技术领域
[0001] 本发明属于可拓展芯片设计技术领域,具体涉及一种可拓展芯粒的实现及拓展方法。
相关背景技术
[0002] 随着人工智能技术不断在各个行业应用,对芯片算力的需求越来越高,尤其是AI大模型的快速发展,使得现有单芯片的算力越难越难以满足实际计算需求,当前提升算力的途径除了增加芯片数量形成算力集群之外,常规的做法多是采用扩大芯片面积及增加晶体管数量的方式来提升单芯片性能。
[0003] 然而,受先进工艺制程的限制和设计复杂度的限制,当芯片的工艺尺寸微缩到物理极限,继续通过芯片增加面积来提高算力的途径将变得困难,并且,更大的芯片面积也意味着更高的设计复杂度,可能会引入更多的设计和制造错误,导致芯片的可靠性降低。
具体实施方式
[0029] 为了使本发明的目的、特征能够更加的明显和易懂,下面通过实施例并结合附图对本技术方案进行详细说明。
[0030] 在本实施例中,按照图1的流程所示,一种可拓展芯粒的实现及拓展方法,包括步骤:
[0031] 步骤S1,设计芯粒的计算电路和存储电路,并将计算电路和存储电路集成在芯粒基板上,具体地,设计的计算电路和存储电路包含TR接口、PCIe接口、LPDDR接口和C2C接口;其中,C2C接口用于芯片之间的相互连接;PCIe接口用于芯片和主机的连接;LPDDR接口用于连接芯片外DRAM颗粒;TR接口用于可拓展芯粒之间的相互连接;优选地,TR可选择短距离的serdes接口或符合UCIe标准的接口,T代表发送,R代表接收。
[0032] 将计算电路和存储电路集成在芯粒基板上,具体步骤为:
[0033] 首先,在芯粒基板上,将芯粒基板标记为四条边端,具体标记方式为:当芯粒基板水平放置时,按照顺时针的方向,以芯粒基板的边缘北端为起点,四条边缘端分别为芯粒边缘A端、芯粒边缘B端、芯粒边缘C端和芯粒边缘D端;然后,在芯粒边缘A端布局2个TR接口;在芯粒边缘B端布局1个C2C接口,1个PCIe接口和1个LPDDR接口;这三个接口的具体排列方式为:以芯粒边缘A端为上,芯粒边缘C端为下,从上到下依次为:PCIe接口、C2C接口、LPDDR接口;并且C2C接口与LPDDR接口相邻,PCIe接口与C2C接口相邻;接着,在芯粒边缘C端布局1个LPDDR接口和1个C2C接口;最后,在芯粒边缘D端布局2个TR接口,封装好的芯粒如图2所示。
[0034] 步骤S2,将集成后的芯粒按照具体需求进行拓展,具体拓展方式包括芯粒配合IO芯片使用,以及将芯粒封装成芯片,其中,将芯粒封装成芯片,具体步骤为:
[0035] 首先,在一块基板上,放置四个芯粒,具体放置方式为:按照顺时针的方向,以左下的芯粒为起点,分别标记为芯粒一、芯粒二、芯粒三、芯粒四;
[0036] 然后,将芯粒二按照顺时针的方向旋转90度,旋转后的芯粒二通过边缘A端的TR接口与芯粒一的边缘D端的TR接口相连接;将芯粒三按照顺时针的方向旋转180度,旋转后的芯粒三通过边缘A端的TR接口与芯粒二的边缘D端的TR接口相连接;
[0037] 接着,将芯粒四按照顺时针的方向旋转270度,旋转后的芯粒四通过边缘A端的TR接口与芯粒三的边缘D端的TR接口相连接;将旋转后的芯粒四通过边缘D端的TR接口与芯粒一的边缘A端的TR接口相连接,封装好的芯片如图3所示。
[0038] 芯粒配合IO芯片使用的实例之一如图5所示,封装后的芯粒通过TR接口连接芯片外部的IO芯片,从而实现单芯粒使用场景中进一步拓展DRAM容量。
[0039] 步骤S3,如果芯粒拓展成芯片,除了进一步将芯片进行2*2的mesh型互联;还可以将封装后的芯片根据算力需求进行其他规格的mesh型互联,进行mesh互联芯片的数量满足N*N,其中,N≥2,N为水平方向上的芯片数量和竖直方向上的芯片数量,即水平方向上的芯片数量和竖直方向上的芯片数量要相等;
[0040] 其中,将芯片进行2*2的mesh型互联,具体步骤为:
[0041] 首先,将封装后的芯片标记为四条边端,具体标记方式为:当芯片水平放置时,按照顺时针的方向,以芯片基板的边缘北端为起点,四条边缘端分别为芯片边缘A端、芯片边缘B端、芯片边缘C端和芯片边缘D端;然后,在一块基板上,放置四个芯片,按照顺时针的方向,以左下的芯片为起点,分别标记为芯片一、芯片二、芯片三、芯片四;
[0042] 接着,通过连接芯片一中芯片边缘D端的C2C接口与芯片二中芯片边缘B端的的C2C接口,完成芯片一与芯片二的互联;通过连接芯片二中芯片边缘A端的C2C接口与芯片三中芯片边缘C端的的C2C接口,完成芯片二与芯片三的互联;通过连接芯片三中芯片边缘B端的C2C接口与芯片四中芯片边缘D端的的C2C接口,完成芯片三与芯片四的互联;通过连接芯片四中芯片边缘C端的C2C接口与芯片一中芯片边缘A端的的C2C接口,完成芯片四与芯片一的互联,芯片进行2*2的mesh型互联后如图4所示。
[0043] 需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
[0044] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
[0045] 以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。