CN112612748A - 一种基于可扩展小芯片架构的超级异构计算方法 - Google Patents
一种基于可扩展小芯片架构的超级异构计算方法 Download PDFInfo
- Publication number
- CN112612748A CN112612748A CN202011574027.3A CN202011574027A CN112612748A CN 112612748 A CN112612748 A CN 112612748A CN 202011574027 A CN202011574027 A CN 202011574027A CN 112612748 A CN112612748 A CN 112612748A
- Authority
- CN
- China
- Prior art keywords
- architecture
- super
- chip
- method based
- small
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/78—Architectures of general purpose stored program computers comprising a single central processing unit
- G06F15/7807—System on chip, i.e. computer system on a single chip; System in package, i.e. computer system on one or more chips in a single package
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/163—Interprocessor communication
Landscapes
- Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Microelectronics & Electronic Packaging (AREA)
- Software Systems (AREA)
- Design And Manufacture Of Integrated Circuits (AREA)
- Semiconductor Integrated Circuits (AREA)
Abstract
本发明公开了一种基于可扩展小芯片架构的超级异构计算方法,将相同或不同的功能模块,在分开的晶元上设计实现;并通过高速芯片互联链路实现小芯片间的互联互通以及协同工作;所述超级异构计算,具体为将一份计算任务由两个或多个计算模块来协同执行完成计算,所述计算模块分别设置于不同的小芯片上。本发明突破异构架构在SoC内的面积与生产良率等限制,以及伴随的性能及算力限制,利用小芯片的灵活可配置特性,能非常弹性的扩展异构计算的总体算力配置,通过成熟小芯片的复用,可以快速的配置推出符合市场需求的新产品。
Description
技术领域
本发明公开了一种基于可扩展小芯片架构的超级异构计算方法,涉及芯片设计技术领域。
背景技术
目前市场采用的技术主要是集成芯片(SoC)架构,单一封装内只有单一晶元(die),例如nVidia前一代架构Pascal与目前最新架构图灵(Turing),其电晶体数(Transistor Count)从12个十亿,增长到18.6个十亿之多,增长了55%。而其晶元面积则是从471mm^2增长到了754mm^2,增长了60%,这比例还没有计算上先进制程微缩的效果。这表示有部分设计无法因为制程微缩带来优势,却要为这部分设计采用较昂贵的制程。另一方面由于单一晶元面积如此巨大,晶元制作过程中只要有一颗原子缺陷、或者出现一丝杂质,就会影响产品的良率,为了避免整个晶元因此而报废,势必要在晶元增加备份设计以及修复电路,这些都将造成晶元有效使用率大幅下降。
为了增加算力以赶上与日俱增的计算需求,Nvidia的V100/A100等芯片甚至都已经分别达到了台积电在12nm/7nm下能生产的单一芯片的最大光罩尺寸,这表示以SoC架构来设计的方案已经无法满足行业发展需求,需要有突破性的方案来提供可扩展性算力的平台。
为了有效使用先进制程工艺带来的优点,采用单一芯片(chip)封装内搭载数个小芯片的架构,让每个小芯片能被控制在比较好的良率,进而简化备份设计以及修复电路的设计复杂度以及对应的矽面积代价。另一方面,对于无法在先进制程工艺,例如12纳米、7纳米制程,微缩带上得到优势的设计,例如类比电路,则集中放在主流制程工艺,例如28纳米、22纳米制程,的小芯片上,以提升小芯片的性价比以。而将介面类的功能放在这一类的小芯片上,也提升了芯片的灵活性。此外,针对不同的目标市场,还可以透过封装不同数目的小芯片达到性能上的可扩充性(scalability)。
异构架构是传统SoC上为了更有效的利用各个功能模块的特性来做协同运算,从而提高计算效率以及芯片使用率的一个方式,其架构如图1所示,特点是能根据不同阶段的计算需求,调动各种不同特性的计算模块来进行协同计算。功能模块通常有通用性最强的CPU,并行处理的GPU,数学计算优势的DSP,以及根据各式各样计算需求优化设计的ASIC等等。为了模块间的协同效率,会安排模块间有充足的通信带宽以及高速的通用内存以支持模块间的数据交互。然而受限于SoC面积与生产良率问题,异构计算的可扩展性极差。
通过可扩展的小芯片架构设计,能将异构计算的配置由SoC内拓展到几个小芯片或者晶元上,根据不同的应用,还可以灵活配置不同功能模块数量以及小芯片数量,以设计满足市场需求的产品,并拥有快速产品化的特性。
发明内容
本发明所要解决的技术问题是:针对现有技术的缺陷,提供一种基于可扩展小芯片架构的超级异构计算方法,以可扩展小芯片(小芯片)架构来提供超级异构计算方法。
本发明为解决上述技术问题采用以下技术方案:
一种基于可扩展小芯片架构的超级异构计算方法,将相同或不同的功能模块,在分开的晶元上设计实现;并通过高速芯片互联链路实现小芯片间的互联互通以及协同工作;所述超级异构计算,具体为将一份计算任务由两个或多个计算模块来协同执行完成计算,所述计算模块分别设置于不同的小芯片上。
作为进一步优选方案,所述可扩展的小芯片架构,具体为根据实际应用场景需求,增加小芯片的数量或者小芯片内功能模块的数量,不受SoC的芯片尺寸及生产限制。
作为进一步优选方案,所述功能模块为逻辑电路、模拟电路或者內存电路。所述计算模块为计算单元,所述计算单元为CPU、GPU、DSP、或者ASIC。
作为进一步优选方案,所述在分开的晶元上设计实现,其中分开的晶元数量为两颗或两颗以上。
作为进一步优选方案,高速芯片互联链路要求带宽大于设定的阈值、时延小于设定的阈值,且功耗小于设定的阈值。所述带宽、时延和功耗的参数设定阈值的选取,是将若干分开的小芯片改以集成芯片的方式实现时,将小芯片对应的功能模块间互相传输状态与集成芯片内一般的总线连接实现状态进行对比得出。
作为进一步优选方案,在两个小芯片之间,设置一组或者一组以上的高速芯片互联链路。所述高速芯片互联链路为并行链路或串行链路。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:本发明突破异构架构在SoC内的面积与生产良率等限制,以及伴随的性能及算力限制,利用小芯片的灵活可配置特性,能非常弹性的扩展异构计算的总体算力配置,通过成熟小芯片的复用,可以快速的配置推出符合市场需求的新产品。
附图说明
图1是传统的SoC架构的芯片设计。
图2是以小芯片来取代传统SoC,实现小芯片间的异构计算的架构示意图。
图3是以小芯片复用来快速实现超级异构计算的重新配置的架构示意图。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
下面结合附图对本发明的技术方案做进一步的详细说明:
在做小芯片的实现时,根据功能模块的划分以及产品的规划,可以分成两颗或多颗以上的小芯片来实现。Chiplet间以高速链接对接,实现小芯片间的高速互联互通,能支持小芯片间的任务分工与合作,以分布式计算的特性,达到可根据应用需求调节小芯片个数与拓扑结构设计的安排,弹性的扩展方案算力。
本发明所公开的一种基于可扩展小芯片架构的超级异构计算方法,将相同或不同的功能模块,在分开的晶元上设计实现;并通过高速芯片互联链路实现小芯片间的互联互通以及协同工作;所述超级异构计算,具体为将一份计算任务由两个或多个计算模块来协同执行完成计算,所述计算模块分别设置于不同的小芯片上。
以小芯片来实现的超级异构计算,能根据产品应用需求,通过不同的拓扑结构配置最合适的小芯片架构。如图2所示,举出了两种例子:星状拓扑结构与点对点拓扑结构。右上方的星状拓扑结构主要是以Die3作为小芯片间的传输核心,所有小芯片间的信息交互都必须通过Die3。右下方的点对点拓扑结构是分布式的,每个小芯片都可以直接与其它的小芯片做信息交互。各种的拓扑结构都可以根据需求在各小芯片上增加需要增加的功能模块,也可以根据应用需求采用不同的拓扑结构来设计小芯片。
图3举例了一种小芯片的复用方式,右边的小芯片架构设计中,保留复用了左边小芯片架构设计中的Die 0及Die 3,新增了Die 4及Die 5。在不同的市场应用需求下,保留可复用的Die 0及Die 3,能减少研发投入成本,降低研发风险,并缩短产品量产时间。能高效快速的改变配置并降低量产成本与风险,是通过小芯片实现超级异构计算的重要优点。
本发明所公开的方案,在具体实施的重点如下:
根据市场及产品的功能规划,可以将异构计算架构里的功能模块分布在不同的小芯片上实现。每一颗小芯片内的功能模块可以配置是一种或多种,单一功能模块可以配置是一个或多个。整体小芯片架构可以用不同的拓扑结构来实现(例如星状、点对点),拓扑结构内可以根据需求决定配置不同种类、不同个数的小芯片。
小芯片内需要增加高速片间互联设计,以作为芯片间互联互通的高速链路。根据小芯片互联数量以及互联带宽需求,这一高速片间互联设计可以是一组或多组,设计重点在于让小芯片间的互联互通效率与SoC内部总线效率等级一致。高速芯片互联链路要求带宽大于设定的阈值、时延小于设定的阈值,且功耗小于设定的阈值。所述带宽、时延和功耗的参数设定阈值的选取,是将若干分开的小芯片改以集成芯片的方式实现时,将小芯片对应的功能模块间互相传输状态与集成芯片内一般的总线连接实现状态进行对比得出。
根据不同产品需求设计的超级异构计算,安排使用不同功能的小芯片。小芯片可以是全新设计或是复用现有的小芯片,设计重点在于小芯片上的高速片间互联设计需兼容。
上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质,在本发明的精神和原则之内,对以上实施例所作的任何简单的修改、等同替换与改进等,均仍属于本发明技术方案的保护范围之内。
Claims (9)
1.一种基于可扩展小芯片架构的超级异构计算方法,其特征在于:
将相同或不同的功能模块,在分开的晶元上设计实现;
并通过高速芯片互联链路实现小芯片间的互联互通以及协同工作;
所述超级异构计算,具体为将一份计算任务由两个或多个计算模块来协同执行完成计算,所述计算模块分别设置于不同的小芯片上。
2.如权利要求1所述的一种基于可扩展小芯片架构的超级异构计算方法,其特征在于:所述可扩展的小芯片架构,具体为根据实际应用场景需求,增加小芯片的数量或者小芯片内功能模块的数量,不受SoC的芯片尺寸及生产限制。
3.如权利要求1所述的一种基于可扩展小芯片架构的超级异构计算方法,其特征在于:所述功能模块为逻辑电路、模拟电路或者內存电路。
4.如权利要求1所述的一种基于可扩展小芯片架构的超级异构计算方法,其特征在于:所述计算模块为计算单元,所述计算单元为CPU、GPU、DSP、或者ASIC。
5.如权利要求1所述的一种基于可扩展小芯片架构的超级异构计算方法,其特征在于:所述在分开的晶元上设计实现,其中分开的晶元数量为两颗或两颗以上。
6.如权利要求1所述的一种基于可扩展小芯片架构的超级异构计算方法,其特征在于:所述高速芯片互联链路要求带宽大于设定的阈值、时延小于设定的阈值,且功耗小于设定的阈值。
7.如权利要求1所述的一种基于可扩展小芯片架构的超级异构计算方法,其特征在于:所述高速芯片互联链路为并行链路或串行链路。
8.如权利要求1所述的一种分布式可拓展的小芯片设计架构,其特征在于:在两个小芯片之间,设置一组或者一组以上的高速芯片互联链路。
9.如权利要求6所述的一种分布式可拓展的小芯片设计架构,其特征在于:所述带宽、时延和功耗的参数设定阈值的选取,是将若干分开的小芯片改以集成芯片的方式实现时,将小芯片对应的功能模块间互相传输状态与集成芯片内一般的总线连接实现状态进行对比得出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011574027.3A CN112612748A (zh) | 2020-12-25 | 2020-12-25 | 一种基于可扩展小芯片架构的超级异构计算方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011574027.3A CN112612748A (zh) | 2020-12-25 | 2020-12-25 | 一种基于可扩展小芯片架构的超级异构计算方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112612748A true CN112612748A (zh) | 2021-04-06 |
Family
ID=75248105
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011574027.3A Pending CN112612748A (zh) | 2020-12-25 | 2020-12-25 | 一种基于可扩展小芯片架构的超级异构计算方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112612748A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113203723A (zh) * | 2021-04-08 | 2021-08-03 | 复旦大学 | 纳米金芯片及其制备方法和应用 |
CN113312304A (zh) * | 2021-06-04 | 2021-08-27 | 海光信息技术股份有限公司 | 一种互联装置、主板及服务器 |
CN114706467A (zh) * | 2022-03-10 | 2022-07-05 | 南京蓝洋智能科技有限公司 | 一种多颗dram系统的节能处理方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102246304A (zh) * | 2008-11-04 | 2011-11-16 | 全球Oled科技有限责任公司 | 具有小芯片和可适性互连的器件 |
CN108710596A (zh) * | 2018-05-10 | 2018-10-26 | 中国人民解放军空军工程大学 | 一种基于dsp和fpga多协处理卡的桌面超算硬件平台 |
CN109786368A (zh) * | 2019-01-24 | 2019-05-21 | 中国科学院微电子研究所 | 一种光电芯片协同封装结构及方法 |
CN111741601A (zh) * | 2020-07-09 | 2020-10-02 | 复旦大学 | 一种通用的可配置的有源基板电路结构 |
CN111897398A (zh) * | 2020-08-11 | 2020-11-06 | 曙光信息产业(北京)有限公司 | 一种异构计算扩展装置及电子设备 |
-
2020
- 2020-12-25 CN CN202011574027.3A patent/CN112612748A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102246304A (zh) * | 2008-11-04 | 2011-11-16 | 全球Oled科技有限责任公司 | 具有小芯片和可适性互连的器件 |
CN108710596A (zh) * | 2018-05-10 | 2018-10-26 | 中国人民解放军空军工程大学 | 一种基于dsp和fpga多协处理卡的桌面超算硬件平台 |
CN109786368A (zh) * | 2019-01-24 | 2019-05-21 | 中国科学院微电子研究所 | 一种光电芯片协同封装结构及方法 |
CN111741601A (zh) * | 2020-07-09 | 2020-10-02 | 复旦大学 | 一种通用的可配置的有源基板电路结构 |
CN111897398A (zh) * | 2020-08-11 | 2020-11-06 | 曙光信息产业(北京)有限公司 | 一种异构计算扩展装置及电子设备 |
Non-Patent Citations (1)
Title |
---|
杨晖;: "后摩尔时代Chiplet技术的演进与挑战", 集成电路应用, no. 05 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113203723A (zh) * | 2021-04-08 | 2021-08-03 | 复旦大学 | 纳米金芯片及其制备方法和应用 |
CN113203723B (zh) * | 2021-04-08 | 2023-01-24 | 复旦大学 | 纳米金芯片及其制备方法和应用 |
CN113312304A (zh) * | 2021-06-04 | 2021-08-27 | 海光信息技术股份有限公司 | 一种互联装置、主板及服务器 |
CN113312304B (zh) * | 2021-06-04 | 2023-04-21 | 海光信息技术股份有限公司 | 一种互联装置、主板及服务器 |
CN114706467A (zh) * | 2022-03-10 | 2022-07-05 | 南京蓝洋智能科技有限公司 | 一种多颗dram系统的节能处理方法 |
CN114706467B (zh) * | 2022-03-10 | 2023-06-09 | 南京蓝洋智能科技有限公司 | 一种多颗dram系统的节能处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112612748A (zh) | 一种基于可扩展小芯片架构的超级异构计算方法 | |
CN108845970B (zh) | 一种自由切换gpu服务器拓扑的装置及方法 | |
CN112817905A (zh) | 互联裸芯、互联微组件、互联微系统及其通信方法 | |
WO2019214128A1 (zh) | 一种动态可重构的智能计算集群及其配置方法 | |
CN112817907B (zh) | 互联裸芯扩展微系统及其扩展方法 | |
CN102387084A (zh) | 基于RapidIO协议包交换的系统结构 | |
US10817304B2 (en) | Calculating device | |
CN112835848A (zh) | 互联裸芯的片间互联旁路系统及其通信方法 | |
CN103001867A (zh) | 一种主备双机热备份系统及方法 | |
CN112613264A (zh) | 一种分布式可拓展的小芯片设计架构 | |
CN111786894B (zh) | 实现片上网络传输带宽扩充功能的fpga装置 | |
CN208227066U (zh) | 一种模块化智能变电站网络交换机 | |
US7996454B2 (en) | Method and apparatus for performing complex calculations in a multiprocessor array | |
CN108364949B (zh) | 一种实现芯片互联超高带宽的方法及芯片互联结构 | |
CN104795334B (zh) | 模块化封装的集成电路芯片及其制作方法 | |
CN114896940B (zh) | 一种软件定义的晶圆级交换系统设计方法及装置 | |
CN112217652A (zh) | 一种基于中心通信模式的网络拓扑装置及方法 | |
CN112732631A (zh) | 一种小芯片间的数据传输方法 | |
CN117215994B (zh) | 一种不同部分良好情况下晶片间互连的配置策略 | |
CN112631989A (zh) | 一种小芯片间、芯片间、小芯片与芯片间的数据传输方法 | |
CN117290288B (zh) | 一种io晶粒及系统级芯片 | |
CN110162494A (zh) | 一种现场可编程逻辑门阵列芯片和数据交互方法 | |
Tam et al. | Breaking the memory wall for AI chip with a new dimension | |
CN114615215B (zh) | 一种支撑片上片间一体化路由的数据包编码方法 | |
EP3945425A1 (en) | A high-performance computing system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |