WO2023056875A1

WO2023056875A1 - 多核芯片、集成电路装置、板卡及其制程方法

Info

Publication number: WO2023056875A1
Application number: PCT/CN2022/122372
Authority: WO
Inventors: 邱志威; 陈帅; 高崧
Original assignee: 寒武纪(西安)集成电路有限公司
Priority date: 2021-10-08
Filing date: 2022-09-29
Publication date: 2023-04-13
Also published as: TWI814179B; CN115966534A; TW202316921A

Abstract

一种多核芯片、集成电路装置、板卡及其制程方法，其中计算装置（501）包括在集成电路装置中，该集成电路装置包括通用互联接口和其他处理装置。计算装置（501）与其他处理装置进行交互，共同完成用户指定的计算操作。集成电路装置还可以包括存储装置，存储装置分别与计算装置（501）和其他处理装置连接，用于计算装置（501）和其他处理装置的数据存储。

Description

多核芯片、集成电路装置、板卡及其制程方法

相关申请的交叉引用

本申请要求于2021年10月08日申请的，申请号为202111172907.2，名称为“多核芯片、集成电路装置、板卡及其制程方法”的中国专利申请的优先权。

技术领域

本发明一般地涉及半导体领域。更具体地，本发明涉及多核芯片、集成电路装置、板卡及其制程方法。

背景技术

自从大数据时代来临，结合人工智能技术的系统级芯片需要应对越来越复杂环境，迫使系统级芯片开发出更多的功能，目前芯片设计已逼近最大光罩尺寸。因此，开发人员试着将系统级芯片划分为多芯片模块，模块与模块间需要以超短(ultra-short)和极短(extra-short)距离连结，以实现晶粒(die)间的高速数据传递。除了尽量扩展带宽外，晶粒对晶粒(die-to-die，D2D)的连接更是一种极低延迟和极低功耗的解决方案。

晶粒对晶粒接口是一个功能块，会占据晶粒一小片面积，用以提供装配在同一封装中的两个模块或两晶粒间的数据接口。晶粒对晶粒接口利用非常短的通道连接封装内的模块或晶粒，其传输速率和带宽超过传统芯片对芯片接口。

在现有技术中，两个用晶粒对晶粒接口相连的模块或晶粒通常会并排摆放，且两个模块或晶粒的晶粒对晶粒接口相邻，两个晶粒对晶粒接口通过下方的中介层(interposer layer)实现电性连接。虽然晶粒对晶粒接口的传输速率和带宽表现优异，但经由下方的中介层传输数据时，其传输路径高达毫米级。传输路径太长会造成讯号的衰减和速率的降低，仍无法满足高强度运算所需的要求。

因此，一种发挥晶粒对晶粒接口优势的技术方案是迫切需要的。

发明内容

为了至少部分地解决背景技术中提到的技术问题，本发明的方案提供了一种多核芯片、集成电路装置、板卡及其制程方法。

在一个方面中，本发明揭露一种多核芯片，包括第一核层及第二核层。第一核层包括：第一运算区，生成有第一运算电路；以及第一晶粒对晶粒区，生成有第一收发电路。第二核层包括：第二运算区，生成有第二运算电路；以及第二晶粒对晶粒区，生成有第二收发电路。第一核层和第二核层纵向堆叠，第一运算电路及第二运算电路通过第一收发电路及第二收发电路进行层间数据传输。

在另一个方面，本发明揭露一种集成电路装置，包括前述的多核芯片；还揭露一种板卡，包括前述的集成电路装置。

在另一个方面，本发明揭露一种制成多核芯片的方法，包括：生成第一核层，第一核层包括第一运算区，生成有第一运算电路，以及第一晶粒对晶粒区，生成有第一收发电路；生成第二核层，第二核层包括第二运算区，生成有第二运算电路，以及第二晶粒对晶粒区，生成有第二收发电路。第一核层和第二核层纵向堆叠，第一运算电路及第二运算电路通过第一收发电路及第二收发电路进行层间数据传输。

本发明的多核芯片通过晶粒对晶粒区的纵向堆叠，使得两晶粒对晶粒接口无需通过中介层进行数据传输，两晶粒对晶粒接口的传输路径大大缩短了，有助于提高核间的传输效率。

附图说明

通过参考附图阅读下文的详细描述，本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本发明的若干实施方式，并且相同或对应的标号表示相同或对应的部分。其中：

图1示出一种包括晶粒对晶粒接口的封装结构的布局俯视图；

图2示出图1的封装结构沿着虚线方向的剖面图；

图3是示出本发明实施例的板卡的结构图；

图4示出本发明实施例的芯片的示意图；

图5是示出本发明实施例的集成电路装置的结构图；

图6是示出本发明另一个实施例纵向堆叠的示意图；

图7是示出本发明另一个实施例纵向堆叠的示意图；

图8是示出本发明另一个实施例纵向堆叠的示意图；

图9是示出本发明另一个实施例纵向堆叠的示意图；

图10是示出本发明另一个实施例纵向堆叠的示意图；

图11是示出本发明另一个实施例制成图4的多核芯片的流程图；

图12是示出本发明另一个实施例制成图6的多核芯片的流程图；

图13是示出本发明另一个实施例制成图7的多核芯片的流程图；

图14是示出本发明另一个实施例制成图8的多核芯片的流程图；

图15是示出本发明另一个实施例制成图9的多核芯片的流程图；以及

图16是示出本发明另一个实施例制成图10的多核芯片的流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，本发明的权利要求、说明书及附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。本发明的说明书和权利要求书中使用的术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的，而并不意在限定本发明。如在本发明说明书和权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解，在本发明说明书和权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本说明书和权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。

下面结合附图来详细描述本发明的具体实施方式。

晶粒对晶粒接口就如同任何其他芯片对芯片接口一样，在两个晶粒间建立的数据链接渠道。晶粒对晶粒接口逻辑上分为物理层、链路层和事务层，并提供一种标准化的平行接口，连接到内部互连结构。

图1示出一种包括晶粒对晶粒接口的封装结构的布局俯视图，此封装结构的布局是位于晶片的模塑料(molding compound)区10，模塑料区10包括系统区域及存储区域，此示例性的系统区域位于模塑料区10的中央，用以放置2个片上系统101，存储区域分别位于系统区域的两侧，用以放置8个片外内存102。

系统区域还设有晶粒对晶粒区103、物理区104及输入输出区105。晶粒对晶粒区103生成有收发电路，用以在两个片上系统101间进行数据分享；物理区104生成有物理访问电路，用以访问片外内存102；输入输出区105生成有输入输出电路，用以作为片上系统101对外联系的接口。

系统区域还放置了内存106，作为片上系统101的暂存空间，其容量小于片外内存102，但数据传输速率却高于片外内存102。

图2示出图1的封装结构沿着虚线方向的剖面图。如图所示，系统区域分为上下2层，上层为片上系统101，下层为晶粒对晶粒区103的收发电路、内存106及输入输出区105的输入输出电路。封装结构还包括中介层201及基板202，中介层201设置于基板202上。当2个片上系统101进行数据传输时，其路径为发送端片上系统101→发送端晶粒对晶粒区103的收发电路→中介层201→接收端晶粒对晶粒区103的收发电路→接收端片上系统101，以此实现晶粒对晶粒端口的低延迟和低功耗的技术功效。

图3示出本发明实施例的一种板卡30的结构示意图。如图1所示，板卡30包括芯片301，其是一种系统级芯片，集成有一个或多个组合处理装置，组合处理装置是一种人工智能运算单元，用以支持各类深度学习和机器学习算法，满足计算机视觉、语音、自然语言处理、数据挖掘等领域复杂场景下的智能处理需求。特别是深度学习技术大量应用在云端智能领域，云端智能应用的一个显著特点是输入数据量大，对平台的存储能力和计算能力有很高的要求，此实施例的板卡30适用在云端智能应用，具有庞大的片外存储、片上存储和强大的计算能力。

芯片301通过对外接口装置302与外部设备303相连接。外部设备303例如是服务器、计算机、摄像头、显示器、鼠标、键盘、网卡或wifi接口等。待处理的数据可以由外部设备303通过对外接口装置302传递至芯片301。芯片301的计算结果可以经由对外接口装置302传送回外部设备303。根据不同的应用场景，对外接口装置302可以具有不同的接口形式，例如PCIe接口等。

更详细来说，芯片301包括计算装置和处理装置。计算装置配置成执行用户指定的操作，主要实现为单核智能处理器或者多核智能处理器，用以执行深度学习或机器学习的计算。处理装置作为通用的处理装置，执行包括但不限于数据搬运、对计算装置的开启和/或停止等基本控制。根据实现方式的不同，处理装置可以是中央处理器(central processing unit，CPU)、图形处理器(graphics processing unit，GPU)或其他通用和/或专用处理器中的一种或多种类型的处理器，这些处理器包括但不限于数字信号处理器(digital signal processor，DSP)、专用集成电路(application specific integrated circuit，ASIC)、现场可编程门阵列(field-programmable gate array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，并且其数目可以根据实际需要来确定。如前所述，仅就此实施例的计算装置而言，其可以视为具有单核结构或者同构多核结构。然而，当将计算装置和处理装置整合共同考虑时，二者视为形成异构多核结构。

板卡30还包括用于存储数据的存储器件304，其包括一个或多个存储单元305。存储器件304通过总线与控制器件306和芯片301进行连接和数据传输。板卡30中的控制器件306配置用于对芯片301的状态进行调控。为此，在一个应用场景中，控制器件306可以包括单片机(Micro Controller Unit，MCU)。

图4示出此实施例的芯片301的示意图，其是一种多核芯片，包括第一核层41与第二核层42，实际上第一核层41和第二核层42纵向堆叠在一块，图4中的第一核层41与第二核层42视觉上为上下分离仅为了方便说明而以此方式展示。

第一核层41包括第一运算区411、第一晶粒对晶粒区412及第一硅通孔(through silicon via，TSV)413。第一运算区411生成有第一运算电路，以实现计算装置的功能；第一晶粒对晶粒区412生成有第一收发电路，用以作为第一运算电路的晶粒对晶粒接口；第一硅通孔413用以在三维集成电路中实现堆叠芯片的电性互连。第二核层42包括第二运算区421、第二晶粒对晶粒区422及第二硅通孔423。第二运算区421生成有第二运算电路，以实现处理装置的功能；第二晶粒对晶粒区422生成有第二收发电路，用以作为第二运算电路的晶粒对晶粒接口；第二硅通孔423同样用以在三维集成电路中实现堆叠芯片的电性互连。

在此实施例中，第一运算区411和第二运算区421还分别生成有内存414和内存424，用以暂存第一运算电路与第二运算电路的运算结果。内存414和内存424直接设置在第一运算区411和第二运算区421内，不需经过中介层传导，其数据传输速率快。

第一核层41还包括输入输出区415及物理区416，第二核层42还包括输入输出区425及物理区426。输入输出区415生成有输入输出电路，用以作为第一核层41对外联系的接口，输入输出区425生成有输入输出电路，用以作为第二核层42对外联系的接口。物理区416生成有物理访问电路，用以作为第一核层41访问片外内存的接口，物理区426生成有物理访问电路，用以作为第二核层42访问片外内存的接口。

当计算装置与处理装置要进行数据交换时，第一运算电路及第二运算电路通过第一收发电路及第二收发电路进行层间数据传输。具体来说，当计算装置欲传输数据至处理装置时，数据通过以下路径到达处理装置：第一运算区411的第一运算电路→第一晶粒对晶粒区412的第一收发电路→第一硅通孔413→第二晶粒对晶粒区422的第二收发电路→第二运算区421的第二运算电路；当处理装置欲传输数据至计算装置时，数据通过以下路径到达：第二运算区421的第二运算电路→第二晶粒对晶粒区422第二收发电路→第一硅通孔413→第一晶粒对晶粒区412的第一收发电路→第一运算区411的第一运算电路。

当计算装置的计算结果需要与片外的其他装置进行数据交换时，内存区414通过输入输出电路将数据传输至其他装置。具体来说，当内存区414的数据欲传输至片外的其他装置时，数据通过以下路径到达片外的其他装置：输入输出区415的输入输出电路→第一硅通孔413→第二硅通孔423；当片外的其他装置欲传输数据至内存区414时，数据通过前述的反向路径到达内存区414。需注意的是，第一硅通孔413与第二硅通孔423中的部分特定硅通孔专门设计用来电性传导输入输出电路的数据。

当处理装置的计算结果需要与片外的其他装置进行数据交换时，内存区424的数据通过以下路径到达片外的其他装置：输入输出区425的输入输出电路→第二硅通孔423；当片外的其他装置欲传输数据至内存区424时，数据通过前述的反向路径到达内存区424。

当计算装置的计算结果需要通过物理区416存储至片外内存时，内存区414通过物理访问电路将数据传输至片外内存。具体来说，当内存区414的数据欲传输至片外内存时，数据通过以下路径到达片外内存：物理区416的物理访问电路→第一硅通孔413→第二硅通孔423；当片外内存欲传输输入数据至内存区414供计算装置进行处理时，数据通过前述的反向路径到达内存区414。需注意的是，第一硅通孔413与第二硅通孔423中的部分特定硅通孔专门设计用来电性传导物理访问电路的数据。

当处理装置的计算结果需要通过物理区426存储至片外内存时，内存区424通过物理访问电路将数据传输至片外内存。具体来说，当内存区424的数据欲传输至片外内存时，数据通过以下路径到达片外内存：物理区426的物理访问电路→第二硅通孔423；当片外内存欲传输输入数据至内存区424供计算装置进行处理时，数据通过前述的反向路径到达内存区424。

如图4所示，第一晶粒对晶粒区412与第二晶粒对晶粒区422纵向堆叠，使得第一核层41的晶粒对晶粒接口与第二核层42的晶粒对晶粒接口直接通过第一硅通孔413电性连接，不需要利用如图2所示的中介层201进行传输。硅通孔的长度约在十几微米，相较于中介层的毫米级的长度，此实施例的数据传输更为快速且信号强度佳。

本发明另一个实施例亦是图3所示的板卡30，其芯片301中的组合处理装置的结构如图5所示。组合处理装置50包括计算装置501、接口装置502、处理装置503和片外内存504。

计算装置501配置成执行用户指定的操作，主要实现为单核智能处理器或者多核智能处理器，用以执行深度学习或机器学习的计算，其可以通过接口装置502与处理装置503进行交互，以共同完成用户指定的操作。

接口装置502连接至总线，用以与其他装置相连接，例如图3的控制器件306、对外接口装置302等。

处理装置503作为通用的处理装置，执行包括但不限于数据搬运、对计算装置501的开启和/或停止等基本控制。根据实现方式的不同，处理装置503可以是中央处理器、图形处理器或其他通用和/或专用处理器中的一种或多种类型的处理器，这些处理器包括但不限于数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，并且其数目可以根据实际需要来确定。如前所述，仅就此实施例的计算装置501而言，其可以视为具有单核结构或者同构多核结构。然而，当将计算装置501和处理装置503整合共同考虑时，二者视为形成异构多核结构。

片外内存504用以存储待处理的数据，为DDR内存，大小通常为16G或更大，用于保存计算装置501和/或处理装置503的数据。

图6示出此实施例纵向堆叠的示意图。此实施例同样是一种多核芯片，包括第一核层61、第二核层62与内存层63，实际上第一核层61、第二核层62和内存层63依序由上至下纵向堆叠在一块，图6中的各层视觉上为上下分离仅为了方便说明而以此方式展示。

第一核层61包括第一运算区611，第一运算区611布满第一核层61的逻辑层，即图中第一核层61的顶侧，第一核层61在特别区域还包括第一晶粒对晶粒区612及第一硅通孔613。第二核层62包括第二运算区621，第二运算区621布满第二核层62的逻辑层，即图中第二核层62的顶侧，第二核层62在特别区域还包括第二晶粒对晶粒区622及第二硅通孔623。第一晶粒对晶粒区612与第二晶粒对晶粒区622的位置上下相对。其功能与作用与前述实施例相同，故不赘述。

内存层63包括内存区631、第一输入输出区632、第二输入输出区633第一物理区634、第二物理区635及第三硅通孔636，内存区631生成有存储单元，用以暂存第一运算电路或第二运算电路的运算结果，第一输入输出区632生成有第一输入输出电路，用以作为第一运算电路对外联系的接口，即实现接口装置502的功能，第二输入输出区633生成有第二输入输出电路，用以作为第二运算电路对外联系的接口，亦实现接口装置502的功能，第一物理区634生成有第一物理访问电路，用以将内存区631中存储第一运算电路的计算结果发送至片外内存504，第二物理区635生成有第二物理访问电路，用以将内存区631中存储第二运算电路的计算结果发送至片外内存504。第三硅通孔636遍布整个内存区62，示例性仅显示于一侧，用以电性连接特定的元件。

当计算装置501与处理装置503要进行数据交换时，第一运算电路及第二运算电路通过第一收发电路及第二收发电路进行层间数据传输。具体来说，当计算装置501欲传输数据至处理装置503时，数据通过以下路径到达处理装置503：第一运算区611的第一运算电路→第一晶粒对晶粒区612的第一收发电路→第一硅通孔613→第二晶粒对晶粒区622的第二收发电路→第二运算区621的第二运算电路；当处理装置503欲传输数据至计算装置501时，数据通过前述的反向路径到达计算装置501。需注意的是，第一硅通孔613中的部分特定硅通孔专门设计用来电性连接第一收发电路和第二收发电路。

当计算装置501的计算结果需要通过接口装置502与片外的其他装置进行数据交换时，内存区631通过第一输入输出电路将数据传输至其他装置。具体来说，当内存区631的数据欲传输至片外的其他装置时，数据通过以下路径到达片外的其他装置：第一输入输出区632的输入输出电路→第三硅通孔636；当片外的其他装置欲与计算装置501进行数据交换时，数据通过前述的反向路径到达内存区631。

当处理装置503的计算结果需要通过接口装置502与片外的其他装置进行数据交换时，内存区631通过第二输入输出电路将数据传输至其他装置。具体来说，当内存区631的数据欲传输至片外的其他装置时，数据通过以下路径到达片外的其他装置：第二输入输出区633的输入输出电路→第三硅通孔636；当片外的其他装置欲与处理装置503进行数据交换时，数据通过前述的反向路径到达内存区631。

需注意的是，第三硅通孔636中的部分特定硅通孔专门设计用来电性传导第一及第二输入输出电路的数据。

当计算装置501的计算结果需要通过第一物理区634存储至片外内存504时，内存区631通过第一物理访问电路将数据传输至片外内存504。具体来说，当内存区631的数据欲传输至片外内存504时，数据通过以下路径到达片外内存504：第一物理区634的第一物理访问电路→第三硅通孔636；当片外内存504欲传输输入数据至内存区631供计算装置501进行处理时，数据通过前述的反向路径到达内存区631。

当处理装置503的计算结果需要通过第二物理区635存储至片外内存504时，内存区631通过第二物理访问电路将数据传输至片外内存504。具体来说，当内存区631的数据欲传输至片外内存504时，数据通过以下路径到达片外内存504：第二物理区635的第二物理访问电路→第三硅通孔636；当片外内存504欲传输输入数据至内存区631供处理装置503进行处理时，数据通过前述的反向路径到达内存区631。

需注意的是，第三硅通孔636中的部分特定硅通孔专门设计用来电性传导第一物理访问电路及第一物理访问电路的数据。

如图6所示，第一晶粒对晶粒区612与第二晶粒对晶粒区622纵向堆叠，使得第一核层61的晶粒对晶粒接口与第二核层62的晶粒对晶粒接口直接通过第一硅通孔613电性连接，不需要利用如图2所示的中介层201进行传输。

本发明的另一个实施例同样是实现如图5所示的结构。图7示出此实施例纵向堆叠的示意图。此实施例同样是一种多核芯片，包括第一核层71、第一内存层72、第二核层73及第二内存层74，实际上第一核层71、第一内存层72、第二核层73及第二内存层74依序纵向堆叠在一块，图7中的各层视觉上为上下分离仅为了方便说明而以此方式展示。

第一核层71包括第一运算区711，第一运算区711布满第一核层71的逻辑层，即图中第一核层71的顶侧，第一核层71在特别区域还包括第一晶粒对晶粒区712及第一硅通孔713，第二核层73包括第二运算区731，第二运算区731布满第二核层73的逻辑层，即图中第二核层73的顶侧，第二核层73在特别区域还包括第二晶粒对晶粒区732及第二硅通孔733，其功能和作用与前述实施例相同，故不赘述。

第一内存层72包括第一内存区721、第一输入输出区722、第一物理区723及第三硅通孔724。第一内存区721生成有存储单元，用以暂存第一运算电路的运算结果。第一输入输出区722生成有第一输入输出电路，用以作为第一核层71与第一内存层72对外联系的接口，即实现接口装置502的功能。第二物理区723生成有第一物理访问电路，用以访问片外内存504。第三硅通孔724遍布整个第一内存层72，示例性仅显示于一侧，用以电性连接特定的元件。

第二内存层74包括第二内存区741、第二输入输出区742、第二物理区743及第四硅通孔744。第二内存区741生成有存储单元，用以暂存第二运算电路的运算结果。第二输入输出区742生成有第二输入输出电路，用以作为第二核层73与第二内存层74对外联系的接口，即实现接口装置502的功能。第二物理区743生成有第二物理访问电路，用以访问片外内存504。第四硅通孔744遍布整个第二内存层74，示例性仅显示于一侧，用以电性连接特定的元件。

各层的硅通孔如有必要，将分别包括收发硅通孔、输入输出硅通孔及物理硅通孔。收发硅通孔用来电性连接第一收发电路和第二收发电路，输入输出硅通孔用以电性传导输入输出电路的数据，物理硅通孔用以电性传导运算电路的运算结果至片外内存504。

当计算装置501欲传输数据至处理装置503时，数据通过以下路径到达处理装置503：第一运算区711的第一运算电路→第一晶粒对晶粒区712的第一收发电路→第一硅通孔713的收发硅通孔→第三硅通孔724的收发硅通孔→第二晶粒对晶粒区732的第二收发电路→第二运算区731的第二运算电路；当处理装置503欲传输数据至计算装置501时，数据通过前述的反向路径到达计算装置501。

当计算装置501的计算结果需要通过接口装置502与片外的其他装置进行数据交换时，数据通过以下路径到达片外的其他装置：第一输入输出区722的第一输入输出电路→第三硅通孔724的输入输出硅通孔→第二硅通孔733的输入输出硅通孔→第四硅通孔744的输入输出硅通孔；当片外的其他装置欲传输数据至第一内存区721时，数据通过前述的反向路径到达第一内存区721。当处理装置503的计算结果需要通过接口装置502与片外的其他装置进行数据交换时，数据通过以下路径到达片外的其他装置：第二输入输出区742的输入输出电路→第四硅通孔744的输入输出硅通孔；当片外的其他装置欲传输数据至第二内存区741时，数据通过前述的反向路径到达第二内存区741。

当第一内存区721的数据欲传输至片外内存504时，数据通过以下路径到达片外内存504：第一物理区723的第一物理访问电路→第三硅通孔724的物理硅通孔→第二硅通孔733的物理硅通孔→第四硅通孔744的物理硅通孔；当片外内存504欲传输输入数据至第一内存区721供计算装置501进行处理时，数据通过前述的反向路径到达第一内存区721。当第二内存区741的数据欲传输至片外内存504时，数据通过以下路径到达片外内存504：第二物理区743的第二物理访问电路→第四硅通孔744的物理硅通孔；当片外内存504欲传输输入数据至第二内存区741供处理装置503进行处理时，数据通过前述的反向路径到达第二内存区741。

在此实施例中，第一核层71与第一内存层72搭配使用，第二核层73与第二内存层74搭配使用，为了传输效率，第一核层71与第一内存层72采用面对面贴合制程，使得第一运算电路与第一内存区721的传输路径最短，第二核层73与第二内存层74采用面对面贴合制程，同样使得第二运算电路与第二内存区741的传输路径最短。为了实现前述最短传输路径，第一内存层72与第二核层73则采用背对背贴合制程。

如图7所示，第一晶粒对晶粒区712与第二晶粒对晶粒区732纵向堆叠，使得第一核层71的晶粒对晶粒接口与第二核层73的晶粒对晶粒接口直接通过第一硅通孔713与第三硅通孔724电性连接，不需要利用如图2所示的中介层201进行传输。

本发明的另一个实施例同样是实现如图5所示的结构。图8示出此实施例纵向堆叠的示意图。此实施例的多核芯片包括第一核层81、第一内存层82、第二核层83、第二内存层84、第三内存层85及第四内存层86，更详细来说，此实施例的多核芯片分为第一晶粒组和第二晶粒组，第一晶粒组堆叠在第二晶粒组上，第一晶粒组由上至下分别为第三内存层85、第一核层81及第一内存层82，第二晶粒组由上至下分别为第四内存层86、第二核层83及第二内存层84，即第四内存层86位于第一内存层82与第二核层83间。图8中的各层视觉上为上下分离仅为了方便说明而以此方式展示。

第一核层81、第一内存层82、第二核层83、第二内存层84的功能和作用与前述实施例中的第一核层71、第一内存层72、第二核层73、第二内存层74相同，故不赘述。

第三内存层85包括第三内存区851及第五硅通孔852，第三内存区851布满第三内存层85的逻辑层，即图中第三内存层85的顶侧。第三内存区851生成有存储单元，用以暂存第一运算电路的运算结果，第五硅通孔852遍布整个第三内存层85，示例性仅显示于一侧，用以电性连接特定的元件。第三内存层85仅负责暂存第一运算电路的运算结果，不负责第一晶粒组对外的联系任务。第一运算电路可以使用第一内存区821和第三内存区851的暂存空间，当计算装置501欲暂存中间数据时，可以通过第五硅通孔852暂存至第三内存区851，或是通过第一硅通孔813暂存至第一内存区821。

第四内存层86包括第四内存区861及第六硅通孔862，第四内存区861布满第四内存层86的逻辑层，即图中第四内存层86的顶侧。第四内存区861生成有存储单元，用以暂存第二运算电路的运算结果，第六硅通孔862遍布整个第四内存层86，示例性仅显示于一侧，用以电性连接特定的元件。第四内存层86仅负责暂存第二运算电路的运算结果，不负责第二晶粒组对外的联系任务。第二运算电路可以使用第二内存区841和第四内存区861的暂存空间，当处理装置503欲暂存中间数据时，可以通过第六硅通孔862暂存至第四内存区861，或是通过第二硅通孔833暂存至第二内存区841。

当计算装置501欲传输数据至处理装置503时，数据通过以下路径到达处理装置503：第一运算区811的第一运算电路→第一晶粒对晶粒区812的第一收发电路→第一硅通孔813的收发硅通孔→第三硅通孔824的收发硅通孔→第六硅通孔862的收发硅通孔→第二晶粒对晶粒区832的第二收发电路→第二运算区831的第二运算电路；当处理装置503欲传输数据至计算装置501时，数据通过前述的反向路径到达计算装置501。

当第一晶粒组的计算结果需要通过接口装置502与片外的其他装置进行数据交换时，数据通过以下路径到达片外的其他装置：第一输入输出区822的第一输入输出电路→第三硅通孔824的输入输出硅通孔→第六硅通孔862的输入输出硅通孔→第二硅通孔833的输入输出硅通孔→第四硅通孔844的输入输出硅通孔；当片外的其他装置欲传输数据至第一晶粒组时，数据通过前述的反向路径到达第一内存区821。当第二晶粒组的计算结果需要通过接口装置502与片外的其他装置进行数据交换时，数据通过以下路径到达片外的其他装置：第二输入输出区842的第二输入输出电路→第四硅通孔844的输入输出硅通孔；当片外的其他装置欲传输数据至第二晶粒组时，数据通过前述的反向路径到达第二内存区841。

当第一晶粒组的数据欲传输至片外内存504时，数据通过以下路径到达片外内存504：第一物理区823的第一物理访问电路→第三硅通孔824的物理硅通孔→第六硅通孔862的物理硅通孔→第二硅通孔833的物理硅通孔→第四硅通孔844的物理硅通孔；当片外内存504欲传输输入数据至第一晶粒组供计算装置501进行处理时，数据通过前述的反向路径到达第一内存区821。当第二晶粒组的数据欲传输至片外内存504时，数据通过以下路径到达片外内存504：第二物理区843的第二物理访问电路→第四硅通孔844的物理硅通孔；当片外内存504欲传输输入数据至第二晶粒组供处理装置503进行处理时，数据通过前述的反向路径到达第二内存区841。

在此实施例中，第一核层81与第一内存层82和第三内存层85搭配使用，第二核层83与第二内存层84和第四内存层86搭配使用，为了传输效率，第一核层81与第一内存层82采用面对面贴合制程，使得第一运算电路与第一内存区821的传输路径最短，第一核层81与第三内存层85采用面对背贴合制程，第一内存层82与第四内存层86采用背对背贴合制程，第二核层83与第四内存层86采用面对面贴合制程，同样使得第二运算电路与第四内存区861的传输路径最短，第二核层83与第二内存层84采用面对背贴合制程。

如图8所示，第一晶粒对晶粒区812与第二晶粒对晶粒区832纵向堆叠，使得第一核层81的晶粒对晶粒接口与第二核层83的晶粒对晶粒接口直接通过第一硅通孔813、第三硅通孔824与第六硅通孔862电性连接，不需要利用如图2所示的中介层201进行传输。

本发明的另一个实施例同样是实现如图5所示的结构。图9示出此实施例纵向堆叠的示意图。此实施例的多核芯片由上至下堆叠分为第一晶粒组、第二晶粒组和第三晶粒组。第一晶粒组由上至下分别为第一核层91及第一内存层92，第二晶粒组由上至下分别为第二核层93及第二内存层94，第三晶粒组仅包括第三内存层95，故第三内存层95位于第二内存层94下。图9中的各层视觉上为上下分离仅为了方便说明而以此方式展示。

第一核层91包括第一运算区911，第一运算区911布满第一核层91的逻辑层，即图中第一核层91的顶侧，第一核层91在特别区域还包括第一晶粒对晶粒区912及第一硅通孔913，第一内存层92包括第一内存区921及第二硅通孔922，第一内存区921布满第一内存层92的逻辑层，即图中第一内存层92的顶侧。第一内存区921生成有存储单元，用以暂存第一运算电路的运算结果。第二核层93包括第二运算区931，第二运算区931布满第二核层93的逻辑层，即图中第二核层93的顶侧，第二核层93在特别区域还包括第二晶粒对晶粒区932及第三硅通孔933，第二内存层94包括第二内存区941及第四硅通孔942，第二内存区941布满第二内存层94的逻辑层，即图中第二内存层94的顶侧，第二内存区941生成有存储单元，用以暂存第二运算电路的运算结果。

第三内存层95包括第三内存区951、第一输入输出区952、第二输入输出区953、第一物理访问区954、第二物理访问区955及第五硅通孔956，第三内存区951生成有存储单元，用以暂存第一运算电路或第二运算电路的运算结果，第一输入输出区952生成有第一输入输出电路，用以作为第一晶粒组对外联系的接口，即实现接口装置502的功能，第二输入输出区953生成有第二输入输出电路，用以作为第二晶粒组对外联系的接口，即实现接口装置502的功能，第一物理区954生成有第一物理访问电路，用以联系第一晶粒组与片外内存504，第二物理区955生成有第二物理访问电路，用以联系第二晶粒组与片外内存504。

各硅通孔遍布整个层中，示例性仅显示于一侧。各层的硅通孔如有必要，将分别包括收发硅通孔、输入输出硅通孔及物理硅通孔。收发硅通孔用来电性连接第一收发电路和第二收发电路，输入输出硅通孔用以电性传导输入输出电路的数据，物理硅通孔用以电性传导运算电路的运算结果至片外内存504。

当计算装置501欲传输数据至处理装置503时，数据通过以下路径到达处理装置503：第一运算区911的第一运算电路→第一晶粒对晶粒区912的第一收发电路→第一硅通孔913的收发硅通孔→第二硅通孔922的收发硅通孔→第二晶粒对晶粒区932的第二收发电路→第二运算区931的第二运算电路；当处理装置503欲传输数据至计算装置501时，数据通过前述的反向路径到达计算装置501。

第一晶粒组与第二晶粒组不直接对片外联系，当需要对片外联系时，此实施例通过第三晶粒组的第三内存层95来执行。

当计算装置501的计算结果需要通过接口装置502与片外的其他装置进行数据交换时，数据会通过各层的输入输出硅通孔传送至第三内存区951暂存，再由第三内存区951通过以下路径到达片外的其他装置：第一输入输出区952的第一输入输出电路→第五硅通孔956的第一输入输出硅通孔；当片外的其他装置欲传输数据至第一晶粒组时，数据通过前述的反向路径先暂存在第三内存区951，再从第三内存区951传送至第一内存区921。

当处理装置503的计算结果需要通过接口装置502与片外的其他装置进行数据交换时，数据会通过各层的输入输出硅通孔传送至第三内存区951暂存，再由第三内存区951通过以下路径到达片外的其他装置：第二输入输出区953的第二输入输出电路→第五硅通孔956的第二输入输出硅通孔；当片外的其他装置欲传输数据至第二晶粒组时，数据通过前述的反向路径先暂存在第三内存区951，再从第三内存区951传送至达第二内存区941。

当第一内存区921的数据欲传输至片外内存504时，数据会通过各层的物理硅通孔传送至第三内存区951暂存，再由第三内存区951通过以下路径到达片外的其他装置：第一物理区954的第一物理访问电路→第五硅通孔956的第一物理硅通孔；当片外内存504欲传输输入数据至第一晶粒组时，输入数据通过前述的反向路径先暂存在第三内存区951，再从第三内存区951传送至达第一内存区921。

当第二内存区941的数据欲传输至片外内存504时，数据会通过第四硅通孔的物理硅通孔传送至第三内存区951暂存，再由第三内存区951通过以下路径到达片外的其他装置：第二物理区955的第二物理访问电路→第五硅通孔956的第二物理硅通孔；当片外内存504欲传输输入数据至第二晶粒组时，输入数据通过前述的反向路径先暂存在第三内存区951，再从第三内存区951通过第四硅通孔的物理硅通孔传送至达第二内存区941。

在此实施例中，第一核层91与第一内存层92搭配使用，第二核层93与第二内存层94搭配使用，为了传输效率，第一核层91与第一内存层92采用面对面贴合制程，使得第一运算电路与第一内存区921的传输路径最短，第二核层93与第二内存层94采用面对面贴合制程，同样使得第二运算电路与第二内存区941的传输路径最短。为了实现前述最短传输路径，第一内存层92与第二核层93则采用背对背贴合制程，第二内存层94与第三内存层95采用面对背贴合制程。

如图9所示，第一晶粒对晶粒区912与第二晶粒对晶粒区932纵向堆叠，使得第一核层91的晶粒对晶粒接口与第二核层93的晶粒对晶粒接口直接通过第一硅通孔913与第二硅通孔922电性连接，不需要利用如图2所示的中介层201进行传输。

本发明的另一个实施例同样是实现如图5所示的结构。图10示出此实施例纵向堆叠的示意图。此实施例的多核芯片由上至下堆叠分为第一晶粒组、第二晶粒组和第三晶粒组。第一晶粒组由上至下分别为第三内存层B及第一核层A，第二晶粒组由上至下分别为第一内存层D及第二核层C，第三晶粒组仅包括第二内存层E。明显地，此实施例的纵向堆叠结构与图9的实施例差异仅在于第一晶粒组与第二晶粒组的核层与内存层位置对调，本领域技术人员基于前述实施例的说明，无需创造性的劳动便可知悉此实施例各层间的协同方式，故不赘述。

上述多个实施例都是一种纵向堆叠的片上系统，可以用FCBGA(flip chip ball grid array)或是CoWoS(chip on wafer on substrate)封装工艺来实现。FCBGA被称为倒装芯片球栅格阵列的封装格式，用小球代替针脚来连接电路，能提供最短的对外连接距离，采用这一封装不仅提供优异的电性效能，同时可以减少组件互连间的损耗及电感，降低电磁干扰的问题，并承受较高的频率。CoWoS是一种整合生产技术，先将晶粒通过CoW的封装制程连接至硅晶圆，再把CoW晶粒与基板连接，整合成CoWoS，通过这种技术可以把多颗晶粒封装到一起，达到了封装体积小、功耗低、引脚少的技术功效。

本发明的另一个实施例是一种制成如图4所示的多核芯片的方法，其流程图如图11所示。

在步骤1101中，生成第一核层41，第一核层包括第一运算区411及第一晶粒对晶粒区412，其中第一运算区411生成有第一运算电路，第一晶粒对晶粒区412生成有第一收发电路。在此步骤中，在第一核层41生成收发硅通孔，用以电性连接第一收发电路及第二收发电路。

在步骤1102中，生成第二核层42，第二核层包括第二运算区421及第二晶粒对晶粒区422，其中第二运算区421生成有第二运算电路，第二晶粒对晶粒区422生成有第二收发电路。

第一核层41和第二核层42纵向堆叠，第一运算电路及第二运算电路通过第一收发电路及第二收发电路进行层间数据传输。本领域技术人员可以通过图4的实施例的描述知悉此实施例的技术手段，故不赘述。

在此实施例中，第一晶粒对晶粒区412与第二晶粒对晶粒区422纵向堆叠，使得第一核层41的晶粒对晶粒接口与第二核层42的晶粒对晶粒接口直接通过第一硅通孔413电性连接，不需要利用如图2所示的中介层201进行传输。

本发明的另一个实施例是一种制成如图6所示的多核芯片的方法，其流程图如图12所示。

在步骤1201中，生成第一核层61，第一核层61包括第一运算区611及第一晶粒对晶粒区612，其中第一运算区611生成有第一运算电路，第一晶粒对晶粒区612生成有第一收发电路。在此步骤中，在第一核层61生成收发硅通孔，用以电性连接第一收发电路及第二收发电路。

在步骤1202中，生成内存层63，在内存层63生成内存区631、输入输出区632、第一物理区634及硅通孔624。内存区631生成有存储单元，用以暂存第一运算电路与第二运算电路的运算结果；输入输出区632生成有输入输出电路，用以作为多核芯片对外联系的接口；第一物理区634生成有物理访问电路，用以访问片外内存504。硅通孔624用以电性连接第一收发电路及第二收发电路。在此步骤中，在内存层63生成收发硅通孔，用以电性连接第一收发电路及第二收发电路，具体来说，是将部分的硅通孔624设置成收发硅通孔。

在步骤1203中，生成第二核层62，第二核层62包括第二运算区621及第二晶粒对晶粒区622，其中第二运算区621生成有第二运算电路，第二晶粒对晶粒区622生成有第二收发电路。

在此实施例中，第一核层61、内存层63及第二核层62依序堆叠，即在第一核层61和第二核层62间生成内存层63。第一晶粒对晶粒区612与第二晶粒对晶粒区622纵向堆叠，使得第一核层61的晶粒对晶粒接口与第二核层62的晶粒对晶粒接口直接通过第一硅通孔613与第三硅通孔636电性连接，不需要利用如图2所示的中介层201进行传输。

本发明的另一个实施例是一种制成如图7所示的多核芯片的方法，其流程图如图13所示。

在步骤1301中，生成第一核层71，第一核层71包括第一运算区711及第一晶粒对晶粒区712，其中第一运算区711生成有第一运算电路，第一晶粒对晶粒区712生成有第一收发电路。在此步骤中，在第一核层71生成收发硅通孔，用以电性连接第一收发电路及第二收发电路。

在步骤1302中，生成第一内存层72，第一内存层72包括第一内存区721，生成有存储单元，用以暂存第一运算电路的运算结果。在此步骤中，在第一内存层72生成收发硅通孔，用以电性连接第一收发电路及第二收发电路。

在步骤1303中，生成第二核层73，第二核层73包括第二运算区731及第二晶粒对晶粒区732，其中第二运算区731生成有第二运算电路，第二晶粒对晶粒区732生成有第二收发电路。

在步骤1304中，生成第二内存层74，第二内存层74包括第二内存区741，生成有存储单元，用以暂存第二运算电路的运算结果。在此步骤中，在第二内存层74生成收发硅通孔，用以电性连接第一收发电路及第二收发电路。

在此实施例中，第一核层71、第一内存层72、第二核层73、第二内存层74依序堆叠，更具体来说，第一晶粒对晶粒区712与第二晶粒对晶粒区732纵向堆叠，使得第一核层71的晶粒对晶粒接口与第二核层73的晶粒对晶粒接口直接通过收发硅通孔电性连接，不需要利用如图2所示的中介层201进行传输。

本发明的另一个实施例是一种制成如图8所示的多核芯片的方法，其流程图如图14所示。

在步骤1401中，生成第三内存层85，第三内存层85包括第三内存区851，生成有存储单元，用以暂存第一运算电路的运算结果。

在步骤1402中，生成第一核层81，第一核层81包括第一运算区811及第一晶粒对晶粒区812，其中第一运算区811生成有第一运算电路，第一晶粒对晶粒区812生成有第一收发电路。在此步骤中，在第一核层81生成收发硅通孔，用以电性连接第一收发电路及第二收发电路。

在步骤1403中，生成第一内存层82，第一内存层82包括第一内存区821，生成有存储单元，用以暂存第一运算电路的运算结果。在此步骤中，在第一内存层82生成收发硅通孔，用以电性连接第一收发电路及第二收发电路。

在步骤1404中，生成第四内存层86，第四内存层86包括第四内存区861，生成有存储单元，用以暂存第二运算电路的运算结果，其中第四内存层86位于第一内存层82与第二核层83间。在此步骤中，在第四内存层86生成收发硅通孔，用以电性连接第一收发电路及第二收发电路。

在步骤1405中，生成第二核层83，第二核层83包括第二运算区831及第二晶粒对晶粒区832，其中第二运算区831生成有第二运算电路，第二晶粒对晶粒区832生成有第二收发电路。

在步骤1406中，生成第二内存层84，第二内存层84包括第二内存区841，生成有存储单元，用以暂存第二运算电路的运算结果。在此步骤中，在第二内存层84生成收发硅通孔，用以电性连接第一收发电路及第二收发电路。

在此实施例中，第三内存层85、第一核层81、第一内存层82、第四内存层86、第二核层83、第二内存层84依序堆叠，更具体来说，第一晶粒对晶粒区812与第二晶粒对晶粒区832纵向堆叠，使得第一核层81的晶粒对晶粒接口与第二核层83的晶粒对晶粒接口直接通过收发硅通孔电性连接，不需要利用如图2所示的中介层201进行传输。

本发明的另一个实施例是一种制成如图9所示的多核芯片的方法，其流程图如图15所示。

在步骤1501中，生成第一核层91，第一核层91包括第一运算区911及第一晶粒对晶粒区912，其中第一运算区911生成有第一运算电路，第一晶粒对晶粒区912生成有第一收发电路。在此步骤中，在第一核层91生成收发硅通孔，用以电性连接第一收发电路及第二收发电路。

在步骤1502中，生成第一内存层92，第一内存层92包括第一内存区921，生成有存储单元，用以暂存第一运算电路的运算结果。在此步骤中，在第一内存层92生成收发硅通孔，用以电性连接第一收发电路及第二收发电路。

在步骤1503中，生成第二核层93，第二核层93包括第二运算区931及第二晶粒对晶粒区932，其中第二运算区931生成有第二运算电路，第二晶粒对晶粒区932生成有第二收发电路。

在步骤1504中，生成第二内存层94，第二内存层94包括第二内存区941，生成有存储单元，用以暂存第二运算电路的运算结果。

在步骤1505中，生成第三内存层95，第三内存层95包括第三内存区951，生成有存储单元，用以暂存第一运算电路或第二运算电路的运算结果，其中第三内存层95位于第二内存层94之下。

在此实施例中，第一核层91、第一内存层92、第二核层93、第二内存层94及第三内存层95依序堆叠，更具体来说，第一晶粒对晶粒区912与第二晶粒对晶粒区932纵向堆叠，使得第一核层91的晶粒对晶粒接口与第二核层93的晶粒对晶粒接口直接通过收发硅通孔电性连接，不需要利用如图2所示的中介层201进行传输。

本发明的另一个实施例是一种制成如图10所示的多核芯片的方法，其流程图如图16所示。

在步骤1601中，生成第三内存层B，第三内存层B包括第三内存区1021，生成有存储单元，用以暂存第一运算电路的运算结果。

在步骤1602中，生成第一核层A，第一核层A包括第一运算区1011及第一晶粒对晶粒区1012，其中第一运算区1011生成有第一运算电路，第一晶粒对晶粒区1012生成有第一收发电路。在此步骤中，在第一核层A生成收发硅通孔，用以电性连接第一收发电路及第二收发电路。

在步骤1603中，生成第一内存层D，第一内存层D包括第一内存区1041，生成有存储单元，用以暂存第二运算电路的运算结果。在此步骤中，在第一内存层D生成收发硅通孔，用以电性连接第一收发电路及第二收发电路。

在步骤1604中，生成第二核层C，第二核层C包括第二运算区1031及第二晶粒对晶粒区1032，其中第二运算区1031生成有第二运算电路，第二晶粒对晶粒区1032生成有第二收发电路。

在步骤1605中，生成第二内存层E，第二内存层E包括第二内存区1051，生成有存储单元，用以暂存第一运算电路或第二运算电路的运算结果。

在此实施例中，第三内存层B、第一核层A、第一内存层D、第二核层C、第二内存层E依序堆叠，更具体来说，第一晶粒对晶粒区1012与第二晶粒对晶粒区1032纵向堆叠，使得第一核层A的晶粒对晶粒接口与第二核层C的晶粒对晶粒接口直接通过收发硅通孔电性连接，不需要利用如图2所示的中介层201进行传输。

本发明的方案是通过将核层纵向堆叠，使得核层的晶粒对晶粒区亦是纵向堆叠，两晶粒对晶粒接口无需通过中介层而是以硅通孔进行数据传输，两晶粒对晶粒接口的传输路径大大缩短了，有助于提高核间的传输效率。

根据不同的应用场景，本发明的电子设备或装置可以包括服务器、云端服务器、服务器集群、数据处理装置、机器人、电脑、打印机、扫描仪、平板电脑、智能终端、PC设备、物联网终端、移动终端、手机、行车记录仪、导航仪、传感器、摄像头、相机、摄像机、投影仪、手表、耳机、移动存储、可穿戴设备、视觉终端、自动驾驶终端、交通工具、家用电器、和/或医疗设备。所述交通工具包括飞机、轮船和/或车辆；所述家用电器包括电视、空调、微波炉、冰箱、电饭煲、加湿器、洗衣机、电灯、燃气灶、油烟机；所述医疗设备包括核磁共振仪、B超仪和/或心电图仪。本发明的电子设备或装置还可以被应用于互联网、物联网、数据中心、能源、交通、公共管理、制造、教育、电网、电信、金融、零售、工地、医疗等领域。进一步，本发明的电子设备或装置还可以用于云端、边缘端、终端等与人工智能、大数据和/或云计算相关的应用场景中。在一个或多个实施例中，根据本发明方案的算力高的电子设备或装置可以应用于云端设备(例如云端服务器)，而功耗小的电子设备或装置可以应用于终端设备和/或边缘端设备(例如智能手机或摄像头)。在一个或多个实施例中，云端设备的硬件信息和终端设备和/或边缘端设备的硬件信息相互兼容，从而可以根据终端设备和/或边缘端设备的硬件信息，从云端设备的硬件资源中匹配出合适的硬件资源来模拟终端设备和/或边缘端设备的硬件资源，以便完成端云一体或云边端一体的统一管理、调度和协同工作。

需要说明的是，为了简明的目的，本发明将一些方法及其实施例表述为一系列的动作及其组合，但是本领域技术人员可以理解本发明的方案并不受所描述的动作的顺序限制。因此，依据本发明的公开或教导，本领域技术人员可以理解其中的某些步骤可以采用其他顺序来执行或者同时执行。进一步，本领域技术人员可以理解本发明所描述的实施例可以视为可选实施例，即其中所涉及的动作或模块对于本发明某个或某些方案的实现并不一定是必需的。另外，根据方案的不同，本发明对一些实施例的描述也各有侧重。鉴于此，本领域技术人员可以理解本发明某个实施例中没有详述的部分，也可以参见其他实施例的相关描述。

在具体实现方面，基于本发明的公开和教导，本领域技术人员可以理解本发明所公开的若干实施例也可以通过本文未公开的其他方式来实现。例如，就前文所述的电子设备或装置实施例中的各个单元来说，本文在考虑了逻辑功能的基础上对其进行拆分，而实际实现时也可以有另外的拆分方式。又例如，可以将多个单元或组件结合或者集成到另一个系统，或者对单元或组件中的一些特征或功能进行选择性地禁用。就不同单元或组件之间的连接关系而言，前文结合附图所讨论的连接可以是单元或组件之间的直接或间接耦合。在一些场景中，前述的直接或间接耦合涉及利用接口的通信连接，其中通信接口可以支持电性、光学、声学、磁性或其它形式的信号传输。

在本发明中，作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元示出的部件可以是或者也可以不是物理单元。前述部件或单元可以位于同一位置或者分布到多个网络单元上。另外，根据实际的需要，可以选择其中的部分或者全部单元来实现本发明实施例所述方案的目的。另外，在一些场景中，本发明实施例中的多个单元可以集成于一个单元中或者各个单元物理上单独存在。

在另外一些实现场景中，上述集成的单元也可以采用硬件的形式实现，即为具体的硬件电路，其可以包括数字电路和/或模拟电路等。电路的硬件结构的物理实现可以包括但不限于物理器件，而物理器件可以包括但不限于晶体管或忆阻器等器件。鉴于此，本文所述的各类装置(例如计算装置或其他处理装置)可以通过适当的硬件处理器来实现，例如中央处理器、GPU、FPGA、DSP和ASIC等。进一步，前述的所述存储单元或存储装置可以是任意适当的存储介质(包括磁存储介质或磁光存储介质等)，其例如可以是可变电阻式存储器(Resistive Random Access Memory，RRAM)、动态随机存取存储器(Dynamic Random Access Memory，DRAM)、静态随机存取存储器(Static Random Access Memory，SRAM)、增强动态随机存取存储器(Enhanced Dynamic Random Access Memory，EDRAM)、高带宽存储器(High Bandwidth Memory，HBM)、混合存储器立方体(Hybrid Memory Cube，HMC)、ROM和RAM等。

依据以下条款可更好地理解前述内容：

条款A1.一种多核芯片，包括：第一核层，包括：第一运算区，生成有第一运算电路；以及第一晶粒对晶粒区，生成有第一收发电路；第二核层，包括：第二运算区，生成有第二运算电路；以及第二晶粒对晶粒区，生成有第二收发电路；其中，所述第一核层和所述第二核层纵向堆叠，所述第一运算电路及所述第二运算电路通过所述第一收发电路及所述第二收发电路进行层间数据传输。

条款A2.根据条款A1所述的多核芯片，连接至片外内存，还包括内存层，所述内存层包括：内存区，生成有存储单元，用以暂存所述第一运算电路与所述第二运算电路的运算结果；输入输出区，生成有输入输出电路，用以作为所述多核芯片对外联系的接口；以及物理区，生成有物理访问电路，用以访问所述片外内存。

条款A3.根据条款A2所述的多核芯片，其中所述内存层位于所述第一核层和所述第二核层间，所述内存层生成有硅通孔，用以电性连接所述第一收发电路及所述第二收发电路。

条款A4.根据条款A2所述的多核芯片，其中所述内存区位于所述第一核层和所述第二核层间，所述第二核层生成有硅通孔，用以电性传导所述输入输出电路的数据。

条款A5.根据条款A2所述的多核芯片，其中所述内存区位于所述第一核层和所述第二核层间，所述第二核层生成有硅通孔，用以电性传导所述物理访问电路的数据。

条款A6.根据条款A1所述的多核芯片，还包括：第一内存层，包括第一内存区，生成有存储单元，用以暂存所述第一运算电路的运算结果；以及第二内存层，包括第二内存区，生成有存储单元，用以暂存所述第二运算电路的运算结果；其中，所述第一核层、所述第一内存层、所述第二核层、所述第二内存层依序堆叠，所述第一内存层生成有收发硅通孔，用以电性连接所述第一收发电路及所述第二收发电路。

条款A7.根据条款A6所述的多核芯片，其中所述第一内存层还包括第一输入输出区，生成有第一输入输出电路，用以作为所述多核芯片对外联系的接口，所述第二核层及所述第二内存层生成有输入输出硅通孔，用以电性传导所述第一输入输出电路的数据。

条款A8.根据条款A6所述的多核芯片，其中所述第二内存层还包括第二输入输出区，生成有第二输入输出电路，通过输入输出硅通孔电性连接至所述多核芯片外。

条款A9.根据条款A6所述的多核芯片，连接至片外内存，其中所述第一内存层还包括第一物理区，生成有物理访问电路，所述第二核层及所述第二内存层生成有物理硅通孔，用以电性传导所述第一运算电路的运算结果至所述片外内存。

条款A10.根据条款A6所述的多核芯片，连接至片外内存，其中所述第二内存层还包括第二物理区，生成有物理访问电路，通过物理硅通孔将所述第二运算电路的运算结果传送至所述片外内存。

条款A11.根据条款A6所述的多核芯片，其中所述第一核层与所述第一内存层为面对面制程，所述第一内存层与所述第二核层为背对背制程，所述第二核层与所述第二内存层为面对面制程。

条款A12.根据条款A6所述的多核芯片，还包括第三内存层，所述第三内存层包括第三内存区，生成有存储单元，用以暂存所述第一运算电路的运算结果，其中所述第三内存层位于所述第一核层之上。

条款A13.根据条款A12所述的多核芯片，其中所述第三内存层与所述第一核层为面对面或面对背制程。

条款A14.根据条款A6所述的多核芯片，还包括第四内存层，所述第四内存层包括第四内存区，生成有存储单元，用以暂存所述第二运算电路的运算结果，其中所述第四内存层位于所述第一内存层与所述第二核层间，所述第四内存层生成有收发硅通孔，用以电性连接所述第一收发电路及所述第二收发电路。

条款A15.根据条款A14所述的多核芯片，其中所述第一内存层还包括第一输入输出区，生成有第一输入输出电路，用以作为所述多核芯片对外联系的接口，所述第四内存层、所述第二核层及所述第二内存层生成有输入输出硅通孔，用以电性传导所述第一输入输出电路的数据。

条款A16.根据条款A14所述的多核芯片，连接至片外内存，其中所述第一内存层还包括第一物理区，生成有物理访问电路，所述第四内存层、所述第二核层及所述第二内存层生成有物理硅通孔，用以电性传导所述第一运算电路的运算结果至所述片外内存。

条款A17.根据条款A14所述的多核芯片，其中所述第一核层与所述第一内存层为面对面制程，所述第一内存层与所述第四内存层为背对背制程，所述第四内存层与所述第二核层为面对面制程，所述第二核层及所述第二内存层为面对背制程。

条款A18.根据条款A6所述的多核芯片，还包括第三内存层，包括第三内存区，生成有存储单元，用以暂存所述第一运算电路或所述第二运算电路的运算结果，其中，所述第三内存层位于所述第二内存层之下。

条款A19.根据条款A18所述的多核芯片，其中所述第三内存层还包括输入输出区，生成有输入输出电路，用以作为所述多核芯片对外联系的接口。

条款A20.根据条款A18所述的多核芯片，连接至片外内存，其中所述第三内存层还包括物理区，生成有物理访问电路，用以电性传导所述第一运算电路及所述第二运算电路的运算结果至所述片外内存。

条款A21.根据条款A18所述的多核芯片，其中所述第一核层与所述第一内存层为面对面制程，所述第一内存层与所述第二核层为背对背制程，所述第二核层与所述第二内存层为面对面制程，所述第二内存层与所述第三内存层为面对背制程。

条款A22.根据条款A1至21所述任一项的多核芯片，其中各层以倒装芯片球栅格阵列方式封装。

条款A23.根据条款A1至21所述任一项的多核芯片，其中各层以CoWoS方式封装。

条款A24.一种集成电路装置，包括根据条款A1至21任一项所述的多核芯片。

条款A25.一种板卡，包括根据条款A24所述的集成电路装置。

条款A26.一种制成多核芯片的方法，包括：生成第一核层，所述第一核层包括：第一运算区，生成有第一运算电路；以及第一晶粒对晶粒区，生成有第一收发电路；生成第二核层，所述第二核层包括：第二运算区，生成有第二运算电路；以及第二晶粒对晶粒区，生成有第二收发电路；其中，所述第一核层和所述第二核层纵向堆叠，所述第一运算电路及所述第二运算电路通过所述第一收发电路及所述第二收发电路进行层间数据传输。

条款A27.根据条款A26所述的方法，所述多核芯片连接至片外内存，所述方法还包括在所述第一核层和所述第二核层间生成内存层，所述内存层包括：内存区，生成有存储单元，用以暂存所述第一运算电路与所述第二运算电路的运算结果；输入输出区，生成有输入输出电路，用以作为所述多核芯片对外联系的接口；以及物理区，生成有物理访问电路，用以访问所述片外内存。

条款A28.根据条款A27所述的方法，其中所述生成内存层的步骤包括在所述内存层生成有硅通孔，用以电性连接所述第一收发电路及所述第二收发电路。

条款A29.根据条款A26所述的方法，还包括：生成第一内存层，包括第一内存区，生成有存储单元，用以暂存所述第一运算电路的运算结果；以及生成第二内存层，包括第二内存区，生成有存储单元，用以暂存所述第二运算电路的运算结果；其中，所述第一核层、所述第一内存层、所述第二核层、所述第二内存层依序堆叠；其中所述生成第一内存层的步骤包括在所述第一内存层生成收发硅通孔，用以电性连接所述第一收发电路及所述第二收发电路。

条款A30.根据条款A29所述的方法，还包括生成第三内存层，所述第三内存层包括第三内存区，生成有存储单元，用以暂存所述第一运算电路的运算结果，其中所述第三内存层位于所述第一核层之上。

条款A31.根据条款A30所述的方法，还包括生成第四内存层，所述第四内存层包括第四内存区，生成有存储单元，用以暂存所述第二运算电路的运算结果，其中所述第四内存层位于所述第一内存层与所述第二核层间，所述生成第四内存层的步骤包括在所述第四内存层生成收发硅通孔，用以电性连接所述第一收发电路及所述第二收发电路。

条款A32.根据条款A29所述的方法，还包括生成第三内存层，包括第三内存区，生成有存储单元，用以暂存所述第一运算电路或所述第二运算电路的运算结果，其中所述第三内存层位于所述第二内存层之下。

以上对本发明实施例进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

一种多核芯片，包括：

第一核层，包括：

第一运算区，生成有第一运算电路；以及

第一晶粒对晶粒区，生成有第一收发电路；

第二核层，包括：

第二运算区，生成有第二运算电路；以及

第二晶粒对晶粒区，生成有第二收发电路；

其中，所述第一核层和所述第二核层纵向堆叠，所述第一运算电路及所述第二运算电路通过所述第一收发电路及所述第二收发电路进行层间数据传输。
根据权利要求1所述的多核芯片，连接至片外内存，还包括内存层，所述内存层包括：

内存区，生成有存储单元，用以暂存所述第一运算电路与所述第二运算电路的运算结果；

输入输出区，生成有输入输出电路，用以作为所述多核芯片对外联系的接口；以及

物理区，生成有物理访问电路，用以访问所述片外内存。
根据权利要求2所述的多核芯片，其中所述内存层位于所述第一核层和所述第二核层间，所述内存层生成有硅通孔，用以电性连接所述第一收发电路及所述第二收发电路。
根据权利要求2所述的多核芯片，其中所述内存区位于所述第一核层和所述第二核层间，所述第二核层生成有硅通孔，用以电性传导所述输入输出电路的数据。
根据权利要求2所述的多核芯片，其中所述内存区位于所述第一核层和所述第二核层间，所述第二核层生成有硅通孔，用以电性传导所述物理访问电路的数据。
根据权利要求1所述的多核芯片，还包括：

第一内存层，包括第一内存区，生成有存储单元，用以暂存所述第一运算电路的运算结果；以及

第二内存层，包括第二内存区，生成有存储单元，用以暂存所述第二运算电路的运算结果；

其中，所述第一核层、所述第一内存层、所述第二核层、所述第二内存层依序堆叠，所述第一内存层生成有收发硅通孔，用以电性连接所述第一收发电路及所述第二收发电路。
根据权利要求6所述的多核芯片，其中所述第一内存层还包括第一输入输出区，生成有第一输入输出电路，用以作为所述多核芯片对外联系的接口，所述第二核层及所述第二内存层生成有输入输出硅通孔，用以电性传导所述第一输入输出电路的数据。
根据权利要求6所述的多核芯片，其中所述第二内存层还包括第二输入输出区，生成有第二输入输出电路，通过输入输出硅通孔电性连接至所述多核芯片外。
根据权利要求6所述的多核芯片，连接至片外内存，其中所述第一内存层还包括第一物理区，生成有物理访问电路，所述第二核层及所述第二内存层生成有物理硅通孔，用以电性传导所述第一运算电路的运算结果至所述片外内存。
根据权利要求6所述的多核芯片，连接至片外内存，其中所述第二内存层还包括第二物理区，生成有物理访问电路，通过物理硅通孔将所述第二运算电路的运算结果传送至所述片外内存。
根据权利要求6所述的多核芯片，其中所述第一核层与所述第一内存层为面对面
制程，所述第一内存层与所述第二核层为背对背制程，所述第二核层与所述第二内存层为面对面制程。
根据权利要求6所述的多核芯片，还包括第三内存层，所述第三内存层包括第三内存区，生成有存储单元，用以暂存所述第一运算电路的运算结果，其中所述第三内存层位于所述第一核层之上。
根据权利要求12所述的多核芯片，其中所述第三内存层与所述第一核层为面对面或面对背制程。
根据权利要求6所述的多核芯片，还包括第四内存层，所述第四内存层包括第四内存区，生成有存储单元，用以暂存所述第二运算电路的运算结果，其中所述第四内存层位于所述第一内存层与所述第二核层间，所述第四内存层生成有收发硅通孔，用以电性连接所述第一收发电路及所述第二收发电路。
根据权利要求14所述的多核芯片，其中所述第一内存层还包括第一输入输出区，生成有第一输入输出电路，用以作为所述多核芯片对外联系的接口，所述第四内存层、所述第二核层及所述第二内存层生成有输入输出硅通孔，用以电性传导所述第一输入输出电路的数据。
根据权利要求14所述的多核芯片，连接至片外内存，其中所述第一内存层还包括第一物理区，生成有物理访问电路，所述第四内存层、所述第二核层及所述第二内存层生成有物理硅通孔，用以电性传导所述第一运算电路的运算结果至所述片外内存。
根据权利要求14所述的多核芯片，其中所述第一核层与所述第一内存层为面对面制程，所述第一内存层与所述第四内存层为背对背制程，所述第四内存层与所述第二核层为面对面制程，所述第二核层及所述第二内存层为面对背制程。
根据权利要求6所述的多核芯片，还包括第三内存层，包括第三内存区，生成有存储单元，用以暂存所述第一运算电路或所述第二运算电路的运算结果，其中，所述第三内存层位于所述第二内存层之下。
根据权利要求18所述的多核芯片，其中所述第三内存层还包括输入输出区，生成有输入输出电路，用以作为所述多核芯片对外联系的接口。
根据权利要求18所述的多核芯片，连接至片外内存，其中所述第三内存层还包括物理区，生成有物理访问电路，用以电性传导所述第一运算电路及所述第二运算电路的运算结果至所述片外内存。
根据权利要求18所述的多核芯片，其中所述第一核层与所述第一内存层为面对面制程，所述第一内存层与所述第二核层为背对背制程，所述第二核层与所述第二内存层为面对面制程，所述第二内存层与所述第三内存层为面对背制程。
根据权利要求1至21所述任一项的多核芯片，其中各层以倒装芯片球栅格阵列方式封装。
根据权利要求1至21所述任一项的多核芯片，其中各层以CoWoS方式封装。
一种集成电路装置，包括根据权利要求1至21任一项所述的多核芯片。
一种板卡，包括根据权利要求24所述的集成电路装置。
一种制成多核芯片的方法，包括：

生成第一核层，所述第一核层包括：

第一运算区，生成有第一运算电路；以及

第一晶粒对晶粒区，生成有第一收发电路；

生成第二核层，所述第二核层包括：

第二运算区，生成有第二运算电路；以及

第二晶粒对晶粒区，生成有第二收发电路；

其中，所述第一核层和所述第二核层纵向堆叠，所述第一运算电路及所述第二运算电路通过所述第一收发电路及所述第二收发电路进行层间数据传输。
根据权利要求26所述的方法，所述多核芯片连接至片外内存，所述方法还包括在所述第一核层和所述第二核层间生成内存层，所述内存层包括：

内存区，生成有存储单元，用以暂存所述第一运算电路与所述第二运算电路的运算结果；

输入输出区，生成有输入输出电路，用以作为所述多核芯片对外联系的接口；以及

物理区，生成有物理访问电路，用以访问所述片外内存。
根据权利要求27所述的方法，其中所述生成内存层的步骤包括在所述内存层生成有硅通孔，用以电性连接所述第一收发电路及所述第二收发电路。
根据权利要求26所述的方法，还包括：

生成第一内存层，包括第一内存区，生成有存储单元，用以暂存所述第一运算电路的运算结果；以及

生成第二内存层，包括第二内存区，生成有存储单元，用以暂存所述第二运算电路的运算结果；

其中，所述第一核层、所述第一内存层、所述第二核层、所述第二内存层依序堆叠；

其中所述生成第一内存层的步骤包括在所述第一内存层生成收发硅通孔，用以电性连接所述第一收发电路及所述第二收发电路。
根据权利要求29所述的方法，还包括生成第三内存层，所述第三内存层包括第三内存区，生成有存储单元，用以暂存所述第一运算电路的运算结果，其中所述第三内存层位于所述第一核层之上。
根据权利要求30所述的方法，还包括生成第四内存层，所述第四内存层包括第四内存区，生成有存储单元，用以暂存所述第二运算电路的运算结果，其中所述第四内存层位于所述第一内存层与所述第二核层间，所述生成第四内存层的步骤包括在所述第四内存层生成收发硅通孔，用以电性连接所述第一收发电路及所述第二收发电路。
根据权利要求29所述的方法，还包括生成第三内存层，包括第三内存区，生成有存储单元，用以暂存所述第一运算电路或所述第二运算电路的运算结果，其中所述第三内存层位于所述第二内存层之下。