WO2018058430A1

WO2018058430A1 - 一种可扩展内存的芯片

Info

Publication number: WO2018058430A1
Application number: PCT/CN2016/100795
Authority: WO
Inventors: 戴芬; 胡杏; 徐君; 王元钢
Original assignee: 华为技术有限公司
Priority date: 2016-09-29
Filing date: 2016-09-29
Publication date: 2018-04-05
Also published as: EP3511837A4; CN108139971B; EP3511837A1; CN108139971A; US20190220434A1; EP3511837B1; US10678738B2

Abstract

一种可扩展内存的芯片(200)，该芯片(200)包括：基板(240)以及集成于基板(240)上的处理器(230)、第一内存模块集合(210)和第二内存模块集合(220)；所述处理器(230)通过第一通信接口(250)与所述第一内存模块集合(210)中的至少一个内存模块进行通信，所述处理器(230)通过第二通信接口(260)与所述第二内存模块集合(220)中的至少一个内存模块进行通信；所述第一内存模块集合(210)中的内存模块与所述第二内存模块集合(220)中的内存模块通过基板网络进行通信，所述基板网络是位于所述基板(240)内部的通信网络。可以使处理器(230)通过第二内存模块集合(220)访问第一内存模块集合(210)中的内存模块，从而可以在保证高内存带宽的同时，降低处理器(230)访问内存模块的延迟。

Description

一种可扩展内存的芯片

技术领域

本发明涉及集成电路领域，尤其涉及一种可扩展内存的芯片。

背景技术

内存计算(In-memory computation)是一种将数据全部加载到内存中的计算方法，通过将数据全部加载到内存中，避免了数据在硬盘中的导入和导出，从而提高了芯片的处理速度。

内存计算需要较大内存的容量和带宽，因此，需要大量内存模块与处理器连接。如果每个内存模块都与处理器直接连接时，每个内存模块能够使用的带宽仅为1/N(假设有N个内存模块与处理器直接相连)；如果多个内存模块作为一个内存模块集合，并通过该内存模块集合中的一个内存模块与处理器直接连接，每个内存模块集合能够使用的带宽较大，但是处理器访问内存模块的平均跳数增加，从而降低了处理器访问内存模块的速度。

因此，如何在芯片上集成较多的内存模块并保证高内存带宽和较小的访问时延是当前亟需解决的问题。

发明内容

有鉴于此，本发明实施例提供了一种可扩展内存的芯片，通过在基板上集成处理器和至少两个内存模块集合，并通过基板网络连接该至少两个内存模块，从而可以在集成较多内存模块的同时保证高内存带宽和较快的访问速度。

该可扩展内存的芯片包括：基板以及集成于基板上的处理器、第一内存模块集合和第二内存模块集合；所述处理器通过第一通信接口与所述第一内存模块集合中的至少一个内存模块进行通信，所述处理器通过第二通信接口与所述第二内存模块集合中的至少一个内存模块进行通信；所述第一内存模块集合中的内存模块与所述第二内存模块集合中的内存模块通过基板网络进行通信，所述基板网络是位于所述基板内部的通信网络。

本发明实施例提供的可扩展内存芯片，通过基板网络将多个内存模块集合连接起来，可以使处理器通过第二内存模块集合访问第一内存模块集合中的内存模块，从而可以避开负载较重的通信接口，降低处理器访问内存模块的延迟。

可选地，所述处理器包括多个处理器核，所述多个处理器核通过片上网络进行通信，所述片上网络是位于所述基板外部的通信网络；所述第一内存模块集合和所述第二内存模块集合中分别包括多个内存模块。

配置多核处理器与多内存模块的芯片可以提供更多的通信路径，有利于避开负载较重的通信路径，从而可以降低处理器访问内存模块的时延。

可选地，所述第一内存模块集合中的任意两个内存模块通过所述基板网络进行通信；所述第二内存模块集合中的任意两个内存模块通过所述基板网络进行通信。

当第一内存模块集合和第二内存模块集合分别包括多个内存模块时，每个内存模块集合中的任意两个内存模块之间可以通过基板网络互相连接，从而可以提供更多可选的通信路径，有利于平衡整个芯片的负载。

可选地，所述第一内存模块集合中的任意一个内存模块与所述第二内存模块集合中的任意一个内存模块通过所述基板网络进行通信。

从而可以提供更多可选的通信路径，有利于平衡整个芯片的负载。

可选地，所述第一通信接口与所述第二通信接口分别位于不同的处理器核。

在不可预知负载的情况下，通过将不同的通信接口设置于不同的处理器核，可以避免通信接口集中于一个处理器核导致经过该处理器核的通信路径负载较重。

可选地，当所述处理器的第一处理器核需要访问所述第一内存模块集合中的第一内存模块时，所述第一处理器核用于确定从所述第一处理器核至所述第一内存模块的多条通信路径中跳数最少的一条通信路径为访问路径。

本发明实施例提供的可扩展内存的芯片，需要进行读写操作的处理器核根据该处理器核到内存模块的多条通信路径的跳数确定访问路径，从而可以避免复杂的路径选择运算，减轻了处理器的负担。

可选地，当所述处理器的第二处理器核需要访问所述第一内存模块集合中的第二内存模块时，所述第二处理器核用于确定从所述第二处理器核至所述第二内存模块的多条通信路径中访问时延最小的一条通信路径为访问路径。

本发明实施例提供的可扩展内存的芯片，需要进行读写操作的处理器核根据该处理器核到内存模块的多条通信路径的时延确定访问路径，从而可以根据通信路径的时延变化及时调整访问路径，有利于平衡整个芯片的负载。

可选地，所述第二处理器核具体用于：根据内存时延与内存跳数确定基板网络时延，其中，所述内存时延为所述芯片中任意两个相邻的内存模块之间数据传输所需的平均时间，所述内存跳数为从所述第二处理器核至所述第二内存模块的多条通信路径中数据传输所经过的内存模块的数量；根据内核时延与内核跳数确定片上网络时延，其中，所述内核时延为所述处理器中任意两个相邻的处理器核之间数据传输所需的平均时间，所述内核跳数为从所述第二处理器核至所述第二内存模块的多条通信路径中数据传输所经过的处理器核的数量；根据所述基板网络时延和所述片上网络时延确定所述第二处理器核至所述第二内存模块的多条通信路径的访问时延；从所述多条通信路径中选择访问时延最小的通信路径为所述访问路径。

本发明实施例提供的可扩展内存的芯片，需要进行读写操作的处理器核根据通信路径中不同类型的通信网络的时延从多条通信路径中确定访问路径，从而可以更加精确地确定不同通信路径的时延。

可选地，所述第二处理器核还用于：根据所述内存时延、所述内存跳数和基板网络负载参数确定所述基板网络时延，所述基板网络负载参数用于指示所述基板网络的负载量。

本发明实施例提供的可扩展内存的芯片，通过基板网络负载参数确定基板网络时延，从而可以根据基板网络的负载的变化动态确定通信路径的时延。

可选地，所述第二处理器核还用于：根据所述内核时延、所述内核跳数和片上网络负载参数确定所述片上网络时延，所述片上网络负载参数用于指示所述片上网络的负载量。

本发明实施例提供的可扩展内存的芯片，通过片上网络负载参数确定片上网络时延，从而可以根据片上网络的负载的变化动态确定通信路径的时延。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图作简单地介绍，显而易见地，下面所描述的附图仅仅是本发明的一些实施例的附图。

图1是适用本发明实施例的一种可扩展内存的芯片的示意性结构图；

图2是本发明一实施例提供的可扩展内存的芯片的示意性结构图；

图3是本发明另一实施例提供的可扩展内存的芯片的示意性结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部实施例。

图1示出了适用本发明实施例的一种可扩展内存的芯片100的示意性结构图。如图1所示，该芯片100包括一个多核心处理器芯片(Chip of Multi Processor，CMP)，多个三维(Three-dimensional，3D)动态随机存储器(Dynamic Random Access Memory，DRAM)以及将该CMP与该多个DRAM集成在一起的硅基板(silicon interposer)，其中，硅基板表面可以覆盖金属涂层，DRAM以及CMP可以倒置集成于硅基板上。在硅基板和CMP之间设置有多个用于通信的微凸块(Micro-bump)，CMP的带宽可以根据微凸块位置(pitch)以及CMP的周长计算出来。

CMP中的多个处理器核(core)通过片上网络(Network on Chip，NoC)连接，NoC是位于硅基板外部的通信网络，两个DRAM之间以及DRAM与CMP之间通过基板网络进行通信，基板网络是位于硅基板内部的通信网络，由于NoC不占用基板内部资源，因此，可以利用基板网络为DRAM之间以及CMP与DRAM之间提供丰富的通信路径。

图1示出的芯片100仅是示意性的说明，本发明实施例不限于此，芯片100可以是中央处理器(Central Processing Unit，CPU)芯片，也可以是图形处理器(Graphics Processing Unit，GPU)芯片，还可以是其它类型的芯片。本发明实施例提供的可扩展内存的芯片所包括的处理器可以是单核处理器，所包括的内存模块可以是高带宽存储器(High Bandwidth Memory，HBM)，芯片集成的内存模块的数量不限于图1所示的数量，内存模块与处理器之间的相对位置以及内存模块之间的相对位置也不限于图1所示的位置，此外，硅基板是举例说明，本发明实施例提供的可扩展内存的芯片还可以使用其他材料制备的基板，例如，使用陶瓷材料制备的基板。

图2示出了本发明实施例提供的一种可扩展内存的芯片200的示意性结构图，如图2所示，该芯片200包括：

基板240以及集成于基板上的处理器230、第一内存模块集合210和第二内存模块集合220；

所述处理器230通过第一通信接口250与所述第一内存模块集合210中的至少一个内存模块进行通信，所述处理器230通过第二通信接口260与所述第二内存模块集合220中的至少一个内存模块进行通信；

所述第一内存模块集合210中的内存模块与所述第二内存模块集合220中的内存模块通过基板网络进行通信，所述基板网络是位于所述基板240内部的通信网络。

应理解，本发明实施例中的术语“第一”和“第二”仅仅是为了区分不同的内容，不对本发明实施例作其它限定。

本发明实施例中，基板240用于将处理器230、第一内存模块集合210以及第二内存模块集合220集成在一起，基板240可以提供丰富的基板资源，用于构建基板网络，如图2所示，第一内存模块集合210与第二内存模块集合220之间的连线属于基板网络，位于基板240的内部，第一内存模块集合210与处理器230之间的连线以及第二内存模块集合220与处理器230之间的连线也属于基板网络，位于基板240的内部。

第一通信接口250和第二通信接口260可以是微凸块。

当处理器230确定访问第一内存模块集合210中的内存模块时，如果第一通信接口250的负载不高，处理器230可以通过第一通信接口250直接访问所述内存模块，这样处理器230访问第一内存模块210的跳数最小，从而处理器230访问第一内存模块210的延迟最小，如果第一通信结构250的负载较高，且此时第二通信接口260的负载不高，则处理器可以通过第二通信接口260以及第二内存模块220访问第一内存模块210，从而可以避开负载较大的通信路径，减小处理器230对第一内存模块210的访问时延。

上述实施例仅是举例说明，本发明实施例不限于此，根据本发明实施例的可扩展内存的芯片还可以包括更多个内存模块集合，每个内存模块集合中可以包括一个内存模块，也可以包括多个内存模块。

根据本发明实施例的可扩展内存芯片，通过基板网络将多个内存模块集合连接起来，可以使处理器通过第二内存模块集合访问第一内存模块集合中的内存模块，从而可以避开负载较重的通信接口，降低处理器访问内存模块的延迟。

可选地，所述处理器230包括多个处理器核，所述多个处理器核通过片上网络进行通信，所述片上网络是位于所述基板240外部的通信网络；

所述第一内存模块集合210和所述第二内存模块集合220中分别包括多个内存模块。

处理器230可以为单核处理器，第一内存模块集合210和第二内存模块集合220可以分别包括一个内存模块(情况1)，处理器230可以为多核处理器，第一内存模块集合210和第二内存模块集合220可以分别包括多个内存模块(情况2)。根据情况2配置的芯片与根据情况1配置的芯片相比，根据情况2配置的芯片的处理器核访问内存模块的通信路径更多，从而可以避开负载较重的通信路径，降低处理器访问内存模块的时延。

可选地，所述第一内存模块集合210中的任意两个内存模块通过所述基板网络进行通信；

所述第二内存模块集合220中的任意两个内存模块通过所述基板网络进行通信。

当第一内存模块集合210和第二内存模块集合220包括多个内存模块时，每个内存模块集合中的任意两个内存模块之间可以通过基板网络互相连接，从而可以提供更多可选的通信路径，有利于平衡整个芯片的负载。

可选地，所述第一内存模块集合210中的任意一个内存模块与所述第二内存模块集合220中的任意一个内存模块通过所述基板网络进行通信。从而可以提供更多的通信路径，有利于平衡整个芯片的负载。

可选地，所述第一通信接口250与所述第二通信接口260分别位于不同的处理器核。

如果通信接口在处理器的位置上比较接近，不利于芯片的负载平衡，例如，对于一个多核处理器，如果第一通信接口和第二通信接口的位置位于同一个处理器核，则其它处理器核都要通过该处理器核访问内存模块，从而造成经过该处理器核的通信路径的负载较大，因此，不同的通信接口应当位于不同的处理器核，且相互之间的距离应当尽可能的远。本发明实施例提供的可扩展内存的芯片，不同的通信接口位于不同的处理器核，从而更加有利于平衡整个芯片的不同通信路径的负载。

可选地，当处理器230的第一处理器核需要访问所述第一内存模块集合210中的第一内存模块时，所述处理器核用于确定从所述第一处理器核至所述第一内存模块的多条通信路径中跳数最少的一条通信路径为访问路径。

当第一处理器核需要访问第一内存模块时，第一处理器核可以从第一处理器核到第一内存模块的多条通信路径中确定跳数最少的一个通信路径为访问路径，并通过该访问路径读取第一内存模块中存储的数据或者在第一内存模块中写入数据。应理解，本发明实施例中，“第一处理器核”和“第一内存模块”均为非特指名词，第一处理器核可以为处理器230中的任意一个需要进行读写操作的处理器核，第一内存模块可以为第一内存模块集合中的任意一个内存模块。

可选地，当处理器230的第二处理器核需要访问所述第一内存模块集合210中的第二内存模块时，

所述第二处理器核用于确定从所述第二处理器核至所述第二内存模块的多条通信路径中访问时延最小的一条通信路径为访问路径。

当第二处理器核需要访问第二内存模块时，第二处理器核可以从第二处理器核到第二内存模块的多条通信路径中确定访问时延最小的一条通信路径为访问路径，并通过该访问路径读取第二内存模块中存储的数据或者在第二内存模块中写入数据，该访问时延可以是一段时间内的平均访问时延，也可以是当前时刻的访问时延。应理解，本发明实施例中，“第二处理器核”和“第二内存模块”均为非特指名词，第二处理器核可以为处理器230中的任意一个需要进行读写操作的处理器核，第二内存模块可以为第一内存模块集合中的任意一个内存模块。

可选地，所述第二处理器核具体用于：

根据内存时延与内存跳数确定基板网络时延，其中，所述内存时延为所述芯片中任意两个相邻的内存模块之间数据传输所需的平均时间，所述内存跳数为从所述第二处理器核至所述第二内存模块的多条通信路径中数据传输所经过的内存模块的数量；

根据内核时延与内核跳数确定片上网络时延，其中，所述内核时延为所述处理器中任意两个相邻的处理器核之间数据传输所需的平均时间，所述内核跳数为从所述第二处理器核至所述第二内存模块的多条通信路径中数据传输所经过的处理器核的数量；

根据所述基板网络时延和所述片上网络时延确定所述第二处理器核至所述第二内存模块的多条通信路径的访问时延；

从所述多条通信路径中选择访问时延最小的通信路径为所述访问路径。

由于基板的类型以及制造工艺不同，基板网络与片上网络的传输时延可能相同，也可能不同，因此，需要针对不同的网络确定不同网络对应的传输时延。

例如，数据从第二处理器核到第一通信接口250需要经过5个处理器核(该第二处理器核不计入数据所经过的处理器核的数量)，则内核跳数为5，假设该5跳中每一跳的平均时延为1毫秒(即，内核时延为1毫秒)，则片上网络时延为5毫秒。如果处理器为单核处理器，即，第二处理器核为处理器的唯一处理器核，则片上网络时延为0。

再例如，数据从第一通信接口250传输至第二内存模块需要经过5个内存模块(该第二内存模块计入数据所经过的内存模块的数量)，则内存跳数为5，假设该5跳中每一跳的平均时延为1毫秒(即，内存时延为1毫秒)，则基板网络时延为5毫秒。如果第二内存模块是第一内存模块集合中唯一的内存模块，则内存跳数为1，基板网络时延为1毫秒。

第二处理器核可以根据基板网络时延和片上网络时延确定所述第二处理器核至所述第二内存模块的多条通信路径的访问时延，进而从所述多条通信路径中选择访问时延最小的通信路径为所述访问路径。

因此，本发明实施例提供的可扩展内存的芯片，需要进行读写操作的处理器核根据通信路径中不同类型的通信网络的时延从多条通信路径中确定访问路径，从而可以更加精确地确定不同通信路径的时延。

可选地，所述第二处理器核还用于：

根据所述内存时延、所述内存跳数和基板网络负载参数确定所述基板网络时延，所述基板网络负载参数用于指示所述基板网络的负载量。

可选地，所述第二处理器核还用于：

根据所述内核时延、所述内核跳数和片上网络负载参数确定所述片上网络时延，所述片上网络负载参数用于指示所述片上网络的负载量。

网络的负载越大，传输延迟越大，因此，应当尽可能的避免使用负载较大的网络进行通信。本发明实施例提供的可扩展内存的芯片，处理器核在确定基板网络时延时可以根据内存时延、内存跳数和基板网络负载参数确定基板网络时延，其中，基板网络负载参数正相关于基板网络的负载，第二处理器核可以通过一段时间的学习获得负载参数，例如，第二处理器核通过分析一段时间内的基板网络的负载量与基板网络的时延的关系得到基板网络负载参数，并通过内存时延、内存跳数和基板网络负载参数相乘确定基板网络时延。

可以通过类似的方法获得片上网络负载参数，并确定片上网络时延，在此不再赘述。

因此，本发明实施例提供的可扩展内存的芯片，通过基板网络负载参数确定基板网络时延，以及通过片上网络负载参数确定片上网络时延，从而可以根据基板网络和片上网络的负载的变化动态确定通信路径的时延。

下面，将详细描述本发明实施例提供的一种可扩展内存的芯片以及该芯片的访问路径的选择方法。

如图3所示，芯片300包括一个硅基板，一个16核处理器，该16核处理器的处理器核分别编号C1至C16，芯片300还包括4个内存模块集合，其中，第一内存模块集合包括4个内存模块，分别编号M1至M4，第二内存模块集合包括4个内存模块，分别编号M5至M8，第三内存模块集合包括4个内存模块，分别编号M9至M12，第四内存模块集合包括4个内存模块，分别编号M13至M16。M1通过第一通信接口与C1相连，M5通过第二通信接口与C13相连，M9通过第三通信接口与C16相连，M13通过第四通信接口与C4相连。其余M之间的连线表示内存模块之间通过基板网络连接。从而，本发明实施例提供的芯片300，通过不同内存模块集合之间的通信连接，可以为处理器提供更加丰富的通信路径，有利于平衡芯片300的负载。

假设处理器中只有相邻的连个处理器核可以通过片上网络直接通信，当 C3需要访问M5时，C3可以首先确定C3至M5的多条通信路径中跳数最少的通信路径，例如，第一通信路径：C3-C4-M13-M1-M4-M6-M5，以及第二通信路径：C3-C2-C1-C5-C9-C13-M5，每条通信路径的跳数均为6，C3可以从第一通信路径和第二通信路径中选择任意一条通信路径为访问路径，无需考虑每条路径的负载情况，从而可以避免复杂的路径选择运算，减轻了处理器的负担。

C3还可以根据每条通信路径的时延确定访问M5的访问路径，例如可以根据快速路径选择(Choose Faster Path，CFP)算法确定访问路径。

CFP算法如下：

CFP算法解析如下：

1、current node表示当前发起访问请求的核节点(即，处理器核)；destination node表示目标内存节点(即，需要访问的内存模块)；

2、close_pillar表示首先路由到离当前核节点最近的另一个核节点；far_pillar表示首先路由到离目标内存节点最近的核节点，意味着离当前发起访问请求的核节点更远的核节点；

3、total_close表示以close_pillar方式选择通信路径时，基板网络时延和片上网络时延相加得到的总时延，其中，dest_close_NoC表示片上网络的跳数，NoC_latency表示片上网络每一跳的平均时延，dest_close_NiSI表示基板网络的跳数，NiSI_latency表示基板网络每一跳的平均时延；total_far表示以close_pillar方式选择通信路径时，基板网络时延和片上网络时延相加得到的总时延，其中，dest_far_NoC表示片上网络的跳数，NoC_latency表示片上网络每一跳的平均时延，dest_far_NiSI表示基板网络的跳数，NiSI_latency表示基板网络每一跳的平均时延。

4、通过比较total_close和total_far的大小，选择较小的通信路径为访问路径。

上述通信路径选择方法没有考虑网络的负载情况，简化了通信路径选择的步骤，降低了处理器的负担。

实际上，网络的负载越大，传输延迟越大，为了更加精确地反映不同通信路径的时延，需要考虑网络的负载情况。

例如，可以通过dest_close_NoC×NoC_latency×片上网络负载参数计算出片上网络时延，以及通过dest_close_NiSI×NiSI_latency×基板网络负载参数计算出基板网络时延。实际应用中，处理器可以通过收集一段时间内的片上网络的负载量与时延确定片上网络负载参数，处理器还可以通过收集一段时间内的基板网络的负载量与时延确定基板网络负载参数，从而可以更加精确的计算出通信路径的总时延。处理器具体如何确定负载参数可以根据参阅现有技术的相关方法，在此不再赘述。

可以理解的是，本发明实施例提供的芯片可以应用于计算机、服务器等具有计算和存储能力的计算设备中。本领域技术人员可以知道，所述计算设备中除了包括上述本发明实施例所述的芯片外，还可以包括硬盘、网卡等其他器件。例如，所述计算设备能够通过网卡等通信接口接收数据，并通过所述芯片对接收的数据进行计算及存储。在此不再赘述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本申请所提供的实施例中所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此。

Claims

一种可扩展内存的芯片，其特征在于，包括：基板以及集成于基板上的处理器、第一内存模块集合和第二内存模块集合；

所述处理器通过第一通信接口与所述第一内存模块集合中的至少一个内存模块进行通信，所述处理器通过第二通信接口与所述第二内存模块集合中的至少一个内存模块进行通信；

所述第一内存模块集合中的内存模块与所述第二内存模块集合中的内存模块通过基板网络进行通信，所述基板网络是位于所述基板内部的通信网络。
根据权利要求1所述的芯片，其特征在于：

所述处理器包括多个处理器核，所述多个处理器核通过片上网络进行通信，所述片上网络是位于所述基板外部的通信网络；

所述第一内存模块集合和所述第二内存模块集合中分别包括多个内存模块。
根据权利要求2所述的芯片，其特征在于：

所述第一内存模块集合中的任意两个内存模块通过所述基板网络进行通信；

所述第二内存模块集合中的任意两个内存模块通过所述基板网络进行通信。
根据权利要求2或3所述的芯片，其特征在于：所述第一内存模块集合中的任意一个内存模块与所述第二内存模块集合中的任意一个内存模块通过所述基板网络进行通信。
根据权利要求2至4中任一项所述的芯片，其特征在于：所述第一通信接口与所述第二通信接口分别位于不同的处理器核。
根据权利要求1至5中任一项所述的芯片，其特征在于：

当所述处理器的第一处理器核需要访问所述第一内存模块集合中的第一内存模块时，所述第一处理器核用于确定从所述第一处理器核至所述第一内存模块的多条通信路径中跳数最少的一条通信路径为访问路径。
根据权利要求1至5中任一项所述的芯片，其特征在于：

当所述处理器的第二处理器核需要访问所述第一内存模块集合中的第二内存模块时，

所述第二处理器核用于确定从所述第二处理器核至所述第二内存模块的多条通信路径中访问时延最小的一条通信路径为访问路径。
根据权利要求7所述的芯片，其特征在于，所述第二处理器核具体用于：

根据内存时延与内存跳数确定基板网络时延，其中，所述内存时延为所述芯片中任意两个相邻的内存模块之间数据传输所需的平均时间，所述内存跳数为从所述第二处理器核至所述第二内存模块的多条通信路径中数据传输所经过的内存模块的数量；

根据内核时延与内核跳数确定片上网络时延，其中，所述内核时延为所述处理器中任意两个相邻的处理器核之间数据传输所需的平均时间，所述内核跳数为从所述第二处理器核至所述第二内存模块的多条通信路径中数据传输所经过的处理器核的数量；

根据所述基板网络时延和所述片上网络时延确定所述第二处理器核至所述第二内存模块的多条通信路径的访问时延；

从所述多条通信路径中选择访问时延最小的通信路径为所述访问路径。
根据权利要求8所述的芯片，其特征在于，所述第二处理器核还用于：

根据所述内存时延、所述内存跳数和基板网络负载参数确定所述基板网络时延，所述基板网络负载参数用于指示所述基板网络的负载量。
根据权利要求8或9所述的芯片，其特征在于，所述第二处理器核还用于：

根据所述内核时延、所述内核跳数和片上网络负载参数确定所述片上网络时延，所述片上网络负载参数用于指示所述片上网络的负载量。