CN109144943A

CN109144943A - 基于高速串行通道互连的计算芯片与存储器芯片组合系统

Info

Publication number: CN109144943A
Application number: CN201810672821.8A
Authority: CN
Inventors: 童元满; 陆洪毅; 刘垚; 童乔凌
Original assignee: Shenzhen Anxin Intelligent Control Technology Co Ltd
Current assignee: Shenzhen Anxin Intelligent Control Technology Co Ltd
Priority date: 2018-06-26
Filing date: 2018-06-26
Publication date: 2019-01-04

Abstract

本发明涉及计算机系统结构与集成电路设计领域，公开了一种基于高速串行通道互连的计算芯片与存储器芯片组合系统，包括若干个计算芯片和若干个存储器芯片组，存储器芯片组内包含若干个存储器芯片，基于算法数据流图映射的系统结构将计算芯片划分为n组计算芯片组，每个计算芯片组内包含若干个计算芯片，在需要进行数据共享和交换的计算芯片组之间设有若干个存储器芯片组，计算芯片组内的计算芯片通过若干条高速串行通道与相邻的所有存储器芯片组连接。本发明基于高速串行通道互连的计算芯片与存储器芯片组合系统，可根据需要灵活提升高速串行通道数量来提高访存带宽，整体系统结构设计灵活，有效适应计算芯片间流式数据处理的场景，且存储成本低。

Description

基于高速串行通道互连的计算芯片与存储器芯片组合系统

技术领域

本发明涉及计算机系统结构与集成电路设计领域，具体涉及一种基于高速串行通道互连的计算芯片与存储器芯片组合系统。

背景技术

在各种不同类型的算法中，有大量的算法属于访存密集型算法，也就是算法执行过程中访存操作所占的比重更高，访存性能很大程度上决定了算法运行时性能。特别是对于那种访存模式不规则的算法，也就是那种访存局部性很差的算法，Cache(高速缓存)在算法执行过程中不能起到有效的加速作用。在这种情况下，访存带宽和延时对于算法运行时性能起到决定性作用。

当前，为提高存储系统的性能，业界推出了多种不同技术路线的新型存储技术，比如DDR4/DDR5、GDDR5、HMC(Hybrid Memory Cube)、HBM(High Bandwidth Memory)等。虽然各种新型存储技术能够提高越来越高的访存带宽，但是依然存在两个方面的不足。一是这些存储技术的带宽提高受限，它们采用多位并行的接口总线，进一步提高带宽的主要方式是采用更宽的接口总线或者提高接口速率，但是多位并行绑定传输对于信号完整性要求较高，更宽更高速率的接口实现难度越来越大；主处理器如果要进一步提高访存带宽，必须集成更多的访存接口，受限于芯片尺寸和管脚数量，宽总线类型访存接口的集成数量难以大幅提升。二是新型存储技术的实现成本较高，如先进的HBM技术的工程费用就高达上千万美元。三是上述各种新型存储技术本身不具有共享使用模式，或者共享的粒度很低，比如DDR4/DDR5、GDDR5、以及HBM存储介质都只能被与之直接相连的主控芯片访问，不能实现多个主控芯片的直接共享访问；HMC虽然能够连接多个主控芯片，但是不支持超过4个以上的主控芯片共享使用。上述各种新型存储技术的弱共享使用特性一定程度上更加使得采用新型存储的成本更高。

发明内容

本发明的目的就是针对上述技术的不足，提供一种基于高速串行通道互连的计算芯片与存储器芯片组合系统，可根据需要灵活提升高速串行通道数量来提高访存带宽，整体系统结构设计灵活，有效适应计算芯片间流式数据处理的场景，且存储成本低。

为实现上述目的，本发明所设计的基于高速串行通道互连的计算芯片与存储器芯片组合系统，包括若干个计算芯片和若干个存储器芯片组，所述存储器芯片组内包含若干个存储器芯片，基于算法数据流图映射的系统结构，将所述计算芯片划分为n组计算芯片组，每个所述计算芯片组内包含若干个所述计算芯片，在需要进行数据共享和交换的所述计算芯片组之间设有若干个存储器芯片组，所述计算芯片组内的计算芯片通过若干条高速串行通道与相邻的所有存储器芯片组连接。

优选地，所述计算芯片数量为1时，所述计算芯片通过若干条高速串行通道分别与每个所述存储器芯片组相连。

优选地，将所述计算芯片划分为1组计算芯片组，每个所述计算芯片均通过若干条高速串行通道分别与每个所述存储器芯片组相连。

优选地，将所述计算芯片划分为1组计算芯片组，相邻的两个所述计算芯片之间通过若干条高速串行通道连接，所述计算芯片之间依次通过若干条高速串行通道首尾相连，所述计算芯片通过若干条高速串行通道与所有存储器芯片组均连接。

优选地，所述存储器芯片组数量为0。

优选地，所述存储器芯片组内的存储器芯片通过高速串行通道级联。

本发明与现有技术相比，具有以下优点：

1、通过高速串行通道连接计算芯片与存储器芯片组，可以根据需要灵活提高高速串行通道数量来提高访存带宽；

2、多个计算芯片通过高速串行通道可以连接至若干个集中式共享的存储器芯片组，不仅灵活实现数据共享，也可以有效降低存储器在整体系统中的成本开销；

3、通过高速串行通道可以直接连接计算芯片，不仅可以为整体系统结构设计提供了灵活性，也可以有效适应计算芯片间流式数据处理的场景。

附图说明

图1为本发明基于高速串行通道互连的计算芯片与存储器芯片组合系统基于算法数据流图映射的组合结构示意图；

图2为本发明基于高速串行通道互连的计算芯片与存储器芯片组合系统单个计算芯片与多个存储器芯片组的组合结构示意图；

图3为本发明基于高速串行通道互连的计算芯片与存储器芯片组合系统多个计算芯片与多个存储器芯片组的组合结构示意图；

图4为本发明基于高速串行通道互连的计算芯片与存储器芯片组合系统中计算芯片直连与共享存储器芯片相结合的组合结构示意图；

图5为将图4存储器芯片取消后的计算芯片组合结构示意图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步的详细说明。

实施例一

如图2所示，一种基于高速串行通道互连的计算芯片与存储器芯片组合系统，包括1个计算芯片和x个存储器芯片组，x为自然数，每个存储器芯片组内包含若干个存储器芯片，计算芯片为主控芯片，计算芯片通过至少1个高速串行通道分别与每个存储器芯片组连接，也可以根据应用需求，使用多于1个的高速串行通道连接各个存储器芯片组，此时计算芯片运行时数据分布在所有存储器芯片中，所有的存储器芯片被1个计算芯片独占使用，本实施例中，存储器芯片组内的存储器芯片通过高速串行通道级联。

实施例二

如图3所示，一种基于高速串行通道互连的计算芯片与存储器芯片组合系统，包括n个计算芯片和m个存储器芯片组，每个存储器芯片组内包含若干个存储器芯片，存储器芯片组内的存储器芯片通过高速串行通道级联，n、m均为自然数，将计算芯片划分为1组计算芯片组，每个计算芯片均通过若干条高速串行通道分别与每个存储器芯片组相连，也就是每个计算芯片都能够访问所有的存储器芯片组，这m个存储器芯片被n个计算芯片共享使用，这种系统结构不仅可以非常简单的在n个计算芯片之间实现数据共享，同时也降低了系统中存储器芯片的使用成本开销。

实施例三

如图1所示，一种基于高速串行通道互连的计算芯片与存储器芯片组合系统，包括若干个计算芯片和若干个存储器芯片组，存储器芯片组内包含若干个存储器芯片，存储器芯片组内的存储器芯片通过高速串行通道级联，基于算法数据流图映射的系统结构，将计算芯片划分为h组计算芯片组，h为自然数，每个计算芯片组内包含若干个计算芯片，如第一组计算芯片组内包含a1个计算芯片，分别记为c1.1、c1.2、…、c1.a1，第二组计算芯片组内包含a2个计算芯片，分别记为c2.1、c2.2、…、c2.a2，依次类推，第h组计算芯片组内包含ah个计算芯片，分别记为ch.1、ch.2、…、ch.ah，在需要进行数据共享和交换的计算芯片组之间设有若干个存储器芯片组，如在第一组计算芯片组和第二组计算芯片组之间设有x1个存储器芯片组，分别记为m1.1、m1.2、…、m1.x1，在第二组计算芯片组和第三组计算芯片组之间设有x2个存储器芯片组，分别记为m2.1、m2.2、…、m2.x2，依次类推，在第h-1组计算芯片组和第h组计算芯片组之间设有x(h-1)个存储器芯片组，分别记为m(h-1).1、m(h-1).2、…、m(h-1).x(h-1)，计算芯片组内的计算芯片均通过若干条高速串行通道与相邻的所有存储器芯片组连接，即第一组计算芯片组的a1个计算芯片和第二组计算芯片组的a2个计算芯片均通过若干条高速串行通道与设在第一组计算芯片组和第二组计算芯片组之间的x1个存储器芯片组连接，这x1个存储器芯片组作为第一组计算芯片组和第二组计算芯片组之间的公共数据缓存，依次类推，第h-1组计算芯片组的a(h-1)个计算芯片和第h组计算芯片组的ah个计算芯片均通过若干条高速串行通道与设在第(h-1)组计算芯片组和第h组计算芯片组之间的x(h-1)个存储器芯片组连接，这x(h-1)个存储器芯片组作为第(h-1)组计算芯片组和第h组计算芯片组之间的公共数据缓存，这种系统结构所体现出的计算芯片与存储器芯片组之间的互连拓扑结构取决于算法数据流图，可根据实际需求进行灵活调整。

实施例四

如图4所示，一种基于高速串行通道互连的计算芯片与存储器芯片组合系统，包括p个计算芯片和q个存储器芯片组，p、q均为大于1的自然数，每个存储器芯片组内包含若干个存储器芯片，存储器芯片组内的存储器芯片通过高速串行通道级联，将p个计算芯片划分为1组计算芯片组，相邻的两个计算芯片之间通过若干条高速串行通道连接，p个计算芯片之间依次通过若干条高速串行通道首尾相连，构成一个环形互连拓扑结构，本发明并不限定整体系统的实际互连拓扑结构，具体的互连拓扑结构需要根据算法数据流进行设置，p个计算芯片各自通过若干条高速串行通道与所有存储器芯片组连接，这q个存储器芯片被p个计算芯片共享使用，可以作为公共的数据缓存。

另外，如图5所示，本实施例可以取消存储器芯片组，这种计算芯片直连的系统结构适用于流式数据处理的应用场景，不需要大容量缓存，比如多芯片流水处理系统结构，相邻计算芯片能够实现无阻塞流水处理，不需要额外的存储器芯片缓存数据，可以有效减小数据传输延时，从而提高运算性能并降低能耗。

本发明基于高速串行通道互连的计算芯片与存储器芯片组合系统通过高速串行通道连接计算芯片与存储器芯片组，可以根据需要灵活提高高速串行通道数量来提高访存带宽；同时，多个计算芯片通过高速串行通道可以连接至若干个集中式共享的存储器芯片组，不仅灵活实现数据共享，也可以有效降低存储器在整体系统中的成本开销；另外，通过高速串行通道可以直接连接计算芯片，不仅可以为整体系统结构设计提供了灵活性，也可以有效适应计算芯片间流式数据处理的场景。

Claims

1.一种基于高速串行通道互连的计算芯片与存储器芯片组合系统，包括若干个计算芯片和若干个存储器芯片组，所述存储器芯片组内包含若干个存储器芯片，其特征在于：基于算法数据流图映射的系统结构，将所述计算芯片划分为n组计算芯片组，每个所述计算芯片组内包含若干个所述计算芯片，在需要进行数据共享和交换的所述计算芯片组之间设有若干个存储器芯片组，所述计算芯片组内的计算芯片通过若干条高速串行通道与相邻的所有存储器芯片组连接。

2.根据权利要求1所述基于高速串行通道互连的计算芯片与存储器芯片组合系统，其特征在于：所述计算芯片数量为1时，所述计算芯片通过若干条高速串行通道分别与每个所述存储器芯片组相连。

3.根据权利要求1所述基于高速串行通道互连的计算芯片与存储器芯片组合系统，其特征在于：将所述计算芯片划分为1组计算芯片组，每个所述计算芯片均通过若干条高速串行通道分别与每个所述存储器芯片组相连。

4.根据权利要求1所述基于高速串行通道互连的计算芯片与存储器芯片组合系统，其特征在于：将所述计算芯片划分为1组计算芯片组，相邻的两个所述计算芯片之间通过若干条高速串行通道连接，所述计算芯片之间依次通过若干条高速串行通道首尾相连，所述计算芯片通过若干条高速串行通道与所有存储器芯片组均连接。

5.根据权利要求4所述基于高速串行通道互连的计算芯片与存储器芯片组合系统，其特征在于：所述存储器芯片组数量为0。

6.根据权利要求1所述基于高速串行通道互连的计算芯片与存储器芯片组合系统，其特征在于：所述存储器芯片组内的存储器芯片通过高速串行通道级联。