CN114970831A

CN114970831A - 一种数模混合存算一体化设备

Info

Publication number: CN114970831A
Application number: CN202210660792.XA
Authority: CN
Inventors: 张和; 康旺; 李赛
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2022-06-13
Filing date: 2022-06-13
Publication date: 2022-08-30

Abstract

本发明提供一种数模混合存算一体化设备，包括：包括存储访存接口、模拟存内计算阵列、数字存内计算阵列和计算结果合成单元；其中：所述存储访存接口分别与所述模拟存内计算阵列和所述数字存内计算阵列相连接；所述计算结果合成单元分别与所述模拟存内计算阵列和所述数字存内计算阵列相连接；用于分别接收模拟存内计算阵列的第一计算结果和数字存内计算阵列的第二计算结果，并融合所述第一计算结果和所述第二计算结果，得到融合计算结果。本发明实施例提供的数模混合存算一体化设备，能够提高数据计算效率。

Description

一种数模混合存算一体化设备

技术领域

本发明涉及数据处理技术领域，具体涉及一种数模混合存算一体化设备。

背景技术

近年来，为了解决器件尺寸微缩挑战与冯诺依曼计算架构瓶颈，存内计算(或者也可称为存算一体、内存计算等)技术得到人们的广泛关注，其基本思想是存储与计算融合在同一个芯片，从而直接利用存储器进行计算，减少存储器与处理器之间的数据传输，降低功耗的同时提高性能。

存算一体计算技术目前被认为是后摩尔时代解决大数据实时智能处理的高效硬件方案之一，也是目前深度学习神经网络高效实施方案之一。对于深度学习神经网络应用，其最频繁的运算是乘积累加运算(Multiply Accumulate,简称MAC)，通过存内计算的方式可以高效的实现MAC运算，从而在大幅度提高性能的同时降低功耗。现有技术方案主要分为模拟存算一体和数字存算一体，分别独立进行存算一体，从而使得数据计算效率不够高效。

发明内容

针对现有技术中的问题，本发明实施例提供一种数模混合存算一体化设备，能够至少部分地解决现有技术中存在的问题。

一方面，本发明提出一种数模混合存算一体化设备，包括存储访存接口、模拟存内计算阵列、数字存内计算阵列和计算结果合成单元；其中：

所述存储访存接口分别与所述模拟存内计算阵列和所述数字存内计算阵列相连接；

用于接收输入的权值数据，并对所述权值数据按照高比特位和低比特位分别进行拆分，得到高比特位组数据和低比特位组数据；

所述模拟存内计算阵列用于接收数字输入信号和所述低比特位组数据，对所述数字输入信号和所述低比特位组数据进行数据处理，得到第一计算结果；

所述数字存内计算阵列用于接收数字输入信号和所述高比特位组数据，对所述数字输入信号和所述高比特位组数据进行数据处理，得到第二计算结果；

所述计算结果合成单元分别与所述模拟存内计算阵列和所述数字存内计算阵列相连接；

用于分别接收所述第一计算结果和所述第二计算结果，并融合所述第一计算结果和所述第二计算结果，得到融合计算结果。

其中，所述模拟存内计算阵列具体用于：

接收数字输入信号和所述低比特位组数据，将所述数字输入信号转换为模拟输入信号，对所述模拟输入信号和所述低比特位组数据进行模拟计算，对模拟计算结果进行数字转换，得到第一计算结果。

其中，所述模拟存内计算阵列内置有数模信号转换器和模数信号转换器；

相应的，通过所述数模信号转换器将所述数字输入信号转换为模拟输入信号，以及通过所述模数信号转换器对模拟计算结果进行数字转换，得到第一计算结果。

其中，所述数字存内计算阵列内置有数字累加器；

相应的，通过所述数字累加器对所述数字输入信号和所述高比特位组数据进行数字计算，得到第二计算结果。

其中，所述数模混合存算一体化设备还包括存算一体数据接口；

所述存算一体数据接口与所述计算结果合成单元相连接，用于将融合计算结果发送至数据接收方。

其中，所述数模混合存算一体化设备还包括控制电路；

所述控制电路分别与所述存储访存接口、所述模拟存内计算阵列、所述数字存内计算阵列、所述计算结果合成单元和所述存算一体数据接口相连接；

用于接收控制信号，并根据所述控制信号控制所述存储访存接口、所述模拟存内计算阵列、所述数字存内计算阵列、所述计算结果合成单元和所述存算一体数据接口。

其中，使用上述数模混合存算一体化设备的数据处理方法，包括：

对权值数据按照高比特位和低比特位分别进行拆分，得到高比特位组数据和低比特位组数据；

对数字输入信号和所述低比特位组数据进行数据处理，得到第一计算结果；对数字输入信号和所述高比特位组数据进行数据处理，得到第二计算结果；

融合所述第一计算结果和所述第二计算结果，得到融合计算结果。

其中，所述数据处理方法还包括：

将融合计算结果发送至数据接收方。

其中，所述对权值数据按照高比特位和低比特位分别进行拆分，得到高比特位组数据和低比特位组数据，包括：

对权值数据按照高比特位和低比特位分别进行均分，得到位数相等的高比特位组数据和低比特位组数据。

其中，所述权值数据与所述数字输入信号之间为乘加运算。

本发明实施例提供的数模混合存算一体化设备，包括存储访存接口、模拟存内计算阵列、数字存内计算阵列和计算结果合成单元；其中：所述存储访存接口分别与所述模拟存内计算阵列和所述数字存内计算阵列相连接；用于接收输入的权值数据，并对所述权值数据按照高比特位和低比特位分别进行拆分，得到高比特位组数据和低比特位组数据；所述模拟存内计算阵列用于接收数字输入信号和所述低比特位组数据，对所述数字输入信号和所述低比特位组数据进行数据处理，得到第一计算结果；所述数字存内计算阵列用于接收数字输入信号和所述高比特位组数据，对所述数字输入信号和所述高比特位组数据进行数据处理，得到第二计算结果；所述计算结果合成单元分别与所述模拟存内计算阵列和所述数字存内计算阵列相连接；用于分别接收所述第一计算结果和所述第二计算结果，并融合所述第一计算结果和所述第二计算结果，得到融合计算结果，能够提高数据计算效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。在附图中：

图1是本发明一实施例提供的数模混合存算一体化设备结构示意图。

图2是本发明一实施例提供的模拟存内计算阵列结构示意图。

图3是本发明另一实施例提供的数模混合存算一体化设备结构示意图。

图4是本发明一实施例提供的数字存内计算阵列结构示意图。

图5是本发明另一实施例提供的数模混合存算一体化设备结构示意图。

图6是本发明另一实施例提供的数模混合存算一体化设备结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚明白，下面结合附图对本发明实施例做进一步详细说明。在此，本发明的示意性实施例及其说明用于解释本发明，但并不作为对本发明的限定。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。

图1是本发明一实施例提供的数模混合存算一体化设备结构示意图，如图1所示，本发明实施例提供的数模混合存算一体化设备，包括：存储访存接口1、模拟存内计算阵列2、数字存内计算阵列3和计算结果合成单元4；其中：

所述存储访存接口1分别与所述模拟存内计算阵列2和所述数字存内计算阵列3相连接；

所述模拟存内计算阵列2用于接收数字输入信号和所述低比特位组数据，对所述数字输入信号和所述低比特位组数据进行数据处理，得到第一计算结果；

所述数字存内计算阵列3用于接收数字输入信号和所述高比特位组数据，对所述数字输入信号和所述高比特位组数据进行数据处理，得到第二计算结果；

所述计算结果合成单元4分别与所述模拟存内计算阵列和所述数字存内计算阵列相连接；

如图2所示，对模拟存内计算阵列2说明如下：

模拟存内计算阵列2基于模拟信号运算实现计算任务，常见存储介质包含RRAM、MRAM、SRAM和Flash等。

如图2所示，外部的数字输入信号需要先经过DAC转换为模拟输入信号，将模拟输入信号作为模拟存内计算阵列2的输入。模拟存内计算阵列2包括存储计算单元，其介质和结构多种多样，此处不做限制。模拟存内计算阵列2实现乘加计算，并输出模拟量的计算结果。最终，经过ADC将模拟计算结果转化为数字信号，得到第一计算结果并输出。

如图3所示，所述模拟存内计算阵列2具体用于：

所述模拟存内计算阵列2内置有数模信号转换器和模数信号转换器；

需要说明的是，参照图2，可以将图2中的DAC和ADC内置在存储/计算阵列中。

如图4所示，对数字存内计算阵列3说明如下：

数字存内计算阵列3主要由SRAM存储介质实现，但此处并不限制其余存储介质。如图4所示，数字输入信号直接以数字信号形式输入到数字存内计算阵列3中，数字存内计算阵列3也以数字信号的形式进行运算，数字存内计算阵列3包括逻辑门及加法树等结构，实现数字式的乘法和加法运算。计算结果由底部的数字累加器进行累加，实现完整的乘加运算。

所述数字存内计算阵列3内置有数字累加器；

需要说明的是，参照图4，可以将图4中数字累加器内置在数字存内计算阵列3中。

在低精度计算场景，模拟存算一体方案有很好的性能优势。但是在高精度计算场景，只能选取数字存算一体方案来进行计算。

然而，数字存算一体方案性能相较于传统数字处理方案提升有限，且存储密度较低。因此，本发明实施例将数字和模拟存算一体技术结合。将高精度计算任务进行拆分，分别由数字和模拟存算一体处理，兼顾面积开销与功耗开销。结构如图5所示。

如图6所示，进一步地，所述数模混合存算一体化设备还包括存算一体数据接口5；

所述存算一体数据接口5与所述计算结果合成单元4相连接，用于将融合计算结果发送至数据接收方，数据接收方可以根据实际需要指定。

进一步地，所述数模混合存算一体化设备还包括控制电路；

所述控制电路分别与所述存储访存接口1、所述模拟存内计算阵列2、所述数字存内计算阵列3、所述计算结果合成单元4和所述存算一体数据接口5相连接；

用于接收控制信号，并根据所述控制信号控制所述存储访存接口1、所述模拟存内计算阵列2、所述数字存内计算阵列3、所述计算结果合成单元4和所述存算一体数据接口5。

进一步地，使用上述数模混合存算一体化设备的数据处理方法，包括：

步骤S1：对权值数据按照高比特位和低比特位分别进行拆分，得到高比特位组数据和低比特位组数据。所述对权值数据按照高比特位和低比特位分别进行拆分，得到高比特位组数据和低比特位组数据，包括：

对权值数据按照高比特位和低比特位分别进行均分，得到位数相等的高比特位组数据和低比特位组数据。举例说明如下：

如图3所示，在处理计算任务时，以12比特精度乘法运算为例。数字输入信号位12bit信号，12bit权值参数分为两部分。假设以6比特和6比特将12比特权值划分为高低比特两组。高比特组由数字存内计算阵列负责运算，即12比特输入乘以6比特高位权值。低比特组由模拟存内计算阵列负责运算，即12比特输入乘以6比特低位权值，将两个计算结果相融合，得到融合计算结果。

步骤S2：对数字输入信号和所述低比特位组数据进行数据处理，得到第一计算结果；对数字输入信号和所述高比特位组数据进行数据处理，得到第二计算结果。可参照上述说明，不再赘述。

步骤S3：融合所述第一计算结果和所述第二计算结果，得到融合计算结果。可参照上述说明，不再赘述。

进一步地，所述数据处理方法还包括：

将融合计算结果发送至数据接收方。可参照上述说明，不再赘述。

进一步地，所述对权值数据按照高比特位和低比特位分别进行拆分，得到高比特位组数据和低比特位组数据，包括：

对权值数据按照高比特位和低比特位分别进行均分，得到位数相等的高比特位组数据和低比特位组数据。可参照上述说明，不再赘述。

进一步地，所述权值数据与所述数字输入信号之间为乘加运算。可参照上述说明，不再赘述。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在本说明书的描述中，参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种数模混合存算一体化设备，其特征在于，包括存储访存接口、模拟存内计算阵列、数字存内计算阵列和计算结果合成单元；其中：

2.根据权利要求1所述的数模混合存算一体化设备，其特征在于，所述模拟存内计算阵列具体用于：

3.根据权利要求2所述的数模混合存算一体化设备，其特征在于，所述模拟存内计算阵列内置有数模信号转换器和模数信号转换器；

4.根据权利要求3所述的数模混合存算一体化设备，其特征在于，所述数字存内计算阵列内置有数字累加器；

5.根据权利要求1至4任一所述的数模混合存算一体化设备，其特征在于，所述数模混合存算一体化设备还包括存算一体数据接口；

6.根据权利要求5所述的数模混合存算一体化设备，其特征在于，所述数模混合存算一体化设备还包括控制电路；

7.一种使用如权利要求1所述数模混合存算一体化设备的数据处理方法，其特征在于，包括：

8.根据权利要求7所述的数据处理方法，其特征在于，所述数据处理方法还包括：

将融合计算结果发送至数据接收方。

9.根据权利要求7所述的数据处理方法，其特征在于，所述对权值数据按照高比特位和低比特位分别进行拆分，得到高比特位组数据和低比特位组数据，包括：

10.根据权利要求7所述的数据处理方法，其特征在于，所述权值数据与所述数字输入信号之间为乘加运算。