WO2022105805A1

WO2022105805A1 - 数据的处理方法及存算一体芯片

Info

Publication number: WO2022105805A1
Application number: PCT/CN2021/131247
Authority: WO
Inventors: 何伟; 沈杨书; 祝夭龙
Original assignee: 北京灵汐科技有限公司
Priority date: 2020-11-18
Filing date: 2021-11-17
Publication date: 2022-05-27
Also published as: CN112395247B; CN112395247A

Abstract

一种数据的处理方法及存算一体芯片（200），其中，该方法应用于存算一体芯片（200），存算一体芯片（200）包括至少一个计算核（210），至少一个计算核（210）包括：存储计算阵列（201）、计算模块（202）；该方法包括：存储计算阵列（201）对输入存算一体芯片（200）的具有第一数据属性的第一数据进行运算（S302）；计算模块（202）对输入存算一体芯片（200）的具有第二数据属性的第二数据进行运算，第一数据属性与第二数据属性不同（S304）。根据该方法，可以解决在采用存算一体芯片对数据进行处理的过程中，大量数据需要存储计算阵列进行运算，导致存储计算阵列运算量大以及功耗高的问题。

Description

数据的处理方法及存算一体芯片

技术领域

本申请涉及神经网络领域，具体涉及一种数据的处理方法及存算一体芯片。

背景技术

近年来，为了解决传统冯诺依曼计算体系结构瓶颈，存算一体架构得到人们的广泛关注，如图1所示，其基本思想是直接利用存储器进行逻辑计算，从而减少存储器与处理器之间的数据传输量以及传输距离，降低功耗的同时提高性能。但是，在有大量数据需要进行运算的情况下，仍需消耗较多的时间将大量数据逐行写入存算一体芯片中的存储计算阵列中，从而难以进一步提高存算一体在实际应用中的整体工作效率。

发明内容

本申请实施例提供了一种数据的处理方法及存算一体芯片，以解决在采用存算一体芯片对数据进行处理的过程中，大量数据需要存储计算阵列进行运算，导致存储计算阵列运算量大以及功耗高的问题。

为了解决上述技术问题，本申请是这样实现的：

第一方面，本申请提供了一种数据的处理方法，应用于存算一体芯片，所述存算一体芯片包括至少一个计算核，所述计算核包括：存储计算阵列、计算模块；所述方法包括：所述存储计算阵列对输入所述存算一体芯片的具有第一数据属性的第一数据进行运算；所述计算模块对输入所述存算一体芯片的具有第二数据属性的第二数据进行运算，所述第一数据属性与所述第二数据属性不同。

第二方面，本申请提供了一种存算一体芯片，所述存算一体芯片包括至少一个计算核，所述计算核包括：存储计算阵列、计算模块；所述存储计算阵列，用于对输入所述存算一体芯片的具有第一数据属性的第一数据进行运算；所述计算模块，用于对输入所述存算一体芯片的具有第二数据属性的第二数据进行运算，所述第一数据属性与所述第二数据属性不同。

第三方面，本申请实施例还提供了一种电子设备，其特征在于，包括处理器，存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。

第四方面，本申请实施例还提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。

第五方面，本申请实施例还提供了一种计算机程序产品，包括计算机可读代码，或者承载有计算机可读代码的非易失性计算机可读存储介质，当所述计算机可读代码在电子设备的处理器中运行时，所述电子设备中的处理器执行用于实现第一方面所述的方法的步骤。

在本申请中，通过本申请实施例中的存算一体芯片，能够针对不同数据属性的数据采用不同的模块进行运算，即可以通过存储计算阵列对具有第一数据属性的数据进行运算，以及可以通过计算模块对具有第二数据属性的数据进行运算，从而减轻了存算一体芯片中存储计算阵列的运算量，解决了相关技术中在采用存算一体芯片对数据进行处理的过程中，大量数据需要存储计算阵列进行运算，导致存储计算阵列运算量大以及功耗高的问题。

附图说明

图1是相关技术中存算一体芯片的结构示意图；

图2是本申请实施例的存算一体芯片的结构示意图；

图3是本申请实施例的数据的处理方法的流程图。

具体实施方式

下面将结合本申请一些实施例中的附图，对本申请一些实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请实施例保护的范围。

在本申请实施例的描述中，需要理解的是，术语“第一”、“第二”仅由于描述目的，且不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。因此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者多个该特征。本申请实施例的描述中，除非另有说明，“多个”的含义是两个或两个以上。

图1是相关技术中存算一体芯片的结构示意图。在图1中，存算一体芯片100包括：存储计算阵列101、数模转换模块102和模数转换模块103。在图1中，在采用存算一体芯片100对数据进行处理的过程中，大量数据需要存储计算阵列101进行运算，从而导致存储计算阵列101运算量大以及功耗高的问题。

下面结合附图，通过具体的实施例及其应用场景对本申请实施例提供的数据的处理方法进行详细地说明。

本申请实施例提供了一种数据的处理方法，该方法应用于存算一体芯片，其中，如图2所示，该存算一体芯片200包括至少一个计算核210，其中，至少一个计算核210包括：存储计算阵列201、计算模块202。需要说明的是，图2中的存算一体芯片200仅示意性给出一个计算核210，在一种可能的实现方式中，存算一体芯片200中可以包括多个计算核210，构成众核结构的存算一体芯片。在本公开实施例中，仅以存算一体芯片200中包含一个计算核210为例，进行示例性说明。

基于此，图3是本申请实施例的数据的处理方法的流程图，如图3所示，该方法的步骤包括：

步骤S302，存储计算阵列对输入存算一体芯片的具有第一数据属性的第一数据进行运算；

步骤S304，计算模块对输入存算一体芯片的具有第二数据属性的第二数据进行运算，第一数据属性与第二数据属性不同。

通过本申请实施例中的存算一体芯片，能够针对不同数据属性的数据采用不同的模块进行运算，即可以通过存储计算阵列对具有第一数据属性的数据进行运算，以及可以通过计算模块对具有第二数据属性的数据进行运算，从而减轻了存算一体芯片中存储计算阵列的运算量，解决了在采用存算一体芯片对数据进行处理的过程中，大量数据需要存储计算阵列进行运算，导致存储计算阵列运算量大以及功耗高的问题。

需要说明的是，本申请实施例中的存算一体芯片可以对混合神经网络的数据进行处理，例如存算一体芯片可以将混合神经网络中的不同数据属性的神经网络的数据，分配至存算一体芯片中的一个或多个计算核进行处理。在本申请实施例中，该第一神经网络和第二神经网络为该混合神经网络中的神经网络，第一神经网络的数据和第二神经网络的数据具有不同数据属性，因此，通过该存算一体芯片对具有不同数据属性的神经网络的数据进行区分，得到适合计算核中的计算模块处理的神经网络的数据及适合计算核中的存储计算阵列处理的神经网络的数据，从而根据不同数据属性分配计算核中计算模块和存储计算阵列可以处理的数据，使混合神经网络中的不同神经网络的数据的处理效率保持平衡，可以提升混合神经网络中数据的处理效率。

进一步地，在本申请实施例的可选实施方式中，本申请实施例的存储计算阵列中包括非易失性存储，在具体应用场景中该非易失性存储可以包括NOR型闪存单元阵列、NAND型闪存单元阵列、电阻性随机存取存储器(Resistive Random Access Memory，RRAM)器件；上述非易失性存储仅仅是举例说明，在其他应用场景中该非易失性存储还可以是非易失性存储器(Non-Volatile Memory，NVM)、非挥发性的磁性随机存储器(Magnetic Random Access Memory，MRAM)等。此外，在本申请实施例中，该存储计算阵列的运算方式可以为矩阵运算。

另外，本申请实施例中的计算模块可以包括以下至少之一：向量运算模块、矩阵运算模块。基于此，本申请实施例中的计算模块的运算方式可以为矩阵运算和/或向量运算。

在本申请实施例的另一个可选实施方式中，本申请实施例中的第一数据为第一神经网络的数据；存储计算阵列预存储有第一神经网络的权重，该第一神经网络的权重为第一神经网络中所包含函数的权重，例如，激活函数、损失函数等函数的权重。基于此，由于预先存储有第一神经网络的权重，在第一神经网络的数据输入到存储计算阵列中后可以直接对其进行运算，大大提高了存储计算阵列的运算效率。

此外，本申请实施例中的第一数据包括以下至少之一：使用频率超过预设频率阈值的数据、运算功耗超过预设功耗阈值的数据、传输时延低于预设时延阈值的数据；本申请实施例中的第二数据包括以下至少之一：使用频率小于或等于预设频率阈值的数据、运算功耗小于或等于预设功耗阈值的数据、传输时延高于或等于预设时延阈值的数据。

在本申请实施例的运算过程中，可以将高频使用的数据(即使用频率超过预设频率阈值的数据)直接输入存储阵列进行运算，低频使用的数据(即使用频率小于或等于预设频率阈值的数据)输入计算模块中进行运算，或者是将计算密集型功耗大给存储计算阵列，省延迟和节省带宽的数据给计算模块，或者，是将低延迟数据输入到存储计算阵列中，从而降低运算过程中数据频繁从片外传输的概率。

需要说明的是，该预存储第一神经网络的权重的时机可以是存储计算一体芯片中的存储计算阵列和计算模块完全没有进行运算之前，即在进行运算之前就已经在存储计算阵列中存储有该第一神经网络的权重，第一神经网络的数据则可以直接输入到存储计算阵列中进行运算；还可以是，在运算一段时间后，再添加其他类型的第一神经网络的权重，例如混合神经网络中的其他神经网络的权重。也就是说，在本申请实施例中是预先存储第一神经网络的权重之后再对第一神经网络的数据进行运算。

另外，本申请实施例中的使用频率超过预设频率阈值的神经网络可以是指该神经网络的主要用途，例如：人脸识别、图像分类、数据的风险评估等等。以人脸识别为主要用途的神经网络为例，则在对输入的图像进行人脸识别之前，将与该神经网络对应的权重预存储到存储计算阵列中，这样在该神经网络输入图像数据时，直接输入到存储计算阵列中进行运算，而对于其他神经网络的数据则输入到计算模块中进行运算，在减轻了存储计算阵列运算负担的同时，提升了存算一体芯片的运算效率。

在本申请实施例的另一个可选实施方式中，第二数据为第二神经网络的数据；在计算模块对输入存算一体芯片的具有第二数据属性的第二数据进行运算之前，包括：

步骤S11，存储计算阵列接收并存储第二神经网络的权重。

步骤S12，存储计算阵列响应于计算模块的权重获取请求，发送第二神经网络的权重至计算模块。

需要说明的是，该第二神经网络的权重也可以是与第一神经网络的权重的存储时机一样，在还没进行运算之前就预先存储。另外，由于计算模块是对输入存算一体芯片的具有第二数据属性的数据进行运算，则在识别出当前输入存算一体芯片的数据不是具有第一数据属性的数据，而是具有第二属性的数据的情况下，会将该具有第二属性的数据输入到计算模块中，因此，可以通过权重获取请求，从存储计算阵列中调用第二神经网络的权重，进而在运算过程中，依据第二神经网络的权重对第二神经网络的数据进行运算。

在本申请实施例中存储计算阵列和计算模块可以并行执行数据运算。

基于本申请实施例中的数据的处理方式，在存算一体芯片的基础上，对输入存算一体芯片的具有不同数据属性的数据可以进行区分运算，从而减少低频数据对存储计算阵列的占用、降低运算功耗、并且减少在运算过程中的输入/输出(Input/Output，I/O)数据搬运。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本申请上述实施例的方法。

需要说明的是，本申请实施例的数据的处理方法可以由硬件执行，或者该方法可以由通过处理器运行计算机可执行代码的方式来执行。在不违背逻辑的情况下，本申请不同实施例之间可以相互结合，不同实施例描述有所侧重，未侧重描述的部分可参见其他实施例的记载。

本申请实施例提供了一种存算一体芯片，如图2所示，该存算一体芯片包括至少一个计算核，该至少一个计算核包括：存储计算阵列、计算模块；

存储计算阵列，用于对输入存算一体芯片的具有第一数据属性的第一数据进行运算；

计算模块，用于对输入存算一体芯片的具有第二数据属性的第二数据进行运算，第一数据属性与第二数据属性不同。

可选地，本申请实施例中的第一数据为第一神经网络的数据；存储计算阵列预存储有第一神经网络的权重。

可选地，本申请实施例中的第一数据包括以下至少之一：使用频率超过预设频率阈值的数据、运算功耗超过预设功耗阈值的数据、传输时延低于预设时延阈值的数据。

可选地，本申请实施例中的第二数据包括以下至少之一：使用频率小于或等于预设频率阈值的数据、运算功耗小于或等于预设功耗阈值的数据、传输时延高于或等于预设时延阈值的数据。

可选地，本申请实施例中的第二数据为第二神经网络的数据；存储计算阵列，还用于在计算模块对输入存算一体芯片的具有第二数据属性的第二神经网络的数据进行运算之前，接收并存储第二神经网络的权重；响应于计算模块的权重获取请求，发送第二神经网络的权重至计算模块。

可选地，本申请实施例中的存储计算阵列和计算模块并行执行数据运算。

可选地，存储计算阵列包括非易失性存储。

可选地，计算模块包括以下至少之一：向量运算模块、矩阵运算模块。

可选地，本申请实施例还提供一种电子设备，包括处理器，存储器，存储在存储器上并可在所述处理器上运行的程序或指令，该程序或指令被处理器执行时实现上述对数据的处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

需要注意的是，本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。

本申请实施例还提供一种可读存储介质，所述可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述数据的处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

其中，所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质，包括计算机可读存储介质，如计算机只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等。

显然，本领域的技术人员应该明白，上述的本申请的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本申请不限制于任何特定的硬件和软件结合。

以上所述仅为本申请的可选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种数据的处理方法，应用于存算一体芯片，其特征在于，所述存算一体芯片包括至少一个计算核，所述计算核包括：存储计算阵列、计算模块；所述方法包括：

所述存储计算阵列对输入所述存算一体芯片的具有第一数据属性的第一数据进行运算；

所述计算模块对输入所述存算一体芯片的具有第二数据属性的第二数据进行运算，所述第一数据属性与所述第二数据属性不同。
根据权利要求1所述的方法，其特征在于，所述第一数据为第一神经网络的数据；所述存储计算阵列预存储有所述第一神经网络的权重。
根据权利要求1所述的方法，其特征在于，

所述第一数据包括以下至少之一：使用频率超过预设频率阈值的数据、运算功耗超过预设功耗阈值的数据、传输时延低于预设时延阈值的数据。
根据权利要求1所述的方法，其特征在于，所述第二数据包括以下至少之一：使用频率小于或等于预设频率阈值的数据、运算功耗小于或等于预设功耗阈值的数据、传输时延高于或等于预设时延阈值的数据。
根据权利要求1所述的方法，其特征在于，所述第二数据为第二神经网络的数据；在所述计算模块对输入所述存算一体芯片的具有第二数据属性的第二数据进行运算之前，所述方法还包括：

所述存储计算阵列接收并存储所述第二神经网络的权重；

所述存储计算阵列响应于所述计算模块的权重获取请求，发送所述第二神经网络的权重至所述计算模块。
根据权利要求1所述的方法，其特征在于，

所述存储计算阵列和所述计算模块并行执行数据运算；

所述存储计算阵列包括非易失性存储；

所述计算模块包括以下至少之一：向量运算模块、矩阵运算模块。
一种存算一体芯片，其特征在于，所述存算一体芯片包括至少一个计算核，所述计算核包括：存储计算阵列、计算模块；

所述存储计算阵列，用于对输入所述存算一体芯片的具有第一数据属性的第一数据进行运算；

所述计算模块，用于对输入所述存算一体芯片的具有第二数据属性的第二数据进行运算，所述第一数据属性与所述第二数据属性不同。
根据权利要求7所述的存算一体芯片，其特征在于，所述第一数据为第一神经网络的数据；所述存储计算阵列预存储有所述第一神经网络的权重。
一种电子设备，其特征在于，包括处理器，存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现包括如权利要求1-6中任一项所述的数据的处理方法的步骤。
一种可读存储介质，其特征在于，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现包括如权利要求1-6中任一项所述的数据的处理方法的步骤。
一种计算机程序产品，包括计算机可读代码，或者承载有计算机可读代码的非易失性计算机可读存储介质，当所述计算机可读代码在电子设备的处理器中运行时，所述电子设备中的处理器执行用于实现权利要求1-6中的任一项所述的数据的处理方法的步骤。