CN108090025B

CN108090025B - 动态多通道的神经网络soc芯片及其通道资源分配方法

Info

Publication number: CN108090025B
Application number: CN201810051540.0A
Authority: CN
Inventors: 廖裕民; 方金木
Original assignee: Rockchip Electronics Co Ltd
Current assignee: Rockchip Electronics Co Ltd
Priority date: 2018-01-19
Filing date: 2018-01-19
Publication date: 2021-08-27
Anticipated expiration: 2038-01-19
Also published as: CN108090025A

Abstract

本发明提供一种动态多通道的神经网络SOC芯片及其通道资源分配方法，增设动态分配通道资源电路，该电路包括源统计单元、DDR访问分组单元、分组配置存储单元、DDR访问通路矩阵单元、终端统计单元以及复数个DDR通道；所述动态分配通道资源电路的在工作过程中，每个源统计单元对神经网络层的数据流量进行统计后送往DDR访问分组单元；由所述DDR访问分组单元判断各个神经网络层的输入数据量和DDR通道的数据量，并以此调整DDR通道的连接关系形成新的DDR通道使用分组关系；再由所述DDR访问通路矩阵单元对数据源通路和DDR通道进行分组互联。从而实现动态分配通道资源，使得人工智能芯片的带宽问题得到有效解决解决。

Description

动态多通道的神经网络SOC芯片及其通道资源分配方法

技术领域

本发明涉及一种人工智能设备，特别涉及一种神经网络SOC芯片及其通道资源分配方法。

背景技术

随着人工智能技术的快速发展，人们对人工智能设备的性能需求越来越高。但是当前困扰深度学习神经网络设备快速发展的一大阻碍就是神经网络结构和运行方式需要大量的数据搬移。比如神经元、权值、阈值、卷积核数据读取，每层神经网络的中间运算结果，反馈训练时的误差计算和回写，最终结果造成了已有的SOC芯片的存储结构不堪重负，存储带宽很容易成为深度学习神经网络的性能瓶颈。

因此本发明提出了一种神经网络SOC芯片，具有自适应超大带宽的深度学习能力，通过多组独立的DDR通道,动态分配通道资源，使得每层或者每几层神经网络都可能被分配到独立的DDR通道，使得人工智能芯片的带宽问题得到有效解决。

发明内容

本发明要解决的技术问题，在于提供一种动态多通道的神经网络SOC芯片及其通道资源分配方法，通过多组独立的DDR通道,动态分配通道资源，使得人工智能芯片的带宽问题得到有效解决解决。

本发明的神经网络SOC芯片是这样实现的：一种动态多通道的神经网络SOC芯片，包括神经网络电路和动态分配通道资源电路；

所述神经网络电路包括复数个神经网络层，每个神经网络层具有一数据源通路；

所述动态分配通道资源电路包括复数个源统计单元、一DDR访问分组单元、一分组配置存储单元、一DDR访问通路矩阵单元、复数个终端统计单元以及复数个DDR通道；复数个所述源统计单元分别一一对应连接各所述神经网络层的数据源通路；复数个所述源统计单元还均连接至所述DDR访问分组单元和DDR访问通路矩阵单元；所述DDR访问分组单元、所述分组配置存储单元、所述DDR访问通路矩阵单元依次连接；每个所述DDR通道均对应通过一所述终端统计单元连接所述DDR访问通路矩阵单元；复数个所述终端统计单元还均连接至所述DDR访问分组单元；

所述动态分配通道资源电路工作过程中，每个所述源统计单元都会对由对应神经网络层经过自身的数据流量进行统计，并将统计信息送往所述DDR访问分组单元；在神经网络电路工作完成并停止后，所述DDR访问分组单元开始判断各个神经网络层的输入数据量和DDR通道的数据量，并以此调整DDR通道的连接关系形成新的DDR通道使用分组关系，并把新的DDR通道使用分组关系写到所述分组配置存储单元；所述DDR访问通路矩阵单元根据分组配置存储单元的配置对数据源通路和DDR通道进行分组互联。

进一步的，所述DDR通道包括依次连接的DDR控制器、DDR PHY、DDR IO以及DDR颗粒，所述DDR通道通过所述DDR控制器连接所述终端统计单元。

进一步的，所述动态分配通道资源电路第一次工作前，先对分组配置存储单元写入通道配置初始值；该通道配置初始值满足条件是：尽量使用所有的DDR通道，尽量使每个神经网络层都有独立的DDR通道，如果通道数量少于神经网络层数，则随机多层共用一个DDR通道。

进一步的，所述分组配置存储单元由非易失性存储器构成。

进一步的，所述源统计单元对数据流量的统计方法具体为：读写分开统计，累加每笔读或写传输的突发传输长度和位宽，单笔数据流量＝突发传输长度×位宽。

进一步的，所述终端统计单元还进行DDR带宽利用率统计，该DDR带宽利用率＝单位时间内的数据流量÷DDR通道的理论带宽值。

本发明方法是这样实现的：一种神经网络SOC芯片的通道资源分配方法，该神经网络SOC芯片本发明上述的动态多通道的神经网络SOC芯片；所述通道资源分配方法包括首次工作的分组过程和首次工作完成之后的分组过程；

所述首次工作的分组过程包括：

步骤11、首先对将数据源通路中对延时敏感且数据量大的神经网络层独立分配一个DDR通道；

步骤12、然后对剩余数据源通路的数据量进行排序，排序后从最大数据量的神经网络层先开始分组；首先把最大数据量的数据源通路分配到DDR通道1，然后将第二大数据量的神经网络层和最大数据量的神经网络层的数据量进行相加，如果相加之和大于单个DDR通道的理论带宽的预定利用率下的数据量，则把第二大数据量的神经网络层数据源通路分配到DDR通道2，反之，则与最大数据量的神经网络层共享DDR通道1；以此类推，将所有源通道分配到各个DDR通道，完成第一轮分配；

所述首次工作完成之后的分组过程包括：

步骤21、对各个DDR通道的利用率进行判断，将利用率低于阈值的DDR通道找出来进行重分配以提高DDR效率；

步骤21、统计各个DDR通道的读写比例，如果出现读或者写的比例大于阈值的DDR通道，则找出数据源通路中读比例最大的，然后找到其他源通道中写比例最大的且互换通道后DDR通道数据量不会超过理论带宽的预定利用率时，互换DDR通道分组；如果没有对应的写比例过大的数据源通路或者互换后会使DDR带宽超标，则不再互换DDR通道分组。

进一步的，所述重分配方法为：如果该DDR通道只对应一个数据源通路，则说明该数据源通路天然取数效率低，不用调整；如果是多个数据源通路共用的DDR通道，则将最低利用率的两个DDR通道中的分别与最大数据量源的数据源通路进行互换。

进一步的，所述理论带宽的预定利用率为70％；所述最低阈值为40％，并能被设置；所述最高阈值为90％以上，并能被设置。

本发明具有如下优点：本发明的芯片和通道资源分配方法通过多组独立的DDR通道，动态分配通道资源；使得每个神经网络层或者每几个神经网络层都可能被分配到独立的DDR通道；使得人工智能芯片的带宽问题得到有效解决解决。

附图说明

下面参照附图结合实施例对本发明作进一步的说明。

图1为本发明神经网络SOC芯片的电路结构示意图。

具体实施方式

请参阅图1所示，本发明的神经网络SOC芯片，包括神经网络电路和动态分配通道资源电路；

所述神经网络电路包括复数个神经网络层，通常一个神经网络电路会有上百个神经网络层，如图中所示的神经元输入层、卷积层、池化层、激活层、全连接层等，每个神经网络层具有一数据源通路；

所述动态分配通道资源电路第一次工作前，先对分组配置存储单元写入通道配置初始值；所述分组配置存储单元由非易失性存储器构成，即掉电后重新工作，数据依然保留。该通道配置初始值满足条件是：尽量使用所有的DDR通道，尽量使每个神经网络层都有独立的DDR通道，如果通道数量少于神经网络层数，则随机多层共用一个DDR通道。

所述动态分配通道资源电路工作过程中，每个所述源统计单元都会对由对应神经网络层经过自身(即源统计单元)的数据流量进行统计，并将统计信息送往所述DDR访问分组单元；在神经网络电路工作完成并停止后，所述DDR访问分组单元开始判断各个神经网络层的输入数据量和DDR通道的数据量，并以此调整DDR通道的连接关系形成新的DDR通道使用分组关系，并把新的DDR通道使用分组关系写到所述分组配置存储单元；所述DDR访问通路矩阵单元根据分组配置存储单元的配置对数据源通路和DDR通道进行分组互联。

其中，数据流量具体的统计方法为：读写分开统计，累加每笔读或写传输的突发传输长度和位宽，单笔数据流量＝突发传输长度×位宽。如此不断累加直到神经网络电路工作完成之后，将统计信息送往DDR访问分组单元。其中，所述终端统计单元相比于所述源统计单元，多一个统计功能就是DDR带宽利用率统计，具体就是单位时间内的数据流量除以DDR通道的理论带宽值。

所述DDR通道包括依次连接的DDR控制器、DDR PHY、DDR IO以及DDR颗粒，所述DDR通道通过所述DDR控制器连接所述终端统计单元。

所述DDR控制器负责将DDR访问通路矩阵单元送过来的总线协议数据访问转化为DDR_PHY的接口，也就是DFI接口；

所述DDR_PHY负责在接收到DDR控制器送来的DFI请求后,将DFI请求转为具体的DDR颗粒访问行为；

所述DDR IO是芯片专门用于连接DDR_PHY与DDR颗粒的IO_PAD,因为DDR访问对速率和信号质量要求很高,因此会定制不同于普通IO的专用DDR_IO用于连接DDR_PHY与DDR颗粒；DDR颗粒就是DDR存储颗粒芯片,再通过DDR IO与本发明的神经网络芯片连接。

基于上述本发明的动态多通道的神经网络SOC芯片，本发明还提供DDR通道资源的分配方法，其包括首次工作的分组过程和首次工作完成之后的分组过程；

所述首次工作的分组过程包括：

步骤11、首先通过配置DDR访问分组单元进行配置，对将数据源通路中对延时敏感且数据量大的神经网络层独立分配一个DDR通道,比如神经元层；

步骤12、然后在DDR访问分组单元中对剩余数据源通路的数据量进行排序，排序后从最大数据量的神经网络层先开始分组,分组通过配置非易失性分组配置存储单元来实现；首先把最大数据量的数据源通路分配到DDR通道1，然后将第二大数据量的神经网络层和最大数据量的神经网络层的数据量进行相加，如果相加之和大于单个DDR通道的理论带宽的预定利用率(通常该理论带宽的预定利用率为70％)下的数据量，则把第二大数据量的神经网络层数据源通路分配到DDR通道2，反之，则与最大数据量的神经网络层共享DDR通道1；以此类推，将所有源通道分配到各个DDR通道，完成第一轮分配；

所述首次工作完成之后的分组过程包括：

步骤21、在DDR访问分组单元中对各个DDR通道的利用率进行判断，将利用率低于最低阈值(该最低阈值可设置，比如40％)的DDR通道找出来进行重分配以提高DDR效率；所述重分配方法为：

如果该DDR通道只对应一个数据源通路，则说明该数据源通路天然取数效率低，不用调整；如果是多个数据源通路共用的DDR通道，则将最低利用率的两个DDR通道中的分别与最大数据量源的数据源通路进行互换，重分配分组通过配置非易失性分组配置存储单元来实现。

步骤21、在DDR访问分组单元中统计各个DDR通道的读写比例，如果出现读或者写的比例大于最高阈值(通常该最高阈值为90％以上，并能被设置)的DDR通道，则找出数据源通路中读比例最大的，然后找到其他源通道中写比例最大的且互换通道后DDR通道数据量不会超过理论带宽预定利用率(通常该理论带宽的预定利用率为70％)时，互换DDR通道分组；如果没有对应的写比例过大的数据源通路或者互换后会使DDR带宽超标，则不再互换DDR通道分组，重分配分组通过配置非易失性分组配置存储单元来实现。例如：

第一次工作后,对终端DDR通道读写比例进行查询,发现终端通道1的读写比例为95％与5％，超过设置的90％。则去查询终端通道1对应的源通道中去每个源通道的读写比例,找到终端通道1对应的源通道中读比例最大的层,假设为卷积层(假设该层的读比例为98％),然后到其他非终端通道1对应的源通道中找到写比例最大的层,假设为终端通道3对应的全连接层(假设该层的写比例为88％),然后将终端通道3的全连接层与终端通道1对应的卷积层对换,对换后卷积层对应终端通道3,全连接层对应终端通道1.然后检查对换后终端通道3和终端通道1的通道数据量不会超过理论带宽70％,如果某个通道超过70％，则撤销该次对换；然后到其他非终端通道1对应的源通道中找到写比例最第二的层，再尝试一次终端通道对换，如此循环直到完成通道对换。

虽然以上描述了本发明的具体实施方式，但是熟悉本技术领域的技术人员应当理解，我们所描述的具体的实施例只是说明性的，而不是用于对本发明的范围的限定，熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化，都应当涵盖在本发明的权利要求所保护的范围内。

Claims

1.一种动态多通道的神经网络SOC芯片，其特征在于：包括神经网络电路和动态分配通道资源电路；

所述动态分配通道资源电路工作过程中，每个所述源统计单元都会对由对应神经网络层的数据流量进行统计，并将统计信息送往所述DDR访问分组单元；在神经网络电路工作完成并停止后，所述DDR访问分组单元开始判断各个神经网络层的输入数据量和DDR通道的数据量，并以此调整DDR通道的连接关系形成新的DDR通道使用分组关系，并把新的DDR通道使用分组关系写到所述分组配置存储单元进行配置；所述DDR访问通路矩阵单元根据分组配置存储单元的配置对数据源通路和DDR通道进行分组互联。

2.根据权利要求1所述的动态多通道的神经网络SOC芯片，其特征在于：所述DDR通道包括依次连接的DDR控制器、DDR PHY、DDR IO以及DDR颗粒，所述DDR通道通过所述DDR控制器连接所述终端统计单元。

3.根据权利要求1所述的动态多通道的神经网络SOC芯片，其特征在于：所述动态分配通道资源电路第一次工作前，先对分组配置存储单元写入通道配置初始值；该通道配置初始值满足条件是：尽量使用所有的DDR通道，尽量使每个神经网络层都有独立的DDR通道，如果通道数量少于神经网络层数，则随机多层共用一个DDR通道。

4.根据权利要求1所述的动态多通道的神经网络SOC芯片，其特征在于：所述源统计单元对数据流量的统计方法具体为：读写分开统计，累加每笔读或写传输的突发传输长度和位宽，单笔数据流量＝突发传输长度×位宽。

5.根据权利要求1所述的动态多通道的神经网络SOC芯片，其特征在于：所述终端统计单元还进行DDR带宽利用率统计，该DDR带宽利用率＝单位时间内的数据流量÷DDR通道的理论带宽值。

6.根据权利要求1所述的动态多通道的神经网络SOC芯片，其特征在于：所述分组配置存储单元由非易失性存储器构成。

7.一种神经网络SOC芯片的通道资源分配方法，其特征在于：该神经网络SOC芯片为权利要求1至6任一项所述的动态多通道的神经网络SOC芯片；所述通道资源分配方法包括首次工作的分组过程和首次工作完成之后的分组过程；

所述首次工作的分组过程包括：

所述首次工作完成之后的分组过程包括：

步骤21、对各个DDR通道的利用率进行判断，将利用率低于最低阈值的DDR通道找出来进行重分配以提高DDR效率；

步骤21、统计各个DDR通道的读写比例，如果出现读或者写的比例大于最高阈值的DDR通道，则找出数据源通路中读比例最大的，然后找到其他源通道中写比例最大的且互换通道后DDR通道数据量不会超过理论带宽的预定利用率时，互换DDR通道分组；如果没有对应的写比例过大的数据源通路或者互换后会使DDR带宽超标，则不再互换DDR通道分组。

8.根据权利要求7所述的一种神经网络SOC芯片的通道资源分配方法，其特征在于：所述重分配方法为：如果该DDR通道只对应一个数据源通路，则说明该数据源通路天然取数效率低，不用调整；如果是多个数据源通路共用的DDR通道，则将最低利用率的两个DDR通道分别与最大数据量源的数据源通路进行互换。

9.根据权利要求7所述的一种神经网络SOC芯片的通道资源分配方法，其特征在于：

所述理论带宽的预定利用率为70％；

所述最低阈值为40％，并能被设置；

所述最高阈值为90％以上，并能被设置。