CN116306811A

CN116306811A - 一种针对ReRAM部署神经网络的权重分配方法

Info

Publication number: CN116306811A
Application number: CN202310178399.1A
Authority: CN
Inventors: 董光达; 余少华; 伍骏; 熊大鹏; 李涛
Original assignee: Suzhou Yizhu Intelligent Technology Co ltd
Current assignee: Suzhou Yizhu Intelligent Technology Co ltd
Priority date: 2023-02-28
Filing date: 2023-02-28
Publication date: 2023-06-23
Anticipated expiration: 2043-02-28
Also published as: CN116306811B

Abstract

本发明公开了一种针对ReRAM部署神经网络的权重分配方法，属于神经网络技术领域，其方法包括：遍历神经网络结构，将权重进行转换，适配到存算神经网络计算引擎，每层的权重形成一个3维的小立方体；使用3d背包算法，遍历所有的权重立方体，将小立方体放到存算阵列转换的大立方体中，并获取对应的坐标信息。本发明转换了存算阵列视角，将权重存放问题抽象为传统的3d背包问题，便于使用成熟的算法解决陌生的问题，提高了权重存放的效率；同时适用于多数神经网络的权重存放，可复用性高，更利于神经网络的部署与存算神经网络计算引擎的迭代改进。

Description

一种针对ReRAM部署神经网络的权重分配方法

技术领域

本发明涉及神经网络技术领域，尤其涉及一种针对ReRAM部署神经网络的权重分配方法。

背景技术

神经网络算法在计算过程中加载权重会占用大量数据带宽，基于ReRAM的存算神经网络计算引擎事先将权重写入计算单元，在执行神经网络算法是仅需要加载特征向量，省去权重的加载，能极大缓解带宽压力释放算力。

目前基于ReRAM的存内神经网络计算引擎尚处于起步阶段，没有成熟的完整的解决方案。

该算法中存算颗粒结构如图1所示，其中，一个bank由256行144B的存算单元组成；一个macro由4个bank组成，其中bank之间共享输入的数据/地址，提供4个不同的输出；一个group由16个macro组成。该算法描述4 group的情况，即存算颗粒总共包含256bank。rowBank表示并行放置的bank数量，即一次进行能使用的最大bank数量。神经网络的权重格式也是多维数组，即number * widht * hight * channel。由于存算阵列与权重都是多维格式，一般网络较多，如果纯手动摆放整个网络的权重到存算阵列将引起很多不便，如：

（1）多维数据，摆放难度大，容易出现数据覆盖问题。

（2）没有复用性，不同神经网络都需要独立处理，工作量极大。

（3）迭代困难，存放规则变化，手动变更权重存放难以为继。

发明内容

本发明的目的在于克服现有技术的不足，从而提供一种针对ReRAM部署神经网络的权重分配方法。

本发明的目的是通过以下技术方案来实现的：

一种针对ReRAM部署神经网络的权重分配方法，包括以下步骤：

步骤1：读入神经网络；

步骤2：读入神经网络层信息；

步骤3：判断是否包括权重数据；

步骤4：若是，则进行权重转换，形成3维小立方体；若否，则跳转至步骤5；

步骤5：判断神经网络层是否为最后一层；

步骤6：若是，则使用3d背包算法将3维小立方体存放到存算阵列转换的大立方体中；若否，则读入该神经网络层的下一层，并跳转至步骤2；

步骤7：输出存放坐标。

进一步的，所述步骤4中的权重转换具体为：将神经网络权重转换为存算神经网络计算引擎支持的3维小立方体。

进一步的，权重转换的映射关系为：3维小立方体的rowBank表示并行放置的bank数量，即一次进行能使用的最大bank数量；一个bank由144B * 256 行组成，即一个bank的存储容量为144B * 256 = 36 KB；底面由rowBank * columns组成，表示当前的计算资源。

进一步的，存算阵列转换的映射关系为：3维小立方体的rowBank表示并行放置的bank数量，即一次进行能使用的最大bank数量；一个bank由144B * 256 行组成，即一个bank的存储容量为144B * 256 = 36 KB；底面由rowBank * columns组成，表示当前的计算资源。

进一步的，所述步骤6中使用3d背包算法将3维小立方体存放到存算阵列转换的大立方体中具体包括以下步骤：

步骤601：对3维小立方体降序排列；

步骤602：依次传入排序好的小立方体进行存放，并先沿colums方向摆放，如果小立方体的columns超过存算颗粒大立方体的边界，则增加最大的rowBanks到下一行摆放；再沿rowBank方向摆放，如果当前平面摆放满，则增加rows到下一层空间摆放；最后沿rows方向摆放；

步骤603：存放结束，获取存放的所有小立方体坐标，生成神经网络部署必要的权重分布信息。

进一步的，所述步骤601中的降序排列以rowbank>columns>rows的优先级进行降序排列。

本发明的有益效果：

1、本发明转换存算阵列视角，将权重存放问题抽象为传统的3d背包问题，便于使用成熟的算法解决陌生的问题，提高权重存放的效率；

2、本发明适用于多数神经网络的权重存放，可复用性高，更利于神经网络的部署与存算神经网络计算引擎的迭代改进。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图示出的结构获得其他的附图。

图1是存算颗粒结构图。

图2是本发明的方法流程图。

图3是3维立方体结构示意图。

具体实施方式

应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本实施例中，如图2所示，一种针对ReRAM部署神经网络的权重分配方法，包括以下步骤：

步骤1：读入神经网络；

步骤2：读入神经网络层信息；

步骤3：判断是否包括权重数据；

步骤5：判断神经网络层是否为最后一层；

步骤7：输出存放坐标。

在本实施例中，权重转换的映射关系为：3维小立方体的rowBank表示并行放置的bank数量，即一次进行能使用的最大bank数量；一个bank由144B(列方向) * 256 行（行方向）组成，即一个bank的存储容量为144B * 256 = 36 KB；底面由rowBank * columns组成，表示当前的计算资源。

在本实施例中，存算阵列转换的映射关系为：3维小立方体的rowBank表示并行放置的bank数量，即一次进行能使用的最大bank数量；一个bank由144B(列方向) * 256 行（行方向）组成，即一个bank的存储容量为144B * 256 = 36 KB；底面由rowBank * columns组成，表示当前的计算资源。

在本实施例中，本发明的ReRAM部署神经网络的权重分配算法，主要包括：遍历神经网络结构，将权重进行转换，适配到存算神经网络计算引擎，每层的权重形成一个3维的小立方体；使用3d背包算法，遍历所有的权重立方体，将小立方体放到存算阵列转换的大立方体中，并获取对应的坐标信息。具体如下：

1、解析神经网络例如mobileNet-v3-unit8.tflite，遍历网络的每一层，将一般卷积、深度卷积层及全连接层放到同一数组中（记作weight_layer_array），其他没有带权重的层忽略；

2、遍历weight_layer_array，将权重的维度根据存算神经网络计算引擎的约束进行形变，得到新的数组；

3、将上一步得到的新数组传入3d背包算法中进行小立方体的摆放，注意存放过程中权重立方体不能旋转，具体步骤包括：

（1）对小立方体降序排列（降序优先级：rowbank>columns>rows）；

（2）依次传入排序好的小立方体进行存放，获取坐标。如，图3其具体存放过程为：

（a）先沿colums方向摆放，如果小立方体的columns超过存算颗粒大立方体的边界，则增加最大的rowBanks到下一行摆放；

（b）再沿rowBank方向摆放，如果当前平面摆放满，则增加rows到下一层空间摆放；

（c）最后沿rows方向摆放；

（3）存放结束，获取存放的所有小立方体坐标，生成神经网络部署必要的权重分布信息。

需要特别说明的是，在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详细描述的部分，可以参见其他实施例的相关描述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、ROM、RAM等。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种针对ReRAM部署神经网络的权重分配方法，其特征在于，包括以下步骤：

步骤1：读入神经网络；

步骤2：读入神经网络层信息；

步骤3：判断是否包括权重数据；

步骤5：判断神经网络层是否为最后一层；

步骤7：输出存放坐标。

2.根据权利要求1所述的一种针对ReRAM部署神经网络的权重分配方法，其特征在于，所述步骤4中的权重转换具体为：将神经网络权重转换为存算神经网络计算引擎支持的3维小立方体。

3.根据权利要求2所述的一种针对ReRAM部署神经网络的权重分配方法，其特征在于，权重转换的映射关系为：3维小立方体的rowBank表示并行放置的bank数量，即一次进行能使用的最大bank数量；一个bank由144B * 256 行组成，即一个bank的存储容量为144B *256 = 36 KB；底面由rowBank * columns组成，表示当前的计算资源。

4.根据权利要求1所述的一种针对ReRAM部署神经网络的权重分配方法，其特征在于，存算阵列转换的映射关系为：3维小立方体的rowBank表示并行放置的bank数量，即一次进行能使用的最大bank数量；一个bank由144B * 256 行组成，即一个bank的存储容量为144B* 256 = 36 KB；底面由rowBank * columns组成，表示当前的计算资源。

5.根据权利要求1所述的一种针对ReRAM部署神经网络的权重分配方法，其特征在于，所述步骤6中使用3d背包算法将3维小立方体存放到存算阵列转换的大立方体中具体包括以下步骤：

步骤601：对3维小立方体降序排列；

6.根据权利要求5所述的一种针对ReRAM部署神经网络的权重分配方法，其特征在于，所述步骤601中的降序排列以rowbank>columns>rows的优先级进行降序排列。