CN112613604A - 神经网络的量化方法及装置 - Google Patents

神经网络的量化方法及装置 Download PDF

Info

Publication number
CN112613604A
CN112613604A CN202110015968.1A CN202110015968A CN112613604A CN 112613604 A CN112613604 A CN 112613604A CN 202110015968 A CN202110015968 A CN 202110015968A CN 112613604 A CN112613604 A CN 112613604A
Authority
CN
China
Prior art keywords
layer
network model
weight
final
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110015968.1A
Other languages
English (en)
Inventor
王堃
韩亚敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi Yuspace Intelligent Technology Co ltd
Original Assignee
Jiangsu Yusheng Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Yusheng Technology Co ltd filed Critical Jiangsu Yusheng Technology Co ltd
Priority to CN202110015968.1A priority Critical patent/CN112613604A/zh
Publication of CN112613604A publication Critical patent/CN112613604A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Neurology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种神经网络的量化方法及装置,涉及神经网络模型压缩技术领域,解决了神经网络不能根据实际需要自动量化的技术问题,其技术方案要点是通过限定位宽,逐层对网络模型的卷积层的权重进行量化,以获得在相对较小的位宽下能够得到较高的准确率,并且不需要通过训练集对网络模型重新训练,直接在验证集上做验证就可以确定每一层卷积层在不同的位宽下的权重和准确率。并能够根据每个网络模型的特点,自动用更合理的低精度来进行运算,降低了计算位宽,进一步提升了计算效率。

Description

神经网络的量化方法及装置
技术领域
本公开涉及神经网络模型压缩技术领域,尤其涉及一种神经网络的量化方法及装置。
背景技术
近年来,随着人工智能技术的不断发展,卷积神经网络(Convolutional NeuralNetworks,CNNs)在人工智能中的应用也是俞渐广泛,尤其是在语音识别、图像分类、目标检测等领域取得了较好的成果。为了追求更好的性能,新提出的卷积神经网络往往具有很深的层数,甚至超过了1000层,权重体积和计算复杂度也随之大大增加,甚至对于GPU(Graphics Processing Unit,图形处理器)而言也是一种挑战。此外,许多现实的应用场景往往只能采用嵌入式或移动设备,存储和计算资源非常有限,不能满足多数卷积神经网络的部署要求。
在传统的神经网络中,都是利用数据集对网络模型进行训练,训练过程即对参数不断更新调整的过程,让参数可以利用网络模型的情况对预测的数据进行处理。早期的设计工程中,对网络模型的训练都是为了提升模型精度,并没有考虑模型大小,因此,传统的训练方法训练出来的模型精度都是32位浮点数,这会导致模型比较大,使得大型规模和计算成本成为在低功耗、资源有限的移动系统中部署算法的主要阻碍。因此,在对神经网络模型进行压缩的同时保证模型精度成为深度学习的一个重要研究方向,对神经网络模型进行压缩的方法有很多,例如,网络剪枝,知识蒸馏,权重稀疏,权重量化等。
研究发现卷积神经网络的权重以及特征图不一定需要被表示为浮点数,即使是使用很低的精度来表示,卷积神经网络的性能也不一定会有明显下降。这说明浮点数模型在精度表示方面存在着很大的冗余,如果能把它去除,那么神经网络模型的体积会进一步得到压缩,并且低精度变量的运算也往往比浮点运算耗费更少的时间。
现有技术中都采用统一的量化精度,例如谷歌提出的量化算法,从32bit浮点数转成低精度8/16bit定点数,事实上可以用一些更低的精度去量化卷积神经网络模型结构和算法,例如2、4、6bit等等,但是如何给出合理比特位是个问题。最简单的量化规则为均匀量化,即量化步长一定、量化值成倍增长的方法。此外,还有许多方法会按照原始权重的分布来制定量化规则,例如先用clamp函数将原始值截断后再量化、取对数再量化、保持分布的量化、满足高斯分布的量化等等。为了消除各层权重分布范围差异的影响,许多算法还会先将各层权重归一化再量化,最后再乘上一个与原始分布范围有关的尺度因子。通过不断改进量化规则,单一精度量化技术可以将神经网络的权重量化得越来越低,甚至已有不少工作尝试将权重二值化(量化值取1和-1)和三值化(量化值取1、0和-1)。
但上述量化方法都是固定位宽量化,不能根据实际情况进行自动量化。
发明内容
本公开提供了一种神经网络的量化方法及装置,其技术目的是改变神经网络的固定位宽量化,使得神经网络根据实际需要进行自动量化。
本公开的上述技术目的是通过以下技术方案得以实现的:
一种神经网络的量化方法,包括:
加载网络模型,从所述网络模型中按照卷积层逐层提取权重Wi,其中,i为自然数;
将验证集投入到所述网络模型的每一层卷积层分别提取特征值,获取特征值的数据范围;
对每一层卷积层的权重Wi进行量化,具体包括:
W'=Wi×2j-1;(1)
Figure BDA0002886708300000021
其中j∈[2,8],表示位宽;[-2j-1+1,2j-1-1]为通过位宽j表示的所述特征值的数据范围,对于不在所述数据范围之内的特征值,对式(1)进行clip饱和操作,即将大于值域|[-2j-1+1,2j-1-1]|的数据饱和到[-2j-1+1,2j-1-1]内重新计算卷积层i的权重Wfinal,i
将所述验证集投入到权重为所述Wfinal,i的卷积层进行验证获取验证准确率;
获取不同的位宽j对应的权重Wfinal,i及验证准确率,确定最大的验证准确率对应的位宽j及卷积层的权重Wfinal,i,直至确定每一层卷积层的权重,完成神经网络的量化,保存量化后的网络模型。
进一步地,所述网络模型包括VGG16、YOLOv3和ResNet50。
一种神经网络的量化装置,包括:
权重提取单元,用于加载网络模型,从所述网络模型中按照卷积层逐层提取权重Wi,其中,i为自然数;
特征值提取单元,用于将验证集投入到所述网络模型的每一层卷积层分别提取特征值,获取特征值的数据范围;
量化单元,用于对每一层卷积层的权重Wi进行量化,具体包括:
W'=Wi×2j-1;(1)
Figure BDA0002886708300000031
其中j∈[2,8],表示位宽;[-2j-1+1,2j-1-1]为通过位宽j表示的所述特征值的数据范围,对于不在所述数据范围之内的特征值,对式(1)进行clip饱和操作,即将大于值域|[-2j-1+1,2j-1-1]|的数据饱和到[-2j-1+1,2j-1-1]内重新计算卷积层i的权重Wfinal,i
验证单元,将所述验证集投入到权重为Wfinal,i的卷积层进行验证获取验证准确率;
确定单元,获取不同的位宽j对应的权重Wfinal,i及验证准确率,确定最大的验证准确率对应的位宽j及卷积层的权重Wfinal,i,直至确定每一层卷积层的权重,完成神经网络的量化,保存量化后的网络模型。
本公开的有益效果在于:本公开所述的神经网络的量化方法及装置,通过限定位宽,逐层对网络模型的卷积层的权重进行量化,以获得在相对较小的位宽下能够得到较高的准确率,并且不需要通过训练集对网络模型重新训练,直接在验证集上做验证就可以确定每一层卷积层在不同的位宽下的权重和准确率。并能够根据每个网络模型的特点,自动用更合理的低精度来进行运算,降低了计算位宽,进一步提升了计算效率。
附图说明
图1为本发明所述方法的流程图;
图2为本发明实施例的流程图;
图3为本发明所述装置的示意图。
具体实施方式
下面将结合附图对本公开技术方案进行详细说明。
图1为本发明所述方法的流程图,如图1所示,S100:加载网络模型,从所述网络模型中按照卷积层逐层提取权重Wi,其中,i为自然数。例如,第一层卷积层的权重为W1,第二层卷积层的权重为W2,若网络模型一共有16层卷积层,则i∈[0,15]。
S101:将验证集投入到所述网络模型的每一层卷积层分别提取特征值,获取特征值的数据范围。
S102:对每一层卷积层的权重Wi进行量化,具体包括:
W'=Wi×2j-1;(1)
Figure BDA0002886708300000041
其中j∈[2,8],表示位宽;[-2j-1+1,2j-1-1]为通过位宽j表示的所述特征值的数据范围,对于不在所述数据范围之内的特征值,对式(1)进行clip饱和操作,即将大于值域|[-2j-1+1,2j-1-1]|的数据饱和到[-2j-1+1,2j-1-1]内重新计算卷积层i的权重Wfinal,i
S103:将所述验证集投入到权重为Wfinal,i的卷积层进行验证获取验证准确率。验证准确率由识别正确的数量除以验证集的总数量而得来。
S104:获取不同的位宽j对应的权重Wfinal,i及验证准确率,确定最大的验证准确率对应的位宽j及卷积层的权重Wfinal,i,直至确定每一层卷积层的权重,完成神经网络的量化,保存量化后的网络模型。
由上述式(1)和式(2)计算出第i层卷积层的权重Wfinal,i后,将验证集投入到第i层卷积层进行验证获取验证准确率,获取不同的位宽j对应的权重Wfinal,i及验证准确率,确定最大的验证准确率对应的位宽j(例如位宽为3)及第i层卷积层的权重Wfinal,i(该权重即为位宽为3时由式(1)和式(2)计算得到的权重)。然后继续由式(1)和式(2)计算出第(i+1)层卷积层的权重Wfinal,i+1,再通过步骤S103和步骤S104,确定最大的验证准确率对应的第(i+1)层卷积层的位宽j和权重Wfinal,i+1,逐层确定每一层卷积层的位宽和权重,最终完成神经网络的量化,保存量化后的网络模型。
图2为本发明实施例流程图,如图2所示,初始化i=0,j=2,然后获取卷积层的长度len(例如len=16,即一共有16层卷积层),i≤len,j≤8,然后通过位宽j=2对第0层卷积层的权重进行量化。量化完成后,使用验证集对第0层卷积层进行验证,计算验证准确率m,保存验证准确率m和对应的位宽j=2。依次通过j=3,j=4,...,j=8对第0层卷积层的权重进行量化,得到量化后不同的位宽对应的不同的权重和不同的验证准确率m。找出第0层卷积层最大的验证准确率m对应的位宽及权重并进行保存,然后开始对第1层卷积层的权重进行量化,直至全部卷积层量化完毕,保存最终的网络模型,该网络模型即是需要的模型。
图3为本发明所述装置的示意图,该装置包括权重提取单元、特征提取单元、量化单元、验证单元和确定单元。权重提取单元用于加载网络模型,从所述网络模型中按照卷积层逐层提取权重Wi,其中,i为自然数。
特征值提取单元用于将验证集投入到所述网络模型的每一层卷积层分别提取特征值,获取特征值的数据范围。
量化单元用于对每一层卷积层的权重Wi进行量化,具体包括:
W'=Wi×2j-1;(1)
Figure BDA0002886708300000051
其中j∈[2,8],表示位宽;[-2j-1+1,2j-1-1]为通过位宽j表示的所述特征值的数据范围,对于不在所述数据范围之内的特征值,对式(1)进行clip饱和操作,即将大于值域|[-2j-1+1,2j-1-1]|的数据饱和到[-2j-1+1,2j-1-1]内重新计算卷积层i的权重Wfinal,i
验证单元用于将所述验证集投入到权重为Wfinal,i的卷积层进行验证获取验证准确率。
确定单元用于获取不同的位宽j对应的权重Wfinal,i及验证准确率,确定最大的验证准确率对应的位宽j及卷积层的权重Wfinal,i,直至确定每一层卷积层的权重,完成神经网络的量化,保存量化后的网络模型。
作为具体实施例地,网络模型包括VGG16、YOLOv3和ResNet50。
以上为本公开示范性实施例,本公开的保护范围由权利要求书及其等效物限定。

Claims (4)

1.一种神经网络的量化方法,其特征在于,包括:
加载网络模型,从所述网络模型中按照卷积层逐层提取权重Wi,其中,i为自然数;
将验证集投入到所述网络模型的每一层卷积层分别提取特征值,获取特征值的数据范围;
对每一层卷积层的权重Wi进行量化,得到量化后的权重Wfinal,i,具体包括:
W'=Wi×2j-1; (1)
Figure FDA0002886708290000011
其中j∈[2,8],表示位宽;[-2j-1+1,2j-1-1]为通过位宽j表示的所述特征值的数据范围,对于不在所述数据范围之内的特征值,对式(1)进行clip饱和操作,即将大于值域|[-2j -1+1,2j-1-1]|的数据饱和到[-2j-1+1,2j-1-1]内重新计算卷积层i的权重Wfinal,i
将所述验证集投入到权重为所述Wfinal,i的卷积层进行验证获取验证准确率;
获取不同的位宽j对应的权重Wfinal,i及验证准确率,确定最大的验证准确率对应的位宽j及卷积层的权重Wfinal,i,直至确定每一层卷积层的权重,完成神经网络的量化,保存量化后的网络模型。
2.如权利要求1所述的神经网络的量化方法,其特征在于,所述网络模型包括VGG16、YOLOv3和ResNet50。
3.一种神经网络的量化装置,其特征在于,包括:
权重提取单元,用于加载网络模型,从所述网络模型中按照卷积层逐层提取权重Wi,其中,i为自然数;
特征值提取单元,用于将验证集投入到所述网络模型的每一层卷积层分别提取特征值,获取特征值的数据范围;
量化单元,用于对每一层卷积层的权重Wi进行量化,具体包括:
W'=Wi×2j-1; (1)
Figure FDA0002886708290000012
其中j∈[2,8],表示位宽;[-2j-1+1,2j-1-1]为通过位宽j表示的所述特征值的数据范围,对于不在所述数据范围之内的特征值,对式(1)进行clip饱和操作,即将大于值域|[-2j -1+1,2j-1-1]|的数据饱和到[-2j-1+1,2j-1-1]内重新计算卷积层i的权重Wfinal,i
验证单元,将所述验证集投入到权重为Wfinal,i的卷积层进行验证获取验证准确率;
确定单元,获取不同的位宽j对应的权重Wfinal,i及验证准确率,确定最大的验证准确率对应的位宽j及卷积层的权重Wfinal,i,直至确定每一层卷积层的权重,完成神经网络的量化,保存量化后的网络模型。
4.如权利要求3所述的神经网络的量化装置,其特征在于,所述网络模型包括VGG16、YOLOv3和ResNet50。
CN202110015968.1A 2021-01-07 2021-01-07 神经网络的量化方法及装置 Pending CN112613604A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110015968.1A CN112613604A (zh) 2021-01-07 2021-01-07 神经网络的量化方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110015968.1A CN112613604A (zh) 2021-01-07 2021-01-07 神经网络的量化方法及装置

Publications (1)

Publication Number Publication Date
CN112613604A true CN112613604A (zh) 2021-04-06

Family

ID=75253393

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110015968.1A Pending CN112613604A (zh) 2021-01-07 2021-01-07 神经网络的量化方法及装置

Country Status (1)

Country Link
CN (1) CN112613604A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113762503A (zh) * 2021-05-27 2021-12-07 腾讯云计算(北京)有限责任公司 数据处理方法、装置、设备及计算机可读存储介质
WO2024082705A1 (zh) * 2022-10-19 2024-04-25 华为技术有限公司 一种神经网络训练方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113762503A (zh) * 2021-05-27 2021-12-07 腾讯云计算(北京)有限责任公司 数据处理方法、装置、设备及计算机可读存储介质
WO2024082705A1 (zh) * 2022-10-19 2024-04-25 华为技术有限公司 一种神经网络训练方法及装置

Similar Documents

Publication Publication Date Title
CN109002889B (zh) 自适应迭代式卷积神经网络模型压缩方法
CN108764471B (zh) 基于特征冗余分析的神经网络跨层剪枝方法
CN110555450B (zh) 人脸识别神经网络调整方法和装置
TWI722434B (zh) 深度神經網絡自我調整增量模型壓縮的方法
CN110175641B (zh) 图像识别方法、装置、设备和存储介质
CN111489364B (zh) 基于轻量级全卷积神经网络的医学图像分割方法
CN111723915B (zh) 一种基于深度卷积神经网络的目标检测方法
CN110929836B (zh) 神经网络训练及图像处理方法和装置、电子设备、介质
WO2020001401A1 (zh) 深度神经网络中的网络层运算方法及装置
CN112613604A (zh) 神经网络的量化方法及装置
CN114677548B (zh) 基于阻变存储器的神经网络图像分类系统及方法
CN110705708A (zh) 卷积神经网络模型的压缩方法、装置及计算机存储介质
CN114707637A (zh) 一种神经网络量化部署方法、系统及存储介质
CN114943335A (zh) 一种三值神经网络逐层优化方法
CN113240090B (zh) 图像处理模型生成方法、图像处理方法、装置及电子设备
CN113011532A (zh) 分类模型训练方法、装置、计算设备及存储介质
CN112561050B (zh) 一种神经网络模型训练方法及装置
CN112686384A (zh) 一种自适应比特位宽的神经网络量化方法及其装置
CN115170902B (zh) 图像处理模型的训练方法
CN112446461A (zh) 一种神经网络模型训练方法及装置
CN113177627B (zh) 优化系统、重新训练系统及其方法及处理器和可读介质
CN114139678A (zh) 卷积神经网络量化方法、装置、电子设备和存储介质
CN111614358B (zh) 基于分通道量化的特征提取方法、系统、设备及存储介质
CN109389221A (zh) 一种神经网络压缩方法
CN114611665A (zh) 基于权重振荡影响度的多精度分层量化方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right

Effective date of registration: 20210408

Address after: Room 317-1, 3 / F, building B, 116 Shiyang Road, Qinhuai District, Nanjing, Jiangsu 210000

Applicant after: Jiangsu Yu Space Technology Co.,Ltd.

Address before: 210000 Room 301, building B4, Nanjing Zidong International Creative Park, No.2, Zidong Road, Maqun street, Qixia District, Nanjing City, Jiangsu Province

Applicant before: Jiangsu Yusheng Technology Co.,Ltd.

TA01 Transfer of patent application right
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220111

Address after: 2209-c1, No. 19, Erquan East Road, Huizhi enterprise center, Xishan District, Wuxi City, Jiangsu Province, 214000

Applicant after: Wuxi yuspace Intelligent Technology Co.,Ltd.

Address before: Room 317-1, 3 / F, building B, 116 Shiyang Road, Qinhuai District, Nanjing, Jiangsu 210000

Applicant before: Jiangsu Yu Space Technology Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220914

Address after: Room 1101, block C, Kangyuan smart port, No. 50, Jiangdong Street, Jialing, Jianye District, Nanjing City, Jiangsu Province, 210000

Applicant after: Jiangsu Yu Space Technology Co.,Ltd.

Address before: 2209-c1, No. 19, Erquan East Road, Huizhi enterprise center, Xishan District, Wuxi City, Jiangsu Province, 214000

Applicant before: Wuxi yuspace Intelligent Technology Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230905

Address after: 2209-c1, No. 19, Erquan East Road, Huizhi enterprise center, Xishan District, Wuxi City, Jiangsu Province, 214000

Applicant after: Wuxi yuspace Intelligent Technology Co.,Ltd.

Address before: Room 1101, block C, Kangyuan smart port, No. 50, Jiangdong Street, Jialing, Jianye District, Nanjing City, Jiangsu Province, 210000

Applicant before: Jiangsu Yu Space Technology Co.,Ltd.

TA01 Transfer of patent application right