CN109063834A - 一种基于卷积特征响应图的神经网络剪枝方法 - Google Patents

一种基于卷积特征响应图的神经网络剪枝方法 Download PDF

Info

Publication number
CN109063834A
CN109063834A CN201810765996.3A CN201810765996A CN109063834A CN 109063834 A CN109063834 A CN 109063834A CN 201810765996 A CN201810765996 A CN 201810765996A CN 109063834 A CN109063834 A CN 109063834A
Authority
CN
China
Prior art keywords
network
convolution
label
indicate
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810765996.3A
Other languages
English (en)
Other versions
CN109063834B (zh
Inventor
葛粟
葛一粟
高飞
卢书芳
张元鸣
张永良
陆佳炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201810765996.3A priority Critical patent/CN109063834B/zh
Publication of CN109063834A publication Critical patent/CN109063834A/zh
Application granted granted Critical
Publication of CN109063834B publication Critical patent/CN109063834B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于卷积特征响应图的网络剪枝方法,它通过卷积特征响应图剪枝的神经网络压缩方法,能实现不影响神经网络精度的基础上,实现神经网络的压缩和加速。本发明通过采用上述技术,剔除神经网络中冗余的卷积操作实现网络的加速和压缩;根据卷积特征响应图的特征响应比判断,实现自动有效的特征提取,结合网络剪枝操作,能在不影响神经网络精度的基础上,实现神经网络的压缩和加速,减少了神经网络中大量的计算量和参数数量,加快神经网络的运算,解决了深度学习难以应用在现实场景中的问题。

Description

一种基于卷积特征响应图的神经网络剪枝方法
技术领域
本发明涉及一种基于卷积特征响应图的神经网络剪枝方法,尤其涉及利用卷积特征响应图的可视化方法,对冗余的网络卷积结构进行剪枝操作,实现网络缩减和加速的神经网络压缩方法。
背景技术
神经网络由于其准确率高,通用性强的特点,受到各行各业学者的持续关注和研究,但由于神经网络的高复杂性和网络计算量巨大的原因,只有较少的方法能应用到实际的场景中。而神经网络的使用需要大量的计算量,因此许多学者针对神经网络进行压缩和加速的研究。而多数方法在实现网络加速的同时,需要对网络结构进行修改并牺牲部分的网络精度。因此基于卷积特征响应图的神经网络剪枝方法是一种较好的解决方案,在不影响网络精度的基础上,实现神经网络的缩减,达到网络加速的目的。
为了解决神经网络计算量过大的问题,国内外学术界、工业界提出了很多方案。其中与本发明较为接近的技术方案包括:Y.Gong(Y.Gong,L.Liu,M.Yang,L.Bourdev,“Compressing Deep Convolutional Networks using Vector Quantization”[J],arXiv:1412.6115,2014)提出了一种压缩神经网络模型大小的方法,主要通过密集权重矩阵进行量化编码实现网络压缩,但该方法只适用于全链接层的网络压缩,不能应用于其他的网络结构。S.Han等人(S.Han,H.Mao,W.J.Dally,“DeepCompression:Compressing Deep NeuralNetworks with Pruning,Trained Quantization and Huffman Coding”,[C]in2016international conference of Learning Representations,October 2016,vol.56,No.4,pp.1-14.)提出了“Deep Compression”压缩方法,通过减去小权重的分支再训练,权重聚类压缩和哈夫曼编码的方式,减少了网络大小,提高了运算速度和减少了网络使用的能量损耗,但该算法在实现了网络加速的同时影响了神经网络的精度。Z.Lin等人(Z.Lin,M.Courbariaux,R.Memisevic,et al.“Neural Networks with Few Multiplications”,[C]in 2016International Conference on Learning Representations,2016)通过在隐层中随机二值化和在反向传播中将乘法转换为移位操作实现网络量化加速。二值网络虽然能极大的压缩网络的大小和提升网络的速度,但相应的牺牲网络精度是不可避免的,特别是在目标检测的问题上。
综上所述,当前神经网络压缩和加速的方案中存在如下不足:
(1)多数方法对在网络速度提高的基础上,减少了部分网络参数的精度,导致网络整体精度受到影响;
(2)部分方法只能针对全连接层进行压缩和加速,而全连接层由于参数过多训练复杂而渐渐被全卷积结构所替代,应用场景局限性较大;
(3)许多方法用二值化操作替代神经网络中复杂的浮点数计算,需要特定的硬件才能有较好的实际应用,对硬件依赖性较高。
人工神经网络在各行业中都有较好的实际应用场景,但由于网络依赖大规模的计算能力,导致神经网络在实际应用中受到限制。而现在多数方法为了实现网络加速的目标,需要牺牲部分的网络精度或依赖于特殊的硬件。
发明内容
针对现有技术中存在的上述问题,为了不影响神经网络精度并实现神经网络压缩和加速,本发明提供了一种基于卷积特征响应图的网络剪枝方法;它通过卷积特征响应图剪枝的神经网络压缩方法,能实现不影响神经网络精度的基础上,实现神经网络的压缩和加速。
所述的一种基于卷积特征响应图的网络剪枝方法,其特征在于包括如下步骤:
步骤1:读取网络权重文件和网络配置文件,得到初始网络结构N0
步骤2:读入训练样本集合Sample={(Ik,labelk)|k=1,2,3,…,nsample},其中Ik表示宽度为Wk高度为Hk的训练样本图像,labelk为对应的图像标签信息,nsample表示训练样本数量,labelk=(xk,yk,wk,hk),(xk,yk)表示目标区域在图像中所在位置的左上角坐标,wk和hk分别表示目标区域在图像Ik中的宽度和高度;
步骤3:将图像和标签文件(Ik,labelk)输入到网络中,并根据各层特征响应图进行网络剪枝操作,具体如下:
步骤3.1:将图像Ik输入初始网络结构N0中,并进行前向传播,得到网络卷积特征图集合R={rij|i=1,2,3,…,n,j=1,2,3,…,m},其中rij表示图像Ik经过第i层中第j个卷积后得到的卷积特征响应图,n表示网络的层数,m表示该卷积层中的卷积数量;
步骤3.2:根据式(1)计算卷积特征图rij中标签区域内的像素值之和vposij,根据式(2)计算rij中标签区域外的像素值之和vnegij
其中,vpq表示在卷积特征图rij中坐标(p,q)位置的像素值,(xij,yij)表示在rij中目标区域左上角的坐标,wij和hij分别表示在rij中目标区域的宽度和高度,Wij和Hij分别表示rij的宽度和高度;
步骤3.3:根据式(4)计算特征图rij中的目标响应比tij
步骤3.4:剔除满足式(5)的卷积滤波器,并更新初始网络结构N0
tij<λ (5)
其中λ表示事先给定的卷积剔除阈值;
步骤4:将样本(Ik,labelk)从训练样本集合Sample中剔除,并重复步骤3和4,直到Sample中无样本,得到最终的剪枝网络Nfinal
通过采用上述技术,本发明的有益效果如下:本发明通过采用上述技术,剔除神经网络中冗余的卷积操作实现网络的加速和压缩;根据卷积特征响应图的特征响应比判断,实现自动有效的特征提取,结合网络剪枝操作,能在不影响神经网络精度的基础上,实现神经网络的压缩和加速,减少了神经网络中大量的计算量和参数数量,加快神经网络的运算,解决了深度学习难以应用在现实场景中的问题;
附图说明
图1为本发明根据卷积特征响应图进行剪枝的流程图;
图2为本发明经过步骤3.1前向传播后的网络卷积特征图。
具体实施方法
下面结合实施实例来详细阐述本发明基于卷积特征响应图的神经网络剪枝方法具体实施方式。
如图1所示,本发明的一种基于卷积特征响应图的网络剪枝方法,包括如下步骤:
步骤1:读取网络权重文件和网络配置文件,得到初始网络结构N0
步骤2:读入训练样本集合Sample={(Ik,labelk)|k=1,2,3,…,nsample},其中Ik表示宽度为Wk高度为Hk的训练样本图像,labelk为对应的图像标签信息,nsample表示训练样本数量,labelk=(xk,yk,wk,hk),(xk,yk)表示目标区域在图像中所在位置的左上角坐标,wk和hk分别表示目标区域在图像Ik中的宽度和高度;
步骤3:将图像和标签文件(Ik,labelk)输入到网络中,并根据各层特征响应图进行网络剪枝操作,具体如下:
步骤3.1:将图像Ik输入初始网络结构N0中,并进行前向传播,得到网络卷积特征图集合R={rij|i=1,2,3,…,n,j=1,2,3,…,m},其中rij表示图像Ik经过第i层中第j个卷积后得到的卷积特征响应图,n表示网络的层数,m表示该卷积层中的卷积数量,经过步骤3.1前向传播后的网络卷积特征图如图2所示;
步骤3.2:根据式(1)计算卷积特征图rij中标签区域内的像素值之和vposij,根据式(2)计算rij中标签区域外的像素值之和vnegij
其中,vpq表示在卷积特征图rij中坐标(p,q)位置的像素值,(xij,yij)表示在rij中目标区域左上角的坐标,wij和hij分别表示在rij中目标区域的宽度和高度,Wij和Hij分别表示rij的宽度和高度;
步骤3.3:根据式(4)计算特征图rij中的目标响应比tij
步骤3.4:剔除满足式(5)的卷积滤波器,并更新初始网络结构N0
tij<λ (5)
其中λ表示事先给定的卷积剔除阈值;在本实例中,λ=1;
步骤4:将样本(Ik,labelk)从训练样本集合Sample中剔除,并重复步骤3和4,直到Sample中无样本,得到最终的剪枝网络Nfinal
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围的不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

Claims (1)

1.一种基于卷积特征响应图的网络剪枝方法,其特征在于包括如下步骤:
步骤1:读取网络权重文件和网络配置文件,得到初始网络结构N0
步骤2:读入训练样本集合Sample={(Ik,labelk)|k=1,2,3,…,nsample},其中Ik表示宽度为Wk高度为Hk的训练样本图像,labelk为对应的图像标签信息,nsample表示训练样本数量,labelk=(xk,yk,wk,hk),(xk,yk)表示目标区域在图像中所在位置的左上角坐标,wk和hk分别表示目标区域在图像Ik中的宽度和高度;
步骤3:将图像和标签文件(Ik,labelk)输入到网络中,并根据各层特征响应图进行网络剪枝操作,具体如下:
步骤3.1:将图像Ik输入初始网络结构N0中,并进行前向传播,得到网络卷积特征图集合R={rij|i=1,2,3,…,n,j=1,2,3,…,m},其中rij表示图像Ik经过第i层中第j个卷积后得到的卷积特征响应图,n表示网络的层数,m表示该卷积层中的卷积数量,经过步骤3.1前向传播后的网络卷积特征图如图2所示;
步骤3.2:根据式(1)计算卷积特征图rij中标签区域内的像素值之和vposij,根据式(2)计算rij中标签区域外的像素值之和vnegij
其中,vpq表示在卷积特征图rij中坐标(p,q)位置的像素值,(xij,yij)表示在rij中目标区域左上角的坐标,wij和hij分别表示在rij中目标区域的宽度和高度,Wij和Hij分别表示rij的宽度和高度;
步骤3.3:根据式(4)计算特征图rij中的目标响应比tij
步骤3.4:剔除满足式(5)的卷积滤波器,并更新初始网络结构N0
tij<λ (5)
其中λ表示事先给定的卷积剔除阈值;
步骤4:将样本(Ik,labelk)从训练样本集合Sample中剔除,并重复步骤3和4,直到Sample中再无样本可剔除,得到最终的剪枝网络Nfinal
CN201810765996.3A 2018-07-12 2018-07-12 一种基于卷积特征响应图的神经网络剪枝方法 Active CN109063834B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810765996.3A CN109063834B (zh) 2018-07-12 2018-07-12 一种基于卷积特征响应图的神经网络剪枝方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810765996.3A CN109063834B (zh) 2018-07-12 2018-07-12 一种基于卷积特征响应图的神经网络剪枝方法

Publications (2)

Publication Number Publication Date
CN109063834A true CN109063834A (zh) 2018-12-21
CN109063834B CN109063834B (zh) 2021-07-20

Family

ID=64816144

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810765996.3A Active CN109063834B (zh) 2018-07-12 2018-07-12 一种基于卷积特征响应图的神经网络剪枝方法

Country Status (1)

Country Link
CN (1) CN109063834B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109858613A (zh) * 2019-01-22 2019-06-07 鹏城实验室 一种深度神经网络的压缩方法、系统及终端设备
CN110929805A (zh) * 2019-12-05 2020-03-27 上海肇观电子科技有限公司 神经网络的训练方法、目标检测方法及设备、电路和介质
CN112488297A (zh) * 2020-12-03 2021-03-12 深圳信息职业技术学院 一种神经网络剪枝方法、模型生成方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778448A (zh) * 2015-03-24 2015-07-15 孙建德 一种基于结构自适应卷积神经网络的人脸识别方法
CN106875373A (zh) * 2016-12-14 2017-06-20 浙江大学 基于卷积神经网络剪枝算法的手机屏幕mura缺陷检测方法
CN107316079A (zh) * 2017-08-08 2017-11-03 珠海习悦信息技术有限公司 终端卷积神经网络的处理方法、装置、存储介质及处理器
CN108197707A (zh) * 2017-12-31 2018-06-22 厦门大学 基于全局误差重建的卷积神经网络的压缩方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778448A (zh) * 2015-03-24 2015-07-15 孙建德 一种基于结构自适应卷积神经网络的人脸识别方法
CN106875373A (zh) * 2016-12-14 2017-06-20 浙江大学 基于卷积神经网络剪枝算法的手机屏幕mura缺陷检测方法
CN107316079A (zh) * 2017-08-08 2017-11-03 珠海习悦信息技术有限公司 终端卷积神经网络的处理方法、装置、存储介质及处理器
CN108197707A (zh) * 2017-12-31 2018-06-22 厦门大学 基于全局误差重建的卷积神经网络的压缩方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
S.ABID: ""A NEW NEURAL NETWORK PRUNING METHOD BASED ON THE SINGULAR VALUE DECOMPOSITION AND THE WEIGHT INITIALISATION"", 《2002 11TH EUROPEAN SIGNAL PROCESSING CONFERENCE》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109858613A (zh) * 2019-01-22 2019-06-07 鹏城实验室 一种深度神经网络的压缩方法、系统及终端设备
CN110929805A (zh) * 2019-12-05 2020-03-27 上海肇观电子科技有限公司 神经网络的训练方法、目标检测方法及设备、电路和介质
CN110929805B (zh) * 2019-12-05 2023-11-10 上海肇观电子科技有限公司 神经网络的训练方法、目标检测方法及设备、电路和介质
CN112488297A (zh) * 2020-12-03 2021-03-12 深圳信息职业技术学院 一种神经网络剪枝方法、模型生成方法及装置
CN112488297B (zh) * 2020-12-03 2023-10-13 深圳信息职业技术学院 一种神经网络剪枝方法、模型生成方法及装置

Also Published As

Publication number Publication date
CN109063834B (zh) 2021-07-20

Similar Documents

Publication Publication Date Title
CN111126472B (zh) 一种基于ssd改进的目标检测方法
CN110210621B (zh) 一种基于残差网络改进的目标检测方法
CN107464210A (zh) 一种基于生成式对抗网络的图像风格迁移方法
CN108985444A (zh) 一种基于节点抑制的卷积神经网络剪枝方法
CN109063834A (zh) 一种基于卷积特征响应图的神经网络剪枝方法
CN107240136B (zh) 一种基于深度学习模型的静态图像压缩方法
CN109005398B (zh) 一种基于卷积神经网络的立体图像视差匹配方法
CN107292458A (zh) 一种应用于神经网络芯片的预测方法和预测装置
CN111046917B (zh) 基于深度神经网络的对象性增强目标检测方法
CN109615068A (zh) 一种对模型中的特征向量进行量化的方法和装置
CN110060286A (zh) 一种单目深度估计方法
CN112528904A (zh) 一种用于砂石颗粒物粒径检测系统的图像分割方法
CN104182771A (zh) 基于带丢包自动编码技术的时间序列数据图形化分析方法
CN109636764A (zh) 一种基于深度学习与显著性检测的图像风格转移方法
CN115471423A (zh) 一种基于生成对抗网络及自注意力机制的点云去噪方法
CN105913451B (zh) 一种基于图模型的自然图像超像素分割方法
Al-Amaren et al. RHN: A residual holistic neural network for edge detection
CN113781528A (zh) 一种基于光流计算的河流表面流速测算方法
CN116342782A (zh) 生成虚拟形象渲染模型的方法和装置
CN110264483B (zh) 一种基于深度学习的语义图像分割方法
CN114359269A (zh) 基于神经网络的虚拟食品盒缺陷生成方法及系统
Tu (Retracted) Computer hand-painting of intelligent multimedia images in interior design major
CN112232292B (zh) 应用于移动端的人脸检测方法及装置
CN108985331A (zh) 一种基于对抗生成网络的目标计数方法
Tang et al. Lightweight network with one-shot aggregation for image super-resolution

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant