CN115730654A - 层剪枝方法、厨余垃圾检测方法及遥感图像车辆检测方法 - Google Patents
层剪枝方法、厨余垃圾检测方法及遥感图像车辆检测方法 Download PDFInfo
- Publication number
- CN115730654A CN115730654A CN202211476624.1A CN202211476624A CN115730654A CN 115730654 A CN115730654 A CN 115730654A CN 202211476624 A CN202211476624 A CN 202211476624A CN 115730654 A CN115730654 A CN 115730654A
- Authority
- CN
- China
- Prior art keywords
- layer
- decoupling
- convolution
- network model
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000001514 detection method Methods 0.000 title claims abstract description 70
- 238000013138 pruning Methods 0.000 title claims abstract description 55
- 239000010813 municipal solid waste Substances 0.000 title claims abstract description 10
- 238000012549 training Methods 0.000 claims abstract description 50
- 230000006835 compression Effects 0.000 claims abstract description 10
- 238000007906 compression Methods 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims description 31
- 230000008569 process Effects 0.000 claims description 30
- 238000004364 calculation method Methods 0.000 claims description 28
- 239000010806 kitchen waste Substances 0.000 claims description 19
- 230000004913 activation Effects 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 6
- 230000002238 attenuated effect Effects 0.000 claims description 5
- 230000005484 gravity Effects 0.000 claims description 3
- 238000005286 illumination Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000001502 supplementing effect Effects 0.000 claims description 3
- 230000015556 catabolic process Effects 0.000 abstract description 3
- 238000006731 degradation reaction Methods 0.000 abstract description 3
- 238000013135 deep learning Methods 0.000 description 6
- 230000001133 acceleration Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明新型公开了一种层剪枝方法,包括确定目标网络模型和训练数据集;采用训练数据集训练目标网络模型得到基础网络模型;对基础网络模型等价替换得到解耦网络模型;采用训练数据集训练解耦网络模型;等价解耦训练后的解耦网路模型并确定卷积层及参数;采用卷积层及参数进行合并处理,完成目标网络模型的层剪枝。本发明还公开了一种包括所述层剪枝方法的厨余垃圾检测检测方法以及包括所述层剪枝方法的遥感图像车辆检测方法。本发明具有模型压缩率高、不下降性能、可靠性好的优点。
Description
技术领域
本发明属于深度学习检测技术领域,具体涉及一种层剪枝方法、厨余垃圾检测方法及遥感图像车辆检测方法。
背景技术
随着深度学习技术的发展,基于人工智能的成果已经广泛应用到了人们的生活当中,包括农业植保、遥感检测、智能交通、灾难救援等场景,深度学习技术已然成为当下的研究热点。目标检测作为计算机视觉中的一项基本任务,已经得到了极大的发展,但对于厨余垃圾检测与无人机平台目标检测而言,仍面临许多挑战。厨余垃圾检测与无人机平台目标检测不同于传统的离线处理,其均需要高速地检测图像中的目标。对于厨余垃圾检测而言,亟需提高垃圾检测的速度,以便于后续垃圾分拣的任务。而对于无人机平台的遥感图像车辆检测,其也需要快速的完成检测过程。因此,常规的基于深度学习的目标检测方法并无法直接应用于厨余垃圾检测或无人机中的遥感图像车辆检测。因此研究如何实现高精度、高速度的厨余垃圾检测与无人机平台的遥感车辆目标检测,就具有重要的意义。
现阶段,基于深度学习的检测模型存在参数量大、计算量高等问题,针对计算和存储资源受限的无人机平台,需对已有模型研究一系列参数剪枝、量化加速等方法。参数剪枝是一种重要的模型压缩方法,具体包括通道剪枝和层剪枝等。通道剪枝虽然能大幅度减少参数量和计算量,但在边缘设备部署时,由于模型的内存访问成本依然很高,最终模型部署时的速度提升非常有限。层剪枝的加速效果更加理想,通过删除模型的冗余卷积层,同时大幅降低模型的参数量、计算量和内存访问成本,能够有效提高模型推理速度。因此,层剪枝方式相比通道剪枝对硬件实际部署更加友好。
但是,深度学习神经网络的性能通常与网络的层数大小呈正比关系,裁剪卷积层通常会导致深度学习模型性能严重下降,因此需要在剪枝率和性能之间做出良好的权衡。传统的层剪枝方法通过卷积重要性评价算法选择出冗余卷积层,再删除冗余层重新进行训练得到最终的推理模型。一方面,模型直接删除冗余层,将导致模型性能急剧下降,模型再次训练时难以恢复到初始精度;另一方面,若为了保持模型性能而降低剪枝率,则模型的推理速度无法得到大幅度的提高。
综上所述,当前的检测方法在访问模型的内存时所需的成本相对较高,且对于速度的提升存在一定的限制,模型的性能与剪枝率之间的比例关系在一定程度上的相互影响,存在精度与速度方面的双重问题。
发明内容
本发明的目的之一在于提供一种模型压缩率高、不下降性能、可靠性好的层剪枝方法。
本发明的目的之二在于提供一种包括了所述层剪枝方法的厨余垃圾检测方法。
本发明的目的之三在于提供一种包括了所述层剪枝方法的遥感图像车辆检测方法。
本发明提供的这种层剪枝方法,包括如下步骤:
S1.确定目标网络模型,以及获取训练数据集;
S2.采用步骤S1获取的训练数据集,针对步骤S1获取的目标网络模型进行训练,获取基础网络模型;
S3.采用步骤S2获取的基础网络模型进行等价替换处理,获取解耦网络模型;
S4.采用步骤S1获取的训练数据集,针对步骤S3获取的解耦网络模型再次进行训练,获取训练后的解耦网络模型;
S5.采用步骤S4获取的训练后的解耦网路模型进行等价解耦处理,确定卷积层及其参数;
S6.采用步骤S5获取的卷积层及其参数进行合并处理,获得层剪枝后的网络模型,完成目标网络模型的层剪枝。
步骤S1所述的获取训练数据集,具体包括:采集训练图片,对获取的图片进行随机处理,所述随机处理包括多尺度数据增强、左右翻转、光照增强和使用补灰度值的方式统一图片大小;将图片目标的标签整理为统一的格式(n,x,y,w,h),其中,n为目标类别,(x,y)是目标的中心坐标,w是目标宽度,h是目标高度。
步骤S3所述的采用步骤S2获取的基础网络模型进行等价替换处理,具体包括:
(1)将基础网络模型中的卷积层等价替换为解耦卷积层:
将原卷积与单位卷积进行并联处理,单位卷积为1*1核的核卷积,初始权重为单位矩阵;
替换前的输入为xi,卷积层输出为yi,计算过程表示为:yi=wc*xi,其中wc为替换前卷积层的参数;等价解耦后,解耦卷积层的计算过程表征如下:
yi'=α·wc*xi+(1-α)·we*xi
其中,yi'为解耦后的卷积层输出,we为解耦后的单位卷积层的参数,学习参数α用于控制两个卷积的比重,且初始设置为α=1.0;
(2)将基础网络模型的激活层等价替换为解耦激活层:
替换前的输入为xi,激活层输出为yr,计算过程表述为:
式中act()为激活层的函数表达式;
等价解耦后,解耦激活层的计算过程表征如下:
其中,yr′为解耦后的激活层输出,学习参数β用于控制负轴斜率,且初始设置为β=1.0;
当解耦激活层后连接解耦卷积层时,收集相邻解耦层的参数用于构建组成(α,β)对,将所有(α,β)对用于组成集合M。
步骤S4所述的采用步骤S1获取的训练数据集,针对步骤S3获取的解耦网络模型再次进行训练,获取训练后的解耦网络模型,具体包括:
(1)针对步骤S3获取的解耦网络模型进行再次训练处理,训练时采用的所有流程与步骤S2训练流程一致;
(2)k为需要被压缩的层的个数,每N个训练批次完成后,变量k的值增加1,直至达到预设的层压缩比K%,其中,N为设定的训练次数;
(3)计算集合M中所有(α,β)对的和的值,根据值的大小进行排序;选择前k个最小计算值所对应的(α,β)对组合成集合M',对集合M'施加惩罚梯度,使其在数值上逐渐衰减到0;
(4)G为损失函数L对卷积的回传梯度,l为学习率,W'为更新后的参数,则模型参数W的更新方式为:
W'=W-lG
对于需要被衰减的M'中的α和β,梯度设置为固定值G=0.005,M'中的α和β将在固定梯度影响下逐渐变小,直至趋近于0;
对于M'以外的α和β,保留回传梯度G,施加额外的惩罚梯度衰减,以提高压缩效率,采用如下的计算方式进行:
W'=W-lG+λP
其中,λP为施加的惩罚梯度,λ为惩罚因子,P为符号函数,且满足:
步骤S5所述的采用步骤S4获取的训练后的解耦网路模型进行等价解耦处理,确定卷积层及其参数,具体包括:
(1)将模型中所有解耦卷积层等价转换为普通卷积形式:设解耦卷积层的输入为xi,解耦卷积层输出为yi,解耦卷积层的计算过程表征如下:
yi=α·wc'*xi+(1-α)·we'*xi
其中,wc'为解耦卷积的卷积层更新后的参数,we'为解耦卷积的1*1卷积层更新后的参数,当α=0时,yi=we'*xi,则该解耦卷积层等价转换为一个1*1卷积层;当α≠0时,将we'的参数合并到wc'中,yi=wc”*xi,其中wc”=α·wc'*xi+(1-α)·we',解耦卷积层等价转换为解耦前的卷积形式,且与解耦前的卷积层保持核大小相同;
(2)将模型中所有解耦激活层等价转换为普通激活层或直接移除:解耦激活层的计算过程为:
其中,输入为xi,解耦激活层输出为yr′;当β=0时,yr′=xi,则激活层不具备非线性,直接移除;当β≠0时,将激活层等价转换为普通激活层,则激活层具有非线性,使得相邻的卷积层之间不能进行合并处理;
设定修剪阈值δ,对(α,β)对进行约减,其中,δ取值是任意自然数;当(α,β)对的值均为0时,则直接合并α所在卷积层的参数到前一级卷积层的参数中,将被压缩的卷积层记为D'。
步骤S6所述的采用步骤S5获取的卷积层及其参数进行合并处理,获得层剪枝后的网络模型,具体包括:
依次合并被压缩的卷积层D'中卷积层的参数到其前级卷积层的参数中,前级卷积层与激活层的计算为:
y1=act1(w1*x)
后级卷积层与激活层的计算为:
y2=act2(w2*y1)
其中,x为输入特征,y1为前级卷积层的输出特征,y2为后级卷积层的输出特征,w1为前级卷积层参数,act1为前级卷积层的激活层,w2为后级卷积层参数,act2为后级卷积层的激活层,*为卷积运算符;由于act1中β=0,且后级卷积层的α=0,则计算过程为:
y2=act2(w2*w1*x)=act2(w1'*x)
w1'为合并后的新卷积权重,且w1'=w2*w1,此时w2所在的卷积层被压缩,其中,w2的参数为1*1卷积核形式参数。
本发明还提供了一种包含所述层剪枝方法的厨余垃圾检测方法,具体包括如下步骤:
A.采集厨余垃圾的图像,并构建原始数据集;
B.以Yolov5模型为基础模型,搭建并训练得到目标检测模型;
C.对步骤B得到的目标检测模型,采用所述的层剪枝方法处理,得到压缩后的厨余垃圾检测模型;
D.采用步骤C得到的厨余垃圾检测模型,进行实际的厨余垃圾检测。
本发明还提供了一种包含所述层剪枝方法的遥感图像车辆检测方法,具体包括如下步骤:
a.采集原始遥感车辆的图像,构建原始数据集;
b.以Yolov5模型为基础模型,搭建并训练得到目标检测模型;
c.对步骤b得到的目标检测模型,采用所述的层剪枝方法处理,得到压缩后的遥感图像车辆检测模型;
d.将步骤c得到的遥感图像车辆检测模型部署到无人机平台上,进行实际的遥感图像车辆检测。
本发明提供的这种层剪枝方法、厨余垃圾检测方法及遥感图像车辆检测方法,通过对目标网络模型进行训练、等价处理、再次训练、等价解耦处理、获取相关参数、确定层剪枝后的模型等处理,形成目标检测方法,同时也针对遥感图像车辆完成检测;本发明方法具有模型压缩率高、不下降性能、可靠性好的优点。
附图说明
图1为本发明的层剪枝方法的方法流程示意图。
图2为本发明的厨余垃圾检测方法的方法流程示意图。
图3为本发明的遥感图像车辆检测方法的方法流程示意图。
具体实施方式
如图1所示为本发明中层剪枝方法流程示意图:本发明提供的层剪枝方法,包括如下步骤:
S1.确定目标网络模型,以及训练数据集;
确定训练数据集,具体包括:采集训练图片,对获取的图片进行随机处理,包括多尺度数据增强、左右翻转、光照增强、使用补灰度值的方式统一图片大小;将图片目标的标签整理为统一的格式(n,x,y,w,h),其中,n为目标类别,(x,y)是目标的中心坐标,w是目标宽度,h是目标高度;
S2.采用步骤S1获取的训练数据集,针对步骤S1获取的目标网络模型进行训练,获取基础网络模型;
S3.采用步骤S2获取的基础网络模型进行等价替换处理,获取解耦网络模型,等价替换处理具体包括:
(1)将基础网络模型中的卷积层等价替换为解耦卷积层:
将原卷积与单位卷积进行并联处理,单位卷积为1*1核的核卷积,初始权重为单位矩阵;
替换前的输入为xi,卷积层输出为yi,计算过程表示为:yi=wc*xi,其中wc为替换前卷积层的参数;等价解耦后,解耦卷积层的计算过程表征如下:
yi'=α·wc*xi+(1-α)·we*xi
其中,yi'为解耦后的卷积层输出,we为解耦后的单位卷积层的参数,学习参数α用于控制两个卷积的比重,且初始设置为α=1.0;
(2)将基础网络模型的激活层等价替换为解耦激活层:
替换前的输入为xi,激活层输出为yr,计算过程可表述为:
式中act()为激活层的函数表达式;
等价解耦后,解耦激活层的计算过程表征如下:
其中,yr′为解耦后的激活层输出,学习参数β用于控制负轴斜率,且初始设置为β=1.0;
当解耦激活层后接的是解耦卷积层时,收集相邻解耦层的参数用于构建组成(α,β)对,将所有(α,β)对用于组成集合M;
S4.采用步骤S1获取的训练数据集,针对步骤S3获取的解耦网络模型再次进行训练,获取训练后的解耦网络模型,具体包括:
(1)针对步骤S3获取的解耦网络模型进行再次训练处理,训练时采用的所有流程与步骤S2所采用的训练保持一致;
(2)k为需要被压缩的层的个数,每N个训练批次完成后,变量k的值增加1,到达到预设的层压缩比K%,其中,N为设定的训练次数;
(3)计算集合M中所有(α,β)对的和的值,根据值的大小进行排序,将值的大小作为评估卷积层的重要指标;选择前k个最小计算值对应的(α,β)对组合成集合M',对集合M'施加惩罚梯度,使其在数值上被逐渐衰减到0;
(4)G为损失函数L对卷积的回传梯度,l为学习率,W'为更新后的参数,则模型参数W的更新方式为:
W'=W-lG
对于需要被衰减的M'中的α和β,其梯度设置为固定值G=0.005,M'中的α和β将在固定梯度影响下逐渐变小,直至趋近于0;
对于M'以外的α和β,保留回传梯度G,施加额外的惩罚梯度衰减,以提高压缩效率,采用如下的计算方式进行:
W'=W-lG+λP
其中,λP为施加的惩罚梯度,λ为惩罚因子,P为符号函数,且满足:
S5.采用步骤S4获取的训练后的解耦网路模型进行等价解耦处理,确定卷积层及其参数,具体包括:
(1)将模型中所有解耦卷积层等价转换为普通卷积形式,设解耦卷积层的输入为xi,解耦卷积层输出为yi,解耦卷积层的计算过程表征如下:
yi=α·wc'*xi+(1-α)·we'*xi
其中,wc'为解耦卷积的卷积层更新后的参数,we'为解耦卷积的1*1卷积层更新后的参数,当α=0时,yi=we'*xi,则该解耦卷积层等价转换为一个1*1卷积层;当α≠0时,将we'的参数合并到wc'中,yi=wc”*xi,其中wc”=α·wc'*xi+(1-α)·we',解耦卷积层等价转换为解耦前的卷积形式,且与解耦前的卷积层保持核大小相同;
(2)将模型中所有解耦激活层等价转换为普通激活层或直接移除;解耦激活层的计算过程为:
其中,输入为xi,解耦激活层输出为yr′,当β=0时,yr′=xi,则激活层不具备非线性,直接移除;当β≠0时,将激活层等价转换为普通激活层,则激活层具有非线性,使得相邻的卷积层之间不能进行合并处理;
设定修剪阈值δ,对(α,β)对进行约减,其中,δ取值是任意自然数;当(α,β)对的值均为0时,则直接合并α所在卷积层的参数到前一级卷积层的参数中,将被压缩的卷积层记为D';
S6.采用步骤S5获取的卷积层及其参数进行合并处理,获得层剪枝后的网络模型,具体包括:
依次合并被压缩的卷积层D'中卷积层的参数到其前级卷积层的参数中,前级卷积层与激活层的计算为:
y1=act1(w1*x)
后级卷积层与激活层的计算为:
y2=act2(w2*y1)
其中,x为输入特征,y1为前级卷积层的输出特征,y2为后级卷积层的输出特征,w1为前级卷积层参数,act1为前级卷积层的激活层,w2为后级卷积层参数,act2为后级卷积层的激活层,*为卷积运算符;由于act1中β=0,且后级卷积层的α=0,计算过程为:
y2=act2(w2*w1*x)=act2(w1'*x)
w1'为合并后的新卷积权重,且w1'=w2*w1,此时w2所在的卷积层被压缩,其中,w2的参数为1*1卷积核形式参数。
如图2所示为本发明的厨余垃圾检测的方法流程示意图:本发明提供得这种包含所述层剪枝方法的厨余垃圾检测,具体包括如下步骤:
A.采集厨余垃圾的图像,并构建原始数据集;
B.以Yolov5模型为基础模型,搭建并训练得到目标检测模型;
C.对步骤B得到的目标检测模型,采用所述的层剪枝方法处理,得到压缩后的厨余垃圾检测模型;
D.采用步骤C得到的厨余垃圾检测模型,进行实际的厨余垃圾检测。
如图3所示为本发明的遥感图像车辆检测方法的方法流程示意图:本发明提供的这种包含所述层剪枝方法的遥感图像车辆检测方法,具体包括如下步骤:
a.采集原始遥感车辆的图像,构建原始数据集;
b.以Yolov5模型为基础模型,搭建并训练得到目标检测模型;
c.对步骤b得到的目标检测模型,采用所述的层剪枝方法处理,得到压缩后的遥感图像车辆检测模型;
d.将步骤c得到的遥感图像车辆检测模型部署到无人机平台上,进行实际的遥感图像车辆检测。
Claims (8)
1.一种层剪枝方法,包括如下步骤:
S1.确定目标网络模型,以及获取训练数据集;
S2.采用步骤S1获取的训练数据集,针对步骤S1获取的目标网络模型进行训练,获取基础网络模型;
S3.采用步骤S2获取的基础网络模型进行等价替换处理,获取解耦网络模型;
S4.采用步骤S1获取的训练数据集,针对步骤S3获取的解耦网络模型再次进行训练,获取训练后的解耦网络模型;
S5.采用步骤S4获取的训练后的解耦网路模型进行等价解耦处理,确定卷积层及其参数;
S6.采用步骤S5获取的卷积层及其参数进行合并处理,获得层剪枝后的网络模型,完成目标网络模型的层剪枝。
2.根据权利要求1所述的层剪枝方法,其特征在于步骤S1所述的获取训练数据集,具体包括:采集训练图片,对获取的图片进行随机处理,所述随机处理包括多尺度数据增强、左右翻转、光照增强和使用补灰度值的方式统一图片大小;将图片目标的标签整理为统一的格式(n,x,y,w,h),其中,n为目标类别,(x,y)是目标的中心坐标,w是目标宽度,h是目标高度。
3.根据权利要求2所述的层剪枝方法,其特征在于步骤S3所述的采用步骤S2获取的基础网络模型进行等价替换处理,具体包括:
(1)将基础网络模型中的卷积层等价替换为解耦卷积层:
将原卷积与单位卷积进行并联处理,单位卷积为1*1核的核卷积,初始权重为单位矩阵;
替换前的输入为xi,卷积层输出为yi,计算过程表示为:yi=wc*xi,其中wc为替换前卷积层的参数;等价解耦后,解耦卷积层的计算过程表征如下:
yi'=α·wc*xi+(1-α)·we*xi
其中,yi'为解耦后的卷积层输出,we为解耦后的单位卷积层的参数,学习参数α用于控制两个卷积的比重,且初始设置为α=1.0;
(2)将基础网络模型的激活层等价替换为解耦激活层:
替换前的输入为xi,激活层输出为yr,计算过程表述为:
式中act()为激活层的函数表达式;
等价解耦后,解耦激活层的计算过程表征如下:
其中,yr′为解耦后的激活层输出,学习参数β用于控制负轴斜率,且初始设置为β=1.0;
当解耦激活层后连接解耦卷积层时,收集相邻解耦层的参数用于构建组成(α,β)对,将所有(α,β)对用于组成集合M。
4.根据权利要求3所述的层剪枝方法,其特征在于步骤S4所述的采用步骤S1获取的训练数据集,针对步骤S3获取的解耦网络模型再次进行训练,获取训练后的解耦网络模型,具体包括:
(1)针对步骤S3获取的解耦网络模型进行再次训练处理,训练时采用的所有流程与步骤S2训练流程一致;
(2)k为需要被压缩的层的个数,每N个训练批次完成后,变量k的值增加1,直至达到预设的层压缩比K%,其中,N为设定的训练次数;
(3)计算集合M中所有(α,β)对的和的值,根据值的大小进行排序;选择前k个最小计算值所对应的(α,β)对组合成集合M',对集合M'施加惩罚梯度,使其在数值上逐渐衰减到0;
(4)G为损失函数L对卷积的回传梯度,l为学习率,W'为更新后的参数,则模型参数W的更新方式为:
W'=W-lG
对于需要被衰减的M'中的α和β,梯度设置为固定值G=0.005,M'中的α和β将在固定梯度影响下逐渐变小,直至趋近于0;
对于M'以外的α和β,保留回传梯度G,施加额外的惩罚梯度衰减,以提高压缩效率,采用如下的计算方式进行:
W'=W-lG+λP
其中,λP为施加的惩罚梯度,λ为惩罚因子,P为符号函数,且满足:
5.根据权利要求4所述的层剪枝方法,其特征在于步骤S5所述的采用步骤S4获取的训练后的解耦网路模型进行等价解耦处理,确定卷积层及其参数,具体包括:
(1)将模型中所有解耦卷积层等价转换为普通卷积形式:设解耦卷积层的输入为xi,解耦卷积层输出为yi,解耦卷积层的计算过程表征如下:
yi=α·wc'*xi+(1-α)·we'*xi
其中,wc'为解耦卷积的卷积层更新后的参数,we'为解耦卷积的1*1卷积层更新后的参数,当α=0时,yi=we'*xi,则该解耦卷积层等价转换为一个1*1卷积层;当α≠0时,将we'的参数合并到wc'中,yi=wc”*xi,其中wc”=α·wc'*xi+(1-α)·we',解耦卷积层等价转换为解耦前的卷积形式,且与解耦前的卷积层保持核大小相同;
(2)将模型中所有解耦激活层等价转换为普通激活层或直接移除:解耦激活层的计算过程为:
其中,输入为xi,解耦激活层输出为y′r;当β=0时,y′r=xi,则激活层不具备非线性,直接移除;当β≠0时,将激活层等价转换为普通激活层,则激活层具有非线性,使得相邻的卷积层之间不能进行合并处理;
设定修剪阈值δ,对(α,β)对进行约减,其中,δ是0到1之间的小数;当(α,β)对的值均为0时,则直接合并α所在卷积层的参数到前一级卷积层的参数中,将被压缩的卷积层记为D'。
6.根据权利要求5所述的层剪枝方法,其特征在于步骤S6所述的采用步骤S5获取的卷积层及其参数进行合并处理,获得层剪枝后的网络模型,具体包括:
依次合并被压缩的卷积层D'中卷积层的参数到其前级卷积层的参数中,前级卷积层与激活层的计算为:
y1=act1(w1*x)
后级卷积层与激活层的计算为:
y2=act2(w2*y1)
其中,x为输入特征,y1为前级卷积层的输出特征,y2为后级卷积层的输出特征,w1为前级卷积层参数,act1为前级卷积层的激活层,w2为后级卷积层参数,act2为后级卷积层的激活层,*为卷积运算符;由于act1中β=0,且后级卷积层的α=0,则计算过程为:
y2=act2(w2*w1*x)=act2(w1'*x)
w1'为合并后的新卷积权重,且w1'=w2*w1,此时w2所在的卷积层被压缩,其中,w2的参数为1*1卷积核形式参数。
7.一种包括了权利要求1~6之一所述的层剪枝方法的厨余垃圾检测方法,具体包括如下步骤:
A.采集厨余垃圾的图像,并构建原始数据集;
B.以Yolov5模型为基础模型,搭建并训练得到目标检测模型;
C.对步骤B得到的目标检测模型,采用权利要求1~6之一所述的层剪枝方法处理,得到压缩后的厨余垃圾检测模型;
D.采用步骤C得到的厨余垃圾检测模型,进行实际的厨余垃圾检测。
8.一种包括了权利要求1~6之一所述的层剪枝方法的遥感图像车辆检测方法,具体包括如下步骤:
a.采集原始遥感车辆的图像,构建原始数据集;
b.以Yolov5模型为基础模型,搭建并训练得到目标检测模型;
c.对步骤b得到的目标检测模型,采用权利要求1~6之一所述的层剪枝方法处理,得到压缩后的遥感图像车辆检测模型;
d.将步骤c得到的遥感图像车辆检测模型部署到无人机平台上,进行实际的遥感图像车辆检测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211476624.1A CN115730654B (zh) | 2022-11-23 | 2022-11-23 | 层剪枝方法、厨余垃圾检测方法及遥感图像车辆检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211476624.1A CN115730654B (zh) | 2022-11-23 | 2022-11-23 | 层剪枝方法、厨余垃圾检测方法及遥感图像车辆检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115730654A true CN115730654A (zh) | 2023-03-03 |
CN115730654B CN115730654B (zh) | 2024-05-14 |
Family
ID=85297687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211476624.1A Active CN115730654B (zh) | 2022-11-23 | 2022-11-23 | 层剪枝方法、厨余垃圾检测方法及遥感图像车辆检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115730654B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112488070A (zh) * | 2020-12-21 | 2021-03-12 | 上海交通大学 | 一种面向遥感图像目标检测的神经网络压缩方法 |
WO2022027937A1 (zh) * | 2020-08-06 | 2022-02-10 | 苏州浪潮智能科技有限公司 | 一种神经网络压缩方法、装置、设备及存储介质 |
CN114332070A (zh) * | 2022-01-05 | 2022-04-12 | 北京理工大学 | 一种基于智能学习网络模型压缩的陨坑检测方法 |
CN114594461A (zh) * | 2022-03-14 | 2022-06-07 | 杭州电子科技大学 | 基于注意力感知与缩放因子剪枝的声呐目标检测方法 |
CN114913441A (zh) * | 2022-06-28 | 2022-08-16 | 湖南大学 | 通道剪枝方法、目标检测方法及遥感图像车辆检测方法 |
-
2022
- 2022-11-23 CN CN202211476624.1A patent/CN115730654B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022027937A1 (zh) * | 2020-08-06 | 2022-02-10 | 苏州浪潮智能科技有限公司 | 一种神经网络压缩方法、装置、设备及存储介质 |
CN112488070A (zh) * | 2020-12-21 | 2021-03-12 | 上海交通大学 | 一种面向遥感图像目标检测的神经网络压缩方法 |
CN114332070A (zh) * | 2022-01-05 | 2022-04-12 | 北京理工大学 | 一种基于智能学习网络模型压缩的陨坑检测方法 |
CN114594461A (zh) * | 2022-03-14 | 2022-06-07 | 杭州电子科技大学 | 基于注意力感知与缩放因子剪枝的声呐目标检测方法 |
CN114913441A (zh) * | 2022-06-28 | 2022-08-16 | 湖南大学 | 通道剪枝方法、目标检测方法及遥感图像车辆检测方法 |
Non-Patent Citations (3)
Title |
---|
XIAOHAN DING等: "ResRep: Lossless CNN Pruning via Decoupling Remembering and Forgetting", 《ARXIV》, 14 August 2021 (2021-08-14) * |
孙彦;丁学文;雷雨婷;陈静;孔祥鑫;: "基于SSD_MobileNet_v1网络的猫狗图像识别", 天津职业技术师范大学学报, no. 01, 28 March 2020 (2020-03-28) * |
邵伟平;王兴;曹昭睿;白帆;: "基于MobileNet与YOLOv3的轻量化卷积神经网络设计", 计算机应用, no. 1, 10 July 2020 (2020-07-10) * |
Also Published As
Publication number | Publication date |
---|---|
CN115730654B (zh) | 2024-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6980958B1 (ja) | 深層学習に基づく農村地域分けゴミ識別方法 | |
CN108765506B (zh) | 基于逐层网络二值化的压缩方法 | |
CN110766063B (zh) | 基于压缩激励和紧密连接卷积神经网络的图像分类方法 | |
CN110929577A (zh) | 一种基于YOLOv3的轻量级框架改进的目标识别方法 | |
CN113160062B (zh) | 一种红外图像目标检测方法、装置、设备及存储介质 | |
CN113850242B (zh) | 一种基于深度学习算法的仓储异常目标检测方法及系统 | |
CN112541532B (zh) | 基于密集连接结构的目标检测方法 | |
CN113420651B (zh) | 深度卷积神经网络的轻量化方法、系统及目标检测方法 | |
CN112668630B (zh) | 一种基于模型剪枝的轻量化图像分类方法、系统及设备 | |
CN110008853B (zh) | 行人检测网络及模型训练方法、检测方法、介质、设备 | |
CN113971764B (zh) | 一种基于改进YOLOv3的遥感图像小目标检测方法 | |
CN109543744B (zh) | 一种基于龙芯派的多类别深度学习图像识别方法及其应用 | |
CN112101364A (zh) | 基于参数重要性增量学习的语义分割方法 | |
CN111242066A (zh) | 大尺寸图像目标检测方法、装置及计算机可读存储介质 | |
CN114663662B (zh) | 超参数搜索方法、装置、计算机设备和存储介质 | |
CN115272894A (zh) | 面向无人机图像目标检测方法、装置、电子设备及存储介质 | |
CN114492634B (zh) | 一种细粒度装备图片分类识别方法及系统 | |
CN116310688A (zh) | 基于级联融合的目标检测模型及其构建方法、装置及应用 | |
CN117197896A (zh) | 一种基于深度学习的医疗废弃物暂存站异常行为实时检测方法 | |
Ayachi et al. | An edge implementation of a traffic sign detection system for Advanced driver Assistance Systems | |
CN110728186A (zh) | 一种基于多网融合的火灾检测方法 | |
CN117173595A (zh) | 基于改进YOLOv7的无人机航拍图像目标检测方法 | |
CN115730654A (zh) | 层剪枝方法、厨余垃圾检测方法及遥感图像车辆检测方法 | |
CN116129158A (zh) | 一种输电线路铁塔小部件图像识别方法及装置 | |
CN111915621B (zh) | 一种融合深度神经网络与cv模型的污损图像分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |