CN112115837A - 一种基于YoloV3和双阈值模型压缩的目标检测方法 - Google Patents
一种基于YoloV3和双阈值模型压缩的目标检测方法 Download PDFInfo
- Publication number
- CN112115837A CN112115837A CN202010954287.7A CN202010954287A CN112115837A CN 112115837 A CN112115837 A CN 112115837A CN 202010954287 A CN202010954287 A CN 202010954287A CN 112115837 A CN112115837 A CN 112115837A
- Authority
- CN
- China
- Prior art keywords
- model
- yolov3
- training
- layer
- threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Astronomy & Astrophysics (AREA)
- Remote Sensing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了一种基于YoloV3和双阈值模型压缩的目标检测方法,属于模型压缩技术领域。其包括:构建目标检测数据集,并划分训练集和测试集;使用YoloV3模型在训练集上面进行训练,将训练好的模型保存为YoloV3_N;使用YoloV3_N对验证集进行测试,将验证结果标记为Result_N;使用YoloV3_N模型在训练集上进行稀疏训练,将训练好的模型保存为YoloV3_S;使用双阈值模型压缩方法对YoloV3_S进行模型压缩,将压缩好的模型保存为YoloV3_C;使用YoloV3_C模型对验证集进行测试,将测试结果标记为Result_C;使用YoloV3_C模型在目标检测数据集上进行微调,将最终的模型保存为YoloV3_F;使用YoloV3_F模型对验证集进行测试,将测试结果标记为Result_F。本发明可以在基本不损失正确率的情况下进行模型压缩,解决机载目标检测部署问题。
Description
技术领域
本发明属于模型压缩技术领域,主要涉及一种轻量化的目标检测方法,具体来说是指一种基于YoloV3和双阈值模型压缩的轻量化目标检测方法,可用于机载图像目标识别方案部署。
背景技术
当前无人机应用的趋势是利用原始勘察数据,实现机载信息的快速处理,进而对各种突发情况进行自主决策。因此,无人机在安全生产保障支援、突发自然灾害应急支援、突发治安事件智能救援等领域得到了广泛应用。然而,实时高效地机载信息信息处理成为了无人机实际应用的技术瓶颈。
目标检测是无人机机载信息处理的重要研究方向,同时也是计算机视觉的重要研究方向。近些年来,随着深度学习技术的火热发展,目标检测算法也从基于手工特征的传统算法转向基于深度学习的目标检测算法。目前,已有一系列相关算法被提出,如R-CNN、OverFeat、Faster R-CNN、SSD、Yolo系列等。在网络结构上,基于深度学习的目标检测算法已经从双阶段进化到单阶段,从单尺度网络进化到特征空间金字塔。这些算法都在目标检测领域取得了非常好的检测效果。其中,当前应用最为广泛的就是YoloV3模型。
然而,当下的基于深度学习的目标检测方法虽然有很强大的表示能力,也带来了很大的计算资源消耗。当下的目标检测模型在机载信息应用中收到了诸多限制:
1)模型尺寸,当下的目标检测模型优良的表示能力来自于数目众多的参数,而这些参数与网络架构信息一起,同样需要被保存在硬盘里,而且在进行推理时也需要被加载到内存中;
2)运行时间的内存消耗,在推理过程中,目标检测模型中的激活函数的值消耗了比保存模型参数更多的内存,这对于高性能GPU不成问题,但是对于移动端设备影响很大;
3)计算操作的数目,在高分辨图像的卷及操作是很消耗计算资源的,甚至一个较大的目标检测框架在移动端设备处理一张图片需要几分钟,严重限制了真实应用。
因此,实时高效地机载信息处理成为了无人机实际应用的技术瓶颈。
发明内容
本发明的目的在于针对上述问题,提出一种基于YoloV3和双阈值模型压缩的轻量化目标检测方法,解决目标检测方法在机载嵌入式端的部署问题。
为实现上述目的,本发明采用的技术方案为:
一种基于YoloV3和双阈值模型压缩的目标检测方法,包括如下步骤:
步骤1:构建目标检测数据集,并随机将其中的50%数据设置为训练集,剩余的50%数据设置为验证集;
步骤2:使用YoloV3模型在训练集上面进行训练,直至模型收敛,并将训练好的模型保存为YoloV3_N;
步骤3:使用YoloV3_N对验证集进行测试,并将验证结果标记为Result_N;
步骤4:使用YoloV3_N模型在训练集上面进行稀疏训练,直至模型收敛,并将训练好的模型保存为YoloV3_S;
步骤5:使用双阈值模型压缩方法对YoloV3_S进行模型压缩,并将压缩好的模型保存为YoloV3_C;
步骤6:使用YoloV3_C模型对验证集进行测试,并将测试结果标记为Result_C;
步骤7:使用YoloV3_C模型在目标检测数据集上面进行微调,直至模型收敛,并将最终的模型保存为YoloV3_F;
步骤8:使用YoloV3_F模型对验证集进行测试,并将目标检测的测试结果标记为Result_F。
进一步的,步骤4所述的稀疏训练按照如下方式进行:
4a)为每一个通道都引入一个缩放因子,然后和通道的输出相乘,接着联合训练网络权重和这些缩放因子,定义目标函数为:
其中,(x,y)代表训练数据和标签,W是网络的可训练参数,γ代表BN层的缩放因子,l(f(x,W),y)是目标检测的训练损失函数,用于确保训练好的目标检测模型具有良好的泛化性,f(x,W)代表目标检测网络的输出结果,λ是平衡因子,g(.)是缩放因子的乘法项,g(γ)=|γ|,|·|代表l1范数,从而确保γ参数的稀疏性;
4b)设zin代表BN层的输入,zout代表BN层的输出,BN归一化激活层通过如下方式表示:
其中,uβ和σβ代表当前批中所有输入样本激活值的平均值与标准差值,ε代表一个极小正常量,γ和β是可训练的仿射变换参数,提供了将标准化激活线性转换回任何尺度的可能性,γ代表网络的缩放因子,β代表网络的位移因子;
4c)基于4a)中的目标函数,在训练集上面进行训练,直到模型收敛。
进一步的,步骤5所述的使用双阈值模型压缩方法对YoloV3_S进行模型压缩的具体方式为:
5a)经过卷积层之后的特征图维度为h×w×c,其中h和w分别代表特征图的长度,c代表特征图的通道数,将其送入BN层,得到归一化后的特征图,特征图的每一个通道都对应一个γ参数;
5b)设置两个γ阈值γ1和γ2,分别代表全局阈值以及每一层的阈值;如果γ1≥γ2,则本层的阈值设置为γ2,如果γ1<γ2,则本层的阈值设置为γ1;
5c)每一层单独进行通道裁剪操作,小于本层γ阈值的通道被裁剪。
本发明相对于现有技术所取得的有益效果在于:
1、本发明方法简单易行,便于实施。
2、本发明方法可以在基本不损失正确率的情况下进行模型压缩,压缩效果良好。
3、本发明能够有效地对模型进行压缩,能够解决机载目标检测部署问题。
附图说明
图1是本发明实施例中目标检测方法的流程图。
具体实施方式
以下结合附图对本发明的实现步骤和实验效果做进一步的详细描述。
一种基于YoloV3和双阈值模型压缩的轻量化目标检测方法,包括如下步骤:
步骤1,构建目标检测数据集,并随机将其中的50%设置为训练集,剩余的50%设置为验证集;
步骤2,使用YoloV3模型在训练集上面进行训练,直至模型收敛,并将训练好的模型保存为YoloV3_N;
步骤3,使用YoloV3_N对验证集进行测试,并将验证结果标记为Result_N;
步骤4,使用YoloV3_N模型在训练集上面进行稀疏训练,直至模型收敛,并将训练好的模型保存为YoloV3_S,具体步骤如下:
4a)为每一个通道都引入一个缩放因子,然后和通道的输出相乘,接着联合训练网络权重和这些缩放因子,定义目标函数为:
其中,(x,y)代表训练数据和标签,W是网络的可训练参数,γ代表BN层的缩放因子,l(f(x,W),y)是目标检测的训练损失函数,用于确保训练好的目标检测模型具有良好的泛化性,f(x,W)代表目标检测网络的输出结果,λ是平衡因子,g(.)是缩放因子的乘法项,g(γ)=|γ|,|·|代表l1范数,从而确保γ参数的稀疏性;
4b)设zin代表BN层的输入,zout代表BN层的输出,BN归一化激活层通过如下方式表示:
其中,uβ和σβ代表当前批中所有输入样本激活值的平均值与标准差值,ε代表一个极小正常量,γ和β是可训练的仿射变换参数,提供了将标准化激活线性转换回任何尺度的可能性,γ代表网络的缩放因子,β代表网络的位移因子;
4c)基于4a)中的目标函数,在训练集上面进行训练,直到模型收敛;
步骤5,使用双阈值模型压缩方法对YoloV3_S进行模型压缩,并将压缩好的模型保存为YoloV3_C;具体方式为:
5a)经过卷积层之后的特征图维度为h×w×c,其中h和w分别代表特征图的长度,c代表特征图的通道数,将其送入BN层,得到归一化后的特征图,特征图的每一个通道都对应一个γ参数;
5b)设置两个γ阈值γ1和γ2,分别代表全局阈值以及每一层的阈值;如果γ1≥γ2,则本层的阈值设置为γ2,如果γ1<γ2,则本层的阈值设置为γ1;
5c)每一层单独进行通道裁剪操作,小于本层γ阈值的通道被裁剪;
步骤6,使用YoloV3_C模型对验证集进行测试,并将测试结果标记为Result_C;
步骤7,使用YoloV3_C模型在目标检测数据集上面进行微调,直至模型收敛,并将最终的模型保存为YoloV3_F;
步骤8,使用YoloV3_F模型对验证集进行测试,并将测试结果标记为Result_F。
上述方法的效果可以通过以下仿真实验进一步说明:
1、实验条件与方法
硬件平台为:Intel(R)Core(TM)i7-9750H CPU@2.60GHZ、16.00GB RAM;
软件平台为:PyTorch 1.2;
实验方法:YoloV3以及本发明方法。
2、仿真内容与结果
将构建的目标检测数据集的50%作为训练数据集,剩余的50%作为验证数据集,用YoloV3作为目标检测方法,用本发明作为模型压缩方法,γ1和γ2分别设置为0.7和0.05,进行模型压缩。YoloV3的原模型架构每一层的通道数以及使用本方法进行模型压缩后的架构每一层的通道数如下所示:
其中,layer index表示层号,total channel表示压缩前每一层的总通道数,remaining channel表示压缩后每一层的通道数。
压缩前后的性能统计如表1所示:
表1 YoloV3模型压缩前后性能统计表
指标 | YoloV3模型压缩前 | YoloV3模型压缩后 |
mAP | 0.9742 | 0.9828 |
参数量(M) | 61.95 | 14.55 |
总通道数 | 13376 | 4104 |
单次推理时间(S) | 0.0242 | 0.0146 |
可以看到YoloV3模型压缩后的mAP比压缩前略有提高,在模型压缩中常常出现此类情况,是因为模型保留主要架构后更有利于推理,其泛化性更高,参数量从61.95M下降到14.55M,参数压缩率76.5%,模型架构总通道数从13376下降到4104,通道压缩率69.3%,单次推理时间从0.0242S下降到0.0146S,实现加速39.7%。
Claims (3)
1.一种基于YoloV3和双阈值模型压缩的目标检测方法,其特征在于,包括如下步骤:
步骤1:构建目标检测数据集,并随机将其中的50%数据设置为训练集,剩余的50%数据设置为验证集;
步骤2:使用YoloV3模型在训练集上面进行训练,直至模型收敛,并将训练好的模型保存为YoloV3_N;
步骤3:使用YoloV3_N对验证集进行测试,并将验证结果标记为Result_N;
步骤4:使用YoloV3_N模型在训练集上面进行稀疏训练,直至模型收敛,并将训练好的模型保存为YoloV3_S;
步骤5:使用双阈值模型压缩方法对YoloV3_S进行模型压缩,并将压缩好的模型保存为YoloV3_C;
步骤6:使用YoloV3_C模型对验证集进行测试,并将测试结果标记为Result_C;
步骤7:使用YoloV3_C模型在目标检测数据集上面进行微调,直至模型收敛,并将最终的模型保存为YoloV3_F;
步骤8:使用YoloV3_F模型对验证集进行测试,并将目标检测的测试结果标记为Result_F。
2.根据权利要求1所述的一种基于YoloV3和双阈值模型压缩的目标检测方法,其特征在于,步骤4所述的稀疏训练按照如下方式进行:
4a)为每一个通道都引入一个缩放因子,然后和通道的输出相乘,接着联合训练网络权重和这些缩放因子,定义目标函数为:
其中,(x,y)代表训练数据和标签,W是网络的可训练参数,γ代表BN层的缩放因子,l(f(x,W),y)是目标检测的训练损失函数,用于确保训练好的目标检测模型具有良好的泛化性,f(x,W)代表目标检测网络的输出结果,λ是平衡因子,g(.)是缩放因子的乘法项,g(γ)=|γ|,|·|代表l1范数,从而确保γ参数的稀疏性;
4b)设zin代表BN层的输入,zout代表BN层的输出,BN归一化激活层通过如下方式表示:
其中,uβ和σβ代表当前批中所有输入样本激活值的平均值与标准差值,ε代表一个极小正常量,γ和β是可训练的仿射变换参数,提供了将标准化激活线性转换回任何尺度的可能性,γ代表网络的缩放因子,β代表网络的位移因子;
4c)基于4a)中的目标函数,在训练集上面进行训练,直到模型收敛。
3.根据权利要求2所述的一种基于YoloV3和双阈值模型压缩的目标检测方法,其特征在于,步骤5所述的使用双阈值模型压缩方法对YoloV3_S进行模型压缩的具体方式为:
5a)经过卷积层之后的特征图维度为h×w×c,其中h和w分别代表特征图的长度,c代表特征图的通道数,将其送入BN层,得到归一化后的特征图,特征图的每一个通道都对应一个γ参数;
5b)设置两个γ阈值γ1和γ2,分别代表全局阈值以及每一层的阈值;如果γ1≥γ2,则本层的阈值设置为γ2,如果γ1<γ2,则本层的阈值设置为γ1;
5c)每一层单独进行通道裁剪操作,小于本层γ阈值的通道被裁剪。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010954287.7A CN112115837A (zh) | 2020-09-11 | 2020-09-11 | 一种基于YoloV3和双阈值模型压缩的目标检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010954287.7A CN112115837A (zh) | 2020-09-11 | 2020-09-11 | 一种基于YoloV3和双阈值模型压缩的目标检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112115837A true CN112115837A (zh) | 2020-12-22 |
Family
ID=73802522
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010954287.7A Pending CN112115837A (zh) | 2020-09-11 | 2020-09-11 | 一种基于YoloV3和双阈值模型压缩的目标检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112115837A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116347080A (zh) * | 2023-03-27 | 2023-06-27 | 任红梅 | 基于下采样处理的智能算法应用系统及方法 |
CN117173794A (zh) * | 2023-11-03 | 2023-12-05 | 广州英码信息科技有限公司 | 一种适合边缘设备部署的行人重识别方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110895714A (zh) * | 2019-12-11 | 2020-03-20 | 天津科技大学 | 一种YOLOv3的网络压缩方法 |
CN111062382A (zh) * | 2019-10-30 | 2020-04-24 | 北京交通大学 | 用于目标检测网络的通道剪枝方法 |
CN111325342A (zh) * | 2020-02-19 | 2020-06-23 | 深圳中兴网信科技有限公司 | 模型的压缩方法、装置、目标检测设备和存储介质 |
CN111444760A (zh) * | 2020-02-19 | 2020-07-24 | 天津大学 | 一种基于剪枝与知识蒸馏的交通标志检测与识别方法 |
-
2020
- 2020-09-11 CN CN202010954287.7A patent/CN112115837A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111062382A (zh) * | 2019-10-30 | 2020-04-24 | 北京交通大学 | 用于目标检测网络的通道剪枝方法 |
CN110895714A (zh) * | 2019-12-11 | 2020-03-20 | 天津科技大学 | 一种YOLOv3的网络压缩方法 |
CN111325342A (zh) * | 2020-02-19 | 2020-06-23 | 深圳中兴网信科技有限公司 | 模型的压缩方法、装置、目标检测设备和存储介质 |
CN111444760A (zh) * | 2020-02-19 | 2020-07-24 | 天津大学 | 一种基于剪枝与知识蒸馏的交通标志检测与识别方法 |
Non-Patent Citations (1)
Title |
---|
韩家明: "无人机视觉导航着陆标识检测与分割方法", 《应用科技》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116347080A (zh) * | 2023-03-27 | 2023-06-27 | 任红梅 | 基于下采样处理的智能算法应用系统及方法 |
CN116347080B (zh) * | 2023-03-27 | 2023-10-31 | 苏州利博特信息科技有限公司 | 基于下采样处理的智能算法应用系统及方法 |
CN117173794A (zh) * | 2023-11-03 | 2023-12-05 | 广州英码信息科技有限公司 | 一种适合边缘设备部署的行人重识别方法 |
CN117173794B (zh) * | 2023-11-03 | 2024-03-08 | 广州英码信息科技有限公司 | 一种适合边缘设备部署的行人重识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112101190B (zh) | 一种遥感图像分类方法、存储介质及计算设备 | |
CN114037844B (zh) | 基于滤波器特征图的全局秩感知神经网络模型压缩方法 | |
CN111488985B (zh) | 深度神经网络模型压缩训练方法、装置、设备、介质 | |
CN110909667B (zh) | 面向多角度sar目标识别网络的轻量化设计方法 | |
CN109002889B (zh) | 自适应迭代式卷积神经网络模型压缩方法 | |
CN109871749B (zh) | 一种基于深度哈希的行人重识别方法和装置、计算机系统 | |
CN112115837A (zh) | 一种基于YoloV3和双阈值模型压缩的目标检测方法 | |
Liang | Smart and fast data processing for deep learning in Internet of Things: Less is more | |
CN104809475A (zh) | 基于增量线性判别分析的多类标场景分类方法 | |
CN109344893A (zh) | 一种基于移动终端的图像分类方法及系统 | |
CN116362325A (zh) | 一种基于模型压缩的电力图像识别模型轻量化应用方法 | |
CN114972753B (zh) | 基于上下文信息聚合和辅助学习的轻量级语义分割方法及系统 | |
Chen et al. | HRCP: High-ratio channel pruning for real-time object detection on resource-limited platform | |
CN113850373B (zh) | 一种基于类别的滤波器剪枝方法 | |
CN114065831A (zh) | 基于多尺度随机深度残差网络的高光谱图像分类方法 | |
US20230394312A1 (en) | Pruning activations and weights of neural networks with programmable thresholds | |
CN110633787A (zh) | 基于多比特神经网络非线性量化的深度神经网络压缩方法 | |
CN110288002B (zh) | 一种基于稀疏正交神经网络的图像分类方法 | |
CN112613604A (zh) | 神经网络的量化方法及装置 | |
CN111860557B (zh) | 图像处理方法及装置、电子设备及计算机存储介质 | |
Pei et al. | Neural network compression and acceleration by federated pruning | |
CN114677545A (zh) | 一种基于相似性剪枝和高效模块的轻量化图像分类方法 | |
CN114781615A (zh) | 一种基于压缩神经网络的二阶段量化实现方法及装置 | |
CN111368976B (zh) | 基于神经网络特征识别的数据压缩方法 | |
Linglin et al. | Research on pruning algorithm of target detection model with YOLOv4 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |