CN112612602A

CN112612602A - 用于目标检测网络模型的自动压缩处理方法

Info

Publication number: CN112612602A
Application number: CN202011463328.9A
Authority: CN
Inventors: 安磊; 徐孝忠; 潘杰锋; 李琪; 戚浩金; 李建刚; 王勇; 严钰君; 叶明达; 胡一嗔; 张寒之; 徐科兵; 赵萌; 娄一艇; 陈晓杰; 黄智�; 叶夏明; 裘建开; 孙夷泽; 琚小明
Original assignee: Ningbo Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Current assignee: Ningbo Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority date: 2020-12-11
Filing date: 2020-12-11
Publication date: 2021-04-06
Anticipated expiration: 2040-12-11
Also published as: CN112612602B

Abstract

本实施例公开了用于目标检测网络模型的自动压缩处理方法，将原始训练集人为划分为训练集和验证集，在训练集上对网络模型进行训练，得到预训练后的网络权重；根据网络特点构建适应性函数，同时随机初始化个初始解向量与相同数量的解更新向量，设置个历史最优解向量与一个全局最优解向量计算解向量P的适应性函数，更新历史最优解向量与全局最优解向量，通过和更新解更新向量；根据向量更新向量，迭代执行直到满足停止条件，全局最优解向量代表的模型所需的压缩模型。通过阈值选择策略对目标检测网络模型进行自动剪枝，使得网络模型可以直接部署到边缘端，提高检测速度与效率，减少了服务器的负载和网络传输带宽，降低了设备对于环境的使用限制。

Description

用于目标检测网络模型的自动压缩处理方法

技术领域

本申请涉及边缘端的目标检测领域，具体涉及用于目标检测网络模型的自动压缩处理方法。

背景技术

目标检测是关于寻找符合与期望目标相匹配的问题，在现实生活中有着广泛的应用场景。电力系统的安全稳定运行十分重要，因此需要对智能电网系统中的异常目标进行检测，以便及时地处理安全隐患或者解决存在的问题。针对电力系统现有的目标检测网络模型需要运行在强大的GPU上面，且占用内存多，计算速度慢，大部分网络模型无法直接移植在边缘端嵌入式设备上，难以应用于边缘端的在线检测系统，实时地、快递地检测目标状态。

同时，现有的模型压缩方法大多基于人类经验进行设计，所得到的模型通常是次优的，进行模型压缩后得到的检测结果精度下降明显，难以快速准确的检测出目标

目前，电力系统目标检测存在的几个挑战在于：

1)网络模型占用资源较多，推理速度较慢，边缘端的嵌入式设备计算资源较少，无法满足电力系统实时检测目标状态的需求；

2)模型压缩方法基于经验进行设计，模型进行压缩后精度下降明显，无法准确的检测出目标；

因此，针对电力系统边缘端的目标检测，提出一种基于自动搜索算法的网络模型压缩方法，在不损失精度的前提下，降低网络模型所需要的存储空间以及推理所需要的计算资源，使目标检测可以更好的应用在边缘端，成为本领域的技术人员需要解决的问题。

发明内容

本申请实施例提出了用于目标检测网络模型的自动压缩处理方法，能够使网络模型可以直接部署到边缘端，提高检测速度与效率。

具体的，本申请实施例提出的自动压缩处理方法，包括：

步骤一：搭建目标检测网络模型，将原始训练集人为划分为训练集和验证集，在训练集上对网络模型进行训练，得到预训练后的网络权重W；

步骤二：将模型压缩设计为最值优化问题，根据网络特点构建适应性函数F，该函数用来在验证集上对压缩后的模型进行性能评估，对模型进行优化，同时随机初始化N个初始解向量P＝{p₁,p₂,…,p_N}与相同数量的解更新向量V＝{v₁,v₂,…,v_N}，设置N个历史最优解向量H＝{h₁,h₂,…,h_N}与一个全局最优解向量global；

步骤三：计算解向量P的适应性函数F，更新历史最优解向量H与全局最优解向量global，通过H和global更新解更新向量V；

步骤四：根据向量V更新向量P，迭代执行步骤三与步骤四直到满足停止条件，全局最优解向量global代表的模型所需的压缩模型。

可选的，所述目标检测网络模型具体包括：

采用24个卷积层，每个卷积层后面跟一个BN层，在第1层，第2层，第6层以及第16层后面跟一个最大池化层(MaxPool)，在第24层后跟N个1*1的卷积核，以减小计算量，其中N代表我们想要检测的种类；

将原始训练集按照9:1的比例随机划分为训练集与验证集，训练集用来进行模型预训练，验证集用来进行性能评估。

可选的，所述将模型压缩设计为最值优化问题，具体包括：

定义适应性函数F的输入为向量，代表目标检测网络每一层的压缩率，输出为压缩后的网络模型在验证集上的准确率，模型压缩问题转化求最优的p_i，即：maxF(p_i)＝max(acc(W_i′,p_i)_验证集)，其中p_i∈P，W_i′为p_i对应的卷积核权重；

根据p_i计算，在此解向量下目标检测网络每一层的卷积核需要裁剪的数目n_i，计算公式为：n_i＝p_i*x，x为原始网络每一层包含的卷积核数目构成的向量，根据计算结果，在原网络中按照n_i根据阈值选取卷积核进行裁剪；

对裁剪后的网络模型在训练集上进行重训练，重训练轮数为2到3轮，得到W_i′，重训练完成后，在验证集上进行测试，测试的结果为适应性函数F_i的输出。

可选的，所述步骤2中，每个p_i对应一个v_i与h_i，通过v_i来更新p_i以进入下次迭代，所有的p_i共享一个global。

可选的，所述步骤三具体包括：

在每次迭代中，首先计算N个p_i对应的F(p_i),然后将F(p_i)与F(h_i)进行比较，若F(p_i)>F(h_i)，则对h_i进行更新h_i＝p_i，否则，h_i不变；

选取本次迭代中最大的F(p)与F(global)进行比较，若F(p)>F(global)，则对global进行更新global＝p，否则，global不变；

对v_i进行更新，更新公式为：v_i＝v_i+a₁*random(0,1)*(h_i-p_i)+a₂*random(0,1)*(global-p_i),其中：a₁与a₂通常取(0,5)之间的整数，random(0,1)代表(0,1)之间的随机数。

可选的，所述根据向量V更新向量P，包括：

对P进行更新，P＝P+V,对更新后的P求适应度进入下一次迭代；

迭代次数可根据收敛速度自由选取，一般选择1000次；

向量p_i中的参数取值范围为(0,100)对于超出这个范围的p_i，进行合法性调整，将其适应度值设置的很小，以便下次迭代时，将参数范围拉到(0,100)以内。

本申请提供的技术方案带来的有益效果是：

通过阈值选择策略对目标检测网络模型进行自动剪枝，使得网络模型可以直接部署到边缘端，提高检测速度与效率，减少了服务器的负载和网络传输带宽，降低了设备对于环境的使用限制，提高了用户的隐私保护。

附图说明

为了更清楚地说明本申请的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的用于目标检测网络模型的自动压缩处理方法的流程图。

具体实施方式

为使本申请的结构和优点更加清楚，下面将结合附图对本申请的结构作进一步地描述。

本申请实施例提出了如图1所示的用于目标检测网络模型的自动压缩处理方法，具体包括：

可选的，所述目标检测网络模型具体包括：

可选的，所述将模型压缩设计为最值优化问题，具体包括：

可选的，所述步骤三具体包括：

可选的，所述根据向量V更新向量P，包括：

对P进行更新，P＝P+V,对更新后的P求适应度进入下一次迭代；

迭代次数可根据收敛速度自由选取，一般选择1000次；

本实施例提供了用于目标检测网络模型的自动压缩处理方法，整个方法包括两个主要部分：网络修剪以及自动搜索。

以下针对本实施例的两部分和实施策略进行阐述。

一、目标检测网络模型的设计

1)采用24个卷积层，每个卷积层后面跟一个BN层，在第1层，第2层，第6层以及第16层后面跟一个最大池化层(MaxPool)，在第24层后跟N个1*1的卷积核，以减小计算量，其中N代表我们想要检测的种类

2)将原始训练集按照9:1的比例随机划分为训练集与验证集，训练集用来进行模型预训练，验证集用来进行性能评估

二、网络模型的修剪

需要根据解向量P，设置阈值γ，对预训练的目标检测模型进行裁剪

网络模型的裁剪，删除对检测结果影响较低的网络连接，具体包括：

1)在进行网络模型训练时，对损失函数引入因子正则化项，同时，设置一个阈值γ，对目标检测网络模型进行训练，找到权重小于γ的神经网络连接。训练过程使用的损失函数为：

其中：f为原先的损失函数，L为引入正则化因子后的损失函数，

为正则化项，θ为正则化系数，可以自由设置

2)引入正则化项后的损失函数L，会使权重偏向于0，将权重与阈值γ相比较，删除权重小于γ的神经网络连接

3)对修剪后的神经网络进行重训练；固定未参与修剪的层相对应的权重，其余层保留上一轮训练的结果，再此基础上重新训练模型

三、自动搜索算法的实施

自动搜索算法主要为适应性函数F的计算以及H,global，V的更新，具体包括:

1)在每次迭代中，首先计算N个p_i对应的F(p_i),然后将F(p_i)与F(h_i)进行比较，若F(p_i)>F(h_i)，则对h_i进行更新h_i＝p_i，否则，h_i不变

2)选取本次迭代中最大的F(p)与F(global)进行比较，若F(p)>F(global)，则对global进行更新global＝p，否则，global不变

3)对v_i进行更新，更新公式为：v_i＝v_i+a₁*random(0,1)*(h_i-p_i)+a₂*random(0,1)*(global-p_i),其中：a₁与a₂通常取(0,5)之间的整数，random(0,1)代表(0,1)之间的随机数

其中，所述向量P的更新，具体包括：

1)对P进行更新，P＝P+V,对更新后的P求适应度进入下一次迭代

2)迭代次数可根据收敛速度自由选取，一般选择1000次

3)向量p_i中的参数取值范围为(0,100)对于超出这个范围的p_i，进行合法性调整，将其适应度值设置的很小，以便下次迭代时，将参数范围拉到(0,100)以内。

以上所述为本实施例的实施例，应当指出，凡是在不脱离本实施例原理的前提下，利用本实施例说明书及附图所作的等同变换，或直接或间接运用在相关领域，均同理包括在本实施例的专利保护范围内。

Claims

1.用于目标检测网络模型的自动压缩处理方法，其特征在于，包括：

2.根据权利要求1所述的用于目标检测网络模型的自动压缩处理方法，其特征在于，所述目标检测网络模型具体包括：

3.根据权利要求1所述的用于目标检测网络模型的自动压缩处理方法，其特征在于，所述将模型压缩设计为最值优化问题，具体包括：

定义适应性函数F的输入为向量，代表目标检测网络每一层的压缩率，输出为压缩后的网络模型在验证集上的准确率，模型压缩问题转化求最优的p_i，即：maxF(p_i)＝max(acc(W′_i,p_i)_验证集)，其中p_i∈P，W_i′为p_i对应的卷积核权重；

对裁剪后的网络模型在训练集上进行重训练，重训练轮数为2到3轮，得到W′_i，重训练完成后，在验证集上进行测试，测试的结果为适应性函数F_i的输出。

4.根据权利要求1所述的用于目标检测网络模型的自动压缩处理方法，其特征在于，所述步骤2中，每个p_i对应一个v_i与h_i，通过v_i来更新p_i以进入下次迭代，所有的p_i共享一个global。

5.根据权利要求1所述的用于目标检测网络模型的自动压缩处理方法，其特征在于，所述步骤三具体包括：

6.根据权利要求1所述的用于目标检测网络模型的自动压缩处理方法，其特征在于，所述根据向量V更新向量P，包括：

对P进行更新，P＝P+V,对更新后的P求适应度进入下一次迭代；

迭代次数可根据收敛速度自由选取，一般选择1000次；