CN113947705B

CN113947705B - 一种基于约束条件下的演化神经网络的目标检测方法

Info

Publication number: CN113947705B
Application number: CN202111238755.1A
Authority: CN
Inventors: 孙亚楠; 李思毅; 吴杰; 冯雨麒; 谢香凝; 陈圣嘉
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2021-10-25
Filing date: 2021-10-25
Publication date: 2022-08-12
Anticipated expiration: 2041-10-25
Also published as: CN113947705A

Abstract

本发明公开了一种基于约束条件下的演化神经网络的目标检测方法，其包括构建若干结构块和由若干个体构成的种群，通过变长编码方式对每个个体进行编码，即完成种群初始化；根据训练数据集对每个个体进行训练更新；在验证数据集上对个体进行评估，计算个体准确率和复杂度得到个体适应度；根据预设的约束量，利用约束控制方法调整个体适应度，并调整准确率超过阈值的个体构架；根据调整后的适应度从种群中选择父本，通过父本交叉生成一级子代，并使一级子代概率性发生变异，生成二级子代；对父代、一级子代和二级子代进行选择，生成新的种群，进行迭代进化。本发明设计轻量结构单元利用约束方法，不用人工经验达到优化的目标检测结果。

Description

一种基于约束条件下的演化神经网络的目标检测方法

技术领域

本发明涉及数字图像处理领域，具体涉及一种基于约束条件下的演化神经网络的目标检测方法。

背景技术

目标检测是计算机视觉、机器学习、人工智能等领域的研究热点，在诸如智能视频监控、机器人环境感知、大规模图像检索等方面都有广泛的应用。然而，由于实际场景中目标物体的各种形变、姿态变化以及背景光照、角度等环境因素，目标检测仍是一个具有挑战的任务。随着深度学习技术的不断发展，基于深度学习的目标检测性能得到了大幅度的提升。目前，目标检测主要利用图像处理和深度学习的方法定位图像中感兴趣的目标，准确地判别每个目标的类别并且给出每个目标在图像中的边界框，为后续图像智能分析(跟踪、识别、验证、匹配、检索等等)顺利进行的必要条件。

随着物联网概念的兴起，目标检测在移动和嵌入式设备上进行广泛应用，诸如智能视频监控、车辆自动驾驶、机器人环境感知、视觉人机交互等。这些设备往往具有有限的计算资源限制，在移动和嵌入式设备上进行部署的目标检测模型不仅要准确，而且要满足特定的资源约束限制。目前，在目标检测方法中，卷积神经网络与候选区提取算法相结合，利用卷积神经网路进行分类和识别，可以进行多尺度和多类别的目标检测，极大提高了目标检测的准确率。但是良好的网络模型性能需要较大的网络深度和网络宽度，会带来较大的网络规模和复杂度。因此，为了达到更优性能同时满足设备要求，我们需要设计复杂度尽可能接近设备限制的模型。

随着深度学习的不断发展，卷积神经网络(CNN)成为目标检测技术的有效方法，可以有效提高其准确度。然而，卷积神经网络的架构设计颇具挑战性，尤其是构建一个拥有很好目标检测功能的轻量级神经网络强烈依赖人工经验，这些人工经验来自无数专业人员对处理任务以及神经网络模型多年研究成果的共同积累。目前这些行业大量匮乏此类专业人员，这导致面向移动和嵌入式设备的基于CNN的目标检测方法很难独立实现。

发明内容

针对现有技术中的上述不足，本发明提供的一种基于约束条件下的演化神经网络的目标检测方法解决了目前目标检测模型规模大，无法直接用于资源有限的移动端和嵌入式设备，以及现有技术中轻量级神经网络十分依赖人工经验的问题。

为了达到上述发明目的，本发明采用的技术方案为：

提供一种基于约束条件下的演化神经网络的目标检测方法，其包括以下步骤：

S1、构建若干结构块，并通过结构块构建组成种群的个体，通过变长编码方式对每个个体进行编码，即完成种群初始化；每个结构块包括至少两个卷积层；个体为CNN网络；

S2、构建训练数据集，根据训练数据集对每个个体进行训练更新；

S3、构建验证数据集，根据验证数据集对个体进行评估得到适应度，即个体的准确率和复杂度；

S4、根据预设的约束量对个体适应度进行约束控制，并根据准确率和复杂度调整个体构架，并评估得到构架调整后的适应度；

S5、根据调整后的适应度从种群中选择父本，通过父本交叉生成一级子代，并使一级子代概率性发生变异，生成二级子代；

S6、对父代、一级子代和二级子构成的种群代进行选择，生成新的种群；

S7、重复步骤S2到步骤S6进行迭代进化，得到用于进行目标检测的轻量模型。

进一步地，步骤S1的具体方法为：

S1-1、通过间接编码方式对各个结构块进行编码，并设置各个结构块的数目范围；

S1-2、根据设置的范围，以一个结构块为初始，随机添加结构块或池化层，并在最后添加若干全连接层，构成一个初始CNN网络；其中随机添加结构块时匹配每个卷积层的输入输出特征图数目，随机添加池化层时匹配池化层类型；

S1-3、在初始CNN网络后依次添加一个RPN网络、一个ROI池化层和若干全连接层，完成CNN网络构建；其中RPN网络用于在滑动窗口生成一个不同大小和不同长宽比的候选区域，候选区域用于映射输入的样本；

S1-4、利用结构块类型和输入输出特征图的个数对CNN网络的结构块进行编码，利用池化层类型对CNN网络的池化层进行编码，直到完成对构建的CNN网络的编码，即完成对构建的CNN网络的变长编码；

S1-5、重复上述步骤，构建若干个CNN网络，即完成初始化；其中一个CNN网络即一个种群中的一个个体。

进一步地，步骤S1中的五种结构块的结构为：

第一结构块，包括依次连接的第一卷积层和第二卷积层；所述第一卷积层和第二卷积层均为3×3结构；

第二结构块，包括依次连接的第三卷积层和第四卷积层，且第三卷积层的输入端与第四卷积层的输出端相连；所述第三卷积层和第四卷积层均为3×3结构；

第三结构块，包括依次连接的第五卷积层、第六卷积层和第七卷积层，且第五卷积层的输入端与第七卷积层的输出端相连；所述第六卷积层为3×3结构，所述第五卷积层和第七卷积层为1×1结构，构成瓶颈结构；

第四结构块，包括依次连接的第八卷积层和第九卷积层，且第八卷积层的输入端与第九卷积层的输出端相连；所述第八卷积层为分组卷积层，所述第八卷积层和第九卷积层均为3×3结构；

第五结构块，包括依次连接的第十卷积层、第十一卷积层和第十二卷积层，且第十卷积层的输入端与第十二卷积层的输出端相连；所述第十卷积层和第十二卷积层为1×1结构，所述第十一卷积层为3×3结构，构成瓶颈结构；其中第十卷积层和第十二卷积层为通过分组数设置的分组卷积层，第十一卷积层和第十二卷积层构成深度可分离卷积结构。

进一步地，步骤S2的具体方法为：

S2-1、获取待训练图片，并通过选择性搜索算法提取待训练图片的候选区域；

S2-2、通过公式IoU＝A∩B/A∪B，计算候选区域与待训练图片的交并比；其中A为预测结果，即候选区域值，B为真实标签，即待训练图片的正确区域值，IoU为交并比，∩为交集运算，∪为并集运算；

S2-3、将交并比大于阈值的候选区域作为正样本；

S2-4、从最大交并比值开始对正样本进行排序，并取前I个候选区域，将前I个候选区域的坐标作为该待训练图片的训练样本；

S2-5、将待训练图片和训练样本输入初始化的CNN网络，并将批处理参数设置为m进行训练，得到分类向量和输出的坐标；

S2-6、将分类向量和候选区域的类别进行交叉熵计算得到分类损失，并将正确区域的坐标与输出的坐标进行回归损失计算得到回归损失；

S2-7、将分类损失和回归损失相加并返回网络，同时利用SGD算法对网络进行优化更新。

进一步地，步骤S2-6的具体方法包括以下子步骤：

S2-6-1、根据公式：

得到分类损失L；其中n₁为样本数量，x为每个样本，y为真实样本标签，a为预测输出，ln为以自然对数为底的对数运算；

S2-6-2、根据公式：

得到回归损失L(t,t^*)；其中{x,y,w,h}为坐标，(x,y)为中心坐标，w为宽度，h为高度，i属于{x,y,w,h}，smooth_L1(·)为回归损失函数，t为输出目标框的坐标，t^*为正确区域的坐标，t_i和

为中间变量，均用于对坐标的四个维度进行计算。

进一步地，步骤S3中对个体进行评估得到适应度的具体方法为：

S3-1、根据公式：

得到精度平均值即个体准确率mAP；其中AP为精度值，n₂为目标类别，TP为被分为正样本并分对的概率，FN为被分为负样本并分错的概率，FP为被分为正样本并分错的概率，recall为召回率，其中recall按照升序排列为t₁,t₂,t₃,...,t_m，m为常数，precision为识别准确率，Precision(t_i+1)为t_i+1对应的识别准确率；

S3-2、获取个体的参数数目作为复杂度；其中准确率和复杂度共同构成适应度。

进一步地，步骤S4的具体方法为：

S4-1、将个体参数数目与预设的参数量约束值进行比较，判断个体是否可行，若是则不处理；否则通过自适应惩罚函数对个体进行适应度惩罚，并进入步骤S4-2；

S4-2、判断不可行个体的准确率是否大于阈值，若是则修复调整不可行个体的结构至少一次，并进入步骤S4-3；否则不处理；

S4-3、判断调整后的个体是否满足步骤S4-1的参数量约束，若是则保留替换结构；否则保留初始个体结构。

进一步地，步骤S4-1的自适应惩罚函数fitness为：

fitness＝φ×mAP-(1-φ)×CV；

其中φ为当前种群的可行性比例，CV为归一化约束违背量，N_f为当前种群中可行个体数，N为当前种群所有个体数，complexity_i为当前种群中个体复杂度，complexity_max为当前种群中个体的最大复杂度，C为约束量，mAP为个体准确率。

进一步地，步骤S5的具体方法为：

S5-1、设置父本大小、交叉概率和突变概率；

S5-2、随机一个整数，在种群中选择对应整数个个体；

S5-3、比较所选个体约束后的适应度大小，保留约束后的适应度最大的个体，完成一个父本的选择；

S5-4、重复步骤S5-2和步骤S5-3直到达到设置父本大小；

S5-5、在父本中随机选择两个父本，并生成一个随机数；

S5-6、判断随机数是否小于交叉概率，若是则将两个父本随机分成两部分，实现单点交叉，生成两个子代，进入步骤S5-7；否则使两个父本直接进入后代种群中，进入步骤S5-7；

S5-7、生成一个随机数，判断其是否小于突变概率，若是则对个体进行变异操作；否则个体保持不变；其中变异操作包括：随机添加一个结构块、随机添加一个池化层、移除选定位置上的结构块、移除选定位置上的池化层、随机改变选定位置上结构块的参数值、随机改变选定位置上池化层的参数值中的至少一种。

进一步地，步骤S6中生成新的种群的具体方法为：

S6-1、根据公式M_i＝N×P_i计算个体i的生存期望，并根据生存期望选择

个个体；其中

为个体i被选取的概率、F_i为个体i的适应度、N为种群大小和

为向上取整；

S6-2、按照适应度对选择的个体进行排序，并删除适应度最低的

个个体，保持种群数目为初始数目N；

S6-3、将所有个体按照适应度从大到小进行排序，并按照这N个个体的选取概率将[0,1]划分为N个区间；

S6-4、产生H个随机数，利用轮盘赌算法将H个随机数落在N个区间上；

S6-5、统计各个区间的随机数个数，保留随机数最多的区间对应的个体，重复操作N次，得到N个个体；

S6-6、用适应度最大的个体代替选出的个体中适应度最小的个体，得到新的种群。

本发明的有益效果为：

1、利用自适应惩罚方法，利用种群中可行个体(模型参数量超过设置的网络架构)的比例作为惩罚因子，与归一化复杂度(模型参数量)，对不可行个体的适应度进行惩罚；利用自适应恢复算法，通过架构中结构单元替换的思想对不可行架构进行恢复。以上过程不需要人工经验的参与，能够根据当前实验中种群个体性能进行约束控制，实现对演化神经网络复杂度的高效约束。在提高神经网络性能的同时，限制网络规模，有利于最终的CNN模型满足小型设备的资源要求。

提出约束控制方法与演化神经网络相结合的方法用于目标检测，通过约束控制方法和演化计算找到一个满足约束条件同时性能较好的神经网络；使用遗传算法优化CNN的体系结构设计和连接权重初始化，实现在没有人工经验的情况下，能够通过神经网络达到较好的目标检测效果。

2、设计改进搜索空间，通过设计结构块构建多种轻量结构单元，有助于搜索轻量网络模型和后续的恢复操作。

3、利用可变长度编码方式，通过编码卷积结构类型，输入输出通道数和池化层类型实现对网络架构的快速编码，方便进行后续的遗传操作。

4、根据整个模型在演化过程的评估结果进行约束优化，优化目标检测效果的同时搜索更小型的完整网络。

5、在找到最佳神经网络之前，CNN的最佳深度是不清楚的，本方法中提出间接编码和可变长度基因编码策略对CNN进行编码，提高CNN结构的多样性。

6、在环境选择环节，种群中采用混合选择算法选择，既保证了精英性又具有多样性。

附图说明

图1为本发明的流程图；

图2为第二结构块的结构图；

图3为第三结构块的结构图；

图4为第四结构块的结构图；

图5为第五结构块的结构图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

如图1所示，提供一种基于约束条件下的演化神经网络的目标检测方法，其包括以下步骤：

步骤S1的具体方法为：

如图2到图5所示，步骤S1中的五种结构块的结构为：

步骤S2的具体方法为：

S2-3、将交并比大于阈值的候选区域作为正样本；

步骤S2-6的具体方法包括以下子步骤：

S2-6-1、根据公式：

S2-6-2、根据公式：

为中间变量，均用于对坐标的四个维度进行计算。

步骤S3中对个体进行评估得到适应度的具体方法为：

S3-1、根据公式：

步骤S4的具体方法为：

步骤S4-1的自适应惩罚函数fitness为：

fitness＝φ×mAP-(1-φ)×CV；

步骤S5的具体方法为：

S5-1、设置父本大小、交叉概率和突变概率；

S5-2、随机一个整数，在种群中选择对应整数个个体；

S5-4、重复步骤S5-2和步骤S5-3直到达到设置父本大小；

S5-5、在父本中随机选择两个父本，并生成一个随机数；

步骤S6中生成新的种群的具体方法为：

个个体；其中

为个体i被选取的概率、F_i为个体i的适应度、N为种群大小和

为向上取整；

个个体，保持种群数目为初始数目N；

在本发明的一个实施例中，使用一个(0,0.5)之间的数字来表示最大池类型，使用一个[0.5,1)之间的数字来表示平均池化类型。步骤S1-4中的变长编码方式的具体编码例子为：

假设一个CNN结构为：包括依次连接的第二结构块(输入量为32和输出量为64)、第一结构块(输入量为64和输出量为256)、平均池化层和第三结构块(输入量为256和输出量为512)，其中第二结构块的输入通道数为32，第三结构块的输出通道数为512；则该CNN结构的编码结果过为：2(32-64)-1(64-256)-0.8-3(256-512)。

为了实现目的，本发明设计了五种结构块用于建立种群，步骤S6的过程保证了种群的精英性。

为了验证该神经网络在目标检测任务中的准确性，应用PASCALVOC数据集，共20类，统一图片大小224×224。把全部图片按照7：2：1的比例随机分成训练集、验证集和测试集。验证集的数据仅仅在选择演化模型的时候起验证作用，查看网络训练是否有效，而测试集是在最后的实验结果对比中起测试作用。

在演化过程中根据适应度选择出了在目标检测任务中效果最好的网络结构。网络结构模型包含了卷积和池化操作，可以实现图片的特征提取和分类。训练过程设置训练步数为300，每一步遍历所有训练数据，在不过拟合的情况下，达到较好的学习效果；为了不超出存储，一个批次训练2个样本。模型需要优化算法求解，优化算法采用SGD算法，学习率设为0.001，进行权重更新。在网络训练过程中，要确保训练集和测试集的损失都呈下降趋势，这样才进行有效训练。

本发明利用自适应惩罚方法，利用种群中可行个体(模型参数量超过设置的网络架构)的比例作为惩罚因子，与归一化复杂度(模型参数量)，对不可行个体的适应度进行惩罚；利用自适应恢复算法，通过架构中结构单元替换的思想对不可行架构进行恢复。以上过程不需要人工经验的参与，能够根据当前实验中种群个体性能进行约束控制，实现对演化神经网络复杂度的高效约束。在提高神经网络性能的同时，限制网络规模，有利于最终的CNN模型满足小型设备的资源要求。

设计改进搜索空间，通过设计结构块构建多种轻量结构单元，有助于搜索轻量网络模型和后续的恢复操作。

利用可变长度编码方式，通过编码卷积结构类型，输入输出通道数和池化层类型实现对网络架构的快速编码，方便进行后续的遗传操作。

根据整个模型在演化过程的评估结果进行约束优化，优化目标检测效果的同时搜索更小型的完整网络。

在找到最佳神经网络之前，CNN的最佳深度是不清楚的，本方法中提出间接编码和可变长度基因编码策略对CNN进行编码，提高CNN结构的多样性。

在环境选择环节，种群中采用混合选择算法选择，既保证了精英性又具有多样性。