CN113076962A

CN113076962A - 一种基于可微神经网络搜索技术的多尺度目标检测方法

Info

Publication number: CN113076962A
Application number: CN202110528406.7A
Authority: CN
Inventors: 刘启和; 严张豹; 周世杰; 张准; 董婉祾; 王钰涵; 但毅
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2021-05-14
Filing date: 2021-05-14
Publication date: 2021-07-06
Anticipated expiration: 2041-05-14
Also published as: CN113076962B

Abstract

本发明公开了一种基于可微神经网络搜索技术的多尺度目标检测方法，针对不同的数据以及应用场景不需要通过大量的人力来改进已有模型使其满足性能要求，而是通过神经网络结构搜索技术来自动搜索出一个较为理想的网络模型，同时在搜索过程中，考虑了多尺度目标检测，使得搜索出的模型具有良好的检测效果。

Description

一种基于可微神经网络搜索技术的多尺度目标检测方法

技术领域

本发明属于目标检测技术领域，具体涉及一种基于可微神经网络搜索技术的多尺度目标检测方法。

背景技术

近年来，深度学习飞速发展，尤其是神经网络的发展，颠覆了传统问题的解决方式，，与此同时，模型的各种参数也越来越庞大。层出不穷的各种网络模型，使得在对实际问题进行模型选择和设计的时候，很难找出一个最优的模型，即便找出这种模型，其资源消耗也特别巨大。在此背景在，一种针对不同数据自动搜索出最优或者较为最优的神经网络结构的技术—神经网络结构搜索(Neural Architecture Search)，受到人们的广泛关注，而在目标检测这一块，尽管研究人员已经提出了许多目标检测方法，但是，大量任务表明这些目标检测算法在实际部署中往往存在一些漏洞，目前主要有三个问题：一、针对不同场景下的数据，利用原始的网络模型，最后训练出的模型其检测效果并不理想。二、为了让模型的检测效果理想，需要人工重新设计和改进已有的网络模型，如在多尺度目标检测中，对不同尺度特征图所提取的位置，往往会随着实际用途或者所处平台而不同，这大大增大了人力成本和资源。三、通过人工设计或改进的模型，大都仍然存在冗余，可以进一步裁剪和改进。

发明内容

针对现有技术中的上述不足，本发明提供的基于可微神经网络搜索技术的多尺度目标检测方法解决了现有的多尺度目标检测过程中需要人工设计改进模型，以致于目标检测效果不理想的问题。

为了达到上述发明目的，本发明采用的技术方案为：一种基于可微神经网络搜索技术的多尺度目标检测方法，包括以下步骤：

S1、构建基于可微神经网络搜索技术的多尺度目标检测模型；

S2、对多尺度目标检测模型进行训练；

S3、将原始待处理图像输入到训练好的多尺度目标检测模型中，获得多尺度目标检测结果。

本发明的有益效果为：

(1)本发明针对不同的数据以及应用场景不需要通过大量的人力来改进已有模型使其满足性能要求，而是通过神经网络结构搜索技术来自动搜索出一个较为理想的网络模型；

(2)本发明在在网络模型的搜索过程中，考虑了多尺度的目标检测，使得搜索出的模型具有良好的检测效果；

(3)本发明中在进行多尺度特征提取提取时，在单个cell结构中的两个结点之间设计了混合操作，对每个可能的操作均赋予权重，再进行softmax操作，经过这种连续池化后，搜索空间变得可微，而对结构的搜索就变成了对权重的学习，提高了模型检测的准确性；

(4)本发明进行了多尺度特征图提取，并采样SSD算法进行目标检测，保证了对大小差异较大的目标的准确提取；

附图说明

图1为本发明提供的基于可微神经网络搜索技术的多尺度目标检测方法流程图。

图2为本发明提供的多尺度目标检测模型的网络结构示意图。

图3为本发明提供的cell结构示意图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

如图1所示，一种基于可微神经网络搜索技术的多尺度目标检测方法，包括以下步骤：

S2、对多尺度目标检测模型进行训练；

本实施例的步骤S1中的多尺度目标检测模型如图2所示，包括初始卷积单元、多尺度特征提取单元及分类回归单元；

所述初始卷积单元用于对输入数据进行初步的特征提取，同时确保输入多尺度特征提取单元的特征图的尺寸，其中，输入到多尺度特征提取单元中的特征图的尺寸为38×38；

所述多尺度特征提取单元用于基于可微神经网络搜索技术自动搜索出尺度不通过的6个特征图；

所述分类回归单元用于对多尺度特征提取单元提取的6个特征图进行目标检测。

上述初始卷积单元包括依次连接的第一3×3卷积层、第二3×3卷积层、第一2×2最大池化层、第三3×3卷积层、第二2×2最大池化层、第四3×3卷积层和第三2×2最大池化层；

其中，所述第一3×3卷积层、第二3×3卷积层、第三3×3卷积层和第四3×3卷积层后均添加有Relu层。

具体地，设置原始输入图像x的大小为300×300×3，即图像长宽为300，采用grb通道，pⁱ×qⁱ×mⁱ为第i层输出特征图的大小，其中，p⁰×q⁰×m⁰为初始输入；

第一3×3卷积层表示为：p¹×q¹×m¹＝F¹(p⁰×q⁰×m⁰)，其中，F¹表示采用64个padding模式的3×3卷积，输出大小保持不变，此时，输出特征图大小p¹×q¹×m¹＝300×300×64；

第二3×3卷积层表示为：p²×q²×m²＝F²(p¹×q¹×m¹)，其中，F²表示采用64个padding模式的3×3卷积，输出大小保持不变，此时，输出特征图大小p²×q²×m²＝300×300×64；

第一2×2最大池化层表示为：p³×q³×m³＝F³(p²×q²×m²)，其中，F³表示采用64个2×2的最大池化，此时，输出特征图大小p²×q²×m²＝150×150×64；

第三3×3卷积层表示为：p⁴×q⁴×m⁴＝F⁴(p³×q³×m³)，其中，F⁴表示采用128个padding模式的3×3卷积，输出大小保持不变，此时，输出特征图大小p⁴×q⁴×m⁴＝150×150×128；

第二2×2最大池化层表示为：p⁵×q⁵×m⁵＝F⁵(p⁴×q⁴×m⁴)，其中，F⁵表示采用64个2×2的最大池化，此时，输出特征图大小p⁵×q⁵×m⁵＝75×75×128；

第四3×3卷积层表示为：p⁶×q⁶×m⁶＝F⁶(p⁵×q⁵×m⁵)，其中，F⁶表示采用256个padding模式的3×3卷积，输出大小保持不变，此时，输出特征图大小p⁶×q⁶×m⁶＝75×75×256；

第三2×2最大池化层表示为：：p⁷×q⁷×m⁷＝F⁷(p⁶×q⁶×m⁶)，其中，F⁷表示采用512个ceil-mode方式的2×2的最大池化，此时，输出特征图大小p⁷×q⁷×m⁷＝38×8×512。

在SSD目标检测算法中，涉及6个尺度不同的特征图，本实施例中的多尺度特征提取单元包括6个尺度下依次连接的cell结构，cell结构是一种特定的基本结构单元，每个cell输出对应尺度的特征图，从而实现多尺度的目标检测，如图3所示，为一个cell结构的具体结构示意；

每个所述cell结构包括5个结点，前4个结点对输入图像进行卷积及池化操作，在操作过程中，图像x的大小保持不变，第5个结点对输入图像进行reduction操作，在操作过程中，图像x的大小保持不变，使输入每个cell结构输出的图像尺寸减半。

具体地，对于第一个cell结构：L₁(x)＝Mix(x)，其中，L₁(x)为经过第1个cell结构后输出的p₁×q₁阶特征矩阵，Mix(x)为5个结点所进行的一些列混合操作；

其中，第1个结点：l¹¹(x)＝o'^(1,2)(x)，l¹¹(x)为经过第1个cell结构的第1个cell结构的第1个结点后的输出；

第2个结点：l¹²(x)＝o'^(2,3)(x)，l¹²(x)为经过第1个cell结构的第1个cell结构的第2个结点后的输出；

第3个结点：l¹³(x)＝o'^(3,4)(x)，l¹³(x)为经过第1个cell结构的第1个cell结构的第3个结点后的输出；

第4个结点：l¹⁴(x)＝o'^(4,5)(x)，l¹⁴(x)为经过第1个cell结构的第1个cell结构的第4个结点后的输出；

第5个结点：l¹⁵(x)＝N(x)，l¹⁵(x)为经过第1个cell结构的第5个结点后的输出，N(x)表示不做操作。

基于上述结点构建方法，构建剩余5个cell结构，但是对于第5个结点，采用如下方式：

lⁱ⁵(x)＝reduction(x)，lⁱ⁵(x)为经过第i个cell结构的第5个结点后的输出，N(x)表示不做操作，reduction(x)表示将x的大小减半。

对于每个cell结构中的5个结点，每个结点可以看做一个特征图，两个结点之间并非单一确定的某个操作，而是由多种操作混合而成的一种混合操作，例如，结点1和结点2之间可能存在5×5卷积操作o¹，3×3卷积操作o²，1×1卷积操作o³，以及最大池化操作o⁴，共四种操作，其对应的权值分别为a¹,a²,a³,a⁴，那么这两个结点之间的混合操作定义为：

因此，相邻两个结点之间对图像进行混合操作，所述混合操作的表达式为：

式中，o'^(i,j)为结点i和结点j之间的混合操作，

为结点i和结点j之间原始操作o的权值，o^(i,j)为结点i和结点j之间的原始操作，O为原始操作的集合；

基于上述混合操作，对每个可能的操作均赋予权重a，再进行softmax操作，经过这种连续池化后，搜索空间变得可微，而对结构的搜索就变成了对权重a的学习；

对于搜索空间，我们搜索的是两个特征图之间应该选择何种操作，如果特征图P₁得到特征图P₂，可以由多种大小不同的卷积核得到，或者不采用卷积而使用池化，因此对于每个cell结构，其对特征图进行处理时的操作的集合作为对应的搜索空间；

第一个cell结构的搜索空间f₁为：

f₁＝{conv5×5,conv3×3,maxpool3×3,averagepool3×3}

第二个cell结构的搜索空间f₂为：

f₂＝{conv5×5,conv3×3,maxpool2×2,averagepool2×2}

第三个cell结构的搜索空间f₃为：

f₃＝{conv3×3,conv1×1,maxpool2×2,averagepool2×2}

第四个cell结构的搜索空间f₄为：

f₄＝{conv3×3,conv1×1,maxpool1×1,averagepool1×1}

第五个cell结构的搜索空间f₅为：

f₅＝{conv3×3,conv1×1,maxpool1×1,averagepool1×1}

第六个cell结构的搜索空间f₆为：

f₆＝{conv1×1,maxpool1×1,averagepool1×1}

式中，convK×K为卷积核大小为K的卷积操作，maxpoolK×K为大小为K的最大池化操作，averagepoolK×K为大小为K的均值池化操作。

将上述多尺度目标检测模型中的cell结构的输出作为SSD算法中的多尺度特征图，分别进行分类和检测框的逻辑回归，对特征图的每一个点生成不同数目的默认框，依次为4、6、6、6、4、4；

具体地，分类回归单元包括6个Muti-box层，6个所述Muti-box层的输入依次对应6个cell结构的输出，每个Muti-box层均包括逻辑回归网络和分类网络；

第一个Muti-box层中的逻辑回归网络表示为：

loc¹＝Conv¹(L¹)

第二个Muti-box层中的逻辑回归网络表示为：

loc²＝Conv²(L²)

第三个Muti-box层中的逻辑回归网络表示为：

loc³＝Conv³(L³)

第四个Muti-box层对应的逻辑回归网络表示为：

loc⁴＝Conv⁴(L⁴)

第五个Muti-box层中的逻辑回归网络表示为：

loc⁵＝Conv⁵(L⁵)

第六个Muti-box层中的逻辑回归网络表示为：

loc⁶＝Conv⁶(L⁶)

式中，loc^p为第p个Muti-box层对应的逻辑回归网络的输出，p＝1,2,...,6，其输出大小依次为38×38×16、19×19×24、10×10×24、5×5×24、3×3×16、1×1×16；

L^p为第p个cell结构的输出，其输出大小依次为38×38×512、19×19×512、10×10×512、5×5×512、3×3×512、1×1×512；

Conv¹为用16个padding模式的3×3卷积核操作进行卷积操作，Conv²为用24个padding模式的3×3卷积核操作进行卷积操作，Conv³为用24个padding模式的3×3卷积核操作进行卷积操作，Conv⁴为用24个padding模式的3×3卷积核操作进行卷积操作，Conv⁵为用16个padding模式的3×3卷积核操作进行卷积操作，Conv⁶为用16个padding模式的3×3卷积核操作进行卷积操作，

将前6层的输出结合，展开形成大小为1×8732×4的loc⁷；

第一Muti-box层中的分类网络表示为：

conf¹＝Conv_conf¹(L¹)

第二Muti-box层中的分类网络表示为：

conf²＝Conv_conf²(L²)

第三Muti-box层中的分类网络表示为：

conf³＝Conv_conf³(L³)

第四Muti-box层中的分类网络表示为：

conf⁴＝Conv_conf⁴(L⁴)

第五Muti-box层中的分类网络表示为：

conf⁵＝Conv_conf⁵(L⁵)

第六Muti-box层中的分类网络表示为：

conf⁶＝Conv_conf⁶(L⁶)

式中，conf^p为第p个Muti-box层对应的分类网络的输出，其输出大小依次为38×38×84、19×19×126、10×10×126、5×5×126、3×3×84、1×1×84；

Conv_conf¹为用84个padding模式的3×3卷积核操作进行卷积操作，Conv_conf²为用126个padding模式的3×3卷积核操作进行卷积操作，Conv_conf³为用126个padding模式的3×3卷积核操作进行卷积操作，Conv_conf⁴为用126个padding模式的3×3卷积核操作进行卷积操作，Conv_conf⁵为用84个padding模式的3×3卷积核操作进行卷积操作，Conv_conf⁶为用84个padding模式的3×3卷积核操作进行卷积操作；

将前6层的输出结合，展开成大小为1×8732×21的conf⁷。

在本实施例的步骤S2中，对多尺度目标检测模型进行训练的方法具体为：

S21、构建训练样本集合X_train＝{x₁,x₂,...,x_n}；

式中，x_i为样本，下标1≤i≤n，n为样本总个数；

S22、将训练样本集合中的样本x_i依次输入到多尺度目标检测模型中，得到6个尺度的特征图；

S23、进行尺度及比例设置，在6个尺度的特征图上生成先验框；

先验框的尺度遵循线性递增的规则，即随着特征图的大小降低，先验框的尺度线性增加，因此，进行尺度设置的公式为：

其中，S_k为第k个特征图的先验框尺度相对于图像的比例，k∈[2,m]，m为特征图的数量，S_max为最大尺度，取0.9，S_max为最小尺度，取0.2；对于第一个特征图，其尺度单独设置为0.1；

所述步骤S23中，进行比例设置时，每个尺度下的特征图中先验框的长宽比依次设置为1，2，3，1/2，1/3，1'，其中，1'为长宽比为1但是尺度大小为

的先验框；

S24、基于生成的先验框，进行正样本及负样本的选择；

具体地，进行正样本和负样本选择的方法具体为：

A1、在每个特征图中，计算每个先验框和对应真实框的IOU值，计算公式为：

IOU＝(A∩B)/(A∪B)

式中，A和B分别为先验框和真实框的面积；

A2、将IOU值大于0.5对应的样本作为正样本，将IOU值小于0.5对应的样本作为负样本，且正样本和负样本的比例为1:3；

S25、基于正样本和负样本的选择结果，计算多尺度目标检测模型的损失；

具体地，多尺度目标检测模型的损失的计算公式为：

式中，N为先验框对应的样本为正样本的样本数量，L_conf(x,c)为类别损失，L_loc(x,l,g)为位置损失，x为是否匹配的参数值，x＝{0,1}，c为类别置信度预测值，a为经验值，l为先验框的位置预测值，g为真实框的位置参数；

所述位置损失L_loc(x,l,g)采用Smoot h_L1损失计算，其表达式为：

式中，上标cx,cy为框的中心点的横、纵坐标，上标w,h为框的宽和高，

为i个default-box与第j个真实框关于类别k是否匹配的参数，

d为default-box的位置参数；

所述类别损失函数L_conf(x,c)的计算公式为：

式中，

为第i个default-box与第j个真实框关于类别p是否匹配的参数，

为第p个类别的预测置信度；

S26、基于损失计算结果，进行多尺度目标检测模型的参数优化，得到训练好的多尺度目标检测模型。

具体地，在定义混合操作时引入结构参数a，并且结构参数通过了softmx进行连续池化，故对于结构参数a和网络参数w，都可以利用梯度下降算法进行优化，因此，进行参数优化时的公式为：

式中，a为结构参数，即对操作赋予的权重，w为网络参数，L_val(·)为验证集合样本上的损失值，L_train(·)为训练样本集合上的损失值；

上述对结构参数a和网络参数w进行优化的方法具体为：

B1、将结构参数a视为已经训练好的参数，固定不变，在训练样本集上利用梯度下降法优化网络参数w；

B2、将网络参数w视为已经训练好的参数，固定不变，在验证样本集上利用梯度下降法优化结构参数a；

B3、重复步骤B1～B2，对网络参数w和结构参数a进行优化，进而得到训练好的多尺度目标检测模型。

本实施的步骤S3中，利用多尺度目标检测模型对原始待处理图像进行处理，获得多尺度目标检测结果的方法具体为：

S31、通过初始卷积单元对原始待处理图像进行初始卷积处理，获得图像F；

S32、通过多尺度特征提取单元对图像F进行处理，获得6个尺度的特征图；

S33、对每个特征图中的每个像素点生成大小比例不同的先验框；

S34、基于生成的先验框，进行正样本和负样本匹配；

具体地，进行正样本匹配的方法具体为：

设一张图像中，先验框数量为m，真实框数量为n，遍历所有先验框，对每个先验框，其与n个真实框求IOU，得到一个m×n的矩阵A，在矩阵A中按每列找出最大值，用得到n个最大值，进而保证了每个真实框至少有一个匹配的先验框，在矩阵A中按行进行遍历，如果某行是已经进行匹配的，则跳过，否则，找出这一行中超过阈值的IOU的最大值，并认为该先验框匹配对应的真实框。

进行负样本匹配的方法具体为：

计算所有先验框的类别损失，将损失按照从大到小排序得到矩阵B，对于没有作为正样本的先验框框，且其IOU小于阈值，选取B中靠前损失所对应的样本作为负样本，且满足正负样本比例为1:3；

S35、基于正样本和负样本的匹配结果，计算多尺度目标检测的损失，并通过梯度下降法更新多尺度目标检测模型的参数a和w；

S36、基于当前多尺度目标检测模型的参数，选取每个混合操作中参数a最大的操作，并确定其对应的cell结构；

S37、对确定的cell结构输出的特征图进行非极大值抑制操作，获得对应尺度下特征图中的目标检测结果。

具体地，步骤S37具体为：

S37-1、选取当前特征图中置信度前200的所有先验框，构建集合H；

同时，构造用于存放最优框的集合M，并将其初始化为空集；

S37-2、将集合H中的先验框按照置信度进行排序，选出分数最高的先验框m，并将其移动到集合M中；

S37-3、遍历集合H中的先验框，计算分数最高的先验框m的IOU值，并将高于设定IOU阈值的先验框从集合H中删除；

S37-4、重复步骤S37-2～S37-3，直到集合H为空，输出集合M中的先验框，作为多尺度目标检测结果。

Claims

1.一种基于可微神经网络搜索技术的多尺度目标检测方法，其特征在于，包括以下步骤：

S2、对多尺度目标检测模型进行训练；

2.根据权利要求1所述的基于可微神经网络搜索技术的多尺度目标检测方法，其特征在于，所述步骤S1中的多尺度目标检测模型包括初始卷积单元、多尺度特征提取单元及分类回归单元；

所述初始卷积单元用于对输入数据进行初步的特征提取,同时确保输入多尺度特征提取单元的特征图的尺寸；

3.根据权利要求2所述的基于可微神经网络搜索技术的多尺度目标检测方法，其特征在于，所述初始卷积单元包括依次连接的第一3×3卷积层、第二3×3卷积层、第一2×2最大池化层、第三3×3卷积层、第二2×2最大池化层、第四3×3卷积层和第三2×2最大池化层；

4.根据权利要求2所述的基于可微神经网络搜索技术的多尺度目标检测方法，其特征在于，所述多尺度特征提取单元包括6个尺度下依次连接的cell结构；

每个所述cell结构包括5个结点，前4个结点对输入图像进行卷积及池化操作，第5个结点对输入图像进行reduction操作，使输入每个cell结构输出的图像尺寸减半。

5.根据权利要求4所述的基于可微神经网络搜索技术的多尺度目标检测方法，其特征在于，对于每个cell结构中的5个结点，相邻两个结点之间对图像进行混合操作，所述混合操作的表达式为：

式中，o'^(i,j)为结点i和结点j之间的混合操作，

基于上述混合操作，对每个可能的操作均赋予权重a，再进行softmax操作；

对于每个cell结构，其对特征图进行处理时的操作的集合作为对应的搜索空间；

第一个cell结构的搜索空间f₁为：

f₁＝{conv5×5,conv3×3,maxpool3×3,averagepool3×3}

第二个cell结构的搜索空间f₂为：

f₂＝{conv5×5,conv3×3,maxpool2×2,averagepool2×2}

第三个cell结构的搜索空间f₃为：

f₃＝{conv3×3,conv1×1,maxpool2×2,averagepool2×2}

第四个cell结构的搜索空间f₄为：

f₄＝{conv3×3,conv1×1,maxpool1×1,averagepool1×1}

第五个cell结构的搜索空间f₅为：

f₅＝{conv3×3,conv1×1,maxpool1×1,averagepool1×1}

第六个cell结构的搜索空间f₆为：

f₆＝{conv1×1,maxpool1×1,averagepool1×1}

6.根据权利要求2所述的基于可微神经网络搜索技术的多尺度目标检测方法，其特征在于，所述分类回归单元包括6个Muti-box层，6个所述Muti-box层的输入依次对应6个cell结构的输出，每个Muti-box层均包括逻辑回归网络和分类网络；

第一个Muti-box层中的逻辑回归网络表示为：

loc¹＝Conv¹(L¹)

第二个Muti-box层中的逻辑回归网络表示为：

loc²＝Conv²(L²)

第三个Muti-box层中的逻辑回归网络表示为：

loc³＝Conv³(L³)

第四个Muti-box层对应的逻辑回归网络表示为：

loc⁴＝Conv⁴(L⁴)

第五个Muti-box层中的逻辑回归网络表示为：

loc⁵＝Conv⁵(L⁵)

第六个Muti-box层中的逻辑回归网络表示为：

loc⁶＝Conv⁶(L⁶)

式中，loc^p为第p个Muti-box层对应的逻辑回归网络的输出，L^p为第p个cell结构的输出，Conv¹为用16个padding模式的3×3卷积核操作进行卷积操作，Conv²为用24个padding模式的3×3卷积核操作进行卷积操作，Conv³为用24个padding模式的3×3卷积核操作进行卷积操作，Conv⁴为用24个padding模式的3×3卷积核操作进行卷积操作，Conv⁵为用16个padding模式的3×3卷积核操作进行卷积操作，Conv⁶为用16个padding模式的3×3卷积核操作进行卷积操作，其中，p＝1,2,...,6；

第一Muti-box层中的分类网络表示为：

conf¹＝Conv_conf¹(L¹)

第二Muti-box层中的分类网络表示为：

conf²＝Conv_conf²(L²)

第三Muti-box层中的分类网络表示为：

conf³＝Conv_conf³(L³)

第四Muti-box层中的分类网络表示为：

conf⁴＝Conv_conf⁴(L⁴)

第五Muti-box层中的分类网络表示为：

conf⁵＝Conv_conf⁵(L⁵)

第六Muti-box层中的分类网络表示为：

conf⁶＝Conv_conf⁶(L⁶)

式中，conf^p为第p个Muti-box层对应的分类网络的输出，Conv_conf¹为用84个padding模式的3×3卷积核操作进行卷积操作，Conv_conf²为用126个padding模式的3×3卷积核操作进行卷积操作，Conv_conf³为用126个padding模式的3×3卷积核操作进行卷积操作，Conv_conf⁴为用126个padding模式的3×3卷积核操作进行卷积操作，Conv_conf⁵为用84个padding模式的3×3卷积核操作进行卷积操作，Conv_conf⁶为用84个padding模式的3×3卷积核操作进行卷积操作。

7.根据权利要求4所述的基于可微神经网络搜索技术的多尺度目标检测方法，其特征在于，所述步骤S2中，对多尺度目标检测模型进行训练的方法具体为：

S21、构建训练样本集合X_train＝{x₁,x₂,...,x_n}；

式中，x_i为样本，下标1≤i≤n，n为样本总个数；

S24、基于生成的先验框，进行正样本及负样本的选择；

8.根据权利要求7所述的基于可微神经网络搜索技术的多尺度目标检测方法，其特征在于，所述步骤S23中，进行尺度设置的公式为：