CN112085042A

CN112085042A - 一种图像检测网络模型、装置、方法、及存储介质

Info

Publication number: CN112085042A
Application number: CN201910515345.3A
Authority: CN
Inventors: 楚梦蝶; 张玉双; 朴安妮
Original assignee: SF Technology Co Ltd
Current assignee: SF Technology Co Ltd; SF Tech Co Ltd
Priority date: 2019-06-14
Filing date: 2019-06-14
Publication date: 2020-12-15

Abstract

本申请实施例公开了一种图像检测网络模型、装置、方法、及存储介质，本申请中的图像检测网络模型中的特征提取层，用于对获取到的X光图像进行特征提取，得到N种不同尺度的特征图，特征提取层由基本卷积块组成，基本卷积块中融合有BN参数和Scale参数；残差预测层，用于分别对N种不同尺度的特征图进行图像检测处理，得到N个检测结果，残差预测层中与预测块相连接的卷积核为1*1卷积核；输出层，用于根据N个检测结果，确定待检测物的目标检测结果。本实施例中的图像检测网络模型可以提取X光图像中的多种尺度的特征图，可以针对多种大小的检测物进行图像检测，故本方案可以根据X光图像进行待检测物的自动检测，且检测准确率高。

Description

一种图像检测网络模型、装置、方法、及存储介质

技术领域

本申请涉及安检设备技术领域，具体涉及一种图像检测网络模型、装置、方法、及存储介质。

背景技术

随着公众安全意识的增强，各种安检设备被广泛应用于机场、口岸、港口、地铁、法院、重大赛事的场馆等重要公共场所。而其中最常用的就是X光安检机，目前安检机在客流和物流领域得到了越来越广泛的应用。

通常X光安检机的机身与传送带之间形成安检通道，安检通道的至少一侧设有X光机。传送带系统的一端为待检区域，待检测物放置在待检区域后，会被电机驱动的传送带系统传输到另一端，中途必然经过安检通道，被X光机照射扫描生成X光成像，从而可以识别出待检测物是否为违禁品。

在现有技术中，在X光安检机的终端上显示X光图像后，需要安检人员对显示的图片进行人工排查，安检人员容易产生疲劳，导致漏判误检等事件发生。

发明内容

本申请实施例提供一种图像检测网络模型、装置、方法、及存储介质，可以根据X光图像进行待检测物的自动检测。

一方面、本申请提供一种图像检测网络模型，所述图像检测网络模型包括特征提取层、残差预测层以及输出层:

所述特征提取层，用于对获取到的X光图像进行特征提取，得到N种不同尺度的特征图，所述N为大于1的整数，其中，所述特征提取层由基本卷积块组成，所述基本卷积块中融合有BN参数和Scale参数；

所述残差预测层，用于分别对所述N种不同尺度的特征图进行图像检测处理，得到N个检测结果，其中，所述残差预测层中与预测块相连接的卷积核为1*1卷积核，所述预测块为所述残差预测层中的模块；

所述输出层，用于根据所述N个检测结果，确定所述待检测物的目标检测结果。

可选的，在一些实施例中，所述基本卷积块包括第一路卷积层以及第二路卷积层，所述第一路卷积层包括一个M*M卷积核，所述第二路卷积层包括两个M*M卷积核，所述M为大于1的整数。

另一方面，本申请还提供一种图像检测装置，具体包括：

第一采集单元，用于采集待检测物的X光图像；

提取单元，用于基于训练后的图像检测网络模型中的特征提取层对所述X光图像进行特征提取，得到N种不同尺度的特征图，所述特征提取层由基本卷积块组成，所述基本卷积块中融合有BN参数和Scale参数，所述N为大于1的整数；

检测单元，用于基于所述图像检测网络模型中的残差预测层分别对所述N种不同尺度的特征图进行图像检测处理，得到N个检测结果，所述残差预测层中与预测块相连接的卷积核为1*1卷积核，所述预测块为所述残差预测层中的模块；

确定单元，用于根据所述N个检测结果，确定所述待检测物的目标检测结果。

可选的，在一些实施例中，所述确定单元具体用于：

根据所述N个检测结果得到所述不同尺度的特征图分别对应的不同尺度的待检测物的检测结果；

根据所述不同尺度的待检测物的检测结果，确定所述目标检测结果。

可选的，在一些实施例中，所述装置还包括：

第二采集单元，用于采集异常检测物的X光图像，得到正例样本；

第三采集单元，用于采集非异常检测物的X光图像，得到负例样本；

训练单元，用于根据所述正例样本以及所述负例样本对预设图像检测网络模型进行训练，得到所述训练后的图像检测网络模型。

可选的，在一些实施例中，所述第二采集单元具体用于：

采集所述异常检测物经过透视变换处理的多个X光图像，得到所述正例样本；

所述第三采集单元具体用于：

采集所述非异常检测物经过透视变换处理的多个X光图像，得到所述负例样本。

可选的，在一些实施例中，所述训练单元具体用于：

根据所述正例样本以及所述负例样本对所述预设图像检测网络模型进行训练，得到所述正例样本以及所述负例样本的异常预测值；

获取所述正例样本以及所述负例样本的异常真实值，对所述异常真实值和所述异常预测值进行收敛，得到所述训练后的图像检测网络模型。

可选的，在一些实施例中，所述装置还包括：

发送单元，用于发送所述目标检测结果至显示终端，使得所述显示终端根据所述目标检测结果显示所述待检测物的类别信息以及所述待检测物的坐标信息。

另一方面，本申请还提供一种图像检测方法，具体包括：

采集待检测物的X光图像；

基于训练后的图像检测网络模型中的特征提取层对所述X光图像进行特征提取，得到N种不同尺度的特征图，所述特征提取层由基本卷积块组成，所述基本卷积块中融合有BN参数和Scale参数，所述N为大于1的整数；

基于所述图像检测网络模型中的残差预测层分别对所述N种不同尺度的特征图进行图像检测处理，得到N个检测结果，所述残差预测层中与预测块相连接的卷积核为1*1卷积核，所述预测块为所述残差预测层中的模块；

根据所述N个检测结果，确定所述待检测物的目标检测结果。

可选的，在一些实施例中，所述根据所述N个检测结果，确定所述待检测物的目标检测结果，包括：

可选的，在一些实施例中，所述采集待检测物的X光图像之前，所述方法还包括：

采集异常检测物的X光图像，得到正例样本；

采集非异常检测物的X光图像，得到负例样本；

根据所述正例样本以及所述负例样本对预设图像检测网络模型进行训练，得到所述训练后的图像检测网络模型。

可选的，在一些实施例中，所述采集异常检测物的X光图像，得到正例样本，包括：

所述采集非异常检测物的X光图像，得到负例样本，包括：

可选的，在一些实施例中，所述根据所述正例样本以及所述负例样本对预设图像检测网络模型进行训练，得到所述训练后的图像检测网络模型，包括：

可选的，在一些实施例中，所述目标检测结果包括所述待检测物的类别信息及坐标信息，所述根据所述N个检测结果，确定所述待检测物的目标检测结果之后，所述方法还包括：

发送所述目标检测结果至显示终端，使得所述显示终端根据所述目标检测结果显示所述待检测物的类别信息以及所述待检测物的坐标信息。

本申请的又一方面提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述各方面所述的方法。

此外，本申请实施例还提供一种存储介质，所述存储介质存储有多条指令，所述指令适于处理器进行加载，以执行本申请实施例提供的任一种图像检测方法中的步骤。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的图像检测网络模型的框架示意图；

图2是本申请实施例提供的图像检测方法的一种流程示意图；

图3是本申请实施例提供的特征提取层的框架示意图；

图4是本申请实施例提供的基本卷积块的框架示意图；

图5是本申请实施例中mrsa与Xavier参数初始化的试验实验结果对比图；

图6是本申请实施例提供的残差预测块的框架示意图；

图7是本申请实施例提供的图像检测方法的另一种流程示意图；

图8是本申请实施例提供的图像检测装置的一种结构示意图；

图9是本申请实施例提供的图像检测装置的另一种结构示意图；

图10是本申请实施例提供的服务器的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在以下的说明中，本申请的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明，除非另有述明。因此，这些步骤及操作将有数次提到由计算机执行，本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理单元的操作。此操作转换该数据或将其维持在该计算机的内存系统中的位置处，其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实体位置，其具有由该数据格式所定义的特定特性。但是，本申请原理以上述文字来说明，其并不代表为一种限制，本领域测试人员将可了解到以下的多种步骤及操作亦可实施在硬件当中。

本申请的原理使用许多其它泛用性或特定目的运算、通信环境或组态来进行操作。所熟知的适合用于本申请的运算系统、环境与组态的范例可包括(但不限于)手持电话、个人计算机、服务器、多处理器系统、微电脑为主的系统、主架构型计算机、及分布式运算环境，其中包括了任何的上述系统或装置。

本申请中的术语“第一”、“第二”和“第三”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。

本申请实施例提供一种图像处理方法、装置及存储介质，该图像处理装置可以集成在网络设备中，该网络设备可以是服务器，也可以是终端等设备，其中，该终端可以包括安检设备等设备。

请参阅图1，图1为本申请实施例提供的图像检测网络模型的一个框架示意图，其中，该图像检测网络模型包括特征提取层、残差预测层以及输出层，具体地:

特征提取层，用于对获取到的X光图像进行特征提取，得到N种不同尺度的特征图，该N为大于1的整数，其中，该特征提取层由基本卷积块组成，该基本卷积块中融合有BN参数和Scale参数；

残差预测层，用于分别对该N种不同尺度的特征图进行图像检测处理，得到N个检测结果，其中，该残差预测层中与预测块相连接的卷积核为1*1卷积核，该预测块为该残差预测层中的模块；

输出层，用于根据该N个检测结果，确定该待检测物的目标检测结果。

本申请实施例中，将从图像处理装置的角度进行描述，在一实施例中，提供了一种图像处理方法，该方法可以由图像处理装置的处理器执行，如图2所示，该图像处理方法的具体流程可以如下：

201、采集待检测物的X光图像。

其中，待检测物的X光图像可以通过位于安检机内的X光机生成。

在一场景实施例中，该安检机可以位于地铁站入口等重要公共场所中，当乘客进入地铁站之前，需要将随身行李等待检测物放入安检机内进行检查，此时，安检机会通过内部的X光机采集待检测物的X光图像。

在一些实施例中，该图像处理装置可以嵌入安检机中，或者为安检机，该装置可以通过安检机中的X光机获取待检测物的X光图像。

在另一些实施例中，该图像处理装置为位于安检机之外的装置，图像处理装置可以使用外接装置TX2或其他有线或无线装置与安检机相连接，此时，当安检机获取到了待检测物的X光图像之后，需要将该X光图像发送至图像处理装置中。

其中，该待检测物一般包括行李箱及行李箱里面的物品，手提包及手提包里面的物品，即待检测物一般同时有多个，且大小不一。

在一些实施例中，采集待检测物的X光图像之前，方法还包括：

a.采集异常检测物的X光图像，得到正例样本。

具体地，采集异常检测物经过透视变换处理的多个X光图像，得到正例样本，其中，异常检测物为违禁物品，例如不允许带入地铁站、高铁站等公共场所的物品，例如，酒精和刀具等。

透视变换是指利用透视中心、像点、目标点三点共线的条件，按透视旋转定律使透视面绕透视轴旋转某一角度，破坏原有的投影光线束，仍能保持承影面上投影几何图形不变的变换。由于X光图像在形成的过程中，不同X光射线的位置，所产生的X光图像有很大不同，通过透视变换，可以模拟不同X光射线的位置，可以很大程度增加数据的多样性。

此外，在正例样本采集的过程中，还可以对样本进行翻转、裁剪、旋转等方式丰富样本。

b.采集非异常检测物的X光图像，得到负例样本。

具体地，可以采集非异常检测物经过透视变换处理的多个X光图像，得到负例样本。

此外，在负例样本采集的过程中，还可以对样本进行翻转、裁剪、旋转等方式丰富样本。

其中，为了增加检测的准确率，可以采集一些与正例样本外形相似的物体作为负例样本，例如，纽扣电池的X光图像为正例样本，此时可以采集与纽扣电池外形相似的衣物纽扣的X光图像作为负例样本。

c.根据正例样本以及负例样本对预设图像检测网络模型进行训练，得到训练后的图像检测网络模型。

具体地，根据正例样本以及负例样本对预设图像检测网络模型进行训练，得到正例样本以及负例样本的异常预测值；然后获取正例样本以及负例样本的异常真实值，对异常真实值和异常预测值进行收敛，得到训练后的图像检测网络模型。

202、基于训练后的图像检测网络模型中的特征提取层对X光图像进行特征提取，得到N种不同尺度的特征图。

其中，在一实施例中，图像检测网络模型的结构可以如图1所示，该模型包括特征提取层、残差预测层以及输出层，其中，特征提取层提取N种不同尺度的特征图，N为大于1的整数，例如提取5种不同尺寸的特征图，该5中不同尺寸可以分别为19*19，10*10，5*5，3*3和1*1，为了减少计算，舍弃38*38大小的特征图；残差预测层包括多个残差预测块，残差预测块用于对不同尺度的特征图进行图像检测处理，输出层用于融合不同尺度的特征图对应的检测结果，得到目标检测结果。

其中，如图3所示，特征提取层由多个基本卷积块(Base Block)以及多个池化层(pool)组成。

其中，如图4所示，基本卷积块的结构可以采用两路卷积层，包括第一路卷积层以及第二路卷积层，其中，所述第一路卷积层包括一个M*M卷积核，所述第二路卷积层包括两个M*M卷积核，所述M为大于1的整数。

其中，M可以为3，即在基本卷积层的结构中，一路采用一个3*3的卷积核，生成感受视野较小的特征图，能够更好的学习小尺寸的目标(待检测物)，另一路采用两个3*3卷积核，生成感受视野较大的特征图，可以学习大尺寸的目标，更好的适应数据中物体之间尺寸差异大的特点，提高识别准确率。最终形成的特征，将经过两路卷积后的特征与上层特征直接进行concat连接，即保留了低层的网络特征，又提取了新的语义特征，即避免了数据的损失，又学习到了更高阶的特征。

又如图4所示，在每个基本卷积块中的卷积(Convolution)后加入BatchNorm(BN)+Scale+ReLU操作，在使用激活函数ReLU前，加入BatchNorm+Scale操作实现批量归一化，即将BatchNorm+Scale的线性变换参数融合到卷积中，提高模型的检测速度。

其中，卷积块参数设置如下：

因为在后面的BatchNorm层中会减去平均值，所以在Convolution层设置bias_term并没有意义，默认设置bias_term为true，且默认bias_filler为constant，value为0。在这里设置bias_term：false。

其中，在网络训练过程中，由于参数不断改变导致后面的每一层输入的分布也发生变化，而学习的过程又要使每一层适应输入的分部，从而不得不降低学习率。BatchNorm就是在网络训练过程中使得每一层神经网络的输入保持相同分部，使其保持均值为0，方差为1的标准正态分部，使得非线性变换函数的输入值落入对输入比较敏感的区域，以此避免梯度消失问题，产生的梯度变大也意味着学习收敛速度加快。

然而，如果每层神经网络，都通过BN层，则需要将非线性函数替换成线性函数的效果，Scale是将BatchNorm得到的数据进行线性变换。BN操作之后，为了获得非线性，对变换后的数据进行Scale和Shift操作，使得数据分布介于线性与非线性之间，既能有非线性较强的表达能力，又避免太靠近非线性两边使得网络收敛速度太慢。

由于在推理BatchNorm非常耗时，本方案将BatchNorm+Scale的线性变换参数融合到卷积层。其中，

卷积层公式为：

Y＝W*X+B；

其中，W为卷积权重，B为卷积偏置。

BatchNorm层公式为：

其中，RunMean为滑动均值，RunStd为滑动方差，eps为一个较小数(防止分母为0)，Gamma为缩放因子，Beta为偏移。

将Conv和BatchNorm融合后，公式为：

融合后的卷积权重：

融合后的卷积偏置：

合并后的卷积：Y_{conv_new}＝w'*X+B'；

经过Conv+BatchNorm+Scale融合为一起后，在丝毫不影响检测精度的情况下，模型测试阶段速度有明显提高，可以迅速地根据X光图像得到检测结果。

网络初始化是一件非常重要的事情，传统的固定方差的高斯分布初始化在网络变深的时候，模型很难收敛，目前，常用的网络初始化方法为“Xavier”，Xavier可以根据输入和输出神经元的个数，自动地决定初始化值的大小，但Xavier在推导时假设激活函数是线性的，本方案使用的激活函数为ReLU，并不满足此条件，因此，本申请最终选择使用“mrsa”为参数初始化方法。

当只考虑输入个数时，mrsa初始化是一个均值为0，此时方差为

的高斯分布：

第l层卷积：y_l＝W_lX_l+b_l；

假设x和w独立，且各自的每个元素都同分布，n_l表示输入元素个数，x_l和w_l都表示单个元素，则其方差表示为：Var[y_l]＝n_lVar[w_lx_l]；

当权重w满足为0均值时，上述方差可以写为：

而针对ReLU激活函数：x_l＝f(y_l-1)，f为激活函数

带入之前的方差公式，则有：

为了使得每一层数据的方差保持一致，则权重应该满足：

对于反向传播，可以进行同样的推导，不过因为反向，上述的n不再是输入个数，而是输出个数。mrsa可以更好帮助模型收敛，同时，通过实验证明，网络越深，mrsa初始化明显优于Xavier初始化，其中，mrsa与Xavier参数初始化实验结果对比如图5所示。

203、基于图像检测网络模型中的残差预测层分别对N种不同尺度的特征图进行图像检测处理，得到N个检测结果。

为了使特征更好地沿着图像检测网络模型传递，减少特征损失，在选取的N个特征图后加入了一个残差预测层，使特征更好传递下去，然后再对特征图进行最终的目标分类(类别信息)和坐标框回归(坐标信息)。

其中，残差预测层中包括N个残差预测块(ResBlock)，每个残差预测块分别对不同尺度的特征图(Feature Map)进行图像检测处理，残差预测块的详细结构如图6所示，通过实验证明，使用1*1的卷积核与使用3*3的卷积核，其生成的最终模型的准确率几乎相同，而使用1*1的卷积核，则会大大的减少计算成本，因此在ResBlock结构中，将传统最后的3*3卷积核，替换成1*1卷积核，即此时，残差预测层中与预测块相连接的卷积核为1*1卷积核，其中，预测块为所述残差预测层中的模块，用于根据获取到的特征进行结果预测，具体地，预测块可以为全连接层。

其中，本申请图像检测网络模型中的损失函数包括类别损失与目标框回归损失，公式可以如下：

其中，L_cls为类别的损失函数，L_reg为目标框的损失函数，

与

代表真实的类别与目标框位置，p_i与t_i为预测的类别与目标框位置，λ为损失权重，N为每个minibatch的数量。

其中：

在目标框回归过程中通常采用SmoothL1为损失函数，公式如下，

通常情况下，β为固定值，取值为1，为了使得目标框的位置信息更加鲁棒，本申请利用每个minibatch的均值和方差，以及冲量momentum＝0.9更新β参数，使其自适应于数据，公式如下，自适应SmoothL1loss，

μ_R＝μ_R*m+μ_B(1-m)；

σ_R ²＝σ_R ²*m+σ_B ²(1-m)；

当通过残差预测层中的N个残差预测块分别对N个不同尺度的特征图进行了图像检测处理之后，将得到N个不同的特征图分别对应的检测结果，即得到N个检测结果。

在一些实施例中，该检测结果包括不同尺寸的特征图对应的检测物的类别信息及坐标信息。具体地，该类别信息可以包括异常检测物类别以及非异常检测物类别，也可以是具体的检测物类别，例如刀具、汽油等。

204、根据N个检测结果，确定待检测物的目标检测结果。

由于每个检测结果所对应的检测结果不同，例如，19*19尺寸的特征图对对应的是体积比较小的检测物的检测结果，1*1尺寸的特征图对应的是体积比较大的检测物的检测结果。

当得到这N个检测结果之后，将融合这N个检测结果，确定待检测物的目标检测结果。

在一些实施例中，可以通过图像检测网络模型中的输出层融合这N个检测结果，确定待检测物的目标检测结果。

在一些实施例中，当确定了待检测物的目标检测结果之后，将会对该目标检测结果进行非极大值抑制算法(Non-maximum suppression，NMS)处理，用于去除目标检测结果中重叠率大于阈值的坐标框，其中，该重叠率可以为80％，也可以为其他数值，具体此处不做限定。

在一些实施例中，当确定待检测物的目标检测结果之后，还需要发送目标检测结果至显示终端，使得显示终端根据目标检测结果显示待检测物的类别信息以及待检测物的坐标信息，此时，安检人员可以通过显示终端轻松得知待检测物中是否存在异常检测物以及异常检测物的坐标信息，其中，该坐标信息在显示终端可以以坐标框的形式表现出来。

在一些实施例中，该显示终端还可以为图像处理装置的一部分，当图像处理装置确定待检测物的目标检测结果之后，通过显示终端显示该目标检测结果。

在一些实施例中，当图像处理装置检测检测出待检测物中存在异常检测物时，可以发出警告，其中，该警告可以为声音警告，也可以为灯光警告，具体此处不做限定。

本申请实施例中，图像检测装置采集待检测物的X光图像；然后基于训练后的图像检测网络模型中的特征提取层对X光图像进行特征提取，得到N种不同尺度的特征图，其中，特征提取层由基本卷积块组成，基本卷积块中融合有BN参数和Scale参数，N为大于1的整数；再基于图像检测网络模型中的残差预测层分别对N种不同尺度的特征图进行图像检测处理，得到N个检测结果；最后根据N个检测结果，确定待检测物的目标检测结果。本实施例中的图像检测装置可以提取X光图像中的多种尺度的特征图，可以针对多种大小的检测物进行图像检测，故本方案可以根据X光图像进行待检测物的自动检测，且检测准确率高。

请参阅图7，图7为本申请实施例提供的图像处理方法的另一流程示意图，该实施例将从网络设备的角度进行描述，方法的具体流程可以如下：

701、网络设备采集异常检测物经过透视变换处理的多个X光图像，得到正例样本。

其中，异常检测物为违禁物品，例如不允许带入地铁站、高铁站等公共场所的物品，例如，酒精和刀具等。

702、网络设备采集非异常检测物经过透视变换处理的多个X光图像，得到负例样本。

703、网络设备根据正例样本以及负例样本对预设图像检测网络模型进行训练，得到训练后的图像检测网络模型。

其中，本申请实施例中的图像检测网络模型如图1所示，特征提取层的结构如图3所示，特征提取层中的基本卷积块的结构如图4所示，其中，本方案将BatchNorm+Scale的线性变换参数融合到卷积层，减少了模型的参数，可以加快模型的检测速度。此外，本申请实施例中图像检测网络模型中残差预测层中的残差预测块的结构如图6所示，在该结构中可以为分为两路，一路包括一个1*1的卷积核，另一路包括一个1*1的卷积核、一个3*3的卷积核以及一个1*1的卷积核，其中，这两路中与预测块相连接的卷积核均为1*1卷积核，这样可以减少计算成本，加快检测速度。

其中，本申请实施例使用“mrsa”为进行网络的初始化的方法，其收敛速度较其他初始化方法的收敛速度快，例如比“Xavier”初始化方法的收敛速度快。

704、网络设备采集待检测物的X光图像。

705、网络设备基于训练后的图像检测网络模型中的特征提取层对X光图像进行特征提取，得到5种不同尺度的特征图。

其中，这5中不同尺寸的特征图可以分别为19*19，10*10，5*5，3*3和1*1，为了减少计算，舍弃38*38大小的特征图。

其中，获取不同尺度的特征图的目的是针对不同体积的检测物进行更精准检测，提高检测的准确率。

706、网络设备基于图像检测网络模型中的残差预测层分别对5种不同尺度的特征图进行图像检测处理，得到5个检测结果。

其中，每个检测结果所对应的检测结果不同，例如，19*19尺寸的特征图对应的是体积比较小的检测物的检测结果，1*1尺寸的特征图对应的是体积比较大的检测物的检测结果。

其中，检测结果包括待检测物的类别信息及坐标信息，该类别信息可以包括异常检测物类别以及非异常检测物类别，也可以是具体的检测物类别，例如刀具、汽油等。

具体地，网络设备根据5个检测结果得到不同尺度的特征图分别对应的不同尺度的待检测物的检测结果。

707、网络设备根据上述5个检测结果，确定目标检测结果。

当得到这5个检测结果之后，将融合这5个检测结果，确定待检测物的目标检测结果。

在一些实施例中，可以通过图像检测网络模型中的输出层融合这5个检测结果，确定待检测物的目标检测结果。

在一些实施例中，当确定了待检测物的目标检测结果之后，将会对该目标检测结果进行NMS处理，用于去除目标检测结果中重叠率大于阈值的坐标框，其中，该重叠率可以为80％，也可以为其他数值，具体此处不做限定。

在一些实施例中，该显示终端还可以为网络设备的一部分，当图像处理装置确定待检测物的目标检测结果之后，通过显示终端显示该目标检测结果。

本申请实施例中，网络设备采集待检测物的X光图像；然后基于训练后的图像检测网络模型中的特征提取层对X光图像进行特征提取，得到5种不同尺度的特征图，其中，特征提取层由基本卷积块组成，基本卷积块中融合有BN参数和Scale参数；再基于图像检测网络模型中的残差预测层分别对N种不同尺度的特征图进行图像检测处理，得到5个检测结果；最后根据5个检测结果，确定待检测物的目标检测结果。本实施例中的网络设备可以提取X光图像中的多种尺度的特征图，可以针对多种大小的检测物进行图像检测，故本方案可以根据X光图像进行待检测物的自动检测，且检测准确率高。

为了更好地实施本申请实施例提供的图像检测方法，本申请实施例还提供一种图像检测装置，该图像检测装置具体可以集成在服务器中。其中名词的含义与上述文本识别方法中相同，具体实现细节可以参考方法实施例中的说明。

请参阅图8，图8为本申请实施例提供的图像检测装置的结构示意图，该图像检测装置包括：

第一采集单元801，用于采集待检测物的X光图像；

提取单元802，用于基于训练后的图像检测网络模型中的特征提取层对所述X光图像进行特征提取，得到N种不同尺度的特征图，所述特征提取层由基本卷积块组成，所述基本卷积块中融合有BN参数和Scale参数，所述N为大于1的整数；

检测单元803，用于基于所述图像检测网络模型中的残差预测层分别对所述N种不同尺度的特征图进行图像检测处理，得到N个检测结果；

确定单元804，用于根据所述N个检测结果，确定所述待检测物的目标检测结果。

在一些实施例中，所述确定单元804具体用于：

请参阅图9，在一些实施例中，所述装置还包括：

第二采集单元805，用于采集异常检测物的X光图像，得到正例样本；

第三采集单元806，用于采集非异常检测物的X光图像，得到负例样本；

训练单元807，用于根据所述正例样本以及所述负例样本对预设图像检测网络模型进行训练，得到所述训练后的图像检测网络模型。

在一些实施例中，所述第二采集单元805具体用于：

在一些实施例中，所述第三采集单元806具体用于：

采集所述非异常检测物经过透视变换处理的多个X光图像，得到所述负例样本；

在一些实施例中，所述训练单元807具体用于：

在一些实施例中，所述装置还包括：

发送单元807，用于发送所述目标检测结果至显示终端，使得所述显示终端根据所述目标检测结果显示所述待检测物的类别信息以及所述待检测物的坐标信息。

在一些实施例中，所述残差预测层中与预测块相连接的卷积核为1*1卷积核，所述预测块为所述残差预测层中的模块，所述基本卷积块包括第一路卷积层以及第二路卷积层，所述第一路卷积层包括一个M*M卷积核，所述第二路卷积层包括两个M*M卷积核，所述M为大于1的整数。

本申请实施例中，第一采集单元801采集待检测物的X光图像；然后提取单元802基于训练后的图像检测网络模型中的特征提取层对X光图像进行特征提取，得到N种不同尺度的特征图，其中，特征提取层由基本卷积块组成，基本卷积块中融合有BN参数和Scale参数，N为大于1的整数；检测单元803再基于图像检测网络模型中的残差预测层分别对N种不同尺度的特征图进行图像检测处理，得到N个检测结果；最后确定单元804根据N个检测结果，确定待检测物的目标检测结果。本实施例中的图像检测装置可以提取X光图像中的多种尺度的特征图，可以针对多种大小的检测物进行图像检测，故本方案可以根据X光图像进行待检测物的自动检测，且检测准确率高。

参考图10，本申请实施例提供了一种服务器1000，可以包括一个或者一个以上处理核心的处理器1001、一个或一个以上计算机可读存储介质的存储器1002、射频(RadioFrequency，RF)电路1003、电源1004、输入单元1005、以及显示单元1006等部件。本领域技术人员可以理解，图10中示出的服务器结构并不构成对服务器的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器1001是该服务器的控制中心，利用各种接口和线路连接整个服务器的各个部分，通过运行或执行存储在存储器1002内的软件程序和/或模块，以及调用存储在存储器1002内的数据，执行服务器的各种功能和处理数据，从而对服务器进行整体监控。可选的，处理器1001可包括一个或多个处理核心；优选的，处理器1001可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器1001中。

存储器1002可用于存储软件程序以及模块，处理器1001通过运行存储在存储器1002的软件程序以及模块，从而执行各种功能应用以及数据处理。

RF电路1003可用于收发信息过程中，信号的接收和发送。

服务器还包括给各个部件供电的电源1004(比如电池)，优选的，电源可以通过电源管理系统与处理器1001逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

该服务器还可包括输入单元1005，该输入单元1005可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

该服务器还可包括显示单元1006，该显示单元1006可用于显示由用户输入的信息或提供给用户的信息以及服务器的各种图形用户接口，这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。具体在本实施例中，服务器中的处理器1001会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器1002中，并由处理器1001来运行存储在存储器1002中的应用程序，从而实现各种功能，如下：

采集待检测物的X光图像；

基于所述图像检测网络模型中的残差预测层分别对所述N种不同尺度的特征图进行图像检测处理，得到N个检测结果；

根据所述N个检测结果，确定所述待检测物的目标检测结果。

由上可知，本申请实施例中，图像检测装置采集待检测物的X光图像；然后基于训练后的图像检测网络模型中的特征提取层对X光图像进行特征提取，得到N种不同尺度的特征图，其中，特征提取层由基本卷积块组成，基本卷积块中融合有BN参数和Scale参数，N为大于1的整数；再基于图像检测网络模型中的残差预测层分别对N种不同尺度的特征图进行图像检测处理，得到N个检测结果；最后根据N个检测结果，确定待检测物的目标检测结果。本实施例中的图像检测装置可以提取X光图像中的多种尺度的特征图，可以针对多种大小的检测物进行图像检测，故本方案可以根据X光图像进行待检测物的自动检测，且检测准确率高。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本申请实施例提供一种存储介质，其中存储有多条指令，该指令能够被处理器进行加载，以执行本申请实施例所提供的任一种图像检测方法中的步骤。例如，该指令可以执行如下步骤：

采集待检测物的X光图像；

根据所述N个检测结果，确定所述待检测物的目标检测结果。

以上各个操作的具体实施可参见前面的实施例，在此不再赘述。

其中，该存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、磁盘或光盘等。

由于该存储介质中所存储的指令，可以执行本申请实施例所提供的任一种图像检测方法中的步骤，因此，可以实现本申请实施例所提供的任一种图像检测方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

以上对本申请实施例所提供的一种图像检测网络模型、装置、方法、及存储介质进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种图像检测网络模型，其特征在于，所述图像检测网络模型包括特征提取层、残差预测层以及输出层:

2.根据权利要求1所述的图像检测网络模型，其特征在于，所述基本卷积块包括第一路卷积层以及第二路卷积层，所述第一路卷积层包括一个M*M卷积核，所述第二路卷积层包括两个M*M卷积核，所述M为大于1的整数。

3.一种图像检测装置，其特征在于，包括：

第一采集单元，用于采集待检测物的X光图像；

4.根据权利要求3所述的装置，其特征在于，所述确定单元具体用于：

5.根据权利要求3所述的装置，其特征在于，所述装置还包括：

6.根据权利要求5所述的装置，其特征在于，所述第二采集单元具体用于：

所述第三采集单元具体用于：

7.根据权利要求5所述的装置，其特征在于，所述训练单元具体用于：

8.根据权利要求3至7中任一项所述的装置，其特征在于，所述装置还包括：

9.根据权利要求3至7中任一项所述的装置，其特征在于，所述基本卷积块包括第一路卷积层以及第二路卷积层，所述第一路卷积层包括一个M*M卷积核，所述第二路卷积层包括两个M*M卷积核，所述M为大于1的整数。

10.一种图像检测方法，其特征在于，包括：

采集待检测物的X光图像；

根据所述N个检测结果，确定所述待检测物的目标检测结果。

11.根据权利要求10所述的方法，其特征在于，所述根据所述N个检测结果，确定所述待检测物的目标检测结果，包括：

12.根据权利要求10所述的方法，其特征在于，所述采集待检测物的X光图像之前，所述方法还包括：

采集异常检测物的X光图像，得到正例样本；

采集非异常检测物的X光图像，得到负例样本；

13.根据权利要求12所述的方法，其特征在于，所述采集异常检测物的X光图像，得到正例样本，包括：

所述采集非异常检测物的X光图像，得到负例样本，包括：

14.根据权利要求12所述的方法，其特征在于，所述根据所述正例样本以及所述负例样本对预设图像检测网络模型进行训练，得到所述训练后的图像检测网络模型，包括：

15.一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行如权利要求10至14中任一项所述的图像检测中的步骤。

16.一种存储介质，其特征在于，所述存储介质存储有多条指令，所述指令适于处理器进行加载，以执行权利要求10至14中任一项所述的图像检测中的步骤。