CN110334676B

CN110334676B - 一种在局部复原的模糊图片上基于特征描述子比对的小目标检测方法

Info

Publication number: CN110334676B
Application number: CN201910625987.9A
Authority: CN
Inventors: 朱顺意; 范继辉; 瞿明军; 李广立; 刘雪健; 周莉; 巩志远; 陈建学; 杜来民; 邓国超; 白玥寅; 张松; 周雨晨
Original assignee: Shandong Lingneng Electronic Technology Co ltd; Taiyuan University of Technology; Shandong University
Current assignee: Shandong Lingneng Electronic Technology Co ltd; Taiyuan University of Technology; Shandong University
Priority date: 2019-07-11
Filing date: 2019-07-11
Publication date: 2023-06-30
Anticipated expiration: 2039-07-11
Also published as: CN110334676A

Abstract

本发明涉及一种在局部复原的模糊图片上基于特征描述子比对的小目标检测方法，属于目标检测技术领域，包括以下步骤：(1)准备车辆数据集，所述车辆数据集包含有经过四点车前窗对齐算法对齐过的模糊车辆图片；(2)使用降噪算法对车辆数据集中的图片进行降噪处理；(3)通过插值函数对图片进行局部超分辨率复原，目标区域为对齐后的前车窗；(4)对复原后的图片进行特征检测，提取特征描述子；(5)通过特征描述子比对判断是否存在小目标。本发明采用局部复原有效减少了计算量，且提高了小目标检测的准确率,为交通领域检测车年检标和安全带的有无提供了一种切实可行的方法。

Description

一种在局部复原的模糊图片上基于特征描述子比对的小目标检测方法

技术领域

本发明涉及一种在局部复原的模糊图片上基于特征描述子比对的小目标检测方法，属于目标检测技术领域。

背景技术

小目标检测技术在当今许多领域中得到了广泛的应用，如在交通领域中对车辆是否贴有年检标、是否系安全带的检测等等。但是，交通监控摄像头所处位置较高，采集到的图片清晰度有限，且受恶劣天气如大雾、沙尘等影响明显，所拍摄的图片较为模糊，传统的目标检测方法效果较差。因此，研究模糊图片上的小目标检测算法是十分必要的。

然而，模糊小目标检测在实际应用中面临着许多的困难。首先，小目标的分辨率低，形状简单，轮廓粗糙，因此和大目标相比，小目标的检测率低。其次，小目标常常隐藏在复杂的背景中，用传统的图像处理方法往往难以得到理想效果。第三，图像经常受噪声干扰，令检测的难度变大。

目前，针对模糊小目标检测的算法主要有：(1)利用视觉注意机制的小目标检测算法；(2)利用相邻像素进行噪声抑制的小目标检测算法；(3)改进的目标识别网络，如SSD和YOLO。但上述算法仅对图片进行了初步的处理，如噪声抑制等，未能有效提取图片信息。对于改进的深度学习下的目标识别网络，算法计算量大，运行所需的时间长且对于模糊小目标的识别率提高不明显。

本发明在对图片进行降噪的基础上，引入超分辨率复原。超分辨率技术(Super-Resolution)是指从观测到的低分辨率图像重建出相应的高分辨率图像，对于提高模糊图片上小目标的识别率有明显作用。但是超分辨率复原所需计算量较大，而车辆年检标和安全带的检测仅在车窗区域，因此有大量的无效计算。

发明内容

针对现有技术的不足，本发明提供一种在局部复原的模糊图片上基于特征描述子比对的小目标检测方法，局部复原有效减少了计算量，且提高了小目标检测的准确率,为交通领域检测车年检标和安全带的有无提供了一种切实可行的方法。

本发明采用以下技术方案：

一种在局部复原的模糊图片上基于特征描述子比对的小目标检测方法，包括以下步骤：

(1)准备车辆数据集，所述车辆数据集包含有经过四点车前窗对齐算法对齐过的模糊车辆图片；

(2)使用降噪算法对车辆数据集中的图片进行降噪处理；

(3)通过插值函数对图片进行局部超分辨率复原，目标区域为对齐后的前车窗；

(4)对复原后的图片进行特征检测，提取特征描述子；

(5)通过特征描述子比对判断是否存在安全带、车年检标等小目标。

本发明解决了模糊图片上小目标检测中存在的准确率低的问题，有效提升了小目标识别的泛化能力和准确率。

优选的，步骤(1)中，此处的车辆数据集为多张车脸图像，需要保证采集的车辆图像包含车脸且具有尺度、场景的变化，即各张车脸所对应的尺度、场景应该有所不同，不能全部一样，通过改进版的MTCNN算法进行车辆对齐，得到车前窗左下角、右下角，车头左下角、右下角四个点的坐标，即收集车脸四角在图像中的位置信息。

此处改进版的MTCNN算法具体为：

1)将车辆数据集划分为训练集和测试集，使用LabelImg工具标注训练数据集；进一步为：

将车辆数据集划分为训练集和测试集，可随机划分，划分比例优选为：训练集占90％，测试集占10％，下载并安装LabelImg工具，将类别文件中的值改为car，考虑到车脸的对称性，选取车前窗左下角、右下角，车头左下角、右下角为特征点，对训练集中的车辆图像标注(可采用LabelImg工具手动标注)车前窗左下角、右下角，车头左下角、右下角，共四个特征点，即收集车脸四角在图像中的位置信息。

2)MTCNN算法模型是现有的用于处理人脸对齐的模型，其工作原理，本发明修改MTCNN算法中的图像读取文件，更改特征点数量，将原本读取5个特征点更改为读取4个特征点；进一步为：

修改MTCNN算法模型中的图像读取label.xml标签文件的函数，通过函数读取特征点向量列表，即lable.xml，将读取到的的特征点向量列表的第7、8位删除(读取函数在修改后会自动在读取后将第7、8位删除)，即删除第五个点的坐标数据，更改特征点个数为4。

3)训练MTCNN算法模型，使用标注后的训练集中的图像进行算法模型的训练，得到训练后的MTCNN算法模型，训练过程可参考现有技术进行。

4)指定目标图片并使用resize()构建图像金字塔，进一步为指定目标图像，即指定测试集中的一张图像(或其他来源的包含车脸的图片)进行算法模型的应用验证；

对给定的车辆图像，使用resize()函数将其缩放到不同尺度形成图像金字塔，以适应不同大小的车脸。本发明的图像金字塔中，可以在代码中人为指定最大和最小尺寸，最小为20×20，最大为100×100，单位为像素，分辨率无要求。

5)将图像金字塔导入MTCNN算法模型，经过P-Net进行第一级处理；进一步为：

将图像金字塔导入MTCNN算法模型，首先经过P-Net，通过一个全卷积神经网络(FCN)进行初步特征提取，生成预测窗和边框回归向量(bounding box regressionvectors)，使用边框回归(Bounding-box regression)的方法来校正预测窗，并使用非极大值抑制(NMS)的方法来校正这些预测窗，合并重叠的预测窗。

6)P-Net的输出结果进入R-Net进行第二级处理；进一步为：

P-Net的输出结果经过resize()函数修改大小(即缩放，可修改为24×24×3，单位为像素)后输入R-Net，R-Net的基本构造比P-Net增加了一个全连接层，用以滤除大量效果较差的预测窗，最后对选定的预测窗进行边框回归(Bounding-box regression)和非极大值抑制(NMS)进一步优化预测结果。

7)R-Net的输出结果进入O-Net进行第三级处理，识别出车脸边框及特征点；进一步为：

R-Net的输出结果经过resize()函数修改大小(即缩放，可修改为48×48×3，单位为像素)后输入O-Net，O-Net的基本构造比R-Net增加了一个卷积层，通过更多的监督学习来识别车脸区域，并对四个特征点进行回归，输出四个特征点，同时对选定的预测窗进行边框回归(Bounding-box regression)和非极大值抑制进一步优化预测结果，输出最终预测窗和4个特征点，即得到车前窗左下角、右下角，车头左下角、右下角四个点的坐标。

MTCNN算法是基于深度卷积网络的算法，有别于传统的计算机视觉算法，MTCNN算法经过若干次卷积计算，池化计算后，通过全连接层输出结果，本发明中，经过修改的改进版MTCNN中，经过全连接层可以输出4个点的坐标。

优选的，步骤(2)中，根据步骤(1)中车前窗的四个点的坐标，对图片中所匹配的车前窗区域进行方位与数值判断，判断出目标区域方位，对车前窗区域进行对齐与矫正操作，保证每一张待测图片中的目标区域的位置基本保持恒定，对前车窗区域进行降噪处理。

优选的，步骤(2)中，由于前车窗区域为类四边形，通过车前窗四个点的横坐标与纵坐标的数值大小关系，判断出目标区域方位。

优选的，对前车窗区域进行对齐和矫正时优选采用仿射变换，能够在保证原图像平直性的情况下矫正图片倾角条件相对较差的图像，仿射变换包括平移、缩放、剪切、旋转、错切等及其一种或多种组合。

如：由于类四边形有四个点，左上角点命名为A，右上角点命名为B，左下角点命名为C，右下角点命名为D。对于任意高空监控摄像头正中图像，ABCD趋近于等腰梯形，其中AB趋近平行于CD且∠ACD约等于∠BDC所以，对于以下不同情况，具体为

1：当∠ACD>∠BDC时，此情况为汽车左倾(以看图人的视角来看，而非司机视角)，需对其进行水平方向错切处理；

2：同理当∠ACD<∠BDC时，此情况为汽车右倾，也需要进行水平方向错切，调整ABCD为等腰梯形。

其他仿射变换方式均为较为常规的方法，此处不再赘述。

优选的，降噪处理优选采用现有的空间滤波、变换域滤波或形态学噪声滤波器等，降噪处理现有技术已比较成熟，此处不再赘述。

优选的，步骤(3)中，限定超分辨率复原的区域为车前窗区域，对降噪处理后的车辆图片，通过插值函数对前车窗区域进行局部超分辨率复原，插值函数包括但不限于二次插值、双三次插值的传统机器学习算法及深度学习算法。

插值是在离散数据的基础上补插连续函数，使得这条连续曲线通过全部给定的离散数据点，插值是离散函数逼近的重要方法，由于图像为离散数据的矩阵，对图像采用图像插值方式复原是除卷积神经网络图像复原外适用性最广的办法，通常插值包括二次插值，三次插值，双三次插值等。

优选的，步骤(4)中，限定特征描述子提取的区域为车前窗，通过对原图像添加限制条件，可根据前车窗四点区域进行定位，限制检测区域为类四边形区域，及前挡风玻璃区域，使原图像特定区域作为待测区域，添加方式为根据坐标进行原图裁剪的方式。

进一步优选的，步骤(4)中，使用特征检测算法对车前窗区域进行特征检测，所述特征描述子包括但不限于SIF、SURF和LBP，可根据实际需要灵活选择，具体方法可参见现有技术。

进一步优选的，步骤(5)中，判断是否存在小目标的方式为：预先提取大量小目标的特征描述子，并将特征描述子提前写入内存中，并设定最小阈值，将待测图片中提取到的特征描述子，与预先提取并写入内存的特征描述子进行度量比较，度量比较方式包括但不限于曼哈顿距离比较和欧几里得距离比较，若其度量比较结果小于所设定阈值，则判定当前特征描述子所代表的特征存在，否则反之。

另外，本发明未详尽之处，均可采用现有技术进行。

本发明的有益效果为：

本发明在对图片进行降噪的基础上，引入超分辨率复原，有效提高了模糊小目标检测的准确率并且限制超分辨复原的区域，实现局部复原，有效减少计算量。通过特征描述子比对来判断车年检标和安全带的有无，计算速度快，准确率高。

本发明解决了模糊图片上小目标检测的问题，高了小目标检测的的精度,为交通领域检测车年检标和安全带的有无提供了一种切实可行的方法。

附图说明

图1为本发明的在局部复原的模糊图片上基于特征描述子比对的小目标检测方法的流程示意图；

图2为以某一车脸图像为例，采用LabelImg工具标注车前窗左下角、右下角，车头左下角、右下角，共四个特征点位置示意图一；

图3为以某一车脸图像为例，采用LabelImg工具标注车前窗左下角、右下角，车头左下角、右下角，共四个特征点位置示意图一；

图4为MTCNN工作原理示意图；

图5为高空监控摄像头拍摄的前车窗区域为正中图像场景示意图；

图6为位于侧面的监控摄像头拍摄的前车窗区域场景示意图；

图7为某一实施例中预设的三个文件夹；

图8为图7中文件夹中某一安全带图片；

图9为图7中文件夹中某一车年检标图片；

图10为图7中文件夹中某一安全标志图片；

图11为某一实施例中的私家车图片。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述，但不仅限于此，本发明未详尽说明的，均按本领域常规技术。

实施例1：

一种在局部复原的模糊图片上基于特征描述子比对的小目标检测方法，如图1所示，包括以下步骤：

(2)使用降噪算法对车辆数据集中的图片进行降噪处理；

(4)对复原后的图片进行特征检测，提取特征描述子；

实施例2：

一种在局部复原的模糊图片上基于特征描述子比对的小目标检测方法，方法如实施例1所示，所不同的是，步骤(1)中，此处的车辆数据集为多张车脸图像，需要保证采集的车辆图像包含车脸且具有尺度、场景的变化，即各张车脸所对应的尺度、场景应该有所不同，不能全部一样，通过改进版的MTCNN算法进行车辆对齐，得到车前窗左下角、右下角，车头左下角、右下角四个点的坐标，即收集车脸四角在图像中的位置信息。

此处改进版的MTCNN算法具体为：

将车辆数据集划分为训练集和测试集，可随机划分，划分比例优选为：训练集占90％，测试集占10％，下载并安装LabelImg工具，将类别文件中的值改为car，考虑到车脸的对称性，选取车前窗左下角、右下角，车头左下角、右下角为特征点，对训练集中的车辆图像标注(可采用LabelImg工具手动标注)车前窗左下角、右下角，车头左下角、右下角，共四个特征点，即收集车脸四角在图像中的位置信息，如图2、图3所示。

2)MTCNN算法模型是现有的用于处理人脸对齐的模型，其工作原理如图4所示，本发明修改MTCNN算法中的图像读取文件，更改特征点数量，将原本读取5个特征点更改为读取4个特征点；进一步为：

6)P-Net的输出结果进入R-Net进行第二级处理；进一步为：

实施例3：

一种在局部复原的模糊图片上基于特征描述子比对的小目标检测方法，方法如实施例2所示，所不同的是，步骤(2)中，根据步骤(1)中车前窗的四个点的坐标，对图片中所匹配的车前窗区域进行方位与数值判断，判断出目标区域方位，对车前窗区域进行对齐与矫正操作，保证每一张待测图片中的目标区域的位置基本保持恒定，对前车窗区域进行降噪处理。

如：由于类四边形有四个点，左上角点命名为A，右上角点命名为B，左下角点命名为C，右下角点命名为D。对于任意高空监控摄像头正中图像，如图5所示，ABCD趋近于等腰梯形，其中AB趋近平行于CD且∠ACD约等于∠BDC所以，对于以下不同情况，具体为

1：当∠ACD>∠BDC时，如图6所示，此情况为汽车左倾(以看图人的视角来看，而非司机视角)，需对其进行水平方向错切处理；

其他仿射变换方式均为较为常规的方法，此处不再赘述。

优选的，降噪处理优选采用现有的空间滤波、变换域滤波或形态学噪声滤波器，降噪处理现有技术已比较成熟，此处不再赘述。

实施例4：

一种在局部复原的模糊图片上基于特征描述子比对的小目标检测方法，包括：

1)预设三个文件夹，分别是安全标志，安全带，车年检标，如图7所示，三个文件夹分别由安全带、车年检标、安全标志的图片组成，如图8、9、10，每一个文件夹有10张图片，并对每一个图片使用SURF算法提取特征描述子；

(2)准备车辆数据集，数据集为多辆经过改进版MTCNN对齐后的车辆图像，图11为其中一张私家车图片；

(3)使用中值滤波器降噪算法处理图片的椒盐噪声，使用低通滤波器降噪算法处理图片的高斯噪声；

(4)采用改进版的MTCNN对齐后的图片，会自动输出车前窗的四个角坐标，根据坐标确定车前窗为目标区域，通过双三次插值对图片的目标区域进行局部超分辨率复原。

(5)对复原后的目标区域使用SURF算法提取特征描述子；

(6)与安全带文件夹下10张图片进行特征描述子比对，对于预设的文件夹中的每一张图片，如果有四个或以上的特征点匹配，则该图片符合要求，每有一张图片符合要求，安全带得分加1，得分大于5则判定为存在，其中，图11的图片得分1，判定不存在；

与车年检标文件夹下的10张图对比，有9个图片符合，得分为9，判定存在；

与安全标志文件夹下的10张图对比，有10个图片符合，得分为10，判定存在。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明所述原理的前提下，还可以作出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种在局部复原的模糊图片上基于特征描述子比对的小目标检测方法，其特征在于，包括以下步骤：

（1）准备车辆数据集，所述车辆数据集包含有经过四点车前窗对齐算法对齐过的模糊车辆图片；

（2）使用降噪算法对车辆数据集中的图片进行降噪处理；

（3）通过插值函数对图片进行局部超分辨率复原，目标区域为对齐后的前车窗；

（4）对复原后的图片进行特征检测，提取特征描述子；

（5）通过特征描述子比对判断是否存在小目标；

步骤（1）中，车辆数据集所采集的模糊车辆图像具有尺度、场景的变化，通过改进版的MTCNN算法进行车辆对齐，得到车前窗左下角、右下角，车头左下角、右下角四个点的坐标，即收集车脸四角在图像中的位置信息；

改进版的MTCNN算法具体为：

1）将车辆数据集划分为训练集和测试集，使用LabelImg工具标注训练数据集；进一步为：

将车辆数据集划分为训练集和测试集，可随机划分，划分比例为：训练集占90%，测试集占10%，下载并安装LabelImg工具，将类别文件中的值改为car，考虑到车脸的对称性，选取车前窗左下角、右下角，车头左下角、右下角为特征点，对训练集中的车辆图像标注车前窗左下角、右下角，车头左下角、右下角，共四个特征点，即收集车脸四角在图像中的位置信息；

2）修改MTCNN算法中的图像读取文件，更改特征点数量，将原本读取5个特征点更改为读取4个特征点；进一步为：

修改MTCNN算法模型中的图像读取label.xml标签文件的函数，通过函数读取特征点向量列表，即lable.xml，将读取到的的特征点向量列表的第7、8位删除，即删除第五个点的坐标数据，更改特征点个数为4；

3）训练MTCNN算法模型，使用标注后的训练集中的图像进行算法模型的训练，得到训练后的MTCNN算法模型；

4）指定目标图片并使用resize()构建图像金字塔，进一步为指定目标图像，即指定测试集中的一张图像进行算法模型的应用验证；

对给定的车辆图像，使用resize()函数将其缩放到不同尺度形成图像金字塔，以适应不同大小的车脸；图像金字塔中，最小尺寸为20×20，最大尺寸为100×100，单位为像素，分辨率无要求；

5）将图像金字塔导入MTCNN算法模型，经过P-Net进行第一级处理；进一步为：

将图像金字塔导入MTCNN算法模型，首先经过P-Net，通过一个全卷积神经网络进行初步特征提取，生成预测窗和边框回归向量，使用边框回归的方法来校正预测窗，并使用非极大值抑制的方法来校正这些预测窗，合并重叠的预测窗；

6）P-Net的输出结果进入R-Net进行第二级处理；进一步为：

P-Net的输出结果经过resize()函数修改大小后输入R-Net，R-Net的基本构造比P-Net增加了一个全连接层，用以滤除大量效果较差的预测窗，最后对选定的预测窗进行边框回归和非极大值抑制进一步优化预测结果；

7）R-Net的输出结果进入O-Net进行第三级处理，识别出车脸边框及特征点；进一步为：

R-Net的输出结果经过resize()函数修改大小后输入O-Net，O-Net的基本构造比R-Net增加了一个卷积层，通过更多的监督学习来识别车脸区域，并对四个特征点进行回归，输出四个特征点，同时对选定的预测窗进行边框回归和非极大值抑制进一步优化预测结果，输出最终预测窗和4个特征点，即得到车前窗左下角、右下角，车头左下角、右下角四个点的坐标；

步骤（2）中，根据步骤（1）中车前窗的四个点的坐标，对图片中所匹配的车前窗区域进行方位与数值判断，对车前窗区域进行对齐与矫正操作，保证每一张待测图片中的目标区域的位置保持恒定，对前车窗区域进行降噪处理；

降噪处理采用现有的空间滤波、变换域滤波或形态学噪声滤波器；

步骤（3）中，限定超分辨率复原的区域为车前窗区域，对降噪处理后的车辆图片，通过插值函数对前车窗区域进行局部超分辨率复原，插值函数包括但不限于二次插值、双三次插值的传统机器学习算法及深度学习算法；

步骤（5）中，判断是否存在小目标的方式为：预先提取大量小目标的特征描述子，并将特征描述子提前写入内存中，并设定最小阈值，将待测图片中提取到的特征描述子，与预先提取并写入内存的特征描述子进行度量比较，度量比较方式包括但不限于曼哈顿距离比较和欧几里得距离比较，若其度量比较结果小于所设定阈值，则判定当前特征描述子所代表的特征存在，否则反之。

2.根据权利要求1所述的在局部复原的模糊图片上基于特征描述子比对的小目标检测方法，其特征在于，步骤（2）中，由于前车窗区域为类四边形，通过车前窗四个点的横坐标与纵坐标的数值大小关系，判断出目标区域方位。

3.根据权利要求2所述的在局部复原的模糊图片上基于特征描述子比对的小目标检测方法，其特征在于，对前车窗区域进行对齐和矫正时采用仿射变换，能够在保证原图像平直性的情况下矫正图片倾角条件差的图像，仿射变换包括平移、缩放、剪切、旋转、错切及其一种或多种组合。

4.根据权利要求3所述的在局部复原的模糊图片上基于特征描述子比对的小目标检测方法，其特征在于，步骤（4）中，限定特征描述子提取的区域为车前窗，通过对原图像添加限制条件，使原图像特定区域作为待测区域，添加方式为根据坐标进行原图裁剪的方式。

5.根据权利要求4所述的在局部复原的模糊图片上基于特征描述子比对的小目标检测方法，其特征在于，步骤（4）中，使用特征检测算法对车前窗区域进行特征检测，所述特征描述子包括但不限于SIF、SURF和LBP。