CN110458234A

CN110458234A - 一种基于深度学习的以图搜车方法

Info

Publication number: CN110458234A
Application number: CN201910747926.XA
Authority: CN
Inventors: 文莉; 黄宇恒; 金晓峰; 梁添才; 赵清利
Original assignee: Shenzhen Grg Banking Technology Co Ltd; Guangzhou Grg Jetco Financial Electronic Co Ltd; Guangdian Yuntong Financial Electronic Co Ltd
Current assignee: Shenzhen Grg Banking Technology Co Ltd; Guangzhou Grg Jetco Financial Electronic Co Ltd; GRG Banking Equipment Co Ltd; Guangdian Yuntong Financial Electronic Co Ltd
Priority date: 2019-08-14
Filing date: 2019-08-14
Publication date: 2019-11-15
Anticipated expiration: 2039-08-14
Also published as: CN110458234B

Abstract

本发明涉及计算机视觉技术领域，具体为基于深度学习的以图搜车方法，其融合了车辆的全局外观特征与局部特征，具有较强的泛化性与鲁棒性。包括步骤：采集实际应用场景的图片；自动对获取的图片打标签，即同一辆车的图片归为一类，建立训练集和测试集；设计神经网络结构；将训练集的样本输入到神经网络结构中进行训练，得到以图搜车模型；利用以图搜车模型计算测试集所有样本的特征向量；特征比对：采用余弦距离计算目标图像特征向量与样本特征向量之间的相似度大小；对得到的相似度，按照从大到小进行排序，得到以图搜车结果。

Description

一种基于深度学习的以图搜车方法

技术领域

本发明涉及计算机视觉技术领域，具体为基于一种深度学习的以图搜车方法。

背景技术

以图搜车是一种基于图像的车辆检索技术，其旨在搜索到不同视频监控场景下的同一辆车。数据显示，65％以上的犯罪案件都与车辆有关。而在涉车案件中，嫌疑车辆的车牌通常是假牌、套牌，无法通过识别车牌号码来锁定车辆身份，因此基于视觉表观特征的以图搜车技术具有重大研究意义和实用价值。

目前以图搜车技术主要分为两大类，一类是基于传统图像特征，另一类是基于深度特征。基于传统图像特征通过手工设计的特征描述子，如sift、hog等，以及颜色直方图等，获取目标图像的颜色特征、纹理特征等用于以图搜车。传统图像特征具有运行速度快、可解释性强等优点。但在实际应用中其泛化性差，对遮挡、光照变化、角度变化等干扰的鲁棒性差等缺点。基于深度特征通过自动学习数据的分布式特征表示用于以图搜车，其具有较强的泛化性与鲁棒性。

于2018年1月23日公开的公开号为“CN107622229A”的发明专利，其通过计算目标车辆图像与待匹配车辆图像的颜色特征相似度和编码方向梯度直方图特征相似度进行加权融合来得到相似度，然而在实际应用中，光照、阴影、相机偏色等都会造成车辆颜色发生剧烈变化，从而导致算法鲁棒性非常差。

于2017年8月4日公开的公开号为“CN107016362A”的发明专利，其拍摄车辆前挡风玻璃图片，输入深度训练的检测器进行检测定位，得到前挡风玻璃粘贴的每个标志的候选区域，统计标志的数量及颜色序列，计算标志与车辆前挡风玻璃图片中心点的相对位置。若两张车辆前挡风玻璃图片的标志的数量、颜色序列均一致，且相对位置的差异值在预设值以内，判定车辆为同一车辆，否则不是同一车辆。这种方法只适用车辆前拍的情况，且当粘贴标志有改动时，会造成车辆识别精度显著下降。

发明内容

为解决现有技术所存在的技术问题，本发明提出一种基于深度学习的以图搜车方法，其融合了车辆的全局外观特征与局部特征，具有较强的泛化性与鲁棒性。

本发明采用以下技术方案来实现：一种基于深度学习的以图搜车方法，包括如下步骤：

S1、采集实际应用场景的图片；

S2、自动对S1获取的图片打标签，即同一辆车的图片归为一类，建立训练集和测试集；

S3、设计神经网络结构；

S4、将步骤S2处理好的训练集的样本输入到步骤S3所设计的神经网络结构中进行训练，得到以图搜车模型；

S5、利用步骤S4中的以图搜车模型计算步骤S2中测试集所有样本的特征向量；

S6、特征比对：采用余弦距离计算目标图像特征向量与步骤S5所得的每一样本的特征向量之间的相似度大小；

S7、对步骤S6得到的相似度，按照从大到小进行排序，得到以图搜车结果。

在优选的实施例中，所述步骤S2为：采用SSD车身检测算法得到车身区域；然后分别利用三个车牌检测模型对车身区域进行车牌检测，进而分别利用三个车牌识别模型对车牌区域进行车牌识别，得到三个相应的车牌识别置信度；加权三个车牌识别模型的置信度，把置信度与设定阈值比较；若置信度大于设定阈值，则判断为目标车辆，并找出置信度最高的车牌，把相应的原始图片放入以置信度最高的车牌号码命名的文件夹，最后采用随机车牌遮挡方法对原始图片的车牌进行遮挡处理，获得一定比例的车牌被遮挡的样本和车牌未被遮挡的样本，建立训练集和测试集；若置信度小于等于预设阈值，则判断为非目标车辆，返回步骤S1；

其中，三个车牌检测模型为三个相同功能但性能不一样的车牌检测算法，三个车牌识别模型也为三个相同功能但性能不一样的车牌识别算法。

本发明与现有技术相比，具有如下优点和有益效果：实现了一个模型对车辆的全局外观特征与局部特征(如年检标、挂饰等)学习，其不仅对车前挡风玻璃粘贴标志的变化、车牌的变化(车牌遮挡、污损等)、光照的变化具有一定鲁棒性，而且可实现车辆前后拍的识别以及车辆套牌、移除甚至伪造牌照时车辆的识别，同时模型精度高、速度快、显存占用低、泛化性与鲁棒性好。

附图说明

图1是本发明的整体流程图；

图2是以图搜车样本自动截取流程图；

图3是以图搜车的神经网络结构图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

实施例

如图1所示，本发明基于深度学习的以图搜车方法，主要包括如下几个步骤：

S1、采集实际应用场景的图片；

S2、自动对S1获取的图片打标签，即同一辆车的图片归为一类，建立训练集和测试集。

如图2，采用SSD(Single Shot MultiBox Detector)车身检测算法得到车身区域；然后分别利用三个车牌检测模型对车身区域进行车牌检测，进而分别利用三个车牌识别模型对车牌区域进行车牌识别，得到三个相应的车牌识别置信度；加权三个车牌识别模型的置信度，把置信度与设定阈值比较；若置信度大于设定阈值，则判断为目标车辆，并找出置信度最高的车牌，把相应的原始图片放入以置信度最高的车牌号码命名的文件夹，最后采用随机车牌遮挡方法对原始图片的车牌进行遮挡处理，获得一定比例的车牌被遮挡的样本和车牌未被遮挡的样本，建立训练集和测试集；若置信度小于等于预设阈值，则判断为非目标车辆，返回步骤S1。

为了使模型适应无牌车以及污损车牌等情况，所以会采用遮挡车牌的样本用于训练集进行模型训练，同时为了测试模型对车牌遮挡样本的性能，测试集也会采用遮挡车牌的样本。

其中，三个车牌检测模型为三个相同功能但性能不一样的车牌检测算法，三个车牌识别模型也为三个相同功能但性能不一样的车牌识别算法。本实施例采用性能互补的车牌检测与车牌识别算法，例如，采用基于深度学习的车牌检测与车牌识别算法。

S3、设计神经网络结构；

如图3，使用稠密块(dense block)为基本模块，对整体神经网络结构进行设计：神经网络结构包括相连接的5×5卷积层和3×3池化层，池化层与稠密块连接；稠密块设有多个，在相邻两个稠密块之间加入注意力机制模块，用以阻止过拟合和促进与任务相关特征的学习。同时设计多尺度特征组合策略，即在多个稠密块输出端分别引出全局池化层(Global Pooling)，然后对多个全局池化层的输出端进行连接(Concat)，进而进行降维处理，以促进特征的表达力，同时减少模型参数；训练阶段，以降维后的特征作为输入，采用微调后的center loss作为损失函数(也叫监督函数)对网络结构进行监督训练；测试阶段，直接采用降维后的特征作为输入目标的特征表达。center loss用以调节深度特征的分布，对center loss的参数进行适当调节，可提高深度特征的类别区分能力。在本实施例中，所设计的神经网络结构设有三个稠密块，分别为第一稠密块、第二稠密块和第三稠密块；从三个稠密块分别引出一个输出端，该输出端均与一个全局池化层连接，因而全局池化层也设有三个；所设计的神经网络结构还设有两个注意力机制模块，其中第一稠密块、第二稠密块之间设置第一注意力机制模块，第二稠密块、第三稠密块之间设置第二注意力机制模块。

S6、特征比对：采用余弦距离计算目标图像特征向量与步骤S5所得的每一样本的特征向量之间的相似度大小。余弦距离的计算公式如(1)所示；

其中，||·||为向量的L-2范数，X和Y分别为目标图像特征向量与S5所得到的每一样本特征向量，θ为两个特征向量(目标图像特征向量与样本特征向量)之间的夹角。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种基于深度学习的以图搜车方法，其特征在于，包括如下步骤：

S1、采集实际应用场景的图片；

S3、设计神经网络结构；

2.根据权利要求1所述的以图搜车方法，其特征在于，所述步骤S2为：采用SSD车身检测算法得到车身区域；然后分别利用三个车牌检测模型对车身区域进行车牌检测，进而分别利用三个车牌识别模型对车牌区域进行车牌识别，得到三个相应的车牌识别置信度；加权三个车牌识别模型的置信度，把置信度与设定阈值比较；若置信度大于设定阈值，则判断为目标车辆，并找出置信度最高的车牌，把相应的原始图片放入以置信度最高的车牌号码命名的文件夹，最后采用随机车牌遮挡方法对原始图片的车牌进行遮挡处理，获得一定比例的车牌被遮挡的样本和车牌未被遮挡的样本，建立训练集和测试集；若置信度小于等于预设阈值，则判断为非目标车辆，返回步骤S1；

3.根据权利要求2所述的以图搜车方法，其特征在于，所述车牌检测与车牌识别算法为基于深度学习的车牌检测与车牌识别算法。

4.根据权利要求1所述的以图搜车方法，其特征在于，步骤S3使用稠密块为基本模块，对整体神经网络结构进行设计：神经网络结构包括相连接的卷积层和池化层，池化层与稠密块连接；稠密块设有多个，在相邻两个稠密块之间加入注意力机制模块，用以促进与任务相关特征的学习；同时设计多尺度特征组合策略，在多个稠密块输出端分别引出全局池化层，然后对多个全局池化层的输出端进行连接，进而进行降维；训练阶段，以降维后的特征作为输入，采用微调后的center loss作为损失函数对网络结构进行监督训练；测试阶段，直接采用降维后的特征作为输入目标的特征表达。

5.根据权利要求4所述的以图搜车方法，其特征在于，所述神经网络结构设有三个稠密块，分别为第一稠密块、第二稠密块和第三稠密块；从三个稠密块分别引出一个输出端，该输出端均与一个全局池化层连接；神经网络结构还设有两个注意力机制模块，其中第一稠密块、第二稠密块之间设置第一注意力机制模块，第二稠密块、第三稠密块之间设置第二注意力机制模块。

6.根据权利要求1所述的以图搜车方法，其特征在于，步骤S6所述余弦距离的计算公式为：

其中，||·||为向量的L-2范数，X和Y分别为目标图像特征向量与S5所得到的每一样本特征向量，θ为两个特征向量之间的夹角。