CN115546472B - 一种路面车辆重识别方法、装置及应用 - Google Patents

一种路面车辆重识别方法、装置及应用 Download PDF

Info

Publication number
CN115546472B
CN115546472B CN202211506874.5A CN202211506874A CN115546472B CN 115546472 B CN115546472 B CN 115546472B CN 202211506874 A CN202211506874 A CN 202211506874A CN 115546472 B CN115546472 B CN 115546472B
Authority
CN
China
Prior art keywords
vehicle
map
characteristic information
encoder
position map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211506874.5A
Other languages
English (en)
Other versions
CN115546472A (zh
Inventor
韩致远
王国梁
卓家雨
张郑结
张香伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CCI China Co Ltd
Original Assignee
CCI China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CCI China Co Ltd filed Critical CCI China Co Ltd
Priority to CN202211506874.5A priority Critical patent/CN115546472B/zh
Publication of CN115546472A publication Critical patent/CN115546472A/zh
Application granted granted Critical
Publication of CN115546472B publication Critical patent/CN115546472B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/08Detecting or categorising vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本申请提出了一种路面车辆重识别方法、装置及应用,包括以下步骤:对待识别车辆图像进行目标检测得到多个检测部位框,基于所述检测部位框对所述待识别车辆图像进行切割得到多个相同尺寸大小的车辆部位图,并对每一所述车辆部位图记录对应的面积系数;对每一所述车辆部位图进行拉伸操作并结合每一所述车辆部位图对应的面积系数计算每一所述车辆部位图的加权向量;对每一所述车辆部位图的加权向量进行位置信息的标注后,输入编码器中提取特征信息;对不同待识别车辆图像的所述特征信息进行比对判断是否为同一车辆。通过本方案可以判断不同摄像组件下经过的两辆车辆是否属于同一辆车,从而实现车辆搜索,车辆监控,车辆跟踪等任务。

Description

一种路面车辆重识别方法、装置及应用
技术领域
本申请涉及跨摄像头目标重识别领域,特别是涉及一种路面车辆重识别方法、装置及应用。
背景技术
车辆重识别是利用计算机视觉来判断不同摄像组件下的经过的两辆车辆是否属于同一辆车的技术,广泛应用于交通场景下的车辆搜索,车辆监控,车辆跟踪任务当中,属于目标重识别算法领域的一个子领域。
在车辆重识别算法领域中,取稳健的特征表示是目标重新识别的关键挑战之一,尽管基于卷积神经网络(CNN)的方法在提取图像特征的过程中取得了巨大成功,但由于卷积操作的特殊性,导致卷积核在提取特征的过程中,一次只处理一个局部区域,并且会因卷积核下采样算子(例如池化和跨步卷积)导致图像全局信息丢失。
Transformer作为一种基于注意力的编码器-解码器架构,最初作用于自然语言处理领域,相对于卷积神经网络CNN每次只能学习一小块区域的特征,视觉Transformer(ViT)能够在第一层就学习到图像的全局信息,现有的将Transformer运用于重识别任务时,将车辆图片直接进行分割成区块输入,这种分割方式本身是对车辆信息的一种损耗,并且,这种切割方式通常会在原图上以从左往右、从上往下的顺序将图片裁剪为一组32*32或64*64的区块,由于目标检测算法产出的目标框是标准矩形,而车辆只是占据框内的一部分,这种切割方式不可避免地会引入非车辆部位的背景区域,从而降低特征质量,导致最后匹配精度降低。其次,受到不同摄像组件角度的影响,车辆不同部位在图像中的面积大小是不同的,用相同大小的区块对图像进行裁剪,很容易造成同一张裁剪区块中有车辆不同部位的信息,这种处理方式没法对车辆特定部位的特征进行针对性的应用,最后得到的精度往往不甚理想。
发明内容
本申请实施例提供了一种路面车辆重识别方法、装置及应用,能够在图像分割时使用卷积神经网络进行目标检测,提取到车辆不同部位的位置信息,并使用Transformer模块进行进一步的特征提取得到整个车辆信息的特征表示,对两张车辆特征信息图片进行距离对比,从而判断两张图片中的车辆是否是同一辆车。
第一方面,本申请实施例提供了一种路面车辆重识别方法,所述方法包括:
对待识别车辆图像进行目标检测得到多个检测部位框,基于所述检测部位框对所述待识别车辆图像所进行切割得到多个相同尺寸大小的车辆部位图,并对每一所述车辆部位图记录对应的面积系数;对每一所述车辆部位图进行拉伸操作并结合每一所述车辆部位图对应的面积系数计算每一所述车辆部位图的加权向量;对每一所述车辆部位图的加权向量进行位置信息的标注后,输入编码器中进行特征信息的提取;对不同车辆图像的所述特征信息进行比对判断是否为同一车辆。
第二方面,本申请实施例提供了一种路面车辆重识别装置,包括:
第一图像处理模块:对待识别车辆图像进行目标检测得到多个检测部位框,基于所述检测部位框对所述待识别车辆图像所进行切割得到多个相同尺寸大小的车辆部位图,并对每一所述车辆部位图记录对应的面积系数;
第二图像处理模块:对每一所述车辆部位图进行拉伸操作并结合每一所述车辆部位图对应的面积系数计算每一所述车辆部位图的加权向量;
特征提取模块:对每一所述车辆部位图的加权向量进行位置信息的标注后,输入编码器中进行特征信息的提取;
识别模块:对不同车辆图像的所述特征信息进行比对判断是否为同一车辆。
第三方面,本申请实施例提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行一种路面车辆重识别方法。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序包括用于控制过程以执行过程的程序代码,所述过程包括一种路面车辆重识别方法。
本发明的主要贡献和创新点如下:
本申请实施例在车辆重识别的任务上,使用卷积神经网络与Transformer提取车辆特征,本申请实施例提取到的特征值更好的保留了车辆全局和局部的关键部位的特征,使用此方法提取的特征,能更好的表示目标车辆的信息;本申请提出了先使用轻量级目标检测模型来对车的关键部位进行位置检测,再将对应的部位进行拉伸操作后得到车辆部位图,对于没有获取到的车辆部位,采用计算量最小的纯色填充方案来进行填充;本申请通过将所述车辆部位图的面积信息作为惩罚项对每一所述车辆部位图的向量进行加权,提高了车辆重识别的成功率;本申请提出在高速路、高架桥这类行进方向相对确定的场景下针对每颗摄像组件建立基于固定时间区间的多个车辆特征库,缓解了同一库中保存过多、时间跨度过大的车辆特征而导致搜索开销增大、搜索正确率下降的问题;本方案提出了车辆特征库的三级优先匹配方法,基于某颗摄像组件在时间点上的特征信息,在摄像组件逻辑位置前后各一个摄像组件的三级优先特征库中进行逐级搜索,提升检索效率,并且通过指定任何时间点为的任何车辆,获取路面上该车辆的完整跟踪信息。
本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种路面车辆重识别方法的流程图;
图2是根据本申请实施例的一种编码器模型的结构图;
图3是根据本申请实施例的一种基于Transformer与动态惩罚项分配的车辆重识别方法的结构图;
图4是根据本申请实施例的一种编码器模型进行丢弃操作的结构图;
图5是根据本申请实施例的一种编码器模型中,多层感知模块的结构图;
图6是根据本申请实施例的一种根据摄像组件获取多个车辆特征信息库的结构图;
图7是根据本申请实施例的一种对不同车辆特征信息库进行判断的结构示意图;
图8是根据本申请实施例的一种根据三级优先度进行车辆特征匹配的结构示意图;
图9是根据本申请实施例的一种路面车辆重识别装置的结构框图;
图10是根据本申请实施例的电子装置的硬件结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。
需要说明的是:在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本说明书中所描述的多个步骤,在其他实施例中也可能被合并为单个步骤进行描述。
实施例一
本申请实施例提供了一种路面车辆重识别方法,可以对车辆图片进行检测切割后输入到编码器进行特征信息的提取,通过对特征信息距离的比对判断是否为同一车辆,具体地,参考图1,所述方法包括:
对待识别车辆图像进行目标检测得到多个检测部位框,基于所述检测部位框对所述待识别车辆图像所进行切割得到多个相同尺寸大小的车辆部位图,并对每一所述车辆部位图记录对应的面积系数;
对每一所述车辆部位图进行拉伸操作并结合每一所述车辆部位图对应的面积系数计算每一所述车辆部位图的加权向量;
对每一所述车辆部位图的加权向量进行位置信息的标注后,输入编码器中进行特征信息的提取;
对不同车辆图像的所述特征信息进行比对判断是否为同一车辆。
在一些实施例中,“对待识别车辆图像进行目标检测得到多个检测部位框”的步骤包括:所述待识别车辆图像包括至少一待识别车辆,使用卷积神经网络对所述至少一待识别车辆的不同部位进行检测得到车辆不同部位的检测部位框。
具体的,在本方案的一些实施例中,所述车辆不同部位包括:全车、车头、车顶、左前车门、右前车门、左后车门、右后车门、车尾。
也就是说,根据所述检测部位框将所述待识别车辆图像切割为不同的车辆部位图,分别为全车部位图、车头部位图、车顶部位图、左前车门部位图、右前车门部位图、左后车门部位图、右后车门部位图、车尾部位图。
在一些实施例中,“基于所述检测部位框对所述待识别车辆图像所进行切割得到多个相同尺寸大小的车辆部位图”步骤包括:将所述检测部位框形变成统一规格,根据所述形变后的检测部位框对所述待处理图像进行切割。
进一步的,因为在不同的摄像组件下,车辆检测到的不同部位占全车的面积是不同的,如果直接统一形变成同样的大小,对于较小的车辆部位图与较大的车辆部位图的信息权重相同化处理,是不合理的,所以,本方案在所述车辆部位检测模型中计算每个所述车辆部位图的面积系数作为惩罚项。
其中,所述车辆部位图的面积系数为:
Figure 113470DEST_PATH_IMAGE001
其中,σ表示车辆部位图的面积系数,Spart表示车辆部位面积,Scar表示车辆全车面积。
进一步的,对每个所述检测部位框进行相同的形变操作,得到多张车辆部位图。
在一些实施例中,若对应同一待识别车辆图像的部分检测部位框缺失,以纯色填充缺失的所述检测部位框对应的车辆部位图。
进一步的,将所述检测部位框缺失的车辆部位图标注为缺省状态,对所述缺省状态的车辆部位图中的所有像素点使用纯色像素块进行填充。
具体的,由于获取所述待识别车辆图像的设备是一个固定的电子设备,而车辆是持续运动的,所以,大部分情况下并不会通过所述待识别车辆图像获取所有车辆部位的检测部位框,会存在部分检测部位框缺失,对于部分缺失的检测部位框将其标注为缺省状态,将标记为缺省状态的检测部位框中的像素点使用RGB为(0,0,0)的纯色像素块进行填充,在实际应用中,发现使用纯色对缺省状态的检测部位框进行填充对计算机的算力要求不高,且与其他填充方案对正确率的影响不大。
在本方案的一些实施例中,所述卷积神经网络对所述待识别车辆图像进行识别,得到所述待识别车辆图像中的八个检测部位框,对所述八个检测部位框进行切割、形变操作得到八张32*32的车辆部位图。
也就是说,后续所有的待识别车辆图像都可以通过上述操作,得到八张32*32的车辆部位图和每张所述车辆部位图对应的面积系数。
在一些实施例中,“对每一所述车辆部位图进行拉伸操作并结合每一所述车辆部位图对应的面积系数计算每一所述车辆部位图的加权向量”步骤包括:对每一所述车辆部位图进行拉伸操作得到拉伸向量,每一车辆部位图的拉伸向量、面积系数以及权重相乘后加上偏移量得到每一车辆部位图的加权向量。
具体的,对每一所述车辆部位图进行拉伸操作时,假设所述车辆部位图的大小为宽P*高P*通道数C,当对其进行拉伸操作后,所述车辆部位图变为(PP)*C规格的向量。
示例性的,所述车辆部位图的大小为32*32*384,当对所述车辆部位图进行拉伸操作后,所述车辆部位图变为1024*384规格的向量。
具体的,所述加权向量的公式表示为:
Figure 787028DEST_PATH_IMAGE002
具体的,Zn表示所述车辆部位图的加权向量,w表示所述车辆部位图的权重,σn表示所述车辆部位图的面积系数,Xn表示所述车辆部位图拉伸后的拉伸向量,b为所述车辆部位图的偏移量。所述车辆部位图的权重和偏移量在训练过程中进行动态更新,以确保模型的准确率。
具体的,使用惩罚项来对车辆部位图进行加权得到加权向量的目的是在统一每张所述车辆部位图的区块大小的同时,保留车辆检测面积大小的信息,提高最终的匹配精度,在实际应用中发现,使用面积系数和加权向量进行特征提取后进行匹配,可以更容易匹配到相同的车辆。
在一些实施例中,在“对每一所述车辆部位图的加权向量进行对应位置信息的标注后,输入编码器中提取特征信息”步骤中:所述编码器为Transformer编码器,在所述Transformer编码器中的编码模块中进行丢弃操作。
具体的,所述编码模块的结构如图2所示,为了使模型的训练过程不易出现过拟合,并使得最终训练好的编码器泛化性更强,且不依赖某些局部特征,在所述编码模块和所述多层感知模块中添加如图4所示的丢弃操作,具体操作如下:
1.在所述车辆部位图的加权向量在所述编码器中进行前向传播时,让其中某个神经元的激活值以一定的概率停止工作;
2.将所述车辆部位图的加权向量进行前向传播后得到的损失结果通过编码器进行反向传播,当部分所述车辆部位图的加权向量执行完这个过程后,在没有被删除的神经元上按照随机梯度下降法更新所述编码器的对应参数;
3.恢复被删除的神经元,因为被删除的神经元参数未变,而没有被删除的神经元参数已经更新,因此每一组所述车辆部位图的加权向量都在训练不同的编码器;
4.重复步骤1、2、3直至训练完成。
具体的,所述编码器模型基于Transformer神经网络架构组成,基于Transformer神经网络架构与动态惩罚项分配的车辆重识别方法的结构图如图3所示。
具体的,所述多层感知模块(MLP)用于替代常规的线性分类器在所述编码模块中来执行分类任务,本方案在常规的多层感知模块中加入丢弃(Dropout)层来缓解所述编码器的过拟合问题,所述多层感知模块(MLP)结构如图5所示。
具体的,为了提高所述编码器模型的泛化能力,本方案使用批量归一化的方法,所述批量归一化的方式为:对输入编码器的所述车辆部位图的加权向量进行取值后定义两个待学习参数,对每个取值结果进行期望值和方差的计算,根据所述期望值和方差的计算结果对所述车辆部位图的加权向量进行标准化,最后将标准化的结果结合两个所述待学习参数进行输出。
在一些实施例中,所述编码器的训练方式是:针对每张车辆部位图,分别选取距每张所述车辆部位图欧氏距离最远的正样本和欧式距离最近的负样本组成三元组对所述编码器训练。
示例性的,针对一批训练数据,随机挑选P个ID的车辆图片,每个车辆随机挑选K张不同的车辆部位图,即每批训练数据含有P*K张车辆部位图,之后对每一批训练数据中的每张车辆部位图a挑选出一个正样本和负样本组成三元组,使用以下公式计算所述三元组的损失:
Figure 251507DEST_PATH_IMAGE003
其中,max da,p为在当前训练批次的训练数据中,与车辆部位图a欧式距离最远的正样本车辆部位图p,min da,n为在当前训练批次的训练数据中,与车辆部位图a欧式距离最近的负样本车辆部位图n。
具体的,使用三元组损失L训练出的所述编码器模型来提取车辆特征,会尽可能地使相同车辆特征向量的欧式距离更小,不同车辆特征向量的欧式距离更大。
示例性的,所述车辆部位图a的特征向量为X,所述车辆部位图n的特征向量为Y,其中:
Figure 185965DEST_PATH_IMAGE004
则,特征向量X与特征向量Y的欧氏距离为:
Figure 324867DEST_PATH_IMAGE005
在一些实施例中,获取沿着车辆前进方向的多个摄像组件拍摄的多张所述待识别车辆图像,每个摄像组件获取的所述待识别车辆图像依照时间轴顺序排列,不同时间区间的所述待识别车辆图像的所述特征信息存入对应时间区间的车辆特征信息库中。
具体的,每个摄像组件信息都对应多个不同时间区间的车辆特征信息库。
具体的,如图6所示,当一摄像组件n获取待识别车辆图像后,经过卷积神经网络进行检测部位框的识别,根据所述检测部位框进行切割、拉伸后,输入到编码器中提取车辆特征信息,将所述车辆特征信息根据时间轴放入摄像组件n对应的不同时间区间的车辆特征信息库中。
在一些实施例中,在“对不同待识别车辆图像的所述特征信息进行比对判断是否为同一辆车”中,选定特定摄像组件特定时刻获取的待识别车辆图像的特征信息作为基准特征信息,基于所述基准特征信息从领近所述特定摄像组件的摄像组件中依照时间区间先后顺序依次选取优先匹配特征库、次优先匹配特征库、最后匹配特征库,其中所述优先匹配特征库的时间区间最接近所述特定时刻,基于优先匹配特征库、次优先匹配特征库、最后匹配特征库中的特征信息和基准特征信息比对判断是否为同一车辆。
具体的,所述临近所述特定摄像组件的摄像组件可以为所述特定摄像组件的前一个临近的摄像组件和后一个临近的摄像组件。
示例性的,如图7所示,本方案中以五分钟为一个时间区间,当摄像组件n+1在6:08分提取到所述待识别车辆的特征信息后,分别获取摄像组件n的5:55-6:00车辆特征信息库、6:00-6:05车辆特征信息库、6:05-6:10车辆特征信息库和摄像组件n+2的6:05-6:10车辆特征信息库、6:10-6:15车辆特征信息库、6:15-6:20车辆特征信息库,按照距所述待识别车辆的特征信息采集时间的远近程度将摄像组件n的6:05-6:10车辆特征信息库和摄像组件n+2的6:05-6:10车辆特征信息库作为优先匹配特征库;将摄像组件n的6:00-6:05车辆特征信息库和摄像组件n+2的6:10-6:15车辆特征信息库作为次优先匹配特征库;将摄像组件n的5:55-6:00车辆特征信息库和摄像组件n+2的6:15-6:20车辆特征信息库作为最后匹配特征库。
具体的,因为所述待识别车辆根据道路行进方向逐个经过摄像组件存在时间序列上的前后关系,因此,本方案按照时间区间划分的车辆特征信息库在存储正确的前提下,能够缓解同一库中保存过多、时间跨度过大的车辆特征信息从而导致搜索开销增大、搜索正确率下降的问题。
在一些实施例中,在“基于优先匹配特征库、次优先匹配特征库、最后匹配特征库中的特征信息和基准特征信息比对判断是否为同一车辆”步骤中,先将基准特征信息与优先匹配特征库中的车辆特征信息进行欧式距离的计算,若所述基准特征信息与所述优先匹配特征库中车辆A的特征信息的欧式距离小于第一设定阈值,则所述车辆A和所述待识别车辆为同一车辆,否之,将所述基准特征信息与次优先匹配特征库中的车辆特征信息进行欧氏距离的计算,若所述基准特征信息与所述次优先匹配特征库中车辆B的特征信息的欧式距离小于第一设定阈值,则所述车辆B和所述待识别车辆为同一车辆,否之,将所述基准特征信息与最后匹配特征库中的车辆特征信息进行欧氏距离的计算,若所述基准特征信息与所述最后匹配特征库中的车辆C的特征信息的欧式距离小于第一设定阈值,则所述车辆C和所述待识别车辆为同一车辆。
具体的,所述第一设定阈值可以认为设置,也可以在训练过程中动态更新,使用多个不同优先级的特征匹配库来对所述待识别车辆进行特征信息的比对,从而进行车辆的重识别,可以提升检索效率,且能够通过指定任何时间点位的任何车辆,获取路面上该车辆的完整跟踪信息。
在一些实施例中,在高速路面的摄像组件中获取待识别车辆图像。
具体的,高速路行驶方向相对固定,摄像头的相对位置也比较好进行掌握,使本方案在根据基准特征信息对不同优先级的匹配特征库中的信息进行比对时的准确率更高,更容易进行待识别车辆的重识别。
实施例二
基于相同的构思,参考图9,本申请还提出了一种路面车辆重识别装置,包括:
第一图像处理模块:对待识别车辆图像进行目标检测得到多个检测部位框,基于所述检测部位框对所述待识别车辆图像所进行切割得到多个相同尺寸大小的车辆部位图,并对每一所述车辆部位图记录对应的面积系数;
第二图像处理模块:对每一所述车辆部位图进行拉伸操作并结合每一所述车辆部位图对应的面积系数计算每一所述车辆部位图的加权向量;
特征提取模块:对每一所述车辆部位图的加权向量进行位置信息的标注后,输入编码器中进行特征信息的提取;
识别模块:对不同车辆图像的所述特征信息进行比对判断是否为同一车辆。
实施例三
本实施例还提供了一种电子装置,参考图10,包括存储器404和处理器402,该存储器404中存储有计算机程序,该处理器402被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
具体地,上述处理器402可以包括中央处理器(CPU),或者特定集成电路(ApplicationSpecificIntegratedCircuit,简称为ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
其中,存储器404可以包括用于数据或指令的大容量存储器404。举例来说而非限制,存储器404可包括硬盘驱动器(HardDiskDrive,简称为HDD)、软盘驱动器、固态驱动器(SolidStateDrive,简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(UniversalSerialBus,简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器404可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器404可在数据处理装置的内部或外部。在特定实施例中,存储器404是非易失性(Non-Volatile)存储器。在特定实施例中,存储器404包括只读存储器(Read-OnlyMemory,简称为ROM)和随机存取存储器(RandomAccessMemory,简称为RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(ProgrammableRead-OnlyMemory,简称为PROM)、可擦除PROM(ErasableProgrammableRead-OnlyMemory,简称为EPROM)、电可擦除PROM(ElectricallyErasableProgrammableRead-OnlyMemory,简称为EEPROM)、电可改写ROM(ElectricallyAlterableRead-OnlyMemory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(StaticRandom-AccessMemory,简称为SRAM)或动态随机存取存储器(DynamicRandomAccessMemory,简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器404(FastPageModeDynamicRandomAccessMemory,简称为FPMDRAM)、扩展数据输出动态随机存取存储器(ExtendedDateOutDynamicRandomAccessMemory,简称为EDODRAM)、同步动态随机存取内存(SynchronousDynamicRandom-AccessMemory,简称SDRAM)等。
存储器404可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器402所执行的可能的计算机程序指令。
处理器402通过读取并执行存储器404中存储的计算机程序指令,以实现上述实施例中的任意一种路面车辆重识别方法。
可选地,上述电子装置还可以包括传输设备406以及输入输出设备408,其中,该传输设备406和上述处理器402连接,该输入输出设备408和上述处理器402连接。
传输设备406可以用来经由一个网络接收或者发送数据。上述的网络具体实例可包括电子装置的通信供应商提供的有线或无线网络。在一个实例中,传输设备包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备406可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
输入输出设备408用于输入或输出信息。在本实施例中,输入的信息可以是待识别车辆图像、待识别车辆的特征信息等,输出的信息可以是任意一辆车的车辆特征信息等。
可选地,在本实施例中,上述处理器402可以被设置为通过计算机程序执行以下步骤:
S101、对待识别车辆图像进行目标检测得到多个检测部位框,基于所述检测部位框对所述待识别车辆图像所进行切割得到多个相同尺寸大小的车辆部位图,并对每一所述车辆部位图记录对应的面积系数;
S102、对每一所述车辆部位图进行拉伸操作并结合每一所述车辆部位图对应的面积系数计算每一所述车辆部位图的加权向量;
S103、对每一所述车辆部位图的加权向量进行位置信息的标注后,输入编码器中进行特征信息的提取;
S104、对不同车辆图像的所述特征信息进行比对判断是否为同一车辆。
需要说明的是,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
通常,各种实施例可以以硬件或专用电路、软件、逻辑或其任何组合来实现。本发明的一些方面可以以硬件来实现,而其他方面可以以可以由控制器、微处理器或其他计算设备执行的固件或软件来实现,但是本发明不限于此。尽管本发明的各个方面可以被示出和描述为框图、流程图或使用一些其他图形表示,但是应当理解,作为非限制性示例,本文中描述的这些框、装置、系统、技术或方法可以以硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其他计算设备或其某种组合来实现。
本发明的实施例可以由计算机软件来实现,该计算机软件由移动设备的数据处理器诸如在处理器实体中可执行,或者由硬件来实现,或者由软件和硬件的组合来实现。包括软件例程、小程序和/或宏的计算机软件或程序(也称为程序产品)可以存储在任何装置可读数据存储介质中,并且它们包括用于执行特定任务的程序指令。计算机程序产品可以包括当程序运行时被配置为执行实施例的一个或多个计算机可执行组件。一个或多个计算机可执行组件可以是至少一个软件代码或其一部分。另外,在这一点上,应当注意,如图10中的逻辑流程的任何框可以表示程序步骤、或者互连的逻辑电路、框和功能、或者程序步骤和逻辑电路、框和功能的组合。软件可以存储在诸如存储器芯片或在处理器内实现的存储块等物理介质、诸如硬盘或软盘等磁性介质、以及诸如例如DVD及其数据变体、CD等光学介质上。物理介质是非瞬态介质。
本领域的技术人员应该明白,以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种路面车辆重识别方法,其特征在于,包括以下步骤:
对待识别车辆图像进行目标检测得到多个检测部位框,基于所述检测部位框对所述待识别车辆图像进行切割得到多个相同尺寸大小的车辆部位图,并对每一所述车辆部位图记录对应的面积系数;
对每一所述车辆部位图进行拉伸操作并结合每一所述车辆部位图对应的面积系数计算每一所述车辆部位图的加权向量,对每一所述车辆部位图进行拉伸操作得到拉伸向量,每一车辆部位图的拉伸向量、面积系数以及权重相乘后加上偏移量得到每一车辆部位图的加权向量;
对每一所述车辆部位图的加权向量进行位置信息的标注后,输入编码器中提取特征信息,所述编码器为Transformer编码器,在所述Transformer编码器中的编码模块中进行丢弃操作,具体操作如下:
S01在所述车辆部位图的加权向量在所述编码器中进行前向传播时,让其中一神经元的激活值以第一设定概率停止工作,将停止工作的神经元进行删除;
S02将所述车辆部位图的加权向量进行前向传播后得到的损失结果通过编码器进行反向传播,当所述车辆部位图的加权向量执行完这个过程后,在没有被删除的神经元上按照随机梯度下降法更新所述编码器的对应参数;
S03恢复被删除的神经元;
S04重复步骤S01、S02、S03直至训练完成;
对不同待识别车辆图像的所述特征信息进行比对判断是否为同一车辆。
2.根据权利要求1所述的一种路面车辆重识别方法,其特征在于,“对待识别车辆图像进行目标检测得到多个检测部位框”的步骤包括:所述待识别车辆图像包括至少一待识别车辆,使用卷积神经网络对所述至少一待识别车辆的不同部位进行检测得到车辆不同部位的检测部位框。
3.根据权利要求1所述的一种路面车辆重识别方法,其特征在于,所述编码器的训练方式是:针对每张车辆部位图,分别选取距每张所述车辆部位图欧氏距离最远的正样本和欧式距离最近的负样本组成三元组对所述编码器训练。
4.根据权利要求1所述的一种路面车辆重识别方法,其特征在于,若对应同一待识别车辆图像的部分检测部位框缺失,以纯色填充缺失的所述检测部位框对应的车辆部位图。
5.根据权利要求1所述的一种路面车辆重识别方法,其特征在于,获取沿着车辆前进方向的多个摄像组件拍摄的多张所述待识别车辆图像,每个摄像组件获取的所述待识别车辆图像依照时间轴顺序排列,不同时间区间的所述待识别车辆图像的所述特征信息存入对应时间区间的车辆特征信息库中。
6.根据权利要求5所述的一种路面车辆重识别方法,其特征在于,在“对不同待识别车辆图像的所述特征信息进行比对判断是否为同一辆车”中,选定特定摄像组件特定时刻获取的待识别车辆图像的特征信息作为基准特征信息,基于所述基准特征信息从领近所述特定摄像组件的摄像组件中依照时间区间先后顺序依次选取优先匹配特征库、次优先匹配特征库、最后匹配特征库,其中所述优先匹配特征库的时间区间最接近所述特定时刻,基于优先匹配特征库、次优先匹配特征库、最后匹配特征库中的特征信息和基准特征信息比对判断是否为同一车辆。
7.根据权利要求6所述的一种路面车辆重识别方法,其特征在于,在“基于优先匹配特征库、次优先匹配特征库、最后匹配特征库中的特征信息和基准特征信息比对判断是否为同一车辆”步骤中,先将基准特征信息与优先匹配特征库中的车辆特征信息进行欧式距离的计算,若所述基准特征信息与所述优先匹配特征库中车辆A的特征信息的欧式距离小于第一设定阈值,则所述车辆A和所述待识别车辆为同一车辆,否之,将所述基准特征信息与次优先匹配特征库中的车辆特征信息进行欧氏距离的计算,若所述基准特征信息与所述次优先匹配特征库中车辆B的特征信息的欧式距离小于第一设定阈值,则所述车辆B和所述待识别车辆为同一车辆,否之,将所述基准特征信息与最后匹配特征库中的车辆特征信息进行欧氏距离的计算,若所述基准特征信息与所述最后匹配特征库中的车辆C的特征信息的欧式距离小于第一设定阈值,则所述车辆C和所述待识别车辆为同一车辆。
8.一种路面车辆重识别装置,其特征在于,包括:
第一图像处理模块:对待识别车辆图像进行目标检测得到多个检测部位框,基于所述检测部位框对所述待识别车辆图像所进行切割得到多个相同尺寸大小的车辆部位图,并对每一所述车辆部位图记录对应的面积系数;
第二图像处理模块:对每一所述车辆部位图进行拉伸操作并结合每一所述车辆部位图对应的面积系数计算每一所述车辆部位图的加权向量,对每一所述车辆部位图进行拉伸操作得到拉伸向量,每一车辆部位图的拉伸向量、面积系数以及权重相乘后加上偏移量得到每一车辆部位图的加权向量;
特征提取模块:对每一所述车辆部位图的加权向量进行位置信息的标注后,输入编码器中提取特征信息,所述编码器为Transformer编码器,在所述Transformer编码器中的编码模块中进行丢弃操作,具体操作如下:
S01在所述车辆部位图的加权向量在所述编码器中进行前向传播时,让其中一神经元的激活值以第一设定概率停止工作,将停止工作的神经元进行删除;
S02将所述车辆部位图的加权向量进行前向传播后得到的损失结果通过编码器进行反向传播,当所述车辆部位图的加权向量执行完这个过程后,在没有被删除的神经元上按照随机梯度下降法更新所述编码器的对应参数;
S03恢复被删除的神经元;
S04重复步骤S01、S02、S03直至训练完成;
识别模块:对不同车辆图像的所述特征信息进行比对判断是否为同一车辆。
9.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1-7任一所述的一种路面车辆重识别方法。
10.一种可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序,所述计算机程序包括用于控制过程以执行过程的程序代码,所述过程包括根据权利要求1-7任一所述的一种路面车辆重识别方法。
CN202211506874.5A 2022-11-29 2022-11-29 一种路面车辆重识别方法、装置及应用 Active CN115546472B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211506874.5A CN115546472B (zh) 2022-11-29 2022-11-29 一种路面车辆重识别方法、装置及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211506874.5A CN115546472B (zh) 2022-11-29 2022-11-29 一种路面车辆重识别方法、装置及应用

Publications (2)

Publication Number Publication Date
CN115546472A CN115546472A (zh) 2022-12-30
CN115546472B true CN115546472B (zh) 2023-02-17

Family

ID=84722343

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211506874.5A Active CN115546472B (zh) 2022-11-29 2022-11-29 一种路面车辆重识别方法、装置及应用

Country Status (1)

Country Link
CN (1) CN115546472B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016145547A1 (en) * 2015-03-13 2016-09-22 Xiaoou Tang Apparatus and system for vehicle classification and verification
CN108875600A (zh) * 2018-05-31 2018-11-23 银江股份有限公司 一种基于yolo的车辆信息检测和跟踪方法、装置及计算机存储介质
CN114220076A (zh) * 2021-12-20 2022-03-22 城云科技(中国)有限公司 多目标检测方法、装置及其应用
CN115311632A (zh) * 2022-08-11 2022-11-08 沈阳风驰软件股份有限公司 一种基于多摄像头的车辆重识别方法和设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10127810B2 (en) * 2012-06-07 2018-11-13 Zoll Medical Corporation Vehicle safety and driver condition monitoring, and geographic information based road safety systems
US9792575B2 (en) * 2016-03-11 2017-10-17 Route4Me, Inc. Complex dynamic route sequencing for multi-vehicle fleets using traffic and real-world constraints

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016145547A1 (en) * 2015-03-13 2016-09-22 Xiaoou Tang Apparatus and system for vehicle classification and verification
CN108875600A (zh) * 2018-05-31 2018-11-23 银江股份有限公司 一种基于yolo的车辆信息检测和跟踪方法、装置及计算机存储介质
CN114220076A (zh) * 2021-12-20 2022-03-22 城云科技(中国)有限公司 多目标检测方法、装置及其应用
CN115311632A (zh) * 2022-08-11 2022-11-08 沈阳风驰软件股份有限公司 一种基于多摄像头的车辆重识别方法和设备

Also Published As

Publication number Publication date
CN115546472A (zh) 2022-12-30

Similar Documents

Publication Publication Date Title
CN107292291B (zh) 一种车辆识别方法和系统
CN107563372B (zh) 一种基于深度学习ssd框架的车牌定位方法
CN108960080B (zh) 基于主动防御图像对抗攻击的人脸识别方法
CN109753913B (zh) 计算高效的多模式视频语义分割方法
CN109558823B (zh) 一种以图搜图的车辆识别方法及系统
US9501703B2 (en) Apparatus and method for recognizing traffic sign board
CN110263712B (zh) 一种基于区域候选的粗精行人检测方法
CN113221905A (zh) 基于均匀聚类的语义分割的无监督域适应方法、装置、系统和存储介质
CN109214403B (zh) 图像识别方法、装置及设备、可读介质
CN115546601B (zh) 一种多目标识别模型及其构建方法、装置及应用
US11403850B2 (en) System and method for providing unsupervised domain adaptation for spatio-temporal action localization
CN111881741B (zh) 车牌识别方法、装置、计算机设备和计算机可读存储介质
CN112926461B (zh) 神经网络训练、行驶控制方法及装置
CN111401196A (zh) 受限空间内自适应人脸聚类的方法、计算机装置及计算机可读存储介质
CN112766170B (zh) 基于簇类无人机图像的自适应分割检测方法及装置
CN112101114B (zh) 一种视频目标检测方法、装置、设备以及存储介质
CN111062347B (zh) 一种自动驾驶中交通要素分割方法、电子设备及存储介质
CN112183542A (zh) 基于文本图像的识别方法、装置、设备和介质
CN114821519A (zh) 一种基于坐标注意力的交通标志识别方法及系统
CN114612847A (zh) 一种Deepfake视频篡改检测方法以及系统
CN111160282B (zh) 一种基于二值化Yolov3网络的红绿灯检测方法
CN106650814B (zh) 一种基于车载单目视觉室外道路自适应分类器生成方法
CN115546472B (zh) 一种路面车辆重识别方法、装置及应用
KR101847175B1 (ko) 객체 인식방법 및 이를 이용한 객체 인식장치
EP4332910A1 (en) Behavior detection method, electronic device, and computer readable storage medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant