WO2022027873A1

WO2022027873A1 - 基于多模态信息融合的车辆再识别方法及装置

Info

Publication number: WO2022027873A1
Application number: PCT/CN2020/131777
Authority: WO
Inventors: 闫军; 刘艳洋
Original assignee: 智慧互通科技有限公司
Priority date: 2020-08-05
Filing date: 2020-11-26
Publication date: 2022-02-10
Also published as: CN111931627A

Abstract

一种基于多模态信息融合的车辆再识别方法及装置，涉及智能停车管理领域，方法包括：从监控视频中提取待查询车辆图像（101）；将待查询车辆图像作为预置多分支监测机制网络模型的输入，提取车辆的全局特征和多个局部特征，并根据多个局部特征中的车牌区域提取车辆的车牌字符（102）；从预置数据库中获取不同车辆分别与车辆的全局特征、多个局部特征和车牌字符之间的相似度或者匹配的联合概率（103）；根据不同车辆与待查询车辆之间的相似度或者匹配的联合概率生成车辆重识别排序表（104）。该方法可以有效提高车辆再识别的准确率，进一步地区分了车辆之间的类间差异和类内差异，能够适应真实场景下的各种应用需求。

Description

基于多模态信息融合的车辆再识别方法及装置

技术领域

本发明涉及智能停车管理领域，特别涉及一种基于多模态信息融合的车辆再识别方法及装置。

背景技术

车辆作为城市监控中的重要对象，在检测、跟踪、调度等大量与车辆相关的任务中引起了广泛关注。车辆再识别是找出不同摄像机所拍摄到的同一辆车，或同一摄像机在不同光照、不同视角下拍摄到的同一车辆。通过车辆再识别技术，可以实现跨镜头自动识别并锁定同一辆车，在城市交通调度、违法车辆追踪等具体任务中，起着十分重要的作用，有利于智能交通和智慧城市的规划与发展。

目前常见的车辆再识别方法通常包含如下几种类型：一种是利用传感器来解决车辆再识别的问题。例如，通过地磁传感器、红外射频传感器等进行车辆再识别，然而这种方法所需成本较高，安装环境要求复杂，不适用于大规模推广使用。第二种方法是通过车牌进行识别，实现车辆跨摄像头的追踪定位，但是在很多情况下，车牌由于光照、遮挡、污损等各种原因，导致车牌号码识别不准确，进而导致车辆再识别的误差较大；第三种方法是基于车辆局部外观特征进行车辆再识别，然而由于车辆局部外观特征对于车辆的反映情况较为片面，进而导致车辆再识别进度较低。

发明内容

为解决上述技术问题，本发明提供一种基于多模态信息融合的车辆再识别方法及装置，可以解决现有再识别方法仅通过车辆外观或者是车牌号码进行车辆再识别，所应用的识别特征较为单一，识别精度较低的问题。

为实现上述目的，一种基于多模态信息融合的车辆再识别方法，其特征在于，所述方法包括：

从监控视频中提取待查询车辆图像；

将所述待查询车辆图像作为预置多分支监测机制网络模型的输入，提取所述车辆的全局特征和多个局部特征，并根据多个局部特征中的车牌区域提取所述车辆的车牌字符；

从预置数据库中获取不同车辆分别与所述车辆的全局特征、多个局部特征和车牌字符之间的相似度或者匹配的联合概率，所述预置数据库中保存有不同车辆分别对应的全局特征、多个局部特征和车牌字符，所述预置数据库中保存有不同车辆分别对应的全局特征、多个局部特征和车牌字符；

根据不同车辆与所述待查询车辆之间的相似度或者匹配的联合概率生成车辆重识别排序表。

进一步地，所述方法还包括：

从监控视频中提取待查询车辆图像的时空信息；

根据不同车辆与待查询车辆之间匹配的联合概率和所述待查询车辆图像的时空信息预测所述车辆的相对行驶方向；

根据不同摄像头之间的拓扑关系、所述车辆相对行驶方向、以及预置车辆时空转移模型，得到所述车辆与不同车辆之间的时空匹配概率，所述预置车辆时空转移模型是根据不同车辆分别对应的历史车辆行驶时空数据建立的。

进一步地，所述根据不同车辆与待查询车辆之间的相似度或者匹配的联合概率生成车辆重识别排序表的步骤包括：

根据不同车辆与待查询车辆之间匹配的联合概率或者相似度，以及所述车辆与不同车辆之间的时空匹配概率生成车辆重识别排序表。

进一步地，从监控视频中提取待查询车辆图像的步骤包括：

从监控视频中获取的待查询车辆图片上进行车辆目标检测，获取完整地被边界框标出的车辆目标图像；

剔除所述车辆目标图像中的冗余背景信息，得到所述待查询车辆图像。

进一步地，所述全局特征为所述车辆的整体外观特征，所述多个局部特征包括车辆车头外观特征、车辆车尾外观特征、车辆车牌区域外观特征。

进一步地，从预置数据库中获取不同车辆分别与所述车辆的全局特征、多个局部特征和车牌字符之间的相似度的步骤包括：

根据不同车辆以及所述车辆的整体外观特征、车辆车头外观特征、车辆车尾外观特征、车辆车牌区域外观特征、以及车牌字符特征，构造三元损失函数并计算不同车辆与所述车辆之间的特征距离，得到不同车辆分别与所述车辆之间的相似度。

进一步地，所述获取不同车辆与所述车辆匹配的联合概率的步骤包括：

基于贝叶斯概率模型，根据公式Pa＝PF×θ×Ptpo进行计算，其中，Pa为候选车辆与所述待查询车辆匹配的联合概率，PF为候选车辆与待查询车辆之间车辆车头外观特征、车辆车尾外观特征、车辆车牌区域外观特征、车辆整体外观特征匹配的联合概率，Ptpo为候选车辆与待查询车辆之间的车牌匹配概率，θ为车牌识别的置信度。

进一步地，本发明提供一种基于多模态信息融合的车辆再识别装置，所述装置包括：

提取模块，用于从监控视频中提取待查询车辆图像；

所述提取模块，还用于将所述待查询车辆图像作为预置多分支监测机制网络模型的输入，提取所述车辆的全局特征和多个局部特征，并根据多个局部特征中的车牌区域提取所述车辆的车牌字符；

获取模块，用于从预置数据库中获取不同车辆分别与所述车辆的全局特征、多个局部特征和车牌字符之间的相似度或者匹配的联合概率，所述预置数据库中保存有不同车辆分别对应的全局特征、多个局部特征和车牌字符，所述预置数据库中保存有不同车辆分别对应的全局特征、多个局部特征和车牌字符；

生成模块，用于根据不同车辆与所述待查询车辆之间的相似度或者匹配的联合概率生成车辆重识别排序表。

进一步地，所述装置还包括：预测模块；

所述提取模块，还用于从监控视频中提取所述待查询车辆图像的时空信息；

所述预测模块，用于根据不同车辆与待查询车辆之间匹配的联合概率和所述待查询车辆图像的时空信息预测所述车辆的相对行驶方向；

所述获取模块，还用于根据不同摄像头之间的拓扑关系、所述车辆相对行驶方向、以及预置车辆时空转移模型，得到所述车辆与不同车辆之间的时空匹配概率，所述预置车辆时空转移模型是根据不同车辆分别对应的历史车辆行驶时空数据建立的。

进一步地，所述生成模块，具体用于根据不同车辆与待查询车辆之间匹配的联合概率或者相似度，以及所述车辆与不同车辆之间的时空匹配概率生成车辆重识别排序表。

进一步地，所述提取模块，具体用于从监控视频中获取的待查询车辆图片上进行车辆目标检测，获取完整地被边界框标出的车辆目标图像；剔除所述车辆目标图像中的冗余背景信息，得到所述待查询车辆图像。

进一步地，所述获取模块，具体用于根据不同车辆以及所述车辆的整体外观特征、车辆车头外观特征、车辆车尾外观特征、车辆车牌区域外观特征、以及车牌字符特征，构造三元损失函数并计算不同车辆与所述车辆之间的特征距离，得到不同车辆分别与所述车辆之间的相似度。

进一步地，所述获取模块，具体还用于基于贝叶斯概率模型，根据公式Pa＝ PF×θ×Ptpo进行计算，其中，Pa为候选车辆与所述待查询车辆匹配的联合概率，PF为候选车辆与待查询车辆之间车辆车头外观特征、车辆车尾外观特征、车辆车牌区域外观特征、车辆整体外观特征匹配的联合概率，Ptpo为候选车辆与待查询车辆之间的车牌匹配概率，θ为车牌识别的置信度。

本发明提供的一种基于多模态信息融合的车辆再识别方法及装置，通过融入了预置多分支监测机制网络模型，通过分别比对车辆的全局特征、多个局部特征和车牌字符，实现基于全局外观特征、局部外观特征以及车牌字符相融合的特征匹配，进而与现有只是通过单一特征或者车牌字符进行特征匹配相比，可以有效提高车辆再识别的准确率；进一步地在模态上，还融入了车辆对应的时间与地理位置信息，形成多模态融合概率特征，很好的区分了车辆之间的类间差异和类内差异，能够适应真实场景下的不同光照、不同摄像头型号识别的应用需求。

通过以下参照附图对本公开的示例性实施例的详细描述，本公开的其它特征及其优点将会变得清楚。

附图说明

此处所说明的附图用来提供对本公开的进一步理解，构成本申请的一部分，本公开的示意性实施例及其说明用于解释本公开，并不构成对本公开的不当限定。在附图中：

图1是本发明提供的一种基于多模态信息融合的车辆再识别方法的流程图；

图2是本发明提供的一种基于多模态信息融合的车辆再识别装置的示意图。

具体实施方式

现在将参照附图来详细描述本公开的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。

同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本公开及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为授权说明书的一部分。

在这里示出和讨论的所有示例中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它示例可以具有不同的值。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

本发明提供一种基于图像深度信息的停车事件确定方法，如图1所示，具体包括如下步骤：

101、从监控视频中提取待查询车辆图像。

对于本发明实施例，步骤101具体可以包括：从监控视频中获取的待查询车辆图片上进行车辆目标检测，获取完整地被边界框标出的车辆目标图像；剔除所述车辆目标图像中的冗余背景信息，得到所述待查询车辆图像。对于本发明实施例，通过将原始监控图像的车辆类别检出并进行实例分割，去除了背景噪声的干扰，可充分提取出车辆的全部信息，从而保证了提取的图像的清晰度，进而可以进一步提升车辆的再识别精度。

具体地，从监控视频中获取的待查询车辆图片上进行车辆目标检测的具体过程可以包括如下步骤：当某一监控摄像机在捕获视频帧时，同时获取该监控摄像头的地理位置信息，以及拍摄该视频帧的时间信息。同时，利用单阶段的检测方法作为目标检测工具，再从源监控视频流中获取的车辆图片上进行车辆目标检测，获取完整地被边界框标出的车辆目标，作为车辆实例分割源数据，并且忽略分辨率小于256*256的图片，并在车辆检测后图像中，标注每辆车对应的身份ID。其中，所述地理位置包括但不限于国家、城市、经纬度坐标等。所述时间包括但不限于年月日、时分秒、农历、阳历等。所述单阶段检测方法包括但不限于YOLO、SSD等回归式的目标检测方法。所述源车辆图片涵盖真实的道路交通场景监控捕捉的同一辆车的多幅不同视角、不同背景、不同光照强度下的图像，其中，车辆图像所涵盖的内容包括：车牌外观信息、车牌字符信息、颜色、车型、车辆标注信息。

进一步地，获取完整地被边界框标出的车辆目标图像，剔除所述车辆目标图像中的冗余背景信息，得到所述待查询车辆图像的步骤具体可以包括：使用多边形标注工具将车辆图片数据集中的车辆目标，沿着车辆边界抠出，制成车辆实例分割数据集。使用卷积神经网络生成特征向量，训练车辆实例分割网络模型，然后将车辆图片进行初步的实例分割，之后对初步分割结果做数据清洗，如边缘检测、孔洞填充、连通域检测和像素面积比对，完善车辆和实例分割效果，获得分割后的车辆数据集。其中，所述实例分割方法包括但不限于MASK-RCNN、SOLO等实例分割方法。所述卷积神经网络包括但不限于VGG、AlexNet、ResNet等卷积神经网络。所述边缘检测包括但不限于高斯滤波、Canny、Sobel等边缘检测方法。所述孔洞填充包括但不限于开运算、闭运算、漫水填充等像素填充方法。

102、将所述待查询车辆图像作为预置多分支监测机制网络模型的输入，提取所述车辆的全局特征和多个局部特征，并根据多个局部特征中的车牌区域提取所述车辆的车牌字符。

其中，所述全局特征为所述车辆的整体外观特征，所述多个局部特征包括车辆车头外观特征、车辆车尾外观特征、车辆车牌区域外观特征。所述预置多分支监测机制网络模型包括但不限于SSD、YOLO、M2det、Fast-RCNN等检测模型，检测模型所用的数据集为实例分割后的剔除背景噪声的车辆图像的数据集。所述车牌字符识别方法包括但不限于CRNN+CTC、YOLOV3等字符识别方法，进而保证车牌识别的准确性。

103、从预置数据库中获取不同车辆分别与所述车辆的全局特征、多个局部特征和车牌字符之间的相似度或者匹配的联合概率。

其中，所述预置数据库中保存有不同车辆分别对应的全局特征、多个局部特征和车牌字符，所述预置数据库中保存有不同车辆分别对应的全局特征、多个局部特征和车牌字符。

对于本发明实施例，从预置数据库中获取不同车辆分别与所述车辆的全局特征、多个局部特征和车牌字符之间的相似度的步骤包括：根据不同车辆以及所述车辆的整体外观特征、车辆车头外观特征、车辆车尾外观特征、车辆车牌区域外观特征、以及车牌字符特征，构造三元损失函数并计算不同车辆与所述车辆之间的特征距离，得到不同车辆分别与所述车辆之间的相似度。

具体地，利用卷积层分别提取每张车辆图像的初始特征，再利用多分支检测模块机制分别提取车头外观特征、车尾外观特征、车牌外观特征以及车牌字符特征这四部分局部特征，经过图像融合，将四部分局部特征与全局特征相融合得到再识别模型。

进一步地，所述损失函数为三元组损失函数为：

其中，f(P)、f(N)为由不同摄像机拍摄的ID相同的车辆图像，f(A)为一张ID不同的车辆图像。所述提取多个局部特征和全局特征，需要设置提取不同区域特征的卷积神经网络的初始参数。具体地，经过车辆特征提取神经网络,输出车辆身份特征；特征融合网络采用5层全连接层神经网络，取其中第一层全连接层后的输出作为车辆的融合特征。所述特征提取网络包括但不限于ResNet、VGG、AlexNet等特征提取网路模型。训练特征融合网络的方法如下：采用了交叉熵损失函数和三元组损失函数的度量学习，训练所述网络的特征学习过程；在采用度量学习的损失函数训练特征融合网络5层全连接层神经网络的过程中，减小了车辆相同ID的类内距离，扩大了车辆不同ID类间距离，增强车辆融合特征的鲁棒性。

对于本发明实施例，所述获取不同车辆与所述车辆匹配的联合概率的步骤包括：基于贝叶斯概率模型，根据公式Pa＝PF×θ×Ptpo进行计算，其中，Pa为候选车辆与所述待查询车辆匹配的联合概率，PF为候选车辆与待查询车辆之间车辆车头外观特征、车辆车尾外观特征、车辆车牌区域外观特征、车辆整体外观特征匹配的联合概率，Ptpo为候选车辆与待查询车辆之间的车牌匹配概率，θ为车牌识别的置信度。

104、根据不同车辆与所述待查询车辆之间的相似度或者匹配的联合概率生成车辆重识别排序表。

其中，为了方便进行候选车辆筛选，所述车辆重识别排序表可以按照相似度或者概率的降序进行排列。

对于本发明实施例，为了进一步提升车辆再识别准确率，还可以融入车辆的时空信息，具体方法可以包括：从监控视频中提取所述待查询车辆图像的时空信息；根据不同车辆与待查询车辆之间匹配的联合概率和所述待查询车辆图像的时空信息预测所述车辆的相对行驶方向；根据不同摄像头之间的拓扑关系、所述车辆相对行驶方向、以及预置车辆时空转移模型，得到所述车辆与不同车辆之间的时空匹配概率，所述预置车辆时空转移模型是根据不同车辆分别对应的历史车辆行驶时空数据建立的。

此时，步骤104具体可以包括：根据不同车辆与待查询车辆之间匹配的联合概率或者相似度，以及所述车辆与不同车辆之间的时空匹配概率生成车辆重识别排序表。

本发明提供的一种基于多模态信息融合的车辆再识别方法，通过融入了预置多分支监测机制网络模型，通过分别比对车辆的全局特征、多个局部特征和车牌字符，实现基于全局外观特征、局部外观特征以及车牌字符相融合的特征匹配，进而与现有只是通过单一特征或者车牌字符进行特征匹配相比，可以有效提高车辆再识别的准确率；进一步地在模态上，还融入了车辆对应的时间与地理位置信息，形成多模态融合概率特征，很好的区分了车辆之间的类间差异和类内差异，能够适应真实场景下的不同光照、不同摄像头型号识别的应用需求。

作为图1所示方法的具体实现方式，本发明实施例提供一种基于多模态信息融合的车辆再识别装置，如图2所示，所述装置包括：提取模块21，用于从监控视频中提取待查询车辆图像；

所述提取模块21，还用于将所述待查询车辆图像作为预置多分支监测机制网络模型的输入，提取所述车辆的全局特征和多个局部特征，并根据多个局部特征中的车牌区域提取所述车辆的车牌字符；

获取模块22，用于从预置数据库中获取不同车辆分别与所述车辆的全局特征、多个局部特征和车牌字符之间的相似度或者匹配的联合概率，所述预置数据库中保存有不同车辆分别对应的全局特征、多个局部特征和车牌字符，所述预置数据库中保存有不同车辆分别对应的全局特征、多个局部特征和车牌字符；

生成模块23，用于根据不同车辆与所述待查询车辆之间的相似度或者匹配的联合概率生成车辆重识别排序表。

进一步地，所述装置还包括：预测模块24；

所述提取模块21，还用于从监控视频中提取所述待查询车辆图像的时空信息；

所述预测模块24，用于根据不同车辆与待查询车辆之间匹配的联合概率和所述待查询车辆图像的时空信息预测所述车辆的相对行驶方向；

所述获取模块22，还用于根据不同摄像头之间的拓扑关系、所述车辆相对行驶方向、以及预置车辆时空转移模型，得到所述车辆与不同车辆之间的时空匹配概率，所述预置车辆时空转移模型是根据不同车辆分别对应的历史车辆行驶时空数据建立的。

进一步地，所述生成模块23，具体用于根据不同车辆与待查询车辆之间匹配的联合概率或者相似度，以及所述车辆与不同车辆之间的时空匹配概率生成车辆重识别排序表。

进一步地，所述提取模块21，具体用于从监控视频中获取的待查询车辆图片上进行车辆目标检测，获取完整地被边界框标出的车辆目标图像；剔除所述车辆目标图像中的冗余背景信息，得到所述待查询车辆图像。对于本发明实施例，通过将原始监控图像的车辆类别检出并进行实例分割，去除了背景噪声的干扰，可充分提取出车辆的全部信息，从而保证了提取的图像的清晰度，进而可以进一步提升车辆的再识别精度。

进一步地，所述获取模块22，具体用于根据不同车辆以及所述车辆的整体外观特征、车辆车头外观特征、车辆车尾外观特征、车辆车牌区域外观特征、以及车牌字符特征，构造三元损失函数并计算不同车辆与所述车辆之间的特征距离，得到不同车辆分别与所述车辆之间的相似度。

进一步地，所述获取模块22，具体还用于基于贝叶斯概率模型，根据公式Pa＝PF×θ×Ptpo进行计算，其中，Pa为候选车辆与所述待查询车辆匹配的联合概率，PF为候选车辆与待查询车辆之间车辆车头外观特征、车辆车尾外观特征、车辆车牌区域外观特征、车辆整体外观特征匹配的联合概率，Ptpo为候选车辆与待查询车辆之间的车牌匹配概率，θ为车牌识别的置信度。

本发明提供的一种基于多模态信息融合的车辆再识别装置，通过融入了预置多分支监测机制网络模型，通过分别比对车辆的全局特征、多个局部特征和车牌字符，实现基于全局外观特征、局部外观特征以及车牌字符相融合的特征匹配，进而与现有只是通过单一特征或者车牌字符进行特征匹配相比，可以有效提高车辆再识别的准确率；进一步地在模态上，还融入了车辆对应的时间与地理位置信息，形成多模态融合概率特征，很好的区分了车辆之间的类间差异和类内差异，能够适应真实场景下的不同光照、不同摄像头型号识别的应用需求。

应该明白，公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好，应该理解，过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素，并且不是要限于所述的特定顺序或层次。

在上述的详细描述中，各种特征一起组合在单个的实施方案中，以简化本公开。不应该将这种公开方法解释为反映了这样的意图，即，所要求保护的主题的实施方案需要比清楚地在每个权利要求中所陈述的特征更多的特征。相反，如所附的权利要求书所反映的那样，本发明处于比所公开的单个实施方案的全部特征少的状态。因此，所附的权利要求书特此清楚地被并入详细描述中，其中每项权利要求独自作为本发明单独的优选实施方案。

为使本领域内的任何技术人员能够实现或者使用本发明，上面对所公开实施例进行了描述。对于本领域技术人员来说；这些实施例的各种修改方式都是显而易见的，并且本文定义的一般原理也可以在不脱离本公开的精神和保护范围的基础上适用于其它实施例。因此，本公开并不限于本文给出的实施例，而是与本申请公开的原理和新颖性特征的最广范围相一致。

上文的描述包括一个或多个实施例的举例。当然，为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的，但是本领域普通技术人员应该认识到，各个实施例可以做进一步的组合和排列。因此，本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外，就说明书或权利要求书中使用的术语“包含”，该词的涵盖方式类似于术语“包括”，就如同“包括，”在权利要求中用作衔接词所解释的那样。此外，使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。

本领域技术人员还可以了解到本发明实施例列出的各种说明性逻辑块(illustrative logical block)，单元，和步骤可以通过电子硬件、电脑软件，或两者的结合进行实现。为清楚展示硬件和软件的可替换性(interchangeability)，上述的各种说明性部件(illustrative components)，单元和步骤已经通用地描述了它们的功能。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用，可以使用各种方法实现所述的功能，但这种实现不应被理解为超出本发明实施例保护的范围。

本发明实施例中所描述的各种说明性的逻辑块，或单元都可以通过通用处理器，数字信号处理器，专用集成电路(ASIC)，现场可编程门阵列或其它可编程逻辑装置，离散门或晶体管逻辑，离散硬件部件，或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器，可选地，该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算装置的组合来实现，例如数字信号处理器和微处理器，多个微处理器，一个或多个微处理器联合一个数字信号处理器核，或任何其它类似的配置来实现。

本发明实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件模块、或者这两者的结合。软件模块可以存储于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或本领域中其它任意形式的存储媒介中。示例性地，存储媒介可以与处理器连接，以使得处理器可以从存储媒介中读取信息，并可以向存储媒介存写信息。可选地，存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于ASIC中，ASIC可以设置于用户终端中。可选地，处理器和存储媒介也可以设置于用户终端中的不同的部件中。

在一个或多个示例性的设计中，本发明实施例所描述的上述功能可以在硬件、软件、固件或这三者的任意组合来实现。如果在软件中实现，这些功能可以存储与电脑可读的媒介上，或以一个或多个指令或代码形式传输于电脑可读的媒介上。电脑可读媒介包括电脑存储媒介和便于使得让电脑程序从一个地方转移到其它地方的通信媒介。存储媒介可以是任何通用或特殊电脑可以接入访问的可用媒体。例如，这样的电脑可读媒体可以包括但不限于RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁性存储装置，或其它任何可以用于承载或存储以指令或数据结构和其它可被通用或特殊电脑、或通用或特殊处理器读取形式的程序代码的媒介。此外，任何连接都可以被适当地定义为电脑可读媒介，例如，如果软件是从一个网站站点、服务器或其它远程资源通过一个同轴电缆、光纤电缆、双绞线、数字用户线(DSL)或以例如红外、无线和微波等无线方式传输的也被包含在所定义的电脑可读媒介中。所述的碟片(disk)和磁盘(disc)包括压缩磁盘、镭射盘、光盘、DVD、软盘和蓝光光盘，磁盘通常以磁性复制数据，而碟片通常以激光进行光学复制数据。上述的组合也可以包含在电脑可读媒介中。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

一种基于多模态信息融合的车辆再识别方法，其特征在于，所述方法包括：

从监控视频中提取待查询车辆图像；

将所述待查询车辆图像作为预置多分支监测机制网络模型的输入，提取所述车辆的全局特征和多个局部特征，并根据多个局部特征中的车牌区域提取所述车辆的车牌字符；

从预置数据库中获取不同车辆分别与所述车辆的全局特征、多个局部特征和车牌字符之间的相似度或者匹配的联合概率，所述预置数据库中保存有不同车辆分别对应的全局特征、多个局部特征和车牌字符，所述预置数据库中保存有不同车辆分别对应的全局特征、多个局部特征和车牌字符；

根据不同车辆与所述待查询车辆之间的相似度或者匹配的联合概率生成车辆重识别排序表。
根据权利要求1所述的一种基于多模态信息融合的车辆再识别方法，其特征在于，所述方法还包括：

从监控视频中提取所述待查询车辆图像的时空信息；

根据不同车辆与待查询车辆之间匹配的联合概率和所述待查询车辆图像的时空信息预测所述车辆的相对行驶方向；

根据不同摄像头之间的拓扑关系、所述车辆相对行驶方向、以及预置车辆时空转移模型，得到所述车辆与不同车辆之间的时空匹配概率，所述预置车辆时空转移模型是根据不同车辆分别对应的历史车辆行驶时空数据建立的。
根据权利要求2所述的一种基于多模态信息融合的车辆再识别方法，其特征在于，所述根据不同车辆与待查询车辆之间的相似度或者匹配的联合概率生成车辆重识别排序表的步骤包括：

根据不同车辆与待查询车辆之间匹配的联合概率或者相似度，以及所述车辆与不同车辆之间的时空匹配概率生成车辆重识别排序表。
根据权利要求1所述的一种基于多模态信息融合的车辆再识别方法，其特征在于，从监控视频中提取待查询车辆图像的步骤包括：

从监控视频中获取的待查询车辆图片上进行车辆目标检测，获取完整地被边界框标出的车辆目标图像；

剔除所述车辆目标图像中的冗余背景信息，得到所述待查询车辆图像。
根据权利要求1-4任一项所述的一种基于多模态信息融合的车辆再识别方法，其特征在于，所述全局特征为所述车辆的整体外观特征，所述多个局部特征包括车辆车头外观特征、车辆车尾外观特征、车辆车牌区域外观特征。
根据权利有要求5所述的一种基于多模态信息融合的车辆再识别方法，其特征在于，从预置数据库中获取不同车辆分别与所述车辆的全局特征、多个局部特征和车牌字符之间的相似度的步骤包括：

根据不同车辆以及所述车辆的整体外观特征、车辆车头外观特征、车辆车尾外观特征、车辆车牌区域外观特征、以及车牌字符特征，构造三元损失函数并计算不同车辆与所述车辆之间的特征距离，得到不同车辆分别与所述车辆之间的相似度。
根据权利有要求5所述的一种基于多模态信息融合的车辆再识别方法，其特征在于，所述获取不同车辆与所述车辆匹配的联合概率的步骤包括：

基于贝叶斯概率模型，根据公式Pa＝PF×θ×Ptpo进行计算，其中，Pa为候选车辆与所述待查询车辆匹配的联合概率，PF为候选车辆与待查询车辆之间车辆车头外观特征、车辆车尾外观特征、车辆车牌区域外观特征、车辆整体外观特征匹配的联合概率，Ptpo为候选车辆与待查询车辆之间的车牌匹配概率，θ为车牌识别的置信度。
一种基于多模态信息融合的车辆再识别装置，其特征在于，所述装置包括：

提取模块，用于从监控视频中提取待查询车辆图像；

所述提取模块，还用于将所述待查询车辆图像作为预置多分支监测机制网络模型的输入，提取所述车辆的全局特征和多个局部特征，并根据多个局部特征中的车牌区域提取所述车辆的车牌字符；

获取模块，用于从预置数据库中获取不同车辆分别与所述车辆的全局特征、多个局部特征和车牌字符之间的相似度或者匹配的联合概率，所述预置数据库中保存有不同车辆分别对应的全局特征、多个局部特征和车牌字符，所述预置数据库中保存有不同车辆分别对应的全局特征、多个局部特征和车牌字符；

生成模块，用于根据不同车辆与所述待查询车辆之间的相似度或者匹配的联合概率生成车辆重识别排序表。
根据权利要求8所述的一种基于多模态信息融合的车辆再识别装置，其特征在于，所述装置还包括：预测模块；

所述提取模块，还用于从监控视频中提取所述待查询车辆图像的时空信息；

所述预测模块，用于根据不同车辆与待查询车辆之间匹配的联合概率和所述待查询车辆图像的时空信息预测所述车辆的相对行驶方向；

所述获取模块，还用于根据不同摄像头之间的拓扑关系、所述车辆相对行驶方向、以及预置车辆时空转移模型，得到所述车辆与不同车辆之间的时空匹配概率，所述预置车辆时空转移模型是根据不同车辆分别对应的历史车辆行驶时空数据建立的。
根据权利要求9所述的一种基于多模态信息融合的车辆再识别装置，其特征在于，

所述生成模块，具体用于根据不同车辆与待查询车辆之间匹配的联合概率或者相似度，以及所述车辆与不同车辆之间的时空匹配概率生成车辆重识别排序表。
根据权利要求8所述的一种基于多模态信息融合的车辆再识别装置，其特征在于，

所述提取模块，具体用于从监控视频中获取的待查询车辆图片上进行车辆目标检测，获取完整地被边界框标出的车辆目标图像；剔除所述车辆目标图像中的冗余背景信息，得到所述待查询车辆图像。
根据权利要求8-11任一项所述的一种基于多模态信息融合的车辆再识别装置，其特征在于，所述全局特征为所述车辆的整体外观特征，所述多个局部特征包括车辆车头外观特征、车辆车尾外观特征、车辆车牌区域外观特征。
根据权利要求12所述的一种基于多模态信息融合的车辆再识别装置，其特征在于，

所述获取模块，具体用于根据不同车辆以及所述车辆的整体外观特征、车辆车头外观特征、车辆车尾外观特征、车辆车牌区域外观特征、以及车牌字符特征，构造三元损失函数并计算不同车辆与所述车辆之间的特征距离，得到不同车辆分别与所述车辆之间的相似度。
根据权利要求12所述的一种基于多模态信息融合的车辆再识别装置，其特征在于，

所述获取模块，具体还用于基于贝叶斯概率模型，根据公式Pa＝PF×θ×Ptpo进行计算，其中，Pa为候选车辆与所述待查询车辆匹配的联合概率，PF为候选车辆与待查询车辆之间车辆车头外观特征、车辆车尾外观特征、车辆车牌区域外观特征、车辆整体外观特征匹配的联合概率，Ptpo为候选车辆与待查询车辆之间的车牌匹配概率，θ为车牌识别的置信度。