CN117315430A

CN117315430A - 面向大范围车辆再辨识的不完备模态特征融合方法

Info

Publication number: CN117315430A
Application number: CN202311595144.1A
Authority: CN
Inventors: 许恒; 黄诚惕; 洪岚; 朱建清; 黄麟涵; 陈宇涛; 潘文杰; 曾焕强; 蔡灿辉
Original assignee: Huaqiao University
Current assignee: Huaqiao University
Priority date: 2023-11-28
Filing date: 2023-11-28
Publication date: 2023-12-29
Anticipated expiration: 2043-11-28
Also published as: CN117315430B

Abstract

本发明一种面向大范围车辆再辨识的不完备模态特征融合方法，涉及图像处理技术领域，包括：训练包括三通道模型和单通道模型的双模态模型，对可见光车辆图像，采用三通道模型提取主特征，辅以图像灰度化，采用单通道模型提取辅助特征；对红外光车辆图像，采用单通道模型提取主特征，辅以通道复制扩展，采用三通道模型提取辅助特征；将主特征和辅特征叠加获得完整特征，利用KL散度优化完整、主、辅特征三者之间后验概率分布差异，优化特征融合效果。本发明能解决在长时间大范围的监控场景中车辆因活动轨迹复杂多变出现的模态不完备问题，即可见光和红外车辆图像不完备而无法直接实现可见光和红外图像的特征融合问题，提升车辆再辨识准确性。

Description

面向大范围车辆再辨识的不完备模态特征融合方法

技术领域

本发明涉及图像处理、机器视觉、深度学习、智能视频监控领域，特别涉及一种面向大范围车辆再辨识的不完备模态特征融合方法。

背景技术

车辆再辨识旨在从大规模的车辆图像库中检索出与待查询车辆图像具有相同身份的感兴趣车辆图像，其实质为图像匹配问题。但是，在实际的长时间大范围的监控场景中，车辆再辨识经常面临模态不完备问题，即因为车辆活动轨迹、活动时间不同，不能保证每一车辆都能同时具备可见光和红外光车辆图像，无法直接实现可见光和红外光图像的特征融合，只能进行跨模态车辆图像匹配，又因可见光和红外图像之间巨大的模态差异导致匹配效果不佳，造成车辆再辨识准确率低下。

发明内容

针对现有技术的问题，本发明的目的在于提供一种面向大范围车辆再辨识的不完备模态特征融合方法，能够支持模态不完备情况下通过特征融合的方式学习近似的模态完整特征，从而提高车辆再辨识能力。

本发明采用如下技术方案：

一种面向大范围车辆再辨识的不完备模态特征融合方法，包括：

训练包括三通道模型和单通道模型的双模态模型；基于所述双模态模型，对可见光车辆图像，采用三通道模型提取主特征，并将可见光车辆图像灰度化后采用单通道模型提取辅助特征，再将主特征和辅助特征融合作为可见光车辆图像的完整特征；对红外光车辆图像，采用单通道模型提取主特征，并将红外光车辆图像复制扩展为三通道图像，采用三通道模型提取辅助特征，再将主特征和辅助特征融合作为红外光车辆图像的完整特征，具体步骤如下：

将单通道的红外光车辆图像复制扩展为三通道图像，并和可见光车辆图像联合训练三通道模型，如下式所示：

其中，TM表示三通道模型，表示三通道模型的网络参数；/>表示三通道模型交叉熵损失函数；/>表示第/>张车辆图像；/>表示图像数量；/>表示属于第/>类的第/>张车辆图像的/>维独热编码向量，在该向量中第/>个元素取值为1，余下元素取值为0；/>等于类别数量；/>表示三通道模型全连接层中类别/>对应的权重参数，T是转置操作，/>表示相应的偏置参数；/>表示车辆图像/>经过三通道模型提取的特征，若/>为红外光车辆图像，则/>为辅助特征，Rep表示通道复制函数；若/>为可见光车辆图像，则/>为主特征。

将可见光车辆图像灰度化，并和红外光车辆图像联合训练单通道模型，如下式所示：

其中，SM表示单通道模型，表示单通道模型的网络参数；/>表示单通道模型交叉熵损失函数；/>表示第/>张车辆图像；/>表示图像数量；/>表示属于第/>类的第/>张车辆图像的/>维独热编码向量，在该向量中第/>个元素取值为1，余下元素取值为0；/>等于类别数量；/>表示单通道模型全连接层中类别/>对应的权重参数，T是转置操作，/>表示相应的偏置参数；/>表示车辆图像/>经过单通道模型提取的特征，若/>为可见光车辆图像，则/>为辅助特征，Gray表示灰度化函数，/>表示/>的红色通道图像；/>表示/>的绿色通道图像；表示/>的蓝色通道图像；若/>为红外光车辆图像，则/>为主特征。

将主特征和辅助特征融合作为图像的完整特征，如下式所示：

其中，表示特征融合后的完整特征。

优选的，所述的面向大范围车辆再辨识的不完备模态特征融合方法，还包括：在特征融合后的完整特征上加设目标函数驱动三通道模型和单通道模型再辨识协同学习，实现特征融合总体优化，如下式所示：

其中，表示完整特征对应的交叉熵损失函数；/>表示完整特征与三通道模型提取特征的KL散度以及完整特征与单通道模型提取特征之间KL散度之和；/>表示温度系数，用于软化后验概率分布。

优选的，所述的完整特征对应的交叉熵损失函数，如下式所示：

其中，表示完整特征对应的全连接层中类别/>对应的权重参数，/>表示相应的偏置参数。

优选的，所述完整特征与三通道模型提取特征的KL散度以及完整特征与单通道模型提取特征之间KL散度之和，如下式所示：

其中，，/>，分别表示完整特征的后验概率分布、三通道模型提取特征的后验概率分布和单通道模型提取特征的后验概率分布；/>表示完整特征对应的全连接层中类别/>对应的权重参数，/>表示相应的偏置参数；/>表示三通道模型全连接层中类别/>对应的权重参数，/>表示相应的偏置参数；/>表示单通道模型全连接层中类别/>对应的权重参数，/>表示相应的偏置参数；/>表示温度系数，用于软化后验概率分布；T是转置操作。与现有技术相比，本发明的有益效果如下：

本发明对可见光车辆图像，采用三通道模型提取主特征，辅以图像灰度化，采用单通道模型提取辅助特征；对红外光车辆图像，采用单通道模型提取主特征，辅以通道复制扩展，采用三通道模型提取辅助特征；然后将主特征和辅特征叠加获得完整特征，利用KL散度优化完整、主、辅特征三者之间后验概率分布差异，优化特征融合效果，无需完备的可见光图像和红外光图像即可实现特征融合，能够提升车辆再辨识在长时间大范围监控场景中的实战能力。

附图说明

图1为本发明实施例的面向大范围车辆再辨识的不完备模态特征融合方法的流程图；

图2(a)为本发明实施例的可见光三通道模型训练示意图；图2(b) 为本发明实施例的红外光单通道模型训练示意图；

图3为本发明实施例的双模态模型的训练示意图。

具体实施方式

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施例对本发明进行详细描述。需要说明的是，在不冲突的情况下，本发明的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明。

参见图1所示，本实施例一种面向大范围车辆再辨识的不完备模态特征融合方法，

训练阶段包括如下步骤：

步骤1，获取可见光车辆图像和红外光车辆图像作为训练样本；其中，每个图像配有身份标识作为标签。

步骤2，利用模态独立学习方式分别训练三通道模型和单通道模型。

步骤2.1 构建三通道模型和单通道模型。如图2(a)和2(b)所示，三通道模型采用ResNet50网络，该网络包括：三通道茎（Stem）层、四个残差组(Layer1、Layer2、Layer3、Layer4)、广义均值池化(Generalized Mean Pooling, GeP)层和批量归一化(BatchNormalization, BN)层。类似地，单通道模型也采用ResNet50网络，该网络包括：单通道茎层、四个残差组、广义均值池化层和批量归一化层。需要指出的是，三通道茎层和单通道茎层，皆由卷积(Convolutional, Conv)层、修正线性单元(Rectified Liner Unit, ReLU)激活函数、批量归一化层、最大池化层(Max Pooling, MP)组成，所不同的是三通道茎层的卷积层卷积核为3×64×3×3，而单通道茎层的卷积层卷积核1×64×3×3，分别用于处理三通道的可见光图像和单通道的红外光图像。

步骤2.2，构建三通道模型和单通道模型交叉熵损失函数，保证可见光模态下的鉴别性模型和红外光模态下的鉴别性模型，分别如公式(1)和公式(2)所示：

(1)

其中，TM表示三通道模型，表示三通道模型的网络参数；/>表示三通道模型交叉熵损失函数；/>表示第/>张车辆可见光图像；/>表示可见光图像数量；/>表示属于第/>类的第/>张车辆可见光图像的/>维独热编码向量，在该向量中第/>个元素取值为1，余下元素取值为0；/>等于类别数量；/>表示三通道模型全连接层中类别/>对应的权重参数，T是转置操作，/>表示相应的偏置参数；/>表示车辆可见光图像经过三通道模型提取的特征。

(2)

其中，SM表示单通道模型，表示单通道模型的网络参数；/>表示单通道模型交叉熵损失函数；/>表示第/>张车辆红外光图像；/>表示红外光图像数量；/>表示属于第/>类的第/>张车辆红外光图像的/>维独热编码向量，在该向量中第/>个元素取值为1，余下元素取值为0；/>等于类别数量；/>表示单通道模型全连接层中类别/>对应的权重参数，T是转置操作，/>表示相应的偏置参数；/>表示车辆红外光图像经过单通道模型提取的特征。

步骤2.3 利用批量梯度下降法优化公式（1）和（2），训练三通道模型和单通道模型，获得模态独立学习的三通道模型和单通道模型。

步骤3，设计双模态协同学习方式，对获得的模态独立学习的三通道模型和单通道模型进行协同学习。对可见光车辆图像，采用三通道模型提取主特征，并将可见光车辆图像灰度化后采用单通道模型提取辅助特征，再将主特征和辅助特征融合作为可见光车辆图像的完整特征；类似地，对红外光车辆图像，采用单通道模型提取主特征，并将红外光车辆图像复制扩展为三通道图像，采用三通道模型提取辅助特征，再将主特征和辅助特征融合作为红外光车辆图像的完整特征。参见图3，具体包括以下步骤。

步骤3.1，将单通道的红外光车辆图像复制扩展为三通道图像，并和可见光车辆图像联合训练三通道模型，如公式(3)所示：

(3)

其中，TM表示三通道模型，表示三通道模型的网络参数；/>表示三通道模型交叉熵损失函数；/>表示第/>张车辆图像；/>表示图像数量；/>表示属于第/>类的第/>张车辆图像的/>维独热编码向量，在该向量中第/>个元素取值为1，余下元素取值为0；/>等于类别数量； />表示三通道模型全连接层中类别/>对应的权重参数，T是转置操作，/>表示相应的偏置参数；/>表示车辆图像/>经过三通道模型提取的特征，若/>为红外光车辆图像，则/>为辅助特征，Rep表示通道复制函数；若/>为可见光车辆图像，则/>为主特征。

步骤3.2，将可见光车辆图像灰度化，并和红外光车辆图像联合训练单通道模型，如公式(4)所示：

(4)

步骤3.3，将主特征和辅助特征融合作为图像的完整特征，如公式(5)所示：

(5)

其中，表示特征融合后的完整特征。

步骤3.4，构建完整特征对应的交叉熵损失函数，如公式(6)所示，

(6)

步骤3.5，利用完整特征与三通道模型提取特征的KL散度以及完整特征与单通道模型提取特征之间KL散度之和，进行协同学习，如公式(7)所示：

(7)

其中，，/>，分别表示完整特征的后验概率分布、三通道模型提取特征的后验概率分布和单通道模型提取特征的后验概率分布；/>表示完整特征对应的全连接层中类别/>对应的权重参数，/>表示相应的偏置参数；/>表示三通道模型全连接层中类别/>对应的权重参数，/>表示相应的偏置参数；/>表示单通道模型全连接层中类别/>对应的权重参数，/>表示相应的偏置参数；/>表示温度系数，用于软化后验概率分布；T是转置操作。

步骤3.6，在完整特征后加设目标函数驱动三通道和单通道车辆再辨识协同学习，实现特征融合总体优化，如公式(8)所示：

(8)

步骤3.7，利用批量梯度下降法优化公式（8），协同训练三通道模型和单通道模型，获得最终的三通道模型和单通道模型，用于不完备模态车辆再辨识的测试。

本实施例一种面向大范围车辆再辨识的不完备模态特征融合方法，测试阶段包括：

利用训练好的双模态协同学习模型，分别提取待查询车辆图像和候选库中每个车辆的可见光图像和红外光图像的特征向量，将提取的主特征和辅助特征融合作为待查询车辆图像和候选库中车辆图像的完整特征，计算待查询车辆图像的完整特征与候选库中每个车辆图像的完整特征之间的欧氏距离，欧氏距离越小表示两张图像的相似度越大，从而获取待查询车辆图像与候选库中每个车辆图像的相似度关系。根据所得到的相似度大小进行降序排序，并输出识别结果，若输出识别结果排序第一的图像与待查询图像具有相同身份标签，说明本次查询成功，否则，查询失败。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或，单数不排除复数。系统权利要求中陈述的多个单元或系统也可以由一个单元或系统通过软件或者硬件来实现。

最后应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神范围。

Claims

1.一种面向大范围车辆再辨识的不完备模态特征融合方法，其特征在于，包括：

；

其中，TM表示三通道模型，表示三通道模型的网络参数；/>表示三通道模型交叉熵损失函数；X_i表示第i张车辆图像；n表示图像数量；/>表示属于第c类的第i张车辆图像的m维独热编码向量，在该向量中第c个元素取值为1，余下元素取值为0；m等于类别数量；表示三通道模型全连接层中类别c对应的权重参数，T是转置操作，/>表示相应的偏置参数；/>表示车辆图像X_i经过三通道模型提取的特征，若X_i为红外光车辆图像，则/>为辅助特征，Rep表示通道复制函数；若X_i为可见光车辆图像，则/>为主特征；

；

其中，SM表示单通道模型，表示单通道模型的网络参数；/>表示单通道模型交叉熵损失函数；X_i表示第i张车辆图像；n表示图像数量；/>表示属于第c类的第i张车辆图像的m维独热编码向量，在该向量中第c个元素取值为1，余下元素取值为0；m等于类别数量；表示单通道模型全连接层中类别c对应的权重参数，T是转置操作，/>表示相应的偏置参数；/>表示车辆图像X_i经过单通道模型提取的特征，若X_i为可见光车辆图像，则/>为辅助特征，Gray表示灰度化函数，/>表示X_i的红色通道图像；/>表示X_i的绿色通道图像；/>表示X_i的蓝色通道图像；若X_i为红外光车辆图像，则/>为主特征；

；

其中，表示特征融合后的完整特征；

在特征融合后的完整特征上加设目标函数驱动三通道模型和单通道模型再辨识协同学习，实现特征融合总体优化。

2.根据权利要求1所述的面向大范围车辆再辨识的不完备模态特征融合方法，其特征在于，在特征融合后的完整特征上加设目标函数驱动三通道模型和单通道模型再辨识协同学习，实现特征融合总体优化，如下式所示：

；

3.根据权利要求2所述的面向大范围车辆再辨识的不完备模态特征融合方法，其特征在于，所述的完整特征对应的交叉熵损失函数，如下式所示：

；

其中，表示完整特征对应的全连接层中类别c对应的权重参数，/>表示相应的偏置参数。

4.根据权利要求3所述的面向大范围车辆再辨识的不完备模态特征融合方法，其特征在于，所述完整特征与三通道模型提取特征的KL散度以及完整特征与单通道模型提取特征之间KL散度之和，如下式所示：

；

其中，，/>，分别表示完整特征的后验概率分布、三通道模型提取特征的后验概率分布和单通道模型提取特征的后验概率分布；/>表示完整特征对应的全连接层中类别o对应的权重参数，/>表示相应的偏置参数；/>表示三通道模型全连接层中类别o对应的权重参数，/>表示相应的偏置参数；/>表示单通道模型全连接层中类别o对应的权重参数，/>表示相应的偏置参数；/>表示温度系数，用于软化后验概率分布；T是转置操作。