CN111126310A

CN111126310A - 一种基于场景迁移的行人性别识别方法

Info

Publication number: CN111126310A
Application number: CN201911367254.6A
Authority: CN
Inventors: 曾焕强; 蔡磊; 朱建清; 曹九稳; 张云; 马凯光
Original assignee: Huaqiao University
Current assignee: Huaqiao University
Priority date: 2019-12-26
Filing date: 2019-12-26
Publication date: 2020-05-08
Anticipated expiration: 2039-12-26
Also published as: CN111126310B

Abstract

本发明涉及一种基于场景迁移的行人性别识别方法，包括场景迁移过程与性别识别过程。本发明通过对偶生成对抗模型对来自不同场景的行人图像集进行图像迁移，减小不同数据集中行人场景的差异。利用迁移图像训练卷积神经网络，使网络模型具有较高精度的性别识别能力。本发明结合了对偶生成对抗模型用于图像迁移的优点，解决了以往基于卷积神经网络在行人性别识别问题上的不足，有效地提高了行人性别识别精度。本发明可以被广泛地应用在智能视频监控场景，大型商场的人口统计等。

Description

一种基于场景迁移的行人性别识别方法

技术领域

本发明涉及计算机视觉和模式识别技术领域，更具体地说，涉及一种基于场景迁移的行人性别识别方法。

背景技术

随着互联网、云计算和多媒体技术的快速发展，视频监控系统已广泛地部署在城市的各个角落，例如街道、机场、火车站等公共场所。在这些监控系统中，行人身份识别在公共安全中发挥着重要作用。作为行人身份识别技术的重要辅助手段，行人性别识别技术是行人智能监控系统进行远距离目标身份识别的重要组成部分。

行人性别识别是指在监控视频中识别出过往行人的性别，其具有重要的应用价值，例如大型商场的人口统计等。

现有技术的方法是基于手工特征进行行人性别识别，例如提取行人轮廓特征(HOG)或者纹理特征(LBP)，并运用SVM、Adboost等分类器实现性别分类；但单一的手工特征提取方法的识别精度普遍不高。

或者，基于目前比较流行的深度学习方法进行特征学习与分类，而基于卷积神经网络方法往往泛化性能较差，对输入噪声和抖动比较敏感，例如当输入图像的场景发生改变时，由于训练数据无法涵盖所有场景下的行人图像，导致在测试阶段神经网络可能无法有效地应对场景变化所造成的识别错误。

发明内容

本发明的目的在于克服现有技术的不足，提供一种基于场景迁移的行人性别识别方法，有效地提高了行人性别识别精度。

本发明的技术方案如下：

一种基于场景迁移的行人性别识别方法，包括场景迁移过程、性别识别过程；

场景迁移过程，步骤如下：

1.1)设定行人图像数据集

和

分别来自U和V两种不同的场景；

1.2)提取

和

中的行人掩模，得到掩模图像数据集

和

1.3)构建对偶生成对抗网络，利用

和

训练对偶生成对抗网络，直至对偶生成对抗模型收敛，得到生成模型G_U→V和G_V→U；

其中，通过G_U→V能够将来自U场景下的行人图像迁移至V场景，同时保持被迁移图像中行人外貌和姿态不发生改变；通过G_V→U能够将来自V场景下的行人图像迁移至U场景，同时保持被迁移图像中行人外貌和姿态不发生改变；

当行人图像从U场景迁移至V场景时，性别识别过程步骤如下：

2.1)把

中的每张行人图像输入G_U→V，经过前向传播，得到与

相对应的迁移图像集

2.2)构建卷积神经网络，利用

训练卷积神经网络，直至网络收敛，得到模型P；

2.3)把

中的每张行人图像输入到模型P，经前向传播，获得深度特征，利用Softmax 分类函数对深度特征计算其性别概率，输出性别识别结果；

或者，当行人图像从V场景迁移至U场景时，性别识别过程步骤如下：

2.1)把

中的每张行人图像输入G_V→U，经过前向传播，得到与

相对应的迁移图像集

2.2)构建卷积神经网络，利用

训练卷积神经网络，直至网络收敛，得到模型P；

2.3)把

作为优选，步骤1.3)中，模型G_U→V和G_V→U的获得步骤如下：

1.3.1)随机从

和

中分别选取k张行人图像及其对应的掩模图像，k≤M，k≤N；

1.3.2)将选取的行人图像与掩模图像输入对偶生成对抗网络进行对抗训练；

1.3.3)重复步骤1.3.1)、步骤1.3.2)，直至对偶生成对抗模型收敛，得到生成模型G_U→V和 G_V→U。

作为优选，步骤1.3)中，对抗训练采用的损失函数为对偶生成对抗损失函数与行人外貌映射损失函数之和，具体为：

L＝L_DualGAN(u,v)+L_KPAM(u,v)；

其中，L_DualGAN(u,v)表示对偶对抗损失函数，L_KPAM(u,v)表示行人外貌映射损失函数； D_p(·)和D_d(·)表示两个对偶的鉴别器，D_p(·)用于鉴别生成图像是否为U场景的图像，D_d(·) 用于鉴别生成图像是否为V场景的图像，z和

为随机噪声向量，λ₁、λ₂、λ₃和λ₄为参数常量，⊙表示点乘操作，M(u)和M(v)分别表示U场景和V场景的掩模图像。

作为优选，步骤2.2)中，模型P的获取步骤如下：

2.2.1)随机从

中选取m张具有性别标签属性的迁移图像，m≤M；

2.2.2)将选取的迁移图像送入卷积神经网络进行训练；

2.2.3)重复步骤2.2.1)和2.2.2)，直到卷积神经网络收敛，得到模型P；

或者，2.2.1)随机从

中选取n张具有性别标签属性的迁移图像，n≤N；

2.2.2)将选取的迁移图像送入卷积神经网络进行训练；

作为优选，卷积神经网络训练过程中，第l层参数更新如下：

权重参数：

偏置参数：

其中，l表示网络层数，α表示学习步长，W^(l)表示第l层神经元的权重参数，ΔW^(l)表示第l层神经元权重参数的导数，b^(l)表示第l层神经元的偏置参数，Δb^(l)表示第l层神经元偏置参数的导数，m表示一次训练输入的图片数量，λ表示正则化因子。

本发明的有益效果如下：

本发明所述的基于场景迁移的行人性别识别方法，通过对偶生成对抗模型对来自不同场景的行人图像集进行图像迁移，减小不同数据集中行人场景的差异。利用迁移图像训练卷积神经网络，使网络模型具有较高精度的性别识别能力。本发明结合了对偶生成对抗模型用于图像迁移的优点，解决了以往基于卷积神经网络在行人性别识别问题上的不足，有效地提高了行人性别识别精度。

本发明可以被广泛地应用在智能视频监控场景，大型商场的人口统计等。

附图说明

图1是场景迁移过程的原理示意图；

图2是性别识别过程的原理示意图。

具体实施方式

以下结合附图及实施例对本发明进行进一步的详细说明。

本发明提供一种基于场景迁移的行人性别识别方法，包括场景迁移过程、性别识别过程。

场景迁移过程，如图1所示，步骤如下：

1.1)设定行人图像数据集

和

分别来自U和V两种不同的场景；

1.2)通过行人掩模提取模块提取

和

中的行人掩模，得到掩模图像数据集

和

1.3)构建对偶生成对抗网络，利用

和

其中，通过G_U→V能够将来自U场景下的行人图像迁移至V场景，同时保持被迁移图像中行人外貌和姿态不发生改变；通过G_V→U能够将来自V场景下的行人图像迁移至U场景，同时保持被迁移图像中行人外貌和姿态不发生改变。

模型G_U→V和G_V→U的获得步骤具体如下：

1.3.1)随机从

和

中分别选取k张行人图像及其对应的掩模图像，k≤M，k≤N；

对抗训练采用的损失函数为对偶生成对抗损失函数与行人外貌映射损失函数之和，具体为：

L＝L_DualGAN(u,v)+L_KPAM(u,v)；

如图2所示，当行人图像从U场景迁移至V场景时，性别识别过程的步骤如下：

2.1)把

中的每张行人图像输入G_U→V，经过前向传播，得到与

相对应的迁移图像集

2.2)构建卷积神经网络，利用

训练卷积神经网络，直至网络收敛，得到模型P；

模型P的获取步骤具体如下：

2.2.1)随机从

中选取m张具有性别标签属性的迁移图像，m≤M；

2.2.2)将选取的迁移图像送入卷积神经网络进行训练；

2.3)把

中的每张行人图像输入到模型P，经前向传播，获得深度特征，利用Softmax 分类函数对深度特征计算其性别概率，输出性别识别结果。

2.1)把

中的每张行人图像输入G_V→U，经过前向传播，得到与

相对应的迁移图像集

2.2)构建卷积神经网络，利用

训练卷积神经网络，直至网络收敛，得到模型P；

模型P的获取步骤具体如下：

2.2.1)随机从

中选取n张具有性别标签属性的迁移图像，n≤N；

2.2.2)将选取的迁移图像送入卷积神经网络进行训练；

2.3)把

所述的卷积神经网络训练过程中，第l层参数更新如下：

权重参数：

偏置参数：

上述实施例仅是用来说明本发明，而并非用作对本发明的限定。只要是依据本发明的技术实质，对上述实施例进行变化、变型等都将落在本发明的权利要求的范围内。

Claims

1.一种基于场景迁移的行人性别识别方法，其特征在于，包括场景迁移过程、性别识别过程；

场景迁移过程，步骤如下：

1.1)设定行人图像数据集

和

分别来自U和V两种不同的场景；

1.2)提取

和

中的行人掩模，得到掩模图像数据集

和

1.3)构建对偶生成对抗网络，利用

和

2.1)把

中的每张行人图像输入G_U→V，经过前向传播，得到与

相对应的迁移图像集

2.2)构建卷积神经网络，利用

训练卷积神经网络，直至网络收敛，得到模型P；

2.3)把

中的每张行人图像输入到模型P，经前向传播，获得深度特征，利用Softmax分类函数对深度特征计算其性别概率，输出性别预测结果；

2.1)把

中的每张行人图像输入G_V→U，经过前向传播，得到与

相对应的迁移图像集

2.2)构建卷积神经网络，利用

训练卷积神经网络，直至网络收敛，得到模型P；

2.3)把

中的每张行人图像输入到模型P，经前向传播，获得深度特征，利用Softmax分类函数对深度特征计算其性别概率，输出性别预测结果。

2.根据权利要求1所述的基于场景迁移的行人性别识别方法，其特征在于，步骤1.3)中，模型G_U→V和G_V→U的获得步骤如下：

1.3.1)随机从

和

中分别选取k张行人图像及其对应的掩模图像，k≤M，k≤N；

1.3.3)重复步骤1.3.1)、步骤1.3.2)，直至对偶生成对抗模型收敛，得到生成模型G_U→V和G_V→U。

3.根据权利要求1或2所述的基于场景迁移的行人性别识别方法，其特征在于，步骤1.3)中，对抗训练采用的损失函数为对偶生成对抗损失函数与行人外貌映射损失函数之和，具体为：

L＝L_DualGAN(u,v)+L_KPAM(u,v)；

其中，L_DualGAN(u,v)表示对偶对抗损失函数，L_KPAM(u,v)表示行人外貌映射损失函数；D_p(·)和D_d(·)表示两个对偶的鉴别器，D_p(·)用于鉴别生成图像是否为U场景的图像，D_d(·)用于鉴别生成图像是否为V场景的图像，z和

4.根据权利要求1所述的基于场景迁移的行人性别识别方法，其特征在于，步骤2.2)中，模型P的获取步骤如下：

2.2.1)随机从

中选取m张具有性别标签属性的迁移图像，m≤M；

2.2.2)将选取的迁移图像送入卷积神经网络进行训练；

或者，2.2.1)随机从

中选取n张具有性别标签属性的迁移图像，n≤N；

2.2.2)将选取的迁移图像送入卷积神经网络进行训练；

2.2.3)重复步骤2.2.1)和2.2.2)，直到卷积神经网络收敛，得到模型P。

5.根据权利要求1或4所述的基于场景迁移的行人性别识别方法，其特征在于，卷积神经网络训练过程中，第l层参数更新如下：

权重参数：

偏置参数：