WO2020001082A1

WO2020001082A1 - 一种基于迁移学习的人脸属性分析方法

Info

Publication number: WO2020001082A1
Application number: PCT/CN2019/078472
Authority: WO
Inventors: 陆生礼; 庞伟; 向家淇; 周世豪; 杨文韬; 泮雯雯
Original assignee: 东南大学
Priority date: 2018-06-30
Filing date: 2019-03-18
Publication date: 2020-01-02
Also published as: CN109325398B; CN109325398A

Abstract

一种基于迁移学习的人脸属性分析方法，属于计算推算的技术领域，尤其涉及识别人脸属性的计算机视觉技术领域。方法包括在多属性预测网络上联合训练样本集以预测特征属性，将收敛的多属性预测网络迁移到主属性预测网络，继续训练主属性预测网络并微调参数直至主属性预测网络的损失函数收敛，所述主属性包含但不限于基于逻辑回归的人脸属性以及基于线性回归的人脸属性的主属性，既防止了局部极小，又避免了任务过于复杂导致的精度降低，在实际应用中更加精确灵活。

Description

一种基于迁移学习的人脸属性分析方法

技术领域

本发明公开了一种基于迁移学习的人脸属性分析方法，属于计算推算的技术领域，尤其涉及识别人脸属性的计算机视觉技术领域。

背景技术

人脸属性分析指对特定图片分析其是否为人脸、校正不在图像中心或过大过小的人脸、定位人脸关键点以及判别人脸面部特征。分析出来的不同属性能应用于不同场合：判别是否为人脸能过滤人脸检测中误检的非人脸；校正不在图像中心或过大过小的人脸、定位人脸关键点能微调人脸检测的结果；判别人脸面部特征能进一步为大样本人脸识别任务提供特征索引且可用于辅助其它人脸相关的任务。

通常人脸属性分析使用深度学习的卷积神经网络进行特征提取，再根据提取到的特征进行分类以得到人脸的相关属性。与传统的人工提取特征相比，卷积神经网络不需要大量的先验知识，经过训练后只要输入一张图片就能自动提取图片的特征。

多任务学习是目前深度学习领域广泛应用的技术，由于单个任务过于简单，在训练时很容易陷入局部极小值，在预测时很难达到很好的效果，因此，人脸属性分析时，往往将多个相关属性同时训练。然而，人脸属性不同于容易取得多分类样本的人脸识别等任务，传统的人脸属性分析方法只有几个简单分类任务而没有精度需求很高的回归任务，因此仍然容易陷入过拟合。

此外，通常人脸属性分析需要先经过人脸检测，再将检测到的人脸图像输入属性分析系统。由于人脸检测结果在复杂条件下极不稳定，往往存在偏差，导致人脸属性分析的准确性也受到影响。比如，当输入一张非人脸时，因为没有人脸辨识任务的辅助，传统的属性分析系统也会输出某个人脸属性而不会识别出非人脸的负样本。

发明内容

本发明的发明目的是针对上述背景技术的不足，提供了一种基于迁移学习的人脸属性分析方法，实现了更加灵活准确的人脸属性分析，解决了传统属性分析仅采用简单分类任务导致的过拟合的技术问题。

本发明为实现上述发明目的采用如下技术方案：

一种基于迁移学习的人脸属性分析方法，包括如下步骤：

步骤一：设计卷积神经网络的结构，卷积神经网络包括多属性预测网络和主属性预测网络，主属性预测网络的全连接层的输出只包含主属性预测部分，主属性预测网络的卷积层和多属性预测网络的卷积层部分完全相同；

步骤二：准备训练数据集，数据集包括通过各类人脸数据库建立的训练样本集以及相应的标注，每张图片均带有自己的标签，训练样本集包括人脸正样本(带边框信息)、人脸负样本、人脸部分样本(带边框信息)、人脸关键点样本和人脸面部特征样本，人脸正、负、部分样本的产生步骤包括对人脸检测数据集的随机剪切和缩放，人脸关键点样本的产生步骤包括对人脸关键点数据集的随机剪切和缩放；

步骤三：将包含各类人脸属性样本的样本集在多属性预测网络进行联合训练至基本收敛，根据多属性预测网络中卷积层提取的共享特征向量和损失函数需要的特征属性的维数构成全连接层，全连接层判别输入样本特征属性并根据样本标签调用损失函数以计算损失函数值，如，全连接层对人脸正、负、部分的判别和人脸面部特征判别调用Softmax作为损失函数，全连接层对人脸关键点和边框的判别调用均方误差作为损失函数，全连接层每次前向传播计算损失时，只有与输入样本相关的属性被激活，当对训练数据集分批训练时，每批次的损失是该批次内所有样本损失函数值的平均值；

步骤四：将训练后的多属性预测网络模型迁移到主属性预测网络进行再训练以识别主属性，具体是采用多属性预测网络损失函数收敛时的参数初始化主属性预测网络，参数包括权重参数和偏置参数。

优选的，人脸检测数据集包含图片中所有人脸的真实边框标注，正、负、部分样本的划分根据随机剪切后的边框与所有真实边框交叠率δ确定：当δ<δ ₁时为判定负样本，当δ>δ ₂时判定为正样本，当δ ₁<δ<δ ₂时判定为部分样本。

优选地，通过随机旋转包含人脸关键点真实坐标标注的人脸关键点数据集以扩充人脸关键点数据集，具体方法为：1)设置旋转角度θ，旋转正角度对应逆时针，相应地，负角度对应顺时针；2)计算旋转之后图片四个角点的新坐标，确定旋转后的显示区域；3)依据四个角点旋转前后的坐标，求出仿射变换矩阵；4)对所有关键点应用步骤3中求得的仿射变换，求出旋转之后的关键点坐标。

优选的，步骤二中按照卷积神经网络各层输入图像的尺寸对随机剪切后的图片进行缩放至尺寸。

可选的，人脸属性包括各种人脸相关的线性回归和逻辑回归任务，其中，基于逻辑回归的人脸属性包括人脸判断和人脸面部特征，基于线性回归的人脸属性包括关键点如五官在人脸的相对位置、人脸框在整张图片中的相对位置等。

本发明采用上述技术方案，具有以下有益效果：

(1)本发明首先对包含各类人脸属性的多任务进行联合训练以提取孤立的特征属性，然后将训练好的模型迁移到训练更侧重属性的主属性预测网络中继续训练进而实现对孤立特征属性的结合分析，提升使单类属性的预测精度，既防止了局部极小，又避免了任务过于复杂导致的精度降低，能够完成基于回归人脸属性的高精度识别；

(2)本发明公开的人脸属性分析方法通过对现有人脸数据可进行裁剪、缩放、旋转的操作增强数据进而提高模型泛化能力，能够实现人脸边框等复杂人脸属性识别的高精度识别，能够避免传统人脸属性分析方法依赖于人脸结果的缺陷，在实际应用中更加精确灵活。

附图说明

图1为本发明公开的人脸属性分析方法的流程图。

图2为模型参数迁移的示意图。

具体实施方式

下面结合附图对发明的技术方案进行详细说明。

本申请针对传统人脸属性分析方法由于任务过于简单，在训练时容易陷入过拟合的问题，提出了融合人脸边界框等多种复杂人脸属性的多任务训练。

人脸属性包括各种与人脸相关的线性回归和逻辑回归任务，基于逻辑回归的人脸属性包括人脸判断和人脸面部特征，基于线性回归的人脸属性包括五官在人脸的相对位置、人脸框在整张图片中的相对位置等。

本发明提出的基于迁移学习的人脸属性分析方法如图1所示，主要包括如下四个大步骤。

步骤一：设计卷积神经网络的结构

卷积神经网络的设计包括多属性预测网络设计和主属性预测网络设计。卷积神经网络结构由卷积层和全连接层组成，其中，全连接层输出大小由具体的特征属性确定，卷积层输出共享的特征向量作为全连接层的输入。主属性预测网络的全连接层只包含主属性预测部分，卷积层和多属性预测网络的卷积层部分完全相同。示例性地，本方法将人脸关键点检测作为主属性。

步骤二：准备训练数据集

数据集包括通过各类人脸数据库建立的训练样本集以及相应的标注，每张图片均带有自己的标签，训练样本集包括人脸正样本(带边框信息)、人脸负样本、人脸部分样本(带边框信息)、人脸关键点样本和人脸面部特征样本，人脸正、负、部分样本的产生步骤包括对人脸检测数据集的随机剪切和缩放，人脸关键点样本的产生步骤包括对人脸关键点数据集的随机旋转、随机剪切和缩放，经剪切的图片缩放后的大小由卷积神经网络各层的输入图像的大小来确定。

在本发明的实施例中，人脸正、负、部分样本由Wider face数据集生成，人脸关键点和各种人脸属性由CelebA数据集生成，CelebA数据集中的每个图像有40余种标注好的属性，在本实施例中，从中选出与人脸关键点相关的16个属性作为人脸关键点样本和人脸面部特征样本，如，眼间距宽窄、鼻子高低、嘴唇厚薄、是否微笑等16种特征。

在本发明的实施例中，人脸检测数据集包含图片中所有人脸的真实边框标注，其中，正、负、部分样本的划分根据随机剪切后的边框与所有真实边框的交叠率δ确定。

人脸负样本(δ<0.4)的产生方式为：

设(x ₁,y ₁)为边框左上角点坐标，(x ₂,y ₂)为边框右下角点坐标，w,h为真实边框的宽度和高度。Δx,Δy为边框左上角(x ₁,y ₁)的随机偏移量，示例性地，取Δx＝RAND(-x ₁,w),Δy＝RAND(-y ₁,h)，RAND为随机数。

人脸正样本(δ>0.65)的产生方式为：

对随机裁剪后的图片进行边框信息计算并求取边框偏移，示例性地，取，Δx＝RAND(-0.2w,0.2w),Δy＝RAND(-0.2h,-0.2h)，裁剪的大小L＝RAND(min(w,h)*0.8,max(w,h)*1.25)，RAND为随机数，(x′ ₁,y′ ₁)为平移后边框左上角点坐标，(x′ ₂,y′ ₂)平移后边框右下角点坐标，

x′ ₂＝x′ ₁+L，

y′ ₂＝y′ ₁+L，

则边框偏移计算方法如下：

人脸部分样本(0.4<δ<0.65)的产生方式和正样本类似，这里不再赘述。

在本发明的实施例中，将图片绕左下角逆时针旋转以扩充人脸关键点数据集，其中，确定旋转之后的关键点在新图片上的坐标的方法包括如下步骤：

1)：设置旋转角度θ，旋转正角度为逆时针，相应地，负角度指顺时针；

2)：以图片左下角为坐标原点，计算旋转之后A、B、C、D四个角点的新坐标，确定旋转后的显示区域，w,h为原始图片的宽度和高度，

其中，1≤i≤n,i是自然数，n为关键点个数，

A _x＝h sin θ，

A _y＝h cos θ，

B _x＝0，

B _y＝0，

C _x＝w cos θ，

C _x＝w sin θ，

D _x＝w cos θ-hsinθ，

D _y＝w sin θ-hcosθ，

(x _i,y _i)为第i个关键点在原图中的坐标；

3)对n个关键点应用步骤二中求得的仿射变换，求出旋转之后的关键点坐标(x′ _i,y′ _i)：

x′ _i＝x _icosθ-y _isinθ+|min(A _x,B _x,C _x,D _x)|，

y′ _i＝x _isinθ+y _icosθ+|min(A _y,B _y,C _y,D _y)|。

步骤三：将包含各类人脸属性样本的样本集在多属性预测网络进行联合训练至基本收敛

多属性预测网络中卷积层从样本集中提取共享特征向量，根据损失函数需要的特征向量维数构建全连接层，全连接层判别输入样本的特征属性并根据样本标签调用损失函数以计算损失函数值，如，全连接层对人脸正、负、部分的判别和人脸面部特征判别调用Softmax作为损失函数，全连接层对人脸关键点和边框的判别调用均方误差作为损失函数，但全连接层每次前向传播计算损失时，只有与样本相关的属性被激活，当训练数据集分批训练时，从各类属性样本中随机抽取一批数据以保证各类属性样本数量满足一定比例，每批次的损失是该批次内所有样本损失函数值的平均值。

步骤四：将训练后的模型迁移到主属性预测网络进行再训练得到最终的主属性神经网络模型

如图2所示，将联合训练后的多属性预测网络参数作为主属性预测网络的参数，参数包括权重参数和偏置参数。

综上，本发明具有以下有益效果：

Claims

一种基于迁移学习的人脸属性分析方法，其特征在于，在多属性预测网络上联合训练样本集以预测特征属性，将收敛的多属性预测网络迁移到主属性预测网络，继续训练主属性预测网络并微调参数直至主属性预测网络的损失函数收敛，所述主属性包含但不限于基于逻辑回归的人脸属性以及基于线性回归的人脸属性的主属性。
根据权利要求1所述一种基于迁移学习的人脸属性分析方法，其特征在于，所述样本集包含但不限于带边框信息的人脸正样本、人脸负样本、带边框信息的人脸部分样本、人脸关键点样本和人脸面部特征样本。
根据权利要求2所述一种基于迁移学习的人脸属性分析方法，其特征在于，基于逻辑回归的人脸属性包含但不限于人脸判断和人脸面部特征，基于线性回归的人脸属性包含但不限于关键点在人脸的相对位置、人脸框在整张图片中的相对位置。
根据权利要求2所述一种基于迁移学习的人脸属性分析方法，其特征在于，带边框信息的人脸正样本、人脸负样本、带边框信息的人脸部分样本的生成方法为：对包含人脸真实边框标注的人脸检测数据集进行剪切和/或缩放的预处理，依据预处理后图片的边框与人脸检测数据集的所有真实边框的交叠率δ划分样本，将δ<δ ₁的图片划分为人脸负样本，将δ>δ ₂的图片划分为带边框信息的正样本，将δ ₁<δ<δ ₂的图片划分为带边框信息的人脸部分样本，δ ₂、δ ₁为预处理后图片的边框与人脸检测数据集的所有真实边框的交叠率的上下限。
根据权利要求2所述一种基于迁移学习的人脸属性分析方法，其特征在于，所述人脸关键点样本的生成方法为：对人脸关键点数据集进行剪切和/或缩放的预处理。
根据权利要求5所述一种基于迁移学习的人脸属性分析方法，其特征在于，对人脸关键点数据集进行旋转以扩充数据的方法为：依据人脸关键点数据集中图片角点旋转前后的坐标确定图片的仿射变换矩阵以及旋转后的图片显示区域，对图片中的关键点坐标进行仿射变换得到旋转后的关键点坐标。
根据权利要求2所述一种基于迁移学习的人脸属性分析方法，其特征在于，在多属性预测网络上联合训练样本集以预测特征属性的具体方法为：通过卷积层提取训练样本集的共享特征，判别输入样本的特征属性并根据输入样本的标签调用损失函数，与输入样本相关的属性在前向传播预测样本的损失值时激活。
根据权利要求7所述一种基于迁移学习的人脸属性分析方法，其特征在于，输入样本的标签为带边框信息的人脸正样本、人脸负样本、带边框信息的人脸部分样本和人脸面部特征样本时，调用预Softmax作为损失函数。
根据权利要求7所述一种基于迁移学习的人脸属性分析方法，其特征在于，输入样本为人脸关键点样本时，调用均方误差作为损失函数。
根据权利要求1所述一种基于迁移学习的人脸属性分析方法，其特征在于，将收敛的多属性预测网络迁移到主属性预测网络为：采用收敛的多属性预测网络的参数初始化主属性预测网络参数，参数包括权重参数和偏置参数。