CN107633232A

CN107633232A - 一种基于深度学习的低维人脸模型训练方法

Info

Publication number: CN107633232A
Application number: CN201710884185.0A
Authority: CN
Inventors: 刘梅; 周春燕; 刘明华
Original assignee: Sichuan Changhong Electric Co Ltd
Current assignee: Sichuan Changhong Electric Co Ltd
Priority date: 2017-09-26
Filing date: 2017-09-26
Publication date: 2018-01-26

Abstract

本发明公开了基于深度学习的低维人脸模型训练方法，包括：步骤s1：采集人脸图像并作对齐处理，构造训练样本集；步骤s2：构建轻量型神经网络模型，将训练样本集输入模型中训练，直到模型收敛，得到初始模型；步骤s3：利用初始模型对训练样本打分，随机挑选基准样本，并根据基准样本挑选正负样本的难例样本集；步骤s4：将步骤s3得到的难例进一步丰富化，将丰富后的难例样本组合在一起，作为后续训练的难例集；步骤s5：精调模型：利用难例集精调模型，将s2中的初始训练模型用于初始化新模型，不断迭代训练直到模型收敛。本发明轻量型单网络模型具有参数少，提取的特征维数低，效率高的优点。

Description

一种基于深度学习的低维人脸模型训练方法

技术领域

本发明涉及一种人脸模型训练方法，具体涉及一种基于深度学习的低维人脸模型训练方法，属于计算机视觉技术领域。

背景技术

人脸识别技术是指对输入的人脸图像进行人脸位置确定，并进一步确认每个人脸的身份信息。该研究是人工智能，视觉感知的热门研究课题，已经广泛应用于人机交互、社会安全，移动支付等领域。

人脸识别在技术上因为深度学习的进步以及硬件资源的更新已经有了质的飞跃，在标准测试库(LFW)上的识别率已赶超人类。但大多数效果良好的深度学习模型都是基于多网络深网络，针对特定的测试库。因此在实时应用时，存在效率低下，不能适应各种变换场景的问题。

目前基于卷积神经网络的模型训练，训练样本集大多来自于网络爬虫搜索，样本不够丰富(光线，姿态，遮挡，分辨率)，样本分布不够广泛。在训练过程中，随机选择小批量图像进行模型参数更新，随机性太强，得到的模型不够鲁棒。

发明内容

本发明提供了一种基于深度学习的低维人脸模型训练方法。设计了一种轻量型的单网络，在同样的训练库下，该方法可以实现人脸识别率的大幅提升，且人脸特征仅有256维。

本发明所采用的技术方案是：

基于深度学习的低维人脸模型训练方法，包括如下步骤：

步骤s1：采集人脸图像并作对齐处理，构造训练样本集；

步骤s2：构建轻量型神经网络模型，将训练样本集输入模型中训练，直到模型收敛，得到初始模型；

步骤s3：利用初始模型对训练样本打分，随机挑选基准样本，并根据基准样本挑选正负样本的难例样本集；

步骤s4：将步骤s3得到的难例进一步丰富化，将丰富后的难例样本组合在一起，作为后续训练的难例集；

步骤s5：精调模型：利用难例集精调模型，将s2中的初始训练模型用于初始化新模型，不断迭代训练直到模型收敛；

进一步的所述步骤s2的步骤包括：构建的轻量型网络包括5个卷积层，4个最大池化层，2个全连接层，提取人脸特征的模型包含大约4M个参数；

所述步骤s3的步骤包括：

s31：利用步骤s2得到的模型提取训练样本集里的人脸特征，将第一个全连接层的256维输出作为低维的人脸特征；

s32：计算余弦距离，选取难例，与基准样本是同一个人的，选取原则是，选择距离远的样本；而不是同一人的样本，则选取距离近的样本；

所述步骤s4的步骤包括：

s41：难例样本的丰富化包括增加面部光线，按人脸关键点的位置计算人脸的面部亮度，如果亮度较暗，提升人脸面部亮度，如果亮度亮，则降低亮度，并保存为新的样本；

s42：提高、降低图像分辨率到原始训练样本大小的一倍、一半。

所述步骤s5的步骤包括：将每个人的难例样本以及丰富后的样本组合在一起，构建难例batch，每个人挑选的难例batch个数要保持一致。

本发明相比现有技术具有以下优点，轻量型单网络模型具有参数少，提取的特征维数低，效率高的优点。传统训练方法没有设置难例样本集，是将所有样本直接加入模型训练，而难例样本集在训练的迭代优化中，对模型进行约束，使模型对相同人和不同人的样本有更强的辨识能力。难例的样本丰富化使得模型对环境的变化鲁棒性更强。

附图说明

图1为本发明方法流程图；

图2部分正难例；随机挑选一个基准样本，图2中选定org董璇.jpg为当前基准样本，利用初始模型测试董璇这个分类下的所有正样本与基准样本的距离，选取距离远的样本为正难例；

图3部分负难例。根据图2所示，选定org董璇.jpg为当前基准样本，利用初始模型对所有非董璇类训练样本打分，选取距离org董璇.jpg较近的负样本为负难例。

具体实施方式

下面结合实施例与附图对本发明进行详细描述：

本发明主要应用于深度卷积神经网络的模型训练，应用于人脸识别率的提升，具体实施步骤如下：

实施例1

本实施例提供了一种深度卷积神经网络的模型训练方法，如图1所示，具体包括以下步骤：

步骤s1：采集亚洲人脸图像，对图像做预处理，包括人脸检测，关键点检测，人脸对齐，构造训练样本集；

步骤s2：构建轻量型神经网络模型，将训练样本集输入模型中训练，直到模型收敛，得到初始模型。构建的轻量型网络包括5个卷积层，4个最大池化层，2个全连接层；

步骤s3：利用初始模型对训练样本打分，随机挑选基准样本，并根据基准样本挑选正负样本的难例样本集，例如，从lm这个人的样本里面随机选择一张图像作为基准样本，计算lm其他样本与基准样本的距离，选取远距离的样本作为正样本的难例，计算其他人的样本与基准样本的距离，选择距离近的样本作为负样本的难例；

步骤s4：根据基准样本，求取正负难例，并组合为一个batch，得到N个人的所有难例集，进一步，对难例集丰富化，包括将每个样本进行降分辨率，调整光线，将丰富后的难例样本组合在一起，作为后续训练的难例集；

步骤s5：利用难例集精调模型，将s2中的初始训练模型用于初始化新模型，设置batch的大小为每个人难例样本的数量，不断迭代训练直到模型收敛；

附图2、3为本发明一个实施例得到的部分正难例和部分负难例的示意图。

尽管这里参照本发明的解释性实施例对本发明进行了描述，上述实施例仅为本发明较佳的实施方式，本发明的实施方式并不受上述实施例的限制，应该理解，本领域技术人员可以设计出很多其他的修改和实施方式，这些修改和实施方式将落在本申请公开的原则范围和精神之内。

Claims

1.一种基于深度学习的低维人脸模型训练方法，其特征在于包括如下步骤：

步骤s1：采集人脸图像并作对齐处理，构造训练样本集；

步骤s5：精调模型：利用难例集精调模型，将s2中的初始训练模型用于初始化新模型，不断迭代训练直到模型收敛。

2.根据权利要求1所述基于深度学习的低维人脸模型训练方法，其特征在于：

步骤s2包括：构建的轻量型网络包括5个卷积层，4个最大池化层，2个全连接层，提取人脸特征的模型包含大约4M个参数。

3.根据权利要求1所述基于深度学习的低维人脸模型训练方法，其特征在于：

所述步骤s3包括：

s32：计算余弦距离，选取难例，与基准样本是同一个人的，选取原则是，选择距离远的样本；而不是同一人的样本，则选取距离近的样本。

4.根据权利要求1所述基于深度学习的低维人脸模型训练方法，其特征在于：

步骤s4包括：

5.根据权利要求1所述基于深度学习的低维人脸模型训练方法，其特征在于：

步骤s5包括：将每个人的难例样本以及丰富后的样本组合在一起，构建难例batch，每个人挑选的难例batch个数要保持一致。