CN107633232A - 一种基于深度学习的低维人脸模型训练方法 - Google Patents
一种基于深度学习的低维人脸模型训练方法 Download PDFInfo
- Publication number
- CN107633232A CN107633232A CN201710884185.0A CN201710884185A CN107633232A CN 107633232 A CN107633232 A CN 107633232A CN 201710884185 A CN201710884185 A CN 201710884185A CN 107633232 A CN107633232 A CN 107633232A
- Authority
- CN
- China
- Prior art keywords
- model
- sample
- difficult example
- training
- low
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了基于深度学习的低维人脸模型训练方法,包括:步骤s1:采集人脸图像并作对齐处理,构造训练样本集;步骤s2:构建轻量型神经网络模型,将训练样本集输入模型中训练,直到模型收敛,得到初始模型;步骤s3:利用初始模型对训练样本打分,随机挑选基准样本,并根据基准样本挑选正负样本的难例样本集;步骤s4:将步骤s3得到的难例进一步丰富化,将丰富后的难例样本组合在一起,作为后续训练的难例集;步骤s5:精调模型:利用难例集精调模型,将s2中的初始训练模型用于初始化新模型,不断迭代训练直到模型收敛。本发明轻量型单网络模型具有参数少,提取的特征维数低,效率高的优点。
Description
技术领域
本发明涉及一种人脸模型训练方法,具体涉及一种基于深度学习的低维人脸模型训练方法,属于计算机视觉技术领域。
背景技术
人脸识别技术是指对输入的人脸图像进行人脸位置确定,并进一步确认每个人脸的身份信息。该研究是人工智能,视觉感知的热门研究课题,已经广泛应用于人机交互、社会安全,移动支付等领域。
人脸识别在技术上因为深度学习的进步以及硬件资源的更新已经有了质的飞跃,在标准测试库(LFW)上的识别率已赶超人类。但大多数效果良好的深度学习模型都是基于多网络深网络,针对特定的测试库。因此在实时应用时,存在效率低下,不能适应各种变换场景的问题。
目前基于卷积神经网络的模型训练,训练样本集大多来自于网络爬虫搜索,样本不够丰富(光线,姿态,遮挡,分辨率),样本分布不够广泛。在训练过程中,随机选择小批量图像进行模型参数更新,随机性太强,得到的模型不够鲁棒。
发明内容
本发明提供了一种基于深度学习的低维人脸模型训练方法。设计了一种轻量型的单网络,在同样的训练库下,该方法可以实现人脸识别率的大幅提升,且人脸特征仅有256维。
本发明所采用的技术方案是:
基于深度学习的低维人脸模型训练方法,包括如下步骤:
步骤s1:采集人脸图像并作对齐处理,构造训练样本集;
步骤s2:构建轻量型神经网络模型,将训练样本集输入模型中训练,直到模型收敛,得到初始模型;
步骤s3:利用初始模型对训练样本打分,随机挑选基准样本,并根据基准样本挑选正负样本的难例样本集;
步骤s4:将步骤s3得到的难例进一步丰富化,将丰富后的难例样本组合在一起,作为后续训练的难例集;
步骤s5:精调模型:利用难例集精调模型,将s2中的初始训练模型用于初始化新模型,不断迭代训练直到模型收敛;
进一步的所述步骤s2的步骤包括:构建的轻量型网络包括5个卷积层,4个最大池化层,2个全连接层,提取人脸特征的模型包含大约4M个参数;
所述步骤s3的步骤包括:
s31:利用步骤s2得到的模型提取训练样本集里的人脸特征,将第一个全连接层的256维输出作为低维的人脸特征;
s32:计算余弦距离,选取难例,与基准样本是同一个人的,选取原则是,选择距离远的样本;而不是同一人的样本,则选取距离近的样本;
所述步骤s4的步骤包括:
s41:难例样本的丰富化包括增加面部光线,按人脸关键点的位置计算人脸的面部亮度,如果亮度较暗,提升人脸面部亮度,如果亮度亮,则降低亮度,并保存为新的样本;
s42:提高、降低图像分辨率到原始训练样本大小的一倍、一半。
所述步骤s5的步骤包括:将每个人的难例样本以及丰富后的样本组合在一起,构建难例batch,每个人挑选的难例batch个数要保持一致。
本发明相比现有技术具有以下优点,轻量型单网络模型具有参数少,提取的特征维数低,效率高的优点。传统训练方法没有设置难例样本集,是将所有样本直接加入模型训练,而难例样本集在训练的迭代优化中,对模型进行约束,使模型对相同人和不同人的样本有更强的辨识能力。难例的样本丰富化使得模型对环境的变化鲁棒性更强。
附图说明
图1为本发明方法流程图;
图2部分正难例;随机挑选一个基准样本,图2中选定org董璇.jpg为当前基准样本,利用初始模型测试董璇这个分类下的所有正样本与基准样本的距离,选取距离远的样本为正难例;
图3部分负难例。根据图2所示,选定org董璇.jpg为当前基准样本,利用初始模型对所有非董璇类训练样本打分,选取距离org董璇.jpg较近的负样本为负难例。
具体实施方式
下面结合实施例与附图对本发明进行详细描述:
本发明主要应用于深度卷积神经网络的模型训练,应用于人脸识别率的提升,具体实施步骤如下:
实施例1
本实施例提供了一种深度卷积神经网络的模型训练方法,如图1所示,具体包括以下步骤:
步骤s1:采集亚洲人脸图像,对图像做预处理,包括人脸检测,关键点检测,人脸对齐,构造训练样本集;
步骤s2:构建轻量型神经网络模型,将训练样本集输入模型中训练,直到模型收敛,得到初始模型。构建的轻量型网络包括5个卷积层,4个最大池化层,2个全连接层;
步骤s3:利用初始模型对训练样本打分,随机挑选基准样本,并根据基准样本挑选正负样本的难例样本集,例如,从lm这个人的样本里面随机选择一张图像作为基准样本,计算lm其他样本与基准样本的距离,选取远距离的样本作为正样本的难例,计算其他人的样本与基准样本的距离,选择距离近的样本作为负样本的难例;
步骤s4:根据基准样本,求取正负难例,并组合为一个batch,得到N个人的所有难例集,进一步,对难例集丰富化,包括将每个样本进行降分辨率,调整光线,将丰富后的难例样本组合在一起,作为后续训练的难例集;
步骤s5:利用难例集精调模型,将s2中的初始训练模型用于初始化新模型,设置batch的大小为每个人难例样本的数量,不断迭代训练直到模型收敛;
附图2、3为本发明一个实施例得到的部分正难例和部分负难例的示意图。
尽管这里参照本发明的解释性实施例对本发明进行了描述,上述实施例仅为本发明较佳的实施方式,本发明的实施方式并不受上述实施例的限制,应该理解,本领域技术人员可以设计出很多其他的修改和实施方式,这些修改和实施方式将落在本申请公开的原则范围和精神之内。
Claims (5)
1.一种基于深度学习的低维人脸模型训练方法,其特征在于包括如下步骤:
步骤s1:采集人脸图像并作对齐处理,构造训练样本集;
步骤s2:构建轻量型神经网络模型,将训练样本集输入模型中训练,直到模型收敛,得到初始模型;
步骤s3:利用初始模型对训练样本打分,随机挑选基准样本,并根据基准样本挑选正负样本的难例样本集;
步骤s4:将步骤s3得到的难例进一步丰富化,将丰富后的难例样本组合在一起,作为后续训练的难例集;
步骤s5:精调模型:利用难例集精调模型,将s2中的初始训练模型用于初始化新模型,不断迭代训练直到模型收敛。
2.根据权利要求1所述基于深度学习的低维人脸模型训练方法,其特征在于:
步骤s2包括:构建的轻量型网络包括5个卷积层,4个最大池化层,2个全连接层,提取人脸特征的模型包含大约4M个参数。
3.根据权利要求1所述基于深度学习的低维人脸模型训练方法,其特征在于:
所述步骤s3包括:
s31:利用步骤s2得到的模型提取训练样本集里的人脸特征,将第一个全连接层的256维输出作为低维的人脸特征;
s32:计算余弦距离,选取难例,与基准样本是同一个人的,选取原则是,选择距离远的样本;而不是同一人的样本,则选取距离近的样本。
4.根据权利要求1所述基于深度学习的低维人脸模型训练方法,其特征在于:
步骤s4包括:
s41:难例样本的丰富化包括增加面部光线,按人脸关键点的位置计算人脸的面部亮度,如果亮度较暗,提升人脸面部亮度,如果亮度亮,则降低亮度,并保存为新的样本;
s42:提高、降低图像分辨率到原始训练样本大小的一倍、一半。
5.根据权利要求1所述基于深度学习的低维人脸模型训练方法,其特征在于:
步骤s5包括:将每个人的难例样本以及丰富后的样本组合在一起,构建难例batch,每个人挑选的难例batch个数要保持一致。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710884185.0A CN107633232A (zh) | 2017-09-26 | 2017-09-26 | 一种基于深度学习的低维人脸模型训练方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710884185.0A CN107633232A (zh) | 2017-09-26 | 2017-09-26 | 一种基于深度学习的低维人脸模型训练方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107633232A true CN107633232A (zh) | 2018-01-26 |
Family
ID=61102431
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710884185.0A Pending CN107633232A (zh) | 2017-09-26 | 2017-09-26 | 一种基于深度学习的低维人脸模型训练方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107633232A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108596024A (zh) * | 2018-03-13 | 2018-09-28 | 杭州电子科技大学 | 一种基于人脸结构信息的肖像生成方法 |
CN109359556A (zh) * | 2018-09-21 | 2019-02-19 | 四川长虹电器股份有限公司 | 一种基于低功耗嵌入式平台的人脸检测方法及系统 |
CN109840905A (zh) * | 2019-01-28 | 2019-06-04 | 山东鲁能软件技术有限公司 | 电力设备锈迹检测方法及系统 |
CN111178118A (zh) * | 2018-11-13 | 2020-05-19 | 浙江宇视科技有限公司 | 图像采集处理方法、装置及计算机可读存储介质 |
CN112347982A (zh) * | 2020-11-26 | 2021-02-09 | 江苏云从曦和人工智能有限公司 | 基于视频的无监督难例数据挖掘方法、装置、介质及设备 |
CN112529026A (zh) * | 2019-09-17 | 2021-03-19 | 华为技术有限公司 | 提供ai模型的方法、ai平台、计算设备及存储介质 |
CN112825121A (zh) * | 2019-11-20 | 2021-05-21 | 北京眼神智能科技有限公司 | 深度卷积神经网络初始化和训练方法、装置、介质及设备 |
CN113033719A (zh) * | 2021-05-27 | 2021-06-25 | 浙江啄云智能科技有限公司 | 目标检测处理方法、装置、介质及电子设备 |
CN117011630A (zh) * | 2022-09-16 | 2023-11-07 | 腾讯科技(深圳)有限公司 | 一种目标检测模型的训练方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101477625A (zh) * | 2009-01-07 | 2009-07-08 | 北京中星微电子有限公司 | 人体上半身检测方法和系统 |
CN106845330A (zh) * | 2016-11-17 | 2017-06-13 | 北京品恩科技股份有限公司 | 一种基于深度卷积神经网络的二维人脸识别模型的训练方法 |
CN106874880A (zh) * | 2017-02-21 | 2017-06-20 | 广东大仓机器人科技有限公司 | 一种人脸识别样本丰富化的方法 |
CN107194341A (zh) * | 2017-05-16 | 2017-09-22 | 西安电子科技大学 | Maxout多卷积神经网络融合人脸识别方法和系统 |
-
2017
- 2017-09-26 CN CN201710884185.0A patent/CN107633232A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101477625A (zh) * | 2009-01-07 | 2009-07-08 | 北京中星微电子有限公司 | 人体上半身检测方法和系统 |
CN106845330A (zh) * | 2016-11-17 | 2017-06-13 | 北京品恩科技股份有限公司 | 一种基于深度卷积神经网络的二维人脸识别模型的训练方法 |
CN106874880A (zh) * | 2017-02-21 | 2017-06-20 | 广东大仓机器人科技有限公司 | 一种人脸识别样本丰富化的方法 |
CN107194341A (zh) * | 2017-05-16 | 2017-09-22 | 西安电子科技大学 | Maxout多卷积神经网络融合人脸识别方法和系统 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108596024B (zh) * | 2018-03-13 | 2021-05-04 | 杭州电子科技大学 | 一种基于人脸结构信息的肖像生成方法 |
CN108596024A (zh) * | 2018-03-13 | 2018-09-28 | 杭州电子科技大学 | 一种基于人脸结构信息的肖像生成方法 |
CN109359556A (zh) * | 2018-09-21 | 2019-02-19 | 四川长虹电器股份有限公司 | 一种基于低功耗嵌入式平台的人脸检测方法及系统 |
CN109359556B (zh) * | 2018-09-21 | 2021-08-06 | 四川长虹电器股份有限公司 | 一种基于低功耗嵌入式平台的人脸检测方法及系统 |
CN111178118A (zh) * | 2018-11-13 | 2020-05-19 | 浙江宇视科技有限公司 | 图像采集处理方法、装置及计算机可读存储介质 |
CN111178118B (zh) * | 2018-11-13 | 2023-07-21 | 浙江宇视科技有限公司 | 图像采集处理方法、装置及计算机可读存储介质 |
CN109840905A (zh) * | 2019-01-28 | 2019-06-04 | 山东鲁能软件技术有限公司 | 电力设备锈迹检测方法及系统 |
WO2021051918A1 (zh) * | 2019-09-17 | 2021-03-25 | 华为技术有限公司 | 提供ai模型的方法、ai平台、计算设备及存储介质 |
CN112529026A (zh) * | 2019-09-17 | 2021-03-19 | 华为技术有限公司 | 提供ai模型的方法、ai平台、计算设备及存储介质 |
CN112529026B (zh) * | 2019-09-17 | 2023-12-19 | 华为云计算技术有限公司 | 提供ai模型的方法、ai平台、计算设备及存储介质 |
CN112825121A (zh) * | 2019-11-20 | 2021-05-21 | 北京眼神智能科技有限公司 | 深度卷积神经网络初始化和训练方法、装置、介质及设备 |
CN112347982A (zh) * | 2020-11-26 | 2021-02-09 | 江苏云从曦和人工智能有限公司 | 基于视频的无监督难例数据挖掘方法、装置、介质及设备 |
CN113033719A (zh) * | 2021-05-27 | 2021-06-25 | 浙江啄云智能科技有限公司 | 目标检测处理方法、装置、介质及电子设备 |
CN117011630A (zh) * | 2022-09-16 | 2023-11-07 | 腾讯科技(深圳)有限公司 | 一种目标检测模型的训练方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107633232A (zh) | 一种基于深度学习的低维人脸模型训练方法 | |
CN106778527B (zh) | 一种基于三重损失的改进的神经网络行人再识别方法 | |
CN109522853B (zh) | 面向监控视频的人脸检测与搜索方法 | |
CN103473571B (zh) | 一种人体检测方法 | |
CN109359541A (zh) | 一种基于深度迁移学习的素描人脸识别方法 | |
CN110070074A (zh) | 一种构建行人检测模型的方法 | |
CN107463920A (zh) | 一种消除局部遮挡物影响的人脸识别方法 | |
CN109670528A (zh) | 面向行人重识别任务的基于成对样本随机遮挡策略的数据扩充方法 | |
CN102567716B (zh) | 一种人脸合成系统及实现方法 | |
CN106326874A (zh) | 一种人眼图像中的虹膜识别方法及其装置 | |
CN107844795A (zh) | 基于主成分分析的卷积神经网络特征提取方法 | |
CN103870816B (zh) | 一种识别率高的植物识别的方法 | |
CN104504362A (zh) | 基于卷积神经网络的人脸检测方法 | |
CN106991386A (zh) | 一种基于深度残差网络的手势识别方法 | |
CN104298973A (zh) | 基于自编码器的人脸图像旋转方法 | |
CN110321844A (zh) | 一种基于卷积神经网络的快速虹膜检测方法 | |
CN110516595A (zh) | 基于卷积神经网络的手指多模态融合识别方法 | |
CN110084149A (zh) | 一种基于难样本四元组动态边界损失函数的人脸验证方法 | |
CN101169830A (zh) | 基于嵌入式隐马尔可夫模型和选择性集成的人脸画像自动生成方法 | |
CN110263768A (zh) | 一种基于深度残差网络的人脸识别方法 | |
CN107609108A (zh) | 一种基于号码牌识别和人脸识别的运动员照片分拣方法 | |
CN106491322A (zh) | 基于OpenCV图像识别的盲人拐杖控制系统及方法 | |
CN107145841A (zh) | 一种基于矩阵的低秩稀疏人脸识别方法及其系统 | |
CN104679967B (zh) | 一种判断心理测试可靠性的方法 | |
CN115273150A (zh) | 基于人体姿态估计的安全帽佩戴的新型识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180126 |