CN110569780A - 一种基于深度迁移学习的高精度人脸识别方法 - Google Patents
一种基于深度迁移学习的高精度人脸识别方法 Download PDFInfo
- Publication number
- CN110569780A CN110569780A CN201910825038.5A CN201910825038A CN110569780A CN 110569780 A CN110569780 A CN 110569780A CN 201910825038 A CN201910825038 A CN 201910825038A CN 110569780 A CN110569780 A CN 110569780A
- Authority
- CN
- China
- Prior art keywords
- face recognition
- recognition model
- precision
- loss function
- face
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于深度迁移学习的高精度人脸识别方法,首先利用中规模人脸图片数据集以及SoftMax分类损失函数对深度卷积神经网络进行分类训练,通过梯度下降算法优化模型参数,得到初始人脸识别模型;随后更换大规模目标数据集,加载初始人脸模型除SoftMax分类层外的前N‑1层,同时采用Arcface损失函数对加载后的深度卷积神经网络进行训练,利用梯度下降优化模型参数,得到目标人脸识别模型。本发明利用深度迁移学习技术,既解决了SoftMax损失函数精度不高的问题,也解决了直接使用Arcface损失函数难以收敛的问题,提高了人脸识别模型的训练速度和识别精度,最终在公开测试集LFW上的识别精度为99.40%。
Description
技术领域
本发明涉及人工智能与图像处理领域,具体是涉及一种基于深度迁移学习的高精度人脸识别方法。
背景技术
人脸识别宏观上分为两类:人脸验证和人脸识别。人脸验证是1∶1的比对,即判断两张图片里的人是否为同一人。人脸识别是1∶N的比对,即判断系统当前见到的人,为事先见过的众多人中的哪一个。人脸识别算法经历了早期算法(基于几何特征、基于模板匹配等)、人工特征+分类器和深度学习三个阶段。目前而言,深度学习算法已经成为人脸识别领域的主流算法,极大地提高了人脸识别的精度,推动这一技术走向实用。
目前人脸识别领域主要存在以下问题:识别精度和模型训练速度难以平衡。为了加速人脸识别模型训练使其能够快速收敛,现在主流的做法是采用SoftMax分类损失函数,该损失函数可以加快分类速度,但由于自身的弊端导致其无法将不同的类分离的很远,既无法保证类内距离很小,也无法保类间距离很大,这导致最终训练得到的人脸识别模型鲁棒性很差,很容易出现误分类的情况,人脸识别精度无法得到保障。为了提升人脸识别精度,现在主流的做法是更换损失函数,目前常用的损失函数有:Triplet Loss、CenterLoss、Arcface、Normface、AM-SoftMax等,它们都具有相同的特性,即都可以在训练的时候使得不同类样本尽量分离,同类样本尽量紧凑,从而使得类间距离大于类内距离,极大地减小了人脸识别误分类的风险,识别精度大幅提升。但由于这些损失函数相对于SoftMax损失函数更加苛刻,因此收敛速度很慢甚至难以收敛。
发明内容
本发明的目的在于克服以上存在的技术问题,提供一种基于深度迁移学习的高精度人脸识别方法,该方法利用迁移学习技术对人脸识别模型进行训练,在保证收敛速度的同时可以得到高精度的人脸识别模型。
为实现上述目的,本发明采用如下的技术方案:
一种基于深度迁移学习的高精度人脸识别方法,包括初始人脸识别模型单元、目标人脸识别模型单元及分类器单元三个模块;
所述初始人脸识别模型单元用于快速提升人脸识别精度,使分类损失收敛至较小数值,并将得到的模型传送至所述目标人脸识别模型单元作下一步处理;
所述目标人脸识别模型单元利用迁移学习技术在所述初始人脸识别模型单元的基础上进一步提升人脸识别精度;
所述分类器单元利用所述目标人脸识别模型对真实环境人脸图像进行特征提取,训练多分类逻辑回归线性分类器,并用其进行预测;步骤如下:
步骤S1:选取中规模人脸数据集和分类损失函数,搭建深度卷积神经网络,将所述中规模人脸数据集输入到所述深度卷积神经网络,通过所述分类损失函数对所述深度卷积神经网络进行分类训练,再利用梯度下降算法对人脸识别模型进行参数优化,得到初始人脸识别模型;
步骤S2:选取大规模人脸数据集和损失函数,加载所述步骤S1得到的初始人脸识别模型,采用所述损失函数对加载后的深度卷积神经网络进行训练,得到目标人脸识别模型;
步骤S3:利用所述目标人脸识别模型对真实环境训练人脸图像进行特征提取,得到训练特征矩阵,训练分类器;
步骤S4:利用所述目标人脸识别模型对真实环境测试人脸图像进行特征提取,得到测试特征矩阵,用训练的分类器进行预测,最后得到预测结果。
进一步地,所述步骤S1中的中规模人脸数据集有8万个人,500万张图片,每张图片为160×160的RGB彩色图像。
进一步地,所述步骤S1中选择的损失函数为SoftMax分类损失函数。
进一步地,所述步骤S2中的大规模人脸数据集有10万个人,800万张图片,每张图片为160×160的RGB彩色图像。
进一步地,所述步骤S2中选择的损失函数为Arcface损失函数。
进一步地,所述步骤S3和步骤S4中的真实环境人脸图像为160×160的RGB彩色图像。
进一步地,所述步骤S3和步骤S4中的分类器为多分类逻辑回归线性分类器。
本发明的有益效果:
本发明利用深度迁移学习技术,可以解决训练速度和训练精度之间的矛盾,既能较快速实现收敛,也能得到高精度的人脸识别模型,高效且可复现,能够适用于其它物体识别任务,具有较强的适应能力。
附图说明
图1:本发明一种基于深度迁移学习的高精度人脸识别方法的流程图。
具体实施方式
下面结合附图及实施例对本发明进行详细说明。
如图1所示,本发明提供了一种基于深度迁移学习技术的高精度人脸识别方法,该方法由三部分组成,包括初始人脸识别模型单元、目标人脸识别模型单元以及分类器单元。
初始人脸识别模型单元的功能是快速地提升人脸识别的精度,使分类损失迅速收敛至一个较小的值。该单元以160×160的RGB人脸彩色图像作为深度卷积神经网络的输入,选取中规模人脸数据集作为训练数据集(8万个人,500万张图片)。为了能够快速收敛,选取SoftMax分类损失函数作为该单元的Loss Function。利用梯度下降法优化模型参数,最终得到的初始人脸识别模型在公开测试集LFW上的验证精度为98%左右。
目标人脸识别模型单元的功能是在所述初始人脸识别模型单元的基础上利用深度迁移学习技术进一步提升人脸识别模型精度至State-of-the-Art精度,同时由于有初始人脸识别模型单元的存在,此单元可以快速收敛至目标精度,不会存在收敛很慢甚至难以收敛的问题。此单元以160×160的RGB人脸彩色图像作为深度卷积神经网络的输入,选取大规模人脸数据集作为训练数据集(10万个人,800万张图片)。为了能够使得不同类样本尽可能分离,同类样本尽可能紧凑,提升识别精度,选用Arcface损失函数作为该单元的LossFunction,具体形式为:
其中,N为样本数,C为类别数,为归一化的人脸特征向量和归一化的对应该类别的权重向量之间的内积,cos(θj)为归一化的人脸特征向量和归一化的其它类别的权重向量之间的内积。m为引入的间隔参数,m越大,惩罚力度越大,s的引入是为了确保能够收敛。
利用梯度下降法优化模型参数,最终得到的目标人脸识别模型在公开测试集LFW上的验证精度为99.40%。
分类器单元的功能为利用所述目标人脸识别模型对真实环境训练人脸图像进行特征提取,得到训练人脸特征矩阵,训练多分类逻辑回归线性分类器。随后利用所述目标人脸识别模型对真实环境测试人脸图像进行特征提取,得到测试人脸特征矩阵,利用训练得到的分类器进行预测,得到测试结果。
经测试,在光照、分辨率低、低头、遮挡等多种情况影响下,最终该模型在真实环境下依旧能取得95.3%人脸识别精度,支持多人脸同时识别,识别响应速度快,效果良好。
最后应说明的是:以上实施例仅用以说明本发明而并非限制本发明所描述的技术方案;因此,尽管本说明书参照上述的各个实施例对本发明已进行了详细的说明,但是,本领域的普通技术人员应当理解,仍然可以对本发明进行修改或等同替换;而一切不脱离本发明的精神和范围的技术方案及其改进,其均应涵盖在本发明的权利要求范围中。
Claims (7)
1.一种基于深度迁移学习的高精度人脸识别方法,其特征在于:包括初始人脸识别模型单元、目标人脸识别模型单元及分类器单元三个模块;
所述初始人脸识别模型单元用于快速提升人脸识别精度,使分类损失收敛至较小数值,并将得到的模型传送至所述目标人脸识别模型单元作下一步处理;
所述目标人脸识别模型单元利用迁移学习技术在所述初始人脸识别模型单元的基础上进一步提升人脸识别精度;
所述分类器单元利用所述目标人脸识别模型对真实环境人脸图像进行特征提取,训练多分类逻辑回归线性分类器,并用其进行预测;步骤如下:
步骤S1:选取中规模人脸数据集和分类损失函数,搭建深度卷积神经网络,将所述中规模人脸数据集输入到所述深度卷积神经网络,通过所述分类损失函数对所述深度卷积神经网络进行分类训练,再利用梯度下降算法对人脸识别模型进行参数优化,得到初始人脸识别模型;
步骤S2:选取大规模人脸数据集和损失函数,加载所述步骤S1得到的初始人脸识别模型,采用所述损失函数对加载后的深度卷积神经网络进行训练,得到目标人脸识别模型;
步骤S3:利用所述目标人脸识别模型对真实环境训练人脸图像进行特征提取,得到训练特征矩阵,训练分类器;
步骤S4:利用所述目标人脸识别模型对真实环境测试人脸图像进行特征提取,得到测试特征矩阵,用训练的分类器进行预测,最后得到预测结果。
2.根据权利要求1所述的基于深度迁移学习的高精度人脸识别方法,其特征在于:所述步骤S1中的中规模人脸数据集有8万个人,500万张图片,每张图片为160×160的RGB彩色图像。
3.根据权利要求1所述的基于深度迁移学习的高精度人脸识别方法,其特征在于:所述步骤S1中选择的分类损失函数为SoftMax分类损失函数。
4.根据权利要求1所述的基于深度迁移学习的高精度人脸识别方法,其特征在于:所述步骤S2中的大规模人脸数据集有10万个人,800万张图片,每张图片为160×160的RGB彩色图像。
5.根据权利要求1所述的基于深度迁移学习的高精度人脸识别方法,其特征在于:所述步骤S2中选择的损失函数为Arcface损失函数。
6.根据权利要求1所述的基于深度迁移学习的高精度人脸识别方法,其特征在于:所述步骤S3和步骤S4中的真实环境人脸图像为160×160的RGB彩色图像。
7.根据权利要求1所述的基于深度迁移学习的高精度人脸识别方法,其特征在于:所述步骤S3和步骤S4中的分类器为多分类逻辑回归线性分类器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910825038.5A CN110569780A (zh) | 2019-09-03 | 2019-09-03 | 一种基于深度迁移学习的高精度人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910825038.5A CN110569780A (zh) | 2019-09-03 | 2019-09-03 | 一种基于深度迁移学习的高精度人脸识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110569780A true CN110569780A (zh) | 2019-12-13 |
Family
ID=68777323
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910825038.5A Pending CN110569780A (zh) | 2019-09-03 | 2019-09-03 | 一种基于深度迁移学习的高精度人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110569780A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111191558A (zh) * | 2019-12-25 | 2020-05-22 | 深圳市优必选科技股份有限公司 | 一种机器人及其人脸识别示教方法和存储介质 |
CN111274946A (zh) * | 2020-01-19 | 2020-06-12 | 杭州涂鸦信息技术有限公司 | 一种人脸识别方法和系统及设备 |
CN112395986A (zh) * | 2020-11-17 | 2021-02-23 | 广州像素数据技术股份有限公司 | 一种新场景快速迁移且防遗忘的人脸识别方法 |
CN113069080A (zh) * | 2021-03-22 | 2021-07-06 | 上海交通大学医学院附属第九人民医院 | 一种基于人工智能的困难气道评估方法及装置 |
CN113723205A (zh) * | 2021-08-04 | 2021-11-30 | 中国人民解放军陆军勤务学院 | 一种基于人脸底库特征分组的人脸识别方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106295584A (zh) * | 2016-08-16 | 2017-01-04 | 深圳云天励飞技术有限公司 | 深度迁移学习在人群属性的识别方法 |
CN106599863A (zh) * | 2016-12-21 | 2017-04-26 | 中国科学院光电技术研究所 | 一种基于迁移学习技术的深度人脸识别方法 |
CN108182427A (zh) * | 2018-01-30 | 2018-06-19 | 电子科技大学 | 一种基于深度学习模型和迁移学习的人脸识别方法 |
CN110097033A (zh) * | 2019-05-15 | 2019-08-06 | 成都电科智达科技有限公司 | 一种基于特征扩充的单样本人脸识别方法 |
-
2019
- 2019-09-03 CN CN201910825038.5A patent/CN110569780A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106295584A (zh) * | 2016-08-16 | 2017-01-04 | 深圳云天励飞技术有限公司 | 深度迁移学习在人群属性的识别方法 |
CN106599863A (zh) * | 2016-12-21 | 2017-04-26 | 中国科学院光电技术研究所 | 一种基于迁移学习技术的深度人脸识别方法 |
CN108182427A (zh) * | 2018-01-30 | 2018-06-19 | 电子科技大学 | 一种基于深度学习模型和迁移学习的人脸识别方法 |
CN110097033A (zh) * | 2019-05-15 | 2019-08-06 | 成都电科智达科技有限公司 | 一种基于特征扩充的单样本人脸识别方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111191558A (zh) * | 2019-12-25 | 2020-05-22 | 深圳市优必选科技股份有限公司 | 一种机器人及其人脸识别示教方法和存储介质 |
CN111191558B (zh) * | 2019-12-25 | 2024-02-02 | 深圳市优必选科技股份有限公司 | 一种机器人及其人脸识别示教方法和存储介质 |
CN111274946A (zh) * | 2020-01-19 | 2020-06-12 | 杭州涂鸦信息技术有限公司 | 一种人脸识别方法和系统及设备 |
CN111274946B (zh) * | 2020-01-19 | 2023-05-05 | 杭州涂鸦信息技术有限公司 | 一种人脸识别方法和系统及设备 |
CN112395986A (zh) * | 2020-11-17 | 2021-02-23 | 广州像素数据技术股份有限公司 | 一种新场景快速迁移且防遗忘的人脸识别方法 |
CN112395986B (zh) * | 2020-11-17 | 2024-04-26 | 广州像素数据技术股份有限公司 | 一种新场景快速迁移且防遗忘的人脸识别方法 |
CN113069080A (zh) * | 2021-03-22 | 2021-07-06 | 上海交通大学医学院附属第九人民医院 | 一种基于人工智能的困难气道评估方法及装置 |
CN113723205A (zh) * | 2021-08-04 | 2021-11-30 | 中国人民解放军陆军勤务学院 | 一种基于人脸底库特征分组的人脸识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110569780A (zh) | 一种基于深度迁移学习的高精度人脸识别方法 | |
CN111738315B (zh) | 基于对抗融合多源迁移学习的图像分类方法 | |
CN107909101B (zh) | 基于卷积神经网络的半监督迁移学习字符识别方法及系统 | |
CN107633255B (zh) | 一种深度学习模式下的岩石岩性自动识别分类方法 | |
CN109711281B (zh) | 一种基于深度学习的行人重识别与特征识别融合方法 | |
CN109583322B (zh) | 一种人脸识别深度网络训练方法和系统 | |
CN107016413B (zh) | 一种基于深度学习算法的烟叶在线分级方法 | |
CN109033938A (zh) | 一种基于可区分性特征融合的人脸识别方法 | |
WO2018052587A1 (en) | Method and system for cell image segmentation using multi-stage convolutional neural networks | |
CN109684922B (zh) | 一种基于卷积神经网络的多模型对成品菜的识别方法 | |
CN110188641A (zh) | 图像识别和神经网络模型的训练方法、装置和系统 | |
CN110059586B (zh) | 一种基于空洞残差注意力结构的虹膜定位分割系统 | |
US20120093396A1 (en) | Digital image analysis utilizing multiple human labels | |
CN111178120B (zh) | 一种基于作物识别级联技术的害虫图像检测方法 | |
CN105608447A (zh) | 对人体面部微笑表情深度卷积神经网络的检测方法 | |
CN112580590A (zh) | 一种基于多语义特征融合网络的指静脉识别方法 | |
CN107316035A (zh) | 基于深度学习神经网络的对象识别方法及装置 | |
CN106599864A (zh) | 一种基于极值理论的深度人脸识别方法 | |
CN109472209A (zh) | 一种图像识别方法、装置和存储介质 | |
CN113076994A (zh) | 一种开集域自适应图像分类方法及系统 | |
CN109815967A (zh) | 基于特征融合的cnn舰船目标识别系统及方法 | |
CN108549794A (zh) | 一种蛋白质二级结构预测方法 | |
CN109740656A (zh) | 一种基于卷积神经网络的矿石分选方法 | |
CN109711433A (zh) | 一种基于元学习的细粒度分类方法 | |
CN113095370A (zh) | 图像识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20191213 |
|
WD01 | Invention patent application deemed withdrawn after publication |