CN104751140A - 一种基于深度学习sdae理论的三维人脸识别算法及其在金融领域应用 - Google Patents
一种基于深度学习sdae理论的三维人脸识别算法及其在金融领域应用 Download PDFInfo
- Publication number
- CN104751140A CN104751140A CN201510145327.2A CN201510145327A CN104751140A CN 104751140 A CN104751140 A CN 104751140A CN 201510145327 A CN201510145327 A CN 201510145327A CN 104751140 A CN104751140 A CN 104751140A
- Authority
- CN
- China
- Prior art keywords
- face
- sdae
- deep learning
- training
- depth
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
本说明提供一种基于深度学习SDAE理论的三维人脸识别算法。构建一个基于深度学习SDAE理论的三维人脸识别算法模型的步骤包括:建立深度学习的SDAE模型;人脸深度数据归一化;用三维人脸深度数据构建网络的整体结构(architecture);AutoEncoder进行无监督预训练;fine_turing过程有监督微调;分类及预测结果阶段(即人脸识别)。本发明创新地将深度学习应用于人脸三维深度数据的处理和识别,提出了一种深度学习和深度信息相结合的新的人脸识别算法,避免了传统的问题并获得了较好的识别率,在此基础上我们又提出了该算法在金融领域的应用。
Description
技术领域
本发明涉及人工智能、模式识别、机器学习、计算复杂性理论、控制论,统计学等领域,具体是关于一种基于深度学习SDAE理论的三维人脸识别算法及其在金融方面的应用。
背景技术
一.人脸识别的研究背景
人脸识别是当前人工智能和模式识别的研究热点,它可以用于身份验证,公共场合对人的监视,图像数据库的检索等等,提高人与计算机的交互能力等等。而传统的基于二维图像的人脸识别虽然在限定环境下已经达到了较高的识别率,但是光照,姿态,表情等的变化已经成为二维人脸识别研究的瓶颈,制约了其进一步发展。
目前人脸识别的主要方法:1.基于几何特征的人脸识别方法;2.基于代数特征的人脸识别方法;3.基于神经网络的人脸识别方法;4.其他方法
三维人脸模型的深度信息具有比二维人脸图像更丰富的信息,同时不断有基于深度信息的人脸识别新观念,新理论被提出,三维人脸识别作为计算机视觉,人机智能交互,模式识别,计算机图形学的交叉研究方向,其研究成果将对这些学科的发展发挥巨大的推动作用,同时也将在金融,医疗及公共安全方面有广阔的市场应用前景。
二.深度学习SDAE的研究背景
当前多数分类、回归等学习方法为浅层结构算法,其局限性在于有限样本和计算单元情况下对复杂函数的表示能力有限,针对复杂分类问题其泛化能力受到一定制约。深度学习可通过学习一种深层非线性网络结构,实现复杂函数逼近,表征输入数据分布式表示,并展现了强大的从少数样本集中学习数据集本质特征的能力。
深度学习的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。
SDAE模型中核心的是AutoEncoder自动解码器,给定一个神经网络,我们假设其输出与输入是相同的,然后训练调整其参数,得到每一层中的权重。自然地,我们就得到了输入I的几种不同表示(每一层代表一种表示),这些表示就是特征。自动编码器就是一种尽可能复现输入信号的神经网络,为了实现这种复现,自动解码器会捕捉可以代表输入数据的重要因素,同时加入稀疏的约束条件和一定量的噪声,可以大大提高精确度。
发明内容
深度学习是机器学习理论中的一个新的研究领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,是人工智能的延伸。
在此之前深度学习都是应用于图像,声音,文本领域,人脸部分也是基于像素的识别,本质上是二维的人脸识别,无法避免传统的姿势,光照的影响。我们创新地将深度学习理论应用于人脸三维深度数据的处理和识别,提出了一种深度学习SDAE理论和深度信息相结合的新的人脸识别算法,避免了传统的问题并获得了较好的识别率,在此基础上我们又提出了该算法模型在金融方面的应用。
提醒:本发明的重点在于提供一种基于深度学习SDAE理论的三维人脸识别算法,该算法使用的人脸的深度数据,前期准备包括人脸数据的获取,三维人脸特征的提取,数据降噪等,而这些准备工作不在本发明内介绍,默认得到的是已经经过前期处理的人脸数据。
1.构建一个基于深度学习SDAE理论的三维人脸识别算法模型,包括以下步骤:
1)人脸深度数据归一化;
2)利用NN模型构建SDAE网络结构;
3)AutoEncoder进行无监督预训练;
4)fine_turing过程有监督微调;
5)分类及预测结果阶段(即人脸识别)。
2.所述的人脸深度数据归一化步骤包括:
1)点云图像的人脸姿态矫正;
2)选取对表情不敏感的特征点;
3)得到深度信息;
4)返回深度数据训练矩阵。
3.所述的利用NN模型构建SDAE网络结构步骤包括:
1)设计网络结构(输入层,中间隐层,输出层);
2)根据神经网络堆叠AutoEncoder。
4.所述的AutoEncoder进行无监督预训练步骤包括:
1)根据网络结构和人脸深度信息调整参数;
2)将训练样本分为若干组,分别训练若干轮;
3)进行无监督学习SDAEtrain。
5.所述的进行无监督学习SDAEtrain步骤包括:
1)计算前馈网络;
2)误差反向传播计算误差;
3)权值参数更新。
本算法在金融领域(借贷人信用评级和借贷额度)的应用,步骤如下:
1.不需要实体柜台和工作人员,系统采集初次借贷人的人脸三维数据,即刷脸工作;
2.系统自动将人脸数据与公安部数据库匹配验证身份;
3.往后如果借贷人有违反银行规定的行为利用该算法识别身份;
4.将违规行为同步到与借贷人绑定的电子信用档案;
5.根据电子信用档案调整借贷人的信用评级;
6.当再次借贷时本策略可以识别借贷人身份并搜索电子信用数据库和大数据分析给出银行合理的建议。
本发明对于医疗的有益效果在于:
①不同于传统的实体银行,该算法直接应用于基于互联网的虚拟银行,虚拟银行不设置物理站点,没有实体营业柜台,通过摄像头或其他采集设备,进行“刷脸”认证,不需要人工登记盖章等环节就可以系统审核贷款额度并“告知”ATM机。
②人脸深度数据相当于提供了一个借贷人电子信用档案的“电子身份证”,避免了传统的文本身份及借款登记繁琐的手续,同时利用基于深度学习SDAE理论的三维人脸识别算法可以利用大数据分析和有效监管借贷人的信用评级。
③本策略一旦核实发生违规行为的借贷人身份会及时修改借贷人的电子信用档案,降低其借贷信用等级,与传统的工作人员工作相比更加高效方便。在帮助健全金融借贷的信用评级体制的同时节省了大量人力物力。
附图说明
图1:基于深度学习SDAE的三维人脸识别算法流程图
图2:人脸点云模型
图3:人脸深度图像
图4:深度图像归一化
图5:构建网络及逐层训练
图6:AutoEnconder的重构(复现输入)流程图
图7:加入稀疏约束的SAE模型
图8:加入噪声的DAE模型
具体实施方式
(下文将结合附图详细描述本发明的实施例。应当注意的是,下述实施例中描述的技术特征或者技术特征的组合不应当被认为是孤立的,它们可以被相互组合从而达到更好的技术效果。在下述实施例的附图中,各附图所出现的相同标号代表相同的特征或者部件,可应用于不同实施例中。)
本发明借助深度学习SDAE原理由自己设计一个能够对大数据量三维人脸深度数据进行学习的合适的SDAE算法模型并进行识别分析。
步骤S111:人脸深度数据归一化
对于我们接触的三维人脸数据,最易得到的三维点云数据如图2,其对应的是人脸深度图像,如图3,将取得的点云图像根据三维坐标旋转公式归一化至右手坐标系完成人脸姿态矫正,得到的与XOY平面的欧式距离即为深度信息,如图4,由于鼻尖点是人脸受表情影响最小的特征点,将深度数据平移至以鼻尖点为原点的坐标系。
假设原始采集的人脸为M个人,每人N个样本,每个样本获得的人脸上的三维深度特征值为T,将所有数据形式表征为(M*N)*T的训练矩阵train,同时生成与之匹配的(M*N)*1的结果矩阵train_match。在测试训练结果时,测试时取得的人脸为某个人n数量样本,每个样本坐标数为t,将形式表征为n*t的测试矩阵test和test_match。
步骤S112:利用NN模型构建SDAE网络结构
本算法的SDAE网络由一个AutoEncoder堆叠而成,例如一个包含10个人的样本集为10000*121的矩阵,即构建网络的节点向量,即visible层为121个节点,设计网络结构为:121-50-10三层神经网络,一个输入层121,一个中间隐层50,一个输出层10(预测分类数 的元包矩阵),如图5。
nnsetup构建神经网络结构:
Encoder过程:y=f(xw'+b)
Decoder过程:x=g(wy+b)
步骤S113:AutoEncoder进行无监督预训练
-Input:X code:h=WTX
-loss:
AutoEnconder的重构(复现输入)流程如图6。
Sdae.ae{1}.activation_function ='sigm';
Sdae.ae{1}.learningRate =1;
Sdae.ae{1}.inputZeroMaskedFraction =0.5;
设置激活函数activation_function为sigmoid函数;
设置学习速率learningRate为1;
给输入值加入噪声0.5的inputZeroMaskeFraction,使学习能力更强。
动量项nn.momentum:调节在应用minibatch方法训练网络时,每次新权值更新值和上一次权值更行值的相对比例;
权值惩罚项nn.weightPenaltyL2:防止权值过大,发生过拟合现象;
稀疏目标nn.sparsityTarget:通过控制隐层激活值的平均值,来控制隐层激活值的稀疏性。
加入稀疏的约束条件变形为SAE模型如图7,训练中加入噪声变形为DAE模型如图8。
Opts.numepochs =10;
Opts.batchsize =50;
Sdae=sdaetrain(sae,train,opts);
所有样本训练次数numepochs为10次,防止出现误差,使结果更加精确。
将训练样本分成多个batch,每个batch中样本数为50个,使Matlab的运行处理更加高效。
SDAEtrain是无监督学习,通过for循环调用NNtrain,依次训练每个autoencoder,在NNtrain主要进行三步:
①nn=nnff(nn,batch_x,batch_y);%前馈计算网络
②nn=nnbp(nn);%反向函数计算误差和权值梯度
③nn=nnapplygrads(nn);%权值参数更新
步骤S114:fine_turing过程有监督微调
设置激活函数activation_function为sigmoid函数;
设置学习速率learningRate为1;
nn=nntrain(nn,train,train_match,opts);
把Pre_training阶段,学习到的权值矩阵,作为网络权值的初始值。
步骤S115:分类及预测结果阶段(即人脸识别)
输出显示人脸识别结果[er,bad]=nntest(nn,test,test_match);
labels=nnpredict(nn,x);
nnpredict函数首先实现一个网络的前馈计算,计算样本属于每个分类的“概率”。
nn=nnff(nn,x,zeros(size(x,1),nn.size(end)));
根据最大化原则,确定样本的分类,并提取类别标签。
Claims (5)
1.构建一种基于深度学习SDAE理论的三维人脸识别算法模型,包括以下步骤:
1)人脸深度数据归一化;
2)利用NN模型构建SDAE网络结构;
3)AutoEncoder进行无监督预训练;
4)fine_turing过程有监督微调;
5)分类及预测结果阶段(即人脸识别)。
2.所述的人脸深度数据归一化步骤包括:
1)点云图像的人脸姿态矫正;
2)选取对表情不敏感的特征点;
3)得到深度信息;
4)返回深度数据训练矩阵。
3.所述的利用NN模型构建SDAE网络结构步骤包括:
1)设计网络结构(输入层,中间隐层,输出层);
2)根据神经网络堆叠AutoEncoder。
4.所述的AutoEncoder进行无监督预训练步骤包括:
1)根据网络结构和人脸深度信息调整参数;
2)将训练样本分为若干组,分别训练若干轮;
3)进行无监督学习SDAEtrain。
5.所述的进行无监督学习SDAEtrain步骤包括:
1)计算前馈网络;
2)误差反向传播计算误差;
3)权值参数更新。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510145327.2A CN104751140A (zh) | 2015-03-30 | 2015-03-30 | 一种基于深度学习sdae理论的三维人脸识别算法及其在金融领域应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510145327.2A CN104751140A (zh) | 2015-03-30 | 2015-03-30 | 一种基于深度学习sdae理论的三维人脸识别算法及其在金融领域应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104751140A true CN104751140A (zh) | 2015-07-01 |
Family
ID=53590797
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510145327.2A Pending CN104751140A (zh) | 2015-03-30 | 2015-03-30 | 一种基于深度学习sdae理论的三维人脸识别算法及其在金融领域应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104751140A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104965812A (zh) * | 2015-07-13 | 2015-10-07 | 深圳市腾讯计算机系统有限公司 | 一种深层模型处理方法及装置 |
CN106803062A (zh) * | 2016-12-20 | 2017-06-06 | 陕西师范大学 | 栈式降噪自编码神经网络手势图像的识别方法 |
CN107403222A (zh) * | 2017-07-19 | 2017-11-28 | 燕山大学 | 一种基于辅助更新模型和有效性检验的运动跟踪方法 |
CN107766787A (zh) * | 2016-08-16 | 2018-03-06 | 深圳云天励飞技术有限公司 | 人脸属性识别方法、装置、终端及存储介质 |
CN107844744A (zh) * | 2017-10-09 | 2018-03-27 | 平安科技(深圳)有限公司 | 结合深度信息的人脸识别方法、装置及存储介质 |
WO2018054283A1 (zh) * | 2016-09-23 | 2018-03-29 | 北京眼神科技有限公司 | 人脸模型的训练方法和装置、人脸认证方法和装置 |
CN108364346A (zh) * | 2018-03-08 | 2018-08-03 | 腾讯科技(深圳)有限公司 | 构建三维人脸模型的方法、装置和计算机可读存储介质 |
CN109308471A (zh) * | 2018-09-29 | 2019-02-05 | 河海大学常州校区 | 一种肌电信号特征提取方法 |
CN109670392A (zh) * | 2018-09-04 | 2019-04-23 | 中国人民解放军陆军工程大学 | 基于混合自动编码器道路图像语义分割方法 |
CN109949180A (zh) * | 2019-03-19 | 2019-06-28 | 山东交通学院 | 一种船舶冷热电联供系统的冷热电负荷预测方法及系统 |
CN110298264A (zh) * | 2019-06-10 | 2019-10-01 | 上海师范大学 | 基于堆叠降噪自编码器的人体日常行为活动识别优化方法 |
CN110705525A (zh) * | 2019-10-24 | 2020-01-17 | 北京建筑大学 | 一种诊断滚动轴承故障的方法及装置 |
CN110751108A (zh) * | 2019-10-23 | 2020-02-04 | 武汉理工大学 | 一种地铁分布式振动信号相似度确定方法 |
US10594712B2 (en) | 2016-12-06 | 2020-03-17 | General Electric Company | Systems and methods for cyber-attack detection at sample speed |
CN112597901A (zh) * | 2020-12-23 | 2021-04-02 | 艾体威尔电子技术(北京)有限公司 | 一种基于三维测距的多人脸场景有效人脸识别装置及方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101894254A (zh) * | 2010-06-13 | 2010-11-24 | 南开大学 | 一种基于等高线法的三维人脸识别方法 |
US20110235897A1 (en) * | 2010-03-24 | 2011-09-29 | Nat'l Institute Of Advanced Industrial Science And Technology | Device and process for three-dimensional localization and pose estimation using stereo image, and computer-readable storage medium storing the program thereof |
-
2015
- 2015-03-30 CN CN201510145327.2A patent/CN104751140A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110235897A1 (en) * | 2010-03-24 | 2011-09-29 | Nat'l Institute Of Advanced Industrial Science And Technology | Device and process for three-dimensional localization and pose estimation using stereo image, and computer-readable storage medium storing the program thereof |
CN101894254A (zh) * | 2010-06-13 | 2010-11-24 | 南开大学 | 一种基于等高线法的三维人脸识别方法 |
CN101894254B (zh) * | 2010-06-13 | 2013-01-09 | 南开大学 | 一种基于等高线法的三维人脸识别方法 |
Non-Patent Citations (2)
Title |
---|
杜骞: "深度学习在图像语义分类中的应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
陈涛等: "综合网络态势分析模型研究", 《中国通信学会第六届学术年会论文集(中)》 * |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104965812B (zh) * | 2015-07-13 | 2017-12-01 | 深圳市腾讯计算机系统有限公司 | 一种深层模型处理方法及装置 |
CN104965812A (zh) * | 2015-07-13 | 2015-10-07 | 深圳市腾讯计算机系统有限公司 | 一种深层模型处理方法及装置 |
CN107766787A (zh) * | 2016-08-16 | 2018-03-06 | 深圳云天励飞技术有限公司 | 人脸属性识别方法、装置、终端及存储介质 |
WO2018054283A1 (zh) * | 2016-09-23 | 2018-03-29 | 北京眼神科技有限公司 | 人脸模型的训练方法和装置、人脸认证方法和装置 |
US10594712B2 (en) | 2016-12-06 | 2020-03-17 | General Electric Company | Systems and methods for cyber-attack detection at sample speed |
CN106803062A (zh) * | 2016-12-20 | 2017-06-06 | 陕西师范大学 | 栈式降噪自编码神经网络手势图像的识别方法 |
CN107403222A (zh) * | 2017-07-19 | 2017-11-28 | 燕山大学 | 一种基于辅助更新模型和有效性检验的运动跟踪方法 |
CN107844744A (zh) * | 2017-10-09 | 2018-03-27 | 平安科技(深圳)有限公司 | 结合深度信息的人脸识别方法、装置及存储介质 |
CN108364346A (zh) * | 2018-03-08 | 2018-08-03 | 腾讯科技(深圳)有限公司 | 构建三维人脸模型的方法、装置和计算机可读存储介质 |
CN108364346B (zh) * | 2018-03-08 | 2023-05-12 | 腾讯科技(深圳)有限公司 | 构建三维人脸模型的方法、装置和计算机可读存储介质 |
CN109670392A (zh) * | 2018-09-04 | 2019-04-23 | 中国人民解放军陆军工程大学 | 基于混合自动编码器道路图像语义分割方法 |
CN109308471A (zh) * | 2018-09-29 | 2019-02-05 | 河海大学常州校区 | 一种肌电信号特征提取方法 |
CN109949180A (zh) * | 2019-03-19 | 2019-06-28 | 山东交通学院 | 一种船舶冷热电联供系统的冷热电负荷预测方法及系统 |
CN110298264A (zh) * | 2019-06-10 | 2019-10-01 | 上海师范大学 | 基于堆叠降噪自编码器的人体日常行为活动识别优化方法 |
CN110298264B (zh) * | 2019-06-10 | 2023-05-30 | 上海师范大学 | 基于堆叠降噪自编码器的人体日常行为活动识别优化方法 |
CN110751108A (zh) * | 2019-10-23 | 2020-02-04 | 武汉理工大学 | 一种地铁分布式振动信号相似度确定方法 |
CN110751108B (zh) * | 2019-10-23 | 2022-10-14 | 武汉理工大学 | 一种地铁分布式振动信号相似度确定方法 |
CN110705525A (zh) * | 2019-10-24 | 2020-01-17 | 北京建筑大学 | 一种诊断滚动轴承故障的方法及装置 |
CN112597901A (zh) * | 2020-12-23 | 2021-04-02 | 艾体威尔电子技术(北京)有限公司 | 一种基于三维测距的多人脸场景有效人脸识别装置及方法 |
CN112597901B (zh) * | 2020-12-23 | 2023-12-29 | 艾体威尔电子技术(北京)有限公司 | 一种基于三维测距的多人脸场景有效人脸识别装置及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104751140A (zh) | 一种基于深度学习sdae理论的三维人脸识别算法及其在金融领域应用 | |
CN110414432B (zh) | 对象识别模型的训练方法、对象识别方法及相应的装置 | |
CN108229444B (zh) | 一种基于整体和局部深度特征融合的行人再识别方法 | |
Liu et al. | Learning efficient spatial-temporal gait features with deep learning for human identification | |
Houshmand et al. | Facial expression recognition under partial occlusion from virtual reality headsets based on transfer learning | |
CN109522798A (zh) | 基于活体识别的视频防伪方法、系统、装置及可存储介质 | |
CN112395979B (zh) | 基于图像的健康状态识别方法、装置、设备及存储介质 | |
Ghadi et al. | Syntactic model-based human body 3D reconstruction and event classification via association based features mining and deep learning | |
Pham et al. | Learning to recognise 3D human action from a new skeleton‐based representation using deep convolutional neural networks | |
CN115050064A (zh) | 人脸活体检测方法、装置、设备及介质 | |
Pan et al. | Hierarchical support vector machine for facial micro-expression recognition | |
Pratama et al. | Face recognition for presence system by using residual networks-50 architecture | |
US20220012527A1 (en) | Framework for few-shot temporal action localization | |
Wang et al. | A deep clustering via automatic feature embedded learning for human activity recognition | |
Xue et al. | Attention‐based spatial–temporal hierarchical ConvLSTM network for action recognition in videos | |
Praseetha et al. | Secure fingerprint authentication using deep learning and minutiae verification | |
Zou et al. | Application of facial symmetrical characteristic to transfer learning | |
Shopon et al. | Residual connection-based graph convolutional neural networks for gait recognition | |
Shopon et al. | Multiview gait recognition on unconstrained path using graph convolutional neural network | |
Wu et al. | Parallel multi-path age distinguish network for cross-age face recognition | |
Yu et al. | A multilayer pyramid network based on learning for vehicle logo recognition | |
CN113469002B (zh) | 基于区块链互证和生物多特征识别及多源数据融合的身份识别方法 | |
CN110929243A (zh) | 一种基于手机惯性传感器的行人身份识别方法 | |
Guo | Analysis of artificial intelligence technology and its application in improving the effectiveness of physical education teaching | |
Hdioud et al. | Facial expression recognition of masked faces using deep learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20150701 |
|
WD01 | Invention patent application deemed withdrawn after publication |