CN104751140A

CN104751140A - 一种基于深度学习sdae理论的三维人脸识别算法及其在金融领域应用

Info

Publication number: CN104751140A
Application number: CN201510145327.2A
Authority: CN
Inventors: 侯振杰; 张建; 吴卓燃; 陆中秋; 陈宸; 陈永康
Original assignee: Changzhou University
Current assignee: Changzhou University
Priority date: 2015-03-30
Filing date: 2015-03-30
Publication date: 2015-07-01

Abstract

本说明提供一种基于深度学习SDAE理论的三维人脸识别算法。构建一个基于深度学习SDAE理论的三维人脸识别算法模型的步骤包括：建立深度学习的SDAE模型；人脸深度数据归一化；用三维人脸深度数据构建网络的整体结构(architecture)；AutoEncoder进行无监督预训练；fine_turing过程有监督微调；分类及预测结果阶段(即人脸识别)。本发明创新地将深度学习应用于人脸三维深度数据的处理和识别，提出了一种深度学习和深度信息相结合的新的人脸识别算法，避免了传统的问题并获得了较好的识别率，在此基础上我们又提出了该算法在金融领域的应用。

Description

一种基于深度学习SDAE理论的三维人脸识别算法及其在金融领域应用

技术领域

本发明涉及人工智能、模式识别、机器学习、计算复杂性理论、控制论，统计学等领域，具体是关于一种基于深度学习SDAE理论的三维人脸识别算法及其在金融方面的应用。

背景技术

一.人脸识别的研究背景

人脸识别是当前人工智能和模式识别的研究热点，它可以用于身份验证，公共场合对人的监视，图像数据库的检索等等，提高人与计算机的交互能力等等。而传统的基于二维图像的人脸识别虽然在限定环境下已经达到了较高的识别率，但是光照，姿态，表情等的变化已经成为二维人脸识别研究的瓶颈，制约了其进一步发展。

目前人脸识别的主要方法:1.基于几何特征的人脸识别方法；2.基于代数特征的人脸识别方法；3.基于神经网络的人脸识别方法；4.其他方法

三维人脸模型的深度信息具有比二维人脸图像更丰富的信息，同时不断有基于深度信息的人脸识别新观念，新理论被提出，三维人脸识别作为计算机视觉，人机智能交互，模式识别，计算机图形学的交叉研究方向，其研究成果将对这些学科的发展发挥巨大的推动作用，同时也将在金融，医疗及公共安全方面有广阔的市场应用前景。

二.深度学习SDAE的研究背景

当前多数分类、回归等学习方法为浅层结构算法，其局限性在于有限样本和计算单元情况下对复杂函数的表示能力有限，针对复杂分类问题其泛化能力受到一定制约。深度学习可通过学习一种深层非线性网络结构，实现复杂函数逼近，表征输入数据分布式表示，并展现了强大的从少数样本集中学习数据集本质特征的能力。

深度学习的实质，是通过构建具有很多隐层的机器学习模型和海量的训练数据，来学习更有用的特征，从而最终提升分类或预测的准确性。

SDAE模型中核心的是AutoEncoder自动解码器，给定一个神经网络，我们假设其输出与输入是相同的，然后训练调整其参数，得到每一层中的权重。自然地，我们就得到了输入I的几种不同表示(每一层代表一种表示)，这些表示就是特征。自动编码器就是一种尽可能复现输入信号的神经网络，为了实现这种复现，自动解码器会捕捉可以代表输入数据的重要因素，同时加入稀疏的约束条件和一定量的噪声，可以大大提高精确度。

发明内容

深度学习是机器学习理论中的一个新的研究领域，其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，是人工智能的延伸。

在此之前深度学习都是应用于图像，声音，文本领域，人脸部分也是基于像素的识别，本质上是二维的人脸识别，无法避免传统的姿势，光照的影响。我们创新地将深度学习理论应用于人脸三维深度数据的处理和识别，提出了一种深度学习SDAE理论和深度信息相结合的新的人脸识别算法，避免了传统的问题并获得了较好的识别率，在此基础上我们又提出了该算法模型在金融方面的应用。

提醒：本发明的重点在于提供一种基于深度学习SDAE理论的三维人脸识别算法，该算法使用的人脸的深度数据，前期准备包括人脸数据的获取，三维人脸特征的提取，数据降噪等，而这些准备工作不在本发明内介绍，默认得到的是已经经过前期处理的人脸数据。

1.构建一个基于深度学习SDAE理论的三维人脸识别算法模型，包括以下步骤：

1)人脸深度数据归一化；

2)利用NN模型构建SDAE网络结构；

3)AutoEncoder进行无监督预训练；

4)fine_turing过程有监督微调；

5)分类及预测结果阶段(即人脸识别)。

2.所述的人脸深度数据归一化步骤包括：

1)点云图像的人脸姿态矫正；

2)选取对表情不敏感的特征点；

3)得到深度信息；

4)返回深度数据训练矩阵。

3.所述的利用NN模型构建SDAE网络结构步骤包括：

1)设计网络结构(输入层，中间隐层，输出层)；

2)根据神经网络堆叠AutoEncoder。

4.所述的AutoEncoder进行无监督预训练步骤包括：

1)根据网络结构和人脸深度信息调整参数；

2)将训练样本分为若干组，分别训练若干轮；

3)进行无监督学习SDAEtrain。

5.所述的进行无监督学习SDAEtrain步骤包括：

1)计算前馈网络；

2)误差反向传播计算误差；

3)权值参数更新。

本算法在金融领域(借贷人信用评级和借贷额度)的应用，步骤如下：

1.不需要实体柜台和工作人员，系统采集初次借贷人的人脸三维数据，即刷脸工作；

2.系统自动将人脸数据与公安部数据库匹配验证身份；

3.往后如果借贷人有违反银行规定的行为利用该算法识别身份；

4.将违规行为同步到与借贷人绑定的电子信用档案；

5.根据电子信用档案调整借贷人的信用评级；

6.当再次借贷时本策略可以识别借贷人身份并搜索电子信用数据库和大数据分析给出银行合理的建议。

本发明对于医疗的有益效果在于：

①不同于传统的实体银行，该算法直接应用于基于互联网的虚拟银行，虚拟银行不设置物理站点，没有实体营业柜台，通过摄像头或其他采集设备，进行“刷脸”认证，不需要人工登记盖章等环节就可以系统审核贷款额度并“告知”ATM机。

②人脸深度数据相当于提供了一个借贷人电子信用档案的“电子身份证”，避免了传统的文本身份及借款登记繁琐的手续，同时利用基于深度学习SDAE理论的三维人脸识别算法可以利用大数据分析和有效监管借贷人的信用评级。

③本策略一旦核实发生违规行为的借贷人身份会及时修改借贷人的电子信用档案，降低其借贷信用等级，与传统的工作人员工作相比更加高效方便。在帮助健全金融借贷的信用评级体制的同时节省了大量人力物力。

附图说明

图1：基于深度学习SDAE的三维人脸识别算法流程图

图2：人脸点云模型

图3：人脸深度图像

图4：深度图像归一化

图5：构建网络及逐层训练

图6：AutoEnconder的重构(复现输入)流程图

图7：加入稀疏约束的SAE模型

图8：加入噪声的DAE模型

具体实施方式

(下文将结合附图详细描述本发明的实施例。应当注意的是，下述实施例中描述的技术特征或者技术特征的组合不应当被认为是孤立的，它们可以被相互组合从而达到更好的技术效果。在下述实施例的附图中，各附图所出现的相同标号代表相同的特征或者部件，可应用于不同实施例中。)

本发明借助深度学习SDAE原理由自己设计一个能够对大数据量三维人脸深度数据进行学习的合适的SDAE算法模型并进行识别分析。

步骤S111:人脸深度数据归一化

对于我们接触的三维人脸数据，最易得到的三维点云数据如图2，其对应的是人脸深度图像，如图3，将取得的点云图像根据三维坐标旋转公式归一化至右手坐标系完成人脸姿态矫正，得到的与XOY平面的欧式距离即为深度信息，如图4，由于鼻尖点是人脸受表情影响最小的特征点，将深度数据平移至以鼻尖点为原点的坐标系。

假设原始采集的人脸为M个人，每人N个样本，每个样本获得的人脸上的三维深度特征值为T，将所有数据形式表征为(M*N)*T的训练矩阵train，同时生成与之匹配的(M*N)*1的结果矩阵train_match。在测试训练结果时，测试时取得的人脸为某个人n数量样本，每个样本坐标数为t，将形式表征为n*t的测试矩阵test和test_match。

步骤S112：利用NN模型构建SDAE网络结构

本算法的SDAE网络由一个AutoEncoder堆叠而成，例如一个包含10个人的样本集为10000*121的矩阵，即构建网络的节点向量，即visible层为121个节点，设计网络结构为：121-50-10三层神经网络，一个输入层121，一个中间隐层50，一个输出层10(预测分类数的元包矩阵)，如图5。

nnsetup构建神经网络结构：

Encoder过程：y＝f(xw'+b)

Decoder过程：x＝g(wy+b)

步骤S113：AutoEncoder进行无监督预训练

-Input：X code：h＝W^TX

-loss:

AutoEnconder的重构(复现输入)流程如图6。

Sdae.ae{1}.activation_function ＝'sigm'；

Sdae.ae{1}.learningRate ＝1；

Sdae.ae{1}.inputZeroMaskedFraction ＝0.5；

设置激活函数activation_function为sigmoid函数；

设置学习速率learningRate为1；

给输入值加入噪声0.5的inputZeroMaskeFraction，使学习能力更强。

动量项nn.momentum：调节在应用minibatch方法训练网络时，每次新权值更新值和上一次权值更行值的相对比例；

权值惩罚项nn.weightPenaltyL2：防止权值过大，发生过拟合现象；

稀疏目标nn.sparsityTarget：通过控制隐层激活值的平均值，来控制隐层激活值的稀疏性。

加入稀疏的约束条件变形为SAE模型如图7，训练中加入噪声变形为DAE模型如图8。

Opts.numepochs ＝10；

Opts.batchsize ＝50；

Sdae＝sdaetrain(sae,train,opts)；

所有样本训练次数numepochs为10次，防止出现误差，使结果更加精确。

将训练样本分成多个batch，每个batch中样本数为50个，使Matlab的运行处理更加高效。

SDAEtrain是无监督学习，通过for循环调用NNtrain，依次训练每个autoencoder，在NNtrain主要进行三步：

①nn＝nnff(nn,batch_x,batch_y)；％前馈计算网络

②nn＝nnbp(nn)；％反向函数计算误差和权值梯度

③nn＝nnapplygrads(nn)；％权值参数更新

步骤S114：fine_turing过程有监督微调

设置激活函数activation_function为sigmoid函数；

设置学习速率learningRate为1；

nn＝nntrain(nn,train,train_match,opts)；

把Pre_training阶段，学习到的权值矩阵，作为网络权值的初始值。

步骤S115：分类及预测结果阶段(即人脸识别)

输出显示人脸识别结果[er,bad]＝nntest(nn,test,test_match)；

labels＝nnpredict(nn,x)；

nnpredict函数首先实现一个网络的前馈计算，计算样本属于每个分类的“概率”。

nn＝nnff(nn,x,zeros(size(x,1),nn.size(end)))；

根据最大化原则，确定样本的分类，并提取类别标签。

Claims

1.构建一种基于深度学习SDAE理论的三维人脸识别算法模型，包括以下步骤：