CN110210399A - 一种基于不确定性量化概率卷积神经网络的人脸识别方法 - Google Patents
一种基于不确定性量化概率卷积神经网络的人脸识别方法 Download PDFInfo
- Publication number
- CN110210399A CN110210399A CN201910475769.1A CN201910475769A CN110210399A CN 110210399 A CN110210399 A CN 110210399A CN 201910475769 A CN201910475769 A CN 201910475769A CN 110210399 A CN110210399 A CN 110210399A
- Authority
- CN
- China
- Prior art keywords
- layer
- face
- neural networks
- probability
- convolutional neural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Abstract
本发明涉及了一种基于不确定性量化概率卷积神经网络的人脸识别方法,包括训练阶段和识别阶段,通过已知类别的样本对概率卷积神经网络进行训练,将人脸特征的提取用概率卷积神经网络的学习过程实现,并将人脸特征的描述用连接权大小表示,然后用训练样本测试训练好的概率卷积神经网络并确定分类阈值,将待识别样本输入到概率卷积神经网络并计算其的输出向量,取其中最大分量与分类阈值比较给出识别结果,并对识别结果给出不确定性量化分析,提供对识别结果的均值和方差估计。采用概率卷积神经网络系统通过差异提取层和特征映射层避免显式地特征提取过程,隐式地从样本中获取对构筑样本空间贡献较大的特征,与现有的相比有更高的识别率和抗干扰性。
Description
技术领域
本发明涉及人脸识别技术领域,具体地,涉及一种基于不确定性量化概率卷积神经网络的人脸识别方法。
背景技术
人脸识别技术是利用计算机分析人脸图像,提取有效的特征信息,识别个人身份的技术。它首先判断图像中是否存在人脸?如果存在则进一步确定每张人脸的位置、大小信息。并依据这些信息进一步提取每张人脸中潜在的模式特征,将其与已知人脸库中的人脸进行对比,从而识别每张人脸的类别信息。其中,判断一幅图像中是否存在人脸的过程就是人脸检测,将提取特征后的图像与已知人脸库对比的过程就是人脸识别。
目前基于卷积神经网络的人脸识别方法主要是把神经网络作为一个分类器使用,神经网络的输入为面部关键部位的形状、大小、位置关系等特征,神经网络只是根据这些特征完成模式分类。可见,这些方法依靠的是一些“看似有效的特征”存在着主观性、获取特征计算量大、鲁棒性差等问题。其实,人们对人和事物的模式识别往往依靠的是那种难以描述的“神似”特征,这些特征很难用类似于提取和描述形状、大小等特征的方法去获得和描述。
用神经网络模拟人的学习过程和联想能力,可以从复杂的数据中建立辨识系统,这符合人类对人脸图像这种复杂数据的认知过程。用神经网络去发现同一人脸多幅图像中存在的共性特征是通过调整神经网络的连接权实现的,这就是神经网络的训练。一旦训练完成,神经网络就可以作为人脸识别器使用,且识别过程无须“逐一比对”,对待识别人数多的识别问题,该系统识别每个人脸图像需要的时间都是相同的。
人脸识别要解决的关键问题就是如何提取和表示那些“只可意会、不可言传”的“神似”特征,而神经网络所具有的学习功能和非线性映射功能有助于神经网络从样本感悟至IJ这些特征并记忆于连接权上,实现“神似”特征的提取和表示。
近几年研究者在人脸检测与人脸识别方面取得了大量成果,在检测性能和识别性能上都有很大提高。近几年,大量的人脸检测算法被提出,这些算法大致可以分为3类:(1)基于肤色特征的方法,(2) 基于知识模型的方法,(3)基于统计理论的方法。其中,人工神经网络(ANN)方法通过训练一个网络结构,把模式的统计特性隐含在网络结构和参数之中,对于人脸这类复杂的、难以显式描述的模式,基于ANN的方法具有独特的优势,Rowiey使用了两层ANN检测多姿态的人脸,第一层用来估计输入图像窗口的人脸姿态,第二层为三个人脸检测器,分别用来检测正面人脸、半侧面人脸、侧面人脸。一幅输入图像首先经过人脸姿态检测器估计其人脸姿态,对图像进行相应的预处理后,将其作为第二层的三个人脸检测器,最终确定人脸的位置以及姿态。
而卷积神经网络是近年发展起来,并引起广泛重视的一种高效识别方法。20世纪60年代,Hubei和Wiesel在研究猫脑皮层中用于局部敏感和方向选择的神经元时发现其独特的网络结构可以有效地降低反馈神经网络的复杂性,继而提出了卷积神经网络(Convolutional Neural Networks-简称CNN)。现在,CNN已经成为众多科学领域的研究热点之一,特别是在模式分类领域,由于该网络避免了对图像的复杂前期预处理,可以直接输入原始图像,因而得到了更为广泛的应用。 K.Fukushima在1980年提出的新识别机是卷积神经网络的第一个实现网络。随后,更多的科研工作者对该网络进行了改进。其中,具有代表性的研究成果是Alexander和Taylor提出的″改进认知机″,该方法综合了各种改进方法的优点并避免了耗时的误差反向传播。
一般地,CNN的基本结构包括二层,其一为特征提取层,每个神经元的输入与前一层的局部接受域相连,并提取该局部的特征。一旦该局部特征被提取后,它与其他特征间的位置关系也随之确定下来;其二是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射是一个平面,平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数,使得特征映射具有位移不变性。此外,由于一个映射面上的神经元共享权值,因而减少了网络自由参数的个数。卷积神经网络中的每一个卷积层都紧跟着一个用来求局部平均与二次提取的计算层,这种特有的两次特征提取结构减小了特征分辨率。
CNN主要用来识别位移、缩放及其他形式扭曲不变性的二维图形。由于CNN的特征检测层通过训练数据进行学习,所以在使用CNN 时,避免了显示的特征抽取,而隐式地从训练数据中进行学习;再者由于同一特征映射面上的神经元权值相同,所以网络可以并行学习,这也是卷积网络相对于神经元彼此相连网络的一大优势。卷积神经网络以其局部权值共享的特殊结构在语音识别和图像处理方面有着独特的优越性,其布局更接近于实际的生物神经网络,权值共享降低了网络的复杂性,特别是多维输入向量的图像可以直接输入网络这一特点避免了特征提取和分类过程中数据重建的复杂度。
现有的人脸识别大致可分为以下几类方法:(1)基于几何特征的方法;(2)基于弹性模型匹配方法;(3)神经网络方法;(4)基于线性和非线性子空间的方法。目前,存在的很多算法对场景简单的人脸图像具有很好的识别效果,然而在视频监控领域,视频图像受光照,方位,噪声和不同的人脸及表情等影响,即使目前高性能的人脸识别算法在这样的条件下仍不能达到非常理想的识别结果。
虽然人脸识别有很多其他识别无法比拟的优点,但是它本身也存在许多困难。人脸识别的困难主要是人脸作为生物特征的特点所带来的,比如人脸在视觉上的特点是:
1.不同个体之间的区别不大,所有的人脸的结构都相似,甚至人脸器官的结构外形都很相似;这样的特点对于利用人脸进行定位是有利的,但是对于利用人脸区分人类个体是不利的。
2.人脸的外形很不稳定,人可以通过脸部的变化产生很多表情,而在不同观察角度,人脸的视觉图像也相差很大,另外,人脸识别还受光照条件(例如白天和夜晚,室内和室外等环境)、人脸的很多遮盖物、年龄、拍摄的姿态角度等多方面因素的影响。
有上述可知,现有的人脸识别技术存在受人器官的影响以及受人脸脸部表情的影响增加人脸识别干扰因素使得人脸识别效率低、干扰因数多。并且在人脸识别中,第一类的变化是应该放大而作为区分个体的标准的,而第二类的变化应该消除,因为它们可以代表同一个个体。通常称第一类变化为类间变化,而称第二类变化为类内变化。对于人脸,类内变化往往大于类间变化,从而使在受类内变化干扰的情况下利用类间变化区分个体变得异常困难,因此对人脸识别预报和不确定性量化分析就显得尤其重要。
因此,需提供一种提高人脸识别率和抗干扰性的基于不确定性量化概率卷积神经网络的人脸识别方法,以解决现有技术的不足。
发明内容
为了克服现有技术的不足,本发明提供了一种能够提高人脸识别率和抗干扰性的基于不确定性量化概率卷积神经网络的人脸识别方法。
本发明的技术方案如下:
一种基于不确定性量化概率卷积神经网络的人脸识别方法,用于对目标图像进行人脸识别并从多个待判定图像中判定出与所述目标图像相一致的人脸图像,包括以下步骤:
步骤S1:训练阶段,首先通过已知类别的样本对概率卷积神经网络进行训练,将通过人脸特征提取模块对人脸特征的提取并将人脸特征的描述用连接权大小表示,然后用训练样本测试训练好的概率卷积神经网络并确定分类阈值;
步骤S2:识别阶段,将待识别样本输入到概率卷积神经网络中,计算概率卷积神经网络的输出向量,取其中最大的分量与所述分类阈值比较给出识别结果,并对识别结果给出不确定性量化分析,提供对识别结果的均值和方差估计;
在所述步骤S2中的识别包括以下子步骤:
S2-1:通过图像采集与预处理模块对采集的样本进行预处理,得到待识别的样本;
S2-2:选取所述待识别的样本作为卷积神经网络的输入进入人脸识别模块中的输入层,并采用所述人脸识别模块的差异提取层对所述待识别的样本进行差异提取;
S2-3:所述特征提取层的第一层中的神经元提取输入所述待识别的样本中不同方向的边缘成分作为所述差异提取层的第一次特征提取并输出至所述人脸识别模块的特征映射层的第一层输入;
S2-4:所述差异提取层的第一层输出为所述特征提取层的第二层输入,所述特征提取层的第二层完成对所述待识别的样本的第二次特征提取并作为所述特征映射层的第二层输入;
S2-5:所述特征映射层的第二层输出为所述特征提取层的第三层输入,所述特征提取层的第三层完成对所述待识别的样本的第三次特征提取并作为所述特征映射层的第三层输入;
S2-6:所述特征映射层的第三层输出作为所述特征提取层的第四层输入,所述特征提取层的第四层通过监督竞争学习的方式得到各层的权值、阈值及神经元细胞平面数并作为所述特征映射层的第四层输入;
S2-7:所述特征映射层的第四层作为所述人脸识别模块的网络输出层,所述网络输出层由所述特征映射层的第四层的输出最大结果所决定的所述网络输出层最终的模式识别结果的均值和方差预测;
S2-8:完成对所述样本的识别。
优选地,所述样本为人脸图像。
基于上述的所述基于不确定性量化概率卷积神经网络的人脸识别方法,本发明还提供一种人脸自动识别系统,包括:
图像采集与预处理模块,用于对动态采集到的图像进行处理;
人脸检测与定位模块,用于在动态采集的图像中自动找到所要识别人脸的位置;
人脸特征提取模块,用于在人脸定位之后对能反应人脸的特征进行提取;
人脸识别模块,用于完成对每个人脸图像的识别;
人脸识别不确定量化分析模块,用量化异方差不确定性来对人脸图像进行多层特征的分析。
优选地,所述图像采集与预处理模块中的预处理包括定位和分割预处理。
优选地,所述人脸识别模块可以通过概率卷积神经网络的识别法实现人脸识别。
优选地,所述人脸识别不确定量化分析模块上的量化异方差是采用正态分布的形式来实现对人脸的识别预报。
基于上述描述的所述人脸自动识别系统,本发明还提供一种概率卷积神经网络系统,包括卷积层以及由所述卷积层组成的网络架构,
所述卷积层包括输入层、与所述输入层的输出传导连接的差异提取层、与所述差异提取层的输出传导连接特征映射层以及与所述特征映射层连接的网络输出层;
所述网络架构包括:
编码器,用于将概率卷积神经网络系统中的高级输入函数映射到低维具有潜在人脸特征的函数上;
解码器,用于将映射潜在人脸特征的函数到近似人脸识别的结果;
U-Net架构,用于将所述编码器中提取的人脸特征传递至所述解码器中。
优选地,所述特征映射层是由复杂神经元组成的神经层,所述特征映射层的输入连接是固定的,每个特征映射为一个平面,平面上所有神经元的权值相等。
优选地,所述特征映射层的最后一层为识别层,所述识别层给出模式识别的结果的均值和方差预测。
优选地,所述输入层的输出作为所述特征提取层的第一层输入;所述特征提取层第一层中的神经元通过有监督训练提取输入图像中不同方向的边缘成分,并且所述特征提取层的第一层输出作为所述特征映射层的第一层输入;所述特征提取层的第二层和第三层的神经元是无监督竞争学习的自组织神经元;所述特征提取层的第四层通过监督竞争学习的训练来正确识别所有样本;所述特征映射层的最后一层的输出为所述识别层。
优选地,所述编码器由一系列逐渐减少的卷积层组成。其中,所述编码器的输出功能为均值和标准偏差值并对潜在人脸特征进行采样。其中,均值和标准偏差值对应于所述正态分布的函数。
优选地,所述解码器采用一系列所述卷积层将采样的潜在人脸特征映射回原始分辨率层然后进行双线性插值。其中,所述解码器的主干包括两个分支部分,一个所述分支部分用于平均预测,另一个所述分支部分用于对数标准差预测;两个所述分支部分来实现对人脸识别预报和不确定性量化分析。
本发明的有益效果为:与现有技术相比,该基于不确定性量化概率卷积神经网络的人脸识别方法具有以下优点:
(1)通过人脸识别模块中的概率卷积神经网络系统上的多层的特征提取结构使得在识别时对输入样本有较高的畸变容忍的能力;
(2)采用概率卷积神经网络系统通过差异提取层和特征映射层避免显式地特征提取过程,隐式地从样本中获取对构筑样本空间贡献较大的特征,与传统网络相比有更高的识别率和抗干扰性;
(3)采用概率卷积神经网络系统上的特征提取层不同神经元以及学习规则的组合形式,进一步提高了网络的识别能力;
(4)通过对理想预处理条件下的人脸图像的学习,优化了网络系统中各层的权值参数,大大提高了复杂场景中的人脸识别率。实验结果表明此方法明显优于结构法,模板匹配法等传统识别方法。
(5)概率卷积神经网络系统通过识别层给出最终的模式识别结果的均值和方差预测实现对人脸识别预报和不确定性量化分析。
附图说明:
图1为本发明所述人脸自动识别系统的框架图。
图2为本发明所述概率卷积神经网络系统的结构图。
图3为本发明所述概率卷积神经网络系统的网络架构低概率预测的正态分布图。
图4为本发明所述概率卷积神经网络系统的网络架构高能力预测的正态分布图。
图5为本发明所述基于不确定性量化概率卷积神经网络的人脸识别方法的流程图。
图6为本发明所述基于不确定性量化概率卷积神经网络的人脸识别方法识别阶段的流程图。
图7为本发明所述基于不确定性量化概率卷积神经网络的人脸识别方法与现有人脸识别方法相比的数据表格。
具体实施方式
为了使本发明的发明目的,技术方案及技术效果更加清楚明白,下面结合具体实施方式对本发明做进一步的说明。应理解,此处所描述的具体实施例,仅用于解释本发明,并不用于限定本发明。
本发明所提供的基于不确定性量化概率卷积神经网络的人脸识别方法可以应用于人脸闸机、人脸会员识别、人脸签到、安防监控等上。虽然下述具体实施方式结合手机为例来阐述,但应该理解,本发明不受此限制。现通过具体实施方式结合附图的方式对本发明做出进一步的诠释说明。
请参照图1,本发明的提供一种人脸自动识别系统,包括:
图像采集与预处理模块,用于对动态采集到的图像进行处理;
人脸检测与定位模块,用于在动态采集的图像中自动找到所要识别人脸的位置;
人脸特征提取模块,用于在人脸定位之后对能反应人脸的特征进行提取;
人脸识别模块,用于完成对每个人脸图像的识别;
人脸识别不确定量化分析模块,用量化异方差不确定性来对人脸图像进行多层特征的分析。
所述图像采集与预处理模块中的预处理包括定位和分割预处理。其中,图像的预处理是将每一个文字图像分检出来交给识别模块识别,在图像分析中,对输入图像进行特征抽取、分割和匹配前所进行的处理。图像预处理的目的是消除图像中无关的信息,恢复有用的真实信息,增强有关信息的可检测性和最大限度地简化数据,从而改进特征抽取、图像分割、匹配和识别的可靠性;所述图像采集与预处理模块可以通过克服噪声干扰,改善识别效果,主要用于图像增强以滤除噪声,校正不均匀光照,增强对比度使复杂场景图像具有一定的可辨性。
所述人脸检测与定位模块可以通过基于肤色模型的人脸定位算法、基于统计模型的人脸定位算法或基于特征模型的人脸定位算法实现自动识别人脸。
所述人脸检测与定位模块可以通过基于肤色模型的人脸定位算法、基于统计模型的人脸定位算法或基于特征模型的人脸定位算法实现人脸的检测与定位。
所述人脸特征提取模块可以通过基于欧式距离的特征提取方式、基于KL变换的特征提取方式、基于SVD的特征提取方式或基于ICA 的特征提取方式等特征提取方式实现人脸特征的提取。
所述人脸识别模块可以通过概率卷积神经网络系统的识别法实现人脸识别,在其他实施例中,也可以通过人工神经网络(ANN)方法实现人脸识别。
参照图2,所述概率卷积神经网络系统上的卷积层包括输入层、与所述输入层的输出传导连接的差异提取层、与所述差异提取层的输出传导连接特征映射层以及与所述特征映射层连接的网络输出层。
所述差异提取层的输出为特征提取层的第一层输入。其中,所述特征提取层为简单神经元组成的神经层,完成人脸特征的提取,其所述第一层输入的连接是可变的,并在学习过程中不断更正;而对应于每个神经元的所有输入连接还必须满足一个约束条件才能起到差异提取的作用。
所述特征映射层是由复杂神经元组成的神经层,所述特征映射层的输入连接是固定的,每个特征映射为一个平面,平面上所有神经元的权值相等。所述特征映射层的第四层的输出最大结果所决定的所述网络输出层最终的模式识别结果的均值和方差预测,并用来实现对人脸识别预测和不确定性量化分析。
所述特征映射层的最后一层为识别层,所述识别层给出模式识别的结果的均值和方差预测。
将所述概率卷积神经网络系统作为一个眼睛,所述差异提取层相对应于视网膜中的中心细胞,由加强中心感受野神经元平面和抑制中心神经元平面两部分构成。该概率卷积神经网络系统中的网络由所述输入层的输出作为所述特征提取层的第一层输入;所述特征提取层第一层中的神经元通过有监督训练提取输入图像中不同方向的边缘成分,并且所述特征提取层的第一层输出作为所述特征映射层的第一层输入;所述特征提取层的第二层和第三层的神经元是无监督竞争学习的自组织神经元;所述特征提取层的第四层通过监督竞争学习的训练来正确识别所有样本;所述特征映射层的最后一层的输出为所述识别层,所述识别层用于显示网络最终的模式识别结果的均值和方差预测。在本实施例中,所述样本为人脸图像。该概率卷积神经网络系统中的网络在人脸变化过程中可以自动地识别输入模式,而不受输入图片扭曲,缩放和位移的影响。
所述概率卷积神经网络系统包括:
编码器,用于将概率卷积神经网络系统中的高级输入函数映射到低维具有潜在人脸特征的函数上;
解码器,用于映射潜在人脸特征的函数到近似人脸识别的结果;
U-Net架构,用于将所述编码器中提取的人脸特征传递至所述解码器中。
所述编码器由一系列逐渐减少的卷积层组成。其中,所述编码器的输出功能为均值和标准偏差值并对潜在人脸特征进行采样。
所述解码器使用一系列卷积层将采样的潜在人脸特征映射回原始分辨率层然后进行双线性插值。其中,所述解码器的主干包括两个分支部分,一个所述分支部分用于平均预测,另一个所述分支部分用于对数标准差σ预测。
所述解码器上的卷积层一部分设置为协作过滤器,所述协作过滤器目的是为了提高不确定性量化概率卷积神经网络的人脸识别系统的性能。所述协作过滤器是由所述解码器上最大池卷积层组成的,即是由1x1、3x3和两个堆叠的3x3个卷积层并行实现;每个卷积层之间以通道方式连接,以产生发送到下一个网络的最终特征集层。
所述解码器还设置有具有丢弃率0:045的丢失层,所述丢失层用于在所述解码器中帮助避免对一概率训练数据集的模型过拟合。其中,所述丢失层在第一个启动所述协作过滤器之前和之后启用。
所述概率卷积神经网络系统的概率卷积神经网络通过在承认相对高方差估计(即低精度预测)的同时来开始对卷积神经网络进行粗略估计,并随着所述概率训练数据集的训练程序的进展逐步增加网络的预测,降低方差估计值。
请参照图3和图4,所述人脸识别不确定量化分析模块上的量化异方差是采用正态分布的形式来实现对人脸的识别预报,而不是点估计。所述概率卷积神经网络系统中的网络对预测人脸自动识别结果的均值和方差对应的正态分布函数。所述概率卷积神经网络系统的卷积神经网络对人脸自动识别提供了一个置信区间,所述置信区间用于预测对数标准偏差和使用softplus函数来计算相关统计人脸识别信息,通过计算的人脸识别信息设置为所述概率训练数据集,所述概率训练数据集用于负对数似然函数计算。
基于不确定性量化概率卷积神经网络的人脸识别系统通过所述编码器将对人脸特征已使用的层类型进行了颜色编码并采用特征级联方式将所述编码器中的人脸信息传送至所述解码器中解码并通过所述U-Net架构进行处理。其中,通过所述概率卷积神经网络系统的所述解码器上设置的对应于均值μ和方差预测的两个所述分支部分来实现对人脸识别预报和不确定性量化分析,基于不确定性量化概率卷积神经网络的人脸识别系统还采用所述人脸识别不确定量化分析模块上的量化异方差降低方差的估计值以及所述概率卷积神经网络系统,明确不确定性量化得到准确的人脸自动识别结果。
请参照图5,根据上述的基于不确定性量化概率卷积神经网络的人脸识别系统,本发明还提供一种基于不确定性量化概率卷积神经网络的人脸识别方法,主要包括以下步骤:
步骤S1:训练阶段,首先通过已知类别的人脸图像对概率卷积神经网络的所述概率训练数据集进行训练,将人脸特征的提取用概率卷积神经网络的学习过程实现,将人脸特征的描述用连接权大小表示,然后用训练样本测试训练好的概率卷积神经网络并确定分类阈值;
步骤S2:识别阶段,将待识别人脸图像输入到概率卷积神经网络,计算概率卷积神经网络输出向量,取其中最大分量与所述分类阈值比较给出识别结果,并对识别结果给出不确定性量化分析,提供对识别结果的均值和方差估计;
请参照图6,在所述步骤2中的识别包括以下子步骤:
S2-1:通过所述图像采集与预处理模块对采集的人脸图像进行必要的预处理,得到理想的人脸图像;
S2-2:选取所述理想的人脸图像作为所述的概率卷积神经网络系统的卷积神经网络的输入进入所述输入层,并采用所述差异提取层对所述理想的人脸图像进行差异提取;
S2-3:所述特征提取层第一层中的神经元提取输入理想的人脸图像中不同方向的边缘成分作为所述差异提取层的第一次特征提取并输出至所述特征映射层的第一层输入;
S2-4:所述差异提取层的第一层输出为所述特征提取层的第二层输入,所述特征提取层的第二层完成对所述理想的人脸图像的第二次特征提取并作为所述特征映射层的第二层输入;
S2-5:所述特征映射层的第二层输出为所述特征提取层的第三层输入,所述特征提取层的第三层完成对所述理想的人脸图像的第三次特征提取并作为所述特征映射层的第三层输入;
S2-6:所述特征映射层的第三层输出作为所述特征提取层的第四层输入,所述特征提取层的第四层通过监督竞争学习的方式得到各层的权值、阈值及神经元细胞平面数并作为所述特征映射层的第四层输入;
S2-7:所述特征映射层的第四层作为所述网络输出层,所述网络输出层由所述特征映射层的第四层的输出最大结果所决定的所述网络输出层最终的模式识别结果的均值和方差预测;
S2-8:完成对所述人脸图像的识别。
在所述步骤S2-1中,所述理想的人脸图像为具有区分的特定人脸特征的人脸图像。
通过基于不确定性量化概率卷积神经网络的人脸识别方法与现有人脸识别方法相比,计算不同训练集图片识别结果的均值,具体数据如下表所示;
基于上表的数据,与现有人脸识别方法相比,得到本发明的人脸识别方法基于对理想预处理条件下的人脸图像的学习,优化了网络系统中各层的权值参数,大大提高了复杂场景中的人脸识别率。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,其架构形式能够灵活多变,可以派生系列产品。只是做出若干简单推演或替换,都应当视为属于本发明由所提交的权利要求书确定的专利保护范围。
Claims (12)
1.一种基于不确定性量化概率卷积神经网络的人脸识别方法,其特征在于,包括:
步骤S1:训练阶段,首先通过已知类别的样本对概率卷积神经网络进行训练,将通过人脸特征提取模块对人脸特征的提取并将人脸特征的描述用连接权大小表示,然后用训练样本测试训练好的概率卷积神经网络并确定分类阈值;
步骤S2:识别阶段,将待识别样本输入到概率卷积神经网络中,计算概率卷积神经网络的输出向量,取其中最大的分量与所述分类阈值比较给出识别结果,并对识别结果给出不确定性量化分析,提供对识别结果的均值和方差估计;
在所述步骤S2中的识别包括以下子步骤:
S2-1:通过图像采集与预处理模块对采集的样本进行预处理,得到待识别的样本;
S2-2:选取所述待识别的样本作为卷积神经网络的输入进入人脸识别模块中的输入层,并采用所述人脸识别模块的差异提取层对所述待识别的样本进行差异提取;
S2-3:对差异提取的所述待识别的样本的特征逐渐传输出下一层;
S2-4:待所述待识别的样本的特征传输至特征提取层的第四层得到各层的权值、阈值及神经元细胞平面数;
S2-5:所述待识别的样本的特征传输至所述特征映射层的第四层作为所述人脸识别模块的网络输出层,所述网络输出层由所述特征映射层的第四层的输出最大结果所决定的所述网络输出层最终的模式识别结果的均值和方差预测;
S2-6:完成对所述样本的识别。
2.根据权利要求1所述的基于不确定性量化概率卷积神经网络的人脸识别方法,其特征在于,在所述步骤S2-3中,所述差异提取层的输出作为特征提取层的第一层输入,所述特征提取层的第一层中的神经元提取输入所述待识别的样本中不同方向的边缘成分作为所述差异提取层的第一次特征提取并输出至所述人脸识别模块的特征映射层的第一层输入;所述差异提取层的第一层输出为所述特征提取层的第二层输入,所述特征提取层的第二层完成对所述待识别的样本的第二次特征提取并作为所述特征映射层的第二层输入;所述特征映射层的第二层输出为所述特征提取层的第三层输入,所述特征提取层的第三层完成对所述待识别的样本的第三次特征提取并作为所述特征映射层的第三层输入;所述特征映射层的第三层输出作为所述特征提取层的第四层输入,所述特征提取层的第四层通过监督竞争学习的方式得到各层的权值、阈值及神经元细胞平面数并作为所述特征映射层的第四层输入。
3.根据权利要求1所述的基于不确定性量化概率卷积神经网络的人脸识别方法,其特征在于,所述样本为人脸图像。
4.一种人脸自动识别系统,根据权利要求1-3任意一项所述的基于不确定性量化概率卷积神经网络的人脸识别方法,其特征在于,所述人脸自动识别系统包括:
图像采集与预处理模块,用于对动态采集到的图像进行处理;
人脸检测与定位模块,用于在动态采集的图像中自动找到所要识别人脸的位置;
人脸特征提取模块,用于在人脸定位之后对能反应人脸的特征进行提取;
人脸识别模块,用于通过概率卷积神经网络完成对每个人脸图像的识别;
人脸识别不确定量化分析模块,用量化异方差不确定性来对人脸图像进行多层特征的分析。
5.根据权利要求4所述的人脸自动识别系统,其特征在于,所述图像采集与预处理模块中的预处理包括定位和分割预处理。
6.根据权利要求4或5所述的人脸自动识别系统,其特征在于,述人脸识别不确定量化分析模块上的量化异方差是采用正态分布的形式来实现对人脸的识别预报。
7.一种概率卷积神经网络系统,根据权利要求1-3任意一项所述的基于不确定性量化概率卷积神经网络的人脸识别方法,其特征在于,所述概率卷积神经网络系统,包括卷积层以及由所述卷积层组成的网络架构;
所述卷积层包括输入层、与所述输入层的输出传导连接的差异提取层、与所述差异提取层的输出传导连接特征映射层以及与所述特征映射层连接的网络输出层;
所述网络架构包括:
编码器,用于将概率卷积神经网络系统中的高级输入函数映射到低维具有潜在人脸特征的函数上;
解码器,用于将映射潜在人脸特征的函数到近似人脸识别的结果;
U-Net架构,用于将所述编码器中提取的人脸特征传递至所述解码器中。
8.根据权利要求7所述的概率卷积神经网络系统,其特征在于,所述特征映射层是由复杂神经元组成的神经层,所述特征映射层的输入连接是固定的,每个特征映射为一个平面,平面上所有神经元的权值相等。
9.根据权利要求7或8所述的概率卷积神经网络系统,其特征在于,所述特征映射层的最后一层为识别层,所述识别层给出模式识别的结果的均值和方差预测。
10.根据权利要求9所述的概率卷积神经网络系统,其特征在于,,其特征在于,所述输入层的输出作为所述特征提取层的第一层输入;所述特征提取层第一层中的神经元通过有监督训练提取输入图像中不同方向的边缘成分,并且所述特征提取层的第一层输出作为所述特征映射层的第一层输入;所述特征提取层的第二层和第三层的神经元是无监督竞争学习的自组织神经元;所述特征提取层的第四层通过监督竞争学习的训练来正确识别所有样本;所述特征映射层的最后一层的输出为所述识别层。
11.根据权利要求7或8所述的概率卷积神经网络系统,其特征在于,所述解码器采用一系列所述卷积层将采样的潜在人脸特征映射回原始分辨率层然后进行双线性插值,所述解码器的主干包括两个分支部分,一个所述分支部分用于平均预测,另一个所述分支部分用于对数标准差预测;两个所述分支部分来实现对人脸识别预报和不确定性量化分析。
12.根据权利要求7或8所述的概率卷积神经网络系统,其特征在于,所述编码器由一系列逐渐减少的卷积层组成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910475769.1A CN110210399A (zh) | 2019-05-31 | 2019-05-31 | 一种基于不确定性量化概率卷积神经网络的人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910475769.1A CN110210399A (zh) | 2019-05-31 | 2019-05-31 | 一种基于不确定性量化概率卷积神经网络的人脸识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110210399A true CN110210399A (zh) | 2019-09-06 |
Family
ID=67790276
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910475769.1A Pending CN110210399A (zh) | 2019-05-31 | 2019-05-31 | 一种基于不确定性量化概率卷积神经网络的人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110210399A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111798458A (zh) * | 2020-06-15 | 2020-10-20 | 电子科技大学 | 一种基于不确定性引导的交互式医学图像分割方法 |
CN112731410A (zh) * | 2020-12-25 | 2021-04-30 | 上海大学 | 一种基于cnn的水下目标声呐探测方法 |
CN113255576A (zh) * | 2021-06-18 | 2021-08-13 | 第六镜科技(北京)有限公司 | 人脸识别方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104346607A (zh) * | 2014-11-06 | 2015-02-11 | 上海电机学院 | 基于卷积神经网络的人脸识别方法 |
CN107341518A (zh) * | 2017-07-07 | 2017-11-10 | 东华理工大学 | 一种基于卷积神经网络的图像分类方法 |
CN107958230A (zh) * | 2017-12-22 | 2018-04-24 | 中国科学院深圳先进技术研究院 | 人脸表情识别方法及装置 |
CN109635774A (zh) * | 2018-12-21 | 2019-04-16 | 中山大学 | 一种基于生成对抗网络的人脸合成方法 |
CN109785258A (zh) * | 2019-01-10 | 2019-05-21 | 华南理工大学 | 一种基于多判别器生成对抗网络的人脸图像修复方法 |
-
2019
- 2019-05-31 CN CN201910475769.1A patent/CN110210399A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104346607A (zh) * | 2014-11-06 | 2015-02-11 | 上海电机学院 | 基于卷积神经网络的人脸识别方法 |
CN107341518A (zh) * | 2017-07-07 | 2017-11-10 | 东华理工大学 | 一种基于卷积神经网络的图像分类方法 |
CN107958230A (zh) * | 2017-12-22 | 2018-04-24 | 中国科学院深圳先进技术研究院 | 人脸表情识别方法及装置 |
CN109635774A (zh) * | 2018-12-21 | 2019-04-16 | 中山大学 | 一种基于生成对抗网络的人脸合成方法 |
CN109785258A (zh) * | 2019-01-10 | 2019-05-21 | 华南理工大学 | 一种基于多判别器生成对抗网络的人脸图像修复方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111798458A (zh) * | 2020-06-15 | 2020-10-20 | 电子科技大学 | 一种基于不确定性引导的交互式医学图像分割方法 |
CN111798458B (zh) * | 2020-06-15 | 2022-07-29 | 电子科技大学 | 一种基于不确定性引导的交互式医学图像分割方法 |
CN112731410A (zh) * | 2020-12-25 | 2021-04-30 | 上海大学 | 一种基于cnn的水下目标声呐探测方法 |
CN112731410B (zh) * | 2020-12-25 | 2021-11-05 | 上海大学 | 一种基于cnn的水下目标声呐探测方法 |
CN113255576A (zh) * | 2021-06-18 | 2021-08-13 | 第六镜科技(北京)有限公司 | 人脸识别方法及装置 |
CN113255576B (zh) * | 2021-06-18 | 2021-10-29 | 第六镜科技(北京)有限公司 | 人脸识别方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104346607B (zh) | 基于卷积神经网络的人脸识别方法 | |
CN107609460B (zh) | 一种融合时空双重网络流和attention机制的人体行为识别方法 | |
US11908244B2 (en) | Human posture detection utilizing posture reference maps | |
CN110532900B (zh) | 基于U-Net和LS-CNN的人脸表情识别方法 | |
WO2022111236A1 (zh) | 一种结合注意力机制的面部表情识别方法及系统 | |
CN110084156A (zh) | 一种步态特征提取方法及基于步态特征的行人身份识别方法 | |
CN108268859A (zh) | 一种基于深度学习的人脸表情识别方法 | |
CN109101938B (zh) | 一种基于卷积神经网络的多标签年龄估计方法 | |
CN106909938B (zh) | 基于深度学习网络的视角无关性行为识别方法 | |
CN109255289B (zh) | 一种基于统一式生成模型的跨衰老人脸识别方法 | |
CN110210399A (zh) | 一种基于不确定性量化概率卷积神经网络的人脸识别方法 | |
CN109583419A (zh) | 一种基于深度卷积网络的情绪预测系统 | |
CN110135244B (zh) | 一种基于脑-机协同智能的表情识别方法 | |
CN106548194B (zh) | 二维图像人体关节点定位模型的构建方法及定位方法 | |
CN110458235B (zh) | 一种视频中运动姿势相似度比对方法 | |
CN106529441B (zh) | 基于模糊边界分片的深度动作图人体行为识别方法 | |
CN105893941B (zh) | 一种基于区域图像的人脸表情识别方法 | |
CN105608710A (zh) | 一种非刚性人脸检测和追踪定位方法 | |
Song et al. | Feature extraction and target recognition of moving image sequences | |
Huang et al. | Design and Application of Face Recognition Algorithm Based on Improved Backpropagation Neural Network. | |
CN116343284A (zh) | 基于注意力机制的多特征户外环境情绪识别方法 | |
Lin et al. | A BERT based method for continuous estimation of cross-subject hand kinematics from surface electromyographic signals | |
Ahammad et al. | Recognizing Bengali sign language gestures for digits in real time using convolutional neural network | |
CN113221655B (zh) | 基于特征空间约束的人脸欺骗检测方法 | |
CN109344720A (zh) | 一种基于自适应特征选择的情感状态检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190906 |
|
RJ01 | Rejection of invention patent application after publication |