发明内容
因此,本发明的目的在于提供了一种基于单训练样本人脸识别的身份认证方法,通过事先构建针对面部子特征的多训练样本集,实现对面部子特征的识别能力,并结合子特征识别融合技术,实现单训练样本人脸识别。
本发明采用以下技术方案:
一种基于单训练样本人脸识别的远程身份认证方法,其特征在于,包括以下步骤:
1)输入人脸子特征训练样本素材:准备一组人脸照片,容量为M = m[1]+m[2]+…+m[N],其中,N是训练样本中参加拍摄样本的人的数量,m[i](1≤i≤N,m[i]≥1)是第i个人在给定的不同拍摄条件下照片的总数量;
2)构造训练样本:M个训练素材,两两配对,产生M×M个人脸照片的训练样本;
3)提取每个所述训练样本的P个子特征,进而通过每个训练样本中两张照片对应子特征之间的差值获得每一训练样本的P个子特征度量模块;
4)给定任意的训练样本,依据P个子特征度量模块计算训练样本中两幅图像的差值,构造该样本的P维样本特征数据向量v,若训练样本中两副照片代表同一个人时,v的响应值为r=1,否则r=0;
5)依据步骤4)中,对于M×M个训练向量和对应的响应值,通过机器学习的方法,得到机器学习的训练结果数据集;
6)输入待识的当事人人脸照片,调用远程的人脸图片库,从人脸图片库中取出匹配当事人的单张照片,调用P个子特征度量模块计算出P个拓扑学距离空间意义下的距离,构成待测试向量v’,依据步骤5中的机器学习算法和训练结果数据集,预测判定v’对应的值r’;当r’=1时,判定当事人的待识别照片与人脸图片库中所述单张照片对应同一人;当r’=0时,判定两幅照片对应不同人。
通过以上技术方案可以看出,依据本发明,通过适量的人脸子特征训练样本,构造子特征度量模块,进而生成P维样本数据向量v,通过机器学习算法形成训练结果数据集,步骤6)依据采用的机器学习算法和训练结果数据集判断某对于单训练样本的照片和输入的待识别照片进行识别,这种方式大大提高了识别率,使单训练样本人脸识别方法具有产业应用前景。在步骤6)中,子特征的差值泛指两个字特征向量在其所在拓扑学意义下距离空间内的距离。
上述基于单训练样本人脸识别的远程身份认证方法,在步骤2)之前还包括对样本素材尺度标准化的步骤:统一所有照片上人的瞳孔平均坐标,且统一每一照片上的两瞳孔间距,并把所述照片规整为同一尺寸。
上述基于单训练样本人脸识别的远程身份认证方法,对样本素材尺寸标准化后还包括对样本素材灰度化的步骤。
上述基于单训练样本人脸识别的远程身份认证方法,还包括对所获得的灰度化的所述照片进行亮度标准化的步骤。
上述基于单训练样本人脸识别的远程身份认证方法,亮度标准化是执行人脸检测,切割出人脸区域,然后让面部平均亮度和反差标准化。
上述基于单训练样本人脸识别的远程身份认证方法,面部平均亮度的标准为127,反差标准化的标准是亮度均方差为32。
上述基于单训练样本人脸识别的远程身份认证方法,所述步骤2)中照片规整的尺寸为像素值240×320,瞳孔距离64像素。
上述基于单训练样本人脸识别的远程身份认证方法,对于RGB彩色照片,转换为灰度图像的步骤为,读取各像素3个通道的亮度值,利用Y =
((R*299)+(G*587)+(B*114)) / 1000进行灰度化。
上述基于单训练样本人脸识别的远程身份认证方法,所述子特征的个数不少于6个且不大于38个。
上述基于单训练样本人脸识别的远程身份认证方法,机器学习的方法选自人工神经网络算法、支持向量机算法、贝叶斯分类算法、决策树算法。
具体实施方式
当前的单训练样本人脸识别方法普遍识别率不高,大多在65%左右,不具有市场前景。发明人认为,只有识别率大于90%才具有产业应用的价值。
参照说明书附图1,配置为人脸采集模块,通过图像或者是片采集数据获得代是别的照片,也就是图中左部的人脸照片;配置人脸照片库,通常是国家人口信息库、公安部的追逃库、银行联网核查库等匹配的库文件,自然也包括如某个公司的人员库,其所存在的往往是单一的照片,如身份证件的人脸照片,且表情往往比较单一。另外,配置的人脸照片库大多远程分布,部分本地存放,如以公司为单位的库文件,即便是公司内部,可能涉及多个采集点,相应的库文件可能也远程布设。
然后配置的人脸对比模块为本文所提出的基于单训练样本的人脸识别方法,或者说本文的改进点体现在人脸对比方法的改进上。
从而,关于人脸对比方法,通过有效融合多种子识别特征,实现单训练样本人脸识别。具体步骤以树形结构的形式描述如下:
1、获取样本素材:其容量为M = m[1]+m[2]+…+m[N],N是训练样本中参加拍摄样本人的数量,m[i](1≤i≤N,m[i]≥1)是第i个人在不同拍摄条件(如光照、姿态、表情等拍摄条件)下照片数量,该数量越大最终所获得的域就越大,但运算量也会相应增大。
2、样本素材尺度标准化,以利于后续步骤的处理:采集的人像照片根据统一的标准,尺寸标准化。
2-1、根据2,统一缩放、旋转、平移、剪裁样本素材,使得照片尺寸统一为240×320,两瞳孔平均纵坐标为160,瞳孔平均横坐标为120,瞳孔距离64像素。其中的缩放、旋转、平移针对照片本身原始的图像要素进行选择,如角度不正,旋转到位即可。
注:在图像处理中,行列自动为像素值所标定,纵横坐标对应该像素值。
3、样本素材灰度化:把RGB彩色图像转换为灰度图像。
3-1、根据3,可用公式Y = ((R*299)+(G*587)+(B*114)) / 1000,把RGB彩色图像转换为灰度图像。
4、照片亮度标准化:让面部平均亮度和反差标准化。
4-1、根据4,让照片面部平均亮度值为127,亮度均方差32。
5、构造训练样本:M个训练素材,两两进行配对,产生M×M个人脸照片配对,这些配对就是训练样本。
6、根据M×M个训练样本,构造P(P≥1)个子特征度量模块,每个子特征度量模块可以根据训练样本计算样本中的两张照片对应特征之间的差值。
以下为经过验证可被选用的子特征度量模块,数量为7个,并且通过经过验证,最多可以构建38个子特征度量模块。
6-1、根据6,子特征度量模块的一种是实现方法是计算样本中两幅照片中人脸下巴纵坐标的差。
6-2、根据6,子特征度量模块的一种是实现方法是计算样本中两幅照片中人脸宽度的差。
6-3、根据6,子特征度量模块的一种是实现方法是计算样本中两幅照片中人脸下嘴唇纵坐标的差。
6-4、根据6,子特征度量模块的一种是实现方法是计算样本中两幅照片中人脸眉毛区域差异部分的面积(像素数)。
6-5、根据6,子特征度量模块的一种是实现方法是计算样本中两幅照片中人脸性别的差异,同性别差异为0,不同性别差异为1。
6-6、根据6,子特征度量模块的一种是实现方法是计算样本中两幅照片中人脸的嘴宽度的差。
6-7、根据6,子特征度量模块的一种是实现方法是计算样本中两幅照片中人脸的ASM轮廓模型对应节点坐标距离之和。
7、给定任意的训练样本,依据P个子特征度量模块计算的样本中两幅图像的差值,构造一个P维样本特征数据向量v。当训练样本中的两幅照片代表同一个人时,向量v对应的响应值r=1,否则r=0。
8、对于M×M个训练样本,可以得到M×M个训练向量和对应的响应值,可以借助于机器学习算法,得到机器学习训练结果数据集。
8-1、根据8,机器学习算法可以是人工神经网络算法。
8-2、根据8,机器学习算法可以是支持向量机算法。
8-3、根据8,机器学习算法可以是贝叶斯分类算法。
8-4、根据8,机器学习算法可以是决策树算法。
这样,通过前述的8个步骤就构造除了对比方法,依据所述对比方法,具体的对比步骤为:
通过人脸采集模块获取待识别对象的人脸照片,这里的人脸照片通常是现场提取,如摄像头的采集,然后通过匹配的人脸照片库调出所述待识别对象的信息库人脸照片。进而,使用所述对比方法,调用P个子特征度量模块计算出P个差值,构成待测试向量v’。依据步骤8中机器学习算法和训练结果数据集,预测判定v’对应的值r’。当r’=1时,判定两幅照片对应同一人;让r’=0时,判定两幅照片对应不同人。从而,判断出待识别对象是否在相应的人脸数据库中。
在以上的内容中,人脸采集模块、人脸照片库和人脸比对模块,根据具体的配置可分布于相同或者不同的装置内。其相互之间的通讯,可以采用基于有限网络的通讯方式,亦可以采用基于无线网络的通信方式,还可以采用通过存储介质匹配数据转移的架构,同时,还可以采用本地调用的方式。
以上机器学习的算法是当前比较常用的图像处理算法,在此不再赘述。
经过验证上述识别方法的识别率在92.5~96%。
一个实施例:
1、编制样本素材:编制容量为M = N×10=200×10=2000的样本素材,N=200是训练样本中参加拍摄样本人的数量,每人10张照片。
2、统一缩放、旋转、平移、剪裁样本素材,使得照片尺寸统一为240×320,两瞳孔平均纵坐标为160,瞳孔平均横坐标为120,瞳孔距离64像素。
3、样本素材灰度化:用公式Y = ((R*299)+(G*587)+(B*114)) / 1000,把RGB彩色图像转换为灰度图像。
4、照片亮度标准化:让照片面部平均亮度值为127,亮度均方差32。
5、构造训练样本:M=2000个训练素材,两两进行配对,产生M×M个=4000000个人脸照片配对,这些配对就是训练样本。
6、根据M×M=4000000个训练样本,构造P=12个子特征度量模块,每个子特征度量模块可以根据训练样本计算样本中的两张照片计算对应特征之间的差值。这12个子特征模块分别度量以下特征:
(1)眉毛浓度;
(2)眉毛宽度;
(3)鼻孔纵坐标;
(4)鼻孔间距;
(5)嘴中心点纵坐标;
(6)上嘴唇纵坐标;
(7)具有68个节点的ASM模型;
(8)眉毛的分布区域;
(9)眼睛的二值化形状;
(10)嘴的形状类型(利用聚类分析算法分类)
(11)鼻子形状类型(利用聚类分析算法分类)
(12)性别
7、给定任意的训练样本,依据P=12个子特征度量模块计算的样本中两幅图像的插值,构造一个P=12维样本特征数据向量v。当样本中的两幅照片代表同一个人时,向量v对应的响应值r=1,否则r=0。
8、对于M×M=4000000个训练样本,可以得到M×M=4000000个训练向量和对应的响应值,可以借助于贝叶斯分类器,得到机器学习训练结果数据集。
9、构造定待测试样本:给出待识别比对的两幅人脸照片,调用P=12个子特征度量模块计算出P=12个差值,构成12维待测试向量v’。依据8中机器学习算法和训练结果数据集,预测判定v’对应的值r’。当r’=1时,判定两幅照片对应同一人;当r’=0时,判定两幅照片对应不同人。
经过验证,该方法的识别率为95%。