一种在医保应用中场景自适应的人脸识别系统
技术领域
本发明涉及人脸识别技术领域,具体地说是一种在医保应用中场景自适应的人脸识别系统。
背景技术
人脸是一个人最天然、最直观的身份特征表示,人脸图像取样方便,且不同人脸重复(俗称撞脸)的概率极低,非常适用于需要做身份鉴别的场合。人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术,通过将静态图像或视频帧图像与数据库中的人脸图像进行匹配,以达到身份识别和鉴定的目的。相比于指纹、虹膜、DNA等其他的生物识别技术,人脸识别技术更加友好便捷,因此具有广泛的应用前景。随着深度学习算法的发展,人脸识别的准确率越来越高,该技术开始大规模进入实用阶段。
人脸识别系统普遍存在的一个问题就是识别效果容易受到环境的影响,在不同的场景下,由于受到光照、分辨率等因素的影响,人脸匹配的相似度会出现波动,某些恶劣情况下,识别的正确率甚至会急剧下降。以医保应用为例,在系统内储存有标准人脸图像,根据现场对人脸图像的采集,将其与标准人脸图像进行比对。
一般来说,储存在数据库中的人脸图像,通常是在环境极好的场景下拍摄的,例如身份证照,不存在光照不良、成像模糊等问题,而人脸识别系统在工作时,往往是通过监控摄像头获取到人脸图像,往往会出现暗光、侧光、距离过远不清楚、运动过快成像模糊等问题。当两张所处环境类似的人脸图像进行比对时,其相似度结果输出正常,不同人的相似度低,同一人的相似度高;而当两张环境差异较大的人脸图像进行比对时,其相似度结果就会急剧下降,即使同一个人的两张照片,相似度也会很低,与两张不同人照片的相似度差不多,从而导致错误的识别结果。
例如,用户A、B的注册照均为身份证照片,用户A在普通环境下,摄像头抓拍到的人脸图像,与自身注册照相似度达到90%,与用户B的注册照相似度为60%,假设系统以相似度70%为判断界限,故而此图可以正确识别为用户A;而在暗光状态下,A与其自身注册照的相似度也只有60%,与用户B的相似度为40%,从而此图被判断为不在库中的未注册人脸,识别结果错误。
正是因为以上原因,影响了人脸识别的适用范围和使用环境。那么,以上技术问题的解决也就对人脸识别系统的进一步应用至关重要。
发明内容
有鉴于此,本发明针对上述现有技术存在的容易受环境影响而降低识别效果的技术问题,提供了一种识别准确率高的场景自适应的人脸识别系统。
本发明的技术解决方案是,提供一种以下的场景自适应的人脸识别系统,包括人脸检测模块、特征提取模块和相似度计算匹配模块,所述的人脸检测模块检测人脸,得到人脸图像,所述的特征提取模块从人脸图像中提取显著性特征,所述的相似度计算匹配模块将所述的显著性特征与已有标准图像进行对比,从而计算得到相似度;
所述的人脸识别系统还包括相似度补偿模块,所述的相似度补偿模块包括光照判断模块和距离判断模块和模糊判断模块,所述的光照判断模块和距离判断模块能够根据所述的人脸图像判断出拍摄的光照和距离,从而得到补偿系数,根据所述的补偿系数对相似度进行补偿。
采用以上方案,本发明与现有技术相比,具有以下优点:采用本发明,本发明通过光照判断和距离判断对相似度进行补偿,即通过判断拍摄的实际光照和距离条件来得到补偿系数,以弥补实际拍摄条件与已有标准图像的拍摄条件差距,有利于提高检测到的人脸图像与已有标准图像匹配的相似度,从而提高人脸识别的准确性,使其可以适应不同场景下的人脸图像比对,输出稳定的相似度结果。
作为改进,所述的相似度补偿模块还包括模糊判断模块,所述的模糊判断模块根据所述人脸图像的清晰度,与所述光照判断模块和距离判断模块协同,得到补偿系数。模糊判断能够在光照和距离的基础上,加入清晰度的考虑,从而协同得到补偿系数,进一步提高识别准确性。
作为改进,当人脸检测模块检测并得到人脸图像后,所述的特征提取模块利用卷积神经网络算法,对人脸图像进行特征提取。提取特征的算法采用卷积神经网络(Convolutional Neural Network,CNN)模型,卷积神经网络是目前深度学习领域中使用最广泛、效果最好的模型框架,相比与传统的手工特征,具有更强的鲁棒性,识别能力有大幅度的提高。
作为改进,在光照判断模块中,对人脸图像的像素灰度值进行直方图统计,不同光照场景下的人脸图像的直方图分布是有明显差异,根据其分布情况,判断出图像的光照情况,得到光照补偿参数。
作为改进,在距离判断模块中,利用特征点定位的算法,计算出特定五官之间的距离,再结合摄像头本身的分辨率信息,从而判断出待识别人脸和摄像头的距离,得到距离补偿参数。因为五官的距离和人脸与摄像头的距离均为人脸识别的重要信息,以此作为补偿系数的重要权项,识别结果更为稳定。
作为改进,在模糊判断模块中,利用支持向量机算法,训练出了判断模糊程度的支持向量机模型,我们将模糊程度划分为清晰、一般模糊、重度模糊三个级别,得到模糊补偿参数。
作为改进,所述的光照补偿参数、距离补偿参数和模糊补偿参数,根据各个补偿参数的权重,得到所述的补偿系数。
附图说明
图1为本发明一种在医保应用中场景自适应的人脸识别系统的框图;
图2为直方图统计差异对比图;
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,但本发明并不仅仅限于这些实施例。
本发明涵盖任何在本发明的精髓和范围上做的替代、修改、等效方法以及方案。为了使公众对本发明有彻底的了解,在以下本发明优选实施例中详细说明了具体的细节,而对本领域技术人员来说没有这些细节的描述也可以完全理解本发明。
如图1所示,示意了本发明的一种在医保应用中场景自适应的人脸识别系统的框图流程,所述的场景自适应的人脸识别系统包括人脸检测模块、特征提取模块和相似度计算匹配模块,所述的人脸检测模块检测人脸,得到人脸图像,所述的特征提取模块从人脸图像中提取显著性特征,所述的相似度计算匹配模块将所述的显著性特征与已有标准图像进行对比,从而计算得到相似度;所述的已有标准图像即为图中注册人脸特征。
所述的人脸识别系统还包括相似度补偿模块,所述的相似度补偿模块包括光照判断模块和距离判断模块和模糊判断模块,所述的光照判断模块和距离判断模块能够根据所述的人脸图像判断出拍摄的光照和距离,从而得到补偿系数,根据所述的补偿系数对相似度进行补偿。
所述的相似度补偿模块还包括模糊判断模块,所述的模糊判断模块根据所述人脸图像的清晰度,与所述光照判断模块和距离判断模块协同,得到补偿系数。
当人脸检测模块检测并得到人脸图像后,所述的特征提取模块利用卷积神经网络算法,对人脸图像进行特征提取。提取特征的算法采用卷积神经网络(ConvolutionalNeural Network,CNN)模型,卷积神经网络是目前深度学习领域中使用最广泛、效果最好的模型框架,相比与传统的手工特征,具有更强的鲁棒性,识别能力有大幅度的提高。本发明中所使用的卷积神经网络模型,经由百万数量级的训练样本学习而来,对不同人种、不同年龄,一定范围内人脸的姿态、表情、光照、尺度等变化都有较好的适应能力。
如图2所示,在不同光照下,直方图统计存在较大差异,图中进行了对比。在光照判断模块中,对人脸图像的像素灰度值进行直方图统计,不同光照场景下的人脸图像的直方图分布是有明显差异,根据其分布情况,判断出图像的光照情况,得到光照补偿参数。根据统计出的光照分布中心,可计算出相应的光照补偿参数C1。具体公式如下:
其中I为光照分布中心,即当I>180时,属光照良好的情况,无需补偿;当I≤180时,光线开始偏暗,逐步加大补偿,最大不超过w为可调参数,一般取在0.03左右。
在距离判断的模块中,利用特征点定位的算法,可以计算出特定五官之间的距离,再结合摄像头本身的分辨率信息,就可以判断出待识别人脸和摄像头的距离。例如某720P摄像头的情况如下表所示。
两眼距离(像素) |
人脸离摄像头的距离(米) |
40 |
2 |
30 |
3 |
20 |
4 |
根据实验统计结果分析,当人脸距离小于2米时,人脸相似度的结果基本不受距离影响,可以不做补偿,即当人脸距离小于等于2米时距离的补偿参数C2为0,大于2米时开始引入补偿参数,随距离增大而增大;而补偿参数也不宜过大,以距离4米时的补偿为最高上限。具体公式如下:
其中d为图像中两眼的像素距离,η为可调参数,一般取在0.04左右。
在距离判断模块中,利用特征点定位的算法,计算出特定五官之间的距离,再结合摄像头本身的分辨率信息,从而判断出待识别人脸和摄像头的距离,得到距离补偿参数。因为五官的距离和人脸与摄像头的距离均为人脸识别的重要信息,以此作为补偿系数的重要权项,识别结果更为稳定。
在模糊判断模块中,利用支持向量机算法,训练出了判断模糊程度的支持向量机模型,我们将模糊程度划分为清晰、一般模糊、重度模糊三个级别,得到模糊补偿参数。具体补偿参数C3数值如下表所示:
C3 |
模糊判断结果 |
0 |
清晰 |
β |
一般模糊 |
1.5β |
重度模糊 |
其中β为可调参数,一般取在0.02左右。
所述的光照补偿参数、距离补偿参数和模糊补偿参数,根据各个补偿参数的权重,得到所述的补偿系数。综合上述三个模块的结果,可以计算出对相似度做出补偿的参数C:
其中γ为可调参数,一般取在0.04左右。γ实际上为三个参数设置了同一个权重,但是,可以根据实际需要,可以设置γ1、γ2、γ3分别作为C1、C2、C3的权重系数,均在本发明的保护之内。
以下列举了一个实际的相似度补偿过程及结果的相似度数据,其中注册人脸为A、B、C,待识别人脸X(实际为人物A),以相似度达到0.7为识别阈值,补偿前无法识别人脸X,而补偿后则可以将X识别为A。
|
补偿前 |
补偿后 |
A |
0.62 |
0.77 |
B |
0.55 |
0.59 |
C |
0.56 |
0.61 |
需要注意的是,根据实际项目的应用场景确定,则可以在系统的工作过程中收集样本,后台做统计分析,根据结果可以对w、η、β、γ这四个参数做进一步优化调整,可以获得更好的识别效果。在本发明中,由于特征提取的模块和相似度补偿模块可以并行计算,故而可以采用多线程的方式工作,虽然多加了两步运算,但对系统的运行速度几乎没有影响。
以上仅就本发明较佳的实施例作了说明,但不能理解为是对权利要求的限制。本发明不仅局限于以上实施例,其具体结构允许有变化。总之,凡在本发明独立权利要求的保护范围内所作的各种变化均在本发明的保护范围内。