CN114463814A - 一种基于图像处理的快速证件照眼镜检测方法 - Google Patents

一种基于图像处理的快速证件照眼镜检测方法 Download PDF

Info

Publication number
CN114463814A
CN114463814A CN202210094313.2A CN202210094313A CN114463814A CN 114463814 A CN114463814 A CN 114463814A CN 202210094313 A CN202210094313 A CN 202210094313A CN 114463814 A CN114463814 A CN 114463814A
Authority
CN
China
Prior art keywords
glasses
histogram
value
photo
follows
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210094313.2A
Other languages
English (en)
Other versions
CN114463814B (zh
Inventor
兰志才
张正德
李坚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Xihongqiao Navigation Technology Co ltd
Original Assignee
Shanghai Xihongqiao Navigation Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Xihongqiao Navigation Technology Co ltd filed Critical Shanghai Xihongqiao Navigation Technology Co ltd
Priority to CN202210094313.2A priority Critical patent/CN114463814B/zh
Publication of CN114463814A publication Critical patent/CN114463814A/zh
Application granted granted Critical
Publication of CN114463814B publication Critical patent/CN114463814B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于图像处理的快速证件照眼镜检测方法,属于图像识别技术领域。本发明通过图像处理增强证件照的对比度,突出镜框和脸部的分界线,不断对证件照进行切片,获得眼镜可能存在区域的切片,在此基础上进一步图像处理,对眼镜可能存在区域进行高斯平滑处理,基于非极大值抑制输出边缘强度矩阵,强调鼻梁和眼下的眼镜特征,极大程度的提高了本发明识别眼镜的正确率;本发明不依赖深度学习算法进行眼镜识别,针对无框眼镜识别同样有很高的正确率,同时本发明不仅快速,可以满足实时性,而且具有极高的正确率较低的召回率,极大程度的降低了对于计算资源的需求,可以满足内网安全的需求。

Description

一种基于图像处理的快速证件照眼镜检测方法
技术领域
本发明涉及图像识别技术领域,具体为一种基于图像处理的快速证件照眼镜检测方法。
背景技术
证件照是各种证件各种场景中证明身份的照片,证件照是要求各不一致,部分证件照是不允许申请者佩戴眼镜的,通过人工进行筛选不仅需要大量的人工,还会拖慢流程时间,因此需要计算机智能的判别证件照中人物是否佩戴眼镜,传统计算机视觉算法无法正确识别种类繁杂的眼镜,而网络自发训练的端到端识别方法由于缺乏先验知识,吸纳了大量冗余特征,无法较好地取得性能和正确性之间的平衡,如:直接使用支持向量机对戴眼镜的人脸进行学习,由于人脸本身的复杂性,眼镜框的形状和粗细之间的相互作用,无框眼镜缺乏可以用于支持向量机识别的显著的方向梯度直方图特征,这些因素使得识别的正确率和召回率之间无法得到较好的平衡;而深度学习计算方法依赖于大量的计算资源,导致算法运行时间过长。
发明内容
本发明的目的在于提供一种基于图像处理的快速证件照眼镜检测方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种基于图像处理的快速证件照眼镜检测方法,眼镜检测方法的具体步骤包括:
步骤一:获取证件照,通过相机或摄像头或数据采集系统获取证件照;
步骤二:图像处理,对证件照进行图像增强;
步骤三:不断对证件照进行切片,获得眼镜可能存在区域的切片;
步骤四:对眼镜可能存在区域进行高斯平滑处理;
步骤五:基于非极大值抑制输出边缘强度矩阵;
步骤六:基于更新后的边缘强度矩阵进一步切片重组眼镜可能区域;
步骤七:将重组眼镜可能区域输入眼镜支持向量机,输出最终结果。
本发明不依赖深度学习算法进行眼镜识别,通过图像处理不断强化证件照中可能存在的眼镜的特征,配合不断的切片一步步的定位镜框可能存在的位置,极大程度的提高了最终支持向量机识别眼镜的正确率,本发明不仅快速,可以满足实时性,而且具有极高的正确率较低的召回率,极大程度的降低了对于计算资源的需求,同时可以满足内网安全的需求。
所述步骤二中对于证件照进行图像增强包括直方图均衡化和高光修正;
增强证件照的对比度,抑制证件照在空间域中的噪声,突出镜框和脸部的分界线,降低光照对图像的影响,进行高光修正消除图像中的高亮度奇异区域;
所述直方图均衡化具体内容为:将证件照的RGB三通道转化为HSV通道,对于亮度V通道基于累积分布函数进行直方图均衡化,将直方图均衡化的HSV通道重新转化为RGB图像输出;
直接将证件照基于RGB三通道分别进行直方图均衡化会导致出现奇异点,证件照的RGB三通道转化为HSV通道,映射后灰度级为0~255,灰度级得到了扩展,基于累积分布函数将灰度值重新分配,再转化为RGB图像输出。
所述直方图均衡化具体步骤包括:
Step 1.1:计算RGB三通道像素的最大值和最小值的具体公式为:
A=max(r,g,b)
I=min(r,g,b)
其中,r,g,b表示证件照RGB三通道的数值,A表示r,g,b中最大值,I表示r,g,b中最小值;
Step 1.2:将证件照RGB三通道转化为HSV通道具体计算公式为:
Figure BDA0003490468680000021
Figure BDA0003490468680000031
V=A
其中,H表示HSV通道中的色调,S表示HSV通道中的饱和度,V表示HSV通道中的亮度;
Step 1.3:直方图均衡化亮度通道具体公式为:
Figure BDA0003490468680000032
其中,Vhist表示直方图均衡化后的新亮度通道,cdf(V)表示原亮度通道的累积分布函数,定义域为[0,255],值域记作[cdf(V)min,cdf(V)max]。
Step 1.4:将H、S和Vhist重新转换为RGB三通道输出证件照。
所述高光修正具体内容为:基于双边滤波的高光抑制算法进行高光修正,建立双色反射模型得到镜面反射分量与最大漫反射色度之间的转换关系,设置阈值分离仅含漫反射分量的像素点与含有镜面反射分量的像素点,估算仅含漫反射分量的像素点与含有镜面反射分量的像素点的最大漫反射色度,以估算的最大漫反射色度的相似度作为双边滤波器的值域,同时以图像的最大色度图作为双边滤波的引导图保边去噪,去除镜面反射分量,从而进行高光修正。
所述步骤三的具体步骤包括:
Step 2.1:通过方向梯度直方图特征提取器和线性支持向量机识别图像中的人脸,输出人脸区域切片;
Step 2.2:通过方向梯度直方图特征提取器和线性支持向量机识别人脸区域切片中的五官,获取左右眼虹膜中心区域坐标;
Step 2.3:获取眼镜可能存在区域切片,旋转图片直至左右眼虹膜中心坐标的连线水平,通过缩放图像直至左右眼虹膜中心坐标的线段长度为d个像素;裁剪左眼虹膜中心坐标上d像素,左眼虹膜中心坐标下d像素,左眼虹膜中心坐标左侧
Figure BDA0003490468680000033
像素,左眼虹膜中心坐标右侧
Figure BDA0003490468680000034
像素,最终输出2d*2d像素的眼镜可能存在区域切片。
不断的切片一步步逼近眼镜的范围,一方面减少无关信息的干扰提高支持向量机的正确率,另一方面极大的程度的缩小数据量,避免数据冗余。
所述Step 2.1具体步骤包括:
Step 2.1.a:将证件照灰度化,降低图像在后续计算中所占用的计算资源,增强视觉上的对比,突出目标特征,具体计算公式为:
gray=0.299r+0.587g+0.114b
其中,gray表示证件照灰度值,r,g,b表示证件照RGB三通道的数值;
Step 2.1.b:计算每个像素的梯度值和梯度方向,具体计算公式为:
Figure BDA0003490468680000041
其中,g(x,y)表示坐标为(x,y)的像素的梯度值,gx表示水平方向梯度,gy表示垂直方向梯度;
Step 2.1.c:计算梯度方向,具体计算公式为:
Figure BDA0003490468680000042
其中,θ(x,y)表示坐标为(x,y)的像素的梯度方向;
Step 2.1.d:计算梯度直方图向量,具体的计算公式为:
HOG(i)=∑g(x,y),(i*20≤θ(x,y)<(i+1)*20)
其中i取值范围{0,1,2,3,4,5,6,7,8},将图片切分为8*8的单元,根据每个单元的角度分组计算方向梯度直方图特征向量;
Step 2.1.e:归一化方向梯度直方图,以2*2的单元为一个块,块的方向梯度直方图特征向量是4个单元的方向梯度直方图特征向量组成的36维向量,计算块的方向梯度直方图特征向量的归一值,具体计算公式为:
Figure BDA0003490468680000043
其中,k表示向量的维度,HOG′(k)表示块的方向梯度直方图特征向量;
Step 2.1.f:输入块的方向梯度直方图特征向量至人脸支持向量机中进行分类,输出人脸区域;
块的方向梯度直方图特征向量是一个36维向量,可以认为每一个块的方向梯度直方图特征向量是36维空间中的一个点,预先通过标注好的人脸区域获得人脸支持向量机,所述人脸支持向量机就是一组36维超平面可以框柱被认为是人脸的点,在二维空间中,人脸支持向量机通过一组直线框柱人脸所在区域,最终输出人脸切片。
所述步骤四对眼镜可能存在区域进行高斯平滑处理具体内容包括:
对于眼镜可能存在区域的每一个点(x,y),其他点(x±u,y±v)关于点(x,y)的权重具体计算公式为:
Figure BDA0003490468680000051
其中,u表示其他点(x±u,y±v)与点(x,y)沿着X轴的距离,v表示其他点(x±u,y±v)与点(x,y)沿着Y轴的距离,G(u,v)表示其他点(x±u,y±v)关于点(x,y)的权重;
将眼镜可能存在区域每一个点进行高斯平滑处理,具体计算公式为:
Figure BDA0003490468680000052
其中,pixel(x±u,y±v)表示其他点(x±u,y±v)的像素值,c表示眼镜可能存在区域的长,w表示眼镜可能存在区域的宽,pixel′(x,y)表示点(x,y)高斯平滑处理后的像素值。对眼镜可能存在区域进行高斯平滑处理过滤掉眼镜可能存在区域的细小噪声,以便进一步的获取边缘强度矩阵,防止噪声引起的错误检测。
通过梯度计算后的图像边缘是模糊的,通过非极大值抑制计算边缘强度矩阵,进一步的对于边缘进行强化,同时将局部最大值之外的所有梯度值抑制为0,进一步更新边缘强度矩阵,极大程度的强化边缘。
所述步骤五基于非极大值抑制输出边缘强度矩阵的具体内容包括:
Step 3.1:计算眼镜可能存在区域每一个沿着Y轴方向上的一阶导数矩阵gray’;
Step 3.2:输出通过非极大值抑制得到边缘强度矩阵g(x,y),具体计算公式为:
Figure BDA0003490468680000053
Step 3.3:判断g(x,y)每个像素邻接的8个像素中为0的元素的个数输出零度矩阵e(x,y),具体计算公式为:
Figure BDA0003490468680000061
Step 3.4:计算零度矩阵E进行步进为1的含上下阈值Q和H的最大池化更新边缘强度矩阵,具体计算公式为:
Figure BDA0003490468680000062
其中,g(x,y)′表示更新后的边缘强度矩阵。
所述步骤六重组眼镜可能区域的具体内容包括:
从边缘强度矩阵中裁剪鼻梁区域,眼睛下方区域,得到重组眼镜可能区域切片:基于边缘强度矩阵和上述步骤中对于证件照的切片,进一步的定位鼻梁和眼镜下面的镜框,强调鼻梁和眼镜下面的镜框特征。
鼻梁区域以点(x1,y1)和点(x2,y2)确定的矩形组成,具体计算公式为:
Figure BDA0003490468680000063
眼睛下方区域由以点(x11,y11)和点(x12,y12)确定的矩形及以点(x21,y21)和点(x22,y22)确定的矩形拼接而成,具体计算公式为:
Figure BDA0003490468680000064
所述步骤七判断是否具有眼镜框具体内容包括:将重组眼镜可能区域的矩阵提取方向梯度直方图特征,输入眼镜支持向量机进行检测,设置上限阈值B,当眼镜支持向量机的返回值大于阈值B,判断照片中人脸带了眼镜,当眼镜支持向量机的返回值小于阈值B,判断照片中人脸没有佩戴眼镜,根据判断结果输出最终结果。
所述步骤七判断是否具有眼镜框具体内容还包括:将重组眼镜可能区域的矩阵提取方向梯度直方图特征,输入眼镜支持向量机进行检测,设置上限阈值B和下限阈值S,当眼镜支持向量机的返回值大于阈值B,判断照片中人脸带了眼镜,当眼镜支持向量机的返回值小于阈值S,判断照片中人脸没有佩戴眼镜,基于玻璃检测网络GDNet建立玻璃检测模型,当眼镜支持向量机的返回值小于B大于S时,将证件照输入玻璃检测模型,如果检测到玻璃,判断照片中人脸带了眼镜,如果没有检测到玻璃,判断照片中人脸没有佩戴眼镜,根据判断结果输出最终结果。
与现有技术相比,本发明所达到的有益效果是:
1.本发明不依赖深度学习算法进行眼镜识别,通过图像处理不断强化证件照中可能存在的眼镜的特征,配合不断的切片一步步的定位镜框可能存在的位置,极大程度的提高了最终支持向量机识别眼镜的正确率;
2.本发明配合图像处理一步步的切片,强调可能存在的眼镜镜框的特征,本发明针对无框眼镜识别同样有很高的正确率;
3.本发明不仅快速,可以满足实时性,而且具有极高的正确率较低的召回率,极大程度的降低了对于计算资源的需求,同时可以满足内网安全的需求。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明一种基于图像处理的快速证件照眼镜检测方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明提供技术方案:
实施例一:一种基于图像处理的快速证件照眼镜检测方法,眼镜检测方法的具体步骤包括:
步骤一:获取证件照,通过相机或摄像头或数据采集系统获取证件照;
步骤二:图像处理,对证件照进行图像增强;
步骤三:不断对证件照进行切片,获得眼镜可能存在区域的切片;
步骤四:对眼镜可能存在区域进行高斯平滑处理;
步骤五:基于非极大值抑制输出边缘强度矩阵;
步骤六:基于更新后的边缘强度矩阵进一步切片重组眼镜可能区域;
步骤七:将重组眼镜可能区域输入眼镜支持向量机,输出最终结果。
本发明不依赖深度学习算法进行眼镜识别,通过图像处理不断强化证件照中可能存在的眼镜的特征,配合不断的切片一步步的定位镜框可能存在的位置,极大程度的提高了最终支持向量机识别眼镜的正确率,本发明不仅快速,可以满足实时性,而且具有极高的正确率较低的召回率,极大程度的降低了对于计算资源的需求,同时可以满足内网安全的需求。
步骤二中对于证件照进行图像增强包括直方图均衡化和高光修正;
增强证件照的对比度,抑制证件照在空间域中的噪声,突出镜框和脸部的分界线,降低光照对图像的影响,进行高光修正消除图像中的高亮度奇异区域;
直方图均衡化具体内容为:将证件照的RGB三通道转化为HSV通道,对于亮度V通道基于累积分布函数进行直方图均衡化,将直方图均衡化的HSV通道重新转化为RGB图像输出;
直接将证件照基于RGB三通道分别进行直方图均衡化会导致出现奇异点,证件照的RGB三通道转化为HSV通道,映射后灰度级为0~255,灰度级得到了扩展,基于累积分布函数将灰度值重新分配,再转化为RGB图像输出。
直方图均衡化具体步骤包括:
Step 1.1:计算RGB三通道像素的最大值和最小值的具体公式为:
A=max(r,g,b)
I=min(r,g,b)
其中,r,g,b表示证件照RGB三通道的数值,A表示r,g,b中最大值,I表示r,g,b中最小值;
Step 1.2:将证件照RGB三通道转化为HSV通道具体计算公式为:
Figure BDA0003490468680000091
Figure BDA0003490468680000092
V=A
其中,H表示HSV通道中的色调,S表示HSV通道中的饱和度,V表示HSV通道中的亮度;
Step 1.3:直方图均衡化亮度通道具体公式为:
Figure BDA0003490468680000093
其中,Vhist表示直方图均衡化后的新亮度通道,cdf(V)表示原亮度通道的累积分布函数,定义域为[0,255],值域记作[cdf(V)min,cdf(V)max]。
Step 1.4:将H、S和Vhist重新转换为RGB三通道输出证件照。
高光修正具体内容为:基于双边滤波的高光抑制算法进行高光修正,建立双色反射模型得到镜面反射分量与最大漫反射色度之间的转换关系,设置阈值分离仅含漫反射分量的像素点与含有镜面反射分量的像素点,估算仅含漫反射分量的像素点与含有镜面反射分量的像素点的最大漫反射色度,以估算的最大漫反射色度的相似度作为双边滤波器的值域,同时以图像的最大色度图作为双边滤波的引导图保边去噪,去除镜面反射分量,从而进行高光修正。
步骤三的具体步骤包括:
Step 2.1:通过方向梯度直方图特征提取器和线性支持向量机识别图像中的人脸,输出人脸区域切片;
Step 2.2:通过方向梯度直方图特征提取器和线性支持向量机识别人脸区域切片中的五官,获取左右眼虹膜中心区域坐标;
Step 2.3:获取眼镜可能存在区域切片,旋转图片直至左右眼虹膜中心坐标的连线水平,通过缩放图像直至左右眼虹膜中心坐标的线段长度为128个像素;裁剪左眼虹膜中心坐标上128像素,左眼虹膜中心坐标下128像素,左眼虹膜中心坐标左侧64像素,左眼虹膜中心坐标右侧192像素,最终输出256*256像素的眼镜可能存在区域切片。
不断的切片一步步逼近眼镜的范围,一方面减少无关信息的干扰提高支持向量机的正确率,另一方面极大的程度的缩小数据量,避免数据冗余。
Step 2.1具体步骤包括:
Step 2.1.a:将证件照灰度化,降低图像在后续计算中所占用的计算资源,增强视觉上的对比,突出目标特征,具体计算公式为:
gray=0.299r+0.587g+0.114b
其中,gray表示证件照灰度值,r,g,b表示证件照RGB三通道的数值;
Step 2.1.b:计算每个像素的梯度值和梯度方向,具体计算公式为:
Figure BDA0003490468680000101
其中,g(x,y)表示坐标为(x,y)的像素的梯度值,gx表示水平方向梯度,gy表示垂直方向梯度;
Step 2.1.c:计算梯度方向,具体计算公式为:
Figure BDA0003490468680000102
其中,θ(x,y)表示坐标为(x,y)的像素的梯度方向;
Step 2.1.d:计算梯度直方图向量,具体的计算公式为:
HOG(i)=∑g(x,y),(i*20≤θ(x,y)<(i+1)*20)
其中i取值范围{0,1,2,3,4,5,6,7,8},将图片切分为8*8的单元,根据每个单元的角度分组计算方向梯度直方图特征向量;
Step 2.1.e:归一化方向梯度直方图,以2*2的单元为一个块,块的方向梯度直方图特征向量是4个单元的方向梯度直方图特征向量组成的36维向量,计算块的方向梯度直方图特征向量的归一值,具体计算公式为:
Figure BDA0003490468680000111
其中,k表示向量的维度,HOG′(k)表示块的方向梯度直方图特征向量;
Step 2.1.f:输入块的方向梯度直方图特征向量至人脸支持向量机中进行分类,输出人脸区域;
块的方向梯度直方图特征向量是一个36维向量,可以认为每一个块的方向梯度直方图特征向量是36维空间中的一个点,预先通过标注好的人脸区域获得人脸支持向量机,人脸支持向量机就是一组36维超平面可以框柱被认为是人脸的点,在二维空间中,人脸支持向量机通过一组直线框柱人脸所在区域,最终输出人脸切片。
步骤四对眼镜可能存在区域进行高斯平滑处理具体内容包括:
对于眼镜可能存在区域的每一个点(x,y),其他点(x±u,y±v)关于点(x,y)的权重具体计算公式为:
Figure BDA0003490468680000112
其中,u表示其他点(x±u,y±v)与点(x,y)沿着X轴的距离,v表示其他点(x±u,y±v)与点(x,y)沿着Y轴的距离,G(u,v)表示其他点(x±u,y±v)关于点(x,y)的权重;
将眼镜可能存在区域每一个点进行高斯平滑处理,具体计算公式为:
Figure BDA0003490468680000113
其中,pixel(x±u,y±v)表示其他点(x±u,y±v)的像素值,c表示眼镜可能存在区域的长,w表示眼镜可能存在区域的宽,pixel′(x,y)表示点(x,y)高斯平滑处理后的像素值。对眼镜可能存在区域进行高斯平滑处理过滤掉眼镜可能存在区域的细小噪声,以便进一步的获取边缘强度矩阵,防止噪声引起的错误检测。
通过梯度计算后的图像边缘是模糊的,通过非极大值抑制计算边缘强度矩阵,进一步的对于边缘进行强化,同时将局部最大值之外的所有梯度值抑制为0,进一步更新边缘强度矩阵,极大程度的强化边缘。
步骤五基于非极大值抑制输出边缘强度矩阵的具体内容包括:
Step 3.1:计算眼镜可能存在区域每一个沿着Y轴方向上的一阶导数矩阵gray’;
Step 3.2:输出通过非极大值抑制得到边缘强度矩阵g(x,y),具体计算公式为:
Figure BDA0003490468680000121
Step 3.3:判断g(x,y)每个像素邻接的8个像素中为0的元素的个数输出零度矩阵e(x,y),具体计算公式为:
Figure BDA0003490468680000122
Step 3.4:计算零度矩阵E进行步进为1的含上下阈值L和H的最大池化更新边缘强度矩阵,具体计算公式为:
Figure BDA0003490468680000123
其中,g(x,y)′表示更新后的边缘强度矩阵。
步骤六重组眼镜可能区域的具体内容包括:
从边缘强度矩阵中裁剪鼻梁区域,眼睛下方区域,得到重组眼镜可能区域切片:基于边缘强度矩阵和上述步骤中对于证件照的切片,进一步的定位鼻梁和眼镜下面的镜框,强调鼻梁和眼镜下面的镜框特征。
鼻梁区域以点(x1,y1)和点(x2,y2)确定的矩形组成,具体计算公式为:
Figure BDA0003490468680000124
眼睛下方区域由以点(x11,y11)和点(x12,y12)确定的矩形及以点(x21,y21)和点(x22,y22)确定的矩形拼接而成,具体计算公式为:
Figure BDA0003490468680000131
步骤七判断是否具有眼镜框具体内容包括:将重组眼镜可能区域的矩阵提取方向梯度直方图特征,输入眼镜支持向量机进行检测,设置上限阈值B,当眼镜支持向量机的返回值大于阈值B,判断照片中人脸带了眼镜,当眼镜支持向量机的返回值小于阈值B,判断照片中人脸没有佩戴眼镜,根据判断结果输出最终结果。
步骤七判断是否具有眼镜框具体内容还包括:将重组眼镜可能区域的矩阵提取方向梯度直方图特征,输入眼镜支持向量机进行检测,设置上限阈值B和下限阈值S,当眼镜支持向量机的返回值大于阈值B,判断照片中人脸带了眼镜,当眼镜支持向量机的返回值小于阈值S,判断照片中人脸没有佩戴眼镜,基于玻璃检测网络GDNet建立玻璃检测模型,当眼镜支持向量机的返回值小于B大于S时,将证件照输入玻璃检测模型,如果检测到玻璃,判断照片中人脸带了眼镜,如果没有检测到玻璃,判断照片中人脸没有佩戴眼镜,根据判断结果输出最终结果。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于图像处理的快速证件照眼镜检测方法,其特征在于:眼镜检测的具体步骤包括:
步骤一:获取证件照;
步骤二:图像处理,对证件照进行图像增强;
步骤三:不断对证件照进行切片,获得眼镜可能存在区域的切片;
步骤四:对眼镜可能存在区域进行高斯平滑处理;
步骤五:基于非极大值抑制输出边缘强度矩阵;
步骤六:基于更新后的边缘强度矩阵进一步切片重组眼镜可能区域;
步骤七:将重组眼镜可能区域输入眼镜支持向量机,输出最终结果。
2.根据权利要求1所述的一种基于图像处理的快速证件照眼镜检测方法,其特征在于:所述步骤二中对于证件照进行图像增强包括直方图均衡化和高光修正;
所述直方图均衡化具体内容为:将证件照的RGB三通道转化为HSV通道,对于亮度V通道基于累积分布函数进行直方图均衡化,将直方图均衡化的HSV通道重新转化为RGB图像输出;
所述直方图均衡化具体步骤包括:
Step 1.1:计算RGB三通道像素的最大值和最小值的具体公式为:
A=max(r,g,b)
I=min(r,g,b)
其中,r,g,b表示证件照RGB三通道的数值,A表示r,g,b中最大值,I表示r,g,b中最小值;
Step 1.2:将证件照RGB三通道转化为HSV通道具体计算公式为:
Figure FDA0003490468670000021
Figure FDA0003490468670000022
V=A
其中,H表示HSV通道中的色调,S表示HSV通道中的饱和度,V表示HSV通道中的亮度;
Step 1.3:直方图均衡化亮度通道具体公式为:
Figure FDA0003490468670000023
其中,Vhist表示直方图均衡化后的新亮度通道,cdf(V)表示原亮度通道的累积分布函数,定义域为[0,255],值域为[cdf(V)min,cdf(V)max];
Step 1.4:将H、S和Vhist重新转换为RGB三通道输出证件照。
3.根据权利要求1所述的一种基于图像处理的快速证件照眼镜检测方法,其特征在于:所述步骤三的具体步骤包括:
Step 2.1:通过方向梯度直方图特征提取器和线性支持向量机识别图像中的人脸,输出人脸区域切片;
Step 2.2:通过方向梯度直方图特征提取器和线性支持向量机识别人脸区域切片中的五官,获取左右眼虹膜中心区域坐标;
Step 2.3:获取眼镜可能存在区域切片,旋转图片直至左右眼虹膜中心坐标的连线水平,通过缩放图像直至左右眼虹膜中心坐标的线段长度为d个像素;裁剪左眼虹膜中心坐标上d像素,左眼虹膜中心坐标下d像素,左眼虹膜中心坐标左侧
Figure FDA0003490468670000024
像素,左眼虹膜中心坐标右侧
Figure FDA0003490468670000025
像素,最终输出2d*2d像素的眼镜可能存在区域切片。
4.根据权利要求3所述的一种基于图像处理的快速证件照眼镜检测方法,其特征在于:所述Step 2.1具体步骤包括:
Step 2.1.a:将证件照灰度化,具体计算公式为:
gray=0.299r+0.587g+0.114b
其中,gray表示证件照灰度值,r,g,b表示证件照RGB三通道的数值;
Step 2.1.b:计算每个像素的梯度值和梯度方向,具体计算公式为:
Figure FDA0003490468670000031
其中,g(x,y)表示坐标为(x,y)的像素的梯度值,gx表示水平方向梯度,gy表示垂直方向梯度;
Step 2.1.c:计算梯度方向,具体计算公式为:
Figure FDA0003490468670000032
其中,θ(x,y)表示坐标为(x,y)的像素的梯度方向;
Step 2.1.d:计算梯度直方图向量,具体的计算公式为:
HOG(i)=∑g(x,y),(i*20≤θ(x,y)<(i+1)*20)
其中i取值范围{0,1,2,3,4,5,6,7,8},将图片切分为8*8的单元,根据每个单元的角度分组计算方向梯度直方图特征向量;
Step 2.1.e:归一化方向梯度直方图,以2*2的单元为一个块,块的方向梯度直方图特征向量是4个单元的方向梯度直方图特征向量组成的36维向量,计算块的方向梯度直方图特征向量的归一值,具体计算公式为:
Figure FDA0003490468670000033
其中,k表示向量的维度,HOG'(k)表示块的方向梯度直方图特征向量;
Step 2.1.f:输入块的方向梯度直方图特征向量至人脸支持向量机中进行分类,输出人脸区域。
5.根据权利要求1所述的一种基于图像处理的快速证件照眼镜检测方法,其特征在于:所述步骤四对眼镜可能存在区域进行高斯平滑处理具体内容包括:
对于眼镜可能存在区域的每一个点(x,y),其他点(x±u,y±v)关于点(x,y)的权重具体计算公式为:
Figure FDA0003490468670000041
其中,u表示其他点(x±u,y±v)与点(x,y)沿着X轴的距离,v表示其他点(x±u,y±v)与点(x,y)沿着Y轴的距离,G(u,v)表示其他点(x±u,y±v)关于点(x,y)的权重;
将眼镜可能存在区域每一个点进行高斯平滑处理,具体计算公式为:
Figure FDA0003490468670000042
其中,pixel(x±u,y±v)表示其他点(x±u,y±v)的像素值,c表示眼镜可能存在区域的长,w表示眼镜可能存在区域的宽,pixel'(x,y)表示点(x,y)高斯平滑处理后的像素值。
6.根据权利要求1所述的一种基于图像处理的快速证件照眼镜检测方法,其特征在于:所述步骤五基于非极大值抑制输出边缘强度矩阵的具体内容包括:
Step 3.1:计算眼镜可能存在区域每一个沿着Y轴方向上的一阶导数矩阵gray';
Step 3.2:输出通过非极大值抑制得到边缘强度矩阵g(x,y),具体计算公式为:
Figure FDA0003490468670000043
Step 3.3:判断g(x,y)每个像素邻接的8个像素中为0的元素的个数输出零度矩阵e(x,y),具体计算公式为:
Figure FDA0003490468670000044
Step 3.4:计算零度矩阵E进行步进为1的含上下阈值L和H的最大池化更新边缘强度矩阵,具体计算公式为:
Figure FDA0003490468670000045
其中,g(x,y)'表示更新后的边缘强度矩阵。
7.根据权利要求1所述的一种基于图像处理的快速证件照眼镜检测方法,其特征在于:所述步骤六重组眼镜可能区域的具体内容包括:从边缘强度矩阵中裁剪鼻梁区域,眼睛下方区域,得到重组眼镜可能区域切片;
鼻梁区域以点(x1,y1)和点(x2,y2)确定的矩形组成,具体计算公式为:
Figure FDA0003490468670000051
眼睛下方区域由以点(x11,y11)和点(x12,y12)确定的矩形及以点(x21,y21)和点(x22,y22)确定的矩形拼接而成,具体计算公式为:
Figure FDA0003490468670000052
8.根据权利要求1所述的一种基于图像处理的快速证件照眼镜检测方法,其特征在于:所述步骤七判断是否具有眼镜框具体内容包括:将重组眼镜可能区域的矩阵提取方向梯度直方图特征,输入眼镜支持向量机进行检测,设置上限阈值B,当眼镜支持向量机的返回值大于阈值B,判断照片中人脸带了眼镜,当眼镜支持向量机的返回值小于阈值B,判断照片中人脸没有佩戴眼镜,根据判断结果输出最终结果。
9.根据权利要求1所述的一种基于图像处理的快速证件照眼镜检测方法,其特征在于:所述步骤七判断是否具有眼镜框具体内容还包括:将重组眼镜可能区域的矩阵提取方向梯度直方图特征,输入眼镜支持向量机进行检测,设置上限阈值B和下限阈值S,当眼镜支持向量机的返回值大于阈值B,判断照片中人脸带了眼镜,当眼镜支持向量机的返回值小于阈值S,判断照片中人脸没有佩戴眼镜,基于玻璃检测网络GDNet建立玻璃检测模型,当眼镜支持向量机的返回值小于B大于S时,将证件照输入玻璃检测模型,如果检测到玻璃,判断照片中人脸带了眼镜,如果没有检测到玻璃,判断照片中人脸没有佩戴眼镜,根据判断结果输出最终结果。
CN202210094313.2A 2022-01-26 2022-01-26 一种基于图像处理的快速证件照眼镜检测方法 Active CN114463814B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210094313.2A CN114463814B (zh) 2022-01-26 2022-01-26 一种基于图像处理的快速证件照眼镜检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210094313.2A CN114463814B (zh) 2022-01-26 2022-01-26 一种基于图像处理的快速证件照眼镜检测方法

Publications (2)

Publication Number Publication Date
CN114463814A true CN114463814A (zh) 2022-05-10
CN114463814B CN114463814B (zh) 2024-08-23

Family

ID=81410749

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210094313.2A Active CN114463814B (zh) 2022-01-26 2022-01-26 一种基于图像处理的快速证件照眼镜检测方法

Country Status (1)

Country Link
CN (1) CN114463814B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117095444A (zh) * 2023-08-29 2023-11-21 广州市星飞达电子科技有限公司 一种基于人工智能的图像识别方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018041237A1 (zh) * 2016-08-31 2018-03-08 腾讯科技(深圳)有限公司 人脸验证的方法、装置以及存储介质
CN111429409A (zh) * 2020-03-13 2020-07-17 深圳市雄帝科技股份有限公司 对图像中人物佩戴眼镜的识别方法、系统及其存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018041237A1 (zh) * 2016-08-31 2018-03-08 腾讯科技(深圳)有限公司 人脸验证的方法、装置以及存储介质
CN111429409A (zh) * 2020-03-13 2020-07-17 深圳市雄帝科技股份有限公司 对图像中人物佩戴眼镜的识别方法、系统及其存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
易丛琴;梁静;: "基于灰度特征和模板匹配的人眼定位", 计算机与信息技术, no. 07, 20 July 2008 (2008-07-20) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117095444A (zh) * 2023-08-29 2023-11-21 广州市星飞达电子科技有限公司 一种基于人工智能的图像识别方法
CN117095444B (zh) * 2023-08-29 2024-02-13 广州市星飞达电子科技有限公司 一种基于人工智能的图像识别方法

Also Published As

Publication number Publication date
CN114463814B (zh) 2024-08-23

Similar Documents

Publication Publication Date Title
CN106548463B (zh) 基于暗通道与Retinex的海雾图像自动去雾方法及系统
CN109344724B (zh) 一种证件照自动背景替换方法、系统及服务器
CN104036278B (zh) 人脸算法标准脸部图像的提取方法
CN103679173B (zh) 图像显著区域检测方法
EP1394723A2 (en) Method for detecting red-eye effect in digital images
CN106570447B (zh) 基于灰度直方图匹配的人脸照片太阳镜自动去除方法
CN109377450B (zh) 一种边缘保护的去噪方法
CN109711268B (zh) 一种人脸图像筛选方法及设备
CN106503644B (zh) 基于边缘投影及颜色特征的眼镜属性检测方法
KR20110014067A (ko) 스테레오 컨텐트의 변환 방법 및 시스템
CN108805826B (zh) 改善去雾效果的方法
WO2019014814A1 (zh) 一种定量检测人脸抬头纹的方法和智能终端
CN103218615B (zh) 人脸判定方法
CN108446642A (zh) 一种快速人脸识别系统
CN114463814B (zh) 一种基于图像处理的快速证件照眼镜检测方法
CN108765316B (zh) 雾气浓度自适应判断方法
CN111274851A (zh) 一种活体检测方法及装置
Wang et al. Lane detection algorithm based on density clustering and RANSAC
CN106778631B (zh) 一种虹膜识别预处理过程中快速滤除伪造虹膜的异质虹膜分类器设计方法
CN105913391A (zh) 一种基于形状可变形态学重构的去雾方法
CN109145875B (zh) 一种人脸图像中的黑框眼镜去除方法及装置
KR100703528B1 (ko) 영상 인식 장치 및 방법
CN105405109A (zh) 一种基于带状背景建模的脏点检测方法
CN112085683A (zh) 一种显著性检测中的深度图可信度检测方法
CN113554695A (zh) 零件孔位智能识别定位方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant