身份证真伪识别方法、装置、设备及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种身份证真伪识别方法、装置、设备及存储介质。
背景技术
随着互联网普及以及技术的发展,证券、银行、保险等行业中的很多业务的办理也逐渐可以在终端设备(如VTM,手机等)上实现,目前最普遍的是网上银行、手机银行等。这些业务按照规定都是需要“客户本人持本人有效证件”进行办理。
如果按传统方式在营业网点的柜面办理,需要客户本人持本人有效证件到柜面进行办理,由柜面工作人员现场验证客户身份。如果将这些业务搬到终端设备上,则面临的主要问题是对客户身份的验证,即如何确定是“客户本人持本人有效证件”在办理。上述过程需要进行两个阶段的验证:身份证信息验证,以及是否本人的验证。对于身份证信息验证,目前比较常用的做法是让客户分别拍身份证正反面的图像和人脸图像,然后传到后台审核人员进行人工审核(针对所有身份证)。
其中,在采集到身份证图像后,需要对身份证的真伪进行识别。身份证图像采集过程中环境的光线明暗,对识别的准确度造成很大的影响。例如,采用用户在较暗的光线下拍摄的身份证图像,很多情况下无法准确识别是否为真身份证。
发明内容
本申请提供了一种身份证真伪识别方法、装置、设备及存储介质,用以解决采集身份证的过程中环境光线明暗,对识别的准确度造成很大的影响,导致身份证的真伪识别准确度低,经常出现识别错误的问题。
第一方面,本申请实施例提供了一种份证真伪识别方法,包括:采集获得身份证的图像;获得所述图像的第一颜色空间的参数,其中,所述第一颜色空间的参数中至少包括亮度分量、第一色彩a分量和第二色彩b分量;将所述图像的第一颜色空间的参数输入第一分类模型,得到所述第一分类模型输出的所述身份证的真伪识别结果;其中,所述第一分类模型为采用第一样本图像集合进行分类学习得到,所述第一样本图像集合中包括样本图像中每个像素的亮度分量、第一色彩a分量和第二色彩b分量,与样本图像中身份证的真伪信息之间的对应关系。
可选地,将所述图像的第一颜色空间的参数输入第一分类模型,得到所述第一分类模型输出的所述身份证的真伪识别结果之前,所述方法还包括:获得采集到的所述图像的整体亮度值,判断所述图像的整体亮度值是否低于临界值,并确定判断结果为是。
可选地,判断所述图像的整体亮度值是否低于临界值之后,所述方法还包括:若确定判断结果为否,则将所述图像的第二颜色空间的参数输入第二分类模型,得到所述第二分类模型输出的所述身份证的真伪识别结果;其中,所述第二颜色空间包括红色R分量、绿色G分量和蓝色B分量,所述第二分类模型为采用第二样本图像集合进行分类学习得到,所述第二样本图像集合中包括样本图像中每个像素的红色R分量、绿色G分量和蓝色B分量,与样本图像中身份证的真伪信息之间的对应关系。
可选地,获得采集到的所述图像的整体亮度值,包括:计算所述图像中所有像素的亮度分量的平均值;将得到的所述平均值,作为采集到的所述图像的整体亮度值。
可选地,确定所述图像的整体亮度值低于临界值之前,所述方法还包括:按照第三样本图像集合中样本图像的整体亮度值,将所述第二样本图像集合中样本图像聚类为两类图像,将所述两类图像的分界值作为所述临界值。
可选地,所述第一颜色空间还包括红色R分量、绿色G分量和蓝色B分量;将所述图像的第一颜色空间的参数输入第一分类模型,包括:将所述图像的亮度分量、第一色彩a分量、第二色彩b分量、红色R分量、绿色G分量和蓝色B分量分别输入所述第一分类模型。
第二方面,本申请实施例提供了一种身份证真伪识别装置,包括:采集模块,用于采集获得身份证的图像;获取模块,用于获得所述图像的第一颜色空间的参数,其中,所述第一颜色空间的参数中至少包括亮度分量、第一色彩a分量和第二色彩b分量;识别模块,用于将所述图像的第一颜色空间的参数输入第一分类模型,得到所述第一分类模型输出的所述身份证的真伪识别结果;其中,所述第一分类模型为采用第一样本图像集合进行分类学习得到,所述第一样本图像集合中包括样本图像中每个像素的亮度分量、第一色彩a分量和第二色彩b分量,与样本图像中身份证的真伪信息之间的对应关系。
可选地,所述识别模块还用于:将所述图像的第一颜色空间的参数输入第一分类模型,得到所述第一分类模型输出的所述身份证的真伪识别结果之前,获得采集到的所述图像的整体亮度值,判断所述图像的整体亮度值是否低于临界值,并确定判断结果为是。
第三方面,本申请实施例提供了一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;所述存储器,用于存储计算机程序;所述处理器,用于执行所述存储器中所存储的程序,实现所述的身份证真伪识别方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现所述的身份证真伪识别方法。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请实施例提供的该方法,在构建第一分类模型时考虑了采集到的图像的亮度分量,将采集的身份证的图像的包含亮度分量的第一颜色空间的参数作为第一分类模型的输入参数,使得第一分类模型输出的身份证的真伪识别结果,是考虑了环境光线明暗后所得到的结果,从而避免了现有的身份证真伪识别过程中未考虑环境光线明暗,导致身份证真伪识别准确度低,经常出现识别错误的问题,提高了身份证真伪识别的准确度。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例中识别身份证真伪的方法流程示意图;
图2为本申请实施例中识别身份证真伪的装置结构示意图;
图3为本申请实施例中电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例中,定义第一分类模型和第二分类模型。
其中,定义第一分类模型为采用第一样本图像集合进行分类学习得到,该第一样本图像集合中包括样本图像中每个像素的亮度分量与样本图像中身份证的真伪信息之间的对应关系。
定义第二分类模型为采用第二样本图像集合进行分类学习得到,该第二样本图像集合中包括样本图像中每个像素的红色(R)分量、绿色(G)分量和蓝色(B)分量,与样本图像中身份证的真伪信息之间的对应关系。
分析认为,采用第二分类模型进行真伪识别时,未考虑环境光线明暗对采集图像的影响,训练时采用的训练样本均是在光线亮度较好的情况下采集的,并未考虑环境光线亮度对身份证真伪识别所采用的模型的影响。因此,在光线比较暗的情况下采集的身份证图像,如果采用第二分类模型,经常会出现难以识别身份证文字,无法分辨身份证真伪的情况,降低了识别的准确度。
鉴于此,本申请实施例中提出了第一分类模型,该第一分类模型中加入了能够体现环境光线亮度的参数,采用该第一分类模型对身份证真伪进行识别。
其中,第一分类模型可以是由服务器进行训练得到,具体地:服务器基于第一样本图像集合中的样本图像进行模型训练,在模型训练之前,分别计算第一样本图像集合中每个样本图像的亮度(L)值,第一样本图像集合中包括样本图像的亮度值与该样本图像中的身份证真伪指示信息之间的对应关系。服务器将训练得到的第一分类模型下发给用于进行身份证真伪识别的终端。
其中,第一分类模型的输入参数中至少包括图像的亮度(L)分量的取值。假设定义第一颜色空间至少包括亮度(L)分量、第一色彩(a)分量和第二色彩(b)分量,即在采用第一分类模型时图像采用第一颜色空间进行表示。在第一颜色空间采用Lab模型表示时,该第一颜色空间包括亮度(L)分量、第一色彩(a)分量和第二色彩(b)分量。则,第一样本图像集合中除了包括样本图像中每个像素的亮度分量与样本图像中身份证的真伪信息之间的对应关系外,还包括样本图像中每个像素的第一色彩(a)分量和第二色彩(b)分量,与样本图像中身份证的真伪信息之间的对应关系。
第一色彩(a)分量表示从洋红色到绿色的范围,第二色彩(b)分量表示从黄色到蓝色的范围。亮度分量表示明度(Luminosity)。亮度分量的取值范围为0到100,取值为0时对应黑色,取值为100时对应白色。第一色彩(a)分量的取值为负值时对应绿色,为正值时对应洋红色。第二色彩(b)分量取值为负值时对应蓝色,取值为正值时对应黄色。
根据需要第一分类模型中还包括:红色(R)分量、绿色(G)分量和蓝色(B)分量。第一分类模型的输入参数中还可以包括红色(R)分量、绿色(G)分量和蓝色(B)分量,即第一分类模型的输入参数可以同时包括亮度(L)分量、第一色彩(a)分量、第二色彩(b)分量、红色(R)分量、绿色(G)分量和蓝色(B)分量。则,第一样本图像集合中除了包括样本图像中每个像素的亮度分量、第一色彩(a)分量和第二色彩(b)分量,与样本图像中身份证的真伪信息之间的对应关系之外,还包括样本图像中每个像素的红色(R)分量、绿色(G)分量和蓝色(B)分量,与样本图像中身份证的真伪信息之间的对应关系。
其中,定义第二颜色空间包括红色(R)分量、绿色(G)分量和蓝色(B)分量。第二分类模型也可以是由服务器进行训练得到,具体地:服务器基于第二样本图像集合中的样本图像对分类器进行训练得到第二分类模型,其中,第二样本图像集合中包括样本图像中每个像素的红色(R)分量、绿色(G)分量和蓝色(B)分量,与样本图像中身份证的真伪信息之间的对应关系。服务器将训练得到的第二分类模型下发给用于进行身份证真伪识别的终端。
需要说明的是,本申请实施例中,对于第一分类模型和第二分类模型在训练时所采用的分类器,不作限制,可以使用已有的任意一种类型的分类器。
基于以上定义,本申请实施例中,如图1所示,终端进行身份证真伪识别的具体过程如下:
步骤101,采集获得身份证的图像。
一个具体实施例中,终端上所安装的客户端程序在屏幕上显示用于采集用户身份证图像的引导框;该客户端程序通过语音或者显示文字等方式提示用户将自己的身份证置于引导框内;该客户端程序在检测到引导框内存在身份证后,采集该身份证的图像。
其中,采集的身份证的图像可以是该身份证的正面图像,也可以是该身份证的反面图像。本申请实施例所提供的身份证真伪识别过程可以用于对身份证的正面图像的真伪进行识别,也可以用于对身份证的反面图像的真伪进行识别。
步骤102,获得该身份证的图像的第一颜色空间的参数,其中,第一颜色空间的参数中至少包括亮度分量、第一色彩(a)分量和第二色彩(b)分量。
一个具体实施例中,采集到的身份证的图像默认采用RGB模型表示,这就需要将采集到的身份证的图像的表示形式从采用RGB模型表示转换为采用Lab模型表示。
其中,将图像从采用RGB模型表示,转换为采用Lab模型表示的具体过程如下:像素的RGB无法直接转换为Lab,这就需要向将RGB转换为XYZ坐标表示后再转换为Lab。假设r、g、b为像素的三个通道,取值范围均为[0,255],则RGB转XYZ具体为:
则可得到:
X=R*0.4124+G*0.3576+B*0.1805
Y=R*0.2126+G*0.7152+B*0.0722
Z=R*0.0193+G*0.1192+B*0.9505
其中,gamma函数用于对图像进行非线性色调编辑,以提高图像对比度。
将XYZ转换为Lab,具体为:
L=116f(Y/Yn)-16
a=500[f(X/Xn)-f(Y/Yn)]
b=200[f(Y/Yn)-f(Z/Zn)]
其中,L表示Lab模型中的亮度L分量的值,a表示Lab模型中的第一色彩a分量的值,b表示Lab模型中第二色彩b分量的值,Xn的取值为95.047,Yn的取值为100.0,Zn的取值为108.883。
步骤103,将该身份证的图像的第一颜色空间的参数输入第一分类模型,得到该第一分类模型输出的身份证的真伪识别结果。
一个具体实施例中,获得采集到的图像的整体亮度值,判断图像的整体亮度值是否低于临界值,并确定判断结果为是,则将该身份证的图像的第一颜色空间的参数输入第一分类模型,得到该第一分类模型输出的身份证的真伪识别结果;若确定判断结果为否,则将该身份证的图像的第二颜色空间的参数输入第二分类模型,得到该第二分类模型输出的身份证的真伪识别结果。
一个具体实施例中,采集到的图像的整体亮度值的获得过程如下:计算采集到的图像中所有像素的亮度(L)分量的平均值;将得到的该平均值,作为采集到的图像的整体亮度(L)值。
其中,临界值的获得方式有很多种,例如,根据技术人员的经验得到,或者通过多次实验统计得到。一个具体实施例中,临界值的获得过程如下:按照第三样本图像集合中样本图像的整体亮度值,将第三样本图像集合中样本图像聚类为明、暗两类图像,将该两类图像的分界值作为临界值。具体地,可以是服务器执行该聚类过程后得到该临界值,并将该临界值下发给各用于识别身份证真伪的终端。
一个具体实施例中,在第一颜色空间还包括红色(R)分量、绿色(G)分量和蓝色(B)分量的情况下,将采集到的身份证的图像的亮度(L)分量、第一色彩(a)分量和第二色彩(b)分量,以及该身份证图像的红色(R)分量、绿色(G)分量和蓝色(B)分量,分别输入到第一分类模型,得到该第一分类模型输出的身份证的真伪识别结果。
本申请实施例中,在构建第一分类模型时考虑了采集到的图像的亮度分量,将采集的身份证的图像的包含亮度分量的第一颜色空间的参数作为第一分类模型的输入参数,使得第一分类模型输出的身份证的真伪识别结果,是考虑了环境光线明暗后所得到的结果,从而避免了现有的身份证真伪识别过程中未考虑环境光线明暗,导致身份证真伪识别准确度低,经常出现识别错误的问题,提高了身份证真伪识别的准确度。
基于同一构思,本申请实施例中提供了一种身份证真伪识别装置,该装置的具体实施可参见方法实施例部分的描述,重复之处不再赘述,如图2所示,该装置主要包括:
采集模块201,用于采集获得身份证的图像;
获取模块202,用于获得所述图像的第一颜色空间的参数,其中,所述第一颜色空间的参数中至少包括亮度分量分量、第一色彩(a)分量和第二色彩(b)分量;
识别模块203,用于将所述图像的第一颜色空间的参数输入第一分类模型,得到所述第一分类模型输出的所述身份证的真伪识别结果;
其中,所述第一分类模型为采用第一样本图像集合进行分类学习得到,所述第一样本图像集合中包括样本图像中每个像素的亮度分量、第一色彩(a)分量和第二色彩(b)分量,与样本图像中身份证的真伪信息之间的对应关系。
具体地,识别模块203还用于:在将所述图像的第一颜色空间的参数输入第一分类模型,得到所述第一分类模型输出的所述身份证的真伪识别结果之前,获得采集到的所述图像的整体亮度值,判断所述图像的整体亮度值是否低于临界值,并确定判断结果为是。
具体地,识别模块203还用于:判断所述图像的整体亮度值是否低于临界值之后,若确定判断结果为否,则将所述图像的第二颜色空间的参数输入第二分类模型,得到所述第二分类模型输出的所述身份证的真伪识别结果;其中,所述第二颜色空间包括红色(R)分量、绿色(G)分量和蓝色(B)分量,所述第二分类模型为采用第二样本图像集合进行分类学习得到,所述第二样本图像集合中包括样本图像中每个像素的红色(R)分量、绿色(G)分量和蓝色(B)分量,与样本图像中身份证的真伪信息之间的对应关系。
具体地,采集模块201具体用于:计算所述图像中所有像素的亮度分量的平均值;将得到的所述平均值,作为采集到的所述图像的整体亮度值。
具体地,识别模块203具体用于:确定所述图像的整体亮度值低于临界值之前,按照第三样本图像集合中样本图像的整体亮度值,将所述第三样本图像集合中样本图像聚类为两类图像,将所述两类图像的分界值作为所述临界值。
具体地,所述第一颜色空间还包括红色(R)分量、绿色(G)分量和蓝色(B)分量;识别模块203具体用于:将所述图像的亮度分量、第一色彩(a)分量、第二色彩(b)分量、红色(R)分量、绿色(G)分量和蓝色(B)分量分别输入所述第一分类模型。
基于同一构思,本申请实施例中还提供了一种电子设备,如图3所示,该电子设备主要包括:处理器301、通信接口302、存储器303和通信总线304,其中,处理器301、通信接口302和存储器303通过通信总线304完成相互间的通信。其中,存储器303中存储有可被至处理器301执行的程序,处理器301执行存储器303中存储的程序,实现如下步骤:采集获得身份证的图像;获得所述图像的第一颜色空间的参数,其中,所述第一颜色空间的参数中至少包括亮度分量、第一色彩(a)分量和第二色彩(b)分量;将所述图像的第一颜色空间的参数输入第一分类模型,得到所述第一分类模型输出的所述身份证的真伪识别结果;其中,所述第一分类模型为采用第一样本图像集合进行分类学习得到,所述第一样本图像集合中包括样本图像中每个像素的亮度分量、第一色彩(a)分量和第二色彩(b)分量,与样本图像中身份证的真伪信息之间的对应关系。
上述电子设备中提到的通信总线304可以是外设部件互连标准(PeripheralComponent Interconnect,简称PCI)总线或扩展工业标准结构(Extended IndustryStandard Architecture,简称EISA)总线等。该通信总线304可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口302用于上述电子设备与其他设备之间的通信。
存储器303可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器301的存储装置。
上述的处理器301可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等,还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,当该计算机程序在计算机上运行时,使得计算机执行上述实施例中所描述身份证真伪识别方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机指令时,全部或部分地产生按照本申请实施例所述的流程或功能。该计算机可以时通用计算机、专用计算机、计算机网络或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、微波等)方式向另外一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如软盘、硬盘、磁带等)、光介质(例如DVD)或者半导体介质(例如固态硬盘)等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。