CN109446900A - 证件真伪验证方法、装置、计算机设备及存储介质 - Google Patents

证件真伪验证方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN109446900A
CN109446900A CN201811106159.6A CN201811106159A CN109446900A CN 109446900 A CN109446900 A CN 109446900A CN 201811106159 A CN201811106159 A CN 201811106159A CN 109446900 A CN109446900 A CN 109446900A
Authority
CN
China
Prior art keywords
image
certificate
region unit
text
original certificate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811106159.6A
Other languages
English (en)
Inventor
黄锦伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201811106159.6A priority Critical patent/CN109446900A/zh
Publication of CN109446900A publication Critical patent/CN109446900A/zh
Priority to ZA2019/04157A priority patent/ZA201904157B/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

本发明公开一种证件真伪验证方法、装置、设备及介质,该方包括采用CTPN‑RNN算法对原始证件图像进行定位,获取文本行区域,截取文本行区域对应的图像作为获取区域块图像;采用OCR识别模型对区域块图像进行识别,获取对应的目标文字;基于证件类型和区域块图像对应的位置标识,获取对应的内容校验规则,采用内容校验规则对区域块图像对应的目标文字进行内容校验,获取内容校验结果;将区域块图像对应的目标文字和与证件类型对应的数据库中的标准文字进行校验,获取数据校验结果;对原始证件图像进行色差校验,获取色差校验结果;若内容校验结果、数据校验结果和色差校验结果均为校验通过时,原始证件图像为真证件,解决证件真伪验证不准确的问题。

Description

证件真伪验证方法、装置、计算机设备及存储介质
技术领域
本发明涉及密码技术领域,尤其涉及一种证件真伪验证方法、装置、计算机设备及存储介质。
背景技术
目前,随着我国经济的飞速发展,人员流动日益频繁,当人们外出旅游、出国和住宿等时,需要对人员进行证件真伪验证,目前证件真伪验证方法比较单一,从而导致证件真伪验证不准确的问题。
发明内容
本发明实施例提供一种证件真伪验证方法、装置、计算机设备及存储介质,以解决证件真伪验证不准确的问题。
一种证件真伪验证方法,包括:
获取原始证件图像,所述原始证件图像对应一证件类型;
采用CTPN-RNN算法对所述原始证件图像进行定位,获取至少一个文本行区域,从所述原始证件图像中截取所述文本行区域对应的图像作为区域块图像,并获取每一所述区域块图像对应的位置标识;
采用OCR识别模型对每一所述区域块图像进行识别,获取与每一所述区域块图像对应的目标文字;
基于所述证件类型和每一所述区域块图像对应的位置标识,获取对应的内容校验规则,采用所述内容校验规则对每一所述区域块图像对应的目标文字进行内容校验,获取内容校验结果;
将每一所述区域块图像对应的目标文字和与所述证件类型对应的数据库中的标准文字进行校验,获取数据校验结果;
对所述原始证件图像进行色差校验,获取色差校验结果;
若所述内容校验结果、所述数据校验结果和所述色差校验结果均为校验通过时,所述原始证件图像对应的证件为真证件。
一种证件真伪验证装置,包括:
图像获取模块,用于获取原始证件图像,所述原始证件图像对应一证件类型;
区域块图像获取模块,用于采用CTPN-RNN算法对所述原始证件图像进行定位,获取至少一个文本行区域,从所述原始证件图像中截取所述文本行区域对应的图像作为区域块图像,并获取每一所述区域块图像对应的位置标识;
目标文字获取模块,用于采用OCR识别模型对每一所述区域块图像进行识别,获取与每一所述区域块图像对应的目标文字;
第一校验模块,用于基于所述证件类型和每一所述区域块图像对应的位置标识,获取对应的内容校验规则,采用所述内容校验规则对每一所述区域块图像对应的目标文字进行内容校验,获取内容校验结果;
第二校验模块,用于将每一所述区域块图像对应的目标文字和与所述证件类型对应的数据库中的标准文字进行校验,获取数据校验结果;
第三校验模块,用于对所述原始证件图像进行色差校验,获取色差校验结果;
结果确定模块,用于若所述内容校验结果、所述数据校验结果和所述色差校验结果均为校验通过时,所述原始证件图像对应的证件为真证件。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述证件真伪验证的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述证件真伪验证方法的步骤。
上述证件真伪验证方法、装置、计算机设备及存储介质中,通过采用CTPN-RNN算法对获取到的原始证件图像进行定位,获取至少一个文本行区域,从原始证件图像中截取文本行区域对应的图像作为区域块图像,以实现对原始证件图像中每一区域进行定位,并采用OCR识别模型对每一区域块图像进行识别,获取与每一区域块图像对应的目标文字,以实现从原始证件图像中获取到证件中的文字。基于证件类型和每一区域块图像对应的位置标识,获取对应的内容校验规则,采用内容校验规则对每一区域块图像对应的目标文字进行内容校验,获取内容校验结果,以实现根据预设内容校验规则对原始证件图像中目标文字进行校验。将每一区域块图像对应的目标文字和与证件类型对应的数据库中的标准文字进行校验,获取数据校验结果,以实现对原始证件图像中目标文字进行数据校验。对原始证件图像进行色差校验,获取色差校验结果,以实现对原始证件图像进行色差校验。若内容校验结果、数据校验结果和色差校验结果均为校验通过时,原始证件图像对应的证件为真证件,以实现根据内容校验结果、数据校验结果和色差校验结果判断证件真伪,大大提高证件验证的准确性,且证件验证过程简单快速。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中证件真伪验证方法的一应用环境示意图;
图2是本发明一实施例中证件真伪验证方法的一流程图;
图3是本发明一实施例中证件真伪验证方法的一流程图;
图4是本发明一实施例中证件真伪验证方法的一流程图;
图5是本发明一实施例中证件真伪验证方法的一流程图;
图6是本发明一实施例中证件真伪验证方法的一流程图;
图7是本发明一实施例中证件真伪验证方法的一流程图;
图8是本发明一实施例中证件真伪验证方法的一流程图;
图9是本发明一实施例中证件真伪验证装置的一原理框图;
图10是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的证件真伪验证方法,可应用在如图1的应用环境中,其中,用户端通过网络与服务端进行通信,该网络可以是有线网络或者无线网络,服务端获取原始证件图像,服务端对原始证件图像进行校验,以确定原始证件图像是否为真证件,以解决证件真伪验证不准确的问题。其中,服务端和用户端之间通过网络进行连接,其中,用户端可以但不限于个人计算机、笔记本电脑、智能手机和平板电脑。服务端可以用独立的服务端或者是多个服务端组成的服务端集群来实现。
在一实施例中,如图2所示,提供一种证件真伪验证方法,以该方法应用在图1中的服务端为例进行说明,包括如下步骤:
S10:获取原始证件图像,原始证件图像对应一证件类型。
其中,证件类型是指与原始证件图像对应的类型,其证件类型可以为二代身份证、香港身份证、港澳通行证和护照等。
具体地,服务端获取用户端发送的证件真伪验证请求,根据真伪验证请求获取原始证件图像,其原始证件图像可以是用户端上传至服务端的,该原始证件图像对应的证件类型可以是用户端在上传原始证件图像时确定的证件类型。
S20:采用CTPN-RNN算法对原始证件图像进行定位,获取至少一个文本行区域,从原始证件图像中截取文本行区域对应的图像作为区域块图像,并获取每一区域块图像对应的位置标识。
其中,文本行区域是指对原始证件图像按一定的规则将图像定位成若干有意义的区域,且各区域之间无交集。区域块图像是指对文本行区域进行截取的图像。位置标识是指与区域块图像对应的标识,通过该位置标识可查找到对应的区域块图像,例如,某一身份证号的位置标识为1,通过位置标识1可确定该区域块图像为身份证号的图像。
具体地,CTPN(Connectionist Text Proposal Network,连接文本提议网络,以下简称CTPN)是用于准确定位图像中文本行的模型。RNN(Recurrent Neural Networks,循环神经网络)的主要用途是用于处理和预测序列数据,RNN的隐藏层之间的结点是有连接的,隐藏层的输入不仅包括输入层的输出,还包括上一时刻隐藏层的输出。通过将CTPN无逢结合到RNN卷积网络中,使其可准确定位原始证件图像中的文本行区域,不同证件类型的原始证件图像,每一文本行区域在原始证件图像中的位置不同。通过CTPN-RNN算法从原始证件图像中定位到至少一个文本行区域,使其获取到的至少一个文本行区域更加精准。通过裁剪工具对原始证件图像中文本行区域进行截取,以获取到区域块图像,每一区域块图像对应一位置标识。其中,通过CTPN-RNN算法对原始证件图像进行定位时,每一原始证件图像可映射成大小为W×H×C的特征向量,并通过回归过滤等操作,得到每一文本行四个角的坐标,文本行的左上角坐标即是区域块图像的左上角坐标,预先根据每一证件类型对应的区域块图像左上角坐标,配置对应的位置标识,通过每一区域块图像左上角的坐标确定与区域块图像对应的位置标识。于本实施例中,可通过OpenCV对原始证件图像中文本行区域进行截取,其中,OpenCV(Open Source Computer Vision Library,开源计算机视觉库)是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows、Android和Mac OS操作系统上。本实施例中,通过OpenCV对每一文本行区域的4个角的坐标进行截取操作,以获取相应的区域块图像,通过OpenCV进行截取操作,其计算简单、运算效率较高且性能较稳定。
S30:采用OCR识别模型对每一区域块图像进行识别,获取与每一区域块图像对应的目标文字。
其中,目标文字是指采用OCR识别模型从区域块图像中识别出的文字,该目标文字可包含中文、数字和英文等。
具体地,通过预先训练的OCR识别模型对每一区域块图像进行识别的过程就是文字特征提取,从区域块图像中提取文字特征,并从OCR识别模型中找出特征最相似的字,以获取到每一区域块图像对应的目标文字。
其中,预先训练的OCR识别模型中保存有文字的各种特征,如文字的结构和文字的笔画等。OCR识别模型进行训练时,主要通过定义网络(可以是LeNet的改进版),加入batchnormalization深度学习,选择合适损失函数,损失函数可选择sparse_softmax_cross_entropy_with_logits交叉嫡,加入优化器,优化器可选择Adam(学习率设为0.1),通过对训练文本进行模型训练,以得到OCR识别模型。
S40:基于证件类型和每一区域块图像对应的位置标识,获取对应的内容校验规则,采用内容校验规则对每一区域块图像对应的目标文字进行内容校验,获取内容校验结果。
其中,内容校验规则是指预先设置的对目标文字进行校验的规则,于本实施例中,内容校验规则可以是依据证件标准规则预先编写的代码,通过执行该代码对目标文字进行校验。证件标准规则是国家制定的关于证件标准的规则。
具体地,服务端基于原始证件图像的证件类型,可获取到与证件类型对应的数据库,数据库中包括预先设置的内容校验规则。基于区域块图像对应的位置标识获取到对应的内容校验规则,利用该内容校验规则对区域块图像对应的的目标文字进行内容校验,获取到内容校验结果,其内容校验结果可为校验通过或校验失败。
进一步地,不同证件类型对应的内容校验规则不同。例如,证件类型为二代身份证时,查找二代身份证对应的数据库,其二代身份证对应的数据库中包含依据证件标准规则预先编写的对二代身份证进行校验的内容校验规则。如二代身份证号码包括1~6位为地区代码(其中1和2位数为各省级政府的代码,3和4位数为地和市级政府的代码,5 6位数为县和区级政府代码)7~14位为出生年月日,15~17位为顺序号(其中,单数为男性分配码,双数为女性分配码),18位为校验码。二代身份证号码的校验规则为:(1)将前17位数分别乘以不同系数,从第一位到17位的系数分别为(7,9,10,5,8,4,2,1,6,3,7,9,10,5,8,4,2)。(2)将前17位数乘以相应的系数,并将结果相加。(3)用相加获得的结果初一11,获取余数。(4)余数的可能性为0,1,2,3,4,5,6,7,8,9,10这11为数,那么对应的校验码分别为1,0,X,9,8,7,6,5,4,3,2。再例如,证件类型为香港身份证时,查找香港身份证对应的数据库,其香港身份证对应的数据库中包含依据证件标准规则预先编写的对香港身份证进行校验的内容校验规则,如香港身份证号的校验规则为由香港身份证号前7位确定,首位字母改为数字代表,即A以1代表,B以2代表...Z以26代表,可以得到8个数字,香港身份证号中括弧内的为校验码,用来校验前面的数字是否正确,可能为数字或者字母A。通过第一个数字乘以8,第二个数字乘以7,依此类推,第七个数字乘以2,第六个数乘以1,再将以上所有乘积相加,得到一个数,再将这个数除以11,得到余数。如果整除,校验码为0;如果余数为1,则校验码为A;如果余数为2~10,则用11减去这个余数,则为校验码。
进一步地,证件的不同位置对应的内容校验规则不同。例如,香港身份证中包含中文电码、中文名称、签发日期、标记符号、首次签发日期、英文名、出生日期、性别和身份id等区域块图像,每一区域块图像对应一位置标识,则通过位置标识可在与证件类型对应的数据库中查找到对应的内容校验规则。如,在香港身份证对应的数据库中,通过中文电码的位置标识可查找到与中文电码对应的内容校验规则。
S50:将每一区域块图像对应的目标文字和与证件类型对应的数据库中的标准文字进行校验,获取数据校验结果。
具体地,服务端中存储有每一证件类型对应的数据库,其数据库中包含有所有用户对应的标准文字。服务端通过证件类型查找数据库,获取与证件类型对应的数据库,根据每一区域块图像对应的目标文字查找与证件类型对应的数据库,获取与目标文字对应的标准文字,将目标文字与标准文字进行匹配,以获取数据校验结果,其中,数据校验结果可为校验通过或校验失败。
进一步地,每一原始证件图像对应一身份id,通过该身份id可确定唯一的用户。获取区域块图像对应的目标文字中的身份id,通过身份id查找与证件类型对应的数据库,若数据库中包含与身份id对应的标准文字(即与身份id相同的文字),获取现该身份id对应的每一区域块图像对应的标准文字,将目标文字与标准文字进行匹配,若均匹配成功,则数据校验结果为校验通过,若任意一目标文字未匹配成功,则数据校验结果为校验失败。例如,某一证件类型为二代身份证,身份id可以是身份证号码,如身份id为xxxx1,通过xxxx1查找与二代身份证对应的数据库,若数据库中包含与xxxx1相匹配的标准文字,则获取与xxxx1对应的每一区域块图像的目标文字和数据库中与xxxx1相关联的标准文字,其相关联的标准文字可以是姓名、年龄和地址等,将目标文字与标准文字相匹配,获取数据校验结果。
S60:对原始证件图像进行色差校验,获取色差校验结果。
具体地,服务端所获取的原始证件图像,该原始证件图像包括正面图像和至少两张不同角度拍摄证件的侧面的图像,计算每一侧面图像与正面图像之间的色差,并将色差与预设的色差阈值进行比较,获取色差校验结果。其中,色差校验结果可为校验通过和校验失败。通常证件不同角度获取到的原始证件图像折射出的光线不同,例如,香港身份证,不同角度获取到的原始证件图像折射出的光线可以为金色和绿色等不同颜色。本实施例中,通过对原始证件图像进行色差校验,提高证件真伪验证的准确性。
S70:若内容校验结果、数据校验结果和色差校验结果均为校验通过时,原始证件图像对应的证件为真证件。
具体地,服务端获取内容校验结果、数据校验结果和色差校验结果,若内容校验结果、数据校验结果和色差校验结果均为校验通过时,原始证件图像对应的证件为真证件;反之,若内容校验结果、数据校验结果和色差校验结果中的任一个为校验失败,则原始证件图像对应的证件为假证件。
步骤S10-S70中,通过采用CTPN-RNN算法对获取到的原始证件图像进行定位,获取至少一个文本行区域,从原始证件图像中截取文本行区域对应的图像作为区域块图像,以实现对原始证件图像中每一区域进行定位,并采用OCR识别模型对每一区域块图像进行识别,获取与每一区域块图像对应的目标文字,以实现从原始证件图像中获取到证件中的文字。基于证件类型和每一区域块图像对应的位置标识,获取对应的内容校验规则,采用内容校验规则对每一区域块图像对应的目标文字进行内容校验,获取内容校验结果,以实现根据预设内容校验规则对原始证件图像中目标文字进行校验。将每一区域块图像对应的目标文字和与证件类型对应的数据库中的标准文字进行校验,获取数据校验结果,以实现对原始证件图像中目标文字进行数据校验。对原始证件图像进行色差校验,获取色差校验结果,以实现对原始证件图像进行色差校验。若内容校验结果、数据校验结果和色差校验结果均为校验通过时,原始证件图像对应的证件为真证件,以实现根据内容校验结果、数据校验结果和色差校验结果判断证件真伪,大大提高证件验证的准确性,且验证过程简单快速。
在一实施例中,如图3所示,步骤S30中,即采用OCR识别模型对每一区域块图像进行识别,获取与每一区域块图像对应的目标文字,包括:
S31:采用OCR识别模型对每一区域块图像进行识别,获取目标识别内容,目标识别内容包括区域块图像对应的识别文字和与识别文字对应的识别概率。
具体地,服务端将区域块图像输入至OCR识别模型中,先通过文字切割算法将区域块图像切割成单字体图像;再将切割出的单字体图像依据切割出来的顺序依序输入到OCR识别模型进行识别,获取每一单字体图像对应的目标识别内容,目标识别内容中包含与区域块图像对应的识别文字和识别文字对应的识别概率。其中,文字切割算法可以为基于投影的文字切割算法。例如,某一证件类型为二代身份证,将二代身份证中姓名对应的区域块图像输入至OCR识别模型中,若区域块图像中姓名为“李大”,先将区域块图像分割成两个单字体图像“李”和“大”,通过OCR识别模型对单字体图像进行识别,获取单字体图像对应识别文字和识别文字对应的识别概率,识别文字和与识别文字对应的识别概率可为“李”95%和“季”73%;“大”98%和“人”80%。
S32:将最大识别概率对应的识别文字作为区域块图像对应的目标文字。
具体地,服务端获取区域块图像中每一单字体图像对应的识别文字和与识别文字对应的识别概率,并提取每一单字体图像最大识别概率对应的识别文字作为目标文字。例如,步骤S31中,识别文字和与识别文字对应的识别概率可为“李”95%和“季”73%;“大”98%和“人”80%,将最大识别概率95%对应的“李”和98%对应的“大”作为目标文字。
步骤S31-S32中,采用OCR识别模型对每一区域块图像进行识别,获取目标识别内容,目标识别内容包括区域块图像对应的识别文字和与识别文字对应的识别概率,将最大识别概率对应的识别文字作为区域块图像对应的目标文字,以实现通过预先训练的OCR识别模型对区域块图像中的内容进行识别,以快速获取到与区域块图像对应的目标文字,识别过程快速,且OCR识别模型可反复利用。
在一实施例中,OCR识别模型包含专用OCR识别模型和通用OCR识别模型。
其中,预先训练的OCR识别模型可包含专用OCR识别模型和通用OCR识别模型,其中,通用OCR识别模型可识别出区域块图像中的中文、数字和英文等组合的目标识别内容,而专用OCR识别模型只可识别出区域块图像中的中文、数字和英文等中的一种目标识别内容,专用OCR识别模型是将通用OCR识别模型分别拆开成中文、英文数字三个不同模型,相比通用OCR识别模型而言,识别率较高。两者训练过程相同,只是在训练库上对训练图像进行分类,比如说数字专用OCR识别模型就是用只包含数字的训练图像和标记文本进行训练。
如图4所示,步骤S31中,即采用OCR识别模型对每一区域块图像进行识别,获取目标识别内容,具体包括如下步骤:
S311:基于原始证件图像对应的证件类型和每一区域块图像对应的位置标识,获取每一区域块图像对应的属性,属性包括专用属性和通用属性。
其中,预先设置每一种证件类型的原始证件图像中每一文本行区域的属性,该属性用于区分是否只包含中文、数字和英文的专用属性和同时包含中文、数字和英文等组合形成的通用属性。其中,专用属性对应专用OCR识别模型,通用属性对应通用OCR识别模型。
具体地,通过原始证件图像对应的证件类型获取与证件类型对应的数据库,数据库中存储有每一文本行区域对应的属性,通过截取的文本行区域的区域块图像对应的位置标识,确定该区域块图像对应的属性,该属性包括专用属性和通用属性。
S312:若区域块图像对应的属性为专用属性,则采用专用OCR识别模型对区域块图像进行识别,获取与区域块图像对应的目标识别内容。
具体地,服务端根据原始证件图像对应的证件类型和区域块图像对应的位置标识确定区域块图像对应的属性为专用属性时,则采用专用OCR识别模型对区域块图像进行识别,以获取到与区域块图像对应的目标识别内容,使得该目标识别内容更准确。
例如,证件类型为香港身份证,香港身份证图像中第一文本行区域为“香港永久性居民身份证”,因只包含中文,则预先设置第一文本行区域对应的属性为专用属性,则通过区域块图像的位置标识可确定与之对应的属性为专用属性,通过专用OCR识别模型对区域块图像进行识别,以获取与区域块图像对应的目标识别内容,其中,本步骤中,专用识别模型为中文专用OCR识别模型。
S313:若区域块图像对应的属性为通用属性,则采用通用OCR识别模型对区域块图像进行识别,获取与区域块图像对应的目标识别内容。
具体地,服务端根据原始证件图像对应的证件类型和区域块图像对应的位置标识确定区域块图像对应的属性为通用属性时,采用通用OCR识别模型对区域块图像进行识别,以获取到与区域块图像对应的目标识别内容。
例如,证件类型为二代身份证,二代身份证中第三文本行区域为“出生X年X月X日”,第三文本行区域中包含了中文和数字,则预先设置第三文本行区域对应的属性为通用属性,则通过区域块图像对应的位置标识可确定与之对应的属性为通用属性,并通过通用OCR识别模型对区域块图像进行识别,以获取与区域块图像对应的目标识别内容。
步骤S311-S313中,基于原始证件图像对应的证件类型和每一区域块图像对应的位置标识,获取每一区域块图像对应的属性,属性包括专用属性和通用属性,以便后续根据属性确定识别模型。若区域块图像对应的属性为专用属性,则采用专用OCR识别模型对区域块图像进行识别,获取与区域块图像对应的目标识别内容,以实现通过专用OCR识别模型对区域块图像进行识别,以提高识别效率和精准度。若区域块图像对应的属性为通用属性,则采用通用OCR识别模型对区域块图像进行识别,获取与区域块图像对应的目标识别内容,以实现通过通用OCR识别模型对区域块模型进行识别,提高识别效率。
在一实施例中,如图5所示,步骤S40中,即基于证件类型和每一区域块图像对应的位置标识,获取对应的内容校验规则,采用内容校验规则对每一区域块图像对应的目标文字进行内容校验,获取内容校验结果,具体包括如下步骤:
S41:基于证件类型,获取与证件类型对应的至少一个内容校验规则,每一内容校验规则对应一待校验区域标识。
具体地,服务端根据证件类型获取与证件类型对应的数据库,每一证件类型对应的数据库中存储有内容校验规则。其中,内容校验规则是对原始证件图像中特定区域块图像对应的目标文字进行校验的规则。每一内容校验规则对应一待校验区域标识。例如,证件类型为香港身份证,数据库中包含待校验区域标识为中文电报号码、中文名称、符号标记、出生日期和身份证号码对应的内容校验规则,每一内容校验规则对应一待校验区域标识,根据该标识可获取到对应的内容校验规则。
进一步地,基于证件类型,与证件类型对应的数据库中存储有待校验区域标识和内容校验规则的对应关系,可以是一对一的关系,也可以是多对一的关系。例如,证件类型为香港身份证,待校验区域标识为身份证号码对应一内容校验规则,则是一对一的关系;待校验区域标识为中文名称和待校验区域标识为中文电码标识对应一内容校验规则,则是多对一的关系,即待校验区域标识为中文名称和待校验区域标识为中文电码对应同一内容校验规则,并将对应同一校验规则的待校验区域标识进行关联。例如,待校验区域标识为中文名称和待校验区域标识为中文电码对应同一内容校验规则,同一内容校验规则为通过中文电码规则,识别出的中文电码区域中文电码对应的汉字、字母和符号,将汉字、字母和符号与中文名称进行对比,当一致时,则判定内容校验结果为校验通过。
S42:获取位置标识与待校验区域标识相匹配的目标区域块图像。
具体地,服务端获取位置标识,将位置标识与待校验区域标识进行匹配,获取匹配成功的位置标识对应的区域块图像,将该区域块图像作为目标区域块图像。例如,位置标识为中文名称,将位置标识与待校验区域标识进行匹配,若与证件类型对应的数据库中包含待校验区域标识为中文名称,则将位置标识对应的区域块图像作为目标区域块图像。
进一步地,若位置标识与待校验区域标识相匹配,判断与该待校验区域标识是否有关联的待校验区域标识,若有关联的待校验区域标识,则将原始证件图像中剩余位置标识与关联的待校验区域标识进行匹配,获取每一相匹配的目标区域块图像。例如,步骤S41中,数据库中包含有待校验区域标识为中文名称和待校验区域标识为中文电码对应同一内容校验规则,若位置标识为中文名称与待校验区域标识为中文名称匹配成功,判断与待校验区域标识为中文电码是否有关联的待校验区域标识,而待校验区域标识为中文名称和待校验区域标识为中文电码关联,则将原始证件图像中剩余位置标识与待校验区域标识为中文电码进行匹配,若相匹配,则获取位置标识为中文名称和位置标识为中文电码对应的区域块图像作为目标区域块图像。
S43:采用内容校验规则,对目标区域块图像对应的目标文字进行内容校验,获取内容校验结果。
具体地,获取与位置标识匹配成功的待校验区域标识,并根据待校验区域标识获取对应的内容校验规则,根据内容校验规则对目标区域块图像对应的目标文字进行内容校验,获取内容校验结果。例如,步骤S42中,获取待校验区域标识为中文名称对应的内容校验规则,通过该内容校验规则对目标区域块图像对应的目标文字进行内容校验,获取内容校验结果。
进一步地,若待校验区域标识与内容校验规则为多对一的关系,则将关联的与待校验区域标识相匹配的目标区域块图像对应的目标文字均输入同一内容校验规则中,获取内容校验结果。例如,待校验区域标识为中文名称和待校验区域标识为中文电码对应同一内容校验规则,步骤S42中,位置标识为中文名称和位置标识为中文电码对应的区域块图像作为目标区域块图像,将中文名称和中文电码均输入至同一内容校验规则中,先识别出的中文电码对应的汉字、字母和符号,将汉字、字母和符号与中文名称进行对比,当一致时,则判定内容校验结果为校验通过。其中,识别出的中文电码对应的汉字、字母和符号,主要是根据中文电码表进行识别,中文电码表中采用四位阿拉伯数字作代号,简称“四码电报”,从0001到9999按四位数顺序排列,用四位数字表示最多一万个汉字、字母和符号,即每一四位数对应一中文汉字,识别出汉字、字母和符号。
步骤S41-S43中,基于证件类型,获取与证件类型对应的至少一个内容校验规则,以便后续通过位置标识查找到对应的内容校验规则,使得查找到对应的校验规则速度更快。获取位置标识与待校验区域标识相匹配的目标区域块图像,采用内容校验规则,对目标区域块图像对应的目标文字进行内容校验,获取内容校验结果,以实现对目标文字进行内容校验。
在一实施例中,原始证件图像包括证件正面图像和至少两个证件侧面图像,其中,正面图像是指垂直于证件拍摄的图像,侧面图像是指以正面图像为基准,通过预设角度倾斜拍摄的照片,预设角度可为30-40度。
如图6所示,步骤S60中,即对原始证件图像进行色差校验,获取色差校验结果,包括:
S61:对原始证件图像进行空间转换,获取每一原始证件图像对应的图像参数,图像参数包括色调、饱和度和亮度。
其中,对原始证件图像进行空间转换,以便获取到对应的图像参数,本实施例中,将原始证件图像转换至HSI颜色空间,获取原始证件图像对应的图像参数,图像参数可具体为色调、饱和度和亮度。其中,HSI颜色空间中,通过色调(Hue)、饱和度(Saturation)和亮度(Intensity)来描述原始证件图像。其中,色调是指原始证件图像中色彩的总体倾向,由证件反射的光线中以哪种波长占优势来决定的,不同波长产生不同颜色的感觉,色调是颜色的重要的特征,它决定了颜色本质的根本特征。饱和度是指原始证件图像中色彩的鲜艳程度,也称色彩的纯度,饱和度取决于该彩色中含色成分和消色成分(灰色)的比例。亮度是指原始证件图像的明亮程度,单位是堪德拉每平米(cd/m2)或称nits,也就是每平方公尺分之烛光。
S62:基于每一原始证件图像对应的色调、饱和度和亮度,采用色差公式计算每一证件侧面图像和证件正面图像之间的图像色差;色差公式为1为正面图像,2为侧面图像,D为正面图像和侧面图像的图像色差,i1为正面图像的亮度,i2为侧面图像的亮度,s1为正面图像的饱和度,s2为侧面图像的饱和度,h1为正面图像的色调,h2为侧面图像的色调。
具体地,获取每一侧面图像和正面图像的图像参数,通过色差计算公式计算每一侧面图像与正面图像之间的色差,主要是通过侧面图像和正面图像对应的色调、饱和度和亮度进行计算,其色差公式为将正面图像的色调、饱和度和亮度分别代入公式中h1、s1和i1,将侧面图像的色调、饱和度和亮度分别代入公式中h2、s2和i2,通过色差公式计算出侧面图像和正面图像的图像色差。
S63:将每一图像色差和与证件类型对应的色差阈值进行比较,若图像色差大于或等于色差阈值,则色差校验结果为校验通过。
其中,色差阈值是指预先设定的值,每一证件类型预设有一色差阈值。将计算出的每一侧面图像与正面图像之间的图像色差和与证件类型对应的色差阈值进行比较,当每一侧面图像与正面图像之间的色差均大于或等于色差阈值时,则色差校验结果为校验通过,若任意一侧面图像与正面图像间的色差小于色差阈值时,则色差校验结果为校验失败。
步骤S61-S63中,通过对原始证件图像进行空间转换,以便获取每一原始证件图像对应的图像参数。基于每一原始证件图像对应的图像参数,采用色差公式计算每一证件侧面图像和证件正面图像之间的图像色差,将每一图像色差和与证件类型对应的色差阈值进行比较,若图像色差大于或等于色差阈值,则色差校验结果为校验通过,实现对原始证件图像的色差校验。将每一侧面图像对应的图像色差与色差阈值进行比较,使得对证件真伪验证更加准确。
在一实施例中,如图7所示,步骤S61中,即对原始证件图像进行空间转换,获取每一原始证件图像对应的图像参数,具体包括如下步骤:
S611:判断原始证件图像是否为RGB颜色空间图像。
具体地,可通过原始证件图像的属性判断是否为RGB图像,通常RGB颜色空间图像属性中位深度是24。其中,位深度用于指定图像中的每个像素可以使用的颜色信息数量。RGB颜色空间图像是由三个颜色通道组成,将带有8位/通道(bpc)的RGB图像称作24位图像(8位x 3通道=24位数据/像素),即位深度为24。其中,RGB颜色空间是工业界的一种颜色标准,是通过对红、绿和蓝三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色,RGB即是代表红、绿和蓝三个通道的颜色。对于彩色图像中的每个RGB(红色、绿色和蓝色)分量,为每个像素指定一个0(黑色)到255(白色)之间的强度值。
S612:若原始证件图像为RGB颜色空间图像,则获取RGB颜色空间的颜色值,颜色值包括红色分量强度、绿色分量强度和蓝色分量强度。
具体地,若原始证件图像为RGB颜色空间图像,则可通过photoshop等工具获取RGB颜色空间的颜色值,颜色值指RGB颜色空间的红色分量强度、绿色分量强度和蓝色分量强度,通过红色分量强度、绿色分量强度和蓝色分量强度可表示原始证件图像中每一个像素。
S613:若原始证件图像不为RGB颜色空间图像,则将原始证件图像转换为RGB颜色空间图像,获取RGB颜色空间的颜色值。
具体地,若原始证件图像不为RGB颜色空间图像,则可通过photoshop等工具将原始证件图像转换为RGB颜色空间图像,再获取RGB颜色空间的颜色值。
S614:通过几何推导法将RGB颜色空间的颜色值转换为HSI颜色空间的图像值,将HSI颜色空间的图像值作为与原始证件图像对应的图像参数。
其中,HSI颜色空间是从人的视觉系统出发,用色调、饱和度和亮度来描述色彩。HSI颜色空间可以用一个圆锥空间模型来描述。
具体地,获取到原始证件图像的RGB颜色空间的颜色值后,通过几何推导法将RGB颜色空间的颜色值转化为HSI颜色空间的图像值,HSI颜色空间的图像值包括色调、饱和度和亮度。其中,几何推导法主要是从RGB颜色空间中先分离出亮度,将三维空间降为二维,在二维平面内利用解析几何的向量点积公式求出HSI模型的色调和饱和度。
步骤S611-S614中,判断原始证件图像是否为RGB颜色空间图像,以确定原始证件图像是否需要进行空间转换。若原始证件图像为RGB颜色空间图像,则获取RGB颜色空间的颜色值,以快速获取到与原始证件图像对应的RGB颜色空间。若原始证件图像不为RGB颜色空间图像,则将原始证件图像转换为RGB颜色空间图像,获取RGB颜色空间的颜色值,以实现对原始证件图像进行空间转换,并获取与原始证件图像对应的RGB颜色空间。通过几何推导法将RGB颜色空间的颜色值转换为HSI颜色空间的图像值,将HSI颜色空间的图像值作为与原始证件图像对应的图像参数,以实现快速获取到图像参数,获取过程简单。
在一实施例中,图像值包括亮度、饱和度和色调。如图8所示,步骤S614中,即通过几何推导法将RGB颜色空间的颜色值转换为HSI颜色空间的图像值,具体包括如下步骤:
S6141:基于红色分量强度、绿色分量强度和蓝色分量强度,根据亮度公式获取HSI颜色空间的亮度,亮度公式为r为红色分量强度,g为绿色分量强度,b为蓝色分量强度,i为亮度。
具体地,获取原始证件图像对应的RGB颜色空间的颜色值,将RGB颜色空间的颜色值中的红色分量强度、绿色分量强度和蓝色分量强度分别代入至亮度公式中,以获取转换成HSI颜色空间的图像值中的亮度,即与原始证件图像对应的亮度。
S6142:基于红色分量强度、绿色分量强度和蓝色分量强度,根据饱和度公式获取HSI颜色空间的饱和度,饱和度公式为s为饱和度,min(r,g,b)为红色分量强度、绿色分量强度和蓝色分量强度中的最小值。
具体地,服务端根据基于红色分量强度、绿色分量强度和蓝色分量强度,获取与红色分量强度、绿色分量强度和蓝色分量强度中的最小值,将红色分量强度、绿色分量强度和蓝色分量强度和最小值代入饱和度公式中,以获取转换成HSI颜色空间的图像值中的饱和度,即与原始证件图像对应的饱和度。
S6143:基于红色分量强度、绿色分量强度和蓝色分量强度,根据色调公式获取HSI颜色空间的色调,色调公式为h为色调。
具体地,服务端基于红色分量强度、绿色分量强度和蓝色分量强度,通过公式求出θ值,若绿色分量强度大于或等于蓝色分量强度,则色调等于θ值,若绿色分量强度小于蓝色分量强度,则色调等于2π-θ,以获取转换成HSI颜色空间的图像值中的色调,即与原始证件图像对应的色调。
步骤S6141-S6143中,基于红色分量强度、绿色分量强度和蓝色分量强度,根据亮度公式获取HSI颜色空间的亮度,根据饱和度公式获取HSI颜色空间的饱和度,根据色调公式获取HSI颜色空间的色调,以快速获取到HSI颜色空间的亮度、饱和度和色调,将HSI颜色空间的亮度、饱和度和色调作为与原始证件图像对应的图像参数,以便后续根据图像参数计算侧面图像与正面图像的图像色差。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种证件真伪验证装置,该证件真伪验证装置与上述实施例中证件真伪验证方法一一对应。如图9所示,该证件真伪验证装置包括图像获取模块10、区域块图像获取模块20、目标文字获取模块30、第一校验模块40、第二校验模块50、第三校验模块60和结果确定模块70。各功能模块详细说明如下:
图像获取模块10,用于获取原始证件图像,原始证件图像对应一证件类型。
区域块图像获取模块20,用于采用CTPN-RNN算法对原始证件图像进行定位,获取至少一个文本行区域,从原始证件图像中截取文本行区域对应的图像作为区域块图像,并获取每一区域块图像对应的位置标识。
目标文字获取模块30,用于采用OCR识别模型对每一区域块图像进行识别,获取与每一区域块图像对应的目标文字。
第一校验模块40,用于基于证件类型和每一区域块图像对应的位置标识,获取对应的内容校验规则,采用内容校验规则对每一区域块图像对应的目标文字进行内容校验,获取内容校验结果。
第二校验模块50,用于将每一区域块图像对应的目标文字和与证件类型对应的数据库中的标准文字进行校验,获取数据校验结果。
第三校验模块60,用于对原始证件图像进行色差校验,获取色差校验结果。
结果确定模块70,用于若内容校验结果、数据校验结果和色差校验结果均为校验通过时,原始证件图像对应的证件为真证件。
在一实施例中,目标文字获取模块30包括目标识别内容获取单元和目标文字获取单元。
目标识别内容获取单元,用于采用OCR识别模型对每一区域块图像进行识别,获取目标识别内容,目标识别内容包括区域块图像对应的识别文字和与识别文字对应的识别概率。
目标文字获取单元,用于将最大识别概率对应的识别文字作为区域块图像对应的目标文字。
在一实施例中,OCR识别模型包含专用OCR识别模型和通用OCR识别模型。
目标识别内容获取单元包括属性获取子单元、第一识别子单元和第二识别子单元。
属性获取子单元,用于基于原始证件图像对应的证件类型和每一区域块图像对应的位置标识,获取每一区域块图像对应的属性,属性包括专用属性和通用属性。
第一识别子单元,用于若区域块图像对应的属性为专用属性,则采用专用OCR识别模型对区域块图像进行识别,获取与区域块图像对应的目标识别内容。
第二识别子单元,用于若区域块图像对应的属性为通用属性,则采用通用OCR识别模型对区域块图像进行识别,获取与区域块图像对应的目标识别内容。
在一实施例中,第一校验模块40包括内容校验规则获取单元、目标区域块图像获取单元和内容校验结果获取单元。
内容校验规则获取单元,用于基于证件类型,获取与证件类型对应的至少一个内容校验规则,每一内容校验规则对应一待校验区域标识。
目标区域块图像获取单元,用于获取位置标识与待校验区域标识相匹配的目标区域块图像。
内容校验结果获取单元,用于采用内容校验规则,对目标区域块图像对应的目标文字进行内容校验,获取内容校验结果。
在一实施例中,原始证件图像包括证件正面图像和至少两个证件侧面图像。
第三校验模块60包括图像参数获取子模块、图像色差计算子模块和色差校验结果获取子模块。
图像参数获取子模块,用于对原始证件图像进行空间转换,获取每一原始证件图像对应的图像参数,图像参数包括色调、饱和度和亮度。
图像色差计算子模块,用于基于每一原始证件图像对应的色调、饱和度和亮度,采用色差公式计算每一证件侧面图像和证件正面图像之间的图像色差。色差公式为1为正面图像,2为侧面图像,D为正面图像和侧面图像的色差,i1为正面图像的亮度,i2为侧面图像的亮度,s1为正面图像的饱和度,s2为侧面图像的饱和度,h1为正面图像的色调,h2为侧面图像的色调。
色差校验结果获取子模块,用于将每一图像色差和与证件类型对应的色差阈值进行比较,若图像色差大于或等于色差阈值,则色差校验结果为校验通过。
在一实施例中,图像参数获取子模块包括判断单元、第一判定单元、第二判定单元和图像参数获取单元。
判断单元,用于判断原始证件图像是否为RGB颜色空间图像。
第一判定单元,用于若原始证件图像为RGB颜色空间图像,则获取RGB颜色空间的颜色值,颜色值包括红色分量强度、绿色分量强度和蓝色分量强度。
第二判定单元,用于若原始证件图像不为RGB颜色空间图像,则将原始证件图像转换为RGB颜色空间图像,获取RGB颜色空间的颜色值。
图像参数获取单元,用于通过几何推导法将RGB颜色空间的颜色值转换为HSI颜色空间的图像值,将HSI颜色空间的图像值作为与原始证件图像对应的图像参数。
在一实施例中,图像值包括亮度、饱和度和色调。图像参数获取单元包括亮度获取子单元、饱和度获取子单元和色调获取子单元。
亮度获取子单元,用于基于红色分量强度、绿色分量强度和蓝色分量强度,根据亮度公式获取HSI颜色空间的亮度,亮度公式为r为红色分量强度,g为绿色分量强度,b为蓝色分量强度,i为亮度。
饱和度获取子单元,用于基于红色分量强度、绿色分量强度和蓝色分量强度,根据饱和度公式获取HSI颜色空间的饱和度,饱和度公式为s为饱和度,min(r,g,b)为红色分量强度、绿色分量强度和蓝色分量强度中的最小值。
色调获取子单元,用于基于红色分量强度、绿色分量强度和蓝色分量强度,根据色调公式获取HSI颜色空间的色调,色调公式为 h为色调。
关于证件真伪验证装置的具体限定可以参见上文中对于证件真伪验证方法的限定,在此不再赘述。上述证件真伪验证装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务端,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储用户的标准文字等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种证件真伪验证方法。
在一实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中证件真伪验证方法的步骤,例如,图2所示的步骤S10至步骤S70,或者,处理器执行计算机程序时实现上述实施例中证件真伪验证装置中的各模块/子模块/单元/子单元的功能,例如,图9所示模块10至模块70的功能。为避免重复,此处不再赘述。
在一实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例中证件真伪验证方法的步骤,例如,图2所示的步骤S10至步骤S70,或者,该计算机程序被处理器执行时实现上述装置中证件真伪验证装置中的各模块/子模块/单元/子单元的功能,例如,图9所示模块10至模块70的功能。为避免重复,此处不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种证件真伪验证方法,其特征在于,包括:
获取原始证件图像,所述原始证件图像对应一证件类型;
采用CTPN-RNN算法对所述原始证件图像进行定位,获取至少一个文本行区域,从所述原始证件图像中截取所述文本行区域对应的图像作为区域块图像,并获取每一所述区域块图像对应的位置标识;
采用OCR识别模型对每一所述区域块图像进行识别,获取与每一所述区域块图像对应的目标文字;
基于所述证件类型和每一所述区域块图像对应的位置标识,获取对应的内容校验规则,采用所述内容校验规则对每一所述区域块图像对应的目标文字进行内容校验,获取内容校验结果;
将每一所述区域块图像对应的目标文字和与所述证件类型对应的数据库中的标准文字进行校验,获取数据校验结果;
对所述原始证件图像进行色差校验,获取色差校验结果;
若所述内容校验结果、所述数据校验结果和所述色差校验结果均为校验通过时,所述原始证件图像对应的证件为真证件。
2.如权利要求1所述的证件真伪验证方法,其特征在于,所述采用OCR识别模型对每一所述区域块图像进行识别,获取与每一所述区域块图像对应的目标文字,包括:
采用OCR识别模型对每一所述区域块图像进行识别,获取目标识别内容,所述目标识别内容包括所述区域块图像对应的识别文字和与所述识别文字对应的识别概率;
将最大识别概率对应的识别文字作为所述区域块图像对应的目标文字。
3.如权利要求2所述的证件真伪验证方法,其特征在于,所述OCR识别模型包含专用OCR识别模型和通用OCR识别模型;
所述采用OCR识别模型对每一所述区域块图像进行识别,获取目标识别内容,包括:
基于所述原始证件图像对应的证件类型和每一所述区域块图像对应的位置标识,获取每一所述区域块图像对应的属性,所述属性包括专用属性和通用属性;
若所述区域块图像对应的属性为专用属性,则采用所述专用OCR识别模型对所述区域块图像进行识别,获取与所述区域块图像对应的目标识别内容;
若所述区域块图像对应的属性为通用属性,则采用所述通用OCR识别模型对所述区域块图像进行识别,获取与所述区域块图像对应的目标识别内容。
4.如权利要求1所述的证件真伪验证方法,其特征在于,所述基于所述证件类型和每一所述区域块图像对应的位置标识,获取对应的内容校验规则,采用所述内容校验规则对每一所述区域块图像对应的目标文字进行内容校验,获取内容校验结果,包括:
基于所述证件类型,获取与所述证件类型对应的至少一个内容校验规则,每一所述内容校验规则对应一待校验区域标识;
获取所述位置标识与所述待校验区域标识相匹配的目标区域块图像;
采用所述内容校验规则,对所述目标区域块图像对应的目标文字进行内容校验,获取内容校验结果。
5.如权利要求1所述的证件真伪验证方法,其特征在于,所述原始证件图像包括证件正面图像和至少两个证件侧面图像;
所述对所述原始证件图像进行色差校验,获取色差校验结果,包括:
对所述原始证件图像进行空间转换,获取每一所述原始证件图像对应的图像参数,所述图像参数包括色调、饱和度和亮度;
基于每一所述原始证件图像对应的色调、饱和度和亮度,采用色差公式计算每一所述证件侧面图像和所述证件正面图像之间的图像色差;所述色差公式为1为正面图像,2为侧面图像,D为正面图像和侧面图像的色差,i1为正面图像的亮度,i2为侧面图像的亮度,s1为正面图像的饱和度,s2为侧面图像的饱和度,h1为正面图像的色调,h2为侧面图像的色调;
将每一所述图像色差和与所述证件类型对应的色差阈值进行比较,若所述图像色差大于或等于所述色差阈值,则所述色差校验结果为校验通过。
6.如权利要求5所述的证件真伪验证方法,其特征在于,所述对所述原始证件图像进行空间转换,获取每一所述原始证件图像对应的图像参数,包括:
判断所述原始证件图像是否为RGB颜色空间图像;
若所述原始证件图像为RGB颜色空间图像,则获取RGB颜色空间的颜色值,所述颜色值包括红色分量强度、绿色分量强度和蓝色分量强度;
若所述原始证件图像不为RGB颜色空间图像,则将所述原始证件图像转换为RGB颜色空间图像,获取RGB颜色空间的颜色值;
通过几何推导法将所述RGB颜色空间的颜色值转换为HSI颜色空间的图像值,将HSI颜色空间的所述图像值作为与所述原始证件图像对应的图像参数。
7.如权利要求6所述的证件真伪验证方法,其特征在于,所述图像值包括亮度、饱和度和色调;
所述通过几何推导法将所述RGB颜色空间的颜色值转换为HSI颜色空间的图像值,包括:
基于所述红色分量强度、所述绿色分量强度和所述蓝色分量强度,根据亮度公式获取HSI颜色空间的亮度,所述亮度公式为r为红色分量强度,g为绿色分量强度,b为蓝色分量强度,i为亮度。
基于所述红色分量强度、所述绿色分量强度和所述蓝色分量强度,根据饱和度公式获取HSI颜色空间的饱和度,所述饱和度公式为s为饱和度,min(r,g,b)为红色分量强度、绿色分量强度和蓝色分量强度中的最小值;
基于所述红色分量强度、所述绿色分量强度和所述蓝色分量强度,根据色调公式获取HSI颜色空间的色调,所述色调公式为 h为色调。
8.一种证件真伪验证装置,其特征在于,包括:
图像获取模块,用于获取原始证件图像,所述原始证件图像对应一证件类型;
区域块图像获取模块,用于采用CTPN-RNN算法对所述原始证件图像进行定位,获取至少一个文本行区域,从所述原始证件图像中截取所述文本行区域对应的图像作为区域块图像,并获取每一所述区域块图像对应的位置标识;
目标文字获取模块,用于采用OCR识别模型对每一所述区域块图像进行识别,获取与每一所述区域块图像对应的目标文字;
第一校验模块,用于基于所述证件类型和每一所述区域块图像对应的位置标识,获取对应的内容校验规则,采用所述内容校验规则对每一所述区域块图像对应的目标文字进行内容校验,获取内容校验结果;
第二校验模块,用于将每一所述区域块图像对应的目标文字和与所述证件类型对应的数据库中的标准文字进行校验,获取数据校验结果;
第三校验模块,用于对所述原始证件图像进行色差校验,获取色差校验结果;
结果确定模块,用于若所述内容校验结果、所述数据校验结果和所述色差校验结果均为校验通过时,所述原始证件图像对应的证件为真证件。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述证件真伪验证方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述证件真伪验证方法的步骤。
CN201811106159.6A 2018-09-21 2018-09-21 证件真伪验证方法、装置、计算机设备及存储介质 Pending CN109446900A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811106159.6A CN109446900A (zh) 2018-09-21 2018-09-21 证件真伪验证方法、装置、计算机设备及存储介质
ZA2019/04157A ZA201904157B (en) 2018-09-21 2019-06-26 Certificate verifying method, device, computer device and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811106159.6A CN109446900A (zh) 2018-09-21 2018-09-21 证件真伪验证方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN109446900A true CN109446900A (zh) 2019-03-08

Family

ID=65530825

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811106159.6A Pending CN109446900A (zh) 2018-09-21 2018-09-21 证件真伪验证方法、装置、计算机设备及存储介质

Country Status (2)

Country Link
CN (1) CN109446900A (zh)
ZA (1) ZA201904157B (zh)

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110110726A (zh) * 2019-05-15 2019-08-09 深圳供电局有限公司 电力设备铭牌识别方法、装置、计算机设备和存储介质
CN110135288A (zh) * 2019-04-28 2019-08-16 佛山科学技术学院 一种电子证照的快速核对方法及装置
CN110210872A (zh) * 2019-05-07 2019-09-06 上海上湖信息技术有限公司 证件真伪鉴定方法、装置以及计算机可读存储介质
CN110223398A (zh) * 2019-06-12 2019-09-10 浙江机电职业技术学院 一种地铁自动售检票系统及方法
CN110245616A (zh) * 2019-06-17 2019-09-17 深圳市安络科技有限公司 一种虚假通缉令预警方法及装置
CN110287971A (zh) * 2019-05-22 2019-09-27 平安银行股份有限公司 数据验证方法、装置、计算机设备及存储介质
CN110347691A (zh) * 2019-05-29 2019-10-18 平安科技(深圳)有限公司 证件类型校验方法、装置、计算机设备及存储介质
CN110443237A (zh) * 2019-08-06 2019-11-12 北京旷视科技有限公司 证件识别方法、装置、电子设备及计算机可读存储介质
CN110458238A (zh) * 2019-08-02 2019-11-15 南通使爱智能科技有限公司 一种证件圆弧点检测和定位的方法及系统
CN110570209A (zh) * 2019-07-30 2019-12-13 平安科技(深圳)有限公司 证件真伪验证方法、装置、计算机设备及存储介质
CN110751041A (zh) * 2019-09-19 2020-02-04 平安科技(深圳)有限公司 证件真伪验证方法、系统、计算机设备及可读存储介质
CN111046899A (zh) * 2019-10-09 2020-04-21 京东数字科技控股有限公司 身份证真伪识别方法、装置、设备及存储介质
CN111243159A (zh) * 2020-01-20 2020-06-05 支付宝实验室(新加坡)有限公司 伪造证件的识别方法、装置及电子设备
CN111709413A (zh) * 2020-06-22 2020-09-25 中国平安财产保险股份有限公司 基于图像识别的证件验证方法、装置、计算机设备和介质
CN111881810A (zh) * 2020-07-23 2020-11-03 前海人寿保险股份有限公司 基于ocr的证件识别方法、装置、终端和存储介质
CN112132812A (zh) * 2020-09-24 2020-12-25 平安科技(深圳)有限公司 证件校验方法、装置、电子设备及介质
CN112507889A (zh) * 2019-04-29 2021-03-16 众安信息技术服务有限公司 一种校验证件与持证人的方法及系统
US10970533B2 (en) 2019-07-02 2021-04-06 International Business Machines Corporation Methods and systems for finding elements in optical character recognition documents
CN113128504A (zh) * 2021-04-25 2021-07-16 福州符号信息科技有限公司 一种基于校验规则的ocr识别结果纠错方法、设备
CN110163193B (zh) * 2019-03-25 2021-08-06 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机可读存储介质和计算机设备
CN113407748A (zh) * 2021-05-11 2021-09-17 银雁科技服务集团股份有限公司 重要空白凭证管理方法及装置
CN113434912A (zh) * 2021-08-24 2021-09-24 共道网络科技有限公司 一种材料合规性校验方法及装置
CN113837026A (zh) * 2021-09-03 2021-12-24 支付宝(杭州)信息技术有限公司 检测证件真伪的方法及装置
WO2022089196A1 (zh) * 2020-10-27 2022-05-05 北京字节跳动网络技术有限公司 一种图像处理方法、装置、电子设备及存储介质
WO2022089124A1 (zh) * 2020-10-29 2022-05-05 腾讯科技(深圳)有限公司 证照真伪识别方法、装置、计算机可读介质及电子设备
CN115375998A (zh) * 2022-10-24 2022-11-22 成都新希望金融信息有限公司 一种证件识别方法、装置、电子设备及存储介质
CN116580409A (zh) * 2023-07-14 2023-08-11 深圳市明泰智能技术有限公司 一种证件的自动识别方法、系统和终端

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103426016A (zh) * 2013-08-14 2013-12-04 湖北微模式科技发展有限公司 一种第二代身份证真伪鉴别方法与装置
CN106529592A (zh) * 2016-11-07 2017-03-22 湖南源信光电科技有限公司 一种基于混合特征与灰度投影的车牌识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103426016A (zh) * 2013-08-14 2013-12-04 湖北微模式科技发展有限公司 一种第二代身份证真伪鉴别方法与装置
CN106529592A (zh) * 2016-11-07 2017-03-22 湖南源信光电科技有限公司 一种基于混合特征与灰度投影的车牌识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
"深度学习CTPN+CRNN模型实现图片内文字的定位与识别(OCR)", pages 1, Retrieved from the Internet <URL:https://cloud.tencent.com/developer/article/1061781?areaSource=102001.4&traceId=IJ_WJ1CgxwXDqNlRHt1xp> *
太原市城南公证处: "【公证知识】"五证"真伪识别技巧,很实用!", Retrieved from the Internet <URL:https://mp.weixin.qq.com/s?__biz=MzA5NjAwNzg2NA==&mid=2661123860&idx=2&sn=ee368a8183debe177bf6e7872714ba8d&chksm=8bdf84c3bca80dd50823c3dd4807d14ad521aad6b73421e9a0023e1d119b0fcf8257b7765a7b&scene=27> *
梁艳;潘保昌;郑胜林;: "区域方向直方图及在鉴别身份证真伪中的应用", 计算机工程与设计, no. 12 *
洪雅敏;: "面向二代身份证的图文识别", 兰州工业学院学报, no. 06 *

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110163193B (zh) * 2019-03-25 2021-08-06 腾讯科技(深圳)有限公司 图像处理方法、装置、计算机可读存储介质和计算机设备
CN110135288A (zh) * 2019-04-28 2019-08-16 佛山科学技术学院 一种电子证照的快速核对方法及装置
CN112507889A (zh) * 2019-04-29 2021-03-16 众安信息技术服务有限公司 一种校验证件与持证人的方法及系统
CN110210872A (zh) * 2019-05-07 2019-09-06 上海上湖信息技术有限公司 证件真伪鉴定方法、装置以及计算机可读存储介质
CN110110726A (zh) * 2019-05-15 2019-08-09 深圳供电局有限公司 电力设备铭牌识别方法、装置、计算机设备和存储介质
CN110287971A (zh) * 2019-05-22 2019-09-27 平安银行股份有限公司 数据验证方法、装置、计算机设备及存储介质
CN110287971B (zh) * 2019-05-22 2023-11-14 平安银行股份有限公司 数据验证方法、装置、计算机设备及存储介质
CN110347691A (zh) * 2019-05-29 2019-10-18 平安科技(深圳)有限公司 证件类型校验方法、装置、计算机设备及存储介质
CN110347691B (zh) * 2019-05-29 2023-10-31 平安科技(深圳)有限公司 证件类型校验方法、装置、计算机设备及存储介质
CN110223398A (zh) * 2019-06-12 2019-09-10 浙江机电职业技术学院 一种地铁自动售检票系统及方法
CN110245616A (zh) * 2019-06-17 2019-09-17 深圳市安络科技有限公司 一种虚假通缉令预警方法及装置
US10970533B2 (en) 2019-07-02 2021-04-06 International Business Machines Corporation Methods and systems for finding elements in optical character recognition documents
CN110570209A (zh) * 2019-07-30 2019-12-13 平安科技(深圳)有限公司 证件真伪验证方法、装置、计算机设备及存储介质
CN110458238A (zh) * 2019-08-02 2019-11-15 南通使爱智能科技有限公司 一种证件圆弧点检测和定位的方法及系统
CN110443237A (zh) * 2019-08-06 2019-11-12 北京旷视科技有限公司 证件识别方法、装置、电子设备及计算机可读存储介质
WO2021051554A1 (zh) * 2019-09-19 2021-03-25 平安科技(深圳)有限公司 证件真伪验证方法、系统、计算机设备及可读存储介质
CN110751041A (zh) * 2019-09-19 2020-02-04 平安科技(深圳)有限公司 证件真伪验证方法、系统、计算机设备及可读存储介质
CN111046899A (zh) * 2019-10-09 2020-04-21 京东数字科技控股有限公司 身份证真伪识别方法、装置、设备及存储介质
CN111046899B (zh) * 2019-10-09 2023-12-08 京东科技控股股份有限公司 身份证真伪识别方法、装置、设备及存储介质
CN111243159A (zh) * 2020-01-20 2020-06-05 支付宝实验室(新加坡)有限公司 伪造证件的识别方法、装置及电子设备
CN111709413A (zh) * 2020-06-22 2020-09-25 中国平安财产保险股份有限公司 基于图像识别的证件验证方法、装置、计算机设备和介质
CN111881810A (zh) * 2020-07-23 2020-11-03 前海人寿保险股份有限公司 基于ocr的证件识别方法、装置、终端和存储介质
CN111881810B (zh) * 2020-07-23 2024-03-29 前海人寿保险股份有限公司 基于ocr的证件识别方法、装置、终端和存储介质
CN112132812B (zh) * 2020-09-24 2023-06-30 平安科技(深圳)有限公司 证件校验方法、装置、电子设备及介质
CN112132812A (zh) * 2020-09-24 2020-12-25 平安科技(深圳)有限公司 证件校验方法、装置、电子设备及介质
WO2022089196A1 (zh) * 2020-10-27 2022-05-05 北京字节跳动网络技术有限公司 一种图像处理方法、装置、电子设备及存储介质
WO2022089124A1 (zh) * 2020-10-29 2022-05-05 腾讯科技(深圳)有限公司 证照真伪识别方法、装置、计算机可读介质及电子设备
CN113128504B (zh) * 2021-04-25 2023-06-20 福州符号信息科技有限公司 一种基于校验规则的ocr识别结果纠错方法、设备
CN113128504A (zh) * 2021-04-25 2021-07-16 福州符号信息科技有限公司 一种基于校验规则的ocr识别结果纠错方法、设备
CN113407748A (zh) * 2021-05-11 2021-09-17 银雁科技服务集团股份有限公司 重要空白凭证管理方法及装置
CN113434912A (zh) * 2021-08-24 2021-09-24 共道网络科技有限公司 一种材料合规性校验方法及装置
CN113837026A (zh) * 2021-09-03 2021-12-24 支付宝(杭州)信息技术有限公司 检测证件真伪的方法及装置
CN113837026B (zh) * 2021-09-03 2023-11-07 支付宝(杭州)信息技术有限公司 检测证件真伪的方法及装置
CN115375998A (zh) * 2022-10-24 2022-11-22 成都新希望金融信息有限公司 一种证件识别方法、装置、电子设备及存储介质
CN116580409A (zh) * 2023-07-14 2023-08-11 深圳市明泰智能技术有限公司 一种证件的自动识别方法、系统和终端
CN116580409B (zh) * 2023-07-14 2023-09-19 深圳市明泰智能技术有限公司 一种证件的自动识别方法、系统和终端

Also Published As

Publication number Publication date
ZA201904157B (en) 2021-03-31

Similar Documents

Publication Publication Date Title
CN109446900A (zh) 证件真伪验证方法、装置、计算机设备及存储介质
CN108345880A (zh) 发票识别方法、装置、计算机设备和存储介质
CN109492643A (zh) 基于ocr的证件识别方法、装置、计算机设备及存储介质
CN108388905B (zh) 一种基于卷积神经网络和邻域上下文的光源估计方法
CN110472623A (zh) 图像检测方法、设备以及系统
CN109858435A (zh) 一种基于脸部图像的小熊猫个体识别方法
CN108681692A (zh) 一种基于深度学习的遥感图像内新增建筑识别方法
Berezhnoy et al. Computer analysis of van Gogh’s complementary colours
CN109325989A (zh) 车牌图像生成方法、装置、设备及介质
CN110502986A (zh) 识别图像中人物位置方法、装置、计算机设备和存储介质
CN111310624A (zh) 遮挡识别方法、装置、计算机设备及存储介质
US11194997B1 (en) Method and system for thermal infrared facial recognition
JP2022532177A (ja) 偽造された顔の認識方法、装置、および非一時的コンピュータ可読記憶媒体
RU2606874C1 (ru) Способ управления устройством формирования среды дополненной реальности
CN109408776A (zh) 一种基于生成式对抗网络的书法字体自动生成算法
CN109993086A (zh) 人脸检测方法、装置、系统及终端设备
CN109740572A (zh) 一种基于局部彩色纹理特征的人脸活体检测方法
CN110135265A (zh) 案件自动审核方法、装置、计算机设备及存储介质
CN110503102A (zh) 车辆识别码检测方法、装置、计算机设备和存储介质
CN112101349A (zh) 一种车牌样本生成方法及装置
CN111626124A (zh) Ocr图像样本生成、印刷体验证方法、装置、设备及介质
CN109086723A (zh) 一种基于迁移学习的人脸检测的方法、装置以及设备
CN108960344A (zh) 文物图像的差异检测方法、装置及终端设备
CN113111806A (zh) 用于目标识别的方法和系统
CN109871845A (zh) 证件图像提取方法及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination