CN111461131A - 身份证号码信息识别方法、装置、设备及存储介质 - Google Patents
身份证号码信息识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111461131A CN111461131A CN202010301489.1A CN202010301489A CN111461131A CN 111461131 A CN111461131 A CN 111461131A CN 202010301489 A CN202010301489 A CN 202010301489A CN 111461131 A CN111461131 A CN 111461131A
- Authority
- CN
- China
- Prior art keywords
- character
- image
- identification
- pixel
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
本发明涉及图像处理领域,公开了一种身份证号码信息识别方法、装置、设备及存储介质,用于解决识别身份证中的身份证号码信息时,识别效率低下的问题。身份证号码信息识别方法包括:获取携带有身份证号码信息的身份证图像;利用预置深度学习模型对身份证图像中的每个初始像素进行灰度化处理,得到初始像素的字节亮度平均值,并根据字节亮度平均值,得到灰度化处理图像;对灰度化处理图像中的每个基础像素进行二值化处理,得到二值化处理图像;利用预置投影统计算法确定二值化处理图像中身份证号码信息的位置区域,生成多个字符图像;采用字符识别算法分别对多个字符图像中对应的多个字符信息进行识别,得到身份证号码的识别信息。
Description
技术领域
本发明涉及图像处理领域,尤其涉及一种身份证号码信息识别方法、装置、设备及存储介质。
背景技术
身份证是用于证明持有人身份的一种法定证件,作为每个人重要的身份证明文件。现如今,身份证的用途非常广泛,例如:购买行程票务、入住酒店登记、出入境登记等,足以见得生活中的许多场景中均需要对身份证进行识别。身份证件具有统一的固定样式,身份证件带有国徽的一面为正面,带有人像的一面为反面,在现有的识别技术中,应用较广泛的方法是采用光学字符识别(optical character recognition,OCR)方法,在不同的应用场景中采用OCR方法对身份证进行识别,提取出相关的信息。
但采用现有的OCR方法对身份证进行识别时,不能根据身份证图像的样式固定特点对身份证号码信息进行定位和识别,因此导致在识别身份证号码信息时,识别效率低下。
发明内容
本发明的主要目的在于解决识别身份证中的身份证号码信息时,识别效率低下的问题。
本发明第一方面提供了一种身份证号码信息识别方法,包括:获取携带有身份证号码信息的身份证图像;利用预置深度学习模型对所述身份证图像中的每个初始像素进行灰度化处理,得到初始像素的字节亮度平均值,并根据所述字节亮度平均值,得到灰度化处理图像;对所述灰度化处理图像中的每个基础像素进行二值化处理,得到基础像素的分类阈值,并利用所述分类阈值对所述灰度化处理图像进行分类,得到二值化处理图像;利用预置投影统计算法确定所述二值化处理图像中所述身份证号码信息的位置区域,生成多个字符图像,其中,所述字符图像用于显示所述身份证号码信息的字符信息;采用字符识别算法分别对所述多个字符图像中对应的多个字符信息进行识别,得到身份证号码的识别信息。
可选的,在本发明第一方面的第一种实现方式中,所述利用预置深度学习模型对所述身份证图像中的每个初始像素进行灰度化处理,得到初始像素的字节亮度平均值,并根据所述字节亮度平均值,得到灰度化处理图像包括:利用预置深度学习模型获取所述身份证图像中的多个初始像素;分别提取所述多个初始像素对应的多个字节亮度分量,并计算多个字节亮度分量中每个字节亮度分量的平均值,得到多个字节亮度平均值;将所述多个字节亮度平均值中的每个字节亮度平均值确定为对应初始像素的像素值,得到灰度化处理图像。
可选的,在本发明第一方面的第二种实现方式中,所述对所述灰度化处理图像中的每个基础像素进行二值化处理,得到基础像素的分类阈值,并利用所述分类阈值对所述灰度化处理图像进行分类,得到二值化处理图像包括:获取所述灰度化处理图像中的多个基础像素的像素数据,得到多个基础像素值;通过所述多个基础像素值的数值大小,分别确定每个基础像素值对应所属的一个预置像素取值区间;统计每个预置像素取值区间内基础像素值的数量,得到多个基础像素值的数量,每个预置像素取值区间对应一个基础像素值的数量;对所述多个基础像素值的数量进行归一化处理,得到多个归一化像素值的数量;利用多个归一化像素值的数量以及所述多个基础像素值计算分类阈值,并按照所述分类阈值对所述灰度化处理图像中的多个基础像素进行分类,得到二值化处理图像。
可选的,在本发明第一方面的第三种实现方式中,所述利用预置投影统计算法确定所述二值化处理图像中所述身份证号码信息的位置区域,生成多个字符图像,其中,所述字符图像用于显示所述身份证号码信息的字符信息包括:利用预置投影统计算法对所述二值化处理图像进行水平投影,得到水平投影图像,分别获取所述水平图像中多行二值化像素,并获取每行二值化像素中的每个二值化像素的值,得到多个横向像素值;查询所述多个横向像素值为0的多个横向像素值,统计每行二值化像素中对应横向像素值的数量,得到各行横向像素值的数量;根据各行横向像素值的数量建立第一坐标系,其中,所述第一坐标系的X轴表示水平投影图像中多行二值化像素的行数,所述第一坐标系的Y轴表示水平投影图像中各行横向像素值的数量;在所述第一坐标系中,选取二值化像素的行数在预置行数范围内的多行二值化像素,确定身份证号码信息区域,并生成携带有所述身份证号码信息区域的候选字符图像;在所述候选字符图像中确定所述身份证号码信息区域内多个字符信息区域中的每个字符信息区域,并根据每个字符信息区域生成对应的字符图像,得到多个字符图像。
可选的,在本发明第一方面的第四种实现方式中,所述在所述候选字符图像中确定所述身份证号码信息区域内多个字符信息区域中的每个字符信息区域,并根据每个字符信息区域生成对应的字符图像,得到多个字符图像包括:对所述候选字符图像进行垂直投影,得到垂直投影图像,分别获取所述垂直投影图像中多列二值化像素,并获取每列二值化像素中的每个二值化像素的值,得到多个纵向像素值;查询所述多个纵向像素值为0的多个纵向像素值,统计每列二值化像素中对应纵向像素值的数量,得到各列纵向像素值的数量;根据所述各列纵向像素值的数量建立第二坐标系,其中,所述第二坐标系的X轴表示垂直投影图像中多列二值化像素的列数,所述第二坐标系的Y轴表示垂直投影图像中各列纵向像素值的数量;在所述第二坐标系中,选取所述各列纵向像素值的数量为0所对应的列数,得到多个待选列数值,在所述多个待选列数值中选取相邻一列纵向像素值数量不为0的待选列数值,得到多个目标列数值;将所述多个目标列数值确定为所述垂直投影图像的多个切割点,通过所述多个切割点切割所述垂直投影图像,确定身份证号码信息中多个字符信息区域,并生成携带有所述多个字符信息区域的多个字符图像。
可选的,在本发明第一方面的第五种实现方式中,所述采用字符识别算法分别对所述多个字符图像中对应的多个字符信息进行识别,得到身份证号码的识别信息包括:采用字符识别算法检测所述多个字符图像中任意一个字符图像内的字符信息区域,得到待检测字符文本框;在所述待检测字符文本框内提取待检测字符特征,并计算所述待检测字符特征与多个预置字符特征之间的多个基础相似度,其中,所述预置字符特征为提前设置在字典特征库中的字符特征;在所述多个基础相似度中,将基础相似度的数值大于标准阈值的基础相似度确定为目标相似度,并确定所述目标相似度对应的待检测字符特征为预置字符特征,得到待整合字符识别信息;获取所述多个字符图像中其他字符图像内的字符信息区域,得到其他待检测字符文本框,并通过所述其他待检测字符文本框确定其他待整合字符识别信息;整合所述待整合字符识别信息与所述其他待整合字符识别信息,得到身份证号码的识别信息。
本发明第二方面提供了一种身份证号码信息识别装置,包括:获取模块,用于获取携带有身份证号码信息的身份证图像;灰度化模块,用于利用预置深度学习模型对所述身份证图像中的每个初始像素进行灰度化处理,得到初始像素的字节亮度平均值,并根据所述字节亮度平均值,得到灰度化处理图像;二值化模块,用于对所述灰度化处理图像中的每个基础像素进行二值化处理,得到基础像素的分类阈值,并利用所述分类阈值对所述灰度化处理图像进行分类,得到二值化处理图像;投影模块,用于利用预置投影统计算法确定所述二值化处理图像中所述身份证号码信息的位置区域,生成多个字符图像,其中,所述字符图像用于显示所述身份证号码信息的字符信息;识别模块,用于采用字符识别算法分别对所述多个字符图像中对应的多个字符信息进行识别,得到身份证号码的识别信息。
可选的,在本发明第二方面的第一种实现方式中,所述灰度化模块具体用于:利用预置深度学习模型获取所述身份证图像中的多个初始像素;分别提取所述多个初始像素对应的多个字节亮度分量,并计算多个字节亮度分量中每个字节亮度分量的平均值,得到多个字节亮度平均值;将所述多个字节亮度平均值中的每个字节亮度平均值确定为对应初始像素的像素值,得到灰度化处理图像。
可选的,在本发明第二方面的第二种实现方式中,所述二值化模块具体用于:获取所述灰度化处理图像中的多个基础像素的像素数据,得到多个基础像素值;通过所述多个基础像素值的数值大小,分别确定每个基础像素值对应所属的一个预置像素取值区间;统计每个预置像素取值区间内基础像素值的数量,得到多个基础像素值的数量,每个预置像素取值区间对应一个基础像素值的数量;对所述多个基础像素值的数量进行归一化处理,得到多个归一化像素值的数量;利用多个归一化像素值的数量以及所述多个基础像素值计算分类阈值,并按照所述分类阈值对所述灰度化处理图像中的多个基础像素进行分类,得到二值化处理图像。
可选的,在本发明第二方面的第三种实现方式中,所述投影模块包括:投影及获取单元,用于利用预置投影统计算法对所述二值化处理图像进行水平投影,得到水平投影图像,分别获取所述水平图像中多行二值化像素,并获取每行二值化像素中的每个二值化像素的值,得到多个横向像素值;查询及统计单元,用于查询所述多个横向像素值为0的多个横向像素值,统计每行二值化像素中对应横向像素值的数量,得到各行横向像素值的数量;建立单元,用于根据各行横向像素值的数量建立第一坐标系,其中,所述第一坐标系的X轴表示水平投影图像中多行二值化像素的行数,所述第一坐标系的Y轴表示水平投影图像中各行横向像素值的数量;选取及确定单元,用于在所述第一坐标系中,选取二值化像素的行数在预置行数范围内的多行二值化像素,确定身份证号码信息区域,并生成携带有所述身份证号码信息区域的候选字符图像;确定及生成单元,用于在所述候选字符图像中确定所述身份证号码信息区域内多个字符信息区域中的每个字符信息区域,并根据每个字符信息区域生成对应的字符图像,得到多个字符图像。
可选的,在本发明第二方面的第四种实现方式中,所述确定及生成单元具体用于:对所述候选字符图像进行垂直投影,得到垂直投影图像,分别获取所述垂直投影图像中多列二值化像素,并获取每列二值化像素中的每个二值化像素的值,得到多个纵向像素值;查询所述多个纵向像素值为0的多个纵向像素值,统计每列二值化像素中对应纵向像素值的数量,得到各列纵向像素值的数量;根据所述各列纵向像素值的数量建立第二坐标系,其中,所述第二坐标系的X轴表示垂直投影图像中多列二值化像素的列数,所述第二坐标系的Y轴表示垂直投影图像中各列纵向像素值的数量;在所述第二坐标系中,选取所述各列纵向像素值的数量为0所对应的列数,得到多个待选列数值,在所述多个待选列数值中选取相邻一列纵向像素值数量不为0的待选列数值,得到多个目标列数值;将所述多个目标列数值确定为所述垂直投影图像的多个切割点,通过所述多个切割点切割所述垂直投影图像,确定身份证号码信息中多个字符信息区域,并生成携带有所述多个字符信息区域的多个字符图像。
可选的,在本发明第二方面的第五种实现方式中,所述识别模块具体用于:采用字符识别算法检测所述多个字符图像中任意一个字符图像内的字符信息区域,得到待检测字符文本框;在所述待检测字符文本框内提取待检测字符特征,并计算所述待检测字符特征与多个预置字符特征之间的多个基础相似度,其中,所述预置字符特征为提前设置在字典特征库中的字符特征;在所述多个基础相似度中,将基础相似度的数值大于标准阈值的基础相似度确定为目标相似度,并确定所述目标相似度对应的待检测字符特征为预置字符特征,得到待整合字符识别信息;获取所述多个字符图像中其他字符图像内的字符信息区域,得到其他待检测字符文本框,并通过所述其他待检测字符文本框确定其他待整合字符识别信息;整合所述待整合字符识别信息与所述其他待整合字符识别信息,得到身份证号码的识别信息。
本发明第三方面提供了一种身份证号码信息识别设备,包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;所述至少一个处理器调用所述存储器中的所述指令,以使得所述身份证号码信息识别设备执行上述的身份证号码信息识别方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的身份证号码信息识别方法。
本发明提供的技术方案中,获取携带有身份证号码信息的身份证图像;利用预置深度学习模型对所述身份证图像中的每个初始像素进行灰度化处理,得到初始像素的字节亮度平均值,并根据所述字节亮度平均值,得到灰度化处理图像;对所述灰度化处理图像中的每个基础像素进行二值化处理,得到基础像素的分类阈值,并利用所述分类阈值对所述灰度化处理图像进行分类,得到二值化处理图像;利用预置投影统计算法确定所述二值化处理图像中所述身份证号码信息的位置区域,生成多个字符图像,其中,所述字符图像用于显示所述身份证号码信息的字符信息;采用字符识别算法分别对所述多个字符图像中对应的多个字符信息进行识别,得到身份证号码的识别信息。本发明实施例中,利用预置深度学习模型对携带有身份证号码信息的身份证图像依次进行灰度化处理、二值化处理及投影处理,确定身份证号码信息的位置区域,然后再在身份证号码信息区域内进行身份证号码信息的识别,得到身份证号码的识别信息,提高了身份证号码信息的识别效率。
附图说明
图1为本发明实施例中身份证号码信息识别方法的一个实施例示意图;
图2为本发明实施例中身份证号码信息识别方法的另一个实施例示意图;
图3为本发明实施例中身份证号码信息识别装置的一个实施例示意图;
图4为本发明实施例中身份证号码信息识别装置的另一个实施例示意图;
图5为本发明实施例中身份证号码信息识别设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种身份证号码信息识别方法、装置、设备及存储介质,利用预置深度学习模型对携带有身份证号码信息的身份证图像依次进行灰度化处理、二值化处理及投影处理,确定身份证号码信息的位置区域,然后再在身份证号码信息区域内进行身份证号码信息的识别,得到身份证号码的识别信息,提高了身份证号码信息的识别效率。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中身份证号码信息识别方法的一个实施例包括:
101、获取携带有身份证号码信息的身份证图像;
可以理解的是,本发明的执行主体可以为身份证号码信息识别装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
服务器在获取身份证号码信息时,首先需要获取用于显示身份证号码信息的身份证图像,这里的身份证图像的格式可以为BMP格式、JPEG格式、TIFF格式、SVG格式、PNG格式、PSD格式等,在本申请中并不对身份证图像的格式进行限定。此外,本申请也不对身份证图像的分辨率进行限定,一般的,身份证图像的分辨率为320×448PPI或480×640PPI。
可以理解的是,身份证图像中显示的是身份证的反面信息,即带有人像一面的身份证图像,该面图像上携带的字符信息包括:持有人的姓名、性别、民族、出生日期、常住户口所在地住址、公民身份号码以及持有人相片,因此识别身份证图像中的身份证号码信息时,首先需要确定身份证号码信息的位置区域。
102、利用预置深度学习模型对身份证图像中的每个初始像素进行灰度化处理,得到初始像素的字节亮度平均值,并根据字节亮度平均值,得到灰度化处理图像;
服务器在确定身份证号码信息的位置之前,先要对身份证图像进行预处理,以便进行后续的识别操作。服务器进行预处理的第一步就是对身份证图像灰度化。灰度化处理就是将一幅色彩图像转化为灰度图像的过程,已知彩色图像分为R、G、B三个分量,分别对应显示红绿蓝三种颜色,灰度化就是使彩色的R、G、B分量相等的过程,其中,灰度值大的像素点比较亮,其像素值最大为255,显示为白色,灰度值小的像素点比较暗,其像素值最小为0,显示为黑色。服务器将身份证图像进行灰度化后,得到灰度化处理图像,其中灰度化处理图像中的每个像素中的R、G、B的分量值均相同。
103、对灰度化处理图像中的每个基础像素进行二值化处理,得到基础像素的分类阈值,并利用分类阈值对灰度化处理图像进行分类,得到二值化处理图像;
服务器在对身份证图像进行灰度化处理之后,得到灰度化处理图像,为了更好的分析身份证图像中的信息,服务器需要对灰度化处理图像进行二值化处理。一幅图像中包括目标物体、背景以及噪声,二值化处理的目的就是计算出一个阈值,利用该阈值将图像中的数据分成两部分,第一部分为像素值大于或等于该阈值的像素群,第二部分为像素值小于该阈值的像素群,从而在图像中提取出目标物体。本申请中利用二值化处理将灰度化处理图像中的身份证的信息与身份证背景分离。
需要说明的是,这里的基础像素指的是构成灰度化处理图像的每一个像素,在步骤102中的初始像素指的是构成身份证图像的每一个像素,而灰度化处理图像是由身份证图像经过灰度化处理得来的,因此这里的基础像素相当于初始像素经过灰度化处理得来的。
104、利用预置投影统计算法确定二值化处理图像中身份证号码信息的位置区域,生成多个字符图像,其中,字符图像用于显示身份证号码信息的字符信息;
服务器在得到身份证字符信息与身份证背景信息分离后的二值化处理图像后,就需要获取二值化处理图像中身份证号码信息的位置区域,从而进一步对身份证号码信息进行识别,进而提高识别效率。这里采用的是预置投影统计算法确定身份证号码信息的位置区域,投影统计算法利用的原理是在某个方向上对目标图像进行像素点数值的累加,通过像素点数值的浮动特点确定目标区域。在本申请中,分别对二值化处理图像采用水平投影与垂直投影,通过水平投影和垂直投影得到的像素点直方图通常会出现周期性尖峰的特性,若是将文字进行投影,则文字的行与行之间或列与列之间通常会出现明显的空白区,空白区在像素点直方图中对应的显示数值为零,因此,通过空白区的区域所在位置进而确定文字与文字之间的距离,从而对文字的位置区域进行提取。
105、采用字符识别算法分别对多个字符图像中对应的多个字符信息进行识别,得到身份证号码的识别信息。
服务器得到切分后的多个字符图像后,分别对字符图像中的字符进行字符识别,字符识别算法的识别原理为:服务器首先提取统计字符特征或字符结构特征,然后服务器在将多个特征与预置字符特征进行特征匹配,其中,特征匹配是从已有的特征库中找到与待识别字符特征相似度最高的预置字符特征的过程,也就是说,当服务器提取到字符特征之后,不管是统计特征还是结构特征,均需要与一个特征库中的预置字符特征进行比对,特征库中应包含欲识别字符集中所有字符的特征。在本申请中,利用特征识别与特征匹配的方法对多个字符图像中的身份证号码的字符信息进行字符识别,进而得到最终的身份证号码的识别信息。
本发明实施例中,利用预置深度学习模型对携带有身份证号码信息的身份证图像依次进行灰度化处理、二值化处理及投影处理,确定身份证号码信息的位置区域,然后再在身份证号码信息区域内进行身份证号码信息的识别,得到身份证号码的识别信息,提高了身份证号码信息的识别效率。
请参阅图2,本发明实施例中身份证号码信息识别方法的另一个实施例包括:
201、获取携带有身份证号码信息的身份证图像;
服务器在获取身份证号码信息时,首先需要获取用于显示身份证号码信息的身份证图像,这里的身份证图像的格式可以为BMP格式、JPEG格式、TIFF格式、SVG格式、PNG格式、PSD格式等,在本申请中并不对身份证图像的格式进行限定。此外,本申请也不对身份证图像的分辨率进行限定,一般的,身份证图像的分辨率为320×448PPI或480×640PPI。
可以理解的是,身份证图像中显示的是身份证的反面信息,即带有人像一面的身份证图像,该面图像上携带的字符信息包括:持有人的姓名、性别、民族、出生日期、常住户口所在地住址、公民身份号码以及持有人相片,因此识别身份证图像中的身份证号码信息时,首先需要确定身份证号码信息的位置区域。
202、利用预置深度学习模型获取身份证图像中的多个初始像素;
服务器在确定身份证号码信息的位置之前,先要对身份证图像进行预处理,第一步就是对身份证图像灰度化。对身份证图像进行灰度化处理的第一步就是要获取身份证图像中的每个像素以及每个像素对应的像素值。服务器通过扫描身份证图像获取到身份证图像中的每一个初始像素,通过每一个初始像素的坐标获取到该初始像素对应的像素值。
203、分别提取多个初始像素对应的多个字节亮度分量,并计算多个字节亮度分量中每个字节亮度分量的平均值,得到多个字节亮度平均值;
服务器在获取身份证图像中的多个初始像素后,分别提取多个初始像素对应的多个字节亮度分量,这里的字节亮度分量是由R、G、B三个分量表示的,说明每个初始像素显示出来的颜色是由R、G、B三个颜色分量构成的,其中,每个初始像素的字节亮度分量可以相同亦可以不同。本申请中采用灰度化处理身份证图像的原理是分别取每个初始像素中R、G、B三个颜色分量,计算每个初始像素中R、G、B三个颜色分量的平均值,并将该平均值作为对应灰度化处理身份证图像之后初始像素的像素值。
204、将多个字节亮度平均值中的每个字节亮度平均值确定为对应初始像素的像素值,得到灰度化处理图像;
服务器计算身份证图像中所有初始像素的字节亮度平均值后,将字节亮度平均值作为对应初始像素的像素值,这样,即可完成身份证图像的灰度化处理。
例如,已知身份证图像某块区域的某个初始像素,该初始像素的字节亮度分量分别为R:123,G:58,B:179,计算字节亮度分量的平均值为120,也就是说字节亮度平均值为120,将字节亮度平均值作为该初始像素的像素值,即可得到灰度化处理后该初始像素的像素值。对身份证图像中的每个初始像素均进行字节亮度平均值的计算,以完成身份证图像的灰度化处理。
205、对灰度化处理图像中的每个基础像素进行二值化处理,得到基础像素的分类阈值,并利用分类阈值对灰度化处理图像进行分类,得到二值化处理图像;
服务器首先获取灰度化处理图像中的多个基础像素的像素数据,得到多个基础像素值;其次服务器通过多个基础像素值的数值大小,分别确定每个基础像素值对应所属的一个预置像素取值区间;服务器统计每个预置像素取值区间内基础像素值的数量,得到多个基础像素值的数量,每个预置像素取值区间对应一个基础像素值的数量;然后服务器对多个基础像素值的数量进行归一化处理,得到多个归一化像素值的数量;服务器利用多个归一化像素值的数量以及多个基础像素值计算分类阈值,并按照分类阈值对灰度化处理图像中的多个基础像素进行分类,得到二值化处理图像。
以二值化处理一幅灰度化处理后的目标图像为例:灰度化处理图像中基础像素值为0-255,共256个级别,将按照相邻两个级别为一个区间单位划分基础像素值,可以得到255个预置像素取值区间。以目标图像中的基础像素值仅为0-4为例,则预置像素取值区间[0,1)、[1,2)、[2,3)、[3,4)、[4,5),已知目标图像中所有基础像素点的基础像素值分别为:0、1、0、2、0、3、4、4、2、3、4、1、0、2、3、4、1、2、3、3,服务器分别统计所有基础像素值属于某一个预置像素取值区间,并分别统计每一个预置像素取值区间内基础像素值的数量,得到对应的基础像素值的数量,由已知的条件统计出每个预置像素取值区间内的基础像素值的数量分别为:4、3、4、5、4,服务器分别对这些基础像素值的数量进行归一化,这里归一化指的是将每个预置像素取值区间内的基础像素值的数量与总像素点的数量相比,将基础像素值限制在0-1之间,由此得到归一化像素值的数量为0.20、0.15、0.20、0.25、0.20。这里服务器设置一个分类阈值i(基础像素值),i∈[0,4]且i为整数,通过基础像素值数量确定具体的分类阈值,服务器需要统计基础像素值为[0,i)的基础像素个数所占所有基础像素个数的比例ω0、统计基础像素值为[0,i)的基础像素的平均基础像素值u0、统计基础像素值为[i,5)的基础像素个数所占所有基础像素个数的比例ω1、统计基础像素值为[i,5)的基础像素的平均基础像素u1以及整幅图像中基础像素的平均基础像素值u2,根据上述的统计值计算方差g,其中g=ω0(u0-u2)2+ω1(u1-u2)2,以i=2为例,可以计算得到:
ω0=7÷20=0.35; u0=(0.2×0+0.15×1)÷7=0.021;
ω1=13÷20=0.65; u1=(0.2×2+0.25×3+0.5×5)÷13=0.108;
u2=(0.2×0+0.15×1+0.2×2+0.25×3+0.2×4)÷20=0.105;由此可以计算得到方差g:g=ω0(u0-u2)2+ω1(u1-u2)2=0.35(0.021-0.105)2+0.65(0.108-0.105)2=0.00706185,最后,服务器分别计算当分类阈值i取不同值的方差g,确定使方差g数值最大所对应的i为分类阈值,基础像素值在[0,i)内的像素为前景像素,基础像素值在[i,5)内的为背景像素,由此将目标图像进行二值化处理,得到二值化处理图像。
206、利用预置投影统计算法确定二值化处理图像中身份证号码信息的位置区域,生成多个字符图像,其中,字符图像用于显示身份证号码信息的字符信息;
服务器首先利用预置投影统计算法对二值化处理图像进行水平投影,得到水平投影图像,分别获取水平图像中多行二值化像素,并获取每行二值化像素中的每个二值化像素的值,得到多个横向像素值;其次服务器查询多个横向像素值为0的多个横向像素值,统计每行二值化像素中对应横向像素值的数量,得到各行横向像素值的数量;然后服务器根据各行横向像素值的数量建立第一坐标系,其中,第一坐标系的X轴表示水平投影图像中多行二值化像素的行数,第一坐标系的Y轴表示水平投影图像中各行横向像素值的数量;服务器在第一坐标系中,选取二值化像素的行数在预置行数范围内的多行二值化像素,确定身份证号码信息区域,并生成携带有身份证号码信息区域的候选字符图像;最后服务器在候选字符图像中确定身份证号码信息区域内多个字符信息区域中的每个字符信息区域,并根据每个字符信息区域生成对应的字符图像,得到多个字符图像。其中:服务器首先对候选字符图像进行垂直投影,得到垂直投影图像,分别获取垂直投影图像中多列二值化像素,并获取每列二值化像素中的每个二值化像素的值,得到多个纵向像素值;其次服务器查询多个纵向像素值为0的多个纵向像素值,统计每列二值化像素中对应纵向像素值的数量,得到各列纵向像素值的数量;然后服务器根据各列纵向像素值的数量建立第二坐标系,其中,第二坐标系的X轴表示垂直投影图像中多列二值化像素的列数,第二坐标系的Y轴表示垂直投影图像中各列纵向像素值的数量;服务器在第二坐标系中,选取各列纵向像素值的数量为0所对应的列数,得到多个待选列数值,在多个待选列数值中选取相邻一列纵向像素值数量不为0的待选列数值,得到多个目标列数值;最后服务器将多个目标列数值确定为垂直投影图像的多个切割点,通过多个切割点切割垂直投影图像,确定身份证号码信息中多个字符信息区域,并生成携带有多个字符信息区域的多个字符图像。
以对身份证图像进行二值化后得到的二值化处理图像进行投影统计为例:已知二值化处理图像有多行多列的二值化像素构成,每个二值化像素有对应的二值化像素值,其中,每个二值化像素的像素值可能相同也可能不相同。服务器首先对二值化处理图像进行水平投影,得到水平投影图像,服务器对二值化处理图像进行水平投影的过程即为统计每行不同二值化像素值的数量的过程,例如:二值化处理图像共有4行二值化像素,每行有10个二值化像素,且二值化像素的像素值的范围为0-4其中,设置像素值为0的显示为黑色,像素值为4的显示为白色,已知第一行的横向像素值依次为1、2、0、0、0、3、4、0、1、3,第二行的横向像素值依次为4、1、1、2、3、4、1、2、3、3,第三行的横向像素值依次为0、1、0、2、0、3、0、0、2、3,第四行的横向像素值依次为1、2、3、1、2、4、3、4、2、3,服务器统计到每行像素值为0的像素数量分别为4、0、5、0,然后服务器建立第一坐标系,其中第一坐标系的X轴表示水平投影图像中二值化像素的行数分别为1、2、3、4,第一坐标系的Y轴表示水平投影图像中每行二值化像素中像素值为0的像素数量分别为4、0、5、0,根据身份证中身份证信息之间的排列位置,即身份证号码信息的上部与下部均无字符,因此将身份证图像进行水平投影后,第一坐标系中出现一个带有峰值的曲线且左右的像素数量分别为0的区域即为身份证号码信息的位置区域,得到候选字符图像,在上面的例子中第三行即为身份证号码信息的位置区域。需要说明的是,因为身份证号码信息是由字符组成,因此其具有一定的宽度,因此,带有峰值的曲线包括多行目标像素值数量不为0的像素对应的取值点,目标像素值数量值的是每行像素值为0的像素数量。
服务器得到候选字符图像后,需要对候选字符图像中多个身份证号码字符信息进行字符分割,将候选字符图像切分成多个字符图像,其中,每个字符图像中有且仅有一个字符。对候选字符图像进行分割的原理与获取身份证号码信息区域位置的原理相似,均是利用投影法对图像进行投影然后建立二维坐标系,通过每行或每列像素值为0的像素数量确定目标区域位置。以对提取到身份证号码信息位置的候选字符图像进行投影统计为例:服务器首先对候选字符图像进行垂直投影,得到垂直投影图像,服务器对候选字符图像进行垂直投影的过程即为统计每列不同二值化像素值的数量的过程,例如:候选字符图像中共有5列二值化像素,每列有10个二值化像素,且二值化像素的像素值的范围为0-4其中,设置像素值为0的显示为黑色,像素值为4的显示为白色,已知第一列的纵向像素值依次为2、3、1、2、3、2、1、3、2、1,第二列的纵向像素值依次为1、2、0、0、0、3、4、0、1、3,第三行的纵向像素值依次为4、1、1、2、3、4、1、2、3、3,第四行的纵向像素值依次为0、1、0、2、0、3、0、0、2、3,第五行的纵向像素值依次为1、2、3、1、2、4、3、4、2、3,服务器统计到每列像素值为0的纵向像素值的数量分别为0、4、0、5、0,然后服务器建立第二坐标系,其中,第二坐标系的X轴表示垂直投影图像中二值化像素的列数分别为1、2、3、4、5,第二坐标系的Y轴表示垂直投影图像中每列二值化像素中每列二值化像素中像素值为0的像素数量分别为0、4、0、5、0,根据身份证号码信息字符之间的排列位置,即每两个相邻字符之间均设有空隙,该空隙中均无字符,因此将候选字符图像进行垂直投影后,第二坐标系中会出现多个带有峰值的曲线,且每相邻两个曲线之间的像素数量为0,这样,即可确定曲线的位置区域为一个字符区域,曲线与第二坐标系X轴的交点为切割点,这里的切割点的特点为:该切割点对应纵向像素值的数量为0,且相邻一列的纵向像素值的数量不为0,需要说明的是,这里的相邻一列可以为左侧相邻的一列也可以为右侧相邻的一列,具体的相邻列数根据具体的情况而定。
207、采用字符识别算法分别对多个字符图像中对应的多个字符信息进行识别,得到身份证号码的识别信息。
服务器首先采用字符识别算法检测多个字符图像中任意一个字符图像内的字符信息区域,得到待检测字符文本框;其次服务器在待检测字符文本框内提取待检测字符特征,并计算待检测字符特征与多个预置字符特征之间的多个基础相似度,其中,预置字符特征为提前设置在字典特征库中的字符特征;然后服务器在多个基础相似度中,将基础相似度的数值大于标准阈值的基础相似度确定为目标相似度,并确定目标相似度对应的待检测字符特征为预置字符特征,得到待整合字符识别信息;服务器获取多个字符图像中其他字符图像内的字符信息区域,得到其他待检测字符文本框,并通过其他待检测字符文本框确定其他待整合字符识别信息;最后服务器整合待整合字符识别信息与其他待整合字符识别信息,得到身份证号码的识别信息。
需要说明的是,这里的标准阈值是判定字符图像中的待检测字符特征与特征库中预置字符特征之间是否相似的临界值,当标准阈值大于待检测字符特征与预置字符特征之间的相似度时,说明待检测字符与预置字符特征相似。此外,标准阈值是经过大量计算出来的一个数值,对于不同的字符特征会有不同的标准阈值,因此在本申请中,并不对标准阈值的数值进行限定。
本发明实施例中,利用预置深度学习模型对携带有身份证号码信息的身份证图像依次进行灰度化处理、二值化处理及投影处理,确定身份证号码信息的位置区域,然后再在身份证号码信息区域内进行身份证号码信息的识别,得到身份证号码的识别信息,提高了身份证号码信息的识别效率。
上面对本发明实施例中身份证号码信息识别方法进行了描述,下面对本发明实施例中身份证号码信息识别装置进行描述,请参阅图3,本发明实施例中身份证号码信息识别装置一个实施例包括:
获取模块301,用于获取携带有身份证号码信息的身份证图像;灰度化模块302,用于利用预置深度学习模型对身份证图像中的每个初始像素进行灰度化处理,得到初始像素的字节亮度平均值,并根据字节亮度平均值,得到灰度化处理图像;二值化模块303,用于对灰度化处理图像中的每个基础像素进行二值化处理,得到基础像素的分类阈值,并利用分类阈值对灰度化处理图像进行分类,得到二值化处理图像;模块304,用于利用预置投影统计算法确定二值化处理图像中身份证号码信息的位置区域,生成多个字符图像,其中,字符图像用于显示身份证号码信息的字符信息;识别模块305,用于采用字符识别算法分别对多个字符图像中对应的多个字符信息进行识别,得到身份证号码的识别信息。
本发明实施例中,利用预置深度学习模型对携带有身份证号码信息的身份证图像依次进行灰度化处理、二值化处理及投影处理,确定身份证号码信息的位置区域,然后再在身份证号码信息区域内进行身份证号码信息的识别,得到身份证号码的识别信息,提高了身份证号码信息的识别效率。
请参阅图4,本发明实施例中身份证号码信息识别装置的另一个实施例包括:
获取模块301,用于获取携带有身份证号码信息的身份证图像;灰度化模块302,用于利用预置深度学习模型对身份证图像中的每个初始像素进行灰度化处理,得到初始像素的字节亮度平均值,并根据字节亮度平均值,得到灰度化处理图像;二值化模块303,用于对灰度化处理图像中的每个基础像素进行二值化处理,得到基础像素的分类阈值,并利用分类阈值对灰度化处理图像进行分类,得到二值化处理图像;投影模块304,用于利用预置投影统计算法确定二值化处理图像中身份证号码信息的位置区域,生成多个字符图像,其中,字符图像用于显示身份证号码信息的字符信息;识别模块305,用于采用字符识别算法分别对多个字符图像中对应的多个字符信息进行识别,得到身份证号码的识别信息。
可选的,灰度化模块302还可以具体用于:
利用预置深度学习模型获取身份证图像中的多个初始像素;分别提取多个初始像素对应的多个字节亮度分量,并计算多个字节亮度分量中每个字节亮度分量的平均值,得到多个字节亮度平均值;将多个字节亮度平均值中的每个字节亮度平均值确定为对应初始像素的像素值,得到灰度化处理图像。
可选的,二值化模块303还可以具体用于:
获取灰度化处理图像中的多个基础像素的像素数据,得到多个基础像素值;通过多个基础像素值的数值大小,分别确定每个基础像素值对应所属的一个预置像素取值区间;统计每个预置像素取值区间内基础像素值的数量,得到多个基础像素值的数量,每个预置像素取值区间对应一个基础像素值的数量;对多个基础像素值的数量进行归一化处理,得到多个归一化像素值的数量;利用多个归一化像素值的数量以及多个基础像素值计算分类阈值,并按照分类阈值对灰度化处理图像中的多个基础像素进行分类,得到二值化处理图像。
可选的,投影模块304包括:
投影及获取单元3041,用于利用预置投影统计算法对二值化处理图像进行水平投影,得到水平投影图像,分别获取水平图像中多行二值化像素,并获取每行二值化像素中的每个二值化像素的值,得到多个横向像素值;查询及统计单元3042,用于查询多个横向像素值为0的多个横向像素值,统计每行二值化像素中对应横向像素值的数量,得到各行横向像素值的数量;建立单元3043,用于根据各行横向像素值的数量建立第一坐标系,其中,第一坐标系的X轴表示水平投影图像中多行二值化像素的行数,第一坐标系的Y轴表示水平投影图像中各行横向像素值的数量;选取及确定单元3044,用于在第一坐标系中,选取二值化像素的行数在预置行数范围内的多行二值化像素,确定身份证号码信息区域,并生成携带有身份证号码信息区域的候选字符图像;确定及生成单元3045,用于在候选字符图像中确定身份证号码信息区域内多个字符信息区域中的每个字符信息区域,并根据每个字符信息区域生成对应的字符图像,得到多个字符图像。
可选的,确定及生成单元3041还可以具体用于:
对候选字符图像进行垂直投影,得到垂直投影图像,分别获取垂直投影图像中多列二值化像素,并获取每列二值化像素中的每个二值化像素的值,得到多个纵向像素值;查询多个纵向像素值为0的多个纵向像素值,统计每列二值化像素中对应纵向像素值的数量,得到各列纵向像素值的数量;根据各列纵向像素值的数量建立第二坐标系,其中,第二坐标系的X轴表示垂直投影图像中多列二值化像素的列数,第二坐标系的Y轴表示垂直投影图像中各列纵向像素值的数量;在第二坐标系中,选取各列纵向像素值的数量为0所对应的列数,得到多个待选列数值,在多个待选列数值中选取相邻一列纵向像素值数量不为0的待选列数值,得到多个目标列数值;将多个目标列数值确定为垂直投影图像的多个切割点,通过多个切割点切割垂直投影图像,确定身份证号码信息中多个字符信息区域,并生成携带有多个字符信息区域的多个字符图像。
可选的,识别模块303还可以具体用于:
采用字符识别算法检测多个字符图像中任意一个字符图像内的字符信息区域,得到待检测字符文本框;在待检测字符文本框内提取待检测字符特征,并计算待检测字符特征与多个预置字符特征之间的多个基础相似度,其中,预置字符特征为提前设置在字典特征库中的字符特征;在多个基础相似度中,将基础相似度的数值大于标准阈值的基础相似度确定为目标相似度,并确定目标相似度对应的待检测字符特征为预置字符特征,得到待整合字符识别信息;获取多个字符图像中其他字符图像内的字符信息区域,得到其他待检测字符文本框,并通过其他待检测字符文本框确定其他待整合字符识别信息;整合待整合字符识别信息与其他待整合字符识别信息,得到身份证号码的识别信息。
本发明实施例中,利用预置深度学习模型对携带有身份证号码信息的身份证图像依次进行灰度化处理、二值化处理及投影处理,确定身份证号码信息的位置区域,然后再在身份证号码信息区域内进行身份证号码信息的识别,得到身份证号码的识别信息,提高了身份证号码信息的识别效率。
上面图3和图4从模块化功能实体的角度对本发明实施例中的身份证号码信息识别装置进行详细描述,下面从硬件处理的角度对本发明实施例中身份证号码信息识别设备进行详细描述。
图5是本发明实施例提供的一种身份证号码信息识别设备的结构示意图,该身份证号码信息识别设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对身份证号码信息识别设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在身份证号码信息识别设备500上执行存储介质530中的一系列指令操作。
身份证号码信息识别设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的身份证号码信息识别设备结构并不构成对身份证号码信息识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述身份证号码信息识别方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种身份证号码信息识别方法,其特征在于,所述身份证号码信息识别方法包括:
获取携带有身份证号码信息的身份证图像;
利用预置深度学习模型对所述身份证图像中的每个初始像素进行灰度化处理,得到初始像素的字节亮度平均值,并根据所述字节亮度平均值,得到灰度化处理图像;
对所述灰度化处理图像中的每个基础像素进行二值化处理,得到基础像素的分类阈值,并利用所述分类阈值对所述灰度化处理图像进行分类,得到二值化处理图像;
利用预置投影统计算法确定所述二值化处理图像中所述身份证号码信息的位置区域,生成多个字符图像,其中,所述字符图像用于显示所述身份证号码信息的字符信息;
采用字符识别算法分别对所述多个字符图像中对应的多个字符信息进行识别,得到身份证号码的识别信息。
2.根据权利要求1所述的身份证号码信息识别方法,其特征在于,所述利用预置深度学习模型对所述身份证图像中的每个初始像素进行灰度化处理,得到初始像素的字节亮度平均值,并根据所述字节亮度平均值,得到灰度化处理图像包括:
利用预置深度学习模型获取所述身份证图像中的多个初始像素;
分别提取所述多个初始像素对应的多个字节亮度分量,并计算多个字节亮度分量中每个字节亮度分量的平均值,得到多个字节亮度平均值;
将所述多个字节亮度平均值中的每个字节亮度平均值确定为对应初始像素的像素值,得到灰度化处理图像。
3.根据权利要求1所述的身份证号码信息识别方法,其特征在于,所述对所述灰度化处理图像中的每个基础像素进行二值化处理,得到基础像素的分类阈值,并利用所述分类阈值对所述灰度化处理图像进行分类,得到二值化处理图像包括:
获取所述灰度化处理图像中的多个基础像素的像素数据,得到多个基础像素值;
通过所述多个基础像素值的数值大小,分别确定每个基础像素值对应所属的一个预置像素取值区间;
统计每个预置像素取值区间内基础像素值的数量,得到多个基础像素值的数量,每个预置像素取值区间对应一个基础像素值的数量;
对所述多个基础像素值的数量进行归一化处理,得到多个归一化像素值的数量;
利用多个归一化像素值的数量以及所述多个基础像素值计算分类阈值,并按照所述分类阈值对所述灰度化处理图像中的多个基础像素进行分类,得到二值化处理图像。
4.根据权利要求1所述的身份证号码信息识别方法,其特征在于,所述利用预置投影统计算法确定所述二值化处理图像中所述身份证号码信息的位置区域,生成多个字符图像,其中,所述字符图像用于显示所述身份证号码信息的字符信息包括:
利用预置投影统计算法对所述二值化处理图像进行水平投影,得到水平投影图像,分别获取所述水平图像中多行二值化像素,并获取每行二值化像素中的每个二值化像素的值,得到多个横向像素值;
查询所述多个横向像素值为0的多个横向像素值,统计每行二值化像素中对应横向像素值的数量,得到各行横向像素值的数量;
根据各行横向像素值的数量建立第一坐标系,其中,所述第一坐标系的X轴表示水平投影图像中多行二值化像素的行数,所述第一坐标系的Y轴表示水平投影图像中各行横向像素值的数量;
在所述第一坐标系中,选取二值化像素的行数在预置行数范围内的多行二值化像素,确定身份证号码信息区域,并生成携带有所述身份证号码信息区域的候选字符图像;
在所述候选字符图像中确定所述身份证号码信息区域内多个字符信息区域中的每个字符信息区域,并根据每个字符信息区域生成对应的字符图像,得到多个字符图像。
5.根据权利要求4所述的身份证号码信息识别方法,其特征在于,所述在所述候选字符图像中确定所述身份证号码信息区域内多个字符信息区域中的每个字符信息区域,并根据每个字符信息区域生成对应的字符图像,得到多个字符图像包括:
对所述候选字符图像进行垂直投影,得到垂直投影图像,分别获取所述垂直投影图像中多列二值化像素,并获取每列二值化像素中的每个二值化像素的值,得到多个纵向像素值;
查询所述多个纵向像素值为0的多个纵向像素值,统计每列二值化像素中对应纵向像素值的数量,得到各列纵向像素值的数量;
根据所述各列纵向像素值的数量建立第二坐标系,其中,所述第二坐标系的X轴表示垂直投影图像中多列二值化像素的列数,所述第二坐标系的Y轴表示垂直投影图像中各列纵向像素值的数量;
在所述第二坐标系中,选取所述各列纵向像素值的数量为0所对应的列数,得到多个待选列数值,在所述多个待选列数值中选取相邻一列纵向像素值数量不为0的待选列数值,得到多个目标列数值;
将所述多个目标列数值确定为所述垂直投影图像的多个切割点,通过所述多个切割点切割所述垂直投影图像,确定身份证号码信息中多个字符信息区域,并生成携带有所述多个字符信息区域的多个字符图像。
6.根据权利要求1-5中任一项所述的身份证号码信息识别方法,其特征在于,所述采用字符识别算法分别对所述多个字符图像中对应的多个字符信息进行识别,得到身份证号码的识别信息包括:
采用字符识别算法检测所述多个字符图像中任意一个字符图像内的字符信息区域,得到待检测字符文本框;
在所述待检测字符文本框内提取待检测字符特征,并计算所述待检测字符特征与多个预置字符特征之间的多个基础相似度,其中,所述预置字符特征为提前设置在字典特征库中的字符特征;
在所述多个基础相似度中,将基础相似度的数值大于标准阈值的基础相似度确定为目标相似度,并确定所述目标相似度对应的待检测字符特征为预置字符特征,得到待整合字符识别信息;
获取所述多个字符图像中其他字符图像内的字符信息区域,得到其他待检测字符文本框,并通过所述其他待检测字符文本框确定其他待整合字符识别信息;
整合所述待整合字符识别信息与所述其他待整合字符识别信息,得到身份证号码的识别信息。
7.一种身份证号码信息识别装置,其特征在于,所述身份证号码信息识别装置包括:
获取模块,用于获取携带有身份证号码信息的身份证图像;
灰度化模块,用于利用预置深度学习模型对所述身份证图像中的每个初始像素进行灰度化处理,得到初始像素的字节亮度平均值,并根据所述字节亮度平均值,得到灰度化处理图像;
二值化模块,用于对所述灰度化处理图像中的每个基础像素进行二值化处理,得到基础像素的分类阈值,并利用所述分类阈值对所述灰度化处理图像进行分类,得到二值化处理图像;
投影模块,用于利用预置投影统计算法确定所述二值化处理图像中所述身份证号码信息的位置区域,生成多个字符图像,其中,所述字符图像用于显示所述身份证号码信息的字符信息;
识别模块,用于采用字符识别算法分别对所述多个字符图像中对应的多个字符信息进行识别,得到身份证号码的识别信息。
8.根据权利要求7所述的身份证号码信息识别装置,其特征在于,所述灰度化模块具体用于:
利用预置深度学习模型获取所述身份证图像中的多个初始像素;
分别提取所述多个初始像素对应的多个字节亮度分量,并计算多个字节亮度分量中每个字节亮度分量的平均值,得到多个字节亮度平均值;
将所述多个字节亮度平均值中的每个字节亮度平均值确定为对应初始像素的像素值,得到灰度化处理图像。
9.一种身份证号码信息识别设备,其特征在于,所述身份证号码信息识别设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;所述至少一个处理器调用所述存储器中的所述指令,以使得所述身份证号码信息识别设备执行如权利要求1-6中任意一项所述的身份证号码信息识别方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述身份证号码信息识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010301489.1A CN111461131B (zh) | 2020-04-16 | 2020-04-16 | 身份证号码信息识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010301489.1A CN111461131B (zh) | 2020-04-16 | 2020-04-16 | 身份证号码信息识别方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111461131A true CN111461131A (zh) | 2020-07-28 |
CN111461131B CN111461131B (zh) | 2023-04-18 |
Family
ID=71686005
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010301489.1A Active CN111461131B (zh) | 2020-04-16 | 2020-04-16 | 身份证号码信息识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111461131B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111898602A (zh) * | 2020-08-10 | 2020-11-06 | 赞同科技股份有限公司 | 一种图像中的凭证号码区域识别方法、装置及设备 |
CN114067104A (zh) * | 2021-11-26 | 2022-02-18 | 重庆远视科技有限公司 | 图像处理方法、屈光信息获取方法及系统 |
CN114495103A (zh) * | 2022-01-28 | 2022-05-13 | 北京百度网讯科技有限公司 | 文本识别方法、装置、电子设备和介质 |
CN116189181A (zh) * | 2022-11-11 | 2023-05-30 | 杭州海量信息技术有限公司 | 一种身份证ocr的图像规范化方法及系统 |
CN117373589A (zh) * | 2023-10-09 | 2024-01-09 | 曜立科技(北京)有限公司 | 基于数字疗法的神经介入术后抗凝管理系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105741171A (zh) * | 2016-01-28 | 2016-07-06 | 李天� | 一种用于征信系统的人物特征图像处理方法及其征信系统 |
CN106156712A (zh) * | 2015-04-23 | 2016-11-23 | 信帧电子技术(北京)有限公司 | 一种基于自然场景下的身份证号码识别方法与装置 |
WO2019153739A1 (zh) * | 2018-02-09 | 2019-08-15 | 深圳壹账通智能科技有限公司 | 基于人脸识别的身份认证方法、装置、设备和存储介质 |
CN110414523A (zh) * | 2019-07-22 | 2019-11-05 | 彩讯科技股份有限公司 | 一种身份证识别方法、装置、设备及存储介质 |
-
2020
- 2020-04-16 CN CN202010301489.1A patent/CN111461131B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156712A (zh) * | 2015-04-23 | 2016-11-23 | 信帧电子技术(北京)有限公司 | 一种基于自然场景下的身份证号码识别方法与装置 |
CN105741171A (zh) * | 2016-01-28 | 2016-07-06 | 李天� | 一种用于征信系统的人物特征图像处理方法及其征信系统 |
WO2019153739A1 (zh) * | 2018-02-09 | 2019-08-15 | 深圳壹账通智能科技有限公司 | 基于人脸识别的身份认证方法、装置、设备和存储介质 |
CN110414523A (zh) * | 2019-07-22 | 2019-11-05 | 彩讯科技股份有限公司 | 一种身份证识别方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
杨航;周曦;: "基于深度学习的身份证号码识别方法" * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111898602A (zh) * | 2020-08-10 | 2020-11-06 | 赞同科技股份有限公司 | 一种图像中的凭证号码区域识别方法、装置及设备 |
CN111898602B (zh) * | 2020-08-10 | 2024-04-16 | 赞同科技股份有限公司 | 一种图像中的凭证号码区域识别方法、装置及设备 |
CN114067104A (zh) * | 2021-11-26 | 2022-02-18 | 重庆远视科技有限公司 | 图像处理方法、屈光信息获取方法及系统 |
CN114495103A (zh) * | 2022-01-28 | 2022-05-13 | 北京百度网讯科技有限公司 | 文本识别方法、装置、电子设备和介质 |
CN116189181A (zh) * | 2022-11-11 | 2023-05-30 | 杭州海量信息技术有限公司 | 一种身份证ocr的图像规范化方法及系统 |
CN116189181B (zh) * | 2022-11-11 | 2024-01-23 | 杭州海量信息技术有限公司 | 一种身份证ocr的图像规范化方法及系统 |
CN117373589A (zh) * | 2023-10-09 | 2024-01-09 | 曜立科技(北京)有限公司 | 基于数字疗法的神经介入术后抗凝管理系统 |
CN117373589B (zh) * | 2023-10-09 | 2024-03-29 | 曜立科技(北京)有限公司 | 基于数字疗法的神经介入术后抗凝管理系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111461131B (zh) | 2023-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111461131B (zh) | 身份证号码信息识别方法、装置、设备及存储介质 | |
EP1271403B1 (en) | Method and device for character location in images from digital camera | |
CN107093172B (zh) | 文字检测方法及系统 | |
EP1229493B1 (en) | Multi-mode digital image processing method for detecting eyes | |
CN101122953B (zh) | 一种图片文字分割的方法 | |
EP3214577A1 (en) | Image text recognition method and device | |
CN108108734B (zh) | 一种车牌识别方法及装置 | |
CN105139011B (zh) | 一种基于标识物图像的车辆识别方法及装置 | |
US7370059B2 (en) | Model of documents and method for automatically classifying a document | |
CN1198238C (zh) | 图象处理设备和由一个多级图象产生二进制图象的方法 | |
CN111444907A (zh) | 文字识别的方法、装置、设备及存储介质 | |
Chen et al. | Efficient text localization in born-digital images by local contrast-based segmentation | |
CN112818983B (zh) | 一种利用图片相识度判断字符倒置的方法 | |
CN113723410B (zh) | 一种数码管数字识别方法及装置 | |
CN116503848B (zh) | 车牌的智能识别方法、装置、设备及存储介质 | |
CN117011855A (zh) | 一种字符串图像切割识别方法、系统和可读存储介质 | |
Chang et al. | Binarization of document images using Hadamard multiresolution analysis | |
CN113537216B (zh) | 一种点阵字体文本行倾斜校正方法及装置 | |
CN112785550B (zh) | 图像质量值确定方法、装置、存储介质及电子装置 | |
Höhn | Detecting arbitrarily oriented text labels in early maps | |
Clavelli et al. | Text segmentation in colour posters from the spanish civil war era | |
CN109086766B (zh) | 一种基于积分图的多阈值融合冠字号提取方法 | |
Tsai et al. | Efficiently extracting and classifying objects for analyzing color documents | |
Tian et al. | A new algorithm for license plate localization in open environment using color pair and stroke width features of character | |
Tedjojuwono | Fast Performance Indonesian Automated License Plate Recognition Algorithm Using Interconnected Image Segmentation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |