CN110070103A - 身份证识别的方法及终端设备 - Google Patents
身份证识别的方法及终端设备 Download PDFInfo
- Publication number
- CN110070103A CN110070103A CN201910192998.2A CN201910192998A CN110070103A CN 110070103 A CN110070103 A CN 110070103A CN 201910192998 A CN201910192998 A CN 201910192998A CN 110070103 A CN110070103 A CN 110070103A
- Authority
- CN
- China
- Prior art keywords
- character
- image
- block
- identification
- obtains
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Character Input (AREA)
Abstract
本发明适用于图像识别技术领域,提供了一种身份证识别的方法及终端设备,该方法包括:通过获取身份证图像;对所述身份证图像进行预处理,获取预处理后的图像;对所述预处理后的图像进行单字分割;对单字分割处理后的字符块进行初始识别以及二次识别,可以提高身份证图像的识别正确率。
Description
技术领域
本发明属于图像识别技术领域,尤其涉及一种身份证识别的方法及终端设备。
背景技术
身份证是证明公民合法身份的唯一有效证件,是公民参加各种政治、经济、社会活动所必须的证件。可以说,身份证已经深入我们生活的各个方面。因此,如何快捷、准确地读取身份证信息变得越来越重要。
身份证识别技术,属于模式识别中的印刷体字符识别的范畴,与普通文本识别所不同的是,身份证识别是复杂背景下的字符识别。在身份证识别中经常遇到的问题包括:光线干扰、倾斜角度过大等造成图像变形严重,导致身份证识别率偏低。
发明内容
有鉴于此,本发明实施例提供了一种身份证识别的方法及终端设备,以解决现有技术中由于光线干扰、倾斜角度过大等造成图像变形严重,导致身份证识别率偏低的问题。
本发明实施例的第一方面提供了一种身份证识别的方法,包括:
获取身份证图像;
对所述身份证图像进行预处理,获取预处理后的图像;
对所述预处理后的图像进行单字分割;
对单字分割处理后的字符块进行初始识别以及二次识别。
在一实施例中,所述对所述身份证图像进行预处理,获取预处理后的图像,包括:
采用水平投影法对所述身份证图像进行区域分割,获取汉字个人信息图像块和编号数字图像块;
对所述汉字个人信息图像块和所述编号数字图像块进行平滑处理、锐化处理以及二值化操作,获取第一图像;
将所述第一图像进行倾斜校正,获取预处理后的图像。
在一实施例中,所述水平投影法采用的投影模板包括:汉字个人信息区域、头像区域和编号数字区域;
所述采用水平投影法对所述身份证图像进行区域分割,获取汉字个人信息图像块和编号数字图像块,包括:
采用水平投影法对所述身份证图像进行区域分割,得到汉字个人信息区域图像、头像区域图像和编号数字区域图像;
删除头像区域图像中的头像,删除汉字个人信息区域图像中的第一统一制式字样所在图像,以及删除编号数字区域图像中的第二统一制式字样所在图像,获取汉字个人信息图像块和编号数字图像块。
在一实施例中,所述对所述预处理后的图像进行单字分割,包括:
以预设高度、预设文字最大宽度以及预设回溯长度对所述预处理后的图像进行单字分割;
对采用单字分割后获得的各个字符图像进行去毛刺和去空洞操作,获取预设像素的单字符图像。
在一实施例中,所述对单字分割处理后的字符块进行初始识别,包括:
根据四边码特征进行编码,获取预设字符集合,所述预设字符集合包括文字集合以及数字集合;
对任意第一字符块的四边框分别向相反方向确定预设宽度,获取四个条状区域,其中,所述第一字符块为对单字分割处理后的字符块中任意一个字符块;
分别计算所述四个条状区域内白背景所占比例,并对所述比例进行编码,获取四维特征向量;
对每一维特征向量从上向下进行扫描,计算每一条扫描线左右白背景的比例之和,进行归一化处理后进行编码,获取所述第一字符块对应的编码;
根据所述预设字符集合以及所述第一字符块对应的编码,对所述第一字符块进行初始识别,获取所述第一字符块对应的字符集合。
在一实施例中,所述对单字分割处理后的字符块进行二次识别,包括:
对任意第一字符块从边缘向中部扫描,记录每条扫描线遇到的第一个黑像素的位置,获取所述第一字符块中字符的轮廓;
对所述第一字符块在水平和垂直方向上二次扫描,获取所述第一字符块中字符的内部结构信息;
根据所述第一字符块中字符的轮廓、内部结构信息以及获取的所述第一字符块对应的字符集合,对所述第一字符块进行识别,确定所述第一字符块对应的文字或者数字。
在一实施例中,在所述对单字分割处理后的字符块进行初始识别以及二次识别之后,所述身份证识别的方法还包括:
根据文字之间的关联,对识别结果进行校正;
将校正之后的字符,按照字符串的方式保存。
本发明实施例的第二方面提供了一种身份证识别的装置,包括:
获取模块,用于获取身份证图像;
预处理模块,用于对所述身份证图像进行预处理,获取预处理后的图像;
分割模块,用于对所述预处理后的图像进行单字分割;
识别模块,用于对单字分割处理后的字符块进行初始识别以及二次识别。
本发明实施例的第三方面提供了一种终端设备,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如身份证识别的方法所述的步骤。
本发明实施例的第四方面提供了一种计算机可读存储介质,包括:所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如身份证识别的方法所述的步骤。
本发明实施例与现有技术相比存在的有益效果是:通过获取身份证图像;对所述身份证图像进行预处理,获取预处理后的图像;对所述预处理后的图像进行单字分割;对单字分割处理后的字符块进行初始识别以及二次识别,解决现有技术中由于光线干扰、倾斜角度过大等造成图像变形严重,导致身份证识别率偏低的问题,从而提高身份证图像的识别正确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的身份证识别的方法的实现流程示意图;
图2是本发明实施例提供的对身份证图像进行预处理的实现流程示意图;
图3是本发明实施例提供的对预处理后的图像进行单字分割的流程示意图;
图4是本发明实施例提供的对单字分割处理后的字符块进行初始识别的示例图;
图5是本发明实施例提供的身份证识别的装置的示意图;
图6是本发明实施例提供的终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
图1为本发明实施例提供的一种身份证识别的方法的实现流程示意图,详述如下。
步骤101,获取身份证图像。
可选的,步骤101中获取的身份证图像可以为格式统一的图片,例如,身份证图像可以为256色灰度BMP图片。
步骤102,对所述身份证图像进行预处理,获取预处理后的图像。
可选的,身份证图像首先需要运用图像处理的各种方法进行预处理,从而得到品质较高的图像。身份证图像的预处理是指对采集到的身份证图像进行灰度化和去噪处理,以使身份证图像的质量得到改善,同时保留和增强身份证中纹理和颜色的信息,去除可能影响身份证区域纹理和颜色信息的噪点,为身份证图像定位提供方便。
可选的,步骤102中对身份证图像进行预处理的流程包括以下步骤,如图2详述。
步骤201,采用水平投影法对所述身份证图像进行区域分割,获取汉字个人信息图像块和编号数字图像块。
可选的,身份证图像中字符信息分布规则,每行有一定间隙,本系统采用水平投影法进行图像分割。由于身份证图像中有较多冗余信息,如背景网格、防伪标识等。如果对身份证图像整图进行文字识别,时间和空间开销比较大,因此我们采用先对身份证图像进行区域分割,获取字个人信息图像块和编号数字图像块,这样可以为后续图像预处理减少许多背景干扰。
本步骤中所述水平投影法采用的投影模板包括:汉字个人信息区域、头像区域和编号数字区域,将身份证图像分割成为三部分。
可选的,采用水平投影法对所述身份证图像进行区域分割,得到汉字个人信息区域图像、头像区域图像和编号数字区域图像;然后删除头像区域图像中的头像,删除汉字个人信息区域图像中的第一统一制式字样所在图像,以及删除编号数字区域图像中的第二统一制式字样所在图像,获取汉字个人信息图像块和编号数字图像块。
可选的,第一统一制式字样可以指身份证图像正面左侧的“姓名、性别、出生日期以及住址”,第二统一制式字样可以指身份证图像正面下端的“公民身份号码”。例如,删除汉字个人信息区域图像中的“姓名、性别、出生日期以及住址”统一制式字样所在图像以及编号数字区域图像中的“公民身份号码”统一制式字样所在图像,即对于身份证图像中的统一制式字样可以不进行识别,直接输出,这样可以减少识别时间,降低识别难度以及错误率。
步骤202,对所述汉字个人信息图像块和所述编号数字图像块进行平滑处理、锐化处理以及二值化操作,获取第一图像。
对于已经取得的汉字个人信息图像块和编号数字图像块,存在噪声、文字边缘模糊、粘连等现象,我们需要对其进行平滑去噪、锐化增强边缘及二值化操作,把灰度图像转化为黑白二值图像,并对二值图像进一步分割,提取出每个文字所在的矩形区域。
可选的,步骤202中所述的平滑处理主要目的是减少图像的噪声。在频率域,由于噪声通常代表一种高频分量,可以用各种形式的低通滤波器达到平滑的目的。空间域则往往采用模板操作。它实现了邻域运算,即运算后某个象素点的值取决于其自身和邻域点的值。步骤202中所述的平滑处理技术可以采用高斯模板减少图像的噪声。
可选的,步骤202中所述的锐化处理与平滑处理恰恰相反,它通过增强高频分量减少图像的模糊,加强图像中景物的边缘。身份证图像在平滑处理后减少了噪声,但可能会使文字信息的边缘模糊,这时需要通过锐化处理突出这些信息。
可选的,步骤202中所述的二值化操作指将灰度图像转换为黑白二值图像的操作。在文字识别中,最终往往是对黑白二值图像操作的,身份证识别也不例外。步骤202中所述的二值化操作用采用迭代法求整体阈值,按阈值划分目标和背景,即用阈值将图像的数据分成两部分:大于阈值的像素群和小于阈值的像素群,从而分离图像中的背景和文字。
通过图像预处理可以将身份证图像中的字符信息、激光防伪标志和网格阴影区分离出来,从而获得单个字符块的二值化图像。
步骤203,将所述第一图像进行倾斜校正,获取预处理后的图像。
可选的,因获取的身份证图像可能会发生歪斜,因此对二值化处理后的图像倾斜校正,可以提高身份证识别的正确率。
可选的,获取预处理后的图像后,继续执行附图1中步骤103。
步骤103,对所述预处理后的图像进行单字分割。
可选的,在对预处理后的图像进行字符识别前,可以先进行单字分割,对每个文字图像先进行去毛刺和空洞等修饰,再规范化为24x24个象素的图像,为识别作好准备。
步骤103中对所述预处理后的图像进行单字分割时,如图3所示,可以包括以下步骤。
步骤301,以预设高度、预设文字最大宽度以及预设回溯长度对所述预处理后的图像进行单字分割。
可选的,由于身份证为国家统一的证件,身份证上的不同作用的字符的尺寸相同,但是同一行的字符的尺寸相同,因此可以对不同尺寸的字符设置不同的分割标准。例如,名字比住址的字符尺寸大,则分割标准中对名字进行分割时的预设高度为2mm,预设文字最大宽度可以为3.5mm,预设回溯长度为3mm,对住址进行分割时的预设高度为1.3mm,预设文字最大宽度可以为1.6mm,预设回溯长度为0.8mm。
步骤302,对采用单字分割后获得的各个字符图像进行去毛刺和去空洞操作,获取预设像素的单字符图像。
预设像素的单字符图像可以为24x24个象素的图像。
可选的,在步骤302获取预设像素的单字符图像之后,还可以包括对各个字符进行特征提取,从规范化后的图像中提取统计特征或结构特征的过程。提取的特征的稳定性及有效性,将直接决定识别的性能。
步骤104,对单字分割处理后的字符块进行初始识别以及二次识别。
可选的,步骤104中对单字分割处理后的字符块进行初始识别的流程如图4所示。
步骤401,根据四边码特征进行编码,获取预设字符集合。
汉字边框中含有较丰富的结构信息,并且由于边框部分笔画较少,不太会出现粘连情况,因此可以采用四边码进行粗分类。首先从汉字的四边框起,向内取适当宽度,以此宽度分割出文字四周的四部分,根据每一部分内含有黑像素的比例分成四个等级,例如,四个等级采用0、1、2和3表示,按照上左下右的方式编码,然后对每个汉字编码后,将编码相同的汉字组成一类,共有256中分类,即256个汉字集合。在本步骤中,可以按照此方法将数字进行分类。步骤401中所述的预设字符集合可以包括汉字集合以及数字集合。
步骤402,对任意第一字符块的四边框分别向相反方向确定预设宽度,获取四个条状区域,其中,所述第一字符块为对单字分割处理后的字符块中任意一个字符块。
本步骤中预设宽度可以根据经验确定。
步骤403,分别计算所述四个条状区域内白背景所占比例,并对所述比例进行编码,获取四维特征向量。
可选的,四维特征向量中每一维有0、1、2和3四个值可取。
步骤404,对每一维特征向量从上向下进行扫描,计算每一条扫描线左右白背景的比例之和,进行归一化处理后进行编码,获取所述第一字符块对应的编码。
步骤405,根据所述预设字符集合以及所述第一字符块对应的编码,对所述第一字符块进行初始识别,获取所述第一字符块对应的字符集合。
可选的,附图4所示的字符初始识别的方法为对字符的粗分类,获得的大类中字符数目已经大大减少,但字之间的相似度比较大,因此需要进行细分类,抽取新的特征以便区分这些相近的汉字。可选的,对字符进行二次识别的方法包括:对任意第一字符块从边缘向中部扫描,记录每条扫描线遇到的第一个黑像素的位置,获取所述第一字符块中字符的轮廓;对所述第一字符块在水平和垂直方向上二次扫描,获取所述第一字符块中字符的内部结构信息;根据所述第一字符块中字符的轮廓、内部结构信息以及获取的所述第一字符块对应的字符集合,对所述第一字符块进行识别,确定所述第一字符块对应的文字或者数字。
在步骤104对单字分割处理后的字符块进行初始识别以及二次识别之后,所述身份证识别的方法还可以包括:根据文字之间的关联,对识别结果进行校正;以及将校正之后的字符,按照字符串的方式保存。
可选的,在输出识别后的身份证图像时,可以将身份证上的统一制式字样与采用身份证识别的方法识别出的字符相结合输出。
上述身份证识别的方法,通过获取身份证图像;对所述身份证图像进行预处理,获取预处理后的图像;对所述预处理后的图像进行单字分割;对单字分割处理后的字符块进行识别,可以提高身份证图像的识别正确率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
对应于上文实施例所述的身份证识别的方法,图5示出了本发明实施例提供的身份证识别的装置的示例图。如图5所示,该装置可以包括:获取模块501、预处理模块502、分割模块503和识别模块504。
获取模块501,用于获取身份证图像;
预处理模块502,用于对所述身份证图像进行预处理,获取预处理后的图像;
分割模块503,用于对所述预处理后的图像进行单字分割;
识别模块504,用于对单字分割处理后的字符块进行初始识别以及二次识别。
可选的,所述预处理模块502,还可以用于采用水平投影法对所述身份证图像进行区域分割,获取汉字个人信息图像块和编号数字图像块;对所述汉字个人信息图像块和所述编号数字图像块进行平滑处理、锐化处理以及二值化操作,获取第一图像;将所述第一图像进行倾斜校正,获取预处理后的图像。
可选的,所述水平投影法采用的投影模板包括:汉字个人信息区域、头像区域和编号数字区域。所述预处理模块502,还可以用于采用水平投影法对所述身份证图像进行区域分割,,得到汉字个人信息区域图像、头像区域图像和编号数字区域图像;删除头像区域图像中的头像,删除汉字个人信息区域图像中的第一统一制式字样所在图像,以及删除编号数字区域图像中的第二统一制式字样所在图像,获取汉字个人信息图像块和编号数字图像块。
所述分割模块503,还可以用于以预设高度、预设文字最大宽度以及预设回溯长度对所述预处理后的图像进行单字分割;对采用单字分割后获得的各个字符图像进行去毛刺和去空洞操作,获取预设像素的单字符图像。
所述识别模块504,还可以用于根据四边码特征进行编码,获取预设字符集合,所述预设字符集合包括文字集合以及数字集合;对任意第一字符块的四边框分别向相反方向确定预设宽度,获取四个条状区域,其中,所述第一字符块为对单字分割处理后的字符块中任意一个字符块;分别计算所述四个条状区域内白背景所占比例,并对所述比例进行编码,获取四维特征向量;对每一维特征向量从上向下进行扫描,计算每一条扫描线左右白背景的比例之和,进行归一化处理后进行编码,获取所述第一字符块对应的编码;根据所述预设字符集合以及所述第一字符块对应的编码,对所述第一字符块进行初始识别,获取所述第一字符块对应的字符集合。
所述识别模块504,还可以用于对任意第一字符块从边缘向中部扫描,记录每条扫描线遇到的第一个黑像素的位置,获取所述第一字符块中字符的轮廓;对所述第一字符块在水平和垂直方向上二次扫描,获取所述第一字符块中字符的内部结构信息;根据所述第一字符块中字符的轮廓、内部结构信息以及获取的所述第一字符块对应的字符集合,对所述第一字符块进行识别,确定所述第一字符块对应的文字或者数字。
在所述识别模块504对单字分割处理后的字符块进行识别之后,还可以用于根据文字之间的关联,对识别结果进行校正;将校正之后的字符,按照字符串的方式保存。
上述身份证识别的装置,通过预处理模块对获取的身份证图像进行预处理,获取预处理后的图像;分割模块对所述预处理后的图像进行单字分割;识别模块对单字分割处理后的字符块进行初始识别以及二次识别,可以提高身份证图像的识别正确率。
图6是本发明一实施例提供的终端设备的示意图。如图6所示,该实施例的终端设备6包括:处理器601、存储器602以及存储在所述存储器602中并可在所述处理器601上运行的计算机程序603,例如身份证识别的程序。所述处理器601执行所述计算机程序603时实现上述身份证识别的方法实施例中的步骤,例如图1所示的步骤101至104,或者图2所示的步骤201至步骤203,或者图3所示的步骤301至步骤302,或者图4所示的步骤401至步骤405,所述处理器601执行所述计算机程序603时实现上述各装置实施例中各模块的功能,例如图5所示模块501至504的功能。
示例性的,所述计算机程序603可以被分割成一个或多个程序模块,所述一个或者多个程序模块被存储在所述存储器602中,并由所述处理器601执行,以完成本发明。所述一个或多个程序模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序603在所述身份证识别的装置或者终端设备6中的执行过程。例如,所述计算机程序603可以被分割成获取模块501、预处理模块502、分割模块503和识别模块504,各模块具体功能如图5所示,在此不再一一赘述。
所述终端设备6可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器601、存储器602。本领域技术人员可以理解,图6仅仅是终端设备6的示例,并不构成对终端设备6的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器601可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器602可以是所述终端设备6的内部存储单元,例如终端设备6的硬盘或内存。所述存储器602也可以是所述终端设备6的外部存储设备,例如所述终端设备6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器602还可以既包括所述终端设备6的内部存储单元也包括外部存储设备。所述存储器602用于存储所述计算机程序以及所述终端设备6所需的其他程序和数据。所述存储器602还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种身份证识别的方法,其特征在于,包括:
获取身份证图像;
对所述身份证图像进行预处理,获取预处理后的图像;
对所述预处理后的图像进行单字分割;
对单字分割处理后的字符块进行初始识别以及二次识别。
2.如权利要求1所述的身份证识别的方法,其特征在于,所述对所述身份证图像进行预处理,获取预处理后的图像,包括:
采用水平投影法对所述身份证图像进行区域分割,获取汉字个人信息图像块和编号数字图像块;
对所述汉字个人信息图像块和所述编号数字图像块进行平滑处理、锐化处理以及二值化操作,获取第一图像;
将所述第一图像进行倾斜校正,获取预处理后的图像。
3.如权利要求2所述的身份证识别的方法,其特征在于,
所述水平投影法采用的投影模板包括:汉字个人信息区域、头像区域和编号数字区域;
所述采用水平投影法对所述身份证图像进行区域分割,获取汉字个人信息图像块和编号数字图像块,包括:
采用水平投影法对所述身份证图像进行区域分割,得到汉字个人信息区域图像、头像区域图像和编号数字区域图像;
删除头像区域图像中的头像,删除汉字个人信息区域图像中的第一统一制式字样所在图像,以及删除编号数字区域图像中的第二统一制式字样所在图像,获取汉字个人信息图像块和编号数字图像块。
4.如权利要求3所述的身份证识别的方法,其特征在于,所述对所述预处理后的图像进行单字分割,包括:
以预设高度、预设文字最大宽度以及预设回溯长度对所述预处理后的图像进行单字分割;
对采用单字分割后获得的各个字符图像进行去毛刺和去空洞操作,获取预设像素的单字符图像。
5.如权利要求1或4所述的身份证识别的方法,其特征在于,所述对单字分割处理后的字符块进行初始识别,包括:
根据四边码特征进行编码,获取预设字符集合,所述预设字符集合包括文字集合以及数字集合;
对任意第一字符块的四边框分别向相反方向确定预设宽度,获取四个条状区域,其中,所述第一字符块为对单字分割处理后的字符块中任意一个字符块;
分别计算所述四个条状区域内白背景所占比例,并对所述比例进行编码,获取四维特征向量;
对每一维特征向量从上向下进行扫描,计算每一条扫描线左右白背景的比例之和,进行归一化处理后进行编码,获取所述第一字符块对应的编码;
根据所述预设字符集合以及所述第一字符块对应的编码,对所述第一字符块进行初始识别,获取所述第一字符块对应的字符集合。
6.如权利要求5所述的身份证识别的方法,其特征在于,所述对单字分割处理后的字符块进行二次识别,包括:
对任意第一字符块从边缘向中部扫描,记录每条扫描线遇到的第一个黑像素的位置,获取所述第一字符块中字符的轮廓;
对所述第一字符块在水平和垂直方向上二次扫描,获取所述第一字符块中字符的内部结构信息;
根据所述第一字符块中字符的轮廓、内部结构信息以及获取的所述第一字符块对应的字符集合,对所述第一字符块进行识别,确定所述第一字符块对应的文字或者数字。
7.如权利要求6所述的身份证识别的方法,其特征在于,在所述对单字分割处理后的字符块进行初始识别以及二次识别之后,所述身份证识别的方法还包括:
根据文字之间的关联,对识别结果进行校正;
将校正之后的字符,按照字符串的方式保存。
8.一种身份证识别的装置,其特征在于,包括:
获取模块,用于获取身份证图像;
预处理模块,用于对所述身份证图像进行预处理,获取预处理后的图像;
分割模块,用于对所述预处理后的图像进行单字分割;
识别模块,用于对单字分割处理后的字符块进行初始识别以及二次识别。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910192998.2A CN110070103A (zh) | 2019-03-14 | 2019-03-14 | 身份证识别的方法及终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910192998.2A CN110070103A (zh) | 2019-03-14 | 2019-03-14 | 身份证识别的方法及终端设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110070103A true CN110070103A (zh) | 2019-07-30 |
Family
ID=67366285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910192998.2A Pending CN110070103A (zh) | 2019-03-14 | 2019-03-14 | 身份证识别的方法及终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110070103A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111639648A (zh) * | 2020-05-26 | 2020-09-08 | 浙江大华技术股份有限公司 | 证件识别方法、装置、计算设备和存储介质 |
CN116681628A (zh) * | 2023-08-03 | 2023-09-01 | 湖南华菱电子商务有限公司 | 一种基于深度学习的营业执照数据处理方法及系统 |
-
2019
- 2019-03-14 CN CN201910192998.2A patent/CN110070103A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111639648A (zh) * | 2020-05-26 | 2020-09-08 | 浙江大华技术股份有限公司 | 证件识别方法、装置、计算设备和存储介质 |
CN111639648B (zh) * | 2020-05-26 | 2023-09-19 | 浙江大华技术股份有限公司 | 证件识别方法、装置、计算设备和存储介质 |
CN116681628A (zh) * | 2023-08-03 | 2023-09-01 | 湖南华菱电子商务有限公司 | 一种基于深度学习的营业执照数据处理方法及系统 |
CN116681628B (zh) * | 2023-08-03 | 2023-10-24 | 湖南华菱电子商务有限公司 | 一种基于深度学习的营业执照数据处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107944452B (zh) | 一种圆形印章文字识别方法 | |
CN109670500B (zh) | 一种文字区域获取方法、装置、存储介质及终端设备 | |
CN108171104B (zh) | 一种文字检测方法及装置 | |
CN105528614B (zh) | 一种漫画图像版面的识别方法和自动识别系统 | |
CN107045634B (zh) | 一种基于最大稳定极值区域与笔画宽度的文本定位方法 | |
US8331680B2 (en) | Method of gray-level optical segmentation and isolation using incremental connected components | |
CN104252620A (zh) | 字符粘连的图形验证码识别方法 | |
CN109993161B (zh) | 一种文本图像旋转矫正方法及系统 | |
CN113688838B (zh) | 红色笔迹提取方法、系统、可读存储介质及计算机设备 | |
US11704925B2 (en) | Systems and methods for digitized document image data spillage recovery | |
Michalak et al. | Fast Binarization of Unevenly Illuminated Document Images Based on Background Estimation for Optical Character Recognition Purposes. | |
CN109522768A (zh) | Qr码的识别方法及装置 | |
CN110070103A (zh) | 身份证识别的方法及终端设备 | |
CN112508024A (zh) | 一种变压器电气铭牌钢印字体智能识别方法 | |
CN113033562A (zh) | 一种图像处理方法、装置、设备及存储介质 | |
CN114758340A (zh) | 物流地址智能识别方法、装置、设备及存储介质 | |
Chang et al. | Improved binarization algorithm for document image by histogram and edge detection | |
Ganchimeg | History document image background noise and removal methods | |
CN114519788A (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
CN106023105A (zh) | 一种植物叶片的二值图像生成方法及系统 | |
CN112215783B (zh) | 一种图像噪点识别方法、装置、存储介质及设备 | |
CN114529570A (zh) | 图像分割方法、图像识别方法、用户凭证补办方法及系统 | |
CN114446447A (zh) | 一种染色体核型图像数据的半自动标注方法 | |
CN111476243A (zh) | 影像文字识别方法及装置 | |
Soumya et al. | Enhancement and segmentation of historical records |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190730 |