CN108268868A - 身份证图像的倾斜值获取方法及装置、终端、存储介质 - Google Patents
身份证图像的倾斜值获取方法及装置、终端、存储介质 Download PDFInfo
- Publication number
- CN108268868A CN108268868A CN201710631668.XA CN201710631668A CN108268868A CN 108268868 A CN108268868 A CN 108268868A CN 201710631668 A CN201710631668 A CN 201710631668A CN 108268868 A CN108268868 A CN 108268868A
- Authority
- CN
- China
- Prior art keywords
- monocase
- region
- regions
- card image
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/243—Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
Abstract
本发明提供了一种身份证图像的倾斜值获取方法及装置、终端、存储介质。其中,倾斜值获取方法包括:解析身份证图像,提取所有的单字符区域;对所有的单字符区域进行分组,得到多个单字符区域组;获取长度最大的单字符区域组;获取长度最大的单字符区域组的首尾两个单字符区域的连接线段的倾斜值,并将连接线段的倾斜值确定为身份证图像的倾斜值。本发明可以准确的得到身份证图像倾斜值。
Description
技术领域
本发明涉及图像处理领域,尤其涉及一种身份证图像的倾斜值获取方法及装置、终端、存储介质。
背景技术
目前,为了识别出用户提供的身份证图像中的字符信息,需要在识别字符信息之前,确定身份证图像的倾斜值,然后根据倾斜值对其进行校正。目前,最简单的方法是提取身份证图像的边界线,通过边界线的倾斜值来确定身份证图像的倾斜值,但是由于一些用户提供的身份证图像的分辨率太低,或者身份证图像之外的背景图像的颜色与身份证图像本身的颜色太过于接近,使得有些身份证图像的边界线难以界定,从而导致倾斜值获取失败。
发明内容
为克服现有技术中由一些身份证图像边界线的难以界定导致的倾斜值获取失败的问题,本发明提供一种身份证图像的倾斜值获取方法及装置、终端、存储介质。
第一方面,本发明实施例提供了一种身份证图像的倾斜值获取方法,包括:
解析身份证图像,提取所有的单字符区域,所述单字符区域为包含单个字符的区域;
对所有的单字符区域进行分组,得到多个单字符区域组;其中,所述单字符区域组中任意相邻的两个单字符区域之间的距离小于第一预设阈值;
获取长度最大的单字符区域组;
获取长度最大的单字符区域组的首尾两个单字符区域的连接线段的倾斜值,并将所述连接线段的倾斜值确定为身份证图像的倾斜值。
优选地,所述对所有的单字符区域进行分组,得到多个单字符区域组,包括:
获取第一单字符区域;
获取与所述第一单字符区域的距离小于所述第一预设阈值的所有的第二单字符区域;
直至获取与第n-1单字符区域的距离小于所述第一预设阈值的所有的第n字单字符区域;其中,n大于2,且所述第一单字符区域、所述第二单字符区域直至所述第n单字符区域不相同;将第一单字符区域、第二单字符区域直至第n单字符区域确定为单字符区域组。
优选地,所述第一预设阈值小于或等于身份证图像上的字符的最小行间距。
优选地,所述获取长度最大的单字符区域组,包括:
分别获取各单字符区域组的首尾两个单字符区域的连接线段的长度;
从获取的所有连接线段的长度中,筛选出最大长度,并将所述最大长度对应的单字符区域组确定为长度最大的单字符区域组。
优选地,所述分别获取各单字符区域组的首尾两个单字符区域的连接线段的长度,包括:
获取当前单字符区域组中任两个单字符区域之间的距离,并筛选出最大距离;
将所述最大距离确定为当前单字符区域组的首尾两个单字符区域的连接线段的长度。
优选地,所述解析身份证图像,提取多个单字符区域,包括:
解析身份证图像,提取所有的最大稳定极值区域;
从所有的最大稳定极值区域中滤除非单字符区域,得到多个所述单字符区域。
优选地,所述非单字符区域为第一矩形边界对应的最大稳定极值区域;
所述解析身份证图像,提取所有的最大稳定极值区域之后,还包括:
分别为各所述最大稳定极值区域确定矩形边界;
所述从所有的最大稳定极值区域中滤除非字符特征区域,包括:
检测是否有所述第一矩形边界,所述第一矩形边界为位于其它矩形边界的内部的矩形边界、面积大于第二预设阈值的矩形边界、或长宽比大于第三预设阈值的矩形边界;
若检测有第一矩形边界,则从所有的最大稳定极值区域中将第一矩形边界对应的最大稳定极值区域滤除。
第二方面,本发明实施例提供了一种身份证图像的倾斜值获取装置,包括:
解析模块,用于解析身份证图像,提取所有的单字符区域,所述单字符区域为包含单个字符的区域;
分组模块,用于对所有的单字符区域进行分组,得到多个单字符区域组,所述单字符区域组中任意相邻的两个单字符区域之间的距离小于第一预设阈值;
获取模块,用于获取长度最大的单字符区域组;
倾斜值确定模块,用于获取长度最大的单字符区域组的首尾两个单字符区域的连接线段的倾斜值,并将所述连接线段的倾斜值确定为身份证图像的倾斜值。
第三方面,本发明实施例提供了一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的身份证图像的倾斜值获取方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的身份证图像的倾斜值获取方法。
本发明实施例通过提取身份证图像上的单字符区域,并将连接单字符区域的直线的倾斜值,确定为身份证图像的倾斜值,由于字符的颜色相对于身份图像本身的颜色具有很高的辨识度,因此,可以精确的提取出单字符区域,从而准确的得到身份证图像倾斜值。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的身份证图像的倾斜值获取方法的第一流程示意图;
图2是本发明实施例的身份证图像的倾斜值获取方法的第二流程示意图;
图3是本发明实施例的身份证图像的倾斜值获取方法的第三流程示意图;
图4是本发明实施例的身份证图像的倾斜值获取装置的结构示意图。
具体实施方式
为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参照图1,是本发明实施例的身份证图像的倾斜值获取方法的第一流程示意图。该方法包括:
步骤101,解析身份证图像,提取多个单字符区域。身份证图像包括多个按序排列的字符多行字符,字符可以为文字或数字。其中,单字符区域为包含单个字符的区域。具体地,可以基于区域特征提取算法,对身份证图像中所有的特征区域进行提取,并从中剔除非单字符区域(即不具有单个字符全部特征的区域),从而得到单字符区域。具体地,对于黑色的字符来说,特征区域可以是灰度值小于预设灰度值(如20)的区域。
步骤102,对所有的单字符区域进行分组,得到多个单字符区域组。其中,单字符区域组中任意相邻的两个单字符区域之间的距离小于第一预设阈值,(即单字符区域组中,任一单字符区域都具有至少一个目标单字符区域,且该目标单字符区域与该单字符区域之间的距离小于第一预设阈值,同时目标单字符区域也属于该单字符区域组)。由于身份证图像上的字符的行间距和列间距大小不一,为了尽可能使单字符区域组中各单字符区域均是位于身份证图像上同一行的字符,具体地,第一预设阈值的范围要大于身份证图像上字符的最小列间距(本实施例中,列间距为在字符的排序方向上相邻的两个字符的几何中心的距离),同时要小于身份证图像上字符的最大行间距(本实施例中,行间距为分别位于与字符的排序方向垂直的方向上的两个字符的几何中心的距离)。其中,优选地,第一预设阈值小于或等于身份证图像上字符的最小行间距。此外,第一预设阈值也可以为身份证图像上“姓名”字符行与“性别”字符行的行间距。
进一步地,为了尽可能将身份证图像上位于同一行的所有单字符区域均分为同一组中,任一单字符区域组中的任一单字符区域与另一单字符区域组中的任一单字符区域之间的距离大于或等于第一预设阈值。
步骤103,获取长度最大的单字符区域组。该步骤具体包括:分别计算各单字符区域组的长度,并筛选出长度最大的单字符区域组。
单字符区域组的长度计算包括:
获取单字符区域组的首尾两个单字符区域的连接线段的长度;将连接线段的长度确定为该单字符区域组的长度。其中,连接线段是将首尾两个单字符区域各自的参照点作为端点的线段。其中,参照点具体为单字符区域的几何中心点。具体地,获取单字符区域组的首尾两个单字符区域的连接线段的长度的步骤,包括:获取当前单字符区域组中任两个单字符区域之间的距离,并筛选出最大距离;将该最大距离确定为当前单字符区域组的首尾两个单字符区域的连接线段的长度。进一步地,筛选出长度最大的单字符区域组的步骤,包括:从获取的所有连接线段的长度中,筛选出最大长度,并将最大长度对应的单字符区域组确定为长度最大的单字符区域组。
步骤104,获取长度最大的单字符区域组的首尾两个单字符区域的连接线段的倾斜值,并将连接线段的倾斜值确定为身份证图像的倾斜值。其通过获取连接线段的两端点的坐标,即可以得到连接线段的倾斜值。倾斜值可以为倾斜角度,也可以为斜率。由于各个字符的形状不一,这就会导致提取的各单字符区域的几何中心点不能同时位于同一直线上,因此,通过获取长度最大的单字符区域组的首尾两个单字符区域的连接线段的倾斜值,可以尽量减少误差,使其接近于真实的身份证图像的倾斜值。
本发明实施例通过提取身份证图像上的单字符区域,并将连接单字符区域的直线的倾斜值,确定为身份证图像的倾斜值,由于字符的颜色相对于身份图像本身的颜色具有很高的辨识度,因此,可以精确的提取出单字符区域,从而准确的得到身份证图像倾斜值。
请参照图2,是本发明实施例的身份证图像的倾斜值获取方法的第二流程示意图。该方法包括:
步骤201,解析身份证图像,提取所有的最大稳定极值区域。身份证图像具体可以为身份证的拍摄图像。最大稳定极值区域是当使用不同的灰度阈值对身份证图像进行二值化处理时得到的最稳定的区域。具体地,本步骤包括:获取预设数目的灰度阈值,分别采用每个灰度阈值对身份证图像进行二值化处理,得到各个灰度阈值对应的二值化图像;获取在预设灰度阈值范围对应的各个二值化图像中均保持形状稳定的区域,得到最大稳定极值区域。
身份证图像的二值化处理是将身份证图像中像素点的灰度值设置为第一数值或第二数值,也就是将整个身份证图像呈现出明显的只有黑和白的视觉效果。而对身份证图像的二值化处理方式有双峰法、迭代法、P参数法等,除去列出来的几种二值化处理方式,还有很多其他二值化处理的方式,本公开实施例对此不再一一列举。而关于二值化处理方式的详细步骤可以参考相关技术,本实施例对此不作具体阐述。需要说明的是,第一数值和第二数值可以预先设置,且第一数值大于第二数值,比如,第一数值可以为255、254、253等等,第二数值可以为0、1、2等等,本实施例对此不作具体限定。
步骤202,分别为各所述最大稳定极值区域确定矩形边界。由于各个最大稳定极值区域是不规则的区域,不便于计算其中心点,也不便于对非单字符区域的去除,因此需要为各最大稳定极值区域确定一个外接的矩形边界,以便于对单字符区域的中心点的计算。具体地,本步骤包括:确定最大稳定极值区域的轮廓;根据确定的轮廓,得到该轮廓的最小外接矩形,从而得到该最大稳定极值区域的矩形边界。其中,最小外接矩形是指以二维坐标表示的二维形状的最大范围,即以给定的二维形状各顶点中的最大横坐标、最小横坐标、最大纵坐标、最小纵坐标定下边界的矩形。
步骤203,从所有的最大稳定极值区域中滤除非单字符区域,得到多个单字符区域。其中,单字符区域为包含单个字符的区域。具体地,本步骤包括:检测是否有第一矩形边界;若检测有第一矩形边界,则从所有的最大稳定极值区域中将第一矩形边界对应的最大稳定极值区域滤除。其中,非单字符区域为第一矩形边界对应的最大稳定极值区域;第一矩形边界为位于其它矩形边界的内部的矩形边界、面积大于第二预设阈值的矩形边界、或长宽比大于第三预设阈值的矩形边界。其中,第二预设阈值大于或等于字符在身份证图像中所对应的面积值。第三预设阈值的大小取决于字符的形状,如字符的形状为字符,那么第三预设阈值可以设为1.5,这是因为通常情况下规则字符的矩形边界的长度比都不会大于1.5。在一些情况下,单字符区域内部也会包裹更小的最大稳定极值区域,因此,还需要将位于其它矩形边界的内部的矩形边界对应的最大稳定极值区域滤除。
步骤204,对所有的单字符区域进行分组,得到多个单字符区域组。其中,单字符区域组中任意相邻的两个单字符区域之间的距离小于第一预设阈值。本步骤已在上文中作了详细介绍,故在此不作赘述。
步骤205,获取长度最大的单字符区域组。本步骤已在上文中作了详细介绍,故在此不作赘述。
步骤206,获取长度最大的单字符区域组的首尾两个单字符区域的连接线段的倾斜值,并将连接线段的倾斜值确定为身份证图像的倾斜值。本步骤已在上文中作了详细介绍,故在此不作赘述。
本发明实施例通过滤除非单字符区域,从而保证得到的剩余最大稳定极值区域均为单字符区域,从而避免了非单字符区域的对后续计算的干拢,从而提高了对身份证图像的倾斜值计算的精确度。
请参照图3,是本发明实施例的身份证图像的倾斜值获取方法的第三流程示意图。该方法包括:
步骤301,解析身份证图像,提取多个单字符区域。本步骤已在上文中作了详细介绍,故在此不作赘述。
步骤302,获取第一单字符区域。其中,对于首次获取的单字符区域组而言,第一单字符区域可从提取的所有的单字符区域中随机选择;对于非首次获取的单字符区域组而言,第一单字符区域需要从剩余的单字符区域中随机选择。其中,剩余的单字符区域是指从所有的单字符区域中,剔除掉已经获取的单字符区域组后得到的多个单字符区域。
步骤303,获取与第一单字符区域的距离小于第一预设阈值的所有的第二单字符区域。其中,单字符区域组中任意相邻的两个单字符区域之间的距离小于第一预设阈值。进一步地,为了尽可能将身份证图像上位于同一行的所有单字符区域均分为同一组中,任一单字符区域组中的任一单字符区域与另一单字符区域组中的任一单字符区域之间的距离大于或等于第一预设阈值。第一预设阈值已经在上文中,作了详细介绍,故在此不作赘述。
针对于同一行的单字符区域而言,位于中间的单字符区域通常会具有至少两个与之距离小于第一预设阈值的单字符区域,因此,为了得到所有的位于同一行的单字符区域,需要获取所有的第二单字符区域。
步骤304,直至获取与第n-1单字符区域的距离小于第一预设阈值的所有的第n字单字符区域。本步骤可以理解为:依次以新获取到的单字符区域为基准,获取与该基准距离小于第一预设阈值的所有的单字符区域,直至第n单字符区域。为了保证不重复获取单字符区域,第一单字符区域、第二单字符区域直至第n单字符区域各不相同。其中,n可以为预设定值,例如n可以为10。此外,n也可以为一个不定值,为了尽可能将身份证图像上位于同一行的所有单字符区域均分为同一组中,步骤304具体为:获取与第n-1单字符区域的距离小于第一预设阈值的所有的第n字单字符区域,直至第n+1单字符区域获取失败。其中,第n+1单字符区域与第一单字符区域、第二单字符区域直至第n单字符区域各不相同。
具体地,本步骤包括:获取与第二单字符区域的距离小于第一预设阈值的所有的第三单字符区域;获取与第三单字符区域的距离小于第一预设阈值的所有的第四单字符区域……直至获取与第n-1单字符区域的距离小于第一预设阈值的所有的第n单字符区域。在实施本步骤的过程中,由于第三单字符区域和第一字符区域与均第二字符区域的距离小于第一预设阈值,这样,就会导致获取的第三单字符区域和之前获取的第一单字符区域重复,因此,在实施步骤304中的过程,为了保证当前获取的单字符区域与之前获取的所有的单字符区域均不同,具体地,在获取与第k-1单字符区域小于第一预设阈值的所有的第k单字符区域的步骤之后,可以判断新获取的第k单字符区域与之前获取的所有的单字符区域(包括所有的第一单字符区域、第二单字符区域直至第k单字符区域)是否有重合,若有重合,则结束进程,若没有重合,则执行下一步骤:以最新获取到的单字符区域为基准(即第k单字符区域),获取与该基准距离(k单字符区域)小于第一预设阈值的所有的第k+1单字符区域。其中,k小于或等于n-1。
步骤305,将第一单字符区域、第二单字符区域直至第n单字符区域确定为单字符区域组。
步骤306,获取长度最大的单字符区域组。本步骤已在上文中作了详细介绍,故在此不作赘述。
步骤307,获取长度最大的单字符区域组的首尾两个单字符区域的连接线段的倾斜值,并将连接线段的倾斜值确定为身份证图像的倾斜值。本步骤已在上文中作了详细介绍,故在此不作赘述。
本发明实施例,可以尽可能将身份证图像上位于同一行的所有单字符区域均分为同一组中,以便于提高身份证图像的倾斜值计算的精确度。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
上文针对本发明实施例的身份证图像的倾斜值获取方法做了详细介绍,下面将相对于上述方法的装置做进一步阐述。
请参照图4,是本发明实施例的身份证图像的倾斜值获取装置结构示意图。身份证图像包括按序排列的多个字符。倾斜值获取装置包括解析模块401、分组模块402、获取模块403和倾斜值确定模块404。
解析模块401,用于解析身份证图像,提取所有的单字符区域。其中,单字符区域为包含单个字符的区域。
分组模块402,用于对所有的单字符区域进行分组,得到多个单字符区域组。其中,单字符区域组中任意相邻的两个单字符区域之间的距离小于第一预设阈值。优选地,分组模块402进一步包括第一单字符区域获取单元、第二单字符区域获取单元、依次获取单元和单字符区域组确定单元。其中,第一单字符区域获取单元,用于获取第一单字符区域。第二单字符区域获取单元,用于获取与第一单字符区域的距离小于所述第一预设阈值的所有的第二单字符区域。依次获取单元,用于直至获取与第n-1单字符区域的距离小于所述第一预设阈值的所有的第n字单字符区域(即依次以新获取到的单字符区域为基准,获取与基准距离小于第一预设阈值的所有的单字符区域,直至第n单字符区域)。其中,n大于等于2,且第一单字符区域、第二单字符区域直至第n单字符区域不相同。单字符区域组确定单元,用于将第一单字符区域、第二单字符区域直至第n单字符区域确定为单字符区域组。
获取模块403用于获取长度最大的单字符区域组。获取模块403包括长度计算单元和筛选单元。长度计算单元,用于分别计算各单字符区域组的长度。筛选单元,用于筛选出长度最大的单字符区域组。
优选地,长度计算单元进一步用于获取单字符区域组的首尾两个单字符区域的连接线段的长度;将连接线段的长度确定为该单字符区域组的长度。其中,获取单字符区域组的首尾两个单字符区域的连接线段的长度的步骤,包括:获取当前单字符区域组中任两个单字符区域之间的距离,并筛选出最大距离;将该最大距离确定为当前单字符区域组的首尾两个单字符区域的连接线段的长度。筛选单元进一步用于获取的所有连接线段的长度中,筛选出最大长度,并将最大长度对应的单字符区域组确定为长度最大的单字符区域组。
倾斜值确定模块404,用于获取长度最大的单字符区域组的首尾两个单字符区域的连接线段的倾斜值,并将连接线段的倾斜值确定为身份证图像的倾斜值。其中,连接线段是将首尾两个单字符区域各自的参照点作为端点的线段。其中,参照点具体为单字符区域的几何中心点。通过获取连接线段的两端点的坐标,即可以得到连接线段的倾斜值。倾斜值可以为倾斜角度,也可以为斜率。由于各个字符的形状不一,这就会导致提取的各单字符区域的几何中心点不能同时位于同一直线上,因此,通过获取长度最大的单字符区域组的首尾两个单字符区域的连接线段的倾斜值,可以尽量减少误差,使其接近于真实的身份证图像的倾斜值。
本发明实施例通过提取身份证图像上的单字符区域,并将连接单字符区域的直线的倾斜值,确定为身份证图像的倾斜值,由于字符的颜色相对于身份图像本身的颜色具有很高的辨识度,因此,可以精确的提取出单字符区域,从而准确的得到身份证图像倾斜值。
本发明实施例还提供了一种终端,包括存储器、处理器以及存储在所述存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述的身份证图像的倾斜值获取方法。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器可以是内部存储器,例如倾斜值获取装置/终端的硬盘或内存。所述存储器也可以是外部存储设备,例如所述倾斜值获取装置/终端上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器还可以既包括所述内部存储器,也包括外部存储设备。所述存储器用于存储所述计算机程序以及所述倾斜值获取装置/终端所需的其他程序和数据。所述存储器还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的倾斜值获取装置/终端和方法,可以通过其它的方式实现。例如,以上所描述的倾斜值获取装置/终端实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
此外,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述的身份证图像的倾斜值获取方法。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
如上所述是结合具体内容提供的一种或多种实施方式,并不认定本发明的具体实施只局限于这些说明。凡与本发明的方法、结构等近似、雷同,或是对于本发明构思前提下做出若干技术推演或替换,都应当视为本发明的保护范围。
Claims (10)
1.一种身份证图像的倾斜值获取方法,其特征在于,包括:
解析身份证图像,提取所有的单字符区域,所述单字符区域为包含单个字符的区域;
对所有的单字符区域进行分组,得到多个单字符区域组;其中,所述单字符区域组中任意相邻的两个单字符区域之间的距离小于第一预设阈值;
获取长度最大的单字符区域组;
获取长度最大的单字符区域组的首尾两个单字符区域的连接线段的倾斜值,并将所述连接线段的倾斜值确定为身份证图像的倾斜值。
2.如权利要求1所述的身份证图像的倾斜值获取方法,其特征在于,所述对所有的单字符区域进行分组,得到多个单字符区域组,包括:
获取第一单字符区域;
获取与所述第一单字符区域的距离小于所述第一预设阈值的所有的第二单字符区域;
直至获取与第n-1单字符区域的距离小于所述第一预设阈值的所有的第n字单字符区域;其中,n大于2,且所述第一单字符区域、所述第二单字符区域直至所述第n单字符区域不相同;将第一单字符区域、第二单字符区域直至第n单字符区域确定为单字符区域组。
3.如权利要求1所述的身份证图像的倾斜值获取方法,其特征在于,所述第一预设阈值小于或等于身份证图像上的字符的最小行间距。
4.如权利要求1所述的身份证图像的倾斜值获取方法,其特征在于,所述获取长度最大的单字符区域组,包括:
分别获取各单字符区域组的首尾两个单字符区域的连接线段的长度;
从获取的所有连接线段的长度中,筛选出最大长度,并将所述最大长度对应的单字符区域组确定为长度最大的单字符区域组。
5.如权利要求4所述的身份证图像的倾斜值获取方法,其特征在于,所述分别获取各单字符区域组的首尾两个单字符区域的连接线段的长度,包括:
获取当前单字符区域组中任两个单字符区域之间的距离,并筛选出最大距离;
将所述最大距离确定为当前单字符区域组的首尾两个单字符区域的连接线段的长度。
6.如权利要求1所述的身份证图像的倾斜值获取方法,其特征在于,所述解析身份证图像,提取多个单字符区域,包括:
解析身份证图像,提取所有的最大稳定极值区域;
从所有的最大稳定极值区域中滤除非单字符区域,得到多个所述单字符区域。
7.如权利要求6所述的身份证图像的倾斜值获取方法,其特征在于,所述非单字符区域为第一矩形边界对应的最大稳定极值区域;
所述解析身份证图像,提取所有的最大稳定极值区域之后,还包括:
分别为各所述最大稳定极值区域确定矩形边界;
所述从所有的最大稳定极值区域中滤除非字符特征区域,包括:
检测是否有所述第一矩形边界,所述第一矩形边界为位于其它矩形边界的内部的矩形边界、面积大于第二预设阈值的矩形边界、或长宽比大于第三预设阈值的矩形边界;
若检测有第一矩形边界,则从所有的最大稳定极值区域中将第一矩形边界对应的最大稳定极值区域滤除。
8.一种身份证图像的倾斜值获取装置,其特征在于,包括:
解析模块,用于解析身份证图像,提取所有的单字符区域,所述单字符区域为包含单个字符的区域;
分组模块,用于对所有的单字符区域进行分组,得到多个单字符区域组,所述单字符区域组中任意相邻的两个单字符区域之间的距离小于第一预设阈值;
获取模块,用于获取长度最大的单字符区域组;
倾斜值确定模块,用于获取长度最大的单字符区域组的首尾两个单字符区域的连接线段的倾斜值,并将所述连接线段的倾斜值确定为身份证图像的倾斜值。
9.一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7任一项所述的身份证图像的倾斜值获取方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的身份证图像的倾斜值获取方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710631668.XA CN108268868B (zh) | 2017-07-28 | 2017-07-28 | 身份证图像的倾斜值获取方法及装置、终端、存储介质 |
PCT/CN2018/081222 WO2019019681A1 (zh) | 2017-07-28 | 2018-03-30 | 身份证图像的倾斜值获取方法及装置、终端、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710631668.XA CN108268868B (zh) | 2017-07-28 | 2017-07-28 | 身份证图像的倾斜值获取方法及装置、终端、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108268868A true CN108268868A (zh) | 2018-07-10 |
CN108268868B CN108268868B (zh) | 2020-07-10 |
Family
ID=62771728
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710631668.XA Active CN108268868B (zh) | 2017-07-28 | 2017-07-28 | 身份证图像的倾斜值获取方法及装置、终端、存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108268868B (zh) |
WO (1) | WO2019019681A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109522892A (zh) * | 2018-09-29 | 2019-03-26 | 北明智通(北京)科技有限公司 | 神经网络辅助的文字图像信息标注方法 |
CN111914836A (zh) * | 2020-07-08 | 2020-11-10 | 浙江大华技术股份有限公司 | 一种身份证信息提取方法、装置、设备和介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111767787B (zh) * | 2020-05-12 | 2023-07-18 | 北京奇艺世纪科技有限公司 | 身份证图像的正反面判断方法、装置、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101408937A (zh) * | 2008-11-07 | 2009-04-15 | 东莞市微模式软件有限公司 | 一种字符行定位的方法及装置 |
CN102955941A (zh) * | 2011-08-31 | 2013-03-06 | 汉王科技股份有限公司 | 身份信息录入方法和装置 |
CN104680161A (zh) * | 2015-01-09 | 2015-06-03 | 安徽清新互联信息科技有限公司 | 一种身份证数字识别方法 |
US20150193667A1 (en) * | 2014-01-08 | 2015-07-09 | Qualcomm Incorporated | Processing text images with shadows |
CN106815583A (zh) * | 2017-01-16 | 2017-06-09 | 上海理工大学 | 一种基于mser和swt相结合的夜间车辆车牌定位方法 |
CN106846339A (zh) * | 2017-02-13 | 2017-06-13 | 广州视源电子科技股份有限公司 | 一种图像检测方法和装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156767A (zh) * | 2016-03-02 | 2016-11-23 | 平安科技(深圳)有限公司 | 行驶证有效期自动提取方法、服务器及终端 |
CN107239776B (zh) * | 2017-05-08 | 2020-05-01 | 京东数字科技控股有限公司 | 倾斜图像校正的方法和装置 |
CN107169489B (zh) * | 2017-05-08 | 2020-03-31 | 北京京东金融科技控股有限公司 | 倾斜图像校正的方法和装置 |
-
2017
- 2017-07-28 CN CN201710631668.XA patent/CN108268868B/zh active Active
-
2018
- 2018-03-30 WO PCT/CN2018/081222 patent/WO2019019681A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101408937A (zh) * | 2008-11-07 | 2009-04-15 | 东莞市微模式软件有限公司 | 一种字符行定位的方法及装置 |
CN102955941A (zh) * | 2011-08-31 | 2013-03-06 | 汉王科技股份有限公司 | 身份信息录入方法和装置 |
US20150193667A1 (en) * | 2014-01-08 | 2015-07-09 | Qualcomm Incorporated | Processing text images with shadows |
CN104680161A (zh) * | 2015-01-09 | 2015-06-03 | 安徽清新互联信息科技有限公司 | 一种身份证数字识别方法 |
CN106815583A (zh) * | 2017-01-16 | 2017-06-09 | 上海理工大学 | 一种基于mser和swt相结合的夜间车辆车牌定位方法 |
CN106846339A (zh) * | 2017-02-13 | 2017-06-13 | 广州视源电子科技股份有限公司 | 一种图像检测方法和装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109522892A (zh) * | 2018-09-29 | 2019-03-26 | 北明智通(北京)科技有限公司 | 神经网络辅助的文字图像信息标注方法 |
CN111914836A (zh) * | 2020-07-08 | 2020-11-10 | 浙江大华技术股份有限公司 | 一种身份证信息提取方法、装置、设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2019019681A1 (zh) | 2019-01-31 |
CN108268868B (zh) | 2020-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105894464B (zh) | 一种中值滤波图像处理方法和装置 | |
CN110766736A (zh) | 缺陷检测方法、装置、电子设备以及存储介质 | |
CN108268868A (zh) | 身份证图像的倾斜值获取方法及装置、终端、存储介质 | |
CN107680108B (zh) | 倾斜图像的倾斜值获取方法、装置、终端及存储介质 | |
KR20170137170A (ko) | 텍스트 이미지 처리 방법 및 장치 | |
CN111383186B (zh) | 一种图像处理方法、装置及终端设备 | |
CN110555847A (zh) | 一种基于卷积神经网络的图像处理方法及装置 | |
CN109785246B (zh) | 一种非局部均值滤波的降噪方法、装置及设备 | |
CN108717744B (zh) | 识别金融单据上的印章序号的方法、装置及终端设备 | |
CN111091572B (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
CN109308465A (zh) | 表格线检测方法、装置、设备及计算机可读介质 | |
CN103295227B (zh) | 一种基于梯度方向分割的圆检测方法 | |
CN108334879A (zh) | 一种区域提取方法、系统及终端设备 | |
CN109508571B (zh) | 一种条空定位方法、装置、电子设备及存储介质 | |
CN110335322B (zh) | 基于图像的道路识别方法及道路识别装置 | |
CN110110697B (zh) | 基于方向矫正的多指纹分割提取方法、系统、设备及介质 | |
CN104933433A (zh) | 一种图像处理方法及电子设备 | |
CN112614074B (zh) | 一种基于响应图和聚类的鲁棒灭点检测方法及装置 | |
CN109978903A (zh) | 一种标识点识别方法、装置、电子设备及存储介质 | |
CN108510636B (zh) | 图像分割方法、图像分割装置及终端设备 | |
CN111862343A (zh) | 一种三维重建方法、装置、设备及计算机可读存储介质 | |
CN112767491B (zh) | 焊道拐点的确定方法、装置和计算机可读存储介质 | |
CN107085727B (zh) | 一种图像边界函数的确定方法及其装置 | |
CN108629219A (zh) | 一种识别一维码的方法及装置 | |
CN112613088B (zh) | 图形识别方法、图形识别装置及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |