CN108021913A - 证件照片信息识别方法及装置 - Google Patents

证件照片信息识别方法及装置 Download PDF

Info

Publication number
CN108021913A
CN108021913A CN201610963652.4A CN201610963652A CN108021913A CN 108021913 A CN108021913 A CN 108021913A CN 201610963652 A CN201610963652 A CN 201610963652A CN 108021913 A CN108021913 A CN 108021913A
Authority
CN
China
Prior art keywords
certificate photograph
certificate
photograph
local feature
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610963652.4A
Other languages
English (en)
Inventor
王佳军
阎志鹏
李鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN201610963652.4A priority Critical patent/CN108021913A/zh
Publication of CN108021913A publication Critical patent/CN108021913A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)

Abstract

本发明提供一种证件照片信息识别方法及装置,方法包括:获取第一证件照片;提取第一证件照片的局部特征信息;根据第一证件照片的局部特征信息和预存标准证件照片的局部特征信息进行变换获得处于标准位置上的第二证件照片,并获取信息栏位置的截取图片,识别截取图片上的文字信息。本发明提供的一种证件照片信息识别方法及装置,通过将待识别证件照片的局部特征信息和预存标准证件照片的局部特征信息进行变换获得处于标准位置上的待识别证件照片,然后获取信息栏位置的截取图片并识别截取图片上的文字信息,达到快速对证件照片信息进行识别及登记,提升了用户的使用体验。

Description

证件照片信息识别方法及装置
技术领域
本发明涉及计算机处理技术领域,尤其涉及一种证件照片信息识别方法及装置。
背景技术
证件是指用来证明身份、经历等的证书和文件。大部分的工作岗位都须要持有有效的证件才可以上岗进行工作。例如:司机需要驾驶证和车辆行驶证才能上路,会计须持有会计证,记者须持有记者证等有效证件。
证件有时候会在使用一定时间之后会被查验及重新办理,以及作为某些福利、索赔等服务事宜的凭证。而这些事情的办理目前均采用较为繁琐的人工处理过程,降低了用户办理体验。
发明内容
本发明提供一种证件照片信息识别方法及装置,用于解决目前在证件识别过程中大多采用较为繁琐的处理过程所带来的用户体验低的问题。
第一方面,本发明提供一种证件照片信息识别方法,包括:
获取第一证件照片,所述第一证件照片为所拍摄的待识别证件照片;
提取所述第一证件照片的局部特征信息;
根据所述第一证件照片的局部特征信息和预存标准证件照片的局部特征信息进行变换获得处于标准位置的第二证件照片;
获取所述第二证件照片上信息栏位置的截取图片;
识别所述截取图片中的文字信息。
优选地,所述提取所述第一证件照片的局部特征信息,包括:
对所述第一证件照片进行检测获取特征点;
根据所述特征点获取特征区域;
根据所述特征区域提取局部特征信息。
优选地,所述根据所述第一证件照片的局部特征信息和预存标准证件照片的局部特征信息进行变换获得处于标准位置上的第二证件照片,包括:
将所述第一证件照片的局部特征信息和预存标准证件照片的局部特征信息进行匹配,获得相匹配的特征点;
根据相匹配的特征点进行计算获得透视变换矩阵;
根据所述透视变换矩阵将第一证件照片变换得到处于标准位置上的第二证件照片。
优选地,在证件照片变换过程中,还包括根据判断条件判断是否变换成功的步骤,所述判断条件包括:
所述第一证件照片和所述标准证件照片相匹配的特征点的个数大于预设阈值;
将第二证件照片上四角的点根据所述透视变换矩阵变换到第一证件照片上的对应位置,所述对应位置的四个点之间的连线形成凸四边形。
优选地,在所述识别所述截取图片中的文字信息之前,还包括对所述截取图像进行去燥的步骤。
第二方面,本发明提供一种基于OCR的证件照片信息识别装置,包括:
第一获取模块,用于获取第一证件照片,所述第一证件照片为所拍摄的待识别证件照片;
提取模块,用于提取所述第一证件照片的局部特征信息;
变换模块,用于根据所述第一证件照片的局部特征信息和预存标准证件照片的局部特征信息进行变换获得处于标准位置的第二证件照片;
第二获取模块,用于获取所述第二证件照片上信息栏位置的截取图片;
识别模块,用于识别所述截取图片中的文字信息。
优选地,所述提取模块具体用于:
对所述第一证件照片进行检测获取特征点;
根据所述特征点获取特征区域;
根据所述特征区域提取局部特征信息。
优选地,所述提取模块具体用于:
将所述第一证件照片的局部特征信息和预存标准证件照片的局部特征信息进行匹配,获得相匹配的特征点;
根据相匹配的特征点进行计算获得透视变换矩阵;
根据所述透视变换矩阵将第一证件照片变换得到处于标准位置上的第二证件照片。
优选地,还包括判断模块,用于根据判断条件判断是否变换成功,所述判断条件包括:
所述第一证件照片和所述标准证件照片相匹配的特征点的个数大于预设阈值;
将第二证件照片上四角的点根据所述透视变换矩阵变换到第一证件照片上的对应位置,所述对应位置的四个点之间的连线形成凸四边形。
优选地,还包括噪点去除模块,用于在所述识别所述截取图片中的文字信息之前,对所述截取图像进行去燥处理。
由上述技术方案可知,本发明提供的一种证件照片信息识别方法及装置,通过将待识别证件照片的局部特征信息和预存标准证件照片的局部特征信息进行变换获得处于标准位置的待识别证件照片,然后获取待识别证件照片上信息栏位置的截取图片并识别截取图片上的文字信息,达到快速对证件照片信息进行识别及登记,提升了用户的使用体验。
附图说明
图1为本发明实施例1提供的证件照片信息识别方法的流程示意图;
图2为本发明实施例2提供的证件照片信息识别方法的流程示意图;
图3为本发明实施例3提供的证件照片信息识别方法的流程示意图;
图4为本发明实施例4提供的证件照片信息识别装置的结构示意图;
图5为本发明实施例5提供的证件照片信息识别装置的结构示意图;
图6为本发明实施例6提供的证件照片信息识别装置的结构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
图1示出了本发明实施例1提供的一种证件照片信息识别方法,包括:
S11、获取第一证件照片,所述第一证件照片为所拍摄的待识别证件照片。
在本步骤中,需要说明的是,为了区分变换前和变换后的待识别证件照片,将本步骤所拍摄获取的待识别证件照片作为第一证件照片,即变换前的待识别证件照片。第一证件照片的拍摄可通过手机终端、平板终端、相机等具有拍摄功能的设备所实现。第一证件照片在拍摄过程中,由于拍摄角度和拍摄范围的影响,使拍摄出来的证件照片除了具有证件本身,还包括证件之外的边缘图像。
S12、提取所述第一证件照片的局部特征信息。
在本步骤中,需要说明的是,第一证件照片获取后,需对照片上的局部区域进行特征提取。首先对第一证件照片进行检测获取特征点。所述特征点可为边缘点、角点、区域点、脊点等。在特征点检测和特征提取过程中,局部特征一般可采用边缘检测局部算子法,通过考察图像的某个区域内像素灰度值的变化,利用边缘点像素临近一阶或二阶方向导致的变化规律,使用一些简单算法来检测边缘。还可采用拉普拉斯高斯算法,通过先对图像进行平滑处理再求导,导数过零点的像素点被确认边缘点。上述算法均为较成熟技术,在此不详细说明。但本发明实施例中并不局限于上述算法。
通过算法获得的特征点表现在图像上可能是某些边缘、角点或局部纹理等。根据特征点获取特征区域,根据所述特征区域提取局部特征信息。图像特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。但不一定图像中的每个点在特征计算中都会被用到。故图像特征提取是较成熟的技术,在此不再赘述。
S13、根据所述第一证件照片的局部特征信息和预存标准证件照片的局部特征信息进行变换获得处于标准位置的第二证件照片。
在本步骤中,需要说明的是,预存标准证件照片的局部特征信息的提取也是采用步骤S12所述的特征提取步骤所实现。第二证件照片为变换后的待识别证件照片。
在证件照片变换过程中,将第一证件照片的局部特征信息和预存标准证件照片的局部特征信息进行匹配,获得相匹配的特征点。然后根据相匹配的特征点进行位置计算获得透视变换矩阵。最后根据透视变换矩阵将第一证件照片变换得到处于标准位置上的第二证件照片。即将第一证件照片上的代表证件的图像进行变换到与标准证件照片位置大小相同的第二证件照片。
在本步骤中的透视变换是将图片投影到一个新的视平面,也称作投影映射。在变换过程中,通过变换矩阵所实现。变换矩阵是数学线性代数中的一个概念。在线性代数中,线性变换可以用矩阵表示。故在本步骤中所采用的透视变换矩阵是一个较成熟的技术,在此不再赘述。
S14、获取所述第二证件照片上信息栏位置的截取图片,所述截取图片上包含有预填字符。
在本步骤中,需要说明的是,在第二证件照片上会存在多个信息栏,比如持证人、车辆类型、证件号码等。在本发明的识别过程中,仅需要对证件上信息进行识别,故只需将证件照片上的信息栏进行截图。截取时,可采用多种方式对证件照片上的对应区域进行截图。截取的图片上包含有预先填好的字符。如持证人,可只截取该持证人栏中所填写的姓名区域即可。
S15、识别所述截取图片中的文字信息。
在本步骤中,需要说明的是,在本发明实施例中,可对每个信息栏的截取图片进行二值化处理,获取二值化图片。图像的二值化就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果。二值化的处理便于后期对图片上文字信息的分析及提取。将二值化处理后的图片采用OCR光学字符识别技术分析获取到信息栏位置内的文字信息。OCR光学字符识别是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。该技术是较成熟的技术,在此不再赘述。
本发明实施例1提供的一种证件照片信息识别方法,通过将待识别证件照片的局部特征信息和预存标准证件照片的局部特征信息进行变换获得处于标准位置上的待识别证件照片,然后获取待识别证件照片上信息栏位置的截取图片并识别截取图片上的文字信息,达到快速对证件照片信息进行识别及登记,提升了用户的使用体验。
图2示出了本发明实施例2提供的一种证件照片信息识别方法,包括:
S21、获取第一证件照片,所述第一证件照片为所拍摄的待识别证件照片。
在本步骤中,需要说明的是,为了区分变换前和变换后的待识别证件照片,将本步骤所拍摄获取的待识别证件照片作为第一证件照片,即变换前的待识别证件照片。第一证件照片的拍摄可通过手机终端、平板终端、相机等具有拍摄功能的设备所实现。第一证件照片在拍摄过程中,由于拍摄角度和拍摄范围的影响,使拍摄出来的证件照片除了具有证件本身,还包括证件之外的边缘图像。
S22、提取所述第一证件照片的局部特征信息。
在本步骤中,需要说明的是,第一证件照片获取后,需对照片上的局部区域进行特征提取。首先对第一证件照片进行检测获取特征点。所述特征点可为边缘点、角点、区域点、脊点等。然后根据特征点获取特征区域,根据所述特征区域提取局部特征信息。图像特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。故图像特征提取是较成熟的技术,在此不再赘述。
S23、根据所述第一证件照片的局部特征信息、预存标准证件照片的局部特征信息和判断条件进行变换获得处于标准位置上的第二证件照片。
在本步骤中,需要说明的是,预存标准证件照片的局部特征信息的提取也是采用步骤S22所述的特征提取步骤所实现。第二证件照片为变换后的待识别证件照片。
在证件照片变换过程中,将第一证件照片的局部特征信息和预存标准证件照片的局部特征信息进行匹配,获得相匹配的特征点。然后根据相匹配的特征点进行位置计算获得透视变换矩阵。最后根据透视变换矩阵将第一证件照片变换得到处于标准位置上的第二证件照片。即将第一证件照片上的代表证件的图像进行变换到与标准证件照片位置大小相同的第二证件照片。
在本步骤中的透视变换是将图片投影到一个新的视平面,也称作投影映射。在变换过程中,通过变换矩阵所实现。变换矩阵是数学线性代数中的一个概念。在线性代数中,线性变换可以用矩阵表示。故在本步骤中所采用的透视变换矩阵是一个较成熟的技术,在此不再赘述。
在变换过程中,为了防止变换后的证件照片出现错误,可根据判断条件判断是否变换成功。所述判断条件包括:
第一证件照片和标准证件照片相匹配的特征点的个数大于预设阈值。对于该条件需要说明的是,预存标准证件照片的局部特征信息是固定的,第一证件照片的局部特征信息针对分析情景可获取一定数量的局部特征信息。匹配时,比较这一定数量的局部特征信息与固定的局部特征信息相匹配多少,即存在多少个特征点。该条件需特征点的个数比预设阈值大。
将第二证件照片上四角的点采用所述透视变换矩阵变换到第一证件照片上的对应位置,对应位置上的四个点之间的连线形成凸四边形。对于该条件需要说明的是,若变换后的证件照片出现错误,则第二证件照片上四角的点可能与第一证件照片上四角的点不相近。此时第二证件照片上四角的点通过透视变换矩阵变换到第一证件照片上的对应位置,此时会出现四个位置点之间的连线形不成凸四边形。该条件需四个位置点之间连线形成凸四边形。
上述两个条件需同时满足,方可代表照片变换成功。若不满足上述条件,则需重回步骤S21。
S24、获取所述第二证件照片上信息栏位置的截取图片,所述截取图片上包含有预填字符。
在本步骤中,需要说明的是,在第二证件照片上会存在多个信息栏,比如持证人、车辆类型、证件号码等。在本发明的识别过程中,仅需要对证件上信息进行识别,故只需将证件照片上的信息栏进行截图。截取时,可采用多种方式对证件照片上的对应区域进行截图。截取的图片上包含有预先填好的字符。如持证人,可只截取该持证人栏中所填写的姓名区域即可。
S25、识别所述截取图片中的文字信息。。
在本步骤中,需要说明的是,对每个信息栏的截取图片进行二值化处理,获取二值化图片。图像的二值化就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果。二值化的处理便于后期对图片上文字信息的分析及提取。将二值化处理后的图片采用OCR光学字符识别技术分析获取到信息栏位置内的文字信息。OCR光学字符识别是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。该技术是较成熟的技术,在此不再赘述。
本发明实施例2提供的一种证件照片信息识别方法,通过将待识别证件照片的局部特征信息和预存标准证件照片的局部特征信息和判断条件进行变换获得处于标准位置上的待识别证件照片,然后获取待识别证件照片上信息栏位置的截取图片并识别截取图像上的文字信息,达到快速对证件照片信息进行识别及登记,提升了用户的使用体验。
图3示出了本发明实施例3提供的一种证件照片信息识别方法,包括:
S31、获取第一证件照片,所述第一证件照片为所拍摄的待识别证件照片。
在本步骤中,需要说明的是,为了区分变换前和变换后的待识别证件照片,将本步骤所拍摄获取的待识别证件照片作为第一证件照片,即变换前的待识别证件照片。第一证件照片的拍摄可通过手机终端、平板终端、相机等具有拍摄功能的设备所实现。第一证件照片在拍摄过程中,由于拍摄角度和拍摄范围的影响,使拍摄出来的证件照片除了具有证件本身,还包括证件之外的边缘图像。
S32、提取所述第一证件照片的局部特征信息。
在本步骤中,需要说明的是,第一证件照片获取后,需对照片上的局部区域进行特征提取。首先对第一证件照片进行检测获取特征点。所述特征点可为边缘点、角点、区域点、脊点等。然后根据特征点获取特征区域,根据所述特征区域提取局部特征信息。图像特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。故图像特征提取是较成熟的技术,在此不再赘述。
S33、根据所述第一证件照片的局部特征信息、预存标准证件照片的局部特征信息和判断条件进行变换获得处于标准位置上的第二证件照片。
在本步骤中,需要说明的是,预存标准证件照片的局部特征信息的提取也是采用步骤S32所述的特征提取步骤所实现。第二证件照片为变换后的待识别证件照片。
在证件照片变换过程中,将第一证件照片的局部特征信息和预存标准证件照片的局部特征信息进行匹配,获得相匹配的特征点。然后根据相匹配的特征点进行位置计算获得透视变换矩阵。最后根据透视变换矩阵将第一证件照片变换得到处于标准位置上的第二证件照片。即将第一证件照片上的代表证件的图像进行变换到与标准证件照片位置大小相同的第二证件照片。
在本步骤中的透视变换是将图片投影到一个新的视平面,也称作投影映射。在变换过程中,通过变换矩阵所实现。变换矩阵是数学线性代数中的一个概念。在线性代数中,线性变换可以用矩阵表示。故在本步骤中所采用的透视变换矩阵是一个较成熟的技术,在此不再赘述。
在变换过程中,为了防止变换后的证件照片出现错误,可根据判断条件判断是否变换成功。所述判断条件包括:
第一证件照片和标准证件照片相匹配的特征点的个数大于预设阈值。对于该条件需要说明的是,预存标准证件照片的局部特征信息是固定的,第一证件照片的局部特征信息针对分析情景可获取一定数量的局部特征信息。匹配时,比较这一定数量的局部特征信息与固定的局部特征信息相匹配多少,即存在多少个特征点。该条件需特征点的个数比预设阈值大。
将第二证件照片上四角的点采用所述透视变换矩阵变换到第一证件照片上的对应位置,对应位置上的四个点之间的连线形成凸四边形。对于该条件需要说明的是,若变换后的证件照片出现错误,则第二证件照片上四角的点可能与第一证件照片上四角的点不相近。此时第二证件照片上四角的点通过透视变换矩阵变换到第一证件照片上的对应位置,此时会出现四个位置点之间的连线形不成凸四边形。该条件需四个位置点之间连线形成凸四边形。
上述两个条件需同时满足,方可代表照片变换成功。若不满足上述条件,则需重回步骤S31。
S34、获取所述第二证件照片上信息栏位置的截取图片,所述截取图片上包含有预填字符。
在本步骤中,需要说明的是,在第二证件照片上会存在多个信息栏,比如持证人、车辆类型、证件号码等。在本发明的识别过程中,仅需要对证件上信息进行识别,故只需将证件照片上的信息栏进行截图。截取时,可采用多种方式对证件照片上的对应区域进行截图。截取的图片上包含有预先填好的字符。如持证人,可只截取该持证人栏中所填写的姓名区域即可。
S35、获取所述截取图片的二值化图片,并对二值化图片进行噪点处理。
在本步骤中,需要说明的是,需要对每个信息栏的截取图片进行二值化处理,获取二值化图片。图像的二值化就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果。二值化的处理便于后期对图片上文字信息的分析及提取。
二值化处理后,二值化图片上还可能存在微小噪点,故需对所述二值化图片进行噪点去除。首先需获取二值化图片上黑色像素点连通区域的面积值,将面积值小于预设面积阈值的区域去除。
需要解释说明的是,如在二值化图片上,字符均代表一个黑色像素点连通的区域。而该区域大于预设面积阈值,故不能对该区域进行去除,即保留了二值化图片上的字符。对于那些单独黑点(黑色像素点连通的小区域),其面积可能会小于预设面积阈值,故需对这样的黑点进行去除,增加了从二值化图片上提取字符的准确性。
S36、对噪点去除的二值化图片进行信息栏线条的去除。
在本步骤中,需要说明的是,在证件照片上,在信息栏所填内容下方一般会存在线条。该线条可为虚线,可为实线。为了防止该线条对字符信息的识别,所以也可对该线条进行去除。
线条去除时,首先在二值化图片左右两侧根据预设像素宽度各截取条状图像。在条状图像中会存在一部分线条,该线条在二值化图片上为黑色线条或黑色断点。
在两条条状图像上根据行像素中最多黑色像素点确定左位置点和右位置点。当对条状图像的从上向下进行行扫描检测时,会在黑色线条或黑色短点的区域处检测到黑色像素点。此时将该区域内几行像素中最多像素点的那行看作线条所存在的位置,从而在黑色像素点上缺点一个左位置点和右位置点。
根据左位置点和右位置点计算获得直线方程。该直线方程建立在脱离二值化图片的情况下,故需根据直线方程在二值化图片上获得像素直线。该像素直线可能并不能保证所有所属线条的黑色像素点被去除。故根据像素直线和预设扩展区域值获得像素区域。即根据像素直线向两侧扩展一下。最后将所述像素区域中的黑色像素点去除。
S37、根据所述二值化图片获得信息栏位置内的文字信息。
在本步骤中,需要说明的是,将二值化处理后的图片采用OCR光学字符识别技术分析获取到信息栏位置内的文字信息。OCR光学字符识别是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。该技术是较成熟的技术,在此不再赘述。
本发明实施例3提供的一种证件照片信息识别方法,通过将待识别证件照片的局部特征信息和预存标准证件照片的局部特征信息进行变换获得处于标准位置上的待识别证件照片,然后获取待识别证件照片上信息栏位置的截取图片的二值化图片,根据所述二值化图片获得信息栏位置内的文字信息,达到快速对证件照片信息进行识别及登记,提升了用户的使用体验。
图4示出了本发明实施例4提供的一种证件照片信息识别装置,包括第一获取模块41、提取模块42、变换模块43、第二获取模块44和识别模块45,其中:
第一获取模块41,用于获取第一证件照片,所述第一证件照片为所拍摄的待识别证件照片;
提取模块42,用于提取所述第一证件照片的局部特征信息;
变换模块43,用于根据所述第一证件照片的局部特征信息和预存标准证件照片的局部特征信息进行变换获得处于标准位置上的第二证件照片;
第二获取模块44,用于获取所述第二证件照片上信息栏位置的截取图片,所述截取图片上包含有预填字符;
识别模块45,用于识别所述截取图片上的文字信息。
在识别过程中,第一获取模块41获取第一证件照片,并将第一证件照片发送给提取模块42。提取模块42提取第一证件照片的局部特征信息,并将局部特征信息发送给变换模块43。变换模块43根据第一证件照片的局部特征信息和预存标准证件照片的局部特征信息进行变换获得处于标准位置上的第二证件照片,并将第二证件照片发送给第二获取模块44。第二获取模块44获取第二证件照片上信息栏位置的截取图片,并将截取图片发送给识别模块45。识别模块45识别截取图片上的文字信息。
在本发明实施例4中一种证件照片信息识别装置的具体工作过程,可以参考上述的证件照片信息识别方法所描述的内容,在此不再一一赘述。
需要说明的是,本发明实施例中可以通过硬件处理器(hardware processor)来实现相关功能模块。
本发明实施例4提供的一种证件照片信息识别装置,通过将待识别证件照片的局部特征信息和预存标准证件照片的局部特征信息进行变换获得处于标准位置上的待识别证件照片,然后获取待识别证件照片上信息栏位置的截取图片并识别截取图片上的文字信息,达到快速对证件照片信息进行识别及登记,提升了用户的使用体验。
图5示出了本发明实施例提供的一种基于OCR的证件照片信息识别装置,包括第一获取模块51、提取模块52、变换模块53、判断模块54、第二获取模块55和识别模块56,其中:
第一获取模块51,用于获取第一证件照片,所述第一证件照片为所拍摄的待识别证件照片;
提取模块52,用于提取所述第一证件照片的局部特征信息;
变换模块53,用于根据所述第一证件照片的局部特征信息和预存标准证件照片的局部特征信息进行变换获得处于标准位置上的第二证件照片;
判断模块54,用于根据判断条件判断是否变换成功,所述判断条件包括:
所述第一证件照片和所述标准证件照片相匹配的特征点的个数大于预设阈值;
将第二证件照片上四角的点采用所述透视变换矩阵变换到第一证件照片上的对应位置,四个位置点之间的连线形成凸四边形;
第二获取模块55,用于获取所述第二证件照片上信息栏位置的截取图片,所述截取图片上包含有预填字符;
识别模块56,用于识别所述截取图片上的文字信息。
在识别过程中,第一获取模块51获取第一证件照片,并将第一证件照片发送给提取模块52。提取模块52提取第一证件照片的局部特征信息,并将局部特征信息发送给变换模块53。变换模块53根据第一证件照片的局部特征信息和预存标准证件照片的局部特征信息进行变换获得处于标准位置上的第二证件照片,并将第二证件照片发送给判断模块54。判断模块54根据判断条件判断第二证件照片是否为正确的变换照片。判断正确后发送给第二获取模块55。第二获取模块55获取第二证件照片上信息栏位置的截取图片,并将截取图片发送给识别模块56。识别模块56识别截取图片上的文字信息。
在本发明实施例5中一种证件照片信息识别装置的具体工作过程,可以参考上述的证件照片信息识别方法所描述的内容,在此不再一一赘述。
需要说明的是,本发明实施例中可以通过硬件处理器(hardware processor)来实现相关功能模块。
本发明实施例5提供的一种证件照片信息识别装置,通过将待识别证件照片的局部特征信息、预存标准证件照片的局部特征信息和判断条件进行变换获得处于标准位置上的待识别证件照片,然后获取待识别证件照片上信息栏位置的截取图片并识别截取图片上的文字信息,达到快速对证件照片信息进行识别及登记,提升了用户的使用体验。
图6为本发明实施例6提供的一种基于OCR的证件照片信息识别装置,包括第一获取模块61、提取模块62、变换模块63、判断模块64、第二获取模块65、第三获取模块67和识别模块72,其中:
第一获取模块61,用于获取第一证件照片,所述第一证件照片为所拍摄的待识别证件照片;
提取模块62,用于提取所述第一证件照片的局部特征信息;
变换模块63,用于根据所述第一证件照片的局部特征信息和预存标准证件照片的局部特征信息进行变换获得处于标准位置上的第二证件照片;
判断模块64,用于根据判断条件判断是否变换成功,所述判断条件包括:
所述第一证件照片和所述标准证件照片相匹配的特征点的个数大于预设阈值;
将第二证件照片上四角的点采用所述透视变换矩阵变换到第一证件照片上的对应位置,四个位置点之间的连线形成凸四边形;
第二获取模块65,用于获取所述第二证件照片上信息栏位置的截取图片,所述截取图片上包含有预填字符;
第三获取模块66,用于获取所述截取图片的二值化图片;
噪点去除模块67,用于在根据所述二值化图片获得信息栏位置内的文字信息之前,对所述二值化图片进行噪点去除;
线条去除模块68,用于在根据所述二值化图片获取信息栏位置内的文字信息之前,对所述二值化图片进行信息栏线条的去除;
识别模块69,用于根据所述二值化图片获得信息栏位置内的文字信息。
在识别过程中,第一获取模块61获取第一证件照片,并将第一证件照片发送给提取模块62。提取模块62提取第一证件照片的局部特征信息,并将局部特征信息发送给变换模块63。变换模块63根据第一证件照片的局部特征信息和预存标准证件照片的局部特征信息进行变换获得处于标准位置上的第二证件照片,并将第二证件照片发送给判断模块64。判断模块64根据判断条件判断第二证件照片是否为正确的变换照片。判断正确后发送给第二获取模块65。第二获取模块65获取第二证件照片上信息栏位置的截取图片,并将截取图片发送给第三获取模块66。第三获取模块66获取所述截取图片的二值化图片,并将二值化图片发送给噪点处理模块67。噪点处理模块67对二值化图片进行噪点去除,并将去除噪点的二值化图片发送给线条处理模块68。线条处理模块68将二值化图片进行信息栏线条的去除,并发送给识别模块69,识别模块57根据所述二值化图片获得信息栏位置内的文字信息。
在本发明实施例6中一种证件照片信息识别装置的具体工作过程,可以参考上述的证件照片信息识别方法所描述的内容,在此不再一一赘述。
需要说明的是,本发明实施例中可以通过硬件处理器(hardware processor)来实现相关功能模块。
本发明实施例6提供的一种证件照片信息识别装置,通过将待识别证件照片的局部特征信息、预存标准证件照片的局部特征信息和判断条件进行变换获得处于标准位置上的待识别证件照片,然后获取待识别证件照片上信息栏位置的截取图片的二值化图片,根据所述二值化图片获得信息栏位置内的文字信息,达到快速对证件照片信息进行识别及登记,提升了用户的使用体验。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本领域普通技术人员可以理解:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims (10)

1.一种证件信息识别方法,其特征在于,包括:
获取第一证件照片,所述第一证件照片为所拍摄的待识别证件照片;
提取所述第一证件照片的局部特征信息;
根据所述第一证件照片的局部特征信息和预存标准证件照片的局部特征信息进行变换获得处于标准位置的第二证件照片;
获取所述第二证件照片上信息栏位置的截取图片;
识别所述截取图片中的文字信息。
2.根据权利要求1所述的方法,其特征在于,所述提取所述第一证件照片的局部特征信息,包括:
对所述第一证件照片进行检测获取特征点;
根据所述特征点获取特征区域;
根据所述特征区域提取局部特征信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一证件照片的局部特征信息和预存标准证件照片的局部特征信息进行变换获得处于标准位置上的第二证件照片,包括:
将所述第一证件照片的局部特征信息和预存标准证件照片的局部特征信息进行匹配,获得相匹配的特征点;
根据相匹配的特征点进行计算获得透视变换矩阵;
根据所述透视变换矩阵将第一证件照片变换得到处于标准位置的第二证件照片。
4.根据权利要求3所述的方法,其特征在于,在证件照片变换过程中,还包括根据判断条件判断是否变换成功的步骤,所述判断条件包括:
所述第一证件照片和所述标准证件照片相匹配的特征点的个数大于预设阈值;
将第二证件照片上四角的点根据所述透视变换矩阵变换到第一证件照片上的对应位置,所述对应位置的四个点之间的连线形成凸四边形。
5.根据权利要求1所述的方法,其特征在于,在所述识别所述截取图片中的文字信息之前,还包括对所述截取图像进行去噪的步骤。
6.一种证件照片信息识别装置,其特征在于,包括:
第一获取模块,用于获取第一证件照片,所述第一证件照片为所拍摄的待识别证件照片;
提取模块,用于提取所述第一证件照片的局部特征信息;
变换模块,用于根据所述第一证件照片的局部特征信息和预存标准证件照片的局部特征信息进行变换获得处于标准位置的第二证件照片;
第二获取模块,用于获取所述第二证件照片上信息栏位置的截取图片;
识别模块,用于识别所述截取图片中的文字信息。
7.根据权利要求6所述的装置,其特征在于,所述提取模块具体用于:
对所述第一证件照片进行检测获取特征点;
根据所述特征点获取特征区域;
根据所述特征区域提取局部特征信息。
8.根据权利要求6所述的装置,其特征在于,所述提取模块具体用于:
将所述第一证件照片的局部特征信息和预存标准证件照片的局部特征信息进行匹配,获得相匹配的特征点;
根据相匹配的特征点进行计算获得透视变换矩阵;
根据所述透视变换矩阵将第一证件照片变换得到处于标准位置的第二证件照片。
9.根据权利要求6或8所述的装置,其特征在于,还包括判断模块,用于根据判断条件判断是否变换成功,所述判断条件包括:
所述第一证件照片和所述标准证件照片相匹配的特征点的个数大于预设阈值;
将第二证件照片上四角的点根据所述透视变换矩阵变换到第一证件照片上的对应位置,所述对应位置的四个点之间的连线形成凸四边形。
10.根据权利要求7所述的装置,其特征在于,还包括噪点去除模块,用于在所述识别所述截取图片中的文字信息之前,对所述截取图像进行去燥处理。
CN201610963652.4A 2016-10-28 2016-10-28 证件照片信息识别方法及装置 Pending CN108021913A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610963652.4A CN108021913A (zh) 2016-10-28 2016-10-28 证件照片信息识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610963652.4A CN108021913A (zh) 2016-10-28 2016-10-28 证件照片信息识别方法及装置

Publications (1)

Publication Number Publication Date
CN108021913A true CN108021913A (zh) 2018-05-11

Family

ID=62084530

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610963652.4A Pending CN108021913A (zh) 2016-10-28 2016-10-28 证件照片信息识别方法及装置

Country Status (1)

Country Link
CN (1) CN108021913A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110047071A (zh) * 2019-04-26 2019-07-23 杭州智趣智能信息技术有限公司 一种图像质量评估方法、装置和介质
CN110415183A (zh) * 2019-06-18 2019-11-05 平安科技(深圳)有限公司 图片校正方法、装置、计算机设备及计算机可读存储介质
CN111401137A (zh) * 2020-02-24 2020-07-10 中国建设银行股份有限公司 证件栏位识别的方法和装置
CN111767916A (zh) * 2019-11-21 2020-10-13 北京沃东天骏信息技术有限公司 图像检测方法、装置、设备及存储介质
US11250291B2 (en) 2018-09-04 2022-02-15 Advanced New Technologies, Co., Ltd. Information detection method, apparatus, and device

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101957919A (zh) * 2010-09-22 2011-01-26 上海交通大学 基于图像局部特征检索的文字识别方法
CN102074001A (zh) * 2010-11-25 2011-05-25 上海合合信息科技发展有限公司 一种文本图像的拼接方法及系统
CN102509383A (zh) * 2011-11-28 2012-06-20 哈尔滨工业大学深圳研究生院 一种基于特征检测及模板匹配的混合号码识别方法
CN103578125A (zh) * 2012-08-09 2014-02-12 索尼公司 图像处理设备、图像处理方法和程序
CN105320952A (zh) * 2015-10-15 2016-02-10 广东广信通信服务有限公司 一种基于ocr的行驶证信息识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101957919A (zh) * 2010-09-22 2011-01-26 上海交通大学 基于图像局部特征检索的文字识别方法
CN102074001A (zh) * 2010-11-25 2011-05-25 上海合合信息科技发展有限公司 一种文本图像的拼接方法及系统
CN102509383A (zh) * 2011-11-28 2012-06-20 哈尔滨工业大学深圳研究生院 一种基于特征检测及模板匹配的混合号码识别方法
CN103578125A (zh) * 2012-08-09 2014-02-12 索尼公司 图像处理设备、图像处理方法和程序
CN105320952A (zh) * 2015-10-15 2016-02-10 广东广信通信服务有限公司 一种基于ocr的行驶证信息识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
大连海事大学教务处编: "《2005届陆上专业本科优秀毕业设计(论文)摘要选编》", 31 October 2005 *
潘学权等: "《计算机辅助翻译教程》", 30 June 2016 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11250291B2 (en) 2018-09-04 2022-02-15 Advanced New Technologies, Co., Ltd. Information detection method, apparatus, and device
CN110047071A (zh) * 2019-04-26 2019-07-23 杭州智趣智能信息技术有限公司 一种图像质量评估方法、装置和介质
CN110415183A (zh) * 2019-06-18 2019-11-05 平安科技(深圳)有限公司 图片校正方法、装置、计算机设备及计算机可读存储介质
WO2020252920A1 (zh) * 2019-06-18 2020-12-24 平安科技(深圳)有限公司 图片校正方法、装置、计算机设备及计算机可读存储介质
CN111767916A (zh) * 2019-11-21 2020-10-13 北京沃东天骏信息技术有限公司 图像检测方法、装置、设备及存储介质
CN111401137A (zh) * 2020-02-24 2020-07-10 中国建设银行股份有限公司 证件栏位识别的方法和装置

Similar Documents

Publication Publication Date Title
US10699146B2 (en) Mobile document detection and orientation based on reference object characteristics
CN110033471B (zh) 一种基于连通域分析和形态学操作的框线检测方法
CN108021913A (zh) 证件照片信息识别方法及装置
Elrefaei et al. Automatic electricity meter reading based on image processing
CN107491730A (zh) 一种基于图像处理的化验单识别方法
WO2014160433A2 (en) Systems and methods for classifying objects in digital images captured using mobile devices
US9558403B2 (en) Chemical structure recognition tool
EP3588364A1 (en) Within document face verification
CN109740547A (zh) 一种图像处理方法、设备及计算机可读存储介质
US9418316B1 (en) Sharpness-based frame selection for OCR
CN111259891B (zh) 一种自然场景下身份证识别方法、装置、设备和介质
US20170039721A1 (en) Pose detection using depth camera
CN110378351B (zh) 印章鉴别方法及装置
Kanter Color Crack: Identifying Cracks in Glass
JP2014131278A (ja) 印刷された文書の認証方法
CN111784675A (zh) 物品纹理信息处理的方法、装置、存储介质及电子设备
CN108830133A (zh) 合同影像图片的识别方法、电子装置及可读存储介质
US10715683B2 (en) Print quality diagnosis
WO2019061659A1 (zh) 人脸图像眼镜去除方法、装置及存储介质
US11216905B2 (en) Automatic detection, counting, and measurement of lumber boards using a handheld device
CN110991434B (zh) 自助终端证件识别方法及装置
JP6630341B2 (ja) シンボルの光学的検出方法
KR20160083226A (ko) 차량 번호판 인식 장치 및 방법
CN109635679B (zh) 一种实时的靶纸定位及环线识别方法
CN110569716A (zh) 一种货架图像翻拍检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180511