CN107967479B - 一种带污损票据的字符识别方法及系统 - Google Patents

一种带污损票据的字符识别方法及系统 Download PDF

Info

Publication number
CN107967479B
CN107967479B CN201610911556.5A CN201610911556A CN107967479B CN 107967479 B CN107967479 B CN 107967479B CN 201610911556 A CN201610911556 A CN 201610911556A CN 107967479 B CN107967479 B CN 107967479B
Authority
CN
China
Prior art keywords
character
outline
angle
inclination angle
perimeter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610911556.5A
Other languages
English (en)
Other versions
CN107967479A (zh
Inventor
翟云龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yihua Computer Co Ltd
Shenzhen Yihua Time Technology Co Ltd
Shenzhen Yihua Financial Intelligent Research Institute
Original Assignee
Shenzhen Yihua Computer Co Ltd
Shenzhen Yihua Time Technology Co Ltd
Shenzhen Yihua Financial Intelligent Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yihua Computer Co Ltd, Shenzhen Yihua Time Technology Co Ltd, Shenzhen Yihua Financial Intelligent Research Institute filed Critical Shenzhen Yihua Computer Co Ltd
Priority to CN201610911556.5A priority Critical patent/CN107967479B/zh
Publication of CN107967479A publication Critical patent/CN107967479A/zh
Application granted granted Critical
Publication of CN107967479B publication Critical patent/CN107967479B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/752Contour matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种带污损票据的字符识别方法及系统。该方法包括:获取带污损的字符票据图像的所有轮廓;计算所述所有轮廓中每一个轮廓的质心纵坐标和周长;根据所述质心纵坐标和周长识别字符的轮廓;根据所述字符的轮廓对所述字符进行识别。根据字符轮廓的周长特征和质心纵坐标特征能有效剔除不符合字符轮廓特征的轮廓,排除污损对识别字符的干扰,从而准确的识别字符的轮廓,有利于提高字符识别的准确率。

Description

一种带污损票据的字符识别方法及系统
技术领域
本发明涉及字符识别技术领域,尤其涉及一种带污损票据的字符识别方法及系统。
背景技术
票据文件在采集图像的过程中,图像经常会带有污损,也容易出现倾斜,污损和倾斜都会对票据文件中字符号码的识别造成一定的干扰,降低票据文件中字符号码识别的准确性。
发明内容
本发明提供了一种带污损票据的字符识别方法及系统,该方法及系统可以排除污损对字符识别的干扰,准确识别字符的轮廓,提高字符识别的准确率。
为实现上述设计,本发明采用以下技术方案:
一方面,提供了一种带污损票据的字符识别方法,包括:
获取带污损的字符票据图像的所有轮廓;
计算所述所有轮廓中每一个轮廓的质心纵坐标和周长;
根据所述质心纵坐标和周长识别字符的轮廓;
根据所述字符的轮廓对所述字符进行识别。
其中,所述根据所述质心纵坐标和周长识别字符的轮廓,包括:
根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析;
根据所述聚类分析的结果识别字符的轮廓。
其中,所述根据所述字符的轮廓对所述字符进行识别,包括:
根据所述字符的轮廓计算所述字符的轮廓的二阶中心距,根据所述二阶中心距计算所述字符的倾斜角;
根据所述倾斜角对所述字符进行矫正,识别矫正后的字符。
其中,所述根据所述倾斜角对所述字符进行矫正,识别矫正后的字符,包括:
当所述倾斜角小于等于预设第一角度时,不需要对所述字符进行矫正,直接识别所述字符;
当所述倾斜角大于所述预设第一角度且小于等于预设第二角度时,根据所述倾斜角对所述字符进行矫正,识别矫正后的字符;
当所述倾斜角大于预设第二角度时,确定所述倾斜角存在异常,结束识别字符操作。
其中,所述预设第一角度为1°~3°,所述预设第二角度为9°~11°。
其中,所述根据所述二阶中心距计算所述字符的倾斜角的计算公式为:
Figure BDA0001134218980000021
其中,所述θ表示倾斜角,
Figure BDA0001134218980000022
p+q=2,h表示字符的高度,w表示字符的宽度,f(x,y)表示坐标(x,y)处的图像二值化后的值,取0或1,(x,y)表示字符的坐标,
Figure BDA0001134218980000023
表示字符的重心坐标。
其中,所述获取带污损的字符票据图像的所有轮廓,包括:
对带污损的字符票据图像进行滤波;
获取滤波后的字符票据图像的所有轮廓。
另一方面,提供了一种带污损票据的字符识别系统,包括:
第一获取单元,用于获取带污损的字符票据图像的所有轮廓;
第一计算单元,用于计算所述所有轮廓中每一个轮廓的质心纵坐标和周长;
第一识别单元,用于根据所述质心纵坐标和周长识别字符的轮廓;
第二识别单元,用于根据所述字符的轮廓对所述字符进行识别。
其中,所述第一获取单元包括:
滤波单元,用于对带污损的字符票据图像进行滤波;
第二获取单元,用于获取滤波后的字符票据图像的所有轮廓;
所述第一识别单元包括:
聚类分析单元,用于根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析;
第三识别单元,用于根据所述聚类分析的结果识别字符的轮廓;
所述第二识别单元包括:
第二计算单元,用于根据所述字符的轮廓计算所述字符的轮廓的二阶中心距,根据所述二阶中心距计算所述字符的倾斜角;
矫正单元,用于根据所述倾斜角对所述字符进行矫正,识别矫正后的字符。
其中,所述矫正单元包括:
直接识别单元,用于当所述倾斜角小于等于预设第一角度时,不需要对所述字符进行矫正,直接识别所述字符;
矫正识别单元,用于当所述倾斜角大于所述预设第一角度且小于等于预设第二角度时,根据所述倾斜角对所述字符进行矫正,识别矫正后的字符;
结束识别单元,用于当所述倾斜角大于预设第二角度时,确定所述倾斜角存在异常,结束识别字符操作;
所述根据所述二阶中心距计算所述字符的倾斜角的计算公式为:
Figure BDA0001134218980000041
其中,所述θ表示倾斜角,
Figure BDA0001134218980000042
p+q=2,h表示字符的高度,w表示字符的宽度,f(x,y)表示坐标(x,y)处的图像二值化后的值,取0或1,(x,y)表示字符的坐标,
Figure BDA0001134218980000043
表示字符的重心坐标;
所述预设第一角度为1°~3°,所述预设第二角度为9°~11°。
本发明的有益效果为:本发明实施例通过获取带污损的字符票据图像的所有轮廓;计算所述所有轮廓中每一个轮廓的质心纵坐标和周长;根据所述质心纵坐标和周长识别字符的轮廓;根据所述字符的轮廓对所述字符进行识别。根据字符轮廓的周长特征和质心纵坐标特征能有效剔除不符合字符轮廓特征的轮廓,排除污损对识别字符的干扰,从而准确的识别字符的轮廓,有利于提高字符识别的准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据本发明实施例的内容和这些附图获得其他的附图。
图1是本发明具体实施方式中提供的一种带污损票据的字符识别方法的第一实施例的方法流程图。
图2是本发明具体实施方式中提供的一种带污损票据的字符识别方法的第二实施例的方法流程图。
图3是本发明具体实施方式中提供的一种带污损票据的字符识别系统的第一实施例的结构方框图。
图4是本发明具体实施方式中提供的一种带污损票据的字符识别系统的第二实施例的结构方框图。
具体实施方式
为使本发明解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面将结合附图对本发明实施例的技术方案作进一步的详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,其是本发明具体实施方式中提供的一种带污损票据的字符识别方法的第一实施例的方法流程图。如图所示,该方法包括:
步骤101:获取带污损的字符票据图像的所有轮廓。
所述获取带污损的字符票据图像的所有轮廓,包括:对带污损的字符票据图像进行滤波;获取滤波后的字符票据图像的所有轮廓。对带污损的字符票据图像进行滤波,能有效消除图像上的噪声。可选地,对带污损的字符票据图像进行滤波,具体为:对带污损的字符票据图像采用高斯滤波方法进行滤波;对带污损的字符票据图像进行滤波的滤波方法还可以为:均值滤波、中值滤波、低通滤波、高通滤波和最大均匀性平滑滤波等。可选地,获取滤波后的字符票据图像的所有轮廓,具体为:采用边缘检测算法获取滤波后的字符票据图像的所有轮廓;获取滤波后的字符票据图像的所有轮廓的方法还可以为:分水岭算法、先验知识法、数学形态法等。通过图像滤波、边缘检测能有效去除图像的污损干扰。
步骤102:计算所述所有轮廓中每一个轮廓的质心纵坐标和周长。
步骤103:根据所述质心纵坐标和周长识别字符的轮廓。
所述根据所述质心纵坐标和周长识别字符的轮廓,包括:根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析;根据所述聚类分析的结果识别字符的轮廓。
字符票据图像中,字符的轮廓具有一定的特征,例如:一组字符通常排成一行,因此即使图像中的字符出现倾斜,这组字符轮廓的质心纵坐标基本成直线分布;字符轮廓的周长在一个长度范围内,且通常情况下,字符轮廓的周长相对污损轮廓的周长较长。当字符轮廓的质心纵坐标满足字符轮廓的质心纵坐标的特征,且周长满足字符轮廓的周长长度时,则识别出这个轮廓属于字符轮廓;否则这个轮廓不属于字符的轮廓,属于污损聚类;从而就可以识别出所有轮廓中属于字符的轮廓。
步骤104:根据所述字符的轮廓对所述字符进行识别。
所述根据所述字符的轮廓对所述字符进行识别,包括:根据所述字符的轮廓计算所述字符的轮廓的二阶中心距,根据所述二阶中心距计算所述字符的倾斜角;根据所述倾斜角对所述字符进行矫正,识别矫正后的字符。
综上所述,本发明实施例通过获取带污损的字符票据图像的所有轮廓;计算所述所有轮廓中每一个轮廓的质心纵坐标和周长;根据所述质心纵坐标和周长识别字符的轮廓;根据所述字符的轮廓对所述字符进行识别。根据字符轮廓的周长特征和质心纵坐标特征能有效剔除不符合字符轮廓特征的轮廓,排除污损对识别字符的干扰,从而准确的识别字符的轮廓,有利于提高字符识别的准确率。
请参考图2,其是本发明具体实施方式中提供的一种带污损票据的字符识别方法的第二实施例的方法流程图。如图所示,该方法包括:
步骤201:获取带污损的字符票据图像的所有轮廓。
步骤202:计算所述所有轮廓中每一个轮廓的质心纵坐标和周长。
步骤203:根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析。
步骤204:根据所述聚类分析的结果识别字符的轮廓。
聚类分析能将类似的对象集合起来成为一个聚类;根据质心纵坐标和周长对所有轮廓进行聚类分析,将所有轮廓分为字符轮廓和非字符轮廓(污损轮廓)两类。
字符轮廓的质心纵坐标处在一条直线上,将质心纵坐标处在一条直线上作为字符轮廓进行聚类的一个相似特征;通常情况下,字符轮廓的周长相对污损轮廓的周长较长,且字符轮廓的周长在一个长度范围内,将字符轮廓的周长在一个长度范围内作为字符轮廓进行聚类的另一个相似特征;如果某个轮廓的质心纵坐标不在这条直线上,或者周长不在该长度范围内,则表明该轮廓不属于字符轮廓。只有当字符轮廓的质心纵坐标满足字符轮廓的质心纵坐标的特征,且周长满足字符轮廓的长度范围时,该字符才属于字符轮廓;否则不属于字符轮廓,而属于污损轮廓。
其中,聚类分析的算法包括:划分法(Partitioning Methods)、层次法(Hierarchical Methods)、基于密度的方法(density-based methods)、基于网格的方法(grid-based methods)、基于模型的方法(Model-Based Methods)等。
步骤205:根据所述字符的轮廓计算所述字符的轮廓的二阶中心矩,根据所述二阶中心矩计算所述字符的倾斜角。
二阶中心矩的计算公式为:
Figure BDA0001134218980000071
其中,p+q=2,h表示字符的高度,w表示字符的宽度,f(x,y)表示坐标(x,y)处的图像二值化后的值,取0或1,(x,y)表示字符的坐标,
Figure BDA0001134218980000081
表示字符的重心坐标。
根据二阶中心矩计算所述字符的倾斜角的计算公式为:
Figure BDA0001134218980000082
其中,θ表示倾斜角,arctan表示反正切函数,
Figure BDA0001134218980000083
Figure BDA0001134218980000084
Figure BDA0001134218980000085
步骤206:根据所述倾斜角对所述字符进行矫正,识别矫正后的字符。
所述根据所述倾斜角对所述字符进行矫正,识别矫正后的字符,包括:当所述倾斜角小于等于预设第一角度时,不需要对所述字符进行矫正,直接识别所述字符;当所述倾斜角大于所述预设第一角度且小于等于预设第二角度时,根据所述倾斜角对所述字符进行矫正,识别矫正后的字符;当所述倾斜角大于预设第二角度时,确定所述倾斜角存在异常,结束识别字符操作。
其中,预设第一角度和预设第二角度可以根据实际情况或经验进行设置,预设第一角度小于预设第二角度。可选地,预设第一角度为1°~3°,预设第二角度为9°~11°。进一步可选地,预设第一角度为2°,所述预设第二角度为10°。例如:当字符的倾斜角为0.5°时,则不需要对字符进行矫正,直接识别字符的后续操作以识别字符;当字符的倾斜角为5°时,则对字符进行角度矫正,使矫正后的字符的倾斜角小于等于2°(通常为0°),然后对矫正后的字符进行后续的识别;当字符的倾斜角为15°时,则确定字符的倾斜角存在异常,结束识别字符操作,不再对字符进行识别。
综上所述,本发明实施例根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析,可以准确的识别出字符轮廓;使用二阶中心矩能准确计算出字符的倾斜角,且计算简单;根据求得的倾斜角对字符进行矫正,识别矫正后的字符,提高了字符识别的准确率;根据计算得到的倾斜角θ是否满足一定条件进行不同操作(不旋转直接进行后续识别,旋转矫正后继续识别,报错不再进行后续操作),降低了时间复杂度,节省了时间,提高了识别的效率。
以下为本方案一种带污损票据的字符识别系统的实施例,一种带污损票据的字符识别系统的实施例基于一种带污损票据的字符识别方法的实施例实现,在一种带污损票据的字符识别系统的实施例中未尽的描述,请参考一种带污损票据的字符识别方法的实施例。
请参考图3,其是本发明具体实施方式中提供的一种带污损票据的字符识别系统的第一实施例的结构方框图。如图所示,该系统包括:
第一获取单元310,用于获取带污损的字符票据图像的所有轮廓。
所述第一获取单元310包括:滤波单元311和第二获取单元312。
滤波单元311,用于对带污损的字符票据图像进行滤波。
第二获取单元312,用于获取滤波后的字符票据图像的所有轮廓。
第一计算单元320,用于计算所述所有轮廓中每一个轮廓的质心纵坐标和周长。
第一识别单元330,用于根据所述质心纵坐标和周长识别字符的轮廓。
第一识别单元330包括:聚类分析单元331和第三识别单元332。
聚类分析单元331,用于根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析。
第三识别单元332,用于根据所述聚类分析的结果识别字符的轮廓。
第二识别单元340,用于根据所述字符的轮廓对所述字符进行识别。
所述第二识别单元340包括:第二计算单元341和矫正单元342。
第二计算单元341,用于根据所述字符的轮廓计算所述字符的轮廓的二阶中心距,根据所述二阶中心距计算所述字符的倾斜角。
矫正单元342,用于根据所述倾斜角对所述字符进行矫正,识别矫正后的字符。
综上所述,各单元模块协同工作,第一获取单元310,用于获取带污损的字符票据图像的所有轮廓;第一计算单元320,用于计算所述所有轮廓中每一个轮廓的质心纵坐标和周长;第一识别单元330,用于根据所述质心纵坐标和周长识别字符的轮廓;第二识别单元340,用于根据所述字符的轮廓对所述字符进行识别。根据字符轮廓的周长特征和质心纵坐标特征能有效剔除不符合字符轮廓特征的轮廓,排除污损对识别字符的干扰,从而准确的识别字符的轮廓,有利于提高字符识别的准确率。
请参考图4,其是本发明具体实施方式中提供的一种带污损票据的字符识别系统的第二实施例的结构方框图。如图所示,该系统包括:
第一获取单元310,用于获取带污损的字符票据图像的所有轮廓。
所述第一获取单元310包括:滤波单元311和第二获取单元312。
滤波单元311,用于对带污损的字符票据图像进行滤波。
第二获取单元312,用于获取滤波后的字符票据图像的所有轮廓。
第一计算单元320,用于计算所述所有轮廓中每一个轮廓的质心纵坐标和周长。
第一识别单元330,用于根据所述质心纵坐标和周长识别字符的轮廓。
第一识别单元330包括:聚类分析单元331和第三识别单元332。
聚类分析单元331,用于根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析。
第三识别单元332,用于根据所述聚类分析的结果识别字符的轮廓。
第二识别单元340,用于根据所述字符的轮廓对所述字符进行识别。
所述第二识别单元340包括:第二计算单元341和矫正单元342。
第二计算单元341,用于根据所述字符的轮廓计算所述字符的轮廓的二阶中心距,根据所述二阶中心距计算所述字符的倾斜角。
矫正单元342,用于根据所述倾斜角对所述字符进行矫正,识别矫正后的字符。
所述根据所述二阶中心距计算所述字符的倾斜角的计算公式为:
Figure BDA0001134218980000111
其中,所述θ表示倾斜角,所述
Figure BDA0001134218980000112
p+q=2,h表示字符的高度,W表示字符的宽度,f(x,y)表示坐标(x,y)处的图像二值化后的值,取0或1,(x,y)表示字符的坐标,
Figure BDA0001134218980000113
表示字符的重心坐标。
所述矫正单元342包括:直接识别单元、矫正识别单元和结束识别单元。
直接识别单元,用于当所述倾斜角小于等于预设第一角度时,不需要对所述字符进行矫正,直接识别所述字符。
矫正识别单元,用于当所述倾斜角大于所述预设第一角度且小于等于预设第二角度时,根据所述倾斜角对所述字符进行矫正,识别矫正后的字符。
结束识别单元,用于当所述倾斜角大于预设第二角度时,确定所述倾斜角存在异常,结束识别字符操作。
所述预设第一角度为1°~3°,所述预设第二角度为9°~11°。
综上所述,各单元模块协同工作,通过根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析,可以准确的识别出字符轮廓;使用二阶中心矩能准确计算出字符的倾斜角,且计算简单;根据求得的倾斜角对字符进行矫正,识别矫正后的字符,提高了字符识别的准确率;根据计算得到的倾斜角θ是否满足一定条件进行不同操作(不旋转直接进行后续识别,旋转矫正后继续识别,报错不再进行后续操作),降低了时间复杂度,节省了时间,提高了识别的效率。
以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理,而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式,这些方式都将落入本发明的保护范围之内。

Claims (10)

1.一种带污损票据的字符识别方法,其特征在于,包括:
获取带污损的字符票据图像的所有轮廓;
计算所述所有轮廓中每一个轮廓的质心纵坐标和周长;
根据所述质心纵坐标和周长识别字符的轮廓;
当字符轮廓的质心纵坐标满足字符轮廓的质心纵坐标的特征,且周长满足字符轮廓的周长长度时,则识别出这个轮廓属于字符轮廓;否则这个轮廓不属于字符的轮廓,属于污损聚类,其中,所述字符轮廓的周长大于污损轮廓的周长;
根据所述字符的轮廓对所述字符进行识别。
2.根据权利要求1所述的方法,其特征在于,所述根据所述质心纵坐标和周长识别字符的轮廓,包括:
根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析;
根据所述聚类分析的结果识别字符的轮廓。
3.根据权利要求1所述的方法,其特征在于,所述根据所述字符的轮廓对所述字符进行识别,包括:
根据所述字符的轮廓计算所述字符的轮廓的二阶中心距,根据所述二阶中心距计算所述字符的倾斜角;
根据所述倾斜角对所述字符进行矫正,识别矫正后的字符。
4.根据权利要求3所述的方法,其特征在于,所述根据所述倾斜角对所述字符进行矫正,识别矫正后的字符,包括:
当所述倾斜角小于等于预设第一角度时,不需要对所述字符进行矫正,直接识别所述字符;
当所述倾斜角大于所述预设第一角度且小于等于预设第二角度时,根据所述倾斜角对所述字符进行矫正,识别矫正后的字符;
当所述倾斜角大于预设第二角度时,确定所述倾斜角存在异常,结束识别字符操作。
5.根据权利要求4所述的方法,其特征在于,所述预设第一角度为1°~3°,所述预设第二角度为9°~11°。
6.根据权利要求3所述的方法,其特征在于,所述根据所述二阶中心距计算所述字符的倾斜角的计算公式为:
Figure FDA0003167275770000021
其中,所述θ表示倾斜角,
Figure FDA0003167275770000022
p+q=2,h表示字符的高度,w表示字符的宽度,f(x,y)表示坐标(x,y)处的图像二值化后的值,取0或1,(x,y)表示字符的坐标,
Figure FDA0003167275770000023
表示字符的重心坐标。
7.根据权利要求1所述的方法,其特征在于,所述获取带污损的字符票据图像的所有轮廓,包括:
对带污损的字符票据图像进行滤波;
获取滤波后的字符票据图像的所有轮廓。
8.一种带污损票据的字符识别系统,其特征在于,包括:
第一获取单元,用于获取带污损的字符票据图像的所有轮廓;
第一计算单元,用于计算所述所有轮廓中每一个轮廓的质心纵坐标和周长;
第一识别单元,用于根据所述质心纵坐标和周长识别字符的轮廓;
当字符轮廓的质心纵坐标满足字符轮廓的质心纵坐标的特征,且周长满足字符轮廓的周长长度时,则识别出这个轮廓属于字符轮廓;否则这个轮廓不属于字符的轮廓,属于污损聚类,其中,所述字符轮廓的周长大于污损轮廓的周长;
第二识别单元,用于根据所述字符的轮廓对所述字符进行识别。
9.根据权利要求8所述的系统,其特征在于,所述第一获取单元包括:
滤波单元,用于对带污损的字符票据图像进行滤波;
第二获取单元,用于获取滤波后的字符票据图像的所有轮廓;
所述第一识别单元包括:
聚类分析单元,用于根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析;
第三识别单元,用于根据所述聚类分析的结果识别字符的轮廓;
所述第二识别单元包括:
第二计算单元,用于根据所述字符的轮廓计算所述字符的轮廓的二阶中心距,根据所述二阶中心距计算所述字符的倾斜角;
矫正单元,用于根据所述倾斜角对所述字符进行矫正,识别矫正后的字符。
10.根据权利要求9所述的系统,其特征在于,所述矫正单元包括:
直接识别单元,用于当所述倾斜角小于等于预设第一角度时,不需要对所述字符进行矫正,直接识别所述字符;
矫正识别单元,用于当所述倾斜角大于所述预设第一角度且小于等于预设第二角度时,根据所述倾斜角对所述字符进行矫正,识别矫正后的字符;
结束识别单元,用于当所述倾斜角大于预设第二角度时,确定所述倾斜角存在异常,结束识别字符操作;
所述根据所述二阶中心距计算所述字符的倾斜角的计算公式为:
Figure FDA0003167275770000041
其中,所述θ表示倾斜角,
Figure FDA0003167275770000042
p+q=2,h表示字符的高度,w表示字符的宽度,f(x,y)表示坐标(x,y)处的图像二值化后的值,取0或1,(x,y)表示字符的坐标,
Figure FDA0003167275770000043
表示字符的重心坐标;
所述预设第一角度为1°~3°,所述预设第二角度为9°~11°。
CN201610911556.5A 2016-10-19 2016-10-19 一种带污损票据的字符识别方法及系统 Active CN107967479B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610911556.5A CN107967479B (zh) 2016-10-19 2016-10-19 一种带污损票据的字符识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610911556.5A CN107967479B (zh) 2016-10-19 2016-10-19 一种带污损票据的字符识别方法及系统

Publications (2)

Publication Number Publication Date
CN107967479A CN107967479A (zh) 2018-04-27
CN107967479B true CN107967479B (zh) 2021-11-12

Family

ID=61997032

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610911556.5A Active CN107967479B (zh) 2016-10-19 2016-10-19 一种带污损票据的字符识别方法及系统

Country Status (1)

Country Link
CN (1) CN107967479B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113191360A (zh) * 2020-01-14 2021-07-30 深圳怡化电脑股份有限公司 票据的字符轮廓定位方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751785A (zh) * 2010-01-12 2010-06-23 杭州电子科技大学 基于图像处理的车牌自动识别方法
CN101859382A (zh) * 2010-06-03 2010-10-13 复旦大学 一种基于最大稳定极值区域的车牌检测与识别的方法
CN103699876A (zh) * 2013-11-26 2014-04-02 天津商业大学 一种基于线阵ccd图像识别车号的方法及装置
CN104112128A (zh) * 2014-06-19 2014-10-22 中国工商银行股份有限公司 应用于票据影像字符识别的数字图像处理系统及方法
CN105336035A (zh) * 2015-10-28 2016-02-17 深圳怡化电脑股份有限公司 一种脏污冠字号图像分类的方法与系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4050055B2 (ja) * 2002-01-10 2008-02-20 株式会社リコー 手書き文字一括変換装置、手書き文字一括変換方法およびプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751785A (zh) * 2010-01-12 2010-06-23 杭州电子科技大学 基于图像处理的车牌自动识别方法
CN101859382A (zh) * 2010-06-03 2010-10-13 复旦大学 一种基于最大稳定极值区域的车牌检测与识别的方法
CN103699876A (zh) * 2013-11-26 2014-04-02 天津商业大学 一种基于线阵ccd图像识别车号的方法及装置
CN104112128A (zh) * 2014-06-19 2014-10-22 中国工商银行股份有限公司 应用于票据影像字符识别的数字图像处理系统及方法
CN105336035A (zh) * 2015-10-28 2016-02-17 深圳怡化电脑股份有限公司 一种脏污冠字号图像分类的方法与系统

Also Published As

Publication number Publication date
CN107967479A (zh) 2018-04-27

Similar Documents

Publication Publication Date Title
CN110163853B (zh) 一种边缘缺陷的检测方法
CN109785316B (zh) 一种芯片表观缺陷检测方法
CN108389179B (zh) 一种基于机器视觉的罐盖表面缺陷检测方法
CN110119741B (zh) 一种有背景的卡证图像信息识别方法
CN109658402B (zh) 基于计算机视觉成像的工业型材几何尺寸自动检测方法
CN108921813B (zh) 一种基于机器视觉的无人机检测桥梁结构裂缝识别方法
CN102222226B (zh) 一种基于先验分析的迭代式车牌字符分割方法
CN109727244B (zh) 一种磁瓦表面裂纹检测方法
CN109815822B (zh) 基于广义Hough变换的巡检图零部件目标识别方法
CN110047063B (zh) 一种物料掉落的检测方法、装置、设备及存储介质
CN114693610A (zh) 一种基于机器视觉的焊缝表面缺陷检测方法、设备及介质
CN113077437B (zh) 工件质量检测方法及其系统
CN105447489B (zh) 一种图片ocr识别系统的字符与背景粘连噪声消除方法
CN111582000B (zh) 一种条形码定位方法、装置及相关设备
JP5011268B2 (ja) 画像検出装置及び画像検出方法
CN110674812A (zh) 一种面向复杂背景的民用车牌定位与字符分割方法
CN115619845A (zh) 一种自适应扫描文档图像倾斜角检测方法
CN116052152A (zh) 一种基于轮廓检测和深度神经网络的车牌识别系统
CN107967479B (zh) 一种带污损票据的字符识别方法及系统
CN113781413A (zh) 一种基于Hough梯度法的电解电容定位方法
CN116434071B (zh) 一种规整化建筑掩膜的确定方法、确定装置、设备及介质
CN112418210B (zh) 一种杆塔巡检信息智能分类方法
CN112734779A (zh) 一种圆点标定板边缘亚像素检测方法
CN110956200A (zh) 一种轮胎花纹相似度检测方法
CN115511966A (zh) 基于角点检测的元件识别定位方法及系统、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant