CN107967479B

CN107967479B - 一种带污损票据的字符识别方法及系统

Info

Publication number: CN107967479B
Application number: CN201610911556.5A
Authority: CN
Inventors: 翟云龙
Original assignee: Shenzhen Yihua Computer Co Ltd; Shenzhen Yihua Time Technology Co Ltd; Shenzhen Yihua Financial Intelligent Research Institute
Current assignee: Shenzhen Yihua Computer Co Ltd; Shenzhen Yihua Time Technology Co Ltd; Shenzhen Yihua Financial Intelligent Research Institute
Priority date: 2016-10-19
Filing date: 2016-10-19
Publication date: 2021-11-12
Anticipated expiration: 2036-10-19
Also published as: CN107967479A

Abstract

本发明公开了一种带污损票据的字符识别方法及系统。该方法包括：获取带污损的字符票据图像的所有轮廓；计算所述所有轮廓中每一个轮廓的质心纵坐标和周长；根据所述质心纵坐标和周长识别字符的轮廓；根据所述字符的轮廓对所述字符进行识别。根据字符轮廓的周长特征和质心纵坐标特征能有效剔除不符合字符轮廓特征的轮廓，排除污损对识别字符的干扰，从而准确的识别字符的轮廓，有利于提高字符识别的准确率。

Description

一种带污损票据的字符识别方法及系统

技术领域

本发明涉及字符识别技术领域，尤其涉及一种带污损票据的字符识别方法及系统。

背景技术

票据文件在采集图像的过程中，图像经常会带有污损，也容易出现倾斜，污损和倾斜都会对票据文件中字符号码的识别造成一定的干扰，降低票据文件中字符号码识别的准确性。

发明内容

本发明提供了一种带污损票据的字符识别方法及系统，该方法及系统可以排除污损对字符识别的干扰，准确识别字符的轮廓，提高字符识别的准确率。

为实现上述设计，本发明采用以下技术方案：

一方面，提供了一种带污损票据的字符识别方法，包括：

获取带污损的字符票据图像的所有轮廓；

计算所述所有轮廓中每一个轮廓的质心纵坐标和周长；

根据所述质心纵坐标和周长识别字符的轮廓；

根据所述字符的轮廓对所述字符进行识别。

其中，所述根据所述质心纵坐标和周长识别字符的轮廓，包括：

根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析；

根据所述聚类分析的结果识别字符的轮廓。

其中，所述根据所述字符的轮廓对所述字符进行识别，包括：

根据所述字符的轮廓计算所述字符的轮廓的二阶中心距，根据所述二阶中心距计算所述字符的倾斜角；

根据所述倾斜角对所述字符进行矫正，识别矫正后的字符。

其中，所述根据所述倾斜角对所述字符进行矫正，识别矫正后的字符，包括：

当所述倾斜角小于等于预设第一角度时，不需要对所述字符进行矫正，直接识别所述字符；

当所述倾斜角大于所述预设第一角度且小于等于预设第二角度时，根据所述倾斜角对所述字符进行矫正，识别矫正后的字符；

当所述倾斜角大于预设第二角度时，确定所述倾斜角存在异常，结束识别字符操作。

其中，所述预设第一角度为1°～3°，所述预设第二角度为9°～11°。

其中，所述根据所述二阶中心距计算所述字符的倾斜角的计算公式为：

其中，所述θ表示倾斜角，

p+q＝2，h表示字符的高度，w表示字符的宽度，f(x，y)表示坐标(x，y)处的图像二值化后的值，取0或1，(x，y)表示字符的坐标，

表示字符的重心坐标。

其中，所述获取带污损的字符票据图像的所有轮廓，包括：

对带污损的字符票据图像进行滤波；

获取滤波后的字符票据图像的所有轮廓。

另一方面，提供了一种带污损票据的字符识别系统，包括：

第一获取单元，用于获取带污损的字符票据图像的所有轮廓；

第一计算单元，用于计算所述所有轮廓中每一个轮廓的质心纵坐标和周长；

第一识别单元，用于根据所述质心纵坐标和周长识别字符的轮廓；

第二识别单元，用于根据所述字符的轮廓对所述字符进行识别。

其中，所述第一获取单元包括：

滤波单元，用于对带污损的字符票据图像进行滤波；

第二获取单元，用于获取滤波后的字符票据图像的所有轮廓；

所述第一识别单元包括：

聚类分析单元，用于根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析；

第三识别单元，用于根据所述聚类分析的结果识别字符的轮廓；

所述第二识别单元包括：

第二计算单元，用于根据所述字符的轮廓计算所述字符的轮廓的二阶中心距，根据所述二阶中心距计算所述字符的倾斜角；

矫正单元，用于根据所述倾斜角对所述字符进行矫正，识别矫正后的字符。

其中，所述矫正单元包括：

直接识别单元，用于当所述倾斜角小于等于预设第一角度时，不需要对所述字符进行矫正，直接识别所述字符；

矫正识别单元，用于当所述倾斜角大于所述预设第一角度且小于等于预设第二角度时，根据所述倾斜角对所述字符进行矫正，识别矫正后的字符；

结束识别单元，用于当所述倾斜角大于预设第二角度时，确定所述倾斜角存在异常，结束识别字符操作；

所述根据所述二阶中心距计算所述字符的倾斜角的计算公式为：

其中，所述θ表示倾斜角，

表示字符的重心坐标；

所述预设第一角度为1°～3°，所述预设第二角度为9°～11°。

本发明的有益效果为：本发明实施例通过获取带污损的字符票据图像的所有轮廓；计算所述所有轮廓中每一个轮廓的质心纵坐标和周长；根据所述质心纵坐标和周长识别字符的轮廓；根据所述字符的轮廓对所述字符进行识别。根据字符轮廓的周长特征和质心纵坐标特征能有效剔除不符合字符轮廓特征的轮廓，排除污损对识别字符的干扰，从而准确的识别字符的轮廓，有利于提高字符识别的准确率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对本发明实施例描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据本发明实施例的内容和这些附图获得其他的附图。

图1是本发明具体实施方式中提供的一种带污损票据的字符识别方法的第一实施例的方法流程图。

图2是本发明具体实施方式中提供的一种带污损票据的字符识别方法的第二实施例的方法流程图。

图3是本发明具体实施方式中提供的一种带污损票据的字符识别系统的第一实施例的结构方框图。

图4是本发明具体实施方式中提供的一种带污损票据的字符识别系统的第二实施例的结构方框图。

具体实施方式

为使本发明解决的技术问题、采用的技术方案和达到的技术效果更加清楚，下面将结合附图对本发明实施例的技术方案作进一步的详细描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参考图1，其是本发明具体实施方式中提供的一种带污损票据的字符识别方法的第一实施例的方法流程图。如图所示，该方法包括：

步骤101：获取带污损的字符票据图像的所有轮廓。

所述获取带污损的字符票据图像的所有轮廓，包括：对带污损的字符票据图像进行滤波；获取滤波后的字符票据图像的所有轮廓。对带污损的字符票据图像进行滤波，能有效消除图像上的噪声。可选地，对带污损的字符票据图像进行滤波，具体为：对带污损的字符票据图像采用高斯滤波方法进行滤波；对带污损的字符票据图像进行滤波的滤波方法还可以为：均值滤波、中值滤波、低通滤波、高通滤波和最大均匀性平滑滤波等。可选地，获取滤波后的字符票据图像的所有轮廓，具体为：采用边缘检测算法获取滤波后的字符票据图像的所有轮廓；获取滤波后的字符票据图像的所有轮廓的方法还可以为：分水岭算法、先验知识法、数学形态法等。通过图像滤波、边缘检测能有效去除图像的污损干扰。

步骤102：计算所述所有轮廓中每一个轮廓的质心纵坐标和周长。

步骤103：根据所述质心纵坐标和周长识别字符的轮廓。

所述根据所述质心纵坐标和周长识别字符的轮廓，包括：根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析；根据所述聚类分析的结果识别字符的轮廓。

字符票据图像中，字符的轮廓具有一定的特征，例如：一组字符通常排成一行，因此即使图像中的字符出现倾斜，这组字符轮廓的质心纵坐标基本成直线分布；字符轮廓的周长在一个长度范围内，且通常情况下，字符轮廓的周长相对污损轮廓的周长较长。当字符轮廓的质心纵坐标满足字符轮廓的质心纵坐标的特征，且周长满足字符轮廓的周长长度时，则识别出这个轮廓属于字符轮廓；否则这个轮廓不属于字符的轮廓，属于污损聚类；从而就可以识别出所有轮廓中属于字符的轮廓。

步骤104：根据所述字符的轮廓对所述字符进行识别。

所述根据所述字符的轮廓对所述字符进行识别，包括：根据所述字符的轮廓计算所述字符的轮廓的二阶中心距，根据所述二阶中心距计算所述字符的倾斜角；根据所述倾斜角对所述字符进行矫正，识别矫正后的字符。

综上所述，本发明实施例通过获取带污损的字符票据图像的所有轮廓；计算所述所有轮廓中每一个轮廓的质心纵坐标和周长；根据所述质心纵坐标和周长识别字符的轮廓；根据所述字符的轮廓对所述字符进行识别。根据字符轮廓的周长特征和质心纵坐标特征能有效剔除不符合字符轮廓特征的轮廓，排除污损对识别字符的干扰，从而准确的识别字符的轮廓，有利于提高字符识别的准确率。

请参考图2，其是本发明具体实施方式中提供的一种带污损票据的字符识别方法的第二实施例的方法流程图。如图所示，该方法包括：

步骤201：获取带污损的字符票据图像的所有轮廓。

步骤202：计算所述所有轮廓中每一个轮廓的质心纵坐标和周长。

步骤203：根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析。

步骤204：根据所述聚类分析的结果识别字符的轮廓。

聚类分析能将类似的对象集合起来成为一个聚类；根据质心纵坐标和周长对所有轮廓进行聚类分析，将所有轮廓分为字符轮廓和非字符轮廓(污损轮廓)两类。

字符轮廓的质心纵坐标处在一条直线上，将质心纵坐标处在一条直线上作为字符轮廓进行聚类的一个相似特征；通常情况下，字符轮廓的周长相对污损轮廓的周长较长，且字符轮廓的周长在一个长度范围内，将字符轮廓的周长在一个长度范围内作为字符轮廓进行聚类的另一个相似特征；如果某个轮廓的质心纵坐标不在这条直线上，或者周长不在该长度范围内，则表明该轮廓不属于字符轮廓。只有当字符轮廓的质心纵坐标满足字符轮廓的质心纵坐标的特征，且周长满足字符轮廓的长度范围时，该字符才属于字符轮廓；否则不属于字符轮廓，而属于污损轮廓。

其中，聚类分析的算法包括：划分法(Partitioning Methods)、层次法(Hierarchical Methods)、基于密度的方法(density-based methods)、基于网格的方法(grid-based methods)、基于模型的方法(Model-Based Methods)等。

步骤205：根据所述字符的轮廓计算所述字符的轮廓的二阶中心矩，根据所述二阶中心矩计算所述字符的倾斜角。

二阶中心矩的计算公式为：

其中，p+q＝2，h表示字符的高度，w表示字符的宽度，f(x，y)表示坐标(x，y)处的图像二值化后的值，取0或1，(x，y)表示字符的坐标，

表示字符的重心坐标。

根据二阶中心矩计算所述字符的倾斜角的计算公式为：

其中，θ表示倾斜角，arctan表示反正切函数，

步骤206：根据所述倾斜角对所述字符进行矫正，识别矫正后的字符。

所述根据所述倾斜角对所述字符进行矫正，识别矫正后的字符，包括：当所述倾斜角小于等于预设第一角度时，不需要对所述字符进行矫正，直接识别所述字符；当所述倾斜角大于所述预设第一角度且小于等于预设第二角度时，根据所述倾斜角对所述字符进行矫正，识别矫正后的字符；当所述倾斜角大于预设第二角度时，确定所述倾斜角存在异常，结束识别字符操作。

其中，预设第一角度和预设第二角度可以根据实际情况或经验进行设置，预设第一角度小于预设第二角度。可选地，预设第一角度为1°～3°，预设第二角度为9°～11°。进一步可选地，预设第一角度为2°，所述预设第二角度为10°。例如：当字符的倾斜角为0.5°时，则不需要对字符进行矫正，直接识别字符的后续操作以识别字符；当字符的倾斜角为5°时，则对字符进行角度矫正，使矫正后的字符的倾斜角小于等于2°(通常为0°)，然后对矫正后的字符进行后续的识别；当字符的倾斜角为15°时，则确定字符的倾斜角存在异常，结束识别字符操作，不再对字符进行识别。

综上所述，本发明实施例根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析，可以准确的识别出字符轮廓；使用二阶中心矩能准确计算出字符的倾斜角，且计算简单；根据求得的倾斜角对字符进行矫正，识别矫正后的字符，提高了字符识别的准确率；根据计算得到的倾斜角θ是否满足一定条件进行不同操作(不旋转直接进行后续识别，旋转矫正后继续识别，报错不再进行后续操作)，降低了时间复杂度，节省了时间，提高了识别的效率。

以下为本方案一种带污损票据的字符识别系统的实施例，一种带污损票据的字符识别系统的实施例基于一种带污损票据的字符识别方法的实施例实现，在一种带污损票据的字符识别系统的实施例中未尽的描述，请参考一种带污损票据的字符识别方法的实施例。

请参考图3，其是本发明具体实施方式中提供的一种带污损票据的字符识别系统的第一实施例的结构方框图。如图所示，该系统包括：

第一获取单元310，用于获取带污损的字符票据图像的所有轮廓。

所述第一获取单元310包括：滤波单元311和第二获取单元312。

滤波单元311，用于对带污损的字符票据图像进行滤波。

第二获取单元312，用于获取滤波后的字符票据图像的所有轮廓。

第一计算单元320，用于计算所述所有轮廓中每一个轮廓的质心纵坐标和周长。

第一识别单元330，用于根据所述质心纵坐标和周长识别字符的轮廓。

第一识别单元330包括：聚类分析单元331和第三识别单元332。

聚类分析单元331，用于根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析。

第三识别单元332，用于根据所述聚类分析的结果识别字符的轮廓。

第二识别单元340，用于根据所述字符的轮廓对所述字符进行识别。

所述第二识别单元340包括：第二计算单元341和矫正单元342。

第二计算单元341，用于根据所述字符的轮廓计算所述字符的轮廓的二阶中心距，根据所述二阶中心距计算所述字符的倾斜角。

矫正单元342，用于根据所述倾斜角对所述字符进行矫正，识别矫正后的字符。

综上所述，各单元模块协同工作，第一获取单元310，用于获取带污损的字符票据图像的所有轮廓；第一计算单元320，用于计算所述所有轮廓中每一个轮廓的质心纵坐标和周长；第一识别单元330，用于根据所述质心纵坐标和周长识别字符的轮廓；第二识别单元340，用于根据所述字符的轮廓对所述字符进行识别。根据字符轮廓的周长特征和质心纵坐标特征能有效剔除不符合字符轮廓特征的轮廓，排除污损对识别字符的干扰，从而准确的识别字符的轮廓，有利于提高字符识别的准确率。

请参考图4，其是本发明具体实施方式中提供的一种带污损票据的字符识别系统的第二实施例的结构方框图。如图所示，该系统包括：

所述第一获取单元310包括：滤波单元311和第二获取单元312。

滤波单元311，用于对带污损的字符票据图像进行滤波。

第一识别单元330包括：聚类分析单元331和第三识别单元332。

所述第二识别单元340包括：第二计算单元341和矫正单元342。

其中，所述θ表示倾斜角，所述

表示字符的重心坐标。

所述矫正单元342包括：直接识别单元、矫正识别单元和结束识别单元。

直接识别单元，用于当所述倾斜角小于等于预设第一角度时，不需要对所述字符进行矫正，直接识别所述字符。

矫正识别单元，用于当所述倾斜角大于所述预设第一角度且小于等于预设第二角度时，根据所述倾斜角对所述字符进行矫正，识别矫正后的字符。

结束识别单元，用于当所述倾斜角大于预设第二角度时，确定所述倾斜角存在异常，结束识别字符操作。

所述预设第一角度为1°～3°，所述预设第二角度为9°～11°。

综上所述，各单元模块协同工作，通过根据所述质心纵坐标和周长对所述所有轮廓进行聚类分析，可以准确的识别出字符轮廓；使用二阶中心矩能准确计算出字符的倾斜角，且计算简单；根据求得的倾斜角对字符进行矫正，识别矫正后的字符，提高了字符识别的准确率；根据计算得到的倾斜角θ是否满足一定条件进行不同操作(不旋转直接进行后续识别，旋转矫正后继续识别，报错不再进行后续操作)，降低了时间复杂度，节省了时间，提高了识别的效率。

以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理，而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释，本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式，这些方式都将落入本发明的保护范围之内。