CN111191657B

CN111191657B - 一种文字识别方法、装置及计算机可读存储介质

Info

Publication number: CN111191657B
Application number: CN201911137654.8A
Authority: CN
Inventors: 马文伟; 刘设伟; 沈程秀; 闫永泽
Original assignee: Taikang Insurance Group Co Ltd; Taikang Online Property Insurance Co Ltd
Current assignee: Taikang Insurance Group Co Ltd; Taikang Online Property Insurance Co Ltd
Priority date: 2019-11-19
Filing date: 2019-11-19
Publication date: 2023-08-18
Anticipated expiration: 2039-11-19
Also published as: CN111191657A

Abstract

本发明提供了一种文字识别方法、装置及计算机可读存储介质，所述方法包括：针对待识别的圆形印章图像进行二值化处理，得到二值图像；对二值图像中的文字进行区域连通，得到多个连通区域；根据每个连通区域的中心到二值图像的圆心的距离，以及与穿过圆心的射线所相交的连通区域的数量，从多个连通区域中分别确定第一连通区域、第二连通区域；分别对位于第一目标区域中的文字和第二目标区域中的文字进行识别。上述方法将弯曲型文字和直线型文字准确区分开来，提高了文字识别的准确度；并分别对第一连通区域中的文字和第二连通区域中的文字单独进行识别，使得可以按照语义顺序进行提取，降低了文字识别难度。

Description

一种文字识别方法、装置及计算机可读存储介质

技术领域

本发明属于图像处理领域，特别是涉及一种文字识别方法、装置及计算机可读存储介质。

背景技术

日常生活中增值税发票、医疗收费票据等票据均需盖有印章，才能用于报销流程，它是开票单位授权的证明。印章中一般刻有企业名称、印章类型以及印章编号等信息，一般包含两种类型文字行：弯曲型文字行、直线型文字行。其中弯曲型文字行一般代表企业名称，直线型文字行一般表示印章类型、印章编号等。例如，在某医疗门诊收费票据示意图中，印章图像中弯曲型文字行内容为“**市中医医院”、直线型文字行内容分别为“门急诊收费章”和“(30)”。

虽然OCR(Optical Character Recognition，光学字符识别)技术已经相当成熟并应用在多个领域，例如医院化验单、个人体检单等识别，但医疗收费票据依然是OCR技术难以覆盖的领域。多个省或直辖市的众多医疗收费票据中没有直接机打“医院名称”这一关键信息，而是以印章文字的形式出现，因此印章文字的检测与识别至关重要。

但是，目前票据图像中的圆形印章文字检测仍然存在困难，原因主要在于：圆形印章图像文字排列复杂，既有直线型文字也有弯曲型文字，使印章文字难以有效按语义顺序提取，造成文字识别难度加大；并且，现有的文字识别技术在圆形印章图像识别时容易把弯曲型文字和直线型文字交接的地方检测成一行，造成识别结果准确度较低。

发明内容

有鉴于此，本发明提供一种文字识别方法、装置及计算机可读存储介质，在一定程度上解决了目前的圆形印章文字识别难度较大、识别结果准确度较低的问题。

依据本发明的第一方面，提供了一种文字识别方法，所述方法包括：

针对待识别的圆形印章图像进行二值化处理，得到二值图像；

对所述二值图像中的文字进行区域连通，得到多个连通区域；

根据每个所述连通区域的中心到所述二值图像的圆心的距离，以及与穿过所述圆心的射线所相交的所述连通区域的数量，从所述多个连通区域中分别确定呈弯曲型分布的文字的至少一个第一连通区域、呈直线型分布的文字的至少一个第二连通区域；所述至少一个所述第一连通区域形成第一目标区域，所述至少一个所述第二连通区域形成第二目标区域；

分别对位于所述第一目标区域中的文字和所述第二目标区域中的文字进行识别。

可选地，所述从所述多个连通区域中分别确定呈弯曲型分布的文字的至少一个第一连通区域、呈直线型分布的文字的至少一个第二连通区域，包括：

对于每个所述连通区域，计算所述连通区域的中心到所述圆形印章图像的圆心的距离，得到所述连通区域与所述圆心的目标距离；

将所述目标距离相互之间的差值小于或等于预设的距离阈值的连通区域确定为第三连通区域；以及，将剩余的至少一个所述连通区域确定为呈直线型分布的文字的第二连通区域；

针对每个所述第三连通区域，若所述第三连通区域与所述圆心确定的直线与至少两个连通区域相交，则确定所述第三连通区域为所述第二连通区域；

将所述第三连通区域中，剩余的至少一个所述第三连通区域确定为呈弯曲型分布的文字的第一连通区域。

可选地，在针对待识别的圆形印章图像进行二值化处理之前，还包括：

基于RGB颜色空间和CMYK颜色空间对待识别的圆形印章图像进行图像增强。

可选地，所述基于RGB颜色空间和CMYK颜色空间对待识别的圆形印章图像进行图像增强，包括：

对于所述圆形印章图像中的每个像素点，确定所述像素点的R分量、G分量、B分量之间的方差，得到方差矩阵；

对于所述圆形印章图像中的每个像素点，确定所述像素点的R分量与G分量的差值，得到差值矩阵；

在CMYK颜色空间上确定所述圆形印章图像的M分量，得到M分量矩阵；

根据所述方差矩阵、所述差值矩阵、所述M分量矩阵其中的至少一个确定目标矩阵；

基于所述目标矩阵对待识别的圆形印章图像进行图像增强。

可选地，在从所述多个连通区域中分别确定呈弯曲型分布的文字的至少一个第一连通区域、呈直线型分布的文字的至少一个第二连通区域之后，还包括：

根据所述第一目标区域两端的连通区域与过所述圆心的垂线的对称关系将所述圆形印章图像设置到水平状态。

可选地，所述根据所述第一目标区域两端的连通区域与过所述圆心的垂线的对称关系将所述圆形印章图像设置到水平状态包括：

将位于所述第一目标区域两端的连通区域分别确定为第四连通区域和第五连通区域；

确定由所述第四连通区域的中心与圆心的连线、所述第五连通区域的中心与圆心的连线构成的第一夹角的角平分线；

确定所述角平分线与过所述圆形印章图像的圆心的垂线之间的第二夹角；

根据所述第二夹角将所述圆形印章图像设置到水平状态。

可选地，所述分别对位于所述第一目标区域中的文字和所述第二目标区域中的文字进行识别，包括：

采用ASTER算法将所述第一目标区域中的文字设置到正立状态，并确定位于所述第一目标区域中的每个文字的位置，再对所述文字进行识别；

采用EAST算法确定位于所述第二目标区域中的每个文字的位置，并采用CRNN算法对所述文字进行识别。

依据本发明的第二方面，提供了一种文字识别装置，所述装置包括：

二值化处理模块，用于针对待识别的圆形印章图像进行二值化处理，得到二值图像；

区域连通模块，用于对所述二值图像中的文字进行区域连通，得到多个连通区域；

目标区域确定模块，用于根据每个所述连通区域的中心到所述二值图像的圆心的距离，以及与穿过所述圆心的射线所相交的所述连通区域的数量，从所述多个连通区域中分别确定呈弯曲型分布的文字的至少一个第一连通区域、呈直线型分布的文字的至少一个第二连通区域；所述至少一个所述第一连通区域形成第一目标区域，所述至少一个所述第二连通区域形成第二目标区域；

文字识别模块，用于分别对位于所述第一目标区域中的文字和所述第二目标区域中的文字进行识别。

可选地，所述目标区域确定模块包括：

距离计算子模块，用于对于每个所述连通区域，计算所述连通区域的中心到所述圆形印章图像的圆心的距离，得到所述连通区域与所述圆心的目标距离；

区域确定第一子模块，用于将所述目标距离相互之间的差值小于或等于预设的距离阈值的连通区域确定为第三连通区域；以及，将剩余的至少一个所述连通区域确定为呈直线型分布的文字的第二连通区域；

区域确定第二子模块，用于针对每个所述第三连通区域，若所述第三连通区域与所述圆心确定的直线与至少两个连通区域相交，则确定所述第三连通区域为所述第二连通区域；

区域确定第三子模块，用于将所述第三连通区域中，剩余的至少一个所述第三连通区域确定为呈弯曲型分布的文字的第一连通区域。

可选地，所述装置还包括：

图像增强模块，用于基于RGB颜色空间和CMYK颜色空间对待识别的圆形印章图像进行图像增强。

可选地，所述图像增强模块，包括：

方差矩阵确定子模块，用于对于所述圆形印章图像中的每个像素点，确定所述像素点的R分量、G分量、B分量之间的方差，得到方差矩阵；

差值矩阵确定子模块，用于对于所述圆形印章图像中的每个像素点，确定所述像素点的R分量与G分量的差值，得到差值矩阵；

M分类矩阵确定子模块，用于在CMYK颜色空间上确定所述圆形印章图像的M分量，得到M分量矩阵；

目标矩阵确定子模块，用于根据所述方差矩阵、所述差值矩阵、所述M分量矩阵其中的至少一个确定目标矩阵；

图像增强子模块，用于基于所述目标矩阵对待识别的圆形印章图像进行图像增强。

可选地，所述装置还包括：

水平状态设置模块，用于根据所述第一目标区域两端的连通区域与过所述圆心的垂线的对称关系将所述圆形印章图像设置到水平状态。

可选地，所述水平状态设置模块包括：

连通区域确定第四子模块，用于将位于所述第一目标区域两端的连通区域分别确定为第四连通区域和第五连通区域；

角平分线确定子模块，用于确定由所述第四连通区域的中心与圆心的连线、所述第五连通区域的中心与圆心的连线构成的第一夹角的角平分线；

第二夹角确定子模块，用于确定所述角平分线与过所述圆形印章图像的圆心的垂线之间的第二夹角；

设置子模块，用于根据所述第二夹角将所述圆形印章图像设置到水平状态。

可选地，所述文字识别模块，包括：

第一识别子模块，用于采用ASTER算法确定位于所述第一目标区域中的每个文字的位置，并对所述文字进行识别；

第二识别子模块，用于采用EAST算法确定位于所述第二目标区域中的每个文字的位置，并采用CRNN算法对所述文字进行识别。

第三方面，本发明实施例提供了一种电子设备，包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如第一方面所述的文字识别方法的步骤。

第四方面，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的文字识别方法的步骤。

针对在先技术，本发明具备如下优点：

本发明提供的一种文字识别方法和装置，针对待识别的圆形印章图像进行二值化处理，得到二值图像；对所述二值图像中的文字进行区域连通，得到多个连通区域；根据每个所述连通区域的中心到所述二值图像的圆心的距离，以及与穿过所述圆心的射线所相交的所述连通区域的数量，从所述多个连通区域中分别确定呈弯曲型分布的文字的至少一个第一连通区域、呈直线型分布的文字的至少一个第二连通区域；所述至少一个所述第一连通区域形成第一目标区域，所述至少一个所述第二连通区域形成第二目标区域；分别对位于所述第一目标区域中的文字和所述第二目标区域中的文字进行识别。在上述方法中，通过对圆形印章图像对应的二值图像中的文字进行区域连通，得到由弯曲型分布的文字组成的第一连通区域和由直线型分布的文字组成的第二连通区域，从而将弯曲型文字和直线型文字准确的区分开来，提高了文字识别的准确度；并且，可以分别对第一连通区域中的文字和第二连通区域中的文字单独进行识别，使得识别过程中第一连通区域和第二连通区域中的文字可以有效地按照语义顺序进行提取，降低了文字识别难度。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1是本发明实施例提供的一种文字识别方法的步骤流程图；

图2是本发明实施例提供的一种圆形印章的二值图像的示意图；

图3是本发明实施例提供的一种圆形印章的二值图像的连通区域的示意图；

图4是本发明实施例提供的一种第一目标区域和第二目标区域的示意图；

图5是本发明实施例提供的文字识别结果的示意图；

图6是本发明实施例提供的另一种文字识别方法的步骤流程图；

图7是本发明实施例提供的通过连线确定连通区域的示意图；

图8是本发明实施例提供的一种文字识别装置的框图；

图9是本发明实施例提供的另一种文字识别装置的框图。

具体实施方式

下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例，然而应当理解，可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本发明，并且能够将本发明的范围完整的传达给本领域的技术人员。

图1是本发明实施例提供的一种文字识别方法的步骤流程图，应用于终端，如图1所示，该方法可以包括：

步骤101、针对待识别的圆形印章图像进行二值化处理，得到二值图像。

在本发明实施例中，可以将盖有圆形印章的票据进行拍照，得到票据图像，然后从票据图像中提取出圆形印章部分，得到待识别的圆形印章图像。

为了从待识别的圆形印章图像中识别文字，可以将待识别的圆形印章图像进行二值化处理，以提高图像对比度，为后续的印章文字识别作准备。

图像的二值化，就是将图像上的像素点的灰度值设置为0或255，也就是将整个图像呈现出明显的只有黑和白的视觉效果。圆形印章图像具有复杂的纹理背景，且印章一般压盖在票据预打印字以及机打文字上方，造成印章文字对比度较低。在二值化处理时，设定一个全局的阈值T，用T将圆形印章图像的数据分成两部分：大于T的像素群和小于T的像素群。可以将大于T的像素群的像素值设定为白色，小于T的像素群的像素值设定为黑色。圆形印章图像上的纹理背景和机打文字、预打印字的像素值一般与票据背景色接近，相比于印章文字的像素值要小很多。在二值化处理中，采用设定的阈值T将纹理背景和机打文字、预打印字设定为黑色，将印章文字设定为白色，这样，就可以得到一张背景色为黑色，印章文字为白色的二值图像。

图2是本发明实施例提供的一种圆形印章的二值图像的示意图。在图2中，印章文字“上海市中医医院、门急诊收费章、(30)”被二值化为白色，印章图像所在的票据纸张上的纹理背景和机打文字、预打印字被二值化为黑色。其中，印章文字“上海市中医医院”呈弯曲型分布，印章文字“门急诊收费章”和印章文字“(30)”分别呈直线型分布。

步骤102、对所述二值图像中的文字进行区域连通，得到多个连通区域。

在本发明实施例中，连通区域(Connected Component)一般是指图像中具有相同像素值且位置相邻的前景像素点组成的图像区域(Region，Blob)。因此，我们可以通过相同像素值和位置相邻这两个条件在图像中寻找连通区域，寻找连通区域有基本的算法，如Two-Pass(两步)法、Seed-Filling(种子填充)法等。

对于找到的每个连通区域，我们赋予其一个唯一的标识(Label)，以区别其他连通区域。对于本发明实施例中的二值图像，一般情况下，每一个印章文字对应一个连通区域，若印章文字连接过于紧密，也有可能存在两个或更多印章文字对应一个连通区域的情况。总之，最终可以找个多个连通区域。

图3是本发明实施例提供的一种圆形印章的二值图像的连通区域的示意图。在图3中，由虚线所包围的区域为独立的一个连通区域，例如，“上海市中医医院”七个字中，每一个字分别对应一个连通区域；“收费章”三个字对应一个连通区域，“门急诊”三个字对应一个连通区域；此外，“(30)”对应一个连通区域。

步骤103、根据每个所述连通区域的中心到所述二值图像的圆心的距离，以及与穿过所述圆心的射线所相交的所述连通区域的数量，从所述多个连通区域中分别确定呈弯曲型分布的文字的至少一个第一连通区域、呈直线型分布的文字的至少一个第二连通区域；所述至少一个所述第一连通区域形成第一目标区域，所述至少一个所述第二连通区域形成第二目标区域。

在本发明实施例中，对于每一个印章文字对应一个连通区域的情况，每个连通区域的中心对应每个印章文字的中心。圆形印章中包括的印章文字有呈弯曲型分布的，也有呈直线型分布的，对于呈弯曲型分布的文字来说，每个文字的中心到圆形印章圆心的距离是相等的，对于呈直线型分布的文字来说，每个文字的中心到圆形印章圆心的距离是不等的。据此，可以计算每个连通区域的中心到圆心的距离，将距离相等的连通区域确定为第一连通区域，将其他连通区域确定为第二连通区域。

但是可能会存在呈直线型分布的文字到圆心的距离与呈弯曲型分布的文字到圆心的距离相等的情况，此时，为了将呈直线型分布的文字从第一连通区域中剔除，可以引入穿过圆心的射线。从二值图像的圆心发出无数条射线，一条射线只能与一个呈弯曲型分布的文字相交，而一条射线有可能与两个呈直线型分布的文字相交。从而在第一连通区域中，若存在两个连通区域同时与一条射线相交，则将该连通区域从第一连通区域中去除，将其确定为第二连通区域。

对于两个或更多印章文字对应一个连通区域的情况，连通区域的中心位于连通区域中每个印章文字的中心的连线上，因此，连通区域的中心到圆心的距离与每个印章文字的中心到圆心的距离是相等的。因此，仍然可以采用步骤103中的方法确定第一连通区域和第二连通区域。

在准确确定出第一连通区域和第二连通区域后，将所有的第一连通区域所组成的区域确定为第一目标区域，显然，第一目标区域为所有的呈弯曲型分布的文字所在的区域；将所有的第二连通区域所组成的区域确定为第二目标区域，显然，第二目标区域为所有的呈直线型分布的文字所在的区域。

图4是本发明实施例提供的一种第一目标区域和第二目标区域的示意图。

在图4中，由虚线所包围的区域分别代表一个目标区域，其中，“上海市中医医院”外侧的虚线围成的区域为第一目标区域，“门急诊收费章”外侧的虚线围成的区域为第二目标区域。

步骤104、分别对位于所述第一目标区域中的文字和所述第二目标区域中的文字进行识别。

在本发明实施例中，在从二值图像中区分出第一目标区域和第二目标区域后，可以分别在第一目标区域和第二目标区域中进行文字识别。具体地，可以采用弯曲型文字的识别算法识别第一目标区域中的文字，采用直线型文字的识别算法识别第二目标区域中的文字。因为每个目标区域中的文字在语义上是连续的、有逻辑性的，所以，两个目标区域中的文字可以分别有效地按照语义顺序进行提取，降低了文字识别难度。

图5是本发明实施例提供的文字识别结果的示意图。采用弯曲型文字的识别算法识别第一目标区域中的文字之后，可以得到图5中的识别结果。

综上，本发明实施例提供的文字识别方法，针对待识别的圆形印章图像进行二值化处理，得到二值图像；对所述二值图像中的文字进行区域连通，得到多个连通区域；根据每个所述连通区域的中心到所述二值图像的圆心的距离，以及与穿过所述圆心的射线所相交的所述连通区域的数量，从所述多个连通区域中分别确定呈弯曲型分布的文字的至少一个第一连通区域、呈直线型分布的文字的至少一个第二连通区域；所述至少一个所述第一连通区域形成第一目标区域，所述至少一个所述第二连通区域形成第二目标区域；分别对位于所述第一目标区域中的文字和所述第二目标区域中的文字进行识别。在上述方法中，通过对圆形印章图像对应的二值图像中的文字进行区域连通，得到由弯曲型分布的文字组成的第一目标区域和由直线型分布的文字组成的第二目标区域，从而将弯曲型文字和直线型文字准确的区分开来，提高了文字识别的准确度；并且，可以分别对第一目标区域中的文字和第二目标区域中的文字单独进行识别，使得识别过程中可以有效地按照语义顺序进行提取，降低了文字识别难度。

图6是本发明实施例提供的另一种文字识别方法的步骤流程图，如图6所示，该方法可以包括：

步骤201、基于RGB颜色空间和CMYK颜色空间对待识别的圆形印章图像进行图像增强。

在本发明实施例中，因为票据图像往往具有复杂的纹理背景，且印章一般压盖在票据预打印字以及机打文字上方，造成印章文字对比度较低，因此，可以对圆形印章图像进行图像增强，以使印章文字更加明显，有利于后续的文字识别。

具体地，可以分别在RGB(Red Gree Blue，红色绿色蓝色)颜色空间上进行图像增强，在CMYK(Cyan Magenta Yellow blacK，青色品红色黄色黑色)颜色空间上进行图像增强，将两者增强的效果进行叠加，得到更好的增强效果。

可选地，步骤201可以包括以下步骤2011-步骤2015：

步骤2011、对于所述圆形印章图像中的每个像素点，确定所述像素点的R分量、G分量、B分量之间的方差，得到方差矩阵。

在本发明实施例中，可以获取圆形印章图像中的每个像素点的R分量、G分量、B分量，并根据以下公式1计算三分量之间的方差，最终圆形印章图像中的每个像素点对应一个方差，所有像素点的方差组成一个方差矩阵M_std。

具体地，计算方差矩阵M_std的公式1如下：

其中，m,n均为大于1的自然数。上述方差矩阵中的每个矩阵元素σ(i,j)(i∈(0,m-1),j∈(0,n-1))表示图像中坐标为(i,j)的像素点的R分量、G分量、B分量的方差。

其中，每个像素点的R分量、G分量、B分量的方差σ(i,j)为：

其中，公式2中R(i,j)、G(i,j)、B(i,j)分别为坐标为(i,j)的像素点的R分量、G分量、B分量。而u(i,j)的计算方法如公式3：

u(i,j)＝(R(i,j)+G(i,j)+B(i,j))/3 (公式3)

步骤2012、对于所述圆形印章图像中的每个像素点，确定所述像素点的R分量与G分量的差值，得到差值矩阵。

在本发明实施例中，可以获取每个像素点的R分量与G分量的差值，最终图像中的每个像素点对应一个差值，所有像素点的差值组成一个差值矩阵ΔRG。

差值矩阵ΔRG的计算公式如下：

ΔRG＝R(i,j)-G(i,j) (公式4)

步骤2013、在CMYK颜色空间上确定所述圆形印章图像的M分量，得到M分量矩阵。

在本发明实施例中，在CMYK颜色空间上，M分量的颜色空间对文字拉开的效果最好，区分度最好，因此，可以通过计算圆形印章图像中每个像素点的M分量，来增强图像。

具体地，每个像素点的M分量的计算公式如下：

其中，R'(i,j)＝R(i,j)/255.0，

G'(i,j)＝G(i,j)/255.0，

B'(i,j)＝B(i,j)/255.0，

K＝1-max(R'(i,j),G'(i,j),B'(i,j))。

最终图像中的每个像素点对应一个M分量，所有像素点的M分量组成一个M分量矩阵M。

步骤2014、根据所述方差矩阵、所述差值矩阵、所述M分量矩阵其中的至少一个确定目标矩阵。

在本发明实施例中，上面步骤中计算得到图像的方差矩阵M_std、差值矩阵ΔRG、M分量矩阵M，可以根据上述至少一个矩阵确定目标矩阵。进一步的，可以使用上述任意一个矩阵作为目标矩阵，也可以使用上述任意两个或三个矩阵的和作为目标矩阵。

在一个优选的实施方案中，将所述方差矩阵、所述差值矩阵、所述M分量矩阵三者的和作为目标矩阵。

上述三个矩阵对应三个灰度图像，三个灰度图像均是圆形印章图像的增强图像，将三个灰度图像融合后，得到的融合图像的增强效果将会更好。因此，将所述方差矩阵、所述差值矩阵、所述M分量矩阵三者的和作为目标矩阵。

步骤2015、基于所述目标矩阵对待识别的圆形印章图像进行图像增强。

在本发明实施例中，将上述三个矩阵的和确定为目标矩阵，将该目标矩阵对应的图像作为圆形印章图像的增强图像。即圆形印章图像的增强图像IMG_st的计算公式为：

IMG_st＝M_std+ΔRG+M×255 (公式6)

通过步骤2011-步骤2015，基于RGB颜色空间和CMYK颜色空间对待识别的圆形印章图像进行了图像增强，相比于在单个空间上增强图像，本方案中将三种增强的效果进行了叠加，得到的图像增强效果更好。

步骤202、针对待识别的圆形印章图像进行二值化处理，得到二值图像。

该步骤可以参照步骤101，此处不再赘述。

步骤203、对所述二值图像中的文字进行区域连通，得到多个连通区域。

该步骤可以参照步骤102，此处不再赘述。

步骤204、对于每个所述连通区域，计算所述连通区域的中心到所述圆形印章图像的圆心的距离，得到所述连通区域与所述圆心的目标距离。

在本发明实施例中，连通区域为不规则形状，确定连通区域的中心较为困难，可以将连通区域的外接矩形的中心确定为连通区域的中心。计算每个连通区域的外接矩形的中心到圆心的距离，将此作为目标距离。

步骤205、将所述目标距离相互之间的差值小于或等于预设的距离阈值的连通区域确定为第三连通区域；以及，将剩余的所述至少一个连通区域确定为呈直线型分布的文字的第二连通区域。

在本发明实施例中，对于呈弯曲型分布的文字来说，每个文字的中心到圆形印章圆心的距离是基本上是相等的，对于呈直线型分布的文字来说，每个文字的中心到圆形印章圆心的距离是不等的。但是，由于印章制作时存在的误差，不能保证所有弯曲型分布的文字相对于圆心都是对称排布的，此外，还存在一个连通区域对应两个或多个文字的情况，因此，不能保证所有弯曲型分布的文字的连通区域中心到圆心的距离是完全相等的，即目标距离之间是有可能存在微小差别的。因此，可以预先设置距离阈值，例如，距离阈值为0.01mm，若目标距离相互之间的差值小于或等于该距离阈值，则确定该组目标距离对应的连通区域中包含的文字为弯曲型分布的文字。将目标距离相互之间的差值小于或等于该距离阈值的连通区域确定为第三连通区域。

因为直线型分布的文字的连通区域与圆心的距离是不相等的，可以将除去第三连通区域的其他连通区域确定为直线型分布的文字的第二连通区域。

步骤206、针对每个所述第三连通区域，若所述第三连通区域与所述圆心确定的直线与至少两个连通区域相交，则确定所述第三连通区域为所述第二连通区域。

在本发明实施例中，可能会存在呈直线型分布的文字到圆心的距离与呈弯曲型分布的文字到圆心的距离相等的情况，为了将呈直线型分布的文字从第三连通区域中剔除，可以引入穿过圆心的射线。具体地，该射线为第三连通区域与圆心确定的直线，即该射线为穿过圆心并穿过第三连通区域的直线，该直线有多条。

因一条连线只能与一个呈弯曲型分布的文字相交，而一条连线有可能与两个呈直线型分布的文字相交。从而在第三连通区域中，若存在两个连通区域同时与一条直线相交，则将该连通区域从第三连通区域中去除，将其确定为直线型分布的文字的第二连通区域；并将第三连通区域中剩余的连通区域确定为弯曲型分布的文字的第一连通区域。

图7是本发明实施例提供的通过连线确定连通区域的示意图。在图7中，假设通过步骤205确定的第三连通区域对应的文字分别为：“上”、“海”、“市”、“中”、“医”、“医”、“院”、“章”。图7中虚线所示为印章图像的圆心和每个第三连通区域确定的多条直线。可以看出，“上”、“海”、“市”、“中”、“医”、“医”、“院”对应的连通区域与圆心确定的直线分别只与各自的连通区域相交，即只与一个连通区域相交，则可以将“上”、“海”、“市”、“中”、“医”、“医”、“院”对应的连通区域确定为第一连通区域；而“章”字对应的连通区域与圆心确定的直线除了与“章”字的连通区域相交，还与“费”字的连通区域相交。因此，“章”字对应的连通区域与圆心确定的直线与至少两个连通区域相交，则可以将“章”字对应的连通区域确定为第二连通区域。

步骤207、将所述第三连通区域中，剩余的至少一个所述第三连通区域确定为呈弯曲型分布的文字的第一连通区域。

在本发明实施例中，从第三连通区域中将呈直线型分布的文字的连通区域去除之后，剩余的则均为呈弯曲型分布的文字的连通区域，将这些剩余的连通区域确定为呈弯曲型分布的文字的第一连通区域。

步骤208、将至少一个所述第一连通区域确定为第一目标区域，将至少一个所述第二连通区域确定为第二目标区域。

在本发明实施例中，将所有的第一连通区域组成的区域确定为第一目标区域，将所有的第二连通区域组成的区域确定为第二目标区域。

在上述步骤204-步骤208中，通过计算连通区域的中心与圆心的目标距离，初步确定第三连通区域，再通过第三连通区域与圆心确定的直线与连通区域的交点个数，从第三连通区域中去除直线型分布的文字的连通区域，得到弯曲型分布的文字的第一连通区域，则所有连通区域中去除第一连通区域的即为呈直线型分布的文字的第二连通区域。在上述方法中，根据连通区域与圆心的位置关系以及过圆心的射线与相交的连通区域的数量，从多个连通区域中准确区分出了第一连通区域和第二连通区域，算法较为简便，实现速度快。

步骤209、根据所述第一目标区域两端的连通区域与过所述圆心的垂线的对称关系将所述圆形印章图像设置到水平状态。

在本发明实施例中，圆形印章图像中的文字若处于倒置状态，将增加文字识别的难度，可以通过第一目标区域中呈弯曲型分布的文字与过圆心的垂线轴对称的特点，将圆形印章图像放置于水平状态。

具体地，步骤209步骤包括以下步骤2091-步骤2094：

步骤2091、将位于所述第一目标区域两端的连通区域分别确定为第四连通区域和第五连通区域。

在本发明实施例中，圆形印章图像中的文字若处于倒置状态，将增加文字识别的难度，可以通过呈弯曲型分布的文字的特点将圆形印章图像放置于水平状态。首先，确定位于第一目标区域两端的连通区域，将一端确定为第四连通区域，另一端确定为第五连通区域。

步骤2092、确定由所述第四连通区域的中心与圆心的连线、所述第五连通区域的中心与圆心的连线构成的第一夹角的角平分线。

在本发明实施例中，将第四连通区域与圆心的连线作为第一条边，将第五连通区域与圆心的连线作为第二条边，这两条边组成一个第一夹角，确定这个第一夹角的角平分线。

步骤2093、确定所述角平分线与过所述圆形印章图像的圆心的垂线之间的第二夹角。

首先，确定过圆心的垂线，因为组成第一夹角的两条边在圆心印章图像中是对称的，根据第一夹角的角平分线与垂线是否重合，可以确定圆形印章图像是否是水平状态。若重合，则说明圆形印章图像是水平状态，若不重合，则确定两者之间的第二夹角。其中，所述水平状态是指所述圆形印章图像中所述第二目标区域中的文字与水平线齐平的状态。

步骤2094、根据所述第二夹角将所述圆形印章图像设置到水平状态。

若第一夹角的角平分线与垂线不重合，则说明圆形印章图像不是水平状态，可以将圆形印章图像向垂线方向旋转第二夹角的角度，即可将圆形印章图像调整到水平状态。

在步骤2091-步骤2094中，根据第一夹角的角平分线与过圆心的垂线的位置关系，将圆形印章图像设置到了水平状态，从而减小了文字识别的难度，提高了文字识别的准确度。

步骤210、采用ASTER算法将所述第一目标区域中的文字设置到正立状态，并确定位于所述第一目标区域中的每个文字的位置，再对所述文字进行识别。

在本发明实施例中，第一目标区域中的文字为呈弯曲型分布的文字，在识别时，可以先将每个文字设置到直立状态，再进行识别。具体地，可采用端到端神经网络模型算法ASTER(An Attentional Scene Text Recognizer with Flexible Rectification，具有柔性矫正功能的注意力机制场景文本识别方法)将第一目标区域中的每个文字设置到正立状态，再确定每个文字的位置，进而再对文字进行识别。ASTER网络模型在处理倾斜、弯曲或不规则布局的文本方面具有显著的优势。

步骤211、采用EAST算法确定位于所述第二目标区域中的每个文字的位置，并采用CRNN算法对所述文字进行识别。

在本发明实施例中，第二目标区域中的文字为呈直线分布的文字，相对于呈弯曲型分布的文字较为容易识别。具体可以首先采用网络模型算法EAST(An Efficient andAccurate Scene Text Detector，有效的精确的场景文本识别方法)确定第二目标区域中的每个文字的位置，进而再采用CRNN(AnEnd-to-EndTrainableNeuralNetworkforImage-basedSequenceRecognitiona ndItsApplicationtoSceneTextRecognition，基于序列的端到端图像文本识别)对文字进行识别。该方法对于文字识别的精准度较高，识别速度较快。

综上，本发明实施例提供的文字识别方法，除具有图1中的文字识别方法的有益效果外，还基于RGB颜色空间和CMYK颜色空间对待识别的圆形印章图像进行了图像增强，相比于在单个空间上增强图像，本方案中将三种增强的效果进行了叠加，得到的图像增强效果更好。

并且，还通过计算连通区域的中心与圆心的目标距离，初步确定第三连通区域，再通过第三连通区域与圆心确定的直线与连通区域的交点个数，从第三连通区域中去除直线型分布的文字的连通区域，得到弯曲型分布的文字的第一连通区域，则所有连通区域中去除第一连通区域的即为呈直线型分布的文字的第二连通区域。在上述方法中，根据连通区域与圆心的位置关系以及过圆心的射线与相交的连通区域的数量，从多个连通区域中准确区分出了第一连通区域和第二连通区域，算法较为简便，实现速度快。

此外，还根据第一夹角的角平分线与过圆心的垂线的位置关系，将圆形印章图像设置到了水平状态，从而减小了文字识别的难度，提高了文字识别的准确度。

图8是本发明实施例提供的文字识别装置的框图。如图8所示，该装置300可以包括：

二值化处理模块301，用于针对待识别的圆形印章图像进行二值化处理，得到二值图像；

区域连通模块302，用于对所述二值图像中的文字进行区域连通，得到多个连通区域；

目标区域确定模块303，用于根据每个所述连通区域的中心到所述二值图像的圆心的距离，以及与穿过所述圆心的射线所相交的所述连通区域的数量，从所述多个连通区域中分别确定呈弯曲型分布的文字的至少一个第一连通区域、呈直线型分布的文字的至少一个第二连通区域；所述至少一个所述第一连通区域形成第一目标区域，所述至少一个所述第二连通区域形成第二目标区域；

文字识别模块304，用于分别对位于所述第一目标区域中的文字和所述第二目标区域中的文字进行识别。

对于上述装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

综上，本发明提供的文字识别装置，针对待识别的圆形印章图像进行二值化处理，得到二值图像；对所述二值图像中的文字进行区域连通，得到多个连通区域；根据每个所述连通区域的中心到所述二值图像的圆心的距离，以及与穿过所述圆心的射线所相交的所述连通区域的数量，从所述多个连通区域中分别确定呈弯曲型分布的文字的至少一个第一连通区域、呈直线型分布的文字的至少一个第二连通区域；所述至少一个所述第一连通区域形成第一目标区域，所述至少一个所述第二连通区域形成第二目标区域；分别对位于所述第一目标区域中的文字和所述第二目标区域中的文字进行识别。在上述方法中，通过对圆形印章图像对应的二值图像中的文字进行区域连通，得到由弯曲型分布的文字组成的第一连通区域和由直线型分布的文字组成的第二连通区域，从而将弯曲型文字和直线型文字准确的区分开来，提高了文字识别的准确度；并且，可以分别对第一连通区域中的文字和第二连通区域中的文字单独进行识别，使得识别过程中第一连通区域和第二连通区域中的文字可以有效地按照语义顺序进行提取，降低了文字识别难度。

在图8的基础上，图9是本发明实施例提供的另一种文字识别装置的框图。如图9所示，所述目标区域确定模块303包括：

距离计算子模块3031，用于对于每个所述连通区域，计算所述连通区域的中心到所述圆形印章图像的圆心的距离，得到所述连通区域与所述圆心的目标距离；

区域确定第一子模块3032，用于将所述目标距离相互之间的差值小于或等于预设的距离阈值的连通区域确定为第三连通区域；以及，将剩余的至少一个所述连通区域确定为呈直线型分布的文字的第二连通区域；

区域确定第二子模块3033，用于针对每个所述第三连通区域，若所述第三连通区域与所述圆心确定的直线与至少两个连通区域相交，则确定所述第三连通区域为所述第二连通区域；

区域确定第三子模块3034，用于将所述第三连通区域中，剩余的至少一个所述第三连通区域确定为呈弯曲型分布的文字的第一连通区域。

可选地，所述装置300还包括：

图像增强模块305，用于基于RGB颜色空间和CMYK颜色空间对待识别的圆形印章图像进行图像增强。

可选地，所述图像增强模块305，包括：

可选地，所述装置300还包括：

水平状态设置模块306，用于根据所述第一目标区域两端的连通区域与过所述圆心的垂线的对称关系将所述圆形印章图像设置到水平状态。

可选地，所述水平状态设置模块306包括：

可选地，所述文字识别模块304，包括：

第一识别子模块3041，用于采用ASTER算法将所述第一目标区域中的文字设置到正立状态，并确定位于所述第一目标区域中的每个文字的位置，再对所述文字进行识别；

第二识别子模块3042，用于采用EAST算法确定位于所述第二目标区域中的每个文字的位置，并采用CRNN算法对所述文字进行识别。

综上，本发明实施例提供的另一种文字识别装置，除具有图8中的文字识别装置的有益效果外，还基于RGB颜色空间和CMYK颜色空间对待识别的圆形印章图像进行了图像增强，相比于在单个空间上增强图像，本方案中将三种增强的效果进行了叠加，得到的图像增强效果更好。

优选的，本发明实施例还提供一种终端，包括处理器，存储器，存储在存储器上并可在所述处理器上运行的计算机程序，该计算机程序被处理器执行时实现上述文字识别方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述文字识别方法方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，如只读存储器(Read-Only Memory，简称ROM)、随机存取存储器(Random Access Memory，简称RAM)、磁碟或者光盘等。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域技术人员易于想到的是：上述各个实施例的任意组合应用都是可行的，故上述各个实施例之间的任意组合都是本发明的实施方案，但是由于篇幅限制，本说明书在此就不一一详述了。

在此提供的文字识别方法不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造具有本发明方案的系统所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本发明并帮助理解各个发明方面中的至少一个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的至少一个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的文字识别方法中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims

1.一种文字识别方法，其特征在于，所述方法包括：

根据每个所述连通区域的中心到所述二值图像的圆心的距离，以及与穿过所述圆心的射线所相交的所述连通区域的数量，从所述多个连通区域中分别确定呈弯曲型分布的文字的至少一个第一连通区域、呈直线型分布的文字的至少一个第二连通区域；所述至少一个所述第一连通区域形成第一目标区域，所述至少一个所述第二连通区域形成第二目标区域，包括：

将所述第三连通区域中，剩余的至少一个所述第三连通区域确定为呈弯曲型分布的文字的第一连通区域；

2.根据权利要求1所述的方法，其特征在于，在针对待识别的圆形印章图像进行二值化处理之前，还包括：

3.根据权利要求2所述的方法，其特征在于，所述基于RGB颜色空间和CMYK颜色空间对待识别的圆形印章图像进行图像增强，包括：

基于所述目标矩阵对待识别的圆形印章图像进行图像增强。

4.根据权利要求1所述的方法，其特征在于，在从所述多个连通区域中分别确定呈弯曲型分布的文字的至少一个第一连通区域、呈直线型分布的文字的至少一个第二连通区域之后，还包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述第一目标区域两端的连通区域与过所述圆心的垂线的对称关系将所述圆形印章图像设置到水平状态包括：

根据所述第二夹角将所述圆形印章图像设置到水平状态。

6.根据权利要求1所述的方法，其特征在于，所述分别对位于所述第一目标区域中的文字和所述第二目标区域中的文字进行识别，包括：

7.一种文字识别装置，其特征在于，所述装置包括：

目标区域确定模块，用于根据每个所述连通区域的中心到所述二值图像的圆心的距离，以及与穿过所述圆心的射线所相交的所述连通区域的数量，从所述多个连通区域中分别确定呈弯曲型分布的文字的至少一个第一连通区域、呈直线型分布的文字的至少一个第二连通区域；所述至少一个所述第一连通区域形成第一目标区域，所述至少一个所述第二连通区域形成第二目标区域，包括：

区域确定第三子模块，用于将所述第三连通区域中，剩余的至少一个所述第三连通区域确定为呈弯曲型分布的文字的第一连通区域；

8.一种电子设备，包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1-6中任一项所述的文字识别方法的步骤。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如权利要求1-6所述的文字识别方法的步骤。