CN109948620A

CN109948620A - 一种字符分割方法及终端

Info

Publication number: CN109948620A
Application number: CN201910208497.9A
Authority: CN
Inventors: 庄国金; 郝占龙; 陈文传; 杜保发; 林玉玲; 吴建杭; 方恒凯
Original assignee: Xiamen Shang Ji Network Technology Co Ltd
Current assignee: Xiamen Shang Ji Network Technology Co Ltd
Priority date: 2019-03-19
Filing date: 2019-03-19
Publication date: 2019-06-28

Abstract

本发明涉及一种字符分割方法及终端，属于数据处理领域。本发明通过采用垂直投影法分割字符图像中的字符，得到字符有序集合；当第一字符的宽度小于预设的下限值时，获取所述字符图像中与所述第一字符相邻的字符，得到第二字符；所述第一字符为所述字符有序集合中的一字符；调用OCR识别引擎识别第三字符，得到第一OCR识别结果；所述第三字符由所述第一字符和所述第二字符组成；若所述第一OCR识别结果的置信度大于预设的置信度阈值，且所述第三字符的宽度小于预设的上限值，则合并所述字符有序集合中的所述第一字符和所述第二字符。实现提高对同时包含多种类型字符的字符图像进行字符分割的准确性。

Description

一种字符分割方法及终端

技术领域

本发明涉及一种字符分割方法及终端，属于数据处理领域。

背景技术

申请号为201810175856.0的专利文献公开了一种字符分割位置的确定、字符分割方法、装置及设备，所述字符分割位置的确定方法包括：根据待分割字符串图像中包括的至少一个粘连子串、所述粘连子串的宽度以及单个字符的平均宽度，确定与所述粘连子串中包括的各字符对应的目标分割位置；根据字符间粘连区域的属性信息，确定与所述粘连子串对应的至少一个备选分割位置；根据所述粘连子串的边界位置、与所述粘连子串对应的至少一个备选分割位置，以及预设更新条件，对所述目标分割位置进行更新，解决现有分割法对粘连字符的分割效果不佳及存在漏分、错分的问题，从而提高粘连字符的分割准确率，提升粘连字符的分割效果。

但是，上述专利文献提供的字符分割方法中是否采用备选分割位置必须要满足条件：上一个确定的目标分割位置对应的区域宽度与当前目标备选分割位置对应的区域宽度的差在第一预设范围内。即上述专利文献适用于对字符宽度相似的字符图像进行字符分割，对于一个字符图像中同时包含汉字、英文和数字等字符宽度不一的应用场景，其分割效果较差。

发明内容

本发明所要解决的技术问题是：如何提高对同时包含多种类型字符的字符图像进行字符分割的准确性。

为了解决上述技术问题，本发明采用的技术方案为：

本发明提供一种字符分割方法，包括：

采用垂直投影法分割字符图像中的字符，得到字符有序集合；

当第一字符的宽度小于预设的下限值时，获取所述字符图像中与所述第一字符相邻的字符，得到第二字符；所述第一字符为所述字符有序集合中的一字符；

调用OCR识别引擎识别第三字符，得到第一OCR识别结果；所述第三字符由所述第一字符和所述第二字符组成；

若所述第一OCR识别结果的置信度大于预设的置信度阈值，且所述第三字符的宽度小于预设的上限值，则合并所述字符有序集合中的所述第一字符和所述第二字符。

优选地，还包括：

当第四字符的宽度大于所述预设的上限值时，获取第五字符和第六字符；所述第四字符为所述字符有序集合中的一字符；所述第四字符由所述第五字符和所述第六字符组成；

调用OCR识别引擎识别所述第五字符，得到第二识别结果；

调用OCR识别引擎识别所述第六字符，得到第三识别结果；

若所述第二识别结果的置信度和所述第三识别结果的置信度均大于所述预设的置信度阈值，则将所述字符有序集合中的所述第四字符分割成所述第五字符和所述第六字符。

优选地，获取所述预设的上限值和下限值的步骤为：

统计所述字符有序集合的平均字符宽度；

所述上限值为所述平均字符宽度的1.2倍；

所述下限值为所述平均字符宽度的80%。

优选地，采用垂直投影法分割字符图像中的字符，得到字符有序集合，具体为：

S1、二值化所述字符图像，得到二值图像；

S2、从所述二值图像中获取一行字符的图像，得到行图像；

S3、垂直投影所述行图像，得到垂直投影直方图；所述垂直投影直方图的横坐标表示一黑色像素点在所述行图像中的水平位置；所述垂直投影直方图的纵坐标表示黑色像素点个数；

S4、获取所述垂直投影直方图中，纵坐标值为零的点的横坐标值，得到坐标值集合；

S5、根据所述坐标值集合分割所述行图像，得到行字符有序集合；

S6、重复执行所述步骤S2至所述步骤S5，直至所述二值图像所有行均被遍历；所述字符有序集合由所有的所述行字符有序集合组成。

本发明还提供一种字符分割终端，包括一个或多个处理器及存储器，所述存储器存储有程序，并且被配置成由所述一个或多个处理器执行以下步骤：

优选地，还包括：

调用OCR识别引擎识别所述第五字符，得到第二识别结果；

调用OCR识别引擎识别所述第六字符，得到第三识别结果；

优选地，获取所述预设的上限值和下限值的步骤为：

统计所述字符有序集合的平均字符宽度；

所述上限值为所述平均字符宽度的1.2倍；

所述下限值为所述平均字符宽度的80%。

S1、二值化所述字符图像，得到二值图像；

S2、从所述二值图像中获取一行字符的图像，得到行图像；

本发明具有如下有益效果：

1、本发明提供一种字符分割方法及终端，区别于现有技术根据字符图像的平均字符宽度修正垂直投影法的初步字符分割结果，对于字符图像中字符类型单一的应用场景能够较好地消除黏连和误分割的情形。但是，对于字符图像中字符类型多样的应用场景，由于不同字符类型的字符宽度差别较大，其修正效果差。例如，一个字符图像中大部分字符为汉字，夹杂少量的英文和数字。该字符图像的平均字符宽度与汉字的字符宽度近似。该字符图像中存在字符片段“2013年”，其中，包含字符“2”、“0”、“1”、“3”和“年”。由于，数字的字符宽度明显小于汉字的字符宽度。根据上述现有技术，会将“2”与“0”合并为一个字符“20”，“1”与“3”合并为一个字符“13”。显然，“20”和“13”均不是一个正确的字符。本发明提供的字符分割方法及终端，检测到一个字符的宽度小于预设的下限值时，即发现根据垂直投影法初步分割的过程中，存在将一个字符误分割成两个字符的可能时，先调用OCR识别引擎识别合并后的字符，若识别结果的置信度大于预设的置信度阈值，说明合并后的字符较大概率是一个正确的字符，则将两字符合并，否则不合并两字符。例如，OCR识别引擎对“20”进行识别，识别结果的置信度远低于预设的置信度阈值，则说明“20”不是一个正确的字符，不将“2”和“0”合并。OCR识别引擎对“础”进行识别，识别结果的置信度大于预设的置信度阈值，则说明“础”是一个正确的字符。并且合并后的“础”的宽度小于预设的上限值，“石”的宽度小于预设的下限值，说明“石”极有可能只是一个拼旁部首，“础”在根据垂直投影法分割字符的过程中被误分割为“石”和“出”，因此，应将二者合并为“础”。本发明在根据字符宽度执行合并字符操作之前，先调用OCR识别引擎识别合并后的字符，并根据识别结果的置信度判断合并后为正确字符的可能性，只有当合并后为一个正确字符的可能性大时，才执行合并操作，极大程度上提高了对同时包含多种类型字符的字符图像进行字符分割的准确性。

2、进一步地，当发现字符有序集合中一个字符的宽度大于预设的上限值时，即根据垂直投影方法初步分割的过程中对于黏连的两个字符可能存在未分割开的情形时，先调用OCR引擎分别识别根据字符宽度大于预设的上限值的字符分割得到的两个字符，若两个字符的识别结果的置信度均大于预设的置信度阈值，则说明分割得到的两个字符较大概率均为正确的字符，再执行分割操作，避免了对未黏连的一个字符误分割为两个字符的情形，极大程度上提高了对同时包含多种类型字符的字符图像进行字符分割的准确性。

3、进一步地，若上限值和下限值的取值偏差太大，对于异常情况的条件限制过于严格，导致很多异常无法进行判断；偏差值取得太小，异常情况条件限制的太宽松，会导致正常字符也要进入判断是否异常。本发明的上限值和下限值为经验值能够实现较好的检测出异常情况。

4、进一步地，垂直投影直方图用于统计黑色像素点分布情况，即行图像中每一列包含的黑色像素点个数。若行图像中有一列的黑色像素点个数为零，则说明这一列上不存在任何的痕迹，极有可能是两个字符间的分界线。根据这一原理，对字符图像进行初步分割。

附图说明

图1为本发明提供的一种字符分割方法的具体实施方式的流程框图；

图2为二值图像示意图；

图3为行图像示意图；

图4为垂直投影直方图示意图；

图5为垂直投影法分割字符图像的分割结果示意图；

图6为本发明提供的一种字符分割终端的具体实施方式的结构框图；

标号说明：

1、处理器； 2、存储器。

具体实施方式

下面结合附图和具体实施例来对本发明进行详细的说明。

请参照图1至图6，

本发明的实施例一为：

如图1所示，本实施例提供一种字符分割方法，包括：

S1、采用垂直投影法分割字符图像中的字符，得到字符有序集合。

其中，可采用现有的垂直投影法对字符图像进行分割，得到字符有序集合。

优选地，所述S1具体为：

S11、二值化所述字符图像，得到二值图像。

例如，图2为所述二值图像，二值图像中只包括黑色像素点和白色像素点。

S12、从所述二值图像中获取一行字符的图像，得到行图像。

例如，所述行图像如图3所示，为二值图像中的第一行文字所在区域。

S13、垂直投影所述行图像，得到垂直投影直方图；所述垂直投影直方图的横坐标表示一黑色像素点在所述行图像中的水平位置；所述垂直投影直方图的纵坐标表示黑色像素点个数。

例如，所述垂直投影直方图如图4所示。

S14、获取所述垂直投影直方图中，纵坐标值为零的点的横坐标值，得到坐标值集合。

S15、根据所述坐标值集合分割所述行图像，得到行字符有序集合。

例如，图4中，横坐标值为438至461的点的纵坐标值均为零，则说明横坐标值为438至461这一区域没有字迹，极有可能为两个字符间的空隔，可在这一区域设置一分割点，将两个字符分割开。

S16、重复执行所述步骤S2至所述步骤S5，直至所述二值图像所有行均被遍历；所述字符有序集合由所有的所述行字符有序集合组成。

例如，图5为垂直投影法分割字符图像的分割结果示意图。其中，“是一”由于存在黏连，未被正确分割为两个字符。“础”由于左右偏旁结构间存在空隙，被误分割为“石”和“出”。

其中，垂直投影直方图用于统计黑色像素点分布情况，即行图像中每一列包含的黑色像素点个数。若行图像中有一列的黑色像素点个数为零，则说明这一列上不存在任何的痕迹，极有可能是两个字符间的分界线。本实施例根据这一原理，对字符图像进行初步分割。

S2、合并所述字符有序集合中被误分割的字符。

S21、统计所述字符有序集合的平均字符宽度；所述上限值为所述平均字符宽度的1.2倍；所述下限值为所述平均字符宽度的80%。

其中，由图5可知，字符图像经过初步分割的字符宽度中，接近正常宽度nWidth的字符个数最多。在横坐标代表的字符宽度，纵坐标代表字符个数的直方图中只要统计出宽度分布最多（最密集）的区域，nWidth即落在这个区域里，最后取这个区域的中心点作为nWidth值。具体步骤：

设定固定步长（例如，5个像素点），循环横坐标从1到最大字符宽度max，累加连续步长横坐标对应的字符数，如横坐标为Xn时，累加数为Xn-2~Xn+2区域的纵坐标值总和SUMn，在这些累加数SUM1~SUMmax中的最大值对应的横坐标值可确认为nWidth。

nWidth代表一个字符所应该占有的标准宽度，正常宽度应接近nWidth。实际字符与此值偏差越大，代表异常概率越高。在这里偏差取0.2*nWidth，下限值为nWidth -0.2*nWidth =0.8*nWidth，上限值为nWidth+0.2*nWidth =1.2*nWidth，即满足宽度在0.8*nWidth-1.2n*Width区域时认定为完整单字符的正常宽度，不需要进行黏连切开或偏旁部首合并处理，在小于0.8nWidth需要进行偏旁部首合并判断，大于1.2nWidth需要进行黏连判断。

若上限值和下限值的取值偏差太大，对于异常情况的条件限制过于严格，导致很多异常无法进行判断；偏差值取得太小，异常情况条件限制的太宽松，会导致正常字符也要进入判断是否异常。本发明的上限值和下限值为经验值能够实现较好的检测出异常情况。

例如，所示字符有序集合的平均字符宽度为nWidth，则所述上限值为1.2*nWidth，所述下限值为0.8*nWidth。

S22、当第一字符的宽度小于预设的下限值时，获取所述字符图像中与所述第一字符相邻的字符，得到第二字符；所述第一字符为所述字符有序集合中的一字符。

S23、调用OCR识别引擎识别第三字符，得到第一OCR识别结果；所述第三字符由所述第一字符和所述第二字符组成。

S24、若所述第一OCR识别结果的置信度大于预设的置信度阈值，且所述第三字符的宽度小于预设的上限值，则合并所述字符有序集合中的所述第一字符和所述第二字符。

其中，所述预设的置信度阈值为900。本实施例中，置信度阈值的最大值为1000。

例如，图5中的“2”的字符宽度小于下限值0.8nWidth，则获取与其相邻且位于右侧的第二字符“0”。调用OCR识别引擎对第三字符“20”进行识别，识别结果的置信度为100，远低于预设的置信度阈值900，则说明“20”不是一个正确的字符，不将“2”和“0”合并。OCR识别引擎对“础”进行识别，识别结果的置信为970,大于预设的置信度阈值900，则说明“础”是一个正确的字符。并且合并后的“础”的宽度小于预设的上限值，“石”的宽度小于预设的下限值，说明“石”极有可能只是一个拼旁部首，“础”在根据垂直投影法分割字符的过程中被误分割为“石”和“出”，因此，应将二者合并为“础”，修正了垂直投影法的错误分割结果。

其中，本实施例检测到一个字符的宽度小于预设的下限值时，即发现根据垂直投影法初步分割的过程中，存在将一个字符误分割成两个字符的可能时，先调用OCR识别引擎识别合并后的字符，若识别结果的置信度大于预设的置信度阈值，说明合并后的字符较大概率是一个正确的字符，则将两字符合并，否则不合并两字符。极大程度上提高了对同时包含多种类型字符的字符图像进行字符分割的准确性。

S3、分割所述字符有序集合中黏连的字符。

S31、当第四字符的宽度大于所述预设的上限值时，获取第五字符和第六字符；所述第四字符为所述字符有序集合中的一字符；所述第四字符由所述第五字符和所述第六字符组成。

例如，第四字符为图5中的“是一”，“是一”的字符宽度大于预设的上限值1.2nwidth。

S32、调用OCR识别引擎识别所述第五字符，得到第二识别结果。

S33、调用OCR识别引擎识别所述第六字符，得到第三识别结果。

例如，所述第五字符为“是”，第六字符为“一”，第四字符“是一”由第五字符和第六字符组成。

S34、若所述第二识别结果的置信度和所述第三识别结果的置信度均大于所述预设的置信度阈值，则将所述字符有序集合中的所述第四字符分割成所述第五字符和所述第六字符。

例如，OCR识别引擎识别第五字符“是”的识别结果的置信度为967，OCR识别引擎识别第六字符“一”的识别结果的置信度为980，均大于预设的置信度阈值900，同时OCR识别引擎对“是一”的识别结果的置信度为140，远低于预设的置信度阈值。因此，“是一”极大可能不是一个正确的字符，而分割结果“是”和“一”极大可能都是正确的字符，因此，本实施例将第四字符“是一”分割为第五字符“是”和第六字符“一”。

其中，当发现字符有序集合中一个字符的宽度大于预设的上限值时，即根据垂直投影方法初步分割的过程中对于黏连的两个字符可能存在未分割开的情形时，先调用OCR引擎分别识别根据字符宽度大于预设的上限值的字符分割得到的两个字符，若两个字符的识别结果的置信度均大于预设的置信度阈值，则说明分割得到的两个字符较大概率均为正确的字符，再执行分割操作，避免了对未黏连的一个字符误分割为两个字符的情形，极大程度上提高了对同时包含多种类型字符的字符图像进行字符分割的准确性。

本发明的实施例二为：

如图6所示，本实施例提供一种字符分割终端，包括一个或多个处理器1及存储器2，所述存储器2存储有程序，并且被配置成由所述一个或多个处理器1执行以下步骤：

优选地，所述S1具体为：

S11、二值化所述字符图像，得到二值图像。

S12、从所述二值图像中获取一行字符的图像，得到行图像。

例如，所述垂直投影直方图如图4所示。

S2、合并所述字符有序集合中被误分割的字符。

例如，所示字符有序集合的平均字符宽度为nWidth，则所述上限值为1.2nWidth，所述下限值为0.8nWidth。

S3、分割所述字符有序集合中黏连的字符。

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种字符分割方法，其特征在于，包括：

2.根据权利要求1所述的字符分割方法，其特征在于，还包括：

调用OCR识别引擎识别所述第五字符，得到第二识别结果；

调用OCR识别引擎识别所述第六字符，得到第三识别结果；

3.根据权利要求1所述的字符分割方法，其特征在于，获取所述预设的上限值和下限值的步骤为：

统计所述字符有序集合的平均字符宽度；

所述上限值为所述平均字符宽度的1.2倍；

所述下限值为所述平均字符宽度的80%。

4.根据权利要求1所述的字符分割方法，其特征在于，采用垂直投影法分割字符图像中的字符，得到字符有序集合，具体为：

S1、二值化所述字符图像，得到二值图像；

S2、从所述二值图像中获取一行字符的图像，得到行图像；

5.一种字符分割终端，其特征在于，包括一个或多个处理器及存储器，所述存储器存储有程序，并且被配置成由所述一个或多个处理器执行以下步骤：

6.根据权利要求5所述的字符分割终端，其特征在于，还包括：

调用OCR识别引擎识别所述第五字符，得到第二识别结果；

调用OCR识别引擎识别所述第六字符，得到第三识别结果；

7.根据权利要求5所述的字符分割终端，其特征在于，获取所述预设的上限值和下限值的步骤为：

统计所述字符有序集合的平均字符宽度；

所述上限值为所述平均字符宽度的1.2倍；

所述下限值为所述平均字符宽度的80%。

8.根据权利要求5所述的字符分割终端，其特征在于，采用垂直投影法分割字符图像中的字符，得到字符有序集合，具体为：

S1、二值化所述字符图像，得到二值图像；

S2、从所述二值图像中获取一行字符的图像，得到行图像；