CN109948620A - 一种字符分割方法及终端 - Google Patents

一种字符分割方法及终端 Download PDF

Info

Publication number
CN109948620A
CN109948620A CN201910208497.9A CN201910208497A CN109948620A CN 109948620 A CN109948620 A CN 109948620A CN 201910208497 A CN201910208497 A CN 201910208497A CN 109948620 A CN109948620 A CN 109948620A
Authority
CN
China
Prior art keywords
character
ordered set
obtains
width
limit value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910208497.9A
Other languages
English (en)
Inventor
庄国金
郝占龙
陈文传
杜保发
林玉玲
吴建杭
方恒凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Shang Ji Network Technology Co Ltd
Original Assignee
Xiamen Shang Ji Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Shang Ji Network Technology Co Ltd filed Critical Xiamen Shang Ji Network Technology Co Ltd
Priority to CN201910208497.9A priority Critical patent/CN109948620A/zh
Publication of CN109948620A publication Critical patent/CN109948620A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

本发明涉及一种字符分割方法及终端,属于数据处理领域。本发明通过采用垂直投影法分割字符图像中的字符,得到字符有序集合;当第一字符的宽度小于预设的下限值时,获取所述字符图像中与所述第一字符相邻的字符,得到第二字符;所述第一字符为所述字符有序集合中的一字符;调用OCR识别引擎识别第三字符,得到第一OCR识别结果;所述第三字符由所述第一字符和所述第二字符组成;若所述第一OCR识别结果的置信度大于预设的置信度阈值,且所述第三字符的宽度小于预设的上限值,则合并所述字符有序集合中的所述第一字符和所述第二字符。实现提高对同时包含多种类型字符的字符图像进行字符分割的准确性。

Description

一种字符分割方法及终端
技术领域
本发明涉及一种字符分割方法及终端,属于数据处理领域。
背景技术
申请号为201810175856.0的专利文献公开了一种字符分割位置的确定、字符分割方法、装置及设备,所述字符分割位置的确定方法包括:根据待分割字符串图像中包括的至少一个粘连子串、所述粘连子串的宽度以及单个字符的平均宽度,确定与所述粘连子串中包括的各字符对应的目标分割位置;根据字符间粘连区域的属性信息,确定与所述粘连子串对应的至少一个备选分割位置;根据所述粘连子串的边界位置、与所述粘连子串对应的至少一个备选分割位置,以及预设更新条件,对所述目标分割位置进行更新,解决现有分割法对粘连字符的分割效果不佳及存在漏分、错分的问题,从而提高粘连字符的分割准确率,提升粘连字符的分割效果。
但是,上述专利文献提供的字符分割方法中是否采用备选分割位置必须要满足条件:上一个确定的目标分割位置对应的区域宽度与当前目标备选分割位置对应的区域宽度的差在第一预设范围内。即上述专利文献适用于对字符宽度相似的字符图像进行字符分割,对于一个字符图像中同时包含汉字、英文和数字等字符宽度不一的应用场景,其分割效果较差。
发明内容
本发明所要解决的技术问题是:如何提高对同时包含多种类型字符的字符图像进行字符分割的准确性。
为了解决上述技术问题,本发明采用的技术方案为:
本发明提供一种字符分割方法,包括:
采用垂直投影法分割字符图像中的字符,得到字符有序集合;
当第一字符的宽度小于预设的下限值时,获取所述字符图像中与所述第一字符相邻的字符,得到第二字符;所述第一字符为所述字符有序集合中的一字符;
调用OCR识别引擎识别第三字符,得到第一OCR识别结果;所述第三字符由所述第一字符和所述第二字符组成;
若所述第一OCR识别结果的置信度大于预设的置信度阈值,且所述第三字符的宽度小于预设的上限值,则合并所述字符有序集合中的所述第一字符和所述第二字符。
优选地,还包括:
当第四字符的宽度大于所述预设的上限值时,获取第五字符和第六字符;所述第四字符为所述字符有序集合中的一字符;所述第四字符由所述第五字符和所述第六字符组成;
调用OCR识别引擎识别所述第五字符,得到第二识别结果;
调用OCR识别引擎识别所述第六字符,得到第三识别结果;
若所述第二识别结果的置信度和所述第三识别结果的置信度均大于所述预设的置信度阈值,则将所述字符有序集合中的所述第四字符分割成所述第五字符和所述第六字符。
优选地,获取所述预设的上限值和下限值的步骤为:
统计所述字符有序集合的平均字符宽度;
所述上限值为所述平均字符宽度的1.2倍;
所述下限值为所述平均字符宽度的80%。
优选地,采用垂直投影法分割字符图像中的字符,得到字符有序集合,具体为:
S1、二值化所述字符图像,得到二值图像;
S2、从所述二值图像中获取一行字符的图像,得到行图像;
S3、垂直投影所述行图像,得到垂直投影直方图;所述垂直投影直方图的横坐标表示一黑色像素点在所述行图像中的水平位置;所述垂直投影直方图的纵坐标表示黑色像素点个数;
S4、获取所述垂直投影直方图中,纵坐标值为零的点的横坐标值,得到坐标值集合;
S5、根据所述坐标值集合分割所述行图像,得到行字符有序集合;
S6、重复执行所述步骤S2至所述步骤S5,直至所述二值图像所有行均被遍历;所述字符有序集合由所有的所述行字符有序集合组成。
本发明还提供一种字符分割终端,包括一个或多个处理器及存储器,所述存储器存储有程序,并且被配置成由所述一个或多个处理器执行以下步骤:
采用垂直投影法分割字符图像中的字符,得到字符有序集合;
当第一字符的宽度小于预设的下限值时,获取所述字符图像中与所述第一字符相邻的字符,得到第二字符;所述第一字符为所述字符有序集合中的一字符;
调用OCR识别引擎识别第三字符,得到第一OCR识别结果;所述第三字符由所述第一字符和所述第二字符组成;
若所述第一OCR识别结果的置信度大于预设的置信度阈值,且所述第三字符的宽度小于预设的上限值,则合并所述字符有序集合中的所述第一字符和所述第二字符。
优选地,还包括:
当第四字符的宽度大于所述预设的上限值时,获取第五字符和第六字符;所述第四字符为所述字符有序集合中的一字符;所述第四字符由所述第五字符和所述第六字符组成;
调用OCR识别引擎识别所述第五字符,得到第二识别结果;
调用OCR识别引擎识别所述第六字符,得到第三识别结果;
若所述第二识别结果的置信度和所述第三识别结果的置信度均大于所述预设的置信度阈值,则将所述字符有序集合中的所述第四字符分割成所述第五字符和所述第六字符。
优选地,获取所述预设的上限值和下限值的步骤为:
统计所述字符有序集合的平均字符宽度;
所述上限值为所述平均字符宽度的1.2倍;
所述下限值为所述平均字符宽度的80%。
优选地,采用垂直投影法分割字符图像中的字符,得到字符有序集合,具体为:
S1、二值化所述字符图像,得到二值图像;
S2、从所述二值图像中获取一行字符的图像,得到行图像;
S3、垂直投影所述行图像,得到垂直投影直方图;所述垂直投影直方图的横坐标表示一黑色像素点在所述行图像中的水平位置;所述垂直投影直方图的纵坐标表示黑色像素点个数;
S4、获取所述垂直投影直方图中,纵坐标值为零的点的横坐标值,得到坐标值集合;
S5、根据所述坐标值集合分割所述行图像,得到行字符有序集合;
S6、重复执行所述步骤S2至所述步骤S5,直至所述二值图像所有行均被遍历;所述字符有序集合由所有的所述行字符有序集合组成。
本发明具有如下有益效果:
1、本发明提供一种字符分割方法及终端,区别于现有技术根据字符图像的平均字符宽度修正垂直投影法的初步字符分割结果,对于字符图像中字符类型单一的应用场景能够较好地消除黏连和误分割的情形。但是,对于字符图像中字符类型多样的应用场景,由于不同字符类型的字符宽度差别较大,其修正效果差。例如,一个字符图像中大部分字符为汉字,夹杂少量的英文和数字。该字符图像的平均字符宽度与汉字的字符宽度近似。该字符图像中存在字符片段“2013年”,其中,包含字符“2”、“0”、“1”、“3”和“年”。由于,数字的字符宽度明显小于汉字的字符宽度。根据上述现有技术,会将“2”与“0”合并为一个字符“20”,“1”与“3”合并为一个字符“13”。显然,“20”和“13”均不是一个正确的字符。本发明提供的字符分割方法及终端,检测到一个字符的宽度小于预设的下限值时,即发现根据垂直投影法初步分割的过程中,存在将一个字符误分割成两个字符的可能时,先调用OCR识别引擎识别合并后的字符,若识别结果的置信度大于预设的置信度阈值,说明合并后的字符较大概率是一个正确的字符,则将两字符合并,否则不合并两字符。例如,OCR识别引擎对“20”进行识别,识别结果的置信度远低于预设的置信度阈值,则说明“20”不是一个正确的字符,不将“2”和“0”合并。OCR识别引擎对“础”进行识别,识别结果的置信度大于预设的置信度阈值,则说明“础”是一个正确的字符。并且合并后的“础”的宽度小于预设的上限值,“石”的宽度小于预设的下限值,说明“石”极有可能只是一个拼旁部首,“础”在根据垂直投影法分割字符的过程中被误分割为“石”和“出”,因此,应将二者合并为“础”。本发明在根据字符宽度执行合并字符操作之前,先调用OCR识别引擎识别合并后的字符,并根据识别结果的置信度判断合并后为正确字符的可能性,只有当合并后为一个正确字符的可能性大时,才执行合并操作,极大程度上提高了对同时包含多种类型字符的字符图像进行字符分割的准确性。
2、进一步地,当发现字符有序集合中一个字符的宽度大于预设的上限值时,即根据垂直投影方法初步分割的过程中对于黏连的两个字符可能存在未分割开的情形时,先调用OCR引擎分别识别根据字符宽度大于预设的上限值的字符分割得到的两个字符,若两个字符的识别结果的置信度均大于预设的置信度阈值,则说明分割得到的两个字符较大概率均为正确的字符,再执行分割操作,避免了对未黏连的一个字符误分割为两个字符的情形,极大程度上提高了对同时包含多种类型字符的字符图像进行字符分割的准确性。
3、进一步地,若上限值和下限值的取值偏差太大,对于异常情况的条件限制过于严格,导致很多异常无法进行判断;偏差值取得太小,异常情况条件限制的太宽松,会导致正常字符也要进入判断是否异常。本发明的上限值和下限值为经验值能够实现较好的检测出异常情况。
4、进一步地,垂直投影直方图用于统计黑色像素点分布情况,即行图像中每一列包含的黑色像素点个数。若行图像中有一列的黑色像素点个数为零,则说明这一列上不存在任何的痕迹,极有可能是两个字符间的分界线。根据这一原理,对字符图像进行初步分割。
附图说明
图1为本发明提供的一种字符分割方法的具体实施方式的流程框图;
图2为二值图像示意图;
图3为行图像示意图;
图4为垂直投影直方图示意图;
图5为垂直投影法分割字符图像的分割结果示意图;
图6为本发明提供的一种字符分割终端的具体实施方式的结构框图;
标号说明:
1、处理器; 2、存储器。
具体实施方式
下面结合附图和具体实施例来对本发明进行详细的说明。
请参照图1至图6,
本发明的实施例一为:
如图1所示,本实施例提供一种字符分割方法,包括:
S1、采用垂直投影法分割字符图像中的字符,得到字符有序集合。
其中,可采用现有的垂直投影法对字符图像进行分割,得到字符有序集合。
优选地,所述S1具体为:
S11、二值化所述字符图像,得到二值图像。
例如,图2为所述二值图像,二值图像中只包括黑色像素点和白色像素点。
S12、从所述二值图像中获取一行字符的图像,得到行图像。
例如,所述行图像如图3所示,为二值图像中的第一行文字所在区域。
S13、垂直投影所述行图像,得到垂直投影直方图;所述垂直投影直方图的横坐标表示一黑色像素点在所述行图像中的水平位置;所述垂直投影直方图的纵坐标表示黑色像素点个数。
例如,所述垂直投影直方图如图4所示。
S14、获取所述垂直投影直方图中,纵坐标值为零的点的横坐标值,得到坐标值集合。
S15、根据所述坐标值集合分割所述行图像,得到行字符有序集合。
例如,图4中,横坐标值为438至461的点的纵坐标值均为零,则说明横坐标值为438至461这一区域没有字迹,极有可能为两个字符间的空隔,可在这一区域设置一分割点,将两个字符分割开。
S16、重复执行所述步骤S2至所述步骤S5,直至所述二值图像所有行均被遍历;所述字符有序集合由所有的所述行字符有序集合组成。
例如,图5为垂直投影法分割字符图像的分割结果示意图。其中,“是一”由于存在黏连,未被正确分割为两个字符。“础”由于左右偏旁结构间存在空隙,被误分割为“石”和“出”。
其中,垂直投影直方图用于统计黑色像素点分布情况,即行图像中每一列包含的黑色像素点个数。若行图像中有一列的黑色像素点个数为零,则说明这一列上不存在任何的痕迹,极有可能是两个字符间的分界线。本实施例根据这一原理,对字符图像进行初步分割。
S2、合并所述字符有序集合中被误分割的字符。
S21、统计所述字符有序集合的平均字符宽度;所述上限值为所述平均字符宽度的1.2倍;所述下限值为所述平均字符宽度的80%。
其中,由图5可知,字符图像经过初步分割的字符宽度中,接近正常宽度nWidth的字符个数最多。在横坐标代表的字符宽度,纵坐标代表字符个数的直方图中只要统计出宽度分布最多(最密集)的区域,nWidth即落在这个区域里,最后取这个区域的中心点作为nWidth值。具体步骤:
设定固定步长(例如,5个像素点),循环横坐标从1到最大字符宽度max,累加连续步长横坐标对应的字符数,如横坐标为Xn时,累加数为Xn-2~Xn+2区域的纵坐标值总和SUMn,在这些累加数SUM1~SUMmax中的最大值对应的横坐标值可确认为nWidth。
nWidth代表一个字符所应该占有的标准宽度,正常宽度应接近nWidth。实际字符与此值偏差越大,代表异常概率越高。在这里偏差取0.2*nWidth,下限值为nWidth -0.2*nWidth =0.8*nWidth,上限值为nWidth+0.2*nWidth =1.2*nWidth,即满足宽度在0.8*nWidth-1.2n*Width区域时认定为完整单字符的正常宽度,不需要进行黏连切开或偏旁部首合并处理,在小于0.8nWidth需要进行偏旁部首合并判断,大于1.2nWidth需要进行黏连判断。
若上限值和下限值的取值偏差太大,对于异常情况的条件限制过于严格,导致很多异常无法进行判断;偏差值取得太小,异常情况条件限制的太宽松,会导致正常字符也要进入判断是否异常。本发明的上限值和下限值为经验值能够实现较好的检测出异常情况。
例如,所示字符有序集合的平均字符宽度为nWidth,则所述上限值为1.2*nWidth,所述下限值为0.8*nWidth。
S22、当第一字符的宽度小于预设的下限值时,获取所述字符图像中与所述第一字符相邻的字符,得到第二字符;所述第一字符为所述字符有序集合中的一字符。
S23、调用OCR识别引擎识别第三字符,得到第一OCR识别结果;所述第三字符由所述第一字符和所述第二字符组成。
S24、若所述第一OCR识别结果的置信度大于预设的置信度阈值,且所述第三字符的宽度小于预设的上限值,则合并所述字符有序集合中的所述第一字符和所述第二字符。
其中,所述预设的置信度阈值为900。本实施例中,置信度阈值的最大值为1000。
例如,图5中的“2”的字符宽度小于下限值0.8nWidth,则获取与其相邻且位于右侧的第二字符“0”。调用OCR识别引擎对第三字符“20”进行识别,识别结果的置信度为100,远低于预设的置信度阈值900,则说明“20”不是一个正确的字符,不将“2”和“0”合并。OCR识别引擎对“础”进行识别,识别结果的置信为970,大于预设的置信度阈值900,则说明“础”是一个正确的字符。并且合并后的“础”的宽度小于预设的上限值,“石”的宽度小于预设的下限值,说明“石”极有可能只是一个拼旁部首,“础”在根据垂直投影法分割字符的过程中被误分割为“石”和“出”,因此,应将二者合并为“础”,修正了垂直投影法的错误分割结果。
其中,本实施例检测到一个字符的宽度小于预设的下限值时,即发现根据垂直投影法初步分割的过程中,存在将一个字符误分割成两个字符的可能时,先调用OCR识别引擎识别合并后的字符,若识别结果的置信度大于预设的置信度阈值,说明合并后的字符较大概率是一个正确的字符,则将两字符合并,否则不合并两字符。极大程度上提高了对同时包含多种类型字符的字符图像进行字符分割的准确性。
S3、分割所述字符有序集合中黏连的字符。
S31、当第四字符的宽度大于所述预设的上限值时,获取第五字符和第六字符;所述第四字符为所述字符有序集合中的一字符;所述第四字符由所述第五字符和所述第六字符组成。
例如,第四字符为图5中的“是一”,“是一”的字符宽度大于预设的上限值1.2nwidth。
S32、调用OCR识别引擎识别所述第五字符,得到第二识别结果。
S33、调用OCR识别引擎识别所述第六字符,得到第三识别结果。
例如,所述第五字符为“是”,第六字符为“一”,第四字符“是一”由第五字符和第六字符组成。
S34、若所述第二识别结果的置信度和所述第三识别结果的置信度均大于所述预设的置信度阈值,则将所述字符有序集合中的所述第四字符分割成所述第五字符和所述第六字符。
例如,OCR识别引擎识别第五字符“是”的识别结果的置信度为967,OCR识别引擎识别第六字符“一”的识别结果的置信度为980,均大于预设的置信度阈值900,同时OCR识别引擎对“是一”的识别结果的置信度为140,远低于预设的置信度阈值。因此,“是一”极大可能不是一个正确的字符,而分割结果“是”和“一”极大可能都是正确的字符,因此,本实施例将第四字符“是一”分割为第五字符“是”和第六字符“一”。
其中,当发现字符有序集合中一个字符的宽度大于预设的上限值时,即根据垂直投影方法初步分割的过程中对于黏连的两个字符可能存在未分割开的情形时,先调用OCR引擎分别识别根据字符宽度大于预设的上限值的字符分割得到的两个字符,若两个字符的识别结果的置信度均大于预设的置信度阈值,则说明分割得到的两个字符较大概率均为正确的字符,再执行分割操作,避免了对未黏连的一个字符误分割为两个字符的情形,极大程度上提高了对同时包含多种类型字符的字符图像进行字符分割的准确性。
本发明的实施例二为:
如图6所示,本实施例提供一种字符分割终端,包括一个或多个处理器1及存储器2,所述存储器2存储有程序,并且被配置成由所述一个或多个处理器1执行以下步骤:
S1、采用垂直投影法分割字符图像中的字符,得到字符有序集合。
其中,可采用现有的垂直投影法对字符图像进行分割,得到字符有序集合。
优选地,所述S1具体为:
S11、二值化所述字符图像,得到二值图像。
例如,图2为所述二值图像,二值图像中只包括黑色像素点和白色像素点。
S12、从所述二值图像中获取一行字符的图像,得到行图像。
例如,所述行图像如图3所示,为二值图像中的第一行文字所在区域。
S13、垂直投影所述行图像,得到垂直投影直方图;所述垂直投影直方图的横坐标表示一黑色像素点在所述行图像中的水平位置;所述垂直投影直方图的纵坐标表示黑色像素点个数。
例如,所述垂直投影直方图如图4所示。
S14、获取所述垂直投影直方图中,纵坐标值为零的点的横坐标值,得到坐标值集合。
S15、根据所述坐标值集合分割所述行图像,得到行字符有序集合。
例如,图4中,横坐标值为438至461的点的纵坐标值均为零,则说明横坐标值为438至461这一区域没有字迹,极有可能为两个字符间的空隔,可在这一区域设置一分割点,将两个字符分割开。
S16、重复执行所述步骤S2至所述步骤S5,直至所述二值图像所有行均被遍历;所述字符有序集合由所有的所述行字符有序集合组成。
例如,图5为垂直投影法分割字符图像的分割结果示意图。其中,“是一”由于存在黏连,未被正确分割为两个字符。“础”由于左右偏旁结构间存在空隙,被误分割为“石”和“出”。
其中,垂直投影直方图用于统计黑色像素点分布情况,即行图像中每一列包含的黑色像素点个数。若行图像中有一列的黑色像素点个数为零,则说明这一列上不存在任何的痕迹,极有可能是两个字符间的分界线。本实施例根据这一原理,对字符图像进行初步分割。
S2、合并所述字符有序集合中被误分割的字符。
S21、统计所述字符有序集合的平均字符宽度;所述上限值为所述平均字符宽度的1.2倍;所述下限值为所述平均字符宽度的80%。
其中,由图5可知,字符图像经过初步分割的字符宽度中,接近正常宽度nWidth的字符个数最多。在横坐标代表的字符宽度,纵坐标代表字符个数的直方图中只要统计出宽度分布最多(最密集)的区域,nWidth即落在这个区域里,最后取这个区域的中心点作为nWidth值。具体步骤:
设定固定步长(例如,5个像素点),循环横坐标从1到最大字符宽度max,累加连续步长横坐标对应的字符数,如横坐标为Xn时,累加数为Xn-2~Xn+2区域的纵坐标值总和SUMn,在这些累加数SUM1~SUMmax中的最大值对应的横坐标值可确认为nWidth。
nWidth代表一个字符所应该占有的标准宽度,正常宽度应接近nWidth。实际字符与此值偏差越大,代表异常概率越高。在这里偏差取0.2*nWidth,下限值为nWidth -0.2*nWidth =0.8*nWidth,上限值为nWidth+0.2*nWidth =1.2*nWidth,即满足宽度在0.8*nWidth-1.2n*Width区域时认定为完整单字符的正常宽度,不需要进行黏连切开或偏旁部首合并处理,在小于0.8nWidth需要进行偏旁部首合并判断,大于1.2nWidth需要进行黏连判断。
若上限值和下限值的取值偏差太大,对于异常情况的条件限制过于严格,导致很多异常无法进行判断;偏差值取得太小,异常情况条件限制的太宽松,会导致正常字符也要进入判断是否异常。本发明的上限值和下限值为经验值能够实现较好的检测出异常情况。
例如,所示字符有序集合的平均字符宽度为nWidth,则所述上限值为1.2nWidth,所述下限值为0.8nWidth。
S22、当第一字符的宽度小于预设的下限值时,获取所述字符图像中与所述第一字符相邻的字符,得到第二字符;所述第一字符为所述字符有序集合中的一字符。
S23、调用OCR识别引擎识别第三字符,得到第一OCR识别结果;所述第三字符由所述第一字符和所述第二字符组成。
S24、若所述第一OCR识别结果的置信度大于预设的置信度阈值,且所述第三字符的宽度小于预设的上限值,则合并所述字符有序集合中的所述第一字符和所述第二字符。
其中,所述预设的置信度阈值为900。本实施例中,置信度阈值的最大值为1000。
例如,图5中的“2”的字符宽度小于下限值0.8nWidth,则获取与其相邻且位于右侧的第二字符“0”。调用OCR识别引擎对第三字符“20”进行识别,识别结果的置信度为100,远低于预设的置信度阈值900,则说明“20”不是一个正确的字符,不将“2”和“0”合并。OCR识别引擎对“础”进行识别,识别结果的置信为970,大于预设的置信度阈值900,则说明“础”是一个正确的字符。并且合并后的“础”的宽度小于预设的上限值,“石”的宽度小于预设的下限值,说明“石”极有可能只是一个拼旁部首,“础”在根据垂直投影法分割字符的过程中被误分割为“石”和“出”,因此,应将二者合并为“础”,修正了垂直投影法的错误分割结果。
其中,本实施例检测到一个字符的宽度小于预设的下限值时,即发现根据垂直投影法初步分割的过程中,存在将一个字符误分割成两个字符的可能时,先调用OCR识别引擎识别合并后的字符,若识别结果的置信度大于预设的置信度阈值,说明合并后的字符较大概率是一个正确的字符,则将两字符合并,否则不合并两字符。极大程度上提高了对同时包含多种类型字符的字符图像进行字符分割的准确性。
S3、分割所述字符有序集合中黏连的字符。
S31、当第四字符的宽度大于所述预设的上限值时,获取第五字符和第六字符;所述第四字符为所述字符有序集合中的一字符;所述第四字符由所述第五字符和所述第六字符组成。
例如,第四字符为图5中的“是一”,“是一”的字符宽度大于预设的上限值1.2nwidth。
S32、调用OCR识别引擎识别所述第五字符,得到第二识别结果。
S33、调用OCR识别引擎识别所述第六字符,得到第三识别结果。
例如,所述第五字符为“是”,第六字符为“一”,第四字符“是一”由第五字符和第六字符组成。
S34、若所述第二识别结果的置信度和所述第三识别结果的置信度均大于所述预设的置信度阈值,则将所述字符有序集合中的所述第四字符分割成所述第五字符和所述第六字符。
例如,OCR识别引擎识别第五字符“是”的识别结果的置信度为967,OCR识别引擎识别第六字符“一”的识别结果的置信度为980,均大于预设的置信度阈值900,同时OCR识别引擎对“是一”的识别结果的置信度为140,远低于预设的置信度阈值。因此,“是一”极大可能不是一个正确的字符,而分割结果“是”和“一”极大可能都是正确的字符,因此,本实施例将第四字符“是一”分割为第五字符“是”和第六字符“一”。
其中,当发现字符有序集合中一个字符的宽度大于预设的上限值时,即根据垂直投影方法初步分割的过程中对于黏连的两个字符可能存在未分割开的情形时,先调用OCR引擎分别识别根据字符宽度大于预设的上限值的字符分割得到的两个字符,若两个字符的识别结果的置信度均大于预设的置信度阈值,则说明分割得到的两个字符较大概率均为正确的字符,再执行分割操作,避免了对未黏连的一个字符误分割为两个字符的情形,极大程度上提高了对同时包含多种类型字符的字符图像进行字符分割的准确性。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (8)

1.一种字符分割方法,其特征在于,包括:
采用垂直投影法分割字符图像中的字符,得到字符有序集合;
当第一字符的宽度小于预设的下限值时,获取所述字符图像中与所述第一字符相邻的字符,得到第二字符;所述第一字符为所述字符有序集合中的一字符;
调用OCR识别引擎识别第三字符,得到第一OCR识别结果;所述第三字符由所述第一字符和所述第二字符组成;
若所述第一OCR识别结果的置信度大于预设的置信度阈值,且所述第三字符的宽度小于预设的上限值,则合并所述字符有序集合中的所述第一字符和所述第二字符。
2.根据权利要求1所述的字符分割方法,其特征在于,还包括:
当第四字符的宽度大于所述预设的上限值时,获取第五字符和第六字符;所述第四字符为所述字符有序集合中的一字符;所述第四字符由所述第五字符和所述第六字符组成;
调用OCR识别引擎识别所述第五字符,得到第二识别结果;
调用OCR识别引擎识别所述第六字符,得到第三识别结果;
若所述第二识别结果的置信度和所述第三识别结果的置信度均大于所述预设的置信度阈值,则将所述字符有序集合中的所述第四字符分割成所述第五字符和所述第六字符。
3.根据权利要求1所述的字符分割方法,其特征在于,获取所述预设的上限值和下限值的步骤为:
统计所述字符有序集合的平均字符宽度;
所述上限值为所述平均字符宽度的1.2倍;
所述下限值为所述平均字符宽度的80%。
4.根据权利要求1所述的字符分割方法,其特征在于,采用垂直投影法分割字符图像中的字符,得到字符有序集合,具体为:
S1、二值化所述字符图像,得到二值图像;
S2、从所述二值图像中获取一行字符的图像,得到行图像;
S3、垂直投影所述行图像,得到垂直投影直方图;所述垂直投影直方图的横坐标表示一黑色像素点在所述行图像中的水平位置;所述垂直投影直方图的纵坐标表示黑色像素点个数;
S4、获取所述垂直投影直方图中,纵坐标值为零的点的横坐标值,得到坐标值集合;
S5、根据所述坐标值集合分割所述行图像,得到行字符有序集合;
S6、重复执行所述步骤S2至所述步骤S5,直至所述二值图像所有行均被遍历;所述字符有序集合由所有的所述行字符有序集合组成。
5.一种字符分割终端,其特征在于,包括一个或多个处理器及存储器,所述存储器存储有程序,并且被配置成由所述一个或多个处理器执行以下步骤:
采用垂直投影法分割字符图像中的字符,得到字符有序集合;
当第一字符的宽度小于预设的下限值时,获取所述字符图像中与所述第一字符相邻的字符,得到第二字符;所述第一字符为所述字符有序集合中的一字符;
调用OCR识别引擎识别第三字符,得到第一OCR识别结果;所述第三字符由所述第一字符和所述第二字符组成;
若所述第一OCR识别结果的置信度大于预设的置信度阈值,且所述第三字符的宽度小于预设的上限值,则合并所述字符有序集合中的所述第一字符和所述第二字符。
6.根据权利要求5所述的字符分割终端,其特征在于,还包括:
当第四字符的宽度大于所述预设的上限值时,获取第五字符和第六字符;所述第四字符为所述字符有序集合中的一字符;所述第四字符由所述第五字符和所述第六字符组成;
调用OCR识别引擎识别所述第五字符,得到第二识别结果;
调用OCR识别引擎识别所述第六字符,得到第三识别结果;
若所述第二识别结果的置信度和所述第三识别结果的置信度均大于所述预设的置信度阈值,则将所述字符有序集合中的所述第四字符分割成所述第五字符和所述第六字符。
7.根据权利要求5所述的字符分割终端,其特征在于,获取所述预设的上限值和下限值的步骤为:
统计所述字符有序集合的平均字符宽度;
所述上限值为所述平均字符宽度的1.2倍;
所述下限值为所述平均字符宽度的80%。
8.根据权利要求5所述的字符分割终端,其特征在于,采用垂直投影法分割字符图像中的字符,得到字符有序集合,具体为:
S1、二值化所述字符图像,得到二值图像;
S2、从所述二值图像中获取一行字符的图像,得到行图像;
S3、垂直投影所述行图像,得到垂直投影直方图;所述垂直投影直方图的横坐标表示一黑色像素点在所述行图像中的水平位置;所述垂直投影直方图的纵坐标表示黑色像素点个数;
S4、获取所述垂直投影直方图中,纵坐标值为零的点的横坐标值,得到坐标值集合;
S5、根据所述坐标值集合分割所述行图像,得到行字符有序集合;
S6、重复执行所述步骤S2至所述步骤S5,直至所述二值图像所有行均被遍历;所述字符有序集合由所有的所述行字符有序集合组成。
CN201910208497.9A 2019-03-19 2019-03-19 一种字符分割方法及终端 Pending CN109948620A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910208497.9A CN109948620A (zh) 2019-03-19 2019-03-19 一种字符分割方法及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910208497.9A CN109948620A (zh) 2019-03-19 2019-03-19 一种字符分割方法及终端

Publications (1)

Publication Number Publication Date
CN109948620A true CN109948620A (zh) 2019-06-28

Family

ID=67009057

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910208497.9A Pending CN109948620A (zh) 2019-03-19 2019-03-19 一种字符分割方法及终端

Country Status (1)

Country Link
CN (1) CN109948620A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112016566B (zh) * 2020-10-27 2021-03-16 恒银金融科技股份有限公司 一种金融票据大写金额处手写汉字的分割方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5692069A (en) * 1995-03-17 1997-11-25 Eastman Kodak Company Apparatus for performing character segmentation using slant histograms
CN103729636A (zh) * 2013-12-18 2014-04-16 小米科技有限责任公司 字符切割方法、装置及电子设备
CN104636747A (zh) * 2013-11-11 2015-05-20 北京大学 一种字符去粘连的方法及系统
CN106599896A (zh) * 2016-11-08 2017-04-26 广州视源电子科技股份有限公司 一种字符分割方法和装置、及元件检测方法和装置
CN107729899A (zh) * 2016-08-11 2018-02-23 杭州海康威视数字技术股份有限公司 一种车牌号码识别方法及装置
CN108491845A (zh) * 2018-03-02 2018-09-04 深圳怡化电脑股份有限公司 字符分割位置的确定、字符分割方法、装置及设备
CN109034158A (zh) * 2017-06-09 2018-12-18 杭州海康威视数字技术股份有限公司 一种车牌识别方法、装置及计算机设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5692069A (en) * 1995-03-17 1997-11-25 Eastman Kodak Company Apparatus for performing character segmentation using slant histograms
CN104636747A (zh) * 2013-11-11 2015-05-20 北京大学 一种字符去粘连的方法及系统
CN103729636A (zh) * 2013-12-18 2014-04-16 小米科技有限责任公司 字符切割方法、装置及电子设备
CN107729899A (zh) * 2016-08-11 2018-02-23 杭州海康威视数字技术股份有限公司 一种车牌号码识别方法及装置
CN106599896A (zh) * 2016-11-08 2017-04-26 广州视源电子科技股份有限公司 一种字符分割方法和装置、及元件检测方法和装置
CN109034158A (zh) * 2017-06-09 2018-12-18 杭州海康威视数字技术股份有限公司 一种车牌识别方法、装置及计算机设备
CN108491845A (zh) * 2018-03-02 2018-09-04 深圳怡化电脑股份有限公司 字符分割位置的确定、字符分割方法、装置及设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112016566B (zh) * 2020-10-27 2021-03-16 恒银金融科技股份有限公司 一种金融票据大写金额处手写汉字的分割方法

Similar Documents

Publication Publication Date Title
US9311533B2 (en) Device and method for detecting the presence of a logo in a picture
US8942484B2 (en) Text detection using image regions
CN102509383B (zh) 一种基于特征检测及模板匹配的混合号码识别方法
US11087168B2 (en) Method and apparatus for positioning text over image, electronic apparatus, and storage medium
CN101515325B (zh) 基于字符切分和颜色聚类的数字视频中的字符提取方法
CN110287949B (zh) 视频片段提取方法、装置、设备及存储介质
CN104298982A (zh) 一种文字识别方法及装置
CN105225335A (zh) 一种纸币冠字号污损识别方法与系统
CN105868759A (zh) 分割图像字符的方法及装置
Huang et al. Automatic detection and localization of natural scene text in video
CN105005969B (zh) 一种票据图像涂改检测方法及系统
CN102750773B (zh) 纸币冠字号图像区域的定位方法
CN110647882A (zh) 图像校正方法、装置、设备及存储介质
CN110619333A (zh) 一种文本行分割方法、文本行分割装置及电子设备
CN108734161B (zh) 冠字号区域的识别方法、装置、设备及存储介质
CN108830278A (zh) 一种字符串图像识别方法
CN109948620A (zh) 一种字符分割方法及终端
CN109508716B (zh) 一种图像文字的定位方法及装置
CN109919155A (zh) 一种文本图像的倾斜角矫正方法及终端
CN110059695B (zh) 一种基于垂直投影的字符分割方法及终端
CN103679700A (zh) 票据图像倒置检测系统
CN109255320A (zh) 一种改进的非极大值抑制方法
CN108805115A (zh) 一种图片中文字的识别方法、装置、设备及存储介质
CN114241490A (zh) 基于笔画扰动与后处理的手写体识别模型性能的提升方法
CN100456317C (zh) 行方向判定方法以及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination