CN108491845A - 字符分割位置的确定、字符分割方法、装置及设备 - Google Patents

字符分割位置的确定、字符分割方法、装置及设备 Download PDF

Info

Publication number
CN108491845A
CN108491845A CN201810175856.0A CN201810175856A CN108491845A CN 108491845 A CN108491845 A CN 108491845A CN 201810175856 A CN201810175856 A CN 201810175856A CN 108491845 A CN108491845 A CN 108491845A
Authority
CN
China
Prior art keywords
split
adhesion
character
segmentation
substring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810175856.0A
Other languages
English (en)
Other versions
CN108491845B (zh
Inventor
傅博扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yihua Computer Co Ltd
Shenzhen Yihua Time Technology Co Ltd
Shenzhen Yihua Financial Intelligent Research Institute
Original Assignee
Shenzhen Yihua Computer Co Ltd
Shenzhen Yihua Time Technology Co Ltd
Shenzhen Yihua Financial Intelligent Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yihua Computer Co Ltd, Shenzhen Yihua Time Technology Co Ltd, Shenzhen Yihua Financial Intelligent Research Institute filed Critical Shenzhen Yihua Computer Co Ltd
Priority to CN201810175856.0A priority Critical patent/CN108491845B/zh
Publication of CN108491845A publication Critical patent/CN108491845A/zh
Application granted granted Critical
Publication of CN108491845B publication Critical patent/CN108491845B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)

Abstract

本发明实施例公开了一种字符分割位置的确定、字符分割方法、装置及设备,所述字符分割位置的确定方法包括:根据待分割字符串图像中包括的至少一个粘连子串、所述粘连子串的宽度以及单个字符的平均宽度,确定与所述粘连子串中包括的各字符对应的目标分割位置;根据字符间粘连区域的属性信息,确定与所述粘连子串对应的至少一个备选分割位置;根据所述粘连子串的边界位置、与所述粘连子串对应的至少一个备选分割位置,以及预设更新条件,对所述目标分割位置进行更新,解决现有分割法对粘连字符的分割效果不佳及存在漏分、错分的问题,从而提高粘连字符的分割准确率,提升粘连字符的分割效果。

Description

字符分割位置的确定、字符分割方法、装置及设备
技术领域
本发明实施例涉及文本识别技术领域,尤其涉及一种字符分割位置的确定、字符分割方法、装置及设备。
背景技术
字符分割技术是文本处理技术领应用非常广泛的一个技术要点,字符分割的准确性直接影响到文本的处理效果。
目前,常用的字符分割方法有连通分量提取法和滴水分割法等。连通分量提取法是一种被广泛应用字符分割方法,但是这种方法不能分割粘连字符,只能分割没有粘连的字符。粘连字符的分割目前主要应用滴水分割法和利用隐型马尔科夫链的分割法。
滴水分割法主要是模仿水滴从高处向低处滴落的过程来对粘连字符进行切分。水滴从字符串顶部在重力的作用下,只能沿字符轮廓向下滴落或水平滚动,当水滴陷在轮廓的凹处时,将渗漏到字符笔画中,经穿透笔画后继续滴落,最终水滴所经过的轨迹就构成了字符的分割路径。利用隐型马尔科夫链的分割法采用人工分割的样本作为训练集合,采用固定大小的小块学习字符之间的可分割概率作为先验知识,对输入图像使用马尔科夫网络,从先验知识中得到一个概率图,表示图像中各个位置可能成为分割点的概率,对概率图使用图像分割算法进行分割,得到字符串的分割位置。
滴水分割法在处理有多个“凹处”和字符扭曲倾斜的验证码时,无法确定准确的滴水渗漏处,错误判断分割位置,造成分割字符笔画的断裂。利用隐型马尔科夫链的分割法的实施过度依赖先验知识,适用于固定格式的验证码。对字符大小和字符间距变化较大的验证码,则无法准确分割。因此,滴水分割法和利用隐型马尔科夫链的分割法对粘连字符的分割效果不佳,存在漏分、错分的问题,分割字符的准确率很差。
发明内容
本发明实施例提供一种字符分割位置的确定、字符分割方法、装置及设备,解决现有分割法对粘连字符的分割效果不佳及存在漏分、错分的问题,从而提高粘连字符的分割准确率,提升粘连字符的分割效果。
第一方面,本发明实施例提供了一种字符分割位置的确定方法,包括:
根据待分割字符串图像中包括的至少一个粘连子串、所述粘连子串的宽度以及单个字符的平均宽度,确定与所述粘连子串中包括的各字符对应的目标分割位置;
根据字符间粘连区域的属性信息,确定与所述粘连子串对应的至少一个备选分割位置;
根据所述粘连子串的边界位置、与所述粘连子串对应的至少一个备选分割位置,以及预设更新条件,对所述目标分割位置进行更新。
第二方面,本发明实施例还提供了一种字符分割方法,包括:
在目标图像中获取待分割字符串图像,并根据所述待分割字符串图像中包括的字符总数量以及所述待分割字符串图像的两个边界之间的宽度,确定与所述待分割字符串图像中的各单个字符对应的第一分割位置;
根据所述待分割字符串图像中各列和投影,确定出至少一个第二分割位置,并使用所述第二分割位置更新所述第一分割位置;
根据所述第二分割位置,在所述待分割字符串图像中确定出至少一个粘连子串;
使用如第一方面所述的方法,确定出所述粘连子串中包括的各字符对应的目标分割位置;
根据所述目标分割位置以及所述第一分割位置对所述待分割字符串图像进行字符分割。
第三方面,本发明实施例还提供了一种字符分割位置的确定装置,包括:
目标分割位置确定模块,用于根据待分割字符串图像中包括的至少一个粘连子串、所述粘连子串的宽度以及单个字符的平均宽度,确定与所述粘连子串中包括的各字符对应的目标分割位置;
备选分割位置确定模块,用于根据字符间粘连区域的属性信息,确定与所述粘连子串对应的至少一个备选分割位置;
目标分割位置更新模块,用于根据所述粘连子串的边界位置、与所述粘连子串对应的至少一个备选分割位置,以及预设更新条件,对所述目标分割位置进行更新。
第四方面,本发明实施例还提供了第一分割位置确定模块,用于在目标图像中获取待分割字符串图像,并根据所述待分割字符串图像中包括的字符总数量以及所述待分割字符串图像的两个边界之间的宽度,确定与所述待分割字符串图像中的各单个字符对应的第一分割位置;
第一分割位置更新模块,用于根据所述待分割字符串图像中各列和投影,确定出至少一个第二分割位置,并使用所述第二分割位置更新所述第一分割位置;
粘连子串确定模块,用于根据所述第二分割位置,在所述待分割字符串图像中确定出至少一个粘连子串;
子串分割位置确定模块,用于使用第一方面所述的方法,确定出所述粘连子串中包括的各字符对应的目标分割位置;
字符分割模块,用于根据所述目标分割位置以及所述第一分割位置对所述待分割字符串图像进行字符分割。
第五方面,本发明实施例还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述所涉及的任一所述的字符分割位置的确定方法。
第六方面,本发明实施例还提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述所涉及的任一所述的字符分割位置的确定方法。
第七方面,本发明实施例还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述所涉及的任一所述的字符分割方法。
第八方面,本发明实施例还提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述所涉及的任一所述的字符分割方法。
本发明实施例通过在目标图像中获取待分割字符串图像,确定待分割字符串图像中的各单个字符对应的第一分割位置,在待分割字符串图像中确定出至少一个粘连子串,及各粘连子串包括的各字符对应的目标分割位置;根据目标分割位置以及第一分割位置对待分割字符串图像进行字符分割,解决现有分割法对粘连字符的分割效果不佳及存在漏分、错分的问题,从而提高粘连字符的分割准确率,提升粘连字符的分割效果。
附图说明
图1是本发明实施例一提供的一种字符分割位置的确定方法的流程图;
图2是本发明实施例二提供的一种字符分割位置的确定方法的流程图;
图3是本发明实施例三提供的一种字符分割方法的流程图;
图4是本发明实施例四提供的一种字符分割位置的确定装置的示意图;
图5是本发明实施例五提供的一种字符分割装置的示意图;
图6为本发明实施例六提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1是本发明实施例一提供的一种字符分割位置的确定方法的流程图,本实施例可适用于确定粘连字符分割位置的情况,该方法可以由字符分割位置的确定装置来执行,该装置可以由软件和/或硬件的方式来实现,并一般可集成在计算机设备中,如图1所示,该方法包括如下操作:
S110、根据待分割字符串图像中包括的至少一个粘连子串、所述粘连子串的宽度以及单个字符的平均宽度,确定与所述粘连子串中包括的各字符对应的目标分割位置。
其中,待分割字符串图像中包括待分割的字符串。粘连子串的宽度以及单个字符的平均宽度可以是物理距离的宽度,也可以是粘连子串和单个字符在水平方向包括的像素点的个数。优选的,粘连子串的宽度和单个字符的平均宽度为水平方向包括的像素点的个数。目标分割位置为根据粘连子串的宽度以及单个字符的平均宽度确定的等间隔分割位置。单个字符的平均宽度可以基于先验知识获取,例如银行账号、身份证号中单个字符的平均宽度等,本发明实施例对此并不进行限制。
需要说明的是,在对待分割字符串图像以及粘连子串进行处理前,可以首先对待分割字符串图像进行二值化处理,将待分割字符串图像上的像素点的灰度值设置为0或255,以便根据像素点对待分割字符串图像确定分割位置。
另外还需说明的是,在对粘连子串确定目标分割位置之前,还需要根据粘连字串的宽度来判断粘连子串中是否存在粘连字符。具体的判断方法可以是:如果粘连子串的宽度大于预设的阈值(如单个字符宽度的1.2倍),则表明该粘连子串中存在粘连字符,否则认为该粘连子串是单个字符。在确定粘连子串中存在粘连字符时,才需要对粘连字串确定目标分割位置。
在本发明实施例中,当获取到粘连子串的宽度(L)以及单个字符的平均宽度(char_mean)后,可以根据公式num=Floor(L/char_mean)确定该粘连子串包含的字符个数num,以及目标分割位置(数量为num-1)。举例而言,粘连子串的宽度为100,单个字符的平均宽度为10,则粘连子串包括的单个字符个数为10,该粘连子串的目标分割位置有9个,各目标分割位置的间距为10。需要说明的是,当每个字符宽度不一致时,也可以对粘连子串进行不等间隔的分割,并记录相应的分割位置作为目标分割位置。
S120、根据字符间粘连区域的属性信息,确定与所述粘连子串对应的至少一个备选分割位置。
其中,字符间粘连区域的属性信息可以是字符间粘连区域各列像素点的个数。可选的,字符间粘连区域的属性信息可以是字符间粘连区域各列像素点的灰度值为255的个数(粘连子串经过二值化处理)。
在本发明实施例中,可以根据字符间粘连区域各列像素点的个数信息确定粘连子串对应的至少一个备选分割位置。
在本发明的一个可选实施例中,所述根据字符间粘连区域的属性信息,确定与所述粘连子串对应的至少一个备选分割位置,包括:获取所述粘连子串的粘连区域中各列和投影的第一最小值位置;获取所述粘连子串的粘连区域中列高度的第二最小值位置;将所述第一最小值位置以及所述第二最小值位置作为所述粘连子串的备选分割位置。
其中,列和投影可以是每列像素点在垂直方向的投影,列和投影可以统计粘连子串每列图像数据中非零像素点的个数。列高度可以是粘连子串图像数据每列非零像素点的高度,具体可以对每列粘连子串图像数据从上从上往下找出起始点,从下到上找出结束点,则起始点和结束点两者之间的差(起始点和结束点之间包括的非零像素点的个数)即为列高度。第一最小值和第二最小值可以是根据实际需求分别为其设置相应的阈值,本发明实施例对此并不进行限制。
在本发明实施例中,可以将粘连子串中所有的列和投影和列高度的最小值位置确定为粘连子串的备选分割位置。需要说明的是,对于粘连子串连续多列出现列和投影或者列高度的最小值情况,可以将连续多列最小值的起始列记为start,将连续多列最小值的止点列记为end,通过最小值的起止位置为连续多列的最小值确定一个最小值:(start×end)/2,也即最小值位置为连续多列最小值的中间位置。这种最小值的处理方式能够有效减少不必要的备选分割位置,从而降低算法的数据处理量,提高算法的处理速度。
S130、根据所述粘连子串的边界位置、与所述粘连子串对应的至少一个备选分割位置,以及预设更新条件,对所述目标分割位置进行更新。
其中,粘连子串的边界位置可以是粘连子串的左边界和右边界位置。预设更新条件是根据当前待处理的分割位置、上一个已经确定的目标分割位置、字符的宽度以及粘连字符的宽度,确定的筛选备选分割位置并更新目标分割位置的条件。
在本发明实施例中,可以针对当前目标分割位置依据相应的规则选取该当前目标分割位置匹配的一定数量的备选分割位置。需要说明的是,在筛选备选分割位置时,不必对全部的备选分割位置进行判断,因为当前目标分割位置对应的备选分割位置只在当前目标分割位置对应的小范围内出现。在选取当前目标分割位置匹配的一定数量的备选分割位置后,需要对选取的备选分割位置依次根据预设更新条件判断是否可以对当前目标分割位置进行更新。当备选分割位置满足预设更新条件时,即可采用该备选分割位置更新当前目标分割位置。
本发明实施例通过对待分割字符串图像中包括的至少一个粘连子串确定的各字符对应的目标分割位置,根据粘连子串的边界位置、与粘连子串对应的至少一个备选分割位置,以及预设更新条件,对目标分割位置进行更新,以获取最终的分割位置,解决现有分割法对粘连字符的分割效果不佳及存在漏分、错分的问题,从而提高粘连字符的分割准确率,提升粘连字符的分割效果。
实施例二
图2是本发明实施例二提供的一种字符分割位置的确定方法的流程图,如图2所示,该方法包括如下操作:
S210、根据待分割字符串图像中包括的至少一个粘连子串、所述粘连子串的宽度以及单个字符的平均宽度,确定与所述粘连子串中包括的各字符对应的目标分割位置。
S220、根据字符间粘连区域的属性信息,确定与所述粘连子串对应的至少一个备选分割位置。
S230、获取一个所述目标分割位置作为当前处理位置。
在本发明实施例中,一个粘连子串可能会存在多个目标分割位置。因此,需要遍历粘连子串的所有目标分割位置并进行更新。
S240、在所述备选分割位置中,获取与所述当前处理位置匹配的一个所述目标备选分割位置。
其中,目标备选分割位置是当前处理位置所在区域的备选分割位置。举例而言,当前处理位置为第10列,则第5列-第15列之间的备选分割位置即可作为当前处理位置的目标备选分割位置。
在本发明实施例中,一个目标分割位置可能对应存在多个目标备选分割位置,但并不是所有的目标备选分割位置都是可用的。因此需要对当前处理位置匹配的所有目标备选分割位置根据预设更新条件依次进行判断。
S250、当所述目标备选分割位置满足第一预设更新条件和第二预设更新条件时,将所述目标备选分割位置加入与所述当前处理位置对应的备选位置集中。
其中,第一预设更新条件和第二预设更新条件是两个预设更新条件。备选位置集中包括的目标备选分割位置为所有符合第一预设更新条件和第二预设更新条件的备选分割位置。备选位置集中包括的目标备选分割位置可以有一个,也可以有多个,当然,备选位置集也可以是空集。当备选位置集为空集时,表明当前处理位置不存在匹配的备选分割位置。
在本发明的一个可选实施例中,所述第一预设更新条件包括:上一个确定的所述目标分割位置对应的区域宽度与当前目标备选分割位置对应的区域宽度的差在第一预设范围内;所述第二预设更新条件包括:所述粘连子串的宽度与所述当前分割位置对应的区域宽度的差在第二预设范围内。
其中,第一预设范围和第二预设范围可以根据统计的单个字符宽度的最大值和最小值设置。
具体的,在利用预设更新条件对目标备选分割位置进行判断时,首先需要将粘连子串的左边界(左边界的划分方法在下一个实施例描述)作为第一个目标分割位置,记为S_0。上一个确定的目标分割位置记为S_i-1,当前处理位置记为S_i。将目标备选分割位置代入S_i时,需要满足的第一预设更新条件可以为:S_i-S_i-1的值在字符宽度的最小值和字符宽度的最大值对应的范围内;第二预设更新条件可以为:剩余部分的宽度L-(S_i-S_0)的值在(num-i)与字符宽度的最小值乘积和(num-i)与字符宽度的最大值乘积对应的范围内。其中,L为粘连子串的宽度,num为粘连子串包含的字符个数,i表示当前处理位置的编号(1≤i<num)。
举例而言,假设当前处理位置的编号为1,字符宽度的最小值为8,宽度的最大值为10,粘连子串的宽度为39,字符个数为5,则当前处理位置为S_1。获取与S_1匹配的一个目标备选分割位置代入S_1,如果S_1-S_0的值在(8,10)的范围内,表明该目标备选分割位置满足第一预设更新条件。如果39-(S_1-S_0)的值在(32,40)的范围内,表明该目标备选分割位置满足第二预设更新条件。也即,表明该目标备选分割位置满足预设更新条件,可以将该目标备选分割位置存储到当前处理位置对应的备选位置集中。
S260、判断是否获取与所述当前处理位置匹配的全部目标备选分割位置,若是,则执行S270,否则,返回执行S240。
需要说明的是,在备选分割位置中,当前处理位置可能存在多个符合预设更新条件的目标备选分割位置的情况。当存在多个符合预设更新条件的目标备选分割位置时,需要将所有的匹配的目标备选分割位置存储在当前处理位置对应的备选位置集中。
S270、判断是否完成对全部目标分割位置的处理,若是,则执行S280,否则,返回执行S230。
在本发明实施例中,需要找出粘连子串的所有目标分割位置对应的备选位置集。
S280、根据处理结束后与各所述目标分割位置分别对应的备选位置集,对各所述目标分割位置进行更新。
在本发明实施例中,一个粘连子串的所有目标分割位置对应的备选位置集确定后,需要采用备选位置集中的一个备选分割位置更新对应的目标分割位置,以完成对该粘连子串的所有目标分割位置的更新。对待分割字符图像中包括的所有粘连子串,均需要对通过目标分割位置对应的备选位置集对各粘连子串的目标分割位置进行更新,从而完成对待分割字符串图像中所有粘连子串的字符分割位置的确定。
本发明实施例通过确定粘连子串的目标分割位置对应的备选位置集,并根据备选位置集对粘连子串的各目标分割位置进行更新,从而确定粘连子串的字符分割位置,解决现有分割法对粘连字符的分割效果不佳及存在漏分、错分的问题,从而提高粘连字符的分割准确率,提升粘连字符的分割效果。
在本发明的一个可选实施例中,所述根据处理结束后与各所述目标分割位置分别对应的备选位置集,对各所述目标分割位置进行更新,包括:如果所述备选位置集包括一个所述目标备选分割位置,则根据所述目标备选分割位置更新对应的所述目标分割位置;如果所述备选位置集包括至少两个所述目标备选分割位置,则根据至少两个所述目标备选分割位置对所述粘连子串进行分割,对分割后的所述粘连子串进行字符识别,并根据识别结果计算至少两个所述目标备选分割位置对应的置信度分数;根据所述置信度分数最高的所述目标备选分割位置更新所述目标分割位置。
其中,置信度分数是根据目标备选分割位置分别分割粘连子串获取各自的分割结果,对分割后的字符进行识别后获取的每个字符的准确度,可以采用现有确定识别出的字符的置信度的方法来确定。可选的,本发明实施例对确定置信度分数所采用的字符识别算法可以是基于模板匹配的字符识别算法,也可以采用其他现有的字符识别算法,本发明实施例对此并不进行限制。
具体的,如果粘连子串的其中一个目标分割位置对应的备选位置集中包括一个目标备选分割位置,则使用该目标备选分割位置更新该目标分割位置。如果粘连子串的其中一个目标分割位置对应的备选位置集中包括多个目标备选分割位置,则根据每个目标备选分割位置对粘连子串进行分割,对分割后的粘连子串进行字符识别,并根据识别结果计算每个目标备选分割位置对应的置信度分数,选择置信度分数最高的目标备选分割位置更新目标分割位置。如果最高置信度分数对应存在多个目标候选分割位置,则可以随机选择其中一个置信度分数最高的目标候选分割位置更新目标分割位置。
在本发明的一个可选实施例中,所述根据处理结束后与各所述目标分割位置分别对应的备选位置集,对各所述目标分割位置进行更新,包括:如果所述备选位置集为空,则不对所述目标分割位置进行更新。
相应的,如果备选位置集为空,说明当前的目标分割位置不存在符合预设更新条件的备选分割位置,此时不需要更新目标分割位置,直接将确定的原始的目标分割位置作为目标分割位置。
实施例三
图3是本发明实施例三提供的一种字符分割方法的流程图,本实施例可适用于分割包含粘连字符图像的情况,该方法可以由字符分割装置来执行,该装置可以由软件和/或硬件的方式来实现,并一般可集成在计算机设备中,如图3所示,该方法包括如下操作:
S310、在目标图像中获取待分割字符串图像,并根据所述待分割字符串图像中包括的字符总数量以及所述待分割字符串图像的两个边界之间的宽度,确定与所述待分割字符串图像中的各单个字符对应的第一分割位置。
其中,目标图像既可以包括待分割字符串,也可以包括除待分割字符串的其他字符或标识。当目标图像中包括除待分割字符串的其他字符或标识时,需要采用图像处理字符识别相关算法以及相应的规则(如待分割字符串的长度范围)等从目标图像中获取待分割字符串图像。待分割字符串图像中包括的字符总数量可以根据先验知识确定。例如,身份证号码的字符总数量为18个,手机号的字符总数量为11个。待分割字符串图像的两个边界指的是待分割字符串图像的左右边界。优选的,待分割字符串图像的两个边界之间的宽度为待分割字符串图像的两个边界之间水平方向包括的像素点的个数。
在本发明实施例中,确定待分割字符串图像的左右边界可以采用边缘检测算法,如边缘检测梯度算法,或者采用边缘检测函数也可以确定待分割字符串图像的左右边界,只要是能够确定待分割字符串图像的左右边界即可,本发明实施例对此并不进行限制。
具体的,确定第一分割位置的方法与确定粘连子串的目标分割位置的方法类似,采用待分割字符串图像的左右边界之间的宽度与字符总数量的比值作为第一分割位置的等间隔间距,并将待分割字符串图像的左右边界分别作为第一个和最后一个第一分割位置。根据第一个和最后一个第一分割位置,以及确定的第一分割位置的间距,即可确定待分割字符串图像中的各单个字符对应的第一分割位置。
S320、根据所述待分割字符串图像中各列和投影,确定出至少一个第二分割位置,并使用所述第二分割位置更新所述第一分割位置。
具体的,对待分割字符串图像中每列非零像素点的个数进行求和计算(也即实施例一中描述的列和投影),当其中一列图像数据中非零像素点的个数为0,或者非零像素点的个数小于预设的阈值(考虑噪声的影响)时,将该列位置确定为一个第二分割位置。通过列和投影的方法可以确定待分割字符串图像中所有的第二分割位置。实际上,第二分割位置为待分割字符串图像中的单个字符和粘连子串之间的分割位置,因为待分割字符串图像中包括的字符并不是全部粘连的,很多情况下只是部分粘连的问题。因此,第二分割位置的确定能够将一个大的粘连问题分割为若干小的粘连问题,从而提高字符分割的精度。
需要说明的是,除了采用列和投影的方式确定第二分割位置,还可以采用二值图像连通域标记算法确定第二分割位置,本发明实施例并不限制第二分割位置的确定方式。
S330、根据所述第二分割位置,在所述待分割字符串图像中确定出至少一个粘连子串。
在本发明实施例中,由于第二分割位置可以将单个字符和粘连子串精确分割,所以第二分割位置确定后,各粘连子串的左右边界也相应确定。
S340、使用如实施例一或实施例二任一项所述的方法,确定出所述粘连子串中包括的各字符对应的目标分割位置。
在本发明实施例中,在第二分割位置确定后,待分割字符串图像中的所有粘连子串即可确定。采用实施例一或实施例二所提供的针对粘连子串的字符分割位置的确定方法,可以确定各粘连子串中包括的各字符对应的目标分割位置。
S350、根据所述目标分割位置以及所述第一分割位置对所述待分割字符串图像进行字符分割。
在本发明实施例中,确定的目标分割位置以及更新后的第一分割位置即包括了针对待分割字符串图中每一单个字符的分割位置,采用目标分割位置以及更新后的第一分割位置对待分割字符串图像进行字符分割,即可完成对待分割字符串图中每一单个字符的分割。
本发明实施例通过在目标图像中获取待分割字符串图像,确定待分割字符串图像中的各单个字符对应的第一分割位置,在待分割字符串图像中确定出至少一个粘连子串,及各粘连子串包括的各字符对应的目标分割位置;根据目标分割位置以及第一分割位置对待分割字符串图像进行字符分割,解决现有分割法对粘连字符的分割效果不佳及存在漏分、错分的问题,从而提高粘连字符的分割准确率,提升粘连字符的分割效果。
在本发明的一个可选实施例中,在目标图像中获取待分割字符串图像之后,还包括:对所述待分割字符串图像中包括的字符进行膨胀处理;获取膨胀处理后的所述待分割字符串图像的倾斜边界;根据所述倾斜边界计算倾斜角度,并根据所述倾斜角度对所述待分割字符串图像进行校正处理。
在本发明实施例中,在目标图像中获取待分割字符串图像后,可能存在待分割字符串图像中的字符串存在倾斜角度的情况,这就需要对待分割字符串图像中的字符串进行倾斜校正处理。可选的,具体倾斜校正处理的步骤可以包括:首先对待分割字符串图像中包括的字符进行膨胀处理,从而将断续的字符连成一条直线,便于直线检测。然后获取膨胀处理后的待分割字符串图像的倾斜边界(即边缘检测),最后根据倾斜边界计算倾斜角度,将倾斜角度作为图像的旋转角度,用旋转函数旋转图像,实现校正处理。
需要说明的是,本发明实施例只是示例性的给出了一种图像倾斜校正处理的方法,现有技术中图像倾斜校正处理存在多种相应的算法,均可以完成对待分割字符串图像的倾斜校正处理,所以本发明实施例并不对倾斜校正处理的方法进行限制。
实施例四
图4是本发明实施例四提供的一种字符分割位置的确定装置的示意图,可执行本发明任意实施例所提供的字符分割位置的确定方法,具备执行方法相应的功能模块和有益效果,本实施例可适用于确定粘连字符分割位置的情况。
所述装置包括:
目标分割位置确定模块410,用于根据待分割字符串图像中包括的至少一个粘连子串、所述粘连子串的宽度以及单个字符的平均宽度,确定与所述粘连子串中包括的各字符对应的目标分割位置;
备选分割位置确定模块420,用于根据字符间粘连区域的属性信息,确定与所述粘连子串对应的至少一个备选分割位置;
目标分割位置更新模块430,用于根据所述粘连子串的边界位置、与所述粘连子串对应的至少一个备选分割位置,以及预设更新条件,对所述目标分割位置进行更新。
本发明实施例通过对待分割字符串图像中包括的至少一个粘连子串确定的各字符对应的目标分割位置,根据粘连子串的边界位置、与粘连子串对应的至少一个备选分割位置,以及预设更新条件,对目标分割位置进行更新,以获取最终的分割位置,解决现有分割法对粘连字符的分割效果不佳及存在漏分、错分的问题,从而提高粘连字符的分割准确率,提升粘连字符的分割效果。
可选的,备选分割位置确定模块420,还用于获取所述粘连子串的粘连区域中各列和投影的第一最小值位置;获取所述粘连子串的粘连区域中列高度的第二最小值位置;将所述第一最小值位置以及所述第二最小值位置作为所述粘连子串的备选分割位置。
可选的,目标分割位置更新模块430,还用于获取一个所述目标分割位置作为当前处理位置;在所述备选分割位置中,获取与所述当前处理位置匹配的一个所述目标备选分割位置;当所述目标备选分割位置满足第一预设更新条件和第二预设更新条件时,将所述目标备选分割位置加入与所述当前处理位置对应的备选位置集中,并返回执行在所述备选分割位置中,获取与所述当前处理位置匹配的一个所述目标备选分割位置的操作,直至获取与所述当前处理位置匹配的全部目标备选分割位置;返回执行获取一个所述目标分割位置作为当前处理位置的操作,直到完成对全部目标分割位置的处理;根据处理结束后与各所述目标分割位置分别对应的备选位置集,对各所述目标分割位置进行更新;其中,所述第一预设更新条件包括:上一个确定的所述目标分割位置对应的区域宽度与当前目标备选分割位置对应的区域宽度的差在第一预设范围内;所述第二预设更新条件包括:所述粘连子串的宽度与所述当前分割位置对应的区域宽度的差在第二预设范围内。
进一步的,目标分割位置更新模块430,还用于如果所述备选位置集包括一个所述目标备选分割位置,则根据所述目标备选分割位置更新对应的所述目标分割位置;如果所述备选位置集包括至少两个所述目标备选分割位置,则根据至少两个所述目标备选分割位置对所述粘连子串进行分割,对分割后的所述粘连子串进行字符识别,并根据识别结果计算至少两个所述目标备选分割位置对应的置信度分数;根据所述置信度分数最高的所述目标备选分割位置更新所述目标分割位置。
进一步的,目标分割位置更新模块430,还用于如果所述备选位置集为空,则不对所述目标分割位置进行更新。
上述字符分割位置的确定装置可执行本发明任意实施例所提供的字符分割位置的确定方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的字符分割位置的确定方法。
实施例五
图5是本发明实施例五提供的一种字符分割装置的示意图,可执行本发明任意实施例所提供的字符分割方法,具备执行方法相应的功能模块和有益效果,本实施例可适用于分割包含粘连字符图像的情况。
所述装置包括:
第一分割位置确定模块510,用于在目标图像中获取待分割字符串图像,并根据所述待分割字符串图像中包括的字符总数量以及所述待分割字符串图像的两个边界之间的宽度,确定与所述待分割字符串图像中的各单个字符对应的第一分割位置;
第一分割位置更新模块520,用于根据所述待分割字符串图像中各列和投影,确定出至少一个第二分割位置,并使用所述第二分割位置更新所述第一分割位置;
粘连子串确定模块530,用于根据所述第二分割位置,在所述待分割字符串图像中确定出至少一个粘连子串;
子串分割位置确定模块540,用于使用如实施例一或实施例二任一项所述的方法,确定出所述粘连子串中包括的各字符对应的目标分割位置;
字符分割模块550,用于根据所述目标分割位置以及所述第一分割位置对所述待分割字符串图像进行字符分割。
本发明实施例通过在目标图像中获取待分割字符串图像,确定待分割字符串图像中的各单个字符对应的第一分割位置,在待分割字符串图像中确定出至少一个粘连子串,及各粘连子串包括的各字符对应的目标分割位置;根据目标分割位置以及第一分割位置对待分割字符串图像进行字符分割,解决现有分割法对粘连字符的分割效果不佳及存在漏分、错分的问题,从而提高粘连字符的分割准确率,提升粘连字符的分割效果。
可选的,所述装置还包括,校正处理模块560,用于对所述待分割字符串图像中包括的字符进行膨胀处理;获取膨胀处理后的所述待分割字符串图像的倾斜边界;根据所述倾斜边界计算倾斜角度,并根据所述倾斜角度对所述待分割字符串图像进行校正处理。
上述字符分割装置可执行本发明任意实施例所提供的字符分割方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的字符分割方法。
实施例六
图6为本发明实施例六提供的一种计算机设备的结构示意图。图6示出了适于用来实现本发明实施方式的计算机设备612的框图。图6显示的计算机设备612仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机设备612以通用计算设备的形式表现。计算机设备612的组件可以包括但不限于:一个或者多个处理器616,存储装置628,连接不同系统组件(包括存储装置628和处理器616)的总线618。
总线618表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,ISA)总线,微通道体系结构(Micro Channel Architecture,MCA)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
计算机设备612典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备612访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置628可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)630和/或高速缓存存储器632。计算机设备612可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统634可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如只读光盘(Compact Disc-Read Only Memory,CD-ROM)、数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线618相连。存储装置628可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块626的程序636,可以存储在例如存储装置628中,这样的程序模块626包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块626通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备612也可以与一个或多个外部设备614(例如键盘、指向设备、摄像头、显示器624等)通信,还可与一个或者多个使得用户能与该计算机设备612交互的设备通信,和/或与使得该计算机设备612能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口622进行。并且,计算机设备612还可以通过网络适配器620与一个或者多个网络(例如局域网(Local AreaNetwork,LAN),广域网Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器620通过总线618与计算机设备612的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备612使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of IndependentDisks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器616通过运行存储在存储装置628中的程序,从而执行各种功能应用以及数据处理,例如实现本发明上述实施例所提供的字符分割位置的确定方法,又例如实现本发明上述实施例所提供的字符分割方法。
通过所述计算机设备在目标图像中获取待分割字符串图像,确定待分割字符串图像中的各单个字符对应的第一分割位置,在待分割字符串图像中确定出至少一个粘连子串,及各粘连子串包括的各字符对应的目标分割位置;根据目标分割位置以及第一分割位置对待分割字符串图像进行字符分割,解决现有分割法对粘连字符的分割效果不佳及存在漏分、错分的问题,从而提高粘连字符的分割准确率,提升粘连字符的分割效果。
实施例七
本发明实施例七还提供一种存储计算机程序的计算机存储介质,所述计算机程序在由计算机处理器执行时用于执行本发明上述实施例任一所述的字符分割位置的确定方法以及字符分割方法。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(Read Only Memory,ROM)、可擦式可编程只读存储器((Erasable Programmable ReadOnly Memory,EPROM)或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、射频(Radio Frequency,RF)等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (11)

1.一种字符分割位置的确定方法,其特征在于,包括:
根据待分割字符串图像中包括的至少一个粘连子串、所述粘连子串的宽度以及单个字符的平均宽度,确定与所述粘连子串中包括的各字符对应的目标分割位置;
根据字符间粘连区域的属性信息,确定与所述粘连子串对应的至少一个备选分割位置;
根据所述粘连子串的边界位置、与所述粘连子串对应的至少一个备选分割位置,以及预设更新条件,对所述目标分割位置进行更新。
2.根据权利要求1所述的方法,其特征在于,所述根据字符间粘连区域的属性信息,确定与所述粘连子串对应的至少一个备选分割位置,包括:
获取所述粘连子串的粘连区域中各列和投影的第一最小值位置;
获取所述粘连子串的粘连区域中列高度的第二最小值位置;
将所述第一最小值位置以及所述第二最小值位置作为所述粘连子串的备选分割位置。
3.根据权利要求1所述的方法,其特征在于,所述根据所述粘连子串的边界位置、与所述粘连子串对应的至少一个备选分割位置,以及预设更新条件,对所述目标分割位置进行更新,包括:
获取一个所述目标分割位置作为当前处理位置;
在所述备选分割位置中,获取与所述当前处理位置匹配的一个所述目标备选分割位置;
当所述目标备选分割位置满足第一预设更新条件和第二预设更新条件时,将所述目标备选分割位置加入与所述当前处理位置对应的备选位置集中,并返回执行在所述备选分割位置中,获取与所述当前处理位置匹配的一个所述目标备选分割位置的操作,直至获取与所述当前处理位置匹配的全部目标备选分割位置;
返回执行获取一个所述目标分割位置作为当前处理位置的操作,直到完成对全部目标分割位置的处理;
根据处理结束后与各所述目标分割位置分别对应的备选位置集,对各所述目标分割位置进行更新;
其中,所述第一预设更新条件包括:上一个确定的所述目标分割位置对应的区域宽度与当前目标备选分割位置对应的区域宽度的差在第一预设范围内;
所述第二预设更新条件包括:所述粘连子串的宽度与所述当前分割位置对应的区域宽度的差在第二预设范围内。
4.根据权利要求3所述的方法,其特征在于,所述根据处理结束后与各所述目标分割位置分别对应的备选位置集,对各所述目标分割位置进行更新,包括:
如果所述备选位置集包括一个所述目标备选分割位置,则根据所述目标备选分割位置更新对应的所述目标分割位置;
如果所述备选位置集包括至少两个所述目标备选分割位置,则根据至少两个所述目标备选分割位置对所述粘连子串进行分割,对分割后的所述粘连子串进行字符识别,并根据识别结果计算至少两个所述目标备选分割位置对应的置信度分数;
根据所述置信度分数最高的所述目标备选分割位置更新所述目标分割位置。
5.根据权利要求3所述的方法,其特征在于,所述根据处理结束后与各所述目标分割位置分别对应的备选位置集,对各所述目标分割位置进行更新,包括:
如果所述备选位置集为空,则不对所述目标分割位置进行更新。
6.一种字符分割方法,其特征在于,包括:
在目标图像中获取待分割字符串图像,并根据所述待分割字符串图像中包括的字符总数量以及所述待分割字符串图像的两个边界之间的宽度,确定与所述待分割字符串图像中的各单个字符对应的第一分割位置;
根据所述待分割字符串图像中各列和投影,确定出至少一个第二分割位置,并使用所述第二分割位置更新所述第一分割位置;
根据所述第二分割位置,在所述待分割字符串图像中确定出至少一个粘连子串;
使用如权利要求1-4任一项所述的方法,确定出所述粘连子串中包括的各字符对应的目标分割位置;
根据所述目标分割位置以及所述第一分割位置对所述待分割字符串图像进行字符分割。
7.根据权利要求5所述的方法,其特征在于,在目标图像中获取待分割字符串图像之后,还包括:
对所述待分割字符串图像中包括的字符进行膨胀处理;
获取膨胀处理后的所述待分割字符串图像的倾斜边界;
根据所述倾斜边界计算倾斜角度,并根据所述倾斜角度对所述待分割字符串图像进行校正处理。
8.一种字符分割位置的确定装置,其特征在于,包括:
目标分割位置确定模块,用于根据待分割字符串图像中包括的至少一个粘连子串、所述粘连子串的宽度以及单个字符的平均宽度,确定与所述粘连子串中包括的各字符对应的目标分割位置;
备选分割位置确定模块,用于根据字符间粘连区域的属性信息,确定与所述粘连子串对应的至少一个备选分割位置;
目标分割位置更新模块,用于根据所述粘连子串的边界位置、与所述粘连子串对应的至少一个备选分割位置,以及预设更新条件,对所述目标分割位置进行更新。
9.一种字符分割装置,其特征在于,包括:
第一分割位置确定模块,用于在目标图像中获取待分割字符串图像,并根据所述待分割字符串图像中包括的字符总数量以及所述待分割字符串图像的两个边界之间的宽度,确定与所述待分割字符串图像中的各单个字符对应的第一分割位置;
第一分割位置更新模块,用于根据所述待分割字符串图像中各列和投影,确定出至少一个第二分割位置,并使用所述第二分割位置更新所述第一分割位置;
粘连子串确定模块,用于根据所述第二分割位置,在所述待分割字符串图像中确定出至少一个粘连子串;
子串分割位置确定模块,用于使用如权利要求1-4任一项所述的方法,确定出所述粘连子串中包括的各字符对应的目标分割位置;
字符分割模块,用于根据所述目标分割位置以及所述第一分割位置对所述待分割字符串图像进行字符分割。
10.一种计算机设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的字符分割位置的确定方法。
11.一种计算机设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求6-7中任一所述的字符分割方法。
CN201810175856.0A 2018-03-02 2018-03-02 字符分割位置的确定、字符分割方法、装置及设备 Active CN108491845B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810175856.0A CN108491845B (zh) 2018-03-02 2018-03-02 字符分割位置的确定、字符分割方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810175856.0A CN108491845B (zh) 2018-03-02 2018-03-02 字符分割位置的确定、字符分割方法、装置及设备

Publications (2)

Publication Number Publication Date
CN108491845A true CN108491845A (zh) 2018-09-04
CN108491845B CN108491845B (zh) 2022-05-31

Family

ID=63341275

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810175856.0A Active CN108491845B (zh) 2018-03-02 2018-03-02 字符分割位置的确定、字符分割方法、装置及设备

Country Status (1)

Country Link
CN (1) CN108491845B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109948620A (zh) * 2019-03-19 2019-06-28 厦门商集网络科技有限责任公司 一种字符分割方法及终端
CN110059695A (zh) * 2019-04-23 2019-07-26 厦门商集网络科技有限责任公司 一种基于垂直投影的字符分割方法及终端
CN111079762A (zh) * 2019-11-26 2020-04-28 合肥联宝信息技术有限公司 一种粘连字符的切割方法及电子设备
CN112633289A (zh) * 2020-12-30 2021-04-09 凌云光技术股份有限公司 一种粘连字符分割方法和系统
CN113657370A (zh) * 2021-08-26 2021-11-16 北京有竹居网络技术有限公司 一种文字识别方法及其相关设备
CN114155373A (zh) * 2021-12-06 2022-03-08 深圳怡化电脑股份有限公司 字符切割方法、装置、电子设备及存储介质
CN114612892A (zh) * 2022-03-17 2022-06-10 佛山市南海区广工大数控装备协同创新研究院 一种pcb元器件表面3d字符分割方法

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101251892A (zh) * 2008-03-07 2008-08-27 北大方正集团有限公司 一种字符切分方法和装置
CN101398894A (zh) * 2008-06-17 2009-04-01 浙江师范大学 机动车车牌自动识别方法及其实现装置
CN101458768A (zh) * 2009-01-04 2009-06-17 上海大学 自由手写数字串分割方法
CN102156865A (zh) * 2010-12-14 2011-08-17 上海合合信息科技发展有限公司 手写文本行字符切分方法、识别方法
CN102169542A (zh) * 2010-02-25 2011-08-31 汉王科技股份有限公司 文字识别中粘连字符的切分方法和装置
CN102222226A (zh) * 2011-06-21 2011-10-19 杭州电子科技大学 一种基于先验分析的迭代式车牌字符分割方法
CN103455815A (zh) * 2013-08-27 2013-12-18 电子科技大学 一种复杂场景下的自适应车牌字符分割方法
CN104239879A (zh) * 2014-09-29 2014-12-24 小米科技有限责任公司 分割字符的方法及装置
CN104408455A (zh) * 2014-11-27 2015-03-11 上海理工大学 粘连字符分割方法
CN104992175A (zh) * 2015-07-10 2015-10-21 河海大学常州校区 一种基于树型关系的过粘连钢坯字符分割方法
CN105069456A (zh) * 2015-07-30 2015-11-18 北京邮电大学 一种车牌字符分割方法及装置
CN105528605A (zh) * 2014-09-28 2016-04-27 江苏省兴泽实业发展有限公司 一种基于投影与识别的双层车牌字符分割方法
CN106203417A (zh) * 2016-07-12 2016-12-07 北京科技大学 一种粘连字符可分割的人民币冠字号识别方法
CN106650729A (zh) * 2016-12-09 2017-05-10 浙江浩腾电子科技股份有限公司 一种基于投影的车牌字符切割方法
CN106650739A (zh) * 2016-12-09 2017-05-10 浙江浩腾电子科技股份有限公司 一种车牌字符切割方法
CN107437294A (zh) * 2017-08-01 2017-12-05 深圳怡化电脑股份有限公司 一种字符分割方法、装置、设备及存储介质

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101251892A (zh) * 2008-03-07 2008-08-27 北大方正集团有限公司 一种字符切分方法和装置
CN101398894A (zh) * 2008-06-17 2009-04-01 浙江师范大学 机动车车牌自动识别方法及其实现装置
CN101458768A (zh) * 2009-01-04 2009-06-17 上海大学 自由手写数字串分割方法
CN102169542A (zh) * 2010-02-25 2011-08-31 汉王科技股份有限公司 文字识别中粘连字符的切分方法和装置
CN102156865A (zh) * 2010-12-14 2011-08-17 上海合合信息科技发展有限公司 手写文本行字符切分方法、识别方法
CN102222226A (zh) * 2011-06-21 2011-10-19 杭州电子科技大学 一种基于先验分析的迭代式车牌字符分割方法
CN103455815A (zh) * 2013-08-27 2013-12-18 电子科技大学 一种复杂场景下的自适应车牌字符分割方法
CN105528605A (zh) * 2014-09-28 2016-04-27 江苏省兴泽实业发展有限公司 一种基于投影与识别的双层车牌字符分割方法
CN104239879A (zh) * 2014-09-29 2014-12-24 小米科技有限责任公司 分割字符的方法及装置
CN104408455A (zh) * 2014-11-27 2015-03-11 上海理工大学 粘连字符分割方法
CN104992175A (zh) * 2015-07-10 2015-10-21 河海大学常州校区 一种基于树型关系的过粘连钢坯字符分割方法
CN105069456A (zh) * 2015-07-30 2015-11-18 北京邮电大学 一种车牌字符分割方法及装置
CN106203417A (zh) * 2016-07-12 2016-12-07 北京科技大学 一种粘连字符可分割的人民币冠字号识别方法
CN106650729A (zh) * 2016-12-09 2017-05-10 浙江浩腾电子科技股份有限公司 一种基于投影的车牌字符切割方法
CN106650739A (zh) * 2016-12-09 2017-05-10 浙江浩腾电子科技股份有限公司 一种车牌字符切割方法
CN107437294A (zh) * 2017-08-01 2017-12-05 深圳怡化电脑股份有限公司 一种字符分割方法、装置、设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SHUANG QIAO等: "Research of Improving the Accuracy of License Plate Character Segmentation", 《2010 FIFTH INTERNATIONAL CONFERENCE ON FRONTIER OF COMPUTER SCIENCE AND TECHNOLOGY》 *
张真等: "一种应用于身份证字符精确切分的算法", 《计算机应用与软件》 *
洪涛等: "标牌粘连字符自适应定位分割重建与识别", 《中国图象图形学报》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109948620A (zh) * 2019-03-19 2019-06-28 厦门商集网络科技有限责任公司 一种字符分割方法及终端
CN110059695A (zh) * 2019-04-23 2019-07-26 厦门商集网络科技有限责任公司 一种基于垂直投影的字符分割方法及终端
CN110059695B (zh) * 2019-04-23 2021-08-27 厦门商集网络科技有限责任公司 一种基于垂直投影的字符分割方法及终端
CN111079762A (zh) * 2019-11-26 2020-04-28 合肥联宝信息技术有限公司 一种粘连字符的切割方法及电子设备
CN111079762B (zh) * 2019-11-26 2022-02-08 合肥联宝信息技术有限公司 一种粘连字符的切割方法及电子设备
CN112633289A (zh) * 2020-12-30 2021-04-09 凌云光技术股份有限公司 一种粘连字符分割方法和系统
CN112633289B (zh) * 2020-12-30 2024-04-26 凌云光技术股份有限公司 一种粘连字符分割方法和系统
CN113657370A (zh) * 2021-08-26 2021-11-16 北京有竹居网络技术有限公司 一种文字识别方法及其相关设备
CN113657370B (zh) * 2021-08-26 2024-04-23 北京有竹居网络技术有限公司 一种文字识别方法及其相关设备
CN114155373A (zh) * 2021-12-06 2022-03-08 深圳怡化电脑股份有限公司 字符切割方法、装置、电子设备及存储介质
CN114612892A (zh) * 2022-03-17 2022-06-10 佛山市南海区广工大数控装备协同创新研究院 一种pcb元器件表面3d字符分割方法
CN114612892B (zh) * 2022-03-17 2024-04-09 佛山市南海区广工大数控装备协同创新研究院 一种pcb元器件表面3d字符分割方法

Also Published As

Publication number Publication date
CN108491845B (zh) 2022-05-31

Similar Documents

Publication Publication Date Title
CN108491845A (zh) 字符分割位置的确定、字符分割方法、装置及设备
CN106843737B (zh) 文本输入方法、装置及终端设备
CN106874909A (zh) 一种图像字符的识别方法及其装置
US20180239957A1 (en) Heuristic finger detection method based on depth image
CN104937638A (zh) 用于跟踪和检测目标对象的系统和方法
US9286527B2 (en) Segmentation of an input by cut point classification
CN108734161B (zh) 冠字号区域的识别方法、装置、设备及存储介质
US8515175B2 (en) Storage medium, apparatus and method for recognizing characters in a document image using document recognition
CN107315989B (zh) 针对医学资料图片的文本识别方法和装置
CN105700727B (zh) 与透明层以下的应用层的交互方法及信息处理系统
WO2015031702A1 (en) Multiple hypothesis testing for word detection
CN110490190A (zh) 一种结构化图像文字识别方法及系统
US20140226904A1 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
US20220036112A1 (en) Word recognition method, apparatus and storage medium
CN105184294B (zh) 一种基于像素追踪的倾斜文字判断识别方法
CN113971728B (zh) 图像识别方法、模型的训练方法、装置、设备及介质
CN111444906A (zh) 基于人工智能的图像识别方法和相关装置
CN113887375A (zh) 一种文本识别方法、装置、设备及存储介质
US7623998B1 (en) System and method for identifying Bezier curves from a shape
US20150186718A1 (en) Segmentation of Overwritten Online Handwriting Input
CN111753812A (zh) 文本识别方法及设备
EP4130967A1 (en) Grouping strokes of digital ink
CN111783780B (zh) 图像处理方法、装置及计算机可读存储介质
CN110443251A (zh) 仪表图像识别方法及装置
CN104112135B (zh) 文本图像提取装置以及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant