CN106991422A - 字符切割方法、装置及计算机可读存储介质和电子设备 - Google Patents

字符切割方法、装置及计算机可读存储介质和电子设备 Download PDF

Info

Publication number
CN106991422A
CN106991422A CN201710301338.4A CN201710301338A CN106991422A CN 106991422 A CN106991422 A CN 106991422A CN 201710301338 A CN201710301338 A CN 201710301338A CN 106991422 A CN106991422 A CN 106991422A
Authority
CN
China
Prior art keywords
character
marquee
picture
target
target character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710301338.4A
Other languages
English (en)
Other versions
CN106991422B (zh
Inventor
李春华
刘洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JD Digital Technology Holdings Co Ltd
Jingdong Technology Holding Co Ltd
Original Assignee
Beijing Jingdong Financial Technology Holding Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Financial Technology Holding Co Ltd filed Critical Beijing Jingdong Financial Technology Holding Co Ltd
Priority to CN201710301338.4A priority Critical patent/CN106991422B/zh
Publication of CN106991422A publication Critical patent/CN106991422A/zh
Application granted granted Critical
Publication of CN106991422B publication Critical patent/CN106991422B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)

Abstract

本公开是关于一种字符切割方法、装置及计算机可读存储介质和电子设备。该方法包括:获取一包含N个字符的图片,计算每个所述字符在所述图片中的位置信息;基于一具有预设参数的选取框确定所述图片中的N个字符中的M个目标字符;根据所述M个目标字符对应的所述位置信息,对所述图片进行切割得到所述M个目标字符分别对应的单个字符。本公开可以提高字符识别的效率和准确率。

Description

字符切割方法、装置及计算机可读存储介质和电子设备
技术领域
本公开涉及计算机技术领域,尤其涉及一种字符切割方法、字符切割装置、实现该字符切割方法的计算机可读存储介质和电子设备。
背景技术
随着计算机技术的不断发展,针对文本或图片(如证件照片)等的字符(如身份证号码)识别技术在日常生活中的应用越来越广泛。然而通常图片中既有待识别的目标字符,也会有一些噪点,即非目标字符。因此在进行字符识别时,需要排除如图片中的噪点。
相关技术中,为了有效去除噪点,提高识别的准确率。在字符识别之前,会对图片进行去噪切割处理以去除图片中的噪点,并将需要识别的目标字符按照单个字符进行切割分成多个图片,之后进行单个目标字符的识别。其中,目前的去噪切割算法一般是通过投影的方式来实现,这对于规范、噪点少的图片是基本可以满足的。但是当图片中的噪点较多且变得个性化、噪点形状与目标字符相似、字符倾斜等复杂情况下,目前的方法对于目标字符的识别效率和准确率就会非常低,难以满足更多复杂的业务场景。
因此,有必要提供一种新的技术方案改善上述方案中存在的一个或者多个问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种字符切割方法、字符切割装置、实现该字符切割方法的计算机可读存储介质和电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开实施例的第一方面,提供一种字符切割方法,所述方法包括:
获取一包含N个字符的图片,计算每个所述字符在所述图片中的位置信息;
基于一具有预设参数的选取框确定所述图片中的N个字符中的M个目标字符;其中N为大于等于2的整数,M为小于等于N的整数;
根据所述M个目标字符对应的所述位置信息,对所述图片进行切割得到所述M个目标字符分别对应的单个字符。
本公开的一种示例性实施例中,所述预设参数用于表征所述选取框的尺寸大小,且与所述目标字符的尺寸相关;
所述基于一具有预设参数的选取框确定所述图片中的N个字符中的M个目标字符包括:
将所述N个字符中同时满足所述选取框的尺寸大小和预设字符间距条件的字符确定为所述M个目标字符;其中,所述预设字符间距为相邻两个目标字符中心点之间的水平距离。
本公开的一种示例性实施例中,所述预设参数包括参考宽度和参考高度,所述参考宽度为所述目标字符的高度与宽度的比值,所述参考高度为基于所述M个目标字符的高度得到的众数;
所述将所述N个字符中同时满足所述选取框的尺寸大小和预设字符间距条件的字符确定为所述M个目标字符包括:
将所述选取框移动至所述图片中所述N个字符中的第一字符处,若所述第一字符位于所述选取框内,则确定该第一字符为第一目标字符;
将所述选取框从所述第一目标字符处依次移动所述预设字符间距到第二至第N字符处,若所述第二至第N字符均位于所述选取框内,则确定该第二至第N字符为第二至第M目标字符。
本公开的一种示例性实施例中,所述方法还包括:
若所述第一字符的至少部分位于所述选取框外,则将所述选取框移动所述预设字符间距到所述第二字符处;
判断所述第二字符是否位于所述选取框内,若是则确定该第二字符为所述第一目标字符;若否则将所述选取框从所述第二字符处移动到第三字符处重新判断确定第一目标字符。
本公开的一种示例性实施例中,所述方法还包括:
若所述第二字符的至少部分位于所述选取框外,则在所述所述第二字符处将所述选取框沿上下左右任意一个方向平移预设距离;
判断平移后所述第二字符是否位于所述选取框内,若是则确定该第二字符为所述第一目标字符。
本公开的一种示例性实施例中,所述方法还包括:
将所述选取框从平移后的位置移动所述预设字符间距到与所述第二字符相邻的所述第三字符处;
判断平移后所述第三字符是否位于所述选取框内,若是则确定该第三字符为所述第二目标字符。
本公开的一种示例性实施例中,所述方法还包括:
当确定的目标字符的数量P超过M个时,从第P目标字符至第一目标字符中依次选取M个作为最终的目标字符。
本公开的一种示例性实施例中,所述计算每个所述字符在所述图片中的位置信息包括:
对所述图片进行二值化处理后,扫描所述图片获取一个所述字符的第一黑色像素点并在一数组中记录该第一黑色像素点的坐标;
判断所述第一黑色像素点周围紧邻的多个第二像素点是否为黑色像素点,若是则在所述数组中记录该多个第二黑色像素点的坐标;
判断该多个第二黑色像素点各自周围紧邻的多个第三像素点是否为黑色像素点,若是则在所述数组中记录该多个第三黑色像素点的坐标,依此循环判断记录直至没有新的黑色像素点出现;
将归属于一个所述字符的所述数组作为所述位置信息。
本公开的一种示例性实施例中,所述在所述数组中记录该多个第三黑色像素点的坐标包括:
记录该多个第三黑色像素点时,对于已经记录了坐标的黑色像素点不再记录坐标。
根据本公开实施例的第二方面,提供一种字符切割装置,所述装置包括:
字符位置计算模块,用于获取一包含N个字符的图片,计算每个所述字符在所述图片中的位置信息;
目标字符确定模块,用于基于一具有预设参数的选取框确定所述图片中的N个字符中的M个目标字符;其中N为大于等于2的整数,M为小于等于N的整数;以及
目标字符切割模块,用于根据所述M个目标字符对应的所述位置信息,对所述图片进行切割得到所述M个目标字符分别对应的单个字符。
根据本公开实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任意一个实施例中所述字符切割方法的步骤。
根据本公开实施例的第四方面,提供一种电子设备,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一个实施例中所述字符切割方法的步骤。
本公开的实施例提供的技术方案可以包括以下有益效果:
本公开的一种实施例中,通过上述字符切割方法及装置,可以直接通过与目标字符匹配的选取框来直接确定目标字符,再根据目标字符的位置信息直接进行切割。这样,一方面,相比于相关技术中先识别噪点再去燥,然后切割目标字符的方法,可以提高目标字符的识别效率和准确率;另一方面,随着目标字符的识别效率和准确率的提高,可以满足更多复杂的业务场景中的目标字符识别要求。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性示出本公开示例性实施例中字符切割方法流程图;
图2示意性示出本公开示例性实施例中身份证图片示意图;
图3示意性示出本公开示例性实施例中字符位置计算方法流程图;
图4示意性示出本公开示例性实施例中身份证图片与坐标轴位置示意图;
图5示意性示出本公开示例性实施例中字符像素点扫描示意图;
图6示意性示出本公开示例性实施例中字符有效像素点寻找示意图;
图7示意性示出本公开示例性实施例中目标字符示意图;
图8示意性示出本公开示例性实施例中目标字符确定示意图一;
图9示意性示出本公开示例性实施例中目标字符确定示意图二;
图10示意性示出本公开示例性实施例中目标字符确定示意图三;
图11示意性示出本公开示例性实施例中目标字符确定示意图四;
图12示意性示出本公开示例性实施例中目标字符确定示意图五;
图13示意性示出本公开示例性实施例中目标字符确定示意图六;
图14示意性示出本公开示例性实施例中目标字符确定示意图六;
图15示意性示出本公开示例性实施例中一种字符切割装置示意图;
图16示意性示出本公开示例性实施例中另一字符切割装置示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
本示例实施方式中首先提供了一种字符切割方法,该方法可以应用于一计算机设备,例如可以是个人计算机、服务器等等。参考图1中所示,该方法可以包括以下步骤:
步骤S101:获取一包含N个字符的图片,计算每个所述字符在所述图片中的位置信息。
步骤S102:基于一具有预设参数的选取框确定所述图片中的N个字符中的M个目标字符;其中N为大于等于2的整数,M为小于等于N的整数。
步骤S103:根据所述M个目标字符对应的所述位置信息,对所述图片进行切割得到所述M个目标字符分别对应的单个字符。
通过上述字符切割方法,一方面,相比于相关技术中先识别噪点再去燥,然后切割目标字符的方法,可以提高目标字符的识别效率和准确率;另一方面,随着目标字符的识别效率和准确率的提高,可以满足更多复杂的业务场景中的目标字符识别要求。
下面,将参考图1至图14对本示例实施方式中的上述方法的各个步骤进行更详细的说明。
在步骤S101中,获取一包含N个字符的图片,计算每个所述字符在所述图片中的位置信息。
本示例实施方式中,所述字符可以是阿拉伯数字、中文文字或者英文字母等等。所述图片可以是包含待识别字符的图片,例如可以是钞票、发票、保险票据等各种票据的图片,或者具有身份信息(如身份证号)的证件图片,如身份证、护照等图片,也可以是获取的如包含文字的网页图片或者书本内容图片等等。
参考图2中所示,本示例实施方式中以身份证图片中的身份证号即目标字符识别为例进行说明。示例性的,图2仅示出了身份证图片的局部,该局部图片包括目标字符即身份证号码(632127198704191134)和噪点(如汉字“份号码”以及图2中形似1的竖线)。
参考图3中所示,步骤S101中所述计算每个所述字符在所述图片中的位置信息可以包括以下步骤:
步骤S301:对所述图片进行二值化处理后,扫描所述图片获取一个所述字符的第一黑色像素点并在一数组中记录该第一黑色像素点的坐标。
示例性的,身份证图片一般为彩色,二值化处理后变为如图2所示的黑白色,之后就可以对该图片进行扫描。如图4所示,可以将图片放在二维坐标系中,图片的左下角与坐标原点重合,X轴与Y轴以像素为单位。以图5所示的单个字符“1”的情形为例,y=0开始逐行扫描,直至y=y0,遇到第一黑色像素点,即图5中最左下角的一个黑色像素点。将该第一黑色像素点记为有效点,并将该第一黑色像素点的坐标如[10,2]记录在一个数组中,如[[10,2]]。
步骤S302:判断所述第一黑色像素点周围紧邻的多个第二像素点是否为黑色像素点,若是则在所述数组中记录该多个第二黑色像素点的坐标。
示例性的,如图6所示,继续以上述第一黑色像素点为起点,向该第一黑色像素点周围紧邻的多个第二像素点进行“感染”。例如向第一黑色像素点周围八个方向(上、下、左、右、左上、右上、左下、右下)的临近像素点进行“感染”,判断这个八个像素点是否为黑色。图6中该第一黑色像素点周围八个方向中的右方、上方和右上方像素点为黑色像素点,则将这3个像素点标记为有效点并将这3个像素点的坐标录入所述数组中。例如,该数组变为[[10,2],[10,3],[11,2],[11,3]]。
步骤S303:判断该多个第二黑色像素点各自周围紧邻的多个第三像素点是否为黑色像素点,若是则在所述数组中记录该多个第三黑色像素点的坐标,依此循环判断记录直至没有新的黑色像素点出现。
示例性的,继续以上述3个黑色像素点各自分别为起点,向四周进行“感染”,寻找黑色像素点即有效点并记录坐标。如此循环,直至没有新的有效坐标加入所述数组,判断结束。这样图片中一个字符的黑色像素点就以坐标形式记录在同一个数组中,例如[[10,2],[10,3],[11,2],[11,3]……]。相应的,最终多个字符组成的数组例如可以是[[10,2],[10,3],[11,2],[11,3]……,[15,2],[15,3],[16,2],[16,3]……]]。
在一示例性实施例中,步骤S203中所述在所述数组中记录该多个第三黑色像素点的坐标可以包括:记录该多个第三黑色像素点时,对于已经记录了坐标的黑色像素点不再记录坐标。
示例性的,以上述3个黑色像素点各自分别为起点向四周进行“感染”寻找黑色像素点时,该3个黑色像素点各自周围的部分黑色像素点已经在之前记录了坐标,因此会有部分重复的黑色像素点(即坐标值相同的像素点),所以对于已经记录了坐标的黑色像素点不再记录坐标。
步骤S304:将归属于一个所述字符的所述数组作为所述位置信息。该数组中记录每个字符所属的所有黑色像素点的坐标。基于此可以得到每个字符各自在所述图片中的位置信息。
在步骤S102中,基于一具有预设参数的选取框确定所述图片中的N个字符中的M个目标字符;其中N为大于等于2的整数,M为小于等于N的整数。
示例性的,所述预设参数用于表征所述选取框的尺寸大小,且与所述目标字符的尺寸相关。也即该选取框与所述目标字符相匹配。所述基于一具有预设参数的选取框确定所述图片中的N个字符中的M个目标字符可以包括:将所述N个字符中同时满足所述选取框的尺寸大小和预设字符间距条件的字符确定为所述M个目标字符;其中,所述预设字符间距为相邻两个目标字符中心点之间的水平距离。
具体来说,上述举例列出的身份证图片中,身份证号即目标字符的数量、高度、宽度以及相邻字符间距(即相邻两个目标字符中心点之间的水平距离)一般具有规律性。如身份证号为18位,每个数字的高度基本一致,相邻数字间距也是相对固定的,且数字高度与宽度的比值是相对固定的。因此可以基于此形成一个与目标字符尺寸匹配的选取框,该选取框可以恰好围住一个目标字符,类似于一个“围城”。通过该选取框可以后续判断字符是否为目标字符。
参考图7中所示,在一示例性实施例中,所述选取框可以是矩形选取框,所述预设参数可以包括参考宽度αh0和参考高度h0,所述参考宽度αh0为所述目标字符(即身份证号码数字)的高度与宽度的比值,所述参考高度h0为基于所述M个目标字符(如18位身份证号码)的高度得到的众数。其中,相邻两个数字字符中心点之间的水平距离d是基本固定的。所述目标字符即身份证号数字的高度可以通过上步骤S101中所述数组中记录的数字字符的坐标得到,例如可以找到每个字符对应的Y轴的坐标最大值和最小值,基于这两个值可以确定一个字符在Y轴的高度。这里可以先统计出所有18位数字字符的高度,然后取其众数作为参考高度h0。这样可以在一定程度上提高后续目标字符识别的准确性。
相应的,所述将所述N个字符中同时满足所述选取框的尺寸大小和预设字符间距条件的字符确定为所述M个目标字符可以包括以下步骤401~402:
步骤401:将所述选取框移动至所述图片中所述N个字符中的第一字符处,若所述第一字符位于所述选取框内,则确定该第一字符为第一目标字符。
步骤402:将所述选取框从所述第一目标字符处依次移动所述预设字符间距到第二至第N字符处,若所述第二至第N字符均位于所述选取框内,则确定该第二至第N字符为第二至第M目标字符。
在一种示例性实施例中,所述方法还可以包括以下步骤403~404:
步骤403:若所述第一字符的至少部分位于所述选取框外,则将所述选取框移动所述预设字符间距到所述第二字符处。
步骤404:判断所述第二字符是否位于所述选取框内,若是则确定该第二字符为所述第一目标字符;若否则将所述选取框从所述第二字符处移动到第三字符处重新判断确定第一目标字符。下面对上述步骤401~404进行示例性的详细说明。
参考图8中所示,示例性的,可以从图片最左端的字符开始进行判定,尝试将字符围在所述选取框中。如可以将“份”这一字符最左端的黑色像素点与所述选取框的左边相切,最下端的黑色像素点与所述选取框的下边相切,根据步骤S101中计算得到的记录该字符的坐标的数组,可以判定属于这个字符的所有黑色像素点是否都在该选取框范围内,如果该选取框成功框住了所有黑色像素点则暂且判断这个字符是目标字符。如图8中所示,由于“份”字切图切掉了一部分,宽度变小所以暂时符合要求,因此暂且认定它是第一目标字符。找到第一目标字符后,将所述选取框向后平移,理想情况下,第一目标字符应为身份证号的第一位,所以向后平移的距离应该是所述预设字符间距d。平移后,理想情况下所述选取框可以框住身份证号第二位,如图9所示。但在本实施例中的实际例子中,第一字符满足条件后向后移动,发现所述选取框不能围住下一个字符,如图10所示。这种情况下,则判定第二字符为噪点,同时第一字符也改判为噪点,从第三字符开始重新循环判断,继续向后寻找直到找到第一目标字符。例如通过上述方法很容易判断出字符“6”为第一目标字符,以在字符“6”位置处为起点,将所述选取框向后平移一个步长即所述预设字符间距d,可以找到“3”为第二目标字符,依此循环判断可以得到全部18位目标字符,如图11所示。
然而在实际情况中,所述图片可能会有稍许倾斜的情况,或者目标字符在图片中有稍许倾斜的情况,这样相邻两个字符并不是在一条水平线上。例如,字符“3”被识别为第二目标字符后,从字符“3”再向后寻找下一个即第三目标字符“2”时,由于倾斜导致字符在X轴的相对位置会有偏移,所以字符“2”就会有几个黑色像素点溢出位于所述选取框外,如图12所示。这种情况下很容易将本身是目标字符的字符判定为噪点,字符识别准确率下降。
为了提高字符识别准确率,针对目标字符倾斜情况,在本公开的一种示例性实施例中,所述方法还可以包括以下步骤501~502:
步骤501:若所述第二字符的至少部分位于所述选取框外,则在所述所述第二字符处将所述选取框沿上下左右任意一个方向平移预设距离。
示例性的,参考图13中所示,本示例实施例中,把字符倾斜这种情况考虑进去,设定一种容错机制:当判定得到一个目标字符后,所述选取框向后移动一个预设字符间距d到下一个字符处。如果该下一个字符不能被所述选取框围住,例如属于字符“2”的几个黑色像素点溢出位于所述选取框外时,暂不将该字符“2”判定为噪点。而是根据根据经验设定一个参数m,在该字符“2”处将所述选取框在m个像素范围内进行“抖动”,即向上下左右四个方向中任意一个方向平移n个像素点的距离(即所述预设距离),其中n≤m。
步骤502:判断平移后所述第二字符是否位于所述选取框内,若是则确定该第二字符为所述第一目标字符。
示例性的,上述“抖动”在任意一种情形下,只要满足字符“2”的所有黑色像素点均位于所述选取框中,就判定该字符“2”为目标字符。这样可以通过容错机制进一步提高字符识别的准确率。
在一种示例性实施例中,所述方法还可以包括以下步骤503~504:
步骤503:将所述选取框从平移后的位置移动所述预设字符间距到与所述第二字符相邻的所述第三字符处。
示例性的,当在如字符“2”处将所述选取框在m个像素范围内进行“抖动”后识别出了目标字符,则在下一步平移时就以“抖动”后的位置作为起点进行平移所述预设字符间距d到字符“1”,而不是“抖动”之前的位置。这样可以适应这一倾斜情况而进一步提高字符识别的准确率。
步骤504:判断平移后所述第三字符是否位于所述选取框内,若是则确定该第三字符为所述第二目标字符。例如平移后判断字符“1”是否位于所述选取框内,若是则确定该字符“1”为下一个目标字符。
本公开的一种示例性实施例中,所述方法还可以包括以下步骤:当确定的目标字符的数量P超过M个时,从第P目标字符至第一目标字符中依次选取M个作为最终的目标字符。
示例性的,按照上述方法步骤进行循环判断识别目标字符,直到所述选取框移动到图片最右端,可以将整个平移过程中所有符合要求的字符暂定为目标字符。在如图14所示情况下,图片中存在一些形状与目标字符类似且位置与身份证号大致在一条水平线上,间隔又刚好合适的字符,如图14中的椭圆所圈的竖线。这些字符在现有相关技术如投影方式中是无法有效去除噪点的,导致字符识别准确率降低。本示例实施例中的方法,这些字符本应是噪点却也可能被识别为目标字符,导致识别的目标字符如身份证号的个数超过18个。那么可以在如图14所示情况下,从所述图片最右侧开始向左计算18位作为最终的目标字符。
在步骤S103中,根据所述M个目标字符对应的所述位置信息,对所述图片进行切割得到所述M个目标字符分别对应的单个字符。
示例性的,可以通过上步骤S101中所述数组中记录的每个字符的坐标,找到多个目标字符的具体位置,据此对所述图片进行切割得到多个目标字符(如18位身份证号码)分别对应的单个字符。如切割得到单个字符的图片,用于后续的识别。
相比于相关技术中先识别出噪点,再将噪点去除,然后按照位置进行图片切割的方法,本示例实施方式中的上述方法与传统方法的思路是相反的,该方法可以直接识别判断哪些字符是目标字符,再根据目标字符的位置坐标进行切割,因此可以在一定程度上提高目标字符的识别效率和准确率。另外,该方法可以满足目标字符在一定范围内略有倾斜的情况下的字符识别,也可以对图14所示字符“8”这种被噪点完全切开两半的字符进行有效识别,因此字符识别准确率较高,适应性也更强。该方法更进一步可以满足更多复杂的业务场景中的目标字符识别要求。
需要说明的是,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。另外,也易于理解的是,这些步骤可以是例如在多个模块/进程/线程中同步或异步执行。
进一步的,本示例实施方式中,还提供了一种字符切割装置。参考图15中所示,该装置100可以包括字符位置计算模块101、目标字符确定模块102和目标字符切割模块103。其中:
所述字符位置计算模块101,用于获取一包含N个字符的图片,计算每个所述字符在所述图片中的位置信息。
所述目标字符确定模块102,用于基于一具有预设参数的选取框确定所述图片中的N个字符中的M个目标字符;其中N为大于等于2的整数,M为小于等于N的整数。
所述目标字符切割模块103,用于根据所述M个目标字符对应的所述位置信息,对所述图片进行切割得到所述M个目标字符分别对应的单个字符。
在本公开的一种示例性实施例中,所述预设参数用于表征所述选取框的尺寸大小,且与所述目标字符的尺寸相关;
所述目标字符确定模块102,用于将所述N个字符中同时满足所述选取框的尺寸大小和预设字符间距条件的字符确定为所述M个目标字符;其中,所述预设字符间距为相邻两个目标字符中心点之间的水平距离。
在本公开的一种示例性实施例中,所述预设参数包括参考宽度和参考高度,所述参考宽度为所述目标字符的高度与宽度的比值,所述参考高度为基于所述M个目标字符的高度得到的众数;所述目标字符确定模块102,用于将所述选取框移动至所述图片中所述N个字符中的第一字符处,若所述第一字符位于所述选取框内,则确定该第一字符为第一目标字符;之后将所述选取框从所述第一目标字符处依次移动所述预设字符间距到第二至第N字符处,若所述第二至第N字符均位于所述选取框内,则确定该第二至第N字符为第二至第M目标字符。
在本公开的一种示例性实施例中,所述目标字符确定模块102还用于:
若所述第一字符的至少部分位于所述选取框外,则将所述选取框移动所述预设字符间距到所述第二字符处;
判断所述第二字符是否位于所述选取框内,若是则确定该第二字符为所述第一目标字符;若否则将所述选取框从所述第二字符处移动到第三字符处重新判断确定第一目标字符。
在本公开的一种示例性实施例中,所述目标字符确定模块102还用于:
若所述第二字符的至少部分位于所述选取框外,则在所述所述第二字符处将所述选取框沿上下左右任意一个方向平移预设距离;
判断平移后所述第二字符是否位于所述选取框内,若是则确定该第二字符为所述第一目标字符。
在本公开的一种示例性实施例中,所述目标字符确定模块102还用于:
将所述选取框从平移后的位置移动所述预设字符间距到与所述第二字符相邻的所述第三字符处;
判断平移后所述第三字符是否位于所述选取框内,若是则确定该第三字符为所述第二目标字符。
在本公开的一种示例性实施例中,所述目标字符确定模块102还用于:
当确定的目标字符的数量P超过M个时,从第P目标字符至第一目标字符中依次选取M个作为最终的目标字符。
在本公开的一种示例性实施例中,所述字符位置计算模块101,用于:
对所述图片进行二值化处理后,扫描所述图片获取一个所述字符的第一黑色像素点并在一数组中记录该第一黑色像素点的坐标;
判断所述第一黑色像素点周围紧邻的多个第二像素点是否为黑色像素点,若是则在所述数组中记录该多个第二黑色像素点的坐标;
判断该多个第二黑色像素点各自周围紧邻的多个第三像素点是否为黑色像素点,若是则在所述数组中记录该多个第三黑色像素点的坐标,依此循环判断记录直至没有新的黑色像素点出现;
将归属于一个所述字符的所述数组作为所述位置信息。
在本公开的一种示例性实施例中,所述字符位置计算模块101,还用于:记录该多个第三黑色像素点时,对于已经记录了坐标的黑色像素点不再记录坐标。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。作为模块或单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现木公开方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本示例实施方式中,还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可以实现上述任意一个实施例中所述字符切割方法的步骤。所述字符切割方法的具体步骤可参考前述实施例中关于上述字符切割方法各步骤的详细描述,此处不再赘述。所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本示例实施方式中,还提供一种电子设备,该电子设备可以包括处理器,以及用于存储所述处理器的可执行指令的存储器。其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一个实施例中所述字符切割方法的步骤。该字符切割方法的步骤可参考前述方法实施例中的详细描述,此处不再赘述。所述电子设备可以是手机、平板电脑等移动终端,也可以是台式计算机、服务器等终端设备,本示例实施方式中对此不作限制。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施方式的上述方法。
图16示出根据本公开示例实施方式中一种字符切割装置400的示意图。例如,装置400可以被提供为一服务器。参照图16,装置400包括处理组件422,其进一步包括一个或多个处理器,以及由存储器432所代表的存储器资源,用于存储可由处理组件422的执行的指令,例如应用程序。存储器432中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件422被配置为执行指令,以执行上述字符切割方法。
装置400还可以包括一个电源组件426被配置为执行装置400的电源管理,一个有线或无线网络接口450被配置为将装置400连接到网络,和一个输入输出(I/O)接口458。装置400可以操作基于存储在存储器432的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。

Claims (12)

1.一种字符切割方法,其特征在于,所述方法包括:
获取一包含N个字符的图片,计算每个所述字符在所述图片中的位置信息;
基于一具有预设参数的选取框确定所述图片中的N个字符中的M个目标字符;其中N为大于等于2的整数,M为小于等于N的整数;
根据所述M个目标字符对应的所述位置信息,对所述图片进行切割得到所述M个目标字符分别对应的单个字符。
2.根据权利要求1所述方法,其特征在于,所述预设参数用于表征所述选取框的尺寸大小,且与所述目标字符的尺寸相关;
所述基于一具有预设参数的选取框确定所述图片中的N个字符中的M个目标字符包括:
将所述N个字符中同时满足所述选取框的尺寸大小和预设字符间距条件的字符确定为所述M个目标字符;其中,所述预设字符间距为相邻两个目标字符中心点之间的水平距离。
3.根据权利要求2所述方法,其特征在于,所述预设参数包括参考宽度和参考高度,所述参考宽度为所述目标字符的高度与宽度的比值,所述参考高度为基于所述M个目标字符的高度得到的众数;
所述将所述N个字符中同时满足所述选取框的尺寸大小和预设字符间距条件的字符确定为所述M个目标字符包括:
将所述选取框移动至所述图片中所述N个字符中的第一字符处,若所述第一字符位于所述选取框内,则确定该第一字符为第一目标字符;
将所述选取框从所述第一目标字符处依次移动所述预设字符间距到第二至第N字符处,若所述第二至第N字符均位于所述选取框内,则确定该第二至第N字符为第二至第M目标字符。
4.根据权利要求3所述方法,其特征在于,所述方法还包括:
若所述第一字符的至少部分位于所述选取框外,则将所述选取框移动所述预设字符间距到所述第二字符处;
判断所述第二字符是否位于所述选取框内,若是则确定该第二字符为所述第一目标字符;若否则将所述选取框从所述第二字符处移动到第三字符处重新判断确定第一目标字符。
5.根据权利要求3所述方法,其特征在于,所述方法还包括:
若所述第二字符的至少部分位于所述选取框外,则在所述所述第二字符处将所述选取框沿上下左右任意一个方向平移预设距离;
判断平移后所述第二字符是否位于所述选取框内,若是则确定该第二字符为所述第一目标字符。
6.根据权利要求5所述方法,其特征在于,所述方法还包括:
将所述选取框从平移后的位置移动所述预设字符间距到与所述第二字符相邻的所述第三字符处;
判断平移后所述第三字符是否位于所述选取框内,若是则确定该第三字符为所述第二目标字符。
7.根据权利要求5或6所述方法,其特征在于,所述方法还包括:
当确定的目标字符的数量P超过M个时,从第P目标字符至第一目标字符中依次选取M个作为最终的目标字符。
8.根据权利要求1~6任一项所述方法,其特征在于,所述计算每个所述字符在所述图片中的位置信息包括:
对所述图片进行二值化处理后,扫描所述图片获取一个所述字符的第一黑色像素点并在一数组中记录该第一黑色像素点的坐标;
判断所述第一黑色像素点周围紧邻的多个第二像素点是否为黑色像素点,若是则在所述数组中记录该多个第二黑色像素点的坐标;
判断该多个第二黑色像素点各自周围紧邻的多个第三像素点是否为黑色像素点,若是则在所述数组中记录该多个第三黑色像素点的坐标,依此循环判断记录直至没有新的黑色像素点出现;
将归属于一个所述字符的所述数组作为所述位置信息。
9.根据权利要求8所述方法,其特征在于,所述在所述数组中记录该多个第三黑色像素点的坐标包括:
记录该多个第三黑色像素点时,对于已经记录了坐标的黑色像素点不再记录坐标。
10.一种字符切割装置,其特征在于,所述装置包括:
字符位置计算模块,用于获取一包含N个字符的图片,计算每个所述字符在所述图片中的位置信息;
目标字符确定模块,用于基于一具有预设参数的选取框确定所述图片中的N个字符中的M个目标字符;其中N为大于等于2的整数,M为小于等于N的整数;以及
目标字符切割模块,用于根据所述M个目标字符对应的所述位置信息,对所述图片进行切割得到所述M个目标字符分别对应的单个字符。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1~9任一项所述字符切割方法的步骤。
12.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1~9任一项所述字符切割方法的步骤。
CN201710301338.4A 2017-05-02 2017-05-02 字符切割方法、装置及计算机可读存储介质和电子设备 Active CN106991422B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710301338.4A CN106991422B (zh) 2017-05-02 2017-05-02 字符切割方法、装置及计算机可读存储介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710301338.4A CN106991422B (zh) 2017-05-02 2017-05-02 字符切割方法、装置及计算机可读存储介质和电子设备

Publications (2)

Publication Number Publication Date
CN106991422A true CN106991422A (zh) 2017-07-28
CN106991422B CN106991422B (zh) 2020-03-27

Family

ID=59418388

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710301338.4A Active CN106991422B (zh) 2017-05-02 2017-05-02 字符切割方法、装置及计算机可读存储介质和电子设备

Country Status (1)

Country Link
CN (1) CN106991422B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107992872A (zh) * 2017-12-25 2018-05-04 广东小天才科技有限公司 一种对图片进行文本识别的方法及移动终端
CN109145879A (zh) * 2018-09-30 2019-01-04 金蝶软件(中国)有限公司 一种打印字体识别的方法、设备及存储介质
CN109961063A (zh) * 2017-12-26 2019-07-02 杭州海康机器人技术有限公司 文本检测方法及装置、计算机设备和存储介质
CN110197179A (zh) * 2019-03-14 2019-09-03 北京三快在线科技有限公司 识别卡号的方法和装置、存储介质及电子设备
CN112233206A (zh) * 2019-07-15 2021-01-15 浙江宇视科技有限公司 字符图像生成方法、装置、设备及存储介质
CN112257586A (zh) * 2020-10-22 2021-01-22 江苏禹空间科技有限公司 目标检测中的真值框选择方法、装置、存储介质及设备
CN113537225A (zh) * 2020-04-22 2021-10-22 华晨宝马汽车有限公司 用于字符识别的方法、电子设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258198A (zh) * 2013-04-26 2013-08-21 四川大学 一种表格文档图像中字符提取方法
JP2014085841A (ja) * 2012-10-24 2014-05-12 Glory Ltd 文字切出装置及び文字切出方法並びに文字認識装置
US20150063699A1 (en) * 2013-08-30 2015-03-05 Konica Minolta Laboratory U.S.A., Inc. Line segmentation method applicable to document images containing handwriting and printed text characters or skewed text lines
CN105426856A (zh) * 2015-11-25 2016-03-23 成都数联铭品科技有限公司 一种图像表格文字识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014085841A (ja) * 2012-10-24 2014-05-12 Glory Ltd 文字切出装置及び文字切出方法並びに文字認識装置
CN103258198A (zh) * 2013-04-26 2013-08-21 四川大学 一种表格文档图像中字符提取方法
US20150063699A1 (en) * 2013-08-30 2015-03-05 Konica Minolta Laboratory U.S.A., Inc. Line segmentation method applicable to document images containing handwriting and printed text characters or skewed text lines
CN105426856A (zh) * 2015-11-25 2016-03-23 成都数联铭品科技有限公司 一种图像表格文字识别方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107992872A (zh) * 2017-12-25 2018-05-04 广东小天才科技有限公司 一种对图片进行文本识别的方法及移动终端
CN107992872B (zh) * 2017-12-25 2020-04-28 广东小天才科技有限公司 一种对图片进行文本识别的方法及移动终端
CN109961063A (zh) * 2017-12-26 2019-07-02 杭州海康机器人技术有限公司 文本检测方法及装置、计算机设备和存储介质
CN109145879A (zh) * 2018-09-30 2019-01-04 金蝶软件(中国)有限公司 一种打印字体识别的方法、设备及存储介质
CN109145879B (zh) * 2018-09-30 2021-01-12 金蝶软件(中国)有限公司 一种打印字体识别的方法、设备及存储介质
CN110197179A (zh) * 2019-03-14 2019-09-03 北京三快在线科技有限公司 识别卡号的方法和装置、存储介质及电子设备
CN112233206A (zh) * 2019-07-15 2021-01-15 浙江宇视科技有限公司 字符图像生成方法、装置、设备及存储介质
CN112233206B (zh) * 2019-07-15 2024-03-22 浙江宇视科技有限公司 字符图像生成方法、装置、设备及存储介质
CN113537225A (zh) * 2020-04-22 2021-10-22 华晨宝马汽车有限公司 用于字符识别的方法、电子设备和存储介质
CN113537225B (zh) * 2020-04-22 2024-06-28 华晨宝马汽车有限公司 用于字符识别的方法、电子设备和存储介质
CN112257586A (zh) * 2020-10-22 2021-01-22 江苏禹空间科技有限公司 目标检测中的真值框选择方法、装置、存储介质及设备
CN112257586B (zh) * 2020-10-22 2024-01-23 无锡禹空间智能科技有限公司 目标检测中的真值框选择方法、装置、存储介质及设备

Also Published As

Publication number Publication date
CN106991422B (zh) 2020-03-27

Similar Documents

Publication Publication Date Title
CN106991422A (zh) 字符切割方法、装置及计算机可读存储介质和电子设备
US11886799B2 (en) Determining functional and descriptive elements of application images for intelligent screen automation
EP3618003B1 (en) Method and apparatus for generating synthetic picture
JP6628442B2 (ja) テキスト画像処理方法および装置
CN110390269A (zh) Pdf文档表格提取方法、装置、设备及计算机可读存储介质
CN105930159A (zh) 一种基于图像的界面代码生成的方法及系统
Wang et al. Fast and robust object detection using asymmetric totally corrective boosting
RU2370814C2 (ru) Система и способ для обнаружения списка в рукописных входных данных
CN111126394A (zh) 文字识别方法、阅读辅助设备、电路和介质
CN111898411A (zh) 文本图像标注系统、方法、计算机设备和存储介质
WO2021144683A1 (en) Document information extraction system using sequenced comparators
CN105528333B (zh) 一种文档优化显示的方法和装置
JP2015011555A (ja) 画像処理装置、画像処理方法、及びプログラム
CN110766068B (zh) 一种验证码识别方法及计算设备
KR20230012651A (ko) 이미지 기반 테이블 정보 생성 방법
US11055526B2 (en) Method, system and apparatus for processing a page of a document
US20150139547A1 (en) Feature calculation device and method and computer program product
JP2006133941A (ja) 画像処理装置、画像処理方法、画像処理プログラム及び携帯型端末
CN111783725A (zh) 人脸识别方法、装置及存储介质
JP5794154B2 (ja) 画像処理プログラム、画像処理方法、及び画像処理装置
CN112395834B (zh) 基于图片输入的脑图生成方法、装置、设备及存储介质
CN115359502A (zh) 一种图像处理方法、装置、设备以及存储介质
CN113657317A (zh) 一种货物位置识别方法、系统、电子设备及存储介质
US20190377941A1 (en) Character recognition apparatus and character recognition method
AU2014277851A1 (en) Detecting a gap between text columns from text line fragments

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Patentee after: Jingdong Technology Holding Co.,Ltd.

Address before: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Patentee before: Jingdong Digital Technology Holding Co.,Ltd.

Address after: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Patentee after: Jingdong Digital Technology Holding Co.,Ltd.

Address before: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Patentee before: JINGDONG DIGITAL TECHNOLOGY HOLDINGS Co.,Ltd.

CP01 Change in the name or title of a patent holder
CP03 Change of name, title or address

Address after: Room 221, 2 / F, block C, 18 Kechuang 11th Street, Daxing District, Beijing, 100176

Patentee after: JINGDONG DIGITAL TECHNOLOGY HOLDINGS Co.,Ltd.

Address before: 101111 Room 221, 2nd Floor, Block C, 18 Kechuang 11th Street, Beijing Economic and Technological Development Zone

Patentee before: BEIJING JINGDONG FINANCIAL TECHNOLOGY HOLDING Co.,Ltd.

CP03 Change of name, title or address