CN111079762B - 一种粘连字符的切割方法及电子设备 - Google Patents

一种粘连字符的切割方法及电子设备 Download PDF

Info

Publication number
CN111079762B
CN111079762B CN201911171903.5A CN201911171903A CN111079762B CN 111079762 B CN111079762 B CN 111079762B CN 201911171903 A CN201911171903 A CN 201911171903A CN 111079762 B CN111079762 B CN 111079762B
Authority
CN
China
Prior art keywords
point
cutting
pixel
character
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911171903.5A
Other languages
English (en)
Other versions
CN111079762A (zh
Inventor
罗文君
汪二虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Lianbao Information Technology Co Ltd
Original Assignee
Hefei Lianbao Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Lianbao Information Technology Co Ltd filed Critical Hefei Lianbao Information Technology Co Ltd
Priority to CN201911171903.5A priority Critical patent/CN111079762B/zh
Publication of CN111079762A publication Critical patent/CN111079762A/zh
Application granted granted Critical
Publication of CN111079762B publication Critical patent/CN111079762B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/187Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)
  • Control Of Cutting Processes (AREA)

Abstract

本申请公开了一种粘连字符的切割方法及电子设备,方法包括:获取第一图像中的粘连字符,对所述粘连字符的像素点的点参数进行分析;据所述点参数确定所述粘连字符上的第一像素点集合;根据所述第一像素点集合确定所述粘连字符的第一紧邻区域,以在所述粘连字符的第一紧邻区域中选取切割起始点;将所述初始操作点作为当前操作点,根据所述当前操作点的相邻区域的像素点的像素值确定切割所述粘连字符的切割趋势。本申请实施例的粘连字符的切割方法,获得更准确的粘连字符的分割起始点,更加精确地对粘连字符进行切割,提高了粘连字符分割的准确率。

Description

一种粘连字符的切割方法及电子设备
技术领域
本申请涉及图像处理领域,尤其涉及一种粘连字符的切割方法及电子设备。
背景技术
目前,常用的粘连字符切割方法为连通域法、垂直投影法和滴水分割法。垂直投影法是指,在二值图上,统计图像垂直方向上字符像素个数,用像素个数极小值点的位置作为切割点。滴水算法是模拟水滴从高处低落的过程对字符进行分割,通过临近像素的值,判断下一个分割点的位置,分割路径将沿着字符轮廓,当水滴落在字符凹陷处时,将渗透到字符区域中,最终水滴低落的轨迹就是字符分割的路径。
现有的粘连字符切割方法在垂直方向字符区域像素个数小于垂直方向粘连区域像素个数时,会将垂直方向的字符区域误认为是分割点,不能获得最佳的滴水起始位置,导致分割错误率较高。而现有的通过滴水算法来切割粘连字符的方法,水滴的下一步的滴落位置通常由它下方的三个像素和它左右两个像素共五个像素的值决定。判断的像素数量少,感受视野小,遇到特殊情况时,易造成错分割。比如,当水滴遇到水平长笔画时,水滴一直向水平方向右侧滚动,不能正确分割字符。现有的粘连字符切割方法不能有效地对字符进行正确分割,切割准确度较低。
发明内容
为了解决上述技术问题,为了解决上述技术问题,本申请实施例提供了粘连字符的切割方法,应用于电子设备中,所述方法包括:
获取第一图像中的粘连字符,对所述粘连字符的像素点的点参数进行分析,其中所述点参数至少包括像素值和位置参数;
根据所述点参数确定所述粘连字符上的第一像素点集合,其中所述第一像素点集合具有相同的像素值;
根据所述第一像素点集合确定所述粘连字符的第一紧邻区域,以在所述粘连字符的第一紧邻区域中选取切割起始点,其中所述切割起始点表征为将所述粘连字符切割为独立字符的初始操作点;
将所述初始操作点作为当前操作点,根据所述当前操作点的相邻区域的像素点的像素值确定切割所述粘连字符的切割趋势,并基于所述切割趋势进行切割,以形成所述粘连字符对应的多个独立字符。
优选地,所述的根据所述第一像素点集合确定所述粘连字符的第一紧邻区域,以在所述粘连字符的第一紧邻区域中选取切割起始点,包括:
统计所述粘连字符的宽度值,以及所述粘连字符中每个目标单元的宽度值,得到第一目标单元的第一宽度值和第二目标单元的第二宽度值,其中,所述目标单元与所述独立字符相对应,所述第一宽度值大于所述第二宽度值;
判断待确定起始点的第一位置参数是否在第一预设条件的范围内,若是,选取所述待确定起始点为预切割起始点;
其中,所述第一预设条件包括,所述待确定起始点的第一位置参数大于所述第二宽度值,并且,所述粘连字符的宽度值与所述待确定起始点的第一位置参数的差值大于所述第二宽度值。
优选地,所述的根据所述第一像素点集合确定所述粘连字符的第一紧邻区域,以在所述粘连字符的第一紧邻区域中选取切割起始点,包括:
统计所述预切割起始点的垂直投影首尾跳变点距离和垂直投影首尾跳变点次数的阈值;
判断所述预切割起始点的垂直投影首尾跳变点距离和垂直投影首尾跳变点次数是否在第二预设条件的范围内,若是,将所述预切割起始点确定为切割起始点;
其中,所述第二预设条件包括,判断所述预切割起始点的垂直投影首尾跳变点距离是否小于所述垂直投影首尾跳变点距离的阈值,并且判断所述预切割起始点的垂直投影首尾跳变点次数是否小于所述垂直投影首尾跳变点次数的阈值。
优选地,所述的根据所述当前操作点的相邻区域的像素点的像素值确定切割所述粘连字符的切割趋势,包括:
根据所述第一图像中的第一像素值和第二像素值,基于所述当前操作点对所述粘连字符执行第一切割操作和/或第二切割操作;其中,
所述第一切割操作包括:
在第一区域中选取具有第二像素值的像素点作为所述当前操作点的下一个切割点,所述第一区域为所述当前操作点的紧邻区域;
所述第二切割操作包括:
在第二区域中选取具有第二像素值的像素点作为所述当前操作点的下一个切割点,所述第二区域为所述第一区域的紧邻区域。
优选地,所述的根据所述当前操作点的相邻区域的像素点的像素值确定切割所述粘连字符的切割趋势,还包括:
重复执行所述第一切割操作和/或所述第二切割操作,以将所述粘连字符切割为独立字符。
优选地,所述的获取第一图像中的粘连字符,包括:基于第一图像中的目标对象的形态,确定粘连字符。
优选地,所述的获取第一图像中的粘连字符,还包括:统计所述第一图像中每一个目标单元的宽度值,得到目标单元的宽度阈值,比较每一个目标单元的宽度与宽度阈值,当所述目标单元的宽度小于所述宽度阈值时,确定所述粘连字符。
本申请还提供一种电子设备,包括:
获取模块,其用于获取第一图像中的粘连字符,对所述粘连字符的像素点的点参数进行分析,其中所述点参数至少包括像素值和位置参数;
处理模块,其用于根据所述点参数确定所述粘连字符上的第一像素点集合,其中所述第一像素点集合具有相同的像素值;以及根据所述第一像素点集合确定所述粘连字符的第一紧邻区域,以在所述粘连字符的第一紧邻区域中选取切割起始点,其中所述切割起始点表征为将所述粘连字符切割为独立字符的初始操作点;切割模块,其用于将所述初始操作点作为当前操作点,根据所述当前操作点的相邻区域的像素点的像素值确定切割所述粘连字符的切割趋势,并基于所述切割趋势进行切割,以形成所述粘连字符对应的多个独立字符;
切割模块,其用于将所述初始操作点作为当前操作点,根据所述当前操作点的相邻区域的像素点的像素值确定切割所述粘连字符的切割趋势,并基于所述切割趋势进行切割,以形成所述粘连字符对应的多个独立字符。
优选地,所述处理模块进一步用于:
统计所述粘连字符的宽度值,以及所述粘连字符中每个目标单元的宽度值,得到第一目标单元的第一宽度值和第二目标单元的第二宽度值,其中,所述目标单元与所述独立字符相对应,所述第一宽度值大于所述第二宽度值;
判断待确定起始点的第一位置参数是否在第一预设条件的范围内,若是,选取所述待确定起始点为预切割起始点;
其中,所述第一预设条件包括,所述待确定起始点的第一位置参数大于所述第二宽度值,并且,所述粘连字符的宽度值与所述待确定起始点的第一位置参数的差值大于所述第二宽度值。
优选地,所述切割模块进一步用于:
统计所述预切割起始点的垂直投影首尾跳变点距离和垂直投影首尾跳变点次数的阈值;
判断所述预切割起始点的垂直投影首尾跳变点距离和垂直投影首尾跳变点次数是否在第二预设条件的范围内,若是,将所述预切割起始点确定为切割起始点;
其中,所述第二预设条件包括,判断所述预切割起始点的垂直投影首尾跳变点距离是否小于所述垂直投影首尾跳变点距离的阈值,并且判断所述预切割起始点的垂直投影首尾跳变点次数是否小于所述垂直投影首尾跳变点次数的阈值。
与现有技术相比,本申请实施例的有益效果在于:
通过本申请实施例的粘连字符的切割方法,利用改进的粘连字符的分割起始点的确定方法和粘连字符分割方法,获得更准确的粘连字符的分割起始点,更加精确地对粘连字符进行切割,相比于现有技术中利用滴水算法进行粘连字符切割的方法,有效地避免了粘连字符的错分割。利用更多的像素点参与确定切割粘连字符的切割趋势,提高了粘连字符分割的准确率。本申请利用水平方向像素循环填充,在切割粘连字符遇到水平长笔画时,可以获得更大的感受野,从而提高切割粘连字符的准确率。
附图说明
图1本申请的实施例中粘连字符的切割方法示意图;
图2为本申请的实施例中粘连字符的切割方法另一示意图;
图3为本申请的实施例中电子设备的示意图;
图4为本发明实施例中粘连字符的第一区域中切割点的示意图;
图5为本发明实施例中粘连字符的第二区域中切割点的示意图;
图6为本申请实施例中粘连字符分割路径的示意图。
具体实施方式
下面,结合附图对本申请的具体实施例进行详细的描述,但不作为本申请的限定。
应理解的是,可以对此处公开的实施例做出各种修改。因此,下述说明书不应该视为限制,而仅是作为实施例的范例。本领域的技术人员将想到在本申请的范围和精神内的其他修改。
包含在说明书中并构成说明书的一部分的附图示出了本申请的实施例,并且与上面给出的对本申请的大致描述以及下面给出的对实施例的详细描述一起用于解释本申请的原理。
通过下面参照附图对给定为非限制性实例的实施例的优选形式的描述,本申请的这些和其它特性将会变得显而易见。
还应当理解,尽管已经参照一些具体实例对本申请进行了描述,但本领域技术人员能够确定地实现本申请的很多其它等效形式,它们具有如权利要求所述的特征并因此都位于借此所限定的保护范围内。
当结合附图时,鉴于以下详细说明,本申请的上述和其他方面、特征和优势将变得更为显而易见。
此后参照附图描述本申请的具体实施例;然而,应当理解,所公开的实施例仅仅是本申请的实例,其可采用多种方式实施。熟知和/或重复的功能和结构并未详细描述以避免不必要或多余的细节使得本申请模糊不清。因此,本文所公开的具体的结构性和功能性细节并非意在限定,而是仅仅作为权利要求的基础和代表性基础用于教导本领域技术人员以实质上任意合适的详细结构多样地使用本申请。
下面,结合附图详细的说明本申请实施例。
如图1所示,本申请实施例提供一种粘连字符的切割方法,该方法包括:
S1:获取第一图像中的粘连字符,对所述粘连字符的像素点的点参数进行分析,其中所述点参数至少包括像素值和位置参数;
具体地,在本实施例中,首先,对第一图像进行二值化处理,将第一图像转化为白底黑字的二值图,第一图像中的像素点包括第一像素点和第二像素点,例如,第一像素点表征为像素值为0的黑色像素,即,第一像素值,第二像素点表征为像素值为255的白色像素,即,第二像素值。之后,从二值图中的字符中获取粘连字符,粘连字符所包含的像素点的像素值都为第一像素值。粘连字符为应用在电子设备中的常用字符图像,例如,验证码。对粘连字符的每个像素点的点参数进行分析,点参数至少包括像素值和位置参数,粘连字符中的像素点的像素值为第一像素值,位置参数为粘连字符中的每个像素点在粘连字符中的具体位置。
S2:根据所述点参数确定所述粘连字符上的第一像素点集合,其中所述第一像素点集合具有相同的像素值;
具体地,在本实施例中,如图1所示,根据粘连字符上的像素点的点参数确定第一像素点集合,第一像素点集合具有相同的第一像素值,也就是像素值为0的黑色像素。例如,将粘连字符具体做图像垂直方向投影,获得投影的第一像素值像素个数数列,即,零值像素个数数列,然后将第一像素值像素个数数列按照从小到大的顺序排列。
S3:根据所述第一像素点集合确定所述粘连字符的第一紧邻区域,以在所述粘连字符的第一紧邻区域中选取切割起始点,其中所述切割起始点表征为将所述粘连字符切割为独立字符的初始操作点;
具体地,在本实施例中,如图1所示,根据第一像素点集合确定粘连字符的第一紧邻区域,第一紧邻区域位于粘连字符的上方,与第一像素点集合相邻。对于粘连字符的切割过程是从粘连字符的上方开始切割,从与第一像素点集合相邻的第一紧邻区域中选取切割起始点,切割起始点表征为将粘连字符切割为独立字符的初始操作点,选取初始操作点为切割粘连字符过程的初始操作。
S4:将所述初始操作点作为当前操作点,根据所述当前操作点的相邻区域的像素点的像素值确定切割所述粘连字符的切割趋势,并基于所述切割趋势进行切割,以形成所述粘连字符对应的多个独立字符。
具体地,在本实施例中,如图1所示,选取初始操作点后,将初始操作点作为当前操作点进行切割粘连字符的操作,当前操作点在进行下一步切割操作时,根据当前操作点的相邻区域的像素点的像素值确定切割粘连字符的切割趋势,当前操作点在相邻区域的像素点中选取第二像素值进行下一步的切割操作,并且以此作为切割粘连字符的切割趋势,当前操作点在进行每一步的切割操作时,根据上述切割趋势进行对粘连字符的切割,直至将粘连字符切割完成,形成粘连字符对应的多个独立字符。例如,将粘连的验证码切割为独立的字符,以便于对验证码进行后续操作。
通过本申请实施例的粘连字符的切割方法,利用改进的粘连字符的分割起始点的确定方法和粘连字符分割方法,获得更准确的粘连字符的分割起始点,更加精确地对粘连字符进行切割,并且,利用更多的像素点参与确定切割粘连字符的切割趋势,提高了粘连字符分割的准确率。
在本申请的一个实施例中,该粘连字符的切割方法还包括以下步骤:
统计所述粘连字符的宽度值,以及所述粘连字符中每个目标单元的宽度值,得到第一目标单元的第一宽度值和第二目标单元的第二宽度值,其中,所述目标单元与所述独立字符相对应,所述第一宽度值大于所述第二宽度值;
判断待确定起始点的第一位置参数是否在第一预设条件的范围内,若是,选取所述待确定起始点为预切割起始点;
其中,所述第一预设条件包括,所述待确定起始点的第一位置参数大于所述第二宽度值,并且,所述粘连字符的宽度值与所述待确定起始点的第一位置参数的差值大于所述第二宽度值。
具体地,在本实施例中,首先统计待切割的粘连字符的宽度值,并且统计该粘连字符中每个目标单元的宽度值,每个目标单元与切割完成后所生成的独立字符相对应。例如,粘连字符具有两个目标单元,第一目标单元和第二目标单元,统计第一目标单元和第二目标单元的宽度值,分别得到第一宽度值和第二宽度值,第一宽度值大于第二宽度值,在这里,第二宽度值为最小宽度值。判断待确定起始点的第一位置参数是否在第一预设条件的范围内,具体地,待确定起始点的第一位置参数可以是坐标值(x,y),也可以认为是待确定起始点的最小值点,该第一位置参数是根据零值像素个数数列选取的。当判断待确定起始点的第一位置参数在第一预设条件的范围内时,选取该待确定起始点为预切割起始点。其中,第一预设条件包括,待确定起始点的第一位置参数大于第二宽度值,例如,待确定起始点的坐标值x大于第二宽度值,也就是待确定起始点的坐标值x大于最小宽度值;并且,第一预设条件还包括,粘连字符的宽度值与待确定起始点的第一位置参数的差值大于第二宽度值,例如,粘连字符的宽度值与待确定起始点的坐标值x的差值大于第二宽度值,也就是,粘连字符的宽度值与待确定起始点的坐标值x的差值大于最小宽度值。当确定了待确定起始点的第一位置参数在第一预设条件的范围内时,选取该待确定起始点为预切割起始点,并进入下一个步骤;当确定待确定起始点的第一位置参数不在第一预设条件的范围内时,零值像素个数数列得指针指向下一个位置,重新根据零值像素个数数列选取待确定起始点的第一位置参数,也就是待确定起始点的坐标值(x,y),再进行判断,重新选取的待确定起始点的第一位置参数是否在第一预设条件的范围内,若是,再进行下一步骤。在一些优选的实施例中,粘连字符可以具有多个目标单元,统计每一个目标单元的宽度值,得到目标单元的最小宽度值。第一预设条件包括待确定起始点的第一位置参数大于最小宽度值,例如,待确定起始点的坐标值x大于最小宽度值,也就是待确定起始点的坐标值x大于最小宽度值;并且,第一预设条件还包括,粘连字符的宽度值与待确定起始点的第一位置参数的差值大于最小宽度值,例如,粘连字符的宽度值与待确定起始点的坐标值x的差值大于最小宽度值,也就是,粘连字符的宽度值与待确定起始点的坐标值x的差值大于最小宽度值。
在本申请的一个实施例中,该粘连字符的切割方法还包括以下步骤:
统计所述预切割起始点的垂直投影首尾跳变点距离和垂直投影首尾跳变点次数的阈值;
判断所述预切割起始点的垂直投影首尾跳变点距离和垂直投影首尾跳变点次数是否在第二预设条件的范围内,若是,将所述预切割起始点确定为切割起始点;
其中,所述第二预设条件包括,判断所述预切割起始点的垂直投影首尾跳变点距离是否小于所述垂直投影首尾跳变点距离的阈值,并且判断所述预切割起始点的垂直投影首尾跳变点次数是否小于所述垂直投影首尾跳变点次数的阈值。
具体地,在本实施例中,统计预切割起始点的垂直投影首尾跳变点距离和垂直投影首尾跳变点次数的阈值,判断预切割起始点的垂直投影首尾跳变点距离和垂直投影首尾跳变点次数是否在第二预设条件的范围内,若是,将预切割起始点确定为切割起始点。其中,第二预设条件包括,判断预切割起始点的垂直投影首尾跳变点距离是否小于垂直投影首尾跳变点距离的阈值,并且判断预切割起始点的垂直投影首尾跳变点次数是否小于垂直投影首尾跳变点次数的阈值,垂直投影首尾跳变点距离的阈值为垂直投影首尾跳变点距离的最大值,垂直投影首尾跳变点次数的阈值为垂直投影首尾跳变点次数的最大值。当确定预切割起始点的垂直投影首尾跳变点距离小于垂直投影首尾跳变点距离的最大值,并且判断预切割起始点的垂直投影首尾跳变点次数小于垂直投影首尾跳变点次数的最大值时,将预切割起始点确定为切割起始点。当确定预切割起始点的垂直投影首尾跳变点距离不小于垂直投影首尾跳变点距离的最大值,并且判断预切割起始点的垂直投影首尾跳变点次数不小于垂直投影首尾跳变点次数的最大值时,重新根据零值像素个数数列选取待确定起始点的第一位置参数,也就是待确定起始点的坐标值(x,y),再进行判断,重新选取的待确定起始点的第一位置参数是否在第一预设条件的范围内,直到选取合适的待确定起始点。合适的切割起始点具有较小的垂直投影首尾跳变点距离和小小的垂直投影首尾跳变点次数。
在本申请的一个实施例中,该粘连字符的切割方法还包括以下步骤:
根据所述第一图像中的第一像素值和第二像素值,基于所述当前操作点对所述粘连字符执行第一切割操作和/或第二切割操作;其中,
所述第一切割操作包括:
在第一区域中选取具有第二像素值的像素点作为所述当前操作点的下一个切割点,所述第一区域为所述当前操作点的紧邻区域;
所述第二切割操作包括:
在第二区域中选取具有第二像素值的像素点作为所述当前操作点的下一个切割点,所述第二区域为所述第一区域的紧邻区域。
具体地,在本实施例中,根据所述第一图像中的第一像素值和第二像素值,基于当前操作点对所述粘连字符执行第一切割操作和/或第二切割操作,以完成对粘连字符的切割。具体地,第一切割操作包括:在第一区域中选取具有第二像素值的像素点作为当前操作点的下一个切割点,第一区域为所述当前操作点的紧邻区域。第一切割操作具体包括,如图4所示,n0是当前操作点所在的位置,根据当前操作点周围的位于第一区域的5个位置的像素点的像素值判断下一个切割点的位置,切割点的落规则如图4所示。“w”表示第一图像中像素值为255的像素点,也就是第二像素值,“b”表示第一图像中像素值为0的像素点,也就是第一像素值,“*”表示第一图像中的任意值像素的像素点。在当前操作点所在位置周围像素的值如图4中的规则1、2、3、4、5所示时,按箭头所指得到下一个切割点的位置。在当前操作点所在位置周围像素点的像素值如图4中的规则6所示,即满足公式(1)。在公式(1)中,n5表示n5位置的像素灰度值。
Figure BDA0002288935020000101
在本实施例中,当前操作点根据第一切割操作对粘连字符进行切割,也就是在紧邻当前操作点的第一区域中选取具有第二像素值的像素点(像素值为255的像素点)作为下一个切割点,对粘连字符进行切割操作。
具体地,在本实施例中,第二切割操作包括:在第二区域中选取具有第二像素值的像素点作为当前操作点的下一个切割点,第二区域为第一区域的紧邻区域。具体地址,第二切割操作为循环填充,在切割粘连字符的过程中,由于当前操作点位于粘连字符的水平长笔画,也就是当前操作点紧邻的左右两个像素点的像素值都为第二像素值,并且当前像素点下方的三个像素点的像素值都为第一像素值,这时,当前操作点难以判断下一个切割位置,由于前操作点紧邻的左右两个像素点和当前像素点下方的三个像素点所在的区域为第一区域,将紧邻第一区域的第二局域的像素点填充到第一区域,参与判断当前操作点的下一个切割位置。具体地,如图4所示,即满足公式(2),在公式(2)中分别用左侧的像素点填充n1和n5,右侧的像素点填充n3和n4,即令
Figure BDA0002288935020000102
再进入循环,依据图5所示的规则,若再次满足规则6,即满足公式(3),则令
Figure BDA0002288935020000111
直到当前操作点位置到达第一图像垂直方向最下方,跳出循环,得到粘连字符分割路径。如图6所示,为粘连字符分割路径的示意图。
在切割粘连字符的过程中遇到水平长笔画时,通过循环填充,使更多的像素点参与下一个切割位置的判断,获得了更大的感受野,提高了粘连字符分割的准确率。
在本申请的一个实施例中,该粘连字符的切割方法还包括以下步骤:
重复执行所述第一切割操作和/或所述第二切割操作,以将所述粘连字符切割为独立字符。
具体地,在本实施例中,在切割粘连字符的过程中,当遇到水平长笔画的时候,执行第二切割操作,当没有水平长笔画的时候,执行第一切割操作,根据不同的情况重复执行第一切割操作和/或第二切割操作,知道将粘连字符切割为独立字符。
在本申请的一个实施例中,如图2所示,该粘连字符的切割方法还包括以下步骤:
S5:所述的获取第一图像中的粘连字符,包括:基于第一图像中的目标对象的形态,确定粘连字符。
具体地,在本实施例中,将获取的第一图像进行连通域分割,以及水平、垂直方向投影,去除干扰区域,当第一图像中的目标对象的形态表征粘连字符的形态,确定该粘连字符,对粘连字符进行切割操作。
在本申请的一个实施例中,如图2所示,该粘连字符的切割方法还包括以下步骤:
S6:统计所述第一图像中每一个目标单元的宽度值,得到目标单元的宽度阈值,比较每一个目标单元的宽度与宽度阈值,当所述目标单元的宽度小于所述宽度阈值时,确定所述粘连字符。
具体地,在本实施例中,具体的确定粘连字符是否具有表征粘连字符形态的方法如下,统计第一图像中每一个目标单元的宽度值,得到目标单元的宽度阈值,比较每一个目标单元的宽度与宽度阈值,当目标单元的宽度小于所述宽度阈值时,确定粘连字符。然后利用改进的切割粘连字符的方法对粘连字符进行切割,如果不符合上述条件,则生成的字符不是粘连字符,这时,不需要对该字符进行切割。
本申请实施例还提供一种电子设备,如图3所示,包括:
获取模块,其用于获取第一图像中的粘连字符,对所述粘连字符的像素点的点参数进行分析,其中所述点参数至少包括像素值和位置参数;
处理模块,其用于根据所述点参数确定所述粘连字符上的第一像素点集合,其中所述第一像素点集合具有相同的像素值;以及根据所述第一像素点集合确定所述粘连字符的第一紧邻区域,以在所述粘连字符的第一紧邻区域中选取切割起始点,其中所述切割起始点表征为将所述粘连字符切割为独立字符的初始操作点;切割模块,其用于将所述初始操作点作为当前操作点,根据所述当前操作点的相邻区域的像素点的像素值确定切割所述粘连字符的切割趋势,并基于所述切割趋势进行切割,以形成所述粘连字符对应的多个独立字符;
切割模块,其用于将所述初始操作点作为当前操作点,根据所述当前操作点的相邻区域的像素点的像素值确定切割所述粘连字符的切割趋势,并基于所述切割趋势进行切割,以形成所述粘连字符对应的多个独立字符。
具体地,所述处理模块进一步用于:
统计所述粘连字符的宽度值,以及所述粘连字符中每个目标单元的宽度值,得到第一目标单元的第一宽度值和第二目标单元的第二宽度值,其中,所述目标单元与所述独立字符相对应,所述第一宽度值大于所述第二宽度值;
判断待确定起始点的第一位置参数是否在第一预设条件的范围内,若是,选取所述待确定起始点为预切割起始点;
其中,所述第一预设条件包括,所述待确定起始点的第一位置参数大于所述第二宽度值,并且,所述粘连字符的宽度值与所述待确定起始点的第一位置参数的差值大于所述第二宽度值。
具体地,所述切割模块进一步用于:
统计所述预切割起始点的垂直投影首尾跳变点距离和垂直投影首尾跳变点次数的阈值;
判断所述预切割起始点的垂直投影首尾跳变点距离和垂直投影首尾跳变点次数是否在第二预设条件的范围内,若是,将所述预切割起始点确定为切割起始点;
其中,所述第二预设条件包括,判断所述预切割起始点的垂直投影首尾跳变点距离是否小于所述垂直投影首尾跳变点距离的阈值,并且判断所述预切割起始点的垂直投影首尾跳变点次数是否小于所述垂直投影首尾跳变点次数的阈值。
具体地,切割模块还用于重复执行所述第一切割操作和/或所述第二切割操作,以将所述粘连字符切割为独立字符。
具体地,获取模块还用于基于第一图像中的目标对象的形态,确定粘连字符。
具体地,处理模块还用于统计所述第一图像中每一个目标单元的宽度值,得到目标单元的宽度阈值,比较每一个目标单元的宽度与宽度阈值,当所述目标单元的宽度小于所述宽度阈值时,确定所述粘连字符。
本申请技术方案带来的有益效果:
通过本申请实施例的粘连字符的切割方法,利用改进的粘连字符的分割起始点的确定方法和粘连字符分割方法,获得更准确的粘连字符的分割起始点,更加精确地对粘连字符进行切割,相比于现有技术中利用滴水算法进行粘连字符切割的方法,有效地避免了粘连字符的错分割。利用更多的像素点参与确定切割粘连字符的切割趋势,提高了粘连字符分割的准确率。本申请利用水平方向像素循环填充,在切割粘连字符遇到水平长笔画时,可以获得更大的感受野,从而提高切割粘连字符的准确率。在用户使用与粘连字符有关的程序时,如验证码,可有效并快速地将验证码中易出现的粘连字符切割,得到所需的验证码。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (8)

1.一种粘连字符的切割方法,其特征在于,包括:
获取第一图像中的粘连字符,对所述粘连字符的像素点的点参数进行分析,其中所述点参数至少包括像素值和位置参数;
根据所述点参数确定所述粘连字符上的第一像素点集合,其中所述第一像素点集合具有相同的像素值;
根据所述第一像素点集合确定所述粘连字符的第一紧邻区域,以在所述粘连字符的第一紧邻区域中选取切割起始点,其中所述切割起始点表征为将所述粘连字符切割为独立字符的初始操作点;
将所述初始操作点作为当前操作点,根据所述当前操作点的相邻区域的像素点的像素值确定切割所述粘连字符的切割趋势,并基于所述切割趋势进行切割,以形成所述粘连字符对应的多个独立字符;
所述的根据所述当前操作点的相邻区域的像素点的像素值确定切割所述粘连字符的切割趋势,包括:
根据所述第一图像中的第一像素值和第二像素值,基于所述当前操作点对所述粘连字符执行第一切割操作和第二切割操作;其中,
所述第一切割操作包括:
在第一区域中选取具有第二像素值的像素点作为所述当前操作点的下一个切割点,所述第一区域为所述当前操作点的紧邻区域;
所述第二切割操作包括:
在第二区域中选取具有第二像素值的像素点作为所述当前操作点的下一个切割点,所述第二区域为所述第一区域的紧邻区域;当所述当前操作点紧邻的左右两个像素点的像素值都为第二像素值、且当前像素点下方的三个像素点的像素值都为第一像素值时,将紧邻第一区域的第二区域的像素点填充到第一区域,参与判断当前操作点的下一个切割位置;
所述的根据所述当前操作点的相邻区域的像素点的像素值确定切割所述粘连字符的切割趋势,还包括:
重复执行所述第一切割操作和所述第二切割操作,以将所述粘连字符切割为独立字符。
2.根据权利要求1所述的方法,其特征在于,所述的根据所述第一像素点集合确定所述粘连字符的第一紧邻区域,以在所述粘连字符的第一紧邻区域中选取切割起始点,包括:
统计所述粘连字符的宽度值,以及所述粘连字符中每个目标单元的宽度值,得到第一目标单元的第一宽度值和第二目标单元的第二宽度值,其中,所述目标单元与所述独立字符相对应,所述第一宽度值大于所述第二宽度值;
判断待确定起始点的第一位置参数是否在第一预设条件的范围内,若是,选取所述待确定起始点为预切割起始点;
其中,所述第一预设条件包括,所述待确定起始点的第一位置参数大于所述第二宽度值,并且,所述粘连字符的宽度值与所述待确定起始点的第一位置参数的差值大于所述第二宽度值。
3.根据权利要求2所述的方法,其特征在于,所述的根据所述第一像素点集合确定所述粘连字符的第一紧邻区域,以在所述粘连字符的第一紧邻区域中选取切割起始点,包括:
统计所述预切割起始点的垂直投影首尾跳变点距离和垂直投影首尾跳变点次数的阈值;
判断所述预切割起始点的垂直投影首尾跳变点距离和垂直投影首尾跳变点次数是否在第二预设条件的范围内,若是,将所述预切割起始点确定为切割起始点;
其中,所述第二预设条件包括,判断所述预切割起始点的垂直投影首尾跳变点距离是否小于所述垂直投影首尾跳变点距离的阈值,并且判断所述预切割起始点的垂直投影首尾跳变点次数是否小于所述垂直投影首尾跳变点次数的阈值。
4.根据权利要求1所述的方法,其特征在于,所述的获取第一图像中的粘连字符,包括:基于第一图像中的目标对象的形态,确定粘连字符。
5.根据权利要求4所述的方法,其特征在于,所述的获取第一图像中的粘连字符,还包括:统计所述第一图像中每一个目标单元的宽度值,得到目标单元的宽度阈值,比较每一个目标单元的宽度与宽度阈值,当所述目标单元的宽度大于所述宽度阈值时,确定所述粘连字符。
6.一种电子设备,其特征在于,包括:
获取模块,其用于获取第一图像中的粘连字符,对所述粘连字符的像素点的点参数进行分析,其中所述点参数至少包括像素值和位置参数;
处理模块,其用于根据所述点参数确定所述粘连字符上的第一像素点集合,其中所述第一像素点集合具有相同的像素值;以及根据所述第一像素点集合确定所述粘连字符的第一紧邻区域,以在所述粘连字符的第一紧邻区域中选取切割起始点,其中所述切割起始点表征为将所述粘连字符切割为独立字符的初始操作点;
切割模块,其用于将所述初始操作点作为当前操作点,根据所述当前操作点的相邻区域的像素点的像素值确定切割所述粘连字符的切割趋势,并基于所述切割趋势进行切割,以形成所述粘连字符对应的多个独立字符;根据所述第一图像中的第一像素值和第二像素值,基于所述当前操作点对所述粘连字符执行第一切割操作和第二切割操作;其中,所述第一切割操作包括:在第一区域中选取具有第二像素值的像素点作为所述当前操作点的下一个切割点,所述第一区域为所述当前操作点的紧邻区域;所述第二切割操作包括:在第二区域中选取具有第二像素值的像素点作为所述当前操作点的下一个切割点,所述第二区域为所述第一区域的紧邻区域;当所述当前操作点紧邻的左右两个像素点的像素值都为第二像素值、且当前像素点下方的三个像素点的像素值都为第一像素值时,将紧邻第一区域的第二区域的像素点填充到第一区域,参与判断当前操作点的下一个切割位置;重复执行所述第一切割操作和所述第二切割操作,以将所述粘连字符切割为独立字符。
7.根据权利要求6所述的电子设备,其特征在于,所述处理模块进一步用于:
统计所述粘连字符的宽度值,以及所述粘连字符中每个目标单元的宽度值,得到第一目标单元的第一宽度值和第二目标单元的第二宽度值,其中,所述目标单元与所述独立字符相对应,所述第一宽度值大于所述第二宽度值;
判断待确定起始点的第一位置参数是否在第一预设条件的范围内,若是,选取所述待确定起始点为预切割起始点;
其中,所述第一预设条件包括,所述待确定起始点的第一位置参数大于所述第二宽度值,并且,所述粘连字符的宽度值与所述待确定起始点的第一位置参数的差值大于所述第二宽度值。
8.根据权利要求7所述的电子设备,其特征在于,所述切割模块进一步用于:
统计预切割起始点的垂直投影首尾跳变点距离和垂直投影首尾跳变点次数的阈值;
判断所述预切割起始点的垂直投影首尾跳变点距离和垂直投影首尾跳变点次数是否在第二预设条件的范围内,若是,将所述预切割起始点确定为切割起始点;
其中,所述第二预设条件包括,判断所述预切割起始点的垂直投影首尾跳变点距离是否小于所述垂直投影首尾跳变点距离的阈值,并且判断所述预切割起始点的垂直投影首尾跳变点次数是否小于所述垂直投影首尾跳变点次数的阈值。
CN201911171903.5A 2019-11-26 2019-11-26 一种粘连字符的切割方法及电子设备 Active CN111079762B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911171903.5A CN111079762B (zh) 2019-11-26 2019-11-26 一种粘连字符的切割方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911171903.5A CN111079762B (zh) 2019-11-26 2019-11-26 一种粘连字符的切割方法及电子设备

Publications (2)

Publication Number Publication Date
CN111079762A CN111079762A (zh) 2020-04-28
CN111079762B true CN111079762B (zh) 2022-02-08

Family

ID=70311681

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911171903.5A Active CN111079762B (zh) 2019-11-26 2019-11-26 一种粘连字符的切割方法及电子设备

Country Status (1)

Country Link
CN (1) CN111079762B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111611988A (zh) * 2020-05-22 2020-09-01 上海携程商务有限公司 图片验证码识别方法及装置、电子设备和计算机可读介质
CN112257715A (zh) * 2020-11-18 2021-01-22 西南交通大学 一种粘连字符识别方法及系统

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101408933A (zh) * 2008-05-21 2009-04-15 浙江师范大学 基于粗网格特征提取和bp神经网络的车牌字符识别方法
CN102129560A (zh) * 2010-01-18 2011-07-20 富士通株式会社 字符识别的方法和设备
CN102169542A (zh) * 2010-02-25 2011-08-31 汉王科技股份有限公司 文字识别中粘连字符的切分方法和装置
CN103310435A (zh) * 2012-03-21 2013-09-18 华中科技大学 将垂直投影和最优路径相结合对车牌字符进行分割的方法
CN104252620A (zh) * 2014-09-25 2014-12-31 同程网络科技股份有限公司 字符粘连的图形验证码识别方法
CN104408455A (zh) * 2014-11-27 2015-03-11 上海理工大学 粘连字符分割方法
CN105095890A (zh) * 2014-04-25 2015-11-25 广州市动景计算机科技有限公司 图像中字符分割方法及装置
CN106446896A (zh) * 2015-08-04 2017-02-22 阿里巴巴集团控股有限公司 一种字符分割方法、装置及电子设备
CN108171237A (zh) * 2017-12-08 2018-06-15 众安信息技术服务有限公司 一种文本行图像单字切分方法和装置
CN108491845A (zh) * 2018-03-02 2018-09-04 深圳怡化电脑股份有限公司 字符分割位置的确定、字符分割方法、装置及设备
CN108805128A (zh) * 2017-05-05 2018-11-13 北京京东金融科技控股有限公司 一种字符分割方法和装置
CN108960239A (zh) * 2018-07-10 2018-12-07 武汉科技大学 一种基于图像处理的激光蚀刻金属雷管编码字符分割方法
CN109325492A (zh) * 2018-08-17 2019-02-12 平安科技(深圳)有限公司 字符切割方法、装置、计算机设备及存储介质
CN109948621A (zh) * 2019-03-20 2019-06-28 南京工业大学 一种基于图片验证码的图像处理与字符分割方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9286534B2 (en) * 2012-10-17 2016-03-15 Cognex Corporation System and method for selecting and displaying segmentation parameters for optical character recognition

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101408933A (zh) * 2008-05-21 2009-04-15 浙江师范大学 基于粗网格特征提取和bp神经网络的车牌字符识别方法
CN102129560A (zh) * 2010-01-18 2011-07-20 富士通株式会社 字符识别的方法和设备
CN102169542A (zh) * 2010-02-25 2011-08-31 汉王科技股份有限公司 文字识别中粘连字符的切分方法和装置
CN103310435A (zh) * 2012-03-21 2013-09-18 华中科技大学 将垂直投影和最优路径相结合对车牌字符进行分割的方法
CN105095890A (zh) * 2014-04-25 2015-11-25 广州市动景计算机科技有限公司 图像中字符分割方法及装置
CN104252620A (zh) * 2014-09-25 2014-12-31 同程网络科技股份有限公司 字符粘连的图形验证码识别方法
CN104408455A (zh) * 2014-11-27 2015-03-11 上海理工大学 粘连字符分割方法
CN106446896A (zh) * 2015-08-04 2017-02-22 阿里巴巴集团控股有限公司 一种字符分割方法、装置及电子设备
CN108805128A (zh) * 2017-05-05 2018-11-13 北京京东金融科技控股有限公司 一种字符分割方法和装置
CN108171237A (zh) * 2017-12-08 2018-06-15 众安信息技术服务有限公司 一种文本行图像单字切分方法和装置
CN108491845A (zh) * 2018-03-02 2018-09-04 深圳怡化电脑股份有限公司 字符分割位置的确定、字符分割方法、装置及设备
CN108960239A (zh) * 2018-07-10 2018-12-07 武汉科技大学 一种基于图像处理的激光蚀刻金属雷管编码字符分割方法
CN109325492A (zh) * 2018-08-17 2019-02-12 平安科技(深圳)有限公司 字符切割方法、装置、计算机设备及存储介质
CN109948621A (zh) * 2019-03-20 2019-06-28 南京工业大学 一种基于图片验证码的图像处理与字符分割方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
An Improved Drop-fall Algorithm Based on Background Analysis for Handwritten Digits Segmentation;Ma Rui et al.;《Global Congress on Intelligent Systems》;20090821;第374-378页 *
一种用于手写数字分割的滴水算法的改进;马瑞 等;《小型微型计算机系统》;20071231;第28卷(第11期);第2110-2112页 *
基于滴水算法的验证码中粘连字符分割方法;李兴国 等;《计算机工程与应用》;20141231;第50卷(第1期);第163-166页 *
粘连字符验证码的识别研究;朱莹玲;《中国优秀硕士学位论文全文数据库 信息科技辑》;20170715;第2017年卷(第7期);第I138-31页 *

Also Published As

Publication number Publication date
CN111079762A (zh) 2020-04-28

Similar Documents

Publication Publication Date Title
CN106529550B (zh) 基于连通域分析的多维特征量提取方法及装置
EP2132682B1 (en) Method and apparatus for detecting objects of interest in soccer video by color segmentation and shape anaylsis
CN109447969B (zh) 肝占位性病变识别方法、装置和实现装置
CN111079762B (zh) 一种粘连字符的切割方法及电子设备
CN108182383B (zh) 一种车窗检测的方法及设备
CN109800619B (zh) 成熟期柑橘果实图像识别方法
CN104239909B (zh) 一种图像的识别方法和装置
CN102184544B (zh) 校畸和识别围棋棋谱图像的方法
CN108009522B (zh) 一种道路检测方法、装置及终端
CN109671068B (zh) 一种基于深度学习的腹部肌肉标注方法及装置
CN110619333A (zh) 一种文本行分割方法、文本行分割装置及电子设备
CN109145906B (zh) 目标对象的图像确定方法、装置、设备及存储介质
CN109308456B (zh) 目标对象的信息确定方法、装置、设备及存储介质
CN110880175A (zh) 一种焊点缺陷检测方法、系统以及设备
CN106326887A (zh) 一种光学字符识别结果的校验方法及装置
CN111768450A (zh) 基于散斑图的结构光相机行偏差的自动检测方法和装置
CN105894540A (zh) 一种基于移动终端的上下往复移动计数方法及系统
CN110705531A (zh) 缺失字符检测、缺失字符检测模型的建立方法及装置
CN109785380B (zh) 一种内切圆确定方法及装置
CN113762229B (zh) 一种建筑场地内建筑器材的智能识别方法及系统
CN107239743A (zh) 一种基于投影法的刻度线读数自动检测方法
CN109727254B (zh) 人体扫描图像处理方法、设备及计算机可读存储介质
CN110874835A (zh) 作物叶部病害抗性鉴定方法、系统、电子设备及存储介质
CN115423825A (zh) 跳远距离的获取方法、装置、设备及计算机可读存储介质
CN103886554B (zh) 自动识别系统中的代码定位方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant