CN108460386B - 字符图像切割方法、装置、设备及存储介质 - Google Patents

字符图像切割方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN108460386B
CN108460386B CN201810226507.7A CN201810226507A CN108460386B CN 108460386 B CN108460386 B CN 108460386B CN 201810226507 A CN201810226507 A CN 201810226507A CN 108460386 B CN108460386 B CN 108460386B
Authority
CN
China
Prior art keywords
line
character
cutting position
matched
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810226507.7A
Other languages
English (en)
Other versions
CN108460386A (zh
Inventor
石鸥
傅博扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yihua Computer Co Ltd
Shenzhen Yihua Time Technology Co Ltd
Shenzhen Yihua Financial Intelligent Research Institute
Original Assignee
Shenzhen Yihua Computer Co Ltd
Shenzhen Yihua Time Technology Co Ltd
Shenzhen Yihua Financial Intelligent Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yihua Computer Co Ltd, Shenzhen Yihua Time Technology Co Ltd, Shenzhen Yihua Financial Intelligent Research Institute filed Critical Shenzhen Yihua Computer Co Ltd
Priority to CN201810226507.7A priority Critical patent/CN108460386B/zh
Publication of CN108460386A publication Critical patent/CN108460386A/zh
Application granted granted Critical
Publication of CN108460386B publication Critical patent/CN108460386B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)

Abstract

本发明实施例公开了一种字符图像切割方法、装置、设备及存储介质。该方法包括:获取与待切割字符图像匹配的二值化处理图像;根据起始遍历行及设定行宽获取行区域并根据行区域确定字符切割位置;根据先验信息和字符切割位置修正行区域的行起止范围,将根据修正行区域重新确定的字符切割位置作为备选切割位置;计算备选切割位置的得分和连续度;更新起始遍历行后,返回执行根据起始遍历行及设定行宽获取行区域的操作直至完成对二值化处理图像行遍历;如果确定与目标行区域匹配的备选切割位置的得分和连续度满足设定条件,则确定其为理想切割位置。通过上述方法,解决了待切割字符图像中存在大小不一的字符的问题,提高了字符图像切割的精确度。

Description

字符图像切割方法、装置、设备及存储介质
技术领域
本发明实施例涉及图像处理技术领域,尤其涉及一种字符图像切割方法、装置、设备及存储介质。
背景技术
字符图像切割是字符识别的前提,字符图像切割指的是对待切割字符图像进行预处理(例如去噪、亮度补偿、边缘检测和倾斜校正等)后确定每个字符的边界进而完成切割,以得到每个单独的字符图像后对其进行识别,字符切割的准确程度直接影响着字符的最终识别结果。
对于预定种类的待切割字符图像,一般可以使用预设的切割模板确定每个字符的边界进而完成图像切割,但是,由于待切割字符图像的拍摄角度或扫描角度等不同,会出现待切割字符图像中各字符大小不一的问题,使用统一的切割模板有可能会导致字符图像切割错误而影响字符识别结果,例如是将一个字符图像“0”误切割成两个字符图像“1”,进而会将一个字符“0”误识别为两个字符“1”。
发明内容
本发明实施例提供了一种字符图像切割方法、装置、设备及存储介质,以解决待切割字符图像中存在大小不一的字符的问题,进而提高字符图像切割的准确度。
第一方面,本发明实施例提供了一种字符图像切割方法,包括:
获取与待切割字符图像匹配的二值化处理图像;
根据起始遍历行以及设定行宽,在所述二值化处理图像中获取行区域,并根据所述行区域确定字符切割位置,所述起始遍历行具有预设初始值;
根据先验信息选取设定数量的字符的切割位置修正所述行区域的行起止范围,将根据修正行区域重新确定的字符切割位置作为与所述行区域匹配的备选切割位置;
计算与所述行区域匹配的备选切割位置的得分和连续度;
根据逐行遍历规则更新所述起始遍历行后,返回执行根据起始遍历行以及设定行宽,在所述二值化处理图像中获取行区域的操作,直至完成对所述二值化处理图像的行遍历;
如果确定与目标行区域匹配的备选切割位置的得分和连续度满足设定条件,则确定与所述目标行区域匹配的备选切割位置为理想切割位置。
第二方面,本发明实施例还提供了一种字符图像切割装置,包括:
二值化处理图像获取模块,用于获取与待切割字符图像匹配的二值化处理图像;
字符切割位置预确定模块,用于根据起始遍历行以及设定行宽,在所述二值化处理图像中获取行区域,并根据所述行区域确定字符切割位置,所述起始遍历行具有预设初始值;
备选切割位置确定模块,用于根据先验信息选取设定数量的字符的切割位置修正所述行区域的行起止范围,将根据修正行区域重新确定的字符切割位置作为与所述行区域匹配的备选切割位置;
得分和连续度计算模块,用于计算与所述行区域匹配的备选切割位置的得分和连续度;
循环处理模块,用于根据逐行遍历规则更新所述起始遍历行后,返回执行根据起始遍历行以及设定行宽,在所述二值化处理图像中获取行区域的操作,直至完成对所述二值化处理图像的行遍历;
理想切割位置确定模块,用于如果确定与目标行区域匹配的备选切割位置的得分和连续度满足设定条件,则确定与所述目标行区域匹配的备选切割位置为理想切割位置。
第三方面,本发明实施例还提供了一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例中任一所述的字符图像切割方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的字符图像切割方法。
本发明实施例提供了一种字符图像切割方法、装置、设备及存储介质,该方法通过选取设定行宽的行区域对与待切割字符图像匹配的二值化处理图像进行逐行遍历,根据每个行区域确定字符切割位置后,修正对应行区域的行起止范围,将根据修正行区域重新确定的字符切割位置作为与对应行区域匹配的备选切割位置,计算每个与行区域匹配的备选切割位置的得分和连续度,将得分和连续度满足设定条件的备选切割位置确定为理想切割位置。上述字符图像切割方法,通过对行区域的起止范围进行修正后确定各个备选切割位置,解决了待切割字符图像中存在大小不一的字符的问题;采用行遍历的方法确定与每个行区域匹配的备选切割位置,提高了对待切割字符图像中字符位置和噪声的容忍度;上述字符图像切割方法通过对每个备选切割位置打分以及计算每个备选切割位置的连续度的技术手段,进一步提高了字符图像切割的精确度。
附图说明
图1A是本发明实施例一中的一种字符图像切割方法的流程图;
图1B是本发明实施例一中的一种待切割字符图像的示意图;
图1C是本发明实施例一中的一种待切割字符图像的示意图;
图2为本发明实施例二中的一种字符图像切割方法的流程图;
图3是本发明实施例三中的一种字符图像切割装置的结构示意图;
图4是本发明实施例四中的一种设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1A是本发明实施例一提供的一种字符图像切割方法的流程图,可适用于待切割字符图像中存在大小不一的字符的情况,该方法可以由本发明实施例提供的字符图像切割装置来执行,该装置可采用软件和/或硬件的方式实现,并一般可集成在处理器中。如图1A所示,本实施例的方法具体包括:
S110、获取与待切割字符图像匹配的二值化处理图像。
其中,待切割字符图像可以是指例如图1B或图1C之类的待切割字符图像,本实施例提供的字符图像切割方法的具体应用场景可以是对银行支票中的票号图像切割等,旨在确定待切割字符图像中每一个字符图像的切割位置,即每一个字符图像的上下左右边界,进而可以后续对每一个字符图像进行字符识别。
二值化处理图像可以指的是仅对待切割字符图像进行二值化处理后的图像,也可以指的是对待切割字符图像进行二值化处理以及后续处理后的图像,其中后续处理是为了简化计算而进行的处理过程,例如可以是积分处理等,本实施例对此不做具体限定。
对待切割字符图像进行二值化处理可以使用现有的二值化方法,二值化阈值可以采用以下方法进行计算:像素点灰度值均值的一半、otsu算法、百分比算法或者上述方法的任意组合。具体的,为了便于后续的处理可以将经过二值化处理后的字符点赋值为1,背景点赋值为0。
作为本实施例一种可选的实施方式,可以将获取与待切割字符图像匹配的二值化处理图像,具体为:按照设定切割阈值对待切割字符图像进行二值化处理,得到二值化图像;计算二值化图像的积分图像作为二值化处理图像。
即,将利用设定的切割阈值,例如可以是利用otsu算法生成的切割阈值等,对待切割字符图像进行二值化处理,得到二值化图像,对该二值化图像进行积分计算处理后得到积分图像,将该积分图像作为二值化处理图像进行后续的操作,目的在于对后续处理中的行列和计算以及区域和计算进行加速。
S120、根据起始遍历行以及设定行宽,在二值化处理图像中获取行区域,并根据所述行区域确定字符切割位置,所述起始遍历行具有预设初始值。
其中,设定行宽指的是行区域的行数,典型的,为小于字符高度的行数,例如字符高度约占60像素行,可以选择行宽为50像素行的行区域对二值化处理图像进行行遍历。起始遍历行指的是行区域的第一像素行,其预设初始值可以选择为二值化处理图像的第一像素行,也可以根据具体需求选择为二值化处理图像的第x像素行。
例如,二值化处理图像包括150像素行,起始遍历行的预设初始值设为1,行区域的设定行宽为50像素行,那么根据起始遍历行以及设定行宽,在二值化处理图像中获取行区域,即为在二值化处理图像中获取包括1~50像素行的行区域。根据该行区域(1~50像素行)确定字符切割位置,具体为确定每一个字符的上下左右边界。
其中,根据行区域确定字符切割位置,具体为:
根据所述行区域确定所述行区域的列切割位置,并根据所述行区域的列切割位置以及先验信息确定出各个候选字符;确定出每个所述候选字符的左右边界,并根据确定出的所述左右边界对每个所述候选字符的上下边界进行定位;将确定出的与每个所述候选字符匹配的上下边界以及左右边界作为根据所述行区域确定的字符切割位置。
对于该行区域(1~50像素行),遍历列确定在该行区域中的列切割位置,具体步骤为:计算该行区域内的列和,确定列和为0的空隙,空隙与空隙之间即为字符,进而对待切割字符图像中的字符进行切割。具体的,可以根据待切割字符图像的先验信息对字符进行切割,例如预先可以确定待切割字符图像中包括9个字符,最右侧字符右侧存在较大的空隙,那么即可从根据“最右侧字符右侧存在较大的空隙”来确定第9个候选字符,进而从第9个候选字符的位置进行反推切割出所有9个候选字符。根据列切割位置和切割得到的候选字符,即可确定每一个候选字符的左右边界。
之后,再对每个候选字符的上下边界进行定位,具体步骤为:对每个候选字符的左边界到右边界这段计算行和,先确定连续若干行行和最大的位置,然后基于此位置向上确定上边界、向下确定下边界,确定上下边界的条件为连续出现若干行和为0的行。至此,可以确定每个所述候选字符的上下左右边界,即根据行区域(1~50像素行)确定的字符切割位置。
S130、根据先验信息选取设定数量的字符的切割位置修正所述行区域的行起止范围,将根据修正行区域重新确定的字符切割位置作为与所述行区域匹配的备选切割位置。
由于行区域的设定行宽是预先根据经验值设定的,根据该行区域确定的字符切割位置可能会由于字符大小不一等问题而导致字符切割不正确进而产生对字符识别的影响,因此,下述将对该行区域的行起止范围进行修正。
其中,可以根据先验信息选取设定数量的字符的切割位置进行修正,例如包括9个字符的待切割字符图像,一般两端的字符边界可能会存在不合理的现象,那么可以选择中间的字符的切割位置进行修正,比如第2~7个字符的切割位置进行修正,再例如,待切割字符图像中最左侧字符可能会受盖章的影响,如图1C所示,那么可以选择除了最左侧字符之外的剩余字符的切割位置进行修正。
作为本实施例一种可选的实施方式,可以将根据先验信息选取设定数量的字符的切割位置修正所述行区域的行起止范围,具体为:将设定数量的字符的上边界中行数值最小的上边界所在行作为修正行区域的起始行;将设定数量的字符的下边界中行数值最大的下边界所在行作为修正行区域的终止行。
即,将选定的设定数量的字符的上边界中最小像素行数值作为修正行区域的起始行数,将选定的设定数量的字符的下边界中最大像素行数值作为修正行区域的终止行数。例如,选定的设定数量的字符的上边界中的最小像素行数值为10,选定的设定数量的字符的下边界中的最大像素行数值为74,那么修正行区域的即为包括10~74像素行的行区域。
根据修正行区域(10~74像素行)重新确定待切割字符图像中每个字符的切割位置,确定方法同上,此处不再赘述。并将重新确定的字符切割位置作为与行区域(1~50像素行)匹配的备选切割位置。
S140、计算与所述行区域匹配的备选切割位置的得分和连续度。
对与行区域(1~50像素行)匹配的备选切割位置进行打分和计算连续度,以判断该备选切割位置的合理程度。
具体的,可以计算根据与所述行区域匹配的备选切割位置确定的所有字符高度的累加和,将所述累加和作为所述备选切割位置的得分;
计算根据与所述行区域匹配的备选切割位置确定的所有相邻字符的中心间距的方差,将所述方差作为所述备选切割位置的连续度。
即,备选切割位置的得分可以为根据备选切割位置确定的每个字符高度的累加和,得分越高说明也接近于理想切割;备选切割位置的连续度可以为根据备选切割位置确定的相邻字符的中心间距的方差,方差值越小,说明字符的连续性越好,切割得越合理。其中,每个字符的中心可以是对该字符的上下左右边界取均值确定的。与合理切割对应的相邻字符的中心间距的方差要比与不合理切割对应的相邻字符的中心间距的方差小,例如,如图1B所示的待切割字符图像(旨在切割图中右侧9个字符图像),如果将左侧第二个0误切割为字符图像,由于是不合理切割,那么据此计算得出的相邻字符的中心间距的方差必然会大一些。
S150、根据逐行遍历规则更新所述起始遍历行后,返回执行根据起始遍历行以及设定行宽,在所述二值化处理图像中获取行区域的操作,直至完成对所述二值化处理图像的行遍历。
逐行遍历规则指的是固定行宽的行区域从上往下逐行遍历二值化处理图像,例如,对于包括150像素行的二值化处理图像,设定行宽为50像素行,起始遍历行的预设初始值为1的情况,可以选择分别为1~50像素行、2~51像素行、3~52像素行、……、101~150像素行的行区域对该二值化处理图像进行遍历。
根据S120~S140,执行完对行区域(1~50像素行)的操作后,更新起始遍历行的值为2,返回执行S120~S140以执行完行区域(2~51像素行)的操作,获取与行区域(2~51像素行)匹配的备选切割位置,再更新起始遍历行的值,直至执行完对行区域(101~150像素行)的操作,获取与行区域(101~150像素行)匹配的备选切割位置,以完成对二值化处理图像的行遍历。
通过上述循环操作,可以分别获取到与1~50像素行、2~51像素行、3~52像素行、……、101~150像素行的行区域分别匹配的备份切割位置。
在上述循环操作中,在对某行区域进行操作的过程中,根据该行区域确定字符切割位置时(S120),在确定了待切割字符图像中的各个候选字符之后,可以计算该区域内的行和,若存在过多的行和小于一定阈值的行,认为此行区域不合理(例如是此区域包括了过多的背景),则停止对该行区域的后续操作,跳出该次循环,执行对下一行区域的操作。例如,在对行区域(3~52像素行)进行操作的过程中,在确定各个候选字符之后,通过计算该区域内的行和,确定存在过多的行和小于一定阈值的行,则停止对该区域的后续操作,转而执行对行区域(4~53像素行)的操作。
上述技术方案中增加了判断条件,可以省略部分不必要的计算过程,提高了计算效率,避免了系统资源的浪费。
S160、如果确定与目标行区域匹配的备选切割位置的得分和连续度满足设定条件,则确定与所述目标行区域匹配的备选切割位置为理想切割位置。
对二值化处理图像行遍历完成后,对获取的各个备选切割位置的得分和连续度进行分析判断,根据分析判断结果确定理想切割位置。
作为本实施例一种具体的实施方式,可以判断与目标行区域匹配的备选切割位置的连续度,以及与目标行区域连续的至少两个行区域匹配的备选切割位置的连续度是否均与第一连续度阈值的差值处于设定零值区域范围内:若是,则确定与目标行区域匹配的备选切割位置的得分和连续度满足设定条件;
若否,则判断与目标行区域匹配的备选切割位置的得分是否大于与其他行区域匹配的备选切割位置的得分,且与所述行区域匹配的备选切割位置的连续度是否小于第二连续度阈值:若是,则确定与目标行区域匹配的备选切割位置的得分和连续度满足设定条件。进而,将得分和连续度满足设定条件的备选切割位置作为理想切割位置。其中,连续度阈值越大,代表字符间的连续度越差,第一连续度阈值小于第二连续度阈值,第一连续度阈值可以指的是计算得到的各个方差结果中的方差最小值,第二连续度阈值指的是可以指的是方差临界值,若大于该方差临界值则认为连续性差。
具体的,可以是判断是否存在若干连续行区域,例如是1~50像素行、2~51像素行、3~52像素行、4~53像素行的行区域等,与这些行区域匹配的备选切割位置对应的方差,均接近方差最小值,那么与这些行区域匹配的备选切割位置均为理想切割位置。如果不存在连续行区域满足上述条件,则确定得分最高且对应的方差不太大(不能超过第二连续度阈值)的备选切割位置,该备选切割位置为理想切割位置。其中,可以是将方差大于第二连续度阈值的备选切割位置的得分认定为无效,不进行得分大小比较。
本实施例提供的一种字符图像切割方法,采用设定行宽的行区域对与待切割字符对应的二值化处理图像进行行遍历,确定与各个行区域匹配的备选切割位置,进而通过判断各个备选切割位置的得分和连续度以确定理想切割位置,提高了对字符位置以及噪声的容忍度,同时也结合字符的连续性特征,进一步提高了确定理想切割位置的精确度;采用对二值化图像进行积分计算以获取二值化处理图像的技术手段,精简了重复计算的过程,极大地提高了算法的速度;通过优化每个固定行宽的行区域的行起止范围以确定各个备选切割位置的技术手段,解决了待切割字符图像中存在大小不一的字符的问题,提高了对大小不一的字符切割的精度。
实施例二
图2是本发明实施例二提供的一种字符图像切割方法的流程图,本实施例以上述实施例为基础进行具体化,在本实施例中,上述字符图像切割方法,还包括:如果确定与所有行区域匹配的备选切割位置的得分和方差结果均不满足设定条件,则重新获取与所述待切割字符图像匹配的新的二值化处理图像,并根据所述新的二值化处理图像重新确定理想切割位置。
如图2所示,本实施例的方法具体包括:
S210、获取与待切割字符图像匹配的二值化处理图像,其中,与所述二值化处理图像对应的二值化切割阈值为第一二值化切割阈值。
S220、根据起始遍历行以及设定行宽,在所述二值化处理图像中获取行区域,并根据所述行区域确定字符切割位置,所述起始遍历行具有预设初始值。
S230、根据先验信息选取设定数量的字符的切割位置修正所述行区域的行起止范围,将根据修正行区域重新确定的字符切割位置作为与所述行区域匹配的备选切割位置。
S240、计算与所述行区域匹配的备选切割位置的得分和连续度。
S250、判断是否完成对所述二值化处理图像的行遍历,若否,则执行S260,若是,则执行S270。
S260、根据逐行遍历规则更新所述起始遍历行,返回执行S220。
逐行遍历规则可以是固定行宽的行区域从上往下逐行遍历二值化处理图像,例如,对于包括150像素行的二值化处理图像,设定行宽为50像素行,起始遍历行的预设初始值为1的情况,可以选择分别为1~50像素行、2~51像素行、3~52像素行、……、101~150像素行的行区域对该二值化处理图像进行遍历。那么,起始遍历行的像素行号则可以通过依次加1来更新。
逐行遍历规则还可以是固定行宽的行区域从上往下每N行遍历二值化处理图像,例如,对于包括150像素行的二值化处理图像,设定行宽为50像素行,起始遍历行的预设初始值为1的情况,N为2时,可以选择分别为1~50像素行、3~52像素行、5~54像素行、……、101~150像素行的行区域对该二值化处理图像进行遍历。那么,起始遍历行的像素行号则可以通过依次加2来更新。对此,可以具体根据待切割字符图像的字符图像内容来具体限定。
S270、判断是否存在备选切割位置的得分和连续度满足设定条件的目标行区域,若是,则执行S280,若否,则执行S290。
S280、将与所述目标行区域匹配的备选切割位置确定为理想切割位置。
S290、重新获取与所述待切割字符图像匹配的新的二值化处理图像,并根据所述新的二值化处理图像重新确定理想切割位置,其中,与所述新的二值化处理图像对应的二值化切割阈值为第二二值化切割阈值。
由于二值化的效果直接影响着后续的字符切割,因此,在本实施例中选择对待切割字符图像进行多次二值化,即选取不同的二值化切割阈值对待切割字符图像进行二值化,具体的,以两次二值化为例进行说明。
当利用第一二值化切割阈值对待切割字符图像进行二值化处理,得到二值化处理图像以确定理想切割位置时,如果能返回理想切割位置(即存在与目标行区域匹配的备选切割位置的得分和连续度是否满足设定条件),则结束本实施例中字符图像切割方法的流程;如果不能返回理想切割位置(即不存在与目标行区域匹配的备选切割位置的得分和连续度是否满足设定条件),则利用第二二值化切割阈值对待切割字符图像进行二值化处理,得到二值化处理图像进而执行与前述处理方法相同的操作以确定理想切割位置,如果能返回理想切割位置,则结束本实施例中字符图像切割方法的流程,如果不能返回理想切割位置,则可返回报错信息,以指示待切割字符图像的畸变太严重等问题。
其中,第一二值化切割阈值和第二二值化切割阈值可以选取为通过otsu算法计算的切割阈值的0.8倍和0.6倍,也可以依据具体情形具体设定。
在上述技术方案中,通过利用不同的二值化切割阈值进行多次二值化的技术手段,可以兼容待切割字符图像的亮度不统一(有的较暗有的较亮)的情形,进一步提高了对待切割字符图像的切割效果。
实施例三
图3是本发明实施例三中提供的一种字符图像切割装置的结构示意图,可适用于待切割字符图像中存在大小不一的字符的情况,该装置可采用软件和/或硬件的方式实现,并一般可集成在处理器中。如图3所示,所述装置包括:二值化处理图像获取模块310、字符切割位置预确定模块320、备选切割位置确定模块330、得分和连续度计算模块340、循环处理模块350和理想切割位置确定模块360,其中:
二值化处理图像获取模块310,用于获取与待切割字符图像匹配的二值化处理图像;
字符切割位置预确定模块320,用于根据起始遍历行以及设定行宽,在所述二值化处理图像中获取行区域,并根据所述行区域确定字符切割位置,所述起始遍历行具有预设初始值;
备选切割位置确定模块330,用于根据先验信息选取设定数量的字符的切割位置修正所述行区域的行起止范围,将根据修正行区域重新确定的字符切割位置作为与所述行区域匹配的备选切割位置;
得分和连续度计算模块340,用于计算与所述行区域匹配的备选切割位置的得分和连续度;
循环处理模块350,用于根据逐行遍历规则更新所述起始遍历行后,返回执行根据起始遍历行以及设定行宽,在所述二值化处理图像中获取行区域的操作,直至完成对所述二值化处理图像的行遍历;
理想切割位置确定模块360,用于如果确定与目标行区域匹配的备选切割位置的得分和连续度满足设定条件,则确定与所述目标行区域匹配的备选切割位置为理想切割位置。
本发明实施例提供了一种字符切割装置,通过选取设定行宽的行区域对与待切割字符图像匹配的二值化处理图像进行逐行遍历,根据每个行区域确定字符切割位置后,修正对应行区域的行起止范围,将根据修正行区域重新确定的字符切割位置作为与对应行区域匹配的备选切割位置,计算每个与行区域匹配的备选切割位置的得分和连续度,将得分和连续度满足设定条件的备选切割位置确定为理想切割位置。上述字符图像切割装置,通过对行区域的起止范围进行修正后确定各个备选切割位置,解决了待切割字符图像中存在大小不一的字符的问题;采用行遍历的方法确定与每个行区域匹配的备选切割位置,提高了对待切割字符图像中字符位置和噪声的容忍度;通过对每个备选切割位置打分以及计算每个备选切割位置的连续度的技术手段,进一步提高了字符图像切割的精确度。
在上述实施例的基础上,所述字符切割装置还包括:重新确定理想切割位置模块,用于如果确定与所有行区域匹配的备选切割位置的得分和方差结果均不满足设定条件,则重新获取与所述待切割字符图像匹配的新的二值化处理图像,并根据所述新的二值化处理图像重新确定理想切割位置;
其中,所述新的二值化处理图像与前一次使用的所述二值化处理图像通过不同的二值化切割阈值生成。
具体的,二值化处理图像获取模块310包括:二值化单元和积分单元,其中,
二值化单元,用于按照设定切割阈值对所述待切割字符图像进行二值化处理,得到二值化图像;
积分单元,用于计算所述二值化图像的积分图像作为所述二值化处理图像。
具体的,字符切割位置预确定模块320包括:候选字符确定单元、边界定位单元和字符切割位置预确定单元,其中,
候选字符确定单元,用于根据所述行区域确定所述行区域的列切割位置,并根据所述行区域的列切割位置以及先验信息确定出各个候选字符;
边界定位单元,用于确定出每个所述候选字符的左右边界,并根据确定出的所述左右边界对每个所述候选字符的上下边界进行定位;
字符切割位置预确定单元,用于将确定出的与每个所述候选字符匹配的上下边界以及左右边界作为根据所述行区域确定的字符切割位置。
具体的,备选切割位置确定模块330包括:起始行修正单元和终止行修正单元,其中,
起始行修正单元,用于将所述设定数量的字符的上边界中行数值最小的上边界所在行作为修正行区域的起始行;
终止行修正单元,用于将所述设定数量的字符的下边界中行数值最大的下边界所在行作为修正行区域的终止行。
具体的,得分和连续度计算模块340包括:得分计算单元和连续度计算单元,其中,
得分计算单元,用于计算根据与所述行区域匹配的备选切割位置确定的所有字符高度的累加和,将所述累加和作为所述备选切割位置的得分;
连续度计算单元,用于计算根据与所述行区域匹配的备选切割位置确定的所有相邻字符的中心间距的方差,将所述方差作为所述备选切割位置的连续度。
在上述各实施例的基础上,理想切割位置确定模块360,具体用于判断与目标行区域匹配的备选切割位置的连续度,以及与目标行区域连续的至少两个行区域匹配的备选切割位置的连续度是否均与第一连续度阈值的差值处于设定零值区域范围内:若是,则确定与目标行区域匹配的备选切割位置的得分和连续度满足设定条件;
若否,则判断与目标行区域匹配的备选切割位置的得分是否大于与其他行区域匹配的备选切割位置的得分,且与所述行区域匹配的备选切割位置的连续度是否小于第二连续度阈值:若是,则确定与目标行区域匹配的备选切割位置的得分和连续度满足设定条件。
上述字符图像切割装置可执行本发明任意实施例所提供的字符图像切割方法,具备执行的字符图像切割方法相应的功能模块和有益效果。
实施例四
图4是本发明实施例四中提供的一种设备的结构示意图,如图4所示,该设备包括处理器410、存储器420、输入装置430和输出装置440;设备中处理器410的数量可以是一个或多个,图4中以一个处理器410为例;设备中的处理器410、存储器420、输入装置430和输出装置440可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储器420作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明任意实施例中字符图像切割方法对应的程序指令/模块(例如,字符图像切割装置中的二值化处理图像获取模块310、字符切割位置预确定模块320、备选切割位置确定模块330、得分和连续度计算模块340、循环处理模块350和理想切割位置确定模块360)。处理器410通过运行存储在存储器420中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的用于设备的操作。
存储器420可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器420可进一步包括相对于处理器410远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置430可用于接收输入的触摸信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置440可包括显示屏等显示设备。
实施例五
本实施例提供了一种包含计算机可执行指令的存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例提供的字符图像切割方法,该方法包括:
获取与待切割字符图像匹配的二值化处理图像;
根据起始遍历行以及设定行宽,在所述二值化处理图像中获取行区域,并根据所述行区域确定字符切割位置,所述起始遍历行具有预设初始值;
根据先验信息选取设定数量的字符的切割位置修正所述行区域的行起止范围,将根据修正行区域重新确定的字符切割位置作为与所述行区域匹配的备选切割位置;
计算与所述行区域匹配的备选切割位置的得分和连续度;
根据逐行遍历规则更新所述起始遍历行后,返回执行根据起始遍历行以及设定行宽,在所述二值化处理图像中获取行区域的操作,直至完成对所述二值化处理图像的行遍历;
如果确定与目标行区域匹配的备选切割位置的得分和连续度满足设定条件,则确定与所述目标行区域匹配的备选切割位置为理想切割位置。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台设备执行本发明各个实施例所述的方法。
值得注意的是,上述字符图像切割装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (9)

1.一种字符图像切割方法,其特征在于,包括:
获取与待切割字符图像匹配的二值化处理图像;
根据起始遍历行以及设定行宽,在所述二值化处理图像中获取行区域,并根据所述行区域确定字符切割位置,所述起始遍历行具有预设初始值;
根据先验信息选取设定数量的字符的切割位置修正所述行区域的行起止范围,将根据修正行区域重新确定的字符切割位置作为与所述行区域匹配的备选切割位置;
计算与所述行区域匹配的备选切割位置的得分和连续度;
根据逐行遍历规则更新所述起始遍历行后,返回执行根据起始遍历行以及设定行宽,在所述二值化处理图像中获取行区域的操作,直至完成对所述二值化处理图像的行遍历;
如果确定与目标行区域匹配的备选切割位置的得分和连续度满足设定条件,则确定与所述目标行区域匹配的备选切割位置为理想切割位置;
所述根据所述行区域确定字符切割位置,包括:
根据所述行区域确定所述行区域的列切割位置,并根据所述行区域的列切割位置以及先验信息确定出各个候选字符;
确定出每个所述候选字符的左右边界,并根据确定出的所述左右边界对每个所述候选字符的上下边界进行定位;
将确定出的与每个所述候选字符匹配的上下边界以及左右边界作为根据所述行区域确定的字符切割位置;
所述行宽指的是行区域的行数,所述行区域的行数为小于字符高度的行数。
2.根据权利要求1所述的方法,其特征在于,还包括:
如果确定与所有行区域匹配的备选切割位置的得分和方差结果均不满足设定条件,则重新获取与所述待切割字符图像匹配的新的二值化处理图像,并根据所述新的二值化处理图像重新确定理想切割位置;
其中,所述新的二值化处理图像与前一次使用的所述二值化处理图像通过不同的二值化切割阈值生成。
3.根据权利要求1或2所述的方法,其特征在于,所述获取与待切割字符图像匹配的二值化处理图像,包括:
按照设定切割阈值对所述待切割字符图像进行二值化处理,得到二值化图像;
计算所述二值化图像的积分图像作为所述二值化处理图像。
4.根据权利要求1所述的方法,其特征在于,所述根据先验信息选取设定数量的字符的切割位置修正所述行区域的行起止范围,包括:
将所述设定数量的字符的上边界中行数值最小的上边界所在行作为修正行区域的起始行;
将所述设定数量的字符的下边界中行数值最大的下边界所在行作为修正行区域的终止行。
5.根据权利要求1所述的方法,其特征在于,所述计算与所述行区域匹配的备选切割位置的得分和连续度,包括:
计算根据与所述行区域匹配的备选切割位置确定的所有字符高度的累加和,将所述累加和作为所述备选切割位置的得分;
计算根据与所述行区域匹配的备选切割位置确定的所有相邻字符的中心间距的方差,将所述方差作为所述备选切割位置的连续度。
6.根据权利要求1或5所述的方法,其特征在于,确定与目标行区域匹配的备选切割位置的得分和连续度满足设定条件,包括:
判断与目标行区域匹配的备选切割位置的连续度,以及与目标行区域连续的至少两个行区域匹配的备选切割位置的连续度是否均与第一连续度阈值的差值处于设定零值区域范围内:若是,则确定与目标行区域匹配的备选切割位置的得分和连续度满足设定条件;
若否,则判断与目标行区域匹配的备选切割位置的得分是否大于与其他行区域匹配的备选切割位置的得分,且与所述行区域匹配的备选切割位置的连续度是否小于第二连续度阈值:若是,则确定与目标行区域匹配的备选切割位置的得分和连续度满足设定条件。
7.一种字符图像切割装置,其特征在于,包括:
二值化处理图像获取模块,用于获取与待切割字符图像匹配的二值化处理图像;
字符切割位置预确定模块,用于根据起始遍历行以及设定行宽,在所述二值化处理图像中获取行区域,并根据所述行区域确定字符切割位置,所述起始遍历行具有预设初始值;
备选切割位置确定模块,用于根据先验信息选取设定数量的字符的切割位置修正所述行区域的行起止范围,将根据修正行区域重新确定的字符切割位置作为与所述行区域匹配的备选切割位置;
得分和连续度计算模块,用于计算与所述行区域匹配的备选切割位置的得分和连续度;
循环处理模块,用于根据逐行遍历规则更新所述起始遍历行后,返回执行根据起始遍历行以及设定行宽,在所述二值化处理图像中获取行区域的操作,直至完成对所述二值化处理图像的行遍历;
理想切割位置确定模块,用于如果确定与目标行区域匹配的备选切割位置的得分和连续度满足设定条件,则确定与所述目标行区域匹配的备选切割位置为理想切割位置;
所述字符切割位置预确定模块包括:候选字符确定单元、边界定位单元和字符切割位置预确定单元,其中,
所述候选字符确定单元,用于根据所述行区域确定所述行区域的列切割位置,并根据所述行区域的列切割位置以及先验信息确定出各个候选字符;
所述边界定位单元,用于确定出每个所述候选字符的左右边界,并根据确定出的所述左右边界对每个所述候选字符的上下边界进行定位;
所述字符切割位置预确定单元,用于将确定出的与每个所述候选字符匹配的上下边界以及左右边界作为根据所述行区域确定的字符切割位置;
所述行宽指的是行区域的行数,所述行区域的行数为小于字符高度的行数。
8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6中任一所述的方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的方法。
CN201810226507.7A 2018-03-19 2018-03-19 字符图像切割方法、装置、设备及存储介质 Active CN108460386B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810226507.7A CN108460386B (zh) 2018-03-19 2018-03-19 字符图像切割方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810226507.7A CN108460386B (zh) 2018-03-19 2018-03-19 字符图像切割方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN108460386A CN108460386A (zh) 2018-08-28
CN108460386B true CN108460386B (zh) 2022-03-08

Family

ID=63237058

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810226507.7A Active CN108460386B (zh) 2018-03-19 2018-03-19 字符图像切割方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN108460386B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112861648B (zh) * 2021-01-19 2023-09-26 平安科技(深圳)有限公司 文字识别方法、装置、电子设备及存储介质
CN115050015B (zh) * 2022-08-15 2023-09-12 恒银金融科技股份有限公司 金融票据账号字符区的精确分割方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001060246A (ja) * 1999-08-23 2001-03-06 Oki Electric Ind Co Ltd 文字切出し方法
CN102222226A (zh) * 2011-06-21 2011-10-19 杭州电子科技大学 一种基于先验分析的迭代式车牌字符分割方法
CN104616009A (zh) * 2015-02-13 2015-05-13 广州广电运通金融电子股份有限公司 一种字符切割识别方法
CN106650729A (zh) * 2016-12-09 2017-05-10 浙江浩腾电子科技股份有限公司 一种基于投影的车牌字符切割方法
CN107437294A (zh) * 2017-08-01 2017-12-05 深圳怡化电脑股份有限公司 一种字符分割方法、装置、设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001060246A (ja) * 1999-08-23 2001-03-06 Oki Electric Ind Co Ltd 文字切出し方法
CN102222226A (zh) * 2011-06-21 2011-10-19 杭州电子科技大学 一种基于先验分析的迭代式车牌字符分割方法
CN104616009A (zh) * 2015-02-13 2015-05-13 广州广电运通金融电子股份有限公司 一种字符切割识别方法
CN106650729A (zh) * 2016-12-09 2017-05-10 浙江浩腾电子科技股份有限公司 一种基于投影的车牌字符切割方法
CN107437294A (zh) * 2017-08-01 2017-12-05 深圳怡化电脑股份有限公司 一种字符分割方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN108460386A (zh) 2018-08-28

Similar Documents

Publication Publication Date Title
US10896349B2 (en) Text detection method and apparatus, and storage medium
CN110619333B (zh) 一种文本行分割方法、文本行分割装置及电子设备
CN107169489B (zh) 倾斜图像校正的方法和装置
WO2013063820A1 (zh) 一种车牌图像定位的方法和装置
CN109325492B (zh) 字符切割方法、装置、计算机设备及存储介质
CN108460386B (zh) 字符图像切割方法、装置、设备及存储介质
CN111989692B (zh) 表单识别方法、表格提取方法及相关装置
CN108446702B (zh) 一种图像字符分割方法、装置、设备及存储介质
CN108734161B (zh) 冠字号区域的识别方法、装置、设备及存储介质
CN110674811B (zh) 图像识别的方法及装置
CN101256630B (zh) 用于改善文档图像二值化性能的去噪声装置和方法
CN112906695A (zh) 适配多类ocr识别接口的表格识别方法及相关设备
CN113362238A (zh) 测试图像处理方法、装置、电子设备及存储介质
CN108717544B (zh) 一种基于智能图像分析的报纸样稿文字自动检测方法
CN116071272A (zh) 一种图像校正方法、装置、电子设备及其存储介质
CN107194971B (zh) 一种金手指定位方法、装置及计算机可读存储介质
CN107992785B (zh) 模糊车牌的识别方法及装置
JP5772675B2 (ja) 濃淡画像のエッジ抽出方法、エッジ抽出装置並びに濃淡画像のエッジ抽出プログラム
CN114119410A (zh) 校正畸变表格图像中的单元格的方法及装置
CN106951902B (zh) 一种图像二值化处理方法及装置
CN112530079A (zh) 一种检测票据要素的方法、装置、终端设备和存储介质
CN106886777B (zh) 一种字符边界确定方法及装置
CN110543798A (zh) 二维码的识别方法及装置
CN112580638B (zh) 文本检测方法、装置、存储介质及电子设备
CN112529923B (zh) 一种控件识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant