CN110837754B - 字符切割定位方法、装置、计算机设备及存储介质 - Google Patents

字符切割定位方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN110837754B
CN110837754B CN201810934043.5A CN201810934043A CN110837754B CN 110837754 B CN110837754 B CN 110837754B CN 201810934043 A CN201810934043 A CN 201810934043A CN 110837754 B CN110837754 B CN 110837754B
Authority
CN
China
Prior art keywords
intermediate image
character
target
cutting
account content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810934043.5A
Other languages
English (en)
Other versions
CN110837754A (zh
Inventor
傅博扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yihua Computer Co Ltd
Shenzhen Yihua Time Technology Co Ltd
Shenzhen Yihua Financial Intelligent Research Institute
Original Assignee
Shenzhen Yihua Computer Co Ltd
Shenzhen Yihua Time Technology Co Ltd
Shenzhen Yihua Financial Intelligent Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Yihua Computer Co Ltd, Shenzhen Yihua Time Technology Co Ltd, Shenzhen Yihua Financial Intelligent Research Institute filed Critical Shenzhen Yihua Computer Co Ltd
Priority to CN201810934043.5A priority Critical patent/CN110837754B/zh
Publication of CN110837754A publication Critical patent/CN110837754A/zh
Application granted granted Critical
Publication of CN110837754B publication Critical patent/CN110837754B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Character Input (AREA)

Abstract

本申请涉及一种字符切割定位方法,该方法包括:获取包含有账号内容的目标图像,账号内容包括多个字符,对账号内容中的字符进行多次迭代削弱处理,获取每次削弱处理后得到的中间图像,对每个中间图像中的账号内容进行字符切割,计算切割后得到的字符间距,确定与每个中间图像对应的目标字符间距,根据每个中间图像对应的目标字符间距筛选出目标切割字符间距,将目标切割字符间距对应的中间图像作为目标中间图像,将目标中间图像对应的字符切割位置作为目标字符切割位置。该方法提高了字符切割定位的准确度,且有利于提高后续识别的准确度。此外,还提出了一种字符切割定位装置、计算机设备及存储介质。

Description

字符切割定位方法、装置、计算机设备及存储介质
技术领域
本发明涉及计算机技术领域,尤其是涉及一种字符切割定位方法、装置、计算机设备及存储介质。
背景技术
账号在支票、存单、业务委托书等业务中,是非常重要的一环,也是后期日志记录中检索定位收款/存款人的一串字符。为了能够对账号中的字符进行准确识别,需要准确地从账号中切割出一个一个的字符,但是账号中的字符可能存在黏连,导致切割不准确,比如,将多个字符切割到一起,从而导致后续识别的准确率大大降低。
发明内容
基于此,有必要针对上述问题,提供一种字符切割定位准确度高的字符切割定位方法、装置、计算机设备及存储介质。
第一方面,本发明实施例提供一种字符切割定位方法,所述方法包括:
获取包含有账号内容的目标图像,所述账号内容包括多个字符;
对所述账号内容中的字符进行多次迭代削弱处理,获取每次削弱处理后得到的中间图像;
对每个中间图像中的账号内容进行字符切割,计算切割后得到的字符间距,确定与每个中间图像对应的目标字符间距;
根据每个中间图像对应的目标字符间距筛选出目标切割字符间距,将所述目标切割字符间距对应的中间图像作为目标中间图像;
将所述目标中间图像对应的字符切割位置作为目标字符切割位置。
在其中一个实施例中,所述对所述账号内容中的字符进行多次迭代削弱处理,获取每次削弱处理后得到的中间图像,包括:采用形态学算法对账号内容中的字符进行水平方向上的多次迭代削弱处理,获取每次水平削弱处理后得到的初始图像;对每个所述初始图像中的账号内容在垂直方向进行多次迭代削弱处理,获取每次垂直迭代削弱处理后得到的中间图像。
在其中一个实施例中,所述对每个所述初始图像中的账号内容在垂直方向进行多次迭代削弱处理,获取每次垂直迭代削弱处理后得到的中间图像,包括:对每个所述初始图像中的账号内容在垂直方向上由底向上每次扫描获取预设行数的特征行;通过将每次扫描得到的预设行数的特征行进行背景化实现垂直方向上的迭代削弱处理。
在其中一个实施例中,所述目标字符间距为每个中间图像对应的最大字符间距;所述根据每个中间图像对应的目标字符间距目标切割字符间距,将所述目标切割字符间距对应的中间图像作为目标中间图像,包括:从多张所述中间图像中获取一张中间图像作为当前中间图像;获取所述当前中间图像对应的当前最大字符间距,若当前最大字符间距小于当前中间值,则将当前最大字符间距作为下一张中间图像的中间值;获取下一张中间图像作为当前中间图像,进入获取当前中间图像对应的当前最大字符间距的步骤,直至遍历完所有中间图像,将最终得到的中间值所对应的中间图像作为目标中间图像。
在其中一个实施例中,所述对每个中间图像中的账号内容进行字符切割,计算切割后得到的字符间距,确定与每个中间图像对应的目标字符间距,包括:对每个中间图像中的账号内容进行垂直投影,根据垂直投影的结果对所述账号内容进行字符切割,得到切割后与每个中间图像对应的最大字符间距,将最大字符间距作为与每个中间图像对应的目标字符间距。
在其中一个实施例中,在所述获取包含有账号内容的图像之后,还包括:获取与所述账号内容对应的定位窗口,所述定位窗口的大小是根据账号内容的长度和宽度确定的;根据所述定位窗口在所述原始图像中定位出所述账号内容的位置。
在其中一个实施例中,所述方法还包括:根据所述目标字符切割位置对所述目标图像中的账号内容进行切割,对切割得到的多个字符进行识别。
第二方面,本发明实施例提供一种字符切割定位装置,所述装置包括:
获取模块,用于获取包含有账号内容的目标图像,所述账号内容包括多个字符;
削弱处理模块,用于对所述账号内容中的字符进行多次迭代削弱处理,获取每次削弱处理后得到的中间图像;
切割模块,用于对每个中间图像中的账号内容进行字符切割,计算切割后得到的字符间距,确定与每个中间图像对应的目标字符间距;
筛选模块,用于根据每个中间图像对应的目标字符间距筛选出目标切割字符间距,将所述目标切割字符间距对应的中间图像作为目标中间图像;
切割位置确定模块,用于根据所述目标中间图像对应的字符切割位置作为目标字符切割位置。
在其中一个实施例中,所述削弱处理模块包括:水平削弱处理模块,用于采用形态学算法对账号内容中的字符进行水平方向上的多次迭代削弱处理,获取每次水平削弱处理后得到的初始图像;垂直削弱处理模块,用于对每个所述初始图像中的账号内容在垂直方向进行多次迭代削弱处理,获取每次垂直迭代削弱处理后得到的中间图像。
在其中一个实施例中,所述垂直削弱处理模块还用于对每个所述初始图像中的账号内容在垂直方向上由底向上每次扫描获取预设行数的特征行;通过将每次扫描得到的预设行数的特征行进行背景化实现垂直方向上的迭代削弱处理。
在其中一个实施例中,所述目标字符间距为每个中间图像对应的最大字符间距;所述筛选模块还用于从多张所述中间图像中获取一张中间图像作为当前中间图像;获取所述当前中间图像对应的当前最大字符间距,若当前最大字符间距小于当前中间值,则将当前最大字符间距作为下一张中间图像的中间值;获取下一张中间图像作为当前中间图像,进入获取当前中间图像对应的当前最大字符间距的步骤,直至遍历完所有中间图像,将最终得到的中间值所对应的中间图像作为目标中间图像。
在其中一个实施例中,所述确定模块还用于对每个中间图像中的账号内容进行垂直投影,根据垂直投影的结果对所述账号内容进行字符切割,得到切割后与每个中间图像对应的最大字符间距,将最大字符间距作为与每个中间图像对应的目标字符间距。
在其中一个实施例中,上述字符切割定位装置还包括:定位模块,用于获取与所述账号内容对应的定位窗口,所述定位窗口的大小是根据账号内容的长度和宽度确定的,根据所述定位窗口在所述原始图像中定位出所述账号内容的位置。
在其中一个实施例中,上述字符切割定位装置还包括:切割识别模块,用于根据所述目标字符切割位置对所述目标图像中的账号内容进行切割,对切割得到的多个字符进行识别。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
获取包含有账号内容的目标图像,所述账号内容包括多个字符;
对所述账号内容中的字符进行多次迭代削弱处理,获取每次削弱处理后得到的中间图像;
对每个中间图像中的账号内容进行字符切割,计算切割后得到的字符间距,确定与每个中间图像对应的目标字符间距;
根据每个中间图像对应的目标字符间距筛选出目标切割字符间距,将所述目标切割字符间距对应的中间图像作为目标中间图像;
将所述目标中间图像对应的字符切割位置作为目标字符切割位置。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
获取包含有账号内容的目标图像,所述账号内容包括多个字符;
对所述账号内容中的字符进行多次迭代削弱处理,获取每次削弱处理后得到的中间图像;
对每个中间图像中的账号内容进行字符切割,计算切割后得到的字符间距,确定与每个中间图像对应的目标字符间距;
根据每个中间图像对应的目标字符间距筛选出目标切割字符间距,将所述目标切割字符间距对应的中间图像作为目标中间图像;
将所述目标中间图像对应的字符切割位置作为目标字符切割位置。
上述字符切割定位方法、装置、计算机设备及存储介质,通过对账号内容中的字符进行多次迭代削弱处理,然后获取每次削弱处理后得到的中间图像,继而在每个中间图像的基础上进行字符切割,根据切割得到的字符间距得到切割最优的目标中间图像,然后将目标中间图像对应的切割位置作为目标字符切割位置。该方法通过对目标图像进行迭代削弱处理得到多个中间图像,然后对每个中间图像进行切割,选择出最优的切割位置,提高了字符切割定位的准确度,且有利于提高后续识别的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为一个实施例中字符切割定位方法的流程图;
图2为一个实施例中包含有账号内容的目标图像的示意图;
图3A为一个实施例中削弱处理之前账号内容的示意图;
图3B为一个实施例中削弱处理之后其中一个中间图像的示意图;
图4为一个实施例中字符间距的示意图;
图5为一个实施例中确定目标字符切割位置的示意图;
图6为一个实施例中对账号内容进行处理得到中间图像的流程图;
图7A为一个实施例中垂直削弱处理之前的初始图像的示意图;
图7B为一个实施例中垂直削弱处理之后的其中一个中间图像的示意图;
图8为一个实施例中返回的结果示意图;
图9为一个实施例中字符切割定位装置的结构框图;
图10为另一个实施例中削弱处理模块的结构框图;
图11为另一个实施例中字符切割定位装置的结构框图;
图12为又一个实施例中字符切割定位装置的结构框图;
图13为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,提出了一种字符切割定位方法,该方法既可以用于终端,也可以应用于服务器,本实施例以应用于终端举例说明。该字符切割定位方法具体包括以下步骤:
步骤102,获取包含有账号内容的目标图像,账号内容包括多个字符。
其中,账号内容是指账号的具体内容信息,账号内容通常是由一串字符组成的,字符可以是字母、也可以是数字、还可以是符号。目标图像可以是彩色图像,也可以是灰度图像,还可以是二值化图像。在一个实施例中,是通过将包含有账号信息的支票、收据图像中截取出账号信息所在的区域,将截取到的区域作为目标图像。如图2所示,为一个实施例中,包含有账号内容的目标图像的示意图。在一个实施例中,在账号识别的场景下,对收款单、支票、存款单等单据影像(即目标图像)中的账号信息进行识别时,首先获取包含有账号信息的原始图像,如果存在污损,则需要先去除污损,得到包含有账号内容的目标图像。
步骤104,对账号内容中的字符进行多次迭代削弱处理,获取每次削弱处理后得到的中间图像。
其中,削弱处理是指对字符进行削弱的处理,比如,对字符的厚度进行削弱处理。迭代削弱处理是指在前一次削弱处理的基础上进行进一步的削弱处理。每次削弱处理都相应地会得到一个中间图像,迭代多次相应地会得到多个中间图像。后一次中间图像是在前一次中间图像的基础上进行削弱处理得到的。举个例子,假设进行5次迭代削弱处理,第一次削弱处理得到第一个中间图像后,下一次削弱处理是在该第一个中间图像的基础上进行再次削弱处理,然后得到第二个中间图像,依此类推,最后一共会得到5个中间图像。
账号内容是由一个个字符组成的,而字符与字符之间可能存在黏连,导致后续切割不准确,所以通过对账号内容中的字符的厚度进行削弱处理,有利于减少黏连,提高切割的准确性。如图3A所示,为一个实施例中,削弱处理之前的账号内容示意图,如图3B所示,削弱处理之后的其中一个中间图像的示意图,可以很明显的看到,处理之后的中间图像中的账号内容减少了黏连。
步骤106,对每个中间图像中的账号内容进行字符切割,计算切割后得到的字符间距,确定与每个中间图像对应的目标字符间距。
其中,字符切割是指将账号内容中的字符切割出来,字符间距是指切割得到的相邻字符之间的间隔,如图4所示,为一个实施例中,字符间距的示意图。目标字符间距是指能够代表中间图像切割情况的字符间隔。比如,可以将切割得到的最大字符间距作为目标字符间距,也可以将切割得到的最大字符间距与最小字符间距之差作为目标字符间距。
步骤108,根据每个中间图像对应的目标字符间距筛选出目标切割字符间距,将目标切割字符间距对应的中间图像作为目标中间图像。
其中,目标切割字符间距是指得到的最优的目标字符间距,从多个中间图像对应的目标字符间距中筛选出目标切割字符间距。在一个实施例中,获取到每个中间图像对应的目标字符间距后,将得到的每个中间图像对应的目标字符间距与预设的标准字符间距进行比较,获取与该标准字符间距最接近的目标字符间距作为目标切割字符间距,然后将目标切割字符间距对应的中间图像作为目标中间图像。
在另一个实施例中,通过将得到的目标字符间距中最小的目标字符间距作为目标切割字符间距,然后将目标切割字符间距对应的中间图像作为目标中间图像。
步骤110,将目标中间图像对应的字符切割位置作为目标字符切割位置。
其中,字符切割位置是指对目标中间图像进行切割时每个字符对应的切割位置。由于该目标中间图像切割出的字符间距最符合标准字符间距,所以将该目标中间图像对应的字符切割位置作为目标字符切割位置。如图5所示,为一个实施例中,确定的目标字符切割位置的示意图。
上述字符切割定位方法,通过对账号内容中的字符进行多次迭代削弱处理,然后获取每次削弱处理后得到的中间图像,继而在每个中间图像的基础上进行字符切割,根据切割得到的字符间距得到切割最优的目标中间图像,然后将目标中间图像对应的切割位置作为目标字符切割位置。该方法通过对目标图像进行迭代削弱处理得到多个中间图像,然后对每个中间图像进行切割,选择出最优的切割位置,提高了字符切割定位的准确度,且有利于提高后续识别的准确度。
如图6所示,对账号内容中的字符进行多次迭代削弱处理,获取每次削弱处理后得到的中间图像,包括:
步骤104A,采用形态学算法对账号内容中的字符进行水平方向上的多次迭代削弱处理,获取每次水平削弱处理后得到的初始图像。
其中,为了减少水平方向上的黏连,首先,采用形态学算法对账号内容中的字符(字符厚度)进行水平方向的削弱处理,削弱处理可以采用形态学算法中的腐蚀操作。将经过水平削弱处理后的图像称为“初始图像”。每次水平迭代处理都会得到一个初始图像,后一次得到的初始图像是在前一次得到的初始图像的基础上进行再次水平削弱处理得到的。比如,假设一共进行了5次水平方向的迭代削弱处理,那么相应地得到5个初始图像。
步骤104B,对每个初始图像中的账号内容在垂直方向进行多次迭代削弱处理,获取每次垂直迭代削弱处理后得到的中间图像。
其中,为了进一步减少黏连,在进行了水平方向的迭代削弱得到多个初始图像的基础上,对每个初始图像中的账号内容进行垂直方向的多次迭代削弱处理,然后获取经过垂直迭代削弱处理得到的中间图像。比如,假设一共得到了5个初始图像,分别对每个初始图像中的账号内容在垂直方向进行10次迭代,那么相应地将会得到50个中间图像。通过对账号内容分别进行水平和垂直方向的削弱处理,有利于减少账号内容中相邻字符之间的黏连,便于提高后续切割的准确度。
在一个实施例中,所述对每个所述初始图像中的账号内容在垂直方向进行多次迭代削弱处理,获取每次垂直迭代削弱处理后得到的中间图像,包括:对每个所述初始图像中的账号内容在垂直方向上由底向上每次扫描获取预设行数的特征行,通过将每次扫描得到的预设行数的特征行进行背景化实现垂直方向上的迭代削弱处理。
其中,特征行是指包含有账号内容的目标像素的行。可以将账号内容看作是由多个像素行组成的。在垂直方向上由底向上每次扫描获取预设行数的特征行,然后将扫描得到的预设行数的特征行进行背景化,即将特征行中组成账号内容的目标像素设置为非目标像素。这样,有利于减少账号内容的底部的黏连,提高后续切割的准确度。
举个例子,假设预设行数为1行,即每次迭代将扫描得到的一行特征行进行背景化。假设组成账号内容的特征行一共有30行。每削减一次,从底部开始减少一行特征行。比如,假设迭代10次,第一次迭代减少的是第30行的特征行,得到第一个中间图像,第二次迭代是在第一次迭代的基础上(即第一个中间图像)进一步削弱,即继续减少的是第29行的特征行,以此类推,如果迭代10次,那么最后得到的中间图像相当于是在初始图像上减少了10行特征行。如图7A为一个实施例中,垂直迭代削弱处理之前的初始图像的示意图,如图7B为垂直迭代削弱处理之后的其中一个中间图像的示意图。通过底部的特征行进行背景化,有利于减少字符底部之间的黏连,提高切割的准确性。
在一个实施例中,所述目标字符间距为每个中间图像对应的最大字符间距;所述根据每个中间图像对应的目标字符间距筛选出目标切割字符间距,将所述目标切割字符间距对应的中间图像作为目标中间图像,包括:从多张所述中间图像中获取一张中间图像作为当前中间图像;获取当前中间图像对应的当前最大字符间距,若当前最大字符间距小于当前中间值,则将当前最大字符间距作为下一张中间图像的中间值;获取下一张中间图像作为当前中间图像,进入获取当前中间图像对应的当前最大字符间距的步骤,直至遍历完所有中间图像,将最终得到的中间值所对应的中间图像作为目标中间图像。
其中,将中间图像对应的最大字符间距作为目标字符间距。由于账号内容存在黏连的情况,可能导致将两个或两个以上字符切割在了一起,所以通过将切割得到的最大字符间距作为目标字符间距来对切割的情况进行考量。比如,如果将两个字符切割到了一起,那么得到的最大字符间距肯定很大,所以相应地就会把这个不准确的切割方式筛选掉。
具体地,可以预先设置一个较大的中间值,获取一张中间图像作为当前中间图像,然后获取当前中间图像对应的当前最大字符间距,如果当前最大字符间距小于当前中间值,那么就把当前最大字符间距作为下一张中间图像的中间值。然后获取下一张中间图像作为当前中间图像,将当前中间图像对应的当前最大字符间距与上一次得到的中间值进行比较,如果当前最大字符间距小于当前对应的中间值,则同样地,将得到的当前最大字符距离作为下一张中间图像的中间值。如果当前最大字符间距不小于当前中间值,则仍然将当前中间值作为下一张中间图像的中间值。遍历完所有的中间图像,将最终得到的中间值所对应的中间图像作为目标中间图像,便于后续根据该目标中间图像对应的切割方式进行切割。
在另一个实施例中,将得到的中间图像按照迭代削弱处理得到的先后顺序进行排序,排在前面的中间图像削弱处理的程度相对浅,比如,如果迭代5次,那么第5次得到的中间图像削弱的程度是最深的。在进行遍历的时候采用从前向后的顺序进行遍历,这样,当前和后两张中间图像对应的切割结果一样时,优先选择前面的中间图像作为参考,这是由于前面的切割程度浅,最大限度地保持了账号内容原有的特点,便于提高后续识别的准确度。如图8所示,为一个实施例中,返回的结果示意图,从图中可以看出第[4]到第[8]的结果都为29,此时,选择第[4]作为最优结果,其中,图中255代表无效结果。
在一个实施例中,判断目标中间图像对应的最大字符间距与预设的标准字符间距之间的差值是否在预设误差范围内,若是,则进入将目标中间图像对应的字符切割位置作为目标字符切割位置的步骤。
在一个实施例中,所述对每个中间图像中的账号内容进行字符切割,计算切割后得到的字符间距,确定与每个中间图像对应的目标字符间距,包括:对每个中间图像中的账号内容进行垂直投影,根据垂直投影的结果对所述账号内容进行字符切割,得到切割后与每个中间图像对应的最大字符间距,将最大字符间距作为与每个中间图像对应的目标字符间距。
其中,对中间图像进行切割,可以采用垂直投影的算法将账号内容在垂直方向上进行投影,然后根据垂直投影的结果对账号内容进行字符切割。由于账号内容中字符之间是存在间隔的,即会存在空隙,所以进行垂直投影后,会存在没有特征点的地方,将没有特征点的地方确定为字符切割位置。然后获取切割后每个中间图像对应的最大字符间距,将最大字符间距作为每个中间图像对应的目标字符间距。
在一个实施例中,在所述获取包含有账号内容的图像之后,还包括:获取与所述账号内容对应的定位窗口,所述定位窗口的大小是根据账号内容的长度和宽度确定的;根据所述定位窗口在所述原始图像中定位出所述账号内容的位置。
其中,定位窗口用于定位账号内容的位置。在一个实施例中,定位窗口的大小是根据账号内容的长度和宽度确定的。根据定位窗口在目标图像中搜索定位账号内容的位置,便于后续对账号内容进行削减处理。
在一个实施例中,上述字符切割定位方法还包括:根据所述目标字符切割位置对所述目标图像中的账号内容进行字符切割,对切割得到的多个字符进行识别。
其中,在确定了目标字符切割位置后,根据目标字符切割位置对目标图像中的账号内容的字符进行切割,切割得到多个字符,然后对每个字符进行识别。通过对账号内容的字符进行准确切割,提高了对字符识别的准确度。
如图9所示,在一个实施例中,提出了一种字符切割定位装置,该装置包括:
获取模块902,用于获取包含有账号内容的目标图像,所述账号内容包括多个字符。
削弱处理模块904,用于对所述账号内容中的字符进行多次迭代削弱处理,获取每次削弱处理后得到的中间图像。
确定模块906,用于对每个中间图像中的账号内容进行字符切割,计算切割后得到的字符间距,确定与每个中间图像对应的目标字符间距。
筛选模块908,用于根据每个中间图像对应的目标字符间距筛选出目标切割字符间距,将所述目标切割字符间距对应的中间图像作为目标中间图像。
切割位置确定模块910,用于将所述目标中间图像对应的字符切割位置作为目标字符切割位置。
如图10所示,在一个实施例中,所述削弱处理模块904包括:
水平削弱处理模块904A,用于采用形态学算法对账号内容中的字符进行水平方向上的多次迭代削弱处理,获取每次水平削弱处理后得到的初始图像;
垂直削弱处理模块904B,用于对每个所述初始图像中的账号内容在垂直方向进行多次迭代削弱处理,获取每次垂直迭代削弱处理后得到的中间图像。
在一个实施例中,所述垂直削弱处理模块还用于对每个所述初始图像中的账号内容在垂直方向上由底向上每次扫描获取预设行数的特征行;通过将每次扫描得到的预设行数的特征行进行背景化实现垂直方向上的迭代削弱处理。
在一个实施例中,所述目标字符间距为每个中间图像对应的最大字符间距;所述筛选模块还用于从多张所述中间图像中获取一张中间图像作为当前中间图像;获取所述当前中间图像对应的当前最大字符间距,若当前最大字符间距小于当前中间值,则将当前最大字符间距作为下一张中间图像的中间值;获取下一张中间图像作为当前中间图像,进入获取当前中间图像对应的当前最大字符间距的步骤,直至遍历完所有中间图像,将最终得到的中间值所对应的中间图像作为目标中间图像。
在一个实施例中,所述确定模块还用于对每个中间图像中的账号内容进行垂直投影,根据垂直投影的结果对所述账号内容进行字符切割,得到切割后与每个中间图像对应的最大字符间距,将最大字符间距作为与每个中间图像对应的目标字符间距。
如图11所示,在一个实施例中,上述字符切割定位装置还包括:
定位模块903,用于获取与所述账号内容对应的定位窗口,所述定位窗口的大小是根据账号内容的长度和宽度确定的,根据所述定位窗口在所述原始图像中定位出所述账号内容的位置。
如图12所示,在一个实施例中,上述字符切割定位装置还包括:
切割识别模块912,用于根据所述目标字符切割位置对所述目标图像中的账号内容进行切割,对切割得到的多个字符进行识别。
图13示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是服务器,也可以是终端。如图13所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现字符切割定位方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行字符切割定位方法。本领域技术人员可以理解,图13中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的字符切割定位方法可以实现为一种计算机程序的形式,计算机程序可在如图13所示的计算机设备上运行。计算机设备的存储器中可存储组成该字符切割定位装置的各个程序模块。比如,获取模块902、削弱处理模块904、确定模块906、筛选模块908和切割位置确定模块910。
在一个实施例中,提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:获取包含有账号内容的目标图像,所述账号内容包括多个字符;对所述账号内容中的字符进行多次迭代削弱处理,获取每次削弱处理后得到的中间图像;对每个中间图像中的账号内容进行字符切割,计算切割后得到的字符间距,确定与每个中间图像对应的目标字符间距;根据每个中间图像对应的目标字符间距筛选出目标切割字符间距,将所述目标切割字符间距对应的中间图像作为目标中间图像;将所述目标中间图像对应的字符切割位置作为目标字符切割位置。
在一个实施例中,所述对所述账号内容中的字符进行多次迭代削弱处理,
获取每次削弱处理后得到的中间图像,包括:采用形态学算法对账号内容中的字符进行水平方向上的多次迭代削弱处理,获取每次水平削弱处理后得到的初始图像;对每个所述初始图像中的账号内容在垂直方向进行多次迭代削弱处理,获取每次垂直迭代削弱处理后得到的中间图像。
在一个实施例中,所述对每个所述初始图像中的账号内容在垂直方向进行多次迭代削弱处理,获取每次垂直迭代削弱处理后得到的中间图像,包括:对每个所述初始图像中的账号内容在垂直方向上由底向上每次扫描获取预设行数的特征行;通过将每次扫描得到的预设行数的特征行进行背景化实现垂直方向上的迭代削弱处理。
在一个实施例中,所述目标字符间距为每个中间图像对应的最大字符间距;所述根据每个中间图像对应的目标字符间距目标切割字符间距,将所述目标切割字符间距对应的中间图像作为目标中间图像,包括:从多张所述中间图像中获取一张中间图像作为当前中间图像;获取所述当前中间图像对应的当前最大字符间距,若当前最大字符间距小于当前中间值,则将当前最大字符间距作为下一张中间图像的中间值;获取下一张中间图像作为当前中间图像,进入获取当前中间图像对应的当前最大字符间距的步骤,直至遍历完所有中间图像,将最终得到的中间值所对应的中间图像作为目标中间图像。
在一个实施例中,所述对每个中间图像中的账号内容进行字符切割,计算切割后得到的字符间距,确定与每个中间图像对应的目标字符间距,包括:对每个中间图像中的账号内容进行垂直投影,根据垂直投影的结果对所述账号内容进行字符切割,得到切割后与每个中间图像对应的最大字符间距,将最大字符间距作为与每个中间图像对应的目标字符间距。
在一个实施例中,在所述获取包含有账号内容的图像之后,所述计算机程序被处理器执行时,还使得处理器执行以下步骤:获取与所述账号内容对应的定位窗口,所述定位窗口的大小是根据账号内容的长度和宽度确定的;根据所述定位窗口在所述原始图像中定位出所述账号内容的位置。
在一个实施例中,所述计算机程序被处理器执行时,还使得处理器执行以下步骤:根据所述目标字符切割位置对所述目标图像中的账号内容进行切割,对切割得到的多个字符进行识别。
在一个实施例中,提出了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:获取包含有账号内容的目标图像,所述账号内容包括多个字符;对所述账号内容中的字符进行多次迭代削弱处理,获取每次削弱处理后得到的中间图像;对每个中间图像中的账号内容进行字符切割,计算切割后得到的字符间距,确定与每个中间图像对应的目标字符间距;根据每个中间图像对应的目标字符间距筛选出目标切割字符间距,将所述目标切割字符间距对应的中间图像作为目标中间图像;将所述目标中间图像对应的字符切割位置作为目标字符切割位置。
在一个实施例中,所述对所述账号内容中的字符进行多次迭代削弱处理,获取每次削弱处理后得到的中间图像,包括:采用形态学算法对账号内容中的字符进行水平方向上的多次迭代削弱处理,获取每次水平削弱处理后得到的初始图像;对每个所述初始图像中的账号内容在垂直方向进行多次迭代削弱处理,获取每次垂直迭代削弱处理后得到的中间图像。
在一个实施例中,所述对每个所述初始图像中的账号内容在垂直方向进行多次迭代削弱处理,获取每次垂直迭代削弱处理后得到的中间图像,包括:对每个所述初始图像中的账号内容在垂直方向上由底向上每次扫描获取预设行数的特征行;通过将每次扫描得到的预设行数的特征行进行背景化实现垂直方向上的迭代削弱处理。
在一个实施例中,所述目标字符间距为每个中间图像对应的最大字符间距;所述根据每个中间图像对应的目标字符间距筛选出目标切割字符间距,将所述目标切割字符间距对应的中间图像作为目标中间图像,包括:从多张所述中间图像中获取一张中间图像作为当前中间图像;获取所述当前中间图像对应的当前最大字符间距,若当前最大字符间距小于当前中间值,则将当前最大字符间距作为下一张中间图像的中间值;获取下一张中间图像作为当前中间图像,进入获取当前中间图像对应的当前最大字符间距的步骤,直至遍历完所有中间图像,将最终得到的中间值所对应的中间图像作为目标中间图像。
在一个实施例中,所述对每个中间图像中的账号内容进行字符切割,计算切割后得到的字符间距,确定与每个中间图像对应的目标字符间距,包括:对每个中间图像中的账号内容进行垂直投影,根据垂直投影的结果对所述账号内容进行字符切割,得到切割后与每个中间图像对应的最大字符间距,将最大字符间距作为与每个中间图像对应的目标字符间距。
在一个实施例中,在所述获取包含有账号内容的图像之后,所述计算机程序被处理器执行时,还使得处理器执行以下步骤:获取与所述账号内容对应的定位窗口,所述定位窗口的大小是根据账号内容的长度和宽度确定的;根据所述定位窗口在所述原始图像中定位出所述账号内容的位置。
在一个实施例中,所述计算机程序被处理器执行时,还使得处理器执行以下步骤:根据所述目标字符切割位置对所述目标图像中的账号内容进行切割,对切割得到的多个字符进行识别。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (9)

1.一种字符切割定位方法,其特征在于,所述方法包括:
获取包含有账号内容的目标图像,所述账号内容包括多个字符;
对所述账号内容中的字符进行多次迭代削弱处理,获取每次削弱处理后得到的中间图像;
对每个中间图像中的账号内容进行字符切割,计算切割后得到的字符间距,确定与每个中间图像对应的目标字符间距;
根据每个中间图像对应的目标字符间距筛选出目标切割字符间距,将所述目标切割字符间距对应的中间图像作为目标中间图像;
将所述目标中间图像对应的字符切割位置作为目标字符切割位置;
其中,所述目标字符间距为每个中间图像对应的最大字符间距;
所述根据每个中间图像对应的目标字符间距筛选出目标切割字符间距,将所述目标切割字符间距对应的中间图像作为目标中间图像,包括:
从多张所述中间图像中获取一张中间图像作为当前中间图像;
获取所述当前中间图像对应的当前最大字符间距,若当前最大字符间距小于当前中间值,则将当前最大字符间距作为下一张中间图像的中间值;若所述当前最大字符间距不小于当前中间值,则继续将当前中间值作为下一张中间图像的中间值;
获取下一张中间图像作为当前中间图像,进入获取当前中间图像对应的当前最大字符间距的步骤,直至遍历完所有中间图像,将最终得到的中间值所对应的中间图像作为目标中间图像。
2.根据权利要求1所述的方法,其特征在于,所述对所述账号内容中的字符进行多次迭代削弱处理,获取每次削弱处理后得到的中间图像,包括:
采用形态学算法对账号内容中的字符进行水平方向上的多次迭代削弱处理,获取每次水平削弱处理后得到的初始图像;
对每个所述初始图像中的账号内容在垂直方向进行多次迭代削弱处理,获取每次垂直迭代削弱处理后得到的中间图像。
3.根据权利要求2所述的方法,其特征在于,所述对每个所述初始图像中的账号内容在垂直方向进行多次迭代削弱处理,获取每次垂直迭代削弱处理后得到的中间图像,包括:
对每个所述初始图像中的账号内容在垂直方向上由底向上每次扫描获取预设行数的特征行;
通过将每次扫描得到的预设行数的特征行进行背景化实现垂直方向上的迭代削弱处理。
4.根据权利要求1所述的方法,其特征在于,所述对每个中间图像中的账号内容进行字符切割,计算切割后得到的字符间距,确定与每个中间图像对应的目标字符间距,包括:
对每个中间图像中的账号内容进行垂直投影,根据垂直投影的结果对所述账号内容进行字符切割,得到切割后与每个中间图像对应的最大字符间距,将最大字符间距作为与每个中间图像对应的目标字符间距。
5.根据权利要求1所述的方法,其特征在于,在所述获取包含有账号内容的图像之后,还包括:
获取与所述账号内容对应的定位窗口,所述定位窗口的大小是根据账号内容的长度和宽度确定的;
根据所述定位窗口在原始图像中定位出所述账号内容的位置。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述目标字符切割位置对所述目标图像中的账号内容进行切割,对切割得到的多个字符进行识别。
7.一种字符切割定位装置,其特征在于,所述装置包括:
获取模块,用于获取包含有账号内容的目标图像,所述账号内容包括多个字符;
削弱处理模块,用于对所述账号内容中的字符进行多次迭代削弱处理,获取每次削弱处理后得到的中间图像;
确定模块,用于对每个中间图像中的账号内容进行字符切割,计算切割后得到的字符间距,确定与每个中间图像对应的目标字符间距;
筛选模块,用于根据每个中间图像对应的目标字符间距筛选出目标切割字符间距,将所述目标切割字符间距对应的中间图像作为目标中间图像;
切割位置确定模块,用于根据所述目标中间图像对应的字符切割位置作为目标字符切割位置;
其中,所述目标字符间距为每个中间图像对应的最大字符间距;所述筛选模块具体用于,从多张所述中间图像中获取一张中间图像作为当前中间图像;获取所述当前中间图像对应的当前最大字符间距,若当前最大字符间距小于当前中间值,则将当前最大字符间距作为下一张中间图像的中间值;若所述当前最大字符间距不小于当前中间值,则继续将当前中间值作为下一张中间图像的中间值;获取下一张中间图像作为当前中间图像,进入获取当前中间图像对应的当前最大字符间距的步骤,直至遍历完所有中间图像,将最终得到的中间值所对应的中间图像作为目标中间图像。
8.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至6中任一项所述方法的步骤。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至6中任一项所述方法的步骤。
CN201810934043.5A 2018-08-16 2018-08-16 字符切割定位方法、装置、计算机设备及存储介质 Active CN110837754B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810934043.5A CN110837754B (zh) 2018-08-16 2018-08-16 字符切割定位方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810934043.5A CN110837754B (zh) 2018-08-16 2018-08-16 字符切割定位方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN110837754A CN110837754A (zh) 2020-02-25
CN110837754B true CN110837754B (zh) 2022-08-30

Family

ID=69573235

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810934043.5A Active CN110837754B (zh) 2018-08-16 2018-08-16 字符切割定位方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN110837754B (zh)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006068269A1 (ja) * 2004-12-24 2006-06-29 Nec Corporation 映像構造化装置及び方法
CN102043959B (zh) * 2010-12-28 2012-09-26 青岛海信网络科技股份有限公司 车牌字符分割方法
CN102521588A (zh) * 2011-12-30 2012-06-27 四川九洲电器集团有限责任公司 一种车牌字符分割方法
CN106446896B (zh) * 2015-08-04 2020-02-18 阿里巴巴集团控股有限公司 一种字符分割方法、装置及电子设备
CN106127207A (zh) * 2016-08-12 2016-11-16 万永秀 车牌字符分割方法
CN106650739B (zh) * 2016-12-09 2020-08-11 浙江浩腾电子科技股份有限公司 一种车牌字符切割新方法
CN106650729B (zh) * 2016-12-09 2019-06-21 浙江浩腾电子科技股份有限公司 一种基于投影的车牌字符切割方法
CN107767531B (zh) * 2017-10-24 2020-01-14 深圳怡化电脑股份有限公司 纸币识别方法及系统
CN108345880B (zh) * 2018-01-26 2021-07-27 金蝶软件(中国)有限公司 发票识别方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN110837754A (zh) 2020-02-25

Similar Documents

Publication Publication Date Title
CN110807491A (zh) 车牌图像清晰度模型训练方法、清晰度检测方法及装置
CN111461170A (zh) 车辆图像检测方法、装置、计算机设备及存储介质
JP7026165B2 (ja) テキスト認識方法及びテキスト認識装置、電子設備、記憶媒体
JP7132050B2 (ja) テキスト行の区分化方法
CN108108734B (zh) 一种车牌识别方法及装置
CN110490190B (zh) 一种结构化图像文字识别方法及系统
CN109471853B (zh) 数据降噪方法、装置、计算机设备和存储介质
CN114529837A (zh) 建筑物轮廓提取方法、系统、计算机设备及存储介质
CN110298858B (zh) 一种图像裁剪方法及装置
CN111259366A (zh) 一种基于自监督学习的验证码识别器的训练方法和装置
CN112529014B (zh) 直线检测方法、信息提取方法、装置、设备及存储介质
CN111368638A (zh) 电子表格的创建方法、装置、计算机设备和存储介质
JP2019102061A5 (zh)
CN112507782A (zh) 文本图像的识别方法及装置
CN111445058A (zh) 数据分析方法、装置、设备及计算机可读存储介质
US8787702B1 (en) Methods and apparatus for determining and/or modifying image orientation
CN111914926A (zh) 基于滑窗的视频抄袭检测方法、装置、设备和介质
CN113963353A (zh) 一种文字图像处理识别方法、装置、计算机设备和存储介质
CN114241463A (zh) 签名验证方法、装置、计算机设备和存储介质
CN114511523A (zh) 基于自监督学习的胃癌分子亚型分类方法及装置
CN110837754B (zh) 字符切割定位方法、装置、计算机设备及存储介质
CN116612498A (zh) 一种鸟类识别模型训练方法、鸟类识别方法、装置及设备
CN108364024B (zh) 图像匹配方法、装置、计算机设备和存储介质
CN110895849A (zh) 冠字号切割定位方法、装置、计算机设备及存储介质
CN115759964A (zh) 一种投标文件通用资格验证的方法、系统及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant