CN117710987A - 冠字号分割方法、装置、电子设备和存储介质 - Google Patents

冠字号分割方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN117710987A
CN117710987A CN202410168513.7A CN202410168513A CN117710987A CN 117710987 A CN117710987 A CN 117710987A CN 202410168513 A CN202410168513 A CN 202410168513A CN 117710987 A CN117710987 A CN 117710987A
Authority
CN
China
Prior art keywords
character
crown word
difference
characters
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410168513.7A
Other languages
English (en)
Inventor
王辉
康松
李果
冯勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Zmvision Technology Co ltd
Original Assignee
Wuhan Zmvision Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Zmvision Technology Co ltd filed Critical Wuhan Zmvision Technology Co ltd
Priority to CN202410168513.7A priority Critical patent/CN117710987A/zh
Publication of CN117710987A publication Critical patent/CN117710987A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Character Input (AREA)

Abstract

本发明提供一种冠字号分割方法、装置、电子设备和存储介质,属于金融机具技术领域,该方法包括:获取第一纸币的冠字号模板和目标二值化图像,目标二值化图像中包括第一纸币的冠字号区域,冠字号模板中至少包括第一纸币的冠字号字符数量、冠字号字符大小、冠字号重心、冠字号高度和冠字号字符间距;基于第一纸币的冠字号字符数量对目标二值化图像包含的字符进行排列组合,获得多个字符组合;分别计算多个字符组合和冠字号模板的重心差、高度差、字符间距差和字符大小差,并基于多个字符组合分别和冠字号模板的重心差、高度差、字符间距差和字符大小差,计算多个字符组合分别对应的分割分值;将分割分值最小的字符组合进行分割,获得分割结果。

Description

冠字号分割方法、装置、电子设备和存储介质
技术领域
本发明涉及金融机具技术领域,尤其涉及一种冠字号分割方法、装置、电子设备和存储介质。
背景技术
相关技术的冠字号分割方法往往要求对冠字号区域的定位精准度高,且对二值化的要求也比较高,从而避免分割时引入各种干扰,而针对冠字号区域或者附近存在背景、花纹、污损等情况,相关技术难以做到很好的分割,从而导致冠字号字符不够干净,影响最后的分割结果,导致冠字号分割精度较低。
发明内容
本发明提供一种冠字号分割方法、装置、电子设备和存储介质,可以降低对冠字号区域的定位及二值化效果的要求,同时又能达到更好的分割效果,提高冠字号分割精度。
本发明提供一种冠字号分割方法,包括:
获取第一纸币的冠字号模板和目标二值化图像,所述目标二值化图像中包括所述第一纸币的冠字号区域,所述冠字号模板中至少包括所述第一纸币的冠字号字符数量、冠字号字符大小、冠字号重心、冠字号高度和冠字号字符间距;
基于所述第一纸币的冠字号字符数量对所述目标二值化图像包含的字符进行排列组合,获得多个字符组合,每个字符组合包含的字符数量与所述第一纸币的冠字号字符数量相同;
分别计算所述多个字符组合和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,并基于所述多个字符组合分别和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,计算所述多个字符组合分别对应的分割分值;
将分割分值最小的字符组合进行分割,获得分割结果。
根据本发明提供的冠字号分割方法,所述分别计算所述多个字符组合和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,包括:
分别计算所述多个字符组合分别对应的最后一个字符和所述冠字号模板的高度差和字符大小差;
分别计算所述多个字符组合分别对应的除了最后一个字符以外的其他字符和所述冠字号模板的高度差、重心差和字符间距差。
根据本发明提供的冠字号分割方法,所述方法还包括:
基于所述多个字符组合分别对应的最后一个字符和所述冠字号模板的高度差和字符大小差,确定所述多个字符组合分别对应的最后一个字符的分割分值;
基于所述多个字符组合分别对应的除了最后一个字符以外的其他字符和所述冠字号模板的高度差、重心差和字符间距差,确定所述多个字符组合分别对应的除了最后一个字符以外的其他字符的分割分值。
根据本发明提供的冠字号分割方法,所述基于所述多个字符组合分别对应的除了最后一个字符以外的其他字符和所述冠字号模板的高度差、重心差和字符间距差,确定所述多个字符组合分别对应的除了最后一个字符以外的其他字符的分割分值,包括:
基于所述多个字符组合分别对应的除了最后一个字符以外的其他字符和所述冠字号模板的重心差和高度差,确定所述多个字符组合分别对应的除了最后一个字符以外的其他字符分别对应的初始分割分值;
基于所述多个字符组合分别对应的除了最后一个字符以外的其他字符分别对应的初始分割分值以及所述冠字号模板的字符间距差,确定所述多个字符组合分别对应的除了最后一个字符以外的其他字符分别对应的分割分值。
根据本发明提供的冠字号分割方法,所述基于所述多个字符组合分别和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,计算所述多个字符组合分别对应的分割分值,包括:
分别将所述多个字符组合分别对应的所有字符的分割分值相加,获得所述多个字符组合分别对应的分割分值。
根据本发明提供的冠字号分割方法,在所述计算所述多个字符组合分别对应的分割分值后,所述方法还包括:
在所述多个字符组合分别对应的分割分值中的最小分割分值与预设最小分值的差值在预设置信范围内的情况下,确定最小分割分值对应的字符组合中最左边的字符和最右边的字符分别与所述冠字号模板的字符大小差;
在所述最小分割分值对应的字符组合中最左边的字符与所述冠字号模板的字符大小差小于预设最大差值,和/或所述最小分割分值对应的字符组合中最右边的字符与所述冠字号模板的字符大小差小于预设最大差值的情况下,将所述预设最小分值更新为最小分割分值。
本发明还提供一种冠字号分割装置,包括:
获取模块,用于获取第一纸币的冠字号模板和目标二值化图像,所述目标二值化图像中包括所述第一纸币的冠字号区域,所述冠字号模板中至少包括所述第一纸币的冠字号字符数量、冠字号字符大小、冠字号重心、冠字号高度和冠字号字符间距;
排列组合模块,用于基于所述第一纸币的冠字号字符数量对所述目标二值化图像包含的字符进行排列组合,获得多个字符组合,每个字符组合包含的字符数量与所述第一纸币的冠字号字符数量相同;
计算模块,用于分别计算所述多个字符组合和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,并基于所述多个字符组合分别和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,计算所述多个字符组合分别对应的分割分值;
分割模块,用于将分割分值最小的字符组合进行分割,获得分割结果。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述冠字号分割方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述冠字号分割方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述冠字号分割方法。
本发明提供的一种冠字号分割方法、装置、电子设备和存储介质,先获取包含字符数量、字符大小、高度、重心和字符间距在内的冠字号模板,然后在二值化图像中的所有字符中,通过递归的方法选择模板中字符数量的备选字符,通过计算重心差、字符间距差、高度差、空白差等特征,递归计算所有可能的字符组合的分割分值,从而将分割分值最小的字符组合进行分割,得到最优的分割结果,可以降低对冠字号区域的定位及二值化效果的要求,同时又能达到更好的分割效果,提高冠字号分割精度。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的冠字号分割方法的流程示意图;
图2是本发明提供的冠字号分割装置的结构示意图;
图3是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
首先对以下内容进行介绍:
相关技术中金融机具产品对纸币冠字号识别率的要求非常高,一般误识别率要求在万三以内。冠字号识别包含了定位、分割和识别等多个步骤,其最大难点在于从复杂的冠字号区域分割得到包含单个字符的小图。相关技术中的分割方法是直接对冠字号区域进行二值化后,通过连通域或者投影的方法,结合预设的字符大小,来分割得到单个字符的小图。而不同的纸币在经过流通以后,会受到不同程度的污损,而且包括美元等外币的冠字号区域附近存在大量花纹或者背景,此时的二值化效果难以保证,这对冠字号的正确分割以及进一步的识别带来了更大的挑战。
下面结合图1描述本发明提供的冠字号分割方法。
图1是本发明提供的冠字号分割方法的流程示意图,如图1所示,该方法包括以下步骤:
步骤100,获取第一纸币的冠字号模板和目标二值化图像,所述目标二值化图像中包括所述第一纸币的冠字号区域,所述冠字号模板中至少包括所述第一纸币的冠字号字符数量、冠字号字符大小、冠字号重心、冠字号高度和冠字号字符间距;
可选地,第一纸币可以是任意币种的纸币,比如人民币,或美元,或欧元,本发明对此不作限定。
可选地,第一纸币可以是任意面额的纸币,比如1元,或5元,或100元,本发明对此不作限定。
可选地,第一纸币的冠字号模板中包含冠字号字符数量n,字符大小数组Size[n],字符间距数组Distance[n-1],字符高度数组Height[n],字符重心数组Space[n-1]。
可选地,第一纸币的冠字号模板中还可以包含其他备选阈值信息OtherInfos,比如字符大小、高度、间距的预设范围,作为参考。
可选地,可以通过一张冠字号区域较为正常干净的第一纸币样本获取第一纸币的冠字号模板,或通过多张第一纸币样本进行统计,获取第一纸币的冠字号模板。
可选地,第一纸币的目标二值化图像可以是任意包含第一纸币的冠字号区域的二值化图像,可以是整个第一纸币的二值化图像,也可以是第一纸币的部分包含冠字号区域的图像,本发明对此不作限定。
可以理解的是,目标二值化图像包含的信息越少,即干扰噪声越少,冠字号分割效率越高。
在本发明的一个实施例中,根据预设的冠字号区域的坐标范围,在第一纸币的对应通道的采样图像中,结合仿射变换旋正冠字号,获得冠字号初定位区域图像,然后对初定位区域图像使用最大类间方差法进行二值化,使用横向和纵向投影,再结合预设的冠字号区域的长度区间、空白区间、高度区间,确定得到第一纸币的目标二值化图像。
步骤110,基于所述第一纸币的冠字号字符数量对所述目标二值化图像包含的字符进行排列组合,获得多个字符组合,每个字符组合包含的字符数量与所述第一纸币的冠字号字符数量相同;
可选地,可以在目标二值化图像中的所有字符中,通过递归的方法选择冠字号模板中字符数量的备选字符,获得多个字符组合。
可选地,可以设置递归次数上限阈值,超过阈值时直接停止计算,考虑到已优先计算连续字符的情况,递归次数上限的设置能大大控制算法效率,避免连通域特别多时导致的计算超时。
可选地,获取第一纸币的冠字号模板和目标二值化图像后,可以基于第一纸币的冠字号字符数量对目标二值化图像包含的字符进行排列组合,获得多个字符组合。
可选地,在对二值化图像包含的字符进行排列组合前,可以根据预设的阈值信息OtherInfos剔除明显异常的连通域区域,剩余得到有效连通域个数,即字符个数T。
可选地,可以在目标二值化图像中任意选取指定的n个字符集t[n],其中t∈T,n为第一纸币的冠字号模板中包含冠字号字符数量,即共有种排列组合。
步骤120,分别计算所述多个字符组合和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,并基于所述多个字符组合分别和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,计算所述多个字符组合分别对应的分割分值;
可选地,重心差为多个字符组合的重心和冠字号模板的重心的差值。
可选地,高度差为多个字符组合的高度和冠字号模板的重心的差值。
可选地,字符间距差为多个字符组合的字符间距和冠字号模板的字符间距的差值。
可选地,字符大小差为多个字符组合的字符大小和冠字号模板的字符大小的差值。
可选地,获得多个字符组合后,可以分别计算多个字符组合和所述冠字号模板的重心差、高度差、间距差和字符大小差,以确定和冠字号模板差距最小的一个字符组合作为冠字号字符。
可选地,可以基于多个字符组合分别和冠字号模板的重心差、高度差、字符间距差和字符大小差,计算多个字符组合分别对应的分割分值,以确定和冠字号模板差距最小的一个字符组合作为冠字号字符。
步骤130,将分割分值最小的字符组合进行分割,获得分割结果。
可选地,可以将分割分值最小的字符组合确定为和冠字号模板差距最小的字符组合,即冠字号字符,然后对其进行分割,获得冠字号分割结果。
本发明提供的冠字号分割方法,先获取包含字符数量、字符大小、高度、重心和字符间距在内的冠字号模板,然后在二值化图像中的所有字符中,通过递归的方法选择模板中字符数量的备选字符,通过计算重心差、字符间距差、高度差、空白差等特征,递归计算所有可能的字符组合的分割分值,从而将分割分值最小的字符组合进行分割,得到最优的分割结果,可以降低对冠字号区域的定位及二值化效果的要求,同时又能达到更好的分割效果,提高冠字号分割精度。
可选地,所述分别计算所述多个字符组合和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,包括:
分别计算所述多个字符组合分别对应的最后一个字符和所述冠字号模板的高度差和字符大小差;
分别计算所述多个字符组合分别对应的除了最后一个字符以外的其他字符和所述冠字号模板的高度差、重心差和字符间距差。
可选地,获得多个字符组合后,为了计算多个字符组合和冠字号模板的重心差、高度差、字符间距差和字符大小差,可以分别遍历多个字符组合,可以是从左往右遍历,也可以是从右往左遍历,最后一个字符可以是按遍历顺序的最后一个字符。
可选地,在遍历过程中,可以计算当前字符与下一字符的重心tSpace、当前字符的高度tHeight、当前字符与下一字符的字符间距tDistance,当前字符的字符大小,然后分别计算每个字符与冠字号模板的重心差、高度差、字符间距差和字符大小差。
可选地,由于遍历到最后只剩下一位字符,无法计算与下一字符的重心及与下一字符的字符间距等核心参数,因此只需要确定最后一个字符和冠字号模板的高度差和字符大小差,以及除了最后一个字符以外的其他字符和冠字号模板的高度差、重心差和字符间距差,方便后续计算多个字符组合分别对应的分割分值。
本发明提供的冠字号分割方法,通过确定多个字符组合中所有字符和冠字号模板的高度差、多个字符组合中最后一个字符和冠字号模板的字符大小差以及多个字符组合中除了最后一个字符以外的其他字符和冠字号模板的重心差和字符间距差,方便后续计算多个字符组合分别对应的分割分值。
可选地,所述方法还包括:
基于所述多个字符组合分别对应的最后一个字符和所述冠字号模板的高度差和字符大小差,确定所述多个字符组合分别对应的最后一个字符的分割分值;
基于所述多个字符组合分别对应的除了最后一个字符以外的其他字符和所述冠字号模板的高度差、重心差和字符间距差,确定所述多个字符组合分别对应的除了最后一个字符以外的其他字符的分割分值。
可选地,为了计算多个字符组合分别对应的分割分值,可以先确定字符组合中所有字符分别对应的分割分值。
可选地,对于最后一个字符,由于无法计算其重心及与下一个字符的字符间距等核心参数,因此可以基于其和冠字号模板的高度差和字符大小差,确定其分割分值。
具体地,可以在最后一个字符与冠字号模板的高度差不为0时,将高度差的绝对值作为最后一个字符的分割分值,在最后一个字符与冠字号模板的高度差为0时,将字符大小差的绝对值作为最后一个字符的分割分值。
可选地,可以基于除最后一个字符以外的其他字符和冠字号模板的重心差、字符间距差和高度差,确定除最后一个字符以外的其他字符的分割分值。
本发明提供的冠字号分割方法,基于多个字符组合分别对应的最后一个字符和冠字号模板的高度差和字符大小差,以及多个字符组合分别对应的除了最后一个字符以外的其他字符和冠字号模板的高度差、重心差和字符间距差,确定多个字符组合分别对应的所有字符的分割分值,便于后续计算多个字符组合分别对应的分割分值。
可选地,所述基于所述多个字符组合分别对应的除了最后一个字符以外的其他字符和所述冠字号模板的高度差、重心差和字符间距差,确定所述多个字符组合分别对应的除了最后一个字符以外的其他字符的分割分值,包括:
基于所述多个字符组合分别对应的除了最后一个字符以外的其他字符和所述冠字号模板的重心差和高度差,确定所述多个字符组合分别对应的除了最后一个字符以外的其他字符分别对应的初始分割分值;
基于所述多个字符组合分别对应的除了最后一个字符以外的其他字符分别对应的初始分割分值以及所述冠字号模板的字符间距差,确定所述多个字符组合分别对应的除了最后一个字符以外的其他字符分别对应的分割分值。
可选地,在遍历过程中,除了最后一个字符以外,可以首先基于字符和冠字号模板的重心差和高度差,确定字符分别对应的初始分割分值。
具体地,可以将字符与冠字号模板的重心差的绝对值,和字符与冠字号模板的高度差的绝对值进行求和,作为字符的初始分割分值。
例如:字符A的重心tSpace与冠字号模板M的重心差的绝对值为s1,字符A的当前高度tHeight与冠字号模板M的高度差的绝对值s2,那么字符A的初始分割分值为s1+s2。
可选地,若字符的高度tHeight小于冠字号模板高度的一半,或低于最小预设高度,或高于最大预设高度,可以给该字符与冠字号模板的高度差赋值为一个极大的数,比如1000,或2000等,以使得后续计算的分割分值极大。
可选地,确定初始分割分值后,可以结合字符和冠字号模板的字符间距差确定最终分割分值。
具体地,计算当前字符与遍历顺序的后一字符的字符间距tDistance,然后计算其与冠字号模板M的字符间距差的绝对值s3,如果s3大于初始分割分值,则使用s3作为当前字符的分割分值,否则将初始分割分值作为分割分值。
可选地,所述基于所述多个字符组合分别和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,计算所述多个字符组合分别对应的分割分值,包括:
分别将所述多个字符组合分别对应的所有字符的分割分值相加,获得所述多个字符组合分别对应的分割分值。
可选地,在确定多个字符组合分别对应的所有字符的分割分值后,可以分别对多个字符组合分别对应的所有字符的分割分值进行求和,获得多个字符组合分别对应的分割分值,然后将分割分值最小的字符组合进行分割,获得分割结果。
例如,某字符组合包含6个字符,6个字符分别对应的分割分值为50、100、150、200、250和300,则该字符组合的分割分值为1050。
本发明提供的冠字号分割方法,通过将多个字符组合分别对应的所有字符的分割分值相加,获得多个字符组合分别对应的分割分值。
可选地,在所述计算所述多个字符组合分别对应的分割分值后,所述方法还包括:
在所述多个字符组合分别对应的分割分值中的最小分割分值与预设最小分值的差值在预设置信范围内的情况下,确定最小分割分值对应的字符组合中最左和最右两个字符分别与所述冠字号模板的字符大小差;
在所述最小分割分值对应的字符组合中最左边的字符与所述冠字号模板的字符大小差小于预设最大差值,和/或所述最小分割分值对应的字符组合中最右边的字符与所述冠字号模板的字符大小差小于预设最大差值的情况下,将所述预设最小分值更新为最小分割分值。
可选地,预设最小分值可以根据实际需求设定,可以是500,或1000,或1500,本发明对此不作限定。
可选地,在获得多个字符组合分别对应的分割分值,可以将最小的分割分值与预设最小分值进行比较,如果最小的分割分值小于预设最小分值,则可以将预设最小分值更新为最小的分割分值,并记录当前的备选字符集的所有坐标信息。
可选地,考虑到实际噪声往往存在于冠字号区域的两边,而不是中间,因此需要判定最左和最右两个字符分别与冠字号模板M中的字符大小的差值,从而确定是否更新预设最小分值。
具体地,如果最小的分割分值和预设最小分值的差值在预设置信范围内,则需要判定最左和最右两个字符分别与冠字号模板M中的字符大小的差值,在最左边的字符与冠字号模板的字符大小差小于预设最大差值,和/或最右边的字符与冠字号模板的字符大小差小于预设最大差值的情况下,将预设最小分值更新为最小分割分值。
可选地,预设最大差值可以是冠字号模板字符大小的两倍,或其他任意差值,本发明对此不作限定。
本发明提供的冠字号分割方法,首先判断最小分割分值与预设最小分值的差值在预设置信范围内,然后基于最小分割分值对应的字符组合中最左和最右两个字符分别与冠字号模板的字符大小差的置信度,将预设最小分值更新为最小分割分值。
下面对本发明提供的冠字号分割装置进行描述,下文描述的冠字号分割装置与上文描述的冠字号分割方法可相互对应参照。
图2是本发明提供的冠字号分割装置200的结构示意图,如图2所示,该装置200包括获取模块210、排列组合模块220、计算模块230和分割模块240,其中:
获取模块210,用于获取第一纸币的冠字号模板和目标二值化图像,所述目标二值化图像中包括所述第一纸币的冠字号区域,所述冠字号模板中至少包括所述第一纸币的冠字号字符数量、冠字号字符大小、冠字号重心、冠字号高度和冠字号字符间距;
排列组合模块220,用于基于所述第一纸币的冠字号字符数量对所述目标二值化图像包含的字符进行排列组合,获得多个字符组合,每个字符组合包含的字符数量与所述第一纸币的冠字号字符数量相同;
计算模块230,用于分别计算所述多个字符组合和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,并基于所述多个字符组合分别和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,计算所述多个字符组合分别对应的分割分值;
分割模块240,用于将分割分值最小的字符组合进行分割,获得分割结果。
本发明提供的冠字号分割装置,先获取包含字符数量、字符大小、高度、重心和字符间距在内的冠字号模板,然后在二值化图像中的所有字符中,通过递归的方法选择模板中字符数量的备选字符,通过计算重心差、字符间距差、高度差、空白差等特征,递归计算所有可能的字符组合的分割分值,从而将分割分值最小的字符组合进行分割,得到最优的分割结果,可以降低对冠字号区域的定位及二值化效果的要求,同时又能达到更好的分割效果,提高冠字号分割精度。
可以理解的是,本发明提供的冠字号分割装置与上述各实施例提供的冠字号分割方法相对应,本发明提供的冠字号分割装置的相关技术特征可参考上述各实施例提供的冠字号分割方法的相关技术特征,在此不再赘述。
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)310、通信接口(Communications Interface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行冠字号分割方法,该方法包括:获取第一纸币的冠字号模板和目标二值化图像,所述目标二值化图像中包括所述第一纸币的冠字号区域,所述冠字号模板中至少包括所述第一纸币的冠字号字符数量、冠字号字符大小、冠字号重心、冠字号高度和冠字号字符间距;基于所述第一纸币的冠字号字符数量对所述目标二值化图像包含的字符进行排列组合,获得多个字符组合,每个字符组合包含的字符数量与所述第一纸币的冠字号字符数量相同;分别计算所述多个字符组合和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,并基于所述多个字符组合分别和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,计算所述多个字符组合分别对应的分割分值;将分割分值最小的字符组合进行分割,获得分割结果。
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的冠字号分割方法,该方法包括:获取第一纸币的冠字号模板和目标二值化图像,所述目标二值化图像中包括所述第一纸币的冠字号区域,所述冠字号模板中至少包括所述第一纸币的冠字号字符数量、冠字号字符大小、冠字号重心、冠字号高度和冠字号字符间距;基于所述第一纸币的冠字号字符数量对所述目标二值化图像包含的字符进行排列组合,获得多个字符组合,每个字符组合包含的字符数量与所述第一纸币的冠字号字符数量相同;分别计算所述多个字符组合和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,并基于所述多个字符组合分别和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,计算所述多个字符组合分别对应的分割分值;将分割分值最小的字符组合进行分割,获得分割结果。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的冠字号分割方法,该方法包括:获取第一纸币的冠字号模板和目标二值化图像,所述目标二值化图像中包括所述第一纸币的冠字号区域,所述冠字号模板中至少包括所述第一纸币的冠字号字符数量、冠字号字符大小、冠字号重心、冠字号高度和冠字号字符间距;基于所述第一纸币的冠字号字符数量对所述目标二值化图像包含的字符进行排列组合,获得多个字符组合,每个字符组合包含的字符数量与所述第一纸币的冠字号字符数量相同;分别计算所述多个字符组合和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,并基于所述多个字符组合分别和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,计算所述多个字符组合分别对应的分割分值;将分割分值最小的字符组合进行分割,获得分割结果。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种冠字号分割方法,其特征在于,包括:
获取第一纸币的冠字号模板和目标二值化图像,所述目标二值化图像中包括所述第一纸币的冠字号区域,所述冠字号模板中至少包括所述第一纸币的冠字号字符数量、冠字号字符大小、冠字号重心、冠字号高度和冠字号字符间距;
基于所述第一纸币的冠字号字符数量对所述目标二值化图像包含的字符进行排列组合,获得多个字符组合,每个字符组合包含的字符数量与所述第一纸币的冠字号字符数量相同;
分别计算所述多个字符组合和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,并基于所述多个字符组合分别和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,计算所述多个字符组合分别对应的分割分值;
基于所述多个字符组合分别对应的分割分值中分割分值最小的字符组合进行分割,获得分割结果。
2.根据权利要求1所述的冠字号分割方法,其特征在于,所述分别计算所述多个字符组合和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,包括:
分别计算所述多个字符组合分别对应的最后一个字符和所述冠字号模板的高度差和字符大小差;
分别计算所述多个字符组合分别对应的除了最后一个字符以外的其他字符和所述冠字号模板的高度差、重心差和字符间距差。
3.根据权利要求2所述的冠字号分割方法,其特征在于,所述方法还包括:
基于所述多个字符组合分别对应的最后一个字符和所述冠字号模板的高度差和字符大小差,确定所述多个字符组合分别对应的最后一个字符的分割分值;
基于所述多个字符组合分别对应的除了最后一个字符以外的其他字符和所述冠字号模板的高度差、重心差和字符间距差,确定所述多个字符组合分别对应的除了最后一个字符以外的其他字符的分割分值。
4.根据权利要求3所述的冠字号分割方法,其特征在于,所述基于所述多个字符组合分别对应的除了最后一个字符以外的其他字符和所述冠字号模板的高度差、重心差和字符间距差,确定所述多个字符组合分别对应的除了最后一个字符以外的其他字符的分割分值,包括:
基于所述多个字符组合分别对应的除了最后一个字符以外的其他字符和所述冠字号模板的重心差和高度差,确定所述多个字符组合分别对应的除了最后一个字符以外的其他字符分别对应的初始分割分值;
基于所述多个字符组合分别对应的除了最后一个字符以外的其他字符分别对应的初始分割分值以及所述冠字号模板的字符间距差,确定所述多个字符组合分别对应的除了最后一个字符以外的其他字符分别对应的分割分值。
5.根据权利要求3所述的冠字号分割方法,其特征在于,所述基于所述多个字符组合分别和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,计算所述多个字符组合分别对应的分割分值,包括:
分别将所述多个字符组合分别对应的所有字符的分割分值相加,获得所述多个字符组合分别对应的分割分值。
6.根据权利要求1所述的冠字号分割方法,其特征在于,在所述计算所述多个字符组合分别对应的分割分值后,所述方法还包括:
在所述多个字符组合分别对应的分割分值中的最小分割分值与预设最小分值的差值在预设置信范围内的情况下,确定最小分割分值对应的字符组合中最左边的字符和最右边的字符分别与所述冠字号模板的字符大小差;
在所述最小分割分值对应的字符组合中最左边的字符与所述冠字号模板的字符大小差小于预设最大差值,和/或所述最小分割分值对应的字符组合中最右边的字符与所述冠字号模板的字符大小差小于预设最大差值的情况下,将所述预设最小分值更新为最小分割分值。
7.一种冠字号分割装置,其特征在于,包括:
获取模块,用于获取第一纸币的冠字号模板和目标二值化图像,所述目标二值化图像中包括所述第一纸币的冠字号区域,所述冠字号模板中至少包括所述第一纸币的冠字号字符数量、冠字号字符大小、冠字号重心、冠字号高度和冠字号字符间距;
排列组合模块,用于基于所述第一纸币的冠字号字符数量对所述目标二值化图像包含的字符进行排列组合,获得多个字符组合,每个字符组合包含的字符数量与所述第一纸币的冠字号字符数量相同;
计算模块,用于分别计算所述多个字符组合和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,并基于所述多个字符组合分别和所述冠字号模板的重心差、高度差、字符间距差和字符大小差,计算所述多个字符组合分别对应的分割分值;
分割模块,用于将分割分值最小的字符组合进行分割,获得分割结果。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述冠字号分割方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述冠字号分割方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述冠字号分割方法。
CN202410168513.7A 2024-02-06 2024-02-06 冠字号分割方法、装置、电子设备和存储介质 Pending CN117710987A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410168513.7A CN117710987A (zh) 2024-02-06 2024-02-06 冠字号分割方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410168513.7A CN117710987A (zh) 2024-02-06 2024-02-06 冠字号分割方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN117710987A true CN117710987A (zh) 2024-03-15

Family

ID=90157468

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410168513.7A Pending CN117710987A (zh) 2024-02-06 2024-02-06 冠字号分割方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN117710987A (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103679918A (zh) * 2014-01-06 2014-03-26 成都术有科技有限公司 一种基于dsp的高速纸币冠字号码提取及识别方法
CN104616009A (zh) * 2015-02-13 2015-05-13 广州广电运通金融电子股份有限公司 一种字符切割识别方法
JP2017097785A (ja) * 2015-11-27 2017-06-01 グローリー株式会社 紙幣処理装置及び紙幣処理方法
CN106874909A (zh) * 2017-01-18 2017-06-20 深圳怡化电脑股份有限公司 一种图像字符的识别方法及其装置
RU2707320C1 (ru) * 2019-06-20 2019-11-26 Общество С Ограниченной Ответственностью "Конструкторское Бюро "Дорс" (Ооо "Кб "Дорс") Способ распознавания символа на банкноте и сопроцессор для вычислительной системы устройства для обработки банкнот
CN110895849A (zh) * 2018-09-13 2020-03-20 深圳怡化电脑股份有限公司 冠字号切割定位方法、装置、计算机设备及存储介质
CN112560449A (zh) * 2021-02-23 2021-03-26 北京远鉴信息技术有限公司 一种文本质量的检测方法、装置、电子设备及存储介质
JP2021163231A (ja) * 2020-03-31 2021-10-11 ローレルバンクマシン株式会社 紙葉類識別装置および紙葉類識別方法
CN113673511A (zh) * 2021-07-30 2021-11-19 苏州鼎纳自动化技术有限公司 一种基于ocr的字符分割方法
CN117058805A (zh) * 2023-07-06 2023-11-14 中银金融科技有限公司 纸币图像处理方法及系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103679918A (zh) * 2014-01-06 2014-03-26 成都术有科技有限公司 一种基于dsp的高速纸币冠字号码提取及识别方法
CN104616009A (zh) * 2015-02-13 2015-05-13 广州广电运通金融电子股份有限公司 一种字符切割识别方法
JP2017097785A (ja) * 2015-11-27 2017-06-01 グローリー株式会社 紙幣処理装置及び紙幣処理方法
CN106874909A (zh) * 2017-01-18 2017-06-20 深圳怡化电脑股份有限公司 一种图像字符的识别方法及其装置
CN110895849A (zh) * 2018-09-13 2020-03-20 深圳怡化电脑股份有限公司 冠字号切割定位方法、装置、计算机设备及存储介质
RU2707320C1 (ru) * 2019-06-20 2019-11-26 Общество С Ограниченной Ответственностью "Конструкторское Бюро "Дорс" (Ооо "Кб "Дорс") Способ распознавания символа на банкноте и сопроцессор для вычислительной системы устройства для обработки банкнот
JP2021163231A (ja) * 2020-03-31 2021-10-11 ローレルバンクマシン株式会社 紙葉類識別装置および紙葉類識別方法
CN112560449A (zh) * 2021-02-23 2021-03-26 北京远鉴信息技术有限公司 一种文本质量的检测方法、装置、电子设备及存储介质
CN113673511A (zh) * 2021-07-30 2021-11-19 苏州鼎纳自动化技术有限公司 一种基于ocr的字符分割方法
CN117058805A (zh) * 2023-07-06 2023-11-14 中银金融科技有限公司 纸币图像处理方法及系统

Similar Documents

Publication Publication Date Title
CN108197644A (zh) 一种图像识别方法和装置
CN111429359B (zh) 小面积指纹图像拼接方法、装置、设备及存储介质
CN110490190B (zh) 一种结构化图像文字识别方法及系统
CN114862861B (zh) 基于少样本学习的肺叶分割方法和装置
CN107563386A (zh) 元器件验证方法、装置、设备与计算机可读存储介质
CN111311497B (zh) 一种条形码图像角度校正方法和装置
CN113361567B (zh) 图像处理方法、装置、电子设备和存储介质
CN115909353A (zh) 一种图像二值化处理方法和装置
CN107992785B (zh) 模糊车牌的识别方法及装置
CN112200789B (zh) 一种图像识别的方法及装置、电子设备和存储介质
CN111898408B (zh) 一种快速人脸识别方法及装置
CN111488811B (zh) 人脸识别方法、装置、终端设备及计算机可读介质
CN113496215A (zh) 一种活体人脸检测的方法、装置及电子设备
CN117710987A (zh) 冠字号分割方法、装置、电子设备和存储介质
CN117058805A (zh) 纸币图像处理方法及系统
CN116934698A (zh) 一种基于语义编辑的皮肤病变图像分割方法及系统
CN114764788B (zh) 一种颅内动脉狭窄检测方法及系统
CN115984178A (zh) 伪造图像检测方法、电子设备和计算机可读存储介质
CN110276353B (zh) 冠字号字符切分方法、装置、可读存储介质及终端设备
CN111753723B (zh) 一种基于密度校准的指纹识别方法及装置
CN108510636A (zh) 图像分割方法、图像分割装置及终端设备
CN113554685A (zh) 遥感卫星运动目标检测方法、装置、电子设备及存储介质
CN113744158A (zh) 图像生成方法、装置、电子设备和存储介质
CN108960222B (zh) 图像二值化方法、装置、设备及存储介质
CN115984863B (zh) 图像处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination