CN107437294B - 一种字符分割方法、装置、设备及存储介质 - Google Patents
一种字符分割方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN107437294B CN107437294B CN201710647345.XA CN201710647345A CN107437294B CN 107437294 B CN107437294 B CN 107437294B CN 201710647345 A CN201710647345 A CN 201710647345A CN 107437294 B CN107437294 B CN 107437294B
- Authority
- CN
- China
- Prior art keywords
- column
- segmentation
- character
- value
- binary image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07D—HANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
- G07D7/00—Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
- G07D7/20—Testing patterns thereon
- G07D7/2016—Testing patterns thereon using feature extraction, e.g. segmentation, edge detection or Hough-transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
本发明实施例公开了一种字符分割方法、装置、设备及存储介质,其中,方法包括:对待分割字符图像进行二值化,获得二值图像;在二值图像上逐列移动设定分割模板,顺序遍历连续的第一设定数值行,获得遍历结果;根据遍历结果,确定二值图像中字符的列位置、上边界和共同下边界;根据列位置、上边界和共同下边界,从二值图像中分割字符。本发明技术方案,在确定字符在二值图像中的上边界和共同下边界的同时,也确定了字符的在二值图像中的列位置,相对于现有技术,在字符分割时运算速度快,并且在遍历扫描过程中均加以防噪声处理,可有效排除字符污损等噪声的影响,提高字符分割的准确度。
Description
技术领域
本发明实施例涉及图像处理技术,尤其涉及一种字符分割方法、装置、设备及存储介质。
背景技术
通过检测识别冠字号,可鉴别出纸币的真伪,而冠字号识别的首要步骤就是分割冠字号中的单个字符,分割的精度直接决定了后续冠字号字符识别的精度,因此准确地分割冠字号字符具有非常重要的意义。
纸币在流通过程时,难免会对冠字号字符造成污损,而现有字符分割方法容易受到污损噪声影响,易导致字符分割不准确,并且现有字符分割方法对字体大小渐变的冠字号进行字符分割时,运算速度慢。
发明内容
为解决相关技术问题,本发明提供一种字符分割方法、装置、设备及存储介质,受污损等噪声影响小,字符分割准确度高且运算速度快。
为实现上述目的,本发明实施例采用如下技术方案:
第一方面,本发明实施例提供了一种字符分割方法,包括:
对待分割字符图像进行二值化,获得二值图像;
在所述二值图像上逐列移动设定分割模板,顺序遍历连续的第一设定数值行,获得遍历结果;
根据所述遍历结果,确定所述二值图像中字符的列位置、上边界和共同下边界;
根据所述列位置、上边界和共同下边界,从所述二值图像中分割所述字符。
第二方面,本发明实施例提供了一种字符分割装置,包括:
二值化模块,用于对待分割字符图像进行二值化,获得二值图像;
遍历模块,用于在所述二值图像上逐列移动设定分割模板,顺序遍历连续的第一设定数值行,获得遍历结果;
边界确定模块,用于根据所述遍历结果,确定所述二值图像中字符的列位置、上边界和共同下边界;
字符分割模块,用于根据所述列位置、上边界和共同下边界,从所述二值图像中分割所述字符。
第三方面,本发明实施例提供了一种字符分割设备,其特征在于,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所述的字符分割方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本发明任意实施例所述的字符分割方法。
本发明实施例提供的技术方案带来的有益效果:
本发明技术方案,以设定分割模板对二值图像进行行与列的遍历扫描,确定二值图像中字符的列位置、上边界和共同下边界,在确定字符在二值图像中的上边界和共同下边界的同时,也确定了字符的在二值图像中的列位置,相对于现有技术,在字符分割时运算速度快,并且在遍历扫描过程中均加以防噪声处理,可有效排除字符污损等噪声的影响,提高字符分割的准确度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据本发明实施例的内容和这些附图获得其他的附图。
图1是本发明实施例提供的一种字符分割方法的流程示意图;
图2是本发明实施例提供的对二值图像扫描之前的初始状态示意图;
图3是本发明实施例提供的对二值图像扫描过程中的状态示意图;
图4是本发明实施例提供对二值图像扫描确定字符边界时的状态示意图;
图5是本发明实施例提供的对二值图像进行行与列遍历扫描时的流程示意图;
图6是本发明实施例提供的确定字符边界的流程示意图;
图7是本发明实施例提供的一种字符分割装置的架构示意图;
图8是本发明实施例提供的一种字符分割设备的结构示意图。
具体实施方式
为使本发明解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面将结合附图对本发明实施例的技术方案作进一步的详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例提供的一种字符分割方法的流程示意图,本实施例的方法可适用于字符识别过程中分割字符的情况,例如纸币冠字号识别过程中分割冠字号字符;该方法可以由字符分割装置来执行,例如具有计算功能和处理功能的设备(ATM机、验钞机等)。如图1所示,本实施例提供的方法可以包括如下步骤:
S110、对待分割字符图像进行二值化,获得二值图像。
在一个实施例中,待分割字符图像优选为纸币的冠字号区域图像,可以采用otsu算法或者百分比算法等对冠字号区域图像进行二值化处理,获得相应的二值图像。在其他实施例中,待分割字符图像也可以是车牌上的车牌号区域图像,或其它包含字符的图像区域。
S120、在二值图像上逐列移动设定分割模板,顺序遍历连续的第一设定数值行,获得遍历结果。
示例性的,不同版本、不同币种及不同面额的纸币的设定分割模板通常不同,以面额为100港元的2010版港币为例来说,冠字号区域图像的尺寸为200*50,则二值图像的尺寸为200*50,即宽度为200,高度为50,相应的设定分割模板可以为{0,20,40,60,83,107,134,167,192},表示相应冠字号区域图像上8个字符的9个列分割位置,其中,二值图像的尺寸及设定分割模板均为先验信息。
在一个实施例中,对二值图像扫描之前的初始状态如图2所示;在扫描过程中,如图3所示,对于连续的第一设定数值行,在行方向上从二值图像的左方开始逐列向右移动设定分割模板,在列方向上从二值图像的下方开始逐行向上移动设定分割模板。在对二值图像执行行与列的遍历扫描过程中,还加以防噪声处理,保证了确定字符列位置和行边界的准确性,行边界即为字符的上边界和共同下边界。
S130、根据遍历结果,确定二值图像中字符的列位置、上边界和共同下边界。
示例性的,在对二值图像中进行行与列的遍历扫描过程中,当设定分割模板移动到如图4所示的位置处时,设定分割模板上列分割位置所在列即为字符的列位置,设定分割模板的下边缘所在行即为字符的共同下边界,根据字符的列位置和共同下边界确定字符的上边界。
S140、根据列位置、上边界和共同下边界,从二值图像中分割字符。
综上,在本实施例中,以设定分割模板对二值图像进行行与列的遍历扫描,确定二值图像中字符的列位置、上边界和共同下边界,在确定字符在二值图像中的上边界和共同下边界的同时,也确定了字符的在二值图像中的列位置,相对于现有技术,在字符分割时运算速度快,并且在遍历扫描过程中均加以防噪声处理,可有效排除字符污损等噪声的影响,提高字符分割的准确度。
请参考图5,本实施例在上述实施例的基础上,可选的,所述设定分割模板的宽度不小于所述二值图像的宽度;所述第一设定数值与所述字符的最小标准高度值h相等。
可选的,所述在所述二值图像上逐列移动设定分割模板,顺序遍历连续的第一设定数值行,获得遍历结果,包括:
对于所述二值图像上连续的h行,在行方向上按第一设定方向逐列移动所述设定分割模板,进行列扫描;
获得多个第一特征值,其中,所述第一特征值为所述设定分割模板中,每个列分割位置所在列上前景点数的和值;
当所述第一特征值取最小值,并且所述设定分割模板中任意两个列分割位置之间包含的前景点数大于第二设定数值时,记录对应的最佳列分割位置,并计算对应的第二特征值,其中,所述第二特征值为所述二值图像中,标准高度值为h的所有字符的高度和值;
在列方向上按第二设定方向逐行移动所述设定分割模板,重复所述列扫描的操作,获得多个所述最佳列分割位置和多个所述第二特征值。
基于上述优化,如图5所示,本发明实施例提供的对二值图像进行行与列遍历扫描时的流程,具体可以包括如下步骤:
S521、对于二值图像上连续的h行,在行方向上按第一设定方向逐列移动设定分割模板,进行列扫描。
S522、获得多个第一特征值。
其中,第一特征值为设定分割模板中,每个列分割位置所在列上前景点数的和值。
S523、当第一特征值取最小值,并且设定分割模板中任意两个列分割位置之间包含的前景点数大于第二设定数值时,记录对应的最佳列分割位置,并计算对应的第二特征值。
其中,第二特征值为二值图像中,标准高度值为h所对应字符的高度和值。即在一次列扫描过程中,当设定分割模板移动到最佳列分割位置时,计算二值图像中最小标准高度对应字符的高度和值。
在一个实施例中,以面额为100港元的2010版港币为例来说,二值图像的尺寸为200*50,如图2所示,设定分割模板的宽度不小于二值图像的宽度200,第一设定数值与字符的最小标准高度值h相等,h必然小于二值图像的高度50,在本实施例中h即2中虚线到设定分割模板下边缘的距离,取值为20,二值图像中的白色区域为前景部分,黑色区域为背景部分,其中,前景部分除了字符区域外,还包括噪声区域(如图2中二值图像上边缘附近的污损噪声,和下边缘附近的盲文噪声等)。
对于二值图像上的第1~20行,在行方向上按从左往右的方向逐列移动设定分割模板,在行方向上,每移动一次设定分割模板,则统计9个列分割位置所在列上的前景点数的和值,即获得相应的第一特征值,在逐列移动设定分割模板后,可获得多个第一特征值,多个第一特征值中必然存在一个最小第一特征值aiRow[1]。在其它实施例中,所述第一设定方向也可以为从右往左。
当设定分割模板在行方向上从左往右移动到图4所示的位置处时,相应的第一特征值最小,记最小第一特征值为aiRow[1],并且保证了设定分割模板中任意两个列分割位置之间包含的前景点数大于第二设定数值(例如20),记录此时设定分割模板上每个列分割位置所在列作为最佳列分割位置,同时计算前3个字符的高度和值(本实施例中前3个字符标准高度值最小,均为20),获得第二特征值。需要说明的是,由于噪声在二值图像中也表现为前景,为避免噪声影响,本实施例中的第二设定数值不宜过小,例如不能设置为0、1和2等数值,在其它实施例中要求第二设定数值大于5。
S524、在列方向上按第二设定方向逐行移动设定分割模板,重复S521~S523的列扫描的操作,获得多个最佳列分割位置和多个第二特征值。
示例性的,在对第1~20行逐列移动扫描结束后,按从二值图像的下方往上的方向,继续对第2~21行执行与上述S510~S530相同的列扫描操作,获得相应的最小第一特征值aiRow[2]、最佳列分割位置和第二特征值;……;最后对第31~50行执行与上述S510~S530相同的列扫描操作,获得相应的最小第一特征值aiRow[31]、最佳列分割位置和第二特征值,由此可分别获得31个最佳列分割位置和31个第二特征值,作为行与列遍历扫描的遍历结果。在其它实施例中,第二设定方向也可以是由上往下的方向。
根据获取的31个最佳列分割位置和31个第二特征值,可确定二值图像中字符的列位置和共同下边界,再根据二值图像每个位置上字符对应的标准高度值(先验信息),可进一步确定字符的上边界,在确定字符的上边界和共同下边界的同时,也确定了字符的列位置。最后,根据字符的上边界、共同下边界和列位置,从二值图像中分割出全部字符。
为进一步从遍历结果中预先排除掉大部分候选情况,进一步提高算速度,在上述实施例的基础上,进行如下优化操作:
优选的,所述S522中,获得多个第一特征值,可以优化为:若设定分割模板中任意两个列分割位置之间包含的前景点数大于第二设定数值的条件不满足,则将第一特征值赋值为最大值max。
优选的,所述S523中,计算对应的第二特征值,可以优化为:在连续的h行中,若前景点数小于第三设定数值对应的行数量值大于第四设定数值,则将第二特征值赋值为0,其中,第四设定数值小于h。
在一个实施例中,若在行方向上移动设定分割模板时,若任意两个列分割位置之间包含的前景点数大于第二设定数值(例如20)的条件不满足,说明存在至少两个列分割位置之间没有字符,将对应的第一特征值赋值为最大值max。这就说明在行方向上,设定分割模板还没有移动到接近图4中所示的位置,此时直接将第一特征值赋值为最大值max,即可排除大部分在行方向上与图4所示位置相差较远的情况,而剩下的在行方向上与图4所示位置较接近的情况只是少数,只需要从这少数几种情况对应的第一特征值中找出最小第一特征值aiRow即可。通过这个优化操作,可快速确定最小第一特征值aiRow,提高了运算速度。
对于连续的h行,在确定最小第一特征值aiRow时,同时记录对应的最佳列分割位置,并计算对应的第二特征值。在计算第二特征值时,统计该连续的20行中每一行上的前景点数,若某一行对应的前景点数小于第三设定数值(例如10),则认为该行与二值图像中的字符不相交,进一步的,如果连续的20行中超过第四设定数值行(例如超过5行)被判定为与二值图像中的字符不相交,则可以认为设定分割模板在列方向上与图4所示的位置相差较远,直接将对应的第二特征值赋值为0;如果连续的20行中被判定为与二值图像中的字符不相交的行数量不超过第四设定数值行(例如超过5行),则说明此时设定分割模板在列方向上的位置,接近于图4所示的位置,此时计算真实的第二特征值,即计算二值图像中标准高度值最小的所有字符的高度和值,在本实施例中,第二特征和值为二值图像中前3个字符(前3个字符的标准高度最小)的高度和值。这样在设定分割模板在列方向上连续遍历20行时,即可排除大部分在列方向上与图4所示位置相差较远的情况,而剩下的在列方向上与图4所示位置较接近的情况只是少数,只需要从这少数几种情况对应的第二特征值中找到最大的第二特征值即可。通过这个优化操作,可快速确定最佳列分割位置和最大的第二特征值,进一步提高了运算速度。
需要说明的是,考虑到噪声在二值图像中也体现为前景,在判定某一行与字符不相交时,不能以该行上的前景点数为0作为判定依据,而是以对应的前景点数小于第三设定数值(例如10)作为判定依据,以避免噪声因素的影响。
在一个实施例中,对于尺寸为200*50的二值化图像,在对其顺序遍历连续的20行时,可获得31个最小第一特征值,对应记录31个最佳列分割位置,以及对应计算获得31个第二特征值。在经过上述两个优化操作后,大部分情况被排除,需要考虑的最小第一特征值、最佳列分割位置以及第二特征值,均只剩下少数情况,有效提高了运算速度。
综上,在本实施例中,提供了一种对二值图像进行行与列遍历扫描的具体实施方式,进一步优化了行扫描与列扫描操作,预先排除多数候选情况,有效提高了字符分割时的运算速度,并且在列扫描和行扫描过程中均加以防噪声处理,可有效排除字符污损等噪声的影响,提高字符分割的准确度。
请参考图6,本实施例在上述实施例的基础上,可选的,所述S130根据遍历结果,确定所述二值图像中字符的列位置、上边界和共同下边界,具体可以包括如下步骤:
S631、从多个第二特征值中选取最大值,取此时设定分割模板下边缘所在行作为字符的共同下边界。
S632、根据与最大第二特征值对应的最佳列分割位置确定字符的列位置。
S633、根据字符的列位置,确定字符的标准高度值。
S634、根据共同下边界和字符的标准高度值,确定字符的上边界。
在一个实施例中,第二特征值即为二值图像中前3个字符的高度和值,在列方向上移动设定分割模板时,这个高度和值也是变化的,当第二特征值取最大值时,表示设定分割模板移动到了图4所示的位置,确定此时对应的最佳列分割位置,即可确定二值图像中每个字符的列位置,根据此时设定分割模板下边缘的位置即可确定字符的共同下边界。而由于二值图像每个位置上字符的标准高度值都是先验信息,因此,根据每个字符的列位置,可以确定每个字符对应的标准高度值,由标准高度值和共同下边界,可确定每个字符的上边界。根据字符的上边界、共同下边界和列位置,从二值图像中分割出全部字符。
在上述实施例的基础上,可选的,在所述S110对待分割字符图像进行二值化之前,还包括如下步骤:
根据标准冠字号区域图像,获得不同位置处字符的标准高度值和设定分割模板;
从目标纸币图像中截取冠字号区域图像,作为待分割字符图像。
请参考图7,本实施例提供的一种字符分割装置,用于执行上述实施例提供的字符分割方法,具备执行方法相应的功能模块和有益效果。如图7所示,所述装置700可以包括:二值化模块710、遍历模块720、边界确定模块730和字符分割模块740,其中:
二值化模块710,用于对待分割字符图像进行二值化,获得二值图像。
遍历模块720,用于在二值图像上逐列移动设定分割模板,顺序遍历连续的第一设定数值行,获得遍历结果。
边界确定模块730,用于根据遍历结果,确定二值图像中字符的列位置、上边界和共同下边界。
字符分割模块740,用于根据列位置、上边界和共同下边界,从二值图像中分割字符。
综上,在本实施例中,以设定分割模板对二值图像进行行与列的遍历扫描,确定二值图像中字符的列位置、上边界和共同下边界,在确定字符在二值图像中的上边界和共同下边界的同时,也确定了字符的在二值图像中的列位置,相对于现有技术,在字符分割时运算速度快,并且在列扫描和行扫描中均加以防噪声处理,可有效排除字符污损等噪声的影响,提高字符分割的准确度。
在上述实施例的基础上,设定分割模板的宽度不小于二值图像的宽度;第一设定数值与字符的最小标准高度值h相等。
在上述实施例的基础上,遍历模块720,具体用于:
对于二值图像上连续的h行,在行方向上按第一设定方向逐列移动设定分割模板,进行列扫描;
获得多个第一特征值,其中,第一特征值为设定分割模板中,每个列分割位置所在列上前景点数的和值;
当第一特征值取最小值,并且设定分割模板中任意两个列分割位置之间包含的前景点数大于第二设定数值时,记录对应的最佳列分割位置,并计算对应的第二特征值,其中,第二特征值为二值图像中,标准高度值为h的所有字符的高度和值;
在列方向上按第二设定方向逐行移动设定分割模板,重复列扫描的操作,获得多个最佳列分割位置和多个第二特征值。
在上述实施例的基础上,所述获得多个第一特征值,包括:若所述设定分割模板中任意两个列分割位置之间包含的前景点数大于第二设定数值的条件不满足,则将所述第一特征值赋值为最大值max;
所述计算对应的第二特征值,包括:在连续的h行中,若前景点数小于第三设定数值对应的行数量值大于第四设定数值,则将所述第二特征值赋值为0,其中,所述第四设定数值小于h。
在上述实施例的基础上,边界确定模块730,具体用于:
从多个第二特征值中选取最大值,取此时设定分割模板下边缘所在行作为字符的共同下边界;
根据与最大第二特征值对应的最佳列分割位置确定字符的列位置;
根据字符的列位置,确定字符的标准高度值;
根据共同下边界和字符的标准高度值,确定字符的上边界。
在上述实施例的基础上,装置700还可以包括:
先验信息获取模块,用于根据标准冠字号区域图像,获得不同位置处字符的标准高度值和所述设定分割模板;和
冠字号区域图像截取模块,用于从目标纸币图像中截取冠字号区域图像,作为所述待分割字符图像。
需要说明的是,字符分割装置与前述字符分割方法属于同一个发明构思,在装置实施例中未详尽描述的细节内容,可以参考上述方法的实施例。
图8是本发明实施例提供的一种字符分割设备的结构示意图。图8示出了适于用来实现本发明实施方式的示例性字符分割设备12的框图。图8显示的字符分割设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,字符分割设备12以通用计算设备的形式表现。字符分割设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
字符分割设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被字符分割设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。字符分割设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图8未显示,通常称为“硬盘驱动器”)。尽管图8中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
字符分割设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该字符分割设备12交互的设备通信,和/或与使得该字符分割设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,字符分割设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与字符分割设备12的其它模块通信。应当明白,尽管图中未示出,可以结合字符分割设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的字符分割方法。
本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种字符分割方法,该方法包括:
对待分割字符图像进行二值化,获得二值图像;
在所述二值图像上逐列移动设定分割模板,顺序遍历连续的第一设定数值行,获得遍历结果;
根据所述遍历结果,确定所述二值图像中字符的列位置、上边界和共同下边界;
根据所述列位置、上边界和共同下边界,从所述二值图像中分割所述字符。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或设备上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (8)
1.一种字符分割方法,其特征在于,包括:
对待分割字符图像进行二值化,获得二值图像;
在所述二值图像上逐列移动设定分割模板,顺序遍历连续的第一设定数值行,获得遍历结果;所述设定分割模板的宽度不小于所述二值图像的宽度;所述第一设定数值与所述字符的最小标准高度值h相等;
根据所述遍历结果,确定所述二值图像中字符的列位置、上边界和共同下边界;
根据所述列位置、上边界和共同下边界,从所述二值图像中分割所述字符;
所述在所述二值图像上逐列移动设定分割模板,顺序遍历连续的第一设定数值行,获得遍历结果,包括:
对于所述二值图像上连续的h行,在行方向上按第一设定方向逐列移动所述设定分割模板,进行列扫描;
获得多个第一特征值,其中,所述第一特征值为所述设定分割模板中,每个列分割位置所在列上前景点数的和值;
当所述第一特征值取最小值,并且所述设定分割模板中任意两个列分割位置之间包含的前景点数大于第二设定数值时,记录对应的最佳列分割位置,并计算对应的第二特征值,其中,所述第二特征值为所述二值图像中,标准高度值为h的所有字符的高度和值;
在列方向上按第二设定方向逐行移动所述设定分割模板,重复所述列扫描的操作,获得多个所述最佳列分割位置和多个所述第二特征值。
2.如权利要求1所述的方法,其特征在于,
所述获得多个第一特征值,包括:若所述设定分割模板中任意两个列分割位置之间包含的前景点数大于第二设定数值的条件不满足,则将所述第一特征值赋值为最大值max;
所述计算对应的第二特征值,包括:在连续的h行中,若前景点数小于第三设定数值对应的行数量值大于第四设定数值,则将所述第二特征值赋值为0,其中,所述第四设定数值小于h。
3.如权利要求1所述的方法,其特征在于,所述根据所述遍历结果,确定所述二值图像中字符的列位置、上边界和共同下边界,包括:
从多个所述第二特征值中选取最大值,取此时所述设定分割模板下边缘所在行作为所述字符的共同下边界;
根据与最大第二特征值对应的最佳列分割位置确定所述字符的列位置;
根据所述字符的列位置,确定所述字符的标准高度值;
根据所述共同下边界和所述字符的标准高度值,确定所述字符的上边界。
4.如权利要求1所述的方法,其特征在于,所述对待分割字符图像进行二值化之前,还包括:
根据标准冠字号区域图像,获得不同位置处字符的标准高度值和所述设定分割模板。
5.如权利要求1~4任一项所述的方法,其特征在于,所述对待分割字符图像进行二值化之前,还包括:
从目标纸币图像中截取冠字号区域图像,作为所述待分割字符图像。
6.一种字符分割装置,其特征在于,包括:
二值化模块,用于对待分割字符图像进行二值化,获得二值图像;
遍历模块,用于在所述二值图像上逐列移动设定分割模板,顺序遍历连续的第一设定数值行,获得遍历结果;所述设定分割模板的宽度不小于所述二值图像的宽度;所述第一设定数值与所述字符的最小标准高度值h相等;边界确定模块,用于根据所述遍历结果,确定所述二值图像中字符的列位置、上边界和共同下边界;
字符分割模块,用于根据所述列位置、上边界和共同下边界,从所述二值图像中分割所述字符;
所述在所述二值图像上逐列移动设定分割模板,顺序遍历连续的第一设定数值行,获得遍历结果,包括:
对于所述二值图像上连续的h行,在行方向上按第一设定方向逐列移动所述设定分割模板,进行列扫描;
获得多个第一特征值,其中,所述第一特征值为所述设定分割模板中,每个列分割位置所在列上前景点数的和值;
当所述第一特征值取最小值,并且所述设定分割模板中任意两个列分割位置之间包含的前景点数大于第二设定数值时,记录对应的最佳列分割位置,并计算对应的第二特征值,其中,所述第二特征值为所述二值图像中,标准高度值为h的所有字符的高度和值;
在列方向上按第二设定方向逐行移动所述设定分割模板,重复所述列扫描的操作,获得多个所述最佳列分割位置和多个所述第二特征值。
7.一种字符分割设备,其特征在于,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至5中任一所述的字符分割方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至5中任一所述的字符分割方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710647345.XA CN107437294B (zh) | 2017-08-01 | 2017-08-01 | 一种字符分割方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710647345.XA CN107437294B (zh) | 2017-08-01 | 2017-08-01 | 一种字符分割方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107437294A CN107437294A (zh) | 2017-12-05 |
CN107437294B true CN107437294B (zh) | 2020-05-01 |
Family
ID=60460908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710647345.XA Active CN107437294B (zh) | 2017-08-01 | 2017-08-01 | 一种字符分割方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107437294B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108491845B (zh) * | 2018-03-02 | 2022-05-31 | 深圳怡化电脑股份有限公司 | 字符分割位置的确定、字符分割方法、装置及设备 |
CN108510639B (zh) * | 2018-03-02 | 2020-06-09 | 深圳怡化电脑股份有限公司 | 一种纸币鉴伪方法、装置、验钞机和存储介质 |
CN108446702B (zh) * | 2018-03-14 | 2022-05-31 | 深圳怡化电脑股份有限公司 | 一种图像字符分割方法、装置、设备及存储介质 |
CN108460386B (zh) * | 2018-03-19 | 2022-03-08 | 深圳怡化电脑股份有限公司 | 字符图像切割方法、装置、设备及存储介质 |
CN108510636B (zh) * | 2018-03-27 | 2020-01-14 | 深圳怡化电脑股份有限公司 | 图像分割方法、图像分割装置及终端设备 |
CN108717744B (zh) * | 2018-04-27 | 2020-08-18 | 深圳怡化电脑股份有限公司 | 识别金融单据上的印章序号的方法、装置及终端设备 |
CN109035256B (zh) * | 2018-06-28 | 2021-07-20 | 百度在线网络技术(北京)有限公司 | 用户界面图像切割方法、装置、服务器和存储介质 |
CN111524268B (zh) * | 2019-01-16 | 2022-08-30 | 深圳怡化电脑股份有限公司 | 一种纸币粘贴物的检测方法、装置及设备 |
CN111666795A (zh) * | 2019-03-08 | 2020-09-15 | 北京京东尚科信息技术有限公司 | 提取字符的方法、系统、电子设备及存储介质 |
CN109948392B (zh) * | 2019-03-19 | 2022-03-18 | 厦门码灵半导体技术有限公司 | 二维码边界检测方法、分割方法、存储介质和电子设备 |
CN110032348B (zh) * | 2019-03-21 | 2022-05-24 | 北京空间飞行器总体设计部 | 一种字符显示方法、装置、介质 |
CN110209457A (zh) * | 2019-06-04 | 2019-09-06 | 深圳云里物里科技股份有限公司 | 应用于电子价签的字体渲染方法、系统及电子设备和介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4136257B2 (ja) * | 2000-03-17 | 2008-08-20 | 株式会社リコー | 文字認識装置、文字認識方法および記憶媒体 |
CN105046252B (zh) * | 2014-11-21 | 2018-09-07 | 华中科技大学 | 一种人民币冠字码识别方法 |
CN104616009B (zh) * | 2015-02-13 | 2018-05-18 | 广州广电运通金融电子股份有限公司 | 一种字符切割识别方法 |
CN106874909B (zh) * | 2017-01-18 | 2019-10-11 | 深圳怡化电脑股份有限公司 | 一种图像字符的识别方法及其装置 |
-
2017
- 2017-08-01 CN CN201710647345.XA patent/CN107437294B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN107437294A (zh) | 2017-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107437294B (zh) | 一种字符分割方法、装置、设备及存储介质 | |
US10896349B2 (en) | Text detection method and apparatus, and storage medium | |
CN108805128B (zh) | 一种字符分割方法和装置 | |
US9679354B2 (en) | Duplicate check image resolution | |
CN108734161B (zh) | 冠字号区域的识别方法、装置、设备及存储介质 | |
CN107369240B (zh) | 一种纸币鉴伪方法、装置、计算机及存储介质 | |
CN110210297B (zh) | 报关单图像中文字定位与提取的方法 | |
CN107103683B (zh) | 纸币识别方法和装置、电子设备和存储介质 | |
CN108717744B (zh) | 识别金融单据上的印章序号的方法、装置及终端设备 | |
CN108269349B (zh) | 一种纸币处理方法、装置、设备和存储介质 | |
CN111444807A (zh) | 目标检测方法、装置、电子设备和计算机可读介质 | |
US20140037181A1 (en) | Character recognition method, character recognition apparatus and financial apparatus | |
CN107330430A (zh) | 藏文字符识别装置与方法 | |
CN108734846B (zh) | 纸币图像的去噪方法及装置、终端及存储介质 | |
CN107358718B (zh) | 一种冠字号识别方法、装置、设备及存储介质 | |
Ganapathy et al. | A Malaysian vehicle license plate localization and recognition system | |
CN107680246B (zh) | 一种纸币图案中的曲线边界定位方法及设备 | |
CN111104844B (zh) | 多发票信息录入方法、装置、电子设备及存储介质 | |
CN108961531B (zh) | 纸币冠字号识别的方法、装置、设备及存储介质 | |
CN111599080B (zh) | 拼接纸币的检测方法、装置、金融机具设备及存储介质 | |
CN115546811A (zh) | 一种识别印章的方法、装置、设备及存储介质 | |
CN108230538B (zh) | 一种纸币鉴定方法、装置、设备和储存介质 | |
CN114120305A (zh) | 文本分类模型的训练方法、文本内容的识别方法及装置 | |
CN107240184B (zh) | 一种塑料币版本识别的方法、装置及设备 | |
CN108960222B (zh) | 图像二值化方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |