CN106650714A - 一种纸钞的冠字号识别方法及其装置 - Google Patents
一种纸钞的冠字号识别方法及其装置 Download PDFInfo
- Publication number
- CN106650714A CN106650714A CN201610878638.4A CN201610878638A CN106650714A CN 106650714 A CN106650714 A CN 106650714A CN 201610878638 A CN201610878638 A CN 201610878638A CN 106650714 A CN106650714 A CN 106650714A
- Authority
- CN
- China
- Prior art keywords
- character
- identification
- vertical
- string
- horizontal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 230000003287 optical effect Effects 0.000 claims abstract description 21
- 238000004891 communication Methods 0.000 description 5
- 238000012790 confirmation Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
- G06V10/225—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07D—HANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
- G07D7/00—Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
- G07D7/06—Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency using wave or particle radiation
- G07D7/12—Visible light, infrared or ultraviolet radiation
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07D—HANDLING OF COINS OR VALUABLE PAPERS, e.g. TESTING, SORTING BY DENOMINATIONS, COUNTING, DISPENSING, CHANGING OR DEPOSITING
- G07D7/00—Testing specially adapted to determine the identity or genuineness of valuable papers or for segregating those which are unacceptable, e.g. banknotes that are alien to a currency
- G07D7/20—Testing patterns thereon
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Toxicology (AREA)
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
本发明提供了一种纸钞的冠字号识别方法及其装置,所述方法包括以下步骤:C.对冠字号图像进行垂直方向的光学字符识别,并选取自信度符合第一阈值的垂直识别字符;D.对所述冠字号图像进行水平方向的光学字符识别,并选取自信度最高的预定数量个水平识别字符,以组成水平识别字符串;E.确认预定数量个垂直识别字符,以组成垂直识别字符串;F.分别比较水平识别字符串中与垂直识别字符串中的对应位置上的字符的自信度值,并把自信度值高的字符确定为最终识别出的字符。本发明中的方案有效地提高了对纸币中冠字号字符串的识别正确率。
Description
技术领域
本发明涉及纸钞识别技术领域,特别的,具体地,本发明涉及一种纸钞的冠字号识别方法及其装置。
背景技术
纸钞的冠字号识别是指:当纸钞经过ATM机的识别模块时,纸钞上的序列号(冠字号)被扫描纪录成图形并将其转换成ASCII码以进行分析的过程。被识别出的冠字号将被保存在ATM机的存储器中以供银行工作人员查询,从而加强了对流经该ATM机的纸钞的管理。
目前通常对纸钞的识别是单一(垂直)方向的,即:对冠字号中的各列字符实施从上至下的识别。各个被识别的字符都具有一个相应的自信度值(Confidence),该值用以表示被识别出的字符的可信度,即:被识别的目标字符/图形与被判断出的字符之间的相似程度.
然而,由于一些长期使用的纸币存在着一些污迹或灰尘,或者由于扫描设备的老化,扫描出的冠字号图像上会存在着一些噪点和噪块,从而影响了对冠字号的有效识别(参见附图1)。毫无疑问,这将会造成某些被识别的字符的自信度较低,从而造成识别出错,而在现有技术中,目前还没有一种基于识别字符的自信度的数据进行自我调整和纠正的技术。
为此,本发明提出了一种纸钞的冠字号识别的技术,其将二值化(扫描)后的冠字号图像进行垂直与水平方向的光学字符识别,并利用垂直与水平方向的光学字符识别结果进行相互校验、纠正和调整,以达到提高纸钞的冠字号字符的整体识别正确率的目的。
发明内容
鉴于上述技术问题,为了实现本发明的目的,本发明的第一方面提供了一种纸钞的冠字号识别方法,所述方法包括以下步骤:C.对冠字号图像进行垂直方向的光学字符识别,并选取自信度符合第一阈值的垂直识别字符;D.对所述冠字号图像进行水平方向的光学字符识别,并选取自信度最高的预定数量个水平识别字符,以组成水平识别字符串;E.确认预定数量个垂直识别字符,以组成垂直识别字符串;F.分别比较水平识别字符串中与垂直识别字符串中的对应位置上的字符的自信度值,并把自信度值高的字符确定为最终识别出的字符。
特别的,还包括步骤:B.对所述冠字号进行扫描,以生成所述冠字号图像。
特别的,还包括步骤:A.根据所述冠字号的字符个数确定所述预定数量。
特别的,所述冠字号的字符个数是根据纸钞的类别而预先设定的。
特别的,所述第一阈值是根据所述冠字号图像上存在的噪点和噪块程度来确定的。
特别的,所述步骤D中具体包括:D1.对冠字号图像进行水平方向的光学字符识别,并获取自信度符合第二阈值的水平识别字符;D2.确定自信度符合所述第二阈值的水平识别字符的个数是否符合所述预定数量;当所述个数不符合所述预定数量时,选取自信度最高的预定数量个水平识别字符。
特别的,所述第二阈值是根据所述冠字号图像上存在的噪点和噪块程度来确定的。
特别的,所述步骤E中具体包括:E1.确定所述自信度符合所述第一阈值的垂直识别字符的个数是否小于所述预定数量:I.当所述个数小于所述预定数量时:i.确定缺省字符的位置;ii.把所述缺省字符与所述垂直识别字符组成所述垂直识别字符串;II.当所述个数不小于所述预定数量时:选取自信度最高的预定数量个垂直识别字符,以组成所述垂直识别字符串。
特别的,所述缺省字符的自信度是最低值。
特别的,所述步骤i具体包括:根据所述水平识别字符串中各个字符的位置信息,确定在垂直方向的光学字符识别中所忽略的字符在垂直识别字符串中的位置;该位置为缺省字符的位置。
本发明的第二方面提供了一种纸钞的冠字号识别装置,其特征在于包括:垂直识别模块,其被配置为对冠字号图像进行垂直方向的光学字符识别,并选取自信度符合第一阈值的垂直识别字符;水平识别模块,其被配置为对所述冠字号图像进行水平方向的光学字符识别,并选取自信度符合第二阈值的水平识别字符;垂直字符串确认模块,其被配置为确认预定数量个垂直识别字符,以组成垂直识别字符串;水平字符串确认模块,其被配置为选取自信度最高的预定数量个水平识别字符,以组成水平识别字符串;字符确定模块,其被配置为分别比较水平识别字符串中与垂直识别字符串中的对应位置上的字符的自信度值,并把自信度值高的字符确定为最终识别出的字符。
特别的,还包括:扫描模块,其被配置为对所述冠字号进行扫描,以生成所述冠字号图像。
特别的,还包括:数量预设模块,其被配置为根据所述冠字号的字符个数确定所述预定数量。
特别的,所述水平字符串确认模块还包括:水平数量判断单元,其被配置为确定自信度符合所述第二阈值的水平识别字符的个数是否符合所述预定数量;水平字符串选取单元,其被配置为当所述个数不符合所述预定数量时,获取自信度最高的预定数量个水平识别字符;水平字符串生成单元,其被配置为生成水平识别字符串。
特别的,所述垂直字符串确认模块还包括:垂直数量判断单元,其被配置为确定所述自信度符合所述第一阈值的垂直识别字符的个数是否小于所述预定数量;垂直字符串选取单元,其被配置为当所述个数不小于所述预定数量时,获取自信度最高的预定数量个垂直识别字符;缺省位置确定单元,其被配置为确定缺省字符的位置;垂直字符串生成单元,其被配置为生成垂直识别字符串。
综上所述,本发明的纸钞的冠字号识别方法及其装置可以将二值化(扫描)后的冠字号图像进行垂直与水平方向的光学字符识别,并利用垂直与水平方向的光学字符识别结果进行相互校验、纠正和调整,以达到提高纸钞的冠字号字符的整体识别正确率的目的。本发明中的方案有效地提高对纸币中冠字号字符串的识别正确率,加强了ATM机对其所经手的纸钞的有效管理。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更加明显:
图1示出了根据本发明的一个实施例,对纸币的冠字号字符串进行扫描后所获得的需要识别的冠字号图像的示意图;
图2示出了根据本发明所公开的一种纸钞的冠字号识别方法的方法流程图;
图3示出了根据本发明所公开的一种纸钞的冠字号识别装置的模块图;
图4示出了垂直识别冠字号图像时所生成的扫描结果的代码;以及
图5示出了水平识别冠字号图像时所生成的扫描结果的代码。
具体实施方式
在以下优选的实施例的具体描述中,将参考构成本发明一部分的所附的附图。所附的附图通过示例的方式示出了能够实现本发明的特定的实施例。示例的实施例并不旨在穷尽根据本发明的所有实施例。可以理解,在不偏离本发明的范围的前提下,可以利用其他实施例,也可以进行结构性或者逻辑性的修改。因此,以下的具体描述并非限制性的,且本发明的范围由所附的权利要求所限定。
本发明的主要思路是对冠字号的图像进行垂直与水平方向的光学字符识别(OCR),并利用这些识别结果进行相互校验、纠正,从而提高纸钞整体识别率。
需要指出的是在本文中通过垂直方向的光学字符识别而获得的字符被称为垂直识别字符,因此而确认出的字符串被称为垂直识别字符串;通过水平方向的光学字符识别而获得的字符被称为水平识别字符,因此而确认出的字符串被称为水平识别字符串。
如图3所示,实施图2中所示方法的装置包括数量预测模块302、扫描模块304、垂直识别模块306、水平识别模块308、水平字符串确认模块310、垂直字符串确认模块312和字符确认模块314。
其中,扫描模块304与垂直识别模块306和水平识别模块308分别连接,以把扫描出的冠字号的图像分别发送给垂直识别模块306和水平识别模块308。垂直识别模块306与垂直字符串确认模块312连接,水平识别模块308与水平字符串确认模块310连接。数量预测模块302与垂直字符串确认模块312和水平字符串确认模块310分别连接。字符确认模块314与垂直字符串确认模块312和水平字符串确认模块310分别连接,以获取这两个模块所确定的字符串。以下将结合图2中的方法流程图具体介绍各个模块的功能和本发明中识别冠字号的方法。
在步骤202中,数量预设模块302根据纸钞的冠字号的字符的个数确定预定数量N。
具体的,每一种纸币都具有一组冠字号,而该冠字号中字符的数量是相同的,例如,现版的人民币的冠字号由10位(N=10)字符(包括字母和数字)组成。因此每一种纸钞都具有对应数量的冠字号字符。数量预设模块302可以通过确认纸钞的类型来确定该纸钞中冠字号字符的数量N,也可以通过人工在数量预设模块中设定需要识别的冠字号字符的数量N。然后数量预设模块302所获得的该预定数量被输入至垂直字符串确认模块312和水平字符串确认模块310中,以供这两个模块分析和确认冠字号字符串。
在步骤204中,扫描模块304对纸钞上的冠字号进行扫描,以生成冠字号图像。
具体的,扫描模块304对纸钞上冠字号所在的区域进行扫描,以生成冠字号图像,该图像如图1所示,所扫描出的图像是二值化的,即由位于图像坐标系内的黑色点和白色点构成,每个字符由不同的点组成。同时由于系统内存在着系统噪声或者由于纸钞上的污迹,所扫描出的冠字号图像中具有许多的噪点或噪块,而这些噪点或噪声将影响识别装置对该图像中字符的识别。扫描模块在获得冠字号图像后,把该图像分别发送至垂直识别模块306和水平识别模块308中,以供这两个模块对图像进行识别。
在步骤206中,垂直识别模块306对从扫描模块304中获得的冠字号图像进行垂直方向的光学字符识别,并选取出自信度符合第一阈值的垂直识别字符。
具体的,垂直识别模块306会根据模板库中的字符信息对冠字号图像中的图形/图案进行垂直方向的字符识别,以确认该冠字号图像中所包含的字符。其中模板库中具有所有字符(包括26个字母和10个数字)的字符参考信息,该参考信息可以例如是:正确情况下,每个字符的宽、高的点数最小尺寸,以及每个字符的图形式样等信息。例如在本发明所示的实施例中,模板库中对于字符“S”的最小尺寸(MinW ×H)设定为14×23,即,正确情况下字符“S”的宽最小为14个点,高最小为23个点。如果识别出的字符“S”的尺寸相对于这个参考尺寸相差过大,那么该字符的正确性就很低(一般情况下,小于最小尺寸的图形通常为噪点或噪块)。在本发明中,根据与该模板库中参考信息的比对,每个被识别的字符会获得一个相应的自信度值,该自信度值表示该被识别的字符的可信度或准确度。当该被识别的字符与模板库中对应的字符的参考信息越接近,该字符的自信度值就越高。而只有自信度值超过一定的阈值,该被识别的字符才能被认为是有效的或识别成功的。
在本实施例中,以图1中的冠字号图像为例,经过垂直识别模块306的识别,可以获得如图4所示的扫描结果的代码。其中每个扫描出的字符都有一个识别区域以指示该字符所覆盖的坐标区域,例如,识别出的字符“Y”的坐标区域表示为:[Y]in(35,4)→(53,40);其中点(35,4)和(53,40)分别为字符“Y”在坐标系中的两个对角顶点。基于该字符的坐标区域可以获得该被识别字符的宽、高的尺寸,并结合该字符的图形式样,从而可以与模板库中的字符参考信息相比对,以确定该被识别字符的自信度值。
在该步骤中,当该自信度值超过第一阈值时,该被识别的字符被认为是有效的。然后,被识别出的且自信度符合第一阈值的垂直识别字符将被输入至垂直字符串确认模块312中。
表-1示出了以图1中的冠字号图像为例的垂直字符的识别结果,其中,在所有识别出的字符中,一共有9个被识别出的字符符合第一阈值(≥60)的要求。其中序号表示识别的顺序。
表-1:
序号(从右到左) | 字符及自信度数据 | 忽略(自信度小于40) |
1 | [‘6’=80] | ‘4’和‘]’ |
2 | [‘4’=78] | ‘Y’ |
3 | [‘E’=41,‘5’=85] | ‘Z’ |
4 | [‘5’=87] | |
5 | [‘3’=83] | |
6 | [‘9’=87] | ‘U’和‘Z’ |
7 | [‘4’=81] | ‘I’ |
8 | [‘Y’=69] | ‘W’ |
9 | [‘S’=70] |
在一个优选的实施例中,该第一阈值是根据所述冠字号图像上存在的噪点和噪块程度来确定的。例如当纸币比较旧且污迹比较多,或者扫描模块因的老化而造成噪点或噪块较多时,该第一阈值可以设得较低,以避免获取有效字符不足;反之,则可以设得较高,以排除非目标字符的识别结果。
在步骤208中,水平识别模块308对从扫描模块304中获得的冠字号图像进行水平方向的光学字符识别,并选取出自信度符合第二阈值的水平识别字符。
具体的,与步骤206类似,水平识别模块308会根据模板库中的字符信息对冠字号图像中的图形/图案进行水平方向的字符识别,以确认该冠字号图像中所包含的字符。在水平识别模块308中的模板库可以是与垂直识别模块306中的模板库相同的模板库,也可以是根据水平识别的特性而设的不同的模板库。相同的,在该步骤中,根据与该模板库中参考信息的比对,每个被识别的字符也会获得一个相应的自信度值,然后,水平识别模块308把符合第二阈值的识别出的水平字符输入至水平字符串确认模块310中。
在本发明中,水平识别出的字符用于修正垂直识别出的字符。所以,水平识别出的字符应该至少有预订数量N个,以保证有足够的水平识别字符来校验垂直识别字符。因此,该第二阈值可以适当的低于该第一阈值。同样,在设定该第二阈值的时候也可以考虑冠字号图像中噪点、噪块对于识别的影响,即:根据所述冠字号图像上存在的噪点和噪块程度来确定该第二阈值。
表-2示出了以图1中的冠字号图像为例的水平字符的识别结果,其中,在所有识别出的字符中,一共有10个被识别出的字符符合第二阈值的要求。其中序号表示识别的顺序。
在步骤210中,水平字符串确认模块310在接收到水平识别模块308确认出的水平识别字符后,选取自信度最高的预定数量N个水平识别字符,以组成水平识别字符串。
具体的,水平字符串确认模块310包括:水平数量判断单元、水平字符串选取单元和水平字符串生成单元,其中,水平数量判断单元与水平字符串选取单元通信连接,水平字符串选取单元与水平字符串生成单元通信连接。水平字符串确认模块310从数量预设模块302中确认预定数量N,即:冠字号字符的个数。然后水平数量判断单元确定从水平识别模块308中获得的自信度符合第二阈值的水平识别字符的个数是否符合所述预定数量N。如果符合,则水平字符串生成单元直接生成水平识别字符串。如果不符合,则先由水平字符串选取单元选取自信度最高的预定数量个水平识别字符,然后再由水平字符串生成单元生成水平识别字符串。
例如,在上述实施例中(参见表-2),当第二阈值设为35时,水平识别模块308会向水平字符串确认模块310发送11个水平识别字符(序号分别为2、3、5、6、8、9、10、12、13、14、15)。而根据预定数量N(N=10),只需要10个字符作为垂直识别字符的校验字符。因此,水平字符串确认模块310会选取自信度最高的N个字符作为水平识别字符串(序号分别为2、3、5、6、8、9、10、12、13、14),其中,序列号为15的字符由于自信度最低而被排除。
随后,水平字符串生成单元会根据识别先后的相反顺序对这些选定的水平识别字符排序以生成水平识别字符串(垂直识别顺序是从右至左的,因此排列字符串的顺序是与垂直识别顺序相反的)。在上述示例中,该字符串为“SY49355416”,并把该水平识别字符串和各个字符的自信度值发送至字符确定模块314中。此外,水平字符串确认模块310还会把该水平识别字符串及各个字符所覆盖的坐标区域的位置信息发送至垂直字符串确认模块312中。
在步骤212中,垂直字符串确认模块312确认预定数量N个垂直识别字符,以组成垂直识别字符串。
具体的,垂直字符串确认模块312中包括:垂直数量判断单元、垂直字符串选取单元、缺省位置确定单元和垂直字符串生成单元,其中,垂直数量判断单元和缺省位置确定单元分别与垂直字符串选取单元通信连接,垂直数量判断单元与缺省位置确定单元通信连接,垂直字符串选取单元与垂直字符串生成单元通信连接。垂直字符串确认模块312从数量预设模块302获取预订数量值N,并从垂直识别模块306接收垂直识别字符。然后通过垂直数量判断单元确定接收到的该垂直识别字符的数量是否小于所述预订数量值N,并把确认结果发送给垂直字符串选取单元和缺省位置确定单元。
垂直识别模块306发送的垂直识别字符的个数存在3种情况:大于预订数量、等于预订数量、小于预订数量。
类似于步骤210中的过程,当该垂直识别字符的数量大于或等于所述预订数量值N时,垂直字符串选取单元可以先选取自信度最高的预定数量个水平识别字符,由水平字符串按照识别顺序生成单元生成水平识别字符串,或直接按照识别顺序生成单元生成水平识别字符串,此处不再累述。
当该垂直识别字符的数量小于所述预订数量值N时,则说明在通过垂直方式识别字符的过程中存在遗漏识别字符的情况发生,因此需要参考通过水平方式识别字符的结果来确定出该遗漏字符的位置,然后以缺省字符在遗漏的位置上代替遗漏的字符,从而生成完整的水平识别字符串。
具体的,当垂直识别字符的数量小于所述预订数量值N时,缺省位置确定单元根据水平识别字符的位置信息确定该缺省字符的位置。即:依次确认水平识别字符串中的各个水平识别字符,以比对在所有垂直识别字符中是否能找到一个垂直识别字符的覆盖区域与该水平识别字符的覆盖区域相对应。如果存在一个水平识别字符,其覆盖区域无法与任何一个垂直识别字符的覆盖区域相对应,那么该水平识别字符就是遗漏的字符。其中“相对应”是指两个字符所覆盖的区域部分重叠且重叠比率满足一定的阈值,该阈值可以是例如70%(即:构成两个字符的点有70%是重叠的)。例如垂直识别字符“Y”的覆盖区域是(35,4)→(53,40),而水平识别字符“Y”的覆盖区域是(35,4)→(53,48)(参见图5),两者覆盖区域高度重合,因此可以认为垂直识别字符中存在与水平识别字符“Y”相对应的字符。
在图1所示的示例中,根据表-1,垂直识别模块306识别出的字符为‘S’、‘Y’、‘4’、‘9’、‘3’、‘5’、‘5’、‘4’、‘6’,也就是说字符“1”被遗漏或没识别出。缺省位置确定单元会获取这些垂直识别字符的位置信息(各字符所覆盖的坐标区域)并使之与水平识别字符串中各字符的位置信息进行比对,从而找出该缺失的字符位于字符串中的哪个位置。通过位置比对,缺省位置确定单元可以发现垂直识别字符中无法找到与水平识别字符串中第9个字符(字符“1”)相对应的字符,因此,垂直识别字符串中的第9个字符为缺省字符的位置。
需要指出的是,缺省字符的数量根据遗漏多少个字符来确定,如果预订数量为N,垂直识别字符的个数为n,则缺省字符的数量为N-n。即:要确定N-n个缺省字符的位置。在本示例中,缺省字符以问号“?”来表示,当然也可以用其他符号来表示。该缺省字符仅用于确定遗漏字符的位置,因此其自信度被设定为是最低的,例如为0。
在确定完缺省字符的位置之后,缺省位置确定单元把该位置信息发送至垂直字符串选取单元,由垂直字符串选取单元生成垂直识别字符串,并发送至字符确定模块314。在上述实施例中,最终获得的垂直识别字符串为“SY493554?6”。
在步骤214中,字符确定模块314分别比较水平识别字符串中与垂直识别字符串中的对应位置上的字符的自信度值,并把自信度值高的字符确定为最终识别出的字符。
具体的,字符确定模块314在从垂直字符串确认模块312和水平字符串确认模块310中分别获取垂直识别字符串、水平识别字符串以及各个字符的自信度值,然后依次按顺序实施比较,自信度值高的字符被确定为最终识别出的字符。例如,在上述示例中,把垂直识别字符串“SY493554?6”和水平识别字符串“SY49355416”进行比较,以取自信度高的字符作为最终冠字号字符串中的字符。经比较,对于第九位上的字符,水平识别字符“1”的自信度(67)大于垂直识别字符“?”的自信度(0),因此,第九位的字符为“1”。最终识别出的字符串为“SY49355416”
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论如何来看,均应将实施例看作是示范性的,而且是非限制性的。此外,明显的,“包括”一词不排除其他元素和步骤,并且措辞“一个”不排除复数。装置权利要求中陈述的多个元件也可以由一个元件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
Claims (15)
1.一种纸钞的冠字号识别方法,所述方法包括以下步骤:
C.对冠字号图像进行垂直方向的光学字符识别,并选取自信度符合第一阈值的垂直识别字符;
D.对所述冠字号图像进行水平方向的光学字符识别,并选取自信度最高的预定数量个水平识别字符,以组成水平识别字符串;
E.确认预定数量个垂直识别字符,以组成垂直识别字符串;
F.分别比较水平识别字符串中与垂直识别字符串中的对应位置上的字符的自信度值,并把自信度值高的字符确定为最终识别出的字符。
2.根据权利要求1所述的方法,其中,还包括步骤:
B.对所述冠字号进行扫描,以生成所述冠字号图像。
3.根据权利要求2所述的方法,其中,还包括步骤:
A.根据所述冠字号的字符个数确定所述预定数量。
4.根据权利要求3所述的方法,其中,所述冠字号的字符个数是根据纸钞的类别而预先设定的。
5.根据权利要求3所述的方法,其中,所述第一阈值是根据所述冠字号图像上存在的噪点和噪块程度来确定的。
6.根据权利要求3所述的方法,其中,所述步骤D中具体包括:
D1.对冠字号图像进行水平方向的光学字符识别,并获取自信度符合第二阈值的水平识别字符;
D2.确定自信度符合所述第二阈值的水平识别字符的个数是否符合所述预定数量;当所述个数不符合所述预定数量时,选取自信度最高的预定数量个水平识别字符。
7.根据权利要求6所述的方法,其中,所述第二阈值是根据所述冠字号图像上存在的噪点和噪块程度来确定的。
8.根据权利要求3所述的方法,其中,所述步骤E中具体包括:
E1.确定所述自信度符合所述第一阈值的垂直识别字符的个数是否小于所述预定数量:
I.当所述个数小于所述预定数量时:
i.确定缺省字符的位置;
ii.把所述缺省字符与所述垂直识别字符组成所述垂直识别字符串;
II.当所述个数不小于所述预定数量时:
选取自信度最高的预定数量个垂直识别字符,以组成所述垂直识别字符串。
9.根据权利要求8所述的方法,其中,所述缺省字符的自信度是最低值。
10.根据权利要求8所述的方法,其中,所述步骤i具体包括:
根据所述水平识别字符串中各个字符的位置信息,确定在垂直方向的光学字符识别中所忽略的字符在垂直识别字符串中的位置;该位置为缺省字符的位置。
11.一种纸钞的冠字号识别装置,其特征在于包括:
垂直识别模块,其被配置为对冠字号图像进行垂直方向的光学字符识别,并选取自信度符合第一阈值的垂直识别字符;
水平识别模块,其被配置为对所述冠字号图像进行水平方向的光学字符识别,并选取自信度符合第二阈值的水平识别字符;
垂直字符串确认模块,其被配置为确认预定数量个垂直识别字符,以组成垂直识别字符串;
水平字符串确认模块,其被配置为选取自信度最高的预定数量个水平识别字符,以组成水平识别字符串;
字符确定模块,其被配置为分别比较水平识别字符串中与垂直识别字符串中的对应位置上的字符的自信度值,并把自信度值高的字符确定为最终识别出的字符。
12.根据权利要求11所述的装置,其特征在于,还包括:
扫描模块,其被配置为对所述冠字号进行扫描,以生成所述冠字号图像。
13.根据权利要求12所述的装置,其特征在于,还包括:
数量预设模块,其被配置为根据所述冠字号的字符个数确定所述预定数量。
14.根据权利要求12所述的装置,其特征在于,所述水平字符串确认模块还包括:
水平数量判断单元,其被配置为确定自信度符合所述第二阈值的水平识别字符的个数是否符合所述预定数量;
水平字符串选取单元,其被配置为当所述个数不符合所述预定数量时,获取自信度最高的预定数量个水平识别字符;
水平字符串生成单元,其被配置为生成水平识别字符串。
15.根据权利要求12所述的装置,其特征在于,所述垂直字符串确认模块还包括:
垂直数量判断单元,其被配置为确定所述自信度符合所述第一阈值的垂直识别字符的个数是否小于所述预定数量;
垂直字符串选取单元,其被配置为当所述个数不小于所述预定数量时,获取自信度最高的预定数量个垂直识别字符;
缺省位置确定单元,其被配置为确定缺省字符的位置;
垂直字符串生成单元,其被配置为生成垂直识别字符串。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610878638.4A CN106650714A (zh) | 2016-10-08 | 2016-10-08 | 一种纸钞的冠字号识别方法及其装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610878638.4A CN106650714A (zh) | 2016-10-08 | 2016-10-08 | 一种纸钞的冠字号识别方法及其装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106650714A true CN106650714A (zh) | 2017-05-10 |
Family
ID=58853756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610878638.4A Pending CN106650714A (zh) | 2016-10-08 | 2016-10-08 | 一种纸钞的冠字号识别方法及其装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106650714A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111523331A (zh) * | 2019-02-02 | 2020-08-11 | 北京骑胜科技有限公司 | 一种二维码识别方法及装置 |
CN111582259A (zh) * | 2020-04-10 | 2020-08-25 | 支付宝实验室(新加坡)有限公司 | 机读码识别方法、装置、电子设备和存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1551038A (zh) * | 2003-04-14 | 2004-12-01 | 佳能株式会社 | 字符识别法 |
CN101777124A (zh) * | 2010-01-29 | 2010-07-14 | 北京新岸线网络技术有限公司 | 一种提取视频文本信息的方法及装置 |
CN102521911A (zh) * | 2011-12-16 | 2012-06-27 | 尤新革 | 钞票冠字号识别方法 |
CN102663377A (zh) * | 2012-03-15 | 2012-09-12 | 华中科技大学 | 一种基于模板匹配的字符识别方法 |
CN103186940A (zh) * | 2011-12-28 | 2013-07-03 | 光荣株式会社 | 号码识别装置以及号码识别方法 |
CN105528604A (zh) * | 2016-01-31 | 2016-04-27 | 华南理工大学 | 一种基于ocr的票据自动识别与处理系统 |
-
2016
- 2016-10-08 CN CN201610878638.4A patent/CN106650714A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1551038A (zh) * | 2003-04-14 | 2004-12-01 | 佳能株式会社 | 字符识别法 |
CN101777124A (zh) * | 2010-01-29 | 2010-07-14 | 北京新岸线网络技术有限公司 | 一种提取视频文本信息的方法及装置 |
CN102521911A (zh) * | 2011-12-16 | 2012-06-27 | 尤新革 | 钞票冠字号识别方法 |
CN103186940A (zh) * | 2011-12-28 | 2013-07-03 | 光荣株式会社 | 号码识别装置以及号码识别方法 |
CN102663377A (zh) * | 2012-03-15 | 2012-09-12 | 华中科技大学 | 一种基于模板匹配的字符识别方法 |
CN105528604A (zh) * | 2016-01-31 | 2016-04-27 | 华南理工大学 | 一种基于ocr的票据自动识别与处理系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111523331A (zh) * | 2019-02-02 | 2020-08-11 | 北京骑胜科技有限公司 | 一种二维码识别方法及装置 |
CN111523331B (zh) * | 2019-02-02 | 2023-03-21 | 北京骑胜科技有限公司 | 一种二维码识别方法及装置 |
CN111582259A (zh) * | 2020-04-10 | 2020-08-25 | 支付宝实验室(新加坡)有限公司 | 机读码识别方法、装置、电子设备和存储介质 |
CN111582259B (zh) * | 2020-04-10 | 2024-04-16 | 支付宝实验室(新加坡)有限公司 | 机读码识别方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7787695B2 (en) | Method for applying a signature simplicity analysis for improving the accuracy of signature validation | |
US6813381B2 (en) | Method and apparatus for identification of documents, and computer product | |
CN105184292B (zh) | 自然场景图像中手写体数学公式结构分析与识别方法 | |
TWI484421B (zh) | 利用動態文件識別框架的文件驗證 | |
JP5624671B2 (ja) | 文字列切出方法及び文字列切出装置 | |
JP4911340B2 (ja) | 二次元コード検出システムおよび二次元コード検出プログラム | |
KR101024176B1 (ko) | 화상 처리 장치, 바코드 처리 장치, 및 화상 처리 방법 | |
CN113435556B (zh) | 一种点阵码的生码、解码方法及防伪方法 | |
US20060210138A1 (en) | Verification of authenticity of check data | |
US20120072013A1 (en) | Character recognition apparatus, sorting apparatus, sorting control apparatus, and character recognition method | |
EP0862132A2 (en) | Robust identification code recognition system | |
CN104303192A (zh) | 来自标记的特征的唯一识别信息 | |
CN106650714A (zh) | 一种纸钞的冠字号识别方法及其装置 | |
US9064138B2 (en) | Method for detecting reorgination of barcodes | |
CN107798355B (zh) | 一种基于文档图像版式自动分析与判断的方法 | |
CN113205633B (zh) | 票据红蓝纤维的检测方法、装置、电子设备和存储介质 | |
CN111340000A (zh) | 一种针对pdf文档表格提取优化方法及系统 | |
CN108074321B (zh) | 一种纸币的图像边界提取方法及装置 | |
CN112734623B (zh) | 标准成本核算中的财务凭证防伪加密及读取识别方法 | |
CN106340115A (zh) | 纸币的冠字号码识别方法及装置 | |
CN102682308A (zh) | 图像处理方法和图像处理设备 | |
JPH10207978A (ja) | 文字等パターン照合方法及び装置 | |
JP2599320B2 (ja) | 紙葉類認識装置 | |
CN102236638B (zh) | 西文单词中字符大小写的修正方法和装置 | |
JP2020119289A (ja) | 情報処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170510 |
|
WD01 | Invention patent application deemed withdrawn after publication |