CN103577820A - 字符识别方法、字符识别装置及金融设备 - Google Patents

字符识别方法、字符识别装置及金融设备 Download PDF

Info

Publication number
CN103577820A
CN103577820A CN201310329263.2A CN201310329263A CN103577820A CN 103577820 A CN103577820 A CN 103577820A CN 201310329263 A CN201310329263 A CN 201310329263A CN 103577820 A CN103577820 A CN 103577820A
Authority
CN
China
Prior art keywords
character
mentioned
characters
picture
medium
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310329263.2A
Other languages
English (en)
Other versions
CN103577820B (zh
Inventor
具范龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aiteke AP Co., Ltd.
Original Assignee
LG N Sys Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020120083895A external-priority patent/KR101337022B1/ko
Priority claimed from KR1020130087482A external-priority patent/KR101470748B1/ko
Application filed by LG N Sys Inc filed Critical LG N Sys Inc
Publication of CN103577820A publication Critical patent/CN103577820A/zh
Application granted granted Critical
Publication of CN103577820B publication Critical patent/CN103577820B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/166Normalisation of pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

本发明涉及字符识别方法、字符识别装置及金融设备,对于识别介质的字符的字符识别方法而言,从介质中获得个别字符的字符图像,并根据将预定的多个字符的集合分层性地分成由多个上位组及下位组构成的多个组的分级结构对字符图像进行逐步解读,从而确定字符。

Description

字符识别方法、字符识别装置及金融设备
技术领域
本发明涉及字符识别方法、字符识别装置及金融设备。
背景技术
金融设备是对投入或取出纸币或支票之类的介质等金融业务进行处理的设备,为了提高金融业务的信赖性,准确识别在介质中包含的多个字符是很重要的。
为了提高字符识别的准确性,最近普遍使用光学式字符解读方式。但在光学式字符方式的情况下,虽然在所扫描的图像的品质优越时,字符识别的准确性很高,但在所扫描的图像的品质差时,会降低字符识别的准确性。由此,需要一种即使在所扫描的图像的品质差的情况下,也能准确、迅速地识别介质的字符的字符识别方法。
发明内容
本发明的至少一个实施例所要实现的技术问题在于,提供能够准确识别介质的字符的字符识别方法、字符识别装置及金融设备。字符识别方法、字符识别装置及金融设备所要实现的技术问题并不局限于上述所述的技术问题,并且,还能存在其他技术问题。
一方面的字符识别方法包括以下步骤,即,从上述介质中获得个别字符的字符图像的步骤;及根据将预定的多个字符的集合分层性地分成由多个上位组及下位组构成的多个组的分级结构,对上述字符图像逐步进行解读,从而确定个别字符的步骤。
另一方面的字符识别装置包括图像获得部,其从介质获得个别字符的字符图像,及字符确定部,其从上述个别字符的字符图像中确定上述个别字符;执行预定次数以上上述个别字符的确定的情况下,在预定的多个数字字符的集合内确定上述相互不同的介质的同一位子的预定英文字符。
又一方面的字符识别装置包括图像获得部,其从第一国纸币中获得个别字符的字符图像,及字符确定部,其从个别字符的字符图像中确定个别字符;用第二国序列号的英文字符代替上述第一国纸币的第一国序列号的数字字符位子的情况下,第二国序列号的英文字符被确定为从包含0至9的数字集合中包含一部分数字或多个数字的集合内的数字。
再一方面的金融设备包括介质引入/取出部,用于引入或取出包含多个字符的介质;字符识别装置,从上述介质中获得个别字符的字符图像,并根据将预定的多个字符的集合分层性地分成由多个上位组及下位组构成的多个组的分级结构,对上述字符图像进行解读,来确定字符;及控制部,用于控制上述介质引入/取出部和上述字符识别装置的动作。
还有一方面的金融设备包括介质引入/取出部,用于引入或取出包含由不同种类和大小的字符构成的多个字符的介质;及字符识别装置,获得上述介质的图像,从所获得的上述介质的图像中获得字符串图像,并以所获得的上述字符串图像为基础,获得个别字符的字符图像,来从上述字符图像中确定上述个别字符。
如上所述,能够准确、迅速地识别在介质中包含的多个字符。
附图说明
图1是图示本发明一实施例的金融设备的框图。
图2是图示本发明一实施例的字符识别装置的框图。
图3是表示根据本发明的一实施例,从介质的图像中获得个别字符的字符图像的流程图。
图4是根据本发明的另一实施例,用于说明从介质的图像中获得个别字符的字符图像的方法的附图。
图5是根据本发明的一实施例,用于说明利用模板确定字符的方法的附图。
图6是根据本发明的一实施例,用于说明字符识别装置根据分级结构解读字符来确定字符的方法。
图7是用于说明本发明一实施例的字符图像的附图。
图8是在本发明一实施例的字符识别装置中,用于对利用分级结构确定介质的字符的一例进行说明的附图。
图9是表示根据本发明一实施例,来确定介质的字符的字符识别方法的流程图。
图10是表示根据本发明的另一实施例,来确定介质的字符的字符识别方法的流程图。
图11是表示根据本发明的又一实施例,来确定介质的字符的字符识别方法的流程图。
具体实施方式
以下,通过例示的附图对本发明的一部分实施例进行详细说明。向各附图的结构要素附加附图文字时,要注意的是,相同的结构要素即使在其他附图上表示,也尽可能地具有相同的符号。并且,在说明本发明的实施例时,判断相关公知结构或功能的具体说明会妨碍对本发明实施例的理解的情况下,其详细说明将省略。
并且,在说明本发明实施例的结构要素时,能够使用第一、第二、A、B、(a)及(b)等术语。此类术语仅仅用于区别上述结构要素与其他结构要素,而相关结构要素的本质、次序或顺序等不会由上述术语进行限定。某一结构要素记载为与其他结构要素“连接”、“结合”或“接续”的情况下,这一结构要素能够与其他结构要素直接连接或接续,但也应理解为在各个结构要素之间能够由其他结构要素“连接”、“结合”或“接续”。
本发明一实施例的金融设备是一种获得纸币、证券、转账、硬币及购物券等多种介质,从而执行金融业务的装置,上述金融业务包括执行存款处理、转账接收及购物券交换等的处理和/或取款处理、转账放出、购物券放出等介质处理。此类金融设备的例子能够包括自动提款机(CD:Cash Dispenser)、现金回收装置(Cash Recycling Device)之类的金融自动化设备(ATM:Automated Teller Machine)等。但是,金融设备并不局限于上述的例子,也可以是金融资讯系统(FIS,Financial Information System)之类的对金融业务进行自动化的装置。
以下,假设金融设备为金融自动化设备,来说明本发明的实施例。但是,此类假设仅用于说明上的方便,而并不是将本发明的技术思想限定于金融自动化设备中使用的。
图1是图示本发明一实施例的金融设备的框图。参照图1,金融设备100由介质引入/取出部110、控制部120及字符识别装置200构成。金融设备100还能包括保管部130、用户界面部140或存储器150。
介质引入/取出部110引入或取出介质。例如,介质可以是纸币、支票、转账或购物券,但并不局限于此。介质引入/取出部110还能包括传感器,用于判断介质是否引入或取出。
字符识别装置200识别介质,从而界定字符。例如,字符识别装置200能够利用光学式字符解读方式确定字符。字符识别装置200能够利用光源中放出的光照射介质,并以接收从介质反射或穿透的光的方式获得介质的图像。字符识别装置200利用所获得的介质的图像,来确定在介质中包含的字符。于此相关的具体说明参照图2。
并且,字符识别装置200能够利用所获得的介质的图像,来获得字符字段信息(character field information)。字符识别装置200通过获得字符字段信息,来判断介质的券种或介质的状态等。字符字段信息能够包含一种以上的字符串图像。
控制部120控制金融设备100的整体动作。即,控制部120控制介质引入/取出部110,使其引入或取出介质,或控制字符识别装置200,使其识别介质,来确定在介质中印刷的字符,并且,控制保管部130,使其保管引入后识别的介质,或将保管的介质放出,从而通过介质引入/取出部110取出,同时,控制用户界面部140,使其从用户处接收命令或信息等数据,或向用户显示信息。
例如,当控制部120感知到向介质引入/取出部110投入的介质从介质引入/取出部110向字符识别装置200移送时,控制字符识别装置200,使其确定在介质印刷的字符。
本实施例的控制部120相当于一个以上的数据处理器(processor)或包括一个以上的数据处理器。由此,控制部120能够以在微型数据处理器或通用计算机系统之类的其他硬件装置中包括的形态驱动。
保管部130保管介质。例如,保管部130接收从介质引入/取出部110引入的介质,从而进行保管,或为了取出所保管的介质,向介质引入/取出部110传送。
用户界面部140从用户处获得输入信息,并向用户表示输出信息。例如,用户界面部140向用户表示在字符识别装置200中识别的字符,或在字符识别装置200中的字符识别失败的情况下,能够表示字符识别发生了错误。或者,还能表示金融设备100的介质的处理状态。并且,若有需要,用户界面部140从用户处输入用于指定字符识别失败的字符的字符信息。
用户界面部140能够包括显示面板、触摸屏、显示器、键盘、音响等输入输出装置及用于驱动上述装置的软件模块。
存储器150存储字符识别中所需的信息。例如,存储器能够存储将预定的多个字符的集合分层性地分成由多个上位组及下位组构成的多个组的分级结构,根据分级结构逐步解读字符图像的多个条件及字符解读所需的模板等。但是,此类模板不会单独在存储器中存储,而是包括在用于字符解读的程序中,从而以程序的形态在存储器150中存储。并且,存储器150还能存储通过字符识别装置200进行识别的字符。
本发明一实施例的存储器150是通常的存储介质,因此,只要是与本实施例相关领域的技术人员,就能了解能够以硬盘驱动器(Hard Disk Drive,HDD)、只读存贮器(ROM,Read Only Memory)、随机存取存储器(RAM,Random Access Memory)、闪存(Flash Memory)、内存卡(Memory Card)及固态驱动器(Solid State Drive,SDD)等体现。
图2是图示本发明一实施例的字符识别装置的框图。参照图1,字符识别装置200是对包括在介质的字符进行识别的装置,能够包括图像获得部210,及字符确定部220。图1中,有关于字符识别装置200记载的内容也能适用于图2,因此,于此相关的重复的说明将省略。
本实施例的字符识别装置200相当于一个以上的数据处理器(processor)或包括一个以上的数据处理器。由此,字符识别装置200能够以在微型数据处理器或通用计算机系统之类的其他硬件装置中包括的形态驱动。
而且,图像获得部210和字符确定部220通过在字符识别装置200中包括的一个数据处理器进行驱动,或通过各个不同的数据处理器进行驱动。
图像获得部210从介质中获得个别字符的字符图像。个别字符的字符图像的一例参照图7。图像获得部210能够利用光,来获得介质的图像。由此,图像获得部210能够包括发光部及受光部,上述发光部包括光源。
根据一实施例,图像获得部210能够获得介质的图像,并从所获得的介质的图像中获得字符串图像,同时,以获得的字符串图像为基础,能够获得个别字符的字符图像。图像获得部210获得介质的图像时,图像获得部210只能获得并非介质的整体图像的特定部分的图像。并且,图像获得部210能够在一个介质中获得多个图像。
图像获得部210在介质中,利用印刷字符的字符印刷位置或各个字符的字符大小,来获得介质的图像。
并且,图像获得部210对所获得的介质的图像进行修改,从而获得字符串图像。
例如,能够从所获得的介质的图像中清除围绕字符串的空白,或反转所获得的介质图像的颜色,或执行对在所获得的介质的图像内包含的大小相互不同的字符的大小进行同一化的图像修改。图像获得部210还能执行图像锐化作业(image sharpening),用于使所获得的介质的图像变得更加清晰。
而且,图像获得部210还能执行将所获得的介质的图像、字符串图像或个别字符图像中某一个以多个像素划分的作业。根据本实施例,图像获得部210还能包括用于执行图像修改的图像处理装置。与此相关的具体说明参照图3至图4。
字符确定部220从通过图像获得部210获得的个别字符的字符图像中,确定个别字符。字符确定部220利用存储器150中存储的信息,从个别字符的字符图像中确定个别字符。
根据一实施例,字符确定部220能够在以多个像素划分的个别字符图像中,利用多个像素各自的颜色值,来确定字符。字符确定部220除了各个像素的颜色以外,利用像素的灰度值或亮度值,来确定字符。在此,颜色值、灰度值或亮度值等成为像素值。例如,字符确定部220是在以多个像素划分的个别字符像素中,将各像素的颜色与储存器150中储存的信息相比较,从而确定字符。
根据其他实施例,字符确定部220能够利用在以多个像素划分的个别字符图像中预设定的模板,来确定字符。模板的大小与两个以上的像素的和相同,并且,能够设有多个模板,用于确定个别字符,同时,多个模板的大小分别不同。与此相同的多个模板考虑到在介质印刷的字符的字体及字体大小,预先生成,并在存储器中存储。按字符的种类,模板的形态或数量会不同。于此相关的具体说明参照图5。
根据另一实施例,字符确定部220根据分级结构进行解读,从而确定字符。分级结构是将预定的多个字符的集合分层性地分成由多个上位组及下位组构成的多个组。在此,上位组所包含的字符包含在相关上位组的下位组中包含的字符。分级结构能够以预定的字符的集合中包含的字符之间的形态的类似性为基础,将预定的字符的集合分成由多个上位组及下位组构成的多个组。但,并不局限于此。
例如,预定的字符的集合可以是数字0至数字9的集合或字母A至Z的集合等。字符能够包括韩文、字母、汉子、罗马文字及数字等视觉性极好体系,因此,预定的多个字符的集合并不局限于上述的例中。
根据上述的例子,数字0至9的集合能够根据将预定的多个字符的集合分层性地分成由多个上位组及下位组构成的多个组的分级结构,逐步解读字符。上述分级结构能够以数字0至9之间的各个数字形态的类似性为基础,能够将数字0至9的集合分成多个组。
字符确定部220在根据分级结构,对字符图像逐步进行解读时,按分级结构的各个阶段将上述字符图像的预定位置的字符像素的数量,背景像素的数量,或字符像素的数量和背景像素的数量的比例中的一个与基准值相比较,从而以上述比较结果为基础,确定上述个别字符。
根据一实施例,字符确定部220在确定字符时,能够利用一个以上的模板确定字符。例如,字符确定部220根据控制部120的信号,将模板位于字符图像上的预定位置,并确定在预定位置模板内包括的像素的像素值与字符像素值之间的纵横方向的邻接性,来确定字符。字符像素之间的纵横方向的邻接性通过相互不同位置的两组字符像素之间的背景像素的数量确认。
此时,字符确定部220为了解读在预定的多个字符的集合中包含的多个字符,能够利用多种大小的多个模板。字符确定部220根据字符的大小、种类,能够利用存储于存储器中的多种模板。
并且,字符确定部220在解读字符时,能够根据分级结构分层性地使用多个模板。
根据以上的实施例,字符识别装置根据将预定的多个字符的集合分层性地分成由多个上位组及下位组构成的多个组的分级结构,对上述字符图像进行逐步解读,从而准确、迅速地识别介质中包含的多个字符。
图3是表示根据本发明的一实施例,从介质的图像中获得个别字符的字符图像的流程图。参照图3,在图3中记载的方法图3中记载的方法由如下步骤构成,即,在图1至图2中图示的字符识别装置200中,将介质的图像中获得个别字符的字符图像的过程,以时间序列进行处理。因此,能够了解的是,即使在下述内容中省略的内容,对于图1至图2中图示的字符识别装置200相关的上述所述的内容也适用于图3中记载的方法中。
在步骤310中,图像获得部210获得介质的图像。此时,图像获得部210只能获得并非介质的整体图像的介质的一部分图像。此时,介质的一部分图像对介质的一部分获得图像,但也能在获得介质的整体图像后,在介质的整体图像中抽取介质的一部分图像来获得。图3例示性地表示了在介质中获得一个介质的一部分图像。
图像获得部210需要获得的介质的(整体或一部分)图像的位置会根据介质的种类预先确定,因此,图形获得部210能够利用按介质的种类确定的字符所印刷的位置,在介质中获得图像。
例如,存储器150能够存储与需要获得的介质的图像的位置相关的坐标信息。并且,按多种介质的种类,介质的大小会不同,因此,存储器150能够根据多种介质的种类存储坐标信息。
由此,图像获得部210参照存储器150中存储的坐标信息,来获得介质的图像。步骤320中,图像获得部210从所获得的介质的图像中获得字符串图像。图像获得部210执行对所获得的介质的图像的修改,从而获得字符串图像。字符串图像包含一个以上的字符。
此时,图像的修改能够包括从所获得的介质的图像中清除围绕字符串的上下空白及左右空白,或反转所获得的介质图像的颜色,或对在所获得的介质的图像内包含的大小相互不同的字符的大小进行同一化中的至少一个。
步骤330中,图像获得部210从所获得的介质的字符串图像中获得个别字符的字符图像。
个别字符的字符图像的大小能够以预定的大小来定。此时,预定的大小会根据字符识别装置200识别的介质的种类有所不同。例如,字符识别装置200对韩国万元券纸币的序列号进行识别的情况下,字符图像的大小能够以韩国万元券纸币的序列号的字体大小来确定。
图像获得部210利用字符与字符之间的空白,从而将字符串图像按字符分割成预定大小的字符图像。而且,图像获得部210能够将各字符图像显示为由多个图像构成的预定大小的图像。例如,图像获得部210能够进行扩大、缩小,使得个别字符的字符图像具有一定大小,或者,图像获得部210能够执行将字符图像分割成多个像素等的图像处理。
由此,图像获得部210能够获得与在字符串图像中包含的字符数量一样的个别字符的字符图像。
图4是根据本发明的另一实施例,用于说明从介质的图像中获得个别字符的字符图像的方法的附图。
本实施例中举例说明如下内容,即,对图像获得部210获得介质的整体图像后,从存储器150中获取所要获得的介质的一部图像的位置信息,从而获得通过位置信息所定义的领域,即,一级字符组图像G1,并从一级字符组图像G1中获得字符图像。
图像获得部220在获得的介质的整体图像中第一次获得一次字符组图像G1。图4以图像获得部220例示性地获得一个一次字符组图像G1的方式进行说明。
一般来说,介质中印刷字符的位置已经确定。而且,存储器150中预先存储了需要按介质的大小获得的一级字符组图像G1的四个坐标信息。即,为了获得一个一级字符组图像G1,存储四个坐标信息。
按介质的券种,大小会不同,因此,根据介质的大小,字符印刷的位置也会不同。因此,在存储器150中,能够按介质的大小存储坐标信息。作为另一例,存储器150中能够存储用于确定与两个坐标信息一同需要获得的图像的大小的长度值。
因此,识别出介质的图像时,确定所识别的图像的四个顶点坐标,并且,利用与确定的四个顶点的坐标相对应的一级字符组图像G1的坐标信息,获得一级字符组图像。
在介质的图像中,能够通过切割用于获得一级字符组图像G1的坐标来定义的领域,获得一级字符组图像G1。
所获得的一级字符组图像G1包含多个字符,以下,例示性地对多个字符的不同种类和不同大小的情况进行说明。字符的种类例举字母和数字进行说明。
所获得的一级字符组图像G1包含字符和字符以外的背景信息。此时,一级字符组图像G1的背景颜色是介质的颜色,字符的颜色是黑色。
图像获得部210修改一级字符组图像G1,从而获得字符串图像。
首先,图像获得部210对所获得的一级字符组图像G1的颜色进行反转,从而获得第一组图像G11。第一组图像G11中,字符的颜色一例为白色,背景颜色为黑色。
图像获得部210执行分割(segmentation)过程,用于在颜色反转的第一组图像G11中清除不必要的背景。
此时,图像获得部210能够通过如下方式执行分割(segmentation)。
图像获得部210将第一组图像G11划分为多个像素,并求得作为横向像素的灰度值之和的各行的灰度值之和。然后,比较各行的灰度值之和,并以相邻的两行之间各行灰度值之和的差异最大的两个地点为基准,清除上侧空白和下侧空白。由此,能够清除反转的第一组图像G11的上侧空白和下侧空白。
相同地,图像获得部210将第一组图像G11划分为多个像素,并求得作为纵向像素的灰度值之和的各行的灰度值之和。然后,在相邻的两个列之间寻找灰度值之和的差异最大的两个地点,从而向两侧以位于最外侧的两个地点为基准,清除左侧空白和右侧空白。由此,能够清除第一组图像G11的左侧空白和右侧空白。
由此,能够最终获得清除不必要的空白的第二组图像G21.
但是,切割的空白的位置只是用于更容易的说明,因此,实际切割的部分会根据介质有所不同。其理由在于,是因为根据扫描状态,灰度值之差较大的地点会不同,并且,切割的地点可以是与字符的警戒部相同的位置或与字符的警戒部相分隔的位置。
第二组图像G21中,修改第二组图像G21,使得各字符的字体相同,从而获得第三组图像G31。
此时,向纵向加上字符的各像素的灰度值。按各字符,将灰度值之和画在图表上时,按各字符具有一个以上的最大值和两个最小值。两个最小值之间的距离是预期的字符的横向大小。
求得按各字符的横向大小之后,按各字符,向横向加上像素的灰度值。比较各行的灰度之和,从而在相邻的两行之间寻找灰度值之差最大的地点。按各字符,将灰度值之和画在图表上时,按各字符具有一个以上的最大值和两个最小值。两个最小值之间的距离是预期的字符的纵向大小。
所获得的各字符的横向大小和纵向大小会有所不同。因此,利用双线性插值法(bilinear interpolation)修改字符,使得横向及纵向成为一定的大小(基准字符的大小)。
此时,基准字符的大小能够在存储器150中存储或属于字符组的字符中,以某一字符的大小进行选择。作为一例,能够以大小最小的字符为基准,来确定基准字符的大小。
图像获得部210能够将通过如上的过程获得的第三组图像G31作为字符串图像使用。
即,字符串图像能够通过如下步骤获得,即,反转一级字符组图像G1的颜色的步骤;在反转颜色的第一组图像G11中,清除不必要的背景的分割步骤;及对字符的大小进行同一化的字符大小同一化步骤。
本实施例中,在字符大小同一化步骤的前或后还能执行图像锐化(imagesharpening)步骤,用于对字符的影像进行锐利化的。
图像获得部210在所获得的字符串图像中,即,在第三组图像G31中获得个别字符的字符图像N1。图像获得部210经过对获得的字符串图像进行分割的过程,来获得个别字符的字符图像N1。
此时,图像获得部210还能执行在分割过程后,对所获得的个别字符的字符图像N1的颜色进行反转的过程。因此,最终获得的个别字符的字符图像N1中,字符的颜色一例为黑色,背景颜色为白色。当然,也能在分割过程之后不执行反转过程。
本实施例中,能够在不执行对字符大小进行同一化的字符大小同一化步骤的情况下,切割第二组图像G21获得个别字符的字符图像N1。在此情况下所获得的字符图像的大小会有所不同,且在此情况下,按字符的大小,模板的大小、形态或数量中的一种以上会不同。
图5是根据本发明的一实施例,用于说明利用模板确定字符的方法的附图。
字符确定部220从图像获得部210中接收个别字符的字符图像N1,从而确定个别字符。字符确定部220对存储器150中存储的信息与所获得的个别字符的字符图像N1进行比较,从而能够确定个别字符。此时,个别字符的字符图像N1可以是以多个像素划分的。字符确定部220能够利用预设定的模板(template)对划分为多个像素的个别字符的字符图像N1判断字符信息。
模板的大小拥有比一个像素大的大小。由此,模板的大小相当于两个以上的像素之和,并如图5所示,能够设置用于确定个别字符的多个模板(T1至T3),多个模板的大小会不同。此类多个模板考虑到在介质中印刷的字符的字体,预先生产,从而在存储器150中存储。按字符或介质的种类,模板的形态或数量会不同。
本实施例中,模板并不是一种在由预定数量的像素组成的预定大小的领域内,对各像素设定像素值的通常的模板,而是只定义为由预定大小的像素组成的预定大小的领域,且各像素的像素值可以是并未设定的变形的模板。即,变形的模板可以是由预定数量的像素组成的预定大小的窗口形态。
例如,用于确定数字的模板的形态与用于确定字符的模板的形态会有所不同。或者,用于确定数字的模板的形态与用于确定字符的模板的形态会有一部分相同,而另一部分不同。并且,用于确定数字的模板的数量与用于确定字符的模板的数量会有所不同。
但是,由于在确定字符之前是不清楚字符的种类的状态,因此,首先使用用于确定数字的模板后,再使用用于确定字母的模板或按相反顺序使用模板。
字符确定部220旋转特定模板,从而将所选的特定模板位于划分为多个像素的个别字符的字符图像上之后,能够确认位于模板内像素的像素值。此时,特定模板最初定位的像素能够预先确定或能够变化。
字符确定部220能够将特定模板在个别字符的字符图像上边移动边确定字符,且在执行利用特定模板的特定字符的确定过程之后,再利用模板执行特定字符的确定过程。即,本实施例中确定一个字符的过程能够执行多次。按各次数,作为确定对象的字符的种类或数量会不同。或者,按各次数,在字符的确定中所使用的模板的形态或数量会不同。并且,能够依次利用多个模板,来确定字符。
由此,字符确定部220利用多个模板,第一次确定一个个别的字符,并且,在一个个别字符的确定结束之后,会确定之后的字符。
作为其他例,字符确定部220能够在划分为多个像素的个别字符的字符图像中,利用各像素的颜色,来确定字符。各像素的颜色能够与存储器150中存储的信息相比较,来确定字符。例如,在判断数字0的情况下,存储器150中存储着以往所获得后存储的多个数字信息,而在其中判断是否与数字0一致。
字符确定部220能够对未确定的字符进行第二次确定。
作为一例,与在存储器150中存储的多个模板中,抽取一部分模板,从而第一次确定字符的方法相同的方法对未确定的字符进行第二次确定。
作为另一例,能够利用在存储器150中存储的第一次使用的,作为与多数的一次模板不同种类模板的二次模板,对未确定的字符进行第二次确定。
并且,字符确定部220在整体字符中抽取一部分字符,从而第三次确定字符。第三次确定字符的理由在于,能够准确确定能够进行错误确定的字符。能够进行错误确定的字符通过多次的实验确定,从而预先存储于存储器150中。
例如,能够进行错误确定的字符为数字“8”和字母“B”。上述所确定的字符为“8”的情况下,有可能是将字母“B”错误地确定为“8”,因此,字符确定部220才要对一部分字符进行第三次确定。
在对字符进行第三次确定时,能够使用与第一次或第二次确定字符的步骤中使用的相同的模板或不同的模板。
根据本实施例,在第一次确定字符之后,判断所确定的字符是否准确确定时,不会以所有字符为对象,而是在字符中抽取预先确定的会发生错误确定的字符,并只将抽取的字符为对象判断是否发生错误确定。由此,具有能够缩短确定字符的时间的效果。
此时,第二次确定字符的步骤或第三次确定字符的步骤能够省略。
根据本实施例,即使所获得的介质的图像的品质不佳,也因执行字符组图像的修改过程和多次的字符确定步骤,因此,能够准确地识别字符。
图6是根据本发明的一实施例,用于说明字符识别装置根据分级结构解读字符来确定字符的方法。解读图6中记载的字符的方法能够在图1至图2中图示的字符识别装置200中进行时间序列性的处理。因此,能够了解的是,即使在下述内容中省略的内容,对于图1至图2中图示的字符识别装置200相关的上述所述的内容也适用于图6。
在图像获得部210中获得个别字符的字符图像之后,字符图像从图像获得部210向字符确定部220输入时,字符确定部220根据分级结构逐步解读字符。图6中公开的分级结构仅仅是一实施例,除此之外,还能适用多种分级结构是所属领域技术人员都能理解的。
分级结构是将预定的多个字符的集合分层性地分成由多个上位组及下位组构成的多个组的,上位组中包含的多个字符包含相关下位组中包含的多个字符。分级结构能够在外部装置中预先生成之后,在存储器150中存储后使用。以下,为了说明的方便,假设为在作为外部装置的一个数据处理器中生成分级结构的方式进行说明。数据处理器能够按如下方法生成分级结构。
首先,在数据处理器中确定条件一,上述条件一使预定的多个字符的集合作为最上位组进行组化的基准。例如,以预定字符的集合中包含的字符之间的形态的类似性为基础,来确定条件一。
数据处理器将预定的多个字符的集合根据条件一进行分类。由此,将满足条件一的多个字符作为第A组,将不满足条件一的多个字符作为第B组进行组化。
然后,在最上位组中分别包含的字符根据预定的基准,能够组化为多个下位组。例如,以各组中包含的多个字符的形态为基础,分别确定作为将各组中包含的多个字符组化为下位组的基准的条件,并根据所确定的条件,对各组中包含的字符进行分类。根据图6,将第A组的字符根据条件二进行分类,从而在第A组中包含的多个字符中,将满足条件二的多个字符作为第a组,将不满足条件二的多个字符作为第b组进行组化。第B组的多个字符根据条件三进行分类,从而在第B组中包含的多个字符中,将满足条件三的多个字符作为第c组,将不满足条件三的多个字符作为第d组进行组化。
进而,能够将上述多个下位组根据预定的基准进行更加细分化。参照图6,将第c组的字符根据条件4进行分类,从而在第c组更加细分为第一组和第二组。由此,在第c组中包含的多个字符中,将满足条件4的多个字符作为第一组,将不满足条件4的多个字符作为第二组进行组化。
根据一实施例,对数字0至9的集合生成分级结构的情况下,分级结构能够在数字0至9之间的数字中,将形态类似的数字分层性地组化为上位组和下位组的多个组。
首先,将数字0至9的集合根据预定的条件分为包含数字1、7的第A组和包含数字0、2、3、4、5、6、8、9的第B组,。然后,将数字1、7的第A组和数字0、2、3、4、5、6、8、9的第B组更加细分为各个下位组,此时,第A组还能分为包含数字1的第a组和包含数字7的第b组,第B组还能分为包含数字2、5、6的第c组和包含数字0、3、4、8、9的第d组。包含数字2、5、6的第c组能够组化为包含数字2的第一组和包含数字5、6的第二组的更低的组。
字符确定部220利用如上生成的分级结构,将输入的字符图像逐步进行解读,从而确定字符。根据图6的分级结构,字符确定部220在所输入的字符图像中适用第一模板,从而判断所述的字符图像是否满足条件一。所输入的字符图像满足条件一时,判断为属于第A组,所输入的字符图像不满足条件一时,判断为属于第B组。
然后,当字符图像属于第A组时,字符确定部220在字符图像中适用第二模板,从而判断所输入的字符图像是否满足条件二。当字符图像属于第B组时,字符确定部220在字符图像中适用第三模板,从而判断所输入的字符图像是否满足条件三。
参照图6,当字符图像属于第A组,并满足条件二的情况下,字符图像能够判断为属于第a组。并且,当字符图像属于第B组,并满足条件三的情况下,字符确定部220在字符图像中适用模板四,从而判断字符图像是否满足条件四。此时,字符确定部220在字符图像满足条件四时,属于第一组,而不满足条件四时,属于第二组。
由此,字符确定部220按分级结构的各级适用模板,从而将所输入的字符图像根据分解结构进行分层解读,从而确定字符。字符确定部220按各个阶段将上述字符图像的预定位置的字符像素的数量,背景像素的数量,或字符像素的数量和背景像素的数量的比例中的一个与基准值相比较,从而能够以比较结果为基础,如图6,对字符图像进行逐步解读。
例如,条件一至条件四在预定的位置中,能够确认预定范围内的字符像素的数是否为基准值以上。并且,条件一至条件四能够确认字符像素的数和背景像素的数的比率是否为基准值以上。
字符确定部220利用图6的分级结构,来解读字符图像,并能够以解读的结果为基础,在图6中图示的组中确定字符图像所属的组。字符确定部220能够将字符图像的字符确定为在确定的组中包含的字符中的一个。根据一实施例,字符确定部220在相关组内利用一个以上的模板,将相关文字作为一个字符来确定。
由此,字符识别装置200对于对字符图像进行解读,来确定字符方面而言,对各个别字符的字符图像,使用所有模板进行比较,从而不会确定字符。根据一实施例,根据由上位组及下位组构成的分级结构,在各个分层中,根据预定位置的一部分领域的像素是否满足预设定的条件,将字符所述的组逐渐缩短为下位组,从而确定字符,因此,在确定各个字符方面,能够大大减少所要比较的比较对象,最终能够迅速地识别字符图像的字符。
图7是用于说明本发明一实施例的字符图像的附图。以下所记述的内容能够适用于图1至图2中图示的字符识别装置200。
参照图7,图示了个别字符的字符图像。图7的字符图像由除了字符部分和字符的剩余背景部分构成。即,字符图像由字符部分所占的字符图像和背景部分所占的背景像素构成。背景像素在构成字符图像的像素中,能够由像素值为预定的像素值以上的像素来确定,而字符像素则由像素值为预定的像素值以下的像素来确定。此时,像素值能够是像素的亮度值或灰度值。作为一例,划分背景像素的预定的像素值能够是200,划分字符像素的预定的像素值能够是30。
例如,字符识别装置200在预定的多个字符的集合中包含的多个字符的各个字符图像中,以字符像素和背景像素的位置及结构的类似度为基础,利用将预定的多个字符的集合分层性地组化为上位组及下位组的分级结构,来识别字符。字符识别装置200利用如上的分解结构,逐步解读向字符识别装置200投入的介质的字符图像。
图8是在本发明一实施例的字符识别装置中,用于对利用分级结构确定介质的字符的一例进行说明的附图。以下,在字符识别装置200中,将识别图8中图示的纸币的序列号10为例进行说明。
当字符识别装置200中投入纸币时,图像获得部210获得印刷纸币的序列号10部分的图像。图像获得部210获得印刷纸币的序列号10部分的图像之后,在所获得的图像中切掉上下左右的空白部分,从而获得包含序列号10的字符串的字符串图像。
图像获得部210在所获得的字符串图像中,按序列号10的各个字符进行分割,从而获得个别字符的字符图像。在图8中图示的纸币的情况下,获得共计10个字符图像。图像获得部210中获得的供给10个字符图像依次向字符确定部220传达并解读。
在纸币的序列号10的情况下,根据纸币的种类及券种,来指定序列号10的各个位子的字符的种类。在图8中图示的纸币的情况下,序列号10的第一位及第二位为字母,剩余位为数字。
由此,字符确定部220在序列号10的第一位及第二位,将字母A至Z的集合利用分层性地分为由多个上位组及下位组构成的多个组的分级结构,对输入的字符图像逐步进行解读,而在剩余的位中,利用分层性地分为由多个上位组及下位组构成的多个组的分级结构,对输入的字符图像逐步进行解读。
在字符识别装置200中识别数字的字符图像时,利用数字集合的分级结构对字符图像逐步进行解读,而在识别字母的字符图像时,则利用字母集合的分级结构对字符图像进行解读。
如果,字符识别装置200利用数字集合的分级结构对字母的字符图像进行解读的情况下,对特定字母的字符图像进行解读时,会以特定数字进行识别。
例如,在字符识别装置200中利用数字集合的分级结构对字母E的字符图像进行解读时,会识别为数字2。作为另一例,利用数字集合的分级结构对字母E、C或K的字符图像进行解读时,能够识别为数字5、6、2中的一个。作为其他例,利用数字集合的分级结构对字母A、B、D、H或J的字符图像进行解读时,会分类为包含数字3、4、8及9的组,从而能够识别为数字3、4、8及9中的一个数字。
相反,利用字母集合的分级结构对数字8的字符图像进行逐步解读时,能够识别为字母B。
根据一实施例,将对人民币的序列号进行识别的字符识别装置200的情况作为一例进行说明时,首先,字符识别装置200从人民币中获得序列号的字符串图像后,按序列号的各个位子获得字符的字符图像。
字符识别装置200将人民币的序列号的各个位子所分配的预定的字符的集合根据分层性地分成由多个上位组及下位组构成的多个组的分级结构,逐步解读字符图像,从而确定字符。
人民币的情况下,序列号的最后一位会是0至9的数字。相反,韩币的情况下,序列号的最后一位是A至Z的字母。
由此,将在人民币的序列号位子中代替韩币的序列号进行编制的人民币在识别人民币的字符识别装置200中进行识别时,字符识别装置200会将编制的人民币的序列号的最后一位字符识别为并非字母的数字。
此时,利用识别人民币的序列号的分级机构,对特定字母的字符图像进行解读时,能够识别为特定数字。例如,人民币的序列号的最后一位的字符为字母E的情况下,能够确定为数字2。
在上述的实施例中,代替人民币的韩币的序列号的图像能够利用例如上述图7的字符图像。此时,字符图像内序列号的字体和字体大小可以是韩币中使用的字体和字体大小。
上述实施例说明了在人民币序列号的数字字符位子中代替韩币的序列号的英文字符的情况,但并不局限于此,且能够在第一国纸币的第一国序列号的预定的字符位子中代替第二国序列号的预定的字符。
由此,在第一国纸币的第一国序列号的数字字符位子中代替第二国序列号的英文字符的情况下,通过图像获得部210,从第一国纸币中获得个别字符的字符图像之后,在字符确定部220中,从个别字符的字符图像中确定个别支付时,将第二国序列号的英文字符在包含0至9的数字集合中,确定为包含一部分数字或多个数字的集合内的数字。
如上述例子,字符确定部220能够对相互不同的介质进行预订次数以上的字符的确定。在对相互不同的介质执行预定次数以上的确定的情况下,能够将相互不同介质的同一位子的预定因为字符在预定的数字字符的集合内确定。在此,预定的多个数字字符之间的集合可以是多个上位组或下位组中的一个。
例如,相互不同介质的同一位子可以是序列号的最后一位子,此时,最后一位子的预定英文字符为英文E、K或C的情况下,预定的数字字符的集合为5、5及2。作为另一例,最后一位子的预定英文字符为英文E的情况下,预定的字符的集合为2。作为其他例,最后一位子的预定英文字符为英文A、B、D、H或J的情况下,预定的数字字符的集合为3、4、8及9。作为又一其他例,最后一位子的预定英文字符为英文L的情况下,预定的数字字符的集合为1及7。
由此,字符识别装置200按介质的种类、券种及相关文字的位子都使用预先指定的分级结构,从而确定介质的字符。
图9是表示根据本发明一实施例,来确定介质的字符的字符识别方法的流程图。参照图9,在图9中记载的方法由图1至图2中图示的字符识别装置200中进行时间序列性处理的步骤构成。因此,即使在下述内容中省略的内容,对于图1至图2中图示的字符识别装置200相关的上述所述的内容也适用于图9中记载的方法中。
步骤610中,图像获得部210获得个别字符的字符图像。例如,图像获得部210能够利用光获得字符图像。
步骤620中,字符确定部220根据分级结构逐步解读图像,从而确定字符。分级结构是将预定的多个字符的集合分层性地分成由多个上位组及下位组构成的多个组的,因此,能够包含数字0至9的集合或字母A至Z的集合等。字符确定部220在预定的多个字符的集合中包含的多个字符的种类,能够利用一个以上的模板确定字符图像的字符。
图10是表示根据本发明的另一实施例,来确定介质的字符的字符识别方法的流程图。参照图10,图10中记载的方法由图1至图2中图示的字符识别装置200中进行时间序列性处理的步骤构成。因此,即使在下述内容中省略的内容,对于图1至图2中图示的字符识别装置200相关的上述所述的内容也适用于图10中记载的方法中。
步骤710中,字符识别装置200接收通过媒介质引入/取出部110投入的介质。
步骤720中图像获得部210获得介质的图像。图像获得部210能够获得并非介质整体图像的特定部分的图像。
步骤730中,图像获得部210获得字符串图像。例如,图像获得部210执行用于清除空白的图像处理,从而获得包含一个以上的字符的字符图像。
在740步骤中,图像获得部210获得个别字符的字符图像。例如,图像获得部210通过图像处理,能够将字符串图像按各字符分割为预定大小的字符图像。
在750步骤中,字符确定部220根据分级结构逐步解读字符图像,从而确定字符。例如,字符确定部220根据解读结果,在多个组中确定字符图像所属的组时,将字符图像的字符确定为包含在所确定的组中的字符中的一个。步骤760中,字符确定部220判断所输入的字符图像的字符是否识别,从而向控制部120传送判断结果。步骤750中,根据解读字符来确定字符的结果,在字符图像的字符确定为预定集合的字符中的一个时,进行步骤770,而未确定字符图像的字符时,进行步骤780。
步骤770中,控制部120根据字符识别装置200的所识别的结果,处理投入的介质。
步骤780中,用户界面部140表示在所投入的介质中发生字符识别错误。
根据本发明的多个实施例,字符识别装置200即使不与字符图像的整体图像相比较,也能利用多个上位组及下位组构成的分级结构,比较预定位置的一部分像素,从而能够迅速地识别字符图像的字符。
图11是表示根据本发明的又一实施例,来确定介质的字符的字符识别方法的流程图。参照图11,图11中记载的方法由图1至图2中图示的字符识别装置200中进行时间序列性处理的步骤构成。因此,即使在下述内容中省略的内容,对于图1至图2中图示的字符识别装置200相关的上述所述的内容也适用于图11中记载的方法中。
步骤1011中,字符识别装置200通过介质引入/取出部110接收所投入的介质。
步骤1012中,图像获得部210获得介质的图像。图像获得部210能够获得并非介质整体图像的特定部分的图像。
步骤1013中,图像获得部210修改所获得的介质的图像,从而获得字符串图像。例如,图像获得部210执行清除围绕字符串的背景的作业,颜色的反转作业,同一化字符大小的作业等图像修改,从而能够获得包含一个以上字符的字符串图像。
步骤1014中,图像获得部210获得个别字符的字符图像。此时,图像获得部210能够获得字符的大小同一化的个别字符的字符图像,也能获得字符的大小相互不同的个别字符的字符图像。
步骤1015中,字符确定部220第一次确定字符。字符确定部220能够利用多个模板获得个别字符的字符图像。但是,并不局限于此,且字符确定部220能够参照图1至图10中说明的实施例,来确定个别字符。
步骤1016中,字符确定部220第二次确定字符。字符确定部220对未确定的字符进行二度确定。作为一例,字符确定部220在存储器150中存储的多个模板中抽取一部分模板,从而对未确定的字符进行第二次确定。作为另一例,能够利用在存储器150中存储的多个模板(一次)和作为其他种类模板的二次模板,对未确定字符进行第二次确定。
在步骤1017中,字符确定部220第三次确定字符。字符确定部220为了准确确定能够发生错误确定的字符,第三次确定字符。能够发生错误确定的字符通过多次实验来确定,从而预先存储于存储器150中。在第三次确定字符时,能够使用与在第一次或第二次确定字符时使用过的模板相同的模板或不同的模板。
在步骤1018中,字符确定部220判断所输入的字符图像的字符是否识别,从而向控制部120传送判断结果。字符确定部220在所确定的整体字符中,判断整体字符是否能够识别。根据在步骤1012至步骤1017中确定字符的结果,确定了个别字符时,向步骤1019进行,而未确定个别字符时,向步骤1020进行。
步骤1019为能够识别整体字符的情况,在此,控制部120根据字符识别装置200的识别结果,对投入的介质进行处理。
步骤1020是在所判断的整体字符中,无法识别一个以上的字符的情况,用户界面部140表示在投入的介质中发生字符识别错误。但是,无法识别一个以上字符时的字符识别装置200的动作并不局限于表示发生字符识别错误。根据其他实施例,字符识别装置200通过用户界面部140不会表示发生错误,而是存储识别错误的结果,来进行管理。
根据又一实施例,字符识别装置200不会在执行步骤1020之后终止,与步骤1019一样,能够处理所投入的介质。
以上,构成本发明的实施例的所有结构要素以结合为一个的方式或结合后工作的方式进行说明,但本发明并不局限于此类实施例中。即,只要是在本发明的目的范围内,其所有结构要素都能以一个以上选择性地进行结合,从而进行工作。并且,虽然其所有结构要素都能以一个独立的硬件来体现,但各结构一要素的一部分或全部能够进行选择性的组合,从而作为具有程序模块的计算机程序来体现,上述具有程序模块的计算机程序执行在一个或多个硬件中组合的一部分或全部功能。构成上述计算机程序的代码及代码段通过本发明所属领域技术人员能够容易地推论。此类计算机程序存储于计算机能够读取的计算机可读介质(Computer Readable Media)中,通过计算机进行读取和执行,从而能够体现本发明的实施例。作为计算机程序的计算机可读介质,能够包括磁记录媒介质、光记录媒介质及载波媒介质等。
并且,以上所记载的“包含”、“构成”或“具有”等术语只要是在没有特别相反的记载的情况下,意味着能够内载相关结构因素,因此,应解释为并不是除去其他结构要素,而是还包括其他结构要素。包括技术性或科学性术语的所有术语只要是在不会进行不通过定义的情况下,通过本发明所属领域技术人员,与一般理解的术语具有相同的意义。与在词典中定义的术语一样,一般使用的术语应解释为与相关技术的文脉的意义一致,且只要是在本发明中没有明确定义,不会异常或过度地解释为形式上的意义。
以上的说明仅仅是将本发明的技术思想进行例示说明的,只要是本发明所属领域技术人员,在不会脱离本发明的本质特性的范围内,能够进行多种修整及变形。因此,本发明中公开的实施例并不是用于限定本发明的技术思想,而是用于说明本发明的,并且,根据此类实施例,并不表示本发明的技术思想的范围受到限制。本发明的保护范围应根据权利要求进行解释,并且,在与此相同等的范围内的所有技术思想应解释为包括在本发明的权利要求中。

Claims (20)

1.一种字符识别装置,其特征在于,包括:
图像获得部,其从介质获得个别字符的字符图像;及
字符确定部,其根据将预定的多个字符的集合分层性地分成由多个上位组及下位组构成的多个组的分级结构,对上述字符图像进行解读,来确定个别字符。
2.根据权利要求1所述的字符识别装置,其特征在于,上述字符确定部按上述分级结构的各个阶段将上述字符图像的预定位置的字符像素的数量、背景像素的数量或字符像素的数量和背景像素的数量的比例中的一个与基准值相比较,并以上述比较的结果为基础,确定上述个别字符。
3.根据权利要求1所述的字符识别装置,其特征在于,上述分级结构以上述预定的多个字符的集合中包含的字符之间的形态的类似性为基础,将上述预定的多个字符的集合分成上述多个组。
4.根据权利要求1所述的字符识别装置,其特征在于,上述字符确定部从上述多个组中确定上述字符图像所属的组,并将上述字符图像的上述个别字符确定为在所确定的上述组中包含的字符中的一个。
5.根据权利要求1所述的字符识别装置,其特征在于,
上述分级结构是将数字0至9分层性地分成由多个上位组及下位组构成的多个组的结构,
如果上述字符确定部利用上述分级结构解读特定字母的字符图像,就确定为特定数字。
6.根据权利要求1所述的字符识别装置,其特征在于,
上述分级结构是将数字0至9分层性地分成由多个上位组及下位组构成的多个组的结构,
如果上述字符确定部利用上述分级结构解读字母E时,就确定为数字2。
7.根据权利要求1所述的字符识别装置,其特征在于,
上述分级结构是将字母A至Z分层性地分成由多个上位组及下位组构成的多个组的结构,
如果在上述字符确定部利用上述分级结构解读数字8时,就确定为字母B。
8.根据权利要求1所述的字符识别装置,其特征在于,上述字符确定部根据在上述预定的多个字符的集合中包含的字符种类,利用至少一个以上的模板,来确定上述个别字符。
9.一种字符识别装置,其特征在于,包括:
图像获得部,其从介质获得个别字符的字符图像,及
字符确定部,其从上述个别字符的字符图像中确定上述个别字符;
上述字符确定部对相互不同的介质执行预定次数以上的上述个别字符的确定的情况下,在预定的多个数字字符的集合内确定上述相互不同的介质的同一位子的预定英文字符。
10.根据权利要求9所述的字符识别装置,其特征在于,上述相互不同的介质的同一位子是序列号的最后的位子,在上述预定英文字符为英文E、K或C的情况下,上述预定的多个数字字符的集合为5、6及2。
11.根据权利要求9所述的字符识别装置,其特征在于,上述相互不同的介质的同一位子是序列号的最后的位子,在上述预定英文字符为英文E的情况下,上述预定的多个数字字符的集合为2。
12.根据权利要求9所述的字符识别装置,其特征在于,上述相互不同的介质的同一位子是序列号的最后的位子,在上述预定英文字符为英文A、B、D、H或J的情况下,上述预定的多个数字字符的集合为3、4、8及9。
13.根据权利要求9所述的字符识别装置,其特征在于,上述相互不同的介质的同一位子是序列号的最后的位子,在上述预定英文字符为英文L的情况下,上述预定的多个数字字符的集合为1及7。
14.一种字符识别装置,其特征在于,包括:
图像获得部,其从第一国纸币获得个别字符的字符图像,及
字符确定部,其从个别字符的字符图像中确定个别字符;
用第二国序列号的英文字符代替上述第一国纸币的第一国序列号的数字字符位子的情况下,第二国序列号的英文字符被确定为从包含0至9的数字集合中包含一部分数字或多个数字的集合内的数字。
15.根据权利要求14所述的字符识别装置,其特征在于,代替上述第一国纸币的第一国序列号的数字字符位子的上述第二国序列号的英文字符的字符图像包含像素值为200以上的背景像素及像素值为30以下的字符像素。
16.一种金融设备,其特征在于,包括:
介质引入/取出部,用于引入或取出包含多个字符的介质;
字符识别装置,从上述介质中获得个别字符的字符图像,并根据将预定的多个字符的集合分层性地分成由多个上位组及下位组构成的多个组的分级结构,对上述字符图像进行解读,来确定字符;及
控制部,用于控制上述介质引入/取出部和上述字符识别装置的动作。
17.一种金融设备,其特征在于,包括:
介质引入/取出部,用于引入或取出包含由不同种类和大小的字符构成的多个字符的介质;及
字符识别装置,获得上述介质的图像,从所获得的上述介质的图像中获得字符串图像,并以所获得的上述字符串图像为基础,获得个别字符的字符图像,来从上述字符图像中确定上述个别字符。
18.一种金融设备,其特征在于,上述字符识别装置从上述字符图像中第一次确定上述个别字符,并第二次确定上述第一次确定的结果未被确定的字符,在上述字符串图像中包含的所有字符中提取一部分个别字符的字符图像并第三次确定字符。
19.根据权利要求17所述的金融设备,其特征在于,上述字符识别装置从上述字符串图像包含的整体字符中对能够产生错误确定的字符进行第三次确定。
20.根据权利要求17所述的金融设备,其特征在于,上述字符识别装置利用多个模板,第一次、第二次或第三次确定字符,每次所使用的模板的形态和数量都不同。
CN201310329263.2A 2012-07-31 2013-07-31 字符识别方法、字符识别装置及金融设备 Active CN103577820B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2012-0083895 2012-07-31
KR1020120083895A KR101337022B1 (ko) 2012-07-31 2012-07-31 금융기기, 매체감지장치 및 매체감지방법
KR10-2013-0087482 2013-07-24
KR1020130087482A KR101470748B1 (ko) 2013-07-24 2013-07-24 문자 인식 방법, 문자 인식 장치 및 금융기기

Publications (2)

Publication Number Publication Date
CN103577820A true CN103577820A (zh) 2014-02-12
CN103577820B CN103577820B (zh) 2017-08-25

Family

ID=50025519

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310329263.2A Active CN103577820B (zh) 2012-07-31 2013-07-31 字符识别方法、字符识别装置及金融设备

Country Status (2)

Country Link
US (1) US9563811B2 (zh)
CN (1) CN103577820B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256520A (zh) * 2017-12-27 2018-07-06 中国科学院深圳先进技术研究院 一种识别硬币年份的方法、终端设备及计算机可读存储介质
CN110135413A (zh) * 2019-05-08 2019-08-16 深圳前海达闼云端智能科技有限公司 一种字符识别图像的生成方法、电子设备和可读存储介质

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046252B (zh) * 2014-11-21 2018-09-07 华中科技大学 一种人民币冠字码识别方法
FR3048099B1 (fr) * 2016-02-18 2018-03-23 Airbus Operations Systeme de controle permettant la comparaison de deux chaines de caracteres et procede d'installation d'une nouvelle configuration dans un aeronef
CN108073927B (zh) * 2016-11-18 2020-05-15 深圳怡化电脑股份有限公司 一种字符识别方法及装置
AU2018221709B2 (en) * 2017-02-17 2022-07-28 The Coca-Cola Company System and method for character recognition model and recursive training from end user input
US10679101B2 (en) 2017-10-25 2020-06-09 Hand Held Products, Inc. Optical character recognition systems and methods
US20230139004A1 (en) * 2021-10-29 2023-05-04 Samsung Electronics Co., Ltd. Methods and systems for semantically segmenting a source text image based on a text area threshold determination

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040086179A1 (en) * 2002-11-04 2004-05-06 Yue Ma Post-processing system and method for correcting machine recognized text
US20070058856A1 (en) * 2005-09-15 2007-03-15 Honeywell International Inc. Character recoginition in video data
CN101809631A (zh) * 2007-09-27 2010-08-18 光荣株式会社 纸张处理装置
CN101923741A (zh) * 2010-08-11 2010-12-22 西安理工大学 一种基于验钞机的纸币号码识别方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07200736A (ja) 1993-12-29 1995-08-04 Canon Inc 文字認識方法及びその装置
US5999647A (en) * 1995-04-21 1999-12-07 Matsushita Electric Industrial Co., Ltd. Character extraction apparatus for extracting character data from a text image
KR100289641B1 (ko) 1997-08-13 2001-05-02 구자홍 지폐류 인식방법
US6510238B2 (en) * 1999-05-13 2003-01-21 Currency Systems International, Inc. Partial OCR note confirmation methods
JP2002342288A (ja) 2001-05-21 2002-11-29 Casio Comput Co Ltd 認証装置、認証システム、認証方法、認証プログラム及び記録媒体
AUPR824401A0 (en) * 2001-10-15 2001-11-08 Silverbrook Research Pty. Ltd. Methods and systems (npw002)
KR100489550B1 (ko) 2002-08-19 2005-05-16 (주)신우아이티 일련번호 추출기능을 가진 유가증권 계수 장치 및 그방법
JP4788106B2 (ja) * 2004-04-12 2011-10-05 富士ゼロックス株式会社 画像辞書作成装置、符号化装置、画像辞書作成方法及びそのプログラム
CN100369049C (zh) * 2005-02-18 2008-02-13 富士通株式会社 灰度字符的精确分割装置及方法
KR100719608B1 (ko) 2005-07-21 2007-05-17 주식회사 씨텍 지폐 일련번호 인식 방법 및 장치
US8417017B1 (en) * 2007-03-09 2013-04-09 Cummins-Allison Corp. Apparatus and system for imaging currency bills and financial documents and method for using the same
KR100874752B1 (ko) 2007-03-14 2008-12-19 김용환 지폐 인식장치 및 그 인식방법
KR100893613B1 (ko) 2007-12-06 2009-04-20 주식회사 씨텍 지폐 및 바코드가 표시된 유가증권의 인식계수방법과 그장치
KR101149843B1 (ko) 2009-10-08 2012-05-24 주식회사 카스모아이티 유가증권의 일련번호 인식방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040086179A1 (en) * 2002-11-04 2004-05-06 Yue Ma Post-processing system and method for correcting machine recognized text
US20070058856A1 (en) * 2005-09-15 2007-03-15 Honeywell International Inc. Character recoginition in video data
CN101809631A (zh) * 2007-09-27 2010-08-18 光荣株式会社 纸张处理装置
CN101923741A (zh) * 2010-08-11 2010-12-22 西安理工大学 一种基于验钞机的纸币号码识别方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256520A (zh) * 2017-12-27 2018-07-06 中国科学院深圳先进技术研究院 一种识别硬币年份的方法、终端设备及计算机可读存储介质
CN110135413A (zh) * 2019-05-08 2019-08-16 深圳前海达闼云端智能科技有限公司 一种字符识别图像的生成方法、电子设备和可读存储介质
CN110135413B (zh) * 2019-05-08 2021-08-17 达闼机器人有限公司 一种字符识别图像的生成方法、电子设备和可读存储介质

Also Published As

Publication number Publication date
US20140037181A1 (en) 2014-02-06
US9563811B2 (en) 2017-02-07
CN103577820B (zh) 2017-08-25

Similar Documents

Publication Publication Date Title
CN103577820A (zh) 字符识别方法、字符识别装置及金融设备
Eskenazi et al. A comprehensive survey of mostly textual document segmentation algorithms since 2008
US10846523B2 (en) System and method of character recognition using fully convolutional neural networks with attention
EP0011388B1 (en) System and method for processing documents
CN106874909A (zh) 一种图像字符的识别方法及其装置
JP6528147B2 (ja) 会計データ入力支援システム、方法およびプログラム
US20110280481A1 (en) User correction of errors arising in a textual document undergoing optical character recognition (ocr) process
EP2830024A1 (en) System for reading paper sheet serial number, and method for reading paper sheet serial number
CN103870823A (zh) 字符识别装置及方法、字符识别程序
CN104951781A (zh) 字符辨识装置以及识别函数生成方法
JP2019079347A (ja) 文字種推定システム、文字種推定方法、および文字種推定プログラム
US8391606B2 (en) Image processing device, image processing method, and computer readable medium
EP3477547B1 (en) Optical character recognition systems and methods
US10706337B2 (en) Character recognition device, character recognition method, and recording medium
JP7021496B2 (ja) 情報処理装置及びプログラム
Kumar et al. Line based robust script identification for indianlanguages
US11100356B2 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP6118646B2 (ja) 帳票処理装置、帳票処理方法、帳票処理プログラム
JP6007720B2 (ja) 情報処理装置及び情報処理プログラム
KR101470748B1 (ko) 문자 인식 방법, 문자 인식 장치 및 금융기기
KR101718877B1 (ko) 라벨 프린터 기반 범용 프린터 드라이버 구동 방법 및 기록매체
JP5886181B2 (ja) バーコード画像補正装置、通帳処理装置、及び自動取引装置
JP7231844B2 (ja) 情報処理装置、情報処理方法、プログラム
CN106959940A (zh) 一种便于文档自动化录入的文档格式及转换和识别方法
JP2010152464A (ja) 文字認識装置、文字認識装置の確認画面生成方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20180905

Address after: Gyeonggi Do, South Korea

Patentee after: Aiteke AP Co., Ltd.

Address before: Seoul, South Kerean

Patentee before: LG N-sys Inc.

TR01 Transfer of patent right