CN103460222A - 字符串切出方法以及字符串切出装置 - Google Patents

字符串切出方法以及字符串切出装置 Download PDF

Info

Publication number
CN103460222A
CN103460222A CN2011800690001A CN201180069000A CN103460222A CN 103460222 A CN103460222 A CN 103460222A CN 2011800690001 A CN2011800690001 A CN 2011800690001A CN 201180069000 A CN201180069000 A CN 201180069000A CN 103460222 A CN103460222 A CN 103460222A
Authority
CN
China
Prior art keywords
character
character string
frame
evaluation
estimate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011800690001A
Other languages
English (en)
Other versions
CN103460222B (zh
Inventor
后藤雅典
米泽亨
黑岩素子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glory Ltd
Original Assignee
Glory Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glory Ltd filed Critical Glory Ltd
Publication of CN103460222A publication Critical patent/CN103460222A/zh
Application granted granted Critical
Publication of CN103460222B publication Critical patent/CN103460222B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/147Determination of region of interest
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)

Abstract

一种字符串切出方法,对拍摄了印刷了字符串的纸张类的纸张类图像施加字符框而切出字符的图像,将包围形成字符串的字符的大小的区域设定为字符部,将与该字符部相邻的环状区域设定为外周部,将包围多个外周部的区域设定为字符串框,在纸张类图像上移动字符串框的位置的同时将在字符串框中包含的全部字符部作为对象,算出从外周部的特征量减去字符部的特征量的差分,且算出基于该差分的字符串框评价值,使用在字符串框评价值最大的位置上设定的字符框来切出字符部内的图像。

Description

字符串切出方法以及字符串切出装置
技术领域
本发明涉及从拍摄了纸张类的纸张类图像中切出字符串而进行字符识别时的字符串切出方法以及字符串切出装置。
背景技术
在纸币、支票、票据或商品券等的纸张类中,作为识别号而印刷有用于确定该纸张类的字符串。在纸币的情况下,该识别号被称为序列号。例如,在发现了伪造纸币的情况下,能够利用该序列号来确认该伪造纸币是否为自行交易的纸币。因此,在金融机构等中,存在想要对该序列号自动地进行字符识别并注册在数据库中,对交易的纸币进行管理的要求。
为了利用纸币的序列号而构筑数据库,需要对作为数据而注册的序列号准确地进行字符识别,但该字符识别是从拍摄了纸币的纸币图像中切出序列号图像而进行。因此,需要确定作为序列号的字符串的位置而准确地切出图像。作为用于切出图像上的字符串的技术,例如在专利文献1中,公开了基于颜色信息而区分背景和字符串,仅切出字符串的图像的方法。具体而言是如下方法:利用彩色的纸币图像,通过从包含字符串的区域的图像中去掉表示背景的颜色的像素而仅切出字符串的图像。
此外,在专利文献2中,公开了利用在字符和背景中浓度不同的情况而切出字符串的图像的方法。具体而言是如下方法:通过包含字符串的区域,生成投射了图像的浓度的直方图,并将浓度投射值超过预定阈值的区域作为字符串图像而切出。通过调整阈值,使得切出的区域的宽度与预先设定的字符串图像的宽度在容许范围内一致,能够从背景或污渍中分离序列号图像而切出。
此外,在专利文献3中,公开了通过字符切出窗口在字符串上进行扫描而检测各字符的位置,从而一个字符一个字符地切出形成字符串的各字符的方法。具体而言是如下方法:利用字符切出窗口,该字符切出窗口由与在形成字符串的字符中大小最小的字符匹配而设置的中心区域、在中心区域的外侧与最大的字符匹配而设置的带状的外接区域、在外接区域的外侧基于各字符间的间隔而设置的带状的背景区域构成。通过在被2值化的字符串图像上移动字符切出窗口,当在背景区域以及外接区域中形成区域内的字符的像素的合计面积满足预定条件且在中心区域中字符的投射长度满足预定值的情况下,将该位置检测作为字符位置而切出字符图像。
现有技术文献
专利文献
专利文献1:特开2010-225013号公报
专利文献2:特开平6-301814号公报
专利文献3:特公平7-99532号公报
发明内容
发明要解决的课题
但是,在利用颜色信息的专利文献1的方法中,存在在印刷的字符串和背景为同色系的情况下不能区分背景和字符串的情况。纸币根据发行国或现金种类而具有各种大小、颜色、花纹等,但也有序列号以与背景相同的色系而被印刷的情况,不能应对这样的情况。
此外,在利用表示了字符串的浓度的直方图的专利文献2的方法中,存在若在字符串附近印刷了字符识别对象外的字符或者在字符串的背景中有图案或花纹,则不能准确地切出字符串的情况。存在在纸币上除了序列号以外还印刷了与发行国有关的信息或金额等的信息的情况。此外,也存在在序列号的背景中描画了图案或花纹的情况。若存在序列号以外的字符或背景的花纹,则因直方图的值变化,所以对序列号的切出处理产生影响。
具体而言,例如图20(A)所示,若在表示序列号区域101的Y方向的浓度分布的直方图中切出超过图示的阈值h的区域,则成为仅切出在序列号102的上部印刷的切出对象外的字符串103的图像。此外,即使将阈值降低为包含序列号102,通过切出包含对象外字符串103和序列号102两者的图像区域,也不能切出仅包含序列号102的图像。其结果,存在即使在切出的区域中进行字符识别也不能对序列号102准确地进行字符识别的情况。另外,也有缩小作为序列号区域101的区域的Y方向的高度,使得对象外的字符串103不包含在区域101内的方法,但存在因在序列号102的印刷位置上存在误差,所以不能缩小的情况。此外,如图20(B)所示,在序列号102的背景中描画了花纹的情况下,受到背景的影响。即使在表示序列号区域101的X方向的浓度分布的直方图中切出超过图示的阈值h的区域,也不能准确地确定形成序列号102的各字符的位置。
此外,在利用相当于一个字符量的大小的字符切出窗口的专利文献3的方法中,如图20(B)所示的情况下,也因字符和背景的浓度差小所以不能准确地检测各字符的位置,不能切出各字符。
本发明是为了解决上述现有技术的课题而完成的,其目的在于,提供一种字符串切出方法以及字符串切出装置,在字符串的附近印刷了处理对象外的字符串的情况下或在字符串的背景中有图案或花纹的情况下,也能够确定形成字符串的各字符的位置而准确地切出该图像。
用于解决课题的手段
为了解决上述的课题并达到目的,提供一种字符串切出方法,对拍摄了印刷或者打印了字符串的纸张类的纸张类图像施加字符框而切出字符串的图像,其特征在于,包括:字符串框设定步骤,将包括形成字符串的各字符的区域设定为字符部,将与该字符部的周围相邻的环状区域设定为外周部,将字符部和其外周部合起来的部分设定为字符框,将包含全部字符框的区域设定为字符串框;特征量算出步骤,将各字符框作为对象,算出字符部内以及外周部内的各图像的特征量;评价值算出步骤,将字符串框作为对象,算出基于先算出的特征量的字符串框评价值;字符串框移动步骤,在纸张类图像上移动字符串框的位置;以及图像切出步骤,使用字符串框评价值最大的位置上的字符串框,切出字符部内的图像。
此外,本发明在上述发明中,其特征在于,根据纸张类的种类而设定字符串框。
此外,本发明在上述发明中,其特征在于,特征量为区域内全像素的浓度平均值。
此外,本发明在上述发明中,其特征在于,在字符串框设定步骤中,除了形成字符串的字符之外,也对与字符串相邻的余白部分设定字符部以及外周部,在评价值算出步骤中,将基于对余白部分设定的字符部以及外周部的特征量的值从字符串框评价值中减去所得的值作为字符串框评价值。
此外,本发明在上述发明中,其特征在于,在字符串框设定步骤中,除了形成字符串的字符之外,也对印刷在纸张类的切出对象外的字符设定字符部以及外周部,在评价值算出步骤中,将基于对切出对象外的字符设定的字符部以及外周部的特征量的值从字符串框评价值中减去所得的值作为字符串框评价值。
此外,本发明在上述发明中,其特征在于,在字符串框设定步骤中,除了形成字符串的字符之外,也对与字符串以预定的位置关系印刷在纸张类的切出对象外的字符或者花纹设定字符部以及外周部,在评价值算出步骤中,将基于对切出对象外的字符或者花纹设定的字符部以及外周部的特征量的值加到字符串框评价值所得的值作为字符串框评价值。
此外,本发明在上述发明中,其特征在于,在图像切出步骤中,不切出对余白部分、切出对象外的字符或者花纹设定的字符部内的图像。
此外,本发明在上述发明中,其特征在于,还包括:将在纸张类图像上设定的字符串框的位置固定的状态下,将字符部以及外周部相对于字符串框沿着预定方向移动规定像素量而算出特征量的步骤,在评价值算出步骤中,在字符串框被固定的位置中字符部以及外周部移动后的字符串框评价值大于移动前的字符串评价值时,将字符串框评价值作为移动后的值,在图像切出步骤中,将移动后的字符部内的图像作为切出对象。
此外,本发明在上述发明中,其特征在于,还包括:第1部分评价步骤,将在字符串框中包含的多个字符框中的一部分作为对象,执行除了图像切出步骤之外的各步骤而算出特征量以及字符串框评价值,只对从通过第1部分评价步骤而算出的所述字符串框评价值成为最大值到规定位次以内的字符串框的位置,执行将字符框的全部作为对象的特征量算出步骤、评价值算出步骤以及图像切出步骤。
此外,本发明在上述发明中,其特征在于,还包括:第2部分评价步骤,将在字符串框中包含的多个字符框中的一部分作为对象,算出特征量以及字符串框评价值,只对通过第2部分评价步骤而算出的字符串框评价值超过规定阈值的字符串框的位置,执行将字符框的全部作为对象的特征量算出步骤、评价值算出步骤以及图像切出步骤。
此外,本发明提供一种字符串切出装置,通过接收拍摄了印刷或者打印了字符串的纸张类的纸张类图像并实施字符串框而切出字符串的图像,其特征在于,包括:斜行校正部,在纸张类图像倾斜的情况下校正该倾斜;部分区域提取部,从纸张类图像或者通过斜行校正部校正后的纸张类图像提取包含字符串的区域;评价值算出部,将包括形成字符串的字符的区域设定为字符部、将与字符部的周围相邻的环状区域设定为外周部、将所述字符部和其外周部合起来的部分设定为字符框、将包含全部所述字符框的区域设定为字符串框,一边移动字符串框的位置一边算出字符部以及外周部的图像的特征量,且将字符部的全部作为对象,算出基于在各位置中算出的外周部以及字符部的特征量的字符串框评价值;以及字符位置决定部,将字符串框评价值最大的所述字符串框的位置中的字符部决定为切出图像的区域。
发明效果
根据本发明,由于对形成在纸张类上印刷的字符串的各字符设定字符部以及外周部,一边变更包含字符部以及外周部的字符串框的位置,一边相对地评价从在字符串框中包含的全部字符部以及外周部算出的字符串评价值而决定字符串框的位置,切出在字符部中包含的各字符的图像,所以能够抑制切出对象外的字符串或背景的花纹等的影响,能够准确地切出形成字符串的各字符的图像。
此外,根据本发明,由于根据成为处理对象的纸张类的种类来设定字符部、外周部、字符串框,所以能够按每个纸张类设定适当的字符串框,准确地切出形成字符串的各字符的图像。
此外,根据本发明,由于能够根据在字符部以及外周部的各自中包含的全像素的浓度平均值来算出字符串评价值,所以能够利用灰度(gray scale)的纸张类图像而准确地确定字符串的位置。
此外,根据本发明,由于除了字符串之外对与字符串相邻的余白部分也设定字符部以及外周部,将评价式设定为在错误识认了字符串的位置的情况下评价值降低,所以能够准确地确定字符串的位置而不会将进行了位偏移的位置错误识认为准确的位置。
此外,根据本发明,由于与切出对象外的字符串匹配地设定字符部以及外周部,将评价式设定为在存在将切出对象外字符串错误识认为切出对象字符串的可能性的位置中评价值降低,所以能够准确地确定字符串的位置而不会将切出对象外字符串错误识认为切出对象字符串。
此外,根据本发明,由于除了字符串之外也对成为确定字符串的位置的依据的特征部设定字符部以及外周部,将评价式设定为在准确地确定了字符串的位置的情况下评价值提高,所以能够准确地确定字符串的位置。
此外,根据本发明,由于能够按每个字符部设定是否将字符部内的图像设为切出对象,所以能够设定与利用目的相对应的各种种类的字符部或外周部来利用。
此外,根据本发明,由于以固定了字符串框的状态,以像素单位相对于字符串框移动字符部以及外周部的位置而评价,所以即使是在因各字符的印刷位置偏移或图像歪斜而在纸张类图像上形成字符串的各字符的图像没有成为水平且等间隔的状态的情况下,也能够准确地确定各字符的位置。
此外,根据本发明,由于只利用形成字符串框的字符部以及外周部的一部分而求出字符串框评价值,筛选了应评价的字符串框在图像上的位置之后,只有在该位置上利用包含在字符串框中的全部字符部以及外周部而详细地评价,所以能够降低整体的处理量而使处理高速化。
此外,根据本发明,由于只利用形成字符串框的字符部以及外周部的一部分而求出字符串框评价值,且只有在该值满足规定阈值的情况下,利用在字符串框中包含的全部字符部以及外周部而详细地评价,所以能够降低整体的处理量而使处理高速化。
此外,根据本发明,利用字符串切出装置,抑制切出对象外的字符串或背景的花纹等的影响,能够准确地切出形成字符串的各字符的图像。能够将该字符串切出装置与生成纸张类图像的扫描仪或纸张类处理装置连接而利用,或者以在纸张类处理装置中内置的状态利用,或者为了处理在存储装置中存储的纸张类图像而利用。
附图说明
图1是实施例1的字符串切出装置的概略结构的说明图。
图2是说明字符串切出装置的纸张类图像的斜行校正的说明图。
图3是说明用于确定字符串的位置而利用的字符框的说明图。
图4是说明字符部的设定方法的说明图。
图5是说明由字符框构成的字符串框的说明图。
图6是说明在存储器中存储的字符框信息的内容的说明图。
图7是说明利用字符串框而确定字符串的位置的方法的说明图。
图8是说明在图像上确定字符的位置的方法的流程图。
图9是说明算出字符串框评价值的方法的流程图。
图10是说明字符框评价值的说明图。
图11是说明实施例2的字符串框的说明图。
图12是说明字符串框内的字符框的移动的说明图。
图13是表示字符串框内的各字符框的移动的例子的说明图。
图14是说明作为实施例3的背景框之一的余白框的说明图。
图15是表示背景框的例子的说明图。
图16是表示利用背景框的纸币图像的例子的说明图。
图17是表示包含字符框以及背景框的字符串框的例子的说明图。
图18是说明只利用实施例4的一部分字符框而使处理速度高速化的方法的流程图。
图19是说明只利用一部分字符框而使处理速度高速化的其他方法的流程图。
图20是说明利用了直方图的字符串切出方法的现有例的说明图。
具体实施方式
以下,参照附图,详细说明本发明的字符串切出方法以及字符串切出装置的优选的实施例。
若规定了在纸张类的表面上打印或者印刷的字符的大小以及间隔,则本发明能够应用于商品券、支票、票据、纸币以及帐票等的各种纸张类中,但在以下的实施例中,将纸币作为处理对象。在纸币上,作为识别符而印刷了作为字符串的序列号。说明从拍摄了纸币的纸币图像中切出形成该序列号的各字符的图像的情况。具体而言,字符串切出装置将印刷了序列号的纸币图像作为处理对象,利用本发明的字符串切出方法而在纸币图像上确定形成序列号的各字符的位置,进行切出序列号图像或者形成序列号的各字符的图像的处理。另外,以下,为了简化说明,有记载为切出序列号、字符串或者字符的情况,但这些意味着以不包含周围的字符、花纹以及图案等且仅包含作为序列号的字符串或者形成该字符串的各字符的方式,从纸币图像中切出部分图像。
实施例1
图1表示本实施方式的字符串切出装置10的结构概略的方框图和在利用字符串切出装置10时连接的结构部的例子。
首先,说明在利用字符串切出装置10时连接的结构部。字符串切出装置10与扫描仪1、现金种类识别部2以及字符识认部5连接而利用。字符串切出装置10接收由扫描仪1生成的纸币图像,基于从现金种类识别部2接收到的现金种类信息而从纸币图像切出序列号或者形成序列号的各字符,并发送到字符识认部5。
具体而言,字符串切出装置10进行从扫描仪1接收对纸币进行扫描而取得的纸币图像,并从该纸币图像中切出包含有序列号或者形成序列号的各字符的区域的部分图像的处理。其中,若能够取得包含有成为处理对象的序列号的纸币图像,则该方法并不特别限定,例如既可以是纸币图像从CCD摄像机等的其他的摄像装置输入,也可以读出在存储器或硬盘等的存储装置或者存储介质中保存的纸币图像而利用。
字符串切出装置10在从包含有序列号的纸币图像中切出包含有序列号的部分区域的图像时,利用与印刷了序列号的位置、形成序列号的字符数或各字符的字符尺寸等有关的信息。由于在纸币上印刷的序列号的印刷位置、字符数、字符尺寸等按纸币的每个现金种类决定,所以字符串切出装置10从现金种类识别部2接收与成为处理对象的纸币图像有关的现金种类信息。例如,在成为处理对象的纸币图像为在纸币处理装置内正在处理中的纸币,且由扫描仪1生成纸币图像、利用所生成的纸币图像而由现金种类识别部2进行现金种类识别的情况下,字符串切出装置10从扫描仪1接收纸币图像并从现金种类识别部2接收现金种类信息而利用。另外,字符串切出装置10在将在存储器等的存储装置中保存的纸币图像作为对象进行处理的情况下,既能够利用与纸币图像相关联保存的现金种类信息,也能够通过现金种类识别部2识别所保存的纸币图像而取得现金种类信息。
字符串切出装置10将切出的序列号或者形成序列号的各字符的图像发送到字符识认部5。字符识认部5利用OCR等的技术对接收到的图像进行字符识认,并变换为文本数据。这样从纸币图像中提取并成为了文本数据的序列号例如用于管理与在纸币处理装置中处理的纸币有关的信息。
另外,既可以是用于取得纸币图像的扫描仪1、现金种类识别部2、字符识认部5内置在字符串切出装置10中的结构,也可以是各结构部(1、2以及5)以及字符串切出装置10作为结构部而内置在纸币处理装置等中的结构。
接着,说明字符串切出装置10的结构。字符串切出装置10包括控制部3以及存储器4。
控制部3包括校正纸币图像的斜行的斜行校正部3A、从校正后的纸币图像中提取包含序列号的部分区域的部分区域提取部3B、设定用于在提取出的部分区域内确定序列号的位置的字符框而进行评价的字符串框评价值算出部3C、基于评价了字符框的评价值而决定形成序列号的各字符的位置的字符位置决定部3D。
此外,在存储器4内,存储有包含字符框的高度或宽度等的信息的字符框信息4A、包含序列号的高度或宽度等的信息的字符串信息4B。另外,也有在存储器4内,包含与在印刷了序列号的区域附近或者序列号的背景设定的余白框或背景框有关的背景框信息4C的情况,但关于这些的细节将在后面叙述。
接着,说明字符串切出装置10的各结构部的细节。斜行校正部3A具有校正从扫描仪1接收到的纸币图像的倾斜的功能。作为生成纸币图像的方法,有通过具有供纸器(feeder)的单体的扫描仪1对纸币进行扫描的方法、或通过在纸币处理装置内部中包含的扫描仪1对在纸币处理装置内部的搬运路上搬运的纸币进行扫描的方法。在相对这样固定的扫描仪1移动纸币的同时进行了扫描的情况下,有如图2(A)所示那样纸币图像100相对矩形形状的图像200倾斜而被拍摄的情况。相对扫描仪1移动的纸币进行斜行成为原因。斜行校正部3A在从扫描仪1输入的图像200中如图2(A)所示那样纸币图像100倾斜的情况下,如图2(B)所示,旋转图像200,使得成为图像200的各边和对应的纸币图像100的各边平行的图像。即,从图2(A)所示的序列号102倾斜的状态到图2(B)所示,校正斜行引起的图像的倾斜,以便序列号102成为与图像200的底边平行的状态。
部分区域提取部3B具有从进行了斜行校正的纸币图像200中,将包含序列号102的部分区域101作为部分图像而提取的功能。序列号102在纸币上被印刷的位置或形成序列号102的字符串的高度以及宽度根据纸币的现金种类而决定。因此,控制部3从现金种类识别部2接收纸币图像100的现金种类信息。部分区域提取部3B基于该现金种类信息,从纸币图像100提取部分区域101。要提取的部分区域101为如图2(C)所示那样包含序列号102的矩形图像。另外,要提取的部分区域101上纸币图像100上的位置、宽度以及高度等的信息作为字符串信息4B而存储在存储器4内。由于字符串信息4B与现金种类信息相关联保存,所以能够基于从现金种类识别部2接收到的现金种类信息而读出字符串信息4B。
另外,表示了在通过斜行校正部3A校正了纸币图像100的倾斜之后提取包含序列号102的部分区域101的图像的例子,但本发明并不限定于此。如图2(C)所示,只要能够获得包含序列号102的部分区域101的图像,则也可以例如从倾斜纸币图像100中提取包含序列号102的部分区域101的图像之后、校正该部分区域101的图像的倾斜。
字符串框评价值算出部3C具有在由部分区域提取部3B从纸币图像100提取出的部分区域101内设定字符串框,一边在部分区域101的图像上移动字符串框,一边算出用于评价字符串框的评价值的功能。然后,字符位置决定部3D基于由字符串框评价值算出部3C算出的评价值来确定字符串框的基点,决定用于形成序列号102的各字符的位置。
字符串框评价值算出部3C以及字符位置决定部3D进行的处理的细节将在后面叙述,首先,参照图3至图6说明字符框20。
如图3所示,字符框20由字符部21、与字符部21的外周相邻的四角环状的外周部22形成。字符部21的大小与在形成序列号102的各位的位置中印刷的字符中的最大字符匹配地设定。具体而言,例如在“1”和“8”中字符宽度等的大小不同的情况下,与尺寸大的“8”匹配地设定了字符部21。即,字符部21设定为在该位位置中出现的字符中的最大字符收敛于内部。
具体而言,例如图4(A)所示,在使用英文字母的字符位置中被使用的字符中字符“B”的尺寸最大的情况下,与其匹配地设定字符部21。由此,在各字符位置中的字符部21的尺寸被固定,对于例如“I”那样字符宽度窄的字符也利用相同的大小的字符部21。同样地,如同图(B)所示,在使用数字的字符位置中数字“3”的尺寸最大的情况下,与其匹配地设定字符部21,即使是在例如“1”那样字符宽度窄的情况下,也使用相同的尺寸的字符框20。
若决定字符部21的尺寸,则如图3所示,设定与其外周相邻的预定宽度的环状的外周部22。外周部22以包含形成序列号102的字符的周围、即字符的背景的方式,以若干个像素的宽度设定。
另外,字符部21的形状并不限定于矩形,只要设定为在该字符位置中包含字符且将相邻的字符不包含在区域内,则例如也可以是圆形状或椭圆形状等的区域。同样地,关于外周部22,只要设定为以与字符部21相邻的形状不包含相邻的字符,则除了环状之外也可以是一部分被切出的带状的区域。
图5表示通过参照图3以及图4说明的方法设定的字符框20的例子。如图5(A)所示,在形成序列号102的各字符的位置中,由设定为包含具有被使用的可能性的全部字符的字符部21以及在其外周设定为环状的外周部22形成字符框20。只要设定为在字符部21的外周不会产生与相邻的字符位置的字符部21重复的区域,则并不限定外周部22的宽度,但优选如上所述设定为若干个像素宽度。此时,如图5(A)所示,也可以在相邻的外周部22之间产生不包含在字符框20的间隙区域23。字符串框24以全部字符框20包含在内部的方式被设定在外周部22的外侧,在有间隙区域23的情况下,设定为间隙区域23以及字符框20包含在其内部中。
另外,在形成序列号102的各字符的大小根据字符位置而不同的情况下,如图5(B)或图5(C)所示,也有在字符串框24内设定不同的大小的字符框20的情况。字符串框24设定为包含位于形成序列号102的字符串的最左侧的字符框20、位于最右侧的字符框以及尺寸最大的字符框20的全部的矩形区域。此外,在各字符的间隔不是一定的情况下,也有如图5(D)所示,只有一部分间隙区域23大于其他间隙区域的情况。此外,在各字符的位置或字符的间隔根据被使用的字符而变化的序列号的情况下,也有如图5(E)所示,对多个字符位置设定一个字符框的情况。这样,字符框20以及字符串框24的位置或大小并不特别限定,与序列号102的结构匹配地适当地设定。
用于设定字符部21、外周部22以及字符框20、字符串框24的信息作为字符框信息4A而预先存储在存储器4内。具体而言,如图6所示,例如关于形成序列号102的各字符,相对于字符串框24的左上端的基点30的字符框20左上端部31以及字符部21左上端部32的相对坐标、字符框20的宽度Wf以及高度Hf、字符部21的宽度Wc以及高度Hc包含在字符框信息4A中。即,若在存储器4内设定基点30,则如图6所示,必要的信息作为字符框信息4A而被存储,使得能够设定由在各字符位置中的字符部21以及外周部22构成的字符框20、包含全部字符框20的字符串框24。若将基点30设定在纸币图像上的适当的位置,则字符框20以及字符串框24设定为形成序列号102的各字符包含在对应的各字符部21的区域内部中。
接着,参照图7说明字符串框评价值算出部3C的处理内容的概要。若通过斜行校正部3A以及部分区域提取部3B的处理,如图7(A)所示那样提取出包含序列号102的部分区域101的图像,则字符串框评价值算出部3C首先如图7(B)所示那样设定包含由字符部21(m)以及外周部22(m)构成的字符框20(m)和间隙区域23的字符串框24。这里,“m”对应于在字符串框24中包含的字符数,左端的字符框表示为20(1)、形成该字符框20(1)的字符部以及外周部分别表示为21(1)以及22(1)。
若设定字符串框24,则接着,如图7(C)所示那样,将部分区域101的左上端30a作为起点、将设定的字符串框24的右下端与部分区域101的右下端一致时的字符串框24的基点30的位置作为终点30b,设定将起点30a以及终点30b作为顶点的基点扫描区域40。在该基点扫描区域40中包含的各像素的位置成为基点30可取的坐标。字符串框评价值算出部3C在各坐标中算出用于评价配置了字符串框24的位置的评价值。该评价值设定为,如图7(D)所示,在形成序列号102的各字符位于包含在对应的字符部21(m)内的位置时表示最大值。
即,字符串框评价值算出部3C在部分区域101的图像内部设定字符串框24可存在的范围,在该范围内一边移动字符串框24一边在各位置中算出评价值。此时算出的评价值的算出方法设定为,所设定的字符串框24如图7(D)所示那样在最适合切出形成序列号102的各字符的位置中表示最大值。犹如,通过比较在各位置中算出的评价值而找出表示最大值的基点30,从而能够决定形成序列号102的各字符包含在各字符部21(m)中时的字符串框24的位置。
以下,参照图8的流程图说明该字符串框评价值算出部3C进行的处理的细节。
首先,为了在包含序列号102的部分区域101上设定包含字符框20(m)的字符串框24,读出在存储器4内存储的字符框信息4A(图8步骤S1)。字符框信息4A与现金种类信息相关联保存,基于从现金种类识别部2接收到的现金种类信息而读出。字符框20以及字符串框24的设定方法参照图3至图7如上所述。
在算出与字符框20(m)以及字符串框24有关的各评价值之前,总评价值(字符串框评价值)的最大值初始化为0(零)(步骤S2)。之后,算出基点30的位置位于图7(C)所示的基点扫描区域40内部的坐标(i,k)时的总评价值Sc(i,k)(以下,将坐标(i,k)记载为“基点评价坐标”)。该总评价值Sc(i,k)是设定为如下的评价值:在所设定的字符串框24例如图7(D)所示那样最适合切出形成序列号102的各字符的位置中表示最大值。关于该总评价值Sc(i,k)的算出方法的细节将在后面叙述。
若算出基点评价坐标(i,k)中的总评价值Sc(i,k),则接着,比较算出的总评价值和作为总评价值的最大值而保存的最大评价值(图8步骤S4)。
然后,在算出的总评价值Sc(i,k)大于在此之前算出的总评价值的最大值的情况下(步骤S4;是),将该值作为最大评价值而保存在存储器4内,且将算出该值的基点评价坐标(i,k)作为用于确定序列号102的位置的字符串框24的基点30的位置而保存在存储器4内(步骤S5)。
之后,关于图7(C)所示的基点扫描区域40内的基点评价坐标(i,k),若残留应评价的坐标(图8步骤S6;否),则重复上述步骤(步骤S3至S5),若全部评价坐标的评价结束(步骤S6;是),则结束字符串框评价值算出部3C的处理。通过这些处理,在图7所示的例中,成为同图(D)所示的将基点30的位置作为基点评价坐标(i,k)时的总评价值Sc(i,k)成为最大值且该基点评价坐标(i,k)存储到存储器4内的状态。
在字符位置决定部3D中,基于字符串框评价值算出部3C的评价结果,如图7(D)所示,将总评价值Sc(i,k)成为了最大值时的基点评价坐标(i,k)作为基点30设定字符串框24。然后,此时将设定了字符部21(m)的区域决定为包含了形成序列号102的各字符的区域(图8步骤S7)。字符位置决定部3D从部分区域101的图像切出作为字符部21(m)而设定的区域的图像而发送到字符识认部5。在字符识认部5中利用OCR等的技术对从字符位置决定部3D接收到的图像进行字符识认,将在该图像中包含的字符变换为文本数据。在字符识认部5中,如图10(B)所示,由于分离余白或背景等的多余的区域,接收只有形成序列号102的一个字符在整体上较大地描画的图像而进行处理,所以能够准确地进行字符识别。另外,字符位置决定部3D除了基于字符部21(m)切出图像之外,既可以基于字符框20(m)切出包含外周部22(m)的区域的图像,也可以基于字符串框24切出包含序列号102整体的图像。这里,m表示与第m个字符框有关。
接着,参照图9的流程图说明算出总评价值Sc(i,k)的处理的细节。总评价值Sc(i,k)是在将基点评价坐标(i,k)作为基点30的字符串框24中包含的全部字符框20(m)的评价值的合计值。首先进行将总评价值设为0(零)的初始化(图9步骤S11),之后,开始算出各字符框20(m)的评价值的处理。
作为各字符部21(m)的特征量,算出浓度平均值C(m)(步骤S12)。例如,在字符串框24中包含11个的字符框20(1)至20(11)的情况下,即序列号102由11个字符的字符形成的情况下,算出C(1)至C(11)的浓度平均值。
浓度平均值是在区域内包含的像素值的平均值。例如,在灰度的图像由将黑设为0(零)且将白设为255的256阶段的浓淡表示的情况下,形成该图像的各像素根据图像的浓淡而具有0至255的任一个像素值。在各字符部21(m)中包含的像素值的平均为字符部21(m)的1个字符量的浓度平均值C(m)。
以如图10(A)所示那样设定了字符框20(m)的情况为例,说明具体的浓度平均值C(m)的算出方法。如图10(B)所示,在字符部21(m)的宽度方向的像素数为Wc(m)、高度方向的像素数为Hc(m)的情况下,将在字符部21(m)中包含的全像素的像素值作为浓度值进行合算而求出浓度合计值Vc(m)。将该浓度合计值Vc(m)除以在字符部21(m)中包含的像素数(Wc(m)×Hc(m))所得的值为字符部21(m)的浓度平均值C(m)。即,作为C(m)=Vc(m)/(Wc(m)×Hc(m)),算出浓度平均值C(m)。
接着,作为外周部22(m)的特征量,算出浓度平均值F(m)(图9步骤S13)。在部分区域101上设定的环状的外周部22(m)中包含的像素值的平均为外周部22(m)的浓度平均值F(m)。参照图10说明具体的浓度平均值F(m)的算出方法。如同图(C)所示,将在宽度方向像素数为Wf(m)、高度方向的像素数为Hf(m)的区域即字符框20(m)中包含的全像素的像素值作为浓度值进行合算而求出浓度合计值Va(m)。由于外周部22(m)的浓度平均值F(m)为在环状的区域中包含的像素的浓度平均值,所以使用字符框20(m)整体的浓度合计值Va(m)和上述的字符部21(m)的浓度合计值Vc(m),作为F(m)=(Va(m)-Vc(m))/{(Wf(m)×Hf(m))-(Wc(m)×Hc(m))}而算出。
接着,算出字符框20(m)的评价值Ec(m)(图9步骤S14)。作为Ec(m)=F(m)-C(m)而算出字符框评价值Ec(m)。通过该字符框评价值Ec(m),能够评价字符框20(m)相对形成序列号102的字符设定在适当的位置上,即设定在能够通过字符部21(m)切出字符图像的位置上。
在部分区域图像101中,通常,形成序列号102的各字符由比背景浓(暗)的像素形成。因此,字符部21(m)的浓度平均值C(m)以及外周部22(m)的浓度平均值F(m)在其区域内构成字符的像素越多则值越小。例如图10(D)所示,在只有字符的一部分包含在字符部21(m)中的情况下,字符“A”越偏离字符部21(m),浓度平均值C(m)的值越大。相反地,如图10(A)所示,在字符整体包含在字符部21(m)内时,浓度平均值C(m)取最小值。相对于此,外周部浓度平均值F(m)如图10(D)所示,若字符偏离字符部21(m)而其一部分处于外周部22(m),则值减小,在如同图(A)所示,在字符整体包含在字符部21(m)内时取最大值。
这样,设定各个评价式,使得在字符框20相对形成序列号102的字符位于适当的位置的情况下字符部21(m)的浓度平均值C(m)成为最小值、外周部22(m)的浓度平均值F(m)成为最大值。
另外,以字符由比背景浓(暗)的像素形成的情况为例进行了说明,但本发明并不限定于此。例如,在字符比背景淡(亮)的情况下,与上述说明相反地,在字符整体包含在字符部21(m)内的状态下浓度平均值C(m)取最大值且F(m)取最小值。此时,作为Ec(m)=C(m)-F(m)而算出字符框评价值Ec(m)即可。此外,即使是将在上述图9以及图10的说明中表示的图像利用反转了其灰度的负(nega)图像进行处理的情况下,也作为Ec(m)=C(m)-F(m)而算出字符框评价值Ec(m)即可。即,只要与被印刷的字符图像的特性匹配地设定为在字符部21(m)内包含了字符的状态下取最大值,则算出字符框评价值Ec(m)的评价式的内容并不特别限定。
对在字符串框24中包含的各字符框20(m)的全部算出字符框评价值Ec(m)(图9步骤S15;否)。然后,若在全部字符框20(m)中算出字符框评价值Ec(m)(步骤S15;是),则将字符框评价值Ec(m)进行合算而算出总评价值Sc(i,k)(步骤S16)。
另外,表示了作为字符部21(m)以及外周部22(m)的特征量而利用浓度平均值的例子,但利用的特征量并不限定于此,只要是表示字符的像素和表示字符以外的背景的像素之间其值不同且根据形成在区域内包含的字符的像素的数目而其值变化的特征量,则例如也可以利用彩色的纸币图像的RGB的亮度值等。此外,关于评价值,只要设定为根据形成在字符部21(m)中包含的字符的像素数而其值变化且字符整体包含在字符部21(m)内时取最大值,则并不限定于区域内的像素的平均值,也可以利用像素的合计值等。
根据以上的方法,在形成序列号102的各字符完全包含在字符部21(m)中时,字符框评价值Ec(m)取最大值。然后,在字符串框24内的全部字符框20(m)中,形成序列号102的各字符完全包含在字符部21(m)中时,总评价值Sc(i,k)取最大值。利用这个,一边在部分区域101内移动基点30一边算出总评价值Sc(i,k),检测取最大值的基点30的位置,从而能够确定如图7(D)所示的字符串框24的位置。
这样,由于使包含根据现金种类而设定的多个字符框20(m)的字符串框24以扫描部分区域101内的方式移动,将在各位置中的评价值相对进行比较,决定取最大值的位置,所以即使是在序列号102的背景存在图案或花纹的情况下也能够准确地确定字符的位置。
此外,由于与形成序列号102的字符匹配地设定由字符部21(m)以及外周部22(m)构成的字符框20(m)并在各字符位置中进行评价,且设定由多个字符框20(m)构成的字符串框24而进行评价,所以关于一部分字符,在其附近存在序列号以外的字符的情况下或在字符的背景中存在图案或花纹的情况下,也能够准确地确定序列号102的位置。
实施例2
在上述实施例1中,表示了使字符串框24在包含序列号102的部分区域101的图像上移动,将评价值成为最大的位置确定为用于切出序列号102的位置而切出图像的方法。在字符串框24中包含的各字符框20(m)的位置以相对字符串框24固定的状态进行了评价值的算出,但本发明并不限定于此。在本实施例2中,说明在各评价坐标中一边相对字符串框24单独移动各字符框20(m)一边进行评价的方法。
在本实施例2中,由于由字符部21(m)以及外周部22(m)构成的字符框20(m)的设定方法、包含多个字符框20(m)的字符串框24的设定方法、利用了浓度平均值的各评价值的算出方法、将评价值成为最大值的评价位置作为序列号102的位置而切出图像的方法与上述实施例1相同,所以省略说明。
在本实施例2中,由于只有在作为基点30的坐标的基点评价坐标(i,k)中算出字符串框24的总评价值Sc(i、k)时的、各字符框20(m)的评价方法与上述实施例1不同,所以以下说明这一点的细节。
字符串切出装置10从纸币图像100中提取包含序列号102的部分区域101而利用。此时,若存在将拍摄时的纸币的弯曲或搬运的纸币的搬运偏差等作为原因的采样间隔的变动等,则存在在纸币图像100上序列号102的图像歪斜的情况。其结果,存在理应位于等间隔且水平的位置的字符在图像上具有不同的间隔或者倾斜的情况。此外,由于斜行校正部3A的校正也不是完整的,所以也存在在图像上序列号102倾斜的情况。此外,在纸币图像100被正常地摄像到的情况下,也存在如例如被称为缩小券的纸币那样纸币自身的品质差、在纸币上印刷的序列号102的位置偏离或者倾斜的情况。
根据本实施例2的方法,即使是在这样的情况下,也能够准确地确定形成序列号102的字符的位置。通过在参照图8以及图9说明的算出字符框评价值Ec(m)的步骤中,相对地移动相对于字符串框24的各字符框20的位置,检测字符框评价值Ec(m)成为最大的位置来实现。
参照图11以及图12说明具体的方法。首先,利用如图11所示那样设定的由多个字符部21(m)、多个外周部22(m)以及多个间隙区域23构成的字符串框24,与上述实施例1相同地算出各字符框20(m)的字符框评价值Ec(m)。这里,在同图的情况下,m取1至5的值。之后,进一步以将字符串框24、即基点30固定的状态,将除了字符框20(1)之外的4个字符框20(2)至20(5)向上下左右偏移规定像素量而再次算出字符框评价值Ec(2)至Ec(5)。例如,将字符框20(2)至20(5)的每个以各字符框左上端的坐标31A至31D为中心向上下左右各偏移1个像素,从而在各位置中进行评价。或者,也可以设定以坐标31A至31D为中心的一边为若干个像素的矩形区域,在该矩形区域内移动字符框20(2)至20(5)的同时在各位置中获得字符框评价值Ec(m)。另外,除上述之外也可以移动字符框20(1)。
例如,如图12(A)所示,在通过所设定的字符串框24,字符应收敛于字符部21(1)以及21(2)内时,存在因上述的图像的歪斜等的影响而图像上的第2字符“B”如图12(B)所示那样偏移的情况。在本实施例2中,如图12(C)所示,将左上端与基点30的坐标一致的第1字符“A”的字符框20(1)的位置固定的状态,在将其他的字符框20(2)向上下左右的规定方向偏移规定像素数的位置进行评价。由于字符框评价值Ec(2)的值在字符部21(m)内包含了字符整体的状态下取最大值,所以与图12(B)相比同图(C)的评价值更大。因此,将处于图12(C)的状态时的坐标41A的信息与基点30相关联而保存在存储器4内,且将该基点评价坐标(i,k)中的总评价值Sc(i,k)的值作为在图12(C)的状态下算出的值而不是在图12(B)的状态下算出的值来推进处理。其结果,在图12(C)的状态时的总评价值Sc(i,k)为最大值的情况下,字符位置决定部3D将与第2字符“B”对应的字符部21(2)的位置,基于在存储器4中存储的坐标41A决定为图12(C)所示的字符部21(2)而不是如图12(B)所示的字符部21(2)。在上述说明中仅使用第2字符进行了说明,但也可以对在字符串框24中包含的各字符进行这样的处理。
通过如此使在字符串框24中包含的各字符框20(m)在规定区域内偏移而评价,所以即使是在序列号102在纸币上偏移而印刷的情况下或在纸币图像上偏移的情况下,也能够准确地确定各字符的位置,能够切出包含各字符的区域的图像。
关于使各字符框20(m)移动的方向或移动的量,例如初始设定为以1个像素间距(pitch)向上下左右移动5个像素量,基于该初始设定进行处理即可。
但是,本发明并不限定于此,例如,也可以在第m个字符位置中偏移了字符框20时字符框评价值Ec(m)的值增大的情况下,以在之后的字符位置中限定移动的量或方向的方式动态地变更设定的同时进行处理。
具体而言,例如,假设在图11所示的第2字符的字符框20(2)中,即使以1个像素间距向上下左右移动5个像素的字符框20(2)而评价,字符框评价值Ec(2)也不变化,在第3字符的字符框20(3)中向右方向移动3个像素的字符框20(3)时,字符框评价值Ec(3)增大。此时,在接下来的第4字符的字符框20(4)中,变更与字符框20(4)的移动方向以及移动量有关的设定,使得不进行向左方向移动的处理,只进行向上下方向以1个像素间距移动5个像素的处理和向右方向移动的处理。此时关于向右方向移动时的移动量,也可以不是如初始设定的1个像素至5个像素,而是3个像素至5个像素或者3个像素至5个像素这样动态地变更设定。
通过印刷的偏移或图像的歪斜,形成序列号102的各字符的位置开始中途偏移的情况下,之后很少返回到字符位置没有偏移的位置,大多数情况下偏移的状态持续或者偏移量增加。因此,通过动态地变更设定,能够降低整体的处理量的同时获得与基于所固定的初期设定来进行了处理时相同的效果。
图13表示字符位置的偏移沿着一个方向扩大时的具体的例子。在图13(A)中,如同图上段所示,由于从位于左起第3字符的位置的字符开始向右方向产生偏移,所以在如上述实施例1所示那样固定了字符框20的情况下,越向右方向,各字符框20(m)和字符的偏移越大。在这样的状态下,不能算出准确的字符框评价值Ec(m),其结果,不能准确地确定字符的位置。相对于此,通过在本实施例2中说明的方法,如图13(A)下段所示,进行将第3字符至第5字符移动1个像素、将第6字符至第8字符移动2个像素、将第9字符至第11字符移动3个像素的移动各字符框20(m)的处理而算出字符框评价值Ec(m),能够准确地确定各字符的位置。另外,图13(B)同样表示向下方向的字符位置的偏移扩大时的例子。
相对字符串框24移动各字符框20(m)的位置而评价的上述处理既可以在全部情况下进行,也可以只有在通过上述实施例1的方法求出的最大评价值小于预定值时作为再评价来进行。能够确定序列号102的位置时的总评价值Sc(i,k)根据形成序列号102的各字符的种类等而变化。但是,如图12或图13所示,在字符中产生偏差的情况下,与以字符种类的差异作为原因时相比,总评价值Sc(i,k)的值大幅降低。也可以利用这个来设定阈值,只有在表示了最大值的总评价值Sc(i,k)的值低于阈值的情况下,判定为因字符偏移所以值降低,进行移动各字符框20(m)的上述处理。
这样,不固定相对于字符串框24的各字符框20(m)的位置,相对于基点30移动各字符框20(m)而进行评价,从而即使是在形成序列号102的各字符的位置在实际的纸币上偏移的情况下或因在图像中产生了歪斜而偏移的情况下,也能够准确地确定各字符的位置。
此外,考虑产生形成序列号102的各字符的位置偏移的实情,当检测出在某个字符位置中产生的偏移的情况下,若在之后的字符位置中,动态地变更与字符框20的移动方向或移动量有关的设定,使得不进行与检测出偏移的方向相反方向的各字符框20(m)的移动,且将检测出的偏移量作为初始值进行处理,则能够降低整体的处理量,且能够使处理高速化。
此外,若只有在固定各字符框20(m)而获得的总评价值Sc(i,k)的最大值小于规定值的情况下进行移动各字符框20(m)的位置的处理,则能够获得同样的效果的同时降低整体的处理量,且能够使处理高速化。
实施例3
在上述实施例1以及实施例2中,表示了对形成序列号102的各字符设定字符框20的方法,但本发明并不限定于此。在本实施例3中,说明除了利用用于利用形成序列号102的字符而评价的字符框20之外,还利用用于利用序列号102的背景的余白、字符串、花纹等而评价的背景框的方法。
在本实施例3中,由于由字符部21(m)以及外周部22(m)构成的字符框20(m)的设定方法、包含多个字符框20(m)的字符串框24的设定方法、利用了浓度平均值的各评价值的算出方法、将评价值成为最大值的评价位置作为序列号102的位置来切出图像的方法、移动各字符框20(m)来应对印刷偏移或图像的歪斜的方法与上述实施例1以及实施例2相同,所以省略说明。
在本实施例3中,与上述实施例1以及实施例2的不同点仅在于,为了算出评价值而利用的字符串框24除了包括包含形成序列号102的各字符的字符框20(m)之外,还包括评价序列号102的背景的背景框。以下,详细说明这一点。
如图14(A)所示,能够通过上述实施例1以及实施例2中说明的方法来确定序列号102的位置。但是,在序列号102的右端的字符的再右侧有污渍的情况下等,存在如同图(B)所示那样将字符位置偏移的状态作为序列号102的位置来确定的情况。这样,将以字符单位偏移的状态识认字符位置称为位偏移,在序列号102的附近有花纹的情况下,也存在同样地进行位偏移而识认的情况。
在本实施例3中,如图14(C)所示,除了与序列号102的位置匹配地设定的字符框20(m)之外,还在序列号102左右的余白部分设置用于评价余白的余白框50(n)。与字符框20(m)相同地,余白框50(n)由字符部51(n)以及外周部52(n)形成。这里,“n”对应于在字符串框24中包含的余白框的数目,在同图的例中,左端的余白框表示为50(1)、右端的余白框表示为50(2)。并且,形成左端的背景框50(1)的字符部以及外周部分别表示为51(1)以及52(1)、形成右端的背景框50(2)的字符部以及外周部表示为51(2)以及52(2)。
字符框20(m)和余白框50(n)的差异在于,字符框20(m)被设定为形成序列号102的各字符包含在字符部21(m)的区域内,相对于此,余白框50(n)被设定为在字符部51(n)的区域内不包含字符或花纹等。
字符框20(m)的评价值Ec(m)算出为字符部21(m)的浓度平均值C(m)与外周部22(m)的浓度平均值F(m)的差分(Ec(m)=F(m)-C(m))。相对于此,余白框50(n)的评价值Eb(n)设为对字符部51(n)的浓度平均值C(n)与外周部52(n)的浓度平均值F(n)的差分(F(n)-C(n))的绝对值乘以-1的负的值。然后,总评价值Sc(i,k)算出为全部字符框评价值Ec(m)以及余白框评价值Eb(n)的合计值。即,对字符框20(m)以及余白框50(n)的各框算出字符部和外周部(21(m)以及22(m)、51(n)以及52(n))的浓度平均值差分,并将对字符框20(m)的全部合计了差分值所得的值和对余白框50(n)的全部合计了差分值的绝对值所得的值乘以-1的值相加,从而算出总评价值Sc(i,k)。
由于余白框50(n)设定在不存在字符或花纹的余白部分,所以原本字符部51(n)和外周部52(n)的浓度平均值不产生差、作为浓度平均值的差分的评价值Eb(n)成为0(零)。但是若由于位偏移而在余白框50(n)中包含字符或背景的花纹等,则字符部51(n)和外周部52(n)的浓度平均值产生差分,不为0(零)。因此,通过将对该差分值的绝对值乘以-1所得的负的值作为余白框50(n)的评价值Eb(n),能够使该评价值Eb(n)作用于降低处于位偏移的状态时的总评价值Sc(i,k)的值的方向。
即,由于字符框20(m)的评价值Ec(m)成为字符串框24设定在适当的位置的指针,所以该评价值Ec(m)作用于在适当的位置中提高总评价值Sc(i,k)。相对于此,由于余白框50(n)的评价值Eb(n)成为表示字符串框24产生了位偏移的指针,所以该评价值Eb(n)作用于在位偏移的位置中降低总评价值Sc(i,k)。其结果,通过总评价值Sc(i,k),能够更加准确地评价字符串框24的位置。另外,只要这样设定,则本发明的各评价值的算出方法并不限定于上述方法,可以通过其他的运算式来算出。
参照图14说明具体的评价值的算出方法。在产生了位偏移的图14(D)所示的状态中,由于在位于字符串框24内的左端的余白框50(1)中有序列号102开头的字符“A”,所以与没有余白框50(n)的情况相比,总评价值Sc(i,k)降低。此外,由于在位于字符串框24的右端的余白框50(2)中也有背景的花纹,所以同样地,总评价值Sc(i,k)降低。其结果,与图14(D)所示的位置相比,如图14(E)所示,字符串框24位于适当的位置时总评价值Sc(i,k)的值更大。因此,基于总评价值Sc(i,k)的值,能够准确地确定序列号102的位置。
这样,通过除了评价形成序列号102的字符的字符框20(m)之外,还设置用于评价与序列号102相邻的余白的余白框50(n),能够更准确地确定序列号102的位置。作为用于评价背景的背景框,除了上述余白框50(n)之外,还能够利用例如图15(A)至(C)所示的背景框。
图15(A)是除了图14(A)所示的字符串框24的结构之外,还以与多个字符重叠的方式设置了背景框(多位框)60的例子。此外,图15(B)是除了图14(A)所示的字符串框24的结构之外,还在各字符位置中,以将字符部21(m)分割为两个区域而在上侧位于外周部72、下侧位于字符部71的方式设置了背景框(上下框)70的例子。
另外,余白框50、背景框60以及70并不以单体用于评价,而是为了进一步准确地进行字符框20(m)的评价而辅助性地利用。在图15中,也是除了字符框20(m)之外还设置了背景框60、70以及80,但使用虚线表示了字符框20(m)以及字符串框24,使得容易理解背景框60、70以及80的形状以及位置。此外,为了简化说明,记载为“各背景框60、70以及80”,但这并不意图一个字符串框24始终包含全部种类的背景框(60、70以及80),一个字符串框24除了包含多种背景框之外,也可以仅包含任一个背景框。
除了图14(A)所示的字符串框24的结构之外,还设置了如图15(A)以及(B)所示的背景框60以及70的字符串框24利用于如图16(A)至(D)所示那样在部分区域101内包含序列号102以外的字符串103(以下,记载为“切出对象外字符串103”)的情况。在包含这样的切出对象外字符串103的位置上有字符串框24时,若通过背景框60以及70而降低评价值,则能够避免切出对象外字符串103被错误识认为序列号102的情况。
具体而言,如图16(A)至(D)所示那样在字符串框24内有切出对象外字符串103的情况下,在各字符框20(m)中包含切出对象外字符串103而不是序列号102的位置中,存在各字符框20(m)的评价值Ec(m)提高的可能性。因此,图15(A)所示的背景框60在图16(B)所示的位置中、图15(B)所示的背景框70在图16(D)所示的位置中分别设定为切出对象外字符串103的一部分包含在框内。然后,在该位置中,与上述余白框50(n)的情况相同地,设定背景框60以及70的评价值Eb(n)的算出方法,使得评价值表示负的值。即,背景框60以及70用于在存在通过切出对象外字符串103而错误识认序列号102的位置的可能性的同图所示的位置中降低总评价值Sc(i,k)的值。这样,通过利用背景框60以及70,与处于在字符串框24内包含序列号102的适当的位置的情况相比,降低在字符串框24内包含切出对象外字符串103的位置上的总评价值Sc(i,k),能够避免序列号102的位置被错误识认的情况。
如图17(c)以及(d)所示,背景框60以及70的评价值Eb(n)通过对字符部(61以及71)的浓度平均值C与外周部(62以及72)的浓度平均值F的差分的绝对值乘以-1而算出。在图16(B)以及(D)所示的位置中,与同图(A)以及(C)所示的位置相比,字符部(61以及71)的浓度平均值C与外周部(62以及72)的浓度平均值F的差分的绝对值增大。因此,若将对该绝对值乘以-1的评价值Eb(n)相加,则与图16(A)的位置相比,同图(B)的位置的总评价值Sc(i,k)降低,与同图(C)的位置相比,同图(D)的位置的总评价值Sc(i,k)降低。
在如图16(A)以及(C)所示那样字符串框24相对于序列号102处于适当的位置的情况下,与处于如同图(B)以及(D)所示的位置的情况相比,背景框60以及70的评价值Eb(n)的绝对值减小。这是因为背景框60以及70设定为处于如同图(B)以及(D)所示的位置时在形成背景框60以及70的字符部61以及71中包含的像素的浓度平均值C与在外周部62以及72中包含的像素的浓度平均值F的差分增大。
即,背景框60以及70设定为,当位于在字符部21(m)内包含序列号102的适当的位置时,这些背景框60以及70的存在不会对字符串框24的总评价值Sc(i,k)产生大的影响。并且,背景框60以及70设定为,在存在将位于背景的切出对象外字符串103或花纹错误识认为序列号102的位置的可能性的位置中降低总评价值Sc(i,k)。通过将字符串框24设为除了字符框20(m)之外还包括背景框60以及70的结构,能够避免错误识认序列号102的位置的情况,能够准确地确定序列号102的位置。
背景框60以及70的利用并不限定于如上所述那样降低总评价值Sc(i,k)的情况,也可以设定为字符部21(m)位于包含序列号102的适当的位置时的字符串框24的总评价值Sc(i,k)提高。
具体而言,例如图15(C)所示,也可以除了字符框20(m)之外,在成为序列号102的位置确定的依据的位置中设置背景框80,辅助序列号102的位置的确定。
在上述背景框60以及70中,与余白框50(n)的情况同样地,将背景框评价值Eb设为对字符部61以及71的浓度平均值C与外周部62以及72的浓度平均值F的差分(F-C)的绝对值乘以-1的值,且作用于在背景框60以及70的内部中包含字符或花纹的情况下降低总评价值Sc(i,k)的方向。但是,在图15(C)所示的背景框80中,将评价值Eb作为字符部81的浓度平均值C与外周部82的浓度平均值F的差分(F-C),不进行-1的乘法。然后,对各字符框20(m)的评价值Ec(m)的合计值加上背景框80的评价值Eb的合计值所得的值作为总评价值Sc(i,k)。
图15(C)所示的背景框(花纹框)80用于识认图16(E)所示的序列号102时。在同图所示的纸币中,在序列号102的左侧印刷有大致L字形的花纹105。如图16(B)所示,在部分区域101的图像中也包含该花纹105的图像,能够将该花纹105的位置用作确定序列号102的位置的依据。如图15(C)所示的背景框80设定为,在位于如图16(E)所示那样形成序列号102的各字符包含在各字符部21(m)的内部中的适当的位置时,在背景框80的字符部81内包含上述花纹105。并且,设定为,在背景框80的字符部81中完全包含了花纹105的状态下,从外周部82的浓度平均值F减去字符部81的浓度平均值C所得的值、即背景框80的评价值Eb取最大值(参照图17(e))。因此,背景框80的评价值Eb作用于在字符串框24相对序列号102位于适当的位置时提高总评价值Sc(i,k)的方向。因此,通过利用背景框80,能够更容易准确地确定序列号102的位置。
另外,关于上述背景框60、70以及80,既可以如上所述那样仅利用一个背景框来确定字符串框24,也可以设置多个背景框。在设置多个背景框的情况下,与余白框50(n)的评价值相同地,将背景框评价值表示为Eb(n)。以下,将评价值记载为背景框评价值Eb(n)。
能够根据评价式的设定来变更将背景框评价值Eb(n)作用于提高总评价值Sc(i,k)的方向还是作用于降低的方向。与字符框评价值Ec(m)相同地,背景框评价值Eb(n)能够算出为外周部(52(n)、62、72以及82)的浓度平均值F与字符部(51(n)、61、71以及81)的浓度平均值C的差分。但是,算出方法并不限定于此,也可以将浓度平均值的差分进行常数倍或者设定加上常数的评价式来利用。评价式根据设定余白框50(n)、多位框60、上下框70以及花纹框80等的背景框的位置以及大小、目的来适当地设定。
如图1所示,设定余白框50(n)、背景框60、70以及80而求出背景框评价值Eb(n)所需的信息作为背景框信息4C而保存在存储器4内,由字符串框评价值算出部3C利用。在存储器4内存储的字符框信息4A以及背景框信息4C中,包含设定字符框20(m)、字符串框24、余白框50(n)或背景框60、70以及80而利用所需的信息。这些信息与纸币的现金种类相关联存储,基于成为处理对象的纸币图像100的现金种类而从存储器4读出利用。图17表示字符框信息4A以及背景框信息4C的一例。这样,在存储器4中,例如包含与字符框20(m)、余白框50(n)、背景框(60、70以及80)、以及字符串框24有关的信息以及用于算出评价值的评价式等的信息。
如以上所示,若为了确定序列号102的位置,利用余白框50(n)或背景框60、70以及80,则能够抑制存在错误识认序列号102的位置的可能性的字符或花纹的影响,或者能够利用成为识认序列号102的位置的依据的字符或花纹。除了在实施例1以及2中所述的字符串框24的结构之外,还适当地设定由用于评价在序列号102附近或者背景的字符串或花纹等的特征部的字符部(51(n)、61、71以及81)以及外周部(52(n)、62、72以及82)构成的余白框50(n)或背景框60、70以及80以及用于评价它们的评价式,并利用背景框评价值Eb(n)来算出总评价值Sc(i,k),从而能够更准确地确定序列号102的位置。
实施例4
在上述实施例1至实施例3中,表示了仅由多个字符框20(m)形成的字符串框24或者包含字符框20(m)、余白框50(n)以及背景框(60、70以及80)中的任一个的字符串框24中,从最初开始利用在字符串框24中包含的全部框算出各框的评价值Ec(m)以及Eb(n)、总评价值Sc(i,k)的方法。但是,本发明并不限定于此。在本实施例4中,说明仅利用形成字符串框24的字符框20(m)、余白框50(n)、以及背景框(60、70以及80)的一部分而进行评价的方法。
在本实施例4中,由于由字符部21(m)以及外周部22(m)构成的字符框20(m)的设定方法、包含多个字符框20(m)的字符串框24的设定方法、利用了浓度平均值的各评价值的算出方法、将评价值成为最大值的评价位置作为序列号102的位置来切出图像的方法、移动字符串框24而应对印刷偏移或图像的歪斜的方法、利用余白框50(n)或背景框60、70以及80的方法与上述实施例1至实施例3相同,所以省略说明。
在本实施例4中,与上述实施例1至实施例3的不同点在于,对在字符串框24中包含的字符框20(m)等的全部框算出评价值之前,仅利用一部分框而算出评价值,并基于该结果来选择包含序列号102的可能性高的字符串框24。筛选了成为处理对象的字符串框24之后,与上述实施例1至实施例3相同地,利用在字符串框24内包含的字符框20(m)、余白框50(n)、背景框60、70以及80等的全部框来评价。以下,详细说明与上述实施例1至实施例3不同的点。
图18表示在本实施例4中追加的处理的流程图。在进行图18所示的处理,选择了成为处理对象的字符串框24的候选之后,与上述实施例1至实施例3相同地进行图8以及图9所示的处理。
首先,从存储器4读出字符框信息4A,根据成为处理对象的现金种类来设定包含字符框20(m)的字符串框24(图18步骤S21)。此时,在对该现金种类设定了余白框50(n)或背景框60、70以及80的情况下,同样从存储器4读出背景框信息4C,并将所读出的(包含于背景框信息信息4C)框追加到设定的字符串框24。然后,在开始与评价值计算有关的处理之前,进行将评价值设为0(零)的初始化(步骤S22)。至此为止的处理与上述实施例1至实施例3相同。
接着,算出在部分区域101的图像上在基点评价坐标(i,k)上配置了字符串框24的基点30时的、部分评价值Sp(i,k)(步骤S23)。部分评价值Sp(i,k)是,仅利用在字符串框24中包含的字符框20(m)、余白框50(n)、背景框60、70以及80等的多个框中的一部分框而算出的评价值。具体而言,例如,在图17(b)所示的包含字符框20(m)以及余白框50(n)的字符串框24中,如仅从右侧开始两个字符框20(包括m)或者仅由右端的字符框20(m)以及余白框50(n)那样在字符串框24中包含的多个框中选择为了算出部分评价值Sp(i,k)而利用的框。要利用的框的选择,优先选择在确定序列号102的位置时难以受到序列号102以外的切出对象外字符串103或背景的花纹等的影响的框即可。对选择的各个框求出评价值Ec(m)以及Eb(n),并基于该评价值来算出部分评价值Sp(i,k)。此时,由于进行没有利用在字符串框24中包含的字符框20(m)、背景框50(n)、背景框60、70以及80等的全部框而是只利用了一部分框的处理,所以能够降低整体的处理量,且能够使处理高速化。
接着,判定算出的部分评价值Sp(i,k)是否进入过去算出的全部部分评价值Sp(i,k)中从值高到低的位次的规定位次、例如上位N位以内(图18步骤S24)。然后,在部分评价值Sp(i,k)进入上位N位以内的情况下(步骤S24;是),将算出该评价值的基点评价坐标(i,k)保存在存储器4内。在部分评价值Sp(i,k)没有进入上位N位以内的情况下,不保存基点评价坐标(i,k)而进入下一个处理(步骤S24;否)。
接着,判定是否结束了全部基点评价坐标(i,k)的评价(步骤S26),在结束了全部评价坐标的评价的情况下(步骤S26;是),结束处理,在残留应评价的评价坐标的情况下(步骤S26;否),重复进行上述步骤(步骤S23至S26)。
通过以上的处理,能够选择部分评价值Sp(i,k)的值进入高到低的上位N位以内的基点评价坐标(i,k)而存储在存储器4中。这些基点评价坐标(i,k)表示在将该位置作为基点30设定了字符串框24时,形成序列号102的各字符包含在各字符部21(m)内的可能性高的坐标。在选择了成为候选的基点评价坐标(i,k)之后,只将这些基点评价坐标(i,k)作为评价对象,进行与图8以及图9所示的实施例1至实施例3相同的处理。
这样,不利用在字符串框24中包含的字符框20(m)、余白框50(n)、背景框60、70以及80等的全部框,而是只利用一部分框,选择成为候选的基点评价坐标(i,k)之后,只对选择的评价坐标算出利用了全部框的评价值,所以能够降低整体的处理量,且能够使处理高速化。
此外,通过在字符串框24中包含的字符框20(m)、余白框50(n)、背景框60、70以及80等的框中,选择难以受到序列号102以外的切出对象外字符串103或背景的花纹等的影响的框而进行评价,所以能够有效地筛选成为候选的基点评价坐标(i,k)。
另外,作为通过降低处理量来使整体的处理高速化的方法,除了选择评价值从高到低的上位N位以内的基点评价坐标(i,k)的上述方法之外,也可以只有在部分评价值Sp(i,k)超过规定值的情况下算出总评价值Sc(i,k)。
图19的流程图表示具体的处理例。首先,从存储器4读出字符框信息4A或背景框信息4C,根据成为处理对象的现金种类,设定包括字符框20(m)、余白框50(n)、背景框60、70以及80等的字符串框24(步骤S31)。然后,在开始与评价值计算有关的处理之前,进行将最大评价值设为0(零)的初始化(步骤S32)。
在算出部分评价值Sp(i,k)之后(步骤S33),判定该评价值是否超过规定的阈值(步骤S34),只有在超过了阈值的情况下(步骤S34;是),进行算出总评价值Sc(i,k)的处理(步骤S35)。在部分评价值Sp(i,k)为阈值以下的情况下(步骤S34;否),进入下一个基点评价坐标的处理(步骤S38;否)。关于各处理,由于与在上述实施例1至实施例3或者本实施例4中上述的处理相同,所以省略详细的说明。
这样,由于在字符串框24中包含的字符框20(m)、余白框50(n)、背景框60、70以及80等的框中只利用一部分框而进行了评价之后,只有在该评价值超过规定值的情况下,利用全部框而算出评价值,所以能够降低整体的处理量,且能够使处理高速化。此外,通过在字符串框24中包含的字符框20(m)等的框中选择难以受到序列号102以外的字符串或背景的花纹等的影响的框而进行评价,所以能够有效地筛选成为候选的评价坐标。
如以上所示,根据上述实施例1至实施例4,由于将多个字符框20(m)设定为包含序列号102的各字符,且利用用于评价在各字符框20(m)中包含序列号102的评价值,一边在纸币图像上移动字符框20(m)一边相对地比较评价值来确定序列号102的位置,所以即使是在序列号102附近印刷了字符或者在序列号102的背景有花纹或图案的情况下,也能够准确地确定序列号102的位置,能够准确地切出包含该序列号102或者形成该序列号102的各字符的图像。此时,由于将字符框20(m)划分为包含字符的字符部21(m)和字符部21(m)周围的外周部22(m),将评价式设定为在字符和字符周围利用不同的像素值等的特征量且在字符部21(m)中包含字符时评价值提高,所以能够准确地确定各字符的位置。此外,由于根据包含多个字符框20(m)的字符串框24来确定序列号102的位置,所以即使是在形成序列号102的一部分字符的附近有序列号以外的字符串或者在背景中有花纹的情况下,也能够准确地确定对序列号102打上字符框20(m)的位置。
此外,由于将各字符框20(m)从设定为字符串框24的位置起以像素单位移动而进行评价,所以即使是在因印刷偏移或纸币图像的歪斜而图像上的形成序列号102的各字符的位置偏移的情况下,也能够准确地确定形成序列号102的各字符的位置。
此外,由于除了序列号102之外,还设定用于评价序列号102周围的特征或序列号以外的字符串的余白框50(n)或背景框60、70以及80,通过这些框,将评价式设定为在存在错误识认为序列号102的位置的可能性的位置中降低评价值或者在准确地识认了序列号102的位置的位置中提高评价值,所以在有序列号以外的字符串的情况下或在背景中有图案或花纹的情况下,也能够抑制它们的影响,能够准确地确定对序列号102打上字符框20(m)的位置。
此外,由于通过将在字符串框24中包含的字符框20(m)、余白框50(n)、背景框60、70以及80的多个框中只利用了一部分框的评价来筛选了作为评价对象的评价位置之后,利用包含字符框20(m)的全部框而进行评价,所以能够维持准确地确定序列号102的位置的效果的同时,能够降低整体的处理量来实现高速的处理。此外,由于进行在包括字符框20(m)的多个框中只利用了一部分框的评价,只有在评价值超过了规定的阈值时进行利用了包括字符框20(m)的全部框的评价,所以同样地能够降低整体的处理且实现高速的处理。
另外,在上述实施例1至实施例4的各个实施例中说明的处理,既可以单独进行各处理,也可以将所选择的处理或者全部处理组合进行。此外,上述的处理并不限定于纸币,能够应用于在支票、票据、商品券等的纸张类上印刷的全部识别号,此时也能够获得同样的效果。
产业上的可利用性
以上所示,本发明的字符串切出方法以及字符串切出装置,在对在纸张类上印刷的识别号进行字符识认时,利用拍摄了纸张类的图像,准确地确定形成字符串的各字符的字符位置时有用。
标号说明
1    扫描仪1
2    现金种类识别部
3    控制部
3A   斜行校正部
3B   部分区域提取部
3C   字符框评价值算出部
3D   字符位置决定部
4    存储器
4A   字符框信息
4B   字符串信息
4C   背景框信息
5    字符识认部
10   字符串切出装置
20(m)   字符框
21(m)、51(n)、61、71、81   字符部
22(m)、52(n)、62、72、82   外周部
23   间隙区域
24   字符串框
30   基点
50(n)   余白框
60、70、80   背景框
100  纸币图像
101  部分区域
102  序列号
103  字符串

Claims (11)

1.一种字符串切出方法,对拍摄了印刷或者打印了字符串的纸张类的纸张类图像施加字符框而切出字符串的图像,其特征在于,包括:
字符串框设定步骤,将包括形成所述字符串的各字符的区域设定为字符部,将与所述字符部的周围相邻的环状区域设定为外周部,将所述字符部和其外周部合起来的部分设定为字符框,将包含全部所述字符框的区域设定为字符串框;
特征量算出步骤,将所述各字符框作为对象,算出所述字符部内以及所述外周部内的各图像的特征量;
评价值算出步骤,将所述字符串框作为对象,算出基于所述特征量的字符串框评价值;
字符串框移动步骤,使所述字符串框的位置在所述纸张类图像上移动;以及
图像切出步骤,使用所述字符串框评价值最大的位置上的所述字符串框,切出所述字符部内的图像。
2.如权利要求1所述的字符串切出方法,其特征在于,
根据所述纸张类的种类而设定所述字符串框。
3.如权利要求1或2所述的字符串切出方法,其特征在于,
所述特征量为区域内全像素的浓度平均值。
4.如权利要求1或3所述的字符串切出方法,其特征在于,
在所述字符串框设定步骤中,除了形成所述字符串的字符之外,也对与所述字符串相邻的余白部分设定字符部以及外周部,
在所述评价值算出步骤中,将基于对所述余白部分设定的所述字符部以及所述外周部的特征量的值从所述字符串框评价值中减去所得的值作为字符串框评价值。
5.如权利要求1至4的任一项所述的字符串切出方法,其特征在于,
在所述字符串框设定步骤中,除了形成所述字符串的字符之外,也对印刷在所述纸张类的切出对象外的字符设定字符部以及外周部,
在所述评价值算出步骤中,将基于对切出对象外的字符设定的所述字符部以及所述外周部的特征量的值从所述字符串框评价值中减去所得的值作为字符串框评价值。
6.如权利要求1至5的任一项所述的字符串切出方法,其特征在于,
在所述字符串框设定步骤中,除了形成所述字符串的字符之外,也对与所述字符串以预定的位置关系印刷在所述纸张类的切出对象外的字符或者花纹设定所述字符部以及所述外周部,
在所述评价值算出步骤中,将基于对切出对象外的字符或者花纹设定的所述字符部以及所述外周部的特征量的值加到所述字符串框评价值所得的值作为字符串框评价值。
7.如权利要求4至6的任一项所述的字符串切出方法,其特征在于,
在所述图像切出步骤中,不切出对余白部分、切出对象外的字符或者花纹设定的所述字符部内的图像。
8.如权利要求1至7的任一项所述的字符串切出方法,其特征在于,还包括:
将在所述纸张类图像上设定的所述字符串框的位置固定的状态下,将所述字符部以及所述外周部相对于所述字符串框沿着规定方向移动规定像素量而算出所述特征量的步骤,
在所述评价值算出步骤中,在所述字符串框被固定的位置中,所述字符部以及所述外周部的移动后的所述字符串框评价值大于移动前的所述字符串评价值时,将所述字符串框评价值作为移动后的值,
在所述图像切出步骤中,将移动后的所述字符部内的图像作为切出对象。
9.如权利要求1至8的任一项所述的字符串切出方法,其特征在于,还包括:
第1部分评价步骤,将在所述字符串框中包含的多个所述字符框中的一部分作为对象,执行除了所述图像切出步骤之外的所述各步骤而算出所述特征量以及所述字符串框评价值,
只对从通过所述第1部分评价步骤而算出的所述字符串框评价值成为最大值到规定位次以内的所述字符串框的位置,执行将所述字符框的全部作为对象的所述特征量算出步骤、所述评价值算出步骤以及所述图像切出步骤。
10.如权利要求1至8的任一项所述的字符串切出方法,其特征在于,还包括:
第2部分评价步骤,将在所述字符串框中包含的多个所述字符框中的一部分作为对象,算出所述特征量以及所述字符串框评价值,
只对通过所述第2部分评价步骤而算出的所述字符串框评价值超过规定阈值的所述字符串框的位置,执行将所述字符框的全部作为对象的所述特征量算出步骤、所述评价值算出步骤以及所述图像切出步骤。
11.一种字符串切出装置,通过接收拍摄了印刷或者打印了字符串的纸张类的纸张类图像并实施字符串框而切出字符串的图像,其特征在于,包括:
斜行校正部,在所述纸张类图像倾斜的情况下校正其倾斜;
部分区域提取部,从所述纸张类图像或者通过所述斜行校正部校正后的纸张类图像提取包含所述字符串的区域;
评价值算出部,将包括形成所述字符串的字符的区域设定为字符部,将与所述字符部的周围相邻的环状区域设定为外周部,将所述字符部和其外周部合起来的部分设定为字符框,将包含全部所述字符框的区域设定为字符串框,一边移动所述字符串框的位置一边算出所述字符部以及所述外周部的图像的特征量,且将所述字符部的全部作为对象,算出基于在各位置中算出的所述外周部以及所述字符部的特征量的字符串框评价值;以及
字符位置决定部,将所述字符串框评价值最大的所述字符串框的位置中的所述字符部决定为切出图像的区域。
CN201180069000.1A 2011-03-04 2011-03-04 字符串提取方法以及字符串提取装置 Active CN103460222B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2011/055042 WO2012120587A1 (ja) 2011-03-04 2011-03-04 文字列切出方法及び文字列切出装置

Publications (2)

Publication Number Publication Date
CN103460222A true CN103460222A (zh) 2013-12-18
CN103460222B CN103460222B (zh) 2017-07-07

Family

ID=46797599

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180069000.1A Active CN103460222B (zh) 2011-03-04 2011-03-04 字符串提取方法以及字符串提取装置

Country Status (6)

Country Link
US (1) US9008431B2 (zh)
EP (1) EP2682901A4 (zh)
JP (1) JP5624671B2 (zh)
CN (1) CN103460222B (zh)
RU (1) RU2557461C2 (zh)
WO (1) WO2012120587A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104834925A (zh) * 2014-02-07 2015-08-12 冲电气工业株式会社 信息处理装置、字符位置校正方法以及信息处理系统
CN105321255A (zh) * 2014-07-28 2016-02-10 日立欧姆龙金融系统有限公司 纸张类识别装置、纸张类处理装置及纸张类识别方法

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130156288A1 (en) * 2011-12-19 2013-06-20 De La Rue North America Inc. Systems And Methods For Locating Characters On A Document
ITTO20121174A1 (it) * 2012-12-31 2014-07-01 Cts Electronics S P A Dispositivo e metodo di binarizzazione per documenti di pagamento o contabili
CN105393287A (zh) * 2013-07-31 2016-03-09 光荣株式会社 纸币处理系统、纸币处理装置及纸币处理方法
WO2015015534A1 (ja) * 2013-07-31 2015-02-05 グローリー株式会社 紙幣処理装置
US9472037B2 (en) * 2014-01-31 2016-10-18 Ncr Corporation Media item re-orientation
JP6335012B2 (ja) 2014-04-30 2018-05-30 グローリー株式会社 文字有無判定システム及び文字有無判定方法
CN103996239B (zh) * 2014-06-13 2016-08-24 广州广电运通金融电子股份有限公司 一种基于多线索融合的票据定位识别方法及系统
US9910566B2 (en) * 2015-04-22 2018-03-06 Xerox Corporation Copy and paste operation using OCR with integrated correction application
RU2613846C2 (ru) * 2015-09-07 2017-03-21 Общество с ограниченной ответственностью "Аби Девелопмент" Метод и система извлечения данных из изображений слабоструктурированных документов
JP6555751B2 (ja) * 2015-11-27 2019-08-07 グローリー株式会社 紙幣処理装置及び紙幣処理方法
KR101792690B1 (ko) 2015-12-30 2017-11-03 기산전자(주) 지폐 처리 장치
CN105761351A (zh) * 2016-01-08 2016-07-13 东方通信股份有限公司 基于结构特征的字符识别方法
JP6934707B2 (ja) * 2016-07-13 2021-09-15 グローリー株式会社 有価証券の文字/番号検査装置及び文字/番号検査方法
RU2628266C1 (ru) * 2016-07-15 2017-08-15 Общество с ограниченной ответственностью "Аби Девелопмент" Способ и система подготовки содержащих текст изображений к оптическому распознаванию символов
JP6903966B2 (ja) * 2017-03-16 2021-07-14 富士フイルムビジネスイノベーション株式会社 情報処理装置、情報処理システム及びプログラム
WO2019090506A1 (en) * 2017-11-08 2019-05-16 Intel Corporation Scene text detector for unconstrained environments
JP6922690B2 (ja) * 2017-11-22 2021-08-18 富士通株式会社 文字領域抽出プログラム、文字領域抽出装置及び文字領域抽出方法
KR102585645B1 (ko) * 2018-02-20 2023-10-10 삼성전자주식회사 문자를 인식하기 위한 전자 장치 및 방법
US11003937B2 (en) * 2019-06-26 2021-05-11 Infrrd Inc System for extracting text from images
JP7337572B2 (ja) * 2019-07-08 2023-09-04 グローリー株式会社 記番号読取装置、紙葉類処理装置、及び記番号読取方法
CN110378328B (zh) * 2019-09-16 2019-12-13 图谱未来(南京)人工智能研究院有限公司 一种证件图像处理方法及装置
CN113673544A (zh) * 2020-05-13 2021-11-19 珠海金山办公软件有限公司 一种相似字体的确定方法、装置、电子设备及存储介质
CN111695540B (zh) * 2020-06-17 2023-05-30 北京字节跳动网络技术有限公司 视频边框识别方法及裁剪方法、装置、电子设备及介质
CN116057582A (zh) * 2020-08-31 2023-05-02 富士通先端科技株式会社 序列号识别参数确定装置、序列号识别参数确定程序及纸张处理系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5915039A (en) * 1996-11-12 1999-06-22 International Business Machines Corporation Method and means for extracting fixed-pitch characters on noisy images with complex background prior to character recognition
CN1928891A (zh) * 2005-09-05 2007-03-14 富士通株式会社 指定文本行提取方法和装置
CN101419661A (zh) * 2007-10-26 2009-04-29 国际商业机器公司 基于图像中的文本进行图像显示的方法和系统
CN101821752A (zh) * 2007-11-09 2010-09-01 株式会社理光 信息处理装置和信息处理方法
CN101847287A (zh) * 2009-03-25 2010-09-29 日立欧姆龙金融系统有限公司 编号识别装置及方法、纸张类处理装置、自动交易处理装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0799532B2 (ja) 1986-11-28 1995-10-25 富士電機株式会社 文字切出し装置
JPH04104385A (ja) 1990-08-23 1992-04-06 N T T Data Tsushin Kk 帳票識別処理装置
JPH06301814A (ja) 1993-04-14 1994-10-28 Kawasaki Steel Corp 文字読取装置
JPH09259219A (ja) 1996-03-26 1997-10-03 Sharp Corp 文字認識方法
GB0106817D0 (en) * 2001-03-19 2001-05-09 Rue De Int Ltd Monitoring method
EP1437692B1 (en) 2003-01-08 2006-03-22 Glory Ltd. Bill serial number reading device and bill serial number reading method
JP4774390B2 (ja) * 2006-09-13 2011-09-14 株式会社キーエンス 文字切り出し装置、方法およびプログラム
US8509571B2 (en) * 2008-06-11 2013-08-13 Panasonic Corporation Pattern recognition apparatus, pattern recognition method, image processing apparatus, and image processing method
JP5337194B2 (ja) * 2011-04-25 2013-11-06 シャープ株式会社 画像処理装置
JP6061502B2 (ja) * 2012-06-04 2017-01-18 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5915039A (en) * 1996-11-12 1999-06-22 International Business Machines Corporation Method and means for extracting fixed-pitch characters on noisy images with complex background prior to character recognition
CN1928891A (zh) * 2005-09-05 2007-03-14 富士通株式会社 指定文本行提取方法和装置
CN101419661A (zh) * 2007-10-26 2009-04-29 国际商业机器公司 基于图像中的文本进行图像显示的方法和系统
CN101821752A (zh) * 2007-11-09 2010-09-01 株式会社理光 信息处理装置和信息处理方法
CN101847287A (zh) * 2009-03-25 2010-09-29 日立欧姆龙金融系统有限公司 编号识别装置及方法、纸张类处理装置、自动交易处理装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104834925A (zh) * 2014-02-07 2015-08-12 冲电气工业株式会社 信息处理装置、字符位置校正方法以及信息处理系统
CN104834925B (zh) * 2014-02-07 2018-10-16 冲电气工业株式会社 信息处理装置、字符位置校正方法以及信息处理系统
CN105321255A (zh) * 2014-07-28 2016-02-10 日立欧姆龙金融系统有限公司 纸张类识别装置、纸张类处理装置及纸张类识别方法
CN105321255B (zh) * 2014-07-28 2018-01-05 日立欧姆龙金融系统有限公司 纸张类识别装置、纸张类处理装置及纸张类识别方法

Also Published As

Publication number Publication date
RU2557461C2 (ru) 2015-07-20
RU2013144590A (ru) 2015-04-10
EP2682901A1 (en) 2014-01-08
EP2682901A4 (en) 2014-09-03
JP5624671B2 (ja) 2014-11-12
US9008431B2 (en) 2015-04-14
WO2012120587A1 (ja) 2012-09-13
JPWO2012120587A1 (ja) 2014-07-07
US20130343652A1 (en) 2013-12-26
CN103460222B (zh) 2017-07-07

Similar Documents

Publication Publication Date Title
CN103460222A (zh) 字符串切出方法以及字符串切出装置
US9977957B2 (en) Method and system for identifying characters on a valuable medium
US7164795B2 (en) Apparatus for extracting ruled line from multiple-valued image
JP5214330B2 (ja) 画像処理装置、バーコード処理装置、及び画像処理方法
EP1139272A2 (en) Method and apparatus for identification of documents, and computer product
CN101923644B (zh) 图像处理方法、图像处理装置以及图像形成装置
JP4658848B2 (ja) 文字列認識方法及び文字列認識装置
JP4857173B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP5830338B2 (ja) 帳票認識方法および帳票認識装置
JP2012008791A (ja) 帳票認識装置及び帳票認識方法
JP2009535899A (ja) 走査されたカラー画像からの複調画像の生成
WO2013140563A1 (ja) 紙葉類記番号読取システム及び紙葉類記番号読取方法
US20060279767A1 (en) Method and apparatus for detecting specific pattern and copying machine including the same
US20060164517A1 (en) Method for digital recording, storage and/or transmission of information by means of a camera provided on a comunication terminal
CN101344748B (zh) 具有复印防止功能的复印装置及其复印防止方法
CN102682308B (zh) 图像处理方法和图像处理设备
CN108074321B (zh) 一种纸币的图像边界提取方法及装置
JP2012185810A (ja) 画像処理装置及び画像処理プログラム
CN111027532A (zh) 一种交强险保单车船税金额识别系统和方法
KR20070078509A (ko) 지로 장표 수납기의 문자인식방법
JP6039944B2 (ja) 帳票種類判別装置および帳票種類判別方法
US11948342B2 (en) Image processing apparatus, image processing method, and non-transitory storage medium for determining extraction target pixel
JP2006178841A (ja) 紙葉類真偽判別装置
JP2009272714A (ja) 画像処理装置、画像処理方法、プログラム及びプログラムを記録した記録媒体
JP2005301713A (ja) 帳票画像の地紋除去方法及び装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant