CN1215432C - 帐票识别方法 - Google Patents

帐票识别方法 Download PDF

Info

Publication number
CN1215432C
CN1215432C CNB021020493A CN02102049A CN1215432C CN 1215432 C CN1215432 C CN 1215432C CN B021020493 A CNB021020493 A CN B021020493A CN 02102049 A CN02102049 A CN 02102049A CN 1215432 C CN1215432 C CN 1215432C
Authority
CN
China
Prior art keywords
account ticket
login
frame
input
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB021020493A
Other languages
English (en)
Other versions
CN1383094A (zh
Inventor
嶋好博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Information and Telecommunication Engineering Ltd
Original Assignee
Hitachi Computer Peripherals Co Ltd
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Computer Peripherals Co Ltd, Hitachi Ltd filed Critical Hitachi Computer Peripherals Co Ltd
Publication of CN1383094A publication Critical patent/CN1383094A/zh
Application granted granted Critical
Publication of CN1215432C publication Critical patent/CN1215432C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供即使从扫描仪输入的帐票的方向不同,或者帐票具有伸缩,也能够无误地进行帐票识别的帐票识别方法,或者,在预先登录帐票的种类时,能够进行帐票的更新修正的结构的帐票登录方法,从帐票抽取成为特征的输入点,对于输入点进行伸缩、旋转、倾斜的修正,根据与预先登录的辞典点的距离的最小值识别帐票的种类,另外,登录帐票种类时,能够对于相似帐票进行警告画面显示,该系统构成为经过通信网络(100),连接辞典登录站(101)、帐票识别站(106)和帐票生成站(109),各个站相互协同动作,进行输入帐票的识别以及向辞典的登录。

Description

帐票识别方法
技术领域
本发明涉及在读取多种帐票时,在帐票处理之前识别读取的帐票种类的帐票识别方法以及登录识别了的帐票的帐票登录方法,特别是,涉及能够对于帐票的方向或者伸缩、倾斜,稳定地识别帐票的种类的帐票识别方法以及帐票登录方法。
背景技术
作为有关帐票识别方法的现有技术,已知有自动地抽取出用于识别帐票种类的特征量,例如,帐票中的文字码,文字行,格,框等,把这些特征量与作为线索预先登录的帐票的特征量进行对照,识别帐票种类的方法。
作为上述的帐票识别的特征量利用格的现有技术中,例如已知在特开昭61-59568号公报中等记载的技术。该现有技术通过使用帐票内的横线以及纵线进行帐票的结构分析,识别帐票种类。
另外,作为用点座标来反映帐票识别的特征量并进行对照的现有技术,例如已知在特开昭62-184585号公报等中记载的技术。该现有技术是把由点集合构成的图形进行对照的方法,通过求用于检测2个点集合的相似性的对照程度,或者,以被分割为横方向以及纵方向的小区域的块单位高速地求对照程度,识别帐票的种类。另外,例如,在特开平8-25236号公报中,公开了作为把框的中心点作为特征量,根据以横方向以及纵方向为基础的混列表进行对照的方法,进而,在特开2000-339406号公报中,公开了从横方向以及列方向的连接关系求帐票内的最小矩形的位置关系,决定最小矩形的属性的方法。
另外,作为特征量利用文字行的位置的现有技术,例如已知在特开平7-114616号公报等中记载的技术。该现有技术为了识别治疗收费申请明细书的样式,根据抽取出的文字行的位置进行帐票识别。
进而,作为对于由于帐票的伸缩或者格的掠过等,抽取出帐票内的各个矩形不稳定的帐票的帐票识别的现有技术,例如已知在特开2000-306030号公报中记载的技术。该现有技术把一致的矩形的座标作为下一次对照的矩形的基准点,使基准点顺序移动进行对照。
以往,作为检索具有相似性质的图像的方法,例如已知有在「日本工业出版,图像研究,第11卷9号第5页~第9页,2000年9月,著作者名:武者义则,广池敦」中公开的技术。该现有技术从图像抽取出图像特征矢量,在其矢量彼此之间的距离中从密钥图像收集接近的图像,作为图像特征矢量,使用红绿蓝的三原色空间中的颜色特征量和辉度图像的明暗移动变化的微分方程特征量。但是,该现有技术并没有考虑到有关在帐票图像中特有的格或者文字行、框的特征。
另外,以往作为用于个人识别的指纹对照方法,例如,已知在特开2000-293688号公报等中记载的技术。该现有技术把输入的指纹图像的特征信息与预先存储的指纹图像的特征信息进行对照,以及,把特征信息的某一方旋转成倒立状态或者正交状态对照指纹。但是,该现有技术没有关于在帐票图像中特有的格或者文字行、框的特征的考虑。
另外,以往,作为检测文书的旋转角的方法,例如,已知在特开平6-103411号公报等中记载的技术。该现有技术使文书旋转0度,90度,180度,270度,分别进行文字识别,把其中最正确文书的旋转角决定为文书的方向。但是,该现有技术为了检测帐票的方向,以各个角度进行文字识别,具有在文字识别方面需要花费处理时间的问题,而且,并没有考虑到识别帐票的种类。
另外,以往,作为识别帐票的同时,还识别帐票的90度单位的旋转方向的方法,例如,已知在特开平7-249099号公报中记载的技术。该现有技术对于把输入帐票旋转了90度,180度,270度的帐票,求格即垂直线·水平线的分布,通过它们与预先求出的垂直线·水平线的分布进行对照,从而识别帐票的同时还识别所输入的帐票90度单位的旋转方向。但是,该现有技术中存在对于作为特征量所使用的格的掠过或者粗细不稳定,根据所接触的文字的排列,将发生连接文字笔画那样的伪格,进行错误的帐票识别以及旋转方向识别的问题。
以往,作为使用框线的线种类进行帐票识别的方法,例如已知在特开平11-66228号公报等中公开的技术。该现有技术判定框线的线种类,生成用于帐票读取的格式信息。另外,作为这种技术,在特开平11-85900号公报中公开的现有技术把实线与虚线区别开来识别帐票,进而,能够通过在识别精度方面不区别实线和虚线进行处理,识别帐票。但是,该现有技术并没有公开对是否利用每个帐票种类、每个帐票框的格的种类的这种情况进行切换,以便使之成为有效或者无效。
以往,作为即使帐票有伸缩也能够进行帐票识别的方法,例如已知在特开2000-306030号公报等中记载的技术。该现有技术通过使基准点顺序移动并对照邻接的帐票的框,防止帐票总体的伸缩引起的位置偏移所产生的对照错误。但是,该现有技术在框丢失不能够抽取出框的情况下或者产生伪矩形的情况下,存在着在每个框的对照中将出错的问题点,另外,并没有考虑到基准位置的偏移。还有,作为同种技术,已知在特开2000-123174号公报,特开平8-315068号公报,特开平7249099号公报等中记载的技术。这些现有技术是把包含在一定区域内的格的间隔进行对照,从其对照结果推断帐票图像的伸缩率的方法,但是,在格之间的对照中,发生格的丢失或者伪格时,对照自身会出错,因此,不能够解决有关所推断的伸缩率的值出错这样的问题,由于是依赖于格的对照,处理伸缩的方法,因此具有如果格的对照出错则在伸缩方面将发生错误这样的问题。
上述现有技术中,识别成为帐票识别对象的输入帐票的方向的技术,通过在预先登录的帐票的角部印刷特殊的标志或者指定的文字列,对于输入帐票读取其标志等,在沿着帐票旋转90度的方向设定扫描仪的情况下或者上下反转即旋转180度状态的帐票用扫描仪输入的情况下,能够识别帐票的种类,但是存在着在帐票上需要特殊的指定印刷区域,不能够有效地使用帐票的空间这样的问题点。
另外,上述现有技术中,作为在帐票识别的同时还识别帐票的90度单位的旋转方向的方法,记载在上述特开平7-249099号公报中的技术,对于把输入帐票旋转90度,180度,270度的帐票,求格即垂直线水平线的分布,通过把它们与预先求出的垂直线水平线的分布进行对照,从而识别帐票的同时,还识别所输入的帐票的90度单位的旋转方向这样的技术,在存在作为特征而利用的格的掠过或者过粗的情况下,识别变得不稳定,另外,根据所接触的文字的排列,会产生连接文字笔画的伪格,从而存在进行错误的帐票识别以及旋转方向的识别这样的问题点。
另外,在上述现有技术中,区别成为帐票识别对象的输入帐票中的框线的种类,实线和虚线,从而识别帐票的技术,没有考虑对是否利用每个帐票种类、每个帐票框的格的种类的这种情况进行切换,以便使之成为有效还是无效。因此,该现有技术在虚线的间隔狭窄的帐票的情况下,或者虚线的点过粗而相邻的点连接在一起成为实线的情况下,存在着有可能错误地识别为不同的帐票,或者不能够检测该帐票而拒绝的问题点,另外,根据帐票的不同,在框的形状相同,且不需要区别实线和虚线,且特定部分是实线还是虚线都应该视为同一帐票的帐票被混合输入的情况下,或者相对于所有种类的帐票,把虚线和实线视为相同而进行帐票识别等,或者进行虚线与实线的区别视为不同的帐票进行帐票识别,除去唯一地选择以上某一种方法以外就不能够进行处理。即,该现有技术即使对于在不需要实线和虚线的区别,且特征部分是实线还是虚线都应视为同一帐票的帐票,也需要预先分别登录用于帐票识别用的辞典或者帐票读取用的格式信息,因此存在辞典登录的作业过多,另外存储辞典的容量过大的问题点。
进而,上述现有技术中,为了对应帐票的伸缩使基准点顺序移动进行对照的方法,如果由于格的丢失或者伪格的出现,在对照过程中使新设定的基准出错,则存在着在帐票识别中产生错误,或者有可能被拒绝这样的问题点。
进而,以上说明过的现有技术如果每一种都增多登录帐票的种类,则使用者难以判断新的成为登录对象的帐票已经登录完毕还是未登录,另外,存在着在登录完毕的相似帐票识别为同一种类的帐票时,不能够把其帐票与相似帐票进行区别这样的问题点。
本发明的第1个目的在于提供解决上述现有技术的问题点,即使在从扫描仪输入了任意设定帐票的方向的帐票,例如,旋转90度的状态或者上下反转即旋转180度状态的帐票时,也与正立状态的帐票时相同,能够可靠地识别帐票种类的同时,检测帐票的旋转方向的帐票识别方法。
本发明的第2个目的在于提供在预先登录的每个帐票或者该帐票的每个框中具备控制信息,利用框线的种类,例如是实线或虚线,即使在框的形状相同时,进行切换使得把框线的种类不同的帐票识别为不同种类的帐票或者把框线的种类不同的帐票识别为相同的帐票,从而能够识别帐票的种类的帐票识别方法。
本发明的第3个目的在于提供即使在帐票中存在位置偏移,也能够高精度地识别帐票的种类的帐票识别方法。
本发明的第4个目的在于提供即使对于因格的掠过等引起的丢失或者出现伪格,或者即使帐票存在伸缩,也能够高精度地稳定地识别帐票的种类的帐票识别方法。
本发明的第5个目的在于提供具备用于使用者以目视进行判断成为新登录对象的帐票已经登录完毕还是未登录的画面接口,编辑并印刷对象帐票试行再次登录的功能,确保保管有对应于已印刷的帐票的帐票识别用辞典的功能的帐票登录方法。
本发明的帐票识别方法的特征在于,作为特征从输入帐票抽取出一个或者多个框的中心点,以90度单位使输入帐票的输入特征或者预先登录的登录帐票的特征中的某一个旋转,把输入特征与登录特征进行对照,把最一致的角度作为帐票的方向,把对应于特征的帐票种类作为帐票识别结果输出,由此,帐票在旋转90度的方向上设定于扫描仪的情况下,或者向扫描仪输入了上下反转即旋转180度的状态的帐票的情况下,也能够与正立状态的帐票相同地进行帐票识别。作为特征的框的中心点与其它的特征,例如,格的投影分布等相比较,能够稳定地抽出,并能够减小识别误差。这是因为格虽然在文字行的内部抽取为伪格,但是通过抽取出4边由格构成的框,把其框的利用格为框线,因此能够减少误抽取。
另外,本发明的帐票识别方法的特征在于,从输入帐票抽取出框线的种类,求出其与预先登录的帐票的框线种类的一致性,即使框的形状相同,也能够把框线种类不同的帐票识别为不同的帐票,进而,即使是框线种类不同的帐票,但如果框的形状相同,还能够识别为相同种类的帐票。
另外,本发明的帐票识别方法的特征在于,把具有输入帐票的特征的各个位置从预先登录的特征的基准位置,沿着横方向以及纵方向以一定宽度平行移动的同时进行对照,把与登录特征最一致的平行移动位置作为输入帐票的位置,把对应于特征的帐票种类作为帐票识别结果输出,由此即使帐票存在位置偏移也能够进行帐票识别。
另外,本发明的帐票识别方法的特征在于,使帐票的特征的对照与特征的伸缩相互独立,与特征的对照误差无关地,使特征伸缩。这里,使具有输入帐票的特征的各位置各以一定倍率沿着横方向以及纵方向伸缩,把与登录特征最一致的伸缩率作为输入帐票的伸缩率而输出,把对应于特征的帐票种类作为帐票识别结果输出,由此即使帐票存在伸缩也能够进行帐票识别。
本发明的帐票识别方法的特征在于,在画面上显示新成为登录对象的帐票图像和根据帐票识别判断为相似的登录完毕的帐票图像,输入该帐票已经登录完毕还是未登录的使用者的判断信息,为了作为新帐票,登录对象帐票,通过把对象帐票的数据编辑并印刷,且再次试行登录,从而能够进行帐票登录。
在本发明的帐票识别方法中,把输入帐票的特征与登录帐票的特征进行对照的方法具备在输入帐票的特征中赋予了点座标的输入点和在登录帐票的特征中赋予了点座标的辞典点,计算上述输入点与辞典点的距离,如果上述距离是预定值以下则判断为存在与输入点相对应的辞典点,通过基于相应的点数,输入点以及辞典点数,求出对照的一致的程度,从而能够进行高精度的帐票识别。
附图说明
图1是示出进行本发明一实施形态的帐票识别以及帐票登录的帐票识别系统的结构例的框图。
图2是说明在辞典登录站中的用于帐票识别的辞典登录的处理动作的流程图。
图3是说明用于进行根据图2说明过的辞典登录中的对话式操作的画面显示例的图。
图4是说明在帐票识别站中的输入帐票的特征抽取处理与帐票识别处理的动作的流程图。
图5是说明图4的步骤401中的帐票识别处理的动作的流程图。
图6是说明图5的步骤501中的搜索对照处理的动作的流程图。
图7是说明图6的步骤604中的点对照处理的动作的流程图。
图8是说明图7的步骤702中的相似度抽取处理的动作的流程图。
图9是说明图8的步骤802中的投入票数抽取处理的动作的流程图。
图10是说明图4的步骤400中的框抽取处理的动作的流程图。
图11是说明帐票识别站106中的输入帐票的特征抽取处理和帐票识别处理的另一个动作例的流程图。
图12A,12B说明作为有关在图4的步骤400中的框抽取处理中说明的帐票识别的特征的框中心点。
图13A~13D是说明存储在帐票辞典文件中的辞典点的图。
图14是说明计算图9的步骤903中的输入点与辞典点的最小距离的方法的图。
图15是说明把在图6的步骤602,603中所示的座标值向X、Y方向偏移的点对照的图。
图16是说明作为框的特征使用的框线的种类的图。
图17是说明在图8的步骤802中的投入票数抽取处理中,利用点的属性时的处理动作的流程图。
图18是说明在图5的步骤500中的框座标的旋转90度的处理。
图19是说明在图8的步骤802中的投入票数抽取处理中,把点的属性切换为有效或者无效中的某一种,并求出投票数时的处理动作的流程图。
图20是说明在帐票识别站中使用的帐票图像的特征例的图。
图21是示出本发明其它实施形态的帐票图像识别系统的结构例的框图。
图22是说明作为帐票图像的特征,使用框、格、文字行矩形,进行帐票识别的处理动作的例子的流程图。
图23是说明在图22的步骤2206中的帐票识别结果的复合判断的处理动作的流程图。
图24是说明使用了3种帐票特征的帐票识别的处理动作的其它例子的流程图。
图25是说明进行帐票辞典文件108与帐票文件2113之间的匹配性检验的处理动作的流程图。
图26是示出把处理中心与远方的支店或者事务所连接到网络上进行帐票识别的系统的结构例的框图。
具体实施方式
以下根据附图详细地说明本发明的帐票识别方法以及帐票登录方法的实施形态。
图1是示出进行本发明一实施形态的帐票识别以及帐票登录的帐票识别系统的结构例的框图。图1中,100是网络,101是辞典登录站,102、107是扫描仪,103是登录对象帐票图像文件,104、108是帐票辞典文件,105是显示装置,106是帐票识别站,109是帐票生成站,110是帐票文件,111是帐票打印机。
图1所示的帐票识别系统构成为经过通信网络100,连接辞典登录站101、帐票识别站106、帐票生成站109,这些站能够相互协同动作。辞典登录站101为了识别帐票的种类预先登录帐票图像的特征。在辞典登录站101中,具备获取帐票图像的扫描仪102,保管成为登录对象的帐票图像的登录对象帐票图像文件103,保管登录的帐票图像的特征的帐票辞典文件104。另外,辞典登录站101具有显示装置105,在该显示装置105的画面上显示登录完毕的帐票图像或者用扫描仪获得的新的帐票图像,对话式地进行登录作业。
帐票识别站106使用保管登录的帐票图像特征的帐票辞典文件108识别从扫描仪107输入的帐票图像的种类。帐票辞典文件108的内容是复制了帐票登录站101一侧的帐票辞典文件104的内容,能够经过通信网,始终更新最新的数据。另外,作为在帐票识别中使用的帐票辞典文件,也可以是经过通信网访问使用辞典登录站一侧的帐票辞典文件104的结构。
帐票生成站109具备帐票文件110和帐票打印机111,对于保管于帐票文件110中的帐票数据,使用帐票打印机111并在纸张上印刷帐票。帐票生成站109编辑并印刷帐票数据使得容易地进行帐票识别,在帐票登录站101中,能够用扫描仪102获取印刷了的帐票的图像,试行新登录。
图2是说明在辞典登录站101中用于帐票识别的辞典登录的处理动作的流程图,以下进行说明。
(1)首先,输入帐票图像,作为帐票图像的特征抽取出框。该处理是从帐票图像抽取出横线和纵线,根据其交叉点抽取出框的处理,进而,作为特征抽取出框内的中心点的座标。一般,框由于抽取出多个,因此作为特征抽取出多个框的中心点的座标(步骤200,201)。
(2)接着,进行已经登录的帐票辞典与从输入帐票抽取出的特征的对照,求对照的程度(步骤202)。
(3)根据在步骤202中的对照程度,决定是拒绝还是验收。这里可以简单地构成为如果对照的程度比预定值大则验收,如果比预定值小则拒绝(步骤203)。
(4)在步骤203中,判断为拒绝时,把从输入帐票抽取出的该特征作为辞典而追加登录在帐票辞典文件104中,把该帐票图像保管在登录对象帐票图像文件103中(步骤204,205)。
(5)在步骤203中,判断为验收时,有可能输入的帐票已登录完毕或者登录着相似帐票,在显示装置105上显示警告的同时,从登录对象帐票图像文件103读入登录帐票图像,在画面上显示输入的帐票图像和登录帐票图像,进行该帐票的确认以及在帐票生成站109中的帐票的变更(步骤206,207)。
如以上说明的那样,辞典登录站101在画面上显示成为登录对象的帐票图像和根据帐票识别判断为相似的登录完毕的帐票图像,使得使用者判断该帐票是已经登录完毕还是未登录,输入其判断信息。由此,由于作为新帐票而登录对象帐票,因此能够编辑并印刷对象帐票的数据,试行再次登录。
图3是说明用于进行根据图2说明过的辞典登录中的对话操作的画面显示例的图。在显示装置105的显示画面300上,显示输入帐票图像301和登录完毕或者作为相似帐票的登录帐票图像304。另外,在显示画面300上,把显示图像的说明文303、304也进行显示,另外,为了向使用者指示所需要的确认,在显示警告文305的同时,显示用于转移到编辑、印刷对象帐票的数据的帐票生成站109的处理的单击按钮306。
图4是说明在帐票识别站106中的输入帐票的特征抽取处理和帐票识别处理的动作的流程图。在图4所示的流程中,在步骤400中从输入帐票图像抽取出帐票识别用的特征。在所说明的例中,作为特征抽取出位于帐票内的所有框的中心点的座标。但是,作为特征并不限定于框的中心点的座标,例如也可以是格的中心点的座标或者文字行的中心点的座标。其次,在步骤401中根据抽取出的特征识别帐票的种类。
图5是说明在图4的步骤401中的帐票识别处理的动作的流程图,以下进行说明。
(1)以90度单位旋转在图4的步骤400抽取出的输入帐票图像的特征,即,框线的中心点(输入点)的座标。这里,进行左旋90度,右旋90度,上下反转180度的3种旋转。这些旋转能够通过变换作为特征的框的中心点的座标进行(步骤500)。
(2)对于在步骤500的3种旋转的每一种,以及没有旋转的情况,求中心座标,反复进行后述的步骤501的搜索对照,步骤502的相似度登录(步骤505)。
(3)在搜索对照的处理中,使基准位置以预定宽度沿着横方向,接着,沿着纵方向平行移动的同时,进行输入点与辞典中的点的对照。而且,在相似度登录的处理中,按每个在步骤500中设定的旋转角,求通过对照可以得到的相似度,登录其相似度和其旋转角(步骤501,502)。
(4)然后,把在每个登录了的旋转角的相似度中,具有最大相似度的旋转角决定为帐票的方向,进而,把具有其最大相似度的辞典的种类决定为相对应的帐票的种类(步骤503,504)。
图6是说明图5的步骤501中的搜索对照处理的动作的流程图,以下进行说明。
(1)首先,设定用于平行移动点座标的基准位置的移动开始位置,即,设定从基准位置的搜索等级宽度,即,基准位置的平行移动的单位(步骤600,601)。
(2)使基准位置的X方向以所设定的等级宽度偏移,进而,使基准位置的Y方向以所设定的等级宽度偏移,同时反复进行步骤604,605,606的处理(步骤602,603)。
(3)在点对照的处理中,把输入点与辞典点的对照进行到辞典结束为止。而且,在相似度登录的处理中,登录该点对照的相似度,及此时的X方向,Y方向的偏移量(步骤604秒,605)。
(4)由于在步骤604、605的处理中,登录了旋转与X方向、Y方向的偏移量之间的多个组合中的每一个的点对照的相似度,及此时的X方向、Y方向的偏移量,因此,与X方向、Y方向的偏移量一起登录其中具有最大相似度的X方向、Y方向的偏移量的辞典的种类。该登录的X方向、Y方向的偏移量以后确定要读取的帐票内的框之一,并在框内的文字等的读取中使用(步骤606)。
图7是说明图6的步骤604中的点对照处理的动作的流程图。在图7所示的流程中,首先,在步骤700中,设定从基准位置的位置偏移量。接着,在步骤701中,至辞典结束为止反复进行步骤702中的相似度的抽取。而且,在步骤703中按照抽取出的相似度的大小顺序改变排列帐票种类。
图8是说明图7的步骤702中的相似度抽取处理的动作的流程图,以下进行说明。该处理是假设在输入帐票中具有伸缩,假定伸缩率为多个,并抽取出相似度,由于独立地进行对照处理与对于特征的伸缩处理,因此具有不会受到对照处理的误差影响的优点。
(1)首先,设定多个放大缩小的倍率,并设定成反复进行步骤801,802,803的处理,直到它们结束为止(步骤800)。
(2)根据对应的放大缩小率进行输入点座标的放大缩小。在该处理中,由于假定伸缩率为多个并进行输入点座标的放大缩小,因此具有即使在帐票伸缩的情况下也能够计算出相似度,另外,即使在作为特征利用的点中发生丢失或者假点,也能够可靠地计算出相似度的效果(步骤801)。
(3)接着,作为投入票数求出与输入点对照的辞典点的个数,抽取出投入票数,并根据投入票数和输入点数以及辞典点数计算相似的程度(步骤802,803)。
在上述的处理中,作为相似度的计算方法,例如可以使用以输入点数和辞典点数之和除投入票数的百分率。即,相似度成为投入票数/(输入点数+辞典点数)的百分率。另外,相似度例如也可以使用以输入点数与辞典点数之和除投入票数减去输入点数与辞典点数之差而计算的个数的百分率。即,相似度成为(投入票数-绝对值(辞典点数-输入点数))/(输入点数+辞典点数)的百分率。这种情况下,由于对于投入票数减去输入点数与辞典点数之差求出,因此在检测出多个输入点的情况下,具有能够减少投入票数,降低相似度的效果。
图9是说明图8的步骤802中的投入票数抽出处理的动作的流程图。该处理是对于所注目的输入点求位于其附近的辞典点内处于最小距离的辞典点,从其最小距离的长度判断是否存在对照的辞典点的同时,作为投入票数计数对于输入点存在辞典点的输入点的个数的处理。
在图9所示的流程中,首先,在步骤900中,把投入票数初始化。接着,在步骤901中,设定成反复进行步骤902以下的处理,直到输入点结束为止。在步骤902,903的处理中,计算输入点与辞典点的最小距离,直到辞典的点结束为止。而且,在步骤904中判断该距离是否小于预定值,如果小于则在步骤905中把投入票数的值增加1。通过反复进行以上的处理,能够计算出投入票数。
图10是说明图4的步骤400中的框抽取处理的动作的流程图,以下进行说明。
(1)首先,从帐票图像检测出横线和纵线。在该处理中,用黑线部分即黑列(ラン)的集合反映图像,作为横线抽取出线长较长的黑列。另外,纵线的抽取通过把图像旋转90度,同样地抽取出线长较长的黑列进行。另外,作为其它的方法,也可以使用抽取出黑象素的块的轮廓线,取出框线的方法(步骤1000)。
(2)接着检测框。该框的检测能够通过从纵线以及横线的交点取出框来进行。另外,详细的框检测方法也可以是在特开平8-125855号公报中公开的方法(步骤1001)。
(3)接着,检测框的四个角的座标,计算框的中心点座标,把该中心点座标作为用于帐票识别的特征(步骤1002,1003)。
(4)进而,根据从框线的倾斜或者帐票边缘的倾斜而检测出的帐票的微小倾斜角,对于计算出的中心点座标进行倾斜修正。这里的修正是对于微小的倾斜角的点座标的修正,关于90度单位的旋转,以已经说明过的步骤505的处理进行。这样,对于微小的倾斜进行了倾斜修正的中心点座标作为用于帐票识别的特征(步骤1004)。
图11是说明帐票识别站106中的输入帐票的特征抽取处理和帐票识别处理的其它动作例的流程图,是与根据图4说明过的例子不同的处理。该处理作为特征使用文字行的位置座标进行帐票识别。
在图11所示的流程中,在步骤1101的处理中,从输入帐票图像抽取文字行。详细的文字行抽取方法能够使用在特开平11-232376号公报中公开的条形码行的抽取处理方法。而且,以文字行的座标,例如文字行内部的中心点的座标为特征,由此,在步骤1102的处理中反复进行帐票识别。另外,步骤1102的帐票识别处理也可以是与图4的步骤401的处理相同的处理。
图12是说明在图4的步骤400中的框抽取处理,说明作为帐票识别的特征的框的中心点的图。图12(a)示出输入帐票图像1200的例子,该例中,在输入帐票图像1200中,存在框1201,1202,1203的3个框。而且,图12(b)示出抽取出了输入帐票图像1200内各框的中心点1211,1212,1213的结果的图像1210。各个框内部的中心点表现为横方向以及纵方向的座标。
图13说明存储在帐票辞典文件104或者108中的辞典点。图13(a)~图13(d)中,把作为帐票种类登录完毕的辞典的例子示为1300,1301,1302,1303。对应于帐票的种类分别具备各自的辞典点。在辞典1300中,作为位置座标具备辞典点1310、1311、1312、1313,另外,在辞典1301中,作为位置座标具备辞典点1314、1315、1316,在辞典1302中,作为位置座标具备辞典点1317、1318、1319,在辞典1303中,作为位置座标具备辞典点1320、1321、1322。
图14说明在图9的步骤903中的计算输入点与辞典点的最小距离的方法。图14中,在以1400表示的横方向X,以1401表示的纵方向Y的帐票平面中,把从输入帐票图像抽取出的输入点(用黑点表示)记为1410、1411、1412。另外,把某个辞典的辞典点(用白点表示)记为1420、1421、1422、1423。
对于任意的输入点1410,为了求存在于附近的最短距离的辞典点,计算该输入点1410与辞典点1420、1421、1422、1423的距离,具有其最短距离的辞典点在本例中求出为辞典点1420。对于各个输入点,进行同样的处理,求位于最短距离的辞典点。其结果,作为位于输入点1411的最短距离的辞典点抽取出1421,对于输入点1412抽取出1422。另外,由于以输入点为基准检测相对应的辞典点,因此对于辞典点1423没有对应的输入点。
图15是说明把在图6的步骤602,603中示出的座标值向X、Y方向偏移了的点对照的图。在图15所示的输入帐票图像中,把用1500所示的横方向X,用1501所示的纵方向Y的原点位置记为1540。另外,把从输入帐票图像抽取出的输入点记为1520、1521、1522,把某个辞典的辞典点记为1530,1531、1532、1533。而且,纵方向的虚线1502~1507表示把原点的位置沿着横方向以一定间隔移动时的偏移位置,另外,横方向的虚线1508~1512表示把原点的位置沿着纵方向以一定间隔移动时的偏移位置。
在图15中,使原点沿着上述虚线的交点平行移动。即,把输入点的座标值仅更新预定量。而且,对于平行移动了的输入点座标,进行图6的步骤604的点对照的处理。本发明的实施形态由于像这样把原点以一定的间隔沿着横方向以及纵方向平行移动进行点之间的对照,因此即使在输入帐票中存在位置偏移也能够高精度地进行帐票识别。
图16是说明作为框的特征使用的框线的种类的图。在上述说明过的图10的流程中的、抽取线段的步骤1000中,不仅抽取实线,例如还能够抽取出虚线,把其作为框的特征在帐票识别中利用。作为构成框线的种类,有实线和虚线时,如图16所示,作为框的种类,有作为框1600~1615所示的16种。另外,作为框线的种类,不一定限定于实线和虚线,例如,也可以包括点划线或者点线等线种类。另外,在线种类中还可以包括线粗细。如果框的线种类不同,则即使框的形状或者位置相同,帐票的种类也不同。
在本发明的实施形态中,在框线的种类不同的16种框中分别提供属性。属性对应于框线的种类,例如,也可以是从1~16的号码。例如,框1600的4条框线是实线。另外,框1601~1604的3条框线是实线,剩余的1条框线是虚线。框线1605~1610的2条框线是实线,其余的2条框线是虚线。框1611~1614的3条框线是虚线,剩余的1条框线是实线。框1615的4条框线是虚线,这些是所有不同种类的框。另外,在步骤1000中从格中抽取出虚线的处理中,例如,能够使用在特开平9-319824号公报中公开的虚线抽取方法。
图17是说明在图8的步骤802中的投入票数抽取处理中,利用点的属性时的处理动作的流程图。这里的处理,作为点的属性赋予框线的线种类。而且,该处理是对于所注目的输入点,求位于其附近的辞典点内,输入点与辞典点的属性相同而且位于最小距离的辞典点,从其最小距离的长度判断是否存在对照的辞典点,同时,对于输入点作为投入票数计数存在辞典点的输入点个数的处理。
图17中,首先,在步骤1700把投入票数初始化。接着,在步骤1701中,设定成反复进行步骤1702以下的处理,直到输入点结束为止。在步骤1702中,至辞典点结束为止,在步骤1703中求输入点与辞典点的属性一致的辞典点,在步骤1704中计算输入点与该辞典点的最小距离。而且,在步骤1705中判断该距离是否小于预定值,在小于时,在步骤1706中使投入票数的值增加1。通过反复进行以上的处理,能够计算投入票数。
通过上述图17的处理,能够对于框线种类不同的帐票,判断为帐票种类不同。由此,例如,即使框线的属性不同也视为相同种类的帐票时,能够共用用于文字读取的格式数据,能够得到可以省略格式数据生成的作业的优点。另外,在帐票图像中,点线由于受到图像2值化的影响而破坏,有时成为点线相连接的实线。对于这样的帐票,通过忽视框线的属性,能够可靠地识别帐票的种类。
图18是说明图5的步骤500中的框座标旋转90度的处理的图。在图18中,把从输入帐票图像抽取出的特征示为1800。这里,作为特征具备框中心点的位置座标。对于该输入特征1800,向右旋转90度的特征是特征1801,另外,对于该输入特征1800,上下反转的特征是特征1802,向左旋转90度的特征是特征1803。本发明的实施形态由于如上述那样以90度单位旋转输入特征进行对照,因此即使在扫描仪上沿着任意方向设定帐票,也能够进行帐票的识别。另外也可以与使输入点旋转的方法不同,使辞典点旋转进行对照。
图19是说明在图8的步骤802中的投入票数抽取处理中,把点的属性切换为有效或者无效,从而求投入票数时的处理动作的流程图,以下进行说明。
该切换处理按照每个帐票种类进行。但是,并不是限定于按照每个帐票种类进行切换处理,也可以按照帐票内的每个框进行切换处理。而且,在预先登录的每个帐票或者每个帐票内的框中具备把框线的种类置为有效无效的识别控制信息。这里,作为一例,作为识别控制信息具备属性标志,根据在步骤1907中使用的该属性标志而切换控制。另外,在该例中,作为点的属性赋予框线的线种类,可切换考虑线种类的识别处理与忽视线种类的差别的识别处理。而且,该处理是对于所注目的输入点,求在位于其附近的辞典点内,输入点与辞典点的属性相同而且位于最小距离的辞典点,从其最小距离的长度判断是否存在对照的辞典点,同时,作为投入票数计数对于输入点存在辞典点的输入点的个数的处理。
(1)首先,把投入票数初始化,并设定成反复进行步骤1902以下的处理,直到输入点结束为止(步骤1901)。
(2)直到辞典的点结束为止,判断各框的属性,例如,把线种类置为有效还是置为无效。如果把属性置为有效,求输入点与辞典点的属性一致的辞典点,计算输入点与该辞典点之间的最小距离(步骤1902,1907,1903,1904)。
这里,在上述的步骤1907中,把属性置为无效时,不进行步骤1903的处理以下的最小距离计算的处理,但也不一定限定于这样做。例如,也可以是在步骤1907中属性标志无效时,在步骤1903中,即使输入点与辞典点的属性不一致,也在步骤1904的处理中进行最小距离的计算而忽视属性的方法。
(3)接着,判断在步骤1904中计算出的最小距离是否小于预定值,如果小于则使投入票数的值增加1a通过反复进行以上的处理,能够计算投入票数(步骤1905,1906)。
通过上述图19所示的处理,对于框线种类不同的帐票,能够切换判断为帐票种类相同或者判断为不同,计算投入票数。
图20是说明帐票识别中使用的帐票图像的特征例的图。作为帐票的特征,如图20所示,有帐票中的框2001中的框内部的中心点2000的座标,帐票中的格2003中的格的中心点2002的座标,帐票中的文字行外接的矩形2005的中心点2004的座标等,能够把这些作为在帐票识别中利用的特征使用。
图22是说明作为帐票图像的特征,使用根据图20说明的3种特征,即框、格、文字行矩形进行帐票识别的处理动作例的流程图。图22中,在步骤2200中作为帐票的特征抽取出框,在步骤2201中利用框进行帐票识别。接着,在步骤2202中作为帐票的特征抽取出格,在步骤2203中进行利用了格的帐票识别。进而,在步骤2204中抽取出文字行,在步骤2205中进行利用了文字行的帐票识别。最后,在步骤2206中进行在步骤2201、2203、2205中各帐票识别结果的复合判断。
图23是说明在图22的步骤2206中的帐票识别结果的复合判断的动作处理的流程图,以下进行说明。
首先,在步骤2300中指示反复进行步骤2301~2305的处理直到预先登录的帐票的种类结束为止。在步骤2301的处理中,把用于复合判断的指标值按照每个帐票种类进行初始化。接着,在步骤2302的处理中,把利用框的帐票识别结果加入到该指标值,这里是加入到初始值上。接着,在步骤2303的处理中,把利用格框的帐票识别结果加入到该指标值,这里是加入到初始值+利用框的识别结果的指标值上。进而,在步骤2304的处理中,把利用文字行的帐票识别结果加入到该指标值,这里是加入到初始值+利用框的识别结果+利用格的识别结果的指标值上。接着,在步骤2305的处理中,登录在步骤2304中得到的初始值+利用框的识别结果+利用格的识别结果+利用文字行的识别结果的指标值。最后,在步骤2306的处理中,按照指标值的大小排列作为识别结果的帐票种类。
在上述中,作为指标值使用了各帐票识别候补的顺序时,按照指标值小的顺序分类帐票种类。或者,在作为指标值使用了各帐票识别候补的相似度时,按照指标值大的顺序分类帐票种类。本发明的实施形态如上述那样,由于能够使用多个帐票的特征输出帐票识别结果因此能够进行高精度的帐票识别。例如,能够高精度的识别框和下划线混合存在的帐票。
图24是说明使用了3种帐票特征的帐票识别的处理动作的其它例子的流程图,是与根据图23说明过的流程的方法不同的方法的例子。
图24中,首先,在步骤2400抽取框,在步骤2401中进行利用框的帐票识别。接着,在步骤2402中,判断是否拒绝利用框帐票识别,如果拒绝,则在步骤2403中抽取格,在步骤2404中进行基于利用格的帐票识别。接着,在步骤2405中判断是否拒绝利用格的帐票识别,在判断为拒绝时,在步骤2406中抽取文字行,在步骤2407中进行利用了文字行的帐票识别。
图24所示的处理中,如上述那样,在拒绝了利用某种特征的帐票识别时,由于进行利用了其它特征的帐票识别,因此能够缩短处理时间。图26是示出处理中心和位于远方的支店或者事务所连接于网络从而进行帐票识别的系统的结构例的框图。图26中,2600是网络,2601是中心站,2602是登录站,2603、2604是生成站,2610~2612是支店站,2613是识别站。
图26所示的系统构成为在网络2600上连接有在全国设有多个的中心站2601和设置在远方的支店或事务所中的支店站2610~2612。中心站2601中,具备进行帐票登录的登录站2602,生成帐票的生成站2603。另外,在支店站2610~2612中,具备进行帐票图像的输入、识别的识别站2613,能够进行支店中的帐票生成的生成站2614。在这样构成的系统中,经过网络2600,帐票识别用的辞典或者印刷用的帐票文件从中心站2601分发到各支店站2610~2612,因此能够统一管理辞典等的保存,能够减轻保存作业。
图21是示出本发明其它实施形态的帐票图像识别系统的结构例的框图。图21中,2110是中心站,2111是远方站,2112是帐票生成站,2113是帐票文件,2114是帐票打印机,其它的符号与图1相同。
图21所示的本发明其它实施形态帐票图像识别系统构成为经过通信网络100连接辞典登录站101,帐票识别站106,帐票生成站109、2112,这些站能够协同动作。而且,辞典登录站101、帐票生成站109构成为用点划线包围的中心站2110,另一方面,帐票识别站106、帐票生成站2112构成为用点划线包围的设置在位于远方的各事务所中的远方站2111。
辞典登录站101为了识别帐票的种类预先登录帐票图像的特征。在辞典登录站101中,具备获取帐票图像的扫描仪102,保管成为登录对象的帐票图像的登录对象帐票图像文件103,保管登录的帐票图像的特征的帐票辞典文件104。另外,辞典登录站101具有显示装置105,在该显示装置105的画面上显示登录完毕的帐票图像或者用扫描仪获得的新的帐票图像,对话式地进行登录作业。
帐票识别站106使用保管登录的帐票图像的特征的帐票辞典文件108识别从扫描仪107输入的帐票图像的种类。帐票辞典文件108的内容复制了辞典登录站101一侧的帐票辞典文件104的内容,经过通信网络,能够始终更新为最新的数据。另外,作为帐票识别中使用的帐票辞典文件,还可以是经过通信网络访问辞典登录站一侧的帐票辞典文件104的结构。
帐票生成站109具备帐票文件110和帐票打印机111,对于保管在帐票文件110中的帐票数据,使用帐票打印机在纸张上印刷帐票。帐票生成站109为了使得帐票识别容易,编辑并印刷帐票数据,在辞典登录站101中,能够用扫描仪102获得印刷了的帐票的图像,试行新登录。
帐票生成站2112设置在作为事务所一侧的远方站,连接帐票文件2113,帐票打印机2114。而且,保管在帐票文件2113中的帐票在事务所一侧从帐票打印机2114印刷并进行分发。这时,在更新帐票辞典文件108,并且没有保管最新的帐票文件时,不存在帐票辞典文件108与帐票文件2113之间的匹配性,有可能对于前述的印刷并分发的帐票拒绝帐票识别。因此,需要检测帐票辞典文件108与帐票文件2113的匹配性。
图25是说明进行帐票辞典文件108与帐票文件2113之间的匹配性检测的处理动作的流程图。
在图25所示的流程中,帐票生成站2112,首先,在步骤2500中指定印刷对象的帐票的种类。接着,在步骤2501中搜索帐票辞典文件108,在步骤2502中判断是否保管着该帐票辞典。如果保管着该帐票辞典,则在步骤2503中从帐票文件2113选择该帐票数据,在步骤2504中印刷帐票数据。另一方面,在步骤2502的判断中,如果没有保管着帐票辞典,则在步骤2505中向位于中心一侧的辞典登录站101发出帐票辞典的发送请求,更新帐票辞典文件108。由此,能够保证保管与所印刷的帐票相对应的帐票识别用辞典。
如以上那样,本发明为了把预先登录的多个帐票的特征与所输入的帐票的特征相对照,进行识别帐票的种类的帐票识别,公开了预先登录帐票的特征的帐票登录方法,该帐票登录方法的特征是在画面上显示成为登录对象的输入帐票图像和根据帐票识别判断为相似的登录完毕的帐票图像,输入上述输入帐票是已经登录完毕还是未登录这样的使用者的判断信息,并为了将对象帐票作为新帐票而登录,将对象帐票的数据进行编辑、印刷,试行再登录;以及公开了把预先登录的多个帐票的特征与所输入的帐票的特征根据座标位置进行对照,识别帐票的种类的帐票识别方法。所公开的帐票识别方法,例如,是以下述为特征的帐票识别方法,即,把作为输入帐票的输入特征抽取出的各位置从预先登录的帐票的登录特征的基准位置,沿着横方向以及纵方向以一定间隔平行移动的同时,与上述基准位置相对照,把与登录特征最一致的平行移动位置作为输入帐票的位置,把具有最一致的登录特征的帐票种类作为帐票识别结果。另外,帐票识别方法具备在输入帐票的特征上赋予点座标的输入点和在登录帐票的特征上赋予点座标的辞典点,计算上述输入点与辞典点的距离,如果上述距离是预定值以下则判断是否存在与输入点相对应的辞典点,根据相对应的点数,输入点数以及辞典点数,把输入帐票的特征与登录帐票的特征相对照,求对照一致的程度,识别输入帐票的种类。
如以上所说明的那样,如果依据本发明,则由于根据从框线的倾斜或者帐票边缘的倾斜而检测出的帐票的倾斜角,对于框的中心点座标进行倾斜的修正,因此即使对于具有倾斜的帐票也能够进行高精度的帐票识别。另外,如果依据本发明,则由于把伸缩率设定为多个,进行输入点座标的放大缩小,因此即使在丢失特征或者发生伪格的帐票伸缩的情况下,也可以得到能够计算相似度的效果。
进而,如果依据本发明,则由于把原点以一定的间隔沿着横方向以及纵方向平行移动,进行点之间的对照,因此即使在输入帐票中存在位置偏移的情况下,也能够高精度地进行帐票识别。另外,如果依据本发明,则由于对于框线种类不同的帐票,能够按每个帐票或者每个帐票内的框,切换框线种类的有效、无效,识别帐票的种类,因此可以得到能够谋求提高帐票识别的可靠性,而且,能够减少存储总量的效果。
进而,如果依据本发明,则由于作为输入特征把框的中心点以90度单位旋转,进行对照,因此即使把帐票以任意的方向设定在扫描仪中,也能够进行帐票的识别,另外,与利用格的分布特征的帐票识别相比较能够进行可靠的帐票的识别。

Claims (5)

1.一种帐票识别方法,该帐票识别方法根据位置座标,把预先登录的多个帐票的特征与所输入的帐票的特征相对照,识别帐票的种类,其特征在于:
从输入帐票抽取出包含在帐票内的一个或者多个框、格线或者文字行,作为输入特征抽取出作为帐票特征的框、格线或者文字行的中心点座标,以90度单位旋转上述输入特征或者预先登录的帐票的登录特征中的某一个,根据从框、格线或者文字行检测出的微小倾斜角,对上述输入特征进行微小角度修正,把输入特征与登录特征相对照,把相似度最高的角度作为输入帐票的方向,把具有相似度最高的登录特征的帐票种类作为帐票识别结果。
2.根据权利要求1所述的帐票识别方法,其特征在于:
输出具有上述相似度最高的角度的输入帐票的方向。
3.一种帐票识别方法,其特征在于:
按所登录的每个帐票种类或者每个帐票的框具备把框的线种类置为有效·无效的识别控制信息,从输入帐票抽取出框线的种类,求与预先登录的帐票的框线种类的相似性,切换把即使框的形状相同但框线的种类不同的帐票识别为其它种类的帐票的控制、以及如果框的形状相同则即使框线的种类不同也识别为相同种类的帐票的控制。
4.一种帐票识别方法,该帐票识别方法根据位置座标,把预先登录的多个帐票的特征与所输入的帐票的特征进行对照,识别帐票的种类,其特征在于:
把作为输入帐票的输入特征而抽取出的各位置座标各以一定倍率沿着横方向以及纵方向伸缩,或者,沿着横方向或者纵方向假设多个伸缩率,根据上述假设的伸缩率使输入特征伸缩,把与预先登录的帐票的登录特征的相似度最高的伸缩率作为输入帐票的伸缩率,把具有相似度最高的登录特征的帐票种类作为帐票识别结果。
5.根据权利要求4所述的帐票识别方法,其特征在于:
把上述相似度最高的伸缩率作为输入帐票的伸缩率。
CNB021020493A 2001-04-25 2002-01-18 帐票识别方法 Expired - Fee Related CN1215432C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2001127639A JP2002324236A (ja) 2001-04-25 2001-04-25 帳票識別方法及び帳票登録方法
JP127639/2001 2001-04-25

Publications (2)

Publication Number Publication Date
CN1383094A CN1383094A (zh) 2002-12-04
CN1215432C true CN1215432C (zh) 2005-08-17

Family

ID=18976476

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB021020493A Expired - Fee Related CN1215432C (zh) 2001-04-25 2002-01-18 帐票识别方法

Country Status (3)

Country Link
US (1) US7106904B2 (zh)
JP (1) JP2002324236A (zh)
CN (1) CN1215432C (zh)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8205237B2 (en) 2000-09-14 2012-06-19 Cox Ingemar J Identifying works, using a sub-linear time search, such as an approximate nearest neighbor search, for initiating a work-based action, such as an action on the internet
US8010988B2 (en) * 2000-09-14 2011-08-30 Cox Ingemar J Using features extracted from an audio and/or video work to obtain information about the work
RU2003108433A (ru) 2003-03-28 2004-09-27 Аби Софтвер Лтд. (Cy) Способ предварительной обработки изображения машиночитаемой формы
US20110188759A1 (en) * 2003-06-26 2011-08-04 Irina Filimonova Method and System of Pre-Analysis and Automated Classification of Documents
RU2635259C1 (ru) * 2016-06-22 2017-11-09 Общество с ограниченной ответственностью "Аби Девелопмент" Способ и устройство для определения типа цифрового документа
JP4697387B2 (ja) * 2004-06-07 2011-06-08 富士ゼロックス株式会社 原稿画像判定装置、原稿画像判定方法及びそのプログラム
JP4614320B2 (ja) * 2004-10-25 2011-01-19 株式会社リコー 位置合わせ装置、位置合わせ方法、プログラムおよび記録媒体
JP2006163916A (ja) * 2004-12-08 2006-06-22 Nippon Telegr & Teleph Corp <Ntt> 直線パターン識別方法及び装置及びプログラム
US7787158B2 (en) * 2005-02-01 2010-08-31 Canon Kabushiki Kaisha Data processing apparatus, image processing apparatus, data processing method, image processing method, and programs for implementing the methods
JP4635845B2 (ja) * 2005-11-29 2011-02-23 日本電気株式会社 Ocr装置、フォームアウト方法及びフォームアウトプログラム
JP4837371B2 (ja) * 2005-12-05 2011-12-14 創英株式会社 書類登録システム及び書類登録方法
WO2007117334A2 (en) * 2006-01-03 2007-10-18 Kyos Systems Inc. Document analysis system for integration of paper records into a searchable electronic database
JP4848221B2 (ja) * 2006-07-31 2011-12-28 富士通株式会社 帳票処理プログラム、該プログラムを記録した記録媒体、帳票処理装置、および帳票処理方法
JP4918937B2 (ja) * 2007-03-08 2012-04-18 富士通株式会社 帳票種識別プログラム、帳票種識別方法および帳票種識別装置
US8108764B2 (en) * 2007-10-03 2012-01-31 Esker, Inc. Document recognition using static and variable strings to create a document signature
US20090226090A1 (en) * 2008-03-06 2009-09-10 Okita Kunio Information processing system, information processing apparatus, information processing method, and storage medium
US8600164B2 (en) * 2008-03-28 2013-12-03 Smart Technologies Ulc Method and tool for recognizing a hand-drawn table
US8634645B2 (en) * 2008-03-28 2014-01-21 Smart Technologies Ulc Method and tool for recognizing a hand-drawn table
JP5617249B2 (ja) * 2010-01-20 2014-11-05 富士ゼロックス株式会社 帳票識別装置、帳票識別プログラム及び帳票処理システム
JP5462017B2 (ja) * 2010-02-08 2014-04-02 沖電気工業株式会社 帳票処理システム、エントリ端末および帳票データ処理方法
CN102467739A (zh) * 2010-10-29 2012-05-23 夏普株式会社 图像判断装置、图像提取装置以及图像判断方法
JP2012190410A (ja) * 2011-03-14 2012-10-04 Toshiba Corp 帳票処理システム、方法及びプログラム
CN102509115B (zh) * 2011-11-22 2014-06-25 北京京北方信息技术有限公司 一种分层带回溯查找机制的票据类型识别方法
CN103577817B (zh) * 2012-07-24 2017-03-01 阿里巴巴集团控股有限公司 表单识别方法与装置
US10114800B1 (en) * 2013-12-05 2018-10-30 Intuit Inc. Layout reconstruction using spatial and grammatical constraints
CN103871063B (zh) * 2014-03-19 2017-04-19 中国科学院自动化研究所 一种基于点集匹配的图像配准方法
JP6810892B2 (ja) * 2017-06-05 2021-01-13 京セラドキュメントソリューションズ株式会社 画像処理装置
US11087448B2 (en) * 2019-05-30 2021-08-10 Kyocera Document Solutions Inc. Apparatus, method, and non-transitory recording medium for a document fold determination based on the change point block detection

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07107694B2 (ja) 1984-08-31 1995-11-15 株式会社日立製作所 文書処理装置
JPH0727560B2 (ja) 1986-02-10 1995-03-29 株式会社日立製作所 点パタ−ン照合方法
US4949392A (en) * 1988-05-20 1990-08-14 Eastman Kodak Company Document recognition and automatic indexing for optical character recognition
US5276742A (en) * 1991-11-19 1994-01-04 Xerox Corporation Rapid detection of page orientation
JP3186246B2 (ja) 1992-09-24 2001-07-11 株式会社日立製作所 文書読取装置
JP3483919B2 (ja) 1993-10-20 2004-01-06 株式会社日立製作所 伝票文書情報システム
JPH07249099A (ja) 1994-03-14 1995-09-26 Fujitsu Ltd 帳票識別装置
JP3348224B2 (ja) 1994-10-26 2002-11-20 株式会社日立製作所 表枠線の交点補正装置および表認識装置および光学文字読取装置
JP3469345B2 (ja) 1995-03-16 2003-11-25 株式会社東芝 画像のファイリング装置及びファイリング方法
JP3353215B2 (ja) 1995-05-15 2002-12-03 日本電信電話株式会社 帳票書式識別方法及び装置
JPH09319824A (ja) 1996-05-30 1997-12-12 Hitachi Ltd 帳票認識方法
JP3580670B2 (ja) * 1997-06-10 2004-10-27 富士通株式会社 入力画像を基準画像に対応付ける方法、そのための装置、及びその方法を実現するプログラムを記憶した記憶媒体
JP3524339B2 (ja) 1997-08-25 2004-05-10 沖電気工業株式会社 光学式文字読取装置用帳票のフォーマット情報生成方法
JPH1185900A (ja) 1997-09-03 1999-03-30 Ricoh Co Ltd 帳票識別方法、機械読み取り可能媒体及び文字認識装置
JP3580115B2 (ja) 1998-02-10 2004-10-20 株式会社日立製作所 カスタマバーコード読取り郵便物等区分装置
US6798905B1 (en) * 1998-07-10 2004-09-28 Minolta Co., Ltd. Document orientation recognizing device which recognizes orientation of document image
JP2000123174A (ja) 1998-10-16 2000-04-28 Matsushita Electric Ind Co Ltd 帳票書式識別装置
JP2000293688A (ja) 1999-04-01 2000-10-20 Fujitsu Ltd 指紋照合装置
JP3951502B2 (ja) 1999-04-26 2007-08-01 富士通株式会社 帳票照合装置
JP4450888B2 (ja) 1999-05-28 2010-04-14 富士通株式会社 帳票認識方法
US6785428B1 (en) * 1999-10-05 2004-08-31 Adobe Systems Incorporated Rotated transform of an image using block transfers
US6778703B1 (en) * 2000-04-19 2004-08-17 International Business Machines Corporation Form recognition using reference areas

Also Published As

Publication number Publication date
US7106904B2 (en) 2006-09-12
US20020159639A1 (en) 2002-10-31
JP2002324236A (ja) 2002-11-08
CN1383094A (zh) 2002-12-04

Similar Documents

Publication Publication Date Title
CN1215432C (zh) 帐票识别方法
US7970213B1 (en) Method and system for improving the recognition of text in an image
CN110472208A (zh) Pdf文档中表格解析的方法、系统、存储介质及电子设备
CN101060579A (zh) 显示控制装置、图像处理装置、显示控制方法
CN103975342A (zh) 用于移动图像捕获和处理的系统和方法
CN1320832C (zh) 无线手持设备的基于视觉引导模型的点击接口
CN1822630A (zh) 自动评分装置、方法及其存储介质
US20070030519A1 (en) Image processing apparatus and control method thereof, and program
CN1834992A (zh) 检测文档图像中的字符的方向
JP2005004724A (ja) 画像処理装置及びその制御方法、プログラム
CN1452121A (zh) 在线手写文字模式识别编辑装置及方法
JP4807489B2 (ja) 教材処理装置、教材処理方法および教材処理プログラム
JP2021179848A (ja) 画像処理システム、画像処理方法、及びプログラム
JP2013041539A (ja) 情報抽出装置
CN1174338C (zh) 字符识别方法
CN1173283C (zh) 文献图象处理装置和方法
CN108304815A (zh) 一种数据获取方法、装置、服务器及存储介质
JP2007058485A (ja) 画像認識装置、画像認識方法および画像認識プログラム
JP2001092967A (ja) 図面認識装置および図面認識方法
CN1896997A (zh) 字符串检索装置及使计算机执行字符串检索方法的程序
US20170061182A1 (en) Method for processing information from a hand-held scanning device
Seguin et al. New techniques for the digitization of art historical photographic archives-the case of the cini foundation in venice
JP2007041709A (ja) 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP4807487B2 (ja) 教材処理装置、教材処理方法および教材処理プログラム
CN1107280C (zh) 中英文表单的识别系统及识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee