CN101051305A - 用于光学字符识别的页单输入设备、页单以及相关程序 - Google Patents

用于光学字符识别的页单输入设备、页单以及相关程序 Download PDF

Info

Publication number
CN101051305A
CN101051305A CNA2007100922752A CN200710092275A CN101051305A CN 101051305 A CN101051305 A CN 101051305A CN A2007100922752 A CNA2007100922752 A CN A2007100922752A CN 200710092275 A CN200710092275 A CN 200710092275A CN 101051305 A CN101051305 A CN 101051305A
Authority
CN
China
Prior art keywords
zone
pattern
leaf
information
ocr page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007100922752A
Other languages
English (en)
Inventor
铃木智久
水谷博之
宇田明弘
小平直朗
土桥外志正
古畑彰夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Publication of CN101051305A publication Critical patent/CN101051305A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1448Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/40Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • G06V10/945User interactive design; Environments; Toolboxes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1463Orientation detection or correction, e.g. rotation of multiples of 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Input (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种输入设备,包括:图像输入部,用于输入包含有区域和模式的图像,所述区域中填写有将要输入的信息且所述模式至少表示用于定义对应区域的位置的参考位置和对应区域的尺寸信息;存储部,用于存储由图像输入部输入的图像;模式识别部,用于根据存储在存储部中的图像中的模式来检测参考位置;区域指定部,用于根据模式识别部分所检测的参考位置以及区域的尺寸信息来指定区域的位置;以及区域输入部,用于输入在区域指定部所定义的区域中的图像。

Description

用于光学字符识别的页单输入设备、页单以及相关程序
本申请要求于2006年4月3日提交的第2006-102063号在先日本专利申请的优先权,该申请的全部内容合并于此以资参考。
技术领域
本发明涉及一种OCR(光学字符识别)页单(sheet)输入设备、一种OCR页单表格绘制设备、一种OCR页单、一种OCR页单输入的程序以及一种绘制OCR页单表格的程序,由此检测在OCR页单中的具有将要输入的信息的区域,从而通过字符识别等来输入该信息。
背景技术
在OCR页单输入设备的使用中,在OCR页单页面图像(以下称为“OCR页单图像”)中检测包含信息——诸如将要输入的字符——的区域(以下称为“区域”),从而可以将该信息识别为字符信息。
作为用于在OCR页单图像中检测将输入区域的方法,其将容易识别的标记设置在有关将输入区域的对应位置处,从而使得从作为参考的所检测标记的位置来确定将输入区域的位置。例如,在专利文件1中公开了由给定的标记来表示将输入区域所在的行位置。
[专利文件1]第2001-195541号日本专利,第[0013]段和图2。
然而,在根据所检测标记的位置确定将输入区域的位置的情况下,如果OCR页单输入设备没有识别将输入区域的尺寸,则不能在OCR页单中确定将输入区域的尺寸和位置。因此,当在OCR页单中填写了尺寸各不相同的多个将输入区域从而可以检测将输入区域的位置并且因此识别包含在将输入区域中的诸如字符的信息时,能够通过OCR页单输入设备取得在OCR页单中的将输入区域的位置信息的OCR页单表格是所希望的。
发明内容
就上述问题而言,本发明的目的在于提供一种OCR页单输入设备,其可以基于从OCR页单表格获得的信息来确定OCR页单中的将输入区域的位置。本发明的另一目的在于提供一种OCR页单表格绘制设备,其可以容易地绘制OCR页单表格,以便由OCR页单输入设备得到有关OCR页单中的将输入区域所处位置的信息。此外,本发明的另一目的在于提供一种OCR页单,一种输入OCR页单的程序以及一种绘制OCR页单表格的程序。
为了实现上述目的,本发明涉及一种OCR页单输入设备,包括:OCR页单图像输入部,其用于输入OCR页单的图像,所述OCR页单包含配置有将输入信息的区域和至少表示用于定义所述区域所处位置的参考位置和所述区域的尺寸信息的模式;存储部,其用于存储由所述OCR页单图像输入部输入的OCR页单图像;模式识别部,其用于根据存储在所述存储部中的OCR页单图像的模式来检测所述参考位置,并识别所述区域的尺寸信息;区域指定部,其用于根据所述模式识别部所检测的参考位置以及所述区域的尺寸信息来指定所述区域的位置;以及区域输入部,其用于输入在所述区域指定部所定义的区域中的图像。
所述区域可以形成为矩形,并且所述区域指定部可以被配置为确定已经由所述参考位置在区域中定义了的角的位置。
根据本发明,可以通过从OCR页单表格获得的模式来确定在OCR页单中将输入区域的尺寸和位置。
所述模式可以包括被配置为模式的旋转形状不匹配于在未旋转情况下的所述模式的原始形状的模式。在此情况下,可以通过所检测的标记的模式形状来二维地确定OCR页单图像的旋转角,以便当OCR页单图像旋转了给定角时来规则地校正所述OCR页单图像的位置。
本发明还涉及一种OCR页单表格绘制设备,包括:区域指定部,其用于获取定义信息以定义配置有将输入信息的区域;区域生成部,用于通过所述区域指定部所得到的定义信息来生成所述区域;模式生成部,用于生成模式,以基于所述区域指定部所得到的定义信息,至少表示与所述区域的位置有关的参考位置以及所述区域的尺寸信息;以及表格数据生成部,其用于生成OCR页单表格数据,所述OCR页单表格数据是通过组合由所述区域生成部生成的所述区域和由所述模式生成部分生成的所述模式来获得的。
所述定义信息可以包括与所述区域的尺寸和位置有关的信息。
所述OCR页单表格绘制设备可以包括区域信息重用部,用于作为库来存储包含所述区域的尺寸信息的属性信息,通过用户的指示加载存储为所述库的所述区域的属性信息,并重用所述属性信息以生成新的区域。
根据本发明的OCR页单表格绘制设备,可以容易地绘制这样的OCR页单表格,其能够通过OCR页单输入设备来获取有关OCR页单中的将输入区域的尺寸和位置的信息。
根据本发明,可以通过从对应的OCR页单表格获得的信息来确定OCR页单中的将输入区域的尺寸和位置。此外,根据本发明的OCR页单表格绘制设备,可以容易地绘制这样的OCR页单表格,其能够通过OCR页单输入设备获取有关OCR页单中的将输入区域的尺寸和位置的信息。
附图说明
图1是示出根据本发明实施例的OCR页单的示意图;
图2是详细示出图1所示的OCR页单中的OCR页单表格的模式的示意图;
图3是示出参考位置标记和将输入区域之间的位置关系的说明图;
图4是表示以单个属性信息模式包含在多个将输入区域中的属性信息的说明图;
图5是以单个属性信息模式表示的包含在将输入区域中的属性信息的图表;
图6是示出OCR页单中的另一OCR页单表格的模式的示意图;
图7是本发明实施例中的OCR页单输入设备的功能性框图;
图8是用于解释图7中的OCR页单输入设备的操作的流程图;
图9是根据本发明实施例的OCR页单绘制设备的功能性框图;
图10是示出有关将输入区域的定义信息被写入的文本文件的示意图;
图11是示出用户用来指示将在将输入区域中写入的内容的种类和标题的GUI示意图;
图12是示出用户用来指示将输入区域的尺寸和位置的GUI示意图。
图13是示出根据图10所示的定义信息绘制的将输入区域的示意图。
图14是示出根据图10所示的定义信息绘制的OCR页单表格的示意图。
图15是根据本发明另一实施例的OCR页单绘制设备的功能性框图;
图16是与区域信息重用部的功能对应的选择将输入区域的说明图;
图17是与区域信息重用部的功能对应的输入命令的菜单显示的示意图;
图18是与区域信息重用部的功能对应的将输入区域的拷贝操作的示意图;
图19是示出在库中的注册信息的显示示例的示意图;
图20是示出在库中包含未确定信息的注册信息的显示示例的示意图;以及
图21是示出用户用于指示未确定信息的描述的GUI示意图。
具体实施方式
下文中,将参照附图描述本发明的实施例。虽然在描述本发明的实施例中参照附图,但所述附图仅用于示例性目的,而不限制本发明。
图1是示出根据本发明实施例的将由OCR页单输入设备读取的OCR页单的示意图。
如图1所示,OCR页单1包括一个或多个将输入区域2(2-1,2-2,2-3)。“将输入区域”2表示写入某些字符(字符串)或图像的区域,并且表示将通过字符识别或图像提取而输入的区域。在每一将输入区域周围配置有参考位置标记3(3-1,3-2,3-3)和属性信息模式4(4-1,4-2,4-3),它们分别用作定义将输入区域的参考位置和至少表示将输入区域的尺寸信息的模式。换句话说,在OCR页单1中,为每一将输入区域提供参考位置标记3(3-1、3-2,3-3)和属性信息模式4(4-1、4-2,4-3)。在此,参考位置标记3用于确定将输入区域2和与参考位置标记3相邻的属性信息模式4的位置。属性信息模式4用于至少表示将输入区域2的尺寸信息。
图2是详细示出图1所示的OCR页单中的包括参考位置标记3和属性信息模式4的OCR页单表格模式的示意图。
最初需要将参考位置标记3检测为模式,以便确定OCR页单图像的旋转角和参考位置。参考位置标记3是通过与包含在OCR页单输入设备中的参考模式进行匹配来检测的。参考位置标记3包括当参考位置标记3旋转时旋转形成的模式不能与原始模式匹配的模式。从这点来看,参考位置标记3包括二维成形的模式,从而可以根据参考位置标记3的形状来确定OCR页单图像的参考方向。在该实施例中,参考位置标记3被划分为矩形(正方形)的九个部分(3×3),从而这些部分中的某些部分被染色,而其它部分未被染色,以便满足上述要求。
在OCR页单1中,定义了参考位置标记3和属性信息模式4之间的相对位置。例如,属性信息模式4的左下角P2位于参考位置标记3的轮廓3a的右下角1向右10毫米处。如上所述,由于参考位置标记3包括二维模式以便确定OCR页单的规则方向,因此参考位置标记3的轮廓3a的右下角P1表示当规则地配置参考位置标记3时参考位置标记3的轮廓的右下角。按照该方式,由于定义了参考位置标记3和属性信息模式4之间的相对位置,因此可以根据参考位置标记3的位置来确定属性信息模式4的位置。在此,参考位置标记3就并非总是受限于在该实施例中示出的参考位置标记,而是只要参考位置标记3的旋转形成的模式不同于其原始模式,就可以应用任意一个参考位置标记。此外,并非总是要求分离地准备参考位置标记3与属性信息模式4。例如,属性信息模式4可以充当参考位置标记3。
在该实施例中,属性信息模式4通过填充等间隔排列的比特记录区域4a中的一些区域来表示二进制比特数组。例如,可以通过填充的比特记录区域4a来表示比特值“1”,可以通过未填充的比特记录区域4a来表示比特值“0”。属性信息模式4可以包括条形码、二维码、字符或其组合,而不是二进制比特数组。
由属性信息模式4表示的将输入区域的属性信息,可以描述内容类型和将输入区域2的水平和垂直尺寸。此外,属性信息模式4可以包括除了有关将输入区域2的信息之外的信息。例如,属性信息模式4可以包括OCR页单表格的绘制日期和时间、该表格的创建者、与预期的将输入区域2有关的另一将输入区域的标识符或有关区域2的其它信息。
然后,将描述参考位置标记3和将输入区域2的位置之间的关系。
通过OCR页单1,定义了将输入区域2和参考位置标记3之间的相对位置。如图2所示,例如,将输入区域2的左上角P4被定义在从参考位置标记3的左下角P3分别向左移开5毫米和向下移开5毫米的位置处。由于参考位置标记3可以通过二维形状来确定OCR页单的规则方向,因此参考位置标记3的左下角P3表示当规则地配置参考位置标记3时的参考位置标记3的左下角。按照该方式,由于定义了将输入区域2和参考位置标记3之间的位置关系,因此可以根据参考位置标记3的规定角(例如左下角P3)来确定给定的角(例如左上角P4)。
代替确定将输入区域2和参考位置标记3之间的位置关系,可以将确定相对位置的信息作为属性信息添加到属性信息模式4,从而可以通过参考位置标记3的位置来确定将输入区域2的位置。
此外,代替使用参考位置标记3来确定将输入区域2的位置,如图3所示,例如,可以将OCR页单1的左上角P5和将输入区域2的左上角P6之间的二维长度添加到属性信息模式4,由此确定将输入区域2的位置。在图3所涉及的实施例中,将包含申请人名称的将输入区域2的左上角P6定义在OCR页单1的左上角P5的右边10毫米和下边30毫米处。可以按如上所述的相同方式来定义另一将输入区域2(2-2,2-3)。
然后,如图4所示,将描述通过单个属性信息模式4来表示包含在区域2(2-11,2-12,2-13、2-14,2-15)中的属性信息的方法。
图5是通过单个属性信息模式表示的包含在将输入区域2中的属性信息的图表。实际上,该表中的点线所指示的信息(区域编号,每一将输入区域的属性信息)是由属性信息模式4来表示的。按照该方式,通过属性信息模式4表示相对于参考位置标记3左下角P3的区域2左上角P11、P12、P13、P14、P15的水平和垂直偏移值(单位:毫米)、区域2(2-11,2-12、2-13,2-14,2-15)的分类内容,以及区域2(2-11,2-12、2-13,2-14,2-15)的水平和垂直尺寸。因此,在该实施例的OCR页单输入设备中,通过检测和识别属性信息模式4,可以同时确定区域2的位置,因此改进了处理速度。
此外,可以在属性信息模式4中包含定义另一将输入区域2的其它信息(标识号、坐标)。例如,当在分离的区域中填入以假名(日文字母)写成的发音和中文字符时,可以将有关一个区域的信息添加到有关另一区域的属性信息模式。在此情况下,当由OCR页单输入设备输入OCR页单时,一起参考中文字符和发音的字符识别结果以检查或纠正所述字符识别结果的有效性。此外,可以将每一金额、对应的小计以及合计填写到将输入区域2。在此情况下,可以将有关一个区域的信息添加到有关另一区域的属性信息模式,从而使得当由OCR页单输入设备输入OCR页单时可以检查金额的总计和小计。
然后,将描述OCR页单表格的修改的实施例。
图6是示出OCR页单中的另一OCR页单表格模式的示意图。在该实施例中,参考位置标记3和属性信息模式4被形成在与将输入区域的边界对应的格线(ruled line)6中。
参考位置标记3由垂直格线6和水平格线6的交点以及从所述交点到垂直格线6和水平格线6中的空隙6a、6b、6c的距离来表征。在该实施例中,空隙6a位于离开所述交点1毫米的垂直格线6的上侧。空隙6b位于离开所述交点1毫米的水平格线6的左侧。空隙6c位于离开所述交点2毫米的垂直格线6的下侧。
此外,属性信息模式4由水平格线6的空隙6d来表征。具体地说,属性信息模式4由二进制比特数组来表征,所述二进制比特数组是通过在对应比特记录区域61中打开水平格线6中的空隙6d而形成的。在此,比特记录区域61彼此等间隔排列。在此情况下,可以由具有空隙6d的比特记录区域61来表示比特数“0”,可以由不具有空隙6d的比特记录区域61来表示比特数“1”。
通过使用该实施例中的模式,由于OCR页单表格包括参考位置标记3和属性信息模式4,因此无需形成用于参考位置标记3和属性信息模式4的单独的图。
然后,将描述OCR页单1的OCR页单输入设备。
在该实施例中,OCR页单输入设备被实现为典型的计算机硬件,其包括CPU、存储设备(ROM、RAM)、输入设备(键盘、鼠标)、显示设备等,以及用于输入OCR页单的软件。或者,可以由经由通信介质而彼此连接的多个计算机来运行OCR页单输入程序。或者,可以将一部分或全部OCR页单输入实现为专用硬件。在该实施例中,OCR页单输入设备可以被配置为输入OCR页单图像,所述OCR页单图像是由连接到所述计算机上的图像扫描仪读取的,或是由外部扫描仪读取并经由传送介质或存储介质而传送的。
图7是在该实施例中的OCR页单输入设备的功能性框图。
如图7所示,在该实施例中,OCR页单输入设备10包括OCR页单图像输入部11、存储部12、将输入区域定义部13以及区域输入部14。以上各部由计算机和安装在计算机上的程序来实现。
OCR页单图像输入部11用于输入在与计算机连接的扫描仪中读取的或经由传送介质或存储介质获得的OCR页单图像数据,于是,OCR页单图像输入部11用于将OCR页单图像数据存储在存储部12(例如RAM)中。
将输入区域定义部13识别存储在存储部12中的OCR页单图像的模式,以便确定将输入区域2在OCR页单图像中的位置。具体地说,将输入区域定义部13包括参考位置标记检测部131、属性信息模式识别部132和区域指定部133。参考位置标记检测部131和属性信息模式识别部132与本发明中的模式识别部对应。参考位置标记检测部131被配置为检测OCR页单数据模式中的参考位置标记3。属性信息模式识别部132被配置为根据参考位置标记3和属性信息模式4之间的相对位置基于参考位置标记检测部131所检测的参考位置标记3的位置来确定属性信息模式4的位置,并识别属性信息模式4,以便获得有关将输入区域2的属性信息。由于参考位置标记3和将输入区域2之间的相对位置被二维地定义,因此区域指定部133可以根据参考位置标记检测部131所检测的参考位置标记3的位置和包含在属性信息模式识别部132所获得的有关将输入区域2的属性信息中的将输入区域2的尺寸信息,来确定将输入区域2的位置。
区域输入部14为在将输入区域定义部13处定义的将输入区域2的图像数据提供预定信息处理功能,例如图像提取和字符识别。
然后,将描述在该实施例中的OCR页单输入设备10的操作。图8是解释图7中的OCR页单输入设备10的操作的流程图。
首先,OCR页单图像输入部11输入如图1和图2所示表格设计的那样的OCR页单图像,并将所述OCR页单图像存储在存储部12中(步骤S501)。其后,将输入区域定义部13在参考位置标记检测部131处,从存储在存储部12中的OCR页单图像的模式检测参考位置标记3(步骤S502)。在此,参考位置标记3包括二维成形模式,从而使得标记3的旋转形成的模式不会与标记3的原始模式相同。从这点看来,将输入区域定义部13根据所检测的参考位置标记3的模式形状来二维地确定OCR页单图像的旋转角度,以便如果所述OCR页单图像旋转离开规则方向,则规则地纠正OCR页单图像的方向。如果已经为输入所述OCR页单图像执行了旋转角度补偿,则可以无条件地跳过OCR页单图像的旋转角度补偿。
属性信息模式识别部132通过存储在存储部12中的OCR页单图像的参考位置标记3的位置,来确定属性信息模式4的位置(S503)。如图2所示,属性信息模式识别部132通过位于标记3轮廓右下角1向左10毫米处的模式4左下角P2,来确定属性信息模式4。因此,通过识别属性信息模式4的左下角P2,可以确定模式4的位置。属性信息模式识别部132定位并识别属性信息模式4,以得到有关将输入区域的属性信息。所述属性信息被输出给将输入区域定义部13(步骤S504)。
于是,将输入区域定义部13根据参考位置标记检测部131所检测的参考位置标记3的位置和包含在属性信息模式识别部132所获得的有关将输入区域2的属性信息中的将输入区域2的尺寸信息,来确定将输入区域2的位置,于是,将如此确定的位置传送给区域输入部14。由于通过从参考位置标记3的左下角P3向左移开5毫米并向下移开5毫米的位置定义了将输入区域2的左上角P4,因此将输入区域定义部13首先确定将输入区域2的左上角P4的坐标。于是,将输入区域定义部13通过包含在属性信息模式识别部132所获得的区域2属性信息中的区域2尺寸信息来确定将输入区域2的位置。于是,将输入区域定义部13将这样获得的将输入区域2的坐标传送给区域输入部14。
区域输入部14为将输入区域定义部13处所定义的将输入区域2的图像数据执行预定信息输入,例如字符识别和图像提取。
将对于在OCR页单1中的另一将输入区域重复上述操作(步骤S507)。
如上所述,根据该实施例中的OCR页单输入设备10,可以基于OCR页单1中包含的信息来确定将输入区域2的位置。因此,即使在OCR页单1中配置了尺寸各不相同的多个将输入区域,OCR页单输入设备10也可以确定这些区域的位置,以便为区域的图像适当地执行预期的输入,例如字符识别。
然后,将描述该实施例中的OCR页单表格绘制设备。
在该实施例中,OCR页单表格绘制设备被实现为典型的计算机硬件资源,其包括CPU、存储设备(ROM、RAM)、输入设备(键盘、鼠标)、显示设备等,以及软件,例如用于绘制OCR页单表格的程序。或者,OCR页单表格绘制程序可以由经由计算机介质彼此连接的多台计算机来实现。或者,一部分或整个OCR页单表格绘制可以实现为专用硬件。在该实施例中,由OCR页单表格绘制设备绘制的OCR页单表格数据可以被连接到计算机上的记录设备存储在可拆卸存储介质中。或者,可以经由通信介质将OCR页单表格数据传送给另一计算机。
图9是在该实施例中的OCR页单绘制设备的功能性框图。
在该实施例中,OCR页单表格绘制设备20包括:区域指定部21,其用于得到由用户绘制的将输入区域的定义信息;区域生成部22,其用于基于区域指定部21所得到的区域的定义信息来生成将输入区域;模式生成部23,其用于基于将输入区域的定义信息来生成包含参考位置标记和属性信息模式的模式;表格数据生成部24,其用于生成OCR页单表格数据,所述表格数据是在区域生成部22处生成的将输入区域与在模式生成部23处生成的模式的组合;以及OCR页单数据输出部25,其用于将表格数据生成部24所生成的OCR页单表格数据转换为能够被计算机打印的数据(图像数据、矢量数据),所述计算机利用通用操作系统运行并输出因此而获得的转换数据。
然后,将描述该实施例中的OCR页单表格绘制设备20的操作。
首先,区域指定部21得到由用户绘制的将输入区域的定义信息。所述定义信息可以包括将要写入的内容、尺寸、位置、标题。所述定义信息可以通过用户形成的文本文件的形式来得到。因此而获得的文本文件可以在区域指定部21中被读取。
图10是示出有关将输入区域的定义信息的文本文件示意图。在所述文本文件中,在对应的行中写入将输入区域的定义信息集合31、32、33。在所述将输入区域的定义信息31中,“申请人”指定标题,“10,30”表示位置,“名称”表示将要写入的内容。如图3所示,所述位置被表示为从OCR页单1的左上角P5到将输入区域2的左上角P6的二维偏移值(单位:毫米,在X方向和Y方向)。所述尺寸表示沿着X方向和Y方向的长度(单位:毫米)。
可以通过GUI(图形用户接口)来输入所述将输入区域的定义信息。
图11是示出作为GUI的窗口(对话框)的示意图,所述窗口被用户用于指示在将输入区域中将写入的内容的种类和标题。窗口34包括:文本框35,在文本窗口35中输入所述将输入区域的标题;以及下拉框37,用于指示下拉菜单36中的内容。图12是示出作为GUI的表格编辑窗口38的示意图,所述窗口被用户用于指示将输入区域2的尺寸和位置。在表格编辑窗口38中,用户操作例如鼠标的输入设备,并移动鼠标光标,从而指示将输入区域2的尺寸和位置。区域指定部21得到用户使用所述GUI所指示的区域的标题、内容种类、位置和尺寸。
于是,区域生成部22根据由区域指定部21得到的区域定义信息来生成将输入区域,并在显示器上绘制所述生成的区域。图13是示出如何根据图10所列出的定义信息来生成三个区域2(2-1,2-2,2-3)的示意图。在此情况下,标题5(5-1,5-2,5-3)被同时添加到对应的区域2。
于是,在生成部分23基于所述将输入区域的定义信息来生成包含参考位置标记3和属性信息模式4的模式。由于定义了区域2相对于位置标记3的位置,因此参考位置标记3的位置根据将输入区域2的位置来确定。由于定义了参考位置标记3和属性信息模式4之间的相对位置,因此属性信息模式4的位置可以根据参考位置标记3的位置来确定。结果,如图14所示,生成预期的OCR页单表格,在所述OCR页单表格中,如图13定义的将输入区域2(2-1,2-2,2-3)、参考位置标记3(3-1,3-2,3-3)以及属性信息模式4(4-1,4-2,4-3)被组合为模式。
然后,描述OCR页单表格绘制设备的另一实施例。
图15是该实施例中的OCR页单绘制设备的功能性框图。
如图15所示,除了图9所示的OCR页单表格绘制设备20的各部之外,OCR页单绘制设备30还包括区域信息重用部26。区域信息重用部26被配置为通过重用已经生成的OCR页单表格数据来为区域指定部21提供将要新生成的将输入区域的定义信息。
然后,将描述区域信息重用部分26的具体功能。
区域信息重用部26读取已经生成的OCR页单表格数据,并将所述数据作为模板显示在显示设备屏幕上。如图16所示,用户可以通过鼠标操作来选择采用在所述显示设备屏幕上所显示的OCR页单表格的预期将输入区域2。当预期区域2被选择并且其后通过右手点击操作被点击时,如图17所示,显示可以应用于将输入区域2的有关输入命令的菜单41。当用户在菜单41中选择了期望的命令时,区域信息重用部26执行所选的输入命令。
当从菜单41中选择了命令“拷贝”时,区域信息重用部26把将输入区域2的拷贝作为新的区域42添加到用户所指示的区域。通过该操作,生成了标题、尺寸和内容与区域2相同的区域。当从菜单41中选择了“删除”命令时,区域信息重用部26删除所选的将输入区域。
当从菜单41中选择了命令“属性改变”时,区域信息重用部26显示包含有关所选将输入区域的属性信息(内容,尺寸)的一个或多个将要改变内容的对话框,以便使用由用户在该对话框中输入的一个或多个内容来改变所述区域的属性信息。
当从菜单41中选择了命令“添加到库中”时,区域信息重用部26在库中注册所选区域的内容、尺寸、标题。在此,“库”表示在可读条件下存储一些标题、尺寸和内容的数据库。例如,所述库被安装在外部存储器设备(例如与计算机连接的硬盘驱动器)中。
在区域信息重用部26中备有用于显示所述库的内容的命令。当用户执行所述命令时,区域信息重用部26显示与存储在所述库中的全部将输入区域有关的信息。图19是示出所述库中的注册信息的显示示例的示意图。用户可以选择与任意将输入区域有关的信息以进行重用。
所述库允许注册有关将输入区域的部分未确定的信息。在图20中,在所述库中注册了区域的尺寸和内容,但不注册所述区域的标题。如果用户选择了所述库中的、有关将输入区域的、包含未确定信息的信息,则区域信息重用部26显示对话框43,并让用户填写所述未确定信息,如图21所示。在图19和20中,所述区域的标题是未确定的,但所述区域的内容以及水平和垂直尺寸可以是未确定的。
在区域信息重用部26中,由用户指示将要从OCR页单表格数据注册到所述库中的一个或多个将输入区域的一个或多个信息。但是可以默认注册这些信息。
虽然参照以上示例详细描述了本发明,但本发明不限于以上公开,只要不脱离本发明的范围,就可以进行各种变化和修改。

Claims (10)

1.一种光学字符识别OCR页单输入设备,包括:
OCR页单图像输入部,其用于输入OCR页单的图像,所述OCR页单包含区域和模式,其中所述区域中配置有将要输入的信息,所述模式至少表示用于定义所述区域位置的参考位置和所述区域的尺寸信息;
存储部,其用于存储由所述OCR页单图像输入部输入的所述OCR页单的所述图像;
模式识别部,其用于根据存储在所述存储部中的所述OCR页单的所述图像的所述模式来检测所述参考位置,并识别所述区域的尺寸信息;
区域指定部,其用于通过所述模式识别部所检测的所述参考位置以及所述区域的所述尺寸信息来指定所述区域的位置;以及
区域输入部,其用于输入在所述区域指定部所定义的所述区域中的图像。
2.如权利要求1所述的OCR页单输入设备,其中,所述区域形成为矩形,并且所述区域指定部被配置为基于所述参考位置确定所述区域中的预定角的位置,以便通过所述角的位置和所述区域的所述尺寸信息来进行确定。
3.如权利要求1所述的OCR页单输入设备,其中,所述模式包括被配置为所述模式的旋转形状不同于在未旋转情况下的所述模式的原始形状的模式。
4.一种OCR页单表格绘制设备,包括:
区域指定部,其用于获取定义信息以定义配置有将要输入的信息的区域;
区域生成部,用于通过所述区域指定部所得到的所述定义信息来生成所述区域;
模式生成部,其用于基于所述区域指定部所得到的所述定义信息,生成至少表示与所述区域的位置有关的参考位置以及所述区域的尺寸信息的模式;以及
表格数据生成部,用于生成OCR页单表格数据,其中所述OCR页单表格数据是通过组合所述区域生成部所生成的所述区域和所述模式生成部所生成的所述模式来获得的。
5.如权利要求4所述的OCR页单表格绘制设备,其中,所述定义信息包括与所述区域的尺寸和位置有关的信息。
6.如权利要求4所述的OCR页单表格绘制设备,进一步包括:区域信息重用部,其用于作为库来存储包含所述区域的尺寸信息的属性信息,通过用户的指示加载存储为所述库的所述区域的属性信息,并重用所述属性信息以生成新的区域。
7.一种OCR页单,包括:
区域,其用于配置将要输入的信息;以及
模式,其表示用于指定所述区域的参考位置和所述区域的尺寸信息。
8.如权利要求7所述的OCR页单,其中,所述模式是以用于定义所述区域轮廓的格线来形成的。
9.一种用于输入OCR页单的程序,包括:
OCR页单图像输入部,其用于输入OCR页单的图像,所述OCR页单包含区域和模式,其中所述区域中配置有将要输入的信息,所述模式至少表示用于定义所述区域位置的参考位置和所述区域的尺寸信息;
存储部,其用于存储由所述OCR页单图像输入部输入的所述OCR页单的所述图像;
模式识别部,其用于根据存储在所述存储部中的所述OCR页单的所述图像的所述模式来检测所述参考位置,并识别所述区域的尺寸信息;
区域指定部,其用于通过所述模式识别部所检测的所述参考位置以及所述区域的所述尺寸信息来指定所述区域的位置;以及
区域输入部,其用于输入在所述区域指定部所定义的所述区域中的图像,
其中,计算机根据所述程序而运行。
10.一种用于绘制OCR页单表格的程序,包括:
区域指定部,其用于获取定义信息以定义将要输入的信息所填充的区域;
区域生成部,其用于根据所述区域指定部所得到的所述定义信息来生成所述区域;
模式生成部,其用于基于所述区域指定部所得到的所述定义信息,生成至少表示与所述区域的位置有关的参考位置以及所述区域的尺寸信息的模式;以及
表格数据生成部,其用于生成OCR页单表格数据,所述OCR页单表格数据是通过组合由所述区域生成部生成的所述区域和由所述模式生成部生成的所述模式来获得的,
其中,计算机根据所述程序而运行。
CNA2007100922752A 2006-04-03 2007-04-03 用于光学字符识别的页单输入设备、页单以及相关程序 Pending CN101051305A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP102063/2006 2006-04-03
JP2006102063A JP2007279828A (ja) 2006-04-03 2006-04-03 帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラム

Publications (1)

Publication Number Publication Date
CN101051305A true CN101051305A (zh) 2007-10-10

Family

ID=38557369

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007100922752A Pending CN101051305A (zh) 2006-04-03 2007-04-03 用于光学字符识别的页单输入设备、页单以及相关程序

Country Status (3)

Country Link
US (1) US7926732B2 (zh)
JP (1) JP2007279828A (zh)
CN (1) CN101051305A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102710978A (zh) * 2012-04-12 2012-10-03 深圳Tcl新技术有限公司 电视机的光标移动方法及装置
CN102710632A (zh) * 2012-05-29 2012-10-03 华为终端有限公司 注册信息处理方法及终端设备和交互式系统
CN102724578A (zh) * 2012-05-10 2012-10-10 深圳Tcl新技术有限公司 电视频道导航的方法及装置
CN103179369A (zh) * 2010-09-21 2013-06-26 株式会社锦宫事务 摄像对象物、图像处理程序及图像处理方法
CN107066433A (zh) * 2015-11-25 2017-08-18 柯尼卡美能达美国研究所有限公司 偏移图像中的旋转的表格
CN113191131A (zh) * 2021-05-10 2021-07-30 重庆中科云从科技有限公司 用于文本识别的表格模板建立方法、文本识别方法、系统

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010079711A (ja) * 2008-09-26 2010-04-08 Ricoh Co Ltd 多角形型コード、情報登録装置及び情報出力装置
FR2946773A1 (fr) * 2009-06-12 2010-12-17 Bertrand Labaye Procede et dispositif de reconnaissance d'informations au moyen d'une balise graphique.
JP5479083B2 (ja) * 2009-12-25 2014-04-23 キヤノン株式会社 画像処理装置及びその制御方法並びにプログラム
JP5561856B2 (ja) * 2010-05-24 2014-07-30 株式会社Pfu 帳票作成装置、帳票作成プログラム、および帳票作成方法
JP5556524B2 (ja) * 2010-09-13 2014-07-23 株式会社リコー 帳票処理装置、帳票処理方法、帳票処理プログラム、及びそのプログラムを記録した記録媒体
US20120200742A1 (en) 2010-09-21 2012-08-09 King Jim Co., Ltd. Image Processing System and Imaging Object Used For Same
JP2012194879A (ja) * 2011-03-17 2012-10-11 Pfu Ltd 情報処理装置、情報処理方法及びプログラム
WO2014006726A1 (ja) 2012-07-05 2014-01-09 株式会社 東芝 オブジェクトにデータを埋め込む装置及び方法、並びに埋め込まれたデータを抽出する装置及び方法
TW201413628A (zh) * 2012-09-28 2014-04-01 Kun-Li Zhou 謄本解析系統
JP6116508B2 (ja) * 2014-03-20 2017-04-19 富士通フロンテック株式会社 帳票読取プログラム、帳票読取方法、および帳票読取システム
JP6148193B2 (ja) * 2014-03-20 2017-06-14 株式会社Pfu 帳票定義作成装置、帳票定義作成方法、および、プログラム
JP6398346B2 (ja) * 2014-06-11 2018-10-03 富士通株式会社 表生成方法、プログラム及び装置、並びに帳票生成方法、プログラム及び装置
CN105373791B (zh) * 2015-11-12 2018-12-14 中国建设银行股份有限公司 信息处理方法及信息处理装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS647274A (en) * 1987-06-30 1989-01-11 Toshiba Corp Character reader
JPH06139419A (ja) 1992-10-23 1994-05-20 Matsushita Electric Ind Co Ltd 記号構造およびその処理装置
JPH06342481A (ja) 1993-05-31 1994-12-13 Nippon Arugo Rizumu Kk 帳票読み取りシステム
JPH08305791A (ja) 1995-04-28 1996-11-22 Fuji Xerox Co Ltd 画像認識装置及び制御シート
JP3712578B2 (ja) 2000-01-11 2005-11-02 エヌ・ティ・ティ・アドバンステクノロジ株式会社 文字認識制御方法および装置
JP2001229312A (ja) 2000-02-16 2001-08-24 Oki Electric Ind Co Ltd イメージ切り出し方法及びイメージ切り出し装置
US20020050982A1 (en) * 2000-04-05 2002-05-02 Petter Ericson Data form having a position-coding pattern detectable by an optical sensor
JP4603658B2 (ja) * 2000-07-07 2010-12-22 キヤノン株式会社 画像処理装置及び画像処理方法並びに記憶媒体
US7392472B2 (en) * 2002-04-25 2008-06-24 Microsoft Corporation Layout analysis
JP4594638B2 (ja) 2004-03-30 2010-12-08 富士通株式会社 媒体処理装置,媒体処理方法,媒体画像処理装置,媒体画像処理プログラムおよび帳票
US7607078B2 (en) * 2005-07-06 2009-10-20 International Business Machines Corporation Paper and electronic recognizable forms
JP4670658B2 (ja) * 2006-01-25 2011-04-13 富士ゼロックス株式会社 画像処理装置、画像処理方法及びプログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103179369A (zh) * 2010-09-21 2013-06-26 株式会社锦宫事务 摄像对象物、图像处理程序及图像处理方法
CN102710978A (zh) * 2012-04-12 2012-10-03 深圳Tcl新技术有限公司 电视机的光标移动方法及装置
CN102724578A (zh) * 2012-05-10 2012-10-10 深圳Tcl新技术有限公司 电视频道导航的方法及装置
CN102710632A (zh) * 2012-05-29 2012-10-03 华为终端有限公司 注册信息处理方法及终端设备和交互式系统
CN102710632B (zh) * 2012-05-29 2016-03-30 华为终端有限公司 注册信息处理方法及终端设备和交互式系统
CN107066433A (zh) * 2015-11-25 2017-08-18 柯尼卡美能达美国研究所有限公司 偏移图像中的旋转的表格
CN107066433B (zh) * 2015-11-25 2020-05-08 柯尼卡美能达美国研究所有限公司 偏移图像中的旋转的表格
CN113191131A (zh) * 2021-05-10 2021-07-30 重庆中科云从科技有限公司 用于文本识别的表格模板建立方法、文本识别方法、系统

Also Published As

Publication number Publication date
US20070228168A1 (en) 2007-10-04
US7926732B2 (en) 2011-04-19
JP2007279828A (ja) 2007-10-25

Similar Documents

Publication Publication Date Title
CN101051305A (zh) 用于光学字符识别的页单输入设备、页单以及相关程序
JP5058575B2 (ja) 画像処理装置及びその制御方法、プログラム
Clausner et al. Aletheia-an advanced document layout and text ground-truthing system for production environments
CN1218274C (zh) 在线手写文字模式识别编辑装置及方法
CN1866183A (zh) 2-d阵列中的译码和差错校正
CN1719865A (zh) 图像处理系统及图像处理方法
US8584932B2 (en) Information input/output apparatus, information processing apparatus, information input/output system, printing medium, and information input/output method
JP5581541B2 (ja) ドットパターン
CN1808377A (zh) 由非专属语言驱动的通用序列图生成器
CN1259709A (zh) 在文档中嵌入信息的方法和系统
CN104268814A (zh) 生成电子病历的方法和装置
CN1677343A (zh) 网格画布
CN1722071A (zh) 用于复合跟踪系统的方法和装置
CN1655178A (zh) 使用快速图像匹配的局部定位
CN1499443A (zh) 被动嵌入的交互编码
CN102855232A (zh) 一种表格分析编改加工方法
JP4708888B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
CN1877560A (zh) 文档处理系统、打印系统、文档文件、文档处理方法和计算机程序产品
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
JP5732866B2 (ja) 画像処理装置及び画像処理プログラム
JP5720182B2 (ja) 画像処理装置及び画像処理プログラム
CN1110018C (zh) 特征值抽取方法及设备
JP4179977B2 (ja) スタンプ処理装置、電子承認システム、プログラム、及び記録媒体
CN1234564A (zh) 字型产生法及电脑媒介
CN1510637A (zh) 一种打印绘制图形化文件的通用方法及动态链接库

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20071010