CN102708365A - 信息处理装置、信息处理方法以及程序 - Google Patents

信息处理装置、信息处理方法以及程序 Download PDF

Info

Publication number
CN102708365A
CN102708365A CN2012100592429A CN201210059242A CN102708365A CN 102708365 A CN102708365 A CN 102708365A CN 2012100592429 A CN2012100592429 A CN 2012100592429A CN 201210059242 A CN201210059242 A CN 201210059242A CN 102708365 A CN102708365 A CN 102708365A
Authority
CN
China
Prior art keywords
area
zone
information
positional information
entry name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012100592429A
Other languages
English (en)
Inventor
伊藤修光
泽田敬
藤塚诚弘
毛木达也
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Publication of CN102708365A publication Critical patent/CN102708365A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1448Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

能高效生成用于OCR软件等的定义信息的信息处理装置、方法及程序。本发明的信息处理装置包括:区域识别部,针对在图像数据内由规定的表现方式指定的区域,来识别第一区域和第二区域,第一区域是由第一区域指定表现方式指定的区域,第二区域是由与第一区域指定表现方式不同的第二区域指定表现方式指定的区域;位置信息取得部,在图像数据内取得由区域识别部识别出的第一区域的位置信息,作为用于指定成为字符识别对象的区域的位置信息;项目名取得部,取得字符信息来作为项目名,字符信息是通过对由区域识别部识别出的第二区域内存在的字符进行识别而得的信息,项目名是针对由位置信息取得部取得的位置信息所指定的成为字符识别对象的区域的项目名。

Description

信息处理装置、信息处理方法以及程序
技术领域
本发明涉及信息处理装置、信息处理方法以及程序的技术。
背景技术
近年来,根据业务改善以及成本消减的观点,在各种业务中正在开展文牍精简化(paperless,无纸化办公)。但在一个方面看来,仍然使用纸的情况还多数存在,例如在交易文件等方面仍然使用纸。以往,为了对这样使用纸的业务的效率进行改善,而使用了OCR(Optical Character Recognition:光学字符识别)软件。
为了在这样的OCR软件中指定读取区域等,需要该读取区域等的定义信息。在以下列举的专利文献1以及专利文献2中,公开了与该定义信息相关的技术。
在专利文献1中公开了这样的技术:按颜色来扫描图像数据,由此读取与颜色相对应的字符种类。另外,在专利文献2中公开了这样的技术:对在由规定色框围起的区域内记载的属性信息进行识别,生成读取项目的属性信息定义体。
现有技术文献:
专利文献:
专利文献1:JP实开平05-008670号公报,
专利文献2:JP特开平05-081472号公报。
然而,在以往的技术中,用户在制作OCR软件的定义信息时,针对从图像数据中取得的读取区域的位置信息,需要通过手动输入来设定用于表示该读取区域的记载内容的项目名。
发明内容
本发明正是考虑这样的问题点而做成的,目的在于,提供一种能够高效生成用于OCR软件等的定义信息的技术。本发明为了解决上述问题而采用以下的结构。
即,本发明的信息处理装置,其特征在于,包括:
区域识别部,其用于针对在图像数据内由规定的表现方式指定的区域,来识别第一区域和第二区域,所述第一区域是由第一区域指定表现方式指定的区域,所述第二区域是由与所述第一区域指定表现方式不同的第二区域指定表现方式指定的区域,
位置信息取得部,其用于在所述图像数据内取得由所述区域识别部识别出的所述第一区域的位置信息,来作为用于指定成为字符识别对象的区域的位置信息,
项目名取得部,其用于取得字符信息来作为项目名,所述字符信息是通过对由所述区域识别部识别出的所述第二区域内存在的字符进行识别而得的信息,所述项目名是针对由所述位置信息取得部取得的所述位置信息所指定的所述成为字符识别对象的区域的项目名。
在此,区域指定表现方式是指,用于指定区域的表现方式,例如框、填充图、阴影等。
通过上述结构,识别出图像数据内中的第一区域与第二区域。并且,从第一区域取得用于指定成为字符识别对象的区域的位置信息。另外,从第二区域取得针对该成为字符识别对象的区域的项目名。因此,用户无需通过手动输入来设定与所取得的位置信息相关的针对成为字符识别对象的区域的项目名。因此,通过上述结构,能够高效地生成(制作)用于OCR软件等的定义信息。
另外,作为本发明的其它方式,本发明的信息处理装置还具有用于使所述第一区域与所述第二区域相对应关联的对应关联部,
所述项目名取得部,在被所述对应关联部对应关联的所述第一区域和第二区域中,可以从被对应关联的所述第二区域取得所述字符信息来作为针对特定区域的项目名,所述特定区域是由特定位置信息指定的所述成为字符识别对象的区域,所述特定位置信息是从被对应关联的所述第一区域取得的位置信息。
通过上述结构,使得用于指定成为字符识别对象的区域的位置信息与针对该成为字符识别对象的区域的项目名相对应关联。因此,用户无需再进行使所取得的位置信息与项目名相对应关联的处理。因此,通过上述结构,能够高效地生成(制作)用于OCR软件等的定义信息。
另外,作为本发明的其它实施方式,所述对应关联部可以使所述第一区域与在图像数据上距离所述第一区域最近的所述第二区域相对应关联。
另外,作为本发明的其它实施方式,所述对应关联部,可以判断所述第一区域的位置与所述第二区域的位置的位置关系是否满足规定条件,使判断为满足规定条件的所述第一区域与所述第二区域相对应关联。
另外,作为本发明的其它实施方式,所述对应关联部,可以在图像数据内纵向排列的多个第一区域与纵向排列的多个第二区域中,判断为横向排列的一个第一区域与一个第二区域满足所述规定条件。
另外,作为本发明的其它实施方式,所述对应关联部,可以在图像数据内横向排列的多个第一区域与横向排列的多个第二区域中,判断为纵向排列的一个第一区域与一个第二区域满足所述规定条件。
另外,作为本发明的其它实施方式,所述对应关联部,可以识别存在于图像数据内的表示所述第一区域与所述第二区域的对应关系的规定的对应关系指示表现方式,基于识别出的该对应关系,使所述第一区域与所述第二区域相对应关联。
另外,作为本发明的其它实施方式,本发明的信息处理装置还可以具有用于生成项目定义信息的项目定义信息生成部,所述项目定义信息包括:用于对由所述位置信息取得部取得的所述成为字符识别对象的区域进行指定的所述位置信息,由所述项目名取得部取得的针对由所述位置信息指定的所述成为字符识别对象的区域的所述项目名。
此外,作为本发明的其它实施方式,可以是用于实现以上各结构的信息处理方法,也可以是程序,也可以是存储了这样的程序的、计算机能够读取的存储介质。另外,作为本发明的其它实施方式,也可以是由用于实现以上各结构的多个装置构成的信息处理系统,所述多个装置能够相互通信。
通过本发明,提供了一种能够高效地生成(制作)用于OCR软件等的定义信息的技术。
附图说明
图1例示出实施方式的信息处理装置的处理。
图2例示出实施方式的信息处理装置的结构。
图3是表示实施方式的信息处理装置的处理顺序一例的流程图。
图4表示通过实施方式的信息处理装置处理的图像数据的一例。
图5表示第一区域与第二区域的扫描顺序的一例。
图6表示第一区域与第二区域的对应关联的一例。
图7表示第一区域与第二区域的对应关联的一例。
图8表示第一区域与第二区域的对应关联的一例。
图9表示第一区域与第二区域的对应关联的一例。
图10表示从图4所示的图像数据中取得的项目定义信息的一例。
附图标记的说明
1信息处理装置,
2扫描仪,
11存储部,
12控制部,
13总线,
14输入输出部,
31区域识别部,
32位置信息取得部,
33项目名取得部,
34对应关联部,
35项目定义信息生成部
50、50a、50b、50c第一区域,
60、60a、60b、60c第二区域,
70对应关系指示表现方式(箭头),
71对应关系指示表现方式(线段),
72a、72b对应关系指示表现方式(标记)。
具体实施方式
下面,说明本发明的一方面的信息处理装置、信息处理方法以及程序等的实施方式(下面也称为“本实施方式”)。但是,本实施方式是例示,本发明并非限于本实施方式的结构。
此外,虽然通过自然语言(中文等)来说明本实施方式中出现的数据,但在具体实施中,能够用计算机可识别的模拟语言、指令、参数、机器语言等来指定。
§1信息处理装置
利用图1以及图2来说明本实施方式的信息处理装置。
<概要>
图1例示出本实施方式的信息处理装置所执行的处理。本实施方式的信息处理装置对第一区域50和第二区域60进行识别,该第一区域50和第二区域60是在图像数据内根据规定表现方式而指定的区域。
第一区域50由第一区域指定表现方式来指定。另一方面,第二区域60由第二区域指定表现方式来指定。即,第一区域50和第二区域60的区域指定表现方式不同。区域指定表现方式是用于指定区域的表现方式,例如,框、填充图(filling)、各种阴影等。在图1所示的例子中,第一区域指定表现方式仅为框。即,在第一区域指定表现方式中,在框内没有填充图以及各种阴影等。另一方面,在图1所示的例子中,第二区域指定表现方式是填充图。
第一区域50是在图像数据内作为字符识别对象而被指定的区域。另外,第二区域60是特定的项目名所存在的区域,所述特定的项目名是针对被指定为字符识别对象的区域的项目名。
例如,用户在表单或卡片等的纸面上通过标记、封印或印刷等,来描画框、填充图或各种阴影等,由此指定第一区域50和第二区域60。信息处理装置利用扫描仪等来读取这样指定了第一区域50和第二区域60的纸,由此取得指定了第一区域50和第二区域60的图像数据。
本实施方式的信息处理装置对由不同区域指定表现方式所指定的第一区域50和第二区域60进行识别。并且,本实施方式的信息处理装置从第一区域50中取得用于指定成为字符识别对象的区域的位置信息。另外,本实施方式的信息处理装置从第二区域60中取得针对成为该字符识别对象的区域的项目名(与成为该字符识别对象的区域相关的项目名)。
这样一来,本实施方式的信息处理装置,从在图像数据上被指定的第一区域以及第二区域中,针对成为字符识别对象的区域,分别取得位置信息和项目名,由此,用户能够高效制作定义信息。
此外,用户也可以利用描画软件等来编辑图像数据,由此在该图像数据上指定第一区域50和第二区域60。
<结构例>
图2表示本实施方式的信息处理装置1的结构例。信息处理装置1如图2所示,作为其硬件结构,具有与总线13连接的存储部11、控制部12、输入输出部14等。
存储部11用于存储由控制部12执行的处理中所用的各种数据和程序(未图示)。存储部11例如由硬盘实现。存储部11也可以由USB(UniversalSerial Bus:通用串行总线)存储器等的存储介质实现。
此外,存储部11所存储的上述各种数据和程序也可以从CD(CompactDisc:光盘)或DVD(Digital Versatile Disc:数字化通用磁盘)等的存储介质中取得。另外,存储部11也可以称为辅助存储装置。
控制部12具有:微处理器或CPU(Central Processing Unit:中央处理器)等的一个或多个处理器;该处理器的处理所使用的周边电路(ROM(ReadOnly Memory:只读存储器)、RAM(Random Access Memory:随机存取存储器)、接口电路等)。控制部12通过执行存储在存储部11中的各种数据和程序,来实现本实施方式中的信息处理装置1的处理。从配置在由控制部12内的处理器访问的地址空间内的意义上来说,ROM、RAM等也可以称为主存储装置。
输入输出部14是一个或多个接口,用于与信息处理装置1外部的装置之间收发数据。输入输出部14例如是:用于连接LAN(Local Area Network:局域网)电缆的接口,用于与输入装置以及输出装置等用户接口相连接的接口,或USB(Universal Serial Bus:通用串行总线)等的接口。
如图2所示,输入输出部14例如可以与扫描仪2相连接。另外,输入输出部14也可以与未图示的用户接口(触摸面板、辅助键盘、键盘、鼠标、显示器等的输入输出装置)相连接。进而,输入输出部14也可以与CD驱动器、DVD驱动器等可装拆的存储介质的输入输出装置相连接,或者与存储卡等的非易失性的便携式存储介质等的输入输出装置相连接。输入输出部14也可以具有进行网络连接的接口(通信部)功能。
本实施方式的信息处理装置,分别取得针对成为字符识别对象的区域的位置信息和项目名,由此使用户高效地制作定义信息。该处理实现为控制部12的处理。
如图2所示,控制部12为了实现上述处理而包括:区域识别部31、位置信息取得部32、项目名取得部33、对应关联部34以及项目定义信息生成部35。例如,通过在作为控制部12的周边电路的RAM等中将存储在存储部11中的程序等展开,由控制部12的处理器来执行这些程序等,由此实现区域识别部31、位置信息取得部32、项目名取得部33、对应关联部34以及项目定义信息生成部35。
区域识别部31,针对在图像数据内由规定表现方式指定的区域,来识别第一区域和第二区域,所述第一区域是由第一区域指定表现方式所指定的区域,所述第二区域是由与所述第一区域指定表现方式不同的第二区域指定表现方式所指定的区域。区域识别部31例如区分识别出图1所示的第一区域50和第二区域60。
位置信息取得部32在图像数据内取得由区域识别部识别出的第一区域的位置信息,将其作为用于指定成为字符识别对象的区域的位置信息。如图1所示,位置信息取得部32例如取得图像数据内的第一区域50的位置信息,将其作为用于指定成为字符识别对象的区域的位置信息。
此外,位置信息取得部32也可以为了后述的对应关联部34的处理而可以取得第二区域的位置信息。位置信息取得部32例如取得图1所示的图像数据内的第二区域60的位置信息。
项目名取得部33取得字符信息来作为项目名,所述字符信息是通过对由区域识别部31识别出的第二区域内存在的字符进行识别而得到的信息,所述项目名是针对成为字符识别对象的区域的项目名,所述字符识别对象是根据由位置信息取得部32取得的位置信息而指定的。如图1所示,例如,项目名取得部33取得通过对第二区域内存在的字符进行字符识别而得的字符信息,来作为针对第一区域50的项目名。
此外,如后述,对应关联部34对第一区域和第二区域进行对应关联。在本实施方式中,对应关联部34对第一区域和第二区域进行对应关联,从被关联的第一区域取得位置信息,根据取得的位置信息指定作为字符识别对象的区域,项目名取得部33从关联的该第二区域取得字符信息来作为针对该区域的项目名。
对应关联部34使第一区域和第二区域对应关联。
例如,对应关联部34使第一区域与在图像数据上距离该第一区域最近的第二区域相对应关联。
另外,例如,对应关联部34判断第一区域的位置与第二区域的位置之间的位置关系是否满足规定条件,将判断为满足规定条件的第一区域与第二区域相对应关联。规定条件是针对对应关系中第一区域与第二区域的位置关系赋予的条件。详细后述。
另外,例如,对应关联部34识别出存在于图像数据内的规定的对应关系指示表现方式,该规定的对应关系指示表现方式表示第一区域与第二区域的对应关联。并且,对应关联部34基于该识别出的对应关系,来使第一区域与第二区域对应关联。
对应关系指示表现方式表示第一区域与第二区域的对应关联。例如,对应关系指示表现方式是指:设在第一区域与第二区域之间的箭头,连接第一区域与第二区域的线段,在第一区域与第二区域标注的相同标记或印记。对应关系指示表现方式只要能够表示第一区域与第二区域的对应关系即可,可以使用任何方式实现。
项目定义信息生成部35生成包括位置信息和项目名的项目定义信息,该位置信息是位置信息取得部32取得的用于指定成为字符识别对象的区域的信息,该项目名是,由项目名取得部33取得的、针对由该位置信息指定的成为字符识别对象的区域的项目名。所生成的项目定义信息,是用于指定成为字符识别对象的区域的位置以及项目名的信息。该项目定义信息例如通过OCR软件等使用。
§2动作例
接着,利用图3来说明本实施方式的信息处理装置1的动作例。图3表示本实施方式的信息处理装置1的处理顺序的一例。此外,在图3中,将步骤简称为“S”。
<开始>
首先,例如响应于用户的操作,存储在存储部11中的程序被展开在控制部12的RAM等中。然后,由控制部12的处理器执行展开在控制部12的RAM等中的该程序。这样一来,信息处理装置1开始处理。
<步骤101>
接着,控制部12取得用于该处理的图像数据(步骤101)。所取得的图像数据例如可以是通过图2所示的扫描仪2获取的数据。另外,所取得的图像数据也可以是存储在存储部11中的数据。这样的图像数据也可以是通过网络取得的。另外,图像数据也可以是从存储卡等的非易失性的便携式的存储介质等中取得的。
图4表示此时取得的图像数据的一例。图像数据例如是通过对表单以及卡片等纸介质进行电子化而得到的数据。如图4所示,第一区域(50a、50b)以及第二区域(60a、60b),被指定在记载于表单以及卡片等中的栏以及字符等之上。将第一区域(50a、50b)以及第二区域(60a、60b)表现为能够与记载于表单以及卡片等中的栏以及字符等相区别。
例如,为了使第一区域(50a、50b)以及第二区域(60a、60b)能够明确地与记载于表单以及卡片等中的栏以及字符等相区别,可以用与记载于表单以及卡片等中的栏以及字符等的颜色不同的颜色来表现第一区域(50a、50b)以及第二区域(60a、60b)。如果这样表现,通过对该不同颜色进行检测读取的OCR引擎,能够从图像数据内描画图像数据中,只提取第一区域(50a、50b)以及第二区域(60a、60b)的区域指定表现方式。例如,如果记载在表单以及卡片等中栏以及字符等为黑色,则该OCR引擎检测读取该黑色以外的颜色,由此提取第一区域(50a、50b)以及第二区域(60a、60b)。
但是,并非一定要用与记载于表单以及卡片等中的栏以及字符等的颜色不同的颜色来表现第一区域(50a、50b)以及第二区域(60a、60b)。例如,只要通过能够与记载于表单以及卡片等中的栏等的区域指定表现方式相区别的区域指定表现方式来表现出将第一区域(50a、50b)以及第二区域(60a、60b)即可,也可以使用与记载于表单以及卡片等中的栏以及字符等的颜色相同的颜色来表现。
<步骤102>
接着,如图3所示,控制部12对在步骤101中取得的图像数据内的第一区域进行识别(步骤102)。
在图4所示的图像数据中、使用框来作为第一区域指定表现方式。换言之,在图4所示的图像数据中,第一区域(50a、50b)是由框表现出来的。控制部12对由该框表现的第一区域(50a、50b)进行识别。
例如,控制部12从在图像数据内描画的图像数据中提取第一区域以及第二区域的区域指定表现方式。由于第一区域(50a、50b)以及第二区域(60a、60b)表现为能够与记载于表单以及卡片等中的栏以及字符等相区别,因此该提取能够执行。接着,控制部12从所提取的第一区域以及第二区域的区域指定表现方式中确定第一区域指定表现方式的区域。例如通过图案匹配等来实现用于该确定的处理。并且,控制部12将所确定的区域识别为第一区域。这样一来,控制部12在图4所示的图像数据内识别出由框表现的第一区域(50a、50b)。
<步骤103>
接着,控制部12取得在步骤102中识别出的第一区域的图像数据内的位置信息(步骤103)。
位置信息只要是表示图像数据内的位置的信息即可,可以是任意信息。在本实施方式中,用xy坐标系来表现位置信息,该xy坐标系以图像数据的左上端为原点,以横轴为x轴,以纵轴为y轴。但是,位置信息的表现方式并不限于xy坐标系。例如,位置信息的表现方式也可以是极坐标系,该极坐标系以图像数据的某一点(例如,图像数据的中心)为原点。
另外,本实施方式的第一区域的位置信息包括第一区域的左上端的位置(坐标)、横向长度以及纵向长度。该位置信息如后述的图9中例示。控制部12确定在步骤102中识别出的第一区域的左上端的位置坐标。另外,控制部12确定所识别出的第一区域的横向长度与纵向长度。由此,控制部12取得所识别出的第一区域的图像数据内的位置信息。
<步骤104>
接着,控制部12对在步骤101中取得的图像数据内的第二区域进行识别(步骤104)。
在图4所示的图像数据中,用填充图作为第二区域指定表现方式。换言之,在图4所示的图像数据中、第二区域(60a、60b)由填充图表现出来。控制部12对由该填充图表现的第二区域(60a、60b)进行识别。此外,利用与在步骤102中的第一区域的识别方法相同的方法来识别该第二区域。
<步骤105>
接着,控制部12取得在步骤104中识别出的第二区域的图像数据内的位置信息(步骤105)。此外,该步骤105也可以省略。本实施方式中,由于在后述的步骤107中使用对应关联的第二区域的位置信息,因此取得该第二区域的位置信息。此外,第二区域的位置信息的取得方法与步骤103中的第一区域的位置信息的取得方法相同。
<步骤106>
接着,控制部12通过对在步骤104中识别出的第二区域内存在的字符进行字符识别,由此取得该第二区域内存在的字符的字符信息(步骤106)。
字符识别可以通过任意方法执行。在本步骤106中,控制部12通过对记载在第二区域内的字符进行字符识别,由此取得记载在该第二区域内的字符的字符信息。
此外,所取得的字符信息,作为针对成为字符识别对象的第一区域的项目名。第一区域与第二区域分别只存在一个时,只考虑一种第一区域与第二区域的组合,因此无需确定第一区域与第二区域的对应关系。即,在本步骤106中从第二区域取得的字符信息,无需确定是针对哪个第一区域的项目名。在本步骤106中取得了字符信息的时刻,将该字符信息确定为针对步骤102以及103所涉及的第一区域的项目名。
另一方面,在第一区域与第二区域分别存在多个时,需要确定从第二区域取得的字符信息是针对哪个第一区域的项目名。在本实施方式中,在后述的步骤107中,通过使第一区域与第二区域相对应关联,由此确定从第二区域取得的字符信息是针对哪个第一区域的项目名。
然而,这样的对应关联并非都是必要的。例如,如图5所示,控制部12从图像数据的上部开始按顺序进行扫描,从而进行步骤102涉及的第一区域的识别以及步骤104涉及的第二区域的识别。并且,控制部12每发现一个第一区域和一个第二区域,就会重复步骤102~106的处理。此时,所处理的第一区域与第二区域一直分别为一个,因此不需要上述对应关联的处理。
此外,例如,如果这样执行处理,则在图5所示的例子中,从第二区域60a取得的字符信息被确定为针对第一区域50a的项目名。另外,从第二区域60b取得的字符信息被确定为针对第一区域50b的项目名。从第二区域60c取得的字符信息被确定为针对第一区域50c的项目名。此外,在该处理中,根据发现第一区域与第二区域的顺序,交替执行步骤102~103和步骤104~106。
<步骤107>
接着,控制部12确定在步骤102中识别出的第一区域与在步骤104中识别出的第二区域之间的对应关系,因此将该第一区域与该第二区域相对应关联。例如在对应关联的第一区域与第二区域分别为一个时,也可以省略本步骤107。在本步骤107中,如上述,确定从第二区域取得的字符信息是针对哪个第一区域的项目名。
利用图6~9来说明控制部12进行的对应关联的处理的例子。
例如,控制部12将第一区域与图像数据上距离该第一区域最近的第二区域相对应关联。图6表示该处理的例子。在本实施方式中,在步骤103以及105中,取得第一区域与第二区域的位置信息。在该位置信息中,包括各区域的左上端的位置坐标。控制部12利用该位置坐标,分别计算第一区域与第二区域的距离。即,控制部12分别计算第一区域的左上端的位置坐标与第二区域的左上端的位置坐标之间的距离。并且,控制部12将该距离最短的第一区域与第二区域相对应关联。
在图6所示的例子中,控制部12将第一区域50a与图像数据上距离该第一区域50a最近的第二区域60a相对应关联。另外,将第一区域50b与图像数据上距离该第一区域50b最近的第二区域60b相对应关联。
此外,也可以交换该处理中的第一区域与第二区域。即,控制部12也可以将第二区域与图像数据上距离该第二区域最近的第一区域相对应关联。
另外,例如,控制部12也可以判断第一区域的位置与第二区域的位置之间的位置关系是否满足规定条件,从而将判断为满足规定条件的第一区域与第二区域相对应关联。
规定条件是在对应关系中对第一区域与第二区域的位置关系附加的条件。
例如,规定条件涉及对应关系中第一区域与第二区域的距离。控制部12,在图像数据内的第一区域与第二区域中,判断为处于阈值以内距离的第一区域与第二区域满足规定条件,所述阈值可以由用户设定以及变更。
另外,例如,规定条件涉及对应关系中第一区域与第二区域的相对位置关系。控制部12,在图像数据内的第一区域与第二区域中,判断为处于某特定相对位置关系的第一区域与第二区域满足规定条件。在此,在本实施方式中,相对位置关系表现为,以图像数据的左上端为原点,指向第一区域左上端的矢量与指向第二区域左上端的矢量之间的差分矢量。另外,某特定相对位置关系表现为,应该满足该差分矢量的条件矢量。并且,例如,在该差分矢量与条件矢量的内积处于特定范围内的情况下,判断为该差分矢量的第一区域与第二区域满足某特定相对位置关系,该特定范围是能够由用户设定以及变更值的范围。
另外,例如,规定条件涉及对应关系中的第一区域与第二区域的横向排列方式。控制部12,在图像数据内纵向排列的第一区域与纵向排列的第二区域中,判断为横向排列的第一区域与第二区域满足规定条件。图7例示出满足该条件的第一区域与第二区域。此外,图7中的坐标(x、y)中的x表示横轴(x轴)的坐标。另外,y表示纵轴(y轴)的坐标。
在此,在本实施方式中,纵向排列的第一区域是指,与第一区域的左上端的横轴(x轴)相关的位置坐标(x坐标)存在于阈值以内误差范围内的第一区域,所述阈值能够由用户设定以及变更。例如,图7所示的第一区域50a的x坐标为70。第一区域50b的x坐标为68。第一区域50c的x坐标为70。此时,例如如果阈值为5,则第一区域50a、第一区域50b以及第一区域50c分别是纵向排列的第一区域。
针对第二区域也是同样的。在本实施方式中,纵向排列的第二区域是指,与第二区域的左上端的横轴(x轴)相关的位置坐标(x坐标)存在于阈值以内误差范围内的第二区域,所述阈值能够由用户设定以及变更。例如,图7所示的第二区域60a的x坐标为20。第二区域60b的x坐标为21。第二区域60c的x坐标为19。此时,例如如果阈值为5,则第二区域60a、第二区域60b以及第二区域60c分别为纵向排列的第二区域。
控制部12取得这样纵向排列的第一区域与纵向排列的第二区域。并且,控制部12,在纵向排列的第一区域以及第二区域中,判断为横向排列的第一区域与第二区域满足上述规定条件。
在此,在本实施方式中,第一区域与第二区域横向排列是指如下状态:第一区域左上端的纵轴(y轴)所相关的位置坐标(y坐标)与第二区域左上端的纵轴所相关的位置坐标之间的差,处于能够由用户设定以及变更的阈值以内。
例如,图7所示的第一区域50a的y坐标为59。第一区域50b的y坐标为98。第一区域50c的y坐标为140。与此相对,图7所示的第二区域60a的y坐标为60。第二区域60b的y坐标为100。第二区域60c的y坐标为141。
此时,例如如果阈值为5,则控制部12判断为第一区域50a与第二区域60a为横向排列,满足规定条件。另外,控制部12判断为第一区域50b与第二区域60b为横向排列,满足规定条件。进而,控制部12判断为第一区域50c与第二区域60c为横向排列,满足规定条件。即,控制部12使第一区域50a与第二区域60a相对应关联。另外,控制部12使第一区域50b与第二区域60b相对应关联。进而,控制部12使第一区域50c与第二区域60c相对应关联。
另外,例如,规定条件涉及对应关系中的第一区域与第二区域的纵向排列方式。控制部12,在图像数据内横向排列的第一区域与横向排列的第二区域中,判断为纵向排列的第一区域与第二区域满足规定条件。图8例示出满足该条件的第一区域与第二区域。图8中的坐标(x、y)与图7中的坐标相同。
在此,判断第一区域是否为横向排列的方法,以及判断第二区域是否为横向排列的方法,与判断上述第一区域与第二区域是否为横向排列的方法相同。另外,判断第一区域与第二区域是否为纵向排列的方法,与判断上述第一区域是否为纵向排列的方法以及判断上述第二区域是否为纵向排列的方法相同。
例如,如果阈值为5,则控制部12判断图8中的第一区域50a与第二区域60a为纵向排列,满足规定条件。另外,控制部12判断为第一区域50b与第二区域60b为纵向排列,满足规定条件。进而,控制部12判断为第一区域50c与第二区域60c为纵向排列,满足规定条件。即,控制部12使第一区域50a与第二区域60a相对应关联。另外,控制部12使第一区域50b与第二区域60b相对应关联。进而,控制部12使第一区域50c与第二区域60c相对应关联。
另外,例如,控制部12识别出存在于图像数据内的规定的对应关系指示表现方式,该规定的对应关系指示表现方式表示第一区域与第二区域的对应关系。并且,控制部12基于该识别出的对应关系指示表现方式所示的对应关系,使第一区域与第二区域相对应关联。
对应关系指示表现方式,表示第一区域与第二区域的对应关联。图9例示出该对应关系指示表现方式。
例如,对应关系指示表现方式是图9所示的箭头70。例如,控制部12识别出存在于图像数据内的箭头70。然后,控制部12根据识别出的箭头70,来取得与该箭头70所指示的方向相关的矢量信息。进而,控制部12利用该取得的矢量信息,来确定该箭头70所指示的第一区域50a和第二区域60a。其结果,控制部12使所确定的第一区域50a和第二区域60a相对应关联。
另外,例如,对应关系指示表现方式是图9所示的线段71。例如,控制部12识别出存在于图像数据内的线段71。然后,控制部12确定线段71所连接的第一区域50b和第二区域60b。其结果,控制部12使所确定的第一区域50b和第二区域60b相对应关联。
另外,例如,对应关系指示表现方式是图9所示的标记72a和标记72b。例如,控制部12识别出存在于图像数据内的作为同一标记的标记72a和标记72b。然后,控制部12确定标注了作为同一标记的标记72a和标记72b的第一区域50c和第二区域60c。其结果,控制部12使所确定的第一区域50c和第二区域60c相对应关联。
控制部12,通过至此为止例示的对应关联的方法,使在步骤102中识别出的第一区域与在步骤104中识别出的第二区域相对应关联。此外,控制部12也可以使用至此为止例示的对应关联的方法的多种组合,来使第一区域与第二区域相对应关联。
<步骤108>
接着,控制部12生成项目定义信息,该项目定义信息包括在步骤103中取得的位置信息和在步骤106中取得的项目名。图10例示出针对图4所示的图像数据执行上述步骤102~107的处理的结果,即,在该步骤108中生成的项目定义信息。
如图10所示,第一区域50a与第二区域60a相对应关联。另外,第一区域50b与第二区域60b相对应关联。
并且,第一区域50a的x坐标(左侧)、y坐标(顶端)、横轴的长度(宽度)以及纵轴的长度(高度)分别为120、80、320以及30。第一区域50b的x坐标、y坐标、横轴的长度以及纵轴的长度分别为120、120、320以及30。另外,第二区域60a的x坐标、y坐标、横轴的长度以及纵轴的长度分别为20、80、90以及30。第二区域60b的x坐标、y坐标、横轴的长度以及纵轴的长度分别为20、120、90以及30。
图10例示出从这样的第一区域50a与第二区域60a以及第一区域50b与第二区域60b取得的项目定义信息。此外,图10例示的项目定义信息中的“项目名”字段(field)存储有从第二区域取得的字符信息。“左侧”字段存储有第一区域的左上端的x坐标。“顶端”字段存储有第一区域的左上端的y坐标。“宽度”字段存储有第一区域的横轴的长度。“高度”字段存储有第一区域的纵轴的长度。
在此,项目定义信息的行数据(记录:record)表示对应关系中的第一区域与第二区域的信息。即,项目定义信息的记录包括成为字符识别对象的区域的位置信息与针对该区域的项目名。
此外,OCR软件等可以从项目定义信息的记录中取得成为字符识别对象的区域的位置信息以及针对该区域的项目名。即,可以在OCR软件等中,为了确定成为字符识别对象的区域的信息而使用项目定义信息。
另外,控制部12,可以将从项目定义信息的记录中得到的成为字符识别对象的区域的位置信息与项目名以及取得了这些信息的图像数据,一起显示在与信息处理装置1连接的显示装置上。
<结束>
最后,控制部12例如将在步骤108中生成的项目定义信息存储在存储部11中。然后,信息处理装置1结束本动作例的处理。
<其它>
此外,控制部12进行的上述步骤102和104中的第一区域和第二区域的识别处理,相当于区域识别部31的处理。
控制部12进行的上述步骤103中的位置信息取得的处理,相当于位置信息取得部32的处理。
控制部12进行的上述步骤106中的项目名取得的处理,相当于项目名取得部33的处理。
控制部12进行的上述步骤107中的对应关联的处理,相当于对应关联部34的处理。
控制部12进行的上述步骤108中的项目定义信息的生成处理,相当于项目定义信息生成部35的处理。
§3实施方式的作用以及效果
根据上述,在本实施方式的信息处理装置1中,识别出图像数据内中的第一区域与第二区域(步骤102以及104)。并且,从第一区域取得用于指定成为字符识别对象的区域的位置信息(步骤103)。另外,从第二区域取得针对该成为字符识别对象的区域的项目名(步骤106)。
因此,通过本实施方式的信息处理装置1,用户无需通过手动输入来设定与所取得的位置信息相关的、针对成为字符识别对象的区域的项目名。因此,通过本实施方式的信息处理装置1,能够高效地生成(制作)用于OCR软件等的定义信息。
另外,在本实施方式的信息处理装置1中,使得用于指定成为字符识别对象的区域的位置信息与针对该成为字符识别对象的区域的项目名相对应关联(步骤107)。因此,用户无需再进行使所取得的位置信息与项目名相对应关联的处理。因此,通过本实施方式的信息处理装置1,能够高效地生成(制作)用于OCR软件等的定义信息。
§4补充
以上,详细说明了本发明的实施方式,但上述说明的全部观点仅为本发明的例示,并非用于限定其范围。在不脱离本发明的精神的范围内,能够进行各种改良和变形。
本领域技术人员能够根据上述本实施方式的记载,基于权利要求书的记载以及技术常识,来实施等价的范围。另外,本说明书中使用的用语并不特别限定,能够用作该领域常用用语。因此,只要没有其它定义,本说明书中使用的全部专用用语和技术用语,具有本发明所属领域技术人员能够一般理解的意义。在两者矛盾时,在本说明书(包括定义)中记载的意义中来理解本说明书中使用的用语。

Claims (10)

1.一种信息处理装置,其特征在于,包括:
区域识别部,其用于针对在图像数据内利用规定的表现方式来指定的区域,识别第一区域和第二区域,所述第一区域是利用第一区域指定表现方式来指定的区域,所述第二区域是利用与所述第一区域指定表现方式不同的第二区域指定表现方式来指定的区域,
位置信息取得部,其用于在所述图像数据内取得由所述区域识别部识别出的所述第一区域的位置信息,作为用于指定成为字符识别对象的区域的位置信息,
项目名取得部,其用于取得字符信息作为项目名,所述字符信息是通过对由所述区域识别部识别出的所述第二区域内存在的字符进行识别所得到的信息,所述项目名是利用由所述位置信息取得部取得的所述位置信息来指定的所述成为字符识别对象的区域的项目名。
2.如权利要求1所述的信息处理装置,其特征在于,
还具有用于使所述第一区域与所述第二区域相对应关联的对应关联部,
所述项目名取得部从所述第二区域取得所述字符信息作为特定区域的项目名,所述特定区域是利用特定位置信息来指定的所述成为字符识别对象的区域,所述特定位置信息是从通过所述对应关联部与该第二区域相对应关联的所述第一区域取得的位置信息。
3.如权利要求2所述的信息处理装置,其特征在于,
所述对应关联部使所述第一区域与在图像数据上离所述第一区域最近的所述第二区域相对应关联。
4.如权利要求2所述的信息处理装置,其特征在于,
所述对应关联部判断所述第一区域的位置与所述第二区域的位置之间的位置关系是否满足规定条件,并使判断为满足规定条件的所述第一区域与所述第二区域相对应关联。
5.如权利要求4所述的信息处理装置,其特征在于,
所述对应关联部,在图像数据内纵向排列的多个第一区域与纵向排列的多个第二区域中,将横向排列的一个第一区域与一个第二区域判断为满足所述规定条件。
6.如权利要求4所述的信息处理装置,其特征在于,
所述对应关联部,在图像数据内横向排列的多个第一区域与横向排列的多个第二区域中,将纵向排列的一个第一区域与一个第二区域判断为满足所述规定条件。
7.如权利要求2所述的信息处理装置,其特征在于,
所述对应关联部,对存在于图像数据内的用于表示所述第一区域与所述第二区域的对应关系的规定的对应关系指示表现方式进行识别,并基于识别出的该对应关系,使所述第一区域与所述第二区域相对应关联。
8.如权利要求1~7中任意一项所述的信息处理装置,其特征在于,
还具有用于生成项目定义信息的项目定义信息生成部,
所述项目定义信息包括:
用于对由所述位置信息取得部取得的所述成为字符识别对象的区域进行指定的所述位置信息;
由所述项目名取得部取得的利用所述位置信息来指定的所述成为字符识别对象的区域的所述项目名。
9.一种信息处理方法,其特征在于,使计算机执行如下步骤:
区域识别步骤,针对在图像数据内利用规定的表现方式来指定的区域,识别第一区域和第二区域,所述第一区域是利用第一区域指定表现方式来指定的区域,所述第二区域是利用与所述第一区域指定表现方式不同的第二区域指定表现方式来指定的区域,
位置信息取得步骤,在所述图像数据内取得所识别出的所述第一区域的位置信息,作为用于指定成为字符识别对象的区域的位置信息,
项目名取得步骤,取得字符信息作为项目名,所述字符信息是通过对识别出的所述第二区域内存在的字符进行识别所得到的信息,所述项目名是利用所取得的所述位置信息来指定的所述成为字符识别对象的区域的项目名。
10.一种程序,其特征在于,使计算机执行如下步骤:
区域识别步骤,针对在图像数据内利用规定的表现方式来指定的区域,识别第一区域和第二区域,所述第一区域是利用第一区域指定表现方式来指定的区域,所述第二区域是利用与所述第一区域指定表现方式不同的第二区域指定表现方式来指定的区域,
位置信息取得步骤,在所述图像数据内取得所识别出的所述第一区域的位置信息,作为用于指定成为字符识别对象的区域的位置信息,
项目名取得步骤,取得字符信息作为项目名,所述字符信息是通过对识别出的所述第二区域内存在的字符进行识别所得到的信息,所述项目名是利用所取得的所述位置信息来指定的所述成为字符识别对象的区域的项目名。
CN2012100592429A 2011-03-17 2012-03-02 信息处理装置、信息处理方法以及程序 Pending CN102708365A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011-059362 2011-03-17
JP2011059362A JP2012194879A (ja) 2011-03-17 2011-03-17 情報処理装置、情報処理方法及びプログラム

Publications (1)

Publication Number Publication Date
CN102708365A true CN102708365A (zh) 2012-10-03

Family

ID=46828502

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012100592429A Pending CN102708365A (zh) 2011-03-17 2012-03-02 信息处理装置、信息处理方法以及程序

Country Status (3)

Country Link
US (1) US20120237131A1 (zh)
JP (1) JP2012194879A (zh)
CN (1) CN102708365A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110942068A (zh) * 2018-09-25 2020-03-31 富士施乐株式会社 信息处理装置、存储介质及信息处理方法
CN112347831A (zh) * 2019-08-09 2021-02-09 株式会社日立制作所 信息处理装置以及表识别方法
CN112639816A (zh) * 2018-09-14 2021-04-09 三菱电机株式会社 图像信息处理装置、图像信息处理方法和图像信息处理程序
CN113508393A (zh) * 2019-02-27 2021-10-15 日本电信电话株式会社 信息处理装置、关联方法以及关联程序

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6303531B2 (ja) * 2014-01-22 2018-04-04 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP6707825B2 (ja) * 2015-09-14 2020-06-10 富士ゼロックス株式会社 情報処理装置及びプログラム
JP6903966B2 (ja) * 2017-03-16 2021-07-14 富士フイルムビジネスイノベーション株式会社 情報処理装置、情報処理システム及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070228168A1 (en) * 2006-04-03 2007-10-04 Kabushiki Kaisha Toshiba OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form
CN101523413A (zh) * 2006-11-16 2009-09-02 国际商业机器公司 根据硬拷贝表单自动生成表单定义

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070228168A1 (en) * 2006-04-03 2007-10-04 Kabushiki Kaisha Toshiba OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form
CN101523413A (zh) * 2006-11-16 2009-09-02 国际商业机器公司 根据硬拷贝表单自动生成表单定义

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112639816A (zh) * 2018-09-14 2021-04-09 三菱电机株式会社 图像信息处理装置、图像信息处理方法和图像信息处理程序
CN110942068A (zh) * 2018-09-25 2020-03-31 富士施乐株式会社 信息处理装置、存储介质及信息处理方法
CN110942068B (zh) * 2018-09-25 2024-01-23 富士胶片商业创新有限公司 信息处理装置、存储介质及信息处理方法
CN113508393A (zh) * 2019-02-27 2021-10-15 日本电信电话株式会社 信息处理装置、关联方法以及关联程序
CN112347831A (zh) * 2019-08-09 2021-02-09 株式会社日立制作所 信息处理装置以及表识别方法

Also Published As

Publication number Publication date
JP2012194879A (ja) 2012-10-11
US20120237131A1 (en) 2012-09-20

Similar Documents

Publication Publication Date Title
CN102708365A (zh) 信息处理装置、信息处理方法以及程序
CN101944179B (zh) 图像处理装置和图像处理方法
US8508756B2 (en) Image forming apparatus having capability for recognition and extraction of annotations and additionally written portions
US8213717B2 (en) Document processing apparatus, document processing method, recording medium and data signal
JP2009122760A (ja) 文書処理装置、文書処理方法及び文書処理プログラム
CN102693425A (zh) 图像处理设备和图像处理方法
US20140023272A1 (en) Image processing device, image processing method and storage medium
JP2000194850A (ja) ユ―ザ囲み領域の抽出装置及び抽出方法
JP2008145611A (ja) 情報処理装置、プログラム
US11670067B2 (en) Information processing apparatus and non-transitory computer readable medium
JP4983464B2 (ja) 帳票画像処理装置及び帳票画像処理プログラム
JP6780271B2 (ja) 画像処理装置及び画像処理プログラム
JP2012008644A (ja) 縮小画像生成装置及びプログラム
JP4136282B2 (ja) 画像処理装置及び画像処理方法並びに記憶媒体
CN114529933A (zh) 一种合同数据差异性的比对方法、装置、设备和介质
JP5673277B2 (ja) 画像処理装置およびプログラム
JP4143245B2 (ja) 画像処理方法および装置並びに記憶媒体
JP2018055256A (ja) 情報処理装置、情報処理方法及びプログラム
CN110764721A (zh) 模板生成方法、装置、电子设备和计算机可读介质
JP7404943B2 (ja) 情報処理装置及び情報処理プログラム
JP4333297B2 (ja) 印刷イメージ表示装置
JP4651407B2 (ja) 画像処理装置およびコンピュータプログラムおよび記憶媒体
JP4974367B2 (ja) 領域分割方法及び装置、並びにプログラム
JP4050677B2 (ja) 画像処理装置、画像処理方法及びプログラム並びに記録媒体
JP2008123446A (ja) ログ情報管理システム、ログ情報管理装置、ログ情報管理方法及びログ情報管理プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121003