CN102402573A - 表格处理装置和表格处理方法 - Google Patents
表格处理装置和表格处理方法 Download PDFInfo
- Publication number
- CN102402573A CN102402573A CN2011102689208A CN201110268920A CN102402573A CN 102402573 A CN102402573 A CN 102402573A CN 2011102689208 A CN2011102689208 A CN 2011102689208A CN 201110268920 A CN201110268920 A CN 201110268920A CN 102402573 A CN102402573 A CN 102402573A
- Authority
- CN
- China
- Prior art keywords
- definition
- processing
- data
- information
- processing region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/174—Form filling; Merging
Abstract
一种表格处理装置包括:存储单元,配置为在存储区域中存储用于扫描和处理第一表格的定义数据;图像输入单元,配置为扫描第二表格以获得表格图像;位置调整单元,配置为基于第一表格上的处理项目的输入区段的相对位置,调整表示表格图像上的对应处理项目的输入区段的处理区域的位置,并且关联表格图像上的处理区域与定义数据中定义的处理项目的定义信息;以及更新单元,配置为通过将定义信息中指示处理区域的位置的值改变为指示处理区域的调整后位置的值,更新定义信息。
Description
技术领域
本公开的一方面涉及表格处理技术。
背景技术
定义例如表格的处理项目、处理区域和处理信息的定义数据用于扫描和处理表格。已经提出用于使更新定义数据更简单的技术。
例如,日本公报专利公开No.2002-298081公开了一种通过组合表示输入区段的定义元素的模板使得可能简单地产生定义数据的技术。而且,日本公报专利公开No.2001-126010公开了一种使简化和自动化产生定义数据的处理成为可能的技术。在公开的技术中,由线围绕的方框区域和线的属性从通过扫描表格获得的表格图像提取,通过字符识别获得的字符(或字符串)与表示处理项目和登记在字典中的关键词相比较,靠近匹配关键词的字符(字符串)放置的方框区域标识为输入区段(entry field),并且根据预定的格式输出标识的方框区域的区域信息和线的属性。
然而,利用公开的技术,难以有效地更新定义数据。
利用日本公报专利公开No.2002-298081中公开的技术,当表格的布局改变时,用户需要选择要应用到表格的输入区段的模板。因此,公开的技术要求手动操作以更新定义数据,并且因此没有改进更新定义数据的效率。利用日本公报专利No.2001-126010中公开的技术,即使当表格的布局仅略微地改变,更新表格的定义数据花费与从表格产生新的定义数据所需的一样多的时间。因此,该技术也没有使高效地更新定义数据成为可能。
发明内容
在本公开的一方面,提供一种表格处理装置,该装置包括:存储单元,配置为存储用于扫描和处理存储区域中的第一表格的定义数据;图像输入单元,配置为扫描第二表格以获得表格图像;位置调整单元,配置为基于第一表格上的处理项目的输入区段的相对位置,调整表示表格图像上的对应处理项目的输入区段的处理区域的位置,并且将表格图像上的处理区域与定义数据中定义的处理项目的定义信息关联;以及更新单元,配置为通过将指示定义信息中的处理区域的位置的值改变为指示处理区域的调整后位置的值,来更新定义信息。相对于第一表格上的处理项目的项目标题(header),在定义数据中定义输入区段的相对位置。
附图说明
图1是图示表格处理装置的示例硬件配置的框图;
图2A到2D是用于描述相关技术的表格处理中的问题的图;
图3是图示根据第一实施例的表格处理装置的示例功能配置的框图;
图4是图示示例定义数据的图;
图5是图示示例确认屏幕的图;
图6A和6B是用于描述更新定义数据的示例的图;
图7是图示示例配置屏幕的图;
图8是图示包括新增的处理项目的示例定义数据的图;
图9是图示根据第一实施例的示例位置调整处理的流程图;
图10A是图示更新定义数据的示例处理的流程图;
图10B是图示更新定义数据的另一示例处理的流程图;
图11A和11B是用于描述表格的示例布局变化的图;
图12是图示根据第二实施例的表格处理装置的示例功能配置的框图;以及
图13是图示根据第二实施例的示例位置调整处理的流程图。
具体实施方式
以下参考附图描述本发明的优选实施例。
<<第一实施例>>
<硬件配置>
图1是图示根据第一实施例的表格处理装置100的示例硬件配置的框图。
如图1所示,表格处理装置100包括通过总线B相互连接的控制器110、操作面板120和扫描器130。
操作面板120包括用于将如装置信息的信息提供给用户的显示单元,以及用于接收如设置和指令的用户输入的输入单元。扫描器140可选地扫描文件并产生图像数据。
控制器110包括经由总线B相互连接的中央处理单元(CPU)111、存储单元112、网络I/F 113和外部存储器I/F 114。
CPU 111执行程序,并因此控制整个表格处理装置100。存储单元112存储程序和数据(例如,图像数据)。例如,存储单元112包括由易失性存储器实现的随机存取存储器(RAM)、由非易失性存储器实现的只读存储器(ROM)、以及作为海量存储器的硬盘驱动器(HDD)。RAM用作CPU 111的工作区(其中临时存储程序和数据的存储器区域)。ROM和HDD存储程序和数据。CPU 111从ROM和/或HDD将程序加载到RAM中,并且执行加载的程序。
网络I/F 113是用于将表格处理装置100连接到数据通信信道N(如网络)的接口。表格处理装置100可以经由网络I/F 113与具有通信功能的外部装置通信。
外部存储I/F 114是用于将用作外部存储的存储介质114a连接到表格处理装置100的接口。存储介质114a例如由安全数字(SD)存储卡、通用串行总线(USB)存储器、CD-RW或DVD-RW实现。表格处理装置100可以经由外部存储I/F 114从和向存储介质114a读出和写入数据。
利用以上硬件配置,表格处理装置100可以提供多种表格处理功能(服务)。
<表格处理功能>
以下描述表格处理装置100的示例表格处理功能。
表格处理装置100扫描表格以获得表格图像,并对表格图像执行识别处理以标识表格处理对象。表格处理装置100参考输入定义数据,并确定是否在与匹配标识的表格处理对象的各个处理项目的定义信息关联的定义数据中,定义在表格上相对于项目标题表达的输入区段(处理区域)的相对位置。每个处理项目的定义信息可以包括例如处理区域的位置、以及指示要对处理区域执行的处理的处理信息。基于相对位置,表格处理装置100调整表格图像上处理区域(表示输入区段)的位置,并且将表格图像上的处理区域与定义数据中对应的处理项目的定义信息关联。当参考在对应的定义信息中定义的表格图像的原点的处理区域的位置不同于处理区域的调整后位置时,表格处理装置100更新定义信息。
图2A到2D是用于描述相关技术的表格处理中的问题的图。
图2A图示“原始”表格11,且图2B图示通过改变表格11获得的“变化的”表格12。由项目标题“制作人”指示的新处理项目已经在由项目标题“财产名称”和“支付”指示的处理项目之间,添加到变化的表格12,结果表格11的布局已经改变。当如上举例说明改变表格的布局时,有必要也改变用于扫描和处理表格的定义数据。
例如,表格的定义数据包括表格上各个处理项目(要处理的信息项目)的输入区段(处理区域)的位置(例如,参考表格图像的原点的坐标),以及指示要对输入区段执行的处理的处理信息(处理名称)。例如,表格11的定义数据定义处理项目“承租人”、“保证人”、“财产名称”和“支付”的输入区段的位置,以及指示要对输入区段(例如,用于输入区段“承租人”的局部图像存储处理、用于输入区段“保证人”的像素化处理、以及用于输入区段“财产名称”和“支付”的光学字符识别(OCR)处理)执行的处理的处理信息。基于该定义数据,如图2C所示,在通过扫描表格11获得的表格图像G1上标识处理区域R1到R4,并且对标识的处理区域R1到R4执行定义的处理。
因此,如果原始表格11的定义数据用于扫描和处理变化的表格12,则对通过扫描变化的表格12获得的表格图像G2上的处理项目“财产名称”和“支付”的处理区域R3和R4,不能精确地执行OCR处理。这是因为作为改变表格11的布局的结果,处理项目“财产名称”和“支付”的处理区域R3和R4(或输入区段)的位置已经改变,如图2D所示。
在以下说明中,“表格图像G”可以用作引用通过扫描表格11获得的表格图像G1和通过扫描表格12获得的表格图像G2的一般术语。并且,“处理区域R”可以用作引用处理区域R1到R4的一般术语。
在相关技术的技术中,为了防止上述问题,变化的表格的定义数据由用户手动更新(例如,通过改变要应用的模板),或者自动地重新生成(或重现建立)变化的表格的定义数据。然而,利用相关技术的方法,即使当仅略微改变表格时,也难以有效地更新定义数据。由于频繁地对表格进行改变(如增加处理项目),所以优选更有效地更新定义数据。
根据第一实施例,表格处理装置100基于相对于表格上的对应项目标题表达的输入区段的相对位置,关联表格图像G上的处理区域(表示输入区段)与对应的处理项目的定义信息。当参考在对应的定义信息中定义的表格图像G的原点的处理区域R的位置不同于处理区域R的调整后位置时,表格处理装置100更新定义信息中指示处理区域R的位置的值。
该配置使得对应于原始表格11和变化的表格12之间的差别,只更新部分定义数据成为可能,并且因此使得高效的更新定义数据成为可能。
以下描述表格处理装置100的示例功能配置和操作。
图3是图示根据第一实施例的表格处理装置100的示例功能配置的框图。
如图3所示,表格处理装置100包括图像输入单元21、识别单元22、定义数据更新单元31、定义数据存储单元41、定义数据输入单元51、内容确认单元(显示单元)52和用户输入单元(配置单元)61。
图像输入单元21是用例如扫描器130扫描表格以获得表格图像G的功能单元。在该示例中,图像输入单元21扫描变化的表格12以获得表格图像G2。
识别单元22对表格图像G执行识别处理。例如,识别处理包括基于线的表识别(矩阵结构识别)和字符(或字符串)识别。通过识别处理,识别单元22获得表格图像G上的局部图像、图像区域(例如,由参考表格图像G的原点的坐标指示)、以及字符(或字符串),并且标识表格处理对象,如扫描的表格上的处理项目(或项目标题)和输入区段(或处理区域)。例如,识别单元22标识变化的表格12的表格图像G2上的处理项目和输入区段。
定义数据更新单元31是更新输入的定义数据41D以匹配扫描的表格的功能单元。定义数据41D经由定义数据输入单元51输入,并且存储在定义数据存储单元41中。例如,由表格处理装置100的存储单元112的存储区域实现定义数据存储单元41。定义数据更新单元31访问定义数据存储单元41,并更新定义数据41D以匹配扫描的表格。在图3中,假设输入和更新原始表格11的定义数据41Da以匹配变化的表格12。
以下使用定义数据41Da描述定义数据41D的示例配置。
图4是图示原始表格11的定义数据41Da的配置的图。
定义数据41Da包括用于表格11上的每个处理项目的定义信息。每组定义信息包括由参考表格图像G1的原点的坐标指示的处理区域R的位置,以及指示要对处理区域R执行的处理的处理信息(例如,字符串)。因此,定义数据41Da包括用于各个处理项目的多组定义信息。
并且,与定义信息关联地定义设置信息,设置信息包括处理项目的项目名称和关于项目标题的输入区段的相对位置。相对位置指示相对于表格图像G上的对应项目标题的位置的输入区段的位置。
例如,如下所述表达相对位置。
参考图2A的表格11,处理项目“承租人”的输入区段具有三行和一列,并且位于项目标题“承租人”的右侧。在该情况下,关于项目标题“承租人”的输入区段的相对位置表达为“右,3行,1列”。在定义数据41Da中,包括相对位置“右,3行,1列”和项目名称的设置信息D1与处理项目“承租人”的定义信息关联。
类似地,处理项目“保证人”的输入区段具有三行和一列,并且位于项目标题“保证人”的右侧。相应地,在定义数据41Da中,包括相对位置“右,3行,1列”和项目名称的设置信息D2与处理项目“保证人”的定义信息关联。
处理项目“财产名称”的输入区段具有一行和一列,并且位于项目标题“财产名称”的右侧。在该情况下,关于项目标题“财产名称”的输入区段的相对位置表达为“右,1行,1列”。在定义数据41Da中,包括相对位置“右,1行,1列”和项目名称的设置信息D3与处理项目“财产名称”的定义信息关联。
类似地,处理项目“支付”的输入区段具有一行和一列,并且位于项目标题“支付”的右侧。相应地,在定义数据41Da在,包括相对位置“右,1行,1列”和项目名称的设置信息D4与处理项目“支付”的定义信息关联。
在以下描述中,使用具有上述配置的定义数据41Da。
定义数据更新单元31如下所述更新定义数据41Da(包括相对位置)。
基于在表格11的定义数据41Da中定义的输入区段的相对位置,定义数据更新单元31调整表格12的表格图像G2上的处理区域R的位置(表示输入区段)。通过调整处理区域R的位置,定义数据更新单元31关联表格图像G2上的处理区域R与定义数据41Da中定义的对应处理项目的定义信息。当在对应定义数据中定义的处理区域R的位置不同于处理区域R的调整后位置(绝对位置)时,定义数据更新单元31更新定义信息。
对于以上处理,定义数据更新单元31包括比较单元311、设置信息确认单元312、位置调整单元313和更新单元314。
比较单元311是这样的功能单元,其比较表格图像G2上标识的处理项目与定义数据41Da中定义的处理项目,并且因此确定表格图像G2上的处理项目是否匹配定义数据41Da中定义的处理项目。例如,比较单元311比较处理项目的项目名称,或比较表示处理项目的项目标题的局部图像。在前者的情况下,比较单元311比较关于标识的表格处理对象(即,通过识别单元22从表格图像G2获得的信息)的信息中的名称的字符串与在定义数据41Da中定义的项目名称的字符串。在后者的情况下,比较单元311比较关于标识的表格处理对象的信息中的项目标题的局部图像与定义数据41Da中定义的项目标题的局部图像。在该情况下,代替项目名称,项目标题的局部图像与相对位置一起包含在定义数据41Da中。
当表格图像G2上的处理项目匹配定义数据41Da中定义的处理项目时,比较单元311确定表格图像G2包括与定义数据41Da中定义的处理项目相同的处理项目,并且确定匹配的处理项目的处理区域R的位置需要被确认。例如,当变化的表格12的表格图像G上的处理项目与原始表格11的定义数据41Da中定义的处理项目相比较时,除了表格图像G2上的处理项目“制作人”外的处理项目匹配定义数据41Da中的处理项目。在该情况下,比较单元311确定除了处理项目“制作人”外的处理项目的处理区域R的位置需要被确认。
设置信息确认单元312是这样的功能单元,其基于比较单元311的确定结果,确定是否与匹配处理项目的定义信息关联地在定义数据41Da中定义输入区段的相对位置。例如,设置信息确认单元312参考定义数据41D,并确定与处理项目“财产名称”的定义信息关联地定义相对位置“右,1行,1列”。
基于设置信息确认单元312的确定结果,位置调整单元313调整表格图像G2上的匹配处理项目的处理区域R的位置。首先,位置调整单元313基于关于表格处理对象的信息(例如,其包括指示表示项目标题的局部图像的区域的值),标识表格图像G2上的匹配处理项目的项目标题的局部图像的位置。接着,位置调整单元313基于输入区段的相对位置和项目标题的局部图像的标识位置,调整匹配处理项目的处理区域R的位置。
将处理项目“财产名称”作为示例,位置调整单元313基于参考表格图像G2的原点指示局部图像的区域的坐标,标识表格图像G2上的项目标题“财产名称”的局部图像的位置。接下来,位置调整单元313基于输入区段的相对位置“右,1行,1列”,参考项目标题“财产名称”的局部图像的标识位置,调整处理区域R3(表示处理项目“财产名称”的输入区段)的位置。作为结果,位于项目标题“财产名称”右侧的一行和一列的区域确定为表格图像G2上的处理区域R3。
因此,定义数据更新单元31调整表示表格图像G2上的匹配处理项目的输入区段的处理位置R的位置,并且关联处理区域R与在定义数据41Da中定义的对应处理项目的定义信息。
图5是图示示例确认屏幕W1的图。
如图5所示,确认屏幕W1显示已经通过如上所述处理调整的表格图像G2上的处理区域R1到R4的位置。
确认屏幕W1由内容确认单元52显示。内容确认单元52接收处理区域R1到R4的调整后位置,并且将其显示在表格处理装置100的操作面板120上。
确认屏幕W1使用户能可视地确认匹配原始表格11的定义数据41Da中定义的处理项目的变化的表格12上的处理项目。当表格11的布局改变时,这接着使用户能够简单地标识新增的处理项目。
确认屏幕W1还包括图形用户界面(GUI),其允许用户选择是否更新定义数据41Da,以反映处理区域R的位置的变化。在该示例中,按钮“更新”和“不更新”提供在确认屏幕W1上。当用户选择按钮之一时,内容确认单元52发送对应的指令(更新或不更新)到定义数据更新单元31。
返回参考图3,当指令指示“更新”时,定义数据更新单元31的更新单元314更新定义数据41Da。
更具体地,更新单元314将指示在与表格图像G2上的处理区域R关联的定义信息中的处理区域R的位置的值,改变为指示调整后位置的值。更新单元314只改变已经调整的处理区域R的位置的值。注意,例如,处理区域R的位置通过参考表格图像G2的原点的坐标指示,并且不同于相对于项目标题表达的输入区段的相对位置。
图6A和6B是用于描述更新定义数据的示例的图。
图6A图示原始的定义数据41Da1,并且图6B图示更新的定义数据41Da2。
例如,在扫描变化的表格12和输入原始表格11的定义数据41Da1的情况下,更新单元314更新定义数据41Da1,并因此获得定义数据41Da2。
在变化的表格12中,已经在处理项目“财产名称”和“支付”之间增加处理项目“制作人”。
然而,变化的表格12中的处理项目“承租人”和“保证人”的输入区段的位置与原始表格11中的那些相同。因此,更新单元314不更新处理区域R1和R2的位置(坐标)。
同时,变化的表格12中的处理项目“财产名称”和“支付”的输入区段的位置不同于原始表格11中的那些。因此,更新单元314用处理区域R3和R4的调整后坐标重写指示处理区域R3和R4(参考表格图像G2的原点表达)的位置的数据D5和D6。
因此,即使当作为布局改变的结果改变输入区段的位置时,以上配置使得精确地标识表格图像G2上的处理区域R成为可能。
图7是图示示例配置屏幕W2的图。
配置屏幕W2包括用于设置关于处理项目“制作人”的处理区域的区域信息的“区域信息”选项卡,处理项目“制作人”已经作为表格11的布局改变的结果增加。例如,当用指向设备选择确认屏幕上的项目标题“制作人”时,可以显示配置屏幕W2。
如上所述,用户可以在由内容确认单元52显示的确认屏幕W1上,确认当改变表格的布局时增加的新处理项目。用户输入单元61显示配置屏幕W2,以允许用户定义新处理项目的处理区域R的位置和指示要对处理区域R执行处理的处理信息(定义信息),并且设置要与定义信息关联的处理区域R的项目名称和相对位置(设置信息)。用户输入单元61在配置屏幕W2上输入的值,并且发送该值到定义数据更新单元31。
返回参考图3,定义数据更新单元31基于从用户输入单元61接收的值,更新定义数据41Da。
图8图示包括关于新增的处理项目“制作人”的信息的定义数据41Da3。
当从用户输入单元61接收用于处理项目“制作人”的定义信息和设置信息时,定义数据更新单元31的更新单元314更新定义数据41Da。更具体地,更新单元314根据预定的格式增加包括定义信息和设置信息的数据D7到定义数据41Da。
这里,不同于处理区域R的位置和处理信息,处理区域R的项目名称和相对位置不是必需的。例如,处理区域R的项目名称和相对位置可以提供给预期要频繁变化的处理项目。
如上所述,在该实施例的表格处理装置100中,通过上述功能单元的合作提供表格处理功能(或服务)。通过执行在表格处理装置100中安装的软件程序实现功能单元。例如,软件程序由CPU 111从存储单元112(例如,HDD和/或ROM)加载到存储器(例如,RAM),并且执行软件程序以实现表格处理装置100的功能单元。
以下参考流程图描述由表格处理装置100的各功能单元执行的示例处理(各功能单元之间的合作)。
<位置调整处理>
图9是图示根据第一实施例的示例位置调整处理的流程图。在该示例处理中,假设扫描变化的表格12,并输入包括输入区段的相对位置的原始表格11的定义数据41Da。
如图9所示,定义数据输入单元51接收(或读取)原始表格11的定义数据41Da(步骤S101)。定义数据输入单元51在定义数据存储单元41中存储接收的定义数据41Da。
接下来,图像输入单元21扫描变化的表格12,并因此获得表格图像G2(步骤S102)。
识别单元22对表格图像G2执行识别处理(步骤S103)。在该步骤中,识别单元22获取识别结果,如表格图像G2上的局部图像、图像区域和字符(或字符串),并且标识表格处理对象,如表格12上的处理项目(或项目标题)和输入区段(或处理区域)。
基于识别结果,表格处理装置100确定表格图像G2上是否存在尚未对其执行位置调整处理的表格处理对象(例如,处理项目)(步骤S104)。如果出现这样的处理项目(步骤S104中的是),定义数据更新单元31如下所述的位置调整处理。
定义数据更新单元31的比较单元311比较表格图像G2上的处理项目与定义数据存储单元41中存储的定义数据41Da中定义的处理项目,并因此确定表格图像G2上的处理项目是否匹配定义数据41Da中定义的处理项目之一(步骤S105)。
如果处理项目匹配(步骤S105中的是),则定义数据更新单元31的设置信息确认单元312确定是否与匹配处理项目的定义信息关联地定义输入区段的相对位置(步骤S106)。
如果定义相对位置(步骤S106中的是),则定义数据更新单元31的位置调整单元313基于相对位置,调整表示表格图像G2上的匹配处理项目的输入区段的处理区域R的位置(步骤S107)。更具体地,位置调整单元313基于关于表格处理目标的信息(即,识别结果),标识表示表格图像G2上的匹配处理项目的项目标题的局部图像的位置。接下来,位置调整单元313基于与匹配处理项目的定义信息关联地定义的输入区段的相对位置,参考项目标题的局部图像的标识位置,调整匹配处理项目的处理区域R的位置。
随后,处理返回到步骤S104,并且定义数据更新单元31对尚未对其执行位置调整处理的表格处理对象(即,处理项目),重复步骤S105到S107。
同时,如果表格图像G2上的处理项目不匹配定义数据41Da中定义的任一处理项目(步骤S105中的否),或者如果不与匹配处理项目的定义信息关联地定义输入区段的相对位置(步骤S106中的否),则定义数据更新单元31返回到步骤S104,不执行步骤S107的位置调整处理。
当对表格图像G2上的所有表格处理对象(即,处理项目)执行位置调整处理时(步骤S104中的否),定义数据更新单元31发送(多个)位置调整处理的结果到内容确认单元52。
内容确认单元52在表格处理装置100的操作面板120上,显示表格图像G2以及位置调整处理区域R(步骤S108)。内容确认单元52以这样的方式显示位置调整处理区域R,该方式为位置调整处理区域是视觉上可区别的。
<定义数据更新处理>
图10A和10B是图示更新定义数据41Da的示例处理的流程图。在位置调整处理后响应于用户指令,开始图10A和10B的处理。
在图10A的处理中,更新定义数据41Da中指示处理区域R的位置的值。
如图10A所示,当从内容确认单元52接收更新定义数据41Da的指令时(步骤S201中的是),定义数据更新单元31的更新单元314将指示与表格图像G2上的处理区域R关联的定义信息中的处理区域R的位置的值(例如,参考表格图像的原点的坐标),改变为指示调整后位置的值(步骤S202)。更新单元314仅改变指示已经调整的处理区域R的位置的值。
在图10B的处理中,处理项目的定义信息增加到定义数据41Da。
如图10B所示,当从用户输入单元61接收定义信息(例如,处理区域的位置和处理信息)和/或增加的处理项目的设置信息(例如,处理区域的项目名称和相对位置)时,定义数据更新单元31的更新单元314按预定的格式向定义数据41Da增加接收的信息(步骤S302)。
<总结>
如上所述,该实施例的表格处理装置100基于表格11的定义数据41Da中定义的输入区段的相对位置,调整表格12的表格图像G2上的处理项目R(表示处理项目的输入区段)的位置。作为结果,表格图像G2上的处理区域R与定义数据41Da中定义的对应处理项目的定义信息关联。当与定义信息关联地定义的、参考表格图像G2的原点的处理区域R的位置不同于处理区域R的调整后位置时,表格处理装置100更新定义信息。
该配置使得使用原始表格11的定义数据41Da,并仅更新对应于原始表格11和变化的表格12之间的差别的定义数据41Da中的部分成为可能。因此,该配置使得高效更新定义数据41Da以匹配变化的表格12成为可能。
在以上描述中,新处理项目增加到表格的情况用作示例。然而,以上实施例也可以应用于其它情况。例如,以上实施例可以应用于图11A和11B所示的情况,其中处理项目的类型和数量没有改变,但是他们的位置改变了。此外,以上实施例也可以应用于修改表格的数据以匹配类似的表格的情况。
<<第二实施例>>
在第一实施例中,描述了用于更新包括输入区段的相对位置的定义数据的处理。在第二实施例中,描述用于更新不包括输入区段的相对位置的定义数据的配置和处理。
在第二实施例中,省略与第一实施例重迭的描述,与第一实施例中使用的参考标号相同的参考标号分配给对应的组件。在以下描述中,“定义数据41D”用作引用包括输入区段的相对位置的定义数据和不包括输入区段的相对位置的定义数据的一般术语。
<表格处理功能>
图12是图示根据第二实施例的表格处理装置100的示例功能配置的框图。
如图12所示,该实施例的定义数据更新单元31包括代替设置信息确认单元312的相对位置确定单元315。
在该实施例中,图像输入单元21扫描原始表格11以获得表格图像G1,并且扫描变化的表格12以获得表格图像G2。识别单元22对表格图像G1和G2执行识别处理,并因此获得识别结果,如表格图像G1和G2上的局部图像、图像区域和字符(或字符串)。基于识别处理结果,识别单元22标识表格处理对象,如表格11和12上的处理项目(或项目标题)和输入区段(或处理区域),并且发出关于标识的表格处理对象的信息以及表格图像G1和G2到定义数据更新单元31。
定义数据输入单元51接收不包括输入区段的相对位置的原始表格11的定义数据41Db,并且在定义数据存储单元41中存储定义数据41Db。比较单元311比较表格图像G2上标识的处理项目与定义数据41Db中定义的处理项目,并因此确定表格图像G2上的处理项目是否匹配定义数据41Db中定义的处理项目。
由于原始表格11的定义数据41Db不包括输入区段的相对位置,因此定义数据更新单元31的相对位置确定单元315基于原始表格11的表格图像G1,确定表示输入区段的处理区域R的相对位置。
相对位置确定单元315在原始表格11的表格图像G1上标识匹配处理项目的项目标题的局部图像的位置。随后,相对位置确定单元315参考局部图像的标识位置确定表格图像G1上的处理项目R的相对位置。
基于确定的原始表格11上的处理项目R的相对位置,定义数据更新单元31的位置调整单元313调整变化的表格12的表格图像G上的处理区域R的位置。作为结果,变化的表格12的表格图像G2上的处理区域R与原始表格11的定义数据41Db中定义的对应处理项目的定义信息关联。
<位置调整处理>
图13是图示根据第二实施例的示例位置调整处理的流程图。在该示例处理中,假设扫描原始表格11和变化的表格12二者,并输入原始表格11的定义数据41Db。定义数据41Db不包括输入区段的相对位置。
如图13所示,定义数据输入单元51接收原始表格11的定义数据41Db(步骤S401)。定义数据输入单元51在定义数据存储单元41中存储接收的定义数据41Db。
接下来,图像输入单元21扫描原始表格11和变化的表格12,并因此获得表格图像G1和G2(步骤S402)。
识别单元22对表格图像G1和G2执行识别处理(步骤S403)。在该步骤中,识别单元22获得识别处理的结果,如表格图像G1和G2上的局部图像、图像区域和字符(或字符串),并且标识表格处理对象,如表格11和12上的处理项目(或项目标题)和输入区段(或处理区域)。
基于识别结果,表格处理装置100确定表格图像G2上是否存在尚未对其执行位置调整处理的处理对象(即,处理项目)(步骤S404)。如果出现这样的处理项目(步骤S404中的是),则定义数据更新单元31执行如下所述的位置调整处理。
定义数据更新单元31的比较单元311比较表格图像G2上的处理项目与定义数据存储单元41中存储的定义数据41Db中定义的处理项目,并因此确定表格图像G2上的处理项目是否匹配定义数据41Db中定义的处理项目之一(步骤S405)。
如果处理项目匹配(步骤S405中的是),则相对位置确定单元315相对于表示匹配处理项目的项目标题的局部图像的位置,确定表格图像G1上的处理区域R的相对位置,并且确定是否成功地确定相对位置(步骤S406)。
如果成功地确定相对位置(步骤S406中的是),则定义数据更新单元31的位置调整单元313基于相对位置,调整表示表格图像G2上的匹配处理项目的输入区段的处理区域R的位置(步骤S407)。更具体地,位置调整单元313基于关于表格图像G2上的表格处理对象(即,识别处理结果)的信息,标识表示表格图像G2上的匹配处理项目的项目标题的局部图像的位置。接下来,位置调整单元313基于处理区域R的相对位置和标识的项目标题的局部图像的位置,调整匹配处理项目的处理区域R的位置。
随后,处理返回到步骤S404,并且定义数据更新单元31对尚未执行位置调整处理的表格处理对象(即,处理项目)重复步骤S405到S407。
同时,如果表格图像G2上的处理项目不匹配定义数据41Db中定义的任一处理项目(步骤S405中的否),或者如果没有成功地确定处理区域R的相对位置(步骤S406中的否),则定义数据更新单元31返回到步骤S404,不执行步骤S407的位置调整处理。
当对表格图像G2上的所有表格处理对象(即,处理项目)执行位置调整处理时(步骤S404中的否),定义数据更新单元31发送(多个)位置调整处理的结果到内容确认单元52。
内容确认单元52在表格处理装置100的操作面板120上显示表格图像G2以及位置调整处理区域R(步骤S408)。内容确认单元52以这样的方式显示位置调整处理区域R,其中位置调整处理区域R是视觉上可区分的。
<总结>
如上所述,该实施例的表格处理装置100参考项目标题的局部图像的位置,确定表格图像G1上处理区域R的相对位置。基于确定的处理区域R的相对位置,表格处理装置100调整变化的表格12的表格图像G2上的处理区域R(对应于输入区段)的位置。作为结果,变化的表格12的表格图像G2的处理区域R与原始表格11的定义数据41Db中定义的对应处理项目的定义信息关联。当参考关联定义信息中定义的表格图像G2的原点的处理区域R的位置不同于处理区域R的调整后位置时,表格处理装置100更新定义信息。
即使当输入区段(或处理区域)的相对位置没有定义在定义数据41Db中时,该配置使得高效地更新定义数据41Db成为可能。因此,第二实施例也提供如第一实施例中的有利效果。
因此,第二实施例使得使用不包括输入区段的相对位置传统定义数据成为可能。换言之,第二实施例消除了准备包括输入区段的相对位置的定义数据的需要,并因此使得减少用户工作量成为可能。此外,第二实施例通过不包括输入区段的相对位置使得减小定义数据的大小成为可能,并因此使得减小用于定义数据的存储空间(即,定义数据存储单元41)的量成为可能。
例如,通过使用表格处理装置100的处理单元(例如,CPU 111),执行程序实现上述实施例的表格处理功能,程序由表格处理装置100的运行环境(平台)支持的编程语言编写。
这样的程序可以存储在非暂时计算机可读存储介质(例如,存储介质114a)中,如CD-ROM/RW、DVD-ROM/RW、SD卡或USB存储器。例如,存储在存储介质114a中的程序可以经由外部存储I/F 114安装在表格处理装置100中。可替代地,程序可以经由电话线和网络I/F 113下载,并且安装到表格处理装置100中。
以上实施例还可以应用于相关技术的表格识别技术。例如,日本公报专利公开2000-29986公开了一种表格识别技术,其中基于格式信息识别其布局可变的半固定表格,格式信息包括关于表格上的处理项目的信息和指示要对对应于处理项目的输入区段的处理区域R执行的处理的处理信息。
当应用于公开的识别技术时,以上实施例使得关联输入区段的相对位置与对应处理项目的格式信息成为可能,从而使得基于输入区段的相对位置调整表格图像上的处理区域的位置成为可能(即,使得关联位置调整处理区域与处理信息成为可能)。因此,上述实施例能够实现高效地更新格式信息。
本发明不限于具体公开的实施例,并且可以不脱离本发明的范围做出变化和修改。
该公开的一方面使得提供可能高效更新用于扫描和处理表格的定义数据的表格处理装置、表格处理方法和存储表格处理程序的存储介质成为可能。
Claims (7)
1.一种表格处理装置,包括:
存储单元,配置为在存储区域中存储用于扫描和处理第一表格的定义数据;
图像输入单元,配置为扫描第二表格以获得表格图像;
位置调整单元,配置为
基于第一表格上的处理项目的输入区段的相对位置,调整表示表格图像上的对应处理项目的输入区段的处理区域的位置,相对于第一表格上的处理项目的项目标题在定义数据中定义相对位置;及
关联表格图像上的处理区域与定义数据中定义的处理项目的定义信息;以及
更新单元,配置为通过将定义信息中指示处理区域的位置的值改变为指示处理区域的调整后位置的值,更新定义信息。
2.如权利要求1所述的表格处理装置,还包括:
识别单元,配置为对表格图像执行识别处理,以标识表示表格图像上的处理项目的表格处理对象;
比较单元,配置为确定表格图像上的处理项目是否匹配第一表格的定义数据中定义的处理项目;
确认单元,配置为如果处理项目匹配,则确定是否在与处理项目的定义信息关联的定义数据中定义输入区段的相对位置;
其中,如果确认单元确定在与定义信息关联的定义数据中定义输入区段的相对位置,则位置调整单元基于输入区段的相对位置调整处理区域的位置。
3.如权利要求2所述的表格处理装置,其中位置调整单元配置为
基于关于识别单元标识的表格处理对象的信息,标识表示表格图像上的处理项目的项目标题的局部图像的位置,以及
基于输入区段的相对位置和局部图像的标识位置,调整处理区域的位置。
4.如权利要求1到3任一所述的表格处理装置,其中更新单元配置为如果指示定义信息中处理区域的位置的值不同于指示处理区域的调整后位置的值,则更新定义信息。
5.如权利要求1到3任一所述的表格处理装置,还包括:
显示单元,配置为显示在表格图像上的调整后位置处的处理区域,以使处理区域可区分。
6.如权利要求1到3任一所述的表格处理装置,还包括:
用户输入单元,配置为允许用户经由图形用户界面输入用于定义数据的信息,
其中,更新单元配置为基于输入信息更新定义数据。
7.一种用表格处理装置处理表格的方法,所述表格处理装置包括存储用于扫描和处理第一表格的定义数据的存储单元,所述方法包括:
扫描第二表格以获得表格图像;
基于第一表格上的处理项目的输入区段的相对位置,调整表示表格图像上的对应处理项目的输入区段的处理区域的位置,相对于第一表格上的处理项目的项目标题在定义数据中定义相对位置;
关联表格图像上的处理区域与定义数据中定义的处理项目的定义信息;以及
通过将定义信息中指示处理区域的位置的值改变为指示处理区域的调整后位置的值,更新定义信息。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010204858A JP5556524B2 (ja) | 2010-09-13 | 2010-09-13 | 帳票処理装置、帳票処理方法、帳票処理プログラム、及びそのプログラムを記録した記録媒体 |
JP2010-204858 | 2010-09-13 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102402573A true CN102402573A (zh) | 2012-04-04 |
CN102402573B CN102402573B (zh) | 2013-12-25 |
Family
ID=45806457
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011102689208A Active CN102402573B (zh) | 2010-09-13 | 2011-09-13 | 表格处理装置和表格处理方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8564846B2 (zh) |
JP (1) | JP5556524B2 (zh) |
CN (1) | CN102402573B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156715A (zh) * | 2015-04-24 | 2016-11-23 | 富士通株式会社 | 分析表格图像的布局的方法和设备 |
CN107967354A (zh) * | 2017-12-19 | 2018-04-27 | 马上消费金融股份有限公司 | 一种内容显示位置调整方法、系统、装置及存储介质 |
CN111814444A (zh) * | 2020-07-21 | 2020-10-23 | 四川爱联科技有限公司 | 一种基于bs架构的表格数据汇总分析方法 |
CN113508393A (zh) * | 2019-02-27 | 2021-10-15 | 日本电信电话株式会社 | 信息处理装置、关联方法以及关联程序 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6103235B2 (ja) * | 2013-10-09 | 2017-03-29 | 富士ゼロックス株式会社 | 設定記憶装置および画像形成装置、設定記憶制御プログラム |
US9910842B2 (en) * | 2015-08-12 | 2018-03-06 | Captricity, Inc. | Interactively predicting fields in a form |
JP2018124705A (ja) * | 2017-01-31 | 2018-08-09 | 日本Ics株式会社 | 証憑の管理プログラム |
US11416674B2 (en) | 2018-07-20 | 2022-08-16 | Ricoh Company, Ltd. | Information processing apparatus, method of processing information and storage medium |
US20220164974A1 (en) * | 2019-03-28 | 2022-05-26 | Sony Group Corporation | Information processing device, information processing method, and program |
JP6590355B1 (ja) * | 2019-04-26 | 2019-10-16 | Arithmer株式会社 | 学習モデル生成装置、文字認識装置、学習モデル生成方法、文字認識方法、及びプログラム |
JP2021131659A (ja) * | 2020-02-19 | 2021-09-09 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、制御方法、及びプログラム |
USD993277S1 (en) * | 2020-12-10 | 2023-07-25 | Yokogawa Electric Corporation | Display screen or portion thereof with graphical user interface |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1188946A (zh) * | 1996-12-27 | 1998-07-29 | 富士通株式会社 | 从图像中提取管理信息的设备与方法 |
CN1430162A (zh) * | 2001-12-29 | 2003-07-16 | 财团法人资讯工业策进会 | 电子表单编辑方法及系统 |
CN1487461A (zh) * | 2002-09-04 | 2004-04-07 | ��ʿͨ��ʽ���� | 表单处理装置,表单处理方法和使计算机能执行处理的程序 |
US20050076301A1 (en) * | 2003-10-01 | 2005-04-07 | Weinthal Tevya A. | Apparatus, system, and method for managing fitness data |
US20070228168A1 (en) * | 2006-04-03 | 2007-10-04 | Kabushiki Kaisha Toshiba | OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07107694B2 (ja) * | 1984-08-31 | 1995-11-15 | 株式会社日立製作所 | 文書処理装置 |
US4949392A (en) * | 1988-05-20 | 1990-08-14 | Eastman Kodak Company | Document recognition and automatic indexing for optical character recognition |
JPH04136357A (ja) | 1990-09-26 | 1992-05-11 | Misawa Homes Co Ltd | 階段の取付構造 |
JPH04183527A (ja) | 1990-11-14 | 1992-06-30 | Mitsubishi Electric Corp | ワイヤ放電加工機のワイヤ供給装置 |
JPH09319824A (ja) * | 1996-05-30 | 1997-12-12 | Hitachi Ltd | 帳票認識方法 |
JP3394694B2 (ja) * | 1997-08-29 | 2003-04-07 | 沖電気工業株式会社 | フォーマット情報登録方法及びocrシステム |
JP2000029986A (ja) | 1998-07-10 | 2000-01-28 | Ricoh Co Ltd | 帳票データ読取方法、記録媒体、及び、帳票データ読取装置 |
JP2000268106A (ja) | 1999-03-15 | 2000-09-29 | Casio Comput Co Ltd | 帳票処理装置およびそのプログラム記録媒体 |
JP2001126010A (ja) | 1999-11-01 | 2001-05-11 | Ricoh Co Ltd | 帳票処理装置、帳票定義作成方法、領域抽出方法及び記憶媒体 |
JP2001312694A (ja) * | 2000-05-01 | 2001-11-09 | Hitachi Ltd | 多種類の帳票認識方法および装置 |
JP3857513B2 (ja) * | 2000-09-29 | 2006-12-13 | グローリー株式会社 | 辞書更新システム、辞書更新方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2002298081A (ja) | 2001-03-30 | 2002-10-11 | Toshiba Corp | 光学的文字認識装置及び帳票読取定義体のフィールド定義方法 |
JP4136357B2 (ja) | 2001-10-30 | 2008-08-20 | 株式会社Pfu | 帳票定義処理装置、帳票定義処理プログラム、および帳票定義処理プログラム記録媒体 |
JP4183527B2 (ja) | 2003-02-24 | 2008-11-19 | 日立オムロンターミナルソリューションズ株式会社 | 帳票定義データ作成方法および帳票処理装置 |
JP2005044256A (ja) | 2003-07-25 | 2005-02-17 | Casio Comput Co Ltd | 帳票フィールド属性作成システムおよび方法、並びにプログラム |
JP4357226B2 (ja) * | 2003-08-08 | 2009-11-04 | 日立オムロンターミナルソリューションズ株式会社 | 帳票定義装置、帳票定義方法及び帳票定義プログラム |
WO2007049270A2 (en) * | 2005-10-25 | 2007-05-03 | Charactell Ltd | Form data extraction without customization |
JP4521377B2 (ja) * | 2006-06-02 | 2010-08-11 | 日立オムロンターミナルソリューションズ株式会社 | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム |
US20100125617A1 (en) * | 2008-11-18 | 2010-05-20 | Andrea Alexander | System for Consolidating Business Documents |
-
2010
- 2010-09-13 JP JP2010204858A patent/JP5556524B2/ja not_active Expired - Fee Related
-
2011
- 2011-08-31 US US13/222,288 patent/US8564846B2/en not_active Expired - Fee Related
- 2011-09-13 CN CN2011102689208A patent/CN102402573B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1188946A (zh) * | 1996-12-27 | 1998-07-29 | 富士通株式会社 | 从图像中提取管理信息的设备与方法 |
CN1430162A (zh) * | 2001-12-29 | 2003-07-16 | 财团法人资讯工业策进会 | 电子表单编辑方法及系统 |
CN1487461A (zh) * | 2002-09-04 | 2004-04-07 | ��ʿͨ��ʽ���� | 表单处理装置,表单处理方法和使计算机能执行处理的程序 |
US20050076301A1 (en) * | 2003-10-01 | 2005-04-07 | Weinthal Tevya A. | Apparatus, system, and method for managing fitness data |
US20070228168A1 (en) * | 2006-04-03 | 2007-10-04 | Kabushiki Kaisha Toshiba | OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156715A (zh) * | 2015-04-24 | 2016-11-23 | 富士通株式会社 | 分析表格图像的布局的方法和设备 |
CN107967354A (zh) * | 2017-12-19 | 2018-04-27 | 马上消费金融股份有限公司 | 一种内容显示位置调整方法、系统、装置及存储介质 |
CN113508393A (zh) * | 2019-02-27 | 2021-10-15 | 日本电信电话株式会社 | 信息处理装置、关联方法以及关联程序 |
CN111814444A (zh) * | 2020-07-21 | 2020-10-23 | 四川爱联科技有限公司 | 一种基于bs架构的表格数据汇总分析方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102402573B (zh) | 2013-12-25 |
US20120062961A1 (en) | 2012-03-15 |
JP2012059226A (ja) | 2012-03-22 |
JP5556524B2 (ja) | 2014-07-23 |
US8564846B2 (en) | 2013-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102402573B (zh) | 表格处理装置和表格处理方法 | |
JP6098628B2 (ja) | 画像処理プログラム、画像処理方法、及び画像処理装置 | |
US9032395B2 (en) | Method for installing applications installed in an old mobile terminal to a new mobile terminal | |
JP4819560B2 (ja) | 表示制御装置、画像処理装置、インターフェース画面、表示制御方法 | |
CN105847632B (zh) | 信息处理装置以及信息处理方法 | |
CN102053803B (zh) | 设置变更装置及方法 | |
KR102038269B1 (ko) | 전문가 방문 서비스 제공 방법 및 그 장치 | |
JP2015162077A (ja) | データ管理プログラム、データ管理システム、及びデータ管理サーバ | |
CN101505349A (zh) | 图像处理方法、装置及系统、图像读取装置和形成装置 | |
CN1173283C (zh) | 文献图象处理装置和方法 | |
EP2511859A1 (en) | User information registration program and user information registration method | |
CN101128727B (zh) | 车辆质量分析系统和多数据管理方法 | |
JP6930284B2 (ja) | 印刷システム、印刷装置及びプログラム | |
JP2019169182A (ja) | 情報処理装置、制御方法、プログラム | |
CN1598847A (zh) | 设计变更支持系统、设计变更方法以及记录它的记录介质 | |
JP2007087276A (ja) | 部品情報提供装置 | |
CN101128725B (zh) | 车辆质量分析系统和数据管理方法 | |
CN112732291B (zh) | 一种产品功能开发方法、装置、存储介质及电子装置 | |
JP2009217588A (ja) | ファイルシステム、電子カメラ、ファイルアクセス方法及びプログラム | |
US20060212371A1 (en) | System and method for generating material inventory list | |
CN101128726A (zh) | 车辆质量分析系统和程序文件管理方法 | |
JP6586485B2 (ja) | 会計情報処理装置、会計処理方法、およびプログラム | |
CN114730167B (zh) | Plc系统构建辅助程序、运算终端可读存储介质及plc系统构建辅助装置 | |
CN109407919B (zh) | 投保信息展示方法、装置及存储设备、计算机设备 | |
JP2007293655A (ja) | 文書処理装置、電子文書の出力処理方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |