CN100430957C - 图像处理装置、方法 - Google Patents
图像处理装置、方法 Download PDFInfo
- Publication number
- CN100430957C CN100430957C CNB2006101002692A CN200610100269A CN100430957C CN 100430957 C CN100430957 C CN 100430957C CN B2006101002692 A CNB2006101002692 A CN B2006101002692A CN 200610100269 A CN200610100269 A CN 200610100269A CN 100430957 C CN100430957 C CN 100430957C
- Authority
- CN
- China
- Prior art keywords
- zone
- image processing
- area information
- document data
- specified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
图像处理装置、方法以及存储图像处理程序的存储介质。图像处理装置包括输入单元、提取单元、读取单元和处理单元。输入单元将经数字化的区域指定用文档数据变换为可在图像处理装置内处理的格式并输入该区域指定用文档数据,所述区域指定用文档数据包括区域信息,该区域信息表示为了执行预定处理而预先指定的区域。提取单元从区域指定用文档数据中提取区域信息,读取单元读取用于执行预定处理的文档图像。处理单元从读取单元读取的文档图像中提取与提取单元提取的区域信息相对应的区域,并执行预定处理。
Description
技术领域
本发明涉及一种图像处理装置、图像处理方法以及存储图像处理程序的存储介质,具体地说,本发明涉及一种对指定区域执行OCR(光学字符识别)处理的图像处理装置、图像处理方法以及存储图像处理程序的存储介质。
背景技术
在其上记录有文档图像等的纸张上指定了区域并执行OCR处理的情况下,存在以下方法,诸如使用GUI(图形用户界面)等通过鼠标等指定矩形区域的方法、预先设置要经过OCR处理的区域并将其用作模板的方法等。
此外,例如,日本专利申请特开平7-282192和特开平5-159099中公开的技术已经提出了与前述区域指定相似的技术。
日本专利申请特开平7-282192中公开的技术提出了基于来自拍摄者的视线(line-of-sight)信息设置字符区域,并且对通过图像拾取单元的图像拾取而获取的图像信号之中的与该字符区域相对应的图像信号执行字符识别处理,从而提高了精确度并且提高了字符识别速度。
日本专利申请特开平5-159099中公开的技术提出了在制作商务表格时,放宽作为识别对象的字符框的印刷精确度,并使表格能够通过诸如电子复印等的简易印刷(easy printing)来制作。在电子复印等的情况下,在各商务表格中,从表格的外沿到字符识别区的偏移量大。然而,印刷自身之间的偏移量(即,印刷之间的相对偏移量)小。因此,通过用与由顶线和右线构成的基准印刷的相对位置来指定商务表格图像中的字符识别区域,消除了精确印刷从表格的边缘或外侧到字符识别区域的距离的需要,并且放宽了印刷表格的精确度。因此,传统上只能通过印刷来制作的字符识别装置用商务表格可以通过诸如字处理器、电子复印等的简易印刷来制作。
然而,日本专利申请特开平7-282192中公开的技术在指定区域时使用视线信息。因此,检测视线的结构昂贵,并且当被用于指定通常文档的区域时存在区域指定的精确度的问题。
此外,日本专利申请特开平5-159099中公开的技术预先设置外框等,并用相对位置对区域进行指定。然而,需要系统能够识别的基准标记(外框等),且存在这样的问题:难以将识别应用于各种类型的文档。
发明内容
开发出本发明以解决上述问题,使得能够容易地执行对要经过OCR处理的区域的指定。
本发明的第一方面的一种图像处理装置包括:接收单元,其接收包括区域信息的区域指定用文档数据并将所述文档数据变换为可由所述图像处理装置处理的格式,所述区域信息表示文档数据的区域,所述区域是所述图像处理装置的处理目标;提取单元,其从所述区域指定用文档数据中提取区域信息;读取单元,其读取文档图像;和处理单元,其从读取单元读取的文档图像中提取与提取单元提取的区域信息相对应的区域,并对文档图像的所述区域执行处理。
附图说明
将基于以下附图详细描述本发明的实施例,其中:
图1是示出了与本发明实施例相关的图像处理装置的结构的图;
图2是示出了关于与本发明实施例相关的图像处理装置的从外部计算机等设置要经过OCR的区域的区域指定处理的流程的示例的流程图;
图3是示出了区域登记处理的流程的示例的流程图,该区域登记处理登记要经过OCR处理的区域并在与本发明实施例相关的图像处理装置执行;和
图4是示出了在与本发明实施例相关的图像处理装置执行OCR处理的流程的示例的流程图。
具体实施方式
下文中将参照附图详细描述本发明实施例的示例。图1是示出了与本发明实施例相关的图像处理装置的结构的图。
如图1所示,与本发明实施例相关的图像处理装置10具有图像读入部12、区域指定读入模块14、区域指定方法设置UI(用户接口)16、OCRUI(用户接口)18、识别区域数据存储部20、识别区域数据库22、识别区域数据获取部24、和OCR识别模块26。
图像读入部12读入通过使用扫描仪或传真机等使要经过OCR处理的纸文档(例如诸如商务表格等的固定格式文档)电子化而制成的图像数据。
区域指定读入模块14获取通过使纸文档等数字化而制成的区域指定用文档,或者获取通过各种类型的应用软件而制成的区域指定用文档。区域指定用文档包括由各种类型的应用软件指定的作为OCR处理对象的区域信息(例如,可在应用软件中使用的诸如框、颜色、颜色标记等的指定了区域的信息)。区域指定读入模块14从区域指定用文档中提取由各种类型的应用软件指定的作为OCR处理对象的区域。要注意,区域指定读入模块14可获取通过对纸文档等进行数字化而制成的区域指定用文档,在所述纸文档等中指定了由手写标记等指定的作为OCR处理对象的区域(例如框或颜色标记等)。
区域指定读入模块14由各种类型的读入插件28和识别区域指定读入部30构成。
各种类型的读入插件28将在各种类型的应用软件等中使用的数据格式变换为可在图像处理装置10处理的格式,并将它们输入到(将它们送入)图像处理装置10中。各种类型的读入插件28例如包括:图像读入插件模块,其读入通过对纸文档进行数字化而制成的图像数据(区域指定用文档),在该纸文档中通过笔迹等指定了作为OCR处理对象的区域(例如,诸如通过矩形框或颜色标记等的笔迹指定的OCR对象区域),并且图像读入插件模块读入通过对纸文档进行数字化而制成的图像数据(区域指定用文档),在该图像数据中由各种类型的图像编辑器等指定了作为OCR处理对象的区域;读入PPT文档的插件模块,在该PPT文档中,微软公司的软件Power Pointer(PPT)指定了作为OCR处理对象的区域;读入WORD文档的插件模块,在WORD文档中微软公司的软件Word指定了作为OCR处理对象的区域;读入XDW文档的插件模块,在该XDW文档中富士施乐有限公司(Fuji Xerox Co.,Ltd)的软件Docuworks(XDW)指定了作为OCR处理对象的区域;等等。要注意到各种类型的插件28不限于上述插件模块,可使用其他插件模块。
识别区域指定读入部30根据在区域指定方法设置UI 16处指定的设置,从各种类型的插件28读入区域指定用文档,并提取作为OCR处理对象的区域。
在从各种类型的读入插件28读入所述区域时的处理方法由区域指定方法设置UI16设置。指定这样的处理方法作为要设置的处理方法,该处理方法例如具有诸如矩形框、填色的(colored-in)区域、颜色指定、自动之类的设置并且根据所述设置提取要作为OCR处理对象的区域。要注意到可以执行诸如要读入的文档的类型之类的设置。
OCR UI18执行作为由识别区域指定读入部30提取的OCR处理对象的区域的索引信息(例如应用于从给定装置获取的图像数据的规则等)的输入,并且执行输入以执行在区域指定方法设置UI 16处设置的处理方法的选择等。
识别区域数据存储部20将OCR UI 18输入的索引信息和表示作为由识别区域指定读入部30提取的OCR处理对象的区域(识别区域)的区域信息存储在识别区域数据库22中并彼此关联。要注意到,可将识别区域数据自身与索引信息关联地存储在识别区域数据库22中,来代替存储在识别区域数据库22中的识别区域作为区域信息。
识别区域数据获取部24根据从外部UI或系统输入的区域选择信息(例如,读取要经过OCR的图像的装置的信息)产生索引数据(索引信息),并从识别区域数据库22中存储的数据中选择并获取与索引数据(索引信息)相对应的区域信息。
OCR识别模块26从图像读入部12获取通过对要经过OCR处理的纸文档(例如诸如商务表格等的固定格式文档)进行电子化而制成的图像数据。OCR识别模块26还获取识别区域数据获取部24已获取的区域信息,并对从图像读入部12获取的图像数据中与该区域信息相对应的区域执行OCR处理。
接下来,将描述与本发明实施例相关的在如上所述构成的图像处理装置10执行的处理。
首先,将描述在对如上所述构成的图像处理装置10登记OCR处理对象时的区域指定处理。要注意到下文中将解释的是这种情况:通过使用在图像处理装置10之外的计算机等中安装的各种类型的应用软件,来指定要经过OCR处理的区域。
图2是示出了关于与本发明实施例相关的图像处理装置10的从外部计算机等设置要经过OCR的区域的区域指定处理的流程的示例的流程图。
首先,在步骤100中,从要经过OCR处理的纸文档产生被电子化的图像数据,程序继续进行到步骤102。即,由扫描仪等读入要经过OCR处理的纸文档,并将其电子化,从而产生图像数据。
在步骤102中,各种类型的应用软件(例如前述PPT、Word、XDW等)取得产生的图像数据,程序继续进行到步骤104。
在步骤104中,判断是否已使用各种类型的应用软件完成了对图像数据要经过OCR处理的区域的指定。该判断是这样的判断:各种类型的应用软件是否已完成了对要经过OCR的区域的指定以及图像处理装置10是否被指示对指定的区域进行登记等。如果该判断是否定的,则程序等待直到判断变成肯定的为止,然后继续进行到步骤106。即,因为在各种类型的应用软件处指定了要经过OCR处理的区域,所以可以使用用户使用的应用软件来进行区域指定。要注意到在该应用软件处进行的区域指定可以是使用可在各种类型的应用软件使用的例如框、颜色、颜色标记等而进行的对区域的指定。
在步骤106中,将由各种类型的应用软件指定的区域的图像数据(即,区域指定用文档)输出到图像处理装置10,该系列处理结束。
要注意到,除了如上所述使用安装在外部计算机中的各种类型的应用软件指定要经过OCR处理的区域之外,还可通过使通过矩形或颜色标记等进行了手写指定的纸文档电子化来产生区域指定用文档。
图3是示出了区域登记处理的流程的示例的流程图,该区域登记处理登记要经过OCR处理的区域并在与本发明实施例相关的图像处理装置10执行。
在步骤200中,输入区域指定用文档,该区域指定用文档如上所述由各种类型的应用软件指定了要经过OCR处理的区域,程序继续进行到步骤202。根据例如在区域指定方法设置UI 16指定的设置,识别区域指定读入部30将从计算机等输出的区域指定用文档经由各种类型的读入插件28送入图像处理装置10中。此时,如果在区域指定方法设置UI 16未指定文档类型,则根据指定的文档的扩展名等判断文档类型,经由各种类型的读入插件28读入区域识别用文档。
在步骤202中,根据区域指定方法设置UI 16的设置对区域进行提取,程序继续进行到步骤204。即,通过执行在区域指定方法设置UI16处的设置,从而提取由区域指定处理所指定的区域,识别区域指定读入部30从区域指定用文档中提取由区域指定处理所指定的区域(下文中,将由区域指定处理所指定的区域称为识别区域)。
在步骤204中,获取了用于指定所提取的识别区域的索引数据(索引信息),程序继续进行到步骤206。由识别区域数据存储部20执行索引数据(索引信息)的获取,识别区域数据存储部20从OCR UI18获取该索引数据。例如,如果图像读入部12从预定装置读入了要经过OCR的图像,则用户使用OCR UI 18制定用于选择预定的识别区域作为索引数据(索引信息)的规则,而识别区域数据存储部20获取该索引数据。
在随后的步骤206中,与索引数据(索引信息)相关联地将提取的识别区域存储在识别区域数据库22中,该系列区域登记处理结束。按此方式,在图像读入部12从预定装置读入了要经过OCR的图像的情况下,通过检索对应的索引数据(索引信息)可自动选择出对应的识别区域。
接下来将描述在与本发明实施例相关的图像处理装置10执行OCR处理的情况下的处理。图4是示出了在与本发明实施例相关的图像处理装置10处执行OCR处理的流程的示例的流程图。
在步骤300中,获取OCR图像,程序继续进行到步骤302。即,OCR识别模块26经由图像读入部12获取了通过扫描仪或传真机等读入要经过OCR处理的纸文档(例如诸如商务表格等的固定格式文档)而制作并电子化了的图像数据。
在步骤302中,基于作为OCR图像的获取源的装置的信息获取识别区域,程序继续进行到步骤304。即,识别区域数据获取部24从识别区域数据库22中检索并获取与对应于所述装置信息的索引信息相关联的识别区域。
在步骤304中,基于由OCR识别模块26获取的表示OCR图像的图像数据以及由识别区域数据获取部24获取的区域信息,来执行OCR处理,该系列OCR处理结束。即,从OCR图像中提取出对应于识别区域的部分,对该提取的部分执行预定的OCR处理。
例如,因为可在图像上用矩形框指定区域,所以可以假设用通常的传真机或扫描仪等读入文档并指明该图像上的识别区域。可清楚地指定要识别的区域。
此外,因为在对区域进行指定时可使用诸如通过标记等的颜色指定,所以即使在有诸如表格等的大量矩形框的文档中,仍可容易地判断出指定了哪个区域。
因为对区域识别中使用的文档可以完全不添加任何编辑,所以可以用专用于用户的管理方法来管理区域指定用文档,并且可以重用在区域指定中已用过的文档。此外,即使指定的区域由于标准处理等的改变而改变时,也可重用在区域指定中已用过的文档,因此,区域的重新指定很容易。
由识别区域数据存储部20存储的数据是由各种类型的应用软件指定的识别区域。因此,即使图像处理装置10或者图像处理装置10中的软件改变了,仍可利用该数据。
上述实施例中的图像读入部12、区域指定读入模块14、区域指定方法设置UI 16、识别区域数据存储部20、识别区域数据获取部24和OCR识别模块26可由硬件构成,或者可由软件构成。即,上述在图像处理装置10处执行的区域登记处理和OCR处理可以是由硬件执行的处理,或者可以是由软件执行的处理。
以上描述了本发明的特定实施例,但是本发明不限于此实施例。
即,本发明的第一方面提供了一种图像处理装置,其包括:输入单元,其将经数字化的区域指定用文档数据变换为可在图像输出装置内处理的格式并输入该文档数据,所述区域指定用文档数据包括区域信息,该区域信息表示为了执行预定处理而预先指定的区域;提取单元,其从区域指定用文档数据中提取区域信息;读取单元,其读取用于执行预定处理的文档图像;和处理单元,其从读取单元读取的文档图像中提取与提取单元提取的区域信息相对应的区域,并执行预定处理。
根据上述第一方面,在输入单元,将区域指定用文档数据变换为可在图像输出装置内处理的格式并输入,该区域指定用文档数据已被数字化(或电子化)并且包括区域信息,该区域信息表示为了执行预定处理而预先指定的区域。在提取单元,从由输入单元输入的区域指定用文档数据中提取区域信息。
例如,输入单元可将区域指定用文档数据输入到图像处理装置中,在该区域指定用文档数据中,使用各种类型的应用软件指定了用于执行预定处理的区域。该区域信息可由提取单元提取。
此外,读取单元读取用于执行预定处理的文档图像。在处理单元,从由读取单元读取的文档图像中提取出与提取单元提取的区域信息相对应的区域,并且执行预定处理(例如,OCR处理)。
即,通过使用用户常使用的应用软件,用户指定了要执行预定处理的区域。在执行预定处理时,对指定的区域可自动执行预定处理。因此,可以容易地执行对要执行诸如OCR处理之类的预定处理的区域的指定。
第一方面的图像处理装置还可具有:存储单元,用于与索引信息相关联地存储提取单元提取的区域信息,该索引信息与读取单元的读取源(读取对象部分)相关;获取单元,用于在读取单元读取文档图像时,从读取单元的读取源获取索引信息;和检索单元,用于从存储单元中检索与获取单元获取的索引信息相对应的区域信息,其中,处理单元从读取单元读取的文档图像中提取与检索单元检索到的区域信息相对应的区域,并执行预定处理。
区域指定用文档数据可包括由预定框和颜色(例如颜色标记等)中的至少一种指定的区域信息,或者可包括由预定应用软件指定的区域信息。
通过一种图像处理方法提供了本发明的第二方面,该方法包括:将经数字化的区域指定用文档数据变换为可处理的格式并输入该文档数据,所述区域指定用文档数据包括区域信息,该区域信息表示为了执行预定处理而预先指定的区域;从输入的区域指定用文档数据中提取区域信息;读取用于执行预定处理的文档图像;以及从读取的文档图像中提取与所提取的区域信息相对应的区域,并执行预定处理。
在第二方面中,在输入步骤中,将区域指定用文档数据变换为可在装置自身内处理的格式并输入,该区域指定用文档数据已被数字化(或电子化)并且包括区域信息,该区域信息表示为了执行预定处理而预先指定的区域。在提取步骤中,从在输入步骤中输入的区域指定用文档数据中提取所述区域信息。
例如,输入步骤可输入区域指定用文档数据,在该区域指定用文档数据中使用各种类型的应用软件指定用于执行预定处理的区域。该区域信息可由提取步骤提取。
然后,在读取步骤中,读取用于执行预定处理的文档图像。在处理步骤中,从在读取步骤中读取的文档图像中提取出与在提取步骤中提取的区域信息相对应的区域,并且执行预定处理(例如,OCR处理)。
即,通过使用用户常使用的应用软件,用户指定了要执行预定处理的区域。在执行预定处理时,对指定的区域可自动执行预定处理。因此,可以容易地执行对要执行诸如OCR处理之类的预定处理的区域的指定。
第二方面的图像处理方法还可包括以下步骤:存储步骤,用于与索引信息相关联地存储在提取步骤中提取的区域信息,该索引信息与在读取步骤的读取源相关;获取步骤,用于在读取步骤中读取文档图像时,从读取步骤的读取源获取索引信息;和检索步骤,用于从在存储步骤中存储的区域信息之中检索与在获取步骤中获取的索引信息相对应的区域信息。处理步骤可从在读取步骤中读取的文档图像中提取与在检索步骤中检索到的区域信息相对应的区域,并可执行预定处理。
区域指定用文档数据可包括由预定框和颜色中的至少一种指定的区域信息,或者可包括由预定应用软件指定的区域信息。
作为第三方面,本发明提供一种存储图像处理程序的存储介质,该图像处理程序使计算机执行上述图像处理方法的各步骤。
如上所述,根据本发明,可以容易地执行对要经过OCR处理的区域的指定。
Claims (8)
1、一种图像处理装置,其包括:
接收单元,其接收包括区域信息的区域指定用文档数据并将所述文档数据变换为能够由所述图像处理装置处理的格式,所述区域信息表示文档数据的区域,所述区域是所述图像处理装置的处理目标;
提取单元,其从所述区域指定用文档数据中提取区域信息;
读取单元,其读取文档图像;
处理单元,其从读取单元读取的文档图像中提取与提取单元提取的区域信息相对应的区域,并对文档图像的所述区域执行处理;
存储单元,其与索引信息相关联地存储提取单元提取的区域信息;
获取单元,其在读取单元读取文档图像时获取索引信息;和
检索单元,其从存储单元中检索与获取单元获取的索引信息相对应的区域信息,
其中,处理单元从读取单元读取的文档图像中提取与检索单元检索到的区域信息相对应的区域,并执行所述处理。
2、如权利要求1所述的图像处理装置,其中,所述区域指定用文档数据包括由框和颜色中的至少一种指定的区域信息。
3、如权利要求1所述的图像处理装置,其中,所述区域指定用文档数据包括由应用软件指定的区域信息。
4、如权利要求1所述的图像处理装置,其中,所述图像处理装置的处理包括光学字符识别处理。
5、一种图像处理方法,其包括以下步骤:
接收包括区域信息的区域指定用文档数据,所述区域信息表示文档数据的区域,所述区域是预定处理的目标;
将所述文档数据变换为可处理的格式;
从所述区域指定用文档数据中提取区域信息;
读取文档图像;
从读取的文档图像中提取与提取的区域信息相对应的区域;以及
对文档数据的所述区域执行所述预定处理;
该图像处理方法还包括以下步骤:
当读取文档图像时获取索引信息;
与所述索引信息相关联地存储所提取的区域信息;以及
从存储的区域信息之中检索与所述索引信息相对应的区域信息,
其中,所述预定处理包括从读取的文档图像中提取与检索到的区域信息相对应的区域的步骤。
6、如权利要求5所述的图像处理方法,其中,所述区域指定用文档数据包括由框和颜色中的至少一种指定的区域信息。
7、如权利要求5所述的图像处理方法,其中,所述区域指定用文档数据包括由应用软件指定的区域信息。
8、如权利要求5所述的图像处理方法,其中,所述预定处理包括光学字符识别处理。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005337308 | 2005-11-22 | ||
JP2005337308A JP2007141159A (ja) | 2005-11-22 | 2005-11-22 | 画像処理装置、画像処理方法、及び画像処理プログラム |
JP2005-337308 | 2005-11-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1971585A CN1971585A (zh) | 2007-05-30 |
CN100430957C true CN100430957C (zh) | 2008-11-05 |
Family
ID=38053608
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2006101002692A Expired - Fee Related CN100430957C (zh) | 2005-11-22 | 2006-07-06 | 图像处理装置、方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20070116363A1 (zh) |
JP (1) | JP2007141159A (zh) |
CN (1) | CN100430957C (zh) |
AU (1) | AU2006235826B2 (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080002084A (ko) * | 2006-06-30 | 2008-01-04 | 삼성전자주식회사 | 광학 문자 판독을 위한 시스템 및 광학 문자 판독방법 |
JP4970301B2 (ja) | 2008-02-08 | 2012-07-04 | シャープ株式会社 | 画像処理方法、画像処理装置、画像読取装置、画像形成装置、画像処理システム、プログラムおよび記録媒体 |
CN102576409A (zh) * | 2009-09-17 | 2012-07-11 | 日本电气株式会社 | 图像处理设备、图像处理方法、分类器和程序 |
WO2013190479A2 (en) * | 2012-06-19 | 2013-12-27 | Lau Tak Wai | Composite device and application process and apparatus thereof |
JP2014067303A (ja) * | 2012-09-26 | 2014-04-17 | Toshiba Corp | 文字認識装置、方法およびプログラム |
CN103121324B (zh) * | 2013-02-06 | 2015-09-16 | 心医国际数字医疗系统(大连)有限公司 | 一种医疗影像集中打印的系统 |
JP6129759B2 (ja) * | 2014-02-03 | 2017-05-17 | 満男 江口 | Simd型超並列演算処理装置向け超解像処理方法、装置、プログラム及び記憶媒体 |
JP2017151493A (ja) * | 2016-02-22 | 2017-08-31 | 富士ゼロックス株式会社 | 画像処理装置、画像読み取り装置及びプログラム |
US10423828B2 (en) * | 2017-12-15 | 2019-09-24 | Adobe Inc. | Using deep learning techniques to determine the contextual reading order in a form document |
US20200104586A1 (en) * | 2018-09-28 | 2020-04-02 | Konica Minolta Laboratory U.S.A., Inc. | Method and system for manual editing of character recognition results |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07168910A (ja) * | 1993-10-19 | 1995-07-04 | N T T Data Tsushin Kk | 文書レイアウト解析装置及び文書フォ−マット識別装置 |
JPH08221510A (ja) * | 1995-02-16 | 1996-08-30 | Toshiba Corp | 帳票文書処理装置および帳票文書処理方法 |
CN1189905A (zh) * | 1996-05-01 | 1998-08-05 | 卡西欧计算机株式会社 | 文本输出设备 |
CN1550971A (zh) * | 2003-05-20 | 2004-12-01 | ������������ʽ���� | 图像处理装置及其控制方法、程序 |
JP2004341656A (ja) * | 2003-05-14 | 2004-12-02 | Fujitsu Ltd | 画像処理装置および画像処理プログラム |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5048109A (en) * | 1989-12-08 | 1991-09-10 | Xerox Corporation | Detection of highlighted regions |
JPH0844827A (ja) * | 1994-07-27 | 1996-02-16 | Ricoh Co Ltd | デジタル複写機 |
DE19744743A1 (de) * | 1997-10-10 | 1999-04-15 | Daimler Chrysler Ag | Verfahren zur automatischen Datenerfassung und Archivierung |
GB9809679D0 (en) * | 1998-05-06 | 1998-07-01 | Xerox Corp | Portable text capturing method and device therefor |
JP4185699B2 (ja) * | 2002-04-12 | 2008-11-26 | 日立オムロンターミナルソリューションズ株式会社 | 帳票読み取りシステム、帳票読み取り方法及びそのためのプログラム |
JP4047090B2 (ja) * | 2002-07-31 | 2008-02-13 | キヤノン株式会社 | 画像処理方法及び画像処理装置 |
US20050196070A1 (en) * | 2003-02-28 | 2005-09-08 | Fujitsu Limited | Image combine apparatus and image combining method |
JP4322169B2 (ja) * | 2003-07-16 | 2009-08-26 | 株式会社リコー | 文書処理システム、文書処理方法、文書処理プログラム |
JP4574313B2 (ja) * | 2004-10-04 | 2010-11-04 | キヤノン株式会社 | 画像処理装置および方法 |
JP4443443B2 (ja) * | 2005-03-04 | 2010-03-31 | 富士通株式会社 | 文書画像レイアウト解析プログラム、文書画像レイアウト解析装置、および文書画像レイアウト解析方法 |
-
2005
- 2005-11-22 JP JP2005337308A patent/JP2007141159A/ja active Pending
-
2006
- 2006-06-08 US US11/448,943 patent/US20070116363A1/en not_active Abandoned
- 2006-07-06 CN CNB2006101002692A patent/CN100430957C/zh not_active Expired - Fee Related
- 2006-11-02 AU AU2006235826A patent/AU2006235826B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07168910A (ja) * | 1993-10-19 | 1995-07-04 | N T T Data Tsushin Kk | 文書レイアウト解析装置及び文書フォ−マット識別装置 |
JPH08221510A (ja) * | 1995-02-16 | 1996-08-30 | Toshiba Corp | 帳票文書処理装置および帳票文書処理方法 |
CN1189905A (zh) * | 1996-05-01 | 1998-08-05 | 卡西欧计算机株式会社 | 文本输出设备 |
JP2004341656A (ja) * | 2003-05-14 | 2004-12-02 | Fujitsu Ltd | 画像処理装置および画像処理プログラム |
CN1550971A (zh) * | 2003-05-20 | 2004-12-01 | ������������ʽ���� | 图像处理装置及其控制方法、程序 |
Also Published As
Publication number | Publication date |
---|---|
AU2006235826B2 (en) | 2010-01-28 |
AU2006235826A1 (en) | 2007-06-07 |
JP2007141159A (ja) | 2007-06-07 |
US20070116363A1 (en) | 2007-05-24 |
CN1971585A (zh) | 2007-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100430957C (zh) | 图像处理装置、方法 | |
JP4350414B2 (ja) | 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム | |
EP0774729B1 (en) | Character recognizing and translating system | |
JP4533273B2 (ja) | 画像処理装置及び画像処理方法、プログラム | |
US7787712B2 (en) | Electronic document creating apparatus | |
JP5223284B2 (ja) | 情報検索装置、方法およびプログラム | |
JP4366108B2 (ja) | 文書検索装置、文書検索方法及びコンピュータプログラム | |
EP1583348B1 (en) | Check boxes for identifying and processing stored documents | |
US8107727B2 (en) | Document processing apparatus, document processing method, and computer program product | |
US5950213A (en) | Input sheet creating and processing system | |
US20080147687A1 (en) | Information Management System and Document Information Management Method | |
EP1684198A2 (en) | Digital photo managing apparatus and method, and computer recording medium storing program for executing the method | |
JP4261988B2 (ja) | 画像処理装置及び方法 | |
JP3673615B2 (ja) | 画像処理装置及びその制御方法 | |
US7844138B2 (en) | History control apparatus | |
US6222644B1 (en) | Method for scanning small documents by using a card reader kit | |
CN110941947A (zh) | 一种文档编辑的方法、装置、计算机存储介质及终端 | |
JP2005149323A (ja) | 画像処理システム及び画像処理装置並びに画像処理方法 | |
JP4823049B2 (ja) | 文書画像検索装置及びプログラム | |
JP6281739B2 (ja) | 処理装置及びプログラム | |
JP2007087021A (ja) | 紙文書の電子文書化装置,紙文書の電子文書化方法および紙文書の電子文書化用プログラム | |
JP5223328B2 (ja) | 情報管理装置及び情報管理方法ならびにそのプログラム | |
JP2007048057A (ja) | 画像処理装置 | |
JP2007241473A (ja) | 情報処理装置、情報処理方法、プログラム、記憶媒体 | |
JP4822882B2 (ja) | 情報処理装置、情報処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20081105 Termination date: 20170706 |
|
CF01 | Termination of patent right due to non-payment of annual fee |