CN101930546B - 图像处理装置和图像处理方法 - Google Patents

图像处理装置和图像处理方法 Download PDF

Info

Publication number
CN101930546B
CN101930546B CN2010100048036A CN201010004803A CN101930546B CN 101930546 B CN101930546 B CN 101930546B CN 2010100048036 A CN2010100048036 A CN 2010100048036A CN 201010004803 A CN201010004803 A CN 201010004803A CN 101930546 B CN101930546 B CN 101930546B
Authority
CN
China
Prior art keywords
page
view data
character
image processing
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2010100048036A
Other languages
English (en)
Other versions
CN101930546A (zh
Inventor
榎本尚之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of CN101930546A publication Critical patent/CN101930546A/zh
Application granted granted Critical
Publication of CN101930546B publication Critical patent/CN101930546B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Facsimiles In General (AREA)
  • Character Discrimination (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明涉及图像处理装置和图像处理方法。该图像处理装置包括:获取单元,其获取表示包括多页的文档的图像数据;提取单元,其从所获取的图像数据中,提取作为所述多页中的至少一页的第一页中的字符区域;以及输出单元,其将所提取的字符区域内的第一部分图像数据与不同于所述第一页的第二页的所获取图像数据相关联地输出,所述第二页是由于具有与所述第一页中的所提取字符区域相对应的字符区域而被确定的。

Description

图像处理装置和图像处理方法
技术领域
本发明涉及图像处理装置和图像处理方法。
背景技术
诸如账簿和费用表的手写项目的账务表单包括由诸如无碳纸张的压敏纸张构成的那些账务表单。这些账务表单称作“双重凭单”,由层叠在一起的多页压敏纸张构成。当利用钢笔、圆珠笔等等在双重凭单上书写字符时,来自笔的压力也施加到层叠在进行书写的页之下的页,由此输入的字符是双份的。利用双重凭单可以容易地准备原始文档和副本,但是复制在副本上的字符可能是或变得模糊不清。
公开了当利用扫描仪读取多页文档并读取输入的细节时对页面指定恰当格式的技术。JP-A-2000-182055公开一种基于识别出的布局确定获取后继布局的方法的技术。JP-A-2005-115573公开了如下的技术:计算多页分类账单图像的每页的特征量,并且对多个登记的分类账单的每页的相应特征量进行比较,以基于针对每个登记的分类账单计算出的相似度来确定与分类账单图像对应的登记分类账单。JP-A-11-7493公开了如下的技术:当读取多页文档并且实施打印字符识别时,应用从第一页提取的信息以简化对第二页和后继页上的字符的提取。
发明内容
本发明的目的在于使得多页之一的图像中包含的字符图像可用于处理其它页。
本发明的第一方面提供了一种图像处理装置,该图像处理装置包括:获取单元,其获取表示包括多页的文档的图像数据;提取单元,其从所获取的图像数据中,提取作为所述多页中的至少一页的第一页中的字符区域;以及输出单元,其将所提取的字符区域内的第一部分图像数据与不同于所述第一页的第二页的所获取图像数据相关联地输出,所述第二页是由于具有与所述第一页内的所提取字符区域对应的字符区域而被确定的。
本发明的第二方面提供了根据第一方面的图像处理装置,其中,所述输出单元输出如下的字符信息:所述字符信息表示通过应用到所述第一部分图像数据的字符识别处理而产生的字符,并且与获取的所述第二页的图像数据相关联。
本发明的第三方面提供了根据第二方面的图像处理装置,其中,所述获取单元获取按特定分辨率读取的所述第一页的第一图像数据、以及按低于所述特定分辨率的分辨率读取的不同于所述第一页的页的第二图像数据。
本发明的第四方面提供了根据第一方面的图像处理装置,其中,所述获取单元获取按特定色调读取的所述第一页的第一图像数据、以及按高于所述特定色调的色调读取的不同于所述第一页的页的第二图像数据。
本发明的第五方面提供了根据第一方面的图像处理装置,其中,所述输出单元将所述第一部分图像数据与所述第二页的所获取图像数据相关联地输出到针对所述第一页确定的输出目的地。
本发明的第六方面提供了根据第一方面的图像处理装置,该图像处理装置还包括:存储器,其存储有表示多种类型的页的格式的格式信息;以及识别单元,其对所获取的图像数据进行分析,确定由该图像数据表示的页的格式的格式信息,将该格式信息与存储在所述存储器中的格式信息进行比较,并且识别所述页的格式,并且其中,所述提取单元从所获取的图像数据中提取针对识别出的格式而确定的字符区域。
本发明的第七方面提供了根据第一方面的图像处理装置,其中,所述提取单元从所获取的图像数据中提取针对所述第一页确定的字符区域。
本发明的第八方面提供了根据第一方面的图像处理装置,其中,所述输出单元将所述第一部分图像数据与所述第二页中的预定区域内的第二部分图像数据相关联地输出。
本发明的第九方面提供了根据第一方面的图像处理装置,其中,所述输出单元输出所述第一部分图像数据,所述第一部分图像数据替代所述第二页中的与所述第一页的所提取字符区域相对应的字符区域内的第三部分图像数据。
本发明的第十方面提供了一种图像处理方法,该图像处理方法包括以下步骤:获取表示包括多页的文档的图像数据;从所获取的图像数据中,提取作为所述多页中的至少一页的第一页中的字符区域;并且将所提取的字符区域内的第一部分图像数据与不同于所述第一页的第二页的所获取图像数据相关联地输出,所述第二页是由于具有与所述第一页中的所提取字符区域对应的字符区域而被确定的。
根据本发明的第一方面,可以使得多页中的任一页的图像中包含的字符图像能够用于处理其它页。
根据本发明的第二方面,可以使得通过基于多页中的任一页的图像中包含的字符图像执行字符识别处理而获得的字符信息能够用于处理其它页。
根据本发明的第三方面,与按用于读取其它页的分辨率来读取用于执行字符识别处理的字符图像的处理相比较,能够以更高的精度来执行字符识别。
根据本发明的第四方面,能够减小多页中的任一页的图像中包含的字符图像的数据量。
根据本发明的第五方面,可以使得多页中的任一页的图像中包含的字符图像能够用于处理其它页。
根据本发明的第六方面,能够基于页的图像来识别页的格式。
根据本发明的第七方面,可以使得多页中的任一页的图像内的区域(其中,该区域是根据这个页来确定的)中包含的字符图像能够用于处理其它页。
根据本发明的第八方面,可以将多页中的任一页的图像中包含的字符图像与另一页的图像数据内的预定区域中包含的图像数据相关联,并且使其可以使用。
根据本发明的第九方面,可以使得多页中的任一页的图像中包含的字符图像可用于替代另一页的图像内的区域中包含的图像,其中所述区域对应于字符图像的位置。
根据本发明的第十方面,可以使得多页中的任一页的图像中包含的字符图像可用于处理其它页。
附图说明
将参照附图详细描述本发明的示例性实施方式。
图1示出了图像处理系统的整体结构;
图2是示出图像处理装置的整体结构的框图;
图3是示出了存储在存储器中的格式信息的结构的图;
图4是示出了要由图像处理装置读取的账务表单的第一页的示例的图;
图5是示出了账务表单的第二页的示例的图;
图6是示出了账务表单的第三页的示例的图;
图7是用于说明表示记录区域的位置的记录区域位置信息的定义的图;以及
图8是示出在图像处理装置上读取账务表单的一系列操作的流程图。
具体实施方式
1、定义
下面是对术语的说明。
“格式”是指表示由在账务表单上绘制的分格线、包围线等等形成的区域的排列和位置的账务表单的预定构成。在这些区域中,例如,通过利用写入工具(例如,笔)输入字符,或者通过应用个人图章而形成印章。
“格式信息”是指表示账务表单的格式的信息和相关信息,并且包含表示上述区域的位置等等的数值、表示各个区域的用途的标签、以及各页的区域的使用关系。
“记录区域”是指由格式信息定义并且在其中输入字符的区域。
2.结构
下面描述图像处理系统9(本发明的示例性实施方式)的结构。
2-1.整体结构
图1是示出了图像处理系统9的整体结构的图。图像处理装置1经由局域网3和通信网4(其为互联网等等)与外部处理装置2a、2b、2c(在下文中,当不需要对这些装置进行区分时,总称为“外部装置2”)交换信息。
2-2.图像处理装置的结构
图2是示出图像处理装置1的整体结构的框图。CPU(中央处理单元)11读取并执行存储在ROM(只读存储器)12中的引导程序和存储在存储器14中的计算机程序以控制图像处理装置1的每个部分。ROM 12是由半导体元件等等构成的只读非易失性存储装置。ROM 12存储有用于将存储在存储器14中的OS(操作系统)加载到RAM(随机存取存储器)13上的引导程序、以及BIOS(基本输入/输出系统)等。RAM 13用作当CPU 11执行程序时的工作区域。存储器14是非易失性存储装置(例如,硬盘驱动器或EEPROM(电擦除可编程只读存储器)),并且存储读入CPU11的程序。存储器14还存储分类账页的格式信息141。将在以后描述格式信息141的细节。
操作部15包括用于输入各种指令的方向键、按钮等等,接受用户执行的操作,并且将与这些操作的细节对应的信号提供给CPU 11。显示器16例如包括液晶显示器,并且显示与来自CPU 11的指令对应的图像。图像获取部17是获取表示账务表单的图像数据的装置,例如以光学方式读取绘制在介质上的图像以产生与图像对应的图像数据的扫描仪。通信部18例如包括各种调制解调器和无线通信电路、串行接口和无线接口,并且与外部设备交换数据。
2-3.格式信息的结构
图3是示出了存储在存储器14中的格式信息141的结构的图。格式信息141存储每个账务表单名称(即,账务表单的名称)的信息。账务表单名称的列表1410列出了存储在格式信息141中的所有账务表单的账务表单名称,并且针对各个账务表单分离存储在格式信息141中的信息。针对在账务表单名称的列表1410中记载的每个账务表单名称,在区域定义表1411和发送目的地定义表1412中记载信息。在区域定义表1411中,针对每个记录区域,关联并记载有“记录区域识别信息”、“记录区域位置信息”和“附加目的地信息”,其中,“记录区域识别信息”是用于识别账务表单上的记录区域的信息,“记录区域位置信息”表示记录区域的位置,“附加目的地信息”表示基于该记录区域产生的字符信息附加到的页。记录区域识别信息是包含记录区域的编号以及表示记录区域的用途的标签名称的信息。记录区域位置信息是描述定义记录区域的矩形形状的两个x坐标和两个y坐标的信息。附加目的地信息针对账务表单的所有页,描述当定义了单个页作为指定页时字符信息的各项附加到的非指定页的页码。针对指定页的每个记录区域确定附加目的地信息。换言之,附加目的地是由于具有与指定页内的记录区域对应的记录区域而确定的。
发送目的地定义表1412针对每个页记载了“发送目的地信息”和“发送区域信息”,其中,“发送目的地信息”表示作为该页的图像数据发送到的发送目的地的外部处理装置2的识别信息,“发送区域信息”表示从页的图像数据发送到发送目的地的区域。
当如图3所示地在附加目的地信息中记载了“2,3”时,这表示记录区域的附加目的地是页2和3,当在附加目的地信息中记载了“-”时,这表示没有附加目的地。此外,在图3所示的示例中,账务表单的第一页的发送目的地例如是外部处理装置2a,这是由与页1对应的发送目的地信息中的描述“2A”表示的。发送目的地信息是识别根据页而确定的输出目的地的信息,具体地讲,包括外部处理装置的IP地址、与外部处理装置相关联的电子邮件地址等等。
在具体的条件下,通过对由字符识别处理使用标签名称从字符图像数据提取的字符串进行组合,从而产生字符信息。例如,当从表示目标记录区域的图像的图像数据中产生了字符串“富士一郎”并且与记录区域相关联地获取了标签名称“名称”时,图像处理装置1的CPU 11对这个信息进行组合以产生字符信息“<名称>富士一郎</名称>”。
2-4.分类账单的构成
图4是示出了由图像处理装置1读取的账务表单的第一页的示例的图。在页B1(其为账务表单的第一页)上设置了记录区域B111、B121、B122、记录区域B131、B132、B133、记录区域B141、B142、B143、以及记录区域B151。在记录区域B111、B121、B122中,分别输入了发送者的名称、地址和电话号码。在记录区域B131、B132、B133中,分别输入了配送目的地的名称、地址和电话号码。在记录区域B141、B142、B143中,分别输入了要进行配送的货物的名称、要进行配送的个数和进行配送所需的费用。在记录区域B 151中输入了确认方的签字。印章区域B110、B150是进行印记的区域并且分别叠加在记录区域B111、B151上。此外,在页显示区域B10中,预先显示了页码和账务表单的总页数。
图5是示出了账务表单的第二页的示例的图。在页B2(其为账务表单的第二页)上,在与记录区域B111、B121、B122、B131和B133分别对应的位置上设置有记录区域B211、B221、B222、B231、B232和B233。当用户在账务表单中进行输入时,页B1层叠在图中的用斜线表示的区域上面。页B1的与这些区域对应的区域由压敏纸形成。由此,在页B1上输入的字符复制在页B2上的这些区域中。此外,在页显示区域B20中,预先显示页码和账务表单的总页数。
图6是示出了账务表单的第三页的示例的图。在页B3(其为账务表单的第三页)上,在与记录区域B111、B141、B142、B143、B151分别对应的位置上设置了记录区域B311、B341、B342、B343、B351。当用户在账务表单中进行输入时,页B2层叠在页B3上面,页B1层叠在页B2上面。层叠在页B3上面的页B2的与图中的由斜线表示的区域对应的区域由压敏纸形成。因此,在页B1上输入的字符通过页B2复制到页B3的这些区域上。此外,在页显示区域B30中,预先显示页码和账务表单的总页数。
图7是用于说明表示记录区域的位置的记录区域位置信息的定义的图。图中的点O表示页的开始点,其为图像获取部17读取的页上的第一点。图7所示的箭头x表示图像获取部17的主扫描方向,而箭头y表示副扫描方向。图7所示的记录区域B111是矩形的,以点P1和P2作为对角。在主扫描方向上表示点P1的位置的x坐标是x1,而在副扫描方向上表示该位置的y坐标是y1。点P2的x坐标和y坐标分别是x2和y2。x1小于x2,y1小于y2。格式信息141基于与x1、x2、y1和y2对应的数值定义每个记录区域。
3.操作
接下来,将描述图像处理系统9的操作,具体是图像处理装置1的操作。
图8是示出用于在图像处理装置1上读取账务表单的一系列操作的流程图。账务表单名称列表1410的内容显示在显示器16上。当用户通过在观看显示器16上的显示内容的同时操作操作部15的方向键和按钮从而选择了要读取的账务表单的账务表单名称时,CPU 111获取并在RAM 13中存储所选择的账务表单名称(步骤S101)。接下来,当用户按顺序在图像获取部17的自动文档进给器(ADF)(未示出)上层叠安放账务表单(文档的示例)的多页并且操作操作部15以发出读取账务表单的指令时,图像获取部17在CPU 11的控制下逐页扫描账务表单页,并且将从每个扫描的页产生的图像数据与页码进行相关联并将它发送给CPU 11。CPU 11将获取的图像数据与页码相关联并且将它存储在RAM13中(步骤S102)。换言之,图像获取部17和CPU 11用作如下的获取单元:其获取表示包括多页的文档的图像数据。此外,由存储在RAM 13中的页码表示的页是指定页(第一页的示例),它是账务表单中包含的多页中的至少一页,存储在RAM 13中的图像数据是表示指定页的图像的图像数据。
CPU 11定位在步骤S101中从格式信息141的账务表单名称列表1410获取的账务表单名称,并指定与账务表单名称对应的区域定义表1411和发送目的地定义表1412。然后,CPU 11参照区域定义表1411的附加目的地信息字段,获取与图像数据的页码对应的各个记录区域的附加目的地信息,并且针对每个记录区域确定所获取的附加目的地信息是否是“-”(步骤S103)。如果确定了所获取的附加目的地信息是“-”(即,如果针对该记录区域没有定义附加目的地)(步骤S103:是),则CPU 11进入下一个步骤。另一方面,如果确定了所获取的附加目的地信息不是“-”(步骤S103:否),则CPU11从图像数据中提取由记录区域(字符区域的示例)的记录区域位置信息表示的矩形区域的数据,作为表示字符的字符图像数据(第一部分图像数据的示例)(步骤S104)。换言之,CPU 11用作如下的提取单元:其从由获取单元获取的图像数据中,提取作为多页中的一页的指定页中的字符区域。此外,如果区域定义表1411中的针对各页的各个记录区域而确定的附加目的地信息不是“-”,则由记录区域的记录区域位置信息表示的矩形区域的数据是针对指定页而确定的区域内包含的字符图像数据。换言之,在这种情况下,CPU 11用作如下的提取单元:其从表示指定页的图像的图像数据中,提取针对指定页而确定的区域中包含的字符图像数据。
然后,通过执行字符识别处理,CPU 11从提取的字符图像数据产生字符信息(步骤S 105)。换言之,所述字符信息是表示字符并且通过对由提取单元提取的字符图像数据执行字符识别处理而获得的字符信息。然后,CPU 11将产生的字符信息与指定页相关联,同时还将它与在附加目的地信息中表示的各个附加目的地页(即,不同于指定页的页)(第二页的示例)相关联以将其存储在RAM 13中(步骤S106)。
例如,当读取了名称为“配送表A”的账务表单的第一页时,由于与编号为“1”的记录区域相关联的附加目的地是“2,3”,所以CPU 11从与编号为“1”的记录区域对应的图4中的记录区域B111的字符图像数据产生字符串“富士一郎”,将该字符串与记录区域B111的标签名称“名称”进行组合,并且产生由字符串“<名称>富士一郎</名称>”构成的字符信息。然后,CPU 11将产生的字符信息与页2和页3二者相关联并且将它存储在RAM 13中。
在针对由图像获取部17读取的页的所有记录区域都执行了以上所有处理(即,步骤S103到步骤S106的处理)以后,CPU 11参照发送目的地定义表1412并且获取针对该页定义的发送区域信息(步骤S107)。然后,CPU 11从图像数据中提取具有发送区域信息中表示的号码的记录区域的图像数据,作为部分图像数据(第二部分图像数据的示例)并且将它存储在RAM 13中(步骤S108)。换言之,部分图像数据是特定页的图像数据中的预定区域内的图像数据。
接下来,CPU 11确定该页是否具有在步骤S106中与该页相关联的任何字符信息(步骤S109),如果确定了存在相关联的字符信息(步骤S 109:是),则它将所述字符信息附加到部分图像数据(步骤S 110)并且处理前进步骤S111。另一方面,如果CPU 111确定没有相关联的字符信息(步骤S109:否),则CPU 11使得处理直接前进到步骤S111。
在步骤S111中,CPU 11参照发送目的地定义表1412,获取针对该页定义的发送目的地信息(步骤S111),并且将部分图像数据发送到由发送目的地信息表示的发送目的地(步骤S112)。由此,CPU 11用作如下的输出单元:其将由提取单元提取的字符图像数据与附加目的地页的图像数据相关联,并将此数据输出到针对各个附加目的地页而确定的输出目的地。
此外,这时,如果向部分图像数据附加了字符信息,则也将该字符信息与部分图像数据一起发送到发送目的地。具体来说,如果字符信息已经与在附加目的地信息中表示的附加目的地页(即,不同于指定页的页)相关联,则部分图像数据是不同于指定页的页的图像数据内的预定区域中包含的图像数据。由此,CPU 11用作输出单元,所述输出单元通过将如下的字符信息与附加目的地页的图像数据中的预定区域内的图像数据相关联从而输出该字符信息,所述字符信息表示通过对由提取单元提取的字符图像数据执行字符识别处理而确定的字符,其中所述预定区域是根据指定页总的字符图像数据的位置而确定的。
然后,CPU 11确定在账务表单中是否存在后继页(步骤S113),如果确定存在后继页(步骤S113:是),则它将处理返回到步骤S102。另一方面,如果确定没有后继页(步骤S113:否),则CPU 11结束处理。
例如,在针对第一页定义的发送区域信息中,记载了记录区域号“1,10”。它们例如对应于图4所示的记录区域B111、B151。记录区域B111、B151是与印章区域B110、B150叠加的区域,印章区域B110、B150是如上所述地进行印记的区域。在字符识别处理中不识别印章区域的印记,由此,不能基于在字符识别处理中获得的字符信息来确定印记。与作为字符识别结果的字符信息分开地,CPU 11将作为这些记录区域的图像数据的部分图像数据与各页相关联并存储,由此,通过所述部分图像数据来补偿从字符信息丢失的信息。
如上所述,图像处理系统9能够将表示字符并包含在多页中至少一页的图像中的字符图像数据与包含在其它页的图像中的部分图像数据相关联并且进行处理。与原始字符相比,例如由于笔压力的变化或者压敏纸张的灵敏度的变化,在双重凭单中复制的字符经常变得褪色或不清楚。当对这些褪色或不清楚的字符执行字符识别处理时,很有可能会错误地识别这些字符。在图像处理系统9中,例如当读取双重凭单时,包含复制字符的页的部分图像数据(其中,表示原始字符的字符信息已经附加到此数据)输出到对页进行处理的外部处理装置2。由此,通过对复制字符重新利用针对原始字符执行的第一字符识别处理的结果,图像处理系统9能够减小进行处理所需的时间和资源。此外,通过针对比复制字符清楚的原始字符执行字符识别处理,图像处理系统9能够减小字符错误识别的情况。
此外,在上述的示例性实施方式中,在记录区域进行印记。然而,本发明不限于此示例性实施方式。例如,可以在记录区域进行签名或拇指印以替代印记。在这种情况下,上述的印章区域叠加在记录区域上,作为签名区域或拇指印区域。
4.变型
上面描述了示例性实施方式,但是可以如下修改这个示例性实施方式的细节。此外,还可以组合下面的变型。
(1)变型例1
在上述的示例性实施方式中,当CPU 11确定了存在已经与指定页相关联的字符信息时,它将该字符信息附加该页的部分图像数据,但是CPU11可以附加字符图像数据以替代字符信息。在这种情况下,可以在发送目的地执行字符识别处理。例如,当外部处理装置2接收到附加于部分图像数据并从图形处理装置1发送的字符图像数据时,外部处理装置2的CPU可以通过对字符图像数据执行字符识别处理来产生字符信息。换言之,CPU 11可以用作如下的输出单元:其将由提取单元提取的字符图像数据与附加目的地页的图像数据相关联并输出,其中,所述图像数据是根据指定页中的图像数据的位置而确定的。
此外,在上述的示例性实施方式中,附加目的地信息仅仅针对一页包含不同于“-”的描述(即,仅仅存在一个指定页),但是第二和后继页的附加目的地信息可以包含不同于“-”的记载。在这种情况下,也可以将当第一页是指定页时被定义为非指定页的页用作指定页。
(2)变型例2
在上述的示例性实施方式中,当CPU 11确定了存在已经与不同于指定页的页的部分图像数据相关联的字符信息时,它将该字符信息附加到该部分图像数据,但是它也可以将该字符信息直接附加到不同于指定页的页的图像数据。换言之,CPU 11可以用作如下的输出单元:其将由提取单元提取的字符图像数据与附加目的地页的图像数据相关联并输出,其中所述图像数据是根据指定页中的字符图像数据的位置而确定的。
(3)变型例3
图像获取部17可以用不同的分辨率来读取指定页和非指定页的图像数据。由于当进行字符识别处理的图像数据的分辨率较高时字符识别变得更加准确,所以与以低分辨率读取的图像数据相比,以高分辨率读取的图像数据更加适于用作字符图像数据。由此,在这种情况下,在CPU 11的控制之下,图像获取部17以比非指定页更高的分辨率来读取从其提取字符图像数据的指定页,以产生图像数据。
(4)变型例4
此外,图像获取部17可以用不同的色调来读取指定页和非指定页的图像数据。例如,即使对于以黑和白两种色调表示的黑白图像,也可以执行字符识别处理。通过将图像数据设置为低色调,可以减小通信负载并且可以节省存储空间。另一方面,由于如上所述,使用部分图像数据来确认印记等等,所以高色调更适于进行确认,并且,例如,在色彩信息缺失的黑白图像的情况下,可能无法实现确认印记的目的。因此,在这种情况下,在CPU 11的控制下,图像获取部17以比非指定页低的色调来读取从其提取字符图像数据的指定页,以产生图像数据。
(5)变型例5
在上述的示例性实施方式中,发送目的地定义表1412记载了发送目的地信息(其为指定针对各页而确定的输出目的地的信息),但是可以不针对各页确定输出目的地。换言之,CPU 11可以将由提取单元提取的字符图像数据与不同于指定页的页的图像数据相关联并输出,其中所述图像数据是根据指定页中的字符图像数据的位置来确定的。
(6)变型例6
在上述的示例性实施方式中,CPU 11获取用户选择的账务表单名称并且识别获取的图像数据的格式,但是可以通过分析图像数据自身来自动识别获取的图像数据的格式。在这种情况下,存储器14存储有表示多种类型的页的格式的格式信息。换言之,存储器14是存储表示多种类型的页的格式的格式信息的格式信息存储器的示例。然后,当CPU 11从图像获取部17获取了图像数据时,它对获取的图像数据执行诸如标注处理的分析,并且基于分格线和其它线的位置和排列来获得图像数据的格式信息。CPU 11然后可以利用存储在存储器14中的格式的格式信息对获得的格式信息执行模式匹配处理等,以识别图像数据表示的页的格式。换言之,CPU11用作如下的格式识别单元:其对由图像数据获取单元获取的图像数据进行分析,获得表示由所述图像数据表示的页的格式的格式信息,将该格式信息与由格式信息存储器存储的格式信息进行比较,并且识别所述页的格式。此外,可以使用在预定区域中记载的细节来识别图像数据的各项的格式。具体地讲,例如,通过对在页显示区域B10、B20和B30中记载的细节进行分析,可以识别格式。
(7)变型例7
当组合上述的变型例1和变型例2时,CPU 11用作如下的输出单元:其将由提取单元提取的字符图像数据与不同于指定页的页的图像数据相关联并输出,其中所述图像数据是根据指定页中的字符图像数据的位置而确定的,但是CPU 11可以用从非指定页获得的与这个位置对应的区域中包含的图像数据(第三部分图像数据的示例)来替代指定页中的字符图像数据。换言之,CPU 11用作如下的输出单元:其输出提取单元提取的字符图像数据,替代与附加目的地页的图像数据中的字符图像数据的位置对应的区域内的图像数据。
(8)变型例8
在上述的示例性实施方式中,每当CPU11扫描单页时,它发送页的部分图像,但是它可以在扫描了作为一组的单个账务表单以后执行发送处理。
此外,在上述的示例性实施方式中,发送目的地定义表1412记载了外部处理装置2的识别信息作为发送目的地信息,但是发送目的地定义表1412可以记载存储器14中的多个划分存储区域中的每一个的识别信息作为发送目的地信息。多个划分存储区域中的每一个的识别信息例如可以是URL、文件路径或物理地址。在这种情况下,对于每个页,CPU 11将该页的图像数据和附加的字符信息存储在由发送目的地定义表1412的发送目的地信息中记载的识别信息表示的各个存储区域中。然后,图像处理装置1可以配置用于从各个存储区域获取图像数据的各个外部处理装置2的授权设置。在这种情况下,外部处理装置2的识别信息可以与存储区域中的识别信息相关联。
(9)变型例9
由图像处理装置1的CPU 11执行的各个程序可以存储并设置在计算机可读存储介质上,例如,诸如磁带或磁盘的磁记录介质、诸如光盘的光记录介质、磁光介质或半导体存储器。此外,还可以通过例如互联网的网络下载这些程序。此外,执行这些控制操作的控制器可以是不同于CPU的各种装置中的任何一个,例如专用处理器。
此外,对于存储器14、操作部15、显示器16和图像获取部17,可以使用通过通信部18连接的外部设备。在这种情况下,CPU 11可以通过通信部18控制各个外部设备。
对本发明示例性实施方式的前述描述是为了例示和描述的目的而提供的。其并非旨在穷举或者将本发明限于所公开的确切形式。显然,许多变型和修改对于本领域技术人员是显而易见的。选择并描述这些示例性实施方式是为了最好地说明本发明的原理及其实际应用,从而使得本领域其他技术人员能够理解本发明的适用于所构想特定用途的各种实施方式和各种变型。旨在由所附权利要求书及其等同物来限定本发明的范围。

Claims (10)

1.一种图像处理装置,该图像处理装置包括:
获取单元,其获取表示包括多页的文档的图像数据;
提取单元,其从所获取的图像数据中,提取作为所述多页中的至少一页的第一页中的字符区域;以及
输出单元,其将第二页的所获取图像数据和所提取的字符区域内的第一部分图像数据发送到发送目的地,
其中,所述第二页不同于所述第一页,所述第二页具有与所述第一页中的所提取字符区域相对应的字符区域,所述第二页是由压敏纸形成的纸张,在所提取的字符区域中输入的字符复制在所述第二页的所述字符区域中。
2.根据权利要求1的图像处理装置,其中,所述输出单元发送如下的字符信息:所述字符信息表示通过应用于所述第一部分图像数据的字符识别处理而产生的字符,并且与所述第二页的所获取图像数据相关联。
3.根据权利要求2的图像处理装置,其中,所述获取单元获取按特定分辨率读取的所述第一页的第一图像数据、以及按低于所述特定分辨率的分辨率读取的不同于所述第一页的页的第二图像数据。
4.根据权利要求1的图像处理装置,其中,所述获取单元获取按特定色调读取的所述第一页的第一图像数据、以及按高于所述特定色调的色调读取的不同于所述第一页的页的第二图像数据。
5.根据权利要求1的图像处理装置,其中,所述输出单元将所述第一部分图像数据与所述第二页的所获取图像数据相关联地发送到针对所述第一页确定的输出目的地。
6.根据权利要求1的图像处理装置,该图像处理装置还包括:
存储器,其存储有表示多种类型的页的格式的格式信息;以及
识别单元,其对所获取的图像数据进行分析,确定由该图像数据表示的页的格式的格式信息,将该格式信息与存储在所述存储器中的格式信息进行比较,并且识别所述页的格式,
并且其中,
所述提取单元从所获取的图像数据中提取针对识别出的格式而确定的字符区域。
7.根据权利要求1的图像处理装置,其中,所述提取单元从所获取的图像数据中提取针对所述第一页确定的字符区域。
8.根据权利要求1的图像处理装置,其中,所述输出单元将所述第一部分图像数据与所述第二页中的预定区域内的第二部分图像数据相关联地发送。
9.根据权利要求1的图像处理装置,其中,所述输出单元发送所述第一部分图像数据,所述第一部分图像数据替代所述第二页中的与所述第一页的所提取字符区域相对应的所述字符区域内的第三部分图像数据。
10.一种图像处理方法,该图像处理方法包括以下步骤:
获取表示包括多页的文档的图像数据;
从所获取的图像数据中,提取作为所述多页中的至少一页的第一页中的字符区域;以及
将第二页的所获取图像数据和所提取的字符区域内的第一部分图像数据发送到发送目的地,
其中,所述第二页不同于所述第一页,所述第二页具有与所述第一页中的所提取字符区域相对应的字符区域,所述第二页是由压敏纸形成的纸张,在所提取的字符区域中输入的字符复制在所述第二页的所述字符区域中。
CN2010100048036A 2009-06-24 2010-01-18 图像处理装置和图像处理方法 Expired - Fee Related CN101930546B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009-150302 2009-06-24
JP2009150302A JP2011008446A (ja) 2009-06-24 2009-06-24 画像処理装置

Publications (2)

Publication Number Publication Date
CN101930546A CN101930546A (zh) 2010-12-29
CN101930546B true CN101930546B (zh) 2013-06-05

Family

ID=43369711

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010100048036A Expired - Fee Related CN101930546B (zh) 2009-06-24 2010-01-18 图像处理装置和图像处理方法

Country Status (3)

Country Link
US (1) US8345305B2 (zh)
JP (1) JP2011008446A (zh)
CN (1) CN101930546B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5408155B2 (ja) * 2011-02-23 2014-02-05 ブラザー工業株式会社 制御装置及びプログラム
JP6122357B2 (ja) * 2013-06-28 2017-04-26 キヤノン株式会社 情報処理装置、文書合成システム、情報処理方法、及びプログラム
JP2016091196A (ja) * 2014-10-31 2016-05-23 株式会社リコー 画像形成装置、画像形成方法、プログラム、および翻訳システム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH117493A (ja) 1997-06-16 1999-01-12 Sharp Corp 文字認識処理装置
JP3668026B2 (ja) 1998-12-18 2005-07-06 シャープ株式会社 出版物電子化処理装置
US7397578B2 (en) * 2003-03-12 2008-07-08 Sharp Laboratories Of America, Inc. Thumbnail audit trail in MFP and print processor/spooler-based print-job auditing
JP4154308B2 (ja) 2003-10-06 2008-09-24 キヤノン株式会社 帳票認識装置、帳票認識方法、プログラムおよび記憶媒体
JP4789516B2 (ja) * 2005-06-14 2011-10-12 キヤノン株式会社 文書変換装置、文書変換方法並びに記憶媒体
JP4533273B2 (ja) * 2005-08-09 2010-09-01 キヤノン株式会社 画像処理装置及び画像処理方法、プログラム
US20080246975A1 (en) * 2007-04-06 2008-10-09 Xerox Corporation Handwritten annotation recognition for copy jobs
JP5511450B2 (ja) * 2010-03-16 2014-06-04 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム

Also Published As

Publication number Publication date
US20100328685A1 (en) 2010-12-30
JP2011008446A (ja) 2011-01-13
CN101930546A (zh) 2010-12-29
US8345305B2 (en) 2013-01-01

Similar Documents

Publication Publication Date Title
JP4561474B2 (ja) 電子化文書保管システム
US8203748B2 (en) Image processing apparatus, control method therefor, and program
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
US7663776B2 (en) Document processing apparatus and method
US20110197121A1 (en) Effective system and method for visual document comparison using localized two-dimensional visual fingerprints
JP4572136B2 (ja) 文書管理方法
US8599309B2 (en) Method and system for identifying addressing data within a television presentation
US20070070473A1 (en) Image display device, image display method, computer program product, and image display system
CN101257554A (zh) 文档处理装置、文档处理系统和文档处理方法
CN102262616A (zh) 表单处理系统、ocr装置、表单制作装置
US8929686B2 (en) Method and system for deterministic document quality assurance
US20090067717A1 (en) Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program
CN101930546B (zh) 图像处理装置和图像处理方法
JP2001337994A (ja) サムネイル表示システムと方法およびその処理プログラムを記録した記録媒体
CN103258197A (zh) 图像处理装置及其控制方法
US8208766B2 (en) Method of selecting image, program and storage medium for the method, and image processing apparatus using the method
JP2007005950A (ja) 画像処理装置及びネットワークシステム
US20050162668A1 (en) Document administration apparatus, document administration method, storage medium storing computer-readable program, and program
CN113870387A (zh) 数据输出系统及其方法,图像处理系统及其方法
US20070214185A1 (en) Document management system, method and program therefor
EP1061460A2 (en) Partial image forming method and apparatus for filing documents
CN101206708A (zh) 图像处理装置及图像处理方法
JP5304546B2 (ja) 画像形成装置、画像合成方法およびプログラム
JP2005157928A (ja) スタンプ処理装置、電子承認システム、プログラム、及び記録媒体
JP2007087021A (ja) 紙文書の電子文書化装置,紙文書の電子文書化方法および紙文書の電子文書化用プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130605

Termination date: 20180118

CF01 Termination of patent right due to non-payment of annual fee