CN101561877B - 图像处理器及图像处理方法 - Google Patents

图像处理器及图像处理方法 Download PDF

Info

Publication number
CN101561877B
CN101561877B CN200910000468XA CN200910000468A CN101561877B CN 101561877 B CN101561877 B CN 101561877B CN 200910000468X A CN200910000468X A CN 200910000468XA CN 200910000468 A CN200910000468 A CN 200910000468A CN 101561877 B CN101561877 B CN 101561877B
Authority
CN
China
Prior art keywords
image
topography
order
area
subimage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200910000468XA
Other languages
English (en)
Other versions
CN101561877A (zh
Inventor
足利英昭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of CN101561877A publication Critical patent/CN101561877A/zh
Application granted granted Critical
Publication of CN101561877B publication Critical patent/CN101561877B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种图像处理器及图像处理方法。该图像处理器包括局部图像提取单元、定序单元和差异提取单元。所述局部图像提取单元从第一图像提取第一局部图像,并从第二图像提取第二局部图像。所述定序单元根据第一局部图像在第一图像中的位置来确定所提取的第一局部图像的顺序,并根据第二局部图像在第二图像中的位置来确定所提取的第二局部图像的顺序。并且差异提取单元根据第一局部图像的顺序和第二局部图像的顺序来将每个第一局部图像与相应的第二局部图像进行比较,并提取基于第一图像与第二图像之间的比较的差异。

Description

图像处理器及图像处理方法
技术领域
本发明涉及图像处理器及图像处理方法。
背景技术
存在这样的需要,即:例如在检测用户是否在使用纸张作为介质的文档上的笔迹中添加附言或在检查安全文档是否改变时,能够弄清楚文档的通过诸如增加或删除等而作出的修改部分。为了满足这种需要,执行这样的处理,即:用扫描仪来读取文本和纸质文档(要与文本相比较的文档,即可能添加附言的文档),并将两个图像互相比较以提取差异。
作为与此相关的技术,例如专利文献1(JP-A-2004-287682)披露了作为该发明的目的的一种修订图像提取装置,该修订图像提取装置能够防止差异处理之后不充分缩减(insufficient subtraction)处理的发生并且能够提高从修订图像中进行提取的精度。在该修订图像提取装置中,图像位置检测单元检测第一区域识别单元所识别的电子文档的原始图像中的每个区域与第二区域识别单元所识别的修订和叠加图像中的相应区域之间的位置偏移量,并且图像差异处理单元基于所检测到的位置偏移量来校正各个位置以执行差异处理。因此,即使当电子文档的原始图像与修订和叠加图像之间出现位置移动时,该位置移动也被校正以执行差异处理,从而防止差异处理之后不充分缩减的发生,并提高从修订图像中进行提取的精度。
此外,例如专利文献2(JP-A-2004-213230)披露了作为该发明的目的的一种修订提取装置和一种修订提取方法,当在电子文档及修订和叠加图像中执行提取处理时,该修订提取装置和修订提取方法能够抑制不存在修订信息的区域中的不充分缩减,从而实现更精确的提取处理。该修订提取装置包括区域划分单元、图像差异部分以及插值单元。该区域划分单元利用来自电子文档的原始图像和通过由诸如扫描仪等图像读取装置使纸张电子化而获得的图像的字符识别来将所需区域划分成小的区域。原始图像输出在该纸张上且在该纸张上叠加有手写校正。该划分单元判断每个小区域是否需要修订提取操作。该图像差异部分对被判定为需要差异计算的小区域执行差异计算。该图像插值部分对基于该差异计算来进行差异处理的图像执行插值处理。因此,提高了修订和提取处理的精度。
此外,例如专利文献3(JP-A-2004-341914)披露了作为该发明的目的的一种用于更新电子文档文件或图像文件的高效操作及该文件的存储区域的有效利用。在专利文献3中,披露了以下内容:图像扩张单元向通过将原始电子文档文件转换成图像而获得的图像数据(原始文档图像数据)的黑色像素进行扩张处理,校正对准过程中的误差,然后,局部区域划分单元分别划分通过由图像扫描仪来读取修订印刷品而获得的图像数据(修订图像数据)和原始文档图像数据,其后,矩形框提取部分获得矩形信息,矩形框比较-对准单元将图像数据彼此对准,逻辑计算单元对像素单元进行异或计算以提取差异信息,从而获得所提取的差异信息。并且通过存储原始文档图像数据及其差异信息而节省存储区域。
在现有技术中,需要将整个图像部分对准。此外,即使能够实现对准,当行间距或字符间距改变时,尽管其内容不变(例如字符不变),然而也无法方便地提取图像的差异。
本发明的目的是提供一种图像处理器及一种图像处理方法,其中,当比较多个图像时,不需要对准整个图像部分,并且即使局部图像的各个位置彼此不同,也能适当地提取两个图像之间的差异。
发明内容
[1]根据本发明的一个方面,一种图像处理器包括局部图像提取单元、定序单元和差异提取单元。所述局部图像提取单元从第一图像提取第一局部图像,并从第二图像提取第二局部图像。所述定序单元根据第一局部图像在第一图像中的各个位置来确定所提取的第一局部图像的顺序,并根据第二局部图像在第二图像中的各个位置来确定所提取的第二局部图像的顺序。并且所述差异提取单元根据第一局部图像的顺序和第二局部图像的顺序将每个第一局部图像与相应的第二局部图像进行比较,并提取基于第一图像与第二图像之间的比较的差异。
[2]根据第[1]项所描述的图像处理器,所述第一图像和所述第二图像分别可以具有多个页面。所述定序单元可以根据第一图像的各个页面的顺序在全部所述多个页面中确定第一局部图像的顺序。并且所述定序单元可以根据第二图像的各个页面的顺序在全部所述多个页面中确定第二局部图像的顺序。
[3]根据第[1]项或第[2]项所描述的图像处理器,可以利用第一局部图像的特征和相应的第二局部图像的特征来进行每次比较。并且可以根据由定序单元所确定的顺序来进行每次比较。
[4]根据本发明的另一方面,一种图像处理器包括存储单元、局部图像提取单元、定序单元以及差异提取单元。所述存储单元存储与第一图像中的第一局部图像有关的信息,其中,根据从第一图像提取的第一局部图像的各个位置来确定第一局部图像的顺序。所述局部图像提取单元从第二图像提取第二局部图像。所述定序单元根据第二局部图像在第二图像中的各个位置来确定所提取的第二局部图像的顺序。所述差异提取单元根据所存储的与第一局部图像有关的信息和第二局部图像的顺序来将每个第一局部图像与相应的第二局部图像进行比较,并提取基于第一图像与第二图像之间的比较的差异。
[5]根据第[4]项所描述的图像处理器,所述第一图像和所述第二图像分别可以具有多个页面。与第一局部图像有关的所述信息可以包括全部所述多个页面中所确定的顺序。所述定序单元可以根据第二图像的各个页面的顺序在全部所述多个页面中来确定第二局部图像的顺序。
[6]根据第[4]项或第[5]项所描述的图像处理器,所述信息可以包括每个第一局部图像的特征。可以利用所存储的每个第一局部图像的特征和每个第二局部图像的特征来进行每次比较。并且可以根据由存储单元所存储的第一局部图像的顺序和由定序单元所确定的第二局部图像的顺序来进行每次比较。
[7]根据第[1]项或第[4]项所描述的图像处理器,所述图像处理器还可以包括图像处理单元,该图像处理单元在被差异提取单元提取到差异的每个第一局部图像或每个第二局部图像的位置处将新的信息添加到第一图像和第二图像中的至少之一中。
[8]根据本发明的另一方面,一种图像处理方法包括:从第一图像提取第一局部图像;从第二图像提取第二局部图像;根据第一局部图像在第一图像中的各个位置来确定所提取的第一局部图像的顺序;根据第二局部图像在第二图像中的各个位置来确定所提取的第二局部图像的顺序;根据第一局部图像的顺序和第二局部图像的顺序来将每个第一局部图像与相应的第二局部图像进行比较;以及提取基于第一图像与第二之间的比较的差异。
[9]根据本发明的一个方面,一种图像处理方法包括:存储与第一图像中的第一局部图像有关的信息,其中,根据从第一图像提取的第一局部图像的各个位置来确定第一局部图像的顺序;从第二图像提取第二局部图像;根据第二局部图像在第二图像中的各个位置来确定所提取的第二局部图像的顺序;根据所存储的与第一局部图像有关的信息和第二局部图像的顺序来将每个第一局部图像与相应的第二局部图像进行比较;以及提取基于第一图像与第二图像之间的比较的差异。
根据第[1]项,当比较多个图像时,不需要对准整个图像部分,并且即使局部图像的各个位置彼此不同,也能够适当地提取两个图像之间的差异。
根据第[2]项,即使在具有多个页面的多个图像之间,也能够提取两个图像之间的差异。
根据第[3]项,可以比不具有本发明的结构的图像处理器更多地减少用于比较局部图像的处理量。
根据第[4]项,当比较多个图像时,不需要对准整个图像部分,并且即使局部图像的各个位置彼此不同,也能够适当地提取两个图像之间的差异。
根据第[5]项,即使在具有多个页面的多个图像之间,也能够提取两个图像之间的差异。
根据第[6]项,可以比不具有本发明的结构的图像处理器更多地减少用于比较局部图像的处理量。
根据第[7]项,两个图像之间的差异可以表现为不同于其他图像之间的差异。
根据第[8]项,当比较多个图像时,不需要对准整个图像部分,而且即使局部图像的各个位置彼此不同,也能够适当地提取两个图像之间的差异。
根据第[9]项,当比较多个图像时,不需要对准整个图像部分,而且即使局部图像的各个位置彼此不同,也能够适当地提取两个图像之间的差异。
附图说明
基于以下附图,对本发明的示例性实施例进行详细说明,其中:
图1是示例性实施例的结构实例的概念模块框图;
图2是根据示例性实施例的处理实例的流程图;
图3是示出根据示例性实施例的子图像的比对处理的实例的流程图;
图4是示出区域数据表的数据结构实例的说明图;
图5是示出子图像数据表的数据结构实例的说明图;
图6是示出根据示例性实施例的情况1的处理实例的说明图;
图7是示出根据示例性实施例的情况1的处理实例的说明图;
图8是示出根据示例性实施例的情况1的处理实例的说明图;
图9是示出根据示例性实施例的情况2的处理实例的说明图;
图10是示出根据示例性实施例的情况2的处理实例的说明图;
图11是示出根据示例性实施例的情况2的处理实例的说明图;
图12是示出根据示例性实施例的情况2的处理实例的说明图;
图13是示出根据示例性实施例的情况2的处理实例的说明图;
图14是示出根据示例性实施例的情况2的处理实例的说明图;
图15是示出根据示例性实施例的情况2的处理实例的说明图;以及
图16是用于实现示例性实施例的计算机的硬件结构实例的框图。
具体实施方式
现在,参照附图,在下面描述用于实现本发明的示例性实施例。
图1示出了本示例性实施例的结构实例的概念模块框图。
模块通常是指软件(计算机程序)、硬件等的在逻辑上可分离的部分。因此,本示例性实施例中的模块不仅是指计算机程序中的模块,而且是指硬件结构中的模块。因此,本示例性实施例还说明计算机程序、系统以及方法。在这种情况下,为了方便说明,使用“存储”、“使……存储”以及与其等同的用语。当本示例性实施例是计算机程序时,这些用语表示使存储装置进行存储或控制存储装置进行存储的意义。此外,模块基本上在一对一的基础上对应于功能。然而,总的来说,一个模块可以由一个程序形成,或者多个模块可以由一个程序形成。相反,一个模块可以由多个程序形成。此外,多个模块可由一台计算机来执行,或者在分布式或并行环境下,一个模块可以有多台计算机来执行。可以在一个模块中包括其他模块。在下文中,“连接”包括逻辑连接(数据、指令的发送和接收、数据之间的引用关系等)以及物理连接。
此外,系统或装置不仅包括通过用诸如网络等通信单元来连接(包括在一对一的基础上的通信连接)多台计算机、多个硬件、多个装置等而获得的结构,而且包括由一台计算机、一个硬件、一个装置等实现的结构。所述“装置”和“系统”被用作具有相同意义的用语。此外,规定的用语不仅包括预定的意义,而且包括取决于当时状况和状态的意义或取决于一直持续到当时的状况和状态的意义。
可以允许比较多个图像。现在,提供两个图像(包括一个页面或两个页面或更多页面),例举并说明一个要进行比较的图像(所谓的原始图像,在下文中称为“图像A”)和另一个要进行比较的图像(可能对其进行修改的图像,在下文中称为“图像B”)。此外,这里例举了文档作为图像,然而,也可以使用包括局部图像(在下文中称为子图像)的图像。可以例举日语字符的图像作为局部图像。然而,也可以应用诸如西文字母、简体和繁体汉字、韩文字母等另一种字符。并且,所述局部图像不必局限于字符,也可以是字符的一部分,或相反是多个字符或图形。此外,作为图像的内容,可以应用用于商务的文档、用于广告和宣传的小册子等等。
如图1所示,本示例性实施例的图像处理器包括图像接收模块100、预处理模块110、区域提取模块120、区域定序模块130、子图像提取模块140、子图像定序模块150、整体定序模块160、比对模块170、处理模块180以及输出模块190。
图像接收模块100与预处理模块110连接以接收图像并将该图像发送到预处理模块110。“接收图像”包括“通过扫描仪来读取图像”、“通过传真机来接收图像”、“从数据库读取图像”等。所述图像可以由一页纸张或多页纸张组成。此外,要接收的图像不一定必须是纸介质的图像,也可以接收电子文档(即打印之前的电子文档,例如主要包括由文档生成软件所生成的文本的电子文档),然后,可以形成用于打印的图像。
预处理模块110与图像接收模块100和区域提取模块120连接,以便从图像接收模块100接收图像、对该图像进行预处理并将对其进行预处理的图像发送到区域提取模块120。作为预处理,所述预处理包括i)当接收到的图像是多值图像(包括彩色图像)时,将图像转换为二进制图像,ii)对图像进行竖放处理;iii)执行偏斜校正以消除干扰等。所述竖放处理是指将图像的方向转换为能够读取图像的通常方向。例如,在向四个方向旋转图像的同时执行字符识别处理,以便沿着识别率最高的方向之一来旋转图像。可以使用现有技术。此外,所述偏斜校正是指校正倾斜。例如,当通过扫描仪来读取图像时,发生倾斜。因此,通过对图像的huff变换来获得直线的倾斜以使图像这样旋转,即:使直线的倾斜变为横向或竖向。可以采用已知的技术。
区域提取模块120与预处理模块110和区域定序模块130连接,以便从预处理模块110接收图像、从该图像提取区域(例如字符区域、图形区域、照片区域)并将与该区域有关的信息发送到区域定序模块130。例如,提取在图像中写入字符的部分作为块(矩形区域)。可以采用诸如字符的分离技术和作为字符识别处理中的预处理的图像或字符区域提取技术等已知技术。
区域定序模块130与区域提取模块120和子图像提取模块140连接,以便从区域提取模块120接收与该区域有关的信息,确定目标区域的顺序,并将排好序的区域的信息发送到子图像提取模块140。例如,在横向书写文档的情况下(当字符是从左到右书写时),首先从位于图像上的区域开始确定字符区域的顺序。然后,当字符区域位于作为竖向位置的规定范围内并横向布置时,从位于左侧的字符区域到位于右侧的字符区域来确定其顺序。此外,在竖向书写文档的情况下,从位于图像右侧的字符区域开始确定字符区域的顺序。然后,当字符区域位于作为横向位置的规定范围内并竖向布置时,从上部到下部来确定其顺序。在这种情况下,区域定序模块130可以判断文档是横向书写文档还是竖向书写文档以确定字符区域的顺序。也就是说,字符区域的顺序被确定为具有通常的读取顺序,然而,字符区域的顺序不一定必须确定为精确的读取顺序。然而,在要进行比较的图像之间,根据相同的排序规则来确定各个区域的顺序。
子图像提取模块140与区域定序模块130和子图像定序模块150连接,以便从区域定序模块130接收与排好序的区域有关的信息,从该区域内的图像提取子图像,并向子图像定序模块150发送与该子图像有关的信息。例如,提取与一个字符单位有关的子图像。这时,存储所提取的各个页面和各个位置。可以采用诸如作为字符识别处理中的预处理的字符提取技术等已知技术。
子图像定序模块150与子图像提取模块140和整体定序模块160连接,以便i)根据子图像在图像中的各个位置来确定由子图像提取模块140提取的子图像的顺序以及ii)向整体定序模块160发送与排好序的子图像有关的信息。例如,在横向书写文档的情况下,首先从位于图像上的子图像开始确定子图像的顺序。然后,当子图像位于作为竖直位置的规定范围内并横向布置时,从位于左侧的子图像到位于右侧的子图像来排列其顺序。此外,在竖向书写文档的情况下,从位于图像右侧的子图像开始排列子图像的顺序。然后,当子图像位于作为横向位置的规定范围内并竖向布置时,从上部到下部来确定其顺序。在这种情况下,子图像定序模块150可以判断文档是横向书写文档还是竖向书写文档以确定子图像的顺序。也就是说,子图像的顺序被确定为具有通常的读取顺序,然而,不一定必须按照精确的读取顺序来排列其顺序。然而,在要进行比较的图像之间,根据相同的定序规则来确定子图像的顺序。
整体定序模块160与子图像定序模块150和比对模块170连接,以便i)接收在区域中排好序的子图像的信息,ii)确定子图像在整个图像部分中的顺序以及iii)将排好序的子图像的信息发送到比对模块170。即,当图像中存在多个字符区域时,在全部各自由区域定序模块130排好序的多个字符区域中确定子图像的顺序。当图像具有多个页面时,在全部所述页面中确定子图像的顺序。位于第二页面之后的子图像的顺序被确定为跟随位于前页中的子图像。也就是说,分三个阶段来执行分类处理(定序处理)。所述分类处理的顺序包括作为第一优先级的页面的顺序、作为第二优先级的页面中的字符区域的顺序以及作为第三优先级的字符区域中的子图像的顺序。
分别对图像A和图像B执行从预处理模块110到整体定序模块160的处理。在这种情况下,在每个模块对图像A执行处理之后,不需要该模块对图像B执行处理。对图像A的处理可以由预处理模块110到整体定序模块160依次执行,并且整体定序模块160可以将其结果存储在存储装置中,然后,可以执行对图像B的处理。即,存储装置存储根据从图像A提取的子图像的各个位置而排好序的图像A中的子图像的信息。此外,当图像A具有多个页面时,所述存储装置存储在全部所述多个页面中排好序的子图像的信息。此外,可以对图像A执行的处理包括通过比对模块170来提取子图像的特征的处理。然后,所述存储装置可以存储子图像的顺序和子图像的特征作为与子图像有关的信息。当允许存储装置存储与子图像有关的信息时,如果存在多个要进行比较的图像,则可以一次完成对图像A的处理。
比对模块170与整体定序模块160和处理模块180连接,以便根据由整体定序模块160排好序的子图像的顺序来比较图像A与图像B之间的相应子图像,提取图像A和图像B之间的差异并将提取的差异的信息发送到处理模块180。此外,比对模块170使用图像A中的子图像的特征和图像B中的子图像的特征来比较各个子图像。子图像的比较可以根据由整体定序模块160确定的子图像的顺序来进行。
此外,当与图像A中的子图像有关的信息被整体定序模块160存储在存储装置中时,比对模块170根据存储装置中与子图像有关的信息和由整体定序模块160确定的图像B中的子图像的顺序来比较图像A与图像B之间的相应子图像。并且比对模块170提取图像A和图像B之间的差异。此外,比对模块170可以利用存储在存储装置中的图像A中的子图像的特征和图像B中的子图像的特征来比较各个子图像。子图像的比较可以根据存储在存储装置中的图像A中的子图像的顺序和整体定序模块160所确定的图像B中的子图像的顺序来进行。
此外,例如,可以例举子图像的删除、插入和修改作为所提取的差异。在这种情况下,依次将图像A和图像B的子图像互相比较。当子图像不彼此对应时,固定图像A的子图像以查找图像B的子图像。当存在与图像A的子图像相对应的子图像时,所述差异被判定为“插入”。当固定图像B的子图像以查找图像A的子图像时,如果子图像对应于图像B的子图像,则所述差异被判定为“删除”。当所述差异不对应于上述两个实例时,该差异可以被判定为“修改”。此外,当子图像不彼此对应时,可以共同查找多个连续的子图像。
处理模块180与比对模块170和输出模块190连接,以便根据被比对模块170提取到差异的子图像的位置来处理图像A或图像B并将经处理的图像发送到输出模块190。例如,处理与被比对模块170判定为不同的子图像的位置对应的图像A或图像B,以便可以辨别所述差异。对于处理操作来说,可以附加诸如“符号”(例如◆等)的标记,可以使字符为粗体,可以修改字符颜色,可以修改背景颜色等等。此外,可以处理图像本身或将注释附加于图像。此外,当图像呈现在显示器上时,可以使相应的子图像闪烁。
输出模块190与处理模块180连接,以便从处理模块180接收经处理的图像并输出该图像。“输出图像”包括“通过打印机来打印图像”、“在显示器上显示图像”、“通过传真机来发送图像”以及“将图像存储在数据库中”。
图2是示出根据示例性实施例的处理实例的流程图。步骤S210~步骤S224示出了对图像A的处理,步骤S230~步骤S244示出了对图像B的处理。由于这两种处理是相同的处理,所以将描述对图像A的处理(从步骤S210至步骤S224的处理)并省略对图像B的处理的说明。
在步骤S212中,预处理模块110对图像A执行竖放处理。
在步骤S214中,预处理模块110对图像A执行偏斜校正。
在步骤S216中,区域提取模块120从在步骤S212和步骤S214中经预处理的图像A的各个页面提取字符区域。区域提取模块120不仅可以提取字符区域,而且可以提取图形区域。
这里,参照图4,将描述用于存储字符区域的提取结果等的区域数据表400。区域数据表400包括编号栏401、左上x坐标栏402、左上y坐标栏403、宽度栏404、高度栏405、页面栏406、区域栏407、区域顺序栏408以及子图像栏409。子图像栏409包括第一栏410和最后一栏411。
编号栏401存储用于唯一地识别所提取的区域的符号。
左上x坐标栏402、左上y坐标栏403、宽度栏404、高度栏405指定区域并分别存储页面中矩形区域的左上角的x坐标和y坐标及该区域的宽度和高度。然而,所述各栏不必局限于此,而是可以存储左上坐标和右下坐标。
页面栏406存储图像中的各个页面的顺序。
区域栏407存储区域的种类(字符区域、图形区域等)。在步骤S218之后,仅对作为目标的字符区域执行处理。
区域顺序栏408存储在步骤S218中对各个字符区域所确定的顺序。
子图像栏409存储位于区域中的子图像。第一栏410存储位于第一个区域中的子图像的符号,该第一个区域在图5的实例中所示的子图像数据表500的编号栏501中示出。最后一栏411类似地存储位于最后一个区域中的子图像的符号,该最后一个区域在图5的实例中所示的子图像数据表500的编号栏501中示出。
在步骤S218中,区域定序模块130确定图像A的每个页面中的字符区域的顺序。区域数据表400的区域顺序栏408存储该结果。
在步骤S220中,子图像提取模块140从图像A的每个页面(字符区域)提取子图像。
这里,参照图5,将描述用于存储子图像的提取结果的子图像数据表500。子图像数据表500包括编号栏501、左上x坐标栏502、左上y坐标栏503、宽度栏504、高度栏505、区域顺序栏506、页面顺序栏507、整体顺序栏508、标记栏509以及子图像栏510。
编号栏501存储用于唯一地识别所提取的子图像的符号。
左上x坐标栏502、左上y坐标栏503、宽度栏504、高度栏505指定子图像并分别存储页面中矩形区域的左上角的x坐标和y坐标及区域的宽度和高度。然而,所述各栏不必局限于此,而是可以存储左上坐标和右下坐标。
区域顺序栏506存储步骤S222中的结果(字符区域中的子图像的顺序)。
页面顺序栏507和整体顺序栏508存储步骤S224中的结果(图像中的子图像的顺序)。
标记栏509存储步骤S260、步骤S268和步骤S270中的结果。
子图像栏510存储子图像。要存储的内容可以是子图像本身或指示存储子图像的位置的链接。
在步骤S222中,子图像定序模块150确定字符区域中的子图像的顺序。获得的结果存储在子图像数据表500的区域顺序栏506中。
在步骤S224中,整体定序模块160确定图像A中的子图像的顺序。即,当存在多个字符区域时,根据步骤218中的顺序来确定子图像的顺序。当存在多个页面时,根据各个页面的顺序来确定子图像的顺序。获得的结果存储在子图像数据表500的页面顺序栏507和整体顺序栏508中。
从步骤S250至步骤S270的处理由比对模块170来执行。在步骤S250中,根据在步骤S224和步骤S244中分别进行分类的结果将尚未进行比对的子图像依次与图像A和图像B中的子图像比对。即,分别根据所确定的图像中的子图像的顺序,在子图像之间执行比对处理。虽然通常不会将具有相同顺序的子图像进行互相比对,但是分别根据所述顺序来对其进行互相比对。然后,当完成所有子图像的比对处理时,程序转入步骤S272。下面将参照图3来描述比对处理的细节。
在步骤S252中,作为步骤S250中的比对处理的结果,判断两个子图像是否相同。在此判断中,当判定两个子图像相同时(判断结果为“肯定”(Y)),程序返回步骤S250。否则(判断结果为“否定”N),程序转入步骤S254。在这种情况下,所述相同不仅包括子图像之间不存在差异,而且包括差异在规定的范围内(其余部分相同)。
在步骤S254中,关注不与图像B的子图像相对应的图像A的子图像及其随后的总共N个子图像栏(N是0或更大的整数)。也就是说,所述子图像栏被设置为将在步骤S256中进行比对的固定对象。
在步骤S256中,在图像B的子图像中,在不与图像A的子图像相对应的子图像之后,比对与步骤S254中的所关注的子图像栏相对应的子图像栏。
在步骤S258中,作为步骤S256的比对处理的结果,判断两种子图像栏(所关注的图像A的子图像栏和图像B的子图像栏)中的子图像栏是否彼此对应。在此判断中,当判定子图像栏彼此对应时(Y),程序转入步骤S260。否则(N),程序转入步骤S262。在这种情况下,彼此对应不仅包括子图像栏之间不存在差异,而且包括所述差异在规定的范围内(其余部分相同)。
在步骤S260中,在图像B的子图像中,“插入”标记附加于子图像栏上一直到相应位置。也就是说,由于识别到图像B中存在与所关注的图像A的子图像栏相同的子图像栏,所以与图像A相比,一直设置到该相应位置的图像B的子图像是插入的子图像。此结果存储在子图像数据表500的标记栏509中。
步骤S262和步骤S264是与步骤254和步骤256的处理相反的处理。也就是说,在步骤S254和步骤S256中,固定并比对图像A的子图像,然而,在步骤S262和步骤S264中,固定并比对图像B的子图像。
在步骤S262中,关注不与图像A的子图像相对应的图像B的子图像及其随后的总共N个子图像栏。也就是说,所述子图像栏被设置为将在步骤S264中进行比对的固定对象。
在步骤S264中,在图像A的子图像中,在不与图像A的子图像相对应的子图像之后,比对与步骤S262中的所关注的子图像栏相对应的子图像栏。
在步骤S266中,作为步骤S264的比对处理的结果,判断两种子图像栏(图像A的子图像栏和所关注的图像B的子图像栏)中的子图像栏是否彼此对应。在此判断中,当判定子图像栏彼此对应时(Y),程序转入步骤S268。否则(N),程序转入步骤S270。
在步骤S268中,在图像A的子图像中,“删除”标记附加于子图像栏上一直到相应位置。也就是说,由于识别到图像A中存在与所关注的图像B的子图像栏相同的子图像栏,所以与图像B相比,一直设置到该相应位置的图像A的子图像是删除的子图像。此结果存储在子图像数据表500的标记栏509中。
在步骤S270中,“修改”标记分别附加于图像A和图像B的所关注的子图像栏的第一子图像栏。即,由于识别到其他图像中不存在各个所关注的子图像栏,所以第一个所关注的子图像栏被判定为经过修改。此结果存储在子图像数据表500的标记栏509中。在步骤S272中,处理模块180处理在从步骤S250至步骤S270的处理中被判定为“删除”、“插入”以及“修改”的子图像的位置。即,根据子图像数据表500的标记栏509,处理模块180处理相应子图像的位置(子图像数据表500的左上x坐标栏502至高度栏505)。
图3是示出根据本示例性实施例的子图像的比对处理的实例的流程图。也就是说,比对模块170表示并执行图2所示的流程图中的步骤S250的比对处理。
在步骤S310中,接收到图像A的子图像。在步骤S320中,接收到图像B的子图像。即,接收到要互相比较的两个图像的子图像。
在步骤S330中,将两个图像的子图像的特征1(例如子图像的外接矩形框的尺寸,更具体地说,子图像数据表500的宽度栏504和高度栏505)互相比较。
在步骤S332中,判断步骤S330中的比较结果、即所述差异是否在规定的范围内。在此判断中,当所述差异在规定的范围内时(Y),程序转入步骤S334。否则(N),程序转入步骤S348。
在步骤S334中,将两个图像的子图像的特征2(例如子图像的黑色像素的数目)互相比较。
在步骤S336中,判断步骤S334中的比较结果、即所述差异是否在规定的范围内。在此判断中,当所述差异在规定的范围内时(Y),程序转入步骤S338。否则(N),程序转入步骤S348。
在步骤S338中,将两个图像的子图像的特征3(例如子图像被细化之后的黑色像素的数目)互相比较。这里,采用细化的子图像降低了扫描仪读取子图像时的基于表面或浓度的影响。
在步骤S340中,判断步骤S338中的比较结果、即所述差异是否在规定的范围内。在此判断中,当所述差异在规定的范围内时(Y),程序转入步骤S342。否则(N),程序转入步骤S348。
在步骤S342中,将两个图像的子图像的特征4(例如子图像之间的图案匹配之后的相关系数值,更具体地说,两个子图像之间的EOR运算之后表示1的像素的数目)互相比较。
在步骤S344中,判断步骤S342中的比较结果、即所述差异是否在规定的范围内。在此判定中,当所述差异在规定的范围内时(Y),程序转入步骤S346。否则(N),程序转入步骤S348。
在步骤S346中,判定图像A的目标子图像对应于图像B的目标子图像。也就是说,在图2所示的流程图中,获得步骤S252中的Y的情况。
在步骤S348中,判定图像A的目标子图像不对应于图像B的目标子图像。也就是说,在图2所示的流程图中,获得步骤S252中的N的情况。
在图3所示的处理实例中,按照从比较处理中的工作量相对较小的处理开始的顺序执行四个阶段的比较处理,因此,可以不对不相对应的子图像执行工作量大的处理。关于比较处理的阶段的数目,可以执行较大数目的比较处理(例如执行与在字符识别处理中所使用的用于提取特征的处理等效的处理,并增加用于互相比较其结果的处理),或者可以执行较小数目的比较处理。此外,要比较的特征不限于上述实例,也可以使用其他特征。
图6、图7和图8是示出根据本示例性实施例的情况1的处理实例的说明图。
图6中的(a1)和图6中的(b1)示出了作为图像A的图像610和作为图像B的图像620。即,通过改变图像610的各行之间的间距并部分地修改字符来获得图像620。在这种情况下,当将图像610的整个部分与图像620的整个部分对准以提取图像的差异时,由于在图像610与图像620之间,各行之间的间距不同,所以部分611下面的所有部分被判定为不同。
图6中的(a2)所示的图像610和图6中的(b2)所示的图像620示出了区域提取模块120所提取的结果。也就是说,图像610被确定为具有字符区域611和字符区域612,并且图像620被确定为具有字符区域621、字符区域622和字符区域623。出现上述问题是由于在图像610与图像620之间,各行之间的间距是不同的。
然后,区域定序模块130按照字符区域611和612的顺序来设定图像610的各个区域的顺序,并按照字符区域621、622和623的顺序来设置图像620的各个区域的顺序。
图7示出经过子图像提取模块140、子图像定序模块150、整体定序模块160和比对模块170处理的图像610和图像620的处理结果。具体地说,由子图像提取模块140提取的子图像(字符)示出为被矩形框包围并基于子图像定序模块150和整体定序模块160所确定的顺序来布置(从子图像701a至子图像733a、从子图像701b至子图像733b)。也就是说,即使当字符区域被划分成两个部分时,也可以在全部区域中设定子图像的顺序。比对模块170对排好序的子图像进行比对。即,分别根据子图像的顺序,将相应的子图像(即子图像701a、子图像701b,…)互相比较。结果,判定子图像701a至715a分别对应于子图像701b至715b。即,在图2所示的流程图中,重复步骤S250和步骤S252。然后,判定子图像716a不对应于子图像716b以执行步骤S254、S256、S258、S262、S264、S266和S270的处理。然后,子图像716a被确定为修改成子图像716b。类似地,确定子图像717a和子图像717b、子图像729a和子图像729b以及子图像730a和子图像730b是“修改”。
图8示出了处理模块180处理图像620(图像B)中被判定为“修改”的位置处的子图像(子图像716b、717b、729b以及730b)的实例。例如,在图8的(a)所示的图像810中,位于所述位置处的子图像(字符811、812、813以及814)示出为被粗化。此外,在图8的(b)所示的图像820中,位于所述位置处的子图像的背景(经处理的字符821、822、823以及824)被着色。
图9~15是示出根据本示例性实施例的情况2的处理实例的说明图。情况2表示图像分别具有多个页面并执行了插入和删除。
图9中的(a1)和(a2)例举图像911和921作为图像A,图9中的(b1)和(b2)例举图像951和971作为图像B。也就是说,在图像B中,插入了字符并且前页的字符串部分地多出到图像971上。
图9的(a3)、(a4)、(b3)及(b4)所示的图像911和921,以及图像951和971示出了区域提取模块120的提取结果。即,图像911被确定为具有字符区域931和932,图像921被确定为具有字符区域933~937,图像951被确定为具有字符区域981和982,并且图像971被确定为具有字符区域983~988。
然后,区域定序模块130按照字符区域931和932的顺序来设定图像911的各个区域的顺序。图像921的各个区域的顺序按照字符区域933、934、935、936以及937的顺序来设定。图像951的各个区域的顺序按照字符区域981和982的顺序来设定。图像971的各个区域的顺序按照字符区域983、984、985、986、987以及988的顺序来设定。
图10中的(a)和(b)示出了经过子图像提取模块140、子图像定序模块150、整体定序模块160处理的图像A的图像911和921以及图像B的图像951和971的处理结果。具体地说,子图像提取模块140所提取的子图像(字符)示出为被矩形框包围并基于子图像定序模块150和整体定序模块160所确定的顺序来布置(图像A中的60个子图像,图像B中的66个子图像)。也就是说,即使当存在多个图像和多个区域时,也可以在全部页面和区域中设定子图像的顺序。
图11中的(a)和(b)示出了比对模块170执行的处理的中间部分(图2所示的流程图中的步骤S250~S258)。即,在布置S250和S252中,判定在图像A与图像B之间,12个子图像彼此对应。然后,在图2所示的流程图中,当在步骤S254中假设N是1时,也就是说,假设图像A的两个子图像栏(第13和第14子图像)是所关注的子图像栏时,从图像B中的该子图像之后(第13子图像之后)的子图像栏中查找所关注的子图像栏(步骤S256)。在这种情况下,由于不存在相对应的子图像栏,所以程序转入步骤S262。在图11~14中,作为比较的结果,相对应的子图像用虚线的箭头标记示出,并且不相对应的子图像用实线的箭头标记示出。
图12中的(a)和(b)示出了比对模块170执行的处理的中间部分(图2所示的流程图中的步骤S250~S268,即用于判定“插入”和“删除”的处理)。在步骤S262中,假设图像B的两个子图像栏(第13子图像和第14子图像)是所关注的子图像栏,并从图像A中的该子图像之后(第13子图像之后)的子图像栏中查找所关注的子图像栏(步骤S264)。在这种情况下,由于相对应的子图像是第17子图像栏(第17和第18子图像),所以程序转入步骤S268。在步骤S268中,被确定为不对应于所关注的子图像栏的图像A中的子图像(第13子图像)一直到恰好在被判定为对应于所关注的子图像栏的子图像之前的子图像(第16子图像)被确定为删除的子图像1201。
然后,由于图像A的第17子图像至第28子图像与图像B的第13子图像至第24子图像彼此对应,所以重复步骤S250和S252的处理。
然后,由于图像A的第29子图像不对应于图像B的第25子图像,所以图像A的第29和第30子图像栏被认为是所关注的子图像栏,并且从图B中的该子图像之后的子图像栏(从第26子图像)中查找所关注的子图像栏。在这种情况下,由于相对应的子图像是第30子图像栏(第30和第31子图像),所以程序转入步骤S260。在步骤S260中,被判定为不对应于图像A的所关注的子图像栏的图像B中的子图像(第25子图像)一直到恰好在被判定为对应于图像A的所关注的子图像栏的子图像之前的子图像(第29子图像)被判定为插入的子图像1202。
然后,图像A的第31子图像被判定为对应于图像B的第32子图像并继续执行处理。
图13中的(a)和(b)示出了这样一种状态,即:类似地重复所述处理以确定图像B中的插入的子图像1301,并且随后不能从其后的图像B的子图像栏中找到对应于图像A的所关注的子图像栏(第41和第42子图像)的子图像。
图14中的(a)和(b)示出了通过重复类似的处理以确定图像A中的删除的子图像1401并确定图像B中的插入的子图像1402而获得的结果。
简单地说,作为图像A与图像B之间的差异,确定了删除的子图像1201和1401及插入的子图像1202、1301以及1402。
图15示出了处理模块180处理图像951和971(图像B)中被确定为“删除”和“插入”的子图像(删除的子图像1201、1401,插入的子图像1202、1301、1401)的位置的实例。
例如,在图15的(a1)和(a2)所示的子图像的“删除”部分中,分别在子图像之前和之后的一个子图像被粗化且其颜色被修改(字符1511和1512、字符1523和1524)。然后,在子图像的“插入”部分中,子图像被加粗且其颜色被修改(与“删除”的那些不同的颜色)(字符1513~1517、字符1518~1522)。
此外,在图15的(b1)和(b2)所示的子图像的“删除”部分中,分别在子图像之前和之后的一个子图像被加粗且背景的颜色被修改(经处理的字符1531、经处理的字符1534)。然后,在子图像的“插入”部分中,子图像被加粗且背景颜色被修改(与“删除”的颜色不同)(经处理的字符1532、经处理的字符1533、经处理的字符1535)。
此外,在图15的(c1)和(a2)所示的子图像中,符号(◆)附加在对应于“删除”部分的位置(经处理的图像1541、1552)。然后,在子图像的“插入部分”中,子图像被加粗且其颜色被修改(与“删除”的符号不同的颜色)(字符1542~1546、字符1547~1551、字符1553~1555)。
参照图16,下面将描述本示例性实施例的硬件结构实例。图16所示的结构由例如个人计算机(PC)构成并示出了包括诸如扫描仪等数据读取部分1617和诸如打印机等数据输出部分1618的硬件结构实例。
CPU(中央处理单元)1601是用于根据计算机程序来执行处理的控制部分,所述计算机程序分别描述上述示例性实施例中所述各种模块的执行序列,所述各种模块为区域提取模块120、区域定序模块130、子图像提取模块140、子图像定序模块150、整体定序模块160以及比对模块170。
ROM(只读存储器)1612存储CPU 1601所使用的程序或计算参数等等。RAM(随机存取存储器)1603存储CPU 1601的执行中所使用的程序和在其执行中适当地改变的参数。这些部件通过由CPU总线构成的主机总线1604相互连接。
主机总线1604通过桥接器1605连接到诸如PCI(周边组件互连/接口)总线等外部总线1606上。
诸如键盘1608、鼠标等点击装置(指点装置)1609是由操作人员来操作的输入装置。显示器1610由液晶显示器或CRT(阴极射线管)等组成以便将各种信息显示为文本或图像信息。
HDD(硬盘驱动器)1611在其中容纳硬盘并驱动硬盘来记录或再现由CPU 1601执行的程序或信息。在硬盘中,存储接收到的图像或经处理模块180等处理的图像。此外,还存储诸如其他各种数据处理程序等各种计算机程序。
驱动器1612读取记录在诸如安装的磁盘、光盘、光电磁盘或半导体存储器等可移动记录介质1613中的数据或程序以便将该数据或程序提供给通过接口1607、外部总线1606、桥接器1605以及主机总线1604连接的RAM 1603。可移动记录介质1613也可以用作类似于硬盘的数据记录区域。
连接端口1614是用于连接外部连接装置1615的端口并具有诸如USB、IEEE 1394等连接部分。连接端口1614通过接口1607、外部总线1606、桥接器1605以及主机总线1604连接到CPU 1601上。通信部分1616连接到网络上以便执行与外部的数据通信处理。数据读取部分1617是例如执行文档的读取处理的扫描仪。数据输出部分1618是例如执行文档数据的输出处理的打印机。
图16所示的硬件结构示出了一个结构实例,并且本发明的示例性实施例不限于图16所示的结构。可以使用能够执行示例性实施例中所述模块的任何结构。例如,一部分模块可以由专用硬件(例如专用集成电路:ASIC)等组成。一部分模块可以设置在外部系统中并由通信线路连接。此外,图16所示的多个系统可以用通信线路连接在一起以便相互配合。此外,图16所示的结构可以包含在复印机、传真机、扫描仪、打印机、多功能机(具有扫描仪、打印机、复印机、传真机等的两种或更多种功能的图像处理器)等。
根据上述示例性实施例,在图2所示的流程图中,在步骤S250之后的处理中,示出了用于判断“插入”、“删除”以及“修改”的处理的实例。然而,当预先知道处理仅包括“修改”时,或者当插入和删除也被确定为修改时(即在插入和删除之后,所有处理被设定为修改),在步骤S250之后的处理中,可以按照在步骤S224和步骤S244中进行分类的顺序来将两个子图像互相比对,可以将标记附加于不同的子图像,并且可以处理被判定为不同的子图像的位置。
此外,在上述示例性实施例中,示出了这样的实例,即:处理模块180执行基于图像B的处理,然而,处理模块180也可以执行基于图像A的处理。此外,处理模块180可以处理两个图像。即,对于图像A,处理模块180可以处理删除的部分,对于图像B,处理模块180可以处理插入的部分。对于修改的部分,处理模块180可以处理图像中的一者或两者。
此外,对于由比对模块170执行的比对处理,可以应用字符串(文本串)中使用的比对处理以及上述比对处理。
上述程序可以存储并设置在记录介质中。此外,可以由通信单元来提供程序。在这种情况下,可以将上述程序作为“存储程序的计算机可读介质”的发明。
所述“存储程序的计算机可读介质”是指能够被计算机读取的记录有程序的记录介质,其可以用来安装和执行程序以及运行程序。
作为记录介质,可以例举例如,数字通用盘(DVD)诸如作为DVD论坛中建立的标准的“DVD-R、DVD-RW、DVD-RAM等”、作为DVD+RW所建立的标准的“DVD+R、DD+RW等”、压密盘(CD)诸如只读存储器CD(CD-ROM)、可记录CD(CD-R)、可重写CD(CD-RW)等、光电磁盘(MO)、软盘(FD)、磁带、硬盘、只读存储器(ROM)、电可擦除可重写只读存储器(EEPROM)、闪速存储器、随机存取存储器(RAM)等。
上述程序或其一部分可以记录并存储在记录介质中并运行。此外,可以利用例如局域网(LAN)、城域网(MAN)、广域网(WAN)、用于因特网的有线网络或无线通信网络、内联网、外联网、以及诸如其组合的传输介质而经由通信来发送,或者可以由载波来发送。
此外,上述程序可以是其他程序的一部分或与单独的程序一起存储在记录介质中。此外,上述程序可以被分割并存储在多个记录介质中。此外,如果上述程序能被恢复,则该程序可以以诸如压缩或编码等任何形式来记录。
出于解释和说明的目的提供了本发明的示例性实施例的上述说明。其本意并不是穷举或将本发明限制在所公开的确切形式。显然,对于本技术领域的普通技术人员可以进行许多修改和变型。选择和说明上述示例性实施例是为了更好地解释本发明的原理及其实际应用,因此使得本技术领域的其他技术人员能够理解本发明所适用的各种实施例并预见到适合于特定应用的各种修改。目的在于通过所附权利要求书及其等同内容限定本发明的范围。

Claims (9)

1.一种图像处理装置,包括:
区域提取单元,其分别从第一图像提取第一区域和从第二图像提取第二区域;
区域定序单元,其分别确定所提取的第一区域的顺序和所提取的第二区域的顺序;
局部图像提取单元,其从所提取的第一区域提取第一局部图像,并从所提取的第二区域提取第二局部图像;
局部图像定序单元,其根据所述第一局部图像在所述第一图像中的各个位置来确定所提取的第一局部图像相对于每个第一区域的顺序,并根据所述第二局部图像在所述第二图像中的各个位置来确定所提取的第二局部图像相对于每个第二区域的顺序;
定序单元,其分别:基于由所述区域定序单元确定的第一区域的顺序和由所述局部图像定序单元确定的第一局部图像相对于每个第一区域的顺序来确定所述第一局部图像的整体顺序;以及基于由所述区域定序单元确定的第二区域的顺序和由所述局部图像定序单元确定的第二局部图像相对于每个第二区域的顺序来确定所述第二局部图像的整体顺序;以及
差异提取单元,其根据所述第一局部图像的整体顺序和所述第二局部图像的整体顺序来将每个所述第一局部图像与相应的所述第二局部图像进行比较,并提取基于所述第一图像与所述第二图像之间的比较的差异。
2.如权利要求1所述的图像处理装置,其中,
所述第一图像和所述第二图像分别具有多个页面;
所述定序单元根据所述第一图像的各个页面的顺序来在全部所述多个页面中确定所述第一局部图像的顺序,并且
所述定序单元根据所述第二图像的各个页面的顺序来在全部所述多个页面中确定所述第二局部图像的顺序。
3.如权利要求1或2所述的图像处理装置,其中,
利用每个所述第一局部图像的特征和相应的所述第二局部图像的特征来进行每次比较,并且
根据所述定序单元所确定的顺序来进行每次比较。
4.一种图像处理装置,包括:
存储单元,其存储与第一图像中的第一局部图像有关的信息,其中,根据从所述第一图像提取的第一区域的顺序和从所述第一区域提取的所述第一局部图像相对于每个第一区域的顺序来确定所述第一局部图像的整体顺序,所述第一局部图像相对于每个第一区域的顺序是根据所述第一局部图像在所述第一图像中的各个位置来确定的;
区域提取单元,其从第二图像提取第二区域;
区域定序单元,其确定所提取的第二区域的顺序;
局部图像提取单元,其从所提取的第二区域提取第二局部图像;局部图像定序单元,其根据所述第二局部图像在所述第二图像中的各个位置来确定所提取的第二局部图像相对于每个第二区域的顺序;
定序单元,其基于所述第二区域的顺序和所述第二局部图像相对于每个第二区域的顺序来确定所提取的第二局部图像的整体顺序;以及
差异提取单元,其根据所存储的与第一局部图像有关的信息和所述第二局部图像的整体顺序来将每个所述第一局部图像与相应的所述第二局部图像进行比较,并提取基于所述第一图像与所述第二图像之间的比较的差异。
5.如权利要求4所述的图像处理装置,其中,
所述第一图像和所述第二图像分别具有多个页面,
与第一局部图像有关的所述信息包括全部所述多个页面中所确定的顺序,并且
所述定序单元根据所述第二图像的各个页面的顺序来在全部所述多个页面中确定所述第二局部图像的顺序。
6.如权利要求4或5所述的图像处理装置,其中,
所述信息包括每个所述第一局部图像的特征,
利用所存储的每个所述第一局部图像的特征和每个所述第二局部图像的特征来进行每次比较,并且
根据所述存储单元所存储的所述第一局部图像的顺序和所述定序单元所确定的所述第二局部图像的顺序来进行每次比较。
7.如权利要求1或4所述的图像处理装置,还包括:
图像处理单元,其在被所述差异提取单元提取到差异的每个所述第一局部图像或每个所述第二局部图像的位置处将新的信息添加到所述第一图像和所述第二图像中的至少之一中。
8.一种图像处理方法,包括:
从第一图像提取第一区域;
从第二图像提取第二区域;
确定所提取的第一区域的顺序;
确定所提取的第二区域的顺序;
从所提取的第一区域提取第一局部图像;
从所提取的第二区域提取第二局部图像;
根据所述第一局部图像在所述第一图像中的各个位置来确定所提取的第一局部图像相对于每个第一区域的顺序;
根据所述第二局部图像在所述第二图像中的各个位置来确定所提取的第二局部图像相对于每个第二区域的顺序;
基于所提取的第一区域的顺序和所提取的第一局部图像相对于每个第一区域的顺序来确定所述第一局部图像的整体顺序;
基于所提取的第二区域的顺序和所提取的第二局部图像相对于每个第二区域的顺序来确定所述第二局部图像的整体顺序;
根据所述第一局部图像的整体顺序和所述第二局部图像的整体顺序来将每个所述第一局部图像与相应的所述第二局部图像进行比较;以及
提取基于所述第一图像与所述第二图像之间的比较的差异。
9.一种图像处理方法,包括:
存储与第一图像中的第一局部图像有关的信息,其中,根据从所述第一图像提取的第一区域的顺序和从所述第一区域提取的所述第一局部图像相对于每个第一区域的顺序来确定所述第一局部图像的整体顺序,所述第一局部图像相对于每个第一区域的顺序是根据所述第一局部图像在所述第一图像中的各个位置来确定的;
从第二图像提取第二区域;
确定所提取的第二区域的顺序;
从所提取的第二区域提取第二局部图像;
根据所述第二局部图像在所述第二图像中的各个位置来确定所述第二局部图像相对于每个第二区域的顺序;
根据所述第二区域的顺序和所述第二局部图像相对于每个第二区域的顺序来确定所提取的第二局部图像的整体顺序;
根据所存储的与第一局部图像有关的信息和所述第二局部图像的整体顺序来将每个所述第一局部图像与相应的所述第二局部图像进行比较;以及
提取基于所述第一图像与所述第二图像之间的比较的差异。
CN200910000468XA 2008-04-14 2009-01-16 图像处理器及图像处理方法 Active CN101561877B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2008104340A JP4539756B2 (ja) 2008-04-14 2008-04-14 画像処理装置及び画像処理プログラム
JP2008-104340 2008-04-14
JP2008104340 2008-04-14

Publications (2)

Publication Number Publication Date
CN101561877A CN101561877A (zh) 2009-10-21
CN101561877B true CN101561877B (zh) 2013-08-21

Family

ID=41164029

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910000468XA Active CN101561877B (zh) 2008-04-14 2009-01-16 图像处理器及图像处理方法

Country Status (5)

Country Link
US (1) US8391607B2 (zh)
JP (1) JP4539756B2 (zh)
KR (1) KR101235226B1 (zh)
CN (1) CN101561877B (zh)
AU (1) AU2008246275B2 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4539756B2 (ja) * 2008-04-14 2010-09-08 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP2013509820A (ja) 2009-10-28 2013-03-14 ザ トラスティーズ オブ コロンビア ユニヴァーシティ イン ザ シティ オブ ニューヨーク 符号化ローリングシャッタの方法およびシステム
US8000528B2 (en) * 2009-12-29 2011-08-16 Konica Minolta Systems Laboratory, Inc. Method and apparatus for authenticating printed documents using multi-level image comparison based on document characteristics
JP5724311B2 (ja) * 2010-11-15 2015-05-27 富士ゼロックス株式会社 画像処理装置、画像処理システム、及び画像処理プログラム
JP2012134951A (ja) * 2010-11-30 2012-07-12 Canon Inc 撮像装置及びその制御方法
US8331670B2 (en) * 2011-03-22 2012-12-11 Konica Minolta Laboratory U.S.A., Inc. Method of detection document alteration by comparing characters using shape features of characters
CN103309847A (zh) * 2012-03-06 2013-09-18 百度在线网络技术(北京)有限公司 一种用于实现文件比较的方法与设备
JP6051675B2 (ja) * 2012-08-16 2016-12-27 株式会社リコー 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP5835381B2 (ja) 2014-03-17 2015-12-24 富士ゼロックス株式会社 画像処理装置及びプログラム
CN113490912A (zh) * 2019-02-21 2021-10-08 三菱电机株式会社 信息处理装置、信息处理方法及信息处理程序
CN110222590B (zh) * 2019-05-15 2021-05-25 北京字节跳动网络技术有限公司 图像差异判断方法、装置及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6470336B1 (en) * 1999-08-25 2002-10-22 Matsushita Electric Industrial Co., Ltd. Document image search device and recording medium having document search program stored thereon
CN1838061A (zh) * 2005-03-23 2006-09-27 佳能株式会社 打印装置,图像处理装置,以及相关控制方法

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2703559B2 (ja) * 1988-05-20 1998-01-26 キヤノン株式会社 文字認識支援装置
CA2078423C (en) * 1991-11-19 1997-01-14 Per-Kristian Halvorsen Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information
US5452105A (en) * 1992-11-19 1995-09-19 Sharp Kabushiki Kaisha Joint-portion processing device for image data for use in an image processing apparatus
US5699453A (en) * 1994-09-30 1997-12-16 Xerox Corporation Method and apparatus for logically tagging of document elements in the column by major white region pattern matching
US6353840B2 (en) * 1997-08-15 2002-03-05 Ricoh Company, Ltd. User-defined search template for extracting information from documents
JP3432736B2 (ja) * 1997-10-29 2003-08-04 シャープ株式会社 画像処理装置
JP3573945B2 (ja) * 1998-03-12 2004-10-06 沖電気工業株式会社 フォーマット認識装置及び文字読み取り装置
JP3821267B2 (ja) * 1999-01-18 2006-09-13 富士通株式会社 文書画像結合装置、文書画像結合方法及び文書画像結合プログラムを記録した記録媒体
US7221796B2 (en) * 2002-03-08 2007-05-22 Nec Corporation Character input device, character input method and character input program
JP2003331217A (ja) * 2002-03-08 2003-11-21 Nec Corp 文字入力装置、文字入力方法及び文字入力プログラム
JP4120795B2 (ja) 2002-12-27 2008-07-16 株式会社リコー 加筆抽出装置及び加筆抽出方法
JP4275973B2 (ja) * 2003-03-20 2009-06-10 株式会社リコー 加筆画像抽出装置、プログラム、記憶媒体及び加筆画像抽出方法
JP2004334339A (ja) * 2003-04-30 2004-11-25 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
US20040223648A1 (en) * 2003-05-05 2004-11-11 Keith Hoene Determining differences between documents
JP2004341914A (ja) 2003-05-16 2004-12-02 Ricoh Co Ltd 文書ファイリング装置、文書ファイリング方法、およびその方法をコンピュータに実行させるプログラム
JP4298588B2 (ja) * 2004-05-31 2009-07-22 株式会社リコー 情報検出装置および情報検出方法
JP4641414B2 (ja) * 2004-12-07 2011-03-02 キヤノン株式会社 文書画像検索装置、文書画像検索方法、プログラム、記憶媒体
US20060146062A1 (en) * 2004-12-30 2006-07-06 Samsung Electronics Co., Ltd. Method and apparatus for constructing classifiers based on face texture information and method and apparatus for recognizing face using statistical features of face texture information
US7702159B2 (en) * 2005-01-14 2010-04-20 Microsoft Corporation System and method for detecting similar differences in images
EP1890268A1 (en) * 2005-06-07 2008-02-20 Sony Corporation Image processing device and image processing method and computer program
CN101226595B (zh) * 2007-01-15 2012-05-23 夏普株式会社 文档图像处理装置以及文档图像处理方法
JPWO2009081791A1 (ja) * 2007-12-21 2011-05-06 日本電気株式会社 情報処理システム、その方法及びプログラム
JP4539756B2 (ja) * 2008-04-14 2010-09-08 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6470336B1 (en) * 1999-08-25 2002-10-22 Matsushita Electric Industrial Co., Ltd. Document image search device and recording medium having document search program stored thereon
CN1838061A (zh) * 2005-03-23 2006-09-27 佳能株式会社 打印装置,图像处理装置,以及相关控制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JP特开2001-283231A 2001.10.12
JP特开平6-266897A 1994.09.22

Also Published As

Publication number Publication date
AU2008246275B2 (en) 2010-11-11
US20090257653A1 (en) 2009-10-15
KR101235226B1 (ko) 2013-02-21
CN101561877A (zh) 2009-10-21
JP2009258815A (ja) 2009-11-05
JP4539756B2 (ja) 2010-09-08
AU2008246275A1 (en) 2009-10-29
US8391607B2 (en) 2013-03-05
KR20090109047A (ko) 2009-10-19

Similar Documents

Publication Publication Date Title
CN101561877B (zh) 图像处理器及图像处理方法
CN101661465B (zh) 图像处理装置及图像处理方法
US8768052B2 (en) Image processing apparatus, image processing method, and non-transitory computer readable medium
US8824798B2 (en) Information processing device, computer readable medium storing information processing program, and information processing method
CN101155238B (zh) 图像区域检测方法及其装置
CN103425974A (zh) 图像处理装置和图像处理方法
US9171218B2 (en) Image processing apparatus, image processing method, and computer readable medium that recognize overlapping elements in handwritten input
US20150213332A1 (en) Image processing apparatus, non-transitory computer readable medium, and image processing method
CN101533392B (zh) 信息处理装置及信息处理方法
CN101686305B (zh) 图像处理装置、图像处理方法
US9392140B2 (en) Image processing apparatus
JP2009251872A (ja) 情報処理装置及び情報処理プログラム
JP4780184B2 (ja) 画像処理装置及び画像処理プログラム
JP5476884B2 (ja) 画像処理装置及び画像処理プログラム
JP2017010187A (ja) 画像処理装置及び画像処理プログラム
JP4840388B2 (ja) 画像処理装置及び画像処理プログラム
US9258446B2 (en) Image processing apparatus
CN103198291B (zh) 信息处理装置
US20100134849A1 (en) Image processing apparatus, image processing method and computer readable medium
JP6229254B2 (ja) 情報処理装置及び情報処理プログラム
JP2013161158A (ja) 画像処理装置及び画像処理プログラム
JP2017111720A (ja) 画像処理装置及び画像処理プログラム
JP2012209640A (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: Tokyo

Patentee after: Fuji film business innovation Co.,Ltd.

Address before: Tokyo

Patentee before: Fuji Xerox Co.,Ltd.