CN101339566A - 图像处理方法、图像处理设备、图像读取设备、成像设备 - Google Patents

图像处理方法、图像处理设备、图像读取设备、成像设备 Download PDF

Info

Publication number
CN101339566A
CN101339566A CNA2008101428590A CN200810142859A CN101339566A CN 101339566 A CN101339566 A CN 101339566A CN A2008101428590 A CNA2008101428590 A CN A2008101428590A CN 200810142859 A CN200810142859 A CN 200810142859A CN 101339566 A CN101339566 A CN 101339566A
Authority
CN
China
Prior art keywords
picture
file
document
image
reference picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008101428590A
Other languages
English (en)
Other versions
CN101339566B (zh
Inventor
小西阳介
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of CN101339566A publication Critical patent/CN101339566A/zh
Application granted granted Critical
Publication of CN101339566B publication Critical patent/CN101339566B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明提供一种图像处理方法、图像处理设备、图像读取设备、成像设备。当第一次判断为与文档图像相似的参考图像不是包含这个参考图像的文档类型的第一个文档页,作出错误发生的结论,以使得由计数器指示的页面数目被设置作为错误发生位置。在与该文档图像相似的参考图像是该文档类型的最后一个文档页的情形下,当这个文档图像被判断为与该参考图像相似时已经向上计数的文档图像的数目与被包含在该文档类型中的参考图像的数目不对应时,作出错误发生的结论,以使得由计数器指示的页面数目被设置作为错误发生位置。

Description

图像处理方法、图像处理设备、图像读取设备、成像设备
技术领域
本发明涉及:一种用于判断已获得的文档图像是否与预先准备的参考图像相似的图像处理方法和图像处理设备;以及一种使用这种图像处理设备的图像读取设备和成像设备。
背景技术
公知的技术是由多个页面组成的文档在预期的页面处被分割,以致于文档被分类,并且接着单个的被分类文档的页面图像被独立地编档(file)。在一个示例性方法中,具有识别标志的分割页被事先插入到文档的中断处。然后,当在通过图像读取装置例如扫描仪读取文档所获得的页面图像中检测到记录在分割页上的识别标志时,文档被分割。在另一个示例性方法中,当文档将要被图像读取设备读取时,用于分割文档的页面数目被事先指定。然后,当指定的页面数目的文档被读取时,文档被分割。
此外,为了通过读取文档而获得的页面图像的编档处理能在短时间内完成,提出一种图像编档设备,其中:多个子文档的页面图像被连续地读取和存储;然后,索引信息被生成以用于指示页面图像的每一个;然后,基于一个子文档的指定数目的页面,每个页面的索引信息以一种为每个子文档分割的方式被存储;从而当每次一个子文档的页面图像被读取时,无需在页面图像上执行编档处理,编档处理被在多个子文档的页面图像上逐文档地执行(参见公开号为H8-7071的日本专利申请)。
另一方面,作为一种匹配通过读取文档获取的页面图像和事先已存储的预定的图像并且从而判断图像的相似性的技术,公知的方法是,例如,通过OCR(光学字符读取器)提取通过读取文档所获得的页面图像中的关键字,并且接着基于所提取的关键字判断图像的相似性。在另一种方法中,将要执行相似性判断的文档被限制为包含分格线的页形式,并且接着从通过读取文档所获得的页面图像中提取分格线的特征以判断图像的相似性。
此外,提出一种匹配装置,其中输入文档的特征被提取以使得描述符被生成。然后,描述符与事先存储在描述符数据库中的描述符进行匹配,以使得与存储在描述符数据库中的描述符具有整体或部分一致性的文档从输入的文档中被搜索(参见公开号为H7-282088的日本专利申请)。
发明内容
然而,像在现有技术中将分割页插入到文档的方法中,在每一次对文档的扫描处理中,分割页需要在扫描前插入到文档的预期位置处。此外,分割页需要在扫描后从文档中被搜索并被移除。此外,在事先指定一个子文档的页面数目的方法中,允许被指定的页面数目的种类被限制为一个。因此,文档几乎总是使用相同的页面数目被分割的。这产生了一个问题,就是用于页面图像的编档处理对于一种文档是不能完成的,其中文档中每个子文档的页面数目互不相同。
在根据公开号为H8-7071的日本专利申请的上述设备中,为了达到处理其中每个子文档的页面数目互不相同的文档的目的,需要生成定义多个子文档中的每个的页面数目的描述文件。然后,所生成的描述文件需要事先被读取。因此,当文档由大量页面组成时,生成描述文件的工作是复杂的。此外,在根据公开号为H8-7071的日本专利申请的设备中,当文档的一部分具有页面省略或者页面替代,会产生问题,即每个子文档以非希望的状态存储。
进一步地,根据公开号为H7-282088的日本专利申请的上述设备基本地在单页面基础上对描述符执行匹配处理。即没有预计将多个页面组成的文档作为处理目标。因此,没有为下述情况给出描述,例如,当文档的一部分具有页面省略时将要执行的处理,在页面替代的情况下将要执行的处理,和将文档划分为多个子文档的处理。
本发明已经考虑到这些情形。本发明的一个目的是提供:一种无需通过用户的特殊操作、能够确定已获得的文档图像的顺序是否与事先存储的文档的顺序对应的图像处理方法和图像处理设备;以及一种使用该图像处理设备的图像读取设备和成像设备。
本发明的另一个目的是提供:一种图像处理方法和一种图像处理设备,即使当大量的文档被获得,该图像处理方法和图像处理设备也能够为每一个事先存储的文档划分该文档图像,并且容易地判定该已获得的文档图像的顺序是否与事先存储的文档的顺序对应;以及一种使用这种图像处理设备的图像读取设备和成像设备。
另外本发明的另一个目的是提供:一种能够提取文档图像特征、并且然后基于所提取的特征和已存储的参考图像的特征容易地判断该文档图像是否与该参考图像相似的图像处理方法和图像处理设备;以及一种使用这种图像处理设备的图像读取设备和成像设备。
本发明的另一个目的是提供:一种能够当文档图像的顺序被确定为不正确时通知用户该情形的图像处理方法和图像处理设备;以及一种使用这种图像处理设备的图像读取设备和成像设备。
根据本发明的该图像处理设备是一种用于判断已获得的文档图像是否与预先准备的参考图像相似、并且接着基于该判断结果在该文档图像上执行图像处理的图像处理设备,包括:用于存储多个类型识别符的存储装置,每一个类型识别符包括每一个都用于识别多个参考图像的每一个的一个或多个图像识别符,并且因此识别文档的类型;用于判断该已获得的文档图像是否与参考图像相似的判断装置;选择装置,用于当该判断装置判断该文档图像与参考图像相似时,从存储在该存储装置的图像识别符中选择识别该参考图像的图像识别符;以及确定装置,用于对包含由该选择装置选择的图像识别符的每个类型识别符,确定包含在该类型识别符中的图像识别符是否与用来识别被判断为与该文档图像相似的参考图像的图像识别符对应。
多个类型识别符事先被存储,每一个类型识别符包括每一个都用于识别多个参考图像的每一个的一个或多个图像识别符。类型识别符(文档类型索引)例如与识别由多个页面组成的每个子文档(文档的类型)的事物相对应,并且识别当大量文档被逐文档分类时使用的分类单元。此外,图像识别符(文档页面索引)用于识别每个参考图像,并且识别组成文档的每个文档页面。也就是说,参考文档依据文档类型索引(类型识别符)分类。然后,依据文档类型索引分类的文档包含被一个或多个文档页面索引(图像识别符)识别的参考图像。
判断该已获得的文档图像是否与参考图像相似。相似性判断的方法可以是,例如,从单个图像提取的特征相互之间进行比较,以此计算相似性。当该文档图像被判断为与参考图像相似,从多个图像识别符中选择识别该参考图像的图像识别符。然后,识别包含所选图像识别符的类型识别符。因此,确定哪个类型识别符包含与该文档图像相似的参考图像。此外,类型识别符能够被识别。对于每个被识别的类型识别符,确定包含在该类型识别符中的图像识别符是否与用来识别被判断为与该文档图像相似的参考图像的图像识别符对应。因此,可以确定已获得的文档图像的顺序是否与包含在事先存储的每个文档中的参考图像的顺序对应。因此,当组成每个文档的参考图像被存储一次,能够确定在已获得的文档图像中页面省略的存在或不存在和页面替代的存在或不存在,而无需通过用户的特殊操作。此外,当上述处理在由图像读取设备所读取的图像上执行时,除了在读取的文档图像中的页面省略的存在或不存在以及页面替代的存在或不存在之外,堆叠页面馈送的存在或不存在也可以被判定。
根据本发明的图像处理设备是一种图像处理设备,其中图像识别符包含用于指示该参考图像是否是包含在文档类型中的第一个参考图像的识别符,该文档类型是由包含该图像识别符自身的类型识别符所识别的,并且其中该图像处理设备进一步包括:用于以下的装置:每次文档图像被判断为与参考图像相似时,将被判断为相似的文档图像的数目向上计数;以及用于以下的装置:当第一个页被向上计数时,基于由选择装置选择的图像识别符确定该参考图像是否是第一个参考图像;其中当该参考图像被确定为不是第一个参考图像时,该确定装置确定由包含由选择装置选择的图像识别符的类型识别符识别的文档的顺序与已经被存储的文档的顺序不对应。
用于识别每个参考图像的该图像识别符包含用于指示该参考图像是否是包含在文档类型中的第一个参考图像的识别符,该文档类型是由包含该图像识别符自身的类型识别符所识别的。当第一次判断该文档图像与参考图像相似时,确定这个参考图像是否为包含该参考图像的文档的第一个参考图像。当该参考图像不是第一个参考图像时,该文档图像的顺序被确定为与被包含在事先存储的文档中的参考图像的顺序不对应。因此,在第一次判断该文档图像与参考图像相似的情况下,当与该文档图像相似的参考图像不是该文档的第一个参考图像时,作出该文档图像的顺序有错误的结论。相应地,即使获得了大量的文档,对每一个类型识别符,文档能够被容易地划分,并且将要被分类的文档分隔能够被检测和划分。同时,能够确定该文档图像的顺序是否是正确的。
根据本发明的图像处理设备是一种图像处理设备,其中该图像识别符包含用于指示该参考图像是否是包含在文档类型中的最后一个参考图像的识别符,该文档类型是由包含该图像识别符自身的类型识别符所识别的,并且其中该图像处理设备进一步包括:用于以下的装置:每次文档图像被判断为与参考图像相似时,将被判断为相似的文档图像的数目向上计数;用于以下的装置:当判断装置判断该文档图像与该参考图像相似时,基于由选择装置选择的图像识别符确定该参考图像是否是最后一个参考图像;以及用于以下的装置:当该参考图像被确定为是最后一个参考图像时,确定已计数的文档图像的数目是否与被包含在类型识别符中的图像识别符的数目对应,该类型识别符包含由选择装置选择的图像识别符;其中当已计数的文档图像的数目被确定为与被包含在该类型识别符中的图像识别符的数目不对应时,确定装置确定由包含由选择装置选择的图像识别符的类型识别符识别的文档的顺序与已经被存储的文档的顺序不对应。
用于识别每个参考图像的该图像识别符包含用于指示该参考图像是否是包含在文档类型中的最后一个参考图像的识别符,该文档类型是由包含该图像识别符自身的类型识别符所识别的。每次文档图像被判断为与参考图像相似时,将被判断为相似的文档图像的数目向上计数。此外,当文档图像被判断为与参考图像相似时,确定该参考图像是否是包含该参考图像的文档的最后一个参考图像。当该参考图像是最后一个参考图像时,确定已计数的文档图像的数目是否与被包含在该类型识别符中的图像识别符的数目对应。当确定该文档图像的数目与该图像识别符的数目不对应时,该文档图像的顺序被确定为与被包含在事先存储的文档中的参考图像的顺序不对应。因此,在该文档图像与文档的最后一个参考图像相似的情形下,当目前已经向上计数的文档图像的数目与被包含在该文档中的参考图像的数目不对应时,作出该文档图像的顺序有错误的结论。相应地,即使获得了大量的文档,对每一个类型识别符,文档能够容易地被划分,并且将要被分类的文档分隔能够被检测和划分。同时,能够确定该文档图像的顺序是否是正确的。
根据本发明的图像处理设备是一种图像处理设备,其中该图像识别符包含用于指示在文档类型中的页面数目的识别符,该文档类型是由包含该图像识别符自身的类型识别符所识别的,并且其中该图像处理设备进一步包含:用于以下的装置:每次文档图像被判断为与参考图像相似时,将被判断为相似的文档图像的数目向上计数;用于以下的装置:当判断装置判断该文档图像与该参考图像相似时,基于由选择装置选择的图像识别符检测该参考图像的页面数目;以及用于以下的装置:确定已检测的页面数目是否与已计数的文档图像的数目对应;其中当已检测的页面数目被确定与已计数的文档图像的数目不对应时,确定装置确定由包含由选择装置选择的图像识别符的类型识别符识别的文档的顺序与已经被存储的文档的顺序不对应。
用于识别每个参考图像的该图像识别符包含用于指示在文档类型中的页面数目的识别符,该文档类型是由包含该图像识别符自身的类型识别符所识别的。每次文档图像被判断为与参考图像相似时,将被判断为相似的文档图像的数目向上计数。此外,当该文档图像被判断为与参考图像相似时,检测该参考图像的页面数目。然后,确定已检测的页面数目是否与已计数的文档图像的数目对应。当确定该页面数目与该文档图像的数目不对应时,该文档图像的顺序被确定为与被包含在事先存储的文档中的参考图像的顺序不对应。因此,在该文档图像与参考图像相似的情形下,当与该文档图像相似的参考图像的页面数目与目前已经向上计数的文档图像的数目不对应时,作出该文档图像的顺序有错误的结论。相应地,对于由多个文档图像组成的文档,能够在页面的基础上确定该文档图像的顺序是否是正确的。
根据本发明的图像处理设备是一种图像处理设备,其中该图像识别符包含用于指示该图像是一个文档页的正面图像或背面图像的识别符,该判断装置判断从该一个文档页的正面和背面获得的两个文档图像是否分别与参考图像相似,并且当该判断装置判断该两个文档图像分别与参考图像相似时,该选择装置从存储在存储装置上的图像识别符中选择每一个识别该参考图像的图像识别符,并且其中该图像处理设备进一步包括:用于以下的装置:基于由选择装置选择的图像识别符,确定该两个参考图像是否是该一个文档页的正面图像和背面图像;以及用于以下的装置:当该两个参考图像被确定为该一个文档页的正面图像和背面图像时,确定与从该一个文档页正面获得的文档图像相似的参考图像是否是该正面图像,以及与从该一个文档页背面获得的文档图像相似的参考图像是否是该背面图像;其中当确定与从该一个文档页正面获得的文档图像相似的参考图像是该背面图像以及与从该一个文档页背面获得的文档图像相似的参考图像是该正面图像时,确定装置确定由包含由选择装置选择的图像识别符的类型识别符识别的文档的顺序与已经被存储的文档的顺序不对应。
根据本发明的图像处理设备是一种图像处理设备,进一步包括:用于以下的装置:当确定与从该一个文档页正面获得的文档图像相似的参考图像是该背面图像以及与从该一个文档页背面获得的文档图像相似的参考图像是该正面图像时,交换该两个文档图像的正面和背面。
用于识别每个参考图像的该图像识别符包含用于指示该图像是该一个文档页的正面图像或背面图像的识别符。当从该一个文档页的正面和背面获得的两个文档图像被判断为分别与参考图像相似时,确定这两个参考图像是否是该一个文档页的正面图像和背面图像。当这两个参考图像被确定是该一个文档页的正面图像和背面图像时,确定与从该一个文档页正面获得的文档图像相似的该参考图像是否是该正面图像,以及与从该一个文档页背面获得的文档图像相似的该参考图像是否是该背面图像。当确定与从该一个文档页正面获得的文档图像相似的该参考图像是该背面图像以及与从该一个文档页背面获得的文档图像相似的该参考图像是该正面图像时,确定该文档图像的顺序与被包含在事先存储的文档中的参考图像的顺序不对应。此外,当确定与从该一个文档页正面获得的文档图像相似的该参考图像是该背面图像以及与从该一个文档页背面获得的文档图像相似的该参考图像是该正面图像时,该两个文档图像的正面和背面能够被交换以使得在其中正面和背面被替代的该文档能够被正确地恢复。
根据本发明的图像处理设备是一种图像处理设备,其中该存储装置存储与该参考图像的图像识别符相关联的特征,并且其中该图像处理设备进一步包括用于提取该已获得的文档图像的特征的提取装置,其中基于由该提取装置提取的特征和存储在该存储装置中参考图像的特征,该判断装置判断该文档图像是否与该参考图像相似。
参考图像的该特征(特征向量,例如哈希值)和该图像识别符(文档页面索引)以互相相关的方式事先被存储,例如,以哈希表的方式。文档图像的该特征(特征向量,例如,哈希值)被提取。然后,确定该提取的特征是否与存储在哈希表中的特征对应。在对应的情形下,对与该特征对应的图像识别符执行投票。对于该文档图像的各个特征执行相似处理。然后,具有最大数目投票的图像识别符被识别,以使得该文档图像被判断为与被具有最大数目的投票的该图像识别符所识别的参考图像相似。该文档图像的该特征被提取。然后,基于提取的特征和参考图像已存储的特征,与这些特征对应的图像识别符被识别。然后,该文档图像被判断为与由该图像识别符识别的该参考图像相似。因此,无需存储该参考图像本身,仅仅通过存储与该参考图像对应的特征,就能够容易地判断文档图像是否与参考图像相似。
根据本发明的图像处理设备是一种图像处理设备,进一步包括用于以下的装置:当确定装置确定由包含由选择装置选择的图像识别符的类型识别符识别的文档的顺序与已经被存储的文档的顺序不对应时通知这种情况。
当该文档图像的顺序与事先存储的文档中的参考图像的顺序不对应时,即当该文档图像的顺序被确定为不正确时,这种情况被通知。因此,即使在获得大量文档的情形下,当页面省略、页面替代、或者类似的情况发生在已获得的文档中时,用户可以容易地识别该情况。用于通知该用户的一个示例性方法是将该情况显示在提供在该图像处理设备、该图像读取设备或该成像设备上的操作板的显示部分上。此外,当该文档图像被连接到计算机的图像读取设备(扫描仪)读取时,该情况可以在该计算机的显示器上被显示。
根据本发明的图像读取设备是一种图像读取设备,包括:用于读取文档图像的图像读取装置;和任意一个上述图像处理设备;其中该图像处理设备处理由该图像读取装置读取的文档图像。
根据本发明的成像设备是一种成像设备,包括:任意一个上述图像处理设备;和基于由该图像处理设备处理的文档图像形成输出图像的成像设备。
根据本发明的计算机程序是一种计算机程序,用于使计算机判断已输入的文档图像是否与事先存储的参考图像相似,并且然后,基于该判断结果,在该文档图像上执行图像处理,其中该计算机程序包括步骤:使该计算机判断该已输入的文档图像是否与多个参考图像的任意一个相似;当文档图像被判断为与参考图像相似时,使该计算机从每一个都用于识别参考图像的多个图像识别符中选择识别该参考图像的图像识别符;并且使该计算机,对于每个包含该被选择的图像识别符的类型识别符,确定被包含在该类型识别符中的该图形识别符是否与用来识别被判断为与该文档图像相似的参考图像的该图像识别符对应。
根据本发明的计算机可读存储器产品存储上述计算机程序。
本发明的上述和进一步的目的和特征将通过接下来的参照附图的详细描述而更加明显。
附图说明
图1是显示使用根据本发明的图像处理设备的成像设备的结构的框图;
图2是显示文档匹配处理部分的结构的框图;
图3是显示特征点计算部分的结构的框图;
图4是显示滤波部分的滤波系数的例子的说明图;
图5是显示连通分量的特征点的例子的说明图;
图6是显示对于字符串的特征点的提取结果的例子的说明图;
图7是显示当前特征点和周围特征点的说明图;
图8是显示计算关于当前特征点的不变量的例子的说明图;
图9是显示计算关于当前特征点的不变量的例子的说明图;
图10是显示计算关于当前特征点的不变量的例子的说明图;
图11是显示计算关于当前特征点的不变量的例子的说明图;
图12A和12B是显示哈希表结构的说明图;
图13A和13B是显示文档图像将要被登记的情形的例子的说明图;
图14是显示将要被存储的文档的例子的说明图;
图15A和15B是显示文档图像表和文档分类表的结构的说明图;
图16是显示基于投票结果的相似性判断的例子的说明图;
图17是显示文档存储处理过程的流程图;
图18A到18E是显示对文档图像的顺序的检测处理过程的流程图;
图19是显示文档匹配处理过程的流程图;
图20是显示文档图像表结构的说明图;
图21是显示文档存储处理过程的流程图;
图22A到22E是显示对文档图像顺序的检测过程的流程图;
图23是显示将要被存储的文档的例子的说明图;
图24是显示文档图像表的结构的说明图;
图25是显示文档存储处理过程的流程图;
图26A到26F是显示对文档图像顺序的检测处理过程的流程图;和
图27是显示根据本发明的图像读取设备的结构的框图。
具体实施方式
本发明将在下面参照显示其实施例的附图进行描述。
(实施例1)
图1是使用根据本发明的图像处理设备的成像设备100的结构的框图。成像设备100(例如,数字彩色复印机或拥有组合功能例如打印机功能、传真和e-mail分发功能的多功能外围设备)包括彩色图像输入设备1、彩色图像处理设备2(图像处理设备)、彩色图像输出设备3、和用于各种操作的操作板4。当彩色图像输入设备1读取文档时获得的RGB(R:红,G:绿,B:蓝)的模拟信号的图像数据被输出至彩色图像处理设备2,然后由在彩色图像处理设备2中预定的处理而被处理,并且然后被作为CMYK(C:青色,M:绛红色,Y:黄色,K:黑色)的数字彩色信号输出至彩色图像输出设备3。
彩色图像输入设备1是,例如,拥有CCD(电荷耦合装置)的扫描仪。彩色图像输入设备1从文档图像以RGB模拟信号的形式读取反射的光图像,并且然后输出读取的RGB信号至彩色图像处理设备2。此外,彩色图像输出设备3是使用电子摄影术方法或喷墨方法的成像设备,用于输出文档图像的图像数据到记录纸张之上。此外,彩色图像输出设备3可以是例如显示器的显示单元。
彩色图像处理设备2是由A/D转换部分20、阴影校正部分21、输入色调校正部分22、分段处理部分23、文档匹配处理部分24、彩色校正部分25、黑色生成和底色移除部分26、空间滤波处理部分27、输出色调校正部分28、色调再现处理部分29、控制这些硬件部分操作的CPU(中央处理单元)、ASIC(特定用途集成电路)、以及类似的部件构建的。
A/D转换部分20将从彩色图像输入设备1输入的RGB信号转换为,例如,10-位数字信号,并且然后输出转换的RGB信号至阴影校正部分21。阴影校正部分21执行校正处理,其中在彩色图像输入设备1的照明系统、图像聚焦系统、以及图像感测系统中生成的各种失真从输入的RGB信号中被移除,并且然后输出转换的RGB信号(图像)至输入色调校正部分22。
输入色调校正部分22在移除各种失真后对RGB信号执行调整彩色平衡的处理,并且执行将信号转换为那些容易被彩色图像处理设备2采用的图像处理系统处理的例如密度信号的处理。此外,输入色调校正部分22执行图像质量调整处理,例如页面背景密度移除或对比,并且然后输出处理的RGB信号至分段处理部分23。
基于输入的RGB信号,分段处理部分23将输入图像的各个像素分离成文本分量、半色调分量、和图片分量。基于分段结果,分段处理部分23输出用于指示每一个像素属于哪个段的分段类信号至黑色生成和底色移除部分26、空间滤波处理部分27和色调再现处理部分29。此外,分段处理部分23原样输出输入的RGB信号至随后阶段的文档匹配处理部分24。
文档匹配处理部分24二进制化输入的图像(文档图像),然后计算基于二进制图像指定的连通分量的特征点(例如重心),然后从计算的特征点中选择多个特征点,然后基于选择的特征点计算不变量,然后计算用作不变量的特征(例如哈希值)。在文档存储模式(其中将要存储文档),文档匹配处理部分24基于计算的特征存储输入的图像作为参考图像。此外,当文档图像将要被分类并且同时其要被检测单个文档图像的顺序是否是正确的,文档匹配处理部分24基于计算的特征判断每个文档图像是否与参考图像相似。然后,基于判断结果,文档匹配处理部分24为每个文档类型分类文档图像,并且然后确定包含在每个文档类型中的文档图像的顺序是否对应于参考图像的顺序。因此,文档图像所属的文档类型能够被确定,并且,同时,在确定的文档类型中,能够确定文档图像中的页面省略的存在或不存在、文档图像中的顺序替代的存在或不存在、文档图像的堆叠馈送的存在或不存在、以及类似情况。
当输入的文档图像的顺序与参考图像的顺序不同时,例如当在一部分文档图像中存在页面省略时,和当文档图像的顺序被替代时,在文档匹配处理部分24对所有的文档图像的处理已经完成时,成像设备100在操作板4上显示文档图像的顺序与参考图像的顺序不同的位置(错误发生位置或者文档划分重新开始位置),以此通知用户。此外,文档匹配处理部分24原样输出输入的RGB信号至随后阶段的彩色校正部分25。
代替上述结构,文档匹配处理部分24被提供在分段处理部分23的随后阶段中,文档匹配处理部分24可以与输入色调校正部分22平行提供,或者提供在阴影校正部分21和输入色调校正部分22之间。这里,在这种情形下,调整彩色平衡的处理以及将数据转换为密度信号的处理由阴影校正部分21执行。
彩色校正部分25将输入的RGB信号转换到CMY彩色空间,然后依据彩色图像输出设备3的特点执行彩色校正,并且然后输出校正的CMY信号至黑色生成和底色移除部分26。特别地,为了在彩色再现中的高保真度目的,彩色校正部分25基于包含不必要吸收分量的CMY彩色物质的光谱特征执行移除彩色杂质的处理。
基于从彩色校正部分25输入的CMY信号,黑色生成和底色移除部分26生成K(黑色)信号,并且同时,从输入的CMY信号中减去K信号以生成新的CMY信号,并且然后输出生成的CMYK信号至空间滤波处理部分27。在黑色生成和底色移除部分26中的处理的示例将在下面描述。例如,在通过使用轮廓黑色(skeleton black)的黑色生成处理的情形下,轮廓曲线(skeleton curve)的输入输出特征被表示为y=f(x),输入数据由C、M、和Y表示,输出数据由C’、M’、Y’、和K’表示,并且UCR(底色移除)比率由α(0<α<1)表示。然后,在黑色生成和底色移除处理中输出的数据被表示为K’={min(C,M,Y)}、C’=C-αK’、M’=M-αK’、和Y’=Y-αK’。
空间滤波处理部分27基于分段类信号通过数字滤波器在从黑色生成和底色移除部分26输入的CMYK信号上执行空间滤波。由于这点,图像数据的空间频率特性被校正以使得在彩色图像输出设备3中避免了在输出图像中发生模糊或颗粒退化。例如,为了改善尤其是黑色字符(文本)或彩色字符的可再现性,空间滤波处理部分27执行边缘增强处理,以此来加强对于由分段处理部分23分离为文本分量的分段的高频分量。此外,空间滤波处理部分27在由分段处理部分23分离为半色调分量的分段上执行用于移除输入半色调分量的低通滤波。空间滤波处理部分27输出处理的CMYK信号至输出色调校正部分28。
输出色调校正部分28执行输出色调校正处理来将从空间滤波处理部分27输入的CMYK信号转换为半色调屏幕区域比率,比率是彩色图像输出设备3的特征值。然后,输出色调校正部分28输出已经历过输出色调校正处理的CMYK信号至色调再现处理部分29。
基于从分段处理部分23输入的分段类信号,色调再现处理部分29在从输出色调校正部分28输入的CMYK信号上执行预定的处理。例如,为了改善尤其是黑色字符或彩色字符的可再现性,色调再现处理部分29在被分离为文本分量的分段上执行二进制化处理或多层抖动处理,这样信号会变得合适于在彩色图像输出设备3中再现高频分量。此外,色调再现处理部分29在由分段处理部分23分离为半色调分量的分段上执行色调再现处理(半色调生成),这样图像最终被分离为像素以使得每个色调能够被再现。此外,色调再现处理部分29在由分段处理部分23分离为图片分量的分段上执行二进制化处理或多层抖动处理,这样信号会变得合适于在彩色图像输出设备3中再现色调。
彩色图像处理设备2临时将由色调再现处理部分29处理的图像数据(CMYK信号)存储在存储部分(没有示出)。然后,在预定的执行成像的时间里,彩色图像处理设备2读取存储在存储部分的图像数据,并且然后输出读取的图像数据至彩色图像输出设备3。对这些的控制例如由CPU(没有示出)执行。
操作板4由例如液晶显示器的显示部分、设置按钮和类似的部件构造。彩色图像输入设备1、彩色图像处理设备2和彩色图像输出设备3的操作是基于从操作板4中输入的信息(例如对于存储文档的文档存储模式的指定,可选的关于在每个分类的文档中的文档图像的例如编档、复制、电子分发或其它类似的输出处理的选择,以及类似的信息)被控制的。
图2是显示文档匹配过程部分24的结构的框图。文档匹配处理部分24包括:特征点计算部分241、特征计算部分242、投票处理部分243、相似性判断处理部分244、文档分类处理部分245、存储器246、和用于控制这些部分的控制部分247。
特征点计算部分241在输入的图像上执行随后描述的预定的处理,并且二进制化输入的图像、提取(计算)基于二进制图像指定的连通分量的特征点(例如,通过累加在二进制图像中组成连通分量的各个像素的座标值、以及通过将累加的座标值除以在连通分量中包含的像素的数目而获得的值)。特征点计算部分241使存储器246存储提取的特征点,并且输出提取的特征点至特征计算部分242。
图3是显示特征点计算部分241的结构的框图。特征点计算部分241包含:信号转换处理部分2410、分辨率转换部分2411、滤波部分2412、二进制处理部分2413、和重心计算部分2414。
当输入的图像是彩色图像时,信号转换处理部分2410消色差和转换彩色图像为亮度信号或者明度信号,并且然后输出转换的图像至分辨率转换部分2411。例如,当每个像素的彩色分量RGB分别由Rj、Gj、和Bj表示时,亮度信号Yj表示为Yj=0.30×Rj+0.59×Gj+0.11×Bj。这里,本发明并不局限于这个公式。即RGB信号可以被转换为CIE1976L*a*b*信号。
即使当输入的图像是在彩色图像输入设备1中的已经历过光学放大改变的图像时,分辨率转换部分2411在输入的图像上再次执行放大改变,以此实现预定的分辨率,并且然后将已经历过放大改变的图像输出至滤波部分2412。由于这点,即使当放大改变处理已经被彩色图像输入设备1执行由此分辨率已经改变了时,特征点的提取也能够免受它的影响而实现。这允许对文档的精确地分类。尤其是,在尺寸减少字符的情形下,避免了以下可能性:当连通分量要由二进制过程处理指定时,被弄脏的字符导致原本分离的区域被指定,好像它们互相连接,从而计算的重心可能偏离。此外,分辨率转换部分2411将图像转换为分辨率小于当图像是由彩色图像输入设备1使用单位放大率所读取时所获得的分辨率的图像。例如,被彩色输入设备1以600dpi(点每英寸)所读取的图像被转换为以300dpi的图像。这就减少了在随后阶段的处理量。
滤波部分2412校正输入的图像的空间频率特性(例如,图像的增强处理和平滑),并且然后输出校正的图像至二进制处理部分2413。由于依据每个型号彩色图像输入设备1的空间频率特性是不同的,滤波部分2412将不同的空间频率特性校正为所需的特性。在从彩色图像输入设备1输出的图像中(例如,图像信号),在图像中例如模糊的退化是由例如以下引起的:例如镜头和镜子的光学系统部分;光圈比率、转换效率、和CCD受光表面的后图像;以及由物理扫描引起的存储效果和扫描不均。滤波部分2412在边界或边缘上执行增强处理,以此恢复例如在图像中产生的模糊的退化。此外,滤波部分2412执行平滑用于抑止高频分量,这些高频分量在随后阶段执行的特征点提取处理中是不需要的。这允许准确提取特征点,并且因此获得准确确定图像的相似性。这里,在滤波部分2412中使用的滤波系数可以依据所使用的彩色图像输入设备1的型号、特性或者类似的性质而被适当地设置。
图4是显示滤波部分2412的滤波系数的例子的说明图。如图所示,空间滤波器是例如具有7×7(7行乘以7列)尺寸的混合滤波器,并且其执行增强处理和平滑处理。输入的图像的像素被扫描以使得由空间滤波器实行的算术处理在所有的像素上执行。这里,空间滤波器的尺寸不限制于7×7的尺寸。即尺寸可以是3×3、5×5、或类似的尺寸。此外,滤波系数的数值是个例子。即实际值不局限于这个例子,并且可以依据所使用的彩色图像输入设备1的型号、特性、或类似的性质来而被适当地设置。
二进制处理部分2413将阈值与输入图像的亮度值(亮度信号)或明度值(明度信号)进行比较,以此来二进制化图像,并且然后输出经历了二进制化的二进制图像至重心计算部分2414。基于从二进制处理部分2413输入的二进制图像的每个像素的二进制化信息(例如,由“1”和“0”表示),重心计算部分2414对每个像素贴标签(贴标签处理)。然后重心计算部分2414指定连通分量,连通分量上具有相同标签的像素是连续的,然后提取指定的连通分量的重心作为特征点。重心计算部分2414使存储器246存储提取的特征点并且输出提取的特征点至特征计算部分242。这里,特征点由二进制图像中的座标(x-座标,y-座标)表示。
图5是显示连通分量的特征点的例子的说明图。在图中,指定的连通分量是字符“A”,并且其被指定作为一组像素,该组像素被给予了相同的标签。这个字符“A”的特征点(重心)被定位于在图中由黑点指示的位置(x-座标,y-座标)。图6是显示对于字符串的特征点的提取结果的例子的说明图。在字符串由多个字符组成的情形下,基于各种字符提取具有不同的座标的多个特征点。
特征计算部分242采用每个从特征点计算部分241输入的特征点(即连通分量的重心的座标值),作为当前特征点,并且然后提取与当前特征点具有较小距离的周围的例如四个特征点。
图7是显示当前特征点和周围特征点的说明图。如图所示,例如,为当前特征点P1提取被封闭曲线S1包围的四个特征点(对于当前特征点P1,当前特征点P2也作为一个特征点被提取)。此外,对于当前特征点P2,例如,被封闭的曲线S2包围的四个特征点被提取(对于当前特征点P2,当前特征点P1也作为一个特征点被提取)。
特征计算部分242从四个被提取的特征点中选择三个特征点以此来计算不变量。这里,选择的特征点的数目不局限于三个。即四个、五个、或类似个数的特征点可以被选择。被选择的特征点的数目依据预期的不变量的种类而不同。例如,从三个特征点计算的不变量是相似性不变量(关于包括旋转、平行移动和扩展/缩小的几何改变的不变的参数)。
图8是显示计算关于当前特征点P1的不变量的例子的说明图。图9是显示计算关于当前特征点P2的不变量的例子的说明图。如图8所示,从当前特征点P1周围的四个特征点中选择三个特征点。然后,三种不变量分别由H1j(j=1,2,3)表示。每个不变量H1j由表示为H1j=A1j/B1j的公式计算。这里,A1j和B1j的每一个表示特征点之间的距离,并且距离基于各自的特征点的座标计算。因此,例如,即使当文档被旋转、移动、或倾斜时,不变量H1j并不改变。相应地,以满意的精度确定图像相似性,并且因此能够以满意的精度确定相似的文档。
相似地,如图9所示,从当前特征点P2周围的四个特征点中选择三个特征点。然后,三种不变量分别由H2j(j=1,2,3)表示。每个不变量H2j由表示为H2j=A2j/B2j的公式计算。这里,A2j和B2j的每一个表示特征点之间的距离,并且距离基于各自的特征点的座标计算,与已经描述的相同。依照相似的过程,可以为其它的当前特征点计算不变量。
基于为每个当前特征点计算的不变量,特征计算部分242计算哈希值(特征)Hi。当前特征点Pi的哈希值表示为Hi=(Hi1×102+Hi2×101+Hi3×100)/E。这里,E是一个常数,其由期望余数为多大来确定。例如,当常数被设为“10”,余数落入“0”和“9”之间。这就提供了能由被计算的哈希值取值的范围。此外,i是一个自然数,并且i表示特征点的数目。
为当前特征点计算不变量的方法并不限于上述方法。图10是显示计算关于当前特征点P3的不变量的另一个例子的说明图。图11是显示计算关于当前特征点P4的不变量的另一个例子的说明图。如图10所示,从当前特征点P3周围的四个特征点中选择三个特征点,并且四种不变量分别由H3j(j=1,2,3,4)表示。不变量H3j可以由H3j=A3j/B3j计算,与上述方法相似。
如图11所示,从当前特征点P4周围的四个特征点中选择三个特征点,并且四种不变量分别由H4j(j=1,2,3,4)表示。不变量H4j可以由H4j=A4j/B4j计算。在这种情形下,当前特征点Pi的哈希值Hi通过Hi=(Hi1×103+Hi2×102+Hi3×101+Hi4×100)/E计算。
这里,上述哈希值作为特征是一个例子,并不局限于此。可以应用另一种哈希函数。上述实例已经描述了四个点被提取作为其它周围特征点的情形。然而,点的数目不局限于四个。例如,六个特征点可以被提取。在这种情形下,可以从六个特征点提取五个点。然后,对于提取五个点的六种方法的每一种方法,可通过从五个点提取三个点来计算不变量,以使得哈希值可以被计算出来。
例如,当由多个页面组成的文档的图像将要被存储时(在文档存储模式的情形下),特征计算部分242为被包含在文档中的单个图像设置参考图像的文档页面索引(例如,ID1、ID2、...)。每个文档页面索引被用于识别每个参考图像,并且识别组成文档的每个文档页面。在文档存储模式的情形下,特征计算部分242为每个文档设置文档类型索引(例如,DocID1、DocID2、...)。每个文档类型索引对应于用于识别由多个页面组成的每个子文档(文档的类型)的内容,并且识别当大量的文档逐文档地被分类时所使用的分类单元。在文档存储模式的情形下,特征计算部分242为每个参考图像将在上述处理中计算的哈希值(例如,H1、H2、...)和所设置的文档页面索引存储在哈希表中。
图12A和12B是显示哈希表2461结构的说明图。如图12A所示,哈希表2461的结构由包含哈希值和文档页面索引的各个字段构建。更具体地,对应于文档页面索引,指示文档中位置的点索引和不变量(都没有示出)被存储。为了判断图像的相似性,图像的匹配信息、文档图像、或类似的将要被匹配的事务被事先存储在哈希表2461中。哈希表2461被存储在存储器246中。这里,如图12B所示,当哈希值相互之间相等时(H1=H5),在哈希表2461中的两个表项可以统一。
图13A和13B是显示文档图像将要被存储的情形的例子的说明图。如图13A所示,当具有三个页面(P1,P2,P3)的文档要被存储时,如图13B所示,特征计算部分242分别为三个页面的图像(P1,P2,P3)以页面顺序设置文档页面索引ID1、ID2、和ID3,并且然后分别为具有文档页面索引ID1、ID2、和ID3的单个图像计算哈希值(例如H1、H2、...)。特征计算部分242设置头部标志(其指示每个图像是否是文档的第一个页面),并且设置末端标志(其指示每个图像是否是文档的最后一个页面)。这里,当每个图像是文档的第一个页面时,特征计算部分242将相应的头部标志设置为1。此外,当每个图像是文档的最后一个页面时,特征计算部分242将相应的末端标志设置为1。当每个图像不是这些页面时,特征计算部分242将相应的头部标志和相应的末端标志设置为0。
特征计算部分242为了识别具有三个页面的文档(文档的类型)的整体,设置文档类型索引DocID1。同时,特征计算部分242设置已经以页面顺序为单个图像设置的文档页面索引的数目为参考页面的数目(这种情形下为“3”)。特征计算部分242存储文档页面索引、头部标志、末端标志、和文档类型索引到稍后描述的文档图像表中。此外,特征计算部分242存储文档类型索引和参考页面的数目到稍后描述的文档分类表中。
图14是显示将要被存储的文档的例子的说明图。如图14所示,接下来给出的描述是两种类型文档将要被存储的情形。为由三个页面的参考图像组成的文档设置文档类型索引DocID1。然后,为这些页面设置文档页面索引ID1、ID2、和ID3。相似地,为由两个页面的参考图像组成的文档设置文档类型索引DocID2。然后,为这些页面设置文档页面索引ID4和ID5。
图15A是显示文档图像表2462的结构的说明图,图15B是显示文档分类表2463的结构的说明图。文档图像表2462由包括文档页面索引、头部标志、末端标志、和文档类型索引的各个字段构建。文档分类表2463由包括文档类型索引和参考页面数目的各个字段构建。在文档存储模式下,文档图像表2462和文档分类表2463在每次文档被存储时被更新。图15A和图15B表示如图14中所示的两种文档将被存储情形时的文档图像表2462和文档分类表2463。
即根据文档图像表2462,由文档页面索引ID1识别的参考图像被包含在由文档类型索引DocID1识别的文档中,并且是这个文档的第一个页面。由文档页面索引ID2识别的参考图像被包含在由文档类型索引DocID1识别的文档中,并且既不是这个文档的第一个页面也不是这个文档的最后一个页面。由文档页面索引ID3识别的参考图像被包含在由文档类型索引DocID1识别的文档中,并且是文档的最后一个页面。此外,根据文档分类表2463,由文档类型索引DocID1识别的文档的参考页面的数目是“3”。
相似地,根据文档图像表2462,由文档页面索引ID4识别的参考图像被包含在由文档类型索引DocID2识别的文档中,并且是该文档的第一个页面。由文档页面索引ID5识别的参考图像被包含在由文档类型索引DocID2识别的文档中,并且是该文档的最后一个页面。此外,根据文档分类表2463,由文档类型索引DocID2识别的文档的参考页面的数目是“2”。
当文档匹配处理部分24为每个文档类型分类输入的文档图像、并且然后确定被包含在每个文档类型中的文档图像的顺序是否对应于参考图像的顺序时,在要判断每个文档图像是否与事先存储的参考图像相似的情形下,特征计算部分242将单个文档图像的已计算的哈希值存储到存储器246中。
基于由特征计算部分242计算的哈希值(特征),投票处理部分243搜索存储在存储器246中的哈希表2461。当哈希值符合时,投票处理部分243为存储在哈希值上的文档页面索引(即哈希值符合的图像)投票。通过累加投票获得的结果作为获得的投票的数目输出到相似性判断处理部分244。
基于从投票处理部分243输入的投票结果,相似性判断处理部分244判断读取的文档图像是否与任何参考图像相似,并且然后输出判断结果至文档分类处理部分245。更具体地,相似性判断处理部分244将从投票处理部分243输入的所获得的投票的数目除以文档图像所获得的投票的最大数目(表示为:特征点的数目×从一个特征点计算来的哈希值的数目),以此来计算标准化的相似性。然后,相似性判断处理部分244将计算的相似性与事先确定的阈值Th(例如,0.8)进行比较。当相似性大于或等于阈值Th时,判断确定处理部分244判断文档图像与计算出相似性的参考图像相似。当相似性比阈值Th小时,相似性判断处理部分244作出不存在与文档图像相似的参考图像的结论,并且然后输出判断结果(当图像相似时为文档页面索引)至文档分类处理部分245。这里,从投票处理部分243输入的所获得的投票的数目可以与事先定义的阈值进行比较。然后,当所获得的投票的数目大于或等于阈值时,就可以判断文档图像与事先存储的参考图像相似,并且进一步可以判断在被判断为相似的参考图像中具有最大的获得的投票数目的参考图像对应于文档图像。
图16是显示基于投票结果的相似性判断的例子的说明图。如图13B所示,哈希表2462被搜索并且对每一个从文档图像计算得到的哈希值执行投票。然后,假设作为结果,已经为参考图像执行了投票,其中文档页面索引是ID1、ID2、和ID3。然后,每个被获得作为投票结果的所获得的投票的数目除以文档图像所获得的投票的最大数目,以使得标准化的相似性N1、N2、和N3被计算出来。具有已计算的大于或等于阈值Th的相似性的参考图像是具有文档页面索引ID1的参考图像。因此,文档图像被判断为与具有文档页面索引ID1的参考图像相似。
文档分类处理部分245具有:总体计数器TC,其指示头部标志、末端标志、对应于正在处理的页面(文档图像)的参考页面的数目、以及所读取的文档 图像的页面数目;页面计数器PC,其指示在每个划分的文档类型中的文档图像的页面数目;指示错误发生的错误标志;和用于指示其中发生错误的页面数目的错误发生位置的存储部分。在处理前,总体计数器TC、页面计数器PC、错误标志、和错误发生位置都被初始化为“0”。这里,当错误发生时,文档分类处理部分245将错误标志设置为1。
当参考图像与文档图像相似时,即当文档页面索引从相似性判断处理部分244被输入作为判断结果时,文档分类处理部分245基于文档页面索引搜索文档图像表2462,以此来识别文档页面索引的头部标志、末端标志、和文档类型索引。此外,文档分类处理部分245基于识别的文档类型索引搜索文档分类表2463,以此来识别对应于文档类型索引的参考图像的数目,并且然后将已经被识别的参考页面的头部标志、末端标志、和数目设置为对应于正在处理的文档图像的参考页面的头部标志、末端标志、和数目。
这里,当指示不存在与文档图像相似的参考图像的判断结果从相似性判断处理部分244输入时,文档分类处理部分245将参考图像的头部标志、末端标志、和数目设置为1。此外,每次从相似性判断处理部分244获得判断结果时,文档分类处理部分245将总体计数器TC加一。
当第一次判断文档图像与参考图像相似时,文档分类处理部分245判断设置的头部标志是否是1。当头部标志不是1时,即当第一次判断与文档图像相似的参考图像不是包含这个参考图像的文档类型的第一个文档页时,文档分类处理部分245作出错误发生的结论,以此将错误标志设置为1并且将由总体计数器TC指示的页面数目设置为错误发生位置值。
当头部标志是1时,即当第一次判断的与文档图像相似的参考图像是包含这个参考图像的文档类型的第一个文档页时,文档分类处理部分245将在页面计数器PC中的值设置为1。然后,文档分类处理部分245确定设置的末端标志是否是1。当末端标志是1时,文档类型处理部分245确定在页面计数器PC中的值是否与参考页面的数目对应。在末端标志是1的情形下,当页面计数器PC与参考页面的数目不对应时,即在尽管与文档图像相似的参考图像是在文档类型中的最后一个文档页的情形下,在这个文档图像被判断为与参考图像相似时已经向上计数的文档图像的数目(在页面计数器PC中的值)与被包含在文档类型中的参考图像的数目(参考页面的数目)不对应时,文档分类处理部分245作出错误发生的结论,以此将错误标志设置为1并且将由总体计数器TC指示的页面数目设置为错误发生位置值。
在末端标志是1的情形下,当在页面计数器PC中的值与参考页面的数目对应时,在文档图像被判断为与参考图像相似时已经向上计数的文档图像的数目与被包含在文档类型中的参考图像的数目对应。因此,文档分类处理部分245作出文档图像的顺序与包含在事先存储的文档类型中的参考图像的顺序对应的结论。因此,在这种情形下,文档分类处理部分245作出这个文档图像是包含在当前文档类型中的最后一个文档图像的结论,并且因此确定文档划分位置定位在当前文档图像和接下来将要处理的文档图像之间。
此外,当头部标志是1时,文档分类处理部分245确定错误标志是否是1。当错误标志是1时,文档划分处理部分245将错误发生位置的值记录到记录器(没有示出)中,并且然后作出在这个文档图像之前处理的文档图像是包含在在前文档类型中的最后一个文档图像的结论,以此来确定文档划分位置定位在之前处理的文档图像和当前文档图像之间。这里,指示确定的文档划分位置的信息与错误的发生位置一起作为确定信号被输出,并且然后存储到记录器中。用于记录确定信号的记录器可以在彩色图像处理设备2的内部或外部被提供。当记录器是非易失性存储器时,已检测的错误的位置可以被保存。
此外,当文档分类处理部分245已经完成上述对所有文档图像的处理时,成像设备100可以在操作板4上显示被记录在记录器中的错误发生位置,以此来通知用户通过彩色图像输入设备1输入的文档的顺序与事先存储的文档的顺序不同,以及不同的位置。上述确定信号可以例如与文档图像一起,通过网络被传送至打印机或多功能外围设备,并且可以通过计算机或者被直接输出至打印机。
因此,无需用户的特殊操作,输入的文档图像可以根据事先存储的文档的顺序被容易地分类。同时,可以确定文档图像的顺序是否与事先存储的文档的顺序对应。此外,即使当大量的文档图像被输入时,文档图像可以被容易地划分并且将要被分类的文档分割能够被检测和划分。此外,可以确定每个被分类文档是否与事先存储的文档的顺序对应。此外,当输入的文档图像的顺序与事先存储的文档的顺序不同时,可以通知用户情况。
接下来,将在下面描述彩色图像处理设备2的操作。图17是显示文档存储处理过程的流程图。这里,除了被专门的硬件电路例如文档匹配处理部分24执行,文档存储处理可以通过一种方法执行,在该方法中定义文档存储处理过程的计算机程序被装载到具有CPU、RAM、ROM、和类似部件的个人计算机上,并且然后计算机程序被CPU执行。在下面的描述中,彩色图像处理设备2被称为“处理部分”。
处理部分确定模式是否是文档存储模式(S11)。当模式不是文档存储模式时(在S11处的否),处理部分继续步骤S11的处理,并且等待直到用户通过操作板4指定文档存储模式。当模式是文档存储模式时(在S11处的是),处理部分获得参考图像(S12)。此时,参考图像可以通过借助文档读取设备读取文档而获得。可替换地,文档图像可以通过接收由处理设备例如个人计算机生成的电子数据而获得。
处理部分设置文档类型索引(S13)。处理部分计算参考图像的特征点(S14)并且然后,基于已计算的特征点,计算哈希值(特征)(S15)。处理部分设置参考图像的文档页面索引(S16),然后设置参考图像的头部标志(S17),并且然后确定对所有参考图像的处理是否已经完成(S18)。
当对所有参考图像的处理还没有完成时(S18处的否),处理部分继续步骤S14及其背面的处理,以此来计算剩余参考图像的哈希值,并设置文档页面索引和头部标志。当对所有参考图像的处理已经完成时(S18处的是),处理部分设置每个参考图像的末端标志(S19)。作为结果,为每个参考图像建立文档页面索引、头部标志、末端标志、和文档类型索引。
处理部分将设置的文档页面索引和已计算的哈希值存储到哈希表2461中,以此来更新哈希表2461(S20)。处理部分将已经被设置的文档页面索引、头部标志、末端标志、和文档类型索引存储到文档图像表2462中,以此来更新文档图像表2462(S21)。然后,处理部分将已经被设置的文档类型索引和参考页面的数目存储到文档分类表2463中,以此来更新文档分类表2463(S22),并且然后终止处理。
图18A到18E是显示对文档图像的顺序的检测处理过程的流程图。这里,除了被专门的硬件电路例如文档匹配处理部分24执行,对文档图像的顺序的检测处理可以通过装载定义对文档图像的顺序的检测处理过程的计算机程序到具有CPU、RAM、ROM、和类似部件的个人计算机上、并且然后使CPU执行该计算机程序来执行。
处理部分执行初始化设置(S41)。具体地,处理部分将总体计数器TC、页面计数器PC、错误标志、和错误发生位置的单个的值设置为0。处理部分确定对所有文档图像的处理是否已经完成(S42)。当对所有文档图像的处理还没有完成时(S42处的否),处理部分获得文档图像(S43)。此时,文档图像可以通过借助文档读取设备读取文档而获得。可替换地,文档图像可以通过接收由处理设备例如个人计算机生成的电子数据而获得。
处理部分在获得的文档图像上执行文档匹配处理(S44)。这里,文档匹配处理的细节将稍后描述。当对所有文档图像的处理已经完成时(S42处的是),处理部分确定错误标志是否是1(S45)。当错误标志是1时(S45处的是),处理部分将错误发生位置的值记录到记录器中(S46)。处理部分在操作板4上显示被记录在记录器中的错误发生位置(S47),并且然后终止处理。当错误标志是0时(S45处的否),处理部分跳过步骤S46的处理,然后在操作板4上显示被记录在记录器中的错误发生位置(S47),并且然后终止处理。
处理部分确定在文档匹配处理中获得的相似性是否比阈值Th大(S48)。当相似性比阈值Th大时(S48处的是),基于与文档图像相似的参考图像的文档页面索引,处理部分搜索文档图像表2462和文档分类表2463,以此来识别文档页面索引的头部标志、末端标志、和参考页面的数目,并且然后将这些值设置成与正在处理的文档图像相对应的头部标志、末端标志、和参考页面的数目(S49)。当相似性比阈值Th小时(S48处的否),处理部分将与正在处理的文档图像相对应的头部标志、末端标志和参考页面的数目的各个值设置成1(S50)。
处理部分将总体计数器TC加一(S51)。处理部分确定头部标志是否是1(S52)。当头部标志是0时(S52处的否),处理部分确定错误标志是否是0(S53)。当错误标志是0时(S53处的是),处理部分将错误标志设置为1(S54),然后将总体计数器TC的值设置到错误发生位置值中(S55),并且然后返回到步骤S42的处理。当错误标志是1时(S53处的否),处理部分跳过步骤S54和S55的处理,以返回到步骤S42的处理,并且然后继续步骤42及其以后步骤的处理,以此来处理剩余的文档图像。
当头部标志是1时(S52处的是),处理部分确定错误标志是否是1(S56)。当错误标志是1时(S56处的是),处理部分将错误发生位置记录在记录器中(S57),并且然后将错误标志设置为0(S58)。处理部分作出当前的文档图像是包含在新文档类型中的第一个文档图像的结论,因此确定在之前处理的文档图像和当前的文档图像之间定位的文档划分位置(S59),并且然后移动到步骤S60的处理。当错误标志是0时(S56处的否),处理部分跳过步骤S57到S59的处理,并且移动到步骤S60的处理。
处理部分将页面计数器PC中的值设置为1(S60)。处理部分确定末端标志是否为1(S61)。当末端标志为1时(S61处的是),处理部分移动到步骤S72的处理。当末端标志为0时(S61处的否),处理部分确定对所有文档图像的处理是否已经完成(S62)。当对所有文档图像的处理还没有完成时(S62处的否),处理部分获得文档图像(S63),并且然后在获得的文档图像上执行文档匹配处理(S64)。
当对所有文档图像的处理已经完成时(S62处的是),处理部分在操作板4上显示记录在记录器中的错误发生位置(S65),并且然后终止处理。处理部分确定在文档匹配过程中获得的相似性是否比阈值Th大(S66)。当相似性比阈值Th大时(S66处的是),基于与文档图像相似的参考图像的文档页面索引,处理部分搜索文档图像表2462和文档分类表2463,以此来识别文档页面索引的头部标志、末端标志、和参考页面的数目,并且然后将这些值设置到对应于正在处理的文档图像的头部标志、末端标志和参考页面的数目中(S67)。当相似性比阈值Th小时(S66处的否),处理部分将对应于正在处理的文档图像的头部标志、末端标志和参考页面的数目的各个值设置成1(S68)。
处理部分将总体计数器TC加一(S69),并且然后将页面计数器PC加一(S70)。处理部分确定末端标志是否是1(S71)。当末端标志是0时(S71处的否),处理部分返回到步骤S62的处理,并且然后继续在步骤S62以及之后步骤的处理,以此来处理剩余的文档图像。
当末端标志是1时(S71处的是),处理部分确定在页面计数器PC中的值是否与参考页面的数目对应(S72)。当页面计数器PC中的值与参考页面的数目对应时(S72处的是),处理部分作出这个文档图像是包含在当前文档类型中的最后一个文档图像的结论,因此确定要在当前文档图像和接下来将要处理的文档图像之间定位的文档划分位置(S73),并且然后移动到步骤S76的处理。当在页面计数器PC中的值与参考页面的数目不对应时(S72处的否),处理部分将错误标志设置为1(S74),并且然后将总体计数器TC的值设置到错误发生位置值中(S75)。然后,处理部分返回到步骤S42的处理,并且然后继续步骤S42及其以后步骤的处理,以此来处理剩余的文档图像。
处理部分确定错误标志是否是1(S76)。当错误标志是1时(S76处的是),处理部分将错误发生位置的值记录到记录器中(S77),然后将错误标志设置为0(S78),并且然后返回到步骤S42的处理。当错误标志是0时(S76处的否),处理部分跳过步骤S77和S78的处理,并且返回到步骤S42的处理。
在上述对于文档图像顺序的检测处理中的文档匹配处理(图18A到18E中的步骤S44和S64)将在下面描述。图19是显示文档匹配处理过程的流程图,其是图18A到18E流程图的子程序。
处理部分计算获得的文档图像的特征点(S81),并且然后,基于计算的特征点,计算哈希值(特征)(S82)。基于计算的哈希值,处理部分搜索哈希表2461,并且为具有相同哈希值的文档页面索引执行投票(S83)。基于投票处理的结果,处理部分计算相似性(S84),并且然后返回到图18A到18E显示的处理。
当错误发生时,生成的错误的发生位置在操作板4上显示,以使得用户可以被通知到错误的发生位置。此外,当作出当前的文档图像是包含在新文档类型中的第一个文档图像的结论时,文档划分位置被确定为定位在之前处理的文档图像和当前的文档图像之间。可替换地,当作出这个文档图像是包含在当前文档类型中的最后一个文档图像的结论时,确定要在当前文档图像和接下来将要处理的文档图像之间定位的文档划分位置。由于这点,可以为每个文档类型划分文档图像。然后,可以在被划分的文档图像的每个组上执行不同的输出处理。此外,可以为每个文档类型确定文档图像的顺序是否是正确的。
因此,即使当由多页组成的文档被读取时,用户仅对位于所通知的错误发生位置处的文档执行重读取操作就足够了。即无需对文档重做整体的读取处理。此外,用于编档的文件夹(例如,在成像设备100中提供的硬盘;或可替换地通过网络存储到服务器中)可以为具有正确的文档图像顺序的文档和在读取文档图像时没有堆叠馈送或类似的情况发生的已被正确读取的文档、以及为在文档图像的顺序中具有错误的文档分别地设置。然后,这些文档可以被分别地存储。可以为每个文件夹设置路径。然后,基于用于指示文档分类确定结果的确定信号,图像数据可以被存储到每个文件夹中。此外,在被存储到文件夹中的时候,图像数据被压缩成JPEG(联合图像专家组)或类似的格式。
(实施例2)
实施例2将在下面进行描述。这里,依据实施例2的成像设备具有与根据上述实施例1的成像设备100相似的结构。因此,关于结构的描述被省略。
实施例1已经在上面描述了当第一个被输入的文档图像与参考图像相似并且相似的参考图像的头部标志是1、彩色图像处理设备2的文档匹配处理部分24确定这个文档图像具有与参考图像不同的顺序时的结构。此外,当被输入的文档图像与参考图像相似时,根据实施例1的文档匹配处理部分24将文档图像的数目向上计数。然后,在相似参考图像的末端标志是1的情形下,当包含文档图像的文档页面的数目与计数的页数目不对应时,文档匹配处理部分24确定这个文档图像具有与参考图像不同的顺序。因此,上述实施例1在确定例如由三个或更多文档图像组成的文档的顺序是否是正确的情形下是有效的。
在实施例2中,彩色图像处理设备2的文档匹配处理部分24给予每个参考图像在每个文档类型中的页面数目,并且然后当被输入的文档图像与参考图像相似时将文档图像的数目向上计数。然后,基于相似的参考图像的页面数目是否与计算的页数目对应,文档匹配处理部分24确定该文档图像是否具有与参考图像不同的顺序。具体地,当相似的参考图像的页面数目与计数的页数目不对应时,确定文档图像具有与参考图像不同的顺序。
图20是显示文档图像表2462结构的说明图。图20显示了在图14中显示的两种类型文档被存储的情形下的文档图像表2464。根据实施例2的文档图像表2464由包括文档页面索引、用于指示在文档中的每个图像的页面数目的页面ID、和文档类型索引的各个字段构建而成。这里,根据实施例2的文档分类表具有与根据上述实施例1的文档分类表2463相似的结构。此外,在文档存储模式下,文档图像表2464和文档分类表2463在每次文档被存储时更新。
根据文档图像表2464,由文档页面索引ID1识别的参考图像是被包含在由文档类型索引DocID1识别的文档中,并且是这个文档的第一个页面。由文档页面索引ID2识别的参考图像是被包含在由文档类型索引DocID1识别的文档中,并且是这个文档的第二个页面。由文档页面索引ID3识别的参考图像是被包含在由文档类型索引DocID1识别的文档中,并且是这个文档的第三个页面。
相似地,根据文档图像表2464,由文档页面索引ID4识别的参考图像是被包含在由文档类型索引DocID2识别的文档中,并且是这个文档的第一个页面。由文档页面索引ID5识别的参考图像是被包含在由文档类型索引DocID2识别的文档中,并且是这个文档的第二个页面。
如在实施例1中的描述,当文档匹配处理部分24为每个文档类型分类输入的文档图像并且然后确定被包含在每个文档类型中的文档图像的顺序是否与参考图像的顺序对应时,特征计算部分242为每个文档图像计算哈希值。然后,基于哈希值,投票处理部分243为具有对应的哈希值的参考图像的文档页面索引进行投票。然后,基于投票处理部分243的投票结果,相似性判断处理部分244判断文档图像是否与任何参考图像相似。然后,基于相似性判断处理部分244的判断结果,文档分类处理部分245确定输入的文档图像是否具有与事先存储的参考图像对应的顺序。
根据实施例2由文档分类处理部分245执行的处理将在下面进行描述。文档分类处理部分245具有存储部分:总体计数器TC,其指示页面ID、与正在处理的页面(文档图像)对应的参考页面的数目、和读取的文档图像的页面数目;指示在每个划分的文档类型中文档图像的页面数目的页面计数器PC;指示错误发生的错误标志;和用于指示其中发生了错误的页面数目的错误发生位置。在处理前,总体计数器TC、页面计数器PC、错误标志、和错误发生位置都被初始化为“0”。这里,当错误发生时,文档分类处理部分245将错误标志设置为1。
当参考图像与文档图像相似时,即当文档页面索引从相似性判断处理部分244被输入作为判断结果时,文档分类处理部分245基于文档页面索引搜索文档图像表2464,以此来识别文档页面索引的页面ID和文档类型索引。此外,文档分类处理部分245基于识别的文档类型索引搜索文档分类表2463,以此来识别对应于文档类型索引的参考页面的数目,并且然后将已经识别的页面ID和参考页面的数目设置为对应于正在处理的文档图像的页面ID和参考页面的数目。
这里,当用于指示不存在与文档图像相似的参考图像的判断结果被从相似性判断处理部分244输入时,文档分类处理部分245将页面ID和参考页面的数目设置为1。此外,每次从相似性判断处理部分244获得判断结果时,文档分类处理部分245将总体计数器TC加一。
当第一次判断文档图像与参考图像相似时,文档分类处理部分245确定设置的页面ID是否是1。当页面ID不是1时,即当第一次判断与文档图像相似的参考图像不是包含这个参考图像的文档类型的第一个文档页时,文档分类处理部分245作出错误发生的结论,以此来将错误标志设置为1并且将由总体计数器TC指示的页面数目设置到错误发生位置值中。
当页面ID是1时,即当第一次判断的与文档图像相似的参考图像是包含这个参考图像的文档类型的第一个文档页时,文档分类处理部分245将页面计数器PC中的值设置为1。然后,文档分类处理部分245确定参考页面的数目的值是否与设置的页面ID的值对应。当这些值相互之间不对应时,即当这个参考图像不是文档类型的最后一个文档页时,判断下一个文档图像是否与参考图像相似。当下一个文档图像被判断为与参考图像相似时,文档分类处理部分245将页面ID和参考图像的文档页面索引的参考页面的数目设置到对应于正在处理的文档图像的页面ID和参考图像的数目中,并且然后往总体计数器IC和页面计数器PC上加一。
文档分类处理部分245确定在页面计数器PC中的值是否与页面ID的值对应。当在页面计数器PC中的值与页面ID的值不对应时,即当这个文档图像被判断为与参考图像相似时已经向上计数的文档图像的数目(页面计数器PC中的值)与在文档类型中的参考图像的页面数目(页面ID的值)不对应时,文档分类处理部分245作出错误发生的结论,以此来将错误标志设置为1,并且将由总体计数器TC指示的页面数目设置到错误发生位置值中。
当在页面计数器PC中的值与页面ID的值对应时,当文档图像被判断为与参考图像相似时已经向上计数的文档图像的数目与在文档类型中的参考图像的页面数目对应。因此,文档分类处理部分245作出文档图像的顺序与包含在事先存储的文档类型中的参考图像的顺序对应的结论。然后,文档分类处理部分245确定参考页面的数目是否与设置的页面ID的值对应。在对应的情形下,即当这个参考图像是在文档类型中的最后一个页面时,文档分类处理部分245作出结论,即这个文档图像是包含在当前文档类型中的最后一个文档图像,并且因此确定要在当前文档图像和接下来要处理的文档图像之间定位的文档划分位置。
此外,当文档ID是1时,文档分类处理部分245确定错误标志是否是1。当错误标志是1时,文档分类处理部分245将错误发生位置的值记录到记录器(没有示出)中,并且然后作出在这个文档图像之前处理的文档图像是包含在之前的文档类型中的最后一个文档图像的结论,以此来确定在之前处理的文档图像和当前的文档图像之间定位的文档划分位置。这里,用于指示确定的文档划分位置的信息与错误的发生位置一起作为确定信号被输出,并且然后存储到记录器中。用于记录确定信号的记录器可以在彩色图像处理设备2的内部或外部提供。当记录器是非易失性存储器时,已检测的错误的位置可以被保存。
此外,当文档分类处理部分245已经完成了对所有文档图像的上述处理时,成像设备100可以在操作板4上显示被记录在记录器中的错误发生位置,以此来通知用户通过彩色图像输入设备1输入的文档的顺序与事先存储的文档的顺序不同,以及不同的位置。上述确定信号可以例如与文档图像一起,通过网络被传输至打印机或多功能外围设备,并且可以通过计算机或者直接输出至打印机。
这样,在实施例2中,当输入的文档图像与参考图像相似时,基于每个文档图像的页面位置是否与事先存储的文档中的页面位置对应,可以确定文档图像的顺序是否与事先存储的文档的顺序对应。因此,可以确定文档图像的顺序是否是正确的,并且同时,可以识别在由多个页面组成的文档中的页面省略的页面数目。
接下来,在实施例2中的文档存储处理在下面进行描述。图21是显示文档存储处理过程的流程图。这里,除了被专用的硬件电路例如文档匹配处理部分24执行,文档存储处理可以通过一种方法执行,在方法中定义文档存储处理过程的计算机程序被装载到具有CPU、RAM、ROM、和类似部件的个人计算机上,并且然后计算机程序被CPU执行。在下面的描述中,彩色图像处理设备2被称为“处理部分”。
处理部分确定模式是否是文档存储模式(S101)。当模式不是文档存储模式时(S101处的否),处理部分继续步骤S101的处理,并且等待直到用户通过操作板4指定文档存储模式。当模式是文档存储模式时(S101处的是),处理部分获得参考图像(S102)。此时,参考图像可以通过借助文档读取设备读取文档而获得。可替换地,文档图像可以通过接收由处理设备例如个人计算机生成的电子数据而获得。
处理部分设置文档类型索引(S103)。处理部分计算参考图像的特征点(S104),并且然后基于已计算的特征点,计算哈希值(特征)(S105)。处理部分设置参考图像的文档页面索引(S106),然后设置参考图像的页面ID(S107),并且然后确定对所有参考图像的处理是否已经完成(S108)。这里,页面ID可以以单个参考图像被获得的顺序设置为1、2、3··。
当对所有参考图像的处理还没有完成时(S108处的否),处理部分继续步骤S104及其之后的处理,以此来计算剩余参考图像的哈希值和设置文档页面索引和页面ID。当对所有参考图像的处理已经完成时(S108处的是),为每个参考图像设置文档页面索引、页面ID、和文档类型索引,并且处理部分将设置的文档页面索引和计算的哈希值存储到哈希表2461中,以此来更新哈希表2461(S109)。
处理部分将已经设置的文档页面索引、页面ID和文档类型索引存储到文档图像表2464中,以此来更新文档图像表2464(S110)。然后,处理部分将已经设置的文档类型索引和参考页面的数目存储到文档分类表2463中,以此来更新文档分类表2463(S111),并且然后终止处理。
接下来,实施例2中对文档图像的顺序的检测处理被描述。图22A到22E是显示对于文档图像顺序的检测处理过程的流程图。这里,除了被专门的硬件电路例如文档匹配处理部分24执行,对文档图像顺序的检测处理可以通过装载定义对文档图像顺序的检测处理过程的计算机程序到具有CPU、RAM、ROM、和类似部件的个人计算机上、并且然后使CPU执行该计算机程序来执行。
处理部分执行初始化设置(S121)。具体地,处理部分将总体计数器TC、页面计数器PC、错误标志、和错误发生位置的各个值设置为0。处理部分确定对所有文档图像的处理是否已经完成(S122)。当对所有文档图像的处理还没有完成时(S122处的否),处理部分获得文档图像(S123)。此时,文档图像可以通过借助文档读取设备读取文档而获得。可替换地,文档图像可以通过接收由处理设备例如个人计算机生成的电子数据而获得。
处理部分在获得的文档图像上执行文档匹配处理(S124)。这里,文档匹配处理的细节与实施例1中的相同,有关的描述被省略。当对所有文档图像的处理已经完成时(S122处的是),处理部分确定错误标志是否是1(S125)。当错误标志是1时(S125处的是),处理部分将错误发生位置的值记录到记录器中(S126)。处理部分在操作板4上显示被记录在记录器中的错误发生位置(S127),并且然后终止处理。当错误标志是0时(S125处的否),处理部分跳过步骤S126的处理,然后在操作板4上显示被记录在记录器中的错误发生位置(S127),并且然后终止处理。
处理部分确定在文档匹配处理中获得的相似性是否比阈值Th大(S128)。当相似性比阈值Th大时(S128处的是),基于与文档图像相似的参考图像的文档页面索引,处理部分搜索文档图像表2464和文档分类表2463,以此来识别文档页面索引的页面ID和参考页面的数目,并且然后将这些值设置到对应于正在处理的文档图像的页面ID和参考页面的数目中(S129)。当相似性比阈值Th小时(S128处的否),处理部分将对应于正在处理的文档图像的页面ID和参考页面的数目的各个值设置成1(S130)。
处理部分将总体计数器TC加一(S131)。处理部分确定页面ID的值是否是1(S132)。当页面ID的值不是1时(S312处的否),处理部分确定错误标志是否是0(S133)。当错误标志是0时(S133处的是),处理部分将错误标志设置为1(S134),然后将总体计数器TC的值设置到错误发生位置值中(S135),并且然后返回到步骤S122的处理。当错误标志是1时(S133处的否),处理部分跳过步骤S134和S135的处理,以此来返回到步骤S122的处理,并且然后继续在步骤S122及其之后的处理,以此来处理剩余的文档图像。
当页面ID的值是1时(S132处的是),处理部分确定错误标志是否是1(S136)。当错误标志是1时(S136处的是),处理部分将错误发生位置的值记录到记录器中(S137),并且然后将错误标志设置为0(S138)。处理部分作出当前的文档图像是包含在新文档类型中的第一个文档图像的结论,因此确定在之前处理的文档图像和当前的文档图像之间定位的文档划分位置(S139),并且然后移动到步骤S140的处理。当错误标志是0时(S136处的否),处理部分跳过步骤S137到S139的处理,并且移动到步骤S140的处理。
处理部分将页面计数器PC中的值设置为1(S140)。处理部分确定参考页面的数目与页面ID的值是否符合(S141)。当参考页面的数目与页面ID的值符合时(S141处的是),处理部分移动到步骤S155的处理。当参考页面的数目与页面ID的值不符合时(S141处的否),处理部分确定对所有文档图像的处理是否已经完成(S142)。当对所有文档图像的处理还没有完成时(S142处的否),处理部分获得文档图像(S143),并且然后在获得的文档图像上执行文档匹配处理(S144)。
当对所有文档图像的处理已经完成时(S142处的是),处理部分在操作板4上显示记录在记录器中的错误发生位置(S145),并且然后终止处理。处理部分确定在文档匹配处理中获得的相似性是否比阈值Th大(S146)。当相似性比阈值Th大时(S146处的是),基于与文档图像相似的参考图像的文档页面索引,处理部分搜索文档图像表2464和文档分类表2463,以此来识别文档页面索引的页面ID和参考页面的数目,并且然后将这些值设置到对应于正在处理的文档图像的页面ID和参考页面的数目中(S147)。当相似性比阈值Th小时(S146处的否),处理部分将对应于正在处理的文档图像的页面ID和参考页面的数目的各个值设置成1(S148)。
处理部分将总体计数器TC加一(S149),并且然后将页面计数器PC加一(S150)。处理部分确定在页面计数器PC中的值是否与页面ID的值符合(S151)。当在页面计数器PC中的值与页面ID的值不符合时(S151处的否),处理部分将错误标志设置为1(S152),将总体计数器TC的值设置到错误发生位置值中(S153),返回到步骤S122的处理,并且然后继续在步骤S122及其之后的处理,以此来处理剩余的文档图像。
当页面计数器PC的值与页面ID的值符合时(S151处的是),处理部分确定参考页面的数目是否与页面ID的值对应(S154)。当参考页面的数目与页面ID的值对应时(S154处的是),处理部分作出这个文档图像是包含在当前文档类型中的最后一个文档图像的结论,因此确定要在当前文档图像和接下来要处理的文档图像之间定位的文档划分位置(S155),并且然后移动到步骤S156的处理。当参考页面的数目与页面ID的值不对应时(S154处的否),处理部分返回到步骤S142的处理,并且然后继续在步骤S142及其之后的处理,以此来处理剩余的文档图像。
处理部分确定错误标志是否是1(S156)。当错误标志是1时(S156处的是),处理部分将错误发生位置的值记录到记录器中(S157),然后将错误标志设置为0(S158),并且然后返回到步骤S122的处理。当错误标志是0时(S156处的否),处理部分跳过步骤S157和S158的处理,然后返回到步骤S122的处理。
当错误发生时,生成的错误的发生位置被显示在操作板4上,以使得用户可以被通知到错误的发生位置。此外,当作出当前的文档图像是包含在新文档类型中的第一个文档图像的结论时,确定在之前处理的文档图像和当前的文档图像之间定位的文档划分位置。可替换地,当作出这个文档是包含在当前文档类型中的最后文档图像的结论时,确定要在当前文档图像和接下来将要处理的文档图像之间定位的文档划分位置。由于这点,可以为每个文档类型划分文档图像。然后,可以在每组被划分的文档图像上执行不同的输出处理。此外,可以确定包含在每个文档类型中的每个页面是否是正确的。
因此,即使当由多页组成的文档被读取时,用户仅对位于所通知的错误发生位置处的文档执行重读取操作就足够了。即无需对该文档重做整体的读取处理。此外,用于编档的文件夹(例如,在成像设备100中提供的硬盘;或可替换地通过网络存储到服务器中)可以为具有正确的文档图像顺序的文档和在读取文档图像时没有堆叠馈送或类似的情况发生的已被正确读取的文档、以及为在文档图像的顺序中具有错误的文档分别地设置。然后,这些文档可以被分别地存储。可以为每个文件夹设置路径。然后,基于用于指示文档分类确定结果的确定信号,图像数据可以被存储到每个文件夹中。此外,在被存储到文件夹中的时候,图像数据被压缩成JPEG(联合图像专家组)或类似的格式。
(实施例3)
实施例3将在下面进行描述。这里,依据实施例3的成像设备具有与根据上述实施例1的成像设备100相似的结构。因此,关于结构的描述被省略。
实施例1和实施例2已经在上面描述了彩色图像处理设备2的文档匹配处理部分24检测文档图像中的页面省略的存在或不存在、文档图像中的顺序替代的存在或不存在、文档图像的堆叠馈送的存在或不存在、以及类似情况的结构。因此,在上述实施例1和2中,在确定由多个页面组成的文档的顺序是否是正确的具有满意的准确度。在实施例3中,除了在文档图像中的页面省略的存在或不存在、在文档图像中的顺序替代的存在或不存在、以及文档图像的堆叠馈送的存在或不存在外,彩色图像处理设备2的文档匹配处理部分24也检测在双面文档中文档正面和背面的替代的存在或不存在。因此,根据实施例3的文档匹配处理部分24作为确定信号输出用于指示在双面文档中的文档的正面和背面被替代的位置的信息,以及用于指示文档划分位置和错误发生位置的信息。
在实施例3中,如图13A所示,当具有三页(P1,P2,P3)的文档的两面(P1正面,P1背面,P2正面,P2背面,P3正面,P3背面)将要被存储时,文档匹配处理部分24(具体地,特征计算部分242)分别为具有三页的文档的双面图像(P1正面,P1背面,P2正面,P2背面,P3正面,P3背面)以页面顺序设置文档页面索引ID1、ID2、ID3、ID4、ID5、和ID6,并且然后为每个文档页面索引ID1、ID2、ID3、ID4、ID5、和ID6的图像计算哈希值(例如,H1、H2、...)。特征计算部分242设置:用于指示每个图像位于其中的文档的页数目的页面ID;和用于指示每个图像是文档的正面图像还是背面图像的面信息。这里,当每个图像是文档的正面图像时,特征计算部分242将相应的面信息设置为1。当每个图像是文档的背面图像时,特征计算部分242将相应的面信息设置为2。
特征计算部分242为了识别具有三页(文档的类型)的文档的整体,设置文档类型索引DocID1,并且同时,将已经为单个图像设置的页面ID的最大值设置到参考页面的数目中(这种情形下为“3”)。特征计算部分242存储文档页面索引、页面ID、面信息和文档类型索引到稍后描述的文档图像表中。此外,特征计算部分242存储文档类型索引和参考页面的数目到稍后描述的文档分类表中。
图23是显示在实施例3中被存储的文档的例子的说明图。如图23所示下面的描述是两种类型文档将要被存储的情形。为一个由六个页面的参考图像(三个双面文档页)组成的文档设置文档类型索引DocID1。然后为文档的单个页面设置文档页面索引ID1、ID2、ID3、ID4、ID5、和ID6。相似地,为由四个页面的参考图像(两个双面文档页)组成的文档设置文档类型索引DocID2。然后,为文档的单个页面设置文档页面索引ID7、ID8、ID9和ID10。
图24是显示文档图像表2465的结构的说明图。根据实施例3的文档图像表2465由包含文档页面索引、页面ID、表面信息、和文档类型索引的各个字段构建。这里,根据实施例3的文档分类表具有与跟据上述实施例1的文档分类表2463相似的结构。此外,在文档存储模式下,文档图像表2465和文档分类表2463在每次文档被存储时被更新。
根据文档图像表2465,由文档页面索引ID1识别的参考图像是由文档类型索引DocID1识别的文档中的第一个页的正面图像。此外,由文档页面索引ID2识别的参考图像是由文档类型索引DocID1识别的文档的第一个页的背面图像。由文档页面索引ID3识别的参考图像是由文档类型索引DocID1识别的文档的第二个页的正面图像。由文档页面索引ID4识别的参考图像是由文档类型索引DocID1识别的文档的第二个页的背面图像。由文档页面索引ID5识别的参考图像是由文档类型索引DocID1识别的文档的第三页的正面图像。由文档页面索引ID6识别的参考图像是由文档类型索引DocID1识别的文档的第三页的背面图像。此外,根据文档分类表2463,由文档类型索引DocID1识别的文档的参考页面的数目是“3”。
相似地,根据文档图像表2465,由文档页面索引ID7识别的参考图像是由文档类型索引DocID2识别的文档的第一个页的正面图像。此外,由文档页面索引ID8识别的参考图像是由文档类型索引DocID2识别的文档的第一个页的背面图像。由文档页面索引ID9识别的参考图像是由文档类型索引DocID2识别的文档的第二个页的正面图像。由文档页面索引ID10识别的参考图像是由文档类型索引DocID2识别的文档的第二个页的背面图像。此外,根据文档分类表2463,由文档类型索引DocID2识别的文档的参考页面的数目是“2”。
如实施例1中的描述,当文档匹配处理部分24为每个文档类型分类输入的文档图像,并且然后确定被包含在每个文档类型中的文档图像的顺序是否与参考图像的顺序对应,特征计算部分242为每个文档图像计算哈希值。然后,基于哈希值,投票处理部分243为具有对应的哈希值的参考图像的文档页面索引执行投票。然后,基于投票处理部分243的投票结果,相似性判断处理部分244判断文档图像是否与任何参考图像相似。然后,基于相似性判断处理部分244的判断结果,文档分类处理部分245确定输入的文档图像是否与事先存储的参考图像具有对应的顺序。
这里,在实施例3中,除了文档的顺序,文档的正面和背面的替代的存在或不存在也在双面文档中被检测。即从一个文档页的两面读取的文档图像被分别输入,并且然后确定输入的文档图像的正面和背面是否是正确的。具体地,相似性判断处理部分244判断从一个文档页的两面读取的两个文档图像是否分别与参考图像的任一个相似。当这两个分别相似时,文档分类处理部分245确定被判断为与两个文档图像相似的两个参考图像是否分别是一个文档页的正面图像和背面图像。当两个参考图像是一个文档页的正面图像和背面图像时,基于输入的文档图像的正面和背面是否与参考图像的正面和背面对应,文档分类处理部分245确定两个输入的文档图像的正面和背面是否是正确的。这里,在输入的文档图像中,第一个输入的图像被定义为正面图像,而接下来输入的图像被定义为背面图像。
根据实施例3的由文档分类处理部分245执行的处理将在下面进行描述。文档分类处理部分245具有存储部分,用于:总体计数器TC,其指示页面ID、表面信息、与正在处理的页面(文档图像)对应的参考页面的数目、和读取的文档图像的页面数目;指示在每个划分的文档类型中的文档图像的页面数目的页面计数器PC;指示错误发生的错误标志;用于指示发生错误的页面数目的错误发生位置;和指示其中正面和背面被替代的页面数目的正面/背面改变位置。在处理前,总体计数器TC、页面计数器PC、错误标志、错误发生位置、和正面/背面改变位置都被初始化为“0”。这里,当错误发生时,文档分类处理部分245将错误标志设置为1。
当两个参考图像分别与从一个文档页的两面读取的两个文档图像相似时,即当两个文档图像索引从相似性判断处理部分244被作为判断结果输入时,文档分类处理部分245基于这两个文档页面索引搜索文档图像表2465,以此来确定是否这两个文档页面索引的页面ID彼此相同、以及表面信息分别为1和2。当两个文档页面索引的页面ID彼此相同并且表面信息分别是1和2时,即当两个参考图像是分别从一个文档页的正面和背面读取的图像时,文档分类处理部分245确定输入的文档图像的正面和背面是否与参考图像的正面和背面对应。
当输入的文档图像的正面和背面与参考图像的正面和背面对应时,具体地,当与从文档正面读取的文档图像相似的参考图像的表面信息是1并且与从文档背面读取的文档图像相似的参考图像的表面信息是2时,文档分类处理部分245确定两个输入的文档图像的正面和背面是正确的。这里,当两个文档图像的正面和背面不正确时,具体地,当与从文档正面读取的文档图像相似的参考图像的表面信息是2并且与从文档背面读取的文档图像相似的参考图像的表面信息是1时,文档分类处理部分245作出错误发生的结论,以此来将错误标志设置为1,并且将由总体计数器TC指示的页面数目设置作为正面/背面改变位置。
当两个文档图像的正面和背面是正确时,基于文档图像表2465,文档分类处理部分245识别从相似性判断处理部分244作为判断结果输入的两个文档页面索引的页面ID和文档类型索引。此外,文档分类处理部分245识别与来自文档分类表2463的已被识别的文档类型索引对应的参考页面的数目,并且然后将已经被识别的页面ID和参考页面的数目设置到对应于正在处理的文档图像的页面ID和参考页面的数目中。
这里,当从相似性判断处理部分244输入指示没有参考图像与两个文档图像的一个或所有相似的判断结果时,或者可替换地,当与两个文档图像相似的两个参考图像不是一个文档页的正面图像和背面图像时,文档分类处理部分245将页面ID和参考页面的数目设置为1。此外,每次从相似性判断处理部分244获得判断结果时,文档分类处理部分245将总体计数器TC加一。
当第一次确定两个文档图像分别与参考图像相似并且两个参考图像是一个文档页的正面图像和背面图像时,文档分类处理部分245确定设置的页面ID是否是1。当页面ID不是1时,即当第一次判断与文档图像相似的参考图像不是包含这个参考图像的文档类型的第一个文档页时,文档分类处理部分245作出错误发生的结论,以此来将错误标志设置为1并且将由总体计数器TC指示的页面数目设置到错误发生位置值中。
当页面ID是1时,即当第一次判断的与文档图像相似的参考图像是包含这个参考图像的文档类型的第一个文档页时,文档分类处理部分245将在页面计数器PC中的值设置为1。然后,文档分类处理部分245确定参考页面的数目的值是否与设置的页面I D的值对应。当两个值相互之间不对应时,即当这个参考图像不是文档类型的最后一个文档页时,判断接下来的文档图像是否与参考图像相似。当确定两个接下来的文档图像分别与参考图像相似并且两个参考图像是一个文档页的正面图像和背面图像时,文档分类处理部分245将参考图像的文档页面索引的页面ID和参考页面的数目设置到对应于正在处理的文档图像的页面ID和参考图像的数目中,并且然后加一到总体计数器TC和页面计数器PC中。
文档分类处理部分245确定在页面计数器PC中的值是否与页面ID的值对应。当在页面计数器PC中的值与页面ID的值不对应时,即在这个文档图像被判断为与参考图像相似时的已经向上计数的文档图像的数目(在页面计数器PC中的值)与在文档类型中的参考图像的页面数目(页面ID的值)不对应时,文档分类处理部分245作出错误发生的结论,以此将错误标志设置为1并且将由总体计数器TC指示的页面数目设置到错误发生位置值中。
当在页面计数器PC中的值与页面ID的值对应时,在文档图像被判断为与参考图像相似时的已经向上计数的文档图像的数目与在文档类型中的参考图像的页面数目对应。因此,文档分类处理部分245作出文档图像的顺序与包含在事先存储的文档类型中的参考图像的顺序对应的结论。然后,文档分类处理部分245确定参考页面的数目是否与设置的页面ID的值对应。在对应的情形下,即当这个参考图像是在文档类型中的最后一个页面时,文档分类处理部分245作出这个文档图像是包含在当前文档类型中的最后一个文档图像的结论,并且因此确定要在当前文档图像和接下来要处理的文档图像之间定位的文档划分位置。
此外,当页面ID是1时,文档分类处理部分245确定错误标志是否是1。当错误标志是1时,文档分类处理部分245将错误发生位置的值记录到记录器(没有示出)中,并且然后作出在这个文档图像之前处理的文档图像是包含在在前文档类型中的最后一个文档图像的结论,以此来确定将要在之前处理的文档图像和当前的文档图像之间定位的文档划分位置。这里,用于指示确定的文档划分位置和正面/背面改变位置的信息与错误的发生位置一起作为确定信号被输出,并且然后存储到记录器中。用于记录确定信号的记录器可以在彩色图像处理设备2的内部或外部被提供。当记录器是非易失性存储器时,已检测的错误的位置可以被保存。
此外,当文档分类处理部分245已经完成了对所有文档图像的上述处理时,成像设备100可以在操作板4上显示被记录在记录器中的错误发生位置和正面/背面改变位置,以此来通知用户通过彩色图像输入设备1输入的文档的顺序与事先存储的文档的顺序不同,以及不同的位置和正面/背面改变位置。上述确定信号可以例如与文档图像一起,通过网络被传输至打印机或多功能外围设备,并且可以通过计算机或者直接输出至打印机。
这样,在实施例3中,当两个输入的文档图像分别与参考图像相似时,基于从一个文档页的正面和背面读取的两个正面和背面文档图像是否与事先存储的文档的正面和背面对应,可以确定文档图像的顺序是否与事先存储的文档的顺序对应。因此,可以确定文档图像的顺序是否是正确的,同时,在由多个页面组成的文档中可以识别在其上正面图像和背面图像颠倒的页面数目。
接下来,在实施例3中的文档存储处理将在下面进行描述。图25是显示文档存储处理过程的流程图。这里,除了被专门的硬件电路例如文档匹配处理部分24执行,文档存储处理可以通过一种方法执行,在方法中定义文档存储处理过程的计算机程序被装载到具有CPU、RAM、ROM、和类似部件的个人计算机上,并且然后计算机程序被CPU执行。在下面的描述中,彩色图像处理设备2被称为“处理部分”。
处理部分确定模式是否是文档存储模式(S171)。当模式不是文档存储模式时(S171处的否),处理部分继续步骤S171的处理,并且等待直到用户通过操作板4指定文档存储模式。当模式是文档存储模式时(S171处的是),处理部分获得参考图像(S172)。此时,参考图像可以通过从文档读取设备读取文档的两面而获得。可替换地,文档图像可以通过接收由处理设备例如个人计算机生成的电子数据而获得。
处理部分设置文档类型索引(S173)。处理部分计算参考图像的特征点(S174),并且然后,基于已计算的特征点,计算哈希值(特征)(S175)。处理部分设置参考图像的文档页面索引(S176),然后设置参考图像的页面ID(S177),然后设置参考图像的表面信息(S178),并且然后确定对所有参考图像的处理是否已经完成(S179)。这里,页面ID可以以获得单个参考图像的顺序被设置为1、2、3··。当参考图像被文档读取设备读取时,基于在文档读取设备中的文档的方向,表面信息被设置为1(正面)或者2(背面)。
当对所有参考图像的处理还没有完成时(S179处的否),处理部分继续在步骤S174及其之后的处理,以此来计算剩余的参考图像的哈希值和设置文档页面索引、页面ID和表面信息。当对所有参考图像的处理已经被完成时(S179处的是),为每个参考图像设置文档页面索引、页面ID、表面信息和文档类型索引,并且处理部分将设置的文档页面索引和计算的哈希值存储到哈希表2461中,以此来更新哈希表2461(S180)。
处理部分将已经设置的文档页面索引、页面ID、表面信息和文档类型索引存储到文档图像表2465中,以此来更新文档图像表2465(S181)。然后,处理部分将已经设置的文档类型索引和参考页面的数目存储到文档分类表2463中,以此来更新文档分类表2463(S182),并且然后终止处理。
接下来,在实施例3中对文档图像的顺序的检测处理被描述。图26A到26F是显示对于文档图像顺序的检测处理过程的流程图。这里,除了被专门的硬件电路例如文档匹配处理部分24执行,对文档图像顺序的检测处理可以通过装载定义对文档图像的顺序的检测处理过程的计算机程序到具有CPU、RAM、ROM、和类似部件的个人计算机上、并且然后使CPU执行该计算机程序来执行。
处理部分执行初始化设置(S191)。具体地,处理部分将总体计数器TC、页面计数器PC、错误标志、错误发生位置、和正面/背面改变位置的各个值设置为0。处理部分确定对所有文档图像的处理是否已经完成(S192)。当对所有文档图像的处理还没有完成时(S192处的否),处理部分获得从一个文档页的正面和背面读取的两个文档图像(S193)。此时,文档图像可以通过借助文档读取设备读取文档而获得。可替换地,文档图像可以通过接收由处理设备例如个人计算机生成的电子数据而获得。
处理部分在获得的文档图像上执行文档匹配处理(S194)。这里,文档匹配处理与实施例1中描述的是相同的,并且因此描述被省略。当对所有文档图像的处理已经完成时(S192处的是),处理部分确定错误标志是否是1(S195)。当错误标志是1时(S195处的是),处理部分将错误发生位置和正面/背面改变位置的值记录到记录器中(S196)。处理部分在操作板4上显示被记录在记录器中的错误发生位置和正面/背面改变位置(S197),并且然后终止处理。当错误标志是0时(S195处的否),处理部分跳过步骤S196的处理,然后在操作板4上显示被记录在记录器中的错误发生位置和正面/背面改变位置(S197),并且然后终止处理。
基于在文档匹配处理过程中获得的相似性是否比阈值Th大的确定,处理部分判断两个获得的文档图像是否均与参考图像相似(S198)。当两个文档图像与参考图像相似时(S198处的是),基于与两个文档图像分别相似的参考图像的文档页面索引,处理部分搜索文档图像表2465,以此来确定两个参考图像是否是一个文档页的正面图像和背面图像(S199)。当两个参考图像是一个文档页的正面图像和背面图像时(S199处的是),具体地,当两个参考图像的文档页面索引的页面ID彼此之间相同并且表面信息分别是1和2时,处理部分确定两个文档图像的正面和背面是否与参考图像的正面和背面对应(S200)。
当两个文档图像的一个或所有与参考图像不相似时(S198处的否),或者可替换地,当与两个文档图像分别相似的两个参考图像不是一个文档页的正面图像和背面图像时(S199处的否),处理部分将1设置到对应于正在处理的文档图像的页面ID和参考页面的数目的各个值中(S204)。当两个文档图像的正面和背面与参考图像的正面和背面不对应时(S200处的否),处理部分将错误标志设置为1(S201),然后将总体计数器TC的值设置作为正面/背面改变位置(S202),并且然后返回到步骤S203的处理。当两个文档图像的正面和背面与参考图像的正面和背面对应时(S200处的是),处理部分跳过步骤S201和S202的处理,并且然后移动到步骤S203的处理。
基于与两个文档图像分别相似的参考图像的文档页面索引,处理部分搜索文档图像表2465和文档分类表2463,以此来识别文档页面索引的页面ID和参考页面的数目,并且然后将这些值设置到对应于正在处理的文档图像的页面ID和参考图像的数目中(S203)。
处理部分将总体计数器TC加一(S205)。处理部分确定页面ID是否是1(S206)。当页面ID的值不是1时(S206处的否),处理部分确定错误标志是否是0(S207)。当错误标志是0时(S207处的是),处理部分将错误标志设置为1(S208),然后将总体计数器TC的值设置到错误发生位置值中(S209),并且然后返回到步骤S192的处理。当错误标志是1时(S207处的否),处理部分跳过步骤S208和S209的处理,以此来返回到步骤S192的处理,并且然后继续在步骤S192及其之后的处理,以此来处理剩余的文档图像。
当页面ID的值是1时(S206处的是),处理部分确定错误标志是否是1(S210)。当错误标志是1时(S210处的是),处理部分将错误发生位置和正面/背面改变位置的值记录到记录器中(S211),并且然后将错误标志设置为0(S212)。处理部分作出当前的文档图像是包含在新文档类型中的第一个文档图像的结论,因此确定在之前处理的文档图像和当前的文档图像之间定位的文档划分位置(S123),并且然后移动到步骤S214的处理。当错误标志是0时(S210处的否),处理部分跳过步骤S211到S213的处理,并且移动到步骤S214的处理。
处理部分将在页面计数器PC中的值设置为1(S214)。处理部分确定参考页面的数目的值与页面ID的值是否对应(S215)。当参考页面的数目的值与页面ID的值对应时(S215处的是),处理部分移动到步骤S236的处理。当参考页面的数目的值与页面ID的值不对应时(S215处的否),处理部分确定对所有文档图像的处理是否已经完成(S216)。当对所有文档图像的处理还没有完成时(S216处的否),处理部分获得从一个文档页的正面和背面读取的两个文档图像(S217),并且然后在两个获得的文档图像上执行文档匹配处理(S218)。
当对所有文档图像的处理已经完成时(S216处的是),处理部分在操作板4上显示记录在记录器中的错误发生位置和正面/背面改变位置(S219),并且然后终止处理。此时,读取的图像数据可以被存储在硬盘或类似的设备上,并且然后可以在操作板4上显示数据是否应被交换的选择,以使得用户可以选择处理。当交换数据的处理被选择时,基于与正面/背面改变位置有关的信息执行对图像数据的交换处理。
基于在文档匹配处理中获得的相似性是否比阈值Th大的确定,处理部分判断两个获得的文档图像是否均与参考图像相似(S220)。当两个文档图像与参考图像相似时(S220处的是),基于分别与两个文档图像相似的参考图像的文档页面索引,处理部分搜索文档图像表2465,以此来确定两个参考图像是否是一个文档页的正面图像和背面图像(S221)。
当两个参考图像是一个文档页的正面图像和背面图像时(S221处的是),具体地,当两个参考图像的文档页面索引的页面ID彼此之间相同并且表面信息分别是1和2时,处理部分确定两个文档图像的正面和背面是否与参考图像的正面和背面对应(S222)。
当两个文档图像的一个或所有与参考图像不相似时(S220处的否),或者可替换地当分别与两个文档图像相似的两个参考图像不是一个文档页的正面图像和背面图像时(S221处的否),处理部分将1设置到对应于正在处理的文档图像的页面ID和参考页面的数目的各个值中(S226),并且然后移动到步骤S227的处理。当两个文档图像的正面和背面与参考图像的正面和背面不对应时(S222处的否),处理部分将错误标志设置为1(S223),然后将总体计数器TC的值设置作为正面/背面改变位置(S224),并且然后移动到步骤S225的处理。当两个文档图像的正面和背面与参考图像的正面和背面对应时(S222处的是),处理部分跳过步骤S223和S224的处理,并且然后移动到步骤S225的处理。
基于分别与两个文档图像相似的参考图像的文档页面索引,处理部分搜索文档图像表2465和文档分类表2463,以此来识别文档页面索引的页面ID和参考页面的数目,并且然后将这些值设置到对应于正在处理的文档图像的页面ID和参考页面的数目中(S225)。
处理部分将总体计数器TC加一(S227),并且然后加一到页面计数器PC中(S228)。处理部分确定错误标志是否是1(S229)。当错误标志是1时(S229处的是),处理部分将错误发生位置和正面/背面改变位置的值记录到记录器中(S230),然后将错误标志设置为0(S231),并且然后移动到步骤S232的处理。当错误标志是0时(S229处的否),处理部分跳过步骤S230到S231的处理,并且移动到步骤S232的处理。
处理部分确定在页面计数器PC中的值是否与页面ID的值对应(S232)。当在页面计数器PC中的值与页面ID的值不对应时(S232处的否),处理部分将错误标志设置为1(S233),然后将总体计数器TC的值设置到错误发生位置值中(S234),然后返回到步骤S192的处理,并且然后继续在步骤S192及其之后的处理,以此来处理剩余的文档图像。
当在页面计数器PC中的值与页面ID的值对应时(S232处的是),处理部分确定参考页面的数目的值是否与页面ID的值对应(S235)。当参考页面的数目的值与页面ID的值对应时(S235处的是),处理部分作出这个文档图像是包含在当前文档类型中的最后一个文档图像的结论,因此确定要在当前文档图像和接下来将要处理的文档图像之间定位的文档划分位置(S236),然后返回到步骤S192的处理,并且然后继续在步骤S192及其之后的处理,以此来处理剩余的文档图像。当参考页面的数目的值与页面ID的值不对应时(S235处的否),处理部分返回到步骤S216的处理,并且然后继续在步骤S216及其之后的处理,以此来处理剩余的文档图像。
当发生错误或正面/背面改变时,发生位置被显示在操作板4上。因此,用户可以被通知到错误或正面/背面改变的发生位置。此外,可以为每个文档类型划分文档图像,同时可以确定被包含在每个文档类型中的每个页面是否是正确的以及页面的正面和背面是否是正确的。
(实施例4)
根据本发明的图像读取设备将在下面以实施例4的方式进行描述。图27是显示根据本发明的图像读取设备500的结构的框图。如图所示,文档读取设备500包含:彩色图像输入设备1、A/D转换部分20、阴影校正部分21、和文档匹配处理部分24。彩色图像输入设备1、A/D转换部分20、阴影校正部分21、和文档匹配处理部分24与上述成像设备100中的那些是相似的,因此描述被省略。
如上所述,在本发明中,当由多个页面(例如,固定形式页)组成的文档被扫描,从而生成被扫描的编档文档,关于由多个页面组成的文档的页面顺序信息与关于多个页面的固定形式的匹配信息一起被事先存储。然后,在参考图像和文档图像之间判断相似性,以使得将要被分类的文档分隔被检测。由于这点,文档图像被分类成参考文档的形式,以使得可以生成被扫描的编档文档。同时,可以确定文档图像的顺序是否与事先存储的文档的顺序对应。即无需用户的特殊操作,文档图像可以根据事先存储的文档的顺序被容易地分类。同时,可以确定文档图像的顺序是否是正确的。
此外,即使当事先存储的每个子文档的页的数目相互之间不同时,文档图像可以根据合适数目的文档页被分类。同时,可以确定单个文档图像的顺序是否是正确的。此外,当大量文档图像要被分类时,文档可以容易地被分割,并且将要分类的文档分隔被检测和划分。同时,可以确定单个划分的文档图像的顺序是否是正确的。此外,无需存储参考图像本身,仅通过存储与参考图像对应的特征,可以容易地判断文档图像是否与参考图像相似。
此外,在扫描处理的时候(或者也在电子数据的情形下),当在双面文档中的页面省略、页面顺序替代、正面/背面改变、或类似的发生在文档的一部分中时,发生位置被存储并且然后已扫描的编档文档再次被生成,其开始于随后的页面顺序变为正确的位置处。因此,即使当用户扫描大量的文档页时,例如页面省略等问题发生的位置可以被容易地识别出,并且同时,被扫描的编档文档可以被生成,即使在页面省略已经发生的位置之后。因此,用户再次仅仅扫描页面省略发生的部分就足够了。
在上述实施例中,彩色图像输入设备1可以由以下实现,例如,平板扫描仪、胶片扫描仪、数字照相机、或者便携式电话。此外,彩色图像输出设备3可以由以下实现,例如:图像显示设备例如CRT显示器和液晶显示器;或者打印机,其使用电子摄影术方法或者喷墨方法,输出处理结果到记录纸张或类似的部件中。此外,作为成像设备100,可以提供调制解调器作为用于通过网络与服务器设备或类似设备连接的通信装置。此外,代替从彩色图像输入设备1获得彩色图像数据,彩色图像数据可以通过网络从外部存储设备、服务器设备、或类似的设备中获得。
在上述实施例中,存储器246和控制部分247已经被提供在文档匹配处理部分24的内部。然而,本发明不限于此。即存储器246和控制部分247可以在文档匹配处理部分24的外部被提供。
在本发明中,用于控制文档存储处理、文档分类处理、和检测文档图像顺序处理的计算机程序代码可以被记录在计算机可读存储器产品中,存储器产品用于存储被计算机执行的计算机程序(可执行程序、中间代码程序、和源程序)的程序代码。作为结果,存储程序代码的用于控制文档存储处理、文档分类处理、和检测文档图像顺序处理的存储器产品以自由的便携式的方式被提供。为了处理可以被微型计算机执行,存储器产品可以是程序媒介,例如像ROM的存储器(没有示出)。可替换地,另一类型的程序介质可以被使用在其中程序读取装置作为外部存储设备(没有示出)被提供,并且存储器产品被插入到那里以使得存储器产品被读取。
在每个情形下,存储的计算机程序代码可以直接通过微处理器被访问和执行。可替换地,计算机程序代码可以被读取,然后读取的计算机程序代码可以被下载到微型计算机的程序存储区域(没有示出)中,并且然后计算机程序代码可以被执行。在这种情形下,用于下载的计算机程序被事先存储在主装置中。
这里,上述程序媒介是从主体中独立出来的存储器产品,并且可以是:磁带系统,例如磁带和盒式带;盘系统,例如磁盘(包含软盘和硬盘)和光盘,例如CD-ROM/MO/MD/DVD;卡片系统例如,IC卡(包括存储卡)和光卡;和以固定方式装载计算机程序的媒介,包括半导体存储器,例如掩模ROM、EPROM(可擦可编程只读存储器)、EEPROM(电可擦可编程只读存储器)、和闪ROM。
此外,在这种情形下,既然使用的系统结构允许到包括Internet通信网络的连接,存储器产品可以动态地装载计算机程序代码,例如,通过从通信网络下载计算机程序代码的方式。这里,当计算机程序代码将从通信网络被下载时,用于下载的计算机程序可以事先被存储在主装置中,或者可替换地,可以从另一存储器产品安装。这里,本发明可以以一种计算机数据信号的形式被实现,在该信号中上述程序代码被嵌入在由电子传输实现的载波中。

Claims (18)

1、一种用于判断已获得的文档图像是否与预先准备的参考图像相似、并且然后基于该判断结果在该文档图像上执行图像处理的图像处理方法,包括:
存储多个类型识别符的步骤,每个类型识别符包含一个或多个图像识别符,并且由此识别文档的类型,每个图像识别符用于识别多个参考图像的每一个;
判断步骤:判断该已获得的文档图像是否与参考图像相似;
选择步骤:当在所述判断步骤中该文档图像被判断为与参考图像相似时,从该存储的图像识别符中选择识别该参考图像的图像识别符;和
确定步骤:对包含在所述选择步骤中选择的该图像识别符的每个类型识别符,确定包含在该类型识别符中的图像识别符是否与用来识别被判断为与该文档图像相似的参考图像的图像识别符对应。
2、根据权利要求1所述的图像处理方法,其中
该图像识别符包含用于指示该参考图像是否是包含在文档类型中的第一个参考图像的识别符,该文档类型是由包含该图像识别符自身的类型识别符所识别的,并且其中
所述的图像处理方法进一步包括:
执行以下的步骤:每次文档图像被判断为与参考图像相似时,对判断为相似的文档图像将文档图像的数目向上计数;和
执行以下的步骤:当第一页被向上计数时,基于在所述选择步骤选择的图像识别符确定该参考图像是否是第一个参考图像;其中
当该参考图像被确定为不是第一个参考图像时,所述确定步骤确定由包含所述选择步骤中选择的图像识别符的类型识别符识别的文档的顺序与已经被存储的文档的顺序不对应。
3、根据权利要求1所述的图像处理方法,其中
该图像识别符包含用于指示该参考图像是否是包含在文档类型中的最后一个参考图像的识别符,该文档类型是由包含该图像识别符自身的类型识别符所识别的,并且其中
所述的图像处理方法进一步包括:
执行以下的步骤:每次文档图像被判断为与参考图像相似时,对判断为相似的文档图像将文档图像的数目向上计数;
执行以下的步骤:当所述判断步骤判断该文档图像与该参考图像相似时,基于在所述选择步骤中选择的图像识别符确定该参考图像是否是最后一个参考图像;和
执行以下的步骤:当该参考图像被确定为是最后一个参考图像时,确定已计数的文档图像的数目是否与被包含在类型识别符中的图像识别符的数目对应,该类型识别符包含在所述选择步骤中选择的图像识别符;其中
当已计数的文档图像的数目被确定为与被包含在该类型识别符中的图像识别符的数目不对应时,所述确定步骤确定由包含所述选择步骤中选择的图像识别符的类型识别符识别的文档的顺序与已经被存储的文档的顺序不对应。
4、根据权利要求1所述的图像处理方法,其中
该图像识别符包含用于指示在文档类型中的页面数目的识别符,该文档类型是由包含该图像识别符自身的类型识别符所识别的,并且其中
所述的图像处理方法进一步包括:
执行以下的步骤:每次文档图像被判断为与参考图像相似时,对判断为相似的文档图像将文档图像的数目向上计数;
执行以下的步骤:当所述判断步骤判断该文档图像与该参考图像相似时,基于在所述选择步骤中选择的图像识别符检测该参考图像的页面数目;和
确定已检测的页面数目是否与已计数的文档图像的数目对应的步骤;其中
当已检测的页面数目被确定为与已计数的文档图像的数目不对应时,所述确定步骤确定由包含在所述选择步骤中选择的图像识别符的类型识别符识别的文档的顺序与已经被存储的文档的顺序不对应。
5、根据权利要求1所述的图像处理方法,其中
该图像识别符包含用于指示图像是一个文档页的正面图像或背面图像的识别符,
所述判断步骤判断从该一个文档页的正面和背面获得的两个文档图像是否分别与参考图像相似,和
当所述判断步骤判断该两个文档图像分别与参考图像相似时,所述选择步骤从存储的图像识别符中选择每一个识别该参考图像的图像识别符,并且其中
所述的图像处理方法进一步包括:
执行以下的步骤:基于在所述选择步骤选择的图像识别符,确定该两个参考图像是否是该一个文档页的正面图像和背面图像;和
执行以下的步骤:当该两个参考图像被确定为该一个文档页的正面图像和背面图像时,确定与从该一个文档页的正面获得的文档图像相似的参考图像是否是该正面图像,以及与从该一个文档页的背面获得的文档图像相似的参考图像是否是该背面图像;其中
当确定与从该一个文档页的正面获得的文档图像相似的参考图像是该背面图像以及与从该一个文档页的背面获得的文档图像相似的参考图像是该正面图像时,所述确定步骤确定由包含在所述选择步骤中选择的图像识别符的类型识别符识别的文档的顺序与已经被存储的文档的顺序不对应。
6、根据权利要求5所述的图像处理方法,进一步包括:
执行以下的步骤:当确定与从该一个文档页的正面获得的文档图像相似的参考图像是该背面图像以及与从该一个文档页的背面获得的文档图像相似的参考图像是该正面图像时,交换该两个文档图像的正面和背面。
7、根据权利要求1所述的图像处理方法,进一步包括:
执行以下的步骤:存储与该参考图像的图像识别符相关联的特征;和
提取步骤:提取该已获得的文档图像的特征;其中
基于在所述提取步骤中提取的特征和存储的该参考图像的特征,所述判断步骤判断该文档图像是否与该参考图像相似。
8、根据权利要求1所述的图像处理方法,进一步包括:
执行以下的步骤:当所述确定步骤确定由包含在所述选择步骤中选择的图像识别符的类型识别符识别的文档的顺序与已经被存储的文档的顺序不对应时,通知这种情况。
9、一种用于判断已获得的文档图像是否与预先准备的参考图像相似、并且然后基于该判断结果在该文档图像上执行图像处理的图像处理设备,包括:
存储部分,用于存储多个类型识别符,每个类型识别符包含一个或多个图像识别符,并且由此识别文档的类型,每个图像识别符用于识别多个参考图像的每一个;
判断部分,用于判断该已获得的文档图像是否与参考图像相似;
选择部分,用于:当所述判断部分判断该文档图像与参考图像相似时,从存储在所述存储部分中的该图像识别符中选择识别该参考图像的图像识别符;和
第一确定部分,用于:对包含由所述选择部分选择的该图像识别符的每个类型识别符,确定包含在该类型识别符中的图像识别符是否与用来识别被判断为与该文档图像相似的参考图像的图像识别符对应。
10、根据权利要求9所述的图像处理设备,其中
该图像识别符包含用于指示该参考图像是否是包含在文档类型中的第一个参考图像的识别符,该文档类型是由包含该图像识别符自身的类型识别符所识别的,并且其中
所述的图像处理设备进一步包括:
计数部分,用于:每次文档图像被判断为与参考图像相似时,将被判断为相似的文档图像的数目向上计数;和
第二确定部分,用于:当第一页被向上计数时,基于由所述选择部分选择的图像识别符确定该参考图像是否是第一个参考图像;其中
当该参考图像被确定为不是第一个参考图像时,所述第一确定部分确定由包含由所述选择部分选择的图像识别符的类型识别符识别的文档的顺序与已经被存储的文档的顺序不对应。
11、根据权利要求9所述的图像处理设备,其中
该图像识别符包含用于指示该参考图像是否是包含在文档类型中的最后一个参考图像的识别符,该文档类型是由包含该图像识别符自身的类型识别符所识别的,并且其中
所述的图像处理设备进一步包括:
计数部分,用于:每次文档图像被判断为与参考图像相似时,将被判断为相似的文档图像的数目向上计数;
第三确定部分,用于:当所述判断部分判断该文档图像与该参考图像相似时,基于由所述选择部分选择的图像识别符确定该参考图像是否是最后一个参考图像;和
第四确定部分,用于:当该参考图像被确定为是最后一个参考图像时,确定已计数的文档图像的数目是否与被包含在类型识别符中的图像识别符的数目对应,该类型识别符包含由所述选择部分选择的图像识别符;其中
当已计数的文档图像的数目被确定为与被包含在该类型识别符中的图像识别符的数目不对应时,所述第一确定部分确定由包含由所述选择部分选择的图像识别符的类型识别符识别的文档的顺序与已经被存储的文档的顺序不对应。
12、根据权利要求9所述的图像处理设备,其中
该图像识别符包含用于指示在文档类型中的页面数目的识别符,该文档类型是由包含该图像识别符自身的类型识别符所识别的,并且其中
所述的图像处理设备进一步包括:
计数部分,用于:每次文档图像被判断为与参考图像相似时,将被判断为相似的文档图像的数目向上计数;
检测部分,用于:当所述判断步骤判断该文档图像与该参考图像相似时,基于由所述选择部分选择的图像识别符检测该参考图像的页面数目;和
第五确定部分,用于:确定已检测的页面数目是否与已计数的文档图像的数目对应;其中
当已检测的页面数目被确定为与已计数的文档图像的数目不对应时,所述第五确定部分确定由包含由所述选择部分选择的图像识别符的类型识别符识别的文档的顺序与已经被存储的文档的顺序不对应。
13、根据权利要求9所述的图像处理设备,其中
该图像识别符包含用于指示图像是一个文档页的正面图像或背面图像的识别符,
所述判断部分判断从该一个文档页的正面和背面获得的两个文档图像是否分别与参考图像相似,和
当所述判断部分判断该两个文档图像分别与参考图像相似时,所述选择部分从在所述存储部分中存储的图像识别符中选择每一个识别该参考图像的图像识别符,并且其中
所述的图像处理设备进一步包括:
第六确定部分,用于:基于由所述选择部分选择的图像识别符,确定该两个参考图像是否是该一个文档页的正面图像和背面图像;和
第七确定部分,用于:当该两个参考图像被确定为该一个文档页的正面图像和背面图像时,确定与从该一个文档页的正面获得的文档图像相似的参考图像是否是该正面图像,以及与从该一个文档页的背面获得的文档图像相似的参考图像是否是该背面图像;其中
当确定与从该一个文档页的正面获得的文档图像相似的参考图像是该背面图像以及与从该一个文档页的背面获得的文档图像相似的参考图像是该正面图像时,所述第一确定部分确定由包含由所述选择部分选择的图像识别符的类型识别符识别的文档的顺序与已经被存储的文档的顺序不对应。
14、根据权利要求13所述的图像处理设备,进一步包括:
交换部分,用于:当确定与从该一个文档页的正面获得的文档图像相似的参考图像是该背面图像以及与从该一个文档页的背面获得的文档图像相似的参考图像是该正面图像时,交换该两个文档图像的正面和背面。
15、根据权利要求9所述的图像处理设备,其中
所述存储部分存储与该参考图像的图像识别符相关联的特征,和其中
所述的图像处理设备进一步包括
提取部分,用于:提取该已获得的文档图像的特征;其中
基于由所述提取部分提取的特征和存储在所述存储部分中的该参考图像的特征,所述判断部分判断该文档图像是否与该参考图像相似。
16、根据权利要求9所述的图像处理设备,进一步包括
通知部分,用于:当所述第一确定部分确定由包含由所述选择部分选择的图像识别符的类型识别符识别的文档的顺序与已经被存储的文档的顺序不对应时,通知这种情况。
17、一种图像读取设备,包括:
用于读取文档图像的图像输入设备;和
根据权利要求9到16中任意一项所述的图像处理设备;其中
所述的图像处理设备处理由所述图像输入设备读取的文档图像。
18、一种成像设备,包括:
根据权利要求9到16中任意一项所述的图像处理设备;以及
图像输出设备,用于基于由所述的图像处理设备处理的文档成像形成输出图像。
CN2008101428590A 2007-02-13 2008-02-13 图像处理方法、图像处理设备、图像读取设备、成像设备 Expired - Fee Related CN101339566B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP032592/07 2007-02-13
JP2007032592 2007-02-13
JP210013/07 2007-08-10
JP2007210013A JP4324628B2 (ja) 2007-02-13 2007-08-10 画像処理方法、画像処理装置、画像読取装置、画像形成装置、コンピュータプログラム及び記録媒体

Publications (2)

Publication Number Publication Date
CN101339566A true CN101339566A (zh) 2009-01-07
CN101339566B CN101339566B (zh) 2011-07-27

Family

ID=39844695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101428590A Expired - Fee Related CN101339566B (zh) 2007-02-13 2008-02-13 图像处理方法、图像处理设备、图像读取设备、成像设备

Country Status (2)

Country Link
JP (1) JP4324628B2 (zh)
CN (1) CN101339566B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105308944A (zh) * 2013-03-13 2016-02-03 柯法克斯公司 对移动设备捕获的数字图像中的对象进行分类的系统和方法
CN105391887A (zh) * 2014-08-27 2016-03-09 京瓷办公信息系统株式会社 图像读取装置
US9934433B2 (en) 2009-02-10 2018-04-03 Kofax, Inc. Global geographic information retrieval, validation, and normalization
US10108860B2 (en) 2013-11-15 2018-10-23 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data
US10127636B2 (en) 2013-09-27 2018-11-13 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US10146803B2 (en) 2013-04-23 2018-12-04 Kofax, Inc Smart mobile application development platform
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US10657600B2 (en) 2012-01-12 2020-05-19 Kofax, Inc. Systems and methods for mobile image capture and processing
US10699146B2 (en) 2014-10-30 2020-06-30 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US10803350B2 (en) 2017-11-30 2020-10-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6003290B2 (ja) * 2012-06-28 2016-10-05 コニカミノルタ株式会社 出力装置、プログラム、および記録媒体

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5465353A (en) * 1994-04-01 1995-11-07 Ricoh Company, Ltd. Image matching and retrieval by multi-access redundant hashing

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9934433B2 (en) 2009-02-10 2018-04-03 Kofax, Inc. Global geographic information retrieval, validation, and normalization
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US10657600B2 (en) 2012-01-12 2020-05-19 Kofax, Inc. Systems and methods for mobile image capture and processing
US9996741B2 (en) 2013-03-13 2018-06-12 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
CN105308944A (zh) * 2013-03-13 2016-02-03 柯法克斯公司 对移动设备捕获的数字图像中的对象进行分类的系统和方法
US10146803B2 (en) 2013-04-23 2018-12-04 Kofax, Inc Smart mobile application development platform
US10127636B2 (en) 2013-09-27 2018-11-13 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US10108860B2 (en) 2013-11-15 2018-10-23 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data
CN105391887B (zh) * 2014-08-27 2019-08-23 京瓷办公信息系统株式会社 图像读取装置
CN105391887A (zh) * 2014-08-27 2016-03-09 京瓷办公信息系统株式会社 图像读取装置
US10699146B2 (en) 2014-10-30 2020-06-30 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US10803350B2 (en) 2017-11-30 2020-10-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
US11062176B2 (en) 2017-11-30 2021-07-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach

Also Published As

Publication number Publication date
CN101339566B (zh) 2011-07-27
JP4324628B2 (ja) 2009-09-02
JP2008226221A (ja) 2008-09-25

Similar Documents

Publication Publication Date Title
CN101339566B (zh) 图像处理方法、图像处理设备、图像读取设备、成像设备
CN101184137B (zh) 图像处理方法和装置、图像读取及形成设备
US8320683B2 (en) Image processing method, image processing apparatus, image reading apparatus, and image forming apparatus
CN100533467C (zh) 图像处理装置、图像形成装置、图像读取装置及图像处理方法
CN101404020B (zh) 图像处理方法和设备、图像形成设备以及图像读取设备
CN112686812B (zh) 银行卡倾斜矫正检测方法、装置、可读存储介质和终端
CN110020692A (zh) 一种基于印刷体模板的手写体分离与定位方法
CN110298353B (zh) 一种字符识别方法及系统
JP4340711B2 (ja) 画像処理方法、画像処理装置、画像形成装置、コンピュータプログラム及び記録媒体
CN111985465A (zh) 文本识别方法、装置、设备及存储介质
CN112749606A (zh) 一种文本定位方法和装置
CN101277371B (zh) 图像的处理方法、处理装置、形成装置及读取装置
CN101364268B (zh) 图像处理装置和图像处理方法
CN113792659B (zh) 文档识别方法、装置及电子设备
CN111738310B (zh) 物料分类方法、装置、电子设备和存储介质
CN101261684B (zh) 图像处理方法、图像处理装置及图像形成装置
CN111126273A (zh) 图像处理方法、装置、电子设备以及存储介质
CN101246326B (zh) 图像处理方法与装置、图像形成装置、和图像读取装置
CN113705571A (zh) 基于rgb阈值去红章的方法、装置、可读介质及电子设备
CN101237514B (zh) 图像处理装置及方法、图像读取和形成装置
JP2008123456A (ja) 画像処理方法、画像処理装置、画像形成装置、コンピュータプログラム及び記録媒体
CN109961063A (zh) 文本检测方法及装置、计算机设备和存储介质
CN111553317B (zh) 一种防伪码的获取方法、装置、计算机设备和存储介质
EP4266264A1 (en) Unconstrained and elastic id document identification in an rgb image
CN112270295A (zh) 学生作业场景下的框题方法及装置、终端设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110727

Termination date: 20210213

CF01 Termination of patent right due to non-payment of annual fee