CN101261684A - 图像处理方法、图像处理装置及图像形成装置 - Google Patents
图像处理方法、图像处理装置及图像形成装置 Download PDFInfo
- Publication number
- CN101261684A CN101261684A CNA2008100820999A CN200810082099A CN101261684A CN 101261684 A CN101261684 A CN 101261684A CN A2008100820999 A CNA2008100820999 A CN A2008100820999A CN 200810082099 A CN200810082099 A CN 200810082099A CN 101261684 A CN101261684 A CN 101261684A
- Authority
- CN
- China
- Prior art keywords
- zone
- image
- unit
- characteristic quantity
- original image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
Abstract
一种图像处理方法、图像处理装置、图像读取装置和图像形成装置。层分离单元基于区域判定信号,将字符区域的原稿图像输出到特征点计算单元,从照片区域的原稿图像中生成四个层,并将生成的层输出到特征点计算单元。特征点计算单元对每个区域提取的特征点进行合计。特征量计算单元基于特征点计算散列值。投票处理单元基于散列值检索散列表,对于与散列值对应的注册图像进行投票。类似度判定处理单元基于投票结果,判定原稿图像类似于哪个注册图像,并输出判定结果。即使是包含照片的原稿也能够高精度地进行核对。
Description
技术领域
本发明涉及提取原稿图像的特征量并基于提取出的特征量进行与注册图像的类似判定的图像处理方法、图像处理装置和包括该图像处理装置的图像形成装置。
背景技术
作为由扫描仪读取原稿,将读取原稿而得的图像数据与预先注册的图像数据进行核对,从而判定图像的类似度的图像处理,例如提出了由OCR(Optical Character Reader;光学字符阅读器)从图像中提取关键字(keyword),通过提取的关键字来判定图像的类似度的方法、将进行类似度的判定的图像限定于具有格线的帐票图像,从而提取格线的特征来判定图像的类似度的方法等。
但是,在这些判定处理中,为了高精度地判定图像的类似度,需要事先校正(歪斜校正)要读取的原稿的倾斜等,在不能进行歪斜(skew)校正的情况下,存在不能高精度判定图像的类似度的问题。此外,由于判定图像的类似度的情况下的处理复杂,因此难以通过硬件实现。在通过单纯的算法来实现类似度的判定处理的情况下,容易通过硬件实现,但存在不能提高判定精度,而且对于歪斜或噪声等干扰的抗性不足等问题。
因此,在非专利文献1(中居友弘、其他三名,“複比とハツシユに基づく文書画像検索”,电子信息通信学会技术研究报告,2005年3月)中,提出了以下的文档图像的类似度判定方法,在原稿图像旋转的情况下,即使在注册图像中没有写入的情况下,也能够高精度地判定类似度。该方法将原稿图像进行二值化并计算连接分量,将连接分量的重心作为特征点而求出,对某个特征点提取周边的特征点,并从提取出的特征点中,例如选择三个特征点的组来计算特征点的距离之比,基于计算出的多个比来使用散列(hash)函数等计算作为特征量的散列值。该散列值预先按照多个原稿格式(注册原稿)的每个,与表示原稿的索引对应地存储在表中,对与通过读入的(读取的)原稿图像计算出的散列值一致的原稿格式进行投票,并通过对得到的得票数进行阈值处理,从而进行原稿图像的核对。作为特征点所计算的重心难以受到噪声等的影响,即使在产生原稿的旋转、平行移动等的情况下,重心之间的相对位置关系也不变化,所以通过使用基于重心(特征点)之间距离之比的特征量来进行核对,从而能够实现不易受到干扰影响的类似判定处理。
发明内容
但是,在非专利文献1的方法中,由于将原稿图像二值化并求连接分量,所以在原稿由字符构成这样的字符原稿的情况下,能够高精度地求连接分量,并且能够高精度地进行与注册图像的核对,但是在原稿图像是由印刷照片或连续色调区域所构成的照相纸照片等照片原稿的情况下,由于原稿图像的浓度值分布范围较广,因此仅通过将原稿图像进行二值化则连接分量的边界不清楚,不能够高精度地求连接分量,存在与注册图像的核对精度降低的问题。
本发明鉴于这样的情况而完成,本发明的目的在于提供图像处理方法、图像处理装置和包括该图像处理装置的图像形成装置,基于原稿图像的各像素的像素值,生成像素值的范围不同的多个层次图像,在生成的每个层次图像中提取特征点,并基于每个层次图像提取出的特征点,计算原稿图像的特征量(特征向量,例如散列值),从而即使是含有照片的原稿也能够高精度地进行核对。
本发明的图像处理装置提取由多个像素构成的原稿图像的特征量,并基于提取的特征量来进行与注册图像的类似判定,该装置包括:存储单元,预先存储与多个注册图像分别对应的特征量;生成单元,基于原稿图像的各像素的像素值,生成像素值的范围不同的多个层次图像;提取单元,对由生成单元生成的每个层次图像进行二值化处理并提取特征点;计算单元,基于由提取单元每个层次图像所提取出的特征点来计算原稿图像的特征量;特征量判定单元,判定由计算单元计算出的特征量和与注册图像对应的特征量是否一致;投票单元,在由特征量判定单元判定为特征量一致的情况下,每个一致的特征量对与特征量对应的注册图像进行投票;以及类似判定单元,基于由投票单元投票所得的得票数判定原稿图像是否与注册图像类似。
本发明中,基于原稿图像的各像素的像素值,生成像素值的范围不同的多个层次图像。例如,作为原稿图像的各像素的像素值,采用各像素的浓度值(亮度值、明暗值),原稿图像中包含的浓度值例如是由0~255的256色调表示的情况下,通过将原稿图像分为浓度值的范围为0~63、64~127、128~193、194~255的不同的四个层来表现,从而生成四个层次图像。通过对生成的各层次图像进行二值化而得到的二值化图像来确定连接区域(连接分量),将确定的连接区域的重心作为特征点来提取。将在各层次图像中提取的特征点进行合计(将每个层次图像所提取出的各特征点作为原稿图像上的特征点集中),从合计的特征点中选择多个特征点,从而计算作为不变量的特征量(例如,散列值)。判定计算出的特征量和与预先存储的多个注册图像(核对原稿图像是否类似的图像)分别对应的特征量是否一致。在判定为特征量一致的情况下,每个一致的特征量对与该特征量对应的注册图像进行投票。基于投票所得的得票数,例如在某一注册图像的得票数大于规定的阈值的情况下,判定原稿图像与该注册图像类似,在得票数小于规定的阈值的情况下,判定原稿图像与注册图像不类似。在确定用于求特征点的连接区域的情况下,通过将原稿图像分为多个层次图像,从而即使在以连续色调表现原稿图像这样的照片图像的情况下,也可以减少对每个层次图像的色调范围,从而更容易确定连接区域,将连接区域的边界明确化而能够高精度地进行特征点的提取,与注册图像的核对精度提高。
本发明的图像处理装置包括区域判定单元,基于原稿图像的各像素的像素值,至少判定是字符区域或照片区域的哪一个区域,生成单元对由区域判定单元判定为照片区域的区域,生成多个层次图像。
本发明中,基于原稿图像的各像素的像素值,至少判定是字符区域或照片区域的哪一个区域。区域判定的方法可以是任何方法,例如进行通过将原稿图像进行了二值化后的二值化图像对黑像素进行扩大的处理,从而求黑像素部分(游程),将求出的游程(run)连接而统一为一个区域。求与统一了的区域外接的矩形大小,并根据外接矩形的大小来判断各矩形区域的图像类别(例如,字符区域、照片区域)。对于判定为照片区域的区域,生成多个层次图像。即,在混杂了字符区域和照片区域的原稿图像的情况下,对于字符区域,确定连接区域而不用分为层次图像,从而提取特征点,并基于提取出的特征点计算特征量。另一方面,对于照片区域,将原稿图像分为多个层次图像,每个层次图像确定连接区域从而提取特征点,并将在各层次图像中提取的特征点进行合计。由此,即使是混杂了字符区域和照片区域的原稿图像,也能够进一步容易确定连接区域,并将连接区域的边界明确化,从而高精度地进行特征点的提取,提高与注册图像的核对精度。
本发明的图像处理装置中,提取单元对于由区域判定单元判定为字符区域的区域,对原稿图像进行二值化处理来提取特征点,对于被判定为照片区域的区域,每个层次图像提取特征点,计算单元基于每个区域提取出的特征点计算原稿图像的特征量。
本发明中,对于判定为字符区域的区域,对原稿图像实施二值化处理来提取特征点。对于判定为照片区域的区域,每个层次图像提取特征点。将在字符区域和照片区域中分别提取出的特征点进行合计来求一个原稿图像整体的特征点,并基于求出的特征点,计算原稿图像的特征量。由此,即使是混杂了字符区域和照片区域的原稿图像,也能够高精度地进行特征点的提取。
本发明的图像处理装置中,提取单元对于由区域判定单元判定为字符区域的区域,对原稿图像进行二值化处理并提取特征点,对判定为照片区域的区域,每个层次图像提取特征点,计算单元、特征量判定单元以及投票单元对每个区域进行各自的处理,图像处理装置还包括将投票单元对每个区域投票所得的得票数相加的加法单元,类似判定单元基于由加法单元相加后的得票数判定原稿图像是否与注册图像类似。
此外,本发明中,对于判定为字符区域的区域,对原稿图像进行二值化处理并提取特征点。对判定为照片区域的区域,每个层次图像提取特征点,对每个层次图像中提取出的特征点进行合计。基于字符区域和照片区域各自的特征点,每个区域计算特征量,并判定计算出的特征量是否与对应于注册图像的特征量一致。在判定为特征量一致的情况下,每个一致的特征量对与该特征量对应的注册图像进行投票,并将投票所得的得票数进行每个区域相加。基于相加的得票数,判断原稿图像是否与注册图像类似。由此,即使是混杂了字符区域和照片区域的原稿图像,也能够每个区域进行投票处理从而高精度地进行与注册图像的核对。此外,由于可以对字符区域、照片区域分别求位置信息,所以在将它们的信息和注册图像对应存储,每个区域提取特征量并进行投票的情况下,也参照它们的位置信息来判定原稿图像是否与注册图像类似。
本发明的图像处理装置中,提取单元对于由区域判定单元判定为字符区域的区域,对原稿图像进行二值化处理并提取特征点,对判定为照片区域的区域,每个层次图像提取特征点,计算单元、特征量判定单元、投票单元以及类似判定单元对每个区域进行各自的处理,图像处理装置还包括综合判定单元,基于由类似判定单元每个区域所判定的判定结果,判定原稿图像是否与注册图像类似。
本发明中,对于判定为字符区域的区域,对原稿图像进行二值化处理并提取特征点。对判定为照片区域的区域,在每个层次图像中提取特征点,并将每个层次图像提取出的特征点进行合计。基于字符区域和照片区域各自的特征点,每个区域计算特征量,并判定计算出的特征量是否与对应于注册图像的特征量一致。在判定为特征量一致的情况下,每个一致的特征量对与该特征量对应的注册图像进行投票,基于投票所得的得票数,每个区域判定原稿图像是否与注册图像类似。基于每个区域判定的判定结果,判定原稿图像是否与注册图像类似。由此,即使是混杂了字符区域和照片区域的原稿图像,也可以每个区域判定原稿图像是否与注册图像类似,并基于该判定结果最终地判定原稿图像是否与注册图像类似,从而高精度地进行与注册图像的核对。此外,该情况下也与上述同样,由于可以对字符区域、照片区域分别求位置信息,所以将它们的信息和注册图像对应存储,每个区域提取特征量并进行投票的情况下,也参照它们的位置信息来判定原稿图像是否与注册图像类似。进而,对于字符区域和照片区域的判定结果,也可以添加加权来进行判定。例如,求字符区域和照片区域所占的比例,并将该比例用作比率。
本发明的图像处理装置中,提取单元对由区域判定单元判定为照片区域的区域,从多个层次图像中提取特征点,计算单元基于由提取单元提取出的特征点计算原稿图像的特征量。
本发明中,对判定为照片区域的区域,从多个层次图像(层)中分别提取特征点,并基于提取出的特征点来计算原稿图像的特征量。例如,不仅存在注目特征点的层,而且包含相邻的层,都提取接近注目特征点的周边特征点而计算特征量。由此,即使在相同的层上特征量相同,但如果层不同则特征量也可能不同,所以能够进一步提高原稿图像的核对精度。
本发明的图像形成装置包括上述图像处理装置的任何一个,以及进行由该图像处理装置处理过的图像的形成的图像输出装置。
本发明的计算机程序用于使计算机提取由多个像素构成的原稿图像的特征量,并基于提取的特征量来进行与注册图像的类似判定,使计算机具有作为以下单元的功能:基于原稿图像的各像素的像素值,生成像素值的范围不同的多个层次图像的单元;对每个生成的层次图像进行二值化处理并提取特征点的单元;基于每个层次图像提取出的特征点来计算原稿图像的特征量的单元;判定计算出的特征量和与注册图像对应的特征量是否一致的单元;在判定为特征量一致的情况下,每个一致的特征量对与该特征量对应的注册图像进行投票的单元;以及基于投票所得的得票数判定原稿图像是否与注册图像类似的单元。
在本发明的计算机可读取的记录介质,记录了上述计算机程序。
本发明中,即使在以连续色调表现原稿图像这样的照片图像的情况下,也可以对每个层次图像减少色调范围,从而更容易确定连接区域,将连接区域的边界进行明确而能够高精度地进行特征点的提取,提高与注册图像的核对精度。此外,即使是混杂了文字区域和照片区域的原稿图像,也能够高精度地进行与注册图像的核对。
附图说明
图1是表示包括本发明的图像处理装置的图像形成装置的结构的方框图。
图2是表示文本核对处理单元的结构的方框图。
图3是表示特征点计算单元的结构的方框图。
图4是表示连接区域的特征点的例子的说明图。
图5是表示对于字符串的特征点的提取结果的例子的说明图。
图6的(A)~图6的(D)是表示照片区域的特征点的例子的说明图。
图7是表示层的分离方法的例子的说明图。
图8是表示注目特征点和周围特征点的说明图。
图9的(A)~图9的(C)是表示基于注目特征点的不变量的计算例子的说明图。
图10的(A)~图10的(C)是表示基于注目特征点的不变量的计算例子的说明图。
图11的(A)~图11的(D)是表示基于注目特征点的不变量的计算例子的说明图。
图12的(A)~图12的(D)是表示基于注目特征点的不变量的计算例子的说明图。
图13A、图13B是表示散列表的结构的说明图。
图14是表示基于投票结果的类似判定的一例的说明图。
图15是表示本发明的图像读取装置的结构的方框图。
图16是表示彩色图像处理装置的文本核对处理的步骤的流程图。
图17是表示文本核对处理的步骤的流程图。
图18是表示文本核对处理的步骤的流程图。
图19是表示注目特征点和周围特征点的说明图。
图20是表示计算层间的距离的一例的说明图。
图21是表示基于注目特征点的不变量的计算例子的说明图。
图22是表示基于注目特征点的不变量的计算例子的说明图。
图23是表示基于注目特征点的不变量的计算例子的说明图。
图24是表示基于注目特征点的不变量的计算例子的说明图。
图25是表示文本核对处理的步骤的流程图。
图26是表示文本核对处理的步骤的流程图。
具体实施方式
以下,对于本发明,根据表示它的实施方式的附图来进行说明。
(实施方式1)
图1是表示包括本发明的图像处理装置的图像形成装置100的结构的方框图。图像形成装置100(例如,数字彩色复印机或包括复印功能、打印功能、归档(filing)功能、传真或电子邮件发送功能的复合机)包括彩色图像输入装置1、彩色图像处理装置2(图像处理装置)、彩色图像输出装置3、用于进行各种操作的操作面板4等。通过由彩色图像输入装置1读入(读取)原稿而得的RGB(R:红,G:绿,B:蓝)的模拟信号的图像数据被输出到彩色图像处理装置2,由彩色图像处理装置2进行规定的处理,作为CMYK(C:青,M:品红,Y:黄,K:黑)的数字彩色信号而输出到彩色图像输出装置3。
彩色图像输入装置1例如是包括CCD(Charged Coupled Device;电荷耦合器件)的扫描仪,将来自原稿图像的反射光像作为RGB的模拟信号读取,并将读取出的RGB信号输出到彩色图像处理装置2。此外,彩色图像输出装置3是将原稿图像的图像数据输出到记录纸上的电子照片方式或喷墨方式等的打印机。此外,彩色图像输出装置3也可以是显示器等显示装置。
彩色图像处理装置2包括后述的各个处理单元,由ASIC(ApplicationSpecific Integrated Circuit;专用集成电路)等构成。
A/D变换单元20将从彩色图像输入装置1输入的RGB信号例如变换为10比特的数字信号,将变换后的RGB信号输出到黑斑(shading)校正单元21。黑斑校正单元21对输入的RGB信号进行校正处理,以除去在彩色图像输入装置1的照明系统、成像系统、拍摄系统等中产生的各种失真,并将校正后的RGB信号输出到输入色调校正单元22。
输入色调校正单元22对输入的RGB信号(RGB的反射率信号)进行用于调整彩色平衡的处理,同时进行除去基底浓度或进行对比度等画质调整处理。此外,输入色调校正单元22进行变换为浓度信号等彩色图像处理装置2所采用的、图像处理系统容易处理的信号的处理,并将处理后的RGB信号输出到区域识别处理单元23和区域分离处理单元24。
区域识别处理单元23包括二值化处理单元、游程扩大处理单元、标记(labeling)处理单元、外接矩形提取处理单元、判定单元(均未图示)等各处理单元。区域识别处理单元23对输入图像数据进行二值化处理而生成二值化图像。区域识别处理单元23进行由游程扩大处理单元对二值化图像的黑像素进行扩大的处理而求黑像素部分(游程),并将游程扩大信号输出到标记处理单元。从游程扩大处理单元输出的游程扩大信号被输入标记处理单元,在标记处理单元中将基于游程扩大信号连接的游程统一(标记)为一个区域,并将表示该统一的区域的特征的信号输出到外接矩形处理单元。
区域识别处理单元23通过外接矩形处理单元求与被标记的各个区域外接的矩形的大小,并将其结果输出到判定单元。区域识别处理单元23通过判定单元根据外接矩形的大小来判定各矩形区域的图像类别,例如是字符区域还是照片区域,并将判定结果的区域判定信号输出到文本核对处理单元25等。区域识别处理单元23所判定出的照片区域包含网点图像和连续色调图像。
另外,区域识别处理单元23在判定为照片区域时,也一并判定有无基底区域。例如,区域识别处理单元23对判定为照片区域的区域,还基于直方图信息来判断有无基底区域。例如,在被判断为基底的浓度值的最小值以上的浓度区域中,可以将被判断为基底的像素数的最小值以上的区域判定为基底区域。对于被判定为基底区域的区域,可以进行基底除去的处理。另外,判定结果作为区域判定信号被输出。此外,被判断为基底区域的浓度值的最小值、被判断为基底区域的像素数的最小值,可以使用各种图像样本来适当设定可适当判定基底区域的值。
区域分离处理单元24基于输入的RGB信号,将输入的图像中的各像素分离为字符区域、网点区域、照片(连续色调)区域的哪一个。区域分离处理单元24基于分离结果,将表示各像素属于哪个区域的区域识别信号输出到颜色校正单元26、黑版生成底色除去单元27、空间滤波处理单元28、色调再现处理单元29。此外,区域分离处理单元24将输入的RGB信号原样输出到后级的文本核对处理单元25。另外,可以是将区域识别处理单元23和区域分离处理单元24统一,或者代替区域分离处理单元24而设置区域识别处理单元23的结构。
文本核对处理单元25将输入的图像进行二值化,并计算基于二值图像而确定的连接区域的特征点,使用该结果判定输入的图像(原稿图像)和预先注册的注册图像(包含文档图像)的类似度。文本核对处理单元25在判定为图像类似的情况下,将确定了对于预先设定的类似原稿的处理的分量信号输出,从而进行规定的处理。例如,在判定为类似原稿的情况下,进行取消该原稿的输出、禁止该原稿的复印、将该原稿归档到规定的文件夹中等处理。这样,可以在图像(包含文档图像)的核对的同时进行与核对结果对应的处理。此外,文本核对处理单元25将输入的RGB信号原样输出到后级的颜色校正单元26。
另外,原稿图像意味着用扫描仪读取原稿图像而得的原稿图像、使用计算机在规定格式的数据中写入必要事项而生成的电子数据形式的原稿图像、将由扫描仪读入的数据变换为JPEG等规定文件格式而生成的电子化数据等。
颜色校正单元26将输入的RGB信号变换为CMY的颜色空间,并根据彩色图像输出装置3的特性来进行颜色校正,将校正后的CMY信号输出到黑版生成底色除去单元27。具体来说,颜色校正单元26为了真实地进行颜色再现,进行除去色浑浊的处理,该色浑浊基于包含不需要吸收分量的CMY色材的分光特性。
黑版生成底色除去单元27基于从颜色校正单元26输入的CMY信号生成K(黑色)信号,同时从输入的CMY信号中减去K信号而生成新的CMY信号,并将生成的CMYK信号输出到空间滤波处理单元28。示出黑版生成底色除去单元27中的处理的一例。例如,在进行利用骨架黑版(skeleton black)的黑版生成的处理的情况下,将骨架曲线的输入输出特性设为y=f(x),将输入的数据设为C、M、Y,将输出的数据设为C’、M’、Y’、K’,将UCR(UnderColor Removal)率设为α(0<α<1),则通过黑版生成底色除去处理而输出的数据分别表示为K’=f{min(C,M,Y)},C’=C-αK’,M’=M-αK’,Y’=Y-αK’。
空间滤波处理单元28对于从黑版生成底色除去单元27输入的CMYK信号,进行基于数字滤波的空间滤波处理,该数字滤波基于区域识别信号。由此,图像数据的空间频率特性被校正,从而防止彩色图像输出装置3中的输出图像的模糊或粒状性劣化。例如,空间滤波处理单元28对于在区域分离处理单元24中分离为字符区域的区域,特别为了提高黑色字符或颜色字符的再现性,而进行清晰增强处理,增强高频分量。此外,空间滤波处理单元28对区域分离处理单元24中被分离为网点区域的区域,进行用于除去输入网点分量的低通滤波处理。空间滤波处理单元28将处理后的CMYK信号输出到色调再现处理单元29。
色调再现处理单元29基于从区域分离处理单元24输入的区域识别信号,对从空间滤波处理单元28输入的CMYK信号进行规定的处理。例如,色调再现处理单元29将分离为字符区域的区域,特别为了提高黑色字符或颜色字符的再现性,而进行二值化处理或多值化处理,以适应彩色图像输出装置3中的高频分量的再现。此外,色调再现处理单元29对于在区域分离处理单元24中分离为网点区域的区域,最终将图像分离为像素,从而进行色调再现处理(半色调生成),以可再现各自的色调。进而,色调再现处理单元29对在区域分离处理单元24中分离为照片区域的区域进行二值化处理或多值化处理,以便适应彩色图像输出装置3中的色调再现性。
操作面板4例如由液晶显示器等显示单元和设定按钮等操作单元一体化的触摸面板等构成,基于从操作面板4输入的信息来控制彩色图像输入装置1、彩色图像处理装置2、彩色图像输出装置3的动作。另外,以上的各处理由未图示的CPU(Central Processing Unit:控制部件)控制。
彩色图像处理装置2将由色调再现处理单元29处理过的图像数据(CMYK信号)临时存储在存储单元(未图示)中,并在进行图像形成的规定定时读出在存储单元中存储的图像数据,并将读出的图像数据输出到彩色图像输出装置3,这些控制例如通过CPU(未图示)进行。
图2是表示文本核对处理单元25的结构的方框图。文本核对处理单元25包括层分离单元251、特征点计算单元252、特征量计算单元253、投票处理单元254、类似度判定处理单元255、存储器256、控制所述各单元的控制单元257等。
层分离单元251在由控制单元257根据输入到控制单元257的区域判定信号而进行的控制之下,将输入的图像(原稿图像)中被判定为字符区域的区域中的原稿图像输出到后级的特征点计算单元252。此外,层分离单元251在输入的图像(原稿图像)中被判定为照片区域的区域中的原稿图像的各像素的浓度值(也可以是亮度值、明暗的值等)例如以0~255的256色调表示的情况下,通过将原稿图像分别表现为浓度值范围为0~63、64~127、128~193、194~255的不同的四个层,从而生成四个层(层次图像),并将生成的层次图像输出到特征点计算单元252。另外,分离的层不限于四个,也可以是其它的数。
特征点计算单元252对输入的图像(例如判定为字符区域的图像、判定为照片区域的多个层次图像等)进行后述的规定的处理,同时将输入的图像进行二值化,提取(计算)基于二值图像而确定的连接区域的特征点(例如,将构成连接区域的各像素的二值图像中的坐标值进行累加,并将累加后的坐标值除以连接区域中包含的像素数而得的值),并将提取出的特征点输出到特征量计算单元253。另外,特征点计算单元252对于被判定为字符区域和照片区域的区域进行特征点的提取,并对判定为基底区域的区域不进行特征点的提取。
图3是表示特征点计算单元252的结构的方框图。特征点计算单元252包括信号变换处理单元2520、分辨率变换单元2521、滤波处理单元2522、二值化处理单元2523、重心计算单元2524等。
在输入的图像为彩色图像的情况下,信号变换处理单元2520使彩色图像无色,变换为辉度信号或亮度信号,并将变换后的图像输出到分辨率变换单元2521。例如,将各像素RGB的颜色分量分别设为Rj、Gj、Bj,并将各像素的亮度信号设为Yj,从而亮度信号Y可表示为Yj=0.30×Rj+0.59×Gj+0.11×Bj。另外,不限于上式,也可以将RGB信号变换为CIE1976L*a*b*信号。
即使在输入的图像由彩色图像输入装置1进行了光学变倍的情况下,分辨率变换单元2521也将输入的图像再次进行变倍,以成为规定的分辨率,被变倍后的图像输出到滤波处理单元2522。由此,即使在由彩色图像输入装置1进行变倍处理而改变了分辨率的情况下,也可以进行特征点的提取而不会受到其影响,并且能够高精度地判定图像的类似度。特别在缩小了的字符等的情况下,在进行二值化处理来确定连接区域时,可以防止由于字符破坏,本来分离的区域在连接了的状态下被确定,从而计算出的重心偏离的可能。此外,分辨率变换单元2521变换为比彩色图像输入装置1以等倍时读入的分辨率小的分辨率。例如,将在彩色图像输入装置1中以600dpi(dot per inch;每英寸点数)读入的图像变换为300dpi。由此,可以减轻后级的处理量。
滤波处理单元2522对输入的图像所具有的空间频率特性进行校正(例如,图像的增强处理和平滑处理等),并将校正后的图像输出到二值化处理单元2523。由于彩色图像输入装置1的空间滤波特性对于每个机种都不同,因此滤波处理单元2522将不同的空间滤波特性校正为所需的特性。彩色图像输入装置1输出的图像(例如图像信号)中,由于透镜或反射镜等光学部件、CCD等光接收面的孔径、传输效率、残像、物理扫描的积分效果以及扫描不均等而产生图像模糊等裂化。滤波处理单元2522通过进行边界或边缘等的增强处理,从而修复图像中产生的模糊等劣化。此外,滤波处理单元2522进行平滑处理,以抑制在后级处理的特征点的提取处理中所不需要的高频分量。由此,能够高精度地提取特征点,并且结果能够高精度地进行图像的类似度的判定。
二值化处理单元2523通过将输入的图像的浓度值、辉度值(辉度信号)或亮度值(亮度信号)与阈值进行比较从而将图像进行二值化,并将二值化后的二值图像输出到重心计算单元2524。
重心计算单元2524基于从二值化处理单元2523输入的二值图像的各像素的二值化信息(例如,由“1”、“0”表示),对各像素进行标记(附加标记处理),确定被附加了同一标记的像素连接所得的连接区域,并将确定了的连接区域的重心作为特征点提取,将提取出的特征点输出到特征量计算单元253。另外,特征点可以用二值图像中的坐标值(x坐标、y坐标)表示。
图4是表示连接区域的特征点的例子的说明图。在图中,确定的连接区域为字符“A”,被确定为附加了同一标签的像素的集合。该字符“A”的特征点(重心)为图中黑点所示的位置(x坐标、y坐标)。图5是表示对于字符串的特征点的提取结果的例子的说明图。在由多个字符构成的字符串的情况下,根据字符的种类而提取多个分别具有不同坐标的特征点。
图6的(A)~图6的(D)是表示照片区域的特征点的例子的说明图。如图6的(A)所示,被判定为照片区域的原稿图像如图6的(B)所示,例如基于图像的浓度值,被划分为浓度范围为0~63的层1、浓度范围为64~127的层2、浓度范围为128~193的层3、浓度范围为194~255的层4的四个层(层次图像)。如图6的(C)所示,对于层1~4分别提取特征点。如图6的(D)所示,将在各层1~4中提取的特征点合计(将在每层中提取的各特征点集中为原稿图像上的特征点)并作为原稿图像的特征点提取。通过将原稿图像根据浓度值的范围来分为多个层(层次图像),从而即使是以连续色调表现原稿图像这样的照片图像的情况下,也可以减小一个层(层次图像)中包含的浓度值的范围(色调范围),从而进一步容易确定连接区域,并使连接区域的边界明确化,从而高精度地进行特征点的提取。
另外,在将原稿图像分为层的情况下,不必限定于将原稿图像的浓度值像上述那样均等地划分的方法,可以根据原稿图像所具有的浓度直方图,适当变更设定对层进行划分的浓度值的范围。
图7是表示层的分离方法的其它例子的说明图。图7中横轴是浓度值、纵轴是发生频度,表示某一原稿图像的浓度直方图。如图所示,可以在浓度为极小值的部分(箭头)设定用于分为层的浓度范围。由此,不管原稿图像的浓度分布如何,都能在各个层进一步高精度地确定连接区域,提高特征点的提取精度。
特征点计算单元252将每个字符区域和照片区域中提取出的特征点进行合计,并将合计后的特征点输出到特征量计算单元253。特征量计算单元253将从特征点计算单元252输入的特征点(即,连接区域的重心的坐标值)分别设为注目特征点,例如,提取四个距注目特征点距离小的周围的其它的特征点。
图8是表示注目特征点和周围特征点的说明图。如图所示,对于注目特征点P1,例如,按照离注目特征点P1的距离近的顺序,提取由闭曲线S1所包围的四个特征点(对于注目特征点P1,注目特征点P2也作为一个特征点被提取)。此外,对于注目特征点P2,例如与上述同样,按照离注目特征点P2的距离近的顺序,提取由闭曲线S2所包围的四个特征点(对于注目特征点P2,注目特征点P1也作为一个特征点被提取)。
特征量计算单元253从提取的四个特征点中选择三个特征点,并计算不变量。另外,选择的特征点不限于三个,也可以选择四个、五个特征点等。根据要求的不变量的种类,应选择的特征点的数目不同。例如,从三点求出的不变量为相似不变量。
图9的(A)~图9的(C)是表示基于注目特征点P1的不变量的计算例子的说明图。图10的(A)~图10的(C)是表示基于注目特征点P2的不变量的计算例子的说明图。如图9的(A)~图9的(C)所示,从注目特征点P1周围的四个特征点中选择三个特征点,将三组不变量分别设为H1j(j=1,2,3)。不变量H1j由H1j=A1j/B1j所表示的式子计算。这里,A1j、B1j分别表示特征点之间的距离,特征点之间的距离基于各周围特征点的坐标值来计算。由此,例如,即使是原稿旋转、移动、倾斜的情况下,不变量H1j也不变化,能够高精度地进行图像类似度的判定。
同样如图10的(A)~图10的(C)所示,从注目特征点P2周围的四个特征点中选择三个特征点,并将三组不变量分别设为H2j(j=1,2,3)。不变量H2j由H2j=A2j/B2j所表示的式子计算。这里,A12j、B2j分别表示特征点之间的距离,与上述同样,特征点之间的距离基于各周围特征点的坐标值来计算。以下同样,对于其它的注目特征点可以计算不变量。
特征量计算单元253基于由各个注目特征点计算出的不变量,计算散列值(特征量)Hi。注目特征点Pi的散列值Hi由Hi=(Hi1×102+Hi2×101+Hi3×100)/E表示。这里,E是根据将余数设为何种程度而决定的常数,例如,在设为“10”的情况下,余数为“0”~“9”,这成为计算的散列值可取的范围。此外,i是自然数,表示特征点的数。
图11的(A)~图11的(D)是表示基于注目特征点P3的不变量的计算的其它例子的说明图。图12的(A)~图12的(D)是表示基于注目特征点P4的不变量的计算的其它例子的说明图。如图11的(A)~图11的(D)所示,从注目特征点P3的周围特征点P1、P2、P4、P5的四点中选择四组组合,也可以与上述情况同样,通过H3j=(A3j/B3j)计算不变量H3j(j=1,2,3,4)。
此外,如图12的(A)~图12的(D)所示,从注目特征点P4的周围特征点P2、P3、P5、P6的四点中选择四组组合,也可以与上述情况同样,通过H4j=(A4j/B4j)计算不变量H4j(j=1,2,3,4)。在图11的(A)~图11的(D)和图12的(A)~图12的(D)的例子的情况下,注目特征点Pi的散列值Hi也可以通过Hi=(Hi1×103+Hi2×102+Hi3×101+Hi4×100)/E计算。另外,作为特征量的上述散列值为一例,不限定于此,也可以使用其它的散列函数。在上述中,示出了提取四点作为周围的其它特征点的例子,但不限定于四点。例如,也可以提取六点。在该情况下,也可以从六点的特征点中提取五点,关于提取五点的六组方法的每组,从五点中提取三点来求不变量,并计算散列值。
图13A和图13B是表示散列表的结构的说明图。如图13A所示,散列表的结构由表示散列值和原稿的索引的各栏构成。即,更具体地说,对应于表示原稿的索引,注册了表示原稿中的位置的点索引(point index)和不变量。为了判定图像的类似度,预先将要核对的图像、文档图像等注册在散列表中。散列表存储在存储器256中。另外,如图13B所示,在散列值相等的情况下(H1=H5),可以将散列表的两个条目集中为一个。
投票处理单元254基于特征量计算单元253计算出的散列值(特征量)对存储在存储器256中的散列表进行检索,并对散列值中注册的(对应的)索引的原稿(注册图像)进行投票。将投票累加的结果输出到类似度判定处理单元255。
类似度判定处理单元255基于从投票处理单元254输入的投票结果,判定读取的原稿图像与哪个注册图像(注册格式)类似,并输出判定结果。更具体地说,类似度判定处理单元255将从投票处理单元254输入的得票数除以原稿图像的最大得票数(由从特征点的数×一个特征点而计算出的散列值的数所表示)并归一化后的类似度。类似度判定处理单元255将计算出的类似度和预定的阈值Th(例如0.8)进行比较,在类似度为阈值Th以上的情况下,判定与计算出该类似度的注册图像类似,在类似度小于阈值Th的情况下,判定为没有与原稿图像类似的注册图像,并输出其判定结果。另外,将从投票处理单元254输入的得票数与预定的阈值进行比较,如果得票数为阈值以上,则判定原稿图像与预先注册的注册图像类似,进而在判定为类似中,也可以判定为得票数最高的注册格式与原稿图像一致。
图14是表示基于投票结果的类似判定的一例的说明图。如图14所示,对于从原稿图像计算出的每个散列值检索散列表而进行了投票的结果,假设表示原稿的索引被对ID1、ID2、ID3所示的注册图像投票。计算将投票的结果得到的各个得票数除以原稿图像的最大得票数并归一化后的相似度N1、N2、N3。计算出的类似度为阈值Th以上是因为表示原稿的索引是ID1所示的注册格式,因此判定为原稿图像与表示原稿的索引ID1的注册图像类似。
另外,基于文本核对处理单元25输出的判定信号,可以禁止规定的处理,例如在判定为原稿图像相似于注册图像的情况下,禁止复印、传真发送、电子邮件发送从而实现安全性的提高,或者通过保存在预先指定的文件夹中,从而可以构筑与安全等级相应的电子文件系统。
此外,在进行原稿图像的注册的情况下,例如,从图像形成装置100的操作面板4中选择原稿注册模式来进行。原稿注册模式是否被选择通过控制单元257来判定。在原稿注册模式未被选择的情况下,进行通常的复印、归档、电子邮件发送动作等。另外,原稿注册处理不仅通过文本核对处理单元25等专用的硬件电路构成,也可以通过将决定原稿注册处理的顺序的计算机程序载入具有CPU、RAM、ROM等的个人计算机中来通过CPU执行计算机程序,从而来进行。
图15是表示本发明的图像读取装置500的结构的方框图。如图所示,图像读取装置500包括彩色图像输入装置1、彩色图像处理装置2、操作面板4等,彩色图像处理装置2包括A/D变换单元20、黑斑校正单元21、输入色调校正单元22、区域识别处理单元23、区域分离处理单元24、文本核对处理单元25等。彩色图像输入装置1、A/D变换单元20、黑斑校正单元21、输入色调校正单元22、区域识别处理单元23、区域分离处理单元24、文本核对处理单元25、操作面板4与上述图像形成装置100的情况同样,所以省略说明。
接着,说明彩色图像处理装置2的动作。图16是表示彩色图像处理装置2(以下称作处理单元)的文本核对处理的步骤的流程图。另外,文本核对处理不仅通过专用的硬件电路构成,也可以通过将决定文本核对处理的顺序的计算机程序载入具有CPU、RAM、ROM等的个人计算机中,由CPU执行计算机程序而进行。
处理单元进行原稿的读入(S11),取得原稿图像。另外,原稿图像也可以通过由扫描仪读入原稿而取得,或者作为在电子数据的格式中使用计算机输入字符、记号、图标、照片等而生成的电子数据而取得。
处理单元进行原稿图像的区域判定(S12),在是字符区域的情况下(S12中为字符区域),在原稿图像中被判定为字符区域的区域中提取特征点(S13)。另一方面,在是照片区域的情况下(S12中为照片区域),处理单元将原稿图像中被判定为照片区域的区域分离为层(S14)。
处理单元每层提取特征点(S15),并合计每层提取的特征点(S16)。处理单元合计字符区域的特征点和照片区域的特征点(S17),并基于合计的特征点来计算规定的不变量,并基于计算出的不变量来计算特征量(散列值)(S18)。
处理单元基于计算出的特征量来检索散列表,并对与同一特征量对应的注册图像进行投票(S19)。处理单元计算将由投票所得的得票数除以原稿图像的最大得票数(由特征点的数×从一个特征点计算出的散列值的数表示)并进行了归一化的类似度(S20)。
处理单元将计算出的类似度与预定的阈值Th进行比较,在类似度为阈值Th以上的情况下,判定与计算出该类似度的注册图像类似,在类似度小于阈值Th的情况下,判定为没有与原稿图像类似的注册图像,输出判定信号(S21),并结束处理。另外,在原稿图像有多个的情况下,当然是重复进行上述处理。
(实施方式2)
在上述实施方式1中,是将在字符区域中提取的特征点和在照片区域中提取的特征点合计的结构,但不限定于此。例如,也可以采用在字符区域和照片区域中分别进行投票处理,并将每个区域中得到的得票数相加来计算原稿图像和注册图像的类似度的结构。
图17是表示实施方式2的文本核对处理的步骤的流程图。处理单元进行原稿的读入(S31),并取得原稿图像。处理单元进行原稿图像的区域判定(S32),在是字符区域的情况下(S32中为字符区域),在原稿图像中被判断为字符区域的区域提取特征点(S33)。
处理单元基于提取出的特征点计算规定的不变量,并基于计算出的不变量来计算特征量(散列值)(S34)。处理单元基于计算出的特征量来检索散列表,并对与同一特征量对应的注册图像进行投票(S35)。
另一方面,在是照片区域的情况下(S32中为照片区域),处理单元将原稿图像中被判定为照片区域的区域分离为层(S36)。处理单元在每层中提取特征点(S37),并将每层中提取出的特征点进行合计(S38)。
处理单元基于合计出的特征点来计算规定的不变量,并基于计算出的不变量来计算特征量(散列值)(S39)。处理单元基于计算出的特征量来检索散列表,并对与同一特征量对应的注册图像进行投票(S40)。
处理单元将字符区域的得票数和照片区域的得票数相加(S41),计算将相加后的得票数除以原稿图像的最大得票数(由特征点的数×从一个特征点计算出的散列值的数表示)并归一化后的类似度(S42)。
处理单元将计算出的类似度与预定的阈值Th进行比较,在类似度为阈值Th以上的情况下,判定与计算出该类似度的注册图像类似,在类似度小于阈值Th的情况下,判定为没有与原稿图像类似的注册图像,输出判定信号(S43),并结束处理。
(实施方式3)
在上述实施方式2中,是分别在字符区域和照片区域进行投票,并将在每个区域中获得的得票数相加而计算原稿图像和注册图像的类似度的结构,但不限定于此。例如,也可以采用在字符区域和照片区域分别计算类似度,并根据其结果最终判定原稿图像是否类似于注册图像的结构。
图18是表示实施方式3的文本核对处理的步骤的流程图。处理单元进行原稿的读入(S51),并取得原稿图像。处理单元进行原稿图像的区域判定(S52),在是字符区域的情况下(S52中为字符区域),在原稿图像中被判断为字符区域的区域提取特征点(S53)。
处理单元基于提取出的特征点计算规定的不变量,并基于计算出的不变量来计算特征量(散列值)(S54)。处理单元基于计算出的特征量来检索散列表,并对与同一特征量对应的注册图像进行投票(S55)。
处理单元计算将投票的结果所得的得票数除以原稿图像中字符区域的最大得票数(由特征点的数×从一个特征点计算出的散列值的数表示)并归一化后的类似度(S56)。
另一方面,在是照片区域的情况下(S52中为照片区域),处理单元将原稿图像中被判定为照片区域的区域分离为层(S57)。处理单元在每层中提取特征点(S58),并将每层中提取出的特征点进行合计(S59)。
处理单元基于合计的特征点来计算规定的不变量,并基于计算出的不变量来计算特征量(散列值)(S60)。处理单元基于计算出的特征量来检索散列表,并对与同一特征量对应的注册图像进行投票(S61)。
处理单元计算将投票的结果所得的得票数除以原稿图像中照片区域的最大得票数(由特征点的数×从一个特征点计算出的散列值的数表示)并归一化后的类似度(S62)。
处理单元基于在字符区域中计算出的类似度和在照片区域中计算出的类似度,综合判定原稿图像是否与注册图像类似(S63)。综合判定的方法可以适当决定。例如,可以判定为与类似度最大值对应的注册图像类似,或者可以在字符区域和照片区域中设置优先顺序,并通过优先顺序来判定。此外,也可以在字符区域和照片区域中对类似度加权,并根据加权后的类似度来判定。
处理单元根据综合判定的结果输出判定信号(S64),并结束处理。
(实施方式4)
在上述实施方式中,在求照片区域的特征量的情况下,使用相同层内的特征点来进行不变量的计算,但不限定于此,也可以对于在某层中存在的注目特征点,包含相邻的其它层中存在的特征点来求不变量。
图19是表示实施方式4的注目特征点和周围的特征点的说明图。如图19所示,对于多个层中在层3存在的注目特征点P5,按照距注目特征点P5的距离近的顺序,不仅提取层3的特征点,而且提取相邻的其它层存在的周围特征点(层4的特征点P1、层3的特征点P2、层2的特征点P3、P4)。在该情况下,选择周围特征点的基准是离注目特征点的距离,所以注目特征点P5存在的层3内的特征点也成为提取对象。在图19的例子中,示出对注目特征点提取四个周围特征点的情况,但提取的周围特征点的数不限定于4。另外,层间的距离dL可以预先设定。
接着,说明计算层间距离dL的例子。图20是表示计算层间距离dL的一例的说明图。如图20所示,对各层1~4分别设定代表的浓度值(代表浓度值)D1~D4。此外,将色调数设为256色调(8比特),并设定与最大浓度值(255)对应的最大层距离Lmax。
层2和层1的距离dL12利用dL12=|D2-D1|×Lmax/256计算。例如,如果设最大层距离Lmax=32、层1的代表浓度值D1=32(浓度0~63的中央值)、层2的代表浓度值D2=96(浓度64~127的中央值),则层2和层1的距离dL12成为8。例如,在300dpi的图像的情况下,10点的字符为约32×32像素,为了使同一层内的特征点的影响度和层间的影响度程度相同,最大层距离Lmax设为Lmax=32。通过与上述同样的方法,层2和层3的距离dL23、层3和层4的距离dL34分别为8。另外,层间的距离的计算例子不限定于此。
图21、图22、图23和图24是表示实施方式4的基于注目特征点P5的不变量的计算例子的说明图。如图21~图24所示,从注目特征点P5的周围特征点P1、P2、P3、P4的四点中选择四组组合,通过H5j=(A5j/B5j)计算不变量H5j(j=1、2、3、4)。在该情况下,注目特征点Pi的散列值Hi也可以通过Hi=(Hi1×103+Hi2×102+Hi3×101+Hi4×100)/E计算。
即使在二维平面(同一层上)上特征量相同,在三维空间上(层不同)特征量也可能不同,所以通过也包含特征点的空间配置来计算特征量(不变量),从而能够进一步提高原稿图像的核对精度。
图25是表示实施方式4的文本核对处理的步骤的流程图。另外,图25的例子对应于实施方式2。处理单元进行原稿的读入(S71),并取得原稿图像。处理单元进行原稿图像的区域判定(S72),在是字符区域的情况下(S72中为字符区域),在原稿图像中被判断为字符区域的区域提取特征点(S73)。
处理单元基于提取出的特征点计算规定的不变量,并基于计算出的不变量来计算特征量(散列值)(S74)。处理单元基于计算出的特征量来检索散列表,并对与同一特征量对应的注册图像进行投票(S75)。处理单元进行后述的步骤S81的处理。
另一方面,在是照片区域的情况下(S72中为照片区域),处理单元将原稿图像中被判定为照片区域的区域分离为层(S76)。处理单元在每层中提取特征点(S77),并且包含相邻的层的特征点来提取接近注目特征点的周围特征点(S78)。
处理单元基于提取出的特征点来计算规定的不变量,并基于计算出的不变量来计算特征量(散列值)(S79)。处理单元基于计算出的特征量来检索散列表,并对与同一特征量对应的注册图像进行投票(S80)。
处理单元将字符区域的得票数和照片区域的得票数相加(S81),计算将相加后的得票数除以原稿图像的最大得票数(由特征点的数×从一个特征点计算出的散列值的数表示)并归一化后的类似度(S82)。
处理单元将计算出的类似度与预定的阈值Th进行比较,在类似度为阈值Th以上的情况下,判定与计算出该类似度的注册图像类似,在类似度小于阈值Th的情况下,判定为没有与原稿图像类似的注册图像,并输出判定信号(S83),并结束处理。
图26是表示实施方式4的文本核对处理的步骤的流程图。另外,图26的例子对应于实施方式3。处理单元进行原稿的读入(S91),并取得原稿图像。处理单元进行原稿图像的区域判定(S92),在是字符区域的情况下(S92中为字符区域),在原稿图像中被判定为字符区域的区域提取特征点(S93)。
处理单元基于提取的特征点来计算规定的不变量,并基于计算出的不变量来计算特征量(散列值)(S94)。处理单元基于计算出的特征量来检索散列表,并对与同一特征量对应的注册图像进行投票(S95)。
处理单元计算将投票的结果所得的得票数除以原稿图像中字符区域的最大得票数(由特征点的数×从一个特征点计算出的散列值的数表示)并归一化后的类似度(S96)。处理单元进行后述的步骤S103的处理。
另一方面,在是照片区域的情况下(S92中为照片区域),处理单元将原稿图像中被判定为照片区域的区域分离为层(S97)。处理单元对每层提取特征点(S98),并且包含相邻的层的特征点来提取接近注目特征点的周围特征点(S99)。
处理单元基于提取的特征点来计算规定的不变量,并基于计算出的不变量来计算特征量(散列值)(S100)。处理单元基于计算出的特征量来检索散列表,并对与同一特征量对应的注册图像进行投票(S101)。
处理单元计算将投票的结果所得的得票数除以原稿图像中照片区域的最大得票数(由特征点的数×从一个特征点计算出的散列值的数表示)并归一化后的类似度(S102)。
处理单元基于在字符区域中计算出的类似度和在照片区域中计算出的类似度,综合判定原稿图像是否与注册图像类似(S103)。综合判定的方法可以适当决定。例如,可以判定为与类似度最大值对应的注册图像类似,或者可以在字符区域和照片区域中设置优先顺序,并通过优先顺序来判定。此外,也可以在字符区域和照片区域中对类似度赋予加权,并根据加权后的类似度来判定。
处理单元根据综合判定的结果输出判定信号(S104),并结束处理。
(实施方式5)
也可以将本发明应用于电子数据(由应用软件生成的数据)和电子化数据(例如将由扫描仪读入的数据变换为JPEG和PDF等规定文件格式的数据)。例如,将以电子数据和电子化数据的方式提出的数据存储在服务器中,可以对这些数据,将本发明作为应用软件应用。上述数据优选是按每个电子数据、文件格式被存储。
由于对于电子数据可使用多种软件,所以例如使用RIP(Raster ImageProcessor,光栅图像处理器)来解释PDL(页描述语言),变换为光栅图像(RGB数据)后应用本发明的方法即可。此外,关于电子化数据,例如在JPEG和GIF等编码后的图像格式的情况下,临时进行解码处理并在根据需要将YCC信号变换为RGB信号等颜色变换处理之后应用本发明的方法。此外,关于PDF格式,在图像数据以JPEG等编码后的图像格式保存的情况下,在进行解码处理而变换为RGB信号的基础上应用本发明的方法即可,关于字体等向量数据部分,在经由RIP等变换为RGB图像数据的基础上应用本发明的方法即可。另外,在PDF格式的情况下,将每个对象(文本、图片或照片等)的信息作为标签(tag)来保有。可以以该信息为参考来进行数据的变换。对象的信息例如在文本的情况下是字体、点数、颜色或显示位置等,在照片的情况下是编码方法、尺寸或显示位置等。
如以上所说明的,在本发明中,即使在以连续色调表现原稿图像这样的照片图像的情况下,也可以对每个层次图像减少色调范围,从而更容易确定连接区域,将连接区域的边界明确化而能够高精度地进行特征点的提取,与注册图像的核对精度提高。此外,即使是混杂了字符区域和照片区域的原稿图像也能够高精度地进行与注册图像的核对。
在上述实施方式1~4中,区域识别处理单元23判定原稿图像是字符区域还是照片区域,在每个区域分别进行处理(例如,特征点的提取、投票处理、类似度的计算等)的结构,但不限定于此。例如,不必进行区域识别处理,不论原稿图像是字符区域还是照片区域,都能够将原稿图像整体分离为多个层(层次图像),从而在每个层次图像中提取特征点。由此,可以减少在图像处理装置中安装的硬件结构,并且能够降低成本,同时通过降低以软件进行各处理时的处理量从而能够实现高速处理。
在上述实施方式1~4中,区域识别处理单元23判定原稿图像是字符区域还是照片区域,在每个区域分别进行处理的结构,但也可以采用根据区域的判定结果,选择对于字符区域的处理或对于照片区域的处理的其中一个,并对原稿图像整体进行选择了的处理的结构。在该情况下,例如也可以根据被判定为字符区域的区域和被判定为照片区域的区域大小来决定进行哪个处理。
在上述实施方式中,是将注册格式、散列表预先存储在存储器256中的结构,但不限定于此,也可以将注册格式存储在通过通信线路(网络)与图像形成装置100连接的服务器装置的存储单元中,并将散列表分散存储在存储器256中。
本发明也可以在记录了用于使计算机执行的程序的程序代码(执行形式程序、中间代码程序、源程序)的计算机的计算机可读取的记录介质上记录用于进行上述文本核对处理的图像处理方法。另外,作为记录介质,为了由微型计算机进行处理,也可以是未图示的存储器,例如ROM这样的程序介质,也可以设置外部存储单元等程序读取装置,通过在其中插入记录介质从而可读取的程序介质。在任何情况下,可以是微处理器访问并执行存储了的程序代码的结构,也可以是读出程序代码,被读出的程序代码被下载到微型计算机的未图示的程序存储区域中,并且该程序代码被执行的方式。在该情况下,假设用于下载的程序预先存储在主体装置中。
所述程序介质是可与主体分离的记录介质,可以是固定承载程序的介质,包含磁带和卡带等带类、软盘和硬盘等磁盘以及CD-ROM/MO(MagnetoOptical)/MD(Mini disk)/DVD(Digital Versatile Disk)等光盘的盘类、IC(Integrated Circuit)卡(包含存储卡)/光卡等卡类、或者屏蔽ROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically ErasableProgrammable Read Only Memory)、闪存ROM等半导体存储器。
此外,在可与包含互联网的通信网络连接的系统结构的情况下,也可以是用于从通信网络下载程序代码而流动地承载程序代码的介质。另外,这样在从通信网络下载程序代码的情况下,也可以是用于下载的程序预先存储在主体装置中,或者从其它的记录介质安装。另外,本发明可通过上述计算机代码以电子传输具体化的、嵌入载波中的计算机数据信号的形式来实现。
上述记录介质,通过由数字彩色图像形成装置或计算机系统中包括的程序读取装置读取,从而执行上述图像处理方法。此外,计算机系统也可以由打印机构成,该打印机将平板扫描仪、照片扫描仪、数字照相机等图像输入装置、通过载入规定的程序而进行与上述图像处理方法等各种处理的计算机、显示计算机的处理结果的CRT显示器或液晶显示器等图像显示装置、以及计算机的处理结果输出到记录纸上。进而,包括作为用于经由网络与服务器等连接的通信部件的网卡或调制解调器等。
Claims (13)
1.一种图像处理方法,提取由多个像素构成的原稿图像的特征量,并基于提取出的特征量进行与注册图像的类似判定,其特征在于,该方法具有:
预先存储与多个注册图像分别对应的特征量的步骤;
基于原稿图像的各像素的像素值,生成像素值的范围不同的多个层次图像的步骤;
对每个生成的层次图像进行二值化处理并提取特征点的步骤;
基于每个所述层次图像中提取出的特征点,计算原稿图像的特征量的步骤;
判定计算出的特征量和与注册图像对应的特征量是否一致的步骤;
在判定为特征量一致的情况下,每个一致的特征量对与该特征量对应的注册图像进行投票的步骤;以及
基于投票而得的得票数,判定原稿图像是否与注册图像类似的步骤。
2.如权利要求1所述的图像处理方法,其特征在于,还具有:
基于原稿图像的各像素的像素值,至少判定是字符区域或照片区域的哪一个区域的步骤;以及
对判定为照片区域的区域生成多个层次图像的步骤。
3.如权利要求2所述的图像处理方法,其特征在于,还具有:
对于判定为字符区域的区域,对原稿图像进行二值化处理并提取特征点的步骤;
对判定为照片区域的区域,每个所述层次图像提取特征点的步骤;以及
基于对每个区域提取的特征点来计算原稿图像的特征量的步骤。
4.如权利要求2所述的图像处理方法,其特征在于,还具有:
对于判定为字符区域的区域,对原稿图像进行二值化处理并提取特征点的步骤;
对判定为照片区域的区域,每个所述层次图像提取特征点的步骤;
基于提取出的特征点对每个区域计算特征量的步骤;
判定计算出的特征量和与注册图像对应的特征量是否一致的步骤;
在判定为特征量一致的情况下,每个一致的特征量对与该特征量对应的注册图像进行投票的步骤;
将投票所得的得票数进行每个区域相加的步骤;以及
基于相加后的得票数判定原稿图像是否与注册图像类似的步骤。
5.如权利要求2所述的图像处理方法,其特征在于,还具有:
对于判定为字符区域的区域,对原稿图像进行二值化处理并提取特征点的步骤;
对判定为照片区域的区域,每个所述层次图像提取特征点的步骤;
基于提取出的特征点,每个区域计算特征量的步骤;
判定计算出的特征量和与注册图像对应的特征量是否一致的步骤;
在判定为特征量一致的情况下,每个一致的特征量对与该特征量对应的注册图像进行投票的步骤;
基于投票所得的得票数,判定每个区域中原稿图像是否与注册图像类似的步骤;以及
基于每个区域中所判定的判定结果,判定原稿图像是否与注册图像类似的步骤。
6.如权利要求2所述的图像处理方法,其特征在于,还具有:
对判定为照片区域的区域,从所述多个层次图像中提取特征点的步骤;以及
基于提取出的特征点,计算原稿图像的特征量的步骤。
7.一种图像处理装置,提取由多个像素构成的原稿图像的特征量,并基于提取的特征量进行与注册图像的类似判定,其特征在于,该装置包括:
存储单元,预先存储与多个注册图像分别对应的特征量;
生成单元,基于原稿图像的各像素的像素值,生成像素值的范围不同的多个层次图像;
提取单元,对由该生成单元生成的每个层次图像进行二值化处理并提取特征点;
计算单元,基于由该提取单元每个层次图像提取出的特征点,计算原稿图像的特征量;
特征量判定单元,判定由该计算单元计算出的特征量和与注册图像对应的特征量是否一致;
投票单元,在由该特征量判定单元判定为特征量一致的情况下,每个一致的特征量对与该特征量对应的注册图像进行投票;以及
类似判定单元,基于由该投票单元投票所得的得票数,判定原稿图像是否与注册图像类似。
8.如权利要求7所述的图像处理装置,其特征在于,还具有:
区域判定单元,基于原稿图像的各像素的像素值,至少判定是字符区域或照片区域的哪一个区域,
所述生成单元对由所述区域判定单元判定为照片区域的区域,生成多个层次图像。
9.如权利要求8所述的图像处理装置,其特征在于,所述提取单元对于由所述区域判定单元判定为字符区域的区域,对原稿图像进行二值化处理并提取特征点,对判定为照片区域的区域,每个所述层次图像提取特征点,所述计算单元基于每个区域所提取出的特征点,计算原稿图像的特征量。
10.如权利要求8所述的图像处理装置,其特征在于,
所述提取单元对于由所述区域判定单元判定为字符区域的区域,对原稿图像进行二值化处理并提取特征点,对判定为照片区域的区域,每个所述层次图像提取特征点,所述计算单元、特征量判定单元以及投票单元对每个区域进行各自的处理,
所述图像处理装置还包括将所述投票单元对每个区域投票所得的得票数相加的加法单元,
所述类似判定单元基于由所述加法单元相加后的得票数,判定原稿图像是否与注册图像类似。
11.如权利要求8所述的图像处理装置,其特征在于,
所述提取单元对于由所述区域判定单元判定为字符区域的区域,对原稿图像进行二值化处理而提取特征点,对判定为照片区域的区域,每个所述层次图像提取特征点,所述计算单元、特征量判定单元、投票单元以及类似判定单元对每个区域进行各自的处理,
所述图像处理装置还包括综合判定单元,基于由所述类似判定单元对每个区域判定的判定结果,判定原稿图像是否与注册图像类似。
12.如权利要求8所述的图像处理装置,其特征在于,所述提取单元对由所述区域判定单元判定为照片区域的区域,从所述多个层次图像中提取特征点,所述计算单元基于由所述提取单元提取出的特征点,计算原稿图像的特征量。
13.一种图像形成装置,其特征在于,包括:
权利要求7-12的任何一项所述的图像处理装置;以及
进行由该图像处理装置处理过的图像的形成的图像输出装置。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP056291/07 | 2007-03-06 | ||
JP2007056291 | 2007-03-06 | ||
JP2008040439A JP4393556B2 (ja) | 2007-03-06 | 2008-02-21 | 画像処理方法、画像処理装置、画像読取装置、画像形成装置、コンピュータプログラム及びコンピュータでの読み取りが可能な記録媒体 |
JP040439/08 | 2008-02-21 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101261684A true CN101261684A (zh) | 2008-09-10 |
CN101261684B CN101261684B (zh) | 2011-05-11 |
Family
ID=39962133
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008100820999A Expired - Fee Related CN101261684B (zh) | 2007-03-06 | 2008-03-06 | 图像处理方法、图像处理装置及图像形成装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP4393556B2 (zh) |
CN (1) | CN101261684B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8554021B2 (en) * | 2010-10-19 | 2013-10-08 | Palo Alto Research Center Incorporated | Finding similar content in a mixed collection of presentation and rich document content using two-dimensional visual fingerprints |
JP5910867B2 (ja) | 2012-03-13 | 2016-04-27 | 日本電気株式会社 | 文書内の図情報を利用した類似文書の検索システム及び方法 |
JP6056319B2 (ja) * | 2012-09-21 | 2017-01-11 | 富士通株式会社 | 画像処理装置、画像処理方法および画像処理プログラム |
JP6235414B2 (ja) * | 2014-06-06 | 2017-11-22 | 株式会社デンソーアイティーラボラトリ | 特徴量演算装置、特徴量演算方法、及び特徴量演算プログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000163557A (ja) * | 1998-11-25 | 2000-06-16 | Canon Inc | 画像処理方法、画像処理装置及び記憶媒体 |
JP4492036B2 (ja) * | 2003-04-28 | 2010-06-30 | ソニー株式会社 | 画像認識装置及び方法、並びにロボット装置 |
JP4613617B2 (ja) * | 2005-01-07 | 2011-01-19 | ソニー株式会社 | 画像処理システム、学習装置および方法、並びにプログラム |
-
2008
- 2008-02-21 JP JP2008040439A patent/JP4393556B2/ja not_active Expired - Fee Related
- 2008-03-06 CN CN2008100820999A patent/CN101261684B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN101261684B (zh) | 2011-05-11 |
JP4393556B2 (ja) | 2010-01-06 |
JP2008252877A (ja) | 2008-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101382944B (zh) | 图像处理装置和方法、图像形成装置、图像读取装置 | |
US8320683B2 (en) | Image processing method, image processing apparatus, image reading apparatus, and image forming apparatus | |
JP4310356B2 (ja) | 画像処理方法、画像処理装置、画像読取装置、画像形成装置、コンピュータプログラム及び記録媒体 | |
US8107734B2 (en) | Image processing apparatus, and method for performing document matching using extracted feature points of connected image components | |
US8351706B2 (en) | Document extracting method and document extracting apparatus | |
US8103108B2 (en) | Image processing apparatus, image forming apparatus, image processing system, and image processing method | |
US8265345B2 (en) | Image processing method, image processing apparatus, image forming apparatus, and image reading apparatus | |
JP4324628B2 (ja) | 画像処理方法、画像処理装置、画像読取装置、画像形成装置、コンピュータプログラム及び記録媒体 | |
US20060197928A1 (en) | Image processing apparatus and its method | |
CN101388073A (zh) | 图像核对装置、图像核对方法及图像数据输出处理装置 | |
US8107738B2 (en) | Image processing method, image processing apparatus, image forming apparatus, image reading apparatus and memory product | |
JP4362538B2 (ja) | 画像処理装置、画像形成装置、画像送信装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体 | |
JP4486995B2 (ja) | 画像処理システム | |
CN101320425B (zh) | 图像处理装置及方法、图像形成装置 | |
CN101364268B (zh) | 图像处理装置和图像处理方法 | |
CN101261684B (zh) | 图像处理方法、图像处理装置及图像形成装置 | |
WO2021129289A9 (zh) | 图像处理方法、装置、电子设备以及存储介质 | |
JP2008154216A (ja) | 画像処理方法、画像処理装置、画像形成装置、原稿読取装置、コンピュータプログラム及び記録媒体 | |
JP2008228211A (ja) | 画像出力方法、画像処理装置、画像形成装置、画像読取装置、コンピュータプログラム及び記録媒体 | |
CN101237514B (zh) | 图像处理装置及方法、图像读取和形成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110511 Termination date: 20210306 |
|
CF01 | Termination of patent right due to non-payment of annual fee |