CN1921535A - 图像检索装置,图像处理装置,图像检索方法,以及图像处理方法 - Google Patents

图像检索装置,图像处理装置,图像检索方法,以及图像处理方法 Download PDF

Info

Publication number
CN1921535A
CN1921535A CN 200510092330 CN200510092330A CN1921535A CN 1921535 A CN1921535 A CN 1921535A CN 200510092330 CN200510092330 CN 200510092330 CN 200510092330 A CN200510092330 A CN 200510092330A CN 1921535 A CN1921535 A CN 1921535A
Authority
CN
China
Prior art keywords
image
retrieved
data
pixel density
density distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200510092330
Other languages
English (en)
Inventor
刘学平
斋藤高志
查红彬
刘宏
冯所前
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to CN 200510092330 priority Critical patent/CN1921535A/zh
Priority to JP2006024785A priority patent/JP2007066286A/ja
Publication of CN1921535A publication Critical patent/CN1921535A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

一种图像检索方法,它能够迅速并且准确地从不同图像分辨率,不同格式,不同语言的图像中检索出需要的图像,而且可以编辑该检索到的图像。在本发明的图像检索方法中,提取出待检索图像的画素密度分布,然后将待检索图像的画素密度分布数据与参考图像的画素密度分布数据相比较,检索出与待检索图像相匹配的至少一个参考图像;最好,还提取出待检索图像的关键区域,然后将待检索图像的关键区域数据与以上利用画素密度分布检索到的参考图像的关键区域数据相比较,检索出与待检索图像相匹配的至少一个参考图像。

Description

图像检索装置,图像处理装置, 图像检索方法,以及图像处理方法
技术领域
本发明涉及图像检索装置,图像处理装置,图像检索方法,以及图像处理方法,特别涉及比如数字式多功能图像处理机等图像处理装置,以用于该图像处理装置的图像检索装置,图像检索方法,以及图像处理方法。
背景技术
文书或图像检索被应用于电子图书馆技术,办公室自动化技术,以及数字式多功能图像处理机等文书·图像处理系统中。比如,为了当读入不很清晰的文书或图像时,为了能输出高品质的文书或图像,可以通过网络把数字式多功能图像处理机与存储了大量文书和图像的服务器连接,从该服务器上的文书和图像中检索出与读入的文书或图像一样的文书或图像,然后输出该检索到的文书或图像。这样就能输出清晰、高品质的文书或图像。
在文书·图像检索系统中,文书或图像的匹配处理,即从大量文书和图像中检索出与输入文书或图像相同或相应的(即,匹配)文书或图像,是其核心技术。
目前,有如下检索技术。比如,运用OCR(opticalCharacter Recognition:光学文字识别)技术识别文书的具体内容,以此来判断文书的匹配;通过检测数字水印(digitalwatermark)来检索文书或图像;或利用文书·图像的图像性特征来进行检索。
但是,运用OCR技术进行检索时,处理内容复杂,处理时间长,而且对于不同的语种要使用不同的装置,所以使用不方便。另外,检索的成功率依赖于OCR识别准确度。使用数字水印进行检索时也是如此,即,处理内容复杂,检索的成功率依赖于数字水印的检测精度。再者,对于尚未支持的语种,或不带数字水印的文书·图像,则不能进行检索。
利用文书·图像的图像性特征来进行检索时,检索的成功率很大程度上依赖于图像特征量的选择。目前,还没有可以对不同图像分辨率,不同格式,不同语言的文书·图像进行高性能检索的技术。
另外,在现有的文书·图像检索系统中,由于从数据库检索到文书·图像不是用一般文字处理软件可直接编辑的电子文件格式,而是无法直接编辑的图像格式,所以,即使检索出文书·图像,也不能对其进行编辑,或为别的用途再加以利用。
发明内容
本发明的目的是提供一种图像检索装置,图像处理装置,图像检索方法,以及图像处理方法,它能够迅速并且准确地从不同图像分辨率,不同格式,不同语言的图像中检索出需要的图像,而且可以编辑该检索到的图像。
为了达到以上目的,本发明提供一种图像检索装置,用来从多个参考图像中检索出与待检索图像相匹配的参考图像,它包括存储单元,存储参考图像的图像数据以及各个参考图像的画素密度分布数据;画素密度分布提取单元,用来提取出待检索图像的画素密度分布;以及检索单元,它将待检索图像的画素密度分布数据与各个参考图像的画素密度分布数据相比较,来从参考图像中检索出与待检索图像相匹配的至少一个参考图像。
本发明的图像检索装置最好还包括关键区域提取单元,用来提取出待检索图像的关键区域。另外,存储单元中最好还存储各个参考图像的关键区域的数据。检索单元最好还将待检索图像的关键区域数据与利用画素密度分布检索到的参考图像的关键区域数据相比较,检索与待检索图像相匹配的至少一个参考图像。
本发明的图像检索装置还可以包括有效图像区域确定单元,它把待检索图像的图像数据转换为二进制数据,并确定待检索图像的有效图像区域。比如,画素密度分布提取单元可将待检索图像的有效图像区域分割成多个子区域,计算出各个子区域的画素密度,以此得到待检索图像的画素密度分布。另外,关键区域提取单元可将待检索图像的有效图像区域分割成多个子图像,并从子图像中提取待检索图像的关键区域。
为了达到以上目的,本发明提供一种图像检索方法,用来从多个参考图像中检索出与待检索图像相匹配的参考图像,它包括画素密度分布提取步骤,提取出待检索图像的画素密度分布;以及第一检索步骤,将待检索图像的画素密度分布数据与各个参考图像的画素密度分布数据相比较,检索出与待检索图像相匹配的至少一个参考图像。
本发明的图像检索方法最好还包括关键区域提取步骤,提取出待检索图像的关键区域,以及第二检索步骤,将待检索图像的关键区域数据与利用画素密度分布检索到的参考图像的关键区域数据相比较,检索出与待检索图像相匹配的至少一个参考图像。
本发明的图像检索方法最好还包括数据库构筑步骤,用来构筑一数据库,从该数据库中,检索出与待检索图像相匹配的至少一个参考图像。该数据库构筑步骤进行如下步骤:将多个电子文件分别转换为图像,得到以上多个参考图像;提取出各个参考图像的画素密度分布数据;提取出各个参考图像的关键区域数据;将各个参考图像的图像数据,画素密度分布数据,关键区域数据,以及对应的电子文件的数据相互关联地存储于数据库中。
为了达到以上目的,本发明提供一种图像处理装置,用来处理从多个参考图像中检索出的与输入图像相匹配的参考图像,它包括图像输入单元;存储单元,存储参考图像的图像数据以及各个参考图像的画素密度分布数据;画素密度分布提取单元,用来提取出所述输入图像的画素密度分布;检索单元,它将输入图像的画素密度分布数据与各个参考图像的画素密度分布数据相比较,从参考图像中检索出与输入图像相匹配的至少一个参考图像,以及图像输出单元,用来输出检索到的与输入图像相匹配的参考图像。
本发明的图像处理装置,最好还包括关键区域提取单元,用来提取出输入图像的关键区域。
在本发明的图像处理装置中,存储单元中最好还存储各个参考图像的关键区域的数据;检索单元将输入图像的关键区域数据与利用画素密度分布检索到的参考图像的关键区域数据相比较,来检索与输入图像相匹配的至少一个参考图像。
在本发明的图像处理装置中,存储单元,还可以存储各个参考图像的电子文件,并保持各个电子文件与各个参考图像的图像数据相关联。
在本发明的图像处理装置还可以包括显示器,它用来显示检索到的参考图像;和编辑器,用来编辑检索到的参考图像的电子文件。
为了达到以上目的,本发明提供一种图像处理方法,用来处理从多个参考图像中检索出的与输入图像相匹配的参考图像,它包括:图像输入步骤,画素密度分布提取步骤,提取出输入图像的画素密度分布;第一检索步骤,将输入图像的画素密度分布数据与各个参考图像的画素密度分布数据相比较,检索出与输入图像相匹配的至少一个参考图像,以及,图像输出步骤,输出被检索到的参考图像。
本发明的图像处理方法最好还包括关键区域提取步骤,以提取出输入图像的关键区域,以及第二检索步骤,以将输入图像的关键区域数据与利用画素密度分布检索到的参考图像的关键区域数据相比较,检索出与输入图像相匹配的至少一个参考图像。
本发明的图像处理方法还可以包括数据库构筑步骤,用来构筑一数据库,从该数据库中,检索出与待检索图像相匹配的至少一个参考图像。该数据库构筑步骤进行如下步骤:将多个电子文件分别转换为图像,得到多个参考图像;提取出各个参考图像的画素密度分布数据;提取出各个参考图像的关键区域数据;将各个参考图像的图像数据,画素密度分布数据,关键区域数据,以及与各个参考图像对应的电子文件的数据相互关联地存储于数据库中。
本发明的图像处理方法,还可以包括:显示步骤,来显示检索到的参考图像;和编辑步骤,来编辑检索到的参考图像的所述电子文件。
附图说明
通过以下结合附图的详细说明可以对本发明的目的,特征和优点有更清楚的了解。
图1是作为本发明的图像处理装置的一个实施例的数字式多功能图像处理机100的示意图。
图2是显示本实施例的提取图像特征量的方法的流程图。
图3说明本实施例中确定图像印刷芯区的方法。
图4说明本实施例中计算黑画素的密度分布特征量的方法。
图5是显示本实施例的提取图像关键块特征量的方法的流程图。
图6显示关键块KB1。
图7显示关键块KB2。
图8显示关键块KB3。
图9显示输入图像中关键块KB1,KB2,KB3的相对关系。
图10是说明本实施例的图像检索方法的流程图。
图11显示用本实施例的检索方法得到的检索实验结果。
图12显示用本实施例的检索方法得到的检索实验结果。
图13是显示本实施例的数字式多功能图像处理机100的图像处理操作的流程图。
具体实施方式
以下参照附图对本发明的具体实施例进行详细说明。
图1是作为本发明的图像处理装置的一个实施例的数字式多功能图像处理机100的示意图。
图1显示的数字式多功能图像处理机100,比如说,可以具有复印机,打印机,传真机,扫描仪等功能。该数字式多功能图像处理机100可以从存储在数据库中的大量的文书和图像中检索出与输入文书或图像相同或相应的文书或图像,并输出。这样,即使读入的文书或图像不很清晰时也能输出高品质的文书或图像。
如图1所示,数字式多功能图像处理机100包括控制装置整体操作的控制单元101,从稿纸上读入图像数据的图像读入单元102,图像输出单元103,存储有图像数据,文书数据,以及各种程序的硬盘104,进行各种处理的内存105,管理各种图像文件和电子文件的文件管理单元106,检索与读入图像相匹配的图像的检索单元107,编辑和该匹配图像对应的电子文件的编辑器108,用来与网络连接的计算机接口(I/F)109,输入用户的操作,并显示操作结果的用户界面110,以及与电话线相连,可以通过电话线向外部传输文书、图像的传真机111。
在数字式多功能图像处理机100中,图像读入单元102从稿纸上读入图像数据,控制单元101控制提取被读入的图像的特征量。利用得到的图像特征量,检索单元107从存储在内存105中的文书和图像中检索出与读入图像匹配的图像。内存105中的文书和图像中是在数字式多功能图像处理机100开始工作时,从硬盘104读入内存105中的。
当检索到匹配的图像时,图像输出单元103可以将该图像输出,比如可以把检索到的图像或与其对应的电子文件可被显示在一显示器上(未图示)。该电子文件也存储在硬盘104中并与图像数据保持对应关系,当数字式多功能图像处理机100开始工作时,被从硬盘104读入内存105。当图像被显示在该显示器上时,用户可以确认图像(它可以是转换为图像格式的文书)的内容,如果必要,用户可以编辑该图像的电子文件,比如,可以进行修改,追加,删除等编辑。
另外,图像输出单元103也可以把检索到的图像印刷到稿纸上。当检索到的图像被印刷到稿纸上时,可以得到清晰的高质量的图像。
以下说明本实施例的图像特征的提取方法以及图像检索的方法。
在本实施例中没有采用OCR技术或数字水印检测技术来进行检索,而是事先构筑一个用于检索的图像数据库。具体讲,提取出多个图像(以下,称之为参考图像)的图像特征量,并将该图像特征量与参考图像的图像数据以及对应的电子文件数据相关联,存储在该图像数据库。当数字式多功能图像处理机100开始工作时,控制单元101控制提取出读入图像的该图像特征量,利用该图像特征量,检索单元107从位于内存105中的图像数据库中进行检索。
在本实施例中,提取出输入图像及参考图像的前景的画素密度分布(foreground pixel distribution)的特征量,将其作为该输入图像及参考图像的局部特征量(local feature)。参考图像的画素密度分布特征量作为图像特征量被存储于图像数据库中,并与参考图像的图像数据以及对应的电子文件数据相关联。比如,可将输入图像的画素密度分布特征量与图像数据库中的各个参考图像的画素密度分布特征量比较,以从参考图像中检索出与输入图像匹配的一个或多个参考图像。
进一步,在本实施例中,还可提取出输入图像及参考图像中的关键块(key block)的特征量,将其作为输入图像及参考图像的整体特征量(global feature)。这里,图像的关键块为图像中主要的图像块,比如,为图像中具有显著特征的图像块。
参考图像的关键块特征量也作为图像特征量被存储于图像数据库中,并与参考图像的图像数据,对应的电子文件数据,画素密度分布特征量相关联。比如,可将输入图像的关键块特征量与利用画素密度分布特征量检索到的多个参考图像的关键块特征量比较,以从中检索出与输入图像匹配的参考图像。
以下详细说明本实施例的图像特征量提取方法。
图2是显示本实施例的提取图像特征量的方法的流程图。
如图2所示,在步骤S101中,将输入图像的数据转换为二进制数据。
由图像读入单元102从稿纸上读入的原始图像数据可以有各种各样的格式,而且有可能包含扭曲角(skew angle)或扫描噪声,所以,通过将输入图像数据转换为二进制数据,可以消除扭曲角,扫描噪声等,这样有利于可支持不同格式的图像的检索。另外,把输入图像数据转换为二进制数据后,可以容易地提取出图像的前景。
可用以下方法把输入图像数据转换为二进制数据。比如,将画素的值设在0至255之间,并设一阈值(Th,0<Th<255),当画素的值小于阈值Th时,将画素定义为黑,否则将画素定义为白。
在步骤S102中,在已二进制化的图像上,确定图像的印刷芯区(print core)。
所谓图像的印刷芯区为图像的有效区域。在提取图像特征量时,是在印刷芯区范围内进行的。另外,在处理不同的图像时,印刷芯区还可做为该不同图像的一个共同的参照框架。
印刷芯区的位置可以通过将二进制化的图像在横向和纵向投影,从图像的横向投影和纵向投影的范围来确定。另外,在确定印刷芯区位置的同时,根据图像的横向投影和纵向投影的特征,可以判断出该图像中的文字是横排书写格式还是竖排书写格式(以下,称该书写方向为文书主方向)。比如,当该图像中的文字是横排书写格式时,图像的横向投影比纵向投影变化频繁,而当该图像中的文字是竖排书写格式时,图像的纵向投影比横向投影变化频繁。
图3说明本实施例中确定图像印刷芯区的方法。
图3显示的图像是经过二进制化处理后的图像、其中301指由图像读入单元102从稿纸上读入图像时一并读入的稿纸的范围,302是稿纸上做为印刷对象的图像的有效范围,即印刷芯区。图像特征量是在印刷芯区302的范围内提取的。
再返回图2。
在步骤S103中,在二进制化的图像上,计算黑画素的密度分布特征量DDF(Density Distribution Feature)。
图4说明本实施例中计算黑画素的密度分布特征量的方法。
如图4所示,将印刷芯区302分割成多个子区域。比如,在图4中,用横向m条线,纵向n条线,将印刷芯区302分割成m×n个子区域。然后,计算各个子区域的黑画素的数目si(i=0,...,m×n-1)。这里,i为子区域的指数。然后,将各个子区域的黑画素数格式化,计算各个子区域的黑画素数si与最大黑画素数S的比值ri
S = max i = 0 , . . . , m × n - 1 ( s i ) - - - ( 1 )
ri=si/s    i=0,...,m×n-1                    (2)
然后,根据是横向书写格式还是竖向书写格式,计算以上比值的差。
如果是横向书写格式,则
dr j × n + l = r j × n + l - r j × n + l - 1 , l = n - 1 r j × n + l - r j × n + l + 1 , l = 0 2 × r j × n + l - r j × n + l - 1 , others - - - ( 3 )
如果是竖向书写格式,则
dr j × n + l = r j × n + l - r ( j - 1 ) × n + l , j = m - 1 r j × n + l - r ( j + 1 ) × n + l , j = 0 2 × r j × n + l - r ( j - 1 ) × n + l - r ( j + 1 ) × n + l , others - - - ( 4 )
得到的黑画素密度分布特征量DDF可用以下式子表达。
DDF(r0,...,rm×n-1;dr0,...,drm×n-1)            (5)
图5是显示本实施例的提取图像关键块特征量的方法的流程图。
如图5所示,在步骤S121中,将输入图像的数据转换为二进制数据。
在步骤S122中,在已二进制化的图像上,确定图像的印刷芯区。
在步骤S123中,在二进制化的图像上,求图像的关键块特征量KBF(Key Block Feature)。
如上所述,图像的关键块为图像中具有显著特征的主要区域(图像块)。比如,在图3中的图像上,有显示有两辆汽车,图表,文字等的若干图像块。这些图像块可定义为图3中的图像的关键块。具体按以下方法来定量描述各个关键块。
在将图像二进制化,并确定了印刷芯区302后,求黑画素的分布。
具体讲,在文书中,相邻文字之间都留有一定空白。在求图像的关键块特征量KBF时,需将这些空白都填黑,以得到黑画素的连续分布。即,在文书主方向,将相邻文字之间的空白填黑。这样,一行或一列的黑画素相互连接,原来离散分布的黑画素变成有一定长度的黑条带。
根据得到的黑条带的长度和相邻黑条带的间隔的疏密,将印刷芯区302划分为多个图像块。
然后,计算各个图像块中黑条带长度的平均值。比如,黑条带长度的平均值最大的三个图像块可被定义为关键块KB1,KB2,KB3。
图6,图7,图8分别显示关键块KB1,KB2,KB3。在图6,图7,图8中,401,402,和403分别指该三个关键块KB1,KB2,KB3。
在图6,图7,图8中,如上所述,由于相邻黑画素之间被填黑,离散分布的黑画素变成有一定长度的黑条带。这些黑条带的长度和间隔的疏密被用来做为划分印刷芯区302为多个图像块时的基准。
另外,在图6,图7,图8中的左侧,分别显示有关键块KB1,KB2,KB3的横向投影。从该投影可以得到黑条带的长度和间隔的疏密的信息。
图9显示输入图像中关键块KB1,KB2,KB3的相对关系。
在图9中,分别表示为401,402,和403的三个关键块KB1,KB2,KB3是关键块特征量KBF的值最大的三个关键块。
将关键块KB1,KB2,KB3的重心分别表示为c1,c2,c3,求出以下各个量。
l1=‖c1-c2‖    l2=‖c2-c3‖    l3=‖c3-c1‖         (6)
L=max(l1,l2,l3)                                      (7)
kbi=bwi/L    i=1,...,3                              (8)
tl=0.5×(l1+l2+l3)                                     (9)
A=((tl-l1)×(tl-l2)×(tl-l3)×tl)1/2                   (10)
α i = 0 , A = 0 2 × A / l i / l i - 1 , others - - - ( 11 )
即,如果将三角形c1 c2 c3的三个内角分别表示为θ1,θ2,θ3,则有:αi=sin(θi)。
得到的关键块特征量KBF可用以下式子表达。
KBF(kb1,kb2,kb3,α1,α2,α3)                        (12)
这样,就得到了做为图像局部特征量的图像画素密度分布特征量DDF以及做为图像整体特征量的关键块特征量KBF。
以下说明利用画素密度分布特征量DDF和图像关键块特征量KBF从图像数据库检索出与输入图像匹配的图像的方法。
在本实施例中,在进行图像检索之前,先构筑用于检索的图像数据库。比如,该图像数据库是一个包含10000个以上的参考图像的大规模的数据库。这些参考图像具有不同的图像分辨率(比如,100dpi,200dpi,400dpi等等),不同的格式(比如,1比特,8比特,24比特等等),不同的语言(比如,中文,日文,英文等等)。
比如这些参考图像是从可编辑的电子文书转换来的图像。所谓可编辑是指能够用一般文字处理软件进行编辑。在将电子文书转换为图像时,可以设定图像分辨率,图像颜色,二值或多值等条件。
对于每个参考图像,按以上所述的方法提取图像特征量,即,按图2所示的方法提取出各个参考图像的前景的画素密度分布特征量DDF,还可以按图5所示的方法提取出各个参考图像的关键块特征量KBF,并将参考图像的图像数据,对应的电子文件数据,画素密度分布特征量DDF,和关键块特征量KBF相互关联,构筑图像数据库。该图像数据库存储于硬盘104,当本实施例的数字式多功能图像处理机100开始工作时,该图像数据库从硬盘104读入内存105中,并由文件管理单元106管理来管理。
在以下说明中,设输入图像为Q,输入图像的画素密度分布特征量为QDDF,输入图像的关键块特征量为QKBF。再假设文件管理单元106管理图像数据库中的K个参考图像,其中第k个参考图像的画素密度分布特征量和关键块特征量分别为DDF(k)和KBF(k)(k=1,...,K)。
图10是说明本实施例的图像检索方法的流程图。
在步骤S131中,检索单元107利用图像的画素密度分布特征量来进行检索。比如,检索单元107将输入图像的画素密度分布特征量与数据库中的各个参考图像的画素密度分布特征量比较,以检索出与输入图像匹配的参考图像。
具体讲,首先按以下公式计算输入图像的画素密度分布特征量QDDF与第k个参考图像的画素密度分布特征量DDF(k)的两个距离值Ddisk和Ddifk
ds i k = ( r i ddf ( q ) - r i ddf ( k ) ) 2 - - - ( 13 )
dd i k = ( dr i ddf ( q ) - dr i ddf ( k ) ) 2 - - - ( 14 )
将dsi k按以下顺序排列。
ds 0 k < . . . < ds j k < ds j + 1 k < . . . < ds m &times; n - 1 k - - - ( 15 )
Ddis k = &Sigma; j ds j k , j < m &times; n - 1 - - - ( 16 )
Ddif k = &Sigma; i dd i k , j < m &times; n - 1 - - - ( 17 )
从图像数据库中选出距离Ddisk最小的五个参考图像,以及距离Ddifk最小的五个参考图像,得到共10个参考图像,做为这次检索的结果。
在步骤S132中,检索单元107利用图像的关键块特征量来进行检索。比如,检索单元107将输入图像的关键块特征量与以上检索出的10参考图像(以下,称为候选图像)的关键块特征量比较,以从中检索出与输入图像匹配的参考图像。以下设10个候选图像的关键块特征量为KBF(i)(i=0,...,9)。
计算可靠度指数指数sci,pci,和Rkbfi
sc i = &Sigma; j = 1 3 [ sw j &times; ( kb j kbf ( q ) - kb j kbf ( i ) ) 2 ] - - - ( 18 )
pc i = &Sigma; j = 1 3 [ pw j &times; ( &alpha; j kbf ( q ) - &alpha; j kbf ( i ) ) 2 ] - - - ( 19 )
指数sci是用关键块的平均尺寸计算得到的输入图像与候选图像之间的可靠度指数,pci是用关键块之间的相对位置计算得到的输入图像与候选图像之间的可靠度指数。
Rkbfi=1/(1+sci×pci)                (20)
可靠度指数Rkbfi是输入图像与候选图像之间整体的可靠度指数。根据可靠度指数Rkbfi的大小来确定匹配图像。比如,从候选图像中选出与Rkbfi的最小的五个值对应的参考图像,做为检索结果。
图11和图12显示用以上说明的本实施例的检索方法得到的检索实验结果。
在图11和图12所示的检索实验中,构筑了包含10385个参考图像的数据库,使用了具有Pentium 1.7GHz的CPU和256MB内存的个人计算机。在图11的检索实验中,利用图像的画素密度分布特征量进行了检索,得到了与输入图像一致性最高的5个参考图像。在图12的检索实验中,利用图像的画素密度分布特征量和关键块特征量进行了两次检索,得到了与输入图像一致性最高的5个参考图像。在以上检索实验中,处理输入图像所用时间为1.8秒,检索到匹配图像所用时间为1.6秒。
如图11和图12所示,本实施例的检索方法能够迅速并且准确地从不同图像分辨率,不同格式,不同语言的图像中检索出需要的图像。
图13是显示本实施例的数字式多功能图像处理机100的图像处理操作的流程图。
在步骤S201中,图像读入单元102从稿纸上读入图像数据。
在步骤S202中,控制单元101控制提取被读入的图像的特征量。
在步骤S203中,利用得到的图像特征量,检索单元107从在文件管理单元106管理之下的图像数据库中检索与读入图像匹配的图像。
在步骤S204中,控制单元101判断是否检索到与读入图像匹配的图像。如果没有检索到,则图像处理结束。如果检索到,则进入步骤S205。
在步骤S205中,检索到的图像或与其对应的电子文件被显示在显示器上。这时,用户可以确认图像的内容。
在步骤S206中,等待用户指示是否进行编辑。若用户选择编辑时,则进入步骤S207。若用户没有选择编辑时,则进入步骤S208。
在步骤S207中,用户编辑被显示的电子文件,比如,可以进行修改,追加,删除等编辑。
在步骤S208中,等待用户指示是否输出电子文件。若用户选择输出时,则进入步骤S209。若用户没有选择输出时,则图像处理结束。
在步骤S209中,进行各种与输出相关的设定,然后图像输出单元103输出该图像。
如图13所示,根据本实施例,不但能够迅速并且准确地从不同图像分辨率,不同格式,不同语言的图像中检索出需要的图像,而且还可以编辑该检索到的图像。
在本实施例中,画素密度分布的特征量以及关键块特征量被用做图像特征量。这两个特征量受图像质量的变化的影响不大。特别是,画素密度分布的处理很简单,计算少,能快速高效地提取出来。
所以,根据本发明,能够迅速并且准确地从不同图像分辨率,不同格式,不同语言的图像中检索出需要的图像,而且还可以编辑检索到的图像。
以上说明了是本发明的优选实施例,本发明并不限于以上的实施例,属于相关领域的技术人员可以在不脱离本发明的范围的前提下做种种修改。

Claims (20)

1.一种图像检索装置,用来从多个参考图像中检索出与待检索图像相匹配的参考图像,它包括:
存储单元,存储所述多个参考图像的图像数据以及各个所述参考图像的画素密度分布数据;
画素密度分布提取单元,用来提取所述待检索图像的画素密度分布;以及
检索单元,它将所述待检索图像的画素密度分布数据与各个所述参考图像的画素密度分布数据相比较,来从所述多个参考图像中检索出与所述待检索图像相匹配的至少一个参考图像。
2.根据权利要求1所述的图像检索装置,还包括:
关键区域提取单元,用来提取所述待检索图像的关键区域,
其中,
所述存储单元中还存储各个所述参考图像的关键区域的数据,
所述检索单元将所述待检索图像的关键区域数据与所述利用画素密度分布检索到的参考图像的关键区域数据相比较,检索与所述待检索图像相匹配的至少一个参考图像。
3.根据权利要求2所述的图像检索装置,还包括:
有效图像区域确定单元,用来把所述待检索图像的图像数据转换为二进制数据,并确定所述待检索图像的有效图像区域,
其中,
所述画素密度分布提取单元将所述待检索图像的有效图像区域分割成多个子区域,计算出所述各个子区域的画素密度,得到所述待检索图像的画素密度分布。
4.根据权利要求2所述的图像检索装置,还包括:
有效图像区域确定单元,用来把所述待检索图像的图像数据转换为二进制数据,并确定所述待检索图像的有效图像区域,
其中,
所述关键区域提取单元将所述待检索图像的有效图像区域分割成多个子图像,并从所述多个子图像中提取所述待检索图像的关键区域。
5.一种图像检索方法,用来从多个参考图像中检索出与待检索图像相匹配的参考图像,它包括:
画素密度分布提取步骤,提取所述待检索图像的画素密度分布;以及
第一检索步骤,将所述待检索图像的画素密度分布数据与各个所述参考图像的画素密度分布数据相比较,检索出与所述待检索图像相匹配的至少一个参考图像。
6.根据权利要求5所述的图像检索方法,还包括:
关键区域提取步骤,提取所述待检索图像的关键区域,以及
第二检索步骤,将所述待检索图像的关键区域数据与所述利用画素密度分布检索到的参考图像的关键区域数据相比较,检索出与所述待检索图像相匹配的至少一个参考图像。
7.根据权利要求6所述的图像检索方法,还包括:
有效图像区域确定步骤,把所述待检索图像的图像数据转换为二进制数据,并确定所述待检索图像的有效图像区域,
其中,
所述画素密度分布提取步骤中,将所述待检索图像的有效图像区域分割成多个子区域,计算出所述各个子区域的画素密度,得到所述待检索图像的画素密度分布。
8.根据权利要求6所述的图像检索方法,还包括:
有效图像区域确定步骤,把所述待检索图像的图像数据转换为二进制数据,并确定所述待检索图像的有效图像区域,
其中,
所述关键区域提取步骤中,将所述待检索图像的有效图像区域分割成多个子图像,并从所述多个子图像中提取所述待检索图像的关键区域。
9.根据权利要求5至8中任一项所述的图像检索方法,还包括:
数据库构筑步骤,用来构筑一数据库,从该数据库中,检索出与所述待检索图像相匹配的至少一个参考图像,
该数据库构筑步骤进行如下步骤:
将多个电子文件分别转换为图像,得到所述多个参考图像;
提取出所述各个参考图像的画素密度分布数据;
提取出所述各个参考图像的关键区域数据;
将所述各个参考图像的图像数据,所述各个参考图像的画素密度分布数据,所述各个参考图像的关键区域数据,以及对应的所述电子文件的数据相互关联地存储于所述数据库中。
10.一种图像处理装置,用来处理从多个参考图像中检索出的与输入图像相匹配的参考图像,它包括:
图像输入单元,它输入一输入图像;
存储单元,存储所述多个参考图像的图像数据以及各个所述参考图像的画素密度分布数据;
画素密度分布提取单元,用来提取所述输入图像的画素密度分布;
检索单元,它将所述输入图像的画素密度分布数据与各个所述参考图像的画素密度分布数据相比较,来从所述多个参考图像中检索出与所述输入图像相匹配的至少一个参考图像,以及
图像输出单元,用来输出被检索到的与所述输入图像相匹配的参考图像。
11.根据权利要求10所述的图像处理装置,还包括:
关键区域提取单元,用来提取所述输入图像的关键区域,
其中,
所述存储单元中还存储各个所述参考图像的关键区域的数据,
所述检索单元将所述输入图像的关键区域数据与所述利用画素密度分布检索到的参考图像的关键区域数据相比较,来检索与所述输入图像相匹配的至少一个参考图像。
12.根据权利要求11所述的图像处理装置,还包括:
有效图像区域确定单元,用来把所述输入图像的图像数据转换为二进制数据,并确定所述输入图像的有效图像区域,
其中,
所述画素密度分布提取单元将所述输入图像的有效图像区域分割成多个子区域,计算出所述各个子区域的画素密度,得到所述输入图像的画素密度分布。
13.根据权利要求11所述的图像处理装置,还包括:
有效图像区域确定单元,用来把所述输入图像的图像数据转换为二进制数据,并确定所述输入图像的有效图像区域,
其中,
所述关键区域提取单元将所述输入图像的有效图像区域分割成多个子图像,并从所述多个子图像中提取所述输入图像的关键区域。
14.根据权利要求11所述的图像处理装置,其中,
所述存储单元中,与所述各个参考图像的图像数据相关联地,还存储所述各个参考图像的电子文件,
所述图像处理装置还包括:
显示器,它用来显示检索到的参考图像;和
编辑器,它用来编辑检索到的参考图像的所述电子文件。
15.一种图像处理方法,用来处理从多个参考图像中检索出的与输入图像相匹配的参考图像,它包括:
图像输入步骤,用来读如一输入图像;
画素密度分布提取步骤,提取所述输入图像的画素密度分布;
第一检索步骤,将所述输入图像的画素密度分布数据与各个所述参考图像的画素密度分布数据相比较,检索出与所述输入图像相匹配的至少一个参考图像,以及
图像输出步骤,输出被检索到的与所述输入图像相匹配的参考图像。
16.根据权利要求15所述的图像处理方法,还包括:
关键区域提取步骤,提取所述输入图像的关键区域,以及
第二检索步骤,将所述输入图像的关键区域数据与所述利用画素密度分布检索到的参考图像的关键区域数据相比较,检索出与所述输入图像相匹配的至少一个参考图像。
17.根据权利要求16所述的图像处理方法,还包括:
有效图像区域确定步骤,把所述输入图像的图像数据转换为二进制数据,并确定所述输入图像的有效图像区域,
其中,
所述画素密度分布提取步骤中,将所述输入图像的有效图像区域分割成多个子区域,计算出所述各个子区域的画素密度,得到所述输入图像的画素密度分布。
18.根据权利要求16所述的图像处理装置,还包括:
有效图像区域确定步骤,把所述输入图像的图像数据转换为二进制数据,并确定所述输入图像的有效图像区域,
其中,
所述关键区域提取步骤中,将所述输入图像的有效图像区域分割成多个子图像,并从所述多个子图像中提取所述输入图像的关键区域。
19.根据权利要求15至18中任一项所述的图像处理方法,还包括:
数据库构筑步骤,用来构筑一数据库,从该数据库中,检索出与所述待检索图像相匹配的至少一个参考图像,
该数据库构筑步骤进行如下步骤:
将多个电子文件分别转换为图像,得到所述多个参考图像;
提取出所述各个参考图像的画素密度分布数据;
提取出所述各个参考图像的关键区域数据;
将所述各个参考图像的图像数据,所述各个参考图像的画素密度分布数据,所述各个参考图像的关键区域数据,以及与各个参考图像对应的电子文件的数据相互关联地存储于所述数据库中。
20.根据权利要求19所述的图像处理方法,还包括:
显示步骤,来显示检索到的参考图像;和
编辑步骤,来编辑检索到的参考图像的所述电子文件。
CN 200510092330 2005-08-26 2005-08-26 图像检索装置,图像处理装置,图像检索方法,以及图像处理方法 Pending CN1921535A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN 200510092330 CN1921535A (zh) 2005-08-26 2005-08-26 图像检索装置,图像处理装置,图像检索方法,以及图像处理方法
JP2006024785A JP2007066286A (ja) 2005-08-26 2006-02-01 画像検索装置、画像処理装置、及びそれらの方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200510092330 CN1921535A (zh) 2005-08-26 2005-08-26 图像检索装置,图像处理装置,图像检索方法,以及图像处理方法

Publications (1)

Publication Number Publication Date
CN1921535A true CN1921535A (zh) 2007-02-28

Family

ID=37779089

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200510092330 Pending CN1921535A (zh) 2005-08-26 2005-08-26 图像检索装置,图像处理装置,图像检索方法,以及图像处理方法

Country Status (2)

Country Link
JP (1) JP2007066286A (zh)
CN (1) CN1921535A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102685072A (zh) * 2011-03-11 2012-09-19 腾讯科技(深圳)有限公司 上传图片的方法和终端设备
CN101465940B (zh) * 2007-12-21 2013-07-31 三星电子株式会社 用于修剪的设备和方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7882177B2 (en) * 2007-08-06 2011-02-01 Yahoo! Inc. Employing pixel density to detect a spam image
EP2323081A1 (en) 2008-08-05 2011-05-18 Fujitsu Limited Method of creating estimation model by means of multiple regression analysis, creation system and creation program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101465940B (zh) * 2007-12-21 2013-07-31 三星电子株式会社 用于修剪的设备和方法
CN103369194A (zh) * 2007-12-21 2013-10-23 三星电子株式会社 用于修剪的设备和方法
CN102685072A (zh) * 2011-03-11 2012-09-19 腾讯科技(深圳)有限公司 上传图片的方法和终端设备
CN102685072B (zh) * 2011-03-11 2016-09-14 腾讯科技(深圳)有限公司 上传图片的方法和终端设备

Also Published As

Publication number Publication date
JP2007066286A (ja) 2007-03-15

Similar Documents

Publication Publication Date Title
JP4405831B2 (ja) 画像処理装置及びその制御方法、プログラム
US6980332B2 (en) System and method of automated scan workflow assignment
CN1143239C (zh) 用来分析表格图像的方法和设备
US7746507B2 (en) Image processing apparatus for image retrieval and control method therefor
CN1783933A (zh) 图像处理装置及其方法
US11341733B2 (en) Method and system for training and using a neural network for image-processing
CN1874395A (zh) 图像处理装置、图像处理方法及计算机产品
JP2007174270A (ja) 画像処理装置、画像処理方法、記憶媒体、プログラム
CN1838112A (zh) 翻译装置、翻译方法及存储介质
CN1719862A (zh) 图像处理系统和图像处理方法
JP2007042106A (ja) 文書処理方法、文書処理メディア、文書管理方法、文書処理システム及び文書管理システム
CN1744077A (zh) 文档处理装置以及方法
CN1680973A (zh) 基于网络服务应用的光学字符识别系统和方法
JP2007174317A (ja) 画像処理装置及びプログラム
EP2403228B1 (en) Image scanning apparatus, computer readable medium, and image storing method
CN1921535A (zh) 图像检索装置,图像处理装置,图像检索方法,以及图像处理方法
JP4232679B2 (ja) 画像形成装置およびプログラム
CN1100366A (zh) 字符发生方法及装置
US8390874B2 (en) Optimal resolution imaging system and method
US10602019B2 (en) Methods and systems for enhancing image quality for documents with highlighted content
US8749854B2 (en) Image processing apparatus, method for performing image processing and computer readable medium
JP4179977B2 (ja) スタンプ処理装置、電子承認システム、プログラム、及び記録媒体
JP2006333248A (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP2007066286A6 (ja) 画像検索装置、画像処理装置、及びそれらの方法
CN101043565A (zh) 图像形成装置、电子邮件传送服务器和信息处理装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20070228