CN1779681A - 基于内容图像的文档检索方法以及装置 - Google Patents

基于内容图像的文档检索方法以及装置 Download PDF

Info

Publication number
CN1779681A
CN1779681A CNA2005100926646A CN200510092664A CN1779681A CN 1779681 A CN1779681 A CN 1779681A CN A2005100926646 A CNA2005100926646 A CN A2005100926646A CN 200510092664 A CN200510092664 A CN 200510092664A CN 1779681 A CN1779681 A CN 1779681A
Authority
CN
China
Prior art keywords
image
mentioned
document
key
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005100926646A
Other languages
English (en)
Inventor
酒匂裕
广池敦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of CN1779681A publication Critical patent/CN1779681A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明提供基于内容图像的文档检索方法以及装置。以往的文档检索方法为了斟酌内容需要一次读取文档,至今为止不能够实现内容的一览性,为此,虽然有预先生成概要图像的方法,然而在其生成中非常花费时间或者成本,另外因为存在在监视器的一个画面上难以显示检索的全部文档的概要图像等理由,所以不能够完全解决问题,本发明把文档置换为一览性高的图像,即,把文档内的照片、图、表等图像作为其文档的键图像,输入使用了其键图像的一个或者多个检索逻辑式,在显示画面内三维地显示所有包含满足检索逻辑式的类似图像的文档内的图像,而且检索者如果选择显示了的键图像,则显示包括其键图像的文档内容。

Description

基于内容图像的文档检索方法以及装置
技术领域
本发明涉及使用文字处理的图像检索文档的方法及其装置。特别涉及文档的有效的检索方法及其装置,在这里所述的文档还包括构筑在WWW上的Web文档。另外,所谓图像包括照片、画面、图表、表格、曲线图、符号等在文档中出现的各种内容。
背景技术
以往,在特定领域,例如专利或者医疗领域等中,对过去的文档例进行检索从专利的新颖性检查或者类似病例的检查等的观点出发是必不可少的,当前正在积极研究开发。另一方面,最近,正在开发用于从网络等的基础设施完备的互联网或者内部网得到个人所需要的信息的检索技术或者软件。至今为止的检索技术的主流主要是假定存在关键词。即,预先抽取出文档文本内的多个文件关键词或者文档图像的标题内的关键词,预先把该关键词与文档相对应存储。而且,在检索时,使用其所存储的对应,根据所提供的关键词抽取出认为是类似的内容的文档(特开2000-067066「文档图像管理方法、文档图像检索方法、文档图像管理系统以及存储媒体」)。
以上说明的文档检索方法通常大多是根据多个关键词的检索频率等进行类似度计算,按照其值的顺序显示文档名或者Web文档的URL。在这种情况下,需要一个一个地打开文档的文件,检查是否是希望对内容进行斟酌的文档,其工时非常大。即,在文档检索中,为了斟酌内容需要一次读入文档,目前为止不能实现内容的一览性。因此,例如,在特开平5-216936「文档存储/检索方法」中,还考虑预先存储表示文档概要的概要图像,通过显示与文档信息(关键词)等中的检索条件一致的文档的概要图像,减少其工时,实现有效作业的方法。
另一方面,在图像检索中,有预先用人工把关键词加入到图像上的方法,或者从图像进行颜色或形状的特征抽取,按照其特征检索类似图像的方法。
如以上所说明的那样,以往的文档检索方法通常大多是根据多个关键词的检索频率等进行类似度计算,按照其值的顺序显示检索出的文档名或者Web文档的URL。在这种情况下,需要一个一个地打开文档的文件,检查是否是希望对内容进行斟酌的文档。其工时非常大。即,在文档检索中为了斟酌内容需要一次读入文档,目前为止不能够实现内容的一览性。为此,虽然也有特开05-216936那样的预先生成概要图像的方法,然而,在其生成需要花费大量的时间或者成本,或者难以在监视器的一个画面上显示检索的所有文档的概要图像等理由下,不能够完全地解决问题。进而,在一般的关键词中,常常并不能够有效地检索所需要的文档。这是因为一般仅按照文档内的关键词的频率,常常难以正确地近似其内容,因此并不能够仅检测内容类似的文章。
发明内容
为了解决这样的课题,在本发明中,首先把文档置换为一览性高的图像。即,把文档类的照片、图、表等图像作为该文档的键图像。输入使用了一个或者多个该键图像的检索逻辑式,在显示画面内例如三维地显示所有包含满足检索逻辑式的类似图像的文档内的图像。而且,如果检索者选择所显示的键图像,则显示包括其键图像的文档内容。
本发明更具体的方法是在包括图像的文档检索方法中,特征是具有:使文档的数据与该文档中的图像的数据相对应的第1步骤;把规定图像指定为键图像的第2步骤;使用上述指定的键图像和运算符设定检索式的第3步骤;显示通过基于上述检索式的检索抽取出的多个图像的第4步骤;从上述显示的图像指定任意图像的第5步骤;显示与上述指定了的图像相对应的文档的第6步骤。
另外,在上述第1步骤中,具有:在电子文档中通过其代码内容的分析自动地进行对应的步骤;在图像文档中通过图像处理自动地进行对应的步骤。即,在使文档的数据与该文档内的图像的数据相对应时,有文档是电子(HTML等的文本代码等)数据的情况和图像数据(用扫描仪取入的文档等)的情况。在前者的情况下,通过分析文本数据,明确图像数据的存在及其保存位置。另一方面,在图像数据的情况下,通过图像处理,能够分离文字图像和图像数据,明确图像数据的存在及其保存位置。
另外,在上述第2步骤中,具有:在把应该包含在希望检索的文档中的图像指定为键图像时,用利用了电光元件的扫描仪或者照相机输入并指定该图像的步骤,则能够把任意的图像素作为键。另外,在上述第3步骤中,具有:显示表示上述键图像的图标和表示上述运算符的图标的步骤;从上述显示的图标选择构成上述检索式的元素的步骤,则能够简易地生成检索式。
另外,在本发明的检索方法中,在对象中不仅可以包括与键图像相同的图像,还可以包括与键图像类似的图像,因此能够进行有效的检索。
另外,在上述第4步骤中,如果具有把抽取出的多个图像分组,显示各个组的步骤,则能够视觉地把握抽取出的多个图像,很容易选择所希望的图像。这时,还能够从抽取出的图像检测多个特征量,使用它们的距离进行分组。另外,理想的是在由多个特征量的若干个轴构成的空间中显示抽取出的图像。
另外,本发明的其它方法是在包括图像的文档检索方法中,特征是具有:使文档的数据与该文档中的图像的数据相对应的步骤;把规定图像指定为键图像的步骤;从上述图像的数据中抽取出与上述键图像类似的多个图像的步骤;显示上述抽取出的多个图像的步骤;从上述显示的图像指定任意的图像的步骤;显示与上述指定的图像相对应的文档的步骤。
作为上述键图像能够指定多个图像。对于键图像的每一个,如果从图像的数据抽取出与键图像类似的图像群,则能够针对每一个键图像抽取由多个图像构成的图像群(组)。还能够显示这些组的逻辑和或逻辑积。
为了显示所希望的图像,显示表示多个键图像的图标以及表示逻辑运算符的图标,把所显示的图标组合起来设定检索式,根据检索式能够显示图像,能够提高操作性。
作为图像图标,既能够使用图像本身,也能够使用把图像缩小了的图像或者简化了的符号。
作为逻辑运算符,能够使用表示逻辑积(AND)的图标以及表示逻辑和(OR)的图标。根据情况,也可以使用(NAND)(NOR)等其它的运算符。把所显示的图标组合起来设定检索式,根据检索式,进行从多个键图像抽取出的多个图像群相互的集合运算,把集合运算的结果显示为抽取出的多个图像。作为显示方法,能够在三维空间中根据各图像具有的特征量显示所抽取的多个图像。
本发明的装置是在包括图像的文档检索装置中,特征是具有:对文档的数据与该文档中的图像的数据的对应关系进行存储的存储装置;把规定图像指定为键图像的键图像指定装置;从上述图像的数据抽取出与上述键图像类似的多个图像的处理装置;显示上述抽取出的多个图像的图像显示装置;从上述显示的图像指定任意图像的图像指定装置;显示与上述指定的图像相对应的文档的文档显示装置。作为存储装置,能够利用硬盘以外的装置。键图像指定装置能够使用用于读入键图像的扫描仪、选择在监视器上显示的图像或者其图标的指示设备。
存储装置可以存储文档的数据与文档中的图像的数据的对应关系,不一定需要存储文档数据本身或者图像数据本身。在理想的形态中,保存成为检索键的图像数据(或者其加工数据),对于文档数据自身,通过仅存储其保存位置(访问目标,例如地址),能够减小存储装置的容量。
另外,在其它的形态中,在具备输入装置、显示装置、处理装置以及存储装置的文档检索装置,特征是:上述存储装置是对文档的数据与该文档中的图像的数据的对应关系进行存储的存储装置,上述处理装置进行控制使得从上述输入装置把规定图像指定为键图像,从上述存储装置抽取出与上述键图像类似的多个图像,在上述显示装置显示上述抽取出的多个图像,由上述输入装置从上述显示的图像指定任意的图像,在上述显示装置显示与上述指定的图像相对应的文档。作为输入装置,能够使用鼠标等指示设备、扫描仪、键盘等。显示装置能够使用一台或者多台显示器或者打印机等输出装置。作为处理装置,既能够用专用的硬件构成,也能够用在通用的处理器上动作的软件实现。
进而,在本发明中,具有连接于网络的接口,访问存在于网络上所连接的其它存储装置中的文档,取得表示该文档存在位置的地址和存在于该文档内的图像的数据,使它们相对应地存储在上述存储装置中。根据该形态,能够作为互联网等的检索引擎加以利用。这时,所存储的图像可以是图像本身,而如果是数据压缩了的图像或者简化了的图像,则能够有效地利用存储装置的容量。
一般,像专利文档的例子那样,文档的内容大多显著地表现在其内部包括的照片、图、表中。即,希望在文档中强调的事项或者希望让人了解的部分成为在视觉上强调的图像的情况较多,在最近的文献中几乎不存在没有图像的文献。在这样的理由下,表现文档内容的最佳方法是用包含在其文档中的图像的集合进行表现。为此,在本发明中,根据多个内部图像表现文档,通过使用这些图像提高检索率。另外,通过在显示画面上三维地显示利这些图像检索的文档内的图像群,能够实现一览性。另外,通过输入使用了一个或者多个该键图像的检索逻辑式,能够进行基于各种检索条件的检索。另外,如果在该检索逻辑式中包括文本(关键词)并与以往技术组合起来,则能够实现基于图像和关键词的检索,能够进行更高精度的检索。
附图说明
图1是表示作为本发明实施方式中的文档检索装置的结构的一个例子和希望检索的网络上的文档的概念图。
图2是表示图1的处理装置11的具体处理例的流程图。
图3是表示文档检索装置1的处理中的数据的关系或者数据的对应的概念图。
图4是表示图1的处理装置11内的检索文档与图像的对应的处理步骤的流程图。
图5是表示图1的处理装置内要检索的图像例的提示的处理步骤的流程图。
图6是表示图1的处理装置11内的使用了提示图像的检索逻辑式的输入的处理步骤的流程图。
图7是表示图1的处理装置11内的使用了提示图像的检索逻辑式的输入的处理步骤中的用于选择检索键图像和检索逻辑符号的窗口例以及检索逻辑式例的概念图。
图8是表示利用图1的处理装置11的类似度的图像的一览显示的处理步骤的流程图。
图9是表示图1的处理装置11的特定图像的指示与对应文档的显示的处理步骤的流程图。
具体实施方式
在本发明中,以在PC等计算机上工作的检索软件作为具体的方式。即,由PC等计算机、显示装置、鼠标等指示装置、图像的输入装置以及存储图像或者文档的存储装置构成。作为希望检索的文档,假设为连接到网络上的文件内的文档,例如,互联网上的主页等文档。
实施例1
参照附图详细地说明本发明的实施方式。
图1表示本实施方式中的互联网上的文档检索的结构的一个例子。本例的文档检索装置1由用于实现本方法的文档检索的处理装置11、存储装置12、显示装置和鼠标等指示装置13、扫描仪等输入装置14构成。在该例子中,文档检索装置1用互联网或者内部网2连接Web书类群3。
图2具体地表示在图1的处理装置中的处理内容。
图3表示了文档检索装置1的处理中的数据的关系或者数据的对应。在本检索方法中按照以下的顺序进行文档检索。以下,一边参照图2以及图3一边进行说明。
(1)通过检索自动装置搜索网络上的文档,抽取其文档内的图像(文档内的照片、图、表格等的图像),进行文档与图像的对应(图2的111:步骤1)。而且,其结果,在图1的存储装置12中,存储与文档信息地址群(Web书类的情况下是URL等)121、包含在该书类中的图像群122、以及使这些信息即文档信息地址与种类内图像相对应的表123。
在图3的步骤1中模式地示出表123表示的内容。在文档信息地址文件中,保存自动装置搜索到的文档信息地址群。另外,在图像文件中保存这里的文档内的图像。表123是使该文档信息地址与图像相对应的表,例如,文档1有图像10和图像11,文档2有图像20,文档3有图像30和图像31.以上由自动装置进行的搜索、存储、对应能够在检索的空闲时间或者特定的时刻预先进行。
(2)在检索文档时,提示表现希望检索的文档内容的图像(键图像)(图2的112:步骤2)。作为提示方法,例如,有利用扫描仪等输入装置14输入键图像的方法和从已经存在的电子文档选择键图像的方法。
在图3的步骤2中,示出采取了4个键图像的情况。
(3)接着,输入使用了键图像的检索逻辑式(图2的113:步骤3)。例如,在搜索与键图像1相似的图像和与键图像2相似的图像的双方都存在的文档,或者即使没有这些图像但是有与键图像4相似的图像的文档的情况下,检索逻辑式成为图3的步骤3的例子。
(4)根据该检索逻辑式,首先检索存储装置12内的图像。在图3的例子的情况下,全部抽取出包括与键图像1相似的图像的文档的文档信息地址和包括与键图像2相似的图像的文档的文档信息地址,检测在两者中都存在的地址。另外,还抽取包括与键图像4相似的图像的文档的文档信息地址,加入到检索地址中。
(5)其次,关于与检索的文档信息地址对应的各文档,从存储装置12抽取出与键图像1类似的图像、与键图像2类似的图像以及与键图像4类似的图像,在显示装置13中,在以顺序变化的图像特征为轴的三维空间内分组显示(图2的114:步骤4)。关于抽取类似图像的技术,例如有在特开2000-029885中记载的技术。另外,该显示方法能够用在特开平10-193838「图像检索方法以及装置」,A.Hiroike,Y.Musha,A.Sugimoto and Y.Mori,“Visualization of informationspaces to retrieve and browse image data,”Proc.Visua199,Springer-Verlag 155-162,1999等中公开的众所周知的方法实现。通过用这种结构进行检索显示能够实现一览性。另外,图3的步骤4表示了该显示内容。
(6)然后,检索者观察显示的图像,用鼠标等指示装置13选择希望的图像后,则参照存储在存储装置12中的对应表,在显示装置上显示包括其图像的该文档,能够确认内容(图2的115)。图3的步骤4的画面的右上文档是其例子。
以上是本检索方法的概略顺序。下面,使用图4到图9详细地说明各步骤的处理内容的例子。
图4是使图2的111的检索文档与图像的对应具体化的一个例子,通过1111,由已有技术的自动检索装置搜索Web位置,在1112中,在取得图1的3所示的主页文档的URL的同时,取得该文档内的图像。然后,通过1113,在图1的存储装置12的文档信息地址、文档内图像、文档信息地址图像对应表的存储区中保存搜索出的URL、对应图像、对应关系。然后,顺序搜索网络直到没有新的搜索文档为止。这样的处理能够在检索的空闲时间或者预定的时刻预先进行。
图5是使图2的112的要检索的键图像例的提示具体化的一个例子,在1121中,首先选择是用扫描仪输入键图像还是使用已经存在的电子图像。在前者的情况下,用图1的扫描仪输入装置14取得键图像。另一方面,在后者的情况下,从网络或者计算机的存储媒体选择出键图像。然后,所选择的多个键图像在1124中,在图1的显示装置13上将各键图像作为明确的图标进行显示。
图6是把使用了图2的113的键图像的检索式的输入具体化的一个例子,由3个步骤构成。在1131中,首先显示检索逻辑符号的工具箱窗口。
图7表示了用于选择检索键图像和检索逻辑符号的窗口的例子以及检索逻辑式的例子。
在工具箱窗口中,显示如图7的右上方所示的那样的逻辑符号图标。在1132中,显示生成检索逻辑式的作业窗口。另外,在前面说明过的1124中,检索图像的图标显示在图7的左上方。在1133中,使用计算机中已经存在的GUI构成检索式。例如,如图7的中央图的例1所示那样,从各窗口选择逻辑符号、括号和键图像,顺序地下落到图7的下部所示的作业窗口中。例1的情况表示生成“(键图像1AND键图像2)OR键图像4”这样的检索逻辑式的例子。例2是在检索逻辑式中还加入了表现关键词的文本代码的例子。
图8是在图2的114中,使根据检索逻辑式执行与使用了类似度的键图像相似的图像的检索的方法具体化的一个例子。首先,为了进行按照检索逻辑式的执行,进行在计算器等四则运算等中所利用的反波兰记法(Polish notation)的变换。即,在1114中将图8的检索逻辑式变换为按照处理顺序(数据列、记法的元素(逻辑符号)的对这样的顺序)新写的反波兰记法。这些信息以一维地压栈(push)形式存储在处理装置11内的暂存单元中。在1142中,首先,取出第1对(在本例的情况下是键图像1、键图像2与AND逻辑)(出栈(pop))。在1143中,当没有元素(不能够出栈时)时,结束执行检索逻辑式。在有元素时,在1144中执行与第1对(在本例的情况下是键图像1、键图像2和AND逻辑)相对应的处理。在该例子的情况下,如在前面说明过的那样,抽出全部包括与键图像1相似的图像的文档的文档信息地址和包括与键图像2相似的图像的文档的文档信息地址,检测两者中存在的共同地址,存储其数据群A(压栈)。
其次,取出第2对(在本例的情况下是当前压栈的信息地址群A、键图像4和OR逻辑)(出栈)。在这次的1144中,把包括与键图像4相似的图像的文档的文档信息地址全部添加到文档信息地址群A中(OR逻辑),存储(压栈)所添加的文档信息地址群B。在本例的情况下,由于至此为止结束了所有的对,因此在1145中,取出文档信息地址群B,全部显示其文档内与键图像1、键图像2、键图像4相似的图像。另外,作为计算图像之间的类似度的方法的例子,使用求图像的各种特征量,按照距离进行判定的方法。而且,作为显示方法,如在前面叙述的那样,如特开平10-193838「图像检索方法以及装置」中所示,边顺序选择特征量的轴边进行3D显示。通过这样做,能够实现检索图像的一览性。
图9是使图2的115的特定图像指示和与其相对应的文档的显示具体化的一个例子。在1151中,从在1145中3D显示在显示装置13的图像群中,检索者选择有兴趣的特定图像。在1152中,参照文档信息地址图像对应表特定与该图像相对应的文档。然后,在1153中,在显示装置13上显示对应文档。通过这样做,能够完全地使文档检索装置具体化。
另外,在以上说明的例子中,表示了用代表文档的内部图像表现并检索的例子,而也可以并用以往的使用关键词的检索。在这种情况下,如图7的例2所示,还可以在检索逻辑式中加入表现关键词的文本代码。当然,在这种情况下,需要预先由检索自动装置检索文档的同时检查是否存在文档内的关键词,在存储装置11中,必须预先存储文档信息地址、关键词群以及它们的对应表。
另外,本发明不限于上述的实施对象,还能够广泛运用。例如,本发明不限于互联网上的Web文档,还能够适用于计算机内的文档文件的检索。
如以上说明的那样,如果依据本发明,则通过多个内部图像表现文档,通过使用这些图像提高检索率,另外,通过在显示画面内三维地显示利用这些图像检索的文档内的图像群,能够实现一览性。另外,通过输入使用了一个或者多个该键图像的检索逻辑式,能够进行利用各种检索条件的检索。从而,能够适用在互联网上的Web文档检索或者计算机内的文档文件检索,对于其有效化的贡献非常大。

Claims (19)

1.一种文档的检索方法,该文档包含图像,其特征在于包括:
使文档的数据与该文档中的图像的数据相对应的第1步骤;
把规定图像指定为键图像的第2步骤;
使用上述指定的键图像和运算符设定检索式的第3步骤;
显示通过基于上述检索式的检索抽取出的多个图像的第4步骤;
从上述显示的图像指定任意图像的第5步骤;
显示与上述指定了的图像相对应的文档的第6步骤。
2.根据权利要求1所述的文档的检索方法,其特征在于:
在上述第1步骤中,具有:
在电子文档中通过其代码内容的分析自动地进行对应的步骤;
在图像文档中通过图像处理自动地进行对应的步骤。
3.根据权利要求1所述的文档的检索方法,其特征在于:
在上述第2步骤中,具有:
在把应该包含在希望检索的文档中的图像指定为键图像时,用利用了电光元件的扫描仪或者照相机输入并指定该图像的步骤。
4.根据权利要求1所述的文档的检索方法,其特征在于:
在上述第3步骤中,具有:
显示表示上述键图像的图标和表示上述运算符的图标的步骤;
从上述显示的图标选择构成上述检索式的元素的步骤。
5.根据权利要求1所述的文档的检索方法,其特征在于:
在上述第4步骤中,
基于上述检索式的检索的对象把与键图像类似的图像包含在对象中。
6.根据权利要求1所述的文档的检索方法,其特征在于:
在上述第4步骤中,具有:
把抽取出的多个图像分组并显示各个组的步骤。
7.根据权利要求1所述的文档的检索方法,其特征在于:
在上述第4步骤中,具有:
从上述抽取出的图像检测多个特征量,使用它们的距离进行分组的步骤。
8.根据权利要求7所述的文档的检索方法,其特征在于:
具有在由上述多个特征量的若干个轴构成的空间上显示上述抽取出的图像的步骤。
9.一种文档的检索方法,该文档包含图像,其特征在于包括:
使文档的数据与该文档中的图像的数据相对应的步骤;
把规定图像指定为键图像的步骤;
从上述图像的数据中抽取出与上述键图像类似的多个图像的步骤;
显示上述抽取出的多个图像的步骤;
从上述显示的图像指定任意的图像的步骤;
显示与上述指定的图像相对应的文档的步骤。
10.根据权利要求9所述的文档的检索方法,其特征在于:
作为上述键图像指定多个图像,
对于所指定的多个键图像的每一个,从上述图像的数据抽取出与该键图像类似的图像群,
把根据各个键图像抽取出的图像群的集合的逻辑和或者逻辑积作为上述抽取出的多个图像的至少一部分进行显示。
11.根据权利要求9所述的文档的检索方法,其特征在于:
作为上述键图像指定多个图像,
显示表示上述多个键图像的图标以及表示逻辑运算符的图标,
把上述显示的图标进行组合并设定检索式,
基于该检索式,把根据上述多个键图像抽取出的多个图像中的至少一个作为上述抽取出的多个图像进行显示。
12.根据权利要求9所述的文档的检索方法,其特征在于:
作为上述键图像指定多个图像,
至少显示表示上述多个键图像的图标、表示逻辑积的图标以及表示逻辑和的图标,
把上述显示的图标进行组合并设定检索式,
基于该检索式,进行根据上述多个键图像抽取出的多个图像群相互的集合运算,
把该集合运算的结果作为上述抽取出的多个图像进行显示。
13.根据权利要求9所述的文档的检索方法,其特征在于:
在三维空间中,与各图像具有的特征量相对应地显示上述抽取出的多个图像。
14.一种文档检索装置,该文档包含图像,其特征在于包括:
对文档的数据与该文档中的图像的数据的对应关系进行存储的存储装置;
把规定图像指定为键图像的键图像指定装置;
从上述图像的数据抽取出与上述键图像类似的多个图像的处理装置;
显示上述抽取出的多个图像的图像显示装置;
从上述显示的图像指定任意图像的图像指定装置;
显示与上述指定的图像相对应的文档的文档显示装置。
15.根据权利要求14所述的文档检索装置,其特征在于:
上述键图像指定装置是用于读入键图像的扫描仪,或者是选择在监视器上显示的图像或其图标的指示器。
16.一种文档检索装置,具备输入装置、显示装置、处理装置以及存储装置,其特征在于:
上述存储装置是对文档的数据与该文档中的图像的数据的对应关系进行存储的存储装置,
上述处理装置进行控制使得从上述输入装置把规定图像指定为键图像,从上述存储装置抽取出与上述键图像类似的多个图像,在上述显示装置显示上述抽取出的多个图像,由上述输入装置从上述显示的图像指定任意的图像,在上述显示装置显示与上述指定的图像相对应的文档.
17.根据权利要求16所述的文档检索装置,其特征在于:
具有连接于网络的接口,访问存在于网络上所连接的其它存储装置中的文档,取得表示该文档存在位置的地址和存在于该文档内的图像的数据,使它们相对应地存储在上述存储装置中。
18.根据权利要求16所述的文档检索装置,其特征在于:
上述处理装置进行控制使得作为上述键图像指定多个图像,在上述显示装置上至少显示表示上述多个键图像的图标、表示逻辑积的图标以及表示逻辑和的图标,把上述显示的图标进行组合并设定检索式,基于该检索式,抽取根据上述多个键图像抽取出的多个图像群相互的集合。
19.一种文档检索程序,该程序在具备输入装置、显示装置、处理装置以及存储装置的系统中,为了进行文档的检索在上述处理装置中运行,其特征在于包括:
在上述存储装置中对文档的数据与该文档中的图像的数据的对应关系进行存储的功能;
从上述输入装置把规定图像指定为键图像的功能;
从上述存储装置抽取出与上述键图像类似的多个图像的功能;
在上述显示装置显示上述抽取出的多个图像的功能;
用上述输入装置从上述显示的图像指定任意的图像的功能;
在上述显示装置显示与上述指定的图像相对应的文档的功能。
CNA2005100926646A 2004-11-22 2005-08-19 基于内容图像的文档检索方法以及装置 Pending CN1779681A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004336860A JP2006146628A (ja) 2004-11-22 2004-11-22 内容画像による文書検索方法および装置
JP2004336860 2004-11-22

Publications (1)

Publication Number Publication Date
CN1779681A true CN1779681A (zh) 2006-05-31

Family

ID=36462162

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005100926646A Pending CN1779681A (zh) 2004-11-22 2005-08-19 基于内容图像的文档检索方法以及装置

Country Status (3)

Country Link
US (1) US20060112142A1 (zh)
JP (1) JP2006146628A (zh)
CN (1) CN1779681A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178725B (zh) * 2006-11-10 2011-08-17 株式会社理光 用于信息检索的设备和方法
CN101201840B (zh) * 2006-12-13 2011-12-21 佳能株式会社 文档检索设备及文档检索方法
CN104657407A (zh) * 2013-11-20 2015-05-27 株式会社东芝 检索装置以及方法

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7467137B1 (en) 1994-09-02 2008-12-16 Wolfe Mark A System and method for information retrieval employing a preloading procedure
US7813561B2 (en) * 2006-08-14 2010-10-12 Microsoft Corporation Automatic classification of objects within images
JP2008083898A (ja) * 2006-09-27 2008-04-10 Fuji Xerox Co Ltd 情報処理システムおよび情報処理プログラム
US20080120142A1 (en) * 2006-11-20 2008-05-22 Vivalog Llc Case management for image-based training, decision support, and consultation
US20080140722A1 (en) * 2006-11-20 2008-06-12 Vivalog Llc Interactive viewing, asynchronous retrieval, and annotation of medical images
US8654139B2 (en) * 2007-08-29 2014-02-18 Mckesson Technologies Inc. Methods and systems to transmit, view, and manipulate medical images in a general purpose viewing agent
US20090132285A1 (en) * 2007-10-31 2009-05-21 Mckesson Information Solutions Llc Methods, computer program products, apparatuses, and systems for interacting with medical data objects
US8520978B2 (en) * 2007-10-31 2013-08-27 Mckesson Technologies Inc. Methods, computer program products, apparatuses, and systems for facilitating viewing and manipulation of an image on a client device
US9251164B2 (en) * 2010-02-26 2016-02-02 Salesforce.Com, Inc. System, method and computer program product for using a database to access content stored outside of the database
US8924395B2 (en) * 2010-10-06 2014-12-30 Planet Data Solutions System and method for indexing electronic discovery data
JP5665125B2 (ja) 2011-04-07 2015-02-04 株式会社日立製作所 画像処理方法、及び、画像処理システム
CN102779426B (zh) * 2011-05-09 2015-11-25 富泰华工业(深圳)有限公司 语音提示系统及方法
US8862602B1 (en) * 2011-10-25 2014-10-14 Google Inc. Systems and methods for improved readability of URLs
JP5694236B2 (ja) * 2012-05-28 2015-04-01 株式会社東芝 文書検索装置、方法およびプログラム
US10956416B2 (en) * 2019-03-12 2021-03-23 International Business Machines Corporation Data schema discovery with query optimization

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5579471A (en) * 1992-11-09 1996-11-26 International Business Machines Corporation Image query system and method
JP3613403B2 (ja) * 1993-08-13 2005-01-26 富士ゼロックス株式会社 マルチメディア文書記憶装置
US5915038A (en) * 1996-08-26 1999-06-22 Philips Electronics North America Corporation Using index keys extracted from JPEG-compressed images for image retrieval
JPH10340272A (ja) * 1997-06-09 1998-12-22 Toshiba Corp 類似画像検索装置及び方法
US6415282B1 (en) * 1998-04-22 2002-07-02 Nec Usa, Inc. Method and apparatus for query refinement
US6271840B1 (en) * 1998-09-24 2001-08-07 James Lee Finseth Graphical search engine visual index
EP2178008A3 (en) * 1999-01-26 2010-09-01 Xerox Corporation Multi-modal information access
JP2001014333A (ja) * 1999-06-30 2001-01-19 Telecommunication Advancement Organization Of Japan 画像検索システムおよび画像データベース管理装置
EP1244016A1 (en) * 2001-03-23 2002-09-25 Hewlett-Packard Company User access pattern tracking of computer resources
US20030052928A1 (en) * 2001-09-14 2003-03-20 Williams Bruce G. System for and method of interactive screen savers
US7383513B2 (en) * 2002-09-25 2008-06-03 Oracle International Corporation Graphical condition builder for facilitating database queries
AU2003282943A1 (en) * 2002-10-11 2004-05-04 Digimarc Corporation Systems and methods for recognition of individuals using multiple biometric searches
GB2395808A (en) * 2002-11-27 2004-06-02 Sony Uk Ltd Information retrieval

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178725B (zh) * 2006-11-10 2011-08-17 株式会社理光 用于信息检索的设备和方法
CN101201840B (zh) * 2006-12-13 2011-12-21 佳能株式会社 文档检索设备及文档检索方法
CN104657407A (zh) * 2013-11-20 2015-05-27 株式会社东芝 检索装置以及方法

Also Published As

Publication number Publication date
JP2006146628A (ja) 2006-06-08
US20060112142A1 (en) 2006-05-25

Similar Documents

Publication Publication Date Title
CN1779681A (zh) 基于内容图像的文档检索方法以及装置
US11263273B2 (en) Systems and methods for graphical exploration of forensic data
US6721729B2 (en) Method and apparatus for electronic file search and collection
JP5309155B2 (ja) イメージ検索における対話型概念学習
US7904455B2 (en) Cascading cluster collages: visualization of image search results on small displays
US8122023B2 (en) Data access using multilevel selectors and contextual assistance
US8230364B2 (en) Information retrieval
US7743343B2 (en) Combined representation of a hierarchical data item collection
US11226976B2 (en) Systems and methods for graphical exploration of forensic data
US20040064455A1 (en) Software-floating palette for annotation of images that are viewable in a variety of organizational structures
US20080155426A1 (en) Visualization and navigation of search results
US20020055919A1 (en) Method and system for gathering, organizing, and displaying information from data searches
US20130091162A1 (en) Data Access Using Multilevel Selectors and Contextual Assistance
Chen et al. Vis30k: A collection of figures and tables from ieee visualization conference publications
JP5379807B2 (ja) サンプル要素のメタデータに基づいてデジタル・コンテンツを検索する方法、システムおよびコンピュータ・プログラム
CN1758252A (zh) 自动视图选择
CN105005562A (zh) 检索结果的显示处理方法及装置
TW201337606A (zh) 動態重新分類與擷取目標資訊物件之使用者設備、系統及方法
US8423553B2 (en) Graphically displaying a file system
JP5271920B2 (ja) オンライン検索のために構造化データを用いる方法
CN1838117A (zh) 管理环球网网页中的环球网媒体的系统及其实现方法
US20130212080A1 (en) In-context display of presentation search results
KR100363447B1 (ko) 다중 정보검색시스템 및 그 방법
Kunz SERGIO-An interface for context driven knowledge retrieval
Rushing et al. Spyglass: A system for ontology based document retrieval and visualization

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication