CN1716253B - 检索数据的方法和装置 - Google Patents

检索数据的方法和装置 Download PDF

Info

Publication number
CN1716253B
CN1716253B CN 200510080426 CN200510080426A CN1716253B CN 1716253 B CN1716253 B CN 1716253B CN 200510080426 CN200510080426 CN 200510080426 CN 200510080426 A CN200510080426 A CN 200510080426A CN 1716253 B CN1716253 B CN 1716253B
Authority
CN
China
Prior art keywords
search
data
search key
database
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 200510080426
Other languages
English (en)
Other versions
CN1716253A (zh
Inventor
后藤妙子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2004217369A external-priority patent/JP2006039847A/ja
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN1716253A publication Critical patent/CN1716253A/zh
Application granted granted Critical
Publication of CN1716253B publication Critical patent/CN1716253B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明提供一种检索数据的方法和装置。该检索数据的方法包括:显示步骤,该显示步骤显示包括多个属性的数据;第一选择步骤,该第一选择步骤从所显示的数据中选择数据段,作为搜索关键字;确定步骤,该确定步骤确定搜索关键字的属性;以及搜索步骤,该搜索步骤通过对应于所确定的搜索关键字的属性的搜索方法来搜索数据库。

Description

检索数据的方法和装置
技术领域
本发明涉及一种用于数据检索操作的方法、装置和程序。
背景技术
当前的多功能外设(MFP)在功能上越来越完善。具体地,既能复印和打印、又能扫描和传真的MFP目前是主流。作为办公室中纸件信息和电子数据的输入和输出端口,这种MFP起着重要作用。
特别是,MFP的扫描功能允许将纸件形式的大量文档高效转换为电子数据。因此,通过快速扫描文档、并将所产生的数据存储到网络上的数据库或包含在MFP中的数据库中而进行的文档管理越来越多。(以下,将通过扫描将纸件文档转换为电子形式而产生的数据称为“文档图像”)。
由于个人计算机(PC)的普及,创建文档通常通过在PC上使用应用程序来实现。(以下,将通过使用应用程序而创建的电子文档称为“电子文档”。)
与打印在纸张上的文档相比,文档图像和电子文档的优点在于:可以重新编辑和重新使用数据,可以容易地由很多人来共享数据,数据不随时间而退化,等等。另一方面,纸件文档具有易于阅读和处理、携带方便、直观易懂等优点。因此,在很多情况下,需要将电子文档或文档图像以纸件形式输出,以高效使用。
还经常发生与纸件文档相同或相似的文档图像或电子文档被要求重新编辑或重新使用数据的情况。
这些情况的例子包括:需要根据在会议上分发的纸件材料来创建新材料的情况;以及因为纸件文档被部分损坏而需要打印出原始数据的情况。然而在目前的条件下,在多数情况下,需要材料的人必须联系准备材料的另一个人,以接收材料的电子文档。换句话说,在多数情况下,不联系其他人就不能获得电子文件。这损害了重复使用文档的便利性。
因此,需要一种由纸件文档来快速检索文档图像或电子文档,以高效执行文档管理的技术。
一般来说,办公室和家庭中的文档包括文本、照片、图形、表、或其组合。当这类文档信息被存储在数据库中时,可能的检索方法的例子包括以下方法:
1、通过作为搜索关键字的单词或短语来检索相关数据;
2、以图像特征量作为搜索关键字,通过图像特征量来检索相似的图像数据;和
3、将添加到文档图像中的信息设置为搜索关键字,检索包含该信息的数据。
搜索关键字表示用作信息检索索引的单词、短语、图形等的数字数据。
为了进行部分数据检索,将文档图像中的照片、文本等分割的区域设置为搜索关键字。
日本特开2002-297610公开了一种检索技术,该检索技术通过确定对应于图像中的一个或多个用户指定区域的逻辑运算符来进行。
日本特开平10-289251公开了一种检索方法,包括以下步骤:准备以图形方式表示存储在数据库中的各个数据集的关键字图标;显示搜索条件设置窗口;以及将至少一个关键字图标放入搜索条件设置窗口,以设置搜索条件.
对于搜索包括多个属性的数据,最佳搜索方法随属性的不同而不同。因此,检索操作变得复杂且困难,导致对于缺乏计算机操作经验的用户而言,一系列的数据检索操作变得过于繁重。因此,需要一种简化这些操作的技术。
发明内容
本发明的目的在于提供一种简化搜索数据操作的技术。
在本发明的第一方面中,提供一种从数据库中检索数据的方法,该方法包括:显示步骤,该显示步骤显示包括多个属性的数据;第一选择步骤,该第一选择步骤从所显示的数据中选择第一数据片断和第二数据片断,其中,所述第一数据片断用作第一搜索关键字,所述第二数据片断用作第二搜索关键字;确定步骤,该确定步骤确定所述第一搜索关键字的第一属性和所述第二搜索关键字的第二属性;以及搜索步骤,该搜索步骤使用与所述第一搜索关键字的所述第一属性相对应的第一搜索方法和与所述第二搜索关键字的所述第二属性相对应的第二搜索方法,搜索至少一个数据库,其中,所述第一属性包括由所显示的文本所表示的数据,所述第二属性包括由所显示的非文本所表示的数据。使用搜索关键字和逻辑运算符来创建搜索表达式。根据搜索表达式输出由多个搜索方法获得的结果。
设置搜索表达式和逻辑运算符的处理得到了简化。具体而言,当通过指向操作从包括多个属性的、所显示的数据中选择作为搜索关键字的数据段时,然后,根据指向操作设置搜索表达式。当指向操作画出指定路径时,通过遵循预定规则而识别出所选择的指定逻辑运算符。
根据本发明的第二方面,提供一种从数据库中检索数据的装置,该装置包括:显示单元,其显示包括多个属性的数据;选择单元,其从所显示的数据中选择第一数据片断和第二数据片断,其中,所述第一数据片断用作第一搜索关键字,所述第二数据片断用作第二搜索关键字;确定单元,其确定所述第一搜索关键字的第一属性和第二搜索关键字的第二属性;以及搜索单元,其使用与所述第一搜索关键字的所述第一属性相对应的第一搜索方法以及与所述第二搜索关键字的所述第二属性相对应的第二搜索方法,来搜索至少一个数据库,其中,所述第一属性包括由所显示的文本所表示的数据,所述第二属性包括由所显示的非文本所表示的数据。
通过以下参考附图给出的典型实施例的说明,本发明的其它特征将变得显而易见。
附图说明
图1是根据本发明实施例的检索数据的装置的方框图。
图2是根据第一实施例的检索数据的方法的流程图。
图3示出了根据第一实施例的检索图像的区域分割。
图4示出了根据第一实施例对搜索关键字和逻辑运算符的选择。
图5示出了根据第一实施例在屏幕上的可视化搜索表达式和搜索方法的确定。
图6示出了根据第一实施例对要搜索的数据库的选择。
图7示出了根据第一实施例的搜索结果的例子。
图8是根据第三实施例的检索数据的方法的流程图。
图9是根据第三实施例,在屏幕上的可视化搜索表达式和搜索方法的确定。
图10是根据第五实施例的检索数据的方法的流程图。
图11是根据第七实施例的检索数据的方法的流程图。
图12示出了根据第九实施例对搜索关键字区域和逻辑运算符的选择,以及搜索表达式的可视化。
图13示出了根据第九实施例对搜索关键字区域和逻辑运算符的选择,以及搜索表达式的可视化。
图14示出了根据第十实施例对搜索关键字区域和逻辑运算符的选择,以及搜索表达式的可视化。
图15示出了根据第十实施例对搜索关键字区域和逻辑运算符的选择,以及搜索表达式的可视化。
具体实施方式
下面参考附图来说明本发明的实施例。
第一实施例
图1是实现本发明实施例的数据检索装置的方框图。中央处理单元(CPU)101根据存储在只读存储器(ROM)102中的程序来控制该装置的整个系统。ROM 102存储通过CPU 101执行的、用来控制该装置的一个或多个程序,包括用来执行下述流程图所示的处理的程序。随机访问存储器(RAM)103存储文档图像等。外部存储单元104是例如磁盘。数据显示单元105是例如显示器。指示(pointing)装置106是例如鼠标、轨迹球(trackball)、液晶触摸板上使用的笔形装置。数据输入单元107是例如图像扫描仪。
本发明也可在通常的计算机中实施。在这种情况下,由介质等提供的控制程序可以存储在外部存储单元104中,并且CPU 101可响应于来自用户的指令而执行该控制程序。网络接口(I/F)109能与远程装置(未示出)进行通信,从而允许读取和写入程序和数据。这些部件通过无线或有线通信进行连接。数据输出单元108,例如打印机,可以连接到该系统。数据显示单元105、数据输入单元107、数据输出单元108等可以通过它们之间的接口连接到该系统。
图2是根据第一实施例的检索数据的方法的流程图。参考图2来说明本实施例的处理。在步骤S201,用户输入要检索数据的检索图像。在本实施例中,从图1所示的数据输入单元(图像扫描仪)107等输入检索图像。然而,检索图像可以是任意数据,只要其包括多个属性即可。可以从其它终端输入检索图像。检索图像也可以是终端上存在的数据。
在步骤S202,根据属性将检索图像分割成区域.这里的词语“属性”表示区域的特征的类型名称.属性由文本、照片、表、图形等来表示.参考图3说明该处理.文档图像301是在步骤S201中输入的检索图像.如图4所示,该图像以这样的方式显示给用户:使该图像显示在屏幕上,以进行数据显示单元105的搜索操作.基于从文档图像301中抽出的各个特征的量,根据各个属性,将文档图像301分成区域302、303、和304.区域分割技术在例如美国专利No.5,680,478(已转让给佳能株式会社)中公开.在该公开技术中,抽出文档图像中的黑(blackened)像素块和白像素块的集合,并且根据例如形状、尺寸、以及集合状态等的特征量,从文档图像中抽出区域,该区域具有特征名称,例如文本、图片、表、边框、线等.文档图像301被分成照片区域302、文本区域303、和表区域304.进行可视化,以使在作为检索图像的、被分割的文档图像301中的区域,根据其属性具有互相不同的边框颜色,从而使用户能容易地识别区域.
在步骤S203,从在上一步产生的区域中选择搜索范围(area),并且选择逻辑运算符,从而创建搜索表达式。参考图4来说明该处理。指定一个或多个用户要通过其执行搜索的搜索关键字。每个搜索关键字可以通过操作来指定,例如:使用指示装置106围住所需的范围,使用指示装置106指向所需的范围等。在图4中,指示装置指向了区域401-1。换句话说,由将图像分为区域的处理而产生的区域被设置为搜索关键字。搜索关键字不仅可以从一个文档图像中、也可以从多个文档图像中选择。下述实施例采用同样的操作。接下来,由指示装置指向所指定的搜索关键字,并将其拖放到搜索字段403的框(box)中。在图4中,鼠标指针在画出路径402的同时,移动到表示“AND(与)”逻辑运算符的AND框404。区域的范围可被设为搜索关键字,如范围404-2所示。在这种情况下,通过使用指示装置围住目标范围来选择目标区域,由指示装置指向该范围,并将该范围拖放到搜索字段403的框中。可以选择多个搜索关键字。可以使用逻辑运算符的组合。通过上述操作,创建搜索表达式。当选择搜索按钮405(例如,通过使用指示装置点击该按钮)时,处理移至下一步骤(步骤S204),以便将数据显示单元(例如数据显示单元105)的屏幕切换到图5所示的屏幕。
在步骤S204,显示在上一步骤中选择的搜索关键字和逻辑运算符。在步骤S205,为每个搜索关键字选择搜索方法。在图5中,屏幕501显示搜索表达式。以搜索关键字缩略图502和503来示出在步骤S203中选择的搜索关键字。以逻辑运算符504来示出在步骤S203中选择的逻辑运算符。菜单505和506示出搜索方法。通过使用这些菜单,用户能够为每个搜索关键字选择合适的搜索方法。例如,如果选择图像作为搜索关键字,则可能的选项为:根据关键字的特征量来检索相似图像的相似图像搜索法、以及搜索对应于搜索关键字的关键字的关键字搜索法。例如,如果选择字符作为搜索关键字,则可能的选项为:将搜索关键字(字符)识别为图像的相似图像搜索法、以及搜索从搜索关键字的OCR处理中获得的关键字的光学字符识别(OCR)搜索法。用户为每个搜索关键字选择合适的搜索方法。图5中的屏幕501示出:对搜索关键字缩略图502执行相似图像搜索;对搜索关键字缩略图503执行OCR搜索,该OCR搜索从由OCR处理而获得的文本中执行关键字搜索;以及搜索条件是两个搜索操作的结果的逻辑积。相似图像搜索技术在例如日本特开平10-260983中公开。在该公开技术中,通过吸收因为图像角度、或目标位置、或摄影条件的变化而引起的图像特征量中的一些差异,可以在确保一定程度的模糊度的同时,执行适当的图像搜索。通过使用指示装置选择后退按钮508,将数据显示单元(例如,数据显示单元105)的屏幕切换到图4所示的屏幕。在为每个搜索关键字选择了搜索方法后,当使用指示装置选择下一步按钮507时,处理移至下一步骤,以便将数据显示单元(例如,数据显示单元105)的搜索操作的屏幕切换到图6所示的屏幕。
在步骤S206,选择要搜索的数据库.参考图6来说明该处理.在图6中,屏幕601显示搜索操作可用的数据库602.屏幕601可以显示详细信息,例如数据库的位置.通过使用指示装置来指向任意复选框603,选择要搜索的数据库.通过使用指示装置选择后退按钮604,将数据显示单元(例如,数据显示单元105)的屏幕切换到图5所示的屏幕.搜索按钮605用于开始搜索操作.在使用指示装置选择了搜索按钮605时,处理移至下一步骤.在图6的屏幕601中,选择了数据库DB1、DB2、和DB3(如相关复选框603中的选中记号所示).
在步骤S207,使用搜索表达式搜索每个数据库。数据库可以存储在外部存储单元104、或通过网络I/F 109的远程装置(未示出)上。数据库中含有预先存储的电子文档和文档图像。作为搜索索引,添加与根据属性将电子文档和文档图像分成的区域有关的信息的元数据(例如,具有树结构的结构文档)。通过按下搜索按钮605,以为每个搜索关键字确定的搜索方法来执行搜索操作,从而产生搜索结果。如果设置了多个搜索关键字,则对各个搜索结果进行逻辑运算。在本实施例中,使用下面的条件在步骤S205和S206中创建搜索表达式:
搜索关键字和搜索方法
搜索1:
搜索关键字/图5中的搜索关键字图像502
搜索方法/相似图像搜索
搜索2:
搜索关键字/图5中的搜索关键字图像503
搜索方法/OCR搜索,其搜索从由OCR处理而产生的文本数据中获得的关键字
逻辑表达式
搜索1和搜索2的逻辑积
要搜索的数据库
三个数据库DB1、DB2、和DB3。
在步骤S208,显示和输出在步骤S207中产生的搜索结果。参考图7来说明该处理。屏幕701显示在步骤S207中产生的搜索结果。在本实施例中,检索并显示与搜索关键字图像502相似、且具有通过字符识别搜索关键字图像503而产生的关键字的数据。检索到的文档图像和电子文档用缩略图702-1到702-4来表示。缩略图702-1是第一候选(prime candidate),其包括与搜索关键字图像502相似的图像,且具有由搜索关键字图像503的字符识别而得到的标题“太阳”。
缩略图702是第二候选,其包括与搜索关键字图像502相似的图像,且具有包含单词“太阳”的名称.但是,缩略图702-2不如缩略图702-1(第一候选)相似.缩略图702-3是第三候选,其与搜索关键字图像502相似,且具有与包括单词“太阳”的数据相关的关键字.但是,缩略图702-3不如第一缩略图702-1和第二缩略图702-2相似.缩略图702-4是第四候选.该缩略图702-4包括与搜索关键字图像502相似的图像,且图像中的文本区域的字符识别的结果包括单词“太阳”.一般来说,通过从图像中抽出颜色、形状等特征量,并将所抽出的特征量与检索图像的特征量进行比较,来实现相似图像搜索.因此,相似图像搜索不依赖于文件大小或分辨率.因此,如图7所示,搜索结果可以包括不同尺寸的图像.信息703表示候选数据集合702-1到702-4的详细信息.该详细信息包括数据集合的标题、和存储该数据集合的数据库名称.可以通过使用指示装置指向单选按钮704来选择和撤消选择数据集合.打印按钮705用来进行打印.通过使用指示装置选择打印按钮705,将所选择的数据集合输出到数据输出单元(例如,打印机).放大按钮706用来显示放大后的数据.当使用指示装置选择了放大按钮706时,数据显示单元(例如,数据显示单元105)的屏幕被切换到显示放大后的所选数据集合的屏幕.通过使用指示装置指向后退按钮707,数据显示单元(例如,数据显示单元105)的屏幕被切换到图6所示的屏幕.
第二实施例
在第一实施例中,对于每个搜索关键字,选择了单个搜索方法。但是,对于每个搜索关键字,可以选择多个搜索方法。具体而言,第一实施例和第二实施例的比较如下:
第一实施例中的搜索关键字和搜索方法
搜索1:
搜索关键字/图5中的搜索关键字图像502
搜索方法/相似图像搜索
搜索2:
搜索关键字/图5中的搜索关键字图像503
搜索方法/OCR搜索,其搜索从由OCR处理而产生的文本数据中获得的关键字
第二实施例中的搜索关键字和搜索方法
搜索1:
搜索关键字/图5中的搜索关键字图像502
搜索方法/相似图像搜索
搜索1’:
搜索关键字/图5中的搜索关键字图像502
搜索方法/根据添加到图像中的关键字进行关键字搜索
搜索2:
搜索关键字/图5中的搜索关键字图像503
搜索方法/OCR搜索,其搜索从由OCR处理而产生的文本数据中获得的关键字
如上所述,可以为单个搜索关键字图像502选择两种搜索方法。搜索结果被合并,并与第一实施例相同,输出合并后的结果。
第三实施例
在第一实施例中,每当执行搜索操作时,由用户为每个搜索关键字选择搜索方法。在这种情况下,当多次执行搜索操作时,选择搜索方法的操作是多余的。在第三实施例中,可以使用缺省搜索方法。参考图8的流程图来说明该处理。
在步骤S801,从数据输入单元(图像扫描仪)107等输入检索图像。
在步骤S802,根据属性将检索图像分成区域。这里的术语“属性”表示区域的特征的类型的名称。该属性以文本、照片、表、图形等来表示。
在步骤S803,从在上一步骤产生的区域中选择一个或多个搜索关键字范围,并且选择相应的逻辑运算符,从而创建搜索表达式。
在步骤S804,显示在上一步骤中选择的搜索关键字和逻辑运算符。
在步骤S805,用户选择是否为每个搜索关键字选择搜索方法的高级设置。如果选择了高级设置,则处理移至步骤S806。如果未选择,则处理移至步骤S807。
在步骤S806,用户为每个搜索关键字选择搜索方法。
在步骤S807,对每个属性使用缺省的搜索方法。
在步骤S808,(在选择了搜索方法(步骤S806)或使用缺省搜索方法(步骤S807)之后)选择一个或多个要搜索的数据库。
在步骤S809,使用搜索表达式搜索每个数据库。数据库可以存储在外部存储单元104、或通过网络I/F 109的远程装置(未示出)上。
在步骤S810,显示和输出在步骤S809中产生的搜索结果。
参考图9来说明步骤S805、S806、和S807的处理。
在第一实施例中,用户为每个搜索关键字选择搜索方法。在第三实施例中,预先选择了每个属性的搜索方法,并且所选择的方法被设置为缺省方法。通过按下开始搜索按钮906,处理移至步骤S808。如图5所示,通过按下按钮905“对搜索方法使用高级设置”,用户可以为每个搜索关键字选择搜索方法。
第四实施例
在第三实施例中,为每个属性选择单个搜索方法,并将所选择的搜索方法用作缺省方法。但是,与第二实施例类似,可以为每个属性选择多个搜索方法。
第五实施例
在第一实施例中,在根据属性将整个检索图像分成区域后,创建搜索表达式。如果用于搜索操作的搜索关键字是整个检索图像的一部分,则这种区域分割处理是多余的。参考图10的流程图来说明第五实施例的处理。
在步骤S1001,从数据输入单元(图像扫描仪)107等输入检索图像。
在步骤S1002,指定一个或多个搜索关键字。通过使用指示装置选择矩形的搜索关键字范围,可以从在步骤S1001输入的检索图像中选择每个搜索关键字。可以跨越不同的属性来选择搜索关键字范围。
在步骤S1003,根据属性来分割所选择的搜索关键字范围。这里的术语“属性”表示区域的特征的类型名称。该属性以文本、照片、表、图形等表示。
在步骤S1004,选择逻辑运算符。
在步骤S1005,显示所选择的搜索关键字和所选择的逻辑运算符。
在步骤S1006,用户为每个搜索关键字选择搜索方法。
在步骤S1007,选择一个或多个要搜索的数据库。
在步骤S1008,使用由搜索关键字和逻辑运算符创建的搜索表达式来搜索每个数据库。数据库可以存储在外部存储单元104、或通过网络I/F 109的远程装置(未示出)上。
在步骤S1009,显示和输出在步骤S1008中产生的搜索结果。
第六实施例
在第五实施例中,为每个搜索关键字选择单个搜索方法。但是,与第二实施例类似,可以对每个搜索关键字选择多个搜索方法。
第七实施例
在第五实施例中,每当执行搜索操作时,由用户为每个搜索关键字来选择搜索方法。当多次执行搜索操作时,选择搜索方法的操作是多余的。因此,在第七实施例中,可以使用缺省搜索方法。参考图11的流程图来说明该处理。
在步骤S1101,从数据输入单元(图像扫描仪)107等输入检索图像。
在步骤S1102,选择一个或多个搜索关键字。通过使用指示装置选择矩形的搜索关键字范围,可以从在步骤S1101输入的检索图像中选择每个搜索关键字。可以跨越不同的属性来选择搜索关键字范围。
在步骤S1103,根据属性来分割所选择的搜索关键字。
在步骤S1104,选择逻辑运算符。
在步骤S1105,显示所选择的搜索关键字和所选择的逻辑运算符。
在步骤S1106,用户选择是否为每个搜索关键字选择搜索方法的高级设置。如果选择了高级设置,则处理移至步骤S1108。如果未选择,则处理移至步骤S1107。
在步骤S1107,对每个属性使用缺省搜索方法。
在步骤S1108,用户为每个搜索关键字选择搜索方法。
在步骤S1109,(在使用缺省搜索方法(步骤S1107)或选择了搜索方法(步骤S1108)之后)选择一个或多个要搜索的数据库。
在步骤S1110,使用从搜索关键字和逻辑运算符创建的搜索表达式来搜索每个数据库。数据库可以存储在外部存储单元104、或通过网络I/F 109的远程装置(未示出)上。
在步骤S1111,显示和输出在步骤S1110中产生的搜索结果。
第八实施例
在第七实施例中,对每个搜索关键字选择单个搜索方法。但是,与第二实施例类似,可以对每个搜索关键字选择多个搜索方法。
第九实施例
在第二实施例中,选择逻辑运算符以创建搜索表达式是通过将搜索关键字拖放到表示逻辑运算符的框中来实现的。但是,通过移动任何所准备的、表示逻辑运算符的按钮,以将按钮与搜索关键字排列在一起,可以创建搜索表达式。此外,图5所示的用于选中搜索表达式的屏幕和图6所示的用于选择数据库的屏幕,可以一起显示在同一屏幕上。
参考图12来说明该处理。图12示出了用于从检索图像中创建搜索表达式和用于显示所创建的表达式的屏幕。首先,指定搜索关键字范围。例如,通过使用指示装置围住所需的范围、使用指示装置指向所需的范围、或者使用指向装置点击所需的范围,可以指定搜索关键字范围。还可以通过移动指示装置来指定搜索关键字范围。
在图12中,范围1201和1202是搜索关键字范围的候选。接着,执行搜索关键字范围的登录(entry)操作。具体地,通过指示装置指向每个指定的搜索关键字范围,并将其拖放到搜索字段1203中。搜索关键字范围可被识别为具有一个属性的整个数据、或由通过使用指示装置的方法而指定的数据段。
登录逻辑运算符的处理与搜索关键字范围的处理相同.将逻辑运算符按钮1205、1206、和1207中的任一个拖放到搜索字段1203中.在图12中,在鼠标指针画出一条路径1208的同时,“AND”按钮1205被拖放到搜索字段1203中.通过拖到搜索字段1203中而登录的搜索关键字范围的登录,可以通过选择删除该项目选项1212例如复选框、并按下删除按钮1209来取消.为了根据搜索关键字范围的属性来执行搜索方法的高级设置,用户通过按下图12中的“高级设置”按钮1210来调用高级设置(如图13所示)的屏幕.在图13所示的高级设置屏幕中,例如通过使用菜单1301来进行选择,用户选择搜索方法,例如相似图像搜索、OCR搜索等.然后,通过使用指示装置选择开始搜索按钮1211(图12)或1302来执行搜索操作.
第十实施例
在第一和第九实施例中,通过使用指示装置将搜索关键字范围拖动到搜索字段中,来创建搜索表达式。在第十实施例中,创建搜索表达式,而不使用拖动到搜索字段的操作。在例如数据显示单元105较小时,这是有效的。
参考图14来说明本实施例中的步骤S203(图2)。通过指示装置的动作(移动),指定搜索关键字范围。该动作的例子包括:使用指示装置围住所需的范围、使用指示装置指向所需的范围、使用指示装置点击所需的范围、或者移动指示装置。
在图14中,范围1401和1403被选为搜索关键字范围。使用指示装置106画出路径1402。通过指示装置所指向的位置、或通过指示装置所画出的路径,选择与其相关的逻辑运算符和搜索关键字范围。为了选择逻辑运算符,预先设置根据路径来指定逻辑运算符的规则。例如,将圆路径指定为逻辑运算符“AND”。通过在所选择的搜索关键字范围上操作指示装置来画出相关的路径,来确定逻辑运算符。可以同时执行选择搜索关键字范围和画出路径的操作。逻辑运算符“OR(或)”和“NOT(非)”与各自的路径相关。可以通过其它操作来确定逻辑运算符。例如,可以通过指示装置的点击次数、或指示装置的任意事件来确定逻辑运算符。
参考图14来说明本实施例中的步骤S204(图2)。可视化在步骤S203中创建的搜索表达式。用户所需的搜索表达式不处理而直接显示在设置搜索表达式屏幕1404上。所选择的搜索关键字范围的边框颜色或背景颜色可根据所选择的逻辑运算符而变化,以区分所选择的搜索关键字范围。例如,图14表示要执行搜索关键字范围1401和1403的“AND”搜索操作的情况。在这种情况下,搜索关键字范围1401和1403具有对应于“AND”搜索的背景颜色。在屏幕1404上显示所选择的搜索关键字范围的缩略图和所选择的逻辑运算符,使缩略图保持有关背景颜色的信息。通过选择菜单1405并按下删除按钮1406,可以取消已登录的搜索关键字。
为了选择每个搜索关键字范围的高级设置,用户通过按下高级设置按钮1407来调用用于搜索表达式的高级设置(图15所示)的屏幕,并选择菜单1501等。然后,通过使用指示装置指向开始搜索按钮1408或1502来执行搜索操作。
第十一实施例
在第一到第十实施例中,检索图像是由电子文档转换而成的文档图像。但是,检索图像可以是对由用户手写图像而成的、要检索的文档进行转换而得到的文档图像。
第十二实施例
在第十一实施例中,扫描文档以形成文档图像,该文档图像被分成区域,然后指定搜索关键字。可替代地,可以将用户直接写在触摸屏(touch panel)上的信息用作搜索关键字。
如上所述,根据第一到第十二实施例,即使当用户不考虑图像的属性时,也能输出最佳搜索结果。
本发明可以这样来实现:向系统或装置提供存储有用于实现上述实施例的特征的程序代码的存储介质,由该系统或装置中的计算机(CPU或MPU(微处理单元))读出并执行存储在存储介质中的程序代码.
在这种情况下,从存储介质上读出的程序代码实现实施例的特征。
用于提供这种程序代码的存储介质的例子包括:软盘、硬盘、磁光盘(MO)、光盘只读存储器(CD-ROM)、CD-可记录(CD-R)、CD-可重写(CD-RW)、数字通用盘ROM(DVD-ROM)、DVD-RAM、DVD-RW、DVD+RM、磁带、非易失性存储卡、以及ROM。
除了执行由计算机读出的程序代码外,运行在计算机上的操作系统(OS)根据程序代码的指令执行部分或全部实际处理,从而实现上述实施例的特征。
此外,将从存储介质中读出的程序代码写入插在计算机的功能扩展板或连接到计算机的功能扩展单元上的存储器中,包含在该功能扩展板或功能扩展单元中的CPU根据程序的指令执行部分或全部实际处理,从而实现上述实施例的特征。
尽管参考典型实施例对本发明进行了说明,但应该理解,本发明不局限于所公开的实施例。相反,本发明旨在覆盖在权利要求的精神和范围内的各种修改和等同结构。以下权利要求的范围应以最宽的范围来解释,来覆盖所有这种修改和等同结构和功能。

Claims (10)

1.一种从数据库中检索数据的方法,包括:
显示步骤,该显示步骤显示包括多个属性的数据;
第一选择步骤,该第一选择步骤从所显示的数据中选择第一数据片断和第二数据片断,其中,所述第一数据片断用作第一搜索关键字,所述第二数据片断用作第二搜索关键字;
确定步骤,该确定步骤确定所述第一搜索关键字的第一属性和所述第二搜索关键字的第二属性;以及
搜索步骤,该搜索步骤使用与所述第一搜索关键字的所述第一属性相对应的第一搜索方法和与所述第二搜索关键字的所述第二属性相对应的第二搜索方法,搜索至少一个数据库,
其中,所述第一属性包括由所显示的文本所表示的数据,所述第二属性包括由所显示的非文本所表示的数据。
2.根据权利要求1所述的从数据库中检索数据的方法,其特征在于:所显示的数据包括由图像读取单元读取的数据。
3.根据权利要求1所述的从数据库中检索数据的方法,其特征在于:在搜索步骤中,能在屏幕上选择要搜索的所述至少一个数据库。
4.根据权利要求1所述的从数据库中检索数据的方法,其特征在于:能通过用户使用指示装置来执行第一选择步骤。
5.根据权利要求1所述的从数据库中检索数据的方法,其特征在于:该方法进一步包括使用所述第一搜索关键字、所述第二搜索关键字和逻辑运算符来定义搜索表达式,其中,搜索步骤包括使用搜索表达式和所选择的搜索方法来搜索数据库。
6.根据权利要求4所述的从数据库中检索数据的方法,其特征在于:还包括输出步骤,该输出步骤根据搜索表达式来输出搜索结果,
其中,该搜索结果在搜索步骤中获得,并且该搜索结果是基于所述第一搜索方法和所述第二搜索方法二者的,其中所述第一搜索方法不同于所述第二搜索方法。
7.根据权利要求5所述的从数据库中检索数据的方法,其特征在于:在定义步骤中,根据画出不同路径的指向操作来设置不同的逻辑运算符。
8.根据权利要求7所述的从数据库中检索数据的方法,其特征在于:指向操作是拖放操作或者画路径操作。
9.根据权利要求7所述的从数据库中检索数据的方法,其特征在于:指向操作是指示装置在显示屏和触摸屏之一上的移动。
10.一种从数据库中检索数据的装置,包括:
显示单元,其显示包括多个属性的数据;
选择单元,其从所显示的数据中选择第一数据片断和第二数据片断,其中,所述第一数据片断用作第一搜索关键字,所述第二数据片断用作第二搜索关键字;
确定单元,其确定所述第一搜索关键字的第一属性和第二搜索关键字的第二属性;以及
搜索单元,其使用与所述第一搜索关键字的所述第一属性相对应的第一搜索方法以及与所述第二搜索关键字的所述第二属性相对应的第二搜索方法,来搜索至少一个数据库,
其中,所述第一属性包括由所显示的文本所表示的数据,所述第二属性包括由所显示的非文本所表示的数据。
CN 200510080426 2004-07-02 2005-07-01 检索数据的方法和装置 Expired - Fee Related CN1716253B (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2004196454A JP2006018630A (ja) 2004-07-02 2004-07-02 データ検索方法及び装置、プログラム、コンピュータ可読メモリ
JP2004196454 2004-07-02
JP2004-196454 2004-07-02
JP2004217369A JP2006039847A (ja) 2004-07-26 2004-07-26 データ検索方法及び装置、プログラム、可読メモリ
JP2004217369 2004-07-26
JP2004-217369 2004-07-26

Publications (2)

Publication Number Publication Date
CN1716253A CN1716253A (zh) 2006-01-04
CN1716253B true CN1716253B (zh) 2010-05-05

Family

ID=35792840

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200510080426 Expired - Fee Related CN1716253B (zh) 2004-07-02 2005-07-01 检索数据的方法和装置

Country Status (2)

Country Link
JP (1) JP2006018630A (zh)
CN (1) CN1716253B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8726178B2 (en) 2006-11-10 2014-05-13 Ricoh Company, Ltd. Device, method, and computer program product for information retrieval
JP5223284B2 (ja) * 2006-11-10 2013-06-26 株式会社リコー 情報検索装置、方法およびプログラム
KR100886767B1 (ko) * 2006-12-29 2009-03-04 엔에이치엔(주) 지유아이 검색 서비스 제공 방법 및 시스템
JP5167821B2 (ja) * 2008-01-11 2013-03-21 株式会社リコー 文書検索装置、文書検索方法及び文書検索プログラム
US9773033B2 (en) * 2009-05-22 2017-09-26 International Business Machines Corporation Storing and retrieving volumes in a database by volume attributes
JP5444137B2 (ja) * 2010-06-18 2014-03-19 株式会社東芝 顔画像検索装置および顔画像検索方法
EP2678774A4 (en) * 2011-02-24 2015-04-08 Lexisnexis Division Of Reed Elsevier Inc METHOD FOR ELECTRONIC DOCUMENT SEARCHING AND GRAPHICAL DISPLAY OF THE ELECTRONIC DOCUMENT SEARCH
US8553981B2 (en) * 2011-05-17 2013-10-08 Microsoft Corporation Gesture-based visual search
JP2015099567A (ja) * 2013-11-20 2015-05-28 株式会社東芝 検索装置、方法及びプログラム
CN103823898A (zh) * 2014-03-14 2014-05-28 联想(北京)有限公司 一种数据处理方法、装置及电子设备
CN104376100B (zh) * 2014-11-25 2018-12-18 北京智谷睿拓技术服务有限公司 搜索方法及装置
CN106372068A (zh) * 2015-07-20 2017-02-01 中兴通讯股份有限公司 一种图像查找方法及装置、终端
CN106527912B (zh) * 2016-10-28 2019-10-15 山东大学 一种基于Voronoi树图的信息检索可视化系统及方法
CN107767922A (zh) * 2017-10-25 2018-03-06 医渡云(北京)技术有限公司 医疗数据纳排方法及装置、电子设备、存储介质
CN110851459B (zh) * 2018-07-25 2021-08-13 上海柯林布瑞信息技术有限公司 一种搜索方法及装置、存储介质、服务器
JP7363188B2 (ja) * 2019-08-21 2023-10-18 京セラドキュメントソリューションズ株式会社 画像読取装置及び画像形成装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10209230A (ja) * 1997-01-23 1998-08-07 Hitachi Ltd 不良解析装置およびその方法
JPH10340272A (ja) * 1997-06-09 1998-12-22 Toshiba Corp 類似画像検索装置及び方法
JP2002342355A (ja) * 2001-05-16 2002-11-29 Ricoh Co Ltd 新聞発行日確認方法
JP2002222208A (ja) * 2001-06-19 2002-08-09 Hitachi Ltd 文書検索システム、文書検索方法及び検索サーバ
JP2003108580A (ja) * 2001-09-27 2003-04-11 Mitsubishi Electric Corp 音声情報提供システム及びこの音声情報提供システムを用いた音声情報提供事業
JP2003141125A (ja) * 2001-11-07 2003-05-16 Nec Corp マルチメディア情報統合検索装置およびその方法

Also Published As

Publication number Publication date
JP2006018630A (ja) 2006-01-19
CN1716253A (zh) 2006-01-04

Similar Documents

Publication Publication Date Title
CN1716253B (zh) 检索数据的方法和装置
US7610274B2 (en) Method, apparatus, and program for retrieving data
CN100476859C (zh) 从像素的文档图像中提取元数据的方法和装置
US7930634B2 (en) Document display apparatus and document display program
US6208340B1 (en) Graphical user interface including a drop-down widget that permits a plurality of choices to be selected in response to a single selection of the drop-down widget
US6353442B1 (en) Information processing apparatus, information processing method, and providing medium
US6356923B1 (en) Document information management system
US6683600B1 (en) Adaptive input pen mode selection
US20020091700A1 (en) Unique architecture for handheld computers
JP2007286864A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP2007317034A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
US20080184285A1 (en) Multi-selection apparatus and method
JP2008152585A (ja) 表示画像制御装置及びその制御方法
US6288732B1 (en) Information processor
KR100750122B1 (ko) 인쇄 옵션 설정 방법 및 장치
US20070168865A1 (en) Operation screen generating method, display control apparatus, and computer-readable recording medium recording the same program
US20100185967A1 (en) Information Processing Device, and File Managing Method
JPH0563834B2 (zh)
JP4959501B2 (ja) 情報処理装置、情報処理方法、およびプログラム
CN100588218C (zh) 图像形成装置和电子邮件传送服务器
JP5330714B2 (ja) 検索支援装置、および検索支援プログラム
US11379100B2 (en) Information processing apparatus to reduce number of operations during transitioning of screen and non-transitory computer readable medium storing
JP6459470B2 (ja) 文書管理プログラム、方法及び文書管理装置
JP7401344B2 (ja) 文書を電子化する画像処理システム、その制御方法及びプログラム
JP2002259173A (ja) ファイル管理プログラム、ファイル管理プログラムを記録したコンピュータ読取可能な記録媒体、ファイル管理装置およびファイル管理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100505

Termination date: 20170701