CN101233511B - 检索设备和检索方法 - Google Patents

检索设备和检索方法 Download PDF

Info

Publication number
CN101233511B
CN101233511B CN2006800276513A CN200680027651A CN101233511B CN 101233511 B CN101233511 B CN 101233511B CN 2006800276513 A CN2006800276513 A CN 2006800276513A CN 200680027651 A CN200680027651 A CN 200680027651A CN 101233511 B CN101233511 B CN 101233511B
Authority
CN
China
Prior art keywords
image
retrieval
user
keyword
situation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2006800276513A
Other languages
English (en)
Other versions
CN101233511A (zh
Inventor
户高伸治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN101233511A publication Critical patent/CN101233511A/zh
Application granted granted Critical
Publication of CN101233511B publication Critical patent/CN101233511B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03GELECTROGRAPHY; ELECTROPHOTOGRAPHY; MAGNETOGRAPHY
    • G03G15/00Apparatus for electrographic processes using a charge pattern
    • G03G15/50Machine control of apparatus for electrographic processes using a charge pattern, e.g. regulating differents parts of the machine, multimode copiers, microprocessor control
    • G03G15/5016User-machine interface; Display panels; Control console
    • G03G15/502User-machine interface; Display panels; Control console relating to the structure of the control menu, e.g. pop-up menus, help screens
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03GELECTROGRAPHY; ELECTROPHOTOGRAPHY; MAGNETOGRAPHY
    • G03G15/00Apparatus for electrographic processes using a charge pattern
    • G03G15/50Machine control of apparatus for electrographic processes using a charge pattern, e.g. regulating differents parts of the machine, multimode copiers, microprocessor control
    • G03G15/5075Remote control machines, e.g. by a host
    • G03G15/5087Remote control machines, e.g. by a host for receiving image data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03GELECTROGRAPHY; ELECTROPHOTOGRAPHY; MAGNETOGRAPHY
    • G03G2215/00Apparatus for electrophotographic processes
    • G03G2215/00025Machine control, e.g. regulating different parts of the machine
    • G03G2215/00109Remote control of apparatus, e.g. by a host

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Control Or Security For Electrophotography (AREA)

Abstract

本发明的目的在于使用户能够容易而简单地指定或输入用作文档检索键的图像。即,检索设备读取文档图像(S7001)以获得图像数据,在图像数据中提取图像区域(S7004),以及在显示装置上显示与所提取的图像区域对应的图像的列表(S7008)。当用户经由输入装置选择列表中显示的至少一个图像时(S7009),使用所选择的图像作为检索键来执行检索(S7010)。

Description

检索设备和检索方法
技术领域
本发明涉及一种检索设备和检索方法。更具体地说,本发明涉及在使用具有存储由例如扫描仪读取的文档数据信息的功能的检索设备从所存储的文档数据当中检索目标文档数据的情况下,使用在文档数据中包含的图像数据作为检索键(search key)来检索目标文档数据的技术。 
背景技术
在最近的办公室环境中,随着工作变得复杂和信息量的增加,要管理的文档数据的量很大地增加。因此,甚至更为需要从大量的文档中检索目标文档。通过把多条文档信息转换成电子数据并作为文档数据来存储,文档检索设备或文档检索系统能够在检索目标文档时使用这个转换的信息。 
已经提出了各种文档检索方法,包括:文档属性检索,其检索与文档数据相关的信息(即,属性数据);全文检索,其检索在文档数据中包含的字符串;以及图像数据检索,其检索在文档数据中包含的图像数据。 
为了执行这些检索方法,需要向检索设备(检索引擎)输入检索键。与诸如属性检索或全文检索之类的使用字符串作为键的检索方法不同,使用图像数据作为键的图像检索的问题是如何使用户能够容易地并简单地指定或输入这种图像检索键。 
例如在专利参考文献1中所述的图像存储设备利用扫描仪扫描具有预先指定区域的文档来获得检索键。此外,在专利文献2中所述的图像存储设备通过如下方式来提取检索键:在窗口上显示利用扫描仪进行扫描而获得的文档数据,并利用例如鼠标指定要用作检索键的区 域。此外,在专利参考文献3中所述的一种类似图像检索设备预先登记要用作检索键的的图像数据,并在登记的图像数据当中指定检索键。 
专利参考文献1:日本专利特开5-274367号 
专利参考文献2:日本专利特开5-274368号 
专利参考文献3:日本专利特开10-340272号 
发明内容
本发明要解决的问题 
然而,在专利参考文献1中所述的图像存储设备中,为了指定要登记为检索键的区域,需要在原始文档中写入区域信息。此操作对于用户是麻烦的。此外,为了保持原始文档清洁,文档必须被复印。 
在专利参考文献2中,为了使用户能够指定作为键的区域,需要诸如笔设备或鼠标之类的操作装置来指定所述区域。诸如具有扫描仪仪功能、复印功能、以及打印机功能的多功能外围设备之类的OA装置通常没有这种操作装置。因而,必须新增加除了图像检索之外不使用的操作装置,并且该操作装置的附加位置或容纳方法产生新问题。此外,为了从足够大的显示区域提取多个检索键,用户必须进行多次麻烦的区域指定。 
在专利参考文献3所述的类似图像检索设备中,用户难于自由地选择要被记录为检索键的图像数据,因而,可能降低检索精度。 
本发明是考虑上述情况而作出的,其目的在于,使用户能够容易而简单地指定或输入作为检索键的图像数据。 
本发明的另一个目的在于,即使在文档数据的被限制的显示区域内,也使用户能够容易地指定或输入作为检索键的图像数据。 
用于解决问题的手段 
为实现上述目的,按照本发明的一个方面,提供一种用于根据预定检索键从多个存储的数据中检索所需数据的检索设备,其包括: 
读取装置,用于读取文档图像以获得图像数据; 
区域提取装置,用于提取在所述图像数据中的图像区域; 
显示装置,用于显示信息; 
输入装置,用于输入指令;以及 
列表显示装置,用于在所述显示装置上显示与由所述区域提取装置提取的图像区域对应的多个图像的列表; 
其中当所述输入装置选择在所述列表中显示的所述多个图像中的至少一个时,使用所选择的图像作为检索键来执行检索。 
为了实现上述目的,按照本发明的另一个方面,提供一种用于根据预定检索键从多个存储的数据中检索所需数据的检索方法,包括以下步骤: 
读取文档图像以获得图像数据; 
提取在所述图像数据中的图像区域; 
在用于显示信息的显示装置上显示与在所述区域提取步骤中提取的图像区域对应的图像的列表;以及 
当用于输入指令的输入装置选择在所述列表中显示的所述图像中的至少一个时,使用所选择的图像作为检索键来执行检索。 
即,在本发明中,用于根据预定检索键从存储的数据中检索数据的检索设备在通过读取文档图像而获得的图像数据中提取图像区域,在用于向用户显示信息的显示装置上显示与所提取的图像区域对应的图像的列表,当用户利用用于使用户输入指令的输入装置选择列表中显示的图像中的至少一个时,使用所选择的图像作为关键字来执行检索。 
这种配置提取文档中的图像,显示所提取的图像的列表,并使用由用户选择的图像作为检索键来执行检索。 
因而,用户可以容易而简单地指定或输入作为检索键的图像,增加了用户的便利性。 
发明效果 
按照本发明,检索设备提取文档中的图像作为图像数据,显示图 像数据的列表,并利用由用户从列表中显示的图像数据中选择的图像数据作为检索键来执行检索。 
因而,用户可以容易而简单地指定或输入作为检索键的图像数据,增加了用户的便利性。 
从下面的示例性实施例(参照附图)的描述可以清楚地看出本发明的其它特征。 
附图说明
包括在说明书中并构成说明书的一部分的附图与说明书一起用于例示本发明的实施例,用于解释本发明的原理。 
图1是用于解释按照本发明的实施例的文档检索设备的总体布置的方块图; 
图2是用于解释图1所示的文档检索设备的主单元的硬件配置的方块图; 
图3是表示按照本发明的文档检索设备的外观的视图; 
图4是表示按照本发明的文档检索设备的主单元的软件配置的方块图; 
图5是表示按照本发明的文档管理设备的软件配置的方块图; 
图6是表示在按照本发明的文档管理设备的检索处理中在操作单元上显示的窗口的转换示例的示意图; 
图7是表示在选择“图像检索”之后直到执行检索之前的、由按照本发明的文档管理设备的主单元执行的处理的流程图;以及 
图8是表示在选择“经由OCR的关键字检索”直到执行检索之前的、由按照本发明的文档管理设备的主单元执行的处理的流程图。 
具体实施方式
下面将参照附图详细说明本发明的优选实施例。注意,在下面实施例中的每个元件并不旨在限制本发明的范围,而仅仅作为示例。 
图1是用于解释按照本发明的实施例的文档检索设备的总体布置 的方块图。 
本实施例的文档检索设备1000包括:作为图像输入装置的扫描仪1002;作为图像输出装置的打印机1003;和作为用户接口单元的操作单元1004。设备1000还包括用于控制上述部分的主单元1001,以及具有用于存储、管理和检索文档数据的功能的文档管理系统1005。扫描仪1002、打印机1003和操作单元1004中的每一个通过相应接口经由内部总线(未示出)连接到主单元1001。 
主单元1001连接到诸如LAN 1010之类的网络传输装置和公共交换电话网1020。文档管理系统1005也连接到LAN1010,以便经由LAN1010与主单元1001传递数据和命令。代替在文档检索设备1000中提供文档管理系统1005,具有与文档管理系统1005相同功能的外部服务器可通过LAN 1010连接到文档检索设备1000的外部。 
本实施例的文档检索设备1000被配置为可由用户识别为一个设备。文档检索设备1000被设计为多功能外设(MFP),其不仅具有文档检索功能,而且具有复印功能、传真功能、打印机功能和文档存储功能。 
图2是用于解释图1所示的文档检索设备的主单元1001的硬件配置的方块图。图1中的标号1001对应于图2中的2000,1002对应于2070,1003对应于2080,1004对应于2050,1005对应于2060,1010对应于2020,1020对应于2010。 
参见图2,主单元2000是控制器,用于输入和/或输出文档数据、图像信息和装置信息。主单元2000通过与其相连的作为图像输入装置的扫描仪2070和作为图像输出装置的打印机2080实现扫描仪和打印机功能。主单元2000还通过LAN 2020与诸如文档管理系统2060或PC(未示出)之类的外部装置进行通信,从而实现存储、读取和检索文档的功能。主单元2000还连接到公共交换电话网(PSTN)2010,以实现传真功能。作为用户接口(UI)以对用户提供这些功能的操作单元2050连接到主单元2000。 
CPU 2001是用于控制整个主单元2000的控制器。RAM 2002是 用于操作CPU 2001的系统工作存储器。RAM 2002还用作用于暂时存储图像数据的图像存储器。ROM 2003是用于存储系统的引导程序的引导ROM。HDD 2004是硬盘驱动器,用于存储系统软件、图像数据、与图像数据相关的属性数据、以及其它用户数据。通过例如执行在HDD 2004中存储的系统软件来实现用于文档检索的操作规程(后面说明)。 
操作单元I/F 2006用作操作单元2050的接口单元,并向操作单元2050输出要在操作单元2050的显示装置6000上显示的图像数据。操作单元I/F 2006还向CPU 2001传送由用户通过操作单元2050输入的信息。 
网络2007连接到LAN 2020,以便从/向连接到LAN 2020的诸如文档管理系统2060或PC之类的外部装置输入/输出信息。文档检索设备1000支持作为网络通信协议的TCP/IP。文档管理系统2060也按照TCP/IP通信协议进行通信。 
MODEM 2008连接到公共交换电话网(PSTN)2010,以便利用传真功能把图像数据传递到设置在公共交换电话网2010上的传真设备(未示出)。上述这些装置被连接到系统总线2009。 
图像总线I/F 2005用作连接到系统总线2009和图像总线2030的总线桥,用于高速传输图像数据并转换数据结构。图像总线2030配置有PCI总线或IEEE1394总线。 
以下装置被布置在图像总线2030上。光栅图像处理器(RIP)2031把从例如连接到LAN 2020的PC输入的PDL代码光栅化为位图图像。装置I/F 2032把作为图像输入/输出装置的扫描仪2070和打印机2080连接到主单元控制器2000,并转换图像数据的同步/异步系统。 
扫描仪图像处理单元2033校正、操纵和编辑来自扫描仪2070的图像数据。扫描仪图像处理单元2033具有根据图像数据的颜色信号分量确定输入的图像数据是彩色图像还是单色图像并保持该确定结果的功能。 
打印机图像处理单元2034校正、操纵和编辑由打印机2080输出 的图像数据。图像旋转单元2035与扫描仪图像处理单元2033协同操作,在读取的同时旋转由扫描仪2070读取的图像数据,并把该图像数据存储在RAM 2002中。图像旋转单元2035还旋转在RAM 2002中的图像数据。图像旋转单元2035还使得可以与打印机图像处理单元2034协同操作,在旋转图像数据的同时打印在HDD 2004或RAM 2002中的图像数据。 
分辨率转换单元2037转换RAM 2002中的图像数据的分辨率,并把图像数据再次存储在RAM 2002中。颜色空间转换单元2038通过矩阵运算把例如RAM 2002中的YUV图像数据转换成Lab图像数据,并把图像数据再次存储在RAM 2002中。色调转换单元2039通过诸如误差扩散处理之类的技术把例如RAM 2002中的9位256色调的图像数据转换成1位2色调的图像数据,并把图像数据再次存储在RAM 2002中。图像压缩/解压单元2036按照诸如JPEG之类的格式压缩/解压多级图像数据,并按照诸如JBIG、MMR、MR、或MH之类的格式压缩/解压二进制图像数据。 
图像旋转单元2035、分辨率转换单元2037、颜色空间转换单元2038、色调转换单元2039以及图像压缩/解压单元2036可被连接在一起。例如,在RAM 2002中的图像数据的旋转处理和分辨率转换处理可同时进行,而不把数据暂时存储在RAM 2002中。 
图3是表示按照本实施例的文档检索设备1000的外观的透视图。如参照图1所述,本实施例的文档检索设备1000是作为多功能外设提供给用户的,其具有复印功能、传真功能、打印机功能、和文档管理功能。 
作为图像输入装置的扫描仪单元3001对在诸如纸之类的印刷介质上的文档进行照射,并扫描CCD线传感器(1ine sensor),由此把文档转换成光栅图像数据,即电信号。也就是说,用户把文档纸张放在文档馈送器3002的盘上,并经由操作单元3006指示开始读取文档。然后,图2所示的主单元控制器CPU 2001向扫描仪2070发送命令。文档馈送器3002逐页运送文档纸张,并开始文档读取操作。 
作为图像输出装置的打印机单元3003输出光栅图像数据作为在纸上的打印图像,任何打印系统都是可以利用的。例如,可以使用利用感光鼓或感光带的电子照相型打印系统,或者使用从小喷嘴阵列喷射油墨并直接在纸张上打印图像数据的喷墨型打印系统。 
响应来自作为控制器的CPU 2001的指令,开始打印操作。打印机单元3003具有多个馈送台3004,用于选择不同的纸尺寸和纸取向。在馈送台3004中设置有相应的纸盒。此外,排放盘3005接收打印的纸张。也可以按照来自作为控制器的CPU 2001的命令进行诸如分类和装订的后处理。 
图1所示的主单元1001和文档管理系统1005被布置在文档检索设备1000内,因此从外部看不到。 
图4是表示按照本实施例的文档检索设备1000的主单元1001的软件配置的方块图。图4所示的软件被存储在图2所示的HDD 2004中。 
用于控制操作单元2050的UI控制管理器4001进行控制以向下层模块发送用户指令,或在操作单元2050的显示装置6000上显示来自下层的信息。网络控制管理器4002进行控制以通过网络接收指令或信息,或发送来自主单元1001的指令或信息。 
复印应用单元4003和发送应用单元4004接收来自UI控制管理器4001的指令,并使每个管理器单元(后面说明)执行复印作业和传送作业。 
文档管理应用单元4005与文档管理系统1005通信,并提供文档管理功能。文档管理应用单元4005控制检索处理(下面说明)。文档管理应用单元4005连接到从文档数据中包含的图像数据中提取文本信息的OCR引擎4006,还连接到从文档数据中包含的图像数据中提取所需区域内的图像数据的块选择(BS)引擎4007。 
本实施例的BS引擎4007识别图像数据中的图像区域和文本区域,并产生图像数据中的每个区域的类型、位置和尺寸的信息。BS引擎4007还可以确定与图像区域和文本区域不同的各种属性块(如表 块、艺术线条块、背景块等),并提取每种属性的块(区域)。 
公共接口单元4008吸收下层的每个管理单元的装置相关部分。作业管理器4009排列从公共接口单元4008接收的多条作业信息,并将其发送给与下层的装置紧密相关的多个管理器(4010到4014)。例如,如果接收的作业指示“本地复印”,则作业管理器4009控制扫描管理器4011和打印管理器4010。 
如果接收的作业是传真传送作业,则作业管理器4009控制扫描管理器4011、用于文档存储的文件管理器4014以及传真管理器4012。如果接收的作业是LIPS或PostScript的PDL打印作业,则作业管理器4009控制PDL管理器4013、文件管理器4014和打印管理器4010。通过这种方式,作业管理器4009按照接收的作业控制每个管理器的诸如启动、同步和终止的处理。 
图5是表示在按照图1所示的本实施例的文档检索设备1000中布置的文档管理系统1005的软件配置的方块图。文档管理系统1005对主单元1001提供文档的存储、获取和检索的功能。图5中的标号5004和5005表示与图4中的4006以及4007相同的部分。 
网络控制单元5001控制与主单元2000的网络控制管理器4002的通信。检索控制单元5002执行对于从主单元2000请求的检索的处理,或者创建所存储的文档数据的检索索引的处理。 
图像文档处理单元5003根据需要进行缩略图图像数据的创建或图像的转换。图像文档处理单元5003还按照所记录的文档数据从所记录的文档数据中提取检索索引。即,由图像文档处理单元5003把要记录在文档管理系统1005中的文档数据转换成预定格式。对于图像数据,块选择(BS)引擎5005提取在文档数据中包含的图像区域。对于文本(字符)数据,OCR引擎5004从文档数据中包含的图像数据中提取索引数据和固定字符信息。 
文档管理控制单元5006分配关于文档管理的所有处理。标号5007表示在文档管理系统侧上使用的暂时数据的存储位置。 
数据库控制单元5008进行要存储在数据库中的各种数据的创建, 并存储与卷数据库5009、属性数据库5010、全文检索数据库501 1和图像检索数据库5012对应的各种数据。数据库控制单元5008还按照来自主单元1001的请求,从每个数据库中读出数据并创建要传输到主单元1001的文档数据。 
卷数据库5009存储文档数据实体。卷数据库5009是概念性单元,其实体可以是文档管理系统1005的OS上的文件系统。属性数据库5010存储关于诸如文档数据的名称、创建日期和注释之类的属性的信息。全文检索数据库5011记录由OCR引擎5004从所记录的文档数据中提取的索引数据和固定字符信息。当主单元1001指示全文检索时,对全文数据库5011进行全文检索。图像检索数据库5012以与文档数据相关联的方式记录由块选择(BS)引擎5005从所记录的文档数据中提取的图像区域的特征。当主单元1001指示进行图像检索时,对图像检索数据库5012进行图像检索,以按照检索目标图像数据的特征找出相关联的文档数据。 
图6是表示在按照本实施例的检索处理中在操作单元2050内提供的显示装置6000上显示的显示窗口的转换示例的视图。将参照图6说明按照本实施例的检索处理的过程。 
首先显示基本显示窗口6001。本实施例的操作单元2050使用显示装置6000的触摸板。当用户按下在显示窗口上显示的按钮时,执行对应的功能。在本示例中,显示对应于包括“复印”、“传送”和“检索”等10个功能的多个按钮。对于检索,在本示例中显示对应于两个功能即“利用标准的检索”和“原件检索”的按钮6050和6060。“利用标准的检索”表示检索含有被指定为检索键的图像或关键字的文档数据。在另一方面,“原件检索”表示检索与文档页的读取图像完全一致的文档数据(当读取具有多页的文档时,检索与所有文档页的图像一致的文档数据)。 
在按下基本显示窗口6001上的“利用标准的检索”按钮6050之后,显示显示窗口6002。在这个显示窗口中,用户能够通过按钮6070或6080选择“图像检索”或“经由OCR进行关键字检索”。 
如果用户在显示窗口6002内选择“图像检索”,则显示显示窗口6013以设置文档输入等待状态,以便提取要用作检索键的图像数据。 
当显示显示窗口6013并且用户放置文档并按下“扫描开始”按钮时,该文档被读取,BS引擎从读取的图像数据中提取图像区域。所提取的图像区域作为缩略图图像被显示在显示窗口6014上。在这个示例中,显示3个缩略图图像。用户在显示窗口6014上选择要用作检索键的图像数据,并按下“检索开始”按钮以执行检索。为了选择缩略图图像,用户只需要触摸缩略图图像的区域。例如在缩略图图像的左上方提供的复选框中显示的标记表示该图像正被选择。在本实施例中,用户能够选择多个图像数据作为检索键。在这种情况下,用户能够选择是通过多个图像数据的AND还是多个图像数据的OR进行检索。 
当用户按下“检索开始”按钮时,主单元1001对文档管理系统1005发出“图像检索”的指令。文档管理系统1005执行检索,并把结果返回主单元1001。在接收到检索结果后,主单元1001在显示窗口6015上显示该结果。显示窗口6015显示诸如文档名、一致率(相似度)、更新日期和存储位置之类的信息的列表。用户能够在显示窗口6015上选择所需的文档数据,并执行诸如打印或传送之类的操作。 
在另一方面,当用户在显示窗口6002上选择“经由OCR的关键字检索”时,显示显示窗口6023,并且系统1005变成等待状态,等待输入要提取关键字的文档。 
当显示窗口6013被显示,并且用户放置文档并按下“扫描开始”按钮时,该文档被读取,OCR引擎从所读取的图像数据中提取关键字。这样提取的关键字被列举在显示窗口6024上。用户在显示窗口6024上选择要用作检索键的关键字,并按下“检索开始”按钮以执行检索。为了选择关键字,用户只需要触摸关键字的区域。如在关键字的左上方提供的复选框中显示的标记表示该关键字正被选择。在本实施例中,用户能够选择多个关键字作为检索键。在这种情况下,用户能够选择是利用多个关键字的AND还是多个关键字的OR进行检索。 
当用户按下“检索开始”按钮时,主单元1001对文档管理系统 1005发出“经由OCR的关键字检索”指令。文档管理系统1005执行检索,并把结果返回给主单元1001。在接收到检索结果后,主单元1001便在显示窗口6025上显示该检索结果。显示窗口6025显示诸如文档名、一致率(相似度)、更新日期和存储位置之类的信息的列表。用户能够在显示窗口6015上选择所需的文档数据,并执行诸如打印或传送之类的操作。 
图7是按照本实施例在选择“图像检索”之后直到执行检索之前、由文档检索设备1000的主单元执行的处理的流程图。这个处理对应于当显示如图6所示的显示窗口6013和6014时执行的处理。 
当用户选择“图像检索”,放置文档以提取作为检索键的图像,并指示开始读取时,主单元2000启动扫描仪2070以执行文档读取处理(步骤S7001)。读取的图像数据被暂时存储在HDD 2004中。 
主单元对于所存储的图像数据执行块选择(BS)(步骤S7002)。BS引擎4007按照来自文档管理应用4005的指令执行这个处理。作为块选择的结果,确定是否存在图像区域(步骤S7003)。如果不存在图像区域,则结束处理。然而,如果存在图像区域,则从所存储的图像数据中提取对应的图像区域,并将该图像区域存储在RAM 2002中(步骤S7004)。 
接着,从提取的图像区域中提取图像特征(步骤S7005)。这个处理提取图像的边沿信息、颜色信息和布局式样作为图像特征,并把它们作为文件存储在HDD 2004中。在这个实施例中,在HDD 2004中存储的文件名包括预定的名称和名称后面的序列号,例如AREA01.xml和AREA02.xml。主单元2000向文档管理系统2060发出含有作为检索键的图像特征的信息的“图像检索”指令。因而,与传输图像数据本身作为检索键的情况相比,可以减少传输数据的量。文档管理应用单元4005执行图像特征提取处理。 
创建所提取的图像数据的缩小(缩略图)图像,并将其存储在HDD2004中(步骤S7006)。即使在这种情况下,所存储的图像的名称也包括预定的名称和其后的序列号,例如AREA01.jpg和AREA02.jpg。 因为在本实施例中对于每个图像区域执行这个处理,从而能够使得在步骤S7005创建的图像特征信息与缩略图图像相关联。     
确定是否存在下一个图像区域(步骤S7007)。如果存在下一个图像区域,则处理返回步骤S7004,以重复该处理。如果不存在下一个图像区域,则确定是否完成所有图像区域的处理。在显示窗口6014上显示在步骤S7006存储的缩略图图像的列表(步骤S7008)。 
当用户选择要用作检索键的图像数据并指示开始检索(步骤S7009)时,主单元2000向文档管理系统2060发出含有与作为检索键的所选图像数据相对应的图像特征信息在内的“图像检索”指令(步骤S7010)。然后结束处理。 
图8是示出按照本实施例在选择“经由OCR的关键字检索”之后直到执行检索之前、文档检索设备1000的主单元执行的处理的流程图。这个处理对应于当显示如图6所示的显示窗口6023和6024时执行的处理。 
当用户选择“经由OCR的关键字检索”,放置文档以提取关键字,并指示开始读取时,主单元2000启动扫描仪2070以执行文档读取处理(步骤S8001)。所读取的图像数据被暂时存储在HDD 2004中。 
对于所存储的图像数据执行块选择(BS)(步骤S8002)。BS引擎4007按照来自文档管理应用4005的指令执行这个处理。作为块选择的结果,确定是否存在文本区域(步骤S8003)。如果不存在文本区域,则结束处理。如果存在文本区域,则从存储的图像数据中提取对应的文本区域,并将该文本区域存储在RAM 2002中(步骤S8004)。 
主单元通过OCR从所提取的文本区域中提取字符串(步骤S8005)。OCR引擎4006执行这个处理。对所提取的字符串进行语素分析处理以提取名词。所提取的名词根据出现的频率或位置,按照优先权顺序被排列,并作为关键字列表被存储在HDD 2004中。如果存在已经存储的关键字列表,则把这些名词加于其中并存储(步骤S8006)。文档管理应用单元4005执行上述的关键字提取处理。 
然后确定是否存在下一个文本区域(步骤S8007)。如果存在下一个文本区域,则处理返回步骤S8004,以重复该处理。如果不存在下一个文本区域,则确定完成了所有区域的处理。在显示窗口6024上显示在步骤S8006存储的关键字列表(步骤S8008)。 
当用户选择要用作检索键的关键字并指示开始检索(步骤S8009)时,主单元2000向文档管理系统2060发出含有作为检索键的所选关键字在内的全文检索指令(步骤S8010)。然后结束处理。 
如上所述,按照本实施例,对应于所读取文档中的图像数据的缩略图图像的列表被显示,从而用户能够容易地从列表中选择要用作关键字的图像数据。 
因而,用户能够容易而简单地指定或输入用作关键字的图像数据,这增加了用户的便利性。 
<其它实施例> 
在上面的实施例中所述的布置、处理过程和操作显示窗口仅仅是示例。这些布置或处理过程可被改变或修正,只要可以实现本发明的目的。 
例如,在上面的实施例中,显示与所读取文档的图像区域对应的缩略图图像。然而,如果根据显示区域的尺寸和图像区域的数量和尺寸之间的关系,可以显示图像区域的列表,则能够以实际尺寸显示图像。在这种情况下,确定是否可以进行列表类型显示。如果无法进行列表类型显示,则可以把每个图像缩小到允许进行这种列表类型显示的尺寸,或者按照要以列表的形式显示的图像的数量改变图像的缩小比率。 
在上面的实施例中,在操作单元中提供的显示装置具有在显示屏幕上提供的触摸板。然而,可以使用不同于触摸板的任何其它操作装置(如,键和按钮),从所列图像中选择要用于检索的图像。 
图像数据的格式不限于上面实施例中所述的格式,根据需要可以使用合适的格式。 
上述实施例在使用图像数据作为检索键的处理与使用文本数据作 为检索键的处理之间进行区分。然而,本发明不限于此。也可以根据图像数据和字符串的OR或AND进行检索。 
通过向图像或文本数据的检索键添加来自所述操作的另一检索条件(如,文档创建日期/时间、更新日期/时间、存储位置、文档名、文档类型和字符串),可以进行精确的检索。 
除去在文档中的图像和文本数据的检索键之外,通过块选择而获得的其它的属性(表格、艺术线条或背景)也可用作检索键。 
上面详细说明了本发明的实施例。本发明可应用于包括多个设备的文档检索系统或包括单个设备的文档检索设备。 
例如,在上述实施例中,本发明应用于具有扫描仪功能、复印功能、打印机功能和传真功能的多功能外设。在这些功能当中,复印功能、传真功能和打印机功能不是重要的。因而,包括扫描仪(读取设备)和诸如对应于主单元和操作单元的计算机之类的信息处理设备的系统也可应用于本发明。在这种情况下,以上实施例的文档管理系统可被提供在计算机设备中,或者作为外部设备通过网络被连接。 
当文档管理系统是外部设备时,可以准备多个外部设备,使得用户可以指定要用来检索的外部设备。另选的,所有可检索的外部装置都可执行检索。 
从通过扫描仪功能读取文档而获得的图像的图像数据中提取检索键。然而,可以使用任何其它图像数据。例如,可以从通过传真接收的图像数据、经由诸如LAN 2020之类的网络通过电子邮件功能或FTP功能接收的图像数据、或者从Web服务器接收的数据中包含的图像数据中提取检索键。也可以使用从另一打印客户端接收的打印数据。用户可以经由操作单元2050选择在HDD 2004中存储的一个图像数据并提取检索键。 
本发明甚至通过如下方式实现:直接或者从远方对系统或设备供应软件程序,并使系统或设备的计算机读出并执行所供应的程序,所述程序实现上述实施例的功能。在上述实施例中,所述程序对应于图7和图8的流程图。如果可以获得程序的功能,则不必总是采用程序 的形式。 
因而,被安装在计算机中以由计算机实现本发明的功能处理的程序代码本身也实现本发明。即,本发明的权利要求还包括用于实现本发明的功能处理的计算机程序本身。 
在这种情况下,程序可以采取任何形式,例如目标代码、要由解释器执行的程序、或者要提供给OS的脚本数据,只要可以获得所述程序的这些功能。 
可以利用各种记录介质来提供所述程序。示例有floppy
Figure 2006800276513_0
盘、硬盘、光盘、磁光盘、MO、CD-ROM、CD-R、CD-RW、磁带、非易失存储卡、ROM、以及DVD(DVD-ROM或DVD-R)。 
为了供应程序,可以通过使用客户端计算机内的浏览器使客户端计算机连接到互联网上的主页,以便从该主页把程序下载到诸如硬盘之类的记录介质。用户可以下载本发明的计算机程序本身或者含有自动安装功能的压缩文档。 
在本发明的程序中包含的程序代码可被分成多个文件,从而用户可以从不同的主页上下载这些文件。即,使多个用户下载使计算机实现本发明的功能处理的程序文件的WWW服务器也被包括在本发明的权利要求内。 
本发明的程序可被加密,存储在诸如CD-ROM之类的存储介质中并分发给用户。满足预定条件的任何用户可以通过互联网从主页下载用于解密的密钥信息,使用该密钥信息来执行加密的程序,并把程序安装在计算机内。 
上述实施例的功能不仅在所读出的程序由计算机执行时才被实现。例如,当在计算机上运行的OS根据程序的指令执行实际处理的一部分或全部时,可以实现上述实施例的功能。 
从记录介质读出的程序可被写入插入计算机中的功能扩展板的存储器中或者写入连接到计算机的功能扩展单元中。在这种情况下,功能扩展板或功能扩展单元的CPU根据程序的指令执行实际处理的一部分或全部,由此实现上述实施例的功能。 
虽然参照示例性实施例说明了本发明,但是应当理解,本发明不限于公开的示例性实施例。下面权利要求的范围应当被给予最宽的解释,使得包括所有这些改变、等效结构和功能。 
本申请要求于2005年7月28日提交的日本专利申请第2005-219441号的优先权,该专利申请的全部内容通过引用被包括在本文中。 

Claims (7)

1.一种用于执行与检索键对应的数据检索的检索设备,其特征在于包括:
读取装置,用于读取文档图像以获得图像数据;
模式选择装置,用于从用户接收指令,所述指令用于选择使用图像作为检索键执行检索的图像检索模式和使用关键词作为检索键执行检索的关键词检索模式中的一种模式;
图像区域提取装置,用于在用户选择图像检索模式的情况下提取在所述图像数据中的多个图像区域;
关键词提取装置,用于在用户选择关键词检索模式的情况下提取在所述图像数据中的多个关键词;
列表显示装置,用于在用户选择图像检索模式的情况下显示与由所述图像区域提取装置提取的图像区域对应的多个图像的列表,以及在用户选择关键词检索模式的情况下显示由所述关键词提取装置提取的多个关键词的列表;以及
输入装置,用于在用户选择图像检索模式的情况下输入用于从所述多个图像的列表选择图像的指令,以及在用户选择关键词检索模式的情况下输入用于从所述多个关键词的列表选择关键词的指令;
其中在用户选择图像检索模式的情况下使用所选择的图像作为所述检索键,以及在用户选择关键词检索模式的情况下使用所选择的关键词作为所述检索键。
2.如权利要求1所述的检索设备,其特征在于还包括:
缩小装置,用于缩小与由所述图像区域提取装置所提取的图像区域对应的图像的尺寸,
其中所述列表显示装置显示与由所述图像区域提取装置提取的图像区域对应的缩小图像的列表。
3.如权利要求1所述的检索设备,其特征在于,
使用所选择的图像的特征信息作为所述检索键来执行检索。
4.如权利要求3所述的检索设备,其特征在于,
所述特征信息包含图像的边沿信息、颜色信息、和布局式样中的至少一个。
5.如权利要求1所述的检索设备,其特征在于
所述列表显示装置具有显示屏,所述输入装置包括提供在所述显示屏上的触摸板。
6.如权利要求1所述的检索设备,其特征在于,
所述检索设备是至少具有读取功能和打印功能的多功能外设。
7.一种用于执行与检索键对应的数据检索的检索方法,其特征在于包括以下步骤:
读取步骤,读取文档图像以获得图像数据;
模式选择步骤,从用户接收指令,所述指令用于选择使用图像作为检索键执行检索的图像检索模式和使用关键词作为检索键执行检索的关键词检索模式中的一种模式;
图像区域提取步骤,在用户选择图像检索模式的情况下提取在所述图像数据中的多个图像区域;
关键词提取步骤,在用户选择关键词检索模式的情况下提取在所述图像数据中的多个关键词;
显示步骤,在用户选择图像检索模式的情况下在用于显示信息的显示装置上显示与在所述图像区域提取步骤中提取的图像区域对应的图像的列表,以及在用户选择关键词检索模式的情况下在显示装置上显示在所述关键词提取步骤中提取的关键词的列表;以及
输入步骤,在用户选择图像检索模式的情况下输入用于从所述图像的列表选择图像的指令,以及在用户选择关键词检索模式的情况下输入用于从所述关键词的列表选择关键词的指令,
其中,在用户选择图像检索模式的情况下使用所选择的图像作为检索键,以及在用户选择关键词检索模式的情况下使用所选择的关键词作为所述检索键。
CN2006800276513A 2005-07-28 2006-07-24 检索设备和检索方法 Expired - Fee Related CN101233511B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP219441/2005 2005-07-28
JP2005219441A JP2007034847A (ja) 2005-07-28 2005-07-28 検索装置及び検索方法
PCT/JP2006/314572 WO2007013399A1 (ja) 2005-07-28 2006-07-24 検索装置及び検索方法

Publications (2)

Publication Number Publication Date
CN101233511A CN101233511A (zh) 2008-07-30
CN101233511B true CN101233511B (zh) 2012-06-13

Family

ID=37683296

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800276513A Expired - Fee Related CN101233511B (zh) 2005-07-28 2006-07-24 检索设备和检索方法

Country Status (4)

Country Link
US (1) US8326090B2 (zh)
JP (1) JP2007034847A (zh)
CN (1) CN101233511B (zh)
WO (1) WO2007013399A1 (zh)

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004165863A (ja) * 2002-11-12 2004-06-10 Murata Mach Ltd カラー画像送信装置
US8086038B2 (en) * 2007-07-11 2011-12-27 Ricoh Co., Ltd. Invisible junction features for patch recognition
US7970171B2 (en) * 2007-01-18 2011-06-28 Ricoh Co., Ltd. Synthetic image and video generation from ground truth data
US8838591B2 (en) * 2005-08-23 2014-09-16 Ricoh Co., Ltd. Embedding hot spots in electronic documents
US7885955B2 (en) * 2005-08-23 2011-02-08 Ricoh Co. Ltd. Shared document annotation
US7669148B2 (en) * 2005-08-23 2010-02-23 Ricoh Co., Ltd. System and methods for portable device for mixed media system
US8600989B2 (en) * 2004-10-01 2013-12-03 Ricoh Co., Ltd. Method and system for image matching in a mixed media environment
US8156427B2 (en) * 2005-08-23 2012-04-10 Ricoh Co. Ltd. User interface for mixed media reality
US9171202B2 (en) 2005-08-23 2015-10-27 Ricoh Co., Ltd. Data organization and access for mixed media document system
US7812986B2 (en) * 2005-08-23 2010-10-12 Ricoh Co. Ltd. System and methods for use of voice mail and email in a mixed media environment
US7702673B2 (en) * 2004-10-01 2010-04-20 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment
US8825682B2 (en) * 2006-07-31 2014-09-02 Ricoh Co., Ltd. Architecture for mixed media reality retrieval of locations and registration of images
US9405751B2 (en) 2005-08-23 2016-08-02 Ricoh Co., Ltd. Database for mixed media document system
US8335789B2 (en) * 2004-10-01 2012-12-18 Ricoh Co., Ltd. Method and system for document fingerprint matching in a mixed media environment
US8868555B2 (en) * 2006-07-31 2014-10-21 Ricoh Co., Ltd. Computation of a recongnizability score (quality predictor) for image retrieval
US9373029B2 (en) * 2007-07-11 2016-06-21 Ricoh Co., Ltd. Invisible junction feature recognition for document security or annotation
US8385589B2 (en) * 2008-05-15 2013-02-26 Berna Erol Web-based content detection in images, extraction and recognition
US8949287B2 (en) 2005-08-23 2015-02-03 Ricoh Co., Ltd. Embedding hot spots in imaged documents
US8184155B2 (en) * 2007-07-11 2012-05-22 Ricoh Co. Ltd. Recognition and tracking using invisible junctions
US8156115B1 (en) 2007-07-11 2012-04-10 Ricoh Co. Ltd. Document-based networking with mixed media reality
US8005831B2 (en) * 2005-08-23 2011-08-23 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment with geographic location information
US8369655B2 (en) 2006-07-31 2013-02-05 Ricoh Co., Ltd. Mixed media reality recognition using multiple specialized indexes
US8195659B2 (en) * 2005-08-23 2012-06-05 Ricoh Co. Ltd. Integration and use of mixed media documents
US8510283B2 (en) * 2006-07-31 2013-08-13 Ricoh Co., Ltd. Automatic adaption of an image recognition system to image capture devices
US8521737B2 (en) * 2004-10-01 2013-08-27 Ricoh Co., Ltd. Method and system for multi-tier image matching in a mixed media environment
US8276088B2 (en) * 2007-07-11 2012-09-25 Ricoh Co., Ltd. User interface for three-dimensional navigation
US8856108B2 (en) * 2006-07-31 2014-10-07 Ricoh Co., Ltd. Combining results of image retrieval processes
US9384619B2 (en) 2006-07-31 2016-07-05 Ricoh Co., Ltd. Searching media content for objects specified using identifiers
US8156116B2 (en) * 2006-07-31 2012-04-10 Ricoh Co., Ltd Dynamic presentation of targeted information in a mixed media reality recognition system
US7920759B2 (en) 2005-08-23 2011-04-05 Ricoh Co. Ltd. Triggering applications for distributed action execution and use of mixed media recognition as a control input
US8332401B2 (en) * 2004-10-01 2012-12-11 Ricoh Co., Ltd Method and system for position-based image matching in a mixed media environment
US8144921B2 (en) * 2007-07-11 2012-03-27 Ricoh Co., Ltd. Information retrieval using invisible junctions and geometric constraints
US7917554B2 (en) * 2005-08-23 2011-03-29 Ricoh Co. Ltd. Visibly-perceptible hot spots in documents
US8176054B2 (en) * 2007-07-12 2012-05-08 Ricoh Co. Ltd Retrieving electronic documents by converting them to synthetic text
US7991778B2 (en) * 2005-08-23 2011-08-02 Ricoh Co., Ltd. Triggering actions with captured input in a mixed media environment
US9530050B1 (en) 2007-07-11 2016-12-27 Ricoh Co., Ltd. Document annotation sharing
US7769772B2 (en) * 2005-08-23 2010-08-03 Ricoh Co., Ltd. Mixed media reality brokerage network with layout-independent recognition
JP4977452B2 (ja) * 2006-01-24 2012-07-18 株式会社リコー 情報管理装置、情報管理方法、情報管理プログラム、記録媒体及び情報管理システム
US9063952B2 (en) * 2006-07-31 2015-06-23 Ricoh Co., Ltd. Mixed media reality recognition with image tracking
US8676810B2 (en) 2006-07-31 2014-03-18 Ricoh Co., Ltd. Multiple index mixed media reality recognition using unequal priority indexes
US8073263B2 (en) * 2006-07-31 2011-12-06 Ricoh Co., Ltd. Multi-classifier selection and monitoring for MMR-based image recognition
US8201076B2 (en) * 2006-07-31 2012-06-12 Ricoh Co., Ltd. Capturing symbolic information from documents upon printing
US9020966B2 (en) * 2006-07-31 2015-04-28 Ricoh Co., Ltd. Client device for interacting with a mixed media reality recognition system
US8489987B2 (en) * 2006-07-31 2013-07-16 Ricoh Co., Ltd. Monitoring and analyzing creation and usage of visual content using image and hotspot interaction
US9176984B2 (en) * 2006-07-31 2015-11-03 Ricoh Co., Ltd Mixed media reality retrieval of differentially-weighted links
US8396331B2 (en) * 2007-02-26 2013-03-12 Microsoft Corporation Generating a multi-use vocabulary based on image data
JP4433327B2 (ja) * 2007-12-11 2010-03-17 ソニー株式会社 情報処理装置および方法、並びにプログラム
CN101510934B (zh) * 2009-03-20 2014-02-12 北京中星微电子有限公司 一种数码像框及其显示照片的方法
US8385660B2 (en) * 2009-06-24 2013-02-26 Ricoh Co., Ltd. Mixed media reality indexing and retrieval for repeated content
JP2011050038A (ja) * 2009-07-27 2011-03-10 Sanyo Electric Co Ltd 画像再生装置及び撮像装置
US9058331B2 (en) 2011-07-27 2015-06-16 Ricoh Co., Ltd. Generating a conversation in a social network based on visual search results
CN102436477A (zh) * 2011-10-11 2012-05-02 鸿富锦精密工业(深圳)有限公司 具关联内容搜索功能的装置及方法
US10380554B2 (en) * 2012-06-20 2019-08-13 Hewlett-Packard Development Company, L.P. Extracting data from email attachments
US20150169971A1 (en) * 2012-09-07 2015-06-18 Mark Joseph Cummins Character recognition using search results
JP5998807B2 (ja) * 2012-09-28 2016-09-28 株式会社メルコホールディングス 情報処理システム、情報処理装置、情報処理方法及び情報処理プログラム
KR102090269B1 (ko) * 2012-12-14 2020-03-17 삼성전자주식회사 정보 검색 방법, 그와 같은 기능을 갖는 디바이스 및 기록 매체
JP5879286B2 (ja) * 2013-02-27 2016-03-08 京セラドキュメントソリューションズ株式会社 検索システム利用装置
KR102309175B1 (ko) * 2014-08-29 2021-10-06 삼성전자주식회사 스크랩 정보를 제공하는 전자 장치 및 그 제공 방법
JP6470636B2 (ja) * 2015-06-04 2019-02-13 キヤノン株式会社 情報処理装置、その制御方法、及びプログラム
CN106131422B (zh) * 2016-07-26 2019-08-06 广东小天才科技有限公司 一种确定拍照内容的方法及装置
US11295124B2 (en) * 2018-10-08 2022-04-05 Xerox Corporation Methods and systems for automatically detecting the source of the content of a scanned document
JP7363188B2 (ja) * 2019-08-21 2023-10-18 京セラドキュメントソリューションズ株式会社 画像読取装置及び画像形成装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6397213B1 (en) * 1999-05-12 2002-05-28 Ricoh Company Ltd. Search and retrieval using document decomposition

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2890482B2 (ja) * 1989-06-13 1999-05-17 富士ゼロックス株式会社 文書画像再配置ファイリング装置
ATE202251T1 (de) * 1991-08-19 2001-06-15 Oki America Inc Multifunktionelles dokumentenverarbeitungssystem
JPH05274367A (ja) 1992-03-25 1993-10-22 Toshiba Corp 画像記憶装置
JPH05274368A (ja) 1992-03-25 1993-10-22 Toshiba Corp 画像記憶装置
JPH08263512A (ja) * 1995-03-24 1996-10-11 Sumitomo Electric Ind Ltd 文書検索装置
US5913215A (en) * 1996-04-09 1999-06-15 Seymour I. Rubinstein Browse by prompted keyword phrases with an improved method for obtaining an initial document set
JP3711636B2 (ja) * 1996-06-18 2005-11-02 富士ゼロックス株式会社 情報検索装置および方法
JPH10340272A (ja) * 1997-06-09 1998-12-22 Toshiba Corp 類似画像検索装置及び方法
US6910184B1 (en) * 1997-07-25 2005-06-21 Ricoh Company, Ltd. Document information management system
GB0016974D0 (en) * 2000-07-12 2000-08-30 Univ Salford The Document retrieval system
JP4148642B2 (ja) * 2000-10-26 2008-09-10 株式会社リコー 類似画像検索装置、及びコンピュータ読み取り可能な記録媒体
JP2002269135A (ja) * 2001-03-13 2002-09-20 Matsushita Electric Ind Co Ltd 情報検索支援装置
TW501035B (en) * 2001-03-20 2002-09-01 Ulead Systems Inc Interactive image searching method based on local object
US20020194166A1 (en) * 2001-05-01 2002-12-19 Fowler Abraham Michael Mechanism to sift through search results using keywords from the results
JP3615162B2 (ja) * 2001-07-10 2005-01-26 日本電気株式会社 画像符号化方法及び画像符号化装置
JP2004334339A (ja) * 2003-04-30 2004-11-25 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
JP4366119B2 (ja) * 2003-05-29 2009-11-18 キヤノン株式会社 文書処理装置
US7493322B2 (en) * 2003-10-15 2009-02-17 Xerox Corporation System and method for computing a measure of similarity between documents
US7610274B2 (en) * 2004-07-02 2009-10-27 Canon Kabushiki Kaisha Method, apparatus, and program for retrieving data

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6397213B1 (en) * 1999-05-12 2002-05-28 Ricoh Company Ltd. Search and retrieval using document decomposition

Also Published As

Publication number Publication date
US8326090B2 (en) 2012-12-04
JP2007034847A (ja) 2007-02-08
WO2007013399A1 (ja) 2007-02-01
CN101233511A (zh) 2008-07-30
US20070041668A1 (en) 2007-02-22

Similar Documents

Publication Publication Date Title
CN101233511B (zh) 检索设备和检索方法
US6166826A (en) Printing apparatus, printing method, and printing system
CN100545846C (zh) 文档搜索设备和方法
US7552381B2 (en) Check boxes for identifying and processing stored documents
JP5147383B2 (ja) 画像処理装置、画像処理装置の制御方法及びプログラム
CN1332341C (zh) 信息处理装置和信息处理方法
EP1675376A1 (en) Document separator pages
JP4802691B2 (ja) 画像形成装置およびデータアクセス用データプリントプログラム
US8045228B2 (en) Image processing apparatus
JP5660100B2 (ja) 文書管理サーバ、文書管理サーバの制御方法、およびそのプログラム、文書管理システム、文書管理システムの制御方法、およびそのプログラム
JP4745866B2 (ja) デバイス管理システムおよびその制御方法
JP5300206B2 (ja) 情報処理装置、機能制限方法、記憶媒体及びプログラム
US20120140275A1 (en) Scan management system, scan management apparatus, controlling method of scan management system, and recording medium
US20090303535A1 (en) Document management system and document management method
US8867091B2 (en) Image processing system, image processing apparatus, image scanning apparatus, and control method and program for image processing system
JP4541998B2 (ja) 画像処理装置及び画像処理方法
JP2004171304A (ja) 電子化原稿管理装置及びその制御方法、電子化原稿管理システム、プログラム
US20070038606A1 (en) File processing apparatus operating a file based on previous execution history of the file
US20110138272A1 (en) Image forming apparatus and document description information input method of documents thereof
JP2004348467A (ja) 画像検索装置及びその制御方法、プログラム
JP2001256256A (ja) 電子文書検索装置および電子文書検索方法
JP2007336008A (ja) 画像検索装置および方法
JP4736606B2 (ja) 並び順管理装置及びプログラム
EP1063598A2 (en) System and method for document management and document sharing
JPH10254895A (ja) 文書情報管理システムおよび媒体用紙の作成方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120613

CF01 Termination of patent right due to non-payment of annual fee