CN100498791C - 文档检索系统、文档检索装置及其方法 - Google Patents

文档检索系统、文档检索装置及其方法 Download PDF

Info

Publication number
CN100498791C
CN100498791C CNB2007100885240A CN200710088524A CN100498791C CN 100498791 C CN100498791 C CN 100498791C CN B2007100885240 A CNB2007100885240 A CN B2007100885240A CN 200710088524 A CN200710088524 A CN 200710088524A CN 100498791 C CN100498791 C CN 100498791C
Authority
CN
China
Prior art keywords
document
search condition
index
information
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2007100885240A
Other languages
English (en)
Other versions
CN101059811A (zh
Inventor
佐藤正晃
福田慎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN101059811A publication Critical patent/CN101059811A/zh
Application granted granted Critical
Publication of CN100498791C publication Critical patent/CN100498791C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

两个或更多文档管理服务器中的每一个存储文档和相应于该文档的索引数据。在存储在所述两个或更多文档管理服务器中的索引数据中,收集相应于满足第一检索条件的文档的索引数据以便存储。当用户请求基于第二检索条件检索时,确定第一检索条件和第二检索条件是否相同,并且当第一和第二条件相同时,通过参考收集的索引数据执行根据用户的指令的文档检索。

Description

文档检索系统、文档检索装置及其方法
技术领域
本发明涉及用于从通过网络连接的两个或更多文档管理服务器内登记的文档中检索文档的文档检索系统和文档检索装置及其方法。
背景技术
文档检索系统被已知为这样的系统,即其中两个或更多文档存储在诸如文档服务器的数据库内,并且用户从存储的文档中检索所希望的文档。在这种系统中,例如当登记文档时,提取包含在文档数据内的关键字以便产生索引。以和文档相关联的方式与该文档分开地管理以这种方式产生的索引。
当用户输入用于检索文档的关键字时,确定输入的关键字是否包含在索引内。如果索引包含该关键字,将相应于该索引的文档确定为将要检索的文档。以这种方式使用索引改进了检索过程中的响应时间。
作为这样的文档检索系统,以用户操作的装置(例如,个人计算机(PC))请求两个或更多服务器以便检索的方式,提出了综合文档检索服务的实现(见日本专利特开号2004-342042)。在这种系统中,两个或更多服务器共享存储在各自服务器内的文档的索引。因此,通过用户向任意一个服务器发出文档检索命令,可以从存储在两个或更多服务器内的文档中执行检索。
然而,上述传统的技术具有下面的问题。即,在从通过网络连接的两个或更多服务器等中存储的文档中检索文档时,如果对所有服务器作出检索请求,在从所有服务器接收检索结果之前可能花费时间。另外,由于为每个检索操作将包含关于检索请求或检索结果信息的大量数据发送到网络,网络将处于重负载。
可替换地,如果两个或更多服务器共享存储在各自服务器内的文档的索引,如上述的日本专利特开号2004-342042中公开的,在检索时对所述服务器中的一个作出检索请求就足够了,这提高了检索效率。
然而,在这种情况下,分别要求两个或更多服务器维护登记在所有其他服务器内的文档的索引。因此,随着服务器或存储文档的数量的增加,将要维护的索引的数据量增加了,这引起了存储器资源的浪费,并且延长了检索所需时间。另外,在文档登记在某个服务器的情况下,其索引被通过网络传送到所有其他服务器,这增加了网络流量。
发明内容
本发明的目的是解决传统技术的上述问题。
本发明的特征在于提高从通过网络连接的两个或更多文档管理服务器内登记的文档中检索文档时的检索效率。
根据本发明的一个方面,提供了一种用于从通过网络连接的两个或更多文档管理服务器内登记的文档中检索文档的文档检索系统,该文档检索系统包括:
为文档管理服务器的每一个提供的存储单元,用于存储文档和相应于文档的索引数据;
收集单元,用于从文档管理服务器的每一个的存储单元内存储的索引数据中收集相应于满足第一检索条件的文档的索引数据;
确定单元,用于确定第二检索条件是否与第一检索条件相同,第二检索条件由用户指定;和
检索单元,用于在确定单元确定第二检索条件与第一检索条件相同的情况下,通过参考由收集单元收集的索引数据检索文档。
根据本发明的一个方面,提供了一种文档检索装置,其用于从通过网络连接到文档检索装置的两个或更多文档管理服务器中登记的文档中检索文档,该文档检索装置包括:
输入单元,用于接收检索条件以便检索文档;
日志信息管理单元,用于管理由输入单元接收的检索条件的日志信息;
确定单元,用于基于由日志信息管理单元管理的日志信息,确定是否存在满足预定收集条件的检索条件;和
收集单元,用于在确定单元确定存在满足所述预定收集条件的检索条件的情况下,在文档检索装置中收集相应于满足检索条件的文档的索引数据。
另外,根据本发明的一个方面,提供了一种用于从通过网络连接的两个或更多文档管理服务器中登记的文档中检索文档的文档检索方法,该方法包括步骤:
在文档管理服务器的每一个的存储单元内存储文档和相应于该文档的索引数据,
从在存储步骤中存储在存储单元内的索引数据中收集相应于满足第一检索条件的文档的索引数据,
确定第二检索条件是否与第一检索条件相同,第二检索条件由用户指定,和
在确定步骤中确定第二检索条件与第一检索条件相同的情况下,通过参考收集步骤中收集的索引数据执行检索。
根据本发明的一个方面,提供了一种用于文档检索装置的文档检索方法,所述文档检索装置用于从通过网络连接到文档检索装置的两个或更多文档管理服务器中登记的文档中检索文档,该方法包括步骤:
输入检索条件以便检索文档,
管理输入步骤中输入的检索条件的日志信息,
基于日志信息管理步骤中管理的日志信息,确定是否存在满足预定收集条件的检索条件,和
在确定步骤中确定存在满足预定收集条件的检索条件的情况下,在文档检索装置内收集相应于满足检索条件的文档的索引数据。
参考附图,从下面对示例实施例的描述中,将明了本发明的其他特征。
附图说明
结合在说明书中并且构成说明书的一部分的附图示出了本发明的实施例,并且与描述一起用于解释本发明的原理。
图1A和1B是描述根据本发明的实施例的文档检索系统的配置的特征的图;
图2是示出了根据本发明的实施例的文档检索系统的配置的方框图;
图3是示出了根据本发明的实施例的管理服务器和文档服务器的特定硬件配置的方框图;
图4和5是描述根据本发明的实施例的管理服务器上的检索处理的流程图;
图6是描述根据本发明的实施例在文档检索系统内登记新文档数据的处理的流程图;
图7是示出了根据本发明的实施例的个人计算机(PC)的示例关键字输入窗口的图;
图8是示出了根据本发明的实施例存储在命中数据存储器内的示例命中表的图;
图9A和9B是示出了根据本发明的实施例存储已收集索引的示例已收集索引表的图;
图10是示出了根据本发明的实施例用于在PC上显示文档检索结果的示例窗口的图;
图11是根据本发明的实施例用于管理关键字的表的示例图,为这些关键字收集相应的索引;
图12是示出了根据本发明的实施例的文档检索系统的配置的特征的图;
图13是示出了根据本发明的实施例的文档检索系统的配置的方框图;
图14是描述了根据本发明的实施例的文档服务器上的检索处理的流程图;
图15是示出了根据本发明的实施例的示例检索统计数据表的图;
图16是示出了根据本发明的实施例由文档服务器管理的示例索引表的图;
图17是示出了根据本发明的实施例传送到文档服务器的示例检索条件的图;
图18是示出了根据本发明的实施例的文档服务器的示例检索结果显示窗口的图;
图19是描述了根据本发明的实施例的文档服务器上的检索处理的流程图;
图20是描述了根据本发明的实施例用于文档服务器上的收集条件的创建处理的流程图;
图21是示出了根据本发明的实施例,传送到文档服务器的示例收集条件的图;
图22是描述了根据本发明的实施例收集文档服务器上的索引的处理的流程图;
图23是描述了根据本发明的实施例收集文档服务器上的索引的处理的流程图;
图24是描述了根据本发明的实施例在文档服务器上登记新文件的处理的流程图;
图25A和25B是描述根据本发明的实施例的文档服务器上的文档登记处理的图;
图26是描述根据本发明的实施例的文档检索系统的配置的特征的图;
图27是示出了根据本发明的实施例的文档检索系统的配置的方框图;
图28是描述了根据本发明的实施例在文档服务器上收集索引的处理的流程图;和
图29A和29B是描述了根据本发明的实施例的文档服务器的文档属性和能力信息的图。
具体实施方式
现在将参考附图详细描述本发明的优选实施例。应当注意,这些实施例不是限制本发明的范围,并且实施例中描述的特征的所有组合不一定是实现本发明所需的。
[实施例1]
图1A和1B是描述根据本发明的第一实施例的文档检索系统的配置的特征的图。
图1A是描述传统文档检索系统(多服务器检索系统)的配置的方框图。此处,用户操作PC将检索条件(关键字)传送到各个服务器,以便作出检索请求。各个服务器存储文档和与该文档相关联的索引。当各个服务器接收到来自PC的检索请求时,它将从PC接收的检索条件和存储在其内的索引进行比较,并且将检索结果通知PC。PC合并由服务器通知的检索结果,以便向用户显示合并的结果。
如果PC向其作出检索请求的服务器的数目是大量的,执行检索可能是费时的。尤其是在PC等待从所有服务器接收检索结果并且合并检索结果以便显示的情况下,直到PC从所有服务器接收到检索结果为止,检索结果不会被输出显示。这降低了检索效率。
在另一方面,图1B是描述根据第一实施例的文档检索系统(多服务器检索系统)的配置的方框图。此处,用户首先使用PC103将检索条件(关键字)传送到管理服务器101,并且与此同时将该检索条件传送到服务器105到107以便请求文档检索。基于预定的收集条件(例如,在预定的时期内该检索条件已经被至少使用了预定次数),管理服务器101确定用户输入的检索条件是否是经过了索引收集的检索条件。
当确定该检索条件经过索引收集时,在某个服务器内收集相应于该检索条件的索引。在该收集操作中,可以将存储在服务器105到107内的索引传送到某个服务器。可替换地,可以复制该索引以便存储在某个收集目的地服务器内,而将该索引留在最初的服务器上。另外,管理服务器101管理指示已经为其收集了相应索引的检索条件的信息,以及指示已经执行了相应索引的这种收集的信息。
之后,在用户指定某个检索条件并且给出指令以便执行检索的情况下,管理服务器101确定它是否管理着指定的检索条件。此处,如果管理服务器101管理着用户指定的检索条件,意味着已经收集了相应于它的索引。因此,管理服务器101识别出其中收集有该索引的服务器,并且向该服务器通知检索条件,从而请求检索。
服务器105到107中的一个或管理服务器101可以是其中收集有索引的服务器。在第一实施例中,描述这样的情况,即,在服务器105到107中存储着最多的相应于已收集索引的文档的一个内收集索引(图1中,服务器105到107中之一)。
在这种情况下,当将某个关键字指定为检索条件至少预定次数时,识别存储着最多的由该关键字检索的文档的服务器。然后,将由该关键字检索的文档的索引收集在该服务器(例如,服务器106)中。因此,当在随后任意时候指示以该关键字进行检索时,可以通过请求其中收集有所述索引的服务器106以便执行检索,从存储在其他服务器105和107内的文档中执行检索。因此,提高了检索效率。
在该情况下,需要管理为其收集了相应索引的关键字和其中收集有这种索引的服务器。出于这个原因,在第一实施例中,对于各个被指定为检索条件的关键字,管理服务器101例如以图11中所示的表格的形式存储指示其中收集有相应于各个关键字的索引的服务器的信息。在图11中,图11中所示的关键字的索引收集表分别存储在服务器105、106和107内。
虽然在当前实施例中管理服务器101被示为与服务器105到107分开的服务器,管理服务器101可以结合在服务器105到107中的任意一个内。可替换地,可将管理服务器101结合在PC103内。
另外,在各个服务器上为每个文档产生索引,并且索引包含指示包含在文档内的字符串、文档名、文档准备日期和时间、准备文档的用户等的信息。指定为检索条件的关键字代表文档本身的索引,或用户输入以便执行检索的包含在文档的索引内的字符串。
图2是示出了根据本发明的第一实施例的文档检索系统的配置的方框图。
该系统包括通过因特网104互连的管理服务器101、文档服务器(文档存储装置)105和PC(个人计算机)103。虽然除了文档服务器105之外的两个或更多文档服务器(例如106、107)通过因特网104连接到该系统,此处仅指示文档服务器105作为代表例。管理服务器101可以结合在两个或更多文档服务器中的一个内。
在这种配置中,通过操作PC103中提供的被称为浏览器的软件,用户可以访问管理服务器101或文档服务器105以便获得文档数据。应当注意,在各个文档服务器内,存储有文档数据主体和相应于它的索引。
虽然在第一实施例中因特网104用于连接服务器,本发明不限于此。例如,可以使用LAN(局域网)或其他网络系统。
管理服务器101是用于提供用于实现综合两个或更多文档服务器的文档登记/检索服务功能的服务器。例如通过使用PC103的浏览器访问由管理服务器101提供的某个地址(URL),用户可以在各个文档服务器内登记文档,或观看、获得、更新文档服务器内存储的文档或从中执行检索。
管理服务器101监视用户指定为用于检索文档的检索条件的关键字。然后,根据存储在设置存储单元110内的设置数据(例如上述收集条件),管理服务器101提取频繁使用的关键字,并且判断是否收集相应于这些关键字的索引。当收集相应于某个关键字的索引时,管理服务器101从文档服务器收集相应于该关键字的索引,并且在某个服务器(文档服务器中的一个或管理服务器101)内存储该索引。在这种情况下,通过在存储有最多的相应于已收集索引的文档的文档服务器内收集索引,可以更有效地进行下面描述的检索。
然后,当用户利用PC103输入的关键字与为其收集了索引的关键字相同时,对存储该已收集索引的文档服务器作出检索请求。
当用户在已经收集了索引之后登记新文档时,确定是否将收集从该文档产生的索引。如果将收集该索引,将文档主体(文档数据)和其索引存储在该索引的收集目的地文档服务器内。
在另一方面,文档服务器105存储文档主体和索引,并且提供诸如登记、观看、获得、更新和检索文档的功能。用户利用文档服务器105提供的服务,以便通过因特网104访问预定地址(一般为URL),从而访问存储在文档服务器105内的文档。
当两个或更多文档服务器中的每一个接收到利用被指定为检索条件的关键字的检索请求时,参考存储在其内的索引,并且检索相应于该检索条件的文档,并且将检索结果发送到PC103或管理服务器101。
当文档服务器105接收到来自PC103的文档登记请求时,它提供在其内提供的文档登记单元121上登记该文档的功能。
接着,描述第一实施例的管理服务器101。
设置存储单元110存储各种设置数据。设置数据包含用于确定对于如上所述的收集相应于某个关键字的索引来说是否收集所述索引的信息。换言之,当获得关键字的使用频率时,设置数据定义监视关键字的天数和有多少最频繁使用的关键字的分级之下的关键字等级应当接受索引收集。可替换地,设置数据确定有多少具有最大检索文档数目和/或最大检索数目的关键字的分级之下的关键字等级应当接受索引收集。进一步,设置数据确定是否组合使用的频率、以及检索的文档数目和/或检索数目。另外,设置数据包含识别其中存储已收集索引的文档服务器105的信息。
另外,设置数据确定对于文档的登记来说相应于有多少最频繁使用的关键字的分级之下的关键字等级接受比较的索引。另外,当登记的文档的索引在登记时接受收集时,设置数据包含关于是否在收集目的地服务器上登记文档主体的信息。应当注意,可以由管理管理服务器101的服务提供方任意设置该设置数据。
基于指定为检索条件的关键字,命中数据存储器111存储从文档服务器105发送的索引数目(即,命中数目)和与文档服务器105到107相关联的关键字的使用数目作为命中表(见图8)。在基于存储在设置存储单元110内的设置数据的条件下,索引管理器112比较存储在命中数据存储器111内的关键字的命中数据,以便确定接受索引收集的关键字。然后,索引管理器112从文档服务器获得相应于该关键字的索引,并且将所述索引与之相关联地存储在存储单元118内。以这种方式,产生通过收集(复制)频繁使用的索引而获得的已收集索引(见图9)。将这样获得的已收集索引发送到存储着最多的由该关键字检索的文档的文档服务器,以便存储在其中。
文档寄存器113登记由用户指示登记的文档。关键字查看单元115获得用户指定的关键字,以及关于从文档服务器105发送的索引的命中数目的信息,并且在存储单元118内存储该关键字和信息。在登记文档时,索引提取器116产生文档的索引。当登记文档时,登记目的地鉴别器114识别一个文档服务器,在该文档服务器内从两个或更多文档服务器中收集由索引提取器116提取的索引。然后,基于由设置存储单元110管理的信息,登记目的地鉴别器114确定是否需要将文档主体登记在该索引的收集目的地文档服务器内。当需要这种登记时,将该索引的收集目的地文档服务器选择为文档的登记目的地。控制器117控制管理服务器101的整个操作。以RAM(图3中的202)、HDD(图3中的209)等配置存储单元118,并且存储单元118在控制器117的控制下存储上述各种表和数据。网络接口119控制通过因特网104或LAN的通信。
接着描述文档服务器105。
检索单元120当接收到来自PC103的作为检索条件的关键字时,从登记在文档登记单元121内的索引中执行检索,以便提取包括该关键字的索引。文档登记单元121当被指示登记来自PC103的文档时,在存储单元123内存储从该文档中提取的文档主体和索引。控制器122控制文档服务器105的整个操作。以RAM(图3中的202)、HDD(图3中的209)等配置存储单元123,并且存储单元123在控制器122的控制下存储诸如上述的表的各种数据。网络接口124控制通过因特网104或LAN的通信。
如下所述,以包括CPU、ROM、RAM、HDD等的信息处理装置(计算机)配置管理服务器101和文档服务器105以及用户使用的PC103。另外,这些服务器通过例如Web服务提供功能。
图3是示出了根据本实施例的管理服务器101和文档服务器105的特定硬件配置的方框图。上述PC103也具有相同的硬件配置。
在图3中,CPU201根据存储在程序ROM203和RAM202内的程序,控制服务器的整个处理。RAM202起用于CPU201的主存储器、用于执行程序的区域、用于程序的执行区域和数据区域的作用。程序ROM203是存储CPU201的操作程序的只读存储器。程序ROM203包括存储作为用于控制服务器设备的系统程序的基本软件(OS)的程序ROM,以及存储操作系统所需的信息等的数据ROM。可以将系统程序安装在HDD209上(后面描述),而不是ROM203上,并且将程序装入RAM202,以便在其执行时执行。网络接口(NETIF)204控制通过因特网104、LAN等的数据传送,并且评估连接状态。视频RAM205存储用于显示单元206的显示数据。显示单元206是诸如液晶显示器或CRT显示器的显示设备。键盘控制器(KBC)207将由键盘208或指点设备输入的信号输出到总线200。HDD209是硬盘驱动器,用于存储应用程序或各种数据(也起上述的信息存储单元118和123的作用)。FDD210控制对于可移动盘(存储介质)213(诸如floppy(注册商标)盘驱动器和CD-ROM驱动器)的数据写和读出。存储介质213的例子包括FD或外部硬盘、光学存储介质(例如,CD-ROM)、磁光存储介质(例如,MO)、半导体存储介质(例如,存储卡)或其他可移动数据存储设备(可移动设备)。还可以利用存储在HDD209上的应用程序或数据,将其存储在FDD210上。打印机控制器(PRTC)211用于控制向打印机(PTR)212的输出信号。打印机212是诸如激光束打印机(LBP)的打印装置。总线200是用于连接上述单元的传送总线(地址总线、数据总线、输入/输出总线和控制总线)。
应当注意,图2中所示的管理服务器101的设置存储单元110、命中数据存储器111、索引管理器112、文档寄存器113、登记目的地鉴别器114、关键字观看单元115、索引提取器116等可由CPU201和RAM202、HDD209和程序实现。文档服务器105的检索单元120、文档登记单元121等可由CPU201、HDD209和程序等实现。
图4和5是描述根据第一实施例的管理服务器101上的检索处理的流程图。用于执行该处理的程序存储在ROM203或RAM202中,并且在CPU201的控制下执行。
在步骤S1中,接收用户输入PC103中的检索指令和用作检索条件的关键字。
图7是示出了当用户将用于检索的关键字输入PC103中时显示的示例关键字输入窗口的图。
图7示出了将关键字“工程A”输入到用于输入关键字的对话框701内的状态。当在该状态下指定“执行”按钮702时,将检索指令和输入的关键字(“工程A”)从PC103发送到管理服务器101。
这意味着检索在其主体或文档名称中包含字符串“工程A”的文档。“执行”按钮702指示开始检索。
接着,程序进入步骤S2,在该步骤确定是否收集了相应于在步骤S1中接收的关键字的索引。此处,通过参考例如图11中所示的表,识别其中收集了相应于该关键字的索引的服务器,并且向该服务器请求检索。即,基于在步骤S1中获得的关键字向索引管理器112作出查询,从而确定是否已经收集了相应于该关键字的索引。
以这种方式,如果确定已经收集了相应于该关键字的索引,程序从步骤S2进入步骤S3,在该步骤更新命中数据存储器111内存储的命中表的命中数据。
以这种方式,可以识别其中收集了相应于输入的关键字的文档的索引的文档服务器。从而,通过请求识别的服务器执行检索,也可以从存储在其他文档服务器内的文档中执行检索,这提高了检索效率。
图8是示出了根据第一实施例存储在命中数据存储器111内的示例命中表的图。
在图8的例子中,对于关键字“工程A”、“东京”和“照相机”中的每一个,登记使用数目、存储检索的文档的服务器的名称(文档服务器的名称)、各个服务器内的检索文档的数目、登记日期、更新日期。每次使用相应的关键字时,将使用数目增加1。因此,可以识别该关键字已经使用了多少次。检索文档的数目是指示作为以该关键字从存储在各个服务器内的索引中进行检索的结果检索出了多少文档的信息。
因此,在步骤S3中,如果关键字例如是“工程A”,对于存储着相应于该关键字的文档的各个文档服务器,该关键字的使用数目被增加1。
图9A和9B是示出了存储已收集索引的第一实施例的示例的已收集索引表的图,其中收集了相应于关键字(“工程A”)的索引。该已收集索引表例如存储在文档服务器105的存储单元108内。
图9A示出了包含相应于关键字“工程A”的索引的文档存储在各个文档服务器内的状态。即,文档服务器105存储着“文档1”和“文档2”作为包含关键字“工程A”的字符串的文档。在文档服务器106中,存储着包括“文档3”到“文档6”的4个文档作为包含关键字“工程A”的字符串的文档。在文档服务器107中,存储着包括“文档7”到“文档9”的3个文档作为包含关键字“工程A”的字符串的文档。
图9B示出了相应于关键字“工程A”的索引作为已收集索引集中登记在文档服务器106内的状态。
在这个例子中,通过收集存储在文档服务器105到107内的“文档1”到“文档9”的索引作为相应于关键字“工程A”的索引,产生已收集索引。然后,将已收集索引登记在存储着最多相应于该已收集索引的文档的文档服务器106内。
此时,在图11中所示的表内,关键字“工程A”的已收集索引表的存储目的地是“文档服务器106”。
返回图4,在步骤S3中更新命中表之后,程序进入步骤S4。识别出其中登记着已收集索引的文档服务器。在上述图9的例子中,这相应于文档服务器106。在步骤S4中,通过传送关键字将检索请求发送到文档服务器106。在步骤S5中,PC103等待来自文档服务器106的检索结果,并且当收到检索结果时,程序进入步骤S6,在该步骤显示获得的结果。因此,PC103的用户可以基于检索结果了解其中登记着所希望的文档的文档服务器,并且从该文档服务器获得所希望的文档。
图10是示出了显示文档检索结果的示例窗口的图。
在图10中,列出了以关键字(“工程A”)检索的文档名称、其中登记着该文档的文档服务器、所述文档的大小和更新日期和时间。还可以显示除了上述文档信息之外的信息(谁准备了该文档等)。
当作为已收集索引登记相应于用于检索的关键字的索引时,由于仅需访问某个服务器,提高了检索效率。
在另一方面,如果在步骤S2中未在已收集索引表内登记相应于关键字的索引,程序进入步骤S11(图5),以便确定该关键字是否登记在命中数据存储器111的命中表内。如果登记了该关键字,程序进入步骤S12,并且更新相应的命中表。如果未登记该关键字,程序进入步骤S13,在该步骤将关键字登记在命中表内。在以这种方式执行步骤S12或步骤S13之后,程序进入步骤S14。在步骤S14中,识别接受以该关键字的检索的文档服务器,并且将关键字传送到该文档服务器,以便请求检索。在步骤S16中,检查是否从所有接受检索的文档服务器收到了检索结果。如果收到了,程序进入步骤S17,在该步骤合并来自这些文档服务器的检索结果。步骤S14到S17中执行的处理类似于传统的多服务器检索处理的那些处理(图1A)。
接着,在步骤S18中,基于通过步骤S12内的处理更新的命中表,确定是否存在满足存储在设置存储单元110内的设置数据(收集条件)的任何关键字。此处,设置存储单元110的设置数据(收集条件)例如包括从最后更新日期以来是否经过了一个星期(一个星期是更新周期),或是否选择了相应于具有第一到第三使用频率的关键字的索引等。这些条设置信息部分可以单独或组合使用,以便确定将登记在已收集索引表内的索引。
例如,在图8中,假设当前日期是2005年11月7日。假设设置存储单元110的设置数据使得对具有第一、第二或第三使用频率中的任意一个、并且在一个星期内已被更新的关键字进行索引收集。在该情况下,由于对在一个星期内已被更新的关键字进行索引收集,所讨论的更新的日期是2005年11月1日以及之后。因此,在该情况下,仅对关键字“工程A”进行索引收集。
当在步骤S18中确定没有新登记的索引时,处理终止而不进行进一步操作。如果确定存在任何将要新登记的索引时,程序进入步骤S19,并且请求各个文档服务器以该关键字执行检索。然后,各个文档服务器以检索单元120检索包括该关键字的文档的索引。然后,基于来自各个文档服务器的检索结果,获得可收集索引组(步骤S20)。在该情况下,索引管理器112产生如图9B所示的已收集索引表。然后,步骤进入步骤S21,将已收集索引表传送到存储着最多相应于已收集索引的文档的文档服务器(在上面的例子中,文档服务器106),并且处理终止。还相应更新图11中所示的表。
接着,描述登记文档数据的处理。
图6是描述根据第一实施例在文档检索系统上登记文档数据的处理的流程图。
在步骤S31中,输入将要登记的文档数据。在步骤S32中,基于该文档数据,由索引提取器116提取它的索引。接着,在步骤S33中,确定提取的索引是否已经登记为上述的已收集索引。当已经登记时,程序进入步骤S34,并且确定是否在存储着已收集索引的文档服务器(在上述例子中,文档服务器106)内登记文档主体(文档数据)。基于存储在设置存储单元110内的设置数据作出该确定。在该情况下,如果设置使得将文档主体登记在存储着已收集索引的文档服务器内,程序进入步骤S35,在该步骤将文档数据登记在该文档服务器上。
结果,由于将文档数据登记在其中登记着频繁用于检索的关键字的文档服务器内,将提高用户的可操作性。
在另一方面,在步骤S33中,如果提取的索引未作为上述已收集索引登记,或在步骤S34中,设置使得将文档数据登记在除了存储着已收集索引的服务器之外的文档服务器内,则程序进入步骤S36,并且将文档数据登记在由用户指定的文档服务器内。
虽然描述了从存储在文档服务器内的文档中执行检索的情况,文档可以是文本数据或图像数据,诸如位图数据。还可以将本发明应用于从不包括字符串信息的图像中执行检索的情况。
[实施例2]
接着,描述本发明的第二实施例。在第一实施例中,在存储着最多的相应文档的文档服务器内收集存储在两个或更多文档服务器105到107内的文档的索引,并且PC103向收集目的地文档服务器作出检索请求。
相反,在第二实施例中,将索引收集到请求检索的装置(在第一实施例中,PC103)。因此,当将已被收集了相应索引的关键字指定为检索条件时,该装置可以通过参考收集在其自己的装置(PC103)内的索引,从存储在各个文档服务器内的文档中执行检索。即,由于不需要通过因特网请求检索,可以进一步提高检索效率。
图12是示出了根据本发明的第二实施例的文档检索系统的配置的特征的图。
第二实施例的文档检索系统包括与第一实施例中描述的文档服务器105到107类似、并且能够存储文档和文档的索引的文档服务器1201到1204。文档服务器1201具有以类似于PC103的方式接收来自用户的检索指令和作为检索条件的关键字的输入、并且请求文档服务器1202-1204执行检索的功能。
除了文档服务器1201到1204之外,第二实施例的文档检索系统可以包括其他文档服务器。
通过输入关键字作为检索条件,文档服务器1201的用户可以从存储在文档服务器1201或文档服务器1202到1204中的任意一个内的文档中执行检索。接收到用户输入的关键字的文档服务器1201将输入的关键字传送到文档服务器1202到1204,并且请求它们执行检索。接收了该关键字的文档服务器1202到1204分别参考存储在它们自己的服务器内的索引,以便检索包含收到的关键字的文档,并且将检索结果通知作出检索请求的文档服务器1201。
此时,由于文档和文档的索引也存储在文档服务器1201内,文档服务器1201也通过参考存储在其内的索引,从存储在其自己的设备内的文档中执行检索。
此处,在文档服务器1201从存储在文档服务器1201到1204内的文档中执行检索的情况下,与请求文档服务器1202到1204执行检索并且接收检索结果时相比,文档服务器1201当从其自己拥有的服务器内存储的文档中执行检索时可以用更短时间完成检索。尤其是,在文档服务器1201通过网络请求文档服务器1202到1204执行检索的情况下,文档服务器1201需要等待,直到它接收到来自所有文档服务器的检索结果为止。
在另一方面,在文档服务器1201从存储在其自己拥有的设备内的文档中执行检索时,由于不需要通过网络进行数据交换,可以用更短时间完成检索。因此,在第二实施例中,将满足某些条件的文档的索引预先收集在可能被用户操作进行检索的文档服务器内。
例如,在图12中所述的例子中,也将存储在文档服务器1203内的文档F的索引F和存储在文档服务器1204内的文档H的索引H的复本存储在文档服务器1201内。结果,如果用户下一次指示在文档服务器1201内的检索,由于文档F和H的索引存储在文档服务器1201内,可以用较短时间获得检索结果。
图13是示出了根据第二实施例的文档检索系统的配置的图。该系统包括通过因特网1300连接的两个或更多文档服务器1201到1204。虽然因特网1300用于连接服务器,本发明不特别局限于此。例如,可以使用LAN或其他网络系统。
文档服务器1201到1204分别存储文档主体和文档索引,并且提供诸如登记、观看、获得、更新和检索文档的功能。用户使用文档服务器1201到1204提供的检索功能检索系统中登记的文档。在收到通过指定关键字进行的检索请求之后,文档服务器1201到1204分别判断该关键字是否相应于由该服务器管理的索引。如果关键字相应于索引,服务器将这种结果通知用户。当登记文档时,文档服务器1201到1204提供登记文档的功能。
接着,描述文档服务器1201的配置。文档服务器1202到1204的配置可以类似于文档服务器1201的配置,或可以类似于第一实施例的文档服务器105到107的配置。
显示单元1320是诸如提供在文档服务器1201内的LCD显示器的显示设备。通过在显示单元1320上显示图7中所示的窗口,检索条件输入单元1321接收由用户输入的检索关键字。检索单元1322当从用户收到利用指定为检索条件的关键字的检索请求时,通过参考存储在其自己的设备内的索引执行检索,并且将检索结果提供给用户。检索单元1322当收到来自其它文档服务器的检索请求时,以类似方式执行检索,并且将结果提供给请求了检索的文档服务器。
在显示单元1320上显示检索结果,从而将其通知用户。索引管理器1323管理存储在文档服务器1201内的所有索引。将文档主体和索引存储在存储单元1311内。另外,存储在文档服务器1201内的索引包括相应于存储在其自己的设备内的文档主体的索引,以及主体存储在其它文档服务器内的文档的索引。
检索条件传送单元1324将在检索条件输入单元1321中输入的检索关键字传送到其它文档服务器。在另一方面,检索条件接收器1325接收从自其它文档服务器传送的检索关键字。检索结果传送单元1326将检索单元1322执行的检索的结果传送到其它文档服务器。在另一方面,检索结果接收器1327接收从其它文档服务器传送的检索结果,并且在显示单元1320上显示其。统计数据存储器1328存储关于在检索条件输入单元1321中输入的关键字的统计数据等。
基于存储在统计数据存储器1328内的统计数据,收集条件创建器1329提取用于文档服务器1201内的索引收集的条件。此处使用的收集条件由包含在各个文档的索引内的关键字和指示收集目的地文档服务器的信息等构成。收集条件传送单元1330将收集条件创建器1329创建的收集条件传送到其它文档服务器。收集条件接收器1331接收从其它文档服务器传送的收集条件。
收集条件存储单元1332在存储单元1311内存储由收集条件创建器1329创建的收集条件和从其它文档服务器接收的收集条件。基于存储在收集条件存储单元1332内的收集条件,收集条件鉴别器1333从索引管理器1323管理的索引中确定落在收集条件下的索引。
索引传送器1334将由收集条件鉴别器1333确定为要被收集的索引传送到指定的文档服务器。索引接收器1335接收从其他文档服务器传送的索引,并且将其存储在存储单元1311内。
文档登记单元1336在文档服务器1201内登记新文档。通过网络接口1310从外部装置(未示出)输入将要登记的文档的主体(以及相应索引)。此时,当要登记的文档被收集条件鉴别器1333确定为要接受索引收集时,文档登记单元1336利用索引传送器1334将相应于该文档的索引传送到指定的文档服务器。
文档服务器1201到1204的硬件配置与图3中所示的管理服务器101和文档服务器105的硬件配置类似。
图14和19是描述根据第二实施例文档服务器上的检索处理的流程图。用于执行该处理的程序存储在ROM203或RAM202内,并且在CPU201的控制下执行。
图14描述用户对其进行操作以便执行检索的文档服务器(在该情况下,文档服务器1201)上的处理。在步骤S41中,接收用户输入的检索指令和用于检索的关键字。输入检索关键字的示例窗口类似于图7中所示的窗口。然后,程序进入步骤S42,在该步骤将步骤S1401中输入的关键字添加到存储在统计数据存储器1328内的信息以便进行更新。
统计数据存储器1328为图15中所示的表的格式。在图15中,对于用于检索的关键字,对检索数目计数。即,每次将预定的关键字指定为检索条件时,将检索数目增加1,从而计数检索数目。
然后,程序进入步骤S43,在该步骤检索单元1322确定是否将包含在步骤S41接收的关键字的字符串的索引登记在其自己的设备内。在该情况下,通过参考图16中所示的表确定是否登记包含在步骤S41接收的关键字的字符串的索引。由索引管理器1323管理图16中所示的表。索引管理器1323根据索引的添加/删除时常更新该表的信息。
在图16中所示的例子中,索引标题、检索关键字和文档位置被彼此相关联地存储。观看文档位置栏,包括指示着除了执行检索的文档服务器(在该情况下,文档服务器1201)之外的文档服务器的索引。这指出登记在其他文档服务器内的文档的索引被在执行检索的文档服务器1201内复制。
程序进入步骤S44,在该步骤检索条件传送单元1324将检索条件传送到其他文档服务器(在该情况下,文档服务器1202到1204)。
图17是示出了在步骤S44中传送的示例检索条件的图。在图17中,指定检索关键字和将向其发送检索结果的文档服务器。
然后,程序进入步骤S45,在该步骤检索结果接收器1327从其他文档服务器接收检索结果。在从在步骤S44中已向其传送了检索条件的所有文档服务器接收到检索结果的情况下,一系列处理终止。在包括从其他文档服务器接收的检索结果中的检索结果中,由所述检索检索到的那些检索结果不时显示在显示单元1320上,而不用等待接收到所有检索结果。
图18是示出了文档服务器(文档服务器1201)的示例检索结果显示的图,用户操作该文档服务器执行检索。
图18示出当“橙子”指定为检索关键字时的检索结果。如果存储在文档服务器1201内的索引如图16中所示,索引A和索引C包含“橙子”作为关键字,并且因此作为文档服务器1201从存储在其内的文档中执行检索的结果检索出来。附图标记1801代表在相对短的时间内显示出来的、作为文档服务器1201从存储在其内的文档中执行检索的结果检索到的检索结果。附图标记1802代表从其他文档服务器1202、1203和1204检索的检索结果。在该情况下,由于通过因特网1300从其他文档服务器接收检索结果,与检索结果1801相比在显示结果之前通常要花费时间。
图19是描述在图14的步骤S44中向其传送了图17中所示的检索条件的文档服务器(在该实施例中,文档服务器1202到1204)上的处理操作的流程图。
在步骤S51中,检索条件接收器1325接收检索条件。然后,程序进入步骤S52,在该步骤检索单元1322确定其自己的设备内是否登记有包含在步骤S51中接收的关键字字符串的任何索引。此处,以类似于步骤S43中使用的方法执行检索,即,通过由检索单元1322参考存储在各个文档服务器内的图16中所示的表,检索包括作为检索关键字在步骤S51中接收的关键字的索引执行检索。程序进入步骤S53,在该步骤检索结果传送单元1326将在步骤S52获得的检索结果传送到指定的文档服务器。此时,即使检索到的索引数目为“0”,检索结果传送单元1326也传送检索结果。
接着,以文档服务器1201为例子描述索引收集处理。
图20、22和23是描述在文档服务器1201上执行的索引收集处理的流程图。
首先,在步骤S61中,收集条件创建器1329参考统计数据存储器1328,以便提取频繁指定为用于从其自己的设备中检索的检索条件的关键字作为收集条件。此处,从其他文档服务器(文档服务器1202到1204)获得包含作为收集条件提取的关键字的索引,并且在文档服务器1201内创建其复本,从而在文档服务器1201内收集包括这些关键字的索引。
将以这种方式创建的收集条件存储在收集条件存储单元1332内。可以定期或由用户操作触发不定期地创建收集条件。例如,可以通过步骤S42中的存储在统计数据存储器1328内的统计数据的更新触发来创建收集条件。
然后,程序进入步骤S62,在该步骤确定是否已经更新了已存储在收集条件存储单元1332内的收集条件。当已经更新时,程序进入步骤S63,并且收集条件传送单元1330将更新的收集条件传送到其他文档服务器(在该实施例中,文档服务器1202到1204)。
图21是示出了在图20的步骤S63中传送的示例收集条件的图。
该收集条件包含在步骤S61中提取的关键字,以及指示该关键字的收集目的地服务器的信息。此时,文档服务器1201挂起一系列处理,并且停留在待命状态,直到它接收到从其他服务器传送的索引为止。
图22是描述已经收到图20中步骤S63内传送的收集条件的文档服务器上的处理操作的流程图。
起初,收集条件接收器1331在步骤S71中接收收集条件。程序进入步骤S72,在该步骤将在步骤S71中接收的收集条件存储在收集条件存储单元1332内。
然后,程序进入步骤S73,在该步骤收集条件鉴别器1333确定在其自己的设备中是否登记有相应于在步骤S71中接收的收集条件的任何索引。此处,以类似于步骤S43中使用的方法执行确定,即,通过收集条件鉴别器1333参考图16中所示的表,确定是否登记了包括步骤S71中接收的关键字字符串的任何索引而执行确定。
接着,程序进入步骤S74,并且如果在步骤S73中检索到将要收集的索引,程序进入步骤S75。在步骤S75中,索引传送器1334将在步骤S73中检索到的索引传送到指定的服务器。此时,在其内保留登记在其自己的设备内的索引,并且将其复本传送到传送目的地文档服务器,从而复制该索引。如果在步骤S73中检索到两个或更多索引,将所有索引的复本传送到相应的指定的文档服务器。
图23是描述从其他文档服务器传送索引时文档服务器上的操作的流程图。
在步骤S81中,索引接收器1335接收传送的索引。程序进入步骤S82,在该步骤索引管理器1323将在步骤S81中接收的索引存储在存储单元1311内。然后,终止一系列的处理。
通过上述处理,在文档服务器中收集包括频繁使用的检索关键字的文档的索引。例如,在存储在文档服务器1201内的索引如图16所示的情况下,索引C和D作为分别从文档服务器1203和1204复制的结果存储在文档服务器1201内。
下面以文档服务器1201为例描述登记文档的处理。
图24是描述在文档服务器上登记文档的处理的流程图。如上所述,此处通过网络接口1310从外部装置(未示出)输入将要登记的文档的主体(以及相应索引)。如第一实施例所述,可以在文档服务器内提取相应于登记的文档的主体的索引(步骤S31)。
首先,在步骤S91中,登记在文档登记单元1336内的文档主体、和相应索引被存储在存储单元1311内。然后程序进入步骤S92,在该步骤收集条件鉴别器1333确定在步骤S91存储的索引是否落在收集条件存储单元1332内存储的收集条件之下。如果在步骤S91中存储的索引落在收集条件下,程序进入步骤S93。在步骤S93中,索引传送器将落在收集条件下的索引传送到由该收集条件指定的文档服务器。当索引落在两个或更多收集条件下时,在步骤S93中,将索引传送到由所有收集条件指定的收集目的地文档服务器。
下面参考图25A和25B描述登记文档的示例处理。
图25A是示出了相应于将要登记的文档的索引的图。图25B示出了存储在该文档被登记在其内的文档服务器(在该情况下,文档服务器1201)的收集条件存储单元1332内的收集条件。如图25A所示,登记的文档包括关键字,诸如“熊猫”和“大象”。在图25B中,由于分别在文档服务器1203和1204内收集关键字,将索引传送到文档服务器1203和1204。
以上述处理,还可以为新登记的文档执行索引的收集处理。在接收了在图24中的步骤S93传送的索引的文档服务器在其自己的设备内复制索引时,以与图23中所述相同的处理执行这种复制。
以这种方式,在用户对其进行操作以便执行检索的文档服务器内,预先收集相应于频繁被指定为检索条件的关键字的索引。结果,由于可以在该文档服务器的设备内执行涉及参考已收集索引的检索,快速检索成为可能。
[实施例3]
接着,描述本发明的第三实施例。在第二实施例中,在可能被操作以进行检索的文档服务器内,预先复制包括频繁使用的检索关键字的索引。相反,在第三实施例中,假设将文档显示装置、打印装置等用作文档服务器,并且基于登记的文档的特性将索引在某个文档服务器内复制。
假设在文档服务器内显示或打印检索的文档。在第三实施例中,类似于第二实施例,用户操作文档服务器检索目标文档。从操作的文档服务器执行检索,并且同时该文档服务器将检索条件传送到其他文档服务器,从而请求检索。如果所希望的文档登记在用户操作的文档服务器内,由于从其自己的设备内检索文档,可以进行快速检索。
图26是示出了根据本发明的第三实施例的文档检索系统的概念图。在图26中,假设各个文档服务器例如是图像显示装置。另外,关于作为文档服务器的图像显示装置的能力,假设存在能够显示彩色图像的文档服务器和仅能够显示单色图像的文档服务器。
在该文档检索系统中,在将彩色图像和单色图像登记为文档的情况下,假设从能够进行彩色显示的文档服务器检索彩色图像并且显示。出于该原因,通过预先在能够进行彩色显示的文档服务器内收集(复制)相应于彩色文档的索引,可以短时间从能够进行彩色显示的收集目的地文档服务器检索彩色文档。
在图26中,文档服务器2601是能够进行彩色显示的文档服务器,并且文档服务器2602到2604是仅能够进行单色显示的文档服务器。在图26中,在文档服务器2601中复制和存储相应于彩色文档的索引F和H。即,在文档服务器2601内收集相应于彩色文档的索引。因此,当从文档服务器2601检索彩色文档时,由于从其自己的设备内检索彩色文档,可以短时间检索彩色文档。
如上所述,在第三实施例中,根据登记的文档的特性确定索引的收集目的地文档服务器。在第三实施例中,描述文档服务器是图像显示装置的情况,但是文档服务器不限于此。例如,当文档服务器是打印装置时,这样的配置是可行的,其中将相应于由大量页构成的数据的索引复制在能够高速打印的文档服务器或可消耗品大量剩余的文档服务器上。将相应于图形文档的索引复制在具有高打印分辨率的文档服务器内的配置也是可行的。
图27是示出了根据第三实施例的文档检索系统的配置的图。除了第二实施例中描述的配置之外,增加了文档属性鉴别器2701和文档服务器能力存储单元2702。除此之外,配置与图13中所示的相同。文档属性鉴别器2701确定登记的文档是彩色图像还是单色图像。文档服务器能力存储单元2702存储各个文档服务器的显示单元1320的能力信息。由于除了登记文档的处理之外,第三实施例的操作与上述第二实施例中描述的相同,因此省略对类似操作的描述。
图28是描述文档服务器上的文档登记处理的流程图。类似于第二实施例,通过网络接口1310从外部装置(未示出)输入将要登记的文档的主体(以及相应索引)。如第一实施例中所述,可以在该文档服务器中提取相应于登记的文档的主体的索引(步骤S31)。
首先,在步骤S2801中,文档登记单元1336在存储单元1311内存储输入文档主体和相应的索引。然后,程序进入步骤S2802,在该步骤收集条件鉴别器1333确定在步骤S2801中存储的索引是否落在存储在收集条件存储单元1332内的收集条件下。
如果在步骤S2801中存储的索引落在收集条件下,程序从步骤S2802进入步骤S2803,在该步骤索引传送器1334将落在收集条件下的索引传送到由收集条件指定的文档服务器。
在步骤S2803中索引相应于两个或更多收集条件的情况下,将索引传送到由收集条件指定的所有收集目的地文档服务器。然后程序进入步骤S2804,在该步骤文档属性鉴别器2701确定登记的文档的属性。在该情况下,检测文档的颜色类型(彩色或单色)和图像大小。
然后,程序进入步骤S2805,在该步骤确定在步骤S2804中确定的文档的颜色类型是否是“彩色”。如果颜色类型是“彩色”,程序进入步骤S2806。在步骤S2806中,通过参考文档服务器能力存储单元2702,确定能够以彩色显示根据在步骤S2804中确定的属性的大小的图像的文档服务器。如果存在任何能够进行这种显示的文档服务器,程序进入步骤S2807,在该步骤索引传送器1334将索引传送到在步骤S2806中确定为能够进行显示的文档服务器。
接着参考图29A和29B描述文档登记的例子。
图29A是示出了相应于登记的文档的示例文档属性的图。在图29A中,示出了文档的颜色类型和图像大小。
图29B是示出了指出存储在文档服务器能力存储单元2702内的各个文档服务器的能力的示例表的图。在图29A中,获得将要登记的文档的颜色类型(彩色)和图像大小(1024×768)。基于图29B,确定能够以彩色显示大小大于图像大小(1024×768)的图像的文档服务器2603适合于显示该文档。因此,将该文档的索引传送到文档服务器2603。此处,虽然文档服务器2601和2604能够进行彩色显示,由于关于图像大小的能力不足,不能选择它们。
以上面的处理,可以将新登记的文档的索引复制(登记)在具有可以以彩色和该图像的大小显示文档的显示单元的文档服务器内。
以这种方式,可以基于登记的文档的特性,将索引收集在希望操作用于检索的文档服务器内。结果,快速检索成为可能。
(其他实施例)
虽然上面详细描述了本发明的实施例,本发明可以应用于包括两个或更多设备的系统,并且可以应用于由单个设备构成的装置。
应当注意,可以通过将实现上述实施例的功能的软件程序直接或远程提供给系统或装置,并且允许所述系统或装置的计算机读取和执行提供的程序来实现本发明。在这种情况下,程序的形式对本发明来说不是必需的,只要提供该程序的功能即可。
因此,安装在计算机上以便在计算机自身上实现本发明的功能处理的程序代码用于实现本发明。换言之,实现本发明的功能处理的计算机程序本身也包括在本发明的范围内。在这种情况下,只要具有该程序的功能,它可以采用各种形式,诸如目标代码、解释执行的程序、提供给OS的脚本数据等。
用于提供程序的存储介质例如可以包括下列介质。即,floppy(注册商标)盘、硬盘、光盘、磁光盘、MO、CD-ROM、CD-R、CD-RW、磁带、非易失存储器卡、ROM、DVD(DVD-ROM、DVD-R)等。
可替换地,可以用下面的方法提供程序。即,使用客户计算机的浏览器访问因特网主页,以便将程序从主页下载到诸如硬盘等的存储介质上。在这种情况下,可以下载本发明的计算机程序或具有自动安装功能的压缩文件。另外,还可以通过将构成本发明的程序的程序代码划分为两个或更多文件,并且使得各个文件从不同主页下载提供该程序。换言之,允许两个或更多用户将用于实现本发明的功能处理的程序文件下载到计算机上的WWW服务器也包括在本发明的范围内。
另外,还可以设想用于提供的下列实施例,其中对本发明的程序加密,将其存储在诸如CD-ROM等的存储介质上,并且在用户间分发。在这种情况下,允许满足某个准则的用户通过因特网从主页下载用于解密的密钥信息,并且通过使用该密钥信息使得加密的程序以可执行的格式安装在计算机上。
另外,除了通过命令计算机执行它读取的程序实现上述实施例的功能的实施例之外的实施例也是可行的。例如,基于该程序的指令,运行在计算机上的OS等部分或全部地执行实际处理,并且基于该处理可以实现上述实施例的功能。
另外,可以将从存储介质读出的程序写到连接到计算机的扩展单元或插入计算机的扩展板内提供的存储器内。在这种情况下,在将程序写到存储器之后,基于程序的指令,扩展单元或扩展板内提供的CPU等部分或完全地执行实际处理,并且基于该处理实现上述实施例的功能。
如上所述,通过避免服务器的索引共享,本发明的实施例可以抑制多服务器检索系统内的索引的数据量的增加。
另外,当收集例如频繁检索或频繁使用的索引,并且被指定以便收集索引的关键字相应于所述索引时,从收集的索引执行利用该关键字的检索。因此,提高了检索效率。
虽然已经参考示例实施例描述了本发明,应当理解,本发明不限于所公开的示例实施例。下面的权利要求的范围与最宽的解释一致,从而包含所有这种修改、等同结构和功能。

Claims (12)

1、一种用于从通过网络连接的两个或更多文档管理服务器中登记的文档中检索文档的文档检索系统,所述文档检索系统包括:
为文档管理服务器的每一个提供的存储单元,用于存储文档和相应于所述文档的索引数据;
收集单元,用于从每一个所述文档管理服务器的所述存储单元中存储的索引数据中收集相应于满足第一检索条件的文档的索引数据;
确定单元,用于确定第二检索条件是否与第一检索条件相同,其中由用户指定所述第二检索条件;
检索单元,用于在所述确定单元确定第二检索条件与第一检索条件相同的情况下,通过参考由所述收集单元收集的索引数据检索文档;以及
收集信息管理单元,用于管理收集信息,所述收集信息包括指示第一检索条件的信息和指示在其中存储所述收集单元收集的索引数据的文档管理服务器的信息,
其中在所述确定单元确定第二检索条件与第一检索条件相同的情况下,基于由所述收集信息管理单元管理的信息,所述检索单元访问在其内存储所述索引数据的文档管理服务器,并且从文档管理服务器检索文档。
2、如权利要求1的文档检索系统,还包括:
日志信息管理单元,用于管理由用户指定的检索条件的日志信息;和
控制单元,用于在基于由所述日志信息管理单元管理的日志信息确定第一检索条件满足预定收集条件的情况下,控制所述收集单元,以便收集相应于满足所述第一检索条件的文档的索引数据。
3、如权利要求2的文档检索系统,其中所述预定的收集条件是这样的条件,即某个检索条件已经至少被用户指定了预定次数。
4、如权利要求1的文档检索系统,其中所述收集单元收集相应于满足第一检索条件的文档的索引数据,以便将该索引数据存储在所述文档管理服务器中存储着最多的满足第一检索条件的文档的文档管理服务器内。
5、如权利要求1的文档检索系统,还包括:
登记单元,用于在所述文档管理服务器中的其中一个内登记新文档和相应于所述新文档的索引数据,
其中在所述新文档满足第一检索条件的情况下,所述登记单元在存储由所述收集单元收集的所述索引数据的所述文档管理服务器中登记所述新文档和索引数据。
6、一种文档检索装置,用于从通过网络连接到所述文档检索装置的两个或更多文档管理服务器内登记的文档中检索文档,所述文档检索装置包括:
输入单元,用于接收检索条件以便检索文档;
日志信息管理单元,用于管理由所述输入单元接收的检索条件的日志信息;
确定单元,用于基于由所述日志信息管理单元管理的日志信息,确定是否存在满足预定收集条件的检索条件;
收集单元,用于在所述确定单元确定存在满足所述预定收集条件的检索条件的情况下,在所述文档检索装置内收集与满足所述满足预定收集条件的检索条件的文档相应的索引数据;
收集信息管理单元,用于管理收集信息,所述收集信息包括指示所述的满足预定收集条件的检索条件的信息和指示在其中存储所述收集单元收集的索引数据的文档管理服务器的信息;以及
检索单元,用于基于由所述收集信息管理单元管理的信息,访问在其内存储所述索引数据的文档管理服务器,并且从文档管理服务器检索文档。
7、如权利要求6的文档检索装置,其中所述预定收集条件是这样的条件,即某个检索条件由所述输入单元接收了至少预定次数。
8、如权利要求6的文档检索装置,还包括:
识别单元,用于识别文档的属性,
其中在所述确定单元确定存在满足所述预定收集条件的检索条件的情况下,所述收集单元收集与满足所述满足预定收集条件的检索条件的各文档中的基于所述识别单元的识别结果选择的文档相应的索引数据。
9、如权利要求8的文档检索装置,还包括:
能力信息管理单元,用于管理关于所述文档检索装置的功能的能力信息,
其中在所述确定单元确定存在满足所述预定收集条件的检索条件的情况下,所述收集单元收集与满足所述满足预定收集条件的检索条件的各文档中的基于所述识别单元的识别结果和所述能力信息管理单元管理的能力信息选择的文档相应的索引数据。
10、如权利要求9的文档检索装置,至少包括用于显示所述文档的显示单元或适用于打印所述文档的打印机,
其中所述能力信息管理单元至少管理关于所述显示单元的功能或所述打印机的功能的能力信息。
11、一种用于从通过网络连接的两个或更多文档管理服务器中登记的文档中检索文档的文档检索方法,所述方法包括步骤:
存储步骤,在每一个所述文档管理服务器中的存储单元内存储文档和相应于所述文档的索引数据;
收集步骤,从在所述存储步骤中存储在所述存储单元内的索引数据中,收集相应于满足第一检索条件的文档的索引数据;
确定步骤,确定第二检索条件是否与第一检索条件相同,其中由用户指定所述第二检索条件;
检索步骤,在所述确定步骤中确定第二检索条件与第一检索条件相同的情况下,通过参考在所述收集步骤中收集的索引数据执行检索;以及
收集信息管理步骤,管理收集信息,所述收集信息包括指示第一检索条件的信息和指示在其中存储所述收集步骤中收集的索引数据的文档管理服务器的信息,
其中在所述确定步骤中确定第二检索条件与第一检索条件相同的情况下,在所述检索步骤中,基于在所述收集信息管理步骤中管理的信息访问在其内存储所述索引数据的文档管理服务器,并且从文档管理服务器检索文档。
12、一种用于文档检索装置的文档检索方法,所述文档检索装置用于从通过网络连接到所述文档检索装置的两个或更多文档管理服务器内登记的文档中检索文档,所述方法包括步骤:
输入步骤,输入检索条件以便检索文档;
日志信息管理步骤,管理在所述输入步骤中输入的检索条件的日志信息;
确定步骤,基于在所述日志信息管理步骤中管理的日志信息,确定是否存在满足预定收集条件的检索条件;
收集步骤,在所述确定步骤中确定存在满足所述预定收集条件的检索条件的情况下,在所述文档检索装置内收集与满足所述满足预定收集条件的检索条件的文档相应的索引数据;
收集信息管理步骤,管理收集信息,所述收集信息包括指示满足预定收集条件的检索条件的信息和指示在其中存储所述收集步骤中收集的索引数据的文档管理服务器的信息,
检索步骤,基于在所述收集信息管理步骤中管理的信息访问在其内存储所述索引数据的文档管理服务器;并且
从文档管理服务器检索文档。
CNB2007100885240A 2006-03-14 2007-03-14 文档检索系统、文档检索装置及其方法 Expired - Fee Related CN100498791C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2006069902 2006-03-14
JP2006069902 2006-03-14
JP2007032681 2007-02-13

Publications (2)

Publication Number Publication Date
CN101059811A CN101059811A (zh) 2007-10-24
CN100498791C true CN100498791C (zh) 2009-06-10

Family

ID=38865917

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2007100885240A Expired - Fee Related CN100498791C (zh) 2006-03-14 2007-03-14 文档检索系统、文档检索装置及其方法

Country Status (1)

Country Link
CN (1) CN100498791C (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853288A (zh) * 2010-05-19 2010-10-06 马晓普 基于文档实时监控可配置的全文检索服务系统
JP6028392B2 (ja) * 2012-05-24 2016-11-16 富士通株式会社 生成プログラム、生成方法、生成装置、検索プログラム、検索方法および検索装置
JP6623547B2 (ja) * 2015-05-12 2019-12-25 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1744087A (zh) * 2004-09-02 2006-03-08 佳能株式会社 搜索文档的文档处理装置及其控制方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1744087A (zh) * 2004-09-02 2006-03-08 佳能株式会社 搜索文档的文档处理装置及其控制方法

Also Published As

Publication number Publication date
CN101059811A (zh) 2007-10-24

Similar Documents

Publication Publication Date Title
US6883001B2 (en) Document information search apparatus and method and recording medium storing document information search program therein
Hoe‐Lian Goh et al. A checklist for evaluating open source digital library software
CN102483765B (zh) 文件搜索系统和程序
CN100399334C (zh) 搜索结构化文档的设备和方法
CN100424648C (zh) 信息处理方法、信息处理设备和信息处理系统
US7493323B2 (en) Document group analyzing apparatus, a document group analyzing method, a document group analyzing system, a program, and a recording medium
JP2009075655A (ja) ファイル管理システム、ファイル管理方法、およびファイル管理プログラム
JP5105894B2 (ja) 文書検索システム、文書検索装置及びその方法とプログラム、記憶媒体
JP2009187310A (ja) 文書管理方法、文書管理装置および文書管理システム
EP2584480A2 (en) Associative memory technology for analysis of requests for proposal
JP5270863B2 (ja) データ管理装置及び方法
CN100498791C (zh) 文档检索系统、文档检索装置及其方法
JPWO2003060764A1 (ja) 情報検索システム
CN102171645B (zh) 检索系统及其控制方法、检索空间映射服务器装置
KR100616152B1 (ko) 인터넷상에서 기사를 자동분류하여 타 웹사이트에 자동송출하는 제어방법
JP2002197100A (ja) 検索サービスシステムと方法及び記録媒体並びに情報仲介方法
JP4987434B2 (ja) 電文データの監査用保管・検索システム、電文データの監査用保管・検索方法、および電文データの監査用保管・検索プログラム
JP4313738B2 (ja) 画像検索装置および方法、そのプログラム及び記録媒体
JP2006185020A (ja) 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JPH10326282A (ja) 電子ファイル検索・編集方法及びシステム及び電子ファイル検索・編集プログラムを格納した記憶媒体
JP4432460B2 (ja) 電子掲示板管理装置、電子掲示板管理方法、及びプログラム
KR100935390B1 (ko) 동영상 데이터 클러스터를 이용한 광고 데이터 설정 및제공 방법 및 장치
JP2005044226A (ja) 操作情報収集システム
JP2006228067A (ja) 文書管理システム及び文書管理方法
JP3725837B2 (ja) 知識情報収集システムおよび知識情報収集方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090610

CF01 Termination of patent right due to non-payment of annual fee