CN101388031B - 分布式搜索方法、体系结构、系统及软件 - Google Patents

分布式搜索方法、体系结构、系统及软件 Download PDF

Info

Publication number
CN101388031B
CN101388031B CN200810149850.2A CN200810149850A CN101388031B CN 101388031 B CN101388031 B CN 101388031B CN 200810149850 A CN200810149850 A CN 200810149850A CN 101388031 B CN101388031 B CN 101388031B
Authority
CN
China
Prior art keywords
search
data set
search engine
searching request
parts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200810149850.2A
Other languages
English (en)
Other versions
CN101388031A (zh
Inventor
M·布卢姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Reuters Enterprise Centre GmbH
Original Assignee
Thomson Reuters Global Resources ULC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Reuters Global Resources ULC filed Critical Thomson Reuters Global Resources ULC
Publication of CN101388031A publication Critical patent/CN101388031A/zh
Application granted granted Critical
Publication of CN101388031B publication Critical patent/CN101388031B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

描述了用于为律师事务所及其它企业中使用的联机传送平台提供分布式搜索功能的系统、方法及软件。例如,系统、方法及软件的一个方面提供多个数据集。数据集可包含对其它数据集的索引。至少一个搜索引擎与各数据集关联。接收搜索请求的系统根据搜索请求中涉及的数据集来确定哪些搜索引擎被用来处理搜索请求。然后,搜索请求被转发给所识别的搜索引擎。

Description

分布式搜索方法、体系结构、系统及软件
本申请是申请号为200480017052.4、申请日为2004年4月26日、发明名称为“分布式搜索方法、体系结构、系统及软件”的申请的分案申请。
版权声明和许可
本专利文档的一个或多个部分包含受到版权保护的资料。版权所有者不反对任何人复制本专利文档或专利公开,因为它出现在专利及商标局专利文件或记录中,但在其它方面仍保留所有版权。以下声明适用于本文档:版权2003,Thomson Corporation。
相关申请
本申请要求2003年4月25日提交的美国临时专利申请60/465585的优先权,通过引用将其结合到本文中。
技术领域
本发明的各种实施例涉及信息检索系统和知识管理系统,更具体地涉及这类系统中的分布式搜索功能。
背景技术
现代计算机联机信息提供商通常需要搜索大量数据的能力。例如,美国法律体系以及全球的一些其它法律体系极大地依靠书面司法意见、法官的书面判决来表达或解释控制争端解决的法律。因此,我们的法律体系中的法官和律师一直在搜索不断扩充的大量过往意见或判例法,以便获取与新争端的解决或预防最相关的意见或判例法。找到的案例经过关联性研究,最终在文档中引述和论述,称作工作成果,例如,它为法庭诉讼辩护、对相似的法庭诉讼向客户进行建议或者在特定权限中关于法律状况指导客户和律师。
另外,知识管理系统、文档管理系统和其它联机数据提供商通常需要来自其大小可能从大到小变化的数据集的信息。太拉字节范围的数据集不再罕见。例如,一些系统可利用包含大约1.2太拉字节的唯一数据的公开记录以及包括大约20千兆字节(GB)的唯一数据的税务和会计(TA)数据。在先前系统中,由于系统通常仅可存储唯一公开记录数据的百分之五而出现问题。此外,系统对于唯一TA数据过大,它通常与其它数据提供商共享服务器空间。
数据集和系统大小的这类差异对搜索引擎性能、尤其对于与企业服务器实现相关的搜索引擎性能有影响(包括固有可用性问题)。例如,如果在系统的CPU中发生存储器故障,则系统在排除故障之前通常无法运行搜索服务,以及故障转移机制是有问题的。由于搜索服务通常是存储器密集的,并且没有束缚于CPU,因此,解决这些故障问题浪费资源。
此外,有时,如果数据页面在文件系统高速缓存中不可用,查询处理迫使搜索引擎访问盘以找到数据页面。虽然在一些情况下,如果数据集小到足以完全保存在RAM中,则通常可在文件系统高速缓存中找到数据,但情况往往是,数据集很大,使得查询处理往往在盘级而不是在文件系统高速缓存级发生。此外,当前体系结构通常没有确保同一个搜索引擎会一致地处理相同的数据,这消除了搜索引擎高速缓存的优势。
因此,本发明人已经认识到,需要提供联机传送平台中的搜索功能的更好的系统、工具及方法。
发明内容
为了满足这个和/或其它需求,本发明人设计了为律师事务所和其它企业中使用的联机传送平台提供分布式搜索功能的新颖系统、方法和软件。例如,系统、方法及软件的一个方面提供多个数据集。数据集可包含对其它数据集的索引。至少一个搜索引擎与各数据集关联。接收搜索请求的系统根据搜索请求中涉及的数据集来确定哪些搜索引擎被用来处理搜索请求。然后,搜索请求被转发给所识别的搜索引擎。
值得注意的是,示范实施例提供一种搜索功能,它分布在多个搜索引擎之中,其方式是,搜索数据很可能被高速缓存在可用RAM中,从而避免代价高的盘搜索。
附图说明
图1是与本发明的一个或多个实施例对应的示范分布式搜索系统100的框图。
图2是框图,提供对于与本发明的一个或多个实施例对应的示范分布式搜索系统200的更详细说明。
图3是与操作实施本发明的示范分布式搜索系统及关联组件的一个或多个示范方法对应的流程图。
具体实施方式
以下结合附图和所附权利要求的描述描述和/或说明一个或多个发明的一个或多个示范实施例。足够详细地表示和描述了这些实施例,以便使本领域的技术人员能够实施和使用本发明,提供这些实施例只是为了举例说明和讲授本发明而非限定。因此,在需要避免使一个或多个发明难以理解的情况下,描述可能省略相关领域的技术人员已知的某些信息。
示范信息系统
图1说明结合本发明的一个或多个理论的示范分布式搜索系统100。系统100包括搜索控制器102、消息交换机104、搜索引擎106、网络连接存储器(NAS)110以及可通信地把搜索引擎106耦合到NAS110的网络108。上述组件可分布在一个或多个服务器计算机之中。在一些实施例中,服务器计算机包括Sun Microsystems,Inc.制造的基于刀片的服务计算机。但是,在备选实施例中,可采用基于Intel处理器体系结构的服务器。
搜索控制器102“收听”搜索请求。利用“分割-合并”引擎,搜索控制器接收请求,并将它们分为成分请求(由搜索引擎106提供服务)。从搜索引擎106接收到响应时,搜索控制器合并响应,并将其发送给请求方。可对于组成数据收集或收集集合或者从其中产生的各种数据集进行在程序设计上称作“搜索引擎请求”的分割请求。在一些实施例中,数据集包括对数据收集或收集集合的索引的一部分(称作“索引集”)。
消息交换机104用于把消息从搜索控制器102路由到一个或多个搜索引擎106。消息可包含将由一个或多个搜索引擎106执行的搜索请求。在本发明的一些实施例中,消息交换机104提供Java消息服务(JMS)接口。此外,在一些实施例中,可采用诸如可向IBM Corp.购买的MQ消息传输系统之类的消息排队软件来路由消息。但是,本发明没有任何实施例被认为局限于特定的消息路由系统,在备选实施例中,可采用Sonic Software Corporation的SonicMQ消息排队软件。
在一些实施例中,搜索引擎106包括Java“包装机”,它对于服务器搜索和解决的数据进行预处理和后处理。在一些实施例中,这个处理可通过Java本地接口来执行。搜索引擎106接收“搜索引擎请求”成分和特定“索引集”,并使得对于请求指定的“索引集”执行搜索。
要搜索的数据集可能驻留于可通信地通过网络108耦合到搜索引擎106的网络连接存储器110。网络连接存储器可以是通过网络可访问的任何类型的存储装置。这种网络连接存储器的实例是本领域已知的,并且包括文件服务器、存储服务器和其它网络连接存储媒体。
网络108可以是能够支持数据通信的任何类型的有线或无线网络。在本发明的一些实施例中,网络108包括专用千兆位以太网网络。但是,本发明没有任何实施例被认为局限于特定的网络类型。
搜索引擎106可在安装了Linux OS的普通Intel系统中运行。在一些实施例中,可通过网络文件系统(NFS)协议从网络连接存储器(NAS)服务器110来访问“索引集”的数据。当初始查询进入搜索引擎时,对搜索引擎提供满足搜索查询所需的“索引集”名称和文件名。
搜索引擎106可向NAS服务器110进行NFS调用,并请求那些文件的数据。这个数据通常是静态的,并且被高速缓存在NFS客户机系统中。随后,当搜索引擎访问它的已分配“索引集”的数据时,它可为文件信息向NFS服务器进行元目录调用。搜索引擎1-6从本地RAM高速缓存中读取数据页面,这允许查询条件的RAM速度搜索。
图2提供结合本发明的一个或多个理论的示范分布式搜索系统200的更详细说明。系统200包括以上参照图1所述的组件,另外还包括产品/客户机202、资源管理器206和联机传送平台代理208。
产品/客户机202可以是任何客户机软件模块,它采用根据本发明的实施例的理论所提供的分布式搜索功能性。这类软件包括浏览器、文档管理系统、知识管理系统、文档检索系统、判例法检索系统等。产品/客户机202向消息交换机104发出一个或多个搜索请求,消息交换机104根据搜索请求中的数据把请求路由到服务控制器。
联机传送平台(ODP)代理进程208在服务器、如搜索控制器102和搜索引擎106中启动进程,并监测和管理这些进程。在一些实施例中,ODP代理进程208还跟踪各个进程,并向公告板数据库报告其处理状态。此外,在一些实施例中,ODP代理进程208当存在故障或者“长事务处理”条件时重新启动搜索控制器或搜索引擎。ODP代理208被看作是运行ODP环境的宿主代理进程。
当系统启动时,服务器上的ODP代理208启动和查询把ODP代理208分配给代理管理器(未示出)的引擎的(预先配置的)资源管理器206。代理管理器包含有关域中的代理和搜索引擎的信息,并且可对查询它的ODP代理208动态分配工作负荷。在一些实施例中,代理管理器包括LDAP(轻型目录访问协议)代理。在一些实施例中,对搜索引擎分配具有与搜索引擎106关联的“索引集”的名称对应的名称的消息队列。
在一些实施例中,如果搜索引擎106出故障,则其代理将检测出故障引擎并使它重新启动。在搜索引擎出故障时所处理的查询可能丢失,以及控制器请求“出错”。(一些实施例可能把出故障查询的副本传递到对主题索引集操作的另一个搜索引擎。)但是,出故障搜索引擎106可重新启动,使得新的查询可无延迟地被处理。
在一些实施例中,如果搜索引擎系统遇到CPU、RAM或其它硬件故障,则消息交换机代理检测“索引集”队列没有为它提供服务的进程。代理立即警告代理管理器重新分配搜索引擎,以便为那个“索引集”队列提供服务。
各种实施例的示范系统设计结合部署普通系统以及在引导过程期间“学习”它在分布式搜索体系结构中的角色的固定OS影像。系统的弹性包容进程或硬件故障,以及它的灵活性允许对出故障组件的附加资源的分配。
此外,在一些实施例中,为故障转移分配的附加资源不是“空闲”(等待故障转移)。如果检测到处理瓶颈,它们可作为“工作负荷处理机”来部署,从而提供附加处理。这种工作负荷可通过消息交换机104或ODP代理208来检测,它可对每个“索引集”队列的工作负荷模式进行检测和报告。
另外,各种实施例的示范体系结构有助于“懒监测”方案。组件故障不需要立即被检测及修复。当灾难性事件发生时,可出现检测和通知,但修复组件可在任何时间发生,只要存在可用于承担其工作负荷的附加资源。
示范操作方法
图3说明操作信息管理系统、如系统100的一个或多个示范方法的流程图300。流程图300包括框310-340,它们在示范实施例中以顺次执行序列来排列及描述。但是,其它实施例可采用多个处理器或类似处理器的装置或者组织成两个或两个以上虚拟机或子处理器的单一处理器来并行执行两个或两个以上框。其它实施例还改变过程序列或者提供不同的功能划分来得到类似结果。此外,又一些实施例把这些框实现为两个或两个以上互连的硬件模块,其中的相关控制和数据信号在模块之间或者通过模块传递。因此,示范过程流适用于软件、硬件和固件实现。
在框310,示范方法以提供一个或多个数据集开始。在一些实施例中,数据集包括对数据收集或数据收集集合的索引的一些部分。索引可根据数据库索引的范围来划分,其中每个范围包含一个数据集。然后,数据集存储在存储装置、如NAS110中。
框320需要接收搜索请求。在框330,搜索请求经过分析以确定要求哪些数据集。
在框340,搜索请求则被转发到与框330中识别的数据集对应的搜索引擎。在本发明的一些实施例中,搜索请求通过消息队列转发给搜索引擎。此外,在一些实施例中,向与特定搜索引擎关联的消息队列提供与配置用于搜索引擎的“索引集”相同的名称。
结论
上述实施例只是用于说明和讲授实施和使用本发明的一种或多种方式,而不是限制其广度或范围。包含实施或实现本发明的理论的全部方式的本发明的实际范围仅由一个或多个已发布专利权利要求及其等效物来定义。

Claims (10)

1.一种用于执行搜索的方法,包括:
提供多个包括索引集的数据集;
使多个数据集中的数据集与多个搜索引擎中的一个或多个搜索引擎相关联;
接收搜索请求;
响应所述搜索请求而识别要搜索的所述多个数据集中的至少一个数据集;
将所述搜索请求分为成分请求;
把所述搜索请求中的成分请求中的每一个和特定索引集发送给多个搜索引擎中的至少一个搜索引擎中的对应搜索引擎以使得对于请求指定的索引集执行搜索,所述搜索引擎具有与所述至少一个数据集的关联;
在检测到搜索引擎故障时使数据集与多个搜索引擎中的一个或多个搜索引擎重新相关联;以及
将在故障的搜索引擎上执行的查询复制到与数据集重新相关联的多个搜索引擎中的一个或多个搜索引擎。
2.如权利要求1所述的方法,其特征在于,所述数据集包含对数据收集的索引的一部分。
3.如权利要求1所述的方法,其特征在于,发送所述搜索请求包括把所述搜索请求放入消息队列。
4.如权利要求3所述的方法,其特征在于,与所述消息队列关联的标识符和与所述数据集关联的标识符相同。
5.如权利要求1所述的方法,其特征在于,还包括分割所述搜索请求以便发送给多个所述搜索引擎。
6.一种用于执行搜索的系统,所述系统包括:
用于提供多个包括索引集的数据集的部件;
用于使多个数据集中的数据集与能够通过多个处理器中的一个或多个处理器、自计算机可读介质执行的多个搜索引擎中的一个或多个搜索引擎相关联的部件;
用于接收搜索请求的部件;
用于响应所述搜索请求而识别要搜索的所述多个数据集中的至少一个数据集的部件;
用于将所述搜索请求分为成分请求的部件;
用于把所述搜索请求中的成分请求中的每一个和特定索引集发送给多个搜索引擎中的至少一个搜索引擎中的对应搜索引擎以使得对于请求指定的索引集执行搜索的部件,所述搜索引擎具有与所述至少一个数据集的关联;以及
用于在检测到搜索引擎故障时使数据集与多个搜索引擎中的一个或多个搜索引擎重新相关联并将在故障的搜索引擎上执行的查询复制到与数据集重新相关联的多个搜索引擎中的一个或多个搜索引擎的部件。
7.如权利要求6所述的系统,其特征在于,所述数据集包含对数据收集的索引的一部分。
8.如权利要求6所述的系统,其特征在于,用于发送所述搜索请求的部件包括把所述搜索请求放入消息队列。
9.如权利要求8所述的系统,其特征在于,与所述消息队列关联的标识符和与所述数据集关联的标识符相同。
10.如权利要求6所述的系统,其特征在于,还包括用于分割所述搜索请求以便发送给多个所述搜索引擎的部件。
CN200810149850.2A 2003-04-25 2004-04-26 分布式搜索方法、体系结构、系统及软件 Expired - Fee Related CN101388031B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US46558503P 2003-04-25 2003-04-25
US60/465585 2003-04-25
CNB2004800170524A CN100437571C (zh) 2003-04-25 2004-04-26 分布式搜索方法、体系结构、系统及软件

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNB2004800170524A Division CN100437571C (zh) 2003-04-25 2004-04-26 分布式搜索方法、体系结构、系统及软件

Publications (2)

Publication Number Publication Date
CN101388031A CN101388031A (zh) 2009-03-18
CN101388031B true CN101388031B (zh) 2016-12-07

Family

ID=33418258

Family Applications (2)

Application Number Title Priority Date Filing Date
CNB2004800170524A Expired - Fee Related CN100437571C (zh) 2003-04-25 2004-04-26 分布式搜索方法、体系结构、系统及软件
CN200810149850.2A Expired - Fee Related CN101388031B (zh) 2003-04-25 2004-04-26 分布式搜索方法、体系结构、系统及软件

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNB2004800170524A Expired - Fee Related CN100437571C (zh) 2003-04-25 2004-04-26 分布式搜索方法、体系结构、系统及软件

Country Status (11)

Country Link
US (1) US8886629B2 (zh)
EP (1) EP1620816B1 (zh)
JP (2) JP2006524872A (zh)
CN (2) CN100437571C (zh)
AR (1) AR047203A1 (zh)
AU (2) AU2004235104A1 (zh)
CA (1) CA2523591C (zh)
ES (1) ES2453343T3 (zh)
HK (1) HK1097620A1 (zh)
NZ (1) NZ543515A (zh)
WO (1) WO2004097685A2 (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60139157D1 (de) * 2000-01-14 2009-08-13 Thinkstream Inc Verteiltes informationsnetzwerk mit globalem zugriff
US8019757B2 (en) * 2000-01-14 2011-09-13 Thinkstream, Inc. Distributed globally accessible information network implemented to maintain universal accessibility
DE102005037505B4 (de) * 2005-08-09 2011-02-10 Susanne Köhler Netzwerk
JP2008003771A (ja) * 2006-06-21 2008-01-10 Denso Corp 興味情報検索システム、車載器および車外器
CN1917540B (zh) * 2006-07-27 2011-09-14 中山大学 一种用于数字小区的分布式资源共享装置及方法
US8280983B2 (en) * 2007-05-02 2012-10-02 Microsoft Corporation Distributed search in a casual network of servers
CN101196928A (zh) * 2007-12-29 2008-06-11 杭州华三通信技术有限公司 一种内容搜索方法、系统以及引擎分发单元
US8874585B2 (en) 2010-06-09 2014-10-28 Nokia Corporation Method and apparatus for user based search in distributed information space
CN101950300B (zh) * 2010-09-20 2013-07-24 华南理工大学 一种分布式搜索引擎系统及其实现方法
US8706756B2 (en) * 2011-05-11 2014-04-22 Futurewei Technologies, Inc. Method, system and apparatus of hybrid federated search
US9256762B1 (en) 2011-12-20 2016-02-09 Amazon Technologies, Inc. Securing a remote database
US9218344B2 (en) 2012-06-29 2015-12-22 Thomson Reuters Global Resources Systems, methods, and software for processing, presenting, and recommending citations
CN102945284B (zh) * 2012-11-22 2016-06-29 北京奇虎科技有限公司 搜索引擎的状态获取方法、装置以及浏览器
JP5525092B1 (ja) 2013-04-05 2014-06-18 日本電気株式会社 移動管理装置、通信システム、音声着信制御方法及びプログラム
US10073874B1 (en) * 2013-05-28 2018-09-11 Google Llc Updating inverted indices
CN103607324B (zh) * 2013-11-25 2020-01-17 网神信息技术(北京)股份有限公司 用于Java消息服务的数据处理方法及Java消息客户端和服务器
CN104778278A (zh) * 2015-04-30 2015-07-15 亚信科技(南京)有限公司 一种基于solr的搜索方法及搜索应用服务器AUS
CN105335456B (zh) * 2015-09-23 2018-10-23 昆明理工大学 一种用于环境保护法规检索的关联优先排序方法
CN105260136B (zh) * 2015-09-24 2019-04-05 北京百度网讯科技有限公司 数据读写方法及分布式存储系统
US10169415B2 (en) * 2016-09-14 2019-01-01 Google Llc Query restartability
CN109359087B (zh) * 2018-06-15 2020-11-17 深圳市木浪云数据有限公司 即时文件索引和搜索方法、装置及系统
CN112631226B (zh) * 2020-12-26 2021-10-29 太原师范学院 一种基于数据驱动的生产设备故障监测方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US198869A (en) * 1878-01-01 Improvement in camp-bedsteads
US143744A (en) * 1873-10-21 Improvement in springs for wagons
US5590319A (en) * 1993-12-15 1996-12-31 Information Builders, Inc. Query processor for parallel processing in homogenous and heterogenous databases
JPH08272806A (ja) * 1995-04-03 1996-10-18 Nippon Steel Corp データベース検索システム
JP3808941B2 (ja) * 1996-07-22 2006-08-16 株式会社日立製作所 並列データベースシステム通信回数削減方法
EP0822502A1 (en) * 1996-07-31 1998-02-04 BRITISH TELECOMMUNICATIONS public limited company Data access system
US5987446A (en) 1996-11-12 1999-11-16 U.S. West, Inc. Searching large collections of text using multiple search engines concurrently
US6009422A (en) * 1997-11-26 1999-12-28 International Business Machines Corporation System and method for query translation/semantic translation using generalized query language
JP3648051B2 (ja) * 1998-02-02 2005-05-18 富士通株式会社 関連情報検索装置及びプログラム記録媒体
JP2000250832A (ja) * 1999-02-26 2000-09-14 Oki Electric Ind Co Ltd 分散ディレクトリ管理システム
AU6200300A (en) * 1999-06-24 2001-01-09 Simpli.Com Search engine interface
JP2003511795A (ja) * 1999-10-13 2003-03-25 サレニック, インコーポレイテッド インターネット装置を用いて、インターネット情報にアクセスするためのシステムおよび方法
JP2001160039A (ja) * 1999-12-03 2001-06-12 Nec Corp 分散並列型データ処理装置及び分散並列型データ処理プログラムを記録した記録媒体並びに分散並列型データ処理システム
US20020073005A1 (en) * 2000-05-25 2002-06-13 Welnicki Raymond P. Computerized lifestyle planning system and method
US6772194B1 (en) * 2000-06-27 2004-08-03 Cisco Technology, Inc. Directory band shell extension
US7010546B1 (en) * 2000-09-20 2006-03-07 Parasoft Corporation Method and system for testing data sources and database oriented software applications
US6631367B2 (en) * 2000-12-28 2003-10-07 Intel Corporation Method and apparatus to search for information
CN1320874A (zh) * 2001-05-25 2001-11-07 清华大学 网络环境下的程序挖掘方法及其程序挖掘系统
US6795820B2 (en) * 2001-06-20 2004-09-21 Nextpage, Inc. Metasearch technique that ranks documents obtained from multiple collections
JP2003345810A (ja) * 2002-05-28 2003-12-05 Hitachi Ltd 文書検索方法、文書検索システム及び文書検索結果示方システム
US7804982B2 (en) * 2002-11-26 2010-09-28 L-1 Secure Credentialing, Inc. Systems and methods for managing and detecting fraud in image databases used with identification documents

Also Published As

Publication number Publication date
JP2012053903A (ja) 2012-03-15
CN1839385A (zh) 2006-09-27
HK1097620A1 (en) 2007-06-29
JP2006524872A (ja) 2006-11-02
NZ543515A (en) 2008-11-28
US8886629B2 (en) 2014-11-11
EP1620816A2 (en) 2006-02-01
ES2453343T3 (es) 2014-04-07
WO2004097685A3 (en) 2005-02-10
CN101388031A (zh) 2009-03-18
AR047203A1 (es) 2006-01-11
WO2004097685A2 (en) 2004-11-11
CA2523591C (en) 2013-12-31
AU2011200841A1 (en) 2011-03-17
EP1620816B1 (en) 2013-12-25
AU2004235104A1 (en) 2004-11-11
CA2523591A1 (en) 2004-11-11
US20050004898A1 (en) 2005-01-06
CN100437571C (zh) 2008-11-26
JP5725661B2 (ja) 2015-05-27

Similar Documents

Publication Publication Date Title
CN101388031B (zh) 分布式搜索方法、体系结构、系统及软件
JP5730271B2 (ja) ネットワークデータストレージシステムおよびそのデータアクセス方法
JP6250189B2 (ja) データストリームのためのクライアント構成可能なセキュリティオプション
JP6246358B2 (ja) 大規模データストリームの取得、記憶、及び消費のための管理型サービス
CN102169484B (zh) 虚拟化环境中综合的、相关的和动态的数据搜索
US7890626B1 (en) High availability cluster server for enterprise data management
US9529804B1 (en) Systems and methods for managing file movement
US20140181116A1 (en) Method and device of cloud storage
CN111046011B (zh) 日志收集方法、系统、装置、电子设备及可读存储介质
JP4514578B2 (ja) データの移行先を選択する方法及び装置
US8930518B2 (en) Processing of write requests in application server clusters
US11343308B2 (en) Reduction of adjacent rack traffic in multi-rack distributed object storage systems
JP3290801B2 (ja) 資源所在位置検出方式
US20170195409A1 (en) Intelligent mapping for an enterprise grid
CN113168405A (zh) 数据库管理服务提供系统
CN108123983B (zh) 一种亲缘性负载集群的缓存处理方法及系统
US11340964B2 (en) Systems and methods for efficient management of advanced functions in software defined storage systems
AU2013206478B2 (en) Distributed search methods, architectures, systems, and software
Garlick I/O forwarding on livermore computing commodity linux clusters
CN115454773A (zh) 数据采集方法、装置、电子设备和存储介质
Ichikawa et al. Cloud Search Engine for IaaS
CN117271697A (zh) 一种通过代码调用链还原的方法及系统
US8806046B1 (en) Application streaming and network file system optimization via integration with identity management solutions
JP2000099483A (ja) 分散処理システム及び分散処理方法及び記録媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Swiss Swiss

Applicant after: THOMSON REUTERS GLOBAL RESOURCES

Address before: Switzerland Zug

Applicant before: THOMSON REUTERS GLOBAL RESOURCES

COR Change of bibliographic data
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: Swiss Swiss

Patentee after: THOMSON REUTERS GLOBAL RESOURCES

Address before: Swiss Swiss

Patentee before: THOMSON REUTERS GLOBAL RESOURCES

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200415

Address after: Chug, Switzerland

Patentee after: Thomson Reuters Enterprise Center Co.,Ltd.

Address before: Bahr, Switzerland

Patentee before: THOMSON REUTERS GLOBAL RESOURCES

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20161207