JP5725661B2 - 分散型検索システム - Google Patents

分散型検索システム Download PDF

Info

Publication number
JP5725661B2
JP5725661B2 JP2011236190A JP2011236190A JP5725661B2 JP 5725661 B2 JP5725661 B2 JP 5725661B2 JP 2011236190 A JP2011236190 A JP 2011236190A JP 2011236190 A JP2011236190 A JP 2011236190A JP 5725661 B2 JP5725661 B2 JP 5725661B2
Authority
JP
Japan
Prior art keywords
search
request
search engines
index
message queue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011236190A
Other languages
English (en)
Other versions
JP2012053903A (ja
Inventor
ブラム マーク
ブラム マーク
Original Assignee
トムソン ルーターズ グローバル リソーシーズ
トムソン ルーターズ グローバル リソーシーズ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by トムソン ルーターズ グローバル リソーシーズ, トムソン ルーターズ グローバル リソーシーズ filed Critical トムソン ルーターズ グローバル リソーシーズ
Publication of JP2012053903A publication Critical patent/JP2012053903A/ja
Application granted granted Critical
Publication of JP5725661B2 publication Critical patent/JP5725661B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

(著作権表示および承認)
この特許文献の1つ以上の部分には、著作権の保護を必要とする資料が含まれる。著作権者は、Patent and Trademark Officeの特許ファイルまたは記録に見られるので、特許文献または特許情報開示の複製にも不服はないが、全ての著作権を保留しています。以下の表示はこの文書に適用されます。Copyright 2003、The Thomson Corporation。
(関連出願)
本願は、本明細書において援用される米国仮特許出願第60/465,585号(2003年4月25日出願)の優先権を主張する。
(技術分野)
本発明の種々の実施形態は、情報検索システムおよび知識管理(knowledge−management)システムに関し、より詳しくは、そのようなシステム内の分散型検索機能に関する。
近年のコンピュータオンライン情報プロバイダには、通常、莫大な量のデータを検索する能力が必要とされている。例えば、米国法律制度および世界中の別の法律制度では、紛争の解決を規定する法律を明瞭に表現し、または解釈するために、司法の見解書、すなわち裁判官の判決書に強く頼る。従って、法律制度内の裁判官および法律家は、新たな紛争の解決または阻止に最も関連する過去の見解または判例法のこれまでに膨張している本文を継続的に研究している。基礎的な事例は、妥当性に対して研究され、最終的には文書(ワークプロダクトと称される)内に引用され議論され、法的訴えを主張し、例えば、それは、顧客に適当な法的訴えを助言し、または特定の裁判権における法的状態について顧客および法律家に教える。
さらに、知識管理システム、文書管理システム、および別のオンラインデータプロバイダには、通常、サイズが大きいものから小さいものへと変わり得るデータセットからの情報を必要とする。テラバイト値域のデータセットは、もはや未知ではない。例えば、一部のシステムでは、固有のデータの約1.2テラバイトを含む公開録と、固有のデータの約20ギガバイト(GB)を含む税および会計(TA)データとを用い得る。以前のシステムでは、通常、システムが固有の公開録データの5パーセントのみを格納し得るために、問題が生じている。さらに、そのシステムは、固有のTAデータに対して大き過ぎ、そのデータは、通常、別のデータプロバイダとサーバ空間を共有する。
データセットおよびシステムサイズのそのような分散は、(特にエンタープライズサーバに関連する、内在する可用性の問題も含めた)検索エンジンの性能に影響を及ぼす。例えば、メモリの欠陥がシステムのCPUに生じる場合には、システムは、通常、その欠陥が解決されるまで検索サービスを作動することができず、また、フェイルオーバー機構には問題がある。通常、検索サービスはメモリ示強性でありCPUに束縛されないために、これらの欠陥問題を解決するために資源が浪費される。
さらに、ファイルシステムキャッシュにおいて利用可能でない場合には、問い合わせ処理は、時には、検索エンジンにデータページ用のディスクへとアクセさせる。一部の場合には、データセットがRAMに完全に保持するに十分小さい場合には、データは、通常ファイルシステムキャッシュに見つけられ得るが、問い合わせ処理がファイルシステムキャッシュレベルよりむしろディスクレベルにおいてしばしば生じるに十分データセットが大きくなる場合もしばしばある。さらに、今日のアーキテクチャでは、通常、同一の検索エンジンが同一のデータを一貫して処理することは保証されず、このことは、検索エンジンのキャッシュの利点を打ち消す。
従って、本願発明者は、オンラインデリバリプラットフォーム内に検索機能を提供するより優れたシステム、ツール、および方法の必要性を認めている。
(要約)
この必要性および/または別の必要性に対処するために、本願発明者は、法律事務所および別の企業において用いられるオンラインデリバリプラットフォームに分散型検索機能を提供する新規なシステムを考案した。例えば、本システム、方法、およびソフトウェアの一局面では、複数のデータセットを提供する。このデータセットは、別のデータセットへのインデックスを含み得る。少なくとも1つの検索エンジンは各データセットに関連する。検索要求を受信するシステムは、検索要求に含まれるデータセットに基づいて、どの検索エンジンを用いて検索要求を処理かを決定する。次いで、検索要求は、特定された検索エンジンに転送される。
特に、例示的な実施形態により、検索データが利用可能なRAMにおいてキャッシュされる可能性が高くそれによって高価なディスク検索を避けるように、複数の検索エンジンにわたって分散した検索機能が提供される。
例えば、本発明は以下の項目を提供する。
(項目1)
複数のデータセットと複数の検索エンジンとを含むオンライン検索システムであって、該データセットの各々は該データセットに割り当てられた該複数の検索エンジンのうちのを少なくとも1つ有する、システム。
(項目2)
複数のサーバをさらに含み、各サーバが少なくとも1つの前記検索エンジンにホスティングする、項目1に記載のシステム。
(項目3)
各サーバが、1つ以上のプロセッサと、関連したLinux(登録商標)オペレーティングシステムとを含む、項目2に記載のシステム。
(項目4)
前記複数の検索エンジンに検索要求を分散させるように動作可能な複数の検索制御器をさらに含む、項目1に記載のシステム。
(項目5)
前記複数の検索制御器と前記複数の検索エンジンとの間に検索要求をルーティングさせるように動作可能なメッセージサーバをさらに含む、項目4に記載のシステム。
(項目6)
前記メッセージサービスがJAVA(登録商標)メッセージサービスを含む、項目5に記載のシステム。
(項目7)
検索要求がメッセージキューにルーティングされる、項目5に記載のシステム。
(項目8)
前記メッセージキューがIBM/MQメッセージキューソフトウェアの一バージョンによって提供される、項目7に記載のシステム。
(項目9)
前記データセットの各々がデータ収集へのインデックスの一部を含む、項目1に記載のシステム。
(項目10)
検索を行う方法であって、
複数のデータセットを提供することと、
検索要求を受信することと、
該検索要求に応答して検索されるべき該複数のデータセットのうちの少なくとも1つのデータセットを識別することと、
複数の検索エンジンのうちの少なくとも1つの検索エンジンに該検索要求を送信することであって、該検索エンジンは該少なくとも1つのデータセットとの関連性を有する、ことと
を包含する、方法。
(項目11)
前記データセットがデータ収集用のインデックスの一部を含む、項目10に記載の方法。
(項目12)
前記検索要求を送信することが、メッセージキューに該検索要求を配置することを包含する、項目10に記載の方法。
(項目13)
前記メッセージキューに関連した識別子は、前記データセットに関連した識別子と同一である、項目12に記載の方法。
(項目14)
複数の前記検索エンジンに送信するために前記検索要求を分割することをさらに包含する、項目10に記載の方法。
(項目15)
検索を行う方法を実行するための命令を有する機械可読媒体であって、該方法は、
複数のデータセットを提供することと、
検索要求を受信することと、
該検索要求に応答して検索されるべき該複数のデータセットのうちの少なくとも1つのデータセットを識別することと、
複数の検索エンジンのうちの少なくとも1つの検索エンジンに該検索要求を送信することであって、該検索エンジンは該少なくとも1つのデータセットとの関連性を有する、ことと
を包含する、機械可読媒体。
(項目16)
前記データセットがデータ収集用のインデックスの一部を含む、項目15に記載の機械可読媒体。
(項目17)
前記検索要求を送信することが、メッセージキューに該検索要求を配置することを包含する、項目15に記載の機械可読媒体。
(項目18)
前記メッセージキューに関連した識別子は、前記データセットに関連した識別子と同一である、項目17に記載の機械可読媒体。
(項目19)
複数の前記検索エンジンに送信するために前記検索要求を分割することをさらに包含する、項目15に記載の機械可読媒体。
(項目20)
検索を行うシステムであって、
複数のデータセットを提供する手段と、
検索要求を受信する手段と、
該検索要求に応答して検索されるべき該複数のデータセットのうちの少なくとも1つのデータセットを識別する手段と、
複数の検索エンジンのうちの少なくとも1つの検索エンジンに該検索要求を送信する手段であって、該検索エンジンは該少なくとも1つのデータセットとの関連性を有する、手段
を備える、システム。
(項目21)
前記データセットがデータ収集用のインデックスの一部を含む、項目20に記載のシステム。
(項目22)
前記検索要求を送信する前記手段が、メッセージキューに該検索要求を配置することを含む、項目20に記載のシステム。
(項目23)
前記メッセージキューに関連した識別子は、前記データセットに関連した識別子と同一である、項目22に記載のシステム。
(項目24)
複数の前記検索エンジンに送信するために前記検索要求を分割する手段をさらに備える、項目20に記載のシステム。
図1は、本発明の一つ以上の実施形態に対応する例示的な分散型検索システム100のブロック図である。 図2は、本発明の一つ以上の実施形態に対応する例示的な分散型検索システム200のさらなる詳細を提供するブロック図である。 本発明を実施する例示的な分散型検索システムおよび関連される構成要素を動作するための、一つ以上の例示的方法に対応するフローチャートである。
図および添付された請求項を取り込む記述は、一つ以上の発明の一つ以上の例示的な実施形態を記述および/または図示している。本発明を限定するためではなく、例証および教示するためにのみ提供されたこれらの実施形態は、当業者が本発明を作成し、使用することを可能とさせるために、十分詳細において記述されている。このように、一つ以上の発明を分かりにくくすることを避けるために適切となるように、本記述は、当業者に既知の情報を省略し得る。
(例示的な情報システム)
図1は、本発明の一つ以上の教示を取り込む例示的な分散検索システム100を図示している。システム100は、検索制御器102、メッセージスイッチ104、検索エンジン106、ネットワーク接続ストレージ(NAS:network attached storage)、および、検索エンジン106とNAS110とを通信できるように結合するネットワーク108を含む。上述された構成要素は、一つ以上のサーバコンピュータにわたって分配され得る。一部の実施形態において、サーバコンピュータは、Sun Microsystems株式会社からのサービスコンピュータに基づいたブレードを含む。しかしながら、代替的な実施形態において、Intel(登録商標)プロセッサ設計に基づいたサーバが使用され得る。
検索制御器102は、検索要求を「聞く」。「分割−連結」(split−merge)エンジンを利用し、検索制御器は要求を受信し、それらを構成要素要求(検索エンジン106によって提供された)へ分割する。いくつかの応答が検索エンジン106から受信された場合、検索制御器は、それらの応答を合併し、要求先に送る。プログラム的に「検索エンジン要求」と呼ばれる分割要求は、データ収集または収集セットを含む、または生成された様々なデータにされ得る。一部の実施形態において、データセットは、データ収集または収集セットへの、インデックスの一部を含む。
メッセージスイッチ104は、検索制御器102から一つ以上の検索エンジン106へのメッセージをルートするために動作する。メッセージは、一つ以上の検索エンジン106によって実行される検索要求を含み得る。本発明の一部の実施形態において、メッセージスイッチ104は、Java(登録商標)メッセージサービス(JMS)インターフェースを提供する。さらに、一部の実施形態において、メッセージは、IBM Corp.の利用可能なMQメッセージングシステム(登録商標)のような、メッセージキューイングソフトウェアを使用し、ルートされ得る。しかしながら、本発明における実施形態は、特定のメッセージをルートするシステムに限定されるとは考えられてはおらず、代替的な実施形態において、Sonic Software Corporationのメッセージキューイングソフトウェアが利用され得る。
一部の実施形態において、検索エンジン106は、前−処理および後−処理データがサーバによって検索および決定されるJava(登録商標)「ラッパー」(Java(登録商標) wrapper)を含む。一部の実施形態において、この処理は、ジャバネイティブインターフェース(Java(登録商標) Native Interface)を介して実行され得る。検索エンジン106は、検索エンジン要求(SearchEngineRequest)構成要素、および特定のインデックスセット(IndexSet)を受信し、検索を、要求で指定されたIndexSetの上で実行させる。
検索されるデータセットは、ネットワーク108を介して検索エンジン106へ通信可能となるように結合されるネットワーク接続ストレージ110に存在し得る。ネットワーク接続ストレージは、技術的に既知であり、ファイルサーバ、ストレージサーバ、および他のネットワーク接続ストレージメディアを含む。
ネットワーク108は、データ通信をサポート可能である有線またはワイヤレスネットワークの任意のタイプであり得る。本発明の一部の実施形態において、ネットワーク108は、プライベートギガビットイーサーネットネットワーク(Gigabit Ethernet(登録商標))を含む。しかしながら、本発明の実施形態は、特定のネットワークタイプに限定されると考えられてはいない。
検索エンジン106は、リナックス(登録商標)OS(Linux(登録商標) OS)(登録商標)がインストールされた一般的なIntelのシステムの上で動作し得る。一部の実施形態におけるIndexSetのためのデータは、ネットワーク接続ストレージ(NAS)サーバ110から、ネットワークファイルシステム(NFS:network file system)プロトコルを介してアクセスされ得る。初期クエリが検索エンジンに入力された場合、検索エンジンは、検索クエリを満たすために、IndexSetの名前およびファイルネームを与えられる。
検索エンジン106は、NASサーバ110にNFS要求をし得、それらのファイルのためのデータを要求し得る。このデータは、通常静的であり、NFSクライアントシステム上にキャッシュされる。その後、検索エンジンがその割り当てられたIndexSetのためのデータにアクセスする場合、ファイル情報のためのNFSサーバに、メタ−ディレクトリ(meta−directory)要求をし得る。検索エンジン106は、ローカルのRAMキャッシュからデータページを読み込み、RAMがクエリ語彙を迅速に検索することを許可する。
図2は、本発明における一つ以上の教示を取り込む例示的な分散型検索システム200のさらなる詳細を提供する。システム200は、図1に関連して上述された構成要素、および追加的に製品/クライアント202、リソースマネージャ206およびオンラインデリバリプラットホームエージェント(Online Delivery Platform agent)208を含む。
製品/クライアント202は、本発明における実施形態の教示にしたがって提供される分散型検索機能を使用する任意のクライアントソフトウェアモジュールであり得る。そのようなソフトウェアは、ブラウザ、文書管理システム、知識管理システム、文書情報検索システム、判例法検索システムなどを含む。製品/クライアント202は、メッセージスイッチ104に一つ以上の検索要求を出し、検索要求におけるデータに基づいたサービス制御器へ、要求をルートする。
オンラインデリバリプラットフォーム(ODP:Online Platform)エージェントプロセス208は、検索エンジン102および検索エンジン106のようなサーバ上で処理を始め、これらの処理を監視および管理する。一部の実施形態において、ODPエージェントプロセス208はまた、個々の処理を記録し、報告掲示板データベースへそれらの処理状態を報告する。さらに、一部の実施形態において、欠陥または「長い処理」があった場合、ODPエージェントプロセス208は、検索制御器および検索エンジンを再起動する。ODPエージェント208は、ODP環境を起動するホスティングエージェントプロセス(hosting agent process)と考えられる。
システムがブートする場合、サーバ上のODPエージェント208は、ODPエージェント208をエージェントマネージャ(Agent Manager)(図には示されていない)に割り当てるエンジンのために、(前もって設定された)リソースマネージャ206を始動およびクエリする。エージェントマネージャは、一つのドメインにおいて、エージェントおよび検索エンジンについての情報を含み、作業負荷をクエリするODPエージェントへ、ダイナミックに作業負荷を割り当てることができる。一部の実施形態において、エージェントマネージャは、LDAP(Lightweight Directory Access Protocol)エージェントを含む。一部の実施形態において、検索エンジンは、検索エンジン106に関連されたインデックスセット(IndexSet)の名前に対応する名前を有する割り当てられたメッセージキューである。
一部の実施形態において、検索エンジン106が失敗した場合、そのエージェントは、失敗されたエンジンを検出し、それを再スタートさせる。検索エンジンの失敗時に処理されたクエリは失われ得、制御器要求は、「エラー」アウトされる。(一部の実施形態は、失敗されたクエリのコピーを、その主題のインデックスセット上で動作している他の検索エンジンに転送し得る。)しかしながら、失敗された検索エンジン106は、遅延なく新しいクエリが処理され得るように、再スタートされ得る。
一部の実施形態において、検索エンジンシステムがCPU、RAM、または他のハードウェアの失敗に出くわす場合、メッセージスイッチエージェントは、IndexSetキューがそれに役立つ処理をしていないことを検出する。エージェントは、そのIndexSetキューに役立つように、検索エンジンを再割り当てすることを、すぐにエージェントマネージャに警告を発する。
様々な実施形態の例示的なシステムデザインは、ブート処理の間に分散型検索構築におけるその役割を「学ぶ」、固定されたOSのイメージを有する、展開している一般的なシステムを組み込む。そのシステムの弾力性は処理またはハードウェアの失敗に順応し、その柔軟性は、失敗した構成要素のための追加的なリソースの割り当てを許可する。
さらに、一部の実施形態において、フェイルオーバーのために割り当てられた追加的なリソースは、「アイドル状態」(フェイルオーバーを待つ)がない。それらは、「作業量(workload)ハンドラー」として展開され得、処理の障害が検出された場合、追加的な処理を提供する。この動作負荷は、メッセージスイッチ104またはODPエージェント208を介して検出され得、それぞれのIndexSetキューの作業量パターンを検出および報告し得る。
追加的に、様々な実施形態の例示的なアーキテクチャは「弱い監視」スキームを助長する。構成要素の失敗は、すぐに検出または修正される必要がない。破局的な出来事が起こった場合、検出および通知が起こり得るが、それらの作業量を想定するための利用可能な追加のリソースが存在する限りにおいて、修正する(fixing)構成要素はいつでも起こり得る。
(動作の例示的方法)
図3は、システム100のような情報管理システムを動作する一つ以上の例示的な方法のフローチャート300を表している。フローチャート300はブロック310〜340を含み、例示的な本実施形態において、一連の実行手順において配置および記述される。しかしながら、他の実施形態は、複数のプロセッサ、またはプロセッサのような装置、または、二つ以上の仮想コンピュータまたはサブプロセッサとして組織される単一のプロセッサを使用し、二つ以上のブロックを同時に実行し得る。他の実施形態はまた、類似した結果を達成するために、プロセッサ手順を変更し、または、異なる機能的分割を提供する。さらに、他の実施形態は、モジュールとの間、および、モジュールを介して通信される関連された制御およびデータ信号とを用いる二つ以上の相互接続されたハードウェアモジュールとして、ブロックを実行する。このように、例示的な処理フローは、ソフトウェア、ハードウェア、ファームウェアの実行に応用される。
ブロック310において、本例示的方法は、一つ以上のデータセットを提供することで開始される。一部の実施例において、データセットは、データ収集またはデータ収集のセットへのインデックスの一部を含む。インデックスは、データベースのインデックスの範囲に基づいて、データセットを含むそれぞれの範囲に、分割され得る。データセットは、それゆえ、NAS110のように、記録装置上に記憶される。
ブロック320は、検索要求を受信する。ブロック330で検索要求は、どのデータセットが要求されているのかを決定するために分析される。
ブロック340において、検索要求は、ブロック330で識別されたデータセットに対応して検索エンジンに転送される。本発明の一部の実施形態において、検索要求は、メッセージキューを介して、検索エンジンに転送される。さらに、一部の実施形態において、特定の検索エンジンに関連されたメッセージキューは、検索エンジンを設定するIndexSetと同じ名前を与えられる。
(結論)
上記で記述された実施形態は、本発明を作成し利用する一つ以上の方法を図示および教示するためにのみ意図されたものであり、その広さや範囲に限定されるものではない。本発明の実際の範囲は、本発明の教示を実践または実行する全ての方法を取り込んでおり、一つ以上の提出された特許請求項およびそれらの同等物によってのみ限定されるものである。

Claims (2)

  1. オンライン検索システム(100)であって、
    少なくとも1組の命令を格納するコンピュータ読み取り可能な格納手段であって、該少なくとも1組の命令は、プロセッサによって実行されると、検索エンジンとして動作することを該プロセッサに行わせ、該検索エンジンは、特定のデータに対する要求に応答して、該コンピュータ読み取り可能な格納手段に格納されている該特定のデータを取り出すことが可能である、コンピュータ読み取り可能な格納手段と、
    該格納された1組の命令に基づいて、複数の検索エンジン(106)として機能する1つ以上のプロセッサと、
    複数の構成要素要求に分割することが可能な検索要求を要求者から受信する手段と、
    該受信された検索要求を該複数の構成要素要求に分割し、該複数の構成要素要求のそれぞれを該複数の検索エンジン(106)のうちの対応する1つに割り当てる手段と、
    該複数の構成要素要求に応答して該複数の検索エンジン(106)によって提供された複数の検索結果を連結することにより、連結された検索結果を生成する手段と、
    該連結された検索結果を該要求者に提供する手段と
    を含み、
    該コンピュータ読み取り可能な格納手段に格納されたデータに対して提供されるインデックスが、複数のインデックスセットに分割され、該複数の検索エンジン(106)のそれぞれが、該複数のインデックスセットのうちの少なくとも1つを用いて該コンピュータ読み取り可能な格納手段に格納された該データを検索するために割り当てられており、
    該複数の検索エンジン(106)が、構成要素要求と特定のインデックスセットとを受信する手段と、該要求によって特定された該インデックスセットに対して検索が実行されるようにする手段とを含むことを特徴とし、
    該受信された検索要求を該複数の構成要素要求に分割し、該複数の構成要素要求のそれぞれを該複数の検索エンジンのうちの対応する1つに割り当てる該手段は、該検索要求におけるデータに基づいて、該要求に対して特定される該インデックスセットを決定するように構成されており、かつ、該決定されたインデックスセットに基づいて、該複数の構成要素要求のそれぞれを該複数の検索エンジンのうちの対応する1つに割り当てるように構成されていることを特徴とし、
    該複数の検索エンジンのそれぞれは、該複数のインデックスセットのうちの1つに関連付けられており、かつ、該複数の検索エンジンのそれぞれに関連付けられた該インデックスセットに対して検索を実行するように構成されており、
    システムは、複数のメッセージキューをさらに含み、各メッセージキューは、該複数のインデックスセットのうちの1つに関連付けられており、各メッセージキューは、各メッセージキューに関連付けられた該インデックスセットで特定された複数の構成要素要求を受信するように構成されており、各メッセージキューは、該複数の検索エンジン(106)のうち、各メッセージキューと同一のインデックスセットに関連付けられた対応する1つの検索エンジンに割り当てられており、
    該複数の検索エンジンのうちの1つが作動しない場合には、該作動しない検索エンジンに割り当てられた該メッセージキューは、該メッセージキューと同一のインデックスセットに関連付けられた他の1つの検索エンジンに再割り当てされる、システム。
  2. 前記システムは、メッセージスイッチ(104)をさらに含み、該メッセージスイッチは、各構成要素要求をそれに割り当てられた検索エンジン(106)にルーティングする、請求項に記載のシステム。
JP2011236190A 2003-04-25 2011-10-27 分散型検索システム Expired - Fee Related JP5725661B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US46558503P 2003-04-25 2003-04-25
US60/465,585 2003-04-25

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2006513341A Division JP2006524872A (ja) 2003-04-25 2004-04-26 分散型検索方法、アーキテクチャ、システム、およびソフトウェア

Publications (2)

Publication Number Publication Date
JP2012053903A JP2012053903A (ja) 2012-03-15
JP5725661B2 true JP5725661B2 (ja) 2015-05-27

Family

ID=33418258

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2006513341A Pending JP2006524872A (ja) 2003-04-25 2004-04-26 分散型検索方法、アーキテクチャ、システム、およびソフトウェア
JP2011236190A Expired - Fee Related JP5725661B2 (ja) 2003-04-25 2011-10-27 分散型検索システム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2006513341A Pending JP2006524872A (ja) 2003-04-25 2004-04-26 分散型検索方法、アーキテクチャ、システム、およびソフトウェア

Country Status (11)

Country Link
US (1) US8886629B2 (ja)
EP (1) EP1620816B1 (ja)
JP (2) JP2006524872A (ja)
CN (2) CN101388031B (ja)
AR (1) AR047203A1 (ja)
AU (2) AU2004235104A1 (ja)
CA (1) CA2523591C (ja)
ES (1) ES2453343T3 (ja)
HK (1) HK1097620A1 (ja)
NZ (1) NZ543515A (ja)
WO (1) WO2004097685A2 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8019757B2 (en) * 2000-01-14 2011-09-13 Thinkstream, Inc. Distributed globally accessible information network implemented to maintain universal accessibility
ES2329008T3 (es) * 2000-01-14 2009-11-20 Thinkstream, Inc. Red de informacion dsitribuida accessible de forma global.
DE102005037505B4 (de) * 2005-08-09 2011-02-10 Susanne Köhler Netzwerk
JP2008003771A (ja) * 2006-06-21 2008-01-10 Denso Corp 興味情報検索システム、車載器および車外器
CN1917540B (zh) * 2006-07-27 2011-09-14 中山大学 一种用于数字小区的分布式资源共享装置及方法
US8280983B2 (en) * 2007-05-02 2012-10-02 Microsoft Corporation Distributed search in a casual network of servers
CN101196928A (zh) * 2007-12-29 2008-06-11 杭州华三通信技术有限公司 一种内容搜索方法、系统以及引擎分发单元
US8874585B2 (en) 2010-06-09 2014-10-28 Nokia Corporation Method and apparatus for user based search in distributed information space
CN101950300B (zh) * 2010-09-20 2013-07-24 华南理工大学 一种分布式搜索引擎系统及其实现方法
US8706756B2 (en) 2011-05-11 2014-04-22 Futurewei Technologies, Inc. Method, system and apparatus of hybrid federated search
US9256762B1 (en) 2011-12-20 2016-02-09 Amazon Technologies, Inc. Securing a remote database
US9218344B2 (en) 2012-06-29 2015-12-22 Thomson Reuters Global Resources Systems, methods, and software for processing, presenting, and recommending citations
CN102945284B (zh) * 2012-11-22 2016-06-29 北京奇虎科技有限公司 搜索引擎的状态获取方法、装置以及浏览器
JP5525092B1 (ja) 2013-04-05 2014-06-18 日本電気株式会社 移動管理装置、通信システム、音声着信制御方法及びプログラム
US10073874B1 (en) * 2013-05-28 2018-09-11 Google Llc Updating inverted indices
CN103607324B (zh) * 2013-11-25 2020-01-17 网神信息技术(北京)股份有限公司 用于Java消息服务的数据处理方法及Java消息客户端和服务器
CN104778278A (zh) * 2015-04-30 2015-07-15 亚信科技(南京)有限公司 一种基于solr的搜索方法及搜索应用服务器AUS
CN105335456B (zh) * 2015-09-23 2018-10-23 昆明理工大学 一种用于环境保护法规检索的关联优先排序方法
CN105260136B (zh) * 2015-09-24 2019-04-05 北京百度网讯科技有限公司 数据读写方法及分布式存储系统
US10169415B2 (en) * 2016-09-14 2019-01-01 Google Llc Query restartability
CN109359087B (zh) * 2018-06-15 2020-11-17 深圳市木浪云数据有限公司 即时文件索引和搜索方法、装置及系统
CN112631226B (zh) * 2020-12-26 2021-10-29 太原师范学院 一种基于数据驱动的生产设备故障监测方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US198869A (en) * 1878-01-01 Improvement in camp-bedsteads
US143744A (en) * 1873-10-21 Improvement in springs for wagons
US5590319A (en) * 1993-12-15 1996-12-31 Information Builders, Inc. Query processor for parallel processing in homogenous and heterogenous databases
JPH08272806A (ja) * 1995-04-03 1996-10-18 Nippon Steel Corp データベース検索システム
JP3808941B2 (ja) * 1996-07-22 2006-08-16 株式会社日立製作所 並列データベースシステム通信回数削減方法
EP0822502A1 (en) * 1996-07-31 1998-02-04 BRITISH TELECOMMUNICATIONS public limited company Data access system
US5987446A (en) * 1996-11-12 1999-11-16 U.S. West, Inc. Searching large collections of text using multiple search engines concurrently
US6009422A (en) * 1997-11-26 1999-12-28 International Business Machines Corporation System and method for query translation/semantic translation using generalized query language
JP3648051B2 (ja) * 1998-02-02 2005-05-18 富士通株式会社 関連情報検索装置及びプログラム記録媒体
JP2000250832A (ja) * 1999-02-26 2000-09-14 Oki Electric Ind Co Ltd 分散ディレクトリ管理システム
WO2000079436A2 (en) * 1999-06-24 2000-12-28 Simpli.Com Search engine interface
CA2387039A1 (en) * 1999-10-13 2001-04-19 Nicolas Sheard System and methods for accessing internet information using internet appliances
JP2001160039A (ja) * 1999-12-03 2001-06-12 Nec Corp 分散並列型データ処理装置及び分散並列型データ処理プログラムを記録した記録媒体並びに分散並列型データ処理システム
US20020073005A1 (en) * 2000-05-25 2002-06-13 Welnicki Raymond P. Computerized lifestyle planning system and method
US6772194B1 (en) * 2000-06-27 2004-08-03 Cisco Technology, Inc. Directory band shell extension
US7010546B1 (en) * 2000-09-20 2006-03-07 Parasoft Corporation Method and system for testing data sources and database oriented software applications
US6631367B2 (en) * 2000-12-28 2003-10-07 Intel Corporation Method and apparatus to search for information
CN1320874A (zh) * 2001-05-25 2001-11-07 清华大学 网络环境下的程序挖掘方法及其程序挖掘系统
US6795820B2 (en) * 2001-06-20 2004-09-21 Nextpage, Inc. Metasearch technique that ranks documents obtained from multiple collections
JP2003345810A (ja) * 2002-05-28 2003-12-05 Hitachi Ltd 文書検索方法、文書検索システム及び文書検索結果示方システム
US7804982B2 (en) * 2002-11-26 2010-09-28 L-1 Secure Credentialing, Inc. Systems and methods for managing and detecting fraud in image databases used with identification documents

Also Published As

Publication number Publication date
JP2012053903A (ja) 2012-03-15
CN101388031B (zh) 2016-12-07
CN1839385A (zh) 2006-09-27
EP1620816B1 (en) 2013-12-25
CA2523591A1 (en) 2004-11-11
AR047203A1 (es) 2006-01-11
EP1620816A2 (en) 2006-02-01
HK1097620A1 (en) 2007-06-29
ES2453343T3 (es) 2014-04-07
CN100437571C (zh) 2008-11-26
US20050004898A1 (en) 2005-01-06
NZ543515A (en) 2008-11-28
AU2004235104A1 (en) 2004-11-11
US8886629B2 (en) 2014-11-11
CA2523591C (en) 2013-12-31
JP2006524872A (ja) 2006-11-02
CN101388031A (zh) 2009-03-18
WO2004097685A2 (en) 2004-11-11
AU2011200841A1 (en) 2011-03-17
WO2004097685A3 (en) 2005-02-10

Similar Documents

Publication Publication Date Title
JP5725661B2 (ja) 分散型検索システム
JP6246358B2 (ja) 大規模データストリームの取得、記憶、及び消費のための管理型サービス
US9032393B1 (en) Architecture for incremental deployment
US7599941B2 (en) Transparent redirection and load-balancing in a storage network
US7181524B1 (en) Method and apparatus for balancing a load among a plurality of servers in a computer system
US7640247B2 (en) Distributed namespace aggregation
RU2012101682A (ru) Масштабируемая кластерная база данных
US20030110263A1 (en) Managing storage resources attached to a data network
US8984162B1 (en) Optimizing performance for routing operations
US9229740B1 (en) Cache-assisted upload proxy
WO2007056336A1 (en) System and method for writing data to a directory
US8930518B2 (en) Processing of write requests in application server clusters
US11500755B1 (en) Database performance degradation detection and prevention
EP1456766A1 (en) Managing storage resources attached to a data network
GB2483111A (en) Monitoring connections to servers and memory management
CN115454773A (zh) 数据采集方法、装置、电子设备和存储介质
JP7392168B2 (ja) Cdnにおけるurlリフレッシュ方法、装置、機器及びcdnノード
US11340964B2 (en) Systems and methods for efficient management of advanced functions in software defined storage systems
AU2013206478B2 (en) Distributed search methods, architectures, systems, and software
Garlick I/O forwarding on livermore computing commodity linux clusters
WO2024013719A1 (en) Domain name system based global server load balancing service
CN118018543A (zh) 一种文件下载方法、装置和计算设备

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130723

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131022

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20131025

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131122

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20131127

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131220

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20131226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140702

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20141001

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20141006

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20141031

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20141106

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20141201

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20141204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150105

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150330

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150331

R150 Certificate of patent or registration of utility model

Ref document number: 5725661

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees