JP2005189963A

JP2005189963A - 情報処理方法、情報処理装置、制御プログラム及び記憶媒体

Info

Publication number: JP2005189963A
Application number: JP2003427617A
Authority: JP
Inventors: Daiki Suzuki; 大記鈴木; Yuji Kobayashi; 雄二小林; Tomonori Kudou; 朋紀工藤; Tadashi Takizawa; 正滝沢; Shuji Ichikawa; 修治市川; Koji Maekawa; 浩司前川; Kenichi Abe; 健一阿部
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2003-12-24
Filing date: 2003-12-24
Publication date: 2005-07-14

Abstract

【課題】分散検索においてシステム全体での相対的な検索スコアを分散先の検索ユニットとの通信コストをおさえながら最終スコアに反映させることを目的とする。
【解決手段】検索条件を送信し、該検索条件を受信した情報処理装置が該検索条件に基づいて取得した相対スコアを算出するための相対スコア算出情報及び検索結果を受信し、受信した相対スコア算出情報から相対スコアを算出し、算出した相対スコアに基づいて検索結果を出力する。
【選択図】図８

Description

本発明は、ネットワーク上で分散検索を行う情報処理方法、情報処理装置、制御プログラム及び記録媒体に関する。

ネットワーク規模の拡大により、大量の接続コンピュータが抱える大量のデータを扱えるようになった。そこで、ネットワーク上の存在する大量のデータを効率良く扱うための検索手法がいろいろと考案されてきている。

現在は必要な情報を単一のインデックスに集中管理するサーバを設け、そこですべてのユーザの検索要求を受け付ける方法が主流である。ＷＷＷ（ＷｏｒｌｄＷｉｄｅＷｅｂ）のサーチエンジンで代表されるような集中管理型は情報を総合して扱うことを可能とするメリットがあるが、この検索サーバを十分に維持するための大きな問題が２つ存在する。いずれの問題も、情報の増加によってより問題が大きくなる傾向がある。

第１の問題は、情報増加によるインデックスの増大による検索負荷の増加である。情報が増えれば増えるほどインデックスは当然大きくなり、それに対する検索結果を得るための検索負荷も当然大きくなる。

第２の問題は、ユーザからのリクエストや探索ソフト等での情報獲得スピードが情報増加においつかない場合、情報がなかなかインデキシングされない、つまり検索されない状態が続くことである。情報はネットワークに散らばっているわけであり、常に増加・減少を繰り返している。

これらの問題は、複数の検索サーバを相互にやりとりすることで目的の結果を得るような分散検索型で解決することが可能である。

単一のリソース（装置や維持のための人的資源）がすべての作業をこなすのではなく、複数のリソースに分散させ、それらを協調的に動作させることによって個々の作業負荷を減らし、全体の作業効率を上げるための方法であり、これによって第１の問題を解決する。

また情報の探索先を特定せず、リソース同士のやりとりを伝言的なふるまいで拡散させることによって、検索の起点で探索先を調べあげることなく、ネットワークに分散して存在する情報を検索するための方法であり、これによって第２の問題を解決するものである。

しかし、ここで分散故の以下の問題が発生する。

現在の高度な検索機能には、文書対象全体における相対的な特徴量を使用することでランキングを行なうものがある。例えば、テキスト検索における単語の偏在性を特徴量とするものである（例：ＩｎｖｅｒｓｅＤｏｃｕｍｅｎｔＦｒｅｑｕｅｎｃｙ）。単語が対象文書の中でどのぐらい偏在してあらわれるかは、どのぐらい文書を特徴付けるかを示しており、その単語の重要度を計ることが可能となる。検索クエリとの単語一致度においてこの重要度を検索結果のスコアに反映させることで検索精度を高めるものである。このような統計情報を利用した相対スコアは、検索対象全体を把握していない各分散検索ユニット単独で求めることは不可能であった。

それを解決するための技術として、特許文献１あるいは特許文献２記載の分散型検索装置がある。いずれも相対スコア算出に必須である検索対象全体の情報を分散検索ユニットから一度回収し、算出した全体情報あるいはそれに基づいて補正された検索条件をあらためて各分散検索ユニットに指示を送信し、正しい結果を得るものである。
特開２００２−２９７５４号公報特開２００２−３６６５４７号公報

上記従来の技術では正確性の高い結果を得ることが可能であるが、検索時に検索条件発信側と各分散検索ユニット間で最低２回の送受信を行う必要がある。

分散検索を可能とするユニット間の協調は検索実行時にネットワークの通信処理で行われる。分散検索では、１回の検索に対して対象の全分散検索先と通信する必要がある。また同時に実行される検索がシステムのなかで１つである保障はなく、システムの規模によって多数の同時検索が実行される。これによって通信負荷がシステム全体のパフォーマンスにあたえる影響は非常に大きい。その中での必要な送受信回数が多い場合は、当然ながらその影響を受けやすいことになる。つまり、同時実行時にパフォーマンスが落ちやすいことを意味する。

また分散検索を構成する各ユニット間のパフォーマンスがすべての検索ユニット間で同等である保証はない。よって、どうしても通信負荷の大きい分散検索ユニットのパフォーマンスによって全体のパフォーマンスが決まることになる。この影響は当然ながら必要な送受信回数によってリニアに大きくなっていく。これらによっては分散検索本来の第１の目的である負荷分散のメリットを損なう可能性もある。

本発明は、上記問題点を解消するためになされたもので、各検索ユニットの検索結果情報に相対スコア算出のための検索対象情報をも含ませることによって、検索時に検索条件発信側と各分散検索ユニット間での送受信回数を１回で済ませることで通信負荷を抑え、分散検索のパフォーマンスを向上させることを可能とするものである。

上記目的を達成するために、本発明はネットワーク上に分散配置された複数の情報処理装置のうちの１つ情報処理装置で実施される情報処理方法であって、検索条件を送信する送信工程と、前記検索条件を受信した情報処理装置が該検索条件に基づいて取得した相対スコアを算出するための相対スコア算出情報及び検索結果を受信する受信工程と、前記受信工程で受信した相対スコア算出情報から相対スコアを算出する算出工程と、前記算出工程で算出した相対スコアに基づいて前記検索結果を出力する出力工程とを備えたことを特徴とする。

また本発明は、ネットワーク上に分散配置された複数の情報処理装置のうちの１つ情報処理装置であって、検索条件を送信する送信手段と、前記検索条件を受信した情報処理装置が該検索条件に基づいて取得した相対スコアを算出するための相対スコア算出情報及び検索結果を受信する受信手段と、前記受信手段で受信した相対スコア算出情報から相対スコアを算出する算出手段と、前記算出手段で算出した相対スコアに基づいて前記検索結果を出力する出力手段とを備えたことを特徴とする。

本発明によれば、検索条件を送信し検索結果を受信する送受信以外の送受信を行わなくても相対スコアを算出することが出来るため、通信負荷を抑え、パフォーマンスを向上することが可能となる。

以下、本発明の好適な実施の形態について、図面を用いて説明する。

まず、本発明の第１の実施の形態について、図１〜図１６を用いて説明する。図１〜図３は、本実施の形態に係る情報処理装置の構成を示す図である。図１は分散ネットワーク構成を示した図である。なお、以下では情報処理装置の例として検索ユニットを挙げて説明する。ネットワークに複数の検索ユニットが存在し、情報をやりとりするユニットが設定されている。それぞれの検索ユニットはそれぞれの検索対象である情報を管理する。ユーザはネットワークに存在する１つの検索ユニットに対し検索要求を発行することで、分散ネットワーク全体に対して検索した結果を得ることが可能となっている。もちろん管理者はユーザに対して検索ユニットに対するアクセスを制限させることも可能である。

図２は、上記ネットワークシステムを構成する各検索ユニットの機能構成を示したブロック図である。同図において、２０１は分散処理部である。ネットワーク上の他の検索ユニットとの分散協調処理を行い、ネットワーク全体での分散検索をする機能を担う。検索要求に対する分散検索処理条件の作成機能、および検索ユニット間のデータ送受信機能、送受信対象検索ユニット情報の管理機能を含む。

２０２は検索処理部である。２０１の分散処理部から受けた検索要求を解析し、登録されている検索対象文書内を検索する機能を担う。２０３は指定部である。１つ以上の文書を選択する機能を担う。ユーザによって選択する文書が指示されない場合には状況に合わせて自動的に選択する機能を含む。２０４は個人情報管理部である。ユーザ毎の設定情報を管理する機能を担う。２０５はＩＦ（インターフェース）部である。データの登録や検索、印刷等の指示を受け付け、その結果を表示する機能を担う。

２０６はデータベース部である。検索用のデータ、検索対象そのものの文書データ等をデータベースで管理する機能を担う。２０７は要約部である。指定された文書の内容を解析し、その要約を作成する機能を担う。通常、文書の内容にかかわらず要約結果を指定されたサイズにする要約、あるいは指定された要約率で行う要約、あるいは要約結果サイズや要約率を文書の内容によって判断する要約等を実行する。２０８は登録部である。登録の指示を受け、検索の対象となるデータを解析し、検索のための情報とデータそのものをデータベースに登録する機能を担う。２０９は印刷部である。印刷の指示を受け、データを印刷する機能を担う。２１０は印刷装置指定部である。ユーザが使用する可能性のある１つ以上の印刷装置を指定しておく機能を担う。２１１はネットワークバスである。各機能部間のデータのやりとりを担う。本機能は図１におけるネットワークそのものと、ネットワークに繋がるすべての機材が担う。

図３は、図２で示したネットワークシステムにおける各検索ユニットの基本構成を示した図である。同図において、３０１はＣＰＵ（マイクロプロセッサ：中央演算処理部）で、文書検索のための演算、論理判断等を行い、後述するバス（ＢＵＳ）３０９を介して該バス３０９に接続された後述する各構成要素を制御する。３０２はＲＯＭ（リードオンリーメモリ）で、読み出し専用の固定メモリであり、ＣＰＵ３０１による制御プログラム等を記憶している。３０３はＲＡＭ（ランダムアクセスメモリ）で、各構成要素からの各種データの一時記憶に用いる。

３０４は入力部で、キーボード及びマウス等からなる。３０５は表示部で、ＣＲＴ（陰極線管）或いは液晶表示器等からなる。３０６は記憶部で、ハードディスクからなる。３０７は外部記憶部で、フロッピー（登録商標）ディスクや書き込み可能ＣＤ、ＤＶＤ等の外部記憶部にアクセスするためのドライブ等である。この外部記憶部３０７は、記憶部３０６と同等に使用でき、それらの記憶媒体を通して他の情報処理装置とのデータ交換を行う装置である。

３０８は通信部で、モデム或いはＬＡＮ（ローカルエリアネットワーク）コントローラ等からなり、通信回線を介して外部とのデータ交換を行う部である。３０９はバス（ＢＵＳ）で、ＣＰＵ３０１の制御対象である後述する各構成要素を指示するアドレス信号、コントロール信号を転送する。また、後述する各構成要素間のデータ転送を行う。

斯かる各構成要素からなる本実施の形態に斯かる情報処理装置においては、入力部３０４からの各種の入力に応じて作動するものであって、入力部３０４からの入力が供給されると、まず、インタラプタ信号がＣＰＵ３０１に送られ、該ＣＰＵ３０１がＲＯＭ３０２内に記憶してある各種の制御信号を読み出し、それらの制御信号に従って各種の制御が行われる。

以上の構成よりなる本実施例装置では、ネットワーク上の各検索ユニット間で分散して文書を検索することが可能である。この処理例を以下に説明する。

図４は本発明を適用した情報処理装置全体を一つの検索装置とみたてた場合での検索統合スコアの構成例を示したものである。

検索統合スコアは絶対スコアと相対スコアから成り、それぞれα、βといった重み付け係数との積の和によって算出される。

絶対スコアは意味概念ベクトル類似度を用いている。検索クエリと対象文書をともにｎ次元の意味概念ベクトルで表現し、その類似度をベクトルの余弦値を使用している。意味概念ベクトルは単語の同ベクトルを保存した概念ベクトル辞書を用い、検索クエリおよび文書の内容から形態素解析処理で抽出された単語をベクトル表現に転置し、その総和によって表現される。

相対スコアは単語頻度情報と単語相対特徴量の積によって算出される。ここでの単語相対特徴量はｌｏｇ（（対象文書数）／（単語別総出現文書数））であらわされる対象検索文書内での単語の偏在性を示したものである。

このように構成されている場合、各分散検索ユニットにおいて絶対スコアは単独で算出することが可能であるが、相対スコアを算出することは不可能である。

図５は情報処理装置の各分散検索ユニットが出力する検索結果の構成例を示したものである。

検索結果情報は、検索ターゲット全体情報とローカル検索結果リストの２つに分けられている。

検索ターゲット全体情報は分散検索ユニットの対象としている検索ターゲット全体の情報であり、対象文書数と単語別の出現頻度数から構成されている。

ローカル検索結果リストは分散検索ターゲット内における検索結果であり、各検索ユニット内での絶対スコアによるランキングで順序付けられている。検索結果リストはその分散検索ターゲットにおける文書ＩＤと絶対スコアおよび各文書における単語の頻度情報から構成されている。

ここでの対象文書数、単語別出現文書数、単語別頻度情報によって結果送信先で相対スコアを算出することが可能となる。

図６は情報処理装置における相対スコアの算出例を示したものである。最初に各検索ユニットから得た対象文書数の総和によって総対象文書数を算出する。次に単語別に各検索ユニットから得た単語別出現文書数の総和によって単語別総出現文書数を算出する。以上から単語別の単語相対特徴量をｌｏｇ（（総対象文書数）／（単語別総出現文書数））によって算出する。以上により、相対スコアは各文書に出現する単語の単語頻度＊単語相対特徴量の総和によって算出される。得られた文書の相対スコアと算出済の絶対スコアから、α、βといった重み付け係数を用いてα＊（絶対スコア）＋β＊（相対スコア）によって算出される。

上述の説明をフローに従って説明する。図７は本発明の情報処理装置の動作、より具体的にはマイクロプロセッサＣＰＵ３０１による分散検索作成処理のフローチャートである。

ステップＳ７０１はシステムの初期化処理であり、各種パラメータの初期化や初期画面の表示等を行う処理である。ステップＳ７０２はキーボード等の入力部から何らかのキーが押下され、割込みが発生するのをマイクロプロセッサＣＰＵにおいて待つ処理である。キーが入力されると、ステップＳ７０３においてマイクロプロセッサＣＰＵはこのキーを判別し、キーの種類において各種の処理に分岐する。各種キーに対応した分岐先の複数の処理をステップＳ７０４という形でまとめて表現している。分散検索処理時における特定対象登録処理や、図８で説明する分散検索処理等がこの分岐先の一部となる。ステップＳ７０５は上記の各処理の結果、変更された部分を表示する表示処理である。表示内容を表示パターンに展開しバッファに出力するといった通常広く行われている処理である。

図８は、図７のステップＳ７０４で行うキー対応処理の一つである分散検索処理を詳細化したフローチャートである。

ステップＳ８０１は検索要求を取得する処理であり、ユーザからの検索クエリと分散検索指示を取得する。ステップＳ８０２は文書を分散検索するための分散検索指示情報を生成する処理であり、ステップＳ８０１で取得した文書検索要求に基づき分散検索指示要求情報を生成する。

ステップＳ８０３は文書を分散検索するための分散検索指示情報を協調先の他の検索ユニットに送信する処理であり、ステップＳ８０２で生成された情報を送信する。ステップＳ８０４は協調先の検索ユニットからの検索結果を取得する処理であり、ステップＳ８０３で指示した分散検索指示情報のリターン結果を受信する。ステップＳ８０５は、集まった各分散検索ユニットからの結果をもとに統合スコアを算出し、最終的な検索結果を生成する。

ステップＳ８０６は分散検索結果を表示する処理であり、ステップＳ８０５で生成された情報に基づき、順序付けされた文書を検索結果としてリストアップして表示する処理である。

図９は、図８のステップＳ８０５で行う検索結果統合処理を詳細化したフローチャートである。

ステップＳ９０１は相対スコアを算出するための重要単語の特徴量を算出する。ステップＳ９０２はステップＳ９０１で算出した重要単語の特徴量をもとに各文書の相対スコアを算出する。算出された相対スコアと各検索ユニットの検索結果に含まれる絶対スコアをもとに統合スコアを算出する。

ステップＳ９０３はステップＳ９０２で算出した統合スコアによって、検索結果全体をソートし、最終的な検索結果を作成する。

図１０は、図９のステップＳ９０１で行う重要単語の特徴量算出処理を詳細化したフローチャートである。ステップＳ１００１は分散検索結果を回収できた分散検索ユニットの内の第１の検索ユニットをステップＳ１００２からステップＳ１００４までの処理対象としてセットする処理である。

ステップＳ１００２は処理対象の分散検索ユニットの検索結果情報から対象分散検索ユニットでの対象文書数を得て、分散検索全体の検索対象数に加算することで総文書数を更新する。

ステップＳ１００３は分散検索対象ユニットの検索結果の内の第１の重要語をステップＳ１００４の処理対象としてセットする。ステップＳ１００４は対象の重要語の対象分散検索ユニットでの総出現頻度数を得て、分散検索全体の該重要語の出現頻度数に加算することで総出現頻度数を更新する。

ステップＳ１００５は対象の分散検索ユニットの検索結果情報における重要語の内、未処理の単語がまだあるかどうか判定する。まだ存在する場合は、ステップＳ１０１１に進み、すべての重要語が処理されている場合はステップＳ１００６へ進む。

ステップＳ１０１１はステップＳ１００５で未処理重要語が存在すると判定された場合に行われる処理であり、処理対象重要語を次の未処理である重要語に処理対象としてセットする。そして処理対象重要語が変更された状態でステップＳ１００４が行われる。

ステップＳ１００６は分散検索結果を回収できた分散検索ユニットの内、未処理の検索ユニットがまだ存在するかどうか判定する。まだ存在する場合は、ステップＳ１０１０に進み、すべての検索ユニットが処理されている場合はステップＳ１００７へ進む。

ステップＳ１０１０はステップＳ１００６で未処理検索ユニットが存在すると判定された場合に行われる処理であり、処理対象検索ユニットを次の未処理である検索ユニットに処理対象としてセットする。そして処理対象検索ユニットが変更された状態でステップＳ１００２からステップＳ１００４までが行われる。

ステップＳ１００７からステップＳ１００９は、ステップＳ１００６までにおいてすべての検索ユニットの結果を処理することによって得た総文書数と各重要語の総出現頻度数をもとに、各重要語の特徴量を求める処理である。ステップＳ１００７は特徴量をもとめる第１の重要語を処理対象としてセットする。ステップＳ１００８は総文書数と処理対象の重要語の総出現頻度数によって、処理対象の重要語の特徴量を得る処理である。特徴量の算出方法は図６で述べた単語相対特徴量である。ステップＳ１００９は対象の分散検索ユニットの検索結果情報における重要語の内、未処理の単語がまだあるかどうか判定する。まだ存在する場合は、ステップＳ１０１２に進み、すべての重要語が処理されている場合はリターンする。ステップＳ１０１２はステップＳ１００９で未処理重要語が存在すると判定された場合に行われる処理であり、処理対象重要語を次の未処理である重要語に処理対象としてセットする。そして処理対象重要語が変更された状態でステップＳ１００８が行われる。

図１１は、図９のステップＳ９０２で行う統合スコアの算出処理を詳細化したフローチャートである。

ステップＳ１１０１は分散検索結果を回収できた分散検索ユニットの内の第１の検索ユニットをステップＳ１１０２からステップＳ１１０７までの処理対象としてセットする処理である。

ステップＳ１１０２は処理対象の分散検索対象ユニットの検索結果の内の第１の検索結果文書をステップＳ１１０３からステップＳ１１０６までの処理対象としてセットする。

ステップＳ１１０３は処理対象の検索結果文書内に出現する第１の重要語をステップＳ１１０４の処理対象としてセットする。

ステップＳ１１０４は処理対象の重要語の出現頻度とステップＳ９０１で得た同重要語の特徴量をもとに、相対スコアを算出する処理である。相対スコアの算出方法は図６で述べた単語別頻度情報＊単語相対特徴量の総和である。ここでは対象重要語の単語別頻度情報＊単語相対特徴量を求め、文書の累計相対スコアに加算する処理を行う。

ステップＳ１１０５は対象文書内に出現する重要語の内、未処理の単語がまだあるかどうか判定する。まだ存在する場合は、ステップＳ１１１１に進み、すべての重要語が処理されている場合はステップＳ１１０６へ進む。

ステップＳ１１１１はステップＳ１１０５で未処理重要語が存在すると判定された場合に行われる処理であり、処理対象重要語を次の未処理である重要語に処理対象としてセットする。そして処理対象重要語が変更された状態でステップＳ１１０４が行われる。

ステップＳ１１０６は対象文書のすべての重要語を処理したことで得られる対象文書の相対スコアと同文書の分散検索ユニットの検索結果情報における絶対スコアをもとに統合スコアを算出する処理を行う。総合スコアの算出方法は図６で述べたとおりである。

ステップＳ１１０７は対象検索ユニットにおける検索結果文書の内、未処理の文書がまだあるかどうか判定する。まだ存在する場合は、ステップＳ１１１０に進み、すべての検索結果文書が処理されている場合はステップＳ１１０８へ進む。

ステップＳ１１１０はステップＳ１１０７で未処理検索結果文書が存在すると判定された場合に行われる処理であり、処理対象検索結果文書を次の未処理である検索結果文書に処理対象としてセットする。そして処理対象検索結果文書が変更された状態でステップＳ１１０３からステップＳ１１０６までが行われる。

ステップＳ１１０８は分散検索結果を回収できた分散検索ユニットの内、未処理の検索ユニットがまだ存在するかどうか判定する。まだ存在する場合は、ステップＳ１１０９に進み、すべての検索ユニットが処理されている場合はリターンする。

ステップＳ１１０９はステップＳ１１０８で未処理検索ユニットが存在すると判定された場合に行われる処理であり、処理対象検索ユニットを次の未処理である検索ユニットに処理対象としてセットする。そして処理対象検索ユニットが変更された状態でステップステップＳ１１０２からステップＳ１１０７までが行われる。

以上のような構成とすることで、検索時に検索条件発信側と各分散検索ユニット間での送受信回数を最低値である１回で済ませることで基本的な通信負荷を抑え、分散検索のパフォーマンスを向上させることを可能にするという効果を奏する。

（他の実施例）
上述した実施例における絶対スコア、相対スコアともに文書のテキストに対しての検索クエリに対する適合性のスコアを用いているが、同スコアの対象は文書のテキストに限らず画像・動画・音声等を対象とすることも可能である。いずれの場合においてもクエリと対象文書のみで求められる絶対スコアと検索対象全体の状況に依存する相対スコアに分けることが可能であれば、同形態での特徴を適用させることが可能である。

また、本発明は、装置やシステムに記録媒体や通信装置を使ってソフトウェアを提供することによっても、実現可能であることは言うまでもない。この場合、本発明を達成するためのソフトウェアによって表わされる制御プログラムを格納した記憶媒体を、システム或いは装置に読み出すこと、或いは前記制御プログラムを、ネットワーク経由でシステム或いは装置に読み出すことによって、そのシステム或いは装置が本発明の効果を享受することが可能となる。また、前記制御プログラムを記憶するための記憶媒体としては、ハードディスク、フロッピィディスク、光ディスク、光磁気ディスク、ＣＤ−Ｒ、ＤＶＤ、磁気テープ、不揮発性のメモリカード、ＣＤ−ＲＯＭ等を用いることができるのは言うまでもない。

本発明の実施例１に係る情報処理装置のネットワーク構成の概要を示す図である。本発明の実施例１に係る情報処理装置の機能構成を示すブロック図である。本発明の実施例１に係る情報処理装置のシステム構成を示すブロック図である。本発明の実施例１に係る情報処理装置における統合スコアの構成要素である絶対スコアと相対スコアの一例を示す図である。本発明の実施例１に係る情報処理装置における各分散検索ユニットが出力する検索結果情報の構成の一例を示す図である。本発明の実施例１に係る情報処理装置における統合スコアの計算式の一例を示す図である。本発明の実施例１に係る情報処理装置における処理動作全体の流れを示すフローチャートである。本発明の実施例１に係る情報処理装置における分散検索処理動作の詳細な流れを示すフローチャートである。本発明の実施例１に係る情報処理装置における分散検索結果統合処理動作の詳細な流れを示すフローチャートである。本発明の実施例１に係る情報処理装置における分散検索結果統合時における重要単語特徴量算出処理動作の詳細な流れを示すフローチャートである。本発明の実施例１に係る情報処理装置における分散検索結果統合時における統合スコア算出処理動作の詳細な流れを示すフローチャートである。

Claims

ネットワーク上に分散配置された情報処理装置のうちの１つ情報処理装置で実施される情報処理方法であって、
検索条件を送信する送信工程と、
前記検索条件を受信した情報処理装置が該検索条件に基づいて取得した相対スコアを算出するための相対スコア算出情報及び検索結果を受信する受信工程と、
前記受信工程で受信した相対スコア算出情報から相対スコアを算出する算出工程と、
前記算出工程で算出した相対スコアに基づいて前記検索結果を出力する出力工程とを備えたことを特徴とする情報処理方法。
前記相対スコア算出情報は、前記情報処理装置が管理する情報の総数及び前記情報処理装置が管理する情報のうち前記検索条件に合致する情報の数であることを特徴とする請求項１記載の情報処理方法。
前記受信工程は、前記情報処理装置が管理する情報中の前記検索条件に合致する構成部分の数に関わる数情報を更に受信し、
前記出力工程は、前記算出工程で算出した相対スコア及び前記受信工程で受信した数情報に基づいて前記検索結果を出力することを特徴とする請求項１記載の情報処理方法。
前記受信工程は、前記情報処理装置が管理する情報中の前記検索条件に合致する構成部分の数に関わる数情報を更に受信し、
前記算出工程は、前記受信工程で受信した前記情報処理装置が管理する情報の総数と前記情報処理装置が管理する情報のうち前記検索条件に合致する情報の数との割合に関する数値に、前記情報処理装置が管理する情報中の前記検索条件に合致する構成部分の数に関わる情報を乗じた値を前記相対スコアとすることを特徴とする請求項２記載の情報処理方法。
前記情報処理装置が管理する情報の総数をＮ、前記情報処理装置が管理する情報のうち前記検索条件に合致する情報の数をｎ、前記情報処理装置が管理する情報中の前記検索条件に合致する構成部分の数に関わる情報をＡとした場合に、前記相対スコアは
Ａ×ｌｏｇ（Ｎ／ｎ）
に基づいて算出することを特徴とする請求項４記載の情報処理方法。
前記受信工程は前記検索条件を受信した情報処理装置が算出した前記検索条件と前記情報処理装置が管理する情報との類似度を更に受信し、
前記受信工程で受信した類似度と前記算出工程で算出した相対スコアに基づいて統合スコアを算出する統合スコア算出工程を更に備え、
前記出力工程は前記統合スコアに基づいて検索結果を出力することを特徴とする請求項１記載の情報処理方法。
ネットワーク上に分散配置された複数の情報処理装置のうちの１つ情報処理装置であって、
検索条件を送信する送信手段と、
前記検索条件を受信した情報処理装置が該検索条件に基づいて取得した相対スコアを算出するための相対スコア算出情報及び検索結果を受信する受信手段と、
前記受信手段で受信した相対スコア算出情報から相対スコアを算出する算出手段と、
前記算出手段で算出した相対スコアに基づいて前記検索結果を出力する出力手段とを備えたことを特徴とする情報処理装置。
前記相対スコア算出情報は、前記情報処理装置が管理する情報の総数及び前記検索ユニットが管理する情報のうち前記検索条件に合致する情報の数であることを特徴とする請求項７記載の情報処理装置。
前記受信手段は、前記情報処理装置が管理する情報中の前記検索条件に合致する構成部分の数に関わる数情報を更に受信し、
前記出力手段は、前記算出手段で算出した相対スコア及び前記受信手段で受信した数情報に基づいて前記検索結果を出力することを特徴とする請求項７記載の情報処理装置。
前記受信手段は、前記情報処理装置が管理する情報中の前記検索条件に合致する構成部分の数に関わる数情報を更に受信し、
前記算出手段は、前記受信手段で受信した前記検索ユニットが管理する情報の総数と前記検索ユニットが管理する情報のうち前記検索条件に合致する情報の数との割合に関する数値に、前記検索ユニットが管理する情報中の前記検索条件に合致する構成部分の数に関わる情報を乗じた値を前記相対スコアとすることを特徴とする請求項８記載の情報処理装置。
前記検索ユニットが管理する情報の総数をＮ、前記検索ユニットが管理する情報のうち前記検索条件に合致する情報の数をｎ、前記検索ユニットが管理する情報中の前記検索条件に合致する構成部分の数に関わる情報をＡとした場合に、前記相対スコアは
Ａ×ｌｏｇ（Ｎ／ｎ）
に基づいて算出することを特徴とする請求項１０記載の情報処理装置。
前記受信手段は前記送信手段で送信した検索条件を受信した前記情報処理装置が算出した前記検索条件と前記検索ユニットが管理する情報との類似度を更に受信し、
前記受信手段で受信した類似度と前記算出手段で算出した相対スコアに基づいて統合スコアを算出する統合スコア算出手段を更に備え、
前記出力手段は前記統合スコアに基づいて検索結果を出力することを特徴とする請求項７記載の情報処理装置。
請求項１乃至６のいずれか１つに記載の情報処理方法をコンピュータに実行させるための制御プログラム。
請求項１３に記載の制御プログラムを格納したことを特徴とするコンピュータ読み取り可能な記憶媒体。