JP2005189963A - 情報処理方法、情報処理装置、制御プログラム及び記憶媒体 - Google Patents
情報処理方法、情報処理装置、制御プログラム及び記憶媒体 Download PDFInfo
- Publication number
- JP2005189963A JP2005189963A JP2003427617A JP2003427617A JP2005189963A JP 2005189963 A JP2005189963 A JP 2005189963A JP 2003427617 A JP2003427617 A JP 2003427617A JP 2003427617 A JP2003427617 A JP 2003427617A JP 2005189963 A JP2005189963 A JP 2005189963A
- Authority
- JP
- Japan
- Prior art keywords
- information
- search
- information processing
- processing apparatus
- search condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】 分散検索においてシステム全体での相対的な検索スコアを分散先の検索ユニットとの通信コストをおさえながら最終スコアに反映させることを目的とする。
【解決手段】 検索条件を送信し、該検索条件を受信した情報処理装置が該検索条件に基づいて取得した相対スコアを算出するための相対スコア算出情報及び検索結果を受信し、受信した相対スコア算出情報から相対スコアを算出し、算出した相対スコアに基づいて検索結果を出力する。
【選択図】 図8
【解決手段】 検索条件を送信し、該検索条件を受信した情報処理装置が該検索条件に基づいて取得した相対スコアを算出するための相対スコア算出情報及び検索結果を受信し、受信した相対スコア算出情報から相対スコアを算出し、算出した相対スコアに基づいて検索結果を出力する。
【選択図】 図8
Description
本発明は、ネットワーク上で分散検索を行う情報処理方法、情報処理装置、制御プログラム及び記録媒体に関する。
ネットワーク規模の拡大により、大量の接続コンピュータが抱える大量のデータを扱えるようになった。そこで、ネットワーク上の存在する大量のデータを効率良く扱うための検索手法がいろいろと考案されてきている。
現在は必要な情報を単一のインデックスに集中管理するサーバを設け、そこですべてのユーザの検索要求を受け付ける方法が主流である。WWW(World Wide Web)のサーチエンジンで代表されるような集中管理型は情報を総合して扱うことを可能とするメリットがあるが、この検索サーバを十分に維持するための大きな問題が2つ存在する。いずれの問題も、情報の増加によってより問題が大きくなる傾向がある。
第1の問題は、情報増加によるインデックスの増大による検索負荷の増加である。情報が増えれば増えるほどインデックスは当然大きくなり、それに対する検索結果を得るための検索負荷も当然大きくなる。
第2の問題は、ユーザからのリクエストや探索ソフト等での情報獲得スピードが情報増加においつかない場合、情報がなかなかインデキシングされない、つまり検索されない状態が続くことである。情報はネットワークに散らばっているわけであり、常に増加・減少を繰り返している。
これらの問題は、複数の検索サーバを相互にやりとりすることで目的の結果を得るような分散検索型で解決することが可能である。
単一のリソース(装置や維持のための人的資源)がすべての作業をこなすのではなく、複数のリソースに分散させ、それらを協調的に動作させることによって個々の作業負荷を減らし、全体の作業効率を上げるための方法であり、これによって第1の問題を解決する。
また情報の探索先を特定せず、リソース同士のやりとりを伝言的なふるまいで拡散させることによって、検索の起点で探索先を調べあげることなく、ネットワークに分散して存在する情報を検索するための方法であり、これによって第2の問題を解決するものである。
しかし、ここで分散故の以下の問題が発生する。
現在の高度な検索機能には、文書対象全体における相対的な特徴量を使用することでランキングを行なうものがある。例えば、テキスト検索における単語の偏在性を特徴量とするものである(例:Inverse Document Frequency)。単語が対象文書の中でどのぐらい偏在してあらわれるかは、どのぐらい文書を特徴付けるかを示しており、その単語の重要度を計ることが可能となる。検索クエリとの単語一致度においてこの重要度を検索結果のスコアに反映させることで検索精度を高めるものである。このような統計情報を利用した相対スコアは、検索対象全体を把握していない各分散検索ユニット単独で求めることは不可能であった。
それを解決するための技術として、特許文献1あるいは特許文献2記載の分散型検索装置がある。いずれも相対スコア算出に必須である検索対象全体の情報を分散検索ユニットから一度回収し、算出した全体情報あるいはそれに基づいて補正された検索条件をあらためて各分散検索ユニットに指示を送信し、正しい結果を得るものである。
特開2002−29754号公報
特開2002−366547号公報
上記従来の技術では正確性の高い結果を得ることが可能であるが、検索時に検索条件発信側と各分散検索ユニット間で最低2回の送受信を行う必要がある。
分散検索を可能とするユニット間の協調は検索実行時にネットワークの通信処理で行われる。分散検索では、1回の検索に対して対象の全分散検索先と通信する必要がある。また同時に実行される検索がシステムのなかで1つである保障はなく、システムの規模によって多数の同時検索が実行される。これによって通信負荷がシステム全体のパフォーマンスにあたえる影響は非常に大きい。その中での必要な送受信回数が多い場合は、当然ながらその影響を受けやすいことになる。つまり、同時実行時にパフォーマンスが落ちやすいことを意味する。
また分散検索を構成する各ユニット間のパフォーマンスがすべての検索ユニット間で同等である保証はない。よって、どうしても通信負荷の大きい分散検索ユニットのパフォーマンスによって全体のパフォーマンスが決まることになる。この影響は当然ながら必要な送受信回数によってリニアに大きくなっていく。これらによっては分散検索本来の第1の目的である負荷分散のメリットを損なう可能性もある。
本発明は、上記問題点を解消するためになされたもので、各検索ユニットの検索結果情報に相対スコア算出のための検索対象情報をも含ませることによって、検索時に検索条件発信側と各分散検索ユニット間での送受信回数を1回で済ませることで通信負荷を抑え、分散検索のパフォーマンスを向上させることを可能とするものである。
上記目的を達成するために、本発明はネットワーク上に分散配置された複数の情報処理装置のうちの1つ情報処理装置で実施される情報処理方法であって、検索条件を送信する送信工程と、前記検索条件を受信した情報処理装置が該検索条件に基づいて取得した相対スコアを算出するための相対スコア算出情報及び検索結果を受信する受信工程と、前記受信工程で受信した相対スコア算出情報から相対スコアを算出する算出工程と、前記算出工程で算出した相対スコアに基づいて前記検索結果を出力する出力工程とを備えたことを特徴とする。
また本発明は、ネットワーク上に分散配置された複数の情報処理装置のうちの1つ情報処理装置であって、検索条件を送信する送信手段と、前記検索条件を受信した情報処理装置が該検索条件に基づいて取得した相対スコアを算出するための相対スコア算出情報及び検索結果を受信する受信手段と、前記受信手段で受信した相対スコア算出情報から相対スコアを算出する算出手段と、前記算出手段で算出した相対スコアに基づいて前記検索結果を出力する出力手段とを備えたことを特徴とする。
本発明によれば、検索条件を送信し検索結果を受信する送受信以外の送受信を行わなくても相対スコアを算出することが出来るため、通信負荷を抑え、パフォーマンスを向上することが可能となる。
以下、本発明の好適な実施の形態について、図面を用いて説明する。
まず、本発明の第1の実施の形態について、図1〜図16を用いて説明する。図1〜図3は、本実施の形態に係る情報処理装置の構成を示す図である。図1は分散ネットワーク構成を示した図である。なお、以下では情報処理装置の例として検索ユニットを挙げて説明する。ネットワークに複数の検索ユニットが存在し、情報をやりとりするユニットが設定されている。それぞれの検索ユニットはそれぞれの検索対象である情報を管理する。ユーザはネットワークに存在する1つの検索ユニットに対し検索要求を発行することで、分散ネットワーク全体に対して検索した結果を得ることが可能となっている。もちろん管理者はユーザに対して検索ユニットに対するアクセスを制限させることも可能である。
図2は、上記ネットワークシステムを構成する各検索ユニットの機能構成を示したブロック図である。同図において、201は分散処理部である。ネットワーク上の他の検索ユニットとの分散協調処理を行い、ネットワーク全体での分散検索をする機能を担う。検索要求に対する分散検索処理条件の作成機能、および検索ユニット間のデータ送受信機能、送受信対象検索ユニット情報の管理機能を含む。
202は検索処理部である。201の分散処理部から受けた検索要求を解析し、登録されている検索対象文書内を検索する機能を担う。203は指定部である。1つ以上の文書を選択する機能を担う。ユーザによって選択する文書が指示されない場合には状況に合わせて自動的に選択する機能を含む。204は個人情報管理部である。ユーザ毎の設定情報を管理する機能を担う。205はIF(インターフェース)部である。データの登録や検索、印刷等の指示を受け付け、その結果を表示する機能を担う。
206はデータベース部である。検索用のデータ、検索対象そのものの文書データ等をデータベースで管理する機能を担う。207は要約部である。指定された文書の内容を解析し、その要約を作成する機能を担う。通常、文書の内容にかかわらず要約結果を指定されたサイズにする要約、あるいは指定された要約率で行う要約、あるいは要約結果サイズや要約率を文書の内容によって判断する要約等を実行する。208は登録部である。登録の指示を受け、検索の対象となるデータを解析し、検索のための情報とデータそのものをデータベースに登録する機能を担う。209は印刷部である。印刷の指示を受け、データを印刷する機能を担う。210は印刷装置指定部である。ユーザが使用する可能性のある1つ以上の印刷装置を指定しておく機能を担う。211はネットワークバスである。各機能部間のデータのやりとりを担う。本機能は図1におけるネットワークそのものと、ネットワークに繋がるすべての機材が担う。
図3は、図2で示したネットワークシステムにおける各検索ユニットの基本構成を示した図である。同図において、301はCPU(マイクロプロセッサ:中央演算処理部)で、文書検索のための演算、論理判断等を行い、後述するバス(BUS)309を介して該バス309に接続された後述する各構成要素を制御する。302はROM(リードオンリーメモリ)で、読み出し専用の固定メモリであり、CPU301による制御プログラム等を記憶している。303はRAM(ランダムアクセスメモリ)で、各構成要素からの各種データの一時記憶に用いる。
304は入力部で、キーボード及びマウス等からなる。305は表示部で、CRT(陰極線管)或いは液晶表示器等からなる。306は記憶部で、ハードディスクからなる。307は外部記憶部で、フロッピー(登録商標)ディスクや書き込み可能CD、DVD等の外部記憶部にアクセスするためのドライブ等である。この外部記憶部307は、記憶部306と同等に使用でき、それらの記憶媒体を通して他の情報処理装置とのデータ交換を行う装置である。
308は通信部で、モデム或いはLAN(ローカルエリアネットワーク)コントローラ等からなり、通信回線を介して外部とのデータ交換を行う部である。309はバス(BUS)で、CPU301の制御対象である後述する各構成要素を指示するアドレス信号、コントロール信号を転送する。また、後述する各構成要素間のデータ転送を行う。
斯かる各構成要素からなる本実施の形態に斯かる情報処理装置においては、入力部304からの各種の入力に応じて作動するものであって、入力部304からの入力が供給されると、まず、インタラプタ信号がCPU301に送られ、該CPU301がROM302内に記憶してある各種の制御信号を読み出し、それらの制御信号に従って各種の制御が行われる。
以上の構成よりなる本実施例装置では、ネットワーク上の各検索ユニット間で分散して文書を検索することが可能である。この処理例を以下に説明する。
図4は本発明を適用した情報処理装置全体を一つの検索装置とみたてた場合での検索統合スコアの構成例を示したものである。
検索統合スコアは絶対スコアと相対スコアから成り、それぞれα、βといった重み付け係数との積の和によって算出される。
絶対スコアは意味概念ベクトル類似度を用いている。検索クエリと対象文書をともにn次元の意味概念ベクトルで表現し、その類似度をベクトルの余弦値を使用している。意味概念ベクトルは単語の同ベクトルを保存した概念ベクトル辞書を用い、検索クエリおよび文書の内容から形態素解析処理で抽出された単語をベクトル表現に転置し、その総和によって表現される。
相対スコアは単語頻度情報と単語相対特徴量の積によって算出される。ここでの単語相対特徴量はlog((対象文書数)/(単語別総出現文書数))であらわされる対象検索文書内での単語の偏在性を示したものである。
このように構成されている場合、各分散検索ユニットにおいて絶対スコアは単独で算出することが可能であるが、相対スコアを算出することは不可能である。
図5は情報処理装置の各分散検索ユニットが出力する検索結果の構成例を示したものである。
検索結果情報は、検索ターゲット全体情報とローカル検索結果リストの2つに分けられている。
検索ターゲット全体情報は分散検索ユニットの対象としている検索ターゲット全体の情報であり、対象文書数と単語別の出現頻度数から構成されている。
ローカル検索結果リストは分散検索ターゲット内における検索結果であり、各検索ユニット内での絶対スコアによるランキングで順序付けられている。検索結果リストはその分散検索ターゲットにおける文書IDと絶対スコアおよび各文書における単語の頻度情報から構成されている。
ここでの対象文書数、単語別出現文書数、単語別頻度情報によって結果送信先で相対スコアを算出することが可能となる。
図6は情報処理装置における相対スコアの算出例を示したものである。最初に各検索ユニットから得た対象文書数の総和によって総対象文書数を算出する。次に単語別に各検索ユニットから得た単語別出現文書数の総和によって単語別総出現文書数を算出する。以上から単語別の単語相対特徴量をlog((総対象文書数)/(単語別総出現文書数))によって算出する。以上により、相対スコアは各文書に出現する単語の単語頻度*単語相対特徴量の総和によって算出される。得られた文書の相対スコアと算出済の絶対スコアから、α、βといった重み付け係数を用いてα*(絶対スコア)+β*(相対スコア)によって算出される。
上述の説明をフローに従って説明する。図7は本発明の情報処理装置の動作、より具体的にはマイクロプロセッサCPU301による分散検索作成処理のフローチャートである。
ステップS701はシステムの初期化処理であり、各種パラメータの初期化や初期画面の表示等を行う処理である。ステップS702はキーボード等の入力部から何らかのキーが押下され、割込みが発生するのをマイクロプロセッサCPUにおいて待つ処理である。キーが入力されると、ステップS703においてマイクロプロセッサCPUはこのキーを判別し、キーの種類において各種の処理に分岐する。各種キーに対応した分岐先の複数の処理をステップS704という形でまとめて表現している。分散検索処理時における特定対象登録処理や、図8で説明する分散検索処理等がこの分岐先の一部となる。ステップS705は上記の各処理の結果、変更された部分を表示する表示処理である。表示内容を表示パターンに展開しバッファに出力するといった通常広く行われている処理である。
図8は、図7のステップS704で行うキー対応処理の一つである分散検索処理を詳細化したフローチャートである。
ステップS801は検索要求を取得する処理であり、ユーザからの検索クエリと分散検索指示を取得する。ステップS802は文書を分散検索するための分散検索指示情報を生成する処理であり、ステップS801で取得した文書検索要求に基づき分散検索指示要求情報を生成する。
ステップS803は文書を分散検索するための分散検索指示情報を協調先の他の検索ユニットに送信する処理であり、ステップS802で生成された情報を送信する。ステップS804は協調先の検索ユニットからの検索結果を取得する処理であり、ステップS803で指示した分散検索指示情報のリターン結果を受信する。ステップS805は、集まった各分散検索ユニットからの結果をもとに統合スコアを算出し、最終的な検索結果を生成する。
ステップS806は分散検索結果を表示する処理であり、ステップS805で生成された情報に基づき、順序付けされた文書を検索結果としてリストアップして表示する処理である。
図9は、図8のステップS805で行う検索結果統合処理を詳細化したフローチャートである。
ステップS901は相対スコアを算出するための重要単語の特徴量を算出する。ステップS902はステップS901で算出した重要単語の特徴量をもとに各文書の相対スコアを算出する。算出された相対スコアと各検索ユニットの検索結果に含まれる絶対スコアをもとに統合スコアを算出する。
ステップS903はステップS902で算出した統合スコアによって、検索結果全体をソートし、最終的な検索結果を作成する。
図10は、図9のステップS901で行う重要単語の特徴量算出処理を詳細化したフローチャートである。ステップS1001は分散検索結果を回収できた分散検索ユニットの内の第1の検索ユニットをステップS1002からステップS1004までの処理対象としてセットする処理である。
ステップS1002は処理対象の分散検索ユニットの検索結果情報から対象分散検索ユニットでの対象文書数を得て、分散検索全体の検索対象数に加算することで総文書数を更新する。
ステップS1003は分散検索対象ユニットの検索結果の内の第1の重要語をステップS1004の処理対象としてセットする。ステップS1004は対象の重要語の対象分散検索ユニットでの総出現頻度数を得て、分散検索全体の該重要語の出現頻度数に加算することで総出現頻度数を更新する。
ステップS1005は対象の分散検索ユニットの検索結果情報における重要語の内、未処理の単語がまだあるかどうか判定する。まだ存在する場合は、ステップS1011に進み、すべての重要語が処理されている場合はステップS1006へ進む。
ステップS1011はステップS1005で未処理重要語が存在すると判定された場合に行われる処理であり、処理対象重要語を次の未処理である重要語に処理対象としてセットする。そして処理対象重要語が変更された状態でステップS1004が行われる。
ステップS1006は分散検索結果を回収できた分散検索ユニットの内、未処理の検索ユニットがまだ存在するかどうか判定する。まだ存在する場合は、ステップS1010に進み、すべての検索ユニットが処理されている場合はステップS1007へ進む。
ステップS1010はステップS1006で未処理検索ユニットが存在すると判定された場合に行われる処理であり、処理対象検索ユニットを次の未処理である検索ユニットに処理対象としてセットする。そして処理対象検索ユニットが変更された状態でステップS1002からステップS1004までが行われる。
ステップS1007からステップS1009は、ステップS1006までにおいてすべての検索ユニットの結果を処理することによって得た総文書数と各重要語の総出現頻度数をもとに、各重要語の特徴量を求める処理である。ステップS1007は特徴量をもとめる第1の重要語を処理対象としてセットする。ステップS1008は総文書数と処理対象の重要語の総出現頻度数によって、処理対象の重要語の特徴量を得る処理である。特徴量の算出方法は図6で述べた単語相対特徴量である。ステップS1009は対象の分散検索ユニットの検索結果情報における重要語の内、未処理の単語がまだあるかどうか判定する。まだ存在する場合は、ステップS1012に進み、すべての重要語が処理されている場合はリターンする。ステップS1012はステップS1009で未処理重要語が存在すると判定された場合に行われる処理であり、処理対象重要語を次の未処理である重要語に処理対象としてセットする。そして処理対象重要語が変更された状態でステップS1008が行われる。
図11は、図9のステップS902で行う統合スコアの算出処理を詳細化したフローチャートである。
ステップS1101は分散検索結果を回収できた分散検索ユニットの内の第1の検索ユニットをステップS1102からステップS1107までの処理対象としてセットする処理である。
ステップS1102は処理対象の分散検索対象ユニットの検索結果の内の第1の検索結果文書をステップS1103からステップS1106までの処理対象としてセットする。
ステップS1103は処理対象の検索結果文書内に出現する第1の重要語をステップS1104の処理対象としてセットする。
ステップS1104は処理対象の重要語の出現頻度とステップS901で得た同重要語の特徴量をもとに、相対スコアを算出する処理である。相対スコアの算出方法は図6で述べた単語別頻度情報*単語相対特徴量の総和である。ここでは対象重要語の単語別頻度情報*単語相対特徴量を求め、文書の累計相対スコアに加算する処理を行う。
ステップS1105は対象文書内に出現する重要語の内、未処理の単語がまだあるかどうか判定する。まだ存在する場合は、ステップS1111に進み、すべての重要語が処理されている場合はステップS1106へ進む。
ステップS1111はステップS1105で未処理重要語が存在すると判定された場合に行われる処理であり、処理対象重要語を次の未処理である重要語に処理対象としてセットする。そして処理対象重要語が変更された状態でステップS1104が行われる。
ステップS1106は対象文書のすべての重要語を処理したことで得られる対象文書の相対スコアと同文書の分散検索ユニットの検索結果情報における絶対スコアをもとに統合スコアを算出する処理を行う。総合スコアの算出方法は図6で述べたとおりである。
ステップS1107は対象検索ユニットにおける検索結果文書の内、未処理の文書がまだあるかどうか判定する。まだ存在する場合は、ステップS1110に進み、すべての検索結果文書が処理されている場合はステップS1108へ進む。
ステップS1110はステップS1107で未処理検索結果文書が存在すると判定された場合に行われる処理であり、処理対象検索結果文書を次の未処理である検索結果文書に処理対象としてセットする。そして処理対象検索結果文書が変更された状態でステップS1103からステップS1106までが行われる。
ステップS1108は分散検索結果を回収できた分散検索ユニットの内、未処理の検索ユニットがまだ存在するかどうか判定する。まだ存在する場合は、ステップS1109に進み、すべての検索ユニットが処理されている場合はリターンする。
ステップS1109はステップS1108で未処理検索ユニットが存在すると判定された場合に行われる処理であり、処理対象検索ユニットを次の未処理である検索ユニットに処理対象としてセットする。そして処理対象検索ユニットが変更された状態でステップステップS1102からステップS1107までが行われる。
以上のような構成とすることで、検索時に検索条件発信側と各分散検索ユニット間での送受信回数を最低値である1回で済ませることで基本的な通信負荷を抑え、分散検索のパフォーマンスを向上させることを可能にするという効果を奏する。
(他の実施例)
上述した実施例における絶対スコア、相対スコアともに文書のテキストに対しての検索クエリに対する適合性のスコアを用いているが、同スコアの対象は文書のテキストに限らず画像・動画・音声等を対象とすることも可能である。いずれの場合においてもクエリと対象文書のみで求められる絶対スコアと検索対象全体の状況に依存する相対スコアに分けることが可能であれば、同形態での特徴を適用させることが可能である。
上述した実施例における絶対スコア、相対スコアともに文書のテキストに対しての検索クエリに対する適合性のスコアを用いているが、同スコアの対象は文書のテキストに限らず画像・動画・音声等を対象とすることも可能である。いずれの場合においてもクエリと対象文書のみで求められる絶対スコアと検索対象全体の状況に依存する相対スコアに分けることが可能であれば、同形態での特徴を適用させることが可能である。
また、本発明は、装置やシステムに記録媒体や通信装置を使ってソフトウェアを提供することによっても、実現可能であることは言うまでもない。この場合、本発明を達成するためのソフトウェアによって表わされる制御プログラムを格納した記憶媒体を、システム或いは装置に読み出すこと、或いは前記制御プログラムを、ネットワーク経由でシステム或いは装置に読み出すことによって、そのシステム或いは装置が本発明の効果を享受することが可能となる。また、前記制御プログラムを記憶するための記憶媒体としては、ハードディスク、フロッピィディスク、光ディスク、光磁気ディスク、CD−R、DVD、磁気テープ、不揮発性のメモリカード、CD−ROM等を用いることができるのは言うまでもない。
Claims (14)
- ネットワーク上に分散配置された情報処理装置のうちの1つ情報処理装置で実施される情報処理方法であって、
検索条件を送信する送信工程と、
前記検索条件を受信した情報処理装置が該検索条件に基づいて取得した相対スコアを算出するための相対スコア算出情報及び検索結果を受信する受信工程と、
前記受信工程で受信した相対スコア算出情報から相対スコアを算出する算出工程と、
前記算出工程で算出した相対スコアに基づいて前記検索結果を出力する出力工程とを備えたことを特徴とする情報処理方法。 - 前記相対スコア算出情報は、前記情報処理装置が管理する情報の総数及び前記情報処理装置が管理する情報のうち前記検索条件に合致する情報の数であることを特徴とする請求項1記載の情報処理方法。
- 前記受信工程は、前記情報処理装置が管理する情報中の前記検索条件に合致する構成部分の数に関わる数情報を更に受信し、
前記出力工程は、前記算出工程で算出した相対スコア及び前記受信工程で受信した数情報に基づいて前記検索結果を出力することを特徴とする請求項1記載の情報処理方法。 - 前記受信工程は、前記情報処理装置が管理する情報中の前記検索条件に合致する構成部分の数に関わる数情報を更に受信し、
前記算出工程は、前記受信工程で受信した前記情報処理装置が管理する情報の総数と前記情報処理装置が管理する情報のうち前記検索条件に合致する情報の数との割合に関する数値に、前記情報処理装置が管理する情報中の前記検索条件に合致する構成部分の数に関わる情報を乗じた値を前記相対スコアとすることを特徴とする請求項2記載の情報処理方法。 - 前記情報処理装置が管理する情報の総数をN、前記情報処理装置が管理する情報のうち前記検索条件に合致する情報の数をn、前記情報処理装置が管理する情報中の前記検索条件に合致する構成部分の数に関わる情報をAとした場合に、前記相対スコアは
A×log(N/n)
に基づいて算出することを特徴とする請求項4記載の情報処理方法。 - 前記受信工程は前記検索条件を受信した情報処理装置が算出した前記検索条件と前記情報処理装置が管理する情報との類似度を更に受信し、
前記受信工程で受信した類似度と前記算出工程で算出した相対スコアに基づいて統合スコアを算出する統合スコア算出工程を更に備え、
前記出力工程は前記統合スコアに基づいて検索結果を出力することを特徴とする請求項1記載の情報処理方法。 - ネットワーク上に分散配置された複数の情報処理装置のうちの1つ情報処理装置であって、
検索条件を送信する送信手段と、
前記検索条件を受信した情報処理装置が該検索条件に基づいて取得した相対スコアを算出するための相対スコア算出情報及び検索結果を受信する受信手段と、
前記受信手段で受信した相対スコア算出情報から相対スコアを算出する算出手段と、
前記算出手段で算出した相対スコアに基づいて前記検索結果を出力する出力手段とを備えたことを特徴とする情報処理装置。 - 前記相対スコア算出情報は、前記情報処理装置が管理する情報の総数及び前記検索ユニットが管理する情報のうち前記検索条件に合致する情報の数であることを特徴とする請求項7記載の情報処理装置。
- 前記受信手段は、前記情報処理装置が管理する情報中の前記検索条件に合致する構成部分の数に関わる数情報を更に受信し、
前記出力手段は、前記算出手段で算出した相対スコア及び前記受信手段で受信した数情報に基づいて前記検索結果を出力することを特徴とする請求項7記載の情報処理装置。 - 前記受信手段は、前記情報処理装置が管理する情報中の前記検索条件に合致する構成部分の数に関わる数情報を更に受信し、
前記算出手段は、前記受信手段で受信した前記検索ユニットが管理する情報の総数と前記検索ユニットが管理する情報のうち前記検索条件に合致する情報の数との割合に関する数値に、前記検索ユニットが管理する情報中の前記検索条件に合致する構成部分の数に関わる情報を乗じた値を前記相対スコアとすることを特徴とする請求項8記載の情報処理装置。 - 前記検索ユニットが管理する情報の総数をN、前記検索ユニットが管理する情報のうち前記検索条件に合致する情報の数をn、前記検索ユニットが管理する情報中の前記検索条件に合致する構成部分の数に関わる情報をAとした場合に、前記相対スコアは
A×log(N/n)
に基づいて算出することを特徴とする請求項10記載の情報処理装置。 - 前記受信手段は前記送信手段で送信した検索条件を受信した前記情報処理装置が算出した前記検索条件と前記検索ユニットが管理する情報との類似度を更に受信し、
前記受信手段で受信した類似度と前記算出手段で算出した相対スコアに基づいて統合スコアを算出する統合スコア算出手段を更に備え、
前記出力手段は前記統合スコアに基づいて検索結果を出力することを特徴とする請求項7記載の情報処理装置。 - 請求項1乃至6のいずれか1つに記載の情報処理方法をコンピュータに実行させるための制御プログラム。
- 請求項13に記載の制御プログラムを格納したことを特徴とするコンピュータ読み取り可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003427617A JP2005189963A (ja) | 2003-12-24 | 2003-12-24 | 情報処理方法、情報処理装置、制御プログラム及び記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003427617A JP2005189963A (ja) | 2003-12-24 | 2003-12-24 | 情報処理方法、情報処理装置、制御プログラム及び記憶媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005189963A true JP2005189963A (ja) | 2005-07-14 |
Family
ID=34786838
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003427617A Withdrawn JP2005189963A (ja) | 2003-12-24 | 2003-12-24 | 情報処理方法、情報処理装置、制御プログラム及び記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005189963A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008077216A (ja) * | 2006-09-19 | 2008-04-03 | Toshiba Corp | ネットワーク監視方法 |
JP2008217600A (ja) * | 2007-03-06 | 2008-09-18 | Fujitsu Ltd | 情報検索装置、情報検索方法、情報検索プログラム、及び記録媒体 |
JP2012208775A (ja) * | 2011-03-30 | 2012-10-25 | Casio Comput Co Ltd | 検索方法、検索装置、ならびに、コンピュータプログラム |
-
2003
- 2003-12-24 JP JP2003427617A patent/JP2005189963A/ja not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008077216A (ja) * | 2006-09-19 | 2008-04-03 | Toshiba Corp | ネットワーク監視方法 |
JP2008217600A (ja) * | 2007-03-06 | 2008-09-18 | Fujitsu Ltd | 情報検索装置、情報検索方法、情報検索プログラム、及び記録媒体 |
JP2012208775A (ja) * | 2011-03-30 | 2012-10-25 | Casio Comput Co Ltd | 検索方法、検索装置、ならびに、コンピュータプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20050289134A1 (en) | Apparatus, computer system, and data processing method for using ontology | |
KR100898454B1 (ko) | 통합 검색 서비스 시스템 및 방법 | |
US8200695B2 (en) | Database for uploading, storing, and retrieving similar documents | |
KR100672277B1 (ko) | 개인화 검색 방법 및 검색 서버 | |
JP2002519751A (ja) | 文脈に基づきユーザーのプロフィールが駆動する情報検索 | |
JPH1091638A (ja) | 検索システム | |
JP2007073024A (ja) | マクロ情報生成システム、マクロ情報生成装置、マクロ情報生成方法及びマクロ情報生成プログラム | |
JP2008250722A (ja) | 文書検索システム、文書番号部分列取得装置、および文書検索方法 | |
JP2007206771A (ja) | 情報要素処理プログラム、情報要素処理方法及び情報要素処理装置 | |
JP2006195675A (ja) | ブラウジングシステム | |
CN109952571A (zh) | 基于上下文的图像搜索结果 | |
JP2003228585A (ja) | ファイル管理方法とこの方法を利用可能なファイル管理装置 | |
KR20030036500A (ko) | 온라인 상의 전문가 선출 방법 및 시스템 | |
JP2010267247A (ja) | 情報検索装置、情報検索方法、端末装置、およびプログラム | |
JP2008268985A (ja) | タグを付与する方法 | |
JP2006172067A (ja) | データベース管理方法、システム及びプログラム | |
JP2005189963A (ja) | 情報処理方法、情報処理装置、制御プログラム及び記憶媒体 | |
JP5780633B2 (ja) | 専門家検索装置、および専門家検索方法 | |
JP4499179B1 (ja) | 端末装置 | |
JP2020123321A (ja) | クリップボードデータに基づく検索処理方法および装置 | |
JP2007048056A (ja) | 分散検索処理装置 | |
JP2006202118A (ja) | 属性評価装置、属性評価方法および属性評価プログラム | |
JP3967230B2 (ja) | 画像情報表示システム | |
JPH10134087A (ja) | 文書要求装置および関連文書の先取り方法 | |
JP2010266970A (ja) | 情報検索装置、情報検索方法、辞書作成装置、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20070306 |