JP2011048718A - 情報検索装置、情報検索プログラム - Google Patents

情報検索装置、情報検索プログラム Download PDF

Info

Publication number
JP2011048718A
JP2011048718A JP2009197659A JP2009197659A JP2011048718A JP 2011048718 A JP2011048718 A JP 2011048718A JP 2009197659 A JP2009197659 A JP 2009197659A JP 2009197659 A JP2009197659 A JP 2009197659A JP 2011048718 A JP2011048718 A JP 2011048718A
Authority
JP
Japan
Prior art keywords
document
citation
information
index
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009197659A
Other languages
English (en)
Other versions
JP5261326B2 (ja
Inventor
Shunsuke Konagai
俊介 小長井
Takashi Inoue
孝史 井上
Yamato Takahashi
大和 高橋
Ryoji Kataoka
良治 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009197659A priority Critical patent/JP5261326B2/ja
Publication of JP2011048718A publication Critical patent/JP2011048718A/ja
Application granted granted Critical
Publication of JP5261326B2 publication Critical patent/JP5261326B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】文書内の単語やフレーズの重要性を検索結果に的確に反映させる。
【解決手段】引用情報抽出機能部3は、Web文書間の引用情報(Web文書のURL、引用部分を含む。)を抽出する。インデックス機能部4は、Web文書を全文検索用の単位に分割して文書インデックスに格納する際に引用情報を反映させる。引用情報の反映は、文書インデックスにWeb文書番号と引用部分に含まれる単語やフレーズなどの重みを格納する。作成された文書インデックスは、文書インデックスDB5に保存される。キーワード一致度計算部7は、検索キーワードをもって文書インデックスDB5を参照し、検索キーワードとの一致度を算出する。総合ランキング計算部8は、検索キーワードとの一致度と文書重要度テーブル6の文書重要度とを総合して検索結果の出力順を決定する。
【選択図】図1

Description

本発明は、インターネット上のWebサーチエンジン(いわゆる検索エンジン)などの情報検索の技術に関する。
近年、インターネットの普及によって、インターネット上の膨大なWeb文書群(電子文書群)からユーザが必要とする情報を的確に検索するシステムおよびサービスの重要性が高まっている。
一般的な検索サービスによれば、ユーザ入力の検索キーワードが検索対象の文書や該文書に対する別の文書からのリンクアンカーテキストに含まれる数に基づいた検索キーワードと文書の一致度と、該文書が別の文書からどれだけ参照されているかといった文書の重要度とから情報検索の出力順が決定されている。
概略を説明すれば、文書の一致度には非特許文献1の「BM25」や「tf・idf」といった単語の統計量を用いた手法が利用されている。ここでは特定の文書群全体の平均と比較して文書に高い頻度で現れる単語が、該文書を特徴付けるものであるという推定に基づいて、ユーザが入力した検索キーワードが文書の特徴と一致する度合いが高い文書を高い出力順位としている。
この手法によれば、検索キーワードが比較的珍しい単語であれば良好な検索結果が得られるが、検索キーワードが極ありふれた単語であれば同程度の一致度となる文書が多くなりすぎてしまう。そこで、一般的な情報検索サービスでは、検索キーワードとの一致度が同程度となった文書の順位付けのために文書の重要度を算出し、検索キーワードと文書との一致度と文書の重要度とを合わせて検索結果の出力順を決定している。
文書の重要度としては、PageRank(非特許文献2参照)やHITS(非特許文献3参照)といった手法が一般的に利用されている。これら手法は、Webページのリンク情報を用いて、特定の文書が他の多くの文書からリンクされている場合にはその文書が重要であろうという推定に基づいている。このように文書の静的重要度と検索キーワードとの一致度を併せて用いることで、情報検索ユーザの要求を概ね満たしていた。
Stephen Robertson,Hugo Zaragoza,Michael Taylor "Simple BM25 Extension to Multiple Weighted Fields" Proceedings of the thirteenth ACM international conference on Information and knowledge management, 2004 Lawrence Page, Sergey Brin, Rajeev Motwai, Terry Winograd, "The PageRank Citation Ranking: Bringing Order to the Web", 7th International World Wide Web conference (WWW98) Junuary 29,1998 Jon M. Kleinberg,"Authoritative Sources in a Hyperlinked Environment", Journal of the ACM(JACM), vol.46,No.5,September 1999,pp.604−632
しかしながら、検索キーワードと同程度に一致するWeb文書を静的重要度で順序づけると、文書内の単語やフレーズの重要性が検索結果に的確に反映されないおそれがある。
例えば「犬の飼い方」について優良な情報を記述したWeb文書があったとして、そこには「犬には玉葱は毒なので、エサに入れないように注意してください。」という重要な情報が記述されていたとする。また、人間の健康について記述された他のWeb文書中には「ファーストフードなんて犬のエサと同じです、健康のため食べ過ぎに注意!」と記述されていたとする。ここでは他のWeb文書は、前記Web文書よりも多く外部からリンクされ、「pagerank」等の静的重要度が高くなっているものとする。
この状況下でユーザが犬の餌に関する注意事項を調べようと「犬 エサ 注意」という検索キーワードを用いて検索を行った場合には、前記両Web文書間で上記以外の部分の文書長や検索キーワードの頻度が同じであれば、静的重要度が高い後者のページが検索上位に出力されてしまう。
本発明は、上述のような問題点を解決するためになされたものであり、文書内の単語やフレーズの重要性を検索結果に的確に反映させる情報検索技術の提供を解決課題としている。
そこで、本発明は、引用情報に基づき電子文書の単語やフレーズの部分ごとに重み付けし、該重みを検索キーワードの一致度に反映させる。このとき被引用数や引用文書/被引用文書の関係、引用先文書の重要度などが利用されている。
すなわち、本発明は、ユーザ端末から指示された検索キーワードを用いて電子文書群を検索する際に、各電子文書を任意の単位に分割した文書インデックスを参照して前記検索キーワードとの一致度を算出する装置であって、あらかじめ検索対象の電子文書間における引用情報を抽出しておく引用情報抽出手段と、該引用情報抽出手段の抽出した引用情報に基づき各電子文書の前記文書インデックスの分割単位ごとに重みを付与するインデックス手段と、を備え、前記検索キーワードとの一致度を、前記インデックス手段の付与した前記分割単位ごとの重みを加味して算出することを特徴とする。
前記インデックス手段の一態様は、前記引用情報に示された被引用部分中の前記各分割単位に対する引用回数を、引用元の電子文書の前記重みに反映させる。また、前記インデックス手段の他の態様は、電子文書毎に重要度を記録した文書重要度テーブルを参照して、前記引用情報に示された引用先の電子文書に対する重要度を取得し、該重要度を引用元の電子文書の前記重みに反映させる。
さらに、前記引用情報抽出手段の抽出した引用情報に基づき電子文書間の関係の深度を判定する文書間関係判定手段を備え、前記インデックス手段は、前記文書間関係判定手段の判定した深度を引用元の電子文書の前記重みに反映させる態様としてもよい。
なお、本発明は、前記装置を構成する各手段としてコンピュータを機能させるプログラムや、該プログラムを記録した記録媒体の態様とすることもできる。
本発明によれば、電子文書中において他の電子文書に引用されている部分を重要とみなし、その文書内の単語やフレーズの重要度などが的確に反映される。
本発明の第1実施形態に係る情報検索装置の構成図。 同 第2実施形態に係る情報検索装置の構成図。
以下、本発明の実施形態に係る情報検索装置を説明する。この情報検索装置は、電子文書間にリンク情報を備えた文書情報を検索対象とし、各文書へのリンク元の文書に含まれる該リンク先文書の被引用部分の情報と該リンク先文書自体の情報とを併せて該リンク先文書を検索する際の参照情報とする。ここではリンク先文書の情報検索キーワードへの一致度の算出に、該被引用部分の情報検索キーワードへの一致度と該リンク先文書の被引用部分以外の情報検索キーワードへの一致度との加重比を変化させる。
このとき前記リンク先文書が1つ以上の他の文書から1つ以上の引用を行われている場合に、該リンク先文書を構成する各部分の重みを該部分の被引用数に応じて変化させてもよく、被引用部分の重みを該リンク元ページの重要度に応じて変化させてもよい。あるいは該被引用部分の重みを、該引用関係を構成する文書間の関係性に応じて変化させてもよい。
≪第1実施形態≫
図1に基づき前記情報検索装置の詳細を説明する。ここでは前記情報検索装置1は、ユーザ所有の情報検索端末2とインターネットを通じてデータの送受信が可能に接続されている。
この情報検索端末2は、パーソナルコンピュータ(PC)からなり、ユーザ入力の検索要求(検索キーワードを含む。)を前記情報検索装置1に送信し、該検索要求に対する検索結果を前記情報検索装置1から受信する。なお、前記情報検索端末2は、パーソナルコンピュータには限定されず、例えば携帯電話やPDAなどのモバイル端末であってもよい。
前記情報検索装置1は、あらかじめ全文検索用の文書インデックスを作成・保存しておく事前処理と、前記情報検索端末2からの検索要求に応じて文書インデックスを検索して検索結果を作成する検索処理とを実施する。すなわち、前記情報検索装置1は、Webページに代表される電子文書(以下、Web文書という。)群を検索するWebサーチエンジン(いわゆる検索エンジン)のシステムを構成し、通常のコンピュータのハードウェアリソース、例えばCPU,メモリ(RAM),ハードディスクドライブ装置,通信インタフェースなどを備える。
このハードウェアリソースとソフトウェアリソース(例えばOS,アプリケーションなど)との協動の結果、前記情報検索装置1は、検索対象のWeb文書群から引用情報を抽出する引用情報抽出機能部3と、検索対象のWeb文書と前記引用情報抽出機能部3の抽出した引用情報とから前記文書インデックスを作成するインデックス機能部4と、該インデックス機能部4によって作成された文書インデックスを保存する文書インデックスDB5と、検索対象のWeb文書の重要度を記録した文書重要度テーブル6と、前記情報検索端末2から送信された検索要求に基づき前記文書インデックスDB5を参照して検索キーワードと検索対象のWeb文書との一致度を計算するキーワード一致度計算部7と、該計算部7の算出した一致度と前記文書重要度テーブル6の記録情報とを総合して前記情報検索端末2に返信する検索結果の出力順を決定する総合ランキング計算部8とを実装する。
ここでは前記機能部3.4を通じて前記事前処理が実施され、前記計算部7.8を通じて前記検索処理が実施される。また、前記情報検索端末2とのデータ送受信は、前記通信インタフェースを通じて実施され、前記文書インデックスDB5および前記文書重要度テーブル6は、前記ハードディスクドライブ装置上に構築されている。
なお、前記文書重要度テーブル6に記録される各Web文書の重要度は、非特許文献2.3などの手法により算出することができる。以下、前記各部3.4.7.8の処理内容を、Web文書11.12を検索対象とする事例に基づき説明する。
(1)引用情報抽出機能部3
前記引用情報抽出機能3は、検索対象のWeb文書11.12から引用情報を抽出する。ここでは一例としてWeb文書11は、Web文書12中のフレーズ「犬には玉葱は毒なので、エサに入れないように注意してください。」を引用しているものとする。
引用情報の抽出方法を例示すれば、Web文書11中に「html」の記法よりWeb文書12へのリンクが記述されているとして、そのリンクの近傍をWeb文書12と比較して一致している部分を引用と判断する方法を用いることができる。引用時の省略や誤字脱字を考慮して一定割合以上一致している部分を引用と判断してもよい。「html」の記法構造に基づき<blockquote>などのマークアップされた部分や、『』,「」,“”等の一般的に引用を示すことに用いられる記号で囲まれた部分を引用と判断してもよい。また、上記のマークアップや記号による判断を、二つの文書が相互にリンクを行っている場合に、どちらがどちらから引用しているかの判断に用いてもよい。
ここでは抽出される引用情報は、引用している文書URL,引用されている文書URL,引用開始位置,引用終了位置という形式とする。この事例では、引用情報として「Web文書11のURL,Web文書12のURL,1文字目,30文字目」が抽出される。なお、抽出される引用情報は、他の形式であってもよく、抽出後に前記インデックス機能部4に転送される。
(2)インデックス機能部4
前記インデックス機能部4は、Web文書を単語、n−gram、サフィックスアレイといった全文検索用の単位に分割して文書インデックスを作成し、これを前記文書インデックスDB5に保存する。なお、作成する文書インデックスの形式は上記の他いかなる形式であってもよいものとする。
ここでは単語による文書インデックスの一例として、Web文書11.12を含む文書群に単語「犬」が出現する文書インデックスが作成されている。この文書インデックスには、通常の全文検索インデックスに含まれる「tf」や「idf」、「html」による単語のマークアップ情報や単語の位置情報等が含まれてもよい。
また、前記インデックス機能部4は、文書インデックスを作成する際に引用情報抽出機能部3から転送された引用情報を反映させる。例えば図1中の前記文書インデックスDB5に基づき説明すれば、文書インデックスの単語「犬」には(11:1)(12:9)という情報が格納されている。
すなわち、引用情報は、単語の重みに足し込んで文書インデックスに格納され、括弧内の数値は(単語出現Web文書番号:該単語の重み)をそれぞれ示している。この格納例は、Web文書11およびWeb文書12の双方に単語「犬」が1回現れているものの、Web文書12に現れる単語「犬」は別のWeb文書(ここではWeb文書11)から引用されている部分にも含まれるため、Web文書11と比較して大きな重みが与えられている。ここでは文書インデックスに格納される単語の重みは、単純に被引用部分に含まれているか否かによる2種類の重みづけではなく、該単語を含む部分を引用している他のWeb文書数が線形または非線形に反映されているものとする。
このとき前記インデックス機能部4は、Web文書間での引用情報を文書インデックスに反映させる際に、引用しているWeb文書の重要度を文書重要度テーブル6から読み出し、該重要度の値も用いて文書インデックスを構成する。ここでは「単語の重み=Web文書内における単語の出現回数「n」+(引用する他のWeb文書の文書重要度「g」×引用部分における単語の出現回数「k」)」として算出される。なお、文書重要度「g」と出現回数「k」の乗算は、単語を含む部分を引用するWeb文書毎に算出され、それぞれの算出値が出現回数「n」に加算される。
そして、これを前述の文書インデックスの格納例、即ち単語「犬」には(11:1)(12:9)という情報が格納されている状況についてみれば、Web文書11には単語「犬」が1回現れ、他のWeb文書から引用されていないため、単語重みは「1」と算出され、文書インデックスには(WEB文書:重み)の値の組として(11:1)の情報が格納されている。一方、Web文書12には単語「犬」が1回現れ、文書重要度「8」のWeb文書11に引用された部分に単語「犬」が1回出現しているため、単語「犬」の重みは「1+(8.0×1)=9」と算出され、文書インデックスには(12:9)の情報が格納されている。
ただし、前記文書インデックスDB5に保存される文書インデックスは、図1のデータ形式に限定されるものではなく、例えば引用情報の格納を(単語出現Web文書番号:該単語重み:該単語被引用重み)といった形式としてもよい。また、全文検索用の分割単位、即ち文書インデックス毎に重みが格納されるので、n−gramやサフィックスアレイの文字列(フレーズ)としてもよい。
(3)計算部7.8
前記キーワード一致度計算部7は、前記情報検索端末2から検索キーワードを指定した検索要求を受信後に、検索キーワードを用いて前記文書インデックスDB5を参照し、検索キーワードを含むWeb文書をリストアップする。ここでリストアップされた各Web文書の検索キーワードとの一致度を非特許文献1のBM25、BM25F、tf・idfなどの方法で算出する。このとき文書インデックスに格納された重みを変数として加えて、前記キーワード一致度を算出する。
算出方法としては、単語毎に付与された重みをtf・idfなどの計算式に掛け合わせてもよく、BM25Fであれば図1に示すように、前記文書インデックスDB5中の文書インデックスを作成する時点で被引用部分に含まれる単語のtf値の倍率を重みによって変化させてもよい。ここで算出された検索キーワードとの一致度は、前記総合ランキング計算部10に転送される。
前記総合ランキング計算部8は、前記重要度テーブル6を参照してリスト化された各Web文書の重要度のリストを取得する。取得したリストに掲載された各Web文書の重要度と前記キーワード一致度計算部7から転送された前記キーワード一致度とを総合して検索結果の出力順を決定する。ここで決定された出力順に従って前記情報検索端末2に検索結果が送信される。
このとき前記キーワード一致度は、Web文書中で他のWeb文書から引用される単語やフレーズの重みを考慮した文書インデックスをベースに算出されるため、引用されている単語などがWeb文書中の重要部分として定義され、これによりWeb文書内の単語などの重要性が検索結果に的確に反映される。
とりわけ文書インデックスの作成に際して、引用しているWeb文書の重要度の値を前記重みの算出に利用するため、PageRankやHITSに代表される重要度の高いWeb文書に引用された被引用部分を、特に重要でないWeb文書に引用された部分よりも重視して、WEB文書の検索キーワードとの一致度が算出される。また、他のWeb文書から引用されている頻度が前記重みの算出に利用されるため、多数の文書から引用されている単語やフレーズをより重要な部分として検索結果に的確に反映させることもできる。
≪第2実施形態≫
前記情報検索装置1は、図2に示すように、前記抽出機能部3の抽出した引用情報に基づき検索対象Web文書間の関係(リンク)を判定する文書間関係判定機能部9を追加してもよい。
ここでは文書間の関係(リンク)の判定方法として、Web文書のURLを比較して同一ドメインに属する、同一ホストに属する、あるいは同一ディレクトリに属するといった順に関係が深くなるという「WWW」(World Wide Web)の仕組みを利用する方法を用いることができる。具体例を挙げて説明すれば、以下の4つの引用情報が前記引用情報抽出機能部3から転送されたとする。
・1番目の引用情報
(http://hoge.hoge.com/hoge/hoge.html,http://fuga.fuga.com/fuga/fuga.html,引用開始位置, 引用終了位置)
・2番目の引用情報
(http://hoge.hoge.com/hoge/hoge.html,http://fuga.hoge.com/fuga/fuga.html,引用開始位置, 引用終了位置)
・3番目の引用情報
(http://hoge.hoge.com/hoge/hoge.html,http://hoge.hoge.com/fuga/fuga.html,引用開始位置, 引用終了位置)
・4番目の引用情報
(http://hoge.hoge.com/hoge/hoge.html,http://hoge.hoge.com/hoge/fuga.html,引用開始位置, 引用終了位置)
ここでは引用しているWeb文書と引用されているWeb文書の関係(深度)を重みとして反映させることができる。例えば1番目の引用情報は全く異なるドメインによる引用であるので重みを「1」に設定し、2番目の引用情報は同一ドメインの別ホストによる引用であるので重みを「0.5」に設定し、3番目の引用情報は同一ホスト内の異なるディレクトリ間での引用であるので重みを「0.1」に設定し、4番目の引用情報は同一ホストの同一ディレクトリ内の引用であるので重みを「0.05」に設定可能である。
また、一律に別ドメイン間の引用の重みを「1」、同一ドメイン内の引用の重みを「0.5」などと決めずに、特定のドメイン間やホスト間でのリンクや引用の量や割合に応じて引用の重みを算出するなどの方法を用いてもよい。ここで判定されたWeb文書間の関係(リンク)の重み値は、前記インデックス機能部4に転送される。
そして、前記インデックス機能部4は、Web文書間の引用情報を文書インデックスに反映する際に、前記文書間関係判定機能部9から転送された重み値も利用して、文書インデックスを構成する。重み値の利用方法の一例を説明すれば、第1実施形態ではWeb文書12には単語「犬」が1回現れ、文書重要度「8」のWeb文書11に引用された部分に単語「犬」が1回出現しているため、単語「犬」の重みは「1+(8.0×1)=9」と算出され、文書インデックスには(12:9)の情報が格納されている。ここでは更にWeb文書11.12間の関係(リンク)の重み値wを用いて、「1+(w×8.0×1)=9」を単語「犬」の重みとして文書インデックスの情報に格納する。ただし、重み値wの利用方法は、これに限定されず、他の方法を用いてもよいものとする。
このようにWeb文書間の関係(リンク)の重み値wが文書インデックスに反映されることから、引用元のWeb文書と引用先のWeb文書とが同じWebサーバ上に存在する場合や、同じドメインに含まれる場合には被引用部分を重視することなく、別のドメインから引用されている被引用部分を重視して、Web文書の検索キーワードとの一致度が算出される。この意味でWeb文書内の単語やフレーズの真の重要度が検索結果に反映される。
≪その他・プログラムなど≫
本発明は、前記各実施形態に限定されるものではなく、例えばWeb文書の重要度やWeb文書間の関係(リンク)を反映させることなく、単語を含む部分を引用している他のWeb文書数のみを単語の重みとすることもできる。この場合には単語の重みは、「Web文書内における単語の出現回数×単語を含む部分を引用している他のWeb文書数」として算出される。同様に単語を含む部分を引用している他のWeb文書数とWeb文書間の関係(リンク)とを単語の重みとすることも可能である。
なお、本発明は、前記情報検索装置構成する各部3〜9の一部もしくは全部として、コンピュータを機能させるプログラムとして構成することもできる。このプログラムによれば、各部3〜9の全処理あるいは一部の処理をコンピュータに実行させることができる。
このプログラムは、Webサイトや電子メールなどネットワークを通じて提供することができる。また、前記プログラムは、CD−ROM,DVD−ROM,CD−R,CD−RW,DVD−R,DVD−RW,MO,HDD,Blu−ray Disk(登録商標)などの記録媒体に記録して、保存・配布することも可能である。この記録媒体は、記録媒体駆動装置を利用して読み出され、そのプログラムコード自体が前記実施形態の処理を実現するので、該記録媒体も本発明を構成する。
1…情報検索装置
2…情報検索端末(ユーザ端末)
3…引用情報抽出機能部(引用情報抽出手段)
4…インデックス機能部(インデックス手段)
5…文書インデックスDB
6…文書重要度テーブル
7…キーワード一致度計算部
8…総合ランキング計算部
9…文書間関係判定機能部(文書間関係判定手段)
11.12…Web文書

Claims (5)

  1. ユーザ端末から指示された検索キーワードを用いて電子文書群を検索する際に、各電子文書を任意の単位に分割した文書インデックスを参照して前記検索キーワードとの一致度を算出する装置であって、
    あらかじめ検索対象の電子文書間における引用情報を抽出しておく引用情報抽出手段と、該引用情報抽出手段の抽出した引用情報に基づき各電子文書の前記文書インデックスの分割単位ごとに重みを付与するインデックス手段と、を備え、
    前記検索キーワードとの一致度を、前記インデックス手段の付与した前記分割単位ごとの重みを加味して算出することを特徴とする情報検索装置。
  2. 前記インデックス手段は、前記引用情報に示された被引用部分中の前記各分割単位に対する引用回数を、
    引用元の電子文書の前記重みに反映させることを特徴とする請求項1記載の情報検索装置。
  3. 前記インデックス手段は、電子文書毎に重要度を記録した文書重要度テーブルを参照して、
    前記引用情報に示された引用先の電子文書に対する重要度を取得し、該重要度を引用元の電子文書の前記重みに反映させる
    ことを特徴とする請求項1または2のいずれか1項に記載の情報検索装置。
  4. 前記引用情報抽出手段の抽出した引用情報に基づき電子文書間の関係の深度を判定する文書間関係判定手段をさらに備え、
    前記インデックス手段は、前記文書間関係判定手段の判定した深度を引用元の電子文書の前記重みに反映させる
    ことを特徴とする請求項1〜3のいずれか1項に記載の情報検索装置。
  5. 請求項1〜4のいずれか1項に記載の情報検索装置を構成する各手段として、コンピュータを機能させる情報検索プログラム。
JP2009197659A 2009-08-28 2009-08-28 情報検索装置、情報検索プログラム Expired - Fee Related JP5261326B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009197659A JP5261326B2 (ja) 2009-08-28 2009-08-28 情報検索装置、情報検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009197659A JP5261326B2 (ja) 2009-08-28 2009-08-28 情報検索装置、情報検索プログラム

Publications (2)

Publication Number Publication Date
JP2011048718A true JP2011048718A (ja) 2011-03-10
JP5261326B2 JP5261326B2 (ja) 2013-08-14

Family

ID=43834945

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009197659A Expired - Fee Related JP5261326B2 (ja) 2009-08-28 2009-08-28 情報検索装置、情報検索プログラム

Country Status (1)

Country Link
JP (1) JP5261326B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5522598B1 (ja) * 2013-08-05 2014-06-18 求 藤川 情報管理システム、情報管理プログラム、情報管理方法、情報管理装置、記録媒体

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09293077A (ja) * 1996-04-17 1997-11-11 Internatl Business Mach Corp <Ibm> 情報検索方法、情報検索装置及び情報検索プログラムを格納する記憶媒体
JPH1125108A (ja) * 1997-07-02 1999-01-29 Matsushita Electric Ind Co Ltd 関連キーワード自動抽出装置、文書検索装置及びこれらを用いた文書検索システム
JP2001290843A (ja) * 2000-02-04 2001-10-19 Fujitsu Ltd 文書検索装置及びその方法並びに文書検索プログラム及びそのプログラムを記録した記録媒体
JP2006155556A (ja) * 2004-10-27 2006-06-15 Hitachi Software Eng Co Ltd テキストマイニング方法及びテキストマイニングサーバ
JP2007188134A (ja) * 2006-01-11 2007-07-26 Yafoo Japan Corp 索引ファイルを用いた文書検索の方法
JP2008176721A (ja) * 2007-01-22 2008-07-31 Internatl Business Mach Corp <Ibm> コンピュータネットワーク上の電子文書の重要度を、当該電子文書に関係付けられた他の電子文書の当該電子文書に対する批評に基づいて、計算するためのコンピュータ装置、コンピュータプログラム及び方法
JP2009505292A (ja) * 2005-08-15 2009-02-05 マイクロソフト コーポレーション ネットワーク上の文書のバイアスクリック距離を使用するランキング関数
JP2009086944A (ja) * 2007-09-28 2009-04-23 Fuji Xerox Co Ltd 情報処理装置および情報処理プログラム

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09293077A (ja) * 1996-04-17 1997-11-11 Internatl Business Mach Corp <Ibm> 情報検索方法、情報検索装置及び情報検索プログラムを格納する記憶媒体
JPH1125108A (ja) * 1997-07-02 1999-01-29 Matsushita Electric Ind Co Ltd 関連キーワード自動抽出装置、文書検索装置及びこれらを用いた文書検索システム
JP2001290843A (ja) * 2000-02-04 2001-10-19 Fujitsu Ltd 文書検索装置及びその方法並びに文書検索プログラム及びそのプログラムを記録した記録媒体
JP2006155556A (ja) * 2004-10-27 2006-06-15 Hitachi Software Eng Co Ltd テキストマイニング方法及びテキストマイニングサーバ
JP2009505292A (ja) * 2005-08-15 2009-02-05 マイクロソフト コーポレーション ネットワーク上の文書のバイアスクリック距離を使用するランキング関数
JP2007188134A (ja) * 2006-01-11 2007-07-26 Yafoo Japan Corp 索引ファイルを用いた文書検索の方法
JP2008176721A (ja) * 2007-01-22 2008-07-31 Internatl Business Mach Corp <Ibm> コンピュータネットワーク上の電子文書の重要度を、当該電子文書に関係付けられた他の電子文書の当該電子文書に対する批評に基づいて、計算するためのコンピュータ装置、コンピュータプログラム及び方法
JP2009086944A (ja) * 2007-09-28 2009-04-23 Fuji Xerox Co Ltd 情報処理装置および情報処理プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5522598B1 (ja) * 2013-08-05 2014-06-18 求 藤川 情報管理システム、情報管理プログラム、情報管理方法、情報管理装置、記録媒体
JP2015052811A (ja) * 2013-08-05 2015-03-19 求 藤川 情報管理システム、情報管理プログラム、情報管理方法、情報管理装置、記録媒体

Also Published As

Publication number Publication date
JP5261326B2 (ja) 2013-08-14

Similar Documents

Publication Publication Date Title
US8745039B2 (en) Method and system for user guided search navigation
CN102542052B (zh) 优先散列索引
KR101311050B1 (ko) 문서 사용 통계치를 사용한 랭킹 함수
JP5494454B2 (ja) 検索結果生成方法、検索結果生成プログラムおよび検索システム
AU2007324329B2 (en) Annotation index system and method
US20110196861A1 (en) Propagating Information Among Web Pages
US7809736B2 (en) Importance ranking for a hierarchical collection of objects
JP2009525520A (ja) 検索結果リストにおける電子文書を関連性に基づきランク付けおよびソートする評価方法、およびデータベース検索エンジン
JP2008071259A (ja) ブックマーク・タグ設定装置
KR20080073289A (ko) 계층 구조 기반의 문서의 기여도의 전달
Chowdhary et al. Study of web page ranking algorithms: a review
Gurrin et al. Replicating web structure in small-scale test collections
JP4824070B2 (ja) クリックログを利用して専門検索用クローラのシード選択を行う検索処理装置、検索処理方法及びプログラム
JP2010123036A (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP5261326B2 (ja) 情報検索装置、情報検索プログラム
JP5286007B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
KR101180371B1 (ko) 폭소노미 기반 개인화 웹 검색 방법 및 이를 수행하는 시스템
JP2011170583A (ja) 情報検索装置、情報検索方法、情報検索プログラム
JP5384884B2 (ja) 情報検索装置および情報検索プログラム
JP2011128669A (ja) 情報検索装置および情報検索プログラム
JP2011192029A (ja) 情報検索装置及び方法及びプログラム
Inkpen Information retrieval on the internet
Gurrin et al. Dublin City University experiments in connectivity analysis for TREC-9.
US20110022591A1 (en) Pre-computed ranking using proximity terms
Praba et al. Evaluation of Web Searching Method Using a Novel WPRR Algorithm for Two Different Case Studies

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110830

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130205

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130423

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130426

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160502

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5261326

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees