JP2009157865A - 情報検索装置,情報検索プログラム及び情報検索方法 - Google Patents

情報検索装置,情報検索プログラム及び情報検索方法 Download PDF

Info

Publication number
JP2009157865A
JP2009157865A JP2007338612A JP2007338612A JP2009157865A JP 2009157865 A JP2009157865 A JP 2009157865A JP 2007338612 A JP2007338612 A JP 2007338612A JP 2007338612 A JP2007338612 A JP 2007338612A JP 2009157865 A JP2009157865 A JP 2009157865A
Authority
JP
Japan
Prior art keywords
search
information
word
target information
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007338612A
Other languages
English (en)
Inventor
Daichi Morifuji
大地 森藤
Takeshi Tobinaga
豪 飛永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nifty Corp
Original Assignee
Nifty Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nifty Corp filed Critical Nifty Corp
Priority to JP2007338612A priority Critical patent/JP2009157865A/ja
Publication of JP2009157865A publication Critical patent/JP2009157865A/ja
Pending legal-status Critical Current

Links

Abstract

【課題】Webページ等の検索がより容易に行える環境を実現できる情報検索装置を提供する。
【解決手段】Webページ等の検索を行うための情報検索装置を、検索した各検索対象(Webページ等)の識別情報(“AAA”,“www.aaa.com/…”等)を、各検索対象に関する幾つかの特徴語(“ああ”,“いい”,“うう”等)と共に、検索結果として出力する装置として構成しておく。
【選択図】図6

Description

本発明は、複数の検索対象情報(Webページ等)の中から、検索対象情報を検索するための情報検索装置,情報検索プログラム及び情報検索方法に関する。
周知のように、インターネット上には、Webページを検索できるさまざまな検索サイトが存在しているが、いずれの検索サイトも、Webページのタイトル,URL及びスニペット(Webページから抽出したテキスト)が,検索されたWebページ毎に示されるWebページを検索結果として出力するもの(例えば特許文献1参照)となっている。
このため、検索サイトを利用したユーザは、各Webページに関するスニペットを読んで,実際に見てみるWebページを決定しているのであるが、スニペットは、比較的に単純なアルゴリズムで抽出した情報であるため、スニペットという比較的に長い文を読んで選んだWebページに自分が希望する情報が載っていないといったことがしばしば生じているのが現状である。
特開2004−234290号公報
そこで、本発明の課題は、Webページ等の検索がより容易に行える環境を実現できる情報検索装置,情報検索プログラム及び情報検索方法を提供することにある。
上記課題を解決するために、本発明の情報検索装置は、複数の検索対象情報の中から、指定された検索語を含む検索対象情報を検索する検索手段と、検索手段により検索された各検索対象情報の識別情報を、各検索対象情報の,所定アルゴリズムにより決定された1つ以上の特徴語と共に出力する検索結果出力手段とを備える。
すなわち、本発明の情報検索装置は、検索した各検索対象情報(Webページ等)の識別情報(タイトル等)を,複数の特徴語と共に、検索結果として出力する構成を有している。そして、複数の特徴語(1つ以上の特徴語と検索語)が分かれば、各検索対象情報の内容を推定できるため、この情報検索装置を用いておけば、より簡単に(スニペットを読む必要がない形で),検索対象情報の検索を行える環境を実現できることになる。
本発明の情報検索装置を実現する際には、検索を短時間で行えるようにするために、複数の検索対象情報のそれぞれについて、その検索対象情報の識別情報と,その検索対象情報についての,所定アルゴリズムにより決定された複数の特徴語とを記憶した検索用データベースを付加しておくと共に、検索特定手段として、検索語が特徴語として記憶されている検索対象情報の識別情報を検索用データベースの中から検索する手段を採用し、検索結果出力手段として、検索手段により検索された識別情報毎に、その識別情報と,検索用データベース内の,その識別情報と同じ検索対象情報についての,検索語とは異なる1つ以上の特徴語とを含む単位検索結果情報を出力する手段を採用しておくことが出来る。
また、上記構成を採用する場合には、いわゆる絞り込み検索が容易に行えるようにするために、検索用データベースを、各特徴語の各検索対象情報中での相対的な出現頻度を示す数値情報であるスコアも、記憶したデータベースとしておくと共に、検索結果出力手段として、『各単位検索結果情報が、検索用データベース内の,対応する検索対象情報に関する,検索語と一致している特徴語についてのスコアの降順で示される検索結果リストを出力した後、特徴語の組み合わせが指定された場合には、特徴語の組み合わせが指定されたものと一致している各単位検索結果情報がその先頭部分に示される検索結果リストを出力する手段』や、『各単位検索結果情報が、検索用データベース内の,対応する検索対象情報に関する,検索語と一致している特徴語についてのスコアの降順で示される検索結果リストを出力した後、特徴語の組み合わせ及び各特徴語のスコアが指定された場合には、特徴語の組み合わせが指定されたものと一致している各単位検索結果情報が,各特徴語のスコアが指定されている各特徴語のスコアと類似しているものから,順々に,その先頭部分に示される検索結果リストを出力する手段』を採用しておくことが出来る。
また、検索結果出力手段として、『各単位検索結果情報が、検索用データベース内の,対応する検索対象情報に関する,検索語と一致している特徴語についてのスコアの降順で示されるWebページであって、特徴語の組み合わせを指定する操作がなされた場合には、特徴語の組み合わせが指定されたものと一致している各単位検索結果情報がその先頭部分に示されることになるWebページを,Webブラウザに表示させるためのデータを出力する手段』や、『各単位検索結果情報が、検索用データベース内の,対応する検索対象情報に関する,検索語と一致している特徴語についてのスコアの降順で示されるWebページであって、特徴語の組み合わせ及び各特徴語のスコアを指定する操作がなされた場合には、特徴語の組み合わせが指定されたものと一致している各単位検索結果情報が,各特徴語のスコアが指定されている各特徴語のスコアと類似しているものから,順々に,その先頭部分に示されることになるWebページを,Webブラウザに表示させるためのデータを出力する手段』を採用しておくことも出来る。
そして、本発明の情報検索プログラムは、『コンピュータを、複数の検索対象情報の中から、指定された検索語を含む検索対象情報を検索する検索手段と、検索手段により検索された各検索対象情報の識別情報を、各検索対象情報の,所定アルゴリズムにより決定された1つ以上の特徴語と共に出力する検索結果出力手段とを備える装置として動作させる』ものとなっており、本発明の情報検索方法は、『コンピュータに、複数の検索対象情報の中から、指定された検索語を含む検索対象情報を検索する検索ステップと、検索手段により検索された各検索対象情報の識別情報を、各検索対象情報の,所定アルゴリズムにより決定された1つ以上の特徴語と共に出力する検索結果出力ステップとを実行させる』ものとなっている。従って、本発明の情報検索プログラム,情報検索方法を用いても、より簡単に(スニペットを読む必要がない形で),検索対象情報の検索を行える環境を実現できることになる。
本発明を用いれば、より簡単に(スニペットを読む必要がない形で),検索対象情報の検索を行える環境を実現できることになる。
以下、本発明を実施するための最良の形態を、図面を参照して詳細に説明する。
まず、図1を用いて、本発明の一実施形態に係る情報検索装置10の概要を説明する。
図1に模式的に示してあるように、本実施形態に係る情報検索装置10は、検索語を含む検索要求をインターネットを介して送信してきたユーザPC(Webブラウザ)に,その検索要求中の検索語が使用されている各Webページのタイトル等が示される検索結果ページを提供する(Webページである検索結果ページのソースデータを送信する)装置である。
すなわち、情報検索装置10は、既存の検索サーバ(検索サイト)と同様に、各ユーザPCのユーザが,必要とする情報が記載されているWebページを検索するためにアクセスする装置となっている。ただし、情報検索装置10は、各種Webページの検索をより容易に行えるようにするために、検索結果ページとして、従来の検索サーバとは異なる構成のものを提供するように構成した装置となっている。
以上のことを前提に、以下、本実施形態に係る情報検索装置10の構成及び動作をさらに具体的に説明する。なお、本情報検索装置10は、コンピュータ(より具体的には、1台のコンピュータとして機能する複数台のコンピュータ)に、各種のプログラムやデータをインストールすることによって構成した装置となっている。このため、以下では、情報検索装置10のソフトウェア的な構成及び動作のみを説明することにする。
図2に、本実施形態に係る情報検索装置10の機能ブロック図を示す。
図示してあるように、情報検索装置10は、Webページプロフィールデータベース(図では、WebページプロフィールDB)11,検索要求応答部12及び情報収集部13を、備えている。
Webページプロフィールデータベース11(以下、DB11とも表記する)は、図3に模式的に示したように、各種WebページのURL及びタイトルを,単語1〜単語m,スコア1〜スコアm,チェック日時等(各情報の意味,用途については後述)と共に記憶可能なデータベースである。以下、このDB11に記憶される,1つのWebページに関する情報群(URL,タイトル,単語1〜単語m等からなる情報)のことを、プロフィール情報と表記する。
情報収集部13は、DB11へのプロフィール情報の追加や、DB11内のプロフィール情報の更新/削除を行うユニット(機能ブロック)である。この情報収集部13は、情報検索装置10が起動されると,以下のような動作を開始するユニットとなっている。
情報検索装置10が起動されたため動作を開始した情報収集部13は、まず、内容が変更されているWebページ,内容が変更されていないWebページ,公開が開始されたWebページ,或いは,公開が停止されたWebページを、一般的なクローラー(検索ロボット)と同様の手順で探索する探索処理を開始する。なお、内容が変更されているWebページとは、その更新日時が、DB11内の,当該Webページに関するプロフィール情報中のチェック日時(詳細は後述)以降となっているWebページのことであり、内容が変更されていないWebページとは、その更新日時が、DB11内の,当該Webページに関するプロフィール情報中のチェック日時以前となっているWebページのことである。また、公開が開始されたWebページとは、それに関するプロフィール情報がDB11内に存在していないWebページ(プロフィール情報がDB11内に存在するWebページとリンクされているWebページ,起点として指定されているWebページ)のことであり、公開が停止されたWebページとは、いわゆる“リンク切れ”となっているWebページのことである。
そして、情報収集部13は、内容が変更されていないWebページを見出した場合には、そのWebページに関するDB11内のチェック日時を現在日時に変更してから、探索処理を続行する。また、情報収集部13は、公開が停止されたWebページを見出した場合には、そのWebページに関するプロフィール情報をDB11から消去した後に、探索処理を続行する。
さらに、情報収集部13は、内容が変更された/公開が開始されたWebページ(以下、処理対象Webページと表記する)を見出した場合には、図4に示した手順の情報更新処理を行ってから、探索処理を続行する。
すなわち、処理対象Webページ(内容が変更された/公開が開始されたWebページ)を見出した情報収集部13は、まず、その処理対象Webページのソースデータを取得する(ステップS101)。次いで、情報収集部13は、取得したソースデータに対して,形態素解析を行うことにより、処理対象Webページで使用されている単語(本実施形態では、名詞)と、各単語の出現数とを特定する(ステップS102)。
その後、情報収集部13は、特定した各単語に関するスコアを算出する処理(ステップS103)を行う。ここで、或る単語に関するスコアとは、当該単語の重要度を示す数値情報(当該単語が,重要なもの/特徴的なものであるほど大きな値をとる数値情報)のことである。なお、本実施形態に係る情報収集部13は、各単語に関するスコアとして、各単語のTF−IDF値(或る単語の出現数に、当該単語が使用されているWebページの割合の逆数の対数をかけた値)を算出するものとなっている。
ステップS103の処理を終えた情報収集部13は、WebページプロフィールDB更新処理(ステップS104)を開始する。そして、情報収集部13は、処理対象Webページが、内容が変更されたWebページ(プロフィール情報がDB11内に存在するWebページ)であった場合には、DB11内の,そのWebページに関するプロフィール情報中のスコアX,単語X,(X=1〜m)を,ステップS103の処理で算出されたX番目に大きなスコア,当該スコアが算出された単語に変更すると共に、当該プロフィール情報中のチェック日時を現在日時に変更する処理を行う。
また、情報収集部13は、処理対象Webページが、公開が開始されたWebページ(プロフィール情報がDB11内に存在しないWebページ)であった場合には、チェック日時,URL,タイトルとして、それぞれ,現在日時,そのWebページのURL,タイトルを設定し、スコアX,単語X,(X=1〜m)として,ステップS103の処理で算出したX番目に大きなスコア,当該スコアが算出された単語を設定したプロフィール情報をDB11に追加する処理を行う。
そして、情報収集部13は、この情報更新処理(図4の処理)を終了して、探索処理を続行する。
検索要求応答部12(図2参照)は、検索語を含む所定形式の検索要求を受信したときに、その検索要求中の検索語が使用されている各Webページのタイトル等が示される検索結果ページのソースデータを生成して,その検索要求送信元ユーザPCに返送するユニット(機能ブロック)である。
この検索要求応答部12が受信可能な検索要求としては、幾つかの検索語のみを含む第1種検索要求と,幾つかの検索語をスコア指定値(詳細は後述)と共に含む第2種検索要求とが存在している。
まず、図5を用いて、1つの検索語のみを含む第1種検索要求を受信した場合における検索要求応答部12の動作を、説明する。
この場合、検索要求応答部12は、受信した第1種検索要求に含まれている検索語が,単語1〜単語nのいずれか(図では、“単語”)として記憶されているプロフィール情報をDB11から読み出す処理(ステップS201)を最初に行う。次いで、検索要求応答部12は、読み出したプロフィール情報群から、それらを,検索語に関するスコアの降順でソートした情報であるスコア順リストを生成する(ステップS202)。
その後、検索要求応答部12は、生成したスコア順リスト内の各種情報に基づき、検索結果ページデータ(詳細は後述)を生成する処理(ステップS203)を行う。そして、検索要求応答部12は、生成した検索結果ページデータを,検索要求の送信元ユーザPCに送信(ステップS204)してから、第1種検索要求に対する応答処理(図5の処理)を終了する。
ステップS203の処理で生成される検索結果ページデータは、検索結果ページを検索要求の送信元ユーザPCに表示させるための,scriptを含むHTMLデータである。このため、検索結果ページデータの具体的な内容(ステップS203の具体的な処理手順)を説明する代わりに、検索結果ページデータを受信したユーザPC(Webブラウザ)が表示する検索結果ページの構成及び機能を説明することにする。
検索結果ページは、図6に示したような構成のWebページである。すなわち、検索結果ページは、検索語表示・入力欄21及び検索ボタン22と、複数の単位検索結果情報25とが示されるWebページとなっている。
この検索結果ページ上の検索語表示・入力欄21は、検索要求に含まれていた検索語(ユーザが、Webページ検索を行うために入力した検索語)が初期値として表示される,文字入力が可能なアイテムである。検索ボタン22は、それを押下(クリック)すると、検索結果ページを表示しているユーザPC(Webブラウザ)が,検索語表示・入力欄21に入力されている幾つかの検索語を含む第1種検索要求を送信することになるアイテムである。
各単位検索結果情報25は、上記したスコア順リストに含まれる各プロフィール情報中のタイトル(“AAA”等),URL(“www.aaa.com/…”等)及び単語1〜単語3(“ああ”,“いい”等)と、スコア1〜スコア3に対応する長さを有する3つのバー状図形とを、図示してあるような形で含む情報である。
そして、検索結果ページは、スコア順リスト内でプロフィール情報の順番通りに、各プロフィール情報に対応する内容の単位検索結果情報25が示されるWebページとなっている。なお、検索結果ページは、検索語と一致する単語に関するバー状図形が、他の単語に関するバー状図形とは異なる表示形態(本実施形態では、異なる色)で示されるWebページであると共に、各タイトルがいわゆるリンクアンカーとなっているWebページとなっている。
さらに、検索結果ページは、幾つかのバー状図形の長さをマウス操作により変更可能なWebページであると共に、バー状図形の長さを変更すると、図7,図8に示したような形で、再検索ボタン26が表示されるWebページとなっている。すなわち、検索結果ページは、最初の,バー状図形の長さ変更時には、長さを変更したバー状図形の右下部分に再検索ボタン26が表示され(図7)、二度目以降の,バー状図形の長さ変更時には、長さを変更したバー状図形の右下部分に,再検索ボタン26の表示位置が変更される(図8)Webページとなっている。
上記のような操作により検索結果ページ上に表示される再検索ボタン26は、それを押下(クリック)すると、検索結果ページを表示しているユーザPCが,バー状図形の長さが変更された単語毎に、その単語自体,変更後のバー状図形の長さを,それぞれ,検索語,スコア指定値として含む第2種検索要求を送信することになるアイテムである。なお、第2種検索要求は、バー状図形の長さが変更された各単語に関する情報(検索語及びスコア指定値)が,長さの変更順どおりに含まれる要求となっている。
説明の便宜上、複数の検索語を含む第1種検索要求を受信した場合における検索要求応答部12の動作の説明は後述することとし、ここで、第2種検索要求を受信した場合における検索要求応答部12の動作の説明しておくことにする。
検索要求応答部12は、第2種検索要求を受信した場合,図9に示した手順の処理を行うユニットとして構成(プログラミング)されている。
すなわち、第2種検索要求を受信した検索要求応答部12は、まず、受信した第2種検索要求に含まれている第1〜第n検索語が,単語1〜単語nのいずれか(図では、“単語”)として記憶されているプロフィール情報を、DB11から読み出す処理(ステップS301)を行う。なお、第x検索語(x=1〜n)とは、第2種検索要求に含まれるx番目の検索語(x番目に、バー状図形の長さが変更された単語)のことである。
次いで、検索要求応答部12は、読み出したプロフィール情報群に対して、第1〜第n検索語に関するスコアを,それぞれ,第1〜第nソートキーとした降順ソートを行うことにより、スコア順リストを生成する(ステップS302)。すなわち、検索要求応答部12は、プロフィール情報が,第1検索語に関するスコアの降順で並んだスコア順リストであって、第z検索語(z=1〜n−1)に関するスコアまでが等しいプロフィール情報群は,第z+1検索語に関するスコアの降順で並んでいるスコア順リストを生成する。
その後、検索要求応答部12は、生成したスコア順リストの中から、各検索語のスコアが最もスコア指定値に近いプロフィール情報を検索する処理(ステップS303)と、生成したスコア順リスト内の,検索したプロフィール情報以降の各プロフィール情報に基づき、検索結果ページデータを生成する処理(ステップS304)とを行う。
ステップS304の処理で生成される検索結果ページデータは、ステップS203の処理で生成される検索結果ページデータと同様のものである。ただし、ステップS304の処理で生成される検索結果ページデータは、図10に示したような検索結果ページ,すなわち、第2種検索要求中に含まれていた検索語毎に、それをクリックすることにより、その検索語による再検索が行われることになるアイテム(図10における点線枠28内に示されている2アイテム)も示される検索結果ページをWebブラウザに表示させるものとなっている。
複数の検索語を含む第1種検索要求を受信した際に,検索要求応答部12が実行する処理も、図8の処理と同様のものである。ただし、複数の検索語を含む第1種検索要求を受信した際に検索要求応答部12が実行する処理は、ステップS303の処理が行われない(スコア順リスト内の全てのプロフィール情報を用いて、検索結果ページデータが生成される)ものとなっている。
以上、詳細に説明したように、本実施形態に係る情報検索装置10は、検索した各Webページのタイトル等が,複数の特徴語(TF−IDF値から求められた単語)と共に示される検索結果ページを提供する装置となっている。そして、複数の特徴語が分かれば、各Webページの内容を推定できるため、本実施形態に係る情報検索装置10を用いておけば、より簡単に(スニペットを読む必要がない形で)Webページの検索を行えるネット環境を実現できることになる。
《変形形態》
上記した情報検索装置10は、各種の変形を行うことが出来る。例えば、情報検索装置10を、コンピュータ内の文書ファイル(Webページ以外の情報)の検索を行うための装置に変形することが出来る。また、情報検索装置10は、予め,各種検索対象に関する単語,スコアを求めておかない装置(検索が指示された際に、各検索対象に対する形態素解析等を行う装置)に変形することも出来る。ただし、検索対象の数が多い場合/検索を高速に行いたい場合には、上記構成を採用しておくことが望ましい。
また、情報検索装置10を、上記したものとは異なる手順でスコアを算出する装置(スコアの算出アルゴリズムが異なる装置)に変形しても良いことや、各部(検索結果ページ,Webページプロフィールデータベース11等)の具体的な構成を上記したものと異ならせておいても良いことなどは、当然のことである。
本発明の一実施形態に係る情報検索装置の使用形態及び用途の説明図。 実施形態に係る情報検索装置の機能ブロック図。 実施形態に係る情報検索装置が備えるWebページプロフィールデータベースの説明図。 実施形態に係る情報検索装置内の情報収集部の動作手順を示す流れ図。 実施形態に係る情報検索装置内の検索要求応答部の動作手順を示す流れ図。 実施形態に係る情報検索装置が提供する検索結果ページの構成の説明図。 実施形態に係る情報検索装置が提供する検索結果ページの機能の説明図。 実施形態に係る情報検索装置が提供する検索結果ページの機能の説明図。 実施形態に係る情報検索装置内の検索要求応答部の動作手順を示す流れ図。 実施形態に係る情報検索装置が提供する検索結果ページの構成の説明図。
符号の説明
10 情報検索装置
11 Webページプロフィールデータベース
12 検索要求応答部
13 情報収集部

Claims (8)

  1. 複数の検索対象情報の中から、指定された検索語を含む検索対象情報を検索する検索手段と、
    前記検索手段により検索された各検索対象情報の識別情報を、各検索対象情報の,所定アルゴリズムにより決定された1つ以上の特徴語と共に出力する検索結果出力手段と
    を備えることを特徴とする情報検索装置。
  2. 前記複数の検索対象情報のそれぞれについて、その検索対象情報の識別情報と,その検索対象情報についての,前記所定アルゴリズムにより決定された複数の特徴語とを記憶した検索用データベースを、さらに、備え、
    前記検索特定手段が、
    前記検索語が特徴語として記憶されている検索対象情報の識別情報を前記検索用データベースの中から検索する手段であり、
    前記検索結果出力手段が、
    前記検索手段により検索された識別情報毎に、その識別情報と,前記検索用データベース内の,その識別情報と同じ検索対象情報についての,前記検索語とは異なる1つ以上の特徴語とを含む単位検索結果情報を出力する手段である
    ことを特徴とする請求項1記載の情報検索装置。
  3. 前記検索用データベースが、
    各特徴語の各検索対象情報中での相対的な出現頻度を示す数値情報であるスコアも、記憶したデータベースであり、
    前記検索結果出力手段が、
    各単位検索結果情報が、前記検索用データベース内の,対応する検索対象情報に関する,前記検索語と一致している特徴語についての前記スコアの降順で示される検索結果リストを出力した後、特徴語の組み合わせが指定された場合には、特徴語の組み合わせが指定されたものと一致している各単位検索結果情報がその先頭部分に示される検索結果リストを出力する手段である
    ことを特徴とする請求項2記載の情報検索装置。
  4. 前記検索用データベースが、
    各特徴語の各検索対象情報中での相対的な出現頻度を示す数値情報であるスコアも、記憶したデータベースであり、
    前記検索結果出力手段が、
    各単位検索結果情報が、前記検索用データベース内の,対応する検索対象情報に関する,前記検索語と一致している特徴語についての前記スコアの降順で示される検索結果リストを出力した後、特徴語の組み合わせ及び各特徴語のスコアが指定された場合には、特徴語の組み合わせが指定されたものと一致している各単位検索結果情報が,各特徴語のスコアが指定されている各特徴語のスコアと類似しているものから,順々に,その先頭部分に示される検索結果リストを出力する手段である
    ことを特徴とする請求項2記載の情報検索装置。
  5. 前記検索用データベースが、
    各特徴語の各検索対象情報中での相対的な出現頻度を示す数値情報であるスコアも、記憶したデータベースであり、
    前記検索結果出力手段が、
    各単位検索結果情報が、前記検索用データベース内の,対応する検索対象情報に関する,前記検索語と一致している特徴語についての前記スコアの降順で示されるWebページであって、特徴語の組み合わせを指定する操作がなされた場合には、特徴語の組み合わせが指定されたものと一致している各単位検索結果情報がその先頭部分に示されることになるWebページを,Webブラウザに表示させるためのデータを出力する手段である
    ことを特徴とする請求項2記載の情報検索装置。
  6. 前記検索用データベースが、
    各特徴語の各検索対象情報中での相対的な出現頻度を示す数値情報であるスコアも、記憶したデータベースであり、
    前記検索結果出力手段が、
    各単位検索結果情報が、前記検索用データベース内の,対応する検索対象情報に関する,前記検索語と一致している特徴語についての前記スコアの降順で示されるWebページであって、特徴語の組み合わせ及び各特徴語のスコアを指定する操作がなされた場合には、特徴語の組み合わせが指定されたものと一致している各単位検索結果情報が,各特徴語のスコアが指定されている各特徴語のスコアと類似しているものから,順々に,その先頭部分に示されることになるWebページを,Webブラウザに表示させるためのデータを出力する手段である
    ことを特徴とする請求項2記載の情報検索装置。
  7. コンピュータを、
    複数の検索対象情報の中から、指定された検索語を含む検索対象情報を検索する検索手段と、
    前記検索手段により検索された各検索対象情報の識別情報を、各検索対象情報の,所定アルゴリズムにより決定された1つ以上の特徴語と共に出力する検索結果出力手段と
    を備える装置として動作させることを特徴とする情報検索プログラム。
  8. コンピュータに、
    複数の検索対象情報の中から、指定された検索語を含む検索対象情報を検索する検索ステップと、
    前記検索手段により検索された各検索対象情報の識別情報を、各検索対象情報の,所定アルゴリズムにより決定された1つ以上の特徴語と共に出力する検索結果出力ステップと
    を実行させることを特徴とする情報検索方法。
JP2007338612A 2007-12-28 2007-12-28 情報検索装置,情報検索プログラム及び情報検索方法 Pending JP2009157865A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007338612A JP2009157865A (ja) 2007-12-28 2007-12-28 情報検索装置,情報検索プログラム及び情報検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007338612A JP2009157865A (ja) 2007-12-28 2007-12-28 情報検索装置,情報検索プログラム及び情報検索方法

Publications (1)

Publication Number Publication Date
JP2009157865A true JP2009157865A (ja) 2009-07-16

Family

ID=40961770

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007338612A Pending JP2009157865A (ja) 2007-12-28 2007-12-28 情報検索装置,情報検索プログラム及び情報検索方法

Country Status (1)

Country Link
JP (1) JP2009157865A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009199164A (ja) * 2008-02-19 2009-09-03 Ricoh Co Ltd 文書管理装置、文書管理方法及び記録媒体
JP2013505514A (ja) * 2009-09-23 2013-02-14 アリババ グループ ホールディング リミテッド 情報検索方法およびシステム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10187752A (ja) * 1996-12-24 1998-07-21 Kokusai Denshin Denwa Co Ltd <Kdd> 言語間情報検索支援システム
JPH1185786A (ja) * 1997-09-05 1999-03-30 Hitachi Ltd 文書検索方法、文書検索サービスおよび文書検索支援サービス
JPH11259483A (ja) * 1998-03-09 1999-09-24 Omron Corp 検索装置及び記憶媒体
JP2004157965A (ja) * 2002-09-12 2004-06-03 Ricoh Co Ltd 検索支援装置、検索支援方法、プログラムおよび記録媒体
JP2005209229A (ja) * 2005-04-07 2005-08-04 Matsushita Electric Ind Co Ltd 画像検索方法及びその装置
JP2007241635A (ja) * 2006-03-08 2007-09-20 Nec Corp 文書検索装置、情報処理装置、検索結果出力方法、検索結果表示方法およびプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10187752A (ja) * 1996-12-24 1998-07-21 Kokusai Denshin Denwa Co Ltd <Kdd> 言語間情報検索支援システム
JPH1185786A (ja) * 1997-09-05 1999-03-30 Hitachi Ltd 文書検索方法、文書検索サービスおよび文書検索支援サービス
JPH11259483A (ja) * 1998-03-09 1999-09-24 Omron Corp 検索装置及び記憶媒体
JP2004157965A (ja) * 2002-09-12 2004-06-03 Ricoh Co Ltd 検索支援装置、検索支援方法、プログラムおよび記録媒体
JP2005209229A (ja) * 2005-04-07 2005-08-04 Matsushita Electric Ind Co Ltd 画像検索方法及びその装置
JP2007241635A (ja) * 2006-03-08 2007-09-20 Nec Corp 文書検索装置、情報処理装置、検索結果出力方法、検索結果表示方法およびプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009199164A (ja) * 2008-02-19 2009-09-03 Ricoh Co Ltd 文書管理装置、文書管理方法及び記録媒体
JP2013505514A (ja) * 2009-09-23 2013-02-14 アリババ グループ ホールディング リミテッド 情報検索方法およびシステム
US9367605B2 (en) 2009-09-23 2016-06-14 Alibaba Group Holding Limited Abstract generating search method and system

Similar Documents

Publication Publication Date Title
US10929487B1 (en) Customization of search results for search queries received from third party sites
US7475074B2 (en) Web search system and method thereof
US20080071739A1 (en) Using anchor text to provide context
US20080215550A1 (en) Search support apparatus, computer program product, and search support system
US8332208B2 (en) Information processing apparatus, information processing method, and program
JP2008508605A5 (ja)
JP2007188352A (ja) ページリランキング装置、ページリランキングプログラム
JP2009199325A (ja) 表示データ生成装置及び方法
JP2010026666A (ja) 関連情報提示システム、関連情報提示方法、プログラム及び情報記憶媒体
JPWO2013021696A1 (ja) 情報検索システム、方法、及びプログラム
JP2010128928A (ja) 検索システム及び検索方法
JP5151368B2 (ja) 情報処理装置および情報処理プログラム
JP2007034772A (ja) Webサイト検索結果の最適表示システム及びその装置及びその方法及びそのプログラム
JP6446819B2 (ja) 文書差分表示プログラム及び情報処理装置
JP2011002982A (ja) コンテンツ提供装置、コンテンツ提供方法およびコンテンツ提供プログラム
JP2007257369A (ja) 情報検索装置
JP2009157865A (ja) 情報検索装置,情報検索プログラム及び情報検索方法
US9542492B2 (en) Method and system for generating interactive query results previews
JP5039086B2 (ja) 評価情報入力支援装置、評価情報入力支援方法およびその方法を実行させるプログラム
JP5228529B2 (ja) データ検索プログラム、データ検索装置およびデータ検索方法
JP2009271671A (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
JP2004287532A (ja) 統合型メタ検索装置および方法
JP5002631B2 (ja) 単語情報収集装置、単語情報収集方法および単語情報収集プログラム
JP2010015394A (ja) リンク先提示装置およびコンピュータプログラム
JP4713098B2 (ja) 選択項目表示装置、選択項目表示方法、および選択項目表示プログラム

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20101104

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20101104

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120821

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121022

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130219