JP5246932B2 - 検索装置及び方法、ならびに、コンピュータプログラム - Google Patents
検索装置及び方法、ならびに、コンピュータプログラム Download PDFInfo
- Publication number
- JP5246932B2 JP5246932B2 JP2008222064A JP2008222064A JP5246932B2 JP 5246932 B2 JP5246932 B2 JP 5246932B2 JP 2008222064 A JP2008222064 A JP 2008222064A JP 2008222064 A JP2008222064 A JP 2008222064A JP 5246932 B2 JP5246932 B2 JP 5246932B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- search
- data
- unit
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 97
- 238000004590 computer program Methods 0.000 title claims description 7
- 239000013598 vector Substances 0.000 claims description 97
- 238000004458 analytical method Methods 0.000 claims description 68
- 230000000877 morphologic effect Effects 0.000 claims description 45
- 238000010586 diagram Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
一方、特許文献1には、ユーザにより指定された検索語句により、検索を行い、抽出された文献に使用されている語句と、検索に使用されている語句との関連度を、「TF/IDF」や「カルバックの情報量」を用いて計算し、検索結果として、抽出された文献と、関連度の高い語句を共にユーザインタフェースとしてユーザに提供する技術が記載されている。
特許文献1には、検索語句と、抽出された文献に記載されている関連の高い語句がユーザインタフェースとして提供される技術が記載されているが、ユーザが想定する検索結果が表示されない場合は、再度検索キーワードを変えて検索を行う必要があり、上述する問題を解決することはできない。
図1は、本発明の概要を説明するための図である。同図に示すように、まず、検索者は、検索キーワード(例えば、「○○について」)を入力し、この検索キーワードを用いた検索を要求する(ステップS1)。検索装置は、検索キーワードを検索文章として形態素解析した結果からキーワードを取得し、このキーワードによる検索結果として抽出された文章データの先頭の部分を一覧として表示する。検索者は、この一覧を確認し、意図する情報データが検索結果に含まれていなかった場合、意図する情報に少しでも近い情報データを選択して(ステップS2)、再び検索を要求する(ステップS3)。これにより、検索装置は絞込み検索を行うが、検索者が指定した情報データの内容をはじめの検索文章に追加し、その検索文章の形態素解析結果から得られるキーワードにより再検索を行う。これにより、意図する情報に近い情報データが検索結果として多く表示される。そして、検索者の所望の情報を含む情報データが検索結果として表示されるまで、意図する情報に少しでも近い情報データを選択して再検索を要求することを繰り返す(ステップS4)。なお、検索結果に併せて、検索文章から得られたキーワードを表示させるようにすることもできる。
図2は、本発明の第1の形態による検索装置1の機能ブロック図であり、本発明と関係する機能ブロックのみ抽出して示してある。同図において、検索装置1は、1台または複数台のコンピュータ装置等により構成することができ、検索対象の情報に関するデータを格納する情報DB(データベース)30と、ユーザからクエリ(検索要求)を受けるユーザインタフェース部10と、情報DB30にクエリを出力する検索実行部20とを備える。
検索文章受付部11は、自身の備える、あるいは、ネットワークを介して接続される端末装置のキーボードやマウスなどの入力手段により入力された、検索に使用する検索キーワードや、情報データのインデックスの入力を受ける。
情報取得部12は、検索文章受付部11が入力を受けたインデックスにより特定される情報データを情報DB30から読み出し、検索キーワードとともに検索実行部20に出力し、検索を要求する。
検索結果表示部13は、検索実行部20から検索結果として情報データのインデックスを受信し、当該インデックスにより特定される情報データの先頭から所定文字数分、例えば、200文字分程度の内容の文章データを抽出したものである表示用データを情報DB30から読み出し、この表示用データを表示するための検索結果表示画面を、自身の備える、あるいは、ネットワークを介して接続される端末装置のディスプレイに出力する。
図3は、情報DB30に記憶される情報テーブルの例を示す図である。同図において、情報テーブルは、情報データと、当該情報データを一意に識別する情報であるインデックス(Index)とを対応づけて記憶する。なお、情報データには、情報内容の文章データだけではなく、静止画、動画などの画像データや、表示スタイルなどの他のデータが含まれていてもよい。同図においてインデックスには、通番を使用しているが、文字列(「A11」、「B13」等)や、ハッシュ値(「loi83n」や「o98ahy」等)など、各情報データを一意に特定可能であれば任意のものが使用可能である。
図5は、検索装置1の全体処理フローを示す。同図において、まず、検索者は検索サイトにアクセスすると、検索装置1へ検索キーワードを入力し、検索ボタンを押す。これにより、検索装置1のユーザインタフェース部10は、入力された検索キーワードの情報と、検索要求の入力を受ける(ステップS110)。ユーザインタフェース部10は、検索キーワードの情報を検索実行部20に送信し、検索を要求する。
そして、所望の情報が得られた場合(ステップS140:YES)、検索処理を終了する。
同図において、まず、検索者は、キーボードなどの入力手段により、検索サイトのアドレスを入力する。これにより、ユーザインタフェース部10は、検索キーワードを入力するための検索キーワード入力フィールドと検索ボタンとを表示するための検索画面をディスプレイに出力する。検索者は、検索キーワード入力フィールドに検索キーワードを入力し、検索ボタンを押す。これにより、ユーザインタフェース部10の検索文章受付部11は、検索キーワードと、検索要求の入力を受ける(ステップS210)。この検索キーワードを示す検索文章データを検索文章(A)とする。情報取得部12は、検索文章(A)を検索実行部20に送信し、検索を要求する(ステップS220)。
そして、ステップS220からの処理を繰り返し、ステップS240において検索結果表示画面を出力した結果として、検索要求が受信されない場合は(ステップS250:NO)、処理を終了する。
また、ステップS240において、検索結果表示画面を表示させる際に、以前にチェックされた情報データに対応したチェックボックスにデフォルトでチェックを入れて表示させるようにしてもよい。
また、上記においては、検索結果表示部13は、受信したインデックスに対応した情報データから先頭より所定文字数分の情報内容の文章データを表示用データとして取得しているが、画像データや、キーワードが含まれる所定文字数分の情報内容の文章データなどを表示用データとして取得してもよい。
検索実行部20の形態素解析部21は、図6のステップS220においてユーザインタフェース部10から出力された検索文章(A)を受信すると、受信した検索文章(A)の形態素解析を行なう。キーワード取得部22は、形態素解析部21による形態素解析の結果から、重複した言葉を除いてキーワードを取得する(ステップS310)。このとき、例えば名詞、動詞、形容詞、副詞など、所定の品詞のみをキーワードとして選択するようにしてもよい。情報DBアクセス部23は、情報DB30が記憶しているインデックステーブルを検索し、各キーワードに対応したインデックスのリストを返送する。情報DBアクセス部23は、予め決められた任意のルールに従って読み出した各インデックスに表示の優先度を付与する(ステップS320)。例えば、受信したインデックスがいくつのキーワードに対応して読み出されたかをカウントし、その数が多い順に表示の優先度を高くするようにしてもよい。また、例えば、最初に入力された検索キーワードを形態素解析して得たキーワードに対応して読み出されたインデックスの優先度を高くするようにしてもよい。情報DBアクセス部23は、読み出したインデックスと、当該インデックスの表示の優先度と、ステップS310において取得したキーワードとの情報をユーザインタフェース部10に返送する(ステップS330)。
検索者が要求するキーワードに複数の意味が含まれるような場合、そのキーワードを入力してしまうと、本来の意図とは外れた検索結果が得られることがある。例えば、最新のインターネット技術について調べたい場合で、特に、アプリケーション系の技術においてどのようなものがあるかを検索したいときに、「アプリケーション」を検索キーワードとして使用すると、取得可能な情報が限定されてしまう。
本発明の第2の実施形態について説明する。上述した第1の実施形態では、キーワードを使用して情報データを検索しているが、本実施形態では、検索文章との類似度を使用して情報データを検索する。比較的、長文からなる自然文のような質問を与えて、文章と検索質問との内容的な類似性の比較を行う文章検索としては、一般的にベクトル空間モデルを用いた文章検索が使用されている。本実施形態ではこの技術を文章間の類似度の判定に適用する。以下、第1の実施形態との差分について記載する。
ここで、具体的な出現頻度方式(TF)を使用した文章ベクトルの例を説明する。出現頻度方式(TF)では、複数(DN個)の文書からなる文書群がある場合に、ある文書中にある単語w(キーワード)が出現する数を示すTF(w)値と、文書群の中でその単語wが含まれている文書数を示すDF(w)値とを用いて、当該文書における単語wのTF−IDF値をTF(w)×log(DN/DF(w))により算出する。各文書の文章ベクトルは、各単語のTF−IDF値を要素として表される。
検索実行部20aの形態素解析部21は、図6のステップS220においてユーザインタフェース部10から出力された検索文章(A)を受信すると、受信した検索文章(A)の形態素解析を行なう(ステップS410)。
なお、上記においては、特徴情報として文章ベクトルを使用しているが、文章の特徴を示し、当該特徴情報を用いて文書間の類似度を算出可能な情報であれば、任意のものを使用することができる。従って、上述した出現頻度方式(TF)以外にも、他の既存の文書間の類似度の判定方法を用いることができる。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
10…ユーザインタフェース部
11…検索文章受付部(検索キーワード受付部、選択情報受付部)
12…情報取得部
13…検索結果表示部
20、20a…検索実行部
21…形態素解析部
22、22a…情報DBアクセス部(情報アクセス部)
23…キーワード取得部(特徴情報生成部)
24…文章ベクトル計算部(特徴情報生成部)
30、30a…情報DB(記憶部)
Claims (8)
- 情報データと当該情報データの識別情報とを対応付けた情報テーブルと、情報データの識別情報と当該情報データに含まれる情報内容の特徴を示す特徴情報とを対応付けた特徴情報テーブルとを記憶する記憶部と、
検索者による検索キーワードの入力を受け、当該検索キーワードを検索文章として出力する検索キーワード受付部と、
前記検索キーワード受付部により出力された検索文章の特徴情報を生成する特徴情報生成部と、
前記特徴情報テーブル内の各情報データの特徴情報から、所定の類似の条件を満たす、前記特徴情報生成部により生成された特徴情報と類似の特徴情報を選択し、選択した特徴情報に対応した情報データの識別情報を読み出す情報アクセス部と、
前記情報テーブルから、前記情報アクセス部が読み出した情報データの識別情報により特定される情報データ内の一部の情報を表示用データとして取得し、取得した前記情報データの表示用データを画面に表示させる検索結果表示部と、
前記検索結果表示部により前記表示用データを表示させた前記情報データのうち、検索者が選択した情報データの識別情報の入力を受ける選択情報受付部と、
前記情報テーブルから、前記選択情報受付部により入力を受けた情報データの識別情報に対応した情報データを読み出して前記検索文章に付加し、前記特徴情報生成部へ出力する情報取得部とを備え、
前記特徴情報生成部は、前記情報取得部から出力された検索文章の特徴情報を生成し、
前記特徴情報は、キーワードであり、
前記記憶部は、前記特徴情報テーブルとして、情報データの識別情報とキーワードとを対応付けたインデックステーブルを記憶し、
前記検索文章を形態素解析する形態素解析部をさらに備え、
前記特徴情報生成部は、前記形態素解析部による形態素解析の結果からキーワードを取得し、
前記情報アクセス部は、前記インデックステーブルから、前記特徴情報生成部が取得したキーワードに対応する情報データの識別情報を読み出し、
前記検索結果表示部は、検索者により入力された前記検索キーワードをデフォルトで表示した検索キーワード入力フィールドと、前記特徴情報生成部が取得したキーワードとを前記画面に表示させる、
ことを特徴とする検索装置。 - 情報データと当該情報データの識別情報とを対応付けた情報テーブルと、情報データの識別情報と当該情報データに含まれる情報内容の特徴を示す特徴情報とを対応付けた特徴情報テーブルとを記憶する記憶部と、
検索者による検索キーワードの入力を受け、当該検索キーワードを検索文章として出力する検索キーワード受付部と、
前記検索キーワード受付部により出力された検索文章の特徴情報を生成する特徴情報生成部と、
前記特徴情報テーブル内の各情報データの特徴情報から、所定の類似の条件を満たす、前記特徴情報生成部により生成された特徴情報と類似の特徴情報を選択し、選択した特徴情報に対応した情報データの識別情報を読み出す情報アクセス部と、
前記情報テーブルから、前記情報アクセス部が読み出した情報データの識別情報により特定される情報データ内の一部の情報を表示用データとして取得し、取得した前記情報データの表示用データを画面に表示させる検索結果表示部と、
前記検索結果表示部により前記表示用データを表示させた前記情報データのうち、検索者が選択した情報データの識別情報の入力を受ける選択情報受付部と、
前記情報テーブルから、前記選択情報受付部により入力を受けた情報データの識別情報に対応した情報データを読み出して前記検索文章に付加し、前記特徴情報生成部へ出力する情報取得部とを備え、
前記特徴情報生成部は、前記情報取得部から出力された検索文章の特徴情報を生成し、
前記特徴情報は、文章ベクトルであり、
前記記憶部は、前記特徴情報テーブルとして、情報データの識別情報と当該情報データに含まれる文章の文章ベクトルとを対応付けた文章ベクトルテーブルを記憶し、
前記検索文章を形態素解析する形態素解析部をさらに備え、
前記特徴情報生成部は、前記形態素解析部による形態素解析の結果から前記検索文章の文章ベクトルを生成し、
前記情報アクセス部は、前記文章ベクトルテーブル内の各文章ベクトルと、前記特徴情報生成部により生成された文章ベクトルとから類似度を算出し、算出した類似度が所定の類似の条件を満たす文章ベクトルに対応した情報データの識別情報を前記文章ベクトルテーブルから読み出し、
前記検索結果表示部は、検索者により入力された前記検索キーワードをデフォルトで表示した検索キーワード入力フィールドと、前記文章ベクトルを構成する要素に対応した語句であって、前記検索文章に含まれる語句とを前記画面に表示させる、
ことを特徴とする検索装置。 - 検索結果表示部は、前記表示用データとして、前記情報データの最初から所定文字数分の文章データを取得する、
ことを特徴とする請求項1または請求項2に記載の検索装置。 - 前記検索結果表示部は、表示用データを画面に表示させた情報データのうち、次の検索に用いる情報データを指定するためのチェックボックスをさらに前記画面に表示させる、
ことを特徴とする請求項1から請求項3のいずれか1項に記載の検索装置。 - 情報データと当該情報データの識別情報とを対応付けた情報テーブルと、情報データの識別情報と当該情報データに含まれる情報内容の特徴を示す特徴情報とを対応付けた特徴情報テーブルとを記憶する記憶部を備えた検索装置に用いられる検索方法であって、
検索キーワード受付部が、検索者による検索キーワードの入力を受け、当該検索キーワードを検索文章として出力する検索キーワード受付過程と、
特徴情報生成部が、前記検索キーワード受付過程により出力された検索文章の特徴情報を生成する特徴情報生成過程と、
情報アクセス部が、前記特徴情報テーブル内の各情報データの特徴情報から、所定の類似の条件を満たす、前記特徴情報生成過程において生成された特徴情報と類似の特徴情報を選択し、選択した特徴情報に対応した情報データの識別情報を読み出す情報アクセス過程と、
検索結果表示部が、前記情報テーブルから、前記情報アクセス過程において読み出した情報データの識別情報により特定される情報データ内の一部の情報を表示用データとして取得し、取得した前記情報データの表示用データを画面に表示させる検索結果表示過程と、
選択情報受付部が、前記検索結果表示過程において前記表示用データを表示させた前記情報データのうち、検索者が選択した情報データの識別情報の入力を受ける選択情報受付過程と、
情報取得部が、前記情報テーブルから、前記選択情報受付過程において入力を受けた情報データの識別情報に対応した情報データを読み出して前記検索文章に付加し、出力する情報取得過程とを有し、
前記特徴情報取過程では、前記情報取得過程において出力された検索文章の特徴情報を生成し、
前記情報アクセス過程からの処理を繰り返し、
前記特徴情報は、キーワードであり、
前記記憶部は、前記特徴情報テーブルとして、情報データの識別情報とキーワードとを対応付けたインデックステーブルを記憶し、
前記検索文章を形態素解析する形態素解析過程をさらに有し、
前記特徴情報生成過程においては、前記形態素解析過程における形態素解析の結果からキーワードを取得し、
前記情報アクセス過程においては、前記インデックステーブルから、前記特徴情報生成過程において取得したキーワードに対応する情報データの識別情報を読み出し、
前記検索結果表示過程においては、検索者により入力された前記検索キーワードをデフォルトで表示した検索キーワード入力フィールドと、前記特徴情報生成過程において取得したキーワードとを前記画面に表示させる、
ことを特徴とする検索方法。 - 情報データと当該情報データの識別情報とを対応付けた情報テーブルと、情報データの識別情報と当該情報データに含まれる情報内容の特徴を示す特徴情報とを対応付けた特徴情報テーブルとを記憶する記憶部を備えた検索装置に用いられる検索方法であって、
検索キーワード受付部が、検索者による検索キーワードの入力を受け、当該検索キーワードを検索文章として出力する検索キーワード受付過程と、
特徴情報生成部が、前記検索キーワード受付過程により出力された検索文章の特徴情報を生成する特徴情報生成過程と、
情報アクセス部が、前記特徴情報テーブル内の各情報データの特徴情報から、所定の類似の条件を満たす、前記特徴情報生成過程において生成された特徴情報と類似の特徴情報を選択し、選択した特徴情報に対応した情報データの識別情報を読み出す情報アクセス過程と、
検索結果表示部が、前記情報テーブルから、前記情報アクセス過程において読み出した情報データの識別情報により特定される情報データ内の一部の情報を表示用データとして取得し、取得した前記情報データの表示用データを画面に表示させる検索結果表示過程と、
選択情報受付部が、前記検索結果表示過程において前記表示用データを表示させた前記情報データのうち、検索者が選択した情報データの識別情報の入力を受ける選択情報受付過程と、
情報取得部が、前記情報テーブルから、前記選択情報受付過程において入力を受けた情報データの識別情報に対応した情報データを読み出して前記検索文章に付加し、出力する情報取得過程とを有し、
前記特徴情報取過程では、前記情報取得過程において出力された検索文章の特徴情報を生成し、
前記情報アクセス過程からの処理を繰り返し、
前記特徴情報は、文章ベクトルであり、
前記記憶部は、前記特徴情報テーブルとして、情報データの識別情報と当該情報データに含まれる文章の文章ベクトルとを対応付けた文章ベクトルテーブルを記憶し、
前記検索文章を形態素解析する形態素解析過程をさらに有し、
前記特徴情報生成過程においては、前記形態素解析過程における形態素解析の結果から前記検索文章の文章ベクトルを生成し、
前記情報アクセス過程においては、前記文章ベクトルテーブル内の各文章ベクトルと、前記特徴情報生成過程において生成された文章ベクトルとから類似度を算出し、算出した類似度が所定の類似の条件を満たす文書ベクトルに対応した情報データの識別情報を前記文章ベクトルテーブルから読み出し、
前記検索結果表示過程においては、検索者により入力された前記検索キーワードをデフォルトで表示した検索キーワード入力フィールドと、前記文章ベクトルを構成する要素に対応した語句であって、前記検索文章に含まれる語句とを前記画面に表示させる、
ことを特徴とする検索方法。 - 情報データと当該情報データの識別情報とを対応付けた情報テーブルと、情報データの識別情報と当該情報データに含まれる情報内容の特徴を示す特徴情報とを対応付けた特徴情報テーブルとを記憶する記憶部を備え、情報の検索装置として用いられるコンピュータを、
検索者による検索キーワードの入力を受け、当該検索キーワードを検索文章として出力する検索キーワード受付部、
前記検索キーワード受付部により出力された検索文章の特徴情報を生成する特徴情報生成部、
前記特徴情報テーブル内の各情報データの特徴情報から、所定の類似の条件を満たす、前記特徴情報生成部により生成された特徴情報と類似の特徴情報を選択し、選択した特徴情報に対応した情報データの識別情報を読み出す情報アクセス部、
前記情報テーブルから、前記情報アクセス部が読み出した情報データの識別情報により特定される情報データ内の一部の情報を表示用データとして取得し、取得した前記情報データの表示用データを画面に表示させる検索結果表示部、
前記検索結果表示部により前記表示用データを表示させた前記情報データのうち、検索者が選択した情報データの識別情報の入力を受ける選択情報受付部、
前記情報テーブルから、前記選択情報受付部により入力を受けた情報データの識別情報に対応した情報データを読み出して前記検索文章に付加し、前記特徴情報生成部へ出力する情報取得部として機能させ、
前記特徴情報生成部に、前記情報取得部から出力された検索文章の特徴情報を生成するよう機能させ、
前記特徴情報は、キーワードであり、
前記記憶部は、前記特徴情報テーブルとして、情報データの識別情報とキーワードとを対応付けたインデックステーブルを記憶し、
前記コンピュータを、前記検索文章を形態素解析する形態素解析部としてさらに機能させ、
前記特徴情報生成部は、前記形態素解析部による形態素解析の結果からキーワードを取得し、
前記情報アクセス部は、前記インデックステーブルから、前記特徴情報生成部が取得したキーワードに対応する情報データの識別情報を読み出し、
前記検索結果表示部は、検索者により入力された前記検索キーワードをデフォルトで表示した検索キーワード入力フィールドと、前記特徴情報生成部が取得したキーワードとを前記画面に表示させる、
ことを特徴とするコンピュータプログラム。 - 情報データと当該情報データの識別情報とを対応付けた情報テーブルと、情報データの識別情報と当該情報データに含まれる情報内容の特徴を示す特徴情報とを対応付けた特徴情報テーブルとを記憶する記憶部を備え、情報の検索装置として用いられるコンピュータを、
検索者による検索キーワードの入力を受け、当該検索キーワードを検索文章として出力する検索キーワード受付部、
前記検索キーワード受付部により出力された検索文章の特徴情報を生成する特徴情報生成部、
前記特徴情報テーブル内の各情報データの特徴情報から、所定の類似の条件を満たす、前記特徴情報生成部により生成された特徴情報と類似の特徴情報を選択し、選択した特徴情報に対応した情報データの識別情報を読み出す情報アクセス部、
前記情報テーブルから、前記情報アクセス部が読み出した情報データの識別情報により特定される情報データ内の一部の情報を表示用データとして取得し、取得した前記情報データの表示用データを画面に表示させる検索結果表示部、
前記検索結果表示部により前記表示用データを表示させた前記情報データのうち、検索者が選択した情報データの識別情報の入力を受ける選択情報受付部、
前記情報テーブルから、前記選択情報受付部により入力を受けた情報データの識別情報に対応した情報データを読み出して前記検索文章に付加し、前記特徴情報生成部へ出力する情報取得部として機能させ、
前記特徴情報生成部に、前記情報取得部から出力された検索文章の特徴情報を生成するよう機能させ、
前記特徴情報は、文章ベクトルであり、
前記記憶部は、前記特徴情報テーブルとして、情報データの識別情報と当該情報データに含まれる文章の文章ベクトルとを対応付けた文章ベクトルテーブルを記憶し、
前記特徴情報生成部は、前記形態素解析部による形態素解析の結果から前記検索文章の文章ベクトルを生成し、
前記情報アクセス部は、前記文章ベクトルテーブル内の各文章ベクトルと、前記特徴情報生成部により生成された文章ベクトルとから類似度を算出し、算出した類似度が所定の類似の条件を満たす文書ベクトルに対応した情報データの識別情報を前記文章ベクトルテーブルから読み出し、
前記検索結果表示部は、検索者により入力された前記検索キーワードをデフォルトで表示した検索キーワード入力フィールドと、前記文章ベクトルを構成する要素に対応した語句であって、前記検索文章に含まれる語句とを前記画面に表示させる、
ことを特徴とするコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008222064A JP5246932B2 (ja) | 2008-08-29 | 2008-08-29 | 検索装置及び方法、ならびに、コンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008222064A JP5246932B2 (ja) | 2008-08-29 | 2008-08-29 | 検索装置及び方法、ならびに、コンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010055518A JP2010055518A (ja) | 2010-03-11 |
JP5246932B2 true JP5246932B2 (ja) | 2013-07-24 |
Family
ID=42071335
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008222064A Active JP5246932B2 (ja) | 2008-08-29 | 2008-08-29 | 検索装置及び方法、ならびに、コンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5246932B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103995880B (zh) * | 2014-05-27 | 2019-03-12 | 百度在线网络技术(北京)有限公司 | 交互式搜索方法和装置 |
JPWO2021210210A1 (ja) * | 2020-04-15 | 2021-10-21 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002049638A (ja) * | 2000-05-26 | 2002-02-15 | Fujitsu Ltd | 文書情報検索装置、方法、文書情報検索プログラム及び文書情報検索プログラムを格納したコンピュータ可読の記録媒体 |
JP3791908B2 (ja) * | 2002-02-22 | 2006-06-28 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 検索システム、システム、検索方法およびプログラム |
JP4092933B2 (ja) * | 2002-03-20 | 2008-05-28 | 富士ゼロックス株式会社 | 文書情報検索装置及び文書情報検索プログラム |
JP3793876B2 (ja) * | 2002-10-31 | 2006-07-05 | カシオ計算機株式会社 | 情報表示装置および情報表示処理プログラム |
JP2006178599A (ja) * | 2004-12-21 | 2006-07-06 | Fuji Xerox Co Ltd | 文書検索装置および方法 |
-
2008
- 2008-08-29 JP JP2008222064A patent/JP5246932B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010055518A (ja) | 2010-03-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5662961B2 (ja) | レビュー処理方法およびシステム | |
US8200695B2 (en) | Database for uploading, storing, and retrieving similar documents | |
JP5074378B2 (ja) | クエリ用語および返答用語を含む情報ソースからのスニペットを有するファクトクエリエンジンのユーザインタフェース | |
US8001135B2 (en) | Search support apparatus, computer program product, and search support system | |
Kraft et al. | Y! q: contextual search at the point of inspiration | |
US20130110839A1 (en) | Constructing an analysis of a document | |
US20090254540A1 (en) | Method and apparatus for automated tag generation for digital content | |
US20060282413A1 (en) | System and method for a search engine using reading grade level analysis | |
US20060184517A1 (en) | Answers analytics: computing answers across discrete data | |
KR20160149978A (ko) | 검색 엔진 및 그의 구현 방법 | |
JP2016045652A (ja) | 質問文生成装置及びコンピュータプログラム | |
JP2007507801A (ja) | ウェブ検索の個人化 | |
US10606895B2 (en) | Multiple entity aware typeahead in searches | |
KR20160007040A (ko) | 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템 | |
CN109643315B (zh) | 基于结构化网络知识自动生成中文本体库的方法、系统、计算机设备和计算机可读介质 | |
JP4068854B2 (ja) | ファイル管理方法とこの方法を利用可能なファイル管理装置 | |
KR101088710B1 (ko) | 온라인 커뮤니티 사용자 간 상호작용 기반 온라인 커뮤니티 포스트 검색 방법, 장치 및 그 방법을 실행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체 | |
Strzelecki et al. | Direct answers in Google search results | |
JP7172187B2 (ja) | 情報表示方法、情報表示プログラムおよび情報表示装置 | |
US9152698B1 (en) | Substitute term identification based on over-represented terms identification | |
Li et al. | Infographics retrieval: A new methodology | |
JP5246932B2 (ja) | 検索装置及び方法、ならびに、コンピュータプログラム | |
JP4755834B2 (ja) | 属性評価装置、属性評価方法および属性評価プログラム | |
JP2012141681A (ja) | クエリセグメント位置決定装置 | |
JP6985181B2 (ja) | 情報処理装置、情報処理方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110214 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121018 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121030 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130408 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5246932 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160419 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |