JP2010055518A - 検索装置及び方法、ならびに、コンピュータプログラム - Google Patents

検索装置及び方法、ならびに、コンピュータプログラム Download PDF

Info

Publication number
JP2010055518A
JP2010055518A JP2008222064A JP2008222064A JP2010055518A JP 2010055518 A JP2010055518 A JP 2010055518A JP 2008222064 A JP2008222064 A JP 2008222064A JP 2008222064 A JP2008222064 A JP 2008222064A JP 2010055518 A JP2010055518 A JP 2010055518A
Authority
JP
Japan
Prior art keywords
information
search
data
unit
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008222064A
Other languages
English (en)
Other versions
JP5246932B2 (ja
Inventor
Kenichiro Okamoto
賢一郎 岡本
Takeshi Harada
剛 原田
Sumio Miyazaki
純生 宮崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Nippon Telegraph and Telephone West Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Nippon Telegraph and Telephone West Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, Nippon Telegraph and Telephone West Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2008222064A priority Critical patent/JP5246932B2/ja
Publication of JP2010055518A publication Critical patent/JP2010055518A/ja
Application granted granted Critical
Publication of JP5246932B2 publication Critical patent/JP5246932B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】情報検索において、検索者に絞り込みを行なうための検索キーワードを入力させることなく、検索者の所望の情報の絞り込み検索を行う。
【解決手段】検索者が検索キーワードを入力して検索を要求すると、検索装置は、検索キーワードを形態素解析した結果からキーワードを取得し、キーワードと情報データのインデックスとを対応づけたキーワードテーブルから、キーワードに対応した情報データを特定し、特定された各情報データの先頭の部分の内容を検索結果として表示する。検索者は、意図する情報データが検索結果に含まれていない場合、意図する情報に少しでも近い情報データを選択し、再び検索を要求する。検索装置は、選択された情報データの内容の形態素解析結果から得られるキーワードを、最初のキーワードに付加して再検索を行い、検索結果を表示する。所望の情報データが得られまで、情報データの選択と検索要求を繰り返す。
【選択図】図1

Description

本発明は、情報の検索装置及び方法、ならびに、コンピュータプログラムに関する。
近年の情報化社会においては、蓄積されている膨大な量の情報から、所望の情報を見出すことが困難となっている。例えば、既存のシステムにおいて、検索者が検索キーワードを入力して検索を行い、検索の結果、目的とする情報が取得できなかった場合は、さらに検索キーワードを追加して再び検索を行なっている。
一方、特許文献1には、ユーザにより指定された検索語句により、検索を行い、抽出された文献に使用されている語句と、検索に使用されている語句との関連度を、「TF/IDF」や「カルバックの情報量」を用いて計算し、検索結果として、抽出された文献と、関連度の高い語句を共にユーザインタフェースとしてユーザに提供する技術が記載されている。
特開2008−135057号公報
上述したように、検索者が検索のキーワードを入力して検索を行った結果、目的とする情報が取得できないため、さらにキーワードを追加して再び検索を行って所望の情報が得られるまで検索を続ける場合、検索者の思いつくキーワードを全て用いても所望の情報が検索結果として得られないことがある。また、調べたい内容が曖昧である、あるいは、キーワードとなるような言葉を曖昧にしか覚えていない場合、絞り込みを行なうためのキーワードとすべき言葉が思いつかないこともある。
特許文献1には、検索語句と、抽出された文献に記載されている関連の高い語句がユーザインタフェースとして提供される技術が記載されているが、ユーザが想定する検索結果が表示されない場合は、再度検索キーワードを変えて検索を行う必要があり、上述する問題を解決することはできない。
本発明は、上記問題を解決すべくなされたもので、その目的は、検索者に絞り込みを行なうための検索キーワードを入力させることなく、検索者の所望の情報の絞り込み検索を行うことができる検索装置及び方法、ならびに、コンピュータプログラムを提供することにある。
上述した課題を解決するために、本発明は、情報データと当該情報データの識別情報とを対応付けた情報テーブルと、情報データの識別情報と当該情報データに含まれる情報内容の特徴を示す特徴情報とを対応付けた特徴情報テーブルとを記憶する記憶部と、検索者による検索キーワードの入力を受け、当該検索キーワードを検索文章として出力する検索キーワード受付部と、前記検索キーワード受付部により出力された検索文章の特徴情報を生成する特徴情報生成部と、前記特徴情報テーブル内の各情報データの特徴情報から、所定の類似の条件を満たす、前記特徴情報生成部により生成された特徴情報と類似の特徴情報を選択し、選択した特徴情報に対応した情報データの識別情報を読み出す情報アクセス部と、前記情報テーブルから、前記情報アクセス部が読み出した情報データの識別情報により特定される情報データ内の一部の情報を表示用データとして取得し、取得した前記情報データの表示用データを画面に表示させる検索結果表示部と、前記検索結果表示部により前記表示用データを表示させた前記情報データのうち、検索者が選択した情報データの識別情報の入力を受ける選択情報受付部と、前記情報テーブルから、前記選択情報受付部により入力を受けた情報データの識別情報に対応した情報データを読み出して前記検索文章に付加し、前記特徴情報生成部へ出力する情報取得部とを備え、前記特徴情報生成部は、前記情報取得部から出力された検索文章の特徴情報を生成する、ことを特徴とする検索装置である。
また、本発明は、上述する検索装置であって、前記特徴情報は、キーワードであり、前記記憶部は、前記特徴情報テーブルとして、情報データの識別情報とキーワードとを対応付けたインデックステーブルを記憶し、前記検索文章を形態素解析する形態素解析部をさらに備え、前記特徴情報生成部は、前記形態素解析部による形態素解析の結果からキーワードを取得し、前記情報アクセス部は、前記インデックステーブルから、前記特徴情報生成部が取得したキーワードに対応する情報データの識別情報を読み出す、ことを特徴とする。
また、本発明は、上述する検索装置であって、前記検索結果表示部は、前記特徴情報生成部が取得したキーワードを前記画面に表示させることを特徴とする。
また、本発明は、上述する検索装置であって、前記特徴情報は、文章ベクトルであり、前記記憶部は、前記特徴情報テーブルとして、情報データの識別情報と当該情報データに含まれる文章の文章ベクトルとを対応付けた文章ベクトルテーブルを記憶し、前記検索文章を形態素解析する形態素解析部をさらに備え、前記特徴情報生成部は、前記形態素解析部による形態素解析の結果から前記検索文章の文章ベクトルを生成し、前記情報アクセス部は、前記文章ベクトルテーブル内の各文章ベクトルと、前記特徴情報生成部により生成された文章ベクトルとから類似度を算出し、算出した類似度が所定の類似の条件を満たす文章ベクトルに対応した情報データの識別情報を前記文章ベクトルテーブルから読み出す、ことを特徴とする。
また、本発明は、上述する検索装置であって、前記検索結果表示部は、前記文章ベクトルを構成する要素に対応した語句であって、前記検索文章に含まれる語句を前記画面に表示させることを特徴とする。
また、本発明は、上述する検索装置であって、検索結果表示部は、前記表示用データとして、前記情報データの最初から所定文字数分の文章データを取得する、ことを特徴とする。
また、本発明は、上述する検索装置であって、前記検索結果表示部は、表示用データを画面に表示させた情報データのうち、次の検索に用いる情報データを指定するためのチェックボックスをさらに前記画面に表示させる、ことを特徴とする。
また、本発明は、情報データと当該情報データの識別情報とを対応付けた情報テーブルと、情報データの識別情報と当該情報データに含まれる情報内容の特徴を示す特徴情報とを対応付けた特徴情報テーブルとを記憶する記憶部を備えた検索装置に用いられる検索方法であって、検索キーワード受付部が、検索者による検索キーワードの入力を受け、当該検索キーワードを検索文章として出力する検索キーワード受付過程と、特徴情報生成部が、前記検索キーワード受付過程により出力された検索文章の特徴情報を生成する特徴情報生成過程と、情報アクセス部が、前記特徴情報テーブル内の各情報データの特徴情報から、所定の類似の条件を満たす、前記特徴情報生成過程において生成された特徴情報と類似の特徴情報を選択し、選択した特徴情報に対応した情報データの識別情報を読み出す情報アクセス過程と、検索結果表示部が、前記情報テーブルから、前記情報アクセス過程において読み出した情報データの識別情報により特定される情報データ内の一部の情報を表示用データとして取得し、取得した前記情報データの表示用データを画面に表示させる検索結果表示過程と、選択情報受付部が、前記検索結果表示過程において前記表示用データを表示させた前記情報データのうち、検索者が選択した情報データの識別情報の入力を受ける選択情報受付過程と、情報取得部が、前記情報テーブルから、前記選択情報受付過程において入力を受けた情報データの識別情報に対応した情報データを読み出して前記検索文章に付加し、出力する情報取得過程とを有し、前記特徴情報取過程では、前記情報取得過程において出力された検索文章の特徴情報を生成し、前記情報アクセス過程からの処理を繰り返すことを特徴とする検索方法である。
また、本発明は、上述する検索方法であって、前記特徴情報は、キーワードであり、前記記憶部は、前記特徴情報テーブルとして、情報データの識別情報とキーワードとを対応付けたインデックステーブルを記憶し、前記検索文章を形態素解析する形態素解析過程をさらに有し、前記特徴情報生成過程においては、前記形態素解析過程における形態素解析の結果からキーワードを取得し、前記情報アクセス過程においては、前記インデックステーブルから、前記特徴情報生成過程において取得したキーワードに対応する情報データの識別情報を読み出す、ことを特徴とする。
また、本発明は、上述する検索方法であって、前記特徴情報は、文章ベクトルであり、前記記憶部は、前記特徴情報テーブルとして、情報データの識別情報と当該情報データに含まれる文章の文章ベクトルとを対応付けた文章ベクトルテーブルを記憶し、前記検索文章を形態素解析する形態素解析過程をさらに有し、前記特徴情報生成過程においては、前記形態素解析過程における形態素解析の結果から前記検索文章の文章ベクトルを生成し、前記情報アクセス過程においては、前記文章ベクトルテーブル内の各文章ベクトルと、前記特徴情報生成過程において生成された文章ベクトルとから類似度を算出し、算出した類似度が所定の類似の条件を満たす文書ベクトルに対応した情報データの識別情報を前記文章ベクトルテーブルから読み出す、ことを特徴とする。
また、本発明は、情報データと当該情報データの識別情報とを対応付けた情報テーブルと、情報データの識別情報と当該情報データに含まれる情報内容の特徴を示す特徴情報とを対応付けた特徴情報テーブルとを記憶する記憶部を備え、情報の検索装置として用いられるコンピュータを、検索者による検索キーワードの入力を受け、当該検索キーワードを検索文章として出力する検索キーワード受付部、前記検索キーワード受付部により出力された検索文章の特徴情報を生成する特徴情報生成部、前記特徴情報テーブル内の各情報データの特徴情報から、所定の類似の条件を満たす、前記特徴情報生成部により生成された特徴情報と類似の特徴情報を選択し、選択した特徴情報に対応した情報データの識別情報を読み出す情報アクセス部、前記情報テーブルから、前記情報アクセス部が読み出した情報データの識別情報により特定される情報データ内の一部の情報を表示用データとして取得し、取得した前記情報データの表示用データを画面に表示させる検索結果表示部、前記検索結果表示部により前記表示用データを表示させた前記情報データのうち、検索者が選択した情報データの識別情報の入力を受ける選択情報受付部、前記情報テーブルから、前記選択情報受付部により入力を受けた情報データの識別情報に対応した情報データを読み出して前記検索文章に付加し、前記特徴情報生成部へ出力する情報取得部として機能させ、前記特徴情報生成部に、前記情報取得部から出力された検索文章の特徴情報を生成するよう機能させる、ことを特徴とするコンピュータプログラムである。
また、本発明は、上述するコンピュータプログラムであって、前記特徴情報は、キーワードであり、前記記憶部は、前記特徴情報テーブルとして、情報データの識別情報とキーワードとを対応付けたインデックステーブルを記憶し、前記コンピュータを、前記検索文章を形態素解析する形態素解析部としてさらに機能させ、前記特徴情報生成部は、前記形態素解析部による形態素解析の結果からキーワードを取得し、前記情報アクセス部は、前記インデックステーブルから、前記特徴情報生成部が取得したキーワードに対応する情報データの識別情報を読み出す、ことを特徴とする。
また、本発明は、上述するコンピュータプログラムであって、前記特徴情報は、文章ベクトルであり、前記記憶部は、前記特徴情報テーブルとして、情報データの識別情報と当該情報データに含まれる文章の文章ベクトルとを対応付けた文章ベクトルテーブルを記憶し、前記特徴情報生成部は、前記形態素解析部による形態素解析の結果から前記検索文章の文章ベクトルを生成し、前記情報アクセス部は、前記文章ベクトルテーブル内の各文章ベクトルと、前記特徴情報生成部により生成された文章ベクトルとから類似度を算出し、算出した類似度が所定の類似の条件を満たす文書ベクトルに対応した情報データの識別情報を前記文章ベクトルテーブルから読み出す、ことを特徴とする。
所望の情報を検索するためのキーワードが思い浮かばない場合や、検索対象が曖昧な場合であっても、最初の検索キーワードによる検索結果から所望の情報に近い情報データを選択し、その選択した情報データの内容を次回以降の絞り込み検索に使用することができるため、所望の内容を含む情報データを検索結果として得ることができる。また、所望の検索分野の範囲内において、指定した検索キーワードの周辺情報についての内容を含む情報データや、想定していなかったキーワードについての内容を含む情報データを検索結果として取得することができる。また、1つのキーワードに複数の意味がある場合であっても、検索結果から所望の情報に近い情報データの内容を次回以降の絞り込み検索に使用することができるため、所望の情報に近い内容の情報データのみを検索結果として取得し、必要のない意味や分野に関する情報データを検索結果として取得しないようにすることができる。
以下、図面を参照して本発明の実施形態を説明する。
図1は、本発明の概要を説明するための図である。同図に示すように、まず、検索者は、検索キーワード(例えば、「○○について」)を入力し、この検索キーワードを用いた検索を要求する(ステップS1)。検索装置は、検索キーワードを検索文章として形態素解析した結果からキーワードを取得し、このキーワードによる検索結果として抽出された文章データの先頭の部分を一覧として表示する。検索者は、この一覧を確認し、意図する情報データが検索結果に含まれていなかった場合、意図する情報に少しでも近い情報データを選択して(ステップS2)、再び検索を要求する(ステップS3)。これにより、検索装置は絞込み検索を行うが、検索者が指定した情報データの内容をはじめの検索文章に追加し、その検索文章の形態素解析結果から得られるキーワードにより再検索を行う。これにより、意図する情報に近い情報データが検索結果として多く表示される。そして、検索者の所望の情報を含む情報データが検索結果として表示されるまで、意図する情報に少しでも近い情報データを選択して再検索を要求することを繰り返す(ステップS4)。なお、検索結果に併せて、検索文章から得られたキーワードを表示させるようにすることもできる。
本実施形態においては、上記のような検索を対話型検索と記載する。このような対話型検索では、検索者からの検索要求に対する一次回答を出力し、その結果からさらに検索者が検索要求を行なった検索結果を出力する、というような検索者と検索装置との間の要求・回答のやり取りを数回繰り返すことにより、対話的に絞りこみを行い、検索者が意図する情報を数回の検索により検索することが可能となる。
[第1の実施形態]
図2は、本発明の第1の形態による検索装置1の機能ブロック図であり、本発明と関係する機能ブロックのみ抽出して示してある。同図において、検索装置1は、1台または複数台のコンピュータ装置等により構成することができ、検索対象の情報に関するデータを格納する情報DB(データベース)30と、ユーザからクエリ(検索要求)を受けるユーザインタフェース部10と、情報DB30にクエリを出力する検索実行部20とを備える。
情報DB30は、情報テーブルと特徴情報テーブルとを記憶する。情報テーブルは、情報データと、当該情報データの識別であるインデックスとを対応付けた情報を示す。特徴情報テーブルは、各情報データの特徴を示す特徴情報を記憶する。ここでは、特徴情報テーブルとして、キーワードと、当該キーワードに関する内容が情報として含まれる情報データのインデックスとを対応づけた情報を示すインデックステーブルを記憶するものとする。
ユーザインタフェース部10は、検索文章受付部11、情報取得部12、及び、検索結果表示部13を備え、検索者の端末装置により実現されるが、検索者の端末装置と接続されるサーバ等により実現することもできる。
検索文章受付部11は、自身の備える、あるいは、ネットワークを介して接続される端末装置のキーボードやマウスなどの入力手段により入力された、検索に使用する検索キーワードや、情報データのインデックスの入力を受ける。
情報取得部12は、検索文章受付部11が入力を受けたインデックスにより特定される情報データを情報DB30から読み出し、検索キーワードとともに検索実行部20に出力し、検索を要求する。
検索結果表示部13は、検索実行部20から検索結果として情報データのインデックスを受信し、当該インデックスにより特定される情報データの先頭から所定文字数分、例えば、200文字分程度の内容の文章データを抽出したものである表示用データを情報DB30から読み出し、この表示用データを表示するための検索結果表示画面を、自身の備える、あるいは、ネットワークを介して接続される端末装置のディスプレイに出力する。
検索実行部20は、形態素解析部21、キーワード取得部22、及び情報DBアクセス部23を備える。形態素解析部21は、ユーザインタフェース部10から受信した検索キーワードや、情報データを形態素解析する。キーワード取得部22は、形態素解析部21による形態素解析の結果から、キーワードを取得する。情報DBアクセス部23は、キーワード取得部22により得られたキーワードにより情報DB30を検索し、検索結果として得られた情報データのインデックスを返送する。
次に、情報DB30に記憶される各データテーブルについて説明する。
図3は、情報DB30に記憶される情報テーブルの例を示す図である。同図において、情報テーブルは、情報データと、当該情報データを一意に識別する情報であるインデックス(Index)とを対応づけて記憶する。なお、情報データには、情報内容の文章データだけではなく、静止画、動画などの画像データや、表示スタイルなどの他のデータが含まれていてもよい。同図においてインデックスには、通番を使用しているが、文字列(「A11」、「B13」等)や、ハッシュ値(「loi83n」や「o98ahy」等)など、各情報データを一意に特定可能であれば任意のものが使用可能である。
図4は、情報DB30に記憶されるインデックステーブルの例を示す図である。同図において、インデックステーブルは、キーワードと、当該キーワードが含まれている情報データのインデックスとを対応づけて記憶する。このキーワードは、検索実行部20がユーザインタフェース部10から検索要求として受信した検索キーワードや情報データから得られる語句に対応する。同図においては、「最新」という言葉が、インデックス1、2、3、…により特定される情報データに含まれていることを示す。
続いて、検索装置1の処理について説明する。
図5は、検索装置1の全体処理フローを示す。同図において、まず、検索者は検索サイトにアクセスすると、検索装置1へ検索キーワードを入力し、検索ボタンを押す。これにより、検索装置1のユーザインタフェース部10は、入力された検索キーワードの情報と、検索要求の入力を受ける(ステップS110)。ユーザインタフェース部10は、検索キーワードの情報を検索実行部20に送信し、検索を要求する。
検索実行部20は、受信した検索キーワードを形態素解析し、その形態素解析の結果をキーワードとして取得する。検索実行部20は、情報DB30が記憶しているインデックステーブルを検索し、取得したキーワードに対応したインデックスを読み出す(ステップS120)。ユーザインタフェース部10は、情報DB30が記憶している情報テーブルを検索し、検索実行部20が読み出したインデックスにより情報データを特定すると、その特定した情報データから、先頭より所定文字数分の情報内容の文章データを表示用データとして取得する。ユーザインタフェース部10は、検索実行部20から受信したインデックスそれぞれについて取得した表示用データと、検索実行部20において取得したキーワードとを表示するための検索結果表示画面を出力する(ステップS130)。
検索者は、ステップS130において出力された検索結果表示画面を確認し、所望の情報がないと判断した場合は(ステップS140:NO)、検索結果表画面に表示されている表示用データの内容に基づいて、最も所望の情報に近い情報データを選択し、検索を要求する(ステップS150)。ユーザインタフェース部10は、最初に入力された検索キーワードに、ステップS150において選択された情報データのインデックスにより特定される情報データを付加して検索実行部20に出力し、検索を要求する(ステップS160)。これにより、検索実行部20は、ステップS120からの処理を繰り返す。すなわち、検索実行部20は、ユーザインタフェース部10から受信した検索キーワード及び情報データを形態素解析し、その形態素解析の結果をキーワードとして取得する。検索実行部20は、情報DB30が記憶しているインデックステーブルを検索し、取得したキーワードに対応したインデックスを読み出す。ユーザインタフェース部10は、この読み出されたインデックスにより特定される情報データから表示用データを抽出し、抽出した表示用データと、キーワードとを表示するための検索結果表示画面を出力する。
そして、所望の情報が得られた場合(ステップS140:YES)、検索処理を終了する。
図6は、検索装置1のユーザインタフェース部10における処理フローを示す。
同図において、まず、検索者は、キーボードなどの入力手段により、検索サイトのアドレスを入力する。これにより、ユーザインタフェース部10は、検索キーワードを入力するための検索キーワード入力フィールドと検索ボタンとを表示するための検索画面をディスプレイに出力する。検索者は、検索キーワード入力フィールドに検索キーワードを入力し、検索ボタンを押す。これにより、ユーザインタフェース部10の検索文章受付部11は、検索キーワードと、検索要求の入力を受ける(ステップS210)。この検索キーワードを示す検索文章データを検索文章(A)とする。情報取得部12は、検索文章(A)を検索実行部20に送信し、検索を要求する(ステップS220)。
検索結果表示部13は、ステップS220によって要求した検索の結果の情報として、検索実行部20から情報データのインデックスと、当該情報データの表示の優先度と、検索文章(A)から得られたキーワードとの情報を受信する。なお、検索の結果の情報内におけるインデックスの記載順を優先度の情報としてもよい。検索結果表示部13は、受信したインデックスにより、情報DB30に記憶している情報テーブルを検索し、当該インデックスそれぞれに対応した情報データを特定すると、特定した情報データから先頭より所定文字数分、ここでは、200文字程度の情報内容の文章データを表示用データとして取得する(ステップS230)。検索結果表示部13は、情報データの表示の優先度に従って、当該情報データから取得した表示用データを表示するとともに、検索実行部20から受信したキーワード、情報データを選択するためのチェックボックス、ステップS210において受信した検索キーワードがデフォルトで表示される検索キーワード入力フィールド、及び、検索ボタンを表示するための検索結果表示画面をディスプレイに出力する(ステップS240)。
検索者は、ステップS240において出力された検索結果表示画面の表示用データの内容を確認し、所望の情報がないと判断した場合は、最も所望の情報に近い情報データに対応するチェックボックスにマウスによりチェックを入れ、検索ボタンを押す。これにより、検索文章受付部11は、検索キーワードと、チェックされた情報データのインデックスの入力を受ける(ステップS250:YES)。検索文章受付部11は、入力されたインデックスにより情報DB30が記憶している情報テーブルを検索し、当該インデックスに対応した情報データを読み出す(ステップS260)。検索文章受付部11は、情報DB30から取得した情報データの全文データ(B)を、現在の検索文章(A)に追加し、新たな検索文章(A)とする(ステップS270)。このとき、検索文章受付部11は、情報データに情報内容として含まれている文章データ以外のデータ、例えば、静止画、動画や表示スタイルの情報が含まれている場合は、文章データ以外のデータを削除したデータを全文データ(B)として追加する。ユーザインタフェース部10は、検索文章(A)を検索実行部20に送信して検索を要求するステップS220からの処理を繰り返す。
そして、ステップS220からの処理を繰り返し、ステップS240において検索結果表示画面を出力した結果として、検索要求が受信されない場合は(ステップS250:NO)、処理を終了する。
なお、検索結果表示画面には、検索結果として得られた情報データの表示要求を行うためのボタンやリンク等がさらに含まれる。例えば、表示用データの文字表示自体を情報データのリンクとする。検索者は、内容を確認したい情報データの先頭部分(表示用データ)の文字表示をマウスによりクリックすると、ユーザインタフェース部10は、選択された情報データのインデックスと、表示要求とを受信する。情報取得部12は、受信したインデックスに対応した情報データを情報DB30に記憶されている情報テーブルから読み出し、ディスプレイに出力する。検索の途中において、適宜、情報データの表示要求を受け、要求された情報データを出力することもできる。
また、ステップS240において、検索結果表示画面を表示させる際に、以前にチェックされた情報データに対応したチェックボックスにデフォルトでチェックを入れて表示させるようにしてもよい。
また、上記においては、検索結果表示部13は、受信したインデックスに対応した情報データから先頭より所定文字数分の情報内容の文章データを表示用データとして取得しているが、画像データや、キーワードが含まれる所定文字数分の情報内容の文章データなどを表示用データとして取得してもよい。
図7は、検索装置1の検索実行部20における処理フローを示す。
検索実行部20の形態素解析部21は、図6のステップS220においてユーザインタフェース部10から出力された検索文章(A)を受信すると、受信した検索文章(A)の形態素解析を行なう。キーワード取得部22は、形態素解析部21による形態素解析の結果から、重複した言葉を除いてキーワードを取得する(ステップS310)。このとき、例えば名詞、動詞、形容詞、副詞など、所定の品詞のみをキーワードとして選択するようにしてもよい。情報DBアクセス部23は、情報DB30が記憶しているインデックステーブルを検索し、各キーワードに対応したインデックスのリストを返送する。情報DBアクセス部23は、予め決められた任意のルールに従って読み出した各インデックスに表示の優先度を付与する(ステップS320)。例えば、受信したインデックスがいくつのキーワードに対応して読み出されたかをカウントし、その数が多い順に表示の優先度を高くするようにしてもよい。また、例えば、最初に入力された検索キーワードを形態素解析して得たキーワードに対応して読み出されたインデックスの優先度を高くするようにしてもよい。情報DBアクセス部23は、読み出したインデックスと、当該インデックスの表示の優先度と、ステップS310において取得したキーワードとの情報をユーザインタフェース部10に返送する(ステップS330)。
図8は、検索の具体的な例を示す図である。
検索者が要求するキーワードに複数の意味が含まれるような場合、そのキーワードを入力してしまうと、本来の意図とは外れた検索結果が得られることがある。例えば、最新のインターネット技術について調べたい場合で、特に、アプリケーション系の技術においてどのようなものがあるかを検索したいときに、「アプリケーション」を検索キーワードとして使用すると、取得可能な情報が限定されてしまう。
そこで、まず検索者は、「最新」、「インターネット」、「技術」を検索キーワードとして検索を行い、検索結果を得る(図8(a))。初回の検索の結果では、「最新」というキーワードを用いたにもかかわらず、最新とはいえない内容の情報データが含まれていたり、アプリケーション系とは関連が少ないルータやスイッチの情報などが含まれていたりする。また、検索者が所望しない、学校や書籍などの紹介ページなどが含まれる場合もある。
そこで、検索者は、アプリケーション系の技術的な内容が含まれている情報データに対応したチェックボックスをチェックして再び検索を要求する。このように、「アプリケーション」という用語自体をキーワードとして用いるのではなく、選択した情報データの内容が追加キーワードとして使用されるため、「アプリケーション」に属する「PKI」(Public Key Infrastructure:公開鍵暗号基盤)、「SaaS」、「Web2.0」、「SQL」、「Firewall」、「Socket」、…などの技術キーワードが情報データの検索に使用されることになる(図8(b))。従って、よりユーザの意図に即した分野に絞り込んだ情報が示される(図8(c))。
例えば、従来のように、「最新」、「インターネット」、「技術」、「アプリケーション」のようなキーワードを入れた場合には、検索結果として得られる情報には、「アプリケーション」という言葉が入っておらねばならず、「PKI」、「SaaS」、…などについて純粋に1つの技術について記述されている情報は検索結果として得ることはできない。一方、本実施の形態によれば、「アプリケーション系の技術」といった漠然とした意図であっても、「PKI」、「SaaS」、…など具体的な用語が含まれる情報データが検索結果として得られる。このように、「アプリケーション」というキーワードに含まれる意味的な要素がキーワードとして選択されるため、情報範囲を狭めることなく、ユーザの意図に近しい検索結果を得ることができるとともに、検索者の知識にはない用語をキーワードとして検索した結果を得ることができる。
[第2の実施形態]
本発明の第2の実施形態について説明する。上述した第1の実施形態では、キーワードを使用して情報データを検索しているが、本実施形態では、検索文章との類似度を使用して情報データを検索する。比較的、長文からなる自然文のような質問を与えて、文章と検索質問との内容的な類似性の比較を行う文章検索としては、一般的にベクトル空間モデルを用いた文章検索が使用されている。本実施形態ではこの技術を文章間の類似度の判定に適用する。以下、第1の実施形態との差分について記載する。
図9は、本発明の第2の実施形態による検索装置1aの構成を示すブロック図である。この図において、図2に示す第1の実施形態による検索装置1と同一の部分には同一の符号を付し、その説明を省略する。この図に示す検索装置1aが検索装置1と異なる点は、検索実行部20の代わりに、形態素解析部21と、情報DBアクセス部23aと、文章ベクトル計算部24を有する検索実行部20aが、情報DB30の代わりに情報DB30aが備えられている点である。
情報DB30aは、情報テーブルと、特徴情報テーブルとを記憶する。情報テーブルは、第1の実施形態と同様である。特徴情報テーブルは、各情報データの特徴を示す情報である特徴情報を記憶するが、ここでは、特徴情報テーブルとして、各情報データの文章ベクトルを示す文章ベクトルテーブルを記憶するものとする。
文章ベクトル計算部24は、ユーザインタフェース部10から受信した検索キーワード、及び、情報データからなる検索文章(A)の特徴を示す文章ベクトルを、形態素解析部21による当該検索文章(A)の形態素解析結果を用いて生成する。情報DBアクセス部23aは、文章ベクトル計算部24により生成された文章ベクトルと、情報DB30aに記憶されている文章ベクトルテーブルにより示される各情報データの文章ベクトルとに基づいて、類似する情報データを特定する。
図10は、情報DB30aに記憶されている文章ベクトルテーブルの例を示す図である。文章ベクトルテーブルは、インデックスと、当該インデックスにより特定される情報データの特徴情報としての文章ベクトルとを対応づけて記憶する。
ここで、具体的な出現頻度方式(TF)を使用した文章ベクトルの例を説明する。出現頻度方式(TF)では、複数(DN個)の文書からなる文書群がある場合に、ある文書中にある単語w(キーワード)が出現する数を示すTF(w)値と、文書群の中でその単語wが含まれている文書数を示すDF(w)値とを用いて、当該文書における単語wのTF−IDF値をTF(w)×log(DN/DF(w))により算出する。各文書の文章ベクトルは、各単語のTF−IDF値を要素として表される。
そこで、情報テーブルに登録されている各情報データから形態素解析等により文章データに含まれる単語を抽出し、抽出した単語のうちキーワードとすべき単語、例えば、名詞、動詞、形容詞、副詞など、所定の品詞の単語のみを選択する。なお、予め決められた語句をキーワードとして用いてもよい。そして、各キーワードのDF値と、情報データそれぞれの各キーワードのTF値とから、情報データそれぞれの各キーワードのTF−IDF値を算出し、当該情報データについて算出した各キーワードのTF−IDF値を要素とした各情報データの文章ベクトルを生成する。文書群の数DNは、情報テーブルに記憶されている情報データの個数とすることができる。なお、比較する情報データの文章ベクトル同士のなす角が近いほど、それらの情報データが類似していることを表す。
続いて、検索装置1aの処理について説明する。検索装置1aの全体処理フロー、ユーザインタフェース部10の処理フローは、それぞれ、図5に示す第1の実施形態の全体処理フロー、図6に示す第1の実施形態のユーザインタフェース部10の処理フローと同様である。
図11は、検索装置1aの検索実行部20aにおける処理フローを示す図であり、図7の処理フローに代わりに実行される。
検索実行部20aの形態素解析部21は、図6のステップS220においてユーザインタフェース部10から出力された検索文章(A)を受信すると、受信した検索文章(A)の形態素解析を行なう(ステップS410)。
文章ベクトル計算部24は、形態素解析部21による形態素解析の結果から、各キーワードの出現頻度を計測する。このキーワードとは、文章ベクトルテーブルに登録されている文章ベクトルを生成したときに使用したキーワードであり、予め、検索実行部20aの備える記憶手段に記憶されているか、情報DB30aから読み出すものとする。文章ベクトル計算部24は、計測した各キーワードの出現頻度を用いて検索文章(A)の文章ベクトルを生成する(ステップS420)。具体的には、検索実行部20aの記憶手段または情報DB30aに記憶されている文書群の数DN、及び、各キーワードのDF値と、検索文章(A)についての各キーワードの計測数であるTF値とから、各キーワードのTF−IDF値を算出し、算出した各キーワードのTF−IDF値を要素とした文章ベクトルを生成する。
情報DBアクセス部23aは、情報DB30aに記憶されている文章ベクトルテーブル内の各情報データの文章ベクトルと、検索文章(A)の文章ベクトルとを比較して、類似度の高い文章ベクトルに対応したインデックスを読み出す。つまり、情報DBアクセス部23aは、文章ベクトルテーブルから文章ベクトルを順に読み出し、読み出した文章ベクトルと、検索文章(A)の文章ベクトルとが成す角を類似度とするか、あるいは、既存の一般的な類似度算出式(文章ベクトル同士の成す角を用いたものもある)を用いて類似度を算出する。そして、類似度が高い順に所定数の文章ベクトルを選択するか、予め決められた所定の閾値より類似度が高い文章ベクトルを選択する。情報DBアクセス部23aは、選択した文章ベクトルに対応したインデックスを文章ベクトルテーブルから読み出す。そして、類似度が高い順にインデックスの表示の優先度を高くする(ステップS430)。情報DBアクセス部23aは、読み出したインデックスと、当該インデックスの表示の優先度の情報をユーザインタフェース部10に返送する(ステップS440)。このとき、情報DBアクセス部23aは、文章ベクトル生成部24において、検索文章(A)に出現するとして計測されたキーワードを併せてユーザインタフェース部10に返送する。
図6のステップS230において、ユーザインタフェース部10は、ステップS220によって要求した検索の結果として、図11のステップS440において検索実行部20aから返送された、情報データのインデックスと、当該情報データの表示の優先度と、キーワードとの情報を受信することになる。
なお、上記においては、特徴情報として文章ベクトルを使用しているが、文章の特徴を示し、当該特徴情報を用いて文書間の類似度を算出可能な情報であれば、任意のものを使用することができる。従って、上述した出現頻度方式(TF)以外にも、他の既存の文書間の類似度の判定方法を用いることができる。
上述した本発明の実施形態によれば、所望の情報を検索するためのキーワードが思い浮かばない場合や、検索対象が曖昧な場合であっても、最初の検索キーワードによる検索結果から所望の情報に近い情報データの内容を次回以降の絞り込み検索に使用することができるため、所望の内容を含む情報データを検索結果として得ることができる。また、所望の検索分野の範囲内において、指定した検索キーワードの周辺情報についての内容を含む情報データや、想定していなかったキーワードについての内容を含む情報データを検索結果として取得することができる。また、1つのキーワードに複数の意味がある場合であっても、検索結果から所望の情報に近い情報データの内容を次回以降の絞り込み検索に使用することができるため、所望の情報に近い内容の情報データのみを検索結果として取得し、必要のない意味や分野に関する情報データを検索結果として取得しないようにすることができる。
なお、検索装置1、1aは、内部にコンピュータシステムを有している。そして、上述したユーザインタフェース部10、検索実行部20、20aの動作の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータシステムが読み出して実行することによって、上記処理が行われる。ここでいうコンピュータシステムとは、CPUや各種メモリ、OSや周辺機器等のハードウェアを含むものである。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
本発明の概要を説明するための図である。 第1の実施形態による検索装置の機能ブロック図である。 同実施形態による情報テーブルのデータ構成例を示す図である。 同実施形態によるインデックステーブルのデータ構成例を示す図である。 同実施形態による検索装置の処理フローである。 同実施形態によるユーザインタフェース部の処理フローである。 同実施形態による検索実行部の設定例を示す図である。 同実施形態による検索例を示す図である。 第2の実施形態による検索装置の機能ブロック図である。 同実施形態による文章ベクトルテーブルのデータ構成例を示す図である。 同実施形態による検索実行部の処理フローを示す図である。
符号の説明
1、1a…検索装置
10…ユーザインタフェース部
11…検索文章受付部(検索キーワード受付部、選択情報受付部)
12…情報取得部
13…検索結果表示部
20、20a…検索実行部
21…形態素解析部
22、22a…情報DBアクセス部(情報アクセス部)
23…キーワード取得部(特徴情報生成部)
24…文章ベクトル計算部(特徴情報生成部)
30、30a…情報DB(記憶部)

Claims (13)

  1. 情報データと当該情報データの識別情報とを対応付けた情報テーブルと、情報データの識別情報と当該情報データに含まれる情報内容の特徴を示す特徴情報とを対応付けた特徴情報テーブルとを記憶する記憶部と、
    検索者による検索キーワードの入力を受け、当該検索キーワードを検索文章として出力する検索キーワード受付部と、
    前記検索キーワード受付部により出力された検索文章の特徴情報を生成する特徴情報生成部と、
    前記特徴情報テーブル内の各情報データの特徴情報から、所定の類似の条件を満たす、前記特徴情報生成部により生成された特徴情報と類似の特徴情報を選択し、選択した特徴情報に対応した情報データの識別情報を読み出す情報アクセス部と、
    前記情報テーブルから、前記情報アクセス部が読み出した情報データの識別情報により特定される情報データ内の一部の情報を表示用データとして取得し、取得した前記情報データの表示用データを画面に表示させる検索結果表示部と、
    前記検索結果表示部により前記表示用データを表示させた前記情報データのうち、検索者が選択した情報データの識別情報の入力を受ける選択情報受付部と、
    前記情報テーブルから、前記選択情報受付部により入力を受けた情報データの識別情報に対応した情報データを読み出して前記検索文章に付加し、前記特徴情報生成部へ出力する情報取得部とを備え、
    前記特徴情報生成部は、前記情報取得部から出力された検索文章の特徴情報を生成する、
    ことを特徴とする検索装置。
  2. 前記特徴情報は、キーワードであり、
    前記記憶部は、前記特徴情報テーブルとして、情報データの識別情報とキーワードとを対応付けたインデックステーブルを記憶し、
    前記検索文章を形態素解析する形態素解析部をさらに備え、
    前記特徴情報生成部は、前記形態素解析部による形態素解析の結果からキーワードを取得し、
    前記情報アクセス部は、前記インデックステーブルから、前記特徴情報生成部が取得したキーワードに対応する情報データの識別情報を読み出す、
    ことを特徴とする請求項1に記載の検索装置。
  3. 前記検索結果表示部は、前記特徴情報生成部が取得したキーワードを前記画面に表示させることを特徴とする請求項2に記載の検索装置。
  4. 前記特徴情報は、文章ベクトルであり、
    前記記憶部は、前記特徴情報テーブルとして、情報データの識別情報と当該情報データに含まれる文章の文章ベクトルとを対応付けた文章ベクトルテーブルを記憶し、
    前記検索文章を形態素解析する形態素解析部をさらに備え、
    前記特徴情報生成部は、前記形態素解析部による形態素解析の結果から前記検索文章の文章ベクトルを生成し、
    前記情報アクセス部は、前記文章ベクトルテーブル内の各文章ベクトルと、前記特徴情報生成部により生成された文章ベクトルとから類似度を算出し、算出した類似度が所定の類似の条件を満たす文章ベクトルに対応した情報データの識別情報を前記文章ベクトルテーブルから読み出す、
    ことを特徴とする請求項1に記載の検索装置。
  5. 前記検索結果表示部は、前記文章ベクトルを構成する要素に対応した語句であって、前記検索文章に含まれる語句を前記画面に表示させることを特徴とする請求項4に記載の検索装置。
  6. 検索結果表示部は、前記表示用データとして、前記情報データの最初から所定文字数分の文章データを取得する、
    ことを特徴とする請求項1から請求項5のいずれかの項に記載の検索装置。
  7. 前記検索結果表示部は、表示用データを画面に表示させた情報データのうち、次の検索に用いる情報データを指定するためのチェックボックスをさらに前記画面に表示させる、
    ことを特徴とする請求項1から請求項6のいずれかの項に記載の検索装置。
  8. 情報データと当該情報データの識別情報とを対応付けた情報テーブルと、情報データの識別情報と当該情報データに含まれる情報内容の特徴を示す特徴情報とを対応付けた特徴情報テーブルとを記憶する記憶部を備えた検索装置に用いられる検索方法であって、
    検索キーワード受付部が、検索者による検索キーワードの入力を受け、当該検索キーワードを検索文章として出力する検索キーワード受付過程と、
    特徴情報生成部が、前記検索キーワード受付過程により出力された検索文章の特徴情報を生成する特徴情報生成過程と、
    情報アクセス部が、前記特徴情報テーブル内の各情報データの特徴情報から、所定の類似の条件を満たす、前記特徴情報生成過程において生成された特徴情報と類似の特徴情報を選択し、選択した特徴情報に対応した情報データの識別情報を読み出す情報アクセス過程と、
    検索結果表示部が、前記情報テーブルから、前記情報アクセス過程において読み出した情報データの識別情報により特定される情報データ内の一部の情報を表示用データとして取得し、取得した前記情報データの表示用データを画面に表示させる検索結果表示過程と、
    選択情報受付部が、前記検索結果表示過程において前記表示用データを表示させた前記情報データのうち、検索者が選択した情報データの識別情報の入力を受ける選択情報受付過程と、
    情報取得部が、前記情報テーブルから、前記選択情報受付過程において入力を受けた情報データの識別情報に対応した情報データを読み出して前記検索文章に付加し、出力する情報取得過程とを有し、
    前記特徴情報取過程では、前記情報取得過程において出力された検索文章の特徴情報を生成し、
    前記情報アクセス過程からの処理を繰り返すことを特徴とする検索方法。
  9. 前記特徴情報は、キーワードであり、
    前記記憶部は、前記特徴情報テーブルとして、情報データの識別情報とキーワードとを対応付けたインデックステーブルを記憶し、
    前記検索文章を形態素解析する形態素解析過程をさらに有し、
    前記特徴情報生成過程においては、前記形態素解析過程における形態素解析の結果からキーワードを取得し、
    前記情報アクセス過程においては、前記インデックステーブルから、前記特徴情報生成過程において取得したキーワードに対応する情報データの識別情報を読み出す、
    ことを特徴とする請求項8に記載の検索方法。
  10. 前記特徴情報は、文章ベクトルであり、
    前記記憶部は、前記特徴情報テーブルとして、情報データの識別情報と当該情報データに含まれる文章の文章ベクトルとを対応付けた文章ベクトルテーブルを記憶し、
    前記検索文章を形態素解析する形態素解析過程をさらに有し、
    前記特徴情報生成過程においては、前記形態素解析過程における形態素解析の結果から前記検索文章の文章ベクトルを生成し、
    前記情報アクセス過程においては、前記文章ベクトルテーブル内の各文章ベクトルと、前記特徴情報生成過程において生成された文章ベクトルとから類似度を算出し、算出した類似度が所定の類似の条件を満たす文書ベクトルに対応した情報データの識別情報を前記文章ベクトルテーブルから読み出す、
    ことを特徴とする請求項8に記載の検索方法。
  11. 情報データと当該情報データの識別情報とを対応付けた情報テーブルと、情報データの識別情報と当該情報データに含まれる情報内容の特徴を示す特徴情報とを対応付けた特徴情報テーブルとを記憶する記憶部を備え、情報の検索装置として用いられるコンピュータを、
    検索者による検索キーワードの入力を受け、当該検索キーワードを検索文章として出力する検索キーワード受付部、
    前記検索キーワード受付部により出力された検索文章の特徴情報を生成する特徴情報生成部、
    前記特徴情報テーブル内の各情報データの特徴情報から、所定の類似の条件を満たす、前記特徴情報生成部により生成された特徴情報と類似の特徴情報を選択し、選択した特徴情報に対応した情報データの識別情報を読み出す情報アクセス部、
    前記情報テーブルから、前記情報アクセス部が読み出した情報データの識別情報により特定される情報データ内の一部の情報を表示用データとして取得し、取得した前記情報データの表示用データを画面に表示させる検索結果表示部、
    前記検索結果表示部により前記表示用データを表示させた前記情報データのうち、検索者が選択した情報データの識別情報の入力を受ける選択情報受付部、
    前記情報テーブルから、前記選択情報受付部により入力を受けた情報データの識別情報に対応した情報データを読み出して前記検索文章に付加し、前記特徴情報生成部へ出力する情報取得部として機能させ、
    前記特徴情報生成部に、前記情報取得部から出力された検索文章の特徴情報を生成するよう機能させる、
    ことを特徴とするコンピュータプログラム。
  12. 前記特徴情報は、キーワードであり、
    前記記憶部は、前記特徴情報テーブルとして、情報データの識別情報とキーワードとを対応付けたインデックステーブルを記憶し、
    前記コンピュータを、前記検索文章を形態素解析する形態素解析部としてさらに機能させ、
    前記特徴情報生成部は、前記形態素解析部による形態素解析の結果からキーワードを取得し、
    前記情報アクセス部は、前記インデックステーブルから、前記特徴情報生成部が取得したキーワードに対応する情報データの識別情報を読み出す、
    ことを特徴とする請求項11に記載のコンピュータプログラム。
  13. 前記特徴情報は、文章ベクトルであり、
    前記記憶部は、前記特徴情報テーブルとして、情報データの識別情報と当該情報データに含まれる文章の文章ベクトルとを対応付けた文章ベクトルテーブルを記憶し、
    前記特徴情報生成部は、前記形態素解析部による形態素解析の結果から前記検索文章の文章ベクトルを生成し、
    前記情報アクセス部は、前記文章ベクトルテーブル内の各文章ベクトルと、前記特徴情報生成部により生成された文章ベクトルとから類似度を算出し、算出した類似度が所定の類似の条件を満たす文書ベクトルに対応した情報データの識別情報を前記文章ベクトルテーブルから読み出す、
    ことを特徴とする請求項11に記載のコンピュータプログラム。
JP2008222064A 2008-08-29 2008-08-29 検索装置及び方法、ならびに、コンピュータプログラム Active JP5246932B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008222064A JP5246932B2 (ja) 2008-08-29 2008-08-29 検索装置及び方法、ならびに、コンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008222064A JP5246932B2 (ja) 2008-08-29 2008-08-29 検索装置及び方法、ならびに、コンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2010055518A true JP2010055518A (ja) 2010-03-11
JP5246932B2 JP5246932B2 (ja) 2013-07-24

Family

ID=42071335

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008222064A Active JP5246932B2 (ja) 2008-08-29 2008-08-29 検索装置及び方法、ならびに、コンピュータプログラム

Country Status (1)

Country Link
JP (1) JP5246932B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015225657A (ja) * 2014-05-27 2015-12-14 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 対話型検索方法および装置
JPWO2021210210A1 (ja) * 2020-04-15 2021-10-21

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002049638A (ja) * 2000-05-26 2002-02-15 Fujitsu Ltd 文書情報検索装置、方法、文書情報検索プログラム及び文書情報検索プログラムを格納したコンピュータ可読の記録媒体
JP2003256471A (ja) * 2002-02-22 2003-09-12 Internatl Business Mach Corp <Ibm> 検索システム、システム、端末、検索方法およびプログラム
JP2003281183A (ja) * 2002-03-20 2003-10-03 Fuji Xerox Co Ltd 文書情報検索装置、文書情報検索方法及び文書情報検索プログラム
JP2004152102A (ja) * 2002-10-31 2004-05-27 Casio Comput Co Ltd 情報表示装置および情報表示処理プログラム
JP2006178599A (ja) * 2004-12-21 2006-07-06 Fuji Xerox Co Ltd 文書検索装置および方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002049638A (ja) * 2000-05-26 2002-02-15 Fujitsu Ltd 文書情報検索装置、方法、文書情報検索プログラム及び文書情報検索プログラムを格納したコンピュータ可読の記録媒体
JP2003256471A (ja) * 2002-02-22 2003-09-12 Internatl Business Mach Corp <Ibm> 検索システム、システム、端末、検索方法およびプログラム
JP2003281183A (ja) * 2002-03-20 2003-10-03 Fuji Xerox Co Ltd 文書情報検索装置、文書情報検索方法及び文書情報検索プログラム
JP2004152102A (ja) * 2002-10-31 2004-05-27 Casio Comput Co Ltd 情報表示装置および情報表示処理プログラム
JP2006178599A (ja) * 2004-12-21 2006-07-06 Fuji Xerox Co Ltd 文書検索装置および方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015225657A (ja) * 2014-05-27 2015-12-14 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 対話型検索方法および装置
JPWO2021210210A1 (ja) * 2020-04-15 2021-10-21
WO2021210210A1 (ja) * 2020-04-15 2021-10-21 株式会社島津製作所 文書検索装置、文書検索システムおよび文書検索方法

Also Published As

Publication number Publication date
JP5246932B2 (ja) 2013-07-24

Similar Documents

Publication Publication Date Title
JP5662961B2 (ja) レビュー処理方法およびシステム
Kraft et al. Y! q: contextual search at the point of inspiration
JP5074378B2 (ja) クエリ用語および返答用語を含む情報ソースからのスニペットを有するファクトクエリエンジンのユーザインタフェース
US8001135B2 (en) Search support apparatus, computer program product, and search support system
US8200695B2 (en) Database for uploading, storing, and retrieving similar documents
JP6014725B2 (ja) 単文/複文構造の自然言語クエリに対する検索および情報提供方法並びにシステム
US20090254540A1 (en) Method and apparatus for automated tag generation for digital content
EP1225517A2 (en) System and methods for computer based searching for relevant texts
KR20160149978A (ko) 검색 엔진 및 그의 구현 방법
JP2016045652A (ja) 質問文生成装置及びコンピュータプログラム
CN111417940A (zh) 支持复杂答案的证据搜索
US10783192B1 (en) System, method, and user interface for a search engine based on multi-document summarization
WO2018019289A1 (zh) 基于结构化网络知识自动生成中文本体库的方法、系统、计算机设备和计算机可读介质
Strzelecki et al. Direct answers in Google search results
US9152698B1 (en) Substitute term identification based on over-represented terms identification
Li et al. Infographics retrieval: A new methodology
JP5246932B2 (ja) 検索装置及び方法、ならびに、コンピュータプログラム
Bakar The development of an integrated corpus for Malay language
JP4499179B1 (ja) 端末装置
JP2002024262A (ja) 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体
JP4755834B2 (ja) 属性評価装置、属性評価方法および属性評価プログラム
JP2004246422A (ja) 情報検索支援装置
JP6985181B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP2014191777A (ja) 語義解析装置、及びプログラム
JP2010282403A (ja) 文書検索方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130408

R150 Certificate of patent or registration of utility model

Ref document number: 5246932

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160419

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250