JP2007164462A - 質問応答システム、質問応答方法及び質問応答プログラム - Google Patents

質問応答システム、質問応答方法及び質問応答プログラム Download PDF

Info

Publication number
JP2007164462A
JP2007164462A JP2005359661A JP2005359661A JP2007164462A JP 2007164462 A JP2007164462 A JP 2007164462A JP 2005359661 A JP2005359661 A JP 2005359661A JP 2005359661 A JP2005359661 A JP 2005359661A JP 2007164462 A JP2007164462 A JP 2007164462A
Authority
JP
Japan
Prior art keywords
answer candidate
sentence
answer
search
final
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005359661A
Other languages
English (en)
Inventor
Tomoko Okuma
智子 大熊
Hiroshi Masuichi
博 増市
Yohei Yamane
洋平 山根
Daigo Sugihara
大悟 杉原
Takeshi Yoshioka
健 吉岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2005359661A priority Critical patent/JP2007164462A/ja
Publication of JP2007164462A publication Critical patent/JP2007164462A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】検索質問文によって様々な対象が問われる場合において、処理コストを大きくすることなく、適切な回答抽出が可能な質問応答システム、質問応答方法及び質問応答プログラムを提供する。
【解決手段】一次回答候補抽出部51は、関連文検索部40が情報源200をキーワード検索することにより得られる検索結果の文の中から一次回答候補抽出用ルール情報保持部52に保持された一次回答候補抽出用ルール情報に従って、一次回答候補を抽出する。一次回答候補解析部53は、その一次回答候補の構文意味解析を行って、その解析情報であるf−strcutureを生成する。最終回答候補抽出部54は、このf−strcutureに基づいて、最終回答候補抽出用ルール情報保持部55に保持された最終回答候補抽出用ルール情報に従って、一次回答候補の中から最終回答候補を抽出する。
【選択図】 図2

Description

本発明は、入力した検索質問文に応じて、検索対象文を含む情報源を検索して回答を得る質問応答システム、質問応答方法及び質問応答プログラムに関する。
インターネットの発達等により、検索技術を用いて電子化情報から迅速に情報を得ることが可能になった。しかし、大量の情報の中からから効率良く必要十分な情報を得ることは非常に困難である。この問題を解決するために、近年、質問応答システムの需要が大きくなっている。質問応答システムは、ユーザの操作指示に応じた検索質問文に対して検索結果を直接提示するのではなく、当該検索質問文に対する適切な回答を抽出して提示するため、ユーザが検索結果から適切な回答を探す手間が必要でなく、非常に効率が良い。この質問応答システムにおける回答抽出の方法は、大きく以下の3つに分類される。
1つ目は、特許文献1や特許文献2の技術に代表される文型パターンを用いた方法である。例えば、特許文献1では、特許文書において一般的に用いられる「本発明はAに関し、特にBに関する」という文型パターンから、Aを技術分野、Bを技術要素とすることで、技術分野や技術要素に関する検索質問文に対し、適切な文字列を抽出して回答とする。
2つ目は、非特許文献1の技術に代表される機械学習を用いた方法である。この方法では、検索質問文と回答のペアからなる学習データに、機械学習アルゴリズム(非特許文献1では、Support Vector Machine)を適用し、それぞれの検索質問文から回答に相応しい属性を選択する。この方式では例えば、「○○を開発したのはどこですか?」という検索質問文に対し、地名ではなく組織名を回答として選択する等、文型パターンを用いた方法よりも精度の高い解析結果を得ることができる。
3つ目は、特許文献3の技術に代表される論理表現を用いた方法である。この方法では、検索質問文と検索対象文をそれぞれ論理表現に変換し、検索対象文の中から検索質問文の論理式を満たすものを回答として抽出する。
特開平5−59179号公報 特開2003−189111号公報 特開2002−291221号公報 佐々木他、「SVMを用いた学習型質問応答システムSAIQA−II」、情報処理学会論文誌、Vol.45、No.2、2004年、p.635−646
しかし、上述した回答抽出の方法にはそれぞれ問題点がある。まず、文型パターンを用いた方法では、回答を含むあらゆる文の文型パターンを網羅的に且つ厳密に用意しておくことが必要であるが、これが非常に困難である。特に日本語は、語順が自由であることを特徴とする言語であるため、全ての文型パターンを用意することは不可能に近い。すなわち、検索対象が文体の定まっているような限られた文の集合であれば、ある程度適切な回答を抽出することは可能であるが、インターネットや新聞等の様々な文体を有する文の集合を検索対象とする場合は、適切な回答を抽出することが困難である。一方、網羅性を重視して制約の緩い文型パターンを用いると、精度が著しく損なわれる可能性が高い。
また、機械学習を用いた方法では、回答抽出の精度が学習データの多寡に依存するため、文体が統一された文の集合を検索対象とする場合には比較的高い精度を得ることは可能であるものの、インターネット等の様々な文体を有する文の集合を検索対象とする場合には、精度が低くなってしまう。また、固有表現(名詞)を検索対象にしているため、語の定義を問うような検索質問文に対しては、適切な回答を抽出することができない。
更に、論理表現を用いた方法では、処理コストが大きい。すなわち、自然言語文である検索質問文や検索対象文を論理式に変換するためには、莫大な処理負担や時間等の処理コストが必要になるため、検索質問文のみならともかく、膨大な量の検索対象文を論理式に変換することは現実的ではない。
このように、従来の回答抽出の方法では、検索対象の文の構造を十分に考慮した適切な回答抽出が困難であるという問題、検索対象の文の構造を考慮すると処理コストが大きくなるという問題、あるいは、検索質問文によって様々な対象が問われる場合に適切な回答を抽出することができないという問題があった。
本発明の目的は、上述した問題を解決するものであり、検索質問文によって様々な対象が問われる場合において、処理コストを大きくすることなく、適切な回答抽出が可能な質問応答システム、質問応答方法及び質問応答プログラムを提供するものである。
本発明に係る、入力した検索質問文に応じて、検索対象文を含む情報源を検索して回答を得る質問応答システムは、前記検索対象文の中から前記検索質問文の回答となり得る回答候補を抽出する回答候補抽出手段と、前記回答候補の構文意味解析を行い、該回答候補についての構文意味解析の結果を表す解析情報を生成する解析情報生成手段と、前記解析情報に基づいて、前記検索質問文に対する最終的な回答となる最終回答候補を前記回答候補の中から抽出する最終回答候補抽出手段とを有することを特徴とする。
この構成によれば、情報源に含まれる様々な文について、簡易的な回答候補の抽出を行い、その回答候補に対して更に構文意味解析を行って、回答候補の解析情報に基づく最終的な回答候補が抽出される。すなわち、構文意味解析を用いることにより、検索質問文によって様々な対象が問われる場合においても、文の構造を考慮した適切な回答抽出が可能であるとともに、情報源に含まれる全ての文ではなく、抽出された回答候補に対してのみ、処理コストのかかる構文意味解析が行われるため、処理コストを大きくすることなく回答抽出が可能となる。
また、本発明の質問応答システムは、前記最終回答候補の抽出手法を表す抽出ルール情報を保持する保持手段を有し、前記最終回答候補抽出手段が、前記保持手段に保持された最終回答候補の抽出ルールの情報に従って、前記最終回答候補を抽出するようにしてもよい。
この構成によれば、抽出ルールに従って、一律に適切な回答抽出が可能となる。
また、本発明の質問応答システムは、前記最終回答候補の抽出ルールの情報が、前記検索質問文によって問われる対象と前記最終回答候補が有するべき文構造とを対応付けて構成され、前記最終回答候補抽出手段が、前記検索質問文によって問われる対象に対応付けられた文構造に合致するものを前記最終回答候補として前記回答候補の中から抽出するようにしてもよい。
この構成によれば、検索質問文によって問われる対象と最終回答候補が有するべき文構造との対応関係に基づいて、適切な回答抽出が可能となる。
本発明に係る、入力した検索質問文に応じて、検索対象文を含む情報源を検索して回答を得る質問応答方法は、前記検索対象文の中から前記検索質問文の回答となり得る回答候補を抽出する回答候補抽出ステップと、前記回答候補の構文意味解析を行い、該回答候補についての構文意味解析の結果を表す解析情報を生成する解析情報生成ステップと、前記解析情報に基づいて、前記検索質問文に対する最終的な回答となる最終回答候補を前記回答候補の中から抽出する最終回答候補抽出ステップとを有することを特徴とする。
また、本発明の質問応答方法は、前記最終回答候補抽出ステップが、予め保持手段に保持された最終回答候補の抽出手法を表す抽出ルール情報に従って、前記最終回答候補を抽出するようにしてもよい。
また、本発明の質問応答方法は、前記最終回答候補の抽出ルールの情報が、前記検索質問文によって問われる対象と前記最終回答候補が有するべき文構造とを対応付けて構成され、前記最終回答候補抽出ステップが、前記検索質問文によって問われる対象に対応付けられた文構造に合致するものを前記最終回答候補として前記回答候補の中から抽出するようにしてもよい。
本発明に係る、入力した検索質問文に応じて、検索対象文を含む情報源を検索して回答を得る質問応答プログラムは、前記検索対象文の中から前記検索質問文の回答となり得る回答候補を抽出する回答候補抽出ステップと、前記回答候補の構文意味解析を行い、該回答候補についての構文意味解析の結果を表す解析情報を生成する解析情報生成ステップと、前記解析情報に基づいて、前記検索質問文に対する最終的な回答となる最終回答候補を前記回答候補の中から抽出する最終回答候補抽出ステップとをコンピュータに実行させることを特徴とする。
また、本発明の質問応答プログラムは、前記最終回答候補抽出ステップが、予め保持手段に保持された最終回答候補の抽出手法を表す抽出ルール情報に従って、前記最終回答候補を抽出するようにしてもよい。
また、本発明の質問応答プログラムは、前記最終回答候補の抽出ルールの情報が、前記検索質問文によって問われる対象と前記最終回答候補が有するべき文構造とを対応付けて構成され、前記最終回答候補抽出ステップが、前記検索質問文によって問われる対象に対応付けられた文構造に合致するものを前記最終回答候補として前記回答候補の中から抽出するようにしてもよい。
本発明によれば、構文意味解析を用いることにより、検索質問文によって様々な対象が問われる場合においても、文の構造を考慮した適切な回答抽出が可能となる。更に、情報源に含まれる全ての文ではなく、抽出された回答候補に対してのみ、処理コストのかかる構文意味解析が行われるため、処理コストを大きくすることなく回答抽出が可能となる。
本発明の実施の形態について、図面を参照して具体的に説明する。図1は、質問応答システムの構成例を示す図である。同図に示す質問応答システム100は、電子化された検索質問文に応じて、電子化された検索対象文を含むインターネット上の情報源200を検索して回答を得るものである。この質問応答システム100は、検索質問文入力部10と、処理ユニット20内の検索質問文解析部30、関連文検索部40及び回答抽出部50と、回答出力部60とにより構成される。処理ユニット20内の検索質問文解析部30、関連文検索部40及び回答抽出部50は、例えばCPUが所定のプログラムを実行することによって実行される。
検索質問文入力部10は、例えばキーボードであり、ユーザの操作指示に応じた検索質問文の文字列を処理ユニット20内の検索質問文解析部30へ出力する。検索質問文解析部30は、この検索質問文を解析し、その解析結果を関連文検索部40及び回答抽出部50へ出力する。関連文検索部40は、検索質問文解析部30からの検索質問文の解析結果に応じて、検索対象文を含む情報源200を検索し、検索質問文に対応する検索結果の文を、回答抽出部50へ出力する。
回答抽出部50は、検索質問文解析部30からの検索質問文の解析結果に応じて、関連文検索部40からの検索結果の文の中から検索質問文の回答の候補となる文を抽出し、回答出力部60へ出力する。図2は、回答抽出部50の第1の構成を示す図である。図2に示す回答抽出部50は、一次回答候補抽出部51、一次回答候補抽出用ルール保持部52、一次回答候補解析部53、最終回答候補抽出部54及び最終回答候補抽出用ルール保持部55によって構成される。回答出力部60は、例えばモニタであり、回答抽出部50からの回答候補をユーザに提示する。
次に、質問応答システム100による回答抽出処理を、フローチャートを参照しつつ説明する。図3は、質問応答システム100の回答抽出処理を示すフローチャートである。なお、以下においては、「ポアソン分布とは何ですか?」という検索質問文に対する回答候補を抽出する場合を適宜、例にとって説明する。
処理ユニット20内の検索質問文解析部30は、検索質問文入力部10からの検索質問文を入力したか否かを判定する(S101)。検索質問文を入力した場合、検索質問文解析部30は、その検索質問文を解析する(S102)。
具体的には、検索質問文解析部30は、検索に必要なキーワードを抽出する。キーワードの抽出方法は、公知の重要語抽出手法が用いられる。例えば、最も標準的なキーワードの抽出方法であるTF(Term Frequency)/IDF(Inverse Document Frequency)値を利用する方法では、検索質問文が「ポアソン分布とは何ですか?」である場合、検索質問文解析部30は、「ポアソン分布」をキーワードとして抽出する。更に、検索質問文解析部30は、検索質問文によって問われる対象が何であるか(質問タイプ)を解析する。例えば、検索質問文が「ポアソン分布とは何ですか?」である場合、当該検索質問文には疑問指示詞「何」と複合辞「とは」が含まれているため、検索質問文解析部30は、質問タイプを用語の定義を問うものであることを示す「definition」と判断する。
解析により得られたキーワードは、関連文検索部40と、回答抽出部50内の一次回答候補抽出部51及び最終回答候補抽出部54とに出力される。また、解析により得られた質問タイプは、回答抽出部50内の一次回答候補抽出部51及び最終回答候補抽出部54に出力される。
関連文検索部40は、検索質問文解析部30からのキーワードにより、情報源200を検索し、当該情報源200に含まれる啓作対照文の中からキーワードを含む文を検索結果の文として得る(S103)。検索結果の文の文字列は、回答抽出部50内の一次回答候補抽出部51に出力される。
回答抽出部50内の一次回答候補抽出部51は、一次回答候補抽出用ルール保持部50に保持されている一次回答候補抽出用ルール情報と、検索質問文解析部30からのキーワード及び質問タイプとに基づいて、関連文検索部40からの検索結果の文の中から検索質問文の回答となり得る文(一次回答候補)を抽出する(S104)。
図4は、一次回答候補抽出用ルール情報の一例を示す図である。図4に示すように、一次回答候補抽出用ルール情報は、検索質問文の質問タイプと、その検索質問文に対する一次回答候補が有するべき文型パターンとが対応付けられている。例えば、図4の1段目の情報は、検索質問文の質問タイプが用語の定義を問うものを示す「definition」である場合、その検索質問文に対する一次回答候補は、「Q(キーワード)とは○○だ」、「Qとは○○である」、「Qとは○○を示す」のいずれかの文型パターンを有するべきということを示している。
従って、一次回答候補抽出部51は、検索質問文の質問タイプが「definition」であり、キーワードが「Q」である場合、図4に示す一次回答候補抽出用ルール情報に従って、検索結果の文の中から「Qとは○○だ」、「Qとは○○である」、「Qとは○○を示す」のいずれかの文型パターンを有するものを、一次回答候補として抽出する。例えば、検索質問文が「ポアソン分布とは何ですか?」、検索質問文の質問タイプが「definition」、キーワードが「ポアソン分布」である場合には、「正規分布は二項分布、ポアソン分布とは異なり、連続型の分布である。」という文や、「ポアソン分布とは、ある交差点で人が交通事故に遭う確率などを示す。」 という文が一次回答候補として抽出される。
再び、図3に戻って説明する。一次回答候補抽出部51は、一次回答候補を抽出することができたか否かを判定する(S104)。一次回答候補が抽出されなかった場合には、一連の動作が終了する。一方、一次回答候補を抽出することができた場合には、一次回答候補抽出部51は、その一次回答候補を一次回答候補解析部53へ出力する。
一次回答候補解析部53は、一次回答候補を入力した場合、当該一次回答候補のそれぞれに対して、構文意味解析を行う。ここでは、構文意味解析を行うパーザの代表例としてLFG(Lexical Functional Grammar)理論に基づくパーザを例にとって説明する。LFG理論では構文解析情報として、functional structure(f−structure)が生成される(S106)。
LFG理論とそれに基づくパーザについては、「増市、 大熊著、「Lexical Functional Grammarに基づく実用的な日本語解析システムの構築」、自然言語処理、Vol.10、No.2、p.79−109、2003年」に詳細が記述されている。LFG理論では、文を解析することにより、文の意味内容が属性と属性値がペアとなった入れ子構造(マトリックス構造)であるf−structureが生成される。属性には、主語を表す「SUBJ」、目的語を表す「OBJ」、述語を表す「PRED」、外からの制約を受ける句を表す「XCOMP」、場所格を表す「OBL−loc」、日時を表す「OBL−time」等があり、これら属性が階層構造を形成している。図5は、一次回答候補「正規分布は二項分布、ポアソン分布とは異なり、連続型の分布である。」のf−structureを示し、図6は、一次回答候補「ポアソン分布とは、ある交差点で人が交通事故に遭う確率などを示す。」のf−structureを示す。一次回答候補解析部53は、生成したf−structureを、そのf−structureに対応する一次回答候補とともに、最終回答候補抽出部54へ出力する。
再び、図3に戻って説明する。最終回答候補抽出部54は、最終回答候補抽出用ルール保持部55に保持されている最終回答候補抽出用ルール情報、検索質問文解析部30からのキーワード及び質問タイプ、及び、一次回答候補抽出部54からのf−structureに基づいて、一次回答候補抽出部54から一次回答候補の中から最終的な回答候補(最終回答候補)を抽出する(S107)。
図7は、最終回答候補抽出用ルール情報の一例を示す図である。図7に示すように、最終回答候補抽出用ルール情報は、検索質問文の質問タイプと、その検索質問文に対する最終回答候補のf−structureが満たすべき条件(一致条件)と、最終回答候補のf−structureにおける回答部分となるべきもの(回答部分)とが対応付けられている。例えば、図7の1段目の情報は、検索質問文の質問タイプが用語の定義を問うものを示す「definition」である場合、その検索質問文に対する最終回答候補は、主語(SUBJ)がQ(キーワード)、述語(PRED)が「○○だ」あるいは「○○である」であり、外からの制約を受ける句(COMP)が回答部分となるべきということを示している。
従って、最終回答候補抽出部54は、検索質問文の質問タイプが「definition」であり、キーワードが「Q」である場合、図7に示す一次回答候補抽出用ルール情報に従って、一次回答候補の中から対応するf−structureにおける主語(SUBJ)がQ、述語(PRED)が「○○だ」あるいは「○○である」であるものを最終回答候補として抽出し、外からの制約を受ける句(COMP)を回答部分として特定する。
例えば、検索質問文が「ポアソン分布とは何ですか?」、検索質問文の質問タイプが「definition」、キーワードが「ポアソン分布」であり、一次回答候補が「正規分布は二項分布、ポアソン分布とは異なり、連続型の分布である。」、「ポアソン分布とは、ある交差点で人が交通事故に遭う確率などを示す。」である場合、最終回答候補抽出部54は、図6及び図7のf−structureを参照する。ここでは、図6に示す「正規分布は二項分布、ポアソン分布とは異なり、連続型の分布である。」のf−structureは主語(SUBJ)が「ポアソン分布」ではないのに対し、図7に示す「ポアソン分布とは、ある交差点で人が交通事故に遭う確率などを示す。」のf−structureは主語(SUBJ)が「ポアソン分布」であり、述語(PRED)が「○○である」である。従って、最終回答候補抽出部54は、一次回答候補「ポアソン分布とは、ある交差点で人が交通事故に遭う確率などを示す。」を最終回答候補として抽出する。更に、最終回答候補抽出部54は、その最終回答候補のf−structureにおける外からの制約を受ける句である目的語(OBJ)の「ある交差点で人が交通事故に遭う確率など」を回答部分として特定する。
再び、図3に戻って説明する。最終回答候補抽出部54は、最終回答候補を抽出することができたか否かを判定する(S108)。最終回答候補が抽出されなかった場合には、一連の動作が終了する。一方、最終回答候補を抽出することができた場合には、最終回答候補抽出部54は、抽出した最終回答候補とその最終回答候補における回答部分を示す情報とを回答出力部60へ出力する。回答出力部60は、入力した最終回答候補を画像表示等によってユーザに提示する(S109)。この際、回答出力部60は、回答部分を示す情報に基づいて、最終回答候補における回答部分のみをユーザに提示してもよいし、回答部分の表示色を変える等の強調表示を行うようにしてもよい。
なお、一次回答候補の抽出は、上述した方法以外にもさまざまな方法が考えられる。図8は、回答抽出部50の第2の構成を示す図である。図8に示す回答抽出部50は、図2に示す回答抽出部50と比較すると、固有名詞抽出部56を有する。この固有名詞抽出部56は、検索質問文によって問われる対象が固有名詞である場合に、検索結果の文から固有名詞を抽出する。
回答抽出部50が図8に示す構成を有する場合における回答抽出処理を、検索質問文が「2000年のオリンピックはどこで行われましたか?」である場合を例に説明する。検索質問文解析部30は、TF/IDF値を利用する方法により、検索質問文から「2000年」及び「オリンピック」をキーワードとして抽出する。更に、検索質問文解析部30は、検索質問文に疑問指示詞「どこ」が含まれているため、当該検索質問文の質問タイプを、場所を問うものであることを示す「where」とする。
関連文検索部40は、検索質問文解析部30からのキーワード「2000年」及び「オリンピック」により、情報源200を検索し、これらキーワードを含む文を検索結果の文として得る。一次回答候補抽出部51は、検索質問文の質問タイプが「where」であるため、予め保持している、検索質問文の質問タイプと当該検索質問文によって問われる対象の固有名詞のタイプとを対応付けた一次回答候補抽出用ルール情報(図9参照)に基づいて、固有名詞抽出部56に対して地名の抽出を指示する。固有名詞抽出部56は、この指示に従って、検索結果の文に含まれる地名を抽出する。一次回答候補抽出部51は、固有名詞抽出部56によって抽出された地名を含む検索結果の文を一次回答候補として抽出する。ここでは、地名「日本」を含む「2000年のオリンピックでは日本の選手の活躍が目立った。」と、地名「オーストラリア」を含む「オーストラリアで開催された2000年のオリンピックの記事を集めた。」の2つの文が一次回答候補として抽出されるものとする。
その後は、上述と同様の処理が行われる。すなわち、一次回答候補解析部53は、一次回答候補のそれぞれに対して、LFG理論に基づく構文意味解析を行い、解析情報としてのf−structureを生成する。図10は、一次回答候補「2000年のオリンピックでは日本の選手の活躍が目立った。」のf−structureを示し、図11は、一次回答候補「オーストラリアで開催された2000年のオリンピックの記事を集めた。」のf−structureを示す。
最終回答候補抽出部54は、最終回答候補抽出用ルール保持部55に保持されている最終回答候補抽出用ルール情報に従って、一次回答候補の中から最終回答候補を抽出する。図7に示す最終回答候補抽出用ルール情報の3段目の情報は、検索質問文の質問タイプが場所を問うものであることを示す「where」である場合、その検索質問文に対する最終回答候補は地名であり、場所格(OBL−loc)が回答部分となるべきということを示している。
従って、図7に示す最終回答候補抽出用ルール情報によれば、最終回答候補抽出部54は、一次回答候補「2000年のオリンピックでは日本の選手の活躍が目立った。」のf−structureにおいて地名「日本」は場所格(OBL−loc)でないため、当該一次回答候補を最終回答候補とはしない。一方、最終回答候補抽出部54は、一次回答候補「オーストラリアで開催された2000年のオリンピックの記事を集めた。」のf−structureにおいて地名「オーストラリア」は場所格(OBL−loc)であるため、当該一次回答候補を最終回答候補とし、回答部分として「オーストラリア」を特定する。回答出力部60は、最終回答候補に含まれる回答部分をユーザに提示する。
このように、本実施形態の質問応答システム100は、検索対象文を含む情報源200に対してキーワード検索を行うことにより得られる検索結果の文の中から一次回答候補を抽出し、更に、当該一次回答候補の構文意味解析を行って、その解析情報であるf−structureに基づいて、一次回答候補の中から最終回答候補を抽出する。すなわち、構文意味解析を用いることにより、検索質問文によって様々な対象が問われる場合においても、文の構造を考慮した適切な回答抽出が可能であるとともに、情報源200に含まれる全ての検索対象文ではなく、抽出された一次回答候補に対してのみ、処理コストのかかる構文意味解析を行うため、処理コストを大きくすることなく回答抽出が可能となる。
なお、上述した実施形態では、情報源200がインターネット上に存在するものとしたが、これに限定されるものではなく、LANによって接続された他のコンピュータに記憶された情報や質問応答システム100内の記憶装置に記憶された情報を情報源とする場合にも、本発明を適用することができる。
以上、説明したように、本発明に係る質問応答システム、質問応答方法及び質問応答プログラムによれば、検索質問文によって様々な対象が問われる場合においても、処理コストを大きくすることなく、適切な回答抽出が可能であり、質問応答システム等として有用である。
質問応答システムの構成を示す図である。 回答抽出部の第1の構成を示す図である。 質問応答システムの回答抽出処理を示すフローチャートである。 一次回答候補抽出用ルール情報の第1のを示す図である。 f-structureの第1の例を示す図である。 f-structureの第2の例を示す図である。 最終回答候補抽出用ルール情報の一例を示す図である。 回答抽出部の第2の構成を示す図である。 一次回答候補抽出用ルール情報の第1のを示す図である。 f-structureの第3の一例を示す図である。 f-structureの第4の一例を示す図である。
符号の説明
10 検索質問文入力部
20 処理ユニット
30 検索質問文解析部
40 関連文検索部
50 回答抽出部
51 一次回答候補抽出部
52 一次回答候補抽出用ルール保持部
53 一次回答候補解析部
54 最終回答候補抽出部
55 最終回答候補抽出用ルール保持部
56 固有名詞抽出部
60 回答出力部
100 質問応答システム
200 情報源

Claims (9)

  1. 入力した検索質問文に応じて、検索対象文を含む情報源を検索して回答を得る質問応答システムであって、
    前記検索対象文の中から前記検索質問文の回答となり得る回答候補を抽出する回答候補抽出手段と、
    前記回答候補の構文意味解析を行い、該回答候補についての構文意味解析の結果を表す解析情報を生成する解析情報生成手段と、
    前記解析情報に基づいて、前記検索質問文に対する最終的な回答となる最終回答候補を前記回答候補の中から抽出する最終回答候補抽出手段とを有することを特徴とする質問応答システム。
  2. 前記最終回答候補の抽出手法を表す抽出ルール情報を保持する保持手段を有し、
    前記最終回答候補抽出手段は、前記保持手段に保持された抽出ルール情報に従って、前記最終回答候補を抽出することを特徴とする請求項1に記載の質問応答システム。
  3. 前記抽出ルール情報は、前記検索質問文によって問われる対象と前記最終回答候補が有するべき文構造とを対応付けて構成され、
    前記最終回答候補抽出手段は、前記検索質問文によって問われる対象に対応付けられた文構造に合致するものを前記最終回答候補として前記回答候補の中から抽出することを特徴とする請求項2に記載の質問応答システム。
  4. 入力した検索質問文に応じて、検索対象文を含む情報源を検索して回答を得る質問応答方法であって、
    前記検索対象文の中から前記検索質問文の回答となり得る回答候補を抽出する回答候補抽出ステップと、
    前記回答候補の構文意味解析を行い、該回答候補についての構文意味解析の結果を表す解析情報を生成する解析情報生成ステップと、
    前記解析情報に基づいて、前記検索質問文に対する最終的な回答となる最終回答候補を前記回答候補の中から抽出する最終回答候補抽出ステップとを有することを特徴とする質問応答方法。
  5. 前記最終回答候補抽出ステップは、予め保持手段に保持された最終回答候補の抽出手法を表す抽出ルール情報に従って、前記最終回答候補を抽出することを特徴とする請求項4に記載の質問応答方法。
  6. 前記最終回答候補の抽出ルール情報は、前記検索質問文によって問われる対象と前記最終回答候補が有するべき文構造とを対応付けて構成され、
    前記最終回答候補抽出ステップは、前記検索質問文によって問われる対象に対応付けられた文構造に合致するものを前記最終回答候補として前記回答候補の中から抽出することを特徴とする請求項5に記載の質問応答方法。
  7. 入力した検索質問文に応じて、検索対象文を含む情報源を検索して回答を得る質問応答プログラムであって、
    前記検索対象文の中から前記検索質問文の回答となり得る回答候補を抽出する回答候補抽出ステップと、
    前記回答候補の構文意味解析を行い、該回答候補についての構文意味解析の結果を表す解析情報を生成する解析情報生成ステップと、
    前記解析情報に基づいて、前記検索質問文に対する最終的な回答となる最終回答候補を前記回答候補の中から抽出する最終回答候補抽出ステップとをコンピュータに実行させることを特徴とする質問応答プログラム。
  8. 前記最終回答候補抽出ステップは、予め保持手段に保持された最終回答候補の抽出手法を表す抽出ルール情報に従って、前記最終回答候補を抽出することを特徴とする請求項6に記載の質問応答プログラム。
  9. 前記最終回答候補の抽出ルール情報は、前記検索質問文によって問われる対象と前記最終回答候補が有するべき文構造とを対応付けて構成され、
    前記最終回答候補抽出ステップは、前記検索質問文によって問われる対象に対応付けられた文構造に合致するものを前記最終回答候補として前記回答候補の中から抽出することを特徴とする請求項8に記載の質問応答プログラム。
JP2005359661A 2005-12-13 2005-12-13 質問応答システム、質問応答方法及び質問応答プログラム Pending JP2007164462A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005359661A JP2007164462A (ja) 2005-12-13 2005-12-13 質問応答システム、質問応答方法及び質問応答プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005359661A JP2007164462A (ja) 2005-12-13 2005-12-13 質問応答システム、質問応答方法及び質問応答プログラム

Publications (1)

Publication Number Publication Date
JP2007164462A true JP2007164462A (ja) 2007-06-28

Family

ID=38247284

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005359661A Pending JP2007164462A (ja) 2005-12-13 2005-12-13 質問応答システム、質問応答方法及び質問応答プログラム

Country Status (1)

Country Link
JP (1) JP2007164462A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6467678B1 (ja) * 2018-10-08 2019-02-13 モンド・ラボ株式会社 質問応答システム、装置、方法、サーバ装置及びプログラム
WO2023042316A1 (ja) * 2021-09-15 2023-03-23 日本電信電話株式会社 質問回答装置、質問回答方法、およびプログラム
CN116739003A (zh) * 2023-06-01 2023-09-12 中国南方电网有限责任公司 电网管理智能问答实现方法、装置、电子设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6467678B1 (ja) * 2018-10-08 2019-02-13 モンド・ラボ株式会社 質問応答システム、装置、方法、サーバ装置及びプログラム
JP2020060881A (ja) * 2018-10-08 2020-04-16 モンド・ラボ株式会社 質問応答システム、装置、方法、サーバ装置及びプログラム
WO2023042316A1 (ja) * 2021-09-15 2023-03-23 日本電信電話株式会社 質問回答装置、質問回答方法、およびプログラム
CN116739003A (zh) * 2023-06-01 2023-09-12 中国南方电网有限责任公司 电网管理智能问答实现方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
Yangarber et al. Unsupervised discovery of scenario-level patterns for information extraction
JP5825676B2 (ja) ノン・ファクトイド型質問応答システム及びコンピュータプログラム
US10664530B2 (en) Control of automated tasks executed over search engine results
JP6176017B2 (ja) 検索装置、検索方法、およびプログラム
US20090119090A1 (en) Principled Approach to Paraphrasing
CN102439590A (zh) 用于自然语言文本的自动语义标注的系统和方法
KR20040025642A (ko) 확인 문장을 검색하기 위한 방법 및 시스템
Jabbar et al. A survey on Urdu and Urdu like language stemmers and stemming techniques
JP2006004399A (ja) 情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法
JP2005038395A (ja) データベース検索装置
JP2007207127A (ja) 質問応答システム、質問応答処理方法及び質問応答プログラム
JP2007164462A (ja) 質問応答システム、質問応答方法及び質問応答プログラム
CN115062609B (zh) 一种汉语增强依存句法的方法及装置
JP4940606B2 (ja) 翻訳システム、翻訳装置、翻訳方法及びプログラム
JP4148247B2 (ja) 語彙獲得方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP4014130B2 (ja) 用語集生成装置及び用語集生成プログラム並びに用語集検索装置
Borin et al. Language technology for digital linguistics: Turning the linguistic survey of India into a rich source of linguistic information
Zouaoui et al. Ontological Approach Based on Multi-Agent System for Indexing and Filtering Arabic Docu-ments
Tanaka et al. Acquiring and generalizing causal inference rules from deverbal noun constructions
JP2008140204A (ja) データ検索システム及びプログラム
JP4635585B2 (ja) 質問応答システム、質問応答方法及び質問応答プログラム
JP5633844B2 (ja) 言い換え関係集合取得装置、言い換え関係集合取得方法、及びプログラム
Hamoudi et al. Extracting RDF triples using the Stanford Parser
Szpektor et al. Cross lingual and semantic retrieval for cultural heritage appreciation
JP3058511B2 (ja) 中国語文解析方法および中国語文解析装置