JP2007199876A - 質問応答システム、質問応答処理方法及び質問応答プログラム - Google Patents

質問応答システム、質問応答処理方法及び質問応答プログラム Download PDF

Info

Publication number
JP2007199876A
JP2007199876A JP2006015719A JP2006015719A JP2007199876A JP 2007199876 A JP2007199876 A JP 2007199876A JP 2006015719 A JP2006015719 A JP 2006015719A JP 2006015719 A JP2006015719 A JP 2006015719A JP 2007199876 A JP2007199876 A JP 2007199876A
Authority
JP
Japan
Prior art keywords
answer
answer candidate
candidates
candidate
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006015719A
Other languages
English (en)
Inventor
Yohei Yamane
洋平 山根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2006015719A priority Critical patent/JP2007199876A/ja
Publication of JP2007199876A publication Critical patent/JP2007199876A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】回答候補間の関係を考慮した適切な回答候補の提示が可能な質問応答システム、質問応答処理方法及び質問応答プログラムを提供する。
【解決手段】質問応答システム100−1は、検索質問文から検索語を抽出する質問判定部10と、検索語に基づいて知識源200からパッセージを取得するパッセージ検索部20と、パッセージから回答候補を抽出して、回答候補の尤度を表す得点を付与する回答候補抽出部30と、回答候補が表す事物の同一性についての回答候補間の関係を示す関係規則情報を取得する関係抽出部40と、関係規則情報に基づいて同一の事物を表す回答候補を結合して回答候補集合を生成し、該回答候補集合に含まれる回答候補に付与された得点を集計する回答候補結合部50と、得点が最も大きい回答候補集合に含まれる回答候補を優先的に提示する制御を行う回答候補選択部60及び回答候補提示制御部70とを有する。
【選択図】 図3

Description

本発明は、入力した検索質問文に応じた応答を行う質問応答システム、該質問応答システムにおける質問応答処理方法及びコンピュータにおいて実行される質問応答プログラムに関する。
一般的な質問応答の技術として、特許文献1に記載されたものがある。この質問応答システムは、検索質問文から検索語を抽出するとともに、質問種別の判定を行う質問解析部と、検索語に基づいて知識源を検索し、検索結果文であるパッセージを抽出する情報検査部と、パッセージからいくつかの回答候補を抽出、提示する回答抽出部と、その回答候補の根拠を提示する根拠提示部とにより構成される。
ところで、上述した質問応答システムにおける回答抽出部は、高い精度で正解となる回答候補を抽出することが困難であるため、一般に複数の回答候補を提示する。この提示された回答候補の確からしさをユーザが判断可能とするために、根拠提示部が回答候補の根拠文である回答候補の抽出元文や、重要文を提示することもなされる(たとえば、特許文献2及び3参照)。
特開2002−132811号公報 特開2002−132812号公報 特開2002−1259371号公報
しかし、上述した特許文献2及び3に記載された技術は、提示される複数の回答候補のそれぞれが適切であるか否かをユーザが判断可能とするものであり、回答候補間の関係については何ら考慮されていない。このため、回答候補を適切に提示することができない場合がある。
例えば、検索質問文「大阪でおきた大地震の名前はなんですか?」が質問応答システムに入力され、回答候補として順次「大地震」、「元禄大地震」、「新潟県中越地震」、「阪神・淡路大震災」、「関西大震災」、「阪神大震災」、「兵庫県南部地震」が得られた場合を考える。この場合、これら回答候補のうち、検索質問文に対する正解は、「阪神・淡路大震災」、「関西大震災」、「阪神大震災」、「兵庫県南部地震」の4つであるが、単に回答候補が得られた順に提示されると、これらの正解はいずれも提示順序が下位になってしまう。すなわち、同一の事物を表す回答候補であっても、異なる単語であるために別々に扱われて提示されており、ユーザがどの回答候補が適切であるのかを判断しにくい。
本発明の目的は、上述した問題を解決するものであり、回答候補間の関係を考慮した適切な回答候補の提示が可能な質問応答システム、質問応答処理方法及び質問応答プログラムを提供するものである。
本発明に係る、入力した検索質問文に応じて、検索対象文を含む第1の知識源を検索し、前記検索質問文の回答となり得る回答候補を得る質問応答システムは、前記検索質問文から検索語を抽出する検索語抽出手段と、前記検索語に基づいて前記第1の知識源に含まれる検索対象文の中から検索結果の文を取得する検索手段と、前記検索結果の文から前記回答候補を抽出し、前記回答候補毎に該回答候補の尤度を表す数値を付与する回答候補抽出手段と、前記回答候補が表す事物の同一性についての回答候補間の関係を示す関係情報を生成する関係情報生成手段と、前記抽出された回答候補から、前記関係情報に基づいて、同一の事物を表す回答候補からなる回答候補集合を生成し、前記回答候補集合毎に、該回答候補集合に含まれる回答候補に付与された尤度の数値を集計する回答候補結合手段と、記尤度の集計値が最も大きい前記回答候補集合に含まれる回答候補のいずれかを優先的に提示する制御を行う提示制御手段とを有することを特徴とする。
この構成によれば、同一の事物を表す回答候補からなる回答候補集合が生成され、各回答候補集合のうち、回答候補に付与された尤度の集計値が最も大きい回答候補集合に含まれる回答候補のいずれかが回答に相応しい回答候補として優先的に提示される。
また、質問応答システムは、前記関係情報生成手段が、1の回答候補を含む検索結果の文における単語のベクトルと、他の回答候補を含む検索結果の文における単語のベクトルとの内積を算出し、該内積が所定値以上である場合に、前記1及び他の回答候補が同一の事物を表すものであることを示す関係情報を生成するようにしてもよい。
この構成によれば、検索結果の文における単語のベクトルの内積値により、1及び他の回答候補の関係を適切に表すことができる。
また、質問応答システムは、前記関係情報生成手段は、同一の事物を表す回答候補のいずれかがこれら回答候補の代表となる回答候補であることを示す関係情報を生成し、前記回答候補結合手段が、前記同一の事物を表す回答候補からなり、前記代表となる回答候補に他の回答候補を置き換えた回答候補集合を生成し、前記提示制御手段が、前記代表となる回答候補を優先的に提示する制御を行うようにしてもよい。
この構成によれば、回答候補に付与された尤度の集計値が最も大きい回答候補集合に含まれる回答候補のうち、これら回答候補を代表する回答候補が優先的に提示されることが可能となる。
また、質問応答システムは、前記関係情報生成手段が、前記第1の知識源とは異なる第2の知識源に含まれる文に基づいて、前記回答候補が表す事物の同一性についての回答候補間の関係を示す関係情報を生成するようにしてもよい。
この構成によれば、検索対象以外の知識源に含まれる文を考慮することにより、回答候補が表す事物の同一性についての回答候補間の関係をより適切に示すことが可能となる。
また、質問応答システムは、前記関係情報生成手段により生成された関係情報を保持する関係情報保持手段を有するようにしてもよい。
この構成によれば、過去の回答候補提示の際に用いられた関係情報をも用いて、より迅速に回答候補の提示を行うことが可能となる。
本発明に係る、入力した検索質問文に応じて、検索対象文を含む第1の知識源を検索し、前記検索質問文の回答となり得る回答候補を得る質問応答システムでの処理方法は、前記検索質問文から検索語を抽出する検索語抽出ステップと、前記検索語に基づいて前記第1の知識源に含まれる検索対象文の中から検索結果の文を取得する検索ステップと、前記検索結果の文から前記回答候補を抽出し、前記回答候補毎に該回答候補の尤度を表す数値を付与する回答候補抽出ステップと、前記回答候補が表す事物の同一性についての回答候補間の関係を示す関係情報を生成する関係情報生成ステップと、前記抽出された回答候補から、前記関係情報に基づいて、同一の事物を表す回答候補からなる回答候補集合を生成し、前記回答候補集合毎に、該回答候補集合に含まれる回答候補に付与された尤度の数値を集計する回答候補結合ステップと、前記尤度の集計値が最も大きい前記回答候補集合に含まれる回答候補のいずれかを優先的に提示する制御を行う提示制御ステップとを有することを特徴とする。
また、質問応答処理方法は、前記関係情報生成ステップが、1の回答候補を含む検索結果の文の集合における単語のベクトルと、他の回答候補を含む検索結果の文の集合における単語のベクトルとの内積を算出し、該内積が所定値以上である場合に、前記1及び他の回答候補が同一の事物を表すものであることを示す関係情報を生成するようにしてもよい。
また、質問応答処理方法は、前記関係情報生成手段が、同一の事物を表す回答候補のいずれかがこれら回答候補の代表となる回答候補であることを示す関係情報を生成し、前記回答候補結合ステップが、前記同一の事物を表す回答候補からなり、前記代表となる回答候補に他の回答候補を置き換えた回答候補集合を生成し、前記提示制御ステップが、前記代表となる回答候補を優先的に提示する制御を行うようにしてもよい。
また、質問応答処理方法は、前記関係情報生成ステップが、前記第1の知識源とは異なる第2の知識源に含まれる文に基づいて、前記回答候補が表す事物の同一性についての回答候補間の関係を示す関係情報を生成するようにしてもよい。
また、質問応答処理方法は、前記関係情報生成ステップにより生成された関係情報を記憶装置に保持させる関係情報保持ステップを有するようにしてもよい。
本発明に係る、入力した検索質問文に応じて、検索対象文を含む第1の知識源を検索し、前記検索質問文の回答となり得る回答候補を得る質問応答システムにて実行可能なプログラムは、前記検索質問文から検索語を抽出する検索語抽出ステップと、前記検索語に基づいて前記第1の知識源に含まれる検索対象文の中から検索結果の文を取得する検索ステップと、前記検索結果の文から前記回答候補を抽出し、前記回答候補毎に該回答候補の尤度を表す数値を付与する回答候補抽出ステップと、前記回答候補が表す事物の同一性についての回答候補間の関係を示す関係情報を生成する関係情報生成ステップと、前記抽出された回答候補から、前記関係情報に基づいて、同一の事物を表す回答候補からなる回答候補集合を生成し、前記回答候補集合毎に、該回答候補集合に含まれる回答候補に付与された尤度の数値を集計する回答候補結合ステップと、前記尤度の集計値が最も大きい前記回答候補集合に含まれる回答候補のいずれかを優先的に提示する制御を行う提示制御ステップとを有することを特徴とする。
また、質問応答プログラムは、前記関係情報生成ステップが、1の回答候補を含む検索結果の文の集合における単語のベクトルと、他の回答候補を含む検索結果の文の集合における単語のベクトルとの内積を算出し、該内積が所定値以上である場合に、前記1及び他の回答候補が同一の事物を表すものであることを示す関係情報を生成するようにしてもよい。
また、質問応答プログラムは、前記関係情報生成手段が、同一の事物を表す回答候補のいずれかがこれら回答候補の代表となる回答候補であることを示す関係情報を生成し、前記回答候補結合ステップが、前記同一の事物を表す回答候補からなり、前記代表となる回答候補に他の回答候補を置き換えた回答候補集合を生成し、前記提示制御ステップが、前記代表となる回答候補を優先的に提示する制御を行うようにしてもよい。
また、質問応答プログラムは、前記関係情報生成ステップが、前記第1の知識源とは異なる第2の知識源に含まれる文に基づいて、前記回答候補が表す事物の同一性についての回答候補間の関係を示す関係情報を生成するようにしてもよい。
また、質問応答プログラムは、前記関係情報生成ステップにより生成された関係情報を記憶装置に保持させる関係情報保持ステップを有するようにしてもよい。
本発明によれば、同一の事物を表す回答候補からなる回答候補集合が生成され、回答候補に付与された尤度の集計値が最も大きい回答候補集合に含まれる回答候補のいずれかが回答に相応しい回答候補として優先的に提示されるため、異なる単語の回答候補によって同一の事物が表される場合であっても、回答候補間の関連性を考慮した適切な回答候補の提示が可能となる。
本発明の実施の形態について、図面を参照して具体的に説明する。図1及び図2は、第1の質問応答システムのハードウェア構成の一例を示す図である。図1に示す第1の質問応答システム100−1は、パーソナルコンピュータ(PC)であり、内部バス107に接続されたCPU101、メモリ102、ハードディスクドライブ(HDD)103、通信インターフェース(I/F)部104、操作部105及びモニタ106によって構成され、通信I/F部104が外部の通信ネットワーク250を介して知識源200に接続されている。
一方、図2に示す質問応答システム100−1は、LAN等のバス113に接続されたサーバ111及びPC112により構成され、サーバ111が外部の通信ネットワーク250を介して知識源200に接続される。
図3は、第1の質問応答システム100−1の機能ブロック図である。同図に示す質問応答システム100−1は、電子化された検索質問文に応じて、電子化された検索対象文を含む外部の知識源200を検索して回答を得るものである。
この質問応答システム100−1は、質問判定部10、パッセージ検索部20、回答候補抽出部30、関係抽出部40、回答候補結合部50、回答候補選択部60及び回答候補提示制御部70により構成される。これら各機能ブロックは、図1のハードウェア構成においては、CPU101がHDD103から読み出してメモリ102に記憶させた所定のプログラムを実行し、通信I/F部104を介して知識源200にアクセスすることによって実現される。一方、これら各機能ブロックは、図2のハードウェア構成においては、サーバ111がPC112の要求に応じて所定のプログラムを実行し、知識源200にアクセスすることによって実現される。
質問判定部10は、ユーザによる図1の操作部105の操作等に応じて入力した検索質問文を解析し、当該検索質問文に含まれる検索語を抽出する。パッセージ検索部20は、質問判定部10によって抽出された検索語を用いて、知識源200に含まれる検索対象文を検索し、検索結果の文であるパッセージを取得する。回答候補抽出部30は、パッセージ検索部20によって取得されたパッセージから検索質問文の回答となり得る回答候補として抽出する。この際、回答候補抽出部30は、各回答候補に当該回答候補の確からしさ(尤度)を表す得点を付与する。
関係抽出部40は、回答候補抽出部30によって抽出された回答候補が表す事物の同一性についての回答候補間の関係を示す関係規則情報を生成する。回答候補結合部50は、関係抽出部40によって生成された関係規則情報に基づいて、回答候補抽出部30により抽出された回答候補について、同一の事物を表すものを結合して回答候補集合を生成する。回答候補選択部60は、回答候補結合部50によって生成された各回答候補集合毎に、当該回答候補集合に含まれる回答候補に付与された得点を集計する。回答候補提示制御部70は、回答候補選択部60によって集計された、対応する得点が高い所定件数の回答候補集合に含まれる回答候補を、図1のモニタ106等を用いてユーザに提示する制御を行う。
以下、フローチャートを参照しつつ、質問応答システム100−1の動作を説明する。図4は、質問応答システム100−1の動作を示すフローチャートである。なお、以下においては、「大阪で起きた大地震の名前は何ですか?」という検索質問文に対する回答候補を抽出、提示する場合を適宜、例にとって説明する。
ユーザが、図1の操作部105等を用いて検索質問文の入力操作を行うと、質問判定部10には、その検索質問文の文字列が入力される。質問判定部10は、定期的に検索質問文を入力したか否かを判定する(S101)。検索質問文を入力した場合、質問判定部10は、公知の検索語の抽出方法であるTF(Term Frequency)/IDF法等により、その検索質問文から検索語を抽出する(S102)。例えば、検索質問文が「大阪で起きた大地震の名前は何ですか?」である場合、検索語として、「起きる」、「大」、「大阪」、「地震」、「名前」が抽出される。抽出された検索語は、パッセージ検索部20へ送られる。
パッセージ検索部20は、質問判定部10からの検索語を入力すると、知識源200に含まれる検索対象文を検索し、検索語が含まれる検索対象文をパッセージとして取得する(S103)。取得されたパッセージは、回答候補抽出部30及び関係抽出部40へ送られる。
回答候補抽出部30は、パッセージ検索部20からのパッセージを入力すると、当該パッセージに含まれる名詞やそれに準ずる品詞を回答候補として抽出する。更に、回答候補抽出部30は、抽出した各回答候補に対して、当該回答候補の尤度を表す得点を付与する(S104)。得点は、例えば、パッセージにおける回答候補の出現回数等に応じて予め定められたものが付与される。例えば、図5に示すように、検索質問文「大阪で起きた大地震の名前は何ですか?」に対して、「大地震」、「元禄大地震」、「新潟県中越地震」、「阪神・淡路大震災」、「関西大震災」、「阪神大震災」、「兵庫県南部地震」が回答候補として抽出され、これら各回答候補に得点が付与される。回答候補とパッセージは、関係抽出部40へ送られる。また、回答候補と当該回答候補に付与された得点との組み合わせは、回答候補結合部50へ送られる。
関係抽出部40は、回答候補抽出部30からの各回答候補について、当該回答候補が表す事物の同一性についての回答候補間の関係を示す関係規則情報を生成する(S105)。具体的には、関係抽出部40は、1の回答候補を含んでいるパッセージの集合の単語のベクトルと、他の回答候補を含んでいるパッセージの集合の単語のベクトルとの内積を算出する。更に、関係抽出部40は、算出した内積値が所定値以上である場合に、1の回答候補と他の回答候補とが同一の事物を表すものであると判定する。
図6は、回答候補間の関係の一例を示す図である。同図は、検索質問文「大阪で起きた大地震の名前は何ですか?」に対して、「大地震」、「元禄大地震」、「新潟県中越地震」、「阪神・淡路大震災」、「関西大震災」、「阪神大震災」、「兵庫県南部地震」が回答候補として抽出される場合の例を示している。図6において、2つの回答候補を結ぶ実線は、当該実線で結ばれた1の回答候補を含んでいるパッセージの集合の単語のベクトルと他の回答候補を含んでいるパッセージの集合の単語のベクトルとの内積値が所定値以上であり、これら2つの回答候補が同一の事物を表すものであることを示している。例えば、回答候補「阪神・淡路大震災」と回答候補「阪神大震災」及び「兵庫県南部地震」とは、実線で結ばれており、同一の事物を表している。また、回答候補「阪神大震災」と回答候補「関西大震災」とは、実線で結ばれており、同一の事物を表している。更には、回答候補「阪神・淡路大震災」と回答候補「関西大震災」とは、直接、実線で結ばれてはいないものの、回答候補「阪神大震災」を介して実線で結ばれており、同一の事物を表している。
更に、関係抽出部40は、同一の事物を表す回答候補について、いずれかを代表の回答候補としての置き換え先とし、他の回答候補を置き換え元とすることを示す関係規則情報を生成する。例えば、回答候補間の関係が図6のように示される場合、関係抽出部40は、同一の事物を表す回答候補「阪神・淡路大震災」、「阪神大震災」、「兵庫県南部地震」、「関西大震災」のうち、実線で結ばれる他の回答候補の数が最も多い回答候補「阪神・淡路大震災」又は「阪神大震災」を選択する。更に、関係抽出部40は、回答候補「阪神・淡路大震災」を選択した場合には、図7に示すように、選択した回答候補「阪神・淡路大震災」を置き換え先とし、他の回答候補「関西大震災」、「阪神大震災」、「兵庫県南部地震」を置き換え元とすることを示す関係規則情報を生成する。生成された関係規則情報は、回答候補結合部50へ送られる。
回答候補結合部50は、回答候補抽出部30からの各回答候補から、関係抽出部40からの関係規則情報に基づいて、同一の事物を表す回答候補からなる回答候補集合を生成するとともに、各回答候補集合毎に、当該回答候補集合に含まれる回答候補に付与された得点を集計する(S106)。
具体的には、回答候補結合部50は、回答候補抽出部30からの回答候補を1つずつ選択し、その回答候補が、関係規則情報で示される置き換え先の回答候補、及び、置き換え元の回答候補のいずれかと一致するか否かを判定する。選択した回答候補が関係規則情報で示される置き換え先の回答候補、及び、置き換え元の回答候補のいずれとも一致しない場合には、回答候補結合部50は、その選択した回答候補を単独で回答候補集合とする。一方、選択した回答候補が関係規則情報で示される置き換え先の回答候補と一致する場合には、回答候補結合部50は、その選択した回答候補を、回答候補集合を代表する回答候補(代表回答候補)とする。また、選択した回答候補が関係規則情報で示される置き換え元の回答候補と一致する場合には、回答候補結合部50は、その選択した回答候補を、置き換え先の回答候補と一致する代表回答候補に置き換える。回答候補抽出部30からの回答候補の全てについて、このような処理が行われることによって、同一の事物を表す回答候補からなる回答候補集合が生成される。例えば、関係規則情報が図6で示される場合には、回答候補結合部50は、回答候補「阪神・淡路大震災」を代表回答候補とするとともに、回答候補「関西大震災」、「阪神大震災」、「兵庫県南部地震」を、代表回答候補「阪神・淡路大震災」に置き換えて、回答候補「阪神・淡路大震災」を代表とする回答候補集合を生成する。
更に、回答候補結合部50は、回答候補抽出部30からの各回答候補に付与された得点に基づいて、各回答候補集合について、当該回答候補集合に含まれる回答候補に付与された得点を集計する。例えば、図5に示すように各回答候補に得点が付与され、更に、回答候補「大地震」からなる回答候補集合と、回答候補「元禄大地震」からなる回答候補集合と、回答候補「新潟県中越地震」からなる回答候補集合と、回答候補「阪神・淡路大震災」、「関西大震災」、「阪神大震災」、「兵庫県南部地震」からなり、回答候補「阪神・淡路大震災」を代表とする回答候補集合とが生成される場合を考える。この場合、回答候補結合部50は、図8に示すように、回答候補「大地震」からなる回答候補集合と、回答候補「元禄大地震」からなる回答候補集合と、回答候補「新潟県中越地震」からなる回答候補集合については、その回答候補に付与された得点を、回答候補集合に対応する得点とするとともに、回答候補「阪神・淡路大震災」を代表とする回答候補集合については、回答候補「阪神・淡路大震災」、「関西大震災」、「阪神大震災」、「兵庫県南部地震」のそれぞれに付与された得点0.3、0.3、0.2、0.1を集計した0.9を回答候補集合の得点とする。各回答候補集合と、当該回答候補集合に対応する得点とは、回答候補選択部60へ送られる。
回答候補選択部60は、回答候補集合と、当該回答候補集合に対応する得点とを入力すると、得点の高い順に回答候補集合を並べ替える。例えば、回答候補集合に対応する得点が図8に示すものである場合、回答候補選択部60は、図9に示すように、回答候補「阪神・淡路大震災」を代表とする得点0.9の回答候補集合、回答候補「大地震」からなる得点0.7の回答候補集合、回答候補「元禄大地震」からなる得点0.6の回答候補集合、回答候補「新潟県中越地震」からなる得点0.5の回答候補集合の順に並べ替える。
更に、回答候補選択部60は、対応する得点の高い所定件数の回答候補集合に属する回答候補を、提示すべき回答候補として選択する(S107)。例えば、回答候補集合が図9に示すように並び替えられ、得点の最も高い1件の回答候補集合に含まれる回答候補が選択される場合には、得点0.9の回答候補集合に含まれる代表の回答候補「阪神・淡路大震災」が選択される。提示すべきものとして選択された回答候補は、回答候補提示制御部70へ送られる。回答候補提示制御部70は、入力した回答候補を、図1のモニタ106等を用いてユーザに提示する制御を行う(S108)。
このように、本実施形態の質問応答システム100−1では、関係抽出部40が、回答候補抽出部30によって抽出された回答候補が表す事物の同一性についての回答候補間の関係を示す関係規則情報を生成し、回答候補結合部50が、回答候補抽出部30により抽出された回答候補から、この関係規則情報に基づいて、同一の事物を表す回答候補からなる回答候補集合を生成し、回答候補選択部60が、各回答候補集合毎に、当該回答候補集合に含まれる回答候補に付与された得点を集計し、回答候補提示制御部70によって、対応する得点が高い所定件数の回答候補集合に含まれる回答候補が提示される。すなわち、異なる単語の回答候補によって同一の事物が表される場合であっても、それらの回答候補はまとめられ、回答として相応しい場合には優先的に提示されるため、適切な回答候補の提示が可能となる。
ところで、上述した実施形態では、関係抽出部40は、回答候補抽出部30からの各回答候補について、検索対象の知識源200から抽出された、回答候補を含んでいるパッセージの集合の単語のベクトル間の内積値に基づいて、関係規則情報を生成したが、更に、検索対象でない他の知識源から回答候補を含むパッセージを抽出し、そのパッセージの集合の単語のベクトル間の内積値に基づいて、関係規則情報を生成するようにしてもよい。
図10は、他の知識源を利用する質問応答システムの機能ブロック図である。同図に示す第2の質問応答システム100−2は、図3に示す質問応答システム100−1と比較すると、関係抽出部40は、質問判定部10に接続されるとともに、外部の知識源300に接続されている。なお、質問応答システム100−2のハードウェア構成は、図1や図2に示す質問応答システム100−1と同様である。但し、質問応答システム100−2は、通信ネットワーク250を介して知識源200のみならず知識源300にも接続されている。
この質問応答システム100−2において、質問判定部10は、検索質問文から抽出した検索語をパッセージ検索部20のみならず、関係抽出部40にも出力する。関係抽出部40は、パッセージ検索部20からのパッセージを取得するとともに、質問判定部10からの検索語を用いて、知識源300に含まれる検索対象文を検索し、検索結果の文であるパッセージを取得する。そして、関係抽出部40は、回答候補抽出部30からの各回答候補について、1の回答候補を含んでいるパッセージの集合の単語のベクトルと、他の回答候補を含んでいるパッセージの集合の単語のベクトルとの内積を算出する。更に、関係抽出部40は、算出した内積値が所定値以上である場合に、1の回答候補と他の回答候補とが同一の事物を表すものであると判定し、同一の事物を表す回答候補について、いずれかを代表回答候補としての置き換え先とし、他の回答候補を置き換え元とすることを示す関係規則情報を生成する。このように、検索対象でない知識源300に含まれる文を考慮することにより、回答候補が表す事物の同一性についての回答候補間の関係をより適切に示すことが可能となる。
また、関係抽出部40が生成した関係規則情報を保持するようにしてもよい。図11は、関係規則情報を保持する質問応答システムの機能ブロック図である。同図に示す質問応答システム100−3は、図3に示す質問応答システム100−1と比較すると、関係規則情報を保持する関係規則データベース(DB)80を有する。なお、質問応答システム100−3のハードウェア構成は、図1や図2に示す質問応答システム100−1と同様である。但し、質問応答システム100−3は、図1におけるメモリ106や図2におけるサーバ111内のメモリ(図示せず)に関係規則DB80を保持している。
関係抽出部40は、関係規則情報を生成する毎に、当該関係規則情報を関係規則DB80に保持させる。そして、その後の回答候補の提示処理においては、関係抽出部40は、回答候補抽出部30からの回答候補が関係規則DB80内の関係規則情報における置き換え元又は置き換え先と一致する場合には、その関係規則情報をそのまま回答候補結合部50に出力する。これにより、過去の回答候補提示の際に用いられた関係規則情報をも用いて、より迅速に回答候補の提示を行うことが可能となる。
また、上述した実施形態では、回答候補集合を構成する回答候補のうち、代表となる回答候補、換言すれば、置き換え先となる回答候補のみが提示されたが、他の回答候補、換言すれば、置き換え元の回答候補が提示されるようにしてもよい。
以上、説明したように、本発明に係る質問応答システム、質問応答処理方法及び質問応答プログラムによれば、回答候補間の関係を考慮した適切な回答候補の提示が可能であり、質問応答システム等として有用である。
質問応答システムのハードウェア構成の第1の例を示す図である。 質問応答システムのハードウェア構成の第2の例を示す図である。 第1の質問応答システムの機能ブロック図である。 質問応答システムの動作を示すフローチャートである。 回答候補に付与される得点の一例である。 回答候補間の関係の一例を示す図である。 関係規則情報の一例を示す図である。 回答候補集合に対応する得点の一例を示す図である。 得点順に並び替えられた回答候補集合の一例を示す図である。 第2の質問応答システムの機能ブロック図である。 第3の質問応答システムの機能ブロック図である。
符号の説明
10 質問判定部
20 パッセージ検索部
30 回答候補抽出部
40 関係抽出部
50 回答候補結合部
60 回答候補選択部
70 回答候補提示制御部
80 関係規則DB
100−1、100−2、100−3 質問応答システム
101 CPU
102 メモリ
103 HDD
104 通信I/F部
105 操作部
106 モニタ
107 内部バス
111 サーバ
112 PC
113 バス
200、300 知識源
250 通信ネットワーク

Claims (15)

  1. 入力した検索質問文に応じて、検索対象文を含む第1の知識源を検索し、前記検索質問文の回答となり得る回答候補を得る質問応答システムであって、
    前記検索質問文から検索語を抽出する検索語抽出手段と、
    前記検索語に基づいて前記第1の知識源に含まれる検索対象文の中から検索結果の文を取得する検索手段と、
    前記検索結果の文から前記回答候補を抽出し、前記回答候補毎に該回答候補の尤度を表す数値を付与する回答候補抽出手段と、
    前記回答候補が表す事物の同一性についての回答候補間の関係を示す関係情報を生成する関係情報生成手段と、
    前記抽出された回答候補から、前記関係情報に基づいて、同一の事物を表す回答候補からなる回答候補集合を生成し、前記回答候補集合毎に、該回答候補集合に含まれる回答候補に付与された尤度の数値を集計する回答候補結合手段と、
    前記尤度の集計値が最も大きい前記回答候補集合に含まれる回答候補のいずれかを優先的に提示する制御を行う提示制御手段とを有することを特徴とする質問応答システム。
  2. 前記関係情報生成手段は、1の回答候補を含む検索結果の文における単語のベクトルと、他の回答候補を含む検索結果の文における単語のベクトルとの内積を算出し、該内積が所定値以上である場合に、前記1及び他の回答候補が同一の事物を表すものであることを示す関係情報を生成することを特徴とする請求項1に記載の質問応答システム。
  3. 前記関係情報生成手段は、同一の事物を表す回答候補のいずれかがこれら回答候補の代表となる回答候補であることを示す関係情報を生成し、
    前記回答候補結合手段は、前記同一の事物を表す回答候補からなり、前記代表となる回答候補に他の回答候補を置き換えた回答候補集合を生成し、
    前記提示制御手段は、前記代表となる回答候補を優先的に提示する制御を行うことを特徴とする請求項1又は2に記載の質問応答システム。
  4. 前記関係情報生成手段は、前記第1の知識源とは異なる第2の知識源に含まれる文に基づいて、前記回答候補が表す事物の同一性についての回答候補間の関係を示す関係情報を生成することを特徴とする請求項1乃至3のいずれかに記載の質問応答システム。
  5. 前記関係情報生成手段により生成された関係情報を保持する関係情報保持手段を有することを特徴とする請求項1乃至4のいずれかに記載の質問応答システム。
  6. 入力した検索質問文に応じて、検索対象文を含む第1の知識源を検索し、前記検索質問文の回答となり得る回答候補を得る質問応答システムでの処理方法であって、
    前記検索質問文から検索語を抽出する検索語抽出ステップと、
    前記検索語に基づいて前記第1の知識源に含まれる検索対象文の中から検索結果の文を取得する検索ステップと、
    前記検索結果の文から前記回答候補を抽出し、前記回答候補毎に該回答候補の尤度を表す数値を付与する回答候補抽出ステップと、
    前記回答候補が表す事物の同一性についての回答候補間の関係を示す関係情報を生成する関係情報生成ステップと、
    前記抽出された回答候補から、前記関係情報に基づいて、同一の事物を表す回答候補からなる回答候補集合を生成し、前記回答候補集合毎に、該回答候補集合に含まれる回答候補に付与された尤度の数値を集計する回答候補結合ステップと、
    前記尤度の集計値が最も大きい前記回答候補集合に含まれる回答候補のいずれかを優先的に提示する制御を行う提示制御ステップとを有することを特徴とする処理方法。
  7. 前記関係情報生成ステップは、1の回答候補を含む検索結果の文の集合における単語のベクトルと、他の回答候補を含む検索結果の文の集合における単語のベクトルとの内積を算出し、該内積が所定値以上である場合に、前記1及び他の回答候補が同一の事物を表すものであることを示す関係情報を生成することを特徴とする請求項6に記載の処理方法。
  8. 前記関係情報生成手段は、同一の事物を表す回答候補のいずれかがこれら回答候補の代表となる回答候補であることを示す関係情報を生成し、
    前記回答候補結合ステップは、前記同一の事物を表す回答候補からなり、前記代表となる回答候補に他の回答候補を置き換えた回答候補集合を生成し、
    前記提示制御ステップは、前記代表となる回答候補を優先的に提示する制御を行うことを特徴とする請求項6又は7に記載の処理方法。
  9. 前記関係情報生成ステップは、前記第1の知識源とは異なる第2の知識源に含まれる文に基づいて、前記回答候補が表す事物の同一性についての回答候補間の関係を示す関係情報を生成することを特徴とする請求項6乃至8のいずれかに記載の処理方法。
  10. 前記関係情報生成ステップにより生成された関係情報を記憶装置に保持させる関係情報保持ステップを有することを特徴とする請求項6乃至9のいずれかに記載の処理方法。
  11. 入力した検索質問文に応じて、検索対象文を含む第1の知識源を検索し、前記検索質問文の回答となり得る回答候補を得る質問応答システムにて実行可能なプログラムであって、
    前記検索質問文から検索語を抽出する検索語抽出ステップと、
    前記検索語に基づいて前記第1の知識源に含まれる検索対象文の中から検索結果の文を取得する検索ステップと、
    前記検索結果の文から前記回答候補を抽出し、前記回答候補毎に該回答候補の尤度を表す数値を付与する回答候補抽出ステップと、
    前記回答候補が表す事物の同一性についての回答候補間の関係を示す関係情報を生成する関係情報生成ステップと、
    前記抽出された回答候補から、前記関係情報に基づいて、同一の事物を表す回答候補からなる回答候補集合を生成し、前記回答候補集合毎に、該回答候補集合に含まれる回答候補に付与された尤度の数値を集計する回答候補結合ステップと、
    前記尤度の集計値が最も大きい前記回答候補集合に含まれる回答候補のいずれかを優先的に提示する制御を行う提示制御ステップとを有することを特徴とするプログラム。
  12. 前記関係情報生成ステップは、1の回答候補を含む検索結果の文の集合における単語のベクトルと、他の回答候補を含む検索結果の文の集合における単語のベクトルとの内積を算出し、該内積が所定値以上である場合に、前記1及び他の回答候補が同一の事物を表すものであることを示す関係情報を生成することを特徴とする請求項11に記載のプログラム。
  13. 前記関係情報生成手段は、同一の事物を表す回答候補のいずれかがこれら回答候補の代表となる回答候補であることを示す関係情報を生成し、
    前記回答候補結合ステップは、前記同一の事物を表す回答候補からなり、前記代表となる回答候補に他の回答候補を置き換えた回答候補集合を生成し、
    前記提示制御ステップは、前記代表となる回答候補を優先的に提示する制御を行うことを特徴とする請求項11又は12に記載のプログラム。
  14. 前記関係情報生成ステップは、前記第1の知識源とは異なる第2の知識源に含まれる文に基づいて、前記回答候補が表す事物の同一性についての回答候補間の関係を示す関係情報を生成することを特徴とする請求項11乃至13のいずれかに記載のプログラム。
  15. 前記関係情報生成ステップにより生成された関係情報を記憶装置に保持させる関係情報保持ステップを有することを特徴とする請求項11乃至14のいずれかに記載のプログラム。
JP2006015719A 2006-01-24 2006-01-24 質問応答システム、質問応答処理方法及び質問応答プログラム Pending JP2007199876A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006015719A JP2007199876A (ja) 2006-01-24 2006-01-24 質問応答システム、質問応答処理方法及び質問応答プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006015719A JP2007199876A (ja) 2006-01-24 2006-01-24 質問応答システム、質問応答処理方法及び質問応答プログラム

Publications (1)

Publication Number Publication Date
JP2007199876A true JP2007199876A (ja) 2007-08-09

Family

ID=38454461

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006015719A Pending JP2007199876A (ja) 2006-01-24 2006-01-24 質問応答システム、質問応答処理方法及び質問応答プログラム

Country Status (1)

Country Link
JP (1) JP2007199876A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010157199A (ja) * 2008-12-02 2010-07-15 Mie Univ 自動演習システム及び自動演習プログラム
US20150161242A1 (en) * 2013-12-05 2015-06-11 International Business Machines Corporation Identifying and Displaying Relationships Between Candidate Answers
JP2018045320A (ja) * 2016-09-12 2018-03-22 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010157199A (ja) * 2008-12-02 2010-07-15 Mie Univ 自動演習システム及び自動演習プログラム
US20150161242A1 (en) * 2013-12-05 2015-06-11 International Business Machines Corporation Identifying and Displaying Relationships Between Candidate Answers
JP2015109068A (ja) * 2013-12-05 2015-06-11 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 回答候補間の関係を識別および表示する機構、方法、コンピュータ・プログラム、ならびに装置
US9558264B2 (en) 2013-12-05 2017-01-31 International Business Machines Corporation Identifying and displaying relationships between candidate answers
US9558263B2 (en) * 2013-12-05 2017-01-31 International Business Machines Corporation Identifying and displaying relationships between candidate answers
JP2018045320A (ja) * 2016-09-12 2018-03-22 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム

Similar Documents

Publication Publication Date Title
US20190163691A1 (en) Intent Based Dynamic Generation of Personalized Content from Dynamic Sources
JP5011751B2 (ja) 訳語情報出力処理プログラム,処理方法および処理装置
JP5825676B2 (ja) ノン・ファクトイド型質問応答システム及びコンピュータプログラム
JP4650072B2 (ja) 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
CN109657054A (zh) 摘要生成方法、装置、服务器及存储介质
JP3983265B1 (ja) 辞書作成支援システム、方法及びプログラム
JP2019067433A (ja) 話題提供システム
JP2020004045A (ja) 質問応答装置及びコンピュータプログラム
US20210240775A1 (en) System and method for providing automated and unsupervised inline question answering
JP2022047291A (ja) 情報処理装置、方法、及びプログラム
JP5538185B2 (ja) テキストデータ要約装置、テキストデータ要約方法及びテキストデータ要約プログラム
KR20170122755A (ko) 함의 페어 확장 장치, 그것을 위한 컴퓨터 프로그램, 및 질문 응답 시스템
CN111767394A (zh) 一种基于人工智能专家系统的摘要提取方法及装置
Stalin et al. Web based application for hindi question answering system
JP2007207127A (ja) 質問応答システム、質問応答処理方法及び質問応答プログラム
JP2007199876A (ja) 質問応答システム、質問応答処理方法及び質問応答プログラム
Widad et al. Bert for question answering applied on covid-19
KR102519955B1 (ko) 토픽 키워드의 추출 장치 및 방법
JP5211000B2 (ja) ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム
JP2007080019A (ja) 自然言語処理システム、自然言語処理方法、自然言語処理プログラム
JP6988715B2 (ja) 回答文選択装置、方法、およびプログラム
JP2007164462A (ja) 質問応答システム、質問応答方法及び質問応答プログラム
Dissanayake et al. Enhancing conversational ai model performance and explainability for sinhala-english bilingual speakers
JP7131518B2 (ja) 電子機器、発音学習方法、サーバ装置、発音学習処理システムおよびプログラム
JP2005157823A (ja) 知識ベースシステム、および同システムにおける単語間の意味関係判別方法、ならびにそのコンピュータプログラム