JP6270747B2 - 質問応答方法、装置、及びプログラム - Google Patents

質問応答方法、装置、及びプログラム Download PDF

Info

Publication number
JP6270747B2
JP6270747B2 JP2015007130A JP2015007130A JP6270747B2 JP 6270747 B2 JP6270747 B2 JP 6270747B2 JP 2015007130 A JP2015007130 A JP 2015007130A JP 2015007130 A JP2015007130 A JP 2015007130A JP 6270747 B2 JP6270747 B2 JP 6270747B2
Authority
JP
Japan
Prior art keywords
text
unit
sentence
query
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015007130A
Other languages
English (en)
Other versions
JP2016133919A (ja
Inventor
仁 西川
仁 西川
九月 貞光
九月 貞光
千明 宮崎
千明 宮崎
久子 浅野
久子 浅野
松尾 義博
義博 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015007130A priority Critical patent/JP6270747B2/ja
Publication of JP2016133919A publication Critical patent/JP2016133919A/ja
Application granted granted Critical
Publication of JP6270747B2 publication Critical patent/JP6270747B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は質問応答方法、装置、及びプログラムに係り、特に、質問に対する応答を生成するための質問応答方法、装置、及びプログラムに関する。
インターネット上には機械が再利用しやすい形でデータが蓄積されつつあり、それらのデータを用いることで人間に対して知的な応答を行う試みがなされている。これらの情報は様々な形で格納されているが、典型的には<実体、属性、値>の3つ組の形で保存されていることが多い。例えば、「鶴岡八幡宮の創建はいつですか?」というような情報は、<鶴岡八幡宮、創建、康平6年(1063年)>というような3つ組として表現することができる。このような情報として、既存のデータベースを用いることもできるし、事前に何らかの情報抽出などを行って得ることもできる。これら3つ組の情報が格納されたデータベースを利用する質問応答を、以降、データベース型質問応答と呼ぶ。
これらのデータベースを用いることによって、例えば「鶴岡八幡宮の創建はいつですか?」というような質問から、<鶴岡八幡宮、創建、?>というような検索クエリを生成し、実体が「鶴岡八幡宮」、属性が「創建」のレコード<鶴岡八幡宮、創建、康平6年(1063年)>をデータベースから探してくることによって、「康平6年(1063年)」というような回答を生成することができる。
特開2013−250926号公報 特開2013−097723号公報
徳永健伸、情報検索と言語処理、東京大学出版会、1999. Takeshi Fuchi and Shinichiro Takagi,"Japanese Morphological Analyzer using Word Co-occurrence - JTAG", In Proceedings of the 36th Annual Meeting of the Association for Computational Linguistics and 17th International Conference on Computational Linguistics (Volume 1), pp. 409-413, 1998. Kenji Imamura, Genichiro Kikuiand Norihito Yasuda,"Japanese Dependency Parsing Using Sequential Labeling for Semi-spoken Language", In Proceedings of the 45th Annual Meeting of the Association for Computational Linguistics Companion Volume Proceedings of the Demo and Poster Sessions, pp. 225-228, 2007. Hitoshi Nishikawa, Kazuho Arita, Katsumi Tanaka, Tsutomu Hirao, Toshiro Makino and Yoshihiro Matsuo,"Learning to Generate Coherent Summary with Discriminative Hidden Semi-Markov Model", In Proceedings of the 25th International Conference on Computational Linguistics: Technical Papers, pp.1648-1659, 2014.
データベース型質問応答の方法は、ある特定の山の具体的な標高や、人名などの、典型的には固有名詞や数量表現などの、情報抽出の対象となる固有表現を回答することができる。その一方、例えば、どのような経緯で鶴岡八幡宮が創建されたかというような、付加的な情報を質問応答システムが回答することを考えると、そのような情報が格納されているデータベースが必要になる。しかし、一般に既存のデータベースに格納されている情報は上述のように固有名詞や数量表現などであり、例えば「康平6年(1063年)8月に河内国(大阪府羽曳野市)を本拠地とする河内源氏2代目の源頼義が、前九年の役での戦勝を祈願した京都の石清水八幡宮護国寺(あるいは河内源氏氏神の壺井八幡宮)を鎌倉の由比郷鶴岡(現材木座1丁目)に鶴岡若宮として勧請したのが始まりである。」(非特許文献5:日本語版 Wikipedia 「鶴岡八幡宮」,[2014年10月24日検索],インターネット<URL:http://ja.wikipedia.org/wiki/%E9%B6%B4%E5%B2%A1%E5%85%AB%E5%B9%A1%E5%AE%AE >)というような自然文での値はデータベースには用意されていないことが多く、そのままでは適切な回答を生成することはできない。
本発明は、上記問題点を解決するために成されたものであり、クエリに対する応答として適切な関連情報を提示できる質問応答装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、第1の発明に係る質問応答方法は、ユーザから与えられたクエリに対する応答を生成する質問応答装置における質問応答方法であって、クエリ入力部が、クラスが定められた複数の要素の組み合わせからなるクエリを受け付けるステップと、テキスト検索部が、予め用意されたテキストデータベースから、前記クエリ入力部で受け付けた前記クエリに含まれる要素に関連するテキストを検索するステップと、テキスト解析部が、前記テキスト検索部で検索されたテキストの構文を解析するステップと、テキスト要約部が、前記テキスト解析部で解析されたテキストと、前記クエリの前記複数の要素の組み合わせとに基づいて、前記テキストについての要約文を生成するステップと、応答出力部が、前記テキスト要約部で生成された前記要約文を応答として出力するステップと、を含んで実行することを特徴とする。
また、第1の発明に係る質問応答方法において、パラメタ適応部が、前記クエリ入力部で受け付けた前記クエリと、予め学習された、前記複数の要素の各々のクラスに関する特徴を含む複数の特徴に対するパラメタとに基づいて、前記複数の要素の各々のクラスに関する特徴に対するパラメタを、前記クエリの前記複数の要素の各々に関する特徴に対するパラメタに置き換えた適応後パラメタを得るステップを更に含み、前記テキスト要約部が、前記テキストについての要約文を生成するステップは、前記テキスト解析部で解析されたテキストと、前記パラメタ適応部で得られた適応後パラメタとに基づいて、前記テキストについての要約文を生成するようにしてもよい。
また、第1の発明に係る質問応答方法において、文末表現変換部が、前記テキスト要約部で生成された要約文について、前記要約文に含まれる文末表現を、前記応答を表現するための文末表現に変換するステップを更に含み、応答出力部が、要約文を応答として出力するステップは、前記文末表現変換部で変換された前記要約文を応答として出力するようにしてもよい。
第1の発明に係る質問応答装置は、ユーザから与えられたクエリに対する応答を生成する質問応答装置であって、クラスが定められた複数の要素の組み合わせからなるクエリを受け付けるクエリ入力部と、予め用意されたテキストデータベースから、前記クエリ入力部で受け付けた前記クエリに含まれる要素に関連するテキストを検索するテキスト検索部と、前記テキスト検索部で検索されたテキストの構文を解析するテキスト解析部と、前記テキスト解析部で解析されたテキストと、前記クエリの前記複数の要素の組み合わせとに基づいて、前記テキストについての要約文を生成するテキスト要約部と、前記テキスト要約部で生成された前記要約文を応答として出力する応答出力部と、を含んで構成されている。
また、第1の発明に係る質問応答装置において、前記クエリ入力部で受け付けた前記クエリと、予め学習された、前記複数の要素の各々のクラスに関する特徴を含む複数の特徴に対するパラメタとに基づいて、前記複数の要素の各々のクラスに関する特徴に対するパラメタを、前記クエリの前記複数の要素の各々に関する特徴に対するパラメタに置き換えた適応後パラメタを得るパラメタ適応部を更に含み、前記テキスト要約部は、前記テキスト解析部で解析されたテキストと、前記パラメタ適応部で得られた適応後パラメタとに基づいて、前記テキストについての要約文を生成してもよい。
また、第1の発明に係る質問応答装置において、前記テキスト要約部で生成された要約文について、前記要約文に含まれる文末表現を、前記応答を表現するための文末表現に変換する文末表現変換部を更に含み、応答出力部は、前記文末表現変換部で変換された前記要約文を応答として出力してもよい。
第1の発明に係るプログラムは、コンピュータに、上記の質問応答方法を構成する各ステップを実行させるためのプログラムである。
本発明の質問応答方法、装置、及びプログラムによれば、クラスが定められた複数の要素の組み合わせからなるクエリを受け付け、予め用意されたテキストデータベースから、クエリに含まれる要素に関連するテキストを検索し、検索されたテキストの構文を解析し、解析されたテキストと、クエリの複数の要素の組み合わせとに基づいて、テキストについての要約文を生成して応答として出力することにより、クエリに対する応答として適切な関連情報を提示できる、という効果が得られる。
本実施の形態に係る質問応答パラメタ学習装置の機能的な構成例を示すブロック図である。 訓練事例データベース8の一例を示す図である。 ある訓練事例の一例を示す図である。 特徴ベクトルの一例を示す図である。 適応前パラメタデータベース40の一例を示す図である。 本実施の形態に係る質問応答装置の機能的な構成例を示すブロック図である。 検索されたテキストの一例を示す図である。 解析されたテキストの一例を示す図である。 適応後パラメタデータベース40の一例を示す図である。 文末表現抽出装置の機能的な構成例を示すブロック図である。 文末表現変換部の機能的な構成例を示すブロック図である。 本実施の形態における質問応答パラメタ学習処理ルーチンを示すフローチャートである。 本実施の形態における質問応答処理ルーチンを示すフローチャートである。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
<本発明の実施の形態に係る概要>
まず、本発明の実施の形態における概要を説明する。
本発明の実施の形態では、データベース型質問応答において、クラスが定められた複数の要素の組み合わせとして、3つ組<実体、属性、値>が与えられた際に、それに付随する応答を生成する方法を提案する。これによって、例えば「鶴岡八幡宮の創建はいつですか?」という質問がなされ、それに対して3つ組のクラスの各々に関する要素の組み合わせ<鶴岡八幡宮、創建、康平6年(1063年)>が回答として得られたときに、「康平6年(1063年)8月に河内国(大阪府羽曳野市)を本拠地とする河内源氏2代目の源頼義が、前九年の役での戦勝を祈願した京都の石清水八幡宮護国寺(あるいは河内源氏氏神の壺井八幡宮)を鎌倉の由比郷鶴岡(現材木座1丁目)に鶴岡若宮として勧請したのが始まりである。」(上記非特許文献5参照)という関連情報を生成することができるようになる。また、これによって、質問応答システムの利用者に対して、単なる端的な回答だけでなくて、関連する情報も合わせて提示することができるようになる。なお、本実施の形態では、クラスが定められた3つの要素の組み合わせを用いた場合を例に説明するが、これに限定されるものではなく、クラスが定められているものであれば3つ以上の要素の組み合わせを用いて、応答を生成するようにしてもよい。
<本発明の実施の形態に係る質問応答パラメタ学習装置の構成>
次に、本発明の実施の形態に係る質問応答パラメタ学習装置の構成について説明する。図1に示すように、本発明の実施の形態に係る質問応答パラメタ学習装置100は、CPUと、RAMと、後述する質問応答パラメタ学習処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この質問応答パラメタ学習装置100は、機能的には図1に示すように入力部10と、演算部20とを備えている。
入力部10は、訓練事例データベース8の入力を受け付ける。訓練事例データベース8は3つの要素の組み合わせからなるクエリと、テキストと、当該テキストを要約して作成された、クエリに付随する説明の3つを組とした1つ以上のレコードからなるデータベースである。図2に訓練事例データベース8の一例を示す。図2の事例番号1は、3つの要素の組み合わせからなるクエリ「<建長寺、創建、建長5年(1253年)>」、「建長寺」に関するテキスト、及び、クエリに付随する説明の3つからなる。
演算部20は、パラメタ推定部30と、適応前パラメタデータベース40とを含んで構成されている。
パラメタ推定部30は、入力部10で受け付けた訓練事例データベース8に基づいて、パラメタを学習し、適応前パラメタデータベース40として記憶する。パラメタの学習には、一例として上記特許文献2記載のテキスト要約方法を用いることができる。
パラメタ推定部30は、具体的には、まず、入力された訓練事例データベース8の訓練事例の各々、すなわち3つの要素の組み合わせからなるクエリ(以下、qとする)、テキスト(以下、xとする)、及び説明(以下、yとする)に対してそれぞれ形態素解析および係り受け解析を行う。なお、形態素解析に非特許文献2記載の方法を、係り受け解析に非特許文献3記載の方法を利用することができる。
次に、パラメタ推定部30は、訓練事例の各々の解析の結果から、クエリに含まれる3つの要素の各々のクラスに関する特徴を要素として含む特徴ベクトルを構築する。特徴ベクトル^f(x;y,q)は、一例として、テキストx及びクエリqに含まれている単語の各々に対する、当該単語が、説明yに含まれている場合に1、そうでない場合に0となる要素から構成される。なお、ベクトルを表す記号には、記号の前に「^」を付して表現する。
ここで、パラメタ推定部30では、特徴ベクトル^f(x;y,q)を構築する際に、クエリの<実体、属性、値>を構成する単語については、単に単語として扱うのではなく、クエリの<実体、属性、値>といったクラスとして扱う。例を図3及び図4に示す。図3に示す訓練事例では、テキストxに含まれる「京都」という単語は説明yに含まれないため、図4に示す特徴ベクトルでは、対応する特徴ベクトルの要素は0となっている。一方、単語「落慶」はいずれにも含まれるため、対応する特徴ベクトルの要素は1となっている。また、クエリに含まれる<実体、属性、値>を構成する単語については、それぞれ一例として「単語-<実体>」、「単語-<属性>」、「単語-<値>」という要素を用意し、これを説明yが含むか否かに基づいて、ベクトルの値を決定する。例えば、クエリの実体である単語「建長寺」は説明yに含まれるため、対応する「単語-<実体>」のベクトルの要素は1となる。同様に、「単語-<属性>」である「創建」、「単語-<値>」である「建長5年(1253年)」も説明yに含まれるため、対応するベクトルの要素はそれぞれ1となる。なお、ここで、例えば「建長5年(1253年)」などの複数の単語から構成される表現がクエリの実体や属性、値であった場合は、表現が完全一致している場合だけでなく、この例では「建長」などのクエリの実体や属性、値を構成する単語が、部分的に説明yに含まれている場合でも、ベクトルの要素を1としてもよい。
次に、パラメタ推定部30は、訓練事例の各々について構築された特徴ベクトルを用いて、クエリに含まれる3つの要素(単語)の各々のクラスに関する特徴(「単語-<実体>」、「単語-<属性>」、「単語-<値>」が説明yに含まれている否か)、及びその他の単語の特徴(単語が説明yに含まれている否か)の各々に対するパラメタの学習を行う。パラメタの学習についても、上記特許文献2記載の方法を用いて行うことができる。学習の際に用いられる要約方法としては、上記非特許文献4記載の方法を用いることができる。そして、学習したパラメタを適応前パラメタデータベース40として記憶する。
適応前パラメタデータベース40は、パラメタ推定部30において訓練事例データベース4を用いて機械学習を行った結果として得られるものである。図5に例を示す。図5では、一例として、クエリの「単語-<実体>」、「単語-<属性>」、「単語-<値>」の各々に対する重み、及びその他の単語の各々に対する重みが、パラメタとして格納されている。
<本発明の実施の形態に係る質問応答装置の構成>
次に、本発明の実施の形態に係る質問応答装置の構成について説明する。図1に示すように、本発明の実施の形態に係る質問応答装置200は、CPUと、RAMと、後述する質問応答処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この質問応答装置200は、機能的には図6に示すようにクエリ入力部210と、演算部220と、応答出力部250とを備えている。
クエリ入力部210は、クラスが<実体、属性、値>と定められた3つの要素の組み合わせからなるクエリを受け付ける。このクエリはデータベース型質問応答システムに対して入力された何らかの質問に対して、データベース型質問応答システムが出力した応答である。本実施の形態では、例えば、「鶴岡八幡宮の創建はいつ?」というような質問に対して、データベース型質問応答システムが生成した3つの要素の組み合わせとして、<鶴岡八幡宮、創建、康平6年(1063年)>からなるクエリを入力として受け付ける。なお、データベース型質問応答システムとしては、例えば上記特許文献1記載の方法(対象抽出と属性判定に基づく質問応答装置)を用いることができる。
演算部220は、テキスト検索部230と、テキスト解析部232と、パラメタ適応部234と、テキスト要約部236と、文末表現変換部238と、適応前パラメタデータベース240と、適応後パラメタデータベース242とを含んで構成されている。
適応前パラメタデータベース240には、適応前パラメタデータベース40と同じものが記憶されている。
テキスト検索部230は、予め用意されたテキストデータベースから、クエリ入力部210で受け付けたクエリに含まれる特定の要素に関連するテキストを検索する。
テキスト検索部230は、具体的には、クエリ入力部210で受け付けたクエリを用いて、テキスト検索部230に予め用意された何らかのデータベースに格納されている1つ以上のテキストを検索する。一例として、日本語版ウィキペディアの全ての記事が格納されたデータベースを予め用意しておき、その中から、入力された3つの要素の組み合わせのうち、<実体>の要素と完全一致する見出しを持つテキストを検索することができる。例えば、3つの要素の組み合わせとして、<鶴岡八幡宮、創建、康平6年(1063年)>というクエリが入力された場合、データベースの中から「鶴岡八幡宮」の見出しを持つテキストを検索する。検索には、一例として上記非特許文献1記載の、既知の検索方法を利用することができる。図7に、テキスト検索部230で検索されたテキストの一例を示す。
テキスト解析部232は、テキスト検索部230で検索されたテキストの構文を解析する。テキスト解析部232は、具体的には、テキスト検索部230で検索され出力されたテキストを受け取り、当該テキストに対して形態素解析および係り受け解析の処理を加える。それぞれ、形態素解析に非特許文献2記載の方法を、係り受け解析に上記非特許文献3記載の方法を利用することができる。図8に、テキスト解析部で解析されたテキストの一例を示す。図8では、テキスト検索部230で検索されたテキストに対して解析が行われている。図8のmから始まる行は形態素解析の結果として得られた、わかち書き及び形態素の品詞情報、cから始まる行は、係り受け解析の結果として得られた文節及び分節の係り受けの情報である。この例では、係り受け解析器は「康平6年(1063年)」という文節が次の「8月に」という文節にかかり、また「8月に」という文節は「8月」という形態素と「に」という形態素に分かれることが示されている。
パラメタ適応部234は、クエリ入力部210で受け付けた3つの要素の組み合わせからなるクエリと、適応前パラメタデータベース240に記憶されている3つの要素の各々のクラスに関する特徴、及びその他の単語各々の特徴に対するパラメタとに基づいて、3つの要素の各々のクラスに関する特徴に対するパラメタを、クエリの3つの要素の各々に関する特徴に対するパラメタに置き換えた適応後パラメタを得て、適応後パラメタデータベース242として記憶する。
パラメタ適応部234は、具体的には、適応前パラメタデータベース240に「単語-<実体>」、「単語-<属性>」、「単語-<値>」と抽象化された形で記憶されている特徴を、クエリ入力部210で受け付けたクエリに合わせて書き換える。例えば、3つの要素の組み合わせからなるクエリが<鶴岡八幡宮、創建、康平6年(1063年)>であった場合、適応前パラメタデータベース240の「単語-<実体>」は「鶴岡八幡宮」に、「単語-<属性>」は「創建」に、「単語-<値>」は「康平6年(1063年)」にそれぞれ置き換えられる。このように置き換えることで、クエリ入力部210で受け付けたクエリの3つの要素の組み合わせに合わせて、パラメタデータベースを適応させる。
適応後パラメタデータベース242は、パラメタ適応部234から出力されたパラメタを格納するデータベースである。図9に示す例では、クエリの要素のクラス「実体」、「属性」、「値」の重みが、クエリに適応するように書き換えられて記憶されている。例えば、「単語-<実体>」は「鶴岡八幡宮」に、「単語-<属性>」は「創建」に、「単語-<値>」は「康平6年(1063年)」にそれぞれ置き換えられている。
テキスト要約部236は、テキスト解析部232で解析されたテキストと、パラメタ適応部234で得られた適応後パラメタデータベース242に記憶された適応後パラメタとに基づいて、テキストについての要約文を生成する。要約文の生成方法は、一例として、非特許文献4記載の方法を用いて、テキストから一文を選択し、選択した一文を要約文として生成すればよい。
文末表現変換部238は、以下に説明するように、テキスト要約部236で生成された要約文について、要約文に含まれる文末表現を、応答を表現するための文末表現に変換する。
文末表現変換部238における文末表現の変換の一例としては、要約文の文末を敬体に変換することである。例えば、「康平6年(1063年)8月に河内国(大阪府羽曳野市)を本拠地とする河内源氏2代目の源頼義が、前九年の役での戦勝を祈願した京都の石清水八幡宮護国寺(あるいは河内源氏氏神の壺井八幡宮)を鎌倉の由比郷鶴岡(現材木座1丁目)に鶴岡若宮として勧請したのが始まりである。」という応答の文末は常体であり、口語的ではないため、質問応答システムの応答としては、場合によっては不適当である。そのような場合は、「康平6年(1063年)8月に河内国(大阪府羽曳野市)を本拠地とする河内源氏2代目の源頼義が、前九年の役での戦勝を祈願した京都の石清水八幡宮護国寺(あるいは河内源氏氏神の壺井八幡宮)を鎌倉の由比郷鶴岡(現材木座1丁目)に鶴岡若宮として勧請したのが始まりです。」のように文末を敬体に変換する。文末表現の変換には具体的には、以下の方法を用いることができる。
文末表現変換部238は、例えば、文末表現抽出装置において抽出した特徴的文末表現リストデータベースに基づいて、テキスト要約部236で生成された要約文の文末表現を、応答を表現する文末表現に変換することができる。
[文末表現抽出装置の処理]
文末表現抽出装置1000は、機能的には、図10に示すように、リスト生成用入力部1001と、リスト生成用演算部1002と、対話行為毎の特徴的文末表現リストデータベース1003とを含んだ構成で表すことができる。以下、各部について詳述する。
リスト生成用入力部1001は、発話の意図を表す対話行為の種類が各々付与された複数の対話テキストを受け付ける。対話テキストは、1つ以上の文を含む文書である。また、対話行為の種類(タグセット)は、(1)情報提供、(2)自己開示(事実、経験、欲求等をサブタグとして持つ)、(3)質問(事実、経験、欲求、自問等をサブタグとして持つ)、(4)共感・同意、非共感・非同意であるが、本実施の形態では、(1)情報提供に係る特徴的文末表現リストのみを抽出する。なお、本実施の形態では、応答を表現する文末表現として、情報提供を表現する文末表現を用いる場合を例に説明する。
リスト生成用演算部1002は、対話行為の種類が情報提供である場合に関する特徴的文末表現リストを生成する。リスト生成用演算部1002は、対話行為付与済テキストデータベース1020と、リスト生成部1022とを備えている。
対話行為付与済テキストデータベース1020には、リスト生成用入力部1001により受け付けた複数の対話テキストが格納される。
リスト生成部1022は、文末表現抽出部1024と、特徴的文末表現抽出部1026と、文末表現拡張部1028と、不要文末表現フィルタ部1030とを備えている。
文末表現抽出部1024は、対話行為付与済テキストデータベース1020に格納された複数の対話テキストの各々について、当該対話テキストから、文末表現を抽出し、文末表現リストを生成する。また、文末表現抽出部1024は、対話行為付与済テキストデータベース1020に格納された複数の対話テキストに基づいて、各文末表現に対応する対話行為の種類に関する対話行為リストを生成する。
特徴的文末表現抽出部1026は、文末表現抽出部1024によって、複数の対話テキストから抽出された文末表現から、当該情報提供に関する対話テキストにおける文末表現の出現頻度と、対話行為付与済テキストデータベース1020に格納されている、当該情報提供とは異なる対話行為の種類が付与された対話テキストにおける文末表現の出現頻度とに基づいて、対話における情報提供を表現するための文末表現を抽出する。
文末表現拡張部1028は、特徴的文末表現抽出部1026によって生成された特徴的文末表現候補リストと、予め用意された動詞・形容詞の活用語尾リストとに基づいて、特徴的文末表現抽出部1026によって抽出された対話における情報提供を表現するための文末表現の各々に対して、文末表現の活用語尾を変化させて、対話における情報提供を表現するための文末表現として、活用型が異なる複数の文末表現を生成する。
不要文末表現フィルタ部1030は、文末表現拡張部1028によって生成された活用型拡張文末表現リストに基づいて、対話における情報提供を表現するための文末表現から、予め定められた言いさし表現、及び予め定められた文脈に依存する表現の少なくとも一方を含む文末表現を削除して、情報提供に関する文末表現のリストを、特徴的文末表現リストデータベース1003に記憶する。
[文末表現変換部の処理]
文末表現変換部238は、機能的には、図11に示すように、入力部2004と、対話行為毎の特徴的文末表現リストデータベース2005と、演算部2006と、出力部2007とを含んだ構成で表すことができる。以下、各部について詳述する。
入力部2004は、文末表現変換対象のテキストとして、要約文を受け付ける。
特徴的文末表現リストデータベース2005には、文末表現抽出装置1000の特徴的文末表現リストデータベース1003に格納されている特徴的文末表現リストと同じ情報提供に関する特徴的文末表現リストが格納される。
演算部2006は、文末表現抽出部2060と、文末表現候補生成部2062と、文末表現変換部2064とを備えている。
文末表現抽出部2060は、入力部2004により受け付けた要約文から、文末表現及び当該文末表現の直前に出現する形態素の品詞を抽出する。
文末表現候補生成部2062は、特徴的文末表現リストデータベース2005に格納された、情報提供に関する特徴的文末表現リストにおける、文末表現の直前に出現する形態素の品詞と、文末表現抽出部2060によって抽出された文末表現の直前の形態素の品詞とを照合する。そして、文末表現候補生成部2062は、情報提供に関する特徴的文末表現リストから、文末表現抽出部2060によって抽出された文末表現の直前の形態素の品詞に対応する、情報提供を表現するための文末表現を、文末表現の変換候補として抽出し、抽出された文末表現からなる変換候補リストを生成する。
文末表現変換部2064は、文末表現候補生成部2062によって生成された変換候補リストを用いて、要約文に含まれる文末表現を、対話における情報提供を表現するための文末表現に変換することにより、応答を表現するための文末表現に変換する。
そして、応答出力部250は、文末表現変換部238で変換された要約文を応答として出力する。
<本発明の実施の形態に係る質問応答パラメタ学習装置の作用>
次に、本発明の実施の形態に係る質問応答パラメタ学習装置100の作用について説明する。入力部10において、3つの要素の組み合わせからなるクエリと、テキストと、当該テキストを要約して作成された、クエリに付随する説明の3つを組とした1つ以上のレコードを受け付けると、訓練事例データベース8に格納し、質問応答パラメタ学習装置100は、図12に示す質問応答パラメタ学習処理ルーチンを実行する。
まず、ステップS100では、訓練事例データベース8から訓練事例として1つのレコードを選択する。
次に、ステップS102では、ステップS100で選択した訓練事例について、クエリq、テキストx、及び説明yに対してそれぞれ形態素解析および係り受け解析を行う。
ステップS104では、ステップS102で解析したクエリq、テキストx、及び説明yに基づいて、特徴ベクトル^f(x;y,q)を構築する。
ステップS106では、全ての訓練事例について、ステップS102〜ステップS104の処理を終了したかを判定し、終了していなければステップS100へ戻って処理を繰り返し、終了していればステップS108へ移行する。
ステップS108では、ステップS104で訓練事例の各々について構築された特徴ベクトルを用いて、クエリに含まれる3つの要素(単語)の各々のクラスに関する特徴、及びその他の単語の特徴の各々に対するパラメタの学習し、適応前パラメタデータベース40として記憶し処理を終了する。
以上説明したように、本実施の形態に係る質問応答パラメタ学習装置によれば、3つの要素の組み合わせからなるクエリと、テキストと、当該テキストを要約して作成された、クエリに付随する説明の3つを組とした1つ以上のレコードからなる訓練事例データベース8に基づいて、パラメタを学習することにより、クエリに対する応答として適切な関連情報を提示するためのパラメタを学習できる、という効果が得られる。
<本発明の実施の形態に係る質問応答装置の作用>
次に、本発明の実施の形態に係る質問応答装置200の作用について説明する。クエリ入力部210において3つの要素の組み合わせからなるクエリを受け付けると、質問応答装置200は、図13に示す質問応答処理ルーチンを実行する。
まず、ステップS200では、クエリ入力部210において受け付けた3つの要素の組み合わせからなるクエリを取得する。
次に、ステップS202では、予め用意されたテキストデータベースから、ステップS200で取得したクエリに含まれる特定の要素に関連するテキストを検索する。
ステップS204では、ステップS202で検索されたテキストの構文を解析する。
ステップS206では、ステップS200で取得したクエリと、適応前パラメタデータベース240に記憶されているパラメタとに基づいて、3つの要素の各々のクラスに関する特徴に対するパラメタを、ステップS200で取得したクエリの3つの要素の各々に関する特徴に対するパラメタに置き換えた適応後パラメタを得る。
ステップS208では、ステップS206で解析されたテキストと、ステップS208で得られた適応後パラメタとに基づいて、テキストについての要約文を生成する。
ステップS210では、ステップS208で生成された要約文について、要約文に含まれる文末表現を、応答を表現するための文末表現に変換する。
そして、ステップS212では、ステップS210で文末表現が変換された要約文を応答として出力して処理を終了する。
以上説明したように、本実施の形態に係る質問応答装置によれば、クラスが<実体、属性、値>と定められた3つの要素の組み合わせからなるクエリを受け付け、受け付けたクエリの特定の要素に関連するテキストを検索し、検索されたテキストを解析し、クエリと、3つの要素の各々のクラスに関する特徴、及びその他の単語各々の特徴に対するパラメタとに基づいて、置き換えた適応後パラメタを得て、テキスト解析部232で解析されたテキストと、適応後パラメタデータベース242とに基づいて、テキストについての要約文を生成し、要約文に含まれる文末表現を、応答を表現するための文末表現に変換して、応答として出力することにより、クエリに対する応答として適切な関連情報を提示できる、という効果が得られる。
なお、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、上述した実施の形態では、要約部236において、テキストから一文を選択し、選択した一文を要約文として生成したが、これに限定されるものではなく、選択した一文が一定文字数以下となるように不要な文字列を除去する等して要約文を生成してもよい。また、テキストから、一定文字数以下となるように、1つ以上の文を選択して要約文を生成する等、いかなる方法で要約文を生成してもよい。
8 訓練事例データベース
10、2004 入力部
20、220、2006 演算部
30 パラメタ推定部
36 テキスト要約部
38 文末表現変換部
40 適応前パラメタデータベース
42 適応後パラメタデータベース
100 質問応答パラメタ学習装置
200 質問応答装置
210 クエリ入力部
230 テキスト検索部
232 テキスト解析部
234 パラメタ適応部
236 テキスト要約部
238 文末表現変換部
240 適応前パラメタデータベース
242 適応後パラメタデータベース
250 応答出力部
1000 文末表現抽出装置
1001 リスト生成用入力部
1002 リスト生成用演算部
1003、2005 特徴的文末表現リストデータベース
1020 対話行為付与済テキストデータベース
1022 リスト生成部
1024、2060 文末表現抽出部
1026 特徴的文末表現抽出部
1028 文末表現拡張部
1030 不要文末表現フィルタ部
2007 出力部
2062 文末表現候補生成部
2064 文末表現変換部

Claims (5)

  1. ユーザから与えられたクエリに対する応答を生成する質問応答装置における質問応答方法であって、
    クエリ入力部が、クラスが定められた複数の要素の組み合わせからなるクエリを受け付けるステップと、
    テキスト検索部が、予め用意されたテキストデータベースから、前記クエリ入力部で受け付けた前記クエリに含まれる要素に関連するテキストを検索するステップと、
    テキスト解析部が、前記テキスト検索部で検索されたテキストの構文を解析するステップと、
    パラメタ適応部が、前記クエリ入力部で受け付けた前記クエリと、予め学習された、前記複数の要素の各々のクラスに関する特徴を含む複数の特徴に対するパラメタとに基づいて、前記複数の要素の各々のクラスに関する特徴に対するパラメタを、前記クエリの前記複数の要素の各々に関する特徴に対するパラメタに置き換えた適応後パラメタを得るステップと
    テキスト要約部が、前記テキスト解析部で解析されたテキストと、前記パラメタ適応部で得られた適応後パラメタとに基づいて、前記テキストについての要約文を生成するステップと、
    応答出力部が、前記テキスト要約部で生成された前記要約文を応答として出力するステップと、
    を含む質問応答方法。
  2. 文末表現変換部が、前記テキスト要約部で生成された要約文について、前記要約文に含まれる文末表現を、前記応答を表現するための文末表現に変換するステップを更に含み、
    応答出力部が、要約文を応答として出力するステップは、前記文末表現変換部で変換された前記要約文を応答として出力する請求項1に記載の質問応答方法。
  3. ユーザから与えられたクエリに対する応答を生成する質問応答装置であって、
    クラスが定められた複数の要素の組み合わせからなるクエリを受け付けるクエリ入力部と、
    予め用意されたテキストデータベースから、前記クエリ入力部で受け付けた前記クエリに含まれる要素に関連するテキストを検索するテキスト検索部と、
    前記テキスト検索部で検索されたテキストの構文を解析するテキスト解析部と、
    前記クエリ入力部で受け付けた前記クエリと、予め学習された、前記複数の要素の各々のクラスに関する特徴を含む複数の特徴に対するパラメタとに基づいて、前記複数の要素の各々のクラスに関する特徴に対するパラメタを、前記クエリの前記複数の要素の各々に関する特徴に対するパラメタに置き換えた適応後パラメタを得るパラメタ適応部と、
    前記テキスト解析部で解析されたテキストと、前記パラメタ適応部で得られた適応後パラメタとに基づいて、前記テキストについての要約文を生成するテキスト要約部と、
    前記テキスト要約部で生成された前記要約文を応答として出力する応答出力部と、
    を含む質問応答装置。
  4. 前記テキスト要約部で生成された要約文について、前記要約文に含まれる文末表現を、前記応答を表現するための文末表現に変換する文末表現変換部を更に含み、
    応答出力部は、前記文末表現変換部で変換された前記要約文を応答として出力する請求項3に記載の質問応答装置。
  5. コンピュータに、請求項1又は請求項に記載の質問応答方法を構成する各ステップを実行させるためのプログラム。
JP2015007130A 2015-01-16 2015-01-16 質問応答方法、装置、及びプログラム Active JP6270747B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015007130A JP6270747B2 (ja) 2015-01-16 2015-01-16 質問応答方法、装置、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015007130A JP6270747B2 (ja) 2015-01-16 2015-01-16 質問応答方法、装置、及びプログラム

Publications (2)

Publication Number Publication Date
JP2016133919A JP2016133919A (ja) 2016-07-25
JP6270747B2 true JP6270747B2 (ja) 2018-01-31

Family

ID=56438137

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015007130A Active JP6270747B2 (ja) 2015-01-16 2015-01-16 質問応答方法、装置、及びプログラム

Country Status (1)

Country Link
JP (1) JP6270747B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230050937A (ko) 2021-10-08 2023-04-17 주식회사 케이티 요약문을 생성하는 장치, 방법 및 컴퓨터 프로그램

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10860800B2 (en) * 2017-10-30 2020-12-08 Panasonic Intellectual Property Management Co., Ltd. Information processing method, information processing apparatus, and program for solving a specific task using a model of a dialogue system
JP2019133229A (ja) * 2018-01-29 2019-08-08 国立研究開発法人情報通信研究機構 質問応答システムの訓練データの作成方法及び質問応答システムの訓練方法
JP6818706B2 (ja) 2018-02-13 2021-01-20 日本電信電話株式会社 情報提供装置、情報提供方法、およびプログラム
JP6979909B2 (ja) * 2018-03-20 2021-12-15 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
JP7127570B2 (ja) * 2019-02-18 2022-08-30 日本電信電話株式会社 質問応答装置、学習装置、質問応答方法及びプログラム
CN114579605B (zh) * 2022-04-26 2022-08-09 阿里巴巴达摩院(杭州)科技有限公司 表格问答数据处理方法、电子设备及计算机存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01279321A (ja) * 1988-04-30 1989-11-09 Nec Corp 質問応答装置
JP2002259371A (ja) * 2001-03-02 2002-09-13 Nippon Telegr & Teleph Corp <Ntt> 文書要約方法および装置と文書要約プログラムおよび該プログラムを記録した記録媒体
JP3712966B2 (ja) * 2001-08-31 2005-11-02 株式会社ジャストシステム プレゼンテーション資料生成装置、プレゼンテーション資料生成方法、及びプレゼンテーション資料生成プログラム
JP3820242B2 (ja) * 2003-10-24 2006-09-13 東芝ソリューション株式会社 質問応答型文書検索システム及び質問応答型文書検索プログラム
JP4635585B2 (ja) * 2004-12-02 2011-02-23 富士ゼロックス株式会社 質問応答システム、質問応答方法及び質問応答プログラム
JP5623369B2 (ja) * 2011-11-04 2014-11-12 日本電信電話株式会社 テキスト要約装置、方法及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230050937A (ko) 2021-10-08 2023-04-17 주식회사 케이티 요약문을 생성하는 장치, 방법 및 컴퓨터 프로그램

Also Published As

Publication number Publication date
JP2016133919A (ja) 2016-07-25

Similar Documents

Publication Publication Date Title
JP6270747B2 (ja) 質問応答方法、装置、及びプログラム
WO2018034118A1 (ja) 対話システム及びそのためのコンピュータプログラム
CN108885617B (zh) 语句解析系统以及程序
CN109947952B (zh) 基于英语知识图谱的检索方法、装置、设备及存储介质
JP6225012B2 (ja) 発話文生成装置とその方法とプログラム
JP6733809B2 (ja) 情報処理システム、情報処理装置、情報処理方法および情報処理プログラム
JP6955963B2 (ja) 検索装置、類似度算出方法、およびプログラム
JP6543283B2 (ja) パッセージ型質問応答装置、方法、及びプログラム
JP2016164708A (ja) 含意ペア拡張装置、そのためのコンピュータプログラム、及び質問応答システム
JP2013190985A (ja) 知識応答システム、方法およびコンピュータプログラム
JP6126965B2 (ja) 発話生成装置、方法、及びプログラム
JP5964924B2 (ja) 対話装置、方法、及びプログラム
JP6305630B2 (ja) 文書検索装置、方法及びプログラム
WO2020079752A1 (ja) 文献検索方法および文献検索システム
JP2019003270A (ja) 学習装置、映像検索装置、方法、及びプログラム
JP2019008476A (ja) 生成プログラム、生成装置及び生成方法
Talita et al. Challenges in building domain ontology for minority languages
JP4940251B2 (ja) 文書処理プログラム及び文書処理装置
JP6667875B2 (ja) 要約文作成モデル学習装置、要約文作成装置、要約文作成モデル学習方法、要約文作成方法、及びプログラム
JP5718407B2 (ja) 対話パターン抽出装置、対話装置、方法、及びプログラム
JP2015225416A (ja) モデル学習装置、ランキング装置、方法、及びプログラム
JP6573839B2 (ja) 文生成装置、方法、及びプログラム
JP2019021096A (ja) 言語解析装置、方法、及びプログラム
JP2012181685A (ja) 代表文抽出装置およびプログラム
TWI442249B (zh) Domain Knowledge Network Construction Method and Its System

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171004

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171010

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171226

R150 Certificate of patent or registration of utility model

Ref document number: 6270747

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150