JP2014224857A - 対話制御学習装置と対話制御装置とそれらの方法とプログラム - Google Patents

対話制御学習装置と対話制御装置とそれらの方法とプログラム Download PDF

Info

Publication number
JP2014224857A
JP2014224857A JP2013103139A JP2013103139A JP2014224857A JP 2014224857 A JP2014224857 A JP 2014224857A JP 2013103139 A JP2013103139 A JP 2013103139A JP 2013103139 A JP2013103139 A JP 2013103139A JP 2014224857 A JP2014224857 A JP 2014224857A
Authority
JP
Japan
Prior art keywords
dialogue
utterance
action
output
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013103139A
Other languages
English (en)
Other versions
JP5612720B1 (ja
Inventor
弘晃 杉山
Hiroaki Sugiyama
弘晃 杉山
豊美 目黒
Toyomi Meguro
豊美 目黒
南 泰浩
Yasuhiro Minami
泰浩 南
東中 竜一郎
Ryuichiro Higashinaka
竜一郎 東中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013103139A priority Critical patent/JP5612720B1/ja
Application granted granted Critical
Publication of JP5612720B1 publication Critical patent/JP5612720B1/ja
Publication of JP2014224857A publication Critical patent/JP2014224857A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】複数の発話を用いて1ターンに複数の<対話行為>が出力できる対話制御を行うための対話制御学習装置と対話制御装置を提供する。【解決手段】教師発話ペア選択部は、対話記憶部を参照して、対話行為推定学習に用いるための対話IDと発話順番号を持つ発話情報のまとまりの最後の発話順番号を持つ発話情報の対話行為を出力対話行為列、当該出力対話行為列の直前のN個の発話情報を入力発話情報とし、その組を教師発話ペアとして選択して出力し、発話特徴抽出部は、教師発話ペアの出力対話行為列と発話情報特徴ベクトルを組にして教師データとして出力し、対話行為推定器学習部は、出力対話行為列と発話情報特徴ベクトルの組を入力として、当該対話行為列の生成確率を計算するためのパラメータ行列を求め、当該パラメータ行列を対話行為推定器パラメータとして出力する。【選択図】図2

Description

本発明は、利用者と自然言語を用いて対話するシステム(以下、対話システム)における対話制御学習装置と対話制御装置とそれらの方法と、プログラムに関する。
人と対話システムが対話する際、対話システムは、利用者の発話に応じて適切な対話行為(「挨拶」や「質問」のような内容を伴わない抽象表現)を推定し、それに基づいて発話を生成する必要がある。例えば、利用者が何らかの「質問」を行った場合に、「挨拶」を返してしまうと不自然な発話となってしまう。このような不自然な対話行為を避け、より適切な「自己開示」などを推定する技術として、例えば非特許文献1〜3に記載された対話制御が知られている。
これら従来の対話制御は、1ターン(人と対話システムとの一発話対)に出力する対話行為の数は、1個と仮定している。図1に、対話IDで特定される人同士の対話の例を示す。発話文の最初の数字は発話順番号、次のアルファベットと数字で表される1〜3桁の記号は対話者ID、次の<s=″・ ″>が対話行為、その次が発話文である。
図1からも分かるように、人同士の対話は、一発話毎のキャッチボールでは無く、一方の1人が複数の発話を繰り返す場面が頻繁に発生する。例えば、発話順番号の7は、<自己開示_事実>と<質問_事実>の2つの<対話行為>から成る。このような対話に対して、従来の対話制御のように、1ターンの<対話行為>を1個と仮定した方法では、人と対話する対話制御装置としては不十分である。
例えば、対話制御装置が何度か連続して「質問」の<対話行為>を繰り返す場合、利用者は尋問されていると錯覚してしまうこともある。複数の<対話行為>から成る発話が出力可能な対話制御であれば、対話の間に「相槌」や「自己開示」の<対話行為>を挟むことができ、より人間に近い形の対話制御を行うことが可能になる。
この問題に対して、例えば、マルコフ決定過程(MDP)の派生系である部分観測マルコフ決定過程(POMDP)を用いて対話行為列を出力する対話制御が実現している(非特許文献4)。但し、非特許文献4に開示された方法でも、<対話行為>は1ターンに1個と仮定している。
J. Weizenbaum, "ELIZA-A Computer Program For the Study of Natural Language Communication Between Man and Machine", Commun. ACM 9[1] 36-45(1966). 杉山弘晃ほか、「順序学習に基づく逆強化学習による対話制御」、人工知能学会全国大会、2012. Teruhisa Misu, Komei Sugiura, Tatsuya Kawahara, Kiyonori Ohtake, Chiori Hori, Hideki Kashioka, Hisashi Kawai and Satoshi Nakamura."Modeling Spoken Decision Support Dialoge and Optimization of its Dialoge Stategy, ACM Transactions on Speech and Language Processing, Vol.7 Issue 3, pp.10:1-10:18,2011. 目黒豊美ほか、「POMDPを用いた聞き役対話制御部のWizard of Oz 実験による評価」、人工知能学会全国大会、2012.
従来のMDPを用いた手法では、「スキップ」という<対話行為>を導入して、擬似的に1ターンに複数の<対話行為>が出力できる枠組みを実現していた。この手法では、扱う状態数が極めて多くなるため、数ステップにわたって複数の<対話行為>を扱うことが困難である。そのため、対話制御の入力情報として直前の発話を用いて<対話行為>を予測するため、予測精度が悪い課題があった。
本発明は、この課題に鑑みてなされたものであり、複数の発話を用いて1ターンに複数の<対話行為>が出力できる対話制御を行うための対話制御学習装置と対話制御装置と、それらの方法とプログラムを提供することを目的とする。
本発明の対話制御学習装置は、対話記憶部と、教師発話ペア選択部と、発話特徴抽出部と、教師データ記憶部と、対話行為推定器学習部と、を具備する。対話記憶部は、人同士の対話テキストデータを、対話IDと、発話順番号と、対話行為と、発話文と、の組から成る発話情報を、当該対話IDと当該発話順番号とで検索できる様に記憶する。教師発話ペア選択部は、対話記憶部を参照して、対話行為推定学習に用いるための対話IDと発話順番号を持つ発話情報のまとまりの最後の発話順番号を持つ発話情報の対話行為を出力対話行為列、当該出力対話行為列の直前のN個の発話情報を入力発話情報列とし、出力対話行為列と入力発話情報列の組を教師発話ペアとして選択して出力する。発話特徴抽出部は、教師発話ペアの入力発話情報列の各発話文の対話行為を表すベクトル列と又は及び各発話文に含まれる特徴量を示すベクトル列、から成る発話情報特徴ベクトルを抽出し、教師発話ペアの出力対話行為列と発話情報特徴ベクトルを組にして教師データとして出力する。対話行為推定器学習部は、教師データ記憶部に記憶された出力対話行為列と発話情報特徴ベクトルの組を入力として、対話行為の生成確率を計算するためのパラメータ行列を求め、当該パラメータ行列を対話行為推定器パラメータとして出力する。
また、この発明の対話制御装置は、発話特徴抽出部と、対話行為推定器パラメータと、対話行為決定部と、を具備する。発話特徴抽出部は、発話ペアの入力発話情報列の各発話文の対話行為を表すベクトル列と又は及び各発話文に含まれる特徴量を示すベクトル列と、から成る発話情報特徴ベクトルを抽出して出力する。対話行為推定器パラメータは、上記した対話制御学習装置で求めたパラメータ行列である。対話行為決定部は、発言特徴ベクトルを入力として、対話行為推定器パラメータを参照して次の対話行為列の生成確率を求め、当該生成確率の値を元に次のユーザ発話の対話行為列を決定して推定対話行為列として出力する。
本発明の対話制御学習装置によれば、発話情報のまとまりの最後の発話順番号を持つ発話情報の出力対話行為列と、その直前のN個の発話情報の入力発話情報列と、を用いて対話行為の生成確率を計算するパラメータ行列を求めるので、従来法よりも対話行為の推定精度を高めることが可能なパラメータ学習を実現することが出来る。また、出力対話行為列は、複数の<対話行為>を含む形で扱われるので、複数の<対話行為>に対応することが可能である。
また、本発明の対話制御装置によれば、この発明の対話制御学習装置で求めたパラメータ行列を用いて<対話行為>を推定するので、従来法よりもより人間に近い形の対話制御を可能にする。
人同士の対話の例を示す図。 本発明の対話制御学習装置100の機能構成例を示す図。 対話制御学習装置100の動作フローを示す図。 発話情報特徴ベクトルの例を示す図。 本発明の対話制御装置200の機能構成例を示す図。 対話制御装置200の動作フローを示す図。 対話行為決定部240の機能構成例を示す図。 本発明の対話制御学習装置300の機能構成例を示す図。 対話行為推定器学習部350の機能構成例を示す図。 対話行為間接続行列の一例を示す概念的な図。 本発明の対話制御装置400の機能構成例を示す図。 対話行為決定部440の機能構成例を示す図。 各対話行為列の確率を計算する方法を説明する図。
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。
〔対話制御学習装置〕
図2に、この発明の対話制御学習装置100の機能構成例を示す。その動作フローを図3に示す。対話制御学習装置100は、対話記憶部110と、教師発話ペア選択部120と、発話特徴抽出部130と、教師データ記憶部140と、対話行為推定器学習部150と、制御部160と、を具備する。対話制御学習装置100は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。以下説明する各装置についても同じである。
対話記憶部110は、人同士の対話テキストデータを、対話IDと、発話順番号と、対話行為と、発話文と、の組から成る発話情報として、発話順番号と対話IDで検索できるように記憶したものである。対話テキストデータは例えば図1に示したものである。対話テキストデータは、コーパス(corpus)と称される程度に大規模な数を記憶するようにしても良い。
対話テキストデータの1行の最初の数字は発話順番号であり、発話者IDが切り替わる度に1増えるものとする。発話者IDの次のsタグの値<s=″・ ″>は対話行為を表す。<対話行為>の付与の仕方は、予め人手で付与しても良いし、非特許文献3に開示されているように自動で推定して付与するようにしても良い。
対話記憶部110は、対話ID、発話順番号、発話者ID、対話行為、各発話文を組として記憶する。この組を発話情報と称する。対話IDと発話順番号を指定することで、対応する発話情報を検索することができる。また、ある発話文を問い合わせる(クエリ)ことで、直前の数発話順番号を持つ発話情報を検索することも可能である。
教師発話ペア選択部120は、対話記憶部110を参照して、対話行為推定学習に用いるための対話IDと発話順番号を持つ発話情報のまとまりの最後の発話順番号を持つ発話情報の対話行為を出力対話行為列、当該出力対話行為列の直前のN個の発話情報を入力発話情報列とし、出力対話行為列と入力発話情報列の組を教師発話ペアとして選択して出力する(ステップS120)。
ここで発話情報のまとまりとは、図1の対話テキストの例において、例えば対話順番号1〜7で表せる発話情報のまとまりのことである。その発話情報のまとまりの最後の発話順番号である7の、「7 A:<s=“自己開示_事実”>私も学生です</s>」と「7 A:<s=“質問_事実”>何かバイトしてますか?</s>」の2つの発話情報が、出力発話情報列となる。入力発話情報列は、この例では発話順番号1〜6の6個の発話情報である。
この場合の出力対話行為列は、<自己開示_事実・質問_事実>となる。この例ではN個は6個であるが、Nをいくつにするかは任意である。但し、Nを大きくするとデータが疎になるため、Nは4個程度を目安にする。また、どの発話情報を出力発話情報列とするかも任意である。
発話特徴抽出部130は、教師発話ペアの入力発話情報列の各発話文の対話行為を表すベクトル列と又は及び各発話文に含まれる特徴量を示すベクトル列と、から成る発話情報特徴ベクトルを抽出し、教師発話ペアの出力対話行為列と発話情報特徴ベクトルを組にして教師データとして出力する(ステップS130)。発話情報特徴ベクトルは、各発話文に含まれる特徴量を示すベクトル列のみで構成しても良いし、又は、入力発話情報列の各発話文の対話行為を表すベクトル列のみで構成しても良い。又は、各発話文に含まれる特徴量を示すベクトル列と入力発話情報列の各発話文の対話行為を表すベクトル列とを組にして構成しても良い。
図4に、発話情報特徴ベクトルの例を示す。対話行為を表すベクトル列とは、対話行為である<挨拶>、<情報提供>、<質問_事実>、…の種類に対応したビットの並んだベクトル列である。<対話行為>の種類を例えば32種類と仮定した場合、対話行為を表す1つのベクトル列は、32個のビットの何れかの<対話行為>に対応するビットが1になったベクトルである。
図4に示す例では、発話順番号6の対話行為を表すベクトル列の次に発話順番号5の対話行為を表すベクトル列が接続され、発話順番号1までの対話行為を表すベクトル列を構成する。この例では、32×6=192ビットのビットの並びで、対話行為を表すベクトル列が表現される。
発話文に含まれる特徴量を示すベクトル列とは、対象とする発話情報の発話文の中に存在する特徴量に対応させたベクトル列のことである。例えば、特徴量をユニグラムのBag of words(語の袋)とした場合、特徴量を例えば「こんばんは」、「よろしく」、「お願いします」、「こちらこそ」の4種類とすると、発話情報「こんばんは」からは、特徴を示すベクトル列として{1,0,0,0}が抽出される。また、発話情報「こちらこそよろしくお願いします」からは、ベクトル列として{0,1,1,1}が抽出される。発話文に含まれる特徴量を示すベクトル列も、対話行為を表すベクトル列と同様にN個のベクトル列を並べて表現する。
図4に示す例では、例えば発話情報1つ当たりの特徴量を1000個とした場合、1000×6ビットのベクトル列で発話文に含まれる特徴量が表される。この発話文に含まれる特徴量を表すベクトル列と、対話行為を表すベクトル列と、で発話情報特徴ベクトルが構成される。なお、図4に示す例では、発話順番号の後ろ側から前の順番でベクトルを配列したが、その順番は逆でも良い。その規則が固定されていれば並べる順番は昇順でも降順でもどちらでも良い。
また、特徴量は、日本語語彙体系(参考文献1:池原悟ほか、「日本語語彙体系」、岩波書店)やつつじ(参考文献2:松吉俊ほか、「日本語機能表現辞書の編纂」自然言語処理、Vol.14, No.5, pp123-146, 2007)Wikipediaオントロジー(参考文献3:玉川奨ほか、「日本語Wikipediaからの大規模オントロジー学習」、人工知能学会論文誌論文特集Vol.25 No.5 pp.623-636, 2010.)のような、語彙カテゴリをまとめた辞書を用いて抽象化を行っても良い。例えば、「あさごはん」、「あさめし」、を「朝食」と抽象化することで、特徴量の抽出漏れを防止することができる。
発話特徴抽出部130が出力する教師発話ペアの出力対話行為列と発話情報特徴ベクトルの組は、教師データ記憶部140に記憶される。教師発話ペア選択部120と発話特徴抽出部130の動作は、全ての教師発話ペアについての処理が終了するまで繰り返される(ステップS160のNo)。この繰り返し動作の制御は制御部160が行う。制御部160は、対話制御学習装置100の各部の時系列動作を制御する一般的なものであって、特別な処理を行うものではない。
対話行為推定器学習部150は、教師データ記憶部140に記憶された出力対話行為列と発話情報特徴ベクトルの組を入力として、確率的分類を行うためのパラメータ行列を求め、当該パラメータ行列を対話行為推定器パラメータとして出力する(ステップS150)。このパラメータ行列は、確率的分類を行うためのパラメータである。
パラメータ行列は、ロジスティック回帰、ナイーブベイズ、決定木、などの各次元を独立に扱える線形の学習器や、入力情報が存在する近辺のみで計算処理するカーネルベースの学習器(例えばSVM)などを用いて求めることができる。パラメータ行列を求める手法は周知である。
このように、対話制御学習装置100が、入力発話情報列に対応する出力対話行為列の生成確率を計算するためのパラメータ行列を求めることで、上記した発話順番号7の出力対話行為列<自己開示_事実・質問_事実>のように複数の対話行為を含む出力対話行為列に対応することが可能になる。
〔対話制御装置〕
図5に、この発明の対話制御装置200の機能構成例を示す。その動作フローを図6に示す。対話制御装置200は、発話特徴抽出部230と、出力対話行為推定部240と、対話行為推定器パラメータ250と、制御装置260と、を具備する。
発話特徴抽出部230は、ある発話を入力として、当該発話の発話情報列の各発話文の<対話行為>を表すベクトル列と又は及び各発話文に含まれる特徴量を示すベクトル列と、から成る発話情報特徴ベクトルを抽出して出力する(ステップS230)。発話情報特徴ベクトルは、対話行為推定パラメータ250が推定対象の対話行為を持つ発話情報の直前N個の発話情報を入力発話情報列として求めたパラメータ行列である場合は、N個の学習用とは異なる発話情報を1セットとして求めたベクトルである。N個は、学習装置と一致している必要がある。発話特徴抽出部230が出力する発話特徴ベクトルは、上記(図4)で説明したものと同じものである。
対話行為推定器パラメータ250は、対話制御学習装置100を用いてN個の発話情報を入力発話情報列として求めたパラメータ行列である。出力対話行為推定部240は、発話特徴抽出部230が出力する発話特徴ベクトルを入力として、対話行為推定器パラメータ250を参照して次の対話行為の生成確率を求め、当該生成確率の値を元に次のユーザ発話の対話行為を決定して推定対話行為として出力する(ステップS240)。
図7に、出力対話行為推定部240より具体的な機能構成例を示す。出力対話行為推定部240は、内積手段241と、ロジスティック関数処理手段242と、出力対話行為決定手段243と、を備える。
内積手段241は、発話特徴抽出部230が出力する発話情報特徴ベクトルと対話行為推定器パラメータ250との内積演算を行い類似度ベクトルを出力する。ロジスティック関数処理手段242は、類似度ベクトルを構成する各対話行為の出現確率を0〜1の値に射影して確率値に変換する。出力対話行為決定手段243は、各対話行為の確率値を正規化して、最も確率の高い<対話行為>を出力対話行為に決定して出力する。
出力対話行為の決定は、単純に最も高い確率値の<対話行為>を出力するのでは無く、確率値の値に応じた出力にしても良い。例えば、確率値が0.25の物が4つ有った場合、それぞれの<対話行為>が4回に1回の割合で出力されるようにしても良い。
なお、発話特徴抽出部230に発話が直接入力される例で説明を行ったが、発話を発話履歴から抽出するようにしても良い。その場合の対話制御装置200は、利用者の発話とその履歴を入力とする発話対応関係解析部270を備える。発話対応関係解析部270は、利用者の発話とその履歴のテキストデータを入力として、利用者の<対話行為>と、対話者IDと、発話文と、の対応関係を解析すると共に、対話IDと発話順番号を持つ発話情報のまとまりの最後のN個の発話情報を入力発話情報列として出力する。
次に、対話行為列に含まれる各対話行為の出現確率を<対話行為>ごとに計算し、それらと対話行為間の接続確率を用いて対話行為の出現確率を推定する方法の対話制御学習装置300と対話制御装置400について説明する。
〔対話制御学習装置〕
図8に、この発明の対話制御学習装置300の機能構成例を示す。対話制御学習装置300は、対話記憶部110と、教師発話ペア選択部120と、発話特徴抽出部130と、教師データ記憶部140と、対話行為推定器学習部350と、制御部360と、を具備する。参照符号から明らかなように、対話記憶部110と、教師発話ペア選択部120と、発話特徴抽出部130と、教師データ記憶部140と、は対話制御学習装置100と同じものである。
図9に、対話行為推定器学習部350の機能構成例を示す。対話行為推定器学習部350は、出力発話情報列分割手段351と、対話行為間の接続確率計算手段352と、対話行為推定器学習部150′と、を備える。
出力発話情報列分割手段351は、教師データ記憶部140に記憶された出力発話情報列と発話情報特徴ベクトルとの組を入力として、1個の発話順番号の出力対話行為が上記出力発話情報列中に複数個ある場合、当該複数個の数に上記出力対話行為列を分割して出力する(ステップS351)。1個の発話順番号の出力発話情報が複数個ある場合とは、図1に示した例では、発話順番号7と9と10と11等の場合である。
対話制御学習装置300では、同じ発話順番号でも発話情報毎に<対話行為>を扱う点で対話制御学習装置100と異なる。出力発話情報分割手段351によって、例えば発話順番号7の場合、「7 A:<s=“自己開示_事実”>私も学生です</s>」と「7 A:<s=“質問_事実”>何かバイトしてますか?</s>」の2つの発話情報が、それぞれ別々に対話行為推定器学習部150′に入力される。
対話行為推定器学習部150′は、対話行為推定器学習部150と同じ処理を行って、対話行為の生成確率を計算するためのパラメータ行列を求める。
対話行為間の接続確率計算手段352は、対話記憶部110に記憶された全ての対話テキストデータの内、同一の発話順番が付与された対話行為列に現れる対話行為のバイグラムを数え上げ、対話行為間の接続確率を計算する。ただし、上記対話行為列の先頭に開始対話行為(s)、終端に終了対話行為(e)が付与されるとして、上記接続確率を計算する。例えば、図1の発話順番号7を例に取ると、対話行為列が<s,自己開示_事実,質問_事実,e>のように(s)と(e)に挟まれると考え、<s,自己開示_事実>,<自己開示_事実,質問_事実>,<質問_事実,e>のバイグラムを接続確率の計算に用いる。この方法で計算された各対話行為間の接続確率を用いて、対話行為間接続行列を求める(ステップS352)。
図10に、対話行為間接続行列の概念的な図を示す。1行目の2列以降は、接続される一方の<対話行為>a_nのa_1〜a_N、1列目の2行以降は接続される他方の<対話行為>a_mのa_1〜a_Nである。図中のsは開始対話行為を表し、sの行の2列目以降はsと任意のa_nとの接続確率を表す。同様に、eは終了対話行為を表し、eの列の2行目以降は任意のa_mと終了対話行為eとの接続確率を表す。
図10に示す各対話行為の接続確率は、対話行為記憶部110内の全ての発話情報の<対話行為>の接続関係から、予め計算して求めて置く。
対話制御学習装置300は、対話行為推定器学習部150′で求めた対話行為の生成確率を計算するためのパラメータ行列と、対話行為間の接続確率計算手段352で計算した対話行為間接続行列と、を対話行為推定器パラメータとして出力する。
〔対話制御装置〕
図11に、この発明の対話制御装置400の機能構成例を示す。対話制御装置400は、対話制御装置200に対して、対話制御学習装置300で求めた対話行為推定器パラメータ450を用いる点と、その対話行為推定器パラメータ450を用いて出力対話行為列を決定する対話行為決定部440と、を備える点で異なる。
対話行為推定器パラメータ450は、対話行為の生成確率を計算するためのパラメータ行列と対話行為間接続行列から成る。対話行為決定部440は、ロジスティック関数処理手段242で求めた、各対話行為の確率値に、対話行為間接続確率を掛け合わせて、各対話行為の出力確率を再計算して出力対話行為を決定するものである。
図12に、対話行為決定部440のより具体的な機能構成例を示す。対話行為決定部440は、内積手段241と、ロジスティック関数処理手段242と、乗算手段441と、出力対話行為決定手段243と、を備える。対話行為決定部440は、乗算手段441を備える点で対話行為決定部240(図7)と異なる。他の構成は、参照番号から明らかなように対話行為決定部240(図7)と同じものである。
図13を参照して、乗算手段441で計算する確率を説明する。乗算手段441は、一方の対話行為(a_n)ごとに開始対話行為(s)から接続される確率と、発話情報特徴ベクトルから求めた各対話行為の生成確率p(a_n|v)を掛け合わせる。
次に、対話行為(a_n)ごとに終了対話行為(e)への接続確率p(e|a_n)を計算する。p(e|a_n)が指定の閾値θ(通常0.5)以上であればa_nは終了対話行為(e)へ接続し、対話行為列確率としてp(s,a_n,e|v)を出力する。一方、p(e|a_n)が閾値θを下回った場合、終了対話行為e以外へのバイグラム確率p(a′_m|a_n)とa′_mの生成確率p(a′_m|v)を計算し、これらを掛け合わせp(s,a_n,a′_m|v)を計算すると共に、先ほどと同様にa′_mから終了対話行為(e)への接続確率に依って次の対話行為へ接続するか接続を終了するかを決定する。なお、開始対話行為(s)と終了対話行為(e)は、デコード用に用意した特殊対話行為のため、対話行為決定部440の出力には含まれない。
以上説明した対話制御学習装置100,300と、対話制御装置200,400を用いることで、1ターン中に複数回発話を行うような、より人間に近い形の対話が可能になる。特に、複数発話をルールで記述する場合には組み合わせの多さが問題となるため、これを自動で適切に推定する本発明の機能は、優れた対話システムの開発を容易にする効果を奏する。
上記装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (8)

  1. 人同士の対話テキストデータを、対話IDと、発話順番号と、対話行為と、発話文と、の組から成る発話情報として、上記対話IDと上記発話順番号とで検索できる様に記憶した対話記憶部と、
    上記対話記憶部を参照して、対話行為推定学習に用いるための対話IDと発話順番号を持つ発話情報のまとまりの最後の発話順番号を持つ発話情報の対話行為を出力対話行為列、当該出力対話行為列の直前のN個の発話情報を入力発話情報列とし、出力対話行為列と入力発話情報列の組を教師発話ペアとして選択して出力する教師発話ペア選択部と、
    上記教師発話ペアの入力発話情報列の各発話文の対話行為を表すベクトル列と又は及び上記発話文に含まれる特徴量を示すベクトル列と、から成る発話情報特徴ベクトルを抽出し、上記教師発話ペアの出力対話行為列と発話情報特徴ベクトルを組にして教師データとして出力する発話特徴抽出部と、
    上記教師データを記憶する教師データ記憶部と、
    上記出力対話行為列と発話情報特徴ベクトルの組を入力として、当該対話行為列の生成確率を計算するためのパラメータ行列を求め、当該パラメータ行列を対話行為推定器パラメータとして出力する対話行為推定器学習部と、
    を具備する対話制御学習装置。
  2. 請求項1に記載した対話制御学習装置において、
    上記対話行為推定器学習部は、上記出力対話行為列と発話情報特徴ベクトルの組を入力として、当該発話情報特徴ベクトルを入力特徴ベクトルとして確率的分類を行うためのパラメータ行列を求めるものであることを特徴とする対話制御学習装置。
  3. 請求項1に記載した対話制御学習装置において、
    上記対話行為推定器学習部は、
    出力発話情報列と発話情報特徴ベクトルとの組を入力として、1個の発話順番号の出力発話情報が複数個ある場合、当該複数個の数に上記出力発話情報列を分割して出力する出力発話情報列分割手段と、
    上記出力発話情報列分割手段が出力する出力発話情報と発話情報特徴ベクトルとの組を入力として、当該発話情報特徴ベクトルを入力特徴ベクトルとして確率的分類を行うためのパラメータ行列を求める請求項2に記載した対話行為推定器学習部と、
    上記対話記憶部に記憶された全ての対話テキストデータの内、同一の発話順番が付与された対話行為列に現れた対話行為間の接続確率を、上記対話行為列の先頭に開始対話行為、終端に終了対話行為が付与されるとして、各対話行為間の接続確率を計算した対話行為間接続行列を求める対話行為間の接続確率計算手段と、
    を備え、
    上記パラメータ行列と上記対話行為間接続行列を上記対話行為推定器パラメータとして出力するものであることを特徴とする対話制御学習装置。
  4. 入力された発話の発話情報列の各発話文の対話行為を表すベクトル列又は及び上記各発話文に含まれる特徴量を示すベクトル列と、から成る発話情報特徴ベクトルを抽出して出力する発話特徴抽出部と、
    請求項1乃至3の何れかに記載した対話制御学習装置で学習した対話行為推定器パラメータと、
    上記発言特徴ベクトルを入力として、上記対話行為推定器パラメータを参照して次の対話行為の生成確率を求め、当該生成確率の値を元に次のユーザ発話の出力対話行為を決定して出力する対話行為決定部と、
    を具備する対話制御装置。
  5. 人同士の対話テキストデータを、対話IDと、発話順番号と、対話行為と、発話文と、の組から成る発話情報として、上記対話IDと上記発話順番号とで検索できる様に記憶した対話記憶部を参照して、対話行為推定学習に用いるための対話IDと発話順番号を持つ発話情報のまとまりの最後の発話順番号を持つ発話情報の対話行為を出力対話行為列、当該出力対話行為列の直前のN個の発話情報を入力発話情報列とし、出力対話行為列と入力発話情報列の組を教師発話ペアとして選択して出力する教師発話ペア選択過程と、
    上記教師発話ペアの入力発話情報列の各発話文の対話行為を表すベクトル列と又は及び上記発話文に含まれる特徴量を示すベクトル列と、から成る発話情報特徴ベクトルを抽出し、上記教師発話ペアの出力対話行為列と発話情報特徴ベクトルを組にして教師データとして出力する発話特徴抽出過程と、
    教師データ記憶部に記憶された上記出力対話行為列と発話情報特徴ベクトルの組を入力として、当該対話行為列の生成確率を計算するためのパラメータ行列を求め、当該パラメータ行列を対話行為推定器パラメータとして出力する対話行為推定器学習過程と、
    を備える対話制御学習方法。
  6. 請求項5に記載した対話制御学習方法において、
    上記対話行為推定器学習過程は、上記出力対話行為列と発話情報特徴ベクトルの組を入力として、当該発話情報特徴ベクトルを入力特徴ベクトルとして確率的分類を行うためのパラメータ行列を求める過程であることを特徴とする対話制御学習方法。
  7. 入力された発話の発話情報列の各発話文の対話行為を表すベクトル列又は及び上記各発話文に含まれる特徴量を示すベクトル列と、から成る発話情報特徴ベクトルを抽出して出力する発言特徴抽出過程と、
    上記発言特徴ベクトルを入力として、請求項5又は6に記載した対話制御学習方法で学習した対話行為推定器パラメータを参照して次の対話行為の生成確率を求め、当該生成確率の値を元に次のユーザ発話の出力対話行為を決定して出力する対話行為決定過程と、
    を備える対話制御方法。
  8. 請求項1,2,3の何れかに記載した対話制御学習装置、請求項4に記載した対話制御装置としてコンピュータを機能させるためのプログラム。
JP2013103139A 2013-05-15 2013-05-15 対話制御学習装置と対話制御装置とそれらの方法とプログラム Active JP5612720B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013103139A JP5612720B1 (ja) 2013-05-15 2013-05-15 対話制御学習装置と対話制御装置とそれらの方法とプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013103139A JP5612720B1 (ja) 2013-05-15 2013-05-15 対話制御学習装置と対話制御装置とそれらの方法とプログラム

Publications (2)

Publication Number Publication Date
JP5612720B1 JP5612720B1 (ja) 2014-10-22
JP2014224857A true JP2014224857A (ja) 2014-12-04

Family

ID=52123582

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013103139A Active JP5612720B1 (ja) 2013-05-15 2013-05-15 対話制御学習装置と対話制御装置とそれらの方法とプログラム

Country Status (1)

Country Link
JP (1) JP5612720B1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019030949A (ja) * 2017-08-09 2019-02-28 日本電信電話株式会社 ロボット制御装置、ロボット制御方法およびロボット制御プログラム
JP2019046412A (ja) * 2017-09-07 2019-03-22 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2019050037A (ja) * 2018-11-22 2019-03-28 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
KR20190059201A (ko) * 2017-11-22 2019-05-30 서강대학교산학협력단 대화 정책 모델의 최적화 방법 및 이를 구현하는 대화 시스템
US10326470B2 (en) 2015-12-03 2019-06-18 Panasonic Intellectual Property Management Co., Ltd. Converter for converting code-modulated power with conversion code, and controller thereof

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9787819B2 (en) * 2015-09-18 2017-10-10 Microsoft Technology Licensing, Llc Transcription of spoken communications

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5598510A (en) * 1993-10-18 1997-01-28 Loma Linda University Medical Center Self organizing adaptive replicate (SOAR)
JP2001343992A (ja) * 2000-05-31 2001-12-14 Mitsubishi Electric Corp 音声パターンモデル学習装置、音声パターンモデル学習方法、および音声パターンモデル学習プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに音声認識装置、音声認識方法、および音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2009211629A (ja) * 2008-03-06 2009-09-17 National Institute Of Information & Communication Technology 対話装置、重み情報学習装置、対話方法、重み情報学習方法、およびプログラム
JP2012038287A (ja) * 2010-07-12 2012-02-23 National Institute Of Information & Communication Technology 学習システム、シミュレーション装置、および学習方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5598510A (en) * 1993-10-18 1997-01-28 Loma Linda University Medical Center Self organizing adaptive replicate (SOAR)
JP2001343992A (ja) * 2000-05-31 2001-12-14 Mitsubishi Electric Corp 音声パターンモデル学習装置、音声パターンモデル学習方法、および音声パターンモデル学習プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに音声認識装置、音声認識方法、および音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2009211629A (ja) * 2008-03-06 2009-09-17 National Institute Of Information & Communication Technology 対話装置、重み情報学習装置、対話方法、重み情報学習方法、およびプログラム
JP2012038287A (ja) * 2010-07-12 2012-02-23 National Institute Of Information & Communication Technology 学習システム、シミュレーション装置、および学習方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CSNG201100237203; 目黒豊美他: '"POMDPを用いた聞き役対話システムの対話制御"' 言語処理学会第17回年次大会発表論文集[CD-ROM] , 201103, pp.912-915 *
CSNJ201210017148; 杉山弘晃他: '"順序学習に基づく逆強化学習による対話制御"' 2012年度人工知能学会全国大会(第26回)論文集[CD-ROM] , 201206, pp.1-4 *
JPN6013052343; 杉山弘晃他: '"順序学習に基づく逆強化学習による対話制御"' 2012年度人工知能学会全国大会(第26回)論文集[CD-ROM] , 201206, pp.1-4 *
JPN6014002563; 目黒豊美他: '"POMDPを用いた聞き役対話システムの対話制御"' 言語処理学会第17回年次大会発表論文集[CD-ROM] , 201103, pp.912-915 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10326470B2 (en) 2015-12-03 2019-06-18 Panasonic Intellectual Property Management Co., Ltd. Converter for converting code-modulated power with conversion code, and controller thereof
JP2019030949A (ja) * 2017-08-09 2019-02-28 日本電信電話株式会社 ロボット制御装置、ロボット制御方法およびロボット制御プログラム
JP2019046412A (ja) * 2017-09-07 2019-03-22 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
KR20190059201A (ko) * 2017-11-22 2019-05-30 서강대학교산학협력단 대화 정책 모델의 최적화 방법 및 이를 구현하는 대화 시스템
KR102152339B1 (ko) * 2017-11-22 2020-09-04 서강대학교 산학협력단 대화 정책 모델의 최적화 방법 및 이를 구현하는 대화 시스템
JP2019050037A (ja) * 2018-11-22 2019-03-28 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム

Also Published As

Publication number Publication date
JP5612720B1 (ja) 2014-10-22

Similar Documents

Publication Publication Date Title
US11568855B2 (en) System and method for defining dialog intents and building zero-shot intent recognition models
US10437929B2 (en) Method and system for processing an input query using a forward and a backward neural network specific to unigrams
US20200160356A1 (en) Customer interaction and experience system using emotional-semantic computing
CN106502985B (zh) 一种用于生成标题的神经网络建模方法及装置
CN107480143B (zh) 基于上下文相关性的对话话题分割方法和系统
JP5612720B1 (ja) 対話制御学習装置と対話制御装置とそれらの方法とプログラム
US10319368B2 (en) Meaning generation method, meaning generation apparatus, and storage medium
JP3768205B2 (ja) 形態素解析装置、形態素解析方法及び形態素解析プログラム
CN110377916B (zh) 词预测方法、装置、计算机设备及存储介质
US11113335B2 (en) Dialogue system and computer program therefor
JP6832501B2 (ja) 意味生成方法、意味生成装置及びプログラム
Korpusik et al. Spoken language understanding for a nutrition dialogue system
CN111145718A (zh) 一种基于自注意力机制的中文普通话字音转换方法
CN111460132B (zh) 一种基于图卷积神经网络的生成式会议摘要方法
CN111144097B (zh) 一种对话文本的情感倾向分类模型的建模方法和装置
CA3134548A1 (en) Unsupervised adaptation of sentiment lexicon
JP6630304B2 (ja) 対話破壊特徴量抽出装置、対話破壊特徴量抽出方法、プログラム
US20220165257A1 (en) Neural sentence generator for virtual assistants
Tian et al. Tod-da: Towards boosting the robustness of task-oriented dialogue modeling on spoken conversations
JP6973192B2 (ja) 言語モデルを利用する装置、方法及びプログラム
JP6605997B2 (ja) 学習装置、学習方法及びプログラム
JP2019204117A (ja) 対話破壊特徴量抽出装置、対話破壊特徴量抽出方法、プログラム
Malandrakis et al. Emotiword: Affective lexicon creation with application to interaction and multimedia data
Heymann et al. Improving CTC using stimulated learning for sequence modeling
JP6545633B2 (ja) 単語スコア計算装置、単語スコア計算方法及びプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140722

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140806

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140826

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140904

R150 Certificate of patent or registration of utility model

Ref document number: 5612720

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150