JP2017125921A - 発話選択装置、方法、及びプログラム - Google Patents

発話選択装置、方法、及びプログラム Download PDF

Info

Publication number
JP2017125921A
JP2017125921A JP2016004440A JP2016004440A JP2017125921A JP 2017125921 A JP2017125921 A JP 2017125921A JP 2016004440 A JP2016004440 A JP 2016004440A JP 2016004440 A JP2016004440 A JP 2016004440A JP 2017125921 A JP2017125921 A JP 2017125921A
Authority
JP
Japan
Prior art keywords
utterance
label
unit
user
detailed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016004440A
Other languages
English (en)
Inventor
徹 平野
Toru Hirano
徹 平野
俊朗 牧野
Toshiaki Makino
俊朗 牧野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016004440A priority Critical patent/JP2017125921A/ja
Publication of JP2017125921A publication Critical patent/JP2017125921A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ユーザに合わせたタイミングでエージェント発話を選択することができるようにする。【解決手段】詳細化ラベル付与部22が、入力されたユーザの発話に基づいて、発話の詳細化ラベルを付与し、データベース更新部23が、発話の詳細化ラベルと、発話の発話時刻とをユーザ履歴データベース24に記録する。第2エージェント発話選択部33が、発話間隔データベース30に格納された詳細化ラベル毎の発話間隔と詳細化ラベル毎の最終発話時刻とに基づいて、発話候補データベース27に格納された、詳細化ラベルが付与された発話文から、エージェント発話を選択する。【選択図】図1

Description

本発明は、ユーザの発話に対するエージェント発話を選択するための発話選択装置、方法、及びプログラムに関する。
従来、ユーザの発話を解析し、ユーザ発話の意味内容を示す対話行為タイプを求めることで、対話行為タイプに基づいた発話を返すシステムがあった(特許文献1)。具体的には、対話装置が自己開示、共感、非共感の応答を行う生起確率を予め与えられたパラメータに従って決定することによって、ユーザに対して次に行う対話内容を制御している。
特許第5286062号公報
しかし、従来の対話装置では、エージェント側に対話のイニシアチブがある場合、発話内容を選択する基準は対話の焦点に合致するか否かしかなく、焦点のみで発話内容が絞り込めない場合は確率的に発話文が選択されていたため、エージェント側が話題(焦点の有無を含め)を選べるシーンでは焦点や発話文がランダムに選択されていて、適切なタイミングで発話することができなかった。
本発明は、上記の事情に鑑みてなされたもので、ユーザに合わせたタイミングでエージェント発話を選択することができる発話選択装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明の発話選択装置は、入力されたユーザの発話に基づいて、前記発話の詳細化ラベルを付与する詳細化ラベル付与部と、前記詳細化ラベル付与部によって付与された前記発話の詳細化ラベルと、前記発話の発話時刻とをユーザ履歴データベースに記録するデータベース更新部と、予め求められた詳細化ラベル毎の発話間隔と、前記ユーザ履歴データベースから得られる詳細化ラベル毎の最終発話時刻とに基づいて、予め生成された、前記詳細化ラベルが付与された発話文から、エージェント発話を選択するエージェント発話選択部とを含んで構成されている。
本発明の発話選択方法は、詳細化ラベル付与部、データベース更新部、及びエージェント発話選択部を含む発話選択装置における発話選択方法であって、前記詳細化ラベル付与部が、入力されたユーザの発話に基づいて、前記発話の詳細化ラベルを付与し、前記データベース更新部が、前記詳細化ラベル付与部によって付与された前記発話の詳細化ラベルと、前記発話の発話時刻とをユーザ履歴データベースに記録し、前記エージェント発話選択部が、予め求められた詳細化ラベル毎の発話間隔と、前記ユーザ履歴データベースから得られる詳細化ラベル毎の最終発話時刻とに基づいて、予め生成された、前記詳細化ラベルが付与された発話文から、エージェント発話を選択する。
本発明に係るプログラムは、コンピュータを、本発明の発話選択装置を構成する各部として機能させるためのプログラムである。
以上説明したように、本発明の発話選択装置、方法、及びプログラムによれば、入力されたユーザの発話に基づいて、詳細化ラベルを付与して、ユーザ履歴データベースに記録し、詳細化ラベル毎の発話間隔と、詳細化ラベル毎の最終発話時刻とに基づいて、詳細化ラベルが付与された発話文から、エージェント発話を選択することにより、ユーザに合わせたタイミングでエージェント発話を選択することができる、という効果が得られる。
本発明の実施の形態に係る発話選択装置の構成の一例を示す図である。 本発明の実施の形態のユーザ履歴データベースに格納されるデータの一例を示す図である。 本発明の実施の形態の発話候補データベースに格納されるデータの一例を示す図である。 本発明の実施の形態の発話間隔データベースに格納されるデータの一例を示す図である。 本発明の実施の形態に係る対話処理ルーチンのフローチャートの一例である。
<概要>
まず、本発明の実施の形態の概要について説明する。
本発明の実施の形態は、ユーザとの社会的対話を行うための対話装置に関し、特にユーザの発話に対する質問文を、ユーザとの対話履歴に関連づけて発話する技術に関するものである。
本発明の実施の形態では、ユーザの発話の履歴に対して、ラベルを付与して、ラベル毎に発話間隔を計算する。ここで、発話間隔を計算する際、焦点ごとの発話間隔では、パタンを読み取れるほど十分な履歴が存在しない場合が多い。
そこで、本実施の形態では、焦点を抽象化した詳細化ラベルを用いる。このように焦点をそのまま用いずに、焦点を抽象化した詳細化ラベルを用いることにより、多くの焦点について発話間隔を計算することができる。
また、対話開始時には、対話中のユーザの発話履歴情報が発話間隔を計算するのに不十分である。そこで、本実施の形態では、ツイッター(R)や他ユーザの対話履歴など大規模データから、詳細化ラベル毎に一般的な発話間隔を計算し、対話中のユーザの発話履歴から求めた発話間隔と組み合わせて使う。これにより、対話中のユーザの発話履歴から求めた発話間隔が不十分な場合を補うことができる。
また、上記2つの発話間隔を組み合わせる際、可能な限り対話中のユーザの対話履歴から求めた発話間隔を用いたほうが、よりパーソナライズできる。そこで、本実施の形態ででは、大規模データから求められる詳細化ラベルの発話間隔の平均及び分散と、ユーザの対話履歴から求められる詳細化ラベルの発話間隔の平均及び分散と、ユーザの対話履歴に含まれる詳細化ラベルの発話数に応じた信頼度とに基づいて、詳細化ラベルの発話間隔を計算する。これにより、発話履歴が不十分な対話開始時には、一般的な発話間隔を使い、対話履歴が十分な際には対話中のユーザに特化した発話間隔を使うことができる。
<発話選択装置の構成>
以下、図面を参照して本発明の実施の形態を詳細に説明する。図1は、本実施の形態に係る発話選択装置の構成の一例を示す図である。なお、本発明の実施の形態では、ユーザとエージェントとが対話を行うものとする。ユーザはエージェントに対して発話を発し、当該発話は発話選択装置に入力される。また、エージェントは、発話選択装置によって出力された発話をユーザに対して発するものとする。
本実施の形態に係る発話選択装置100は、CPUと、RAMと、後述する対話処理ルーチンを実行するためのプログラム及び各種データを記憶したROMとを備えたコンピュータで構成されている。また、記憶手段としてHDDを設けてもよい。
このコンピュータは、機能的には、図1に示すように、入力部10、演算部20、及び出力部40を含んだ構成で表わすことができる。
入力部10は、ユーザの発話の入力を受け付ける。
演算部20は、ユーザ発話内容理解部21と、詳細化ラベル付与部22と、データベース更新部23と、ユーザ履歴データベース24と、対話管理部25と、発話生成部26と、発話候補データベース27と、発話間隔計算部28と、大規模データ29と、発話間隔データベース30と、話題継続判定部31と、第1エージェント発話選択部32と、第2エージェント発話選択部33とを備えている。
ユーザ発話内容理解部21は、入力部10によって受け付けたユーザの発話から、述語項構造を抽出すると共に、対話における発話の意図を表す対話行為タイプを推定する。述語項構造は、述語と当該述語に対応する格の要素である格要素との組み合わせである。
具体的には、ユーザ発話内容理解部21は、ユーザがエージェントに対して発した発話の入力を受け付け、当該発話に対して形態素解析、述語項構造解析、焦点抽出、及び対話行為タイプの推定の各処理を行う。
ユーザ発話内容理解部21は、まず、入力部10によって受け付けた発話に対して形態素解析を行う。次に、ユーザ発話内容理解部21は、形態素解析結果に基づいて当該発話の係り受け解析を行い、形態素解析結果と係り受け解析結果とに基づいて、述語項構造解析を行って、当該発話の述語項構造を取得する。
例えば、「ラーメンが好きです。」というユーザの発話が入力された場合、ユーザ発話内容理解部21は、「ラーメン(名詞)/が(助詞)/好き(名詞:形容)/です(判定詞)」というように、形態素解析を行う。そして、ユーザ発話内容理解部21は、形態素解析結果に基づいて、当該発話に対して係り受け解析を行い、形態素解析結果及び係り受け解析結果に基づいて、述語項構造解析によって、「ラーメン:が:好き」という述語項構造を得る。
また、ユーザ発話内容理解部21は、入力部10によって受け付けた発話の焦点を抽出する。焦点とは、対話における話題を表す単語である。例えば、ユーザ発話内容理解部21は、入力部10によって受け付けた発話の述語項構造解析結果に基づいて、提題助詞の「は」で示される名詞や、ガ格・ヲ格で提示される名詞を焦点として抽出する。
例えば、ユーザ発話内容理解部21は、形態素解析結果に基づいて、焦点抽出によって、「ラーメン」を当該発話の焦点として抽出する。
そして、ユーザ発話内容理解部21は、入力部10によって受け付けた発話の対話行為タイプを推定する。例えば、ユーザ発話内容理解部21は、当該発話内の単語に基づいて、単語特徴量を抽出し、当該単語特徴量から、対話行為タイプを推定する推定器を用いて、対話行為タイプを推定する。ここで、推定器は、機械学習の手法によって予め構築しておけばよい。例えば、文書分類で一般的に用いられる手法である、サポートベクトルマシンなどを用いて構築することができる。
例えば、ユーザ発話内容理解部21は、形態素解析結果に基づいて、対話行為推定によって、当該発話が発話者自身のことを伝える対話行為タイプである「自己開示_評価+」を推定する。
詳細化ラベル付与部22は、ユーザ発話内容理解部21によって得られた発話の形態素解析結果に基づいて、当該発話の、焦点より抽象化された詳細化ラベルを付与する。
本実施の形態では、発話の話題を示すトピックラベルと、発話がユーザのどういう側面の情報かを示す人物属性ラベルとの組み合わせを、詳細化ラベルとして付与する。
トピックラベルの付与に関しては、例えば、ユーザ発話の単語素性、及び直前発話の単語素性に基づいて分類される、ユーザ発話のトピックを抽出する。具体的には、複数種類のトピックから、適切なカテゴリを1つ選択し、トピックを抽出する。トピックラベルの分類には、周知の機械学習技術を用いる。
また、人物属性ラベルの付与に関しては、ユーザ発話の単語素性、及び直前発話の単語素性に基づいて分類される、ユーザ発話が表している人物属性を抽出する。人物属性の分類には、周知の機械学習技術を用いる。
トピック抽出及び人物属性のための素性としては、形態素解析結果から得られるユーザ発話と直前発話中との単語の表記、および、各単語に紐づく日本語語彙大系のカテゴリを素性として用いる。あるいは素性に発話中の機能語および副詞を追加しても良い。
例えば、ユーザ発話「ラーメンが好きです」に対しては、トピックラベルとして「グルメ」、人物属性ラベルとして「趣味嗜好」が付与される。
なお、本実施の形態では、詳細化ラベルとして、トピックラベルと人物属性ラベルとの組み合わせを用いる場合を例に説明したが、これに限定されるものではなく、トピックラベルのみでもよし、また、人物属性ラベルのみでもよい。その他、焦点を抽象化したものであれば何でもよい。ただし、詳細化ラベルとして、システム構築時に用いる対話履歴データ(ユーザ対話履歴、ツイッター(R)等)において、同一ユーザの発話(投稿)内で出現パタンが読み取り可能な抽象度であることが必要である。これは、発話間隔を計算するためである。
データベース更新部23は、ユーザ発話内容理解部21によって推定された述語項構造及び対話行為タイプと、詳細化ラベル付与部22によって付与されたトピックラベル及び人物属性ラベルとを入力とし、ユーザ発話内容理解部21によって推定された対話行為タイプが自己開示に対応する対話行為タイプである当該ユーザの発話について、抽出された述語項構造と推定された対話行為タイプと付与されたトピックラベル及び人物属性ラベルと発話時刻との組み合わせを、ユーザ履歴データベース24に格納する。
具体的には、データベース更新部23は、ユーザ発話内容理解部21によって抽出された述語項構造と、対話行為タイプとに基づいて、対話行為タイプがユーザ自身のことを発話しているという意味の「自己開示」から始まる場合に、該当する述語項構造を、後述するユーザ履歴データベース24へ格納する。例えば、上述の例では、データベース更新部23は、自己開示_評価+の「ラーメン:が:好き」、「グルメ」、「趣味嗜好」をユーザ履歴データベース24に格納する。
ユーザ履歴データベース24には、対話行為タイプが「自己開示」から始まる対話行為タイプである場合の、対話行為タイプと述語項構造とトピックラベルと人物属性と発話時刻との組み合わせが格納される。ユーザ履歴データベース24に格納されるデータの一例を、図2に示す。
対話管理部25は、ユーザ発話内容理解部21によって推定された対話行為タイプに基づいて、エージェント発話の対話行為タイプを選択する。対話管理部25は、ユーザ発話内容理解部21によって抽出された対話行為タイプに基づいて、次のエージェントの発話としてふさわしい対話行為タイプを選択する。具体的には、対話管理部25は、33種類の対話行為タイプを、直前とその前の対話行為タイプから選択する(詳細については上記特許文献1を参照。)。例えば、上記の例の場合では、直前の発話の対話行為タイプが「自己開示_評価+」なので、対話行為タイプ「質問_評価+」が次のエージェント発話の対話行為タイプとして選ばれる。
発話生成部26は、ユーザ履歴データベース24を入力とし、ユーザに対する発話文を生成し、当該発話文に対して、テンプレートに対して予め定められた発話文の対話行為タイプを付与する。
具体的には、発話生成部26は、ユーザ履歴データベース24に格納された対話行為タイプと述語項構造との組み合わせの各々について、話題を変えたり、広げたりするための発話文を生成する。発話生成部26は、発話文を生成する際、発話生成のテンプレートを用意しておき、ユーザ履歴データベース24に格納されている述語項構造の情報をテンプレートの空白部分に埋め込み、発話文と当該発話文の対話行為タイプとの組み合わせを出力する。
例えば、テンプレートとして、「IF 対話行為タイプ=自己開示_評価+ THEN <項>の他に何<格><述語>ですか?(対話行為タイプ=質問_評価+)」を用いると、ユーザ履歴データベース24中の対話行為タイプ「自己開示_評価+」及び述語項構造の組み合わせから、例えば、「先日おっしゃっていたラーメンの他に何が好きですか?」という発話文が生成され、対話行為タイプ「質問_評価+」が付与される。
他にも、テンプレートとして、「IF 対話行為タイプ=自己開示_経験 THEN <項>以外にはどこに<述語>ことがありますか?(対話行為タイプ=質問_経験)」を用いると、「イギリス以外にはどこに行ったことがありますか?」という発話文が生成され、対話行為タイプ「質問_経験」が付与される。
そして、発話生成部26は、生成した発話文と対話行為タイプの組み合わせの各々を、発話候補データベース27に格納する。このとき、発話候補データベース27には、焦点=*として、生成した発話文と、該当する対話行為タイプと、発話生成のもとになったユーザ履歴データベース24中の発話に付与されているトピックラベル及び人物属性ラベルとの組み合わせが格納される。焦点が”*”のものは、後述する第2エージェント発話選択部33によるエージェント発話の選択において、どんな焦点でもよいという意味を表す。
発話候補データベース27には、エージェントがユーザに対して発するためのエージェント発話の候補が複数記憶されている。エージェント発話の候補は、焦点と対話行為タイプと発話文とトピックラベルと人物属性ラベルとの組み合わせを表すデータである。図3に発話候補データベース27に格納されるエージェント発話の候補の一例を示す。発話候補データベース27に格納されているエージェント発話の候補には、発話生成部26によって生成された発話文が含まれている。
発話間隔計算部28は、オフライン処理として対話履歴を含む大規模データ29から求められる詳細化ラベル毎の発話間隔と、オンライン処理としてユーザ履歴データベース24から求められる詳細化ラベル毎の発話間隔とに基づいて、詳細化ラベル毎の発話間隔を計算する。
具体的には、オンライン処理として、ユーザ履歴データベース24から、詳細化ラベルごとに、当該詳細化ラベルの発話情報を抽出し、抽出した発話情報の発話時刻に基づいて、当該詳細化ラベルuの発話間隔の平均(Au)と分散(Vu )を求める。また、発話間隔の平均と分散の算出に利用した、当該詳細化ラベルuの発話数nuに基づく信頼度Cuを求める。
詳細化ラベルuの信頼度Cuは、発話数nuが少ないと大きく、発話数nuが多いと小さくなるようにする。ただし、信頼度Cu>0である。例えば、Cu=1/log(nu)とする。
また、オフライン処理として、事前に、大量の対話履歴やTwitter(R)(対話でなくて投稿で良い))を格納した大規模データ29に対して、ユーザ発話内容理解部21と詳細化ラベル付与部22と同様の処理を実施し、得られた大量の発話情報から、詳細化ラベルgごとに、上記のオンライン処理と同様に、当該詳細化ラベルgの発話間隔の平均(Ag)と分散(Vg)を求める。
そして、詳細化ラベル毎に、ユーザ履歴データベース24と大規模データ29からそれぞれ得られた発話間隔の平均時間Au、Agとその分散Vu、Vg、信頼度Cuをもとに、適切な発話間隔Intervalを算出する。ユーザ履歴データベース24からの算出結果が変われば、発話間隔Intervalも再計算する。
例えば、詳細化ラベルu,gが同一であるとすると、発話間隔Intervalは、以下の式によって算出される。
上記の式では、分散を用いた重み付けで、分散が小さいほうの重みを大きくするために、重みαの分子は、相手方の値としている。
例えば、詳細化ラベル「グルメと趣味嗜好との組み合わせ」に対しては、発話間隔Intervalは1週間、詳細化ラベル「グルメと経験との組み合わせ」に対しては、発話間隔Intervalは2.5日と算出される。
発話間隔計算部28は、計算した詳細化ラベル毎の発話間隔を発話間隔データベース30に格納する。
発話間隔データベース30には、図4に示すように、計算した詳細化ラベル毎の発話間隔が、ユーザ履歴データベース24から得られる各詳細化ラベルの最終発話時刻と共に記憶されている。
話題継続判定部31は、エージェントとユーザとの間の対話における発話列に基づいて、話題を変更すべきか否かを判定する。
例えば、最後がユーザ発話である発話列から、各素性に対する素性値を抽出して、素性とその素性値の組の集合である素性ベクトルを生成し、予め学習された分類モデルに基づいて、話題を変更すべきか否かを判定する。各素性として、発話中の単語、発話中の単語n-gram、発話中の単語の意味カテゴリ、発話に対応する概念ベクトル、発話中の文末表現、発話中のポジティブ表現やネガティブ表現の文字列、発話中の文字数、及び発話中の文字種を用いることができる。
上記のように判定することにより、焦点がある場合においても、ユーザの反応から、システムが話題を変えるべきかを判定することができる。
話題継続判定部31は、話題を変更すべきであると判定した場合は、現在の焦点を”*”で上書きし、第2エージェント発話選択部33へ出力し、話題を継続すべきと判定した場合は、現在の焦点をそのまま第1エージェント発話選択部32へ出力する。
第1エージェント発話選択部32は、話題継続判定部31から現在の焦点がそのまま出力された場合に、発話候補データベース27から、対話管理部25によって選択されたエージェント発話の対話行為タイプが付与され、かつユーザ発話内容理解部21によって抽出された焦点に対応する発話文を、エージェント発話として選択する。
例えば、第1エージェント発話選択部32は、上記の例の場合に、ユーザ発話内容理解部21によって抽出された焦点情報「ラーメン」と、対話管理部25によって決定された次のエージェント発話の対話行為タイプ「質問_評価+」とを含む検索クエリを用いて、発話候補データベース27から検索する。例えば、上記の例の場合では、図3に示す「何系が好きですか?」や「何が好きですか?」が選択される。なお、例えば「何系が好きですか?」はラーメンの話題を深掘りするための質問であり、「何が好きですか?」は話題を変えたり、広げたりするための質問である。
第2エージェント発話選択部33は、話題継続判定部31から「焦点=*」が出力された場合(焦点が与えられていない場合)に、発話間隔データベース30に記憶されている、詳細化ラベル毎の発話間隔、及び詳細化ラベル毎の最終発話時刻に基づいて、詳細化ラベルを選択し、発話候補データベース27から、選択された詳細化ラベルが付与された発話文を、エージェント発話として選択する。
具体的には、発話間隔データベース30及び現在時刻Nowを参照し、各詳細化ラベル(トピックラベルと人物属性ラベルの組み合わせ)ごとに、最終発話時刻Lastを取得し、現在時刻との差分時間(=Now−Last)を算出する。
次に、発話間隔データベース30中の発話間隔Intervalと上記の差分時間との差(絶対値)Diffを以下の式に従って求める。
Diff=|Interval−(Now−Last)|
詳細化ラベルごとに差Diffを計算し、最も差Diffの値が小さい詳細化ラベルを選択し、選択された詳細化ラベルが付与された発話文を発話候補データベース27から選択し、エージェント発話とする。
出力部40は、第1エージェント発話選択部32又は第2エージェント発話選択部33によって選択されたエージェント発話を出力する。出力部40によって出力された発話は、エージェントによってユーザに対して発せられる。
<発話選択装置100の動作>
次に、本実施の形態に係る発話選択装置100の作用について説明する。まず、ユーザとエージェントとの対話が開始されると、発話選択装置100によって、図5に示す対話処理ルーチンが実行される。対話処理ルーチンは、ユーザの発話が発せられる毎に実行される。
まず、ステップS100において、入力部10によって、ユーザの発話の入力を受け付ける。
次に、ステップS102において、ユーザ発話内容理解部21によって、上記ステップS100で受け付けたユーザの発話に対して形態素解析を行い、ユーザの発話から、述語項構造を抽出すると共に、焦点を抽出し、対話行為タイプを推定する。
ステップS104において、上記ステップS102で推定された対話行為タイプが、自己開示に対応する対話行為タイプであるか否かを判定する。上記ステップS102で推定された対話行為タイプが、自己開示に対応する対話行為タイプである場合には、ステップS106へ進む。一方、上記ステップS102で推定された対話行為タイプが、自己開示に対応する対話行為タイプでない場合には、ステップS114へ移行する。
ステップS106において、詳細化ラベル付与部22によって、上記ステップS102で得られた発話の形態素解析結果に基づいて、トピックの分類と人物属性の分類とを行って、トピックラベルと人物属性ラベルとの組み合わせを、詳細化ラベルとして付与する。
ステップS108では、データベース更新部23によって、上記ステップS102で抽出された述語項構造と推定された対話行為タイプと上記ステップS106で付与された詳細化ラベルのトピックラベルと人物属性ラベルとの組み合わせを、ユーザ履歴データベース24に格納する。
ステップS110において、発話生成部26によって、上記ステップS108でユーザ履歴データベース24に格納された述語項構造と対話行為タイプとの組み合わせに基づいて、述語項構造と、当該対話行為タイプに対して予め定められたテンプレートとから、発話文を生成する。また、発話生成部26によって、生成した当該発話文に対して、当該テンプレートに対して予め定められた発話文の対話行為タイプと、上記ステップS106で付与された詳細化ラベルのトピックラベルと人物属性ラベルとの組み合わせを付与して、発話候補データベース27に格納する。
ステップS112において、発話間隔計算部28によって、ユーザ履歴データベース24から、詳細化ラベルごとに、当該詳細化ラベルの発話情報を抽出し、抽出した発話情報の発話時刻に基づいて、当該詳細化ラベルuの発話間隔の平均(Au)と分散(Vu )を求める。また、発話間隔の平均と分散の算出に利用した、当該詳細化ラベルuの発話数nuに基づく信頼度Cuを求める。
そして、発話間隔計算部28によって、詳細化ラベルごとに、ユーザ履歴データベース24から得られた発話間隔の平均時間Au、分散Vu、及び信頼度Cuと、オフライン処理として大規模データ29から得られた発話間隔の平均時間Ag及び分散Vgとに基づいて、発話間隔Intervalを算出し、発話間隔データベース30に格納する。また、発話間隔データベース30に記憶されている詳細化ラベル毎の最終発話時刻を更新する。
そして、ステップS114において、対話管理部25によって、上記ステップS102で推定された対話行為タイプに基づいて、エージェント発話の対話行為タイプを選択する。
ステップS116において、話題継続判定部31によって、エージェントとユーザとの間の対話における発話列に基づいて、話題を変更すべきか否かを判定し、話題を変更すべきであると判定した場合は、上記ステップS102で得られた現在の焦点を”*”で上書きし、話題を継続すべきであると判定した場合は、上記ステップS102で得られた現在の焦点をそのまま出力する。
ステップS118では、上記ステップS118で出力された焦点が存在するか否かを判定し、上記ステップS102で得られた現在の焦点がそのまま出力されている場合には、ステップS120へ移行し、一方、出力された焦点が”*”である場合には、焦点がなく、エージェント側にイニシアチブがあるものと判断し、ステップS122へ移行する。
そして、ステップS120において、第1エージェント発話選択部32によって、発話候補データベース27から、上記ステップS114で選択されたエージェント発話の対話行為タイプが付与され、かつ上記ステップS116で出力された焦点に対応する発話を、エージェント発話として選択する。
ステップS122では、第2エージェント発話選択部33によって、発話間隔データベース30に記憶されている、詳細化ラベル毎の発話間隔、及び詳細化ラベル毎の最終発話時刻に基づいて、詳細化ラベルを選択し、発話候補データベース27から、当該詳細化ラベルが付与された発話文を、エージェント発話として選択する。
そして、ステップS124において、出力部40によって、上記ステップS120又はS122で選択されたエージェント発話を出力して、対話処理ルーチンを終了する。
出力部40によって出力された発話は、エージェントによってユーザに対して発せられる。
以上説明したように、本実施の形態に係る発話選択装置100によれば、入力されたユーザの発話に基づいて、詳細化ラベルを付与して、ユーザ履歴データベースに記録し、詳細化ラベル毎の発話間隔と、詳細化ラベル毎の最終発話時刻とに基づいて、詳細化ラベルが付与された発話文から、エージェント発話を選択することにより、ユーザに合わせたタイミングでエージェント発話を選択することができる。すわなち、ユーザ毎に異なる質問文を発話するタイミングについて考慮できるので、各ユーザに合わせたタイミングで質問文を発話することが可能になる。
また、従来技術では、発話選択の基準が、焦点に関する発話履歴の有無以外無く、履歴がない場合はランダムに選択していたが、本実施の形態では、発話間隔の情報を用いることにより、発話選択時に、ユーザが最も話したいと思われるタイミングにある焦点の発話が選択可能となる。
また、発話間隔を読み取る際、焦点ごとの発話間隔では、パタンを読み取れるほど十分な履歴が存在しない場合が多いため、本実施の形態では、焦点を抽象化した詳細化ラベルを付与することにより、焦点をそのまま用いるより、多くの焦点について発話間隔情報を取得できる。
また、対話開始時には、対話中のユーザの発話履歴情報では発話間隔を計算するのに不十分であるため、本実施の形態では、ツイッター(R)や他ユーザの対話履歴など大規模データから一般的な発話間隔を計算し、対話中のユーザの発話履歴から求めた発話間隔と組み合わせて使うことにより、対話中のユーザの発話履歴から求めた発話間隔が不十分な場合を補うことができる。
また、上記2つの発話間隔を組み合わせる際、可能な限り対話中のユーザの対話履歴から求めた発話間隔を用いたほうが、よりパーソナライズできるため、本実施の形態では、発話間隔の分散情報と信頼度を用いることにより、発話履歴が不十分な対話開始時には一般的な発話間隔を使うことができ、対話履歴が十分な際には対話中のユーザに特化した発話間隔を使うことができる。
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
また、上記実施の形態では、ユーザ履歴データベース24、発話候補データベース27、大規模データ29、及び発話間隔データベース30を備えている場合について説明したが、例えば、ユーザ履歴データベース24、発話候補データベース27、大規模データ29、及び発話間隔データベース30の少なくとも1つが発話選択装置の外部装置に設けられ、発話選択装置は、外部装置と通信手段を用いて通信することにより、ユーザ履歴データベース24、発話候補データベース27、大規模データ29、及び発話間隔データベース30の少なくとも1つを参照するようにしてもよい。
また、上記実施の形態では、第1エージェント発話選択部32は、発話候補データベース27から、対話管理部25によって選択されたエージェント発話の対話行為タイプが付与され、かつユーザ発話内容理解部21によって抽出された焦点に対応する発話文を、エージェント発話として選択する場合を例に説明したが、これに限定されるものではない。例えば、第1エージェント発話選択部32は、ユーザ発話内容理解部21によって抽出された焦点を用いずに、発話候補データベース27から、対話管理部25によって選択されたエージェント発話の対話行為タイプが付与された発話文を、エージェント発話として選択してもよい。
また、上記実施の形態では、エージェント発話の選択処理と発話文の生成処理とを1つの装置として構成する場合を例に説明したが、エージェント発話の選択処理と発話文の生成処理とを別々の装置として構成してもよい。
また、上述の発話選択装置は、内部にコンピュータシステムを有しているが、コンピュータシステムは、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読取り可能な記録媒体に格納して提供することも可能である。
10 入力部
20 演算部
21 ユーザ発話内容理解部
22 詳細化ラベル付与部
23 データベース更新部
24 ユーザ履歴データベース
25 対話管理部
26 発話生成部
27 発話候補データベース
28 発話間隔計算部
29 大規模データ
30 発話間隔データベース
31 話題継続判定部
32 第1エージェント発話選択部
33 第2エージェント発話選択部
40 出力部
100 発話選択装置

Claims (8)

  1. 入力されたユーザの発話に基づいて、前記発話の詳細化ラベルを付与する詳細化ラベル付与部と、
    前記詳細化ラベル付与部によって付与された前記発話の詳細化ラベルと、前記発話の発話時刻とをユーザ履歴データベースに記録するデータベース更新部と、
    予め求められた詳細化ラベル毎の発話間隔と、前記ユーザ履歴データベースから得られる詳細化ラベル毎の最終発話時刻とに基づいて、予め生成された、前記詳細化ラベルが付与された発話文から、エージェント発話を選択するエージェント発話選択部と、
    を含む発話選択装置。
  2. 前記詳細化ラベルを、発話の焦点よりも抽象化したラベルとした請求項1記載の発話選択装置。
  3. 対話履歴を含む大規模データから求められる前記詳細化ラベル毎の発話間隔と、前記ユーザ履歴データベースから求められる前記詳細化ラベル毎の発話間隔とに基づいて、前記詳細化ラベル毎の発話間隔を計算する発話間隔計算部を更に含み、
    前記エージェント発話選択部は、前記発話間隔計算部によって計算された前記詳細化ラベル毎の発話間隔と、前記ユーザ履歴データベースから得られる詳細化ラベル毎の最終発話時刻とに基づいて、前記詳細化ラベルを選択し、前記選択した前記詳細化ラベルが付与された発話文を、前記エージェント発話として選択する請求項1又は2記載の発話選択装置。
  4. 前記発話間隔計算部は、前記詳細化ラベル毎に、前記大規模データから求められる前記詳細化ラベルの発話間隔の平均及び分散と、前記ユーザ履歴データベースから求められる前記詳細化ラベルの発話間隔の平均及び分散と、前記ユーザ履歴データベースに含まれる前記詳細化ラベルの発話数に応じた信頼度とに基づいて、前記詳細化ラベルの発話間隔を計算する請求項3記載の発話選択装置。
  5. 前記入力されたユーザの発話から、対話における発話の意図を表す対話行為タイプを推定するユーザ発話内容理解部と、
    前記ユーザ発話内容理解部によって推定された前記対話行為タイプに基づいて、エージェント発話の対話行為タイプを選択する対話管理部と、
    前記発話に基づいて、話題を変更すべきか否かを判定する話題継続判定部とを更に含み、
    前記エージェント発話選択部は、前記話題継続判定部によって話題を変更すべきでないと判定された場合、前記対話管理部によって選択された前記エージェント発話の対話行為タイプに基づいて、予め生成された、前記対話行為タイプが付与された発話文から、前記エージェント発話を選択し、
    前記話題継続判定部によって話題を変更すべきであると判定された場合、前記詳細化ラベル毎の発話間隔と、前記ユーザ履歴データベースから得られる詳細化ラベル毎の最終発話時刻とに基づいて、前記詳細化ラベルが付与された発話文から、エージェント発話を選択する請求項1〜請求項4の何れか1項記載の発話選択装置。
  6. 前記詳細化ラベル付与部は、前記ユーザ発話内容理解部によって推定された対話行為タイプが自己開示に対応する対話行為タイプである場合、前記発話の詳細化ラベルを付与し、
    前記データベース更新部は、前記ユーザ発話内容理解部によって推定された対話行為タイプが自己開示に対応する対話行為タイプである場合、前記詳細化ラベル付与部によって付与された前記発話の詳細化ラベルと、前記発話の発話時刻とを前記ユーザ履歴データベースに記録する請求項5記載の発話選択装置。
  7. 詳細化ラベル付与部、データベース更新部、及びエージェント発話選択部を含む発話選択装置における発話選択方法であって、
    前記詳細化ラベル付与部が、入力されたユーザの発話に基づいて、前記発話の詳細化ラベルを付与し、
    前記データベース更新部が、前記詳細化ラベル付与部によって付与された前記発話の詳細化ラベルと、前記発話の発話時刻とをユーザ履歴データベースに記録し、
    前記エージェント発話選択部が、予め求められた詳細化ラベル毎の発話間隔と、前記ユーザ履歴データベースから得られる詳細化ラベル毎の最終発話時刻とに基づいて、予め生成された、前記詳細化ラベルが付与された発話文から、エージェント発話を選択する
    発話選択方法。
  8. コンピュータを、請求項1〜請求項6の何れか1項記載の発話選択装置を構成する各部として機能させるためのプログラム。
JP2016004440A 2016-01-13 2016-01-13 発話選択装置、方法、及びプログラム Pending JP2017125921A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016004440A JP2017125921A (ja) 2016-01-13 2016-01-13 発話選択装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016004440A JP2017125921A (ja) 2016-01-13 2016-01-13 発話選択装置、方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2017125921A true JP2017125921A (ja) 2017-07-20

Family

ID=59364162

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016004440A Pending JP2017125921A (ja) 2016-01-13 2016-01-13 発話選択装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2017125921A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019061487A (ja) * 2017-09-26 2019-04-18 カシオ計算機株式会社 対話装置、対話方法及びプログラム
WO2020036189A1 (ja) * 2018-08-15 2020-02-20 日本電信電話株式会社 応対履歴作成支援装置、応対履歴作成支援方法、データ構造、プログラム、表示装置、及び編集支援装置
WO2020066019A1 (ja) * 2018-09-28 2020-04-02 富士通株式会社 対話装置、対話方法及び対話プログラム
JP2020087352A (ja) * 2018-11-30 2020-06-04 富士通株式会社 対話制御方法、対話制御プログラム、対話制御装置、情報提示方法および情報提示装置
US10971149B2 (en) 2018-05-11 2021-04-06 Toyota Jidosha Kabushiki Kaisha Voice interaction system for interaction with a user by voice, voice interaction method, and program
US20220310079A1 (en) * 2019-07-18 2022-09-29 Sri International The conversational assistant for conversational engagement

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019061487A (ja) * 2017-09-26 2019-04-18 カシオ計算機株式会社 対話装置、対話方法及びプログラム
US10971149B2 (en) 2018-05-11 2021-04-06 Toyota Jidosha Kabushiki Kaisha Voice interaction system for interaction with a user by voice, voice interaction method, and program
JP7096510B2 (ja) 2018-08-15 2022-07-06 日本電信電話株式会社 応対履歴作成支援装置、応対履歴作成支援方法、プログラム、表示装置、及び編集支援装置
WO2020036189A1 (ja) * 2018-08-15 2020-02-20 日本電信電話株式会社 応対履歴作成支援装置、応対履歴作成支援方法、データ構造、プログラム、表示装置、及び編集支援装置
US11749258B2 (en) 2018-08-15 2023-09-05 Nippon Telegraph And Telephone Corporation Device and method for supporting creation of reception history, non-transitory computer readable recording medium
JP7208564B2 (ja) 2018-08-15 2023-01-19 日本電信電話株式会社 応対履歴作成支援装置、応対履歴作成支援方法、プログラム、及び表示装置
JPWO2020036189A1 (ja) * 2018-08-15 2021-08-10 日本電信電話株式会社 応対履歴作成支援装置、応対履歴作成支援方法、データ構造、プログラム、表示装置、及び編集支援装置
JP2022043263A (ja) * 2018-08-15 2022-03-15 日本電信電話株式会社 応対履歴作成支援装置、応対履歴作成支援方法、プログラム、及び表示装置
US11482209B2 (en) 2018-08-15 2022-10-25 Nippon Telegraph And Telephone Corporation Device and method for supporting creation of reception history, non-transitory computer readable recording medium
JPWO2020066019A1 (ja) * 2018-09-28 2021-08-30 富士通株式会社 対話装置、対話方法及び対話プログラム
JP7044167B2 (ja) 2018-09-28 2022-03-30 富士通株式会社 対話装置、対話方法及び対話プログラム
WO2020066019A1 (ja) * 2018-09-28 2020-04-02 富士通株式会社 対話装置、対話方法及び対話プログラム
JP7115265B2 (ja) 2018-11-30 2022-08-09 富士通株式会社 対話制御方法、対話制御プログラム、対話制御装置、情報提示方法および情報提示装置
JP2020087352A (ja) * 2018-11-30 2020-06-04 富士通株式会社 対話制御方法、対話制御プログラム、対話制御装置、情報提示方法および情報提示装置
US20220310079A1 (en) * 2019-07-18 2022-09-29 Sri International The conversational assistant for conversational engagement

Similar Documents

Publication Publication Date Title
US10037758B2 (en) Device and method for understanding user intent
JP2017125921A (ja) 発話選択装置、方法、及びプログラム
JP6310150B2 (ja) 意図理解装置、方法およびプログラム
US9594744B2 (en) Speech transcription including written text
US20190139537A1 (en) Dialogue system and dialogue method
US9747893B2 (en) Unsupervised training method, training apparatus, and training program for an N-gram language model based upon recognition reliability
CN113614825A (zh) 用于自动语音识别的字词网格扩增
JP6370962B1 (ja) 生成装置、生成方法および生成プログラム
JP6429706B2 (ja) 音声対話装置、音声対話方法及びプログラム
US10573311B1 (en) Generating self-support metrics based on paralinguistic information
JPWO2009101837A1 (ja) 記号挿入装置および記号挿入方法
JP7400112B2 (ja) 自動音声認識のための英数字列のバイアス付加
KR101677859B1 (ko) 지식 베이스를 이용하는 시스템 응답 생성 방법 및 이를 수행하는 장치
US20200219487A1 (en) Information processing apparatus and information processing method
JP2016001242A (ja) 質問文生成方法、装置、及びプログラム
US11043215B2 (en) Method and system for generating textual representation of user spoken utterance
JP2020077159A (ja) 対話システム、対話装置、対話方法、及びプログラム
JP2007102104A (ja) 応答文生成装置、応答文生成方法、そのプログラムおよび記憶媒体
JP6806619B2 (ja) 音声合成システム、音声合成方法、及び音声合成プログラム
KR20240096898A (ko) 격자 음성 교정
JP5860439B2 (ja) 言語モデル作成装置とその方法、そのプログラムと記録媒体
JP4986301B2 (ja) 音声認識処理機能を用いたコンテンツ検索装置、プログラム及び方法
JP2020135342A (ja) 言語処理装置、言語処理方法、およびプログラム
JP2020140674A (ja) 回答選択装置及びプログラム
JP2017199283A (ja) 情報抽出装置、方法、及びプログラム