WO2018163646A1

WO2018163646A1 - 対話方法、対話システム、対話装置、およびプログラム

Info

Publication number: WO2018163646A1
Application number: PCT/JP2018/002505
Authority: WO
Inventors: 弘晃杉山; 宏美成松; 雄一郎吉川; 尊優飯尾; 庸浩有本; 石黒　浩
Original assignee: 日本電信電話株式会社; 国立大学法人大阪大学
Priority date: 2017-03-10
Filing date: 2018-01-26
Publication date: 2018-09-13
Also published as: US11354517B2; US20200034434A1; JPWO2018163646A1; JP6864326B2

Abstract

エージェントの対話を聞き流すことを防ぎ、エージェントとの対話を理解しやすくする。対話システム１００は、ユーザ１０１と対話を行う。人型ロボット５０－１は、論理構造の一部が欠落している発話である論理飛躍発話を提示する。ユーザ１０１は、論理飛躍発話において欠落している情報を確認する行動である確認行動を表出する。人型ロボット５０－１は、欠落している情報を説明する発話である補足発話を提示する。

Description

対話方法、対話システム、対話装置、およびプログラム

　この発明は、人とコミュニケーションを行うロボットなどに適用可能な、コンピュータが人間と自然言語等を用いて対話を行う技術に関する。

　近年、人とコミュニケーションを行うロボットの研究開発が進展しており、様々な現場で実用化されてきている。例えば、コミュニケーションセラピーの現場において、ロボットが孤独感を抱える人の話し相手となる利用形態がある。具体的には、老人介護施設においてロボットが入居者の傾聴役となることで、入居者の孤独感を癒す役割を担うことができると共に、ロボットとの会話している姿を見せ、入居者とその家族や介護士など周りの人々との会話のきっかけを作ることができる。また、例えば、コミュニケーション訓練の現場において、ロボットが練習相手となる利用形態がある。具体的には、外国語学習施設においてロボットが外国語学習者の練習相手となることで、外国語学習を効率的に進めることができる。また、例えば、情報提示システムとしての応用において、ロボット同士の対話を聞かせることを基本としながら、時折人に話しかけることで、退屈させずに人を対話に参加させ、人が受け入れやすい形で情報を提示することができる。具体的には、街中の待ち合わせ場所やバス停、駅のホームなどで人が時間を持て余している際や、自宅や教室などで対話に参加する余裕がある際に、ニュースや商品紹介、蘊蓄・知識紹介、教育（例えば、子供の保育・教育、大人への一般教養教授、モラル啓発など）など、効率的な情報提示が期待できる。さらに、例えば、情報収集システムとしての応用において、ロボットが人に話しかけながら情報を収集する利用形態がある。ロボットとのコミュニケーションにより対話感を保持できるため、人に聴取されているという圧迫感を与えずに情報収集することができる。具体的には、個人情報調査や市場調査、商品評価、推薦商品のための趣向調査などに応用することが想定されている。このように人とロボットのコミュニケーションは様々な応用が期待されており、ユーザとより自然に対話を行うロボットの実現が期待される。また、スマートフォンの普及により、LINE(登録商標)のように、複数ユーザでほぼリアルタイムにチャットを行うことにより、人との会話を楽しむサービスも実施されている。このチャットサービスにロボットとの会話の技術を適用すれば、チャット相手がいなくても、ユーザとより自然に対話を行うチャットサービスの実現が可能となる。

　本明細書では、これらのサービスで用いられるロボットやチャット相手などのユーザとの対話相手となるハードウェアやユーザとの対話相手となるハードウェアとしてコンピュータを機能させるためのコンピュータソフトウェアなどを総称してエージェントと呼ぶこととする。エージェントは、ユーザとの対話相手となるものであるため、ロボットやチャット相手などのように擬人化されていたり、人格化されていたり、性格や個性を有していたりするものであってもよい。

　これらのサービスの実現のキーとなるのは、ハードウェアやコンピュータソフトウェアにより実現されるエージェントが人間と自然に対話を行うことができる技術である。

　上記のエージェントの一例として、例えば、非特許文献１に記載されたような、ユーザの発話を音声認識し、発話の意図を理解・推論して、適切な応答をする音声対話システムがある。音声対話システムの研究は、音声認識技術の進展に伴って活発に進められ、例えば音声自動応答システムなどで実用化されている。

　また、上記のエージェントの一例として、あらかじめ定められたシナリオに沿って特定の話題についてユーザと対話を行うシナリオ対話システムがある。シナリオ対話システムでは、シナリオに沿って対話が展開する限り対話を続けることが可能である。例えば、非特許文献２に記載された対話システムは、ユーザと複数のエージェント間で、エージェントによる割り込みやエージェント同士のやり取りを含めながら対話を行うシステムである。例えば、エージェントは、ユーザに対してシナリオに用意された質問を発話し、質問に対するユーザの回答の発話がシナリオに用意された選択肢に対応する場合に、その選択肢に対応する発話を行うように機能する。すなわち、シナリオ対話システムは、システムに予め記憶されたシナリオに基づいた発話をエージェントが行う対話システムである。この対話システムでは、エージェントがユーザに問いかけ、ユーザからの返答を受けた際に、ユーザの発話内容に関わらず「そっか」といった相槌で流したり、エージェントの割り込みで話題を変えたりすることで、ユーザの発話が本来の話題から外れた場合であってもストーリーの破綻をユーザに感じさせないように応答することが可能である。

　また、上記のエージェントの一例として、ユーザの発話内容に沿った発話をエージェントが行うことにより、ユーザとエージェントとが自然な対話を行う雑談対話システムがある。例えば、非特許文献３に記載された対話システムは、ユーザとエージェントとの間で行われる複数回の対話の中で文脈に特有のものをより重視しながら、ユーザまたはエージェントの発話に含まれる単語をトリガーとして、あらかじめ記述しておいたルールに従ってシステムが発話することで、ユーザとシステムとの間で雑談対話を実現するシステムである。雑談対話システムが用いるルールは、あらかじめ記述したものだけでなく、ユーザの発話内容に基づいて自動的に生成したものであってもよいし、ユーザまたはエージェントによる直前の発話またはその近傍に発話された発話に基づいて自動的に生成したものであってもよいし、ユーザまたはエージェントによる直前の発話またはその近傍に発話された発話を少なくとも含む発話に基づいて自動的に生成したものであってもよい。非特許文献３には、ユーザの発話に含まれる単語と共起関係や係り受け関係にある単語に基づいて、自動的にルールを生成する技術が記載されている。また、例えば、非特許文献４に記載された対話システムは、人手で記述したルールと統計的発話生成手法で記述したルールを融合することで、ルール生成のコストを低減したシステムである。雑談対話システムは、シナリオ対話システムとは異なり、予め用意されたシナリオに沿った発話をエージェントが行うものではないため、ユーザの発話によっては、エージェントの発話がユーザの発話に対応しないものとなってしまうという事態は生じずに、少なくともユーザの発話内容、もしくはユーザまたはエージェントによる直前の発話またはその近傍に発話された発話、もしくはユーザまたはエージェントによる直前の発話またはその近傍に発話された発話を少なくとも含む発話に基づいた発話をエージェントが行うことが可能である。すなわち、雑談対話システムは、少なくともユーザの発話内容、もしくはユーザまたはエージェントによる直前の発話またはその近傍に発話された発話、もしくはユーザまたはエージェントによる直前の発話またはその近傍に発話された発話を少なくとも含む発話に基づいた発話をエージェントが行う対話システムである。これらの雑談対話システムでは、ユーザの発話に対して明示的に応答することが可能である。

河原達也，"話し言葉による音声対話システム"，情報処理，vol. 45，no. 10，pp. 1027-1031，2004年10月有本庸浩，吉川雄一郎，石黒浩，"複数体のロボットによる音声認識なし対話の印象評価"，日本ロボット学会学術講演会，2016年杉山弘晃，目黒豊美，東中竜一郎，南泰浩，"任意の話題を持つユーザ発話に対する係り受けと用例を利用した応答文の生成"，人工知能学会論文誌，vol. 30(1)，pp. 183-194，2015年目黒豊美，杉山弘晃，東中竜一郎，南泰浩，"ルールベース発話生成と統計的発話生成の融合に基づく対話システムの構築"，人工知能学会全国大会論文集，vol. 28，pp. 1-4，2014年

　対話システムが対話の話題やシナリオを遷移させるとき、その遷移が唐突な印象を与える場合がある。また、その繋がりの良さを予測しようとしても、必ずしも妥当な評価とはならないことがある。さらに、エージェント間の対話がスムーズに繋がり続けると、あたかも小芝居を見せられているような印象を与えてしまい、対話感が減退したり、ユーザの理解が追い付かなくなったりする。

　また、対話システムによる対話は、対話が破綻することを避けるために、引っ掛かりや当たり障りのないものとなることが多く、ユーザの対話システムに対する共感度が低くなりやすい。この場合、ユーザはエージェントの発話に対してあまり納得していなくても、適当に聞き流してしまうことが多くなる。

　この発明の目的は、上述のような点に鑑みて、ユーザがエージェントの対話を聞き流すことを防ぎ、エージェントとの対話を理解しやすい対話システム、対話装置を実現することである。

　上記の課題を解決するために、この発明の対話方法は、ユーザと対話を行う対話システムが実行する対話方法であって、提示部が、論理構造の一部が欠落している発話である論理飛躍発話を提示する発話提示ステップと、提示部が、論理飛躍発話中の欠落している情報を確認する行動である確認行動が表出された後に、欠落している情報を説明する発話である補足発話を提示する補足提示ステップと、を含む。

　この発明によれば、論理構造の一部が欠落しており理解しにくい発話を意図的に提示することで、ユーザがエージェントの発話を聞き流すことを防ぐため、ユーザがエージェントとの対話を理解しやすい対話システム、対話装置を実現することが可能となる。また、エージェント間の対話であっても齟齬が生じることがあり、かつ、その状態から復帰することができることを示すため、ユーザがエージェントに対して知的な印象を持ち、エージェント間の対話を理解することが容易な対話システム、対話装置を実現することが可能となる。

図１は、実施形態の対話システムの機能構成を例示する図である。図２は、実施形態の対話方法の処理手続きを例示する図である。図３は、変形例の対話システムの機能構成を例示する図である。

　この発明では、対話システムが、内容が飛躍した発話（例えば、論理的に飛躍がある発話や、話題の鍵となる単語が省略された発話）を提示することで、ユーザや他のエージェントによる割り込みを促す。また、エージェント間の対話に内容が飛躍した発話を含め、エージェント間の対話に引っ掛かりを作ることで、ユーザによる割り込みを促す。もしくは、一般的に受け入れ難い主張の発話をエージェントが提示し、ユーザや他のエージェントによる割り込みを挟んで、内容を補足する発話を行う。内容が飛躍した発話や一般的に受け入れ難い主張の発話を提示する前に、話題が遷移することを示す語を提示してもよい。これにより、ユーザがエージェントの発話を聞き流すことが少なくなり、ユーザはエージェントとの対話を理解しやすくなる。また、エージェント間の対話であっても齟齬が生じることがあり、かつ、その状態から復帰できることが示されるため、ユーザはエージェントに対して知的な印象を持ち、エージェント間の対話を理解することが容易になる。

　以下、この発明の実施の形態について詳細に説明する。なお、図面中において同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。

　実施形態の対話システムは、少なくとも一台の人型ロボットがユーザとの対話を行うシステムである。すなわち、実施形態の対話システムは、エージェントが人型ロボットである場合の一例である。対話システム１００は、図１に示すように、例えば、対話装置１と、マイクロホン１１およびカメラ１２からなる入力部１０と、少なくともスピーカ５１を備える提示部５０とを含む。対話装置１は、例えば、行動認識部２０、発話決定部３０、および音声合成部４０を備える。行動認識部２０は、例えば、音声認識部２１および動作認識部２２を備える。この対話システム１００が後述する各ステップの処理を行うことにより実施形態の対話方法が実現される。

　対話装置１は、例えば、中央演算処理装置（CPU: Central Processing Unit）、主記憶装置（RAM: Random Access Memory）などを有する公知又は専用のコンピュータに特別なプログラムが読み込まれて構成された特別な装置である。対話装置１は、例えば、中央演算処理装置の制御のもとで各処理を実行する。対話装置１に入力されたデータや各処理で得られたデータは、例えば、主記憶装置に格納され、主記憶装置に格納されたデータは必要に応じて読み出されて他の処理に利用される。また、対話装置１の各処理部の少なくとも一部が集積回路等のハードウェアによって構成されていてもよい。

　［入力部１０］
　入力部１０は提示部５０と一体もしくは部分的に一体として構成してもよい。図１の例では、入力部１０の一部であるマイクロホン１１－１、１１－２が、提示部５０である人型ロボット５０－１、５０－２の頭部（耳の位置）に搭載されている。また、図１の例では入力部１０の一部であるカメラ１２が独立して設置されているが、例えば、人型ロボット５０－１、５０－２の頭部（目の位置）に搭載されていてもよい。図１の例では、提示部５０は二台の人型ロボット５０－１、５０－２から構成されているが、一台の人型ロボットから構成されていてもよく、三台以上の人型ロボットから構成されていてもよい。

　入力部１０は、ユーザの発話（言語的な行動）と動作（非言語的な行動）の少なくとも何れかを対話システム１００が取得するためのインターフェースである。言い換えれば、入力部１０は、ユーザの行動を対話システム１００へ入力するためのインターフェースである。例えば、入力部１０はユーザの発話音声を収音して音声信号に変換するためのマイクロホン１１である。入力部１０をマイクロホンとする場合、ユーザ１０１が発話した発話音声を収音可能とすればよい。つまり、図１は一例であって、マイクロホン１１－１，１１－２の何れか一方を備えないでもよい。また、ユーザ１０１の近傍などの人型ロボット５０－１，５０－２とは異なる場所に設置された１個以上のマイクロホン、または、複数のマイクロホンを備えたマイクロホンアレイを入力部とし、マイクロホン１１－１，１１－２の双方を備えない構成としてもよい。マイクロホン１１が、変換により得た音響信号を出力する。マイクロホン１１が出力した音響信号は、行動認識部２０の音声認識部２１へ入力される。また、例えば、入力部１０はユーザの身体的な動作を収録して映像信号に変換するためのカメラ１２である。入力部１０をカメラとする場合、ユーザ１０１の身体動作を収録可能とすればよい。つまり、図１は一例であって、カメラ１２は１個のカメラでもよいし複数のカメラでもよい。カメラ１２が、変換により得た映像信号を出力する。カメラ１２が出力した映像信号は、行動認識部２０の動作認識部２２へ入力される。

　［行動認識部２０］
　行動認識部２０は、マイクロホン１１が収音した音響信号とカメラ１２が収録した映像信号の少なくとも何れかを入力として、音声認識部２１と動作認識部２２の少なくとも何れかを用いて、ユーザの行動内容を表す情報を得て、発話決定部３０に対して出力する。

　［音声認識部２１］
　音声認識部２１は、マイクロホン１１から入力された音響信号を音声認識し、認識結果として得たテキストを出力する。音声認識部２１が出力したテキストは、行動認識部２０が出力するユーザの行動内容を表す情報に含められる。音声認識部２１が行う音声認識の方法は、既存のいかなる音声認識技術であってもよく、利用環境等に合わせて最適なものを適宜選択すればよい。なお、音響信号に音声が含まれない場合には、認識結果としてテキストは得られないため、音声認識部２１はテキストを出力せず、行動認識部２０が出力するユーザの行動内容を表す情報にはテキストは含まれない。

　［動作認識部２２］
　動作認識部２２は、カメラ１２から入力された映像信号を動作認識し、ユーザの動作内容を表す情報を得て出力する。動作認識部２２が出力したユーザの動作内容を表す情報は、行動認識部２０が出力するユーザの行動内容を表す情報に含められる。動作認識部２２が行う動作認識の方法は、例えば、ユーザの表情などの変化などを利用する方法である。この方法では、動作認識部２２は、入力された映像信号からユーザの顔の時系列の画像を取得し、取得した時系列の画像から特徴（例えば、瞳孔の大きさ、目尻の位置、目頭の位置、口角の位置、口の開き具合等）の変化であるユーザの動作内容を取得する。動作認識部２２は、入力された映像信号中の各時刻に対応するユーザの動作内容を得て、ユーザの動作内容を表す時系列のデータを生成し、生成した時系列データをユーザの動作内容を表す情報として出力する。ただし、上記の動作認識の方法は一例であり、動作認識部２２が行う動作認識の方法は、既存のいかなる動作認識技術であってもよく、利用環境等に合わせて最適なものを適宜選択すればよい。

　［発話決定部３０］
　発話決定部３０は、対話システム１００からの発話内容を表すテキストを決定し、音声合成部４０に対して出力する。行動認識部２０からユーザの行動内容を表す情報が入力された場合には、入力されたユーザの行動内容を表す情報に基づいて、対話システム１００からの発話内容を表すテキストを決定し、音声合成部４０に対して出力する。なお、対話システム１００の提示部５０が複数の人型ロボットで構成される場合には、発話決定部３０は、当該発話をいずれの人型ロボットが提示するかを決定してもよい。この場合には、当該発話を提示する人型ロボットを表す情報も併せて音声合成部４０へ出力する。また、この場合には、発話決定部３０は、当該発話を提示する相手、すなわち、当該発話をユーザに対して提示するのか、何れかの人型ロボットに対して提示するのか、を決定してもよい。この場合には、当該発話を提示する相手を表す情報も併せて音声合成部４０へ出力する。

　［音声合成部４０］
　音声合成部４０は、発話決定部３０から入力された発話内容を表すテキストを、発話内容を表す音声信号に変換し、提示部５０に対して出力する。音声合成部４０が行う音声合成の方法は、既存のいかなる音声合成技術であってもよく、利用環境等に合わせて最適なものを適宜選択すればよい。なお、対話システム１００の提示部５０が複数の人型ロボットで構成される場合に、発話決定部３０から発話内容を表すテキストと共に当該発話を提示する人型ロボットを表す情報が入力された場合には、音声合成部４０は、当該情報に対応する人型ロボットへ発話内容を表す音声信号を出力する。また、発話決定部３０から発話内容を表すテキストと当該発話を提示する人型ロボットを表す情報に併せて発話を提示する相手を表す情報も入力された場合には、音声合成部４０は、当該情報に対応する人型ロボットへ発話内容を表す音声信号と発話を提示する相手を表す情報を出力する。

　［提示部５０］
　提示部５０は、発話決定部３０が決定した発話内容をユーザへ提示するためのインターフェースである。例えば、提示部５０は、人間の形を模して製作された人型ロボットである。この人型ロボットは、音声合成部４０から入力された発話内容を表す音声信号に対応する音声を、例えば頭部に搭載したスピーカ５１から発音する、すなわち、発話を提示する。スピーカ５１は、音声合成部４０から入力された発話内容を表す音声信号に対応する音声を発音可能とすればよい。つまり、図１は一例であって、スピーカ５１－１，５１－２の何れか一方を備えないでもよい。また、ユーザ１０１の近傍などの人型ロボット５０－１，５０－２とは異なる場所に１個以上のスピーカ、または、複数のスピーカを備えたスピーカアレイを設置し、スピーカ５１－１，５１－２の双方を備えない構成としてもよい。また、人型ロボットは、顔の表情や、身体の動作等の非言語的な行動により発話決定部３０が決定した発話内容をユーザへ提示してもよい。例えば、直前の発話に対して同意する旨を提示する際には、首を縦に振り、同意しない旨を提示する際には、首を横に振るなどの非言語的な行動を提示することが挙げられる。また、人型ロボットは、発話を提示する際に、顔や体全体をユーザまたは他の人型ロボットの方へ向けることで、顔や身体を向いた方にいるユーザまたは他の人型ロボットに対して発話を提示していることを表現することができる。提示部５０を人型ロボットとした場合には、例えば、対話に参加する人格（エージェント）ごとに一台の人型ロボットを用意する。以下では、二人の人格が対話に参加する例として、二台の人型ロボット５０－１および５０－２が存在するものとする。なお、対話システム１００の提示部５０が複数の人型ロボットで構成される場合に、発話決定部３０が当該発話をいずれの人型ロボットから提示するかを決定していた場合には、音声合成部４０が出力した発話内容を表す音声信号を受け取った人型ロボット５０－１または５０－２が当該発話を提示する。また、発話決定部３０が決定した発話を提示する相手を表す情報も入力された場合には、人型ロボット５０－１または５０－２は、発話を提示する相手を表す情報に対応する人型ロボットまたはユーザの発話に顔や視線を向けた状態で、発話を提示する。

　以下、図２を参照して、実施形態の対話方法の処理手続きを説明する。

　ステップＳ１において、対話システム１００は、論理飛躍発話の内容を表す音声を、人型ロボット５０－１が備えるスピーカ５１－１から出力する、すなわち、論理飛躍発話を提示する。論理飛躍発話とは、論理構造の一部が欠落している発話である。論理構造とは、例えば、前提、解釈、結論からなる文構造である。論理飛躍発話の内容を表す音声は、発話決定部３０が決定した論理飛躍発話の内容を表すテキストを音声合成部４０が音声信号に変換したものである。論理飛躍発話の内容を表すテキストは、発話決定部３０が通常の手順で決定した発話内容を表すテキストから、その論理構造を解析して一部の情報をマスク（例えば、省略、代名詞化など）することで生成することができる。

　発話内容を表すテキストは、発話決定部３０が、例えば、あらかじめ定められ発話決定部３０内の図示しない記憶部に記憶された定型文から任意に選択してもよいし、直前までの発話内容に応じて決定してもよい。直前までの発話内容に応じて発話内容を決定する技術は、従来の対話システムにおいて用いられているものを利用すればよく、例えば、非特許文献２に記載されたシナリオ対話システムや非特許文献３または４に記載された雑談対話システムなどを用いることができる。発話決定部３０がシナリオ対話システムにおいて用いられている技術を用いる場合は、例えば、発話決定部３０は、直前の５発話程度を含む対話について、各発話に含まれる単語や各発話を構成する焦点語と発話決定部３０内の図示しない記憶部に記憶された各シナリオに含まれる単語や焦点語との単語間距離が所定の距離より近いシナリオを選択し、選択したシナリオに含まれるテキストを選択することにより発話内容を表すテキストを決定する。発話決定部３０が雑談対話システムにおいて用いられている技術を用いる場合は、発話決定部３０は、例えば、ユーザの発話に含まれる単語をトリガーとして、あらかじめ記述して発話決定部３０内の図示しない記憶部に記憶しておいたルールに従って発話内容を表すテキストを決定してもよいし、ユーザの発話に含まれる単語と共起関係や係り受け関係にある単語に基づいて自動的にルールを生成し、そのルールに従って発話内容を表すテキストを決定してもよい。

　発話内容を表すテキストは、前提、解釈、結論をすべて含む一文から構成されていてもよいし、複数の文を組み合わせることにより前提、解釈、結論を含む一つの文章として構成されていてもよい。例えば、人間同士の対話であっても、直前までの対話で扱っていた話題から他の話題へ遷移しようとする場合、直前の話題を想起させるキーワードを省略して発話されることがある。このとき、話題間の関連が薄いと、何の話題についての発話であるのか理解できない。このような発話は、直前までの話題と提示した発話の話題とに共通点があるという前提が欠落しているものと捉えることができる。

　論理飛躍発話が、直前までの対話で扱っていた話題から他の話題へ遷移させる内容の発話である場合、論理飛躍発話の先頭に、話題が遷移したことを表す話題遷移語を付加してもよい。話題遷移語としては、例えば、「そういえば」「今思いついたんだけど」などが挙げられる。

　ステップＳ２において、行動認識部２０は、マイクロホン１１が取得した音響信号と、カメラ１２が取得した映像信号の少なくとも何れかに基づいて、ユーザの行動内容を表す情報を得て出力する、すなわち、行動認識部２０はユーザの行動を認識してユーザの行動内容を表す情報を得て出力する。行動認識部２０内の音声認識部２１は、マイクロホン１１が取得した音響信号のうちの、提示部５０が論理飛躍発話を提示した後の所定時間区間の音響信号を音声認識し、認識結果として得たテキストを、ユーザの発話内容を表すテキストとして行動認識部２０の出力とする。行動認識部２０内の動作認識部２２は、カメラ１２が取得した映像信号のうちの、提示部５０が論理飛躍発話を提示した後の所定時間区間の映像信号を動作認識し、認識結果として得た各時刻におけるユーザの動作内容を表す時系列のデータを、ユーザの動作内容を表す情報として行動認識部２０の出力とする。所定時間区間は、論理飛躍発話に対するユーザの言語行動や非言語行動を取得できるのに十分な時間（例えば３秒程度から１０秒程度）を予め設定しておけばよい。なお、所定時間区間を０秒とし、論理飛躍発話に対するユーザの行動を取得しないようにしてもよい。行動認識部２０が出力するユーザの行動内容を表す情報は、発話決定部３０に入力される。

　ステップＳ３において、発話決定部３０は、入力されたユーザの行動内容を表す情報に基づいて、すなわち、入力されたユーザの行動内容を表す情報に含まれるユーザの発話内容を表すテキストとユーザの動作内容を表す時系列のデータの少なくとも何れかに基づいて、論理飛躍発話に対して所定時間区間にユーザが確認行動を表出したか否かを判定する。

　確認行動が言語的な行動である場合には、確認行動のことを確認発話と呼ぶ。確認発話は、例えば、論理飛躍発話において欠落している情報を確認する内容の発話（質問文など）、論理飛躍発話において欠落している情報の補足を求める内容の発話（質問文など）、論理飛躍発話において欠落している情報の確認をしたいと感じていることが推察される内容の発話、論理飛躍発話において欠落している情報が補足されることが望ましいと感じていることが推察される内容の発話、である。確認行動が非言語的な行動である場合には、確認行動のことを確認動作と呼ぶ。確認動作は、例えば、目を見開いて、口をあけて、何か言いたげな表情をする動作、である。発話決定部３０内の図示しない記憶部には、例えば先に例示したような、１つ以上の確認発話と１つ以上の確認動作との少なくとも何れかを予め記憶しておく。

　発話決定部３０が、論理飛躍発話に対して所定時間区間にユーザが確認行動をしたか否かを、ユーザの言語的な行動に基づいて判定する場合には、例えば、以下のようにして判定する。発話決定部３０は、ユーザの行動内容を表す情報からユーザの発話内容を表すテキストを取得し、取得したテキストが発話決定部３０内の図示しない記憶部に記憶された確認発話に対応する場合には、ユーザが確認行動をしたと判定し、取得したテキストが発話決定部３０内の図示しない記憶部に記憶された確認発話に対応しない場合には、ユーザが確認行動をしなかったと判定する。

　発話決定部３０が、論理飛躍発話に対して所定時間区間にユーザが確認行動を表出したか否かを、ユーザの非言語的な行動に基づいて判定する場合には、例えば、以下のようにして判定する。発話決定部３０は、ユーザの行動内容を表す情報からユーザの動作内容を表す時系列のデータを取得し、取得した動作内容を表す時系列のデータが発話決定部３０内の図示しない記憶部に記憶された確認動作に対応する場合には、ユーザが確認行動をしたと判定し、取得した動作内容を表す時系列のデータが発話決定部３０内の図示しない記憶部に記憶された確認動作に対応しない場合には、ユーザが確認行動をしなかったと判定する。

　行動認識部２０が音声認識部２１と動作認識部２２の両方を備える場合には、発話決定部３０は、上記のユーザの言語的な行動に基づく判定と上記のユーザの非言語的な行動に基づく判定との両方の判定結果に基づいて、論理飛躍発話に対して所定時間区間にユーザが確認行動をしたか否かの判定結果を得てもよい。例えば、発話決定部３０は、上記のユーザの言語的な行動に基づく判定と上記のユーザの非言語的な行動に基づく判定の少なくとも何れかの判定でユーザが確認行動をしたと判定した場合に、論理飛躍発話に対して所定時間区間にユーザが確認行動をしたと判定し、それ以外の場合に、論理飛躍発話に対して所定時間区間にユーザが確認行動をしなかったと判定する。

　なお、所定時間区間を０秒とし、行動認識部２０が論理飛躍発話に対するユーザの行動を取得しないようにした場合には、ユーザの行動内容を表す情報にはユーザの発話内容やユーザの動作内容は含まれないため、発話決定部３０は、以降は、ユーザが確認行動をしなかったと判定した場合と同じ動作をする。

　発話決定部３０は、ステップＳ３においてユーザが確認行動をしたと判定した場合（ＹＥＳ）にはステップＳ４とステップＳ５とを行わずにステップＳ６を行い、ステップＳ３においてユーザが確認行動をしたと判定した場合（ＮＯ）にはステップＳ４とステップＳ５とを行ってからステップＳ６を行う。

　ステップＳ４において、発話決定部３０は、論理飛躍発話の内容を表すテキストに基づいて確認発話の内容を表すテキストを決定し、決定したテキストを出力する。例えば、発話決定部３０は、発話決定部３０内の図示しない記憶部に論理飛躍発話の内容を表すテキストと組にして記憶された確認発話の内容を表すテキストを取得することで、確認発話の内容を表すテキストを決定する。発話決定部３０は、確認発話を提示する人型ロボットを決定してもよい。この場合は、発話決定部３０は、確認発話を提示する人型ロボットも決定し、補足発話を提示する人型ロボットを指定する情報も出力する。例えば、発話決定部３０は、確認発話を提示する人型ロボットとして、論理飛躍発話を提示した人型ロボット５０－１とは異なる他の人型ロボット５０－２を決定し、補足発話を提示する人型ロボットが人型ロボット５０－２であることを指定する情報も出力する。

　ステップＳ５において、音声合成部４０は、発話決定部３０が決定した確認発話の内容を表すテキストを確認発話の内容を表す音声信号に変換して出力し、提示部５０は、音声合成部４０が出力した確認発話の内容を表す音声信号に対応する確認発話の内容を表す音声を出力する。例えば、提示部５０は、音声合成部４０が出力した音声信号に対応する確認発話の内容を表す音声を、論理飛躍発話を提示した人型ロボット５０－１とは異なる人型ロボット５０－２が備えるスピーカ５１－２から出力する。発話決定部３０が人型ロボットを指定する情報を出力した場合には、音声合成部４０が出力した音声信号と発話決定部３０が出力した人型ロボットを指定する情報とに基づき、確認発話の内容を表す音声を、発話決定部３０が指定した人型ロボット（５０－１または５０－２）が備えるスピーカ（５１－１または５１－２）から出力する。

　すなわち、ステップＳ４とＳ５によって、所定時間区間においてユーザ１０１が確認発話を発話しなかった場合、対話システム１００は、確認発話の内容を表す音声を、論理飛躍発話を提示した人型ロボット５０－１とは異なる他の人型ロボット５０－２が備えるスピーカ５１－２から出力する。ただし、対話システム１００がステップＳ４とＳ５を行うのは必須ではなく、所定時間区間においてユーザ１０１が確認発話を発話しなかった場合でも対話システム１００が確認発話を行わないようにしてもよい。

　ステップＳ６において、発話決定部３０は、論理飛躍発話の内容を表すテキストおよび確認発話の内容を表すテキストに基づいて、補足発話の内容を表すテキストを決定し、決定したテキストを出力する。補足発話とは、論理飛躍発話において欠落している情報を補足する内容の発話である。補足発話は１つの発話であっても複数の発話であってもよい。発話決定部３０は、補足発話を提示する人型ロボットを決定してもよい。この場合は、発話決定部３０は、論理飛躍発話を提示した人型ロボットが何れの人型ロボットであるか、確認発話を提示した人型ロボットが何れの人型ロボットであるか、などに基づいて、補足発話を提示する人型ロボットも決定し、補足発話を提示する人型ロボットを指定する情報も出力する。補足発話が複数の発話である場合には、発話決定部３０は、それぞれの発話について、提示する人型ロボットを決定し、提示する人型ロボットを指定する情報を出力する。

　ステップＳ７において、音声合成部４０は、発話決定部３０が決定した確認発話の内容を表すテキストを音声信号に変換して出力し、提示部５０は、音声合成部４０が出力した音声信号に対応する補足発話の内容を表す音声を出力する。例えば、提示部５０は、音声合成部４０が出力した音声信号に対応する補足発話の内容を表す音声を、論理飛躍発話を提示した人型ロボット５０－１が備えるスピーカ５１－１から出力する。発話決定部３０が人型ロボットを指定する情報も出力した場合には、音声合成部４０が出力した音声信号と発話決定部３０が出力した人型ロボットを指定する情報とに基づき、補足発話の内容を表す音声を、発話決定部３０が指定した人型ロボット（５０－１または５０－２）が備えるスピーカ（５１－１または５１－２）から出力する。

　補足発話には、論理飛躍発話において欠落している情報に関して、ユーザ１０１が同意しやすい内容の質問を含めてもよい。この質問がユーザに向けて提示されれば、ユーザは補足発話の内容に対して同意する旨を発話する可能性が高く、そうなることで、補足発話による説明に対してユーザが持つ納得感を増す効果がある。また、肯定的な内容を発話することで対話感も向上する。

　［具体例］
　以下、実施形態の対話システムによる対話内容の具体例を示す。以降の具体例の記載では、Ｒはロボットを表し、Ｈはユーザを表す。Ｒの後の数字は人型ロボットの識別子である。t(i)（i=0, 1, 2, …）は対話中の発話を表し、iは発話の順番を表す数字である。右矢印（→）は発話相手を表す。例えば、「Ｒ１→Ｈ」であれば、人型ロボットＲ１がユーザＨに向けて発話することを表す。

　具体例１－１～１－４－３では、以下の論理構造の発話内容を想定している。
　　　前提：気温が２５度である
　　　解釈：エアコンが効いていない
　　　結論：エアコンを買い替える

　（具体例１－１）
　具体例１－１は、論理構造のうち前提が欠落した論理飛躍発話を提示し、ユーザが確認行動を表出しなかったと判定して、論理飛躍発話を提示した人型ロボットとは異なる人型ロボットから確認発話を提示し、論理飛躍発話を提示した人型ロボットから補足発話を提示する例である。

　　　t(1)　Ｒ１：エアコン、買い替えてください。エアコン、効いてないですよね？
　　　t(2)　Ｈ：そうかな
　　　t(3)　Ｒ２：ねぇ、なんでそう思うの？
　　　t(4)　Ｒ１：だって、気温、２５度ですよ
　　　t(5)　Ｒ２：そういうことか。でも、我慢した方がエコだよ。
　この例では、まず、対話システム１００は、人型ロボットＲ１から前提が欠落した論理飛躍発話t(1)を提示する。この論理飛躍発話t(1)は、いきなり結論「エアコン、買い替えてください。」を述べ、その後に解釈「エアコン、効いてないですよね？」を述べており、前提が欠落している。次に、対話システム１００は、論理飛躍発話t(1)に対するユーザＨの発話であるユーザ発話t(2)を取得する。対話システム１００は、ユーザ発話t(2)が確認発話ではないと判定し、論理飛躍発話t(1)を提示した人型ロボットＲ１とは異なる人型ロボットＲ２から論理飛躍発話t(1)において欠落している情報の補足を求める内容の確認発話t(3)を提示する。そして、対話システム１００は、人型ロボットＲ１から論理飛躍発話t(1)において欠落している前提を補足する内容の補足発話t(4)を提示する。

　（具体例１－２－１）
　具体例１－２－１は、論理構造のうち解釈が欠落した論理飛躍発話を提示し、論理飛躍発話後にユーザが表出する行動を取得せずに、論理飛躍発話を提示した人型ロボットとは異なる人型ロボットから確認発話を提示し、論理飛躍発話を提示した人型ロボットから補足発話を提示する例である。

　　　t(1)　Ｒ１：気温、２５度ですよ。エアコン、買い替えてください。
　　　t(2)　Ｒ２：ねぇ、なんでそう思うの？
　　　t(3)　Ｒ１：エアコン、効いてないってことでしょ
　　　t(4)　Ｒ２：そういうことか。でも、我慢した方がエコだよ。
　この例では、まず、対話システム１００は、人型ロボットＲ１から解釈が欠落した論理飛躍発話t(1)を提示する。この論理飛躍発話t(1)は、前提「気温、２５度ですよ。」から結論「エアコン、買い替えてください。」へ飛躍しており、解釈が欠落している。次に、対話システム１００は、論理飛躍発話t(1)に対するユーザＨの行動を取得せずに、論理飛躍発話t(1)を提示した人型ロボットＲ１とは異なる人型ロボットＲ２から論理飛躍発話t(1)において欠落している情報の補足を求める内容の確認発話t(2)を提示する。そして、対話システム１００は、人型ロボットＲ１から論理飛躍発話t(1)において欠落している解釈を補足する内容の補足発話t(3)を提示する。

　（具体例１－２－２）
　具体例１－２－２は、論理構造のうち解釈が欠落した論理飛躍発話を提示し、ユーザが確認行動を表出したと判定して、論理飛躍発話を提示した人型ロボットから補足発話を提示する例である。

　　　t(1)　Ｒ１：気温、２５度ですよ。エアコン、買い替えてください。
　　　t(2)　Ｈ：え、急にそんなこと言われても
　　　t(3)　Ｒ１：エアコン、効いてないってことでしょ
　　　t(4)　Ｈ：そういうことか
　　　t(5)　Ｒ２：でも、我慢した方がエコだよ。
　この例では、まず、対話システム１００は、具体例１－２－１と同様に、人型ロボットＲ１から解釈が欠落した論理飛躍発話t(1)を提示する。次に、対話システム１００は、論理飛躍発話t(1)に対するユーザＨの発話であるユーザ発話t(2)を取得する。対話システム１００は、ユーザ発話t(2)が、論理飛躍発話t(1)において欠落している情報の確認をしたいと感じていることが推察される内容の確認発話t(2)であると判定し、確認発話を提示しない。次に、対話システム１００は、人型ロボットＲ１から論理飛躍発話t(1)において欠落している解釈を補足する内容の補足発話t(3)を提示する。さらに、対話システム１００は、ユーザＨが補足発話t(3)に納得した旨を表す発話t(4)を行ったため、人型ロボットＲ２から本来の発話内容から納得した旨を表す部分（「そういうことか。」）を省略した発話t(5)を提示する。

　（具体例１－３）
　具体例１－３は、論理構造のうち結論が欠落した論理飛躍発話を複数の発話に分割して提示し、ユーザが確認行動を表出しなかったと判定して、論理飛躍発話を提示した人型ロボットとは異なる人型ロボットから確認発話を提示し、論理飛躍発話を提示した人型ロボットから補足発話を提示する例である。

　　　t(1)　Ｒ１：気温、２５度ですよ。
　　　t(2)　Ｈ：うん
　　　t(3)　Ｒ１：エアコン、効いてないってことですよね
　　　t(4)　Ｈ：そうかもね
　　　t(5)　Ｒ２：ねぇ、何か言いたいことあるの？
　　　t(6)　Ｒ１：うん、エアコン、買い替えて下さい
　　　t(7)　Ｒ２：そういうことか。でも、我慢した方がエコだよ。
　この例では、結論が欠落した論理飛躍発話を、前提のみを提示する論理飛躍発話t(1)と解釈のみを提示する論理飛躍発話t(3)とに分割して提示する。まず、対話システム１００は、人型ロボットＲ１から前提のみを提示する論理飛躍発話t(1)を提示する。次に、対話システム１００は、論理飛躍発話t(1)に対するユーザＨの発話であるユーザ発話t(2)を取得する。対話システム１００は、ユーザ発話t(2)が確認発話ではないと判定し、解釈のみを提示する論理飛躍発話t(3)を提示する。次に、対話システム１００は、論理飛躍発話t(3)に対するユーザＨの発話であるユーザ発話t(4)を取得する。対話システム１００は、ユーザ発話t(4)が確認発話ではないと判定し、論理飛躍発話t(1), t(3)を提示した人型ロボットＲ１とは異なる人型ロボットＲ２から論理飛躍発話t(1), t(3)において欠落している情報の補足を求める内容の確認発話t(5)を提示する。そして、対話システム１００は、人型ロボットＲ１から論理飛躍発話t(1), t(3)において欠落している結論を補足する内容の補足発話t(6)を提示する。

　（具体例１－４－１）
　具体例１－４－１は、論理構造のうち前提が欠落した論理飛躍発話を提示する際に、解釈と結論の一部を省略して提示し、論理飛躍発話において省略した部分を確認する内容の確認行動をユーザが表出したと判定して、論理飛躍発話において省略した部分を補足する内容の補足発話を提示する例である。さらに、論理飛躍発話において欠落している情報を確認する内容の確認行動をユーザが表出しなかったと判定して、論理飛躍発話を提示した人型ロボットとは異なる人型ロボットから論理飛躍発話において欠落している情報を確認する内容の確認発話を提示し、論理飛躍発話を提示した人型ロボットから論理飛躍発話において欠落している情報を補足する内容の補足発話を提示する例である。

　　　t(1)　Ｒ１：買い替えて下さい。効いてないですよね？
　　　t(2)　Ｈ：何の話？
　　　t(3)　Ｒ１：エアコンですよ
　　　t(4)　Ｈ：ああ、エアコンね
　　　t(5)　Ｒ２：ねぇ、なんでそう思うの？
　　　t(6)　Ｒ１：だって、気温、２５度ですよ
　　　t(7)　Ｒ２：そういうことか。でも、我慢した方がエコだよ。
　この例では、まず、対話システム１００は、人型ロボットＲ１から前提が欠落しており、解釈と結論の一部（「エアコン」）を省略した論理飛躍発話t(1)を提示する。次に、対話システム１００は、論理飛躍発話t(1)に対するユーザＨの発話であるユーザ発話t(2)を取得する。対話システム１００は、ユーザ発話t(2)が、論理飛躍発話t(1)において省略した部分を確認する内容の確認発話であると判定し、論理飛躍発話t(1)を提示した人型ロボットＲ１から論理飛躍発話t(1)において省略した部分を補足する内容の補足発話t(3)を提示する。次に、対話システム１００は、補足発話t(3)に対するユーザＨの発話であるユーザ発話t(4)を取得する。対話システム１００は、ユーザ発話t(2), t(4)がいずれも、論理飛躍発話t(1)において欠落している前提を確認する内容の確認発話ではないと判定し、論理飛躍発話t(1)を提示した人型ロボットＲ１とは異なる人型ロボットＲ２から論理飛躍発話t(1)において欠落している前提を確認する内容の確認発話t(5)を提示する。そして、対話システム１００は、人型ロボットＲ１から論理飛躍発話t(1)において欠落している前提を補足する内容の補足発話t(6)を提示する。

　（具体例１－４－２）
　具体例１－４－２は、論理構造のうち解釈が欠落した論理飛躍発話を提示する際に、結論の一部を代名詞化して提示し、論理飛躍発話において代名詞化した部分を確認する内容の確認行動をユーザが表出したと判定して、論理飛躍発話を提示した人型ロボットとは異なる人型ロボットから論理飛躍発話において欠落している情報を確認する内容の確認発話を提示し、論理飛躍発話を提示した人型ロボットから論理飛躍発話において欠落している情報を補足する内容の補足発話を提示する例である。

　　　t(1)　Ｒ１：気温、２５度ですよ。エアコン、アレしてください。
　　　t(2)　Ｈ：え、買い替えてってこと？
　　　t(3)　Ｒ２：ねぇ、なんでそう思うの？
　　　t(4)　Ｒ１：エアコン、効いてないってことでしょ
　　　t(5)　Ｒ２：そういうことか。でも、我慢した方がエコだよ。
　この例では、まず、対話システム１００は、人型ロボットＲ１から解釈が欠落しており、結論の一部（「買い替え」）を代名詞化（「アレ」）した論理飛躍発話t(1)を提示する。次に、対話システム１００は、論理飛躍発話t(1)に対するユーザＨの発話であるユーザ発話t(2)を取得する。対話システム１００は、ユーザ発話t(2)が、論理飛躍発話t(1)において代名詞化した部分を確認する内容の確認発話であるが、論理飛躍発話t(1)において欠落している解釈を確認する内容の確認発話ではないと判定し、論理飛躍発話t(1)を提示した人型ロボットＲ１とは異なる人型ロボットＲ２から論理飛躍発話t(1)において欠落している解釈を確認する内容の確認発話t(3)を提示する。そして、対話システム１００は、人型ロボットＲ１から論理飛躍発話t(1)において欠落している解釈を補足する内容の補足発話t(4)を提示する。代名詞化した部分（「買い替え」）についてはユーザ発話t(2)で説明されているため、補足発話t(4)では、論理飛躍発話t(1)で欠落している解釈のみを補足する。

　（具体例１－４－３）
　具体例１－４－３は、論理構造のうち結論が欠落した論理飛躍発話を複数の発話に分割して提示し、ユーザが確認行動を表出しなかったと判定して、論理飛躍発話を提示した人型ロボットとは異なる人型ロボットから確認発話を提示し、論理飛躍発話を提示した人型ロボットから論理飛躍発話において欠落している結論を補足する内容の補足発話を提示する際に、結論の一部を代名詞化して提示し、補足発話において代名詞化した部分を確認する確認行動をユーザが表出したと判定して、論理飛躍発話を提示した人型ロボットから補足発話において代名詞化した部分を補足する内容の補足発話を提示する例である。

　　　t(1)　Ｒ１：気温、２５度ですよ
　　　t(2)　Ｈ：うん
　　　t(3)　Ｒ１：エアコン、効いてないってことですよね
　　　t(4)　Ｈ：そうかもね
　　　t(5)　Ｒ２：ねぇ、何か言いたいことあるの？
　　　t(6)　Ｒ１：うん、エアコン、アレしてください
　　　t(7)　Ｈ：アレ？
　　　t(8)　Ｒ１：買い替えて下さい
　　　t(9)　Ｒ２：そういうことか。でも、我慢した方がエコだよ。
　この例では、結論が欠落した論理飛躍発話を、前提のみを提示する論理飛躍発話t(1)と解釈のみを提示する論理飛躍発話t(3)とに分割して提示する。まず、対話システム１００は、人型ロボットＲ１から前提のみを提示する論理飛躍発話t(1)を提示する。次に、対話システム１００は、論理飛躍発話t(1)に対するユーザＨの発話であるユーザ発話t(2)を取得する。対話システム１００は、ユーザ発話t(2)が確認発話ではないと判定し、解釈のみを提示する論理飛躍発話t(3)を提示する。次に、対話システム１００は、論理飛躍発話t(3)に対するユーザＨの発話であるユーザ発話t(4)を取得する。対話システム１００は、ユーザ発話t(4)が確認発話ではないと判定し、論理飛躍発話t(1), t(3)を提示した人型ロボットＲ１とは異なる人型ロボットＲ２から論理飛躍発話t(1), t(3)において欠落している情報の補足を求める内容の確認発話t(5)を提示する。そして、対話システム１００は、人型ロボットＲ１から論理飛躍発話t(1), t(3)において欠落している結論を補足する内容の補足発話t(6)を提示するが、このとき、結論の一部を代名詞化（「アレ」）して提示する。次に、対話システム１００は、補足発話t(6)に対するユーザＨの発話であるユーザ発話t(7)を取得する。対話システム１００は、ユーザ発話t(7)が、補足発話t(6)において代名詞化した部分を確認する内容の確認発話であると判定し、補足発話t(6)を提示した人型ロボットＲ１から補足発話t(6)において代名詞化した部分を補足する内容の補足発話t(8)を提示する。補足発話t(6)で提示した情報（「エアコン」）については冗長になるため、補足発話t(8)では補足発話t(6)において代名詞化した部分のみを説明する。

　（具体例２－１）
　具体例２－１は、論理構造のうち前提と解釈とが欠落した論理飛躍発話を提示し、ユーザが確認行動を表出したと判定して、前提と解釈とを補足する内容の補足発話を複数の発話に分割して複数の人型ロボットが分担して提示する例である。さらに、人型ロボットが複数の補足発話を分担して提示する際に、ユーザに対して否定し難い内容の質問を含め、ユーザが同意する旨の発話を行うように誘導することを行う例である。

　　　t(1)　Ｒ１：人間は必ずしも生身の体を必要としていないよね
　　　t(2)　Ｈ：どういうこと？
　　　t(3)　Ｒ１：だって、最近は二次元で生きてる人も多いじゃん
　　　t(4)　Ｒ２：まあ、そうっちゃそうだけど
　　　t(5)　Ｒ１：ＶＲも最近すごいしね
　　　t(6)　Ｒ２：あれはすごいね
　　　t(7)　Ｒ１→Ｈ：それに、仕事だって、人間はみんな何か道具を使って仕事してるじゃない？あなたもそうだよね？
　　　t(8)　Ｈ：まあ、そうだね
　　　t(9)　Ｒ１：生身の体がなくても快楽が得られるし、仕事をできるし、あんまり必要そうには見えないなあと思ったんだ
　　　t(10)　Ｒ２：まあ、そういわれるとそうかなあ
　この例では、まず、対話システム１００は、人型ロボットＲ１から前提と解釈とが欠落しており、結論だけを述べる論理飛躍発話t(1)を提示する。次に、対話システム１００は、論理飛躍発話t(1)に対するユーザＨの発話であるユーザ発話t(2)を取得する。対話システム１００は、ユーザ発話t(2)が、論理飛躍発話t(1)において欠落している情報を確認する内容の確認発話であると判定し、論理飛躍発話t(1)を提示した人型ロボットＲ１から前提と解釈とを補足する内容の補足発話を複数の発話t(3), t(5), t(7), t(9)に分割して提示する。このとき、自然な流れで補足発話を提示するために、人型ロボットＲ１と他の人型ロボットＲ２との対話として提示する。さらに、対話システム１００は、ユーザＨに対する否定し難い内容の質問である補足発話t(7)を含めることで、ユーザＨが同意する旨の発話t(8)を行うように誘導し、納得感や対話感の向上を図っている。

　（具体例２－２）
　具体例２－２は、論理構造のうち前提と解釈とが欠落した論理飛躍発話を提示し、ユーザが確認行動を表出しなかったと判定して、論理飛躍発話を提示した人型ロボットとは異なる人型ロボットが確認発話を提示し、論理飛躍発話を提示した人型ロボットが補足発話を提示する例である。

　　　t(1)　Ｒ１：人間は必ずしも生身の体を必要としていないよね
　　　t(2)　Ｈ：（沈黙）
　　　t(3)　Ｒ２：どういうこと？
　　　t(4)　Ｒ１：だって、最近は二次元で生きてる人も多いじゃん
　　　t(5)　Ｒ２：まあ、そうっちゃそうだけど
　この例は、具体例２－１において、ユーザＨが確認行動を表出しなかった場合の例である。まず、対話システム１００は、人型ロボットＲ１から前提と解釈とが欠落しており、結論だけを述べる論理飛躍発話t(1)を提示する。次に、対話システム１００は、論理飛躍発話t(1)に対するユーザＨの発話であるユーザ発話t(2)を取得する。対話システム１００は、所定時間区間において、ユーザＨが行動を表出しなかったため、ユーザＨが確認行動を表出しなかったと判定し、論理飛躍発話t(1)を発話した人型ロボットＲ１とは異なる人型ロボットＲ２から論理飛躍発話t(1)において欠落している情報を確認する内容の確認発話t(3)を提示する。そして、対話システム１００は、人型ロボットＲ１から論理飛躍発話t(1)において欠落している前提を補足する内容の補足発話t(4)を提示する。

　（具体例３）
　具体例３は、論理構造のうち前提が欠落した論理飛躍発話を提示する際に、話題が遷移することを表す話題遷移語を付加して提示する例である。また、補足発話を複数の発話に分割して複数の人型ロボットが分担して提示し、その際に、ユーザに対して否定し難い内容の質問を含め、ユーザが同意する旨の発話を行うように誘導することを行う例である。

　　　t(1)　Ｒ１：今思い付いたんだけど、みんなロボットなら人間はもっとゆったり生きられるかもね
　　　t(2)　Ｈ：ん？
　　　t(3)　Ｒ２：何の話してるのさ？
　　　t(4)　Ｒ１：ああ、ごめん。仕事の話。年末年始もお店の人たちはなかなか休めてないじゃない？
　　　t(5)　Ｒ２：うん
　　　t(6)　Ｒ１：そういうところで、多少質は落ちても、ロボットが代わりに働けば、きっと人はうれしいと思うんだ
　　　t(7)　Ｒ２→Ｈ：うーん、うれしい？
　　　t(8)　Ｈ：そりゃ、まあね
　　　t(9)　Ｒ２：ふーん、そっか、そういうもんか
　　　t(10)　Ｒ１：ま、お正月をロボットと過ごしたい人が増えてくれば、またちょっと違うかもしれないけどね
　この例では、まず、対話システム１００は、人型ロボットＲ１から話題遷移語「今思い付いたんだけど」を提示した後に、前提が欠落している論理飛躍発話t(1)を提示する。次に、対話システム１００は、論理飛躍発話t(1)に対するユーザＨの発話であるユーザ発話t(2)を取得する。対話システム１００は、ユーザ発話t(2)が、論理飛躍発話t(1)において欠落している情報を確認する内容の確認発話であると判定し、論理飛躍発話t(1)を提示した人型ロボットＲ１とは異なる人型ロボットＲ２から論理飛躍発話t(1)において欠落している情報を確認する内容の確認発話t(3)を提示する。次に、対話システム１００は、前提と解釈とを補足する内容の補足発話を複数の発話t(4), t(6), t(10)に分割して提示する。このとき、自然な流れで補足発話を提示するために、人型ロボットＲ１と他の人型ロボットＲ２との対話として提示する。さらに、対話システム１００は、ユーザＨに対して否定し難い内容の質問である補足発話t(7)を含めることで、ユーザＨが同意する旨の発話t(8)を行うように誘導する。

　（具体例４）
　具体例４は、話題が遷移する際に、新しい話題の前提である直前の話題との共通点を省略した論理飛躍発話を提示し、ユーザが論理飛躍発話において欠落している情報を確認する確認行動を表出したと判定して、論理飛躍発話において欠落している情報を補足する内容の補足発話を提示する例である。

　　　t(1)　Ｒ１：沖縄でね
　　　t(2)　Ｈ：ん？
　　　t(3)　Ｒ１：訓練中の輸送機が墜落したの知ってる？
　　　t(4)　Ｈ：うわ、まじか、知らなかったなー
　　　t(5)　Ｒ２：聞いた聞いた、二人怪我したんだってね
　　　t(6)　Ｒ１：こわいねえ
　　　t(7)　Ｒ２：そういえば、「まず二島返還」が多数だったってよ
　　　t(8)　Ｈ：ん？北方領土？
　　　t(9)　Ｒ２：そうそう、元島民アンケート
　　　t(10)　Ｒ１：どうかなあ
　この例では、まず、対話システム１００は、ある時事問題に関する話題（「沖縄で輸送機が墜落」）を第一の話題とした対話t(1)～t(6)をユーザＨとの間で実行する。次に、対話システム１００は、話題遷移語「そういえば」を提示し、時事問題ではあるものの第一の話題とは関連性が低い話題（「北方領土に関する元島民のアンケートで、「まず二島返還」が多数派」）である第二の話題の前提を示す単語のうちの少なくとも１つ（例えば「元島民アンケート」や「北方領土」など）を含まない話題誘導発話t(7)を提示する。次に、対話システム１００は、論理飛躍発話t(7)に対するユーザＨの発話であるユーザ発話t(8)を取得する。対話システム１００は、ユーザ発話t(8)が、論理飛躍発話t(7)において欠落している前提を確認する内容の確認発話であると判定し、論理飛躍発話t(7)を提示した人型ロボットＲ２から論理飛躍発話t(7)において欠落している前提を補足する内容の補足発話t(8)を提示する。

　［変形例］
　上述した実施形態では、エージェントとして人型ロボットを用いて音声による対話を行う例を説明したが、上述した実施形態の提示部は身体等を有する人型ロボットであっても、身体等を有さないロボットであってもよい。また、この発明の対話技術はこれらに限定されず、人型ロボットのように身体等の実体がなく、発声機構を備えないエージェントを用いて対話を行う形態とすることも可能である。そのような形態としては、例えば、コンピュータの画面上に表示されたエージェントを用いて対話を行う形態が挙げられる。より具体的には、「LINE」（登録商標）や「２ちゃんねる」（登録商標）のような、複数アカウントがテキストメッセージにより対話を行うグループチャットにおいて、ユーザのアカウントと対話装置のアカウントとが対話を行う形態に適用することも可能である。この形態では、エージェントを表示する画面を有するコンピュータは人の近傍にある必要があるが、当該コンピュータと対話装置とはインターネットなどのネットワークを介して接続されていてもよい。つまり、本対話システムは、人とロボットなどの話者同士が実際に向かい合って話す対話だけではなく、話者同士がネットワークを介してコミュニケーションを行う会話にも適用可能である。

　変形例の対話システム２００は、図３に示すように、例えば、一台の対話装置２からなる。変形例の対話装置２は、例えば、入力部１０、行動認識部２０、発話決定部３０、および提示部５０を備える。行動認識部２０は、例えば、音声認識部２１および動作認識部２２を備える。対話装置２は、例えば、マイクロホン１１、カメラ１２、スピーカ５１を備えていてもよい。

　変形例の対話装置２は、例えば、スマートフォンやタブレットのようなモバイル端末、もしくはデスクトップ型やラップトップ型のパーソナルコンピュータなどの情報処理装置である。以下、対話装置２がスマートフォンであるものとして説明する。提示部５０はスマートフォンが備える液晶ディスプレイである。この液晶ディスプレイにはチャットアプリケーションのウィンドウが表示され、ウィンドウ内にはグループチャットの対話内容が時系列に表示される。グループチャットとは、チャットにおいて複数のアカウントが互いにテキストメッセージを投稿し合い対話を展開する機能である。このグループチャットには、対話装置２が制御する仮想的な人格に対応する複数の仮想アカウントと、ユーザのアカウントとが参加しているものとする。すなわち、本変形例は、エージェントが、対話装置であるスマートフォンの液晶ディスプレイに表示された仮想アカウントである場合の一例である。ユーザはソフトウェアキーボードを用いてグループチャットのウィンドウ内に設けられた入力エリアである入力部１０へ発話内容を入力し、自らのアカウントを通じてグループチャットへ投稿することができる。発話決定部３０はユーザのアカウントからの投稿に基づいて対話装置２からの発話内容を決定し、各仮想アカウントを通じてグループチャットへ投稿する。なお、スマートフォンに搭載されたマイクロホン１１と音声認識機能を用い、ユーザが発声により入力部１０へ発話内容を入力する構成としてもよい。また、スマートフォンに搭載されたスピーカ５１と音声合成機能を用い、各対話システムから得た発話内容を、各仮想アカウントに対応する音声でスピーカ５１から出力する構成としてもよい。

　以上、この発明の実施の形態について説明したが、具体的な構成は、これらの実施の形態に限られるものではなく、この発明の趣旨を逸脱しない範囲で適宜設計の変更等があっても、この発明に含まれることはいうまでもない。実施の形態において説明した各種の処理は、提示部が提示する発話順を除いて、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
［プログラム、記録媒体］
　上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。

　この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。

　また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。

　このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP（Application Service Provider）型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの（コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等）を含むものとする。

　また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims

　ユーザと対話を行う対話システムが実行する対話方法であって、
　提示部が、論理構造の一部が欠落している発話である論理飛躍発話を提示する発話提示ステップと、
　上記提示部が、上記論理飛躍発話において欠落している情報を確認する行動である確認行動が表出された後に、上記欠落している情報を説明する発話である補足発話を提示する補足提示ステップと、
　を含む対話方法。
　請求項１に記載の対話方法であって、
　上記論理飛躍発話は、前提、解釈、および結論からなる論理構造のうち少なくともいずれか一つに関する情報が欠落している発話である、
　対話方法。
　請求項１または２に記載の対話方法であって、
　入力部が、上記論理飛躍発話が提示された後の上記ユーザの行動を受け付ける確認受付ステップと、
　上記提示部が、上記論理飛躍発話が提示された後の上記ユーザの行動が確認行動ではないとき、上記確認行動として、上記論理飛躍発話において欠落している情報を確認する発話を提示する確認提示ステップ
　をさらに含む対話方法。
　請求項１から３のいずれかに記載の対話方法であって、
　上記論理飛躍発話は、上記論理飛躍発話以前に行われた対話の話題との関連性が低い話題である第二話題の発話であって、当該第二話題を表す単語の少なくとも１つが含まれない発話である、
　対話方法。
　請求項１から４のいずれかに記載の対話方法であって、
　上記論理飛躍発話は、上記論理飛躍発話以前に行われた対話の話題との関連性が低い話題の発話であって、話題が遷移したことを表す話題遷移語が先頭に付加された発話である、
　対話方法。
　請求項１から５のいずれかに記載の対話方法であって、
　上記補足発話は、上記欠落している情報に関して、上記ユーザが同意しやすい内容の質問を含む発話である、
　対話方法。
　ユーザと対話を行う対話システムであって、
　論理構造の一部が欠落している発話である論理飛躍発話と、上記欠落している情報を説明する発話である補足発話とを決定する発話決定部と、
　上記論理飛躍発話を提示し、上記論理飛躍発話中の欠落している情報を確認する行動である確認行動が表出された後に、上記補足発話を提示する提示部と、
　を含む対話システム。
　発話を提示する提示部を少なくとも含む対話システムが提示する発話を決定する対話装置であって、
　論理構造の一部が欠落している発話である論理飛躍発話と、上記論理飛躍発話中の欠落している情報を確認する行動である確認行動が表出された後に提示される、上記欠落している情報を説明する発話である補足発話と、を決定する発話決定部
　を含む対話装置。
　請求項１から６のいずれかに記載の対話方法の各ステップをコンピュータに実行させるためのプログラム。
　請求項８に記載の対話装置としてコンピュータを機能させるためのプログラム。