WO2017057173A1

WO2017057173A1 - 対話装置及び対話方法

Info

Publication number: WO2017057173A1
Application number: PCT/JP2016/077975
Authority: WO
Inventors: 拓哉岩佐; 名田　徹; 真眞鍋
Original assignee: 株式会社デンソー
Priority date: 2015-09-28
Filing date: 2016-09-23
Publication date: 2017-04-06
Also published as: JP6376096B2; US20180204573A1; JP2017067851A; US10872603B2

Abstract

コンテンツ情報から生成した会話文を用いてユーザとの会話を行う対話装置を提供する。対話装置は、情報源（ＮＤＳ）からコンテンツ情報を取得する情報取得部（４５）を備え、会話文の生成に用いるコンテンツ情報を変更しつつ、ユーザとの会話を継続する。対話装置は、会話文の生成に用いられる特定のコンテンツ情報に対し、複数の属性情報を設定する。対話装置は、少なくとも一部の属性情報が特定のコンテンツ情報と同一となるような他のコンテンツ情報を、この特定のコンテンツ情報の次に会話文に用いられる候補として情報取得部に取得させる。

Description

対話装置及び対話方法

関連出願の相互参照

　本出願は、２０１５年９月２８日に出願された日本特許出願番号２０１５－１８９９７７号に基づくもので、その開示をここに参照により援用する。

　本開示は、ユーザとの会話を行う対話装置及び対話方法に関する。

　従来、対話装置の一種として、例えば特許文献１には、インターネット上の情報源からニュース等の情報を取得可能な応答システムが開示されている。この応答システムは、「なにか最新ニュースを教えて」といったユーザの質問に対して、インターネットから最新のニュース情報を取得し、取得したニュース情報を用いてユーザへ向けて発話される応答文を生成する。

ＪＰ２００９－３７４５８Ａ

　さて、本願発明者は、特許文献１の応答システムのような単発の質問に応答する対話装置ではなく、雑談のような比較的長い会話をユーザとの間で展開可能な対話装置について、検討を重ねてきた。その過程において、本願発明者は、会話文の生成に用いるニュース等の情報を変更しつつ、ユーザとの会話を継続することが可能な構成を想到した。

　しかし、ユーザとの継続的な会話において、会話文の生成に用いるニュース等の情報を不用意に変更してしまうと、変更前のニュース情報から生成される会話文と、変更後のニュース情報から生成される会話文とのつながりが希薄になる。その結果、ユーザは、対話装置によって生成される会話文に不自然さを感じる虞があった。

　本開示の目的の一つは、このような事情に鑑みて、ユーザとの継続的な会話のために、会話文に用いる情報を変更可能な構成であっても、ユーザに不自然さを感じさせ難い会話文を生成可能な対話装置及び対話方法を提供することにある。

　本開示の一側面の対話装置は、コンテンツ情報から生成した会話文を用いてユーザとの会話を行う対話装置であって、情報源からコンテンツ情報を取得する情報取得部と、会話文の生成に用いるコンテンツ情報を変更しつつ、ユーザとの会話を継続する会話実行部と、会話実行部にて会話文の生成に用いられる特定のコンテンツ情報に対し、複数の属性情報を設定する属性設定部と、少なくとも一部の属性情報が特定のコンテンツ情報と同一となるような他のコンテンツ情報を、この特定のコンテンツ情報の次に会話文に用いられる候補として情報取得部に取得させる取得制御部と、を備える。

　この対話装置によれば、特定のコンテンツ情報における属性情報の少なくとも一部は、このコンテンツ情報の次に会話文に用いられる他のコンテンツ情報の属性情報と同一となり得る。故に、これらのコンテンツ情報から生成される各会話文の間には、つながりが確保され得る。以上によれば、ユーザとの継続的な会話のために、会話文に用いるコンテンツ情報を変更可能な構成であっても、対話装置は、ユーザに不自然さを感じさせ難い会話文を生成することができる。

　また、本開示の一側面の対話方法は、情報源からコンテンツ情報を情報取得部によって取得し、コンテンツ情報から生成した会話文を用いてユーザとの会話を行う対話方法であって、少なくとも一つのプロセッサによって実施されるステップとして、会話文の生成に用いるコンテンツ情報を変更しつつ、ユーザとの会話を継続する会話実行ステップと、会話実行ステップにて会話文の生成に用いられる特定のコンテンツ情報に対し、複数の属性情報を設定する属性設定ステップと、少なくとも一部の属性情報が特定のコンテンツ情報と同一となるような他のコンテンツ情報を、この特定のコンテンツ情報の次に会話文に用いられる候補として情報取得部に取得させる取得制御ステップと、を含む。

　以上の対話方法でも、変更前後のコンテンツ情報から生成される各会話文の間につながりが確保され得るので、ユーザに不自然さを感じさせ難い会話文が生成可能となる。また、本開示の他の側面によれば、上記対話方法を少なくとも一つのプロセッサに実行させるためのプログラムが提供される。このプログラムによっても上述の効果を奏する。なお、プログラムは、電気通信回線を介して提供されるものであってもよいし、非一時的記憶媒体（non-transitory storage medium）に格納されて提供されるものであってもよい。

　本開示の上記および他の目的、特徴や利点は、添付図面を参照した下記の詳細な説明から、より明確になる。図面において、
図１は、一実施形態による対話装置の全体構成を示すブロック図である。図２は、運転者における覚醒度と運転のパフォーマンスとの相関を説明するYerkes-Dodson Lawを模式的に示す図である。図３は、制御回路に構築される機能ブロック及びサブブロックを説明する図である。図４は、コンテンツ情報の変更に伴う属性情報の変化の推移を説明するための図であって、コンテンツ情報に対し規定される複数のスレッドをリスト化した図である。図５は、制御回路にて実施される会話開始処理を示すフローチャートである。図６は、制御回路にて実施される会話実行処理を示すフローチャートである。図７は、制御回路にて実施される固定スレッド設定処理を示すフローチャートである。図８は、制御回路にて実施されるコンテンツ情報設定処理を示すフローチャートである。図９は、変形例による対話システムの全体構成を示すブロック図である。

　図１に示す一実施形態による対話装置１００は、車両に搭載されており、ユーザとなる車両の搭乗者と会話を行うことができる。対話装置１００は、車両の搭乗者のうちで主に運転者と能動的に対話可能である。対話装置１００は、図２に示すように、運転者において高い運転パフォーマンスを示し得る通常の覚醒状態が維持されるよう、運転者との会話を行う。加えて対話装置１００は、運転者との会話により、漫然状態に陥った運転者及び居眠り状態に陥りかけた運転者の覚醒度を、通常の覚醒状態に引き戻す役割を果たすことができる。

　対話装置１００は、図１に示すように、車載状態検出器１０、音声認識操作スイッチ２１、音声入力器２３、及び音声再生装置３０と電気的に接続されている。加えて対話装置１００は、インターネットに接続されており、インターネットを通じて車両の外部から情報を取得することができる。

　車載状態検出器１０は、車両に搭載された種々のセンサ及び電子機器である。車載状態検出器１０には、操舵角センサ１１、アクセルポジションセンサ１２、ＧＮＳＳ受信器１４、車内撮像部１６、車外撮像部１７、及び車載ＥＣＵ群１９が少なくとも含まれている。

　操舵角センサ１１は、運転者によって操縦されたステアリングホイールの操舵角を検出し、対話装置１００へ向けて検出結果を出力する。アクセルポジションセンサ１２は、運転者によって操作されたアクセルペダルの踏み込み量を検出し、対話装置１００へ向けて検出結果を出力する。

　ＧＮＳＳ（Global Navigation Satellite System）受信器１４は、複数の測位衛星から送信される測位信号を受信することにより、車両の現在位置を示す位置情報を取得する。ＧＮＳＳ受信器１４は、取得した位置情報を、対話装置１００及びナビゲーションＥＣＵ（後述する）等へ向けて出力する。

　車内撮像部１６は、例えば近赤外光源と組み合わされた近赤外カメラを有している。近赤外カメラは、車両の室内に取り付けられており、近赤外光源から照射された光によって主に運転者の顔を撮影する。車内撮像部１６は、画像解析によって、運転者の両目の視線方向、及び目（まぶた）の開き具合等を、撮影した画像から抽出する。車内撮像部１６は、抽出した運転者の視線方向及び目の開き具合等の情報を、対話装置１００へ向けて出力する。尚、車内撮像部１６は、複数の近赤外カメラ及び可視光カメラ等を有することにより、例えば運転者の顔以外の範囲を撮影し、手及び体の動きを検出することも可能である。

　車外撮像部１７は、例えば車両の周囲を向けた姿勢にて、車内及び車外に取り付けられた可視光カメラである。車外撮像部１７は、車両前方を少なくとも含む車両周囲を撮影する。車外撮像部１７は、画像解析によって、進行方向の道路形状及び車両周囲の道路の混雑具合等を、撮影した画像から抽出する。車外撮像部１７は、道路形状及び混雑具合等を示す情報を、対話装置１００へ向けて出力する。尚、車外撮像部１７は、複数の可視光カメラ、近赤外線カメラ、及び距離画像カメラ等を有していてもよい。

　車載ＥＣＵ（Electronic Control Unit）群１９は、それぞれマイコン等を主体に構成されており、統合制御ＥＣＵ、及びナビゲーションＥＣＵ等を含んでいる。例えば、統合制御ＥＣＵからは、助手席及び後部座席に搭乗者が着座しているか否かを示す同乗者情報が対話装置１００によって取得可能に出力される。ナビゲーションＥＣＵからは、例えば自車両周囲の道路形状を示す情報等が出力される。

　音声認識操作スイッチ２１は、運転席の周囲に設けられている。音声認識操作スイッチ２１には、対話装置１００の会話機能について、作動のオン及びオフを切り替えるための操作が車両の搭乗者によって入力される。音声認識操作スイッチ２１は、搭乗者による操作情報を、対話装置１００へ出力する。尚、対話装置１００の会話機能に係る設定値を変更する操作が音声認識操作スイッチ２１に入力可能とされていてもよい。

　音声入力器２３は、車室内に設けられたマイク２４を有している。マイク２４は、車両の搭乗者によって発せられた会話の音声を電気信号に変換し、音声情報として対話装置１００へ向けて出力する。マイク２４は、例えばスマートフォン及びタブレット端末等の通信機器に設けられた通話のための構成であってもよい。またマイク２４にて集音された音声データは、対話装置１００へ無線送信されてもよい。

　音声再生装置３０は、搭乗者へ向けて情報を出力する出力インターフェースの機能を有する装置である。音声再生装置３０は、表示器、音声制御部３１、及びスピーカ３２を有している。音声制御部３１は、会話文の音声データを取得すると、取得した音声データに基づいてスピーカ３２を駆動する。スピーカ３２は、車室内に設けられており、車室内に音声を出力する。スピーカ３２は、運転者を含む車両の搭乗者に聞き取られるよう、会話文を再生する。

　尚、音声再生装置３０は、単純な音響機器であってもよく、又はインスツルメントパネルの上面に設置されたコミュニケーションロボット等であってもよい。さらに、対話装置１００に接続されたスマートフォン及びタブレット端末等の通信機器が、音声再生装置３０の機能を果たしてもよい。

　次に、対話装置１００の構成を説明する。対話装置１００は、入力情報取得部４１、音声情報取得部４３、通信処理部４５、情報出力部４７、状態情報処理回路５０、及び制御回路６０等によって構成されている。

　入力情報取得部４１は、音声認識操作スイッチ２１と接続されている。入力情報取得部４１は、音声認識操作スイッチ２１から出力された操作情報を取得し、制御回路６０へ提供する。音声情報取得部４３は、マイク２４と接続された音声入力のためのインターフェースである。音声情報取得部４３は、マイク２４から出力された音声情報を取得し、制御回路６０へ提供する。

　通信処理部４５は、モバイル通信用のアンテナを有している。通信処理部４５は、アンテナを介して、車両外部の基地局との間で情報の送受信を行う。通信処理部４５は、基地局を通じてインターネットに接続可能である。通信処理部４５は、インターネットを通じて種々のコンテンツ情報を取得可能である。コンテンツ情報には、例えばニュース情報、コラム記事情報、ブログ記事情報、自車両が走行している現在地点周辺の混雑具合を示す渋滞情報といった交通情報、並びに現在地点周辺の人気スポット、イベント、及び天気予報といった地域情報等が含まれる。コンテンツ情報は、例えばインターネット上にある少なくとも一つ以上のニュース配信サイトＮＤＳ等から取得される。

　情報出力部４７は、音声再生装置３０と接続された音声出力のためのインターフェースである。情報出力部４７は、制御回路６０によって生成された音声データを音声再生装置３０へ向けて出力する。情報出力部４７から出力された音声データは、音声制御部３１によって取得され、スピーカ３２によって再生される。

　状態情報処理回路５０は、車載状態検出器１０から出力された情報を取得することにより、主に運転者の状態を推定する。状態情報処理回路５０は、プロセッサ５０ａ、ＲＡＭ、及びフラッシュメモリを有するマイクロコンピュータを主体に構成されている。状態情報処理回路５０には、車載状態検出器１０からの信号を受け取る複数の入力インターフェースが設けられている。状態情報処理回路５０は、プロセッサ５０ａによる所定のプログラムの実行により、負荷判定機能及び覚醒状態判定機能を実現させることができる。

　負荷判定機能は、車両が現在走行している道路について、運転者の運転負荷が高いか否かを判定する機能である。状態情報処理回路５０は、操舵角センサ１１及びアクセルポジションセンサ１２から出力される検出結果を取得する。状態情報処理回路５０は、取得した検出結果の推移に基づき、ステアリング及びアクセルペダルの少なくとも一方を運転者が忙しく操作していると推定した場合に、現在の運転負荷が高いと判定する。

　加えて状態情報処理回路５０は、車両が走行中の道路の形状情報、及び自車両周囲の混雑具合を示す交通情報等を取得する。道路の形状情報は、車外撮像部１７及びナビゲーションＥＣＵから取得可能である。交通情報は、車外撮像部１７及び通信処理部４５から取得可能である。状態情報処理回路５０は、進行方向の道路がカーブ形状である場合、及び車両が渋滞の中を走行していると推定される場合に、現在の運転負荷が高いと判定する。

　一方、状態情報処理回路５０は、車両が概ね直線状の道路を走行中であり、且つ、周囲を走行する他の車両及び歩行者も僅かである場合に、現在の運転負荷が低いと判定する。また状態情報処理回路５０は、ステアリング及びアクセルペダルの操作量の変動が僅かである場合にも、運転負荷が低いと判定することができる。

　覚醒状態判定機能は、運転者が漫然状態又は居眠り状態にあるか否かを判定する機能である。状態情報処理回路５０は、各センサ１１，１２から取得した検出結果の推移に基づき、ステアリング又はアクセルペダルの緩慢な操作、及び時折入力される大きな修正操作等を検出した場合に、運転者が漫然状態又は居眠り状態にあると判定する。

　加えて状態情報処理回路５０は、車内撮像部１６から運転者の両目の視線方向及び目の開き具合といった情報を取得する。状態情報処理回路５０は、両目の視差が不安定であったり進行方向の物体の知覚に適切な状態でなかったりした場合、及び目の開度の低い状態が継続している場合等に、運転者が漫然状態又は居眠り状態にあると判定する。

　制御回路６０は、ユーザとの間で交わされる会話を統合的に制御する回路である。制御回路６０は、プロセッサ６０ａ、ＲＡＭ、及びフラッシュメモリを有するマイクロコンピュータを主体に構成されている。制御回路６０には、対話装置１００の他の構成と接続される入出力インターフェースが設けられている。制御回路６０は、プロセッサ６０ａによる所定のプログラムの実行により、図３に示すような音声認識部６１、文章処理部８０、及び会話処理部７０を、機能ブロックとして構築する。以下、制御回路６０に構築される各機能ブロックの詳細を、図３及び図１に基づき説明する。

　音声認識部６１は、ユーザの発話の内容を取得する。音声認識部６１は、音声情報取得部４３と接続されており、音声情報取得部４３から音声データを取得する。音声認識部６１は、取得した音声データを読み込み、テキストデータに変換する。音声認識部６１は、対話装置１００へ投げ掛けられたユーザの質問、ユーザの独り言、ユーザ同士の会話等、車室内にて運転者を含む搭乗者が発した言葉をテキストデータ化し、文章処理部８０へ提供する。

　文章処理部８０は、通信処理部４５を通じてコンテンツ情報を取得し、取得したコンテンツ情報を用いてユーザとの会話に用いられる会話文を生成する。文章処理部８０は、テキストデータ化されたユーザの発話の内容を音声認識部６１から取得し、ユーザの発言に対応した内容の会話文を生成可能である。文章処理部８０は、スレッド設定ブロック８１、取得制御ブロック８２、優先度設定ブロック８４、及び類似度算定ブロック８５を、コンテンツ情報から会話文を生成する会話文生成ブロック８３と共にサブブロックとして含んでいる。尚、以下の説明では、会話文生成ブロック８３にて会話文の生成に用いられているコンテンツ情報を、「特定のコンテンツ情報」と記載する。

　スレッド設定ブロック８１は、特定のコンテンツ情報に対して、複数のスレッドを規定する。スレッドとされる項目は、キーワード、ジャンルの大分類、ジャンルの詳細、日時、場所、コンテンツ情報の提供元となるニュース配信サイトＮＤＳ等である（図４参照）。スレッド設定ブロック８１は、複数のスレッドのそれぞれに、コンテンツ情報の内容及び履歴等に対応した属性情報を設定する。例えばキーワードのスレッドには、ニュース情報に登場する人名、団体名、地名、イベント名、物品名、及び施設名といった固有名詞及びニュース情報における重要語が属性情報として設定される。ジャンルの大分類には、スポーツ、経済、政治、及び芸能といった属性情報が設定される。属性情報は、コンテンツ情報のタイトル及び本文を解析することによって設定されてもよく、又はニュース配信サイトＮＤＳにて付与されていたタグ情報に基づいて設定されてもよい。本文を解析して属性情報を設定する手法としては、例えば形態素解析と固有表現抽出で得られた固有表現を使う。また、文中にある単語に対してtfidf値（term frequency - inverse document frequency）を計算し、スコアの高いものを抽出してもよい。

　取得制御ブロック８２は、通信処理部４５によるコンテンツ情報の取得を制御する。取得制御ブロック８２は、特定のコンテンツ情報の次に会話文に用いられる候補として、他のコンテンツ情報を通信処理部４５に取得させる。取得制御ブロック８２は、少なくとも一部の属性情報が特定のコンテンツ情報と同一となり、一部の属性情報が特定のコンテンツ情報と異なるような他のコンテンツ情報を、通信処理部４５に検索させる。

　具体的に、取得制御ブロック８２は、複数のスレッドのうちで、属性情報を固定する固定スレッドを指定する。複数のスレッドのうちで、固定スレッドに指定されない他のスレッドは、属性情報の変化する遷移スレッドとなる。取得制御ブロック８２は、固定スレッドに格納されている属性情報に関連する他のコンテンツ情報を、通信処理部４５に取得させる。

　取得制御ブロック８２は、次に会話文に用いられる候補のコンテンツ情報を取得させる度に、固定スレッドに指定するスレッドを変更可能である。加えて取得制御ブロック８２は、固定スレッドに指定するスレッドの数を変更可能である。取得制御ブロック８２は、特定のコンテンツ情報に基づく会話に対してユーザが興味や関心を示している場合には、固定スレッドの数を多く設定する。一方で、取得制御ブロック８２は、会話に対するユーザの興味や関心が薄い場合には、固定スレッドの数を少なく設定する。

　加えて取得制御ブロック８２は、音声認識部６１を通じて取得されるユーザの発話の内容を解析し、特定のコンテンツ情報に対し設定された各属性情報に関連するワードを抽出する。属性情報に関連するワードをユーザの発話から抽出した場合、取得制御ブロック８２は、抽出したワードを固定スレッドの属性情報と共に、他のコンテンツ情報を取得させる際の検索ワードとして用いることができる。その結果、取得制御ブロック８２は、特定のコンテンツ情報と内容的な繋がりを有し、且つ、ユーザの興味や関心を惹く確率の高い他のコンテンツ情報を、通信処理部４５に取得させることができる。

　優先度設定ブロック８４は、固定スレッドとして選択されるスレッドの優先順位を設定する。優先度設定ブロック８４にて設定される優先順位の高いスレッドが、取得制御ブロック８２にて固定スレッドに指定される。優先度設定ブロック８４は、音声認識部６１にて取得されたユーザの発話の履歴に基づいて、スレッドの優先順位を調整可能である。

　例えば優先度設定ブロック８４は、属性情報に関連するワードがユーザの発話の内容から抽出された場合に、抽出されたワードに関連するスレッドの優先順位を下げて、抽出されたワードによる属性情報の更新を可能にする（図７　Ｓ１４８参照）。また優先度設定ブロック８４は、特定のコンテンツ情報に基づく会話に対してユーザが興味や関心を示している場合には、ジャンルの詳細のスレッドについて優先順位を上げる調整を行う（図７
　Ｓ１４６参照）。その結果、ジャンルの詳細のスレッドが固定スレッドに指定され易くなるため、ユーザの関心のある話題が継続される。一方で、会話に対するユーザの興味や関心が薄い場合には、優先度設定ブロック８４は、ジャンルの詳細及び提供元の各スレッドについて、優先順位を下げる調整を行う（図７　Ｓ１４４参照）。その結果、会話の話題の変更が可能になる。ユーザの興味や関心を抽出する手法としては、単語のポジティブ・ネガティブの値を計算した辞書を用意しておいて、ユーザ発話内容と辞書とを対照することにより得られるユーザ発話のポジティブ度合から関心度を算出する手法がある。また、カメラを使った表情評定機能と連携し、ユーザの関心度合を決定してもよい。ユーザ発話の形態素情報から発話の種類を推定し、相槌が続けば興味がないといったルールを作成することで関心の高さを取得することもできる。

　類似度算定ブロック８５は、特定のコンテンツ情報と、次の会話文の生成に用いられる候補として取得されたコンテンツ情報との類似度を算定する（図８　Ｓ１６２参照）。類似度算定ブロック８５は、各コンテンツ情報に含まれる特徴的なワードを比較することにより、類似度を算定する。コンテンツ情報に含まれる特徴的なワードを取得する方法としては、例えば、形態素解析と固有表現抽出で得られた固有表現を使う方法がある。また、文中にある単語に対してtfidf値を計算し、スコアの高いものを抽出してもよい。類似度は、あらかじめ大量の文章データから計算しておいた2-gram値を使って、算出することが出来る。また、word2vecを使って類似度を算出してもよい。類似度算定ブロック８５にて算定される類似度が予め設定された閾値よりも高いコンテンツ情報は、取得制御ブロック８２によって会話文に用いられる候補から除外される（図８　Ｓ１６４参照）。以上の処理により、例えば提供元のニュース配信サイトＮＤＳが異なるものの、実質的に同一の出来事を伝えているコンテンツ情報が連続して会話文の生成に採用される事態は、回避される。

　会話文生成ブロック８３は、取得制御ブロック８２の制御によって取得されたコンテンツ情報のタイトル及び本文の内容を要約することにより、一つのコンテンツ情報から複数の会話文を生成可能である。各会話文の語尾は、話し言葉として自然に感じられるような「～だよ」，「～だよね」，「～ですよ」といった形式とされる。ユーザによって質問が投げ掛けられた場合、会話文生成ブロック８３は、音声認識部６１にて取得されるユーザの発話を認識し、ユーザの質問に応答する会話文を生成することができる。会話文生成ブロック８３は、生成した会話文のテキストデータを会話処理部７０へ向けて出力する。

　会話文生成ブロック８３は、ユーザとの会話を継続させるために、会話文の生成に用いるコンテンツ情報を変更することができる。会話文生成ブロック８３は、会話文の生成に用いるコンテンツ情報を変更する場合に、変更後のコンテンツ情報から生成した最初の会話文の冒頭につなぎ文を挿入する。つなぎ文は、例えば、「＜キーワード＞といえば・・・」，「＜日時＞は・・・」のように、属性情報を含んでいる。会話の話題が継続された場合、会話文生成ブロック８３は、属性情報が変更された遷移スレッドを示唆するつなぎ文を挿入する。一方で、会話の話題が大きく変更された場合、会話文生成ブロック８３は、属性情報が維持された固定スレッドを示唆するつなぎ文を挿入する。

　会話処理部７０は、文章処理部８０によって生成された会話文を用いて、ユーザとの会話を行う。会話処理部７０は、ユーザとの間にて行われる会話を制御するためのサブブロックとして、対話実行ブロック７１及び発話制御ブロック７２を含んでいる。

　対話実行ブロック７１は、会話文生成ブロック８３によって生成された会話文のテキストデータを取得し、取得した会話文の音声データを合成する。対話実行ブロック７１は、音節接続方式の音声合成を行ってもよく、又はコーパスベース方式の音声合成を行ってもよい。具体的に対話実行ブロック７１は、会話文のテキストデータから、発話される際の韻律データを生成する。そして対話実行ブロック７１は、予め記憶されている音声波形のデータベースから、韻律データにあわせて音声波形データをつなぎ合わせていく。以上のプロセスにより、対話実行ブロック７１は、会話文のテキストデータを音声データ化することができる。対話実行ブロック７１は、会話文の音声データを情報出力部４７から音声制御部３１へ出力させることにより、この会話文をスピーカ３２によって発話させる。

　発話制御ブロック７２は、対話実行ブロック７１による会話の実行を制御する。例えば、音声認識操作スイッチ２１への操作によって、対話装置１００の会話機能をオフ状態にする指示が入力されていた場合に、発話制御ブロック７２は、対話実行ブロック７１を停止状態にする。

　また発話制御ブロック７２は、状態情報処理回路５０による負荷判定に応じて、対話実行ブロック７１の作動ステータスを禁止状態及び許容状態とのうちで切り替える。具体的に対話実行ブロック７１は、負荷判定機能によって運転負荷が高いと判定された場合に、対話実行ブロック７１の作動ステータスを、発話の開始を禁止する禁止状態とする。一方、負荷判定機能によって運転負荷が低いと判定された場合、発話制御ブロック７２は、対話実行ブロック７１の作動ステータスを発話の開始を許容する許容状態とする。

　さらに発話制御ブロック７２は、負荷判定機能によって運転負荷が低いと判定された場合でも、予め設定された禁止条件が成立している場合には、対話実行ブロック７１の作動ステータスを許容状態とはせずに、禁止状態に維持する。禁止条件は、適宜設定可能である。例えば発話制御ブロック７２は、統合ＥＣＵから出力される同乗者情報に基づき、運転者以外の搭乗者が居ると判定されている場合に、禁止条件を成立させることができる。

　ここまで説明した制御回路６０によって実現されるユーザと対話装置１００との会話の一例を、以下説明する。尚、実際の会話では、実存する固有名詞が当然に発話されるが、以下の説明では、直接的な明示を避けるため、下記の＜＞のような記載とする。
対話装置：「＜テニスプレーヤＮＤ＞がＶ、際立つ勝負強さ、っていうニュースって知ってた？」
ユーザ　：「知らなかった」
対話装置：「＜テニスプレーヤＮＤ＞が全豪オープンで２年ぶり５度目の優勝をしたみたいだよ。」
ユーザ　：「決勝の相手は誰だったの？」
対話装置：「＜テニスプレーヤＡＭ＞だったよ。ベスト４はみんなビッグ４だったみたい。」
ユーザ　：「負けた＜テニスプレーヤＡＭ＞はどんな感じだったんだろう？」

　ここで、ユーザが＜テニスプレーヤＡＭ＞の名前を発話したことにより、制御回路６０は、ユーザが会話に高い関心を示したと推定する。制御回路６０は、現在の会話の話題を継続させるため、会話文の生成に用いるコンテンツ情報をニュース１からニュース２へと変更する（図４参照）。この場合、＜テニスプレーヤＡＭ＞という属性情報を設定可能なキーワードのスレッドのみが遷移スレッドとされる。そのため、次の会話文の冒頭には、キーワードのスレッドを示唆するつなぎ文が挿入される。
対話装置：「＜テニスプレーヤＡＭ＞といえば、準Ｖの＜テニスプレーヤＡＭ＞は『恥じることではない』って言ってたみたいだよ。」
ユーザ　：「負けたといっても準優勝だからね」
対話装置：「＜テニスプレーヤＡＭ＞は全豪オープンの決勝で、２０１０年は＜テニスプレーヤＲＦ＞に、そして２０１１年と２０１３年は＜テニスプレーヤＮＤ＞に負けていて、『また来年も戻って来て、決勝戦ではもう少し違う結果を期待したいね。』と語り、観客から大きな拍手を受けていたよ。」
ユーザ　：「結構決勝に行っているんだね」
対話装置：「そして自分にも勝てるチャンスがあったと感じていた＜テニスプレーヤＡＭ＞は『明らかに最初の３セットでは自分にもチャンスがあった。第４セットは彼に全て持って行かれてしまった。ベースラインからのリターンも最高だった。』と試合を振り返っていたようなんですよ。」
ユーザ　：「そっか」

　以上の「そっか」のように、ユーザが関心の低い返答をした場合、制御回路６０は、会話の話題を変更するために、会話文の生成に用いるコンテンツ情報をニュース２からニュース３へと変更する（図４参照）。この場合、ジャンルの大分類のスレッドと日時のスレッドのみが固定スレッドとされる。そのため、次の会話文の冒頭には、日時のスレッドを示唆するつなぎ文が挿入される。
対話装置：「昨日は、＜Ｆ１チームＲＢ＞、カムフラージュされた新車でテスト走行？っていうＦ１のニュースもあったよ。」
（以下、会話継続）

　以上のような継続的な会話を実現するために、制御回路６０にて実施される各処理の詳細をさらに説明する。まず、会話開始処理の詳細を、図５に基づき、図３を参照しつつ説明する。図５に示す会話開始処理の各ステップは、主に会話処理部７０によって実施される。会話開始処理は、車両の電源がオン状態とされたことに基づいて開始され、車両の電源がオフ状態とされるまで、繰り返し開始される。

　Ｓ１０１では、初期設定として、対話実行ブロック７１の作動ステータスを禁止状態に設定し、Ｓ１０２に進む。Ｓ１０２では、状態情報処理回路５０（図１参照）による負荷判定の判定結果を取得し、現在のユーザにおける運転負荷が低いか否かを判定する。Ｓ１０２にて、現在の運転負荷が高いと判定した場合、Ｓ１０７に進む。一方、Ｓ１０２にて、運転負荷が低いと判定した場合には、Ｓ１０３に進む。

　Ｓ１０３では、禁止条件が成立しているか否かを判定する。一方、Ｓ１０３にて、いずれの禁止条件も成立していないと判定した場合には、Ｓ１０４に進む。Ｓ１０４では、対話実行ブロック７１の作動ステータスを、禁止状態から許容状態へと切り替えて、Ｓ１０５に進む。

　Ｓ１０５では、会話開始条件が成立しているか否かを判定する。会話開始条件は、例えばユーザが漫然状態又は居眠り状態であるか、運転者の嗜好するカテゴリに属するような新着のコンテンツ情報が有るか、といった条件である。Ｓ１０５にて、会話開始条件が成立していないと判定した場合、会話開始処理を一旦終了する。一方、Ｓ１０５にて、会話開始条件が成立していると判定した場合、Ｓ１０６に進む。

　Ｓ１０６では、会話開始処理のサブルーチンとしての会話実行処理（図６参照）を開始し、Ｓ１０７に進む。Ｓ１０７では、会話実行処理が実施中か否かを判定する。Ｓ１０７にて、会話実行処理が継続していると判定されている場合、Ｓ１０７の判定を繰り返すことにより、会話実行処理の終了を待機する。そして、会話実行処理が終了していると判定した場合には、会話開始処理を一旦終了する。

　次に、Ｓ１０６にて開始される会話実行処理の詳細を、図６に基づき、図３を参照しつつ説明する。

　Ｓ１２１では、ユーザとの会話を開始し、Ｓ１２２に進む。Ｓ１２１により、対話装置１００（図１参照）は、「～って知ってた？」というような会話文にて、ユーザに話しかける。こうしたユーザとの会話は、会話文を生成する会話文生成ブロック８３と、生成された会話文を音声データに変換する対話実行ブロック７１との協働によって実現される。

　Ｓ１２２では、会話終了条件が成立しているか否かを判定する。会話終了条件は、例えばユーザが覚醒状態になった、ユーザから会話終了を指示する発話があった、運転負荷が上昇した等の条件である。Ｓ１２２にて、会話終了条件が成立していると判定した場合、Ｓ１２９に進み、Ｓ１２１にて開始した会話を終了する。一方、Ｓ１２２にて、会話終了条件が成立していないと判定した場合、Ｓ１２３に進む。

　Ｓ１２３では、現在の特定のコンテンツ情報から継続して会話文を生成可能か否か判定する。Ｓ１２３にて、会話文の生成の継続が可能と判定した場合、Ｓ１２２及びＳ１２３の判定を繰り返すことにより、会話文の生成継続が困難となるのを待機する。そして、コンテンツ情報に含まれる概ね全ての情報を会話文として使用し、さらなる会話文の生成が困難となった場合には、Ｓ１２４に進む。

　Ｓ１２４では、特定のコンテンツ情報に対して複数のスレッドを規定し、Ｓ１２５に進む。Ｓ１２５では、各スレッドにコンテンツ情報に対応した属性情報を格納し、Ｓ１２６に進む。Ｓ１２６では、サブルーチンとしての固定スレッド設定処理（図７参照）を開始し、Ｓ１２７に進む。

　Ｓ１２７では、サブルーチンとしてのコンテンツ情報設定処理（図８参照）を開始し、Ｓ１２８に進む。Ｓ１２８では、会話文生成ブロック８３にて会話文の生成に用いるコンテンツ情報を、Ｓ１２７にて設定されたコンテンツ情報に変更する。そして、新たなコンテンツ情報に基づく会話文を用いて、ユーザとの会話を継続する。

　次に、Ｓ１２６にて開始される固定スレッド設定処理の詳細を、図７に基づき、図３を参照しつつ説明する。固定スレッド設定処理によれば、複数のスレッドはそれぞれ、固定スレッド及び遷移スレッドのいずれかに設定される。固定スレッド設定処理の各ステップは、主に文章処理部８０の各サブブロックによって実施される。

　Ｓ１４１では、固定スレッドとして選択されるスレッドの優先順位を設定するため、優先順位の初期設定値を読み込み、Ｓ１４２に進む。初期設定値は、ランダムに設定された順位であってもよく、ユーザによる操作入力によって予め設定された順位であってもよい。さらに、ユーザとの会話履歴に基づいて初期設定値が設定されてもよい。

　Ｓ１４２では、音声認識部６１から取得しているユーザの発話の内容から、最新の会話に用いられていた特定のコンテンツ情報に対するユーザの関心が高いか否かを推定する。具体的にＳ１４２では、例えばユーザが「そっか」，「ふーん」といった反応を示した場合、又はユーザの反応が無い場合、ユーザの関心が低いと判定する。Ｓ１４２にて、関心が低いと判定した場合には、Ｓ１４３に進む。

　Ｓ１４３では、固定スレッドの数を予め設定された低関心所定値に設定し、Ｓ１４４に進む。低関心所定値は、会話の話題が大きく変わるように、例えばスレッドの数の過半数以上の値に設定される。本実施形態の低関心所定値は、「４」に予め設定されている。Ｓ１４４では、ジャンルの詳細及び提供元の各スレッドについて優先順位を下げる調整を行い、Ｓ１４９に進む。Ｓ１４４における優先順位の調整により、ジャンルの詳細及び提供元のスレッドに格納される属性情報が変更され易くなる。

　一方、Ｓ１４２にて、ユーザの関心が高いと判定した場合には、Ｓ１４５に進む。Ｓ１４５では、固定スレッドの数を予め設定された高関心所定値に設定し、Ｓ１４６に進む。高関心所定値は、会話の話題が継続されるように、例えばスレッドの数の過半数未満の値に設定される。本実施形態の高関心所定値は、「１」に予め設定されている。高関心所定値は、低関心所定値よりも小さい値とされる。Ｓ１４６では、ジャンルの詳細のスレッドについて優先順位を上げる調整を行い、Ｓ１４７に進む。

　Ｓ１４７では、会話実行処理のＳ１２５（図６参照）にて設定された属性情報に関連するワードがユーザによって発話されたか否かを判定する。Ｓ１４７にて、属性情報に関連するワードがユーザの発話から抽出されなかった場合、Ｓ１４９に進む。一方、Ｓ１４７にて、属性情報に関連するワードがユーザの発話から抽出された場合には、Ｓ１４８に進む。例えば、キーワードのスレッドに属性情報として＜テニスプレーヤＮＤ＞の名前が設定されている場合、他の著名なテニスプレーヤの名前が属性情報に関連するワードに該当する（図４参照）。

　Ｓ１４８では、抽出されたワードに関連するスレッドについて優先順位を最下位へ調整し、且つ、当該スレッドの属性情報を抽出したワードにて更新する。具体的に、上述した会話のように、ユーザが＜テニスプレーヤＡＭ＞の名前を発した場合には、キーワードのスレッドの優先順位が最下位とされ、当該スレッドの属性情報が、＜テニスプレーヤＮＤ＞から＜テニスプレーヤＡＭ＞に更新される（図４参照）。Ｓ１４９では、Ｓ１４３又はＳ１４５にて設定された固定スレッドの数と、Ｓ１４４又はＳ１４６～Ｓ１４８にて設定された優先順位とに基づき、固定スレッドを指定する。

　次に、Ｓ１２７（図６参照）にて開始されるコンテンツ情報設定処理の詳細を、図８に基づき、図３を参照しつつ説明する。コンテンツ情報設定処理によれば、次に会話文の生成に用いられるコンテンツ情報が設定される。コンテンツ情報設定処理の各ステップは、主に文章処理部８０の各サブブロックによって実施される。

　Ｓ１６１では、Ｓ１４９（図７参照）にて指定された固定スレッドの属性情報が同一となるようなコンテンツ情報をインターネットから取得し、Ｓ１６２に進む。取得制御ブロック８２にて属性情報に関連するワードがユーザの発話から抽出されていた場合のＳ１６１では、抽出されたワードとも関連の高いコンテンツ情報が取得される。

　Ｓ１６２では、Ｓ１６１にて取得したコンテンツ情報と、最新の特定コンテンツ情報との類似度を算定し、Ｓ１６３に進む。Ｓ１６３では、Ｓ１６２にて算定された類似度が予め設定された閾値未満か否かを判定する。Ｓ１６３にて、類似度が閾値以上であると判定した場合、Ｓ１６４に進む。Ｓ１６４では、直前のＳ１６１にて取得したコンテンツ情報を会話文に用いる候補から除外し、再びＳ１６１に戻る。再度のＳ１６１では、各属性情報が同一となるようなコンテンツ情報を再検索する。

　一方、Ｓ１６３にて、類似度が閾値未満であると判定した場合、Ｓ１６５に進む。Ｓ１６５では、直前のＳ１６１にて取得したコンテンツ情報を、次に会話文の生成に用いるコンテンツ情報に設定し、Ｓ１６６へ進む。Ｓ１６６では、属性情報を更新したスレッド、又は属性情報が維持されたスレッドを示唆するつなぎ文を生成し、コンテンツ情報設定処理を終了する。

　ここまで説明した本実施形態によれば、特定のコンテンツ情報における属性情報の少なくとも一部は、このコンテンツ情報の次に会話文に用いられる他のコンテンツ情報の属性情報と同一となり得る。故に、上述したニュース１～３（図４参照）といった複数のコンテンツ情報から生成される各会話文の間には、内容的なつながりが確保され得る。以上によれば、ユーザとの継続的な会話のために、会話文に用いるコンテンツ情報を変更可能な構成であっても、対話装置１００は、ユーザに不自然さを感じさせ難い会話文を生成することができる。

　加えて本実施形態によるスレッド設定ブロック８１は、次の会話文に用いられる他のコンテンツ情報を通信処理部４５に取得させる度に、固定スレッドを変更可能である。その結果、会話文に用いるコンテンツ情報の変更が繰り返されることにより、会話の話題は、段階的に変化していく。したがって、対話装置１００は、徐々に話題の変化する自然な会話をユーザとの間において展開可能となる。

　また本実施形態によれば、優先度設定ブロック８４が固定スレッドとするスレッドの優先順位を調整することにより、会話文に用いられるコンテンツ情報の内容の変化が制御される。この優先度設定ブロック８４は、ユーザの発話履歴に基づき、固定スレッドとするスレッドの優先順位を調整可能である。以上によれば、対話装置１００は、例えばユーザの反応に応じてコンテンツ情報を変えることにより、ユーザの興味が失われないように、会話を盛り上げていくことができる。

　さらに本実施形態によれば、会話文生成ブロック８３は、会話文の生成に用いるコンテンツ情報を変更する場合に、変更後のコンテンツ情報から生成される会話文の冒頭につなぎ文を挿入する。つなぎ文は、属性情報が更新されたスレッド、又は属性情報が維持されたスレッドを示唆することにより、変更前後の二つのコンテンツ情報についての内容的な関連をユーザに暗示し得る。その結果、ユーザは、会話文に用いられるコンテンツ情報が変更されても、対話装置１００から発話される会話文に違和感を覚え難くなる。

　加えて本実施形態によれば、取得制御ブロック８２は、類似度算定ブロック８５によって算定される類似度に基づき、特定のコンテンツ情報と同一の出来事を示した他のコンテンツ情報を、次の会話文の候補から除外できる。以上によれば、同じ出来事を知らせる会話文が連続して生成され、ユーザの利用意欲を失わせてしまう事態は、回避される。

　また本実施形態によれば、展開中の話題に対するユーザの関心が高い場合には、固定スレッドの数が増やされる。その結果、話題の変化が小さくなるため、ユーザの関心の高い状態が維持される。一方で、ユーザの関心が低い場合には、固定スレッドの数は減らされる。その結果、対話装置１００は、話題を大きく変えて、新鮮味のある情報を提供することで、ユーザの興味を惹くことができる。

　尚、本実施形態において、通信処理部４５が「情報取得部」に相当し、音声認識部６１が「発話取得部」に相当し、対話実行ブロック７１及び会話文生成ブロック８３が「会話実行部」に相当する。また、スレッド設定ブロック８１が「属性設定部」に相当し、取得制御ブロック８２が「取得制御部」に相当し、優先度設定ブロック８４が「優先度設定部」に相当し、類似度算定ブロック８５が「類似度算定部」に相当する。そして、ニュース配信サイトＮＤＳが「情報源」に相当し、Ｓ１２５が「属性設定ステップ」に相当し、Ｓ１２８が「会話実行ステップ」に相当し、Ｓ１６１が「取得制御ステップ」に相当する。

　（他の実施形態）
　以上、一実施形態を例示したが、本開示の技術的思想は、種々の実施形態及び組み合わせとして具現化できる。

　上記実施形態による対話装置は、固定スレッドに指定するスレッドを適宜変更する制御により、話題の繋がりを維持しながら、話題を徐々に変えていくことで、ユーザとの会話を広げていくことが可能であった。しかし、対話装置は、コンテンツ情報に対してスレッドを規定することなく、維持する属性情報を適宜変更する制御により、話題の繋がりを維持しながら、話題を徐々に変えていくことも可能である。

　上記実施形態による対話装置は、会話文の生成に用いられるコンテンツ情報を変更する際に、会話文の冒頭につなぎ文を挿入していた。こうしたつなぎ文は、会話を自然に繋ぐことが可能な言葉でれば、上記実施形態の例に限定されず、適宜変更可能である。また、つなぎ文の挿入は、行われなくてもよい。

　上記実施形態による対話装置は、二つのコンテンツ情報の類似度を算定し、類似度が閾値を超えた場合には、取得したコンテンツ情報を会話文の生成に用いる候補から除外していた。しかし、こうした類似度に基づくコンテンツ情報の選別処理は省略されてもよい。また、コンテンツ情報の提供元であるニュース配信サイトＮＤＳを変更した場合に限り、類似度による判定が実施されてもよい。

　上記実施形態における会話開始の条件（図５　Ｓ１０５参照）は、適宜変更可能である。例えば、対話装置は、漫然状態を自覚した運転者が運転席周辺に設けられた対話開始スイッチに対して行う入力や、運転者の「雑談しようよ」といった投げ掛け、或いは搭乗者による特定のキーワードの発話等をきかっけとして、ユーザへの雑談を開始可能である。

　上記実施形態では、ユーザの関心が高くなるほど、固定スレッドの数が増やされていた。しかし、固定スレッドに指定される数は、ユーザの関心の高さに係わらず一定であってもよい。また、固定スレッドに指定されるスレッドは、ユーザの発話に関係なく、コンテンツ情報を取得する度に変更されてもよい。

　上記実施形態において、対話装置１００によって一連の会話が開始される直前には、会話開始をユーザに報知するための報知音が、スピーカ３２から出力されてよい。報知音は、ユーザの意識を会話の音声に向けさせることができる。その結果、ユーザは、対話装置１００から投げかけられた会話の始まりの部分を聞き逃し難くなる。

　上記実施形態では、運転者の顔の様子から漫然状態及び居眠り状態が推定されていた。しかし、例えば車内撮像部によって運転者の手及び体の動きを検出可能であれば、手で目及び顔を擦るような動作や、着座位置及び姿勢を頻繁に直すような動作に基づき、漫然状態及び居眠り状態が推定されてもよい。

　上記実施形態では、対話すること自体を目的とした非タスク指向型の会話を対話装置が行っている場合について、詳細を説明した。しかし、対話装置は、上述した雑談のような会話だけでなく、搭乗者から投げかけられた質問に返答する、搭乗者の指定するお店を予約するといったタスク指向型の会話も行うことができる。さらに、非タスク指向型の会話を行っている途中で、一時的にタスク指向型の会話を挟むことも可能である。

　上記実施形態において、制御回路６０のプロセッサ６０ａによって提供されていた会話実行に係る各機能は、例えば専用の集積回路によって実現されていてもよい。或いは、複数のプロセッサが協働して、会話の実行に係る各処理を実施してもよい。さらに、上述のものとは異なるハードウェア及びソフトウェア、或いはこれらの組み合わせによって、各機能が提供されてよい。同様に、状態情報処理回路５０のプロセッサ５０ａによって提供されていた運転負荷判定及び覚醒度判定に係る機能も、上述のものとは異なるハードウェア及びソフトウェア、或いはこれらの組み合わせによって提供可能である。さらに、各プロセッサ５０ａ，６０ａにて実行されるプログラムを記憶する記憶媒体は、フラッシュメモリに限定されない。種々の非遷移的実体的記憶媒体が、プログラムを記憶する構成として採用可能である。

　本開示の技術的思想は、スマートフォン及びタブレット端末等の通信機器、並びに車両外部のサーバー等にインストールされる対話制御プログラムにも適用可能である。例えば対話制御プログラムは、車内に持ち込まれる通信端末の記憶媒体に、プロセッサによって実行可能なアプリケーションとして記憶されている。通信端末は、対話制御プログラムに従って運転者と対話可能であり、対話を通じて運転者の覚醒状態を維持させることができる。

　また、対話制御プログラムがサーバーの記憶媒体に記憶されている場合、サーバーは、車両及び運転者の状態情報を、インターネットを通じて取得することができる。加えてサーバーは、取得した状態情報に基づき生成した会話文を、車両の音声再生装置へ送信し、スピーカから再生させることができる。図９は、この変形例に係る対話システムの全体構成を示すブロック図である。変形例は、基本的な構成が上記実施形態と同様であるため、共通する構成については先行する説明を参照することにより説明を省略し、相違点を中心に説明する。なお、上記実施形態と同じ符号は、同一の構成を示す。

　上記実施形態では、対話装置１００のプロセッサ６０ａが所定のプログラムの実行することにより、対話装置１００が、音声認識部６１と、会話処理部７０と、文章処理部８０とを、機能ブロックとして構築した。これに対し、変形例では、制御サーバー２００のプロセッサ６０ｂが所定のプログラムを実行することにより、制御サーバー２００が、音声認識部６１ｂと、会話処理部７０bと、文章処理部８０ｂとを、機能ブロックとして構築する。つまり、遠隔の制御サーバー２００に設けられた音声認識部６１ｂ、会話処理部７０b、及び文章処理部８０ｂが、上記実施形態の対話装置１００の音声認識部６１、会話処理部７０、及び文章処理部８０の機能を代替する構成（クラウド）である。これに伴い、制御サーバー２００の通信処理部４５ｂは、インターネット等の通信ネットワークを経由して、音声認識部６１ｂ、会話処理部７０ｂ及び文章処理部８０ｂの処理に要する情報を取得するとともに、生成した会話文を対話装置１００の通信処理部４５aへ送信して音声再生装置３０から再生させる。具体的には、制御サーバー２００の通信処理部４５ｂは、ニュース配信サイトＮＤＳ等からコンテント情報を取得するとともに、上記実施形態において対話装置１００の状態情報処理回路５０、入力情報取得部４１および音声情報取得部４３から制御部６０に入力されていた車両及び運転者の状態情報等の各種情報を対話装置１００から取得する。このように取得した情報に基づき生成した会話文は、制御サーバー２００の通信処理部４５ｂから、通信ネットワークを経由して、対話装置１００の通信処理部４５aに送信される。なお、図９では、制御サーバー２００が、音声認識部６１ｂと、文章処理部８０ｂと、会話処理部７０ｂとを備える構成を例示したが、制御サーバーが、音声認識部、文章処理部、及び会話処理部のうち一部の機能を備え、対話装置が他を備えてもよい。例えば、対話装置が音声認識部を備え、制御サーバーが文章処理部と会話処理部とを備えてもよい。

　以上のように、サーバーに対話制御プログラムがインストールされている場合でも、ユーザである運転者とシステムとの会話が実現できる。そして、サーバー型の対話システムでも、運転者の覚醒状態の維持は可能である。

　以上のように、対話制御プログラムを実行する通信機器及びサーバー等によって行われる対話方法は、対話装置によって行われる対話方法と実質同一となり得る。また本開示の技術的思想は、車両に搭載される対話装置だけでなく、ユーザと会話を行う機能を備えた装置、例えば、現金自動預け払い機、玩具、受付用ロボット、介護用ロボット等にも適用可能である。

　さらに本開示の技術的思想は、自動運転を行う車両（自律走行車）に搭載される対話装置にも適用可能である。例えば、「システムからの運転操作切り替え要請にドライバーが適切に応じるという条件のもと、特定の運転モードにおいて自動化された運転システムが車両の運転操作を行う」という自動化レベルの自動運転が想定されている。このような自動運転車両では、運転者（オペレータ）は、運転操作のバックアップのために、待機状態を維持する必要がある。そのため、待機状態にある運転者は、漫然状態及び居眠り状態に陥り易くなると推測される。故に、このような対話装置は、自動運転システムのバックアップとして待機状態にある運転者の覚醒度を維持する構成としても、好適なのである。

　以上、本開示に係る様々な実施形態及び変形例を例示したが、これら実施形態及び変形例の各技術的要素を適宜組み合わせて得られる実施形態も、本開示の実施形態である。

Claims

　コンテンツ情報から生成した会話文を用いてユーザとの会話を行う対話装置であって、
　情報源（ＮＤＳ）から前記コンテンツ情報を取得する情報取得部（４５）と、
　前記会話文の生成に用いる前記コンテンツ情報を変更しつつ、前記ユーザとの会話を継続する会話実行部（７１，８３）と、
　前記会話実行部にて前記会話文の生成に用いられる特定のコンテンツ情報に対し、複数の属性情報を設定する属性設定部（８１）と、
　少なくとも一部の前記属性情報が前記特定のコンテンツ情報と同一となるような他のコンテンツ情報を、この特定のコンテンツ情報の次に前記会話文に用いられる候補として前記情報取得部に取得させる取得制御部（８２）と、を備える対話装置。
　前記属性設定部は、各前記属性情報が設定される複数のスレッドを前記特定のコンテンツ情報に対して規定し、
　前記取得制御部は、次の前記会話文に用いられる前記他のコンテンツ情報を前記情報取得部に取得させる度に、複数の前記スレッドのうちで前記属性情報を固定する固定スレッドを変更可能である請求項１に記載の対話装置。
　前記固定スレッドとして選択される前記スレッドの優先順位を設定する優先度設定部（８４）、をさらに備え、
　前記取得制御部は、前記優先度設定部にて設定される優先順位の高い前記スレッドを、前記固定スレッドに指定する請求項２に記載の対話装置。
　前記ユーザの発話の内容を取得する発話取得部（６１）、をさらに備え、
　前記優先度設定部は、前記発話取得部にて取得された前記ユーザの発話の履歴に基づいて、前記スレッドの優先順位を調整する請求項３に記載の対話装置。
　前記会話実行部は、前記会話文の生成に用いる前記コンテンツ情報を変更した場合に、変更後の前記コンテンツ情報から生成した前記会話文の冒頭に、複数の前記スレッドのうちで前記固定スレッドに指定されなかった遷移スレッドを示唆するつなぎ文を挿入する請求項２～４のいずれか一項に記載の対話装置。
　前記会話実行部は、前記会話文の生成に用いる前記コンテンツ情報を変更した場合に、変更後の前記コンテンツ情報から生成した前記会話文の冒頭に、前記固定スレッドを示唆するつなぎ文を挿入する請求項２～５のいずれか一項に記載の対話装置。
　前記特定のコンテンツ情報と前記他のコンテンツ情報との類似度を算定する類似度算定部（８５）、をさらに備え、
　前記取得制御部は、前記類似度算定部にて算定された類似度が予め設定された閾値よりも高い前記他のコンテンツ情報を、前記会話実行部にて前記会話文の生成に用いられる候補から除外する請求項１～６のいずれか一項に記載の対話装置。
　情報源（ＮＤＳ）からコンテンツ情報を情報取得部（４５，４５ｂ）によって取得し、前記コンテンツ情報から生成した会話文を用いてユーザとの会話を行う対話方法であって、
　少なくとも一つのプロセッサ（６０ａ，　６０ｂ）によって実施されるステップとして、
　前記会話文の生成に用いる前記コンテンツ情報を変更しつつ、前記ユーザとの会話を継続する会話実行ステップ（Ｓ１２８）と、
　前記会話実行ステップにて前記会話文の生成に用いられる特定のコンテンツ情報に対し、複数の属性情報を設定する属性設定ステップ（Ｓ１２５）と、
　少なくとも一部の前記属性情報が前記特定のコンテンツ情報と同一となるような他のコンテンツ情報を、この特定のコンテンツ情報の次に前記会話文に用いられる候補として前記情報取得部に取得させる取得制御ステップ（Ｓ１６１）と、を含む対話方法。
　前記会話実行ステップ、前記属性設定ステップ及び前記取得制御ステップは、前記会話文を出力するための音声再生装置（３０）と通信ネットワーク経由により接続可能な遠隔サーバー（２００）のプロセッサ（６０ｂ）によって実施される請求項８に記載の対話方法。
　請求項８に記載の会話実行ステップ、属性設定ステップ及び取得制御ステップを実施するプロセッサ（６０ｂ）を備える遠隔サーバーにより生成された前記会話文を、通信ネットワークを経由して、受信する通信処理部（４５ａ）と、
　前記通信処理部が受信した会話文を音声再生装置に出力する情報出力部（４７）と、を備える対話装置。
　請求項８に記載の会話実行ステップ、属性設定ステップ及び取得制御ステップを実施するプロセッサ（６０ｂ）を備える遠隔サーバー（２００）と、
　前記遠隔サーバーにより生成された前記会話文を、通信ネットワークを経由して、受信する通信処理部（４５ａ）と、前記通信処理部が受信した会話文を音声再生装置に出力する情報出力部（４７）と、を有する対話装置（１００）と、
　を備える対話システム。
　請求項８に記載の会話実行ステップ、属性設定ステップ及び取得制御ステップを前記少なくとも一つのプロセッサに実行させるためのプログラム。
　前記プログラムは、通信端末で実行可能なアプリケーションである請求項１２に記載のプログラム。