JP2020067785A

JP2020067785A - 制御装置、エージェント装置及びプログラム

Info

Publication number: JP2020067785A
Application number: JP2018199654A
Authority: JP
Inventors: 俊克倉持; Toshikatsu Kuramochi; 関口　敦; Atsushi Sekiguchi; 敦関口
Original assignee: Honda Motor Co Ltd
Current assignee: Honda Motor Co Ltd
Priority date: 2018-10-24
Filing date: 2018-10-24
Publication date: 2020-04-30
Also published as: US20200133630A1; CN111092988A

Abstract

【課題】ユーザの通信環境によっては、ユーザ及びエージェントの間の円滑なコミュニケーションが困難になる。【解決手段】通信ネットワークを介してユーザの音声及びジェスチャの少なくとも一方により示される要求を取得し、当該要求に応じた処理を実行する第１要求処理装置のユーザインタフェースとして機能するエージェント装置を制御する。第１要求処理装置、及び、エージェント装置の間の通信状態を示す通信情報を取得する通信情報取得部と、通信情報取得部が取得した通信情報により示される通信状態に基づいて、エージェント装置による情報の提供に利用されるエージェントの様態を決定する様態決定部とを備える。【選択図】図１

Description

本発明は、制御装置、エージェント装置及びプログラムに関する。

擬人化されたエージェントを介したユーザとのインタラクションに基づいて、各種の処理を実行するエージェント装置が知られている。（例えば、特許文献１〜２を参照されたい）。
［先行技術文献］
［特許文献］
［特許文献１］特開２００６−１８９３９４号公報
［特許文献２］特開２０００−０２０８８８号公報

エージェント装置は、クラウド上又はサーバ上で動作する支援アプリケーションと協働して、ユーザとのインタラクションを実現する。音声認識処理、推論処理、対話管理処理などのマシンパワーを必要とする処理は、支援アプリケーションにより実行され、エージェント装置は、ユーザインタフェースとして機能する。そのため、ユーザの通信環境によっては、ユーザ及びエージェントの間の円滑なコミュニケーションが困難になる。

本発明の第１の態様においては、制御装置が提供される。上記の制御装置は、例えば、エージェント装置を制御する。上記のエージェント装置は、例えば、第１要求処理装置のユーザインタフェースとして機能する。上記の第１要求処理装置は、例えば、通信ネットワークを介してユーザの音声及びジェスチャの少なくとも一方により示される要求を取得する。上記の第１要求処理装置は、例えば、上記の要求に応じた処理を実行する。上記の制御装置は、例えば、第１要求処理装置、及び、エージェント装置の間の通信状態を示す通信情報を取得する通信情報取得部を備える。上記の制御装置は、例えば、通信情報取得部が取得した通信情報により示される通信状態に基づいて、エージェント装置による情報の提供に利用されるエージェントの様態を決定する様態決定部を備える。

上記の制御装置において、エージェントの様態は、（ｉ）エージェントとして利用されるキャラクタの種類、（ｉｉ）キャラクタの外観、（ｉｉｉ）キャラクタの声、及び、（ｉｖ）キャラクタのインタラクションの様態の少なくとも１つであってよい。

上記の制御装置において、エージェント装置は、第１要求処理装置とは異なる第２要求処理装置のユーザインタフェースとして機能してもよい。第２要求処理装置は、有線通信又は近距離無線通信により、エージェント装置から、ユーザの音声又はジェスチャによる要求を取得してよい。第２要求処理装置は、上記の要求に応じた処理を実行してよい。上記の制御装置は、通信情報取得部が取得した通信情報により示される通信状態に基づいて、エージェント装置を、第１要求処理装置及び第２要求処理装置の何れのユーザインタフェースとして機能させるかを決定する処理装置決定部を備えてよい。

上記の制御装置において、様態決定部は、（ｉ）エージェント装置を、第１要求処理装置のユーザインタフェースとして機能させることが決定された場合と、（ｉｉ）エージェント装置を、第２要求処理装置のユーザインタフェースとして機能させることが決定された場合とで、エージェントの様態が異なるように、エージェントの様態を決定してよい。上記の制御装置において、様態決定部は、（ｉ）エージェント装置が、第１要求処理装置のユーザインタフェースとして機能する場合におけるエージェントの様態と、（ｉｉ）エージェント装置が、第２要求処理装置のユーザインタフェースとして機能する場合におけるエージェントの様態とを、予め決定していてもよい。上記の制御装置において、様態決定部は、処理装置決定部の決定結果に基づいて、エージェントの様態を切り替えてよい。

上記の制御装置において、様態決定部は、（ｉ）エージェント装置が、第１要求処理装置のユーザインタフェースとして機能する場合と、（ｉｉ）エージェント装置が、第２要求処理装置のユーザインタフェースとして機能する場合とで、同一の種類のキャラクタを利用することを決定してよい。上記の制御装置において、様態決定部は、（ｉ）エージェント装置が、第１要求処理装置のユーザインタフェースとして機能する場合に利用されるキャラクタの設定年齢を、（ｉｉ）エージェント装置が、第２要求処理装置のユーザインタフェースとして機能する場合に利用されるキャラクタの設定年齢よりも高くすることを決定してよい。

上記の制御装置において、様態決定部は、（ｉ）エージェント装置が、第１要求処理装置のユーザインタフェースとして機能する場合、エージェントのキャラクタとして、大人のキャラクタを利用することを決定してよい。上記の制御装置において、様態決定部は、（ｉｉ）エージェント装置が、第２要求処理装置のユーザインタフェースとして機能する場合、エージェントのキャラクタとして、子供のキャラクタ、大人のキャラクタの幼少期のキャラクタ、又は、大人のキャラクタの外観がデフォルメされたキャラクタを利用することを決定してよい。

上記の制御装置において、様態決定部は、（ｉ）エージェント装置が、第１要求処理装置のユーザインタフェースとして機能する場合、エージェントの音声として、大人の音声又は大人のキャラクタの音声を利用することを決定してよい。上記の制御装置において、様態決定部は、（ｉｉ）エージェント装置が、第２要求処理装置のユーザインタフェースとして機能する場合、エージェントの音声として、子供の音声又は子供のキャラクタの音声を利用することを決定してよい。

上記の制御装置は、ユーザの要求に応答する音声メッセージを生成する音声メッセージ生成部を備えてよい。上記の制御装置において、音声メッセージ生成部は、エージェント装置が、第２要求処理装置のユーザインタフェースとして機能する場合、要求の種類に基づいて定められた定型文を利用して、音声メッセージを生成してよい。上記の制御装置において、第２要求処理装置が認識できる要求の種類の数は、第１要求処理装置が認識できる要求の種類の数よりも少なくてよい。上記の制御装置において、第２要求処理装置が処理できる要求の種類の数は、第１要求処理装置が処理できる要求の種類の数よりも少なくてよい。上記の制御装置において、エージェント装置は、対話型の車両用運転支援装置であってよい。

本発明の第２の態様においては、エージェント装置が提供される。上記のエージェント装置は、例えば、要求処理装置のユーザインタフェースとして機能する。上記の要求処理装置は、例えば、ユーザの音声及びジェスチャの少なくとも一方により示される要求を取得する。上記の要求処理装置は、例えば、上記の要求に応じた処理を実行する。上記のエージェント装置は、例えば、上記の制御装置を備える。上記のエージェント装置は、例えば、制御装置の様態決定部が決定した様態に従って、エージェントの画像を表示又は投影するエージェント出力部を備える。

上記のエージェント装置は、ユーザの音声及びジェスチャの少なくとも一方を示す情報を入力する入力部を備えてよい。上記のエージェント装置は、ユーザに音声メッセージを出力する音声メッセージ出力部を備えてよい。

本発明の第３の態様においては、プログラムが提供される。上記のプログラムを格納する非一時的コンピュータ可読媒体が提供されてもよい。上記のプログラムは、コンピュータを、上記の制御装置として機能させるためのプログラムであってよい。

なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。

対話型エージェントシステム１００のシステム構成の一例を概略的に示す。車両１１０の内部構成の一例を概略的に示す。入出力制御部２７２の内部構成の一例を概略的に示す。要求処理部３４０の内部構成の一例を概略的に示す。要求決定部４２０の内部構成の一例を概略的に示す。応答管理部３５０の内部構成の一例を概略的に示す。エージェント情報格納部３６０の内部構成の一例を概略的に示す。支援サーバ１２０の内部構成の一例を概略的に示す。要求決定部８４２の内部構成の一例を概略的に示す。出力様態の遷移の一例を概略的に示す。

以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。なお、図面において、同一または類似の部分には同一の参照番号を付して、重複する説明を省く場合がある。

［対話型エージェントシステム１００の概要］
図１は、対話型エージェントシステム１００のシステム構成の一例を概略的に示す。本実施形態において、対話型エージェントシステム１００は、車両１１０と、支援サーバ１２０とを備える。本実施形態において、車両１１０は、応答システム１１２と、通信システム１１４とを有する。

対話型エージェントシステム１００は、第１要求処理装置及び第２要求処理装置の一例であってよい。第１要求処理装置及び第２要求処理装置のそれぞれは、要求処理装置の一例であってよい。車両１１０又は車両１１０に搭載された機器は、エージェント装置の一例であってよい。応答システム１１２は、エージェント装置の一例であってよい。支援サーバ１２０は、第１要求処理装置の一例であってよい。

本実施形態において、車両１１０及び支援サーバ１２０は、通信ネットワーク１０を介して、互いに情報を送受することができる。また、車両１１０と、車両１１０のユーザ２０が利用する通信端末３０とが、通信ネットワーク１０を介して情報を送受してもよく、支援サーバ１２０と、通信端末３０とが、通信ネットワーク１０を介して情報を送受してもよい。

本実施形態において、通信ネットワーク１０は、有線通信の伝送路であってもよく、無線通信の伝送路であってもよく、無線通信の伝送路及び有線通信の伝送路の組み合わせであってもよい。通信ネットワーク１０は、無線パケット通信網、インターネット、Ｐ２Ｐネットワーク、専用回線、ＶＰＮ、電力線通信回線などを含んでもよい。通信ネットワーク１０は、（ｉ）携帯電話回線網などの移動体通信網を含んでもよく、（ｉｉ）無線ＭＡＮ（例えば、ＷｉＭＡＸ（登録商標）である。）、無線ＬＡＮ（例えば、ＷｉＦｉ（登録商標）である。）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、Ｚｉｇｂｅｅ（登録商標）、ＮＦＣ（ＮｅａｒＦｉｅｌｄＣｏｍｍｕｎｉｃａｔｉｏｎ）などの無線通信網を含んでもよい。

本実施形態において、ユーザ２０は、車両１１０の利用者であってよい。ユーザ２０は、車両１１０の運転者であってもよく、当該運転者の同乗者であってもよい。ユーザ２０は、車両１１０の所有者であってもよく、車両１１０の占有者であってもよい。車両１１０の占有者は、車両１１０のレンタルサービス又はシェアサービスの利用者であってもよい。

本実施形態において、通信端末３０は、車両１１０及び支援サーバ１２０の少なくとも一方と情報を送受することができればよく、その詳細については特に限定されない。通信端末３０としては、パーソナルコンピュータ、携帯端末などが例示される。携帯端末としては、携帯電話、スマートフォン、ＰＤＡ、タブレット、ノートブック・コンピュータ又はラップトップ・コンピュータ、ウエアラブル・コンピュータなどが例示される。

通信端末３０は、１又は複数の通信方式に対応していてもよい。通信方式としては、移動体通信方式、無線ＭＡＮ方式、無線ＬＡＮ方式、無線ＰＡＮ方式などが例示される。移動体通信方式としては、ＧＳＭ（登録商標）方式、３Ｇ方式、ＬＴＥ方式、４Ｇ方式、５Ｇ方式などが例示される。無線ＭＡＮ方式としては、ＷｉＭＡＸ（登録商標）が例示される。無線ＬＡＮ方式としては、ＷｉＦｉ（登録商標）が例示される。無線ＰＡＮ方式としては、Ｂｌｕｅｔｏｏｔｈ（登録商標）、Ｚｉｇｂｅｅ（登録商標）、ＮＦＣ（ＮｅａｒＦｉｅｌｄＣｏｍｍｕｎｉｃａｔｉｏｎ）などが例示される。

本実施形態において、対話型エージェントシステム１００は、ユーザ２０の音声及びジェスチャの少なくとも一方により示される要求を取得し、当該要求に応じた処理を実行する。ジェスチャとしては、身振り、手振り、仕草、顔の向き、視線の向き、顔の表情などが例示される。また、対話型エージェントシステム１００は、上記の処理の結果をユーザ２０に伝達する。対話型エージェントシステム１００は、対話型エージェントシステム１００のインタフェースとして機能するエージェントと、ユーザ２０との間の対話型のインストラクションを介して、上記の要求の取得及び結果の伝達を実行してよい。

エージェントは、ユーザ２０への情報の伝達に利用される。ユーザ２０と、エージェントとのインタラクションにより、言語情報だけでなく、非言語情報も伝達され得る。これにより、より円滑な情報伝達が達成され得る。エージェントは、ソフトウエアエージェントであってもよく、ハードウエアエージェントであってもよい。なお、エージェントは、ＡＩアシスタントと称される場合もある。

ソフトウエアエージェントは、コンピュータにより実現される擬人化エージェントであってよい。上記のコンピュータは、通信端末３０及び車両１１０の少なくとも一方に搭載されたコンピュータであってよい。擬人化エージェントは、例えば、コンピュータの表示装置又は投影装置上に表示又は投影され、ユーザ２０とコミュニケーションを図ることができる。擬人化エージェントは、音声により、ユーザ２０とコミュニケーションを図ってもよい。ハードウエアエージェントは、ロボットであってよい。ロボットは、ヒューマノイド型のロボットであってもよく、ペット型のロボットであってもよい。

エージェントは、顔を有してもよい。「顔」には、人間又は動物の顔だけでなく、顔の同等物が含まれてもよい。顔の同等物は、顔と同様の機能を有するものであってよい。顔の機能としては、感情を伝達する機能、注視点を示す機能などが例示される。

エージェントは、目を有してもよい。「目」には、人間又は動物の眼だけでなく、眼の同等物が含まれてもよい。眼の同等物は、眼と同様の機能を有するものであってよい。眼の機能としては、感情を伝達する機能、注視点を示す機能などが例示される。

なお、「対話」には、言語情報によるコミュニケーションだけでなく、非言語情報によるコミュニケーションが含まれてよい。言語情報によるコミュニケーションとしては、（ｉ）会話、（ｉｉ）手話、（ｉｉｉ）ジェスチャと、当該ジェスチャによる伝達内容とが予め定義されたサイン又はサイン音などが例示される。非言語情報によるコミュニケーションとしては、身振り、手振り、仕草、顔の向き、視線の向き、顔の表情などが例示される。

本実施形態において、対話型エージェントシステム１００は、応答システム１１２に実装された対話エンジン（図示されていない。ローカル型対話エンジンと称される場合がある。）と、支援サーバ１２０に実装された対話エンジン（図示されていない。クラウド型対話エンジンと称される場合がある。）とを備える。音声認識、ジェスチャ認識などによりユーザ２０からの要求が検出された場合、対話型エージェントシステム１００は、ローカル型対話エンジン及びクラウド型対話エンジンの何れの対話エンジンを利用して上記の要求に応答するかを決定してよい。

ローカル型対話エンジン及びクラウド型対話エンジンは、物理的に異なる対話エンジンであってよい。ローカル型対話エンジン及びクラウド型対話エンジンは、性能の異なる対話エンジンであってよい。一実施形態において、ローカル型対話エンジンが認識できる要求の種類の数は、クラウド型対話エンジンが認識できる要求の種類の数よりも少ない。他の実施形態において、ローカル型対話エンジンが処理できる要求の種類の数は、クラウド型対話エンジンが認識できる処理の種類の数よりも少ない。クラウド型対話エンジンは、第１要求処理装置の一例であってよい。ローカル型対話エンジンは、第２要求処理装置の一例であってよい。

本実施形態によれば、対話型エージェントシステム１００は、車両１１０及び支援サーバ１２０の間の通信状態に基づいて、ローカル型対話エンジン及びクラウド型対話エンジンの何れの対話エンジンを利用するかを決定する。例えば、通信状態が比較的良好である場合、対話型エージェントシステム１００は、クラウド型対話エンジンを利用して、ユーザ２０の要求に応答する。一方、通信状態が比較的不良である場合、対話型エージェントシステム１００は、ローカル型対話エンジンを利用して、ユーザ２０の要求に応答する。これにより、車両１１０及び支援サーバ１２０の間の通信状態に応じて、ローカル型対話エンジンと、クラウド型対話エンジンとが切り替えられ得る。

対話型エージェントシステム１００は、応答システム１１２の状態に基づいて、エージェントの様態を決定してよい。これにより、応答システム１１２の状態に応じて、エージェントの様態が切り替わり得る。応答システム１１２の状態としては、（ｉ）応答システム１１２が停止している状態（ＯＦＦ状態と称される場合がある）、（ｉｉ）応答システム１１２が作動している状態（ＯＮ状態と称される場合がある）であって、対話エンジンによる応答処理を開始するための要求（起動要求と称される場合がある。）を待ち受けている状態（スタンバイ状態と称される場合がある。）、（ｉｉｉ）ＯＮ状態であって、対話エンジンによる応答処理が実行されている状態（起動状態と称される場合がある。）などが例示される。

スタンバイ状態は、起動要求を受け付け、当該起動要求を処理するための状態であってもよい。起動状態は、エージェントを介して起動要求以外の要求を処理するための状態であってもよい。

起動要求は、エージェントを起動させるための要求であってもよく、エージェントを介した応答処理を開始するための要求であってもよく、対話エンジンの音声認識機能又はジェスチャ認識機能を起動又は有効化するための要求であってもよい。起動要求は、応答システム１１２の状態を、スタンバイ状態から起動状態に変更するための要求であってよい。起動要求は、起動ワード、トリガーフレーズなどと称される場合がある。起動要求は、音声に限定されない。起動要求は、予め定められたジェスチャであってもよく、起動要求を入力するための操作であってもよい。

上記の応答システム１１２の状態の少なくとも１つは、さらに細分化されていてもよい。例えば、対話エンジンによる応答処理が実行されている状態は、ローカル型対話エンジンがユーザ２０の要求を処理している状態と、クラウド型対話エンジンがユーザ２０の要求を処理している状態とに細分化され得る。これにより、例えば、対話型エージェントシステム１００は、ローカル型対話エンジンがユーザ２０の要求を処理している場合と、クラウド型対話エンジンがユーザ２０の要求を処理している場合とで、エージェントの様態を切り替えることができる。

エージェントの様態としては、エージェントとして利用されるキャラクタの種類、当該キャラクタの外観、当該キャラクタの声、及び、インタラクションの様態の少なくとも１つが例示される。キャラクタとしては、実在する人物、動物又は物体をモデルにしたキャラクタ、歴史上の人物、動物又は物体をモデルにしたキャラクタ、架空の又は空想上の人物、動物又は物体をモデルにしたキャラクタなどが例示される。上記の物体は、有体物であってもよく、無体物であってもよい。キャラクタは、上記の人物、動物又は物体の一部をモデルにしたキャラクタであってもよい。

外観としては、（ｉ）形状、模様、色彩及びこれらの組み合わせ、（ｉｉ）デフォルメ、誇張又は変形の手法及び程度、並びに、（ｉｉｉ）画像の画風の少なくとも１つが例示される。形状としては、容姿、髪型、服装、アクセサリ、表情及び姿勢の少なくとも１つが例示される。デフォルメの手法としては、頭身比率の変更、パーツの配置の変更、パーツの簡素化などが例示される。画風としては、画像全体の色合い、タッチなどが例示される。タッチとしては、写実的なタッチ、イラスト風のタッチ、漫画風のタッチ、アメリカンコミック風のタッチ、劇画風のタッチ、シリアスなタッチ、コメディ調のタッチなどが例示される。

例えば、同一のキャラクタであっても、年齢によって外観が異なる場合がある。幼少期、青年期、壮年期、中年期、老年期、及び、晩年期の少なくとも２つにおいて、キャラクタの外観が異なってもよい。また、同一のキャラクタであっても、デフォルメの程度が進行するにつれて、外観が幼く見える場合がある。例えば、同一のキャラクタの外観の画像であって、頭身比率の異なる２つの画像を比較すると、頭身比率が小さい画像中のキャラクタは、頭身比率が大きい画像中のキャラクタよりも幼く見える。

声としては、声質、声色（トーンと称される場合がある）、及び、声の高さ（ピッチと称される場合がある）の少なくとも１つが例示される。インタラクションの様態としては、応答時の話し方及び仕草の少なくとも一方が例示される。話し方としては、声量、口調、テンポ、１回あたりの発話の長さ、間の取り方、抑揚のつけ方、強弱のつけ方、相槌の打ち方、癖、及び、話題の展開方法の少なくとも１つが例示される。なお、ユーザ２０及びエージェントの間のインタラクションが手話により実現される場合の話し方の具体例は、ユーザ２０及びエージェントの間のインタラクションが会話により実現される場合の話し方の具体例と同様であってよい。

一般的に、クラウド型対話エンジンは、ローカル型対話エンジンよりも機能が豊富であり、処理可能な要求の数も多く、認識精度も高い。そのため、車両１１０の移動、車両１１０又は支援サーバ１２０における通信障害などにより、車両１１０及び支援サーバ１２０の間の通信状態が悪化し、対話エンジンがクラウド型対話エンジンからローカル型対話エンジンに切り替わると、応答の品質が低下する。その結果、ユーザ２０のユーザ体験が劣化する可能性がある。

本実施形態によれば、対話エンジンがクラウド型対話エンジンからローカル型対話エンジンに切り替わると、エージェントの様態も変化する。これにより、ユーザ２０は、エージェントとの対話中に、当該エージェントの現在の状態を感覚的に理解することができる。その結果、ユーザ２０のユーザ体験の劣化が抑制され得る。

なお、本実施形態においては、応答システム１１２が車両１１０に実装された対話型の車両用運転支援装置である場合を例として、対話型エージェントシステム１００の詳細が説明される。しかしながら、対話型エージェントシステム１００は本実施形態に限定されない。他の実施形態において、応答システム１１２が実装される機器は車両に限定されない。応答システム１１２は、据付式の機器、移動式の機器（移動体と称される場合がある）、又は、携帯式若しくは可搬式の機器に実装されてよい。応答システム１１２は、情報を出力する機能と、通信機能とを備えた機器に実装されることが好ましい。例えば、応答システム１１２は、通信端末３０に実装され得る。応答システム１１２が実装された機器は、エージェント装置、制御装置及び第２要求処理装置の一例であってよい。

据付式の機器としては、デスクトップ型のＰＣ、テレビ、スピーカ、冷蔵庫などの電化製品が例示される。移動式の機器としては、車両、作業機械、船舶、飛行体などが例示される。携帯式若しくは可搬式の機器としては、携帯電話、スマートフォン、ＰＤＡ、タブレット、ノートブック・コンピュータ又はラップトップ・コンピュータ、ウエアラブル・コンピュータ、モバイルバッテリなどが例示される。

［対話型エージェントシステム１００の各部の概要］
本実施形態において、車両１１０は、ユーザ２０の移動に利用される。車両１１０としては、自動車、自動二輪車などが例示される。自動二輪車としては、（ｉ）バイク、（ｉｉ）三輪バイク、（ｉｉｉ）セグウェイ（登録商標）、動力ユニット付きキックボード（登録商標）、動力ユニット付きスケートボードのような、動力ユニットを有する立ち乗り二輪車などが例示される。

本実施形態において、応答システム１１２は、ユーザ２０の音声及びジェスチャの少なくとも一方により示される要求を取得する。応答システム１１２は、上記の要求に応じた処理を実行する。また、応答システム１１２は、上記の処理の結果をユーザ２０に伝達する。

一実施形態において、応答システム１１２は、ユーザ２０が車両１１０に搭載された機器に入力した要求を取得する。応答システム１１２は、車両１１０に搭載された機器を介して、上記の要求に対する応答を、ユーザ２０に提示する。他の実施形態において、応答システム１１２は、ユーザ２０が通信端末３０に搭載された機器に入力した要求を、通信システム１１４を介して取得する。応答システム１１２は、上記の要求に対する応答を、通信システム１１４を介して通信端末３０に送信する。通信端末３０は、応答システム１１２から取得した情報を、ユーザ２０に提示する。

一実施形態において、応答システム１１２は、（ｉ）ユーザ２０が車両１１０に搭載された機器に入力した要求、又は、（ｉｉ）ユーザ２０が通信端末３０に搭載された機器に入力した要求を取得する。応答システム１１２は、ユーザ２０が通信端末３０に搭載された機器に入力した要求を、通信システム１１４を介して取得してよい。応答システム１１２は、車両１１０に搭載された情報出力機器を介して、上記の要求に対する応答を、ユーザ２０に提示する。

他の実施形態において、応答システム１１２は、（ｉ）ユーザ２０が車両１１０に搭載された機器に入力した要求、又は、（ｉｉ）ユーザ２０が通信端末３０に搭載された機器に入力した要求を取得する。応答システム１１２は、ユーザ２０が通信端末３０に搭載された機器に入力した要求を、通信システム１１４を介して取得してよい。応答システム１１２は、上記の要求に対する応答を、通信システム１１４を介して通信端末３０に送信する。通信端末３０は、応答システム１１２から取得した情報を、ユーザ２０に提示する。

応答システム１１２は、ローカル型対話エンジンのユーザインタフェースとして機能してよい。応答システム１１２は、クラウド型対話エンジンのユーザインタフェースとして機能してよい。

本実施形態において、通信システム１１４は、通信ネットワーク１０を介して、車両１１０と、支援サーバ１２０との間で情報を送受する。通信システム１１４は、有線通信又は近距離無線通信により、車両１１０と、通信端末３０との間で情報を送受してもよい。

例えば、通信システム１１４は、応答システム１１２がユーザ２０から取得したユーザ２０に関する情報を、支援サーバ１２０に送信する。通信システム１１４は、通信端末３０がユーザ２０から取得したユーザ２０に関する情報を、支援サーバ１２０に送信してよい。通信システム１１４は、車両１１０に搭載された機器から車両１１０に関する情報を取得し、車両１１０に関する情報を支援サーバ１２０に送信してよい。通信システム１１４は、通信端末３０から通信端末３０に関する情報を取得し、通信端末３０に関する情報を支援サーバ１２０に送信してもよい。

また、通信システム１１４は、クラウド型対話エンジンが出力した情報を、支援サーバ１２０から受信する。通信システム１１４は、クラウド型対話エンジンが出力した情報を、応答システム１１２に転送する。通信システム１１４は、応答システム１１２が出力した情報を、通信端末３０に送信してもよい。

本実施形態において、支援サーバ１２０は、支援サーバ１２０のコンピュータを、クラウド型対話エンジンとして機能させるためのプログラムを実行する。これにより、支援サーバ１２０の上で、クラウド型対話エンジンが動作する。

本実施形態において、支援サーバ１２０は、通信ネットワーク１０を介して、ユーザ２０の音声及びジェスチャの少なくとも一方により示される要求を取得する。支援サーバ１２０は、上記の要求に応じた処理を実行する。また、支援サーバ１２０は、通信ネットワーク１０を介して、上記の処理の結果を応答システム１１２に通知する。

［対話型エージェントシステム１００の各部の具体的な構成］
対話型エージェントシステム１００の各部は、ハードウエアにより実現されてもよく、ソフトウエアにより実現されてもよく、ハードウエア及びソフトウエアにより実現されてもよい。対話型エージェントシステム１００の各部は、その少なくとも一部が、単一のサーバによって実現されてもよく、複数のサーバによって実現されてもよい。対話型エージェントシステム１００の各部は、その少なくとも一部が、仮想マシン上又はクラウドシステム上で実現されてもよい。対話型エージェントシステム１００の各部は、その少なくとも一部が、パーソナルコンピュータ又は携帯端末によって実現されてもよい。携帯端末としては、携帯電話、スマートフォン、ＰＤＡ、タブレット、ノートブック・コンピュータ又はラップトップ・コンピュータ、ウエアラブル・コンピュータなどが例示される。対話型エージェントシステム１００の各部は、ブロックチェーンなどの分散型台帳技術又は分散型ネットワークを利用して、情報を格納してもよい。

対話型エージェントシステム１００を構成する構成要素の少なくとも一部がソフトウエアにより実現される場合、当該ソフトウエアにより実現される構成要素は、一般的な構成の情報処理装置において、当該構成要素に関する動作を規定したプログラムを起動することにより実現されてよい。上記の情報処理装置は、例えば、（ｉ）ＣＰＵ、ＧＰＵなどのプロセッサ、ＲＯＭ、ＲＡＭ、通信インタフェースなどを有するデータ処理装置と、（ｉｉ）キーボード、タッチパネル、カメラ、マイク、各種センサ、ＧＰＳ受信機などの入力装置と、（ｉｉｉ）表示装置、スピーカ、振動装置などの出力装置と、（ｉｖ）メモリ、ＨＤＤなどの記憶装置（外部記憶装置を含む。）とを備える。

上記の情報処理装置において、上記のデータ処理装置又は記憶装置は、プログラムを格納してよい。上記のプログラムは、非一時的なコンピュータ可読記録媒体に格納されてよい。上記のプログラムは、プロセッサによって実行されることにより、上記の情報処理装置に、当該プログラムによって規定された動作を実行させる。

プログラムは、非一時的なコンピュータ可読記録媒体に格納されていてもよい。プログラムは、ＣＤ−ＲＯＭ、ＤＶＤ−ＲＯＭ、メモリ、ハードディスクなどのコンピュータ読み取り可能な媒体に記憶されていてもよく、ネットワークに接続された記憶装置に記憶されていてもよい。プログラムは、コンピュータ読み取り可能な媒体又はネットワークに接続された記憶装置から、対話型エージェントシステム１００の少なくとも一部を構成するコンピュータにインストールされてよい。プログラムが実行されることにより、コンピュータが、対話型エージェントシステム１００の各部の少なくとも一部として機能してもよい。

コンピュータを対話型エージェントシステム１００の各部の少なくとも一部として機能させるプログラムは、対話型エージェントシステム１００の各部の動作を規定したモジュールを備えてよい。これらのプログラム又はモジュールは、データ処理装置、入力装置、出力装置、記憶装置等に働きかけて、コンピュータを対話型エージェントシステム１００の各部として機能させたり、コンピュータに対話型エージェントシステム１００の各部における情報処理方法を実行させたりする。

プログラムに記述された情報処理は、当該プログラムがコンピュータに読込まれることにより、当該プログラムに関連するソフトウエアと、対話型エージェントシステム１００の各種のハードウエア資源とが協働した具体的手段として機能する。そして、上記の具体的手段が、本実施形態におけるコンピュータの使用目的に応じた情報の演算又は加工を実現することにより、当該使用目的に応じた対話型エージェントシステム１００が構築される。

［車両１１０の各部の概要］
図２は、車両１１０の内部構成の一例を概略的に示す。本実施形態において、車両１１０は、入力部２１０と、出力部２２０と、通信部２３０と、センス部２４０と、駆動部２５０と、付帯設備２６０と、制御部２７０とを備える。本実施形態において、制御部２７０は、入出力制御部２７２と、車両制御部２７４と、通信制御部２７６とを有する。本実施形態において、応答システム１１２は、入力部２１０、出力部２２０及び入出力制御部２７２により構成される。また、通信システム１１４は、通信部２３０及び通信制御部２７６により構成される。

入力部２１０は、入力部の一例であってよい。出力部２２０は、エージェント出力部の一例であってよい。制御部２７０は、制御装置及び第２要求処理装置の一例であってよい。入出力制御部２７２は、制御装置の一例であってよい。

本実施形態において、入力部２１０は、情報の入力を受け付ける。例えば、入力部２１０は、ユーザ２０からの要求を受け付ける。入力部２１０は、通信端末３０を介して、ユーザ２０からの要求を受け付けてもよい。

一実施形態において、入力部２１０は、車両１１０の操作に関する要求を受け付ける。車両１１０の操作に関する要求としては、センス部２４０の操作又は設定に関する要求、駆動部２５０の操作又は設定に関する要求、付帯設備２６０の操作又は設定に関する要求などが例示される。設定に関する要求としては、設定を変更するための要求、設定を確認するための要求などが例示される。他の実施形態において、入力部２１０は、ユーザ２０の音声及びジェスチャの少なくとも一方により示される要求を受け付ける。

入力部２１０としては、キーボード、ポインティングデバイス、タッチパネル、操作ボタン、マイク、カメラ、センサ、３次元スキャナ、視線計測器、ハンドル、アクセル、ブレーキ、シフトレバーなどが例示される。入力部２１０は、ナビゲーション装置の一部を構成してよい。

本実施形態において、出力部２２０は情報を出力する。出力部２２０は、例えば、ユーザ２０からの要求に対する対話型エージェントシステム１００の応答を、ユーザ２０に提示する。出力部２２０は、通信端末３０を介して、上記の応答をユーザ２０に提示してもよい。出力部２２０としては、画像出力装置、音声出力装置、振動発生装置、超音波発生装置などが例示される。出力部２２０は、ナビゲーション装置の一部を構成してよい。

画像出力装置は、エージェントの画像を表示又は投影する。画像は、静止画像であってもよく、動画像（映像と称される場合がある。）であってもよい。画像は、平面画像であってもよく、立体画像であってもよい。立体画像の方式は、特に限定されるものではないが、２眼立体方式、インテグラル方式、ホログラフィー方式などが例示される。

画像出力装置としては、表示装置、投影装置、印刷装置などが例示される。音声出力装置としては、スピーカ、ヘッドホン、イヤホンなどが例示される。スピーカは、指向性を有してもよく、指向性の向きを調整又は変更する機能を有してもよい。

本実施形態において、通信部２３０は、通信ネットワーク１０を介して、車両１１０と、支援サーバ１２０との間で情報を送受する。通信部２３０は、有線通信又は近距離無線通信により、車両１１０と、通信端末３０との間で情報を送受してもよい。通信部２３０は、１又は複数の通信方式に対応していてもよい。

本実施形態において、センス部２４０は、車両１１０の状態を検出又は監視する１又は複数のセンサを含む。１又は複数のセンサのそれぞれは、任意の内界センサであってもよく、任意の外界センサであってもよい。１又は複数のセンス部２４０の少なくとも一部は、入力部２１０として利用されてもよい。例えば、センス部２４０は、車両１１０の内部を撮像するカメラ、車両１１０の内部の音声を収集するマイク、車両１１０の外部を撮像するカメラ、及び、車両１１０の外部の音声を収集するマイクの少なくとも１つを含む。上記のカメラ又はマイクは、入力部２１０として利用されてよい。

車両１１０の状態としては、速度、加速度、傾斜、振動、騒音、駆動部２５０の作動状況、付帯設備２６０の作動状況、安全装置の作動状況、自動運転装置の作動状況、異常の発生状況、現在位置、移動経路、外気の温度、外気の湿度、外気の圧力、内部空間の温度、内部空間の湿度、内部空間の圧力、周囲の物体との相対位置、周囲の物体との相対速度などが例示される。安全装置としては、ＡＢＳ（ＡｎｔｉｌｏｃｋＢｒａｋｅＳｙｓｔｅｍ）、エアバッグ、自動ブレーキ、衝突回避装置などが例示される。

本実施形態において、駆動部２５０は、車両１１０を駆動する。駆動部２５０は、制御部２７０からの命令に応じて、車両１１０を駆動してよい。駆動部２５０は、内燃機関によって動力を発生させてもよく、電動機によって動力を発生させてもよい。

本実施形態において、付帯設備２６０は、車両１１０に搭載される機器のうち、駆動部２５０以外の機器であってよい。付帯設備２６０は、制御部２７０からの命令に従って作動してよい。付帯設備２６０は、ユーザ２０の操作に従って作動してもよい。付帯設備２６０としては、保安機器、座席調整機器、施錠管理機器、窓開閉機器、照明機器、空調機器、ナビゲーション機器、音響機器、映像機器などが例示される。

本実施形態において、制御部２７０は、車両１１０の各部を制御する。制御部２７０は、応答システム１１２を制御してもよい。制御部２７０は、通信システム１１４を制御してもよい。制御部２７０は、入力部２１０、出力部２２０、通信部２３０、センス部２４０、駆動部２５０及び付帯設備２６０の少なくとも１つを制御してもよい。また、制御部２７０の各部は、互いに情報を送受してよい。

本実施形態において、入出力制御部２７２は、車両１１０における情報の入出力を制御する。例えば、入出力制御部２７２は、ユーザ２０と、車両１１０との間における情報の伝達を制御する。入出力制御部２７２は、入力部２１０及び出力部２２０の少なくとも一方の動作を制御してよい。入出力制御部２７２は、応答システム１１２の動作を制御してもよい。

例えば、入出力制御部２７２は、入力部２１０を介して、ユーザ２０からの要求を含む情報を取得する。入出力制御部２７２は、上記の要求に対する応答を決定する。入出力制御部２７２は、応答の内容及び様態の少なくとも一方を決定してよい。入出力制御部２７２は、上記の応答に関する情報を出力する。一実施形態において、入出力制御部２７２は、出力部２２０を介して、上記の応答を含む情報をユーザ２０に提示する。他の実施形態において、入出力制御部２７２は、通信部２３０を介して、上記の応答を含む情報を通信端末３０に送信する。通信端末３０は、上記の応答を含む情報をユーザ２０に提示する。

入出力制御部２７２は、ローカル型対話エンジン及びクラウド型対話エンジンの少なくとも一方を利用して、上記の要求に対する応答を決定してよい。これにより、入出力制御部２７２は、応答システム１１２を、ローカル型対話エンジンのユーザインタフェースとして機能させることができる。また、入出力制御部２７２は、応答システム１１２を、クラウド型対話エンジンのユーザインタフェースとして機能させることができる。

入出力制御部２７２は、車両１１０及び支援サーバ１２０の間の通信状態を示す情報（通信情報と称される場合がある。）に基づいて、ローカル型対話エンジン及びクラウド型対話エンジンの何れの対話エンジンにおける処理の実行結果に基づいて応答するかを決定する。なお、入出力制御部２７２は、複数のローカル型対話エンジンを利用してもよく、複数のクラウド型対話エンジンを利用してもよい。この場合、入出力制御部２７２は、少なくとも通信情報に基づいて、どの対話エンジンにおける処理の実行結果に基づいて応答するかを決定してよい。入出力制御部２７２は、発話者又は運転者に応じて、どの対話エンジンにおける処理の実行結果に基づいて応答するかを決定してもよい。入出力制御部２７２は、同乗者の有無に応じて、どの対話エンジンにおける処理の実行結果に基づいて応答するかを決定してもよい。

一実施形態において、入出力制御部２７２は、通信情報に基づいて、ユーザ２０からの要求を処理する対話エンジンを決定する。この場合、ローカル型対話エンジン及びクラウド型対話エンジンの一方がユーザ２０からの要求を処理し、他方はユーザ２０からの要求を処理しない。

他の実施形態において、ローカル型対話エンジン及びクラウド型対話エンジンのそれぞれが、ユーザ２０からの要求に応じた処理を実行し、当該要求に対する応答の候補となる情報を入出力制御部２７２に出力する。入出力制御部２７２は、予め定められた期間内に得られた１又は複数の候補を利用して、ユーザ２０からの要求に対する応答を決定する。例えば、入出力制御部２７２は、予め定められたアルゴリズムに従って、１又は複数の候補のうちの１つを、ユーザ２０からの要求に対する応答として決定する。

なお、入出力制御部２７２又は対話エンジンがユーザ２０からの要求を受け付けた後、予め定められた期間内に、入出力制御部２７２が、支援サーバ１２０の上で動作するクラウド型対話エンジンにおける処理の実行結果を受信することができたか否かを示す情報は、通信情報の一例であってもよい。例えば、入出力制御部２７２が、ユーザ２０からの要求を受け付けた後、予め定められた期間内に、クラウド型対話エンジンにおける処理の実行結果を受信できない場合、入出力制御部２７２は、車両１１０及び支援サーバ１２０の間の通信状態が良好でないと判定することができる。

入出力制御部２７２は、例えば、通信制御部２７６から、通信情報を取得する。なお、通信情報は、（ｉ）通信部２３０、入出力制御部２７２又は通信制御部２７６と、支援サーバ１２０との間の通信状態を示す情報であってもよく、（ｉｉ）通信部２３０、入出力制御部２７２又は通信制御部２７６と、通信ネットワーク１０との間の通信状態を示す情報であってもよく、（ｉｉｉ）通信ネットワーク１０の通信状態を示す情報であってもよく、（ｉｖ）通信ネットワーク１０と、支援サーバ１２０との間の通信状態を示す情報であってもよく、（ｖ）車両１１０及び支援サーバ１２０の少なくとも一方における通信障害の有無を示す情報であってもよい。

入出力制御部２７２は、１又は複数のイベントの発生を検出し、検出されたイベントの種類に基づいて、応答システム１１２の動作を制御してもよい。一実施形態において、入出力制御部２７２は、起動要求の入力を検出する。起動要求の入力が検出された場合、入出力制御部２７２は、例えば、応答システム１１２の状態を、スタンバイ状態から起動状態に変更することを決定する。

他の実施形態において、入出力制御部２７２が、ユーザ２０の通信端末３０にメッセージを送信すべきイベント（伝言イベントと称される場合がある。）の発生を検出する。伝言イベントの発生が検出された場合、入出力制御部２７２は、例えば、通信ネットワーク１０を介して、ユーザ２０の通信端末３０に音声メッセージを送信することを決定する。

入出力制御部２７２は、ユーザ２０からの要求に応答するときのエージェントの様態を制御してよい。一実施形態において、入出力制御部２７２は、通信情報に基づいて、エージェントの様態を制御する。例えば、入出力制御部２７２は、車両１１０及び支援サーバ１２０の間の通信状態が予め定められた条件を満足する場合と、車両１１０及び支援サーバ１２０の間の通信状態が上記の条件を満足しない場合とで、エージェントの様態を切り替える。予め定められた条件は、通信状態が予め定められた特定の状態よりも良好であるという条件であってよい。

他の実施形態において、入出力制御部２７２は、ユーザ２０からの要求を処理した対話エンジンを示す情報に基づいて、エージェントの様態を制御する。例えば、入出力制御部２７２は、ローカル型対話エンジンにおける処理の実行結果に基づいて応答する場合と、クラウド型対話エンジンにおける処理の実行結果に基づいて応答する場合とで、エージェントの様態を切り替える。なお、上述のとおり、通信情報に基づいて、どの対話エンジンにおける処理の実行結果に基づいて応答するかが決定されてもよい。

他の実施形態において、入出力制御部２７２は、（ｉ）ユーザ２０による要求の伝達手段を示す情報、（ｉｉ）ユーザ２０による要求の伝え方を示す情報、並びに、（ｉｉｉ）要求伝達時のユーザ２０の心理状態、覚醒状態及び健康状態の少なくとも１つを示す情報の少なくとも１つに基づいて、エージェントの様態を制御する。要求の伝達手段としては、発話、手話、手話以外のジェスチャなどが例示される。手話以外のジェスチャとしては、手又は指の動作により定義されたサイン、頭部の動作により定義されたサイン、視線により定義されたサイン、顔表情により定義されたサインなどが例示される。

要求の伝え方としては、要求伝達時のユーザ２０の様子、要求の伝達に要した時間の長さ、要求の明確性の程度などが例示される。要求伝達時のユーザ２０の様子としては、（ｉ）発話又は手話の口調、癖、テンポ、及び、間の取り方、（ｉｉ）発話のアクセント、イントネーション、及び、声量、（ｉｉｉ）エージェント又は出力部２２０と、ユーザとの相対位置、並びに、（ｉｖ）注視点の位置の少なくとも１つが例示される。要求の明確性の程度としては、要求が端的に伝達されているか否か、要求を伝達するためのメッセージが冗長的であるか否かなどが例示される。

さらに他の実施形態において、入出力制御部２７２は、車両１１０の状態を示す情報に基づいて、エージェントの様態を制御する。車両１１０の状態は、車両１１０の移動状態、車両１１０の各部の動作状態、及び、車両１１０の内部空間の状態の少なくとも１つであってよい。

車両１１０の移動状態としては、現在位置、移動経路、速度、加速度、傾斜、振動、騒音、渋滞の有無又は程度、連続運転時間、急加速の有無又は頻度、急減速の有無又は頻度などが例示される。車両１１０の各部の動作状態としては、駆動部２５０の作動状況、付帯設備２６０の作動状況、安全装置の作動状況、自動運転装置の作動状況などが例示される。作動状況としては、正常動作中、停止中、メンテナンス中、異常発生中などが例示される。作動状況には、特定の機能の作動の有無又は頻度が含まれてもよい。

車両１１０の内部空間の状態としては、内部空間の温度、湿度、圧力、特定の化学物質の濃度、内部空間に存在するユーザ２０の人数、内部空間に存在する複数のユーザ２０の人間関係などが例示される。内部空間に存在するユーザ２０の人数を示す情報は、同乗者の有無を示す情報の一例であってよい。

本実施形態において、車両制御部２７４は、車両１１０の動作を制御する。例えば、車両制御部２７４は、センス部２４０が出力した情報を取得する。車両制御部２７４は、駆動部２５０及び付帯設備２６０の少なくとも一方の動作を制御してよい。車両制御部２７４は、センス部２４０が出力した情報に基づいて、駆動部２５０及び付帯設備２６０の少なくとも一方の動作を制御してもよい。

本実施形態において、通信制御部２７６は、車両１１０と外部の機器との間の通信を制御する。通信制御部２７６は、通信部２３０の動作を制御してよい。通信制御部２７６は、通信インタフェースであっってもよい。通信制御部２７６は、１又は複数の通信方式に対応してよい。通信制御部２７６は、車両１１０及び支援サーバ１２０の間の通信状態を検出又は監視してよい。通信制御部２７６は、上記の検出又は監視の結果に基づいて、通信情報を生成してよい。

通信情報としては、通信の可否、電波状況、通信品質、通信方式の種類、及び、通信キャリアの種類などに関する情報が例示される。電波状況としては、電波受信レベル、電波強度、ＲＳＣＰ（ＲｅｃｅｉｖｅｄＳｉｇｎａｌＣｏｄｅＰｏｗｅｒ）、ＣＩＤ（ＣｅｌｌＩＤ）などが例示される。通信品質としては、通信速度、データ通信のスループット、データ通信のレイテンシなどが例示される。

通信の可否に関し、例えば、通信ネットワーク１０、通信システム１１４及び支援サーバ１２０の少なくとも１つにおいて通信障害が発生している場合に、通信が可能でない（通信不可と称される場合がある。）と判断される。電波受信レベルが予め定められたレベルよりも小さい場合（例えば、圏外である場合）に、通信不可と判断されてもよい。通信の可否は、特定の電波状況又は通信品質に関する情報を取得する処理（試行と称される場合がある。）を複数回繰り返した結果に基づいて、判断されてもよい。

一実施形態によれば、予め定められた回数の試行のうち、電波状況又は通信品質が予め定められた第１の閾値よりも良好であった試行の割合が、予め定められた第２の閾値よりも大きい場合に、通信が可能である（通信可能と称される場合がある。）と判断される。それ以外の場合は、通信不可と判断される。他の実施形態によれば、予め定められた回数の試行のうち、電波状況又は通信品質が予め定められた第１の閾値よりも不良であった試行の割合が、予め定められた第２の閾値よりも大きい場合に、通信不可と判断される。それ以外の場合は、通信可能と判断される。

［入出力制御部２７２の各部の概要］
図３は、入出力制御部２７２の内部構成の一例を概略的に示す。本実施形態において、入出力制御部２７２は、音声情報取得部３１２と、画像情報取得部３１４と、操作情報取得部３１６と、車両情報取得部３１８と、通信情報取得部３２２と、転送部３３０と、要求処理部３４０と、応答管理部３５０と、エージェント情報格納部３６０とを備える。

通信情報取得部３２２は、通信情報取得部の一例であってよい。要求処理部３４０は、第２要求処理装置の一例であってよい。応答管理部３５０は、様態決定部及び処理装置決定部の一例であってよい。

本実施形態において、音声情報取得部３１２は、入力部２１０から、入力部２１０に入力された音声に関する情報（音声情報と称される場合がある。）を取得する。音声情報取得部３１２は、通信部２３０を介して、通信端末３０の入力装置に入力された音声に関する情報（音声情報と称される場合がある。）を取得してもよい。例えば、音声情報取得部３１２は、ユーザ２０の音声に関する情報を取得する。音声情報としては、音声が記録された音声データ、当該音声が記録された時刻を示す情報などが例示される。音声情報取得部３１２は、音声情報を転送部３３０に出力してよい。

本実施形態において、画像情報取得部３１４は、入力部２１０から、入力部２１０が取得した画像に関する情報（画像情報と称される場合がある。）を取得する。画像情報取得部３１４は、通信部２３０を介して、通信端末３０の入力装置が取得した画像に関する情報（画像情報と称される場合がある。）を取得してもよい。例えば、画像情報取得部３１４は、ユーザ２０を撮像した画像に関する情報を取得する。画像情報としては、画像が記録された画像データ、当該画像が記録された時刻を示す情報などが例示される。画像情報取得部３１４は、画像情報を転送部３３０に出力してよい。

本実施形態において、操作情報取得部３１６は、入力部２１０から、ユーザ２０による車両１１０の操作に関する情報（操作情報と称される場合がある。）を取得する。車両１１０の操作としては、駆動部２５０に関する操作、及び、付帯設備２６０に関する操作の少なくとも一方が例示される。一実施形態において、操作情報取得部３１６は、操作情報を転送部３３０に出力する。他の実施形態において、操作情報取得部３１６は、操作情報を車両制御部２７４に出力する。

駆動部２５０に関する操作としては、ハンドル操作、アクセル操作、ブレーキ操作、運転モードの変更に関する操作などが例示される。付帯設備２６０に関する操作としては、付帯設備２６０のＯＮ／ＯＦＦに関する操作、付帯設備２６０の設定に関する操作、付帯設備２６０の動作に関する操作、などが例示される。より具体的には、方向指示器に関する操作、ワイパーに関する操作、ウインドウォッシャー液の吐出に関する操作、ドアの施錠に関する操作、窓の開閉に関する操作、空調機器又は照明機器のＯＮ／ＯＦＦに関する操作、空調機器又は照明機器の設定に関する操作、ナビゲーション機器、音響機器又は映像機器のＯＮ／ＯＦＦに関する操作、ナビゲーション機器、音響機器又は映像機器の設定に関する操作、ナビゲーション機器、音響機器又は映像機器の動作の開始又は終了に関する操作などが例示される。

本実施形態において、車両情報取得部３１８は、センス部２４０から、車両１１０の状態を示す情報（車両情報と称される場合がある。）を取得する。一実施形態において、車両情報取得部３１８は、車両情報を転送部３３０に出力する。他の実施形態において、車両情報取得部３１８は、車両情報を車両制御部２７４に出力してよい。

本実施形態において、通信情報取得部３２２は、通信制御部２７６から、通信情報を取得する。一実施形態において、通信情報取得部３２２は、通信情報を応答管理部３５０に出力する。他の実施形態において、通信情報取得部３２２は、通信情報を転送部３３０又は要求処理部３４０に出力してよい。

本実施形態において、転送部３３０は、音声情報、画像情報、操作情報及び車両情報の少なくとも１つを、要求処理部３４０及び支援サーバ１２０の少なくとも一方に転送する。転送部３３０は、応答管理部３５０からの命令に従って、各種情報の転送先を決定してよい。転送部３３０は、操作情報を車両制御部２７４に転送してよい。転送部３３０は、操作情報及び車両情報を車両制御部２７４に転送してよい。

なお、本実施形態においては、通信情報取得部３２２が応答管理部３５０に通信情報を出力し、応答管理部３５０が、通信情報に基づいて、音声情報、画像情報、操作情報、車両情報などの転送先を決定する場合を例として、入出力制御部２７２の詳細が説明される。しかしながら、入出力制御部２７２は本実施形態に限定されない。他の実施形態において、通信情報取得部３２２は、転送部３３０に通信情報を出力し、転送部３３０が、通信情報に基づいて、音声情報、画像情報、操作情報、車両情報などの転送先を決定してもよい。

本実施形態において、要求処理部３４０は、ユーザ２０からの要求を取得し、当該要求に応じた処理を実行する。要求処理部３４０は、上記の要求に対する応答を決定する。例えば、要求処理部３４０は、応答の内容及び様態の少なくとも一方を決定する。要求処理部３４０は、上記の決定結果に基づいて、応答に関する情報を生成する。要求処理部３４０は、応答に関する情報を応答管理部３５０に出力する。

要求処理部３４０は、起動要求を検出してよい。起動要求が検出された場合、要求処理部３４０は、起動要求が検出されたことを示す情報を応答管理部３５０に出力してよい。これにより、応答システム１１２における応答処理が開始される。要求処理部３４０は、ローカル型対話エンジンの一例であってよい。要求処理部３４０の詳細は後述される。

なお、本実施形態においては、要求処理部３４０が、入力部２１０に入力されたユーザ２０の音声又はジェスチャによる要求を、有線通信又は近距離無線通信により取得し、当該要求に応じた処理を実行する場合を例として、要求処理部３４０の詳細が説明される。しかしながら、要求処理部３４０は本実施形態に限定されない。他の実施形態において、要求処理部３４０は、通信端末３０の入力装置に入力されたユーザ２０の音声又はジェスチャによる要求を、有線通信又は近距離無線通信により取得し、当該要求に応じた処理を実行する。この場合、通信端末３０は、応答システム１１２の一部を構成してもよい。

また、本実施形態においては、要求処理部３４０が車両１１０に配される場合を例として、要求処理部３４０の詳細が説明される。しかしながら、要求処理部３４０は本実施形態に限定されない。他の実施形態において、要求処理部３４０は通信端末３０に配されてよい。この場合、通信端末３０は、応答システム１１２の一部を構成してもよい。

本実施形態において、応答管理部３５０は、ユーザ２０からの要求に対する応答を管理する。応答管理部３５０は、ローカル型対話エンジン及びクラウド型対話エンジンの利用を管理してよい。例えば、応答管理部３５０は、転送部３３０の動作を制御して、ローカル型対話エンジン及びクラウド型対話エンジンの利用を管理する。応答管理部３５０は、応答の内容及び様態の少なくとも一方を管理してよい。

例えば、ユーザ２０からの要求が検索又は調査に関する要求である場合、応答管理部３５０は、出力部２２０から出力される応答メッセージの内容を管理する。応答管理部３５０は、エージェントが応答メッセージを出力するときのエージェントの様態を管理してよい。応答管理部３５０は、エージェント情報格納部３６０に格納された情報を参照して、出力部２２０から出力される音声及び画像の少なくとも一方を生成してよい。なお、ユーザ２０からの要求が車両１１０の制御に関する要求である場合、応答管理部３５０は、当該要求に応じて車両１１０を制御するための命令を、車両制御部２７４に出力してよい。応答管理部３５０の詳細は後述される。

本実施形態において、エージェント情報格納部３６０は、エージェントに関する各種の情報を格納する。エージェント情報格納部３６０の詳細は後述される。

図４は、要求処理部３４０の内部構成の一例を概略的に示す。本実施形態において、要求処理部３４０は、要求決定部４２０と、実行部４３０と、応答情報生成部４４０と、設定情報格納部４５０とを備える。

本実施形態によれば、理解を容易にすることを目的として、要求処理部３４０が、予め定められた１又は複数の種類の要求を認識し、その他の要求は認識しないように構成される場合を例として、要求処理部３４０の詳細が説明される。要求処理部３４０が認識することのできる要求は、要求処理部３４０が受け付けることのできる処理に対応する要求であってよい。

本実施形態によれば、理解を容易にすることを目的として、要求処理部３４０が、通信ネットワーク１０を利用しない処理は受け付ける一方で、通信ネットワーク１０を利用する処理は受け付けない場合を例として、要求処理部３４０の詳細が説明される。例えば、要求処理部３４０は、車両１１０の操作に関する処理を受け付けるが、インターネット上の情報を検索する処理を受け付けない。

本実施形態において、要求決定部４２０は、転送部３３０を介して、音声情報取得部３１２が取得した音声情報、及び、画像情報取得部３１４が取得した画像情報の少なくとも一方を取得する。要求決定部４２０は、音声情報取得部３１２が取得した音声情報、画像情報取得部３１４が取得した画像情報、操作情報取得部３１６が取得した操作情報、及び、車両情報取得部３１８が取得した車両情報の少なくとも１つを取得してもよい。要求決定部４２０は、（ｉ）音声情報及び画像情報の一方と、（ｉｉ）音声情報及び画像情報の他方、操作情報、並びに、車両情報の少なくとも１つとを取得してもよい。

要求決定部４２０は、上記の音声情報及び画像情報の少なくとも一方を解析して、特定の種類の要求（特定要求と称される場合がある。）を認識するための処理を実行する。要求決定部４２０は、設定情報格納部４５０に格納された情報を参照して、特定要求を認識してよい。特定要求としては、起動要求、応答システム１１２における応答処理を中止又は中断するための要求（中止要求と称される場合がある）、車両１１０の操作に関する要求などが例示される。車両１１０の操作に関する要求としては、センス部２４０の操作又は設定に関する要求、駆動部２５０の操作又は設定に関する要求、付帯設備２６０の操作又は設定に関する要求などが例示される。設定に関する要求としては、設定を変更するための要求、設定を確認するための要求などが例示される。

（ａ）特定要求が認識された場合、要求決定部４２０は、認識された特定要求の種類を示す情報を、実行部４３０に出力してよい。これにより、要求決定部４２０は、ユーザ２０の音声及びジェスチャの少なくとも一方により示される要求を取得することができる。

一方、（ｂ）起動要求が認識された後、特定要求が認識されない場合において、特定要求以外の要求が認識されたとき、要求決定部４２０は、要求処理部３４０では当該要求に応じることができないことを示す情報を、応答情報生成部４４０に出力してよい。また、（ｃ）起動要求が認識された後、特定要求が認識されない場合において、音声情報及び画像情報の少なくとも一方を解析しても要求を認識することができないとき、要求決定部４２０は、要求の認識が不能であることを示す情報を、応答情報生成部４４０に出力してよい。要求決定部４２０の詳細は後述される。

本実施形態において、実行部４３０は、要求決定部４２０から、認識された特定要求の種類を示す情報を取得する。実行部４３０は、認識された特定要求の種類に応じた処理を実行する。実行部４３０は、設定情報格納部４５０に格納された情報を参照して、上記の処理を決定してよい。実行部４３０は、例えば、実行結果を示す情報を、応答情報生成部４４０に出力する。実行部４３０は、処理が実行されたことを示す情報を、応答情報生成部４４０に出力してもよい。

本実施形態において、応答情報生成部４４０は、ユーザ２０からの要求に対する応答を決定する。応答情報生成部４４０は、応答の内容及び様態の少なくとも一方を決定してよい。応答情報生成部４４０は、決定された応答の内容及び様態の少なくとも一方を示す情報（応答情報と称される場合がある。）を生成してよい。応答情報生成部４４０は、生成された応答情報を、応答管理部３５０に出力してよい。

応答の内容としては、出力部２２０から出力される応答メッセージの種類又は内容、車両制御部２７４に送信される命令の種類又は内容などが例示される。応答メッセージとして、１又は複数の定型のメッセージが用意されている場合、応答メッセージの種類は、１又は複数の定型のメッセージのそれぞれを識別するための識別情報であってよい。命令の種類は、車両制御部２７４において実行可能な１又は複数の命令のそれぞれを識別するための識別情報であってよい。

応答の様態としては、出力部２２０が応答メッセージを出力するときのエージェントの様態、車両制御部２７４による車両１１０の制御の様態などが例示される。上述のとおり、エージェントの様態としては、エージェントとして利用されるキャラクタの種類、当該キャラクタの外観、当該キャラクタの声、及び、インタラクションの様態の少なくとも１つが例示される。車両１１０の制御の様態としては、急加速、急減速、急ハンドルなどの急な操作を抑制する態様などが例示される。

本実施形態において、設定情報格納部４５０は、要求処理部３４０の設定に関する各種の情報を格納する。例えば、設定情報格納部４５０は、特定要求の種類を識別するための識別情報と、当該特定要求を検出するための特徴を示す特徴情報とを対応づけて格納する。設定情報格納部４５０は、特定要求の種類を識別するための識別情報と、当該特定要求を検出するための特徴を示す特徴情報と、当該特定要求に応じた処理の内容及び様態の少なくとも一方を示す情報とを対応付けて格納してもよい。

図５は、要求決定部４２０の内部構成の一例を概略的に示す。本実施形態において、要求決定部４２０は、入力情報取得部５２０と、音声認識部５３２と、ジェスチャ認識部５３４と、判定部５４０とを備える。

本実施形態において、入力情報取得部５２０は、要求処理部３４０の入力となる情報を取得する。例えば、入力情報取得部５２０は、音声情報取得部３１２が取得した音声情報、及び、画像情報取得部３１４が取得した画像情報の少なくとも一方を取得する。入力情報取得部５２０は、音声情報取得部３１２が取得した音声情報、画像情報取得部３１４が取得した画像情報、操作情報取得部３１６が取得した操作情報、及び、車両情報取得部３１８が取得した車両情報の少なくとも１つを取得してもよい。入力情報取得部５２０は、（ｉ）音声情報及び画像情報の一方と、（ｉｉ）音声情報及び画像情報の他方、操作情報、並びに、車両情報の少なくとも１つとを取得してもよい。

本実施形態において、入力情報取得部５２０は、取得された音声情報を音声認識部５３２に転送する。入力情報取得部５２０は、取得された画像情報をジェスチャ認識部５３４に転送する。

なお、本実施形態においては、理解を容易にすることを目的として、入力情報取得部５２０が、音声情報及び画像情報の少なくとも一方を取得する場合を例として、要求決定部４２０の詳細が説明される。しかしながら、入力情報取得部５２０が車両情報を取得した場合、入力情報取得部５２０は、車両情報を、音声認識部５３２及びジェスチャ認識部５３４の少なくとも一方に転送してもよい。また、入力情報取得部５２０が操作情報を取得した場合、入力情報取得部５２０は、操作情報を車両制御部２７４に転送してもよい。

本実施形態において、音声認識部５３２は、音声情報を解析して、ユーザ２０の発話の内容を特定する。音声認識部５３２は、ユーザ２０の発話の内容を解析して、ユーザ２０の要求を認識する。音声認識部５３２は、特定要求以外の要求を認識しないように設定されてもよい。音声認識部５３２は、認識された要求の種類を示す情報を、判定部５４０に出力する。音声認識部５３２は、音声情報を解析したにもかかわらず、要求を認識することができなかった場合、要求の認識が不能であることを示す情報を、判定部５４０に出力してよい。

本実施形態において、ジェスチャ認識部５３４は、画像情報を解析して、ユーザ２０により示された１又は複数のジェスチャを抽出する。ジェスチャ認識部５３４は、抽出されたジェスチャを解析して、ユーザ２０の要求を認識する。ジェスチャ認識部５３４は、特定要求以外の要求を認識しないように設定されてもよい。ジェスチャ認識部５３４は、認識された要求の種類を示す情報を、判定部５４０に出力する。ジェスチャ認識部５３４は、画像情報を解析したにもかかわらず、要求を認識することができなかった場合、要求の認識が不能であることを示す情報を、判定部５４０に出力してよい。

本実施形態において、判定部５４０は、音声認識部５３２及びジェスチャ認識部５３４の少なくとも一方において認識された要求が、特定要求であるか否かを判定する。例えば、判定部５４０は、設定情報格納部４５０に格納された情報を参照して、音声認識部５３２及びジェスチャ認識部５３４の少なくとも一方において認識された要求が、特定要求であるか否かを判定する。

（ａ）音声認識部５３２及びジェスチャ認識部５３４の少なくとも一方において認識された要求が、特定要求であった場合、判定部５４０は、認識された特定要求の種類を示す情報を、実行部４３０に出力してよい。（ｂ）音声認識部５３２及びジェスチャ認識部５３４において認識された要求が、特定要求ではなかった場合、判定部５４０は、要求処理部３４０では当該要求に応じることができないことを示す情報を、応答情報生成部４４０に出力してよい。（ｃ）音声認識部５３２及びジェスチャ認識部５３４が要求を認識することができなかった場合、判定部５４０は、要求の認識が不能であることを示す情報を、応答情報生成部４４０に出力してよい。

図６は、応答管理部３５０の内部構成の一例を概略的に示す。本実施形態において、応答管理部３５０は、転送制御部６２０と、応答決定部６３０と、音声合成部６４２と、画像生成部６４４と、命令生成部６５０とを備える。本実施形態において、応答決定部６３０は、起動管理部６３２と、応答内容決定部６３４と、応答様態決定部６３６とを有する。

転送制御部６２０は、処理装置決定部の一例であってよい。応答決定部６３０は、処理装置決定部の一例であってよい。応答内容決定部６３４は、処理装置決定部の一例であってよい。応答様態決定部６３６は、様態決定部及び処理装置決定部の一例であってよい。音声合成部６４２は、音声メッセージ生成部の一例であってよい。

本実施形態において、転送制御部６２０は、転送部３３０の動作を制御する。転送制御部６２０は、転送部３３０の動作を制御するための命令を生成し、当該命令を転送部３３０に送信してよい。転送制御部６２０は、転送部３３０の設定を変更するための命令を生成し、当該命令を転送部３３０に送信してもよい。

例えば、転送制御部６２０は、通信情報取得部３２２から、通信情報を取得する。転送制御部６２０は、通信情報に基づいて、上記の命令を生成する。これにより、転送制御部６２０は、通信情報により示される通信状態に基づいて、応答システム１１２を、クラウド型対話エンジン及びローカル型対話エンジンの何れのユーザインタフェースとして機能させるかを決定することができる。

例えば、転送制御部６２０は、通信情報により示される通信状態が予め定められた条件を満足する場合、通信状態が良好であると判定する。一方、転送制御部６２０は、通信情報により示される通信状態が上記の予め定められた条件を満足しない場合、通信状態が不良であると判定する。予め定められた条件としては、通信が可能であるという条件、電波状況が特定の状況よりも良好であるという条件、通信品質が特定の品質よりも良好であるという条件などが例示される。

通信状態が良好であると判定された場合、転送制御部６２０は、転送部３３０に入力された情報が、通信部２３０を介して支援サーバ１２０に転送されるように、上記の命令を生成する。転送制御部６２０は、音声情報及び画像情報の少なくとも一方が支援サーバ１２０に転送されるように、上記の命令を生成してよい。これにより、ユーザ２０からの要求がクラウド型対話エンジンにおいて処理され得る。

一方、通信状態が不良であると判定された場合、転送制御部６２０は、転送部３３０に入力された情報が、要求処理部３４０に転送されるように、上記の命令を生成する。転送制御部６２０は、音声情報及び画像情報の少なくとも一方が要求処理部３４０に転送されるように、上記の命令を生成してよい。これにより、ユーザ２０からの要求がローカル型対話エンジンにおいて処理され得る。

なお、転送制御部６２０は、車両１１０及び支援サーバ１２０の間の通信状態にかかわらず、転送部３３０に入力された情報が、支援サーバ１２０及び要求処理部３４０の両方に転送されるように、上記の命令を生成してもよい。この場合において、車両１１０及び支援サーバ１２０の間の通信状態が不良であるときには、応答管理部３５０は、所定の期間内に、支援サーバ１２０により実現されるクラウド型対話エンジンからの回答を受領することができない。そのため、結果として、応答管理部３５０は、要求処理部３４０により実現されるローカル型対話エンジンからの回答を利用して、ユーザ２０からの要求に応答することになる。

転送制御部６２０は、操作情報が転送部３３０に入力された場合に、当該操作情報が車両制御部２７４に転送されるように、上記の命令を生成してもよい。これにより、車両１１０の操作に対するレスポンスが向上する。

本実施形態において、応答決定部６３０は、応答システム１１２による応答処理を管理する。例えば、応答決定部６３０は、応答処理が開始又は終了するタイミングを決定する。また、応答決定部６３０は、ユーザ２０からの要求に対する応答を決定する。応答決定部６３０は、ローカル型対話エンジン及びクラウド型対話エンジンの何れの出力に基づいて、ユーザ２０からの要求に応答するかを決定してもよい。応答決定部６３０は、転送制御部６２０を介して、転送部３３０の動作を制御してもよい。

本実施形態において、起動管理部６３２は、応答システム１１２による応答処理が開始又は終了するタイミグを管理する。起動管理部６３２は、応答システム１１２の状態に応じて、転送部３３０を制御してよい。

［応答システム１１２による応答処理を開始する手順］
例えば、起動管理部６３２は、下記の手順に従って、応答システム１１２による応答処理を開始する。本実施形態において、応答システム１１２が起動してスタンバイ状態に移行すると、起動管理部６３２は、要求処理部３４０が起動要求を検出することができるように、転送部３３０を制御する。具体的には、起動管理部６３２は、応答システム１１２がスタンバイ状態に移行したことを示す情報を、転送制御部６２０に出力する。

転送制御部６２０は、応答システム１１２がスタンバイ状態に移行したことを示す情報を取得すると、音声情報及び画像情報の少なくとも一方を要求処理部３４０に転送することを指示する命令を、転送部３３０に送信する。転送制御部６２０は、（ｉ）音声情報及び画像情報の一方と、（ｉｉ）音声情報及び画像情報の他方、操作情報及び車両情報の少なくとも１つとを要求処理部３４０に転送することを指示する命令を、転送部３３０に送信してもよい。

要求処理部３４０は、転送部３３０から情報が入力されると、少なくとも音声情報又は画像情報を解析して、ユーザ２０の発話、ジェスチャなどから起動要求を検出するための処理を開始する。要求処理部３４０は、起動要求を検出すると、起動要求が検出されたことを示す情報を、応答管理部３５０に出力する。

本実施形態において、起動管理部６３２は、要求処理部３４０から、起動要求が検出されたことを示す情報を取得する。起動要求が検出されたことに応じて、起動管理部６３２は、応答処理を開始することを決定する。

このとき、起動管理部６３２は、転送部３３０に入力された各種情報の少なくとも１つの転送先を決定してもよい。起動管理部６３２は、上記の転送先に要求処理部３４０が含まれるか否かを決定してよい。起動管理部６３２は、上記の転送先に支援サーバ１２０が含まれるか否かを決定してよい。起動管理部６３２は、通信情報取得部３２２から通信情報を取得し、当該通信情報に基づいて、転送部３３０に入力された各種情報の少なくとも１つの転送先を決定してもよい。

例えば、起動管理部６３２は、通信情報により示される通信状態が予め定められた第１条件を満足する場合、要求処理部３４０における要求認識処理に利用される情報の転送先に、要求処理部３４０が含まれることを決定する。第１条件としては、（ｉ）通信情報により示される通信状態が、予め定められた第１状態よりも不良である場合、（ｉｉ）通信情報により示される通信状態を表すパラメータの値又は区分が、予め定められた第１の値又は区分よりも、通信状態が良好であることを示している場合などが例示される。

なお、起動管理部６３２は、応答システム１１２による応答処理が実行されている間、音声情報及び画像情報の少なくとも一方の転送先に、要求処理部３４０が含まれることを決定してもよい。要求処理部３４０における要求認識処理に利用される情報は、音声情報及び画像情報の少なくとも一方であってよい。要求処理部３４０における要求認識処理に利用される情報は、（ｉ）音声情報及び画像情報の一方、及び、（ｉｉ）音声情報及び画像情報の他方、操作情報及び車両情報の少なくとも１つであってよい。

例えば、起動管理部６３２は、通信情報により示される通信状態が予め定められた第２条件を満足する場合、支援サーバ１２０における要求認識処理に利用される情報の転送先に、支援サーバ１２０が含まれることを決定する。第２条件としては、（ｉ）通信情報により示される通信状態が、予め定められた第２状態よりも良好である場合、（ｉｉ）通信情報により示される通信状態を表すパラメータの値又は区分が、予め定められた第２の値又は区分よりも、通信状態が良好であることを示している場合などが例示される。第２状態は、第１状態と同一の状態であってもよく、第１状態とは異なる状態であってもよい。

なお、起動管理部６３２は、応答システム１１２による応答処理が実行されている間、音声情報及び画像情報の少なくとも一方の転送先に、支援サーバ１２０が含まれることを決定してもよい。支援サーバ１２０における要求認識処理に利用される情報は、音声情報及び画像情報の少なくとも一方であってよい。支援サーバ１２０における要求認識処理に利用される情報は、（ｉ）音声情報及び画像情報の一方、及び、（ｉｉ）音声情報及び画像情報の他方、操作情報及び車両情報の少なくとも１つであってよい。

起動管理部６３２は、応答処理を開始することが決定されたことを示す情報を、転送制御部６２０に出力する。起動管理部６３２は、各情報の転送先を示す情報を、転送制御部６２０に出力してもよい。

転送制御部６２０は、応答処理を開始することが決定されたことを示す情報を取得すると、転送部３３０に入力される各種情報のそれぞれの転送先を決定する。一実施形態において、転送制御部６２０は、各情報の転送先を示す情報を起動管理部６３２から取得し、当該情報に基づいて、各情報の転送先を決定する。他の実施形態において、転送制御部６２０は、応答処理を開始することが決定されたことを示す情報を取得すると、予め定められた設定に従って、各情報の転送先を決定する。

転送制御部６２０は、転送先に関する設定の変更を指示する命令と、転送先に関する新たな設定に関する情報とを、転送部３３０に送信する。これにより、転送部３３０に入力された各種の情報が、車両１１０及び支援サーバ１２０の間の通信状態に応じた適切な対話エンジンに送信される。その結果、応答システム１１２が、ローカル型対話エンジン及びクラウド型対話エンジンの何れの出力に基づいて、ユーザ２０からの要求に応答するかが、決定され得る。

要求処理部３４０は、転送部３３０から情報が入力されると、少なくとも音声情報又は画像情報を解析して、ユーザ２０の発話、ジェスチャなどから特定要求を認識するための処理を開始する。要求処理部３４０は、特定要求を認識すると、認識された特定要求に応じた処理を実行し、当該特定要求に対する応答に関する情報を応答管理部３５０に出力する。

支援サーバ１２０は、転送部３３０から情報が入力されると、少なくとも音声情報又は画像情報を解析して、ユーザ２０の発話、ジェスチャなどからユーザ２０の要求を認識するための処理を開始する。要求処理部３４０は、ユーザ２０の要求を認識すると、認識された要求に応じた処理を実行し、当該要求に対する応答に関する情報を応答管理部３５０に出力する。

起動管理部６３２は、応答システム１１２による応答処理を開始させるための処理が完了すると、音声合成部６４２及び画像生成部６４４の少なくとも一方と、出力部２２０とを介して、応答システム１１２よる応答処理が実行中であることを、ユーザ２０に伝達する。例えば、起動管理部６３２は、エージェントの様態を、スタンバイ状態に対応する様態から、応答処理の実行中に対応する様態に切り替えることを決定する。

なお、本実施形態においては、要求処理部３４０が、音声情報又は画像情報を解析して起動要求を検出し、応答管理部３５０は、要求処理部３４０から、起動要求が検出されたことを示す情報を取得する場合を例として、応答管理部３５０の詳細が説明された。しかしながら、応答管理部３５０は本実施形態に限定されない。他の実施形態において、応答管理部３５０が、音声情報又は画像情報を解析して起動要求を検出してもよい。さらに他の実施形態において、支援サーバ１２０が、音声情報又は画像情報を解析して起動要求を検出し、応答管理部３５０は、支援サーバ１２０から、起動要求が検出されたことを示す情報を取得してもよい。

［応答システム１１２による応答処理を終了する手順］
例えば、起動管理部６３２は、下記の手順に従って、応答システム１１２による応答処理を終了する。一実施形態において、起動管理部６３２は、要求処理部３４０及び支援サーバ１２０の少なくとも一方から、中止要求が検出されたことを示す情報を取得する。中止要求が検出された場合、起動管理部６３２は、応答システム１１２をスタンバイ状態に移行させることを決定する。起動管理部６３２は、応答システム１１２をスタンバイ状態に移行させることを示す情報を、転送制御部６２０及び要求処理部３４０に出力する。起動管理部６３２は、応答システム１１２をスタンバイ状態に移行させることを示す情報を、支援サーバ１２０に出力してもよい。

転送制御部６２０は、応答システム１１２をスタンバイ状態に移行させることを示す情報を取得すると、（ｉ）音声情報及び画像情報の少なくとも一方を要求処理部３４０に転送することを指示する命令、及び、（ｉｉ）支援サーバ１２０への情報の転送を中止することを指示する命令の少なくとも一方を、転送部３３０に送信する。転送制御部６２０は、（ｉ）音声情報及び画像情報の一方と、（ｉｉ）音声情報及び画像情報の他方、操作情報及び車両情報の少なくとも１つとを要求処理部３４０に転送することを指示する命令を、転送部３３０に送信してもよい。

要求処理部３４０は、応答システム１１２をスタンバイ状態に移行させることを示す情報を取得すると、少なくとも音声情報又は画像情報を解析して、ユーザ２０の発話、ジェスチャなどから起動要求を検出するための処理を開始する。このとき、要求処理部３４０は、起動要求以外の要求を認識しなくてもよい。これにより、制御部２７０の計算機能力及び電力の消費が抑制される。

他の実施形態において、ローカル型対話エンジン及びクラウド型対話エンジンは、応答処理中に、ユーザ２０の活動レベルを判定する。例えば、（ｉ）ローカル型対話エンジン及びクラウド型対話エンジンの少なくとも一方が要求を認識する頻度、（ｉｉ）ユーザ２０の音声の大きさ、並びに、（ｉｉｉ）ユーザ２０のジェスチャの変化の大きさの少なくとも１つが、予め定められた値よりも小さな状態が、一定時間継続した場合、ローカル型対話エンジン及びクラウド型対話エンジンは、応答処理中に、ユーザ２０の活動レベルが低下したと判定する。

起動管理部６３２は、要求処理部３４０及び支援サーバ１２０の少なくとも一方から、ユーザ２０の活動レベルが低下していることを示す情報を取得する。ユーザ２０の活動レベルの低下が検出された場合、起動管理部６３２は、応答システム１１２をスタンバイ状態に移行させることを決定する。起動管理部６３２は、上記の実施形態における手順と同様の手順により、応答システム１１２をスタンバイ状態に移行させてよい。

本実施形態において、応答内容決定部６３４は、ユーザ２０からの要求に対する応答の内容を決定する。応答内容決定部６３４は、要求処理部３４０から、ローカル型対話エンジンが決定した応答の内容を示す情報を取得する。応答内容決定部６３４は、支援サーバ１２０から、クラウド型対話エンジンが決定した応答の内容を示す情報を取得する。これらの情報は、応答の候補として利用される。

一実施形態において、例えば、車両１１０及び支援サーバ１２０の間の通信状態が良好でない場合、応答内容決定部６３４は、要求が受け付けられた後、所定の期間内に、支援サーバ１２０から、クラウド型対話エンジンが決定した応答の内容を示す情報を取得することができない。この場合、応答内容決定部６３４は、ローカル型対話エンジンが決定した応答の内容を、ユーザ２０からの要求に対する応答の内容として決定する。その結果、本実施形態によれば、ユーザ２０からの要求に対する応答の内容が、車両１１０及び支援サーバ１２０の間の通信状態に基づいて決定される。

他の実施形態において、例えば、車両１１０及び支援サーバ１２０の間の通信状態が良好である場合、応答内容決定部６３４は、要求が受け付けられた後、所定の期間内に、要求処理部３４０から、ローカル型対話エンジンが決定した応答の内容を示す情報を取得することができない。この場合、応答内容決定部６３４は、クラウド型対話エンジンが決定した応答の内容を、ユーザ２０からの要求に対する応答の内容として決定する。その結果、本実施形態によれば、ユーザ２０からの要求に対する応答の内容が、車両１１０及び支援サーバ１２０の間の通信状態に基づいて決定される。

さらに他の実施形態において、応答内容決定部６３４は、要求が受け付けられた後、所定の期間内に、ローカル型対話エンジンが決定した応答の内容を示す情報と、クラウド型対話エンジンが決定した応答の内容を示す情報とを取得する。この場合、この場合、応答内容決定部６３４は、例えば、クラウド型対話エンジンが決定した応答の内容を、ユーザ２０からの要求に対する応答の内容として決定する。

本実施形態において、応答様態決定部６３６は、ユーザ２０からの要求に対する応答の様態を決定する。応答様態決定部６３６は、要求処理部３４０から、ローカル型対話エンジンが決定した応答の様態を示す情報を取得する。応答様態決定部６３６は、支援サーバ１２０から、クラウド型対話エンジンが決定した応答の様態を示す情報を取得する。これらの情報は、応答の候補として利用される。

一実施形態において、例えば、車両１１０及び支援サーバ１２０の間の通信状態が良好でない場合、応答様態決定部６３６は、要求が受け付けられた後、所定の期間内に、支援サーバ１２０から、クラウド型対話エンジンが決定した応答の内容を示す情報を取得することができない。この場合、応答様態決定部６３６は、ローカル型対話エンジンが決定した応答の様態を、ユーザ２０からの要求に対する応答の様態として決定する。その結果、本実施形態によれば、ユーザ２０からの要求に対する応答の様態が、車両１１０及び支援サーバ１２０の間の通信状態に基づいて決定される。

他の実施形態において、例えば、車両１１０及び支援サーバ１２０の間の通信状態が良好である場合、応答様態決定部６３６は、要求が受け付けられた後、所定の期間内に、要求処理部３４０から、ローカル型対話エンジンが決定した応答の様態を示す情報を取得することができない。この場合、応答様態決定部６３６は、クラウド型対話エンジンが決定した応答の様態を、ユーザ２０からの要求に対する応答の様態として決定する。その結果、本実施形態によれば、ユーザ２０からの要求に対する応答の様態が、車両１１０及び支援サーバ１２０の間の通信状態に基づいて決定される。

さらに他の実施形態において、応答様態決定部６３６は、要求が受け付けられた後、所定の期間内に、ローカル型対話エンジンが決定した応答の様態を示す情報と、クラウド型対話エンジンが決定した応答の様態を示す情報とを取得する。この場合、この場合、応答様態決定部６３６は、例えば、クラウド型対話エンジンが決定した応答の様態を、ユーザ２０からの要求に対する応答の様態として決定する。

上述のとおり、応答の様態としては、出力部２２０が応答メッセージを出力するときのエージェントの様態、車両制御部２７４による車両１１０の制御の様態などが例示される。また、エージェントの様態としては、エージェントとして利用されるキャラクタの種類、当該キャラクタの外観、当該キャラクタの声、及び、インタラクションの様態の少なくとも１つが例示される。

一実施形態において、応答様態決定部６３６は、（ｉ）応答システム１１２又はエージェントが、クラウド型対話エンジンのユーザインタフェースとして機能する場合と、（ｉｉ）応答システム１１２又はエージェントが、ローカル型対話エンジンのユーザインタフェースとして機能する場合とで、エージェントの様態が異なるように、エージェントの様態を決定する。その結果、エージェントの様態が、車両１１０及び支援サーバ１２０の間の通信状態に基づいて決定される。

他の実施形態において、応答様態決定部６３６は、（ｉ）応答システム１１２又はエージェントが、クラウド型対話エンジンのユーザインタフェースとして機能する場合におけるエージェントの様態と、（ｉｉ）応答システム１１２又はエージェントが、ローカル型対話エンジンのユーザインタフェースとして機能する場合におけるエージェントの様態とを、予め決定しておいてよい。応答様態決定部６３６は、ローカル型対話エンジン及びクラウド型対話エンジンの何れの対話エンジンからの情報が、ユーザ２０からの要求に対する応答として採用されるかを決定する。応答様態決定部６３６は、上記の決定結果に基づいて、エージェントの様態を切り替える。その結果、エージェントの様態が、車両１１０及び支援サーバ１２０の間の通信状態に基づいて切り替えられる。

エージェントとして利用されるキャラクタの種類、及び、当該キャラクタに関する設定の少なくとも一方を適切に決定することで、対話エンジンがクラウド型対話エンジンからローカル型対話エンジンに切り替わり、応答の品質が低下した場合であっても、ユーザ体験の劣化が抑制され得る。特に、応答システム１１２が、移動式の機器、又は、携帯式若しくは可搬式の機器に実装される場合、当該機器の移動により、通信状態が大きく変化する。本実施形態によれば、このような場合であっても、ユーザ体験の劣化が大きく抑制され得る。

一実施形態において、応答様態決定部６３６は、（ｉ）応答システム１１２又はエージェントが、クラウド型対話エンジンのユーザインタフェースとして機能する場合と、（ｉｉ）応答システム１１２又はエージェントが、ローカル型対話エンジンのユーザインタフェースとして機能する場合とで、エージェントとして、同一の種類のキャラクタを利用することを決定してもよい。この場合において、応答様態決定部６３６は、（ｉ）応答システム１１２又はエージェントが、クラウド型対話エンジンのユーザインタフェースとして機能する場合に利用されるキャラクタの設定年齢を、（ｉｉ）応答システム１１２又はエージェントが、ローカル型対話エンジンのユーザインタフェースとして機能する場合に利用されるキャラクタの設定年齢よりも高くすることを決定してよい。

本実施形態によれば、応答システム１１２が、比較的性能の低いローカル型対話エンジンを利用して応答している場合、例えば、エージェントの外観及び声の少なくとも一方が幼くなる。これにより、ユーザ２０の期待値が低下する。また、出力部２２０から警告メッセージを出力する場合と比較して、ユーザ２０の不快感も軽減される。その結果、ユーザ体験の劣化が抑制される。

他の実施形態において、応答様態決定部６３６は、（ｉ）応答システム１１２又はエージェントが、クラウド型対話エンジンのユーザインタフェースとして機能する場合、エージェントのキャラクタとして、大人のキャラクタを利用することを決定してよい。一方、応答様態決定部６３６は、（ｉｉ）応答システム１１２又はエージェントが、ローカル型対話エンジンのユーザインタフェースとして機能する場合、エージェントのキャラクタとして、子供のキャラクタ、大人のキャラクタの幼少期のキャラクタ、又は、大人のキャラクタの外観がデフォルメされたキャラクタを利用することを決定してよい。本実施形態によれば、上記の実施形態の場合と同様の理由により、ユーザ体験の劣化が抑制される。

他の実施形態において、応答様態決定部６３６は、（ｉ）応答システム１１２又はエージェントが、クラウド型対話エンジンのユーザインタフェースとして機能する場合、エージェントの音声として、大人の音声又は大人のキャラクタの音声を利用することを決定してよい。一方、応答様態決定部６３６は、（ｉｉ）応答システム１１２又はエージェントが、ローカル型対話エンジンのユーザインタフェースとして機能する場合、エージェントの音声として、子供の音声又は子供のキャラクタの音声を利用することを決定してよい。本実施形態によれば、上記の実施形態の場合と同様の理由により、ユーザ体験の劣化が抑制される。

さらに実施形態において、応答様態決定部６３６は、（ｉ）応答システム１１２又はエージェントが、クラウド型対話エンジンのユーザインタフェースとして機能する場合と、（ｉｉ）応答システム１１２又はエージェントが、ローカル型対話エンジンのユーザインタフェースとして機能する場合とで、エージェントとして、異なる種類のキャラクタを利用することを決定してもよい。この場合において、応答様態決定部６３６は、（ｉ）応答システム１１２又はエージェントが、クラウド型対話エンジンのユーザインタフェースとして機能する場合に利用されるキャラクタとして、ユーザ２０に、勤勉である、誠実である、落ち着いている、冷静である、又は、大人っぽいという印象を与えるキャラクタを利用することを決定する。一方、応答様態決定部６３６は、（ｉｉ）応答システム１１２又はエージェントが、ローカル型対話エンジンのユーザインタフェースとして機能する場合、エージェントのキャラクタとして、幼い、可愛い、子供っぽい、ユーモアがある、好感がもてるという印象を与えるキャラクタを利用することを決定する。本実施形態によれば、上記の実施形態の場合と同様の理由により、ユーザ体験の劣化が抑制される。

音声合成部６４２は、ユーザ２０の要求に応答する音声メッセージを生成する。音声合成部６４２は、応答内容決定部６３４が決定した応答の内容と、応答様態決定部６３６が決定した応答の様態に基づいて、音声メッセージを生成してよい。応答システム１１２又はエージェントが、ローカル型対話エンジンのユーザインタフェースとして機能する場合、音声合成部６４２は、ユーザ２０からの要求の種類に基づいて予め定められた定型文を利用して、音声メッセージを生成してよい。音声合成部６４２は、生成された音声メッセージを出力部２２０に出力してよい。

画像生成部６４４は、ユーザ２０の要求に応答する画像（応答画像と称される場合がある。）を生成する。画像生成部６４４は、ユーザ２０の要求に応答するエージェントのアニメーション画像を生成してよい。画像生成部６４４は、応答内容決定部６３４が決定した応答の内容と、応答様態決定部６３６が決定した応答の様態に基づいて、応答画像を生成してよい。応答システム１１２又はエージェントが、ローカル型対話エンジンのユーザインタフェースとして機能する場合、画像生成部６４４は、ユーザ２０からの要求の種類に基づいて予め作成された画像を利用して、応答画像を生成してよい。画像生成部６４４は、生成された応答画像を出力部２２０に出力してよい。

なお、本実施形態においては、エージェントがソフトウエアエージェントであり、画像生成部６４４が、エージェントのアニメーション画像を生成する場合を例として、応答管理部３５０の詳細が説明された。しかしながら、応答管理部３５０は本実施形態に限定されない。他の実施形態において、エージェントがハードウエアエージェントである場合、応答管理部３５０は、エージェントの各部の駆動を制御する駆動制御部を有してよく、駆動制御部は、応答内容決定部６３４が決定した応答の内容と、応答様態決定部６３６が決定した応答の様態に基づいて、エージェントを駆動してよい。

命令生成部６５０は、車両１１０を操作するための命令を生成する。命令生成部６５０は、応答内容決定部６３４が決定した応答の内容に基づいて、操作の種類を決定してよい。命令生成部６５０は、応答様態決定部６３６が決定した応答の様態に基づいて、操作量又は操作モードを決定してよい。命令生成部６５０は、生成された命令を車両制御部２７４に出力してよい。

図７は、エージェント情報格納部３６０の内部構成の一例を概略的に示す。本実施形態において、エージェント情報格納部３６０は、設定データ格納部７２２と、音声データ格納部７３２と、画像データ格納部７３４とを備える。

本実施形態において、設定データ格納部７２２は、各エージェントの設定に関する情報を格納する。設定としては、年齢、性別、性格、ユーザ２０に与える印象などが例示される。本実施形態において、音声データ格納部７３２は、各エージェントの音声を合成するための情報（音声情報と称される場合がある。）を格納する。例えば、音声データ格納部７３２は、キャラクタごとに、コンピュータが当該キャラクタの声でメッセージを読み上げるためのデータを格納する。本実施形態において、画像データ格納部７３４は、各エージェントの画像を生成するための情報を格納する。例えば、画像データ格納部７３４は、キャラクタごとに、コンピュータが、当該キャラクタのアニメーション画像を動的に生成するためのデータを格納する。

［支援サーバ１２０の各部の概要］
図８は、支援サーバ１２０の内部構成の一例を概略的に示す。本実施形態において、支援サーバ１２０は、通信部８２０と、通信制御部８３０と、要求処理部８４０とを備える。本実施形態において、要求処理部８４０は、要求決定部８４２と、実行部８４４と、応答情報生成部８４６と、設定情報格納部８４８とを有する。要求処理部８４０は、第１要求処理装置の一例であってよい。

本実施形態の支援サーバ１２０によれば、ハードウエアと、ソフトウエアとの協働により、クラウド型対話エンジンが実現される。本実施形態において、通信部８２０は、通信部２３０と同様の構成を有してよい。例えば、通信部８２０は、通信ネットワーク１０を介して、車両１１０及び通信端末３０の少なくとも一方と、支援サーバ１２０との間で情報を送受する。本実施形態において、通信制御部８３０は、通信制御部２７６と同様の構成を有してよい。例えば、通信制御部８３０は、支援サーバ１２０と外部の機器との間の通信を制御する。通信制御部８３０は、通信部８２０の動作を制御してよい。

本実施形態において、要求処理部８４０は、要求決定部８４２がクラウド型対話エンジンを実現する点で、要求処理部３４０と相違する。上記の相違点以外の点につき、要求処理部８４０は、要求処理部３４０と同様の構成を有してよい。例えば、実行部８４４は、実行部４３０と同様の構成を有してよい。応答情報生成部８４６は、応答情報生成部４４０と同様の構成を有してよい。設定情報格納部８４８は、設定情報格納部４５０と同様の構成を有してよい。

本実施形態において、要求決定部８４２は、クラウド型対話エンジンを実現する点で、要求決定部４２０と相違する。上記の相違点以外の点につき、要求決定部８４２は、要求決定部４２０と同様の構成を有してよい。要求決定部８４２の詳細は後述される。

図９は、要求決定部８４２の内部構成の一例を概略的に示す。本実施形態において、要求決定部８４２は、入力情報取得部９２０と、音声認識部９３２と、ジェスチャ認識部９３４と、推定部９４０とを備える。本実施形態において、推定部９４０は、要求推定部９４２と、ユーザ状態推定部９４４と、車両状態推定部９４６とを有する。

要求決定部８４２は、判定部５４０の代わりに、推定部９４０を備える点で、要求決定部４２０と相違する。上記の相違点以外の点につき、要求決定部８４２は、要求決定部４２０と同様の構成を有してよい。例えば、入力情報取得部９２０は、入力情報取得部５２０と同様の構成を有してよい。音声認識部９３２は、音声認識部５３２と同様の構成を有してよい。ジェスチャ認識部９３４は、ジェスチャ認識部５３４と同様の構成を有してよい。

本実施形態において、入力情報取得部９２０は、要求処理部８４０の入力となる情報を取得する。例えば、入力情報取得部９２０は、音声情報取得部３１２が取得した音声情報、及び、画像情報取得部３１４が取得した画像情報の少なくとも一方を取得する。入力情報取得部９２０は、音声情報取得部３１２が取得した音声情報、画像情報取得部３１４が取得した画像情報、操作情報取得部３１６が取得した操作情報、及び、車両情報取得部３１８が取得した車両情報の少なくとも１つを取得してもよい。入力情報取得部９２０は、（ｉ）音声情報及び画像情報の一方と、（ｉｉ）音声情報及び画像情報の他方、操作情報、並びに、車両情報の少なくとも１つとを取得してもよい。

本実施形態において、入力情報取得部９２０は、取得された音声情報を音声認識部９３２に転送する。入力情報取得部５２０は、取得された画像情報をジェスチャ認識部９３４に転送する。入力情報取得部９２０は、取得された操作情報を推定部９４０に転送する。入力情報取得部９２０は、取得された車両情報を推定部９４０に転送する。入力情報取得部９２０は、取得された操作情報及び車両情報の少なくとも一方を、音声認識部９３２及びジェスチャ認識部の少なくとも一方に転送してもよい。

本実施形態において、音声認識部９３２は、音声情報を解析して、ユーザ２０の発話の内容を特定する。音声認識部９３２は、ユーザ２０の発話の内容を示す情報を、推定部９４０に出力する。音声認識部９３２は、発話の内容を解析して要求を認識する処理を実行してもよく、当該処理を実行しなくてもよい。

本実施形態において、ジェスチャ認識部９３４は、画像情報を解析して、ユーザ２０により示された１又は複数のジェスチャを抽出する。ジェスチャ認識部５３４は、抽出されたジェスチャを示す情報を、推定部９４０に出力する。ジェスチャ認識部９３４は、抽出されたジェスチャを解析して要求を認識する処理を実行してもよく、当該処理を実行しなくてもよい。

本実施形態において、推定部９４０は、ユーザ２０からの要求を認識又は推定する。推定部９４０は、ユーザ２０の状態を認識又は推定してよい。推定部９４０は、車両１１０の状態を認識又は推定してよい。

本実施形態において、要求推定部９４２は、ユーザ２０からの要求を認識又は推定する。要求推定部９４２は、特定要求を認識するだけでなく、特定要求以外の要求も認識又は推定できるように設定されてよい。一実施形態において、要求推定部９４２は、音声認識部９３２から、ユーザ２０の発話の内容を示す情報を取得する。要求推定部９４２は、ユーザ２０の発話の内容を解析して、ユーザ２０の要求を認識又は推定する。他の実施形態において、要求推定部９４２は、ジェスチャ認識部９３４から、画像情報の解析により抽出されたジェスチャを示す情報を取得する。要求推定部９４２は、抽出されたジェスチャを解析して、ユーザ２０の要求を認識又は推定する。

要求推定部９４２は、音声情報又は画像情報に加えて、音声情報及び画像情報以外の情報を利用して、ユーザ２０からの要求を認識又は推定してもよい。例えば、要求推定部９４２は、入力情報取得部９２０から、操作情報及び車両情報の少なくとも一方を取得する。要求推定部９４２は、ユーザ状態推定部９４４から、ユーザ２０の状態を示す情報を取得してもよい。要求推定部９４２は、車両状態推定部９４６から、車両１１０の状態を示す情報を取得してもよい。これらの情報が利用されることで、要求推定部９４２における認識又は推定の精度が向上し得る。

要求推定部９４２は、認識された要求の種類を示す情報を、実行部８４４に出力してよい。要求推定部９４２は、音声情報又は画像情報を解析したにもかかわらず要求を認識することができなかった場合、要求の認識が不能であることを示す情報を、応答情報生成部８４６に出力してよい。

本実施形態において、ユーザ状態推定部９４４は、ユーザ２０の状態を認識又は推定する。ユーザ状態推定部９４４は、音声情報、画像情報、操作情報及び車両情報の少なくとも１つに基づいて、ユーザ２０の状態を認識又は推定する。ユーザ２０の状態としては、ユーザ２０の心理状態、覚醒状態及び健康状態の少なくとも１つが例示される。ユーザ状態推定部９４４は、ユーザ２０の状態を示す情報を、要求推定部９４２に出力してよい。これにより、要求推定部９４２は、例えば要求の候補を絞ることができるので、要求推定部９４２の推定精度が向上し得る。

本実施形態において、車両状態推定部９４６は、車両１１０の状態を認識又は推定する。車両状態推定部９４６は、音声情報、画像情報、操作情報及び車両情報の少なくとも１つに基づいて、車両１１０の状態を認識又は推定する。上述のとおり、車両１１０の状態は、車両１１０の移動状態、車両１１０の各部の動作状態、及び、車両１１０の内部空間の状態の少なくとも１つであってよい。車両状態推定部９４６は、車両１１０の状態を示す情報を、要求推定部９４２に出力してよい。これにより、要求推定部９４２は、例えば要求の候補を絞ることができるので、要求推定部９４２の推定精度が向上し得る。

［エージェントの様態の一例］
図１０は、情報の出力様態の遷移の一例を概略的に示す。図１０は、応答システム１１２の状態に応じて、エージェントの外観が変化する様子の一例を概略的に示す。図１０に示される例において、画像１０２０は、クラウド型対話エンジンがユーザ２０の要求を処理している状態におけるエージェントの外観を示す画像の一例であってよい。画像１０４０は、ローカル型対話エンジンがユーザ２０の要求を処理している状態におけるエージェントの外観を示す画像の一例であってよい。

画像１０４０は、画像１０２０に描かれたキャラクタがデフォルメされた画像であってよい。本実施形態によれば、画像１０４０のキャラクタの頭身比率は、画像１０４０のキャラクタの頭身比率よりも小さい。これにより、画像１０４０に描かれたキャラクタは、画像１０２０に描かれたキャラクタよりも幼く見える。

本実施形態によれば、応答システム１１２の状態が、クラウド型対話エンジンがユーザ２０の要求を処理している状態から、ローカル型対話エンジンがユーザ２０の要求を処理している状態に遷移すると、出力部２２０が表示又は投影するエージェントの画像が、画像１０２０から画像１０４０に切り替わる。同様に、応答システム１１２の状態が、ローカル型対話エンジンがユーザ２０の要求を処理している状態から、クラウド型対話エンジンがユーザ２０の要求を処理している状態に遷移すると、出力部２２０が表示又は投影するエージェントの画像が、画像１０４０から画像１０２０に切り替わる。

本実施形態によれば、ユーザ２０は、対話エンジンの遷移を感覚的に理解することができる。また、ローカル型対話エンジンに対応する画像１０４０に描かれたキャラクタの年齢設定が、クラウド型対話エンジンに対応する画像１０２０に描かれたキャラクタの年齢設定よりも小さいことから、ローカル型対話エンジンがユーザ２０の要求を処理している場合であっても、対話エンジンに対するユーザ２０の期待値が低下する。その結果、ユーザ２０のユーザ体験の劣化が抑制され得る。

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。また、技術的に矛盾しない範囲において、特定の実施形態について説明した事項を、他の実施形態に適用することができる。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。

特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。

１０通信ネットワーク、２０ユーザ、３０通信端末、１００対話型エージェントシステム、１１０車両、１１２応答システム、１１４通信システム、１２０支援サーバ、２１０入力部、２２０出力部、２３０通信部、２４０センス部、２５０駆動部、２６０付帯設備、２７０制御部、２７２入出力制御部、２７４車両制御部、２７６通信制御部、３１２音声情報取得部、３１４画像情報取得部、３１６操作情報取得部、３１８車両情報取得部、３２２通信情報取得部、３３０転送部、３４０要求処理部、３５０応答管理部、３６０エージェント情報格納部、４２０要求決定部、４３０実行部、４４０応答情報生成部、４５０設定情報格納部、５２０入力情報取得部、５３２音声認識部、５３４ジェスチャ認識部、５４０判定部、６２０転送制御部、６３０応答決定部、６３２起動管理部、６３４応答内容決定部、６３６応答様態決定部、６４２音声合成部、６４４画像生成部、６５０命令生成部、７２２設定データ格納部、７３２音声データ格納部、７３４画像データ格納部、８２０通信部、８３０通信制御部、８４０要求処理部、８４２要求決定部、８４４実行部、８４６応答情報生成部、８４８設定情報格納部、９２０入力情報取得部、９３２音声認識部、９３４ジェスチャ認識部、９４０推定部、９４２要求推定部、９４４ユーザ状態推定部、９４６車両状態推定部、１０２０画像、１０４０画像

Claims

通信ネットワークを介してユーザの音声及びジェスチャの少なくとも一方により示される要求を取得し、当該要求に応じた処理を実行する第１要求処理装置のユーザインタフェースとして機能するエージェント装置を制御する制御装置であって、
前記第１要求処理装置、及び、前記エージェント装置の間の通信状態を示す通信情報を取得する通信情報取得部と、
前記通信情報取得部が取得した前記通信情報により示される前記通信状態に基づいて、前記エージェント装置による情報の提供に利用されるエージェントの様態を決定する様態決定部と、
を備える、制御装置。
前記エージェントの様態は、（ｉ）前記エージェントとして利用されるキャラクタの種類、（ｉｉ）前記キャラクタの外観、（ｉｉｉ）前記キャラクタの声、及び、（ｉｖ）前記キャラクタのインタラクションの様態の少なくとも１つである、
請求項１に記載の制御装置。
前記エージェント装置は、さらに、前記第１要求処理装置とは異なる第２要求処理装置のユーザインタフェースとして機能し、
前記第２要求処理装置は、
有線通信又は近距離無線通信により、前記エージェント装置から、前記ユーザの音声又はジェスチャによる要求を取得し、
当該要求に応じた処理を実行し、
前記制御装置は、
前記通信情報取得部が取得した前記通信情報により示される前記通信状態に基づいて、前記エージェント装置を、前記第１要求処理装置及び前記第２要求処理装置の何れのユーザインタフェースとして機能させるかを決定する処理装置決定部、
をさらに備える、
請求項１又は請求項２に記載の制御装置。
前記様態決定部は、（ｉ）前記エージェント装置を、前記第１要求処理装置のユーザインタフェースとして機能させることが決定された場合と、（ｉｉ）前記エージェント装置を、前記第２要求処理装置のユーザインタフェースとして機能させることが決定された場合とで、前記エージェントの様態が異なるように、前記エージェントの様態を決定する、
請求項３に記載の制御装置。
前記様態決定部は、
（ｉ）前記エージェント装置が、前記第１要求処理装置のユーザインタフェースとして機能する場合における前記エージェントの様態と、（ｉｉ）前記エージェント装置が、前記第２要求処理装置のユーザインタフェースとして機能する場合における前記エージェントの様態とを、予め決定しておき、
前記処理装置決定部の決定結果に基づいて、前記エージェントの様態を切り替える、
請求項３又は請求項４に記載の制御装置。
前記様態決定部は、
（ｉ）前記エージェント装置が、前記第１要求処理装置のユーザインタフェースとして機能する場合と、（ｉｉ）前記エージェント装置が、前記第２要求処理装置のユーザインタフェースとして機能する場合とで、同一の種類のキャラクタを利用することを決定し、
（ｉ）前記エージェント装置が、前記第１要求処理装置のユーザインタフェースとして機能する場合に利用される前記キャラクタの設定年齢を、（ｉｉ）前記エージェント装置が、前記第２要求処理装置のユーザインタフェースとして機能する場合に利用される前記キャラクタの設定年齢よりも高くすることを決定する、
請求項３から請求項５までの何れか一項に記載の制御装置。
前記様態決定部は、
（ｉ）前記エージェント装置が、前記第１要求処理装置のユーザインタフェースとして機能する場合、前記エージェントのキャラクタとして、大人のキャラクタを利用することを決定し、
（ｉｉ）前記エージェント装置が、前記第２要求処理装置のユーザインタフェースとして機能する場合、前記エージェントのキャラクタとして、子供のキャラクタ、前記大人のキャラクタの幼少期のキャラクタ、又は、前記大人のキャラクタの外観がデフォルメされたキャラクタを利用することを決定する、
請求項３から請求項６までの何れか一項に記載の制御装置。
前記様態決定部は、
（ｉ）前記エージェント装置が、前記第１要求処理装置のユーザインタフェースとして機能する場合、前記エージェントの音声として、大人の音声又は大人のキャラクタの音声を利用することを決定し、
（ｉｉ）前記エージェント装置が、前記第２要求処理装置のユーザインタフェースとして機能する場合、前記エージェントの音声として、子供の音声又は子供のキャラクタの音声を利用することを決定する、
請求項３から請求項７までの何れか一項に記載の制御装置。
前記制御装置は、
前記ユーザの前記要求に応答する音声メッセージを生成する音声メッセージ生成部、
をさらに備え、
前記音声メッセージ生成部は、前記エージェント装置が、前記第２要求処理装置のユーザインタフェースとして機能する場合、前記要求の種類に基づいて定められた定型文を利用して、前記音声メッセージを生成する、
請求項３から請求項８までの何れか一項に記載の制御装置。
前記第２要求処理装置が認識できる要求の種類の数は、前記第１要求処理装置が認識できる要求の種類の数よりも少ない、
請求項３から請求項９までの何れか一項に記載の制御装置。
前記第２要求処理装置が処理できる要求の種類の数は、前記第１要求処理装置が処理できる要求の種類の数よりも少ない、
請求項３から請求項１０までの何れか一項に記載の制御装置。
前記エージェント装置は、対話型の車両用運転支援装置である、
請求項１から請求項１１までの何れか一項に記載の制御装置。
ユーザの音声及びジェスチャの少なくとも一方により示される要求を取得し、当該要求に応じた処理を実行する要求処理装置のユーザインタフェースとして機能するエージェント装置であって、
請求項１から請求項１２までの何れか一項に記載の制御装置と、
前記制御装置の前記様態決定部が決定した様態に従って、前記エージェントの画像を表示又は投影するエージェント出力部と、
を備える、エージェント装置。
前記ユーザの音声及びジェスチャの少なくとも一方を示す情報を入力する入力部と、
前記ユーザに音声メッセージを出力する音声メッセージ出力部と、
をさらに備える、
請求項１３に記載のエージェント装置。
コンピュータを、請求項１から請求項１２までの何れか一項に記載の制御装置として機能させるための、プログラム。