JP7175221B2

JP7175221B2 - エージェント装置、エージェント装置の制御方法、およびプログラム

Info

Publication number: JP7175221B2
Application number: JP2019040964A
Authority: JP
Inventors: 基嗣久保田; 真也安原; 裕介大井; 昌宏暮橋
Original assignee: Honda Motor Co Ltd
Current assignee: Honda Motor Co Ltd
Priority date: 2019-03-06
Filing date: 2019-03-06
Publication date: 2022-11-18
Anticipated expiration: 2039-03-06
Also published as: CN111667823B; JP2020144618A; CN111667823A

Description

本発明は、エージェント装置、エージェント装置の制御方法、およびプログラムに関する。

従来、車両の乗員と対話を行いながら、乗員の要求に応じた運転支援に関する情報や車両の制御、その他のアプリケーション等を提供するエージェントに関する技術が開示されている（例えば、特許文献１参照）。

特開２００６－３３５２３１号公報

近年では、複数のエージェントを車両に搭載することについて実用化が進められている。また、エージェントが実行可能な機能は、逐次アップデートされる場合がある。しかしながら、あるエージェントに新機能が追加されたとしても、当該新機能をかねてより実行可能な他のエージェントが存在する場合には、乗員に新機能が追加されたエージェントによって新機能を実行させることが困難である場合があった。

本発明は、このような事情を考慮してなされたものであり、新機能を乗員が使用しやすくすることができるエージェント装置、エージェント装置の制御方法、およびプログラムを提供することを目的の一つとする。

この発明に係るエージェント装置、エージェント装置の制御方法、およびプログラムは、以下の構成を採用した。
（１）：この発明の一態様に係るエージェント装置は、車両の乗員の発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部と、前記複数のエージェント機能部のうち、前記乗員の発話に対応するエージェント機能部を選択する選択部とを備え、前記選択部は、前記複数のエージェント機能部のうち、１つのエージェント機能部に新たな機能が追加された場合において、前記新たに追加された機能を前記乗員に提供する場合、前記新たに追加された機能と同じ機能を既に有している他のエージェント機能部に対して優先的に、当該新たな機能が追加されたエージェント機能部による機能を前記乗員に提供させるものである。

（２）：この発明の他の態様に係るエージェント装置は、車両の乗員の発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部と、前記複数のエージェント機能部のうち、前記乗員の発話に対応するエージェント機能部を選択する選択部とを備え、前記複数のエージェント機能部には、車両機器に動作を指示する機能を有する車両エージェント機能部が含まれ、前記選択部は、前記複数のエージェント機能部のうち、前記車両エージェント機能部に新たな機能が追加された場合において、前記新たに追加された機能を前記乗員に提供する場合、前記新たに追加された機能と同じ機能を既に有している他のエージェント機能部に対して優先的に、当該新たな機能が追加された前記車両エージェント機能部による機能を前記乗員に提供させるものである。

（３）：上記（１）又は（２）の態様において、前記選択部は、前記複数のエージェント機能部のうち、特定のエージェント機能部を指定した問いかけであっても、前記新たに追加された機能を前記乗員に提供する場合、前記新たに追加された機能と同じ機能を既に有している他のエージェント機能部に対して優先的に、当該新たな機能が追加されたエージェント機能部による機能を前記乗員に提供させるものである。

（４）：上記（１）から（３）のいずれかの態様において、前記エージェント機能部は、前記複数のエージェント機能部のうち、少なくとも１つのエージェント機能部に新たな機能が追加された場合、前記新たな機能の詳細を特定しない問い合わせに応答して、前記新たに追加された機能に関する情報を前記乗員に提供するものである。

（５）：上記（１）から（４）のいずれかの態様において、前記エージェント機能部は、前記複数のエージェント機能部のうち、少なくとも１つのエージェント機能部に新たな機能が追加された場合、前記新たな機能とは無関係な応答をしている際に、前記新たに追加された機能に関する情報を前記乗員に提供するものである。

（６）：この発明の他の態様に係るエージェント装置の制御方法は、コンピュータが、複数のエージェント機能部のうちいずれかを起動させ、前記起動したエージェント機能部の機能として、車両の乗員の発話に応じて、音声による応答を含むサービスを提供し、前記複数のエージェント機能部のうち、前記乗員の発話に対応するエージェント機能部を選択し、前記複数のエージェント機能部のうち、１つのエージェント機能部に新たな機能が追加された場合において、前記新たに追加された機能を前記乗員に提供する場合、前記新たに追加された機能と同じ機能を既に有している他のエージェント機能部に対して優先的に、当該新たな機能が追加されたエージェント機能部による機能を前記乗員に提供させるものである。

（７）：この発明の他の態様に係るプログラムは、コンピュータに、複数のエージェント機能部のうちいずれかを起動させ、前記起動したエージェント機能部の機能として、車両の乗員の発話に応じて、音声による応答を含むサービスを提供させ、前記複数のエージェント機能部のうち、前記乗員の発話に対応するエージェント機能部を選択させ、前記複数のエージェント機能部のうち、１つのエージェント機能部に新たな機能が追加された場合において、前記新たに追加された機能を前記乗員に提供する場合、前記新たに追加された機能と同じ機能を既に有している他のエージェント機能部に対して優先的に、当該新たな機能が追加されたエージェント機能部による機能を前記乗員に提供させるものである。

（１）～（７）の態様によれば、新機能をユーザが使用しやすくすることができる。

エージェント装置１００を含むエージェントシステム１の構成図である。第１実施形態に係るエージェント装置１００の構成と、車両Ｍに搭載された機器とを示す図である。表示・操作装置２０の配置例を示す図である。スピーカユニット３０の配置例を示す図である。機能一覧情報１６２の内容の一例を示す図である。音像が定位する位置が定まる原理について説明するための図である。エージェントサーバ２００の構成と、エージェント装置１００の構成の一部とを示す図である。地図検索機能を提供する場合のエージェントと乗員の対話の一例を示す図である。ウエイクアップワードを含む発話ＣＶ３に対するエージェントの回答の一例を示す図である。エージェント装置１００の動作の一連の流れを示すフローチャートである。エージェント機能部１５０に優先度が付されている場合の、エージェント装置１００の動作の一連の流れを示すフローチャートである。新たに追加された機能に関する情報を提供する場合のエージェントと乗員の対話の一例を示す図である。エージェント装置１００の未実行の機能を紹介する処理の一連の流れを示すフローチャートである。

以下、図面を参照し、本発明のエージェント装置、エージェント装置の制御方法、およびプログラムの実施形態について説明する。エージェント装置は、エージェントシステムの一部または全部を実現する装置である。以下では、エージェント装置の一例として、車両（以下、車両Ｍ）に搭載され、複数種類のエージェント機能を備えたエージェント装置について説明する。エージェント機能とは、例えば、車両Ｍの乗員と対話をしながら、乗員の発話の中に含まれる要求（コマンド）に基づく各種の情報提供を行ったり、ネットワークサービスを仲介したりする機能である。複数種類のエージェントは、それぞれに果たす機能、処理手順、制御、出力態様・内容がそれぞれ異なってもよい。また、エージェント機能の中には、車両内の機器（例えば運転制御や車体制御に関わる機器）の制御等を行う機能を有するものがあってよい。

エージェント機能は、例えば、乗員の音声を認識する音声認識機能（音声をテキスト化する機能）に加え、自然言語処理機能（テキストの構造や意味を理解する機能）、対話管理機能、ネットワークを介して他装置を検索し、或いは自装置が保有する所定のデータベースを検索するネットワーク検索機能等を統合的に利用して実現される。これらの機能の一部または全部は、ＡＩ（Artificial Intelligence）技術によって実現されてよい。また、これらの機能を行うための構成の一部（特に、音声認識機能や自然言語処理解釈機能）は、車両Ｍの車載通信装置または車両Ｍに持ち込まれた汎用通信装置と通信可能なエージェントサーバ（外部装置）に搭載されてもよい。以下の説明では、構成の一部がエージェントサーバに搭載されており、エージェント装置とエージェントサーバが協働してエージェントシステムを実現することを前提とする。また、エージェント装置とエージェントサーバが協働して仮想的に出現させるサービス提供主体（サービス・エンティティ）をエージェントと称する。

＜全体構成＞
図１は、エージェント装置１００を含むエージェントシステム１の構成図である。エージェントシステム１は、例えば、エージェント装置１００と、複数のエージェントサーバ２００－１、２００－２、２００－３、…とを備える。符号の末尾のハイフン以下数字は、エージェントを区別するための識別子であるものとする。いずれのエージェントサーバであるかを区別しない場合、単にエージェントサーバ２００と称する場合がある。図１では３つのエージェントサーバ２００を示しているが、エージェントサーバ２００の数は２つであってもよいし、４つ以上であってもよい。それぞれのエージェントサーバ２００は、互いに異なるエージェントシステムの提供者が運営するものである。従って、本発明におけるエージェントは、互いに異なる提供者により実現されるエージェントである。提供者としては、例えば、自動車メーカー、ネットワークサービス事業者、電子商取引事業者、携帯端末の販売者及び製造者などが挙げられ、任意の主体（法人、団体、個人等）がエージェントシステムの提供者となり得る。

エージェント装置１００は、ネットワークＮＷを介してエージェントサーバ２００と通信する。ネットワークＮＷは、例えば、インターネット、セルラー網、Ｗｉ－Ｆｉ網、ＷＡＮ（Wide Area Network）、ＬＡＮ（Local Area Network）、公衆回線、電話回線、無線基地局などのうち一部または全部を含む。ネットワークＮＷには、各種ウェブサーバ３００が接続されており、エージェントサーバ２００またはエージェント装置１００は、ネットワークＮＷを介して各種ウェブサーバ３００からウェブページを取得することができる。

エージェント装置１００は、車両Ｍの乗員と対話を行い、乗員からの音声をエージェントサーバ２００に送信し、エージェントサーバ２００から得られた回答を、音声出力や画像表示の形で乗員に提示する。

＜第１実施形態＞
［車両］
図２は、第１実施形態に係るエージェント装置１００の構成と、車両Ｍに搭載された機器とを示す図である。車両Ｍには、例えば、一以上のマイク１０と、表示・操作装置２０と、スピーカユニット３０と、ナビゲーション装置４０と、車両機器５０と、車載通信装置６０と、乗員認識装置８０と、エージェント装置１００とが搭載される。また、スマートフォンなどの汎用通信装置７０が車室内に持ち込まれ、通信装置として使用される場合がある。これらの装置は、ＣＡＮ（Controller Area Network）通信線等の多重通信線やシリアル通信線、無線通信網等によって互いに接続される。なお、図２に示す構成はあくまで一例であり、構成の一部が省略されてもよいし、更に別の構成が追加されてもよい。

マイク１０は、車室内で発せられた音声を収集する収音部である。表示・操作装置２０は、画像を表示すると共に、入力操作を受付可能な装置（或いは装置群）である。表示・操作装置２０は、例えば、タッチパネルとして構成されたディスプレイ装置を含む。表示・操作装置２０は、更に、ＨＵＤ（Head Up Display）や機械式の入力装置を含んでもよい。スピーカユニット３０は、例えば、車室内の互いに異なる位置に配設された複数のスピーカ（音出力部）を含む。表示・操作装置２０は、エージェント装置１００とナビゲーション装置４０とで共用されてもよい。これらの詳細については後述する。

ナビゲーション装置４０は、ナビＨＭＩ（Human machine Interface）と、ＧＰＳ（Global Positioning System）などの位置測位装置と、地図情報を記憶した記憶装置と、経路探索などを行う制御装置（ナビゲーションコントローラ）とを備える。マイク１０、表示・操作装置２０、およびスピーカユニット３０のうち一部または全部がナビＨＭＩとして用いられてもよい。ナビゲーション装置４０は、位置測位装置によって特定された車両Ｍの位置から、乗員によって入力された目的地まで移動するための経路（ナビ経路）を探索し、経路に沿って車両Ｍが走行できるように、ナビＨＭＩを用いて案内情報を出力する。経路探索機能は、ネットワークＮＷを介してアクセス可能なナビゲーションサーバにあってもよい。この場合、ナビゲーション装置４０は、ナビゲーションサーバから経路を取得して案内情報を出力する。なお、エージェント装置１００は、ナビゲーションコントローラを基盤として構築されてもよく、その場合、ナビゲーションコントローラとエージェント装置１００は、ハードウェア上は一体に構成される。

車両機器５０は、例えば、エンジンや走行用モータなどの駆動力出力装置、エンジンの始動モータ、ドアロック装置、ドア開閉装置、窓、窓の開閉装置及び窓の開閉制御装置、シート、シート位置の制御装置、ルームミラー及びその角度位置制御装置、車両内外の照明装置及びその制御装置、ワイパーやデフォッガー及びそれぞれの制御装置、方向指示灯及びその制御装置、空調装置、走行距離情報や車両位置情報またタイヤの空気圧情報や燃料の残量情報など車両に関する情報を管理する車両情報装置などを含む。

車載通信装置６０は、例えば、セルラー網やＷｉ－Ｆｉ網を利用してネットワークＮＷにアクセス可能な無線通信装置である。

乗員認識装置８０は、例えば、着座センサ、車室内カメラ、画像認識装置などを含む。着座センサは座席の下部に設けられた圧力センサ、シートベルトに取り付けられた張力センサなどを含む。車室内カメラは、車室内に設けられたＣＣＤ（Charge Coupled Device）カメラやＣＭＯＳ（Complementary Metal Oxide Semiconductor）カメラである。画像認識装置は、車室内カメラの画像を解析し、座席ごとの乗員の有無、顔向きなどを認識する。本実施形態において、乗員認識装置８０は、着座位置認識部の一例である。

図３は、表示・操作装置２０の配置例を示す図である。表示・操作装置２０は、例えば、第１ディスプレイ２２と、第２ディスプレイ２４と、操作スイッチＡＳＳＹ２６とを含む。表示・操作装置２０は、更に、ＨＵＤ２８を含んでもよい。

車両Ｍには、例えば、ステアリングホイールＳＷが設けられた運転席ＤＳと、運転席ＤＳに対して車幅方向（図中Ｙ方向）に設けられた助手席ＡＳとが存在する。第１ディスプレイ２２は、インストルメントパネルにおける運転席ＤＳと助手席ＡＳとの中間辺りから、助手席ＡＳの左端部に対向する位置まで延在する横長形状のディスプレイ装置である。第２ディスプレイ２４は、運転席ＤＳと助手席ＡＳとの車幅方向に関する中間あたり、且つ第１ディスプレイの下方に設置されている。例えば、第１ディスプレイ２２と第２ディスプレイ２４は、共にタッチパネルとして構成され、表示部としてＬＣＤ（Liquid Crystal Display）や有機ＥＬ（Electroluminescence）、プラズマディスプレイなどを備えるものである。操作スイッチＡＳＳＹ２６は、ダイヤルスイッチやボタン式スイッチなどが集積されたものである。表示・操作装置２０は、乗員によってなされた操作の内容をエージェント装置１００に出力する。第１ディスプレイ２２または第２ディスプレイ２４が表示する内容は、エージェント装置１００によって決定されてよい。

図４は、スピーカユニット３０の配置例を示す図である。スピーカユニット３０は、例えば、スピーカ３０Ａ～３０Ｈを含む。スピーカ３０Ａは、運転席ＤＳ側の窓柱（いわゆるＡピラー）に設置されている。スピーカ３０Ｂは、運転席ＤＳに近いドアの下部に設置されている。スピーカ３０Ｃは、助手席ＡＳ側の窓柱に設置されている。スピーカ３０Ｄは、助手席ＡＳに近いドアの下部に設置されている。スピーカ３０Ｅは、右側後部座席ＢＳ１側に近いドアの下部に設置されている。スピーカ３０Ｆは、左側後部座席ＢＳ２側に近いドアの下部に設置されている。スピーカ３０Ｇは、第２ディスプレイ２４の近傍に設置されている。スピーカ３０Ｈは、車室の天井（ルーフ）に設置されている。

係る配置において、例えば、専らスピーカ３０Ａおよび３０Ｂに音を出力させた場合、音像は運転席ＤＳ付近に定位することになる。また、専らスピーカ３０Ｃおよび３０Ｄに音を出力させた場合、音像は助手席ＡＳ付近に定位することになる。また、専らスピーカ３０Ｅに音を出力させた場合、音像は右側後部座席ＢＳ１付近に定位することになる。また、専らスピーカ３０Ｆに音を出力させた場合、音像は左側後部座席ＢＳ２付近に定位することになる。また、専らスピーカ３０Ｇに音を出力させた場合、音像は車室の前方付近に定位することになり、専らスピーカ３０Ｈに音を出力させた場合、音像は車室の上方付近に定位することになる。これに限らず、スピーカユニット３０は、ミキサーやアンプを用いて各スピーカの出力する音の配分を調整することで、車室内の任意の位置に音像を定位させることができる。

［エージェント装置］
図２に戻り、エージェント装置１００は、管理部１１０と、エージェント機能部１５０－１、１５０－２、１５０－３と、ペアリングアプリ実行部１５２と、記憶部１６０とを備える。管理部１１０は、例えば、音響処理部１１２と、エージェントごとＷＵ（Wake Up）判定部１１４と、表示制御部１１６と、音声制御部１１８と、機能特定部１２０と、選択部１２２とを備える。いずれのエージェント機能部であるか区別しない場合、単にエージェント機能部１５０と称する。３つのエージェント機能部１５０を示しているのは、図１におけるエージェントサーバ２００の数に対応させた一例に過ぎず、エージェント機能部１５０の数は、２つであってもよいし、４つ以上であってもよい。図２に示すソフトウェア配置は説明のために簡易に示しており、実際には、例えば、エージェント機能部１５０と車載通信装置６０の間に管理部１１０が介在してもよいように、任意に改変することができる。

エージェント装置１００の各構成要素は、例えば、ＣＰＵ（Central Processing Unit）などのハードウェアプロセッサがプログラム（ソフトウェア）を実行することにより実現される。これらの構成要素のうち一部または全部は、ＬＳＩ（Large Scale Integration）やＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field-Programmable Gate Array）、ＧＰＵ（Graphics Processing Unit）などのハードウェア（回路部；circuitryを含む）によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めＨＤＤ（Hard Disk Drive）やフラッシュメモリなどの記憶装置（非一過性の記憶媒体を備える記憶装置）に格納されていてもよいし、ＤＶＤやＣＤ－ＲＯＭなどの着脱可能な記憶媒体（非一過性の記憶媒体）に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。記憶部１６０は、前述した記憶装置により実現される。記憶部１６０には、例えば、機能一覧情報１６２が記憶される。

図５は、機能一覧情報１６２の内容の一例を示す図である。機能一覧情報１６２は、エージェントが実行可能な機能と、当該機能が実行可能になった日（図示する、実行可能日）と、当該機能の実行履歴とが、エージェント毎にそれぞれ対応付けられた情報である。実行履歴には、例えば、乗員が機能を「実行済み」であるか、又は「未実行」であるかを示す情報が対応付けられ、１度でも乗員が利用した機能については、「実行済み」を示す情報が対応付けられる。機能一覧情報１６２の内容は、例えば、機能に更新がある度（例えば、新たな機能が追加される度）、又は所定の時間間隔毎にエージェントサーバ２００によって更新される。

図５において、エージェント１には、地図検索機能と、音声再生機能と、しりとり機能とを示す情報が互いに対応付けられており、いずれの機能についても実行履歴が「未実行」を示す情報である。また、エージェント２には、地図検索機能と、音楽再生機能とを示す情報が対応付けられており、地図検索機能が「実行済み」を示す情報であり、音楽再生機能が「未実行」を示す情報である。また、エージェント３には、地図検索機能と、音楽再生機能とを示す情報が対応付けられており、いずれの機能についても実行履歴が「実行済み」を示す情報である。エージェント１～３の詳細については、後述する。

管理部１１０は、ＯＳ（Operating System）やミドルウェアなどのプログラムが実行されることで機能する。

管理部１１０の音響処理部１１２は、エージェントごとに予め設定されているウエイクアップワードやエージェントが実行可能な機能を認識するのに適した状態になるように、入力された音に対して音響処理を行う。

エージェントごとＷＵ判定部１１４は、エージェント機能部１５０－１、１５０－２、１５０－３のそれぞれに対応して存在し、エージェントごとに予め定められているウエイクアップワードを認識する。エージェントごとＷＵ判定部１１４は、音響処理が行われた音声（音声ストリーム）から音声の意味を認識する。まず、エージェントごとＷＵ判定部１１４は、音声ストリームにおける音声波形の振幅と零交差に基づいて音声区間を検出する。エージェントごとＷＵ判定部１１４は、混合ガウス分布モデル（ＧＭＭ；Gaussian mixture model) に基づくフレーム単位の音声識別および非音声識別に基づく区間検出を行ってもよい。

次に、エージェントごとＷＵ判定部１１４は、検出した音声区間における音声をテキスト化し、文字情報とする。そして、エージェントごとＷＵ判定部１１４は、テキスト化した文字情報がウエイクアップワードに該当するか否かを判定する。ウエイクアップワードであると判定した場合。エージェントごとＷＵ判定部１１４は、対応するエージェント機能部１５０を示す情報を選択部に通知する。なお、エージェントごとＷＵ判定部１１４に相当する機能がエージェントサーバ２００に搭載されてもよい。この場合、管理部１１０は、音響処理部１１２によって音響処理が行われた音声ストリームをエージェントサーバ２００に送信し、エージェントサーバ２００がウエイクアップワードであると判定した場合、エージェントサーバ２００からの指示に従ってエージェント機能部１５０が起動する。なお、各エージェント機能部１５０は、常時起動しており且つウエイクアップワードの判定を自ら行うものであってよい。この場合、管理部１１０がエージェントごとＷＵ判定部１１４を備える必要はない。

機能特定部１２０は、乗員が提供を要求するエージェントの機能を特定する。まず、機能特定部１２０は、音声ストリームにおける音声波形の振幅と零交差に基づいて音声区間を検出する。機能特定部１２０は、混合ガウス分布モデルに基づくフレーム単位の音声識別および非音声識別に基づく区間検出を行ってもよい。次に、機能特定部１２０は、検出した音声区間における音声をテキスト化し、文字情報とする。そして、機能特定部１２０は、テキスト化した文字情報が、機能一覧情報１６２の機能欄に含まれる機能の名称に該当するか否かを判定する。機能特定部１２０は、文字情報が機能の名称に該当すると判定した場合、当該機能を、乗員が提供を要求するエージェントの機能として特定する。

なお、機能特定部１２０は、機能が特定される度、機能の名称、機能のリリース日、及び実行履歴等を各エージェント機能部１５０に問合せしてもよい。この場合、記憶部１６０には、機能一覧情報１６２が記憶されていなくてもよい。

選択部１２２は、エージェントごとＷＵ判定部１１４によってウエイクアップワードが認識されたエージェント機能部１５０、又は機能特定部１２０によって特定された機能を実現する（つまり、乗員の発話に対応する）、エージェント機能部１５０を選択する。選択部１２２がエージェント機能部１５０を選択する処理の詳細については、後述する。選択部１２２は、選択したエージェント機能部１５０に音声ストリームを送信する。選択部１２２は、選択したエージェント機能部１５０を起動させる。

エージェント機能部１５０は、対応するエージェントサーバ２００と協働してエージェントを出現させ、車両の乗員の発話に応じて、音声による応答を含むサービスを提供する。エージェント機能部１５０には、車両機器５０を制御する権限が付与されたものが含まれてよい。また、エージェント機能部１５０には、ペアリングアプリ実行部１５２を介して汎用通信装置７０と連携し、エージェントサーバ２００と通信するものがあってよい。例えば、エージェント機能部１５０－１には、車両機器５０を制御する権限が付与されている。エージェント機能部１５０－１は、車載通信装置６０を介してエージェントサーバ２００－１と通信する。エージェント機能部１５０－２は、車載通信装置６０を介してエージェントサーバ２００－２と通信する。エージェント機能部１５０－３は、ペアリングアプリ実行部１５２を介して汎用通信装置７０と連携し、エージェントサーバ２００－３と通信する。ペアリングアプリ実行部１５２は、例えば、Ｂｌｕｅｔｏｏｔｈ（登録商標）によって汎用通信装置７０とペアリングを行い、エージェント機能部１５０－３と汎用通信装置７０とを接続させる。なお、エージェント機能部１５０－３は、ＵＳＢ（Universal Serial Bus）などを利用した有線通信によって汎用通信装置７０に接続されるようにしてもよい。以下、エージェント機能部１５０－１とエージェントサーバ２００－１が協働して出現させるエージェントをエージェント１、エージェント機能部１５０－２とエージェントサーバ２００－２が協働して出現させるエージェントをエージェント２、エージェント機能部１５０－３とエージェントサーバ２００－３が協働して出現させるエージェントをエージェント３と称する場合がある。

表示制御部１１６は、エージェント機能部１５０からの指示に応じて第１ディスプレイ２２または第２ディスプレイ２４に画像を表示させる。以下では、第１ディスプレイ２２を使用するものとする。表示制御部１１６は、一部のエージェント機能部１５０の制御により、例えば、車室内で乗員とのコミュニケーションを行う擬人化されたエージェントの画像（以下、エージェント画像と称する）を生成し、生成したエージェント画像を第１ディスプレイ２２に表示させる。エージェント画像は、例えば、乗員に対して話しかける態様の画像である。エージェント画像は、例えば、少なくとも観者（乗員）によって表情や顔向きが認識される程度の顔画像を含んでよい。例えば、エージェント画像は、顔領域の中に目や鼻に擬したパーツが表されており、顔領域の中のパーツの位置に基づいて表情や顔向きが認識されるものであってよい。また、エージェント画像は、立体的に感じられ、観者によって三次元空間における頭部画像を含むことでエージェントの顔向きが認識されたり、本体（胴体や手足）の画像を含むことで、エージェントの動作や振る舞い、姿勢等が認識されるものであってもよい。また、エージェント画像は、アニメーション画像であってもよい。

音声制御部１１８は、エージェント機能部１５０からの指示に応じて、スピーカユニット３０に含まれるスピーカのうち一部または全部に音声を出力させる。音声制御部１１８は、複数のスピーカユニット３０を用いて、エージェント画像の表示位置に対応する位置にエージェント音声の音像を定位させる制御を行ってもよい。エージェント画像の表示位置に対応する位置とは、例えば、エージェント画像がエージェント音声を喋っていると乗員が感じると予測される位置であり、具体的には、エージェント画像の表示位置付近（例えば、２～３［ｃｍ］以内）の位置である。また、音像が定位するとは、例えば、乗員の左右の耳に伝達される音の大きさを調節することにより、乗員が感じる音源の空間的な位置を定めることである。

図６は、音像が定位する位置が定まる原理について説明するための図である。図６では、説明を簡略化するために、上述したスピーカ３０Ｂ、３０Ｄ、および３０Ｇを用いる例を示しているが、スピーカユニット３０に含まれる任意のスピーカが使用されてよい。音声制御部１１８は、各スピーカに接続されたアンプ（ＡＭＰ）３２およびミキサー３４を制御して音像を定位させる。例えば、図６に示す空間位置ＭＰ１に音像を定位させる場合、音声制御部１１８は、アンプ３２およびミキサー３４を制御することにより、スピーカ３０Ｂに最大強度の５％の出力を行わせ、スピーカ３０Ｄに最大強度の８０％の出力を行わせ、スピーカ３０Ｇに最大強度の１５％の出力を行わせる。この結果、乗員Ｐの位置からは、図６に示す空間位置ＭＰ１に音像が定位しているように感じることになる。

また、図６に示す空間位置ＭＰ２に音像を定位させる場合、音声制御部１１８は、アンプ３２およびミキサー３４を制御することにより、スピーカ３０Ｂに最大強度の４５％の出力を行わせ、スピーカ３０Ｄに最大強度の４５％の出力を行わせ、スピーカ３０Ｇに最大強度の４５％の出力を行わせる。この結果、乗員Ｐの位置からは、図６に示す空間位置ＭＰ２に音像が定位しているように感じることになる。このように、車室内に設けられる複数のスピーカとそれぞれのスピーカから出力される音の大きさを調整することで、音像が定位される位置を変化させることができる。なお、より詳細には、音像の定位する位置は、音源が元々保有している音特性や、車室内環境の情報、頭部伝達関数（HRTF；Head-related transfer function）に基づいて定まるため、音声制御部１１８は、予め官能試験などで得られた最適な出力配分でスピーカユニット３０を制御することで、音像を所定の位置に定位させる。

［エージェントサーバ］
図７は、エージェントサーバ２００の構成と、エージェント装置１００の構成の一部とを示す図である。以下、エージェントサーバ２００の構成と共にエージェント機能部１５０等の動作について説明する。ここでは、エージェント装置１００からネットワークＮＷまでの物理的な通信についての説明を省略する。

エージェントサーバ２００は、通信部２１０を備える。通信部２１０は、例えばＮＩＣ（Network Interface Card）などのネットワークインターフェースである。更に、エージェントサーバ２００は、例えば、音声認識部２２０と、自然言語処理部２２２と、対話管理部２２４と、ネットワーク検索部２２６と、応答文生成部２２８とを備える。これらの構成要素は、例えば、ＣＰＵなどのハードウェアプロセッサがプログラム（ソフトウェア）を実行することにより実現される。これらの構成要素のうち一部または全部は、ＬＳＩやＡＳＩＣ、ＦＰＧＡ、ＧＰＵなどのハードウェア（回路部；circuitryを含む）によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めＨＤＤやフラッシュメモリなどの記憶装置（非一過性の記憶媒体を備える記憶装置）に格納されていてもよいし、ＤＶＤやＣＤ－ＲＯＭなどの着脱可能な記憶媒体（非一過性の記憶媒体）に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。

エージェントサーバ２００は、記憶部２５０を備える。記憶部２５０は、上記の各種記憶装置により実現される。記憶部２５０には、パーソナルプロファイル２５２、辞書ＤＢ（データベース）２５４、知識ベースＤＢ２５６、応答規則ＤＢ２５８などのデータやプログラムが格納される。

エージェント装置１００において、エージェント機能部１５０は、音声ストリーム、或いは圧縮や符号化などの処理を行った音声ストリームを、エージェントサーバ２００に送信する。エージェント機能部１５０は、ローカル処理（エージェントサーバ２００を介さない処理）が可能な音声コマンドを認識した場合は、音声コマンドで要求された処理を行ってよい。ローカル処理が可能な音声コマンドとは、エージェント装置１００が備える記憶部（不図示）を参照することで回答可能な音声コマンドであったり、エージェント機能部１５０－１の場合は車両機器５０を制御する音声コマンド（例えば、空調装置をオンにするコマンドなど）であったりする。従って、エージェント機能部１５０は、エージェントサーバ２００が備える機能の一部を有してもよい。

音声ストリームを取得すると、音声認識部２２０が音声認識を行ってテキスト化された文字情報を出力し、自然言語処理部２２２が文字情報に対して辞書ＤＢ２５４を参照しながら意味解釈を行う。辞書ＤＢ２５４は、文字情報に対して抽象化された意味情報が対応付けられたものである。辞書ＤＢ２５４は、同義語や類義語の一覧情報を含んでもよい。音声認識部２２０の処理と、自然言語処理部２２２の処理は、段階が明確に分かれるものではなく、自然言語処理部２２２の処理結果を受けて音声認識部２２０が認識結果を修正するなど、相互に影響し合って行われてよい。

自然言語処理部２２２は、例えば、認識結果として、「今日の天気は」、「天気はどうですか」等の意味が認識された場合、標準文字情報「今日の天気」に置き換えたコマンドを生成する。これにより、リクエストの音声に文字揺らぎがあった場合にも要求にあった対話をし易くすることができる。また、自然言語処理部２２２は、例えば、確率を利用した機械学習処理等の人工知能処理を用いて文字情報の意味を認識したり、認識結果に基づくコマンドを生成してもよい。

対話管理部２２４は、自然言語処理部２２２の処理結果（コマンド）に基づいて、パーソナルプロファイル２５２や知識ベースＤＢ２５６、応答規則ＤＢ２５８を参照しながら車両Ｍの乗員に対する発話の内容を決定する。パーソナルプロファイル２５２は、乗員ごとに保存されている乗員の個人情報、趣味嗜好、過去の対話の履歴などを含む。知識ベースＤＢ２５６は、物事の関係性を規定した情報である。応答規則ＤＢ２５８は、コマンドに対してエージェントが行うべき動作（回答や機器制御の内容など）を規定した情報である。

また、対話管理部２２４は、音声ストリームから得られる特徴情報を用いて、パーソナルプロファイル２５２と照合を行うことで、乗員を特定してもよい。この場合、パーソナルプロファイル２５２には、例えば、音声の特徴情報に、個人情報が対応付けられている。音声の特徴情報とは、例えば、声の高さ、イントネーション、リズム（音の高低のパターン）等の喋り方の特徴や、メル周波数ケプストラム係数（Mel Frequency Cepstrum Coefficients）等による特徴量に関する情報である。音声の特徴情報は、例えば、乗員の初期登録時に所定の単語や文章等を乗員に発声させ、発声させた音声を認識することで得られる情報である。

対話管理部２２４は、コマンドが、ネットワークＮＷを介して検索可能な情報を要求するものである場合、ネットワーク検索部２２６に検索を行わせる。ネットワーク検索部２２６は、ネットワークＮＷを介して各種ウェブサーバ３００にアクセスし、所望の情報を取得する。「ネットワークＮＷを介して検索可能な情報」とは、例えば、車両Ｍの周辺にあるレストランの一般ユーザによる評価結果であったり、その日の車両Ｍの位置に応じた天気予報であったりする。

応答文生成部２２８は、対話管理部２２４により決定された発話の内容が車両Ｍの乗員に伝わるように、応答文を生成し、エージェント装置１００に送信する。応答文生成部２２８は、乗員がパーソナルプロファイルに登録された乗員であることが特定されている場合に、乗員の名前を呼んだり、乗員の話し方に似せた話し方にした応答文を生成したりしてもよい。

エージェント機能部１５０は、応答文を取得すると、音声合成を行って音声を出力するように音声制御部１１８に指示する。また、エージェント機能部１５０は、音声出力に合わせてエージェントの画像を表示するように表示制御部１１６に指示する。このようにして、仮想的に出現したエージェントが車両Ｍの乗員に応答するエージェント機能が実現される。

［エージェント機能部１５０の選択処理について：ウエイクアップワード無し］
以下、選択部１２２が、エージェント機能部１５０を選択する選択処理について説明する。図８は、地図検索機能を提供する場合のエージェントと乗員の対話の一例を示す図である。まず、乗員は、エージェントに対して、地図検索機能の提供を要求する旨を含む発話ＣＶ１を行う。発話ＣＶ１は、例えば、「地図検索機能を起動して？」等の言葉である。これを受けて、選択部１２２は、例えば、上述した処理によって機能特定部１２０が特定した機能（この一例では、地図検索機能）を検索キーとして、機能一覧情報１６２を検索し、当該機能が対応付けられているエージェントを特定する。図５の機能一覧情報１６２において、地図検索機能が対応付けられているエージェントは、エージェント１～３のエージェントである。

次に、選択部１２２は、当該機能が対応付けられているエージェントのうち、既に当該機能の実行履歴が「実行済み」を示すエージェントが存在する場合であっても、当該機能の実行履歴が「未実行」を示すエージェントを優先的に選択する。図５の機能一覧情報１６２において、地図検索機能が「未実行」を示すエージェントは、エージェント１のみである。したがって、選択部１２２は、エージェント機能部１５０－１を乗員の音声に応答させるエージェント機能部として、エージェント機能部１５０－２やエージェント機能部１５０－３に対して優先的に選択し、起動させる。

選択部１２２によって起動されたエージェント機能部１５０（この一例では、エージェント機能部１５０－１）は、発話ＣＶ１に対する応答文ＲＰ１を、対応するエージェントサーバ２００（この一例では、エージェントサーバ２００－１）から取得し、当該応答文ＲＰ１に音声合成を行って音声を出力するように音声制御部１１８に指示する。応答文ＲＰ１は、例えば、発話ＣＶ１において、要求されている機能を実行するエージェント機能部１５０のエージェントを紹介する言葉が含まれる。応答文ＲＰ１は、例えば、「こんにちは、△△（エージェント１）です。私が地図検索機能を提供します。」等の言葉である。

エージェント機能部１５０－１は、応答文ＲＰ１に対する乗員の発話ＣＶ２が、肯定的な内容である場合、要求された機能（この一例では、地図検索機能）の提供を行う。また、エージェント機能部１５０－１は、応答文ＲＰ１に対する乗員の発話ＣＶ２が、否定的な内容である場合、選択部１２２に再度、エージェント機能部１５０の選択を指示する。この場合、選択部１２２は、一度選択したエージェント機能部１５０を除くエージェント機能部１５０から、乗員が要求する機能を提供するエージェント機能部１５０を選択する。

［エージェント機能部１５０の選択処理について：ウエイクアップワード有り］
次に、乗員が、エージェントに対して、ウエイクアップワードと、地図検索機能の提供を要求する旨とを含む発話ＣＶ３を行う場合について説明する。図９は、ウエイクアップワードを含む発話ＣＶ３に対するエージェントの回答の一例を示す図である。発話ＣＶ３は、例えば、「『ねぇ〇〇（エージェント２）』（ウエイクアップワード）、地図検索機能を起動して？」等の言葉である。これを受けて、選択部１２２は、例えば、上述したように、地図検索機能が対応付けられているエージェントが、エージェント１～３であると特定する。次に、選択部１２２は、当該機能が対応付けられているエージェントのうち、既に当該機能の実行履歴が「実行済み」を示すエージェントが存在し、ウエイクアップワードで指定されたエージェントが存在する場合であっても、当該機能の実行履歴が「未実行」を示すエージェントを優先的に選択する。図５の機能一覧情報１６２において、地図検索機能が「未実行」を示すエージェントは、エージェント１のみである。したがって、選択部１２２は、エージェント機能部１５０－１を乗員の音声に応答させるエージェント機能部として、エージェント機能部１５０－２やエージェント機能部１５０－３に対して優先的に選択し、起動させる。

選択部１２２によって起動されたエージェント機能部１５０（この一例では、エージェント機能部１５０－１）は、発話ＣＶ１に対する応答文ＲＰ２を、対応するエージェントサーバ２００（この一例では、エージェントサーバ２００－１）から取得し、当該応答文ＲＰ２に音声合成を行って音声を出力するように音声制御部１１８に指示する。ここで、応答文ＲＰ２は、例えば、発話ＣＶ１において、選択部１２２によって起動されたエージェント機能部１５０が実現するエージェント（この一例では、エージェント１）以外のエージェント２～３を起動するウエイクアップワードが含まれていた場合、乗員の混乱を防ぐため、起動したエージェントがエージェント１であることを名乗る言葉が含まれる。また、応答文ＲＰ２は、例えば、要求されている機能が、選択部１２２によって起動されたエージェント機能部１５０によっても実行可能となったことを紹介する言葉が含まれる。応答文ＲＰ２は、例えば、「こんにちは、△△（エージェント１）です。私も地図検索機能が使えるようになったんですよ。よろしかったら使ってみませんか？」等の言葉である。

エージェント機能部１５０－１は、応答文ＲＰ２に対する乗員の発話ＣＶ４が、肯定的な内容である場合、要求された機能（この一例では、地図検索機能）の提供を行う。また、エージェント機能部１５０－１は、応答文ＲＰ２に対する乗員の発話ＣＶ４が、否定的な内容である場合、選択部１２２に再度、エージェント機能部１５０の選択を指示する。この場合、選択部１２２は、一度選択したエージェント機能部１５０を除くエージェント機能部１５０から、乗員が要求する機能を提供するエージェント機能部１５０を選択する。

以上説明したように、本実施形態のエージェント装置１００によれば、新機能を有するエージェントが優先的に乗員の対応をするようにし、新機能を乗員が使用しやすくすることができる。

［動作フロー］
図１０は、エージェント装置１００の動作の一連の流れを示すフローチャートである。まず、音響処理部１１２は、マイク１０によって収音された音に対して音響処理を行う（ステップＳ１００）。次に、機能特定部１２０は、音響処理された音声ストリームに基づいて、乗員が提供を要求するエージェントの機能を特定する（ステップＳ１０２）。選択部１２２は、機能特定部１２０によって特定された機能を実行可能なエージェントの有無を判定する（ステップＳ１０４）。選択部１２２は、特定された機能を実現可能なエージェントが存在しない場合、所定の規則によってエージェント機能部１５０を選択／起動し、起動したエージェント機能部１５０に音声ストリームを提供する（ステップＳ１０６）。所定の規則は、例えば、予め定められた選択順序に基づいてエージェント機能部１５０を選択する規則や、ランダムにエージェント機能部１５０を選択する規則である。

これに応じて、エージェントサーバ２００は、機能を提供することができない旨を乗員に回答するための応答文を生成し、管理部１１０に提供する。次に、エージェント機能部１５０は、エージェントサーバ２００により提供され応答文を取得する（ステップＳ１０８）。次に、エージェント機能部１５０は、エージェントのタスクが終了したか否かを判定する（ステップＳ１１０）。例えば、エージェント機能部１５０は、乗員の発話に対する応答文が提供された場合、タスクが終了したと判定する。音声制御部１１８は、エージェント機能部１５０－１によって取得された応答文に音声合成を行って音声を出力する（ステップＳ１１２）。

選択部１２２は、特定された機能が実現可能なエージェントが存在すると判定した場合、そのエージェントの中に、当該機能の実行履歴が「未実行」を示すエージェントが存在するか否かを判定する（ステップＳ１１４）。選択部１２２は、機能の実行履歴が「未実行」を示すエージェントが存在しないと判定した場合、実行履歴が「実行済み」を示すエージェント機能から、所定の規則によって、要求された機能を実現するエージェント機能部１５０を選択する（ステップＳ１１６）。選択部１２２は、選択したエージェント機能部１５０に音声ストリームを提供する（ステップＳ１１８）。

これに応じて、エージェントサーバ２００は、エージェントが要求された機能を提供する旨を乗員に回答するための応答文を生成し、管理部１１０に提供する。次に、選択されたエージェント機能部１５０は、エージェントサーバ２００により提供された応答文を取得する（ステップＳ１２０）。次に、エージェント機能部１５０は、エージェントのタスクが終了したか否かを判定する（ステップＳ１２２）。例えば、エージェント機能部１５０は、乗員の発話に対する応答文が提供された場合、タスクが終了したと判定する。音声制御部１１８は、エージェント機能部１５０によって取得された応答文に音声合成を行って音声を出力する（ステップＳ１２４）。

選択部１２２は、「未実行」を示すエージェントが存在すると判定した場合、特定したエージェントを実現するエージェント機能部１５０に音声ストリームを提供する（ステップＳ１２６）。なお、選択部１２２は、「未実行」を示すエージェントが存在すると判定した場合、特定したエージェントを実現するエージェント機能部１５０のうち、要求された機能を実現するエージェント機能部１５０を所定の規則によって選択してもよい。

これに応じて、エージェントサーバ２００は、当該エージェントが要求された機能を提供する旨を乗員に回答するための応答文を生成し、管理部１１０に提供する。次に、エージェント機能部１５０は、エージェントサーバ２００により提供された応答文を取得する（ステップＳ１２８）。次に、エージェント機能部１５０は、エージェントのタスクが終了したか否かを判定する（ステップＳ１３０）。音声制御部１１８は、エージェント機能部１５０によって取得された応答文に音声合成を行って音声を出力する（ステップＳ１３２）。

［エージェント機能部１５０の優先度について］
なお、選択部１２２は、乗員に要求された機能が「未実行」を示すエージェント機能部１５０が複数存在する場合、各エージェント機能部１５０に付された優先度に基づいて、エージェント機能部１５０を選択してもよい。複数のエージェント機能部１５０のうち、高い優先度が付されるエージェント機能部１５０は、例えば、車両機器５０に動作を指示する機能を有する車両エージェント機能部（この一例では、エージェント機能部１５０－１）である。以下、優先度が最も高いエージェント機能部１５０が、エージェント機能部１５０－１であり、他のエージェント機能部１５０との優先度の関係が、エージェント機能部１５０－１＞エージェント機能部１５０－２＞エージェント機能部１５０－３であるものとする。

例えば、選択部１２２は、乗員に要求された機能が「音楽再生機能」である場合、実行履歴が「未実行」を示すエージェントは、エージェント１～２であるが、エージェント１を実現するエージェント機能部１５０－１の方が、エージェント２を実現するエージェント機能部１５０－２よりも優先度が高いため、エージェント機能部１５０－１を選択する。

以上説明したように、本実施形態のエージェント装置１００によれば、特定のエージェントが優先的に乗員の対応をするようにし、乗員が使い慣れたエージェントと対話する機会を増やすようにすることができる。

［動作フロー］
図１１は、エージェント機能部１５０に優先度が付されている場合の、エージェント装置１００の動作の一連の流れを示すフローチャートである。なお、図１０に示されるステップ番号と同様の処理には、同一のステップ番号を付して説明を省略する。

選択部１２２は、機能の実行履歴が「未実行」を示すエージェントが存在すると判定した場合、当該エージェントに優先度の高いエージェント（この一例では、エージェント１）が含まれるか否かを判定する（ステップＳ２００）。選択部１２２は、エージェントにエージェント１が含まれると判定した場合、優先度の高いエージェント１を実現するエージェント機能部１５０－１に音声ストリームを提供する（ステップＳ２０２）。これに応じて、エージェントサーバ２００－１は、エージェント１が要求された機能を提供する旨を乗員に回答するための応答文を生成し、管理部１１０に提供する。次に、エージェント機能部１５０は、エージェントサーバ２００により提供された応答文を取得する（ステップＳ２０４）。次に、エージェント機能部１５０は、エージェントのタスクが終了したか否かを判定する（ステップＳ２０６）。例えば、エージェント機能部１５０は、乗員の発話に対する応答文が提供された場合、タスクが終了したと判定する。音声制御部１１８は、エージェント機能部１５０によって取得された応答文に音声合成を行って音声を出力する（ステップＳ２０８）。

選択部１２２は、ステップＳ１１４において機能の実行履歴が「未実行」を示すエージェントが存在しないと判定した場合、又は特定された機能が実現可能なエージェントに、エージェント１が含まれないと判定した場合、所定の規則によって、要求された機能を実現するエージェント機能部１５０を選択する（ステップＳ２１０）所定の規則は、例えば、予め定められた選択順序に基づいてエージェント機能部１５０を選択する規則や、ランダムにエージェント機能部１５０を選択する規則や、実行履歴が「実行済み」を示すエージェントのうち、優先度の高いエージェントを実現するエージェント機能部１５０を選択する規則である。選択部１２２は、選択したエージェントを実現するエージェント機能部１５０に音声ストリームを提供する（ステップＳ２１２）。

これに応じて、エージェントサーバ２００は、当該エージェントが要求された機能を提供する旨を乗員に回答するための応答文を生成し、管理部１１０に提供する。次に、エージェント機能部１５０は、エージェントサーバ２００により提供された応答文を取得する（ステップＳ２１４）。次に、エージェント機能部１５０は、エージェントのタスクが終了したか否かを判定する（ステップＳ２１６）。音声制御部１１８は、エージェント機能部１５０によって取得された応答文に音声合成を行って音声を出力する（ステップＳ２１８）。

［新たに追加された機能に関する情報を提供する処理について：問合せがある場合］
また、エージェント機能部１５０は、新たな機能が追加された場合、当該新たに追加された機能に関する情報を、乗員に提供してもよい。図１２は、新たに追加された機能に関する情報を提供する場合のエージェントと乗員の対話の一例を示す図である。まず、乗員は、エージェントに対して、エージェントの新たに追加された機能について問い合わせる発話ＣＶ３を行う。発話ＣＶ３は、例えば、「何か新しい機能はない？」等の言葉である。これを受けて、機能特定部１２０は、テキスト化した文字情報に「新しい機能」等の文言が含まれているか否かを判定する。機能特定部１２０は、例えば、テキスト化した文字情報に「新しい機能」等の文言が含まれている場合、乗員がエージェントの新たに追加された機能について問合せを行っていると判定する。

選択部１２２は、機能特定部１２０によって乗員がエージェントの新たに追加された機能について問合せを行っていると判定された場合、機能一覧情報１６２のうち、実行履歴が「未実行」である機能を特定する。図５において、実行履歴が「未実行」の機能は、例えば、エージェント１が実行可能なしりとり機能である。選択部１２２は、エージェント機能部１５０－１を乗員の音声に応答させるエージェント機能部として選択し、起動させる。

選択部１２２によって起動されたエージェント機能部１５０（この一例では、エージェント機能部１５０－１）は、発話ＣＶ３に対する応答文ＲＰ２を、対応するエージェントサーバ２００（この一例では、エージェントサーバ２００－１）から取得し、当該応答文ＲＰ２に音声合成を行って音声を出力するように音声制御部１１８に指示する。応答文ＲＰ２は、例えば、新たに追加された機能が、選択部１２２によって起動されたエージェント機能部１５０によって実行可能となったことを紹介する言葉が含まれる。応答文ＲＰ２は、例えば、「こんにちは、△△（エージェント１）です。私は『しりとり機能』が実行可能になりました。ご使用になりますか？」等の言葉である。

エージェント機能部１５０－１は、応答文ＲＰ２に対する乗員の発話ＣＶ４が、肯定的な内容である場合、要求された機能（この一例では、しりとり機能）の提供を行う。また、エージェント機能部１５０－１は、応答文ＲＰ２に対する乗員の発話ＣＶ４が、否定的な内容である場合、選択部１２２に再度、エージェント機能部１５０の選択を指示する。この場合、選択部１２２は、一度選択した機能を除く機能であり、使用履歴が「未実行」の機能を選択し、当該機能を実行可能なエージェント機能部１５０を選択する。

以上説明したように、本実施形態のエージェント装置１００によれば、新機能を乗員に紹介し、新機能を乗員が使用しやすくすることができる。

［動作フロー］
図１３は、エージェント装置１００の未実行の機能を紹介する処理の一連の流れを示すフローチャートである。まず、音響処理部１１２は、マイク１０によって収音された音に対して音響処理を行う（ステップＳ３００）。次に、機能特定部１２０は、音響処理された音声ストリームに基づいて、乗員が追加機能の問合せを行ったか否かを判定する（ステップＳ３０２）。エージェント装置１００は、乗員が追加機能の問合せを行っていない場合、図１３のフローチャートの処理を終了する。機能特定部１２０は、乗員が追加機能の問合せを行ったと判定した場合、機能一覧情報１６２に基づいて、未実行のエージェントの機能の有無を判定する（ステップＳ３０４）。音声制御部１１８は、機能特定部１２０によって未実行のエージェントの機能が無いと判定された場合、追加機能が無い旨通知する応答文に音声合成を行って音声を出力する（ステップＳ３０６）。機能特定部１２０は、例えば、追加機能が無いことを通知する応答文の生成を、エージェント機能部１５０に指示し、当該エージェント機能部１５０から応答文の提供を受ける。追加機能が無いことを通知する応答文は、最も優先度が高いエージェント機能部１５０から提供を受けてもよく、他のエージェント機能部１５０から提供を受けてもよい。

機能特定部１２０は、未実行の機能を有するエージェント機能部１５０に音声ストリームを提供する（ステップＳ３０８）。これに応じて、エージェントサーバ２００は、当該エージェントが要求された機能を提供する旨を乗員に回答するための応答文を生成し、管理部１１０に提供する。次に、エージェント機能部１５０は、エージェント機能部１５０により提供された応答文を取得する（ステップＳ３１０）。次に、エージェント機能部１５０は、エージェントのタスクが終了したか否かを判定する（ステップＳ３１２）。音声制御部１１８は、エージェント機能部１５０によって取得された応答文に音声合成を行って音声を出力する（ステップＳ３１４）。

［新たに追加された機能に関する情報を提供する処理について：問合せがない場合］
なお、上述では、エージェント機能部１５０が、乗員から追加機能の問い合わせがあった場合に、当該新たに追加された機能に関する情報を乗員に提供する場合について説明したが、これに限られない。エージェント機能部１５０は、例えば、新たに追加された機能とは無関係な応答（例えば、雑談）をしている際に、新たに追加された機能に関する情報を乗員に提供してもよい。例えば、新たに追加された機能が「しりとり機能」であり、エージェント機能部１５０が乗員に「地図検索機能」に係る応答を行っている場合において、エージェント機能部１５０は、地図検索機能に係る応答を終えた後に、「そういえば、私は『しりとり機能』が実行可能になりました。ご使用になりますか？」等の応答をすることによって、新たに追加された機能に関する情報を乗員に提供してもよい。

以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。

１…エージェントシステム、１０…マイク、２０…表示・操作装置、２２…第１ディスプレイ、２４…第２ディスプレイ、３０…スピーカユニット、３２…アンプ、３４…ミキサー、４０…ナビゲーション装置、５０…車両機器、６０…車載通信装置、７０…汎用通信装置、８０…乗員認識装置、１００…エージェント装置、１１０…管理部、１１２…音響処理部、１１４…エージェントごとＷＵ判定部、１１６…表示制御部、１１８…音声制御部、１２０…機能特定部、１２２…選択部、１５０、１５０－１、１５０－２、１５０－３…エージェント機能部、１５２…ペアリングアプリ実行部、１６０…記憶部、１６２…機能一覧情報、２００、２００－１、２００－２、２００－３…エージェントサーバ、２１０…通信部、２２０…音声認識部、２２２…自然言語処理部、２２４…対話管理部、２２６…ネットワーク検索部、２２８…応答文生成部、２５０…記憶部、２５２…パーソナルプロファイル、３００…ウェブサーバ

Claims

車両の乗員の発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部と、
前記複数のエージェント機能部のうち、前記乗員の発話に対応するエージェント機能部を選択する選択部とを備え、
前記選択部は、前記複数のエージェント機能部のうち、１つのエージェント機能部に新たな機能が追加された場合において、前記新たに追加された機能を前記乗員に提供する場合、前記新たに追加された機能と同じ機能を既に有している他のエージェント機能部に対して優先的に、当該新たな機能が追加されたエージェント機能部による機能を前記乗員に提供させる、
エージェント装置。
車両の乗員の発話に応じて、音声による応答を含むサービスを提供する複数のエージェント機能部と、
前記複数のエージェント機能部のうち、前記乗員の発話に対応するエージェント機能部を選択する選択部とを備え、
前記複数のエージェント機能部には、車両機器に動作を指示する機能を有する車両エージェント機能部が含まれ、
前記選択部は、前記複数のエージェント機能部のうち、前記車両エージェント機能部に新たな機能が追加された場合において、前記新たに追加された機能を前記乗員に提供する場合、前記新たに追加された機能と同じ機能を既に有している他のエージェント機能部に対して優先的に、当該新たな機能が追加された前記車両エージェント機能部による機能を前記乗員に提供させる、
エージェント装置。
前記選択部は、前記複数のエージェント機能部のうち、特定のエージェント機能部を指定した問いかけであっても、前記新たに追加された機能を前記乗員に提供する場合、前記新たに追加された機能と同じ機能を既に有している他のエージェント機能部に対して優先的に、当該新たな機能が追加されたエージェント機能部による機能を前記乗員に提供させる、
請求項１又は請求項２に記載のエージェント装置。
前記エージェント機能部は、前記複数のエージェント機能部のうち、少なくとも１つのエージェント機能部に新たな機能が追加された場合、前記新たな機能の詳細を特定しない問い合わせに応答して、前記新たに追加された機能に関する情報を前記乗員に提供する、
請求項１から請求項３のうちいずれか一項に記載のエージェント装置。
前記エージェント機能部は、前記複数のエージェント機能部のうち、少なくとも１つのエージェント機能部に新たな機能が追加された場合、前記新たな機能とは無関係な応答をしている際に、前記新たに追加された機能に関する情報を前記乗員に提供する、
請求項１から請求項４のうちいずれか一項に記載のエージェント装置。
コンピュータが、複数のエージェント機能部のうちいずれかを起動させ、前記起動したエージェント機能部の機能として、
車両の乗員の発話に応じて、音声による応答を含むサービスを提供し、
前記複数のエージェント機能部のうち、前記乗員の発話に対応するエージェント機能部を選択し、
前記複数のエージェント機能部のうち、１つのエージェント機能部に新たな機能が追加された場合において、前記新たに追加された機能を前記乗員に提供する場合、前記新たに追加された機能と同じ機能を既に有している他のエージェント機能部に対して優先的に、当該新たな機能が追加されたエージェント機能部による機能を前記乗員に提供させる、
エージェント装置の制御方法。
コンピュータに、複数のエージェント機能部のうちいずれかを起動させ、前記起動したエージェント機能部の機能として、
車両の乗員の発話に応じて、音声による応答を含むサービスを提供させ、
前記複数のエージェント機能部のうち、前記乗員の発話に対応するエージェント機能部を選択させ、
前記複数のエージェント機能部のうち、１つのエージェント機能部に新たな機能が追加された場合において、前記新たに追加された機能を前記乗員に提供する場合、前記新たに追加された機能と同じ機能を既に有している他のエージェント機能部に対して優先的に、当該新たな機能が追加されたエージェント機能部による機能を前記乗員に提供させる、
プログラム。