JP2021182057A

JP2021182057A - エージェント制御装置

Info

Publication number: JP2021182057A
Application number: JP2020087038A
Authority: JP
Inventors: 健司藤木; Kenji Fujiki
Original assignee: Toyota Motor Corp
Current assignee: Toyota Motor Corp
Priority date: 2020-05-18
Filing date: 2020-05-18
Publication date: 2021-11-25
Anticipated expiration: 2040-05-18
Also published as: US11636857B2; CN113689849B; CN113689849A; US20210358494A1; JP7318587B2

Abstract

【課題】エージェントが複数存在する場合に、ユーザが呼び出しているエージェントを特定することができ、エージェントとの対話が不成立となることを抑制する。【解決手段】ヘッドユニット２０は、複数のエージェントを実行可能であって、実行される前記エージェントの情報をスピーカ２６に対して出力する出力部と、前記エージェント毎にスピーカ２６に対する報知態様を変更させる変更部と、を備えている。【選択図】図２

Description

本発明は、ユーザの要求に応じてエージェントに係る処理を実行するエージェント制御装置に関する。

特許文献１には、入力音声信号を受け付け、前記入力音声信号に対して音声認識処理を行い音声認識処理の結果と、エージェント情報とに基づいて、当該入力音声信号に基づく処理を何れのエージェントで行うかを決定する音声対話エージェントが開示されている。

特開２０１８−１８９９８４号公報

ここで、エージェントが複数存在する場合、各エージェントの話し方、声質等が同じであると、ユーザがどのエージェントを呼び出しているか分からなくなり、エージェントとの対話が必要な場合に上手くできないなどの問題が発生する。

本発明は、エージェントが複数存在する場合に、ユーザが呼び出しているエージェントを特定することができ、エージェントとの対話が不成立となることを抑制可能なエージェント制御装置を提供することを目的とする。

請求項１に記載のエージェント制御装置は、複数のエージェントを実行可能なエージェント制御装置であって、実行される前記エージェントの情報を報知部に対して出力する出力部と、前記エージェント毎に前記報知部に対する報知態様を変更させる変更部と、を備えている。

請求項１に記載のエージェント制御装置は複数のエージェントを実行可能としている。当該エージェント制御装置では、出力部が実行されるエージェントの情報を報知部に対して出力することで、ユーザとの間で対話を行うことを可能としている。そして、当該エージェント装置では、変更部がエージェント毎に報知部に対する報知態様を変更させることで、ユーザは呼び出しているエージェントを特定することができる。これにより、エージェントとの対話が不成立となることを抑制することができる。

請求項２に記載のエージェント制御装置は、請求項１に記載のエージェント制御装置において、前記報知部はスピーカを含み、前記変更部は、前記エージェント毎に音声態様を変更する。

請求項２に記載のエージェント制御装置は、ユーザに対してエージェントの情報を音声で提供する。提供される音声は、変更部によりエージェント毎の音声態様に変更される。ここで、「音声態様」とは、男性女性の別、声のトーン、話し方等を含む。当該エージェント制御装置によれば、音声によってエージェントを識別させることで、運転中のユーザに対して運転中の安全を損なわない対話を提供することができる。

請求項３に記載のエージェント制御装置は、請求項２に記載のエージェント制御装置において、前記音声態様は、複数の態様からユーザが一の態様を選択可能である。

請求項３に記載のエージェント制御装置によれば、ユーザが好む音声態様を選択できるため、対話をする場合の不慣れな音声態様による不快感を抑制することができる。

請求項４に記載のエージェント制御装置は、請求項１〜３の何れか１項に記載のエージェント制御装置において、前記報知部は表示装置を含み、前記変更部は、前記エージェント毎に各前記エージェントを特定する特定画像を変化させる。

請求項４に記載のエージェント制御装置は、ユーザに対してエージェントを特定する特定画像を提供する。提供される特定画像は、変更部によりエージェント毎の特定画像に変更される。ここで、「特定画像」とは、エージェントに対応するロゴの画像、色彩の画像、並びに点滅、スライドイン等の動的な画像を含む。当該エージェント制御装置によれば、音声による対話が途切れた際中であってもエージェントを識別することができる。

本発明によれば、エージェントが複数存在する場合に、ユーザが呼び出しているエージェントを特定することができ、エージェントとの対話が不成立となることを抑制することができる。

第１の実施形態に係るエージェントシステムの概略構成を示す図である。第１の実施形態の車両のハードウェア構成を示すブロック図である。第１の実施形態の設定データの内容を示す図である。第１の実施形態のヘッドユニットの機能構成を示すブロック図である。第１の実施形態のエージェントシステムにおける設定モードの処理の流れを示すシーケンス図である。第１の実施形態のエージェントシステムにおける起動処理の流れを示すシーケンス図である。第２の実施形態のエージェントシステムにおける起動処理の流れを示すシーケンス図である。第２の実施形態のエージェントシステムにおける起動処理の流れを示すシーケンス図であって、図７の続きの図である。

［第１の実施形態］
図１及び図２に示されるように、第１の実施形態のエージェントシステム１０は、車両１２と、自社サーバ１４と、他社サーバ１６と、を含んで構成されている。車両１２には、エージェント制御装置としてのヘッドユニット２０と、通信装置２２と、タッチパネル２４と、スピーカ２６と、マイク２８と、が搭載されている。タッチパネル２４及びスピーカ２６はそれぞれ報知部の一例である。車両１２の通信装置２２、自社サーバ１４及び他社サーバ１６は、それぞれ、ネットワークＮを介して相互に接続されている。

自社サーバ１４は、車両１２の製造元としての自社が保有するサーバである。自社サーバ１４は、自社のサービスである自社エージェントの機能が実現されるようにユーザＵの発話の意図を推定する機能を有している。自社エージェントには、通話、決済、天気・ニュース取得、車両情報取得、カーナビゲーション、救援要請等の機能がある。

他社サーバ１６は、車両１２の製造元ではない他社が保有するサーバである。他社サーバ１６は、他社のサービスである他社エージェントの機能が実現されるようにユーザＵの発話の意図を推定する機能を有している。他社エージェントには、音楽提供、オーディオブック、通話、天気・ニュース取得等の機能がある。なお、自社エージェントと他社エージェントとで同種の機能が実現されてもよい。

（車両）
図２に示されるように、ヘッドユニット２０は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）２０Ａ、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）２０Ｂ、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）２０Ｃ、ストレージ２０Ｄ、通信Ｉ／Ｆ（ＩｎｔｅｒＦａｃｅ）２０Ｅ及び入出力Ｉ／Ｆ２０Ｆを含んで構成されている。ＣＰＵ２０Ａ、ＲＯＭ２０Ｂ、ＲＡＭ２０Ｃ、ストレージ２０Ｄ、通信Ｉ／Ｆ２０Ｅ及び入出力Ｉ／Ｆ２０Ｆは、内部バス２０Ｇを介して相互に通信可能に接続されている。

ＣＰＵ２０Ａは、中央演算処理ユニットであり、各種プログラムを実行したり、各部を制御したりする。すなわち、ＣＰＵ２０Ａは、ＲＯＭ２０Ｂ又はストレージ２０Ｄからプログラムを読み出し、ＲＡＭ２０Ｃを作業領域としてプログラムを実行する。

ＲＯＭ２０Ｂは、各種プログラム及び各種データを記憶している。本実施形態のＲＯＭ２０Ｂには、ヘッドユニット２０を制御するための制御プログラムが記憶されている。

ＲＡＭ２０Ｃは、作業領域として一時的にプログラム又はデータを記憶する。

記憶部としてのストレージ２０Ｄは、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）又はＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）により構成され、各種プログラム及び各種データを記憶している。本実施形態のストレージ２０Ｄは、処理プログラム１００と、態様データ１１０と、設定データ１２０とを記憶している。

処理プログラム１００は、自社エージェント及び他社エージェントを制御するためのプログラムである。

態様データ１１０は、自社エージェント及び他社エージェントの音声態様と表示態様とが記憶されたデータである。音声態様はスピーカ２６から出力される音声の種別を示すデータであって、男性女性の別、声のトーン、話し方等を含む。本実施形態の音声態様としては、例えば、男性の声であって、声質の異なる男性Ａ、男性Ｂ及び男性Ｃ、並びに、女性の声であって、声質の異なる女性Ａ、女性Ｂ及び女性Ｃの計６種別のデータがある。

また、表示態様はタッチパネル２４に表示される特定画像に係るデータであって、エージェントに対応するロゴの画像、色彩の画像、並びに点滅、スライドイン等の動的な画像を含む。本実施形態の特定画像には、自社エージェントを示す自社ロゴ、及び他社エージェントを示す他社ロゴがある。

設定データ１２０は、自社エージェントに対して設定されている音声態様及び表示態様、並びに他社エージェントに対して設定されている音声態様及び表示態様が記憶されたデータである。設定データ１２０に記憶されている音声態様及び表示態様は、ユーザＵにより選択され、設定されている。

図３に示されるように、例えば、設定データ１２０には、自社エージェントにおいて、「男性Ｃ」の音声態様と「自社ロゴ」点滅の表示態様が設定され、他社エージェントにおいて、「女性Ａ」の音声態様と「他社ロゴ」スライドインの表示態様が設定されている。

図２に示されるように、通信Ｉ／Ｆ２０Ｅは、通信装置２２と接続するためのインタフェースである。当該インタフェースは、例えば、ＣＡＮプロトコルによる通信規格が用いられる。通信Ｉ／Ｆ２０Ｅは、外部バス２０Ｈに対して接続されている。

入出力Ｉ／Ｆ２０Ｆは、車両１２に搭載されるタッチパネル２４、スピーカ２６及びマイク２８と通信するためのインタフェースである。なお、タッチパネル２４、スピーカ２６及びマイク２８は、内部バス２０Ｇに対して直接接続されていてもよい。

通信装置２２は、自社サーバ１４及び他社サーバ１６と通信するための無線通信モジュールである。当該無線通信モジュールは、例えば、５Ｇ、ＬＴＥ、Ｗｉ−Ｆｉ（登録商標）等の通信規格が用いられる。通信装置２２は、ネットワークＮに対して接続されている。

タッチパネル２４は、インストルメントパネル等に設けられ、表示装置としての液晶ディスプレイと、入力装置としてのタッチパッドとを兼ねている。

スピーカ２６は、インストルメントパネル、センタコンソール、フロントピラー、ダッシュボード等に設けられ、自社エージェント及び他社エージェントに係る音声を出力するための装置である。

マイク２８は、車両１２のフロントピラーやダッシュボード等に設けられ、車両１２の乗員であるユーザＵが発した音声を集音する装置である。

図４に示されるように本実施形態のヘッドユニット２０では、ＣＰＵ２０Ａが、処理プログラム１００を実行することで、要求部２００、第一実行部２２０、第二実行部２３０、出力部２４０、変更部２５０、及び設定部２６０として機能する。

要求部２００は、所定の契機にエージェントの実行を要求する機能を有している。ここで、「所定の契機」には、ユーザＵのマイク２８に対する発話、ステアリング等に設けられた図示しないＰＴＴ（プッシュ・トゥ・トーク）スイッチの押下などがある。要求部２００は、ユーザＵの発話による音声情報に自社エージェント用のウェイクワードが含まれる場合、当該音声情報を自社サーバ１４に送信して自社エージェントの実行を要求する。また、要求部２００は、ユーザＵの発話による音声情報に他社エージェント用のウェイクワードが含まれる場合、当該音声情報を他社サーバ１６に送信して他社エージェントの実行を要求する。

第一実行部２２０は、自社エージェントを実行する機能を有している。第一実行部２２０は、発話による音声情報を送信した自社サーバ１４から提供された意図情報を基に自社エージェントの機能を実行する。

第二実行部２３０は、他社エージェントを実行する機能を有している。第二実行部２３０は、発話による音声情報を送信した他社サーバ１６から提供された意図情報を基に他社エージェントの機能を実行する。

出力部２４０は、実行されるエージェントの情報を報知部としてのタッチパネル２４及びスピーカ２６に対して出力する機能を有している。例えば、出力部２４０は、自社エージェントがカーナビゲーション機能における目的地検索を行う場合には、検索された目的地の地図情報をタッチパネル２４に出力し、目的地のテキスト情報を音声化したデータをスピーカ２６に出力する。また、例えば、出力部２４０は、他社エージェントが音楽提供を行う場合には、提供する楽曲のアーティスト及びタイトルをタッチパネル２４に出力し、楽曲データをスピーカ２６に出力する。

タッチパネル２４には、エージェントの情報と共に設定データ１２０から読み出された表示態様に基づくエージェントのロゴが表示される。また、ユーザＵと対話を行う音声については、設定データ１２０から読み出された音声態様に基づく音声がスピーカ２６から出力される。

変更部２５０は、エージェント毎にタッチパネル２４及びスピーカ２６に対する報知態様を変更させる機能を有している。具体的に、変更部２５０は、何れかのエージェントが起動された場合、設定データ１２０を参照して各エージェントに対応する音声態様及び表示態様を変更する。

設定部２６０は、態様データ１１０に記憶されている複数の態様からユーザＵが選択した一の態様を設定する機能を有している。具体的に、設定部２６０は、設定モードに移行した場合に、ユーザＵによる音声態様及び表示態様の選択を受け付けると共に、受け付けられた音声態様及び表示態様を設定データ１２０に記憶する。

なお、自社エージェントの音声態様及び表示態様は、自社サーバ１４から態様情報として取得することができる。また、他社エージェントの音声態様及び表示態様は、他社サーバ１６から態様情報として取得することができる。

（制御の流れ）
本実施形態のエージェントシステム１０において実行される処理の流れについて、図５及び図６のシーケンス図を用いて説明する。ヘッドユニット２０における処理は、ＣＰＵ２０Ａが、上述した要求部２００、第一実行部２２０、第二実行部２３０、出力部２４０、変更部２５０及び設定部２６０として機能することにより実現される。

まず、各エージェントの音声態様及び表示態様を設定する設定モードの処理について説明する。
図５のステップＳ１０において、自社サーバ１４は自社エージェントに係る音声態様及び表示態様に係る態様情報をヘッドユニット２０に向けて送信する。

ステップＳ１１において、他社サーバ１６は他社エージェントに係る音声態様及び表示態様に係る態様情報をヘッドユニット２０に向けて送信する。

各サーバから取得した音声態様及び表示態様は態様データ１１０に記憶される。なお、音声態様及び表示態様は、必ずしも設定モードにおいて各サーバから取得する必要なく、予め態様データ１１０に記憶されていてもよいし、エージェントのアプリケーションプログラムと共に各サーバから取得してもよい。

そして、ステップＳ１２において、ユーザＵはタッチパネル２４を操作すると、ステップＳ１３において、ヘッドユニット２０はユーザＵの選択操作に基づいて、音声態様及び表示態様を設定する。設定された各態様は、設定データ１２０に記憶される。

次に、各エージェントの起動処理について説明する。
車両１２が始動した場合、図６のステップＳ２０において、ヘッドユニット２０は各エージェントの音声態様及び表示態様を読み込む。

ステップＳ２１において、ユーザＵはヘッドユニット２０に向けて発話を行う。例えば、ユーザＵは「Ａｇｅｎｔ、Ｘさんに電話して」、「Ａｓｓｉｓｔａｎｔ、音楽を掛けて」などと発話をしてエージェントに対して要求を行う。

ステップＳ２２において、ヘッドユニット２０はユーザＵの発話による音声の音声認識を行う。

ステップＳ２３において、ヘッドユニット２０は音声認識による音声情報を基に、起動する自社エージェント及び他社エージェントのいずれかを検出する。例えば、ヘッドユニット２０は発話の音声に「Ａｇｅｎｔ」のウェイクワードが存在している場合、自社エージェントを起動するエージェントとして検出する。また、ヘッドユニット２０は発話の音声に「Ａｓｓｉｓｔａｎｔ」のウェイクワードが存在している場合、他社エージェントを起動するエージェントとして検出する。

ステップＳ２３において自社エージェントが検出された場合、ステップＳ２４〜ステップＳ２８の処理に移行する。

ステップＳ２４において、ヘッドユニット２０はステップＳ２３において検出されたエージェントのサーバに対して、音声情報を送信する。例えば、「Ａｇｅｎｔ、Ｘさんに電話して」とユーザＵが発話した場合、「Ｘさんに電話して」という内容の音声情報が自社サーバ１４に送信される。

ステップＳ２５において、自社サーバ１４は受信した音声情報を基に音声認識を行い、意図抽出を実行する。例えば、「Ｘさんに電話して」の音声情報からＸさんに電話を掛けるという意図を抽出する。

ステップＳ２６において、自社サーバ１４は抽出された意図を意図情報としてヘッドユニット２０に送信する。

ステップＳ２７において、ヘッドユニット２０は自社エージェントの態様を設定する。すなわち、ヘッドユニット２０は、設定データ１２０を参照して自社エージェントの音声態様及び表示態様を設定する。

ステップＳ２８において、ヘッドユニット２０は自社エージェントの実行を開始する。すなわち、ヘッドユニット２０は自社サーバ１４からＸさんに電話を掛けるという意図情報を受信すると通話機能を起動し、自社サーバ１４から取得した、又はストレージ２０Ｄに記憶されているＸさんの連絡先を参照してＸさんに電話を掛ける。これにより、ヘッドユニット２０では通話が開始される。

なお、図３の設定データ１２０を参照した結果、自社エージェントが実行される際、ガイダンス等の対話の音声は「男性Ｃ」の声質でスピーカ２６から出力され、タッチパネル２４には自社ロゴが点滅した態様で表示される。

一方、図６のステップＳ２３において他社エージェントが検出された場合、ステップＳ２９〜ステップＳ３３の処理に移行する。

ステップＳ２９において、ヘッドユニット２０はステップＳ２３において検出されたエージェントのサーバに対して、音声情報を送信する。例えば、「Ａｓｓｉｓｔａｎｔ、音楽を掛けて」とユーザＵが発話した場合、「音楽を掛けて」という内容の音声情報が他社サーバ１６に送信される。

ステップＳ３０において、他社サーバ１６は受信した音声情報を基に音声認識を行い、意図抽出を実行する。例えば、「音楽を掛けて」の音声情報から音楽を再生するという意図を抽出する。

ステップＳ３１において、他社サーバ１６は抽出された意図を意図情報としてヘッドユニット２０に送信する。

ステップＳ３２において、ヘッドユニット２０は他社エージェントの態様を設定する。すなわち、ヘッドユニット２０は、設定データ１２０を参照して他社エージェントの音声態様及び表示態様を設定する。

ステップＳ３３において、ヘッドユニット２０は他社エージェントの実行を開始する。すなわち、ヘッドユニット２０は他社サーバ１６から音楽を再生するという意図情報を受信するとプレーヤを起動し、他社サーバ１６から受信した音楽を再生する。

なお、図３の設定データ１２０を参照した結果、他社エージェントが実行される際、ガイダンス等の対話の音声は「女性Ａ」の声質でスピーカ２６から出力され、タッチパネル２４には他社ロゴがスライドインの態様で表示される。

（第１の実施形態のまとめ）
本実施形態のヘッドユニット２０は複数のエージェントを実行可能としている。ヘッドユニット２０では、出力部２４０が実行されるエージェントの情報をタッチパネル２４及びスピーカ２６に対して出力することで、ユーザＵとの間で対話を行うことを可能としている。そして、本実施形態では、変更部２５０がエージェント毎にタッチパネル２４及びスピーカ２６に対する報知態様を変更させることで、ユーザＵは呼び出しているエージェントを特定することができる。したがって、本実施形態によれば、エージェントとの対話が不成立となることを抑制することができる。

また、本実施形態は、ユーザＵに対してエージェントの情報を音声で提供する。提供される音声は、変更部２５０によりエージェント毎の音声態様に変更される。本実施形態によれば、音声によってエージェントを識別させることで、運転中のユーザＵに対して運転中の安全を損なわない対話を提供することができる。

また、本実施形態によれば、ユーザＵが好む音声態様を選択できるため、対話をする場合の不慣れな音声態様による不快感を抑制することができる。

さらに、本実施形態のヘッドユニット２０は、ユーザＵに対してエージェントの情報を画像で提供する。提供される画像は、変更部２５０によりエージェント毎のロゴ等の特定画像に変更される。本実施形態によれば、音声による対話が途切れた際中であってもエージェントを識別することができる。

［第２の実施形態］
第１の実施形態は、自社エージェントと他社エージェントが独立して実行される。これに対して、第２の実施形態は、自社エージェントの実行中に他社エージェントが実行されるものである。以下、第１の実施形態との相違点について説明する。なお、その他の構成については、第１の実施形態と同様であり、詳細な説明は省略する。

本実施形態のエージェントシステム１０において実行される起動処理は図７及び図８に示すとおりである。

車両１２が始動した場合、図７のステップＳ４０において、ヘッドユニット２０は各エージェントの音声態様及び表示態様を読み込む。

ステップＳ４１において、ユーザＵはヘッドユニット２０に向けて発話を行う。例えば、ユーザＵは「Ａｇｅｎｔ、Ｙに行きたい」と発話をしてエージェントに対して要求を行う。

ステップＳ４２において、ヘッドユニット２０はユーザＵの発話による音声の音声認識を行う。

ステップＳ４３において、ヘッドユニット２０は音声認識による音声情報を基に、起動する自社エージェント及び他社エージェントのいずれかを検出する。ステップＳ４１の発話の例では、発話の音声に「Ａｇｅｎｔ」のウェイクワードが存在しているので、ヘッドユニット２０は自社エージェントを起動するエージェントとして検出する。

ステップＳ４４において、ヘッドユニット２０はステップＳ４３において検出されたエージェントのサーバに対して、音声情報を送信する。「Ａｇｅｎｔ、Ｙに行きたい」との発話においては、「Ｙに行きたい」という内容の音声情報が自社サーバ１４に送信される。

ステップＳ４５において、自社サーバ１４は受信した音声情報を基に音声認識を行い、意図抽出を実行する。例えば、「Ｙに行きたい」の音声情報からＹへのルート案内をするという意図を抽出する。

ステップＳ４６において、自社サーバ１４は抽出された意図を意図情報としてヘッドユニット２０に送信する。

ステップＳ４７において、ヘッドユニット２０は自社エージェントの態様を設定する。すなわち、ヘッドユニット２０は、設定データ１２０を参照して自社エージェントの音声態様及び表示態様を設定する。

ステップＳ４８において、ヘッドユニット２０は自社エージェントの実行を開始する。すなわち、ヘッドユニット２０は自社サーバ１４からＹへのルート案内をするという意図情報を受信するとカーナビゲーション機能を起動し、自社サーバ１４から取得したＹの位置情報を車両１２の目的地に設定する。これにより、ヘッドユニット２０では目的地Ｙへのナビゲーションが開始される。

ここで、自社エージェントがカーナビゲーション機能を実行中にユーザＵが他社エージェントを起動した場合、以下の処理が実行される。

図８のステップＳ４９において、ユーザＵはヘッドユニット２０に向けて発話を行う。例えば、ユーザＵは「Ａｓｓｉｓｔａｎｔ、Ｙ付近のレストランを教えて」と発話をしてエージェントに対して要求を行う。

ステップＳ５０において、ヘッドユニット２０はユーザＵの発話による音声の音声認識を行う。

ステップＳ５１において、ヘッドユニット２０は音声認識による音声情報を基に、起動する自社エージェント及び他社エージェントのいずれかを検出する。ステップＳ４９の発話の例では、発話の音声に「Ａｓｓｉｓｔａｎｔ」のウェイクワードが存在しているので、ヘッドユニット２０は他社エージェントを起動するエージェントとして検出する。

ステップＳ５２において、ヘッドユニット２０はステップＳ５１において検出されたエージェントのサーバに対して、音声情報を送信する。「Ａｓｓｉｓｔａｎｔ、Ｙ付近のレストランを教えて」との発話においては、「Ｙ付近のレストランを教えて」という内容の音声情報が他社サーバ１６に送信される。

ステップＳ５３において、他社サーバ１６は受信した音声情報を基に音声認識を行い、意図抽出を実行する。例えば、「Ｙ付近のレストランを教えて」の音声情報からＹ付近に存在するレストランの情報を提供するという意図を抽出する。

ステップＳ５４において、他社サーバ１６は抽出された意図を意図情報としてヘッドユニット２０に送信する。

ステップＳ５５において、ヘッドユニット２０は受信した意図が、現在実行中の自社エージェントの機能に関連があるか否かの判定を行う。ヘッドユニット２０は受信した意図が、現在実行中の自社エージェントの機能に関連があると判定した場合、ステップＳ５６に進む。一方、ヘッドユニット２０は受信した意図が、現在実行中の自社エージェントの機能とは関連がないと判定した場合、ステップＳ５７に進む。

ステップＳ５６において、ヘッドユニット２０は自社エージェントとして他社エージェントを実行する。本実施形態では、ヘッドユニット２０が他社サーバ１６からＹ付近に存在するレストランの情報を提供するという、目的地Ｙへのナビゲーションに関係する意図情報を受信すると、他社サーバ１６から受信したレストランの情報をタッチパネル２４に表示させる。この際、ガイダンス等の対話の音声は「男性Ｃ」の声質でスピーカ２６から出力され、タッチパネル２４には自社ロゴが点滅した態様で表示される。したがって、ユーザＵは自社エージェントとの対話の中でレストランの情報を取得したと認識することができる。

一方、ステップＳ５５において、受信した意図が現在実行中の自社エージェントの機能とは関連がないと判定された場合、ステップＳ５７において、ヘッドユニット２０は他社エージェントの態様を設定する。例えば、音楽を再生するというナビゲーションとは関係のない意図情報を受信した場合、ヘッドユニット２０は、設定データ１２０を参照して他社エージェントの音声態様及び表示態様を設定する。

ステップＳ５８において、ヘッドユニット２０は他社エージェントの実行を開始する。ヘッドユニット２０は他社サーバ１６から音楽を再生するという意図情報を受信するとプレーヤを起動し、他社サーバ１６から受信した音楽を再生する。

本実施形態では、実行中の自社エージェントを経由して他社エージェントを実行する場合、音声態様及び表示態様は変化しない。具体的に本実施形態では、実行中の自社エージェントの機能と関連のある他社エージェントの機能を実行する場合は、自社エージェントの音声態様で対話が行われ、自社エージェントの表示態様がタッチパネル２４に表示される。

ユーザＵは必要なサービスを受けることができれば、どのエージェントにより提供されたかを問わない場合がある。本実施形態の例のように、目的地へのナビゲーションの流れの中で目的地付近のレストラン情報を照会した場合、対話の都度、音声態様や表示態様が変わるとかえって違和感を覚える場合がある。そのため、本実施形態のように、自社エージェントを経由して他社エージェントを実行する場合には音声態様及び表示態様を固定することで、対話毎にエージェントが切り替わる違和感を抑制することができる。

なお、音声態様はエージェント毎に固定して、表示態様のみを変化させてもよい。この場合、対話においてエージェントが切り替わる違和感を抑制しつつ、実際に起動しているエージェントをユーザＵに知らせることができる。

また、本実施形態では、自社エージェントを経由して他社エージェントを実行する場合を例示したが、これに限らず、他社エージェントを経由して自社エージェントを実行する場合においても音声態様及び表示態様を固定するように構成してもよい。

［備考］
上記各実施形態では、音声態様としてスピーカ２６から出力される音声の種別を変えていたが、これに限らず、エージェント毎に音の出る方向を変えてもよい。例えば、自社エージェントは右側のスピーカ２６から音声を出力し、他社エージェントは左側のスピーカ２６から音声を出力させてもよい。

なお、上記実施形態でＣＰＵ２０Ａがソフトウェア（プログラム）を読み込んで実行した各種処理を、ＣＰＵ以外の各種のプロセッサが実行してもよい。この場合のプロセッサとしては、ＦＰＧＡ（Ｆｉｅｌｄ−ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）等の製造後に回路構成を変更可能なＰＬＤ（ＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖｉｃｅ）、及びＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が例示される。また、上述した受付処理を、これらの各種のプロセッサのうちの１つで実行してもよいし、同種又は異種の２つ以上のプロセッサの組み合わせ（例えば、複数のＦＰＧＡ、及びＣＰＵとＦＰＧＡとの組み合わせ等）で実行してもよい。また、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子等の回路素子を組み合わせた電気回路である。

また、上記実施形態において、各プログラムはコンピュータが読み取り可能な非一時的記録媒体に予め記憶（インストール）されている態様で説明した。例えば、ヘッドユニット２０における処理プログラム１００は、ストレージ２０Ｄに予め記憶されている。しかしこれに限らず、各プログラムは、ＣＤ−ＲＯＭ（ＣｏｍｐａｃｔＤｉｓｃＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＤＶＤ−ＲＯＭ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、及びＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）メモリ等の非一時的記録媒体に記録された形態で提供されてもよい。また、プログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。

上記実施形態で説明した処理の流れも、一例であり、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよい。

２０ヘッドユニット（エージェント制御装置）
２４タッチパネル（報知部、表示装置）
２６スピーカ（報知部）
２４０出力部
２５０変更部
Ｕユーザ

Claims

複数のエージェントを実行可能なエージェント制御装置であって、
実行される前記エージェントの情報を報知部に対して出力する出力部と、
前記エージェント毎に前記報知部に対する報知態様を変更させる変更部と、
を備えるエージェント制御装置。
前記報知部はスピーカを含み、
前記変更部は、前記エージェント毎に音声態様を変更する請求項１に記載のエージェント制御装置。
前記音声態様は、複数の態様からユーザが一の態様を選択可能である請求項２に記載のエージェント制御装置。
前記報知部は表示装置を含み、
前記変更部は、前記エージェント毎に各前記エージェントを特定する特定画像を変化させる請求項１〜３の何れか１項に記載のエージェント制御装置。