JP7266432B2

JP7266432B2 - エージェント装置、エージェント装置の制御方法、およびプログラム

Info

Publication number: JP7266432B2
Application number: JP2019047757A
Authority: JP
Inventors: 正樹栗原; 慎一菊池; 真也安原; 裕介大井; 裕本田
Original assignee: Honda Motor Co Ltd
Current assignee: Honda Motor Co Ltd
Priority date: 2019-03-14
Filing date: 2019-03-14
Publication date: 2023-04-28
Anticipated expiration: 2039-03-14
Also published as: US11380325B2; CN111696560A; JP2020147214A; US20200321000A1

Description

本発明は、エージェント装置、システム、エージェント装置の制御方法、およびプログラムに関する。

従来、車両の乗員と対話を行いながら、乗員の要求に応じた運転支援に関する情報や車両の制御、その他のアプリケーション等を提供するエージェント機能に関する技術が開示されている（例えば、特許文献１参照）。

特開２００６－３３５２３１号公報

近年では、エージェント機能を車両に搭載することについて実用化が進められているが、エージェント機能の起動方法について十分に検討されていなかった。このため、従来の技術では、利用者の嗜好に合った起動方法を提供することができない場合があった。

本発明は、このような事情を考慮してなされたものであり、利用者の嗜好に合った起動方法を提供するエージェント装置、システム、エージェント装置の制御方法、およびプログラムことを目的の一つとする。

この発明に係るエージェント装置、システム、エージェント装置の制御方法、およびプログラムは、以下の構成を採用した。
（１）：この発明の一態様に係るエージェント装置は、車両の車室内で収音された乗員の音声に応じて、音声による応答を含むサービスを提供する一以上のエージェント機能部と、前記乗員による入力を受け付ける受付部と、前記受付部により受け付けられた内容に基づいて、前記エージェント機能部の起動方法を変更または追加する起動方法設定部と、を備えるエージェント装置である。

（２）：上記（１）の態様において、前記エージェント機能部は、前記音声に含まれ、前記起動方法設定部によって設定された起動方法に基づく起動キーワードに応じて起動するものである。

（３）：上記（２）の態様において、前記起動方法設定部は、記憶部に記憶された特定ワードを起動キーワードから除外するものである。

（４）：上記（３）の態様において、前記特定ワードは、記憶部に記憶された前記車両の前記乗員に関連ある人物の、名前、苗字、氏名、愛称、または通称のうち、一部または全部を含むものである。

（５）：上記（３）または（４）の態様において、前記エージェント装置は、前記車両の前記乗員に関連ある人物の、名前、苗字、氏名、愛称、または通称のうち、一部または全部を、前記特定ワードとして前記記憶部に記憶させるものである。

（６）：上記（２）から（５）のいずれかの態様において、前記エージェント機能部は、前記設定された起動キーワードが男性を示すワードであると推定される場合、推定結果に基づいて前記音声による応答を含むサービスを提供するものである。

（７）：上記（６）の態様において、前記エージェント機能部は、前記推定結果に基づいて、前記音声による応答を男性調の声色、または口調で提供するものである。

（８）：上記（２）から（７）のいずれかの態様において、前記エージェント機能部は、前記設定された起動キーワードが女性を示すワードであると推定される場合、前記推定結果に基づいて前記音声による応答を含むサービスを提供するものである。

（９）：上記（８）の態様において、前記エージェント機能部は、前記推定結果に基づいて、前記音声による応答を女性調の声色、または口調で提供するものである。

（１０）：上記（２）から（９）のいずれかの態様において、前記車両の乗員を検知する乗員検知部を更に備え、前記エージェント機能部は、前記乗員検知部の検知結果に基づいて、前記受付部を介して第１起動キーワードを起動キーワードとして設定した第１乗員とは異なる乗員により前記第１起動キーワードが入力されたと判定された場合、前記第１起動キーワードに応じて起動せず、前記乗員検知部の検知結果に基づいて、前記受付部を介して第１乗員により前記第１起動キーワードが入力されたと判定された場合、前記第１起動キーワードに応じて起動するものである。

（１１）：上記（２）から（１０）のいずれかの態様において、前記車両の乗員を検知する乗員検知部を更に備え、前記エージェント機能部は、前記乗員検知部の検知結果に基づいて、第１起動キーワードが入力された場合において、前記第１起動キーワードに対応付けられた第１乗員以外の乗員が前記車両の車室内に存在すると判定された場合、前記第１起動キーワードに応じて起動せず、前記乗員検知部の検知結果に基づいて、前記第１起動キーワードが入力された場合において、前記第１起動キーワードに対応付けられた第１乗員以外の乗員が前記車両の車室内に存在しないと判定された場合、前記第１起動キーワードに応じて起動するものである。

（１２）：上記（１０）または（１１）の態様において、前記エージェント機能部は、前記エージェント機能部が前記第１起動キーワードとは異なる起動キーワードで起動した場合、前記第１起動キーワードで起動した際の動作履歴を参照しないものである。

（１３）：上記（２）から（１２）のいずれかの態様において、複数の前記エージェント機能部を備え、前記起動方法設定部は、前記複数の前記エージェント機能部に共通した起動キーワードを使用するものである。

（１４）：この発明の一態様に係るエージェント装置の制御方法は、コンピュータが、車両の車室内で収音された乗員の音声に応じて、音声による応答を含むサービスを提供し、前記乗員による入力を受け付け、前記受け付けられた内容に基づいて、前記サービスを提供する機能の起動方法を変更または追加するエージェント装置の制御方法である。

（１５）：の発明の一態様に係るプログラムは、コンピュータに、車両の車室内で収音された乗員の音声に応じて、音声による応答を含むサービスを提供させ、前記乗員による入力を受け付けさせ、前記受け付けられた内容に基づいて、前記サービスを提供する機能の起動方法を変更または追加させるプログラムである。

（１）、（２）、（１３）～（１５）によれば、エージェント機能部の起動方法を変更または追加することにより、利用者の嗜好に合った起動方法を提供することができる。

（３）～（５）によれば、記憶部に記憶された特定ワードが起動キーワードから除外されるため、乗員がエージェント機能部を起動させる意思がなく、日常会話で特定ワードを用いた場合にエージェント機能部が起動することが抑制されるため、乗員にとっての利便性が向上する。

（６）～（９）によれば、乗員の種別に基づいて記音声による応答を含むサービスを提供することで乗員の満足度が向上する。

（１０）～（１２）によれば、乗員検知部の検知結果が加味されて、エージェント機能部が起動するため、乗員のプライバシーが守られる。

エージェント装置１００を含むエージェントシステム１の構成図である。第１実施形態に係るエージェント装置１００の構成と、車両Ｍに搭載された機器とを示す図である。表示・操作装置２０の配置例を示す図である。スピーカユニット３０の配置例を示す図である。音像が定位する位置が定まる原理について説明するための図である。エージェントサーバ２００の構成と、エージェント装置１００の構成の一部とを示す図である。エージェント装置１００により実行される処理の流れの一例を示すフローチャートである。特定ワード辞書１２２の内容の一例を示す図である。エージェント機能部１５０が起動する処理の一例を示すフローチャートである。汎用通信装置７０とエージェント装置１００とにより実行される処理の流れのフローチャートの一例を示す図である。エージェント装置１００により実行される応答処理のモード設定の処理の流れの一例を示すフローチャートである。エージェント機能部１５０が出力する情報の一例を示す図である。第２実施形態に係るエージェント装置１００Ａの構成と、車両Ｍに搭載された機器とを示す図である。乗員認識装置８０とエージェント装置１００とにより実行される処理の流れのフローチャートの一例を示す図（その１）である。ウエイクアップワード情報１２８の内容の一例を示す図である。乗員認識装置８０とエージェント装置１００とにより実行される処理の流れのフローチャートの一例を示す図（その２）である。エージェント装置１００により実行される応答処理における処理の一部の流れの一例を示すフローチャートである。シークレットモードで起動したエージェント機能部１５０が行う応答の一例を示す図である。変形例のエージェント装置１００Ｂの機能構成の一例を示す図である。

以下、図面を参照し、本発明のエージェント装置、システム、エージェント装置の制御方法、およびプログラムの実施形態について説明する。

＜第１実施形態＞

エージェント装置は、エージェントシステムの一部または全部を実現する装置である。以下では、エージェント装置の一例として、車両（以下、車両Ｍ）に搭載され、複数種類のエージェント機能を備えたエージェント装置について説明する。エージェント機能とは、例えば、車両Ｍの乗員と対話をしながら、乗員の発話の中に含まれる要求（コマンド）に基づく各種の情報提供を行ったり、ネットワークサービスを仲介したりする機能である。複数種類のエージェントはそれぞれに果たす機能、処理手順、制御、出力態様・内容がそれぞれ異なってもよい。また、エージェント機能の中には、車両内の機器（例えば運転制御や車体制御に関わる機器）の制御等を行う機能を有するものがあってよい。

エージェント機能は、例えば、乗員の音声を認識する音声認識機能（音声をテキスト化する機能）に加え、自然言語処理機能（テキストの構造や意味を理解する機能）、対話管理機能、ネットワークを介して他装置を検索し、或いは自装置が保有する所定のデータベースを検索するネットワーク検索機能等を統合的に利用して実現される。これらの機能の一部または全部は、ＡＩ（Artificial Intelligence）技術によって実現されてよい。また、これらの機能を行うための構成の一部（特に、音声認識機能や自然言語処理解釈機能）は、車両Ｍの車載通信装置または車両Ｍに持ち込まれた汎用通信装置と通信可能なエージェントサーバ（外部装置）に搭載されてもよい。以下の説明では、構成の一部がエージェントサーバに搭載されており、エージェント装置とエージェントサーバが協働してエージェントシステムを実現することを前提とする。また、エージェント装置とエージェントサーバが協働して仮想的に出現させるサービス提供主体（サービス・エンティティ）をエージェントと称する。

＜全体構成＞
図１は、エージェント装置１００を含むエージェントシステム１の構成図である。エージェントシステム１は、例えば、エージェント装置１００と、複数のエージェントサーバ２００－１、２００－２、２００－３、…とを備える。符号の末尾のハイフン以下の数字は、エージェントを区別するための識別子であるものとする。いずれのエージェントサーバであるかを区別しない場合、単にエージェントサーバ２００と称する場合がある。図１では３つのエージェントサーバ２００を示しているが、エージェントサーバ２００の数は２つであってもよいし、４つ以上であってもよい。それぞれのエージェントサーバ２００は、互いに異なるエージェントシステムの提供者が運営するものである。従って、本発明におけるエージェントは、互いに異なる提供者により実現されるエージェントである。提供者としては、例えば、自動車メーカー、ネットワークサービス事業者、電子商取引事業者、携帯端末の販売者などが挙げられ、任意の主体（法人、団体、個人等）がエージェントシステムの提供者となり得る。

エージェント装置１００は、ネットワークＮＷを介してエージェントサーバ２００と通信する。ネットワークＮＷは、例えば、インターネット、セルラー網、Ｗｉ－Ｆｉ網、ＷＡＮ（Wide Area Network）、ＬＡＮ（Local Area Network）、公衆回線、電話回線、無線基地局などのうち一部または全部を含む。ネットワークＮＷには、各種ウェブサーバ３００が接続されており、エージェントサーバ２００またはエージェント装置１００は、ネットワークＮＷを介して各種ウェブサーバ３００からウェブページを取得することができる。

エージェント装置１００は、車両Ｍの乗員と対話を行い、乗員からの音声をエージェントサーバ２００に送信し、エージェントサーバ２００から得られた回答を、音声出力や画像表示の態様で乗員に提示する。

＜第１実施形態＞
［車両］
図２は、第１実施形態に係るエージェント装置１００の構成と、車両Ｍに搭載された機器とを示す図である。車両Ｍには、例えば、一以上のマイク１０と、表示・操作装置２０と、スピーカユニット３０と、ナビゲーション装置４０と、車両機器５０と、車載通信装置６０と、乗員認識装置８０と、エージェント装置１００とが搭載される。また、スマートフォンなどの汎用通信装置７０が車室内に持ち込まれ、通信装置として使用される場合がある。これらの装置は、ＣＡＮ（Controller Area Network）通信線等の多重通信線やシリアル通信線、無線通信網等によって互いに接続される。なお、図２に示す構成はあくまで一例であり、構成の一部が省略されてもよいし、更に別の構成が追加されてもよい。

マイク１０は、車室内で発せられた音声を収集する収音部である。表示・操作装置２０は、画像を表示すると共に、入力操作を受付可能な装置（或いは装置群）である。表示・操作装置２０は、例えば、タッチパネルとして構成されたディスプレイ装置を含む。表示・操作装置２０は、更に、ＨＵＤ（Head Up Display）や機械式の入力装置を含んでもよい。スピーカユニット３０は、例えば、車室内の互いに異なる位置に配設された複数のスピーカ（音出力部）を含む。表示・操作装置２０は、エージェント装置１００とナビゲーション装置４０とで共用されてもよい。これらの詳細については後述する。

ナビゲーション装置４０は、ナビＨＭＩ（Human machine Interface）と、ＧＰＳ（Global Positioning System）などの位置測位装置と、地図情報を記憶した記憶装置と、経路探索などを行う制御装置（ナビゲーションコントローラ）とを備える。マイク１０、表示・操作装置２０、およびスピーカユニット３０のうち一部または全部がナビＨＭＩとして用いられてもよい。ナビゲーション装置４０は、位置測位装置によって特定された車両Ｍの位置から、乗員によって入力された目的地まで移動するための経路（ナビ経路）を探索し、経路に沿って車両Ｍが走行できるように、ナビＨＭＩを用いて案内情報を出力する。経路探索機能は、ネットワークＮＷを介してアクセス可能なナビゲーションサーバにあってもよい。この場合、ナビゲーション装置４０は、ナビゲーションサーバから経路を取得して案内情報を出力する。なお、エージェント装置１００は、ナビゲーションコントローラを基盤として構築されてもよく、その場合、ナビゲーションコントローラとエージェント装置１００は、ハードウェア上は一体に構成される。

車両機器５０は、例えば、エンジンや走行用モータなどの駆動力出力装置、エンジンの始動モータ、ドアロック装置、ドア開閉装置、窓、窓の開閉装置及び窓の開閉制御装置、シート、シート位置の制御装置、ルームミラー及びその角度位置制御装置、車両内外の照明装置及びその制御装置、ワイパーやデフォッガー及びそれぞれの制御装置、方向指示灯及びその制御装置、空調装置、走行距離やタイヤの空気圧の情報や燃料の残量情報などの車両情報装置などを含む。

車載通信装置６０は、例えば、セルラー網やＷｉ－Ｆｉ網を利用してネットワークＮＷにアクセス可能な無線通信装置である。

乗員認識装置８０は、例えば、着座センサ、車室内カメラ、画像認識装置などを含む。着座センサは座席の下部に設けられた圧力センサ、シートベルトに取り付けられた張力センサなどを含む。車室内カメラは、車室内に設けられたＣＣＤ（Charge Coupled Device）カメラやＣＭＯＳ（Complementary Metal Oxide Semiconductor）カメラである。画像認識装置は、車室内カメラの画像を解析し、座席ごとの乗員の有無、顔向きなどを認識する。本実施形態において、乗員認識装置８０は、着座位置認識部の一例である。

図３は、表示・操作装置２０の配置例を示す図である。表示・操作装置２０は、例えば、第１ディスプレイ２２と、第２ディスプレイ２４と、操作スイッチＡＳＳＹ２６とを含む。表示・操作装置２０は、更に、ＨＵＤ２８を含んでもよい。

車両Ｍには、例えば、ステアリングホイールＳＷが設けられた運転席ＤＳと、運転席ＤＳに対して車幅方向（図中Ｙ方向）に設けられた助手席ＡＳとが存在する。第１ディスプレイ２２は、インストルメントパネルにおける運転席ＤＳと助手席ＡＳとの中間辺りから、助手席ＡＳの左端部に対向する位置まで延在する横長形状のディスプレイ装置である。第２ディスプレイ２４は、運転席ＤＳと助手席ＡＳとの車幅方向に関する中間あたり、且つ第１ディスプレイ２２の下方に設置されている。例えば、第１ディスプレイ２２と第２ディスプレイ２４は、共にタッチパネルとして構成され、表示部としてＬＣＤ（Liquid Crystal Display）や有機ＥＬ（Electroluminescence）、プラズマディスプレイなどを備えるものである。操作スイッチＡＳＳＹ２６は、ダイヤルスイッチやボタン式スイッチなどが集積されたものである。表示・操作装置２０は、乗員によってなされた操作の内容をエージェント装置１００に出力する。第１ディスプレイ２２または第２ディスプレイ２４が表示する内容は、エージェント装置１００によって決定されてよい。

図４は、スピーカユニット３０の配置例を示す図である。スピーカユニット３０は、例えば、スピーカ３０Ａ～３０Ｈを含む。スピーカ３０Ａは、運転席ＤＳ側の窓柱（いわゆるＡピラー）に設置されている。スピーカ３０Ｂは、運転席ＤＳに近いドアの下部に設置されている。スピーカ３０Ｃは、助手席ＡＳ側の窓柱に設置されている。スピーカ３０Ｄは、助手席ＡＳに近いドアの下部に設置されている。スピーカ３０Ｅは、右側後部座席ＢＳ１側に近いドアの下部に設置されている。スピーカ３０Ｆは、左側後部座席ＢＳ２側に近いドアの下部に設置されている。スピーカ３０Ｇは、第２ディスプレイ２４の近傍に設置されている。スピーカ３０Ｈは、車室の天井（ルーフ）に設置されている。

係る配置において、例えば、専らスピーカ３０Ａおよび３０Ｂに音を出力させた場合、音像は運転席ＤＳ付近に定位することになる。また、専らスピーカ３０Ｃおよび３０Ｄに音を出力させた場合、音像は助手席ＡＳ付近に定位することになる。また、専らスピーカ３０Ｅに音を出力させた場合、音像は右側後部座席ＢＳ１付近に定位することになる。また、専らスピーカ３０Ｆに音を出力させた場合、音像は左側後部座席ＢＳ２付近に定位することになる。また、専らスピーカ３０Ｇに音を出力させた場合、音像は車室の前方付近に定位することになり、専らスピーカ３０Ｈに音を出力させた場合、音像は車室の上方付近に定位することになる。これに限らず、スピーカユニット３０は、ミキサーやアンプを用いて各スピーカの出力する音の配分を調整することで、車室内の任意の位置に音像を定位させることができる。

［エージェント装置］
図２に戻り、エージェント装置１００は、管理部１１０と、記憶部１２０と、エージェント機能部１５０－１、１５０－２、１５０－３と、ペアリングアプリ実行部１５２とを備える。管理部１１０は、例えば、音響処理部１１２と、エージェントごとＷＵ（Wake Up）判定部１１３と、ウエイクアップワード設定部１１４と、モード設定部１１５と、表示制御部１１６と、音声制御部１１８と、生成部１１９とを備える。いずれのエージェント機能部であるかを区別しない場合、単にエージェント機能部１５０と称する。３つのエージェント機能部１５０を示しているのは、図１におけるエージェントサーバ２００の数に対応させた一例に過ぎず、エージェント機能部１５０の数は、２つであってもよいし、４つ以上であってもよい。図２に示すソフトウェア配置は説明のために簡易に示しており、実際には、例えば、エージェント機能部１５０と車載通信装置６０の間に管理部１１０が介在してもよいし、任意に改変することができる。

エージェント装置１００の各構成要素は、例えば、ＣＰＵ（Central Processing Unit）などのハードウェアプロセッサがプログラム（ソフトウェア）を実行することにより実現される。これらの構成要素のうち一部または全部は、ＬＳＩ（Large Scale Integration）やＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field-Programmable Gate Array）、ＧＰＵ（Graphics Processing Unit）などのハードウェア（回路部；circuitryを含む）によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めＨＤＤ（Hard Disk Drive）やフラッシュメモリなどの記憶装置（非一過性の記憶媒体を備える記憶装置）に格納されていてもよいし、ＤＶＤやＣＤ－ＲＯＭなどの着脱可能な記憶媒体（非一過性の記憶媒体）に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。

記憶部１２０には、特定ワード辞書１２２や、性別情報１２４、モード情報１２６などが記憶されている。なお、上述した記憶部１２０に記憶された特定ワード辞書１２２や性別情報１２４は、エージェント機能部１５０ごとに設けられていてもよい。

管理部１１０は、ＯＳ（Operating System）やミドルウェアなどのプログラムが実行されることで機能する。

管理部１１０の音響処理部１１２は、エージェントごとに予め設定されているウエイクアップワードを認識するのに適した状態になるように、入力された音に対して音響処理を行う。音響処理部１１２は、乗員が発生させた音の入力を受け付ける「受付部」の一例である。

エージェントごとＷＵ判定部１１３は、エージェント機能部１５０－１、１５０－２、１５０－３のそれぞれに対応して存在し、エージェントごとに予め定められているウエイクアップワードを認識する。エージェントごとＷＵ判定部１１３は、音響処理が行われた音声（音声ストリーム）から音声の意味を認識する。まず、エージェントごとＷＵ判定部１１３は、音声ストリームにおける音声波形の振幅と零交差に基づいて音声区間を検出する。エージェントごとＷＵ判定部１１３は、混合ガウス分布モデル（ＧＭＭ；Gaussian mixture model)に基づくフレーム単位の音声識別および非音声識別に基づく区間検出を行ってもよい。

次に、エージェントごとＷＵ判定部１１３は、検出した音声区間における音声をテキスト化し、文字情報とする。そして、エージェントごとＷＵ判定部１１３は、テキスト化した文字情報がウエイクアップワードに該当するか否かを判定する。ウエイクアップワードであると判定した場合、エージェントごとＷＵ判定部１１３は、対応するエージェント機能部１５０を起動させる。なお、エージェントごとＷＵ判定部１１３に相当する機能がエージェントサーバ２００に搭載されてもよい。この場合、管理部１１０は、音響処理部１１２によって音響処理が行われた音声ストリームをエージェントサーバ２００に送信し、エージェントサーバ２００がウエイクアップワードであると判定した場合、エージェントサーバ２００からの指示に従ってエージェント機能部１５０が起動する。なお、各エージェント機能部１５０は、常時起動しており且つウエイクアップワードの判定を自ら行うものであってよい。この場合、管理部１１０がエージェントごとＷＵ判定部１１３を備える必要はない。

ウエイクアップワード設定部１１４は、音響処理部１１２により受け付けられた内容に基づいて、複数のエージェント機能部１５０のうち一部または全部の起動方法を変更または追加する。

モード設定部１１５は、音響処理部１１２により受け付けられた内容に基づいて、エージェント機能部１５０の起動方法を変更または追加する。詳細については後述する。

エージェント機能部１５０は、対応するエージェントサーバ２００と協働してエージェントを出現させ、車両の乗員の発話（車両の車室内で収音された乗員の音声）に応じて、音声による応答を含むサービスを提供する。エージェント機能部１５０には、車両機器５０を制御する権限が付与されたものが含まれてよい。また、エージェント機能部１５０には、ペアリングアプリ実行部１５２を介して汎用通信装置７０と連携し、エージェントサーバ２００と通信するものであってよい。例えば、エージェント機能部１５０－１には、車両機器５０を制御する権限が付与されている。エージェント機能部１５０－１は、車載通信装置６０を介してエージェントサーバ２００－１と通信する。エージェント機能部１５０－２は、車載通信装置６０を介してエージェントサーバ２００－２と通信する。エージェント機能部１５０－３は、ペアリングアプリ実行部１５２を介して汎用通信装置７０と連携し、エージェントサーバ２００－３と通信する。

ペアリングアプリ実行部１５２は、例えば、Ｂｌｕｅｔｏｏｔｈ（登録商標）によって汎用通信装置７０とペアリングを行い、エージェント機能部１５０－３と汎用通信装置７０とを接続させる。なお、エージェント機能部１５０－３は、ＵＳＢ（Universal Serial Bus）などを利用した有線通信によって汎用通信装置７０に接続されるようにしてもよい。

表示制御部１１６は、エージェント機能部１５０による指示に応じて第１ディスプレイ２２または第２ディスプレイ２４に画像を表示させる。以下では、第１ディスプレイ２２を使用するものとする。表示制御部１１６は、一部のエージェント機能部１５０の制御により、例えば、車室内で乗員とのコミュニケーションを行う擬人化されたエージェントの画像（以下、エージェント画像と称する）を生成し、生成したエージェント画像を第１ディスプレイ２２に表示させる。エージェント画像は、例えば、乗員に対して話しかける態様の画像である。エージェント画像は、例えば、少なくとも観者（乗員）によって表情や顔向きが認識される程度の顔画像を含んでよい。例えば、エージェント画像は、顔領域の中に目や鼻に擬したパーツが表されており、顔領域の中のパーツの位置に基づいて表情や顔向きが認識されるものであってよい。また、エージェント画像は、観者によって、立体的に感じられ、三次元空間における頭部画像を含むことでエージェントの顔向きが認識される画像である。エージェント画像は、エージェントの動作や振る舞い、姿勢等が認識され本体（胴体や手足）の画像を含むものであってもよい。また、エージェント画像は、アニメーション画像であってもよい。

音声制御部１１８は、エージェント機能部１５０による指示に応じて、スピーカユニット３０に含まれるスピーカのうち一部または全部に音声を出力させる。音声制御部１１８は、複数のスピーカユニット３０を用いて、エージェント画像の表示位置に対応する位置にエージェント音声の音像を定位させる制御を行ってもよい。エージェント画像の表示位置に対応する位置とは、例えば、エージェント画像がエージェント音声を喋っていると乗員が感じると予測される位置であり、具体的には、エージェント画像の表示位置付近（例えば、２～３［ｃｍ］以内）の位置である。また、音像が定位するとは、例えば、乗員の左右の耳に伝達される音の大きさが調節されることにより、乗員が感じる音源の空間的な位置が定められることである。

図５は、音像が定位する位置が定まる原理について説明するための図である。図５では、説明を簡略化するために、上述したスピーカ３０Ｂ、３０Ｄ、および３０Ｇを用いる例を示しているが、スピーカユニット３０に含まれる任意のスピーカが使用されてよい。音声制御部１１８は、各スピーカに接続されたアンプ（ＡＭＰ）３２およびミキサー３４を制御して音像を定位させる。例えば、図５に示す空間位置ＭＰ１に音像を定位させる場合、音声制御部１１８は、アンプ３２およびミキサー３４を制御することにより、スピーカ３０Ｂに最大強度の５％の出力を行わせ、スピーカ３０Ｄに最大強度の８０％の出力を行わせ、スピーカ３０Ｇに最大強度の１５％の出力を行わせる。この結果、乗員Ｐの位置からは、図５に示す空間位置ＭＰ１に音像が定位しているように感じることになる。

また、図５に示す空間位置ＭＰ２に音像を定位させる場合、音声制御部１１８は、アンプ３２およびミキサー３４を制御することにより、スピーカ３０Ｂに最大強度の４５％の出力を行わせ、スピーカ３０Ｄに最大強度の４５％の出力を行わせ、スピーカ３０Ｇに最大強度の４５％の出力を行わせる。この結果、乗員Ｐの位置からは、図５に示す空間位置ＭＰ２に音像が定位しているように感じることになる。このように、車室内に設けられる複数のスピーカとそれぞれのスピーカから出力される音の大きさを調整することで、音像が定位される位置を変化させることができる。なお、より詳細には、音像の定位する位置は、音源が元々保有している音特性や、車室内環境の情報、頭部伝達関数（HRTF；Head-related transfer function）に基づいて定まるため、音声制御部１１８は、予め官能試験などで得られた最適な出力配分でスピーカユニット３０を制御することで、音像を所定の位置に定位させる。

生成部１１９は、特定ワード、または特定ワードに類似するワードに基づいて、特定ワード辞書１２２を生成する。詳細については後述する。

［エージェントサーバ］
図６は、エージェントサーバ２００の構成と、エージェント装置１００の構成の一部とを示す図である。以下、エージェントサーバ２００の構成と共にエージェント機能部１５０等の動作について説明する。ここでは、エージェント装置１００からネットワークＮＷまでの物理的な通信についての説明を省略する。

エージェントサーバ２００は、通信部２１０を備える。通信部２１０は、例えばＮＩＣ（Network Interface Card）などのネットワークインターフェースである。更に、エージェントサーバ２００は、例えば、音声認識部２２０と、自然言語処理部２２２と、対話管理部２２４と、ネットワーク検索部２２６と、応答文生成部２２８とを備える。これらの構成要素は、例えば、ＣＰＵなどのハードウェアプロセッサがプログラム（ソフトウェア）を実行することにより実現される。これらの構成要素のうち一部または全部は、ＬＳＩやＡＳＩＣ、ＦＰＧＡ、ＧＰＵなどのハードウェア（回路部；circuitryを含む）によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めＨＤＤやフラッシュメモリなどの記憶装置（非一過性の記憶媒体を備える記憶装置）に格納されていてもよいし、ＤＶＤやＣＤ－ＲＯＭなどの着脱可能な記憶媒体（非一過性の記憶媒体）に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。

エージェントサーバ２００は、記憶部２５０を備える。記憶部２５０は、上記の各種記憶装置により実現される。記憶部２５０には、パーソナルプロファイル２５２、辞書ＤＢ（データベース）２５４、知識ベースＤＢ２５６、応答規則ＤＢ２５８などのデータやプログラムが格納される。

エージェント装置１００において、エージェント機能部１５０は、音声ストリーム、或いは圧縮や符号化などの処理を行った音声ストリームを、エージェントサーバ２００に送信する。エージェント機能部１５０は、ローカル処理（エージェントサーバ２００を介さない処理）が可能な音声コマンドを認識した場合は、音声コマンドで要求された処理を行ってよい。ローカル処理が可能な音声コマンドとは、エージェント装置１００が備える記憶部（不図示）を参照することで回答可能な音声コマンドであったり、エージェント機能部１５０－１の場合は車両機器５０を制御する音声コマンド（例えば、空調装置をオンにするコマンドなど）であったりする。従って、エージェント機能部１５０は、エージェントサーバ２００が備える機能の一部を有してもよい。

エージェント装置１００は、音声ストリームを取得すると、音声認識部２２０が音声認識を行ってテキスト化された文字情報を出力し、自然言語処理部２２２が文字情報に対して辞書ＤＢ２５４を参照しながら意味解釈を行う。辞書ＤＢ２５４は、文字情報に対して抽象化された意味情報が対応付けられたものである。辞書ＤＢ２５４は、同義語や類義語の一覧情報を含んでもよい。音声認識部２２０の処理と、自然言語処理部２２２の処理は、段階が明確に分かれるものではなく、自然言語処理部２２２の処理結果を受けて音声認識部２２０が認識結果を修正するなど、相互に影響し合って行われてよい。

自然言語処理部２２２は、例えば、認識結果として、「今日の天気は」、「天気はどうですか」等の意味が認識された場合、標準文字情報「今日の天気」に置き換えたコマンドを生成する。これにより、リクエストの音声に文字揺らぎがあった場合にも要求にあった対話をし易くすることができる。また、自然言語処理部２２２は、例えば、確率を利用した機械学習処理等の人工知能処理を用いて文字情報の意味を認識したり、認識結果に基づくコマンドを生成したりしてもよい。

対話管理部２２４は、自然言語処理部２２２の処理結果（コマンド）に基づいて、パーソナルプロファイル２５２や知識ベースＤＢ２５６、応答規則ＤＢ２５８を参照しながら車両Ｍの乗員に対する発話の内容を決定する。パーソナルプロファイル２５２は、乗員ごとに保存されている乗員の個人情報、趣味嗜好、過去の対話の履歴などを含む。知識ベースＤＢ２５６は、物事の関係性を規定した情報である。応答規則ＤＢ２５８は、コマンドに対してエージェントが行うべき動作（回答や機器制御の内容など）を規定した情報である。

また、対話管理部２２４は、音声ストリームから得られる特徴情報を用いて、パーソナルプロファイル２５２と照合を行うことで、乗員を特定してもよい。この場合、パーソナルプロファイル２５２には、例えば、音声の特徴情報に、個人情報が対応付けられている。音声の特徴情報とは、例えば、声の高さ、イントネーション、リズム（音の高低のパターン）等の喋り方の特徴や、メル周波数ケプストラム係数（Mel Frequency Cepstrum Coefficients）等による特徴量に関する情報である。音声の特徴情報は、例えば、乗員の初期登録時に所定の単語や文章等を乗員に発声させ、発声させた音声を認識することで得られる情報である。

対話管理部２２４は、コマンドが、ネットワークＮＷを介して検索可能な情報を要求するものである場合、ネットワーク検索部２２６に検索を行わせる。ネットワーク検索部２２６は、ネットワークＮＷを介して各種ウェブサーバ３００にアクセスし、所望の情報を取得する。「ネットワークＮＷを介して検索可能な情報」とは、例えば、車両Ｍの周辺にあるレストランの一般ユーザによる評価結果であったり、その日の車両Ｍの位置に応じた天気予報であったりする。

応答文生成部２２８は、対話管理部２２４により決定された発話の内容が車両Ｍの乗員に伝わるように、応答文を生成し、生成した応答文をエージェント装置１００に送信する。応答文生成部２２８は、乗員がパーソナルプロファイルに登録された乗員であることが特定されている場合に、乗員の名前を呼んだり、乗員の話し方に似せた話し方にした応答文を生成したりしてもよい。

エージェント機能部１５０は、応答文を取得すると、音声合成を行って音声を出力するように音声制御部１１８に指示する。また、エージェント機能部１５０は、音声出力に合わせてエージェントの画像を表示するように表示制御部１１６に指示する。このようにして、仮想的に出現したエージェントが車両Ｍの乗員に応答するエージェント機能が実現される。

［設定処理］
ウエイクアップワード設定部１１４が、エージェント機能部１５０の起動方法の変更または追加を行う処理について説明する。以下、一例として、ウエイクアップワードの変更が行わる例について説明する。

図７は、エージェント装置１００により実行される処理の流れの一例を示すフローチャートである。本処理は、例えば、エージェント機能部１５０が予め設定されたウエイクアップワードに基づいて起動した後に実行される処理である。

まず、ウエイクアップワード設定部１１４が、ウエイクアップワードの変更を求める音声が入力されたか否かを判定する（ステップＳ１００）。ウエイクアップワードの変更を求める音声が入力された場合、ウエイクアップワード設定部１１４は、変更するウエイクアップワード（以下、変更候補ワード）が入力されたか否かを判定する（ステップＳ１０２）。「ウエイクアップワードの変更を求める音声」とは、例えば、「ウエイクアップワードを変更したい」や、「エージェントを起動させるワードを変更したい」などのウエイクアップワードを変更する意思を示す音声である。これらのウエイクアップワードを変更する意思を示す音声から得られる文字情報（以下、変更情報）は、予め記憶部１２０に記憶されている。ウエイクアップワード設定部１１４は、記憶部１２０に記憶された変更情報を参照して、上記のステップＳ１０２の判定を行う。

変更候補ワードが入力された場合、ウエイクアップワード設定部１１４は、変更候補ワードが特定ワードに類似するか否かを判定する（ステップＳ１０４）。ウエイクアップワード設定部１１４は、特定ワード辞書１２２を参照して、変更候補ワードが特定ワードに類似するか否かを判定する。

図８は、特定ワード辞書１２２の内容の一例を示す図である。特定ワード辞書１２２は、複数の特定ワードが記憶されている辞書である。特定ワードは、例えば、車両Ｍの乗員（利用者）に関連ある人物の、名前、苗字、氏名、愛称、または通称（以下、これらを「名前等」と称する場合がある）のうち、一部または全部を含む。また、特定ワードは、例えば、名前等に類似するワードを含む。また、特定ワードは、車両Ｍにエージェント装置１００が複数搭載される場合、それらのエージェント装置１００に対応するエージェントの現在の名称、及び好ましくは過去及び現在の名称を含む。図８の例では、車両Ｍの乗員の苗字が「本田」であり、「本田」という人物の、苗字や愛称、これらに類似するワードが特定ワードとして規定されている。特定ワード辞書１２２の生成手法については、図１０で後述する。

変更候補ワードが特定ワードに類似しない場合、ウエイクアップワード設定部１１４は、ウエイクアップワードを、予め設定されたウエイクアップワードから変更候補ワードに変更する（ステップＳ１０６）。次に、ウエイクアップワード設定部１１４は、ウエイクアップワードを、予め設定されたウエイクアップワードから変更候補ワードに変更したことを示す音声を、エージェント機能部１５０に出力させる（ステップＳ１０８）。例えば、エージェント機能部１５０は、「あなたが入力した・・・をウエイクアップワードとして登録します」などの音声を出力する。また、ウエイクアップワード設定部１１４は、記憶部１２０に記憶されていたウエイクアップワードを変更後の新たなウエイクアップワードに変更する。この場合、ウエイクアップワード設定部１１４は、変更前のウエイクアップワードも、設定されていたウエイクアップワードの履歴として記憶部１２０に記憶させておいてもよい。

上記のウエイクアップワードの変更とは、エージェント装置１００に含まれる、または管理する全てのエージェント機能部１５０のウエイクアップワードが変更されることであってもよいし、一部または乗員により指定されたエージェント機能部１５０のウエイクアップワードが変更されることであってもよい。

変更候補ワードが特定ワードに類似する場合、ウエイクアップワード設定部１１４は、ウエイクアップワードを、予め設定されたウエイクアップワードから変更候補ワードに変更できないことを示す音声を、エージェント機能部１５０に出力させる（ステップＳ１１０）。例えば、エージェント機能部１５０は、「入力された音声は特定ワードに該当するため、ウエイクアップワードとして登録できません」などの音声を出力する。
これにより、本フローチャートの１ルーチンの処理が終了する。

上述した処理により、乗員の嗜好に合ったウエイクアップワードが設定される。このように、エージェント装置１００は、乗員の嗜好に合った起動方法を提供することができるので、乗員は、よりエージェント機能部１５０により提供されるエージェントに対して親しみを感じることができ、乗員の満足度が向上する。また、エージェント装置１００は、エージェント機能部１５０を起動させる意思が存在せず、乗員が車室内に存在する乗員の名前等を呼んだ場合に、エージェント機能部１５０が起動してしまうことを抑制させることができる。これにより、乗員の利便性を向上させることができる。

［エージェント機能部の起動処理］
図９は、エージェント機能部１５０が起動する処理の一例を示すフローチャートである。本処理は、例えば、図７のフローチャートの処理において、ウエイクアップワードが変更された後に実行される処理である。

エージェントごとＷＵ判定部１１３が、音声が入力されたか否かを判定する（ステップＳ２００）。音声が入力された場合、エージェントごとＷＵ判定部１１３は、入力された音声から得られた情報が、図７のフローチャートの処理で変更されたウエイクアップワードに合致するか否を判定する（ステップＳ２０２）。合致するとは、完全一致に限らず、求められた合致度が所定度合以上であることであってもよい。

入力された音声から得られた情報が、図７のフローチャートの処理で変更されたウエイクアップワードに合致すると判定された場合、エージェントごとＷＵ判定部１１３は、変更されたウエイクアップワードに関連付けられたエージェント機能部１５０を起動させる（ステップＳ２０４）。「変更されたウエイクアップワードに関連付けられたエージェント機能部１５０」とは、図７のフローチャートの処理において、ウエイクアップワードが変更されたエージェント機能部１５０である。次に、エージェント機能部１５０は、入力された音声に応じて、音声制御部１１８に音声を出力させ（ステップＳ２０６）、本フローチャートの１ルーチンの処理が終了する。

入力された音声から得られた情報が、図７のフローチャートの処理で変更されたウエイクアップワードに合致しないと判定された場合、エージェントごとＷＵ判定部１１３は、入力された音声から得られた情報が、図７のフローチャートの処理で変更される前のウエイクアップワードに合致するか否を判定する（ステップＳ２０８）。入力された音声から得られた情報が、図７のフローチャートの処理で変更される前のウエイクアップワードに合致しない場合、本フローチャートの１ルーチンの処理が終了する。

入力された音声から得られた情報が、図７のフローチャートの処理で変更される前のウエイクアップワードに合致すると判定された場合、エージェントごとＷＵ判定部１１３は、ウエイクアップワードは変更されたことを示す音声をエージェント機能部１５０に出力させ（ステップＳ２１０）、ステップＳ２０２の処理に戻る。これにより、乗員は、ウエイクアップワードが変更されたことに気が付いたり、ウエイクアップワードを変更したことを思い出したりする。

なお、ステップＳ２００、ステップＳ２０２、ステップＳ２０８の処理が繰り返され、複数回、入力された音声から得られた情報が、図７のフローチャートの処理で変更される前のウエイクアップワードに合致すると判定された場合、ステップＳ２１０の処理が行われてもよい。

上述した処理により、乗員は、自身の嗜好に合った起動方法でエージェント機能部１５０を起動させることができる。また、エージェント装置１００は、乗員が変更前のウエイクアップワードでエージェント機能部１５０を起動させようとしている場合に、乗員にウエイクアップワードは変更されたことを認識させることができる。この結果、乗員の利便性が向上する。

［特定ワード辞書の生成手法］
図１０は、汎用通信装置７０とエージェント装置１００とにより実行される処理の流れのフローチャートの一例を示す図である。まず、汎用通信装置７０とエージェント装置１００とがペアリングを行って、互いに通信する（ステップＳ３００、Ｓ４００）。次に、エージェント装置１００の生成部１１９が、汎用通信装置７０に情報の提供を依頼する（ステップＳ４０２）。生成部１１９が提供を依頼する情報は、例えば、乗員または乗員に関連ある人物（または動物）の、名前や、苗字、氏名、愛称、通称、これらを特定するための情報である。以下、上記の情報を総称して、「特定ワード候補」という場合がある。生成部１１９が提供を依頼する情報は、例えば、汎用通信装置７０に記憶された連絡先一覧情報や、連絡先一覧情報のうち所定頻度で連絡が行われた連絡先の情報である。

汎用通信装置７０は、ステップＳ４０２の依頼に応じて、自装置に記憶された情報をエージェント装置１００に提供する（ステップＳ３０２）。例えば、汎用通信装置７０は、自装置の表示部に情報を提供することを承諾するか否かを問い合わせる情報を表示させ、汎用通信装置７０の乗員が情報を提供することを承諾する操作を行った場合に、情報をエージェント装置１００に提供してもよい。また、汎用通信装置７０は、乗員の操作に基づいて、乗員が指定した情報のみをエージェント装置１００に提供してもよい。

なお、エージェント装置１００が、連絡先一覧情報などの情報を保持し、汎用通信装置７０に情報の提供を依頼する必要がない場合、上記のステップＳ３００、Ｓ３０２、Ｓ４００、Ｓ４０２の処理は省略されてもよい。

次に、エージェント装置１００の生成部１１９が、汎用通信装置７０により提供された情報の一部または全部を特定ワードとして決定する（ステップＳ４０４）。生成部１１９は、例えば、特定ワード候補のうち、乗員の名前や、苗字、氏名、愛称、通称などを特定ワードとしてもよいし、所定の基準に基づいて特定ワードを抽出してもよい。

次に、生成部１１９は、ステップＳ４０４で決定した特定ワードに類似するワードを導出し、導出したワードを特定ワードとして決定する（ステップＳ４０６）。例えば、生成部１１９は、所定の手法を用いて特定ワードに類似するワードを導出してもよいし、他の装置に類似するワードの導出を依頼してもよい。例えば、生成部１１９は、特定ワードをベクトル化して、記憶装置に記憶された特定辞書を参照して、特定ワードに対応するベクトルに類似するベクトルを有するワードを類似するワードとして導出する。例えば、特定辞書は、ベクトルとベクトルに対応するワードとが対応付けられた辞書である。類似するとは、例えば、コサイン類似度が所定度合以上であることである。また、生成部１１９は、word2vecなどの公知の自然言語解析手法を用いて、特定ワードに類似するワードを導出してもよい。

次に、生成部１１９は、ステップＳ４０６で抽出した特定ワード、およびこの特定ワードに類似するワードである特定ワードに基づいて、特定ワード辞書１２２を生成し、生成した特定ワード辞書１２２を記憶部１２０に記憶させる（ステップＳ４０８）。これにより、本フローチャートの１ルーチンの処理が終了する。

上述した処理により、エージェント装置１００は、簡易に特定ワード辞書１２２を取得したり、より精度の高い特定ワード辞書１２２を取得したりすることができる。

［エージェント機能部の応答処理のモード設定］
エージェント機能部１５０は、ウエイクアップワードが男性または女性を示すワード（または名称）であると推定される場合、推定結果に基づいて音声による応答を含むサービスを提供する。推定結果に基づいて音声による応答を含むサービスを提供するとは、例えば、エージェント機能部１５０が、推定結果が男性の名称である場合、音声による応答を男性調の声色、または口調で提供し、推定結果が女性の名称である場合、音声による応答を女性調の声色、または口調で提供するである。

また、推定結果に基づいて音声による応答を含むサービスを提供するとは、例えば、エージェント機能部１５０が、音声による応答と画像とを含むサービスを提供することであってもよい。この場合、画像は、音声に応じた画像であり、例えば、推定結果が男性の名称である場合、男性の画像であり、推定結果が女性の名称である場合、女性の画像である。なお、エージェント装置１００は、ウエイクアップワードが第１種別または第２種別など複数の種別のうち、どの種別に分類されるかを判定し、判定結果に基づいて音声による応答を含むサービスを提供してもよい。

図１１は、エージェント装置１００により実行される応答処理のモード設定の処理の流れの一例を示すフローチャートである。本フローチャートの処理は、例えば、エージェント機能部１５０が起動した後の実行される処理である。

まず、エージェント装置１００のモード設定部１１５が、ウエイクアップワードを取得する（ステップＳ５００）。次に、モード設定部１１５は、性別情報１２４を参照して、ウエイクアップワードが、男性を示すワードであるかを判定する（ステップＳ５０２）。

性別情報１２４は、各国の男性または女性を示すワードを含む情報である。例えば、モード設定部１１５は、所定のワードがウエイクアップワードに含まれている場合、男性または女性として判定してもよいし、ウエイクアップワードに含まれるワードを分割して、各ワードに対するスコアを導出し、導出したスコアの統合結果に基づいて、ウエイクアップワードが男性または女性であるか判定してもよい。例えば、この場合、性別情報１２４において、ワードに対してスコアが付与されている。例えば、性別情報１２４において、女性を示すワードとして、「さち」のスコアが１点、ワードの最後が「こ」である場合のスコアが２点として登録されている場合、「さちこ」の合計のスコアが３点となる。例えば閾値が３点として設定されている場合、ウエイクアップワード「さちこ」は女性と判定される。

また、例えば、モード設定部１１５は、不図示の学習済モデルを用いて、男性を示すワードであるか、女性を示すワードであるかを判定してもよい。学習済モデルは、ニューラルネットワークなどのモデルである。例えば、学習済モデルは、不図示の学習装置が、ワードと性別とを示す情報を含む学習データを機械学習して生成したモデルである。例えば、学習装置は、男性が対応付けられたワードが入力された場合に男性である確率が高い情報を出力するように、または女性が対応付けられたワードが入力された場合に女性である確率が高い情報を出力するように学習データを学習したモデルである。また、乗員が音声などの入力を行ってウエイクアップワードの性別を指定してもよい。この場合、モード設定部１１５は、記憶部１２０に記憶され、且つ指定された情報に基づいて、ウエイクアップワードの性別を判定してもよい。

図１１の説明に戻る。ウエイクアップワードが男性を示すワードであると推定した場合、モード設定部１１５は、応答モードを男性モードに設定する（ステップＳ５０４）。ウエイクアップワードが女性を示すワードであると推定した場合、モード設定部１１５は、応答モードを女性モードに設定する（ステップＳ５０６）。例えば、モード設定部１１５は、設定したモード（モード情報１２６）を記憶部１２０に記憶させる。エージェント機能部１５０は、記憶部１２０に記憶されたモード情報１２６を参照して、モード設定部１１５により設定されたモードに基づいて、乗員の音声に応じて、音声による応答を含むサービスを提供する。

次に、モード設定部１１５は、エージェント機能部１５０がウエイクアップ状態から停止状態または休止状態に遷移したか否かを判定する（ステップＳ５０８）。停止状態または休止状態とは、再度、乗員がウエイクアップワードを入力しないと、エージェント機能部１５０が応答しない状態である。エージェント機能部１５０がウエイクアップ状態から停止状態または休止状態に遷移した場合、モード設定部１１５は、ステップＳ５０４またはＳ５０６で設定したモードをリセットする（ステップＳ５１０）。これにより、本フローチャートの１ルーチンの処理が終了する。

図１２は、エージェント機能部１５０が出力する情報の一例を示す図である。例えば、モード設定部１１５が、女性モードを設定したものとする。この場合、エージェント機能部１５０は、女性モードに基づいて、女性の声のトーンや、口調の応答（例えば「今日は、天気いいわね」）をスピーカユニット３０に出力させたり、女性の容姿を示すキャラクターＷを示す画像を表示・操作装置２０に表示させたりする。なお、男性モードが設定された場合、エージェント機能部１５０は、男性モードに基づいて、男性の声のトーンや、口調の応答（例えば「今日は、天気いいね」）をスピーカユニット３０に出力させたり、男性の容姿を示すキャラクターを示す画像を表示・操作装置２０に表示させたりする。

また、モードによって応答内容が異なっていてもよい。例えば、女性モードは、応答内容が女性の応答内容となるようなモードであり、男性モードは、応答内容が男性の応答内容となるようなモードであってもよい。例えば、女性モードである場合、エージェント機能部１５０は、ある物体に対して「かわいいね」と応答し、男性モードである場合、エージェント機能部１５０は、ある物体に対して「かっこいいね」と応答する。例えば、エージェント機能部１５０は、モードごとに用意された応答内容が規定された情報を参照して、応答を行ってもよい。

上述した処理により、エージェント装置１００は、利用者の嗜好に合った態様で応答を行うため、より利用者の満足度が向上する。

以上説明した第１実施形態によれば、車両の車室内で収音された乗員の音声に応じて、音声による応答を含むサービスを提供する一以上のエージェント機能部１５０と、乗員による入力を受け付ける音響処理部１１２と、音響処理部１１２により受け付けられた内容に基づいて、エージェント機能部１５０の起動方法を変更または追加するウエイクアップワード設定部１１４とを備えることにより、利用者の嗜好に合った起動方法を提供することができる。

＜第２実施形態＞
以下、第２実施形態について説明する。第２実施形態では、エージェント装置１００は、起動に用いられたウエイクアップワードに応じて、応答する際に参照する情報を変更する。以下、第１実施形態との相違点を中心に説明する。

図１３は、第２実施形態に係るエージェント装置１００Ａの構成と、車両Ｍに搭載された機器とを示す図である。エージェント装置１００Ａは、エージェント装置１００の記憶部１２０に代えて、記憶部１２０Ａを備える。記憶部１２０Ａには、記憶部１２０に記憶された情報に加え、ウエイクアップワード情報１２８と、通常モード履歴情報１３０と、シークレットモード履歴情報１３２とが記憶されている。ウエイクアップワード情報１２８、通常モード履歴情報１３０、およびシークレットモード履歴情報１３２の詳細については後述する。

［ウエイクアップワードの登録］
図１４は、乗員認識装置８０とエージェント装置１００とにより実行される処理の流れのフローチャートの一例を示す図（その１）である。本処理において、乗員認識装置８０の車室内カメラは、所定間隔で車室内の風景を撮像しているものとする。

まず、エージェント装置１００のウエイクアップワード設定部１１４が、シークレットモードにおけるウエイクアップワード（以下、特定ウエイクアップワード）の登録に関する音声が入力されたか否かを判定する（ステップＳ１０１－１）。特定ウエイクアップワードの登録に関する音声とは、例えば、「シークレットモードのウエイクアップワードの登録をお願い」などの音声である。シークレットモードとは、特定の乗員（例えばウエイクアップワードを登録した乗員）のみに対して、エージェント機能部１５０がサービスを提供するモードである。通常モードは、特定の乗員とは異なる乗員（不特定の乗員）に対して、エージェント機能部１５０がサービスを提供するモードである。

ステップＳ１０１－１で特定ウエイクアップワードの登録に関する音声が入力された場合、ウエイクアップワード設定部１１４は、ステップＳ１０１－１で音声が入力されたタイミングを乗員認識装置８０に送信する（ステップＳ１０１－２）。図１４のステップＳ１０２、Ｓ１０４、Ｓ１０６の処理は、図７のステップＳ１０２、Ｓ１０４、Ｓ１０６の処理と同様のため、説明を省略する。

乗員認識装置８０は、ステップＳ１０１－１で送信された音声が入力されたタイミングで撮像された画像を抽出する（ステップＳ６００）。次に、乗員認識装置８０は、抽出された画像に基づいて、ステップＳ１０１－１で音声を入力した乗員の特徴量を抽出する（ステップＳ６０２）。乗員の特徴量とは、例えば、乗員の顔の特徴量（例えば輝度値に基づく指標）の分布である。例えば、乗員認識装置８０は、乗員の口の状態や、音声が入力されたマイク１０の位置、マイク１０ごとの入力データに基づいて、ステップＳ１０１－１で音声を入力した乗員を特定する。

次に、乗員認識装置８０は、ステップＳ６０２で抽出した特徴量に識別情報を付与し（ステップＳ６０４）、付与した特徴量の識別情報をエージェント装置１００に送信する（ステップＳ６０６）。乗員認識装置８０の記憶装置には、抽出した特徴量と識別情報とが対応付けられた情報が記憶されている。なお、乗員認識装置８０が、過去の処理において、ステップＳ６０４で抽出した特徴量に識別情報を既に付与している場合、その識別情報が援用される。

次に、ウエイクアップワード設定部１１４は、ステップＳ６０６で送信された特徴量の識別情報を取得し、取得した識別情報を入力されたウエイクアップワードに対応付けて登録する（ステップＳ１０５）。これによりウエイクアップワード情報１２８が生成される。次に、ウエイクアップワード設定部１１４は、特定ウエイクアップワードを登録したことを示す音声を、エージェント機能部１５０に出力させる（ステップＳ１０９）。例えば、エージェント機能部１５０は、「あなたが入力した・・・をシークレットモードにおけるウエイクアップワードとして登録します」などの音声を出力する。これにより、本フローチャートの１ルーチンの処理が終了する。

図１５は、ウエイクアップワード情報１２８の内容の一例を示す図である。ウエイクアップワード情報１２８は、シークレットモードにおいて登録された特徴量の識別情報と特定ウエイクアップワードとが対応付けられた情報、および通常モードにおいて変更または追加されたウエイクアップワード（特徴量の識別情報が対応付けられていないウエイクアップワード）を含む情報である。通常モードにおけるウエイクアップワードの変更処理は、図７のフローチャートの処理が援用される。

上述した処理により、特定ウエイクアップワードが登録される。

なお、シークレットモードにおけるウエイクアップワードの登録は、ウエイクアップワードを入力した乗員とは異なる乗員が存在する場合、行われなくてもよい。

また、図１４で説明した乗員認識装置８０の一部または全部の処理はエージェント装置１００Ａにおいて行われてもよい。例えば、エージェント装置１００が、画像から特徴量を抽出してもよい。

［エージェント機能部の起動処理］
図１６は、乗員認識装置８０とエージェント装置１００とにより実行される処理の流れのフローチャートの一例を示す図（その２）である。本処理は、エージェント装置１００が、乗員検知装置８０の検知結果に基づいて、特定ウエイクアップワード（第１起動キーワード）を起動キーワードとして設定した第１乗員とは異なる乗員により特定ウエイクアップワードが入力されたと判定された場合、特定ウエイクアップワードに応じて起動せず、乗員検知装置８０の検知結果に基づいて、第１乗員により特定ウエイクアップワードが入力されたと判定された場合、特定ウエイクアップワードに応じて起動する。本処理において、乗員認識装置８０の車室内カメラは、所定間隔で車室内の風景を撮像しているものとする。

エージェントごとＷＵ判定部１１３が、音声が入力されたか否かを判定する（ステップＳ７００）。音声が入力された場合、エージェントごとＷＵ判定部１１３は、ウエイクアップワード情報１２８を参照して、入力された音声から得られた情報が、特定ウエイクアップワードに合致するか否を判定する（ステップＳ７０２）。

入力された音声から得られた情報が、特定ウエイクアップワードに合致しないと判定された場合、エージェントごとＷＵ判定部１１３は、ウエイクアップワード情報１２８を参照して、入力された音声から得られた情報が、通常モードにおけるウエイクアップワードに合致するか否を判定する（ステップＳ７０４）。入力された音声から得られた情報が、通常モードにおけるウエイクアップワードに合致しない場合、本フローチャートの１ルーチンの処理が終了する。

入力された音声から得られた情報が、通常モードにおけるウエイクアップワードに合致すると判定された場合、エージェントごとＷＵ判定部１１３は、対応するエージェント機能部１５０を通常モードで起動させる（ステップＳ７０６）。次に、エージェント機能部１５０は、入力された音声に応じて、音声制御部１１８に音声を出力させ（ステップＳ７０８）、本フローチャートの１ルーチンの処理が終了する。

ステップＳ７０２で入力された音声から得られた情報が特定ウエイクアップワードに合致すると判定された場合、エージェントごとＷＵ判定部１１３は、音声が入力されたタイミングを示す情報、音声を入力した乗員の特徴量の識別情報の送信依頼、および同乗者の有無に関する情報の送信依頼を乗員認識装置８０に送信する（ステップＳ７１０）。

乗員認識装置８０は、ステップＳ７１０で送信された依頼に応じて、音声が入力されたタイミングに撮像された画像を取得する（ステップＳ８００）。次に、乗員認識装置８０は、ステップＳ８００で取得した画像に基づいて、音声を入力した人物の特徴量を抽出し、更に、自装置の記憶装置に記憶された図１４のフローチャートの処理結果を参照し、抽出した乗員の特徴量の識別情報を特定する（ステップＳ８０２）。次に、乗員認識装置８０は、ステップＳ８００で取得した画像に基づいて、音声を入力した人物以外の人物が車室内に存在するか否かを判定する（ステップＳ８０４）。

次に、乗員認識装置８０は、ステップＳ８０２、およびステップＳ８０４で得られた情報を、エージェント装置１００に送信する（ステップＳ８０６）。ステップＳ８０２、およびステップＳ８０４で得られた情報は、音声を入力した乗員の特徴量の識別情報、および同乗者の有無に関する情報（音声を入力した乗員以外の乗員が車室内に存在するか否かを示す情報）である。

次に、エージェントごとＷＵ判定部１１３は、ステップＳ８０６で送信された情報を取得し、ウエイクアップワード情報１２８を参照して、取得した特徴量の識別情報がステップＳ７００で入力されたウエイクアップワードに対応付けられ、且つ同乗者が存在しないか否かを判定する（ステップＳ７１２）。取得した特徴量の識別情報がステップＳ７００で入力されたウエイクアップワードに対応付けられていない、または同乗者が存在する場合、本フローチャートの１ルーチンの処理が終了する。

取得した特徴量の識別情報がステップＳ７００で入力されたウエイクアップワードに対応付けられ、且つ同乗者が存在しない場合、エージェントごとＷＵ判定部１１３は、対応するエージェント機能部１５０をシークレットモードで起動させる（ステップＳ７０６）。次に、エージェント機能部１５０は、入力された音声に応じて、音声制御部１１８に音声を出力させ（ステップＳ７０８）、本フローチャートの１ルーチンの処理が終了する。

上述した処理により、エージェント装置１００は、登録されたウエイクアップワードに応じて、制御モードを切り替える。この結果、乗員は、所望のモードでエージェント機能部１５０を起動させることができる。

上記の例では、画像から得られた特徴量が用いられるものとしたが、特徴量は画像から得られた特徴量に代えて（または加えて）音声から得られた声の特徴量（音声の特徴情報）であってもよい。

また、シークレットモードにおけるエージェント機能部１５０の起動条件は、特定ウエイクアップワードを登録した乗員のみが車室内に存在していること、に代えて（加えて）、シークレットモードにおけるウエイクアップワードを登録した際に乗車していた乗員のみが存在することであってもよいし、指定された乗員が乗車していることであってもよい。この場合、図１４の処理において、各乗員の特徴量の識別情報が特定ウエイクアップワードに対応付けられ、図１６の処理において、特定ウエイクアップワードに対応付けられた識別情報が付与された乗員の乗車が判定される。

上記のステップＳ７１２の処理において、同乗者の有無の判定は、省略されてもよい。すなわち、特定ウエイクアップワードを登録した乗員が、特定ウエイクアップワードを入力した場合、シークレットモードでエージェント機能部１５０は起動してもよい。この場合、同乗者の有無に関する情報の送受信は省略される。

また、エージェント機能部１５０は、乗員検知装置８０の検知結果に基づいて、特定ウエイクアップワードが入力された場合において、特定ウエイクアップワードに対応付けられた第１乗員以外の乗員が車両の車室内に存在すると判定された場合、特定ウエイクアップワードに応じて起動せず、乗員検知装置８０の検知結果に基づいて、特定ウエイクアップワードが入力された場合において、特定ウエイクアップワードに対応付けられた第１乗員以外の乗員が車両の車室内に存在しないと判定された場合、特定ウエイクアップワードに応じて起動してもよい。

［エージェント機能部の起動後の処理］
図１７は、エージェント装置１００により実行される応答処理における処理の一部の流れの一例を示すフローチャートである。エージェント機能部１５０は、エージェント機能部１５０が特定ウエイクアップワードとは異なる起動キーワードで起動した場合、特定ウエイクアップワードで起動した際の動作履歴を参照しない。本フローチャートの処理は、例えば、エージェント機能部１５０が起動した後に実行される処理（例えば、ステップＳ７０６の処理で起動した際に行われる処理）である。

まず、エージェント装置１００のモード設定部１１５が、シークレットモードで起動したか否かを判定する（ステップＳ９００）。シークレットモードで起動した場合、モード設定部１１５は、エージェント機能部１５０にシークレットモード履歴情報１３２を参照させる設定を行う（ステップＳ９０２）。シークレットモード履歴情報１３２は、エージェント機能部１５０がシークレットモードに設定されていた際に行われた処理の履歴の情報である。

シークレットモードで起動していない場合（通常モードで起動した場合）、モード設定部１１５は、エージェント機能部１５０に通常モード履歴情報１３０を参照させる設定を行う（ステップＳ９０４）。通常モード履歴情報１３０は、エージェント機能部１５０が通常モードに設定されていた際に行われた処理の履歴の情報である。これにより、エージェント機能部１５０は、ステップＳ９０２またはＳ９０４で設定されたモードに応じた処理の履歴を参照して、乗員の音声に応じた応答を行う。

次に、モード設定部１１５は、エージェント機能部１５０がウエイクアップ状態から停止状態または休止状態に遷移したか否かを判定する（ステップＳ９０６）。エージェント機能部１５０がウエイクアップ状態から停止状態または休止状態に遷移した場合、モード設定部１１５は、ステップＳ９０２またはＳ９０６における設定をリセットする（ステップＳ５１０）。
これにより、本フローチャートの１ルーチンの処理が終了する。

上述した処理により、エージェント機能部１５０は、起動したモードの履歴を参照して、応答を行うため、乗員の利便性や満足度が向上する。

図１８は、シークレットモードで起動したエージェント機能部１５０が行う応答の一例を示す図である。例えば、過去に、エージェント機能部１５０がシークレットモードで起動した際に、乗員が、「一人でおいしいステーキが食べられる店を教えて」と発話して、エージェントが、「〇〇にある××はどう」と発話していた場合、この会話の内容はシークレットモード履歴情報１３２に記憶されている。その後、乗員がシークレットモードでエージェント機能部１５０を起動させた場合、例えば、エージェント機能部１５０は、シークレットモード履歴情報１３２を参照して、「この前は、一人でおいしいステーキが食べたいっていったから、〇〇にある××にいったけど、今日はどうする」と発話する。

このように、シークレットモードにおいて行われた会話は、シークレットモードにおいてのみ参照され、通常モードでは参照されないため、乗員のプライバシーを配慮したサービスが提供される。

以上説明した第２実施形態によれば、管理部１１０が、車両の乗員を検知する乗員認識装置８０の検知結果を用いて、ウエイクアップワードを設定したり、変更したりするため、利用者の嗜好に合った起動方法を提供することができる。

上記の各実施形態において、管理部１１０（１１０Ａ）は、複数のエージェント機能部１５０のうち、全部または一部のエージェント機能部１５０の起動方法を変更または追加してもよい。例えば、管理部１１０は、乗員に指定されたエージェント機能部１５０または所定のエージェント機能部１５０の起動方法の変更または追加を行う。

［変形例（その１）］
図１９は、変形例のエージェント装置１００Ｂの機能構成の一例を示す図である。エージェント装置１００Ｂは、管理部１１０に代えて、管理部１１０－１～１１０－３を備える。管理部１１０－１～１１０－３のそれぞれは、管理部１１０と同様の機能構成を備える。管理部１１０－１～１１０－３のそれぞれは、例えば、対応するエージェント機能部１５０の起動方法の変更または追加を行う。

なお、上記各実施形態における乗員認識装置８０またはエージェント装置１００において行われた処理の一部または全部は、他の装置において行われてもよい。また、上記の各フローチャートの処理の順番は適宜変更されてもよいし、処理の一部は省略されてもよい。

［変形例（その２）］
ウエイクアップワード設定部１１４が、乗員が行った行動に基づいて、エージェント機能部１５０の起動方法の変更または追加を行ってもよい。行動とは、例えば、手拍子や、視線の動き、ジェスチャーなどである。例えば、ウエイクアップワード設定部１１４が、乗員認識装置８０により認識された乗員の行動が、エージェント機能部１５０の起動方法の変更または追加を行う行動である場合、その行動をエージェント機能部１５０の起動のトリガーとして設定する。この場合、エージェントごとＷＵ判定部１１３がエージェント機能部１５０の起動のトリガーである行動が乗員によって行われた場合、対応するエージェント機能部１５０を起動させる。

以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。

１エージェントシステム、１０‥マイク、２０‥表示・操作装置、３０‥スピーカユニット、７０‥汎用通信装置、８０‥乗員認識装置、１００‥エージェント装置、１１０、１１０Ａ‥管理部、１１２‥音響処理部、１１３‥エージェントごとＷＵ判定部、１１４‥ウエイクアップワード設定部、１１５‥モード設定部、１１６‥表示制御部、１１８‥音声制御部、１１８‥音声制御部、１１９‥生成部、１２０、１２０Ａ‥記憶部、１２２‥特定ワード辞書、１２４‥性別情報、１２６‥モード情報、１２８‥ウエイクアップワード情報、１３０‥通常モード履歴情報、１３２‥シークレットモード履歴情報、１５０‥エージェント機能部、２００‥エージェントサーバ

Claims

車両の車室内で収音された乗員の音声に応じて、音声による応答を含むサービスを提供する一以上のエージェント機能部と、
前記乗員による入力を受け付ける受付部と、
前記受付部により受け付けられた内容に基づいて、前記エージェント機能部の起動方法を変更または追加する起動方法設定部と、を備え、
前記エージェント機能部は、前記音声に含まれ、前記起動方法設定部によって設定された起動方法に基づく起動キーワードに応じて起動し、
前記起動方法設定部は、記憶部に記憶された特定ワードを起動キーワードから除外し、
前記特定ワードは、記憶部に記憶された前記車両の前記乗員に関連ある人物の、名前、苗字、氏名、愛称、または通称のうち、一部または全部を含む、
エージェント装置。
前記エージェント装置は、前記車両の前記乗員に関連ある人物の、名前、苗字、氏名、愛称、または通称のうち、一部または全部を、前記特定ワードとして前記記憶部に記憶させる、
請求項１に記載のエージェント装置。
前記エージェント機能部は、前記設定された起動キーワードが男性を示すワードであると推定される場合、推定の結果に基づいて前記音声による応答を含むサービスを提供する、
請求項１または２に記載のエージェント装置。
前記エージェント機能部は、前記推定の結果に基づいて、前記音声による応答を男性調の声色、または口調で提供する、
請求項３に記載のエージェント装置。
前記エージェント機能部は、前記設定された起動キーワードが女性を示すワードであると推定される場合、前記推定の結果に基づいて前記音声による応答を含むサービスを提供する、
請求項１から４のうちいずれか１項に記載のエージェント装置。
前記エージェント機能部は、前記推定の結果に基づいて、前記音声による応答を女性調の声色、または口調で提供する、
請求項５に記載のエージェント装置。
前記車両の乗員を検知する乗員検知部を更に備え、
前記エージェント機能部は、
前記乗員検知部の検知結果に基づいて、前記受付部を介して第１起動キーワードを起動キーワードとして設定した第１乗員とは異なる乗員により前記第１起動キーワードが入力されたと判定された場合、前記第１起動キーワードに応じて起動せず、
前記乗員検知部の検知結果に基づいて、前記受付部を介して第１乗員により前記第１起動キーワードが入力されたと判定された場合、前記第１起動キーワードに応じて起動する、
請求項１から６のうちいずれか１項に記載のエージェント装置。
車両の車室内で収音された乗員の音声に応じて、音声による応答を含むサービスを提供する一以上のエージェント機能部と、
前記乗員による入力を受け付ける受付部と、
前記受付部により受け付けられた内容に基づいて、前記エージェント機能部の起動方法を変更または追加する起動方法設定部と、
前記車両の乗員を検知する乗員検知部と、を備え、
前記エージェント機能部は、
前記音声に含まれ、前記起動方法設定部によって設定された起動方法に基づく起動キーワードに応じて起動し、
前記乗員検知部の検知結果に基づいて、第１起動キーワードが入力された場合において、前記第１起動キーワードに対応付けられた第１乗員以外の乗員が前記車両の車室内に存在すると判定された場合、前記第１起動キーワードに応じて起動せず、
前記乗員検知部の検知結果に基づいて、前記第１起動キーワードが入力された場合において、前記第１起動キーワードに対応付けられた第１乗員以外の乗員が前記車両の車室内に存在しないと判定された場合、前記第１起動キーワードに応じて起動する、
エージェント装置。
前記エージェント機能部は、前記エージェント機能部が前記第１起動キーワードとは異なる起動キーワードで起動した場合、前記第１起動キーワードで起動した際の動作履歴を参照しない、
請求項８に記載のエージェント装置。
車両の車室内で収音された乗員の音声に応じて、音声による応答を含むサービスを提供する一以上のエージェント機能部と、
前記乗員による入力を受け付ける受付部と、
前記受付部により受け付けられた内容に基づいて、前記エージェント機能部の起動方法を変更または追加する起動方法設定部と、
乗員を撮像する車室内カメラと、
第１乗員が撮像された画像から抽出された特徴量と前記第１乗員の識別情報とが対応付けられた第１参照情報を参照して、前記受付部を介して第１起動キーワードが入力されたときに前記車室内カメラにより撮像された画像を取得して、取得した画像から抽出された特徴量が前記第１乗員の識別情報に対応付けられた特徴量に合致するか否かを判定する乗員検知部と、を備え、
前記第１起動キーワードは、前記第１乗員が設定した前記エージェント機能部を起動させる起動キーワードであり、
前記エージェント機能部は、
前記第１起動キーワードが入力された時に、前記乗員検知部が前記画像から抽出された特徴量が前記第１乗員の識別情報に対応付けられた特徴量に合致しないと判定したことによって前記第１乗員が前記第１起動キーワードを入力していないと判定した場合、前記第１起動キーワードに応じて起動せず、
前記第１起動キーワードが入力された時に、前記乗員検知部が前記画像から抽出された特徴量が前記第１乗員の識別情報に対応付けられた特徴量に合致すると判定したことによって前記第１乗員が前記第１起動キーワードを入力したと判定した場合、前記第１起動キーワードに応じて起動する、
エージェント装置。
コンピュータが、
車両の乗員による入力を受け付ける受付部により受け付けられた内容に基づいて、前記車両の車室内で収音された乗員の音声に応じて、音声による応答を含むサービスを提供し、前記音声に含まれ、設定された起動方法に基づく起動キーワードに応じて起動する一以上のエージェント機能部の起動方法を変更または追加する処理と、
記憶部に記憶された特定ワードを起動キーワードから除外する処理と、を実行し、
前記特定ワードは、記憶部に記憶された前記車両の前記乗員に関連ある人物の、名前、苗字、氏名、愛称、または通称のうち、一部または全部を含む、
エージェント装置の制御方法。
コンピュータに、
車両の乗員による入力を受け付ける受付部により受け付けられた内容に基づいて、前記車両の車室内で収音された乗員の音声に応じて、音声による応答を含むサービスを提供し、前記音声に含まれ、設定された起動方法に基づく起動キーワードに応じて起動する一以上のエージェント機能部の起動方法を変更または追加する処理と、
記憶部に記憶された特定ワードを起動キーワードから除外する処理と、を実行させ、
前記特定ワードは、記憶部に記憶された前記車両の前記乗員に関連ある人物の、名前、苗字、氏名、愛称、または通称のうち、一部または全部を含む、
プログラム。
コンピュータが、
車両の乗員による入力を受け付ける受付部により受け付けられた内容に基づいて、前記車両の車室内で収音された乗員の音声に応じて、音声による応答を含むサービスを提供し、前記音声に含まれ、設定された起動方法に基づく起動キーワードに応じて起動する一以上のエージェント機能部の起動方法を変更または追加する処理と、
前記車両の乗員を検知する乗員検知部の検知結果に基づいて、第１起動キーワードが入力された場合において、前記第１起動キーワードに対応付けられた第１乗員以外の乗員が前記車両の車室内に存在すると判定された場合、前記第１起動キーワードに応じて前記エージェント機能部を起動させず、
前記乗員検知部の検知結果に基づいて、前記第１起動キーワードが入力された場合において、前記第１起動キーワードに対応付けられた第１乗員以外の乗員が前記車両の車室内に存在しないと判定された場合、前記第１起動キーワードに応じて前記エージェント機能部を起動させる、処理と、
を実行するエージェント装置の制御方法。
コンピュータに、
車両の乗員による入力を受け付ける受付部により受け付けられた内容に基づいて、前記車両の車室内で収音された乗員の音声に応じて、音声による応答を含むサービスを提供し、前記音声に含まれ、設定された起動方法に基づく起動キーワードに応じて起動する一以上のエージェント機能部の起動方法を変更または追加する処理と、
前記車両の乗員を検知する乗員検知部の検知結果に基づいて、第１起動キーワードが入力された場合において、前記第１起動キーワードに対応付けられた第１乗員以外の乗員が前記車両の車室内に存在すると判定された場合、前記第１起動キーワードに応じて前記エージェント機能部を起動させず、
前記乗員検知部の検知結果に基づいて、前記第１起動キーワードが入力された場合において、前記第１起動キーワードに対応付けられた第１乗員以外の乗員が前記車両の車室内に存在しないと判定された場合、前記第１起動キーワードに応じて前記エージェント機能部を起動させる、処理と、
を実行させるプログラム。
コンピュータが、
車両の乗員による入力を受け付ける受付部により受け付けられた内容に基づいて、前記車両の車室内で収音された乗員の音声に応じて、音声による応答を含むサービスを提供する一以上のエージェント機能部の起動方法を変更または追加する処理と、
第１乗員が撮像された画像から抽出された特徴量と前記第１乗員の識別情報とが対応付けられた第１参照情報を参照して、前記受付部を介して前記第１乗員が設定した前記エージェント機能部を起動させる第１起動キーワードが入力されたときに乗員を撮像する車室内カメラにより撮像された画像を取得して、取得した画像から抽出された特徴量が前記第１乗員の識別情報に対応付けられた特徴量に合致するか否かを判定する処理と、
前記第１起動キーワードが入力された時に、前記判定する処理において前記画像から抽出された特徴量が前記第１乗員の識別情報に対応付けられた特徴量に合致しないと判定したことによって前記第１乗員が前記第１起動キーワードを入力していないと判定した場合、前記第１起動キーワードに応じて起動せず、
前記第１起動キーワードが入力された時に、前記判定する処理において前記画像から抽出された特徴量が前記第１乗員の識別情報に対応付けられた特徴量に合致すると判定したことによって前記第１乗員が前記第１起動キーワードを入力したと判定した場合、前記第１起動キーワードに応じて起動する処理と、
を実行するエージェント装置の制御方法。
コンピュータに、
車両の乗員による入力を受け付ける受付部により受け付けられた内容に基づいて、前記車両の車室内で収音された乗員の音声に応じて、音声による応答を含むサービスを提供する一以上のエージェント機能部の起動方法を変更または追加する処理と、
第１乗員が撮像された画像から抽出された特徴量と前記第１乗員の識別情報とが対応付けられた第１参照情報を参照して、前記受付部を介して前記第１乗員が設定した前記エージェント機能部を起動させる第１起動キーワードが入力されたときに乗員を撮像する車室内カメラにより撮像された画像を取得して、取得した画像から抽出された特徴量が前記第１乗員の識別情報に対応付けられた特徴量に合致するか否かを判定する処理と、
前記第１起動キーワードが入力された時に、前記判定する処理において前記画像から抽出された特徴量が前記第１乗員の識別情報に対応付けられた特徴量に合致しないと判定したことによって前記第１乗員が前記第１起動キーワードを入力していないと判定した場合、前記第１起動キーワードに応じて起動せず、
前記第１起動キーワードが入力された時に、前記判定する処理において前記画像から抽出された特徴量が前記第１乗員の識別情報に対応付けられた特徴量に合致すると判定したことによって前記第１乗員が前記第１起動キーワードを入力したと判定した場合、前記第１起動キーワードに応じて起動する処理と、
を実行させるプログラム。