JP2020157854A - エージェント装置、エージェント装置の制御方法、およびプログラム - Google Patents
エージェント装置、エージェント装置の制御方法、およびプログラム Download PDFInfo
- Publication number
- JP2020157854A JP2020157854A JP2019057644A JP2019057644A JP2020157854A JP 2020157854 A JP2020157854 A JP 2020157854A JP 2019057644 A JP2019057644 A JP 2019057644A JP 2019057644 A JP2019057644 A JP 2019057644A JP 2020157854 A JP2020157854 A JP 2020157854A
- Authority
- JP
- Japan
- Prior art keywords
- agent
- conversation
- driver
- function unit
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W50/08—Interaction between the driver and the control system
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W40/00—Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W50/08—Interaction between the driver and the control system
- B60W50/14—Means for informing the driver, warning the driver or prompting a driver intervention
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W2050/0001—Details of the control system
- B60W2050/0043—Signal treatments, identification of variables or parameters, parameter estimation or state estimation
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W50/08—Interaction between the driver and the control system
- B60W50/14—Means for informing the driver, warning the driver or prompting a driver intervention
- B60W2050/146—Display means
Landscapes
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Transportation (AREA)
- Mechanical Engineering (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
【課題】利用者にとって好ましい態様で車両に搭載された機器の制御が実現されるエージェント装置、エージェント装置の制御方法、およびプログラムを提供すること。【解決手段】エージェント装置(100)は、車両(M)の乗員の発話に応じて、音声による応答を含むサービスを提供するエージェント機能部(150)と、前記車両の乗員のうち運転者と前記エージェント機能部とが会話をしている場合において、車室内の音響環境を変化させる特定機器を作動させる操作を前記運転者とは異なる同乗者が行った場合には、前記会話の終了後に前記特定機器を作動させる制御部(122)とを備える。【選択図】図2
Description
本発明は、エージェント装置、エージェント装置の制御方法、およびプログラムに関する。
従来、車両の乗員と対話を行いながら、乗員の要求に応じた運転支援に関する情報や車両の制御、その他のアプリケーション等を提供するエージェント機能に関する技術が開示されている(例えば、特許文献1参照)。
近年では、エージェント機能を車両に搭載することについて実用化が進められているが、エージェント機能におけるサービスの提供と車両に搭載された機器の制御について十分に検討されていなかった。このため、従来の技術では、乗員にとって好ましくない態様で車両に搭載された機器の制御が行われる場合があった。
本発明は、このような事情を考慮してなされたものであり、利用者にとって好ましい態様で車両に搭載された機器の制御が実現できるエージェント装置、エージェント装置の制御方法、およびプログラムを提供することを目的の一つとする。
この発明に係るエージェント装置、エージェント装置の制御方法、およびプログラムは、以下の構成を採用した。
(1):この発明の一態様に係るエージェント装置は、車両の乗員の発話に応じて、音声による応答を含むサービスを提供するエージェント機能部と、前記車両の乗員のうち運転者と前記エージェント機能部とが会話をしている場合において、車室内の音響環境を変化させる特定機器を作動させる操作を前記運転者とは異なる同乗者が行った場合には、前記会話の終了後に前記特定機器を作動させる制御部とを備えるエージェント装置である。
(1):この発明の一態様に係るエージェント装置は、車両の乗員の発話に応じて、音声による応答を含むサービスを提供するエージェント機能部と、前記車両の乗員のうち運転者と前記エージェント機能部とが会話をしている場合において、車室内の音響環境を変化させる特定機器を作動させる操作を前記運転者とは異なる同乗者が行った場合には、前記会話の終了後に前記特定機器を作動させる制御部とを備えるエージェント装置である。
(2):上記(1)の態様において、前記運転者と前記エージェント機能部とが会話を行っているか否かを認識する会話状態認識部を更に備えるものである。
(3):上記(1)または(2)の態様において、前記エージェント機能部と会話をしている乗員が、運転者であるか否かを認識する会話状態認識部を更に備えるものである。
(4):上記(1)から(3)のいずれかの態様において、前記運転者と前記エージェント機能部とが会話を行っているか否かの会話認識をサーバ装置に依頼し、前記サーバ装置により送信された会話認識の結果に基づいて、前記運転者と前記エージェント機能部とが会話を行っているか否かの認識を行う会話状態認識部を更に備えるものである。
(5):上記(2)から(4)のいずれかの態様において、前記エージェント機能部と会話をしている乗員が、運転者であるか否かの乗員認識をサーバ装置に依頼し、前記サーバ装置により送信された乗員認識の結果に基づいて、前記乗員が運転者であるか否かの認識を行う会話状態認識部を更に備えるものである。
(6):上記(2)から(4)のいずれかの態様において、前記音響環境を変化させる前記特定機器を作動させる操作とは、車室内の音響環境を前記エージェント機能部に対して音が伝わりにくくなる環境にする操作であるものである。
(7):上記(1)から(6)のいずれかの態様において、前記制御部は、前記同乗者と前記エージェント機能部とが会話をしている場合において、前記音響環境を変化させる特定機器を作動させる操作を前記運転者が行った場合には、前記会話の終了に関係なく前記特定機器を作動させるものである。
(8):上記(1)から(7)のいずれかの態様において、前記特定機器は、空調装置、パワーウインドウ、またはオーディオのうち一以上の機器を含むものである。
(9):上記(1)から(8)のいずれかの態様において、前記操作は、音声入力による操作、または所定のスイッチに対する操作であるものである。
(10):上記(1)から(9)のいずれかの態様において、前記制御部は、前記運転者と前記エージェント機能部とが会話をしている場合において、パワーウインドウを開状態または全開状態に近づける操作を前記同乗者が行った場合には、前記会話の終了後に前記パワーウインドウが開状態または全開状態に近づくように前記パワーウインドウを作動させるものである。
(11):上記(1)から(10)のいずれかの態様において、前記制御部は、前記同乗者と前記エージェント機能部とが会話をしている場合において、パワーウインドウを開状態または全開状態に近づける操作を前記運転者が行った場合には、前記会話の終了に関係なく前記パワーウインドウが開状態または全開状態に近づくように前記パワーウインドウを作動させるものである。
(12):上記(1)から(11)のいずれかの態様において、前記制御部は、前記運転者と前記エージェント機能部とが会話をしている場合において、空調装置を稼働させる、または前記空調装置の出力度合を上昇させる操作を前記同乗者が行った場合には、前記会話の終了後に前記空調装置を稼働または前記出力度合を上昇させるものである。
(13):上記(1)から(12)のいずれかの態様において、前記制御部は、前記同乗者と前記エージェント機能部とが会話をしている場合において、空調装置を稼働させる、または前記空調装置の出力度合を上昇させる操作を前記運転者が行った場合には、前記会話の終了に関係なく前記空調装置を稼働または前記出力度合を上昇させるものである。
(14):上記(1)から(13)のいずれかの態様において、前記制御部は、前記運転者と前記エージェント機能部とが会話をしている場合において、オーディオを稼働させる、またはオーディオにより出力される音を上昇させる操作を前記同乗者が行った場合には、前記会話の終了後に、前記操作に応じて前記オーディオを作動させるものである。
(15):上記(1)から(14)のいずれかの態様において、前記制御部は、前記同乗者と前記エージェント機能部とが会話をしている場合において、オーディオを稼働させる、または前記オーディオにより出力される音を上昇させる操作を前記運転者が行った場合には、前記会話の終了に関係なく前記操作に応じて前記オーディオを作動させるものである。
(16):この発明の一態様に係るエージェント装置の制御方法は、コンピュータが、車両の乗員の発話に応じて、音声による応答を含むサービスを提供するエージェント機能部に、前記サービスを提供させ、前記車両の乗員のうち運転者と前記エージェント機能部とが会話をしている場合において、車室内の音響環境を変化させる特定機器を作動させる操作を前記運転者とは異なる同乗者が行った場合には、前記会話の終了後に前記特定機器を作動させるエージェント装置の制御方法である。
(17):この発明の一態様に係るプログラムは、コンピュータに、車両の乗員の発話に応じて、音声による応答を含むサービスを提供するエージェント機能部を用いて前記サービスを提供させ、前記車両の乗員のうち運転者と前記エージェント機能部とが会話をしている場合において、車室内の音響環境を変化させる特定機器を作動させる操作を前記運転者とは異なる同乗者が行った場合には、前記会話の終了後に前記特定機器を作動させるプログラムである。
(1)−(17)によれば、制御部が、会話の終了後に特定機器を作動させることにより、利用者にとって好ましい態様で車両に搭載された機器の制御が実現できる。
以下、図面を参照し、本発明のエージェント装置、エージェント装置の制御方法、およびプログラムの実施形態について説明する。
<第1実施形態>
エージェント装置は、エージェントシステムの一部または全部を実現する装置である。以下では、エージェント装置の一例として、車両(以下、車両M)に搭載され、複数種類のエージェント機能を備えたエージェント装置について説明する。エージェント機能とは、例えば、車両Mの乗員と対話をしながら、乗員の発話の中に含まれる要求(コマンド)に基づく各種の情報提供を行ったり、ネットワークサービスを仲介したりする機能である。また、エージェント機能の中には、車両内の機器(例えば運転制御や車体制御に関わる機器)の制御等を行う機能を有するものがあってよい。
エージェント機能は、例えば、乗員の音声を認識する音声認識機能(音声をテキスト化する機能)に加え、自然言語処理機能(テキストの構造や意味を理解する機能)、対話管理機能、ネットワークを介して他装置を検索し、或いは自装置が保有する所定のデータベースを検索するネットワーク検索機能等を統合的に利用して実現される。これらの機能の一部または全部は、AI(Artificial Intelligence)技術によって実現されてよい。また、これらの機能を行うための構成の一部(特に、音声認識機能や自然言語処理解釈機能)は、車両Mの車載通信装置または車両Mに持ち込まれた汎用通信装置と通信可能なエージェントサーバ(外部装置)に搭載されてもよい。以下の説明では、構成の一部がエージェントサーバに搭載されており、エージェント装置とエージェントサーバが協働してエージェントシステムを実現することを前提とする。また、エージェント装置とエージェントサーバが協働して仮想的に出現させるサービス提供主体(サービス・エンティティ)をエージェントと称する。
<全体構成>
図1は、エージェント装置100を含むエージェントシステム1の構成図である。エージェントシステム1は、例えば、エージェント装置100と、複数のエージェントサーバ200−1、200−2、200−3、…とを備える。符号の末尾のハイフン以下の数字は、エージェントを区別するための識別子であるものとする。いずれのエージェントサーバであるかを区別しない場合、単にエージェントサーバ200と称する場合がある。図1では3つのエージェントサーバ200を示しているが、エージェントサーバ200の数は2つであってもよいし、4つ以上であってもよい。それぞれのエージェントサーバ200は、互いに異なるエージェントシステムの提供者が運営するものである。従って、本発明におけるエージェントは、互いに異なる提供者により実現されるエージェントである。提供者としては、例えば、自動車メーカー、ネットワークサービス事業者、電子商取引事業者、携帯端末の販売者などが挙げられ、任意の主体(法人、団体、個人等)がエージェントシステムの提供者となり得る。
図1は、エージェント装置100を含むエージェントシステム1の構成図である。エージェントシステム1は、例えば、エージェント装置100と、複数のエージェントサーバ200−1、200−2、200−3、…とを備える。符号の末尾のハイフン以下の数字は、エージェントを区別するための識別子であるものとする。いずれのエージェントサーバであるかを区別しない場合、単にエージェントサーバ200と称する場合がある。図1では3つのエージェントサーバ200を示しているが、エージェントサーバ200の数は2つであってもよいし、4つ以上であってもよい。それぞれのエージェントサーバ200は、互いに異なるエージェントシステムの提供者が運営するものである。従って、本発明におけるエージェントは、互いに異なる提供者により実現されるエージェントである。提供者としては、例えば、自動車メーカー、ネットワークサービス事業者、電子商取引事業者、携帯端末の販売者などが挙げられ、任意の主体(法人、団体、個人等)がエージェントシステムの提供者となり得る。
エージェント装置100は、ネットワークNWを介してエージェントサーバ200と通信する。ネットワークNWは、例えば、インターネット、セルラー網、Wi−Fi網、WAN(Wide Area Network)、LAN(Local Area Network)、公衆回線、電話回線、無線基地局などのうち一部または全部を含む。ネットワークNWには、各種ウェブサーバ300が接続されており、エージェントサーバ200またはエージェント装置100は、ネットワークNWを介して各種ウェブサーバ300からウェブページを取得することができる。
エージェント装置100は、車両Mの乗員と対話を行い、乗員からの音声をエージェントサーバ200に送信し、エージェントサーバ200から得られた回答を、音声出力や画像表示の形で乗員に提示する。
<第1実施形態>
[車両]
図2は、第1実施形態に係るエージェント装置100の構成と、車両Mに搭載された機器とを示す図である。車両Mには、例えば、一以上のマイク10と、表示・操作装置20と、スピーカユニット30と、ナビゲーション装置40と、車両機器50と、車載通信装置60と、乗員認識装置80と、エージェント装置100とが搭載される。また、スマートフォンなどの汎用通信装置70が車室内に持ち込まれ、通信装置として使用される場合がある。これらの装置は、CAN(Controller Area Network)通信線等の多重通信線やシリアル通信線、無線通信網等によって互いに接続される。なお、図2に示す構成はあくまで一例であり、構成の一部が省略されてもよいし、更に別の構成が追加されてもよい。
[車両]
図2は、第1実施形態に係るエージェント装置100の構成と、車両Mに搭載された機器とを示す図である。車両Mには、例えば、一以上のマイク10と、表示・操作装置20と、スピーカユニット30と、ナビゲーション装置40と、車両機器50と、車載通信装置60と、乗員認識装置80と、エージェント装置100とが搭載される。また、スマートフォンなどの汎用通信装置70が車室内に持ち込まれ、通信装置として使用される場合がある。これらの装置は、CAN(Controller Area Network)通信線等の多重通信線やシリアル通信線、無線通信網等によって互いに接続される。なお、図2に示す構成はあくまで一例であり、構成の一部が省略されてもよいし、更に別の構成が追加されてもよい。
マイク10は、車室内で発せられた音声を収集する収音部である。表示・操作装置20は、画像を表示すると共に、入力操作を受付可能な装置(或いは装置群)である。表示・操作装置20は、例えば、タッチパネルとして構成されたディスプレイ装置を含む。表示・操作装置20は、更に、HUD(Head Up Display)や機械式の入力装置を含んでもよい。スピーカユニット30は、例えば、車室内の互いに異なる位置に配設された複数のスピーカ(音出力部)を含む。表示・操作装置20は、エージェント装置100とナビゲーション装置40とで共用されてもよい。これらの詳細については後述する。
ナビゲーション装置40は、ナビHMI(Human machine Interface)と、GPS(Global Positioning System)などの位置測位装置と、地図情報を記憶した記憶装置と、経路探索などを行う制御装置(ナビゲーションコントローラ)とを備える。マイク10、表示・操作装置20、およびスピーカユニット30のうち一部または全部がナビHMIとして用いられてもよい。ナビゲーション装置40は、位置測位装置によって特定された車両Mの位置から、乗員によって入力された目的地まで移動するための経路(ナビ経路)を探索し、経路に沿って車両Mが走行できるように、ナビHMIを用いて案内情報を出力する。経路探索機能は、ネットワークNWを介してアクセス可能なナビゲーションサーバにあってもよい。この場合、ナビゲーション装置40は、ナビゲーションサーバから経路を取得して案内情報を出力する。なお、エージェント装置100は、ナビゲーションコントローラを基盤として構築されてもよく、その場合、ナビゲーションコントローラとエージェント装置100は、ハードウェア上は一体に構成される。
車両機器50は、例えば、パワーウインドウ51、空調装置52、オーディオ53、スイッチ1、スイッチ2、およびスイッチ3を含む。以下、スイッチ1〜スイッチ3を区別しない場合は、「スイッチ」と称する場合がある。スイッチ1は、パワーウインドウを操作するためのスイッチである。スイッチ2は、空調装置52を操作するためのスイッチである。スイッチ3は、オーディオ53を操作するためのスイッチである。
パワーウインドウ51は、乗員の指示を含む発話またはスイッチ1に対して行われた操作に基づいて、車両のウインドウを開放したり、閉止したりする。空調装置52は、乗員の指示を含む発話またはスイッチ2に対して行われた操作に基づいて、起動したり、車室内の温度や湿度を制御したりする。オーディオ53は、乗員の指示を含む発話またはスイッチ3に対して行われた操作に基づいて、オーディオを起動させたり、オーディオを車両のウインドウを開放したり、閉止したりする。また、車両機器50は、例えば、エンジンや走行用モータなどの駆動力出力装置、エンジンの始動モータ、ドアロック装置、ドア開閉装置などを含む。
車載通信装置60は、例えば、セルラー網やWi−Fi網を利用してネットワークNWにアクセス可能な無線通信装置である。
乗員認識装置80は、例えば、着座センサ、車室内カメラ、画像認識装置などを含む。着座センサは座席の下部に設けられた圧力センサ、シートベルトに取り付けられた張力センサなどを含む。車室内カメラは、車室内に設けられたCCD(Charge Coupled Device)カメラやCMOS(Complementary Metal Oxide Semiconductor)カメラである。画像認識装置は、車室内カメラの画像を解析し、座席ごとの乗員の有無、顔向きなどを認識する。
図3は、表示・操作装置20の配置例を示す図である。表示・操作装置20は、例えば、第1ディスプレイ22と、第2ディスプレイ24と、操作スイッチASSY26とを含む。表示・操作装置20は、更に、HUD28を含んでもよい。
車両Mには、例えば、ステアリングホイールSWが設けられた運転席DSと、運転席DSに対して車幅方向(図中Y方向)に設けられた助手席ASとが存在する。第1ディスプレイ22は、インストルメントパネルにおける運転席DSと助手席ASとの中間辺りから、助手席ASの左端部に対向する位置まで延在する横長形状のディスプレイ装置である。第2ディスプレイ24は、運転席DSと助手席ASとの車幅方向に関する中間あたり、且つ第1ディスプレイ22の下方に設置されている。例えば、第1ディスプレイ22と第2ディスプレイ24は、共にタッチパネルとして構成され、表示部としてLCD(Liquid Crystal Display)や有機EL(Electroluminescence)、プラズマディスプレイなどを備えるものである。操作スイッチASSY26は、ダイヤルスイッチやボタン式スイッチなどが集積されたものである。表示・操作装置20は、乗員によってなされた操作の内容をエージェント装置100に出力する。第1ディスプレイ22または第2ディスプレイ24が表示する内容は、エージェント装置100によって決定されてよい。
図4は、スピーカユニット30の配置例を示す図である。スピーカユニット30は、例えば、スピーカ30A〜30Hを含む。スピーカ30Aは、運転席DS側の窓柱(いわゆるAピラー)に設置されている。スピーカ30Bは、運転席DSに近いドアの下部に設置されている。スピーカ30Cは、助手席AS側の窓柱に設置されている。スピーカ30Dは、助手席ASに近いドアの下部に設置されている。スピーカ30Eは、右側後部座席BS1側に近いドアの下部に設置されている。スピーカ30Fは、左側後部座席BS2側に近いドアの下部に設置されている。スピーカ30Gは、第2ディスプレイ24の近傍に設置されている。スピーカ30Hは、車室の天井(ルーフ)に設置されている。
係る配置において、例えば、専らスピーカ30Aおよび30Bに音を出力させた場合、音像は運転席DS付近に定位することになる。また、専らスピーカ30Cおよび30Dに音を出力させた場合、音像は助手席AS付近に定位することになる。また、専らスピーカ30Eに音を出力させた場合、音像は右側後部座席BS1付近に定位することになる。また、専らスピーカ30Fに音を出力させた場合、音像は左側後部座席BS2付近に定位することになる。また、専らスピーカ30Gに音を出力させた場合、音像は車室の前方付近に定位することになり、専らスピーカ30Hに音を出力させた場合、音像は車室の上方付近に定位することになる。これに限らず、スピーカユニット30は、ミキサーやアンプを用いて各スピーカの出力する音の配分を調整することで、車室内の任意の位置に音像を定位させることができる。
[エージェント装置]
図2に戻り、エージェント装置100は、管理部110と、エージェント機能部150−1、150−2、150−3と、ペアリングアプリ実行部156とを備える。管理部110は、例えば、音響処理部112と、エージェントごとWU(Wake Up)判定部114と、表示制御部116と、音声制御部118と、会話状態認識部120と、制御部122とを備える。いずれのエージェント機能部であるかを区別しない場合、単にエージェント機能部150と称する。3つのエージェント機能部150を示しているのは、図1におけるエージェントサーバ200の数に対応させた一例に過ぎず、エージェント機能部150の数は、2つであってもよいし、4つ以上であってもよい。図2に示すソフトウェア配置は説明のために簡易に示しており、実際には、例えば、エージェント機能部150と車載通信装置60の間に管理部110が介在してもよいし、任意に改変することができる。
図2に戻り、エージェント装置100は、管理部110と、エージェント機能部150−1、150−2、150−3と、ペアリングアプリ実行部156とを備える。管理部110は、例えば、音響処理部112と、エージェントごとWU(Wake Up)判定部114と、表示制御部116と、音声制御部118と、会話状態認識部120と、制御部122とを備える。いずれのエージェント機能部であるかを区別しない場合、単にエージェント機能部150と称する。3つのエージェント機能部150を示しているのは、図1におけるエージェントサーバ200の数に対応させた一例に過ぎず、エージェント機能部150の数は、2つであってもよいし、4つ以上であってもよい。図2に示すソフトウェア配置は説明のために簡易に示しており、実際には、例えば、エージェント機能部150と車載通信装置60の間に管理部110が介在してもよいし、任意に改変することができる。
エージェント装置100の各構成要素は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDD(Hard Disk Drive)やフラッシュメモリなどの記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD−ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。
管理部110は、OS(Operating System)やミドルウェアなどのプログラムが実行されることで機能する。
管理部110の音響処理部112は、エージェントごとに予め設定されているウエイクアップワードを認識するのに適した状態になるように、入力された音に対して音響処理を行う。
エージェントごとWU判定部114は、エージェント機能部150−1、150−2、150−3のそれぞれに対応して存在し、エージェントごとに予め定められているウエイクアップワードを認識する。エージェントごとWU判定部114は、音響処理が行われた音声(音声ストリーム)から音声の意味を認識する。まず、エージェントごとWU判定部114は、音声ストリームにおける音声波形の振幅と零交差に基づいて音声区間を検出する。エージェントごとWU判定部114は、混合ガウス分布モデル(GMM;Gaussian mixture model)に基づくフレーム単位の音声識別および非音声識別に基づく区間検出を行ってもよい。
次に、エージェントごとWU判定部114は、検出した音声区間における音声をテキスト化し、文字情報とする。そして、エージェントごとWU判定部114は、テキスト化した文字情報がウエイクアップワードに該当するか否かを判定する。ウエイクアップワードであると判定した場合、エージェントごとWU判定部114は、対応するエージェント機能部150を起動させる。なお、エージェントごとWU判定部114に相当する機能がエージェントサーバ200に搭載されてもよい。この場合、管理部110は、音響処理部112によって音響処理が行われた音声ストリームをエージェントサーバ200に送信し、エージェントサーバ200がウエイクアップワードであると判定した場合、エージェントサーバ200からの指示に従ってエージェント機能部150が起動する。なお、各エージェント機能部150は、常時起動しており且つウエイクアップワードの判定を自ら行うものであってよい。この場合、管理部110がエージェントごとWU判定部114を備える必要はない。
エージェント機能部150は、対応するエージェントサーバ200と協働してエージェントを出現させ、車両Mの乗員の発話に応じて、音声による応答を含むサービスを提供する。エージェント機能部150には、車両機器50を制御する権限が付与されたものが含まれてよい。また、エージェント機能部150には、ペアリングアプリ実行部156を介して汎用通信装置70と連携し、エージェントサーバ200と通信するものであってよい。例えば、エージェント機能部150−1には、車両機器50を制御する権限が付与されている。エージェント機能部150−1は、例えば、車両機器50を制御する場合、車両機器50の制御に関する情報を制御部122に送信し、制御部122に車両機器50を制御させる。エージェント機能部150−1は、車載通信装置60を介してエージェントサーバ200−1と通信する。エージェント機能部150−2は、車載通信装置60を介してエージェントサーバ200−2と通信する。エージェント機能部150−3は、ペアリングアプリ実行部156を介して汎用通信装置70と連携し、エージェントサーバ200−3と通信する。
ペアリングアプリ実行部156は、例えば、Bluetooth(登録商標)によって汎用通信装置70とペアリングを行い、エージェント機能部150−3と汎用通信装置70とを接続させる。なお、エージェント機能部150−3は、USB(Universal Serial Bus)などを利用した有線通信によって汎用通信装置70に接続されるようにしてもよい。以下、エージェント機能部150−1とエージェントサーバ200−1が協働して出現させるエージェントをエージェント1、エージェント機能部150−2とエージェントサーバ200−2が協働して出現させるエージェントをエージェント2、エージェント機能部150−3とエージェントサーバ200−3が協働して出現させるエージェントをエージェント3と称する場合がある。
表示制御部116は、エージェント機能部150による指示に応じて第1ディスプレイ22または第2ディスプレイ24に画像を表示させる。以下では、第1ディスプレイ22を使用するものとする。表示制御部116は、一部のエージェント機能部150の制御により、例えば、車室内で乗員とのコミュニケーションを行う擬人化されたエージェントの画像(以下、エージェント画像と称する)を生成し、生成したエージェント画像を第1ディスプレイ22に表示させる。エージェント画像は、例えば、乗員に対して話しかける態様の画像である。エージェント画像は、例えば、少なくとも観者(乗員)によって表情や顔向きが認識される程度の顔画像を含んでよい。例えば、エージェント画像は、顔領域の中に目や鼻に擬したパーツが表されており、顔領域の中のパーツの位置に基づいて表情や顔向きが認識されるものであってよい。また、エージェント画像は、観者によって、立体的に感じられ、三次元空間における頭部画像を含むことでエージェントの顔向きが認識される画像である。エージェント画像は、エージェントの動作や振る舞い、姿勢等が認識され本体(胴体や手足)の画像を含むものであってもよい。また、エージェント画像は、アニメーション画像であってもよい。
音声制御部118は、エージェント機能部150による指示に応じて、スピーカユニット30に含まれるスピーカのうち一部または全部に音声を出力させる。音声制御部118は、複数のスピーカユニット30を用いて、エージェント画像の表示位置に対応する位置にエージェント音声の音像を定位させる制御を行ってもよい。エージェント画像の表示位置に対応する位置とは、例えば、エージェント画像がエージェント音声を喋っていると乗員が感じると予測される位置であり、具体的には、エージェント画像の表示位置付近(例えば、2〜3[cm]以内)の位置である。また、音像が定位するとは、例えば、乗員の左右の耳に伝達される音の大きさが調節されることにより、乗員が感じる音源の空間的な位置が定められることである。
会話状態認識部120は、エージェント機能部150と会話をしている乗員が、運転者であるか否かを認識する。会話状態認識部120は、例えば、複数のマイク10のそれぞれから取得され、かつ音響処理部112によって音響処理が行われた音声データ(複数の音声ストリーム)に基づいて、エージェントと会話を行っているユーザを判定する。会話状態認識部120は、どの座席に着座している乗員がエージェントと会話を行っているかを判定する。例えば、会話状態認識部120は、運手席に着座した運転者とエージェントが会話をしているか、運転者以外の同乗者がエージェントと会話をしているかを判定する。
例えば、運転席DSに対応したマイク10Aと、助手席ASに対応したマイク10Bと、後部座席BS1に対応したマイク10Cと、後部座席BS2に対応したマイク10Dとのそれぞれから音声データが取得されたものとする。この場合、会話状態認識部120は、4つの音声データのそれぞれから乗員が発話した音声データを抽出する。会話状態認識部120は、抽出された4つの音声データを比較し、比較結果に基づいて、エージェントと会話をしている乗員を判定する。
例えば、車内に複数のユーザがそれぞれの座席に着座している状況下で、後部座席BS1に着座した乗員が発話をしたとする。この場合、後部座席BS1のユーザに最も近いマイク10Dは、他のマイク10に比して発話に対応する音を大きな音として収音する蓋然性が高い。会話状態認識部120は、例えば、最も発話に対応する音が大きい音として収音されたマイク10に対応する座席に存在する利用者を、エージェントと会話をしている利用者として判定する。
また、会話状態認識部120は、音響処理部112によって音声データが取得された複数のマイク10の中から、最も早く(最も応答速度が良く)音声データが取得されたマイクに対応した座席に存在するユーザを、エージェントと会話をしている乗員と判定してもよい。
例えば、車両機器50を制御するための音声が利用者によりマイク10に入力された場合、エージェント機能部150は、会話状態認識部120の判定結果に基づいて、車両機器50の制御を指示した利用者を特定することができる。
また、会話状態認識部120は、車両機器50を操作するためのスイッチを操作した乗員を判定する。例えば、会話状態認識部120は、乗員認識装置80により取得された情報に基づいて、スイッチを操作した乗員を判定する。乗員認識装置80により取得された情報は、乗員がスイッチに対する操作を行ったことを示す情報、およびスイッチに対する操作を行った乗員を示す情報である。例えば、乗員認識装置80は、例えば、乗員認識装置80が車室内の様子が撮像された画像に基づいて、乗員の動作を監視し、所定の位置に設けられたスイッチを操作する動作を乗員が行った場合、操作されたスイッチ、およびスイッチを操作した乗員を示す情報を会話状態認識部120に提供する。運転席に着座する乗員がスイッチに対して操作を行った場合、会話状態認識部120は、乗員認識装置80から運転席に着座した乗員が所定の位置に設けられたスイッチを操作したことを示す情報を取得し、取得した情報に基づいて、操作されたスイッチと、スイッチを操作した乗員とを判定する。なお、会話状態認識部120は、スイッチが操作されるとスイッチが出力信号を取得し、取得した信号を上記の判定に加味してもよい。また、会話状態認識部120が、乗員認識装置80により行われる一部または全部の処理を行ってもよい。
会話状態認識部120は、運転者とエージェント機能部150とが会話を行っているか否かを認識する。会話状態認識部120は、例えば、乗員とエージェントとの会話が開始されたか否かを判定する。また、会話状態認識部120は、例えば、乗員とエージェントとの会話が終了したか否かを判定する。例えば、会話状態認識部120は、エージェント機能部150により開始フラグが提供された場合に、エージェントが会話を開始すると判定し、エージェント機能部150により終了フラグが提供された場合に、エージェントが会話を終了すると判定する。また、会話状態認識部120は、乗員によって行われる発話、またはエージェントにより行われる発話が、最後に乗員またはエージェントにより発話された時から所定時間経過した場合、会話は終了したと判定してもよい。
制御部122は、エージェント機能部150−1により提供された情報またはスイッチにより出力された信号に基づいて、車両機器50を作動させる。
[エージェントサーバ]
図5は、エージェントサーバ200の構成と、エージェント装置100の構成の一部とを示す図である。以下、エージェントサーバ200の構成と共にエージェント機能部150等の動作について説明する。ここでは、エージェント装置100からネットワークNWまでの物理的な通信についての説明を省略する。
図5は、エージェントサーバ200の構成と、エージェント装置100の構成の一部とを示す図である。以下、エージェントサーバ200の構成と共にエージェント機能部150等の動作について説明する。ここでは、エージェント装置100からネットワークNWまでの物理的な通信についての説明を省略する。
エージェントサーバ200は、通信部210を備える。通信部210は、例えばNIC(Network Interface Card)などのネットワークインターフェースである。更に、エージェントサーバ200は、例えば、音声認識部220と、自然言語処理部222と、対話管理部224と、ネットワーク検索部226と、応答文生成部228とを備える。これらの構成要素は、例えば、CPUなどのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPUなどのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDDやフラッシュメモリなどの記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD−ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることでインストールされてもよい。
エージェントサーバ200は、記憶部250を備える。記憶部250は、上記の各種記憶装置により実現される。記憶部250には、パーソナルプロファイル252、辞書DB(データベース)254、知識ベースDB256、応答規則DB258などのデータやプログラムが格納される。
エージェント装置100において、エージェント機能部150は、音声ストリーム、或いは圧縮や符号化などの処理を行った音声ストリームを、エージェントサーバ200に送信する。エージェント機能部150は、ローカル処理(エージェントサーバ200を介さない処理)が可能な音声コマンドを認識した場合は、音声コマンドで要求された処理を行ってよい。ローカル処理が可能な音声コマンドとは、エージェント装置100が備える記憶部(不図示)を参照することで回答可能な音声コマンドであったり、エージェント機能部150−1の場合は車両機器50を制御する音声コマンド(例えば、空調装置をオンにするコマンドなど)であったりする。従って、エージェント機能部150は、エージェントサーバ200が備える機能の一部を有してもよい。
エージェント装置100は、音声ストリームを取得すると、音声認識部220が音声認識を行ってテキスト化された文字情報を出力し、自然言語処理部222が文字情報に対して辞書DB254を参照しながら意味解釈を行う。辞書DB254は、文字情報に対して抽象化された意味情報が対応付けられたものである。辞書DB254は、同義語や類義語の一覧情報を含んでもよい。音声認識部220の処理と、自然言語処理部222の処理は、段階が明確に分かれるものではなく、自然言語処理部222の処理結果を受けて音声認識部220が認識結果を修正するなど、相互に影響し合って行われてよい。
自然言語処理部222は、例えば、認識結果として、「今日の天気は」、「天気はどうですか」等の意味が認識された場合、標準文字情報「今日の天気」に置き換えたコマンドを生成する。これにより、リクエストの音声に文字揺らぎがあった場合にも要求にあった対話をし易くすることができる。また、自然言語処理部222は、例えば、確率を利用した機械学習処理等の人工知能処理を用いて文字情報の意味を認識したり、認識結果に基づくコマンドを生成したりしてもよい。
対話管理部224は、自然言語処理部222の処理結果(コマンド)に基づいて、パーソナルプロファイル252や知識ベースDB256、応答規則DB258を参照しながら車両Mの乗員に対する発話の内容を決定する。パーソナルプロファイル252は、乗員ごとに保存されている乗員の個人情報、趣味嗜好、過去の対話の履歴などを含む。知識ベースDB256は、物事の関係性を規定した情報である。応答規則DB258は、コマンドに対してエージェントが行うべき動作(回答や機器制御の内容など)を規定した情報である。
また、対話管理部224は、音声ストリームから得られる特徴情報を用いて、パーソナルプロファイル252と照合を行うことで、乗員を特定してもよい。この場合、パーソナルプロファイル252には、例えば、音声の特徴情報に、個人情報が対応付けられている。音声の特徴情報とは、例えば、声の高さ、イントネーション、リズム(音の高低のパターン)等の喋り方の特徴や、メル周波数ケプストラム係数(Mel Frequency Cepstrum Coefficients)等による特徴量に関する情報である。音声の特徴情報は、例えば、乗員の初期登録時に所定の単語や文章等を乗員に発声させ、発声させた音声を認識することで得られる情報である。
対話管理部224は、コマンドが、ネットワークNWを介して検索可能な情報を要求するものである場合、ネットワーク検索部226に検索を行わせる。ネットワーク検索部226は、ネットワークNWを介して各種ウェブサーバ300にアクセスし、所望の情報を取得する。「ネットワークNWを介して検索可能な情報」とは、例えば、車両Mの周辺にあるレストランの一般ユーザによる評価結果であったり、その日の車両Mの位置に応じた天気予報であったりする。
応答文生成部228は、対話管理部224により決定された発話の内容が車両Mの乗員に伝わるように、応答文を生成し、生成した応答文をエージェント装置100に送信する。応答文生成部228は、乗員がパーソナルプロファイルに登録された乗員であることが特定されている場合に、乗員の名前を呼んだり、乗員の話し方に似せた話し方にした応答文を生成したりしてもよい。
エージェント機能部150は、応答文を取得すると、音声合成を行って音声を出力するように音声制御部118に指示する。また、エージェント機能部150は、音声出力に合わせてエージェントの画像を表示するように表示制御部116に指示する。このようにして、仮想的に出現したエージェントが車両Mの乗員に応答するエージェント機能が実現される。
[特定機器の制御の概要]
制御部122は、車両Mの乗員のうち運転者とエージェント機能部150とが会話をしている場合において、車室内の音響環境を変化させる特定機器を作動させる操作を運転者とは異なる同乗者が行った場合には、会話の終了後に特定機器を作動させる。この制御を「特定制御」と称する場合がある。
制御部122は、車両Mの乗員のうち運転者とエージェント機能部150とが会話をしている場合において、車室内の音響環境を変化させる特定機器を作動させる操作を運転者とは異なる同乗者が行った場合には、会話の終了後に特定機器を作動させる。この制御を「特定制御」と称する場合がある。
「特定機器」とは、例えば、車室内の音響環境を変化させる可能性が存在する機器である。「車室内の音響環境」とは、例えば、車室内の音の反響度合や反響している音の分布、音の大きさの分布などの音響に関する環境である。「音響環境を変化させる特定機器を作動させる操作」とは、特定機器が稼働または特定機器の稼働状態が変化することにより、特定機器が稼働または特定機器の稼働状態が変化する前の車両内の音響環境が変化する可能性が存在する操作(以下、特定操作)である。
「特定操作」は、例えば、車室内の音響環境をエージェント機能部150に対して音が伝わりにくくなる環境に変化させる操作である。特定操作は、例えば、車室内の音を上昇させる操作である。また、「特定操作」は、音声入力による操作であってもよいし、所定のスイッチに対する操作であってもよい。特定機器とは、例えば、空調装置、パワーウインドウ、またはオーディオ等を含む。
[フローチャート]
図6は、エージェント装置100により実行される処理の流れの一例を示すフローチャートである。本処理は、エージェント機能部150−1が起動している際に行われてもよいし、複数のエージェント機能部150のうち、一以上のエージェント機能部150が起動している場合に行われてもよい。
図6は、エージェント装置100により実行される処理の流れの一例を示すフローチャートである。本処理は、エージェント機能部150−1が起動している際に行われてもよいし、複数のエージェント機能部150のうち、一以上のエージェント機能部150が起動している場合に行われてもよい。
まず、制御部122が、特定機器の特定操作がされたか否かを判定する(ステップS100)。例えば、スイッチを用いた特定操作が行われた場合、制御部122は、スイッチに対する特定操作に応じて送信された信号に基づいて、特定操作が行われたと判定する。例えば、音声の入力による特定操作が行われた場合、制御部122は、エージェント機能部150により送信された情報に基づいて特定操作が行われたと判定する。
会話状態認識部120は、操作が同乗者による操作であるか否かを判定する(ステップS102)。同乗者による操作でないと判定された場合(運転者の操作である場合)、ステップS110の処理に進む。同乗者とエージェントとが会話中に、音響環境を変化させる特定機器を運転者が作動させようとする場合には、会話の終了に関係なく特定機器が作動する。
同乗者による操作であると判定された場合、会話状態認識部120は、同乗者による操作が特定操作であるか否かを判定する(ステップS104)。同乗者による操作が特定操作でない場合、ステップS110の処理に進む。
同乗者による操作が特定操作である場合、会話状態認識部120は、乗員とエージェントとが会話を行っているか否かを判定する(ステップS106)。乗員がエージェントと会話を行っていない場合、ステップS110の処理に進む。
乗員がエージェントと会話を行っている場合、会話状態認識部120は、乗員とエージェントとの会話が終了したか否かを判定する(ステップS108)。乗員とエージェントとの会話が終了した場合、制御部122が、ステップS100の操作に応じた制御を操作対象に対して実行する(ステップS110)。これにより本フローチャートの処理が終了する。
上述した処理により、制御部122が、運転者が特定操作を行った場合、乗員とエージェントとの会話の有無に関わらず特定操作に応じた制御を実行し、運転者とエージェントとが会話を行っている場合、乗員とエージェントとの会話が終了した後に特定操作に応じた制御を実行する。
例えば、運転者が、車両の制御に関する指示を含む発話をエージェントに対して行っている場合、この会話が妨げられると、車両の制御に影響を与える場合がある。これに対して、本実施形態では、運転者とエージェントとの会話に影響を与えないように特定機器が作動する。この結果、運転者にとって好ましい態様でパワーウインドウの制御が行われる。
以下、パワーウインドウ、空調装置、およびオーディオが制御される場合について説明する。
[パワーウインドウの制御]
図7は、運転者によって行われる特定操作と、パワーウインドウの作動のタイミングとの一例を示す図である。図7の横軸は時間を示している。図7の縦軸は(A)〜(C)に関する事項を示している。(A)エージェントと運転者と(またはエージェントと同乗者と)が会話中であるか、または会話していない状態であるかを示している。(B)運転者によって特定操作が行われたか、行われていないかを示している。図7における特定操作は、パワーウインドウにウインドウを自動(ワンタッチ)で全開にさせる操作である。例えば、運転者が、音声で「ウインドウを全開にして」とマイク10に入力する操作である。(C1)パワーウインドウが作動しているか、作動していないかを示している。
図7は、運転者によって行われる特定操作と、パワーウインドウの作動のタイミングとの一例を示す図である。図7の横軸は時間を示している。図7の縦軸は(A)〜(C)に関する事項を示している。(A)エージェントと運転者と(またはエージェントと同乗者と)が会話中であるか、または会話していない状態であるかを示している。(B)運転者によって特定操作が行われたか、行われていないかを示している。図7における特定操作は、パワーウインドウにウインドウを自動(ワンタッチ)で全開にさせる操作である。例えば、運転者が、音声で「ウインドウを全開にして」とマイク10に入力する操作である。(C1)パワーウインドウが作動しているか、作動していないかを示している。
時刻T1以前からエージェントと運転者との会話が行われているものとする。時刻T1で、特定操作が行われると、時刻T+1でパワーウインドウが作動して、その後、ウインドウが全開となる。すなわち、会話の終了に関係なくパワーウインドウ41が開状態または全開状態に近くように作動する。
このように、運転者とエージェントとが会話を行っている場合、運転者によって行われるパワーウインドウに対する特定操作は制限されない。運転者にとって好ましい態様でパワーウインドウの制御が行われる。
図8は、同乗者によって行われる特定操作と、パワーウインドウの作動のタイミングとの一例を示す図である。図7と同様の説明については省略する。図7の縦軸は(a)〜(c)に関する事項を示している。(a)エージェントと運転者とが会話中であるか、または会話していない状態であるかを示している。(b)同乗者によって特定操作が行われたか、行われていないかを示している。図8における特定操作は、図7の特定操作と同様である。(c1)は、図7の(C1)と同様である。
時刻T1で特定操作が行われると、会話が終了した直後である時刻T1+2で、パワーウインドウが作動して、その後、ウインドウが全開となる。すなわち、会話の終了後にパワーウインドウ41が開状態または全開状態に近くように作動する。
このように、運転者とエージェントとが会話を行っている場合、運転者とエージェントとの会話の終了後にパワーウインドウが制御される。すなわち、運転者にとって好ましい態様でパワーウインドウの制御が行われる。
[空調装置の制御(その1)]
図9は、運転者によって行われる特定操作と、空調装置の作動(起動)のタイミングとの一例を示す図である。図7と同様の説明については省略する。図9における特定操作は、空調装置を作動させる操作(オン状態にする操作)である。例えば、運転者が、音声で「冷房をオンにして」、または「車室内が暑い」とマイク10に入力する操作である。(C2)空調装置が作動しているか、作動していないかを示している。
図9は、運転者によって行われる特定操作と、空調装置の作動(起動)のタイミングとの一例を示す図である。図7と同様の説明については省略する。図9における特定操作は、空調装置を作動させる操作(オン状態にする操作)である。例えば、運転者が、音声で「冷房をオンにして」、または「車室内が暑い」とマイク10に入力する操作である。(C2)空調装置が作動しているか、作動していないかを示している。
時刻T2以前からエージェントと運転者との会話が行われているものとする。時刻T2で特定操作が行われると、時刻T2+1で空調装置が作動を開始する。すなわち、会話の終了に関係なく空調装置42が稼働する。
図10は、同乗者によって行われる特定操作と、空調装置の作動のタイミングの一例を示す図である。図9と同様の説明については省略する。図10における特定操作は、図9の特定操作と同様である。(c2)は、図9の(C2)と同様である。
時刻T2で特定操作が行われると、会話が終了した直後である時刻T2+2で、空調装置が作動する。すなわち、会話の終了後に空調装置42が稼働する。
このように、運転者とエージェントとが会話を行っている場合、運転者によって行われる空調装置に対する特定操作は制限されず、同乗者によって行われる空調装置に対する特定操作は制限され、運転者とエージェントとの会話の終了後に空調装置が制御される。すなわち、運転者にとって好ましい態様で空調装置の制御が行われる。
[空調装置の制御(その2)]
図11は、運転者によって行われる特定操作と、空調装置の作動のタイミング(出力度合を上昇させるタイミング)との一例を示す図である。図9と同様の説明については省略する。図11における特定操作は、空調装置を作動させている状態で空調装置の出力度合を上昇させる操作である。例えば、運転者が、音声で「冷房の設定温度を○度下げて」、または「暖房の温度を△度上げて」とマイク10に入力する操作である。(C3)空調装置が作動しているか、作動していないかを示している。また、(C3)における帯の太さは出力度合の大きさを示している。帯が太いほど出力度合は大きい。
図11は、運転者によって行われる特定操作と、空調装置の作動のタイミング(出力度合を上昇させるタイミング)との一例を示す図である。図9と同様の説明については省略する。図11における特定操作は、空調装置を作動させている状態で空調装置の出力度合を上昇させる操作である。例えば、運転者が、音声で「冷房の設定温度を○度下げて」、または「暖房の温度を△度上げて」とマイク10に入力する操作である。(C3)空調装置が作動しているか、作動していないかを示している。また、(C3)における帯の太さは出力度合の大きさを示している。帯が太いほど出力度合は大きい。
時刻T3以前からエージェントと運転者との会話が行われているものとする。時刻T3で特定操作が行われると、時刻T3+1で空調装置の出力度合が上昇する。すなわち、会話の終了に関係なく空調装置42の出力度合が上昇する。
図12は、同乗者によって行われる特定操作と、空調装置の作動のタイミング(出力度合を上昇させるタイミング)との一例を示す図である。図11と同様の説明については省略する。図12における特定操作は、図11の特定操作と同様である。(c3)は、図11の(C3)と同様である。
時刻T3で特定操作が行われると、会話が終了した直後である時刻T3+2で、空調装置の出力度合が上昇する。すなわち、会話の終了後に空調装置42の出力度合が上昇する。
このように、運転者とエージェントとが会話を行っている場合、運転者によって行われる空調装置に対する特定操作は制限されず、同乗者によって行われる空調装置に対する特定操作は制限され、運転者とエージェントとの会話の終了後に空調装置が制御される。すなわち、運転者にとって好ましい態様で空調装置の制御が行われる。
[オーディオの制御(その1)]
図13は、運転者によって行われる特定操作と、オーディオの作動のタイミングとの一例を示す図である。図7と同様の説明については省略する。図13における特定操作は、オーディオを作動させて音楽を車室内に流す操作である。例えば、運転者が、音声で「オーディオで音楽を流して」とマイク10に入力する操作である。(C4)オーディオが作動して音楽を流しているか、音楽を流していないかを示している。
図13は、運転者によって行われる特定操作と、オーディオの作動のタイミングとの一例を示す図である。図7と同様の説明については省略する。図13における特定操作は、オーディオを作動させて音楽を車室内に流す操作である。例えば、運転者が、音声で「オーディオで音楽を流して」とマイク10に入力する操作である。(C4)オーディオが作動して音楽を流しているか、音楽を流していないかを示している。
時刻T4以前からエージェントと運転者との会話が行われているものとする。時刻T4で特定操作が行われると、時刻T4+1でオーディオが作動して音楽を車室内に流す。すなわち、会話の終了に関係なくオーディオ43が稼働して音を出力する。
図14は、同乗者によって行われる特定操作と、オーディオの作動のタイミングとの一例を示す図である。図11と同様の説明については省略する。図14における特定操作は、図13の特定操作と同様である。(c4)は、図13の(C4)と同様である。
時刻T4で特定操作が行われると、会話が終了した直後である時刻T4+2で、オーディオが作動して車室内に音楽が流れる。すなわち、会話の終了後にオーディオ43が稼働して音を出力する。
このように、運転者とエージェントとが会話を行っている場合、運転者によって行われるオーディオに対する特定操作は制限されず、同乗者によって行われるオーディオに対する特定操作は制限され、運転者とエージェントとの会話の終了後にオーディオが作動する。すなわち、運転者にとって好ましい態様でオーディオの制御が行われる。
[オーディオの制御(その2)]
図15は、運転者によって行われる特定操作と、オーディオの作動のタイミング(出力度合を上昇させるタイミング)との一例を示す図である。図13と同様の説明については省略する。図15における特定操作は、オーディオを作動させている状態でオーディオが出力する音楽の音を上昇させる操作である。例えば、運転者が、音声で「音楽の音を大きくして」とマイク10に入力する操作である。(C5)オーディオが作動しているか、作動していないかを示している。また、(C5)における帯の太さはオーディオが出力する音の大きさを示している。帯が太いほど出力度合は大きい。
図15は、運転者によって行われる特定操作と、オーディオの作動のタイミング(出力度合を上昇させるタイミング)との一例を示す図である。図13と同様の説明については省略する。図15における特定操作は、オーディオを作動させている状態でオーディオが出力する音楽の音を上昇させる操作である。例えば、運転者が、音声で「音楽の音を大きくして」とマイク10に入力する操作である。(C5)オーディオが作動しているか、作動していないかを示している。また、(C5)における帯の太さはオーディオが出力する音の大きさを示している。帯が太いほど出力度合は大きい。
時刻T5以前からエージェントと運転者との会話が行われているものとする。時刻T5で特定操作が行われると、時刻T5+1でオーディオが出力する音が大きくなる。すなわち、会話の終了に関係なくオーディオは、出力度合を上昇させて、より大きい音を出す。
図16は、同乗者によって行われる特定操作と、オーディオの作動のタイミング(出力度合を上昇させるタイミング)との一例を示す図である。図15と同様の説明については省略する。図16における特定操作は、図15の特定操作と同様である。(c5)は、図15の(C5)と同様である。
時刻T5で特定操作が行われると、会話が終了した直後である時刻T5+2で、オーディオが出力する音が大きくなる。すなわち、会話の終了後、オーディオ43が出力度合を上昇させて、より大きい音を出す。
このように、運転者とエージェントとが会話を行っている場合、運転者によって行われるオーディオに対する特定操作は制限されず、同乗者によって行われるオーディオに対する特定操作は制限され、運転者とエージェントとの会話の終了後にオーディオが制御される。すなわち、運転者にとって好ましい態様でオーディオの制御が行われる。
[オーディオの制御(その3)]
図17は、運転者によって行われる特定操作と、オーディオの作動のタイミング(出力度合を上昇させるタイミング)との一例を示す図である。図16と同様の説明については省略する。時刻T5で特定操作が行われると、時刻T5+2でオーディオが出力する音が大きくなる。その後、時刻T5+3でエージェントと運転者との会話が開始されると、時刻T5+3の直後に、オーディオにより出力される音の大きさが、時刻T5+2〜T5+3までの音の大きさよりも小さくなる。例えば、時刻T5+3直後にオーディオにより出力される音の大きさは、エージェントが運転者の発話の内容を精度よく認識することができるような音の大きさである。また、時刻T5+3直後にオーディオにより出力される音の大きさは、乗員がエージェントにより提供される音が認識できるような音の大きさである。
図17は、運転者によって行われる特定操作と、オーディオの作動のタイミング(出力度合を上昇させるタイミング)との一例を示す図である。図16と同様の説明については省略する。時刻T5で特定操作が行われると、時刻T5+2でオーディオが出力する音が大きくなる。その後、時刻T5+3でエージェントと運転者との会話が開始されると、時刻T5+3の直後に、オーディオにより出力される音の大きさが、時刻T5+2〜T5+3までの音の大きさよりも小さくなる。例えば、時刻T5+3直後にオーディオにより出力される音の大きさは、エージェントが運転者の発話の内容を精度よく認識することができるような音の大きさである。また、時刻T5+3直後にオーディオにより出力される音の大きさは、乗員がエージェントにより提供される音が認識できるような音の大きさである。
このように、運転者とエージェントとが会話を行っている場合、同乗者によって行われるオーディオに対する特定操作は制限され、運転者とエージェントとが会話を行っていない場合、オーディオの出力度合が上昇する。すなわち、運転者にとって好ましい態様でオーディオの制御が行われる。
図17の例では、オーディオに対する特定操作が行われるものとして説明したが、これに代えて(加えて)、ウインドウに対する特定操作、または空調装置に対する特定操作が行われた場合においても、図17に示すような処理が行われてもよい。例えば、ウインドウが作動している場合において、会話が開始された直後に、ウインドウの動作が停止してもよい。また、例えば、空調装置が閾値以上の出力度合で作動している場合において、会話が開始された直後に、空調装置が閾値未満の出力度合で作動してもよい。
なお、上記のように特定制御が行われる場合、特定操作を行った運転者以外の特定乗員が認識できるような態様(運転者が認識できないような態様、または運転者とエージェントとの会話を妨げないような態様)で、特定操作が会話終了後に行われることを示す情報が、特定操作を行った特定乗員に提供されてもよい。例えば、エージェント機能部150は、特定操作を行った特定乗員に対応するスピーカ(特定操作を行った特定乗員から最も近くに設けられたスピーカ)に、特定操作に応じた制御は会話終了後に行われることを示す情報を、特定乗員に提供してもよい。
また、車室内に座席ごとに表示部が設けられている場合、特定操作を行った特定乗員が着座する座席に設けられた表示部に、会話終了後に特定操作に応じた制御が行われることを示す情報が表示されてもよい。
また、運転者は、特定制御を行うか否かを設定してもよい。例えば、運転者が、特定制御が行わないと車両に対して設定した場合、特定制御は行われなくてもよい。また、運転者は、所定の座席に着座した乗員が行う特定操作に対して特定制御は実行されないように設定してもよい。
以上説明した第1実施形態によれば、制御部122が、運転者とエージェント機能部150とが会話中に、車室内の音響環境を変化させる特定機器を同乗者が作動させる操作を行った場合には、会話の終了後に特定機器を作動させることにより、利用者にとって好ましい態様で車両に搭載された機器の制御が行われる。
<第1実施形態の変形例(1)>
第1実施形態の変形例では、エージェント機能部150―1が、会話状態認識部152と、制御部154とを備える。また、管理部110Aにおいて、会話状態認識部120と、制御部122とが省略される。以下、第1実施形態の車両Mとの相違点について説明する。
第1実施形態の変形例では、エージェント機能部150―1が、会話状態認識部152と、制御部154とを備える。また、管理部110Aにおいて、会話状態認識部120と、制御部122とが省略される。以下、第1実施形態の車両Mとの相違点について説明する。
図18は、第1実施形態の変形例の車両M1の構成の一例を示す図である。会話状態認識部152と、会話状態認識部120とは同様の機能を有し、制御部152と、制御部122とは同様の機能を有する。例えば、制御部154は、運転者とエージェント機能部150とが会話をしている場合において、車室内の音響環境を変化させる特定機器を作動させる操作を運転者とは異なる同乗者が行った場合には、会話の終了後に特定機器を作動させる。
以上説明した第1実施形態の変形例によれば、第1実施形態と同様の効果を奏する。
<第1実施形態の変形例(2)>
会話状態認識部152は、エージェントサーバ200または他のサーバ装置にエージェント機能部150と会話をしている乗員が、運転者であるか否かの認識を依頼してもよい。会話状態認識部120は、運転者とエージェント機能部150とが会話を行っているか否かの認識を依頼してもよい。この場合、エージェントサーバまたは他のサーバ装置は、第1実施形態で説明した会話状態認識部120が有する機能と同様の機能を有する。運転者であるか否かの認識の依頼または運転者とエージェント機能部150とが会話を行っているか否かの認識の依頼を、「認識依頼」と称する場合がある。
会話状態認識部152は、エージェントサーバ200または他のサーバ装置にエージェント機能部150と会話をしている乗員が、運転者であるか否かの認識を依頼してもよい。会話状態認識部120は、運転者とエージェント機能部150とが会話を行っているか否かの認識を依頼してもよい。この場合、エージェントサーバまたは他のサーバ装置は、第1実施形態で説明した会話状態認識部120が有する機能と同様の機能を有する。運転者であるか否かの認識の依頼または運転者とエージェント機能部150とが会話を行っているか否かの認識の依頼を、「認識依頼」と称する場合がある。
図19は、エージェント装置100とエージェントサーバ200とにより実行される処理の一例を示すフローチャートである。特定操作が音声で行われた場合の処理について説明する。また、図19のステップS100、ステップS102〜S110の処理は、図6の処理と同様の説明のため、説明を省略する。
まず、会話状態認識部120は、音声で特定操作が行われると、取得した音声(または発話がされていない場合は車室内の環境音)に基づく音声データをエージェントサーバ200に送信する(ステップS101)。次に、エージェントサーバ200は、ステップS101で送信された音声データを解析して、認識依頼に応じた認識結果を導出し、導出した認識結果をエージェント装置100に送信する(ステップS200)。次に、エージェント装置100が、ステップS200で送信された認識結果に基づいて、以降の処理を行う。
以上説明した第2実施形態によれば、エージェント装置100が、特定操作の操作主体または会話が終了したか否かの判定をエージェントサーバ200に依頼し、エージェントサーバ200により提供された認識結果に基づいて、特性制御を実行することにより、利用者にとって好ましい態様で車両に搭載された機器の制御が実現される。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
1‥エージェントシステム、20‥表示・操作装置、30‥スピーカユニット、100‥エージェント装置、110‥管理部、113‥取得部、120‥会話状態認識部、122‥制御部、150‥エージェント機能部、152‥会話状態認識部、154‥制御部、200‥エージェントサーバ
Claims (17)
- 車両の乗員の発話に応じて、音声による応答を含むサービスを提供するエージェント機能部と、
前記車両の乗員のうち運転者と前記エージェント機能部とが会話をしている場合において、車室内の音響環境を変化させる特定機器を作動させる操作を前記運転者とは異なる同乗者が行った場合には、前記会話の終了後に前記特定機器を作動させる制御部と、
を備えるエージェント装置。 - 前記運転者と前記エージェント機能部とが会話を行っているか否かを認識する会話状態認識部を更に備える、
請求項1に記載のエージェント装置。 - 前記エージェント機能部と会話をしている乗員が、運転者であるか否かを認識する会話状態認識部を更に備える、
請求項1または2に記載のエージェント装置。 - 前記運転者と前記エージェント機能部とが会話を行っているか否かの会話認識をサーバ装置に依頼し、前記サーバ装置により送信された会話認識の結果に基づいて、前記運転者と前記エージェント機能部とが会話を行っているか否かの認識を行う会話状態認識部を更に備える、
請求項1から3のうちいずれか1項に記載のエージェント装置。 - 前記エージェント機能部と会話をしている乗員が、運転者であるか否かの乗員認識をサーバ装置に依頼し、前記サーバ装置により送信された乗員認識の結果に基づいて、前記乗員が運転者であるか否かの認識を行う会話状態認識部を更に備える、
請求項1から4のうちいずれか1項に記載のエージェント装置。 - 前記音響環境を変化させる前記特定機器を作動させる操作とは、車室内の音響環境を前記エージェント機能部に対して音が伝わりにくくなる環境にする操作である、
請求項1から5のうちいずれか1項に記載のエージェント装置。 - 前記制御部は、前記同乗者と前記エージェント機能部とが会話をしている場合において、前記音響環境を変化させる特定機器を作動させる操作を前記運転者が行った場合には、前記会話の終了に関係なく前記特定機器を作動させる、
請求項1から6のうちいずれか1項に記載のエージェント装置。 - 前記特定機器は、空調装置、パワーウインドウ、またはオーディオのうち一以上の機器を含む、
請求項1から7のうちいずれか1項に記載のエージェント装置。 - 前記操作は、音声入力による操作、または所定のスイッチに対する操作である、
請求項1から8のうちいずれか1項に記載のエージェント装置。 - 前記制御部は、前記運転者と前記エージェント機能部とが会話をしている場合において、パワーウインドウを開状態または全開状態に近づける操作を前記同乗者が行った場合には、前記会話の終了後に前記パワーウインドウが開状態または全開状態に近づくように前記パワーウインドウを作動させる、
請求項1から9のうちいずれか1項に記載のエージェント装置。 - 前記制御部は、前記同乗者と前記エージェント機能部とが会話をしている場合において、パワーウインドウを開状態または全開状態に近づける操作を前記運転者が行った場合には、前記会話の終了に関係なく前記パワーウインドウが開状態または全開状態に近づくように前記パワーウインドウを作動させる、
請求項1から10のうちいずれか1項に記載のエージェント装置。 - 前記制御部は、前記運転者と前記エージェント機能部とが会話をしている場合において、空調装置を稼働させる、または前記空調装置の出力度合を上昇させる操作を前記同乗者が行った場合には、前記会話の終了後に前記空調装置を稼働または前記出力度合を上昇させる、
請求項1から11のうちいずれか1項に記載のエージェント装置。 - 前記制御部は、前記同乗者と前記エージェント機能部とが会話をしている場合において、空調装置を稼働させる、または前記空調装置の出力度合を上昇させる操作を前記運転者が行った場合には、前記会話の終了に関係なく前記空調装置を稼働または前記出力度合を上昇させる、
請求項1から12のうちいずれか1項に記載のエージェント装置。 - 前記制御部は、前記運転者と前記エージェント機能部とが会話をしている場合において、オーディオを稼働させる、またはオーディオにより出力される音を上昇させる操作を前記同乗者が行った場合には、前記会話の終了後に、前記操作に応じて前記オーディオを作動させる、
請求項1から13のうちいずれか1項に記載のエージェント装置。 - 前記制御部は、前記同乗者と前記エージェント機能部とが会話をしている場合において、オーディオを稼働させる、または前記オーディオにより出力される音を上昇させる操作を前記運転者が行った場合には、前記会話の終了に関係なく前記操作に応じて前記オーディオを作動させる、
請求項1から14のうちいずれか1項に記載のエージェント装置。 - コンピュータが、
車両の乗員の発話に応じて、音声による応答を含むサービスを提供するエージェント機能部に、前記サービスを提供させ、
前記車両の乗員のうち運転者と前記エージェント機能部とが会話をしている場合において、車室内の音響環境を変化させる特定機器を作動させる操作を前記運転者とは異なる同乗者が行った場合には、前記会話の終了後に前記特定機器を作動させる、
エージェント装置の制御方法。 - コンピュータに、
車両の乗員の発話に応じて、音声による応答を含むサービスを提供するエージェント機能部を用いて前記サービスを提供させ、
前記車両の乗員のうち運転者と前記エージェント機能部とが会話をしている場合において、車室内の音響環境を変化させる特定機器を作動させる操作を前記運転者とは異なる同乗者が行った場合には、前記会話の終了後に前記特定機器を作動させる、
プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019057644A JP2020157854A (ja) | 2019-03-26 | 2019-03-26 | エージェント装置、エージェント装置の制御方法、およびプログラム |
CN202010215594.3A CN111824174A (zh) | 2019-03-26 | 2020-03-24 | 智能体装置、智能体装置的控制方法及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019057644A JP2020157854A (ja) | 2019-03-26 | 2019-03-26 | エージェント装置、エージェント装置の制御方法、およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020157854A true JP2020157854A (ja) | 2020-10-01 |
Family
ID=72641341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019057644A Pending JP2020157854A (ja) | 2019-03-26 | 2019-03-26 | エージェント装置、エージェント装置の制御方法、およびプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2020157854A (ja) |
CN (1) | CN111824174A (ja) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3446805B2 (ja) * | 1997-08-18 | 2003-09-16 | 本田技研工業株式会社 | 車両用音声入力装置 |
EP1560200B8 (en) * | 2004-01-29 | 2009-08-05 | Harman Becker Automotive Systems GmbH | Method and system for spoken dialogue interface |
JP2016161754A (ja) * | 2015-03-02 | 2016-09-05 | クラリオン株式会社 | 車載装置 |
JP6558180B2 (ja) * | 2015-09-28 | 2019-08-14 | 株式会社デンソー | 情報提供装置及び情報提供制御プログラム |
CN108399916A (zh) * | 2018-01-08 | 2018-08-14 | 蔚来汽车有限公司 | 车载智能语音交互系统和方法、处理装置和存储装置 |
-
2019
- 2019-03-26 JP JP2019057644A patent/JP2020157854A/ja active Pending
-
2020
- 2020-03-24 CN CN202010215594.3A patent/CN111824174A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
CN111824174A (zh) | 2020-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2020144663A (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
JP2020147214A (ja) | エージェント装置、システム、エージェント装置の制御方法、およびプログラム | |
JP2020144260A (ja) | 車載エージェントシステム、車載エージェントシステムの制御方法、およびプログラム | |
JP7266418B2 (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
JP7222757B2 (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
CN111717142A (zh) | 智能体装置、智能体装置的控制方法及存储介质 | |
JP2020144264A (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
JP2020144275A (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
JP2020160833A (ja) | 情報提供装置、情報提供方法、およびプログラム | |
US11797261B2 (en) | On-vehicle device, method of controlling on-vehicle device, and storage medium | |
US11542744B2 (en) | Agent device, agent device control method, and storage medium | |
JP7175221B2 (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
JP2020152298A (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
CN111661065A (zh) | 智能体装置、智能体装置的控制方法及存储介质 | |
JP2020157854A (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
JP2020157853A (ja) | 車載エージェントシステム、車載エージェントシステムの制御方法、およびプログラム | |
JP2020142758A (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
JP2020160133A (ja) | エージェントシステム、エージェントシステムの制御方法、およびプログラム | |
JP2020154942A (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
JP2020160848A (ja) | サーバ装置、情報提供システム、情報提供方法、およびプログラム | |
JP2020148583A (ja) | エージェント装置、エージェント装置の制御方法、およびプログラム | |
JP2020142721A (ja) | エージェントシステム、車載機器の制御方法、及びプログラム | |
US11518399B2 (en) | Agent device, agent system, method for controlling agent device, and storage medium | |
JP7297483B2 (ja) | エージェントシステム、サーバ装置、エージェントシステムの制御方法、およびプログラム | |
CN111559317B (zh) | 智能体装置、智能体装置的控制方法及存储介质 |