JP2020154098A - 車載機器制御システム、車載機器制御装置、車載機器制御方法、及びプログラム - Google Patents

車載機器制御システム、車載機器制御装置、車載機器制御方法、及びプログラム Download PDF

Info

Publication number
JP2020154098A
JP2020154098A JP2019051674A JP2019051674A JP2020154098A JP 2020154098 A JP2020154098 A JP 2020154098A JP 2019051674 A JP2019051674 A JP 2019051674A JP 2019051674 A JP2019051674 A JP 2019051674A JP 2020154098 A JP2020154098 A JP 2020154098A
Authority
JP
Japan
Prior art keywords
vehicle device
vehicle
voice
unit
occupant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019051674A
Other languages
English (en)
Other versions
JP7261626B2 (ja
Inventor
桂輔 荒川
Keisuke Arakawa
桂輔 荒川
潤一郎 尾中
Junichiro Onaka
潤一郎 尾中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2019051674A priority Critical patent/JP7261626B2/ja
Priority to CN202010189106.6A priority patent/CN111724798B/zh
Publication of JP2020154098A publication Critical patent/JP2020154098A/ja
Application granted granted Critical
Publication of JP7261626B2 publication Critical patent/JP7261626B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mechanical Engineering (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Navigation (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】車両の安全性を保ちつつ、簡便に車載機器の動作を指示することができる車載機器制御システム、車載機器制御装置、車載機器制御方法及びプログラムを提供する。【解決手段】エージェント装置は、車載機器制御システム車両に搭乗する乗員の発話内容を含む音声を取得する取得部と、車載機器制御部と、音声を認識する音声認識部と、動作が指示される車載機器を特定する特定部と、特定された車載機器が、所定のグループに属する車載機器であるかを判定する判定部と、汎用スイッチと、を備える。車載機器制御部は、指示を受ける車載機器が所定のグループに属する車載機器である場合、スピーカ又は表示部により、動作を実行してもよいかを問い合わせる音声及び動作を実行についての同意を促す同意促進画像のうち少なくとも一方を出力させつつ、同意したことを示す入力が汎用スイッチにより受け付けられた場合、指示を受ける車載機器の動作を制御する。【選択図】図11

Description

本発明は、車載機器制御システム、車載機器制御装置、車載機器制御方法、及びプログラムに関する。
人間と音声対話によって情報を提供するヒューマンマシンインターフェースの研究が進められている。これに関連し、ロボットのコミュニケーションの対象とする人物の状況に基づいて、当該人物に対する発話の可否や発話音量、発話口調を決定する技術や、語彙が登録された辞書を利用して、乗員が発話した音声を認識し、車室内の複数の制御対象機器を、認識した音声の内容に応じて制御する技術が知られている(例えば、特許文献1、2参照)。
特許第4976903号公報 特開2007−286136号公報
しかしながら、従来の技術では、例えば車室内に乗員が複数いる場合に、特定の乗員(例えば、車両の運転者)にしか許容されていない車載機器の操作を、乗員が発話した音声によって、確実に指示することには難しい場合があった。
本発明の態様は、このような事情を考慮してなされたものであり、特定の乗員にしか許容されていない操作を確実に指示し、指示に係る車両の運転責任者の負荷を軽減することができる車載機器制御システム、車載機器制御装置、車載機器制御方法、及びプログラムを提供することを目的の一つとする。
本発明に係る車載機器制御システム、車載機器制御装置、車載機器制御方法、及びプログラムは、以下の構成を採用した。
(1):この発明の一態様に係る車載機器制御システムは、車両に搭乗する乗員の発話内容を含む音声を取得する取得部と、前記車両に搭載され、スピーカおよび表示部を含む車載機器の動作を制御する車載機器制御部と、前記取得部により取得された前記車両の乗員が発話内容を含む音声を認識する音声認識部と、前記音声認識部により認識された前記乗員の音声によって動作が指示される前記車載機器を特定する特定部と、特定された前記車載機器が、所定のグループに属する車載機器であるか否かを判定する判定部と、汎用スイッチと、を備え、前記車載機器制御部は、前記指示を受ける車載機器が前記所定のグループに属する車載機器であると前記判定部により判定された場合、前記スピーカ、又は、前記表示部により、前記所定のグループに属する車載機器が前記指示に対応する動作を実行してもよいかを問い合わせる音声、及び、前記所定のグループに属する車載機器における前記動作を実行についての同意を促す同意促進画像のうち少なくとも一方を出力させつつ、前記指示を実行することに前記乗員が同意したことを示す入力が前記汎用スイッチにより受け付けられた場合、前記指示を受ける前記車載機器の動作を制御するものである。
(2):上記(1)の態様において、前記所定のグループに属する車載機器は、前記車両の挙動に影響する車載機器である。
(3):上記(1)の態様において、前記所定のグループに属する車載機器は、前記車両における運転者にのみ許容されている操作に対応する車載機器である。
(4):上記(1)の態様において、前記汎用スイッチは、前記同意したことを示す入力を含む、音声指示に関する所定の入力を受け付ける場面以外では、他の用途に使用され得るスイッチである。
(5):上記(4)の態様において、前記音声認識部は、音声の受付を開始することを示す入力が前記汎用スイッチにより受け付けられた場合、前記取得部であるマイクにより収集された前記乗員の発話内容を含む音声の認識を開始する。
(6):上記(1)〜(5)のいずれかの態様において、前記汎用スイッチは、ステアリングホイールに設けられている。
(7):上記(1)〜(6)のいずれかの態様において、前記車載機器制御システムは、更に、前記指示を受ける前記車載機器が、前記所定の車載機器以外のグループに属する車載機器であると判定された際、前記車載機器制御部に、前記所定の車載機器以外のグループに属する車載機器の動作を制御させるスイッチを備えるものである。
(8):この発明の一態様に係る車載機器制御装置は、車両に搭乗する乗員の発話内容を含む音声を取得する取得部と、前記車両に搭載され、スピーカおよび表示部を含む車載機器の動作を制御する車載機器制御部と、前記取得部により取得された前記乗員の発話内容を含む音声を認識する音声認識部と、前記音声認識部により認識された前記乗員の音声によって動作が指示される前記車載機器を特定する特定部と、特定された前記車載機器が、所定のグループに属する車載機器であるか否かを判定する判定部と、汎用スイッチと、を備え、前記車載機器制御部は、前記指示を受ける車載機器が前記所定のグループに属する車載機器であると前記判定部により判定された場合、前記スピーカ、又は、前記表示部により、所定のグループに属する車載機器が前記指示に対応する動作を実行してもよいかを問い合わせる音声、及び、前記所定のグループに属する車載機器における前記動作を実行についての同意を促す同意促進画像のうち少なくとも一方を出力させつつ、前記指示を実行することに前記乗員が同意したことを示す入力が前記汎用スイッチにより受け付けられた場合、前記指示を受ける前記車載機器の動作を制御するものである。
(9):この発明の一態様に係る車載機器制御方法は、車両の乗員の発話内容を含む音声を取得する取得部と、汎用スイッチとを備える車載機器制御システムにおける単一または複数のコンピュータが、前記乗員の発話内容を含む音声を認識するステップと、認識された前記乗員の音声によって動作が指示される車載機器を特定するステップと、特定された前記車載機器が、所定のグループに属する車載機器であるか否かを判定するステップと、前記指示を受ける前記車載機器が前記所定のグループに属する車載機器であると判定された場合、前記所定のグループに属する車載機器が前記指示に対応する動作を実行してもよいかを問い合わせる音声、及び、所定のグループに属する車載機器における前記動作を実行についての同意を促す同意促進画像のうち少なくとも一方を、スピーカまたは表示部により出力させるステップと、その際に、前記指示を実行することに前記乗員が同意したことを示す入力が前記汎用スイッチによって受け付けられた場合、前記指示を受けた前記車載機器の動作を制御するステップとを有するものである。
(10):この発明の一態様に係るプログラムは、車両の乗員の発話内容を含む音声を取得する取得部と、汎用スイッチとを備える車載機器制御システムにおける単一または複数のコンピュータにインストールされ、前記乗員の発話内容を含む音声を認識する処理と、認識された前記乗員の音声により動作が指示される車載機器を特定する処理と、特定された前記車載機器が、所定のグループに属する車載機器であるか否かを判定する処理と、前記指示を受ける前記車載機器が、前記所定のグループに属する車載機器であると判定された場合、前記所定のグループに属する車載機器が前記指示に対応する動作を実行してもよいかを問い合わせる音声、及び、前記所定のグループに属する車載機器における前記動作を実行についての同意を促す同意促進画像のうち少なくとも一方を、スピーカまたは表示部により出力させる処理と、その際に、前記指示を実行することに前記乗員が同意したことを示す入力が前記汎用スイッチによって受け付けられた場合、前記指示を受けた前記車載機器の動作を制御する処理と、を含むコンピュータに実行させるものである。
(1)〜(10)の態様によれば、車両の安全性を保ちつつ、乗員に車載機器の動作を簡便に指示させることができる。
第1実施形態に係るエージェントシステム1の構成の一例を示す図である。 第1実施形態に係るエージェント装置100の構成の一例を示す図である。 運転席から見た車室内の一例を示す図である。 車両Mを上から見た車室内の一例を示す図である。 運転席のリクライニング機構に係る同意促進画像IM1の一例を示す図である。 第1実施形態に係るサーバ装置200の構成の一例を示す図である。 回答情報234の内容の一例を示す図である。 影響車載機器EVEに係る車載機器制御を示す情報を受信した場面のタイミングチャートの一例を示す図である。 第1実施形態に係るエージェント装置100の一連の処理の流れを示すフローチャートである。 第1実施形態に係るサーバ装置200の一例の処理の流れを示すフローチャートである。 第2実施形態に係るエージェント装置100Aの一例を示す図である。 第2実施形態に係るエージェント装置100Aの一連の処理の流れを示すフローチャートである。
以下、図面を参照し、本発明の車載機器制御システム、車載機器制御装置、車載機器制御方法、及びプログラムの実施形態について説明する。
<第1実施形態>
[システム構成]
図1は、第1実施形態に係るエージェントシステム1の構成の一例を示す図である。第1実施形態に係るエージェントシステム1は、例えば、車両(以下、車両M)に搭載されるエージェント装置100と、サーバ装置200とを備える。車両Mは、例えば、二輪や三輪、四輪等の車両である。これらの車両の駆動源は、ディーゼルエンジンやガソリンエンジン等の内燃機関、電動機、或いはこれらの組み合わせであってよい。電動機は、内燃機関に連結された発電機による発電電力、或いは二次電池や燃料電池の放電電力を使用して動作する。
エージェント装置100とサーバ装置200とは、ネットワークNWを介して通信可能に接続される。ネットワークNWは、LAN(Local Area Network)やWAN(Wide Area Network)等が含まれる。ネットワークNWには、例えば、Wi−FiやBluetooth(登録商標、以下省略)等無線通信を利用したネットワークが含まれてよい。エージェントシステム1は、複数のエージェント装置100および複数のサーバ装置200により構成されてもよい。
エージェント装置100は、エージェント機能を用いて車両Mの乗員からの音声を取得し、取得した音声をサーバ装置200に送信する。また、エージェント装置100は、サーバ装置から得られるデータ(例えば、エージェントデータ)等に基づいて、乗員と対話したり、画像や映像等の情報を提供したり、車載機器VEや他の装置を制御したりする。車両Mには、例えば、動作が車両Mの挙動に影響する車載機器VE(以下、影響車載機器EVE)と、動作が車両Mの挙動に影響しない車載機器VE(以下、非影響車載機器NVE)とが搭載される。影響車載機器EVEは、例えば、運転者の姿勢に影響を与える機器(運転席のリクライニング機構、運転席のシートポジション制御機構等)、自動運転や高度運転支援(例えば、ACC(Adaptive Cruise Control)や、VSA(Vehicle Stability Assist)等)に係る機器等であり、運転者のみが操作を許容(許可)されている機器である。これに対して、非影響車載機器NVEは、例えば、エアコン、パワーウィンドウ、オーディオ、カーナビゲーション等であり、運転者以外の乗員も操作を許容されている機器である。更に、車載機器VEの分類方法としては、例えば前記車両における運転者にのみ許容(許可)されている操作に対応する車載機器VEと、それ以外の車載機器VEとに分類するものがある。運転者にのみ許容(許可)されていない操作に対応する車載機器としては、影響車載機器EVEに加え、例えば、運転席側のパワーウィンドウ等である。
サーバ装置200は、車両Mに搭載されたエージェント装置100と通信し、エージェント装置100から各種データを取得する。サーバ装置200は、取得したデータに基づいて、音声等による問い合わせに関するエージェントデータを生成し、生成したエージェントデータをエージェント装置100に提供する。第1実施形態に係るサーバ装置200の機能は、エージェント機能に含まれる。また、サーバ装置200の機能は、エージェント装置100におけるエージェント機能を、より高精度な機能に更新する。
[エージェント装置の構成]
図2は、第1実施形態に係るエージェント装置100の構成の一例を示す図である。第1実施形態に係るエージェント装置100は、例えば、エージェント側通信部102と、マイク(マイクロフォン)106と、スピーカ108と、表示部110と、第1汎用スイッチ112と、第2汎用スイッチ113と、エージェント側制御部120と、エージェント側記憶部150とを備える。これらの装置や機器は、CAN(Controller Area Network)通信線等の多重通信線やシリアル通信線、無線通信網等によって互いに接続されてよい。なお、図2に示すエージェント装置100の構成はあくまでも一例であり、構成の一部が省略されてもよいし、更に別の構成が追加されてもよい。
エージェント側通信部102は、NIC(Network Interface controller)等の通信インターフェースを含む。エージェント側通信部102は、ネットワークNWを介してサーバ装置200等と通信する。
マイク106は、車室内の音声を電気信号化し収音する音声入力装置である。マイク106は、収音した音声のデータ(以下、音声データ)をエージェント側制御部120に出力する。例えば、マイク106は、乗員が車室内のシートに着座したときの前方付近に設置される。例えば、マイク106は、マットランプ、ステアリングホイール、インストルメントパネル、またはシートの付近に設置される。マイク106は、車室内に複数設置されてよい。
スピーカ108は、例えば、車室内のシート付近または表示部110付近に設置される。スピーカ108は、エージェント側制御部120により出力される情報に基づいて音声を出力する。
表示部110は、LCD(Liquid Crystal Display)や有機EL(Electroluminescence)ディスプレイ等の表示装置を含む。表示部110は、エージェント側制御部120により出力される情報に基づいて画像を表示する。
第1汎用スイッチ112は、例えば、ボタン等のユーザインターフェースである。第1汎用スイッチ112は、乗員の操作を受け付けて、受け付けた操作に応じた信号をエージェント側制御部120に出力する。第1汎用スイッチ112は、例えば、ステアリングホイールに設けられる。第1汎用スイッチ112は、例えば、専用の機能を割り付けられておらず、何らかの用途に用いられる際には、用途がエージェント装置100によって決定され、スピーカ108から出力される音声や、表示部110に表示される画像によって用途が指示されるものである。具体的には、第1汎用スイッチ112は、スピーカ108から「運転席側のパワーウィンドウを開けますか?同意する場合には、第1汎用スイッチ112を押してください。」等のように、その用途が指示される。
なお、第1汎用スイッチ112は、乗員が同意したことを示す入力の受付け以外の用途に用いられてもよい。例えば、第1汎用スイッチ112は、発話の開始を受け付けるスイッチとして用いられてもよい。また、第1汎用スイッチ112は、乗員が同意したことを示す入力を含む、音声指示に関する所定の入力を受け付ける場面以外では、他の用途に使用されてもよい。他の用途は、例えば、車両Mのオーディオ装置にペアリングされている携帯電話の通話開始や、オーディオ装置のボリューム調整、オーディオ装置の起動/停止、車内照明の点灯/消灯等である。また、第1汎用スイッチ112は、発光する構成を有しており、乗員が同意したことを示す入力の受付けの際に使用するタイミング、又は他の用途で使用できるタイミングにおいて、点灯や点滅し、入力を受け付けるタイミングを乗員に示してもよい。また、第1汎用スイッチ112は、入力の受付けの際に、用途に応じて発光色を異ならせ、乗員に用途を示してもよい。
第2汎用スイッチ113は、例えば、ボタン等のユーザインターフェースである。第2汎用スイッチ113は、乗員の操作を受け付けて、受け付けた操作に応じた信号をエージェント側制御部120に出力する。第2汎用スイッチ113は、例えば、専用の機能を割り付けられておらず、何らかの用途に用いられる際には、用途がエージェント装置100によって決定され、スピーカ108から出力される音声や、表示部110に表示される画像によって用途が指示されるものである。具体的には、第2汎用スイッチ113は、スピーカ108から「エアコンを起動しますか?同意する場合には、第2汎用スイッチ113を押してください。」等のように、その用途が指示される。
図3は、運転席から見た車室内の一例を示す図である。図示の例の車室内には、マイク106A〜106Cと、スピーカ108A〜108Cと、表示部110A〜110Cとが設置される。マイク106Aは、例えば、ステアリングホイールに設けられ、主に運転者が発話した音声を収音する。マイク106Bは、例えば、助手席正面のインストルメントパネル(ダッシュボードまたはガーニッシュ)IPに設けられ、主に助手席の乗員が発話した音声を収音する。マイク106Cは、例えば、インストルメントパネルの中央(運転席と助手席との間)付近に設置される。
スピーカ108Aは、例えば、運転席側のドアの下部に設置され、スピーカ108Bは、例えば、助手席側のドアの下部に設置され、スピーカ108Cは、例えば、表示部110Cの付近、つまり、インストルメントパネルIPの中央付近に設置される。
表示部110Aは、例えば運転者が車外を視認する際の視線の先に虚像を表示させるHUD(Head-Up Display)装置である。HUD装置は、例えば、車両Mのフロントウインドシールド、或いはコンバイナーと呼ばれる光の透過性を有する透明な部材に光を投光することで、乗員に虚像を視認させる装置である。乗員は、主に運転者であるが、運転者以外の乗員であってもよい。
表示部110Bは、運転席(ステアリングホイールに最も近い座席)の正面付近のインストルメントパネルIPに設けられ、乗員がステアリングホイールの間隙から、或いはステアリングホイール越しに視認可能な位置に設置される。表示部110Bは、例えば、LCDや有機EL表示装置等である。表示部110Bには、例えば、車両Mの速度、エンジン回転数、燃料残量、ラジエータ水温、走行距離、その他の情報の画像が表示される。
表示部110Cは、インストルメントパネルIPの中央付近に設置される。表示部110Cは、例えば、表示部110Bと同様に、LCDや有機EL表示装置等である。表示部110Cは、テレビ番組や映画等のコンテンツを表示する。
第1汎用スイッチ112は、例えば、ステアリングホイールのうち、運転操作の妨げにならない位置(例えば、ステアリングホイールの外周以外の位置)に設けられる。
なお、車両Mには、更に、後部座席付近にマイクとスピーカが設けられてよい。図4は、車両Mを上から見た車室内の一例を示す図である。車室内には、図3で例示したマイクスピーカに加えて、更に、マイク106D、106Eと、スピーカ108D、108Eとが設置されてよい。
マイク106Dは、例えば、助手席ST2の後方に設置された後部座席ST3の付近(例えば、助手席ST2の後面)に設けられ、主に、後部座席ST3に着座する乗員が発話した音声を収音する。マイク106Eは、例えば、運転席ST1の後方に設置された後部座席ST4の付近(例えば、運転席ST1の後面)に設けられ、主に、後部座席ST4に着座する乗員が発話した音声を収音する。
スピーカ108Dは、例えば、後部座席ST3側のドアの下部に設置され、スピーカ108Eは、例えば、後部座席ST4側のドアの下部に設置される。
第2汎用スイッチ113は、例えば、マイク106A〜106Dの近傍に設けられる。
なお、図1に例示した車両Mは、図3または図4に例示するように、乗員である運転手が操作可能なステアリングホイールを備える車両であるものとして説明したがこれに限られない。例えば、車両Mは、ルーフがない、すなわち車室がない(またはその明確な区分けがない)車両であってもよい。また、図3または図4の例では、車両Mを運転操作する運転手が座る運転席と、その他の運転操作をしない乗員が座る助手席や後部座席とが一つの室内にあるものとして説明しているがこれに限られない。例えば、車両Mは、ステアリングホイールに代えて、ステアリングハンドルを備えた鞍乗り型自動二輪車両であってもよい。また、図3または図4の例では、車両Mが、ステアリングホイールを備える車両であるものとして説明しているがこれに限られない。例えば、車両Mは、ステアリングホイールのような運転操作機器が設けられていない自動運転車両であってもよい。自動運転車両とは、例えば、乗員の操作に依らずに車両の操舵または加減速のうち一方または双方を制御して運転制御を実行することである。
図2の説明に戻り、エージェント側制御部120は、例えば、取得部122と、音声合成部124と、出力制御部126と、通信制御部128と、特定部130と、判定部132と、車載機器制御部134とを備える。これらの構成要素は、例えば、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)等のプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めエージェント側記憶部150(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD−ROM等の着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることでエージェント側記憶部150にインストールされてもよい。
エージェント側記憶部150は、HDD、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)、ROM(Read Only Memory)、またはRAM(Random Access Memory)等により実現される。エージェント側記憶部150には、例えば、プロセッサによって参照されるプログラム等と、車載機器情報152が格納される。車載機器情報152は、車両Mに搭載されている車載機器VE(の一覧)を示す情報であり、車載機器VEが、影響車載機器EVEであるか非影響車載機器NVEであるかを示す情報である。
取得部122は、マイク106から音声データを取得したり、他の情報を取得したりする。
音声合成部124は、エージェント側通信部102がサーバ装置200から受信したデータ(後述するエージェントデータ)に音声制御内容が含まれる場合に、音声制御として発話によって指示(つまり、音声指示)された音声データに基づいて、人工的な合成音声(以下、エージェント音声と称する)を生成する。
出力制御部126は、音声合成部124によってエージェント音声が生成されると、そのエージェント音声をスピーカ108に出力させる。また、出力制御部126は、エージェントデータに画像制御内容が含まれる場合に、画像制御として指示された画像データを表示部110に表示させる。また、出力制御部126は、音声データの認識結果(フレーズ等のテキストデータ)の画像を表示部110に表示させてもよい。
通信制御部128は、エージェント側通信部102を介して、取得部122によって取得された音声データをサーバ装置200に送信する。
特定部130は、エージェントデータに車載機器制御を示す情報が含まれる場合、車載機器情報152に基づいて、車載機器制御が行われる車載機器VEを特定する。特定部130は、例えば、意味情報に含まれる車載機器VE名を検索キーとして車載機器情報152を検索し、車載機器VEを特定する。
判定部132は、車載機器情報152に基づいて、特定部130によって特定された車載機器VEが、影響車載機器EVEであるか否かを判定する。
車載機器制御部134は、判定部132によって車載機器制御内容によって動作が指示される車載機器VEが、影響車載機器EVEではない(つまり、非影響車載機器NVE)であると判定された場合、車載機器制御内容に基づいて、非影響車載機器NVEの動作を制御する。車載機器制御部134は、車載機器VEが影響車載機器EVEであると判定された場合、車載機器制御内容に示される制御を実行することについて、乗員が同意したことを示す入力が第1汎用スイッチ112によって受け付けられたか否かを判定する。車載機器制御部134は、第1汎用スイッチ112によって乗員が同意したことを示す入力が受け付けられた場合、車載機器制御内容に基づいて、影響車載機器EVEの動作を制御する。
なお、車両Mは、更にインストルメントパネルIPの中央や、後席用のマイク106D、及びマイク106E近傍に、第1汎用スイッチ112以外の他のスイッチである第2汎用スイッチ113を備えて、判定部132によって車載機器制御内容によって動作が指示される車載機器VEが、所定のグループに属する車載機器でない(つまり、非影響車載機器NVE;又は運転者以外でも許容されている操作に対応する車載機器である)と判定された場合、車載機器制御部134は、車載機器制御内容に基づいて、非影響車載機器NVEの制御内容の実行について、乗員が同意したことを、上述のインストルメントパネルIPの中央や、後席用のマイク106D、及びマイク106E近傍に備えられた第2汎用スイッチ113で受け付けてもかまわない。その際は、第2汎用スイッチ113によって乗員が同意したことを示す入力が受け付けられた場合、車載機器制御内容に基づいて、非影響車載機器NVE(又は運転者以外でも許容されている操作に対応する車載機器)の動作を制御する。
ここで、音声合成部124は、判定部132が車載機器制御内容によって動作が指示される車載機器VEが、影響車載機器EVEであると判定した場合、車載機器制御内容に示される制御を実行してもよいかを問い合わせつつ、実行に同意する場合には第1汎用スイッチ112を操作(例えば、押下)することを促す音声を生成する。出力制御部126は、音声合成部124によって生成された第1汎用スイッチ112を操作することを促す音声をスピーカ108によって出力する。また、出力制御部126は、判定部132が車載機器制御内容によって動作が指示される車載機器VEが影響車載機器EVEであると判定した場合、影響車載機器EVEに対して車載機器制御内容に示される指示を実行してもよいかを問い合わせつつ、同意する場合には第1汎用スイッチ112を操作(例えば、押下)することを促す画像(以下、同意促進画像)を表示部110に表示させる。
図5は、運転席のリクライニング機構(つまり、影響車載機器EVE)に係る同意促進画像IM1の一例を示す図である。同意促進画像IM1には、例えば、運転席のリクライニング機構に対して、車載機器制御内容に示される指示(この場合、リクライニング)を実行してもよいかを問い合わせるメッセージMSと、第1汎用スイッチ112に対する同意を示す操作の方法を示す画像(図示する画像IM2)とが含まれる。メッセージMSは、例えば、「運転席をリクライニングしてもいいですか?よろしければ汎用スイッチを押してください。」等のメッセージである。
[サーバ装置の構成]
図6は、第1実施形態に係るサーバ装置200の構成の一例を示す図である。第1実施形態に係るサーバ装置200は、例えば、サーバ側通信部202と、サーバ側制御部210と、サーバ側記憶部230とを備える。
サーバ側通信部202は、NIC等の通信インターフェースを含む。サーバ側通信部202は、ネットワークNWを介して各車両Mに搭載されたエージェント装置100等と通信する。
サーバ側制御部210は、例えば、取得部212と、発話区間抽出部214と、音声認識部216と、エージェントデータ生成部222と、通信制御部224とを備える。これらの構成要素は、例えば、CPUやGPU等のプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSIやASIC、FPGA等のハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めサーバ側記憶部230(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD−ROM等の着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることでサーバ側記憶部230にインストールされてもよい。
サーバ側記憶部230は、HDD、フラッシュメモリ、EEPROM、ROM、またはRAM等により実現される。サーバ側記憶部230には、例えば、プロセッサによって参照されるプログラムのほかに、回答情報234等が格納される。
図7は、回答情報234の内容の一例を示す図である。回答情報234には、例えば、意味情報に、エージェント側制御部120に実行させる制御内容が対応付けられている。意味情報とは、例えば、音声認識部216により発話内容全体から認識される意味である。制御内容には、例えば、車載機器VEに対する動作の指示(制御)に関する車載機器制御や、エージェント音声を出力する音声制御、表示部110に表示させる画像制御等が含まれる。例えば、回答情報234では、「エアコンの起動」という意味情報に対して、「エアコンを起動させる」車載機器制御と、「エアコンを起動しました」という音声制御と、車室内温度及び設定温度を表示する表示制御とが対応付けられている。なお、車載機器制御内容が、影響車載機器EVEに関するものである場合、第1汎用スイッチ112によって乗員の同意が得られていない場合には、制御を実行できないため、影響車載機器EVEの意味情報に対しては、音声情報や表示制御が対応付けられていない。
図6に戻り、取得部212は、サーバ側通信部202を介して、エージェント装置100から、音声データを取得する。
発話区間抽出部214は、取得部122によって取得された音声データから、乗員が発話している期間(以下、発話区間と称する)を抽出する。例えば、発話区間抽出部214は、零交差法を利用して、音声データに含まれる音声信号の振幅に基づいて発話区間を抽出してよい。また、発話区間抽出部214は、混合ガウス分布モデル(GMM;Gaussian mixture model)に基づいて、音声データから発話区間を抽出してもよいし、発話区間特有の音声信号をテンプレート化したデータベースとテンプレートマッチング処理を行うことで、音声データから発話区間を抽出してもよい。
音声認識部216は、発話区間抽出部214によって抽出された発話区間ごとに音声データを認識し、認識した音声データをテキスト化することで、発話内容を含むテキストデータを生成する。例えば、音声認識部216は、発話区間の音声信号を、低周波数や高周波数等の複数の周波数帯に分離し、分類した各音声信号をフーリエ変換することで、スペクトログラムを生成する。音声認識部216は、生成したスペクトログラムを、再帰的ニューラルネットワークに入力することで、スペクトログラムから文字列を得る。再帰的ニューラルネットワークは、例えば、学習用の音声から生成したスペクトログラムに対して、その学習用の音声に対応した既知の文字列が教師ラベルとして対応付けられた教師データを利用することで、予め学習されていてよい。そして、音声認識部216は、再帰的ニューラルネットワークから得た文字列のデータを、テキストデータとして出力する。
また、音声認識部216は、自然言語のテキストデータの構文解析を行って、テキストデータを形態素に分け、各形態素からテキストデータに含まれる文言を認識する。
エージェントデータ生成部222は、音声認識部216により認識された発話内容の意味に基づいて、回答情報234の意味情報を参照し、合致する意味情報に対応付けられた制御内容を取得する。なお、認識結果として、「エアコンをつけて」、「エアコンの電源を入れてください」等の意味が認識された場合、エージェントデータ生成部222は、上述の意味を標準文字情報「エアコンの起動」や、標準コマンド情報「TURN_AC_ON」等に置き換える。これにより、発話内容の要求に文字揺らぎがあった場合にも要求にあった制御内容を取得し易くすることができる。
また、エージェントデータ生成部222は、取得した制御内容(例えば、車載機器制御、音声制御、または表示制御のうち少なくとも一つ)に対応する処理を実行させるためのエージェントデータを生成する。
通信制御部224は、エージェントデータ生成部222により生成されたエージェントデータを、サーバ側通信部202を介して車両Mに送信する。これにより、車両Mは、エージェント側制御部120によって、エージェントデータに対応する制御が実行される。
[影響車載機器EVEに係る車載機器制御を示す情報の受信時のタイミングチャート]
図8は、影響車載機器EVEに係る車載機器制御を示す情報を受信した場面のタイミングチャートの一例を示す図である。図8において、各軸(図示する軸AX1〜AX4)は、時間経過を示し、軸AX1には、車両Mの乗員の行動が示され、軸AX2には、スピーカ108の動作が示され、軸AX3には、表示部110の動作が示され、軸AX4には、第1汎用スイッチ112の状態が示される。
まず、時刻t1〜t2において、乗員が、「運転席をリクライニングして」という発話を行う(図示する、事象EV1)。事象EV1が発生したことに応じて、取得部122は、マイク106によって収音された発話音声を音声データとして取得し、通信制御部128は、エージェント側通信部102を介して取得部122によって取得された音声データをサーバ装置200に送信する。音声認識部216では、取得部122によって取得された音声データの発話内容を特定し、音声データの意味情報、及び車載機器制御が「運転席をリクライニング」であることが認識する。また、サーバ装置200は、「運転席をリクライニング」することを示す車載機器制御を示す情報を含めたエージェントデータをエージェント装置100に送信する。
判定部132は、サーバ装置200からエージェントデータを受信し、エージェントデータに含まれる車載機器制御を示す情報が、影響車載機器EVEに係るものであるか否かを判定する。音声合成部124は、判定部132によって車載機器制御に示される車載機器VEが、影響車載機器EVE(この一例では、運転席のリクライニング機構)であると判定された場合、「運転席をリクライニングしてもよいですか?よろしければ汎用スイッチを押してください。」等の音声を生成する。出力制御部126は、時刻t3において、音声合成部124によって生成された音声をスピーカ108によって出力する(図示する事象EV2)。また、出力制御部126は、時刻t3において、判定部132によって車載機器制御に示される車載機器VEが、影響車載機器EVE(この一例では、運転席のリクライニング機構)であると判定された場合、運転席をリクライニングしてもよいかを問い合わせつつ、同意する場合には第1汎用スイッチ112を操作することを促す同意促進画像を表示部110に表示させる(図示する事象EV3)。乗員は、事象EV2、又は事象EV3によって出力された音声と、表示された同意促進画像とのうち、一方又は双方を確認し、「運転席をリクライニング」することに同意する場合には、第1汎用スイッチ112を操作する。
第1汎用スイッチ112は、時刻t3において運転席をリクライニングしてもよいかの問合せが開始されてから、所定の時間(例えば、数十[秒]〜数[分])内は、入力を受け付ける受付状態となる(図示する事象EV4)。車載機器制御部134は、所定の時間内である時刻t4に、第1汎用スイッチ112によって同意を示す入力が受け付けられたため、運転席のリクライニング機構に対して、運転席のリクライニングに係る制御を指示する。
[処理フロー]
次に、第1実施形態に係るエージェントシステム1の処理の流れについてフローチャートを用いて説明する。なお、以下では、エージェント装置100の処理と、サーバ装置200との処理を分けて説明するものとする。また、以下に示す処理の流れは、所定のタイミングで繰り返し実行されてよい。所定のタイミングとは、例えば、音声データからエージェント装置を起動させる特定ワード(例えば、ウェイクアップワード)が抽出されたタイミングや、車両Mに搭載される各種スイッチのうち、エージェント装置100を起動させるスイッチの選択を受け付けたタイミング等である。
図9は、第1実施形態に係るエージェント装置100の一連の処理の流れを示すフローチャートである。まず、エージェント側制御部120の取得部122は、ウェイクアップワードが認識された後、又は、エージェント装置を起動させるスイッチが押された後に、マイク106によって乗員の音声データが収集されたか否かを判定する(ステップS100)。取得部122は、乗員の音声データが収集されるまでの間、待機する。次に、通信制御部128は、エージェント側通信部102を介して、音声データをサーバ装置200に送信する(ステップS102)。次に、通信制御部128は、サーバ装置200からエージェントデータを受信する(ステップS304)。
特定部130は、受信したエージェントデータに制御内容が含まれる場合、車載機器情報152に基づいて、制御が行われる車載機器VEを特定する(ステップS306)。判定部132は、特定部130によって特定された車載機器VEが、影響車載機器EVEであるか否かを判定する(ステップS308)。車載機器制御部134は、判定部132によって車載機器制御の車載機器VEが影響車載機器EVEではない(つまり、非影響車載機器NVE)であると判定された場合、エージェントデータに示される制御(例えば、音声制御や、表示制御)を非影響車載機器NVE(スピーカ108や表示部110)に実行させる(ステップS310)。
出力制御部126は、判定部132によって車載機器VEが影響車載機器EVEであると判定された場合、音声合成部124によって生成された乗員の同意を求める音声データをスピーカ108に出力させたり、同意促進画像を表示部110に表示させたりすることにより、制御の実行について乗員に同意を求める(ステップS312)。車載機器制御部134は、第1汎用スイッチ112によって同意を示す入力が受け付けられたか否かを判定する(ステップS314)。車載機器制御部134は、同意が受け付けられた場合、エージェントデータに示される車載機器制御を影響車載機器EVEに実行する(ステップS110)。車載機器制御部134は、所定の時間内に、第1汎用スイッチ112によって同意を示す入力が受け付けられなかった場合、エージェントデータに示される車載機器制御を実行せず、処理を終了する(ステップS316)。
図10は、第1実施形態に係るサーバ装置200の一例の処理の流れを示すフローチャートである。まず、サーバ側通信部202は、エージェント装置100から音声データを取得する(ステップS200)。次に、発話区間抽出部214は、音声データに含まれる発話区間を抽出する(ステップS202)。次に、音声認識部216は、抽出された発話区間における音声データから、発話内容を認識する。具体的には、音声認識部216は、音声データをテキストデータにして、最終的にはテキストデータに含まれる文言を認識する(ステップS204)。エージェントデータ生成部222は、発話内容全体の意味に基づくエージェントデータを生成する(ステップS206)。次に、サーバ側制御部210の通信制御部224は、サーバ側通信部202を介して、エージェントデータをエージェント装置100に送信する(ステップS208)。これにより、本フローチャートの処理は、終了する。
[同意を促す音声制御、及び表示制御の他の例]
なお、上述では、車載機器制御が影響車載機器EVEに対するものである場合、音声合成部124が、車載機器制御を実行してもよいかを問い合わせつつ、乗員の同意を促す音声を生成する場合について説明したが、これに限られない。例えば、回答情報234は、影響車載機器EVEに係る制御内容として、予め、車載機器制御を実行してもよいかを問い合わせつつ、乗員の同意を促す音声制御が対応付けられた情報であってもよい。同様に、回答情報234は、影響車載機器EVEに係る制御内容として、予め、同意促進画像を表示する表示制御が対応付けられた情報であってもよい。この場合、音声合成部124や、出力制御部126は、エージェントデータに示される音声制御や表示制御を実行する。
以上説明した第1実施形態のエージェントシステム1によれば、車載機器VEの制御に係るユーザ(乗員)の発話内容を誤認識した場合、或いは車載機器VEの制御に係るユーザの発話が誤りである場合であっても、誤認識に応じて車載機器VEが動作することを抑制し、車両Mの安全性を保ちつつ、乗員に車載機器VEの動作を簡便に指示させることができる。
<第2実施形態>
上述した第1実施形態では、車両Mに搭載されたエージェント装置100と、サーバ装置200とが互いに異なる装置であるものとして説明したがこれに限定されるものではない。例えば、エージェント機能に係るサーバ装置200の構成要素は、エージェント装置100の構成要素に含まれてもよい。この場合、サーバ装置200は、エージェント装置100のエージェント側制御部120によって仮想的に実現される仮想マシンとして機能させてもよい。以下、サーバ装置200の構成要素を含むエージェント装置100Aを第2実施形態として説明する。この場合、エージェント装置100Aが「エージェントシステム」の一例である。なお、第2実施形態において、上述した第1実施形態と同様の構成要素については、同様の符号を付するものとし、ここでの具体的な説明は省略する。
図11は、第2実施形態に係るエージェント装置100Aの一例を示す図である。エージェント装置100Aは、例えば、エージェント側通信部102と、マイク106と、スピーカ108と、表示部110と、第1汎用スイッチ112と、第2汎用スイッチ113と、エージェント側制御部120Aと、エージェント側記憶部150Aとを備える。エージェント側制御部120Aは、例えば、取得部122と、音声合成部124と、出力制御部126と、通信制御部128と、判定部132と、車載機器制御部134と、発話区間抽出部214Aと、音声認識部216Aと、エージェントデータ生成部222Aとを備える。
また、エージェント側記憶部150Aは、例えば、プロセッサによって参照されるプログラムのほかに、車載機器情報152、回答情報234A等が格納される。回答情報234Aは、サーバ装置200から取得した最新の情報によって更新されてもよい。
[処理フロー]
図12は、第2実施形態に係るエージェント装置100Aの一連の処理の流れを示すフローチャートである。また、以下に示す処理の流れは、第1実施形態における処理の流れと同様に所定のタイミングで繰り返し実行されてよい。まず、エージェント側制御部120の取得部122は、マイク106によって乗員の音声データが収集されたか否かを判定する(ステップS400)。取得部122は、乗員の音声データが収集されるまでの間、待機する。次に、発話区間抽出部214は、音声データに含まれる発話区間を抽出する(ステップS402)。次に、音声認識部216は、抽出された発話区間における音声データから、発話内容を認識する。具体的には、音声データをテキストデータにして、最終的にはテキストデータに含まれる文言を認識する(ステップS404)。エージェントデータ生成部222は、発話内容全体の意味に基づくエージェントデータを生成する(ステップS406)。
特定部130は、受信したエージェントデータに制御内容が含まれる場合、車載機器情報152に基づいて、制御が行われる車載機器VEを特定する(ステップS408)。判定部132は、特定部130によって特定された車載機器VEが、影響車載機器EVEであるか否かを判定する(ステップS410)。車載機器制御の車載機器VEが影響車載機器EVEではない(つまり、非影響車載機器NVEである)と判定部132により判定された場合、車載機器制御部134は、エージェントデータに示される制御(例えば、音声制御や、表示制御)を非影響車載機器NVE(スピーカ108や表示部110等)に実行させる(ステップS412)。
出力制御部126は、判定部132によって車載機器制御の車載機器VEが影響車載機器EVEであると判定された場合、音声合成部124によって生成された影響車載機器EVEに対する制御を実行することについて同意を求める音声データをスピーカ108に出力させ、同意促進画像を表示部110に表示させることにより、制御の実行について乗員に同意を求める(ステップS414)。車載機器制御部134は、第1汎用スイッチ112によって同意を示す入力が受け付けられたか否かを判定する(ステップS416)。車載機器制御部134は、同意が受け付けられた場合、エージェントデータに示される車載機器制御を影響車載機器EVEに実行させる(ステップS412)。車載機器制御部134は、所定の時間内に、第1汎用スイッチ112によって同意を示す入力が受け付けられなかった場合、エージェントデータに示される車載機器制御を実行せず、処理を終了する(ステップS418)。
以上説明した第2実施形態のエージェント装置100Aによれば、第1実施形態と同様の効果を奏する他、乗員からの音声を取得するたびに、ネットワークNWを介してサーバ装置200との通信を行う必要がないため、より迅速に発話内容を認識することができる。また、車両Mがサーバ装置200と通信できない状態であっても、エージェントデータを生成して、乗員に情報を提供することができる。
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
例えば、上述した実施形態では、一例として、車両が四輪自動車であるものとして説明したがこれに限定されるものではない。例えば、車両は、二輪自動車や運送トラック等の他の車両であってもよい。また、車両は、レンタカーやシェアカー等の車両であってもよい。この場合、例えば、複数のレンタカーや、レンタル二輪車、複数のシェアカー等にエージェント装置100が配設されていればよい。この場合、エージェント装置100は、乗員と対話を行うことで、エージェント装置100を搭載する車両に初めて乗員が乗車する場合や、操作が不案内な乗員でも、音声により簡便に操作を実施させることができる。また、エージェント装置100は、運転者以外の他の乗員でも許容されている操作について、他の乗員に操作を任せることができるので、運転者の負荷を軽減することができる。
1…エージェントシステム、100、100A…エージェント装置、102…エージェント側通信部、106、106A、106B、106C、106D、106E…マイク、108、108A、108B、108C、108D、108E…スピーカ、110、110A、110B、110C…表示部、112…汎用スイッチ、120、120A…エージェント側制御部、122…取得部、124…音声合成部、126…出力制御部、128…通信制御部、130…特定部、132…判定部、134…車載機器制御部、150、150A…エージェント側記憶部、152…車載機器情報、200…サーバ装置、202…サーバ側通信部、210…サーバ側制御部、212…取得部、214、214A…発話区間抽出部、216、216A…音声認識部、222、222A…エージェントデータ生成部、224…通信制御部、230…サーバ側記憶部、234、234A…回答情報、VE…車載機器、NVE…非影響車載機器、EVE…影響車載機器、M…車両

Claims (10)

  1. 車両に搭乗する乗員の発話内容を含む音声を取得する取得部と、
    前記車両に搭載され、スピーカおよび表示部を含む車載機器の動作を制御する車載機器制御部と、
    前記取得部により取得された前記車両の乗員が発話内容を含む音声を認識する音声認識部と、
    前記音声認識部により認識された前記乗員の音声によって動作が指示される前記車載機器を特定する特定部と、
    特定された前記車載機器が、所定のグループに属する車載機器であるか否かを判定する判定部と、
    汎用スイッチと、を備え、
    前記車載機器制御部は、前記指示を受ける車載機器が前記所定のグループに属する車載機器であると前記判定部により判定された場合、前記スピーカ、又は、前記表示部により、前記所定のグループに属する車載機器が前記指示に対応する動作を実行してもよいかを問い合わせる音声、及び、前記所定のグループに属する車載機器における前記動作を実行についての同意を促す同意促進画像のうち少なくとも一方を出力させつつ、前記指示を実行することに前記乗員が同意したことを示す入力が前記汎用スイッチにより受け付けられた場合、前記指示を受ける前記車載機器の動作を制御する、
    車載機器制御システム。
  2. 前記所定のグループに属する車載機器は、前記車両の挙動に影響する車載機器である、
    請求項1に記載の車載機器制御システム。
  3. 前記所定のグループに属する車載機器は、前記車両における運転者にのみ許容されている操作に対応する車載機器である、
    請求項1に記載の車載機器制御システム。
  4. 前記汎用スイッチは、前記同意したことを示す入力を含む、音声指示に関する所定の入力を受け付ける場面以外では、他の用途に使用され得るスイッチである、
    請求項1に記載の車載機器制御システム。
  5. 前記音声認識部は、音声の受付を開始することを示す入力が前記汎用スイッチにより受け付けられた場合、前記取得部であるマイクにより収集された前記乗員の発話内容を含む音声の認識を開始する、
    請求項4に記載の車載機器制御システム。
  6. 前記汎用スイッチは、ステアリングホイールに設けられている、
    請求項1又は請求項5に記載の車載機器制御システム。
  7. 前記車載機器制御システムは、更に、
    前記指示を受ける前記車載機器が、前記所定のグループに属する車載機器以外のものであると判定された際、前記車載機器制御部に、前記所定のグループ以外のグループに属する車載機器の動作を制御させるスイッチを備える、
    請求項1から請求項6のうちいずれか一項に記載の車載機器制御システム。
  8. 車両に搭乗する乗員の発話内容を含む音声を取得する取得部と、
    前記車両に搭載され、スピーカおよび表示部を含む車載機器の動作を制御する車載機器制御部と、
    前記取得部により取得された前記乗員の発話内容を含む音声を認識する音声認識部と、
    前記音声認識部により認識された前記乗員の音声によって動作が指示される前記車載機器を特定する特定部と、
    特定された前記車載機器が、所定のグループに属する車載機器であるか否かを判定する判定部と、
    汎用スイッチと、を備え、
    前記車載機器制御部は、前記指示を受ける車載機器が前記所定のグループに属する車載機器であると前記判定部により判定された場合、前記スピーカ、又は、前記表示部により、所定のグループに属する車載機器が前記指示に対応する動作を実行してもよいかを問い合わせる音声、及び、前記所定のグループに属する車載機器における前記動作を実行についての同意を促す同意促進画像のうち少なくとも一方を出力させつつ、前記指示を実行することに前記乗員が同意したことを示す入力が前記汎用スイッチにより受け付けられた場合、前記指示を受ける前記車載機器の動作を制御する、
    車載機器制御装置。
  9. 車両の乗員の発話内容を含む音声を取得する取得部と、汎用スイッチとを備える車載機器制御システムにおける単一または複数のコンピュータが、
    前記乗員の発話内容を含む音声を認識するステップと、
    認識された前記乗員の音声によって動作が指示される車載機器を特定するステップと、
    特定された前記車載機器が、所定のグループに属する車載機器であるか否かを判定するステップと、
    前記指示を受ける前記車載機器が前記所定のグループに属する車載機器であると判定された場合、前記所定のグループに属する車載機器が前記指示に対応する動作を実行してもよいかを問い合わせる音声、及び、所定のグループに属する車載機器における前記動作を実行についての同意を促す同意促進画像のうち少なくとも一方を、スピーカまたは表示部により出力させるステップと、
    その際に、前記指示を実行することに前記乗員が同意したことを示す入力が前記汎用スイッチによって受け付けられた場合、前記指示を受けた前記車載機器の動作を制御するステップとを有する、
    車載機器制御方法。
  10. 車両の乗員の発話内容を含む音声を取得する取得部と、汎用スイッチとを備える車載機器制御システムにおける単一または複数のコンピュータにインストールされ、
    前記乗員の発話内容を含む音声を認識する処理と、
    認識された前記乗員の音声により動作が指示される車載機器を特定する処理と、
    特定された前記車載機器が、所定のグループに属する車載機器であるか否かを判定する処理と、
    前記指示を受ける前記車載機器が、前記所定のグループに属する車載機器であると判定された場合、前記所定のグループに属する車載機器が前記指示に対応する動作を実行してもよいかを問い合わせる音声、及び、前記所定のグループに属する車載機器における前記動作を実行についての同意を促す同意促進画像のうち少なくとも一方を、スピーカまたは表示部により出力させる処理と、その際に、前記指示を実行することに前記乗員が同意したことを示す入力が前記汎用スイッチによって受け付けられた場合、前記指示を受けた前記車載機器の動作を制御する処理と、
    を含むコンピュータに実行させるプログラム。
JP2019051674A 2019-03-19 2019-03-19 車載機器制御システム、車載機器制御装置、車載機器制御方法、及びプログラム Active JP7261626B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019051674A JP7261626B2 (ja) 2019-03-19 2019-03-19 車載機器制御システム、車載機器制御装置、車載機器制御方法、及びプログラム
CN202010189106.6A CN111724798B (zh) 2019-03-19 2020-03-17 车载设备控制系统、车载设备控制装置、车载设备控制方法及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019051674A JP7261626B2 (ja) 2019-03-19 2019-03-19 車載機器制御システム、車載機器制御装置、車載機器制御方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2020154098A true JP2020154098A (ja) 2020-09-24
JP7261626B2 JP7261626B2 (ja) 2023-04-20

Family

ID=72558861

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019051674A Active JP7261626B2 (ja) 2019-03-19 2019-03-19 車載機器制御システム、車載機器制御装置、車載機器制御方法、及びプログラム

Country Status (2)

Country Link
JP (1) JP7261626B2 (ja)
CN (1) CN111724798B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114954168A (zh) * 2021-08-05 2022-08-30 长城汽车股份有限公司 座椅通风和加热的方法、装置、存储介质及车辆
WO2024053182A1 (ja) * 2022-09-05 2024-03-14 日産自動車株式会社 音声認識方法及び音声認識装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000163091A (ja) * 1998-11-27 2000-06-16 Denso Corp 音声認識装置
JP2002012100A (ja) * 2000-06-29 2002-01-15 Jatco Transtechnology Ltd 車両制御装置
JP2016161754A (ja) * 2015-03-02 2016-09-05 クラリオン株式会社 車載装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003345389A (ja) * 2002-05-22 2003-12-03 Nissan Motor Co Ltd 音声認識装置
JP2005153671A (ja) * 2003-11-25 2005-06-16 Nissan Motor Co Ltd 車両用表示操作装置
JP2007127993A (ja) * 2005-11-07 2007-05-24 Matsushita Electric Ind Co Ltd 表示装置およびナビゲーション装置
CN109298830A (zh) * 2018-11-05 2019-02-01 广州小鹏汽车科技有限公司 一种车载中控大屏触控方法、装置及计算机可读存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000163091A (ja) * 1998-11-27 2000-06-16 Denso Corp 音声認識装置
JP2002012100A (ja) * 2000-06-29 2002-01-15 Jatco Transtechnology Ltd 車両制御装置
JP2016161754A (ja) * 2015-03-02 2016-09-05 クラリオン株式会社 車載装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114954168A (zh) * 2021-08-05 2022-08-30 长城汽车股份有限公司 座椅通风和加热的方法、装置、存储介质及车辆
WO2024053182A1 (ja) * 2022-09-05 2024-03-14 日産自動車株式会社 音声認識方法及び音声認識装置

Also Published As

Publication number Publication date
CN111724798B (zh) 2024-05-07
JP7261626B2 (ja) 2023-04-20
CN111724798A (zh) 2020-09-29

Similar Documents

Publication Publication Date Title
US10170111B2 (en) Adaptive infotainment system based on vehicle surrounding and driver mood and/or behavior
CN106663422B (zh) 言语识别系统及其言语识别方法
JP2009020423A (ja) 音声認識装置および音声認識方法
CN111724798B (zh) 车载设备控制系统、车载设备控制装置、车载设备控制方法及存储介质
CN112805182A (zh) 智能体装置、智能体控制方法及程序
CN111007968A (zh) 智能体装置、智能体提示方法及存储介质
US11938820B2 (en) Voice control of vehicle systems
JP2020144285A (ja) エージェントシステム、情報処理装置、移動体搭載機器制御方法、及びプログラム
JP2020060861A (ja) エージェントシステム、エージェント方法、およびプログラム
US11518398B2 (en) Agent system, agent server, method of controlling agent server, and storage medium
CN112908320B (zh) 智能体装置、智能体方法及存储介质
JP7239359B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP7288781B2 (ja) 情報提供装置、情報提供方法、およびプログラム
JP7340943B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP7252029B2 (ja) サーバ装置、情報提供方法、およびプログラム
JP7280066B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP7254689B2 (ja) エージェントシステム、エージェント方法、及びプログラム
JP7368090B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020060623A (ja) エージェントシステム、エージェント方法、およびプログラム
WO2023153314A1 (ja) 車内機器制御装置、車内機器制御方法
KR20200000621A (ko) 대화 시스템, 이를 포함하는 차량 및 대화 처리 방법
CN111559317B (zh) 智能体装置、智能体装置的控制方法及存储介质
WO2023144574A1 (ja) 音声認識方法及び音声認識装置
KR20230039799A (ko) 차량 및 그 제어 방법
JP2021163236A (ja) 情報提供装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211126

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221019

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230328

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230410

R150 Certificate of patent or registration of utility model

Ref document number: 7261626

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150