WO2017081960A1

WO2017081960A1 - 音声認識制御システム

Info

Publication number: WO2017081960A1
Application number: PCT/JP2016/079607
Authority: WO
Inventors: 真吾入方; 宗義難波
Original assignee: 三菱自動車工業株式会社
Priority date: 2015-11-09
Filing date: 2016-10-05
Publication date: 2017-05-18
Also published as: JP2017090611A

Abstract

音声に基づき、発話者の発話位置及び発話方向を特定する発話状態特定部（３）を設ける。また、少なくとも発話位置及び発話方向に基づき、制御対象となる車載装置を認識する制御対象認識部（４）を設ける。さらに、発話位置と発話方向との組み合わせに基づき、制御対象を制御する制御部（６）を設ける。

Description

音声認識制御システム

　本発明は、車両乗員の音声で車載装置を制御する音声認識制御システムに関する。

　従来、音声コマンドを用いて車載装置を制御できるようにした音声認識制御システムが開発されている。すなわち、車両の乗員の音声を入力信号として、各種車載装置（カーナビゲーション装置，エアコン装置，カーオーディオ装置など）の作動状態を制御するものである。一般に、発話された音声は音響モデル（音の波形サンプルと音素との対応関係が規定されたモデル）に基づいて解析され、言語モデル（音素の連なり方が規定されたモデル）に基づいてその意味内容が認識される。このような音声認識技術を利用することで、車載装置をハンズフリーで操作することが可能となる。

　一方、車室内には運転手（ドライバー）以外の同乗者が存在することがあるため、発話の主体を区別して認識することが望ましい。そこで、車室内に複数のマイクを設置し、各々のマイクで検出された音声信号の大小や遅れに基づいて、発話者が運転手であるか否かを判断する技術が提案されている。また、音声によるナビゲーション装置の操作入力を運転手のみに許可し、運転手以外はナビゲーション装置を操作できないようにする技術も知られている（特許文献１参照）。このように、発話主体に応じた制御を実施することで、運転手以外の同乗者やカーオーディオ装置の音声による車載装置の誤作動を防止することができる。

特開2004-354930号公報

　しかしながら、単に発話主体を区別して認識しただけでは、同乗者間の会話と音声コマンドとを識別することが難しく、利便性を向上させにくいという課題がある。例えば、運転手が助手席の同乗者に対して「エアコンを作動させるか？」と尋ねたときに、音声認識制御システムがその音声をエアコン装置の作動命令であると誤認識するおそれがある。また、運転手以外の同乗者が存在しない場合であっても、運転手が車外に向けて話しかけたときの音声を誤認識する可能性もある。このように、運転手による発話を認識したとしても、音声コマンドの誤認識や各種制御装置の誤作動が発生しうる。

　本件の目的の一つは、上記のような課題に鑑みて創案されたものであり、音声コマンドの誤認識や各種制御装置の誤作動を防止して利便性を高めた音声認識制御システムを提供することである。なお、この目的に限らず、後述する「発明を実施するための形態」に示す各構成から導き出される作用効果であって、従来の技術では得られない作用効果を奏することも、本件の他の目的として位置付けることができる。

　（１）ここで開示する音声認識制御システムは、車両乗員の音声を入力信号として車載装置を制御する音声認識制御システムである。本システムは、少なくとも前記音声に基づき、発話者の発話位置及び発話方向を特定する発話状態特定部と、少なくとも前記発話位置及び前記発話方向に基づき、制御対象となる前記車載装置を認識する制御対象認識部とを備える。また、前記発話位置と前記発話方向との組み合わせに基づき、前記制御対象を制御する制御部を備える。

　前記発話状態特定部は、前記発話位置が運転席であるか否かを特定することが好ましい。また、前記発話状態特定部は、前記発話方向が前記制御対象の方向であるか否かを特定することが好ましい。
　（２）車速を検出する車速検出部をさらに備えることが好ましい。この場合、前記制御部が、前記発話位置と前記発話方向と前記車速との組み合わせに基づき、前記制御対象を制御することが好ましい。

　（３）前記制御部は、前記車速が高いほど、前記発話方向として特定される範囲を広げることが好ましい。
　例えば、車両停止中には、前記発話方向と前記制御対象の方向とが一致しなければ、前記制御対象を制御しないこととする。これに対し、車両走行中には、前記発話方向が前記制御対象の方向から多少ずれていたとしても、前記制御対象を制御することとする。このように、前記制御対象を制御するために許容される前記発話方向と前記制御対象の方向とのずれ量を、前記車速が高いほど大きくすることが好ましい。

　（４）前記制御対象認識部は、運転手が操作可能な第一車載装置と、前記運転手以外の乗員が操作可能な第二車載装置とのうち、前記制御対象がいずれの種類に属するものであるかを認識することが好ましい。この場合、前記制御部は、前記発話位置，前記発話方向，前記車速の組み合わせと前記制御対象の種類とが対応する場合に、前記制御対象を制御することが好ましい。

　（５）前記制御部は、前記発話位置が運転席である場合に、前記第一車載装置の制御を実施可能とし、前記第二車載装置の制御を実施不能とすることが好ましい。
　（６）前記制御部は、前記発話位置が運転席以外である場合に、前記第二車載装置の制御を実施可能とし、前記第一車載装置の制御を実施不能とすることが好ましい。

　（７）前記制御部は、前記発話方向が所定の方向である場合に、前記制御対象を制御することが好ましい。
　（８）前記発話状態特定部が、前記音声と車載カメラで撮影された車室内の画像とを併用して、前記発話位置及び前記発話方向を特定することが好ましい。

　発話者の発話位置と発話方向とを特定した上で制御対象を制御することで、車載装置に対する作動命令ではない会話による誤認識や制御対象の誤作動を抑制することができる。

音声認識制御システムが適用された車両の模式的な上面図である。音声認識制御システムの構成を示す模式図である。発話位置，発話方向，車速の組み合わせと制御対象の種類との対応関係を示す表である。車速と発話範囲（発話方向のずれ）との関係を示すグラフである。（Ａ）～（Ｃ）は、運転手の音声が認識される発話範囲を示す図である。音声認識制御システムの制御内容を説明するためのフローチャートである。

　図面を参照して、実施形態としての音声認識制御システムについて説明する。なお、以下に示す実施形態はあくまでも例示に過ぎず、以下の実施形態で明示しない種々の変形や技術の適用を排除する意図はない。本実施形態の各構成は、それらの趣旨を逸脱しない範囲で種々変形して実施することができる。また、必要に応じて取捨選択することができ、あるいは適宜組み合わせることができる。

［１．装置構成］
　本実施形態の音声認識制御システムは、図１に示す車両１０に適用される。車両１０の車室内には運転席１４，助手席１５が設けられ、車室前方側にはインパネ（インストルメントパネル，ダッシュボード）が配置される。インパネの車室側に面した部分のうち、運転席１４の前方にはステアリング装置や計器類が配置され、助手席１５の前方にはグローブボックスが配置される。また、インパネの車幅方向中央には、カーナビ機能やＡＶ機能などのユーザーインターフェースを集約して提供するマルチコミュニケーション型のディスプレイ装置１６が搭載される。ディスプレイ装置１６の位置は、運転席１４に座る運転手の視点では左斜め前方であり、助手席１５に座る乗員の視点では右斜め前方である。

　ディスプレイ装置１６は、タッチパネルを備えた汎用の映像表示装置（表示画面）とCPU（Central Processing Unit），ROM（Read Only Memory），RAM（Random Access Memory）などを含む電子制御装置（コンピューター）とを備えた電子デバイスである。ディスプレイ装置１６は、ナビゲーション装置１１，エアコン装置１２，カーオーディオ装置１３，マルチメディアシステムなどの車載装置に接続されて、各種車載装置の入出力装置として機能しうる。例えば、ナビゲーション装置１１から提供される目的地までの経路情報や地図情報，渋滞情報などは、このディスプレイ装置１６の表示画面に表示可能とされる。また、このディスプレイ装置１６の表示画面には、車載の地上デジタル放送チューナーで受信した番組や、DVD映像コンテンツ，リアビューカメラで撮影された映像，エアコン装置１２やカーオーディオ装置１３の操作用インターフェースといった、多様な視覚情報が再生，表示可能である。

　また、車両１０には、乗員の音声を入力信号として各種車載装置を制御する音声認識制御装置１が搭載される。音声認識制御装置１は、CPU，MPU（Micro Processing Unit）などのプロセッサとROM，RAM，不揮発メモリなどを集積した電子デバイス（ECU，電子制御装置）である。ここでいうプロセッサとは、例えば制御ユニット（制御回路）や演算ユニット（演算回路），キャッシュメモリ（レジスタ）などを内蔵する処理装置（プロセッサ）である。また、ROM，RAM及び不揮発メモリは、プログラムや作業中のデータが格納されるメモリ装置である。音声認識制御装置１で実施される制御の内容は、ファームウェアやアプリケーションプログラムとしてROM，RAM，不揮発メモリ，リムーバブルメディア内に記録される。また、プログラムの実行時には、プログラムの内容がRAM内のメモリ空間内に展開され、プロセッサによって実行される。

　図２に示すように、音声認識制御装置１の入力装置としては、マイクアレイ２１，室内カメラ２２，車速センサ２３などが挙げられる。マイクアレイ２１は、複数のマイクロフォンを所定の配列に並べた音声入力装置であり、室内カメラ２２は車室内全体を撮影可能な広角ビデオカメラである。車速センサ２３は、車輪の回転速度に応じたパルス信号を出力するセンサである。一方、音声認識制御装置１の出力装置としては、ナビゲーション装置１１，エアコン装置１２，カーオーディオ装置１３，ディスプレイ装置１６，ウィンカー１７，ワイパー１８などが挙げられる。音声認識制御装置１は、マイクアレイ２１から入力された音声と室内カメラ２２で撮影された画像と車速センサ２３で検出されたパルス情報とに基づいて、各種車載装置を制御する。

［２．制御構成］
　音声認識制御装置１は、単に乗員の音声だけでなく、その音声を発声した人物の発話方向や車速の状態も考慮して、音声内容を認識するとともに車載装置を制御する機能を持つ。例えば、マイクアレイ２１から何らかの音声が入力されると、まずその音声が発せられた位置（発話位置）が特定されるとともに、その音声が発せられた方向（発話方向）が特定される。そして、発話方向が乗員毎に設定された所定の発話範囲内にあれば、発話内容が認識される。このとき、所定の発話範囲は、車速に応じて設定される。また、発話内容の認識結果から、制御対象となる車載装置が認識される。その後、発話位置，発話方向，車速の組み合わせと制御対象の種類とが対応する場合に、その制御対象が実際に制御される。

　上記の制御を実施するための要素として、音声認識制御装置１には、車速検出部２，発話状態特定部３，制御対象認識部４，データベース５，制御部６が設けられる。これらは、音声認識制御装置１で実行されるプログラムの一部の機能を示すものであり、ソフトウェアで実現されるものとする。ただし、各機能の一部又は全部をハードウェア（電子制御回路）で実現してもよく、あるいはソフトウェアとハードウェアとを併用して実現してもよい。
　車速検出部２は、車速センサ２３が出力するパルス信号に基づき、車速を取得（検出，算出）するものである。ここで取得された車速の情報は、発話状態特定部３，制御対象認識部４，制御部６に伝達される。

　発話状態特定部３は、少なくともマイクアレイ２１から入力された音声に基づき、発話者の発話位置及び発話方向を特定するものである。発話位置は、マイクアレイ２１で検知された複数の音声信号の大きさや遅れに基づいて特定可能である。あるいは、室内カメラ２２で撮影された画像を解析し、画像中に存在する人物の口唇の動きと音声が検出されたタイミングとを比較することでも、発話位置を特定可能である。また、発話方向についても同様であり、マイクアレイ２１で検知された複数の音声信号にビームフォーミング処理を施すことで特定可能である。あるいは、室内カメラ２２で撮影された画像中における発話者を特定した上で、発話者の顔の向きを検出することでも特定可能である。ここで特定された発話位置及び発話方向の情報は、制御対象認識部４に伝達される。

　制御対象認識部４は、発話状態特定部３で特定された発話位置及び発話方向の情報に基づいて、音声内容を認識するものである。ここでは、発話者が所定の発話範囲内に向かって発話している場合に、その発話についての音声認識が実施される。ここでいう所定の発話範囲とは、その発話が音声認識制御システムに対する音声コマンドであると確認できる発話の方向を意味する。本実施形態では、それぞれの乗員からディスプレイ装置１６へと向かう方向を含む範囲が、それぞれの乗員の発話範囲として設定される。

　例えば、図５（Ａ）に示すように、運転席１４に着座する運転手から見て、ディスプレイ装置１６の位置が-30度の方向（車両１０の前方を基準として左側に+30度の方向）にあるものとする。この場合、運転手の発話範囲は、-30度の方向を含む範囲（例えば-40～-20度の範囲）に設定される。反対に、助手席１５に着座する乗員から見ると、ディスプレイ装置１６の位置は右側に+30度の方向となるため、この乗員の発話範囲は、+30度の方向を含む範囲（例えば+20～+40度の範囲）に設定される。

　また、発話範囲は、車速が高いほど拡張されるようになっている。この理由は、車両１０の停止中と比較して走行中には、運転手及び乗員が車両前方に視線を向けた状態となりやすいからである。つまり、車両１０の停止中と比較して走行中の発話範囲を拡大することで、顔を車両前方に向けたまま音声コマンドを発することが許容されやすくなり、音声入力の利便性が向上する。本実施形態では、運転手の発話範囲が-40～(-30+A)度の範囲に設定されるとともに、助手席１５の乗員の発話範囲が(30-B)～40度の範囲に設定される。すなわち、車速が高いほど、発話範囲が車両１０の前方に向かって拡張される。また、図４に示すように、車速が高いほど値A，Bの値が増大する特性を持つように設定される。なお、値Aは値Bよりも常に大きい値に設定される。なぜならば、助手席１５の乗員は運転手とは異なり、視線を車両１０の前方に向けなくてもよい（すなわち、顔をディスプレイ装置１６に向けることを躊躇する必要がない）からである。

　制御対象認識部４は、発話方向が発話範囲内にある場合に、発話内容の認識を開始する。このとき、発話内容の文脈が解析され、制御対象となる車載装置の種類が推定されるとともに、制御対象に対する音声コマンドの内容が認識される。音声認識の具体的な手法は任意であり、公知の音声認識技術を採用することができる。例えば、音響モデルに基づいて音声に含まれる音素が解析された後に、言語モデルに基づいて音素の連なりからなる語や句が解析され、その意味内容が認識される。

　音声認識が完了すると、制御対象認識部４は、制御対象が第一車載装置であるか、それとも第二車載装置であるかを識別する。第一車載装置とは、運転手が操作可能な車載装置を意味し、例えば運転席１４のシートアジャスターやウィンカー１７，ワイパー１８などが含まれる。また、車両１０の停止中に限り、ナビゲーション装置１１，エアコン装置１２，カーオーディオ装置１３などの車載装置も第一車載装置に含まれる。これに対し、第二車載装置とは、運転手以外の乗員が操作可能な車載装置を意味し、例えば助手席１５のシートアジャスターがこれに含まれる。また、車両１０の走行中には、ナビゲーション装置１１，エアコン装置１２，カーオーディオ装置１３などの車載装置は第二車載装置に含まれる。このように、第一車載装置と第二車載装置との区分は、車両１０の走行状態（車速）に応じて変化しうる。ここでの識別結果は、制御部６に伝達される。

　データベース５は、音声認識に関する総合的な各種データが記録，保存されたストレージ装置である。ここには、発話位置とその位置における発話範囲との関係が記録，保存されるとともに、車両１０の走行状態（車速）と車載装置の種類との関係が記録，保存される。また、データベース５は、発話位置，発話方向，車速の組み合わせと車載装置の種類との対応関係を併せて記録，保存している。データベース５の内容を図３に例示する。この図には、発話位置が運転席１４であり、発話方向が-40～(-30+A)度の範囲内にあって、車両１０が走行中である場合には、ウィンカー１７やワイパー１８の制御が許容されることが示されている。また、ウィンカー１７，ワイパー１８は、少なくとも発話位置が運転席１４でなければ（発話者が運転手でなければ）制御が許容されないことが示されている。

　制御部６は、データベース５に記録，保存された関係を用いて制御の可否を判定するものである。ここでは、少なくとも発話位置と発話方向との組み合わせに基づいて、制御対象が制御される。本実施形態では、発話位置，発話方向，車速の組み合わせが、制御対象の種類と対応する場合に、実際に制御対象が制御される。一方、発話位置，発話方向，車速の組み合わせが、制御対象の種類と対応しない場合には、その制御対象が制御されることなく、音声コマンドがキャンセル（取り消し）される。

［３．フローチャート］
　図６は、音声認識制御装置１で実施される制御内容を説明するためのフローチャート例である。まず、マイクアレイ２１で検出された音声情報，室内カメラ２２で撮影された画像情報，車速センサ２３からのパルス情報が音声認識制御装置１に入力され（ステップＡ１）、音声が入力されたか否かが判定される（ステップＡ２）。ここで、何らかの音声が入力されていると、発話状態特定部３において、少なくともその音声情報に基づき、発話位置と発話方向とが特定される（ステップＡ３）。また、発話位置が運転席１４又は助手席１５であれば（ステップＡ４）、発話方向が所定の発話範囲内にあることを条件として、音声認識が実施される（ステップＡ５，Ａ６）。一方、発話位置が車両１０のドアやインパネ近傍である場合には、カーオーディオ装置１３の音声だったものと判断されて、音声認識が不実施とされる（ステップＡ７）。

　音声認識が実施されると、制御対象となる車載装置の種類が推定されるとともに、制御対象に対する音声コマンドの内容が認識される（ステップＡ８）。その後、発話位置，発話方向，車速の組み合わせが、制御対象の種類と対応するものであるか否かが判定される（ステップＡ９）。ここで、例えば図３に示すような対応関係がある場合には、その制御対象に対する正当な音声コマンドが入力されたものと判断され、制御部６によって制御対象が実際に制御される（ステップＡ１０）。一方、対応関係がない場合には、その音声コマンドがキャンセルされ、制御が不実施とされる（ステップＡ１１）。

［４．作用］
　図５（Ａ）に示すように、車両停止中に運転手がディスプレイ装置１６の方向に向かって発声すると、その発声内容が音声認識制御装置１に認識され、制御対象が制御される。また、運転手が助手席１５の同乗者と会話している場合には、図５（Ｂ）に示すように、発話方向が所定の発話範囲外となることから、音声認識が不実施とされる。これにより、音声コマンドの誤認識や各種制御装置の誤作動が防止される。また、この場合には音声の認識自体が実施されないことから、不必要に音声認識制御装置１が作動するようなことがなくなり、消費電力が削減される。

　一方、車両走行中には、車速に応じて値Aが増大し、所定の発話範囲が拡大される。これより、図５（Ｃ）に示すように、運転手は車両１０の前方を向いた姿勢で音声コマンドを入力することが可能となる。したがって、車両１０の運転操作に集中したままの状態で、ウィンカー１７やワイパー１８を声で操作することができるようになり、各種車載装置の利便性が向上する。

　また、図３に示すように、制御対象が実際に制御されるのは、発話位置，発話方向，車速の組み合わせと制御対象の種類とが対応する場合に限られる。これにより、運転手以外の乗員が誤ってウィンカー１７を作動させてしまうような事態が回避される。また、ナビゲーション装置１１，エアコン装置１２，カーオーディオ装置１３に対する音声コマンドの入力は、運転手であっても車両停止中に制限されるため、運転手の注意力低下が確実に防止される。

［５．効果］
　（１）上記の音声認識制御装置１では、図３に示すように、発話位置と発話方向との組み合わせに基づいて制御対象が実際に制御される。したがって、車載装置に対する作動命令ではない会話による音声コマンドの誤認識や適切でない制御対象の誤作動を抑制することができる。また、発話方向が所定の発話範囲外となる場合には、音声の認識自体が実施されないため、音声認識制御装置１の演算負荷や消費電力を削減することができ、電力の省エネ性能を高めることができる。

　（２）また、上記の音声認識制御装置１では、発話位置及び発話方向だけでなく、車速の情報を併用して制御対象が制御される。このように、車速を考慮することで、車両走行中の操作に制限をかけることができる。例えば、車両走行中は運転手によるナビゲーション装置１１の音声入力操作に制限をかける一方、運転手以外によるナビゲーション装置１１の音声入力操作を精度良く実施することができる。これにより、車載装置の誤作動を抑制しつつ、利便性を向上させることができる。

　（３）特に、上記の音声認識制御装置１では、図４に示すように、車速が高いほど所定の発話範囲が拡大されるようになっている。このような設定により、車両１０の前方から目を離すことなく、無理のない姿勢で運転手が音声入力操作を実施することができるようになり、車載装置の誤作動を抑制しながら利便性を高めることができる。
　（４）上記の音声認識制御装置１では、制御対象認識部４において、運転手が操作可能な第一車載装置と、運転手以外が操作可能な第二車載装置とが識別される。このように、制御対象とその制御対象を操作可能な乗員の役割との関係をあらかじめ規定しておくことで、適切でない制御対象の誤作動を効果的に防止できる。

　（５）図３に示すように、運転中の運転手以外による操作が好ましいナビゲーション装置１１やエアコン装置１２などは、運転手以外の乗員の音声で作動するようにすることで、運転手の運転操作に対する集中力を高めることができ、車両１０の快適性能を向上させることができる。また、運転手は走行中にこれらの装置を操作できなくなるため、車両１０の安全性能を向上させることができる。
　（６）一方、車両１０を実際に運転している運転手による操作が好ましいウィンカー１７やワイパー１８などは、運転手の音声で作動させることができ、運転操作の利便性を向上させることができる。また、運転手以外はこれらの装置を作動させることができないため、誤作動を効果的に防止することができる。

　（７）上記の音声認識制御装置１では、ディスプレイ装置１６へと向かう方向（所定の方向）を含むように所定の発話範囲が設定されている。これにより、同乗者への会話と音声コマンドとを明確に区別することが可能となり、不必要な音声認識の動作を防止することができる。
　（８）また、マイクアレイ２１で取得された音声情報だけでなく、室内カメラ２２で撮影された画像情報を併用することで、発話位置や発話対象（発話方向）の特定精度を向上させることができる。

［６．変形例］
　上述の実施形態では、図３に示すように、一つの発話位置に対して一つの発話方向が規定されたものを例示したが、発話位置と発話方向との対応関係はこれに限定されない。例えば、ワイパー１８に対する音声コマンドの発話方向は、ワイパー１８が設けられている前方に向かう方向としてもよい。また、ナビゲーション装置１１，エアコン装置１２，カーオーディオ装置１３などについても同様であり、例えばエアコン装置１２への発話コマンドは、送風口に向かって発話した場合にのみ有効となるような設定にしてもよい。少なくとも発話位置，発話方向，制御対象の組み合わせに基づいてその制御対象を制御することで、上述の実施形態と同様の効果を奏するものとなる。

　また、上述の実施形態では、音声の認識から制御対象の制御までに至るすべての過程が音声認識制御装置１で統括管理されているが、音声認識制御装置１の機能の一部又は全部を車両１０の外部に移設することも考えられる。例えば、音声認識制御装置１をインターネット，携帯電話機の無線通信網，その他のデジタル無線通信網などのネットワークに接続可能とし、ネットワーク上のサーバに音声認識制御装置１の機能の一部又は全部を実装してもよい。これにより、データベース５の管理や更新が容易となり、音声認識精度やジェスチャ認識精度を向上させることができる。

１　音声認識制御装置
２　車速検出部
３　発話状態特定部
４　制御対象認識部
５　データベース
６　制御部
１０　車両
１１　ナビゲーション装置
１２　エアコン装置
１３　カーオーディオ装置
１４　運転席
１５　助手席
１６　ディスプレイ装置
１７　ウィンカー
１８　ワイパー
２１　マイクアレイ
２２　室内カメラ
２３　車速センサ

Claims

　車両乗員の音声を入力信号として車載装置を制御する音声認識制御システムにおいて、
　少なくとも前記音声に基づき、発話者の発話位置及び発話方向を特定する発話状態特定部と、
　少なくとも前記発話位置及び前記発話方向に基づき、制御対象となる前記車載装置を認識する制御対象認識部と、
　前記発話位置と前記発話方向との組み合わせに基づき、前記制御対象を制御する制御部と、
を備えたことを特徴とする、音声認識制御システム。
　車速を検出する車速検出部をさらに備え、
　前記制御部が、前記発話位置と前記発話方向と前記車速との組み合わせに基づき、前記制御対象を制御する
ことを特徴とする、請求項１記載の音声認識制御システム。
　前記制御部は、前記車速が高いほど、前記発話方向として特定される範囲を広げる
ことを特徴とする、請求項２記載の音声認識制御システム。
　前記制御対象認識部は、運転手が操作可能な第一車載装置と、前記運転手以外の乗員が操作可能な第二車載装置とのうち、前記制御対象がいずれの種類に属するものであるかを認識し、
　前記制御部は、前記発話位置，前記発話方向，前記車速の組み合わせと前記制御対象の種類とが対応する場合に、前記制御対象を制御する
ことを特徴とする、請求項２又は３記載の音声認識制御システム。
　前記制御部は、前記発話位置が運転席である場合に、前記第一車載装置の制御を実施可能とし、前記第二車載装置の制御を実施不能とする
ことを特徴とする、請求項４記載の音声認識制御システム。
　前記制御部は、前記発話位置が運転席以外である場合に、前記第二車載装置の制御を実施可能とし、前記第一車載装置の制御を実施不能とする
ことを特徴とする、請求項４又は５記載の音声認識制御システム。
　前記制御部は、前記発話方向が所定の方向である場合に、前記制御対象を制御する
ことを特徴とする、請求項１～６の何れか１項に記載の音声認識制御システム。
　前記発話状態特定部が、前記音声と車載カメラで撮影された車室内の画像とを併用して、前記発話位置及び前記発話方向を特定する
ことを特徴とする、請求項１～７の何れか１項に記載の音声認識制御システム。