JP6595324B2

JP6595324B2 - 車載装置、音声認識システム

Info

Publication number: JP6595324B2
Application number: JP2015237508A
Authority: JP
Inventors: 進一小林
Original assignee: Clarion Co Ltd
Current assignee: Faurecia Clarion Electronics Co Ltd
Priority date: 2015-12-04
Filing date: 2015-12-04
Publication date: 2019-10-23
Anticipated expiration: 2035-12-04
Also published as: JP2017102822A

Description

本発明は、車載装置、および音声認識システムに関する。

近年、車両に搭載される機器は、ユーザーがボタンなどを手で操作する手動操作による動作指示、およびユーザーの発話に基づく音声操作による動作指示が受け付け可能に構成されることが多い。しかし周囲環境の騒音が大きい場合には、ユーザーの発話を対象とした音声認識に失敗し、発話により受け付けた動作指示を実行できない。
特許文献１には、音声認識に失敗すると手動操作に切り替える発明が開示されている。

特開２００２−１６８６４３号公報

特許文献１に記載されている発明では、音声認識に失敗しなければ次の操作入力において音声認識を行わないことを決定できない。

本発明の第１の態様によると、車載装置は、ユーザーの発話に基づく音声信号が入力される音声信号入力部と、ユーザーの手動操作に基づく操作信号が入力される操作信号入力部と、前記音声信号に含まれるノイズに関する指標であるノイズ指標を算出するＳＮ比算出部と、前記音声信号または前記操作信号のいずれかを入力信号として受け付け、前記入力信号に基づく制御を実行する制御部と、を備え、前記制御部は、前記ＳＮ比算出部が算出する前記ノイズ指標に基づいて、次の操作入力において前記音声信号、または前記操作信号のいずれを前記入力信号として受け付けるかを決定する。
本発明の第２の態様による車載装置は、ユーザーの手動操作に基づく操作信号が入力される操作信号入力部と、搭載される車両の速度を検出する速度検出器から車速信号を受信する車速信号入力部と、前記操作信号が入力されるシーンごとに想定されるユーザーの操作内容に関する操作リストが予め記憶された記憶部から前記操作リストを取得するリスト取得部と、ユーザーへ報知するための信号を出力する報知部と、前記車速信号に対応する車速が所定の速度以上であり、かつ次の操作入力が行われるときのシーンに対応する操作リストの複雑度が所定値以上であると、当該操作リストに基づく１または複数の選択肢をユーザーへ報知するための信号を前記報知部に出力させる制御部とを備える。
本発明の第３の態様による音声認識システムは、車載装置、および前記車載装置とネットワークにより接続されるサーバから構成される音声認識システムであって、前記車載装置は、ユーザーの発話に基づく音声信号が入力される音声信号入力部と、ユーザーの手動操作に基づく操作信号が入力される操作信号入力部と、前記音声信号、および前記操作信号を前記サーバへ送信する車両通信部と、を備え、前記サーバは、受信した前記音声信号に含まれるノイズに関する指標であるノイズ指標を算出するＳＮ比算出部と、前記音声信号または前記操作信号のいずれかを入力信号として受け付け、前記入力信号に基づく制御を実行するサーバ制御部と、を備え、前記サーバ制御部は、前記ＳＮ比算出部が算出する前記ノイズ指標に基づいて、次の操作入力において前記音声信号、または前記操作信号のいずれを前記入力信号として受け付けるかを決定する。

本発明によれば、音声認識に失敗しなくても、次の操作入力において音声認識を行わないことを決定できる。

第１の実施の形態における車載装置、および車両の構成を示すブロック図シーン遷移の一例を示す図発話リストの一例を示す図メニューＳのシーンにおける発話リストに含まれる単語の周波数特性を示す図メイン処理の動作を表すフローチャート初期処理の詳細を表すフローチャートＶＲ操作処理の詳細を表すフローチャート手動操作処理の詳細を表すフローチャート第２の実施の形態における車載装置、および車両の構成を示すブロック図第２の実施の形態における手動操作処理の詳細を表すフローチャート第２の実施の形態の変形例２における車載装置、および車両の構成を示すブロック図第３の実施の形態におけるメイン処理の動作を表すフローチャート第３の実施の形態におけるＶＲ操作処理の詳細を表すフローチャート第４の実施の形態における車載装置、およびサーバの構成を示すブロック図

（第１の実施の形態）
以下、図１〜図８を参照して、本発明に係る車載装置の第１の実施の形態を説明する。
図１は車載装置２、および車載装置２を搭載する車両３の構成を示すブロック図である。
車両３は、車載装置２と、音声入力部１１と、操作入力部１２と、音声出力部１３と、表示部１４と、記憶部１５と、位置取得部１９とを備える。車載装置２と、音声入力部１１と、操作入力部１２と、音声出力部１３と、表示部１４と、記憶部１５と、位置取得部１９とは、不図示の車内通信バスにより接続され、各種情報の授受が可能である。

車載装置２は、ＣＰＵ、ＲＯＭ、ＲＡＭ、および信号インタフェースから構成される。車載装置２のＣＰＵは、ＲＯＭに保存されるプログラムをＲＡＭに展開して実行する。図１では、このプログラムにより実現される車載装置２の機能を機能ブロックとして表現している。車載装置２は、音声信号入力部２１と、操作信号入力部２２と、報知部２３と、リスト取得部２５と、制御部２６と、ＳＮ比算出部２７とを備える。音声信号入力部２１と、操作信号入力部２２と、報知部２３と、リスト取得部２５と、制御部２６と、ＳＮ比算出部２７とは、仮想的な通信バスにより接続され、各種情報の授受が可能である。

車両３の構成を説明する。
音声入力部１１は、マイクであり、車載装置２の周囲の音声を音声信号に変換し音声信号入力部２１に出力する。音声入力部１１に入力される音声には、ユーザーによる車載装置２への操作指令の発話だけでなくノイズ、たとえば車両３のタイヤが路面と接触する音や緊急車両の警告音も含まれる。
操作入力部１２は、押しボタンや表示部１４の表面に設けられたタッチパネルであり、ユーザーは手を使って操作入力部１２を操作する。操作入力部１２は、ユーザーによる操作に基づき操作信号を作成し操作信号を操作信号入力部２２に出力する。

音声出力部１３は、スピーカーであり、報知部２３からの動作指令に基づき音声を出力する。
表示部１４は、液晶ディスプレイであり、報知部２３からの動作指令に基づき画像を出力する。
記憶部１５は、不揮発性メモリであり、後述する発話リスト、操作リストおよびシーン遷移情報が記憶される。記憶部１５は、リスト取得部２５からの要求に応じて発話リストまたは操作リストをリスト取得部２５に送信する。

車載装置２の構成を説明する。
音声信号入力部２１は、音声入力部１１から音声信号を受信し、制御部２６に出力する。
操作信号入力部２２は、操作入力部１２から操作信号を受信し、制御部２６に出力する。
報知部２３は、制御部２６から受信する動作指令に基づき、音声出力部１３または表示部１４に情報を出力する。すなわち、音または画像を用いてユーザーへ報知を行う。
リスト取得部２５は、制御部２６から受信する動作指令に基づき、記憶部１５に格納された情報を取得し制御部２６に出力する。

制御部２６は、音声信号、または操作信号に基づきシーンを遷移させる。後述するように、特定のシーンでは車両３、または制御部２６が備える機能が実行される。制御部２６は、音声信号を受信すると音声認識を行い、音声認識の結果に基づきシーンを遷移させる。制御部２６は、操作信号を受信すると、操作されたボタン、または押下されたタッチパネルの位置に表示されていた情報に基づき、シーンを遷移させる。特定のシーンにおける機能の実行は、車載装置２が行ってもよいし、車両３に搭載された不図示の他の機器が行ってもよい。実行される機能とはたとえば、目的地へのルート案内、架電、空調管理などである。シーン、およびシーンの遷移については後述する。
ＳＮ比算出部２７は、制御部２６から音声信号を受信し、受信した音声信号に含まれるシグナルとノイズの比率、すなわちユーザーによる操作指令の音声と周囲の騒音の比率を算出し、制御部２６に出力する。

（シーンの遷移）
車載装置２が管理するシーンの遷移を説明する。以下に説明するシーンは、音声信号、または操作信号に基づき制御部２６により遷移される。
図２は、シーン遷移の一例を示す図である。開始時のシーンはメニューＳである。メニューＳから、架電のためのシーンである電話Ａ１、ルート案内のためのシーンである目的地入力Ｂ１、空調管理のためのシーンであるエアコンＣ１のいずれかに遷移する。
電話Ａ１から、記憶された電話帳を用いて架電先を決定するシーンである電話帳Ａ２、または架電先の番号を入力するシーンである番号入力Ａ３に遷移する。電話帳Ａ２、および番号入力Ａ３から、架電を行う架電状態Ａ４に遷移し、架電が終了するとメニューＳに戻る。

目的地入力Ｂ１から、目的地の住所を入力する住所入力Ｂ２、または入力した履歴から目的地を選択する履歴Ｂ３に遷移する。住所入力Ｂ２は、目的地住所の都道府県を入力する県レベルＢ２１と、目的地住所の市町村を入力する市レベルＢ２２と、目的地住所の番地を入力する番地Ｂ２３とから構成され、初めに県レベルＢ２１、次に市レベルＢ２２、最後に番地Ｂ２３に遷移する。番地Ｂ２３、および履歴Ｂ３から、入力された目的地へのルート案内を行うナビ状態Ｂ４に遷移てルート案内を開始し、ルート案内が終了するとメニューＳに戻る。
エアコンＣ１から、目標室温を設定する温度Ｃ２、または空調の起動および停止を行う起動／停止Ｃ３に遷移する。温度Ｃ２において温度設定が完了するとメニューＳに戻る。起動／停止Ｃ３において空調の起動または停止が完了するとメニューＳに戻る。

（発話リスト）
音声信号に基づくシーンの遷移を説明する。シーンごとに想定されるユーザーの発話内容が発話リストとして記憶部１５に格納される。
図３は発話リストおよび操作リストの一例を示す図である。図３に示すように、発話リストはそれぞれのシーンに対応する。図中のカッコ囲みは、記載された文言どおりではなく、記載された文言を解釈した結果が発話リストであることを意味する。たとえばメニューＳにおける発話リストは、「電話」、「目的地入力」、および「エアコン」の３つであり、電話帳Ａ２における発話リストは、記憶部１５に格納されている電話帳に登録されたそれぞれの名称である。また、架電状態Ａ４、およびナビ状態Ｂ４では発話リストは存在しない。

制御部２６は、リスト取得部２５を介して、現在のシーンにおける発話リストを記憶部１５から取得する。そして、受信した音声信号に対して音声認識を行い、その結果が発話リストのいずれかの単語である場合に、シーンを遷移させる。遷移先のシーンが複数存在する場合は、認識した単語であって発話リストに記載された単語と同一のシーンに遷移させる。たとえば電話Ａ１のシーンにおいて、「電話帳」を認識した場合には電話帳Ａ２に遷移させる。

（操作リスト）
操作信号に基づくシーンの遷移を説明する。シーンごとに設定されるユーザーの操作入力の選択肢、すなわち単語が操作リストとして記憶部１５に格納される。
図３は発話リストおよび操作リストの一例を示す図である。図３に示すように、操作リストは発話リストと概ね同じである。図３におけるカッコ囲みの「文字入力」とは、たとえば表示部１４に平仮名および数字を表示させ、ユーザーに操作入力部１２を用いて一文字ずつ選択させることで文字を入力させることである。
たとえばメニューＳのシーンでは、表示部１４に「電話」、「目的地入力」、および「エアコン」の３つが表示され、制御部２６は操作信号に基づきユーザーがいずれを選択したかを判断し、選択された単語と同一のシーンに遷移させる。

（車載装置の動作）
車載装置２は、ユーザーにより音声操作を開始する旨の指令を受信すると、たとえば不図示の音声入力開始ボタンが押されると、音声入力の受け付けを開始する。ユーザーが音声入力を行うと、音声入力部１１から音声信号入力部２１に音声信号が送信され、ＳＮ比算出部２７がＳＮ比ａを算出するとともに、制御部２６は音声認識の結果に基づき遷移先のシーンを決定する。制御部２６は遷移先のシーンにおける発話リストを、リスト取得部２５を介して記憶部１５から取得する。次に制御部２６は、発話リストに含まれる文言の数が１以上かつ所定個数以下、たとえば１〜１０であるか否かを判断し、文言の数が１以上かつ所定個数以下の場合は後述するリスト複雑度を算出し、このリスト複雑度を用いてシーン閾値Ｒを算出する。リスト複雑度、およびリスト複雑度を用いたシーン閾値Ｒの算出方法は後述する。文言の数がゼロ、または所定個数より多いと判断する場合は、固定値をシーン閾値Ｒに設定する。
このようにして得られたＳＮ比ａとシーン閾値Ｒとを比較し、ＳＮ比ａの方が大きいと判断する場合は、次の入力でも音声信号を受け付けることを決定する。その一方、シーン閾値ＲがＳＮ比ａ以上であると判断する場合は、次の入力では操作信号を受け付けることを決定し、報知部２３を介して音声出力部１３を用いてユーザーに報知する。

（シーン閾値）
シーン閾値、およびシーン閾値の算出に必要なリスト複雑度の算出方法を説明する。シーン閾値Ｒは以下の式（１）により算出される。
Ｒ＝Ｂ＋Ｋ・Ｃ＋ＫＮ・Ｎ＋ＫＮｖ・Ｎｖ式（１）
ただし式（１）において、Ｂは基準ＳＮ比、Ｋは所定の係数、Ｃは後述するリスト複雑度、ＫＮはノイズ用係数、Ｎは受信した音声信号に含まれるノイズレベル、ＫＮｖはノイズ変化量用係数、Ｎｖはノイズ微分値を表す。

基準ＳＮ比Ｂは、好適に音声認識が可能な値が設定される。係数Ｋは、リスト複雑度Ｃの値に応じて極端に大きくならない値が設定される。ノイズ微分値Ｎｖは、受信した音声信号に含まれるノイズの時間経過に対する増減を表しており、徐々にノイズが小さくなる場合は負の値をとり、徐々にノイズが大きくなる場合は正の値をとる。
リスト複雑度Ｃは、発話リストに含まれるそれぞれの文言の周波数特性に基づく値Ｓ、およびノイズの周波数特性に基づく値Ｓｎを用いて、式（２）のように算出される。
Ｃ＝Ｓ−Ｓｎ式（２）

式（２）において、Ｓは、発話リストに含まれるそれぞれの文言の周波数特性において、各周波数における最大の信号強度を積算した値である。たとえば、メニューＳのシーンにおける発話リストは、「電話」、「目的地入力」、および「エアコン」であり、それぞれの単語の周波数特性をｆ（ａ）、ｆ（ｂ）、ｆ（ｃ）とする。これら３つの周波数特性は、図４に示すように０Ｈｚ〜αＨｚではｆ（ｃ）が最も大きく、αＨｚ〜βＨｚではｆ（ｂ）が最も大きく、βＨｚ〜２０ｋＨｚではｆ（ａ）が最も大きいとする。この場合、Ｓは以下の式（３）により算出される。

図４は、メニューＳのシーンにおける発話リストに含まれる単語の周波数特性を示す図である。
ノイズの周波数特性に基づく値Ｓｎは、受信した音声信号に含まれるノイズの各周波数における信号強度を積算した値である。Ｓｎは、ノイズの周波数特性をｆ（ｎ）とすると、以下の式（４）により算出される。

（メインフローチャート）
上述した制御部２６の動作をフローチャートを用いて説明する。以下に説明するフローチャートの各ステップの実行主体は、制御部２６のＣＰＵである。
図５はメイン処理の動作を表すフローチャートである。
制御部２６は、音声認識を開始する旨の操作信号を受信すると、ステップＳ１０１から開始されるメイン処理を実行する。
ステップＳ１０１では初期処理を行いステップＳ１０２に進む。初期処理の詳細は後に図６を用いて説明する。

ステップＳ１０２では、音声認識（Voice Recognition、ＶＲ）の適用可否を表す変数であるＶＲ適用が１であるか否かを判断する。ＶＲ適用が１であると判断する場合はステップＳ１０３に進み、ＶＲ適用が１ではないと判断する場合はステップＳ１０４に進む。
ステップＳ１０３およびステップＳ１０４の詳細は後に図７、および図８を用いて説明する。これらのステップの実行が完了するとステップＳ１０５に進む。
ステップＳ１０５では、次のシーンがメニューＳであるか否かを判断する。次のシーンがメニューＳであると判断する場合は本フローチャートにより動作が表されるプログラムの動作を終了し、次のシーンがメニューＳ以外であると判断する場合はステップＳ１０２に戻る。

（初期処理）
図６は、図５のステップＳ１０１から呼び出される、初期処理の詳細を表すフローチャートである。
ステップＳ２０１では、変数ｎにゼロを代入し、ステップＳ２０２に進む。
ステップＳ２０２では、現在のシーンを示す変数「現シーン」に初期シーンＳを代入し、ステップＳ２０３に進む。
ステップＳ２０３では、変数「ＶＲ適用」に音声認識を適用することを示す「１」を代入し、図６のフローチャートにより動作が表されるサブルーチンを終了する。

（ＶＲ操作処理）
図７は、図５のステップＳ１０３から呼び出される、ＶＲ操作処理の詳細を表すフローチャートである。
ステップＳ３０１では、ユーザーが発話を行っていない時間、すなわち無発話区間の音声信号に基づきノイズレベルＮ、すなわち式（１）におけるＮを決定する。次にステップＳ３０２に進む。

ステップＳ３０２では、ステップＳ３０１と同様に無発話区間の音声信号を用いて、ノイズの微分値Ｎｖを算出してステップＳ３０３に進む。
ステップＳ３０３では、報知部２３を介して音声出力部１３を用いて、シーンにあわせたてユーザーへの問いかけ音声を出力する。問いかけ音声とは例えば、温度Ｃ２のシーンにおいて、「設定温度を喋ってください」という音声である。次にステップＳ３０４に進む。

ステップＳ３０４では、音声信号入力部２１を介して音声入力部１１から受信した音声信号を対象として音声認識を行い、ステップＳ３０５に進む。
ステップＳ３０５では、現在のシーンに対応する発話リストを記憶部１５から読み込み、ステップＳ３０４において音声認識が成功し、なおかつ読み込んだ発話リストのいずれかと音声認識の結果が一致するか否かを判断する。音声認識が成功し、なおかつ読み込んだ発話リストのいずれかと一致すると判断する場合はステップＳ３０６に進み、それ以外の場合はステップＳ３０３に戻る。
ステップＳ３０６では、ステップＳ３０４において受信した音声信号を用いてＳＮ比ａを算出し、ステップＳ３０７に進む。

ステップＳ３０７では、現在のシーン、および音声信号の音声認識結果に基づいて遷移先のシーンを決定し、ステップＳ３０８に進む。
ステップＳ３０８では、リスト取得部２５を介してステップＳ３０７において決定した遷移先のシーンにおける発話リストを記憶部１５から読み込み、ステップＳ３０９に進む。
ステップＳ３０９では、ステップＳ３０８において読み込んだ発話リストに含まれる文言の数が１以上所定数未満であるか否かが判断される。発話リストに含まれる文言の数が１以上所定数未満であると判断する場合はステップＳ３１０に進み、０または所定数以上であると判断する場合はステップＳ３１４に進む。

ステップＳ３１０では、上述した式（２）〜（４）を用いてリスト複雑度Ｃを算出し、ステップＳ３１１に進む。
ステップＳ３１１では、ステップＳ３１０において算出したリスト複雑度Ｃに基づき、シーン閾値Ｒを算出し、ステップＳ３１２に進む。
ステップＳ３１２では、ＳＮ比ａとシーン閾値Ｒの大小関係が評価され、ＳＮ比ａがシーン閾値Ｒよりも大きいと判断する場合はステップＳ３１３に進み、ＳＮ比ａがシーン閾値Ｒ以下であると判断する場合はステップＳ３１５に進む。
ステップＳ３１３では、ステップＳ３０７において決定した遷移先シーンに移行し、変数ＶＲ適用に１を代入し、図７のフローチャートにより動作が表されるサブルーチンを終了する。

発話リストに含まれる文言がゼロまたは所定個数より多いと判断されると実行されるステップＳ３１４において、シーン閾値Ｒに固定値を設定し、ステップＳ３１２に進む。
ステップＳ３１２においてＳＮ比ａがシーン閾値Ｒ以下であると判断されると実行されるステップＳ３１５において、ステップＳ３０７において決定した遷移先シーンに移行し、変数ＶＲ適用にゼロを代入し、ステップＳ３１６に進む。
ステップＳ３１６では、変数ｎを１増加させてステップＳ３１７に進む。

ステップＳ３１７では、変数ｎが所定値よりも大きいか否かを判断し、変数ｎが所定値よりも大きいと判断する場合はステップＳ３１８に進み、変数ｎが所定値以下であると判断する場合は、図７のフローチャートにより動作が表されるサブルーチンを終了する。
ステップＳ３１８では、ステップＳ３１１においてシーン閾値Ｒの算出に用いられる、基準ＳＮ比Ｂを１．１倍に増加させてステップＳ３１９に進む。
ステップＳ３１９では、変数ｎにゼロを代入し、図７のフローチャートにより動作が表されるサブルーチンを終了する。

（手動操作処理）
図８は、図５のステップＳ１０４から呼び出される、手動操作処理の詳細を表すフローチャートである。図７に示したＶＲ操作処理と同一の処理を行うステップには、図７と同一のステップ番号を付し、説明を省略する。
ステップＳ４０１において、報知部２３を介して音声出力部１３、および表示部１４を用いてユーザーへの報知を行う。すなわち、表示部１４に現在のシーンにおいて選択可能な選択肢である単語を表示するとともに、音声出力部１３から選択を促す音声を出力する。次にステップＳ４０２に進む。

ステップＳ４０２では、ユーザーの手操作、すなわち操作入力部１２への入力を、操作信号入力部２２を介して受信し、ステップＳ３０１に進む。
ステップＳ３０１ではノイズレベルＮを算出し、続くステップＳ３０２ではノイズの微分値Ｎｖを算出し、ステップＳ４０３に進む。
ステップＳ４０３では、操作信号を受信したか否かを判断し、操作信号を受信したと判断する場合はステップＳ４０４に進み、操作信号を受信していないと判断する場合はステップＳ４０５に進む。

ステップＳ４０４では、受信した操作信号に基づき遷移先のシーンを決定し、ステップＳ３０８に進む。
ステップＳ４０５では、操作信号を受信していないことからシーンを変更しないこととし、遷移先シーンを現在のシーンに決定し、ステップＳ３０８に進む。
ステップＳ３０８以降の処理は、ステップＳ４０６以外は図７と同様なので説明を省略する。
ステップＳ４０６では、直前にＶＲ操作処理のステップＳ３０６において算出されたＳＮ比ａと、当該手操作処理のステップＳ３１１またはステップＳ３１４において算出されたシーン閾値Ｒとを比較する。

上述した第１の実施の形態によれば、次の作用効果が得られる。
（１）車載装置２は、ユーザーの発話に基づく音声信号が入力される音声信号入力部２１と、ユーザーの手動操作に基づく操作信号が入力される操作信号入力部２２と、音声信号に含まれるノイズに関する指標であるノイズ指標、すなわちＳＮ比ａを算出するＳＮ比算出部２７と、音声信号または操作信号のいずれかを入力信号として受け付け、入力信号に基づく制御を実行する制御部２６と、を備える。制御部２６は、ＳＮ比算出部２７が算出するノイズ指標、すなわちＳＮ比ａに基づいて、次の操作入力において音声信号、または操作信号のいずれを入力信号として受け付けるかを決定する。
車載装置２は、ノイズ指標に基づき次の操作入力において、音声信号、または操作信号のいずれを入力信号として受け付けるかを決定するので、音声認識に失敗しなくても、自らの判断で次の操作入力において操作信号を入力信号として受け付けることを決定し、音声認識を行わないことを決定できる。そのため、ノイズが大きく音声認識が困難であること推測される場合は、次の操作入力において音声信号の入力を受け付けないことにより、音声認識に必要な計算リソースを節約できる。

（２）車載装置２は、制御部２６が次の操作入力において操作信号を入力信号として受け付けると決定すると、手動操作を要求する旨をユーザーへ報知するための信号を音声出力部１３または表示部１４に出力する報知部２３を備える。
そのため、車載装置２のユーザは音声認識が困難であると推測される場合には手動操作が要求され、音声認識の失敗による再入力を回避することができ、利便性が向上される。

（３）車載装置２は、音声信号が入力されるシーンごとに想定されるユーザーの発話内容に関する発話リストが予め記憶された記憶部１５から発話リストを取得するリスト取得部２５を備える。制御部２６は、次の操作入力が行われるときのシーンに対応する発話リストに基づいて決定される閾値、すなわちシーン閾値Ｒに基づいて、音声信号、または操作信号のいずれを入力信号として受け付けるかを決定する。
そのため、シーンに応じて音声信号、または操作信号のいずれを入力信号として受け付けるかを決定することができる。

（第１の実施の形態の変形例）
上述した実施の形態における、シーン閾値Ｒ、およびリスト複雑度Ｃの算出式は式（１）〜（３）に限定されない。リスト複雑度Ｃは、発話リストの周波数特性に基づいて算出されれば良く、シーン閾値Ｒは、該当するシーンにおける発話リストに基づいて算出されたリスト複雑度を用いて算出されればよい。

（第２の実施の形態）
図９〜図１０を参照して、本発明に係る車載装置の第２の実施の形態を説明する。以下の説明では、第１の実施の形態と同じ構成要素には同じ符号を付して相違点を主に説明する。特に説明しない点については、第１の実施の形態と同じである。本実施の形態では、主に、ユーザーに手操作による入力を求める際に、車両が走行状態であり、かつ操作の複雑度が所定値以上の場合に、制御部が優先選択肢を算出し、優先選択肢を承認するか否かを問い合わせる点で、第１の実施の形態と異なる。

（構成）
図９は、第２の実施の形態における車載装置２ａ、および車載装置２ａを搭載する車両３ａの構成を示すブロック図である。
車両３ａは、第１の実施の形態における構成に加えて、車両３ａの車速を検出する車速検出部１９ａをさらに備える。車載装置２ａは、第１の実施の形態における構成に加えて、車速検出部１９ａから車速信号を受信する車速信号入力部２９ａをさらに備える。
車載装置２ａの制御部２６のＲＯＭに保存されているプログラムの処理は、手操作処理のみが第１の実施の形態と異なる。

（手操作処理）
第２の実施の形態では、運転中のユーザーの負担軽減を目的として、操作入力部１２を用いて複雑な入力を回避する手段を提供する。制御部２６は、車両３の車速がゼロではなく、入力操作の複雑度が所定値以上の場合に、優先選択肢を算出する。入力操作の複雑度とは、選択肢の数、および選択肢の長さなどに基づき判断され、たとえば選択肢が５以上の場合、選択肢が１０文字以上の場合、および文字入力が必要な場合に複雑度が所定値以上と判断される。優先選択肢とは、複数の選択肢のうち最も確からしい選択肢であり、たとえば過去の統計情報や、選択肢と現在の車両の状況との関係から決定される。たとえば、履歴Ｂ３のシーンではこれまでに最も選択された回数が多かった選択肢を優先選択肢とすることができ、県レベルＢ２１のシーンでは位置取得部１９から得られる車両３ａの現在地の都道府県を優先選択肢とすることができる。

（フローチャート）
図１０は、第２の実施の形態における手動操作処理の詳細を表すフローチャートである。第１の実施の形態と同一の処理を行うステップには、同一のステップ番号を付して説明を省略する。
ステップＳ７０１では、車速信号入力部２９ａが受信した車速信号に基づき、車両が走行状態にあるか否かを判断し、走行状態にあると判断する場合はステップＳ７０２に進み、走行状態にないと判断する場合はステップＳ４０１に進む。

ステップＳ７０２では、現在のシーンにおける入力操作の複雑度が所定値以上であるか否かを判断する。入力操作の複雑度が所定値以上であると判断する場合はステップＳ７０３に進み、入力操作の複雑度が所定値未満であると判断する場合はステップＳ４０１に進む。
ステップＳ７０３では、優先選択肢を算出してステップＳ７０４に進む。
ステップＳ７０４では、報知部２３を介して表示部１４に優先選択肢、および優先選択肢の承認可否の問い合わせを表示し、ステップＳ７０５に進む。
ステップＳ７０５では、報知部２３を介して音声出力部１３から承認可否を問い合わせる音声を出力しステップＳ４０２に進む。
以下の処理は第１の実施の形態と同様なので説明を省略する。

上述した第２の実施の形態によれば、第１の実施の形態における作用効果に加えて、次の作用効果が得られる。
（１）車載装置２は、車載装置２が搭載される車両の速度を検出する車速検出部１９ａから車速信号を受信する車速信号入力部２９ａと、操作信号が入力されるシーンごとに想定されるユーザーの操作内容に関する操作リストが予め記憶された記憶部１５から操作リストを取得するリスト取得部２５と、ユーザーへ報知するための信号を出力する報知部２３とを備える。制御部２６は、次の操作入力において操作信号を入力信号として受け付けると決定した場合に、車速信号に対応する車速が所定の速度以上であり、かつ当該操作リストの複雑度が所定値以上であると、当該操作リストに基づく選択肢をユーザーへ報知するための信号を報知部２３に出力させる。
そのため、ユーザーは報知された選択肢を用いた車載装置２の操作が可能であり、操作が簡便である。ユーザーは運転中に手を使った複雑な操作を行うことは困難であることを考慮して、車両の移動中は簡単な操作しか許可しない操作規制機能を有する車載装置も存在する。この操作規制機能を有する車載装置であっても、本実施の形態における車載装置２の構成を備えれば、走行中に車載装置２の様々な操作が可能となり、特に有用である。

（第２の実施の形態の変形例１）
第２の実施の形態では、優先選択肢として１つの選択肢のみを提示した。しかし、複数の選択肢を提示し、ユーザーに選択させてもよい。たとえば県レベルＢ２１のシーンにおいて、これまでに選択された上位３点を優先選択肢として決定し、ユーザーにこの３つのいずれかを選択させてもよい。

（第２の実施の形態の変形例２）
車載装置は、音声信号入力部２１を備えなくてもよい。
図１１は、第２の実施の形態の変形例２における車載装置２ｂ、および車両３ｂの構成を示すブロック図である。
車両３ｂは、操作入力部１２と、表示部１４と、記憶部１５と、位置取得部１９と、車速検出部１９ａと、車載装置２ｂとを備える。操作入力部１２と、表示部１４と、記憶部１５と、位置取得部１９と、車速検出部１９ａの構成、および動作のうち第２の実施の形態との主な差異は、記憶部１５に発話リストが記憶されない点である。
車載装置２ｂは、操作信号入力部２２と、報知部２３と、リスト取得部２５と、制御部２６と、車速信号入力部２９ａとを備える。操作信号入力部２２と、報知部２３と、リスト取得部２５と、制御部２６と、車速信号入力部２９ａの動作のうち第２の実施の形態との主な差異は、制御部２６において変数「ＶＲ適用」がゼロに固定される点である。すなわち、車載装置２ｂは、常に操作入力部１２からの操作信号に基づき動作する。

この第２の実施の形態の変形例２によれば、次の作用効果が得られる。
（１）車載装置２ｂは、ユーザーの手動操作に基づく操作信号が入力される操作信号入力部２２と、搭載される車両の速度を検出する速度検出器から車速信号を受信する車速信号入力部２９ａと、操作信号が入力されるシーンごとに想定されるユーザーの操作内容に関する操作リストが予め記憶された記憶部１５から操作リストを取得するリスト取得部２５と、ユーザーへ報知するための信号を出力する報知部２３と、車速信号に対応する車速が所定の速度以上であり、かつ次の操作入力が行われるときのシーンに対応する操作リストの複雑度が所定値以上であると、当該操作リストに基づく１または複数の選択肢をユーザーへ報知するための信号を報知部２３に出力させる制御部２６と、を備える。
そのため、第２の実施の形態に特有の作用効果と同一の作用効果が得られる。

（第３の実施の形態）
図１２〜図１３を参照して、本発明に係る車載装置の第３の実施の形態を説明する。以下の説明では、第１の実施の形態と同じ構成要素には同じ符号を付して相違点を主に説明する。特に説明しない点については、第１の実施の形態と同じである。本実施の形態では、主に、発話リストに含まれる文言が所定個数より多い場合に優先選択肢を決定し、優先選択肢のいずれかを選択させる点が第１の実施の形態と異なる。
車載装置２の制御部２６のＲＯＭに保存されているプログラムの動作が、第１の実施の形態と異なる。車載装置２、および車両３のハードウエア構成は第１の実施の形態と同様である。本実施の形態において制御部２６は、シーンごとに入力された音声信号、および操作信号の統計情報を作成し、記憶部１５に記憶する。制御部２６は、前述の優先選択肢の決定に、記憶部１５に記憶した統計情報を用いる。

（ＶＲ操作処理）
第３の実施の形態では、発話リストに含まれる単語が所定個数よりも多い場合に、いくつかの単語だけをユーザーに提示し、発話によるユーザーの選択を簡便にする。これにより、ユーザーによる手操作が必要な機会を減少させることができる。

（フローチャート）
図１２は、第３の実施の形態におけるメイン処理の動作を表すフローチャートである。第１の実施の形態と同様の処理を行うステップには同一のステップ番号を付して説明を省略する。以下に説明する各ステップの実行主体は、制御部２６のＣＰＵである。
ステップＳ１０１において第１の実施の形態と同様の初期処理を行うと、次にステップＳ５０１に進む。
ステップＳ５０１では、音声認識の適用可否を表す変数であるＶＲ適用の値を評価する。ＶＲ適用が１または２であると判断する場合はステップＳ１０３ａに進み、ＶＲ適用がゼロであると判断する場合はステップＳ１０４に進む。

図１３は、図１２のステップＳ１０３ａから呼び出される、第３の実施の形態におけるＶＲ操作処理の詳細を表すフローチャートである。第１の実施の形態と同様の処理を行うステップには同一のステップ番号を付して説明を省略する。
ステップＳ３０１、およびステップＳ３０２は第１の実施の形態と同様なので説明を省略する。次にステップＳ３０３ａに進む。

ステップＳ３０３ａでは、ＶＲ適用が１の場合は第１の実施の形態と同様に、シーンにあわせたてユーザーへの問いかけ音声を出力する。ＶＲ適用が２の場合は、ＲＡＭから関連付けられた選択肢と識別子を読み出し、これを報知部２３を介して音声出力部１３から報知させる。この場合に報知部２３に送信される情報はたとえば、県レベルＢ２１のシーンにおいて、「１．ＡＡＡ県、２．ＢＢＢ県、３．ＣＣＣ県」という情報である。次にステップＳ３０４に進む。
ステップＳ３０４では、第１の実施の形態と同様に音声認識を行いステップＳ３０５ａに進む。

ステップＳ３０５ａでは、ステップＳ３０４において音声認識が成功し、なおかつ発話リストのいずれか、またはステップＳ３０３ａにおいて出力した識別子のいずれかと音声認識の結果が一致するか否かを判断する。音声認識が成功し、なおかつなおかつ発話リストのいずれか、または識別子のいずれかと音声認識の結果が一致すると判断する場合はステップＳ３０６に進み、それ以外の場合はステップＳ３０３ａに戻る。たとえば、ステップＳ３０３ａにおいて、「１．ＡＡＡ県、２．・・・」と出力した場合に、音声認識結果が「１」である場合も本ステップは肯定判断がなされる。

ステップＳ３０６では、ステップＳ３０４において受信した音声信号を用いてＳＮ比ａを算出し、ステップＳ３０７ａに進む。
ステップＳ３０７ａでは、現在のシーン、および音声信号の音声認識結果に基づいて遷移先のシーンを決定する。ただし音声認識結果が識別子である場合は、ＲＡＭを参照してその識別子と関連付けられた選択肢を特定し、その選択肢が音声認識されたとして扱う。次にステップＳ３０８に進む。
ステップＳ３０８〜Ｓ３１４の処理は第１の実施の形態と同様なので説明を省略する。

ステップＳ３１４の次に実行されるステップＳ６０１では、まずステップＳ３０８において取得した発話リストから複数の選択肢を選択し、識別子と関連付けてＲＡＭに保存する。ここで識別子とは、１桁の数字や１文字のアルファベットなどである。発話リストからの選択肢の選択は、たとえば制御部２６に蓄積された統計情報に基づく。さらに、選択した複数の選択肢を用いて、ステップＳ３１０と同様にリスト複雑度を算出し、さらにステップＳ３１１と同様にシーン閾値を算出し、以下ではこの閾値をＲ２と呼ぶ。次にステップＳ６０２に進む。

ステップＳ６０２では、ステップＳ３１４において設定した固定値であるシーン閾値Ｒ、ステップＳ３０６において算出したＳＮ比ａ、ステップＳ３１４において算出した閾値Ｒ２が、Ｒ２＜ａ＜Ｒの関係を満たすか否かを判断する。この関係を満たすと判断する場合はステップＳ６０３に進み、この関係を満たさないと判断する場合はステップＳ３１２に進む。
ステップＳ６０３では、ステップＳ３０７において決定した遷移先シーンに移行し、変数ＶＲ適用に２を代入し、ステップＳ３１６に進む。

上述した第３の実施の形態によれば、第１の実施の形態における作用効果に加えて、次の作用効果が得られる。
（１）車載装置２は、ユーザーへ報知するための信号を出力する報知部２３を備える。制御部２６は、少なくともＳＮ比ａがシーン閾値Ｒよりも小さい場合に、次の操作入力が行われるときのシーンに対応する発話リストに基づく１または複数の選択肢、および選択肢が複数の場合は選択肢に関連付けられた識別子をユーザーへ報知するための信号を報知部２３に出力させ、音声信号を入力信号として受け付けることを決定する。
そのため、ＳＮ比ａがシーン閾値Ｒよりも小さい場合でも、ユーザが手を使わずに車載装置２を操作可能な音声信号による入力を継続できる。ユーザは識別子を発話することにより車載装置２を操作できるので簡便である。

（第４の実施の形態）
図１４を参照して、本発明に係る音声認識システムに係る第４の実施の形態を説明する。以下の説明では、第１の実施の形態と同じ構成要素には同じ符号を付して相違点を主に説明する。特に説明しない点については、第１の実施の形態と同じである。本実施の形態では、第１の実施の形態において車載装置が備えた機能の一部をサーバが備える点が主に異なる。

（構成）
図１４は、第４の実施の形態における車載装置２ｃ、車両３ｃおよびサーバ４の構成を示すブロック図である。音声認識システム５は、ネットワークにより接続される車載装置２ｃとサーバ４とを備える。
車両３ｃは、第１の実施の形態における構成に加えて車両通信部１９ｂをさらに備え、記憶部１５を備えなくてもよい。
車載装置２ｃは、第１の実施の形態において備えたリスト取得部２５およびＳＮ比算出部２７を備えなくてもよい。制御部２６は、音声信号入力部２１に入力された音声信号、および操作信号入力部２２に入力された操作信号を、車両通信部１９ｂを用いてサーバ４に送信する。制御部２６は、車両通信部１９ｂを介してサーバ４から動作指令を受けると、報知部２３を介して音声出力部１３または表示部１４を用いてユーザーに報知を行う。

サーバ４は、記憶部４５ａと、リスト取得部４５と、サーバ制御部４６と、ＳＮ比算出部４７と、サーバ通信部４９とを備える。記憶部４５ａ、リスト取得部４５、およびＳＮ比算出部４７の構成、および動作は第１の実施の形態における記憶部１５、リスト取得部２５、およびＳＮ比算出部２７と同様である。サーバ通信部４９は、車両３ｃと通信を行う。サーバ制御部４６の動作は第１の実施の形態における制御部２６と同様であるが、音声信号入力部２１、操作信号入力部２２、および報知部２３とはサーバ通信部４９および車両通信部１９ｂを介して通信を行う。

上述した第４の実施の形態によれば、第１の実施の形態における作用効果に加えて、次の作用効果が得られる。
（１）音声認識システム５は、車載装置２ｃ、および車載装置２ｃとネットワークにより接続されるサーバ４から構成される。車載装置２ｃは、ユーザーの発話に基づく音声信号が入力される音声入力部１１と、ユーザーの手動操作に基づく操作信号が入力される操作入力部１２と、音声信号、および操作信号をサーバへ送信する車両通信部１９ｂと、を備え、サーバ４は、受信した音声信号に含まれるノイズに関する指標であるノイズ指標を算出するＳＮ比算出部４７と、音声信号または操作信号のいずれかを入力信号として受け付け、入力信号に基づく制御を実行するサーバ制御部４６と、を備え、サーバ制御部４６は、ＳＮ比算出部４７が算出するノイズ指標に基づいて、次の操作入力において音声信号、または操作信号のいずれを入力信号として受け付けるかを決定する。
そのため、車載装置２ｃにおける計算処理を減少させ、車載装置２ｃの構成を簡素化することができる。

上述した各実施の形態および変形例は、それぞれ組み合わせてもよい。
上記では、種々の実施の形態および変形例を説明したが、本発明はこれらの内容に限定されるものではない。本発明の技術的思想の範囲内で考えられるその他の態様も本発明の範囲内に含まれる。たとえば、以下の構成による音声認識システム５も本発明の範囲内に含まれる。
（１）車載装置は、ユーザーへ報知するための信号を出力する報知部をさらに備え、サーバのサーバ制御部は、次の操作入力において操作信号を入力信号として受け付けると決定すると、車載装置の報知部を用いて手動操作を要求する旨をユーザーへ報知させる。
（２）サーバは、音声信号が入力されるシーンごとに、想定されるユーザーの発話内容に関する発話リストが予め記憶され記憶部から発話リストを取得するリスト取得部をさらに備え、サーバ制御部は、次の操作入力が行われるときのシーンに対応する発話リストに基づいて決定されるシーン閾値に基づいて、音声信号、または操作信号のいずれを入力信号として受け付けるかを決定する。
（３）車載装置は、ユーザーへ報知するための信号を出力する報知部をさらに備え、サーバ制御部は、少なくともノイズ指標がシーン閾値よりも小さい場合に、次の操作入力が行われるときのシーンに対応する発話リストに基づく複数の選択肢、および選択肢に関連付けられた識別子を報知部を用いて出力させ、音声信号を入力信号として受け付けることを決定する。
（４）車載装置は、当該車載装置が搭載される車両の速度を検出する速度検出器から車速信号を受信する車速信号入力部と、ユーザーへ報知するための信号を出力する報知部とをさらに備え、サーバは、操作信号が入力されるシーンごとに想定されるユーザーの操作内容に関する操作リストが予め記憶された記憶部から操作リストを取得するリスト取得部をさらに備え、サーバ制御部は、次の操作入力において操作信号を入力信号として受け付けると決定した場合に、車速信号に対応する車速が所定の速度以上であり、かつ当該操作リストの複雑度が所定値以上であると、当該操作リストに基づく１または複数の選択肢をユーザーへ報知するための信号を報知部に出力する。

２ … 車載装置
３ … 車両
４ … サーバ
５ … 音声認識システム
Ｃ … リスト複雑度
Ｒ … シーン閾値
ａ … ＳＮ比
１５ … 記憶部
１９ａ … 車速検出部
１９ｂ … 車両通信部
２１ … 音声信号入力部
２２ … 操作信号入力部
２３ … 報知部
２５ … リスト取得部
２６ … 制御部
２７ … ＳＮ比算出部
２９ａ … 車速信号入力部
４５ … リスト取得部
４５ａ … 記憶部
４６ … サーバ制御部
４７ … ＳＮ比算出部
４９ … サーバ通信部

Claims

ユーザーの発話に基づく音声信号が入力される音声信号入力部と、
ユーザーの手動操作に基づく操作信号が入力される操作信号入力部と、
前記音声信号に含まれるノイズに関する指標であるノイズ指標を算出するＳＮ比算出部と、
前記音声信号または前記操作信号のいずれかを入力信号として受け付け、前記入力信号に基づく制御を実行する制御部と、
前記音声信号が入力されるシーンごとに想定されるユーザーの発話内容に関する発話リストが予め記憶された記憶部から前記発話リストを取得するリスト取得部と、
を備え、
前記制御部は、前記ＳＮ比算出部が算出する前記ノイズ指標と、次の操作入力が行われるときのシーンに対応する前記発話リストに基づいて決定されるシーン閾値とに基づいて、次の操作入力において前記音声信号、または前記操作信号のいずれを前記入力信号として受け付けるかを決定する、車載装置。
請求項１に記載の車載装置において、
ユーザーへ報知するための信号を出力する報知部をさらに備え、
前記制御部は、少なくとも前記ノイズ指標が前記シーン閾値よりも小さい場合に、次の操作入力が行われるときのシーンに対応する発話リストに基づく１または複数の選択肢、および前記選択肢が複数の場合は前記選択肢に関連付けられた識別子をユーザーへ報知するための信号を前記報知部に出力させ、前記音声信号を前記入力信号として受け付けることを決定する、車載装置。
請求項１または２に記載の車載装置において、
前記制御部が次の操作入力において前記操作信号を前記入力信号として受け付けると決定すると、手動操作を要求する旨をユーザーへ報知するための信号を出力する報知部をさらに備える、車載装置。
ユーザーの発話に基づく音声信号が入力される音声信号入力部と、
ユーザーの手動操作に基づく操作信号が入力される操作信号入力部と、
前記音声信号に含まれるノイズに関する指標であるノイズ指標を算出するＳＮ比算出部と、
前記音声信号または前記操作信号のいずれかを入力信号として受け付け、前記入力信号に基づく制御を実行する制御部と、
当該車載装置が搭載される車両の速度を検出する速度検出器から車速信号を受信する車速信号入力部と、
前記操作信号が入力されるシーンごとに想定されるユーザーの操作内容に関する操作リストが予め記憶された記憶部から前記操作リストを取得するリスト取得部と、
ユーザーへ報知するための信号を出力する報知部と、
を備え、
前記制御部は、前記ＳＮ比算出部が算出する前記ノイズ指標に基づいて、次の操作入力において前記音声信号、または前記操作信号のいずれを前記入力信号として受け付けるかを決定し、
前記制御部は、次の操作入力において前記操作信号を前記入力信号として受け付けると決定した場合に、前記車速信号に対応する車速が所定の速度以上であり、かつ当該操作リストの複雑度が所定値以上であると、当該操作リストに基づく１または複数の選択肢をユーザーへ報知するための信号を前記報知部に出力させる、車載装置。
ユーザーの手動操作に基づく操作信号が入力される操作信号入力部と、
搭載される車両の速度を検出する速度検出器から車速信号を受信する車速信号入力部と、
前記操作信号が入力されるシーンごとに想定されるユーザーの操作内容に関する操作リストが予め記憶された記憶部から前記操作リストを取得するリスト取得部と、
ユーザーへ報知するための信号を出力する報知部と、
前記車速信号に対応する車速が所定の速度以上であり、かつ次の操作入力が行われるときのシーンに対応する操作リストの複雑度が所定値以上であると、当該操作リストに基づく１または複数の選択肢をユーザーへ報知するための信号を前記報知部に出力させる制御部と、を備える車載装置。
車載装置、および前記車載装置とネットワークにより接続されるサーバから構成される音声認識システムであって、
前記車載装置は、
ユーザーの発話に基づく音声信号が入力される音声信号入力部と、
ユーザーの手動操作に基づく操作信号が入力される操作信号入力部と、
前記音声信号、および前記操作信号を前記サーバへ送信する制御部と、を備え、
前記サーバは、
受信した前記音声信号に含まれるノイズに関する指標であるノイズ指標を算出するＳＮ比算出部と、
前記音声信号または前記操作信号のいずれかを入力信号として受け付け、前記入力信号に基づく制御を実行するサーバ制御部と、
前記音声信号が入力されるシーンごとに、想定されるユーザーの発話内容に関する発話リストが予め記憶され記憶部から前記発話リストを取得するリスト取得部と、
を備え、
前記サーバ制御部は、前記ＳＮ比算出部が算出する前記ノイズ指標と、次の操作入力が行われるときのシーンに対応する発話リストに基づいて決定されるシーン閾値とに基づいて、次の操作入力において前記音声信号、または前記操作信号のいずれを前記入力信号として受け付けるかを決定する、音声認識システム。
請求項６に記載の音声認識システムにおいて、
前記車載装置は、ユーザーへ報知するための信号を出力する報知部をさらに備え、
前記サーバ制御部は、少なくとも前記ノイズ指標が前記シーン閾値よりも小さい場合に、次の操作入力が行われるときのシーンに対応する発話リストに基づく複数の選択肢、および前記選択肢に関連付けられた識別子を前記報知部を用いて出力させ、前記音声信号を前記入力信号として受け付けることを決定する、音声認識システム。
請求項６または７に記載の音声認識システムにおいて、
前記車載装置は、ユーザーへ報知するための信号を出力する報知部をさらに備え、
前記サーバの前記サーバ制御部は、次の操作入力において前記操作信号を前記入力信号として受け付けると決定すると、前記車載装置の前記報知部を用いて手動操作を要求する旨をユーザーへ報知させる、音声認識システム。
車載装置、および前記車載装置とネットワークにより接続されるサーバから構成される音声認識システムであって、
前記車載装置は、
ユーザーの発話に基づく音声信号が入力される音声信号入力部と、
ユーザーの手動操作に基づく操作信号が入力される操作信号入力部と、
前記音声信号、および前記操作信号を前記サーバへ送信する制御部と、
当該車載装置が搭載される車両の速度を検出する速度検出器から車速信号を受信する車速信号入力部と、
ユーザーへ報知するための信号を出力する報知部と、
を備え、
前記サーバは、
受信した前記音声信号に含まれるノイズに関する指標であるノイズ指標を算出するＳＮ比算出部と、
前記音声信号または前記操作信号のいずれかを入力信号として受け付け、前記入力信号に基づく制御を実行するサーバ制御部と、
前記操作信号が入力されるシーンごとに想定されるユーザーの操作内容に関する操作リストが予め記憶された記憶部から前記操作リストを取得するリスト取得部と、
を備え、
前記サーバ制御部は、前記ＳＮ比算出部が算出する前記ノイズ指標に基づいて、次の操作入力において前記音声信号、または前記操作信号のいずれを前記入力信号として受け付けるかを決定し、
前記サーバ制御部は、次の操作入力において前記操作信号を前記入力信号として受け付けると決定した場合に、前記車速信号に対応する車速が所定の速度以上であり、かつ当該操作リストの複雑度が所定値以上であると、当該操作リストに基づく１または複数の選択肢をユーザーへ報知するための信号を前記報知部に出力させる、音声認識システム。