JP2006030908A - 車両用音声認識装置及び移動体 - Google Patents

車両用音声認識装置及び移動体 Download PDF

Info

Publication number
JP2006030908A
JP2006030908A JP2004213508A JP2004213508A JP2006030908A JP 2006030908 A JP2006030908 A JP 2006030908A JP 2004213508 A JP2004213508 A JP 2004213508A JP 2004213508 A JP2004213508 A JP 2004213508A JP 2006030908 A JP2006030908 A JP 2006030908A
Authority
JP
Japan
Prior art keywords
score
reliability
voice recognition
vehicle
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004213508A
Other languages
English (en)
Inventor
Yoichi Kitano
陽一 北野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2004213508A priority Critical patent/JP2006030908A/ja
Publication of JP2006030908A publication Critical patent/JP2006030908A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】対環境性能を向上させて、より正確な音声認識を行う。
【解決手段】車両用音声認識装置10は、搭乗者が話す音声をマイクから入力して認識する音響パターン認識部50と、CCDカメラ22により搭乗者の口元を撮像した画像に基づいて音声を認識する画像パターン認識部54とを有する。車両用音声認識装置10の環境評価部70は、車両状態検出手段により検出された車両状態に基づいて、音響パターン認識部50の信頼度を示す第1スコア補正係数と画像パターン認識部54の信頼度を示す第2スコア補正係数とを求めるる。音響パターン認識部50により求められた信頼度スコアを第1スコア補正係数で補正するとともに画像パターン認識部54により求められた信頼度スコアを第2スコア補正係数で補正して補正スコアを求める。同一の結果を示す音声認識結果毎に対応する補正スコアを集計して合計スコアを求める。
【選択図】図2

Description

本発明は、マイク等の音声入力手段とカメラ等の画像入力手段を用いて話者が話す音声を認識する音声認識装置に関し、特に、車載用音声認識装置
と、該車載用音声認識装置が搭載される移動体に関する。
近時の車両には多数の電子機器が搭載されるようになり、その機能も一層高度化しつつある。このような中、電子機器の操作の容易化のため音声操作を可能にする音声認識装置が開発されている。
ところで、車両用に限らず、音声認識装置において話者が話す音声を確実に認識するためには、話者の話し方の変化や周囲の騒音等を充分に考慮しなければならない。そのような対策のために、想定される複数の騒音環境に対応した音声モデルを予め設けておき、騒音環境に応じた適当な音声モデルを選択して音声認識を行うシステム(例えば、特許文献1参照)や、話者の心的状態を推定することにより複数の音声認識辞書から適切な辞書を選択して用いる装置(例えば、特許文献2参照)が提案されている。
特開2000−75889号公報 特開2002−149191号公報
音声認識装置にマイク等の音響入力部と、話者の口元を撮像するCCD(Charge Coupled Device)カメラ等の撮像部とを設けておくことにより、音響入力部から得られた話者の音声を認識する手段と、撮像部から得られた画像に基づいて音声を認識手段とを相互補完的に使用することにより、話者の音声を相当に認識することができて好適である。また、音声認識装置を車載用として用いる場合には、想定される音声上のノイズ又は画像ノイズ(以下、環境ノイズと呼ぶ)を含んだ認識辞書を使用することにより、音声認識の対環境性能が向上する。
ところで、車両はその走行状態や走行箇所に応じて温度、湿度、加速度、振動、明るさ及び騒音等が著しく変化するが、前記の認識辞書に含まれる環境ノイズは一定の環境下では有効であっても、異なる環境下では充分に有効でない場合もあり得る。一方、前記の特許文献1及び特許文献2に記載されたシステムでは、このような車両状態に基づく環境変化を考慮した音声認識ができる構成にはなっていない。
また、搭載される車種によっては騒音のレベルや日の当たり方が異なり、所定の認識辞書が全ての車種に対して有効であるとは限らない。従って、搭載される車種毎に認識辞書の調整を行う必要があるがこの作業は煩雑であり、しかも異なるセッティングにすると音声認識装置の車種に対する汎用性が低下する。
本発明はこのような課題を考慮してなされたものであり、車両状態に基づく環境変化の影響を受けにくく、より正確な音声認識を行うことを可能にする車両用音声認識装置及び該車両用音声認識装置を搭載した移動体を提供することを目的とする。
本発明に係る車両用音声認識装置は、車両状態を検出する車両状態検出手段と、
話者が話す音声を音響入力部から入力し、1以上の音響辞書を参照しながら前記音声を認識して、前記音響辞書毎にそれぞれ1以上の音声認識結果と該音声認識結果に対応する信頼度スコアとを求める第1音声認識手段と、
撮像部により前記話者の口元を撮像した画像を入力し、1以上の画像辞書を参照しながら前記音声を認識して、前記画像辞書毎にそれぞれ1以上の音声認識結果と該音声認識結果に対応する信頼度スコアとを求める第2音声認識手段と、
前記車両状態検出手段により検出された前記車両状態に基づいて、前記第1音声認識手段の信頼度を示す第1スコア補正係数と前記第2音声認識手段の信頼度を示す第2スコア補正係数とを求める信頼度算出手段と、
前記第1音声認識手段により求められた信頼度スコアを前記第1スコア補正係数で補正するとともに前記第2音声認識手段により求められた信頼度スコアを前記第2スコア補正係数で補正して補正スコアを求めるスコア算出手段と、
同一の結果を示す前記音声認識結果毎に対応する前記補正スコアを集計して合計スコアとして求めるとともに、少なくとも前記合計スコアが最も高い値である音声認識結果を出力する結果出力手段と、
を有することを特徴とする(請求項1記載の発明)。
このように、本発明では、音響入力部から入力される信号に基づく第1音声認識手段と、撮像部の画像信号に基づく第2音声認識手段とにより求められた複数の音声認識結果に対する各信頼度スコアを、車両状態に基づく第1スコア補正係数、第2スコア補正係数でそれぞれ補正する。この後、得られた補正スコアを集計した合計スコアを比較することにより、複数の音声認識結果のうち、その時点の車両状態における信頼度の高いものを選択することができる。これにより、車両状態に基づく環境変化の影響を受けにくく、より正確な音声認識を行うことができる。
この場合、前記第1スコア補正係数は、前記音響入力部から入力される信号に対する前記車両状態に基づく音響入力信頼度を含み、前記第2スコア補正係数は、前記撮像部により撮像される前記画像に対する前記車両状態に基づく画像入力信頼度を含むようにしてもよい(請求項2記載の発明)。これにより、その時点における音声入力の手段毎の信頼度を考慮した音声認識を行うことができる。
また、前記音響入力信頼度及び(又は)前記画像入力信頼度に基づき、前記第1音声認識手段及び前記第2音声認識手段による音声認識の実行を制御する第1制御手段をさらに有するようにしてもよい(請求項3記載の発明)。
さらに、前記音響辞書及び前記画像辞書は、ともに異なる車両状態で作成された2以上の辞書であって、前記第1スコア補正係数は、前記音響辞書毎の前記車両状態に基づく音響辞書信頼度を含み、前記第2スコア補正係数は、前記画像辞書毎に前記車両状態の基づく画像辞書信頼度を含むようにしてもよい(請求項4記載の発明)。これにより、その時点における各辞書毎の信頼度を考慮した音声認識を行うことができる。
さらにまた、前記音響辞書信頼度及び(又は)前記画像辞書信頼度に基づき、前記第1音声認識手段及び前記第2音声認識手段による音声認識の実行を制御する第2制御手段をさらに有していてもよい(請求項5記載の発明)。
また、本発明は、車両状態を検出する車両状態検出手段と、
話者が話す音声を第1音響入力部から入力し、1以上の音響辞書を参照しながら前記音声を認識して、前記音響辞書毎にそれぞれ1以上の音声認識結果と該音声認識結果に対応する信頼度スコアとを求める第1音声認識手段と、
前記第1音声認識手段と同様の構成であって、前記音声を第2音響入力部から入力して前記音声を認識する第2音声認識手段と、
前記車両状態検出手段により検出された前記車両状態に基づいて、前記第1音声認識手段の信頼度を示す第1スコア補正係数と前記第2音声認識手段の信頼度を示す第2スコア補正係数とを求める信頼度算出手段と、
前記第1音声認識手段により求められた信頼度スコアを前記第1スコア補正係数で補正するとともに前記第2音声認識手段により求められた信頼度スコアを前記第2スコア補正係数で補正して補正スコアを求めるスコア算出手段と、
同一の結果を示す前記音声認識結果毎に対応する前記補正スコアを集計して合計スコアとして求めるとともに、少なくとも前記合計スコアが最も高い値である音声認識結果を出力する結果出力手段と、
を有することを特徴とする(請求項6記載の発明)。
さらに、本発明は、車両状態を検出する車両状態検出手段と、
第1撮像部により話者の口元を撮像した画像を入力し、1以上の画像辞書を参照しながら前記話者が話す音声を認識して、前記画像辞書毎にそれぞれ1以上の音声認識結果と該音声認識結果に対応する信頼度スコアとを求める第1音声認識手段と、
前記第1音声認識部と同様の構成であって、第2撮像部により前記話者の口元を撮像した画像を入力して前記音声を認識する第2音声認識手段と、
前記車両状態検出手段により検出された前記車両状態に基づいて、前記第1音声認識手段の信頼度を示す第1スコア補正係数と前記第2音声認識手段の信頼度を示す第2スコア補正係数とを求める信頼度算出手段と、
前記第1音声認識手段により求められた信頼度スコアを前記第1スコア補正係数で補正するとともに前記第2音声認識手段により求められた信頼度スコアを前記第2スコア補正係数で補正して補正スコアを求めるスコア算出手段と、
同一の結果を示す前記音声認識結果毎に対応する前記補正スコアを集計して合計スコアとして求めるとともに、少なくとも前記合計スコアが最も高い値である音声認識結果を出力する結果出力手段と、
を有することを特徴とする(請求項7記載の発明)。
このような車両用音声認識装置を搭載している移動体では、車載電子機器に対する音声による操作を一層確実に行うことができる(請求項8記載の発明)。
上述したように、第1音声認識手段と第2音声認識手段で求められた複数の音声認識結果に対する各信頼度スコアを、車両状態に基づく第1スコア補正係数、第2スコア補正係数でそれぞれ補正するとともに、得られた補正スコアを集計した合計スコアを比較することにより、複数の音声認識結果のうち、その時点の車両状態における信頼度の高いものを選択することができる。これにより、対環境性能を向上させて車両状態に基づく環境変化の影響を受けにくくすることができ、より正確な音声認識が可能となる。
また、第1音声認識手段では音響入力部の音声信号に基づく音声認識処理を行う一方、第2音声認識手段では撮像部の画像信号に基づく音声認識処理を行うことにより相互補完的な作用を奏し、一層正確に音声認識を行うことができる。
さらに、車両の設計条件や車両用音声認識装置の利用形態等に応じて、第1音声認識手段及び第2音声認識手段の双方を音響入力部の音声信号に基づく音声認識処理を行うようにしてもよく、逆に双方を画像信号に基づく音声認識処理を行うようにしてもよい。
以下、本発明に係る車両用音声認識装置及び移動体について実施の形態を挙げ、添付の図1〜図10を参照しながら説明する。
図1に示すように、本実施の形態に係る車両用音声認識装置10は移動体としての車両12に搭載されており、搭乗者(話者)14の声を入力するマイク(音響入力部)20、口元を撮像するCCDカメラ(撮像部)22及び車内通信網18に接続されている。マイク20及びCCDカメラ22は、車内におけるルーフとフロントウィンドとの境界部近傍に設けられている。
マイク20及びCCDカメラ22は、これ以外の箇所(例えば、ルーフ下面部、インスツルメントパネル部、ヘッドレスト、搭乗者の肩部及びヘッドセット等)に設けられていてもよい。CCDカメラ22は搭乗者14の口元を直接的に撮像するものに限らず、ミラー、プリズム、レンズ等を介して撮像するようにしてもよく、また、MOS型カメラを用いてもよい。
車内通信網18にはエアコンコントローラ24、オーディオ26、ナビゲーションシステム28、エンジンコントローラ30、パネル操作部32、サンルーフコントローラ34及びパワーウィンドコントローラ36が接続されており、これらの各機器(車両状態検出手段)は車内通信網18によって相互にデータ通信が可能である。エアコンコントローラ24には日射センサ38と図示しない風量調節機構が設けられている。オーディオ26には図示しない音量調節機構及び音量認識部が設けられている。
ナビゲーションシステム28にはGPS(Global Positioning System)44又はジャイロセンサ等が接続されており、車両12の位置や座標情報を取得することができる。
エンジンコントローラ30はエンジン40の制御を行うものであって、車速センサ42により車両12の車速Vを検出することができる。また、エンジンコントローラ30は車速Vと図示しない舵角センサの信号とに基づいて車両12のヨーレートYを取得することができる。ヨーレートYは、ジャイロセンサ等の信号を参照しながら算出するようにしてもよい。また、エンジンコントローラ30は、車速V及びエンジン回転数等に基づいて平均振動Fを算出することができる。
パネル操作部32は、搭乗者14が操作するスイッチ等が設けられており、例えばワイパ速度Wを制御するとともに、このワイパ速度Wを車内通信網18に供給する。パワーウィンドコントローラ36は操作スイッチの状態に応じてウィンドを昇降させることができ、他の機器からの要求に従ってその時点におけるウィンド開度Oを車内通信網18に供給する。
図2に示すように、車両用音声認識装置10は、搭乗者14が話す音声をマイク20から入力してデジタルデータに変換するA/D変換部46と、変換されたデジタルデータを周波数分析する第1周波数分析部48と、音響パターン認識部(第1音声認識手段)50とを有する。また、車両用音声認識装置10は、CCDカメラ22で撮像された搭乗者14の口元の画像(動画)を周波数分析する第2周波数分析部52と、画像パターン認識部(第2音声認識手段)54とを有する。
第1周波数分析部48及び第2周波数分析部52は、入力されたデータを周波数分析し、音響パターン認識部50及び画像パターン認識部54の解析用データを得る。
また、車両用音声認識装置10は、異なる車両状態で作成された5個の音響辞書56a、56b、56c、56d及び56eが格納される音響辞書格納部58と、各音響辞書56に基づいて作成される音響認識テーブル60と、異なる車両状態で作成された3個の画像辞書62a、62b及び62cが格納される画像辞書格納部64と、各画像辞書62a〜62cに基づいて作成される画像認識テーブル66と、車両状態を判断して車両用音声認識装置10を統合的に制御する環境評価部70と、該環境評価部70からアクセスされる一時記憶部72と、該一時記憶部72等を参照しながら最終的な音声認識の候補の順位付けを行う最終結果演算部74と、順位付けが行われた音声データが最終結果テーブル76として格納される最終結果格納部78とを有する。音響辞書及び画像辞書は、5個及び3個に限らず設計条件に基づいて適切な個数が設けられていればよい。
図3に示すように、音響認識テーブル60は、前記の音響辞書56a、56b、56c、56d及び56eに対応した群からなるテーブルであって、それぞれ辞書環境値欄60a、辞書信頼度欄60b、認識結果テキスト欄60c、信頼度スコア欄60d、及び1次補正スコア欄60eを有する。
辞書環境値欄60aには各音響辞書56a〜56eが作成された環境のモデル条件値が記録されており、具体的には、車速モデル値Vm1、エアコン風量モデル値Tm1、ワイパ速度モデル値Wm1、ウィンド開度モデル値Om1、及びオーディオ音量モデル値Am1が記録されている。
辞書信頼度欄60bは、各音響辞書56a〜56eのその時点における音響辞書信頼度(第1スコア補正係数)Qm11、Qm12、Qm13、Qm14及びQm15を車両状態に基づいて求めて記録する欄である。
認識結果テキスト欄60cは、音響パターン認識部50が各音響辞書56a〜56eを参照しながら認識した音声である認識結果テキスト(音声認識結果)を信頼度スコアの順に3つを上方の行から記録する欄である。設計条件により、認識結果テキストは4つ以上記録できるようにしてもよい。
音響パターン認識部50が音響辞書56a〜56eから相関の高い認識結果テキストとしてのデータを選択するための手段は、例えば、パターンマッチング手法や統計的な手法を用いることができる。統計的手法としては、確率的な有限状態を持つ隠れマルコフモデル(Hidden Markov Model)の手法を挙げることができる。隠れマルコフモデルでは、音声モデルの学習を行うことにより音声を高確率で認識可能である。この際、各認識結果テキスト毎の信頼度スコアが0〜100の値として求められ、該信頼度スコアの値が信頼度スコア欄60dに記録される。1次補正スコア欄60eは、各信頼度スコアに対して0〜1の値である音響入力信頼度(第1スコア補正係数)TP1を積算した2次スコアが記録される欄である。音響入力信頼度TP1は、マイク20から入力される音響信号の信頼度を車両状態に基づいて設定する値であり、後述する(1)式で求められる。
なお、各音響辞書56a〜56毎に適当な認識結果テキストが3つ得られない場合には、対応する認識結果テキスト欄60cには得られなかった数に応じて「候補無」が記録され、信頼度スコア欄60d及び1次補正スコア欄60eは空欄となる。
図4に示すように、画像認識テーブル66は図3の音響認識テーブル60と同じ書式のテーブルであって、前記の画像辞書62a、62b及び62cに対応した群からなり、それぞれ辞書環境値欄66a、辞書信頼度欄66b、認識結果テキスト欄66c、信頼度スコア欄66d、及び1次補正スコア欄66eを有する。
辞書環境値欄66aには各画像辞書62a〜62cが作成された環境のモデル条件値が記録されており、具体的には、対象面平均明度モデル値Lm1、及び平均振動モデル値Fm1が記録されている。
辞書信頼度欄66bは、各画像辞書62a〜62cのその時点における画像辞書信頼度(第2スコア補正係数)Qm21、Qm22、及びQm23を車両状態に基づいて求めて記録する欄である。
認識結果テキスト欄66cは、画像パターン認識部54が各画像辞書62a〜62cを参照しながら画像に基づいて認識した音声である認識結果テキストを信頼度スコアの順に3つを上方の行から記録する欄である。画像パターン認識部54は、音響パターン認識部50と同様に、前記隠れマルコフモデル等の手法に基づいて音声認識を行うことができる。信頼度スコア欄66dには、前記の信頼度スコア欄60dと同様に、各認識結果テキスト毎の信頼度スコアが0〜100の値として記録される。1次補正スコア欄66eは、各信頼度スコアに対して0〜1の値である画像入力信頼度(第2スコア補正係数)TP2を積算した2次スコアが記録される欄である。画像入力信頼度TP2は、CCDカメラ22から入力される画像信号の信頼度を車両状態に基づいて設定する値であり、後述する(2)式で求められる。
図2に戻り、環境評価部70は、前記の車内通信網18に接続されており、エアコンコントローラ24、オーディオ26、ナビゲーションシステム28及びエンジンコントローラ30等を介して車両状態としての車速V、エアコン風量T、ヨーレートY、オーディオ音量A、位置及び座標情報、ワイパ速度W、ウィンド開度O、サンルーフ開度S、日射センサ38による明るさ信号L及び平均振動F等を取得することができる。車両状態を示す信号としては、これら以外に加速度、ロール、ピッチ等の動的挙動状態の信号、温度、湿度、気圧等の空気状態の信号等の信号を挙げることができる。
一時記憶部72は、取得した車両状態を示す各信号を記憶する実環境値記憶部82と、前記の音響入力信頼度TP1及び画像入力信頼度TP2を記録するパターン信頼度記録部84と、音響認識テーブル60の1次補正スコアに対して音響入力信頼度TP1を積算した2次補正スコアを記録するための実環境音響認識スコアテーブル86と、画像認識テーブル66の1次補正スコアに対して画像入力信頼度TP2を積算した2次補正スコアを記録するための実環境画像認識スコアテーブル88とを有する。この2次補正スコアは、車両状態が反映された実環境スコアともいうことができる。
図5及び図6に示すように、実環境音響認識スコアテーブル86及び実環境画像認識スコアテーブル88は、図3及び図4の音響認識テーブル60及び画像認識テーブル66とほぼ同じ書式のテーブルであって、認識結果テキスト欄86a及び88aを有するとともに、前記の信頼度スコア欄60d及び1次補正スコア欄60eに代わって、各認識結果テキストに対応する2次補正スコアが記録される2次補正スコア欄86b及び88bが設けられている。
説明の便宜上、音響認識テーブル60、画像認識テーブル66、実環境音響認識スコアテーブル86及び実環境画像認識スコアテーブル88は理解しやすいような表形式で示しているが、実際には音響パターン認識部50、画像パターン認識部54及び環境評価部70がアクセス可能なマップ形式等で設けられていればよい。
次に、このように構成される車両用音声認識装置10を用いて搭乗者14が話す音声を認識する手順について説明する。
図7のステップS1において、環境評価部70は、各種のセンサの信号を読み取るとともに、所定のパラメータの算出を行う。つまり、前記のとおり車速V、エアコン風量T、ヨーレートY、オーディオ音量A、位置及び座標情報、ワイパ速度W、ウィンド開度O、サンルーフ開度S、日射センサ38による明るさ信号L及び平均振動F等の信号を取得する。取得した車速V、エアコン風量T、ワイパ速度W、ウィンド開度O、オーディオ音量A、明るさL及び平均振動Fについては、0〜100の範囲となるようにスケール調整やリミット処理を行った後に実環境値記憶部82に記録する。
この時点において、各信号の値はV=55、T=20、W=0、O=0、A=20、L=55及びF=20であるものとする。
ステップS2において、環境評価部70は、実環境値記憶部82に記録された各センサ信号に基づいて音響入力信頼度TP1及び画像入力信頼度TP2を次の(1)式及び(2)式に基づいて求める。
TP1 = 1−(V+T+W+O+A)/(100×Pa) …(1)
TP2 = 1−TP1 …(2)
ここで、パラメータPaは音響信号に影響を与える信号(つまり、V、T、W、O及びA)の数であり、Pa=5である。この(1)式及び(2)式に上記の信号の値を代入することにより、TP1=0.81、TP2=0.19を得る。
音響入力信頼度TP1及び画像入力信頼度TP2は、0〜1の値をとることは(1)式及び(2)式から明らかである。また、(2)式から、TP1+TP2=1となり、音響入力信頼度TP1及び画像入力信頼度TP2が双方とも著しく低い値となることが防止され、音響パターン認識部50か画像パターン認識部54の少なくとも一方を有効に作用させることができる。
また、画像入力信頼度TP2は、(1)式と類似の方法で、TP2=1−(L+F)/(100×2)として求めてもよい。
ステップS3において、環境評価部70は、実環境値記憶部82に記録された各センサ信号に基づいて音響辞書信頼度Qm11〜Qm15及び画像辞書信頼度Qm21〜Qm23を次の(3)式及び(4)式に基づいて求める。
Figure 2006030908
Figure 2006030908
ここで、添え字Nは音響辞書56a〜56e及び画像辞書62a〜62cを識別する番号であり、(3)式については、N=1〜5、(4)式については、N=1〜3である。また、パラメータPbは画像信号に影響を与える信号(つまり、L及びF)の数であり、Pb=2である。パラメータPaは前記の通り、Pa=5である。パラメータCは車両12に固有の1.0以上の調整値である車両係数であって、ここではC=1.2であるものとする。
(3)式では、各音響辞書56a〜56eが作成された環境のモデル条件値と、その時点の車両状態を示す信号との差の絶対値を各信号毎に求めて加算しており、モデル条件値との一致度が高いほど1.0に近づき、一致度が低いほど0.0に近づくように調整されている。車両状態を示す信号とモデル条件値との一致度が高い場合、それだけその音響辞書が作成された状態に近いこととなり、その音響辞書の信頼度は高い。従って、音響辞書信頼度Qm11〜Qm15の値が高く、1.0に近いほど、対応する音響辞書56a〜56eの信頼度が高いといえる。また、(4)式についても同様であって、画像辞書信頼度Qm21〜Qm23の値が1.0に近いほど、対応する画像辞書62a〜62cの信頼度が高い。
さらに、車両係数Cの値を調整することにより、異なる車両12に対しても好適に適用可能となる。
(3)式によれば、上記の各パラメータを代入することにより、Qm11=0.73、Qm12=0.74、Qm13=0.76、Qm14=0.67、及びQm15=0.68が得られ、これらの値を音響認識テーブル60の辞書信頼度欄60bに記録する(図3参照)。また、(4)式によれば、Qm21=0.73、Qm22=0.90、及びQm23=0.92が得られ、これらの値を画像認識テーブル66の辞書信頼度欄66bに記録する(図4参照)。
ステップS4において、環境評価部70は、音響パターン認識部50及び画像パターン認識部54に対して音声認識の処理を開始するように指示を行う。ただし、音響入力信頼度TP1が著しく小さい値である場合には、音響パターン認識部50に対して処理を中止させ、画像入力信頼度TP2が著しく小さい値である場合には画像パターン認識部54に対して処理を中止させる(第1制御手段)。このように、音響入力信頼度TP1及び画像入力信頼度TP2の値に応じて、信頼度が低い方の処理を中止させることにより演算量の低減を図ることができる。また、前記(2)式の構成から、音響入力信頼度TP1及び画像入力信頼度TP2が双方とも著しく低い値となることがなく、音響パターン認識部50及び画像パターン認識部54の少なくとも一方は音声認識処理を実行する。さらに、音響入力信頼度TP1が略1.0である場合には音響パターン認識部50の信頼度が極めて高いため、この音響パターン認識部50のみを実行させれば充分である。このとき、(2)式の構成から画像入力信頼度TP2が略0となり、画像パターン認識部54の処理を中止させることができる。
環境評価部70からの音声認識の処理開始指示を受けて、音響パターン認識部50はステップS5及びS6の処理を行い、画像パターン認識部54はこれと同時並列的にステップS7及びS8の処理を行う。
ステップS5において、音響パターン認識部50は、搭乗者14が話す音声をマイク20を介して入力し、A/D変換部46及び第1周波数分析部48で変換されたデータから音声の特徴抽出を行う。
ステップS6において、前記の隠れマルコフモデルの手法により、前記ステップS5で抽出されたデータと相関の高いデータを各音響辞書56a〜56eから認識結果テキストとして3つずつ選択する。このとき、データの信頼度を示す信頼度スコアを各データ毎に求める。求められた認識結果テキスト及び信頼度スコアは、音響認識テーブル60の認識結果テキスト欄60c及び信頼度スコア欄60dにそれぞれ記録する。なお、3つ求めた認識結果テキストのうち信頼度スコアが著しく小さいものは除外して、認識結果テキスト欄60cに「候補無」と記録する。
一方、ステップS7において、画像パターン認識部54は、搭乗者14が話す際の口元の動きをCCDカメラ22で撮像した画像データを第2周波数分析部52で変換し、変換されたデータから音声の特徴抽出を行う。
ステップS8においては、前記ステップS6と同様に、前記ステップS7で抽出されたデータと相関の高いデータを各画像辞書62a〜62cから認識結果テキストとして3つずつ選択するとともに、信頼度スコアを各データ毎に求める。求められた認識結果テキスト及び信頼度スコアは、画像認識テーブル66の認識結果テキスト欄66c及び信頼度スコア欄66dにそれぞれ記録する。
このようなステップS5、S6の処理及びステップS7、S8の処理により、音響辞書56aに基づいて候補順に「浦賀」、「浦和」、及び「石和」の3つの認識結果テキストが得られ、各信頼度スコアは70、59及び30であって、これらの値が音響認識テーブル60に記録されるものとする(図3参照)。また、画像辞書62aに基づいて、候補順に「浦賀」、「浦和」、及び「浦安」の3つの認識結果テキストが得られ、各信頼度スコアは80、42及び12であって、これらの値が画像認識テーブル66に記録されるものとする(図4参照)。他の音響辞書56b〜56e及び画像辞書62b、62cについても、図3及び図4に示すように、「浦賀」、「浦和」、「石和」、「柏」、「浦安」及び「上田」が認識結果テキストとして得られ、図示するような信頼度スコアがそれぞれ得られるものとする。
なお、音響パターン認識部50及び画像パターン認識部54は、音響辞書信頼度Qm11〜Qm15及び画像辞書信頼度Qm21〜Qm23の値を参照して、著しく小さい値のものがある場合には、対応する辞書に対する音声認識処理を省略してもよい(第2制御手段)。
ステップS6及びステップS8の処理が終了した後、ステップS9において、環境評価部70は、音響認識テーブル60の信頼度スコア欄60d(図3参照)に記録された各信頼度スコアに対して音響入力信頼度TP1をそれぞれ積算して1次補正スコア欄60eに記録する。同様に、画像認識テーブル66の信頼度スコア欄66d(図4参照)に記録された各信頼度スコアに対して画像入力信頼度TP2をそれぞれ積算して1次補正スコア欄66eに記録する。
例えば、図3に示すように、音響辞書56aの第1の候補である「浦賀」については、信頼度スコアが「70」であって、前記のとおり音響入力信頼度TP1は、TP1=0.81であることから、対応する1次補正スコア欄60eには、「57」(57=70×0.81)が記録される。また、図4に示すように、画像辞書62aの第1の候補である「浦賀」については、信頼度スコアが「80」であって、前記のとおり画像入力信頼度TP2は、TP2=0.19であることから、対応する1次補正スコア欄66eには、「15」(15=80×0.19)が記録される。
ステップS10において、環境評価部70は、音響認識テーブル60の1次補正スコア欄60e(図3参照)に記録された各1次補正スコアに対して、対応する音響辞書信頼度Qm11〜Qm15をそれぞれ積算して、一時記憶部72における実環境音響認識スコアテーブル86(図5参照)の2次補正スコア欄86bにそれぞれ記録する。同様に、画像認識テーブル66の1次補正スコア欄66e(図4参照)に記録された各1次補正スコアに対して、対応する画像辞書信頼度Qm21〜Qm23をそれぞれ積算して、実環境画像認識スコアテーブル88(図5参照)の2次補正スコア欄88bにそれぞれ記録する。
例えば、図3に示すように、音響辞書56aの第1の候補である「浦賀」については、1次補正スコアが「57」であって、前記のとおり音響辞書信頼度Qm11は、Qm11=0.73であることから、対応する2次補正スコア欄88bには、「42」(42=57×0.73)が記録される(図5参照)。また、音響辞書56bの第1の候補である「柏」については、1次補正スコアが「43」であって、音響辞書信頼度Qm12は、Qm12=0.74であることから、対応する2次補正スコア欄88bには、「32」(32=43×0.74)が記録される(図5参照)。
ステップS11において、最終結果演算部74は、一時記憶部72の実環境音響認識スコアテーブル86及び実環境画像認識スコアテーブル88を参照して、認識結果テキスト欄86a及び88aに記録されている認識結果テキストを全て抽出するとともに、同一の結果を示す認識結果テキスト毎に対応する2次補正スコアを集計して合計スコアとして求める。抽出及び集計された認識結果テキストは、図8に示すように、最終結果テーブル76に合計スコアの高い順に記録される。
例えば、「浦和」については、図5及び図6に示すように、音響辞書56a、56c、56d及び画像辞書62a、62cに基づいて抽出されており、各2次補正スコアは35、34、20、6及び5である。従って、図8に示すように、「浦和」についての合計スコアはこれらを加算した値である「103」であり、これは最高値となることから、最終結果テーブル76の最上段に記録される。このように、「浦和」は合計スコアが最高値となり信頼度が最も高いこととなる。以下、合計スコアの順に「浦賀」、「浦安」、「柏」、「石和」及び「上田」が記録されることになる。
ところで、音響辞書信頼度Qm11〜Qm15及び画像辞書信頼度Qm21〜Qm23のうち、最も値が高いのは画像辞書信頼度Qm23の「0.92」であるが(図4参照)、画像辞書信頼度Qm23に対応する画像辞書62cに基づく認識結果テキストでは、最終的に最高値の合計スコアを得た「浦和」は2番目に挙げられた候補に過ぎない。つまり、単に辞書の信頼度のみに基づいて1つの辞書を選択したのでは、「浦和」は1番の候補としては選択されないことが諒解される。また、当初の信頼度スコアが最も高いのは、画像辞書62bに基づいて選択された「浦賀」の「90」であり(図4参照)、信頼度スコアにのみ基づいた選択を行ったのでは「浦和」は一番の候補としては選択されない。
これに対して、本実施の形態に係る車両用音声認識装置10では、複数の辞書に基づく複数の認識結果テキストを統合的に判断し、車両状態に基づいて信頼度スコアを補正し、合計することにより、本来の信頼度が最も高いものを一番の候補として選択することができる。
ステップS12において、最終結果格納部78は、他の機器からの要求に応じて最終結果テーブル76に格納された認識結果テキストを車内通信網18を通じて、合計スコアの高い順に供給する。これにより、例えば、ナビゲーションシステム28では搭乗者14が目的地として指定した場所を示す音声を高い認識率で確認し、ナビゲーションの処理を行うことができる。また、ナビゲーションシステム28では、受信した認識結果テキストに対して所定の条件やルールに基づく適性判断を行い、合計スコアを考慮しながら最適な認識結果テキストを選択するようにしてもよい。
上述したように、本実施の形態に係る車両用音声認識装置10は、音声のパターン認識部として対環境性の異なる音響パターン認識部50と画像パターン認識部54の2つのをもち、環境評価部70及び最終結果演算部74の処理により、認識結果テキスト毎の信頼度スコアを車両状態に基づく係数で補正するとともに集計する。これにより、対環境性能が向上し、車両状態に基づく環境変化の影響を受けにくく、より正確な音声認識を行うことができる。
また、搭載される車種による騒音のレベルや日の当たり方の違いに応じて音響辞書56及び画像辞書62をセッティングする必要がなく、車両用音声認識装置10の汎用性が向上する。
上記の説明では、当初求められた信頼度スコアに対して、先ず音響入力信頼度TP1又は画像入力信頼度TP2を積算して1次スコアを求め、次に音響辞書信頼度Qm11〜Qm15又は画像辞書信頼度Qm21〜Qm23を積算して2次補正スコアを求めるものとしたが、この積算の順序は逆であってもよい。また、あらかじめ音響辞書信頼度Qm11〜Qm15に音響入力信頼度TP1を積算した第1スコア補正係数と、画像辞書信頼度Qm21〜Qm23に画像入力信頼度TP2を積算した第2スコア補正係数とを求めておき、音響パターン認識部50により求められた信頼度スコアに第1スコア補正係数を積算する一方、画像パターン認識部54により求められた信頼度スコアに第2スコア補正係数を積算して、それぞれ1回の演算により2次補正スコアを求めるようにしてもよい。
さらに、信頼度スコアから2次補正スコアを求める演算方法は、信頼度スコアに対して第1スコア補正係数又は第2スコア補正係数を単純に積算するという方法に限らず、車両状態が反映されるように補正する演算方法であればよく、例えば、信頼度スコアと第1スコア補正係数又は第2スコア補正係数により2次補正スコアが特定されるマップを参照する方法や、実験式等に代入して求める方法であってもよい。
次に、前記車両用音声認識装置10に対する第1の変形例に係る車両用音声認識装置10a及び第2の変形例に係る車両用音声認識装置10bについて説明する。以下の説明では、車両用音声認識装置10と同じ箇所については同符号を付し、その詳細な説明を省略する。
図9に示すように、第1の変形例に係る車両用音声認識装置10aは、前記のマイク20に相当する第1マイク20aの他に、第2マイク20bを備えるとともに、前記の音響パターン認識部50、音響辞書格納部58及び音響認識テーブル60に相当する第1音響パターン認識部50a、第1音響辞書格納部58a及び第1音響認識テーブル61aを備える。また、車両用音声認識装置10aは、前記の画像パターン認識部54、画像辞書格納部64及び画像認識テーブル66に代えて、第2音響パターン認識部50b、第2音響辞書格納部58b及び第2音響認識テーブル61bを備える。
第1音響辞書格納部58aには、車両状態及び第1マイク20aに対応した複数の音響辞書が格納されており、第2音響辞書格納部58bには、車両状態及び第2マイク20bに対応した複数の音響辞書が格納されている。
第1音響パターン認識部50a及び第2音響パターン認識部50bは、前記音響パターン認識部50と同様の作用を奏し、取得した車両状態に基づいて第1音響辞書格納部58a及び第2音響辞書格納部58bに格納された音響辞書を参照しながら第1音響認識テーブル61a及び第2音響認識テーブル61bを作成する。
環境評価部70は、第1音響認識テーブル61a及び第2音響認識テーブル61bから2次補正スコアを求めて1つの実環境音響認識スコアテーブル86を作成する。最終結果演算部74は、求められた2次補正スコアを集計して最終結果テーブル76を作成する。
このように、独立的な第1音響パターン認識部50a及び第2音響パターン認識部50bを設けることにより、第1マイク20a及び第2マイク20bに個別に対応した音声認識を行うことができ、音声認識の認識率を向上させることができる。この場合、第1マイク20aと第2マイク20bは、運転席付近と助手席付近というように車両12内の異なる場所に配置し、運転者の音声と搭乗者の音声とを入力するようにしてもよい。また、車両用音声認識装置10aは、音声の入力手段として、第1マイク20aや第2マイク20bと比較して高価なCCDカメラ22を用いることがなく、簡便且つ廉価に構成することができる。
次に、図10に示すように、第2の変形例に係る車両用音声認識装置10bは、前記のCCDカメラ22に相当する第1CCDカメラ22aの他に、第2CCDカメラ22bを備えるとともに、前記の画像パターン認識部54、画像辞書格納部64及び画像認識テーブル66に相当する第1画像パターン認識部54a、第1画像辞書格納部64a及び第1画像認識テーブル67aを備える。また、車両用音声認識装置10bは、前記の音響パターン認識部50、音響辞書格納部58及び音響認識テーブル60に代えて、第2画像パターン認識部54b、第2画像辞書格納部64b及び第2画像認識テーブル67bを備える。
第1画像辞書格納部64aには、車両状態及び第1CCDカメラ22aに対応した複数の画像辞書が格納されており、第2画像辞書格納部64bには、車両状態及び第2CCDカメラ22bに対応した複数の音響辞書が格納されている。車両用音声認識装置10bの動作は、前記車両用音声認識装置10aにおける音響に対する処理を画像に対する処理に変えたものとして理解されよう。
このような、車両用音声認識装置10bでは、独立的な第1画像パターン認識部54a及び第2画像パターン認識部54bを設けることにより、第1CCDカメラ22a及び第2CCDカメラ22bに個別に対応して、画像に基づく音声認識を行うことができ、音声認識の認識率を向上させることができる。この場合、第1CCDカメラ22aと第2CCDカメラ22bは、異なる位置から(例えば、左右方向から)搭乗者14の口元を撮像するようにしてもよい。これにより、日の当たり方(例えば、逆光)により一方の画像が不鮮明であっても、他方の画像が鮮明となって、音声認識が適切に行われる可能性が高まる。
このような車両用音声認識装置10bは、音声信号の認識部を用いることがないため、例えば、工事現場等の騒音が極めて大きい場所で使用される特殊車両等に対して好適に適用可能である。
本発明に係る車両用音声認識装置及び移動体は、上述の実施の形態に限らず、本発明の要旨を逸脱することなく、種々の構成を採り得ることはもちろんである。
車両用音声認識装置が搭載された車両のブロック構成図である。 本実施の形態に係る車両用音声認識装置のブロック構成図である。 音響辞書に基づいて作成される音響認識テーブルの内容を示す図である。 画像辞書に基づいて作成される画像認識テーブルの内容を示す図である。 2次補正スコアを記録するための実環境音響認識スコアテーブルの内容を示す図である。 2次補正スコアを記録するための実環境画像認識スコアテーブルの内容を示す図である。 車両用音声認識装置における処理の手順を示すフローチャートである。 最終結果テーブルの内容を示す図である。 第1の変形例に係る車両用音声認識装置のブロック構成図である。 第2の変形例に係る車両用音声認識装置のブロック構成図である。
符号の説明
10、10a、10b…車両用音声認識装置
12…車両 14…搭乗者
20、20a、20b…マイク
22、22a、22b…CCDカメラ
24…エアコンコントローラ 26…オーディオ
28…ナビゲーションシステム 30…エンジンコントローラ
32…パネル操作部 34…サンルーフコントローラ
36…パワーウィンドコントローラ 42…車速センサ
50、50a、50b…音響パターン認識部
54、54a、54b…画像パターン認識部
56a〜56e…音響辞書
60、61a、61b…音響認識テーブル
60d、66d…信頼度スコア欄 60e、66e…1次補正スコア欄
62a〜62c…画像辞書
66、67a、67b…画像認識テーブル
70…環境評価部 74…最終結果演算部
76…最終結果テーブル 86b、88b…2次補正スコア欄
A…オーディオ音量 F…平均振動
L…明るさ信号 O…ウィンド開度
Qm11〜Qm15…音響辞書信頼度
Qm21〜Qm23…画像辞書信頼度
S…サンルーフ開度 T…エアコン風量
TP1…音響入力信頼度 TP2…画像入力信頼度
V…車速 W…ワイパ速度
Y…ヨーレート

Claims (8)

  1. 車両状態を検出する車両状態検出手段と、
    話者が話す音声を音響入力部から入力し、1以上の音響辞書を参照しながら前記音声を認識して、前記音響辞書毎にそれぞれ1以上の音声認識結果と該音声認識結果に対応する信頼度スコアとを求める第1音声認識手段と、
    撮像部により前記話者の口元を撮像した画像を入力し、1以上の画像辞書を参照しながら前記音声を認識して、前記画像辞書毎にそれぞれ1以上の音声認識結果と該音声認識結果に対応する信頼度スコアとを求める第2音声認識手段と、
    前記車両状態検出手段により検出された前記車両状態に基づいて、前記第1音声認識手段の信頼度を示す第1スコア補正係数と前記第2音声認識手段の信頼度を示す第2スコア補正係数とを求める信頼度算出手段と、
    前記第1音声認識手段により求められた信頼度スコアを前記第1スコア補正係数で補正するとともに前記第2音声認識手段により求められた信頼度スコアを前記第2スコア補正係数で補正して補正スコアを求めるスコア算出手段と、
    同一の結果を示す前記音声認識結果毎に対応する前記補正スコアを集計して合計スコアとして求めるとともに、少なくとも前記合計スコアが最も高い値である音声認識結果を出力する結果出力手段と、
    を有することを特徴とする車両用音声認識装置。
  2. 請求項1記載の車両用音声認識装置において、
    前記第1スコア補正係数は、前記音響入力部から入力される信号に対する前記車両状態に基づく音響入力信頼度を含み、前記第2スコア補正係数は、前記撮像部により撮像される前記画像に対する前記車両状態に基づく画像入力信頼度を含むことを特徴とする車両用音声認識装置。
  3. 請求項2記載の車両用音声認識装置において、
    前記音響入力信頼度及び(又は)前記画像入力信頼度に基づき、前記第1音声認識手段及び前記第2音声認識手段による音声認識の実行を制御する第1制御手段をさらに有することを特徴とする車両用音声認識装置。
  4. 請求項1〜3のいずれか1項に記載の車両用音声認識装置において、
    前記音響辞書及び前記画像辞書は、ともに異なる車両状態で作成された2以上の辞書であって、
    前記第1スコア補正係数は、前記音響辞書毎の前記車両状態に基づく音響辞書信頼度を含み、前記第2スコア補正係数は、前記画像辞書毎に前記車両状態の基づく画像辞書信頼度を含むことを特徴とする車両用音声認識装置。
  5. 請求項4記載の車両用音声認識装置において、
    前記音響辞書信頼度及び(又は)前記画像辞書信頼度に基づき、前記第1音声認識手段及び前記第2音声認識手段による音声認識の実行を制御する第2制御手段をさらに有することを特徴とする車両用音声認識装置。
  6. 車両状態を検出する車両状態検出手段と、
    話者が話す音声を第1音響入力部から入力し、1以上の音響辞書を参照しながら前記音声を認識して、前記音響辞書毎にそれぞれ1以上の音声認識結果と該音声認識結果に対応する信頼度スコアとを求める第1音声認識手段と、
    前記第1音声認識手段と同様の構成であって、前記音声を第2音響入力部から入力して前記音声を認識する第2音声認識手段と、
    前記車両状態検出手段により検出された前記車両状態に基づいて、前記第1音声認識手段の信頼度を示す第1スコア補正係数と前記第2音声認識手段の信頼度を示す第2スコア補正係数とを求める信頼度算出手段と、
    前記第1音声認識手段により求められた信頼度スコアを前記第1スコア補正係数で補正するとともに前記第2音声認識手段により求められた信頼度スコアを前記第2スコア補正係数で補正して補正スコアを求めるスコア算出手段と、
    同一の結果を示す前記音声認識結果毎に対応する前記補正スコアを集計して合計スコアとして求めるとともに、少なくとも前記合計スコアが最も高い値である音声認識結果を出力する結果出力手段と、
    を有することを特徴とする車両用音声認識装置。
  7. 車両状態を検出する車両状態検出手段と、
    第1撮像部により話者の口元を撮像した画像を入力し、1以上の画像辞書を参照しながら前記話者が話す音声を認識して、前記画像辞書毎にそれぞれ1以上の音声認識結果と該音声認識結果に対応する信頼度スコアとを求める第1音声認識手段と、
    前記第1音声認識部と同様の構成であって、第2撮像部により前記話者の口元を撮像した画像を入力して前記音声を認識する第2音声認識手段と、
    前記車両状態検出手段により検出された前記車両状態に基づいて、前記第1音声認識手段の信頼度を示す第1スコア補正係数と前記第2音声認識手段の信頼度を示す第2スコア補正係数とを求める信頼度算出手段と、
    前記第1音声認識手段により求められた信頼度スコアを前記第1スコア補正係数で補正するとともに前記第2音声認識手段により求められた信頼度スコアを前記第2スコア補正係数で補正して補正スコアを求めるスコア算出手段と、
    同一の結果を示す前記音声認識結果毎に対応する前記補正スコアを集計して合計スコアとして求めるとともに、少なくとも前記合計スコアが最も高い値である音声認識結果を出力する結果出力手段と、
    を有することを特徴とする車両用音声認識装置。
  8. 請求項1〜7のいずれか1項に記載の車両用音声認識装置を搭載していることを特徴とする移動体。
JP2004213508A 2004-07-21 2004-07-21 車両用音声認識装置及び移動体 Pending JP2006030908A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004213508A JP2006030908A (ja) 2004-07-21 2004-07-21 車両用音声認識装置及び移動体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004213508A JP2006030908A (ja) 2004-07-21 2004-07-21 車両用音声認識装置及び移動体

Publications (1)

Publication Number Publication Date
JP2006030908A true JP2006030908A (ja) 2006-02-02

Family

ID=35897281

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004213508A Pending JP2006030908A (ja) 2004-07-21 2004-07-21 車両用音声認識装置及び移動体

Country Status (1)

Country Link
JP (1) JP2006030908A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241833A (ja) * 2006-03-10 2007-09-20 Kagoshima Univ 認識装置、認識システム、形状認識方法、プログラム及びコンピュータ読み取り可能な記録媒体
WO2010128560A1 (ja) * 2009-05-08 2010-11-11 パイオニア株式会社 音声認識装置、音声認識方法、及び音声認識プログラム
CN109342076A (zh) * 2018-09-20 2019-02-15 无锡吉兴汽车声学部件科技有限公司 整车声学十分制评价方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241833A (ja) * 2006-03-10 2007-09-20 Kagoshima Univ 認識装置、認識システム、形状認識方法、プログラム及びコンピュータ読み取り可能な記録媒体
WO2010128560A1 (ja) * 2009-05-08 2010-11-11 パイオニア株式会社 音声認識装置、音声認識方法、及び音声認識プログラム
CN109342076A (zh) * 2018-09-20 2019-02-15 无锡吉兴汽车声学部件科技有限公司 整车声学十分制评价方法

Similar Documents

Publication Publication Date Title
US9092394B2 (en) Depth based context identification
US6396954B1 (en) Apparatus and method for recognition and apparatus and method for learning
JP2006030447A (ja) 音声認識システムと該音声認識システムを備える移動体及び車両
US20040066941A1 (en) Directional setting apparatus, directional setting system, directional setting method and directional setting program
JP6604151B2 (ja) 音声認識制御システム
US20040215458A1 (en) Voice recognition apparatus, voice recognition method and program for voice recognition
JP6977004B2 (ja) 車載装置、発声を処理する方法およびプログラム
US9311930B2 (en) Audio based system and method for in-vehicle context classification
CN102324035A (zh) 口型辅助语音识别术在车载导航中应用的方法及系统
JP6466385B2 (ja) サービス提供装置、サービス提供方法およびサービス提供プログラム
JP2015509204A (ja) 直接的文法アクセス
JP2001083984A (ja) インタフェース装置
US10655981B2 (en) Method for updating parking area information in a navigation system and navigation system
KR20130046759A (ko) 차량에서 운전자 명령 인지장치 및 방법
JP4660592B2 (ja) カメラ制御装置、カメラ制御方法、カメラ制御プログラムおよび記録媒体
JP2006195302A (ja) 音声認識システム及びこの音声認識システムを備える車両
JP2006030908A (ja) 車両用音声認識装置及び移動体
JP2008046299A (ja) 音声認識装置
JP2006030880A (ja) 車両用音声認識装置及び移動体
JP2009098217A (ja) 音声認識装置、音声認識装置を備えたナビゲーション装置、音声認識方法、音声認識プログラム、および記録媒体
JP4661379B2 (ja) 車載音声認識装置
JP2006126342A (ja) 音声認識システム、この音声認識システムを備える移動体及び車両
KR20100062413A (ko) 텔레매틱스 장치를 위한 음성인식 장치 및 그 방법
KR101710695B1 (ko) 차량용 음성 인식을 위한 마이크로폰 제어 시스템 및 그 제어 방법
JP2019191477A (ja) 音声認識装置及び音声認識方法