JP4938719B2

JP4938719B2 - 車載情報システム

Info

Publication number: JP4938719B2
Application number: JP2008101885A
Authority: JP
Inventors: 雄介奥; 孝光鈴木; 卓司山田
Original assignee: Denso Corp; Toyota Motor Corp
Current assignee: Denso Corp; Toyota Motor Corp
Priority date: 2008-04-09
Filing date: 2008-04-09
Publication date: 2012-05-23
Anticipated expiration: 2028-04-09
Also published as: JP2009251470A

Description

本発明は、ユーザの発話の特徴を学習することにより音声認識の精度を向上させた車載情報システムに関する。

従来より、車載用のナビゲーション装置では音声入力における認識精度を向上させるために種々の工夫がなされている。

例えば、音声認識を行う際に誤認識が発生した場合に、複数回のやり直しを行った後においても誤認識が発生するときは、認識用のテンプレートを他のテンプレートに入れ替えて音声認識を再実行するナビゲーション装置が提案されている（例えば、特許文献１参照）。
特開２００２−１０８３８６号公報

ところで、上述のような従来のナビゲーション装置では、音声認識に用いるテンプレートは不特定多数のユーザを想定して作製されているため、他のテンプレートに入れ替えても、精度の向上には限界があった。

そこで、本発明は、個々のユーザの発話の特徴を学習することにより、音声認識精度の向上を図った車載情報システムを提供することを目的とする。

本発明の一局面の車載情報システムは、手動操作により指令を入力する第１入力手段と、音声を入力する第２入力手段と、前記第２入力手段に入力される音声を音声認識する音声認識手段と、前記第１入力手段に入力される指令の内容、又は前記音声認識手段によって音声認識される音声の意味内容に基づき、所定の情報を出力する情報処理手段と、音声の特徴を評価するための基準値と、音声データの意味内容を特定するための閾値とを前記指令の内容に対応する識別ＩＤに関連付けて格納する音声認識辞書と、前記第２入力手段に音声が入力された後の所定時間内に前記第１入力手段へ指令が入力されると、当該指令の内容を表すデータと、前記第２入力手段に入力される音声を表す音声データとに基づき、前記音声認識手段における認識手法を学習する学習手段とを含み、前記音声認識手段は、前記第２入力手段に入力される音声の特徴の評価値と前記音声認識辞書に格納された基準値との類似度を前記閾値と比較することによって当該音声の意味内容を認識するように構成されており、前記学習手段は、前記第１入力手段に入力された指令の内容に対応する識別ＩＤに関連付けて前記音声認識辞書に格納された前記基準値と、前記第２入力手段に入力される音声を表す音声データの評価値との類似度に基づいて、前記指令の内容に対応する識別ＩＤに関連付けて前記音声認識辞書に格納された前記閾値を変更することにより、前記音声認識手段における認識手法を学習する。

また、前記音声の特徴は、声紋、アクセント、ピッチ、又は発話内容の少なくともいずれか一つであってもよい。

また、前記第１入力手段はタッチパネル式表示手段、又は遠隔操作装置であってもよい。

前記情報処理手段は、ナビゲーション装置の演算処理手段に含まれてもよい。

本発明によれば、個々のユーザの発話の特徴を学習することにより、音声認識精度の向上を図った車載情報システムを提供できるという特有の効果が得られる。

以下、本発明の車載情報システムを適用した実施の形態について説明する。

図１は、本実施の形態の車載情報システムの構成を示す図である。この車載情報システムはナビゲーション装置１０であり、以下で説明する学習機能はナビゲーションＥＣＵ(Electronic Control Unit)１１によって実現される。

このナビゲーション装置１０は、ナビゲーションＥＣＵ１１に加えて、タッチパネル１２、現在位置検出部１３、方位検出部１４、ルート検索部１５、地図データベース１６、マイク１７、音声認識辞書１８、受信部１９、及び遠隔操作装置２０を備える。

ナビゲーションＥＣＵ１１は、図示しないバスを介してＣＰＵ(Central Processing Unit)、ＲＯＭ(Read Only Memory)、及びＲＡＭ(Random Access Memory)等からなるマイクロコンピュータを中心として構成される。

タッチパネル１２には、電子地図と自車両の位置のほか、ナビゲーション装置１０の所定の機能（例えば、ルート検索機能等）を実現するための入力スイッチが表示される。このタッチパネル１２は、手動操作により指令を入力する入力手段であり、例えば、液晶モニタとマトリクススイッチとを組み合わせたものであればよく、パネルに表示した入力スイッチが利用者に押圧されることにより、操作可能に構成されていればよい。

現在位置検出部１３は、衛星航法システム（ＧＰＳ：Global Positioning System）を利用して車両の現在位置及び走行速度等を計算するＧＰＳ受信装置で構成される。

方位検出部１４は、ジャイロコンパスで構成される。

ルート検索部１５は、利用者から指定された検索条件に重み付けを行うことにより、候補のルートの中から最適ルートを検索するように構成される。

また、地図データベース１６は、ナビゲーション装置に必要な電子地図を格納できればよく、例えば、ハードディスクで構成される。

マイク１７は、音声を入力する入力手段であり、入力された音声は、音声データに変換されてナビゲーションＥＣＵ１１に入力される。ナビゲーションＥＣＵ１１は、後述する音声認識機能により、音声データの意味内容を認識する。

音声認識辞書１８は、ナビゲーションＥＣＵ１１が音声認識機能を実行する際に利用される辞書であり、様々な音声の音声データの評価の基準となる基準値と、音声データを特定するための判定に用いる閾値と、その音声の意味内容を表す意味内容データとを関連付けて群データとして格納するデータベースであり、例えば、ハードディスクで構成される。なお、音声データを特定するための判定に用いる閾値については後述する。

受信部１９は、遠隔操作装置２０から送信される指令を受信する受信手段であり、遠隔操作装置２０に手動操作によって入力される指令を受信し、ナビゲーションＥＣＵ１１に伝送するように構成されている。

ナビゲーション装置１０は、利用者がタッチパネル１２又は遠隔装置２０を通じて手動操作による指令を入力できるとともに、マイク１７を通じて音声による指令を入力できるように構成されており、上述の検出部等（１３、１４、１５）によって検出される情報や地図データを用いて電子地図上における自車両の位置を表す位置データを導出することにより、利用者に所望の案内情報を提供できるように構成されていればよい。

本実施の形態では、ナビゲーションＥＣＵ１１は、利用者に所望の案内情報を提供するための案内機能に加えて、利用者の発話の特徴に基づいて音声認識機能における認識手法を学習する学習機能を有する。この学習機能については図２を用いて説明する。

図２は、本実施の形態の車載情報システムにおける音声認識手法の学習機能を示すブロック図である。

ナビゲーションＥＣＵ１１は、入力管理部２１、入力解析制御部２２、手動入力解析部２３、音声認識部２４、及び音声認識学習部２５を含む。なお、この図２は、ナビゲーションＥＣＵ１１が含む機能のうち、音声認識機能と認識手法の学習機能を実現するために必要なブロックだけを示すが、ナビゲーションＥＣＵ１１は、利用者に所望の案内情報を提供するための案内機能を実現するための他のブロックを含むものである。

入力管理部２１は、タッチパネル１２、マイク１７、又は遠隔操作装置２０に入力される指令の管理を行う。入力された指令は、入力解析制御部２２に伝送される。

入力解析制御部２２は、入力される指令を解析する機能を有し、入力管理部２１から入力される指令を手動入力解析部２３又は音声認識部２４に伝送する。タッチパネル１２及び遠隔装置２０から入力される指令は、手動入力解析部２３に伝送され、マイク１７から入力される指令は、音声データに変換されて音声認識部２４に伝送される。

また、この入力解析制御部２２は、入力管理部２１を介してマイク１７から指令が入力された場合には、その後の経過時間をカウントする。この場合において、所定時間以内に入力管理部２１を介してタッチパネル１２又は遠隔操作装置２０から指令が入力された場合には、その旨を表す信号を音声認識学習部２５に伝送する。なお、この所定時間は、例えば５秒間に設定される。

手動入力解析部２３は、タッチパネル１２及び遠隔装置２０から入力される指令を解析する。タッチパネル１２及び遠隔装置２０から入力される指令は、ナビゲーション装置１０を操作するための指令である。例えば、現在地を入力するために、タッチパネル１２又は遠隔装置２０の「現在地」ボタンが押された場合は、現在地を入力するモードを選択するための指令となる。手動入力解析部２３は、必要に応じてこの指令を音声認識学習部２５に伝送する。

音声認識部２４は、音声認識辞書１８を用いて、入力解析制御部２２から伝送される音声データの意味内容を認識する。この認識処理は、音声データに含まれる複数の認証子を評価することによって行われる。認証子は、声紋、アクセント、ピッチ、及び発話内容であり、これらのうち、声紋、アクセント、及びピッチは発話の特徴を表す。

また、この評価は、音声データの評価値（声紋評価値、アクセント評価値、ピッチ評価値、及び発話内容評価値）と、評価基準となるパラメータ（声紋用パラメータＰａ、アクセント用パラメータＰｂ、ピッチ用パラメータＰｃ、及び発話内容用パラメータＰｄ）との類似度を判定することによって行われる。これらのパラメータ（声紋用パラメータＰａ、アクセント用パラメータＰｂ、ピッチ用パラメータＰｃ、及び発話内容用パラメータＰｄ）の値（基準値）を表すデータは、音声認識辞書１８に格納されている。

声紋及び発話内容の評価は、例えば、隠れマルコフモデル（ＨＭＭ：Hidden Markov Model）を用いて、音声データに含まれる単語や音素の評価を行うことによって行われる。この評価には、評価基準として声紋用パラメータＰａ及び発話内容用パラメータＰｄが用いられる。

アクセントの評価は、音声データが表す声の高さの分布を用いて認証を行うことによって実現される。この評価には、評価基準としてアクセント用パラメータＰｂが用いられる。

また、ピッチの評価は、音声データが表す声の高さを用いて認証を行うことによって実現される。この評価には、評価基準としてピッチ用パラメータＰｃが用いられる。

類似度の判定は、各々の評価値（声紋評価値、アクセント評価値、ピッチ評価値、及び発話内容評価値）と、評価基準となるパラメータ（声紋用パラメータＰａ、アクセント用パラメータＰｂ、ピッチ用パラメータＰｃ、及び発話内容用パラメータＰｄ）の各々の値（基準値）との類似度が、声紋閾値Ｔａ、アクセント閾値Ｔｂ、ピッチ閾値Ｔｃ、及び発話内容閾値Ｔｄの各々の値以上であるか否かによって行われる。すべての類似度が閾値以上であれば類似していると判定され、いずれかの類似度が閾値未満であれば非類似と判定される。

図３は、本実施の形態の車載情報システムにおける音声認識辞書１８のデータ構造を示す図である。このように、音声認識辞書内には、様々な言葉毎に識別ＩＤ（Identification）が割り振られ、識別ＩＤ毎に、声紋閾値Ｔａ、アクセント閾値Ｔｂ、ピッチ閾値Ｔｃ、発話内容閾値Ｔｄ、及び意味内容ＩＤが関連付けられて格納されている。

なお、図３に示すデータは音声認識辞書１８に格納されているデータの一部であり、実際には様々な言葉のデータが格納されている。また、図３には示さないが識別ＩＤ毎に、その言葉についての平均的な評価基準となるパラメータ（声紋用パラメータＰａ、アクセント用パラメータＰｂ、ピッチ用パラメータＰｃ、及び発話内容用パラメータＰｄ）の値（基準値）を表すデータも格納されている。

例えば、識別ＩＤ「０００１」の言葉は、声紋閾値Ｔａが０．８、アクセント閾値Ｔｂが０．９、ピッチ閾値Ｔｃが０．７、及び発話内容閾値Ｔｄが０．７５で表される言葉であり、これらのパラメータを満たす言葉の意味は意味内容ＩＤが「Ｍ００００１」とされている。

ここで、意味内容ＩＤ「Ｍ００００１」に対応する意味内容データは「現在地」を表すこととすると、認識手法は次の通りである。

音声認識部２４は、声紋用パラメータＰａ、アクセント用パラメータＰｂ、ピッチ用パラメータＰｃ、及び発話内容用パラメータＰｄを用いて、音声データの評価値（声紋評価値、アクセント評価値、ピッチ評価値、及び発話内容評価値）との類似度を演算する。

音声認識部２４は、演算した声紋の類似度、アクセントの類似度、ピッチの類似度、及び発話内容の類似度のすべてが声紋閾値Ｔａ、アクセント閾値Ｔｂ、ピッチ閾値Ｔｃ、及び発話内容閾値Ｔｄの値以上である場合に、音声データと識別ＩＤ「０００１」の言葉が類似していると判定する。

音声認識部２４は、識別ＩＤ「０００１」に関連付けられた意味内容ＩＤ「Ｍ００００１」によって特定される意味内容を音声認識辞書１８から読み出す。これにより、音声データが表す意味内容が認識される。

具体的には、利用者がマイク１７に「げんざいち」という音声を入力した場合に、音声データの評価値（声紋評価値、アクセント評価値、ピッチ評価値、及び発話内容評価値）が様々な識別ＩＤの声紋用パラメータＰａ、アクセント用パラメータＰｂ、ピッチ用パラメータＰｃ、及び発話内容用パラメータＰｄと照合され、類似度が評価されることにより、識別ＩＤ「０００１」がヒットする。

これにより、音声認識部２４は、入力された音声データの意味内容は、意味内容ＩＤ「Ｍ００００１」によって表されると判定し、タッチパネル１２に「現在地」という言葉を表示する。このようにして、音声認識部２４によって音声データが「現在地」という意味内容を表すと認識されることになる。

ところが、声紋の類似度、アクセントの類似度、ピッチの類似度、又は発話内容の類似度のうちの少なくともいずれか一つが声紋閾値Ｔａ、アクセント閾値Ｔｂ、ピッチ閾値Ｔｃ、又は発話内容閾値Ｔｄに満たない場合は、音声データと類似する言葉は音声認識辞書１８から見つからず、利用者によってタッチパネル１２又は遠隔操作装置２０に入力がなされる場合が想定される。このように、タッチパネル１２又は遠隔操作装置２０に入力がなされた場合には、音声認識学習部２５によって次のように学習が行われる。

音声認識学習部２５は、マイク１７への音声の入力後の所定時間内にタッチパネル１２又は遠隔操作装置２０に入力があったことを表す信号が入力解析制御部２２から入力された場合に、音声認識部２４によって認識された意味内容と、タッチパネル１２又は遠隔操作装置２０に入力された指令の内容とに基づき、認識手法の学習を行う。

マイク１７への音声の入力後の所定時間内（５秒以内）にタッチパネル１２又は遠隔操作装置２０に入力があったことを表す信号が入力解析制御部２２から音声認識学習部２５に入力される場合は、音声認識が正しく行われなかったためにタッチパネル１２又は遠隔操作装置２０が操作された場合と想定される。

このため、本実施の形態のナビゲーション装置１０は、利用者の音声の特徴を学習することにより音声認識の精度の向上を図るべく、音声認識部２４によって認識された意味内容と、タッチパネル１２又は遠隔操作装置２０に入力された指令の内容との類似度に基づき、利用者の音声の特徴に合わせて声紋閾値Ｔａ、アクセント閾値Ｔｂ、ピッチ閾値Ｔｃ、又は発話内容閾値Ｔｄの値を変更する。

このように、利用者の音声の特徴に合わせていずれかの閾値を変更することにより、音声認識処理における評価基準が変更されるので、変更前は正しく音声認識されなかった利用者の発話が正しく音声認識されるようになり、音声認識の精度の向上を図ることができる。

ここで、利用者が「げんざいち」という音声をマイク１７に入力した場合に、音声データのアクセントを表す評価値が「現在地」という単語のアクセントパラメータＰｂと類似していると判定されずに音声認識が正しく行われなかった場合を具体例として説明する。

この場合、音声の入力後５秒以内に利用者によってタッチパネル１２の「現在地」ボタンが押されると、音声認識学習部２５は、タッチパネル１２に入力された指令が表す言葉を特定する声紋閾値Ｔａ、アクセント閾値Ｔｂ、ピッチ閾値Ｔｃ、及び発話内容閾値Ｔｄの値を音声認識辞書１８から読み出す。

音声認識学習部２５は、読み出した閾値（Ｔａ〜Ｔｄ）と類似度を比較し、どの類似度が閾値に満たなかったのかを特定する。

この場合は、声紋の類似度、ピッチの類似度、及び発話内容の類似度の各々が声紋閾値Ｔａ、ピッチ閾値Ｔｃ、及び発話内容閾値Ｔｄの各々の値以上であると判定したが、アクセントの類似度がアクセント閾値Ｔｂ未満であったため、アクセント閾値Ｔｂの値を変更する。

ここで、変更後のアクセント閾値Ｔｂ（変更後）、変更前のアクセント閾値Ｔｂ（変更前）、及び変更前のアクセント閾値Ｔｂとアクセントの類似度との差ΔＴｂを用いると、Ｔｂ（変更後）は次のように表される。

Ｔｂ（変更後）＝Ｔｂ（変更前）−ΔＴｂ
ここで、ΔＴｂ＝Ｔｂ（変更前）−Ｋであり、Ｋは「音声認識が正しく行われなかった場合のアクセントの類似度」である。

すなわち、Ｔｂ（変更前）からΔＴｂを減算することになる。これにより、アクセント閾値Ｔｂ（変更後）は、「音声認識が正しく行われなかった場合のアクセントの類似度（Ｋ）」と同一の値に設定される。これが音声認識手法の学習である。

これにより、次回、利用者が「げんざいち」という音声をマイク１７に入力した場合は、声紋評価値、アクセント評価値、ピッチ評価値、及び発話内容評価値と、声紋用パラメータＰａ、アクセント用パラメータＰｂ、ピッチ用パラメータＰｃ、及び発話内容用パラメータＰｄとは類似すると判定されるため、音声認識学習部２５によって利用者の音声データの意味内容が「現在地」であると正しく認識されるようになる。

これは、声紋評価値、ピッチ評価値、又は発話内容評価値のいずれかが声紋用パラメータＰａ、ピッチ用パラメータＰｃ、又は発話内容用パラメータＰｄと類似しないと判定された場合においても同様であり、音声認識学習部２５によって声紋閾値Ｔａ、アクセント閾値Ｔｂ、ピッチ閾値Ｔｃ、又は発話内容閾値Ｔｄが変更されることにより、次回からは音声認識が正しく行われることになる。

図４は、本実施の形態の車載情報システムにおける音声認識手法の学習処理の処理手順を示す図である。なお、図２に示す処理は、ナビゲーションＥＣＵ１１によって実行される。

ナビゲーション装置１０の電源がオンにされると、ナビゲーションＥＣＵ１１は、本実施の形態の車載情報システムにおける認識手法の学習処理の処理手順を開始する（スタート）。

ナビゲーションＥＣＵ１１は、マイク１７に入力された音声を音声データに変換する（ステップＳ１）。この処理は、ナビゲーションＥＣＵ１１の入力解析制御部２２としての機能によって実行される処理であり、マイク１７から出力される音声信号をデジタル変換することにより音声データが得られる。

ナビゲーションＥＣＵ１１は、音声データに対して音声認識処理を行う（ステップＳ２）。この音声認識処理は、ナビゲーションＥＣＵ１１の音声認識部２４としての機能によって実行される処理であり、音声認識辞書１８を用いて、入力解析制御部２２から伝送される音声データの意味内容を認識する。

具体的には、音声データの評価値（声紋評価値、アクセント評価値、ピッチ評価値、及び発話内容評価値）を演算する。

次いで、ナビゲーションＥＣＵ１１は、音声の特徴の評価結果を分析する（ステップＳ３）。この処理は、ナビゲーションＥＣＵ１１の音声認識部２４としての機能によって実行される処理であり、具体的には、ステップＳ２における比較の結果、音声データの評価値（声紋評価値、アクセント評価値、ピッチ評価値、及び発話内容評価値）を用いて音声認識辞書１８に格納されたデータと照合し、声紋用パラメータＰａ、アクセント用パラメータＰｂ、ピッチ用パラメータＰｃ、及び発話内容用パラメータＰｄがすべて類似するデータが見つかった場合は、そのデータの識別ＩＤに関連付けられた意味内容ＩＤに対応する意味内容の文言を音声認識辞書１８から抽出する。

次いで、ナビゲーションＥＣＵ１１は、ステップＳ３で抽出した文言をタッチパネル１２に表示する（ステップＳ４）。利用者の確認のためである。

さらに、ナビゲーションＥＣＵ１１は、タッチパネル１２又は遠隔操作装置２０への手動操作の入力を監視する（ステップＳ５）。音声認識が正しく行われていない場合は、利用者によってタッチパネル１２又は遠隔操作装置２０への手動操作が行われる可能性が高いからである。

次いで、ナビゲーションＥＣＵ１１は、マイク１７に音声が入力されてから５秒間の間にタッチパネル１２又は遠隔操作装置２０に手動操作が入力されたか否かを判定する（ステップＳ６）。音声認識が正しく行われていない場合は、認識手法の学習が必要になるからである。

ナビゲーションＥＣＵ１１は、マイク１７に音声が入力されてから５秒間の間にタッチパネル１２又は遠隔操作装置２０に手動操作が入力されたと判定した場合は、その手動操作を解析する（ステップＳ７）。例えば、タッチパネル１２に表示されている「現在地」ボタンが押された場合は、「現在地」ボタンが押されたことがナビゲーションＥＣＵ１１によって解析される。

ナビゲーションＥＣＵ１１は、ステップＳ７で解析した操作内容が表す言葉を特定するために必要な閾値（Ｔａ〜Ｔｄ）を音声認識辞書１８から読み出し、ステップＳ１で取得した音声データについて演算された類似度と比較することにより、閾値（Ｔａ〜Ｔｄ）に満たない類似度が声紋、アクセント、ピッチ、又は発話内容のいずれの類似度であるかを特定する（ステップＳ８）。

ナビゲーションＥＣＵ１１は、ステップＳ８で類似度が閾値に満たないと判定されたアクセント閾値Ｔｂ（変更前）からΔＴｂを減じる（ステップＳ９）。これにより、アクセント閾値Ｔｂの値は、ステップＳ８で特定されたアクセントの類似度（Ｋ）と同一の値になる。ここで、ΔＴｂはＴｂ（変更前）と「音声認識が正しく行われなかった場合のアクセントの類似度（Ｋ）」の差分である。

これは、例えば、「げんざいち」という音声がマイク１７に入力された場合に、音声データのアクセントを表す評価値が「現在地」という単語のアクセントパラメータＰｂと類似しないと判定されたために音声認識が正しく行われなかった場合に、次回の音声認識時には類似すると判定されるようにするために、アクセント閾値Ｔｂの値を変更する処理である。

ナビゲーションＥＣＵ１１は、ステップＳ９で変更したアクセント閾値Ｔｂ（変更後）を音声認識辞書１８に登録する（ステップＳ１０）。

これにより、次回、利用者が「げんざいち」という音声をマイク１７に入力した場合は、声紋評価値、アクセント評価値、ピッチ評価値、及び発話内容評価値と、声紋用パラメータＰａ、アクセント用パラメータＰｂ、ピッチ用パラメータＰｃ、及び発話内容用パラメータＰｄとがそれぞれ類似すると判定されるため、音声認識学習部２５によって利用者の音声データの意味内容が「現在地」であると正しく認識されるようになる。

また、ステップＳ６において、マイク１７に音声が入力されてから５秒間の間にタッチパネル１２又は遠隔操作装置２０に手動操作が入力されなかったと判定した場合は、ナビゲーションＥＣＵ１１は、ステップＳ３で音声認識辞書１８から抽出された意味内容の文言によって特定される指令を用いてナビゲーション装置１０の処理を実行する（ステップＳ１１）。

この場合は、「現在地」という意味内容の文言が正しく音声認識された場合であるので、ナビゲーションＥＣＵ１１は、その文言によって特定される指令をナビゲーションＥＣＵ１１内の所定の機能部に伝送する。

このように、本実施の形態のナビゲーション装置１０によれば、利用者の音声の特徴を学習することにより音声認識の精度の向上を図るべく、音声認識部２４によって認識された意味内容と、タッチパネル１２又は遠隔操作装置２０に入力された指令の内容との一致性に基づき、利用者の音声の特徴に合わせて声紋閾値Ｔａ、アクセント閾値Ｔｂ、ピッチ閾値Ｔｃ、又は発話内容閾値Ｔｄの値を変更するので、変更前は正しく音声認識されなかった利用者の発話が正しく音声認識されるようになり、音声認識の精度の向上を図ることができる。

以上では、ナビゲーションＥＣＵ１１が音声認識手法の学習処理を実行する形態について説明したが、本実施の形態の車載情報システムを実現するための制御装置は、ナビゲーションＥＣＵとは別の専用のＥＣＵによって実現されてもよい。この専用ＥＣＵは、ナビゲーション装置１０の内部又は外部のいずれに配設されてもよい。

また、以上では、液晶モニタとマトリクススイッチとを組み合わせたタッチパネル１２を用いる場合について説明したが、パネルに表示した入力スイッチが利用者に押圧されることにより、操作可能に構成されるタッチパネル式表示手段であれば、上述のようなタッチパネル１２に限られるものではない。

また、以上では、車載情報システムがナビゲーション装置１０であり、このナビゲーション装置１０の音声認識機能に学習機能を付加した形態について説明したが、車載情報システムはナビゲーション装置１０に限定されるものではなく、オーディオやエアコン等の様々な車載装置が音声認識機能を有する場合は、その車載装置に本実施の形態の車載情報システムを適用することができる。

以上、本発明の例示的な実施の形態の車載情報システムについて説明したが、本発明は、具体的に開示された実施の形態に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。

本実施の形態の車載情報システムの構成を示す図である。本実施の形態の車載情報システムにおける音声認識手法の学習機能を示すブロック図である。本実施の形態の車載情報システムにおける音声認識辞書１８のデータ構造を示す図である。本実施の形態の車載情報システムにおける音声認識手法の学習処理の処理手順を示す図である。

符号の説明

１０ナビゲーション装置
１１ナビゲーションＥＣＵ
１２タッチパネル
１３現在位置検出部
１４方位検出部
１５ルート検索部
１６地図データベース
１７マイク
１８音声認識辞書
１９受信部
２０遠隔操作装置
２１力管理部
２２入力解析制御部
２３手動入力解析部
２４音声認識部
２５音声認識学習部

Claims

手動操作により指令を入力する第１入力手段と、
音声を入力する第２入力手段と、
前記第２入力手段に入力される音声を音声認識する音声認識手段と、
前記第１入力手段に入力される指令の内容、又は前記音声認識手段によって音声認識される音声の意味内容に基づき、所定の情報を出力する情報処理手段と、
音声の特徴を評価するための基準値と、音声データの意味内容を特定するための閾値とを前記指令の内容に対応する識別ＩＤに関連付けて格納する音声認識辞書と、
前記第２入力手段に音声が入力された後の所定時間内に前記第１入力手段へ指令が入力されると、当該指令の内容を表すデータと、前記第２入力手段に入力される音声を表す音声データとに基づき、前記音声認識手段における認識手法を学習する学習手段と
を含み、
前記音声認識手段は、前記第２入力手段に入力される音声の特徴の評価値と前記音声認識辞書に格納された基準値との類似度を前記閾値と比較することによって当該音声の意味内容を認識するように構成されており、
前記学習手段は、前記第１入力手段に入力された指令の内容に対応する識別ＩＤに関連付けて前記音声認識辞書に格納された前記基準値と、前記第２入力手段に入力される音声を表す音声データの評価値との類似度に基づいて、前記指令の内容に対応する識別ＩＤに関連付けて前記音声認識辞書に格納された前記閾値を変更することにより、前記音声認識手段における認識手法を学習する、車載情報システム。
前記音声の特徴は、声紋、アクセント、ピッチ、又は発話内容の少なくともいずれか一つである、請求項１に記載の車載情報システム。
前記第１入力手段はタッチパネル式表示手段、又は遠隔操作装置である、請求項１又は２に記載の車載情報システム。
前記情報処理手段は、ナビゲーション装置の演算処理手段に含まれる、請求項１乃至３のいずれか一項に記載の車載情報システム。