JP2008164809A

JP2008164809A - 音声認識装置

Info

Publication number: JP2008164809A
Application number: JP2006352741A
Authority: JP
Inventors: Toru Nada; 徹名田
Original assignee: Denso Corp
Current assignee: Denso Corp
Priority date: 2006-12-27
Filing date: 2006-12-27
Publication date: 2008-07-17

Abstract

【課題】音声認識装置において、ドライバーの運転活動を極力妨げずに認識率を向上させること。
【解決手段】音声認識開始スイッチが押下されていると判断された場合には、音声入力手段を介して入力された音声をＡ／Ｄ変換器によってデジタル信号に変換し、その変換されたデジタル信号を分析（特徴パラメータ等を抽出）する（Ｓ１１０）。続いて、分析したデジタル信号を、外部データ入力器を外部記憶媒体から取得した音節の特徴パラメータ等と比較して、候補音節をそのスコアに応じて候補順を付けて複数選択する（Ｓ１２０）。そして、選択された候補音節を表示部に表示させる（Ｓ１３０）。報知された候補音節のうちの何れかを選択する意図の操作を話者より操作受付部が受け付けた場合には、その操作によって特定された候補音節を話者の意図する音節として選択する選択処理を実行する（Ｓ１５０）。
【選択図】図２

Description

本発明は、話者によって入力された音声に基づいて、話者の意図する音節を決定する音声認識装置等に関する。

話者によって入力された音声に基づいて、話者の意図する単音節を一単音節ずつ決定する音声認識装置や、複数音節を一単語として受け付ける音声認識装置が広く知られている。このような音声認識装置の中には、上述の音声認識を行った結果、候補が複数存在する場合にはそれらの候補を表示部に表示させ、音声入力にてそれらの候補から所望のものを選択するよう構成されたものがある（例えば、特許文献１参照。）。

一方、上述のような複数の候補からの絞り込みを効果的に行うためにキースイッチなどの操作部を備える音声認識装置がある。
特開平８−５４８９４号公報（第５頁、図２）

しかし、上述のような音声認識装置においては、音声認識の認識率を向上させるため、誤認識の際に音声を再度入力する必要があるにも拘らず認識率が向上するとは限らず、正しい認識を得るために長時間を要する場合があり、ドライバーの運転活動を妨げるおそれがあるという問題があった。

また、上述のような音声認識装置においては、音声認識を実行する場合において、複数コマンドが受付可能な状態において特定のコマンドを入力するときには、類似の候補語に誤って認識してしまう場合があり、このような場合には、誤った結果が実行されたときに使用者に不快感を与えるという問題があった。さらに、上述のような音声認識の結果に応じて他の候補音節を選択するときや「ＹＥＳ／ＮＯ」などの選択操作を行うときに、わざわざ「次、次」と音声で入力選択して行くのは非常に効率が悪く、手操作で入力した方が早い場合には手操作で選択を行いたいというニーズがあった。

本発明は、このような不具合に鑑みなされたものであり、その目的とするところは、音声認識装置において、ドライバーの運転活動を極力妨げずに、認識率を向上させる技術を提供することにある。

上記課題を解決するためになされた請求項１に係る音声認識装置は、入力された音声を音声認識した際の認識結果の候補を提示し、音声以外の方法による選択入力に基づいて前記認識結果の候補から認識結果を決定することを特徴とする。

具体的には、上述の音声認識装置（１：この欄においては、発明に対する理解を容易にするため、必要に応じて「発明を実施するための最良の形態」欄で用いた符号を付すが、この符号によって請求の範囲を限定することを意味するものではない。）は、車両に搭載され、話者によって入力された音声に基づいて話者の意図する音節を決定する音声認識装置であり、話者の発声した音声を入力する音声入力手段（４）と、指定された情報を報知する報知手段（６）と、話者の操作を受け付ける受付手段（３）と、音声認識手段（５）と、制御手段（５）と、を備える。音声認識手段が、話者の発声した音声を入力する音声入力手段が入力した音声を分析して候補音節を特定し、制御手段が、音声認識手段が特定した候補音節を報知手段に報知させる報知処理を実行する。そして、直前の報知処理の際に報知させた候補音節のうちの何れかを選択する意図の操作を話者より受付手段が受け付けた場合には、制御手段が、その操作によって特定された候補音節を話者の意図する音節として選択する選択処理を実行する。さらに、話者より決定を意味する操作を受付手段が受け付けた場合には、制御手段が、直前の選択処理の際に選択された候補音節を話者の意図する音節として確定する確定処理を実行する。

このように構成された本発明の音声認識装置によれば、ドライバーの運転活動を極力妨げずに、認識率を向上させることができる。
この場合、上述の受付手段としては、運転者の手が届く範囲内に配置されていることが考えられる（請求項２）。このように構成すれば、運転者が運転中でも受付手段を操作しやすく、当該音声認識装置の利便性を高めることができる。

また、上述の受付手段としては、運転中の運転者の視界の範囲内に配置されていることが考えられる（請求項３）。一例を挙げると、受付手段がステアリングに設置されていることや（請求項４）、受付手段がインストルメントパネル周辺に設置されていること（請求項５）、などである。なお、上述の受付手段の具体的構成としては、タッチパネル（請求項６）、キースイッチ群（請求項７）、リモコン（請求項８）などが考えられる。このように構成すれば、運転者が運転中でも受付手段を操作しやすく、当該音声認識装置の利便性を高めることができる。

ところで、候補音節を報知する際には、認識率の高い順に報知することが考えられる。具体的には、請求項９のように、制御手段が、報知処理を実行する際に、そのスコアの高い順に前記候補音節を報知させることが考えられる。ここで、スコアとは、音声の終端までの確からしさの積を云い、尤度とも呼ばれる。このように構成すれば、例えば受付手段がタッチパネルを有する場合には、運転者の視線の動きが少なくて済み、運転者の運転活動を極力妨げないようにすることができる。また、例えば受付手段がキー入力部を有する場合には、運転者による手動操作が少なくなりやすく、運転者の運転活動を極力妨げないようにすることができる。

また、入力された受け対象の言葉（単語やフレーズなど）の数量が多いときには、認識の正解率が低くなるおそれがある。そこで、入力された受け対象の言葉の数量が多いときには、認識結果候補を報知することが考えられる。具体的には、請求項１０のように、制御手段が、報知処理を実行する際に、音声認識手段が特定した候補音節が所定数以上の単音節で構成されている場合には、候補音節を報知手段に報知させることが考えられる。このように構成すれば、入力された受け対象の言葉（単語、フレーズ）の数量が多いときであっても、認識結果の正解率を高くすることができる。

ところで、音声認識手段が特定した複数の候補音節のスコア間の差が所定値よりも小さい場合には複数の候補音節を報知することが考えられる。具体的には、請求項１１のように、制御手段が、報知処理を実行する際に、音声認識手段が特定した複数の候補音節のスコア間の差が所定値よりも小さい場合には複数の候補音節を報知手段に報知させることが考えられる。

このように構成すれば、話者が意図する音節である可能性があるすべての候補音節を報知することによって、話者が意図する音節を迅速に選択することができ、したがって、運転者の運転活動を極力妨げないようにすることができる。

また、音声認識手段が特定した複数の候補音節のスコア間の差が所定値よりも大きい場合には複数の候補音節のうちそのスコアが最も大きい候補音節を報知することが考えられる。具体的には、請求項１２のように、制御手段が、報知処理を実行する際に、音声認識手段が特定した複数の候補音節のうちそのスコアが最も大きい候補音節とその他の候補音節とのスコア間の差が所定値よりも大きい場合には複数の候補音節のうちそのスコアが最も大きい候補音節のみを報知手段に報知させることが考えられる。

このように構成すれば、話者が意図する音節である可能性が低い候補音節を報知せずに、話者が意図する音節である可能性が最も高い候補音節のみを報知することができ、運転者の運転活動を極力妨げないようにすることができる。

以下に本発明の実施形態を図面とともに説明する。
［第一実施形態］
図１は、音声認識機能を有するナビゲーション装置１の構成を示すブロック図である。

［ナビゲーション装置１の構成の説明］
図１に示すように、ナビゲーション装置１は車両に搭載され、車両の現在位置を検出する位置検出器２と、ユーザからの各種指示を入力するための操作スイッチ群３ａと、操作スイッチ群３ａと同様に各種指示を入力可能であってナビゲーション装置１とは別体となったリモートコントロール端末（以下、リモコンと称す）３ｃと、リモコン３ｃからの信号を入力するリモコンセンサ３ｂと、地図データや音声認識データ、各種の情報を記録した外部記憶媒体から地図データ等を入力する外部データ入力器７ａと、地図や各種情報の表示を行うための表示装置６ｂと、各種のガイド音声等を出力するためのスピーカ６ａと、音声を入力して音声情報を出力する音声入力手段４と、上述した位置検出器２や操作スイッチ群３ａ、リモコンセンサ３ｂ、外部データ入力器７ａ、音声入力手段４からの入力に応じて各種処理を実行し、表示装置６ｂ、スピーカ６ａを制御する制御部５と、を備えている。

位置検出器２は、車両に加えられる回転運動の大きさを検出するジャイロスコープ２ａと、地磁気から進行方位を検出するための地磁気センサ２ｂと、車両の速度を検出するための車速センサ２ｃと、ＧＰＳ（Global Positioning System）用の人工衛星からの送信電波をＧＰＳアンテナを介して受信し、車両の位置、方位、速度等を検出するＧＰＳ受信機２ｄと、を備えている。そして、これら各センサ等２ａ〜２ｄは、各々が性質の異なる誤差を有しているため、互いに補完しながら使用するように構成されている。

操作スイッチ群３ａは、表示装置６ｂの表示面と一体に構成されたタッチパネル及び表示装置６ｂの周囲に設けられたメカニカルなキースイッチ等から構成される。なお、タッチパネルと表示装置６ｂとは積層一体化されており、タッチパネルには、感圧方式、電磁誘導方式、静電容量方式、あるいはこれらを組み合わせた方式など各種の方式があるが、その何れを用いてもよい。

なお、操作スイッチ群３ａ、リモコンセンサ３ｂおよびリモコン３ｃが操作受付部３を構成する。
外部データ入力器７ａは、外部記憶媒体７ｂに記憶された各種データを入力するための装置である。外部記憶媒体７ｂには、地図データ（道路データ、地形データ、マークデータ、交差点データ、施設のデータ等）、案内用の音声データ、音声認識データ等が記憶されている。なお、音声認識データとしては、単音節を認識するための特徴パラメータ、単音節毎に対応づけられた複数音節からなる単音節認識用特定語によって構成される辞書、単音節毎に対応づけられた複数音節からなる確認用単語によって構成される辞書等が挙げられる。このようなデータを記憶する外部記憶媒体７ｂの種類としては、ＣＤ−ＲＯＭやＤＶＤ等が一般的であるが、ハードディスクなどの磁気記憶装置やメモリカード等の媒体を用いても良い。

表示装置６ｂは、カラー表示装置であり、液晶ディスプレイ、有機ＥＬディスプレイ、ＣＲＴなどがあるが、その何れを用いてもよい。表示装置６ｂの表示画面には、位置検出器２にて検出した車両の現在位置と外部データ入力器７ａより入力された地図データとから特定した現在地を示すマーク、目的地までの誘導経路、名称、目印、各種施設のマーク等の付加データとを重ねて表示することができる。また、施設のガイド等も表示できる。

スピーカ６ａは、外部データ入力器７ａより入力した施設のガイドや各種案内の音声を出力することができる。
なお、表示装置６ｂおよびスピーカ６ａが音声出力部６を構成する。

音声入力手段４は、利用者が音声を入力（発話）するとその入力した音声に基づく電気信号（音声信号）を制御部５に出力するものである。利用者はこの音声入力手段４に様々な音声を入力することにより、ナビゲーション装置１を操作することができる。

制御部５は、ＣＰＵ、ＲＯＭ、ＲＡＭ、Ｉ／Ｏおよびこれらの構成を接続するバスラインなどからなる周知のマイクロコンピュータを中心に構成されており、ＲＯＭおよびＲＡＭに記憶されたプログラムに基づいて各種処理を実行する。例えば、位置検出器２からの各検出信号に基づき座標及び進行方向の組として車両の現在位置を算出し、外部データ入力器７ａを介して読み込んだ現在位置付近の地図等を表示装置２６に表示する表示処理や、外部データ入力器７ａに格納された地点データと、操作スイッチ群３ａやリモコン３ｃ等の操作に従って設定された目的地とに基づいて、現在位置から目的地までの最適な経路を算出し、その算出した経路を案内する経路案内処理を行う。また、制御部５は後述する音声認識処理を実行することができる。

また、制御部５は、位置検出器２からの出力信号に基づき、当該ナビゲーション装置１の現在位置を検出する現在位置検出手段５ａ、操作受付部３からの出力信号に基づき、ユーザの操作入力を検出する操作入力検出手段５ｂ、音声入力手段４からの出力信号に基づいて音声認識を実行する音声認識手段５ｃ、現在位置検出手段５ａから出力されたデータや、音声認識手段５ｃから出力されたデータを処理するデータ処理手段５ｄ、データ処理手段５ｄによる処理結果を出力する方法を選択する出力方法選択手段５ｅ、データ処理手段５ｄによる処理結果および外部データ入力器７ａから入力された各種データを内蔵する内部記憶媒体に記憶する検索データ格納手段５ｆ、音声認識手段５ｃから出力されたデータおよびデータ処理手段５ｄによる処理結果を記憶するキーワード＆文法データ格納手段５ｇ、を備える。

なお、本実施形態では、制御部５が上述のＨＭＭ手法を用いて音声認識を行っている。
ここで、音声認識で一般的に用いられるＨＭＭ（隠れマルコフモデル）手法について簡単に説明する。本手法は、音声を状態と遷移で表現されたマルコフモデルから生成されるものであると仮定して、生成モデルを事前に作成しておき、それと音声とを突き合わせ（マッチング）、最もよくマッチングするものを認識結果とするものである。最終的には音声の終端までの確からしさの積（尤度と呼ばれるスコア）が最も良いものを認識結果とする。なお、本実施形態では、制御部５が上述のＨＭＭ手法を用いて音声認識を行っているが、他の手法を用いて音声認識を行ってもよい。

ここまででナビゲーション装置１の概略構成を説明したが、ナビゲーション装置１の各部と特許請求の範囲に記載の用語との対応を示す。音声入力手段４が音声入力手段に相当し、音声出力部６が報知手段に相当し、表示装置６ｂが報知手段に相当し、操作スイッチ群３ａおよびリモコン３ｃが受付手段に相当し、制御部５が音声認識手段および制御手段に相当する。

［音声認識処理の説明］
次に、ナビゲーション装置１の制御部５が実行する音声認識処理について図２のフローチャートおよび図３を参照して説明する。なお、図３は音声認識処理を説明する説明図である。

この音声認識処理は、ナビゲーション装置１への情報入力の際に音声入力が可能な状態で利用者が特に指示した際に実行が開始される。
まず、音声認識開始スイッチが押下されていると判断されるまで待機し、音声認識開始スイッチが押下されていると判断された場合には（図３（ａ）参照）、音声入力を受け付ける（Ｓ１１０、図３（ｂ）参照）。具体的には、音声入力手段４を介して入力された音声をＡ／Ｄ変換器によってデジタル信号に変換し、その変換されたデジタル信号を分析（特徴パラメータ等を抽出）する。

続いて、音声認識を実行する（Ｓ１２０）。具体的には、分析したデジタル信号を、外部データ入力器７ａを外部記憶媒体７ｂから取得した音節の特徴パラメータ等と比較して、候補音節をそのスコアに応じて候補順を付けて複数選択する。

続いて、選択された候補音節をその候補順に表示装置６ｂに表示させる（Ｓ１３０、図３（ｃ）参照）。
続いて、操作受付部３が受け付けた操作入力があるか否かを判断する（Ｓ１４０）。操作受付部３が受け付けた操作入力があると判断された場合には（Ｓ１４０：ＹＥＳ）、その操作入力によって選択された候補音節（図３（ｅ）参照）を、話者の意図する音節として確定する（Ｓ１５０、図３（ｄ）および図３（ｆ）参照））。そして、後述するＳ１８０に移行する。

一方、操作受付部３が受け付けた操作入力がないと判断された場合には（Ｓ１４０：ＮＯ）、音声入力手段４を介して音声入力があるか否かを判断する（Ｓ１６０）。音声入力がないと判断された場合には（Ｓ１６０：ＮＯ）、Ｓ１４０に戻って以下の処理を実行する。一方、音声入力があると判断された場合には（Ｓ１６０：ＹＥＳ）、その音声入力によって選択された候補音節を、話者の意図する音節として確定する（Ｓ１７０）。そして、後述するＳ１８０に移行する。

Ｓ１８０では、続いて実行すべき処理があるか否かを判断する。続いて実行すべき処理があると判断された場合には（Ｓ１８０：ＹＥＳ）、Ｓ１１０に戻って以下の処理を実行する。一方、続いて実行すべき処理がないと判断された場合には（Ｓ１８０：ＮＯ）、本処理を終了する。

［第一実施形態の効果］
（１）このように第一実施形態の音声認識機能を有するナビゲーション装置１によれば、次のような作用効果を奏する。すなわち、例えば、楽曲名やアーティスト名を音声認識によって選択する場合に、同名の曲や歌手が存在する。このような場合において、曲名Ａを入力した場合に、歌手Ａ、歌手Ｂ、歌手Ｃの可能性がある場合に、「歌手Ａですか、Ｂですか、Ｃですか」と問いかけるか、または「次の候補」などの音声命令により順々に候補を提示する形態が考えられる。しかし、わざわざ音声で何度も喋るよりも、手操作で選択した方が早い。そこで、複数の候補音節を表示し（Ｓ１３０）、報知された候補音節のうちの何れかを選択する意図の操作を話者より操作受付部３が受け付けた場合には、その操作によって特定された候補音節を話者の意図する音節として選択する選択処理を実行し、話者より決定を意味する操作を操作受付部３が受け付けた場合には、直前の選択処理の際に選択された候補音節を話者の意図する音節として確定する確定処理を実行する（Ｓ１５０、Ｓ１７０）。したがって、ドライバーの運転活動を極力妨げずに、認識率を向上させることができる。

（２）また、第一実施形態のナビゲーション装置１によれば、音声認識処理において、候補音節をそのスコアに応じて候補順を付けて複数選択し、その選択された候補音節をその候補順に表示装置６ｂに表示させる（Ｓ１３０）。このことにより、例えば操作受付部３のタッチパネルを見る際の運転者の視線の動きが少なくて済み、運転者の運転活動を極力妨げないようにすることができる。また、例えば運転者による操作受付部３の操作スイッチ群３ａの操作が少なくなりやすく、運転者の運転活動を極力妨げないようにすることができる。

［他の実施形態］
以上、本発明の一実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、以下のような様々な態様にて実施することが可能である。

（１）上記第一実施形態では、操作受付部３が操作スイッチ群３ａ、リモコンセンサ３ｂおよびリモコン３ｃから構成されているが、これには限られず、操作受付部３が、図示しないステアリングに設けられたメカニカルなキースイッチ等から構成されるようにしてもよい。なおこの場合、キースイッチ等は、運転者が運転中でも操作しやすくする観点から、運転中の運転者の視界の範囲内に位置し、且つ運転中の運転者の視界の範囲内に位置するステアリングに設置される。そして、キースイッチ等は、ユーザから操作に基づき、音量の増加や減少を指示する信号を各種ＥＣＵへ車内ＬＡＮを介して出力し、その信号をナビゲーション装置１が取得するように構成される。

このように構成しても、運転者が運転中でも操作受付部３を操作しやすく、ナビゲーション装置１の利便性を高めることができる。
（２）また、運転者の手が届く範囲内であれば操作受付部３が他の場所に設置されていてもよい。一例を挙げると、操作受付部３を図示しないインストルメントパネル周辺に設置するといった具合である。このように構成しても、運転者が運転中でも操作受付部３を操作しやすく、ナビゲーション装置１の利便性を高めることができる。

（３）また、上記実施形態の音声認識機能をナビゲーション装置１以外の車載器が備える構成を利用して実現してもよい。このように構成しても上記実施形態と同様の作用効果を奏する。

（４）また、上記音声認識処理のＳ１２０において、選択した候補音節が所定数以上の単音節で構成されているか否かを判断し、選択した候補音節が所定数以上の単音節で構成されてと判断された場合に、Ｓ１３０のようにその選択された候補音節をその候補順に表示装置６ｂに表示させるようにしてもよい。このようにすれば、音声入力された受け対象の言葉（単語、フレーズ）の数量が多いときであっても、認識結果の正解率を高くすることができる。

（５）また、上記音声認識処理のＳ１２０において、選択された複数の候補音節のスコア間の差が所定値よりも小さいか否かを判断し、選択された複数の候補音節のスコア間の差が所定値よりも小さいと判断された場合に、Ｓ１３０にようにその選択された候補音節をその候補順に表示装置６ｂに表示させるようにしてもよい。

このようにすれば、次のような作用効果を奏する。すなわち、例えば、楽曲名やアーティスト名を音声認識によって選択する場合に、同名の曲や歌手が存在する。このような場合において、曲名Ａを入力した場合に、曲Ａ以外に、曲名の似ている曲名Ａ１や曲名Ａ２、曲名Ａ３などの可能性がある場合に、「あなたの話した曲名は、この中のどれですか」と問いかけて、候補を選択してもらった方が確実に入力できる場合がある。このような場合には、再度音声で入力しても同じ間違いをしてしまう場合が考えられ、手操作で選択した方が確実である。そこで、選択された複数の候補音節のスコア間の差が所定値よりも小さいか否かを判断し、選択された複数の候補音節のスコア間の差が所定値よりも小さいと判断された場合に、その選択された候補音節をその候補順に表示装置６ｂに表示させる。つまり、話者が意図する音節である可能性があるすべての候補音節を報知することによって、話者が意図する音節を迅速に選択することができ、したがって、運転者の運転活動を極力妨げないようにすることができる。

（６）また、上記音声認識処理のＳ１２０において、選択された複数の候補音節のうちそのスコアが最も大きい候補音節とその他の候補音節とのスコア間の差が所定値よりも大きいか否かを判断し、そのスコアが最も大きい候補音節とその他の候補音節とのスコア間の差が所定値よりも大きいと判断された場合に、Ｓ１３０にようにその選択された複数の候補音節のうちそのスコアが最も大きい候補音節のみをその候補順に表示装置６ｂに表示させるようにしてもよい。ここで、スコアとは、音声の終端までの確からしさの積を云い、尤度とも呼ばれる。このようにすれば、話者が意図する音節である可能性が低い候補音節を報知せずに、話者が意図する音節である可能性が最も高い候補音節のみを報知することができ、運転者の運転活動を極力妨げないようにすることができる。

第一実施形態の音声認識装置の概略構成図である。音声認識装置の制御部が実行する音声認識処理を示すフローチャートである。音声認識処理を説明する説明図である。

符号の説明

１…ナビゲーション装置、２…位置検出器、２ａ…ジャイロスコープ、２ｂ…地磁気センサ、２ｃ…車速センサ、２ｄ…ＧＰＳ受信機、３…操作受付部、３ａ…操作スイッチ群、３ｂ…リモコンセンサ、３ｃ…リモコン、４…音声入力手段、５…制御部、５ａ…現在位置検出手段、５ｂ…操作入力検出手段、５ｃ…音声認識手段、５ｄ…データ処理手段、５ｅ…出力方法選択手段、５ｆ…検索データ格納手段、５ｇ…文法データ格納手段、６…音声出力部、６ａ…スピーカ、６ｂ…表示装置、７ａ…外部データ入力器、７ｂ…外部記憶媒体

Claims

車両に搭載され、話者によって入力された音声に基づいて話者の意図する音節を決定する音声認識装置であって、
話者の発声した音声を入力する音声入力手段と、
前記音声入力手段が入力した音声を分析して候補音節を特定する音声認識手段と、
指定された情報を報知する報知手段と、
話者の操作を受け付ける受付手段と、
前記音声認識手段が特定した候補音節を前記報知手段に報知させる報知処理を実行し、直前の前記報知処理の際に報知させた前記候補音節のうちの何れかを選択する意図の操作を話者より前記受付手段が受け付けた場合にはその操作によって特定された候補音節を話者の意図する音節として選択する選択処理を実行し、話者より決定を意味する操作を前記受付手段が受け付けた場合には直前の前記選択処理の際に選択された候補音節を話者の意図する音節として確定する確定処理を実行する制御手段と、
を備えることを特徴とする音声認識装置。
請求項１に記載の音声認識装置において、
前記受付手段は、運転者の手が届く範囲内に配置されていることを特徴とする音声認識装置。
請求項１または請求項２に記載の音声認識装置において、
前記受付手段は、運転中の運転者の視界の範囲内に配置されていることを特徴とする音声認識装置。
請求項１〜請求項３の何れかに記載の音声認識装置において、
前記受付手段は、ステアリングに設置されていることを特徴とする音声認識装置。
請求項１〜請求項４の何れかに記載の音声認識装置において、
前記受付手段は、インストルメントパネル周辺に設置されていることを特徴とする音声認識装置。
請求項１〜請求項５の何れかに記載の音声認識装置において、
前記受付手段は、タッチパネルとして構成されていることを特徴とする音声認識装置。
請求項１〜請求項５の何れかに記載の音声認識装置において、
前記受付手段は、キースイッチ群として構成されていることを特徴とする音声認識装置。
請求項１〜請求項５の何れかに記載の音声認識装置において、
前記受付手段は、リモコンとして構成されていることを特徴とする音声認識装置。
請求項１〜請求項８の何れかに記載の音声認識装置において、
前記制御手段は、前記報知処理を実行する際に、そのスコアの高い順に前記候補音節を報知させることを特徴とする音声認識装置。
請求項１〜請求項９の何れかに記載の音声認識装置において、
前記制御手段は、前記報知処理を実行する際に、前記音声認識手段が特定した候補音節が所定数以上の単音節で構成されている場合には、前記候補音節を前記報知手段に報知させることを特徴とする音声認識装置。
請求項１〜請求項１０の何れかに記載の音声認識装置において、
前記制御手段は、前記報知処理を実行する際に、前記音声認識手段が特定した複数の候補音節のスコア間の差が所定値よりも小さい場合には前記複数の候補音節を前記報知手段に報知させることを特徴とする音声認識装置。
請求項１〜請求項１１の何れかに記載の音声認識装置において、
前記制御手段は、前記報知処理を実行する際に、前記音声認識手段が特定した複数の候補音節のうちそのスコアが最も大きい候補音節とその他の候補音節とのスコア間の差が所定値よりも大きい場合には前記複数の候補音節のうちそのスコアが最も大きい候補音節のみを前記報知手段に報知させることを特徴とする音声認識装置。