JP2008164809A - 音声認識装置 - Google Patents
音声認識装置 Download PDFInfo
- Publication number
- JP2008164809A JP2008164809A JP2006352741A JP2006352741A JP2008164809A JP 2008164809 A JP2008164809 A JP 2008164809A JP 2006352741 A JP2006352741 A JP 2006352741A JP 2006352741 A JP2006352741 A JP 2006352741A JP 2008164809 A JP2008164809 A JP 2008164809A
- Authority
- JP
- Japan
- Prior art keywords
- candidate
- speech recognition
- voice
- syllable
- syllables
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
【課題】音声認識装置において、ドライバーの運転活動を極力妨げずに認識率を向上させること。
【解決手段】音声認識開始スイッチが押下されていると判断された場合には、音声入力手段を介して入力された音声をA/D変換器によってデジタル信号に変換し、その変換されたデジタル信号を分析(特徴パラメータ等を抽出)する(S110)。続いて、分析したデジタル信号を、外部データ入力器を外部記憶媒体から取得した音節の特徴パラメータ等と比較して、候補音節をそのスコアに応じて候補順を付けて複数選択する(S120)。そして、選択された候補音節を表示部に表示させる(S130)。報知された候補音節のうちの何れかを選択する意図の操作を話者より操作受付部が受け付けた場合には、その操作によって特定された候補音節を話者の意図する音節として選択する選択処理を実行する(S150)。
【選択図】図2
【解決手段】音声認識開始スイッチが押下されていると判断された場合には、音声入力手段を介して入力された音声をA/D変換器によってデジタル信号に変換し、その変換されたデジタル信号を分析(特徴パラメータ等を抽出)する(S110)。続いて、分析したデジタル信号を、外部データ入力器を外部記憶媒体から取得した音節の特徴パラメータ等と比較して、候補音節をそのスコアに応じて候補順を付けて複数選択する(S120)。そして、選択された候補音節を表示部に表示させる(S130)。報知された候補音節のうちの何れかを選択する意図の操作を話者より操作受付部が受け付けた場合には、その操作によって特定された候補音節を話者の意図する音節として選択する選択処理を実行する(S150)。
【選択図】図2
Description
本発明は、話者によって入力された音声に基づいて、話者の意図する音節を決定する音声認識装置等に関する。
話者によって入力された音声に基づいて、話者の意図する単音節を一単音節ずつ決定する音声認識装置や、複数音節を一単語として受け付ける音声認識装置が広く知られている。このような音声認識装置の中には、上述の音声認識を行った結果、候補が複数存在する場合にはそれらの候補を表示部に表示させ、音声入力にてそれらの候補から所望のものを選択するよう構成されたものがある(例えば、特許文献1参照。)。
一方、上述のような複数の候補からの絞り込みを効果的に行うためにキースイッチなどの操作部を備える音声認識装置がある。
特開平8−54894号公報(第5頁、図2)
しかし、上述のような音声認識装置においては、音声認識の認識率を向上させるため、誤認識の際に音声を再度入力する必要があるにも拘らず認識率が向上するとは限らず、正しい認識を得るために長時間を要する場合があり、ドライバーの運転活動を妨げるおそれがあるという問題があった。
また、上述のような音声認識装置においては、音声認識を実行する場合において、複数コマンドが受付可能な状態において特定のコマンドを入力するときには、類似の候補語に誤って認識してしまう場合があり、このような場合には、誤った結果が実行されたときに使用者に不快感を与えるという問題があった。さらに、上述のような音声認識の結果に応じて他の候補音節を選択するときや「YES/NO」などの選択操作を行うときに、わざわざ「次、次」と音声で入力選択して行くのは非常に効率が悪く、手操作で入力した方が早い場合には手操作で選択を行いたいというニーズがあった。
本発明は、このような不具合に鑑みなされたものであり、その目的とするところは、音声認識装置において、ドライバーの運転活動を極力妨げずに、認識率を向上させる技術を提供することにある。
上記課題を解決するためになされた請求項1に係る音声認識装置は、入力された音声を音声認識した際の認識結果の候補を提示し、音声以外の方法による選択入力に基づいて前記認識結果の候補から認識結果を決定することを特徴とする。
具体的には、上述の音声認識装置(1:この欄においては、発明に対する理解を容易にするため、必要に応じて「発明を実施するための最良の形態」欄で用いた符号を付すが、この符号によって請求の範囲を限定することを意味するものではない。)は、車両に搭載され、話者によって入力された音声に基づいて話者の意図する音節を決定する音声認識装置であり、話者の発声した音声を入力する音声入力手段(4)と、指定された情報を報知する報知手段(6)と、話者の操作を受け付ける受付手段(3)と、音声認識手段(5)と、制御手段(5)と、を備える。音声認識手段が、話者の発声した音声を入力する音声入力手段が入力した音声を分析して候補音節を特定し、制御手段が、音声認識手段が特定した候補音節を報知手段に報知させる報知処理を実行する。そして、直前の報知処理の際に報知させた候補音節のうちの何れかを選択する意図の操作を話者より受付手段が受け付けた場合には、制御手段が、その操作によって特定された候補音節を話者の意図する音節として選択する選択処理を実行する。さらに、話者より決定を意味する操作を受付手段が受け付けた場合には、制御手段が、直前の選択処理の際に選択された候補音節を話者の意図する音節として確定する確定処理を実行する。
このように構成された本発明の音声認識装置によれば、ドライバーの運転活動を極力妨げずに、認識率を向上させることができる。
この場合、上述の受付手段としては、運転者の手が届く範囲内に配置されていることが考えられる(請求項2)。このように構成すれば、運転者が運転中でも受付手段を操作しやすく、当該音声認識装置の利便性を高めることができる。
この場合、上述の受付手段としては、運転者の手が届く範囲内に配置されていることが考えられる(請求項2)。このように構成すれば、運転者が運転中でも受付手段を操作しやすく、当該音声認識装置の利便性を高めることができる。
また、上述の受付手段としては、運転中の運転者の視界の範囲内に配置されていることが考えられる(請求項3)。一例を挙げると、受付手段がステアリングに設置されていることや(請求項4)、受付手段がインストルメントパネル周辺に設置されていること(請求項5)、などである。なお、上述の受付手段の具体的構成としては、タッチパネル(請求項6)、キースイッチ群(請求項7)、リモコン(請求項8)などが考えられる。このように構成すれば、運転者が運転中でも受付手段を操作しやすく、当該音声認識装置の利便性を高めることができる。
ところで、候補音節を報知する際には、認識率の高い順に報知することが考えられる。具体的には、請求項9のように、制御手段が、報知処理を実行する際に、そのスコアの高い順に前記候補音節を報知させることが考えられる。ここで、スコアとは、音声の終端までの確からしさの積を云い、尤度とも呼ばれる。このように構成すれば、例えば受付手段がタッチパネルを有する場合には、運転者の視線の動きが少なくて済み、運転者の運転活動を極力妨げないようにすることができる。また、例えば受付手段がキー入力部を有する場合には、運転者による手動操作が少なくなりやすく、運転者の運転活動を極力妨げないようにすることができる。
また、入力された受け対象の言葉(単語やフレーズなど)の数量が多いときには、認識の正解率が低くなるおそれがある。そこで、入力された受け対象の言葉の数量が多いときには、認識結果候補を報知することが考えられる。具体的には、請求項10のように、制御手段が、報知処理を実行する際に、音声認識手段が特定した候補音節が所定数以上の単音節で構成されている場合には、候補音節を報知手段に報知させることが考えられる。このように構成すれば、入力された受け対象の言葉(単語、フレーズ)の数量が多いときであっても、認識結果の正解率を高くすることができる。
ところで、音声認識手段が特定した複数の候補音節のスコア間の差が所定値よりも小さい場合には複数の候補音節を報知することが考えられる。具体的には、請求項11のように、制御手段が、報知処理を実行する際に、音声認識手段が特定した複数の候補音節のスコア間の差が所定値よりも小さい場合には複数の候補音節を報知手段に報知させることが考えられる。
このように構成すれば、話者が意図する音節である可能性があるすべての候補音節を報知することによって、話者が意図する音節を迅速に選択することができ、したがって、運転者の運転活動を極力妨げないようにすることができる。
また、音声認識手段が特定した複数の候補音節のスコア間の差が所定値よりも大きい場合には複数の候補音節のうちそのスコアが最も大きい候補音節を報知することが考えられる。具体的には、請求項12のように、制御手段が、報知処理を実行する際に、音声認識手段が特定した複数の候補音節のうちそのスコアが最も大きい候補音節とその他の候補音節とのスコア間の差が所定値よりも大きい場合には複数の候補音節のうちそのスコアが最も大きい候補音節のみを報知手段に報知させることが考えられる。
このように構成すれば、話者が意図する音節である可能性が低い候補音節を報知せずに、話者が意図する音節である可能性が最も高い候補音節のみを報知することができ、運転者の運転活動を極力妨げないようにすることができる。
以下に本発明の実施形態を図面とともに説明する。
[第一実施形態]
図1は、音声認識機能を有するナビゲーション装置1の構成を示すブロック図である。
[第一実施形態]
図1は、音声認識機能を有するナビゲーション装置1の構成を示すブロック図である。
[ナビゲーション装置1の構成の説明]
図1に示すように、ナビゲーション装置1は車両に搭載され、車両の現在位置を検出する位置検出器2と、ユーザからの各種指示を入力するための操作スイッチ群3aと、操作スイッチ群3aと同様に各種指示を入力可能であってナビゲーション装置1とは別体となったリモートコントロール端末(以下、リモコンと称す)3cと、リモコン3cからの信号を入力するリモコンセンサ3bと、地図データや音声認識データ、各種の情報を記録した外部記憶媒体から地図データ等を入力する外部データ入力器7aと、地図や各種情報の表示を行うための表示装置6bと、各種のガイド音声等を出力するためのスピーカ6aと、音声を入力して音声情報を出力する音声入力手段4と、上述した位置検出器2や操作スイッチ群3a、リモコンセンサ3b、外部データ入力器7a、音声入力手段4からの入力に応じて各種処理を実行し、表示装置6b、スピーカ6aを制御する制御部5と、を備えている。
図1に示すように、ナビゲーション装置1は車両に搭載され、車両の現在位置を検出する位置検出器2と、ユーザからの各種指示を入力するための操作スイッチ群3aと、操作スイッチ群3aと同様に各種指示を入力可能であってナビゲーション装置1とは別体となったリモートコントロール端末(以下、リモコンと称す)3cと、リモコン3cからの信号を入力するリモコンセンサ3bと、地図データや音声認識データ、各種の情報を記録した外部記憶媒体から地図データ等を入力する外部データ入力器7aと、地図や各種情報の表示を行うための表示装置6bと、各種のガイド音声等を出力するためのスピーカ6aと、音声を入力して音声情報を出力する音声入力手段4と、上述した位置検出器2や操作スイッチ群3a、リモコンセンサ3b、外部データ入力器7a、音声入力手段4からの入力に応じて各種処理を実行し、表示装置6b、スピーカ6aを制御する制御部5と、を備えている。
位置検出器2は、車両に加えられる回転運動の大きさを検出するジャイロスコープ2aと、地磁気から進行方位を検出するための地磁気センサ2bと、車両の速度を検出するための車速センサ2cと、GPS(Global Positioning System)用の人工衛星からの送信電波をGPSアンテナを介して受信し、車両の位置、方位、速度等を検出するGPS受信機2dと、を備えている。そして、これら各センサ等2a〜2dは、各々が性質の異なる誤差を有しているため、互いに補完しながら使用するように構成されている。
操作スイッチ群3aは、表示装置6bの表示面と一体に構成されたタッチパネル及び表示装置6bの周囲に設けられたメカニカルなキースイッチ等から構成される。なお、タッチパネルと表示装置6bとは積層一体化されており、タッチパネルには、感圧方式、電磁誘導方式、静電容量方式、あるいはこれらを組み合わせた方式など各種の方式があるが、その何れを用いてもよい。
なお、操作スイッチ群3a、リモコンセンサ3bおよびリモコン3cが操作受付部3を構成する。
外部データ入力器7aは、外部記憶媒体7bに記憶された各種データを入力するための装置である。外部記憶媒体7bには、地図データ(道路データ、地形データ、マークデータ、交差点データ、施設のデータ等)、案内用の音声データ、音声認識データ等が記憶されている。なお、音声認識データとしては、単音節を認識するための特徴パラメータ、単音節毎に対応づけられた複数音節からなる単音節認識用特定語によって構成される辞書、単音節毎に対応づけられた複数音節からなる確認用単語によって構成される辞書等が挙げられる。このようなデータを記憶する外部記憶媒体7bの種類としては、CD−ROMやDVD等が一般的であるが、ハードディスクなどの磁気記憶装置やメモリカード等の媒体を用いても良い。
外部データ入力器7aは、外部記憶媒体7bに記憶された各種データを入力するための装置である。外部記憶媒体7bには、地図データ(道路データ、地形データ、マークデータ、交差点データ、施設のデータ等)、案内用の音声データ、音声認識データ等が記憶されている。なお、音声認識データとしては、単音節を認識するための特徴パラメータ、単音節毎に対応づけられた複数音節からなる単音節認識用特定語によって構成される辞書、単音節毎に対応づけられた複数音節からなる確認用単語によって構成される辞書等が挙げられる。このようなデータを記憶する外部記憶媒体7bの種類としては、CD−ROMやDVD等が一般的であるが、ハードディスクなどの磁気記憶装置やメモリカード等の媒体を用いても良い。
表示装置6bは、カラー表示装置であり、液晶ディスプレイ、有機ELディスプレイ、CRTなどがあるが、その何れを用いてもよい。表示装置6bの表示画面には、位置検出器2にて検出した車両の現在位置と外部データ入力器7aより入力された地図データとから特定した現在地を示すマーク、目的地までの誘導経路、名称、目印、各種施設のマーク等の付加データとを重ねて表示することができる。また、施設のガイド等も表示できる。
スピーカ6aは、外部データ入力器7aより入力した施設のガイドや各種案内の音声を出力することができる。
なお、表示装置6bおよびスピーカ6aが音声出力部6を構成する。
なお、表示装置6bおよびスピーカ6aが音声出力部6を構成する。
音声入力手段4は、利用者が音声を入力(発話)するとその入力した音声に基づく電気信号(音声信号)を制御部5に出力するものである。利用者はこの音声入力手段4に様々な音声を入力することにより、ナビゲーション装置1を操作することができる。
制御部5は、CPU、ROM、RAM、I/Oおよびこれらの構成を接続するバスラインなどからなる周知のマイクロコンピュータを中心に構成されており、ROMおよびRAMに記憶されたプログラムに基づいて各種処理を実行する。例えば、位置検出器2からの各検出信号に基づき座標及び進行方向の組として車両の現在位置を算出し、外部データ入力器7aを介して読み込んだ現在位置付近の地図等を表示装置26に表示する表示処理や、外部データ入力器7aに格納された地点データと、操作スイッチ群3aやリモコン3c等の操作に従って設定された目的地とに基づいて、現在位置から目的地までの最適な経路を算出し、その算出した経路を案内する経路案内処理を行う。また、制御部5は後述する音声認識処理を実行することができる。
また、制御部5は、位置検出器2からの出力信号に基づき、当該ナビゲーション装置1の現在位置を検出する現在位置検出手段5a、操作受付部3からの出力信号に基づき、ユーザの操作入力を検出する操作入力検出手段5b、音声入力手段4からの出力信号に基づいて音声認識を実行する音声認識手段5c、現在位置検出手段5aから出力されたデータや、音声認識手段5cから出力されたデータを処理するデータ処理手段5d、データ処理手段5dによる処理結果を出力する方法を選択する出力方法選択手段5e、データ処理手段5dによる処理結果および外部データ入力器7aから入力された各種データを内蔵する内部記憶媒体に記憶する検索データ格納手段5f、音声認識手段5cから出力されたデータおよびデータ処理手段5dによる処理結果を記憶するキーワード&文法データ格納手段5g、を備える。
なお、本実施形態では、制御部5が上述のHMM手法を用いて音声認識を行っている。
ここで、音声認識で一般的に用いられるHMM(隠れマルコフモデル)手法について簡単に説明する。本手法は、音声を状態と遷移で表現されたマルコフモデルから生成されるものであると仮定して、生成モデルを事前に作成しておき、それと音声とを突き合わせ(マッチング)、最もよくマッチングするものを認識結果とするものである。最終的には音声の終端までの確からしさの積(尤度と呼ばれるスコア)が最も良いものを認識結果とする。なお、本実施形態では、制御部5が上述のHMM手法を用いて音声認識を行っているが、他の手法を用いて音声認識を行ってもよい。
ここで、音声認識で一般的に用いられるHMM(隠れマルコフモデル)手法について簡単に説明する。本手法は、音声を状態と遷移で表現されたマルコフモデルから生成されるものであると仮定して、生成モデルを事前に作成しておき、それと音声とを突き合わせ(マッチング)、最もよくマッチングするものを認識結果とするものである。最終的には音声の終端までの確からしさの積(尤度と呼ばれるスコア)が最も良いものを認識結果とする。なお、本実施形態では、制御部5が上述のHMM手法を用いて音声認識を行っているが、他の手法を用いて音声認識を行ってもよい。
ここまででナビゲーション装置1の概略構成を説明したが、ナビゲーション装置1の各部と特許請求の範囲に記載の用語との対応を示す。音声入力手段4が音声入力手段に相当し、音声出力部6が報知手段に相当し、表示装置6bが報知手段に相当し、操作スイッチ群3aおよびリモコン3cが受付手段に相当し、制御部5が音声認識手段および制御手段に相当する。
[音声認識処理の説明]
次に、ナビゲーション装置1の制御部5が実行する音声認識処理について図2のフローチャートおよび図3を参照して説明する。なお、図3は音声認識処理を説明する説明図である。
次に、ナビゲーション装置1の制御部5が実行する音声認識処理について図2のフローチャートおよび図3を参照して説明する。なお、図3は音声認識処理を説明する説明図である。
この音声認識処理は、ナビゲーション装置1への情報入力の際に音声入力が可能な状態で利用者が特に指示した際に実行が開始される。
まず、音声認識開始スイッチが押下されていると判断されるまで待機し、音声認識開始スイッチが押下されていると判断された場合には(図3(a)参照)、音声入力を受け付ける(S110、図3(b)参照)。具体的には、音声入力手段4を介して入力された音声をA/D変換器によってデジタル信号に変換し、その変換されたデジタル信号を分析(特徴パラメータ等を抽出)する。
まず、音声認識開始スイッチが押下されていると判断されるまで待機し、音声認識開始スイッチが押下されていると判断された場合には(図3(a)参照)、音声入力を受け付ける(S110、図3(b)参照)。具体的には、音声入力手段4を介して入力された音声をA/D変換器によってデジタル信号に変換し、その変換されたデジタル信号を分析(特徴パラメータ等を抽出)する。
続いて、音声認識を実行する(S120)。具体的には、分析したデジタル信号を、外部データ入力器7aを外部記憶媒体7bから取得した音節の特徴パラメータ等と比較して、候補音節をそのスコアに応じて候補順を付けて複数選択する。
続いて、選択された候補音節をその候補順に表示装置6bに表示させる(S130、図3(c)参照)。
続いて、操作受付部3が受け付けた操作入力があるか否かを判断する(S140)。操作受付部3が受け付けた操作入力があると判断された場合には(S140:YES)、その操作入力によって選択された候補音節(図3(e)参照)を、話者の意図する音節として確定する(S150、図3(d)および図3(f)参照))。そして、後述するS180に移行する。
続いて、操作受付部3が受け付けた操作入力があるか否かを判断する(S140)。操作受付部3が受け付けた操作入力があると判断された場合には(S140:YES)、その操作入力によって選択された候補音節(図3(e)参照)を、話者の意図する音節として確定する(S150、図3(d)および図3(f)参照))。そして、後述するS180に移行する。
一方、操作受付部3が受け付けた操作入力がないと判断された場合には(S140:NO)、音声入力手段4を介して音声入力があるか否かを判断する(S160)。音声入力がないと判断された場合には(S160:NO)、S140に戻って以下の処理を実行する。一方、音声入力があると判断された場合には(S160:YES)、その音声入力によって選択された候補音節を、話者の意図する音節として確定する(S170)。そして、後述するS180に移行する。
S180では、続いて実行すべき処理があるか否かを判断する。続いて実行すべき処理があると判断された場合には(S180:YES)、S110に戻って以下の処理を実行する。一方、続いて実行すべき処理がないと判断された場合には(S180:NO)、本処理を終了する。
[第一実施形態の効果]
(1)このように第一実施形態の音声認識機能を有するナビゲーション装置1によれば、次のような作用効果を奏する。すなわち、例えば、楽曲名やアーティスト名を音声認識によって選択する場合に、同名の曲や歌手が存在する。このような場合において、曲名Aを入力した場合に、歌手A、歌手B、歌手Cの可能性がある場合に、「歌手Aですか、Bですか、Cですか」と問いかけるか、または「次の候補」などの音声命令により順々に候補を提示する形態が考えられる。しかし、わざわざ音声で何度も喋るよりも、手操作で選択した方が早い。そこで、複数の候補音節を表示し(S130)、報知された候補音節のうちの何れかを選択する意図の操作を話者より操作受付部3が受け付けた場合には、その操作によって特定された候補音節を話者の意図する音節として選択する選択処理を実行し、話者より決定を意味する操作を操作受付部3が受け付けた場合には、直前の選択処理の際に選択された候補音節を話者の意図する音節として確定する確定処理を実行する(S150、S170)。したがって、ドライバーの運転活動を極力妨げずに、認識率を向上させることができる。
(1)このように第一実施形態の音声認識機能を有するナビゲーション装置1によれば、次のような作用効果を奏する。すなわち、例えば、楽曲名やアーティスト名を音声認識によって選択する場合に、同名の曲や歌手が存在する。このような場合において、曲名Aを入力した場合に、歌手A、歌手B、歌手Cの可能性がある場合に、「歌手Aですか、Bですか、Cですか」と問いかけるか、または「次の候補」などの音声命令により順々に候補を提示する形態が考えられる。しかし、わざわざ音声で何度も喋るよりも、手操作で選択した方が早い。そこで、複数の候補音節を表示し(S130)、報知された候補音節のうちの何れかを選択する意図の操作を話者より操作受付部3が受け付けた場合には、その操作によって特定された候補音節を話者の意図する音節として選択する選択処理を実行し、話者より決定を意味する操作を操作受付部3が受け付けた場合には、直前の選択処理の際に選択された候補音節を話者の意図する音節として確定する確定処理を実行する(S150、S170)。したがって、ドライバーの運転活動を極力妨げずに、認識率を向上させることができる。
(2)また、第一実施形態のナビゲーション装置1によれば、音声認識処理において、候補音節をそのスコアに応じて候補順を付けて複数選択し、その選択された候補音節をその候補順に表示装置6bに表示させる(S130)。このことにより、例えば操作受付部3のタッチパネルを見る際の運転者の視線の動きが少なくて済み、運転者の運転活動を極力妨げないようにすることができる。また、例えば運転者による操作受付部3の操作スイッチ群3aの操作が少なくなりやすく、運転者の運転活動を極力妨げないようにすることができる。
[他の実施形態]
以上、本発明の一実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、以下のような様々な態様にて実施することが可能である。
以上、本発明の一実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、以下のような様々な態様にて実施することが可能である。
(1)上記第一実施形態では、操作受付部3が操作スイッチ群3a、リモコンセンサ3bおよびリモコン3cから構成されているが、これには限られず、操作受付部3が、図示しないステアリングに設けられたメカニカルなキースイッチ等から構成されるようにしてもよい。なおこの場合、キースイッチ等は、運転者が運転中でも操作しやすくする観点から、運転中の運転者の視界の範囲内に位置し、且つ運転中の運転者の視界の範囲内に位置するステアリングに設置される。そして、キースイッチ等は、ユーザから操作に基づき、音量の増加や減少を指示する信号を各種ECUへ車内LANを介して出力し、その信号をナビゲーション装置1が取得するように構成される。
このように構成しても、運転者が運転中でも操作受付部3を操作しやすく、ナビゲーション装置1の利便性を高めることができる。
(2)また、運転者の手が届く範囲内であれば操作受付部3が他の場所に設置されていてもよい。一例を挙げると、操作受付部3を図示しないインストルメントパネル周辺に設置するといった具合である。このように構成しても、運転者が運転中でも操作受付部3を操作しやすく、ナビゲーション装置1の利便性を高めることができる。
(2)また、運転者の手が届く範囲内であれば操作受付部3が他の場所に設置されていてもよい。一例を挙げると、操作受付部3を図示しないインストルメントパネル周辺に設置するといった具合である。このように構成しても、運転者が運転中でも操作受付部3を操作しやすく、ナビゲーション装置1の利便性を高めることができる。
(3)また、上記実施形態の音声認識機能をナビゲーション装置1以外の車載器が備える構成を利用して実現してもよい。このように構成しても上記実施形態と同様の作用効果を奏する。
(4)また、上記音声認識処理のS120において、選択した候補音節が所定数以上の単音節で構成されているか否かを判断し、選択した候補音節が所定数以上の単音節で構成されてと判断された場合に、S130のようにその選択された候補音節をその候補順に表示装置6bに表示させるようにしてもよい。このようにすれば、音声入力された受け対象の言葉(単語、フレーズ)の数量が多いときであっても、認識結果の正解率を高くすることができる。
(5)また、上記音声認識処理のS120において、選択された複数の候補音節のスコア間の差が所定値よりも小さいか否かを判断し、選択された複数の候補音節のスコア間の差が所定値よりも小さいと判断された場合に、S130にようにその選択された候補音節をその候補順に表示装置6bに表示させるようにしてもよい。
このようにすれば、次のような作用効果を奏する。すなわち、例えば、楽曲名やアーティスト名を音声認識によって選択する場合に、同名の曲や歌手が存在する。このような場合において、曲名Aを入力した場合に、曲A以外に、曲名の似ている曲名A1や曲名A2、曲名A3などの可能性がある場合に、「あなたの話した曲名は、この中のどれですか」と問いかけて、候補を選択してもらった方が確実に入力できる場合がある。このような場合には、再度音声で入力しても同じ間違いをしてしまう場合が考えられ、手操作で選択した方が確実である。そこで、選択された複数の候補音節のスコア間の差が所定値よりも小さいか否かを判断し、選択された複数の候補音節のスコア間の差が所定値よりも小さいと判断された場合に、その選択された候補音節をその候補順に表示装置6bに表示させる。つまり、話者が意図する音節である可能性があるすべての候補音節を報知することによって、話者が意図する音節を迅速に選択することができ、したがって、運転者の運転活動を極力妨げないようにすることができる。
(6)また、上記音声認識処理のS120において、選択された複数の候補音節のうちそのスコアが最も大きい候補音節とその他の候補音節とのスコア間の差が所定値よりも大きいか否かを判断し、そのスコアが最も大きい候補音節とその他の候補音節とのスコア間の差が所定値よりも大きいと判断された場合に、S130にようにその選択された複数の候補音節のうちそのスコアが最も大きい候補音節のみをその候補順に表示装置6bに表示させるようにしてもよい。ここで、スコアとは、音声の終端までの確からしさの積を云い、尤度とも呼ばれる。このようにすれば、話者が意図する音節である可能性が低い候補音節を報知せずに、話者が意図する音節である可能性が最も高い候補音節のみを報知することができ、運転者の運転活動を極力妨げないようにすることができる。
1…ナビゲーション装置、2…位置検出器、2a…ジャイロスコープ、2b…地磁気センサ、2c…車速センサ、2d…GPS受信機、3…操作受付部、3a…操作スイッチ群、3b…リモコンセンサ、3c…リモコン、4…音声入力手段、5…制御部、5a…現在位置検出手段、5b…操作入力検出手段、5c…音声認識手段、5d…データ処理手段、5e…出力方法選択手段、5f…検索データ格納手段、5g…文法データ格納手段、6…音声出力部、6a…スピーカ、6b…表示装置、7a…外部データ入力器、7b…外部記憶媒体
Claims (12)
- 車両に搭載され、話者によって入力された音声に基づいて話者の意図する音節を決定する音声認識装置であって、
話者の発声した音声を入力する音声入力手段と、
前記音声入力手段が入力した音声を分析して候補音節を特定する音声認識手段と、
指定された情報を報知する報知手段と、
話者の操作を受け付ける受付手段と、
前記音声認識手段が特定した候補音節を前記報知手段に報知させる報知処理を実行し、直前の前記報知処理の際に報知させた前記候補音節のうちの何れかを選択する意図の操作を話者より前記受付手段が受け付けた場合にはその操作によって特定された候補音節を話者の意図する音節として選択する選択処理を実行し、話者より決定を意味する操作を前記受付手段が受け付けた場合には直前の前記選択処理の際に選択された候補音節を話者の意図する音節として確定する確定処理を実行する制御手段と、
を備えることを特徴とする音声認識装置。 - 請求項1に記載の音声認識装置において、
前記受付手段は、運転者の手が届く範囲内に配置されていることを特徴とする音声認識装置。 - 請求項1または請求項2に記載の音声認識装置において、
前記受付手段は、運転中の運転者の視界の範囲内に配置されていることを特徴とする音声認識装置。 - 請求項1〜請求項3の何れかに記載の音声認識装置において、
前記受付手段は、ステアリングに設置されていることを特徴とする音声認識装置。 - 請求項1〜請求項4の何れかに記載の音声認識装置において、
前記受付手段は、インストルメントパネル周辺に設置されていることを特徴とする音声認識装置。 - 請求項1〜請求項5の何れかに記載の音声認識装置において、
前記受付手段は、タッチパネルとして構成されていることを特徴とする音声認識装置。 - 請求項1〜請求項5の何れかに記載の音声認識装置において、
前記受付手段は、キースイッチ群として構成されていることを特徴とする音声認識装置。 - 請求項1〜請求項5の何れかに記載の音声認識装置において、
前記受付手段は、リモコンとして構成されていることを特徴とする音声認識装置。 - 請求項1〜請求項8の何れかに記載の音声認識装置において、
前記制御手段は、前記報知処理を実行する際に、そのスコアの高い順に前記候補音節を報知させることを特徴とする音声認識装置。 - 請求項1〜請求項9の何れかに記載の音声認識装置において、
前記制御手段は、前記報知処理を実行する際に、前記音声認識手段が特定した候補音節が所定数以上の単音節で構成されている場合には、前記候補音節を前記報知手段に報知させることを特徴とする音声認識装置。 - 請求項1〜請求項10の何れかに記載の音声認識装置において、
前記制御手段は、前記報知処理を実行する際に、前記音声認識手段が特定した複数の候補音節のスコア間の差が所定値よりも小さい場合には前記複数の候補音節を前記報知手段に報知させることを特徴とする音声認識装置。 - 請求項1〜請求項11の何れかに記載の音声認識装置において、
前記制御手段は、前記報知処理を実行する際に、前記音声認識手段が特定した複数の候補音節のうちそのスコアが最も大きい候補音節とその他の候補音節とのスコア間の差が所定値よりも大きい場合には前記複数の候補音節のうちそのスコアが最も大きい候補音節のみを前記報知手段に報知させることを特徴とする音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006352741A JP2008164809A (ja) | 2006-12-27 | 2006-12-27 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006352741A JP2008164809A (ja) | 2006-12-27 | 2006-12-27 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008164809A true JP2008164809A (ja) | 2008-07-17 |
Family
ID=39694427
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006352741A Pending JP2008164809A (ja) | 2006-12-27 | 2006-12-27 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008164809A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4876198B1 (ja) * | 2010-11-12 | 2012-02-15 | パイオニア株式会社 | 情報出力装置、情報出力方法、情報出力プログラム及び情報システム |
JP2016048338A (ja) * | 2014-08-28 | 2016-04-07 | アルパイン株式会社 | 音声認識装置及びコンピュータプログラム |
WO2019163011A1 (ja) * | 2018-02-21 | 2019-08-29 | 三菱電機株式会社 | 表示制御装置および表示制御方法 |
CN112614490A (zh) * | 2020-12-09 | 2021-04-06 | 北京罗克维尔斯科技有限公司 | 生成语音指令的方法、装置、介质、设备、系统及车辆 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06282293A (ja) * | 1993-03-29 | 1994-10-07 | Sony Corp | 音声認識装置 |
JPH09114487A (ja) * | 1995-10-16 | 1997-05-02 | Sony Corp | 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車 |
JP2005053331A (ja) * | 2003-08-04 | 2005-03-03 | Nissan Motor Co Ltd | 車載機器用情報提示装置 |
-
2006
- 2006-12-27 JP JP2006352741A patent/JP2008164809A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06282293A (ja) * | 1993-03-29 | 1994-10-07 | Sony Corp | 音声認識装置 |
JPH09114487A (ja) * | 1995-10-16 | 1997-05-02 | Sony Corp | 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車 |
JP2005053331A (ja) * | 2003-08-04 | 2005-03-03 | Nissan Motor Co Ltd | 車載機器用情報提示装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4876198B1 (ja) * | 2010-11-12 | 2012-02-15 | パイオニア株式会社 | 情報出力装置、情報出力方法、情報出力プログラム及び情報システム |
JP2016048338A (ja) * | 2014-08-28 | 2016-04-07 | アルパイン株式会社 | 音声認識装置及びコンピュータプログラム |
WO2019163011A1 (ja) * | 2018-02-21 | 2019-08-29 | 三菱電機株式会社 | 表示制御装置および表示制御方法 |
US11243741B2 (en) | 2018-02-21 | 2022-02-08 | Mitsubishi Electric Corporation | Display control device and display control method |
CN112614490A (zh) * | 2020-12-09 | 2021-04-06 | 北京罗克维尔斯科技有限公司 | 生成语音指令的方法、装置、介质、设备、系统及车辆 |
CN112614490B (zh) * | 2020-12-09 | 2024-04-16 | 北京罗克维尔斯科技有限公司 | 生成语音指令的方法、装置、介质、设备、系统及车辆 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7392194B2 (en) | Voice-controlled navigation device requiring voice or manual user affirmation of recognized destination setting before execution | |
US7822613B2 (en) | Vehicle-mounted control apparatus and program that causes computer to execute method of providing guidance on the operation of the vehicle-mounted control apparatus | |
JP4506855B2 (ja) | カーナビゲーションシステム | |
JP2009139544A (ja) | 入力装置 | |
JP4997796B2 (ja) | 音声認識装置、及びナビゲーションシステム | |
WO2007069573A1 (ja) | 移動体用入力装置、及び方法 | |
JP2008282224A (ja) | 車載情報検索装置 | |
JP2008014818A (ja) | 作動制御装置、プログラム | |
JPH09292255A (ja) | ナビゲーション方法及び装置 | |
JP2007145106A (ja) | 車載情報端末 | |
JP2008164809A (ja) | 音声認識装置 | |
JP2010039099A (ja) | 音声認識および車載装置 | |
JP2009031943A (ja) | 施設特定装置、施設特定方法及びコンピュータプログラム | |
JP2000338993A (ja) | 音声認識装置、その装置を用いたナビゲーションシステム | |
JP5233431B2 (ja) | 車載表示システム | |
JP4453377B2 (ja) | 音声認識装置、プログラム及びナビゲーション装置 | |
JP2002350146A (ja) | ナビゲーション装置 | |
JP2007101892A (ja) | 音声認識装置 | |
JP3818352B2 (ja) | ナビゲーション装置及び記憶媒体 | |
JP4938719B2 (ja) | 車載情報システム | |
JP2006039954A (ja) | データベース検索装置、プログラム及びナビゲーション装置 | |
JPWO2006028171A1 (ja) | データ提示装置、データ提示方法、データ提示プログラムおよびそのプログラムを記録した記録媒体 | |
JP4652504B2 (ja) | 音声認識装置および音声認識ナビゲーション装置 | |
JP2019109657A (ja) | ナビゲーション装置およびナビゲーション方法、ならびにプログラム | |
JP5028045B2 (ja) | 車載表示装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110906 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120327 |