JP2011232668A

JP2011232668A - 音声認識機能を備えたナビゲーション装置およびその検出結果提示方法

Info

Publication number: JP2011232668A
Application number: JP2010104863A
Authority: JP
Inventors: Hisashi Takahashi; 久高橋; Hiroaki Kokubo; 浩明小窪; Takeshi Honma; 健本間; Hiroaki Takatsuki; 宏明高月; Hitoshi Yamadera; 仁山寺; Takahiro Inada; 高洋稲田; Yoshiaki Suzuki; 義章鈴木
Original assignee: Clarion Co Ltd
Current assignee: Faurecia Clarion Electronics Co Ltd
Priority date: 2010-04-30
Filing date: 2010-04-30
Publication date: 2011-11-17

Abstract

【課題】音声認識により、利用者の意図する語彙に、より一致する語彙を検出し、提示することができる。
【解決手段】利用者から受け付けた音声データおよび該音声データに基づいて検出された語彙が、誤認識データに記憶されている音声データおよび該音声データに対応付けられた語彙である場合、検出手段が検出した他の語彙を高順位で利用者に提示する。
【選択図】図１

Description

本発明は、音声認識機能を備えたナビゲーション装置およびその検出結果提示方法に関する。

ナビゲーション装置には音声認識機能を備えたものがある。このようなナビゲーション装置では、音声の誤認識を防止するため、種々の対策が講じられている。

例えば、特許文献１では、利用者以外の音声情報を除去することにより、音声の誤認識を防止している。

特開２００９−０８６１３２号公報

しかしながら、利用者以外の音声情報を除去しても、利用者ごとに発音の特徴が異なるため、音声認識機能が利用者の意図する語彙を特定できない場合がある。また、発音の特徴を学習して、利用者ごとに音声認識のパラメータを変更することも考えられる。しかしながら、パラメータを変更してしまうと、音素特性が類似する他の語彙までも音声認識の対象から除外されてしまうことがあるため、このような方法の適用も難しい。したがって、従来の技術では、利用者の意図する語彙に一致する語彙を検索し、提示することが難しいという問題がある。

そこで、本発明は、音声認識により、利用者の意図する語彙に、より一致する語彙を検出し、提示できるナビゲーション装置の提供を目的とする。

上記課題を解決するため、本発明に係るナビゲーション装置は、辞書データを有し、音声認識できる。また、誤認識され得る音声データが、誤認識結果の語彙に対応付けられた誤認識データを記憶するための記憶手段と、利用者から音声データを受け付ける音声データ受け付け手段と、音声データの分析結果に基づいて、辞書データから所定数の語彙を検出する検出手段と、利用者から受け付けた音声データおよび該音声データに基づいて検出された語彙が、誤認識データに記憶されている音声データおよび該音声データに対応付けられた語彙である場合、検出手段が検出した他の語彙を高順位で利用者に提示する語彙提示手段と、を有する、という構成を特徴とする。

本発明に係るナビゲーション装置よれば、音声認識により、利用者の意図する語彙に、より一致する語彙を検出し、提示することができる。

本発明の一実施形態に係るナビゲーション装置の概略構成図である。本発明の一実施形態に係る音響モデルの音素を表現したＨＭＭを示す図である。本発明の一実施形態に係る辞書データを示す図である。本発明の一実施形態に係る低順位データを示す図である。本発明の一実施形態に係るナビゲーション装置の機能ブロックを示す図である。本発明の一実施形態に係るナビゲーション装置の音声認識処理を示すフロー図である。本発明の一実施形態に係るナビゲーション装置の画面例である。本発明の一実施形態に係るナビゲーション装置で検索された候補リストの一例を示した図である。本発明の一実施形態に係るナビゲーション装置の画面例である。本発明の一実施形態に係るナビゲーション装置で実行される検索結果提示処理のイメージ図である。

以下、本発明の一実施形態について図面を用いて説明する。

図１は車載用ナビゲーション装置１００の概略構成図である。車載用ナビゲーション装置１００は、演算処理部１と、出力装置１０と、記憶装置１１と、音声入出力装置１２（音声入力装置としてマイクロフォン１３、音声出力装置としてスピーカ１４）と、入力装置１５と、ＲＯＭ装置１６と、車速センサ１７と、ジャイロセンサ１８と、ＧＰＳ(Global Positioning System)受信装置１９と、ＦＭ多重放送受信装置２０と、ビーコン受信装置２１と、を備えている。

演算処理部１は、様々な処理を行う中心的ユニットである。例えば、車速センサ１７、ジャイロセンサ１８、ＧＰＳ受信装置１９、ＦＭ多重放送受信装置２０、またはビーコン受信装置２１から出力される情報を基にして現在地を検出する。また、得られた現在地情報に基づいて、表示に必要な地図データを記憶装置１１あるいはＲＯＭ装置１６から読み出す。また、読み出した地図データをグラフィックス展開し、そこに現在地を示すマークを重ねて出力装置１０へ表示する。また、記憶装置１１あるいはＲＯＭ装置１６に記憶されている地図データ等を用いて、ユーザから指示された出発地または現在地と、目的地と、を結ぶ最適な経路（以下、「推奨経路」という）を探索する。また、スピーカ１４や出力装置１０を用いてユーザを誘導する。

演算処理部１は、各デバイス間をバス６で接続した構成である。演算処理部１は、数値演算及び各デバイスを制御するといった様々な処理を実行するＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）２と、記憶装置１１から読み出した地図データ、演算データなどを格納するＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）３と、プログラムやデータを格納するＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）４と、各種ハードウェアを演算処理部１に接続するインターフェイスであるＩ／Ｆ５と、を有する。

出力装置１０は、演算処理部１で生成されたグラフィックス情報を表示するユニットである。例えば、出力装置１０はグラフィックス情報を表示するための液晶ディスプレイ、有機ＥＬディスプレイなどで構成される。

記憶装置１１は、ＨＤＤ（Hard Disk Drive）や不揮発性メモリカードといった、少なくとも読み書きが可能な記憶媒体で構成される。

記憶装置１１には、例えば、通常の経路探索装置に必要な地図データ（地図上の道路を構成するリンクのリンクデータを含む）であるリンクテーブル、交通情報テーブル、経路情報および区間情報などが記憶されている。

交通情報テーブル（図示せず）は、例えば、ＦＭ多重放送受信装置２０やビーコン受信装置２１等の通信装置を介して、図示しない外部の機関等から送信された交通情報を記憶するテーブルである。また、経路情報（図示せず）は、ナビゲーション装置１００等による経路探索の結果得られた経路に関する情報である。また、区間情報（図示せず）は、例えば一つまたは複数のリンクが連結された区間ごとに、区間を構成するリンクなどを含む情報である。

また、記憶装置１１には、各音素に対応する音響モデルと、辞書データおよび文法データを有する言語モデルと、利用者の意図と異なる単語およびその特徴量を対応付けて記憶した低順位データと、が記憶されている。

図２は、音響モデルの表現形態として各音素を３状態で定義したＨＭＭ（ＨｉｄｄｅｎＭａｒｃｏｖＭｏｄｅｌ）である。また、図３は、言語モデルの辞書データ３０である。辞書データ３０は、音声認識の対象となる単語３１と、その音素列３２とが対応付けて登録されている。また、各単語には、その出現頻度に応じた出現確率３３が対応付けられている。ここで、単語３１とは、音声認識の対象となる、あるまとまった固まりのことをいう。また、文法データ（図示せず）には、辞書データ３０に登録されている単語の相互の接続規則が記述されている。すなわち、文法データには、音声認識可能な単語列が登録されている。

図４は、低順位データ４０の一例を示す。低順位データ４０には、利用者の音声データから変換された特徴ベクトル列の特徴量４１と、かかる特徴量から検索した単語であって、利用者が意図しない単語であると評価した単語が登録される低順位リスト４２と、が対応付けて記憶されている。なお、低順位データ４０の作成処理については後述する。

再び図１に戻って説明する。音声入出力装置１２は、音声入力装置としてマイクロフォン１３と、音声出力装置としてスピーカ１４と、を備える。マイクロフォン１３は、ユーザやその他の搭乗者が発した声などの車載用ナビゲーション装置１００の外部の音声を取得する。

スピーカ１４は、演算処理部１で生成されたユーザへのメッセージを音声信号として出力する。マイクロフォン１３とスピーカ１４は、車両の所定の部位に、別個に配されている。ただし、一体の筐体に収納されていても良い。車載用ナビゲーション装置１００は、マイクロフォン１３及びスピーカ１４を、それぞれ複数備えることができる。

入力装置１５は、ユーザからの指示を、ユーザによる操作を介して受け付ける装置である。入力装置１５は、方向キー３１と、ダイヤルスイッチ３２と、タッチパネル３３と、その他のハードスイッチ（図示しない）である縮尺変更キーなどで構成される。

方向キー３１は、例えば、上下左右および各斜め方向を示す８つのハードスイッチから構成され、出力装置１０に表示されるメニュー項目の選択や、地図画像のスクロール方向を決定する際に用いられる。方向キーによって示される各方向は、選択するメニュー項目の移動方向や、出力装置１０の表示エリアの移動方向を示す。例えば、複数列あるメニュー項目を選択する場合、左方向を示す方向キーを押すと、左の列に配列されているメニュー項目を選択することができる（図示せず）。また、地図画像をスクロールさせる場合、例えば、左方向を示す方向キーを押すと、出力装置１０の表示エリアは左方向に移動する。なお、このような方向キー３１は、ダイヤルスイッチ３２の一部に設けられてもよい。

ダイヤルスイッチ２３は、時計回り及び反時計回りに回転可能に構成され、所定の角度の回転ごとにパルス信号を発生し、演算処理部１に出力する。演算処理部１に入力されたパルス信号の数から、ダイヤルスイッチ２３の回転角度が求められる。

タッチパネル２４は、出力装置１０の表示面側に搭載され、表示画面を透視可能である。タッチパネル２４は、人の指によるタッチや専用のタッチペンによるタッチを検知する。ユーザによるタッチ位置は、例えば、タッチパネル２４上に設定されるＸＹ座標に基づき特定される。このようなタッチパネル２４は、例えば、静電容量方式による入力検出素子などで構成される。

ＲＯＭ装置１６は、ＣＤ-ＲＯＭやＤＶＤなどのＲＯＭやＩＣ（ＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）カードといった、少なくとも読み取りが可能な記憶媒体で構成されている。この記憶媒体には、例えば、動画データや、音声データなどが記憶されている。

車速センサ１７,ジャイロセンサ１８およびＧＰＳ受信装置１９は、車載用ナビゲーション装置１００において現在地（自車位置）を検出するために使用されるものである。

車速センサ１７は、車速を算出するのに用いる値を出力するセンサである。ジャイロセンサ１８は、光ファイバジャイロや振動ジャイロ等で構成され、移動体の回転による角速度を検出するものである。ＧＰＳ受信装置１９は、ＧＰＳ衛星からの信号を受信し移動体とＧＰＳ衛星間の距離と距離の変化率を３個以上の衛星に対して測定することで移動体の現在地、進行速度および進行方位を測定し、演算処理部１に送信するものである。

ＦＭ多重放送受信装置２０は、ＦＭ放送局から送られてくるＦＭ多重放送信号を受信する。ＦＭ多重放送には、ＶＩＣＳ（Vehicle Information Communication System：登録商標）情報の概略現況交通情報、規制情報、ＳＡ／ＰＡ（サービスエリア／パーキングエリア）情報、駐車場情報、天気情報などやＦＭ多重一般情報としてラジオ局が提供する文字情報などがある。

ビーコン受信装置２１は、光ビーコン、電波ビーコン等の信号を受信する。ビーコン等の信号には、ＶＩＣＳ情報の概略現況交通情報、規制情報、ＳＡ／ＰＡ（サービスエリア／パーキングエリア）情報、駐車場情報などがある。

次に、本実施形態に係るナビゲーション装置１００の機能ブロックについて説明する。

図５はナビゲーション装置１００の機能ブロック図である。ナビゲーション装置１００は、分析部５１と、音声データ記憶部５２と、音響モデル記憶部５３と、言語モデル記憶部５４と、音声認識部５５と、特徴量記憶部５６と、を有する。そして、ナビゲーション装置１００は、これら機能部の働きによって、マイロフォン１３などの音声入力装置１２から取得した利用者の音声データに基づいて音声認識処理を実行する。

分析部５１は、利用者が発話した音声データを分析して、かかる音声データの特徴量を抽出する機能部である。具体的には、分析部５１は、利用者から受け付けた音声データを特徴ベクトル列に変換し、かかる特徴ベクトル列を音声データの特徴量として抽出する。なお、特徴ベクトル列とは、音声の各時刻の特徴量を多次元ベクトル量で表し、それを時系列に並べたものである。分析部５１は、例えば、入力音声データから数十ミリ秒程度ずつ音声波形を切り出し、ＭＦＣＣ（ＭｅｌＦｒｅｑｕｅｎｃｙＣｅｐｓｔｒｕｍＣｏｅｆｆｉｃｉｅｎｔ）パラメータと呼ばれる多次元ベクトル量に変換し、これを時系列に並べる。分析部５１は、このような音声データの特徴ベクトル列を音声データ記憶部５２および音声認識部５５へ出力する。

音声データ記憶部５２は、分析部５１で変換された音声の特徴ベクトル列を記憶する機能部である。なお、特徴ベクトル列に変換する前の音声データそのものを記憶するようにしてもよい。

音響モデル記憶部５３は、各音素に対応する音響モデルを記憶する機能部である。すなわち、音響モデル記憶部５３は、図２に示す各音素を記憶する。

言語モデル記憶部５４は、辞書データ３０および文法データ５８を記憶する機能部である。すなわち、言語モデル記憶部５４は、図３に示す辞書データ３０や文法データを記憶する。

音声認識部５５は、利用者の音声データに対応する単語を辞書データ３０および文法データ５８を用いて検索する機能部である。具体的には、音声認識部５５は、音響モデル記憶部５３に記憶された音素のＨＭＭを言語モデルの規則（辞書データ、文法データ）に従って連結したＨＭＭのネットワークから、音声データの特徴量に一致する確率が高い単語を検索する。そして、音声認識部５５は、確率が高い上位ｎ個（ｎは１以上の整数）の単語をリストアップし、リストアップした内容を出力装置１０で表示させるためのグラフィックス情報を生成する。また、音声認識部５５は、生成したグラフィックス情報を出力装置１０（以下、ディスプレイという）に出力する。なお、このような検索は従来技術により実現されればよい。また、音声認識部５５が出力する単語数は予め設定される。

また、音声認識部５５は、低順位データ４０を作成する機能部である。具体的には、音声認識部５５は、低順位データ４０の作成にあたり、ディスプレイに表示した単語が、利用者の意図した単語と一致しているか否かの評価を受け付ける。そして、利用者の意図した単語と一致していない評価を受け付けると、音声認識部５５は、かかる単語と、単語の検索に用いた音声データの特徴量と、を対応付けた低順位データ４０を作成する。音声認識部５５は、作成した低順位データ４０を特徴量記憶部５６に出力する。

また、音声認識部５５は、受け付けた音声データの特徴量と、低順位データ４０内の特徴量とが一致または類似するか否かを判定する機能部である。具体的には、音声認識部５５は、受け付けた音声データの特徴量と一致する特徴量が低順位データ４０内に存在するか否かを検索する。また、音声認識部５５は、受け付けた音声データの特徴量に類似する特徴量が低順位データ４０内に存在するか否かを検索する。なお、受け付けた音声データの特徴量と、低順位データ４０内の特徴量とが相異する場合、かかる相異の度合いが所定の範囲内であれば、音声認識部５５は、受け付けた音声データの特徴量と、低順位データ４０内の特徴量と、が類似すると判定する。このような類似判定は、例えば、ボイス・タグといった従来技術により実現されればよい。

また、音声認識部５５は、受け付けた音声データの特徴量に基づいて検索した単語と、低順位リスト４２の単語と、が一致するか否かを判定する機能部である。具体的には、音声認識部５５は、受け付けた音声データの特徴量に基づいて検索した単語と、かかる特徴量に一致または類似する低順位データ４０内の特徴量に対応付けられた低順位リスト４２の単語と、が一致するか否かを判定する。そして、検索した単語と、低順位リスト４２の単語とが一致する場合、音声認識部５５は、かかる単語のディスプレイに表示する順位を低順位に変更する。

特徴量記憶部５６は、低順位データ４０を記憶する機能部である。具体的には、特徴量記憶部５６は、音声認識部５５によって作成された低順位データ４０を記憶する。

なお、上記の各機能は、ナビゲーション装置１００に実装されるＣＰＵ２が読み込んだ所定のプログラムを実行することにより構築される。そのため、ＲＯＭ４や記憶装置１１には、各機能部の処理を実行するためのプログラムが記憶されている。

また、上記した各構成要素は、本実施形態に係るナビゲーション装置１００の構成を理解容易にするために、主な処理内容に応じて分類したものである。また、構成要素の分類の仕方やその名称によって、本願発明が制限されることはない。本実施形態に係るナビゲーション装置１００の構成は、処理内容に応じて、さらに多くの構成要素に分類することもできる。また、１つの構成要素がさらに多くの処理を実行するように分類することもできる。

また、各機能部は、ハードウェア（ＡＳＩＣなど）により構築されてもよい。また、各機能部の処理が１つのハードウェアで実行されてもよいし、複数のハードウェアで実行されてもよい。

以上、本実施形態に係るナビゲーション装置１００の機能ブロックについて説明した。

次に、本実施形態に係るナビゲーション装置１００で実行される音声認識処理について説明する。図６は、その処理過程を示したフロー図である。本フローは、ナビゲーション装置１００の起動とともに開始されるか、または、ユーザの要求に従って、音声認識モードへ移行した場合に開示される。

本フローが開始されると、分析部５１は、マイクロフォン１３を介して、利用者からの音声データを受け付ける（Ｓ１０１）。また、分析部５１は、受け付けた音声データを分析して音声データの特徴量を抽出し（Ｓ１０２）、処理をＳ１０３に移行する。

Ｓ１０３において、音声認識部５５は、音声データの特徴量に基づいて、音声データに一致する単語を辞書データ３０から検索し、処理をＳ１０４に移行する。

Ｓ１０４において、音声認識部５５は、Ｓ１０２で抽出した特徴量と、低順位データ４０に登録されている特徴量とが一致または類似するか否かを判定する。そして、抽出した特徴量が低順位データ４０の特徴量に一致または類似している場合（Ｓ１０４でＹｅｓ）、音声認識部５５は、処理をＳ１０５に移行する。その一方で、抽出した特徴量が低順位データ４０の特徴量に一致または類似しない場合（Ｓ１０４でＮｏ）、音声認識部５５は、処理をＳ１０９に移行する。

Ｓ１０５において、音声認識部５５は、Ｓ１０３で検索した単語と、かかる単語の検索に用いた特徴量に対応する低順位リスト４２の単語と、が一致するか否かを判定する。かかる単語が一致する場合（Ｓ１０５でＹｅｓ）、音声認識部５５は、低順位リスト４２の単語と一致する単語について、ディスプレイに表示する順位を低順位に変更する。なお、低順位とは、検出された際の表示候補順位よりも低い順位のことである。すなわち、検出された複数の単語のうち、最も低い表示候補順位に変更する場合も含まれる。そして、音声認識部５５は、順位の高い単語からディスプレイに表示するためのグラフィックス情報を生成し、出力装置１０に出力して処理をＳ１０６に移行する。その一方で、低順位リスト４２に、Ｓ１０３で検索した単語が含まれていない場合（Ｓ１０５でＮｏ）、音声認識部５５は、かかる単語をディスプレイに表示するためのグラフィックス情報を生成し、出力装置１０に出力して、処理をＳ１０９に移行する。

Ｓ１０６において、出力装置１０は、低順位リスト４２の単語と一致する単語を低順位に変更した後の、順位の高い単語からディスプレイに表示し、処理をＳ１０７に移行する。

Ｓ１０９において、音声認識部５５は、Ｓ１０３で検索した単語のうち、ディスプレイに表示する順位の高い単語から表示し、処理をＳ１０７に移行する。

Ｓ１０７において、音声認識部５５は、ディスプレイに表示した単語が利用者の意図する単語であるか否かを判定する。判定にあたり、音声認識部５５は、利用者から正否の評価を受け付ける。そして、表示した単語が利用者の意図する単語である場合（Ｓ１０７でＹｅｓ）、音声認識部５５は、本フローを終了する。一方で、表示した単語が利用者の意図する単語でない場合（Ｓ１０７でＮｏ）、音声認識部５５は、低順位データ４０を作成し（Ｓ１０８）、処理をＳ１１０に移行する。

Ｓ１１０において、特徴量記憶部は、低順位データ４０を記憶し、処理をＳ１０６に移行する。

音声認識部は、ディスプレイに表示した単語が利用者の意図する単語と一致する旨の評価を受け付けるまで、Ｓ１０６〜Ｓ１０８、Ｓ１１０の処理を繰り返し実行する。

以上、本実施形態におけるナビゲーション装置１００の音声認識処理について説明した。

次に、本実施形態の具体例について説明する。なお、以下の説明にあたり、具体的な各処理に対応するステップ番号を括弧内に表示する。

図７は、本実施形態における音声認識処理を便宜的に示したナビゲーション装置１００の画面例１０１である。第１具体例は、低順位データ４０が作成されていない場合、または、低順位データ４０内に、受け付けた音声データに対応する特徴量が登録されていない場合、若しくは、受け付けた音声データに基づいて検索した単語と、低順位リスト４２の単語と、が一致しない場合を想定したものである。

また、本具体例では、ナビゲーション装置１００が利用者の音声データを受け付けて、都道府県の設定処理をする場面を想定する。ここで、利用者は「神奈川県」の設定を意図し、「かながわ」と発話したとする。

ナビゲーション装置１００は、利用者の音声を受け付け（Ｓ１０１でＹｅｓ）、音声データの特徴量を抽出する（Ｓ１０２）。そして、ナビゲーション装置１００は、辞書データ３０から音声データの特徴量に一致または類似する単語を検索する（Ｓ１０３）。

図８は、検索の結果、ナビゲーション装置１００がリストアップした単語の候補リストを示した図である。候補リストは、音声データの特徴量および辞書データ３０の出現確率から導き出した、利用者の発話と一致する確率の高い単語の候補を上から順に並べたものである。そして、ナビゲーション装置１００は、候補順位の高い単語からディスプレイに表示する（Ｓ１０９）。本具体例では、利用者が「かながわ」と発話したにも関わらず、ナビゲーション装置が「香川」（「かがわ」）を最も高い候補順位としてリストアップした例を示したものである。

図９は、候補順位の最上位にある「香川」がディスプレイに表示された画面例１０２である。ここで、ナビゲーション装置１００は、表示した県名が、利用者の意図する県名であるか否かの評価を受け付ける（Ｓ１０７）。すなわち、ディスプレイに評価受付けボタン１０３を表示して、利用者による県名の正否について評価を受け付ける。

利用者により、表示した県名が意図するものでないと判定された場合、すなわち、評価受付けボタンの「いいえ」が選択された場合（Ｓ１０７でＮｏ）、ナビゲーション装置１００は、利用者の音声データから抽出した特徴量と、県名「香川」を対応付け、図４に示す低順位データ４０を作成する（Ｓ１０８）。

そして、ナビゲーション装置１００は、候補順位の上から２番目にある「神奈川」をディスプレイに表示する（Ｓ１０６）。ディスプレイに表示した県名「神奈川」は、利用者の発話と一致しているため、ナビゲーション装置１００は、表示内容が正しいとする利用者の評価を受け付け（Ｓ１０７でＹｅｓ）、処理を終了する。

次に、第２具体例について説明する。本具体例では、既に作成済みの低順位データ４０を用いて、ナビゲーション装置１００が検索した単語をディスプレイに表示する場合を想定する。

ここでも、前述と同様に、ナビゲーション装置１００が音声データを受け付けて（Ｓ１０１）、都道府県の設定処理を実行する場面を想定する。また、利用者が「神奈川県」の設定を意図し、「かながわ」と発話したとする。

ナビゲーション装置１００は、前述と同様に、図８に示す単語の候補リストを作成する（Ｓ１０３）。そして、ナビゲーション装置１００は、受け付けた利用者の音声データから抽出した特徴量と一致または類似する特徴量が登録された低順位データ４０の有無について判定する（Ｓ１０４）。ナビゲーション装置１０４は、かかる低順位データ４０が存在すると判定すると（Ｓ１０４でＹｅｓ）、候補リスト内の単語と、かかる単語の検索に用いた特徴量に対応する低順位リスト４２の単語と、が一致するか否かを判定する（Ｓ１０５）。

候補リスト内の単語に一致する単語が低順位リスト４２に登録されている場合（Ｓ１０５でＹｅｓ）、ナビゲーション装置１００は、図１０に示すように、かかる単語の表示候補順位を、例えば、最も低い表示候補順位に変更する（Ｓ１０６）。そして、ナビゲーション装置１００は、候補順位の高い単語からディスプレイに表示する（Ｓ１０６）。その結果、ナビゲーション装置１００は、「香川」を表示せず、利用者の意図通りの「神奈川」をディスプレイに表示することができる。

以上、本発明の実施形態について説明した。このような発明によれば、音声認識により、利用者の意図する語彙に、より一致する語彙を検索し、提示することができる。

特に、本発明では、利用者ごとに音声認識のパラメータを変更することもない。したがって、パラメータが変更された場合に、音素特性が類似する他の語彙までも音声認識の対象から除外されてしまう問題を回避することができる。

１００・・・車載ナビゲーション装置、
１・・・演算処理部、１０・・・出力装置、１１・・・記憶装置、１２・・・音声入出力装置、１５・・・入力装置、１６・・・ＲＯＭ装置、１７・・・車速センサ、１８・・・ジャイロセンサ、１９・・・ＧＰＳ受信装置、２０・・・ＦＭ多重放送受信装置、２１・・・ビーコン受信装置

Claims

辞書データを有し、音声認識機能を備えたナビゲーション装置であって、
誤認識され得る音声データが、誤認識結果の語彙に対応付けられた誤認識データを記憶するための記憶手段と、
利用者から音声データを受け付ける音声データ受け付け手段と、
前記音声データの分析結果に基づいて、前記辞書データから所定数の語彙を検出する検出手段と、
利用者から受け付けた音声データおよび該音声データに基づいて検出された語彙が、前記誤認識データに記憶されている音声データおよび該音声データに対応付けられた語彙である場合、前記検出手段が検出した他の語彙を高順位で利用者に提示する語彙提示手段と、
を有することを特徴とするナビゲーション装置。
請求項１に記載のナビゲーション装置において、
前記語彙提示手段は、
前記誤認識データに、利用者から受け付けた音声データおよび該音声データに基づいて検出された語彙が対応付けられて記憶されている場合、利用者に提示する該語彙の順番を繰り下げて提示する
ことを特徴とするナビゲーション装置。
請求項１または２に記載のナビゲーション装置において、
前記語彙提示手段が提示した語彙が利用者の意図する語彙と異なる場合、該語彙および誤認識された音声データを対応付けた前記誤認識データを作成する誤認識データ作成手段を有する
ことを特徴とするナビゲーション装置。
辞書データを記憶した記憶装置を有し、音声認識機能を備えたナビゲーション装置の検出結果提示方法であって、
前記ナビゲーション装置は、
利用者から音声データを受け付ける音声データ受け付けステップと、
前記音声データの分析結果に基づいて、前記辞書データから所定数の語彙を検出する検出ステップと、
誤認識された音声データが誤認識結果の語彙に対応付けられた誤認識データを参照し、利用者から受け付けた音声データおよび該音声データに基づいて検出された語彙が、前記誤認識データに記憶されている音声データおよび該音声データに対応付けられた語彙である場合、前記検出ステップで検出された他の語彙を高順位で利用者に提示する提示ステップと、
を実行することを特徴とするナビゲーション装置の検出結果提示方法。