JP4642953B2 - 音声検索装置、および、音声認識ナビゲーション装置 - Google Patents
音声検索装置、および、音声認識ナビゲーション装置 Download PDFInfo
- Publication number
- JP4642953B2 JP4642953B2 JP25598199A JP25598199A JP4642953B2 JP 4642953 B2 JP4642953 B2 JP 4642953B2 JP 25598199 A JP25598199 A JP 25598199A JP 25598199 A JP25598199 A JP 25598199A JP 4642953 B2 JP4642953 B2 JP 4642953B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- prefecture
- voice
- recognition
- category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3605—Destination input or retrieval
- G01C21/3608—Destination input or retrieval using speech input, e.g. using speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
Description
【発明の属する技術分野】
本発明は、音声検索、および音声検索を利用した音声認識ナビゲーション装置に関する。
【0002】
【従来の技術】
自動車の現在地を表示し、地図の広域・詳細表示を行い、目的地までの進行方向および残距離を誘導する車載用ナビゲーション装置(以下、ナビゲーション装置と言う)が知られている。また、ナビゲーション装置の一機能として、運転中のドライバからの操作指示を音声で行い、ドライバの安全性を高めるいわゆる音声認識ナビゲーション装置も知られている(例えば特開平09−292255号公報)。
【0003】
図8は、従来のナビゲーション装置において、音声により希望のスキー場を地図表示するまでの音声認識辞書(以下、単に辞書と言う)を説明する概念図である。
【0004】
ナビゲーション装置の電源がオンされると、図8(a)に示す基本辞書がメモリ上に準備される。基本辞書には、「立体表示」「拡大」「縮小」「スキー場」等の命令語が認識語として格納されている。そこで、ユーザが施設ジャンル名として「スキー場」と発話(発声)すると、基本辞書内のすべての認識語に対して音声認識処理がなされる。その結果「スキー場」が音声認識されると、図8(b)に示す通り、認識語としてスキー場の属する都道府県名が入ったスキー場都道府県名辞書がメモり上に準備される。
【0005】
その後、スキー場都道府県名として、例えば「ABCD県」と発話すると、都道府県名辞書内のすべての認識語に対して音声認識処理がなされる。その結果「ABCD県」が音声認識されると、図8(c)に示す通り、認識語としてABCD県に存在するスキー場名の入ったABCD県スキー場名辞書がメモリ上に準備される。その後、スキー場名として「Bスキー場」と発話すると、ABCD県スキー場名辞書内のすべての認識語に対して音声認識処理がなされる。そして「Bスキー場」が音声認識されると、図8(d)に示すようにBスキー場を含む地図がナビゲーション装置の画面上に表示される。
【0006】
音声認識ソフトで認識させる施設ジャンルには、スキー場以外にも、テーマパーク、空港等いろいろと考えられる。これらの施設の中には、都道府県境近くに存在する施設が多い。例えば、群馬県と新潟県の県境付近にあるスキー場、東京都と千葉県の都県境付近にあるテーマパーク、大阪府と兵庫県の府県境付近にある空港等がある。また、ゴルフ場、スキー場等は、施設それ自体が広いのですべてのユーザが正確に所属する都道府県名を理解していない場合が多い。
【0007】
【発明が解決しようとする課題】
このような場合に、ユーザがその施設が属する都道府県名を間違って発話すると、その施設が属さない都道府県の施設名辞書がメモリ上に展開されアクセスされる。その後何度正確にその施設名を発話しても認識に成功しないという問題が発生していた。
【0008】
本発明の目的は、音声認識により検索対象の検索を効率よく短時間に正確にかつ確実に行うことが可能な音声検索装置、およびそのための制御プログラムとデータを記録した記録媒体を提供すること、特に、都道府県境近くにある施設名等を正確に音声認識できる音声認識ナビゲーション装置を提供することにある。
【0009】
【課題を解決するための手段】
請求項1の発明は、複数の検索対象を複数の区分に分類し、区分の指定、検索対象の指定の順に指定して検索対象を検索し、少なくとも検索対象の指定を音声により指定する音声検索装置に適用され、各区分毎に検索対象に関する認識データが格納された第1の記憶手段と、一の区分と所定の関係をもって関連する他の区分を示す区分関連情報を格納する第2の記憶手段と、ユーザからの入力によりある区分が検索対象区分として指定されたとき、第2の記憶手段に格納された区分関連情報を参照して指定された区分と所定の関係をもって関連する他の区分を特定し、指定された区分と特定された他の区分の複数の区分に関する認識データを第1の記憶手段から選択し、選択された複数の区分の認識データをまとめてメモリ上に展開する認識データ選択手段と、認識データ選択手段により選択され、まとめてメモリ上に展開された複数の区分の認識データと音声により指定された検索対象の音声データとに基づいて音声認識を行う音声認識処理手段とを備えることを特徴とするものである。
請求項2の発明は、請求項1記載の音声検索装置において、複数の区分は、都道府県を単位とする区分であり、検索対象は、いずれかの都道府県に存在する検索対象であり、区分関連情報は、指定された都道府県と所定の関係をもって関連づけられる他の都道府県を示す情報であることを特徴とするものである。
請求項3の発明は、請求項2記載の音声検索装置において、区分関連情報は、指定された都道府県に隣接する他の都道府県を示す情報であることを特徴とするものである。
請求項4の発明は、請求項2または3記載の音声検索装置において、検索対象に関する認識データに、検索対象が存在する都道府県に関する情報を付与することを特徴とするものである。
請求項5の発明は、請求項4記載の音声検索装置において、検索対象の検索結果に関連する内容を表示装置に表示するよう制御する表示制御手段をさらに備え、表示制御手段は、検索対象の検索結果に関連する内容を表示するよう制御する際、同時にその検索対象が存在する都道府県に関する情報を表示装置に表示するよう制御することを特徴とするものである。
請求項6の発明は、音声認識ナビゲーション装置に適用され、請求項1〜5のいずれか1項記載の音声検索装置と、地図情報を格納する地図情報格納手段と、少なくとも音声検索装置の検索結果と地図情報とに基づき、道案内のための制御を行う制御手段とを備えるようにしたことを特徴とするものである。
【0010】
なお、上記課題を解決するための手段の項では、分かりやすく説明するため実施の形態の図と対応づけたが、これにより本発明が実施の形態に限定されるものではない。
【0011】
【発明の実施の形態】
図1は、本発明の車載用ナビゲーションシステムの一実施の形態の構成を示す図である。車載用ナビゲーションシステムは、ナビゲーション装置100および音声ユニット200により構成される。
【0012】
ナビゲーション装置100は、GPS受信機101と、ジャイロセンサ102と、車速センサ103と、ドライバ104と、CPU105と、RAM106と、ROM107と、CD−ROMドライブ108と、表示装置109と、バスライン110等から構成される。
【0013】
音声ユニット200は、マイク201と、A/D変換部202と、D/A変換部203と、アンプ204と、スピーカ205と、発話スイッチ206と、ドライバ207と、CPU208と、RAM209と、ROM210と、バスライン212等から構成される。ナビゲーション装置100と音声ユニット200は、通信ライン211を介して接続される。
【0014】
GPS受信機101は、GPS(Global Positioning System)衛星からの信号を受信し、自車の絶対位置、絶対方位を検出する。ジャイロセンサ102は、例えば振動ジャイロで構成され、車のヨー角速度を検出する。車速センサ103は、車が所定距離走行毎に出すパルス数に基づき、車の移動距離を検出する。ジャイロセンサ102と車速センサ103により、車の2次元的な移動が検出できる。ドライバ104は、GPS受信機101、ジャイロセンサ102、車速センサ103からの信号をバスライン110に接続するためのドライバである。すなわち、それぞれのセンサ出力をCPU105が読むことができるデータに変換する。
【0015】
CPU105は、ROM107に格納されたプログラムを実行することによりナビゲーション装置100全体を制御する。RAM106は揮発性メモリであり、ワークデータ領域を確保する。ROM107は、不揮発性メモリで、上述した制御プログラム等を格納する。CD−ROMドライブ108は、CD−ROMを記録媒体とし、ベクトル道路データ等の道路地図情報を格納する。CD−ROMドライブは、DVDを記録媒体とするDVDドライブやその他の記録装置であってもよい。表示装置109は、車の現在地および周辺の道路地図、目的地までのルート情報、次の誘導交差点情報等を表示する。例えば、液晶表示装置あるいはCRTで構成される。バスライン110は、ナビゲーション装置100のCPU105等の構成要素をバス接続するラインである。
【0016】
音声ユニット200は、音声認識、音声合成等、音声に関する処理を行う。発話スイッチ206は、ユーザが押すことにより音声認識の開始を指示するスイッチである。発話スイッチ206が押された後所定時間、音データの入力がマイク201を介して行われる。入力された音は、A/D変換部202およびドライバ207により、デジタル音声データに変換される。
【0017】
音声ユニット200のROM210には、音声認識ソフト(プログラム)、音声合成ソフト(プログラム)、音声認識辞書(以下、単に認識辞書と言う)、音声合成辞書(以下、単に合成辞書と言う)等が格納されている。音声認識ソフトは、デジタル音声データと、認識辞書内の全認識語との相関値を算出し、最も相関値の高い認識語を認識結果として求める。音声合成ソフトは、指定した文章をスピーカから発声させるためのデータを算出する。両ソフトウェアについては、公知な内容であるので詳細な説明は省略する。
【0018】
認識辞書は、音声認識の対象となる言葉(語)を複数集めたひとかたまりのデータである。具体的には、ひらがなやカタカナやローマ字(実際にはその文字コード)で指定されたそれぞれの言葉の読みデータが格納されている。認識辞書に格納された言葉を認識語という。各認識語には、読みデータの他その言葉の文字データや、施設名であれば座標情報などの情報が付帯している。認識辞書の詳細については後述する。合成辞書は、音声合成のために必要な音源データ等が格納されている。
【0019】
発話終了時、CPU208は、RAM209、ROM210等を使い音声認識ソフトを実行し、デジタル音声データの音声認識を行う。音声認識ソフトは、認識辞書内の認識語の読みデータ(ひらがなやカタカナやローマ字で指定されたデータ)を参照しながらその言葉の音声認識用データを生成し、デジタル音声データとの相関値を算出する。すべての認識語についてデジタル音声データとの相関値を算出し、相関値が最も高くかつ所定の値以上の認識語を決定して音声認識を完了する。その認識語にリンクしたエコーバック語を音声合成ソフトを使い、発声用のデータに変換する。その後、D/A変換部203、アンプ204、スピーカ205を用い、認識結果をエコーバック出力させる。
【0020】
もし、算出したどの相関値も所定の値以下である場合は、音声認識ができなかったとしてナビの操作を行わないようにする。具体的には、「プップー」等の認識失敗を意味するビープ音を鳴らすことや、「認識できません」と応答(エコーバック)させる。バスライン212は、音声ユニット200のバスラインである。
【0021】
次に、認識辞書について詳細に説明する。認識辞書は、従来技術の図8で説明したものと同様に、命令語に関する認識語が格納された基本辞書、各ジャンル毎の都道府県名に関する認識語が格納された都道府県名辞書、各ジャンルにおいて、都道府県毎の施設名称に関する認識語が格納された各都道府県施設名称辞書が準備されている。都道府県を指示する場合の都道府県名も命令語の一種である。
【0022】
図2は、認識辞書のうちジャンルがスキー場に関連する認識辞書を示す図である。図2(a)に示す基本辞書は各ジャンルに共通の辞書で、「立体表示」「拡大」「縮小」「スキー場」等の命令語に関する認識語が格納されている。図2(b)に示すスキー場都道府県名辞書には、スキー場の属する都道府県名に関する認識語が格納されている。図2(c)に示すABCD県スキー場名辞書には、ABCD県に存在するスキー場名に関する認識語が格納され、EFGH県スキー場名辞書には、EFGH県に存在するスキー場名に関する認識語が格納されている。スキー場名辞書には、図2(c)のABCD県スキー場名辞書およびEFGH県スキー場名辞書の他に、図2(b)のスキー場都道府県名辞書にある各都道府県に対応するスキー場名辞書が準備されている。
【0023】
認識語は、その言葉の読みデータであるので、ひらがなやカタカナで指定されその文字コード等が格納されるが、図2では分かりやすくするため漢字等により表現している。
【0024】
なお、全国のスキー場名を都道府県単位に階層化して格納しているのは次の理由からである。例えば、図2(b)のスキー場都道府県名辞書を省略し、全国のすべてのスキー場名が格納されたスキー場名辞書を一つだけ準備したと想定する。この場合、一つのスキー場名の音声認識毎に、認識辞書内のすべてのスキー場名と音声認識処理を行わなければならず処理時間が膨大となる。また、認識対象の件数が増えるため誤認識の確率が高くなる。さらには、作業メモリ容量から一度にメモリ上に展開できない場合も生じる。従って、全国のスキー場名を上記のように都道府県単位に階層化して処理を行っている。
【0025】
ジャンルがゴルフ場の場合は、ゴルフ場都道府県名辞書および各都道府県のゴルフ場名辞書が準備される(不図示)。また、テーマパーク等他のジャンルについても同様である。すなわち、認識辞書には、基本辞書、各ジャンルの都道府県名辞書、および各ジャンル毎にさらに都道府県毎に細分化された施設名称辞書が準備されている。
【0026】
本実施の形態では、上述した認識辞書に加えて、隣接都道府県テーブルがROM210に格納されている。図3は、隣接都道府県テーブルを示す図である。隣接都道府県テーブル301は、全国47都道府県のそれぞれの隣接都道府県情報を有する。各都道府県の隣接都道府県情報302は、自都道府県コード303、隣接都道府県の数304、隣接都道府県のコード305のデータを有する。
【0027】
隣接する都道府県の指定については、各種の方法が考えられる。例えば、都道府県境に地理的に接するすべての都道府県を指定する方法、概ね近い都道府県を指定する方法、経験的に隣接都道府県として指定するのがよいと考えられるものを指定する方法、該当都道府県を通過する高速道路に沿った都道府県を指定する方法などが考えられる。図4は、各都道府県に隣接都道府県を指定した一例を示す。
【0028】
本実施の形態では、あるジャンルの施設を探す場合に、ある都道府県名が発話され指定されたとき、上述の隣接都道府県テーブルを使用して、指定された都道府県に隣接する都道府県の施設名辞書もメモリ上に準備する。これにより、都道府県境付近にある施設を探す場合に、間違って隣接の都道府県が指定された場合でも、容易に探し出すことができる。
【0029】
図5〜図7は、音声ユニット200において、ある都道府県に存在する施設名を検索する制御のフローチャートを示す図である。具体的にABCD県に隣接するEFGH県のFスキー場を間違ってABCD県と指定して検索する例を示しながら説明をする。制御プログラムはROM210に格納され、CPU208がその制御プログラムを実行する。ナビゲーション装置100および音声ユニット200の電源オンにより本ルーチンはスタートする。
【0030】
ステップS1では、ROM210に格納された図2(a)の基本辞書をRAM209上に展開する。ROM210の基本辞書をRAM209上に展開するのは処理速度を上げるためである。処理速度がそれほど問題とならない場合は、ROM210内の辞書に直接アクセスするようにしてもよい。ステップS2では、発話スイッチ206が押されたかどうかを判断し、押されている場合はステップS3へ進む。押されていない場合は、本ルーチンを終了する。ユーザは発話スイッチ206を押した後、一定時間内に例えば「スキー場」と発話する。ステップS3では、マイク201からの音声信号をデジタル音声データに変換する。ステップS4では、発話が終了したかどうかを判断する。発話の終了は、一定時間音声信号が途切れた場合を発話の終了と判断する。発話が終了したと判断した場合はステップS5に進み、発話がまだ終了していないと判断した場合はステップS3に戻る。本例の場合、ステップS3において「スキー場」というデジタル音声データが取得できる。
【0031】
ステップS5では、取得したデジタル音声データと基本辞書内の全認識語について相関値を算出し、ステップS6に進む。すなわち、ステップS3で取得した「スキー場」というデジタル音声データと「立体表示」「拡大」「縮小」「スキー場」「ゴルフ場」等の認識語と相関値を算出する。ステップS6では、算出された相関値のうち最も高い相関値が所定の値以上かどうかを判断する。所定の値以上であれば、その語が認識できたとしてステップS7に進む。この例では、「スキー場」という認識語との相関値が最も高くなる。その相関値が所定の値以上であれば、「スキー場」という語が認識できジャンル名が検索できたことになる。ステップS7では、相関値の最も高かった「認識語」と「都道府県名をどうぞ。」という音声を発する。本例では「スキー場、都道府県名をどうぞ。」と音声によりエコーバックする。さらに、ステップS7では該当ジャンルの都道府県名辞書をRAM209上に準備する。本例では「スキー場都道府県名辞書」(図2(b))をRAM209上に準備する。
【0032】
一方、ステップS6において、最も高い相関値が所定の値未満であれば発話された言葉が認識できなかったとしてステップS8に進む。ステップS8では、「認識できません」と音声によるエコーバックし、処理を終了する。ナビゲーション装置100においては何も処理をしない。
【0033】
ステップS7の処理終了後ステップS9に進む。ステップS9では、ステップS3と同様に、マイク201からの音声信号をデジタル音声データに変換する。ステップS10では、ステップS4と同様に、発話が終了したかどうかを判断する。ユーザはこの間に「ABCD県」と発話する。ステップS9およびS10を繰り返すことにより、本例では「ABCD県」というデジタル音声データが取得できる。
【0034】
ステップS11では、取得したデジタル音声データとスキー場都道府県名辞書内の全認識語について相関値を算出し、ステップS12に進む。すなわち、ステップS9で取得した「ABCD県」というデジタル音声データと「北海道」「青森県」「ABCD県」「EFGH県」「沖縄県」等の認識語と相関値を算出する。ステップS12では、算出された相関値のうち最も高い相関値が所定の値以上かどうかを判断する。所定の値以上であれば、その語が認識できたとしてステップS13に進む。この例では、「ABCD県」という認識語との相関値が最も高くなる。その相関値が所定の値以上であれば、「ABCD県」という語が認識できスキー場都道府県名が検索できたことになる。ステップS13では、相関値の最も高かった「認識語」と「施設名称をどうぞ。」という音声を発する。本例では「ABCD県、施設名称をどうぞ。」とエコーバックする。
【0035】
さらに、ステップS13では該当都道府県施設名称辞書および隣接都道府県施設名称辞書をRAM209上に準備する。ステップS12で該当都道府県名が取得できているので、ROM210に格納された隣接都道府県テーブル(図3)をアクセスし、該当都道府県の隣接都道府県情報を取得する。この隣接都道府県情報を基に隣接都道府県施設名称辞書をRAM209上に展開する。これにより、該当都道府県施設名称辞書と隣接都道府県施設名称辞書がまとめられ、あたかも該当都道府県施設名称辞書のようにRAM209上に準備される。本例では、ABCD県にEFGH県が隣接しているとすると、「ABCD県スキー場名辞書」と「EFGH県スキー場名辞書」がRAM209上にまとめられ準備される。
【0036】
なお、ROM210上の都道府県施設名称辞書をRAM209上に展開せず、ROM210に直接アクセスする場合は、該当都道府県施設名称辞書と隣接都道府県施設名称辞書のみを順にアクセスするようにすればよい。
【0037】
一方、ステップS12において、最も高い相関値が所定の値未満であれば発話された言葉が認識できなかったとしてステップS14に進む。ステップS14では、「認識できません」とエコーバックし、処理を終了する。ナビゲーション装置100においては何も処理をしない。
【0038】
ステップS13の処理終了後ステップS15に進む。ステップS15では、ステップS3と同様に、マイク201からの音声信号をデジタル音声データに変換する。ステップS16では、ステップS4と同様に、発話が終了したかどうかを判断する。ユーザはこの間に例えば「Fスキー場」と発話する。Fスキー場は実際にはEFGH県に存在しているが、ABCD県とEFGH県の県境付近に存在するため、このユーザは、Fスキー場がABCD県にあると誤解している。ステップS15およびS16を繰り返すことにより、「Fスキー場」というデジタル音声データが取得できる。
【0039】
ステップS17では、取得したデジタル音声データとRAM209上に準備された施設名称辞書の全認識語について相関値を算出し、ステップS18に進む。RAM209内には、前述したとおり該当都道府県の施設名称辞書と隣接都道府県の施設名称辞書が準備されており、そのすべての認識語との相関値を算出する。本例では、ステップS15で取得した「Fスキー場」というデジタル音声データと「ABCD県スキー場名辞書」「EFGH県スキー場名辞書」内のすべてのスキー場名の認識語と相関値を算出する。
【0040】
ステップS18では、算出された相関値のうち最も高い相関値が所定の値以上かどうかを判断する。所定の値以上であれば、その語が認識できたとしてステップS19に進む。本例では、EFGH県スキー場名辞書の「Fスキー場」という認識語との相関値が最も高くなる。その相関値が所定の値以上であれば、「Fスキー場」という語が認識でき施設名称が検索できたことになる。ステップS19では、相関値の最も高かった認識語「Fスキー場」をエコーバックする。
【0041】
さらに、ステップS19では該当施設名称が認識できたことをナビゲーション装置100に知らせ、その後処理を終了する。ナビゲーション装置100に知らせるときは、その施設の地図上の座標も知らせる。認識辞書の各認識語にはその施設の位置する座標データが付帯情報として格納されている。ナビゲーション装置100は、通信ライン211を介して送信されてきた該当施設の地図上の座標データに基づき、該当施設近辺の道路地図を表示装置109に表示する。
【0042】
一方、ステップS18において、最も高い相関値が所定の値未満であれば発話された言葉が認識できなかったとしてステップS20に進む。ステップS20では、「認識できません」とエコーバックし、処理を終了する。ナビゲーション装置100においても何も処理をしない。
【0043】
以上のようにして、ある都道府県に存在する施設を検索する場合に、間違って隣接する都道府県を指定しても、確実に該当施設を検索することができる。上記の例では、「EFGH県」に存在する「Fスキー場」を検索する場合に、間違って隣接する「ABCD県」と指定しても、確実に「Fスキー場」を検索することができる。また、全国のすべての施設名の認識語を作業メモリ上に準備する必要がなく、少ない作業メモリ容量で、効率よく、迅速に、正確に、確実に該当施設の検索を行うことができる。
【0044】
なお上記では、「Fスキー場」が「EFGH県」にのみ存在する例で説明をしたが、同名の「Fスキー場」が偶然に「ABCD県」にも「EFGH県」にも存在するような場合がある。このような場合、同一レベルでありかつ高い相関値を示すものが2個検索できる。この検索結果はナビゲーション装置100に知らされ、表示装置109に次のような表示を行う。もちろん、音声ユニット200において同時に音声出力をしてもよい。
「1:Fスキー場(ABCD県)
2:Fスキー場(EFGH県)
どちらを選びますか?」
【0045】
ユーザは、選択すべき番号を発話するか、ナビゲーション装置のリモコン等の入力装置(不図示)により選択すべき番号を入力する。これにより、隣接した県で同名の施設名称が混在していても、目的とする施設名称を容易に選択することができる。この場合、施設名称の認識辞書の各認識語に施設の属する都道府県名関連の情報を付与しておくとよい。これにより、上記のように表示する際、施設の属する都道府県名も同時に容易に表示することができるので、ユーザは選択に迷わない。もちろん、その認識語が格納された都道府県単位の施設名称辞書から都道府県名を割り出し表示するようにしてもよい。なお、非常に類似する施設名称が隣接した都道府県に混在していても同様に考えることができる。例えば、上記の例で「Fスキー場」が「EFGH県」に存在し、「Sスキー場」が「ABCD県」に存在する場合である。
【0046】
上記の実施の形態では、車載用ナビゲーションシステムについて説明をしたがこの内容に限定する必要はない。車載用に限らず携帯用のナビゲーション装置にも適用できる。さらには、建物内の案内システムのようなものにも適用できる。すなわち、複数の区分に存在する複数の検索対象から音声により一つの検索対象を指定するシステムあるいは装置すべてに適用できる。
【0047】
上記の実施の形態では、検索対象の存在する区分を都道府県を単位とする区分で説明をしたが、この内容に限定する必要はない。市町村を単位としても良いし、関東、東海、近畿等の地方を単位としても良い。また、建物内の案内システムであればフロアやフロア内の所定の範囲が単位となる場合もある。また、この区分は場所的な区分でなくてもよい。例えば、図2(a)の基本辞書に「レストラン」とある場合に、図2(b)の辞書に対応するものとして、「フランス料理」「中華料理」「日本料理」等のレストランの種類名を示す辞書を準備し、図2(c)の辞書に対応するものとして、各料理毎のレストラン名辞書を準備するようにしてもよい。また、「宿泊施設」を「ビジネスホテル」「ホテル」「旅館」などに区分する場合にも有効である。この場合に、例えば「ビジネスホテル」と「ホテル」は類似の区分としておくと、「ホテル」が指定されたときには「ビジネスホテル」も検索対象に加えて検索することができる。これにより、ビジネスホテルである「ABCホテル」を検索する場合に、分類を間違って「ホテル」と指定しても検索に成功する。以上のように、検査対象はあらゆる対象が想定でき、その区分も検査対象の属性に応じたあらゆる区分が考えられる。
【0048】
上記の実施の形態では、ナビゲーション装置100と音声ユニット200を分離した構成で説明をしたが、この内容に限定する必要はない。音声ユニットを内部に含んだ一つのナビゲーション装置として構成してもよい。また、上記制御プログラムや認識辞書や隣接都道府県テーブルなどをCD−ROMなどの記録媒体で提供することも可能である。さらには、制御プログラムや認識辞書や隣接都道府県テーブルなどをCD−ROMなどの記録媒体で提供し、パーソナルコンピュータやワークステーションなどのコンピュータ上で上記システムを実現することも可能である。
【0049】
上記の実施の形態では、音声ユニット200で施設名の検索に成功した場合、その内容をナビゲーション装置100に知らせ、ナビゲーション装置100では道案内等のナビゲーション処理の一つとしてその施設近辺の地図を表示する例で説明をしたが、この内容に限定する必要はない。ナビゲーション装置100では、音声ユニット200で検索に成功した結果に基づき、経路探索や経路誘導その他の各種のナビゲーション処理が考えられる。
【0050】
上記の実施の形態では、指定された都道府県施設名称辞書および隣接都道府県施設名称辞書をRAM上に一つの施設名称辞書としてまとめて準備をし、その中を検索する例で説明をしたが、この内容に限定する必要はない。指定された都道府県を最も高いプライオリティにし、隣接する都道府県にもプライオリティ付けを行って検索するようにしてもよい。そして、プライオリティの高い都道府県の施設名称辞書から検索を開始し、途中で相関値がある一定レベル以上のものが取得できればその都道府県の検索を完了した後、処理を終了してもよい。
【0051】
上記の実施の形態では、検索対象を音声認識で指定する例で説明をしたが、この内容に限定する必要はない。キーボードなどの入力装置で検索対象を指定する場合にも適用できる。すなわち、検索対象すべてを一度に検索対象とせず、ある所定の区分に分類して区分毎に検索を実行するすべての態様に適用できる。
【0052】
【発明の効果】
本発明は、以上説明したように構成しているので、次のような効果を奏する。
請求項1および7の発明は、指定された区分とその区分に関連する区分の認識データを選択して音声認識処理をしているので、少ない作業メモリ容量で効率よく迅速に正確にかつ確実に検索対象を検索をすることができる。特に、検索対象がいずれの区分に属するかあいまいな場合でも確実に検索することができる。
請求項2および3の発明は、検索対象が都道府県単位で分類された例えばスキー場やゴルフ場などの施設の場合、その施設が都道府県境付近に存在し、どの都道府県に存在しているか正確に認識していなくても確実に検索することができる。すなわち、間違って隣の都道府県を指定しても検索を成功させることができる。
請求項4および5の発明は、検索対象が例えば同名あるいは非常に類似した名称が存在する場合であっても、その検索結果を表示させる場合、検索対象名と存在する都道府県名とを同時に表示することが容易に可能となるので、ユーザにとって混乱が生じない。
請求項6の発明は、上記の効果を、特に音声認識ナビゲーション装置において道案内等のナビゲーションを行うときに有効に発揮させることができる。
【図面の簡単な説明】
【図1】本発明の車載用ナビゲーションシステムの一実施の形態の構成を示す図である。
【図2】認識辞書のうちジャンルがスキー場に関連する認識辞書を示す図である。
【図3】隣接都道府県テーブルを示す図である。
【図4】各都道府県に隣接都道府県を指定した一例を示す図である。
【図5】ある都道府県に存在する施設名を検索する制御のフローチャートを示す図である。
【図6】図5のフローチャートに続くフローチャートを示す図である。
【図7】図6のフローチャートに続くフローチャートを示す図である。
【図8】図8は、従来のナビゲーション装置において、音声により希望のスキー場を地図表示するまでの音声認識辞書を説明する概念図である。
【符号の説明】
100 ナビゲーション装置
101 GPS受信機
102 ジャイロセンサ
103 車速センサ
104 ドライバ
105 CPU
106 RAM
107 ROM
108 CD−ROMドライブ
109 表示装置
110 バスライン
200 音声ユニット
201 マイク
202 A/D変換部
203 D/A変換部
204 アンプ
205 スピーカ
206 発話スイッチ
207 ドライバ
208 CPU
209 RAM
210 ROM
211 通信ライン
212 バスライン
Claims (6)
- 複数の検索対象を複数の区分に分類し、区分の指定、検索対象の指定の順に指定して検索対象を検索し、少なくとも検索対象の指定を音声により指定する音声検索装置において、
各区分毎に検索対象に関する認識データが格納された第1の記憶手段と、
一の区分と所定の関係をもって関連する他の区分を示す区分関連情報を格納する第2の記憶手段と、
ユーザからの入力によりある区分が検索対象区分として指定されたとき、前記第2の記憶手段に格納された前記区分関連情報を参照して指定された区分と所定の関係をもって関連する他の区分を特定し、前記指定された区分と前記特定された他の区分の複数の区分に関する認識データを前記第1の記憶手段から選択し、選択された前記複数の区分の認識データをまとめてメモリ上に展開する認識データ選択手段と、
前記認識データ選択手段により選択され、まとめてメモリ上に展開された前記複数の区分の認識データと音声により指定された検索対象の音声データとに基づいて音声認識を行う音声認識処理手段とを備えることを特徴とする音声検索装置。 - 請求項1記載の音声検索装置において、
前記複数の区分は、都道府県を単位とする区分であり、
前記検索対象は、いずれかの都道府県に存在する検索対象であり、
前記区分関連情報は、指定された都道府県と所定の関係をもって関連づけられる他の都道府県を示す情報であることを特徴とする音声検索装置。 - 請求項2記載の音声検索装置において、
前記区分関連情報は、指定された都道府県に隣接する他の都道府県を示す情報であることを特徴とする音声検索装置。 - 請求項2または3記載の音声検索装置において、
前記検索対象に関する認識データに、検索対象が存在する都道府県に関する情報を付与することを特徴とする音声検索装置。 - 請求項4記載の音声検索装置において、
検索対象の検索結果に関連する内容を表示装置に表示するよう制御する表示制御手段をさらに備え、
前記表示制御手段は、検索対象の検索結果に関連する内容を表示するよう制御する際、同時にその検索対象が存在する都道府県に関する情報を表示装置に表示するよう制御することを特徴とする音声検索装置。 - 請求項1〜5のいずれか1項記載の音声検索装置と、
地図情報を格納する地図情報格納手段と、
少なくとも前記音声検索装置の検索結果と前記地図情報とに基づき、道案内のための制御を行う制御手段とを備えることを特徴とする音声認識ナビゲーション装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25598199A JP4642953B2 (ja) | 1999-09-09 | 1999-09-09 | 音声検索装置、および、音声認識ナビゲーション装置 |
EP00307731.0A EP1083405B2 (en) | 1999-09-09 | 2000-09-07 | Voice reference apparatus, recording medium recording voice reference control program and voice recognition navigation apparatus |
DE60002140T DE60002140T2 (de) | 1999-09-09 | 2000-09-07 | Sprachreferenzapparat, Steuerungsprogramm für Sprachreferenzen auf einem Aufzeichnungsmedium und Navigationsapparat mit Spracherkennung |
US09/659,066 US6950797B1 (en) | 1999-09-09 | 2000-09-11 | Voice reference apparatus, recording medium recording voice reference control program and voice recognition navigation apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25598199A JP4642953B2 (ja) | 1999-09-09 | 1999-09-09 | 音声検索装置、および、音声認識ナビゲーション装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001083988A JP2001083988A (ja) | 2001-03-30 |
JP4642953B2 true JP4642953B2 (ja) | 2011-03-02 |
Family
ID=17286260
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP25598199A Expired - Fee Related JP4642953B2 (ja) | 1999-09-09 | 1999-09-09 | 音声検索装置、および、音声認識ナビゲーション装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6950797B1 (ja) |
EP (1) | EP1083405B2 (ja) |
JP (1) | JP4642953B2 (ja) |
DE (1) | DE60002140T2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070276586A1 (en) * | 2006-05-25 | 2007-11-29 | Samsung Electronics Co., Ltd. | Method of setting a navigation terminal for a destination and an apparatus therefor |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4116233B2 (ja) * | 2000-09-05 | 2008-07-09 | パイオニア株式会社 | 音声認識装置ならびにその方法 |
DE10132887A1 (de) * | 2001-07-06 | 2003-01-16 | Bosch Gmbh Robert | System und Verfahren zum Navigieren eines Fortbewegungsmittels |
DE10143292B4 (de) * | 2001-09-04 | 2015-06-03 | Deutsche Telekom Ag | Sprachfenster |
JP3576511B2 (ja) * | 2001-09-19 | 2004-10-13 | 松下電器産業株式会社 | 音声対話装置 |
WO2003096324A1 (fr) * | 2002-05-10 | 2003-11-20 | Asahi Kasei Kabushiki Kaisha | Dispositif de reconnaissance vocale |
WO2005106392A1 (ja) * | 2004-04-30 | 2005-11-10 | Pioneer Corporation | 地点検索装置、ナビゲーション装置、地点検索方法並びに地点検索プログラム及びこの地点検索プログラムを記録した情報記録媒体 |
JP2006139203A (ja) * | 2004-11-15 | 2006-06-01 | Mitsubishi Electric Corp | 施設検索装置 |
JP4822993B2 (ja) * | 2006-09-11 | 2011-11-24 | アルパイン株式会社 | 地点探索装置及びナビゲーション装置 |
US8219399B2 (en) * | 2007-07-11 | 2012-07-10 | Garmin Switzerland Gmbh | Automated speech recognition (ASR) tiling |
JP5187128B2 (ja) * | 2008-10-16 | 2013-04-24 | 富士通株式会社 | 検索装置、検索方法、及び、プログラム |
GB201421442D0 (en) | 2014-12-02 | 2015-01-14 | Tomtom Int Bv | Method and apparatus for providing point of interest information |
GB201421441D0 (en) | 2014-12-02 | 2015-01-14 | Tomtom Int Bv | Method and apparatus for providing point of interest information |
CN116684327B (zh) * | 2023-08-03 | 2023-10-27 | 中维建技术有限公司 | 一种基于云计算的山林地区通信网络故障监测评估方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08328584A (ja) * | 1995-05-29 | 1996-12-13 | Sony Corp | 音声認識装置、音声認識方法及びナビゲーション装置 |
JPH09114489A (ja) * | 1995-10-16 | 1997-05-02 | Sony Corp | 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車 |
JPH1019194A (ja) * | 1996-07-01 | 1998-01-23 | Hitachi Ltd | 高温圧力容器 |
JPH1062199A (ja) * | 1996-08-23 | 1998-03-06 | Toyota Motor Corp | 音声認識装置 |
JPH1096647A (ja) * | 1996-07-31 | 1998-04-14 | Aisin Aw Co Ltd | 車両用ナビゲーション装置及び記憶媒体 |
JPH11183190A (ja) * | 1997-12-24 | 1999-07-09 | Toyota Motor Corp | ナビゲーション用音声認識装置および音声認識機能付きナビゲーション装置 |
JPH11184880A (ja) * | 1997-12-24 | 1999-07-09 | Sharp Corp | 音声認識装置及びコンピュータ読み取り可能な記録媒体 |
JPH11325946A (ja) * | 1998-05-15 | 1999-11-26 | Matsushita Electric Ind Co Ltd | 車載用ナビゲーション装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69422449T2 (de) * | 1993-07-07 | 2000-08-03 | Aisin Aw Co | Navigationssystem |
JP2946269B2 (ja) | 1993-08-25 | 1999-09-06 | 本田技研工業株式会社 | 車載情報処理用音声認識装置 |
JP3468824B2 (ja) | 1994-03-29 | 2003-11-17 | 本田技研工業株式会社 | 車両誘導装置 |
US6067521A (en) * | 1995-10-16 | 2000-05-23 | Sony Corporation | Interrupt correction of speech recognition for a navigation device |
JPH09292255A (ja) | 1996-04-26 | 1997-11-11 | Pioneer Electron Corp | ナビゲーション方法及び装置 |
JP3605682B2 (ja) * | 1996-05-16 | 2004-12-22 | 本田技研工業株式会社 | 音声入力制御装置 |
US6081803A (en) * | 1998-02-06 | 2000-06-27 | Navigation Technologies Corporation | Support for alternative names in a geographic database used with a navigation program and methods for use and formation thereof |
US6073076A (en) * | 1998-03-27 | 2000-06-06 | Navigation Technologies Corporation | Memory management for navigation system |
US6173279B1 (en) * | 1998-04-09 | 2001-01-09 | At&T Corp. | Method of using a natural language interface to retrieve information from one or more data resources |
US6184823B1 (en) * | 1998-05-01 | 2001-02-06 | Navigation Technologies Corp. | Geographic database architecture for representation of named intersections and complex intersections and methods for formation thereof and use in a navigation application program |
US6122593A (en) * | 1999-08-03 | 2000-09-19 | Navigation Technologies Corporation | Method and system for providing a preview of a route calculated with a navigation system |
US6292745B1 (en) * | 2000-07-24 | 2001-09-18 | Navigation Technologies Corp. | Method and system for forming a database of geographic data for distribution to navigation system units |
-
1999
- 1999-09-09 JP JP25598199A patent/JP4642953B2/ja not_active Expired - Fee Related
-
2000
- 2000-09-07 EP EP00307731.0A patent/EP1083405B2/en not_active Expired - Lifetime
- 2000-09-07 DE DE60002140T patent/DE60002140T2/de not_active Expired - Lifetime
- 2000-09-11 US US09/659,066 patent/US6950797B1/en not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08328584A (ja) * | 1995-05-29 | 1996-12-13 | Sony Corp | 音声認識装置、音声認識方法及びナビゲーション装置 |
JPH09114489A (ja) * | 1995-10-16 | 1997-05-02 | Sony Corp | 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車 |
JPH1019194A (ja) * | 1996-07-01 | 1998-01-23 | Hitachi Ltd | 高温圧力容器 |
JPH1096647A (ja) * | 1996-07-31 | 1998-04-14 | Aisin Aw Co Ltd | 車両用ナビゲーション装置及び記憶媒体 |
JPH1062199A (ja) * | 1996-08-23 | 1998-03-06 | Toyota Motor Corp | 音声認識装置 |
JPH11183190A (ja) * | 1997-12-24 | 1999-07-09 | Toyota Motor Corp | ナビゲーション用音声認識装置および音声認識機能付きナビゲーション装置 |
JPH11184880A (ja) * | 1997-12-24 | 1999-07-09 | Sharp Corp | 音声認識装置及びコンピュータ読み取り可能な記録媒体 |
JPH11325946A (ja) * | 1998-05-15 | 1999-11-26 | Matsushita Electric Ind Co Ltd | 車載用ナビゲーション装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070276586A1 (en) * | 2006-05-25 | 2007-11-29 | Samsung Electronics Co., Ltd. | Method of setting a navigation terminal for a destination and an apparatus therefor |
Also Published As
Publication number | Publication date |
---|---|
EP1083405B1 (en) | 2003-04-16 |
DE60002140D1 (de) | 2003-05-22 |
EP1083405B2 (en) | 2013-07-10 |
JP2001083988A (ja) | 2001-03-30 |
DE60002140T2 (de) | 2004-01-29 |
EP1083405A1 (en) | 2001-03-14 |
US6950797B1 (en) | 2005-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4270611B2 (ja) | 入力システム | |
US6253174B1 (en) | Speech recognition system that restarts recognition operation when a new speech signal is entered using a talk switch | |
US6836822B1 (en) | Apparatus for and method of retrieving information | |
JP4642953B2 (ja) | 音声検索装置、および、音声認識ナビゲーション装置 | |
US20070156331A1 (en) | Navigation device | |
JPH06208389A (ja) | 情報処理方法及び装置 | |
JPH10111141A (ja) | 車両用ナビゲーション装置 | |
JP3892338B2 (ja) | 単語辞書登録装置および単語登録用プログラム | |
JP5455355B2 (ja) | 音声認識装置及びプログラム | |
EP0827124A2 (en) | Vehicle navigation system with city name selection accelerator and medium for storage of programs thereof | |
JPH08202386A (ja) | 音声認識方法、音声認識装置、およびナビゲーション装置 | |
JP3818352B2 (ja) | ナビゲーション装置及び記憶媒体 | |
JP3645104B2 (ja) | 辞書検索装置及び辞書検索プログラムを記録した記録媒体 | |
JP2947143B2 (ja) | 音声認識装置及びナビゲーション装置 | |
JP3296783B2 (ja) | 車載用ナビゲーション装置および音声認識方法 | |
JP2002039779A (ja) | ナビゲーションシステム | |
JPH0926799A (ja) | 音声認識装置 | |
EP1895508B1 (en) | Speech recognizing device, information processing device, speech recognizing method, program, and recording medium | |
WO2006028171A1 (ja) | データ提示装置、データ提示方法、データ提示プログラムおよびそのプログラムを記録した記録媒体 | |
JP2003029778A (ja) | ナビゲーションシステムにおける音声対話インターフェース処理方法 | |
JP3506584B2 (ja) | 情報検索装置及びナビゲーション装置における情報入力装置、並びに情報検索方法、並びにナビゲーション装置における情報入力制御プログラムが記録されたコンピュータ読み取り可能な記録媒体 | |
JP4550207B2 (ja) | 音声認識装置および音声認識ナビゲーション装置 | |
JP3679033B2 (ja) | ナビゲーション装置 | |
JPH11325946A (ja) | 車載用ナビゲーション装置 | |
JP2997164B2 (ja) | 地図表示装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060907 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090612 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090623 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090821 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100126 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20100212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100326 |
|
TRDD | Decision of grant or rejection written | ||
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20101102 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101109 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101202 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131210 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |