JP3890774B2 - ナビゲーションシステム - Google Patents

ナビゲーションシステム Download PDF

Info

Publication number
JP3890774B2
JP3890774B2 JP28792898A JP28792898A JP3890774B2 JP 3890774 B2 JP3890774 B2 JP 3890774B2 JP 28792898 A JP28792898 A JP 28792898A JP 28792898 A JP28792898 A JP 28792898A JP 3890774 B2 JP3890774 B2 JP 3890774B2
Authority
JP
Japan
Prior art keywords
input
speech
reference address
recognition
recognition result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP28792898A
Other languages
English (en)
Other versions
JP2000122685A (ja
Inventor
淳 那須田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP28792898A priority Critical patent/JP3890774B2/ja
Publication of JP2000122685A publication Critical patent/JP2000122685A/ja
Application granted granted Critical
Publication of JP3890774B2 publication Critical patent/JP3890774B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Navigation (AREA)
  • Traffic Control Systems (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、目的地検索機能を有するナビゲーションシステムに関し、特に、住所や施設名称などの目的地特定データを音声入力できるようにしたナビゲーションシステムに関する。
【0002】
【従来の技術及び発明が解決しようとする課題】
従来より、入力された音声を予め記憶されている複数の比較対象パターン候補と比較し、一致度合の高いものを認識結果とする音声認識装置が既に実用化されており、例えばナビゲーションシステムにおいて設定すべき目的地を利用者が地名を音声で入力するためなどに用いられている。特に車載ナビゲーションシステムを運転手自身が利用する場合、音声入力であればボタン操作や画面注視が伴わないため、車両の走行中に行っても安全性が高いため有効である。
【0003】
このような機能を満たすためには、十分詳細な地点の指定が容易にできなくてはならない。具体的には、住所で特定するためには、県や市のレベルではなく、市の下の町名のレベルや、町村における大字といったレベルまで入力できる必要がある。また、施設名称で特定するためには、省略しない正式名称にて音声入力する必要がある。
【0004】
さらに、住所で特定する場合を例に取れば、利用者が例えば「愛知県刈谷市昭和町」と設定したい場合に、「愛知県」「刈谷市」「昭和町」というように県市町というレベル毎に区切って発音しなくてはならないとすると利用者にとって煩わしいので、ひと続きで入力(一括入力)できるようにすることが好ましい。
【0005】
但し、このように一括入力に対応する構成とした場合には、逆に利用者にとって使い勝手が悪くなる状況も想定される。それは、上述したように、住所で特定するためには、県や市のレベルではなく、市の下の町名のレベルや、町村における大字といったレベルまで入力しなくてはならず、例えば「愛知県刈谷市昭和町」と音声入力しなくてはならないこととなる。
【0006】
しかしながら、例えば愛知県内の複数の場所を連続して検索している場合などを考えると、ユーザにとって、毎回「愛知県○○市××町……」というように県名から音声入力するのは面倒であり、また日常的な感覚からすると愛知県を省略するのが普通である。さらに、同一の市町村内の複数の場所を連続して検索している場合には、市町村名まで省略するのがユーザの感覚に沿ったものとなる。
【0008】
本発明は、このような問題を解決し、目的地検索機能による検索履歴を考慮した音声認識を実行することによって、上位階層を省略した音声入力の方が自然な場合であっても上位階層から音声入力しなくてはならないという利用者の負担を軽減し、使い勝手をより向上させたナビゲーションシステムを提供することを目的とする。
【0009】
【課題を解決するための手段及び発明の効果】
上記目的を達成するためになされた請求項1に記載のナビゲーションシステムによれば、利用者が音声入力手段を介して音声を入力すると、認識手段が、その入力された音声を予め辞書手段に記憶されている複数の比較対象パターン候補と比較して一致度合の高いものを認識結果とし、報知手段によって認識結果を報知する。そして、認識結果が報知された後に所定の確定指示がなされた場合には、確定後処理手段が、その認識結果を確定したものとしてナビゲーション手段へ出力する。なお、認識結果の報知後の「所定の確定指示」に関しては、やはり音声で入力(例えば「はい」と発声することで入力)したり、確定ボタンのようなスイッチ類の操作によって指示したりすることが考えられる。
【0010】
ナビゲーション手段は少なくとも目的地検索機能を有しており、その目的地検索を行う上で指定される必要のある所定の目的地特定データの指示が音声入力手段を介して入力されると、その目的地特定データに基づいて目的地検索を実行する。なお、目的地特定データとは、例えば住所や施設名称や電話番号や郵便番号などである。現状のナビゲーションシステムにおいても、検索に際して上述した住所や施設名称などを入力して検索していく方法が採用されている。
【0011】
ここで、辞書手段に記憶されている複数の比較対象パターン候補の内の少なくとも一部については、複数の語を階層的につなぎ合わせたものとして設定されている。また、ナビゲーション手段による目的地検索の結果である目的地の住所の上位階層を構成する語又は語群は、参照用住所として取り込まれて参照用住所記憶手段に記憶される。そして、音声認識手段は、その参照用住所記憶手段に記憶されている参照用住所を入力音声に付加したものも、比較対象パターン候補と比較する入力音声と見なした上で音声認識を実行する。
【0012】
したがって、複数の語が階層的につなぎ合わせて設定されている住所については、その全てを音声入力しなくてもよい状況が生まれる。つまり、参照用住所として記憶されている上位階層に続く下位階層を構成する語又は語群だけを音声入力した場合であっても、予め辞書手段に設定されている比較対象パターン候補と比較して音声認識されることが可能となるのである。
【0013】
このことによる効果及び地名関連データについて明確にするため、具体例を挙げて説明する。
例えば愛知県内の複数の場所を連続して検索している場合などを考えると、ユーザにとって、毎回「愛知県○○市××町……」というように県名から音声入力するのは面倒である。つまり、愛知県内の複数の場所を順次検索していく際には、ユーザの意識として愛知県内の場所を検索していることは当然のこととして考えており、その中のどの市町村についてのものかが重要となる。同様に、同一の市町村内の複数の場所を連続して検索している場合には、さらにその市町村内の場所を検索していることが当然のこととなり、その中のどの地域についてのものであるかが重要となる。
【0014】
この点に関して本発明のナビゲーションシステムでは、目的地検索の結果、例えば「愛知県刈谷市昭和町」という住所が確定されて記憶手段に地名関連データとして記憶されている場合、次のような省略した音声入力が可能となる。つまり、例えば「愛知県犬山市○○町」については「犬山市○○町」というように市名から入力するだけでよく、また「愛知県○○市桜町」については「桜町」というように町名から入力するだけでよくなる。つまり、地名関連データである「愛知県刈谷市昭和町」は、「愛知県」と「刈谷市」と「昭和町」というそれぞれ地名としての異なるレベルを示す複数の語を階層的につなぎ合わせたものであるため、その上位階層を構成する語又は語群である「愛知県」あるいは「愛知県刈谷市」が参照用住所として記憶されることとなる。そのため、2回目には「犬山市○○町」とだけ音声入力すればそれは「愛知県犬山市○○町」と音声入力したものと見なし、また「桜町」とだけ音声入力するだけでも、それが「愛知県○○市桜町」と音声入力したものであると見なして、音声認識を実行できる。
さらに本発明のナビゲーションシステムでは、参照用住所の取込を許可あるいは禁止する指示を利用者が入力するための指示入力手段を備え、その指示入力手段によって参照用住所の取込が許可されている場合に限り、参照用住所の取込が実行されるよう構成されている。これは、利用者の判断で適切な地名関連データのみを記憶しておくようにした方が都合がよい場合もあるからである。
【0015】
ところで、上述した請求項1のナビゲーションシステムにおいては、住所の上位階層が省略されている入力音声に参照用住所を付加したものが音声入力されたと見なすことで対応し、辞書手段の比較対象パターン候補についてはそのままであった。これに対して、請求項2に示すように、辞書手段の比較対象パターン候補に関して工夫を施すことで対応してもよい。
【0016】
この場合には、辞書制御手段が次のような処理を実行する。すなわち、ナビゲーション手段による目的地検索の結果である目的地の住所の上位階層を構成する語又は語群を参照用住所として取り込み、辞書手段に記憶されている該当する比較対象パターン候補から参照用住所の上位階層を構成する語又は語群を省略した第2の比較対象パターン候補を新設する。そして、音声認識手段は、辞書制御手段によって第2の比較対象パターン候補が新設された状態の辞書手段に記憶されている比較対象パターン候補を用いて、前記音声認識手段が今回の入力音声に対する比較を実行する。
【0017】
そして、確定後手段は、音声認識手段による認識結果に参照用住所も加味して認識結果を確定する。上述の具体例を用いて説明すれば、例えば「愛知県」という参照用住所があるために第2の比較対象パターン候補として「犬山市○○町」が設定された場合には、その「犬山市○○町」という認識結果に参照用住所である「愛知県」を加味し、「愛知県犬山市○○町」が確定した認識結果であるとしてナビゲーション手段へ出力することとなる。また、例えば「愛知県刈谷市」という参照用住所があるために第2の比較対象パターン候補として「桜町」が設定された場合には、その「桜町」という認識結果に参照用住所である「愛知県刈谷市」を加味し、「愛知県刈谷市桜町」が確定した認識結果であるとしてナビゲーション手段へ出力することとなる。
なお、請求項2のナビゲーションシステムの場合も、請求項1の場合と同様、参照用住所の取込を許可あるいは禁止する指示を利用者が入力するための指示入力手段を備え、その指示入力手段によって参照用住所の取込が許可されている場合に限り、参照用住所の取込が実行されるよう構成されている。
【0019】
このように、目的地検索機能による検索履歴を考慮した音声認識を実行することによって、上位階層を省略した音声入力の方が自然な場合であっても上位階層から音声入力しなくてはならないという利用者の負担を軽減し、使い勝手をより向上させることができる。
【0020】
また、参照用住所については、直前の目的地検索において得たもののみを記憶しておいてもよいが、過去の所定回数分の目的地検索において得た複数の参照用住所を記憶したり用いたりすることが考えられる。つまり、目的地として頻繁に検索する対象は、例えば都道府県や市町村レベルで考えた場合に同一エリア内となることが多いと考えられる。したがって、参照用住所記憶手段の記憶容量や音声認識手段における処理負荷が過大にならなければ、ある程度多数の地名関連データを記憶しておくことが、利用者の負担軽減及び使い勝手の向上につながる。
【0022】
また、ナビゲーション手段に関して言えば、請求項に示すように、上述した目的地検索により確定された目的地を、その周辺の地図と共に、目的地が区別可能な状態で表示手段に表示することが考えられる。目的地を検索した場合には、その目的地の地点を地図上で示すことが一般的に採用されている。
【0023】
さらに、前記認識結果の報知に関しては請求項に示すように、認識結果の内容を音声として出力することによって行うことが考えられる。カーナビゲーションシステムなどの車載機器用として用いる場合には、音声で出力されれば、ドライバーは視点を表示装置にずらしたりする必要がないので、安全運転のより一層の確保の点では有利であると言える。但し、音声出力に限定されるものではなく、画面上に文字または記号を表示できる表示装置に、認識結果の内容を、文字または記号による画像にて表示することにより行ったり、音声及び画像の両方にて報知するようにしてもよいし、それら以外の報知の手法を採用してもよい。車載機器として適用する場合に音声出力が有利であることを述べたが、もちろん車両が走行中でない状況もあるので、音声及び画像の両方で報知すれば、ドライバーは表示による確認と音声による確認との両方が可能となる。
【0024】
【発明の実施の形態】
図1は本発明の実施形態のナビゲーションシステム2の概略構成を示すブロック図である。本ナビゲーションシステム2は、位置検出器4、地図データ入力器6、操作スイッチ群8、これらに接続された制御回路10、制御回路10に接続された外部メモリ12、表示装置14及びリモコンセンサ15及び音声認識装置30を備えている。なお制御回路10は通常のコンピュータとして構成されており、内部には、周知のCPU、ROM、RAM、I/O及びこれらの構成を接続するバスラインが備えられている。
【0025】
前記位置検出器4は、いずれも周知のジャイロスコープ18、距離センサ20、及び衛星からの電波に基づいて車両の位置を検出するGPS(Global Positioning System )のためのGPS受信機22を有している。これらのセンサ等18,20,22は各々が性質の異なる誤差を持っているため、複数のセンサにより、各々補間しながら使用するように構成されている。なお、精度によっては上述した内の一部で構成してもよく、更に、地磁気センサ、ステアリングの回転センサ、各転動輪の車輪センサ等を用いてもよい。
【0026】
地図データ入力器6は、位置検出の精度向上のためのいわゆるマップマッチング用データ、地図データ及び目印データを含む各種データを入力するための装置である。媒体としては、そのデータ量からCD−ROMを用いるのが一般的であるが、メモリカード等の他の媒体を用いても良い。
【0027】
表示装置14はカラー表示装置であり、表示装置14の画面には、位置検出器4から入力された車両現在位置マークと、地図データ入力器6より入力された地図データと、更に地図上に表示する誘導経路や後述する設定地点の目印等の付加データとを重ねて表示することができる。
【0028】
また、本ナビゲーションシステム2は、リモートコントロール端末(以下、リモコンと称する。)15aを介してリモコンセンサ15から、あるいは操作スイッチ群8により目的地の位置を入力すると、現在位置からその目的地までの最適な経路を自動的に選択して誘導経路を形成し表示する、いわゆる経路案内機能も備えている。このような自動的に最適な経路を設定する手法は、ダイクストラ法等の手法が知られている。操作スイッチ群8は、例えば、表示装置14と一体になったタッチスイッチもしくはメカニカルなスイッチ等が用いられ、各種入力に使用される。
【0029】
そして、音声認識装置30は、上記操作スイッチ群8あるいはリモコン15aが手動操作により目的地などを指示するために用いられるのに対して、利用者が音声で入力することによっても同様に目的地などを指示することができるようにするための装置である。
【0030】
この音声認識装置30は、「音声認識手段」としての音声認識部31と、対話制御部32と、音声合成部33と、音声入力部34と、「音声入力手段」としてのマイク35と、PTT(Push-To-Talk)スイッチ36と、スピーカ37とを備えている。
【0031】
音声認識部31は、音声入力部34から入力された音声データを、対話制御部32からの指示により入力音声の認識処理を行い、その認識結果を対話制御部32に返す。すなわち、音声入力部34から取得した音声データに対し、記憶している辞書データを用いて照合を行ない、複数の比較対象パターン候補と比較して一致度の高い上位比較対象パターンを対話制御部32へ出力する。入力音声中の単語系列の認識は、音声入力部34から入力された音声データを順次音響分析して音響的特徴量(例えばケプストラム)を抽出し、この音響分析によって得られた音響的特徴量時系列データを得る。そして、周知のDPマッチング法によって、この時系列データをいくつかの区間に分け、各区間が辞書データとして格納されたどの単語に対応しているかを求める。
【0032】
対話制御部32は、その認識結果及び自身が管理する内部状態から、音声合成部33への応答音声の発声指示や、システム自体の処理を実行する制御回路10に対して例えばナビゲート処理のために必要な目的地を通知して設定処理を実行させるよう指示する処理を実行する。このような処理が確定後処理であり、結果として、この音声認識装置30を利用すれば、上記操作スイッチ群8あるいはリモコン15aを手動しなくても、音声入力により目的地の指示などが可能となるのである。
【0033】
また音声入力部34は、マイク35にて取り込んだ周囲の音声をデジタルデータに変換して音声認識部31に出力するものである。本実施形態においては、利用者がPTTスイッチ36を押しながらマイク35を介して音声を入力するという使用方法である。具体的には、音声入力部34はPTTスイッチ36が押されたかどうかを判断しており、PTTスイッチ36が押されている場合にはマイク35を介しての音声入力処理を実行するが、押されていない場合にはその音声入力処理を実行しないようにしている。したがって、PTTスイッチ36が押されている間にマイク35を介して入力された音声データのみが音声認識部31へ出力されることとなる。
【0034】
ここで、音声認識部31と対話制御部32についてさらに説明する。図2は、この音声認識部31と対話制御部32の構成をさらに詳しく示したものであり、(A),(B)の2つの構成例を説明する。
まず、図2(A)に示す構成では、音声認識部31が照合部31aと辞書部31bとで構成されており、対話制御部32が記憶部32a、入力部32b及び後処理部32cで構成されている。音声認識部31においては、照合部31aが、音声入力部34から取得した音声データに対し、辞書部31b内に記憶されている辞書データを用いて照合を行なうのである。但し、対話制御部32の記憶部32aに参照用住所があれば、その参照用住所を音声データに付加したものも入力された音声であると一時的に見なして比較対象パターン候補と照合を行なう。この照合の詳細については後述する。
【0035】
そして、照合部31aにて複数の比較対象パターン候補と比較されて一致度が高いとされた上位比較対象パターンは、対話制御部32の記憶部32aへ出力すされることとなる。
ところで、本実施形態の辞書部31bに記憶されている辞書データは、比較対象パターン候補となる語彙そのもののデータだけでなく、その比較対象パターンとなる語彙が複数の語を階層的につなぎ合わせたものである場合、その階層構造を示すデータも記憶されている。具体的には、語彙を構成する音節データが図3に示すように木(tree)構造の各辺(図3において矢印(→)で示す)に割り付けられている。なお、図3において一重丸(○)は頂点を表し、二重丸(◎)は受理頂点、すなわち単語に対する頂点を表す。そして、図3中の矢印Aで示す頂点が「根」となり、そこから先行順走査(preorder traversal)にしたがって各辺に割り付けられ音節を辿ることで単語が完成する。ここで「先行順走査」とは、根を訪問し、次に子を根とする部分木を順番に走査(この走査も先行順走査である。)していくことを指す。なお、ここで、「親」とは直前の頂点、「子」とは次の頂点、「兄弟」とは同じ親を持つ頂点同士をそれぞれ意味する。
【0036】
例えば図3に示す具体例では、「あいちけんかりやししょうわちょう(愛知県刈谷市昭和町)」という一つの認識対象単語は、「あいちけん(愛知県)」と「かりやし(刈谷市)」と「しょうわちょう(昭和町)」という3つの語が階層的につなぎ合わせたものである。したがって、このように3階層となっているということが図3に矢印B,Cで示す受理頂点の存在によって判る。つまり、受理頂点はそこまで辿ってきた音節データで単語が構成されることを示すが、逆にその受理頂点から下流側にさらに音節データがある場合には、その受理頂点よりも上流側が上位階層となり、下流側が下位階層となる。例えば、図3に矢印Bで示す受理頂点を考えると、上流側の「あいちけん(愛知県)」が上位階層であり、下流側の「かりやし(刈谷市)……」が下位階層である。つまり、この場合には県を示す語が上位階層で、市レベル以下を示す語が下位階層となる。また、図3に矢印Cで示す受理頂点を考えると、上流側の「あいちけんかりやし(愛知県刈谷市)」が上位階層であり、図3には示していないが下流側の例えば「しょうわちょう(昭和町)」が下位階層となる。
【0037】
以上は辞書部31bに記憶されている辞書データの説明として、愛知県刈谷市昭和町という具体例で説明したが、基本的には都道府県を最上位階層とし、市レベルを2番目の階層、町レベルを3番目の階層として他の地名についてもデータが設定されている。なお、「基本的に」といったのは、県の次の市レベルで「町」や「村」が来る地名もあるからである。
【0038】
辞書部31bの説明はこれで終わることとする。上述したように、音声認識部31においては、照合部31aが、音声入力部34から取得した音声データに対し、辞書部31b内に記憶されている複数の比較対象パターン候補と比較して一致度の高い上位比較対象パターンを対話制御部32の記憶部32aへ出力する。そして記憶部32aでは、この上位比較対象パターンを記憶しておく。また、入力部32bは制御回路10からの外部状況を入力するのであるが、その入力した外部状況も記憶部32aに記憶される。この場合の外部状況とは、例えば表示装置14において地図が表示されたことや、その表示された地図に関連する住所データなどである。
【0039】
そして、後処理部32cでは、例えば上記所定の確定指示がなされた場合に制御回路10へデータを送って所定の処理をするように指示する「確定後処理」を実行したり、あるいは音声合成部33へ音声データを送って発音させるように指示する処理を実行する。なお、この場合の制御回路10へ送るデータとしては、最終的な認識結果としての上位比較対象パターンの全てでもよいし、あるいはその内の最上位のものだけでもよい。
【0040】
一方、図2(B)に示す構成では、音声認識部31が照合部131aと辞書部131bとで構成されており、対話制御部32が記憶部132a、入力部132b、後処理部132c及び辞書制御部132dで構成されている。
上記図2(A)に示す構成では、対話制御部32の記憶部32aに参照用住所があれば、その参照用住所を音声データに付加したものも入力された音声であると一時的に見なして比較対象パターン候補と照合を行なうようにしていたが、図2(B)の構成では、照合部31aにおける照合処理に先だって、対話制御部32の辞書制御部132dが辞書部31bに記憶されている辞書データの制御を行なう。具体的には、記憶部132aに記憶されている参照用住所を参照して省略可能な上位階層リストを作成し、その省略可能な上位階層部分を辞書部31b内に記憶されている辞書データから一時的に省略する。このように辞書制御がなされた辞書データを用いて照合部31aが照合処理を実行するのである。
【0041】
なお、後処理部132cの動作は、上記図2(A)の場合と同様なので、ここでは説明を省略する。
次に、本実施形態のナビゲーションシステム2の動作について説明する。なお、音声認識装置30に関係する部分が特徴であるので、ナビゲーションシステムとしての一般的な動作を簡単に説明した後、音声認識装置30に関係する部分の動作について詳しく説明することとする。
【0042】
ナビゲーションシステム2の電源オン後に、表示装置14上に表示されるメニューから、ドライバーがリモコン15a(操作スイッチ群8でも同様に操作できる。以後の説明においても同じ)により、案内経路を表示装置14に表示させるために経路情報表示処理を選択した場合、あるいは、音声認識装置30を介して希望するメニューをマイク35を介して音声入力することで、対話制御部32から制御回路10へ、リモコン15aを介して選択されるのを同様の指示がなされた場合、次のような処理を実施する。
【0043】
すなわち、ドライバーが表示装置14上の地図に基づいて、音声あるいはリモコンなどの操作によって目的地を入力すると、GPS受信機22から得られる衛星のデータに基づき車両の現在地が求められ、目的地と現在地との間に、ダイクストラ法によりコスト計算して、現在地から目的地までの最も短距離の経路を誘導経路として求める処理が行われる。そして、表示装置14上の道路地図に重ねて誘導経路を表示して、ドライバーに適切なルートを案内する。このような誘導経路を求める計算処理や案内処理は一般的に良く知られた処理であるので説明は省略する。
【0044】
次に、音声認識装置30における動作について、目的地を検索するために、その目的地検索を行う上で指定される必要のある目的地特定データを音声入力する場合を例にとって説明する。
図4,図5は、その場合の音声認識部31及び対話制御部32における処理を示すフローチャートであり、図4は音声認識に関する処理、図5は参照用住所取込に関する処理を示している。なお、これらのフローチャートは、音声認識部31及び対話制御部32が図2(A)に示す構成を備えていることを前提とした処理を示している。
【0045】
まず図4の音声認識に関する処理について説明する。
最初のステップS10においては音声入力があるかどうかを判断する。上述したように、PTTスイッチ36が押されている間にマイク35を介して入力された音声データのみが音声入力部34から音声認識部31へ出力されるので、この音声入力部34からの音声入力があるかどうかを判断する。
【0046】
音声入力があれば、S20へ移行して音声認識処理を実行する。この音声認識処理は、取得した音声データに対して辞書部31b内に記憶されている辞書データを用いて照合を行なう。
続くS30では、S20での音声認識処理によって認識が成功したかどうかを判断する。認識が成功していれば(S30:YES)、S40に移行し、S20での音声認識処理による認識結果が、「はい」という音声入力であるかどうかを判断する。そして、「はい」という音声入力でなければ(S40:NO)、続くS50にて認識結果が所定カテゴリに属するものであるかどうかを判断する。ここでは経路案内のための目的地を設定する処理を前提としているので、この所定カテゴリとは、地名・住所に関するカテゴリである。
【0047】
所定カテゴリであれば(S50:YES)、S60へ移行して、その認識結果を音声にて応答する処理を実行する。これは、音声合成部33及びスピーカを介して認識結果を音声として出力する処理である。それに対して、所定カテゴリでなければ(S50:NO)、S70へ移行してその他の処理を実行する。S60あるいはS70の処理の後は本ルーチンを一旦終了し、再度S10の音声入力待ちとなる。
【0048】
また、S40にて肯定判断、すなわち認識結果が「はい」という音声入力であった場合には、S80へ移行して認識結果を確定する。そして続くS90にて、所定の確定後処理を実行する。この場合の確定後処理とは、認識結果としての「経路案内のための目的地」に関するデータを、制御回路10へ(図1参照)へ出力する処理などとなる。そして、このような確定後処理が終了した後は本ルーチンを一旦終了し、再度S10の音声入力待ちとなる。
【0049】
一方、S30にて否定判断、すなわち認識成功でなければ、S100へ移行し、認識を失敗した場合の特定の処理(S100〜S150)を行う。但し、この中で参照用住所を参照した再度の音声認識処理(S110)があるので、それに関連する参照用住所取込に関する処理を図5を参照して説明しておく。
【0050】
図5の処理は定期的に起動されて実行されるものであり、最初のステップS210においては、制御回路10が表示装置14に地図を表示したかどうかを判断する。そして、地図を表示していれば(S210:YES)、その表示された地図に関連する住所データを取り込む(S220)。これらの処理は、図2(A)を参照して上述したように、対話制御部32の入力部32bが、制御回路10から入力した外部状況に基づいて行う。
【0051】
そして、S220にて実行した住所の取り込みが初めてであるかどうかを判断し(S230)、初めての取込であれば(S230:YES)、カウンタCNTを0にし(S250)、初めての取込でなければ(S230:NO)、カウンタCNTをインクリメント(CNT←CNT+1)してから(S240)、S260へ移行する。
【0052】
S260では、S220にて取り込んだ住所を、図2(A)に示した対話制御部32内の記憶部32aに設定されたバッファ[CNT]に記憶する。これで本ルーチンを終了する。なお、地図を表示していない場合には(S210:NO)、S220以降の処理を実行することなく、本ルーチンを終了する。
【0053】
ここで、S260での参照用住所の記憶処理について補足説明する。この場合に記憶する住所は、いわゆる上位階層に相当する部分のみである。つまり、「愛知県刈谷市」の場合の「愛知県」、「愛知県刈谷市桜町」の場合の「愛知県刈谷市」といった具合である。
【0054】
図4の処理に戻り、S100では、カウンタCNTを0にリセットし、続くS110にて、対話制御部32内の記憶部32a(図2(A)参照)に設定されたバッファ[CNT]に記憶された住所を付加した状態で、再度、音声認識処理を実行する。つまり、記憶された住所が「愛知県」であれば、その愛知県を頭に付加したものが音声入力されたと見なして、音声認識を行う。
【0055】
続くS120では、S110での音声認識処理によって認識が成功したかどうかを判断し、認識が成功していれば(S120:YES)、S40に移行する。このS40以降の処理については上述したので説明は繰り返さない。
これに対して、S110での音声認識処理によって認識が成功しなかった場合には(S120:NO)、S130へ移行してカウンタCNTが最大値MAX以上であるかどうかを判断する。そして、カウンタCNTが最大値MAX未満である場合には(S130:NO)、そのカウンタCNTをインクリメント(CNT←CNT+1)してから(S140)、S110へ戻る。
【0056】
つまり、バッファ[CNT]に記憶された住所を順番に付加した状態で、認識が成功するまで音声認識処理を繰り返し行うのである。そして、音声認識が成功した時点で(S120:YES)、S40へ移行する。なお、記憶された全ての住所を付加しても認識が成功しなかった場合には(S130:YES)、S150へ移行して所定のエラー処理を行う。例えば、認識が失敗したことを音声にて応答するなどの処理である。
【0057】
なお、本実施例においては、図5のS220にて取り込んだ住所(参照用住所)をCNTに対応させて記憶させていた。この最大値MAXに関しては、例えばMAX=0とすれば、直前の地図表示にて得られた参照用住所のみを記憶しておくこととなる。但し、現実的には過去のある程度の回数分の参照用住所を記憶しておくことが好ましい。つまり、目的地として頻繁に検索する対象は、例えば都道府県や市町村レベルで考えた場合に同一エリア内となることが多いと考えられる。したがって、対話制御部32内の記憶部32aの記憶容量や音声認識部31の照合部31aにおける処理負荷が過大にならなければ、ある程度多数の参照用住所を記憶しておくことが、利用者の負担軽減及び使い勝手の向上につながる。
【0058】
以上説明した処理を行うことによって、本実施形態のナビゲーションシステム2は次の効果を発揮する。
例えば愛知県内の複数の場所を連続して検索している場合などを考えると、ユーザにとって、毎回「愛知県○○市××町……」というように県名から音声入力するのは面倒である。つまり、愛知県内の複数の場所を順次検索していく際には、ユーザの意識として愛知県内の場所を検索していることは当然のこととして考えており、その中のどの市町村についてのものかが重要となる。同様に、同一の市町村内の複数の場所を連続して検索している場合には、さらにその市町村内の場所を検索していることが当然のこととなり、その中のどの地域についてのものであるかが重要となる。
【0059】
この点に関して本ナビゲーションシステム2では、目的地検索の結果、例えば「愛知県刈谷市」という住所が確定されて地図表示がなされ、参照用住所として「愛知県」が記憶されている場合には、次のような省略した音声入力であっても音声認識が可能となる。つまり、例えば「愛知県犬山市○○町」については「犬山市○○町」というように市名から入力するだけでよい。また、例えば「愛知県刈谷市桜町」という住所が確定されて地図表示がなされ、参照用住所として「愛知県刈谷市」が記憶されている場合には、「愛知県○○市桜町」については「桜町」というように町名から入力するだけでよくなる。
【0061】
このように、目的地検索機能による検索履歴を考慮した音声認識を実行することによって、上位階層を省略した音声入力の方が自然な場合であっても上位階層から音声入力しなくてはならないという利用者の負担を軽減し、使い勝手をより向上させることができる。
【0062】
ところで、図4,図5のフローチャートに示す処理内容は、図2(A)に示す構成を前提としたものであったが、図2(B)に示す構成を前提とした場合について説明しておく。
この場合も基本的な処理は同じであるが、図5のS220にて取り込んだ参照用の住所の取り扱い方が異なる。つまり、図2(A)に示す構成を前提とした場合には、図5のS220にて取り込んだ参照用の住所をそのままバッファ[CNT]に記憶させておき、図2(B)に示す構成を前提とした場合には、その参照用住所を辞書データ自体に反映させることとなる。
すなわち、辞書部31bに記憶されている該当する比較対象パターン候補から参照用住所を構成する語を省略した第2の比較対象パターン候補を新設することとなる。上述した具体例で言えば、「犬山市○○町」という市名からの比較対象パターン候補や、「桜町」という町名からの比較対象パターン候補などがこれに相当する。したがって、これらの比較対象パターン候補も一時的に辞書データに加えた状態で音声認識処理を行うこととなる。
【0063】
そして、この場合の後処理部132cにて実行される確定後処理は、次のようなものとなる。例えば「愛知県」という参照用住所があるために比較対象パターン候補として「犬山市○○町」が新設された場合には、その「犬山市○○町」という認識結果に参照用住所である「愛知県」を加味し、「愛知県犬山市○○町」が確定した認識結果であるとして制御回路10へ出力することとなる。また、例えば「愛知県刈谷市」という参照用住所があるために比較対象パターン候補として「桜町」が新設された場合には、その「桜町」という認識結果に参照用住所である「愛知県刈谷市」を加味し、「愛知県刈谷市桜町」が確定した認識結果であるとして制御回路10へ出力することとなる。
【0064】
以上、本発明はこのような実施形態に何等限定されるものではなく、本発明の主旨を逸脱しない範囲において種々なる形態で実施し得る。
(1)例えば、参照用住所の記憶を許可あるいは禁止する指示を利用者が入力するための指示入力手段を備え、参照用住所の記憶が許可されている場合に限って記憶するように構成してもよい。これは、利用者の判断で適切な参照用住所のみを記憶しておくようにした方が都合がよい場合もあるからである。
【0065】
(2)上記実施形態では、「報知手段」としてスピーカ37を用い、音声出力により認識結果を報知するようにしたが、このように音声で出力されれば、認識結果の確認のためにドライバーが視点を移動する必要がないので、一層の安全運転に貢献できる。つまり、ナビゲーションシステム2を車載機器用として用いているので、このような音声出力には利点がある。もちろん、画面上に文字または記号を表示することにより認識結果を報知してもよいし、音声を出力することにより報知すると共に画面上に文字または記号を表示することにより報知するようにしてもよい。そして、画面上に認識結果を表示させる場合には、ナビゲーションシステム2の地図情報を表示するための表示装置14(図1参照)に表示させるような構成を採用することもできる。
【0066】
(2)ナビゲーションシステム2は、車載機器として用いられる場合だけではなく、例えば携帯型ナビゲーションシステムなどでもよい。但し、これまで説明したように車載機器用として用いる場合には利用者がドライバーであることが考えられ、その場合には運転自体が最重要であり、それ以外の車載機器については、なるべく運転に支障がないことが好ましい。したがって、車載機器としてのナビゲーションシステム2を前提とした音声認識装置の場合には、より一層の利点がある。
【図面の簡単な説明】
【図1】 本発明の実施の形態としてのナビゲーションシステムの概略構成を示すブロック図である。
【図2】 音声認識装置における音声認識部と対話制御部の構成を示すブロック図である。
【図3】 音声認識部内の辞書部に記憶されている辞書データを示す説明図である。
【図4】 音声認識装置における音声認識に関する処理を示すフローチャートである。
【図5】 音声認識装置における参照用住所取込に関する処理を示すフローチャートである。
【符号の説明】
2…ナビゲーションシステム 4…位置検出器
6…地図データ入力器 8…操作スイッチ群
10…制御回路 12…外部メモリ
14…表示装置 15…リモコンセンサ
15a…リモコン 18…ジャイロスコープ
20…距離センサ 22…GPS受信機
30…音声認識装置 31…音声認識部
31a…照合部 31b…辞書部
32…対話制御部 32a…記憶部
32b…入力部 32c…後処理部
33…音声合成部 34…音声入力部
35…マイク 36…PTTスイッチ
37…スピーカ
132a…記憶部 132b…入力部
132c…後処理部 132d…辞書制御部

Claims (5)

  1. 少なくとも目的地検索機能を有するナビゲーション手段と、
    該ナビゲーション手段が目的地検索を行う上で指定される必要のある所定の目的地特定データの指示を利用者が音声にて入力するための音声入力手段と、
    該音声入力手段を介して入力された音声を、予め辞書手段に記憶されている複数の比較対象パターン候補と比較して一致度合の高いものを認識結果とする音声認識手段と、
    該音声認識手段による認識結果を報知する報知手段と、
    該報知手段によって認識結果が報知された後に所定の確定指示がなされた場合には、当該認識結果を確定したものとして前記ナビゲーション手段へ出力する確定後処理手段と、
    を備えるナビゲーションシステムであって、
    前記辞書手段に記憶されている前記複数の比較対象パターン候補の内、少なくとも住所に関するものについては、複数の語を階層的につなぎ合わせて設定されており、
    さらに、前記ナビゲーション手段による目的地検索の結果である目的地の住所の上位階層を構成する語又は語群を参照用住所として取り込んで記憶しておく参照用住所記憶手段と、前記参照用住所の取込を許可あるいは禁止する指示を利用者が入力するための指示入力手段とを備え、
    該指示入力手段によって前記参照用住所の取込が許可されている場合に限り、前記参照用住所の取込が実行されるよう構成されており、
    前記音声認識手段は、前記参照用住所記憶手段に記憶されている参照用住所を前記入力音声に付加したものも、前記比較対象パターン候補と比較する入力音声と見なした上で、音声認識を実行すること、
    を特徴とするナビゲーションシステム。
  2. 少なくとも目的地検索機能を有するナビゲーション手段と、
    該ナビゲーション手段が目的地検索を行う上で指定される必要のある所定の目的地特定データの指示を利用者が音声にて入力するための音声入力手段と、
    該音声入力手段を介して入力された音声を、予め辞書手段に記憶されている複数の比較対象パターン候補と比較して一致度合の高いものを認識結果とする音声認識手段と、
    該音声認識手段による認識結果を報知する報知手段と、
    該報知手段によって認識結果が報知された後に所定の確定指示がなされた場合には、当該認識結果を確定したものとして前記ナビゲーション手段へ出力する確定後処理手段と、
    を備えるナビゲーションシステムであって、
    前記辞書手段に記憶されている前記複数の比較対象パターン候補の内、少なくとも住所に関するものについては、複数の語を階層的につなぎ合わせて設定されており、
    さらに、前記ナビゲーション手段による目的地検索の結果である目的地の住所の上位階層を構成する語又は語群を参照用住所として取り込み、前記辞書手段に記憶されている該当する比較対象パターン候補から前記参照用住所の上位階層を構成する語又は語群を省略した第2の比較対象パターン候補を新設する辞書制御手段と、前記参照用住所の取込を許可あるいは禁止する指示を利用者が入力するための指示入力手段とを備え、
    該指示入力手段によって前記参照用住所の取込が許可されている場合に限り、前記参照用住所の取込が実行されるよう構成されており、
    前記辞書制御手段によって前記第2の比較対象パターン候補が新設された状態の前記辞書手段に記憶されている比較対象パターン候補を用いて、前記音声認識手段が今回の入力音声に対する比較を実行し、
    前記確定後手段は、前記音声認識手段による認識結果に前記参照用住所も加味して認識結果を確定するよう構成されていること、
    を特徴とするナビゲーションシステム。
  3. 請求項1又は2記載のナビゲーションシステムにおいて、
    前記参照用住所は複数であることを特徴とするナビゲーションシステム。
  4. 請求項1〜3のいずれか記載のナビゲーションシステムにおいて、
    前記ナビゲーション手段は、前記目的地検索により確定された目的地を、その周辺の地図中と共に、当該目的地が区別可能な状態で表示手段に表示すること、
    を特徴とするナビゲーションシステム。
  5. 請求項1〜4のいずれか記載のナビゲーションシステムにおいて、
    前記報知手段は、音声を出力することにより報知する手段であり、前記認識結果の報知は、前記認識結果の内容を音声として前記音声出力手段から出力することによって行われることを特徴とするナビゲーションシステム。
JP28792898A 1998-10-09 1998-10-09 ナビゲーションシステム Expired - Fee Related JP3890774B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP28792898A JP3890774B2 (ja) 1998-10-09 1998-10-09 ナビゲーションシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP28792898A JP3890774B2 (ja) 1998-10-09 1998-10-09 ナビゲーションシステム

Publications (2)

Publication Number Publication Date
JP2000122685A JP2000122685A (ja) 2000-04-28
JP3890774B2 true JP3890774B2 (ja) 2007-03-07

Family

ID=17723553

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28792898A Expired - Fee Related JP3890774B2 (ja) 1998-10-09 1998-10-09 ナビゲーションシステム

Country Status (1)

Country Link
JP (1) JP3890774B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073080A (ja) * 2000-09-01 2002-03-12 Fujitsu Ten Ltd 音声対話システム
US20020111810A1 (en) * 2001-02-15 2002-08-15 Khan M. Salahuddin Spatially built word list for automatic speech recognition program and method for formation thereof
US7231343B1 (en) 2001-12-20 2007-06-12 Ianywhere Solutions, Inc. Synonyms mechanism for natural language systems
US6963801B2 (en) 2002-09-05 2005-11-08 Denso Corporation Vehicle navigation system having position correcting function and position correcting method
US7292978B2 (en) * 2003-12-04 2007-11-06 Toyota Infotechnology Center Co., Ltd. Shortcut names for use in a speech recognition system
CN1898529A (zh) * 2003-12-26 2007-01-17 松下电器产业株式会社 导航装置
JP4554272B2 (ja) * 2004-05-25 2010-09-29 三菱電機株式会社 音声対話装置
JP5802784B2 (ja) * 2014-03-24 2015-11-04 株式会社東芝 音声処理装置および音声処理方法

Also Published As

Publication number Publication date
JP2000122685A (ja) 2000-04-28

Similar Documents

Publication Publication Date Title
JP4270611B2 (ja) 入力システム
US7676370B2 (en) Command-inputting device having display panel
JP4736982B2 (ja) 作動制御装置、プログラム
JP4997796B2 (ja) 音声認識装置、及びナビゲーションシステム
US20070156331A1 (en) Navigation device
JP3890774B2 (ja) ナビゲーションシステム
JP2001216129A (ja) コマンド入力装置
JP4258890B2 (ja) 音声認識装置、その装置を用いたナビゲーションシステム
JP2010039099A (ja) 音声認識および車載装置
JP2007033209A (ja) ナビゲーション装置
JP3580643B2 (ja) 音声認識方法及び音声認識装置
JP2005275228A (ja) ナビゲーション装置
JP4381632B2 (ja) ナビゲーションシステムおよびその目的地入力方法
JP3700533B2 (ja) 音声認識装置及び処理システム
JP3624698B2 (ja) 音声認識装置、その装置を用いたナビゲーションシステム及び自動販売システム
JP3818352B2 (ja) ナビゲーション装置及び記憶媒体
JP2007065206A (ja) 施設検索装置
JP3654262B2 (ja) 音声認識装置及びナビゲーションシステム
JP3718088B2 (ja) 音声認識修正方式
JP3849283B2 (ja) 音声認識装置
JP3911835B2 (ja) 音声認識装置及びナビゲーションシステム
JP2010128144A (ja) 音声認識装置及びプログラム
JP3296783B2 (ja) 車載用ナビゲーション装置および音声認識方法
JP3705220B2 (ja) ナビゲーション装置、画像表示方法及び画像表示プログラム
JP3925368B2 (ja) 制御システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060711

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061114

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061127

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091215

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101215

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111215

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121215

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees