JP4004885B2 - 音声制御装置 - Google Patents

音声制御装置 Download PDF

Info

Publication number
JP4004885B2
JP4004885B2 JP2002218610A JP2002218610A JP4004885B2 JP 4004885 B2 JP4004885 B2 JP 4004885B2 JP 2002218610 A JP2002218610 A JP 2002218610A JP 2002218610 A JP2002218610 A JP 2002218610A JP 4004885 B2 JP4004885 B2 JP 4004885B2
Authority
JP
Japan
Prior art keywords
dictionary
voice
input
recognition
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002218610A
Other languages
English (en)
Other versions
JP2004061754A (ja
Inventor
誠 坂井
邦雄 横井
徹 名田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP2002218610A priority Critical patent/JP4004885B2/ja
Publication of JP2004061754A publication Critical patent/JP2004061754A/ja
Application granted granted Critical
Publication of JP4004885B2 publication Critical patent/JP4004885B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、音声制御装置に関するものである。
【0002】
【従来の技術】
従来、話者の発する音声を認識して住所の入力を行う音声制御装置がある。この音声制御装置において、ユーザが所望の住所を入力する場合には、都道府県、市区郡、町村字等の名称を単位として(以下、階層と呼ぶ)、この階層毎に所望の住所を区切って読みあげる。例えば、「愛知県刈谷市昭和町1丁目1番地」なる住所を入力する場合には、第1階層となる「愛知県」、第2階層となる「刈谷市」、第3階層となる「昭和町」、第4階層となる「1丁目」、及び第5階層となる「1番地」というように、階層毎に区切って読みあげる。
【0003】
一方、誤って入力した階層部分を修正して再度入力をやり直す場合、ユーザは、1つの階層の表示を消去するコマンドに対応する「戻る」を発することで、1つの階層のみが消去される。例えば、図15に示すように、ユーザが「愛知県刈谷市昭和町1丁目」まで発声した後に、「愛知県刈谷市」以降から再度入力し直す場合には、ユーザは、「1丁目」を発声した直後に「戻る」を2回連続して発声することで、目的とする階層まで入力した住所が消去される。その後、ユーザは、再度「愛知県刈谷市」以降の住所を入力する。
【0004】
このように、従来の音声制御装置では、ユーザは、住所を階層毎に区切って読みあげて所望の住所を入力し、また、誤って入力した階層部分を消去する場合には、「戻る」を発声して誤り部分を消去する。
【0005】
【発明が解決しようとする課題】
しかしながら、上述の音声制御装置における「戻る」に対応するコマンドは、消去対象である階層が1階層に限定されている。従って、例えば「愛知県刈谷市昭和町1丁目」と入力した後、再度、第1階層である都道府県名称から音声入力をやり直す場合には、ユーザは、「戻る」を4回連続して発声する必要があり、このような同一の発話内容を連続して発声することは、ユーザにとって煩わしいものであった。
【0006】
本発明は、かかる問題を鑑みてなされたもので、音声入力した住所の消去を簡単に行うことのできる音声制御装置を提供することを目的とする。
【0007】
請求項1に記載の音声制御装置は、音声を入力するための音声入力手段と、音声入力手段に入力されたユーザの発話音声を認識する音声認識手段と、ユーザによって少なくとも住所である音声が入力されたとき、認識された発話内容を複数の階層に分類して記憶するとともに、複数の階層の各々に対応する各住所の名称をつなぎ合わせて表示装置に表示し、当該発話内容を修正するための修正コマンドが入力されたとき、表示装置に表示している住所のうち、最下位の階層に位置する名称の表示を消去するとともに、最下層に分類して記憶されている発話内容の一部を消去する制御手段とを備え、
制御手段は、
修正コマンドの入力回数が1回であるか、若しくは2回であるかを判断する判断手段を備え、
判断手段による修正コマンドの入力回数の判断のみに基づいて、表示装置に表示している住所の名称、及び発話内容の消去に関する処理を切り換えるものであり、
判断手段によって修正コマンドの入力回数が1回であると判断された場合、表示装置に表示している住所のうち、最下位の階層に位置する名称の表示を消去するとともに、最下層に分類して記憶されている発話内容の一部を消去する処理を行い、
判断手段によって修正コマンドの入力回数が2回であると判断された場合、表示装置に表示している住所のうち、全ての階層に位置する名称の表示を消去するとともに、複数の階層に分類して記憶されている発話内容の全部を消去する処理を行うことを特徴とする。
【0008】
このように、本発明の音声制御装置は、修正コマンドの入力回数が1回であるか、若しくは2回であるかを判断する判断手段を備え、この判断手段による修正コマンドの入力回数の判断のみに基づいて、表示装置に表示している住所の名称、及び発話内容の消去に関する処理を切り換える構成を採用した。
すなわち、判断手段によって修正コマンドの入力回数が1回であると判断された場合、表示装置に表示している住所のうち、最下位の階層に位置する名称の表示を消去するとともに、最下層に分類して記憶されている発話内容の一部を消去する処理を行い、判断手段によって修正コマンドの入力回数が2回であると判断された場合、表示装置に表示している住所のうち、全ての階層に位置する名称の表示を消去するとともに、複数の階層に分類して記憶されている発話内容の全部を消去する処理を行うようにした。
例えば、「愛知県」、「刈谷市」、「昭和町」、「1丁目」の4つの階層を入力した後に、再度、第1の階層である都道府県から音声入力をやり直す場合、ユーザは、音声入力した住所を修正するコマンドを2回連続して発声することで、表示装置に表示している「愛知県刈谷市昭和町1丁目」なる住所の名称を全部消去するとともに、「愛知県刈谷市昭和町1丁目」なる4つの階層に分類して記憶している住所を全部消去することが可能となる。
のように、修正コマンドが2回連続して入力された場合、表示装置に表示している住所のうち、全ての階層に位置する名称の表示を消去するとともに、複数の階層に分類して記憶されている発話内容の全部が消去されるようになるため、修正コマンドを何度も繰り返し発声することなく、容易に表示装置に表示している住所の名称と発話内容を消去することが可能となる。
【0010】
請求項に記載の音声制御装置によれば、住所は、少なくとも、都道府県、市区群、町村字、丁目及び番地の5階層に分類されることを特徴とする。これにより、ユーザは、音声による住所入力を行う場合には、所望の住所の都道府県、市区群、町村字、丁目、及び番地の各階層を発話することで、所望の住所を入力することができる。
【0011】
【発明の実施の形態】
以下、本発明の実施の形態における音声制御装置に関して、図面に基づいて説明する。なお、本実施形態では、本発明の音声制御装置をカーナビゲーション装置に適用した例について説明する。
【0012】
図1は、本実施形態に係わるカーナビゲーション装置の概略構成を示すブロック図である。同図に示すように、本実施形態のカーナビゲーション装置1は、音声認識部10、経路案内部11、車両位置・車両向き計算部12から構成されている。また、カーナビゲーション装置1は、図示しない道路地図描画部等を有している。さらに、カーナビゲーション装置1は、音声入力に用いられるマイク2、トークスイッチ3、表示装置4、スピーカ5、GPS受信機6、車速センサ7、ヨーレートセンサ8、及び地図データベース9等と接続されている。
【0013】
マイク2、及びトークスイッチ3は、音声入力に用いられる装置である。音声を入力する場合には、例えば、トークスイッチ3の押しボタンを押すことで、入力トリガ信号が後述する音声認識部10に送信され、この音声認識部10は、入力トリガ信号を受信すると、マイク2から音声入力を受け付けるモードに変更される。
【0014】
この音声入力を受け付けるモードのとき、ユーザによって音声が入力されると、その音声がマイク2によって音声信号に変換され、音声認識部10に送られる。音声認識部10は、この音声信号を認識して、音声に対応する都道府県や市区郡等の名称に変換して経路案内部11に与える。例えば、「あいちけん」と認識された音声は、「愛知県」という都道府県の名称に変換される。この都道府県の名称を受ける経路案内部11は、受信した名称を記憶するとともに表示装置4に表示し、その後、市区郡、町村字、丁目、及び番地等の名称を受信する毎に、これらを階層的につなぎ合わせて記憶し、かつ表示装置4に表示させる。なお、本実施形態では、都道府県を第1階層、市区郡を第2階層、町村字を第3階層、丁目を第4階層、及び番地を第5階層と呼ぶことにする。
【0015】
また、経路案内部11は、都道府県、市区郡、町村字、丁目、及び番地等の名称からなる住所を全て受信した場合、この住所に対応する道路地図上の地点を検索し、検索した地点を示すマークを、その周辺の道路地図とともに表示装置4へ表示する。
【0016】
さらに、住所の入力中に、ユーザが、例えば「戻る」と発話した場合には、この音声を認識して、音声に対応するコマンドコードに変換し、経路案内部11等に与える。例えば、「戻る」と認識された音声は「表示消去」というコマンドコードに変換される。このコマンドコードを受けた経路案内部11は、このコマンドコードを2回連続して受けたか否かを判断し、判断の結果、1回目である場合には、階層的につなぎ合わせて記憶・表示される住所のうち、最下位の階層に位置する名称のみ消去する。また、2回連続して受けた場合には、記憶及び表示される住所の全てを一括して消去する。
【0017】
表示装置4は、道路地図等を表示する液晶ディスプレイによって構成される。また、表示装置4のディスプレイにタッチパネルが採用されるものであっても良い。
【0018】
スピーカ5は、音声案内や各種警告音等の出力に使用されるものであり、例えば、車両に装備されたスピーカであっても良いし、カーナビゲーション装置1に内蔵されたものであっても良い。
【0019】
GPS受信機6、車速センサ7、及びヨーレートセンサ8は、周知のごとく、車両の現在位置や車両進行方向等を算出するのに必要な信号(以下、センサ信号と呼ぶ)を生成するものである。生成されたセンサ信号は、車両位置・車両向き計算部12に送られる。
【0020】
地図データベース9は、図示しない記憶媒体に格納されるもので、地図情報、道路情報からなる。なお、記憶媒体としては、そのデータ量からCD−ROMやDVD−ROMを用いるのが一般的であるが、メモリカードやハードディスクなどの媒体を用いてもよい。また、地図情報とは、表示装置4に表示するランドマーク等を描画するために必要なデータであり、施設名称、住所、電話番号、及び地図上の座標等を関連付けたデータから構成される。
【0021】
次に、カーナビゲーション装置1に内蔵される音声認識部10について、図2を用いて説明する。同図に示すように音声認識部10は、AD変換回路101、認識プログラム処理部102、音響モデル記憶部103、及び認識辞書記憶部104等によって構成される。
【0022】
AD変換回路101は、マイク2を介して入力されるアナログの音声信号を受信し、この信号をデジタル化した信号に変換する。変換されたデジタル音声信号は、認識プログラム処理部102に送信される。
【0023】
認識プログラム処理部102は、音響モデル記憶部103、及び認識辞書記憶部104を用いて、デジタル音声信号を都道府県等の名称やコマンドコードに変換するものである。まず、認識プログラム処理部102は、音響モデル記憶部103に記憶される、例えば、周知の隠れマルコフモデル(Hidden Markov Model)等の手法を用いて、デジタル音声信号106に対応する発話内容(以後、認識語読みと呼ぶ)を解析する。
【0024】
この解析された認識語読みは、認識辞書記憶部104に記憶される認識語と照合され、最も確からしい認識語、及びその認識語に対応する都道府県や市区郡等の名称、或いはコマンドコードが抽出される。
【0025】
ここで、認識辞書記憶部104について説明する。この認識辞書記憶部104は、都道府県の名称と認識語とを関連付けて記憶する都道府県辞書、都道府県別に分割された市区郡の名称と認識語とを関連付けて記憶する市区郡辞書、都道府県別に分割され、かつ、特定の都道府県における市区郡別に分割された町村字の名称と認識語とを関連付けて記憶する町村字辞書、及び、丁目や番地の名称と認識語とを関連付けて記憶する丁目辞書と番地辞書といった、計5つの認識辞書を有している。
【0026】
すなわち、市区郡辞書は、50程度の都道府県別に用意されるもので、例えば、図5に示すように、都道府県が「愛知県」である市区郡辞書には、愛知県に属する市区郡の名称と認識語とが記憶されている。さらに、町村字辞書は、50程度の都道府県別で、かつ、ある特定の都道府県の市区郡別に用意されるものである。例えば、図6に示すように、愛知県刈谷市に属する町村字の名称と認識語とが記憶されている。なお、図7に示す丁目辞書、及び図8に示す番地辞書については、数字からなる名称であるため、ある特定の場所に属するものではない。
【0027】
さらに、認識辞書記憶部104には、図9に示すように、都道府県や市区郡等の名称とは異なる認識語とコマンドコードとを関連付けて記憶するコマンドコード辞書を有している。このコマンドコード辞書においては、例えば、認識語が「戻る」である場合には、これに対応するコマンドコード「C0001」が抽出される。このコマンドコードは、後述する経路案内部11の機能実行部110が認識可能なコードである。
【0028】
また、認識プログラム処理部102は、都道府県の名称を認識辞書記憶部104から抽出した後、次回に照合/抽出する認識辞書を、都道府県の名称に対応する市区郡辞書へ自動的に切り換える。例えば、都道府県名称が「愛知県」であった場合には、次回に照合/抽出する認識辞書を、愛知県に対応する市区郡辞書へ自動的に切り換える。これは、市区郡の名称を照合/抽出した後も同様であり、次回に照合/抽出する認識辞書を、市区郡の名称に対応する町村字辞書へ自動的に切り換える。但し、図9のコマンドコード辞書は、上述の認識辞書の切り換えには該当せず、常に照合/抽出の対象となる認識辞書である。
【0029】
そして、認識プログラム処理部102は、上述の処理により得られた都道府県や市区郡等の名称に対応する信号を経路案内部11に出力する。例えば、都道府県の「あいちけん」という音声が入力された場合には、都道府県名称の「愛知県」に対応する信号を送信する。
【0030】
続いて、カーナビゲーション装置1の経路案内部11について、図3を用いて説明する。同図に示すように、経路案内部11は機能実行部110を有している。この機能実行部110は、現在地周辺の道路地図を表示する機能や、住所入力による地点検索機能等を実行する。例えば、現在地周辺の道路地図を表示する機能では、車両位置・車両向き計算部12から車両位置・車両の進行方向信号を受信し、地図データベース9から車両位置周辺の地図データを読み出し、画像信号15に変換して表示装置4に表示したりする。
【0031】
一方、住所入力による地点検索機能では、音声認識部10から送信される都道府県や市区郡等の名称を表示装置4に表示したり、都道府県、市区郡、町村字、丁目、及び番地等の名称からなる住所に対応する地点のマークと、その周辺の道路地図を表示装置4に表示したりするものである。
【0032】
例えば、「愛知県」なる都道府県の名称に対応する信号を受信した場合には、この都道府県の名称を表示装置4に表示する。また、都道府県や市区郡等の名称とは異なるコマンドコードC0001を受信した場合には、階層的につなぎ合わせて記憶・表示している住所のうち、最下位の階層に位置する名称のみ消去する。さらに、このコマンドコードC0001を2回連続して受信した場合には、記憶・表示される住所の名称全てを一括して消去する。なお、このコマンドコードC0001を受信した場合に、スピーカ5を介して、表示の消去を実行する案内音やメッセージ等を報知しても良い。
【0033】
また、例えば、「愛知県刈谷市昭和町1丁目1番地」なる住所の名称を全て受信し終えた場合には、地図データベース9から受信した住所に対応する地点の座標を抽出し、さらに、抽出した座標周辺の地図情報や道路情報を読み出す。その後、読み出した情報を画像信号に変換して、表示装置4に住所に対応する地点のマークや、その周辺の道路地図を表示させる。
【0034】
次に、上述のカーナビゲーション装置1において、音声入力による住所に基づく地点検索が行われる地点検索機能の処理について、図10〜図13のフローチャート、及び図14の表示装置4の表示イメージ図を用いて説明する。なお、具体的な例として、ユーザによって、「愛知県刈谷市昭和町1丁目」という住所を入力した後、再度、都道府県名称から入力し直す場面を想定して説明を進める。
【0035】
先ず、図10のステップS1は、トークスイッチ3がユーザに押されるまで待機状態を継続し、トークスイッチ3が押された場合には、ステップS2に処理を進める。ステップS2では、音声認識部10が入力モードに切り換わり、音声の入力を受け付ける状態となる。また、音声認識部10は、これから実行する認識語の照合と、その認識語に対応する都道府県や市区郡等の名称の抽出を、都道府県辞書に基づいて行うように、認識辞書を切り換える。
【0036】
続いて、ステップS3における音声認識処理を、図11〜図13のフローチャートを用いて説明する。まず、図11に示すステップS30では、変数「Back」をゼロに初期化する。この変数「Back」は、コマンドコードC0001に対応する認識語を照合/抽出する毎に1が加算されるものであり、すなわち、この変数「Back」を参照することで、コマンドコードC0001が2回連続して抽出されたか否かを判断することができる。
【0037】
ステップS31は、ユーザによって発話されたか否かを判断し、発話があった場合には、次のステップへ処理を進め、発話がない場合には、発話があるまで待機状態となる。本実施形態では、「あいちけん」という発話があったとする。
【0038】
ステップS32では、ユーザによる発話を解析し、解析した認識語読みを都道府県辞書に記憶される認識語と照合する。そして、最も確からしい認識語と、その認識語に対応する都道府県名称を抽出する。本実施形態では、「あいちけん」という認識語に対応する「愛知県」なる県名が抽出されたとする。
【0039】
ステップS33は、ステップS32において照合/抽出した認識辞書が都道府県辞書、市区郡辞書、町村字辞書、丁目辞書、及び番地辞書のうち、どの階層の認識辞書であったかを判断する。本実施形態では、第1階層の認識辞書であったと判断される。
【0040】
さらに、ステップS33においては、次回の照合/抽出する認識辞書を、現在の認識辞書の下位の階層に位置し、かつ、現在抽出した名称に対応する認識辞書に切り換える。本実施形態では、第1階層の下位の階層である第2の階層で、かつ、「愛知県」の名称に対応する市区郡の認識辞書に切り換わる。なお、現在の認識辞書が第5階層である場合には、その下位の階層に位置する認識辞書は存在しないので、認識辞書を切り換える処理を実行しない。
【0041】
ステップS34は、ステップS33において判断した認識辞書の階層を記憶しておく。本実施形態では、第1階層の認識辞書であったため、変数「kaisou」を1に設定する。
【0042】
ステップS35では、ステップS32において抽出した名称を、表示装置4へ表示する。本実施形態では、図14に示すように、表示内容20「愛知県」が表示される。
【0043】
ステップS36は、変数「kaisou」が5であるか、或いは、「セット」や「新規セット」など発話終了を意味するコマンドが発声された否かを判断し、変数「kaisou」が5である、或いは、発話終了を意味するコマンドが発声された場合には、第1〜第5階層までの名称入力が終了したと判断して、本音声認識処理を終了する。一方、これに該当しない場合には、ステップS37へ処理を進める。本実施形態では、変数「kaisou」は1であるので、ステップS37へ処理を進める。
【0044】
ステップS37の判断は、ステップS31と同一であるので説明を省略するが、本実施形態では、「かりやし」という発話があったとする。ステップS38では、ユーザによる発話を解析し、解析した認識語読みを市区郡辞書に記憶される認識語と照合し、認識語に対応する市区郡名称を抽出する。なお、解析した認識語読みが、市区郡辞書の認識語から照合しても、最も確からしい認識語が選定できない場合には、コマンドコード辞書の認識語からの照合を試みる。そして、このコマンドコード辞書から認識語が照合された場合には、その認識語に対応するコマンドコードを抽出する。なお、本実施形態では、「かりやし」という認識語に対応する「刈谷市」なる市名が抽出されたとする。
【0045】
ステップS39は、ステップS38において、認識語「戻る」に対応するコマンドコードC0001が抽出されたか否かを判断する。ここで、コマンドコードC0001が抽出された場合には、図13のステップS50へ処理を移行し、これに該当しない場合には、図12のステップS40へ処理を進める。本実施形態では、「刈谷市」なる市名が抽出されたので、ステップS40へ処理を進める。
【0046】
図12に示すステップS40では、変数「Back」をゼロに設定する。ここで変数「Back」をゼロに設定する理由は、ユーザが2回連続して「戻る」を発話した場合と、2回連続ではないものの「戻る」を複数回発話した場合との処理を切り換えるためである。このステップS40では、ステップS39において、認識語「戻る」に対応するコマンドコードC0001が抽出されなかったため、変数「Back」にゼロが設定される。
【0047】
ステップS41は、ステップS38において照合/抽出した認識辞書が都道府県辞書、市区郡辞書、町村字辞書、丁目辞書、及び番地辞書のうち、どの階層の認識辞書であったかを判断する。本実施形態では、第2階層の認識辞書であったと判断される。
【0048】
さらに、ステップS41では、次回の照合/抽出する認識辞書を、現在の認識辞書の下位の階層に位置し、かつ、現在抽出した名称に対応する認識辞書に切り換える。本実施形態では、第2階層の下位の階層である第3の階層で、かつ、「愛知県刈谷市」の名称に対応する町村字の認識辞書に切り換わる。なお、現在の認識辞書が第5階層である場合には、その下位の階層に位置する認識辞書は存在しないので、認識辞書を切り換える処理を実行しない。
【0049】
ステップS42は、ステップS41において判断した認識辞書の階層を記憶しておく。本実施形態では、第2階層の認識辞書であったため、変数「kaisou」を2に設定して記憶する。
【0050】
ステップS43では、ステップS38において抽出した名称を記憶するとともに、表示装置4へ表示する。本実施形態では、図14に示すように、表示内容21「愛知県刈谷市」が表示される。なお、表示内容21のように、下位の階層に位置する名称は、上位の階層につなぎ合わせて表示装置4に表示される。その後、ステップS36に処理を移行する。
【0051】
ステップS36は、上述のごとく、変数「kaisou」が5であるか、或いは、「セット」や「新規セット」など発話終了を意味するコマンドが発声された否かを判断する。本実施形態では、変数「kaisou」は2であるので、ステップS37へ処理を進める。
【0052】
ステップS37において、本実施形態では、「しょうわちょう」という発話があったとして処理を進め、ステップS38では、解析した認識語読みを町村字辞書に記憶される認識語と照合し、認識語に対応する町村字名称を抽出する。本実施形態では、「しょうわちょう」という認識語に対応する「昭和町」なる町名が抽出されたとする。ステップS39は、ステップS38において、「昭和町」なる町名が抽出されたので、ステップS40へ処理を進める。
【0053】
ステップS40では、変数「Back」をゼロに再度設定し、ステップS41は、ステップS38において、第3階層の認識辞書であったと判断するとともに、次回の照合/抽出する認識辞書を、第3階層の下位の階層である第4階層の丁目辞書に切り換える。ステップS42は、本実施形態では、第3階層の認識辞書であったため、変数「kaisou」を3に設定して記憶し、ステップS43では、ステップS38において抽出した名称を記憶し、表示装置4へ表示する。本実施形態では、図14に示すように、表示内容22「愛知県刈谷市昭和町」が表示される。その後、ステップS36に処理を移行する。
【0054】
ステップS36は、上述のごとく、変数「kaisou」が5であるか、或いは、「セット」や「新規セット」など発話終了を意味するコマンドが発声された否かを判断する。本実施形態では、変数「kaisou」は3であるので、ステップS37へ処理を進める。
【0055】
ステップS37において、本実施形態では、「いちちょうめ」という発話があったとして処理を進め、ステップS38では、解析した認識語読みを丁目辞書に記憶される認識語と照合し、認識語に対応する丁目名称を抽出する。本実施形態では、「いちちょうめ」という認識語に対応する「1丁目」なる丁目名称が抽出されたとする。ステップS39は、ステップS38において、「1丁目」なる町名が抽出されたので、ステップS40へ処理を進める。
【0056】
ステップS40では、変数「Back」をゼロに設定し、ステップS41は、ステップS38において、第4階層の認識辞書であったと判断するとともに、次回の照合/抽出する認識辞書を、第4階層の下位の階層である第5階層の番地辞書に切り換える。ステップS42は、本実施形態では、第4階層の認識辞書であったため、変数「kaisou」を4に設定して記憶し、ステップS43では、ステップS38において抽出した名称を、表示装置4へ表示する。本実施形態では、図14に示すように、表示内容23「愛知県刈谷市昭和町1丁目」が表示される。その後、ステップS36に処理を移行する。
【0057】
ステップS36は、上述のごとく、変数「kaisou」が5であるか、或いは、「セット」や「新規セット」など発話終了を意味するコマンドが発声された否かを判断する。本実施形態では、変数「kaisou」は4であるので、ステップS37へ処理を進める。
【0058】
ステップS37において、本実施形態では、「戻る」という発話があったとして処理を進め、ステップS38では、解析した認識語読みを番地辞書に記憶される認識語と照合し、認識語に対応する番地名称を抽出する。しかしながら、本実施形態の認識語読み「もどる」は、番地辞書の認識語から照合しても、最も確からしい認識語が選定されない。従って、コマンドコード辞書の認識語から照合が試される。すると、本実施形態では、「もどる」という認識語に対応するコマンドコードC0001が抽出される。
【0059】
ステップS39は、ステップS38において、認識語「戻る」に対応するコマンドコードC0001が抽出されたか否かを判断する。本実施形態では、コマンドコードC0001が抽出されたので、図13のステップS50へ処理を移行する。
【0060】
図13のステップS50では、変数「Back」に1を加える。本実施形態では、直前に処理されたステップS40において、変数「Back」がゼロに設定されているので、ここでは、変数「Back」は1となる。すなわち、直前のステップS38において、コマンドコードC0001が抽出されたので、1回抽出されたことを意味するように1が加えられる。
【0061】
ステップS51は、変数「Back」が2であるか否かを判断し、変数「Back」が2である場合には、ステップS54に処理を移行し、これに該当しない場合には、ステップS52に処理を進める。本実施形態では、変数「Back」は1であるので、ステップS52に処理を進める。
【0062】
ステップS52では、変数「kaisou」から1を減じるとともに、次回の照合/抽出する認識辞書を、現在の認識辞書の1つ上位の階層である認識辞書に切り換える。本実施形態では、第4階層の1つ上位の階層である第3の階層で、かつ、第1及び第2階層である「愛知県刈谷市」に対応する町村字辞書に切り換わる。
【0063】
ステップS53において、表示装置4に表示している住所のうち、最下位の階層に位置する名称の記憶及び表示が消去される。本実施形態では、図14の表示内容24に示すように、第4の階層である「1丁目」の表示が消去される。その後、ステップS37に処理が移行する。
【0064】
ステップS37において、本実施形態では、ユーザによって、再度「戻る」という発話があったとして処理を進め、ステップS38では、解析した認識語読みを町村字辞書に記憶される認識語と照合し、認識語に対応する町村字名称を抽出する。しかしながら、本実施形態の認識語読み「もどる」は、町村字辞書の認識語から照合しても、最も確からしい認識語が選定されない。従って、コマンドコード辞書の認識語から照合が試される。すると、本実施形態では、「もどる」という認識語に対応するコマンドコードC0001が抽出される。
【0065】
ステップS39は、コマンドコードC0001が抽出されたので、ステップS50へ処理を移行し、ステップS50では、変数「Back」に1を加える。本実施形態では、直前に処理されたステップS50において、変数「Back」に1が加算されているので、ここでは、変数「Back」は2となる。すなわち、コマンドコードC0001が2回連続して抽出されたことを意味する。ステップS51は、変数「Back」が2であるので、ステップS54に処理を移行する。
【0066】
そして、ステップS54においては、表示装置4に表示している住所のうち、全ての階層に位置する名称の記憶及び表示を消去する。本実施形態では、図14の表示内容25に示すように、これまでに表示した名称を全て一括して消去する。その後、ステップS30へ処理を移行し、再び、都道府県名称の入力から実行される。
【0067】
なお、第1階層から第5階層までの名称が全て入力された場合、或いは、第5階層まで入力がされていなくても、「セット」や「新規セット」等、発話終了を意味するコマンドが発声されたときは、ステップS36から図10のステップS4へ処理を移行する。そして、ステップS4において、地図データベース9から、入力された住所に対応する地点の座標が抽出され、また、抽出した座標周辺の地図情報や道路情報が読み出される。
【0068】
その後、ステップS5において、ステップS4において読み出した情報を画像信号に変換して、表示装置4に住所に対応する地点のマークと、その周辺の道路地図を表示させる。
【0069】
このように、本発明の音声認識装置は、「戻る」を2回連続して認識した場合、階層的につなぎ合わせて表示される住所の表示を一括して消去する。これにより、入力途中において、再度、都道府県から入力をやり直す場合に、ユーザは、「戻る」を2回連続して発声することで、住所の表示を一括して消去することができる。その結果、「戻る」を何度も繰り返し発声することなく、簡単に表示を消去することが可能となる。
【0070】
なお、本実施形態では、コマンドコードC0001に対する認識語として「戻る」を設定しているが、これに限定されるものではない。さらに、コマンドコード辞書に、例えば、「消去」、「はじめに戻る」等の認識語と、これらの認識語に対してコマンドコードC0002を設け、このコマンドコードC0002が抽出されたときに、階層的につなぎ合わせて表示される住所の表示を一括して消去しても良い。
【0071】
また、本発明の適用範囲は、カーナビゲーション装置の音声による住所入力機能に限定されるものではなく、例えば、住所と同様に階層的に全体が示される電話番号等を音声入力する機能等にも適用できる。
【図面の簡単な説明】
【図1】本実施形態に係わる、カーナビゲーション装置1の概略構成を示すブロック図である。
【図2】本実施形態に係わる、音声認識部10の構成を示すブロック図である。
【図3】本実施形態に係わる、経路案内部11の構成を示すブロック図である。
【図4】本実施形態に係わる、都道府県辞書を示す図である。
【図5】本実施形態に係わる、愛知県に属する市区郡の辞書を示す図である。
【図6】本実施形態に係わる、愛知県刈谷市に属する町村字の辞書を示す図である。
【図7】本実施形態に係わる、丁目辞書を示す図である。
【図8】本実施形態に係わる、番地辞書を示す図である。
【図9】本実施形態に係わる、コマンドコード辞書を示す図である。
【図10】本実施形態に係わる、カーナビゲーション装置1の全体の処理の流れを示すフローチャートである。
【図11】本実施形態に係わる、音声認識処理の全体の流れを示すフローチャートである。
【図12】本実施形態に係わる、音声認識処理の一部の流れを示すフローチャートである。
【図13】本実施形態に係わる、音声認識処理の表示消去処理の流れを示すフローチャートである。
【図14】本実施形態に係わる、表示装置4の表示イメージを示した図である。
【図15】従来技術における、音声入力された結果を示す図である。
【符号の説明】
1 カーナビゲーション装置
2 マイク
3 トークスイッチ
4 表示装置
5 スピーカ
6 GPS受信機
7 車速センサ
8 ヨーレートセンサ
9 地図データベース
10 音声認識部
11 経路案内部
12 車両位置・車両向き計算部

Claims (2)

  1. 音声を入力するための音声入力手段と、
    前記音声入力手段に入力されたユーザの発話音声を認識する音声認識手段と、
    ユーザによって少なくとも住所である音声が入力されたとき、認識された発話内容を複数の階層に分類して記憶するとともに、該複数の階層の各々に対応する各住所の名称をつなぎ合わせて表示装置に表示し、当該発話内容を修正するための修正コマンドが入力されたとき、前記表示装置に表示している住所のうち、最下位の階層に位置する名称の表示を消去するとともに、最下層に分類して記憶されている発話内容の一部を消去する制御手段とを備え、
    前記制御手段は、
    前記修正コマンドの入力回数が1回であるか、若しくは2回であるかを判断する判断手段を備え、
    前記判断手段による修正コマンドの入力回数の判断のみに基づいて、前記表示装置に表示している住所の名称、及び発話内容の消去に関する処理を切り換えるものであり、
    前記判断手段によって修正コマンドの入力回数が1回であると判断された場合、前記表示装置に表示している住所のうち、最下位の階層に位置する名称の表示を消去するとともに、前記最下層に分類して記憶されている発話内容の一部を消去する処理を行い、
    前記判断手段によって修正コマンドの入力回数が2回であると判断された場合、前記表示装置に表示している住所のうち、全ての階層に位置する名称の表示を消去するとともに、複数の階層に分類して記憶されている発話内容の全部を消去する処理を行うことを特徴とする音声制御装置。
  2. 前記住所は、少なくとも都道府県、市区群、町村字、丁目及び番地の5階層に分類されることを特徴とする請求項1記載の音声制御装置。
JP2002218610A 2002-07-26 2002-07-26 音声制御装置 Expired - Fee Related JP4004885B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002218610A JP4004885B2 (ja) 2002-07-26 2002-07-26 音声制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002218610A JP4004885B2 (ja) 2002-07-26 2002-07-26 音声制御装置

Publications (2)

Publication Number Publication Date
JP2004061754A JP2004061754A (ja) 2004-02-26
JP4004885B2 true JP4004885B2 (ja) 2007-11-07

Family

ID=31939744

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002218610A Expired - Fee Related JP4004885B2 (ja) 2002-07-26 2002-07-26 音声制御装置

Country Status (1)

Country Link
JP (1) JP4004885B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007025075A (ja) * 2005-07-13 2007-02-01 Xanavi Informatics Corp ナビゲーション装置
JP2010139826A (ja) * 2008-12-12 2010-06-24 Toyota Motor Corp 音声認識システム
KR102229972B1 (ko) * 2013-08-01 2021-03-19 엘지전자 주식회사 음성 인식 장치 및 그 방법
JP6106708B2 (ja) * 2015-04-28 2017-04-05 四郎丸 功 音声認識装置及び音声認識システム
JP6895037B2 (ja) * 2016-11-06 2021-06-30 ナレルシステム株式会社 音声認識方法、コンピュータプログラム及び装置

Also Published As

Publication number Publication date
JP2004061754A (ja) 2004-02-26

Similar Documents

Publication Publication Date Title
JP5334178B2 (ja) 音声認識装置およびデータ更新方法
US8751145B2 (en) Method for voice recognition
US20080177541A1 (en) Voice recognition device, voice recognition method, and voice recognition program
JP2007011380A (ja) 自動車インターフェース
US9123327B2 (en) Voice recognition apparatus for recognizing a command portion and a data portion of a voice input
JP2000510944A (ja) データ記憶のためにオーディオcdプレイヤーを利用するナビゲーションシステム
JP2002073075A (ja) 音声認識装置ならびにその方法
JP3702867B2 (ja) 音声制御装置
US7809563B2 (en) Speech recognition based on initial sound extraction for navigation and name search
US7295923B2 (en) Navigation device and address input method thereof
JP4004885B2 (ja) 音声制御装置
JP3726783B2 (ja) 音声認識装置
JP3645104B2 (ja) 辞書検索装置及び辞書検索プログラムを記録した記録媒体
JP2007240688A (ja) 音声認識装置及びそれを用いたナビゲーション装置、音声認証装置、方法及びプログラム
JP2001027540A (ja) 音声認識機能を用いたナビゲーション方法
JP5455355B2 (ja) 音声認識装置及びプログラム
JP3700533B2 (ja) 音声認識装置及び処理システム
JPH0926799A (ja) 音声認識装置
JP3296783B2 (ja) 車載用ナビゲーション装置および音声認識方法
JPH10312193A (ja) 音声入力装置
JP2006039954A (ja) データベース検索装置、プログラム及びナビゲーション装置
JP2005114964A (ja) 音声認識方法および音声認識処理装置
JPH11325946A (ja) 車載用ナビゲーション装置
JP4550207B2 (ja) 音声認識装置および音声認識ナビゲーション装置
JP4645708B2 (ja) コード認識装置および経路探索装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050802

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050929

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051214

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060131

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20060224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070822

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100831

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100831

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110831

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120831

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130831

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees