JP3654262B2 - 音声認識装置及びナビゲーションシステム - Google Patents

音声認識装置及びナビゲーションシステム Download PDF

Info

Publication number
JP3654262B2
JP3654262B2 JP2002134248A JP2002134248A JP3654262B2 JP 3654262 B2 JP3654262 B2 JP 3654262B2 JP 2002134248 A JP2002134248 A JP 2002134248A JP 2002134248 A JP2002134248 A JP 2002134248A JP 3654262 B2 JP3654262 B2 JP 3654262B2
Authority
JP
Japan
Prior art keywords
recognition
voice
input
speech
target pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002134248A
Other languages
English (en)
Other versions
JP2002372986A (ja
Inventor
教英 北岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP2002134248A priority Critical patent/JP3654262B2/ja
Publication of JP2002372986A publication Critical patent/JP2002372986A/ja
Application granted granted Critical
Publication of JP3654262B2 publication Critical patent/JP3654262B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Instructional Devices (AREA)
  • Navigation (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、例えばナビゲーションシステムにおける目的地の設定などを音声によって入力できるようにする場合などに有効な音声認識装置及びその音声認識装置を備えたナビゲーションシステムに関する。
【0002】
【従来の技術及び発明が解決しようとする課題】
従来より、入力された音声を予め記憶されている複数の比較対象パターン候補と比較し、一致度合の高いものを認識結果とする音声認識装置が既に実用化されており、例えばナビゲーションシステムにおいて設定すべき目的地を利用者が地名を音声で入力するためなどに用いられている。特に車載ナビゲーションシステムを運転手自身が利用する場合、音声入力であればボタン操作や画面注視が伴わないため、車両の走行中に行っても安全性が高いため有効である。
【0003】
このような機能を満たすためには、十分詳細な地点の指定が容易にできなくてはならない。具体的には、県や市のレベルではなく、市の下の町名のレベルや、町村における大字といったレベルまで入力できる必要がある。さらに、利用者が例えば「愛知県刈谷市昭和町」と設定したい場合に、「愛知県」「刈谷市」「昭和町」というように県市町というレベル毎に区切って発音しなくてはならないとすると利用者にとって煩わしいので、ひと続きで入力(一括入力)できるようにすることが好ましい。
【0004】
但し、このように一括入力に対応する構成とした場合には、逆に利用者にとって使い勝手が悪くなる状況も想定される。それは、設定すべき目的地を利用者が再度入力しなくてはならない場合である。つまり、現在の認識技術ではその認識結果が完全に正確なものとは言い切れないため、一度の音声入力で必ずしも正確に認識されるとは限らないからである。例えば利用者が「愛知県刈谷市昭和(しょうわ)町」と音声で入力した場合に、例えば「愛知県刈谷市松栄(しょうえい)町」と誤って認識してしまうことが考えられる。そして、このような誤認識の場合には、再度「愛知県刈谷市昭和町」と音声入力する必要がある。
【0005】
しかしながら、日常生活における会話などを考えると、このような誤認識の場合には、「愛知県刈谷市昭和町」と音声入力するのではなく、誤認識された町名だけを修正することが自然である。つまり、2回目は「昭和町」だけを音声入力できるようにすることが好ましいと考えられる。
【0006】
また、このような誤認識に起因するのではないが、例えば車載ナビゲーションシステムを搭載した車両が例えば愛知県内を走行しており、同じ愛知県内である「愛知県刈谷市昭和町」を目的地として設定する場合には、「愛知県刈谷市昭和町」と音声入力するのではなく、「愛知県」を省略して「刈谷市昭和町」と音声入力する方が自然である。
【0007】
なお、このような問題は、上述した県市町…からなる地名には限らず、同じように複数の語を階層的につなぎ合わせたものとして設定されるものであれば同様に適用できる。本発明は、このような問題を解決し、音声認識装置への音声入力の対象が階層的構造の場合に、上位階層を省略した方が自然な場合であっても上位階層から音声入力しなくてはならないという利用者の負担を軽減し、使い勝手をより向上させることを目的とする。
【0008】
【課題を解決するための手段及び発明の効果】
上記目的を達成するためになされた請求項1に記載の音声認識装置は、音声を入力するための音声入力手段と、該音声入力手段を介して入力された音声を、予め辞書手段に記憶されている複数の比較対象パターン候補と比較して一致度合の高いものを認識結果とする認識手段と、該認識手段による認識結果を報知する報知手段と、該報知手段によって認識結果が報知された後に所定の確定指示がなされた場合には、当該認識結果を確定したものとして所定の確定後処理を実行する確定後処理手段とを備える音声認識装置であって、前記辞書手段に記憶されている前記複数の比較対象パターン候補の内の少なくとも一つは、複数の語を階層的につなぎ合わせたものとして設定されており、前記複数の語を階層的につなぎ合わせた比較対象パターン候補の上位階層を構成する語又は語群が、認識処理時の省略対象として設定されている場合には、前記認識手段が、その設定されている前記上位階層構成語又は語群を省略した比較対象パターン候補も一時的に前記比較対象パターン候補と見なした上で、前記予め辞書手段に記憶されている複数の比較対象パターン候補と共に入力音声に対する比較を実行するよう構成されており、前記認識処理時の省略対象として設定されている上位階層を構成する語又は語群は、本音声認識装置による音声認識結果が利用されるシステム中の当該音声認識装置以外の装置から入力したものであることを特徴とする。
【0009】
請求項1に記載の音声認識装置によれば、利用者が音声入力手段を介して音声を入力すると、認識手段が、その入力された音声を予め辞書手段に記憶されている複数の比較対象パターン候補と比較して一致度合の高いものを認識結果とし、報知手段によって認識結果を報知する。そして、認識結果が報知された後に所定の確定指示がなされた場合には、確定後処理手段が、その認識結果を確定したものとして所定の確定後処理を実行する。ここで、辞書手段に記憶されている複数の比較対象パターン候補の内の少なくとも一つは、複数の語を階層的につなぎ合わせたものとして設定されている。そしてさらに、複数の語を階層的につなぎ合わせた比較対象パターン候補の上位階層を構成する語又は語群が、認識処理時の省略対象として設定されている場合には、認識手段が、その設定されている上位階層構成語又は語群を省略したものも一時的に比較対象パターン候補と見なした上で、入力音声に対する比較を実行する。
【0010】
したがって、予め辞書手段に設定されている比較対象パターン候補以外であっても、認識処理時の省略対象として設定されている比較対象パターン候補の上位階層構成語又は語群を省略したものも一時的に比較対象パターン候補と見なされて入力音声に対する比較を実行されるため、そのような上位階層構成語又は語群を省略した音声入力も許容されることとなる。
【0011】
また、認識処理時の省略対象として設定される上位階層を構成する語又は語群は、本音声認識装置による音声認識結果が利用されるシステム中の当該音声認識装置以外の装置から入力したものとされる。より、具体的には、例えば音声認識装置がカーナビゲーションシステムにおいて目的地等を音声で入力するために用いられたとすると、そのシステム中のナビゲーション装置本体からの現在地情報等が考えられる。つまり、ナビゲーションシステムを搭載した車両が例えば愛知県内を走行しており、同じ愛知県内である「愛知県刈谷市昭和町」を目的地として設定する場合には、「愛知県刈谷市昭和町」と音声入力するのではなく、「愛知県」を省略して「刈谷市昭和町」と音声入力する方がやはり自然である。つまり、あえて愛知県から特定しないでも、その下位階層である市レベルからの指定で十分であると利用者が考えている状況である。
【0012】
このような場合でも、本発明の音声認識装置であれば対応できる。つまり、上述の例であれば、車両が現在愛知県内を走行しているのであれば、愛知県という上位階層を認識処理時の省略対象として設定すればよいのである。このように、自分達が現在存在している所定のエリア内については、そのエリアを特定する上位階層の地名をあえて特定せず、その下位の階層から特定するという日常会話の習慣においてごく自然な振舞いに対応できることによって、上位階層を省略した方が自然な場合であっても上位階層から音声入力しなくてはならないという利用者の負担を軽減し、使い勝手をより向上させることができるのである。
【0013】
ところで、上述した音声認識装置においては、認識手段が、その設定されている上位階層構成語又は語群を省略したものも一時的に比較対象パターン候補と見なした上で、入力音声に対する比較を実行するのであるが、これを実行する上での構成例を2つ示しておく。
【0014】
まず1つ目は、請求項2に示すように、認識処理時の省略対象として設定されている上位階層構成語又は語群を参照データとして一時的に記憶しておく参照データ記憶手段を備えており、認識手段が、認識処理実行の際、辞書手段に記憶されている複数の比較対象パターン候補から参照データ記憶手段に記憶された参照データの上位階層を構成する語を省略したものも一時的に比較対象パターン候補と見なした上で、今回の入力音声に対する比較を実行する構成である。
【0015】
2つ目は、請求項3に示すように、前回の認識結果が複数の語を階層的につなぎ合わせたものである場合には、その認識結果を参照データとして一時的に記憶しておく参照データ記憶手段と、参照データ記憶手段に記憶された参照データに基づき、辞書手段に記憶されている該当する比較対象パターン候補から参照データの上位階層を構成する語を省略した第2の比較対象パターン候補を新設する辞書制御手段とを備えており、辞書制御手段によって第2の比較対象パターン候補が新設された状態の辞書手段に記憶されている比較対象パターン候補を用いて、認識手段が今回の入力音声に対する比較を実行する構成である。
【0016】
また、認識結果の報知後に所定の確定指示がなされた場合には、その認識結果を確定したものとして所定の確定後処理へ移行すると説明したが、この「所定の確定後処理」とは、例えばカーナビゲーションシステムに用いられた場合には、認識結果としての目的地を設定する処理自体あるいは目的地設定処理を実行する装置側へその目的地を設定するよう指示する処理などが考えられる。また、認識結果の報知後の「所定の確定指示」に関しては、やはり音声で入力(例えば「はい」と発声することで入力)したり、確定ボタンのようなスイッチ類の操作によって指示したりすることが考えられる。
【0017】
また、比較対象パターンを除外して認識結果を決定する場合の条件として、認識結果を報知した後の所定期間内に再度音声入力がなされることを挙げているが、この「所定期間内」としては、認識結果の報知後に前記所定の確定指示がなされるまでとすることが考えられる。つまり、確定指示がなされて所定の確定後処理へ移行するということは正しい認識結果であったことを意味するため、次回の音声入力についての最初の認識処理については、前回の処理で省略対象として設定していたものをそのまま継続はしないようにする。特に、前回の認識結果からその上位階層を構成する語又は語群を省略対象として設定する場合には、装置側の誤認識に基づくものであり、それを次回の音声入力についての認識処理についてまで持ち越すことは基本的には不適切であるからである。但し、現在地に基づいて県名などを省略するような場合には、結果的に省略対象が同じになることは考えられる。
【0018】
さらに、前記認識結果の報知に関しては、請求項4に示すように、所定の音声発生装置から認識結果の内容を音声にて出力することにより行うことが考えられる。カーナビゲーションシステムなどの車載機器用として用いる場合には、音声で出力されれば、ドライバーは視点を表示装置にずらしたりする必要がないので、安全運転のより一層の確保の点では有利であると言える。但し、音声出力に限定されるものではなく、画面上に文字または記号を表示できる表示装置に、認識結果の内容を、文字または記号による画像にて表示することにより行ったり、音声及び画像の両方にて報知するようにしてもよいし、それら以外の報知の手法を採用してもよい。車載機器として適用する場合に音声出力が有利であることを述べたが、もちろん車両が走行中でない状況もあるので、音声及び画像の両方で報知すれば、ドライバーは表示による確認と音声による確認との両方が可能となる。
【0019】
また、請求項1〜4のいずれかに記載の音声認識装置をナビゲーションシステム用として用いる場合には、請求項5に示すように構成することが考えられる。すなわち、請求項1〜のいずれかに記載の音声認識装置と、ナビゲーション装置とを備え、音声認識装置の音声入力手段は、少なくともナビゲーション装置がナビゲート処理をする上で指定される必要のある所定のナビゲート処理関連データの指示を利用者が音声にて入力するために用いられるものであり、確定後処理手段は、認識手段による認識結果をナビゲーション装置に出力するよう構成されているのである。この場合の「所定のナビゲート処理関連データ」としては、目的地が代表的なものとして挙げられるが、それ以外にもルート探索に関する条件選択など、ナビゲート処理をする上で指定の必要のある指示が含まれる。そしてこの場合は、認識結果としてのナビゲート処理関連情報を報知することとなるが、上述したように、一度音声入力した地名の一部が誤認識されていた場合に、その誤っている下位階層だけを再入力すればよくなるなど、利用者の使い勝手が向上する。
【0020】
なお、特に現在走行している場所の県名などを省略しての入力をできるようにする点では請求項6に記載の構成が好ましい。つまり、請求項1〜5のいずれかに記載の音声認識装置と、ナビゲーション装置とを備え、音声認識装置の音声入力手段は、少なくともナビゲーション装置がナビゲート処理をする上で指定される必要のある所定の地名関連データの指示を利用者が音声にて入力するために用いられるものであり、確定後処理手段は、認識手段による認識結果を前記ナビゲーション装置に出力するナビゲーションシステムであって、ナビゲーション装置は、現在地を検出する現在地検出手段と、該現在地検出手段によって検出した現在地が、複数の語を階層的につなぎ合わせた前記比較対象パターン候補として表せる場合には、その上位階層を構成する語又は語群を、認識処理時の省略対象として前記音声認識装置に出力する省略対象データ出力手段とを備えることを特徴とする。
【0021】
この場合には、ナビゲーション装置が、その基本機能を発揮する上で現在地を検出する機能を備えるため、その検出した現在地から例えば現在走行している場所の県名を省略対象として設定することができる。なお、音声認識装置の適用先としては、上述したナビゲーションシステムには限定されない。例えば音声認識装置を空調システム用として用いる場合には、設定温度の調整、空調モード(冷房・暖房・ドライ)の選択、あるいは風向モードの選択を音声入力によって行うようにすることが考えられる。
【0022】
例えば設定温度について言えば、「設定温度を25度にする」や「設定温度を5度下げる」というように、設定温度に関する指示であるが、その指示内容について複数存在する場合である。本発明を適用すれば、「設定温度を25度にする」と入力したのに「設定温度を22度にする」と誤認識した場合には、再度の音声入力では「25度にする」だけ入力すればよくなり、やはり利用者の使い勝手が向上する。空調モードや風向モードなどについても同様である。
【0023】
つまり、「複数の語を階層的につなぎ合わせたものとして設定されている比較対象パターン候補」としては、上述したナビゲーションシステムにおける地名のような県市町…という階層関係だけでなく、上述した空調システムにおいて調整対象(例えば設定温度)を上位階層とし、それに対する調整内容(例えば25度にする)を下位階層とするといったこともできる。
【0024】
なお、上述のナビゲーションシステム及び空調システムは、車載機器として用いられる場合だけではなく、例えば携帯型ナビゲーション装置や屋内用空調装置などでもよい。但し、これまで説明したように車載機器用として用いる場合には利用者がドライバーであることが考えられ、その場合には運転自体が最重要であり、それ以外の車載機器については、なるべく運転に支障がないことが好ましい。したがって、車載機器としてのナビゲーションシステムや空調システムを前提とした音声認識装置の場合には、より一層の利点がある。もちろん、このような視点で考えるならば、ナビゲーションシステムや空調システム以外の車載機器に対しても同様に利用することができる。例えば、カーオーディオ機器などは有効である。また、いわゆるパワーウインドウの開閉やミラー角度の調整などを音声によって指示するような構成を考えれば、そのような状況でも有効である。
【0025】
【発明の実施の形態】
図1は本発明の実施形態の音声認識装置30を適用したカーナビゲーションシステム2の概略構成を示すブロック図である。本カーナビゲーションシステム2は、位置検出器4、地図データ入力器6、操作スイッチ群8、これらに接続された制御回路10、制御回路10に接続された外部メモリ12、表示装置14及びリモコンセンサ15及び音声認識装置30を備えている。なお制御回路10は通常のコンピュータとして構成されており、内部には、周知のCPU、ROM、RAM、I/O及びこれらの構成を接続するバスラインが備えられている。
【0026】
前記位置検出器4は、いずれも周知の地磁気センサ16、ジャイロスコープ18、距離センサ20、及び衛星からの電波に基づいて車両の位置を検出するGPS(Global Positioning System )のためのGPS受信機22を有している。これらのセンサ等16,18,20,22は各々が性質の異なる誤差を持っているため、複数のセンサにより、各々補間しながら使用するように構成されている。なお、精度によっては上述した内の一部で構成してもよく、更に、ステアリングの回転センサ、各転動輪の車輪センサ等を用いてもよい。
【0027】
地図データ入力器6は、位置検出の精度向上のためのいわゆるマップマッチング用データ、地図データ及び目印データを含む各種データを入力するための装置である。媒体としては、そのデータ量からCD−ROMを用いるのが一般的であるが、メモリカード等の他の媒体を用いても良い。
【0028】
表示装置14はカラー表示装置であり、表示装置14の画面には、位置検出器4から入力された車両現在位置マークと、地図データ入力器6より入力された地図データと、更に地図上に表示する誘導経路や後述する設定地点の目印等の付加データとを重ねて表示することができる。
【0029】
また、本カーナビゲーションシステム2は、リモートコントロール端末(以下、リモコンと称する。)15aを介してリモコンセンサ15から、あるいは操作スイッチ群8により目的地の位置を入力すると、現在位置からその目的地までの最適な経路を自動的に選択して誘導経路を形成し表示する、いわゆる経路案内機能も備えている。このような自動的に最適な経路を設定する手法は、ダイクストラ法等の手法が知られている。操作スイッチ群8は、例えば、表示装置14と一体になったタッチスイッチもしくはメカニカルなスイッチ等が用いられ、各種入力に使用される。
【0030】
そして、音声認識装置30は、上記操作スイッチ群8あるいはリモコン15aが手動操作により目的地などを指示するために用いられるのに対して、利用者が音声で入力することによっても同様に目的地などを指示することができるようにするための装置である。
【0031】
この音声認識装置30は、「認識手段」としての音声認識部31と、対話制御部32と、音声合成部33と、音声入力部34と、「音声入力手段」としてのマイク35と、PTT(Push−To−Talk)スイッチ36と、スピーカ37とを備えている。
【0032】
音声認識部31は、音声入力部34から入力された音声データを、対話制御部32からの指示により入力音声の認識処理を行い、その認識結果を対話制御部32に返す。すなわち、音声入力部34から取得した音声データに対し、記憶している辞書データを用いて照合を行ない、複数の比較対象パターン候補と比較して一致度の高い上位比較対象パターンを対話制御部32へ出力する。入力音声中の単語系列の認識は、音声入力部34から入力された音声データを順次音響分析して音響的特徴量(例えばケプストラム)を抽出し、この音響分析によって得られた音響的特徴量時系列データを得る。そして、周知のDPマッチング法によって、この時系列データをいくつかの区間に分け、各区間が辞書データとして格納されたどの単語に対応しているかを求める。
【0033】
対話制御部32は、その認識結果及び自身が管理する内部状態から、音声合成部33への応答音声の発声指示や、システム自体の処理を実行する制御回路10に対して例えばナビゲート処理のために必要な目的地を通知して設定処理を実行させるよう指示する処理を実行する。このような処理が確定後処理であり、結果として、この音声認識装置30を利用すれば、上記操作スイッチ群8あるいはリモコン15aを手動しなくても、音声入力によりナビゲーション装置に対する目的地の指示などが可能となるのである。
【0034】
また音声入力部34は、マイク35にて取り込んだ周囲の音声をデジタルデータに変換して音声認識部31に出力するものである。本実施形態においては、利用者がPTTスイッチ36を押しながらマイク35を介して音声を入力するという使用方法である。具体的には、音声入力部34はPTTスイッチ36が押されたかどうかを判断しており、PTTスイッチ36が押されている場合にはマイク35を介しての音声入力処理を実行するが、押されていない場合にはその音声入力処理を実行しないようにしている。したがって、PTTスイッチ36が押されている間にマイク35を介して入力された音声データのみが音声認識部31へ出力されることとなる。
【0035】
ここで、音声認識部31と対話制御部32についてさらに説明する。図2は、この音声認識部31と対話制御部32の構成をさらに詳しく示したものであり、(A),(B)の2つの構成例を説明する。まず、図2(A)に示す構成では、音声認識部31が照合部31aと辞書部31bとで構成されており、対話制御部32が記憶部32a、入力部32b及び後処理部32cで構成されている。音声認識部31においては、照合部31aが、音声入力部34から取得した音声データに対し、辞書部31b内に記憶されている辞書データを用いて照合を行なうのであるが、詳しくは、まずは対話制御部32の記憶部32aに参照すべきデータがあれば、それを参照して省略可能な上位階層リストを作成する。そして、その省略可能な上位階層部分を辞書部31b内に記憶されている辞書データから省略したものも一時的に比較対象パターン候補と見なした上で照合を行なうのである。この照合の詳細については後述する。
【0036】
そして、照合部31aにて複数の比較対象パターン候補と比較されて一致度が高いとされた上位比較対象パターンは、対話制御部32の記憶部32aへ出力すされることとなる。ところで、本実施形態の辞書部31bに記憶されている辞書データは、比較対象パターン候補となる語彙そのもののデータだけでなく、その比較対象パターンとなる語彙が複数の語を階層的につなぎ合わせたものである場合には、その階層構造を示すデータも記憶されている。具体的には、語彙を構成する音節データが図3に示すように木(tree)構造の各辺(図3において矢印()で示す)に割り付けられている。なお、図3において、一重丸()は頂点を表し、二重丸()は受理頂点、すなわち単語に対する頂点を表す。そして、図3中の矢印Aで示す頂点が「根」となり、そこから先行順走査(preorder traversal)にしたがって各辺に割り付けられ音節を辿ることで単語が完成する。ここで「先行順走査」とは、根を訪問し、次に子を根とする部分木を順番に走査(この走査も先行順走査である。)していくことを指す。なお、ここで、「親」とは直前の頂点、「子」とは次の頂点、「兄弟」とは同じ親を持つ頂点同士をそれぞれ意味する。
【0037】
つまり、図3に示す具体例では、「根」となる頂点(矢印Aで示す)から順に辿ると「あいちけん」となって矢印Bで示す受理頂点となる。したがって、「あいちけん(愛知県)」で一つの認識対象単語となる。そして、さらにその矢印Bで示す受理頂点を経由して「かりやし」となって矢印Cで示す受理頂点となる。したがって、あいちけんかりやし(愛知県刈谷市)」でも一つの認識対象単語となる。さらにその矢印Cで示す受理頂点を経由して「子」の頂点がある。図3には図示しないが例えば「しょうわちょう」と辿ることができて受理頂点があるため、「あいちけんかりやししょうわちょう(愛知県刈谷市昭和町)」でも一つの認識対象単語である。
【0038】
この場合には、例えば「あいちけんかりやししょうわちょう(愛知県刈谷市昭和町)」という一つの認識対象単語は、「あいちけん(愛知県)」と「かりやし(刈谷市)」と「しょうわちょう(昭和町)」という3つの語が階層的につなぎ合わせたものである。したがって、このように3階層となっているということが図3に矢印B,Cで示す受理頂点の存在によって判る。つまり、受理頂点はそこまで辿ってきた音節データで単語が構成されることを示すが、逆にその受理頂点から下流側にさらに音節データがある場合には、その受理頂点よりも上流側が上位階層となり、下流側が下位階層となる。例えば、図3に矢印Bで示す受理頂点を考えると、上流側の「あいちけん(愛知県)」が上位階層であり、下流側の「かりやし(刈谷市)……」が下位階層である。つまり、この場合には県を示す語が上位階層で、市レベル以下を示す語が下位階層となる。また、図3に矢印Cで示す受理頂点を考えると、上流側の「あいちけんかりやし(愛知県刈谷市)」が上位階層であり、図3には示していないが下流側の例えば「しょうわちょう(昭和町)」が下位階層となる。
【0039】
以上は辞書部31bに記憶されている辞書データの説明として、愛知県刈谷市昭和町という具体例で説明したが、基本的には都道府県を最上位階層とし、市レベルを2番目の階層、町レベルを3番目の階層として他の地名についてもデータが設定されている。なお、「基本的に」といったのは、県の次の市レベルで「町」や「村」が来る地名もあるからである。
【0040】
辞書部31bの説明はこれで終わることとする。上述したように、音声認識部31においては、照合部31aが、音声入力部34から取得した音声データに対し、辞書部31b内に記憶されている複数の比較対象パターン候補と比較して一致度の高い上位比較対象パターンを対話制御部32の記憶部32aへ出力する。そして記憶部32aでは、この上位比較対象パターンを記憶しておく。また、入力部32bは制御回路10からの外部状況を入力するのであるが、その入力した外部状況も記憶部32aに記憶される。この場合の外部状況とは、上述した位置検出器4によって検出した位置に基づく現在地のデータである。なお、この記憶部32aに記憶された上位比較対象パターンや入力した外部状況である現在地データなどは、所定の確定指示がなされた場合にはクリアされる。
【0041】
そして、後処理部32cでは、例えば上記所定の確定指示がなされた場合に制御回路10へデータを送って所定の処理をするように指示する「確定後処理」を実行したり、あるいは音声合成部33へ音声データを送って発音させるように指示する処理を実行する。なお、この場合の制御回路10へ送るデータとしては、最終的な認識結果としての上位比較対象パターンの全てでもよいし、あるいはその内の最上位のものだけでもよい。
【0042】
一方、図2(B)に示す構成では、音声認識部31が照合部131aと辞書部131bとで構成されており、対話制御部32が記憶部132a、入力部132b、後処理部132c及び辞書制御部132dで構成されている。上記図2(A)に示す構成では、対話制御部32の記憶部32aに参照すべきデータがあれば、音声認識部31の照合部31aが対話制御部32の記憶部32aに記憶されている参照データを参照して省略可能な上位階層リストを作成し、それに基づいて照合処理を行なうようにしていたが、図2(B)の構成では、照合部31aにおける照合処理に先だって、対話制御部32の辞書制御部132dが辞書31bに記憶されている辞書データの制御を行なう。具体的には、記憶部132aに記憶されている参照データを参照して省略可能な上位階層リストを作成し、その省略可能な上位階層部分を辞書部31b内に記憶されている辞書データから一時的に省略する。このように辞書制御がなされた辞書データを用いて照合部31aが照合処理を実行するのである。
【0043】
なお、後処理部132cの動作は、上記図2(A)の場合と同様なので、ここでは説明を省略する。次に、本実施形態1のカーナビゲーションシステム2の動作について説明する。なお、音声認識装置30に関係する部分が特徴であるので、カナビゲーションシステムとしての一般的な動作を簡単に説明した後、音声認識装置30に関係する部分の動作について詳しく説明することとする。
【0044】
カーナビゲーションシステム2の電源オン後に、表示装置14上に表示されるメニューから、ドライバーがリモコン15a(操作スイッチ群8でも同様に操作できる。以後の説明においても同じ)により、案内経路を表示装置14に表示させるために経路情報表示処理を選択した場合、あるいは、音声認識装置30を介して希望するメニューをマイク35を介して音声入力することで、対話制御部32から制御回路10へ、リモコン15aを介して選択されるのを同様の指示がなされた場合、次のような処理を実施する。
【0045】
すなわち、ドライバーが表示装置14上の地図に基づいて、音声あるいはリモコンなどの操作によって目的地を入力すると、GPS受信機22から得られる衛星のデータに基づき車両の現在地が求められ、目的地と現在地との間に、ダイクストラ法によりコスト計算して、現在地から目的地までの最も短距離の経路を誘導経路として求める処理が行われる。そして、表示装置14上の道路地図に重ねて誘導経路を表示して、ドライバーに適切なルートを案内する。このような誘導経路を求める計算処理や案内処理は一般的に良く知られた処理であるので説明は省略する。
【0046】
次に、音声認識装置30における動作について、上述の経路案内のための目的地を音声入力する場合を例にとって説明する。図4は、その場合の音声認識部31及び対話制御部32における処理を示すフローチャートである。なお、本フローチャートは、音声認識部31及び対話制御部32が図2(A)に示す構成を備えていることを前提とした処理を示している。
【0047】
まず、最初のステップS10においては音声入力があるかどうかを判断する。上述したように、PTTスイッチ36が押されている間にマイク35を介して入力された音声データのみが音声入力部34から音声認識部31へ出力されるので、この音声入力部34からの音声入力があるかどうかを判断する。音声入力があれば(S10:YES)、対話制御部32内の記憶部32a(図2(A)参照)を参照し(S20)、参照データがあるかどうかを判断する(S30)。この参照データはS80の処理において記憶されたものである。S80の処理は後で説明する。記憶部32a内に参照データがあれば(S30:YES)、その参照データに基づいて次の2つの処理を実行する(S40)。すなわち、( )省略可能な上位階層リストの作成と( )照合開始頂点の決定である。ここでは、図3に示した辞書データの具体例である「あいちけんかりやししょうえいちょう(愛知県刈谷市松栄町)」が参照データとして記憶されていた場合について説明する。この参照データについては、上述した受理頂点B,C(図3参照)を考慮すると、「あいちけん(愛知県)」という上位階層と、「あいちけんかりやし(愛知県刈谷市)」という上位階層の2つが考えられる。したがって、このS40では、上記( )の省略可能な上位階層リストとしては、「あいちけん」及び「あいちけんかりやし」を作成することとなる。そして、( )の照合開始頂点の決定は次のように行なう。つまり、図3に示す辞書データであれば、上述したように、図3中の矢印Aで示す頂点が「根」となり、そこから先行順走査(preorder traversal)にしたがって各辺に割り付けられ音節を辿ることで単語が完成する。したがって、この状態では照合開始頂点は矢印Aで示す頂点だけであるが、上記( )によって2つの省略可能な上位階層リストが作成されたので、これに応じた照合開始頂点を追加決定する。つまり、上位階層リスト「あいちけん」の受理頂点である矢印Bで示す受理頂点と、上位階層リスト「あいちけんかりやし」の受理頂点である矢印Cで示す受理頂点を新たな照合開始頂点として決定するのである。
【0048】
S40の処理後は、S50へ移行して音声認識処理を実行する。なお、S30で否定判断、すなわち参照データがない場合にはS40の処理を実行することなくS50へ移行する。ここで、S50での音声認識処理について説明する。基本的には、取得した音声データに対して辞書部31b内に記憶されている辞書データを用いて照合を行なうのであるが、その際、S40で照合開始頂点が追加決定されているので、その追加決定された照合開始頂点から始まる単語も一時的に辞書データ中の単語であるとして照合を行なう。そして、その追加決定された照合開始頂点から始まる単語との照合結果により上位比較対象パターンが定まった場合には、記憶部32aに記憶されている上位階層リストの内の対応するものをその上位比較対象パターンに付加した上で、最終的な認識結果としての上位比較対象パターンを決定する。これにより認識結果が決定される。例えば、図3中の矢印Cで示す受理頂点が照合開始頂点となり、この照合開始頂点から始まる単語である「しょうわちょう(昭和町)」が上位比較対象パターンとして定まった場合には、対応する上位階層リストが「あいちけんかりやし」であるため、最終的な認識結果としては「あいちけんかりやししょうわちょう(愛知県刈谷市昭和町)」となる。
【0049】
図4のフローチャートの説明に戻り、続くS60では、S50での音声認識処理による認識結果が、「はい」という音声入力であるかどうかを判断する。そして、「はい」という音声入力でなければ(S60:NO)、続くS70にて認識結果が所定カテゴリに属するものであるかどうかを判断する。ここでは経路案内のための目的地を設定する処理を前提としているので、この所定カテゴリとは地名に関するカテゴリである。
【0050】
この所定カテゴリであれば(S70:YES)、S80へ移行して、その認識結果を参照データとしてとして記憶部32a(図2(A)参照)に記憶させる。そして、続くS90にて、音声応答処理を実行する。これは、音声合成部33及びスピーカ37を介して認識結果を音声として出力する処理である。
【0051】
一方、所定カテゴリでなければ(S70:NO)、S100へ移行してその他の処理を実行する。S90あるいはS100の処理の後はS10へ戻って、処理を繰り返す。また、S60で肯定判断、すなわち認識結果が「はい」という音声入力であった場合には、S110へ移行して認識結果を確定する。そして続くS120にて、所定の確定後処理を実行する。この場合の確定後処理とは、認識結果としての「経路案内のための目的地」に関するデータを、制御回路10へ(図1参照)へ出力する処理などである。
【0052】
このような確定後処理が終了した後は、S130へ移行して、S80の処理で記憶部32aに記憶されていた参照データを削除する。その後、S10へ戻る。以上が、経路案内のための目的地を音声入力する場合を例にとった場合の動作説明であるが、本発明の音声認識に係る特徴及び効果をより明確に理解するために、S50の処理説明でも触れたが、目的地として「愛知県刈谷市昭和(しょうわ)町」を指定するという具体例で説明を続ける。
【0053】
利用者がマイク35を介して「愛知県刈谷市昭和町」と音声入力したとする。音声認識の精度が100%でない場合には誤認識してしまう可能性がある。例えば「愛知県刈谷市松栄(しょうえい)町」と誤って認識してしまった場合には、音声認識装置30はその音声をスピーカ37を介して出力する。
【0054】
これにより利用者は誤って認識されていることが判るので、再度「愛知県刈谷市昭和町」であることを音声認識装置30側に音声入力しなくてはならない。但し、利用者が再度音声入力する際には「愛知県刈谷市昭和町」と音声入力するのではなく、「昭和町」だけを音声入力するだけでよくなる。つまり、最初の音声入力である「愛知県刈谷市昭和町」は、「愛知県」と「刈谷市」と「昭和町」というそれぞれ地名としての異なるレベルを示す複数の語を階層的につなぎ合わせたものであるため、その上位階層を構成する語又は語群である「愛知県」あるいは「愛知県刈谷市」が認識処理時の省略対象(図4のS40で説明した省略可能な上位階層リストに該当する)として設定されることとなる。そのため、2回目には「昭和町」とだけ音声入力するだけでも、それが「愛知県刈谷市」を省略したものであると見なして入力音声に対する比較を実行できる。もちろん、愛知県だけを省略して再度「刈谷市昭和町」と音声入力する状況にも対応できる。
【0055】
このように、音声認識装置30側に誤認識された場合に、その誤認識された部分(上述の例では「昭和町」という町名)だけを修正することは、日常生活における会話などの習慣から考えると、ごく自然である。音声認識装置30を利用する場合に限って特別な注意を払うことを強制するのは使い勝手の点で好ましくない。したがって、本音声認識装置30のように、誤認識の部分だけ修正するという日常会話の習慣においてごく自然な振舞いに対応できることによって、上位階層を省略した方が自然な場合であっても上位階層から音声入力しなくてはならないという利用者の負担を軽減し、使い勝手をより向上させることができるのである。
【0056】
なお、図4のフローチャートに示すように、S120での確定後処理が終了した場合には、S130にて記憶部32aの参照データを削除している。つまり、この参照データは誤認識された場合を想定し、S40での省略可能な上位階層リストの作成のために記憶されたものであるため、S120での確定後処理が終了してしまえば、もう不必要となり、逆に次回の音声認識に対しては無関係なデータであるため、ここで削除しておくのである。
【0057】
ところで、図4のフローチャートに示す処理内容は、図2(A)に示す構成を前提としたものであったが、図2(B)に示す構成を前提とした場合について説明しておく。この場合も基本的な処理は同じであるが、S40及びS50の処理内容が多少異なることとなる。つまり、図2(A)に示す構成を前提とした場合には、S40にて省略可能な上位階層リストの作成と照合開始頂点の決定をし、S50の音声認識処理においては、S40で追加決定された照合開始頂点から始まる単語も一時的に辞書データ中の単語であるとして照合を行なうようにした。
【0058】
それに対して、図2(B)に示す構成を前提とした場合には、S40に相当する処理として次のような内容の処理を実行する。つまり、省略可能な上位階層リストの作成は同じであるが、辞書制御部132dが、その省略可能な上位階層リストに基づき、辞書部31bに記憶されている該当する比較対象パターン候補からその上位階層リストを構成する語を省略した第2の比較対象パターン候補を新設することとなる。上述した具体例で言えば、「しょうわちょう(昭和町)」や「かりやししょうわちょう(刈谷市昭和町)」などがこれに相当する。したがって、図4のS50に相当する処理としては、この辞書制御部132dによって第2の比較対象パターン候補が新設された状態の辞書部31bに記憶されている比較対象パターン候補を用いて照合部31aによる通常の照合が実施される。なお、この場合には、図4のS130に相当する処理として、記憶部132aの参照データを削除すると共に、辞書制御部132dによって辞書部31bに新設された第2の比較対象パターン候補が削除され、元の状態に復帰される。
【0059】
[別実施形態]
以上図1〜図4を参照して、一実施形態を説明したが、別のいくつかの実施形態について説明する。
【0060】
(1)上記実施形態では、認識処理時の省略対象として、認識結果を報知した後の所定期間内に前回の認識結果と同じ所定のカテゴリに属する音声入力がなされた場合の、その前回の認識結果の上位階層を構成する語を想定した。しかし、これには限定されず、次のような実施形態も考えられる。つまり、制御回路10から入力した外部状況(図2参照)に基づく場合である。具体的には、カーナビゲーションシステム2システム中のナビゲーション装置本体から入力した現在地情報等である。つまり、カーナビゲーションシステム2を搭載した車両が例えば愛知県内を走行しており、同じ愛知県内である「愛知県刈谷市昭和町」を目的地として設定する場合には、「愛知県刈谷市昭和町」と音声入力するのではなく、「愛知県」を省略して「刈谷市昭和町」と音声入力する方がやはり自然である。つまり、あえて愛知県から特定しないでも、その下位階層である市レベルからの指定で十分であると利用者が考えている状況である。
【0061】
このような場合には、対話制御部32が制御回路10から外部状況としての現在地を入力し、例えば「愛知県」という上位階層を認識処理時の省略対象として設定すればよい。このように、自分達が現在存在している所定のエリア内については、そのエリアを特定する上位階層の地名をあえて特定せず、その下位の階層から特定するという日常会話の習慣においてごく自然な振舞いに対応できることによって、上位階層を省略した方が自然な場合であっても上位階層から音声入力しなくてはならないという利用者の負担を軽減し、使い勝手をより向上させることができる。
【0062】
(2)また、上記実施形態では、「報知手段」としてスピーカ37を用い、音声出力により認識結果を報知するようにしたが、このように音声で出力されれば、認識結果の確認のためにドライバーが視点を移動する必要がないので、一層の安全運転に貢献できる。つまり、カーナビゲーションシステム2を車載機器用として用いているので、このような音声出力には利点がある。もちろん、画面上に文字または記号を表示することにより認識結果を報知してもよいし、音声を出力することにより報知すると共に画面上に文字または記号を表示することにより報知するようにしてもよい。そして、画面上に認識結果を表示させる場合には、カーナビゲーションシステム2の地図情報を表示するための表示装置14(図1参照)に表示させるような構成を採用することもできる。
【0063】
なお、上記図4のS40の処理においては、認識結果が所定カテゴリに属するものであるかどうかを判断するものとし、その所定カテゴリとは目的地の設定を前提にするため地名に関するカテゴリであると説明した。しかしながら、本発明の主旨はこのような地名等に限定されるものではなく、抽象的に言えば、認識結果を出力し、利用者の確認を得てから正式に確定する必要があるような情報に関するカテゴリということである。具体的に上述のカーナビゲーションシステム2で言うならば、ナビゲート処理をする上で指定される必要のある所定のナビゲート処理関連情報の指示ということとなる。この「所定のナビゲート処理関連情報」の代表的なものが目的地であるが、それ以外にもルート探索に関する条件選択など、ナビゲート処理をする上で指定の必要のある指示が含まれる。
【0064】
以上、本発明はこのような実施例に何等限定されるものではなく、本発明の主旨を逸脱しない範囲において種々なる形態で実施し得る。例えば、上述した実施形態では、音声認識装置30をカーナビゲーションシステム2に適用した例として説明したが、適用先としては、上述したカーナビゲーションシステム2には限定されない。例えば音声認識装置を空調システム用として用いる場合には、設定温度の調整、空調モード(冷房・暖房・ドライ)の選択、あるいは風向モードの選択を音声入力によって行うようにすることが考えられる。例えば設定温度について言えば、「設定温度を25度にする」や「設定温度を5度下げる」というように、設定温度に関する指示であるが、その指示内容について複数存在する場合である。本発明を適用すれば、「設定温度を25度にする」と入力したのに「設定温度を22度にする」と誤認識した場合には、再度の音声入力では「25度にする」だけ入力すればよくなり、やはり利用者の使い勝手が向上する。空調モードや風向モードなどについても同様である。
【0065】
なお、上述のカーナビゲーションシステム2や空調システムは、車載機器として用いられる場合だけではなく、例えば携帯型ナビゲーション装置や屋内用空調装置などでもよい。但し、これまで説明したように車載機器用として用いる場合には利用者がドライバーであることが考えられ、その場合には運転自体が最重要であり、それ以外の車載機器については、なるべく運転に支障がないことが好ましい。したがって、車載機器としてのカーナビゲーションシステム2や空調システムを前提とした音声認識装置の場合には、より一層の利点がある。もちろん、このような視点で考えるならば、ナビゲーションシステムや空調システム以外の車載機器に対しても同様に利用することができる。例えば、カーオーディオ機器などは有効である。また、いわゆるパワーウインドウの開閉やミラー角度の調整などを音声によって指示するような構成を考えれば、そのような状況でも有効である。
【図面の簡単な説明】
【図1】本発明の実施の形態としてのカーナビゲーションシステムの概略構成を示すブロック図である。
【図2】音声認識装置における音声認識部と対話制御部の構成を示すブロック図である。
【図3】音声認識部内の辞書部に記憶されている辞書データを示す説明図である。
【図4】音声認識装置における音声認識及び対話制御に係る処理を示すフローチャートである。
【符号の説明】
2…カーナビゲーションシステム
4…位置検出器
6…地図データ入力器
8…操作スイッチ群
10…制御回路
12…外部メモリ
14…表示装置
15…リモコンセンサ
15a…リモコン
16…地磁気センサ
18…ジャイロスコープ
20…距離センサ
22…GPS受信機
30…音声認識装置
31…音声認識部
31a…照合部
31b…辞書部
32…対話制御部
32a…記憶部
32b…入力部
32c…後処理部
33…音声合成部
34…音声入力部
35…マイク
36…PTTスイッチ
37…スピーカ
132a…記憶部
132b…入力部
132c…後処理部
132d…辞書制御部

Claims (6)

  1. 音声を入力するための音声入力手段と、
    該音声入力手段を介して入力された音声を、予め辞書手段に記憶されている複数の比較対象パターン候補と比較して一致度合の高いものを認識結果とする認識手段と、
    該認識手段による認識結果を報知する報知手段と、
    該報知手段によって認識結果が報知された後に所定の確定指示がなされた場合には、当該認識結果を確定したものとして所定の確定後処理を実行する確定後処理手段とを備える音声認識装置であって、
    前記辞書手段に記憶されている前記複数の比較対象パターン候補の内の少なくとも一つは、複数の語を階層的につなぎ合わせたものとして設定されており、
    前記複数の語を階層的につなぎ合わせた比較対象パターン候補の上位階層を構成する語又は語群が、認識処理時の省略対象として設定されている場合には、前記認識手段が、その設定されている前記上位階層構成語又は語群を省略した比較対象パターン候補も一時的に前記比較対象パターン候補と見なした上で、前記予め辞書手段に記憶されている複数の比較対象パターン候補と共に入力音声に対する比較を実行するよう構成されており、
    前記認識処理時の省略対象として設定されている上位階層を構成する語又は語群は、本音声認識装置による音声認識結果が利用されるシステム中の当該音声認識装置以外の装置から入力したものであることを特徴とする音声認識装置。
  2. 請求項1に記載の音声認識装置において、
    前記認識処理時の省略対象として設定されている上位階層構成語又は語群を参照データとして一時的に記憶しておく参照データ記憶手段を備えており、
    前記認識手段が、認識処理実行の際、前記辞書手段に記憶されている複数の比較対象パターン候補から前記参照データ記憶手段に記憶された参照データの上位階層を構成する語を省略したものも一時的に前記比較対象パターン候補と見なした上で、今回の入力音声に対する比較を実行するよう構成されていることを特徴とする音声認識装置。
  3. 請求項1に記載の音声認識装置において、
    前回の認識結果が複数の語を階層的につなぎ合わせたものである場合には、その認識結果を参照データとして一時的に記憶しておく参照データ記憶手段と、該参照データ記憶手段に記憶された参照データに基づき、前記辞書手段に記憶されている該当する比較対象パターン候補から前記参照データの上位階層を構成する語を省略した第2の比較対象パターン候補を新設する辞書制御手段とを備えており、
    前記辞書制御手段によって前記第2の比較対象パターン候補が新設された状態の前記辞書手段に記憶されている比較対象パターン候補を用いて、前記認識手段が今回の入力音声に対する比較を実行するよう構成されていることを特徴とする音声認識装置。
  4. 請求項1〜3のいずれかに記載の音声認識装置において、
    前記報知手段は、音声を出力することにより報知する手段であり、
    前記認識結果の報知は、前記認識結果の内容を音声として前記音声出力手段から出力することによって行われることを特徴とする音声認識装置。
  5. 請求項1〜4のいずれかに記載の音声認識装置と、ナビゲーション装置とを備え、
    前記音声認識装置の前記音声入力手段は、少なくとも前記ナビゲーション装置がナビゲート処理をする上で指定される必要のある所定のナビゲート処理関連データの指示を利用者が音声にて入力するために用いられるものであり、
    前記確定後処理手段は、前記認識手段による認識結果を前記ナビゲーション装置に出力するよう構成されていることを特徴とするナビゲーションシステム。
  6. 請求項1〜5のいずれかに記載の音声認識装置と、ナビゲーション装置とを備え、
    前記音声認識装置の前記音声入力手段は、少なくとも前記ナビゲーション装置がナビゲート処理をする上で指定される必要のある所定の地名関連データの指示を利用者が音声にて入力するために用いられるものであり、前記確定後処理手段は、前記認識手段による認識結果を前記ナビゲーション装置に出力するよう構成されているナビゲーションシステムであって、
    前記ナビゲーション装置は、現在地を検出する現在地検出手段と、
    該現在地検出手段によって検出した現在地が、複数の語を階層的につなぎ合わせた前記比較対象パターン候補として表せる場合には、その上位階層を構成する語又は語群を、前記認識処理時の省略対象として前記音声認識装置に出力する省略対象データ出力手段と、
    を備えることを特徴とするナビゲーションシステム。
JP2002134248A 2002-05-09 2002-05-09 音声認識装置及びナビゲーションシステム Expired - Fee Related JP3654262B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002134248A JP3654262B2 (ja) 2002-05-09 2002-05-09 音声認識装置及びナビゲーションシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002134248A JP3654262B2 (ja) 2002-05-09 2002-05-09 音声認識装置及びナビゲーションシステム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP19281697A Division JP3358498B2 (ja) 1997-07-17 1997-07-17 音声認識装置及びナビゲーションシステム

Publications (2)

Publication Number Publication Date
JP2002372986A JP2002372986A (ja) 2002-12-26
JP3654262B2 true JP3654262B2 (ja) 2005-06-02

Family

ID=19194431

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002134248A Expired - Fee Related JP3654262B2 (ja) 2002-05-09 2002-05-09 音声認識装置及びナビゲーションシステム

Country Status (1)

Country Link
JP (1) JP3654262B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006330577A (ja) * 2005-05-30 2006-12-07 Alpine Electronics Inc 音声認識装置及び音声認識方法
JP2007271876A (ja) * 2006-03-31 2007-10-18 Denso Corp 音声認識装置および音声認識用のプログラム
JP2008309864A (ja) * 2007-06-12 2008-12-25 Fujitsu Ten Ltd 音声認識装置および音声認識方法
JP2013037030A (ja) * 2011-08-03 2013-02-21 Casio Comput Co Ltd エミュレータ装置およびプログラム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5961899A (ja) * 1982-09-30 1984-04-09 シャープ株式会社 日本語音声入力装置
JPS62266599A (ja) * 1986-05-14 1987-11-19 三菱電機株式会社 音声認識装置
JPH04291398A (ja) * 1991-03-20 1992-10-15 Hitachi Ltd 音声認識方式及び音声認識システム
JP3337083B2 (ja) * 1992-08-20 2002-10-21 株式会社リコー 車載用ナビゲート装置
JP3348386B2 (ja) * 1993-06-18 2002-11-20 ソニー株式会社 データベース検索装置
JP2946269B2 (ja) * 1993-08-25 1999-09-06 本田技研工業株式会社 車載情報処理用音声認識装置
JPH07311591A (ja) * 1994-05-18 1995-11-28 Sony Corp 音声認識装置およびナビゲーションシステム
JPH08202386A (ja) * 1995-01-23 1996-08-09 Sony Corp 音声認識方法、音声認識装置、およびナビゲーション装置
JPH08320697A (ja) * 1995-05-23 1996-12-03 Hitachi Ltd 音声認識装置
JPH08328584A (ja) * 1995-05-29 1996-12-13 Sony Corp 音声認識装置、音声認識方法及びナビゲーション装置
DE19533541C1 (de) * 1995-09-11 1997-03-27 Daimler Benz Aerospace Ag Verfahren zur automatischen Steuerung eines oder mehrerer Geräte durch Sprachkommandos oder per Sprachdialog im Echtzeitbetrieb und Vorrichtung zum Ausführen des Verfahrens
JP2947143B2 (ja) * 1995-10-16 1999-09-13 ソニー株式会社 音声認識装置及びナビゲーション装置
JPH1062198A (ja) * 1996-08-19 1998-03-06 Sony Corp ナビゲーション装置
JPH10253378A (ja) * 1997-03-13 1998-09-25 Sony Corp 音声認識方法とこれを実施した装置
JP3058125B2 (ja) * 1997-06-27 2000-07-04 日本電気株式会社 音声認識装置

Also Published As

Publication number Publication date
JP2002372986A (ja) 2002-12-26

Similar Documents

Publication Publication Date Title
JP4804052B2 (ja) 音声認識装置、音声認識装置を備えたナビゲーション装置及び音声認識装置の音声認識方法
JP2004037998A (ja) 音声制御装置
JP4736982B2 (ja) 作動制御装置、プログラム
JP2009139544A (ja) 入力装置
JP2004126413A (ja) 車載制御装置、並びにその操作説明方法をコンピュータに実行させるプログラム
JP4997796B2 (ja) 音声認識装置、及びナビゲーションシステム
JPH09292255A (ja) ナビゲーション方法及び装置
JP3580643B2 (ja) 音声認識方法及び音声認識装置
JP3654262B2 (ja) 音声認識装置及びナビゲーションシステム
JP3890774B2 (ja) ナビゲーションシステム
JP4258890B2 (ja) 音声認識装置、その装置を用いたナビゲーションシステム
JP4604377B2 (ja) 音声認識装置
JP2010039099A (ja) 音声認識および車載装置
JP2007033209A (ja) ナビゲーション装置
JP3358498B2 (ja) 音声認識装置及びナビゲーションシステム
JP4201411B2 (ja) 音声認識装置及びナビゲーションシステム
JP3849283B2 (ja) 音声認識装置
JP4320880B2 (ja) 音声認識装置及び車載ナビゲーションシステム
JP2007057805A (ja) 車両用情報処理装置
JP4113698B2 (ja) 入力装置、プログラム
JP3911835B2 (ja) 音声認識装置及びナビゲーションシステム
JPH1138995A (ja) 音声認識装置及びナビゲーションシステム
JP4813144B2 (ja) ナビゲーション装置
JP3925368B2 (ja) 制御システム
JP2001075589A (ja) 音声認識方法及び音声認識装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040409

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050221

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110311

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120311

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120311

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130311

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140311

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees