JP3624698B2 - 音声認識装置、その装置を用いたナビゲーションシステム及び自動販売システム - Google Patents
音声認識装置、その装置を用いたナビゲーションシステム及び自動販売システム Download PDFInfo
- Publication number
- JP3624698B2 JP3624698B2 JP18650398A JP18650398A JP3624698B2 JP 3624698 B2 JP3624698 B2 JP 3624698B2 JP 18650398 A JP18650398 A JP 18650398A JP 18650398 A JP18650398 A JP 18650398A JP 3624698 B2 JP3624698 B2 JP 3624698B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- dictionary
- voice
- vending
- target pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Navigation (AREA)
- Control Of Vending Devices And Auxiliary Devices For Vending Devices (AREA)
- Traffic Control Systems (AREA)
Description
【発明の属する技術分野】
本発明は、例えばナビゲーションシステムにおける目的地の設定などを音声によって入力できるようにする場合などに有効な音声認識装置及びその音声認識装置を備えたナビゲーションシステム及び自動販売システムに関する。
【0002】
【従来の技術及び発明が解決しようとする課題】
従来より、入力された音声を予め記憶されている複数の比較対象パターン候補と比較し、一致度合の高いものを認識結果とする音声認識装置が既に実用化されており、例えばナビゲーションシステムにおいて設定すべき目的地を利用者が地名を音声で入力するためなどに用いられている。特に車載ナビゲーションシステムを運転手自身が利用する場合、音声入力であればボタン操作や画面注視が伴わないため、車両の走行中に行っても安全性が高いため有効である。
【0003】
しかしながら、現在の認識技術ではその認識結果が完全に正しいものとは限らず、ある程度の誤認識が生じることは仕方がない。そのため、誤認識が発生した場合には、再度音声認識自体をやり直す必要があり、利用者の望む結果を得るまでに相当の時間や手間を要することも考えられる。このような点から誤認識を極力防止する工夫が期待される。
【0004】
そこで本発明は、このような問題を解決し、誤認識を極力防止して使い勝手をより向上させた音声認識装置を提供することを目的とする。そして、その音声認識装置を用いたナビゲーションシステム及び自動販売システムを提供することも目的とする。
【0009】
【課題を解決するための手段及び発明の効果】
上記目的を達成するためになされた請求項1に記載の音声認識装置によれば、利用者が音声入力手段を介して音声を入力すると、認識手段が、その入力された音声を予め辞書手段に記憶されている複数の比較対象パターン候補と比較して一致度合の高いものを認識結果とする。辞書手段には、比較対象パターン候補毎に対応して、例えばジャンルなどの属性も記憶されており、辞書管理手段は、前記辞書手段に対して次のような管理を行う。つまり、認識結果を利用者の指示内容として扱って所定の処理を実行する処理システムの状態を入力し、その入力したシステムの状態に基づき、辞書手段に記憶されている複数の比較対象パターン候補について、対応する属性に基づいて一時的に優先度を設定し、その設定された優先度の高い比較対象パターン候補のみを認識手段における認識の際の辞書データとして利用するか、または認識手段における認識結果を認識度合いの高い順に出力する場合に優先度の高い比較対象パターンほど認識度合いが高いと扱うことによって、認識手段における認識の際の辞書データとして利用され易くするのである。例えば、請求項2に示すように、比較対象パターン候補毎に対応する属性に基づいて、入力した前記システムの状態において利用者からの指示としてあり得る確率の高いと考えられる前記比較対象パターンほど優先度を高く設定することにより、認識の際の辞書データとして利用され易くしておく事が考えられる。
【0010】
このようにすれば、例えば誤認識され易い2つの比較対象パターン候補が存在しても、一方は優先度が高く設定され、他方が低く設定されていれば、優先度が低く設定されている比較対象パターン候補が誤って認識される可能性が低くなり、結果的に誤認識を極力防止することができる。また、優先度が低く設定されている比較対象パターン候補についても、優先度は低いが最終的には認識対象としては存在しているので認識結果として得ることは可能である。したがって、例えば音声認識装置としては優先度の高い比較対象パターン候補の順に認識結果として出力したが、利用者からは所望するものでないため別の認識結果を出力するよう指示があると、最終的にはその優先度の低い比較対象パターン候補が認識結果として出力され、利用者の所望のものとなることもできる。
【0011】
つまり、辞書データの一部のみを有効とすると、反対に無効とされた辞書データについては認識の際に全く比較対象とされることがない。したがって、利用者からの指示としての可能性は低くても、指示としてあり得る語彙については辞書データとして有効とするという考え方もあるが、このような可能性の低いものまで辞書データとして有効にしておくと、結局、辞書データ中に誤認識の可能性のある語彙が増えることとなる。この点を鑑みると、本発明のように、利用される/されないという完全な二者択一で対応し切れない状況においては、優先度を設定する手法が有効である。
ところで、請求項1または2に記載の音声認識装置をナビゲーションシステム用として用いる場合には、請求項3に示すように構成することが考えられる。つまり、請求項1または2に記載の音声認識装置と、ナビゲーション装置とを備え、音声認識装置の音声入力手段を、少なくともナビゲーション装置がナビゲート処理をする上で指定される必要のある所定のナビゲート処理関連データの指示を利用者が音声にて入力するために用いるのである。
【0012】
この場合の「所定のナビゲート処理関連データ」としては、目的地が代表的なものとして挙げられ、その目的地としては、地名そのものである場合もあるし、あるいは施設や店舗名などの場合もある。また、それ以外にもルート探索に関する条件選択など、ナビゲート処理をする上で指定の必要のある指示が含まれる。目的地を施設や店舗名などで指定する場合には、データベース中から条件設定して絞り込んでいくことが多い。その場合には、例えばレストランというようなジャンルで絞り込みを行う場合には、食事の提供場所としてあり得ない施設や店舗名についての辞書データは無効あるいは優先度を低く設定すればよい。特に請求項4に示すように、一般的なナビゲーション装置は表示装置に地図やメニューを表示可能であるため、辞書管理手段が、表示装置に表示されている内容に基づくと共に比較対象パターン候補毎に対応する属性に基づいて、前記表示内容においては利用者からの指示としてあり得ないと考えられる比較対象パターンを認識の際の辞書データとして無効にするか、あるいは優先度を低くすればよい。上述の例で言えば、レストランのリストを表示するような画面表示となっていれば、その状態で「地図向き変更」や「地図尺度変更」などの地図操作を要求することは考えられないため、それに関連する語彙の比較対象パターン候補は無効あるいは優先度を低くしておけばよい。
【0013】
一方、請求項1または2に記載の音声認識装置を自動販売システム用として用いる場合には、請求項5に示すように構成することが考えられる。つまり、請求項1または2に記載の音声認識装置と、自動販売装置とを備え、音声認識装置の音声入力手段を、少なくとも前記自動販売装置が販売対象の品物を特定するために指定される必要のある所定の自動販売処理関連データの指示を利用者が音声にて入力するために用いる。
【0014】
ここでいう自動販売装置とは、例えばたばこや飲料水などの販売装置であり、その品物の銘柄自体を利用者が音声にて指定すると、その指定された品物を販売することとなる。この場合、例えば請求項6に示すように、音声認識装置は、自動販売装置にて販売が可能とされている全ての品物の固有名詞に関する比較対象パターン候補を辞書手段中の辞書データとして備えていると共に、辞書管理手段は、自動販売装置のその時点で実際に販売可能な品物以外の固有名詞に関する比較対象パターン候補については、一時的に辞書データとして無効にするか、あるいは優先度を低くすることが考えられる。例えばたばこの自動販売システムを考えた場合、理論上販売が可能な全ての銘柄のたばこの固有名詞に対応する比較対象パターン候補を辞書データとして準備しておく。そして、自動販売装置単位で、その装置にて実際に販売するたばこの銘柄以外の固有名詞に関する比較対象パターン候補については、一時的に辞書データとして無効にするか、あるいは優先度を低く設定しておく。具体的には、自動販売装置の管理者などがマニュアル設定すればよい。このようにすれば、どのような銘柄のたばこを選択して自動販売の対象とするかに応じて辞書データを調整できるので、その自動販売装置で扱っていない銘柄のたばこが誤認識結果とされることがなくなる。そのため、自動販売装置の利用者にとっての使い勝手も向上する。なお、この場合には、扱っていない銘柄の固有名詞に関する比較対象パターン候補については、辞書データとして無効にした方が、優先度を低くするより好ましいと言える。
【0015】
【発明の実施の形態】
以下、本発明が適用された実施例について図面を用いて説明する。なお、本発明の実施の形態は、下記の実施例に何ら限定されることなく、本発明の技術的範囲に属する限り、種々の形態を採り得ることは言うまでもない。
【0016】
[第1実施例]
図1は音声認識装置30を適用した車載用のナビゲーションシステム1の概略構成を示すブロック図である。本ナビゲーションシステム1は、音声認識装置30と機構スイッチ2とリモコンスイッチ3とからなる操作スイッチ部4、その操作スイッチ部4からの操作状況などを入力し、ナビゲーションシステム全体の制御を行う操作制御部5、自車両現在位置を算出するための現在位置算出部6、利用者の設定した目的地に基づき目的地までの適切なルート(推奨ルート)を算出する経路計算部7、経路計算部7にて計算された推奨ルートに基づき、車両の運転を円滑に進めるために必要な案内を音声や簡易地図などで利用者に提供する制御処理を行う案内制御部8、地図データ検索部9、音声出力制御部11,スピーカ12、表示制御部13及びディスプレイ14を備えている。なお操作制御部5は通常のコンピュータとして構成されており、内部には、周知のCPU、ROM、RAM、I/O及びこれらの構成を接続するバスラインが備えられている。
【0017】
前記現在位置算出部6は、例えばいずれも周知のジャイロスコープ、距離センサ及び衛星からの電波に基づいて車両の位置を検出するGPS(Global Positioning System )のためのGPS受信機を有している。これらのセンサ等は各々が性質の異なる誤差を持っているため、複数のセンサにより、各々補間しながら使用するように構成されている。なお、精度によっては上述した内の一部で構成してもよく、更に、地磁気センサ、ステアリングの回転センサ、各転動輪の車輪センサ等を用いてもよい。
【0018】
地図データ検索部9は、位置検出の精度向上のためのいわゆるマップマッチング用データ、地図データ及び目印データを含む各種データを入力するための装置である。媒体としては、そのデータ量からCD−ROMやDVDを用いるのが一般的であるが、メモリカード等の他の媒体を用いても良い。
【0019】
ディスプレイ14はカラーディスプレイであり、ディスプレイ14の画面には、現在位置算出部6から入力された車両現在位置マークと、地図データ検索部9より入力された地図データと、更に地図上に表示する誘導経路や後述する設定地点の目印等の付加データとを重ねて表示することができる。
【0020】
機構スイッチ2は、例えば、ディスプレイ14と一体になったタッチスイッチもしくはメカニカルなスイッチ等が用いられ、経路計算のための目的地や各種入力に使用される。また、リモコンスイッチ3を介しても機構スイッチ2と同じ指示入力をすることができるようにされている。そして、音声認識装置30は、上記機構スイッチ2あるいはリモコンスイッチ3が手動操作により目的地などを指示するために用いられるのに対して、利用者が音声で入力することによっても同様に目的地などを指示することができるようにするための装置である。なお、操作スイッチ部4としては、必ずしもこれら音声認識装置30、機構スイッチ2及びリモコンスイッチ3の全てを備えていなくてはならないということはなく、どれか一つだけでも所望の指示入力は可能であるが、本実施例では利便性を考えて3つを併有するものとする。
【0021】
次に、この操作スイッチ部4の一部を構成する音声認識装置30について、図2を参照してさらに詳しく説明する。
音声認識装置30は、「音声入力手段」としてのマイク31と、マイク31を介して入力した音声信号をA/D変換などによってデータ処理可能な形態に変換処理する入力信号処理部32と、「認識手段」としての認識処理部33と、「辞書手段」及び「辞書管理手段」としての辞書管理部34と、「辞書管理手段」の一部としても機能する認識制御部35とを備えている。
【0022】
なお、図2には図示していないが、本実施例における音声入力方法は、利用者がPTT(Push−To−Talk)スイッチを押しながらマイク31を介して音声を入力するという使用方法である。具体的には、入力信号処理部32はPTTスイッチが押されたかどうかを判断しており、PTTスイッチが押されている場合にはマイク31を介しての音声入力処理を実行するが、押されていない場合にはその音声入力処理を実行しないようにしている。したがって、PTTスイッチが押されている間にマイク31を介して入力された音声データのみが認識処理部33へ出力されることとなる。
【0023】
認識処理部33は、入力信号処理部32から入力された音声データを、設定された辞書データ中に比較対象パターン候補と比較して一致度の高い上位比較対象パターンを認識制御部35へ出力する。入力音声中の単語系列の認識は、入力信号処理部32から入力された音声データを順次音響分析して音響的特徴量(例えばケプストラム)を抽出し、この音響分析によって得られた音響的特徴量時系列データを得る。そして、周知のDPマッチング法によって、この時系列データをいくつかの区間に分け、各区間が辞書データとして格納されたどの単語に対応しているかを求める。
【0024】
なお、認識処理部33から認識制御部35に出力される認識結果は1つとは限らない。例えば認識処理部33における類似判定結果の上位複数の語彙、あるいは認識された複数の語彙のこともある。音声認識技術は、登録された認識対象語と取り込まれた音声のパターンマッチングであるため、一致度の高いものを認識結果として複数出力するのが一般的である。例えば都道府県名を認識辞書とした場合、「ワカヤマケン」と「オカヤマケン」のパターンが似ていれば、「岡山県」という利用者の発声に対して上記2つが認識結果として出力されることもある。また、最近の技術では、利用者の発声、例えば「名古屋市の美術館」に対して「名古屋市」と「美術館」の2つの語彙を別々のものとして認識して認識結果を出力することも可能である。
【0025】
そして、認識制御部35は、その認識結果を操作制御部5へ出力すると共に、操作制御部5からは状態を取得する。この状態とは、ナビゲーションシステム1が現時点でどのような設定状態にあるのかなどを取得する。そして、その取得した状態に基づいて辞書管理部34に対して辞書指定を行う。
【0026】
辞書管理部34は、記憶している辞書データを認識処理部33に設定する。認識処理部33はこの設定された辞書データに基づいて認識処理を行うのであるが、辞書管理部34は、記憶している辞書データ常に同じ状態で認識処理部33に設定するとは限らない。つまり、認識制御部35から辞書指定があると、その指定に基づいて編集した辞書データを認識処理部33に設定するのである。この辞書編集の内容については、後述する。
【0027】
次に、本実施例のナビゲーションシステム1の動作について説明する。なお、音声認識装置30に関係する部分が特徴であるので、ナビゲーションシステムとしての一般的な動作を簡単に説明した後、音声認識装置30に関係する部分の動作について詳しく説明することとする。
【0028】
ナビゲーションシステム1の電源オン後に、ディスプレイ14上に表示されるメニューから、ドライバーが機構スイッチ2またはリモコンスイッチ3により、案内経路をディスプレイ14に表示させるために経路情報表示処理を選択した場合、あるいは、音声認識装置30を介して希望するメニューをマイク31を介して音声入力することで、上述したスイッチ2,3を介して選択されるのと同様の指示が認識制御部35から操作制御部5へなされた場合、次のような処理を実施する。
【0029】
すなわち、ドライバーがディスプレイ14上の地図に基づいて、音声あるいはスイッチ操作によって目的地を入力すると、現在位置算出部6にて車両の現在地が求められ、目的地と現在地との間に、ダイクストラ法によりコスト計算して、現在地から目的地までの最も短距離の経路を誘導経路として求める処理が行われる。そして、ディスプレイ14上の道路地図に重ねて誘導経路を表示して、ドライバーに適切なルートを案内する。このような誘導経路を求める計算処理や案内処理は一般的に良く知られた処理であるので説明は省略する。
【0030】
次に、音声認識装置30における動作について図3のフローチャートを参照して説明する。
起動した際の最初のステップS10においては、ユーザ設定があるかどうかを判断する。ここでいうユーザ設定とは、例えば特別に音声認識の対象としたい地点(ナビゲーションシステムでは、メモリ地点登録として、住所地名や施設名称以外のもので登録されている地点情報)や、音声認識結果の確認方法などの設定である。このようなユーザ設定がなされていない場合には(S10:NO)、そのままS30へ移行するが、ユーザ設定がなされていれば(S10:YES)、その設定状態を入力してから(S20)、S30へ移行する。
【0031】
S30では、ナビゲーションシステムの状態、例えば「ディスプレイ14に現在表示中の地図縮尺が1万分の1の道路地図であって、これ以上詳細な地図はない」といった状態などを取り込む。なお、地図以外の表示として、例えばジャンル別に目的地を探す場合には「レストランリスト」、「温泉リスト」、「ゴルフ場ルスト」などが表示されている状態もあるので、その場合はどのジャンルのリストが表示されているかという状態を取り込む。
【0032】
なお、これらS20での設定状態の入力及びS30でのシステム状態の取り込みは、図2の認識制御部35が操作制御部5から入力及び取り込むこととなる。そして、続くS40では、認識制御部35が、S20にて入力した設定状態及びS30にて取り込んだシステム状態に基づき、辞書管理部34に対して辞書指定を行う。すると、辞書管理部34は、その辞書指定に基づき認識処理部33に対して辞書設定を行う。例えば、図5に示す辞書データ(ベース辞書)は、認識可能な全ての語彙が含まれるものであり、図6に示す辞書データ(選択辞書)は、その中から所定のものだけを抽出して設定したものである。なお、この具体的な設定については、後述することとする。
【0033】
こうして音声認識のための準備が完了すると、S60にて音声認識を行い、その音声認識が成功したかどうかを判断する。なお、音声認識は次のように行う。上述したように、図示しないPTTスイッチが押されている間にマイク31を介して入力された音声データのみが入力信号処理部32から認識処理部33へ出力される。したがって、入力信号処理部32からの音声データの入力があれば、認識処理部33は、辞書管理部34にて設定された辞書データを用いて照合を行い認識処理を実行する。そして、音声データの取込に異常がある、あるいは辞書データを用いた照合の結果、一致するものがない、などの不具合が検出されれば、音声認識は失敗であるとして(S60:NO)、そのまま本処理ルーチンを終了する。
【0034】
一方、音声認識が成功した場合には(S60:YES)、認識制御部35はその認識結果を操作制御部5へ出力する。そして、操作制御部5から音声出力制御部11及びスピーカ12を介して認識結果が音声応答する(S70)。この認識結果の音声応答により、ユーザは自分の意図した指示が正しく認識されているかどうかを判断することができ、正しく認識されていれば、例えば音声にて「はい」と入力したり、所定の確定スイッチを操作することによって、ユーザ要求確定となり(S80:YES)、S90へ移行する。なお、ユーザ要求が確定しない場合には、またS60へ戻って、再度入力された音声データに対する認識処理を行う。また、ユーザ要求確定については、例えば機構スイッチ2やリモコンスイッチ3に確定指示用のスイッチを設けておき、そのスイッチ操作にて判断してもよい。
【0035】
S90では、認識制御部35が要求確定を操作制御部5へ応答する。これによって、例えばディスプレイ14に1万分の1の縮尺の地図が表示されている状態で、ユーザからの音声入力が「地図縮尺を2万分の1に変更する」という要求であった場合には、その要求が確定することによって、操作制御部5はディスプレイ14に表示されている地図の縮尺を2万分の1に変更する処理を実行することとなる。また、「目的地を設定する」のようなユーザ要求であった場合は、目的地とする地点情報がないと要求実現ができない。したがって、この場合は、再度実行する図3の処理中のS20において、ユーザ設定が「目的地を設定する」状態であることを入力し、その設定状態に基づき、S40,S50において、目的地を設定するための辞書編集及び設定を行う。そして、音声認識処理を実行する。このようにして、ユーザの要求する機能がナビゲーションシステム1にて実現されるまで音声認識処理を繰り返す。
【0036】
図3では音声認識装置30での全体的な動作を説明したが、S40,S50における辞書編集及び設定に特徴があるので、この点について具体例を挙げながらさらに説明する。
例えば、図4(A)に示すようにディスプレイ14に「レストラン」のリスト表示がされている状態にて音声認識機能が起動した場合には、ユーザの操作に応じてこのレストランリストを表示していることは明らかで、この状態においてユーザが「地図向きの変更」や「地図尺度の変更」といった地図操作に関する要求を行うことは考えられない。また、他のリスト、例えば「温泉リスト」や「ゴルフ場リスト」が表示されている場合に要求される温泉やゴルフ場に関するデータなどについても、この状態で要求されることは考えられない。
【0037】
そこで、図4(A)のようにレストランリストが表示されている状態でユーザが要求するのは、レストランの店名そのものの指定か、あるいはレストランというジャンルをさらに詳細に区別するジャンル指定のいずれかであると想定でき、絞り込むことができる。そこで、図2における認識制御部35は、操作制御部5からレストランリストが表示されているという状態を取得し、辞書管理部34に対して、「レストランに関する辞書」という指定を行う。
【0038】
辞書管理部34は、予め記憶されているベース辞書(図5参照)から、辞書指定に基づいて必要分を抽出(あるいは不要分を削除)した選択辞書(図6参照)を編集し、認識処理部33に設定する。図5に示すベース辞書は、認識語彙毎に、都道府県(但し名古屋市はここに含む)・市区町村・ジャンル・詳細・条件という5つの項目が設定されているので、この場合には、その内のジャンルに基づき「食事」というジャンルを持つ認識語彙のみを抽出し、図6に示す選択辞書を設定することとなる。このように選択辞書を設定すると、例えば図5中において「○○味」、「伊豆見町」、「和泉市」という3つの認識語彙があるが、この内「○○味」に対して誤認識の可能性が高い「伊豆見町」及び「和泉市」という認識語彙を削除した選択辞書(図6)を設定することができる。したがって、ユーザが「○○味」を指定したい場合、適切にその「○○味」が認識されることとなる。
【0039】
また、「○○味」が音声入力され、図4(B)に示すように、「○○味」の場所が周辺地図と共にディスプレイ14に表示されている状態では、次のような選択辞書の設定がなされる。つまり、この図4(B)に示す地図はユーザの要求に従って表示したものであるため、次の指示として「表示地図尺度の変更」、「表示位置のスクロール」、「目的地とする」、「通過点とする」というような内容が想定され、例えばゴルフ場などの他のリストや、音声のボリューム変更などが指示されることは考えにくい。したがって、この場合の認識制御部35は、ユーザの要求に従って地図を表示しているという状態に基づき、辞書管理部34に対して、地図操作を行うコマンドのみに絞った選択辞書を設定するよう辞書指定をする。
【0040】
このように、ユーザの操作に基づいて状態が変更されていくに従い、その変更された状態において必要な認識語彙のみを含む選択辞書が随時設定されていく。つまり、その時点でのナビゲーションシステム1の状態から必要と思われる認識語彙はそのまま残って有効とされ、それ以外の認識語彙が辞書データとして無効となるので、誤認識を極力防止できながら本来認識すべき語彙についての音声認識は適切に実現することができる。
【0041】
[第2実施例]
上述した第1実施例においては、図5に示すベース辞書を、ジャンルが「食事」となっている認識語彙のみを抽出することによって、図6に示す選択辞書を設定したが、このようにした場合には、図6の選択辞書中に含まれない認識語彙については、認識の際に全く対象外となる。もちろん、上述したように、その時点でのシステムの状態では入力されることがあり得ない認識語彙ばかりであれば対象外としても何ら問題がない。但し、入力される可能性はないとは言えないが、その可能性が低い認識語彙というものも存在する。その認識語彙も選択辞書中に含めておくと、結局、辞書データ中に誤認識の可能性のある語彙が増えることとなる。
【0042】
この点を鑑みた第2実施例では、次のような辞書を構築する。つまり、図7に示すように、認識語彙毎にさらに「優先度」という項目を設定する。そして、図7に示すベース辞書の状態ではその優先度は全て0にしておき、図8に示す選択辞書とする場合には、所定の認識語彙についてのみ、その優先度を10あるいは5に設定するのである。図8に示す場合には、ジャンル項目において「食事」となっている認識語彙については優先度を0から10あるいは5として、それ以外の認識語彙よりも認識対象とされ易くする。但し、本実施例では、ジャンル項目において「食事」となっている認識語彙の中でも、詳細項目において単に「分類タイトル」とされている2つの認識語彙、すなわち「和食」及び「中華」については優先度を5とし、それ以外の4つの認識語彙は優先度を10としてある。
【0043】
このようにすれば、例えば上述した「○○味」、「伊豆見町」、「和泉市」という誤認識の可能性が高い3つの認識語彙が存在しても、「○○味」は優先度が10と高く設定され、他の「伊豆見町」及び「和泉市」は優先度が0と低く設定されているので、優先度の低い認識語彙が誤って認識される可能性が低くなり、結果的に誤認識を極力防止することができる。また、優先度が低く設定されている認識語彙についても、優先度は低いが最終的には選択辞書中に認識対象の語彙としては存在しているので、認識結果として得ることは可能である。したがって、例えば音声認識装置30としては優先度の高い認語語彙の順に認識結果として出力したが、ユーザからは所望するものでないため別の認識結果を出力するよう指示があると、最終的にはその優先度の低い認識語彙が認識結果として出力され、ユーザの所望のものとなることもできる。つまり、利用される/されないという完全な二者択一で対応し切れない状況においては、このように優先度を設定する手法が有効である。
【0044】
[第3実施例]
以上の2つの実施例は、ナビゲーションシステム1におけるユーザの指示入力のために音声認識装置30を利用した例として説明したが、それ以外にも、例えば自動販売システムにおける希望商品などの指示を入力するための音声認識装置として用いることもできる。
【0045】
例えばたばこの自動販売システムを考える。この場合のベース辞書は、図9(A)に示すように、ID(番号)1,2,3…毎に、銘柄・分類・設定の3つの項目が設定されている。ここで、銘柄には、自動販売装置にて理論上販売が可能とされている全てのたばこの銘柄が設定される。つまり、実際にその自動販売装置にて販売するかどうかは関係なく、流通している全てのたばこの銘柄を設定しておくのである。しかし、現実的には1台の自動販売装置で販売できるたばこの種類には限度があるため、実際にその自動販売装置で販売対象としている銘柄のみを認識対象とするため、図9(B)に示すような選択辞書を設定する。つまり、「設定」という項目において、実際に販売可能な銘柄のみを「ON」とし、それ以外は「OFF」と設定する。具体的には、この設定が「ON」とされた銘柄のみが認識語彙とされた選択辞書が構築され、その選択辞書に基づく音声認識が実行されることとなる。なお、このON・OFFの設定は、具体的には自動販売装置の管理者などがマニュアル設定することとなる。
【0046】
このようにすれば、どのような銘柄のたばこを選択して自動販売の対象とするかに応じて辞書データを調整できるので、その自動販売装置で扱っていない銘柄のたばこが誤認識結果とされることがなくなる。そのため、自動販売装置の利用者にとっての使い勝手も向上する。
【0047】
また、上述した第2実施例の場合と同様に、その自動販売装置で扱っていない銘柄については、優先度を低く設定するという手法も採用可能である。但し、この場合には、扱っていない銘柄は、認識しても最終的には販売できないので、辞書データとして無効にした方が、優先度を低くするより好ましいと言える。
【0048】
[その他]
上述した実施例では、音声認識装置30をナビゲーションシステム1あるいは自動販売システムに適用した例として説明したが、適用先としては、それ以外にも種々考えられる。要は、ユーザからの指示に基づきシステムの状態が遷移していく場合に、ある状態においてはユーザからの指示内容が限定される状況が生じるのであれば、認識語彙を抽出した選択辞書を設定することにより、その状態での誤認識を極力防止するという効果が得られるのである。
【図面の簡単な説明】
【図1】実施例としてのナビゲーションシステムの概略構成を示すブロック図である。
【図2】実施例の音声認識装置の概略構成を示すブロック図である。
【図3】実施例の音声認識装置における処理を示すフローチャートである。
【図4】システム状態の具体例を示す説明図である。
【図5】音声認識部内の辞書管理部が設定するベース辞書の説明図である。
【図6】音声認識部内の辞書管理部が設定する選択辞書の説明図である。
【図7】第2実施例の場合のベース辞書の説明図である。
【図8】第2実施例の場合の選択辞書の説明図である。
【図9】第3実施例の場合のベース辞書及び選択辞書の説明図である。
【符号の説明】
1…ナビゲーションシステム 2…機構スイッチ
3…リモコンスイッチ 4…操作スイッチ部
5…操作制御部 6…現在位置算出部
7…経路計算部 8…案内制御部
9…地図データ検索部 11…音声出力制御部
12…スピーカ 13…表示制御部
14…ディスプレイ 30…音声認識装置
31…マイク 32…入力信号処理部
33…認識処理部 34…辞書管理部
35…認識制御部
Claims (6)
- 音声を入力するための音声入力手段と、
該音声入力手段を介して入力された音声を、予め辞書手段に記憶されている複数の比較対象パターン候補と比較して一致度合の高いものを認識結果とする認識手段と、
を備える音声認識装置であって、
前記辞書手段には、前記比較対象パターン候補毎に対応して、例えばジャンルなどの属性も記憶されており、
前記認識結果を利用者の指示内容として扱って所定の処理を実行する処理システムの状態を入力し、その入力したシステムの状態に基づき、前記辞書手段に記憶されている前記複数の比較対象パターン候補について、前記対応する属性に基づいて一時的に優先度を設定し、その設定された優先度の高い比較対象パターン候補のみを前記認識手段における認識の際の辞書データとして利用するか、または前記認識手段における認識結果を認識度合いの高い順に出力する場合に前記優先度の高い比較対象パターンほど前記認識度合いが高いと扱うことによって、前記認識手段における認識の際の辞書データとして利用され易くする辞書管理手段を備えていること、
を特徴とする音声認識装置。 - 請求項1に記載の音声認識装置において、
前記辞書管理手段は、前記比較対象パターン候補毎に対応する属性に基づいて、入力した前記システムの状態において利用者からの指示としてあり得る確率の高いと考えられる前記比較対象パターンほど前記優先度を高く設定することにより、認識の際の辞書データとして利用され易くすること、
を特徴とする音声認識装置。 - 請求項1または2に記載の音声認識装置と、ナビゲーション装置とを備え、
前記音声認識装置の前記音声入力手段は、少なくとも前記ナビゲーション装置がナビゲート処理をする上で指定される必要のある所定のナビゲート処理関連データの指示を利用者が音声にて入力するために用いられるものであること
を特徴とするナビゲーションシステム。 - 請求項3に記載のナビゲーションシステムにおいて、
前記ナビゲーション装置は表示装置に地図やメニューを表示可能であり、前記辞書管理手段は、前記表示装置に表示されている内容に基づくと共に前記比較対象パターン候補毎に対応する属性に基づいて、前記表示内容においては利用者からの指示としてあり得ないと考えられる前記比較対象パターンを認識の際の辞書データとして無効にするか、あるいは前記優先度を低くすること、
を特徴とするナビゲーションシステム。 - 請求項1または2に記載の音声認識装置と、自動販売装置とを備え、
前記音声認識装置の前記音声入力手段は、少なくとも前記自動販売装置が販売対象の品物を特定するために指定される必要のある所定の自動販売処理関連データの指示を利用者が音声にて入力するために用いられるものであること、
を特徴とする自動販売システム。 - 請求項5に記載の自動販売システムにおいて、
前記音声認識装置は、前記自動販売装置にて販売が可能とされている全ての品物の固有名詞に関する比較対象パターン候補を前記辞書手段中の辞書データとして備えていると共に、前記辞書管理手段は、前記自動販売装置のその時点で実際に販売可能な品物以外の固有名詞に関する比較対象パターン候補については、一時的に前記辞書データとして無効にするか、あるいは前記優先度を低くすること、
を特徴とする自動販売システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP18650398A JP3624698B2 (ja) | 1998-07-01 | 1998-07-01 | 音声認識装置、その装置を用いたナビゲーションシステム及び自動販売システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP18650398A JP3624698B2 (ja) | 1998-07-01 | 1998-07-01 | 音声認識装置、その装置を用いたナビゲーションシステム及び自動販売システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000020086A JP2000020086A (ja) | 2000-01-21 |
JP3624698B2 true JP3624698B2 (ja) | 2005-03-02 |
Family
ID=16189644
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP18650398A Expired - Fee Related JP3624698B2 (ja) | 1998-07-01 | 1998-07-01 | 音声認識装置、その装置を用いたナビゲーションシステム及び自動販売システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3624698B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3781715B2 (ja) * | 2002-11-01 | 2006-05-31 | 松下電器産業株式会社 | メタデータ制作装置及び検索装置 |
JP4363076B2 (ja) | 2002-06-28 | 2009-11-11 | 株式会社デンソー | 音声制御装置 |
WO2005064592A1 (ja) * | 2003-12-26 | 2005-07-14 | Kabushikikaisha Kenwood | 機器制御装置、音声認識装置、エージェント装置、車載機器制御装置、ナビゲーション装置、オーディオ装置、機器制御方法、音声認識方法、エージェント処理方法、車載機器制御方法、ナビゲーション方法、オーディオ装置制御方法及びプログラム |
JP2006098331A (ja) * | 2004-09-30 | 2006-04-13 | Clarion Co Ltd | ナビゲーション装置、ナビゲーション方法及びナビゲーションプログラム |
JP2007322309A (ja) * | 2006-06-02 | 2007-12-13 | Xanavi Informatics Corp | 車載情報装置 |
JP5378907B2 (ja) * | 2009-08-07 | 2013-12-25 | 株式会社豊田中央研究所 | 音声対話装置及び音声対話プログラム |
CN107102990A (zh) * | 2016-02-19 | 2017-08-29 | 株式会社东芝 | 对语音进行翻译的方法和装置 |
-
1998
- 1998-07-01 JP JP18650398A patent/JP3624698B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000020086A (ja) | 2000-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4466379B2 (ja) | 車載音声認識装置 | |
US10328950B2 (en) | Vehicle equipment control device and method of searching for control content | |
US20080059175A1 (en) | Voice recognition method and voice recognition apparatus | |
JP4736982B2 (ja) | 作動制御装置、プログラム | |
JP4997796B2 (ja) | 音声認識装置、及びナビゲーションシステム | |
JP2005292970A (ja) | 施設検索装置、プログラム、ナビゲーション装置、及び施設検索方法 | |
JP2010230918A (ja) | 検索装置 | |
JP3624698B2 (ja) | 音声認識装置、その装置を用いたナビゲーションシステム及び自動販売システム | |
JP4258890B2 (ja) | 音声認識装置、その装置を用いたナビゲーションシステム | |
JP5364412B2 (ja) | 検索装置 | |
JP2010039099A (ja) | 音声認識および車載装置 | |
JP2009140287A (ja) | 検索結果表示装置 | |
JP3890774B2 (ja) | ナビゲーションシステム | |
JP2005275228A (ja) | ナビゲーション装置 | |
JP3700533B2 (ja) | 音声認識装置及び処理システム | |
JPH0850698A (ja) | 音声対話型ナビゲーション装置 | |
JP2007057805A (ja) | 車両用情報処理装置 | |
JP3296783B2 (ja) | 車載用ナビゲーション装置および音声認識方法 | |
JP2007065206A (ja) | 施設検索装置 | |
JP2008020980A (ja) | エージェント装置、プログラム、及びエージェント装置における提案方法 | |
JP4453377B2 (ja) | 音声認識装置、プログラム及びナビゲーション装置 | |
JP3925368B2 (ja) | 制御システム | |
JP2003005783A (ja) | ナビゲーションシステムおよびその目的地入力方法 | |
JP3770083B2 (ja) | コマンド入力装置 | |
JP3679033B2 (ja) | ナビゲーション装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040120 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040315 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040824 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041019 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041122 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101210 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111210 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121210 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131210 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |