JPWO2007069372A1

JPWO2007069372A1 - 音声認識装置

Info

Publication number: JPWO2007069372A1
Application number: JP2007550083A
Authority: JP
Inventors: 悠希住吉; 玲子岡田
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2005-12-14
Filing date: 2006-08-16
Publication date: 2009-05-21
Anticipated expiration: 2026-08-16
Also published as: WO2007069372A1; JP4855421B2; US8112276B2; US20090259467A1; CN101331537A; DE112006002988T5

Abstract

音声認識装置１０は、音声認識辞書を参照して入力音声を音声認識して音声認識結果を出力する。この音声認識装置では、音声認識辞書２３−１〜２３−Ｎは予め定められた分類項目に応じて複数備えられ、さらに、音声認識装置は音声認識辞書のうち１つを参照して入力音声を音声認識して前記音声認識結果を得る音声認識手段１７と、音声認識結果が誤認識であるか否かを判定する誤認識判定手段１５と、誤認識判定手段で音声認識結果が誤認識であると判定されると音声認識辞書を切り替える認識辞書管理手段１９と、切り替え後の音声認識辞書を参照して入力音声を音声認識して音声認識結果を得る音声認識手段１７とを有している。

Description

この発明は、複数の音声認識辞書を備えて、音声認識を行う音声認識装置に関し、特に、カーナビゲーション装置等で用いられる音声認識装置に関するものである。

一般に、音声認識装置においては、音声認識辞書に登録された単語（語彙）を参照して音声認識を行っており、音声認識率を向上させるためには音声認識辞書に多数の単語を登録する必要があるものの、１つの音声認識辞書に多数の語彙を登録すると、音声認識を行う際に行われる音声認識辞書の検索に時間が掛かり、音声認識処理に要する時間が増加してしまう（つまり、音声認識処理速度が低下してしまう）。一方、音声認識辞書に登録する語彙数を少なくすると、音声認識辞書の検索に要する時間は短縮されるものの、今度は音声認識率が低下してしまう。

このため、複数の音声認識辞書を備えて、順次音声認識辞書を検索して音声認識辞書の検索に要する時間を短縮するとともに、音声認識率を向上させるようにしたものがある。

例えば、不特定話者が入力した音声の特徴と、複数の音声辞書ファイル（音声認識辞書）の中から選択した音声辞書ファイルに収められている音声の特徴とを比較し、その一致度が基準値に達する語彙を検出する際、一致度の基準値に達する語彙が存在しない場合、一致度の相対的に高い語彙を語彙候補として記憶して、音声辞書ファイルの選択を切換え、入力音声の特徴と、切換えられた音声辞書ファイルに収められている語彙候補に対応する入力音声の特徴とを比較して一致度を判定して、最初に設定した音声辞書ファイル中から一致度が基準値に達する語彙を見付けることができない場合、音声辞書ファイルを切換えつつ、入力音声の照合を繰り返し、正解を見付けるための認識処理を続行するようにしたものがある（例えば、特許文献１参照）。

さらに、誤認識された際に音声認識辞書の指定を変更して認識し直す場合、音声が入力されると、その音声を音声記憶部に記憶しておくとともに、音声認識部で認識処理を行って認識結果を表示して、その結果が誤認識であるため、ユーザが認識辞書の切替え指示を行うと、認識結果制御部が認識辞書制御部に音声認識辞書を切替えさせて、音声記憶部に記憶されている音声を音声認識部に認識処理させるようにしたものがある（例えば、特許文献２参照）。

特開平６−３１８０９７号公報（第２頁〜第３頁、第１図〜第４図）特開２０００−２０００９３公報（第３頁〜第５頁、第１図〜第５図）

従来の音声認識装置は以上のように構成されているので、つまり、不特定話者が入力した音声の特徴（トーン）に応じて音声認識辞書を切り替えるようにしており、入力音声の特徴と音声認識辞書に格納された音声の特徴との一致度が基準値に達するまで、音声認識辞書を切り替えて入力音声の照合を行っているだけで、たとえ、複数の音声認識辞書を備えているとしても、入力音声の認識率を向上させるためには、各音声認識辞書に多数の語彙を格納しておかなければならず、音声認識辞書の検索に要する時間を短縮することが難しいという課題があった。

さらに、従来の音声認識装置では、表示された音声認識結果が誤認識であると、ユーザの切り替え指示に応じて音声認識辞書を切り替えて、再度音声認識を行うようにしているものの、ユーザは、表示された音声認識結果を目視して誤認識であると、音声認識辞書切り替えの指示を入力しなければならず、入力音声を正しく認識した音声認識結果を得るための操作が煩わしく、しかも正しい音声認識結果を得るまでに時間を要してしまうことがある。特に、カーナビゲーション装置で用いられる音声認識装置においては、ユーザが運転中に音声認識辞書切り替え指示を入力するとなると運転に集中できないことがある。

この発明は上記のような課題を解決するためになされたもので、操作が簡単でしかも音声認識処理時間を短縮して認識率を向上させることのできる音声認識装置を得ることを目的とする。

この発明に係る音声認識装置は、予め定められた分類項目に応じた複数の音声認識辞書と音声認識結果が誤認識であるか否かを判定する誤認識判定手段と、誤認識判定手段で音声認識結果が誤認識であると判定されると音声認識辞書を切り替える認識辞書管理手段と、切り替え後の音声認識辞書を参照して入力音声を音声認識して音声認識結果を得る音声認識手段とを有することを特徴とするものである。

以上のように、この発明によれば、音声認識結果について誤認識であるか否かを判定して、誤認識であると判定すると、音声認識辞書を切り替えて音声認識処理を継続するように構成したので、ユーザが特別の操作を行うことなく、音声認識辞書を切り替えて音声認識を行うことができ、その結果、音声認識処理時間を短縮して認識率を向上させることができるという効果がある。

この発明の実施の形態１による音声認識装置の一例を示すブロック図である。図１に示す音声認識装置の動作の第１の例を説明するためのフローチャートである。図１に示す音声認識装置の動作の第２の例を説明するためのフローチャートである。図１に示す音声認識装置で用いられる音声認識辞書とその対応する地域とを示す地域分類テーブルの一例を示す図である。図１に示す音声認識装置の動作の第３の例を説明するためのフローチャートである。図１に示す音声認識装置で用いられる音声認識辞書とその優先順位とを示す優先地域分類テーブルの一例を示す図である。図１に示す音声認識装置の動作の第４の例を説明するためのフローチャートである。図１に示す音声認識装置で用いられる音声認識辞書の使用頻度を示す認識管理情報テーブルの一例を示す図である。図１に示す音声認識装置の動作の第５の例を説明するためのフローチャートである。

以下、この発明をより詳細に説明するために、この発明を実施するための最良の形態について、添付の図面に従って説明する。
実施の形態１．
図１は本発明の実施の形態１による音声認識装置の一例を示すブロック図であり、図示の音声認識装置１０は、例えば、カーナビゲーション装置において用いられる。図示の音声認識装置１０は、制御手段１１、キー入力手段１２、音声入力手段１３、入力音声記憶手段１４、誤認識判定手段１５、認識結果記憶手段１６、音声認識手段１７、認識語彙履歴記憶手段１８、認識辞書管理手段１９、画面出力手段２０、音声出力手段２１、及び位置検出手段２２を備えるとともに、複数の音声認識辞書２３−１乃至２３−Ｎ（Ｎは２以上の整数）を備えており、音声認識辞書２３−１乃至２３−Ｎには、後述するように、互いに異なる分類（例えば、地域分類又はジャンル分類）で語彙が格納されている。

キー入力手段１２には手動操作（手動入力）のためのリモコン／タッチパネル３１が接続され、音声入力手段１３には音声入力を行うためのマイク３２が接続されている。また、画面出力手段２０及び音声出力手段２１にはそれぞれモニタ３３及びスピーカー３４が接続されている。

キー入力手段１２はリモコン／タッチパネル３１からのキー入力を受け付けて、制御手段１１に渡し、音声入力手段１３はマイク３２からの音声を受け付けて、制御手段１１に渡す。制御手段１１は音声入力手段１３からの入力音声を受けると、この入力音声を入力音声記憶手段１４に格納するとともに、入力音声を音声認識手段１７に渡す。一方、認識辞書管理手段１９は制御手段１１の制御下で音声認識辞書２３−１乃至２３−Ｎのいずれか１つを選択音声認識辞書として選択し、音声認識手段１７では選択音声認識辞書を参照して入力音声について音声認識処理を行って音声認識結果を得る。

音声認識結果は制御手段１１を介して誤認識判定手段１５に送られて、誤認識判定手段１５は後述するようにして、音声認識結果が誤認識であるか否かを判定する。さらに、音声認識結果は認識結果記憶手段１６に記憶される。誤認識であると判定されると、誤認識判定結果が制御手段１１に渡されて、制御手段１１は誤認識判定結果を受けると、認識辞書管理手段１９を制御して別の音声認識辞書を選択音声認識辞書として選択する。また、制御手段１１は入力音声記憶手段１４から入力音声を読み込んで、音声認識手段１７に渡し、音声認識手段１７は選択音声認識辞書を参照して再度音声認識処理を行って、音声認識結果を得る。

このようにして、音声認識辞書を変更して音声認識処理が繰り返されて、誤認識判定手段１５で音声認識結果が誤認識でないと判定されると、当該音声認識結果が認識結果記憶手段１６から制御手段１１を介して画面出力手段２０及び／又は音声出力手段２１に渡されて、画像又はテロップとしてモニタ３３に表示されるとともに、スピーカー３４から音声として出力される。

なお、位置検出手段２２は、音声認識装置１０が車両等の移動体に搭載されている際、車両の現在地を検出して、車両現在地を制御手段１１に与える。そして、制御手段１１では後述するようにして、車両現在地に応じて認識辞書管理手段１９を制御して、音声認識辞書２３−１乃至２３−Ｎの内の１つを選択する。図示の例では、音声認識装置１０が位置検出手段２２を備えているが、音声認識装置１０は位置検出手段２２を備えず、カーナビゲーション装置（図示せず）から車両現在地を受けるようにしてもよい。

次に動作について説明する。
図１及び図２を参照して、制御手段１１は、キー入力手段１２を介してリモコン／タッチパネル３１の発話キー（図示せず）が押し下げられたか否かを監視しており（ステップＳＴ１）、発話キーが押し下げられると、音声入力手段１３で受け付けた入力音声Ｖ１を取得し（ステップＳＴ２）、その入力音声を入力音声記憶手段１４に記憶する（ステップＳＴ３）。

その後、制御手段１１は認識辞書管理手段１９を制御して予め規定された順序で音声認識辞書２３−１乃至２３−Ｎの１つを選択音声認識辞書として選択して（ここでは音声認識辞書２３−１乃至２３−Ｎの順に音声認識辞書が選択されるものとする）、入力音声を音声認識手段１７に渡す。音声認識手段１７では音声認識辞書２３−１を参照して入力音声Ｖ１について音声認識処理を行って、音声認識結果Ｗ１を得る（ステップＳＴ４）。

この音声認識結果Ｗ１は制御手段１１に渡され、制御手段１１は誤認識判定手段１５に渡す。そして、誤認識判定手段１５は音声認識結果Ｗ１が誤認識であるか否かを判定する（ステップＳＴ５）。誤認識判定手段１５では、入力音声の特徴の一致度合い（一致度）を用いて、音声認識結果Ｗ１が予め定められた一致度以上の一致度でないと誤認識であると判定する。

例えば、“０”（一致していない）〜“１００”（一致している）までの一致度を備えて、音声認識結果Ｗ１の一致度が５０以上でないと誤認識と規定する。これによって、音声認識結果Ｗ１について一致度が３０であると、誤認識判定手段１５は認識結果が誤認識であると判定し、音声認識結果Ｗ１について一致度が６０であると、誤認識でないと判定する。

誤認識判定手段１５は音声認識結果が誤認識であると判定すると、その旨制御手段１１に通知する。制御手段１１は認識辞書管理手段１９を制御して、認識辞書管理手段１９によって音声認識辞書２３−１から音声認識辞書２３−２に切り替えを行う（ステップＳＴ６）。その後、制御手段１１は入力音声記憶手段１４から入力音声Ｖ１を読み出して（音声取得：ステップＳＴ７）、処理はステップＳＴ４に戻り、音声認識手段１７では音声認識辞書２３−２を参照して入力音声Ｖ１について再度音声認識処理を行って、音声認識結果Ｗ２を得る。

この音声認識結果Ｗ２は認識結果記憶手段１６に記憶され、続いて、ステップＳＴ５において、誤認識判定手段１５によって音声認識結果Ｗ２について誤認識判定が行われる。そして、再度誤認識であると判定されると、ステップＳＴ６において音声認識辞書２３−２から音声認識辞書２３−３への切り替えが行われて、入力音声Ｖ１について音声認識辞書２３−３を参照して音声認識処理が行われることになる。

一方、ステップＳＴ５において、誤認識でないと判定されると、制御手段１１は当該音声認識結果を画面出力手段２０及び／又は音声出力手段２１に渡し、音声認識結果をモニタ３３に表示するとともに、スピーカー３４から出力する（認識結果提示：ステップＳＴ８）。

このようにして、音声認識結果について誤認識であるか否かを判定して、誤認識であると判定すると、音声認識辞書を切り替えて音声認識処理を続行するように構成したので、ユーザが特別の操作を行うことなく、音声認識辞書を切り替えて音声認識を行うことができ、音声認識処理時間を短縮して認識率を向上させることができる。

ところで、誤認識判定手段１５で誤認識でないと判定されて、その音声認識結果を例えば、モニタ３３に表示した際、ユーザが所望の音声認識結果ではないことがある。このため、ここでは、ステップＳＴ８で音声認識結果を提示した後、図２に“Ａ”で示すように、処理を分岐させる。

図３を参照して、制御手段１１ではステップＳＴ８で音声認識結果を提示した後、この音声認識結果に対して、キー入力手段１２又は音声入力手段１３からユーザ入力操作があったか否かを監視する（ステップＳＴ９）。そして、ユーザ入力操作があると、制御手段１１では、そのユーザ入力操作が音声認識結果に対して再認識処理を要求するような操作であるか否かを判定する（例えば、訂正操作又は次操作であるか否かを判定する：ステップＳＴ１０）。ユーザ入力操作が再認識処理の要求であると、制御手段１１は図２に“Ｂ”で示すように、ステップＳＴ６に戻って音声認識辞書の切り替えを行って、再び音声認識処理を行う。

このようにして、音声認識結果を提示した後、ユーザから再認識処理の要求があると、音声認識辞書を切り替えて再度音声認識処理を続行するように構成したので、ユーザが再度入力音声Ｖ１を発話することなく、入力音声Ｖ１に係る音声認識処理を行うことができ、ユーザ所望の音声認識結果を容易に得られるばかりでなく、認識率を向上できる。

続いて、音声認識装置１０が搭載された車両が走行する現在地に応じて音声認識辞書を切り替える例について説明する。いま、音声認識装置１０は音声認識辞書２３−１乃至２３−４を有しているものとし（つまり、Ｎ＝４である）、これら音声認識辞書２３−１乃至２３−４は、地域毎に分類されているものとする。例えば、図４に示すように、音声認識辞書２３−１、２３−２、２３−３、及び２３−４がそれぞれ地域分類（分類項目）：“北海道”、“東京”、“埼玉”、及び“大阪”に対応するものとする。そして、図４に示す地域分類テーブル（認識辞書管理情報）が認識辞書管理手段１９に設定されている。

ここでは、図２のステップＳＴ３で入力音声Ｖ１を入力音声記憶手段１４に記憶した後、図２に“Ｃ”で示すように、処理を分岐させる。図５を参照して、制御手段１１は車両現在地Ｃ１を位置検出手段２２から取得して（ステップＳＴ１１）、車両現在地Ｃ１に対応した音声認識辞書を選択すべく、認識辞書管理手段１９によって車両現在地Ｃに対応する音声認識辞書を選択する（認識辞書切り替え：ステップＳＴ１２）。例えば、車両現在地Ｃ１が東京であると、認識辞書管理手段１９は地域分類テーブルを参照して、認識辞書管理手段１９によって音声認識辞書２３−２を選択する。

その後、制御手段１１は入力音声記憶手段１４から入力音声Ｖ１を読み出して、音声認識手段１７に渡し、音声認識手段１７では音声認識辞書２３−２を参照して入力音声Ｖ１について音声認識処理を行って音声認識結果Ｗ１を得る（音声認識処理：ステップＳＴ１３）。この音声認識結果Ｗ１は制御手段１１に渡され、制御手段１１は音声認識結果Ｗ１を誤認識判定手段１５に渡す。誤認識判定手段１５は音声認識結果Ｗ１が誤認識であるか否かを判定する（ステップＳＴ１４）。

誤認識判定手段１５は音声認識結果が誤認識であると判定すると、その旨制御手段１１に通知する。制御手段１１は再度位置検出手段２２から車両現在地Ｃ２を取得する（ステップＳＴ１５）。そして、車両現在地Ｃ１と車両現在地Ｃ２とが異なっていると、地域分類テーブルを参照して、認識辞書管理手段１９は車両現在地Ｃ２に対応する都道府県の音声認識辞書を選択する（辞書切り替え：ステップＳＴ１６）。

一方、車両現在地Ｃ１と車両現在地Ｃ２とが異ならないと、認識辞書管理手段１９は地域分類テーブルを参照して車両現在地Ｃ２に近い都道府県に対応する音声認識辞書を選択する（例えば、車両現在地Ｃ２が東京であると、車両現在地Ｃ２に近い埼玉県に対応する音声認識辞書２３−３を選択する）。

続いて、制御手段１１は入力音声記憶手段１４から入力音声Ｖ１を読み出して（音声取得：ステップＳＴ１７）、処理はステップＳＴ１３に戻り、音声認識手段１７では選択された音声認識辞書を参照して入力音声Ｖ１について再度音声認識処理を行って、音声認識結果Ｗ２を得る。そして、ステップＳＴ１４において、誤認識判定手段１５によって音声認識結果Ｗ２について誤認識判定が行われる。そして、再度誤認識であると判定されると、ステップＳＴ１５において制御手段１１は再度位置検出手段２２から車両現在地を取得して、音声認識辞書の切り替えを行う。

一方、ステップＳＴ１４において、誤認識でないと判定されると、制御手段１１は当該音声認識結果を画面出力手段２０及び／又は音声出力手段２１に渡し、音声認識結果をモニタ３３に表示するとともに、スピーカー３４から出力する（認識結果提示：ステップＳＴ１８）。

このようにして、音声認識辞書を地域毎に予め分類しておき、車両現在地に応じて音声認識辞書を切り替えるように構成したので、車両現在地に最適な音声認識辞書を用いて音声認識を行うことができ、その結果、音声認識処理時間を短縮して認識率を向上させることができる。

ところで、図４に示す地域分類テーブルにおいて、ユーザは音声認識辞書毎の優先度を、例えば、リモコン／タッチパネル３１を用いて設定することができる。図６は優先度を有する地域分類テーブル（認識辞書管理情報：優先度地域分類テーブル）の一例を示す図であり、図示の例では、“北海道、“東京”、“埼玉”、及び“大阪”はそれぞれ優先度“４”、“１”、“３”、及び“２”に設定されている。優先度が設定された際には、図２に示すステップＳＴ６で音声認識辞書の切り替えを行う際、音声認識辞書管理手段１９では優先度地域分類テーブルを参照して優先度を判定し、優先度の高い順に音声認識辞書を切り替える。

このようにして、音声認識辞書毎に優先度を規定しておけば、優先度の高い音声認識辞書から順次用いられることになって、音声認識処理速度を向上できるばかりでなく、認識率を向上できる。

ここで、図７を参照して、いま、図２のステップＳＴ５において、誤認識判定手段１５で音声認識結果に誤認識がないと判定された際、図２に“Ｄ”で示すように、処理を分岐させるようにしてもよい。つまり、ステップＳＴ５において、誤認識ではないと判定されると、図７に示すステップＳＴ１９に進む。ステップＳＴ１９では、誤認識ではない旨（否誤認識信号）が制御手段１１を介して認識辞書管理手段１９に与えられて、認識辞書管理手段１９は図８に示す認識管理情報テーブルを更新する。

ここでは、この認識管理情報テーブルは認識語彙履歴記憶手段１８に認識語彙履歴情報として記憶されており、認識辞書管理手段１９は、否誤認識信号に応答して音声認識処理の際に使用した音声認識辞書に対応する認識回数を１カウントアップする（認識回数の記憶：ステップＳＴ１９）。

図８に示す例では、分類項目として、“コンビニ”、“ガソリンスタンド”及び“ファミリーレストラン”が用いられており、“コンビニ”、“ガソリンスタンド”及び“ファミリーレストラン”にそれぞれ音声認識辞書２３−１、２３−２、及び２３−３が対応している。

上述のようにして、認識回数が記憶されると、制御手段１１は当該音声認識結果を画面出力手段２０及び／又は音声出力手段２１に渡し、音声認識結果をモニタ３３に表示するとともに、スピーカー３４から出力する（認識結果提示：ステップＳＴ２０）。その後、音声認識処理を行う際において、認識辞書の切り替えを行う際には、図２のステップＳＴ６において、認識辞書管理手段１９は認識管理情報テーブルを参照して認識回数の多い音声認識辞書から順に選択する。

このようにして、誤認識でないと判定された際に使用した音声認識辞書に対応付けて認識回数を記憶して、音声認識処理の際認識回数の多い音声認識辞書から順に使用するように構成したので、ユーザの使用頻度が高い語彙を含む音声認識辞書が用いられることになって、音声認識処理速度を向上できるばかりでなく、認識率を向上できる。

続いて、図１及び図９を参照して、図１及び図２を参照して、制御手段１１はキー入力手段１２を介してリモコン／タッチパネル３１の発話キーが押し下げられたか否かを監視しており（ステップＳＴ２１）、発話キーが押し下げられると、制御手段１１は認識結果記憶手段１６をリセットして（認識結果削除：ステップＳＴ２２）、音声入力手段１３で受け付けた入力音声Ｖ１を取得し（ステップＳＴ２３）、その入力音声を入力音声記憶手段１４に記憶する（ステップＳＴ２４）。

その後、制御手段１１は認識辞書管理手段１９を制御して予め規定された順序で音声認識辞書２３−１乃至２３−Ｎの１つを選択音声認識辞書として選択して（ここでは音声認識辞書２３−１乃至２３−Ｎの順に音声認識辞書が選択される）、入力音声を音声認識手段１７に渡す。音声認識手段１７では音声認識辞書２３−１を参照して入力音声Ｖ１について音声認識処理を行って、音声認識結果Ｗ１を得る（認識処理：ステップＳＴ２５）。

この音声認識結果Ｗ１は制御手段１１に渡され、制御手段１１は音声認識結果Ｗ１を認識結果記憶手段１６に記憶するとともに（ステップＳＴ２６）、誤認識判定手段１５に渡す。そして、誤認識判定手段１５は音声認識結果Ｗ１が誤認識であるか否かを判定する（ステップＳＴ２７）。

誤認識判定手段１５は音声認識結果が誤認識であると判定すると、その旨制御手段１１に通知する。制御手段１１は認識辞書管理手段１９を制御して、認識辞書管理手段１９によって音声認識辞書２３−１から音声認識辞書２３−２に切り替えを行う（ステップＳＴ２８）。その後、制御手段１１は入力音声記憶手段１４から入力音声Ｖ１を読み出して（音声取得：ステップＳＴ２９）、処理はステップＳＴ４に戻る。音声認識手段１７では音声認識辞書２３−２を参照して入力音声Ｖ１について再度音声認識処理を行って、音声認識結果Ｗ２を得る。

この音声認識結果Ｗ２は、ステップＳＴ２６で認識結果記憶手段１６に記憶され、続いて、ステップＳＴ２７において、誤認識判定手段１５によって音声認識結果Ｗ２について誤認識判定が行われる。そして、再度誤認識であると判定されると、ステップＳＴ２８において音声認識辞書２３−２から音声認識辞書２３−３への切り替えが行われて、入力音声Ｖ１について音声認識辞書２３−３を参照して音声認識処理が行われることになる。

一方、ステップＳＴ２７において、誤認識でないと判定されると、制御手段１１は認識結果記憶手段１６に格納された全音声認識結果を取得して（ステップＳＴ３０）、画面出力手段２０及び／又は音声出力手段２１に渡し、全音声認識結果をモニタ３３に表示するとともに、スピーカー３４から出力する（ステップＳＴ３１）。

このようにして、誤認識であるか否かに拘らず、音声認識結果を認識結果記憶手段に記憶して、誤認識でないと判定された際に、全ての音声認識結果を認識結果記憶手段から読み出して提示するように構成したので、ユーザは音声認識辞書切り替え毎の音声認識結果の全ての閲覧することができ、これら音声認識結果からユーザ所望の音声認識結果を選択できる。その結果、認識率を向上させることができる。

以上のように、この実施の形態１によれば、音声認識結果が誤認識である際、音声認識辞書を切り替えて再度音声認識処理を行うようにしたので、特別の操作を行うことなく、音声認識処理時間を短縮して認識率を向上させることができるという効果がある。

この実施の形態１によれば、音声認識結果を提示された後、再認識処理の要求があると、音声認識辞書を切り替えて再度音声認識処理を行うようにしたので、ユーザ所望の音声認識結果を容易に得られるばかりでなく、認識率を向上できるという効果がある。

この実施の形態１によれば、地域毎に音声認識辞書を備えて、現在地に応じて音声認識辞書を切り替えるようにしたので、現在地に最適な音声認識辞書を用いて音声認識を行うことができるという効果がある。

この実施の形態１によれば、音声認識辞書毎に優先度を有しているので、優先度の高い音声認識辞書を用いて音声認識が行われる結果、認識率を向上できるという効果がある。

この実施の形態１によれば、誤認識でないと判定された際の音声認識辞書の使用履歴を記憶して、当該使用履歴に基づいて音声認識辞書を選択するようにしたので、使用頻度が高い音声認識辞書が用いられることになって、認識率を向上できるという効果がある。

この実施の形態１によれば、音声認識結果を記憶して、誤認識でないと判定された際に全ての音声認識結果を提示するようにしたので、音声認識辞書切り替え毎の音声認識結果の全ての閲覧することができ、これら音声認識結果からユーザ所望の音声認識結果を選択できるという効果がある。

以上のように、この発明に係る音声認識装置は、操作が簡単でしかも音声認識処理時間を短縮して認識率を向上させることができ、例えばカーナビゲーション装置等で用いられる音声認識装置に用いるのに適している。

Claims

音声認識辞書を参照して入力音声を音声認識して音声認識結果を出力する音声認識装置において、
予め定められた分類項目に応じた複数の音声認識辞書と、
前記音声認識結果が誤認識であるか否かを判定する誤認識判定手段と、
該誤認識判定手段で前記音声認識結果が誤認識であると判定されると前記音声認識辞書を切り替える認識辞書管理手段と、
切り替え後の音声認識辞書を参照して前記入力音声を音声認識して前記音声認識結果を得る音声手段とを有することを特徴とする音声認識装置。
誤認識判定手段で誤認識でないと判定された音声認識結果を提示する提示手段とを有し、
該提示手段に提示された音声認識結果が非適切であることを示す入力コマンドを受けると、認識辞書管理手段は音声認識辞書を切り替えるようにしたことを特徴とする請求項１記載の音声認識装置。
分類項目として地域を用いた音声認識辞書は予め定められた地域毎に備えられ、
移動体に搭載され、該移動体の現在地を検出する位置検出手段を有し、
認識辞書管理手段は前記位置検出手段で検出された現在地に対応する地域に応じて前記音声認識辞書の切り替えを行うようにしたことを特徴とする請求項１記載の音声認識装置。
音声認識辞書の使用優先度を規定する辞書管理情報を有し、
前記認識辞書管理手段は前記辞書管理情報を参照して前記音声認識辞書の切り替えを行うようにしたことを特徴とする請求項１記載の音声認識装置。
誤認識判定手段で誤認識でないと判定された音声認識結果を音声認識した際に用いた音声認識辞書についてその使用履歴を記憶する認識語彙記憶手段を有し、
認識辞書管理手段は前記認識語彙記憶手段に記憶された使用履歴に応じて前記音声認識辞書の切り替えを行うようにしたことを特徴とする請求項１記載の音声認識装置。
音声認識結果を提示する提示手段と、
前記音声認識結果を記憶する認識結果記憶手段と、
誤認識判定手段で音声認識結果が誤認識でないと判定された際前記認識結果記憶手段に記憶された音声認識結果の全てを読み出して前記提示手段に提示する制御手段とを有することを特徴とする請求項１記載の音声認識装置。