JPWO2007069372A1 - 音声認識装置 - Google Patents

音声認識装置 Download PDF

Info

Publication number
JPWO2007069372A1
JPWO2007069372A1 JP2007550083A JP2007550083A JPWO2007069372A1 JP WO2007069372 A1 JPWO2007069372 A1 JP WO2007069372A1 JP 2007550083 A JP2007550083 A JP 2007550083A JP 2007550083 A JP2007550083 A JP 2007550083A JP WO2007069372 A1 JPWO2007069372 A1 JP WO2007069372A1
Authority
JP
Japan
Prior art keywords
speech recognition
recognition
speech
dictionary
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007550083A
Other languages
English (en)
Other versions
JP4855421B2 (ja
Inventor
悠希 住吉
悠希 住吉
玲子 岡田
玲子 岡田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2007550083A priority Critical patent/JP4855421B2/ja
Publication of JPWO2007069372A1 publication Critical patent/JPWO2007069372A1/ja
Application granted granted Critical
Publication of JP4855421B2 publication Critical patent/JP4855421B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Navigation (AREA)
  • Traffic Control Systems (AREA)

Abstract

音声認識装置10は、音声認識辞書を参照して入力音声を音声認識して音声認識結果を出力する。この音声認識装置では、音声認識辞書23−1〜23−Nは予め定められた分類項目に応じて複数備えられ、さらに、音声認識装置は音声認識辞書のうち1つを参照して入力音声を音声認識して前記音声認識結果を得る音声認識手段17と、音声認識結果が誤認識であるか否かを判定する誤認識判定手段15と、誤認識判定手段で音声認識結果が誤認識であると判定されると音声認識辞書を切り替える認識辞書管理手段19と、切り替え後の音声認識辞書を参照して入力音声を音声認識して音声認識結果を得る音声認識手段17とを有している。

Description

この発明は、複数の音声認識辞書を備えて、音声認識を行う音声認識装置に関し、特に、カーナビゲーション装置等で用いられる音声認識装置に関するものである。
一般に、音声認識装置においては、音声認識辞書に登録された単語(語彙)を参照して音声認識を行っており、音声認識率を向上させるためには音声認識辞書に多数の単語を登録する必要があるものの、1つの音声認識辞書に多数の語彙を登録すると、音声認識を行う際に行われる音声認識辞書の検索に時間が掛かり、音声認識処理に要する時間が増加してしまう(つまり、音声認識処理速度が低下してしまう)。一方、音声認識辞書に登録する語彙数を少なくすると、音声認識辞書の検索に要する時間は短縮されるものの、今度は音声認識率が低下してしまう。
このため、複数の音声認識辞書を備えて、順次音声認識辞書を検索して音声認識辞書の検索に要する時間を短縮するとともに、音声認識率を向上させるようにしたものがある。
例えば、不特定話者が入力した音声の特徴と、複数の音声辞書ファイル(音声認識辞書)の中から選択した音声辞書ファイルに収められている音声の特徴とを比較し、その一致度が基準値に達する語彙を検出する際、一致度の基準値に達する語彙が存在しない場合、一致度の相対的に高い語彙を語彙候補として記憶して、音声辞書ファイルの選択を切換え、入力音声の特徴と、切換えられた音声辞書ファイルに収められている語彙候補に対応する入力音声の特徴とを比較して一致度を判定して、最初に設定した音声辞書ファイル中から一致度が基準値に達する語彙を見付けることができない場合、音声辞書ファイルを切換えつつ、入力音声の照合を繰り返し、正解を見付けるための認識処理を続行するようにしたものがある(例えば、特許文献1参照)。
さらに、誤認識された際に音声認識辞書の指定を変更して認識し直す場合、音声が入力されると、その音声を音声記憶部に記憶しておくとともに、音声認識部で認識処理を行って認識結果を表示して、その結果が誤認識であるため、ユーザが認識辞書の切替え指示を行うと、認識結果制御部が認識辞書制御部に音声認識辞書を切替えさせて、音声記憶部に記憶されている音声を音声認識部に認識処理させるようにしたものがある(例えば、特許文献2参照)。
特開平6−318097号公報(第2頁〜第3頁、第1図〜第4図) 特開2000−200093公報(第3頁〜第5頁、第1図〜第5図)
従来の音声認識装置は以上のように構成されているので、つまり、不特定話者が入力した音声の特徴(トーン)に応じて音声認識辞書を切り替えるようにしており、入力音声の特徴と音声認識辞書に格納された音声の特徴との一致度が基準値に達するまで、音声認識辞書を切り替えて入力音声の照合を行っているだけで、たとえ、複数の音声認識辞書を備えているとしても、入力音声の認識率を向上させるためには、各音声認識辞書に多数の語彙を格納しておかなければならず、音声認識辞書の検索に要する時間を短縮することが難しいという課題があった。
さらに、従来の音声認識装置では、表示された音声認識結果が誤認識であると、ユーザの切り替え指示に応じて音声認識辞書を切り替えて、再度音声認識を行うようにしているものの、ユーザは、表示された音声認識結果を目視して誤認識であると、音声認識辞書切り替えの指示を入力しなければならず、入力音声を正しく認識した音声認識結果を得るための操作が煩わしく、しかも正しい音声認識結果を得るまでに時間を要してしまうことがある。特に、カーナビゲーション装置で用いられる音声認識装置においては、ユーザが運転中に音声認識辞書切り替え指示を入力するとなると運転に集中できないことがある。
この発明は上記のような課題を解決するためになされたもので、操作が簡単でしかも音声認識処理時間を短縮して認識率を向上させることのできる音声認識装置を得ることを目的とする。
この発明に係る音声認識装置は、予め定められた分類項目に応じた複数の音声認識辞書と音声認識結果が誤認識であるか否かを判定する誤認識判定手段と、誤認識判定手段で音声認識結果が誤認識であると判定されると音声認識辞書を切り替える認識辞書管理手段と、切り替え後の音声認識辞書を参照して入力音声を音声認識して音声認識結果を得る音声認識手段とを有することを特徴とするものである。
以上のように、この発明によれば、音声認識結果について誤認識であるか否かを判定して、誤認識であると判定すると、音声認識辞書を切り替えて音声認識処理を継続するように構成したので、ユーザが特別の操作を行うことなく、音声認識辞書を切り替えて音声認識を行うことができ、その結果、音声認識処理時間を短縮して認識率を向上させることができるという効果がある。
この発明の実施の形態1による音声認識装置の一例を示すブロック図である。 図1に示す音声認識装置の動作の第1の例を説明するためのフローチャートである。 図1に示す音声認識装置の動作の第2の例を説明するためのフローチャートである。 図1に示す音声認識装置で用いられる音声認識辞書とその対応する地域とを示す地域分類テーブルの一例を示す図である。 図1に示す音声認識装置の動作の第3の例を説明するためのフローチャートである。 図1に示す音声認識装置で用いられる音声認識辞書とその優先順位とを示す優先地域分類テーブルの一例を示す図である。 図1に示す音声認識装置の動作の第4の例を説明するためのフローチャートである。 図1に示す音声認識装置で用いられる音声認識辞書の使用頻度を示す認識管理情報テーブルの一例を示す図である。 図1に示す音声認識装置の動作の第5の例を説明するためのフローチャートである。
以下、この発明をより詳細に説明するために、この発明を実施するための最良の形態について、添付の図面に従って説明する。
実施の形態1.
図1は本発明の実施の形態1による音声認識装置の一例を示すブロック図であり、図示の音声認識装置10は、例えば、カーナビゲーション装置において用いられる。図示の音声認識装置10は、制御手段11、キー入力手段12、音声入力手段13、入力音声記憶手段14、誤認識判定手段15、認識結果記憶手段16、音声認識手段17、認識語彙履歴記憶手段18、認識辞書管理手段19、画面出力手段20、音声出力手段21、及び位置検出手段22を備えるとともに、複数の音声認識辞書23−1乃至23−N(Nは2以上の整数)を備えており、音声認識辞書23−1乃至23−Nには、後述するように、互いに異なる分類(例えば、地域分類又はジャンル分類)で語彙が格納されている。
キー入力手段12には手動操作(手動入力)のためのリモコン/タッチパネル31が接続され、音声入力手段13には音声入力を行うためのマイク32が接続されている。また、画面出力手段20及び音声出力手段21にはそれぞれモニタ33及びスピーカー34が接続されている。
キー入力手段12はリモコン/タッチパネル31からのキー入力を受け付けて、制御手段11に渡し、音声入力手段13はマイク32からの音声を受け付けて、制御手段11に渡す。制御手段11は音声入力手段13からの入力音声を受けると、この入力音声を入力音声記憶手段14に格納するとともに、入力音声を音声認識手段17に渡す。一方、認識辞書管理手段19は制御手段11の制御下で音声認識辞書23−1乃至23−Nのいずれか1つを選択音声認識辞書として選択し、音声認識手段17では選択音声認識辞書を参照して入力音声について音声認識処理を行って音声認識結果を得る。
音声認識結果は制御手段11を介して誤認識判定手段15に送られて、誤認識判定手段15は後述するようにして、音声認識結果が誤認識であるか否かを判定する。さらに、音声認識結果は認識結果記憶手段16に記憶される。誤認識であると判定されると、誤認識判定結果が制御手段11に渡されて、制御手段11は誤認識判定結果を受けると、認識辞書管理手段19を制御して別の音声認識辞書を選択音声認識辞書として選択する。また、制御手段11は入力音声記憶手段14から入力音声を読み込んで、音声認識手段17に渡し、音声認識手段17は選択音声認識辞書を参照して再度音声認識処理を行って、音声認識結果を得る。
このようにして、音声認識辞書を変更して音声認識処理が繰り返されて、誤認識判定手段15で音声認識結果が誤認識でないと判定されると、当該音声認識結果が認識結果記憶手段16から制御手段11を介して画面出力手段20及び/又は音声出力手段21に渡されて、画像又はテロップとしてモニタ33に表示されるとともに、スピーカー34から音声として出力される。
なお、位置検出手段22は、音声認識装置10が車両等の移動体に搭載されている際、車両の現在地を検出して、車両現在地を制御手段11に与える。そして、制御手段11では後述するようにして、車両現在地に応じて認識辞書管理手段19を制御して、音声認識辞書23−1乃至23−Nの内の1つを選択する。図示の例では、音声認識装置10が位置検出手段22を備えているが、音声認識装置10は位置検出手段22を備えず、カーナビゲーション装置(図示せず)から車両現在地を受けるようにしてもよい。
次に動作について説明する。
図1及び図2を参照して、制御手段11は、キー入力手段12を介してリモコン/タッチパネル31の発話キー(図示せず)が押し下げられたか否かを監視しており(ステップST1)、発話キーが押し下げられると、音声入力手段13で受け付けた入力音声V1を取得し(ステップST2)、その入力音声を入力音声記憶手段14に記憶する(ステップST3)。
その後、制御手段11は認識辞書管理手段19を制御して予め規定された順序で音声認識辞書23−1乃至23−Nの1つを選択音声認識辞書として選択して(ここでは音声認識辞書23−1乃至23−Nの順に音声認識辞書が選択されるものとする)、入力音声を音声認識手段17に渡す。音声認識手段17では音声認識辞書23−1を参照して入力音声V1について音声認識処理を行って、音声認識結果W1を得る(ステップST4)。
この音声認識結果W1は制御手段11に渡され、制御手段11は誤認識判定手段15に渡す。そして、誤認識判定手段15は音声認識結果W1が誤認識であるか否かを判定する(ステップST5)。誤認識判定手段15では、入力音声の特徴の一致度合い(一致度)を用いて、音声認識結果W1が予め定められた一致度以上の一致度でないと誤認識であると判定する。
例えば、“0”(一致していない)〜“100”(一致している)までの一致度を備えて、音声認識結果W1の一致度が50以上でないと誤認識と規定する。これによって、音声認識結果W1について一致度が30であると、誤認識判定手段15は認識結果が誤認識であると判定し、音声認識結果W1について一致度が60であると、誤認識でないと判定する。
誤認識判定手段15は音声認識結果が誤認識であると判定すると、その旨制御手段11に通知する。制御手段11は認識辞書管理手段19を制御して、認識辞書管理手段19によって音声認識辞書23−1から音声認識辞書23−2に切り替えを行う(ステップST6)。その後、制御手段11は入力音声記憶手段14から入力音声V1を読み出して(音声取得:ステップST7)、処理はステップST4に戻り、音声認識手段17では音声認識辞書23−2を参照して入力音声V1について再度音声認識処理を行って、音声認識結果W2を得る。
この音声認識結果W2は認識結果記憶手段16に記憶され、続いて、ステップST5において、誤認識判定手段15によって音声認識結果W2について誤認識判定が行われる。そして、再度誤認識であると判定されると、ステップST6において音声認識辞書23−2から音声認識辞書23−3への切り替えが行われて、入力音声V1について音声認識辞書23−3を参照して音声認識処理が行われることになる。
一方、ステップST5において、誤認識でないと判定されると、制御手段11は当該音声認識結果を画面出力手段20及び/又は音声出力手段21に渡し、音声認識結果をモニタ33に表示するとともに、スピーカー34から出力する(認識結果提示:ステップST8)。
このようにして、音声認識結果について誤認識であるか否かを判定して、誤認識であると判定すると、音声認識辞書を切り替えて音声認識処理を続行するように構成したので、ユーザが特別の操作を行うことなく、音声認識辞書を切り替えて音声認識を行うことができ、音声認識処理時間を短縮して認識率を向上させることができる。
ところで、誤認識判定手段15で誤認識でないと判定されて、その音声認識結果を例えば、モニタ33に表示した際、ユーザが所望の音声認識結果ではないことがある。このため、ここでは、ステップST8で音声認識結果を提示した後、図2に“A”で示すように、処理を分岐させる。
図3を参照して、制御手段11ではステップST8で音声認識結果を提示した後、この音声認識結果に対して、キー入力手段12又は音声入力手段13からユーザ入力操作があったか否かを監視する(ステップST9)。そして、ユーザ入力操作があると、制御手段11では、そのユーザ入力操作が音声認識結果に対して再認識処理を要求するような操作であるか否かを判定する(例えば、訂正操作又は次操作であるか否かを判定する:ステップST10)。ユーザ入力操作が再認識処理の要求であると、制御手段11は図2に“B”で示すように、ステップST6に戻って音声認識辞書の切り替えを行って、再び音声認識処理を行う。
このようにして、音声認識結果を提示した後、ユーザから再認識処理の要求があると、音声認識辞書を切り替えて再度音声認識処理を続行するように構成したので、ユーザが再度入力音声V1を発話することなく、入力音声V1に係る音声認識処理を行うことができ、ユーザ所望の音声認識結果を容易に得られるばかりでなく、認識率を向上できる。
続いて、音声認識装置10が搭載された車両が走行する現在地に応じて音声認識辞書を切り替える例について説明する。いま、音声認識装置10は音声認識辞書23−1乃至23−4を有しているものとし(つまり、N=4である)、これら音声認識辞書23−1乃至23−4は、地域毎に分類されているものとする。例えば、図4に示すように、音声認識辞書23−1、23−2、23−3、及び23−4がそれぞれ地域分類(分類項目):“北海道”、“東京”、“埼玉”、及び“大阪”に対応するものとする。そして、図4に示す地域分類テーブル(認識辞書管理情報)が認識辞書管理手段19に設定されている。
ここでは、図2のステップST3で入力音声V1を入力音声記憶手段14に記憶した後、図2に“C”で示すように、処理を分岐させる。図5を参照して、制御手段11は車両現在地C1を位置検出手段22から取得して(ステップST11)、車両現在地C1に対応した音声認識辞書を選択すべく、認識辞書管理手段19によって車両現在地Cに対応する音声認識辞書を選択する(認識辞書切り替え:ステップST12)。例えば、車両現在地C1が東京であると、認識辞書管理手段19は地域分類テーブルを参照して、認識辞書管理手段19によって音声認識辞書23−2を選択する。
その後、制御手段11は入力音声記憶手段14から入力音声V1を読み出して、音声認識手段17に渡し、音声認識手段17では音声認識辞書23−2を参照して入力音声V1について音声認識処理を行って音声認識結果W1を得る(音声認識処理:ステップST13)。この音声認識結果W1は制御手段11に渡され、制御手段11は音声認識結果W1を誤認識判定手段15に渡す。誤認識判定手段15は音声認識結果W1が誤認識であるか否かを判定する(ステップST14)。
誤認識判定手段15は音声認識結果が誤認識であると判定すると、その旨制御手段11に通知する。制御手段11は再度位置検出手段22から車両現在地C2を取得する(ステップST15)。そして、車両現在地C1と車両現在地C2とが異なっていると、地域分類テーブルを参照して、認識辞書管理手段19は車両現在地C2に対応する都道府県の音声認識辞書を選択する(辞書切り替え:ステップST16)。
一方、車両現在地C1と車両現在地C2とが異ならないと、認識辞書管理手段19は地域分類テーブルを参照して車両現在地C2に近い都道府県に対応する音声認識辞書を選択する(例えば、車両現在地C2が東京であると、車両現在地C2に近い埼玉県に対応する音声認識辞書23−3を選択する)。
続いて、制御手段11は入力音声記憶手段14から入力音声V1を読み出して(音声取得:ステップST17)、処理はステップST13に戻り、音声認識手段17では選択された音声認識辞書を参照して入力音声V1について再度音声認識処理を行って、音声認識結果W2を得る。そして、ステップST14において、誤認識判定手段15によって音声認識結果W2について誤認識判定が行われる。そして、再度誤認識であると判定されると、ステップST15において制御手段11は再度位置検出手段22から車両現在地を取得して、音声認識辞書の切り替えを行う。
一方、ステップST14において、誤認識でないと判定されると、制御手段11は当該音声認識結果を画面出力手段20及び/又は音声出力手段21に渡し、音声認識結果をモニタ33に表示するとともに、スピーカー34から出力する(認識結果提示:ステップST18)。
このようにして、音声認識辞書を地域毎に予め分類しておき、車両現在地に応じて音声認識辞書を切り替えるように構成したので、車両現在地に最適な音声認識辞書を用いて音声認識を行うことができ、その結果、音声認識処理時間を短縮して認識率を向上させることができる。
ところで、図4に示す地域分類テーブルにおいて、ユーザは音声認識辞書毎の優先度を、例えば、リモコン/タッチパネル31を用いて設定することができる。図6は優先度を有する地域分類テーブル(認識辞書管理情報:優先度地域分類テーブル)の一例を示す図であり、図示の例では、“北海道、“東京”、“埼玉”、及び“大阪”はそれぞれ優先度“4”、“1”、“3”、及び“2”に設定されている。優先度が設定された際には、図2に示すステップST6で音声認識辞書の切り替えを行う際、音声認識辞書管理手段19では優先度地域分類テーブルを参照して優先度を判定し、優先度の高い順に音声認識辞書を切り替える。
このようにして、音声認識辞書毎に優先度を規定しておけば、優先度の高い音声認識辞書から順次用いられることになって、音声認識処理速度を向上できるばかりでなく、認識率を向上できる。
ここで、図7を参照して、いま、図2のステップST5において、誤認識判定手段15で音声認識結果に誤認識がないと判定された際、図2に“D”で示すように、処理を分岐させるようにしてもよい。つまり、ステップST5において、誤認識ではないと判定されると、図7に示すステップST19に進む。ステップST19では、誤認識ではない旨(否誤認識信号)が制御手段11を介して認識辞書管理手段19に与えられて、認識辞書管理手段19は図8に示す認識管理情報テーブルを更新する。
ここでは、この認識管理情報テーブルは認識語彙履歴記憶手段18に認識語彙履歴情報として記憶されており、認識辞書管理手段19は、否誤認識信号に応答して音声認識処理の際に使用した音声認識辞書に対応する認識回数を1カウントアップする(認識回数の記憶:ステップST19)。
図8に示す例では、分類項目として、“コンビニ”、“ガソリンスタンド”及び“ファミリーレストラン”が用いられており、“コンビニ”、“ガソリンスタンド”及び“ファミリーレストラン”にそれぞれ音声認識辞書23−1、23−2、及び23−3が対応している。
上述のようにして、認識回数が記憶されると、制御手段11は当該音声認識結果を画面出力手段20及び/又は音声出力手段21に渡し、音声認識結果をモニタ33に表示するとともに、スピーカー34から出力する(認識結果提示:ステップST20)。その後、音声認識処理を行う際において、認識辞書の切り替えを行う際には、図2のステップST6において、認識辞書管理手段19は認識管理情報テーブルを参照して認識回数の多い音声認識辞書から順に選択する。
このようにして、誤認識でないと判定された際に使用した音声認識辞書に対応付けて認識回数を記憶して、音声認識処理の際認識回数の多い音声認識辞書から順に使用するように構成したので、ユーザの使用頻度が高い語彙を含む音声認識辞書が用いられることになって、音声認識処理速度を向上できるばかりでなく、認識率を向上できる。
続いて、図1及び図9を参照して、図1及び図2を参照して、制御手段11はキー入力手段12を介してリモコン/タッチパネル31の発話キーが押し下げられたか否かを監視しており(ステップST21)、発話キーが押し下げられると、制御手段11は認識結果記憶手段16をリセットして(認識結果削除:ステップST22)、音声入力手段13で受け付けた入力音声V1を取得し(ステップST23)、その入力音声を入力音声記憶手段14に記憶する(ステップST24)。
その後、制御手段11は認識辞書管理手段19を制御して予め規定された順序で音声認識辞書23−1乃至23−Nの1つを選択音声認識辞書として選択して(ここでは音声認識辞書23−1乃至23−Nの順に音声認識辞書が選択される)、入力音声を音声認識手段17に渡す。音声認識手段17では音声認識辞書23−1を参照して入力音声V1について音声認識処理を行って、音声認識結果W1を得る(認識処理:ステップST25)。
この音声認識結果W1は制御手段11に渡され、制御手段11は音声認識結果W1を認識結果記憶手段16に記憶するとともに(ステップST26)、誤認識判定手段15に渡す。そして、誤認識判定手段15は音声認識結果W1が誤認識であるか否かを判定する(ステップST27)。
誤認識判定手段15は音声認識結果が誤認識であると判定すると、その旨制御手段11に通知する。制御手段11は認識辞書管理手段19を制御して、認識辞書管理手段19によって音声認識辞書23−1から音声認識辞書23−2に切り替えを行う(ステップST28)。その後、制御手段11は入力音声記憶手段14から入力音声V1を読み出して(音声取得:ステップST29)、処理はステップST4に戻る。音声認識手段17では音声認識辞書23−2を参照して入力音声V1について再度音声認識処理を行って、音声認識結果W2を得る。
この音声認識結果W2は、ステップST26で認識結果記憶手段16に記憶され、続いて、ステップST27において、誤認識判定手段15によって音声認識結果W2について誤認識判定が行われる。そして、再度誤認識であると判定されると、ステップST28において音声認識辞書23−2から音声認識辞書23−3への切り替えが行われて、入力音声V1について音声認識辞書23−3を参照して音声認識処理が行われることになる。
一方、ステップST27において、誤認識でないと判定されると、制御手段11は認識結果記憶手段16に格納された全音声認識結果を取得して(ステップST30)、画面出力手段20及び/又は音声出力手段21に渡し、全音声認識結果をモニタ33に表示するとともに、スピーカー34から出力する(ステップST31)。
このようにして、誤認識であるか否かに拘らず、音声認識結果を認識結果記憶手段に記憶して、誤認識でないと判定された際に、全ての音声認識結果を認識結果記憶手段から読み出して提示するように構成したので、ユーザは音声認識辞書切り替え毎の音声認識結果の全ての閲覧することができ、これら音声認識結果からユーザ所望の音声認識結果を選択できる。その結果、認識率を向上させることができる。
以上のように、この実施の形態1によれば、音声認識結果が誤認識である際、音声認識辞書を切り替えて再度音声認識処理を行うようにしたので、特別の操作を行うことなく、音声認識処理時間を短縮して認識率を向上させることができるという効果がある。
この実施の形態1によれば、音声認識結果を提示された後、再認識処理の要求があると、音声認識辞書を切り替えて再度音声認識処理を行うようにしたので、ユーザ所望の音声認識結果を容易に得られるばかりでなく、認識率を向上できるという効果がある。
この実施の形態1によれば、地域毎に音声認識辞書を備えて、現在地に応じて音声認識辞書を切り替えるようにしたので、現在地に最適な音声認識辞書を用いて音声認識を行うことができるという効果がある。
この実施の形態1によれば、音声認識辞書毎に優先度を有しているので、優先度の高い音声認識辞書を用いて音声認識が行われる結果、認識率を向上できるという効果がある。
この実施の形態1によれば、誤認識でないと判定された際の音声認識辞書の使用履歴を記憶して、当該使用履歴に基づいて音声認識辞書を選択するようにしたので、使用頻度が高い音声認識辞書が用いられることになって、認識率を向上できるという効果がある。
この実施の形態1によれば、音声認識結果を記憶して、誤認識でないと判定された際に全ての音声認識結果を提示するようにしたので、音声認識辞書切り替え毎の音声認識結果の全ての閲覧することができ、これら音声認識結果からユーザ所望の音声認識結果を選択できるという効果がある。
以上のように、この発明に係る音声認識装置は、操作が簡単でしかも音声認識処理時間を短縮して認識率を向上させることができ、例えばカーナビゲーション装置等で用いられる音声認識装置に用いるのに適している。

Claims (6)

  1. 音声認識辞書を参照して入力音声を音声認識して音声認識結果を出力する音声認識装置において、
    予め定められた分類項目に応じた複数の音声認識辞書と、
    前記音声認識結果が誤認識であるか否かを判定する誤認識判定手段と、
    該誤認識判定手段で前記音声認識結果が誤認識であると判定されると前記音声認識辞書を切り替える認識辞書管理手段と、
    切り替え後の音声認識辞書を参照して前記入力音声を音声認識して前記音声認識結果を得る音声手段とを有することを特徴とする音声認識装置。
  2. 誤認識判定手段で誤認識でないと判定された音声認識結果を提示する提示手段とを有し、
    該提示手段に提示された音声認識結果が非適切であることを示す入力コマンドを受けると、認識辞書管理手段は音声認識辞書を切り替えるようにしたことを特徴とする請求項1記載の音声認識装置。
  3. 分類項目として地域を用いた音声認識辞書は予め定められた地域毎に備えられ、
    移動体に搭載され、該移動体の現在地を検出する位置検出手段を有し、
    認識辞書管理手段は前記位置検出手段で検出された現在地に対応する地域に応じて前記音声認識辞書の切り替えを行うようにしたことを特徴とする請求項1記載の音声認識装置。
  4. 音声認識辞書の使用優先度を規定する辞書管理情報を有し、
    前記認識辞書管理手段は前記辞書管理情報を参照して前記音声認識辞書の切り替えを行うようにしたことを特徴とする請求項1記載の音声認識装置。
  5. 誤認識判定手段で誤認識でないと判定された音声認識結果を音声認識した際に用いた音声認識辞書についてその使用履歴を記憶する認識語彙記憶手段を有し、
    認識辞書管理手段は前記認識語彙記憶手段に記憶された使用履歴に応じて前記音声認識辞書の切り替えを行うようにしたことを特徴とする請求項1記載の音声認識装置。
  6. 音声認識結果を提示する提示手段と、
    前記音声認識結果を記憶する認識結果記憶手段と、
    誤認識判定手段で音声認識結果が誤認識でないと判定された際前記認識結果記憶手段に記憶された音声認識結果の全てを読み出して前記提示手段に提示する制御手段とを有することを特徴とする請求項1記載の音声認識装置。
JP2007550083A 2005-12-14 2006-08-16 音声認識装置 Expired - Fee Related JP4855421B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007550083A JP4855421B2 (ja) 2005-12-14 2006-08-16 音声認識装置

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2005360821 2005-12-14
JP2005360821 2005-12-14
PCT/JP2006/316108 WO2007069372A1 (ja) 2005-12-14 2006-08-16 音声認識装置
JP2007550083A JP4855421B2 (ja) 2005-12-14 2006-08-16 音声認識装置

Publications (2)

Publication Number Publication Date
JPWO2007069372A1 true JPWO2007069372A1 (ja) 2009-05-21
JP4855421B2 JP4855421B2 (ja) 2012-01-18

Family

ID=38162688

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007550083A Expired - Fee Related JP4855421B2 (ja) 2005-12-14 2006-08-16 音声認識装置

Country Status (5)

Country Link
US (1) US8112276B2 (ja)
JP (1) JP4855421B2 (ja)
CN (1) CN101331537A (ja)
DE (1) DE112006002988T5 (ja)
WO (1) WO2007069372A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100819234B1 (ko) * 2006-05-25 2008-04-02 삼성전자주식회사 네비게이션 단말의 목적지 설정 방법 및 장치
TWI349266B (en) * 2007-04-13 2011-09-21 Qisda Corp Voice recognition system and method
JP5083033B2 (ja) * 2008-05-23 2012-11-28 株式会社豊田中央研究所 感情推定装置及びプログラム
US9045098B2 (en) * 2009-12-01 2015-06-02 Honda Motor Co., Ltd. Vocabulary dictionary recompile for in-vehicle audio system
US9299340B2 (en) 2013-10-07 2016-03-29 Honeywell International Inc. System and method for correcting accent induced speech in an aircraft cockpit utilizing a dynamic speech database
CN106663424B (zh) * 2014-03-31 2021-03-05 三菱电机株式会社 意图理解装置以及方法
US9293132B2 (en) 2014-08-06 2016-03-22 Honda Motor Co., Ltd. Dynamic geo-fencing for voice recognition dictionary
CN106796786B (zh) * 2014-09-30 2021-03-02 三菱电机株式会社 语音识别系统
JP6562790B2 (ja) * 2015-09-11 2019-08-21 株式会社Nttドコモ 対話装置および対話プログラム
JP6857983B2 (ja) * 2016-08-25 2021-04-14 Jcc株式会社 メタデータ生成システム
JP6526608B2 (ja) * 2016-09-06 2019-06-05 株式会社東芝 辞書更新装置およびプログラム
JP6896335B2 (ja) * 2017-05-30 2021-06-30 アルパイン株式会社 音声認識装置および音声認識方法
KR102446637B1 (ko) * 2017-12-28 2022-09-23 삼성전자주식회사 음향 출력 시스템 및 음성 처리 방법
JP6745465B1 (ja) * 2019-03-06 2020-08-26 パナソニックIpマネジメント株式会社 車両及びカメラモジュール

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143191A (ja) * 1996-11-13 1998-05-29 Hitachi Ltd 音声認識システム
JP2000200093A (ja) * 1999-01-07 2000-07-18 Nec Corp 音声認識装置及びそれに用いる音声認識方法並びにその制御プログラムを記録した記録媒体

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2589299B2 (ja) * 1987-01-28 1997-03-12 富士通株式会社 単語音声認識装置
JPH06250689A (ja) * 1993-02-23 1994-09-09 Toshiba Corp 音声認識装置
JPH06250687A (ja) * 1993-02-25 1994-09-09 Nippondenso Co Ltd 不特定話者用音声認識装置
JPH06260689A (ja) 1993-03-09 1994-09-16 Toshiba Toransupooto Eng Kk 低温容器の液面計測器
JPH06318097A (ja) 1993-05-07 1994-11-15 Matsushita Electric Ind Co Ltd 音声認識装置
US5577164A (en) * 1994-01-28 1996-11-19 Canon Kabushiki Kaisha Incorrect voice command recognition prevention and recovery processing method and apparatus
JP3586777B2 (ja) * 1994-08-17 2004-11-10 富士通株式会社 音声入力装置
JPH08320697A (ja) 1995-05-23 1996-12-03 Hitachi Ltd 音声認識装置
US5825306A (en) 1995-08-25 1998-10-20 Aisin Aw Co., Ltd. Navigation system for vehicles
JP3980791B2 (ja) * 1999-05-03 2007-09-26 パイオニア株式会社 音声認識装置を備えたマンマシンシステム
JP3999913B2 (ja) * 1999-09-08 2007-10-31 三菱電機株式会社 音声認識システム及び方法並びに音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JP4292646B2 (ja) 1999-09-16 2009-07-08 株式会社デンソー ユーザインタフェース装置、ナビゲーションシステム、情報処理装置及び記録媒体
JP4116233B2 (ja) * 2000-09-05 2008-07-09 パイオニア株式会社 音声認識装置ならびにその方法
JP3846896B2 (ja) * 2000-10-13 2006-11-15 日本電信電話株式会社 音声入力された複合名詞の検索装置、検索方法およびデータベース
JP4363076B2 (ja) * 2002-06-28 2009-11-11 株式会社デンソー 音声制御装置
JP2004053742A (ja) * 2002-07-17 2004-02-19 Matsushita Electric Ind Co Ltd 音声認識装置
JP3925368B2 (ja) * 2002-09-18 2007-06-06 株式会社デンソー 制御システム
JP3991914B2 (ja) * 2003-05-08 2007-10-17 日産自動車株式会社 移動体用音声認識装置
JP3948441B2 (ja) 2003-07-09 2007-07-25 松下電器産業株式会社 音声認識方法及び、車載装置
JP2005122128A (ja) * 2003-09-25 2005-05-12 Fuji Photo Film Co Ltd 音声認識システム及びプログラム
JP2005292476A (ja) * 2004-03-31 2005-10-20 Jfe Systems Inc 顧客応対方法及び装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10143191A (ja) * 1996-11-13 1998-05-29 Hitachi Ltd 音声認識システム
JP2000200093A (ja) * 1999-01-07 2000-07-18 Nec Corp 音声認識装置及びそれに用いる音声認識方法並びにその制御プログラムを記録した記録媒体

Also Published As

Publication number Publication date
WO2007069372A1 (ja) 2007-06-21
JP4855421B2 (ja) 2012-01-18
US8112276B2 (en) 2012-02-07
US20090259467A1 (en) 2009-10-15
CN101331537A (zh) 2008-12-24
DE112006002988T5 (de) 2009-01-29

Similar Documents

Publication Publication Date Title
JP4855421B2 (ja) 音声認識装置
JP3943492B2 (ja) ディクテーションとコマンドの区別を向上させる方法
US8484033B2 (en) Speech recognizer control system, speech recognizer control method, and speech recognizer control program
CN106796786B (zh) 语音识别系统
JP4260788B2 (ja) 音声認識機器制御装置
CN109937447B (zh) 语音识别装置、语音识别系统
JP3724461B2 (ja) 音声制御装置
US20080059175A1 (en) Voice recognition method and voice recognition apparatus
CN106537492B (zh) 具有用于语音识别的校正策略的机动车操作装置
JP4466379B2 (ja) 車載音声認識装置
EP2863385B1 (en) Function execution instruction system, function execution instruction method, and function execution instruction program
US20080140423A1 (en) Information processing apparatus and information processing method
JP5606951B2 (ja) 音声認識システムおよびこれを用いた検索システム
JP2009230068A (ja) 音声認識装置及びナビゲーションシステム
JP5217838B2 (ja) 車載機器の操作装置及び車載機器の操作方法
JP4639094B2 (ja) 音声認識システム、音声認識装置及び音声認識プログラム
JP5591428B2 (ja) 自動記録装置
US11164578B2 (en) Voice recognition apparatus, voice recognition method, and non-transitory computer-readable storage medium storing program
JP4770374B2 (ja) 音声認識装置
KR101063159B1 (ko) 명령횟수를 줄일 수 있는 음성 인식을 이용한 주소 검색 방법
JP2000020086A (ja) 音声認識装置、その装置を用いたナビゲーションシステム及び自動販売システム
JP3285954B2 (ja) 音声認識装置
JP2006178898A (ja) 地点検索装置
WO2022215104A1 (ja) 音声対話装置および音声対話方法
JP2007286198A (ja) 音声合成出力装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110722

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111018

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111026

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141104

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4855421

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees