JP2001125587A - 音声認識対話装置及びその音声認識方法 - Google Patents
音声認識対話装置及びその音声認識方法Info
- Publication number
- JP2001125587A JP2001125587A JP30381099A JP30381099A JP2001125587A JP 2001125587 A JP2001125587 A JP 2001125587A JP 30381099 A JP30381099 A JP 30381099A JP 30381099 A JP30381099 A JP 30381099A JP 2001125587 A JP2001125587 A JP 2001125587A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- voice
- utterance
- unit
- speech recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【課題】 誤認識発生後の誤認識の繰り返しを防止し、
より少ない発声回数で正しい認識結果を得ることができ
る音声認識対話装置及びその音声認識方法を得る。 【解決手段】 低速発声、中速発声及び連続発声であら
かじめ作成された各比較対象パターンを低速発声時用パ
ターンセット、中速発声時用パターンセット及び連続発
声時用パターンセットとして、それぞれ分けて比較パタ
ーン格納部6に格納し、音声認識部3は、誤認識した場
合には、低速発声時用パターンセットを使用し、誤認識
が回復した場合には、より高速の発声を想定した比較対
象パターンセットを使用して音声認識処理を行うように
した。
より少ない発声回数で正しい認識結果を得ることができ
る音声認識対話装置及びその音声認識方法を得る。 【解決手段】 低速発声、中速発声及び連続発声であら
かじめ作成された各比較対象パターンを低速発声時用パ
ターンセット、中速発声時用パターンセット及び連続発
声時用パターンセットとして、それぞれ分けて比較パタ
ーン格納部6に格納し、音声認識部3は、誤認識した場
合には、低速発声時用パターンセットを使用し、誤認識
が回復した場合には、より高速の発声を想定した比較対
象パターンセットを使用して音声認識処理を行うように
した。
Description
【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力された音声を
あらかじめ記憶されている複数の比較対象パターン候補
と比較して、一致度の高いものを音声認識結果とする音
声認識対話装置及びその音声認識方法に関する。
あらかじめ記憶されている複数の比較対象パターン候補
と比較して、一致度の高いものを音声認識結果とする音
声認識対話装置及びその音声認識方法に関する。
【0002】
【従来の技術】マンマシンインタフェースの1つの手法
として、近年音声認識を使用した音声対話インタフェー
スが注目されている。従来の動向として、誤認識を極力
抑えることのみに注力されており、誤認識が起こった場
合の対処手法に関して考慮されているものは少なかっ
た。例えば、誤認識が発生した場合の対処として、特開
平10‐253378号公報では、前回の認識結果の下
位候補を現在の認識対象語に追加して再度音声入力を行
う手法が開示されている。また、特開平9‐19808
7号公報では、誤認識結果を記憶しておき、次回の音声
認識結果に作用させる手法が開示されている。
として、近年音声認識を使用した音声対話インタフェー
スが注目されている。従来の動向として、誤認識を極力
抑えることのみに注力されており、誤認識が起こった場
合の対処手法に関して考慮されているものは少なかっ
た。例えば、誤認識が発生した場合の対処として、特開
平10‐253378号公報では、前回の認識結果の下
位候補を現在の認識対象語に追加して再度音声入力を行
う手法が開示されている。また、特開平9‐19808
7号公報では、誤認識結果を記憶しておき、次回の音声
認識結果に作用させる手法が開示されている。
【0003】
【発明が解決しようとする課題】しかし、これらはすべ
て、音声を入力する発話者の発声が一定であることを前
提としている。すなわち、正しく認識された場合と誤認
識が発生した場合において、発話者の対応は同じである
とみなしている。このため、一旦誤認識が発生し、発話
者の対応が変化すると、何度も誤認識を繰り返すという
問題が生じる。このように、音声認識は、今後のマンマ
シンインタフェースとして注目されているが、誤認識が
発生した場合の発話者の対応を考慮しなければ、誤認識
を繰り返すだけのことになる。
て、音声を入力する発話者の発声が一定であることを前
提としている。すなわち、正しく認識された場合と誤認
識が発生した場合において、発話者の対応は同じである
とみなしている。このため、一旦誤認識が発生し、発話
者の対応が変化すると、何度も誤認識を繰り返すという
問題が生じる。このように、音声認識は、今後のマンマ
シンインタフェースとして注目されているが、誤認識が
発生した場合の発話者の対応を考慮しなければ、誤認識
を繰り返すだけのことになる。
【0004】本発明は、上記のような問題を解決するた
めになされたものであり、誤認識が発生したときの発話
者の対応を考慮することによって誤認識の繰り返しを防
止し、より少ない発声回数で正しい認識結果を得ること
ができる音声認識対話装置及びその音声認識方法を得る
ことを目的とする。
めになされたものであり、誤認識が発生したときの発話
者の対応を考慮することによって誤認識の繰り返しを防
止し、より少ない発声回数で正しい認識結果を得ること
ができる音声認識対話装置及びその音声認識方法を得る
ことを目的とする。
【0005】
【課題を解決するための手段】この発明に係る音声認識
対話装置は、発話者の音声を認識して意図を推定し、該
推定結果を表示する音声認識対話装置において、複数の
発声速度ごとにあらかじめ作成された、音声認識を行う
際に比較基準となる比較対象パターンを、各発声速度ご
とにグループ分けして格納された比較パターン格納部
と、該比較パターン格納部に格納された各グループの選
択を行うグループ選択部と、該グループ選択部で選択さ
れたグループの各比較対象パターンと比較して、一致度
の高いものを認識結果として出力する音声認識部と、該
音声認識部からの認識結果に基づいて発話者の意図を推
定する音声対話制御部と、該音声対話制御部の推定内容
を表示すると共に、該推定内容に対する誤認識の有無の
判定が発話者より入力される入力部とを備え、音声対話
制御部は、入力部に入力された誤認識の有無の判定に応
じて、グループ選択部に対するグループ選択制御を行う
ものである。
対話装置は、発話者の音声を認識して意図を推定し、該
推定結果を表示する音声認識対話装置において、複数の
発声速度ごとにあらかじめ作成された、音声認識を行う
際に比較基準となる比較対象パターンを、各発声速度ご
とにグループ分けして格納された比較パターン格納部
と、該比較パターン格納部に格納された各グループの選
択を行うグループ選択部と、該グループ選択部で選択さ
れたグループの各比較対象パターンと比較して、一致度
の高いものを認識結果として出力する音声認識部と、該
音声認識部からの認識結果に基づいて発話者の意図を推
定する音声対話制御部と、該音声対話制御部の推定内容
を表示すると共に、該推定内容に対する誤認識の有無の
判定が発話者より入力される入力部とを備え、音声対話
制御部は、入力部に入力された誤認識の有無の判定に応
じて、グループ選択部に対するグループ選択制御を行う
ものである。
【0006】具体的には、音声対話制御部は、入力部か
ら誤認識であるという判定が入力されるとグループ選択
部に対して発声速度の遅いグループの選択を行わせる、
及び/又は、入力部から誤認識でないという判定が入力
されると上記グループ選択部に対して発声速度の速いグ
ループの選択を行わせるようにした。
ら誤認識であるという判定が入力されるとグループ選択
部に対して発声速度の遅いグループの選択を行わせる、
及び/又は、入力部から誤認識でないという判定が入力
されると上記グループ選択部に対して発声速度の速いグ
ループの選択を行わせるようにした。
【0007】また、この発明に係る音声認識対話装置の
音声認識方法は、入力された音声をあらかじめ記憶され
ている各比較対象パターンと比較して、一致度の高いも
のを音声認識結果とし、該音声認識結果から発話者の意
図を推定して表示すると共に、該表示した推定内容に対
して発話者による誤認識判定を入力する手段を備えた音
声認識対話装置における音声認識方法において、各比較
対象パターンを複数の発声速度ごとにあらかじめ作成す
ると共に各発声速度ごとに複数のグループに分けて記憶
し、発話者による誤認識であるか否かの判定に応じて該
各グループの1つを選択し、該選択したグループの各比
較対象パターンを使用して音声認識処理を行うようにし
た。
音声認識方法は、入力された音声をあらかじめ記憶され
ている各比較対象パターンと比較して、一致度の高いも
のを音声認識結果とし、該音声認識結果から発話者の意
図を推定して表示すると共に、該表示した推定内容に対
して発話者による誤認識判定を入力する手段を備えた音
声認識対話装置における音声認識方法において、各比較
対象パターンを複数の発声速度ごとにあらかじめ作成す
ると共に各発声速度ごとに複数のグループに分けて記憶
し、発話者による誤認識であるか否かの判定に応じて該
各グループの1つを選択し、該選択したグループの各比
較対象パターンを使用して音声認識処理を行うようにし
た。
【0008】具体的には、発話者によって誤認識である
と判定されると、発声速度の遅いグループの各比較対象
パターンを使用して音声認識処理を行う、及び/又は、
発話者によって誤認識ではないと判定されると、発声速
度の速いグループの各比較対象パターンを使用して音声
認識処理を行うようにする。
と判定されると、発声速度の遅いグループの各比較対象
パターンを使用して音声認識処理を行う、及び/又は、
発話者によって誤認識ではないと判定されると、発声速
度の速いグループの各比較対象パターンを使用して音声
認識処理を行うようにする。
【0009】
【発明の実施の形態】次に、図面に示す実施の形態に基
づいて、本発明を詳細に説明する。図1は、本発明の実
施の形態における音声認識対話装置の例を示した概略の
ブロック図である。図1において、音声認識対話装置1
は、音声の取りこみを行うマイクロフォン(以下、マイ
クと呼ぶ)2と、該マイク2から取りこまれた発話者の
音声の認識を行う音声認識部3と、該音声認識部3での
認識結果から発話者の意図を推定し、所定の選択項目を
表示部5に表示させる音声対話制御部4とを備えてい
る。
づいて、本発明を詳細に説明する。図1は、本発明の実
施の形態における音声認識対話装置の例を示した概略の
ブロック図である。図1において、音声認識対話装置1
は、音声の取りこみを行うマイクロフォン(以下、マイ
クと呼ぶ)2と、該マイク2から取りこまれた発話者の
音声の認識を行う音声認識部3と、該音声認識部3での
認識結果から発話者の意図を推定し、所定の選択項目を
表示部5に表示させる音声対話制御部4とを備えてい
る。
【0010】更に、音声認識対話装置1は、音声認識部
3が音声認識を行う際に使用する比較基準をなす複数の
比較対象パターンが所定の複数のグループ(以下、これ
を比較対象パターンセットと呼ぶ)に分けてあらかじめ
格納されている比較パターン格納部6と、該比較パター
ン格納部6に格納された比較対象パターンセットのいず
れか1つを音声認識部3が使用することができるように
比較対象パターンセットの切り替えを行う切り替えスイ
ッチ等で構成されたパターンセット切替部7とを備えて
いる。比較パターン格納部6には、各比較対象パターン
が、発声速度及び発声の明確性等の違いに応じて複数の
比較対象パターンセットに分けてあらかじめ格納されて
いる。
3が音声認識を行う際に使用する比較基準をなす複数の
比較対象パターンが所定の複数のグループ(以下、これ
を比較対象パターンセットと呼ぶ)に分けてあらかじめ
格納されている比較パターン格納部6と、該比較パター
ン格納部6に格納された比較対象パターンセットのいず
れか1つを音声認識部3が使用することができるように
比較対象パターンセットの切り替えを行う切り替えスイ
ッチ等で構成されたパターンセット切替部7とを備えて
いる。比較パターン格納部6には、各比較対象パターン
が、発声速度及び発声の明確性等の違いに応じて複数の
比較対象パターンセットに分けてあらかじめ格納されて
いる。
【0011】ここで、誤認識が発生した後の発話者の発
声がゆっくりかつはっきりしたものになる。これは、人
と人との対話で聞き違いが発生したときと同様に、機械
との対話においても聞き違いに相当する誤認識が発生し
た場合、次回の発声は無意識にこのような発声となる。
このことから、比較パターン格納部6には、発話者の発
声速度及び発声の明確性等の違いに応じて、各比較対象
パターンを複数の比較対象パターンセットに分けてあら
かじめ記憶されている。
声がゆっくりかつはっきりしたものになる。これは、人
と人との対話で聞き違いが発生したときと同様に、機械
との対話においても聞き違いに相当する誤認識が発生し
た場合、次回の発声は無意識にこのような発声となる。
このことから、比較パターン格納部6には、発話者の発
声速度及び発声の明確性等の違いに応じて、各比較対象
パターンを複数の比較対象パターンセットに分けてあら
かじめ記憶されている。
【0012】すなわち、図1では、発声速度が遅くかつ
発声の明確性が高い(以下、このような発声を低速発声
と呼ぶ)発声であらかじめ作成された各比較対象パター
ンで構成された比較対象パターンセットが低速発声時用
パターンセットとして、該低速発声よりも発声速度が速
い(以下、このような発声を中速発声と呼ぶ)発声であ
らかじめ作成された、すなわち低速離散発声よりも少し
速い発声速度で作成された各比較対象パターンで構成さ
れた比較対象パターンセットが中速発声時用パターンセ
ットとして比較パターン格納部6に格納されている。
発声の明確性が高い(以下、このような発声を低速発声
と呼ぶ)発声であらかじめ作成された各比較対象パター
ンで構成された比較対象パターンセットが低速発声時用
パターンセットとして、該低速発声よりも発声速度が速
い(以下、このような発声を中速発声と呼ぶ)発声であ
らかじめ作成された、すなわち低速離散発声よりも少し
速い発声速度で作成された各比較対象パターンで構成さ
れた比較対象パターンセットが中速発声時用パターンセ
ットとして比較パターン格納部6に格納されている。
【0013】更に、上記中速発声よりも発声速度が速い
(以下、このような発声を連続発声と呼ぶ)いわゆる通
常の発声であらかじめ作成された各比較対象パターンで
構成された比較対象パターンセットが連続発声時用パタ
ーンセットとして比較パターン格納部6に格納されてい
る。このように、あらかじめ作成された各比較対象パタ
ーンは、3つの比較対象パターンセットに分けられて比
較パターン格納部6に格納されている。
(以下、このような発声を連続発声と呼ぶ)いわゆる通
常の発声であらかじめ作成された各比較対象パターンで
構成された比較対象パターンセットが連続発声時用パタ
ーンセットとして比較パターン格納部6に格納されてい
る。このように、あらかじめ作成された各比較対象パタ
ーンは、3つの比較対象パターンセットに分けられて比
較パターン格納部6に格納されている。
【0014】マイク2は、音声認識部3に接続され、音
声認識部3は、音声対話制御部4に接続されると共にパ
ターンセット切替部7を介して比較パターン格納部6に
接続されている。音声対話制御部4は、表示部5に接続
されると共にパターンセット切替部7に接続され、パタ
ーンセット切替部7に対して比較対象パターンセットの
切替制御を行う。
声認識部3は、音声対話制御部4に接続されると共にパ
ターンセット切替部7を介して比較パターン格納部6に
接続されている。音声対話制御部4は、表示部5に接続
されると共にパターンセット切替部7に接続され、パタ
ーンセット切替部7に対して比較対象パターンセットの
切替制御を行う。
【0015】このような構成において、音声認識部3
は、マイク2から音声を取りこみ、パターンセット切替
部6で現在選択されている比較パターン格納部6に格納
された比較対象パターンセットを使用して音声認識処理
を行う。この際、音声認識部3は、マイク2から取りこ
まれた音声が現在選択されている比較対象パターンセッ
トにおける各比較対象パターン候補と比較して、一致度
の高いものを認識結果として音声対話制御部4に出力す
る。
は、マイク2から音声を取りこみ、パターンセット切替
部6で現在選択されている比較パターン格納部6に格納
された比較対象パターンセットを使用して音声認識処理
を行う。この際、音声認識部3は、マイク2から取りこ
まれた音声が現在選択されている比較対象パターンセッ
トにおける各比較対象パターン候補と比較して、一致度
の高いものを認識結果として音声対話制御部4に出力す
る。
【0016】音声対話制御部4は、該認識結果を基にし
て発話者の意図を推定し、図2で示すような選択項目を
表示部5に表示させる。発話者は、該表示部5に表示さ
れた選択項目の中から該当する項目を選択することがで
きる。表示部5に表示された推定項目の中に発話者の意
図した項目がない場合は、発話者は表示部5に表示され
ている「該当なし」の項目を選択する。
て発話者の意図を推定し、図2で示すような選択項目を
表示部5に表示させる。発話者は、該表示部5に表示さ
れた選択項目の中から該当する項目を選択することがで
きる。表示部5に表示された推定項目の中に発話者の意
図した項目がない場合は、発話者は表示部5に表示され
ている「該当なし」の項目を選択する。
【0017】選択項目中に発話者が意図する項目が存在
し、該意図する項目が選択されると、音声対話制御部4
は、正常認識と判定し、前回の認識が誤認識で、次回の
対話において、選択項目中に発話者の意図する項目が存
在すれば誤認識回復と判定する。また、発話者によって
「該当なし」の項目が選択されると、音声対話制御部4
は、誤認識であると判定し、発話者による次の発声は低
速発声であると予測し、パターンセット切替部7に対し
て、比較パターン格納部6の低速発声時用パターンセッ
トが使用されて音声認識部3による音声認識が行われる
ように、切替制御を行う。音声認識部3は、発話者の次
発声に対する音声認識処理を低速発声時用パターンセッ
トを使用して行う。
し、該意図する項目が選択されると、音声対話制御部4
は、正常認識と判定し、前回の認識が誤認識で、次回の
対話において、選択項目中に発話者の意図する項目が存
在すれば誤認識回復と判定する。また、発話者によって
「該当なし」の項目が選択されると、音声対話制御部4
は、誤認識であると判定し、発話者による次の発声は低
速発声であると予測し、パターンセット切替部7に対し
て、比較パターン格納部6の低速発声時用パターンセッ
トが使用されて音声認識部3による音声認識が行われる
ように、切替制御を行う。音声認識部3は、発話者の次
発声に対する音声認識処理を低速発声時用パターンセッ
トを使用して行う。
【0018】また、音声対話制御部4は、誤認識回復と
判定するごとに、パターンセット切替部6に対して、低
速発声時用パターンセットから中速発声時用パターンセ
ット、又は中速発声時用パターンセットから連続発声時
用パターンセットに切り替えて音声認識部3による音声
認識が行われるように、切替制御を行う。このようにす
ることによって、発話者の発声が徐々に連続発声に変化
しても対応することができる。
判定するごとに、パターンセット切替部6に対して、低
速発声時用パターンセットから中速発声時用パターンセ
ット、又は中速発声時用パターンセットから連続発声時
用パターンセットに切り替えて音声認識部3による音声
認識が行われるように、切替制御を行う。このようにす
ることによって、発話者の発声が徐々に連続発声に変化
しても対応することができる。
【0019】次に、図3は、図1で示した音声認識対話
装置1における動作例を示したフローチャートであり、
図3を用いて、音声認識対話装置1の動作の流れ、特に
音声対話制御部4による動作の流れについてもう少し詳
細に説明する。図3において、音声対話制御部4は、ス
テップS1で、音声認識部3による認識結果を取得し、
ステップS2で、該認識結果に該当する項目を検索して
表示部5に表示させる。
装置1における動作例を示したフローチャートであり、
図3を用いて、音声認識対話装置1の動作の流れ、特に
音声対話制御部4による動作の流れについてもう少し詳
細に説明する。図3において、音声対話制御部4は、ス
テップS1で、音声認識部3による認識結果を取得し、
ステップS2で、該認識結果に該当する項目を検索して
表示部5に表示させる。
【0020】次に、音声対話制御部4は、ステップS3
で、表示部5に表示された各項目の内、「該当なし」の
項目が発話者によって選択されたか否かを調べ、「該当
なし」が選択された場合(YES)、ステップS4で、
誤認識と判定し、パターンセット切替部7に対して、低
速発声時用パターンセットに切り替えて音声認識部3に
よる音声認識が行われるように、切替制御を行う。この
後、ステップS5で、音声認識部3によって次の音声認
識処理が行われ、ステップS1に戻る。
で、表示部5に表示された各項目の内、「該当なし」の
項目が発話者によって選択されたか否かを調べ、「該当
なし」が選択された場合(YES)、ステップS4で、
誤認識と判定し、パターンセット切替部7に対して、低
速発声時用パターンセットに切り替えて音声認識部3に
よる音声認識が行われるように、切替制御を行う。この
後、ステップS5で、音声認識部3によって次の音声認
識処理が行われ、ステップS1に戻る。
【0021】また、ステップS3で、「該当なし」が選
択されなかった場合(NO)、音声対話制御部4は、ス
テップS6で、パターンセット切替部7は、連続発声時
用パターンセットが選択されているか否かを調べ、連続
発声時用パターンセットが選択されている場合(YE
S)は、ステップS5の処理が行われる。一方、ステッ
プS6で、連続発声時用パターンセットが選択されてい
ない場合(NO)は、音声対話部4は、ステップS7
で、誤認識回復と判定し、パターンセット切替部7に対
して、低速発声時用パターンセットから中速発声時用パ
ターンセット、又は中速発声時用パターンセットから連
続発声時用パターンセットに切り替えて音声認識部3に
よる音声認識が行われるように、切替制御を行う。この
後、ステップS5の処理を行う。
択されなかった場合(NO)、音声対話制御部4は、ス
テップS6で、パターンセット切替部7は、連続発声時
用パターンセットが選択されているか否かを調べ、連続
発声時用パターンセットが選択されている場合(YE
S)は、ステップS5の処理が行われる。一方、ステッ
プS6で、連続発声時用パターンセットが選択されてい
ない場合(NO)は、音声対話部4は、ステップS7
で、誤認識回復と判定し、パターンセット切替部7に対
して、低速発声時用パターンセットから中速発声時用パ
ターンセット、又は中速発声時用パターンセットから連
続発声時用パターンセットに切り替えて音声認識部3に
よる音声認識が行われるように、切替制御を行う。この
後、ステップS5の処理を行う。
【0022】このように、本実施の形態における音声認
識対話装置は、低速発声、中速発声及び連続発声であら
かじめ作成された各比較対象パターンを低速発声時用パ
ターンセット、中速発声時用パターンセット及び連続発
声時用パターンセットとして、それぞれ分けて比較パタ
ーン格納部6に格納し、誤認識した場合は、低速発声時
用パターンセットを使用し、誤認識が回復した場合は、
より高速の発声を想定した比較対象パターンセットを使
用して音声認識処理を行うようにした。このことから、
誤認識発生後の発話者の対応変化によって生じる誤認識
の繰り返しを防止することができるため、より少ない発
声回数で正しい認識結果を得ることができる。
識対話装置は、低速発声、中速発声及び連続発声であら
かじめ作成された各比較対象パターンを低速発声時用パ
ターンセット、中速発声時用パターンセット及び連続発
声時用パターンセットとして、それぞれ分けて比較パタ
ーン格納部6に格納し、誤認識した場合は、低速発声時
用パターンセットを使用し、誤認識が回復した場合は、
より高速の発声を想定した比較対象パターンセットを使
用して音声認識処理を行うようにした。このことから、
誤認識発生後の発話者の対応変化によって生じる誤認識
の繰り返しを防止することができるため、より少ない発
声回数で正しい認識結果を得ることができる。
【0023】なお、本実施の形態では、3種類の発声速
度の比較対象パターンセットを設けた場合を例にして説
明したが、本発明はこれに限定するものではなく、複数
の種類の発声速度の比較対象パターンセットを設けるよ
うにすればよい。また、表示部5の表示項目に対する選
択は、発話者が行ってもよいし、発話者以外の使用者が
行ってもよいことは言うまでもない。
度の比較対象パターンセットを設けた場合を例にして説
明したが、本発明はこれに限定するものではなく、複数
の種類の発声速度の比較対象パターンセットを設けるよ
うにすればよい。また、表示部5の表示項目に対する選
択は、発話者が行ってもよいし、発話者以外の使用者が
行ってもよいことは言うまでもない。
【0024】
【発明の効果】請求項1に係る音声認識対話装置は、複
数の発声速度ごとにあらかじめ作成された各比較対象パ
ターンを、各発声速度ごとにグループ分けして比較パタ
ーン格納部に格納し、誤認識の有無に応じて選択したグ
ループの各比較対象パターンを使用して音声認識処理を
行うようにした。このことから、誤認識発生を容易に検
出することができると共に、誤認識発生後の発話者の対
応変化によって生じる誤認識の繰り返しを防止すること
ができるため、より少ない発声回数で正しい認識結果を
得ることができる。
数の発声速度ごとにあらかじめ作成された各比較対象パ
ターンを、各発声速度ごとにグループ分けして比較パタ
ーン格納部に格納し、誤認識の有無に応じて選択したグ
ループの各比較対象パターンを使用して音声認識処理を
行うようにした。このことから、誤認識発生を容易に検
出することができると共に、誤認識発生後の発話者の対
応変化によって生じる誤認識の繰り返しを防止すること
ができるため、より少ない発声回数で正しい認識結果を
得ることができる。
【0025】請求項2に係る音声認識対話装置は、請求
項1において、具体的には、誤認識した場合、低速の発
声を想定したグループの各比較対象パターンを使用して
音声認識処理を行うようにした。このことから、誤認識
発生後の発話者の発声速度が遅くなることに対して生じ
る誤認識の繰り返しを防止することができるため、より
少ない発声回数で正しい認識結果を得ることができる。
項1において、具体的には、誤認識した場合、低速の発
声を想定したグループの各比較対象パターンを使用して
音声認識処理を行うようにした。このことから、誤認識
発生後の発話者の発声速度が遅くなることに対して生じ
る誤認識の繰り返しを防止することができるため、より
少ない発声回数で正しい認識結果を得ることができる。
【0026】請求項3に係る音声認識対話装置は、請求
項1又は請求項2のいずれかにおいて、具体的には、誤
認識が回復した場合、より高速の発声を想定したグルー
プの各比較対象パターンを使用して音声認識処理を行う
ようにした。このことから、誤認識が回復した後の発話
者の発声速度が通常の速さに戻ることに対して生じる誤
認識の繰り返しを防止することができるため、誤認識回
復後の音声認識性能を向上させることができる。
項1又は請求項2のいずれかにおいて、具体的には、誤
認識が回復した場合、より高速の発声を想定したグルー
プの各比較対象パターンを使用して音声認識処理を行う
ようにした。このことから、誤認識が回復した後の発話
者の発声速度が通常の速さに戻ることに対して生じる誤
認識の繰り返しを防止することができるため、誤認識回
復後の音声認識性能を向上させることができる。
【0027】請求項4に係る音声認識対話装置の音声認
識方法は、誤認識の有無に応じて、発声速度ごとに分け
たグループの1つを選択し、該選択したグループの各比
較対象パターンを使用して音声認識処理を行うようにし
た。このことから、誤認識発生後の発話者の対応変化に
よって生じる誤認識の繰り返しを防止することができる
ため、より少ない発声回数で正しい認識結果を得ること
ができる。
識方法は、誤認識の有無に応じて、発声速度ごとに分け
たグループの1つを選択し、該選択したグループの各比
較対象パターンを使用して音声認識処理を行うようにし
た。このことから、誤認識発生後の発話者の対応変化に
よって生じる誤認識の繰り返しを防止することができる
ため、より少ない発声回数で正しい認識結果を得ること
ができる。
【0028】請求項5に係る音声認識対話装置の音声認
識方法は、請求項4において、具体的には、誤認識した
場合、低速の発声を想定したグループの各比較対象パタ
ーンを使用して音声認識処理を行うようにした。このこ
とから、誤認識発生後の発話者の発声速度が遅くなるこ
とに対して生じる誤認識の繰り返しを防止することがで
きるため、より少ない発声回数で正しい認識結果を得る
ことができる。
識方法は、請求項4において、具体的には、誤認識した
場合、低速の発声を想定したグループの各比較対象パタ
ーンを使用して音声認識処理を行うようにした。このこ
とから、誤認識発生後の発話者の発声速度が遅くなるこ
とに対して生じる誤認識の繰り返しを防止することがで
きるため、より少ない発声回数で正しい認識結果を得る
ことができる。
【0029】請求項6に係る音声認識対話装置の音声認
識方法は、請求項4又は請求項5のいずれかにおいて、
具体的には、誤認識が回復した場合、より高速の発声を
想定したグループの各比較対象パターンを使用して音声
認識処理を行うようにした。このことから、誤認識が回
復した後の発話者の発声速度が通常の速さに戻ることに
対して生じる誤認識の繰り返しを防止することができる
ため、誤認識回復後の音声認識性能を向上させることが
できる。
識方法は、請求項4又は請求項5のいずれかにおいて、
具体的には、誤認識が回復した場合、より高速の発声を
想定したグループの各比較対象パターンを使用して音声
認識処理を行うようにした。このことから、誤認識が回
復した後の発話者の発声速度が通常の速さに戻ることに
対して生じる誤認識の繰り返しを防止することができる
ため、誤認識回復後の音声認識性能を向上させることが
できる。
【図1】 本発明の実施の形態における音声認識対話装
置の例を示した概略のブロック図である。
置の例を示した概略のブロック図である。
【図2】 図1の表示部5の表示例を示した図である。
【図3】 図1の音声認識対話装置の動作例を示したフ
ローチャートである。
ローチャートである。
1 音声認識対話装置 2 マイク 3 音声認識部 4 音声対話制御部 5 表示部 6 比較パターン格納部 7 パターンセット切替部
Claims (6)
- 【請求項1】 発話者の音声を認識して意図を推定し、
該推定結果を表示する音声認識対話装置において、 複数の発声速度ごとにあらかじめ作成された、音声認識
を行う際に比較基準となる比較対象パターンを、各発声
速度ごとにグループ分けして格納された比較パターン格
納部と、 該比較パターン格納部に格納された各グループの選択を
行うグループ選択部と、 該グループ選択部で選択されたグループの各比較対象パ
ターンと比較して、一致度の高いものを認識結果として
出力する音声認識部と、 該音声認識部からの認識結果に基づいて発話者の意図を
推定する音声対話制御部と、 該音声対話制御部の推定内容を表示すると共に、該推定
内容に対する誤認識の有無の判定が発話者によって入力
される入力部と、を備え、 上記音声対話制御部は、入力部に入力された誤認識の有
無の判定に応じて、上記グループ選択部に対するグルー
プ選択制御を行うことを特徴とする音声認識対話装置。 - 【請求項2】 上記音声対話制御部は、入力部から誤認
識であるという判定が入力されると、上記グループ選択
部に対して発声速度の遅いグループの選択を行わせるこ
とを特徴とする請求項1に記載の音声認識対話装置。 - 【請求項3】 上記音声対話制御部は、入力部から誤認
識でないという判定が入力されると、上記グループ選択
部に対して発声速度の速いグループの選択を行わせるこ
とを特徴とする請求項1又は請求項2のいずれかに記載
の音声認識対話装置。 - 【請求項4】 入力された音声をあらかじめ記憶されて
いる各比較対象パターンと比較して、一致度の高いもの
を音声認識結果とし、該音声認識結果から発話者の意図
を推定して表示すると共に、該表示した推定内容に対し
て発話者による誤認識判定を入力する手段を備えた音声
認識対話装置における音声認識方法において、 上記各比較対象パターンを複数の発声速度ごとにあらか
じめ作成すると共に各発声速度ごとに複数のグループに
分けて記憶し、発話者による誤認識であるか否かの判定
に応じて該各グループの1つを選択し、該選択したグル
ープの各比較対象パターンを使用して音声認識処理を行
うことを特徴とする音声認識方法。 - 【請求項5】 発話者によって誤認識であると判定され
ると、発声速度の遅いグループの各比較対象パターンを
使用して音声認識処理を行うことを特徴とする請求項4
に記載の音声認識方法。 - 【請求項6】 発話者によって誤認識ではないと判定さ
れると、発声速度の速いグループの各比較対象パターン
を使用して音声認識処理を行うことを特徴とする請求項
4又は請求項5のいずれかに記載の音声認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30381099A JP2001125587A (ja) | 1999-10-26 | 1999-10-26 | 音声認識対話装置及びその音声認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30381099A JP2001125587A (ja) | 1999-10-26 | 1999-10-26 | 音声認識対話装置及びその音声認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001125587A true JP2001125587A (ja) | 2001-05-11 |
Family
ID=17925585
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP30381099A Pending JP2001125587A (ja) | 1999-10-26 | 1999-10-26 | 音声認識対話装置及びその音声認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2001125587A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017015847A (ja) * | 2015-06-30 | 2017-01-19 | カシオ計算機株式会社 | 音声検索装置、音声検索方法及びプログラム |
JP2020008690A (ja) * | 2018-07-06 | 2020-01-16 | 日本電気株式会社 | 抽出装置、抽出方法、およびプログラム |
-
1999
- 1999-10-26 JP JP30381099A patent/JP2001125587A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017015847A (ja) * | 2015-06-30 | 2017-01-19 | カシオ計算機株式会社 | 音声検索装置、音声検索方法及びプログラム |
JP2020008690A (ja) * | 2018-07-06 | 2020-01-16 | 日本電気株式会社 | 抽出装置、抽出方法、およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3979209B2 (ja) | データ入力方法およびデータ入力装置 | |
EP1941344B1 (en) | Combined speech and alternate input modality to a mobile device | |
JP3943492B2 (ja) | ディクテーションとコマンドの区別を向上させる方法 | |
US5893063A (en) | Data processing system and method for dynamically accessing an application using a voice command | |
JP2007226642A (ja) | 音声認識機器制御装置 | |
JP2005331882A (ja) | 音声認識装置、音声認識方法、および音声認識プログラム | |
JP2020095121A (ja) | 音声認識システム、学習済みモデルの生成方法、音声認識システムの制御方法、プログラム、及び移動体 | |
JPH08171375A (ja) | 画面制御装置とその方法 | |
JP5136512B2 (ja) | 応答生成装置及びプログラム | |
JP2001125587A (ja) | 音声認識対話装置及びその音声認識方法 | |
EP1316944B1 (en) | Sound signal recognition system and method, and dialog control system and method using it | |
JP2009104047A (ja) | 情報処理方法及び情報処理装置 | |
JP2007127896A (ja) | 音声認識装置及び音声認識方法 | |
JPH04248596A (ja) | 音声認識訂正装置 | |
JPH10187184A (ja) | 認識された音声を修正するときに認識されたワードを選択する方法及びシステム | |
JP3112037B2 (ja) | 音声認識装置 | |
JP2001005482A (ja) | 音声認識方法及び装置 | |
JP2000056796A (ja) | 音声入力装置および方法 | |
JP2007272123A (ja) | 音声操作システム | |
JP2979999B2 (ja) | 音声認識装置 | |
KR20060109865A (ko) | 음성인식방법 및 장치 | |
JP2001209394A (ja) | 音声認識装置 | |
JPH0384600A (ja) | 音声認識装置 | |
KR20040008546A (ko) | 연속 음성인식 기기의 오인식 수정 방법 | |
JPH10171488A (ja) | 音声認識方法及び装置及び記憶媒体 |