JPH06149287A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPH06149287A JPH06149287A JP29591092A JP29591092A JPH06149287A JP H06149287 A JPH06149287 A JP H06149287A JP 29591092 A JP29591092 A JP 29591092A JP 29591092 A JP29591092 A JP 29591092A JP H06149287 A JPH06149287 A JP H06149287A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- recognition
- words
- speaker
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【目的】 本発明は音声を認識することにより機器の制
御を行うための音声認識装置に関し、認識した音声を話
者に戻し確認するトークバックの演算量を削減し認識時
間の短縮を図ることを目的とする。 【構成】 入力音声と予め登録された複数の単語と比較
し、最も類似した前記単語から順に再生出力し話者にト
ークバックして入力音声と一致するかを判断する音声認
識装置に、値が小さい程前記入力音声と登録単語とが類
似していることを示す認識距離が所定値以下であるかを
判定する認識距離判定部13と、認識距離が所定値以下
の登録単語のみをトークバックするための候補出力14
を設ける。
御を行うための音声認識装置に関し、認識した音声を話
者に戻し確認するトークバックの演算量を削減し認識時
間の短縮を図ることを目的とする。 【構成】 入力音声と予め登録された複数の単語と比較
し、最も類似した前記単語から順に再生出力し話者にト
ークバックして入力音声と一致するかを判断する音声認
識装置に、値が小さい程前記入力音声と登録単語とが類
似していることを示す認識距離が所定値以下であるかを
判定する認識距離判定部13と、認識距離が所定値以下
の登録単語のみをトークバックするための候補出力14
を設ける。
Description
【0001】
【産業上の利用分野】本発明は音声を認識することによ
り機器の制御を行うための音声認識装置に関し、特に本
発明では認識した音声を話者に戻し確認するトークバッ
クの演算量を削減し認識時間の短縮を図ることに関す
る。
り機器の制御を行うための音声認識装置に関し、特に本
発明では認識した音声を話者に戻し確認するトークバッ
クの演算量を削減し認識時間の短縮を図ることに関す
る。
【0002】
【従来の技術】従来このような分野の技術として以下に
説明するものがあった。図4は従来の音声認識装置を用
いた制御システムを示す図である。本図に示すように、
音声認識装置を用いた制御システムは、車両の車室30
0内の話者の音声を捕捉する二つのマイクロフォン20
0と、該マイクロフォン200からの音声の方向、音源
からの距離から話者を識別する話者方向・距離判定部2
01と、該話者方向・距離判定部201に接続され話者
を識別した音声信号から雑音を消去する適応形処理さら
に自動利得制御(AGC)を行う音声認識の前処理部2
02と、該前処理部202に接続され音声を登録された
どの単語に一致するかを認識する音声認識装置203
と、該音声認識装置203で認識された単語に基づき制
御信号を形成する各種制御部204と、該各種制御部2
04を介して認識された単語を音声に合成する音声合成
部205と、該音声合成部205に接続され合成された
音声を再生するスピーカ206と、前記各種制御部20
4により制御されるオーディオ207と、エアコンデシ
ョナー208と、電話209と、ナビゲーション210
と、オートドライブ211等を含む。
説明するものがあった。図4は従来の音声認識装置を用
いた制御システムを示す図である。本図に示すように、
音声認識装置を用いた制御システムは、車両の車室30
0内の話者の音声を捕捉する二つのマイクロフォン20
0と、該マイクロフォン200からの音声の方向、音源
からの距離から話者を識別する話者方向・距離判定部2
01と、該話者方向・距離判定部201に接続され話者
を識別した音声信号から雑音を消去する適応形処理さら
に自動利得制御(AGC)を行う音声認識の前処理部2
02と、該前処理部202に接続され音声を登録された
どの単語に一致するかを認識する音声認識装置203
と、該音声認識装置203で認識された単語に基づき制
御信号を形成する各種制御部204と、該各種制御部2
04を介して認識された単語を音声に合成する音声合成
部205と、該音声合成部205に接続され合成された
音声を再生するスピーカ206と、前記各種制御部20
4により制御されるオーディオ207と、エアコンデシ
ョナー208と、電話209と、ナビゲーション210
と、オートドライブ211等を含む。
【0003】すなわち、マイクロフォン200で捕捉さ
れた音声は、話者方向距離判定部201、前処理部20
2を介して音声認識装置203により認識され、この認
識結果を各種制御部204、音声合成部205を介して
スピーカ206により話者に伝え、話者の確認を行うト
ークバックにより行われこの確認後に各種制御部204
によりオーディオ207等のそれぞれにつき制御が実行
される。さらに音声認識装置203には制御、例えば制
御対象、制御動作等に必要な単語(文章)が登録されて
おり、入力音声はこの全ての単語とパターンマッチング
により比較される。例えばこの比較された単語は、類似
の程度を示す認識距離に基づく順番で制御対象、制御動
作の候補として記憶され、この候補となった単語を各種
制御部204、音声合成部205を介してスピーカ20
6にトークバックしている。このトークバックされる制
御対象、制御動作等の単語の候補により話者は前記認識
が正しいかを判断した後に、各種制御の実行は開始する
ようにしてある。このトークバックは入力音声に最も近
い順になされるので入力音声の確認が迅速に行われる。
れた音声は、話者方向距離判定部201、前処理部20
2を介して音声認識装置203により認識され、この認
識結果を各種制御部204、音声合成部205を介して
スピーカ206により話者に伝え、話者の確認を行うト
ークバックにより行われこの確認後に各種制御部204
によりオーディオ207等のそれぞれにつき制御が実行
される。さらに音声認識装置203には制御、例えば制
御対象、制御動作等に必要な単語(文章)が登録されて
おり、入力音声はこの全ての単語とパターンマッチング
により比較される。例えばこの比較された単語は、類似
の程度を示す認識距離に基づく順番で制御対象、制御動
作の候補として記憶され、この候補となった単語を各種
制御部204、音声合成部205を介してスピーカ20
6にトークバックしている。このトークバックされる制
御対象、制御動作等の単語の候補により話者は前記認識
が正しいかを判断した後に、各種制御の実行は開始する
ようにしてある。このトークバックは入力音声に最も近
い順になされるので入力音声の確認が迅速に行われる。
【0004】
【発明が解決しようとする課題】しかしながら従来の音
声認識装置203では、入力音声に対応する制御動作等
の候補が上位の候補になるとは限らないので、原則とし
て登録されている全ての単語について順番をつけ、順番
をつけられた候補が順次トークバックされるようにして
いる。このため登録単語が多くなると認識時間が長くか
かるだけでなく演算処理量が増大しているという問題が
ある。
声認識装置203では、入力音声に対応する制御動作等
の候補が上位の候補になるとは限らないので、原則とし
て登録されている全ての単語について順番をつけ、順番
をつけられた候補が順次トークバックされるようにして
いる。このため登録単語が多くなると認識時間が長くか
かるだけでなく演算処理量が増大しているという問題が
ある。
【0005】したがって本発明は上記問題点に鑑みトー
クバックについて認識時間の短縮、演算量の削減を図れ
る音声認識装置を提供することを目的とする。
クバックについて認識時間の短縮、演算量の削減を図れ
る音声認識装置を提供することを目的とする。
【0006】
【課題を解決するための手段】本発明は前記問題点を解
決するために、入力音声と予め登録された複数の単語と
を比較し、入力音声に最も類似した前記単語から順に再
生出力し話者にトークバックして入力音声と一致するか
を判断する音声認識装置に認識距離判定部及び候補出力
を設ける。
決するために、入力音声と予め登録された複数の単語と
を比較し、入力音声に最も類似した前記単語から順に再
生出力し話者にトークバックして入力音声と一致するか
を判断する音声認識装置に認識距離判定部及び候補出力
を設ける。
【0007】前記認識距離判定部は例えば値が小さい程
前記入力音声と登録単語とが類似していることを示す認
識距離が所定値以下であるかを判定する。前記候補出力
は前記認識距離が所定値以下の登録単語のみを入力音声
に対する候補としてトークバックする。
前記入力音声と登録単語とが類似していることを示す認
識距離が所定値以下であるかを判定する。前記候補出力
は前記認識距離が所定値以下の登録単語のみを入力音声
に対する候補としてトークバックする。
【0008】
【作用】本発明の音声認識装置によれば、値が小さい程
前記入力音声と登録単語とが類似していることを示す認
識距離が例えば所定値以下であるかを判定し、すなわち
認識距離の大きいものは入力音声と登録単語とがあまり
類似しておらずこのような単語(文書)が正解である可
能性が低いと判定する。前記認識距離が所定値以下の登
録単語のみを入力音声に対する候補として順次トークバ
ックすることにより、トークバック候補の数が絞り込ま
れるようになった。すなわち正解である可能性が低いと
判定されるものがトークバック候補から省かれるので、
登録単語が多くなっても認識時間が短縮され、演算処理
量が削減される。
前記入力音声と登録単語とが類似していることを示す認
識距離が例えば所定値以下であるかを判定し、すなわち
認識距離の大きいものは入力音声と登録単語とがあまり
類似しておらずこのような単語(文書)が正解である可
能性が低いと判定する。前記認識距離が所定値以下の登
録単語のみを入力音声に対する候補として順次トークバ
ックすることにより、トークバック候補の数が絞り込ま
れるようになった。すなわち正解である可能性が低いと
判定されるものがトークバック候補から省かれるので、
登録単語が多くなっても認識時間が短縮され、演算処理
量が削減される。
【0009】
【実施例】以下本発明の実施例について図面を参照して
説明する。図1は本発明の実施例に係る音声認識装置を
示す図である。なお、全図を通じて同様の構成要素につ
いては同一の参照番号又は記号をもって表す。本図に示
す音声認識装置220は、車両の車室300内の話者の
音声がマイクロフォン200によって捕捉され、音声の
方向、音源からの距離から話者を識別する話者方向・距
離判定部201及び話者を識別した音声信号から雑音を
消去する適応形処理さらに自動利得制御(AGC)を行
う音声認識の前処理部202を介して入力される特徴抽
出部10を具備する。該特徴抽出部10は入力パターン
がパターン固有の性質をもつ特徴量とか特徴パターンと
かを取り出す。
説明する。図1は本発明の実施例に係る音声認識装置を
示す図である。なお、全図を通じて同様の構成要素につ
いては同一の参照番号又は記号をもって表す。本図に示
す音声認識装置220は、車両の車室300内の話者の
音声がマイクロフォン200によって捕捉され、音声の
方向、音源からの距離から話者を識別する話者方向・距
離判定部201及び話者を識別した音声信号から雑音を
消去する適応形処理さらに自動利得制御(AGC)を行
う音声認識の前処理部202を介して入力される特徴抽
出部10を具備する。該特徴抽出部10は入力パターン
がパターン固有の性質をもつ特徴量とか特徴パターンと
かを取り出す。
【0010】さらに前記装置に単語登録部11が設けら
れている。該単語登録部11は、例えば、自動車の制
御、例えば制御対象、制御動作等に必要な単語(文章)
の音声パターンが記憶されている。また前記装置にパタ
ーンマッチング部12が設けられている。該パターンマ
ッチング部12は前記単語登録部の音声パターンと前記
特徴抽出部10により抽出された入力パターンとを比較
し、前記単語登録部に記憶されている全ての単語につい
て類似の程度を示す認識距離を算出する。
れている。該単語登録部11は、例えば、自動車の制
御、例えば制御対象、制御動作等に必要な単語(文章)
の音声パターンが記憶されている。また前記装置にパタ
ーンマッチング部12が設けられている。該パターンマ
ッチング部12は前記単語登録部の音声パターンと前記
特徴抽出部10により抽出された入力パターンとを比較
し、前記単語登録部に記憶されている全ての単語につい
て類似の程度を示す認識距離を算出する。
【0011】前記装置にパターンマッチング12の後段
に認識距離判定部13が設けられる。該認識距離判定部
13はしきい値を有し、前記パターンマッチング部12
で算出された認識距離が前記しきい値を越えるかを判定
する。前記認識装置判定部13の後段に設けられる候補
出力部14は認識距離がしきい値以下の候補のみを前記
各種制御部207に出力する。
に認識距離判定部13が設けられる。該認識距離判定部
13はしきい値を有し、前記パターンマッチング部12
で算出された認識距離が前記しきい値を越えるかを判定
する。前記認識装置判定部13の後段に設けられる候補
出力部14は認識距離がしきい値以下の候補のみを前記
各種制御部207に出力する。
【0012】この候補は音声合成部205を介してスピ
ーカ206から音声として再生され話者にトークバック
される。図2は図1の音声認識装置220におけるトー
クバック候補を形成する一連の信号処理を説明するフロ
ーチャートである。本図に示すように、ステップ1で
は、音声認識装置の特徴抽出部10に話者の音声を入力
する。
ーカ206から音声として再生され話者にトークバック
される。図2は図1の音声認識装置220におけるトー
クバック候補を形成する一連の信号処理を説明するフロ
ーチャートである。本図に示すように、ステップ1で
は、音声認識装置の特徴抽出部10に話者の音声を入力
する。
【0013】ステップ2では、特徴抽出部12により入
力音声のスペクトルパターンが求められる。ステップ3
では、音声認識装置220のパターンマッチング12に
より、予め単語登録部11のメモリ内に格納された登録
単語(文書)のスペクトルパターンと入力音声のスペク
トルパターンが比較される。
力音声のスペクトルパターンが求められる。ステップ3
では、音声認識装置220のパターンマッチング12に
より、予め単語登録部11のメモリ内に格納された登録
単語(文書)のスペクトルパターンと入力音声のスペク
トルパターンが比較される。
【0014】ステップ4では、前記比較では認識距離の
算出は、例えばDP(Dynamic Programming)法が用いら
れ、スペクトルパターンの類似度が定量化され認識距離
x(小さい程類似している)が導出される。ステップ5
では、前記認識距離判定部13により、予め決めておい
た認識距離のしきい値yと上記認識距離xが比較され
る。
算出は、例えばDP(Dynamic Programming)法が用いら
れ、スペクトルパターンの類似度が定量化され認識距離
x(小さい程類似している)が導出される。ステップ5
では、前記認識距離判定部13により、予め決めておい
た認識距離のしきい値yと上記認識距離xが比較され
る。
【0015】ステップ6では、候補出力部14により、
x≦yの条件を満たす単語(文章)だけが認識結果の候
補とし出力され、その他は出力から除外される。ステッ
プ7では、但し、上記ステップ6の候補数が予め決めて
いる最大認識候補数nより少なければ全てを候補とし、
nより多ければ認識距離の近いものかn個を選択しこれ
を最終認識候補とする。
x≦yの条件を満たす単語(文章)だけが認識結果の候
補とし出力され、その他は出力から除外される。ステッ
プ7では、但し、上記ステップ6の候補数が予め決めて
いる最大認識候補数nより少なければ全てを候補とし、
nより多ければ認識距離の近いものかn個を選択しこれ
を最終認識候補とする。
【0016】図3は図1の各種制御部207の制御動作
を説明するフローチャートである。本図に示すステップ
11では、先ず各種制御部207の初期化を行う。ステ
ップ12では、候補出力部14から出力される候補が、
例えば「OK」、「よし」等の機器の制御以外の音声で
あってトークバック候補が正しいとの判断に伴う合図で
あるかを判断する。
を説明するフローチャートである。本図に示すステップ
11では、先ず各種制御部207の初期化を行う。ステ
ップ12では、候補出力部14から出力される候補が、
例えば「OK」、「よし」等の機器の制御以外の音声で
あってトークバック候補が正しいとの判断に伴う合図で
あるかを判断する。
【0017】ステップ13では、もし候補がOK等の合
図でなければ、つぎにトークバック候補が、例えば「N
O」、「だめ」等の間違っているとの判断に伴う合図で
あるかを判断する。ステップ14では、トークバック候
補が制御のための単語であるので、これを保存する。
図でなければ、つぎにトークバック候補が、例えば「N
O」、「だめ」等の間違っているとの判断に伴う合図で
あるかを判断する。ステップ14では、トークバック候
補が制御のための単語であるので、これを保存する。
【0018】ステップ15では、音声合成205を介し
てスピーカ206より、トークバック候補が再生出力さ
れる。そしてステップ12に戻り、「OK」の有無を判
断する。ステップ16では、「OK」があれば、図4に
示すオーディオ207等の制御対象等の制御の実行を開
始する。なお、ステップ13で、「NO」の合図であれ
ば各種制御部204の動作を終了し音声の認識を最初か
らやり直す。
てスピーカ206より、トークバック候補が再生出力さ
れる。そしてステップ12に戻り、「OK」の有無を判
断する。ステップ16では、「OK」があれば、図4に
示すオーディオ207等の制御対象等の制御の実行を開
始する。なお、ステップ13で、「NO」の合図であれ
ば各種制御部204の動作を終了し音声の認識を最初か
らやり直す。
【0019】本実施例によれば、従来の音声認識装置に
おいて常に登録された単語の全てについてトークバック
の候補としていたが、認識距離の大きいものは入力音声
と登録単語とがあまり類似しておらずこのような単語
(文書)が正解である可能性が低いからトークバック候
補から省き、トークバック候補の数が絞り込まれるよう
になった。
おいて常に登録された単語の全てについてトークバック
の候補としていたが、認識距離の大きいものは入力音声
と登録単語とがあまり類似しておらずこのような単語
(文書)が正解である可能性が低いからトークバック候
補から省き、トークバック候補の数が絞り込まれるよう
になった。
【0020】
【発明の効果】以上説明したように本発明によれば、値
が小さい程前記入力音声と登録単語とが類似しているこ
とを示す認識距離が所定値以下であるかを判定し、認識
距離が所定値以下の登録単語のみをトークバックするよ
うにしたので、トークバック候補の数が絞り込まれるよ
うになった。すなわち正解である可能性が低いと判定さ
れるものがトークバック候補から省かれるので、登録単
語が多くなっても認識時間が短縮され、演算処理量が削
減される。
が小さい程前記入力音声と登録単語とが類似しているこ
とを示す認識距離が所定値以下であるかを判定し、認識
距離が所定値以下の登録単語のみをトークバックするよ
うにしたので、トークバック候補の数が絞り込まれるよ
うになった。すなわち正解である可能性が低いと判定さ
れるものがトークバック候補から省かれるので、登録単
語が多くなっても認識時間が短縮され、演算処理量が削
減される。
【図1】本発明の実施例に係る音声認識装置を示す図で
ある。
ある。
【図2】図1の音声認識装置におけるトークバック候補
を形成する一連の信号処理を説明するフローチャートで
ある。
を形成する一連の信号処理を説明するフローチャートで
ある。
【図3】図1の各種制御部207の制御動作を説明する
フローチャートである。
フローチャートである。
【図4】従来の音声認識装置を用いた制御システムを示
す図である。
す図である。
10…特徴抽出部 11…パターンマッチング 13…認識距離判定部 14…候補出力部 200…マイクロフォン 204…各種制御部 206…スピーカ 220…音声認識装置
Claims (1)
- 【請求項1】 入力音声と予め登録された複数の単語と
を比較し、前記入力音声の最も類似した前記単語から順
に再生出力し話者にトークバックして入力音声と一致す
るかを判断する音声認識装置であって、 値が小さい程前記入力音声と登録単語とが類似している
ことを示す認識距離が所定値以下であるかを判定する認
識距離判定部(13)と、 前記認識距離が所定値以下の登録単語のみを前記入力音
声に対する候補として順次トークバックするための候補
出力(14)とを備えることを特徴とする音声認識装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP29591092A JPH06149287A (ja) | 1992-11-05 | 1992-11-05 | 音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP29591092A JPH06149287A (ja) | 1992-11-05 | 1992-11-05 | 音声認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH06149287A true JPH06149287A (ja) | 1994-05-27 |
Family
ID=17826728
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP29591092A Pending JPH06149287A (ja) | 1992-11-05 | 1992-11-05 | 音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH06149287A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000250585A (ja) * | 1999-02-25 | 2000-09-14 | Nippon Telegr & Teleph Corp <Ntt> | 対話型データベース検索方法、装置及び対話型データベース検索プログラムを記録した記録媒体 |
-
1992
- 1992-11-05 JP JP29591092A patent/JPH06149287A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000250585A (ja) * | 1999-02-25 | 2000-09-14 | Nippon Telegr & Teleph Corp <Ntt> | 対話型データベース検索方法、装置及び対話型データベース検索プログラムを記録した記録媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8249867B2 (en) | Microphone array based speech recognition system and target speech extracting method of the system | |
EP0757342B1 (en) | User selectable multiple threshold criteria for voice recognition | |
EP2486562B1 (en) | Method for the detection of speech segments | |
US20020091522A1 (en) | System and method for hybrid voice recognition | |
EP1159735B1 (en) | Voice recognition rejection scheme | |
CN112585674B (zh) | 信息处理装置、信息处理方法和存储介质 | |
JPH11149294A (ja) | 音声認識装置および音声認識方法 | |
JPH06149287A (ja) | 音声認識装置 | |
JP3437492B2 (ja) | 音声認識方法及び装置 | |
KR100322202B1 (ko) | 신경망을 이용한 음성인식장치 및 그 방법 | |
JPH07230293A (ja) | 音声認識装置 | |
WO1994002936A1 (en) | Voice recognition apparatus and method | |
JP3315565B2 (ja) | 音声認識装置 | |
EP1426924A1 (en) | Speaker recognition for rejecting background speakers | |
JPH11109987A (ja) | 音声認識装置 | |
JPH09127982A (ja) | 音声認識装置 | |
WO1992000586A1 (en) | Keyword-based speaker selection | |
JP3002211B2 (ja) | 不特定話者音声認識装置 | |
JPS6312000A (ja) | 音声認識装置 | |
JPH06149285A (ja) | 音声認識装置 | |
JPS5915990A (ja) | 音声認識方式 | |
JPH11149295A (ja) | 音声認識装置 | |
JPH0217038B2 (ja) | ||
JPS62255999A (ja) | 単語音声認識装置 | |
JPS5934596A (ja) | 音声認識処理方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20020219 |