JPH01179997A - 音声認識方法 - Google Patents

音声認識方法

Info

Publication number
JPH01179997A
JPH01179997A JP63004184A JP418488A JPH01179997A JP H01179997 A JPH01179997 A JP H01179997A JP 63004184 A JP63004184 A JP 63004184A JP 418488 A JP418488 A JP 418488A JP H01179997 A JPH01179997 A JP H01179997A
Authority
JP
Japan
Prior art keywords
pattern
input pattern
standard
input
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63004184A
Other languages
English (en)
Inventor
Yoshitake Suzuki
義武 鈴木
Keiichi Nagakura
長倉 恵一
Teruo Hagino
萩野 輝雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP63004184A priority Critical patent/JPH01179997A/ja
Publication of JPH01179997A publication Critical patent/JPH01179997A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、認識対象単語のそれぞれについて、学習時
に音声波形から一定時間長、すなわちフレーム長毎に特
徴量を抽出し、メモリにその特徴量の系列A ” a 
1 、・・・、a1、・・・+  al を標準パタン
として記憶し、学習後の認識時には、入力される音声波
形により抽出される特徴量の系列B−b12・・・、b
J* ・・・、bJと標準パタンとを、動的計画法(D
P)に基づいて照合し、その結果、最も類似度の高い特
徴量の系列を持つ単語名を認識結果として出力する音声
認識方法に関する。
〔従来の技術〕
従来においては入力パタンの標準パタンとの照合距離の
最小値D0があるしきい値りいに対してD□くD□なら
ばそのDlと対応する標準パタンA1を認識候補とし、
あるいは入力パタンと標準パタンとの照合距離の最小値
D□と2番目の最小値D1との差が、あるしきい値DI
mに対して(D−z−D□)〉D1□ならばそのDlと
対応する標準パタンA1を認、jji%候補とし、もし
くは照合距離の最小値D1と、2番目の最小値D1との
比があるしきい値D1□に対して(D a z / D
 @ + ) 〉D1□ならばそのDlと対応する標準
パタンA0をtX*候補としていた。これらの場合りい
+D+z+DI!lは予め経験的に定められ、固定され
た値であった0判定条件としてのしきい値を厳しく設定
すると、発声者の健康状態、疲労度、V!張度などによ
って発声方法や音質等に変化が生じた場合に、入力音声
パタンと当該の標準パタンとの照合距離がしきい値を超
え、その結果、認識候補として正しく選υくされた単語
が棄却される場合があった。
その逆にしきい値をゆるやかに設定すると、認識誤りが
生じた場合でも、照合距離の最小値がしきい値の中に収
まれば、誤った単語が認識候補として出力される場合が
あった。
この発明の目的は、上記の欠点を解決するために、音声
パタンのフレーム長の情報を利用し、DP照合で正しく
選択された単語の棄却を低減するとともに、誤って選択
された単語を棄却とすることにより、誤認識を低減する
音声認識方法を提供することにある。
〔i!題を解決するための手段〕
この発明によれば、DP照合の結果人力tiタンと最も
照合距離の近い標準パタンのフレーム長と入力パタンの
フレーム長との差を用いてしきい値を決定し、照合距離
がそのしきい値に対する判定条件を満たす場合は当該の
標準パタンを認識候補と見なし、それ以外の場合は棄却
する。この発明は、入力音声パタンに対して、選択され
た標準パタンのフレーム長の差が大きい場合には、両者
は互いに異なった単語である確率が高いとし、一方同一
の単語の発声長の揺らぎは比較的少ないという根拠に基
づく。
〔実施例〕
第1図はこの発明の方法の一例を示す、標準パタンメモ
リlには予め学習されたM個の標準パタンAI、・・・
、AMが格納されている。入力パタンメモリ2には入力
パタンBが格納されている。それぞれの系列はDP照合
部3に入力され、AmとB、・・・、Al1とBとの間
で逐次DP照合演算による照合距離D (AmB)が算
出される。 D (A。
B)の計算は、たとえば以下の算術式により行うことが
できる。
(ただし d  (ik、L )”llatm−t)j
mllは、第12フレームの入力パタンと第J、フレー
ムの1準パクンとの距離、Kは、動的計画法により全体
をに個の小区間に区切ったことを示す記号、Wkは区間
にのバスの長さを示す係数であり、そのkについての総
和は照合パスの長さ、また(■in)は、上記の式の値
を最小にするHm、jb)の組をに−1からKまで逐次
辿っていくことを意味する。) 標準パタンA12・・・、Amlと入力パタンBとの照
合距離をそれぞれDr、・・・、D)1とすると、これ
らの値が照合距離最小値選択部4に入力される。
照合距離最小値選択部4においてはDr、・・・+DI
4の中から最小値D0が選択される。ここで添え字m1
はD□を与える標準パタン番号である。Dlは比較部9
に出力される。一方mlはt!!準バツパタンフレーム
長メモリ5ドレスとして出力される。
標準パタンフレーム長メモリ5からは標準パタンmlの
フレーム長し□が出力される。一方、入力パタンフレー
ム長メモリ6には入力パタンフレーム長Lbが格納され
ている。フレーム長差算出部7はL□とLlを入力とし
、LetとLbの差の絶対値yを出力する。すなわち、
y−l Let−Lb  lである。しきい値設定部8
では、予め設定したしきい値初期値C1と、yの関数F
 (y)の値を加えることにより、Dい+(y)−CI
 +F(y)を出力する。ここでF (y) としては
、yの増加にともなって単調に減少する関数、たとえば
負の傾きaをもつ一次閏数F(y)=ayが考えられる
。比較部9では、照合距離最小値選択部4の出力Del
としきい値設定部8の出力D11(y)とを比較し、D
、1くDい、(y)ならば認識候補として標準パタン番
号m1を出力し、D1≧Dい、(y)ならば棄却を示す
値を出力する。
以上、この発明の一実施例を示したが、比較の対象とし
て照合距離の最小値D□と、照合距離の2番目の最小値
D1の差D+z−Daz−D+atを用いることもでき
る。その場合、第1図の4は、照合距離差計算部となり
、4からはDltが比較部9に出力される。また、Dl
を与える標準パタン番号m1が標準パタンフレームメモ
リ5のアドレスとして出力される。しきい値設定部8で
は、予め設定したしきい値初期値C2と、yの関数G 
(y)の値を加えることにより、Dtbv(y) −C
,2+ G (y)を出力する。ここでG (y)とし
ては、yの増加にともなって単調に増加する関数、たと
えば正の傾きbをもつ一次関数G(y)−byが考えら
れる。
比較部9では、照合距離の最終値り、と2番目の照合距
j!I最小値り6.との差D+x−D−t−D□とDい
よ(y)とを入力とし、DIl>DLk□(y)であれ
ばmlを認m候補とし、[)+1≦Dthx(いであれ
ば認識候補を棄却する。
また、比較の対象として照合距離の最小値D□と、照合
距離の2番目の最小値り、!の比D1□−D−z/D□
を用いることもできる。その場合、第1図の4は、照合
圧は比計算部となり、4からはD1□が比較部9に出力
される。また、D□を与える標準パタン番号m1が標準
パタンフレームメモリ5のアドレスとして出力される。
しきい値設定部8では、予め設定したしきい値初期値C
3と、yの関数H(y)の値を加えることにより、Dい
、(y)−C3+H(y)を出力する。ここでH(y)
としては、yの増加にともなって単調に増加する関数、
たとえば正の(頃きCをもつ一次閏敗H(y)−ayが
考えられる。比較部9では、上記D111とDい、(y
)とを入力とし、D、□〉Dい、(y)であればmlを
認識候補とし、D1□≦Dい、(y)であれば認識候補
を棄却する。
さらに、その他の実施例としては、比較の対象として、
上述した照合距離最小値D1、照合距離差D1□、およ
び照合距離比D1□を併用することができる。このとき
、第1図の4においては、上述のDlとI)+zとD1
□を出力する。また、しきい値設定部8では上述した方
法によりしきい値Dt++()’)、Dい、(y)、お
よびDい、(y)を計算し、出力する。比較部9におい
ては、DmlとDい、(y)、D1□とD□8(ν)、
Dm1lとDい、(y)の値をそれぞれ比較する。そし
て、D ml < D cb+ (y)かつり、8〉D
い2(y)かつD+□〉Dい、(y)ならば、認識候補
として照合距離が最小となる!!!準パタンm1を出力
し、その他の場合には認識候補を棄却する。
次に、照合距離しきい値りいとフレーム長差yとの関係
を、第2図により説明する。第2図(alは、縦軸を照
合距離D、横軸を入力パタンと標準パタンのフレーム長
差yとした座標平面である。標準パタンと入力パタンと
の照合結果は、両パクンのフレーム長差および照合距離
値が算出されれば、この平面上の一点に定まる。従来の
しきい値D1゜と、この発明のしきい値Dz、(y)と
は、この平面上では直線で示される。Dい、はフレーム
長差yにかかわらず一定値、またはDい+(y)−C1
+ay。
(a<Q)とした、照合距離最小値D1がこれらの直線
よりも小さい領域に入るとき、mlは認識候補と見なさ
れる0図中の領域a1に!?!識候補の照合結果が入っ
た場合、従来の方法では認識@補を棄却するが、この発
明の方法ではこれを認識候補と見なす、これは、同一単
語に対する種々の発声の1zらぎに対しての棄却率を低
減する効果がある0図中の領域a2に認識候補の照合結
果が入った場合、従来の方法ではパタン間のフレーム長
差を考慮しないため、これを認識候補と見なす、ところ
が、この発明のしきい値を用いれば、a2に照合結果が
入ってもこれを棄却する。すなわち、入力パタンと認識
@補となったa!準パタンとのフレーム数の差が大きく
なるほど、両パタンは異なる単語である可能性が強いと
して、照合結果に対して、フレーム長差に応じたペナル
ティを与えていると解釈することができる。
第2図fblについても同じく、縦軸は照合距離の差り
を表し、横軸はフレーム長差yを示す、従来の方法では
しきい値DIlbはyにかかわらず一定であり、照合距
離最小値D1と照合距離の2番目の最小値D1との差D
+z−D+m*−DmlがI)+zbより小さければ認
識候補棄却となった。この発明のしきい値はDthz(
y)”C2+by、  (b>O)?ある。D+tbと
othx(y)との差は6I域b1およびb2となる。
照合結果が領域b2に入った場合、従来のしきい値を用
いた場合にはこれが認識候補と見なされるが、この発明
のしきい値を用いるとこれは棄却される。すなわち、D
□を与える標準パタンm1と入力パタンのフレーム長の
差が太きくなるほど、両パタンは異なる単語であるとい
う可能性が強いとして、そのときには照合距離が2番目
に小さいパタンm2との照合距離の差D1□が大きくな
ければ、mlは誤認識である可能性が高いと解釈するこ
とができる。
しきい値として照合距離の比を用いる場合も第2図(b
lと同様になるため、ここでの説明は省略する。
さらに、認識候補の判定に上記のDlとD1□とDI□
を組み合わせて用いることも可能である。
〔発明の効果〕
以上説明したようにこの発明は、入力パタンと+!i準
パタンとのフレーム長の差に応じて、認識結果の判定基
準を制御することにより、従来生じていた、■しきい値
を厳しく設定すると、発声者の健康状態、疲労度、緊張
度などによって発声方法や音質等に変化が生じた場合に
、入力音声パタンと当該の標準パタンとの照合距離がし
きい値を超え、その結果、認識候補として正しく選択さ
れた単語が棄却される。■しきい値をゆるやかに設定す
ると、認識誤りが生じた場合でも、照合距離の最小値が
しきい値の中に収まれば、誤った単語が認識候補として
出力される、という欠点を減少させる効果がある。
【図面の簡単な説明】
第1図はこの発明の実施例のプロンク構成図、第2図は
この発明の具体的な作用を示す図である。 特許出願人:日本電信電話株式会社

Claims (3)

    【特許請求の範囲】
  1. (1)予め、入力される認識対象単語のそれぞれについ
    て音声波形から一定時間(以後これをフレームと称す)
    毎に特徴量を抽出し、メモリにその特徴量の系列A=a
    _1、・・・、a_i、・・・、a_Iを標準パタンと
    して記憶する(以後これを学習という)とともに、学習
    後の認識時においては、入力される音声波形より抽出さ
    れる特徴量の系列(入力パタン)B=b_1、・・・、
    b_j、・・・、b_Jと、上記の方法で予め学習され
    たM(M>1)種類の特徴量A_1、・・・、A_Mと
    の照合を動的計画法(ダイナミックプログラミング;以
    下DPと略す)に基づいて行い、入力パタンBとの照合
    距離D(A、B)を全ての標準パタンAについて計算し
    、入力パタンBに対して照合距離D(A、B)を最小化
    する標準パタンA_mを入力パタンBの認識候補とする
    音声認識方法において、 M個の標準パタンの中で入力パタンとの照合距離の最小
    値D_m_1が、あるしきい値D_t_hに対して、D
    _m_1<D_t_hならば、当該最小値D_m_1と
    対応する標準パタンA_m_1を認識候補と決定し、か
    つしきい値D_t_hの値を標準パタンA_m_1のフ
    レーム長L_m_1と入力パタンのフレーム長L_bと
    の差に応じて変化させることを特徴とする音声認識方法
  2. (2)予め、入力される認識対象単語のそれぞれについ
    て音声波形から一定時間(以後これをフレームと称す)
    毎に特徴量を抽出し、メモリにその特徴量の系列A=a
    _1、・・・、a_i、・・・、a_Iを標準パタンと
    して記憶する(以後これを学習という)とともに、学習
    後の認識時においては、入力される音声波形より抽出さ
    れる特徴量の系列(入力パタン)B=b_1、・・・、
    b_j、・・・、b_Jと、上記の方法で予め学習され
    たM(M>1)種類の特徴量A_1、・・・、A_Mと
    の照合を動的計画法(ダイナミックプログラミング;以
    下DPと略す)に基づいて行い、入力パタンBとの照合
    距離D(A、B)を全ての標準パタンAについて計算し
    、入力パタンBに対して照合距離D(A、B)を最小化
    する標準パタンA_mを入力パタンBの認識候補とする
    音声認識方法において、 照合距離の最小値D_m_1と、2番目の最小値D_m
    _2との差が、あるしきい値D_1_2に対して、(D
    _m_2−D_m_1)>D_1_2ならば当該最小値
    D_m_1と対応する標準パタンA_m_1を認識候補
    と決定し、かつしきい値D_1_2の値を標準パタンA
    _m_1のフレーム長L_m_1と入力パタンのフレー
    ム長L_bの差に応じて変化させることを特徴とする音
    声認識方法。
  3. (3)予め、入力される認識対象単語のそれぞれについ
    て音声波形から一定時間(以後これをフレームと称す)
    毎に特徴量を抽出し、メモリにその特徴量の系列A=a
    _1、・・・、a_i、・・・、a_Iを標準パタンと
    して記憶する(以後これを学習という)とともに、学習
    後の認識時においては、入力される音声波形より抽出さ
    れる特徴量の系列(入力パタン)B=b_1、・・・、
    b_j、・・・、b_Jと、上記の方法で予め学習され
    たM(M>1)種類の特徴量A_1、・・・、A_Mと
    の照合を動的計画法(ダイナミックプログラミング;以
    下DPと略す)に基づいて行い、入力パタンBとの照合
    距離D(A、B)を全ての標準パタンAについて計算し
    、入力パタンBに対して照合距離D(A、B)を最小化
    する標準パタンA_mを入力パタンBの認識候補とする
    音声認識方法において、 照合距離の最小値D_m_1と、2番目の最小値D_m
    _2との比が、あるしきい値D_1_2_Rに対して、
    (D_m_2/D_m_1)>D_1_2_Rならば当
    該最小値D_m_1と対応する標準パタンA_m_1を
    認識候補と決定し、かつしきい値D_1_2_Rの値を
    学習パタンA_m_1のフレーム長L_m_1と入力パ
    タンのフレーム長L_bの差に応じて変化させることを
    特徴とする音声認識方法。
JP63004184A 1988-01-11 1988-01-11 音声認識方法 Pending JPH01179997A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63004184A JPH01179997A (ja) 1988-01-11 1988-01-11 音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63004184A JPH01179997A (ja) 1988-01-11 1988-01-11 音声認識方法

Publications (1)

Publication Number Publication Date
JPH01179997A true JPH01179997A (ja) 1989-07-18

Family

ID=11577618

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63004184A Pending JPH01179997A (ja) 1988-01-11 1988-01-11 音声認識方法

Country Status (1)

Country Link
JP (1) JPH01179997A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08297500A (ja) * 1995-02-28 1996-11-12 Meidensha Corp 離散単語音声認識システムにおける誤認識不能処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08297500A (ja) * 1995-02-28 1996-11-12 Meidensha Corp 離散単語音声認識システムにおける誤認識不能処理方法

Similar Documents

Publication Publication Date Title
EP1269464B1 (en) Discriminative training of hidden markov models for continuous speech recognition
US5794190A (en) Speech pattern recognition using pattern recognizers and classifiers
US5621849A (en) Voice recognizing method and apparatus
US6397180B1 (en) Method and system for performing speech recognition based on best-word scoring of repeated speech attempts
US20050071161A1 (en) Speech recognition method having relatively higher availability and correctiveness
JPH03201079A (ja) パターンマッチング装置
US6438519B1 (en) Apparatus and method for rejecting out-of-class inputs for pattern classification
JPH08227408A (ja) ニューラルネットワーク
JP2000298663A (ja) ニューラルネットワークを用いた認識装置およびその学習方法
WO2005069221A1 (ja) パターン識別システム、パターン識別方法、及びパターン識別プログラム
JP2019057087A (ja) 文字認識方法及び文字認識システム
JPH01179997A (ja) 音声認識方法
EP1414023B1 (en) Method for recognizing speech
Niimi et al. Analysis of interactive strategy to recover from misrecognition of utterances including multiple information items
CN100511424C (zh) 语音识别方法
JPH06348291A (ja) 単語音声認識方法
JPH0554116B2 (ja)
EP0526515B1 (en) Pattern recognition
JPS6068484A (ja) オンライン手書き文字認識処理方式
JPH04106674A (ja) パターン認識方法
JP3659688B2 (ja) 文字認識装置
JPS62111292A (ja) 音声認識装置
KR100476337B1 (ko) 음성인식기의유사단어인식방법
JPS6175982A (ja) パタン認識装置
JP2875678B2 (ja) 文字認識結果の後処理方法