JP3063856B2 - 音声認識におけるマッチング距離値の極小値探索方法 - Google Patents

音声認識におけるマッチング距離値の極小値探索方法

Info

Publication number
JP3063856B2
JP3063856B2 JP2325830A JP32583090A JP3063856B2 JP 3063856 B2 JP3063856 B2 JP 3063856B2 JP 2325830 A JP2325830 A JP 2325830A JP 32583090 A JP32583090 A JP 32583090A JP 3063856 B2 JP3063856 B2 JP 3063856B2
Authority
JP
Japan
Prior art keywords
value
matching distance
minimum value
frame
distance value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2325830A
Other languages
English (en)
Other versions
JPH04199000A (ja
Inventor
渉 高橋
正範 牛込
昇 菅村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Oki Electric Industry Co Ltd
Original Assignee
Nippon Telegraph and Telephone Corp
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, Oki Electric Industry Co Ltd filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2325830A priority Critical patent/JP3063856B2/ja
Publication of JPH04199000A publication Critical patent/JPH04199000A/ja
Application granted granted Critical
Publication of JP3063856B2 publication Critical patent/JP3063856B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、入力音声の特徴パタンと標準パタンとの連
続DP(Dynamic Programming)マッチング方式によって
得られたマッチング距離値における極小値を求める方法
に関するものである。
[従来の技術] 音声認識装置においては、入力音声について得られた
特徴パタンと、予め所定の単語等について用意されてい
る複数の標準パタンとのマッチング距離値(類似度)を
求めて、このマッチング距離値に基づいて入力音声を特
定(認識)する。この際、入力音声における音素又は音
節と標準パタンにおける音素又は音節との対応をとるこ
となく実行できる非線形マッチング方法が採用されるこ
とが多く、しかも、計算量の削減のためにそのうちの連
続DPマッチング方式が採用されることが多い。
この連続DPマッチング方式においては、マッチング距
離値の極小値情報に基づいて、対象となっている標準パ
タンにかかる音声(単語等)が入力音声に含まれている
か否か等を判断している。第2図は、極小値情報がかか
る判別に用いられることを説明する概念図である。
入力音声に含まれている単語や音節等についての1個
の標準パタンと、入力音声についての時系列の特徴パタ
ンとのマッチング距離値を順次求めていく場合を考え
る。なお、第2図におけるパタンを表す数値列は、実際
の数値列とは異なり、この説明に用いる仮想的な数値列
である。
入力音声の特徴パタンと標準パタンとが無関係なとき
は、第2図(A)に示すように、マッチング距離値は大
きな値をとり、このような無関係な区間ではこのような
大きな値を連続させる。入力音声の特徴パタンの入力が
進み、標準パタンとの一致部分が生じると、マッチング
距離値はその一致部分が大きくなるに従い、徐々に小さ
くなっていく(第2図(B)〜(D))。そして、入力
音声の特徴パタンと標準パタンとが一致したときにマッ
チング距離値は最も小さな値となる(第2図(E))。
さらに、入力音声の特徴パタンの入力が進むと一致部分
が少なくなって徐々にマッチング距離値が大きくなって
いき(第2図(F))、一致部分もなくなるとマッチン
グ距離値は第2図(A)に示すような大きな値に戻る。
このように、入力音声に含まれている単語や音節等に
ついての1個の標準パタンに対するマッチング距離値の
変化は、極小値を有するものとなり、極小値を検出する
ことで、その単語や音節が含まれているか否か及び含ま
れている位置情報を得ることができる。
第3図(A)〜(D)は、入力音声「あたまがいた
い」の特徴パタン列と、4個の標準パタン「あたま」、
「が」、「いたい」及び「はら」のそれぞれとのマッチ
ング距離値の時間変化を示すものである。標準パタン
「あたま」に対するマッチング距離値は、第3図(A)
に示すように早い時期で極小値をとり、標準パタン
「が」に対するマッチング距離値は、第3図(B)に示
すように中間時期に極小値をとり、標準パタン「いた
い」に対するマッチング距離値は、第3図(C)に示す
ように遅い時期で極小値をとる。入力音声「あたまがい
たい」に含まれていない標準パタン「はら」についての
マッチング距離値は、第3図(D)に示すようにほぼ一
定値をとる。
このように複数の標準パタンとのマッチング距離を
得、その極小値情報に基づいて入力音声を特定(認識)
することができる。
このように連続DPマッチング方式においては、マッチ
ング距離値の極小値を検出することが重要である。従
来、複数のマッチング距離値から極小値を以下のように
して検出(探索)していた。
第4図は、1つの標準パタンとのマッチング距離値を
時間軸上に並べた図であり、入力音声サンプル値を複数
毎に纏めた複数の処理フレーム(同一サンプル値が複数
のフレームの成分になっていても良い)のうちn番目の
処理フレーム(以下、単にnフレームと呼ぶ)を中心と
した複数フレームのマッチング距離値を示している。
今、nフレームが極小値のフレームか否かの判定対象
フレームとする。極小値である場合には、nフレームの
マッチング距離値は、その近傍のフレームのマッチング
距離値より小さい値になっているので、当該nフレーム
のマッチング距離値を近傍の各フレーム(n−mフレー
ムからn+mフレーム)のマッチング距離値と順次大小
比較し、近傍の全フレームより小さいときに極小値と判
断し、いずれかのフレームよりその値が大きいことを検
出したときに極小値でないと判定するようにしていた。
ここで、nフレームのマッチング距離値とマッチング
距離値を大小比較するフレームを、従来は単純に、n−
mフレームからn+mフレームへ向けて変化させてい
た。
[発明が解決しようとする課題] しかしながら、従来の極小値探索方法では、1個の処
理対象フレームがある標準パタンについて極小値フレー
ムであるか否かを判別するのに必要な平均的な比較回数
も多いものであった。例えば、第5図に示すように、単
調増加変化の中間に処理対象のnフレームが位置する場
合には、1回の比較で極小値でないことは検出できる
が、第6図に示すように、単調減少変化の中間に処理対
象のnフレームが位置する場合には、n+1回の比較で
始めて極小値でないことが検出でき、平均的には多くの
比較回数を必要とする。
極小値か否かの判断は、処理対象フレームが変化する
ごとに実行が必要なものであり、上述のように1個の処
理対象フレームに対する平均的比較回数が多いことは大
きな問題となる。
さらに、各標準パタンに対して極小値を探索すること
を必要とし、この点からも、上述のように1個の処理対
象フレームに対する平均的比較回数が多いことは大きな
問題となる。実際上、特定用途向け(例えば医療用)の
音声認識装置であっても、現状では、標準パタンとして
1000〜2000個程度必要である。
以上のように、従来では、マッチング距離値の極小値
探索に多くの時間を必要とし、この面から音声認識を遅
いものとしていた。
本発明は、以上の点を考慮してなされたものであり、
マッチング距離値の極小値探索を高速に実行することが
できる音声認識におけるマッチング距離値の極小値探索
方法を提供しようとするものである。
[課題を解決するための手段] 本発明は、音声認識装置を用いて、入力音声から抽出
した特徴パタンと標準パタンとのマッチング距離値が極
小値となる標準パタン及び極小値の位置情報を得る音声
認識におけるマッチング距離値の極小値探索方法におい
て、入力音声から特徴パタンを抽出する工程と、抽出し
た特徴パタンに対し、処理対象フレームを順次変えなが
ら、予め用意されている複数の標準パタンの各々とのマ
ッチング距離値を求める工程と、マッチング距離値が所
定の閾値よりも小さくなる処理対象フレームを抽出する
工程と、抽出した処理対象フレームのマッチング距離値
とその近傍フレームのマッチング距離値とを大小比較
し、ある処理対象フレームがある標準パタンの極小値に
なっているか否かを判断する工程とを有し、前記大小比
較を、比較対象とする近傍フレームを、処理対象フレー
ムの前側及び後側を交互に切り替えながら、しかも、徐
々に処理対象フレームとの時間差が大きくなるように選
んでいくようにして行うことを特徴とするものである。
[作用] 本発明において、処理対象フレームのマッチング距離
値と、マッチング距離値が大小比較されるフレームを、
前側及び後側で交互に変えるようにしたのは、単調増加
変化及び単調減少変化の中間に処理対象フレームが位置
しても、両者の場合共に迅速に極小値でないことを検出
できるようにしたためである。
また、処理対象フレームに時間が近いフレームから比
較対象フレームとするようにしたのは、処理対象フレー
ムに近い位置に極小値フレームがあったときに、当該処
理対象フレームを極小値フレームでないと迅速に検出で
きるようにしたためである。
[実施例] 以下、本発明の一実施例を図面を参照しながら詳述す
る。
ここで、第1図はこの実施例によるマッチング距離値
の極小値探索方法の処理フロートチャート、第7図はこ
の実施例の極小値探索方法が適用された音声認識装置の
機能ブロック図である。
第7図において、マイクロフォン1によって補足され
た入力音声信号(アナログ信号)は、アナログ/デジタ
ル変換部2に与えられ、このアナログ/デジタル変換部
2によって例えば12kHzでサンプリングされ、デジタル
データ列に変換されて特徴パタン抽出部3に与えられ
る。特徴パタン抽出部3は、連続する所定個数のサンプ
リングデータを1フレームとして所定の分析(例えばLP
C分析等)を行ない、フレーム毎に入力音声情報が圧縮
された特徴パタンを抽出する。このようにして抽出され
た特徴パタン列は照合演算部4に与えられる。照合演算
部4には関連して標準パタン記憶部5が設けられてお
り、照合演算部4は、入力音声の特徴パタンと各標準パ
タンとの連続DPマッチングを行ない、その結果であるマ
ッチング距離値列を極小値探索部6に与える。
極小値探索部6は、第1図に示す処理を実行して、処
理対象フレームの特徴パタンとのマッチング距離値がそ
の処理対象フレームについて極小値を取る標準パタン
(複数のこともある)を得て処理対象フレームを明らか
にしてその標準パタン情報をセーブする。また、この
際、極小値のマッチング距離値もセーブする。
認識処理部7は、同一フレームについて極小値をとる
標準パタンが複数ある場合には、マッチング距離値に基
づいて1個の標準パタンに絞り込んだ後、極小値を有す
る標準パタンについての単語等を極小値が現れた位置順
に繋げて入力音声の認識結果を得る(第3図参照)。
次に、この実施例の最も特徴部分である極小値探索部
6の処理を第1図に基づいて説明する。
極小値探索部6は、入力音声の特徴パタン列のフレー
ム毎に第1図に示す処理を繰返す。ここで、処理対象フ
レームをnフレームとする。
nフレームが極小値探索にかかる処理対象フレームに
なると、第1図に示す処理を開始し、まず、標準パタン
を特定するパラメータiを初期値0にする(ステップ10
0)。
その後、照合演算部4から与えられた、入力音声のn
フレームの特徴パタンと標準パタンiとのマッチング距
離値D(i,n)が閾値THより小さいことを確認する(ス
テップ101)。
これは標準パタンiが対応していないものであっても
部分的に極小値を有することがあることに鑑みて設けら
れた処理ステップである。このような極小値は真に標準
パタンiが対応している場合の極小値より格段的に大き
く、閾値THを適当に選定することで対応していない偽の
極小値を排除することができる。
処理対象のnフレームのマッチング距離値D(i,n)
が真の極小値の可能性を有しない場合には、標準パタン
パラメータiを1インクリメントして次の標準パタンを
指示するものとした後、このインクリメントされたパラ
メータiを標準パタン個数DICNと比較することで、全標
準パタンに対する処理を終了していないことを確認して
上述したステップ101に戻る(ステップ108、109)。な
お、パラメータiの初期値を0としているので、全標準
パタンについての処理が終了したときにはパラメータi
はDICNとなっており、ステップ109で肯定結果が得られ
て当該処理が終了することになる。
ステップ101の判別の結果、処理対象のnフレームの
マッチング距離値D(i,n)が真の極小値の可能性を有
すると判定されると、このnフレームのマッチング距離
値D(i,n)と、直前のn−1フレームのマッチング距
離値D(i,n−1)との大小比較を行なう(ステップ10
2)。nフレームのマッチング距離値D(i,n)大きけれ
ば、このnフレームは極小値フレームでないので、上述
したステップ108に進んで次の標準パタンを対象とす
る。
他方、nフレームのマッチング距離値D(i,n)がn
−1フレームのマッチング距離値D(i,n−1)より小
さければ(等しい場合を含む)、このマッチング距離値
D(i,n)と、直後のn+1フレームのマッチング距離
値D(i,n+1)との大小比較を行なう(ステップ10
3)。この場合でも、nフレームのマッチング距離値D
(i,n)が大きければ、このnフレームは極小値フレー
ムでないので、上述したステップ108に進んで次の標準
パタンを対象とする。
この判別によっても極小値の可能性を有すると判定さ
れると、処理対象のnフレームのマッチング距離値D
(i,n)とn−2フレームのマッチング距離値D(i,n−
2)との大小比較を行なう(ステップ104)。この場合
でも、nフレームのマッチング距離値D(i,n)が大き
ければ、nフレームは極小値フレームでないので、上述
したステップ108に進んで次の標準パタンを対象とし、
他方、極小値の可能性が残っていれば、n+2フレーム
のマッチング距離値D(i,n+2)との大小比較を行な
う(ステップ105)。
以下、同様にして、前側についてはn−mフレームの
マッチング距離値D(i,n−m)、後側についてはn+
mフレームのマッチング距離値D(i,n+m)までの大
小比較を極小値の可能性を有するならば順次行なう(…
ステップ106)。この場合に、比較対象のフレームを、
当該処理対象フレームの前側及び後側を交互に変化させ
ると共に、当該処理対象のnフレームとの時間差が徐々
に大きくなるように変更させていく。
ここで、mは極小値か否かを見極めるための範囲を規
定するものであり、例えば3程度が妥当である。このm
が大きければ極小値探索の平均処理時間が長くなり、小
さすぎれば誤検出の恐れが大きくなるためである。
また、上述のように、処理対象のnフレームのマッチ
ング距離値D(i,n)と、マッチング距離値が大小比較
されるフレームを、前側及び後側で交互に変えるように
したのは、第5図及び第6図に示すような単調増加変化
及び単調減少変化の中間に処理対象フレームが位置して
も、両者の場合共に迅速に極小値でないことを検出でき
るようにしたためである。
さらに、上述のように、処理対象のnフレームに時間
が近いフレームから比較対象フレームとするようにした
のは、nフレームに近い位置に極小値フレームがあった
ときに、当該nフレームを極小値フレームでないと迅速
に検出できるようにしたためである。
ステップ102から106の判断の結果、n−mフレームか
らn+mフレームの間では、当該nフレームのマッチン
グ距離値D(i,n)が最小値(極小値)であると判断さ
れると、標準パタンパラメータi、処理対象フレームを
指示するパラメータn及びマッチング距離値D(i,n)
をセーブして、上述したステップ108に進んで次の標準
パタンを対象とする(ステップ107)。
このようにしてセーブされた情報が、上述したように
認識処理部7で利用される。
以上のように、この実施例によれば、処理対象のnフ
レームが標準パタンiについて極小値フレームか否かを
判断する比較対象のフレームを、nフレームの前側及び
後側を交互に切り替えながら、しかも、徐々にnフレー
ムとの時間差が大きくなるように選んでいくようにした
ので、極小値でないことを検出する平均時間を従来より
短くすることができる。その結果、音声認識時間を短く
することができる。
この探索時間は、実際上、照合演算部4における1フ
レーム当りの処理時間とのバランスが良好となり、並行
処理が有効に機能し、この点からも音声認識時間を短い
ものとすることができる。因に、従来は、両者の処理時
間はバランスしておらず、並行処理が有効に機能してい
なかった。
なお、上述の実施例では、処理対象フレームについて
複数の標準パタンが極小値を有するものとなることがあ
り、これの絞り込みを認識処理部7で行なうものを示し
たが、極小値探索部6で行なうようにしても良い。
また、第1図に示す処理は、一例であって種々の変形
が可能である。例えば、最初の比較対象を後側のフレー
ムのマッチング距離値とするようにしても良く、また、
比較対象フレームを固定して標準パタンを変えながら処
理し、その後に比較対象フレームを変更するものであっ
ても良い。
[発明の効果] 以上のように、本発明によれば、極小値探索部が処理
対象フレームのマッチング距離値が極小値か否かをある
標準パタンについて判断する際に、大小比較を行なう対
象フレームを、処理対象フレームの前側及び後側を交互
に切り替えながら、しかも、徐々に処理対象フレームと
の時間差が大きくなるように選んでいくようにしたの
で、極小値でないことを検出する平均時間を従来より短
くすることができ、音声認識時間を従来より短くするこ
とができる。
【図面の簡単な説明】
第1図は本発明の一実施例による極小値探索処理を示す
フローチャート、第2図及び第3図はマッチング距離値
列における極小値の意味の説明図、第4図は従来の極小
値探索方法の説明図、第5図及び第6図は従来の欠点の
説明図、第7図は上記実施例にかかる音声認識装置の構
成を示すブロック図である。 3……特徴パタン抽出部、4……照合演算部、5……標
準パタン記憶部、6……極小値探索部、7……認識処理
部、n……処理対象フレーム、i……標準パタン、DICN
……標準パタン数、D(i,n)……nフレームの標準パ
タンiについてのマッチング距離値、m……比較対象の
フレーム範囲を規定する数。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 菅村 昇 東京都千代田区内幸町1丁目1番6号 日本電信電話株式会社内 (56)参考文献 特開 平4−198999(JP,A) 特開 平1−116599(JP,A) 特開 平1−116598(JP,A) 特開 平1−116597(JP,A) 特開 昭61−20096(JP,A) 特開 昭62−65091(JP,A) 特許2534125(JP,B2) 特許2506808(JP,B2) 特公 昭61−40120(JP,B2) (58)調査した分野(Int.Cl.7,DB名) G10L 15/00 - 17/00 H03H 21/00 JICSTファイル(JOIS)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】音声認識装置を用いて、入力音声から抽出
    した特徴パタンと標準パタンとのマッチング距離値が極
    小値となる標準パタン及び極小値の位置情報を得る音声
    認識におけるマッチング距離値の極小値探索方法におい
    て、 入力音声から特徴パタンを抽出する工程と、 抽出した特徴パタンに対し、処理対象フレームを順次変
    えながら、予め用意されている複数の標準パタンの各々
    とのマッチング距離値を求める工程と、 マッチング距離値が所定の閾値よりも小さくなる処理対
    象フレームを抽出する工程と、 抽出した処理対象フレームのマッチング距離値とその近
    傍フレームのマッチング距離値とを大小比較し、ある処
    理対象フレームがある標準パタンのの極小値になってい
    るか否かを判断する工程とを有し、 前記大小比較を、比較対象とする近傍フレームを、処理
    対象フレームの前側及び後側を交互に切り替えながら、
    しかも、徐々に処理対象フレームとの時間差が大きくな
    るように選んでいくようにして行うことを特徴とするこ
    とを特徴とする音声認識におけるマッチング距離値の極
    小値探索方法。
JP2325830A 1990-11-29 1990-11-29 音声認識におけるマッチング距離値の極小値探索方法 Expired - Fee Related JP3063856B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2325830A JP3063856B2 (ja) 1990-11-29 1990-11-29 音声認識におけるマッチング距離値の極小値探索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2325830A JP3063856B2 (ja) 1990-11-29 1990-11-29 音声認識におけるマッチング距離値の極小値探索方法

Publications (2)

Publication Number Publication Date
JPH04199000A JPH04199000A (ja) 1992-07-20
JP3063856B2 true JP3063856B2 (ja) 2000-07-12

Family

ID=18181085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2325830A Expired - Fee Related JP3063856B2 (ja) 1990-11-29 1990-11-29 音声認識におけるマッチング距離値の極小値探索方法

Country Status (1)

Country Link
JP (1) JP3063856B2 (ja)

Also Published As

Publication number Publication date
JPH04199000A (ja) 1992-07-20

Similar Documents

Publication Publication Date Title
JPS62217295A (ja) 音声認識方式
EP0614169B1 (en) Voice signal processing device
JP2996019B2 (ja) 音声認識装置
JP3063856B2 (ja) 音声認識におけるマッチング距離値の極小値探索方法
JPH05119792A (ja) 音声認識装置
JP3063855B2 (ja) 音声認識におけるマッチング距離値の極小値探索方法
JP2002062892A (ja) 音響分類装置
JP3477751B2 (ja) 連続単語音声認識装置
JP3114757B2 (ja) 音声認識装置
JP2001083978A (ja) 音声認識装置
JP3458285B2 (ja) 音声認識装置
JP2757356B2 (ja) 単語音声認識方法および装置
JP3473704B2 (ja) 音声認識装置
JPH0997095A (ja) 音声認識装置
JPH10171488A (ja) 音声認識方法及び装置及び記憶媒体
JPS59170894A (ja) 音声区間の切り出し方式
JPH0262879B2 (ja)
JP2744622B2 (ja) 破裂子音識別方式
JP2768938B2 (ja) パターン比較方法
KR20010091093A (ko) 음성 인식 및 끝점 검출방법
JPH02296297A (ja) 音声認識装置
JP2000515991A (ja) パターン認識
JPH03118600A (ja) 音声認識装置
JP2643202B2 (ja) 入力音声の定常部、過渡部、不確定部の検出装置
JPS63173100A (ja) キ−ワ−ド抽出装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080512

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090512

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees