JPH0556518B2 - - Google Patents

Info

Publication number
JPH0556518B2
JPH0556518B2 JP60135365A JP13536585A JPH0556518B2 JP H0556518 B2 JPH0556518 B2 JP H0556518B2 JP 60135365 A JP60135365 A JP 60135365A JP 13536585 A JP13536585 A JP 13536585A JP H0556518 B2 JPH0556518 B2 JP H0556518B2
Authority
JP
Japan
Prior art keywords
pattern
distance
matching window
calculation
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP60135365A
Other languages
English (en)
Other versions
JPS61292698A (ja
Inventor
Kunio Nakajima
Yasushi Ishikawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP60135365A priority Critical patent/JPS61292698A/ja
Publication of JPS61292698A publication Critical patent/JPS61292698A/ja
Publication of JPH0556518B2 publication Critical patent/JPH0556518B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は音声パタン等で代表される時系列パ
タンについて、2つのパタン間の類似度を算出す
るパタン類似度計算装置に関するものである。
〔従来の技術〕
音声の特徴を表すためには、短時間ΔTの間隔
で音声を区切り、各区切りの内の音声をスペクト
ル分析し、そのスペクトクルを表すベクトルai(ai
はたとえば12元のベクトルである)の時系列a1
a2,…,ai,…aIを音声パタンAとして表す。
この音声パタンAと標準の音声パタンB(b1
b2,…,bj,bJで表されるとする)との類似度を
計算して2つの音声パタンA,Bがたとえば同一
の単語を発音したものであるか否かを判定する場
合がある。この判定において考慮すべき点は発声
速度の変動があることで、パタンAもパタンBも
同一人が同一単語を発声したときのパタンである
とし、共に同一の時間単位ΔTで区切つたとして
も、一般にはI≠Jである。また、このような場
合にa1はb1に対応し、aIはbJに対応することはわ
かるが、中間のbjがどのaiに対応するかはわから
ない。また、一般にはaiとbjとの対応は非線形で
ある。
パタンAとパタンBとの類似度は両パタンの平
均距離に負の符号を付した数値で表し、すなわ
ち、平均距離が小さいほど類似度が大きいとす
る。
第3図はパタンAの各ベクトルのサフイツクス
の数字をx軸上にとり、パタンBの各ベクトルの
サフイツクスの数字をy軸上にとつたxy直角座
標に関連して始点位置(i=1,j=1)から終
点位置(i=I,j=J)に到るまでのパタンA
とパタンBの累計距離計算法を示す説明図であつ
て、始点位置から終点位置に到る経路は多数存在
し、経路によつて累計距離も異なるが、このうち
で累計距離の最小な経路を選んだ場合の累計距離
を類似度計算に用いる。
すなわち、入力音声パタン(パタンAとする)
と標準音声パタン(パタンBとする)間の最大一
致を求めることによつて音声速度の変動によつて
起るパタン間の時間軸の影響を除去するのであ
る。換言すれば、パタンAの時間軸をパタンBの
時間軸に対して正規化した上で類似度を算出する
ので、従来はDP(dynamic programming)マツ
チング法が用いられていた。DPマツチング法に
関しては、例えば共立出版株式会社が昭和54年10
月10日に発行した新美著作による書籍「音声認
識」の第4章(P.101〜P.113)に詳述されてい
る。
以下、従来のDPマツチング法によるパタン類
似度計算装置の動作を第3図について説明する。
パタンA,Bをそれぞれ A=a1,a2,…,ai,…,aI …(1) B=b1,b2,…,bj,…,bJ …(2) とする。特徴ベクトルbjに対応する特徴ベクトル
aiの対応づけをi=i(j)で示すとき、パタンAと
Bのパタン間類似度S(A,B)を S(A,B)=−1/I+J−1min i=i(j)〔Ji=i (j)‖ai−bj‖〕 …(3) 但し‖ai−bj‖はベクトルaiとベクトルbj間の
距離、以下d(i,j)で表すことにする。また、
位置(1,1)から位置(i,j)に到るまでの
累積距離をg(i,j)で表せば、g(i,j)の
初期値として g(1,1)=d(1,1) …(4) を得る。更にg(i,j)の漸化式としては g(i,j)=min{d(i,j)+g(i
−1,j) d(i,j)+g(i,j−1) 2d(i,j)+g(i−1,j−1) …(5) を得る。同一のjの値に対し、とり得るiの値の
範囲を j−γij+γ …(6) の条件によつて制約する。但しi1の制約があ
ることは申すまでもない。これは、iの範囲がj
=iの直線を中心として±γ分の幅を持つように
決められていることを意味している。
式(5)を順次計算してg(I,J)を算出すれば、
これが式(3)の min i=i(j) 〔Ji=i(j) ‖ai−bj‖〕となる。
この場合式(6)の関係を整合窓(normalizing
window、以下NWと略記する)と称し、第3図
に示すとおりになる。式(6)の整合窓を備えた従来
装置の構成は、例えば特開昭59−90900(パターン
マツチング回路、日本電気)に述べられている。
NWの長さを|NW|とすれば式(6)から|NW
|=2γ+1…(7)を得る。また式(6)においてj
=J,i=IとすればJ−γIJ+γである
からI<J−γ…(8)又はI>J+γ…(9)である場
合は、パタンAとパタンBとの類似度は計算され
ない。すなわち、この2つのパタンでは時間長の
差が大きすぎるため、上述のようにj=iの直線
に沿つて定められたiの範囲(整合窓)では適正
な計算ができないと判断されるので同じ音声を表
すパタンではないと判定されて、パタン認識され
ず棄却されるのである。換言すれば、|NW|
は同じ単語の発声時における時間長の変動を十分
に許容する長さが必要であり、許容する最大のパ
タン長の差を式(6)のγとして設定する必要があつ
た。
jが一定であるNWに含まれる(i,j)の集
合を第j段とよぶ。第3図に示すように第j段の
計算を行うためには第(j−1)段の累積距離g
(i,j−1)を第(j−1)段のNW範囲にわ
たり記憶しておく|NW|ワードのメモリを必
要とする。すなわち、この|NW|ワードのメ
モリの最初の番地が第1番地であり、最後の番地
が第|NW|番地である。また、式(5)の演算及
び第3図からわかるように、式(5)の演算を済せて
第j段の第n番地へデータを書込む場合には第
(j−1)段の第n番地のデータは消去してもよ
いので、式(5)の演算をjの値を増加しながら順次
進めてゆくときには|NW|ワードのメモリ1
個だけで足りる。
しかし、|NW|の増加は記憶回路の大きさ
および式(5)の計算回数の増加につながり装置規模
を大きくする。
〔発明が解決しようとする問題点〕
以上のように、従来の装置では装置規模が大き
くなるという問題点があり、同時に|NW|が
大きい場合、時間軸の対応を広い範囲で許すた
め、一方のパタンの時間的に短い区間が他方のパ
タンの時間的に長い区間に誤つて対応づけられる
といつた局所的に激しい変動を許す場合が生ずる
こともあり、音声認識装置に用いた場合、異なる
カテゴリの音声を表すパタン間の類似度が誤つて
高く算出され誤認識が起るという問題点があつ
た。
一方|NW|を小さくするため、上述の説明
のようにj=iを中心としてiの範囲を決めるの
ではなく、j=J/Ii…(10)を中心としてNWを設 ける装置も考えられている。
第4図はこのようにして決められたNWを用い
た累計距離計算法を示す説明図で、式(10)は(i=
1,j=1)の点と、(i=I,j=J)の点を
結ぶ対角線を表し I/Jj−γiI/Jj+γ …(11) によつてiに制約を与えるものであつて、式(11)
のγは式(6)のγよりも十分小さくすることができ
るが、式(11)による制御が容易でなく、記憶回路
の番地と(i,j)の対応が複雑であり、また第
4図に示すようにI,Jの値によつては、第j段
の(j,i)が記憶回路のn番地、第(j−1)
段の(j−1,i)もn番地というような場合も
生じ、式(5)の漸化式の計算に|NW|ワードの
メモリが2組必要になるという問題点があつた。
この発明は上記のような問題点を解決するため
になされたもので、パタン長の許容差を大きく保
ちながらNWを小さくすることができる類似度計
算装置を提供することを目的としている。
〔問題点を解決するための手段〕
この発明ではI,Jの値に対応してNWの長さ
を一定に保ちつつNWの位置を平行移動するよう
にした。
〔作用〕
I,Jの値によつてNWの中心位置を左右にず
らし、許容し得るIとJの差を大きくとつても|
NW|を小さくすることができるようにした。
〔実施例〕
以下この発明の実施例を図面について説明す
る。第1図はこの発明の一実施例を示すブロツク
図で、図において1は整合窓制御回路、2,3は
それぞれI,Jの値、4はNWの位置情報、5は
距離計算回路、6,7はそれぞれパタンA,Bの
ベクトル、8は距離、9は漸化式計算回路、10
は加算回路、11は比較回路、12は記憶回路、
13は累積距離、14は加算距離、15は最小距
離、16は正規化回路、17はパタン類似度であ
る。
第2図は第1図の装置における動作を示す説明
図であつて、第3図に類似した表示法で表す。
以下、第2図を参照して第1図の装置の動作を
説明する。
整合窓制御回路1はI2とJ3の値を入力して
定数γに対し、第j段のiの距離を j−γ+I−J/2ij+γ+I−J/2…(12) によつて決定する。但しi1である。この式(1
2)は、従来例で示した(6)式より決定したiの範囲
をさらに(I−J)/2だけ左右いずれかに移動
していることを示しており、式(12)におけるγの
値は式(6)におけるγの値に比し小さくすることが
できる。また式(12)から|NW|=2γ+1…(1
3)となる。
式(12)の意味はI−J=0のときは(i=1,
j=1)の点から(i=I,j=J)の点に到る
対角線を中心とし左右にγ(但しi1の制約が
ある)の幅をとつてNWを決定しI−J>0の時
はNWをI−J/2だけ右へずらし、I−J<0の 時はNWをI−J/2だけ左へずらすことを意味す る。すなわち、IとJの差に応じて、整合窓が全
体的に有効に利用されるように左右いずれかに平
行移動することを意味し、このため、類似度演算
精度を劣化させずに整合窓NWの幅を小さく設定
することができるようになる。
j=1におけるi=j−γ+I−J/2の値 i1 0=1−γ+I−J/2は一般に負になるが、仮 にこれを初期値として ij 0=ij-1 0+1 …(12) の演算により、第2図に示すij 0の値を決定するこ
とができ、結局第j段では ij 0iij 0+2γ (15) の範囲内のiについて式(5)の演算を行えばよい。
但し式(15)の範囲のiであつてもi1の制約条
件を満さないiは無視すべきことは申すまでもな
い。
第1図の装置において整合窓制御回路1以外の
部分の動作は第3図に関して説明した従来の装置
の動作と同様であるのでその説明を省略する。
以上の説明から明らかなように、従来の装置で
は式(7),(8),(9)に示されるようにパタン長の許容
限度Rに対して|NW|=2R+1の整合窓の
長さが必要であつたのに対し、この発明の装置で
は、式(12)のγをγ=R/2としi=Iのときj= Jとして J−R/2+I−J/2IJ+R/2+I−J/
2 からJ−R+I2IJ+R+I、すなわち J−RIJ+R …(16) を得、式(16)が式(8),(9)に対応することになるの
で、式(13)の2γ=Rでよいことがわかる。
すなわちこの発明の装置によりNWの長さを従
来のものの半分に減少できることがわかる。従つ
て、記憶回路12の容量を削減できる。また、整
合窓の位置を平行移動するという簡単な操作で実
現できるので、記憶回路12のアドレス制御が容
易で、かつ発声の都度大幅に入力パタンのベクト
ル量が変化する音声信号などの場合にも容易に対
応できるものである。
なお、式(12)は整合窓制御回路1の制御の一実
施例を示すもので、この発明を限定するものでは
ない。
〔発明の効果〕
以上のようにこの発明によれば、整合窓の位置
を平行移動するという簡単な操作で実現できる手
段を用いることで整合窓の長さを減少することが
でき、必要とする計算回数及び記憶回路容量を減
少することができるばかりでなく、従来の装置で
広すぎる整合窓を用いた場合に生じた局所的な対
応付けによるマツチング誤りの問題を回避するこ
とができ、パタン類似度計算を高精度に行うこと
ができる。
【図面の簡単な説明】
第1図はこの発明の一実施例を示すブロツク
図、第2図は第1図の装置における動作を示す説
明図、第3図はパタンAのサフイツクスの数字を
x軸上にとり、パタンBのベクトルのサフイツク
スの数字をy軸上にとつたxy直角座標に関連し
て始点位置(i=1,j=1)から終点位置(i
=I,j=J)に到るまでのパタンAとパタンB
の累計距離計算法を示す説明図、第4図は第3図
と異なるNWを用いた累計距離計算法を示す説明
図。 1は整合窓制御回路、2はIの値3はJの値、
4はNWの位置情報、5は距離計算回路、6はパ
タンAのベクトル、7はパタンBのベクトル、8
は距離、9は漸化式計算回路。尚、各図中同一符
号は同一又は相当部分を示す。

Claims (1)

  1. 【特許請求の範囲】 1 ベクトルの系列a1,a2,…,ai,…aIで表現
    されるパタンAと、ベクトルの系列b1,b2,…,
    bj,…bJで現されるパタンBの間の類似度を計算
    するパタン類似度計算装置において、 パタンAの各ベクトルのサフイツクスの数字を
    x軸上にとり、パタンBの各ベクトルのサフイツ
    クスの数字をy軸上にとつたxy直角座標を考え、
    この座標上の(i=1,j=1)の始点から出発
    し(i=I,j=J)の終点に至る経路の各点に
    おけるパタンAとパタンBとの距離を計算する距
    離計算回路、 この距離計算回路で計算した各点の距離を漸次
    入力し、上記始点から上記終点までの累積距離を
    最小にする経路を選択しながら、上記始点から上
    記終点までの最小累積距離を漸化式により算出す
    る漸化式計算回路、 この漸化式計算回路における計算において上記
    x軸上のiの範囲を上記y軸上のjの関数として
    与える整合窓、 上記終点の座標I,Jを入力し、上記整合窓に
    よつて与えられる関数の形をI,Jの値に対応し
    て上記整合窓の長さを一定に保ちつつ整合窓の位
    置を平行移動するように決定する整合窓制御回路
    を備えたことを特徴とするパタン類似度計算装
    置。 2 整合窓制御回路は、所定の定数をγとすると
    き j−γ+I−J/2ij+γ+I−J/2 の式により一定のjの値に体するiの値の範囲を
    決定することを特徴とする特許請求の範囲第1項
    記載のパタン類似度計算装置。
JP60135365A 1985-06-21 1985-06-21 パタン類似度計算装置 Granted JPS61292698A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60135365A JPS61292698A (ja) 1985-06-21 1985-06-21 パタン類似度計算装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60135365A JPS61292698A (ja) 1985-06-21 1985-06-21 パタン類似度計算装置

Publications (2)

Publication Number Publication Date
JPS61292698A JPS61292698A (ja) 1986-12-23
JPH0556518B2 true JPH0556518B2 (ja) 1993-08-19

Family

ID=15150024

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60135365A Granted JPS61292698A (ja) 1985-06-21 1985-06-21 パタン類似度計算装置

Country Status (1)

Country Link
JP (1) JPS61292698A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59161782A (ja) * 1983-03-04 1984-09-12 Matsushita Electric Ind Co Ltd パタ−ン・マツチング方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59161782A (ja) * 1983-03-04 1984-09-12 Matsushita Electric Ind Co Ltd パタ−ン・マツチング方法

Also Published As

Publication number Publication date
JPS61292698A (ja) 1986-12-23

Similar Documents

Publication Publication Date Title
JPH02195400A (ja) 音声認識装置
JPH029359B2 (ja)
JPS61219099A (ja) 音声認識装置
JPH02186398A (ja) 連続音声認識装置
JPH0556518B2 (ja)
JP2964881B2 (ja) 音声認識装置
JPH0346839B2 (ja)
JPS6312312B2 (ja)
EP0138166B1 (en) Pattern matching apparatus
EP0139875B1 (en) Pattern matching apparatus
JPS6283798A (ja) 連続音声認識装置
JPS61292697A (ja) パタン類似度計算装置
JPH0449954B2 (ja)
JPH0577078B2 (ja)
JP2707577B2 (ja) ホルマント抽出装置
JPS63188199A (ja) パタンマッチング装置
JPH0223876B2 (ja)
JPS58162995A (ja) パタ−ン類似度計算装置
JPS62173498A (ja) 音声認識装置
JPH0574838B2 (ja)
JPS592954B2 (ja) パタンルイジドケイサンソウチ
JPS5898796A (ja) 連続音声認識装置
JPS638886A (ja) オンライン連続文字認識装置
JPS61279896A (ja) 音声認識装置
JPH0355836B2 (ja)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees