JPS59172700A - パタ−ン比較装置 - Google Patents

パタ−ン比較装置

Info

Publication number
JPS59172700A
JPS59172700A JP58048600A JP4860083A JPS59172700A JP S59172700 A JPS59172700 A JP S59172700A JP 58048600 A JP58048600 A JP 58048600A JP 4860083 A JP4860083 A JP 4860083A JP S59172700 A JPS59172700 A JP S59172700A
Authority
JP
Japan
Prior art keywords
pattern
frame
input
distance
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58048600A
Other languages
English (en)
Other versions
JPH0247760B2 (ja
Inventor
中川 聖一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP58048600A priority Critical patent/JPS59172700A/ja
Publication of JPS59172700A publication Critical patent/JPS59172700A/ja
Priority to US07/183,692 priority patent/US4910783A/en
Publication of JPH0247760B2 publication Critical patent/JPH0247760B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/12Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明はパターン比較装置に関し1、より詳細には連続
する音声等のパターン全一連のパターンとして自動的に
認識する装置に関する。
従来例の構成とその問題点 パターンマツチングによる音声認識装置の一般的な構成
は次のようなものである。
入力音声信号を、フィルタバンク、周波数分析、LPG
分析等によって特徴ベクトルの系列に変換する特徴抽出
手段と、予め発声され、この特徴抽出手段により抽出さ
れた特徴ベクトルの系列を認affk単語全部について
標準パターンとして登録しておく標準パターン記憶手段
と、認識させるべく発声され、前記特徴抽出手段により
抽出された入カバターンと前記標準パターン記憶手段に
記憶されている標準パターンの全てと特徴ベクトルとの
系列としての類似度あるいは距離を計算するパターン比
較手段と、パターン比較の結果、最も類似度の高かった
(距11ffの小さかった)標準パターンに対応する単
語を認識結果として判定出力する判定手段からなる。
このとき、同一話者が同一の単語を発声しても、発声の
都度、その発声時間長が異なるので、gr+記パターン
比較手段で標準パターンと人カバターンの比較を行う1
祭には一両者の時■軸を伸1#式せ、両名のパターン艮
を揃えて比較する必要がある。
その際、発声時間長の変化は、発声単語の各部で一様に
生じているわけではないので、各部を不均一に伸縮する
必要がろる。その伸縮は、比較すべき両者のパターンの
類似度が最大になる(i1121Itが最小になる、以
下距阻で説、明する)ように行われるのが最も良い結果
が得られている。このようなマツチングを効率的に行う
のに動的計画法を用いる装置が一般的である(以下この
マツチングをDPマツチングと称する)。
DPマツチングの方法は格子グラフによって説明できる
。第1図は格子グラフであって、横軸は入カバターンT
−a、a2・°・alに対応するi座標、紋輔は標準パ
ターンR”=b7b:・・b;□に対応するj座標を表
わす。人カバターンTと標準パターンRnヲ時間輔を非
線ノ1りに伸縮してマツチングするとは、この格子グラ
フ上において、両パターンの各特徴ベクトルの対応関係
を示す径路(1)を何らかの標値基準によって決足し、
この径路に関して両パターンの距離全評価することであ
る。この径路を決定する際には音声の性質を考慮して制
限条件を設ける。
第2図(atは径路選択の制限条件の一例である。即ち
、この例では点(i、j)へ至る径Wjは、点(i−2
゜j−1)から点(i−1,j)を通る径路(2)か、
点(1−1、j −1)から来る径路(3)か、点(i
−1,j2)から点(i、j−1)を通る径路(4)か
の何れかしか収り得ないということを意味している。こ
のとき、入カバターンと標準パターンの始端と終端は必
す対応させるという条件をつければ、前記マツチングの
径路は第1図の斜線の部分に制限はれる。この制限は、
いかに時間軸が伸縮するといっても、同−m 語に対し
てはそれ程極端に伸縮するはずはないという半天からあ
まり極端な対応づけが生じないようにするためである。
鮨とb?のベクトル量比’f4L kd”(i 、 j
)とすれば、入カバターンTと標準パターンRnのパタ
ーン間の前記径路に沿う距離は、その径路に沿うd”(
+、3)の荷重平均として定義でれる。第2図の径路上
のa、b、c、d、eはそれに対応する径路が選ばれた
ときの何重である。DPマツチングが適用できるために
は、この拘重の決め方は、格子グラフ上で前記制限条件
の下でいかなる径路が込ばれようともその径路に沿う荷
重のイ1]が一定になるように決めれば良い。a=c=
e=2 、 b=d=1 とすれは、この何重の和はI
+J0.a−b=c−1、d=e=05とすれば、この
荷重の和はI 、 a=b=0.5 、 c=d=e−
1とすれば、この荷重の和はJ”となり、径路の選はれ
方によらず一定となる。
これらは共によく用いられる。また、前記荷重の和−足
という条件の十で、この荷重をjに関する関数とするこ
とにより、より重視してマツチングしたい径路上の部分
の何重を重くする等の操作も可能である。
人カバターン1゛と標準パターンRnの距離は前記制限
条件の下で前記荷重平均の最小値として定義される。即
ち、次の漸化式を解くことによって前記荷重平均の最小
値とその最小値を与える径路が決定され得る。
初M 条件gn(1,1)−d”0.1)。
D(T、Rn)−gn(1,Jn) 荷重の和 CコK D(T、R”)は入カバターンTと標準パター
ンRnの距離でろる。
径路選択の条件としては他にも種々考えられる。
第2図(bl〜(j)等は他の例である。この他にも芒
らに種々の変形が考えられ得る。これら径路の選択条件
に伴って前記漸化式は対応するものに書き換えられるの
線勿論である。
また、孤立して発声された単語を認識する場合は勿論、
連続して発声された(単語と単語の間に切れ目なく発声
された)音声全認識する場合もDPマツチングは良好な
成績をおさめている。
連続単語音声認識の問題は次のように定式化される。
入カバターンのフレーム数を11第iフレームの特徴ベ
クトルear、単語nの標準パターンのフレーム数をJ
n、第jフレームの特徴ベクトルvbT」 とするとき、単語nの標準パターンRnは次のように表
わされる。
R11、、b n b n 、、、b n 、、、b 
n nl 2 」 1 そこでX個のI41語列に対応する標準パターンの結イ
↑ qfllqfflq(X) )<=RR・・・ R q(D   q(+)     qfll     q
(2)   q仁υ    qcυ       qo
OqHq(1=b、  b2−b狐、b、 b2・b、
9.−b、 b2”・b、q(x)・・・・・・ (2
) と入カバターンT=a、a、、・・・al・・・aX 
とのベクトル系列間の距離が最小になる単語列q(1)
q(2)・・・q(xlを求める。
以上の計算を1411記孤立単語の場合と同様にして十
〇捷まDPマツチングで解こうとすれば、例えば10数
字の単語を標準パターンとしてもっているとき、3数字
の連続発声はれた音声を認識するには105=1000
種類の標準パターンとマツチングしなければならない。
標準パターンの数が増せば、たち寸ちその組合せの数は
禁止的な量になる。
そこで、連続単語の認識にもDPマツチングを適用する
ために、マツチングの累積距離の正規化係数(niJ記
何重の和のこと)は入力のフレーム数にのみ依存するよ
うに径路の選択の条件を設定すれば、以下に示すように
標準パターンの単あの組合せにも動的計画法が適用でき
計算量を大幅に減らし得る。
径路の選択条件としては一般に第3図(a)〜(elに
示すものがあるが、以後の説明は簡単化のために第3図
(atを用いる。径路上に示した数値はその径路が選ば
れたときの荷重係数である。
入カバターンTの第iクレームの特徴ベクトル(以後フ
レームとのみ称する)alとX個の標準パターンの連結
からなる連続標準パターンRノ第Jフレームb、のフレ
ーム間距離(ベクトル問丸gl] 1dR(i、j)とし、入カバターンと連続標準パター
ンとの対応づけする時間関数(前記マツチングの径路)
 t=u(it、、: l、て、この時間関数に沿って
求められる次の累槓距@(フレーム間距語の荷重の和)
D(T、R)を最小化するR (以下Rと記す)が求め
るものであるとする。即ち D(T、R) −min(Σ d、 (i 、 u(i
t ) )          −・−”    (3
ンu(il   +=1 R=argmir+l:I)(T、R))ここで、第3
図(alの径路のときは、0≦、u(il−u(i −
1)く2  、u(1)= 1  、u(Il−JRで
ある。また、mi n(f(zl)は2に関して最小化
き几ま たf(zl、a r gm i n (f(zl)はf
(zl を最小にする2の値を意味する。
式(3)は次の漸化式をj眸くことで求められる1、た
yi’l L、D、filは人力が第iフレームで終端
すると仮定したX単語列に対する最小累積距離、Nx(
i)はDI(it VCII応する単1t4i列の最後
尾単語名、B声)はN覗1の始点位置マイナス1 (N
x(itの一つ前(D 単Faのltk F4−yレー
ム、バックポインタと称する)、1)n(s:t)は入
力のs −tフレームと単語nとの最小累積和にト、D
’(i、j)はり、−、(m)と、入力のm+1〜iフ
レームと単−M nのl−jフレームとの最小累積距離
の和のmについての最小値でめる。
初期条件lX01−0.■0J=0としてり、(il=
min(DI−、(m)+D”(m+1:i))  +
++++・+ (41−mi nD ”(i 、 J”
) fx=1.2.・・・、XPこついて求め、この式を満
たすn。
N声+−A 、 B声+−=Q とする。i−■ までこの計算を行えは、次のようにし
−C最後尾の単語から逆順に単語が求まる。即ち最後尾
の単語: Nx(Il 最後から2番目の単語: NX、(Bx(Il)最後か
ら3番目の単語: N、2(B、、(BX(II)  
)最初の単語:N1(B2(B5(・・・(BX(Il
)・・)))でB、(B2(B5(・・・(BX(Il
)・・・)))=Oとなって終了する。
第4図はNr(s l r B工(itから上の単語列
を求めるフローチャートである。
XVCついても最適化する場合は、次゛のようになる。
ここで、D(itは入力のiフレームで終yi+jfす
ると仮定したときの単語列の最小累槓距1ij[X11
−m4nD□(iυ。
N(i)は加)に対応する単語列の最後尾単語名、抜i
はNiJの始点位置マイナス1 (Nil  の一つ前
の単語の最終フレーム)、D”(i、j)はD (rn
 )と人力のm+1〜iフレームと単語nの1〜jフレ
ームとの最小累積距離の和のmについての最小値でおる
初期条件 lX01−0 、1イ01= 0  として
ffil=minDx(il−min(D、−1(m)
+D”(m+1:i)、1’        n +m
 、X =min(D(m〕+Dn(m+1 :i  J)−r
n、1nCD”(i  、Jn))(5)1m 全求め、この式を満たすm・nをn・mとするとき・N
(il=盲 、玖1l== とする。認識結果は次のようにXが既知の場合と同様に
求まる。
最後の月1語: N(Il 最後から2番目の単語:N(■11) Jp後から3番目の単語: N(B(ビニ)))最初の
単語: N(B(B(・・・(B(II片・・)))で
B(B(B(・・・(B(Il )・・・)))−〇と
なったとき終了する。
第5図はNil、f3(ilから上の単語列を求めるフ
ローチャートである。
なおりn(m+1 : i )は次式で定義され、前記
の孤立単1治のDrマツチングと同じ方法で求められる
D’(m+1 : i )=minΣ  d”(k、u
(k))      −・・  (61u(i)  k
−m+1 0りu (k)−u(k−1)り2 、 u(m−1−
1)=1 、 u(i)−Jnところで、例えばO〜9
までの数字の他にジュー、ヒャク、ビャク等の単語を標
準パターンとして持っておれば、235全ニヒヤクサン
ジユーゴ と発声した場合連続単語認識を行えば二巨三
十五と認試されることになるが、前記の方法では二十三
白五等と誤認識されるかも知れない。我々が失踪に単語
全連続して発生する場合は、それらの単語の許される順
序が決っている場合が多い。従って入カバターン臥力文
)は、有限状態オートマトンαと等価な正規文法によっ
て生成された文であるとし、オートマトンαで受理され
るあらゆる単語列のうち、式(3)全最小にする単語列
(q(1)、Q(2)、・・・4x))!r求めるとい
うようにすることによって認識率を向上させることがで
きる。
ここで単語列(q(IJ、q(21、・・・、q(x)
%(オートマトンαで受理すれるとは、IqOlQ(1
))=q、C8,Δ(QH9Q(2)=q7C5、・・
・、Δ(QK 、q(1=1 ))=Q tQ、Δ(Q
z、Q(x)=qfCFC8となるような状態遷移が存
在する場合でめる。各記号の慧味ば、Sは状態qのイ1
限集合(qe−qo、q 、 、・・・’QlslJ’
、Σは入力車めnの有限集合(nG−1,2,・・・、
N)、Δは状態遷務関数で、S×Σ−8・(Δ(q、・
nンー町)、qoは初期状態でq。(S、Fは最終状態
の集合FC8である。ここで、q(υ、・・・、 q(
xil(1,2,・−・、N)でるる。
MJ’l ’iitのオー1−マトンのg識問題と異な
る点は、時間を表わすフレーム番号も反数として入って
いる点であり、しかも単に受理、拒否の出力でなく、受
理iJ能な成金<S槓距離)が出力される点である。
Dq(I)を状慝q、で入力のiフレームで終端すると
仮定したあらゆる単語列のうちの最小累積距離、Nq 
(i )をDqj(i)に対応する単語列の最後尾単語
名、Bq、(i)をN q :(+ )の始点位置マイ
ナス1 (Nq、(i辺一つ+           
                         
         1前の単語の最終フレーム、バック
ポインタト称スる) 、Qq(i)をq への状態遷移
によってDq(Dを4       1       
                      1満た
した状態名即ちΔ(Qq(i)、Nq、(i) −Q3
とするとき、次のtll(化式を解くことで、オートマ
トンflilJaKよる式(3)の解が得られる。即ち
式(4)のxk状態qと航み代えることによって、Dq
、(i)を求める漸化式%式% 初期条件 DQ o(0) −〇 、 Bqo(0) 
= 0としてDq(i) −mi n(Dqk(mJ−
1()n(m+−1: i )l)、q−Δ(q、 、
n)・・<7)m、n+% f: q=q、−q2.・・・1lsl−+につぃて求
め、この式を満たす□、m、q、kn、丘、6とすると
き、Nq(i)士?、Bq(i)−苗、 Qq(i) 
= $とする。n=I までこの計算を行えば、次のよ
うにして最後尾の単語から逆順に単語が求葦る。即ち ■i = I 、 q =min Dqf(i) 、q
、e−F  としてQ( ■ n=Nq(i) ■Bq(i’)\0なら、1=Bq(i) 、q =Q
q(i)として中へ、Bq(j) = 0なら終了する
第6図はフローヂャートである。
以上、(イ)単語数未刈の場合、(ロ)単語−知の場合
、(ハ)オートマトン制御を導入した場合を比較すれば
次のようになる。
(イ)は計算量、記憶量共に最小で済むが、例えば三相
の整数を連続発声して人力した場合、四桁あるいは二相
の数字としてのマツチング結果の方が良かった場合は、
そのまま、四桁あるいは二相の数字として認識してしま
う。(ロ))は入力行声が予め三相とわかっているから
、入力が三相とした場合におけるマツチング結果の中で
最適のものを認識結果とするから(イ)よりも認識の精
度は向上する。
(ハ)は構文情報を尋人することにより、さらに認識の
精度ヲ上げることかできる。
式(41(51(7)を解く具体的な方法がこれまでに
も種々提案され、式(2)で表わされる標準パターンと
その−1まilj’、 !にマツチングするよりは大幅
に計算ガ1が減り、それらの方法を用いたパターン比較
装置が実現されている。しかし、前記(イ)(口j(ハ
)の何れも司fジ、なパターン比軟装置は、それでも計
算量記憶量はかなり多く、計算量の最も少ないパターン
比較装置では、(イ)の場合しか実現できないのが現状
である。
発明の目的 本発明は、単語数未知の場合は勿論、単語数の指定やオ
ートマトン制御の可能な連続単語音声の認識が最小の計
算り先で可能なパターン比較装置を実現することを目的
とする。
発明の構成 入力単語数既知の連続単語音声認識の解法の漸化式((
4)式)、人力単語数未知の連続単語音声認識の解法の
漸化式((5)式)、オートマトン制御の連続単語音声
認識の解法の漸化式((7)式)の何れもD” (m+
1 : i )の計算を必要としている。
本発明は、このDn(m+1 : i )の求め方に特
徴があるパターン比較装置でろって、これを求めるため
の計算量が大幅に削減できたものである。入カバターン
の部分パターンam”m+1・°・aIと標準パターン
amarrl+I・・・a、と標準パターンH=b”、
 b”、、 −b”、、 (D m 分ハターンb” 
b”・・・bnとの、最小累積距離のmについて1−2
   J の最小値Dn(i 、 j)’e 、DPマッチッグの
径路が標準パターン側の軸を基本軸とする径路(正規化
係数が標準パターン長にのみ依存する径路)で求め、 
−m D”(m+1:i):D”(i、Jn)x −−= (
810 とするものである。即ち、D” (m−)−1: i 
)の正規化係数はi−mであり、Dn(i、J”)の正
規化係数はJ”であるから、正規化係数が入カバターン
長にのみ依存するように変換するのである。このとき、
D”(i+j)を満たす前記入カバターンの部分パター
ンの始点位置をr(t、])とすれば m+1 =B”(j 、J”) とlる。
ここで、人カバターンのB”(i 、Jn)〜iフレー
ムは、i全終端フレームと仮定したとき標準パターンn
の最もイgfxできる存在餉補区間であるが、(4)。
(5)t7)式では様々&mについてDn(m+1 :
 i )を必要としている。そこで、上述のm以外につ
いてもD” (m+1 : i )の値を次のように近
似的に推定する。
ここでrはDn(n1+1 : i )の推定の範囲(
窓)でろり、矛吉 局 (B”’ (i 、J n)−r<m−)−1≦B”(
i、J”)+r)   −−・CIGの任意の点ケ始点
、iを終点とするD” (m−1−1: i )を近似
的に指定できたことになる。勿論r=Oとすることも川
船であるが、認識精度の上から妥当なrが選ばれるべき
である。
次に、このようにすれば計算量が減る理出について述べ
る。DPマツチングの径路の拘束条件は第7図(al〜
(el等が考えられる。各径路上の数値はその径路が選
ばれたときの荷重係数でるる。このようにすることによ
って、正規化係数(荷重係数の和)は標準パターンの長
さにのみ依存するようになる。
入カバターンの第Sフレームから第Sフレームまでの部
分パターンをT(s:t)として、第8図において、T
(m、+1 : i )とT(m2+1 : i )の
何れが標準パターンnに近いかを計算するとき、最適の
径路がT(m2+1 : i )に対しては(5)、T
(m + +1−1)に対しては(6)が選ばれたとす
る(m2〈ml)。このとき、MrJ記したように、動
的計画法が適用できるためには、いがなるマツチング径
路が選ばれようとも、その径路に沿う荷重の和は不変で
なければならないが、これが入カバターン長に依存する
場合は第8図から径路(5)と径路(6)では明らかに
異る。ところが、正規化係数が標準パターン長にのみ依
存する場合は、明らかに入カバターン長に関係なく両径
路に沿うイlir重の相eニ一定になるので、入カバタ
ーン側を端71.1目出として動的計画法によりマツチ
ングを行うことができる。ゆえに、正規化係数が標準パ
ターン長にのみ依存するようにしなけれはならない。
マツチング径路の拘束条件を第7図(a)とすれば、D
”(i、J”)、Bn(i、JJ Ir、r7X(r)
漸化式で計算できる。
′また、この式全満足するl座標値f+とすれば(lは
i、i−1,i−2のいすi′L、かでβる)、H”(
i、j)=Bn<i、j)         −−□ 
 02となる。第9図はこの間の事情を図解したもので
りっで、格子点(7)へ至る一つ前の格子点は(8)、
(9)、(1(Jのうらそのイ?1子点までの累積距離
が最小のものである。同様にして格子点(8)、(9)
、(1(lのそれぞれの一つ+iiJの格子点は格子点
(8)については0υ、α4□u4、格子点t9+ K
ついては眩u+i、u勾、格子点曲についてはり蹟A局
、ueのうちくれぞれの点までの累積距離が最小のもの
である。従って、格子点(i、J”)に至る径路は第1
0図(alの斜線部の内部に限定される。叫は傾斜1/
2の直線である。横軸は入カバターン、縦軸は標準パタ
ーンnである。従ってまた、人力の第1フレーム全終端
と仮定して、標準パターンnとマツチングしたときの累
積距離D”(i、J”)は、入カバターンに対する始端
候補点i ”−iのうちDn(i、Jn)が最小になる
という意味で最適な点が標準パターンnVC対応する始
端点として自動的に選択された結果として計算される。
その点がB”(i、Jn)でるる。ここでi′は直線a
0とi軸の交点である。
また、明らかに第Sフレームにおけるフレーム間距pH
d”(i、D 、累m距ta D”(i 、Jn)tr
i i i”& ル)Xに対応する前記斜線部のすべて
の格子点について累積距離を求め直す必要はなく、各格
子点について1回計算するのみで良い。
マツチング径路の拘束条件を第7区tbl〜(elとす
れば、取り得る径路は第10図(blの斜線部となる、
σ力は傾斜1/2の直線、(1119は傾斜2の直線で
ある。
始端点は直線動、(へ)とi軸の交点11 、 lJに
列しl′〜l′の中から自動的に最適点が選ばれる。
以上のような本発明の原理によれは、1つの標)v7<
ターンに対し、各格子点におけるフレーム間W14阿、
累積距離は1回計算するのみでおり、計算量が41−常
に少くて済み、前記(イ)、(ロ)、(ハ)何れの場合
にも適用可能なパターン比較装置を天現し得るものでめ
る。
¥旌例の説、明 第11図は以上の原理に基づく本発明の一去施例である
。入力単語数k(4知の場合について本発明の詳細な説
明する。(100)は音声信号の入力端子である。(1
01)はフィルタバンク等で構成はれた特徴抽出部であ
って、入力音声信号を特徴ベクトルの系列a1.・・・
aI、・・・alに変換する。(102)は卑語標準パ
ターン記憶部であって、認識語集であるN個の単語のそ
れぞれが特徴ベクトルの系列として予め登録されている
。(103)はフレーム間距離計算部であって、入力の
第iフレームにおける特徴ベクトルa、とn番目の単語
標準パターンR”7b7b:・・・b;□。
それぞれの特徴ベクトルとの距離d”(i、j)を1(
、nくN、1くj<J”について求める。d”(i、j
)は例えばa、とす、の市街地距離として定義できる。
即ち、ベクトルの次元’Izとし、a I−cail 
+a 、2+ ”’ −aHρ。
とすることができる。(104)はこのフレーム間距離
を必要がなくなるまで記憶するフレーム間距離記憶部で
ある。(105)は部分累積距離計算部であって、例え
ば、径路の拘束条件を第7図(alとすると式Oυ(2
)の漸化式を計算し、式(9)により1<Ln<Hにつ
いて部分累積距離D”(m: i )を式0りのmの範
囲で求める。(106)はこの邪分累積距#を必要がな
くなるまで記憶する。(107)は終端累積距離計算部
であって、部分累積距離記憶部(106)の内谷と終端
累積距離記憶部(108)の内谷から、漸化式(4)に
従って、Dr(i)−Nr(i) =BxCi) ft
計算する。終端累積距離記憶部(108)は、終端累積
距離計算部(107)で計算された終端紫檀距離Dr(
i)を必要がなくなるまで記憶する。このDz(i)は
終端累積距離計算部(107)における漸化式(4)の
計算に用いられる。(109)はバックポインタ記憶部
でろって、終端累積距離計算部(107)で計算された
パンクポインタBχ(1)ヲ記情する。(110)は最
後jv単RfS記憶部で、終端累積距離記憶部(107
)で求められた第!フレームにおける最後尾単語を記憶
する。(111)は汁声区間検出部でろって、入力信号
の大きさ等から音声区間を判定するもので、この音声−
1区間検出部(111)が音声入力が開始されたことを
検出すると、フレーム数計数部(112)はフレーム毎
に計数を始める。I〕11記の処理は第iフレームにつ
いての処理であったが、このフレーム数tti部(11
2)の計数値がこのiを設定している。従って、前記と
同様の処β11がフレームが1進む毎に行われることに
なる。フレーム数計数部(112)は音声区間が検出さ
れると計数を始め、音声区間が終了するとりセットされ
る。最後尾単語記憶部(110)、バックポインタ記憶
ff(>(1,09)には、NxCi) 、BxCi)
がi−1゜2、・・・、■ について配信されることに
なる。セグメンテーション部(113)はバックポイン
タ記憶部(109)に対し、所定のバックポインタを読
出すべき命令を光するものである。即ち、セグメンテー
ション部(113)がiなる値をバックポインタ記憶部
(109)に発すると、バックポインタ記憶部(109
)からはバックポインタBz(i)が続出される。セグ
メンテーション部(113)はバックポインタ記憶部(
109)からBx(i)なる値を受は収ると、その同じ
値をバックポインタ記憶部(109)に発する。従って
、音声区間検出部(111)が音声入力の終了を検知す
ると、フレーム数計数部(112)の最終値Iがセグメ
ンテーション部(113)に供給嘔れ、セグメンテーシ
ョン部(113) ti 先ずIなる値をバックポイン
タ記憶部(109)に発する。
以後、前記説明の動作に従って、バックポインタ記憶部
DIからBX(I)、Bx−、(Bx(I) )・・・
、0 なる出力が順次得られることになる。これらの値
は、最後から2番目の単語の終シのフレーム、同3番目
の終りのフレーム、同4香目のフレーム、・・・といウ
モのでめり、Nr(i)はiフレームで終る単語でめっ
たから、この値をそのまま最後尾単語記憶部(110)
に与えると、最後の単語から逆の順序で認識結果が得ら
れることになる。この順序を逆に(あたり址えの順序に
)するには、順序の変換をバックポインタ記憶部(10
9)の出力か、最後尾単語記憶部(110)     
’の出力に対してイ1えはよい。
第12ン1ば、以上の実施例の動作ケプログラムで表現
したものであり、ソフトウェアで実現する場合もこれに
従えばよい。なお第12図において、なる記法は、条件
Aが成立する間Bを行うということを意味する。筐た、 ENIJI)0 なる記法は、条件Aが成立するまでBを行うということ
を意味する。
ステップ(200X201)は累積距離Dr(i)、D
n(i 、j)バックポインタBx(i)、B”(i 
、j)の初期化を行う部分である。
ステップ(203)は1フレームにおける処理を示して
おり、大きくわけて部分累積距離を求める部分(204
)と終端累積距離を求める部分(205)に分かれる3
、ステップ(204)はn=L2.・・・、Nについて
部分累積距MD”(m:i)を求める部分でアラて、第
11図(103)〜(106)で行う動作に対応する。
ステップ(206)はステップ(207)における計算
の初期値を与える部分、ステップ(207)は格子点(
i、j)における累積距離D”(i、j) 、/< y
 クポインli B”(i、j) k求メチVrル。
本実施例では第7図(a)の径路の拘束条件の場合を示
している。ステップ(208)は前記式(9)の計算を
行っている。
ステップ(205)は第11図の終端累積距離計算部(
107)で行う動作に対応しており、漸化式(5)を解
いて、Dr(i)、Nx(i)、Br(i)k求める部
分である。
ステップ(209)(210)は、ステップ(203)
で得られた1=L2*=・、IについてのBx(i )
 、Nx(i )から’a 、ri単め列を得る判定処
理部でるって、第11図のバックポインタ記憶部(10
9) 、セグメンテーション部(113) i佐尾単語
記憶部(110)で行う動作に対応した処理を行ってい
る。
本パターン比較装置における計算量は、標準パターンの
平均のフレーム長をJとすれば、フレー人量比At d
”(i、j) 、累積距IP、Dn(i、j)(n=1
.2.−。
と比べると計算量は1/(3−J)になる。いま、フレ
ーム長が10m5ecで単語長が05秒であったとすれ
ば、J−50であるからこの値は1/37.5になる。
第13図は、本実施例において、標準パターンnとのマ
ツチングを行なってD”(s:t’)を求める場合の始
端の魚ばれ方を示している。Sと示した部分が始端とし
て選ばrする範囲である。Sはもともと最適と思われる
始端の前後数フレームの範囲でろって、こ力2で十分と
も考えられるが、より広い範囲に対して始端として採用
される可能性をもたせることにより、より精度の高いパ
ターン比較装置の実現がnJ能である。それは、最適と
思われる始端点S全複数側木めることにより実現できる
Dn(i、j、k) k入カバターンのm−iフレーム
と標準パターンnの1〜jフレームとの最小累積距離の
mについてのに番目の最小値、B’(i、j、k)をD
=(i + j+k)を満たす入カバターンの始点位館
とする。ここで i5′n(i、j)=DFl(i、 j、1)、jT”
(i、j)−1T”(i、j、1)である。
そこ−c、D”(i、J”k)、B”(i、J”k) 
k B”(i 、j、k)\B”(i、j、h) fo
rk\h という条件のもとてに=1.2゜・・・Kに
ついて求め、それぞれの始端点T3” (i 、J”、
k)の前後rフレームの幅を川船な始端点とするもので
βる。
第14図はそのようにして求めた始端点の範囲を示すも
のでろって、本例ではに=3の場合である。
このようにして求めたj5” (i 、 j 、 k 
)がらに=1.2.・・・。
K;r’=0.1.2.−、rについて次の計算によ’
) D”(s :t)を計算する。
m+1=B”(i、J”、k) は、同じ始端点が選ばれては意味がないからである。ま
た、式(【:mの計算において、求められた複数の区間
に重なりを生じるときは、部分累積距離の小さくなる方
を選ふとか、lくhくkに対してB″<i、j、k)<
B”(i 、j、Il) −rti)るいは♂(i、j
、k)>B”(i 、 j 、 h )+rとすること
によって、重なりを生じないようにすれはよい。
第11図の実施例Vこ対し、部分累積距離計算部(10
5)の動作全以上のように変更し、終端累積距離計算部
(107)における累積距離の計算において始端点n汗
1の範111j k k=1.2.・、K K対し、(
P(i、J”、k)’) ゴ<m+1く(B”(iJ”
、Ic))+rと変更することにより、他は全く同じ構
成、動作で、第11図の実施例の改良装置が実現できる
。第11図の実施例はに=1の場合である。
第15図はこの改良された装置の動作をプログラムで表
現したものでるる。第12図と同一の番号を付したステ
ップは、全く同じ処理をしている部分である。ステップ
(306)はステップ(206)に相当する部分であり
、k=1.2.・−・、Kについてステップ< 307
)で行う計算の初期値を与える。ステップ(307)は
ステップ(207)に相当する部分であり、格子点(i
、j)における累積距離Dn(i、j、k) 、バック
ポインタB”(i、j、k)を求める部分である。ここ
でarg−に−th−mi n(f(z))はf(z)
をに番目に最小にする2のことを意味する。ステップ(
30B)はステップ(208)に相当する部分で、拡大
された始端点の範囲で部分累積距F@D”、、(s :
t ) k求める部分である。ステップ(305)はス
テップ(205)に相当する部分で、拡大された始端点
の範囲で終端累積距離Dr(i)全求める部分である。
以上、実施例では入力単語数既知の場合についてのみ本
発明を説明したが、入力単語数未知の場合にもオートマ
トン制御による場合にも本発明を適用できることは今ま
での説明から明らか噂ある。
また、マツチング径路のiig束条件として、本実施例
では第7図(atを用いて説明したが、実用的には第7
図(blが用いられる。この場合、格子点(i、j)に
おける累積距離1)”(i+ j、k) 、バックポイ
ンタなお、実施例では音声を認識する場合を例にとった
が、音声に限らず、本発明は特徴ベクトルの系列で表わ
式れた他の連続パターンの認識にも応用iiJ能である
。。
究明の効果 本究明によれば、単語数未知の場合は勿論、単rttj
数の指定やオートマトン制御の可能な連続単語泣声の認
識が従来の装置に比べて非常に少ない計算量で行えるパ
ターン比較装置の実現が可能となったものである。
【図面の簡単な説明】
第1図はDPマツチングを説明するための格子グラフ、
第2図(at〜(j)は径路選択の制限条件の例ケ示す
図、第3図(a)〜(elは径路の選択条件と荷重係数
の例を示す図、第4図〜第6図は最後尾の単語から逆順
に最初の単語までを求めるための方法を示すフローチャ
ート、第7図fat〜fel、第8図、第9図および第
10図(al、(b)は本発明の詳細な説明するための
図、第11図は本発明の一実施例におけるパターン比較
装置の構成を示すブロック図、第12図、第13図およ
び第14図は同実施例の動作を説明するための図、第1
5図は他の実施例における動作を説明するためのフロー
チャートである。 (101)・・・特徴抽出部、(102)・・・単語標
準パターン記憶部、(103)・−・〃レヒム量比離計
算部、(105)・・・部分累積距離記憶部、(107
)・・・終端累積距離計算部、(109)・・・バック
ポインタ記憶部、(110)・・・最後尾単語記憶部代
理人    森   本   義   弘第1図 第2図 ((1)     (b) (C)         Cd)          
 (e)           げ)に))tt>  
 ti、)t、i) 第3図 Cd)       (b)       (C)  
     td)、C) 第4図 第6図 第7図 <(1>         tb)       (e
)         (dl(e) 第3図 第9図

Claims (1)

  1. 【特許請求の範囲】 ■、 入力信号全特徴ベクトルの系列T=a、 a2°
    °。 alに変換する特徴抽出手段と、特徴ベクトルの系列b
    7 民・・・b;。から成る標準パターンRn(ただし
    n=1.2.・・・、N)を記憶する標準パターン記憶
    手段と、X個の標準パターンの結合R[有]R■・・・
    ■−ゝ−b +1 bq(1ゝ・・・b・コj、、 b
     ’12J bqc2)・・・ド一・・・b:“b:“
    ・・・+2    5    12     J法で求
    めるに1余し、入カバターンの第iフレームの特徴ベク
    トルa1と標準パターンR0の第1フレームの特徴ベク
    トルb’! (n=L2+−’・、N;j==LL−・
    ・Jll)とのベクトル間距離dn(i、j)を計算す
    るフレーム間距離計算手段と、入カバターンの部分パタ
    ーンam+、am+2”’ ”iと標準パp −ンR”
    (n=1.2.・・・、N)のパターン間の距離を、l
    −J平面における径路で、それに沿う荷重の和がその径
    路の選ばれ方a]桐にかかわらず常に標準パターンの長
    さにのみ依存するようなマツチング径路を、前記mにつ
    いてその径路に沿う目1」記フレーム間距離の荷重和が
    最小になるものからに番目に最小になるものまでのに種
    類について、動的計画法によって見出し、得られたに麺
    類の各々の径路のi軸上の始端点S1<82〈・・・〈
    SKのそれぞれから前後rフレーム全始湘点としたとき
    の前記パターン間の距離を推定し、そのパターン間の距
    離全入カバターンのフレーム長にのみ依存するように変
    換することによって、前記それぞれの始端点m+1(S
    、−r<m+1<S 、+r 、52−r<m+1<S
    2+r 、 −,5K−r<:m+1<SK+r)から
    座標(i、Jn、)に至るまでの入カバターンの部分パ
    ターンと標ハ(パターンRnの累積照合距m D” (
    m+1 : i )を求める部分累積距離計算手段と、
    人カバターンの第1フレームから前記第mフレームまで
    の入カバターンの部分パターンと標準パターンの最適の
    結合パターンとの累積照合距離と、前記始端点m+1フ
    レームから第iフレームまでの入力の部分パターンD”
    (m+1:i)との和をn(1りn<N )と前記範囲
    のmについて最小化したものを、入カバターンの第1フ
    レームから前記第1フレームまでの人カバターンの部分
    パターンと標準パターンの最虐の結合パターンとの累積
    照合距離となす終端累積距離計算手段と、そのときの標
    準パターンRnf入力フレームiが最終フレームである
    としたときの最後尾パターンとして記憶する最後1イパ
    タ一ン記憶手段と、そのときのmをバックポインタとし
    て記憶するパックポインタ記憶手段とを備え、入力が終
    了したとき、前記最後尾パターン記憶手段とパックポイ
    ンタ記憶手段の内容から入力とは逆の順序で、入力され
    た個々のパターンを決定してゆくことを特徴とするパタ
    ーン比較装置。
JP58048600A 1983-03-22 1983-03-22 パタ−ン比較装置 Granted JPS59172700A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP58048600A JPS59172700A (ja) 1983-03-22 1983-03-22 パタ−ン比較装置
US07/183,692 US4910783A (en) 1983-03-22 1988-04-19 Method and apparatus for comparing patterns

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58048600A JPS59172700A (ja) 1983-03-22 1983-03-22 パタ−ン比較装置

Publications (2)

Publication Number Publication Date
JPS59172700A true JPS59172700A (ja) 1984-09-29
JPH0247760B2 JPH0247760B2 (ja) 1990-10-22

Family

ID=12807895

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58048600A Granted JPS59172700A (ja) 1983-03-22 1983-03-22 パタ−ン比較装置

Country Status (2)

Country Link
US (1) US4910783A (ja)
JP (1) JPS59172700A (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04194999A (ja) * 1990-11-27 1992-07-14 Sharp Corp 学習を用いた動的計画法
DE4130633A1 (de) * 1991-09-14 1993-03-18 Philips Patentverwaltung Verfahren zum erkennen der gesprochenen woerter in einem sprachsignal
JPH05249990A (ja) * 1992-03-04 1993-09-28 Sony Corp パターンマッチング方法およびパターン認識装置
DE4433366A1 (de) * 1994-09-20 1996-03-21 Sel Alcatel Ag Verfahren und Einrichtung zur Bestimmung eines Maßes der Übereinstimmung zwischen zwei Mustern sowie Spracherkennungseinrichtung damit und Programm-Modul dafür
JP2964881B2 (ja) * 1994-09-20 1999-10-18 日本電気株式会社 音声認識装置
IL113204A (en) * 1995-03-30 1999-03-12 Advanced Recognition Tech Pattern recognition system
US6195638B1 (en) * 1995-03-30 2001-02-27 Art-Advanced Recognition Technologies Inc. Pattern recognition system
US5960395A (en) * 1996-02-09 1999-09-28 Canon Kabushiki Kaisha Pattern matching method, apparatus and computer readable memory medium for speech recognition using dynamic programming
GB9602699D0 (en) * 1996-02-09 1996-04-10 Canon Kk Pattern matching method and apparatus
FI118067B (fi) * 2001-05-04 2007-06-15 Nokia Corp Menetelmä audiosignaalin pakkauksen purkamisessa, pakkauksen purkulaite, ja elektroniikkalaite
CN110083158B (zh) * 2019-04-28 2022-08-16 深兰科技(上海)有限公司 一种确定局部规划路径的方法和设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4608708A (en) * 1981-12-24 1986-08-26 Nippon Electric Co., Ltd. Pattern matching system

Also Published As

Publication number Publication date
JPH0247760B2 (ja) 1990-10-22
US4910783A (en) 1990-03-20

Similar Documents

Publication Publication Date Title
CA2163017C (en) Speech recognition method using a two-pass search
US4852180A (en) Speech recognition by acoustic/phonetic system and technique
JPS59172700A (ja) パタ−ン比較装置
JPH02250188A (ja) マルチテンプレートを用いるdpマツチング方法及び装置
JPH01167896A (ja) 音声認識方法
JPH07508360A (ja) ボキャブラリーモデル予備選択を利用した音声認識システム
Nakagawa Connected spoken word recognition algorithms by constant time delay DP, O (n) DP and augmented continuous DP matching
JP3477751B2 (ja) 連続単語音声認識装置
JPS6073698A (ja) パタ−ン比較装置
JPS5972498A (ja) パタ−ン比較装置
JP3583299B2 (ja) 連続音声認識用の探索装置および連続音声認識用の探索方法
JP3315565B2 (ja) 音声認識装置
JPS62111295A (ja) 音声認識装置
JPS6147999A (ja) 音声認識装置
US20070271096A1 (en) Voice Recognition Method And System Based On The Contexual Modeling Of Voice Units
JPS6265090A (ja) パタ−ン比較装置
JPH0247758B2 (ja)
JP2574242B2 (ja) 音声入力装置
JPH0361957B2 (ja)
JPH06100920B2 (ja) 音声認識装置
JPS59173884A (ja) パタ−ン比較装置
JPH0636155B2 (ja) パタ−ン比較装置
JPS61107398A (ja) 音声認識装置
JPS60179799A (ja) 音声認識装置
JPS60203994A (ja) 音声認識方法