JPS61102697A - Pattern comparator - Google Patents

Pattern comparator

Info

Publication number
JPS61102697A
JPS61102697A JP59224411A JP22441184A JPS61102697A JP S61102697 A JPS61102697 A JP S61102697A JP 59224411 A JP59224411 A JP 59224411A JP 22441184 A JP22441184 A JP 22441184A JP S61102697 A JPS61102697 A JP S61102697A
Authority
JP
Japan
Prior art keywords
frame
pattern
input
matching
standard pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59224411A
Other languages
Japanese (ja)
Other versions
JPH067354B2 (en
Inventor
英一 坪香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP59224411A priority Critical patent/JPH067354B2/en
Publication of JPS61102697A publication Critical patent/JPS61102697A/en
Publication of JPH067354B2 publication Critical patent/JPH067354B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、特徴ベクトルの系列で表された複数種類の標
準パターンと入力パターンとの比較を行い、入力パター
ンの識別を行うパターン比較装置に関し、特に連続して
発声した単語音声の認識などに適用可能なパターン比較
装置に関する。
DETAILED DESCRIPTION OF THE INVENTION Field of Industrial Application The present invention relates to a pattern comparison device that compares an input pattern with a plurality of types of standard patterns represented by a series of feature vectors and identifies the input pattern. The present invention relates to a pattern comparison device that can be applied to recognition of continuously uttered word sounds.

従来例の構成とその問題点 人間にとって最も自然な情報発生手段である音声が、人
間−機械系の入力手段として使用できれば、その効果は
非常に大きい。その場合、音声認識装置としては、より
自然な発声で認識できる条件として、連続して発声した
音声の認識ができることが望ましい。
Conventional configuration and its problems If voice, which is the most natural means of generating information for humans, could be used as an input means for a human-machine system, the effect would be very large. In this case, it is desirable for the speech recognition device to be able to recognize continuously uttered speech as a condition for recognizing more natural speech.

連続して発声した単語音声の認識に有効なパターン比較
装置として、動的計画法(以下DPという)を2段回用
いたいわゆる2段DP法を用いたパターン比較装置が既
に実用化されている。
A pattern comparison device using the so-called two-stage DP method, which uses dynamic programming (hereinafter referred to as DP) two times, has already been put into practical use as a pattern comparison device that is effective in recognizing continuously uttered word sounds. .

しかし、この2段DP法は重複した計算が多く計算量が
膨大で、従ってこの方法を用いた実時間処理が可能なパ
ターン比較装置は、極めて高速の処理が要求され、装置
も複雑となり、高価なものとならざるを得ない。
However, this two-stage DP method involves many duplicate calculations and requires a huge amount of calculation. Therefore, a pattern comparison device that can perform real-time processing using this method is required to perform extremely high-speed processing, making the device complex and expensive. It has to become something.

以上の欠点を除去するために、大幅に計算量の少いパタ
ーン比較装置として、O(nJ D P法、RCWDP
法等を用いたパターン比較装置が提案されている。しか
し、これらの方法をハードウェア的に実現するためには
、高速にアクセス可能な大容量のメモリを必要とする欠
点がある。
In order to eliminate the above drawbacks, O(nJ D P method, RCWDP method,
A pattern comparison device using a method has been proposed. However, implementing these methods in hardware requires a large capacity memory that can be accessed at high speed.

本発明は、これらの欠点を除去したパターンマツチング
装置を提供するものである。○(n)DP法を例にこれ
を説明する。本発明を説明するに先立って次にO(nJ
 D P法について先ず説明する。
The present invention provides a pattern matching device that eliminates these drawbacks. This will be explained using the (n)DP method as an example. Before explaining the present invention, O(nJ
First, the DP method will be explained.

本発明のパターン比較装置は、種々の入力パターンの認
識に用いることができるが、以下、連続して発声される
連続単語音声を例に説明する。
The pattern comparison device of the present invention can be used to recognize various input patterns, and will be described below using continuous word speech that is continuously uttered as an example.

人間により発声される音声は人によりまた時により変化
し、基準となる標準パターンに対し時間的に非線形に伸
縮したものとなっている。この非線形に伸縮している入
力パターンと標準パターンとを比較し入力音声の認識を
行うためには、入力パターント標準パターンの各特徴ベ
クトルの対応付けを非線形に行い、入力パターンがどの
標準パターンと最も類似しているかを計算する必要かあ
る。しかしこの入力音声は非線形に伸縮するとはいって
も異常に長く伸びたり、短くなったシすることはない。
The voices uttered by humans change from person to person and from time to time, and are non-linearly expanded and contracted in time with respect to a standard pattern that serves as a reference. In order to recognize the input speech by comparing this non-linearly expanded/contracted input pattern with the standard pattern, we need to non-linearly associate each feature vector of the input pattern with the standard pattern. Do you need to calculate which is the most similar? However, even though this input voice expands and contracts non-linearly, it does not become abnormally long or short.

このような入力パターンの物理的な特徴に注目し、入力
パターンと標準パターンを比較する際には無制限にすべ
ての可能性について比較するのではなぐ、入力パターン
の物理的な性質により定まる妥当と考えられる範囲につ
いて比較を行うようにする。
Focusing on the physical characteristics of such input patterns, when comparing input patterns and standard patterns, rather than comparing all possibilities without limit, we consider the validity determined by the physical properties of the input patterns. Comparisons should be made within the range that can be used.

入力音声信号はパターン比較装置において、周    
 ゛波数分析、LPG分析、PARCOR分析、相関□
分析等により、いくつかの数値の組(特徴ベクトル)の
系列に変換され、この人力バター/の特徴ベクトルと比
較の対象となる標準パターンの特徴ベクトルとが各ベク
トル毎に比較される。この各ベクトル毎の比較値、すな
わちベクトル間の距離を合計した累積距離というものを
パターンの類似の尺度に用いる。この累積距離を計算す
る場合、各ベクトル毎の比較をすべての組み合わせにつ
いて行うのは計算量が膨大となり、パターン比較装置と
して実用化することができない。
The input audio signal is
゛Wavenumber analysis, LPG analysis, PARCOR analysis, correlation□
Through analysis or the like, it is converted into a series of several sets of numerical values (feature vectors), and each vector is compared with the feature vector of the standard pattern to be compared. This comparison value for each vector, that is, the cumulative distance, which is the sum of distances between vectors, is used as a measure of pattern similarity. When calculating this cumulative distance, comparing each vector for all combinations requires an enormous amount of calculation, and cannot be put to practical use as a pattern comparison device.

、入力パターンを一方の軸に、標準パターンを他方の軸
とする平面(以下、i −i平面という)を考えると、
入力パターンおよび標準パターンの各ベクトルの組み合
わせというのは、i −j平面上の各格子点(以下、単
に点という)により示すことができる。従って前記あら
ゆる組み合わせについて各ベクトル間の距離を計算する
とは、各点におけるベクトル間の距離を計算することで
あり、累積距離を計算するとは、入力パターンの特徴ベ
クトルと、それに対応する標準パターンの特徴ベクトル
のベクトル間距離を順次計算し合計していくことである
。この累積距離を計算する過程で選択された、入力パタ
ーンと標準パターンの特徴ベクトルの対応、すなわち点
列を径路という。
, considering a plane (hereinafter referred to as i-i plane) with the input pattern on one axis and the standard pattern on the other axis,
The combination of each vector of the input pattern and the standard pattern can be represented by each grid point (hereinafter simply referred to as a point) on the i-j plane. Therefore, calculating the distance between each vector for all the above combinations means calculating the distance between vectors at each point, and calculating the cumulative distance means calculating the feature vector of the input pattern and the feature of the standard pattern corresponding to it. This involves sequentially calculating and summing the distances between vectors. The correspondence between the feature vectors of the input pattern and the standard pattern, that is, the sequence of points selected in the process of calculating this cumulative distance, is called a path.

前記した入力パターンの物理的な性質を考慮して比較の
範囲を限定するということは、径路の選択に拘束条件を
設けるということである。
Limiting the range of comparison in consideration of the physical properties of the input patterns described above means setting constraints on route selection.

ここで、以後の説明において用いる用語および記号につ
いて説明する。
Here, terms and symbols used in the following description will be explained.

A:入力パターン(A=a1.a2.・−、ai、・−
・、a工)、aiは第iフレームの特徴ベクトル、 Iは入力パターンのフレーム数 Rn:第n標準パターン(Rn=b?、]lF2.・・
・、bト・・・、b7n)b9は第n標準パターンの第
jフレームの】 特徴ベクトル ■0は第n標準パターンのフレーム数、Nを標準パター
ンの総数とするとき 1≦n≦N ”(’* j): 第n標準パターンの第jフレーム。
A: Input pattern (A=a1.a2.・-, ai,・−
・, a), ai is the feature vector of the i-th frame, I is the number of frames of the input pattern Rn: n-th standard pattern (Rn=b?, ]lF2...
・, bt..., b7n) b9 is the j-th frame of the n-th standard pattern] Feature vector ■0 is the number of frames of the n-th standard pattern, where N is the total number of standard patterns, 1≦n≦N” ('* j): j-th frame of the n-th standard pattern.

の特徴ベクトルbn と入力パターンの8giフレーム
の特徴ベクトルa□とのベクトル間距離 D(i):第1〜第iフレームまでの入力パターンと、
各標準パターンの最適な組み合わせの結合パターンとの
パターン間の距離(以下、終端累積距離という) N(i):第1〜第1フレームまでの入力バター、ンに
対する各標準パターンの最適な組み合わせの結合パター
/を求めたときの当該結合パターンを構成する最後尾標
準パターンを示す番号(以下、最後尾標準パターン名)
B(i):N(i)の始点フレームの1つ手前のフレー
ムを示す番号(以下、バックポインタという)” (’
 + ] ) :入入力バターの第1〜第1フレームま
での部分パターンとRnの第1〜第i′ フレームまで
の部分パターンのパターン間の距離(以下、部分累積距
離D?’ (i 、j )という)と、D(i’−1)
との和のi′についての最小値(以下、中間累積距離と
いう)B″(i+JL部分累積距離D7z(i、j)と
D(i’−1)との和を最小にするi′をsl、すなわ
ちi’=argmin (D(i’−1)+M/ (i
 、j )〕とするとき、当該ii′レームの1つ手前
の゛フレームを示す番号(以下、中間バックポインタと
いう) ただし、argmin Oは0内の値を×について最小
化したときの×の値を示す。
Intervector distance D(i) between the feature vector bn of the input pattern and the feature vector a□ of the 8gi frame of the input pattern: the input pattern from the first to the i-th frame,
Distance between patterns with the combined pattern of the optimal combination of each standard pattern (hereinafter referred to as the terminal cumulative distance) N(i): Distance between the optimal combination of each standard pattern with respect to the input butter and Number indicating the last standard pattern that constitutes the combined pattern when the combined pattern / is calculated (hereinafter referred to as the last standard pattern name)
B(i): Number indicating the frame one frame before the starting point frame of N(i) (hereinafter referred to as back pointer)"('
+]) : Distance between the partial pattern from the 1st frame to the 1st frame of the input input butter and the partial pattern from the 1st frame to the i'th frame of Rn (hereinafter, partial cumulative distance D?' (i, j ) and D(i'-1)
The minimum value for i' of the sum of (hereinafter referred to as intermediate cumulative distance) , i.e. i'=argmin (D(i'-1)+M/ (i
. shows.

D”(i): j =I nのときの中間累積距離であ
り、D”(i)=D” (i 、 I ” ) ’t’
 67)。
D"(i): is the intermediate cumulative distance when j = I n, and D"(i) = D" (i, I") 't'
67).

B”(i): n=1 ”のときの中間バックポインタ
であり、B”(i)=B”(i、J”) である。
B"(i): This is the intermediate back pointer when n=1", and B"(i)=B"(i, J").

0 (n) D P法は、入力パターンが第10フレー
ムで終了すると仮定した場合、最後尾パターンをHnと
したときの中間累積距離D ” (z o )を求める
のに、i′を始端フレームl ’Oを終端フレームとす
る入力パターンの部分パターンA(i’−1、io)と
標準パターンRnとのDPマツチングを始端点自由、終
端点固定として行うものであって、始端点i′における
中間累積距離の初期値Dn(i′、1)と中間バックポ
インタのm直B”(i’ 、o)をD”(i’ 、1 
)=D(i’ −1)Id”(i 、1 )B”(i’
 、0)=E”(i’ −1)とすることによって、第
1〜第1フレームまでのDPマツチングの続きとして部
分パターンA(i’−1゜10)ト標準パターンHnの
DPマツチングを行うものである。このようにすること
によって、例えば、第1図に示すようなマツチング径路
に対する拘束条件のもとでは、取り得るマツチング径路
は第2図のPの領域内に制限され、Dn(io)を求め
るために必要とされるd″(’+1)+”(i+t)の
計算は領域P内の各点についてそれぞれ1回行うのみで
よい。第2図において横軸は入力パターン、縦軸は最後
尾標準パターンHnである。領域Pは傾きHの直線P1
  と傾き2の直線2とで囲まれた領域となっている。
0 (n) D P method assumes that the input pattern ends at the 10th frame, and when the last pattern is Hn, the intermediate cumulative distance D '' (z o ) is calculated by setting i' to the starting frame. DP matching is performed between a partial pattern A (i'-1, io) of an input pattern whose end frame is l'O and a standard pattern Rn with a free start point and a fixed end point. The initial value Dn (i', 1) of the intermediate cumulative distance and the m direction B''(i', o) of the intermediate back pointer are expressed as D''(i', 1).
)=D(i'-1)Id"(i,1)B"(i'
, 0)=E"(i'-1), DP matching of partial pattern A(i'-1°10) and standard pattern Hn is performed as a continuation of DP matching from the first frame to the first frame. By doing this, for example, under the constraint conditions for matching paths as shown in FIG. 1, the possible matching paths are limited to the region P in FIG. ) The calculation of d''('+1)+''(i+t) needed to calculate d''('+1)+''(i+t) only needs to be performed once for each point in the area P.In Fig. 2, the horizontal axis is the input pattern, and the vertical axis is the input pattern. is the last standard pattern Hn.A region P is a straight line P1 with a slope H
This is an area surrounded by a straight line 2 with a slope of 2.

”(’+1)を求めるには、第1図から明らかなように
D″(i−2,j−1)。
To find ``('+1), D''(i-2, j-1), as is clear from FIG.

D”(i−11j−1)ID”(f−11j−2)Id
”(i−1tj)1d”(t、+)のみわかっていれば
よいから、第1フレーム上の中間累積距離D”(io、
j)(ただしり=1.2.・・・、In)を求めるには
、第10フレーム、第i−2クレーム上の中間累積距離
D”(i−1゜j)tD”(i−21j) お!び第1
−17v−ム、第1フレーム上のベクトル間距離”(’
−’+1)+”(’ r 3 ) (タタL s=1.
2 、+++、 J”) ヲ記憶シテおくのみでよい。
D”(i-11j-1)ID”(f-11j-2)Id
Since it is only necessary to know “(i-1tj)1d” (t, +), the intermediate cumulative distance D” (io,
j) (button = 1.2..., In), the intermediate cumulative distance D''(i-1゜j)tD''(i-21j ) oh! and 1st
−17v−m, distance between vectors on the first frame”('
−'+1)+”(' r 3 ) (Tata L s=1.
2, +++, J”) Just store it in your memory.

このとき、D ” (io )は D n(z o )=D n(io 、J ” )とし
て求めることができる。
At this time, D '' (io) can be obtained as D n (zo) = D n (io, J '').

以上のように、入力パターンのフレーム1が1フレーム
進む毎に、そのフレーム上の中間累積圧1ifID”(
i + i)(タタL、 j−=1.2.・+1”;n
=1.2゜・・・、N)を1フレーム前と2フレーム前
の中間累積距離D”(i−1+i)、D”(i−2,j
)、!:17v−ム前および当該フレームのベクトル間
距離d”(n=1.j)、d″(i+i)  CftJ
r:I、n=1.2.・・。
As described above, each time frame 1 of the input pattern advances by one frame, the intermediate cumulative pressure 1ifID"(
i + i) (Tata L, j-=1.2.・+1"; n
= 1.2°..., N) is the intermediate cumulative distance D"(i-1+i), D"(i-2,j
),! :17v-distance between vectors before the frame and in the current frame d'' (n=1.j), d'' (i+i) CftJ
r:I, n=1.2. ....

J”;n==1.2.・IN)から求め、D(i)’=
=s+m (D” (i 。
J''; n==1.2.・IN), D(i)'=
=s+m(D”(i.

Jo)〕として第1フレームまでの終端累積距離を求め
ることができる。このようにして求められた”(’+t
)(fcだしl=’ + 2*”’*I”+ ”=1e
 2r・・’+N)は必要がなくなるまで、すなわち次
の7レームないしその次のフレームにおけるD”(i、
j)の計算終了まで記憶される。
Jo)], the final cumulative distance to the first frame can be determined. It was obtained in this way” ('+t
) (fc, l=' + 2*"'*I"+ "=1e
2r...'+N) until it is no longer needed, that is, D''(i,
It is stored until the calculation of j) is completed.

また、D (i)に対するバックポインタCD(i)に
対する始端点から1を差し引いた値)B(i)は次のよ
うにして求まる。
Further, the back pointer for D(i) (the value obtained by subtracting 1 from the starting point for CD(i)) B(i) is determined as follows.

D”(i、j)に対する中間バックポインタをB”(’
I])とするとき、 1) Dn(iti)=D”(i−2+1−1)+d”
(i−1+i)+d”(iti)のときは B”(’ + 3)=””(’−2+ 1−1 )2)
 ”(’ + + )=”(’−’ I ]−1)”(
’ + ]) ノド@は  B”(’+1)=B”(’
−11]−1)3) D”(t+ +)=D”D−1,
j−2)+dn(i l D oトキは  Bn(i、
j)=Bn(i−1,5−2)とおくととによシ とすれば B(i)=B合(i、1合) となる。従って、B”(t、+)についても、1−フレ
ーム前と2フレーム前のものを覚えておく0なお、第3
図のような径路の場合は、”(’++)。
Set the intermediate back pointer for D"(i, j) to B"('
I]), 1) Dn(iti)=D"(i-2+1-1)+d"
(i-1+i)+d"(iti) then B"('+3)=""('-2+1-1)2)
”(' + + )=”('-' I ]-1)”(
' + ]) Nodo @ is B"('+1) = B"('
−11]−1)3) D”(t+ +)=D”D−1,
j-2)+dn(i l Dotoki is Bn(i,
j) = Bn (i-1, 5-2), then B(i) = B combination (i, 1 combination). Therefore, for B''(t, +), remember the one frame before and the one before two frames.
In the case of a route like the one shown in the figure, "('++)".

B”(’l])は1フレーム前の値を覚えておくだけで
よい。
B''('l]) only needs to remember the value of one frame before.

以上説明した原理を用いたパターン比較装置の従来例に
ついて説明する。第4図は以上の原理に基づくパターン
比較装置を連続単語認識に適用した場合の従来例を示す
ブロック図である。図において、Inは゛音声信号の入
力端子、1はフィルタバンク等で構成された特徴抽出部
であって、入力音声信号を特徴ベクトルa、の系列Aに
変換する。
A conventional example of a pattern comparison device using the principle explained above will be explained. FIG. 4 is a block diagram showing a conventional example in which a pattern comparison device based on the above principle is applied to continuous word recognition. In the figure, In is an input terminal for an audio signal, and 1 is a feature extraction unit composed of a filter bank, etc., which converts the input audio signal into a series A of feature vectors a.

2は単語標準パターン記憶部であって、認識語粟たるN
個の単語がそれぞれ標準パターンR”=b〒。
2 is a word standard pattern storage unit, which stores the recognized word N
Each word is a standard pattern R''=b〒.

・・・l b’j’ l・・・、b’i’n 、 (1
<n<N)  として特徴ベクトルの形で予め登録され
ている。3はベクトル間距離計算部であって、入力パタ
ーンの第iフレームにおける特徴ベクトルa、とn°番
目の単語標準パターンHHの特徴ベクトルb、との距離
d”(i、i)を、5=1.2.・・・、In  につ
いて求め、必要がなくなるまで記憶する。本例において
は中間累積距離     1を計算しているフレームの
1つ前のフレームおよ     1′び当該フレームの
ベクトル間距離を当該フレームの中間累積距離を計算す
るまで記憶する。”(ill)は、例えばa、とbj 
の市街距離として定義できる。すなわち、ベクトルb次
元を1とし、”i :(a il  +”i2””i 
 l)  l b j=(b jl  +”j2+・・
・、b〒1)とするとき となる。
...l b'j' l..., b'i'n, (1
<n<N) and is registered in advance in the form of a feature vector. 3 is an inter-vector distance calculation unit, which calculates the distance d'' (i, i) between the feature vector a in the i-th frame of the input pattern and the feature vector b of the n°-th word standard pattern HH, 5= 1.2..., In, and store it until it is no longer needed.In this example, the distance between the vectors of the frame immediately before the frame for which the intermediate cumulative distance 1 is being calculated, 1', and the frame concerned. "(ill) is stored until the intermediate cumulative distance of the frame is calculated." (ill) is, for example, a, and bj
It can be defined as the city distance of In other words, let the vector b dimension be 1, and “i:(a il +”i2””i
l) l b j=(b jl +”j2+...
・, b〒1).

4は累積距離計算部であって、第iフレームについて中
間累積距離”(’I))、終端累積距離D(i)。
4 is a cumulative distance calculation unit which calculates an intermediate cumulative distance "('I))" and a terminal cumulative distance D(i) for the i-th frame.

中間バンクポインタBn(1,j)、バックポインタB
 (i)を1 =1+ 2+”’+ J n: 1l=
=1t 2 、・・・+ Nについて求め、最後尾の単
語を示すN(i)を求める。第1図に示したマツチング
径路の拘束条件が採用される・・・・・・・・・0) 初期条件、D”(i、1)=D(i−1)+d”(i、
1)DCi)=min (D” (i 、 I ” )
)g”(i、j)、B(t)は次o式から求するoBn
(iti)は Bn(i、0)=Bn(i−1)ヲ初期条件トシテ1 
) ”(’ + ] )=”(’ 2* +−’ )+
d”(’ l ] )+dn(i−1,0 のときは は B”(ill)=B”(t−1+1−2)     −
・・−−−−−−(4)として求まり、B (i)は式
(1)を満足する単語番号をnとすれば B(i)=B”(i l 1”)       −−・
・−・・・(6)となる。また、N(i)=n  であ
る0以上のようにして求められた終端累積距離D(i)
=Dn(i、J”)は終端JRi距離記憶部sK、バッ
クポインタB(i)=Bn(i、T”)はバックポイン
タ記憶部6に、最後尾単語番号N(i)=nは最後尾単
語記憶部7に記憶される。
Intermediate bank pointer Bn (1, j), back pointer B
(i) as 1 = 1+ 2+”'+ J n: 1l=
=1t 2 , . . . + N is determined, and N(i) indicating the last word is determined. The matching path constraint conditions shown in Fig. 1 are adopted...0) Initial conditions, D"(i, 1) = D(i-1) + d"(i,
1) DCi)=min (D” (i, I”)
)g''(i, j), B(t) is oBn obtained from the following o formula
(iti) is Bn(i, 0) = Bn(i-1), the initial condition is 1
) ”('+])=”('2*+-')+
d"('l])+dn(i-1,0, then B"(ill)=B"(t-1+1-2) -
...----- (4), and B (i) is determined as n if the word number that satisfies equation (1) is B (i) = B" (i l 1") ---
...(6). Also, the terminal cumulative distance D(i) obtained as 0 or more where N(i) = n
= Dn (i, J") is the end JRi distance storage sK, back pointer B (i) = Bn (i, T") is stored in the back pointer storage 6, last word number N (i) = n is the last It is stored in the tail word storage section 7.

なおり”(i+i)、Bn(i+i)(ただしi=1.
2゜・・・、T”;n=1.2.・・・、N)は必要が
なくなるまで、累積距離計算部14に一時的に記憶され
る。本実施例においては中間累積距離を計算しているフ
レームの1つ前および2つ前のフレームの中間累積距離
を当該フレームの中間累積距離を計算するまで記憶する
Naori” (i+i), Bn(i+i) (however, i=1.
2゜..., T''; n = 1.2..., N) are temporarily stored in the cumulative distance calculation unit 14 until they are no longer needed. The intermediate cumulative distances of the frames immediately before and two frames before the current frame are stored until the intermediate cumulative distance of the frame is calculated.

また終端累積距離記憶部6に記憶される終端累積距離D
(i)は、式(1)の初期条件を求めるために必要7z
 モロDYl’6 リ、D (iJK ツイテハD” 
(i +1.1 )を求めるまで記憶されておればよい
Also, the terminal cumulative distance D stored in the terminal cumulative distance storage unit 6
(i) is necessary to find the initial condition of equation (1)7z
Moro DYl'6 Ri, D (iJK Tsuiteha D"
It suffices if it is stored until (i +1.1) is found.

8は音声区間検出部であって、入力信号の大きさ等から
音声区間を判定するものである。音声区間検出部8が、
音声入力が開始されたことを検出するとフレーム数計数
部9はフレーム毎に計数をはじめる。前記の処理は第i
フレームについての処理であったが、このフレーム数計
数部9の計数値がすなわちこのiを設定している。従っ
て、前記と同様の処理が、フレームが1進む毎に行われ
ることになる。フレーム数計数部9は音声区間が検出さ
れると計数を始め、音声区間が終了するとリセットされ
る。最後尾単語記憶部7.バックポインタ記憶部6には
、従って、N (i) 、 B (i)がi;1.2.
・・・、1について記憶されることになる。
Reference numeral 8 denotes a voice section detecting section, which determines a voice section from the magnitude of the input signal and the like. The voice section detection unit 8
When it is detected that audio input has started, the frame number counting section 9 starts counting each frame. The above process is
Although the processing was performed on frames, the count value of the frame number counting unit 9 sets i. Therefore, the same processing as described above is performed every time the frame advances by one. The frame number counting section 9 starts counting when a voice section is detected, and is reset when the voice section ends. Last word storage unit 7. Therefore, in the back pointer storage unit 6, N (i) and B (i) are i;1.2.
..., 1 will be stored.

セグメンテーション部10はバックポインタ記憶部6に
対し、所定のバックポインタを読出すべき命令を発する
ものである。すなわち、セグメンテーション部10がi
なる値をバックポインタ記憶部6に発すると、バックポ
インタ記憶部eからはバックポインタB (i)が読出
される。セグメンテーション部10はバックポインタ記
憶部6からB (i)なる値を受は取ると、その同じ値
をバックポインタ記憶部6に発する。従って、音声区間
検出部8が音声入力の終了上検知すると、フレーム数計
数部9の最終値工がセグメンテーション部1゜に供給さ
れ、セグメンテーション部1Qは先ず!なる値をバック
ポインタ記憶部eに発する。以後、前記説明の動作に従
って、バックポインタ記憶部らから、B(I) 、 B
 (B(I) ) 、B(B(B(I) ) ) 、・
・・、0なる出力が順次得られることになる。これらの
値は最後から2番目の単語の終シのフレーム、同3番目
の終りのフレーム、同4番目の終りのフレーム、・・・
・・・というものであり、N(i)はiフレームで終る
単語であったから、この値をそのまま最後尾単語記憶部
7に与えると、最後の単語から逆の順序で認識結果が得
られる。なお認識結果が逆の順序で得られないようにす
るためには、この順序の変換をバックポインタ記憶部6
の出力に対して行うか最後尾単語記憶部7の出力に対し
て行えばよい0 本従来例装置における最終フレームエまでの総計算回数
は、i−j空間の各点におけるベクトル間距離d(’+
1)+中間累積距離”(’+I)  の計算を各点毎に
ただ1回行うのみなので平均クレーム数を1とするとい
ずれもNIlとなる。従来の2段DP法を用いた装置に
おける総計算回数Nl−!12  と比べると計算回数
は1/(−T)になる。いま7レーム長が10 m5e
cで単語長が平均0n5secであったとすれば標準パ
ターンの平均フレーム数Iは、J=50であるから、計
算回数は1/37.5になる。また幅Rの窓(計算制限
領域)を設けた場合の計算回数NI IRと比べても1
/Rとなシ、Rは大体20位であるから計算回数は1/
2oとなる。
The segmentation unit 10 issues a command to the back pointer storage unit 6 to read a predetermined back pointer. That is, the segmentation unit 10
When the value B (i) is issued to the back pointer storage section 6, the back pointer B (i) is read out from the back pointer storage section e. When the segmentation unit 10 receives the value B(i) from the back pointer storage unit 6, it issues the same value to the back pointer storage unit 6. Therefore, when the voice section detecting section 8 detects the end of the voice input, the final value of the frame number counting section 9 is supplied to the segmentation section 1°, and the segmentation section 1Q first detects the end of the voice input. A value is issued to the back pointer storage section e. Thereafter, according to the operation described above, B(I), B are stored from the back pointer storage unit, etc.
(B(I) ) , B(B(B(I) ) ) ,・
..., outputs of 0 will be obtained sequentially. These values are the last frame of the second to last word, the third last frame of the last word, the fourth last frame of the last word, etc.
..., and since N(i) is a word that ends in the i frame, if this value is given as is to the last word storage section 7, the recognition results will be obtained in the reverse order starting from the last word. Note that in order to prevent recognition results from being obtained in the reverse order, this order conversion is performed using the back pointer storage unit 6.
or the output of the last word storage section 7.0 The total number of calculations up to the final frame in this conventional example device is determined by the distance between the vectors d( at each point in the i-j space) '+
1) + Intermediate Cumulative Distance ('+I) is calculated only once for each point, so if the average number of complaints is 1, then all of them are NIl.The total calculation in the device using the conventional two-stage DP method Compared to the number of times Nl-!12, the number of calculations becomes 1/(-T).The length of 7 rams is now 10 m5e.
If the average word length is 0n5 sec in c, the average number of frames I of the standard pattern is J=50, so the number of calculations is 1/37.5. Also, compared to the number of calculations NI IR when a window of width R (calculation restriction area) is provided, it is 1
/R and Nashi, R is approximately 20th place, so the number of calculations is 1/
It becomes 2o.

以上のように0(ロ)DP法においては、連続して発声
された音声を2段DP法よりもはるかに少い計算回数で
認識することができ、認識速度の速い連続音声認識装置
を実現することができ、入力フレーム毎に処理が可能で
あるから、実時間で動作する認識装置が可能となる。
As described above, the 0(b)DP method can recognize continuously uttered speech with far fewer calculations than the two-stage DP method, realizing a continuous speech recognition device with high recognition speed. Since processing can be performed for each input frame, a recognition device that operates in real time is possible.

しかし、前記ベクトル間距離d”(t、j)、中間累積
距離”’(is i )を77− A i毎に21=1
.2゜・・・、N;j=1.2.・・・、Inについて
求めるためには、標準パターン記憶用メモリとして、が
なり高速なアクセスが要求されることになる。例えば、
フレーム周期を6ms 、標準パターy数N m3ec
、標準パターンの平均7レーム数J =s。
However, the distance between the vectors d"(t, j) and the intermediate cumulative distance"'(is i ) are 21=1 for every 77-A i
.. 2°..., N; j=1.2. ..., In, a standard pattern storage memory is required to have very high speed access. for example,
Frame period 6ms, standard putter y number N m3ec
, the average number of 7 frames of the standard pattern J = s.

とすれば、入力パターンのフレーム当9の計算すべき平
均の格子点数はNT=9000であり、特微ベクトルの
次元数を16とすれば、入力パターンのフレーム当りの
標準パターン記憶用メモリに対するアクセス回数は90
00X15=135ooo  回“となる。これを5m
5eC内に行うためには、アクセスタイム37ns以下
が要求される。また、標準パターンの記憶に必要とされ
るメモリ量は、特徴ベクトルの1要素を1バイトで表現
するものとすれば、136KBとなり、37fiSeC
以下でアクセスできる高速メモリが、135KBも必要
ということになり、装置として大変高価なものになる。
Then, the average number of grid points to be calculated per frame of the input pattern is NT = 9000, and if the number of dimensions of the feature vector is 16, then the access to the standard pattern storage memory per frame of the input pattern is NT = 9000. The number of times is 90
00X15=135ooo times".This is 5m
To perform this within 5eC, an access time of 37 ns or less is required. In addition, the amount of memory required to store the standard pattern is 136KB, assuming that one element of the feature vector is expressed in one byte, which is 37fiSeC.
This means that 135 KB of high-speed memory, which can be accessed below, is required, making the device extremely expensive.

発明の目的 本発明は、前記方法による実時間向きの連続的パターン
の比較装置において、高速アクセスが要求されるメモリ
の数を大幅に減少させることを目的とする。
OBJECTS OF THE INVENTION It is an object of the present invention to significantly reduce the number of memories that require high-speed access in a real-time sequential pattern comparison device according to the method described above.

発明の構成 本発明は、入力信号を特徴ベクトル81r a 2 e
・・・+”i+・・・、alの系列に変換する特徴抽出
手段と、特徴ベクトルの系列bn 、 bn、・・・+
 b”j l・・・、b”inカら成る標準パターンR
n(ただしn=1.2.・・・。
Structure of the Invention The present invention converts an input signal into a feature vector 81r a 2 e
...+"i+..., a feature extraction means for converting into a series of features vectors bn, bn,...+
Standard pattern R consisting of b"j l..., b"in
n (however, n=1.2...

N)を記憶する標準パターン記憶手段と、入力フレーム
iを横軸に、標準パターンフレーム)を縦軸とする格子
グラフにおいて、標準パターンRnとマツチングすると
きは傾きkで、入カノシターンn のフレームに対してW(≦(−T−) +1 )フレー
ム隔ッた直線で挾まれる格子点に対して、標準パターン
の各フレームjの特徴ベクトルb?に対してj=1.2
.・・・、Inの順にi軸方向にマツチング径路の最大
傾斜がkの傾斜制限をもつDPマツチングを行い、1つ
の領域の計算が完了すると次の相隣る前記と同様な領域
の計算を同様に行うというように、入力パターンの全範
囲にわたって前記マツチング計算を行うDPマツチング
手段とを含むパターン比較装置である。
In a lattice graph with the input frame i as the horizontal axis and the standard pattern frame) as the vertical axis, when matching with the standard pattern Rn, the slope k is used to match the frame of the input pattern n. On the other hand, for the grid points sandwiched by straight lines separated by W(≦(-T-) +1) frames, the feature vector b of each frame j of the standard pattern? for j=1.2
.. ..., DP matching is performed in the i-axis direction in the order of In, with a slope restriction where the maximum slope of the matching path is k, and when the calculation of one area is completed, the calculation of the next adjacent area similar to the above is performed in the same way. and DP matching means for performing the matching calculation over the entire range of the input pattern.

実施例の説明 第5図は本発明の原理を示す図である。径路の制限条件
を、第1図または第3図のように選えは、24.25を
傾き2の直線、20.21を、 = 7 nと直線24
.26との交点、22.23をj=1と直線24.25
との交点とし、WをJ”/2とすれば、20〜21に含
まれる格子点の終端累積距離は22〜23に含まれる各
格子点までの終端累積距離と、直線24上の中間累積距
離が求まっておれば、計算できる0また、途中の計算も
矢印26に示すように横方向に順次下から上へ計算を進
めていくことができる。このようにして、フレーム周期
をTとするとき、時間WTの間に斜線部Aの計算を以上
のように行い、次のWTの間に斜線部Bの計算を以上の
ように行うというように、以上に述べた計算を時間WT
毎に順次進めてゆくことができる。
DESCRIPTION OF EMBODIMENTS FIG. 5 is a diagram showing the principle of the present invention. Choose the path restriction conditions as shown in Figure 1 or Figure 3: 24.25 is a straight line with slope 2, 20.21 is = 7 n and straight line 24
.. Intersection with 26, 22.23, j=1 and straight line 24.25
, and if W is J”/2, then the terminal cumulative distance of the grid points included in 20 to 21 is the terminal cumulative distance to each grid point included in 22 to 23, and the intermediate cumulative distance on straight line 24. If the distance is known, it can be calculated as 0.In addition, intermediate calculations can be performed horizontally from bottom to top as shown by arrow 26.In this way, the frame period is set to T. Then, during time WT, the calculation for the shaded area A is performed as described above, and during the next WT, the calculation for the shaded area B is performed as described above, and so on.
You can proceed step by step.

このようにすると、標準ノ(ターンの第jフレームは、
Wフレームの入カッくターンと照合する間一定で良いか
ら、標準)くターン用メモリに対して要求されるアクセ
スタイムを遅くすることができる。
In this way, the jth frame of the standard turn is
Since it can be kept constant while checking the input turn of the W frame, the access time required for the standard turn memory can be slowed down.

すなわち、各斜線部の格子点の数はWTであって、この
各格子点に対する計算をTWの間に行う必要があるが(
Tはフレームの周期とする)、このとき、標準パターン
の1フレームに対して許容される計算時間はTW/IN
となり、これは、標準ノ々ターンの1フン一ム分のデー
タを読み出す時間にμ豊であり、特徴ベクトルの次数を
以前と同じく15次とすれば、標準パターンの1つのベ
クトルの要素を読み出すために許されるアクセスタイム
は8.3μsec/15 = 553 n5ecとなり
、従来例で要求された値に比べると約16倍のアクセス
タイムで良いことになる。ただし、今度は入力パターン
を記憶するためのメモリに高速性が要求されるが(標準
パターンの第jフレームに対して、NW回の読W み出しを時間下の間に行わなければならない。
In other words, the number of grid points in each shaded area is WT, and calculations for each grid point need to be performed during TW (
T is the period of the frame), then the calculation time allowed for one frame of the standard pattern is TW/IN
This takes a lot of time to read out data for one hour of the standard number turn, and if the order of the feature vector is set to 15 as before, then the elements of one vector of the standard pattern can be read out. Therefore, the access time allowed is 8.3 μsec/15 = 553 n5ec, which is about 16 times the value required in the conventional example. However, this time, high speed is required of the memory for storing the input pattern (for the j-th frame of the standard pattern, reading must be performed NW times in a short period of time).

TW 前記の例に対しては、  /MW=T/NJ=5mSE
/]− 300X30==0.58μ気の間に15個の特徴ベク
トルを読み出す必要がある。従って、ベクトルの1つの
要素を読み出すのに許されるアクセスタイムは37 n
5ecとなる)、その必要とされる要素は、前記の例に
対しては平均16・W=15X30=450バイトで良
いことになり、大幅なコストダウンに・つながる。
TW For the above example, /MW=T/NJ=5mSE
/]-300X30==0.58μ It is necessary to read out 15 feature vectors. Therefore, the access time allowed to read one element of the vector is 37 n
5ec), the required elements are on average 16·W=15×30=450 bytes for the above example, leading to a significant cost reduction.

以上が本発明の原理であるが、Wを固定とする単純な考
え方では、W≦(min (I n〕/2) +1  
とする必要があり、標準パターンの中の最も短いパター
ンでWの値が決定されてしまい、あまり効果的でない場
合がある。この欠点を補うためには、Inが変る毎にそ
れに応じてWを可変とす石ことが考えられる(W”−(
J”/2) +1 )。本発明によるこのさらに進んだ
原理による比較装置の原理を次に述べる。
The above is the principle of the present invention, but in a simple concept where W is fixed, W≦(min (I n)/2) +1
Therefore, the value of W is determined by the shortest pattern among the standard patterns, which may not be very effective. In order to compensate for this drawback, it is conceivable to vary W accordingly each time In changes (W''-(
J"/2) +1). The principle of this further principle comparison device according to the invention will now be described.

第6図は本発明の詳細な説明する詳細図である。FIG. 6 is a detailed diagram illustrating the invention in detail.

いま、入力パターンが第iフレームのときの処理を説明
する。前記斜線A、B等のそれぞれをブロックと呼ぶこ
とにする。このとき、Dn(i−(’))が求まってい
なければ、同図におけるOで示す格・はこのブロックの
1つ前のブロックのj=1゜2、・・・、Inにおける
格子点でこれらの点における中間累積距離は、本ブロッ
クにおける中間累積距離の初期値となるものである。こ
の場合、マツチング径路の拘束条件は、第3図に示すも
のである。第1図に示す径路の拘束条件を用いるときは
、さらに0における中間累積距離を記憶しておく必要が
ある。Dn(i−〔こ〕)が求まっているときは、この
nに対応する標準パターンに対する計算はスキップする
ことになる。
Now, processing when the input pattern is the i-th frame will be explained. Each of the diagonal lines A, B, etc. will be called a block. At this time, if Dn(i-(')) is not found, the case indicated by O in the figure is a lattice point at j=1゜2,...,In of the block immediately before this block. The intermediate cumulative distances at these points are the initial values of the intermediate cumulative distances in this block. In this case, the constraint conditions for the matching path are as shown in FIG. When using the route constraint conditions shown in FIG. 1, it is also necessary to store the intermediate cumulative distance at 0. When Dn(i-[ko]) has been determined, the calculation for the standard pattern corresponding to n is skipped.

以上のようにすれば、各標準パターンHnに対し、n毎
にWn=〔工n/2〕+1として計算したことを決定す
るには、最初にD・(i−−2〕)を0、あるいは■に
初期化しておけば、求まっているときは、0以外の有限
の値になっているはずであることから判断が可能である
As described above, in order to determine that each standard pattern Hn is calculated by setting Wn = [work n/2] + 1 for each n, first set D・(i--2) to 0, Alternatively, if it is initialized to ■, it is possible to determine since it should be a finite value other than 0 when it has been determined.

第7図は、以上の原理に基づく本発明の実施例を示すブ
ロック図である。101は第4図で1と同じ動作を示す
特徴抽出部、102は第4図2と同様な単語標準パター
ン記憶部、103は第4図      。
FIG. 7 is a block diagram showing an embodiment of the present invention based on the above principle. Reference numeral 101 denotes a feature extractor which performs the same operation as 1 in FIG. 4, 102 a word standard pattern storage unit similar to that shown in FIG.

3と同様なベクトル間距離計算部であるが、本実13例
fUi算0”向7゛”1”向76銭・1°標′準パター
ンRnの第jフレームのベクトルb、にm= −[−!
−(1” −j+1 ) ] + iの範囲の入力パタ
ーンに対しdn(m11)を求める。
The inter-vector distance calculation unit is similar to that in 3, but in the actual 13th example fUi calculation, m = - for the vector b of the j-th frame of the 1° standard pattern Rn of [-!
−(1″−j+1) ] + dn(m11) is determined for the input pattern in the range of i.

104は累積距離計算部であって、前記d”(m、j)
と同様の範囲で中間累積距離、終端累積距離を求める。
104 is a cumulative distance calculation unit, which calculates the above-mentioned d''(m, j)
Find the intermediate cumulative distance and final cumulative distance in the same range as .

112は前記ベクトル間距離の計算と、累積距離の計算
の実行範囲を各n+]について決定いないとき、前記m
の範囲でd”(m、j)、Dn(m、j)の計算をそれ
ぞれベクトル間距離計算部103.累積距離計算部10
4に指示する。105〜107は第4図5〜7と同様な
動作をする。111は認識結果の出力端子であって、第
4図11で得られるものと全く等しい。
112 is the m
The intervector distance calculation unit 103 and the cumulative distance calculation unit 10 calculate d” (m, j) and Dn (m, j) within the range of
4. 105 to 107 perform the same operations as those in FIG. 4, 5 to 7. Reference numeral 111 is an output terminal for the recognition result, which is exactly the same as that obtained in FIG. 4, 11.

第8図は、第7図における実施例をより明確に説明する
ために、ソフトウェア的にその動作を説明するものであ
り、ソフトウェアにより本発明を実現する場合も本例に
従えば良い。
In order to more clearly explain the embodiment shown in FIG. 7, FIG. 8 explains its operation in terms of software, and this example may also be followed when the present invention is implemented by software.

本実施例においては、径路の拘束条件としては第1図の
ものを用いている。
In this embodiment, the conditions shown in FIG. 1 are used as the path constraint conditions.

201はマツチング径路の開始に先立って、中間累積距
離、終端累積距離等に閃を代入する等の初期化を行うス
テップである。202は音声区間終了後の処理のために
flagを′0”にセントしておくステップである。2
03は音声区間の開始を検出するステップであって、第
7図108が行う動作に対応する。音声区間が検出され
るまで、ステップ201,202が実行される。音声区
間が検出されるとステップ204〜ステツプ230が入
力の1フレーム毎に実行される。ステップ205〜ステ
ツプ224は、フレームlにおいて各標準パターンに対
して実行される。206はフレームiにおいて、標準パ
ターンnに対して、マツチング計算を行うべきかどうか
を判定するステップである。次の3つの条件が満たされ
たときマツチング計算を実行すべきであると判定する。
201 is a step in which, prior to starting the matching path, initialization is performed such as substituting flashes into intermediate cumulative distances, final cumulative distances, and the like. 202 is a step in which the flag is set to '0' for processing after the voice section ends.2
03 is a step of detecting the start of a voice section, and corresponds to the operation shown in FIG. 7 108. Steps 201 and 202 are executed until a voice section is detected. When a voice section is detected, steps 204 to 230 are executed for each frame of input. Steps 205 to 224 are performed for each standard pattern in frame l. 206 is a step of determining whether matching calculation should be performed for standard pattern n in frame i. It is determined that matching calculation should be performed when the following three conditions are met.

D・(i−〔ピ〕)−一 +n 1−(−)<、I +n 1−2(−)≧1 これは第7図112のマツチング計算実行範囲決定部の
動作に相当する。ステップ207〜ステツ7”210は
itフレームにおいてマツチング計算の実行に先立って
、マツチング計算の漸化式の初期値を標準パターンnに
ついて設定する。すなり”(m−1、O)=D(m−1
)、B”(m−1、O)=m−1ツブ211〜ステップ
217はj;1.・・、101間バックポインタを標準
パターンnについて計算する。213はその漸化式であ
って、 この式は、式(1)におけるiがmに変った点を除けば
全く同じ形であり、計算の順序が式(1)ではi毎にj
を1〜Inと変化させて求めていたのに対し、この式で
は、各jに対し、 −C’(1”−1+1))+t °と変化させて求めている点が異なる。ステップ218
〜ステツプ222は、ステップ213で計距離Dn(m
、In)が、それ以前に計算された標準パターン n/
に対する中間累積距離D”(m、J”)の最小値よりも
小さいときにステップ220で示される置き替を行うも
のである。以上のように、ステップ206〜ステツプ2
24の動作が完了すると、l以前の各フレームについて
、計算されたHnに対する最小値がD(i)に入ってい
ることになる。以上の動作は主として、第7図103〜
107で行われるものである。225は音声区間の終了
を検出するステップである。音声区間の終了が検出され
るまで、以上のステップ206〜ステツプ225の動作
が行われ、終端累積距離D(i)、終端バックポインタ
B(i)、最後尾単語N(1)が順次計算され、所定の
場所に記憶されてゆく。ステップ226〜ステツプ22
9は、以上の計算を行って      1音声区間を終
了したことが検出されても、前記ブロック毎に処理して
いくものであるから、前記D (i) 、 B (i)
 、 N (i)等は一般には音声区間の終了フレーム
まで求まっていないので、これを完全に求まで進める部
分である。ただし、’maニーma x (T町であり
、Iは音声区間の終るフレームである。ステップ231
は、以上のようにして求めた終端バックポインタB(i
)、最後尾単語N(i)から入力単語例を前記従来例と
同様にして求める部分である。
D·(i-[pi])-1+n 1-(-)<, I+n 1-2(-)≧1 This corresponds to the operation of the matching calculation execution range determining section 112 in FIG. Steps 207 to 7 210 set the initial value of the recurrence formula for the matching calculation for the standard pattern n before executing the matching calculation in the IT frame. -1
), B''(m-1, O)=m-1 The steps 211 to 217 calculate the back pointer between j; 1..., 101 for the standard pattern n. 213 is its recurrence formula, This formula has exactly the same form except that i in formula (1) has been changed to m, and the order of calculation is j for each i in formula (1).
The difference is that this formula is calculated by changing -C'(1''-1+1)) + t ° for each j, whereas it was calculated by changing it from 1 to In.Step 218
~Step 222 calculates the measured distance Dn (m
, In) is the previously calculated standard pattern n/
The replacement shown in step 220 is performed when the intermediate cumulative distance D'' (m, J'') is smaller than the minimum value. As described above, steps 206 to 2
When 24 operations are completed, the minimum value for Hn calculated for each frame before l will be in D(i). The above operations are mainly performed from 103 to 103 in FIG.
107. 225 is a step of detecting the end of the voice section. The operations from step 206 to step 225 described above are performed until the end of the voice section is detected, and the end cumulative distance D(i), end back pointer B(i), and last word N(1) are calculated in sequence. , are stored in a predetermined location. Step 226 - Step 22
9, even if it is detected that one voice section has ended after performing the above calculation, processing is continued for each block, so the D (i), B (i)
. However, 'many max (T town, I is the frame where the voice section ends. Step 231
is the terminal back pointer B(i
), the input word example is obtained from the last word N(i) in the same manner as in the conventional example.

ステップ232は結果を出力する部分であり、文字とし
てプリントアウトされるか、他の機器を動かすコマンド
の出力となる。
Step 232 is a part that outputs the results, which are printed out as characters or output as commands to operate other devices.

なお、本実施例においては、説明の便宜のために、点(
ir + )におけるベクトル間距離、中間累積距離、
中間バックポインタ等はそれぞれd”(ilj)、D”
(ilj)IB”(t、j) 等と表記したが、これら
の記憶領域はir1の全範囲にわたって準備する必要は
なく、第1段の格子点におけるD”(i、j)、B”(
ilj)+7)計gKは、第8図213に示す漸化式か
らも明らかなように、第1図、第3図の何れの径路に対
しても第】−11段j−2段O中間累m距mD”(l+
1−1) 、”(ir1−2L中間ハック;’f:イ7
りBn(i 、 i −1)、Bn(i 、 j−2)
のみ記憶していれば良く、この計算が終了すると、Dn
(ir1−2)、B”(ir1−2) の記憶内容は捨
−CてL4い、”(ilj  t)、Bn(i、1  
*)の内容とそれぞnD”(i、j−2)、B”(i、
j−2)(D記憶領域K、”(’ + +) lB”(
11]) O内容fDn(ir 1−1)、Bn(ir
1−1)O記憶領W2F1mサセ、Dn(ir + )
 IB”(111) ノ記憶領域ニ次段の計算結果を記
憶させて行けば良い。また、各ブロックの幅は、たかだ
かVvma X可maw(T”)/2) +Iであれば
良いから、前記漸化式の計算の為のバッフ1メモリとし
ては、入力パターン用としてW  フレームのバックア
メモリ1段分と、中間m&X 累積距離と中間バックポインタ用のバックァメモリとし
てWma xフレームのものが、それぞれ3段分と、ベ
クトル間距離記憶用としては、第1図の径路の制限条件
の場合はdn(i−1,j)のみ記憶していれば良いか
ら1フレ一ム分のみ準備しておけば良いことになる。第
3図の径路の制限条件の場合はベクトル間距離は計算さ
れる都度使用されるから特に記憶する必要はない。
In addition, in this example, for convenience of explanation, point (
ir + ), intermediate cumulative distance,
Intermediate back pointers etc. are d” (ilj) and D” respectively.
(ilj) IB"(t, j) etc., but these storage areas do not need to be prepared over the entire range of ir1, and D"(i, j), B"(
ilj)+7) As is clear from the recurrence formula shown in FIG. Cumulative m distance mD”(l+
1-1) ,”(ir1-2L intermediate hack;'f:i7
Bn(i, i-1), Bn(i, j-2)
All you need to remember is Dn.
(ir1-2), B" (ir1-2) are discarded, "(ilj t), Bn(i, 1
*) and the contents of nD"(i, j-2) and B"(i,
j-2) (D storage area K, "(' + +) lB" (
11]) O contents fDn(ir 1-1), Bn(ir
1-1) O memory area W2F1m Sase, Dn (ir + )
The calculation result of the next stage may be stored in the storage area of IB" (111). Also, the width of each block may be at most Vvma x maw(T")/2) +I, so The buffer 1 memory for calculating the recurrence formula consists of one stage of W-frame backer memory for the input pattern, and one Wmax-frame backer memory for the intermediate m&X cumulative distance and intermediate back pointer. For storing three stages and the distance between vectors, in the case of the path restriction conditions shown in Figure 1, it is sufficient to store only dn(i-1,j), so prepare only one frame. That's a good thing. In the case of the route restriction conditions shown in FIG. 3, the distance between vectors is used each time it is calculated, so there is no need to specifically store it.

また、本実施例においては、第1図または第3図に示す
ような径路の拘束条件を用いたため径路の最大の傾斜ば
2となるので、ブロックの幅は〔工n/2〕+1となっ
たが、径路の拘束条件としては、これ以外に種々前えら
れ、例えば、第9図のような場合は、最大の傾斜が3と
なるからこの揚殻に径路の最大の傾斜がkのときは、ブ
ロックのとはJnが整数の場合は等しい)0 さらに、本実施例においては、中間累積距離めに、これ
を〜等に初期化している場合について説明したが、入力
のフレーム1についてiがWnで割り切れるか否かを判
定して、割り切れるならマツチング計算を行い、割り切
れないならマツチング計算をスキップするようにしても
勿論良い。
In addition, in this example, since the constraint conditions for the path as shown in FIG. 1 or 3 are used, the maximum slope of the path is 2, so the width of the block is [engine n/2] + 1. However, there are various other constraint conditions for the path.For example, in the case shown in Figure 9, the maximum inclination is 3, so when the maximum inclination of the path in this shell is k, is the same as that of the block if Jn is an integer)0 Furthermore, in this embodiment, the intermediate cumulative distance is initialized to ~, etc., but for input frame 1, i Of course, it is also possible to determine whether or not is divisible by Wn, and if it is divisible, perform the matching calculation, and if not, skip the matching calculation.

発明の効果 以上のように、本発明によれば、CWDP法や0 (n
J D P法のように、DPマツチングを高速に連続し
て行う方法においては、高速、大容量のメモリが必要で
あったのが、高速性を要求されるメモリ数を大幅に減ら
すことができ、安価な装置の実現が可能となったもので
ある。
Effects of the Invention As described above, according to the present invention, the CWDP method and 0 (n
Methods such as the JDP method that perform DP matching continuously at high speed required high-speed, large-capacity memory, but now the number of memories that require high speed can be significantly reduced. This makes it possible to realize an inexpensive device.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図はマツチング計算径路の拘束条件を示す図、第2
図はマツチング計算を行う領域を示す図、第3図はマツ
チング計算径路の別の拘束条件を示す図、第4図は音声
認識装置の従来例を示すブロック図、第6図は本発明の
原理の概略を説明する図、第6図は本発明の原理の詳細
を説明する図、第7図は本発明における一実施例の音声
認識装置のブロック図、第8図は同実施例装置の機能を
ンフトウエアで実現したときのフローチャート、第9図
はマツチング計算径路の拘束条件の他の例を示す図であ
る。                      1
:′101・・・・・・特徴抽出部、102・・・・・
・単語標準パターン記憶部、103・・・・・・ベクト
ル間距離計算部、104・・・・・・累積距離計算部、
106・・・・・・終端累積距離記憶部、106・・・
・・・バックポインタ記憶部、107・・・・・・最後
尾単語記憶部、108・・・・・・音声区間検出部、1
09・・・・・・フレーム数計数部、110・・・・・
・セグメンテーション部、112・・・・・・マツチン
グ計算実行範囲決定部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図 λ力へ〇ターン 第3図 第9図 (1−2゜
Figure 1 shows the constraint conditions of the matching calculation path, Figure 2
The figure shows the area in which matching calculations are performed, Fig. 3 shows another constraint condition for the matching calculation path, Fig. 4 is a block diagram showing a conventional example of a speech recognition device, and Fig. 6 shows the principle of the present invention. 6 is a diagram explaining the details of the principle of the present invention, FIG. 7 is a block diagram of a speech recognition device according to an embodiment of the present invention, and FIG. 8 is a diagram showing the functions of the device according to the embodiment. FIG. 9 is a flowchart when this is realized by software, and is a diagram showing another example of constraint conditions for the matching calculation path. 1
:'101...Feature extraction section, 102...
・Word standard pattern storage unit, 103... Inter-vector distance calculation unit, 104... Cumulative distance calculation unit,
106...Terminal cumulative distance storage unit, 106...
... Back pointer storage section, 107 ... Last word storage section, 108 ... Voice section detection section, 1
09... Frame number counting section, 110...
- Segmentation unit, 112...Matching calculation execution range determination unit. Name of agent: Patent attorney Toshio Nakao and 1 other person No. 1
Figure 2 Turn to λ force Figure 3 Figure 9 (1-2°

Claims (1)

【特許請求の範囲】 入力信号を特徴ベクトルa_1、a_2、…、a_i、
…、a_Iの系列に変換する特徴抽出手段と、特徴ベク
トルの系列b^n_1、b^n_2、…、b^n_j、
…b^n_Jnから成る標準パターンR^n(ただし、
n=1、2、…、N)を記憶する標準パターン記憶手段
と、入力フレームiを横軸に、標準パターンフレームj
を縦軸とする格子グラフにおいて、標準パターンR^n
とマッチングするときは傾きkで、入力パターンのフレ
ームに対してW(≦2−〔(1−J^n−1)/k〕)
フレーム隔った直線で挾まれる格子点に対して、標準パ
ターンの各フレームjの特徴ベクトルb^n_jに対し
てj=1、2、…、J^nの順にi軸方向にマッチング
径距の最大傾斜が、kの傾斜制限をもつDPマッチング
を行い、1つの領域の計算が完了すると次の相隣る前記
と同様な領域の計算を同様に行うというように、入力パ
ターンの全範囲にわたって前記マッチング計算を行うD
Pマッチング手段とを含むことを特徴とするパターン比
較装置。
[Claims] The input signal is converted into feature vectors a_1, a_2, ..., a_i,
..., a_I, and a feature vector sequence b^n_1, b^n_2, ..., b^n_j,
...standard pattern R^n consisting of b^n_Jn (however,
standard pattern storage means for storing n=1, 2,...,N), and standard pattern frame j with input frame i on the horizontal axis.
In a lattice graph whose vertical axis is the standard pattern R^n
When matching with , the slope is k, and W(≦2-[(1-J^n-1)/k]) for the frame of the input pattern.
For the grid points sandwiched by straight lines separated by frames, the matching radius is calculated in the i-axis direction in the order of j = 1, 2, ..., J^n for the feature vector b^n_j of each frame j of the standard pattern. The maximum slope of is calculated over the entire range of the input pattern by performing DP matching with a slope limit of k, and when the calculation of one region is completed, the calculation of the next adjacent region similar to the above is performed in the same way. D performing the matching calculation
A pattern comparison device comprising: P matching means.
JP59224411A 1984-10-25 1984-10-25 Pattern comparison device Expired - Lifetime JPH067354B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59224411A JPH067354B2 (en) 1984-10-25 1984-10-25 Pattern comparison device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59224411A JPH067354B2 (en) 1984-10-25 1984-10-25 Pattern comparison device

Publications (2)

Publication Number Publication Date
JPS61102697A true JPS61102697A (en) 1986-05-21
JPH067354B2 JPH067354B2 (en) 1994-01-26

Family

ID=16813343

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59224411A Expired - Lifetime JPH067354B2 (en) 1984-10-25 1984-10-25 Pattern comparison device

Country Status (1)

Country Link
JP (1) JPH067354B2 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60211498A (en) * 1984-04-05 1985-10-23 日本電気株式会社 Continuous voice recognition equipment

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60211498A (en) * 1984-04-05 1985-10-23 日本電気株式会社 Continuous voice recognition equipment

Also Published As

Publication number Publication date
JPH067354B2 (en) 1994-01-26

Similar Documents

Publication Publication Date Title
JP2692581B2 (en) Acoustic category average value calculation device and adaptation device
US5005203A (en) Method of recognizing continuously spoken words
JP2980026B2 (en) Voice recognition device
US4901352A (en) Pattern matching method using restricted matching paths and apparatus therefor
JP2841404B2 (en) Continuous speech recognition device
JPH0247760B2 (en)
JP2964881B2 (en) Voice recognition device
JPS61102697A (en) Pattern comparator
JP3914709B2 (en) Speech recognition method and system
US6195638B1 (en) Pattern recognition system
JPS5855520B2 (en) Renzokuonseininshikisouchi
JP3999913B2 (en) Speech recognition system and method, and computer-readable recording medium recording speech recognition program
JPS6073698A (en) Pattern comparator
JPH0646358B2 (en) Pattern comparison device
JP4883717B2 (en) Voice recognition method and apparatus, voice recognition program and recording medium therefor
JPS5972498A (en) Pattern comparator
JPH0361957B2 (en)
JPH0247758B2 (en)
JP3092384B2 (en) Pattern matching device
JPH0449719B2 (en)
JPS6129897A (en) Pattern comparator
JPS62111295A (en) Voice recognition equipment
JPH0223876B2 (en)
JPH0636155B2 (en) Pattern comparison device
JPS61107398A (en) Voice recognition equipment

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term