JPS6265090A - Pattern comparator - Google Patents

Pattern comparator

Info

Publication number
JPS6265090A
JPS6265090A JP60205756A JP20575685A JPS6265090A JP S6265090 A JPS6265090 A JP S6265090A JP 60205756 A JP60205756 A JP 60205756A JP 20575685 A JP20575685 A JP 20575685A JP S6265090 A JPS6265090 A JP S6265090A
Authority
JP
Japan
Prior art keywords
frame
pattern
input
calculation
standard pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60205756A
Other languages
Japanese (ja)
Other versions
JPH0646358B2 (en
Inventor
英一 坪香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP60205756A priority Critical patent/JPH0646358B2/en
Publication of JPS6265090A publication Critical patent/JPS6265090A/en
Publication of JPH0646358B2 publication Critical patent/JPH0646358B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、特徴ベクトルの系列で表わされた複数種類の
標準パターンと入力パターンとの比較を行ない、入力パ
ターンの識別を行なうパターン比較装置に関し、特に連
続して発声した単語音声の認識などに適用可能なパター
ン比較装置に関する。
DETAILED DESCRIPTION OF THE INVENTION Field of the Invention The present invention relates to a pattern comparison device that identifies an input pattern by comparing an input pattern with a plurality of types of standard patterns represented by a series of feature vectors. In particular, the present invention relates to a pattern comparison device applicable to recognition of consecutively uttered word sounds.

従来の技術 人間にとって最も自然な情報発生手段である音声が、人
間−機械系の入力手段として使用出来れば、その効果は
非常に大きい。その場合、音声認識装置としては、より
自然な発声で認識出来る条件として、連続して発声した
音声の認識が出来ることが望ましい。
Conventional Technology If voice, which is the most natural means of generating information for humans, could be used as an input means for a human-machine system, the effect would be enormous. In this case, it is desirable for the speech recognition device to be able to recognize continuously uttered speech as a condition for recognizing more natural speech.

連続して発声した単語音声の認識に有効なパターン比較
装置として、動的計画法(以下DPと呼ぶ)を2段階用
いたいわゆる2段DP法を用いたパターン比較装置が既
に実用化されている。
A pattern comparison device using the so-called two-stage DP method, which uses two stages of dynamic programming (hereinafter referred to as DP), has already been put into practical use as a pattern comparison device that is effective in recognizing continuously uttered word sounds. .

しかし、この2段DP法は重複した計算が多く計算量が
膨大で、従ってこの方法を用いた実時間処理が可能なパ
ターン比較装置は極めて高速の処理が要求され、装置も
複雑で、高価なものとならざるを得ない。
However, this two-stage DP method involves many duplicate calculations and requires a huge amount of calculation.Therefore, a pattern comparison device that can perform real-time processing using this method is required to have extremely high-speed processing, and the device is also complex and expensive. It has no choice but to become a thing.

以上の欠点を除去するために、大幅に計算量の少ないパ
ターン比較装置として、○(N)DP法。
In order to eliminate the above drawbacks, the ○(N)DP method is used as a pattern comparison device that requires significantly less calculation.

CWDP法、ACDP法等を用いたパターン比較装置が
提案されている。しかし、これ等の方法を−・−ドウエ
ア的に実現するためには、高速にアクセス可能な大容量
のメモリを必要とする欠点がある。
Pattern comparison devices using the CWDP method, ACDP method, etc. have been proposed. However, in order to implement these methods in hardware, a large capacity memory that can be accessed at high speed is required.

本発明は、これ等の欠点を除去したパターン比軸装置を
提供するものであって、特に、特願昭58−48600
号明細書に記載されている前記A CD P (Aug
mented Continuous DPMatch
ing)法に適用することを目的とする。この方法は単
語数未知、単語数既知、何れの場合にも適用可能であり
、オートマトン制御も可能である。
The present invention provides a pattern ratio axis device that eliminates these drawbacks, and is particularly directed to patent application No. 58-48600.
The A CD P (Aug
Mented Continuous DP Match
ing) for the purpose of applying the law. This method can be applied to both cases where the number of words is unknown and the number of words is known, and automatic control is also possible.

本発明を説明するに先だって次にACDP法について説
明する。以後、ここでは簡単のために単語数未知の場合
について説明する。壕だ、本発明のパターン比較装置は
、種々の入力パターンの認識に用いることが出来るが、
以下、連続して発声される連続単語音声を例に説明する
Before explaining the present invention, the ACDP method will be explained next. Hereinafter, for the sake of simplicity, a case where the number of words is unknown will be explained. Although the pattern comparison device of the present invention can be used to recognize various input patterns,
In the following, continuous word speech that is continuously uttered will be explained as an example.

人間によ゛り発声される音声は人により1だ時により変
化し、基準となる標準パターンに対し時間的に非線形に
伸縮したものとなっている。この非線形に伸縮している
入力パターンと標準パターンとを比較し、入力音声の認
識を行なうためには、入力パターンと標準パターンの各
特徴ベクトルの対応付けを非線形に行ない、入力パター
ンがどの標準パターンと最も類似しているかを計算する
必要がある。しかし、この入力音声は非線形に伸縮する
とはいっても、異常に長く伸びたり、短くなったりする
ことはない。
The sounds uttered by humans change from time to time depending on the person, and are non-linearly expanded and contracted in time with respect to a standard pattern that serves as a reference. In order to compare this non-linearly expanded and contracted input pattern with the standard pattern and perform input speech recognition, we need to non-linearly associate each feature vector of the input pattern with the standard pattern, and determine which standard pattern the input pattern corresponds to. It is necessary to calculate which is most similar to However, even though this input voice expands and contracts nonlinearly, it does not become abnormally long or short.

このような入力パターンの物理的な特徴に注目し、入力
パターンと標準パターンを比較する際には無制限にすべ
ての可能性について比較するのではなく、入力パターン
の物理的な性質により定する妥当と考えられる範囲につ
いて比較を行なうようにする。
Focusing on the physical characteristics of such input patterns, when comparing input patterns and standard patterns, rather than comparing all possibilities without limit, the validity determined by the physical properties of the input patterns Try to make comparisons within a range of possibilities.

入力音声信号はパターン比較装置において、周波数分析
、LPC分析、PARCOR分析、相関分析等により、
いくつかの数値の組(特徴ベク)/りの系列に変換され
、この入力パターンの特徴ベクトルの系列と比較の対象
となる標準パターンの特徴ベクトルの系列とが各ベクト
ル毎に比較される。
The input audio signal is processed by a pattern comparison device through frequency analysis, LPC analysis, PARCOR analysis, correlation analysis, etc.
It is converted into a series of several sets of numerical values (feature vectors), and each vector is compared between the series of feature vectors of this input pattern and the series of feature vectors of the standard pattern to be compared.

この各ベクトル毎の比較値、すなわちベクトル間の距離
を合計した累積距離というものをパターンの類似の尺度
に用いる。この累積距離を計算する場合、各ベクトル毎
の比較をすべての組合せについて行なうのは計n量が膨
大となり、パターン比較装置として実用化することが出
来ない。
This comparison value for each vector, that is, the cumulative distance, which is the sum of distances between vectors, is used as a measure of pattern similarity. When calculating this cumulative distance, comparing each vector for all combinations would result in an enormous amount of total n, making it impossible to put it into practical use as a pattern comparison device.

入力パターンを一方の軸に、標準パターンを他方の軸と
する平面(以下、i−j平面という)を考えると、入力
パターンおよび標準パターンの各ベクトルの組合せと言
うのは、i−j平面上の各格子点(以下、単に点という
)により示すことが出来る。従って、前記あらゆる組合
せについて各ベクトル間の距離を計算するとは、各点に
おけるベクトル間の距離を計算することであり、累積距
離を計算するとは、入力パターンの特徴ベクトルと、そ
れに対応する標準パターンの特徴ベクトルとのベクトル
間距離を順次計算し、合計していくことである。この累
積距離を計算する過程で選択された、入力パターンと標
準パターンの特徴ベクトルの対応、即ち点列を径路と言
う。前記した入力パターンの物理的な性質を考慮して比
較の範囲を限定すると言うことは、径路の選択に拘束条
件を設けると言うことである。ここで、以後の説明にお
いて用いる用語および記号について説明する。
Considering a plane with the input pattern on one axis and the standard pattern on the other axis (hereinafter referred to as the ij plane), the combination of each vector of the input pattern and the standard pattern is a plane on the ij plane. can be shown by each grid point (hereinafter simply referred to as a point). Therefore, calculating the distance between vectors for all combinations means calculating the distance between vectors at each point, and calculating the cumulative distance means calculating the distance between the feature vector of the input pattern and the corresponding standard pattern. The distance between the vectors and the feature vectors is sequentially calculated and summed. The correspondence between the feature vectors of the input pattern and the standard pattern, that is, the sequence of points selected in the process of calculating this cumulative distance, is called a path. Limiting the range of comparison in consideration of the physical properties of the input patterns described above means setting constraints on route selection. Here, terms and symbols used in the following description will be explained.

A:入力パターン(A−al、a2.・・・、ao、・
・・。
A: Input pattern (A-al, a2..., ao,...
....

al) al:入力パターンAの第iフレームの特徴ベクトル I :入力パターンのフレーム数 Rn:第nm準バター 7 (Hn=bnj 、bn2
.、、、、bnj 。
al) al: Feature vector I of the i-th frame of the input pattern A: Number of frames of the input pattern Rn: nm-th quasi-butter 7 (Hn=bnj, bn2
.. ,,,,bnj.

・・・、bnyn) bnj=第n標準パターンの第】フレームの特徴ベクト
ル 1”:第n標準パターンのフレーム数 n:単語名(単語番号)1≦n≦N N:標準パターンの総数 dn(i、i): 第n標準パターンの第jフレームの
特徴ベクトルbnjと入カッリー ンの第iフレームの特徴ベクトル a・ とのベクトル間距離 Dn(s:t):入力パターンの部分ノ(ターンa3〜
atと標準パターンRn との最小 累積距離(以下、部分累積距離と 呼ぶ) D(i) :第1〜第iフレームまでの入カッくターン
と、各標準パターンの最適な組合せの結合パターンとの
パターン間の距離(以下、終端累積距離と呼ぶ) N(i):  第1〜第iフレームまでの入力パターン
に対する各標準パターンの最適な組合せの結合パターン
を求めたときの当該結合パターンを構成する最後尾標準
パターンを示す番号(以下、最後尾単語名と呼ぶ)B(
i) :  N(i)の始点フレームの1つ手前のフレ
ームを示すフレーム番号(以下、パックポインタと呼ぶ
) Dn(i、j):入力パターンの部分パターンam+1
〜a、と標準パターンRnの部分パタ −ンbn1〜bnj  との最小累積距離のmについて
の最小値(以下、途中累 積距離と呼ぶ) B”(i、i): Dn(i+i)  ヲ満fcf入カ
バター ンcD始点位置(以下、途中バックポイン タと呼ぶ) ただし、DPマツチングの径路は、Dn(s:t)。
. . . , bnyn) bnj = Feature vector 1 of the [th ] frame of the nth standard pattern: Number of frames of the nth standard pattern n: Word name (word number) 1≦n≦N N: Total number of standard patterns dn ( i, i): Inter-vector distance Dn (s:t) between the feature vector bnj of the j-th frame of the n-th standard pattern and the feature vector a of the i-th frame of the input pattern Dn(s:t): Partial distance of the input pattern (turns a3 to
Minimum cumulative distance between at and standard pattern Rn (hereinafter referred to as partial cumulative distance) D(i): The minimum cumulative distance between the first to i-th frames and the combination pattern of the optimal combination of each standard pattern. Distance between patterns (hereinafter referred to as end cumulative distance) N(i): Constitutes the combined pattern when determining the optimal combination of each standard pattern for the input pattern from the first to the i-th frame. Number indicating the last standard pattern (hereinafter referred to as the last word name)B(
i): Frame number indicating the frame one before the starting point frame of N(i) (hereinafter referred to as pack pointer) Dn(i, j): Partial pattern am+1 of the input pattern
The minimum value for m of the minimum cumulative distance between ~a and the partial patterns bn1 to bnj of the standard pattern Rn (hereinafter referred to as intermediate cumulative distance) B''(i, i): Dn(i+i) ヲfcf Input back pattern cD starting point position (hereinafter referred to as intermediate back pointer) However, the path for DP matching is Dn (s:t).

D(i)については入力パターン側の軸を基本軸とする
径路であって、Dn(i、i)については標準パターン
側の軸を基本軸とする径路である。
D(i) is a path whose basic axis is the axis on the input pattern side, and Dn(i, i) is a path whose basic axis is the axis on the standard pattern side.

DPマツチングによる連続単語音声認識は次なる漸化式
を計算することによって効率的に実行される。即ち B(i)=ビ N(i)=n“ ただし、m”、n’は式(1)を満たすm 、 nをi
=1〜工について順次計算すればN(I)、N(B(I
)) 、N(B(B(I)) ) 、・・・、N(B(
J・・・B(I)・・)))によって入力された単語が
逆の順序で求められる。
Continuous word speech recognition using DP matching is efficiently performed by calculating the following recurrence formula. That is, B(i)=BiN(i)=n", where m", n' is m that satisfies formula (1), and n is i
If you calculate sequentially for = 1 ~ engineering, you get N(I), N(B(I
)) , N(B(B(I)) ) ,..., N(B(
J...B(I)...))) The input words are found in the reverse order.

第2図は式(1)の計算の物理的意味を説明する図であ
る。bはDn(m:i)を計算する場合の径路の拘束条
件の一実施例である。即ち、点(’+j)に至る径路は
点(i−2,1−1)、(i−1,j−1)。
FIG. 2 is a diagram explaining the physical meaning of the calculation of equation (1). b is an example of the constraint condition of the path when calculating Dn(m:i). That is, the route leading to point ('+j) is point (i-2, 1-1), (i-1, j-1).

(’−’ r j−2)を必ず通り、累積距離が計算さ
れる際、選択された径路に応じて各点のベクトル間距離
に径路上に示した数字で表わされる重み付けがなされる
。このような重みの与え方をすれば同図に示す径路の拘
束条件の許では如何なる径路が選ばれようとも、その径
路に沿う重みの和は入力パターンのフレーム数に等しく
なり一定となる。
('-' r j-2), and when the cumulative distance is calculated, the distance between vectors at each point is weighted according to the selected route, as represented by the number shown on the route. If weights are given in this way, no matter what route is selected under the route constraint conditions shown in the figure, the sum of the weights along that route will be equal to the number of frames of the input pattern and will be constant.

aは入力パターンの第n + 1フレームから第iフレ
ームまでの部分パターンと第n標準パターンHnとのマ
ツチングの様子を示している。直線1は傾斜が%であっ
て、直線2は傾斜が2であり、DPマツチングの径路は
bの拘束条件の許では両直線に挾まれる領域に限定され
る。3は選ばれたマツチング径路の一例である。
a shows how partial patterns from the n+1 frame to the i-th frame of the input pattern are matched with the n-th standard pattern Hn. Straight line 1 has a slope of %, straight line 2 has a slope of 2, and the path of DP matching is limited to the area sandwiched by both straight lines under the constraint b. 3 is an example of a selected matching path.

式(1)を計算するためには、Dn(m+1 : i 
)をn=1〜Nについて、iと10 に関係したmのあ
る範囲に渡って、i=1〜Iのそれぞれについて計算し
なければならない。即ち、第2図aの例で言えば、iが
変わる毎に直線1.2で囲まれる三角形の領域内の全格
子点についてベクトル間距離及び累積距離を計算しなけ
ればならない。
In order to calculate equation (1), Dn(m+1 : i
) must be calculated for each of i=1 to I over a range of m related to i and 10. That is, in the example of FIG. 2a, the inter-vector distance and cumulative distance must be calculated for all grid points within the triangular area surrounded by straight line 1.2 every time i changes.

ACDP法は、このDn(m+1 : i )の計算を
ワードスポツティングの考え方を導入して近似的に行な
うことにより、その計算量を大幅に減らすものである。
The ACDP method substantially reduces the amount of calculation by approximately calculating Dn(m+1:i) by introducing the idea of word spotting.

第3図はACDP法の概念を説明する図である。FIG. 3 is a diagram explaining the concept of the ACDP method.

aは径路の拘束条件の一例を示す図である。即ち、点(
’+1)に至る径路は点(i−2,j−1)、(1−1
、j−1)、(i−1,j−2)を必ず通り、径路上に
示した数字はこの重みを表わす。第2図すに示すものと
の本質的な違いは、このような重みの与え方をすれば同
図に示す径路の拘束条件の許では如何なる径路が選ばれ
ようとも、その径路に沿う重みの和は標準パターンのフ
レーム数に等しくなり一定となると言う点にある。
FIG. 5A is a diagram showing an example of constraint conditions for a route. That is, the point (
'+1) is the point (i-2, j-1), (1-1
, j-1) and (i-1, j-2), and the number shown on the route represents this weight. The essential difference from the one shown in Figure 2 is that if the weights are given in this way, no matter what route is chosen under the route constraint conditions shown in the figure, the weight along that route will be The point is that the sum is equal to the number of frames of the standard pattern and remains constant.

ACDP法の考え方を要約すれば、 (1)第3図aの如き標準パターン側の軸を基本軸とす
る径路の拘束条件に従ってDn(i+ Jn) +Bn
(i、Jn)を計算する。
To summarize the idea of the ACDP method, (1) Dn(i+Jn) +Bn according to the constraint condition of the path whose basic axis is the axis on the standard pattern side as shown in Figure 3a.
Calculate (i, Jn).

j2)  m+1−n=(i、In)とおいて1)n(
t、■”)からDn(m−r+1:i) 〜Dn(m+
r+1:i)を近似的に推定する。即ち、 Dn(m+1:1)=Dn(i、In)拳−Jn となる。ここで、rはD”(m+1 : i )の推定
の範囲である。
j2) m+1-n=(i, In), 1) n(
t, ■”) to Dn(m-r+1:i) ~Dn(m+
approximately estimate r+1:i). That is, Dn(m+1:1)=Dn(i,In)fist-Jn. Here, r is the range of estimation of D''(m+1:i).

(1) 、 (2)より、結局 B”(111)−”1m+1≦Bn(ijn)+rの任
意の点を始点、lを終点とするDn(m+1:i)を近
似的に推定出来たことになる。
From (1) and (2), we were able to approximately estimate Dn(m+1:i) with the starting point at any point in B"(111)-"1m+1≦Bn(ijn)+r and the ending point at l. become.

この方法を連続単語音声認識に適用すると次のようにな
る。
When this method is applied to continuous word speech recognition, the result is as follows.

(1)初期条件 りゆ)=Q、13ゆ)=0 Dn(−1、1)=Dn(o、 j)=oo、for 
n==1−N、 j=1〜J”(2)i=1〜Iについ
て(3)〜(′7)を実行ゆ) n=1〜Nについて(
4)〜(6)を実行(4)初期値Dn(l、1)−dn
(i、1)(5)i=3〜Jnについて (6)r’=o〜rについて m+1=Bn(i、Jn) (D(m’)+rf′(m’+1 :1)1(7四゛)
−07=1゜−0,。。70.。−14,N、3(8)
判定処理(前記の如< B(i)、 N(i)から単語
列を逆の順序で求める) 以上の処理からも明らかなように、ACDP法によれば
、最も計算量の多いdn(l++)の計算を含むステッ
プ(41、((へ)の計算は各i、nについて1回行な
うのみでよいから、通常の2段DPに比べると計算量が
大幅に減少するものである。
(1) Initial conditions Ryu) = Q, 13 Yu) = 0 Dn (-1, 1) = Dn (o, j) = oo, for
n = = 1 - N, j = 1 ~ J'' (2) Execute (3) ~ ('7) for i = 1 ~ I) For n = 1 ~ N (
4) Execute (6) (4) Initial value Dn (l, 1) - dn
(i, 1) (5) For i = 3 ~ Jn (6) For r' = o ~ r m + 1 = Bn (i, Jn) (D (m') + rf'(m' + 1 : 1) 1 (7 4)
−07=1°−0,. . 70. . -14,N,3(8)
Judgment process (determining the word string from B(i), N(i) in the reverse order as described above) As is clear from the above process, according to the ACDP method, dn(l++ Since the calculation of step (41, (to) including the calculation of ) only needs to be performed once for each i and n, the amount of calculation is significantly reduced compared to a normal two-stage DP.

ところが、前記ベクトル間距離dn(i++)、途中累
積距離Dn(111)を7 V −ムi毎にn=1〜N
However, if the distance between the vectors dn(i++) and the intermediate cumulative distance Dn(111) are changed to n=1 to N for every 7 V -mu i,
.

j=1〜Jn について求めるためには、標準パターン
記憶用メモリとして、かなり高速なアクセスが要求され
ることになる。例えば、フレーム周期を5m5ec  
、標準パターン数N=300.標準パターンの平均フレ
ーム数1 =30とすれば、入力パターンのフレーム当
たりの計算すべき平均の格子点数はN 1 =9000
であり、特徴ベクトルの次元数を15とすれば、入力パ
ターンのフレーム当たりの標準パターン記憶用メモリに
対するアクセス回数は9000X15=135000回
となる。
In order to obtain j=1 to Jn, fairly high-speed access is required as a memory for storing standard patterns. For example, set the frame period to 5m5ec
, number of standard patterns N=300. If the average number of frames of the standard pattern is 1 = 30, the average number of grid points to be calculated per frame of the input pattern is N 1 = 9000.
If the number of dimensions of the feature vector is 15, the number of accesses to the standard pattern storage memory per frame of the input pattern is 9000×15=135000.

これを5mBeC内に行なうためには、アクセスタイム
37 n5ec以下が要求される。また、標準パターン
の記憶に必要とされるメモリ量は、特徴ベクトルの1要
素を1バイトで表現するものとすれば、1sskBとな
り、37 n5ec以下でアクセスできる高速メモリが
、135kBも必要ということになり、装置として大変
高価なものになる。
In order to do this within 5 mBeC, an access time of 37 n5ec or less is required. In addition, the amount of memory required to store the standard pattern is 1sskB if one element of the feature vector is expressed in one byte, which means that 135kB of high-speed memory that can be accessed in 37 n5ec or less is required. This makes the device very expensive.

発明が解決しようとする問題点 本発明は、前記ACDP法による連続的ノ(ターンの比
較装置において、高速アクセスが要求されるメモリの数
を大幅に減少させることを目的とする。
Problems to be Solved by the Invention It is an object of the present invention to significantly reduce the number of memories that require high-speed access in a continuous turn comparison device based on the ACDP method.

問題点を解決するだめの手段 本発明のパターン比較装置は、入力信号を特徴ベクトル
a 1 、 a 2 r・・・+ a 1 r・・・、
aIの系列に変換する特徴抽出手段と、特徴ベクトルの
系列bn1.bn2゜・・・、bn3.・・・、bn■
nから成る標準パターンHn(ただし、n=1〜N)を
記憶する標準パターン記憶手段と、入力のフレームiを
横軸に、標準パターンのフレームjを縦軸とする格子グ
ラフにおいて、標準パターンHn とマツチングすると
きは、入力パターンのフレームに対してWフレーム隔た
った直線で挾まれる領域の格子点に対して、標準パター
ンの各フレームjの特徴ベクトルbnjのそれぞれに対
してi軸方向に前記Wの幅でDPマツチングをj=1〜
■0の順に行ない、1つの領域の計算が完了すると次の
相隣る前記と同様な領域の計算を同様に行なうというよ
うに、入力パターンの全範囲に渡って前記マツチング計
算を行なうDPマツチング手段を備えている。
Means for Solving the Problem The pattern comparison device of the present invention converts the input signal into feature vectors a 1 , a 2 r...+ a 1 r...,
a feature extraction means for converting into a series of feature vectors bn1. bn2゜..., bn3. ...,bn■
A standard pattern storage means for storing a standard pattern Hn consisting of n (where n=1 to N), and a lattice graph having an input frame i as a horizontal axis and a standard pattern frame j as a vertical axis. When matching with, for each of the feature vectors bnj of each frame j of the standard pattern, DP matching with the width of W from j=1 to
(2) A DP matching means that performs the matching calculation over the entire range of the input pattern, such that the matching calculation is performed in the order of 0, and when the calculation of one area is completed, the calculation of the next adjacent area similar to the above is performed in the same manner. It is equipped with

作  用 入力信号を特徴ベクトルa1 、 a2 、・・・、a
、、・・・ 。
The input signal is transformed into a feature vector a1, a2,..., a
,,... .

aIの系列に変換し、特徴ベクトルの系列bn1゜bn
3.・・・、bnj、・・・、bnInカラ成ル標準ハ
ターンRn(ただし、n=1〜N)と、入力のフレーム
iを横軸に、標準パターンのフレームjを縦軸とする格
子グラフにおいて、標準パターンRnとマツチングする
ときは、入力パターンのフレームに対してWフレーム隔
たった直線で挾まれる領域の格子点に対して、標準パタ
ーンの各フレームjの特徴ベクトルbnjのそれぞれに
対してi軸方向に前記】 Wの幅でDPマツチングをj=1〜■0の順に行ない、
1つの領域の計算が完了すると次の相隣る前記と同様な
領域の計算を同様に行なうというように、入力パターン
の全範囲に渡って前記マツチング計算を行なう。
Convert to a series of aI, and create a series of feature vectors bn1゜bn
3. ..., bnj, . , when matching with the standard pattern Rn, for each of the feature vectors bnj of each frame j of the standard pattern, i In the axial direction, perform DP matching with the width W in the order of j = 1 to ■0,
When the calculation for one area is completed, the matching calculation is performed for the entire range of the input pattern, such that calculations for the next adjacent area similar to the above are performed in the same manner.

実施例 第4図は本発明の原理を示す図である。径路の制限条件
を第3図のように選べば、8.9をj軸に平行で互いに
W(≦In/2)フレーム隔たった直線とすれば、直線
8上の途中累積距離Dn(i。
Embodiment FIG. 4 is a diagram showing the principle of the present invention. If the limiting conditions for the route are chosen as shown in FIG. 3, and 8.9 is a straight line parallel to the j-axis and separated from each other by W (≦In/2) frames, then the cumulative distance along the straight line 8 is Dn(i.

))が求まっておれば、両直線で挾まれる領域(斜線部
分)の途中累積距離Dn(i、i)は計算することが出
来、さらに、直線8と直線t、)n  との交点を10
.直線9と直線j=J” との交点を11とすれば、1
0〜11に含まれる各格子点までの終端累積距離D(i
)は直線8以前の終端累積距離が求まっておれば計算出
来る。途中の計算は矢印12に示すように横方向に順次
下から上へ計算を進めて行くことが出来る。このように
して、フレーム周期をTとするとき、時間WTの間に斜
線部Aの計算を以上のように行ない、次のWTの間に斜
線部Bの計算を以上のように行なうと言うように、以上
に述べた計算を時間WJ毎に順次進めてゆくこ・とが出
来る。
)), it is possible to calculate the intermediate cumulative distance Dn(i, i) of the area sandwiched by both straight lines (shaded area), and furthermore, the intersection of the straight line 8 and the straight line t, )n can be calculated. 10
.. If the intersection of straight line 9 and straight line j=J'' is 11, then 1
The terminal cumulative distance D(i
) can be calculated if the terminal cumulative distance before straight line 8 is determined. The intermediate calculations can be performed horizontally from bottom to top as shown by arrow 12. In this way, when the frame period is T, the calculation for the shaded area A is performed as described above during the time WT, and the calculation for the shaded area B is performed as described above during the next WT. In addition, it is possible to proceed with the calculations described above sequentially for each time WJ.

このようにすると、標準パターンの第jフレームは、W
フレームの入力パターンと照合する間一定で良いから、
標準パターン用メモリに対して要求されるアクセスタイ
ムを遅くすることが出来る。
In this way, the jth frame of the standard pattern becomes W
It can be constant while matching with the input pattern of the frame, so
The access time required for the standard pattern memory can be slowed down.

即ち、各斜線部の格子点の数はWJであって、この各格
子点に対する計算をTWの間に行なう必要があるが(T
はフレームの周期とする)、このとき、標準パターンの
1フレームに対して許容される計算時間はTW/INと
なり、これは、標準パターンの1フレ一ム分のデータを
読み出す時間に等しく、前記の数値を当てはめれば、W
=J/2であるからT (1/2 )/ TN−=T/
2N =5msec/2X300:8.3μsec で
あり、特徴ベクトルの次数を以前と同じく16次とすれ
ば、標準パターンの1つのベクトルの要素を読み出すた
めに許されるアクセスタイムは8.3 psec /1
5=553nsecとなり、従来例で要求された値に比
べると約16倍のアクセスタイムで良いことになる。但
し、今度は入力パターンを記憶するためのメモリに高速
性が要求されるが(標準パターンの第1フレームに対し
て、NW回の読み出しを時間TW/Jの間に行なわなけ
ればならない。前記の例に対しては、TW/T/NW=
T/NT=5msec/300X30=0.561ts
ecの間に16個の特徴ベクトルを読み出す必要がある
。従って、ベクトルの1つの要素を読み出すのに許され
るアクセスタイムは37 n5ecとなる。その必要と
される容量は、前記の例に対しては、平均15W=15
X30=450  バイトで良いことになり、大幅なコ
ストダウンにつながる。
That is, the number of grid points in each shaded area is WJ, and calculations for each grid point must be performed during TW (T
is the frame period), then the calculation time allowed for one frame of the standard pattern is TW/IN, which is equal to the time to read the data for one frame of the standard pattern, and the calculation time allowed for one frame of the standard pattern is TW/IN. If we apply the numerical value of W
= J/2, so T (1/2)/ TN-=T/
2N = 5 msec/2X300: 8.3 μsec, and if the order of the feature vector is set to 16 as before, the access time allowed to read out the elements of one vector of the standard pattern is 8.3 psec/1.
5=553 nsec, which means that the access time is approximately 16 times longer than the value required in the conventional example. However, this time, high speed is required of the memory for storing the input pattern (the first frame of the standard pattern must be read NW times during the time TW/J. For example, TW/T/NW=
T/NT=5msec/300X30=0.561ts
It is necessary to read out 16 feature vectors during ec. Therefore, the access time allowed to read one element of the vector is 37 n5ec. The required capacity is, for the above example, an average of 15 W = 15
X30=450 bytes is enough, leading to a significant cost reduction.

以上が本発明の原理であるが、Wは固定とすることも可
変とすることも出来る。Wを固定とする場合は基本的に
は工0の最小値を■□とするとき、W≦J 、 /2 
 とするのが最も簡単であるが、工0礼! として非常に短いものが含まれるときはあまり効果的で
ない。但し、メモリを用いれば、W>Jll。
The above is the principle of the present invention, but W can be fixed or variable. When W is fixed, basically, when the minimum value of work 0 is ■□, W≦J, /2
The easiest way is to do this, but it costs 0! It is not very effective when very short items are included. However, if memory is used, W>Jll.

/′2の場合でも以上のような考え方により計算を行な
うことが出来る。即ち、Do(i、In)自体は)玉章
の入力フレームの幅で計算が可能であるが、これからD
n(i)を求めるためには、i−J、7/2までの経端
累積距離が求まっている必要がある。従って、W)T、
/2としたときは、Dn(1)を計算すシラ るiでW−IJ2フv一部分のD”(t、In)。
Even in the case of /'2, calculations can be performed using the above concept. In other words, Do(i, In) itself can be calculated using the width of the input frame of the jade badge, but from now on, D
In order to find n(i), it is necessary to find the meridian cumulative distance to i-J, 7/2. Therefore, W)T,
/2, calculate Dn(1) at i and part of W-IJ2Fvv (t, In).

Bn(i、■”)を記憶しておけば良い。また、前記欠
点を補うには、Jnに応じてWを可変とすることも可能
である。
It is sufficient to memorize Bn(i, ■''). Also, in order to compensate for the above-mentioned drawback, it is also possible to make W variable according to Jn.

本実施例ではInに応じてWを可変とする場合について
説明する。
In this embodiment, a case will be described in which W is made variable depending on In.

第6図は本発明の詳細な説明する詳細図である。FIG. 6 is a detailed diagram illustrating the invention in detail.

い捷、入力パターンが第1フレームのときの処理を説明
する。前記斜線A、B等のそれぞれをブロックと呼ぶこ
とにする。このとき、Dn(i−IJ”/2〕)が求ま
っていなければ、同図における○で示す格子点について
前記の計算を行ない、Dn(i−[:In/2) )、
Dn(i −(In/2) +1 )、 ・、Dn(i
)を求める。・はこのブロックの1つ前のブロックのi
=1.2.・・・ Jnにおける格子点でこれらの点に
おける途中累積距離Dn(’++)は、本ブロックにお
ける途中累積距離Dn(’++)の初期値となるもので
ある。Dn(i−CI”/2)’)が求まっているとき
は、このnに対応する標準・ぐターンに対する計算はス
キップすることになる。
Processing when the input pattern is the first frame will now be described. Each of the diagonal lines A, B, etc. will be called a block. At this time, if Dn(i-IJ''/2)) has not been determined, the above calculation is performed for the grid points indicated by ○ in the same figure, and Dn(i-[:In/2)),
Dn(i −(In/2) +1 ), ・, Dn(i
).・is i of the block before this block
=1.2. ... The intermediate cumulative distance Dn('++) at these grid points in Jn becomes the initial value of the intermediate cumulative distance Dn('++) in this block. When Dn(i-CI''/2)') has been determined, the calculation for the standard turn corresponding to n is skipped.

以上のようにすれば、各標準パターンRnに対する前記
ブロックの幅をn毎にWn=(In/2)+1として計
算したことになる。Dn(i−(In/2))が求まっ
ているか否かを決定するには、最初にDn(i−[:I
n/2) ) to アルイハcx:□に初期化t、テ
おけば、求まっているときは、0あるいは(1)以外の
有限の値になっているはずであることから判断が可能で
ある。または、Dn(i)が求まっているときはGn(
i)−〇、求まッテイナイときはGn(i) = 1と
設定されるフラグGn(1)を設け、初期値をG”(i
) =1 for  i=1〜Iと設定しておき、Dn
(i)が求まる毎にG ”(i) −〇とすることにす
れば、G”(i)を見ることにより、Dn(i)が求ま
っているか否かが判定出来る。
By doing the above, the width of the block for each standard pattern Rn is calculated as Wn=(In/2)+1 for every n. To determine whether Dn(i-(In/2)) has been found, first
This can be determined from the fact that if initialization t and te are set in cx:□, then when it has been determined, it should be a finite value other than 0 or (1). Or, when Dn(i) is calculated, Gn(
i) - 〇, a flag Gn(1) is set to Gn(i) = 1 when it cannot be determined, and the initial value is set to G''(i
)=1 for i=1~I, and Dn
If we set G''(i) - 0 each time (i) is determined, it can be determined whether Dn(i) has been determined by looking at G''(i).

第1図は、以上の原理に基づく本発明の実施例徴抽出部
であって、入力音声信号を特徴ベクトルa、の系列Aに
変換する。102は単語標準・(り一ン記憶部であって
、認識給食たるN個の単語がそれぞれ標準パターンRn
 = b nl、・・・Br)、、・・・。
FIG. 1 shows a feature extractor according to an embodiment of the present invention based on the above principle, which converts an input audio signal into a series A of feature vectors a. Reference numeral 102 is a word standard memory unit, in which N words as recognition school meals are each stored in a standard pattern Rn.
= b nl,...Br),,...

bnIn(1≦n≦N)として特徴ベクトルの形で予め
登録されている。103はベクトル間距離計算部であっ
て、入力パターンの第1フレームにおけル特徴ベクトル
ai とn番目の単語標準ノζターンHnの特徴ベクト
ルb、  との距離dn(mr + )を求め、必要が
無くなるまで記憶する。本例においては部分累積距離を
計算しているフレームの1つ前のフレームおよび当該フ
レームのベクトル間距離を当該フレームの途中累積距離
を計算するまで記憶する。dn(m、))は、例えば〜
とbnjの市街距離として定義できる。即ち、ベクトル
の次元をLとし、輻=(aml、aXn2.・・・、a
mL)、bnj=(bo、1゜bnj2. ・・、 、
bnjL)とするどき” (mr + )=  Σ D
mk−bnjk’に=1 となる。また、本実施例では計算の方向が1軸方向であ
って、第n標準パターンHnの第jフレームのベクトル
b、に対し、1−(Tn/2)≦m≦iの範囲の入力パ
ターンに対しdn(m、j)を求める。
It is registered in advance in the form of a feature vector as bnIn (1≦n≦N). Reference numeral 103 denotes an inter-vector distance calculation unit, which calculates the distance dn (mr + ) between the feature vector ai of the first frame of the input pattern and the feature vector b of the n-th standard word ζ turn Hn, and calculates the distance dn (mr + ) between the Memorize until it disappears. In this example, the vector distance between the frame immediately before the frame for which the partial cumulative distance is being calculated and the frame is stored until the intermediate cumulative distance of the relevant frame is calculated. dn(m,)) is, for example, ~
It can be defined as the city distance of and bnj. That is, let the dimension of the vector be L, and the radius = (aml, aXn2..., a
mL), bnj=(bo, 1°bnj2. . . . , ,
(mr + )= Σ D
mk-bnjk'=1. In addition, in this embodiment, the direction of calculation is the uniaxial direction, and for the vector b of the j-th frame of the n-th standard pattern Hn, an input pattern in the range of 1-(Tn/2)≦m≦i is calculated. Find dn(m,j) for the above.

104は途中累積距離計算部であって、前記cl”(m
、j)と同様の範囲で途中累積距離D”(m、j)。
Reference numeral 104 is an intermediate cumulative distance calculation unit, and the cl”(m
, j), the intermediate cumulative distance D''(m, j).

途中バックポインタBn(m、j)を求める。113は
終端累積距離計算部であって、D(ホ)、B(ホ)、N
−を前記d0(m++)と同様の範囲で求める。第3図
aに示したマツチング径路の拘束条件が採用されると、
Dn(m、j)、B”(m、j)は途中累積距離計算部
104においてつぎのように求まる。
An intermediate back pointer Bn (m, j) is determined. Reference numeral 113 denotes a terminal cumulative distance calculation unit, which includes D (e), B (e), N
- is determined in the same range as d0(m++). When the matching path constraint conditions shown in Figure 3a are adopted,
Dn (m, j) and B'' (m, j) are determined by the intermediate cumulative distance calculation unit 104 as follows.

j=1のとき Dn(m、1)dn(m、j) B”(m、1)=m )≧3のとき ただし p(ホ)、B(ホ)、Nに)は終端累積距離計算部11
3において次のようにして求まる。
When j = 1, Dn (m, 1) dn (m, j) B'' (m, 1) = m ) ≧ 3, where p (e), B (e), N) is the terminal cumulative distance calculation Part 11
3, it can be found as follows.

即ち、 p=Bn(m 、 5 ) m’=p−r+++p+rのm′についてを計算し、 なる漸化式によって Bに)=m″ N輛−nl として求まる。但し、m”、n”は式(2)を満たすm
′。
That is, calculate p=Bn(m, 5) m'=p-r+++p+r for m', and use the recurrence formula to find B as)=m''N-nl.However, m'', n'' are m that satisfies formula (2)
'.

nである。It is n.

112は前記ベクトル間距離の計算と、累積距離の計算
の実行範囲を各nについて決定するものであって、D(
1−(Jn/2) )が求まっていないとき、前記mの
範囲でd”(m、j)、Dn(m、j)の計算をそれぞ
れベクトル間距離計算部103.途中累積距離計算部1
04.終端累積距離計算部113に指示する。
112 determines the execution range of the calculation of the distance between vectors and the calculation of the cumulative distance for each n, and D(
1-(Jn/2)) has not been determined, d'' (m, j) and Dn (m, j) are calculated within the range of m, respectively, by the inter-vector distance calculation unit 103.The interim cumulative distance calculation unit 1
04. An instruction is given to the terminal cumulative distance calculation unit 113.

以上のようにして求められた終端累積距離D−は終端累
積距離記憶部105に、バンクポインタB(ホ)はバッ
クポインタ記憶部106に、最後尾単語番号Nに)は最
後尾単語記憶部107に記憶される。
The end cumulative distance D- obtained as above is stored in the end cumulative distance storage section 105, the bank pointer B (e) is stored in the back pointer storage section 106, and the last word number N) is stored in the end word storage section 107. is memorized.

なお、Dn(m+i)+Bn(m、j)(ただし、j=
12 + ”’ + 1 ” ; n=1.2 + ・
・・+ N )は必要が無くなるまで、部分累積距離計
算部104に一時的に記憶′される。本実施例において
は途中累積距離を計算しているフレームの1つ前および
2つ前のフレームの途中累積距離を計算するまで記憶す
る。
In addition, Dn (m + i) + Bn (m, j) (however, j =
12 + ”' + 1 ”; n=1.2 + ・
...+N) is temporarily stored in the partial cumulative distance calculation unit 104 until it is no longer needed. In this embodiment, the intermediate cumulative distances of the frames immediately before and two frames before the frame for which the intermediate cumulative distances are being calculated are stored until the intermediate cumulative distances are calculated.

また、終端累積距離記憶部105に記憶される終端累積
距離りに)は式(1)の初期値で必要なものであり、D
に)についてはDn(m+1.1 )を求めるまで記憶
しておけばよい。
Furthermore, the terminal cumulative distance stored in the terminal cumulative distance storage unit 105) is a necessary initial value of equation (1), and D
) can be memorized until Dn(m+1.1) is determined.

108は音声区間検出部であって、入力信号の大きさ等
から音声区間を判定するものである。音声区間検出部1
08が、音声入力が開始されたことを検出するとフレー
ム数計数部109はフレーム毎に計数を始める。前記の
処理は第iフレームについての処理であったが、このフ
レーム数計数部109の計数値が即ちとのiを設定して
いる。
Reference numeral 108 denotes a voice section detecting section, which determines a voice section from the magnitude of the input signal and the like. Voice section detection unit 1
08 detects that audio input has started, the frame number counting section 109 starts counting each frame. The above processing was for the i-th frame, and the count value of the frame number counting unit 109 is set to i.

従って、前記と同様の処理が、フレームが1進む毎に行
なわれることになる。フレーム数計数部109は音声区
間が検出されると計数を始め、音声区間が終了するとリ
セットされる。最後尾単語記憶部107.パックポイン
タ記憶部106には、従って、N(i) 、 B(i)
がi=1.2.・・・、■について3己憶されることに
なる。
Therefore, the same processing as described above is performed every time the frame advances by one. The frame number counting unit 109 starts counting when a voice section is detected, and is reset when the voice section ends. Last word storage unit 107. Therefore, in the pack pointer storage unit 106, N(i), B(i)
is i=1.2. ..., 3 will be remembered about ■.

セグメンテーンヨン部110はパックポインタ記憶部1
06に対し、所定のパックポインタを読出すべき命令を
発するものである。即ち、セグメンテー/ヨン部110
がiなる値をパックポインタ記憶部106に発すると、
パックポインタ記憶部106からはパックポインタB(
1)が読出される。
The segmentation section 110 is a pack pointer storage section 1.
06 to issue an instruction to read a predetermined pack pointer. That is, the segment/yeon section 110
issues a value i to the pack pointer storage unit 106,
The pack pointer B (
1) is read out.

セグメンテー7.Jン部110はパックポインタ記憶部
106からB (i)なる値を受は取ると、その同じ値
をバンクポインタ記憶部106に発する。従っ−C1音
声区間検出部108が音声入力の終了を検知すると、フ
レーム数計数部109の最終値Iがセグメンテーンヨン
部110に供給され、セグメンテーンヨン部110は先
ず工なる値をバンクポインタ記憶部10らに発する。以
後、前記説明の動作に従って、パックポインタ記憶部1
06から、B(I)、B (B(I)、 B (B (
B(I)))) 、−=、o  なる出力が頃次得られ
ることになる。これらの値は最後から2番目の単語の終
わりのフレーム、同3番目の単語の終わりのフレーム、
同4番目の単語の終わりのフレーム、・・・・・という
ものであり、N(i)はlフレームで終わる単語であっ
たから、この値をそのまま最後尾単語記憶部107に与
えると、最後の単語から逆の順序で認識結果が得られる
Segmentee 7. Upon receiving the value B (i) from the pack pointer storage section 106 , the transfer section 110 issues the same value to the bank pointer storage section 106 . Therefore, when the C1 voice section detection section 108 detects the end of the voice input, the final value I of the frame number counting section 109 is supplied to the segmentation section 110, and the segmentation section 110 first stores the value in the bank pointer. Issued to Section 10 et al. Thereafter, according to the operation described above, the pack pointer storage unit 1
From 06, B (I), B (B (I), B (B (
An output of B(I))) , -=, o will be obtained from time to time. These values are the frame at the end of the second-to-last word, the frame at the end of the third-to-last word,
This is the frame at the end of the fourth word, and since N(i) is a word that ends in the l frame, if this value is given as is to the last word storage unit 107, the last Recognition results are obtained in reverse order starting from the word.

なお、認識結果が本来の順序で得られるようにするため
には、この順序の変換をツクツクポインタ記憶部106
の出力に対して行なうか最後尾単語記憶部107の出力
に対して行なえばよい。
Note that in order to obtain recognition results in the original order, this order conversion is performed in the pointer storage unit 106.
The process may be performed on the output of the last word storage section 107 or on the output of the last word storage section 107.

以上の実施例においては、説明の便宜のために、点(m
、j)におけるベクトル間距離、途中累積距離、途中パ
ックポインタ等はそれぞれdn(”+ 1 ) +シ(
mIIL”(”+])等と表記したが、これらの記憶領
域はi、i、nの全範囲に渡って準備する必要は無く、
第1段の格子点におけるDn(” + l ) +” 
(mI ] )の計算には、前記漸化式からも明らかな
ように、第3図の径路に対しては第i−1段。
In the above embodiments, for convenience of explanation, the point (m
, j), the inter-vector distance, intermediate cumulative distance, intermediate pack pointer, etc. are dn("+ 1) + s(
mIIL"("+]) etc., but these storage areas do not need to be prepared over the entire range of i, i, n.
Dn("+l)+" at the lattice point of the first stage
(mI ] ) is calculated using the i-1th stage for the route shown in FIG. 3, as is clear from the recurrence formula above.

についてはdn(m+]  ’)(但し、In ” l
 −102〜l)についてのみ記憶していればよい。ま
た、n毎にj=1〜Jnについてこれらの値を計算する
ことにすれば、”(m++)、Bn(l++)について
ばnに関して一旦一つのブロックについて計算してしま
うことになるので、何時迄も記憶しておく必要はない。
For dn(m+] ') (However, In "l
-102 to l) only need to be stored. Also, if we calculate these values for j = 1 to Jn for each n, then for "(m++)" and "Bn(l++)", we will have to calculate for one block regarding n, so when There is no need to remember it.

この考え方に基づいて、さらに詳細な説明を第6図に従
って説明する。ソフトウェアにより実現する場合もこれ
に従えばよいのは勿論である。同図において NDDO なる記法はXが満足される間Yを実行することをNDD
O なる記法はXなる条件が満足されるまでYを実行するこ
とを LSE ENDIFなる記法はXなる条件が満足されればYを、
そうでなければ、Zを実行することをそれぞれ意味する
ものとする。
Based on this idea, a more detailed explanation will be given with reference to FIG. Of course, this can also be followed when implementing it using software. In the same figure, the notation NDDO means executing Y while X is satisfied.
The notation O means to execute Y until the condition X is satisfied, and the notation ENDIF means to execute Y until the condition X is satisfied.
Otherwise, each means to execute Z.

また、途中累積距離、途中パックポインタ、ベクトル間
距離等に関する記法を次のように変更する。即ち、第3
図に示した径路を用いるときは、第1段の途中累積距離
と途中パックポインタの計算は第i−1段と第1−2段
の途中累積距離と途中パックポインタと、第j−1段の
ベクトル間距離が記憶されておればよく、前記ブロック
の最初の入力パターンのフレームにおける途中累積距離
と途中パンクポインタの計算は1フレーム前と2フレー
ム前の途中累積距離と途中パックポインタ、1フレーム
前のベクトル間距離が記憶されておればよい。結局、必
要なメモリは” (il ] ) 。
In addition, the notation regarding intermediate cumulative distance, intermediate pack pointer, distance between vectors, etc. will be changed as follows. That is, the third
When using the route shown in the figure, the calculation of the intermediate cumulative distance and intermediate pack pointer of the 1st stage is based on the intermediate cumulative distance and intermediate pack pointer of the i-1st stage and 1-2nd stage, and the intermediate pack pointer of the i-1st stage and the j-1st stage. It is sufficient to store the inter-vector distance of the first input pattern of the block, and the intermediate cumulative distance and intermediate puncture pointer in the frame of the first input pattern of the block can be calculated using the intermediate cumulative distance of one frame and two frames before, the intermediate pack pointer, and one frame. It is sufficient that the previous inter-vector distance is stored. In the end, the required memory is "(il)".

Nn(i、+)については1=−1〜工。+1 の範囲
で3段分、dn(i、i)についてはi=0〜1o+1
の範囲で2段分(但し、−1は直前のブロックの最終フ
レームの1つ前のフレーム、0は直前のブロックの最終
フレームを意味する。)、各ブロックの最終フレームの
1つ前のフレームと最終フレームニオけるDn(’I]
LE3n(lIIL各)07りの最終フレームにおける
dn(i、i)がそれぞれ記憶されておれば漸化式の計
算は出来るものであり、各単語n毎に1ブロック分の計
算を行なうことにすれば、1=−1〜J0+1の3段分
の”(’l])。
For Nn(i,+), 1=-1~k. 3 steps in the range of +1, for dn(i, i) i=0 to 1o+1
(However, -1 means one frame before the last frame of the immediately preceding block, and 0 means the last frame of the immediately preceding block.), one frame before the last frame of each block. and the final frame is Dn('I)
If dn(i, i) in the final frame of LE3n(lIIL each)07 is memorized, it is possible to calculate the recurrence formula, and we will perform calculations for one block for each word n. For example, "('l]) for 3 stages of 1=-1 to J0+1.

Bn(’l])は1=−1〜J−+1とすることによっ
てすべてのnについて共通に用いることが出来るから、
これらをそれぞれD(io、k)、B(io、k)(但
し、1o=−1〜Ifn+1 、にmo 〜2 )、i
=0〜工。+1の2段分(7)dn(i、+)は1=o
−IIn+1 とすることによってすべてのnについて
共通に用いることが出来るから、これをd (io 、
 k ) (但し、10=0〜7  +1.に=o〜2
)とし、次のブロックの初期値を記憶しておくだめのメ
モリとして、各ブロックの最終フレームの1つ前のフレ
ームと最終フレームニオけるDn(1+l)+Bn(’
+I)、各プロyりの最終フレームにおけるd”(’+
+)をそれぞれDn(’ l ])lBn(’ l I
Ldn(])(但し、i=o 〜1゜j=1〜■0 で
あって、i=oは最終フレーム、i = 1 ハ最iフ
レームの1つ前のフレーム)トスることが出来、メモリ
の大幅な節約が図れる。
Since Bn('l]) can be commonly used for all n by setting 1=-1 to J-+1,
These are D(io, k), B(io, k) (however, 1o=-1~Ifn+1, mo~2), i
= 0 ~ engineering. 2 steps of +1 (7) dn(i, +) is 1=o
-IIn+1, it can be commonly used for all n, so it can be used as d(io,
k) (However, 10=0~7 +1.=o~2
), and the memory for storing the initial value of the next block is Dn(1+l)+Bn('
+I), d''('+
+) respectively Dn(' l ]) lBn(' l I
Ldn(]) (where i=o ~1゜j=1~■0, where i=o is the last frame, and i=1 is the frame immediately before the i-most frame). Significant memory savings can be achieved.

第6図において、ステップ201.202は初期化を行
なう部分である。ステップ203は入力の第iフレーム
における処理を行なう部分である。
In FIG. 6, steps 201 and 202 are initialization steps. Step 203 is a part that performs processing on the i-th frame of input.

ステップ204は前記ブロック内の各格子点に対し、第
1〜N標準パターンと入力パターンとのマツチングを行
なう処理である。ステップ206は第n標準パターンに
対する前記ブロックの幅を求めている。ステップ206
は入力の第iフレームにおいて、第1  Toフレーム
〜第iフレームの終端累積距離り一が求まっているか否
かを前記フラグGn(ホ)の状態から判断し、求まって
いないときはそのブロックの計算を行ない、求まってい
るときはn=n+1の処理ヘスキップする処理である。
Step 204 is a process of matching the first to Nth standard patterns and the input pattern for each grid point in the block. Step 206 determines the width of the block for the nth standard pattern. Step 206
determines from the state of the flag Gn (e) whether or not the end cumulative distance from the first To frame to the i-th frame has been determined in the input i-th frame, and if it has not been determined, calculates that block. This is a process in which the process skips to the process for n=n+1 when it has been found.

ステップ2o了は該当する前記ブロックが未だ計算され
ていないことが判明したとき、以下のステップでそのブ
ロックの計算を行なうのであるから、前取てそこに含ま
れるフレームについてフラグG0(ホ)を0とおいて計
算済みの状態にしている。ステップ208では後の計算
の便宜のために計算すべきブロックの開始フレーム−1
をmoとして算出しておく。ステップ209はj=1.
2百(io、J)(但し、10=1〜工。+1)を計算
している。ステップ211は入力パターンの第1フレー
ムからのフレームの通し番号を求めている。ステップ2
12は入力パターンの第m番のベクトル輻と標準パター
ンの第1番のベクトルbn1とのベクトル間距離を求め
ている。ステップ213はこの値を基にj=1について
D(to、i)+B(’o。
In step 2o, when it is found that the corresponding block has not been calculated yet, the block is calculated in the following step, so the flag G0 (e) is set to 0 for the frame included there. It is now in a calculated state. In step 208, for convenience of later calculations, the starting frame -1 of the block to be calculated is
is calculated as mo. In step 209, j=1.
200 (io, J) (however, 10=1~Eng.+1) is calculated. Step 211 determines the frame serial numbers from the first frame of the input pattern. Step 2
12 calculates the inter-vector distance between the m-th vector convergence of the input pattern and the first vector bn1 of the standard pattern. Based on this value, step 213 calculates D(to, i)+B('o) for j=1.

J)(但し、10=1〜■。+1)を計算している。J) (however, 10=1~■.+1) is calculated.

ステップ214,215はj=2,1o=1〜T o 
+1におけるベクトル間距離d (io 、 2 )を
求めている。
Steps 214 and 215 are j=2, 1o=1~T o
The inter-vector distance d (io, 2) at +1 is calculated.

ステップ216はこの値を基にi=2におけるD(io
、i)、百(io、i)(但し、10=1〜工。+1)
を計算している。ステップ217は次のブロックの計算
に使うためにd’(2)=d(J。+1.2)なる置き
換えを行なっている。
Based on this value, step 216 performs D(io
, i), hundred (io, i) (however, 10 = 1 ~ k. +1)
is being calculated. Step 217 performs the replacement d'(2)=d(J.+1.2) for use in the calculation of the next block.

ステップ218はj=3〜J0におけるD(10゜k)
 、B (io 、 k ) (但し、10=1〜工。
Step 218 is D (10°k) at j=3~J0
, B (io, k) (however, 10=1~k).

+1)を計算している。ステップ219はD(五〇、k
)、B(io。
+1) is calculated. Step 219 is D(50, k
), B(io.

k ) + d (t o 、 k )  なるメモl
J’を巡回的に用いるためにkの値tiの値に応じて設
定している。ステノブ220は直前のブロックの値から
初期値を設定している。ステップ221は第3段におけ
るベクトル間距離を計算している。ステップ222はこ
の値を基に第】段におけるD(10,J)、B(10゜
))(但し、1゜−1〜T o + 1 )を旧線して
いる。ステップ223は次のブロックの計算に使うだめ
の置き換えを行なっている。
k ) + d (t o , k )
In order to use J' cyclically, it is set according to the value of k and the value of ti. The steno knob 220 has its initial value set from the value of the immediately previous block. Step 221 calculates the distance between vectors in the third stage. In step 222, based on this value, D(10, J), B(10°)) (where 1°-1 to T o +1) in the ]th stage are rewritten. Step 223 replaces the blocks to be used in the calculation of the next block.

ステップ224は以上のようにして求めたから、前記説
明に従って、D(ホ)、B(ホ)、N(ホ)を計算して
おり、nが変わる毎に以前に計算した値と比較し、段縫
的に最小値が求められる。
Since step 224 was obtained as described above, D (e), B (e), and N (e) are calculated according to the above explanation, and each time n changes, it is compared with the previously calculated value and the step The minimum value is found systematically.

ステップ203の処理が終了すると判定処理に入る。即
ち、ステップ230においてi = Iとおいて前記説
明に従ってステップ231で求めるべき単語列が逆の順
序で求められる。
When the process of step 203 is completed, determination process begins. That is, in step 230, i = I, and the word string to be found in step 231 is found in the reverse order according to the above explanation.

本実施例においては、第3図に示すような径路の拘束条
件を用いたため径路の最大の傾斜は2と全るので、ブロ
ックの幅は(Jn/2)+1となったし゛が、径路の拘
束条件としては、これ以外にも種々溝えられ、例えば、
第7図のような場合は、最大の傾斜が3となるからこの
場合のブロックの幅は2−4l−(In−1)/3]と
なる。一般に径路の最大の傾斜がkのときは、ブロック
の幅Wば2−(1−、−(In−1)/に’l以下であ
れば良いことになる(k= 2 (’)場合1d、 C
Jn/2) +1 ト2−(1−(J”−1)/2)と
は■1 が整数の場合は等しい)。
In this example, the maximum inclination of the path is 2 because the constraint conditions for the path as shown in Fig. 3 are used, so the width of the block is (Jn/2) + 1. There are various other constraints as well, such as:
In the case shown in FIG. 7, the maximum slope is 3, so the width of the block in this case is 2-4l-(In-1)/3]. Generally, when the maximum slope of the path is k, the block width W2-(1-,-(In-1)/) should be less than 'l' (if k = 2 (') then 1d , C
Jn/2) +1 t2-(1-(J"-1)/2) is the same as ■1 if it is an integer).

発明の効果 以上のように、本発明によれば、ACDP法のように、
DPマツチングを高速に連続して行なう方法においては
、高速、大容量のメモリが必要であったのが、高速性を
要求されるメモリ数を大幅に減らす事が出来、安価な装
置の実現が可能となったものである。
As described above, according to the present invention, like the ACDP method,
The method of performing DP matching continuously at high speed required high-speed, large-capacity memory, but now the number of memories that require high speed can be significantly reduced, making it possible to realize inexpensive equipment. This is what became.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の原理を示すブロック図、第2図はDP
マツチングにより連続パターンを認識する原理を説明す
るだめの説明図、第3図は本発明が適用さるべきACD
P法を説明するだめの説明図、第4図は本発明の原理の
考え方を説明するための説明図、第5図は本発明の詳細
な説明するだめの詳細説明図、第6図は本発明の処理手
順を詳細(で説明するための処理手順図、第7図は径路
の拘束条件の他の例を説明するための説明図である。 101・・・・特徴抽出部、102・・・・・単語標準
パターン記憶部、103・・・・・・ベクトル間距離計
算部、104・・・・・途中累積距離計算部、105・
・・・・・終端素晴距離記憶部、106・・・・・バッ
クポインタ記憶部、107・・・・・・最後尾単語記憶
部、108・・印・音声区間検出部、109 ・・フレ
ーム数計数部、110・・・・・セダメンテーショ7部
、112・・・・・マノナング計算実行範囲決定部。 代理人の氏名 弁理士 中 尾 敏 男 はが1名第4
図 第5図 第6図 (f/)す 2DI  、L−[Jll、ヮ/2] アイゴ7 i Σ 第6図 (+04) ア“ イ″ ゲ 230   i=I 第7図
Figure 1 is a block diagram showing the principle of the present invention, Figure 2 is a DP
An explanatory diagram for explaining the principle of recognizing continuous patterns by matching, Figure 3 is an ACD to which the present invention is applied.
Fig. 4 is an explanatory drawing to explain the principle of the present invention, Fig. 5 is a detailed explanatory drawing to explain the present invention in detail, Fig. 6 is an explanatory drawing to explain the principle of the present invention. A processing procedure diagram for explaining the processing procedure of the invention in detail, FIG. 7 is an explanatory diagram for explaining another example of the constraint condition of the route. ...Word standard pattern storage section, 103... Inter-vector distance calculation section, 104... Intermediate cumulative distance calculation section, 105.
... End fine distance storage section, 106 ... Back pointer storage section, 107 ... Last word storage section, 108 ... Mark/voice section detection section, 109 ... Frame Number counting section, 110... Sedamentation seventh section, 112... Manonang calculation execution range determining section. Name of agent: Patent attorney Toshio Nakao Haga 1 person No. 4
Figure 5 Figure 6 (f/)su2DI, L-[Jll, ヮ/2] Aygo7 i Σ Figure 6 (+04) A “I” Ge230 i=I Figure 7

Claims (1)

【特許請求の範囲】[Claims] 入力信号を特徴ベクトルa_1、a_2、・・・、a_
i、・・・、a_Iの系列に変換する特徴抽出手段と、
特徴ベクトルの系列b^n_1、b^n_2、・・・、
b^n_j、・・・、b^n_(J^n)から成る標準
パターンR^n(ただし、n=1〜N)を記憶する標準
パターン記憶手段と、入力のフレームiを横軸に、標準
パターンのフレームjを縦軸とする格子グラフにおいて
、標準パターンR^nとマッチングするときは、入力パ
ターンのフレームに対して互いにWフレーム隔たった直
線で挾まれる領域の格子点に対して、標準パターンの各
フレームjの特徴ベクトルb^n_jのそれぞれに対し
てi軸方向に前記Wの幅でDPマッチングをj=1〜J
^nの順に行ない、1つの領域の計算が完了すると次の
相隣る前記と同様な領域の計算を同様に行なうというよ
うに、入力パターンの全範囲に渡って前記マッチング計
算を行なうDPマッチング手段とを備えたことを特徴と
するパターン比較装置。
The input signal is converted into feature vectors a_1, a_2, ..., a_
a feature extraction means for converting into a series of i, ..., a_I;
Series of feature vectors b^n_1, b^n_2,...
A standard pattern storage means for storing a standard pattern R^n (where n=1 to N) consisting of b^n_j, ..., b^n_(J^n), and input frame i as the horizontal axis, In a lattice graph with the frame j of the standard pattern as the vertical axis, when matching with the standard pattern R^n, for the lattice points in the area sandwiched by straight lines separated by W frames from each other with respect to the frame of the input pattern, DP matching is performed with the width of W in the i-axis direction for each feature vector b^n_j of each frame j of the standard pattern j = 1 to J
DP matching means that performs the matching calculation over the entire range of the input pattern, such that the matching calculation is performed in the order of ^n, and when the calculation of one area is completed, the calculation of the next adjacent area similar to the above is performed in the same manner. A pattern comparison device comprising:
JP60205756A 1985-09-18 1985-09-18 Pattern comparison device Expired - Fee Related JPH0646358B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60205756A JPH0646358B2 (en) 1985-09-18 1985-09-18 Pattern comparison device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60205756A JPH0646358B2 (en) 1985-09-18 1985-09-18 Pattern comparison device

Publications (2)

Publication Number Publication Date
JPS6265090A true JPS6265090A (en) 1987-03-24
JPH0646358B2 JPH0646358B2 (en) 1994-06-15

Family

ID=16512139

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60205756A Expired - Fee Related JPH0646358B2 (en) 1985-09-18 1985-09-18 Pattern comparison device

Country Status (1)

Country Link
JP (1) JPH0646358B2 (en)

Also Published As

Publication number Publication date
JPH0646358B2 (en) 1994-06-15

Similar Documents

Publication Publication Date Title
US5899971A (en) Computer unit for speech recognition and method for computer-supported imaging of a digitalized voice signal onto phonemes
US4555796A (en) DP Matching system for recognizing a string of words connected according to a regular grammar
JPH029359B2 (en)
JPH0247760B2 (en)
JPS6265090A (en) Pattern comparator
JP2964881B2 (en) Voice recognition device
JPS5972498A (en) Pattern comparator
JPS6073698A (en) Pattern comparator
JPS63188199A (en) Pattern matching system
JP3348735B2 (en) Pattern matching method
JPH0361957B2 (en)
JPS59195699A (en) Word voice recognition equipment
JPS59172698A (en) Voice recognition equipment
JPS60203993A (en) Voice recognition
JP3009962B2 (en) Voice recognition device
JPS60203992A (en) Voice recognition
JPS60203994A (en) Voice recognition
JPS59173883A (en) Pattern comparator
JPS62111295A (en) Voice recognition equipment
JPS6283798A (en) Continuous voice recognition equipment
JPH03253900A (en) Voice recognition device
JPS61102697A (en) Pattern comparator
JPS62299999A (en) Pattern comparator
JPS59200A (en) Pattern matching apparatus
JPH0566600B2 (en)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees