JPS63226693A - Pattern matching system for voice recognition - Google Patents

Pattern matching system for voice recognition

Info

Publication number
JPS63226693A
JPS63226693A JP62061732A JP6173287A JPS63226693A JP S63226693 A JPS63226693 A JP S63226693A JP 62061732 A JP62061732 A JP 62061732A JP 6173287 A JP6173287 A JP 6173287A JP S63226693 A JPS63226693 A JP S63226693A
Authority
JP
Japan
Prior art keywords
time
word
pattern
equation
pattern matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62061732A
Other languages
Japanese (ja)
Other versions
JPH0465393B2 (en
Inventor
迫江 博昭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62061732A priority Critical patent/JPS63226693A/en
Publication of JPS63226693A publication Critical patent/JPS63226693A/en
Publication of JPH0465393B2 publication Critical patent/JPH0465393B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は人間が発声した音声を自動認識する音声vt@
におけるパターンマッチング方式に関するものである。
[Detailed Description of the Invention] (Industrial Application Field) The present invention is a voice vt@ that automatically recognizes human voice.
This paper relates to a pattern matching method.

(従来の技術) 音声認識のパターンマツチング方式に関しては徨々の技
術が開発されているが、それらの中で最も確立され重用
されているものの一つとして「日本音響学会誌第42巻
9号(昭和61年9月発行)の第725頁」に記載され
るがとときDPマツチング法がある。これは音声の時間
軸歪を整合する手法として極めて有効とされている。ま
たDPマツチング法t一連続単語認識に拡張したものと
して、上記文献の@727頁ろるいは特願昭56−19
9098 号明細書に記載されるか如きクロックワイズ
DP法が知られている。この手法は構文制御を有する連
続単語認識法として説明されているが、当然離散単語認
識にも適用可能でるる。ここでは説明を簡単にするため
、離散単語認識の形成で、クロックワイズDP法の要部
を説明する。
(Prior art) Many technologies have been developed regarding pattern matching methods for speech recognition, but one of the most established and heavily used among them is the one described in "Journal of the Acoustical Society of Japan, Vol. 42, No. 9. (Published September 1986), page 725, there is a DP matching method. This is considered to be extremely effective as a method for matching time axis distortion of audio. In addition, as an extension of the DP matching method to one continuous word recognition, see @p. 727 of the above document and Japanese Patent Application No. 56-19.
Clockwise DP methods are known, such as those described in No. 9098. Although this method has been described as a continuous word recognition method with syntactic control, it can of course also be applied to discrete word recognition. Here, to simplify the explanation, the main part of the clockwise DP method will be explained using the formation of discrete word recognition.

単語名を参考nで指定することとして (nln==1.2.−−− N) なる単語セットを認識対象とする。各単語に標準パター
ン Bn=l)? 、 kg * ”” ”j ・’ 11
W nと考える。ここにjは時刻を示し、1.は標準パ
ターンBnの時刻jの特徴を意味する。入力音声パター
ン’frlilFi株に A=&I JL!  −!i ・” 11と示す。
Assuming that a word name is specified by reference n, a word set (nln==1.2.---N) is set as a recognition target. Standard pattern Bn=l) for each word? , kg * ”” ”j・' 11
Consider W n. Here, j indicates time, and 1. means the characteristic of the standard pattern Bn at time j. Input voice pattern 'frlilFi stock A=&I JL! -! i・”11.

音声認識は、入カバターンAと標準パターンBnとのパ
ターン間距離L)(A、B  )  i求め、それが最
小となるnt一定めて認識結果とすることによって行な
われる。DPマツチングではこの距離の計算を次のよう
な漸化式計算によって行なう。
Speech recognition is performed by determining the inter-pattern distance L) (A, B) i between the input cover pattern A and the standard pattern Bn, and fixing the minimum nt as the recognition result. In DP matching, this distance is calculated using the following recurrence formula.

O初期条件 gn(1,1)=dn(1,1)  ・−・ (1)O
漸化式 %式% J ) =II a 1−b 3 IIである。これに
対して(2)式で計算されるgn(i、j)を最適累積
距離と呼ぶ。
O initial condition gn (1, 1) = dn (1, 1) ・−・ (1) O
The recurrence formula %J) = II a 1-b 3 II. On the other hand, gn(i, j) calculated by equation (2) is called the optimal cumulative distance.

このDPマツチング処理は当初、単語ごとに実行されて
いたが、クロッククイズDP法では各単語に対して並列
的に実行する形式に改良された。
Initially, this DP matching process was executed for each word, but in the clock quiz DP method, it has been improved to a format in which it is executed for each word in parallel.

第5図(a)、Φ)は従来方式を説明する図である。FIG. 5(a), Φ) is a diagram explaining the conventional method.

すなわち、第5図(a)のような、i、j、nが関係す
る空間において、入カバターンの各時刻iにおいて、各
標準パターンBnの指定nとそれらの中の時刻jのすべ
ての組み合わせで指定されるn。
That is, in the space where i, j, and n are related as shown in FIG. n specified.

jに対してgn(iej)なる最適累積距離を計算し、
しかる後に時刻iを進めて処理を続行するという方式と
なっている。
Calculate the optimal cumulative distance gn(iej) for j,
After that, time i is advanced and processing is continued.

実際の計算は、gn(j) = gn(i 、 j )
 、■n(j)=gn(i−11J )なる表示を考え
、これらを保持するため、第5図(a)に参照数字lで
示す2列のメモリを用意する。これらのメモリの間で、
tIXs図の)なる演3!を行なって、(2)式の漸化
式計Xt夾行する。
The actual calculation is gn(j) = gn(i, j)
, ■n(j)=gn(i-11J), and to hold these, two columns of memories indicated by reference numeral l in FIG. 5(a) are prepared. Between these memories,
tIXs figure) Naru performance 3! Then, the recursion equation Xt of equation (2) is included.

ここに、 dn(j)=  dn(i、j)−=   (5)であ
る。すべてのn + Jの組み合せに対して、(4)式
の計算を実行し終了と時刻iを1クロック進め、企n(
j)をg ”(j)として以上の処理を繰シ返す。かく
してi・工までの処理が終了した時点で、パターン間距
離は D(A tBn)=gn(J”) として、各nに対して並列的に求まる。クロック(発明
が解決しようとする問題点) このような方法は入カバターンの時刻iに同期して処理
を進めることができるので、発声と並行して処理を進め
ることができ、実時間性が良いとされている。しかし、
この方法を大語いの音声認識に適用しようとすると計算
量が大となるという問題かある。すなわち、(4)式の
漸化式計算は、jとnのすべての組み合せについて実行
しなくてはならない。標準パターンきがJn=30で、
1000語を認識しようとすると、3X10’点で(4
)式を計算することになる。1点あたり10μsで実行
したとしても3ootns金要する。通常のf声認識で
は入カバターンの特Q ” i をサンプリングする周
期は2Qms以下であるので、このような犬語いでtユ
とても実時間実行は不可能である。
Here, dn(j)=dn(i,j)−=(5). For all combinations of n + J, execute the calculation of equation (4), advance the end time and time i by one clock, and calculate the plan n(
The above process is repeated by setting j) to g ''(j).In this way, when the process up to i・t is completed, the distance between patterns is set as D(A tBn)=gn(J''), and for each n can be found in parallel. Clock (Problem to be Solved by the Invention) This method allows processing to proceed in synchronization with time i of the input pattern, so processing can proceed in parallel with utterance, and has good real-time performance. It is said that but,
When this method is applied to speech recognition of large words, there is a problem in that the amount of calculation becomes large. That is, the recurrence formula calculation of equation (4) must be performed for all combinations of j and n. The standard pattern is Jn=30,
If you try to recognize 1000 words, 3X10' points (4
) will calculate the formula. Even if it is executed at 10 μs per point, it takes 3 ootns. In normal f-voice recognition, the period for sampling the input pattern Q''i is less than 2Qms, so real-time execution is impossible with such dog language.

本発明はクロックワイズ温の1)Pマツチングが有する
、計算量が多いという上記欠点會改良して、高速であり
ながら低価格な音声認識装置のパターンマツチング方式
を提供することを目的としたものである。
The object of the present invention is to improve the above-mentioned disadvantages of clockwise temperature 1) P matching, such as the large amount of calculation, and to provide a pattern matching method for a speech recognition device that is high speed and inexpensive. It is.

(問題点を鶏決する手段) 本発明による音声認識のパターンマツチング方式は、谷
単語nの標準パターンを特徴の時系列B n = 6 
n・・・lIn・・・111nとして記憶する手段と、
入jJ 力音声パターンの特徴為iを一時保持する手段と、それ
ぞれの単語nに対応して前に2特徴a1と11rAとの
距離dn(i、j)(7)最JX状(agn(i、j)
tkh的計画法の漸化式によって算出する手段を有する
方式において、時刻(i、1)までのM!累積値g(i
−1,j)k各単語n及び時刻jに対応して△ g n(j)の形で記憶する手段と、時刻lまでの最適
累積値gn(i、j)に対応するgn(j)なるjlを
記憶する手段とを備え、時刻iにて、 ■n(j)の値
が所定の枝刈シ条件を満足する(n、j)のセットに対
シテノミ、前ff1gn(j)Km離d”(j)=dn
(i、j)全加算して新たな数値gとする第1の処理を
行ない、とのjの近傍のjに対応するg ”(j)との
大小比較を行ない、g < g n(j>のときgを新
たなgへj)として転写する第2の処理を行ない、時刻
iが1クロック進行するごとにg n(j)を新喪な■
n(j)  として前記第1、第2の処理を進行する方
式である。
(Means for resolving problems) The pattern matching method for speech recognition according to the present invention uses a time series B n = 6 characterized by a standard pattern of valley words n.
means for storing it as n...lIn...111n;
means for temporarily holding the feature i of the input speech pattern, and the distance dn (i, j) (7) maximum JX shape (agn (i ,j)
In a method having means for calculating by a recurrence formula of tkh-like programming, M! up to time (i, 1)! Cumulative value g(i
−1, j) k means for storing in the form △ g n(j) corresponding to each word n and time j, and gn(j) corresponding to the optimal cumulative value gn(i, j) up to time l; At time i, the value of n(j) satisfies a predetermined pruning condition. d”(j)=dn
Perform the first process of fully adding (i, j) to obtain a new numerical value g, and compare the magnitude of with g '' (j) corresponding to j in the vicinity of j, and find that g < g n(j >, a second process is performed to transfer g to a new g as j), and each time i advances by one clock, g n(j) is transferred to the new g.
In this method, the first and second processes are performed as n(j).

(作用) 本発−の第1の特徴はg n(j)がある基準より小な
n、jのみを対象として(4)式(等制約に(27式)
の動的計画法漸化式を実行するという枝刈りの考え方を
導入した点である。DPマツチングの動的計画法漸化式
(2)あるいは(4)は竣小[を探索する形式のもので
あるので、■n(j)が大であるということは、そのj
が最適経路上に存在する可能性か低いことを意味する。
(Operation) The first feature of the present invention is that g n(j) is smaller than a certain criterion by using equation (4) (equation constraint (formula 27)).
The point is that the idea of pruning is introduced by executing the dynamic programming recurrence formula. Since the dynamic programming recurrence formula (2) or (4) for DP matching is of the form of searching for the complete small [, n(j) is large, which means that j
This means that there is a low possibility that the path exists on the optimal route.

そこで、このようなg n(j)は無視しようという考
え方を導入したのである。これにより、(4)式の計算
Fi第1図にハツチを付して示したg ”(j)の近辺
で行なえばよいことになり大幅な計算量低減が見込まれ
る。しかし、(4)式の漸化式をそのままの形で実行す
るのは、せっかくの枝刈シの効果が薄い。なぜならば(
2)式の計算が省略できるのは、右辺の■n(j) 、
gn(j−1)、gn(j−2)が総て大きかった場合
である。このため、3個の値それぞれの大きさを判定し
なくてはならず、かつ3個とも大きいという条件の論理
積が満足される確率は小さくなる。
Therefore, we introduced the idea of ignoring such g n(j). As a result, the calculation of equation (4) can be performed in the vicinity of g '' (j) shown with a hatch in Fig. 1, and a significant reduction in the amount of calculation is expected. However, the calculation of equation (4) Executing the recurrence formula in its original form will have little effect on pruning.Because (
2) Calculation of formula can be omitted by n(j) on the right side,
This is the case where both gn(j-1) and gn(j-2) are large. Therefore, it is necessary to determine the magnitude of each of the three values, and the probability that the logical product of the condition that all three values are large is satisfied becomes small.

そこで、本発明では(4)式の計算全以下に述べるよう
に、前向きの条件付代入処理として実行することを第2
の特徴とする。第2図はその処理を説明するための図で
ある。ここでは■n(j)はと定義され% d(’Ij
)か加算されていない、1時刻的(i−1)までの累積
最適距離に対応している。以下の処理に先立ってgn(
j)には充分大i数値■か初期セットされているとする
。特定の” + Jに対する処理は次のようでるる。
Therefore, in the present invention, the calculation of equation (4) is performed as a forward conditional assignment process as described below.
The characteristics of FIG. 2 is a diagram for explaining the processing. Here ■n(j) is defined as % d('Ij
) corresponds to the cumulative optimal distance up to one time point (i-1), which is not added. Prior to the following processing, gn(
It is assumed that j) is initially set to a sufficiently large i value ■. The processing for a specific "+J" is as follows.

・・・ (7) 仁の手続きが(j−2)からjまで繰り返されるとg 
n(j)に対して次の処理が行なわれたことになる。
... (7) When the procedure of jin is repeated from (j-2) to j, g
The following processing has been performed on n(j).

・・・・・ (8) △ gn(j−2)+ dn(j−2) =gn(i、j−
2)△ gn(j−1)+an(j−1) =gn(i、j−1
)△ gnCj)+d”(j) = gn(i 、 j )で
あることを考慮して(8)式を総合するとと、(6)式
のiが1クロック進んだものが計算されたことになる。
... (8) △ gn (j-2) + dn (j-2) = gn (i, j-
2) △ gn (j-1) + an (j-1) = gn (i, j-1
)△ gnCj) + d”(j) = gn(i, j), and if we combine equation (8), we get that i in equation (6) is calculated with one clock advance. Become.

このことを−まとめると、(方式の条なる漸化式計算が
達成できたことになるか、この△ g n(j)は(6)式の定義より、gn(i、j)と
gn(i 、 j ) = d”(j)十■n(j)な
る関係で結はれているので、■n(j)を求める(方式
の処理はgn(i、J)を求める(2ン式の計算と等価
なEとになる。
To summarize this, we can say that the recurrence formula calculation, which is a rule of the method, has been achieved. From the definition of equation (6), this △ g n (j) i, j) = d"(j) ten n(j), so find n(j) (The process of the method is to find gn(i, J) (2 E is equivalent to the calculation of .

このように、動的計画法の計’m′に前向きに実行する
と枝刈シに関して次のよりなル6能皐化が遠地される。
In this way, when the dynamic programming method is executed forward in the plan 'm', the next rule for pruning is determined.

枝刈シの判定は(方式(17の■n(j)のみのテスト
で実行されるので効率がよい。これによって枝刈りと判
定された場合には(2)、(3−1)。
The determination of pruning is efficient because it is executed by testing only n(j) in method (17). If pruning is determined by this, (2), (3-1).

(3−2)、(3−3)という漸化式計算に必要な処理
が総べて省略できる。
The processes (3-2) and (3-3) necessary for calculating the recurrence formula can all be omitted.

以上の第1と第2の特徴によっ−C本発明によるパター
ンマツチング方式は極めて効率良いものとなる。
Owing to the above first and second features, the pattern matching method according to the present invention becomes extremely efficient.

本発明は(7)式の手続きを各時刻iで各単語n中のj
=x 、 2 、・・・Jnまでそれぞれ実行し、時刻
iのサイクルを進めるという方式である。なふ・、(方
式′(1)の枝刈シの条件には抛々の変形が考えられる
。最も周率な1例はiの増加とともに最適累積距!■n
(j)が増加すること金場嵐し、θ(i)をiの1次関
数(単調増加)として(方式(1)を適用する方法であ
る。別には色g n(j>の最小値gmink定め、こ
れにαなる余裕を持たせ、θ(i)=gmin+αとし
て(7)式(1) を適用することも考えられる。さら
に別の例としては閾値を用いるのではなく、全gへj)
の中で小さいものから何位以下という条件で枝刈りを行
なってもよい。
The present invention performs the procedure of equation (7) at each time i for j in each word n.
The method is to execute each cycle up to =x, 2, . . . Jn, and advance the cycle at time i. (Method '(1)'s pruning conditions can be considered to have many variations. The most frequent example is the optimal cumulative distance as i increases!■n
(j) increases, and θ(i) is a linear function (monotonically increasing) of i (method (1) is applied. It is also possible to define gmin, add a margin α to this, and apply equation (7) and (1) as θ(i) = gmin + α.Another example is to apply the equation (7) to the total g, instead of using a threshold. j)
You may perform pruning under any number of conditions, starting from the smallest.

(実施例) 第3図は本発明を実施した単語音声認識装置のブロック
図である。マイクロホン10より入力された音声信号は
分析部20によって周波数分析されたのち標本化、ディ
ジタル化され特徴ベクトルAi  としてマイクロプロ
セッサ30に送られる。
(Embodiment) FIG. 3 is a block diagram of a word speech recognition device implementing the present invention. The audio signal inputted from the microphone 10 is frequency-analyzed by the analyzer 20, then sampled, digitized, and sent to the microprocessor 30 as a feature vector Ai.

このマイクロプロセッサにはメモリとして標準パターン
記憶部40と、Gメそり5oが接続されている。標準パ
ターン記憶部40には各単語nの標準パターンBnか特
徴ベクトルbnの時系列として記憶されている。Gメそ
り50は第1図、第2図に示したg n(j)  g 
”(j)のためのワークメモリである。これらの標準パ
ターン記憶部40.Gメモリ50はマイクロプロセッサ
の主記憶内にあって区別されるメモリエリアとし、て定
義されてもよい。
A standard pattern storage section 40 and a G mesori 5o are connected as memories to this microprocessor. The standard pattern storage unit 40 stores standard patterns Bn or feature vectors bn of each word n as a time series. The G mesori 50 is g n (j) g shown in Figs. 1 and 2.
``(j).These standard pattern storage units 40.G memory 50 may be defined as a distinct memory area within the main memory of the microprocessor.

認識処理はマイクロプロセッサ30のプログラムによっ
て実行される。入カバターンの先頭のベクトル&l が
入力されると次のような初期設置が各nに対して行なわ
れる。
The recognition process is executed by the program of the microprocessor 30. When the first vector &l of the input pattern is input, the following initial setting is performed for each n.

これは(1)式の初期条件に対応したものである。This corresponds to the initial condition of equation (1).

以下、入カバターンの特徴ベクトル1童が入力されるご
とに第4図の7CI−チャートに示すごとき処理がマイ
クロプロセッサ30によって実行される。図中の101
のブロックは(7)式の+27の枝刈シ判定に対応する
。同様にして102の2個のブロックは(1)の処理に
、103は(3−1)、(3−2)、(3−3)の処理
にそれぞれ対応する。
Thereafter, each time the feature vector of the input pattern is inputted, the microprocessor 30 executes the process shown in the 7CI-chart of FIG. 101 in the diagram
The block corresponds to +27 pruning decision in equation (7). Similarly, the two blocks 102 correspond to the process (1), and the blocks 103 correspond to the processes (3-1), (3-2), and (3-3), respectively.

104のブロックはgn(j)の値をすべて■n(j)
として切9換えることを意味する。この処理はgn(j
)を記憶するエリアと■n(j) を記憶するエリアと
の番地切シ換えで実現される。105のブロックは■n
(j)のエリアを充分大な数値■でリセットすることを
意味する。
Block 104 stores all the values of gn(j) as ■n(j)
9 means to switch. This process is gn(j
) and the area where n(j) is stored. Block 105 is ■n
This means resetting area (j) with a sufficiently large value ■.

以上の処理が終了すると、入カバターンの時刻が1クロ
ツク増加され、次の特徴ベクトルa、の入力を待って同
様の処理が行なわれる。音声パターンが終了して最後の
特徴ベクトル&□が入力されたとき、マイクロプロセッ
サ30の内部では次のような処理が行なわれる。この時
点でGメモリ50に記憶されている。gn(Jn)  
は(6)式よシであることから、 D(A、Bn)=g(I 、 J)=gn(Jn) 十
d(I 、J)・・・・・ (13) として、各単語nごとにパターン間距離D(A。
When the above processing is completed, the input pattern time is incremented by one clock, and the same processing is performed after waiting for the input of the next feature vector a. When the voice pattern ends and the last feature vector &□ is input, the following processing is performed inside the microprocessor 30. At this point, it is stored in the G memory 50. gn (Jn)
Since is the same as equation (6), D (A, Bn) = g (I , J) = gn (Jn) 10d (I , J) (13) For each word n The distance between patterns D(A.

B”)  ’lる。これらt)11次比較することによ
って、最小値を求め、これに対応するl1l=nヲ認識
結果とし出力する。
B") 'l. By performing these t) 11th-order comparisons, the minimum value is determined, and the corresponding l1l=n is output as the recognition result.

以上本発明を実施例に基づいて説明したがこれらの記載
は本発明の範囲を限定するものではない。
Although the present invention has been described above based on Examples, these descriptions do not limit the scope of the present invention.

特に以上の記載ではパターン間の類似性を距離によって
評価するとしたが、これと大小関係が逆な量によっても
よい。その場合は(7)式吟の大小関係の判定を逆に行
なりことになる。また、本実施例では特徴ai 、bj
をベクトルであるとしたが、ベクトル量子化を行なった
場合のコードブック中のベクトルを指定する番号のよう
なスカラ量であってもよい。また、説明を簡単にするた
め単語認識装置に適用した例を述べたが、クロックワイ
ズ92式の連続音声認識装置にも本パターンマツチング
方式は利用できることは自明である。
In particular, in the above description, the similarity between patterns is evaluated by distance, but it is also possible to evaluate the similarity by a quantity having the opposite magnitude relationship. In that case, the determination of the magnitude relationship of (7) Shikigin will be performed in reverse. Furthermore, in this embodiment, the features ai, bj
is a vector, but it may also be a scalar quantity such as a number specifying a vector in a codebook when vector quantization is performed. Further, for the sake of simplicity, an example has been described in which the pattern matching method is applied to a word recognition device, but it is obvious that the present pattern matching method can also be used in a Clockwise 92 type continuous speech recognition device.

(発明の始聚) 以上述べた枝刈シの効果及び、漸化式計算を前向きの条
件付代入処理によって実行するという本発明によって、
DPマツチングの処理tを大幅に低減し、小型かつ低価
格な音声g識装置の実現が可能となった。
(Beginning of the Invention) With the above-described effects of pruning and the present invention in which recurrence formula calculation is executed by forward conditional assignment processing,
It has become possible to significantly reduce the processing time for DP matching, and to realize a compact and low-cost audio recognition device.

【図面の簡単な説明】[Brief explanation of the drawing]

第11、第2図は本発明の原理説明図、w、3図は本発
明の一実施例を示すブロック図、第4図は置部の処理を
示すフローチャート、第5図(a)に)は従来技術説明
図である。 10・・・・・マイクロホン、20・・・・・・分析部
、30・・・・・・マイクロプロセッサ、40・・・・
・・標準ノくターン記憶部、50−・・・・・Gメモリ
ー。 L   7すf S D 吐 (と12ン     〜 l
Figures 11 and 2 are diagrams explaining the principle of the present invention, Figures 3 and 3 are block diagrams showing an embodiment of the present invention, Figure 4 is a flowchart showing the processing of the part, and Figure 5 (a)) is a diagram illustrating the prior art. 10...Microphone, 20...Analysis section, 30...Microprocessor, 40...
・・Standard turn memory section, 50-・・・・G memory. L 7sf S D vomit (and 12n ~ l

Claims (1)

【特許請求の範囲】[Claims] 各単語nの標準パターンを特徴の時系列B^n=b^n
_1…b^n_j…b^n_jnとして記憶する手段と
、入力音声パターンの特徴a_iを一時保持する手段と
、それぞれの単語nに対応して前記特徴a_iとb^n
_jとの距離d^n(i、j)の最適累積値g^n(i
、j)を動的計画法の漸化式によって算出する手段とを
有する音声認識のパターンマッチング方式において、時
刻(i−1)までの最適累積値g^n(i、1、j)を
各単語n及各時刻jに対応して■^n(j)の形で記憶
する手段と、時刻iまでの最適累積値g^n(i、j)
に対応するg^n(j)なる量を記憶する手段とを備え
、時刻iにて、■^n(j)の値が所定の枝刈り条件を
満足する(n、j)のセットに対してのみ■^n(j)
にd^n(j)=d^n(i、j)を加算して新たな数
値gとする第1の処理を行ない、このjの近傍のjに対
応するg^n(j)との大小比較を行ない、g<g^n
(j)のときgを新たなg^n(j)として転写する第
2の処理を行ない、時刻iが1クロック進行するごとに
g^n(j)を新たな■^n(j)として前記第1、第
2の処理を進行することを特徴とする音声認識のパター
ンマッチング方式。
Time series featuring the standard pattern of each word n = b^n
_1...b^n_j...b^n_jn, means for temporarily holding the feature a_i of the input speech pattern, and storing the feature a_i and b^n corresponding to each word n.
The optimal cumulative value g^n(i
, j) by a recurrence formula of dynamic programming, the optimal cumulative value g^n(i, 1, j) up to time (i-1) is Means for storing in the form ■^n(j) corresponding to word n and each time j, and optimal cumulative value g^n(i, j) up to time i
and means for storing a quantity g^n(j) corresponding to , and at time i, the value of ■^n(j) satisfies a predetermined pruning condition for the set (n, j). Tenomi■^n(j)
The first process is to add d^n(j) = d^n(i, j) to a new value g, and then calculate the difference between g^n(j) corresponding to j in the vicinity of this j. Compare the size and find g<g^n
When (j), a second process is performed to transfer g as a new g^n(j), and every time time i advances by one clock, g^n(j) is transferred as a new ■^n(j). A pattern matching method for speech recognition characterized by proceeding with the first and second processing.
JP62061732A 1987-03-16 1987-03-16 Pattern matching system for voice recognition Granted JPS63226693A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62061732A JPS63226693A (en) 1987-03-16 1987-03-16 Pattern matching system for voice recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62061732A JPS63226693A (en) 1987-03-16 1987-03-16 Pattern matching system for voice recognition

Publications (2)

Publication Number Publication Date
JPS63226693A true JPS63226693A (en) 1988-09-21
JPH0465393B2 JPH0465393B2 (en) 1992-10-19

Family

ID=13179671

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62061732A Granted JPS63226693A (en) 1987-03-16 1987-03-16 Pattern matching system for voice recognition

Country Status (1)

Country Link
JP (1) JPS63226693A (en)

Also Published As

Publication number Publication date
JPH0465393B2 (en) 1992-10-19

Similar Documents

Publication Publication Date Title
JP2739945B2 (en) Voice recognition method
US4349700A (en) Continuous speech recognition system
JPS5991500A (en) Voice analyzer
JPS62133500A (en) Method and apparatus for identifying electrical signal introduced from acoustic signal
JPH0159600B2 (en)
US4488243A (en) Dynamic time warping arrangement
CN115497484B (en) Voice decoding result processing method, device, equipment and storage medium
US5369727A (en) Method of speech recognition with correlation of similarities
JP2980026B2 (en) Voice recognition device
CA1226945A (en) Pattern matching method and apparatus therefor
US5375173A (en) Speaker adapted speech recognition system
US5121465A (en) Pattern matching system
JPS63226693A (en) Pattern matching system for voice recognition
US4790017A (en) Speech processing feature generation arrangement
US4670850A (en) Pattern matching apparatus
JPS63226694A (en) Pattern matching system for voice recognition
JP2000099089A (en) Search device for continuous voice recognition and search method for continuous voice recognition
US7818172B2 (en) Voice recognition method and system based on the contexual modeling of voice units
JP3348735B2 (en) Pattern matching method
JPH0568718B2 (en)
JP3226716B2 (en) Voice recognition device
US20240144934A1 (en) Voice Data Generation Method, Voice Data Generation Apparatus And Computer-Readable Recording Medium
CN116913267A (en) Speech recognition method, device, equipment and storage medium
JPH04271397A (en) Voice recognizer
JPS58149099A (en) Pattern recognition system