JPH0355836B2 - - Google Patents

Info

Publication number
JPH0355836B2
JPH0355836B2 JP61002940A JP294086A JPH0355836B2 JP H0355836 B2 JPH0355836 B2 JP H0355836B2 JP 61002940 A JP61002940 A JP 61002940A JP 294086 A JP294086 A JP 294086A JP H0355836 B2 JPH0355836 B2 JP H0355836B2
Authority
JP
Japan
Prior art keywords
calculation unit
pattern
input
block
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP61002940A
Other languages
Japanese (ja)
Other versions
JPS62161200A (en
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Priority to JP61002940A priority Critical patent/JPS62161200A/en
Publication of JPS62161200A publication Critical patent/JPS62161200A/en
Publication of JPH0355836B2 publication Critical patent/JPH0355836B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明の連続音声認識装置に関し、特に文法に
従つて連続発声された文音声を高速認識する高認
識率の連続音声認識装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Industrial Field of Application] The present invention relates to a continuous speech recognition device, and particularly to a continuous speech recognition device with a high recognition rate that rapidly recognizes sentence speech continuously uttered according to grammar.

〔従来の技術〕[Conventional technology]

音声認識装置の中でも文法に従つて発声された
文音声を認識する装置は、計算機プログラムや限
定業務用文章あるいは航空管制や各種機器の制御
用指令などの認識ができ広範囲な応用分野を有し
ている。文法の拘束が与えられている場合には、
その文法規則を利用することによつて誤認識を防
止できることが原理的に知られている。特に連続
数字認識において入力音声に桁数の制約がある場
合、その制約を規則化することにより認識率を改
善することができる。
Among voice recognition devices, devices that recognize sentence sounds uttered according to grammar can recognize computer programs, limited business texts, and commands for air traffic control and control of various equipment, and have a wide range of applications. There is. Given grammatical constraints,
It is known in principle that misrecognition can be prevented by using the grammar rules. In particular, when there is a restriction on the number of digits in input speech in continuous number recognition, the recognition rate can be improved by regularizing the restriction.

このような文法に従つて連続に発声された文音
声を認識する手法が同一出願人による特願昭58−
239303号明細書「連続音声認識装置」に記載され
ている。この原理であるブロツクワイズDPマツ
チング法は大略次のようである。文法をオートマ
ンαで表現し、そのオートマンαを次のように定
義する。
A method for recognizing sentence sounds continuously uttered according to such a grammar was proposed in a patent application filed in 1983 by the same applicant.
It is described in the specification 239303 "Continuous speech recognition device". The principle of this blockwise DP matching method is roughly as follows. The grammar is expressed by an automan α, and the automan α is defined as follows.

α=<K、Σ、Δ,P0、F> ……(1) ここで、K:状態pの集合{p|p=1、2、
…π} Σ:入力単語nの集合{n|n=1、2、…N} Δ:状態遷移規則{(p、q、n)} ここで、(p、q、n)はpn ―→ qなる状態
遷移を意味する。
α=<K, Σ, Δ, P 0 , F> ...(1) Here, K: set of states p {p|p=1, 2,
...π} Σ: Set of input words n {n|n=1, 2, ...N} Δ: State transition rule {(p, q, n)} Here, (p, q, n) is pn -→ It means q state transition.

P0:初期状態、以後はp=0で示す。P 0 : Initial state, hereinafter indicated as p=0.

F:最終状態集合Fn ―→ K 次に前記オートマトンαに従つて単語nn ―→ Σ
を連続して発声して得られる音声パタンAを A=a1、a2、…ai、aI …(2) で示し、これを(未知)入力パタンと呼ぶ。各単
語nn ―→ Σに対して標準的なパタン Bn=b1 n、b2 n、…bj n、…bn Jo …(3) を用意し、これを単語標準パタンと呼ぶ。この単
語標準パタンBnをオートマンαに従つて接続す
ることによつて得られる連続音声標準パタンC=
Bn1、Bn2、…Bnxと入力パタンAとのDPマツチン
グを行い、2つのパタンの相互に異なる度合を表
わす量(以下相異度と称する)を算出し、最小の
相異度を与える単語系列を認識結果とする。
F: Final state set Fn -→ K Next, according to the automaton α, word nn -→ Σ
A voice pattern A obtained by continuously uttering is expressed as A=a 1 , a 2 , ...a i , a I ...(2), and is called an (unknown) input pattern. A standard pattern B n =b 1 n , b 2 n , ... b j n , ... b n Jo (3) is prepared for each word nn -→ Σ, and this is called a word standard pattern. Continuous speech standard pattern C= obtained by connecting this word standard pattern B n according to Automan α
Perform DP matching between B n1 , B n2 , ... B nx and the input pattern A, calculate the amount representing the degree of mutual difference between the two patterns (hereinafter referred to as the degree of dissimilarity), and give the minimum degree of dissimilarity. The word sequence is the recognition result.

ここで最小の相異度を次のような動的計画の手
法で求める。初期条件を T(0、0)=0 T(i、q)=∞、i≠0、q=0 G1(p、n、j)=∞、G2(p、n、j)=∞ …(4) とし、b=1よりI/BL(ここでI/BLは説明
の簡単のため割り切れるものとする)まで順次
(5)、(6)式の境界条件を基に(7)、(8)式の漸化式を
(p、q、n)n ―→ Δなるすべての対(p、n)
について計算する。すなわち状態pとの境界条件
をi=:s、…ieについて g(i-1、0)=T(i-1、p) h(i-1、0)=i−1 …(5) ただしis=(b-1)・BL+1、ie=b・BL とし、ブロツクb−1との境界条件をi=1、
…、Jnなる各標準パタン時刻jについて g(is−1、j)=G1(p、n、j) h(is−1、j)=H1(p、n、j) g(is−2、j)=G2(p、n、j) h(is−2、j)=H2(p、n、j) …(6) とし、漸化式 g(i、j)=d(i、j)+mind(i−
1、j)+g(i−2、j−1) g(i−1、j−1) g(i−1、j−2) …(7) h(i、j)=h(i^、j^) …(8) ただし((i^、j^)は(7)式の右辺における最小の
g(i、j)を与える(i、j)である。
Here, the minimum degree of dissimilarity is found using the following dynamic programming method. Initial conditions are T(0, 0)=0 T(i, q)=∞, i≠0, q=0 G 1 (p, n, j)=∞, G 2 (p, n, j)=∞ ...(4), and sequentially from b=1 to I/BL (Here, I/BL is assumed to be divisible for ease of explanation)
Based on the boundary conditions of equations (5) and (6), the recurrence equations of equations (7) and (8) are expressed as (p, q, n) for all pairs (p, n) such that n -→ Δ
Calculate about. In other words, the boundary condition with state p is i =: s ,...i For e , g(i-1, 0) = T(i-1, p) h(i-1, 0) = i-1...(5) However, i s = (b-1)・BL+1, i e =b・BL, and the boundary conditions with block b-1 are i=1,
..., J n for each standard pattern time j g(i s -1, j) = G 1 (p, n, j) h (i s -1, j) = H 1 (p, n, j) g (i s −2, j)=G 2 (p, n, j) h(i s −2, j)=H 2 (p, n, j) …(6), and the recurrence formula g(i, j)=d(i,j)+mind(i-
1, j) + g (i-2, j-1) g (i-1, j-1) g (i-1, j-2) ...(7) h (i, j) = h (i^, j^) ...(8) However, ((i^, j^) is (i, j) that gives the minimum g(i, j) on the right side of equation (7).

を入力パタン時刻i=isよりieまで計算する。こ
こでd(i、j)は入力パタンの時刻iにおける
特徴ベクトルaiと標準パタンの時刻jにおける特
徴ベクトルbn jとの間の距離である。
is calculated from input pattern time i=i s to i e . Here, d(i, j) is the distance between the feature vector a i of the input pattern at time i and the feature vector b n j of the standard pattern at time j.

d(i、j)=Dis(ai、bn j) …(9) 次のブロツクの計算のため前記計算結果の境界
値を格納する。
d(i, j)=Dis(a i , b n j ) (9) Store the boundary value of the calculation result for the calculation of the next block.

G1(p、n、j)=g(ie、j) H1(p、n、j)=H(ie、j) G2(p、n、j)=g(ie、1、j) H2(p、n、j)=h(ie、1、j) …(10) (6)、(7)、(8)、(10)式の計算が標準パタン時刻i=
Jnまで終了した後、単語境界における最小化とし
てi=is、…、ieについて if T(i、q)>g(i、jn) then T(i、q)=g(i、Jn) N(i、q)=n P(i、q)=p L(I、q)=h(i、Jn …(11) を計算する。
G 1 (p, n, j) = g (i e , j) H 1 (p, n, j) = H (i e , j) G 2 (p, n, j) = g (i e , 1 , j) H 2 (p, n, j) = h (i e , 1, j) ...(10) (6), (7), (8), (10) are calculated at standard pattern time i =
After finishing up to J n , if T( i , q)>g(i, j n ) then T(i, q)=g(i, J n ) N(i, q)=n P(i, q)=p L(I, q)=h(i, J n ...(11) Calculate.

以上述べた(7)、(8)式は漸化式計算は、第2図
(説明図)に示すように入力パタンのBLフレーム
分をブロツ化してブロツクごとに実行している。
The recurrence formula calculations for equations (7) and (8) described above are performed for each block by converting the BL frame portion of the input pattern into blocks, as shown in FIG. 2 (explanatory diagram).

最後に、入力パタンの認識結果は判定処理とし
て次のような手続きにより求められる。
Finally, the recognition result of the input pattern is determined by the following procedure as a determination process.

初期条件 q^=argmin〔T(I、q)〕…(12) qn ―→ F q=q^、m=1 …(13) 認識単語 n^=N(m、q) 単語始点 l^=L(m、q) 状態遷移 q^=P(m、q) …(14) を求める。Initial condition q^=argmin [T(I, q)]…(12) qn ―→ F q=q^, m=1...(13) Recognized word n^=N(m, q) Word starting point l^=L(m, q) State transition q^=P(m, q) …(14) seek.

もしl^>0ならばq=q^、m=l^として(14)式
を繰り返す。l^=0ならば終了。
If l^ > 0, repeat equation (14) with q = q^ and m = l^. If l^=0, end.

以上説明した方法の漸化式(7)は第3図aに示す
径路に沿つて計算される。このため、入力パタン
と標準パタンの時間軸の対応は1/2から2倍まで
の伸縮に制限されている。このことを「傾斜制
限」と呼んでおり、局所的に不自然な時間軸の対
応を排除している。この傾斜制限を用いることに
より認識率を高くすることが可能である。
The recurrence formula (7) of the method described above is calculated along the path shown in FIG. 3a. For this reason, the correspondence between the input pattern and the standard pattern on the time axis is limited to expansion/contraction from 1/2 to 2 times. This is called "tilt restriction" and eliminates locally unnatural time axis correspondences. By using this slope restriction, it is possible to increase the recognition rate.

しかしながら漸化式(7)を使用する場合はワーク
メモリG1(p、n、j)、H1(p、n、j)、G2
(p、n、j)、H2(p、n、j)が必要である。
さらに演算部とワークメモリ間のデータ転送
((6)、(10)式に相当)が必要である。すなわち、漸
化式(7)を使用する場合はワークメモリが大きくな
り、かつデータ転送が多くなる欠点がある。
However, when using recurrence formula (7), the work memories G 1 (p, n, j), H 1 (p, n, j), G 2
(p, n, j), H 2 (p, n, j) are required.
Furthermore, data transfer (corresponding to equations (6) and (10)) between the calculation unit and the work memory is required. That is, when using the recurrence formula (7), there is a drawback that the work memory becomes large and data transfer increases.

一方、ブロツクワイズDPマチツング法におい
て傾斜制限のない漸化式を使用することが可能で
ある。この場合第3図bに示す径路に沿つて計算
される。このDPマツチングの計算の手順は前記
(4)、〜(14)式と同様に行われるが、初期条件と
して(4)式の代わりに(15)式を用い、 T(0、0)=0 T(i、q)=∞、i≠0、q≠0 G(p、n、j)=∞ …(15) ブロツクb−1との境界条件として(6)式の代わ
りに(16)式を用い、 g(is−1、j)=G(p、n、j) h(is−1、j)=H(p、n、j) …(16) 漸化式として(7)式の代わりに(17)式を用い、 g(i、j)=d(i、j)+ming(i-1、j) g(i-1、i-1) g(i-1、j-2) …(17) (10)式の代わりに(18)式を用いる。
On the other hand, it is possible to use a recurrence formula without slope restrictions in the blockwise DP matching method. In this case, the calculation is performed along the path shown in FIG. 3b. The calculation procedure for this DP matching is described above.
It is performed in the same way as equations (4) to (14), but using equation (15) instead of equation (4) as the initial condition, T(0, 0) = 0 T(i, q) = ∞, i≠0, q≠0 G(p, n, j)=∞ …(15) Using equation (16) instead of equation (6) as the boundary condition with block b-1, g(i s −1 , j)=G(p, n, j) h(i s −1, j)=H(p, n, j) …(16) As the recurrence equation, use equation (17) instead of equation (7). Use, g(i, j) = d(i, j) + ming(i-1, j) g(i-1, i-1) g(i-1, j-2) …(17) (10) Use equation (18) instead of Eq.

G(p、n、j)=g(ie、j) H(p、n、j)=h(ie、j) …(18) 以上説明した傾斜制限なしの漸化式(17)を用
いる方法では傾斜制御ありの漸化式(7)を用いる方
法に比較して、ワークメモリが1/2に減少でき、
さらにデータ転送も1/2に減少できる。
G(p, n, j) = g(i e , j) H(p, n, j) = h(i e , j) ...(18) The recurrence formula (17) without slope restriction explained above is The method used can reduce the work memory by half compared to the method using recurrence formula (7) with slope control.
Furthermore, data transfer can be reduced to 1/2.

しかしながら、傾斜制限がないため入力パタン
と標準パタンの時間軸の対応が不自然になること
が許されており、誤認識の原因となつている。
However, since there is no slope limit, the correspondence between the time axes of the input pattern and the standard pattern is allowed to become unnatural, causing erroneous recognition.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

上述した従来の連続音声認識装置では、傾斜制
限ありの漸化式を用いる場合はワークメモリが大
きくかつデータ転送が多いという欠点がある。一
方、傾斜制限なしの漸化式を用いる場合は誤認識
が多いという欠点がある。
The above-mentioned conventional continuous speech recognition apparatus has the disadvantage that when using a recurrence formula with slope restriction, the work memory is large and data transfer is frequent. On the other hand, when using a recurrence formula without slope restrictions, there is a drawback that there are many erroneous recognitions.

本発明の目的は前記欠点を解消し、ワークメモ
リが小さくかつデータ転送が少なく、また認識率
の高い連続音声認識装置を提供することにある。
SUMMARY OF THE INVENTION It is an object of the present invention to provide a continuous speech recognition device which eliminates the above-mentioned drawbacks, has a small work memory, requires little data transfer, and has a high recognition rate.

〔問題点を解決するための手段〕[Means for solving problems]

本発明の連続音声認識装置は入力パタンを格納
する入力パタンメモリ部と、標準パタンを格納す
る標準パタンメモリ部と、単語nの入力によつて
状態遷移p→qが生じることを意味する規則
(p、q、n)群である状態遷移テーブルΔと最
終状態群Fとを記憶するオートマトン記憶部と、
状態pと単語nにより指定された状態遷移におい
て入力パタン時刻iと標準パタン時刻jで定めら
れる領域内で入力パタンBLフレームの幅を持つ
ブロツクb内の各点(i、j)の入力パタンの特
徴ベクトルと標準パタンの特徴ベクトル間の距離
d(i、j)を求める距離計算部と、前記ブロツ
クbと1つ前のブロツクb−1との境界部分の
DPマツチング計算を第1の漸化式を用いて求め
る境界DP計算部と、前記ブロツクbの内部のDP
マツチング計算を第2の漸化式を用いて求める本
体DP計算部と、前記境界DP計算部と本体DP計
算部で求められた最小累積距離が得られる単語の
組合せを定める判定部とを備えている。
The continuous speech recognition device of the present invention includes an input pattern memory section that stores input patterns, a standard pattern memory section that stores standard patterns, and a rule (which means that state transition p→q occurs when word n is input). an automaton storage unit that stores a state transition table Δ and a final state group F, which are a group of p, q, n);
In the state transition specified by state p and word n, the input pattern at each point (i, j) in block b having the width of the input pattern BL frame within the area defined by input pattern time i and standard pattern time j. A distance calculation unit that calculates the distance d(i, j) between the feature vector and the feature vector of the standard pattern, and a distance calculation unit that calculates the distance d(i, j) between the feature vector and the feature vector of the standard pattern;
A boundary DP calculation unit that calculates the DP matching calculation using the first recurrence formula, and a DP inside the block b.
A main body DP calculation unit that calculates a matching calculation using a second recurrence formula, and a determination unit that determines a combination of words that yields the minimum cumulative distance calculated by the boundary DP calculation unit and the main body DP calculation unit. There is.

〔作用〕[Effect]

次に本発明の作用について第4図を参照しなが
ら説明する。
Next, the operation of the present invention will be explained with reference to FIG.

第4図は本発明の原理を説明するための図であ
る。
FIG. 4 is a diagram for explaining the principle of the present invention.

本発明の原理のDPマツチングの計算は、ブロ
ツクの境界部分では傾斜制限のない漸化式を使用
し、ブロツク内部では傾斜制限ありの漸化式を使
用して進められる。
The calculation of DP matching according to the principles of the present invention proceeds by using a recurrence formula without a slope restriction at the boundary of a block, and using a recurrence formula with a slope restriction inside the block.

初期条件を T(0、0)=0 T(i、q)=∞、i≠0、q=≠ G(p、n、j)=∞ …(19) とし、ブロツクb=1よりI/BLまで順次次の
(20)、(21)式の境界条件を基に(22)、〜(25)
式の漸化式を(p、q、n)n ―→ Δなる対(p、
n)について計算する。すなわち状態pとの境界
条件をi=is、…、ieについて g(i-1、0)=T(i-1、p) h(i-1、0)=i−1 …(20) ただしis=(b−1)・BL+1、ie=b・BL とし、ブロツクb−1との境界条件ををj=1、
…、Jnなる標準パタン時刻jについて g(is−1、j)=G(p、n、j) h(is−1、j)=H(p、n、j) …(21) とし、ブロツクの境界部分を求める第1の漸化式 g(is、j)=d(is、j)+ming(i
s−1、j) g(is−1、j−1) g(is−1、j−2) …(22) h(hs、j)=h(i^、j^) …(23) ただし(i^、j^)は(22)式の右辺における最小を
与える(i、j)である。
The initial conditions are T(0, 0)=0, T(i, q)=∞, i≠0, q=≠ G(p, n, j)=∞...(19), and from block b=1, I/ (22) to (25) based on the boundary conditions of equations (20) and (21) sequentially up to BL.
The recurrence formula of (p, q, n)n -→ Δ is the pair (p, q, n)
n). In other words, the boundary conditions with state p are i=i s , ..., i e g(i-1, 0)=T(i-1, p) h(i-1, 0)=i-1 ...(20 ) However, i s = (b-1)・BL+1, i e =b・BL, and the boundary conditions with block b-1 are j=1,
..., J n for standard pattern time j g(i s -1, j) = G(p, n, j) h (i s -1, j) = H(p, n, j) ...(21) The first recurrence formula g(i s , j) = d(i s , j) + ming(i
s −1, j) g(i s −1, j−1) g(i s −1, j−2) …(22) h(h s , j)=h(i^, j^) …( 23) However, (i^, j^) is (i, j) that gives the minimum on the right side of equation (22).

を計算し、続いてブロツク本体を求める第2の漸
化式 g(i、j)=d(i、j)+mind(i-1、j)+
g(i-2、j-1) g(i-1、j-1) g(i-1、j-2) …(24) h(i、j)=h(i^、j^) …(25) ただし(i^、j^)は(24)式の右辺における最小
を与える(i、j)である。
Then, the second recurrence formula g(i, j) = d(i, j) + mind(i-1, j) + calculates the block body.
g(i-2, j-1) g(i-1, j-1) g(i-1, j-2) …(24) h(i, j)=h(i^, j^)… (25) However, (i^, j^) is (i, j) that gives the minimum on the right side of equation (24).

をi=is+1よりieまで計算する。Calculate from i=i s +1 to i e .

次のブロツクの計算のため前記計算結果の境界
値を格納する。
The boundary value of the calculation result is stored for calculation of the next block.

G(p、n、j)=g(ie、j) H(p、n、j)=H(ie、j) …(26) (21)、〜(25)式の計算が標準パタン時刻j=Jn
まで終了した後、単語境界における最小化として
i=is、…、ieについて if T(i、q)>g(i、Jn then T(i、q)=g(i、Jn) N(i、q)=n P(i、q)=p L(i、q)=h(i、Jn …(27) を計算する。最後に、入力パタンの認識結果は判
定処理として従来方法と同様の手続き、すなわち
(12)、(13)、(14)式より求められる。
G (p, n, j) = g (i e , j) H (p, n, j) = H (i e , j) ...(26) The calculations of equations (21) and (25) are standard patterns. Time j=J n
If T( i , q)>g(i, J n then T(i, q ) =g(i, J n ) N(i, q)=n P(i, q)=p L(i, q)=h(i, J n ...(27) It is obtained using the same procedure as the method, ie, equations (12), (13), and (14).

〔実施例〕〔Example〕

次に、本発明について第1図、第5図、〜第1
0図を用いて詳細に説明する。
Next, regarding the present invention, FIGS. 1, 5, - 1
This will be explained in detail using FIG.

第1図は本発明の連続音声認識装置の一実施例
を示すブロツク図、第5図、第6図、第7図、第
8図はそれぞれ第1図の実施例の一部詳細構成を
示す部分ブロツク図、第9図は第1図における動
作の時間関係を示すタイムチヤート、第10図
a,〜dは第1図における動作の流れを示すフロ
ーチヤートである。
FIG. 1 is a block diagram showing an embodiment of the continuous speech recognition device of the present invention, and FIGS. 5, 6, 7, and 8 each show a partially detailed configuration of the embodiment of FIG. 1. FIG. 9 is a time chart showing the time relationship of the operations in FIG. 1, and FIGS. 10a to 10d are flow charts showing the flow of the operations in FIG. 1.

標準パタンメモリ部130には単語セツトΣに
含まれる単語nの標準パタンBnが記憶されてお
り、オートマトン記憶部230には状態遷移規則
(p、q、n)と最終状態Fの指定情報が記憶さ
れている。
The standard pattern memory unit 130 stores a standard pattern B n of word n included in the word set Σ, and the automaton storage unit 230 stores state transition rules (p, q, n) and designation information for the final state F. remembered.

マイクロホン100より未知入力音声が入力さ
れると入力部110によつて周波数分析がなされ
特徴を示すベクトルa1に変換され順次入力パタン
メモリ部120に送られる。また、入力部110
には音声レベルを検知することによつて音声区間
を決定する機能が与えられており、音声区間中で
は「1」その他では「0」なる音声区間信号Sを
発生する。制御部240は、この音声区間信号S
の立上りの時刻において初期化パルスSET1を発
生する。これによつて第10図aのブロツク10
に対応する初期化がGメモリ150とTメモリ2
00に対してなされる。
When an unknown input voice is input from the microphone 100, the input section 110 performs frequency analysis, converts it into a vector a1 representing the characteristic, and sequentially sends it to the input pattern memory section 120. In addition, the input section 110
is provided with a function of determining a voice section by detecting the voice level, and generates a voice section signal S that is "1" during the voice section and "0" otherwise. The control unit 240 controls the voice section signal S
Initialization pulse SET 1 is generated at the rising edge of . This results in block 10 in Figure 10a.
The initialization corresponding to G memory 150 and T memory 2
00.

以上の初期化が終了すると、以後のBLフレー
ム分の入力特徴aiに入力に同期して入力パタンブ
ロツク信号bが1、2…と計数される。この入力
パタンブロツクbにおいて制御部240よりの単
語指定信号nは1からNまで変化する。各単語n
においてオートマトン記憶部230中の状態テー
ブルが参照され、またその単語nと状態pにて規
定される状態指定信号qも出力される。
When the above initialization is completed, the input pattern block signal b is counted as 1, 2, etc. in synchronization with the input of the input feature a i for the subsequent BL frames. In this input pattern block b, the word designation signal n from the control section 240 changes from 1 to N. each word n
The state table in the automaton storage section 230 is referred to, and a state designation signal q defined by the word n and state p is also output.

次に単語n、状態pなる1サイクル内の動作を
説明する。この1サイクルによつて第2図に図示
した斜線部分の計算が実行される。すなわち
(20)、(21)式の境界条件のもとで(22)、(25)
式を計算する。初めに制御部240よりの信号
SET2によつて、第10図aのブロツク11,1
2に対応する値のセツトがDPマツチング用ワー
クメモリのgメモリ330とhメモリ340に対
して行われる。続いて制御部240よりの標準パ
タン時刻信号jは1からJnまで変化する。各標準
パタン時刻jにおいて、入力パタン時刻信号i1
is(is=(b−1)・BL+1)よりie(ie=b・BL)
まで変化する。
Next, the operation within one cycle of word n and state p will be explained. Through this one cycle, calculations shown in the shaded areas in FIG. 2 are executed. That is, under the boundary conditions of equations (20) and (21), (22) and (25)
Calculate the formula. First, a signal from the control unit 240
By SET 2 , block 11,1 in Figure 10a
2 is set in the g memory 330 and h memory 340 of the DP matching work memory. Subsequently, the standard pattern time signal j from the control section 240 changes from 1 to J n . At each standard pattern time j, the input pattern time signal i 1 is
From i s (i s = (b-1)・BL+1), i e (i e =b・BL)
changes up to.

isフレームにおいて第10図bのブロツク13
に示した計算が境界DP計算部310にて行われ
る。
Block 13 of FIG. 10b in the i s frame.
The calculation shown in is performed by the boundary DP calculation unit 310.

第5図は境界DP計算部の一例を示すブロツク
図である。初めに入力パタンのisフレームと第n
単語の標準パタンのjフレームが読み出されて、
前記(9)式に示すベクトル間距離d(i、j)が距
離計算部300にて求められる。
FIG. 5 is a block diagram showing an example of a boundary DP calculating section. First, the i s frame of the input pattern and the nth
J-frames of the standard pattern of words are read out,
The inter-vector distance d(i, j) shown in equation (9) above is determined by the distance calculation unit 300.

一方、境界DP計算部310では、距離計算と
並列して3つの相異度の最小値が求められる。す
なわち、gメモリ330よりg(is−1、j)、g
(is−1、j−1、g(is−1、j−2)とhメモ
リ340よりh(is−1、j)、h(is−1、j−
1)、h(is−1、j−2)が読み出され、レジス
タG1,G2,G3とH1,H2,H3にそれぞ
れ格納される。比較回路312は3つのレジスタ
G1,G2,G3から最小値を検出し、その最小
値が得られたレジスタGn^(n^は1,2,3のどれ
か)に対応したレジスタHn^を選択するゲート信
号n^を発する。前記ゲート信号n^により選択され
たレジスタHn^の内容がhメモリ340h(is
j)へ書き込まれる。また、比較回路312より
出力された最小値g(is−1、j^)は前記距離計算
部300で求められた距離d(is、j)と加算器
311によつて加算され、gメモリ330のg
(is、j)へ書き込まれる。
On the other hand, the boundary DP calculation unit 310 calculates the minimum value of the three dissimilarities in parallel with the distance calculation. That is, from the g memory 330, g(i s −1, j), g
(i s -1, j-1, g (i s -1, j-2) and h (i s -1, j), h (i s -1, j-
1), h(i s -1, j-2) are read out and stored in registers G1, G2, G3 and H1, H2, H3, respectively. The comparison circuit 312 detects the minimum value from the three registers G1, G2, and G3, and selects the register Hn^ corresponding to the register Gn^ (where n^ is 1, 2, or 3) from which the minimum value was obtained. It emits a gate signal n^ to The contents of the register Hn^ selected by the gate signal n^ are stored in the h memory 340h (i s ,
j). Further, the minimum value g (i s −1, j^) outputted from the comparison circuit 312 is added to the distance d (i s , j) obtained by the distance calculating section 300 by the adder 311, and g memory 330g
(i s , j).

続いて各入力ペタン時刻i(iはis+1よりie
で変化する)において、第10図bのブロツク1
4に示した計算が本体DP計算部320で行われ
る。
Then, at each input point time i (i changes from i s +1 to i e ), block 1 of FIG.
The calculation shown in 4 is performed by the main body DP calculation section 320.

第6図は本体DP計算部の一例を示すブロツク
図である。初めに入力パタンのiフレームが読み
出されて、(9)式に示すベクトル間の距離を距離計
算部300で求め、d(i、j)が得られる。
FIG. 6 is a block diagram showing an example of the main body DP calculation section. First, the i-frame of the input pattern is read out, and the distance calculation unit 300 calculates the distance between the vectors shown in equation (9) to obtain d(i, j).

一方、本体DP計算部320では距離計算と並
列して(24)式の第2の漸化式の右辺の最小値が
求められる。すなわち、gメモリ330より読み
出されたg(i−2、i−1)と、遅延回路32
4にて1時刻遅延された距離d(i−1、j)が
加算器323にて加算されレジスタG1に格納さ
れる。また、gメモリ333よりg(i−1、j
−1)とg(i−1、j−2)が読み出されレジ
スタG2,G3にそれぞれ格納される。さらに、
hメモリ340よりh(i−2、j−1)、h(i
−1、j−1)、h(i−1、j−2)が読み出さ
れレジスタH1,H2,H3にそれぞれ格納され
る。
On the other hand, the main body DP calculation unit 320 calculates the minimum value on the right side of the second recurrence formula of equation (24) in parallel with the distance calculation. That is, g(i-2, i-1) read from the g memory 330 and the delay circuit 32
The distance d(i-1,j) delayed by one time in step 4 is added by adder 323 and stored in register G1. Also, from the g memory 333, g(i-1, j
-1) and g(i-1, j-2) are read out and stored in registers G2 and G3, respectively. moreover,
From the h memory 340, h(i-2, j-1), h(i
-1, j-1) and h(i-1, j-2) are read out and stored in registers H1, H2, and H3, respectively.

比較回路322は3つのレジスタG1,G2,
G3より最小値を検出し、その最小値が得られた
レジスタGn^(n^は1、2、3のどれか)に対応し
たレジスタHn^を選択するゲート信号n^を発する。
前記ゲート信号n^により選択されたレジスタHn^の
内容がhメモリ340のh(i、j)へ書き込ま
れる。また、比較回路322より出力された最小
値は前記距離計算部300で求められた距離d
(i、j)と加算器321によつて加算され、g
メモリ330のg(i、j)へ書き込まれる。入
力パタン時刻iがis+1からieまで変化させるこ
とによつて標準パタン時刻jに対する処理が終了
する。さらに標準パタン時刻jが終端Jnとなつた
後、第10図bのブロツク15に示すように信号
SET3に従つて漸化式(24)の結果g(ie、i)、
h(ie、j)をテーブルメモリG(p、n、j),
H(p、n、j)へ格納する。つづいて制御部2
40より発せされた信号i2(isからieまで変化
する)に従つて第10図cのブロツク16に示し
た比較が行われる。すなわち第7図に示すよう
に、信号i2とqに従つてテーブルメモリ200
よりT(i、q)とgメモリ330よりg(i、
Jn)が読み出され、比較回路170により比較し
T(I、q)>g(i、Jn)の場合wp信号が発せら
れ、g(i、JN)、n、p、h(i、Jn)がテーブ
ルメモリT(i、q),N(i,q),P(i、q),
L(i、q)へ書き込まれる。
The comparison circuit 322 has three registers G1, G2,
The minimum value is detected from G3, and a gate signal n^ is generated to select the register Hn^ corresponding to the register Gn^ (n^ is any one of 1, 2, or 3) from which the minimum value was obtained.
The contents of the register Hn^ selected by the gate signal n^ are written to h(i, j) of the h memory 340. Further, the minimum value output from the comparison circuit 322 is the distance d calculated by the distance calculation section 300.
(i, j) by the adder 321, and g
It is written to g(i,j) in memory 330. By changing the input pattern time i from i s +1 to ie , the processing for the standard pattern time j is completed. Further, after the standard pattern time j reaches the terminal J n , the signal is changed as shown in block 15 of FIG.
According to SET3, the result of recurrence formula (24) g(i e , i),
h(i e , j) in table memory G(p, n, j),
Store in H(p, n, j). Next, control section 2
According to the signal i2 (varying from i s to i e ) issued by 40, the comparison shown in block 16 of FIG. 10c is carried out. That is, as shown in FIG. 7, the table memory 200
From T(i, q) and g(i, q) from g memory 330.
J n ) is read out and compared by the comparator circuit 170. If T(I, q)>g(i, J n ), a wp signal is generated, and g(i, J N ), n, p, h( i, J n ) are table memories T(i, q), N(i, q), P(i, q),
written to L(i,q).

以上の動作によつて状態p、単語n、入力パタ
ンブロツクbの処理が終了する。さらに状態指定
信号pがp1からπと変化されることにより単語指
定信号nに対する処理が終了する。さらに単語指
定信号nが1からNまで変化することにより入力
パタンブロツクbに対する処理が終了する。入力
パタンブロツク信号がI/BLとなつた後に、
(12)、(13)、(14)式に示した判定処理が開始さ
れる。
With the above operations, the processing of state p, word n, and input pattern block b is completed. Further, the state designation signal p is changed from p 1 to π, thereby completing the processing for the word designation signal n. Furthermore, when the word designation signal n changes from 1 to N, the processing for input pattern block b ends. After the input pattern block signal becomes I/BL,
The determination process shown in equations (12), (13), and (14) is started.

判定部220は第8図に示すように構成され、
初めに第10図dのブロツク17の処理として、
オートマトン記憶部230から最終状態集合Fに
含まれる状態qを信号q3に従つて順次指定さ
れ、Tメモリ200よりT(I、q)を読み出し、
比較回路221、最小値レジスタ222、状態レ
ジスタ223を用いて最小のT(I、q)が与え
られる状態q^を得る。続いて第10図dのブロツ
ク18の処理として判定制御部227はq=q^、
m=Iとしてアドレス信号m3、qをNメモリ1
90、Lメモリ210、Pメモリ180へ発しN
(m、q),L(m、q),P(m、q)を読み出す。
このL(m、q)とP(m、q)は次の時刻mと状
態qとなり、N(m、q)は認識結果として出力
される。この処理をl^が零になるまで繰り返すこ
とにより順次認識結果が得られる。
The determination unit 220 is configured as shown in FIG.
First, as the processing of block 17 in FIG. 10d,
The states q included in the final state set F are sequentially specified from the automaton storage unit 230 according to the signal q3, and T(I, q) is read from the T memory 200,
The comparison circuit 221, minimum value register 222, and state register 223 are used to obtain the state q^ that provides the minimum T(I, q). Next, as the process of block 18 in FIG. 10d, the determination control unit 227 determines that q=q^,
Assuming m=I, address signals m3 and q are transferred to N memory 1.
90, send to L memory 210, P memory 180 N
Read out (m, q), L (m, q), and P (m, q).
These L(m, q) and P(m, q) become the next time m and state q, and N(m, q) is output as the recognition result. By repeating this process until l^ becomes zero, recognition results can be obtained sequentially.

以上、本発明の構成を実施例にもとづいて説明
したが、これらの記載は本発明の権利範囲を限定
するものではない。
Although the configuration of the present invention has been described above based on examples, these descriptions do not limit the scope of the present invention.

本実施例では特願昭58−239303明細書に記載し
ているようなブロツクワイズDPマツチング法を
もとに説明しているが、入力パタンの複数フレー
ムをまとめてブロツク化してDPマツチングを実
行する方法であるならば、本発明の原理であるブ
ロツク境界部分とブロツク本体部分を異なる漸化
式で実行することが可能である。すなわち、特願
昭59−067116明細書に記載されている修正DPマ
ツチング計算部をもつブロツクワイズDP法特願
昭59−068015明細書に記載されているブロツクを
標準パタン軸に対して斜めに傾けた斜めブロツク
ワイズDP法、特願昭59−267830明細書に記載さ
れている標準パタン長によつてブロツク幅を変化
させる可変斜めブロツクワイズDP法などにも本
発明の原理であるブロツク境界部分は第1の漸化
式を使用し、ブロツク本体部分は第2の漸化式を
使用することができる。
This example is explained based on the blockwise DP matching method as described in the specification of Japanese Patent Application No. 58-239303, but multiple frames of the input pattern are collectively made into blocks and DP matching is executed. If it is a method, it is possible to implement the principle of the present invention, that is, the block boundary part and the block body part, using different recurrence formulas. That is, the Blockwise DP method having the modified DP matching calculation section described in the specification of Japanese Patent Application No. 59-067116 The block described in the specification of Japanese Patent Application No. 59-068015 is tilted diagonally with respect to the standard pattern axis. The principle of the present invention, the block boundary portion, can also be applied to the diagonal block DP method and the variable diagonal block DP method in which the block width is changed according to the standard pattern length described in the specification of Japanese Patent Application No. 59-267830. The first recurrence formula can be used, and the block body portion can use the second recurrence formula.

さらにブロツク境界部分を求める第1の漸化式
として(22)式を用いているが、入力パタン時刻
iとi−1のみを使用する漸化式であるならばど
のような形でもよい。例えば g(i、j)=d(i、j)+ming(i-1、j) g(i-1、j-1) …(28) でもよいし、また g(i、j)=d(i、j)+min g(i-1、j) g(i-1、j-1) g(i-1、j-2) g(i-1、j-3) …(29) でもよい。
Furthermore, although equation (22) is used as the first recurrence equation for determining the block boundary portion, any recurrence equation may be used as long as it uses only input pattern times i and i-1. For example, g(i, j) = d(i, j) + ming(i-1, j) g(i-1, j-1) ...(28) or g(i, j) = d( i, j) + min g(i-1, j) g(i-1, j-1) g(i-1, j-2) g(i-1, j-3) ...(29) may also be used.

またブロツク本体部を求める第2の漸化式とし
て(24)式を使用しているが、例えば g(i、j)=mind(i、j)+d(i-1、j)+g(i-
2、j-1) d(i、j)+g(i-1、j-1) d(i、j)+d(i、j-1)/2+g(i-1、j-2) …(30) g(i、j)=d(i、j)+mind(i-1、j)+d(i-
2、j)+g(i-3、j-1) (i-1、j)+g(i-2、j-1) g(i-1、j-1) g(i-1、j-2) g(i-1、j-3) …(31) などを用いてもよいことは明白である。
Also, formula (24) is used as the second recurrence formula for calculating the block body, for example, g(i, j) = mind(i, j) + d(i-1, j) + g(i-
2, j-1) d(i, j)+g(i-1, j-1) d(i, j)+d(i, j-1)/2+g(i-1, j-2)...(30 ) g(i, j) = d(i, j) + mind(i-1, j) + d(i-
2, j) + g(i-3, j-1) (i-1, j) + g(i-2, j-1) g(i-1, j-1) g(i-1, j-2 ) g(i-1, j-3) ...(31) etc. can obviously be used.

〔発明の効果〕〔Effect of the invention〕

以上説明したように本発明は、DPマツチング
の各ブロツクの計算において境界部分の漸化式を
入力パタン時刻iとi−1のみを使用することに
よつてワークメモリG,Hを小さくすることがで
き、またデータ転送量も小さくすることができ
る。さらに各ブロツクの本体の漸化式は傾斜制御
のある形式をとり、これにより誤認識率も小さく
できる効果がある。
As explained above, the present invention makes it possible to reduce the work memories G and H by using only the input pattern times i and i-1 for the boundary part recurrence formula in the calculation of each block of DP matching. It is also possible to reduce the amount of data transferred. Furthermore, the recurrence formula for the main body of each block takes a form with tilt control, which has the effect of reducing the rate of misrecognition.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の連続音声認識装置の一実施例
を示すブロツク図、第2図、第3図、第4図は本
発明の原理を説明するための図、第5図、第6
図、第7図、第8図はそれぞれ第1図の実施例の
一部詳細構成を示す部分ブロツク図、第9図は第
1図における動作の時間関係を示すタイムチヤー
ト、第10図a〜dは第1図における動作の一連
の流れを示すフローチヤートである。 100…マイクロホン、110…入力部、12
0…入力パタンメモリ部、130…標準パタンメ
モリ部、150…Gメモリ、160…Hメモリ、
170…比較回路、180…Pメモリ、190…
Nメモリ、200…Tメモリ、210…Lメモ
リ、220…判定部、230…オートマトン記憶
部、240…制御部、300…距離計算部、31
0…境界DP計算部、320…本体DP計算部、3
30…gメモリ、340…hメモリ。
FIG. 1 is a block diagram showing an embodiment of the continuous speech recognition device of the present invention, FIGS. 2, 3, and 4 are diagrams for explaining the principle of the present invention, and FIGS.
7 and 8 are partial block diagrams showing a part of the detailed configuration of the embodiment shown in FIG. 1, respectively. FIG. 9 is a time chart showing the time relationship of the operations in FIG. 1, and FIGS. d is a flowchart showing a series of operations in FIG. 100...Microphone, 110...Input section, 12
0...Input pattern memory section, 130...Standard pattern memory section, 150...G memory, 160...H memory,
170... Comparison circuit, 180... P memory, 190...
N memory, 200...T memory, 210...L memory, 220...judgment unit, 230...automaton storage unit, 240...control unit, 300...distance calculation unit, 31
0... Boundary DP calculation section, 320... Main body DP calculation section, 3
30...g memory, 340...h memory.

Claims (1)

【特許請求の範囲】[Claims] 1 有限状態オートマトンにより指定される単語
列を連続に発声した音声を標準パタンとDPマツ
チングすることにより認識する連続音声認識装置
において、入力パタンを格納する入力パタンメモ
リ部と、標準パタンを格納する標準パタンメモリ
部と、単語nの入力によつて状態遷移p→qが生
じることを意味する規則(p、q、n)群である
状態遷移テーブルΔと最終状態群Fとを記憶する
オートマトン記憶部と、状態pと単語nにより指
定された状態遷移において入力パタン時刻iと標
準パタン時刻jで定められる領域内で入力パタン
BLフレームの幅を持つブロツクb内の各点(i、
j)の入力パタンの特徴ベクトルと標準パタンの
特徴ベクトル間の距離d(i、j)を求める距離
計算部と、前記ブロツクbと1つ前のブロツクb
−1との境界部分のDPマツチング計算を第1の
漸化式を用いて求める境界DP計算部と、前記ブ
ロツクbの内部のDPマツチング計算を前記第1
の漸化式とは異なる第2の漸化式を用いて求める
本体DP計算部と、前記境界DP計算部と本体DP
計算部で求められた最小累積距離が得られる単語
の組合せを定める判定部とを備えることを特徴と
する連続音声認識装置。
1. In a continuous speech recognition device that recognizes speech in which a string of words specified by a finite state automaton is continuously uttered by performing DP matching with a standard pattern, there is an input pattern memory section that stores input patterns, and a standard memory section that stores the standard patterns. A pattern memory unit, an automaton storage unit that stores a state transition table Δ, which is a group of rules (p, q, n) that means that state transition p → q occurs when word n is input, and a final state group F. Then, in the state transition specified by the state p and word n, the input pattern within the area defined by the input pattern time i and the standard pattern time j.
Each point (i,
a distance calculation unit that calculates the distance d(i, j) between the feature vector of the input pattern of j) and the feature vector of the standard pattern;
a boundary DP calculation unit that calculates DP matching calculation for the boundary portion with block b using the first recurrence formula;
A main body DP calculation unit that calculates using a second recurrence formula different from the recurrence formula, and a body DP calculation unit that calculates the boundary DP calculation unit and the main body DP.
A continuous speech recognition device comprising: a determination unit that determines a combination of words that yields the minimum cumulative distance determined by the calculation unit.
JP61002940A 1986-01-10 1986-01-10 Continuous voice recognition equipment Granted JPS62161200A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61002940A JPS62161200A (en) 1986-01-10 1986-01-10 Continuous voice recognition equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61002940A JPS62161200A (en) 1986-01-10 1986-01-10 Continuous voice recognition equipment

Publications (2)

Publication Number Publication Date
JPS62161200A JPS62161200A (en) 1987-07-17
JPH0355836B2 true JPH0355836B2 (en) 1991-08-26

Family

ID=11543353

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61002940A Granted JPS62161200A (en) 1986-01-10 1986-01-10 Continuous voice recognition equipment

Country Status (1)

Country Link
JP (1) JPS62161200A (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6183737B2 (en) * 2012-09-27 2017-08-23 国立大学法人 東京大学 Optimal route search device

Also Published As

Publication number Publication date
JPS62161200A (en) 1987-07-17

Similar Documents

Publication Publication Date Title
US5583968A (en) Noise reduction for speech recognition
JPH0159600B2 (en)
EP0103245B1 (en) Pattern matching apparatus
JPH029359B2 (en)
JPH02186398A (en) Continuous voice recognition device
JPH09319392A (en) Voice recognition device
JPH0296800A (en) Continuous voice recognizing device
EP0488208B1 (en) High speed recognition of a string of words connected according to a regular grammar by dp matching
JPS61145599A (en) Continuous voice recognition equipment
JPH0355836B2 (en)
US4794645A (en) Continuous speech recognition apparatus
JPS6312312B2 (en)
JPH01241667A (en) Dynamic neural network to have learning mechanism
JPH0552517B2 (en)
JP3315565B2 (en) Voice recognition device
JPS60130799A (en) Continuous voice recognition equipment
JPH0346840B2 (en)
JPS61102698A (en) Standard pattern adaption system
JPH0449954B2 (en)
JPH0134399B2 (en)
JPS6313099A (en) Continuous voice recognition equipment
JPS58126599A (en) Continuous voice recognition equipment
JPH0577080B2 (en)
JPS6122350B2 (en)
JPH07325598A (en) Speech recognition device