JPS62161200A - Continuous voice recognition equipment - Google Patents

Continuous voice recognition equipment

Info

Publication number
JPS62161200A
JPS62161200A JP61002940A JP294086A JPS62161200A JP S62161200 A JPS62161200 A JP S62161200A JP 61002940 A JP61002940 A JP 61002940A JP 294086 A JP294086 A JP 294086A JP S62161200 A JPS62161200 A JP S62161200A
Authority
JP
Japan
Prior art keywords
block
boundary
memory
input
standard pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61002940A
Other languages
Japanese (ja)
Other versions
JPH0355836B2 (en
Inventor
誠夫 亘理
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61002940A priority Critical patent/JPS62161200A/en
Publication of JPS62161200A publication Critical patent/JPS62161200A/en
Publication of JPH0355836B2 publication Critical patent/JPH0355836B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は連続音声認識装置に関し、特に文法に従って連
続発声された文音声を高速認識する高認識率の連続音声
認識装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a continuous speech recognition device, and more particularly to a continuous speech recognition device with a high recognition rate that rapidly recognizes sentence speech continuously uttered according to grammar.

〔従来の技術〕[Conventional technology]

音声認識装置の中でも文法に従って発声された文音声を
認識する装置は、計算機プログラムや限定業務用文章あ
るいは航空管制や各種機器の制御用指令などの認識がで
き広範囲な応用分野を有している。文法の拘束が与えら
れている場合には、その文法規則を利用することによっ
て誤認識を防止できることが原理的に知られている。特
に連続数字認識において入力音声に桁数の制約がある場
合、その制約を規則化することにより認識率を改善する
ことができる。
Among voice recognition devices, devices that recognize sentence sounds uttered according to grammar can recognize computer programs, texts for limited business use, commands for air traffic control and control of various devices, and have a wide range of applications. It is known in principle that when grammatical constraints are given, misrecognition can be prevented by using the grammatical rules. In particular, when there is a restriction on the number of digits in input speech in continuous number recognition, the recognition rate can be improved by regularizing the restriction.

このような文法に従って連続に発声された文音声を認識
する手法が同一出願人による特顯昭58−239303
号明細曹「連続音声認識装置」に記載されている。この
原理であるブロックワイズDPマツチング法は大路次の
ようである。文法をオートマンαで表現し、そのオート
マンαを次のように定義する。
A method for recognizing sentence sounds continuously uttered according to such a grammar is proposed in Japanese Patent Application No. 58-239303 by the same applicant.
It is described in the specification ``Continuous speech recognition device''. The blockwise DP matching method based on this principle is as follows. The grammar is expressed by an automan α, and the automan α is defined as follows.

α=<K、Σ、Δ+  PO+  ”>  ・・・・・
・・・・(1)ここで、K:状態pの集合(p l p
=l、 2.・・・π)Σ:入力単語n(7)集合(n
 l n =1.2.−N)Δ:状態遷移規則((p、
 q、 n))ここで、(p、q、n)はp→qなる 状態遷移を意味する。
α=<K, Σ, Δ+ PO+ ”> ・・・・・・
...(1) Here, K: set of states p (p l p
=l, 2. ...π) Σ: Input word n (7) set (n
l n =1.2. -N) Δ: State transition rule ((p,
q, n)) Here, (p, q, n) means a state transition from p to q.

Po:初期状態、以後はp=Qで示す。Po: initial state, hereinafter expressed as p=Q.

F:最終状態集合 FCK 次に前記オートマトンαに従って単語nεΣを連続して
発声して得られる音声パタンAをA =: a 1. 
a 2.・・・・・・ai、・・・・・・al  ・・
・・・・■で示し、これを(未知)入力パタンと呼ぶ。
F: Final state set FCK Next, the speech pattern A obtained by continuously uttering the word nεΣ according to the automaton α is A =: a1.
a2. ...ai, ...al...
... is indicated by ■ and is called an (unknown) input pattern.

各単語nεΣに対して標準的なパタン Bn=b¥ b2.。・・・・・・bjrI、・・・・
・・b−・・・・・・(3)を用意し、これを単語標準
パタンと呼ぶ。この単語標準パタンBnをオートマトン
αに従って接続することによって得られる連続音声標準
パタンC=Bn 1  nI’12  ・・・・・・B
n Xと入力パタンAとのDPマツチングを行い、2つ
のパタンの相互に異なる度合を表わす量(以下相異度と
称する)を算出し、最小の相異度を与える単語系列を認
識結果とする。
Standard pattern Bn=b\b2 for each word nεΣ. . ...bjrI,...
・・b−・・・・(3) is prepared and is called a word standard pattern. Continuous speech standard pattern C=Bn 1 nI'12 . . . B obtained by connecting this word standard pattern Bn according to the automaton α
Perform DP matching between n .

ここで最小の相異度を次のような動的計画の手法で求め
る。初期条件を とし、b=1よシI/BL(ここでI/BLは説明の簡
単のため割り切れるものとする)まで順次(5)。
Here, the minimum degree of dissimilarity is found using the following dynamic programming method. Set the initial condition, and proceed sequentially from b=1 to I/BL (here, I/BL is assumed to be divisible for ease of explanation) (5).

(6)式の境界条件を基に(7)、 (8)式の漸化式
を(p。
Based on the boundary condition of equation (6), the recurrence equations of equations (7) and (8) are calculated as (p).

q、n)εΔなるすべての対(p、n)について計算す
る。すなわち状態pとの境界条件をi=i、。
Calculate for all pairs (p, n) such that q, n) εΔ. That is, the boundary condition with state p is i=i.

・・・鴨について とし、ブロックb−1との境界条件をj=1.・・・。...About ducks and the boundary condition with block b-1 is j=1. ....

Jnなる各標準パタン時刻jについて とし、順化式 %式%(7) []) ただしく倒仝)は(7)式の右辺における最小のg(i
For each standard pattern time j called Jn, the acclimatization formula % formula % (7) [ ]
.

j)を与える(i、j)である。j) which gives (i, j).

を入力パタン時刻i=1.よりieまで計算する。ここ
でd(i、j)は入力パタンの時刻iにおける特徴ベク
トルaiと標準パタンの時刻jにおける特徴ベクトルb
、との間の距離である。   ′d(i、 j)=Di
s(ai、 bρ      ・・・(9)次のブロッ
クの計算のため前記計算結果の境界値を格納する。
Input pattern time i=1. Calculate up to ie. Here, d(i, j) is the feature vector ai at time i of the input pattern and the feature vector b at time j of the standard pattern.
, is the distance between . 'd(i, j)=Di
s(ai, bρ...(9) Store the boundary value of the calculation result for calculation of the next block.

(6)、  (7)、  (8)、(10)式の計算が
標準パタン時刻j=Jnまで終了した後、単語境界にお
ける最小化とじてを計算する。
After the calculations of equations (6), (7), (8), and (10) are completed up to the standard pattern time j=Jn, the minimization end at the word boundary is calculated.

以上述べた(7)、(8)式の漸化式計算は、第2図(
説明図)に示すように入力パタンのBLフレーム分をプ
ロソ化してブロックごとに実行している。
The recurrence formula calculation of equations (7) and (8) described above is shown in Figure 2 (
As shown in the explanatory diagram), the BL frame portion of the input pattern is converted into a processor and executed for each block.

最後に、入力パタンの認識結果は判定処理として次のよ
うな手続きにより求められる。
Finally, the recognition result of the input pattern is determined by the following procedure as a determination process.

初期条件 Q= argmin CT (1,q ) 
)  −(12)qεF q=分lm=1     ・・・(13)を求める。
Initial condition Q= argmin CT (1, q)
) −(12) qεF q=min lm=1 (13) is determined.

もし分〉Oならばq=分2m=分として(14)式を繰
り返す。全=0ならば終了。
If minutes>O, repeat equation (14) with q=minutes 2m=minutes. If all = 0, end.

以上説明した方法の漸化式(7)は第3図(a)に示す
径路に沿って計算される。このため、入力パタンと標準
パタンの時間軸の対応は、1/2から2倍までの伸縮に
制限されている。このことを「傾斜制限」と呼んでおり
、局所的に不自然な時間軸の対応を排除している。この
傾斜制限を用いることにより認識率を高くすることが可
能である。
The recurrence formula (7) of the method described above is calculated along the path shown in FIG. 3(a). Therefore, the correspondence between the input pattern and the standard pattern on the time axis is limited to expansion/contraction from 1/2 to 2 times. This is called "tilt restriction" and eliminates locally unnatural time axis correspondences. By using this slope restriction, it is possible to increase the recognition rate.

しかしながら漸化式(7)を使用する場合はワークメモ
リG1(p、 n、 j)、 H□(p、 n、 j)
、 o2(p、 n、 j)。
However, when using recurrence formula (7), the work memory G1 (p, n, j), H□ (p, n, j)
, o2(p, n, j).

H2(pl nl J)が必要である。さらに演算部と
ワークメモリ間のデータ転送((6)、  (10)式
に相当)が必要である。すなわち、漸化式(7)を使用
する場合はワークメモリが大きくなり、かつデータ転送
が多くなる欠点がある。
H2(pl nl J) is required. Furthermore, data transfer (corresponding to equations (6) and (10)) between the calculation unit and the work memory is required. That is, when using the recurrence formula (7), there is a drawback that the work memory becomes large and data transfer increases.

一方、ブロックワイズDPマツチング法において傾斜制
限のない漸化式を使用することが可能である。この場合
第3図υ)に示す径路に沿って計算される。このDPマ
ツチングの計算の手順は前記(4)、〜(14)式と同
様に行われるが、初期灸件として(4)式の代わりに(
15)式を用い、 ブロックb−1との境界条件として(6)式の代わりに
(16)式を用い、 漸化式として(’7:式の代わりに(17)式を用い、
(10)式の代わりに(18)式を用いる。
On the other hand, it is possible to use a recurrence formula without slope restrictions in the blockwise DP matching method. In this case, the calculation is performed along the path shown in Fig. 3 υ). The calculation procedure for this DP matching is performed in the same manner as the above equations (4) to (14), but as the initial moxibustion condition, instead of equation (4), (
Using equation (15), using equation (16) instead of equation (6) as the boundary condition with block b-1, using equation (17) instead of equation ('7:) as the recurrence equation,
Formula (18) is used instead of formula (10).

以上説明した傾斜制限なしの漸化式(17)を用いる方
法では傾斜制御ありの漸化式(7)を用いる方法に比較
して、ワークメモリが1/2に減少でき、さらにデータ
転送も1/2に減少できる。
The method using the recurrence formula (17) without slope restriction described above can reduce the work memory to 1/2 compared to the method using the recurrence formula (7) with slope control, and data transfer can also be reduced to 1/2. /2.

しかしながら、傾斜制限がないため人力パタンと標準パ
タンの時間軸の対応が不自然になることが許されておシ
、誤認識の原因となっている。
However, since there is no slope limit, the correspondence between the time axes of the manual pattern and the standard pattern is allowed to become unnatural, causing misrecognition.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

上述した従来の連続音声認識装置では、傾斜制限ありの
漸化式を用いる場合はワークメモリが大きくかつデータ
転送が多いという欠点がある。一方、傾斜制限なしの漸
化式を用いる場合は誤認識が多いという欠点がある。
The above-mentioned conventional continuous speech recognition apparatus has the disadvantage that when using a recurrence formula with slope restriction, the work memory is large and data transfer is frequent. On the other hand, when using a recurrence formula without slope restrictions, there is a drawback that there are many erroneous recognitions.

本発明の目的は前記欠点を解消し、ワークメモリが小さ
くかつデータ転送が少なく、また認識率の高い連続音声
認識装置を提供することにある。
SUMMARY OF THE INVENTION It is an object of the present invention to provide a continuous speech recognition device which eliminates the above-mentioned drawbacks, has a small work memory, requires little data transfer, and has a high recognition rate.

〔問題点を解決するための手段〕[Means for solving problems]

本発明・の連続音声認識装置は入力パタンを格納する入
力パタンメモリ部と、標準パタンを格納する標準パタン
メモリ部と、単語nの入力によって状態遷移p −+ 
qが生じることを意味する規則(p。
The continuous speech recognition device of the present invention includes an input pattern memory section that stores input patterns, a standard pattern memory section that stores standard patterns, and a state transition p −+ according to the input of word n.
A rule that means that q occurs (p.

q、n)群である状態遷移テーブルΔと最終状態群Fと
を記憶するオートマトン記憶部と、状態pと単語nによ
り指定された状態遷移において入力パタン時刻iと標準
パタン時刻jで定められる′・貝域内で人力パタンBL
フレームの幅を持つブロックb内の各点(i、j)の入
力パタンの特徴ベクトルと標準パタンの特徴ベクトル間
の距離d(i、j)を求める距離計算部と、前記ブロッ
クbと1つ前のブロックb−1との境界部分のDPマツ
チング計算を第1の漸化式を用いて求める境界DP計算
部と、前記ブロックbの内部のDPマツチング計算を第
2の順化式を用いて求める本体DP計算部と、前記境界
DP計算部と本体DP計算部で求められた最小累積距離
が得られる単語の組合せを定める判定部とを備えている
q, n) group, which is a state transition table Δ and a final state group F, and a state transition designated by a state p and a word n, which is determined by an input pattern time i and a standard pattern time j'.・Manual pattern BL within the shellfish area
a distance calculation unit that calculates the distance d(i, j) between the feature vector of the input pattern and the feature vector of the standard pattern at each point (i, j) in block b having the width of a frame; a boundary DP calculation unit that calculates a DP matching calculation at a boundary portion with the previous block b-1 using a first recurrence formula; and a boundary DP calculation unit that calculates a DP matching calculation inside the block b using a second recurrence formula. The present invention includes a main body DP calculating section for calculating the body DP, and a determining section that determines a combination of words that yields the minimum cumulative distance calculated by the boundary DP calculating section and the main body DP calculating section.

〔作用〕[Effect]

次に本発明の作用について第4図を参照しながら説明す
る。
Next, the operation of the present invention will be explained with reference to FIG.

第4図は本発明の詳細な説明するだめの図である。FIG. 4 is a detailed illustration of the present invention.

本発明の原理のDPマツチングの計算は、ブロックの境
界部分では傾斜制限のない漸化式を使用し、ブロック内
部では傾斜制限ありの漸化式を使用して進められる。
The calculation of DP matching according to the principle of the present invention proceeds by using a recurrence formula without a slope restriction at the boundary of a block, and using a recurrence formula with a slope restriction inside the block.

初期条件を とし、ブロックb=1よりI/BLまで順次次の(20
)、 (21)式の境界条件を基に(22)〜(25)
式の漸化式を(p、q、n)εΔなる対(p、n)につ
いて計算する。すなわち状態pとの境界条件を1=i3
.・・・、1eについて ただし一部(b−1)・BL+ 1 、  r e=b
−BLとし、ブロックb−1との境界条件をj=1.・
・・。
The initial conditions are set as the following (20
), based on the boundary condition of equation (21), (22) to (25)
A recurrence formula of the equation is calculated for the pair (p, n) such that (p, q, n) εΔ. In other words, the boundary condition with state p is 1=i3
.. ..., but for 1e, part (b-1)・BL+ 1, r e=b
-BL, and the boundary condition with block b-1 is j=1.・
....

J なる標準パタン時刻jについて とし、ブロックの境界部分を求める第1の漸化式%式%
(22) ただしく仝小)は(22)式の右辺における最小を与え
る(i、j)である。
The first recurrence formula % formula % for calculating the block boundary part is given as standard pattern time j.
(22) (provided that it is small) is (i, j) that gives the minimum on the right side of equation (22).

を計算し、続いてブロックの本体を求める第2の・・・
(24) h(i、 j)=h(仝、仝)      ・−・(2
5)ただしく仝、仝)は(24)式の右辺における最小
を与える(i、j)である。
and then the second... which calculates the body of the block.
(24) h(i, j)=h(仝,仝) ・−・(2
5) However, 仝 and 仝) are (i, j) that give the minimum on the right side of equation (24).

をt =1. + 1よシieまで計算する。t = 1. Calculate +1 to Cie.

次のブロックの計算のため前記計算結果の境界値を格納
する。
The boundary value of the calculation result is stored for calculation of the next block.

(21)、〜(25)式の計算が標準パタン時刻j=J
n−jで終了した後、単語境界における最小化としてi
=i ・・・、  Ieについて BL を計算する。最後に、入力パタンの認識結果は判定処理
として従来方法と同様の手続き、すなわち(12)、 
(13)、 (14)式より求められる。
Calculation of formulas (21) to (25) is standard pattern time j = J
After terminating at n-j, i as a minimization at a word boundary
=i..., calculate BL for Ie. Finally, the recognition result of the input pattern is determined using the same procedure as the conventional method, namely (12),
It is obtained from equations (13) and (14).

〔実施例〕〔Example〕

次に、本発明について第1図、第5図、〜第10図を用
いて詳細に説明する。
Next, the present invention will be explained in detail using FIGS. 1, 5, to 10.

第1図は本発明の連続音声認識装置の一実施例。FIG. 1 shows an embodiment of the continuous speech recognition device of the present invention.

を示すブロック図、第5図、第6図、第7図、第8図は
それぞれ第1図の実施例の一部詳細構成を示す部分ブロ
ック図、第9図は第1図における動作の時間関係を示す
タイムチャート、第10図(a)。
FIG. 5, FIG. 6, FIG. 7, and FIG. 8 are partial block diagrams each showing a detailed configuration of a part of the embodiment in FIG. 1, and FIG. 9 is a block diagram showing the operation time in FIG. 1. A time chart showing the relationship, FIG. 10(a).

〜(d)は第1図における動作の流れを示すフローチャ
ートである。
-(d) are flowcharts showing the flow of operations in FIG.

標準パタンメ七り部130には単語セットΣに含まれる
単語nの標準パタンBが記憶されており、オートマトン
記憶部230には状態遷移規則(p。
The standard pattern memory section 130 stores the standard pattern B of the word n included in the word set Σ, and the automaton storage section 230 stores the state transition rule (p.

q、n)と最終状態Fの指定情報が記憶されている。q, n) and the designation information of the final state F are stored.

マイクロホン100より未知入力音声が入力されると入
力部110によって周波数分析がなされ特徴を示すベク
トルa1に変換され順次大カパタ/メモリ部120に送
られる。また、入力部110には音声レベルを検知する
ことによって音声区間を決定する機能が与えられており
、音声区間中では「1」その他では「0」なる音声区間
信号Sを発生する。制御部240は、この音声区間信号
Sの立上りの時刻において初期化パルス5ETIを発生
する。これによって第10図(a)のブロック1゜に対
応する初期化がGメモリ150とTメモリ200に対し
てなされる。
When an unknown input voice is input from the microphone 100, the input section 110 performs frequency analysis, converts it into a vector a1 representing characteristics, and sequentially sends it to the large capata/memory section 120. The input unit 110 is also provided with a function of determining a voice section by detecting the voice level, and generates a voice section signal S that is "1" during the voice section and "0" otherwise. The control unit 240 generates the initialization pulse 5ETI at the time when the voice section signal S rises. As a result, initialization corresponding to block 1° in FIG. 10(a) is performed on the G memory 150 and the T memory 200.

以上の初期化が終了すると、以後のBLフレーム分の入
力特徴aiの入力に同期して入力パタンブロック信号す
が1,2・・・・・・と計数される。この入力パタンブ
ロックbにおいて制御部240よりの単語指定信号nは
1からNまで変化する。各単語nにおいてオートマトン
記憶部230中の状態テーブルが参照され、またその単
語nと状態pにて規定される状態指定信号qも出力され
る。
When the above initialization is completed, the input pattern block signals are counted as 1, 2, . . . in synchronization with the input of the input features ai for the subsequent BL frames. In this input pattern block b, the word designation signal n from the control section 240 changes from 1 to N. For each word n, the state table in the automaton storage section 230 is referred to, and a state designation signal q defined by the word n and state p is also output.

次に単語n、状態pなる1サイクル内の動作を説明する
。この1サイクルによって第2図に図示した斜線部分の
計算が実行される。すなわち(20)。
Next, the operation within one cycle of word n and state p will be explained. In this one cycle, calculations shown in the shaded area in FIG. 2 are executed. That is (20).

(21)式の境界条件のもとて(22)、〜(25)式
を計算する。初めに制御部240よりの信号5ET2に
よって、第10図(a)のブロック11.12に対応す
る値のセットがDPマツチング用ワークメモリのgメモ
リ330とhメモリ340に対して行われる。
Based on the boundary condition of equation (21), equations (22) to (25) are calculated. First, a signal 5ET2 from the control unit 240 causes the values corresponding to blocks 11.12 in FIG. 10(a) to be set in the g memory 330 and h memory 340 of the DP matching work memory.

続いて制御部240よりの標準パタン時刻信号jは1か
らJまで変化する。各標準パタン時刻Jにおいて、入力
パタン時刻信号i□はr s (t s =(bl )
・BL+1)よF) 1e(ie=b−BL)まで変化
する。
Subsequently, the standard pattern time signal j from the control section 240 changes from 1 to J. At each standard pattern time J, the input pattern time signal i□ is r s (t s = (bl)
・BL + 1) to F) changes to 1e (ie = b - BL).

i、フレームにおいて第10図の)のブロック13に示
した計算が境界DP計算部310にて行われる。
In frame i, the calculation shown in block 13 in FIG.

第5図は境界DP計算部の一例を示すブロック図である
。初めに入力パタンのi、フレームとir1語の標準パ
タンのjフレームが続み出されて、前記(9)式に示す
ベクトル間距離d(i、j)が距離計算部300にて求
められる。
FIG. 5 is a block diagram showing an example of a boundary DP calculating section. First, the i frame of the input pattern and the j frame of the standard pattern of the ir1 word are successively extracted, and the inter-vector distance d(i, j) shown in equation (9) is determined by the distance calculation unit 300.

一方、境界DP計算部310では、距離計算と並列して
3つの相異度の最小値が求められる。すなわち、gメモ
リ330よりg(iS  ’ ! J ) + g (
1゜−1,j−1,g< i、−1,j−2)とhメモ
リ340よシh (is  11 J )T h(i5
  L J−1)+ h(’S−1、j−2)が読み出
され、レジスタGl、 G2゜G3とHl、H2,H3
にそれぞれ格納される。
On the other hand, the boundary DP calculation unit 310 calculates the minimum value of the three dissimilarities in parallel with the distance calculation. That is, from the g memory 330, g(iS'!J) + g(
1゜-1,j-1,g<i,-1,j-2) and h memory 340 h(is 11 J) Th(i5
L J-1) + h('S-1, j-2) is read out and registers Gl, G2゜G3 and Hl, H2, H3
are stored in each.

比較回路312は3つのレジスタGl、  G2.G3
から最小値を検出し、その最小値が得られたレジスタG
 n (nは1. 2. 3のどれか)に対応したレジ
スタHnを選択するゲート信号台を発する。
The comparison circuit 312 includes three registers Gl, G2. G3
Detect the minimum value from the register G from which the minimum value was obtained.
A gate signal is issued to select the register Hn corresponding to n (n is one of 1, 2, or 3).

前記ゲート信号番により選択されたレジスタHnの内容
がhメモリ340のh(輸、j)へ書き込まれる。また
、比較回路312より出力された最小値g(i、−1,
仝)は前記距離計算部300で求められた距離d(−、
j)と加算器311によって加算され、gメモリ330
0g(−、j)へ曹き込まれる。
The contents of the register Hn selected by the gate signal number are written to h (transport, j) of the h memory 340. Furthermore, the minimum value g(i, -1,
) is the distance d(-,
j) and the adder 311, and the g memory 330
It is added to 0g(-,j).

続いて各入力パタン時刻i(iはi+1よシieまで変
化する)において、第10図中)のブロック14に示し
た計算が本体DP計算部320で行われる。
Subsequently, at each input pattern time i (i changes from i+1 to ie), the calculation shown in block 14 in FIG. 10 is performed in the main body DP calculation section 320.

第6図は本体DP計算部の一例を示すブロック図である
。初めに入力パタンのiフレームが読み出されて、(9
)式に示すベクトル間の距離を距離計算部300で求め
、d(i、j)が得られる。
FIG. 6 is a block diagram showing an example of the main body DP calculating section. First, the i-frame of the input pattern is read out and (9
) The distance between the vectors shown in the equation is calculated by the distance calculation unit 300, and d(i, j) is obtained.

一方、本体DP計算部320では距離計算と並列して(
24)式の第2の漸化式の右辺の最小値が求められる。
On the other hand, the main body DP calculation unit 320 performs (
24) The minimum value of the right-hand side of the second recurrence formula is found.

すなわち、gメモリ330より読み出されたg(i−2
,j−1)と、遅延回路324にて1時刻遅延された距
離d(i−1,j)が加算器323にて加算されレジス
タG1に格納される。
That is, g(i-2
, j-1) and the distance d(i-1, j) delayed by one time in the delay circuit 324 are added in the adder 323 and stored in the register G1.

また、gメモリ330よりg(i−1,j−1)とg(
i−1,j−2)が読み出されレジスタG2.G3にそ
れぞれ格納される。さらに、hメモリ340よりh(i
−2,j−1)、h(i−1゜j−1)、  h(i−
1,j−2)が読み出されレジスタH1,H2,H3に
それぞれ格納される。
Also, from the g memory 330, g(i-1, j-1) and g(
i-1, j-2) are read out and register G2. Each is stored in G3. Furthermore, from the h memory 340, h(i
-2, j-1), h(i-1゜j-1), h(i-
1, j-2) are read out and stored in registers H1, H2, and H3, respectively.

比較回路322は3つのレジスタGl、 G2゜G3よ
り最小値を検出し、その最小値が得られたレジスタGo
 (Oは1. 2. 3のどれか)に対応△     
         △ したレジスタHnft選択するゲート信号nを発す△ る。前記ゲート信号nによ#)選択されたレジスタH合
の内容がhメモリ340のh(i、j)へ書き込まれる
。また、比較回路322よシ出力された最小値は前記距
離計算部300で求められた距離d(i、j)と加算器
321によって加算され、gメモリ330のg(i、j
)へ書き込まれる。
The comparison circuit 322 detects the minimum value from the three registers G1, G2 and G3, and selects the register Go from which the minimum value was obtained.
(O corresponds to 1. 2. 3) △
△ Generates a gate signal n that selects the selected register Hnft. The contents of the register H selected by the gate signal n are written to h(i, j) of the h memory 340. Further, the minimum value output from the comparator circuit 322 is added to the distance d(i, j) obtained by the distance calculating section 300 by the adder 321, and
) is written to.

入力パタン時刻iが! +1からieまで変化されるこ
とによって標準パタン時刻jに対する処理が終了する。
Input pattern time i is! By changing from +1 to ie, the processing for standard pattern time j ends.

さらに標準パタン時刻jが終端J となった後、第10
図(b)のブロック15に示すように信号SET 3に
従って漸化式(24)の結果g(ie、j)。
Furthermore, after the standard pattern time j becomes the terminal J, the 10th
The result g(ie,j) of the recurrence equation (24) according to the signal SET 3 as shown in block 15 of figure (b).

h(ie、j)をテーブルメモリG(p、n、j)。h(ie, j) in table memory G(p, n, j).

H(p、  n、  j )へ格納する。つづいて制御
部240よシ発せられた信号12(i からIeまで叢
化する)に従って第10図(C)のブロック16に示し
た比較が行われる。すなわち第7図に示すように、信号
12とqに従ってテーブルメモIJ 200よりT(i
、q)とgメモリ330よりg(i、J>が読み出され
、比較回路170により比較しT(i、  q )>g
 (i、、r)の場合wp倍信号発せられ、g(i、J
n)、 n、  I)、  h(i、Jn)カフ−7’
k)モリ T(i、   q )、   N(i、  
 q)、   p(i、   q)。
Store in H(p, n, j). Subsequently, the comparison shown in block 16 of FIG. 10(C) is performed according to the signal 12 (complexed from i to Ie) issued by the control section 240. That is, as shown in FIG. 7, T(i
, q) and g(i, J> are read from the g memory 330, and compared by the comparison circuit 170, T(i, q)>g
If (i,, r) then wp times the signal is emitted and g(i, J
n), n, I), h(i, Jn) cuff-7'
k) Mori T(i, q), N(i,
q), p(i, q).

L(i、q)へ書き込まれる。written to L(i,q).

以上の動作によって状態p、単単語n大入カパタンブロ
ックの処理が終了する。さらに状態指定信号pがpoか
らπと変化されることにより単語指定信号nに対する処
理が終了する。さらに単語指定信号nが1からNまで変
化されることにより入力パタンブロックbに対する処理
が終了する。入力パタンブロック信号がI/BLとなっ
た後に、(12)。
With the above operations, the processing of the state p and single word n large input Kapatan block is completed. Further, the state designation signal p is changed from po to π, thereby completing the processing for the word designation signal n. Furthermore, the word designation signal n is changed from 1 to N, thereby completing the processing for the input pattern block b. After the input pattern block signal becomes I/BL, (12).

(13)、 (14)式に示した判定処理が開始される
The determination process shown in equations (13) and (14) is started.

判定部220は第8図に示すように構成され、初めに第
10図(d)のブロック17の処理として、オートマト
ン記憶部230から最終状態集合Fに含まれる状態qを
信号q3に従って順次指定され、Tメモリ200よりT
(I、q)を読み出し、比較回路221.最小値レジス
タ222.状態レジスタ223を用いて最小のT(I、
q)が与えられる状態令を得る。続いて第10図(d)
のブロック18の処理として判定制御部227はqJ、
m=工としてアドレス信号m3.qをNメモリ190゜
Lメモリ210.Pメモリ180へ発しN (m。
The determination unit 220 is configured as shown in FIG. 8, and first, as the process of block 17 in FIG. , T from T memory 200
(I, q) is read and the comparison circuit 221. Minimum value register 222. Using the state register 223, the minimum T(I,
q) obtains the state command given. Next, Figure 10(d)
As the process of block 18, the determination control unit 227 determines qJ,
Address signal m3. q is N memory 190°L memory 210. P is sent to memory 180 and N (m.

q)、L(m、q)、P(m、q)を読み出す。q), L(m, q), and P(m, q).

このL(m、q)とP(m、q)は次の時刻mと状態q
となり、N(m、q)は認識結果として出力される。こ
の処理を分が零になるまで繰り返すことにより順次認識
結果が得られる。
These L(m, q) and P(m, q) are the next time m and state q
Then, N(m, q) is output as the recognition result. By repeating this process until the minutes become zero, recognition results can be obtained sequentially.

以上、本発明の構成を実施例にもとづいて説明したが、
これらの記載は本発明の権利範囲を限定するものではな
い。
The configuration of the present invention has been described above based on examples, but
These descriptions do not limit the scope of the present invention.

本実施例では特願昭58−239303明細書に記載し
ているようなブロックワイズDPマツチング法をもとに
説明しているが、入力パタンの複数フレームをまとめて
ブロック化してDPマツチングを実行する方法であるな
らば、本発明の原理であるブロック境界部分とブロック
本体部分を異なる漸化式で実行することが可能である。
This example is explained based on the blockwise DP matching method as described in the specification of Japanese Patent Application No. 58-239303, but DP matching is executed by grouping multiple frames of the input pattern into blocks. If it is a method, it is possible to implement the block boundary portion and the block body portion, which are the principles of the present invention, using different recurrence formulas.

すなわち、特願昭59−067116明細書に記載され
ている修正DPマツチング計算部をもつブロックワイズ
Dl)法特願昭59−068015明細吉に記載さnて
いるブロックを標準パタン軸に対して斜めに傾けた斜め
ブロックワイズDP法、特願昭59−267830明細
書に記載されている標準パタン長によってブロック幅を
変化させる可変斜めブロックワイズDP法などにも本発
明の原理であるブロック境界部分は第1の順化式を使用
し、ブロック本体部分は第2の順化式を使用することが
できる。
In other words, the blockwise Dl) method having the modified DP matching calculation section described in the specification of Japanese Patent Application No. 59-067116, the block described in the specification of Japanese Patent Application No. 59-068015 is diagonally relative to the standard pattern axis. The block boundary portion, which is the principle of the present invention, can also be applied to the diagonal block width DP method tilted to A first acclimation formula can be used, and the block body portion can use a second acclimation formula.

さらにブロック境界部分を求める第1の漸化式として(
22)式を用いているが、入力パタン時刻iとi−1の
みを使用する漸化式であるならばどのような形でもよい
。例えば でもよいし、また でもよい。
Furthermore, as the first recurrence formula for calculating the block boundary part (
Although Equation 22) is used, any form may be used as long as it is a recurrence equation that uses only input pattern times i and i-1. For example, or again.

またブロック本体部を求める第2の漸化式として(24
)式を朗用しているが、例えば・・・(30) ・・・(31) などを用いてもよいことは明白である。
Also, as the second recurrence formula for calculating the block body, (24
) formula is used, but it is clear that, for example, ... (30) ... (31) etc. may also be used.

〔発明の効果〕〔Effect of the invention〕

以上説明したように本発明は、DPマツチングの各ブロ
ックの計算において境界部分の順化式を入力パタン時刻
iとi −1のみを使用することによってワークメモリ
G、  Hを小さくすることができ、またデータ転送量
も小さくすることができる。さらに各ブロックの本体の
漸化式は傾斜制御のある形式をとり、これにより誤認識
率も小さくできる効果がある。
As explained above, the present invention can reduce the work memories G and H by using only the input pattern times i and i-1 for the adaptation equation of the boundary part in the calculation of each block of DP matching, Furthermore, the amount of data transferred can also be reduced. Furthermore, the recurrence formula for the main body of each block takes a form with tilt control, which has the effect of reducing the false recognition rate.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の連続音声認識装置の一実施例を示すブ
ロック図、第2図、第3図、第4図は本発明の詳細な説
明するための図、第5図、第6図第7図、第8図はそれ
ぞれ第1図の実施例の一部詳細構成を示す部分ブロック
図、第9図は第1図における動作の時間関係を示すタイ
ムチャート、第10図(a)〜(d)は第1図における
動作の一連の流れを示すフローチャートである。 100・・・・・・マイクロホン、110・・・・・・
入力部、120・・・・・・入力パタンメモリ部、13
0・・・・・・標準パタンメモリ部、150・・・・・
・Gメモリ、160・・・・・・Nメモリ、170・・
・・・・比較回路、180・・・・・・Pメモリ、19
0・・・・・・Nメモリ、200・・・・・・TメモI
J、210・・・・・・LメモIJ、220・・・・・
・判定部、230・・・・・・オートマトン記憶部、2
40・・・・・・制御部、300・・・・・・距離計算
部、310・・・・・・境界DP計計部部320・・・
・・・本体DP計計部部330・・・・・・gメモリ、
340・・・・・・hメモリ〇代理人 弁理士  内 
原   1、。 %z図 入カバグレA          n、L第3図   
    第4.舅 (皮) ¥左閏 %を回 )η 7 ブ イ) / ア (、I    ’jsLs+1.,6 6.、’所C/
θ t21  律) ¥710図(bう
FIG. 1 is a block diagram showing an embodiment of the continuous speech recognition device of the present invention, FIGS. 2, 3, and 4 are diagrams for explaining the invention in detail, and FIGS. 5 and 6 7 and 8 are partial block diagrams showing a part of the detailed configuration of the embodiment shown in FIG. 1, FIG. 9 is a time chart showing the time relationship of the operations in FIG. 1, and FIGS. (d) is a flowchart showing a series of operations in FIG. 1. 100...Microphone, 110...
Input section, 120...Input pattern memory section, 13
0...Standard pattern memory section, 150...
・G memory, 160...N memory, 170...
...Comparison circuit, 180...P memory, 19
0...N memory, 200...T memo I
J, 210...L memo IJ, 220...
- Judgment unit, 230... Automaton storage unit, 2
40...Control unit, 300...Distance calculation unit, 310...Boundary DP measurement unit 320...
...Main body DP meter section 330...g memory,
340・・・・・・h memory〇 agent patent attorney
Hara 1. Coverage with %z diagram A n, L Figure 3
4th. Father-in-law (skin) ¥ left leap % times) η 7 buoy) / A(, I 'jsLs+1., 6 6., 'place C/
θ t21 law) ¥710 figure (b u

Claims (1)

【特許請求の範囲】[Claims] 有限状態オートマトンにより指定される単語列を連続に
発声した音声を標準パタンとDPマッチングすることに
より認識する連続音声認識装置において、入力パタンを
格納する入力パタンメモリ部と、標準パタンを格納する
標準パタンメモリ部と、単語nの入力によって状態遷移
p→qが生じることを意味する規則(p、q、n)群で
ある状態遷移テーブルΔと最終状態群Fとを記憶するオ
ートマトン記憶部と、状態pと単語nにより指定された
状態遷移において入力パタン時刻iと標準パタン時刻j
で定められる領域内で入力パタンBLフレームの幅を持
つブロックb内の各点(i、j)の入力パタンの特徴ベ
クトルと標準パタンの特徴ベクトル間の距離d(i、j
)を求める距離計算部と、前記ブロックbと1つ前のブ
ロックb−1との境界部分のDPマッチング計算を第1
の漸化式を用いて求める境界DP計算部と、前記ブロッ
クbの内部のDPマッチング計算を前記第1の漸化式と
は異なる第2の漸化式を用いて求める本体DP計算部と
、前記境界DP計算部と本体DP計算部で求められた最
小累積距離が得られる単語の組合せを定める判定部とを
備えることを特徴とする連続音声認識装置。
In a continuous speech recognition device that recognizes speech in which a string of words specified by a finite state automaton is continuously uttered by performing DP matching with a standard pattern, there is provided an input pattern memory section that stores an input pattern, and a standard pattern memory section that stores the standard pattern. a memory unit, an automaton storage unit that stores a state transition table Δ and a final state group F, which are a group of rules (p, q, n) that mean that a state transition p → q occurs due to the input of a word n; Input pattern time i and standard pattern time j at state transition specified by p and word n
The distance d(i, j
) and the DP matching calculation for the boundary between the block b and the previous block b-1.
a boundary DP calculation unit that calculates the internal DP of the block b using a recurrence formula; a main body DP calculation unit that calculates the internal DP matching of the block b using a second recurrence formula different from the first recurrence formula; A continuous speech recognition device comprising: the boundary DP calculation unit; and a determination unit that determines a combination of words that yields the minimum cumulative distance determined by the main body DP calculation unit.
JP61002940A 1986-01-10 1986-01-10 Continuous voice recognition equipment Granted JPS62161200A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61002940A JPS62161200A (en) 1986-01-10 1986-01-10 Continuous voice recognition equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61002940A JPS62161200A (en) 1986-01-10 1986-01-10 Continuous voice recognition equipment

Publications (2)

Publication Number Publication Date
JPS62161200A true JPS62161200A (en) 1987-07-17
JPH0355836B2 JPH0355836B2 (en) 1991-08-26

Family

ID=11543353

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61002940A Granted JPS62161200A (en) 1986-01-10 1986-01-10 Continuous voice recognition equipment

Country Status (1)

Country Link
JP (1) JPS62161200A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014066949A (en) * 2012-09-27 2014-04-17 Univ Of Tokyo Optimum route searching device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014066949A (en) * 2012-09-27 2014-04-17 Univ Of Tokyo Optimum route searching device

Also Published As

Publication number Publication date
JPH0355836B2 (en) 1991-08-26

Similar Documents

Publication Publication Date Title
JP3114468B2 (en) Voice recognition method
JPS60211498A (en) Continuous voice recognition equipment
US5086472A (en) Continuous speech recognition apparatus
JPH09319392A (en) Voice recognition device
JPH0296800A (en) Continuous voice recognizing device
JPS62161200A (en) Continuous voice recognition equipment
JPS61145599A (en) Continuous voice recognition equipment
US4872201A (en) Pattern matching apparatus employing compensation for pattern deformation
JPS62187897A (en) Continuous voice recognition equipment
US4670850A (en) Pattern matching apparatus
JPS60130799A (en) Continuous voice recognition equipment
JPH01138596A (en) Voice recognition equipment
JPS61102698A (en) Standard pattern adaption system
JPS6313099A (en) Continuous voice recognition equipment
SU1594595A1 (en) Device for measuring the measure of similarity of speech images
JPH0577078B2 (en)
Verhasselt et al. Acoustic-phonetic decoding using a transition controlled neural net
JPH0320759B2 (en)
JPS63305397A (en) Unspecified speaker voice recognition equipment
JP2000099071A (en) Speech recognition device and method
JPS58179900A (en) Voice feature pattern preparation apparatus for voice recognition equipment
JPS6283798A (en) Continuous voice recognition equipment
JPH0465397B2 (en)
JPS638886A (en) On-line continuous character recognizing device
JPH01124900A (en) Phoneme identifier