JPS60130799A - Continuous voice recognition equipment - Google Patents

Continuous voice recognition equipment

Info

Publication number
JPS60130799A
JPS60130799A JP58239303A JP23930383A JPS60130799A JP S60130799 A JPS60130799 A JP S60130799A JP 58239303 A JP58239303 A JP 58239303A JP 23930383 A JP23930383 A JP 23930383A JP S60130799 A JPS60130799 A JP S60130799A
Authority
JP
Japan
Prior art keywords
input
word
state
time
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58239303A
Other languages
Japanese (ja)
Inventor
誠夫 亘理
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP58239303A priority Critical patent/JPS60130799A/en
Publication of JPS60130799A publication Critical patent/JPS60130799A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 本発明は連続音声認識装置に関し、特に文法に従って連
続発声された文音声を認識する装置の改良に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a continuous speech recognition device, and more particularly to an improvement in a device that recognizes sentence speech continuously uttered according to grammar.

音声認識装置の中でも文法に従って発声された文音声を
認識する装置は、計算機プログラムや限定業務用文章あ
るいは航空管制や各種機器の制御用指令などの認識がで
き広範囲な応用分野を有している。文法の拘束が与えら
れている場合には、その文法規則を利用することによっ
て誤認識を防止できることが原理的に知られている。特
に連続数字認識において、入力音声に桁数の制約がある
場合、その制約を規則化することにより認識率を改善す
ることができる。
Among voice recognition devices, devices that recognize sentence sounds uttered according to grammar can recognize computer programs, texts for limited business use, commands for air traffic control and control of various devices, and have a wide range of applications. It is known in principle that when grammatical constraints are given, misrecognition can be prevented by using the grammatical rules. Particularly in continuous number recognition, if there is a restriction on the number of digits in the input speech, the recognition rate can be improved by regularizing the restriction.

このような文法に従って連続に発声された文音声を認識
する手法が特願昭56−199098号明細書に記載さ
れている。この原理は大路次のとおりである。文法をオ
ートマトンαて表現し、そのオートマトンαを次のよう
に定義する。
A method of recognizing sentence sounds continuously uttered according to such a grammar is described in Japanese Patent Application No. 199098/1983. The principle behind this is as follows. We express the grammar as an automaton α, and define the automaton α as follows.

α=(K、Σ、Δ+ pa l F) ・・ ・(1)
ここで、K:状態pの集合(plp=1.2.・・・、
π)Σ:入力単語nの集合(n1n=1.2.、、、、
N)Δ:状態遷移規則((p、q、n)) ここで、(p、q、n)はp −> qなる状態遷移を
意味する。
α=(K, Σ, Δ+ pal F) ・・(1)
Here, K: set of states p (plp=1.2...,
π) Σ: Set of input words n (n1n=1.2., , ,
N) Δ: State transition rule ((p, q, n)) Here, (p, q, n) means a state transition of p −> q.

po:初期状態。以後はpニOで示す。po: initial state. Hereinafter, it will be indicated as pniO.

F:最終状態集合 FcK 次に前記オートマトンαに従って単語n6Σを連続して
発声して得られる音声バタンAをA=は1 + a+2
+・・・、a、・・・、a■ ・・・・・・・・・(2
)で示し、これを(未知)入力バタンと呼ぶ。各単語n
EΣに対して標準的なバタン B’=== 1)? 、 Ib; 、 、、、 、 1
b7 、 、、、 、1bシ1.−−−−−1I:3)
を用意し、これを単語標準バタンと呼ぶ。この単語標準
バタンをオートマトンαに従って接続することによって
得られる連続音声標準パタンCニB0゛。
F: Final state set FcK Next, the sound bang A obtained by continuously uttering the word n6Σ according to the automaton α is A=1 + a+2
+・・・、a、・・・、a■ ・・・・・・・・・(2
), and this is called an (unknown) input button. each word n
Standard slam B' === 1) for EΣ? , Ib; , , , , 1
b7 , , , , 1bsi1. ------1I:3)
This is called a word standard slam. A continuous speech standard pattern C2B0゛ is obtained by connecting this word standard batan according to the automaton α.

B1.・・・ Bnxと入力バタンAとのDPマッチン
クを行い、2つのバタンの相互に異なる度合を表わす量
(以下相異度と称する)を算出し、最小の相異度を与え
る単語系列を認識結果とする。
B1. ...Performs DP matching between Bnx and the input button A, calculates the amount representing the degree of mutual difference between the two buttons (hereinafter referred to as the degree of dissimilarity), and recognizes the word sequence that gives the minimum degree of dissimilarity. shall be.

ここで最小の相異度を次のような動的計画の手法でめる
。初期条件 T(0,0)二〇 ’J) (m 、 q )=” 、 m40 、 q”
r。
Here, the minimum degree of dissimilarity is determined using the following dynamic programming method. Initial condition T(0,0)20'J) (m, q)=”, m40, q”
r.

()(p 、 n 、 j )=−・・川・(4)とし
、rrl = lよりIまで順次(5)式の境界条件を
基に(6)式の漸化式を(p、q、n)eΔなるすべて
の対(p、n)について計算する。すなわち、対(p、
n)について境界条件 G(p 、 n 、 o )=’l’(m−1、1) 
)H(p、口、o)=m−1・・・・・・(5)とし、
漸化式 %式%) (6) ただし、 d (jl:= Dis (a−、lb’; )=Σl
 a+nr 6’jr l ・・・(b ]、 )rr
l j = argmin G(p 、 n 、 j’ )
」−2≦3′≦j をj=xよりJ″まで計算し、g(1,h(j)をそれ
ぞれG(p、n、j)、H(p、n、j)へ格納すを最
小とするXを意味している。次に単語の境界における最
小化として iff T(m、q)>G(p、n、Jn) ・−−−
(力then T(m、 q )=GCp 、 n 、
J”)N(m、q)=n P(m、q)=p L(m、 q )=)((p 、 n 、 J”)を計
算する。
() (p, n, j) = -... river (4), and sequentially from rrl = l to I, based on the boundary condition of equation (5), the recursion equation of equation (6) is (p, q , n) eΔ for all pairs (p, n). That is, the pair (p,
For n), the boundary condition G(p, n, o) = 'l'(m-1, 1)
) H (p, mouth, o) = m-1 (5),
Recurrence formula % formula %) (6) However, d (jl:= Dis (a-, lb'; )=Σl
a+nr 6'jr l...(b], )rr
l j = argmin G(p, n, j')
''-2≦3'≦j from j=x to J'' and store g(1, h(j) in G(p, n, j) and H(p, n, j), respectively. It means the minimum X. Next, as a minimization at the word boundary, if T (m, q) > G (p, n, Jn) ・---
(force then T(m, q) = GCp, n,
J”) N(m, q)=n P(m, q)=p L(m, q)=)((p, n, J”).

すなわち、(6)式の漸化式では第1図に示すように標
準バタン軸に沿った縦1列の計算を各対(p。
That is, in the recurrence formula of equation (6), as shown in FIG. 1, calculations in one vertical column along the standard batten axis are performed for each pair (p.

n)について算出し、この縦1列の計算を入力バタン軸
lこ沿って#動させ、終端m = Iまでめる。
n), and move this vertical column of calculations # along the input button axis l until it reaches the terminal m = I.

入力バタンの認識結果は、判定処理として次のような手
続きによりめられる。
The recognition result of the input button is determined by the following procedure as a determination process.

q = argmin (T(I 、 q ) ) ・
・・・・(8)qεF 初期条件 qニq、m−1・・・・・・(9)認識単H
n=N(m、q) −・・−ao)単語始点 lニL(
m、q) 状態遷移 pニP(m、q) もしX>Oならばq=p、r11=4としてU(2)を
繰り返す。n=0ならば終了。 ・・・・・(11)以
上述べた方法では縦1列の5漸化式計算においてすべて
の標準バタンを1回読み出さなIすればならない。また
% G(p、n、j)さ14(p、n、J)を読み、計
算した結果を格納しなぜればならない。
q = argmin (T(I, q)) ・
...(8) qεF Initial condition qniq, m-1...(9) Recognition single H
n=N(m, q) −・・−ao) word starting point lniL(
m, q) State transition pniP(m, q) If X>O, repeat U(2) with q=p and r11=4. If n=0, end. (11) In the method described above, all the standard buttons must be read out once in the calculation of the five recurrence formulas in one vertical column. It is also necessary to read %G(p, n, j) and store the calculated results.

p、nの数が大きくなると標準パタンやO(p。When the numbers of p and n become large, the standard pattern or O(p.

n、j)、)i(p、n、j)は大晴となり、全メモリ
アクセス時間(読み出し1店−き込み時間)は大きくな
る。一方、DPマツチングの繰返し計算。
n, j), )i(p, n, j) becomes clear, and the total memory access time (one read time minus one read time) becomes long. On the other hand, iterative calculation of DP matching.

は複数の演算器で実行可能であり1.演算時間は全メモ
リアクセス時間より小さくすることができる。
can be executed by multiple arithmetic units, and 1. The computation time can be less than the total memory access time.

さらにメモリの読み出し%書き込みと演Bを並列処理す
ることも可能である。この場合、l)Pマツチングの処
理時間は全メモ’J 7クセス時間となり、単語数や状
態数が大きくなるとDPマツチング処理時間が大きくな
る欠点がありた。言いカンえれば一定時間内に処理でき
る単語数や状態数が少ないという欠点があった。
Furthermore, it is also possible to process memory read/write and performance B in parallel. In this case, l) the processing time for P matching is 7 times for all memos, and there is a drawback that as the number of words and states increases, the processing time for DP matching becomes longer. Simply put, the drawback was that the number of words and states that could be processed within a certain amount of time was small.

本発明の目的は、縦1列の漸化式計算を数フレームまと
めてブロック化することにより、標準パタンやG(p、
n、j)、H(p、、n、j)のアクセス回数を減少ざ
ぜ、DPマツチングの処理時間が小さく処理単語数や状
態数の大きい連続音声認識装置を提供することである。
The purpose of the present invention is to create a standard pattern, G(p,
It is an object of the present invention to provide a continuous speech recognition device that can reduce the number of accesses to H(p, , n, j), shorten the processing time for DP matching, and process a large number of words and states.

本発明による連続音声認識装置は、入力音声を特徴の時
系列AニaI1.ab、・・・、all、・・・、a)
I に変換する入力部と、単語セットΣ=(n)の甲の
各車4! nに対して標準バタ7 B″= lb’; 
、lb’; 、 −・−、+b7、−。
The continuous speech recognition device according to the present invention uses input speech as a time series of characteristics A2aI1. ab,..., all,..., a)
I and each car 4 in the instep of the word set Σ=(n)! Standard butter 7 B″=lb′ for n;
, lb'; , -・-, +b7, -.

lb5’、を記憶する標準バタン記憶部と、単語nの入
力によって状態遷移p −+ qが生じることを意味す
る規則(pe q+ n)の群である状態遷移テーブル
Δと雇終状悪の群Fとを記憶するオートマトン記憶部と
、入カバクン時刻τnと状態qとによって番地指定され
るテーブル記憶’I’ (m 、 q ) 、 P(m
、q)、N(m、q)およびL(m、q)と、状態pさ
即語指定nおよび標準バタン時刻jとlこよって番地指
定されるテーブル記憶()(p、n、j)およびH(p
、n、j)と、人力バタンの第iブロックの各時刻m 
= (i−1)・IL+1.・・・、凰・ILにおいて
順次指定される東語指定信号nに対応した標準パタンの
各特徴ベクトル1b7と入力バタンの特徴ベクトルa−
との距離d(rn、j)を算出する距離計算部と、単語
指定nに対して生起し得る状態対(p、q)に対して、
状態pと単語指定nと標準バタン時刻Jによって指定さ
れる前記テーブル記憶G(p、n、j)およびH(p、
n、j)を参照し、前記テーブル記憶T(m−1,q)
の値を漸化式境界条件とし、L(m−=1.q)を経路
境界条件としてDPマツチング漸化式値g (m。
lb5', a state transition table Δ which is a group of rules (pe q+ n) which means that a state transition p −+ q occurs due to the input of word n, and a group of employment termination states. an automaton storage section storing F, and a table memory 'I' (m, q), P(m
, q), N (m, q) and L (m, q), state p, immediate word designation n, and standard slam time j and l, thereby table memory () (p, n, j) and H(p
, n, j) and each time m of the i-th block of the manual slam.
= (i-1)・IL+1. ..., each feature vector 1b7 of the standard pattern and the feature vector a- of the input button corresponding to the Togo designation signal n sequentially specified in 凰/IL
A distance calculation unit that calculates the distance d(rn, j) from
The table memories G(p, n, j) and H(p,
n, j) and the table storage T(m-1, q)
DP matching recurrence formula value g (m.

j)と経路値h(m、j )をm = (i−1) −
IL−t−1よりi・ILまで、かつJ−1よりJn 
までめて、前記テーブル記憶G(p、n、j)とH(p
、n。
j) and the path value h(m, j) as m = (i-1) −
From IL-t-1 to i・IL, and from J-1 to Jn
In summary, the table memories G(p, n, j) and H(p
, n.

j)とに格納するDPマツチング部と、前記1)Pマツ
チング部で算出された漸化式値g’(m、J”)を状態
qに関して最小値をめT(m、q)Iこ書込み、この最
小を与えた単語名n、状態指定p。
j) and the DP matching unit stored in 1) above, and write the recurrence formula value g'(m, J'') calculated by the P matching unit to T(m, q)I to find the minimum value with respect to state q. , word name n that gave this minimum, state specification p.

経路値h(m、J”)をN(m、q )、P(m、q)
L(m、q)Gこそれぞれ書き込む比較回路と、前記入
カバタン時刻m、入カバタンブロック番号凰。
Route value h(m, J”) is converted to N(m, q), P(m, q)
A comparison circuit that writes L(m, q) and G respectively, the input time m, and the input block number.

単語指定n、状態指定p 、 qi6よび標準バタン時
刻j等の信号を発生するための制御部と、最終時刻m=
Iにおいて、前記最終状態群Fに含まれる状態qで前記
テーブル記憶T(m、q)が最小なるものを定め、この
最小を与えたqおよび時刻mをもとにして前記テーブル
記憶P (m 、 q ) 、 N(m、 q )およ
びL(m、q )を参照して認識結果を定める判定部と
を有している。
A control unit for generating signals such as a word designation n, a state designation p, qi6, and a standard slam time j, and a final time m=
In I, the table memory T (m, q) is determined to be the minimum state q included in the final state group F, and the table memory P (m, q) is determined based on the minimum q and time m. , q ), N(m, q ), and L(m, q ) to determine the recognition result.

次に本発明の原理について説明する。本発明による方法
では、第2図に示すように(6)式の漸化式の計算を入
力バタンのILフレーム分をブロック化して算出する。
Next, the principle of the present invention will be explained. In the method according to the present invention, as shown in FIG. 2, the recurrence formula (6) is calculated by dividing the IL frame of the input button into blocks.

すなわち、次に示す動的計画の手法でめる。初期条件 T(0,0)=O・・・・・・・・・@T(m、q)=
閃1m〜o、q〜0 G(p、n、j)=■ とし、i = lよりI/IL(ここでI/If、は説
明の簡単のため割り切れるとする。)まで順次u 、 
ui式の境界条件を基に1喝式の漸化式を(p、q、n
)εΔなるすべての対(p、n)について計算する。′
すなわち、境界条件 g(m−1iQ)=T(m−1、p) m:m、、−・
−、m6−刊りh (m−1、Q ) =m−1m=m
、 、−・−、m。
In other words, it can be done using the following dynamic programming method. Initial condition T (0, 0) = O... @T (m, q) =
Flash 1m~o, q~0 G (p, n, j) = ■, and sequentially u from i = l to I/IL (Here, I/If is divisible for simplicity of explanation).
Based on the boundary conditions of the ui equation, the recurrence equation of the 1-step equation is (p, q, n
)εΔ for all pairs (p, n). ′
That is, the boundary condition g(m-1iQ)=T(m-1,p) m:m, , -・
-, m6-print h (m-1, Q) = m-1m=m
, , −・−, m.

ただし、m、= (j−1) * IL−1、me=m
e ILg(m、−1,j)=G(p、n、j) J=
1.−、J”−114h(m、−1,j)=H(p、n
、j) j=1.−−−、J’とし、漸化式 %式% ) ただし d(m、 j)=Dis(ay、b7)j = arg
min g (m−1、j’ )1−2≦j’<j をtn = m、よりm6まで計算し、その後J=1よ
りJnまで計算する。1ブロツクの計算終了後g、(m
a。
However, m, = (j-1) * IL-1, me=m
e ILg (m, -1, j) = G (p, n, j) J =
1. −, J”−114h(m, −1, j)=H(p, n
, j) j=1. ---, J', recurrence formula % formula % ) where d (m, j) = Dis (ay, b7) j = arg
min g (m-1, j')1-2≦j'<j from tn = m, calculate up to m6, and then calculate from J=1 to Jn. After completing one block of calculation, g, (m
a.

j)、h(町、j)をそれぞれG(p 、 n 、 j
 ) 。
j) and h(town, j) respectively as G(p, n, j
).

H(p、n、j)へ格納する。Store in H(p, n, j).

次に単語の境界における最小化として iff T(m、q)>g(m、J”) −−−−−−
u*tllen T(m、q)=g(m、J”)N(m
、q)二n P(rn、q)=p L(m、q)=h(m、J’) ただしm=m、 、 ・−、mlI を計算する、 入力バタンの認識結果は、(8) 、 (9) 、 (
IG 、 (lυにより前記従来方式と同様にしてめる
Next, as a minimization at the word boundary, if T(m, q)>g(m, J”) --------
u*tllen T(m, q)=g(m, J”)N(m
, q) 2n P(rn, q)=p L(m, q)=h(m, J') However, m=m, , ・−, mlI is calculated. The recognition result of the input button is (8 ) , (9) , (
IG, (lυ) is obtained in the same manner as in the conventional method.

以上、説明したように本発明における方法の計算量は従
来方法と同一であるが、G(p、n、j)。
As explained above, the amount of calculation of the method according to the present invention is the same as that of the conventional method, but G(p, n, j).

H(p、n、j)のアクセス回数はl/ILとなり、ア
クセス時間が減少される。また、入力バタンのm1フレ
ームより町フレームまでのデータを演算部のレジスタま
たは高速メモリへ格納してあれば、標準バタン1フレー
ムの読み出しに対してd (m 。
The number of accesses to H(p, n, j) becomes l/IL, and the access time is reduced. Furthermore, if the data from the m1 frame of the input button to the town frame is stored in the register or high-speed memory of the arithmetic unit, d (m ) for reading the standard button 1 frame.

j ) m = m、 ’、・・・1meまでを計算す
ることができる。
j) m = m, ', . . . up to 1me can be calculated.

このため、標準バタンの読み出しもlブロックの計算に
対して1回でよく、従来方法と比較しアクセス時間は1
/ILとなる。DPマツチングの演算は繰り返し計算が
多いため並列処理が可能であり、高速の演算部を構成す
ることは容易であるが、バタン記憶など大容量メモリ部
は高速にすることが困難である。従って演算時間は小さ
く、メモリアクセス時間が大きくなっている。本発明に
よる方法ではメモリアクセス時間を従来方法に比較し1
/ILに減少させる利点を持っており、DPマツチング
の処理時間も1/ILに近くなり、一定時間内に処理で
きる単語数や状態数を大きくできる利点を持っている。
Therefore, the standard button only needs to be read once for every l block calculation, and compared to the conventional method, the access time is 1
/IL becomes. Since the calculation of DP matching involves many repeated calculations, parallel processing is possible and it is easy to construct a high-speed calculation section, but it is difficult to make a large-capacity memory section such as a slam memory high-speed. Therefore, the calculation time is short and the memory access time is long. The method according to the present invention has a memory access time of 1 compared to the conventional method.
/IL, the processing time for DP matching becomes close to 1/IL, and the number of words and states that can be processed within a certain amount of time can be increased.

次に本発明の第1実施例について説明する、第3図は本
発明の第1実施例を示すブロック図であり−トである。
Next, a first embodiment of the present invention will be described. FIG. 3 is a block diagram showing the first embodiment of the present invention.

標準バタン記憶部130には単語セットΣに含まれる単
語nの標準パタンB”が記憶されている。オ−トマトン
記憶部230には状態遷移規則と最終状態の指定情報と
が記憶されている。本実施例では状態遷移規則は第9図
(a)および(b)のように記憶されている。第9図(
a)は状態指定テーブルと呼ばれ単語nによる状態遷移
p −+ qとして許されるpの集合を指定している。
The standard pattern B'' of the word n included in the word set Σ is stored in the standard pattern storage unit 130. The automaton storage unit 230 stores state transition rules and final state designation information. In this embodiment, state transition rules are stored as shown in FIGS. 9(a) and (b).
A) is called a state specification table and specifies a set of p allowed as state transition p −+ q by word n.

図の例では単語nに対応するpとしてpl、・・・、p
、・・・、p6が生じ得ることが例示されている。第9
図tb)は遷移テーブルと呼ばれ単語nによって状態p
から遷移し得る状態qの集合を記憶している。図の例で
はqとしてqz e qz *q3 * G4が生じ得
ることを示している。
In the example shown in the figure, p corresponding to word n is pl, ..., p
,..., it is exemplified that p6 can occur. 9th
Figure tb) is called a transition table, and the state p is defined by the word n.
A set of states q that can be transitioned from is stored. The example shown in the figure shows that qz can be expressed as qz e qz *q3 *G4.

マイクロホン100より未知入力音声が入力されると人
力部110によって周波数分析がなされ特徴を示すベク
トルaiに変換され順次入力バタンバッファ120iこ
送られる。また、人力部110には音声レベルを検知す
ることによって音声区間を決定する機能が与えられてお
り、音声区間中では「1」その他では「0」なる音声区
間信号Sを発生する。
When an unknown input voice is input from the microphone 100, the human power section 110 performs frequency analysis, converts it into a vector ai representing characteristics, and sequentially sends it to the input bang buffer 120i. Furthermore, the human power unit 110 is provided with a function of determining a voice section by detecting the voice level, and generates a voice section signal S that is "1" during the voice section and "0" otherwise.

制御部240は、この音声区間信号Sの立上りの時刻l
こおいて初期化パルスIT 1 を発生する。これによ
って第8図のブロック10に対応する初期化がGメモリ
ー150とTメモリ200に対してなされる。
The control unit 240 controls the rise time l of this voice section signal S.
At this point, an initialization pulse IT 1 is generated. As a result, initialization corresponding to block 10 in FIG. 8 is performed on the G memory 150 and the T memory 200.

以上の初期化が終了すると、以後の工しフレーム分の入
力特徴a1 の入力に同期して入力バタンブロック信号
iが1,2.・・・・・・と計数される。この人力バタ
ンブロックiにおいて制御部240よりの単語指定信号
nは1よりへまで変化する。各nにおいてオートマトン
記憶部230中の状態テーブルが参照され、状態指定信
号pがplからp8 まで変化される。またそのnとp
にて規定される状態指定信号qも出力される。
When the above initialization is completed, the input slam block signal i is changed to 1, 2, etc. in synchronization with the input of the input feature a1 for the subsequent processing frames. It is counted as... In this manual slam block i, the word designation signal n from the control section 240 changes from 1 to down. At each n, the state table in the automaton storage section 230 is referred to, and the state designation signal p is changed from pl to p8. Also, that n and p
A state designation signal q defined by is also output.

次に単語n1状態pなる1サイクル内の動作を以下に説
明する。この1サイクルによって第2図の斜線部分の計
算が実行される。すなわち、U。
Next, the operation within one cycle of word n1 state p will be described below. The calculations shown in the shaded areas in FIG. 2 are executed through this one cycle. That is, U.

I式の境界条件のもとて(1鴎、QQ式を計算する。初
めに制御部よりの信号5ET2 によって、第8図のブ
ロック11 、12に対応する値のセットがDPマツチ
ング部140内のgメモリ143とhメモリ144に対
して行われる。つづいて制御部240よりの標準バタン
時刻信号jは1よりJ”まで変化する。各jにおいて、
入力バタン時刻信号m it m、 (m、 =(i−
1)−1L+1)よりm、(me=i −IL)まで変
化する。
Based on the boundary conditions of the I equation (1), calculate the QQ equation. First, the set of values corresponding to blocks 11 and 12 in FIG. This is performed for the g memory 143 and the h memory 144.Next, the standard slam time signal j from the control unit 240 changes from 1 to J''.For each j,
Input slam time signal m it m, (m, = (i-
1) changes from −1L+1) to m, (me=i −IL).

ング部J40では、初めに入力バタンのmフレームと第
n番目の単語の標準バタンのjフレームが読み出されて
、(6−1)式に示すR次元べりトル間の距離を距離計
算部141でめる。すなわち人力バタンバッファ120
と標塘パタンメモリ部130より信号に従ってlも個の
データを順次読み出し。
In the processing section J40, m frames of the input button and j frames of the standard button of the n-th word are first read out, and the distance between the R-dimensional beams shown in equation (6-1) is calculated by the distance calculation section 141. Demeru. In other words, the human-powered slam buffer 120
Then, l pieces of data are sequentially read out from the pattern memory unit 130 according to the signal.

絶対値回路1411にて差の絶対値をめ、加算器141
2とアキュムレータ1413によってそのオロがめられ
、Dis (a、b;)が得られる。一方、゛距離計算
と並夕1ルで3つの相異度の最小値がめられる。すなわ
ら、gメモリ143よりg(m−t*j)eg(In−
1、j−1) 、 g(tn−1、j −2)とhメモ
リ144よりh(m−1,j)、h(m−xnj−B。
The absolute value of the difference is determined by the absolute value circuit 1411, and the adder 141
2 and the accumulator 1413, Dis (a, b;) is obtained. On the other hand, the three minimum values of dissimilarity can be found by distance calculation and parallelism. In other words, g(m-t*j)eg(In-
1, j-1), g(tn-1, j-2) and h(m-1, j), h(m-xnj-B) from the h memory 144.

h(xn−1,j 2)を読み出し、レジスタ山。Read h(xn-1,j 2) and register pile.

02、G3.Hl、1−12.83 へそれぞれ格納す
る。比較回路1422は3つのレジスタoi 、 G2
 、03より最小値を検出し、その最小値が得られたレ
ジスタモリ164のh(m、j)へ誓き込まれる。また
、比較回路1422より出力された最小値g(m−1゜
J)は前記距離計算部141でめられた距離d(tn、
j)と加算器1421によって加算され、gメモIJ 
143のg(m、j )へ書き込まれる。入力バタン時
刻mがm、からnl、まで変fヒされることによって標
準バタン時刻jIこ対する処理が終了する。
02, G3. Hl, 1-12.83 respectively. Comparison circuit 1422 has three registers oi, G2
, 03, and the minimum value is stored in h(m, j) of the register memory 164 from which the minimum value was obtained. Furthermore, the minimum value g (m-1°J) output from the comparison circuit 1422 is the distance d (tn,
j) and the adder 1421, and the g memo IJ
143 g(m,j). By changing the input slam time m from m to nl, the processing for the standard slam time jI is completed.

さらに標準バタン時刻」が終端Jnとなった後、第8図
のブロック14に示すように信号5ET3 に従って順
化式(1暖の結果g(In++ 、 j )”、 11
 Crne 、 j )をテーブルメモリG(p 、 
n 、 j ) 、H(p、n、j )へ格納する。つ
づいて制御部より発せられた信号m2(m、よりm8ま
で変化する)に従って第8図のブロック15に示した比
較が行われる。すなわち第5図に示すように、信号m2
とqに従ってテーブルメモリ200よりT(m、q)と
gメモリ143よりg (m 、 J’ )が読み出さ
れ、比較回路170により比較しT(m、q)>g(m
、J”)の場合wp倍信号発せられ、g(m、J’)、
n、p、h(m、J”)がテーブルメモリT(m、q)
、N(m、q)。
Furthermore, after the "standard slam time" becomes the terminal Jn, the acclimatization formula (1 warm result g(In++, j)", 11 according to the signal 5ET3 as shown in block 14 of FIG.
Crne, j) as table memory G(p,
n, j), and stored in H(p, n, j). Subsequently, the comparison shown in block 15 of FIG. 8 is performed in accordance with the signal m2 (m, which changes from m to m8) issued by the control section. That is, as shown in FIG.
T(m, q) is read from the table memory 200 and g(m, J') is read from the g memory 143 according to
, J”), then wp times the signal is emitted, and g(m, J'),
n, p, h (m, J”) is table memory T (m, q)
, N(m, q).

P(m、q)、L(m、q)へ書き込まれる。Written to P(m, q) and L(m, q).

以上の動作によって状態p、単単語n大入カバタンブロ
ックの処理が終了する。さらに状態指定信号pがplか
らp6と変化されることにより単語指定信号nに対する
処理が終了する。さらに単語指定信号nが1からNまで
変化されることにより入力バタンブロックiに対する処
理が終了する。
With the above operations, the processing of the state p and single word n large entry kabatan block is completed. Furthermore, the state designation signal p is changed from pl to p6, thereby completing the processing for the word designation signal n. Furthermore, the word designation signal n is changed from 1 to N, thereby completing the processing for the input slam block i.

入力バタンブロック信号がI/ILとなった後に、(8
)t9)(10)(11)式に示した判定処理が開始さ
れる。判定部220は第6図に示すように構成され、始
めに第8図のブロック16の処理として、オートマトン
記憶部230から最終状態集合FIこ含まれる状態qを
信号93に従って順次指定され、テーブルメモリ200
よりT(1,q)を読み出し比較回路221゜最小値レ
ジスタ222.状態レジスタ223を用いて最小のT(
1,q)が与えられる状態qを得る。
After the input slam block signal becomes I/IL, (8
)t9) The determination process shown in equations (10) and (11) is started. The determination unit 220 is configured as shown in FIG. 6, and first, as the process of block 16 in FIG. 200
T(1,q) is read from the comparison circuit 221° and the minimum value register 222. Using the status register 223, the minimum T(
1, q) is given.

続いて第8図のプロ、り17の処理上して判定制例部2
27はq:q、m:工としてアドレス信号m3゜qをテ
ーブルメモリ190,210.180 ヘ発しN(m。
Next, in the process of FIG. 8, the judgment restriction part 2
27 issues an address signal m3゜q to the table memory 190, 210.180 as q:q, m:engine, N(m.

q)、L(m、q)、P(m、q)を読み出す。q), L(m, q), and P(m, q).

このL(m、q)とP(m、q)は次(7) mとqと
なり、N(m、q、)は認識結果として出力される。
These L(m, q) and P(m, q) become the following (7) m and q, and N(m, q,) is output as the recognition result.

この処理をlが七〇になるまで繰返丁ことにより順次認
識結果が得られる。
By repeating this process until l reaches 70, recognition results can be obtained in sequence.

以上説明した第1の実施例では、状態p、単飴nの入力
バタン時刻Insよりm。まで(入力バタンブロックi
)の部分の計算結果g(ms、Jn)〜g(me、J“
)がまとめて得られる。この結果を次の状態p′の同じ
人力バタンフロック1の初期値の計算(第5図のブロッ
ク14)で使用するため、オートマトンの初期状態より
最終状態へ順序よ< it算を進める必要がある。一方
、オートマトンの状態遷移にループが含まれる場合(ま
、状態piこおけA計算結果を自分自身の状態pの初期
匝の計算に使用するという不都合が生じ、正しい計算結
果が得られない。
In the first embodiment described above, in the state p, from the input button time Ins of the single candy n, m. up to (input slam block i
) part calculation result g(ms, Jn) ~ g(me, J“
) are obtained all at once. In order to use this result in the calculation of the initial value of the same human-powered slam block 1 in the next state p' (block 14 in Figure 5), it is necessary to proceed with the < it calculation from the initial state of the automaton to the final state. . On the other hand, if the state transition of the automaton includes a loop (well, the inconvenience arises that the calculation result of state pi box A is used to calculate the initial box of its own state p, and the correct calculation result cannot be obtained.

第2の実施例では、前記の欠点を取り除き、オートマト
ンの状態遷移にループが含まれる場合でも正しい結果を
得ることができる。すなわち、状態p、単語nの入カバ
クンブロックiの部分の計算結果のg (me−J’ 
)のみを用いて入力バタンプロ、りi+1の状態qの初
期値の計算を行う。
In the second embodiment, the above-mentioned drawbacks are eliminated, and correct results can be obtained even when a loop is included in the state transition of the automaton. In other words, g (me-J'
) is used to calculate the initial value of the state q of the input button i+1.

第2の実施例における計算手順は本発明の詳細な説明し
た方法とほとんど同じであるが、([,1式の境界条件
は g (m、1 、0 )=:”I’(171,1−p)
 31.1.−Q7)h (m、1 、0 )==m=
 1 g (mt 0 ) =oo m=m、 、・・・、塵
と変わり、さらにu6)式の単語の境界における最小化
は iff T(m、、q)>g(me、J’) −−us
then T(ms、q)=g(meJ”)N (m、
 I q )二〇 P(m、、q)=p L(m、、q)=h(me、Jn) と変わる。
The calculation procedure in the second embodiment is almost the same as the method described in detail of the present invention, but the boundary condition of the equation ([, 1 -p)
31.1. -Q7)h (m, 1, 0)==m=
1 g (mt 0 ) =oo m=m, ,..., change to dust, and furthermore, the minimization of equation u6) at the word boundary is iff T(m,, q)>g(me, J') − -us
then T(ms, q)=g(meJ”)N (m,
I q )20 P(m,, q)=p L(m,, q)=h(me, Jn).

第2の実施側番ごおける装置tの構成は第1の実施例と
同じであるが、境界条件吋)式と車飴の境界における最
小化US式となるため、計算の手11ffiが異なる。
The configuration of the device t in the second embodiment is the same as the first embodiment, but the calculation method 11ffi is different because the boundary condition (2) equation and the minimization US equation at the boundary of car candy are used.

第2の実施例の動作時間r@係を示rタイムチ異なる部
分のみ説明゛づ−る。境界榮件は(1階式より(17)
式へ変わっており、制御信号SL、T2に従って第11
図のブロック11 、12に示した櫃がgメモIJ 1
43 。
The operation time r of the second embodiment will be shown below, and only the different parts will be explained. The boundary condition is (from the first floor formula (17)
According to the control signals SL and T2, the 11th
The boxes shown in blocks 11 and 12 of the figure are g memo IJ 1
43.

hメモリ144へセットされる。また、単語の境界にお
ける最小化はtttp式より0樽式へ変わっており、制
御信号m2に従って第11図のブロック15に示す比較
処理が行われる。
h memory 144. Furthermore, the minimization at word boundaries has been changed from the tttp method to the 0-barrel method, and the comparison process shown in block 15 of FIG. 11 is performed in accordance with the control signal m2.

以上説明した第2の実施例では、オートマトンの状態遷
移にループが存在してもよいが、単語の境界の最小化を
mウニi・IL の点のみでしか行っていないため、単
語」暴り持朋崖度が若干悪くなっている。一方、テーブ
ル記憶T(m、q)。
In the second embodiment described above, a loop may exist in the state transition of the automaton, but since the word boundaries are minimized only at the point munii・IL, the word The degree of resilience has deteriorated slightly. On the other hand, table storage T(m, q).

N(m、q)、L(m、q)、P(m、q)のmに関し
て使用している部分はme=i・IL のみであるので
、第1の実施例のテーブル記憶の]/iLの小さな記憶
容量とすることが可能である。
Since the part used for m in N(m, q), L(m, q), and P(m, q) is only me=i・IL, the table storage in the first embodiment is It is possible to have a small storage capacity of iL.

以上、本発明の構成を実施例にもとづいて説明したが、
これらの記載は本発明の権利範囲を限定するものではな
い。特に本発明ではDPマツチングの漸化式として最も
簡単な(17)式を用いたが、他のより高性能なものを
用いる方法も考えられる。
The configuration of the present invention has been described above based on examples, but
These descriptions do not limit the scope of the present invention. In particular, in the present invention, the simplest equation (17) is used as the recurrence equation for DP matching, but it is also possible to use other higher-performance equations.

例えば なるものを用いる方法が考えられる。ただし、この場合
には漸化式値は時刻(m−2)まで、距離も時刻(m−
1)まで保存しなくてはならないのでテーブル記憶G(
p 、 n 、 j )と同様なものを増設する必要が
ある。また、本説明では距離を基本として認識を行なっ
たが、相関を基本吉して認識する方法も考えられる。こ
の場合(とは、大小関係が逆になるので不説明の最大値
検出機能を、すべて最小値検出機能に置換する必要があ
る。また。
For example, one possible method is to use Naru. However, in this case, the recurrence formula value is up to time (m-2), and the distance is also up to time (m-2).
Since it is necessary to save up to 1), table memory G (
It is necessary to add something similar to p, n, j). Further, in this explanation, recognition was performed based on distance, but a method of recognition based on correlation may also be considered. In this case, the magnitude relationship is reversed, so it is necessary to replace all unexplained maximum value detection functions with minimum value detection functions.Also.

本説明ではテーブル記憶0(p 、 n 、 j )お
よびH(p、n、jうは、フォートランで用いられる三
次元配列としCあるが、p、n、jによりC指定される
メモリとしてよい。すなわら、チーフル記憶はp+ ”
 + Jのすべての範囲(テーブルサイズ” pm−x
 X rlmax X Jmax )を持つのではなく
、使用される範囲(チーフルサイズ=Σ J’)のみを
持(p、n%Δ っているものとしてもよい。これらの自明な変更は本発
明の権利範囲に楓するものである。
In this description, table storage 0 (p, n, j) and H (p, n, j) are three-dimensional arrays used in Fortran, but C may be a memory designated by p, n, j. In other words, Chiful memory is p+”
+ All ranges of J (table size” pm-x
Instead of having the range (X rlmax This covers the scope of rights.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は従来技術を説明するための図であり、第2図は
本発明の詳細な説明するための図であり、9〜 第3図、第4図、第5図、第6図は本発明の実施−トマ
トン記憶部のメモリ構成図であり、第10図である。 図面において、 100・・・マイクロホン、110・・・入力部、12
0・・・入力バタンバッファ、130・・・標準バタン
記憶部、140・・・DPマツチング部、141・・・
距離計算部、150・・・qメモリ、160・・・Hメ
モリ、170・・・比較回路、 180・・・Pメモリ
、190・・・1Nメモリ、200・・・Tメモリ。 210・・・Lメモ、す、 220・・・判定部、23
0・・・オートマトン記憶部、240・・・制御部、で
ある。 入力へ〇タン、11 m 第2図 ジ\カバ69ンA m、i 第5図 第67 第7図 r −」土l二ニョj− 第 8図(イの1) 第9図 (b) 第to図 ・ −口m百− ¥11図 (子の1) 第 110(イの2)
Fig. 1 is a diagram for explaining the prior art, Fig. 2 is a diagram for explaining the present invention in detail, and Figs. FIG. 10 is a memory configuration diagram of an implementation of the present invention--a tomato storage unit. In the drawings, 100...microphone, 110...input section, 12
0... Input button buffer, 130... Standard button storage section, 140... DP matching section, 141...
Distance calculation section, 150...Q memory, 160...H memory, 170...comparison circuit, 180...P memory, 190...1N memory, 200...T memory. 210... L memo, 220... Judgment section, 23
0: automaton storage unit, 240: control unit. To input 〇tan, 11 m Fig. 2 Cover 69 A m, i Fig. 5 Fig. 67 Fig. 7 r - "Sat l Niyo j -" Fig. 8 (A-1) Fig. 9 (b) Figure to: -M100 Figure 11 (Child 1) No. 110 (A 2)

Claims (1)

【特許請求の範囲】 入力音声を特徴の時系列A=all、a!、・・・、 
ai 。 ・・・e ”I に変換する入力部と、単語セットΣ=
(n)の中の各単語nに対して標準バタンB”=l)i
 、lb; 。 ・・・、呵・・、 +b:;・を記憶する標準バタン記
憶部と、単語nの入力によって状態遷移p−+qが生じ
ることを意味する規則(p、q、n)の群である状態遷
移テーブル△と最終状態の群Fとを記憶するオートマト
ン記憶部と、入力バタン時刻mと状態qとによって番地
指定されるテーブル記憶T(m、q)。 P(m、q)、N(m、q)およびL(m、q )と、
状態pと単語指定nおよび標準バタン時刻jとによって
番地指定されるテーブル記憶G(p。 nej)および” (p * n@ J )と、入力バ
タンの第iブ西ツクの各時刻m=<1−1)・IL+1
.・・・。 1−LL(ILは正の整数)において順次指定される単
語指定信号nに対応した標準パタンの各特徴ベクトルわ
7と入力バタンの特徴ベクトル4との距離d(m、j)
を算出する距離計算部と、単語指定nに対して生起し得
る状態対(p 、 q )fこ対して、状態pと単語指
定nと標準バタン時刻Jによって指定される前記テーブ
ル記憶G(p、n、j)およびH(p、n、j)を参照
し、前記テーブル記憶T(m−1,q) の値を漸化式
境界条件とし、L(m 1*q)を経路境界条件として
DPマツチング漸化式値g(m、j)と経路値h(m、
j )をm=(1−1) ・IL+1よりm=1−IL
 まで、かつj=1よりj=J’までめて、前記テーブ
ル記憶G(p、n、j)とH(p、n、j)とに格納す
るDPマツチング部と、前記DPマツチング部で算出さ
れた漸化式値g(m、J”)を状態qに関して最小値を
めT(m、q)に書込み、この最小を与えた単語名n、
状態指定p、経路値h(m、J”)をN(m、q)、P
(m、q)、L(rn。 q)にそれぞれ書き込む比較回路と、前記入カバタン時
刻m、入カバタンブロック番号i、単語指定n、状態指
定p、qおよび標準バタン時刻j等の信号を発生するた
めの制御部と、最終時刻m=Iにおいて、前記最終状態
群Fiご含まれる状態qで前記テーブル記憶T(m、q
)が最小なるものを定め、この最小を与えたqおよび時
刻mをもとにして前記テーブル記憶P(m、q)、N(
m、q)およびL(m、q )を参照して認識結果を定
める判定部とを持つことを特徴とする連続音声認識装置
[Claims] Time series A=all, a! featuring input speech. ,...,
ai. ...e "I" input section and word set Σ=
For each word n in (n), the standard button B”=l)i
, lb; . ..., 呵..., +b:;・, and a state that is a group of rules (p, q, n) that means that state transition p-+q occurs due to the input of word n. An automaton storage unit that stores a transition table Δ and a group F of final states, and a table storage T(m, q) whose address is specified by an input slam time m and a state q. P(m, q), N(m, q) and L(m, q),
A table memory G(p. 1-1)・IL+1
.. .... 1-Distance d (m, j) between each feature vector 7 of the standard pattern corresponding to the word designation signal n sequentially specified in LL (IL is a positive integer) and the feature vector 4 of the input button.
and the table memory G (p , n, j) and H(p, n, j), the value of the table storage T(m-1, q) is a recursion boundary condition, and L(m 1*q) is a path boundary condition. As DP matching recurrence formula value g(m, j) and path value h(m,
m=(1-1) ・From IL+1, m=1-IL
and from j=1 to j=J', the DP matching unit stores the table memories G(p, n, j) and H(p, n, j), and the DP matching unit calculates Write the recurrence formula value g(m, J'') into T(m, q) to find the minimum value with respect to state q, and write the word name n that gave this minimum,
State specification p, route value h(m, J”) as N(m, q), P
(m, q), L(rn. q), and signals such as input kabatan time m, input kabatan block number i, word designation n, state designation p, q, standard baton time j, etc. and a control unit for generating the table memory T(m, q
) is determined as the minimum, and based on the minimum value q and time m, the table storage P(m, q), N(
a determination unit that determines a recognition result with reference to L(m, q) and L(m, q).
JP58239303A 1983-12-19 1983-12-19 Continuous voice recognition equipment Pending JPS60130799A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58239303A JPS60130799A (en) 1983-12-19 1983-12-19 Continuous voice recognition equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58239303A JPS60130799A (en) 1983-12-19 1983-12-19 Continuous voice recognition equipment

Publications (1)

Publication Number Publication Date
JPS60130799A true JPS60130799A (en) 1985-07-12

Family

ID=17042715

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58239303A Pending JPS60130799A (en) 1983-12-19 1983-12-19 Continuous voice recognition equipment

Country Status (1)

Country Link
JP (1) JPS60130799A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0703568A2 (en) 1994-09-20 1996-03-27 Nec Corporation Speech recognition system and speech recognition method with reduced response time for recognition

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0703568A2 (en) 1994-09-20 1996-03-27 Nec Corporation Speech recognition system and speech recognition method with reduced response time for recognition
JPH0887294A (en) * 1994-09-20 1996-04-02 Nec Corp Voice recognition device
US5812739A (en) * 1994-09-20 1998-09-22 Nec Corporation Speech recognition system and speech recognition method with reduced response time for recognition

Similar Documents

Publication Publication Date Title
CN108960419B (en) Apparatus and method for a student-teacher shift learning network using a knowledge bridge
CN110610700B (en) Decoding network construction method, voice recognition method, device, equipment and storage medium
CN110188353A (en) Text error correction method and device
JPS60211498A (en) Continuous voice recognition equipment
JPS58132298A (en) Pattern matching apparatus with window restriction
JP2980026B2 (en) Voice recognition device
US7464033B2 (en) Decoding multiple HMM sets using a single sentence grammar
JPS60130799A (en) Continuous voice recognition equipment
JPS61145599A (en) Continuous voice recognition equipment
JP2003208195A5 (en)
JP4732030B2 (en) Information processing apparatus and control method thereof
JP2964881B2 (en) Voice recognition device
JP5738216B2 (en) Feature amount correction parameter estimation device, speech recognition system, feature amount correction parameter estimation method, speech recognition method, and program
McDonough et al. An algorithm for fast composition of weighted finite-state transducers
JPS62187897A (en) Continuous voice recognition equipment
JPS62161200A (en) Continuous voice recognition equipment
Visweswariah et al. Maximum likelihood training of subspaces for inverse covariance modeling
Droppo Feature Compensation.
Ogawa et al. Lattice rescoring based on large ensemble of complementary neural language models
WO2021240780A1 (en) Labeling error detection device, labeling error detection method, and program
JP2001265383A (en) Voice recognizing method and recording medium with recorded voice recognition processing program
EP1220198A1 (en) Decoding multiple HMM sets using a single sentence grammar
Kannan et al. A comparison of constrained trajectory segment models for large vocabulary speech recognition
JP3226716B2 (en) Voice recognition device
JP3348735B2 (en) Pattern matching method