JPS5898796A - Continuous voice recognition equipment - Google Patents

Continuous voice recognition equipment

Info

Publication number
JPS5898796A
JPS5898796A JP56197841A JP19784181A JPS5898796A JP S5898796 A JPS5898796 A JP S5898796A JP 56197841 A JP56197841 A JP 56197841A JP 19784181 A JP19784181 A JP 19784181A JP S5898796 A JPS5898796 A JP S5898796A
Authority
JP
Japan
Prior art keywords
digit
dissimilarity
word
input pattern
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56197841A
Other languages
Japanese (ja)
Other versions
JPH0134399B2 (en
Inventor
誠夫 亘理
迫江 博昭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP56197841A priority Critical patent/JPS5898796A/en
Priority to US06/447,829 priority patent/US4592086A/en
Priority to DE8282306577T priority patent/DE3267835D1/en
Priority to CA000417329A priority patent/CA1193013A/en
Priority to EP82306577A priority patent/EP0081390B1/en
Publication of JPS5898796A publication Critical patent/JPS5898796A/en
Publication of JPH0134399B2 publication Critical patent/JPH0134399B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 本発明は1個以上の単語を連続して発声した連続音声を
自動的に認識する連続音声認識装置に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a continuous speech recognition device that automatically recognizes continuous speech in which one or more words are successively uttered.

音声認識の手段としては従来から楢々の方法が試みられ
ている。それらの中で最も簡単、かつ有効な方法として
パタンマツチング法があげられる。
As a means of voice recognition, the Narasa method has been tried in the past. Among them, the pattern matching method is the simplest and most effective method.

この方法は、認識すべきW!索の各単語に標準的なパタ
ン(以下単語標準パタンと称する)を用意しておき、入
力された未知の音声パタン(以下入力パタンと称する)
との間で比較操作(すなわちバタンマツチング)を行っ
て相互で異なる度合を表わす量(以下相異度と称する)
を算出し、最も相異の少ないすなわち相異度が最小にな
る単語標準パタンと同じ単語に属すると判定する方法で
ある。
This method is a must-recognize W! A standard pattern (hereinafter referred to as the word standard pattern) is prepared for each word in the search, and the input unknown voice pattern (hereinafter referred to as the input pattern) is prepared in advance.
(hereinafter referred to as the degree of dissimilarity)
This is a method for determining that a word belongs to the same word as the word standard pattern with the least difference, that is, the minimum degree of difference.

特開昭51−104204号公報には上記パタンマツチ
ング法を基礎として動作する連続音声認識装置の動作原
理が記載されている。この原理は大路次のようである。
JP-A-51-104204 describes the operating principle of a continuous speech recognition device that operates based on the pattern matching method described above. The principle behind this is as follows.

すなわち、何個かの単語標準バタンをあらゆる順列で接
続することによって得られるパタンを連続音声の標準パ
タン(以下連続音声標準パタンと称す)と考えて、入力
パタン全体とのマツチングを行う。全体としての相異度
が最小となるように単語標準パタンの個数と単語標準パ
タンの順列を定めることによって認識を行なう。
That is, a pattern obtained by connecting several word standard patterns in any permutation is considered as a continuous speech standard pattern (hereinafter referred to as a continuous speech standard pattern), and is matched with the entire input pattern. Recognition is performed by determining the number of word standard patterns and the permutation of word standard patterns so that the overall degree of difference is minimized.

実際には上記最小化を単語単位での最小化と全体として
の最小化の2段階に分割し、それぞれの最小化を動的計
画法を利用して実行する(以下動的計画法を用いたマツ
チングをDPマツチングと称する)。
In reality, the above minimization is divided into two stages: word-by-word minimization and overall minimization, and each minimization is performed using dynamic programming (hereinafter, the minimization is performed using dynamic programming). This matching is called DP matching).

上記公開公報記載の装置で紘単語単位での最小化におい
て、入力パタンを単語単位にあらゆる可能な分割をし、
そのすべてに対して単語標準パタンとのDPマツチング
を行っている。すなわち入カパタン長をNとし、単語標
準パタン数をVとすればM・V回のDPマツチングを必
要とする。
In the minimization of each word using the device described in the above publication, the input pattern is divided into every possible word,
DP matching with word standard patterns is performed for all of them. That is, if the input pattern length is N and the number of word standard patterns is V, then M.V times of DP matching are required.

ところで、上記のDPマツチングの回数をLmax・V
回(入力パタンの最大可能桁数をLmaxとする)にす
る方法がIEEE TRANSACTlONSON AC
OUSTlCS,SPEECH、AND SIGNAL
PROCESSING、VOL ASSP−29NO.
2APRIL 1981第284頁から第297頁に記
載されている。次にこの方法(以下HLB法と称する)
の大略を述べる。入力パタンAと連続音声標準パタンC
=Bv1、Bv2、・・・、Bvl、・・・、BvLm
axとの相異度は次のようにして求める。入力パタンの
時間点mと連続音声標準パタンの時間点nを第1図に示
したような最適な単調増加で非線形関数n=nm(以下
時間正規化関数という)にて対応づけを行い、その対応
づけられた時間点における特徴ベクトル間の距離d(m
、n)を時間正規化関数に沿って加算したものを相異度
8(A、C)と定義する。
By the way, the number of times of the above DP matching is Lmax・V
(the maximum possible number of digits of the input pattern is Lmax) is based on IEEE
OUSTlCS, SPEECH, AND SIGNAL
PROCESSING, VOL ASSP-29NO.
2APRIL 1981, pages 284 to 297. Next, this method (hereinafter referred to as HLB method)
I will give an outline. Input pattern A and continuous voice standard pattern C
=Bv1, Bv2,..., Bvl,..., BvLm
The degree of difference with ax is determined as follows. The time point m of the input pattern and the time point n of the continuous speech standard pattern are correlated using an optimal monotonically increasing nonlinear function n=nm (hereinafter referred to as time normalization function) as shown in Figure 1, and The distance d(m
, n) along the time normalization function is defined as the degree of dissimilarity 8 (A, C).

ζこで距離d(m、n)は例えば(8)式にて求めるこ
とができる。
ζ Here, the distance d(m, n) can be determined, for example, using equation (8).

(1)式の最小化を次のような動的計画の手法で行う。Equation (1) is minimized using the following dynamic programming method.

す表わち、初期条件 D(0,0)=O・・・・・・(4) D(m、Q)=∞ m=0〜M・・・・・・(5)F(
m、O)=m m=0〜M・・・・・・(6)のもとに
漸化式 ただし をm=L(m)〜U(m)、m=1〜Mについてすなわ
ち第1図の斜線部分について求める。
In other words, the initial condition D (0, 0) = O (4) D (m, Q) = ∞ m = 0 ~ M (5) F (
m, O) = m m = 0 ~ M ...... Based on (6), the recurrence formula is written for m = L (m) ~ U (m), m = 1 ~ M, that is, the first Find the shaded area in the figure.

U(m)=2m−1・・・・・・(10)L(m)=(
m+1)/2・・・・・・(11)ここでargmin
yはxEXの条件の下でyを最小とするxを意味してい
る。すなわち(9)式はn−2≦n’≦nのもとでD(
m−1,n’)を最小とするn′をnとしている。また
、(7)式は第2図に示す3つの経路より最小を選択す
ることを示しておシ、許される経路を3つに制限したの
は時間正規化関数による対応づけが必要以上に歪むこと
を防ぐためである。ここで相異度を求める時用いた最小
値を選択した経路をマツチング経路と呼び、(8)式の
F(m。
U(m)=2m-1...(10)L(m)=(
m+1)/2...(11) Here argmin
y means x that minimizes y under the condition of xEX. In other words, equation (9) is D(
m-1, n') is set to be n'. In addition, equation (7) indicates that the minimum is selected from the three routes shown in Figure 2, and limiting the number of allowed routes to three causes the correspondence by the time normalization function to become unnecessarily distorted. This is to prevent this. Here, the path that selects the minimum value used when calculating the degree of dissimilarity is called the matching path, and F(m) in equation (8).

n)を経路情報と呼ぶ。前記漸化式(7)、t8)、(
9)を入力パタンの終端M、連続音声標準パタンの終端
Nまで計算して得られるD(N、N)が前記(1)式の
相異度S(A、C)である。
n) is called route information. The recurrence formula (7), t8), (
D(N, N) obtained by calculating 9) from the end M of the input pattern to the end N of the continuous speech standard pattern is the degree of dissimilarity S(A, C) in equation (1).

ところで、全体の最小相異度を求めた時得られたマッチ
ング経路(m、n(i)上のある点(ml、nl)にお
いて、始端よりそのマツチング経路に沿ってその点(m
l、nl)まで得られた部分相異度は、その点(ml、
nl)を通るすべてマツチング経路に沿りて得られる部
分相異度の最小値である。すなわちある点(ml、nl
)を通るすべてのマツチング経路に沿って得られる全体
相異度の最小値は始端よりその点(ml、nl)までの
部分相異度とその点(ml.nl)より終端までの部分
相異度のそれぞれの最小値の和で与えられる。
By the way, at a certain point (ml, nl) on the matching path (m, n(i)) obtained when calculating the overall minimum dissimilarity, the point (m
The partial dissimilarity obtained up to the point (ml, nl) is
nl) is the minimum value of partial dissimilarity obtained along all matching paths passing through nl). That is, a certain point (ml, nl
) The minimum value of the overall dissimilarity obtained along all matching paths passing through It is given by the sum of the minimum values of each degree.

すなわち、 ただし(ml、nl)はS(A、C)が得られたマツチ
ング経路上の点である。今、連続音声標準パタンの各桁
ごとの区切れ目の点を考え、それぞれの桁で最小の部分
相異度を求め、その和として最小の全体相異度を得るこ
とができる。従って、入力バタンAと連続音声標準パタ
ンC=BVs、Bv2、・・・、BVl、・・・、Bと
の最小相異度は次のようにして求めることができる。初
めに、連続音声標準パタンの第1桁目の各単語標準パタ
ンと入力パタンとのマツチングを行い、相異度の最小値
を求め、その結果を第2桁目のマツチングの初期値とし
て第2桁目の各単語標準パタンと入力パタンとのマツチ
ングを行う。第Lmax桁までマツチングを行った後、
入力パタンの終端Mにおける各桁ごとの相異度の最小値
を求め、最適な桁aLを得る。第L桁の相異度が得られ
九マツチング経路を逆にたどって順次各桁での認識カテ
ゴリを得る。
That is, where (ml, nl) is the point on the matching path where S(A, C) was obtained. Now, considering the break points for each digit of the continuous speech standard pattern, the minimum partial dissimilarity can be found for each digit, and the minimum overall dissimilarity can be obtained as the sum of the results. Therefore, the minimum degree of difference between the input button A and the continuous voice standard pattern C=BVs, Bv2, . . . , BVl, . . ., B can be determined as follows. First, each word standard pattern in the first digit of the continuous speech standard pattern is matched with the input pattern, the minimum value of the degree of dissimilarity is found, and the result is used as the initial value for matching in the second digit. The standard pattern of each word in the digit is matched with the input pattern. After matching up to the Lmax digit,
The minimum value of the degree of difference for each digit at the terminal end M of the input pattern is determined to obtain the optimum digit aL. The degree of difference for the L-th digit is obtained, and the nine matching paths are traced in reverse to obtain the recognition category for each digit in sequence.

次にHLB法の計算手順を第3図〜第6図を用いて説明
する。第3図は相異度計算の進行順序を示す図、第4図
は第1桁目の相異度計算を示す図、第5図は桁経路情報
FB(l、m)、桁認繊カテゴリW(J、m)よシ判定
計算順序を示す図、N6図は前記引用文献の第289頁
から第290頁に記載されているアルゴリズム5をフロ
ーチャートで表わしたものである。ここで、mは入力パ
タンの時間点、nは標準パタンの時間点、Vは単語、l
は桁、Mは入力パタンの終端、Nvは第V番目の単語標
準パタンの終端、■は単語標準パタン数、Lminは入
力パタンの最小桁数、Lmaxは最大桁数である。相異
度計算は、初期条件(4)、(5)、(6)式のもとて
漸化式(γ)、(8)、(9)を第3図に示す領域lよ
)領域Lmaxまですなわち連続音声標準パタンの各桁
ごとに順に求めることでるる。初期条件の設定は第6図
のブロック1で行われる。次に第l桁目における相異度
計算は以下のように行われる。
Next, the calculation procedure of the HLB method will be explained using FIGS. 3 to 6. Figure 3 is a diagram showing the progression order of difference degree calculation, Figure 4 is a diagram showing the difference degree calculation of the first digit, Figure 5 is digit route information FB (l, m), digit recognition fiber category Figure N6, which is a diagram showing the W(J, m)-wise determination calculation order, is a flowchart representing Algorithm 5 described on pages 289 to 290 of the cited document. Here, m is the time point of the input pattern, n is the time point of the standard pattern, V is the word, and l
is a digit, M is the end of the input pattern, Nv is the end of the Vth word standard pattern, ■ is the number of word standard patterns, Lmin is the minimum number of digits of the input pattern, and Lmax is the maximum number of digits. The dissimilarity calculation is performed using the initial conditions (4), (5), and (6) as the recurrence formula (γ), (8), and (9) in the region L shown in Fig. 3). In other words, each digit of the continuous speech standard pattern can be found in order. Setting of initial conditions is performed in block 1 of FIG. Next, the degree of difference calculation at the l-th digit is performed as follows.

相異度D(m、0)の初期値として前の桁の結果である
桁相異度DB(l−1,m)をセットしく第6図のブロ
ック2で行われる)、(7)、(8)、(9)式に示す
漸化式を第4図に示すように上限U(m)と下限L(m
)でかこまれた部分について計算する(第6図のブロッ
ク3.4で行われる)。ここで上限U(m)は第4図の
左側の線分AB((10)式に示されている)および上
側の線分BEを意味し、下限L(m)は下側の線分AC
および右側の線分CE((11)式に示されている)を
意味する。単語標準パタンの終端NYまで計算を行い、
その終端NYでの相異度D(m、NY)を単語相異度D
(v、m)とする(第6図のブロック5で行われる。1
個の単語標準パタンと計算した後単語相異度り、(v、
m)7)最小値を求め、その最小値を桁相異度DB()
1m)とし、その最小値が得られた単語標準パタンの属
するカテゴリvを桁認識カテゴリW(l、m)とし、そ
の最小値が得られたマツチング経路情報F(v、m)を
桁経路情報FB(l、m)とする(第6図のブロック6
で行われる)。このようにして第1桁目より第Lmax
桁目まで相異度計算を行った後、得られた桁経路情報F
B(l、m)と桁認識カテゴリW(l、m)より人力パ
タンの判定を行う。まず、入力パタンの終端Mにおける
各桁の桁相異度DB(l、N)より、許された桁すなわ
ちLmin桁よりLmax桁の間で最小値を求め、(第
6図のブロック7で行われる)、最小値の得られた桁り
が入力パタンの最終的に決定され九桁数である。つづい
て、第5図に示すように第L桁目の認識結果R(L)を
W(L、N)より得、また入力パタンの終端Nでの桁経
路情報FB(L。
The digit dissimilarity DB(l-1, m), which is the result of the previous digit, is set as the initial value of the dissimilarity D(m, 0) (this is done in block 2 of FIG. 6), (7), The recurrence formulas shown in equations (8) and (9) are converted into upper limit U(m) and lower limit L(m
) (carried out in block 3.4 of Figure 6). Here, the upper limit U(m) means the left line segment AB (shown in equation (10)) and the upper line segment BE in FIG. 4, and the lower limit L(m) means the lower line segment AC
and the line segment CE on the right (shown in equation (11)). Calculate up to the end NY of the word standard pattern,
The dissimilarity degree D (m, NY) at the terminal NY is the word dissimilarity degree D
(v, m) (performed in block 5 of Fig. 6.1
After calculating the word standard pattern, the word dissimilarity is (v,
m) 7) Find the minimum value and use the minimum value as digit dissimilarity DB ()
1m), the category v to which the word standard pattern whose minimum value was obtained belongs is defined as the digit recognition category W(l, m), and the matching path information F(v, m) from which the minimum value was obtained is the digit path information. FB(l,m) (block 6 in Fig. 6)
). In this way, the Lmax is calculated from the first digit.
After calculating the degree of difference up to the digit, the obtained digit path information F
The manual pattern is determined from B(l, m) and digit recognition category W(l, m). First, from the digit dissimilarity DB (l, N) of each digit at the end M of the input pattern, find the minimum value between the allowed digits, that is, between Lmin digit and Lmax digit. ), the obtained digit of the minimum value is finally determined as the nine-digit number of the input pattern. Subsequently, as shown in FIG. 5, the L-th digit recognition result R(L) is obtained from W(L, N), and the digit path information FB(L) at the terminal end N of the input pattern is obtained.

M)より第L−1桁目の終端を得る(第6図のブロック
8で行われる)。前記操作を順にくり返すことによって
、各桁での認識結果R(l)が得られる。
M) to obtain the end of the L-1st digit (performed in block 8 of FIG. 6). By repeating the above operations in order, a recognition result R(l) for each digit can be obtained.

以上説明したように、HLB法では各桁で7回のDPマ
ツチングを行えばよいので、全体でLmax・V回のD
Pマッチングを必要としている。
As explained above, in the HLB method, it is only necessary to perform DP matching seven times for each digit, so there are a total of Lmax V times of DP matching.
P matching is required.

一方、特開昭51−104204号公報の方法ではM・
V回のDPマッチングが必要である。通常、入力パタン
の最大桁数Lmaxが5程度である場合には、フレーム
周期を20mgと想定すると、入カパタン長Mは100
程度となり、HLB法の計算量は大幅に少ないことにな
る。
On the other hand, the method disclosed in Japanese Patent Application Laid-Open No. 51-104204
V times of DP matching are required. Normally, when the maximum number of digits Lmax of the input pattern is about 5, and assuming the frame period is 20 mg, the input pattern length M is 100.
This means that the amount of calculation for the HLB method is significantly smaller.

音声認識装置において認識応答時間は、音声の終端が検
出されてから認識結果を出力するまでの時間である。と
ころで、HLB法においては、第1桁目のマツチングに
必要な入力パタンが得られた後、第1行目のマツチング
が開始され、順次第Lmax桁目までマツチングを行い
、認識結果が得られる。その途中の第l桁目に関しては
、第4図に示した右上隅のE点(m、、n、)まで入力
パタンが得られた時、すなわち連続音声標準パタンの第
l桁目までの最大パタン長をno、単語標準パタンの最
大パタン長をNmaxとすれば、E点の座標の関係より n、=L(m、)・・・・・・(14)であり であるので m、=2・Nmax・l−1・・・・・・(16)とな
り、2・Nmax・l−1点まで入力パタンが得られた
時第l桁目のマツチングを行うことができる。今、入力
パタンはL桁で各桁の平均単語長をNとし、L=Lma
xと仮定すれば、(16)式へm、=L・Nを代入する
ととなり、入力音声の終端が検出された時点では’Lm
ax桁までの計算しか進めることはできず、残りのLm
ax桁に関してはその後で計算することになり、このL
max桁分の計算時間が認識応答時間となり、大きな遅
れを持つ仁とになる。一方、この認識応答時間を短くす
るためには、短くするためには、並列処理やパイプライ
ン処理ができる複雑な高速演算器を必要とする。
In a speech recognition device, the recognition response time is the time from when the end of speech is detected to when the recognition result is output. By the way, in the HLB method, after the input pattern necessary for matching the first digit is obtained, matching of the first line is started, and matching is performed sequentially up to the Lmax digit to obtain a recognition result. Regarding the lth digit in the middle, when the input pattern is obtained up to point E (m,, n,) in the upper right corner shown in Figure 4, that is, the maximum value up to the lth digit of the continuous speech standard pattern. If the pattern length is no and the maximum pattern length of the word standard pattern is Nmax, then from the relationship of the coordinates of point E, n, = L(m,) (14), so m, = 2.Nmax.l-1 (16), and when the input pattern is obtained up to 2.Nmax.l-1 points, matching of the l-th digit can be performed. Now, the input pattern has L digits, and the average word length of each digit is N, and L=Lma
If it is assumed that
The calculation can only proceed up to ax digits, and the remaining Lm
The ax digit will be calculated later, and this L
The calculation time for max digits becomes the recognition response time, resulting in a response with a large delay. On the other hand, in order to shorten this recognition response time, a complex high-speed arithmetic unit capable of parallel processing or pipeline processing is required.

本発明の目的は、上記HLB法を改良するととにより、
認識応答時間を短縮させ、さらに全体の計算量を少なく
し、これにより経済的な連続音声認識装置を提供するこ
とにある。
The purpose of the present invention is to improve the above HLB method, and to
It is an object of the present invention to provide an economical continuous speech recognition device by shortening the recognition response time and reducing the overall amount of calculation.

このためHLB法の計算順序を入れ換えて、本発明の原
理であるVLB法と呼ぶ新規な計算原理を導出する。H
LB法においては第6図のフローチャートに示すように
、各単語標準パタンと入力パタンとの相異度の針算紘、
初めに各単語標準バタンと入力パタンと計算を行い、次
に桁を1つ上げ同様の計算を行っている。すなわち第6
図のブロック3と4に示す計算のルーズの順序は一番内
側より、単語標準パタンの時間点n、入カパタンの時間
点m、単語標準パタンの番号v、桁の番号lである。こ
こで前記計算のループの順序を入れ換え、第7図のフロ
ーチャートに示すように、一番外側を入力パタンの時間
点mにすることが可能であることを示す。DPマツチン
グの時間正規化関数n−は単調増加関数であるので、第
l桁目の初期値DH(l−1、m−1)は、入力パタン
の時間点m−1以前のデータによって決定されている。
Therefore, the calculation order of the HLB method is changed to derive a new calculation principle called the VLB method, which is the principle of the present invention. H
In the LB method, as shown in the flowchart of Figure 6, the degree of dissimilarity between each word standard pattern and the input pattern is calculated,
First, calculations are performed using the standard button and input pattern for each word, and then the same calculation is performed by increasing the digit by one. That is, the sixth
The loose order of calculations shown in blocks 3 and 4 of the figure is, from the innermost side, the time point n of the word standard pattern, the time point m of the input pattern, the number v of the word standard pattern, and the digit number l. Here, it is shown that it is possible to change the order of the calculation loop and set the outermost point to time point m of the input pattern, as shown in the flowchart of FIG. Since the time normalization function n- of DP matching is a monotonically increasing function, the initial value DH (l-1, m-1) of the lth digit is determined by the data before time point m-1 of the input pattern. ing.

すなわち入力パタンの時間点m−1以前のすべての点に
おいて相異度計算が終了しているならば、入力パタンの
時間点mにおける相異度計算を行うことができる。すな
わち、第8図の斜線部分に示すようにn軸に平行で各桁
を含む縦1列の相異度計算を行うことができる。仁の各
桁を含む縦1列の相異度計算には各桁での初期値DB(
l−1,m−1)と各桁のm−1点における相異度D(
m−1,n)が必要であり、これらはm−1点での計算
にて求められている。ただし、m−1点における相異度
D(mt、n)および経路情報F(m−1、n)を各桁
l各単語Vについて記憶しておく必要がある。このため
桁l、単語Vにおける相異度D(m−1,n)およびF
(m−le”)をそれぞれD(l、v、n)およびF(
l、v、n)で示す。このD(l、v、n)とF(l、
v、n)の構成を第15図に示す。
That is, if the degree of dissimilarity calculation has been completed at all points before the time point m-1 of the input pattern, the degree of dissimilarity calculation at the time point m of the input pattern can be performed. That is, as shown in the shaded area in FIG. 8, it is possible to calculate the degree of dissimilarity in one vertical column that is parallel to the n-axis and includes each digit. To calculate the dissimilarity of one vertical column including each digit of jin, use the initial value DB (
l-1, m-1) and the degree of dissimilarity D(
m-1, n) are required, and these are obtained by calculation at the m-1 point. However, it is necessary to store the degree of dissimilarity D (mt, n) at point m-1 and the route information F (m-1, n) for each digit V and each word V. Therefore, the degree of dissimilarity D (m-1, n) and F at digit l and word V
(m-le”) respectively D(l, v, n) and F(
l, v, n). This D(l, v, n) and F(l,
v, n) is shown in FIG. 15.

このように計算順序を入れ換えたVLB法の計算手順を
第7図と第8図を用いて説明する。相異度計算は、動的
計画の漸化式を第8図に示すように上限U(ホ)と下限
L−の間の領域内で入力パタンの時間軸mの順に求める
ことである。VLB法における相異度計算の初期条件は D(l、v、n)∞・・・・・・(17)l=1〜Lm
ax、v=1〜V、n=1〜NvDB(l、m)=∞・
・・・・・(18)l=0〜Lmax、m=0〜M DB(0,0)=0・・・・・・(18)であり、第7
図のブロックlで行われる。次に入力パタンの時間点m
におけるn軸に平行な縦1列の相異度計算は以下のよう
に行われる。初めに入力パタンの時間点mの特徴ベクト
ルam、と第V番目の単語標準パタンbyとの間のベク
トル距離を(8)式により求める(第7図のブロック2
で行われる)。つづいて各桁において縦1列の相異度計
算を行う。この縦1列の相異度計算は、初期値をD(l
、v、0)=DB(l−1,m−1)・・・・・・(2
0)F(l、v、0)=m−1・・・・・・(21)と
して(第7図のブロック3で行われる)、漸化式 ただし をU(m)とL(m)の間でnを減少させる方向で計算
する(第7図のブロック4で行われる)。第2図に示す
ように(m、n)点の計算は(m−1,n)、(m−1
,n−1)、(m−t、n−2)の3点の相異度より求
められる。次の(m、n−1)点の計算は(m−t、n
−1)、(m−1、n−2)、(m−1、n−3)の3
点の相異度より求められ(m−1、n)点の相異度は使
用しないので(m、n)点の計算結果を(m−1、n)
点へ記憶しても(m、n−1)点の計算に影譬を与えな
い。
The calculation procedure of the VLB method in which the calculation order is changed in this way will be explained using FIGS. 7 and 8. The dissimilarity calculation is to obtain the recurrence formula of the dynamic programming in the order of the time axis m of the input pattern within the region between the upper limit U (e) and the lower limit L-, as shown in FIG. The initial condition for dissimilarity calculation in the VLB method is D(l, v, n)∞ (17) l = 1 ~ Lm
ax, v=1~V, n=1~NvDB(l, m)=∞・
...(18) l = 0 to Lmax, m = 0 to M DB (0,0) = 0 (18), and the seventh
This is done in block l of the figure. Next, the time point m of the input pattern
The dissimilarity calculation for one vertical column parallel to the n-axis is performed as follows. First, the vector distance between the feature vector am at time point m of the input pattern and the Vth word standard pattern by is calculated using equation (8) (block 2 in Figure 7).
). Next, a dissimilarity calculation is performed in one vertical column for each digit. In this vertical column dissimilarity calculation, the initial value is D(l
,v,0)=DB(l-1,m-1)...(2
0) F(l, v, 0) = m-1... (21) (performed in block 3 of Figure 7), the recurrence formula is expressed as U(m) and L(m) (This is done in block 4 of FIG. 7.) As shown in Figure 2, the calculations for (m, n) points are (m-1, n), (m-1
, n-1) and (m-t, n-2). The calculation for the next (m, n-1) point is (m-t, n
-1), (m-1, n-2), (m-1, n-3) 3
It is calculated from the dissimilarity of the points (m-1, n).Since the dissimilarity of the point is not used, the calculation result of the (m, n) point is (m-1, n)
Even if it is stored in the point (m, n-1), it does not affect the calculation of the point (m, n-1).

ゆえにnを減少させる方向で計算を進めれば、m−1点
の相異度とm点の相異度の記憶エリアを共有することが
できる。上記晰化式計算を縦1列実行した後、単語標準
パタンの終端Nvにおける相異度D(l、v、Nv)と
それまで計算された最小単語相異度である桁相異度DB
(l、m)と比較し、得られた相異度D(l、v、Nv
)の方が小さい場合は、その相異度D(l、v、NY)
を桁相異度DB(l、m)とし、その単語標準パタンの
属するカテゴリVを桁認識カテゴリW(l、m)とし、
その相異度D(l、v、NY)が得られたマッチング経
路情報F(l、v、Nv)を桁経路情報FB(l,m)
とする(第7図のブロック5で行われる)。このように
して行われる縦1列の相異度計算(第7図のブロック2
,3.4.5の計算)をV個の単語標準パタンについて
実行する。次に入力パタンの時間点mを1つ増加して同
様の縦1列の相異度計算を7個の単語標準パタンについ
て実行し、入力パタンの終端Mまで求める。最後に桁経
路情報FB(l、m)と桁認識カテゴリW(l、m)よ
り入カパタンの判定を行う。
Therefore, if the calculation proceeds in the direction of decreasing n, the storage area for the dissimilarity of the m-1 point and the dissimilarity of the m point can be shared. After executing the above clarification formula calculation in one column, the dissimilarity D (l, v, Nv) at the end Nv of the word standard pattern and the digit dissimilarity DB which is the minimum word dissimilarity calculated so far
(l, m), and obtained dissimilarity D(l, v, Nv
) is smaller, its dissimilarity D(l, v, NY)
Let be the digit dissimilarity degree DB (l, m), let the category V to which the word standard pattern belongs be the digit recognition category W (l, m),
The matching route information F(l, v, Nv) from which the degree of dissimilarity D(l, v, NY) was obtained is converted into the digit route information FB(l, m)
(performed in block 5 of FIG. 7). Dissimilarity calculation for one vertical column performed in this way (block 2 in Figure 7)
, 3.4.5) are performed for V word standard patterns. Next, the time point m of the input pattern is increased by one, and the same dissimilarity calculation in one vertical column is performed for seven word standard patterns to obtain the end point M of the input pattern. Finally, the input pattern is determined based on the digit path information FB (l, m) and the digit recognition category W (l, m).

この判定の方法はHLB法の判定方法と同様である。ま
ず、入力パタンの終端Mにおける各桁の桁相異度DB(
l、N)より許された桁すなわちLmin桁よりLma
x桁の間で最小値を求め(第7図のブロック6で行われ
る)、最小値の得られた桁Lが入力パタンの桁数である
。さらに第L桁目の認識結果R(L)をW(L、M)よ
り得、また桁経路情報FB(L、M)より第L−1桁目
の終端を得る(第7図のブロック7で行われる)。前記
操作を順にくり返すことによって各桁での認識結果R(
l)が得られる。
This determination method is similar to the determination method of the HLB method. First, digit difference degree DB (
l, N), that is, Lmin digit, Lma
The minimum value is found among x digits (this is done in block 6 of FIG. 7), and the digit L for which the minimum value is obtained is the number of digits of the input pattern. Furthermore, the recognition result R(L) of the L-th digit is obtained from W(L, M), and the termination of the L-1st digit is obtained from the digit path information FB(L, M) (block 7 in FIG. ). By repeating the above operations in order, the recognition result R(
l) is obtained.

本発明の連続音声認識装置は前記のVLB法を実行する
装置であるから次のような各部を必要とする。すなわち
、入カパタンAと連続音声標準パタンC=Bvl、Bv
2、・・・、Bvl、・・・、BvLmaxと、以下の
各部に対して入力パタンの時間点を不す信号mを1から
Mまで変化させ、各mに関して単語を示す信号Vを1か
ら■まで変化させ、さらに各Vに関して桁を示す信号l
を1からLmaxまでおよび標準パタンの時間点を示す
信号nを1からNvtで変化させて与える制御部と、上
記制御部の信号l、v、nによって番地指定される相異
度メモリ部D(l、v、n)と、経路情報メモリ部F(
l、v、n)とを有し、各時間点mにおいて前記制御部
より順次指定される単語Vの単語標準パタンb、v、n
=1〜Nvと入力パタンamとのベクトル間距離d(a
m、bnv)n=l〜N7を求める距離計算部と;この
距離を記憶する距離メモリ部d(n)と、各時間点mに
おいて、各桁l、および各単語vに関して最初に初期条
件を時間点m−1の結果である桁相異度DB(lー1.
m−1)と桁経路情報FB(l−1、m−1)により与
え、前記距離d(n)と時間点m−1における相異度D
(l、v、n)と経路情報F(l、v、n)とを参照し
て動的計画の漸化式を計算し時間点mにおける相異度D
(l,v、n)と経路情報F(l、v、n)を順次求め
、単語相異度D(l、V、NY)と単語経路情報F(l
,v、Nv)を求める漸化式計算部と;各時間点mにお
いて、各桁lに関して前記漸化式計算部で求められた各
単語相異度D(l、v、NY)の中より最小を求め、こ
れを桁相異度DB(l,m)とし、これに対応した単語
経路情報F(l、v、NY)を桁経路情報FB(l,m
)とし、最小値が得られた単語各vを桁認織カテゴリW
(l、m)とする桁相異度計算部と;これらを記憶する
ための桁相異度メモリ部DB(l、m)と桁経路情報メ
モリ部FB(l、m)と、桁認識カテゴリメモリ部W(
l、m)と、桁経路情報FB(l,m)と桁g、mカテ
ゴリW(l、m)に基づいて逆順に入力パタンの各桁の
カテゴリを判定し出力する判定部とを有している。
Since the continuous speech recognition device of the present invention is a device that executes the above-mentioned VLB method, it requires the following parts. That is, input pattern A and continuous voice standard pattern C = Bvl, Bv
2, ..., Bvl, ..., BvLmax, and the signal m that misses the time point of the input pattern for each part below is varied from 1 to M, and the signal V indicating a word for each m is varied from 1 to M. ■ A signal l indicating the digit for each V
from 1 to Lmax and a signal n indicating the time point of the standard pattern by varying it from 1 to Nvt, and a dissimilarity memory section D (addressed by the signals l, v, n of the control section). l, v, n) and the route information memory section F(
l, v, n), and word standard patterns b, v, n of the word V that are sequentially specified by the control unit at each time point m.
= 1~Nv and the input pattern am vector distance d(a
m, bnv) n=l~N7; a distance memory unit d(n) that stores this distance; and at each time point m, initial conditions are first set for each digit l and each word v. Digit dissimilarity DB (l-1.
m-1) and the digit path information FB (l-1, m-1), and the distance d(n) and the degree of dissimilarity D at the time point m-1
(l, v, n) and the route information F(l, v, n) to calculate the recurrence formula of the dynamic program and calculate the dissimilarity degree D at time point m.
(l, v, n) and route information F(l, v, n) are sequentially obtained, word dissimilarity degree D(l, V, NY) and word route information F(l
, v, Nv); at each time point m, from each word dissimilarity degree D(l, v, NY) calculated by the recurrence formula calculation unit for each digit l; Find the minimum, set this as digit dissimilarity DB(l,m), and set the corresponding word path information F(l, v, NY) as digit path information FB(l,m
), and each word v for which the minimum value was obtained is defined as a digit recognition category W
(l, m); a digit difference memory unit DB (l, m) for storing these, a digit path information memory unit FB (l, m), and a digit recognition category. Memory part W (
l, m), and a determination unit that determines and outputs the category of each digit of the input pattern in reverse order based on the digit path information FB (l, m) and the digit g, m categories W (l, m). ing.

このように本発明の原理であるVLB法を用いれば相異
度計算を入力パタンの時間軸方向に進めることができる
。とれによって音声の入力が検出されるとすぐ計算を開
始し、音声の入力に同期して順次計算することができる
ので音声の終了と同時に第7図のブロック6、7の判定
処理を始めることができる。したがって従来技術である
HLB法に比較し、認識応答時間が短縮できることにな
る。また、距離計算は、HLB法では第6図のプロック
3に示すようにn、m、v、lのループで囲まれている
が、VLB法で線絡7図のプロック3で示すようにn、
v、mのループで囲まれている。すなわちHLB法にお
ける距離計算の回数はNv。
In this way, by using the VLB method, which is the principle of the present invention, the dissimilarity calculation can proceed in the time axis direction of the input pattern. As soon as a voice input is detected due to a break, calculations can be started, and the calculations can be performed sequentially in synchronization with the voice input, so it is possible to start the determination process of blocks 6 and 7 in FIG. 7 at the same time as the voice ends. can. Therefore, compared to the conventional HLB method, the recognition response time can be shortened. In addition, distance calculation is surrounded by a loop of n, m, v, l as shown in block 3 in Figure 6 in the HLB method, but n, as shown in block 3 in diagram 7 in the VLB method. ,
It is surrounded by a loop of v and m. That is, the number of distance calculations in the HLB method is Nv.

M・■・Lmaxであり、TLB法における距離計算の
回数はN’−V、Mである。したがって従来技術である
HLB法に比較し、距離計算の計算量が1/Lmaxに
減少できることになる。
M.■.Lmax, and the number of distance calculations in the TLB method is N'-V,M. Therefore, compared to the conventional HLB method, the amount of distance calculation can be reduced to 1/Lmax.

次に本発明の装置の具体的構成を図面を参照しながら説
明する。第9図は、本発明の一構成例を示すブロック図
であり、第10図は制御指令信号のタイムチャートであ
る。制御部10は、m1。
Next, the specific configuration of the apparatus of the present invention will be explained with reference to the drawings. FIG. 9 is a block diagram showing a configuration example of the present invention, and FIG. 10 is a time chart of control command signals. The control unit 10 is m1.

n1、v1などの制御指令信号を第10図に示すように
発することによって、他の各部を制御する機能を持つが
、その詳細は他の各部の動作に関連してその都度説明す
る。人力部11は、信号Spee−chinで与えられ
る入力音声を分析し一定時間ごとに特徴ベクトルを出力
する。この音声分析は例えば、多チャンネルのフィルタ
より構成されるフィルタバンクによる周波数分析などが
ある。また入力部11には入力音声のレベルを監視し、
音声の始端、終端を検出する機能を持ち、その検出した
時点を制御部10へ信号SPにより伝える。
It has a function of controlling other parts by issuing control command signals such as n1 and v1 as shown in FIG. 10, but the details will be explained each time in relation to the operation of the other parts. The human power section 11 analyzes the input speech given by the signal Spee-chin and outputs a feature vector at regular intervals. This audio analysis includes, for example, frequency analysis using a filter bank composed of multi-channel filters. The input unit 11 also monitors the level of input audio,
It has a function of detecting the start and end of audio, and transmits the detected time to the control unit 10 by a signal SP.

入力パタンバッファ12は、音声の始端が検出された後
、信号m3に従って入力部11より与えられる特徴ベク
トルamを記憶する。信号m3は入力パタンの時間点m
に対応した信号である。標準パタンメモリ部13は、7
個の単語標準パタンB1、B2.・・・Bvを記憶し、
糠準パタン長メモリ部14は単語標準パタンBvの長さ
Nvを記憶している。
The input pattern buffer 12 stores the feature vector am given from the input unit 11 in accordance with the signal m3 after the start of the voice is detected. Signal m3 is time point m of the input pattern
This is a signal corresponding to The standard pattern memory section 13 has 7
word standard patterns B1, B2. ...Remember Bv,
The bran standard pattern length memory section 14 stores the length Nv of the word standard pattern Bv.

信号vlは連続音声標準パタンの単語vに対応する信号
であり、制御部10は、信号v1に従って、標準パタン
長メモリ部14より単語標準パタンBvの長さNvを読
み出し、単語標準パタンの時間点nに対応する信号n1
を発生する。信号n1に従りて入力パタンバッファ12
より入カパタンの特徴ベクトルamが読み出され、標準
パタンメモリ部よりb1v、b2v、・・・、bvNv
が順次読み出され距離計算部15において(8)式が計
算され、距離d(n)、n=1.2・・・Nvが距離メ
モリ部16へ記憶される。
The signal vl is a signal corresponding to the word v of the continuous speech standard pattern, and the control unit 10 reads the length Nv of the word standard pattern Bv from the standard pattern length memory unit 14 according to the signal v1, and calculates the time point of the word standard pattern. signal n1 corresponding to n
occurs. Input pattern buffer 12 according to signal n1
The feature vector am of the input pattern is read out from the standard pattern memory section, and b1v, b2v, ..., bvNv are read out from the standard pattern memory section.
are sequentially read out, the distance calculation section 15 calculates the equation (8), and the distance d(n), n=1.2...Nv, is stored in the distance memory section 16.

距離計算部15において第11図に示すように初めに信
号n1にてアキュムレータ153がクリヤされ、入力パ
タンバッファ12と標準パタンメモリ部13よりr個の
データが読み込まれ、絶対値回路151にて絶対値を求
め、加算器152にて加算され、(8)式の距離Dia
(am、bnv)がアキュレータ153にて求まり、こ
の距離が距離メモリ部16へ出力される。
In the distance calculation section 15, as shown in FIG. The values are calculated and added by the adder 152, and the distance Dia of equation (8) is obtained.
(am, bnv) is determined by the accurator 153, and this distance is output to the distance memory section 16.

漸化式計算の初期値のセットは音声の入力される前に制
御部10の信号CLにより行われ、相異度メモリ部18
、桁相異度メモリ部21へ(17)、(18)、(19
)式で示した値がセットされる。
The initial value for the recurrence formula calculation is set by the signal CL of the control unit 10 before the voice is input, and the initial value is set by the signal CL of the control unit 10.
, to the digit difference memory unit 21 (17), (18), (19
) is set.

漸化式計算部17は、第7図のプロック4を行う部分で
あり、漸化式(22)、(23)(24)を実行する。
The recurrence formula calculation unit 17 is a part that performs block 4 in FIG. 7, and executes recurrence formulas (22), (23), and (24).

すなわち、漸化式計算部17は、第12図に示すように
3つの相異度レジスタD1、D2.D3と、その3つの
レジスタD1、D2.D3の最小値を計算する比較回路
171と、加算器172と、3つの経路レジスタF1、
F2、F3より構成される。制御部10より発せられた
信号n2によって相異度メモリ部18と経路メモリ部1
9より3つの相異度D(l、v、n)、D(l、v、n
−1)、D(l、v、n−2)と3つの経路情報F(l
、v、n)、F(l、v、n−1)、F(l、v、n−
2)を読み出しそれぞれ相異度レジスタD1.D2.D
3と経路レジスタF1、F2、F3へ格納する。比較回
路171は3つの相異度レジスタDI、D2.D3より
最小値を検出し、その最小値が得られた相異度レジスタ
ーDn(nは1、2、3のどれか)に対応した経路レジ
スタFnを選択するゲート信号nを発する。前記ゲート
信号nにより選択された経路レジスターFnの内容が経
路メモリ部19のF(l、v、m)へ格納される。また
、比較回路171より出力された相異度の最小値D(l
、v、n)は、距離メモリ部16より読み出された距離
d(n)と加算器172によって加算され、相異度メモ
リ部18ヘ格納される。
That is, the recurrence formula calculation unit 17 has three dissimilarity registers D1, D2 . D3 and its three registers D1, D2 . A comparison circuit 171 that calculates the minimum value of D3, an adder 172, three path registers F1,
Consists of F2 and F3. The dissimilarity memory section 18 and the route memory section 1 are controlled by the signal n2 issued from the control section 10.
9, the three dissimilarities D(l, v, n), D(l, v, n
-1), D(l, v, n-2) and three route information F(l
, v, n), F(l, v, n-1), F(l, v, n-
2) are read out and set in the respective difference registers D1. D2. D
3 and stored in route registers F1, F2, and F3. The comparison circuit 171 includes three dissimilarity registers DI, D2 . The minimum value is detected from D3, and a gate signal n is generated to select the path register Fn corresponding to the dissimilarity register Dn (n is any one of 1, 2, or 3) from which the minimum value was obtained. The contents of the route register Fn selected by the gate signal n are stored in F(l, v, m) of the route memory section 19. Further, the minimum value D(l
, v, n) are added to the distance d(n) read from the distance memory unit 16 by an adder 172, and stored in the dissimilarity memory unit 18.

この漸化式計算がn=U(m)よりL(m)まで算出さ
れ、この結果である単語相異度D(l、v、Nv)が各
vおよび各lに対して算出される。
This recurrence formula calculation is calculated from n=U(m) to L(m), and the resulting word dissimilarity D(l, v, Nv) is calculated for each v and each l.

桁相異度計算部20は、第7図のプロック5を行う部分
であり、V個の単語相異度D(l、v、Nv)の最小値
を逐次求める。すなわち、桁相異度計算部20は第13
図に示すように、比較回路201と、単語相異度D(l
、v、Nv)を保持するレジスタ202と、単語標準パ
タンの属するカテゴリvを保持するレジスタ203と、
経路情報F(l,v、Nv)を保持するレジスタ204
より構成される。
The digit dissimilarity calculation unit 20 is a part that performs block 5 in FIG. 7, and sequentially calculates the minimum value of V word dissimilarities D(l, v, Nv). That is, the digit difference calculation unit 20
As shown in the figure, the comparison circuit 201 and the word dissimilarity degree D(l
, v, Nv), and a register 203 that holds the category v to which the standard word pattern belongs.
Register 204 that holds route information F (l, v, Nv)
It consists of

信号l1は信号vl1つの区間にLmax個発生される
。この信号l1は、連続音声標準パタンの桁lに対応す
る信号である。制御部10より発せられた信号l1に従
い、相異度メモリ部18と経路メモシ部19より単語相
異度D(l,v、Nv)と単語経路情報F(l、v、N
v)が読み出され、それぞれレジスタ203と205へ
格納され、単語標準パタンの属するカテゴリvをレジス
タ204へ格納される。一方、比較回路201は前記単
語相異度D(l、v、Nv)と桁相異度メモリ部21よ
り読み出された桁相異度DB(l,m)と比較し、単語
相異度D(l、v、Nv)がより小さいと判定するとゲ
一ト信号vを発生する。ゲート信号vに従ってレジスタ
202,203.204に保持されていた単語相異度D
(l,v、Nv)、カテゴリv単語経路情報F(l、v
、Nv)がそれぞれ桁相異度メモリ部21のDB(l、
m)、桁認識カテゴリメモリ部22のW(l、m)、桁
経路メモリ部23のFB(l、m)へ格納される。さら
に制御部10より信号l1につづいて発せられる信号l
12によりて第7図のブロック3にて行われる部分であ
る縦1列の相異度計算の(20)、(21)式に示した
初期セットが行われる。すなわち桁相異度メモリ部21
よりDB(l、m−1)が読み出され、相異度メモリ部
18のD(l、v、0)へ格納され、経路メモリ部のF
(l、v、0)へm−1が格納される。判定部24は、
第7図のブロック6.7を行う部分であり、桁経路情報
FB(l,m)と桁認識カテゴリW(l、m)より入力
パタンの各桁の認識結果R(l)を出力する。すなわち
判定部24は第14図に示すように、比較回路241と
、最小桁相異度を保持するレジスタ242と、桁数を保
持するレジスタ243と、桁経路情報F(l、m)を保
持するレジスタ244と認識結果を保持するレジスタ2
45より構成される。音声の終端が検出されると入力部
11より信号SPによって制御部10に通知され、つづ
いて制御部lOは判定部24へ信号m1を発し、判定部
24は判定処理を開始する。判定制御部246は信号m
1を受けた彼、信号l3を桁相異度メモリ部21へ発す
る。
The signal l1 is generated Lmax times in one section of the signal vl. This signal l1 is a signal corresponding to digit l of the continuous voice standard pattern. According to the signal l1 issued from the control unit 10, the word dissimilarity degree D (l, v, Nv) and the word route information F (l, v, N
v) are read out and stored in registers 203 and 205, respectively, and the category v to which the word standard pattern belongs is stored in register 204. On the other hand, the comparison circuit 201 compares the word dissimilarity degree D(l, v, Nv) with the digit dissimilarity degree DB(l, m) read out from the digit dissimilarity memory unit 21, and determines the word dissimilarity degree. If it is determined that D(l, v, Nv) is smaller, a gate signal v is generated. Word dissimilarity degree D held in registers 202, 203, and 204 according to gate signal v
(l, v, Nv), category v word path information F(l, v
, Nv) are respectively DB(l, Nv) of the digit difference memory unit 21.
m), are stored in W(l,m) of the digit recognition category memory section 22, and FB(l,m) of the digit path memory section 23. Furthermore, a signal l is issued from the control unit 10 following the signal l1.
12, the initial setting shown in equations (20) and (21) of the dissimilarity calculation for one vertical column, which is the part performed in block 3 of FIG. 7, is performed. In other words, the digit difference memory section 21
DB(l, m-1) is read out, stored in D(l, v, 0) of the dissimilarity memory section 18, and stored in F of the path memory section.
m-1 is stored in (l, v, 0). The determination unit 24
This is the part that performs block 6.7 in FIG. 7, and outputs the recognition result R(l) of each digit of the input pattern from the digit path information FB(l,m) and the digit recognition category W(l,m). That is, as shown in FIG. 14, the determination unit 24 includes a comparison circuit 241, a register 242 that holds the minimum digit difference, a register 243 that holds the number of digits, and digit path information F (l, m). register 244 to hold the recognition result and register 2 to hold the recognition result.
It consists of 45 pieces. When the end of the voice is detected, the input section 11 notifies the control section 10 by a signal SP, and the control section 10 then issues a signal m1 to the determination section 24, and the determination section 24 starts determination processing. The determination control unit 246 receives the signal m
1, he issues a signal l3 to the digit difference memory section 21.

信号l3に従って、桁相異度メモリ部21より入力パタ
ンの終端Mでの桁相異度DB(l、N)が順次読み出さ
れ、比較回路241によって逐次最小値を求めレジスタ
Dへ格納され、その時の桁数lがレジスタLへ格納され
る。信号l3に従って、Lmax個の桁相異度が読み出
された後、レジスタLの内容が入力パタンの桁数を示し
ている。判定制御部246はl=L、m=Mとしてアド
レス信号m2を桁経路メモリ部23と桁認識カテゴリメ
モリ部22へ発し、FB(L、M)とW(L、M)が読
み出され、レジスタFとレジスタRへ格納される。
According to the signal l3, the digit disparity DB(l, N) at the end M of the input pattern is sequentially read out from the digit disparity memory unit 21, and the minimum value is sequentially determined by the comparator circuit 241 and stored in the register D. The number of digits l at that time is stored in register L. After Lmax digit differences are read out according to signal l3, the contents of register L indicate the number of digits of the input pattern. The determination control unit 246 issues an address signal m2 to the digit path memory unit 23 and digit recognition category memory unit 22 with l=L and m=M, and FB (L, M) and W (L, M) are read out. Stored in register F and register R.

レジスタRの内容が認識結果として出力される。The contents of register R are output as the recognition result.

さらに判定制御部246はl=l−、m=Fとしてアド
レス信号m2を桁経路メモリ部23と桁認識力テゴリメ
モリ部22へ発し、FB(l,m)とW(l、m)が読
み出されレジスタFとレジスタに格納される。この処理
を順次Lより1まで操り返すことによりL桁の認識結果
がレジスタRより出力される。
Furthermore, the determination control unit 246 issues an address signal m2 to the digit path memory unit 23 and the digit recognition ability category memory unit 22 with l=l− and m=F, and FB(l, m) and W(l, m) are read out. and stored in register F and register. By repeating this process sequentially from L to 1, the recognition result of L digits is output from register R.

以上、本発明の原理とその一構成例を説明したが、これ
らの記載は本発明の範囲を限定するものではない。特に
本発明の原理であるVLB法の説明において計算のルー
プの順序を一番内側よりn・l、v、mとしたが、l、
n、v、mすることもVLB法を導出した同様な理由に
より可能である。
Although the principle of the present invention and one configuration example thereof have been explained above, these descriptions do not limit the scope of the present invention. In particular, in the explanation of the VLB method, which is the principle of the present invention, the order of the calculation loops is n・l, v, m from the innermost, but l,
It is also possible to use n, v, and m for the same reason as the reason for deriving the VLB method.

また、桁相異度DB(l、m)、桁経路情報FB(l、
m)、桁認識カテゴリW(l、m)より入力パタンの判
定を行う部分の説明において、DB(l、M)の最小値
を求め入力パタンの桁数を判定しているが、IEEE
TRANSACTIONS ON ACOUSTICS、
SPEECH、AND SIGNAL PROCESSI
NG。
In addition, digit difference degree DB (l, m), digit route information FB (l,
m), in the explanation of the part in which the input pattern is determined from the digit recognition category W (l, m), the minimum value of DB (l, M) is determined and the number of digits of the input pattern is determined.
TRANSACTIONS ON ACUSTICS,
SPEECH, AND SIGNAL PROCESSI
NG.

VOL ASSP−27,DECEMBER1979第
588頁より第595頁に記載されているような制約条
件のもとて入力パタンの桁数を判定する方法も可能であ
る。
It is also possible to determine the number of digits of an input pattern under constraints such as those described in VOL ASSP-27, DECEMBER 1979, pages 588 to 595.

さらに、入力パタンamと標準パタンbnvとの距離を
(8)式のような距離尺度を用いて説明したが、このか
わりに(25)式のようなユークリッド距離、(26)
式のような内積等を用いてよい。
Furthermore, although the distance between the input pattern am and the standard pattern bnv was explained using a distance measure such as equation (8), instead of this, the Euclidean distance as shown in equation (25),
You may use an inner product, etc. as shown in Eq.

また、相異度を計算するための漸化式は(22)、(2
3)、(24)式の形の他にも種々前えられ、この(2
2)、(23)、(24)式の代わりに特公告56−2
8278号に記載されている形も使用できることは明白
である。
Also, the recurrence formula for calculating the degree of dissimilarity is (22), (2
In addition to the forms of equations 3) and (24), various forms have been prepared, and this (2)
2), (23), and (24) instead of Special Publication 56-2
It is clear that the forms described in No. 8278 can also be used.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は相異度計算を行う範囲および、マツチング経路
の例を示した図であり、第2図は漸化式において許され
ているマツチング経路を示した図であり、第3図はHL
B法の計算順辱を示した図であり、第4図はHLB法に
おける第l桁目の計算順序を示した図であり、第5図は
、判定処理の計算順序を示した図であり、第6図(1)
および(2)はHLB法の計算手順を示すフローチャー
トであり、第7図(1)および(2)は本発明の原理で
あるVLB法の計算手順を示すフローチャートであり、
第8図はVLB法の計算順序を示した図であり、第9図
は本発明の一実施例の構成図であり、第10図は本発明
の実施例の動作を説明するためのタイムチャートであい
、第11図は本発明の一構成要素の一つである距離計算
部の構成図であり、第12図は漸化式計算部の構成図で
あり、第13図は桁相異度計算部の構成図であり、第1
4図は判定部の構成図であり、第15図は相異度メモリ
部、経路情報メモリ部の構成図であり、第16図は桁相
異度メモリ部、桁経路情報メモリ部、桁紹臓カテゴリメ
モリ部の構成図である。 第9図、第11図、第12図、第13図、第14図にお
いて、10・・・・・・制御部、11・・・・・・入力
部、12・・・・・・入力パタンバッファ、13・・・
・・・標準パタンメモリ部、14・・・・・・標準パタ
ン長メモリ部、15・・・・・・距離計算部、16・・
・・・・距離メモリ部、17・・・・・・漸化式計算部
、18・・・・・・相異度メモリ部、19・・・・・・
経路情報メモリ部、20・・・・・・桁相異度計算部、
21・・・・・・桁相異度メモリ部、22・・・・・・
桁認識カテゴリメモリ部、23・・・・・・桁経路情報
メモリ部、24・・・・・・判定部、151・・・・・
・絶対値回路、152・・・・・・加算器、153・・
・・・・アキュムレータ、171・・・・・・比較回路
、172・・・・・・加算器、D1、D2.D3・・・
・・・相異度を保持するレジスタ、F1、F2、F3・
・・・・・経路を保持するレジスタ、201・・・・・
・比較回路、202・・・・・・単語相異度を保持する
レジスタ、203・・・・・・カテゴリを保持するレジ
スタ、204・・・・・・経路情報を保持するレジスタ
、241・・・・・・比較回路、242・・・・・・最
小桁相異度を保持するレジスタ、243・・・・・・桁
数を保持するレジスタ、244・・・・・・桁経路情報
を保持するレジスタ、245・・・・・・認識結果を保
持し出力するレジスタ、246・・・・・・判定制御部
である。 第1図 第2図 第3図 入力パタン 第4図 556− 拾5図 入力パタン 第10図 y+4’IJ(21%)−−・L(η 第11図 第12図 第13図 第14図 り一−−−−−−−−−−−−−−−−−−−−」第1
5図 1□V−V 第16図 0−一−−−−−◆7FLM 手続補正書(自発) 58.2゜2日 昭和年月日 特許庁長官殿 1、事件の表示昭和s6年特許願第1971141号2
、発明の名称連続音声認識装置 3、補正をする者 事件との関係出願人 東京都港区芝五丁目33番1号 4、代理人 〒108東京都港区芝五丁目37番8号住友三田ビル日
本電気株式会社内 (6591)弁理士内原晋 電話東京(03)456−3111(大代表)5、補正
の対象 明細書の「特許請求の範囲」、「発明の詳細な説明」の
欄および「図面」。 6、補正の内容 囚「特許請求の範囲」の欄 別紙のとおり @「発明の詳細な説明」の欄 (2)第15頁第5行目に「短くするためには。 短くするためには、」とあるのを「短くするためには、
」と補正する。 (3)第17頁第11行目にrn(4Y、n)”Jとあ
るのをrD(1,Y、n)=a■」と補正する。 (4)第22頁第14行目にrW(4m)と、」とある
のをrW(4m)と;」と補正する。 (5)第25頁第7行目に「初めに信号nlにて」とあ
るのを「初めに信号Ct153にて」と補正する。 (6)第25頁第9行目に「13よりr個の」とあるの
を「13より信号rlに従って1個の」と補正する。 (7)第25頁第1θ行目に「絶対値を求め」とあるの
を「差の絶対値を求め」と補正する。 (8)第26頁第5行目に「信号n2によって」とある
のを「信号n2.n21.n22によって」と補正する
。 (9)li26頁第17行目にrF(4v、m)Jとあ
るのを「F(4マ、n)」と補正する。 (10)第26頁第20行目に[メモリ部18Jとある
のを[メモリ部18のD(t、マ、n)」と補正する。 (11)第27頁第19行目に「203と205」とあ
るのを「202と204」と補正する。 021)第26頁第20行目に[204Jとあるのを「
203Jと補正する。 (13)第28頁第11行目に「信号t1につづいて発
せられる信号t2Jを「信号Cl2Jと補正す石。 α◇第28頁第15行目に「DB(4m−1)Jとある
のを「DB(t−1,m−1)Jと補正する。 (l)第29頁第15行目に「レジスタD」とあるのを
「レジスタ242」と補正する。 αの第29頁第16行目に「レジスタL」とあるのを「
レジスタ243」と補正する、αつ第29頁第18行目
に四」とあるのを[243Jと補正する。 αの第29頁第20行目に「m=」とあるのビt4゜■
2」と補正する。 (19)第30頁第2行目に「レジスタFとレジスタ几
」とあるのを「レジスタ244とレジスタ245」と補
正する。 (1)第30頁第3行目に「レジスタB」とあるのを「
レジスタ245」と補正する。 (21)111E30頁第4行目にrt−1+、tn=
FJとあるのを[L=1−1.m=(レジスタ244の
内容)」と補正する。 (2@第30頁第7行目に「レジスタFとレジスタ」と
あるのを「レジスタ244とレジスタ245」と補正す
る。 (qr図面」 ・本願添付図面の第7−1図、第9図、第10図、第1
1図、第12図、第13図および第14図を別紙図画と
差し替える。 別紙 2、特許請求の範囲 特徴ベクトルの時系列である1個以上の単語よりなる入
カパタン人=−□、J8.・・・+”ms・・”+7M
とあらかじめ記憶されている7個の単語標準パタンBY
=1)?、br、・・・、Tol、・・・、ToXv(
マ=1,2.・・・、■)全組合せて得られる最大LH
ax桁の連続音声標準パタ:/C−Bvl、Bvl、−
、BVl、・、BYLaaxとの間で入力パタンの時間
軸mと連続音声標準パタンの時間軸nとを対応させる時
間関数n−の上の入力パタンJ11mと連続音声標準パ
タンTo、とのベクトル間距離’(am、bn)の和と
して定義される相異度の最小値を求めるために、連続音
声標準パタンC==Bvl。 B1.・・・、BA、・・・I31xa*xを各桁ごと
に分割し。 第を桁目における最適な時間関数n−によって与えられ
るベクトル間距離の最小累積量を示す桁相異度DB(4
to)と、この時間関数の先頭時間点を示す桁経路情報
FB(4m)と、この時間関数上において最小累積距離
を与えた単語名Vである桁認識カテゴリW(j、m)と
を1桁tおよび入力パタンの時間点mに対して順次求め
、最後に入力パタンの桁数および各桁の認識結果を判定
する連続音声認識装置において、入力パタンの時間点を
示す信号mを1からMまで変化させ、各11に関して単
語を示す信号マを1からVまで変化させ、さらに各マに
関して桁を示す信号tを1からL1!Inxまでおよび
標準パタンの時間点を示す信号itlからNYまで変化
させて与える制御部と;前記制御部の信号t、マ、nに
よって番地指定される相異度メモリ部D(4v、n)と
経路情報メモリ部F(zt’t”)と;各時間点mにお
いて前記制御部より順次指定される単語マの単語標準パ
タンN、H=l−Jivと入力パタン−1とのベクトル
間距離’(a、、bnv)n=1%NYを求める距離計
算部と;この距離を記憶する距離メモリ部d(n)と;
各時間点mにおいて。 各桁t、および各単語マに関して最初に初期条件を時間
点m−1の結果である桁相異度DB(t−1゜m−1)
と桁経路情報FB(L−1,va−1)Kより与え。 前記距離dIn)と時間点m−1における相異度D(4
゜v、n)と経路情報F(4v、n)とを参照して動的
計画の漸化式を計算し時間点mにおける相異度D(4v
、n)と経路情報F(’t’m”)を順次求め、単語相
異度D(4マNV)と単語経路情報F(4マNV)を求
める漸化式計算部と;各時間点mにおいて、各桁tに関
して前記漸化式計算部で求められた各単語相異度D(4
v、NY)の中より最小を求め、これを桁相異度DB(
4m)とし、これに対応した単語経路情報F(4v、N
Y)を桁経路情報FB(4m)とし、最小値が得られた
単語名Vを桁認識カテゴ!JW(4m)とする桁相異度
計算部と;これらを記憶するための桁相異度メモリ部D
B(4m)と桁経路情報メモリ部FB(4m)と、桁認
識カテゴリメモリ部W(4m)とj桁経路情報FB(4
m)と桁認識カテゴリW(4m)に基づいて逆順に入力
パタンの各桁のカテゴリを判定し出力する判定部とを有
することを特徴とする連続音声認識装置。 第1Z回 nz、nzt、ηZ2
Figure 1 is a diagram showing the range for dissimilarity calculation and examples of matching paths, Figure 2 is a diagram showing matching paths allowed in recurrence formulas, and Figure 3 is a diagram showing HL
FIG. 4 is a diagram showing the calculation order of the first digit in the HLB method, and FIG. 5 is a diagram showing the calculation order of the determination process. , Figure 6 (1)
and (2) are flowcharts showing the calculation procedure of the HLB method, and FIGS. 7(1) and (2) are flowcharts showing the calculation procedure of the VLB method which is the principle of the present invention,
FIG. 8 is a diagram showing the calculation order of the VLB method, FIG. 9 is a block diagram of an embodiment of the present invention, and FIG. 10 is a time chart for explaining the operation of the embodiment of the present invention. Fig. 11 is a block diagram of the distance calculation section which is one of the components of the present invention, Fig. 12 is a block diagram of the recurrence formula calculation section, and Fig. 13 is a block diagram of the digit dissimilarity calculation section. This is a configuration diagram of the first part.
Fig. 4 is a block diagram of the determination section, Fig. 15 is a block diagram of the dissimilarity degree memory section and route information memory section, and Fig. 16 is a block diagram of the digit dissimilarity degree memory section, digit route information memory section, and digit introduction section. FIG. 2 is a configuration diagram of an organ category memory section. In FIG. 9, FIG. 11, FIG. 12, FIG. 13, and FIG. 14, 10... control section, 11... input section, 12... input pattern Buffer, 13...
...Standard pattern memory section, 14...Standard pattern length memory section, 15...Distance calculation section, 16...
... Distance memory section, 17 ... Recurrence formula calculation section, 18 ... Dissimilarity memory section, 19 ...
route information memory section, 20... digit difference calculation section,
21... Digit difference memory section, 22...
Digit recognition category memory section, 23... Digit route information memory section, 24... Judgment section, 151...
・Absolute value circuit, 152... Adder, 153...
. . . Accumulator, 171 . . . Comparison circuit, 172 . . . Adder, D1, D2. D3...
...Registers that hold the degree of difference, F1, F2, F3・
...Register that holds the route, 201...
Comparison circuit, 202...Register for holding word similarity, 203...Register for holding category, 204...Register for holding route information, 241... ... Comparison circuit, 242 ... Register that holds the minimum digit difference, 243 ... Register that holds the number of digits, 244 ... Holds digit route information 245...Register for holding and outputting recognition results, 246...Determination control unit. Fig. 1 Fig. 2 Fig. 3 Input pattern Fig. 4 556- Fig. 5 Input pattern Fig. 10 y+4'IJ (21%) -- L −−−−−−−−−−−−−−−−−−−−" 1st
5 Figure 1 □V-V Figure 16 0-1---◆7FLM Procedural amendment (spontaneous) 58.2゜2 Date Showa Date Mr. Commissioner of the Japan Patent Office 1, Indication of the case Patent application filed in Showa s6 No. 1971141 2
, Name of the invention Continuous speech recognition device 3, Person making the amendment Relationship to the case Applicant: 5-33-1-4, Shiba 5-chome, Minato-ku, Tokyo, Agent: Sumitomo Mita, 5-37-8 Shiba, Minato-ku, Tokyo 108 Building NEC Co., Ltd. (6591) Patent Attorney Susumu Uchihara Telephone Tokyo (03) 456-3111 (Main Representative) 5, "Claims" and "Detailed Description of the Invention" columns of the specification to be amended and "drawing". 6. Contents of the amendment: "Claims" column As shown in the attached sheet @ "Detailed Description of the Invention" column (2) Page 15, line 5, "To make it shorter. To make it shorter. ,” is changed to “In order to shorten it,
” he corrected. (3) In the 11th line of page 17, rn(4Y,n)"J is corrected to rD(1,Y,n)=a■". (4) In the 14th line of page 22, "rW(4m)" is corrected to "rW(4m);". (5) In the 7th line of page 25, the phrase "first with signal nl" is corrected to "first with signal Ct153." (6) On the 9th line of page 25, the phrase "r from 13" is corrected to "from 13, from 1 according to signal rl." (7) In the 1st θ line of page 25, the phrase "calculate the absolute value" is corrected to "calculate the absolute value of the difference." (8) In the fifth line of page 26, the phrase "by signal n2" is corrected to "by signal n2.n21.n22." (9) On page 26, line 17 of li, correct rF(4v, m)J to "F(4ma, n)". (10) In the 20th line of page 26, correct "memory section 18J" to "D(t,ma,n) of memory section 18". (11) Correct "203 and 205" in the 19th line of page 27 to "202 and 204." 021) On page 26, line 20, replace [204J with “
Corrected to 203J. (13) In the 11th line of page 28, it says, ``A stone that corrects the signal t2J that is emitted following the signal t1 as the signal Cl2J. (1) Correct "register D" on page 29, line 15 to "register 242.""RegisterL" on page 29, line 16 of α is replaced with "
The text "4" on the 18th line of page 29 is corrected to [243J]. Bit 4゜■ “m=” is written on page 29, line 20 of α
2”. (19) In the second line of page 30, "register F and register 几" is corrected to "register 244 and register 245." (1) On the third line of page 30, replace “Register B” with “
register 245”. (21) rt-1+, tn= on the 4th line of page 30 of 111E
The one that says FJ is [L=1-1. m=(contents of register 244)". (2@Page 30, line 7, "register F and register" is corrected to "register 244 and register 245". (qr drawings) - Figures 7-1 and 9 of the drawings attached to this application , Fig. 10, 1st
Replace Figures 1, 12, 13, and 14 with the attached drawings. Attachment 2, time series of claim feature vectors consisting of one or more words = -□, J8. ...+"ms..."+7M
7 standard word patterns BY that are pre-memorized as
=1)? ,br,...,Tol,...,ToXv(
Ma = 1, 2. ..., ■) Maximum LH obtained by all combinations
Continuous voice standard pattern of ax digits: /C-Bvl, Bvl, -
, BVl, ., BYLaax, the vector between the input pattern J11m on the time function n- that makes the time axis m of the input pattern correspond to the time axis n of the continuous voice standard pattern and the continuous voice standard pattern To. In order to find the minimum value of the degree of dissimilarity defined as the sum of distances' (am, bn), continuous speech standard pattern C==Bvl. B1. ..., BA, ...I31xa*x is divided into each digit. Digit dissimilarity DB (4
to), the digit path information FB (4m) indicating the first time point of this time function, and the digit recognition category W (j, m) which is the word name V that gave the minimum cumulative distance on this time function. In a continuous speech recognition device that sequentially calculates the digit t and the time point m of the input pattern, and finally determines the number of digits of the input pattern and the recognition result of each digit, the signal m indicating the time point of the input pattern is calculated from 1 to M. For each 11, the signal ma indicating a word is changed from 1 to V, and the signal t indicating a digit for each ma is changed from 1 to L1! a control unit that varies signals up to Inx and from itl to NY indicating time points of the standard pattern; and a dissimilarity memory unit D (4v, n) whose address is designated by the signals t, ma, and n of the control unit; Path information memory unit F(zt't''); inter-vector distance between the word standard pattern N, H=l-Jiv of the word matrix sequentially specified by the control unit at each time point m and the input pattern -1'(a,,bnv); a distance calculation unit that calculates n=1%NY; a distance memory unit d(n) that stores this distance;
At each time point m. For each digit t and each word mark, first set the initial condition to digit dissimilarity DB (t-1゜m-1) which is the result of time point m-1.
is given from the digit route information FB (L-1, va-1)K. The distance dIn) and the degree of dissimilarity D(4) at the time point m-1
゜v, n) and route information F(4v, n) to calculate the recurrence formula of the dynamic program and calculate the dissimilarity degree D(4v, n) at time point m.
. m, each word dissimilarity degree D(4
v, NY), and calculate this as the digit dissimilarity DB (
4m), and the corresponding word path information F(4v, N
Y) is the digit route information FB (4m), and the word name V for which the minimum value is obtained is the digit recognition category! A digit dissimilarity calculating section for calculating JW (4m); and a digit dissimilarity memory section D for storing these.
B (4m), digit route information memory section FB (4m), digit recognition category memory section W (4m), and j digit route information FB (4m).
m) and a determination unit that determines and outputs the category of each digit of an input pattern in reverse order based on the digit recognition category W (4m). 1st Z nz, nzt, ηZ2

Claims (1)

【特許請求の範囲】[Claims] 特徴ベクトルの時系列である1個以上の単語よシなる入
力パタンA=a1、a2、・・・、am、・・・、aM
とあらかじめ記憶されているV個の単語標準パタンBv
:=bv、’*b2v・・・、bH、・・・、bト(v
=1、2、・・・、V)を組合せて得られる最大Lma
x桁の連続音声標準パタンC=Bvl、Hvl、・・・
、Bvl、as+、BvLmaxとの間で入力パタンの
時間軸mと連続音声標準パタンの時間軸nとを対応させ
る時間関数n−の上の入力パタンamと連続音声標準パ
タンbmとのベクトル間距離d(am、bn)の和とし
て定義される相異度の最小値を求めるために、連続音声
標準パタンC=BV1゜By2・・・、Bvl、・・・
、BVLmaxを各桁ごとに分割し、第l桁目における
最適な時間関数n(m)によって与えられるベクトル間
距離の最小累積量を示す桁相異度DB(l、m)と、こ
の時間関数の先頭時間点を示す桁経路情報FB(l,m
)と、この時間関数上に、おいて最小累積距離を与えた
単語名Vである桁認識カテゴリW(l、m)とを、桁l
および入力パタンの時間点mに対して順次求め、最後に
入力パタンの桁数および各桁の認識結果を判定する連続
音声認識装置において、入力パタンの時間点を示す信号
mを1からMまで変化させ、各mに関して単語を示す信
号Vを1からVまで変化させ、さらに各Vに関して桁を
示す信号lを1からLmaxまでおよび標準パタンの時
間点を示す信号nを1からNvまで変化させて与える制
御部と;前記制御部の信号l、v、nによって番地指定
される相異度メモリ部D(l、v、n)と経路情報メモ
リ部F(l、v、n)とを有し各時間点mにおいて前記
制御部より順次指定される単語Vの単語標準パタンb、
v、n=1〜Nvと入力パタンamとのベクトル間距離
d(am、bl、v)n=1〜NVを求める距離計算部
と;この距離を記憶する距離メモリ部d(n)と;各時
間点mにおいて、各桁l、および各単語Vに関して最初
に初期条件を時間点m−1の結果である桁相異度DB(
l−1゜m−1)と桁経路情報FB(l−1、m−1)
によル与え、前記距離d(n)と時間点m−1における
相異度D(l、v、n)と経路情報F(l、v、n)と
を参照して動的計画の漸化式を計算し時間点mにおける
相異度D(l、v、n)と経路情報F(l、v、n)を
順次求め、単語相異度D(l、v、NY)と単語経路情
報F(l、v、Nv)を求める漸化式計算部と;各時間
点mにおいて、各桁lに関して前記漸化式計算部で求め
られ丸缶単語相異度D(l、v、Nv)の中よル最小を
求め、これを桁相異度DB(J、m)とし、これに対応
した単語経路情報F(l、v、Nv)を桁経路情報FB
(J、m)とし、最小値が得られた単語名Vを桁認識カ
テゴリW(l、m)とする桁相異度計算部と;これらを
記憶するための桁相異度メモリ部DB(l、m)と桁経
路情報メモリ部FB(l、m)と、桁認繊カテゴリメモ
リ部W(l、m)と、桁経路情報FB(l、m)と桁認
識カテゴリW(l、m)に基づいて逆順に入力パタンの
各桁のカテゴリを判定し出力する判定部とを有すること
を特徴とする連続音声認識装置。
Input pattern A of one or more words that is a time series of feature vectors A = a1, a2, ..., am, ..., aM
V word standard patterns Bv stored in advance as
:=bv,'*b2v...,bH,...,bto(v
= 1, 2, ..., V) maximum Lma obtained by combining
Continuous voice standard pattern of x digits C=Bvl, Hvl,...
, Bvl, as+, BvLmax, the vector distance between the input pattern am and the continuous speech standard pattern bm on the time function n- that makes the time axis m of the input pattern correspond to the time axis n of the continuous speech standard pattern. In order to find the minimum value of the degree of dissimilarity defined as the sum of d(am, bn), continuous speech standard pattern C=BV1°By2..., Bvl,...
, BVLmax is divided into each digit, and the digit dissimilarity DB(l, m) indicating the minimum cumulative amount of inter-vector distance given by the optimal time function n(m) at the l-th digit and this time function are calculated. Digit path information FB(l, m
) and the digit recognition category W(l, m) which is the word name V that gave the minimum cumulative distance on this time function.
In a continuous speech recognition device that sequentially calculates the time point m of the input pattern and finally determines the number of digits of the input pattern and the recognition result of each digit, the signal m indicating the time point of the input pattern is changed from 1 to M. For each m, the signal V indicating the word is varied from 1 to V, and for each V, the signal l indicating the digit is varied from 1 to Lmax, and the signal n indicating the time point of the standard pattern is varied from 1 to Nv. a dissimilarity memory section D (l, v, n) and a route information memory section F (l, v, n) whose addresses are specified by the signals l, v, n of the control section; a word standard pattern b of the word V sequentially designated by the control unit at each time point m;
a distance calculation section that calculates the intervector distance d(am, bl, v) n=1 to NV between v, n=1 to Nv and the input pattern am; a distance memory section d(n) that stores this distance; At each time point m, for each digit l and each word V, first set the initial condition to the digit dissimilarity DB (
l-1゜m-1) and digit route information FB (l-1, m-1)
given the distance d(n), the degree of dissimilarity D(l, v, n) at the time point m-1, and the route information F(l, v, n). The equation is calculated and the degree of dissimilarity D (l, v, n) and route information F (l, v, n) at time point m are sequentially obtained, and the degree of dissimilarity D (l, v, NY) and the word route are calculated. a recurrence formula calculation unit that calculates information F (l, v, Nv); at each time point m, round can word dissimilarity degree D (l, v, Nv) calculated by the recurrence formula calculation unit for each digit l; ), set this as the digit dissimilarity DB (J, m), and set the corresponding word path information F (l, v, Nv) as the digit path information FB.
(J, m), and the word name V for which the minimum value was obtained is the digit recognition category W(l, m); a digit dissimilarity calculation unit; a digit dissimilarity memory unit DB for storing these; l,m), digit route information memory section FB(l,m), digit recognition category memory section W(l,m), digit route information FB(l,m) and digit recognition category W(l,m ), and a determination unit that determines and outputs the category of each digit of an input pattern in reverse order based on the following:
JP56197841A 1981-12-09 1981-12-09 Continuous voice recognition equipment Granted JPS5898796A (en)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP56197841A JPS5898796A (en) 1981-12-09 1981-12-09 Continuous voice recognition equipment
US06/447,829 US4592086A (en) 1981-12-09 1982-12-08 Continuous speech recognition system
DE8282306577T DE3267835D1 (en) 1981-12-09 1982-12-09 Continuous speech recognition system
CA000417329A CA1193013A (en) 1981-12-09 1982-12-09 Continuous speech recognition system
EP82306577A EP0081390B1 (en) 1981-12-09 1982-12-09 Continuous speech recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56197841A JPS5898796A (en) 1981-12-09 1981-12-09 Continuous voice recognition equipment

Publications (2)

Publication Number Publication Date
JPS5898796A true JPS5898796A (en) 1983-06-11
JPH0134399B2 JPH0134399B2 (en) 1989-07-19

Family

ID=16381225

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56197841A Granted JPS5898796A (en) 1981-12-09 1981-12-09 Continuous voice recognition equipment

Country Status (1)

Country Link
JP (1) JPS5898796A (en)

Also Published As

Publication number Publication date
JPH0134399B2 (en) 1989-07-19

Similar Documents

Publication Publication Date Title
US4592086A (en) Continuous speech recognition system
US4256924A (en) Device for recognizing an input pattern with approximate patterns used for reference patterns on mapping
EP0144689B1 (en) Pattern matching system
US4901352A (en) Pattern matching method using restricted matching paths and apparatus therefor
EP0283902A1 (en) Pattern matching system
JPS5898796A (en) Continuous voice recognition equipment
JPS6312312B2 (en)
JPH0346839B2 (en)
JP2964881B2 (en) Voice recognition device
EP0138166A1 (en) Pattern matching apparatus
JPH0552517B2 (en)
JPH02750B2 (en)
JPH01241667A (en) Dynamic neural network to have learning mechanism
JPH0355836B2 (en)
JPS58126599A (en) Continuous voice recognition equipment
SU1594595A1 (en) Device for measuring the measure of similarity of speech images
JPS5972498A (en) Pattern comparator
JPS592954B2 (en) pattern luigi dokeisan sochi
JPS5926960B2 (en) Time series pattern matching device
JPH0556518B2 (en)
JPS60201395A (en) Voice recognition
JPS61162100A (en) Voice recognition equipment
JPH0449954B2 (en)
JPH0534680B2 (en)
JPS6210698A (en) Pattern comparator