JPS6313099A - Continuous voice recognition equipment - Google Patents

Continuous voice recognition equipment

Info

Publication number
JPS6313099A
JPS6313099A JP61157257A JP15725786A JPS6313099A JP S6313099 A JPS6313099 A JP S6313099A JP 61157257 A JP61157257 A JP 61157257A JP 15725786 A JP15725786 A JP 15725786A JP S6313099 A JPS6313099 A JP S6313099A
Authority
JP
Japan
Prior art keywords
dissimilarity
degree
word
input pattern
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61157257A
Other languages
Japanese (ja)
Inventor
誠夫 亘理
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61157257A priority Critical patent/JPS6313099A/en
Publication of JPS6313099A publication Critical patent/JPS6313099A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は連続音声認識装置に関し、特に文法に従って連
続発声された文音声’(r認識する連続音声認識装置の
改良に関する。
DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to a continuous speech recognition device, and more particularly to an improvement in a continuous speech recognition device that recognizes sentence speech '(r) continuously uttered according to grammar.

(従来の技術) 音声認識装置の中でも文法に従って発声された文音声を
認識する装置は、計算機プログラムや限定業務用文章あ
るいは航空管制や各種機器の制御用指令などの認識がで
き広範囲な応用分野を有している。文法の拘束が与えら
れている場合には、その文法規則を利用することによっ
て誤認識を防止できることが原理的に知られている。特
に連続数字認識において、入力音声に桁数の制約がある
場合、その制約を規則化することにより認識率を改善す
ることができる。
(Prior art) Among speech recognition devices, devices that recognize sentence sounds uttered according to grammar can recognize computer programs, limited business texts, air traffic control and control commands for various equipment, etc., and have a wide range of applications. have. It is known in principle that when grammatical constraints are given, misrecognition can be prevented by using the grammatical rules. Particularly in continuous number recognition, if there is a restriction on the number of digits in the input speech, the recognition rate can be improved by regularizing the restriction.

このような文法に従って連続に発声された文音声を認識
する手法が特願昭56−199098号明細書に記載さ
れている。この手法はCWDP法と呼ばれ、原理は大路
次のとおりである。文法をオートマトンαで表現し、そ
のオートマトンαを次のように定義する。
A method of recognizing sentence sounds continuously uttered according to such a grammar is described in Japanese Patent Application No. 199098/1983. This method is called the CWDP method, and the principle is as follows. The grammar is expressed by an automaton α, and the automaton α is defined as follows.

α=(K、Σ、Δ*po+F)     ・・・・・−
・・・(1)ここで、 K:状態pの集合(plp=1
*2y・・・、π)Σ:入力単語nの集合(nln=1
.2.・−、N)Δ:状態遷移規則((p、q、n) ここで、(psqtn)はpxLqなる状態遷移を意味
する。
α=(K, Σ, Δ*po+F) ・・・・・・−
...(1) Here, K: set of states p (plp=1
*2y..., π)Σ: Set of input words n (nln=1
.. 2. -, N) Δ: State transition rule ((p, q, n) Here, (psqtn) means a state transition of pxLq.

po:初期状態。以後はp−oで示す。po: initial state. Hereinafter, it will be indicated as po.

F:Rt終状態集合FCK 次に前記オートマトンαに従って単語n(Σを連続して
発声して得られる音声バタンAiA= a、 、 a2
.−−−、 a i、 ・−、a、   ・−・−−−
−−(2)で示し、これを(未知)入力バタンと呼ぶ。
F: Rt final state set FCK Next, according to the automaton α, the sound bang obtained by continuously uttering the word n (Σ) AiA= a, , a2
.. ---, ai, ・-, a, ・-・----
--(2), and this is called the (unknown) input button.

各単語n(Σ に対して標準的なバタン B=N、へ、・・・、bj、・−・、bjn     
 ・・・・・・・・・(3)を用意し、これを単語標準
バタンと呼ぶ。この単語標準バタンをオートマトンαに
従って接続することによって得られる連続音声標準パタ
ンイ♂1B 、・・・、B と入力バタンAとのDPマ
ツチングを行い、2つのバタンの相互に異なる度合を表
わすX<以下相異度と称する)を算出し、最小の相異度
を与える単語系列を認識結果とする。
For each word n(Σ, the standard bang B=N, to, ..., bj, ..., bjn
・・・・・・・・・(3) is prepared and this is called a word standard slam. DP matching is performed between the continuous speech standard pattern ♂1B,...,B obtained by connecting these standard word batons according to the automaton α and the input baton A, and the degree of mutual difference between the two batons is expressed by (referred to as the degree of dissimilarity) is calculated, and the word sequence that provides the minimum degree of dissimilarity is taken as the recognition result.

ここで最小の相異度を次のような動的計画の手法で求め
る。初期条件を T(0,0)=O T(i 、 q )=oo、 i〆O+ Q〆0G(q
*nti)==(1)        ・・・・・・・
・・(4)とし、i = 1よシエまで順次(5)式の
境界条件を基に(6)式の漸化式を(pt q* n)
’Δなるすべての対(p+n)について計算する。すな
わち、対(p、n)について境界条件 G(ptnto)=T(i−19p) H(p 、 n 、 o )=i −1−−・・−(5
)とし、漸化式 ただしjは(6)式の右辺における最小のG(p。
Here, the minimum degree of dissimilarity is found using the following dynamic programming method. The initial conditions are T(0,0)=O T(i, q)=oo, i〆O+ Q〆0G(q
*nti)==(1) ・・・・・・・・・
...(4), and the recurrence formula of formula (6) is (pt q * n) based on the boundary condition of formula (5) sequentially until i = 1.
'Calculate for all pairs (p+n) of Δ. That is, for the pair (p, n), the boundary conditions G(ptnto)=T(i-19p) H(p, n, o)=i-1--(5
), where j is the minimum G(p) on the right side of equation (6).

”+J)を与えるj゛である。”+J).

をj=1よりJtで(n番目の標準パターンの始端より
終端まで)計算し、go)h(j)をそれぞれG (p
 +”pJ)+H(p+npJ)に格納する。ここでd
(j)ば入力パターン時刻iKおける特徴ベクトルai
とn番目の標準バタン時刻jにおける特徴ベクトルbj
との間の距離であり、例えばチェビシェフ距離として求
めることができる。
from j=1 (from the start to the end of the nth standard pattern), and calculate go)h(j) as G(p
+”pJ)+H(p+npJ).Here, d
(j) If the feature vector ai at input pattern time iK
and the feature vector bj at the nth standard slam time j
It is the distance between

次に単語の境界における最小化として if  T(i、q)′)CT(p、n、J )   
 ・・・・・−=・(9)then T(i、q)−G
(p、n、J )N(i・q)=n P(i、q)=p L(ieq)=H(psn+Jn) を計算する。
Next, as a minimization at word boundaries, if T(i, q)') CT(p, n, J)
・・・・・・−=・(9) then T(i, q)−G
Calculate (p, n, J) N(i・q)=n P(i, q)=p L(ieq)=H(psn+Jn).

入力バタンの認識結果は、判定処理として次のような手
続により求められる。
The recognition result of the input button is obtained by the following procedure as a determination process.

△ す。p=Qならば終了とする。△ vinegar. If p=Q, the process ends.

以上説明した方法では、第2図(alと(6)式に示す
ように単語相異度q(j)は入力パターン時間長iに比
例した値となっている。第2囚はDPマツチングのパス
を示す説明図である。すなわち、入力パターン時刻1つ
ごとに特徴ベクトル距離d(j)elつ加算している。
In the method explained above, the word dissimilarity q(j) is a value proportional to the input pattern time length i, as shown in Figure 2 (al) and equation (6). It is an explanatory diagram showing a path. That is, a feature vector distance d(j)el is added for each input pattern time.

連続音声認識において、単語相異度が入力パターンの時
間長に比例している埋山は以下のとおりである。、 例えば、第2図(b)のようなりPパスを用いると単語
相異度g(i、j)は ただしW1=W、=1.W、=V2 にて求めることができ、この単語相異度は入力パターン
時間長と標準パターン時間長との和に比例する。すなわ
ち(i+j )に比例する。この場合、相異度は標準パ
ターン時間長が短い程小さな値となる。す々わち、連結
した標準パターンの長さが短い程有利になり、単語の脱
落が起りやすくなる。
In continuous speech recognition, the cases in which the degree of word dissimilarity is proportional to the time length of the input pattern are as follows. , For example, if P path is used as shown in FIG. 2(b), the word dissimilarity g(i, j) becomes W1=W,=1. W,=V2, and this degree of word dissimilarity is proportional to the sum of the input pattern time length and the standard pattern time length. That is, it is proportional to (i+j). In this case, the degree of difference becomes a smaller value as the standard pattern time length becomes shorter. In other words, the shorter the length of the connected standard patterns, the more advantageous it is, and the more likely words will be omitted.

このため、連続音声認識においては(6)式のような標
準パターンの時間長に依存しない漸化式を用いる必要が
ある。
Therefore, in continuous speech recognition, it is necessary to use a recurrence formula that does not depend on the time length of the standard pattern, such as formula (6).

(発明が解決しようとする問題点) しかしながら、入力パターン時間長に比例する漸化式で
は、第2図(b)に示したような入力パターン時間軸に
垂直な方向を取ることはできない。このため、入力パタ
ーンの伸縮の度合が制限される。
(Problems to be Solved by the Invention) However, with the recurrence formula proportional to the input pattern time length, it is not possible to take a direction perpendicular to the input pattern time axis as shown in FIG. 2(b). Therefore, the degree of expansion and contraction of the input pattern is limited.

すなわち、ら)式に示す漸化式では入力パターンは標準
パターンの54までしか縮むことができない。
That is, the input pattern can only be reduced to 54, which is the standard pattern, using the recurrence formula shown in equation (a).

′ゆえに1部分的に伸縮がはげしく起るパターンで 。'Therefore, there is a pattern in which there is a lot of expansion and contraction in one part.

は、入力パターンと標準パターンとの時間軸対応が正確
にできず誤認識の原因となっている。一方、入力パター
ン時間長に比例した漸化式を用いて伸縮の度合を大きく
するためには、第2図(c) 、 (dlのようなりP
パスを用いる必要があυ、 α4式に示す漸化式 またはα9式に示す漸化式 にて求められる。しかしながら、α菊式αQ式はfb1
式に比較し計算量が増大するという欠点がある。
In this case, the time axis correspondence between the input pattern and the standard pattern cannot be accurately achieved, which causes misrecognition. On the other hand, in order to increase the degree of expansion and contraction using a recursion formula proportional to the input pattern time length, it is necessary to
It is necessary to use a path υ, which can be obtained using the recurrence formula shown in equation α4 or equation α9. However, the α chrysanthemum formula αQ formula is fb1
The disadvantage is that the amount of calculation increases compared to the formula.

本発明の目的は、上述した欠点を除去し、認識率が高く
計算量の少ない連続音声認識装置を提供することにある
An object of the present invention is to eliminate the above-mentioned drawbacks and provide a continuous speech recognition device with a high recognition rate and a small amount of calculation.

(問題点を解決する之めの手段) 本発明による連続音声認識装置は、有限状態オートマト
ンの各状態Pにおいて入力パターンの時間長に比例した
相異度T(i、p)を単語境界値とし入力パターンと標
準パターンの間の単語相異度を入力パターンの時間長に
比例し々い形式にて求めるDPマツチング部と、前記D
Pマツチング部によって求められた単語相異度を入力パ
ターン時間長に比例した相異度に変換する相異度変換部
と、前記相異度変換部にて求められた変換相異度をもと
に状態qにおける最小相異度を求めこれを単語境界値T
 (itq)とする最小相異度計算部とを備えることを
特徴とする。
(Means for solving the problem) The continuous speech recognition device according to the present invention uses the degree of dissimilarity T(i, p) proportional to the time length of the input pattern as a word boundary value in each state P of a finite state automaton. a DP matching unit that calculates the degree of word dissimilarity between the input pattern and the standard pattern in a format that is proportional to the time length of the input pattern;
a dissimilarity degree conversion section that converts the word dissimilarity degree obtained by the P matching section into a dissimilarity degree proportional to the input pattern time length; and a dissimilarity degree conversion section that converts the word dissimilarity degree obtained by the P matching section, and Find the minimum degree of dissimilarity in state q and use this as the word boundary value T
(itq).

(作用) 次に本発明の作用について説明する。本発明では、入力
パターンと標準パターンのDPマツチングの計算に使用
する消化式として入力パターン時間長に比例しない形式
のものを用いる。
(Function) Next, the function of the present invention will be explained. In the present invention, the digestion formula used to calculate the DP matching between the input pattern and the standard pattern is of a type that is not proportional to the input pattern time length.

例えば、従来方法で使用していた(6)式の代カに03
式を用いる。これは第2図(blに示すDPパスを持っ
ている。このα4式の漸化式を入力パターンのフレーム
ごとに計算されるCWDP法の形式に書きなおすと、 h(j)=f((psnsj)or H(psnsj−
1)or h(j−1)・・・・・・(17) ただしα0式の最小選択に対応して09式の右辺の選択
が行われる。
For example, 03 is substituted for the formula (6) used in the conventional method.
Use the formula. This has the DP path shown in Figure 2 (bl). If we rewrite this α4 recurrence formula into the form of the CWDP method, which is calculated for each frame of the input pattern, we get h(j) = f(( psnsj)or H(psnsj-
1) or h(j-1) (17) However, in response to the minimum selection of the α0 equation, the right side of the 09 equation is selected.

となる。このαe、αη式を使用したDPマツチングの
計算は以下のようになる。
becomes. Calculation of DP matching using the αe and αη formulas is as follows.

初期条件を(4)式とし、i−1よ、9Iまで順次(5
)式の境界条件を基に00式の漸化式を(p、q、n)
(Δなるすべての対(p、n)について計算する。
Let the initial condition be equation (4), and sequentially from i-1 to 9I (5
) Based on the boundary conditions of equation 00, the recurrence equation is (p, q, n)
(Calculate for all pairs (p, n) where Δ.

各対(p e n)とiにおいて、j=1からJnま1
)式の境界条件の基にαG、αη式を計算し、その結果
g(j)、hす)をそれぞれG(ps”+J)+H(r
’+”tj)に格納する。
For each pair (p e n) and i, from j=1 to Jn or 1
) based on the boundary conditions of the equations αG and αη, and the results g(j) and
'+'tj).

次に単語の境界における相異度を入力パターン時間長に
比例した相異度に09式に従って変換する。
Next, the degree of dissimilarity at the word boundary is converted into a degree of dissimilarity proportional to the input pattern time length according to equation 09.

α=G(psn、”)×i/(i十J’)      
+++++++++α槌続いて単語の境界における最小
化としてl f  T (ir q)>”      
   ・・・・・・・・値■then  T(i、q)
=G’ N(i、q)=n P(i、q)=p L(’−q)=H(pyn、”) を計算する。
α=G(psn,”)×i/(i×J')
++++++++α Then as a minimization at the word boundary, l f T (ir q)>”
・・・・・・・・・Value ■then T(i, q)
=G' N(i, q)=n P(i, q)=p L('-q)=H(pyn,'') Calculate.

入力パターンの認識結果は(11、(Ill 、02式
の判定処理により求められる。
The recognition result of the input pattern is obtained by the determination process of equation (11, (Ill, 02).

以上の方法では、単語相異度は入力パターン時間長に比
例していないが、単語境界において入力パターン時間長
に比例する値に変換し全体の相異度を求めている。これ
によシ従来と同様に入力パターンと連結された標準パタ
ーンとの間の相異度を求めることができる。また、単語
内での相異度は(10式のような漸化式を用いることが
できるので、入力パターンと標準パターンの時間軸対応
における伸縮の度合を大きくできる。
In the above method, the degree of word dissimilarity is not proportional to the input pattern time length, but is converted to a value proportional to the input pattern time length at the word boundary to obtain the overall degree of dissimilarity. As a result, the degree of dissimilarity between the input pattern and the connected standard pattern can be determined as in the conventional method. Furthermore, since a recurrence formula such as Equation 10 can be used for the degree of dissimilarity within a word, the degree of expansion and contraction in the time axis correspondence between the input pattern and the standard pattern can be increased.

(実施例) 次に本発明について図面を参照して詳細に説明する。第
1UAは本発明の1実痴例を示すブロック図であり、第
3図は第1図の実施例における動作の時間関係を示すタ
イムチャー)、g4(a)〜(d1図は第1図の実施例
における動作の流れを示すフローチャートである。
(Example) Next, the present invention will be described in detail with reference to the drawings. 1UA is a block diagram showing a practical example of the present invention, and FIG. 3 is a time chart showing the time relationship of operations in the embodiment of FIG. 3 is a flowchart showing the flow of operations in the embodiment.

標準バタンメモリ1130には単語セットΣに含まれる
単語nの標準パタンBnが記憶されており、オートマト
ン記憶部230には状態遷移規則(p*Q+”)と最終
状態Fの指定情報が記憶されている。
The standard pattern Bn of the word n included in the word set Σ is stored in the standard button memory 1130, and the state transition rule (p*Q+'') and the designation information of the final state F are stored in the automaton storage unit 230. There is.

マイクロホン100よυ未知入力音声が入力されると、
入力部110によりて周波数分析がなされ特徴を示すベ
クトルatに変換され順次大カバクンメモリ部120に
送られる。また、入力部110には音声レベルを検知す
ることによって音声区間を決定する機能が与えられてお
シ、音声区間中では「1」その他ではrOJなる音声区
間信号SPを発生する。制御部240は、この音声区間
信号SPの立上がりの時刻において初期化パルス5ET
1を発生する(第3図)。これによって(4)式および
第4(a)図のブロック10に対応する初期化かのメモ
リ200に対してなされる。
When unknown input audio is input from microphone 100,
Frequency analysis is performed by the input unit 110, and the vector at is converted into a characteristic vector at, which is sequentially sent to the large-capacity memory unit 120. Further, the input section 110 is provided with a function of determining a voice section by detecting the voice level, and generates a voice section signal SP which is "1" during the voice section and rOJ at other times. The control unit 240 generates an initialization pulse 5ET at the time of rise of the voice section signal SP.
1 (Figure 3). As a result, the memory 200 corresponding to equation (4) and block 10 in FIG. 4(a) is initialized.

相異度の計算は入力パターン時刻iに沿って行われる。The calculation of the degree of difference is performed along the input pattern time i.

各時刻iでは状態遷移規則r(pt”*q)をオートマ
トン記憶部230から読み出す。
At each time i, the state transition rule r(pt''*q) is read from the automaton storage unit 230.

続いて制御部240からの信号5ET2により第4(a
)図ブロック11と(5)式に対応する境界条件のセッ
トが行われる。
Subsequently, the signal 5ET2 from the control section 240 causes the fourth (a
) Boundary conditions corresponding to block 11 and equation (5) are set.

続いて標準パターン時刻信号jが1からJnまで変化し
第4(b)図のブロック12とαe、αη式に対応する
漸化式の計算がDPマツチング部310にて行われる。
Subsequently, the standard pattern time signal j changes from 1 to Jn, and the DP matching section 310 calculates the recurrence formula corresponding to block 12 in FIG. 4(b) and the αe, αη formulas.

標準パターン時刻がJnとなった時、第4(b)図のプ
ロップ13に対応するワークメモリの更新を行う。続い
て第4(b)図のブロック14とα梯式に対応する相異
度の変換が相異度変換部350にて行われる。最後に第
4(b)図のブロック15とa9式に対応する単語境界
の最小化が比較回路170を用いて行われる。
When the standard pattern time reaches Jn, the work memory corresponding to prop 13 in FIG. 4(b) is updated. Subsequently, the dissimilarity conversion unit 350 performs dissimilarity conversion corresponding to block 14 in FIG. 4(b) and the α ladder formula. Finally, word boundary minimization corresponding to block 15 and formula a9 in FIG. 4(b) is performed using comparison circuit 170.

以上の処理をすべての状態遷移規則rについて求め、さ
らに入力パターン時刻iを1からItで求める。その後
、第4(c)図のブロック16と(11式に対応する終
端点での最小相異度を終端判定部400で求める。続い
て、第4(d)図のブロック17とαυ、02式に対応
する認識結果の判定処理が結果判定部220で行なわれ
る。
The above process is performed for all state transition rules r, and the input pattern time i is determined from 1 to It. After that, the minimum dissimilarity at the terminal point corresponding to the block 16 in FIG. The result determination unit 220 performs a process of determining the recognition result corresponding to the formula.

以上、本発明を実施例に基づいて説明したが、これらの
記載は本発明の権利範囲を限定するものでない。本発明
で使用される漸化式は00式以外にも種種考えられる。
Although the present invention has been described above based on examples, these descriptions do not limit the scope of the rights of the present invention. Various recurrence formulas other than the 00 formula can be used in the present invention.

例えば、Wl=W2=W、=1  としてもよい。For example, Wl=W2=W, =1 may be used.

この場合は斜め方向が多少有利となるが、計算が簡単と
なる。
In this case, the diagonal direction is somewhat advantageous, but the calculation is simpler.

また、本実施例では特願昭56−199098に記載し
ているようなCWDP法を基にしているが、同様な種種
のオートマトン制御DPマツチング法(例えば特願昭5
4−104669.特願昭6l−031179)にも本
発明の原理を適用することができる。
Furthermore, although this embodiment is based on the CWDP method as described in Japanese Patent Application No. 56-199098, various similar automaton-controlled DP matching methods (for example, Japanese Patent Application No. 56-1999)
4-104669. The principles of the present invention can also be applied to Japanese Patent Application No. 61-031179).

(発明の効果) 以上説明した如く本発明によれば、連続音声認識装置に
おいて、DPマツチングの漸化式を複雑にせずに、入力
パターンと標準パターンの時間軸対応における伸縮の度
合を大きくできこれによって認識率を著しく高め、しか
も計算量を大幅に減少することができるという効果があ
る。
(Effects of the Invention) As explained above, according to the present invention, in a continuous speech recognition device, it is possible to increase the degree of expansion and contraction in the time axis correspondence between the input pattern and the standard pattern without complicating the recurrence formula of DP matching. This has the effect of significantly increasing the recognition rate and significantly reducing the amount of calculation.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の1実施例を示すブロック図、第2図は
DPマ、チングのバスを示す説明図、第3因は第1図の
実施例における動作の時間関係を示すタイムチャート、
第4(a)〜i)図は第1図の実施例における動作の流
れを示すフローチャートである。 110・・・・・・入力部、120・・・・・・入力バ
タンメモリ部、130・・・・・・標準バタンメモリ部
、170・・・比較回路、180〜210メモリ、22
0・・・・・・結果判定部、230・・・・・・オート
マトン記憶部、240・・・・・・制御部、310・・
・・・・DPマツチング部、320゜330・・・・・
・ワークメモリ、350・・・・・・相異度変換部、4
00・・・・・・終端判定部。 αυ     (b)     (C)      (
ダク酩2図 第4(a)図 第4(b)区 第4 (C)図
FIG. 1 is a block diagram showing one embodiment of the present invention, FIG. 2 is an explanatory diagram showing a DP machining bus, and the third factor is a time chart showing the time relationship of operations in the embodiment of FIG.
4(a) to i) are flowcharts showing the flow of operations in the embodiment of FIG. 1. 110... Input section, 120... Input button memory section, 130... Standard button memory section, 170... Comparison circuit, 180 to 210 memory, 22
0...Result determination unit, 230...Automaton storage unit, 240...Control unit, 310...
...DP matching section, 320°330...
・Work memory, 350...Difference conversion unit, 4
00... Termination determination section. αυ (b) (C) (
Figure 4 (a) Figure 4 (b) Section 4 (C) Figure 2

Claims (1)

【特許請求の範囲】 連続して発声された音声を有限状態オートマトンにより
指定される標準パターンの連結パターンとDP(Dyn
amic Programing、動的計画法)マッチ
ングを行い、最小の相異度が得られる標準パターンの系
列を求めることにより認識する連続音声認識装置におい
て、 有限状態オートマトンの各状態Pにおいて入力パターン
の時間長に比例した相異度T(i、p)を単語境界値と
し入力パターンと標準パターンとの単語相異度を入力パ
ターンの時間長に比例しない形式によって求めるDPマ
ッチング部と、前記DPマッチング部によって求められ
た単語相異度を入力パターン時間長に比例した相異度に
変換する相異度変換部と、前記相異度変換部にて求めら
れた変換相異度をもとに状態qにおける最小相異度を求
めこれを単語境界値T(i、q)とする最小相異度計算
部とを備えて成ることを特徴とする連続音声認識装置。
[Claims] Continuously uttered speech is combined with a standard pattern concatenation pattern specified by a finite state automaton and DP (Dyn
In a continuous speech recognition device that performs matching (dynamic programming (amic programming)) and recognizes a series of standard patterns that yield the minimum degree of dissimilarity, the time length of the input pattern is determined in each state P of a finite state automaton. A DP matching unit that uses a proportional degree of dissimilarity T (i, p) as a word boundary value and calculates the degree of word dissimilarity between the input pattern and the standard pattern in a format that is not proportional to the time length of the input pattern, and the DP matching unit. a dissimilarity converter that converts the word dissimilarity obtained into a dissimilarity proportional to the input pattern time length; 1. A continuous speech recognition device comprising: a minimum dissimilarity calculating section which obtains a dissimilarity and uses this as a word boundary value T(i, q).
JP61157257A 1986-07-03 1986-07-03 Continuous voice recognition equipment Pending JPS6313099A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61157257A JPS6313099A (en) 1986-07-03 1986-07-03 Continuous voice recognition equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61157257A JPS6313099A (en) 1986-07-03 1986-07-03 Continuous voice recognition equipment

Publications (1)

Publication Number Publication Date
JPS6313099A true JPS6313099A (en) 1988-01-20

Family

ID=15645696

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61157257A Pending JPS6313099A (en) 1986-07-03 1986-07-03 Continuous voice recognition equipment

Country Status (1)

Country Link
JP (1) JPS6313099A (en)

Similar Documents

Publication Publication Date Title
US5583968A (en) Noise reduction for speech recognition
JPH03201079A (en) Pattern recognizing device
US6029130A (en) Integrated endpoint detection for improved speech recognition method and system
JPS58192100A (en) Hourly alignment of first and second voice pattern and apparatus therefor
JPH029359B2 (en)
JPH0556517B2 (en)
JPH0247760B2 (en)
JPH0296800A (en) Continuous voice recognizing device
JPS6313099A (en) Continuous voice recognition equipment
JPH03120598A (en) Method and device for voice recognition
JPH0575117B2 (en)
JPH01241667A (en) Dynamic neural network to have learning mechanism
JPH0449954B2 (en)
JPS62161200A (en) Continuous voice recognition equipment
JPS61277999A (en) Voice recognition equipment
JPH01138596A (en) Voice recognition equipment
JPH02118696A (en) System for registering voice standard pattern
JPS62111295A (en) Voice recognition equipment
JPS6247100A (en) Voice recognition equipment
JPS61148496A (en) Continuous voice recognition equipment
JPS61100878A (en) Pattern recognizing device
JPS60147798A (en) Voice recognition
JPS6057397A (en) Normalization
JPS61184600A (en) Voice signal preprocessor
JPS61102698A (en) Standard pattern adaption system