JPS58137899A - Pattern recognition equipment - Google Patents

Pattern recognition equipment

Info

Publication number
JPS58137899A
JPS58137899A JP57019649A JP1964982A JPS58137899A JP S58137899 A JPS58137899 A JP S58137899A JP 57019649 A JP57019649 A JP 57019649A JP 1964982 A JP1964982 A JP 1964982A JP S58137899 A JPS58137899 A JP S58137899A
Authority
JP
Japan
Prior art keywords
vector
button
section
memory
calculation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57019649A
Other languages
Japanese (ja)
Other versions
JPH049319B2 (en
Inventor
大城 雅博
岡村 祐彦
元 子野日
迫江 博昭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP57019649A priority Critical patent/JPS58137899A/en
Publication of JPS58137899A publication Critical patent/JPS58137899A/en
Publication of JPH049319B2 publication Critical patent/JPH049319B2/ja
Granted legal-status Critical Current

Links

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16CSHAFTS; FLEXIBLE SHAFTS; ELEMENTS OR CRANKSHAFT MECHANISMS; ROTARY BODIES OTHER THAN GEARING ELEMENTS; BEARINGS
    • F16C35/00Rigid support of bearing units; Housings, e.g. caps, covers
    • F16C35/04Rigid support of bearing units; Housings, e.g. caps, covers in the case of ball or roller bearings
    • F16C35/06Mounting or dismounting of ball or roller bearings; Fixing them onto shaft or in housing
    • F16C35/062Dismounting of ball or roller bearings

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 本発明は、バタン認識装置に関する。[Detailed description of the invention] The present invention relates to a slam recognition device.

バタン認識装置は、例えば音声のように特徴ベクトルの
時系列として表現される時系列バタンを標準バタンとの
マツチングによシ同−性の認識を行なう装置である。例
えば音声認識装置は、認識対象とする各音声に対して標
準バタンか用意されてお9.入力音声バタンを上記各標
準バタンと比較し、すなわちマツチングを行なって、最
も良好な一致が得られる標準バタンを決定することによ
って1入力音声バタンが該標準バタンと同一音声である
と判定される。このようなバタン認識により人力音声を
機械コード化することができる。
A bang recognition device is a device that performs homology recognition by matching time-series bangs expressed as a time series of feature vectors, such as voice, with standard bangs. For example, a speech recognition device has a standard button for each speech to be recognized.9. It is determined that one input voice bang is the same voice as the standard bang by comparing the input voice bang with each of the above-mentioned standard bangs, that is, performing matching, and determining the standard bang that provides the best match. Human speech can be converted into machine code through this type of bang recognition.

上記標準バタンは、あらかじめ話者によって人力される
もので、従来は、各種人力バタンをそのままメモリに記
憶させて標準バタンとして利用している。従って、例え
ば単語認識装置の場合では、1つの単語に対して、へカ
バタン長に相当するメモリ容量を必要とし、さらに単語
数分の容量が必要である。このため、膨大なメモリ容量
が必要である。メモリ容量を減らすために、入力バタン
の一定時間間隔ごとの特徴ベクトルを、代表ベクトル列
として抽出して標準バタンとする方法もあるが、仁の方
法で祉入カバタンの特徴に欠落が生じるため認識率が低
下するという欠点がある。パタン認識は、音声バタンの
認識に限るものではなく、特徴ベクトルの時系列として
表現されるものであれば対象とされるが、音声以外のバ
タン認識装置においても、上述の欠点、すなわち標準バ
タンのメモリ容量が膨大となること、又は、メモリ容量
を低減した場合には認識率が低下することについては、
同様である。
The above-mentioned standard clicks are manually inputted by the speaker in advance, and conventionally, various manually operated clicks are stored in a memory as they are and used as standard clicks. Therefore, in the case of a word recognition device, for example, one word requires a memory capacity equivalent to the length of Hekabatan, and an additional capacity for the number of words. Therefore, a huge memory capacity is required. In order to reduce memory capacity, there is a method of extracting feature vectors of input buttons at regular time intervals as a representative vector sequence and using them as standard buttons, but Jin's method results in missing features of welfare input buttons, making it difficult to recognize them. The disadvantage is that the rate decreases. Pattern recognition is not limited to the recognition of voice slams, but can be applied to any pattern that is expressed as a time series of feature vectors. Regarding the huge memory capacity or the reduction in recognition rate when the memory capacity is reduced,
The same is true.

本発明の目的は、上述の従来の欠点を解決し、バタン認
識率を低下させないで標準バタンを圧縮し、標準バタン
メモリの容量を低減することが可能なバタン認識装fを
提供することにある。
An object of the present invention is to solve the above-mentioned conventional drawbacks, and to provide a button recognition device f capable of compressing a standard button without reducing the button recognition rate and reducing the capacity of a standard button memory. .

列 本発明のバタン認識装置は、ペク)#、5b7Cノ=1
.2.・・・、J)として表現される標準バタンを保持
するためのバタンバッファと、該バタンバッファに格納
されたベクトル列す、をに区間t*<J)に分割する区
切り点列(Ak) = 41+ txt・・・、ZA。
The bang recognition device of the present invention has the following characteristics:
.. 2. ..., J), and a breakpoint sequence (Ak) that divides the vector string stored in the button buffer into sections t*<J) = 41+ txt..., ZA.

・・・I LK+1を各区間の中央位置(’k + ’
に+x )/2のぺ各) k6hと該区間内の各ベクト
ルb、との誤差It bQ −b)’ Itが全区間に
おいて最小となるように動的計画の手法に1って計算す
る演算部および上記演算によって得られる区切り点列<
Lh’tを決定保持する決定部と、該決定部の出力する
各区間の中央位置を示すアドレス信号によって前記バタ
ンバッファから読み出した中央ベクトルbIkt−圧縮
パタンC=e1.c、、・・・、 C1として格納する
圧縮バタンメモリと、任意の人力バタンと前記圧縮バタ
ンとの比較を行カう認識処理部とt−備えたことを特徴
とする。
...I LK+1 is the center position of each section ('k + '
The error It bQ -b)' between k6h and each vector b in the interval is calculated using the dynamic programming method so that It is minimized in the entire interval. part and the breakpoint sequence obtained by the above operation <
A determining unit determines and holds Lh't, and a central vector bIkt-compressed pattern C=e1. which is read from the button buffer using an address signal indicating the center position of each section outputted by the determining unit. c, . . . C1; and a recognition processing unit that compares an arbitrary manual punch with the compressed button.

次に、本発明について1図面を参照して詳細に説明する
。標本点11.1.、・・・* ”is・・・、tl 
 における人力のスペクトラム的特徴を与えるベクトル
fa□、a2.・・・、a8.・・・・、al  とし
たとき、人カバタン人を、 A ””it a鵞t”’ s ”ze”’ e ”1
で表わす。ま九比較すべき標準バタンBを、s=b□ 
、 b2.・・・ 、 bJ 、 ・・・ 、 bJと
表わす。本発明においては、標準バタンBt−第1図に
示すようにに+1個の区切り点L1〜’に+、Vciつ
てに区間に区切9、各区分内における中央のベクトルb
 : 、 b ;、・・・ bKJの列を圧縮バタンC
とする。各区分の中央のベクトル号は、区切9点Lkと
Lk+、の中央位置のベクトルbαk +LA+x ’
4を該区間の代表ベクトルとして抽出したものである。
Next, the present invention will be explained in detail with reference to one drawing. Sample points 11.1. ,...* "is..., tl
The vectors fa□, a2. ..., a8. ..., al, then the person Kabatan is A ``it a go''' s ``ze''' e ''1
It is expressed as The standard baton B to be compared is s=b□
, b2. ..., bJ, ..., bJ. In the present invention, as shown in FIG.
: , b ;,... Compress the column of bKJ with the button C
shall be. The vector number at the center of each division is the vector bαk +LA+x' at the center position of the 9 division points Lk and Lk+.
4 is extracted as a representative vector of the section.

すなわち、 bk = b(Ll、 + lk+1)/、    で
ある。
That is, bk = b(Ll, +lk+1)/.

区切り点列(tt)は、代表ベクトルbjが第2図に示
すように、各区切り点tkとtk+□の間の区間に含ま
れるベクトルb、に対するベクトル誤差の大きさをIt
 b′に−bj II  と表わしたとき、下記(1)
式の最小化条件を満足するものとする。
As shown in FIG. 2, the breakpoint sequence (tt) is the magnitude of the vector error with respect to the vector b included in the interval between each breakpoint tk and tk+□, as shown in FIG.
When b′ is expressed as −bj II, the following (1)
It is assumed that the minimization condition of Eq.

・・・・・・(11 (1)式の最小化問題の計算については後述するが、こ
の計算によって、前記区切9点t1〜1に+□が決定さ
れる。区切り点列(輻)は、 (−)=x□、L3.・・・e ’Ig*・・・e Z
K+1で表わされる。この区切り点間の中央Oベタ1ト
ル幡を改めてC4と表わす仁とにすると、圧縮ノリンC
は、 C=C11C,t…* Ck、”・、 C1で表わされ
るoKは勿論Jより小であり、圧縮ノ(タンCは標準バ
タンBより小容量のメモリに格納することができる0 (1)式の最小化問題の計算は、動的計画の手法によっ
て可能である。今、1−JO像をとる整数簿と、i〜に
+1の値をとるkと、rlL−δ$t≦rIL−1なる
Lによって決定される下記漸化式 %式%) (2) を考える。ここにδFi動的動的性画法演算囲を決定す
るパラメータであり、隣り合う区切り点ZAと’bit
  との最大間隔を規制するために適宜設定される整数
である。(J式の漸化式は、初期条件’r(0,0)=
0  から逐次計算によって求めることができる。そし
て標準パターンBを区切り点列(th>でに分割した場
合に、各分割区間で発生する中央ベクトルbIkと割愛
される各ベクトルb、とが全区間について最小となるよ
うな区切り点列(th )を最適区切り点列として求め
ることがで色る0 (2)式のT(溝、k)の計算は、簿については1〜J
の範囲で行なわれ、%mの値に対してkが1〜に+1の
範囲で行なわれる。更に各にの値に対してlを落−δか
らm −1の範囲で変化させて演算される。そして、各
りの値に対しては、Σ   ”  b(L+m > 7
1− b) II                 
  ・・、・・・(3)ノーL なる演算が行なわれ、次に初期値T(0,0)=0から
漸化的に求められるT (t−1、k−1) t(31
式に加算することによって(′A式右辺の〔〕内の値が
該りに対して求められる。上述のように、Z#/′im
−δから准−1の範囲で変化させるから(2)式の〔〕
内の値は、任意の(” * k)に対してδ個求められ
る。上記6個の値のうち最小値がT(m 。
......(11) The calculation of the minimization problem of formula (1) will be described later, but through this calculation, +□ is determined for the nine division points t1 to 1.The division point sequence (convergence) is , (-)=x□, L3...e 'Ig*...e Z
It is expressed as K+1. If the center O solid 1 torque between these break points is rewritten as C4, then compression
C=C11C,t…*Ck,”・, The oK represented by C1 is of course smaller than J, and the compressed button C can be stored in a memory with a smaller capacity than the standard button B0 (1 ) can be calculated using the dynamic programming method.Now, we have an integer book that takes a 1-JO image, k that takes a value of +1 for i~, and rlL-δ$t≦rIL. Consider the following recurrence formula (%) (2) determined by L equal to -1.Here, δFi is a parameter that determines the dynamic stroke calculation area, and the adjacent breakpoints ZA and 'bit
This is an integer that is set as appropriate to regulate the maximum interval between. (The recurrence formula of the J formula is the initial condition 'r(0,0)=
It can be determined from 0 by sequential calculation. Then, when standard pattern B is divided into a breakpoint sequence (th>), a breakpoint sequence (th ) can be found as the optimal breakpoint sequence.
This is performed within the range of %m, and k is performed within the range of 1 to +1 for the value of %m. Furthermore, the calculation is performed by changing l in the range from −δ to m −1 for each value. And for each value, Σ ” b(L+m > 7
1-b) II
. . . (3) No L calculation is performed, and then T (t-1, k-1) t (31
By adding to the equation ('A, the value in brackets on the right side of the equation is found for the match. As mentioned above, Z#/'im
Since it is varied in the range of -δ to quasi-1, [] in equation (2)
δ values are found for any (''*k). The minimum value among the above six values is T(m.

k)として求められる。このT(711,A)に対応す
るL oil (すなわち区切り点となるフレーム番号
)をL(屏、k)とすると、m=1−J、に=1〜に+
1に対してL(m、k)テーブルが作成される。該テー
ブルを参照することにより最適区切り点列(Lh )を
求めることができる。すなわち、上[Lテーブルにおい
て、終端の区切り点ZIC+、=1.(J 、に+1)
より、’k ” L (Z &+11 k+1)なる逆
向きの漸化式によって、順次始端の区切り点t□へさか
のぼることによって最適区切り点列(Lh)が求められ
る。最適区切り点列(Lk )が求まると、各区切り点
間の中央のベクトルCA   (Ll+Lh+x)/@
が求t!ll、敵適に圧縮され=b た圧縮バタンCが求められる。上記演算によって求めら
れた圧縮パタンCは、圧縮前の標準パ゛タンBに最も近
似したバタンとカるため、認識率の低下をまねくことな
くバタン圧縮が可能となる。
k). If L oil (that is, the frame number serving as a break point) corresponding to this T (711, A) is L (folding, k), then m = 1 - J, = 1 to +
1, an L(m,k) table is created. By referring to the table, the optimum breakpoint sequence (Lh) can be determined. That is, in the upper [L table, the end break point ZIC+, = 1. (J, +1)
Therefore, the optimal breakpoint sequence (Lh) is found by sequentially going back to the starting end of the breakpoint t□ using the reverse recurrence formula 'k'' L (Z &+11 k+1).The optimal breakpoint sequence (Lk) is Once determined, the center vector CA between each break point (Ll+Lh+x)/@
I want it! ll, the compressed button C that is appropriately compressed = b is found. Since the compression pattern C obtained by the above calculation matches the pattern most similar to the standard pattern B before compression, the pattern can be compressed without reducing the recognition rate.

第3図は、本発明の一実施例を示すブロック図である。FIG. 3 is a block diagram showing one embodiment of the present invention.

すなわち、マイクロホン10の出力信号sFi、音声分
析部20でスペクトラム包絡の時系列バタンに変換され
る。該バタンは音声バタンパン7ア30に蓄積される。
That is, the output signal sFi of the microphone 10 is converted into a time-series bang of the spectrum envelope by the voice analysis section 20. The bangs are stored in the audio bang pan 7a30.

今、人力音声から標準パタンを作成する場合、音声パタ
ンバッファ30には標準バタンBが格納されている。動
的計画法計算部(DP計算部)40は、音声バタンバッ
ファ30から出力されるベクトル値bjf:人力として
(力式のT(m、A)t−計算し、これに対応するL(
m、k)f求める(詳細については後述する)。
Now, when creating a standard pattern from human voice, the voice pattern buffer 30 stores a standard pattern B. The dynamic programming calculation unit (DP calculation unit) 40 calculates the vector value bjf output from the audio bang buffer 30 as human power (T(m, A)t− of the force formula, and calculates the corresponding L(
m, k) find f (details will be described later).

制御41部200は、音声パタンバッファ30に5個の
標準バタン列が格納されたとき音声パタンバッファ30
から出力される信号Jを受け、クリヤ信号CLRおよび
マルチプレクサの切替を制御する信号M並びにDP計算
部40の計算に必要な数値信号m、kを出力する。数値
票は1がらJまで順に出力され、6講の値に対して信号
kが1からに+1まで出力される。マルテプレク?50
U、信号Mによって音声バタンバッフ73oに与えるア
ドレス信号の切替えを行なう。すなわち、信号Mが“0
“のときは、DP計算モードであり、音声パタンバッフ
ァ30に格納されている圧縮前の標準パタンBの各ベク
トルbjを指定する。bjの番地jはDP計算部40の
計算過程で1)P計算部40から出力される。信号Mが
“1″のときは、圧縮パタンCi決定するモードであり
、バタンBから抽出する中央ベクトルbi を指定する
。幡の番地は、決定部80の出力する信号tで与えられ
る。
The control unit 200 controls the sound pattern buffer 30 when five standard button sequences are stored in the sound pattern buffer 30.
It receives the signal J output from the DP calculation unit 40 and outputs a clear signal CLR, a signal M for controlling switching of the multiplexer, and numerical signals m and k necessary for calculation by the DP calculation unit 40. The numerical votes are output in order from 1 to J, and the signal k is output from 1 to +1 for the value of 6. Malteplek? 50
U and signal M are used to switch the address signal to be given to the audio slam buffer 73o. In other words, the signal M is “0”
", it is the DP calculation mode, and each vector bj of the uncompressed standard pattern B stored in the audio pattern buffer 30 is specified. The address j of bj is determined by 1) P in the calculation process of the DP calculation unit 40. It is output from the calculation unit 40. When the signal M is “1”, it is the mode for determining the compression pattern Ci, and specifies the central vector bi extracted from the button B. The address of the flag is output from the determination unit 80. It is given by the signal t.

Tメモリ60はDr計算W&40が計算スルT(’11
k)をテーブルとして保持するメ毫りであり、Lメモリ
70は同様にDP計算部40で得られるL(m、k)テ
ーブルを保持するメモリである0決定部80はLメモリ
70に保持されるL(m、k)テーブルを参照して最適
区切り点列(Lk )を定め、アドレス信号L=(ZA
+Z!+□)/2 を出力して前記マルチプレクサ50
を介して音声バタンバッファ30の該当アドレスから中
央ベクトルb′にすなわちbzを読み出す。該ベクトル
を圧縮バタンCのベクトルC1として圧縮バタンメモリ
90に書き込ませる。
T memory 60 is Dr calculation W & 40 is calculation suru T ('11
Similarly, the L memory 70 is a memory that holds the L(m,k) table obtained by the DP calculation unit 40. The 0 determination unit 80 is held in the L memory 70. The optimum breakpoint sequence (Lk) is determined by referring to the L(m,k) table, and the address signal L=(ZA
+Z! +□)/2 and outputs it to the multiplexer 50.
The central vector b', that is, bz, is read from the corresponding address of the audio bang buffer 30 via the central vector b'. This vector is written into the compression button memory 90 as the vector C1 of the compression button C.

圧縮バタンメモリ90は、上述の各ベクトルckt−格
納し、圧縮パタンCを保持するメモリである。
The compression pattern memory 90 is a memory that stores each of the above-mentioned vectors ckt- and holds the compression pattern C.

認識処理[810Gは、各区間内のベクトルを圧縮バタ
ンメモリ90の出力するベクトルCkによって近似し、
音声バタンバッファ30の出力する音声バタンAと比較
し、周知のバタンマツチング法により認識を行なう。
Recognition processing [810G approximates the vector in each section by the vector Ck output from the compression button memory 90,
It is compared with the voice button A output from the voice button buffer 30, and recognition is performed by a well-known bang matching method.

DP計算部40は、例えば第4図に示すように構成され
ている。すなわち、DP制御部400は、制il1部2
00から人力する信号m、kによって(L+m)/2=
7  なるアドレスを計算出力してマルチプレクサ50
を介して音声バッファ30の該当番地から仮の中央ベク
トルbQを読み出す0読み出された仮の中央ベクトルb
Qはバッファ410に格納される。次に、距離計算部4
20は、音声バタンバッファのj番地から読み出される
ベクトルb、と上記中央ベクトルbQとの距離の大きさ
Il bk −bj 11  を計算し、計算結果は累
算部430へ送る。累算部430はLから屏までについ
て上なう。加算部440Fi、Tメモリ60より読出さ
れるT(Z−x、に−1)と累算部430の出力める。
The DP calculation unit 40 is configured as shown in FIG. 4, for example. That is, the DP control section 400 controls the control section 2
From 00 to manually input signals m and k, (L+m)/2=
7. Calculate and output the address and send it to the multiplexer 50.
The temporary central vector bQ is read out from the corresponding address of the audio buffer 30 via 0 The read temporary central vector b
Q is stored in buffer 410. Next, distance calculation section 4
20 calculates the distance Il bk −bj 11 between the vector b read from the address j of the audio bang buffer and the central vector bQ, and sends the calculation result to the accumulator 430 . The accumulator 430 goes up from L to the folding screen. The adder 440Fi receives T(Z-x, -1) read from the T memory 60 and the output of the accumulator 430.

上記T(j 、k)は罵−δからm −1までのtにつ
いてそれぞれ計算されるからδ個求められる。最小検出
部450は、上記δ個のT(j、A)のうち最小のもの
を決定して、該最小値をT(m。
Since the above T(j, k) is calculated for each t from -δ to m-1, δ pieces are obtained. The minimum detection unit 450 determines the minimum value among the δ T(j, A), and converts the minimum value into T(m).

k)としてTメモリ60へ出力し格納する0ま−た上記
最小値T(m、A)に対応するl、(Z 、k)をL(
m、k)としてLメモリ70へ出力格納する0 次に、第5図に示すタイムチャートおよび第3図、第4
図を参照して本実施例の動作を説明する1、音声バタ、
ンバツファ30にパタン長Jの標準バタンBが入力する
と、パタン長Jが制御部200に与えられ(第5図(a
))、制御部200は該パタン長Jに基づいて圧縮フレ
ーム数K(K<J)を決定しく第5図<by’r、圧縮
フレーム数にの決定により信号Mを“0“とする(第5
図(C))。また、クリヤ信号CLRI出力して(第5
図(d))Tメモリ60に送り、Tメモリ60はクリヤ
されT (0,0)=0が初期設定される。以後第5図
(elに示すように出力値mが1からJまで順次出力さ
れる。風の値のおのおのに対して出力値kが1からに+
1まで順次出力される(同図(f))。更に、各にの値
に対して第4図のDP制御部400内で、lの値がm 
−δからm−1まで変化される(第5図(g))。そし
て、DpH1JIi部400は、各lの値に対して先ず
鰍初にj=(L−Jm)/2  としたアドレス信号ノ
を作成して(第5図(h)参照)マルチプレクサ50に
送り、マルチプレクサ50は該アドレス信号ノを選択出
力して音声バタンバッファ30に送る。
0 to be output and stored in the T memory 60 as k), or l, (Z, k) corresponding to the above minimum value T(m, A) as L(
m, k) and stored in the L memory 70. Next, the time chart shown in FIG.
The operation of this embodiment will be explained with reference to the figures.1.
When a standard batten B with a pattern length J is input to the buffer 30, the pattern length J is given to the control unit 200 (see FIG. 5(a)).
)), the control unit 200 determines the number of compressed frames K (K<J) based on the pattern length J, and sets the signal M to "0" based on the determination of the number of compressed frames. Fifth
Figure (C)). In addition, the clear signal CLRI is output (fifth
Figure (d)) is sent to the T memory 60, the T memory 60 is cleared and T (0,0)=0 is initialized. Thereafter, as shown in Fig. 5 (el), the output value m is outputted sequentially from 1 to J. For each wind value, the output value k is outputted from 1 to +
The data is sequentially output up to 1 ((f) in the same figure). Furthermore, in the DP control unit 400 of FIG. 4 for each value of l,
-δ to m-1 (Fig. 5(g)). Then, the DpH1JIi section 400 first creates an address signal with j=(L-Jm)/2 for each value of l (see FIG. 5(h)) and sends it to the multiplexer 50. The multiplexer 50 selectively outputs the address signal and sends it to the audio button buffer 30.

音声バタンバッファ30の(Z+Ffi)/21#地か
ら(仮の)中央ベクトルbQが読み出されて第4図のバ
ッファ410に格納される。次いで、アドレス信号ノ°
の値がlから風まで順次変化さ、れ(第5図(h)参照
)、そのたびにベクトルb、が音声バタンバッファ30
から読み出されて距離計算部420で1lbA”7” 
が算出される。各演算結果は、累算部430で積分され
(2)式の右辺の〔〕内の第2項が算出される。加算器
440は累算部430の出力値とTメモリ60から読出
した’r(4−1゜h−1)とを加算してT(L、k)
を計算した結果を最小検出部4rOに送る。罵−δがら
wL−1までのδ個のtの値に対して、上記T(A、A
)が計算されてそれぞれ最小検出部450に格納され、
最小検出部45 (1、上記a@O’r (L 、 k
 ) (D中の最小値iT(m、A)としてTメモリ6
oに格納する(第5図(i))。一方これに対応するt
がL(w*、k)としてLメモリ70に書き込まれる(
第5嫡(j))。
A (temporary) central vector bQ is read from the (Z+Ffi)/21# location of the audio bang buffer 30 and stored in the buffer 410 in FIG. Next, the address signal
The value of is changed sequentially from l to wind (see FIG. 5(h)), and each time the vector b is changed to the sound bang buffer 30.
1lbA"7" in the distance calculation unit 420.
is calculated. Each calculation result is integrated by the accumulator 430, and the second term in brackets on the right side of equation (2) is calculated. The adder 440 adds the output value of the accumulator 430 and 'r(4-1°h-1) read from the T memory 60 to obtain T(L,k).
The calculated result is sent to the minimum detection unit 4rO. For δ values of t from -δ to wL-1, the above T(A, A
) are calculated and stored in the minimum detection unit 450, respectively,
Minimum detection unit 45 (1, the above a@O'r (L, k
) (T memory 6 as the minimum value iT(m, A) in D
o (FIG. 5(i)). On the other hand, the corresponding t
is written to the L memory 70 as L(w*,k) (
5th heir (j)).

以上の処理がm=J4で終了すると、Lメモリ70のL
(m、k)テーブルが完成され、該テーブルを参照して
決定s80で最適区切り点列+Lh)が決定される。す
なわち、終端の区切り点は’に+1であり、上記Lテー
ブルから読み出した1、(J。
When the above processing ends with m=J4, L of L memory 70 is
The (m, k) table is completed, and the optimal breakpoint sequence +Lh) is determined in decision s80 by referring to the table. That is, the end break point is +1 at ', and 1, (J) read from the L table above.

K+1)はLY、番地を示すから、次にLテーブルから
L(ZK、K)を読み出せばLK−1が求められる。
Since K+1) indicates LY, the address, LK-1 can be obtained by reading L(ZK, K) from the L table.

このように’k ” L(Lk+s + ” + 1 
)なる逆向きの漸化式によって順次始端の区切り点L1
へさかのほることにより最適区切9点列t th )が
求められる0 この時点で、第3図の制#部200の出力する信号Mが
slmとなり、区切り点列(匂)にて決定される圧縮バ
タンの読み出しモードに移る。すなわち、決定部80か
ら” =(’h + Lh+1)/2  として各区切
り点間の中間点を示すアドレスを出力し、マルチプレク
サ50を介して音声バタンバッファ30の該当の番地か
らb−lt−読み出し、これlc4として圧縮バタンメ
モリ90に格納する。すなわち、圧縮バタンメモリ90
には、圧縮ノくタンCが格納される。該圧縮パタンの各
ベクトルcoFiそれぞれの区間内における代表ベクト
ルとされ、後に人力する人力バタンAとの間で認識処理
部100によって周知のバタンマツチング法が実行され
る◇本実施例では標準バタンを、もつとも近似誤差の少
なくなるように選び出された代表ベクトルによって圧縮
することが可能であり、従来よりメモリ容量を減少させ
ることができる効果がある。また、上記圧縮による誤差
は小であり、認識率を低下させることはない。なお、音
声バタン以外の特徴ベクトル列に対しても、同様な構成
によって、同様に認識率を低下させることなくメモリ容
量を減少させることが可能である。
In this way, 'k '' L (Lk + s + '' + 1
), the starting end break point L1 is sequentially determined by the reverse recurrence formula.
By hollowing out the hesaka, an optimal nine-point sequence t th ) is obtained. At this point, the signal M output from the control unit 200 in FIG. 3 becomes slm, which is determined by the sequence of dividing points Move to compression button read mode. That is, the determining unit 80 outputs an address indicating the intermediate point between each breakpoint as "=('h + Lh+1)/2," and reads b-lt- from the corresponding address of the audio button buffer 30 via the multiplexer 50. , this is stored in the compression button memory 90 as lc4. That is, the compression button memory 90
A compression tank C is stored in . Each vector coFi of the compressed pattern is taken as a representative vector within each section, and the recognition processing unit 100 executes a well-known bang matching method between the vector coFi and the human-powered button A that will be manually operated later.◇In this embodiment, the standard button is However, compression can be performed using representative vectors selected so as to reduce approximation errors, and the memory capacity can be reduced compared to the conventional method. Furthermore, the error caused by the above compression is small and does not reduce the recognition rate. Note that with a similar configuration, it is possible to similarly reduce the memory capacity for feature vector sequences other than voice bangs without reducing the recognition rate.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は標準バタンを区切9点列(lh)によってに区
間に分割した各区間の中央ベクトルと圧縮パタンとの関
係を示す図、第2図は上記各区間内における中央ベクト
ルbkと各ベクトルbjとの距離を示す図、第3図は本
発明の一実施例を示すブロック図、第4図は上記実施例
のDP計算部の構成の1fl11−示すブロック図、第
5図は上記実施例の動作を説明するためのタイムチャー
トである。 図において、10・・・マイクロホン、20・・・音声
分析部、30・・・音声バタンバッファ、40・・・D
P計算部、50・・・マルチプレクサ、6o・・・Tメ
モリ、70・・・Lメモリ、80・・・決定部′、90
・・・圧縮バク/メモリ、100・・・認識処理部、2
00・・・!111I41部。 400・・・DP制御部、410・・・バッファ、42
0・・・距離計算部、430・・・累算部、440・・
・加算部、450・・・最小検出部。 代理人 弁理士 住 1)俊 宗
Fig. 1 is a diagram showing the relationship between the center vector of each section obtained by dividing a standard batten into sections by a 9-point sequence (lh) and the compression pattern, and Fig. 2 is a diagram showing the relationship between the center vector bk and each vector within each section. Fig. 3 is a block diagram showing an embodiment of the present invention, Fig. 4 is a block diagram showing the configuration of the DP calculation section 1fl11 of the above embodiment, and Fig. 5 is a block diagram showing the above embodiment. FIG. 2 is a time chart for explaining the operation of FIG. In the figure, 10...Microphone, 20...Speech analysis unit, 30...Sound slam buffer, 40...D
P calculation unit, 50... multiplexer, 6o... T memory, 70... L memory, 80... decision unit', 90
...Compression bag/memory, 100...Recognition processing section, 2
00...! 111I41 part. 400...DP control unit, 410...buffer, 42
0... Distance calculation section, 430... Accumulation section, 440...
- Addition section, 450... Minimum detection section. Agent Patent Attorney 1) Toshi Sou

Claims (1)

【特許請求の範囲】 ベクトル列す、()=1.2.・・・、J)として表現
される標準バタンを保持するためのバタンバッファと、
該バタンバッファに格納されたベクトル列す、 t−K
区間(K<J )に分割する区切り点列(輻) =L1
s t、、・・・、th、・・・* ’に+1を各区間
の中央位置(Lk ” ’h+x )/2  のベクト
ルb;cと該区間内の各ベクトルトノとの誤差II b
λ−bj IIが全区間において最小となるように動的
計画の手法によって計算する演算部および上記演算によ
って得られる区切り点列(Zt)を決定保持する決定部
と、該決定部の出力する各区間の中央位tt−示すアド
レス信号によって前記バタンバッファから読み出した中
央ベクトルbQ 、圧縮バタンC=c、。 C1,・・・、CK  として格納する圧縮バタンメモ
リと、任意の入力バタンと前記圧縮バタンとの比較を行
なう認識処理部とを備えたことを特徴とするパタyil
&!識装置。
[Claims] Vector sequence S, ()=1.2. ..., J) for holding a standard baton, and
The vector sequence stored in the button buffer, t-K
Break point sequence (convergence) for dividing into sections (K<J) = L1
s t, ..., th, ...*' +1 to the center position of each section (Lk '''h+x)/2 Vector b; error between c and each vector tono in the section II b
A calculation section that calculates by a dynamic programming method so that λ-bj II is minimized over the entire interval, a determination section that determines and holds the breakpoint sequence (Zt) obtained by the above calculation, and each output of the determination section. The central position of the interval tt--the central vector bQ read from the button buffer according to the address signal indicating the compressed button C=c. A pattern yil characterized by comprising a compressed button memory for storing C1, .
&! recognition device.
JP57019649A 1982-02-12 1982-02-12 Pattern recognition equipment Granted JPS58137899A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57019649A JPS58137899A (en) 1982-02-12 1982-02-12 Pattern recognition equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57019649A JPS58137899A (en) 1982-02-12 1982-02-12 Pattern recognition equipment

Publications (2)

Publication Number Publication Date
JPS58137899A true JPS58137899A (en) 1983-08-16
JPH049319B2 JPH049319B2 (en) 1992-02-19

Family

ID=12005083

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57019649A Granted JPS58137899A (en) 1982-02-12 1982-02-12 Pattern recognition equipment

Country Status (1)

Country Link
JP (1) JPS58137899A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63502145A (en) * 1986-01-03 1988-08-18 モトロ−ラ・インコ−ポレ−テッド Optimal method for organizing data in speech recognition systems
JPH02501827A (en) * 1986-12-19 1990-06-21 イミュネックス・コーポレーション Human interleukin-4 mutein

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63502145A (en) * 1986-01-03 1988-08-18 モトロ−ラ・インコ−ポレ−テッド Optimal method for organizing data in speech recognition systems
JPH02501827A (en) * 1986-12-19 1990-06-21 イミュネックス・コーポレーション Human interleukin-4 mutein

Also Published As

Publication number Publication date
JPH049319B2 (en) 1992-02-19

Similar Documents

Publication Publication Date Title
WO2007029633A1 (en) Voice synthesis device, method, and program
JPS58165443A (en) Encoded storage device of signal
JP3130348B2 (en) Audio signal transmission method and audio signal transmission device
JPH08501891A (en) Transmission system with at least one coder
JPS58137899A (en) Pattern recognition equipment
GB2237485A (en) Speech processor using compression and non-linear transfer function
KR100422261B1 (en) Voice coding method and voice playback device
JP5006774B2 (en) Encoding method, decoding method, apparatus using these methods, program, and recording medium
JPS63192100A (en) Multi-pulse encoder
EP1610300B1 (en) Speech signal compression device, speech signal compression method, and program
JP2780458B2 (en) Vector quantization method and speech coding / decoding device
JP4170795B2 (en) Time-series signal encoding apparatus and recording medium
JP3227608B2 (en) Audio encoding device and audio decoding device
JPH10190470A (en) Spectrum feature parameter extraction device based on frequency load evaluation function
JPS62180398A (en) Pole parameter value extractor
JPS6240720B2 (en)
JP2002372982A (en) Method and device for analyzing acoustic signal
JP3258526B2 (en) Compressed audio decompression device
JP3787986B2 (en) Recording medium storing sound waveform data compression / decompression method and program for executing the operation
JPH05127697A (en) Speech synthesis method by division of linear transfer section of formant
JPH0367280B2 (en)
JPH05265492A (en) Code excited linear predictive encoder and decoder
JPS6136800A (en) Variable length frame voice analysis/synthesization system
JPS62998A (en) Variable length frame type pattern matching vocoder
JPS59125798A (en) Voice synthesizer