JPH0574836B2 - - Google Patents

Info

Publication number
JPH0574836B2
JPH0574836B2 JP60117135A JP11713585A JPH0574836B2 JP H0574836 B2 JPH0574836 B2 JP H0574836B2 JP 60117135 A JP60117135 A JP 60117135A JP 11713585 A JP11713585 A JP 11713585A JP H0574836 B2 JPH0574836 B2 JP H0574836B2
Authority
JP
Japan
Prior art keywords
pattern
compression
vector
sequence
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60117135A
Other languages
Japanese (ja)
Other versions
JPS61275800A (en
Inventor
Shichiro Tsuruta
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP60117135A priority Critical patent/JPS61275800A/en
Publication of JPS61275800A publication Critical patent/JPS61275800A/en
Publication of JPH0574836B2 publication Critical patent/JPH0574836B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、パタン認識装置に関する。[Detailed description of the invention] (Industrial application field) The present invention relates to a pattern recognition device.

(従来技術とその問題点) パタン認識装置は、例えば音声のように特徴ベ
クトルの時系列として表現されるパタンを標準パ
タンとの比較操作(マツチング)により類似性を
算出し、パタン間の認識を行なう装置である。例
えば、音声認識装置は認識すべき音声パタンを標
準パタンとして予め装置に登録しておき、認識動
作時には、入力される未知音声パタンに対して、
各標準パタンとの間で比較操作を行い、両者の一
致の度合を調べ、最もよく一致する標準パタンを
決定し、認識判定を行う方法に基づいている。こ
のパタンマツチング法では、パタンに固有な変動
現象、例えば、音声パタンにおける発声速度の変
動に起因する時間軸の不均一な伸縮といつた現象
に対して安定な尺度を用いることが重要である。
これに関しては日本音響学会の音声研究会資料
S73−22(昭和48年12月発行)「音声認識における
各種DPマツチング法の比較」(以下文献(1)と呼
ぶ)に詳しく述べられている。また、この方法を
能率的にかつ高精度で実現する方法として動的計
画法(以下DP法と略す)を利用し、時間軸の変
動を正規化したパタン間距離を算出するDPマツ
チング法が有効であると提案されている。このマ
ツチング法では、マツチングの対象となるパタン
は、一定の周期でサンプリングされた時系列ベク
トルを前提としている。このために、各パタンを
記憶するための記憶容量は、各パタンの長さ分だ
け必要となる。例えば、単語音声認識装置の場合
では、単語数分の容量が必要となり、膨大な記憶
容量を必要とする。また、演算時間もパタン長に
比例して増大するために高速演算が要求される。
一方、音声パタンは、母音定常部等においては、
周波数構造の時間的変化は小さく、母音から子音
といつた過渡部分などでは、その変化が大きい。
この性質を利用して、各パタンを情報圧縮し、記
憶容量を削減する装置が知られている(文献(2)特
開昭58−137899号公報)。以下、文献(2)のパタン
圧縮法の概要を説明する。
(Prior art and its problems) A pattern recognition device calculates the similarity of a pattern expressed as a time series of feature vectors, such as voice, with a standard pattern (matching), and performs recognition between patterns. It is a device that performs For example, a speech recognition device registers the speech pattern to be recognized as a standard pattern in the device in advance, and during recognition operation,
This method is based on a method in which a comparison operation is performed between each standard pattern, the degree of agreement between the two is examined, the standard pattern that most closely matches is determined, and a recognition judgment is made. In this pattern matching method, it is important to use a measure that is stable against fluctuation phenomena specific to patterns, such as uneven expansion and contraction of the time axis caused by fluctuations in speaking rate in speech patterns. .
Regarding this, please refer to the Acoustical Society of Japan's speech research group materials.
It is described in detail in S73-22 (published in December 1971) "Comparison of various DP matching methods in speech recognition" (hereinafter referred to as document (1)). In addition, as a way to implement this method efficiently and with high precision, the DP matching method is effective, which uses dynamic programming (hereinafter abbreviated as DP method) to calculate the distance between patterns by normalizing fluctuations in the time axis. It is proposed that This matching method assumes that the pattern to be matched is a time series vector sampled at a constant period. For this reason, the storage capacity for storing each pattern is required to correspond to the length of each pattern. For example, in the case of a word speech recognition device, a capacity corresponding to the number of words is required, which requires an enormous storage capacity. Furthermore, since the calculation time increases in proportion to the pattern length, high-speed calculation is required.
On the other hand, in the vowel stationary part, the speech pattern is
Temporal changes in the frequency structure are small, and changes are large in transitional areas such as from vowels to consonants.
A device is known that utilizes this property to compress information on each pattern to reduce storage capacity (Reference (2) Japanese Patent Application Laid-open No. 137899/1983). Below, an overview of the pattern compression method of document (2) will be explained.

音声パタンは、音声信号の周波数分析器等の出
力を一定の周期でサンプリングすることで、特徴
ベクトルの時系列として B=〓1、〓2、……〓j、〓J (1) と示される。〓jは時刻jにおける特徴ベクトル
である。(1)式のパタンBを第1図aに示すように
K+1個の区切り点l1〜lK+1によつてK区間に区
切り、各区分内における中央ベク〓′1、〓′2
……、〓′Kの列を圧縮パタンCとする。中央ベク
トル〓′kはk番目の区間(lk、lk+1)の中央位置
のベクトルを該区間の代表ベクトルとして抽出し
たものである。すなわち 〓′k=〓(lk+lk+1)/2である。
The audio pattern is expressed as a time series of feature vectors by sampling the output of an audio signal frequency analyzer, etc. at a constant cycle, and is expressed as a time series of feature vectors as follows: B=〓1,〓2,... 〓j , 〓J (1) . 〓 j is the feature vector at time j. Pattern B in equation (1) is divided into K sections by K+1 breakpoints l 1 to l K+1 as shown in Figure 1a, and the central vectors in each section are 〓'1, 〓'2 ,
..., 〓' Let the sequence of K be the compression pattern C. The central vector 〓' k is the vector at the center of the k-th section (l k , l k+1 ) extracted as the representative vector of the section. That is, 〓′ k = 〓 (lk+lk+1)/2 .

区切り点列{lk}は、代表ベクトル〓′kが区間
(lk、lk++1)に含まれる〓jに対するベクトル誤差
の大きさを‖〓′k−〓j‖と表わしたとき、各区
間でのベクトル誤差が最小となるような最適に決
定する。すなわち T= Min {lkK+1k=1 lk+1j=lk+1 ‖〓′k−〓j‖ (2) (2)式の最小化問題を解くことで最適区切り点列
{lk}が求まる。(2)式の具体的計算法として、動
的計画法を用いて、次のように行う。
The breakpoint sequence {l k } is expressed as ‖〓′ k −〓 j ‖ when the magnitude of the vector error for 〓 j where the representative vector 〓′ k is included in the interval (l k , l k++1 ) is expressed as ‖〓′ k −〓 j ‖ , is determined optimally so that the vector error in each interval is minimized. That is, T= Min {l k } K+1k=1 lk+1j=lk+1 ‖〓′ k −〓 j ‖ (2) By solving the minimization problem of equation (2), the optimal breakpoint is found. The sequence {l k } is found. As a specific method for calculating equation (2), dynamic programming is used as follows.

初期値 T(0、0)=0 (3) のもとに、 漸化式 T(m、k)= Min m−δ≦l<m〔T(l−1、k−1)+nj=l ‖〓(l+n)/2−〓j‖〕 (4) なる漸化式を m−δ≦l≦m−1 (5) なる条件の範囲で、m=l〜J、k=1〜K+1
に関して逐次計算することで、区切り点列{lk
でK分割した場合に、各分割区分間(lk、lk+1
で発声する中央ベクトル〓′kと割愛される各ベク
トル〓jとの誤差 d(〓′k、〓j)=lk+1j=lk+1 ‖〓′k−〓j‖ が全区間について最小となるような区切り点列
{lk}を最適区切り点列として求めることができ
る。この最適区切り点列{lk}が求まると、各区
切り点間の中央ベクトル〓k=〓(lk+lk+1)/2が求ま
り、最適に圧縮された圧縮パタン C=〓1、〓2、……、〓k、……、〓K が求められる。該圧縮パタンCの各ベクトル〓k
は、それぞれの区間内における代表ベクトルとさ
れ、後で入力される入力パタンとの間でパタンマ
ツチング法が実行され認識が行われる。すなわ
ち、代表ベクトルの系列により表現される圧縮パ
タンにおいて、間引かれた冗長なベクトルを、抽
出された代表ベクトルにより補間して、圧縮され
る前の時間軸上に再現し、DPマツチング法を適
用して認識処理を行う。
Based on the initial value T (0, 0) = 0 (3), recurrence formula T (m, k) = Min m-δ≦l<m [T (l-1, k-1) + nj=l ‖〓 (l+n)/2 −〓 j ‖〕 (4) The recurrence formula becomes m−δ≦l≦m−1 (5) m=l~J,k =1~K+1
By sequentially calculating the breakpoint sequence {l k }
When dividing into K, between each division section (l k , l k+1 )
The error d ( k ,j ) between the central vector 〓 k uttered at The minimum breakpoint sequence {l k } can be found as the optimal breakpoint sequence. When this optimal breakpoint sequence {l k } is found, the median vector between each breakpoint 〓 k = 〓 ( lk+lk+1)/2 is found, and the optimally compressed compression pattern C=〓1, 〓2 , ..., 〓 k , ..., 〓 K is found. Each vector of the compression pattern C〓 k
are taken as representative vectors within each section, and a pattern matching method is executed between them and an input pattern input later to perform recognition. In other words, in the compression pattern expressed by a series of representative vectors, the thinned out redundant vectors are interpolated with the extracted representative vectors, reproduced on the time axis before compression, and the DP matching method is applied. perform recognition processing.

以上述べた方法は、圧縮パタンが圧縮前のパタ
ンに最も近似したパタンとなるため、認識率の低
下をまねくことなくパタン圧縮を可能としてい
る。
In the method described above, the compressed pattern becomes a pattern that is most similar to the pattern before compression, so that pattern compression is possible without reducing the recognition rate.

しかしながら、このパタン圧縮法では、圧縮パ
タンを得るために(3)式〜(5)式で示される漸化式を
計算する必要があり、例えば入力パタンと標準パ
タンの両パタンとも圧縮し、認識処理する場合に
は、高速演算回路が要求される。従つて、圧縮処
理を実行する回路は必ずしも安価なものではな
い。
However, in this pattern compression method, it is necessary to calculate the recurrence formula shown in equations (3) to (5) in order to obtain a compressed pattern. For example, both the input pattern and the standard pattern are compressed and recognized. For processing, a high-speed arithmetic circuit is required. Therefore, circuits that perform compression processing are not necessarily inexpensive.

(発明の目的) 本発明は、このような従来の欠点を除去せしめ
て、極めて少ない演算量で、パタン圧縮を実現
し、かつ記憶容量、演算量とも大幅に削減したパ
タン認識装置を提供することにある。
(Object of the Invention) An object of the present invention is to provide a pattern recognition device that eliminates such conventional drawbacks, realizes pattern compression with an extremely small amount of calculations, and significantly reduces both storage capacity and amount of calculations. It is in.

(発明の構成) 本発明によれば、特徴ベクトルの系列{bj}、
(j=1、2、……、J)として表現される標準
パタンを保持するパタンメモリと、該パタンメモ
リに格納された前記ベクトル列{bj}のパタン変
化量Dj、(j=1、……J)をパタン全体にわた
り算出し、パタン長Jから決定される分割数Kに
より前記パタン変化量Djの総変化量DJをK等分
するように前記ベクトル列{bj}をK区分に分割
し、上記演算によつて得られる区分点列{lk}を
決定し、該{lk}により定まる各区間の中央位置
のベクトルb′kを前記パタンメモリから読みだし
各区間の代表ベクトルとして圧縮パタンC=c1
c2、……cKを出力する圧縮処理部と、前記圧縮パ
タンCを格納する圧縮パタンメモリと、任意の入
力パタンと前記圧縮パタンとの比較を行う認識処
理部とを備えたことを特徴とするパタン認識装置
が得られる。
(Structure of the Invention) According to the present invention, a sequence of feature vectors {b j },
A pattern memory that holds a standard pattern expressed as (j=1, 2, ..., J), and a pattern change amount D j of the vector sequence {b j } stored in the pattern memory, (j=1 ,...J) over the entire pattern, and divide the vector sequence {b j } so that the total variation D J of the pattern variation D j is divided into K equal parts by the number of divisions K determined from the pattern length J. Divide into K sections, determine the section point sequence {l k } obtained by the above calculation, read the vector b' k of the center position of each section determined by the {l k } from the pattern memory, and calculate each section. As a representative vector of the compression pattern C=c 1 ,
c 2 , ... c K ; a compression pattern memory that stores the compression pattern C; and a recognition processing unit that compares an arbitrary input pattern with the compression pattern. A pattern recognition device is obtained.

更に本発明によれば、特徴ベクトルの系列
{bj}、(j=1、2、……、J)として表現され
る標準パタンを保持するパタンメモリと該パタン
メモリに格納された前記ベクトル列{bj}のパタ
ン変化量Dj、(j=1、2、……、J)をパタン
全体にわたり算出し、前記パタン変化量Djの総
変化量DJから決定される分割数Kにより、前記
パタン総変化量DJをK等分するように前記ベク
トル列{bj}をK区分に分割し、上記演算によつ
て得られる区分点列{lk}を決定し、該{lk}に
より定まる各区間の中央位置のベクトルb′kを前
記パタンメモリから読み出し各区間の代表ベクト
ルとして圧縮パタンC=c1、c2、……cKを出力す
る圧縮処理部と、前記圧縮パタンCを格納する圧
縮パタンメモリと、任意の入力パタンと前記圧縮
パタンとの比較を行う認識処理部とを備えたこと
を特徴とするパタン認識装置が得られる。
Further, according to the present invention, a pattern memory holding a standard pattern expressed as a sequence of feature vectors {b j }, (j=1, 2, ..., J) and the vector sequence stored in the pattern memory are provided. The amount of pattern change D j , (j=1, 2, ..., J) of {b j } is calculated over the entire pattern, and the number of divisions K determined from the total amount of change D J of the pattern change amount D j is calculated. , divide the vector sequence {b j } into K sections so as to divide the total pattern variation D J into K equal parts, determine the segment point sequence {l k } obtained by the above calculation, k } of the center position of each section from the pattern memory and outputs a compressed pattern C=c 1 , c 2 , . . . c K as a representative vector of each section; A pattern recognition device is obtained, comprising a compressed pattern memory that stores a pattern C, and a recognition processing section that compares an arbitrary input pattern with the compressed pattern.

(構成の詳細な説明) 本発明について、図面を参照して詳細に説明す
る。入力パタンAは入力の周波数構造を表わす特
徴ベクトルの系列 A=a1、a2、……、ai、……、aI (6) で表現される。また比較すべき標準パタンBを B=b1、b2、……、bj、……、bJ (7) と表わす。本発明においては、標準パタンBを第
1図に示すようにK+1個の区切り点l1,l2,…
…,lk,……,lK+1によつてK区間に区切り、各
区分(lk、lk+1)内におけるベクトルb′1、b′2、…
…、b′Kの列を圧縮パタンCとする。各区分(lk
lk+1)の中央のベクトルb′kは、区切り点lkとlk+1
の中央位置のベクトルb(lk+lk+1)/2を該区間の代表
ベクトルb′kとして抽出したものである。区切り
点列{lk}は、次の様にして決定される。第1図
bに示すように標準パタンBのパタン変化量Dj
を、ベクトル間距離dj=‖bj−bj-1‖と表わした
とき、このベクトル間距離djのパタン区間にわた
る総和 Djjm=1 dn (8) として表わす。前記区切り点l1,……lK+1は、パ
タン変化量Djのパタン全体にわたる総変化量DJ
をK等分するように、標準パタンBをK区間に分
割することで決定する。すなわち、等分された変
化量をΔDとすると、第1図bに示すように、ベ
クトル列{bj}の先頭からベクトル列{bj}の変
化量Djが、等分された変化量ΔDを越えた点をl2
l3,……,lk,……,lk+1として決定する。区切り
点列{lk}は、 {lk}=l1、l2、……、lk、……、lk+1 (9) で表わされる。この区切り点間の中央のベクトル
b′kを改めてckと表わすことにすると、圧縮パタ
ンCは C=c1、c2、……、ck、……、ck (10) で表わされる。KをJより小さい値に設定するこ
とで圧縮パタンCは標準パタンBより小容量のメ
モリに格納することが可能となる。以上が本発明
の原理である。
(Detailed Description of Configuration) The present invention will be described in detail with reference to the drawings. The input pattern A is expressed by a series of feature vectors A=a 1 , a 2 , . . . , a i , . . . , a I (6) representing the frequency structure of the input. Further, the standard pattern B to be compared is expressed as B=b 1 , b 2 , . . . , b j , . . . , b J (7). In the present invention, the standard pattern B is divided into K+1 breakpoints l 1 , l 2 , . . . as shown in FIG.
Divided into K sections by ..., l k , ..., l K+1 , vectors b' 1 , b' 2 , ... in each section (l k , l k+1 )
..., b' K is a compression pattern C. Each division (l k ,
The vector b′ k at the center of l k + 1
The vector b (lk+lk+1)/2 at the center position of is extracted as the representative vector b' k of the section. The breakpoint sequence {l k } is determined as follows. As shown in Figure 1b, the amount of pattern change D j of standard pattern B
is expressed as inter-vector distance d j =‖b j -b j-1 ‖, then the sum total of this inter-vector distance d j over the pattern section is expressed as D j = jm=1 d n (8). The breakpoint l 1 ,...l K+1 is the total variation D J of the pattern variation D j over the entire pattern.
The standard pattern B is determined by dividing the standard pattern B into K sections so that the standard pattern B is divided into K equal parts. In other words, if the amount of change divided into equal parts is ΔD, then the amount of change D j of the vector sequence {b j } from the beginning of the vector sequence {b j } is the amount of change divided into equal parts, as shown in FIG. 1b. The point beyond ΔD is l 2 ,
Determine as l 3 ,..., l k ,..., l k+1 . The breakpoint sequence {l k } is expressed as {l k }=l 1 , l 2 , ..., l k , ..., l k+1 (9). the median vector between this breakpoints
If b′ k is expressed as c k again, the compression pattern C is expressed as C=c 1 , c 2 , . . . , c k , . . . , c k (10). By setting K to a value smaller than J, compressed pattern C can be stored in a memory with a smaller capacity than standard pattern B. The above is the principle of the present invention.

(実施例) 以上の原理に基づいて動作する本発明の第1の
実施例のブロツク図を第2図に示す。また、圧縮
処理部40の詳細図を第3図にする。マイクロホ
ン等10から入力される音声信号は、音声分析部
20で周波数構造を表わす(6)および(7)式の特徴ベ
クトルの時系列パタンに変換される。該パタンは
音声パタンメモリ30に記憶される。ここで、入
力音声から標準パタンを作成する場合、音声パタ
ンメモリ30には標準パタンBが格納されてい
る。圧縮処理部40は、音声パタンメモリ30か
らベクトル値bj、とbj-1を読み出し距離計算部4
1によりベクトル間距離dj=‖bj−bj-1‖を計算
し、順次、累算部42により(8)式のパタン変化量
Djを算出する。この処理をjを1からJまで変
化させることで、パタン全体にわたるパタン変化
量Dj、(j=1、……J)が算出され、パタン変
化量メモリ43に記憶される。一方、制御部70
では、標準パタン長Jに基づいて圧縮率を決定す
る。
(Embodiment) FIG. 2 shows a block diagram of a first embodiment of the present invention which operates based on the above principle. Further, a detailed diagram of the compression processing section 40 is shown in FIG. An audio signal input from a microphone or the like 10 is converted by the audio analysis unit 20 into a time-series pattern of feature vectors expressed by equations (6) and (7) representing a frequency structure. The pattern is stored in the audio pattern memory 30. Here, when creating a standard pattern from input audio, standard pattern B is stored in the audio pattern memory 30. The compression processing unit 40 reads the vector values b j and b j-1 from the audio pattern memory 30 and calculates the distance calculation unit 4 .
1, the vector distance d j =‖b j −b j-1
Calculate D j . By changing j from 1 to J in this process, the pattern change amount D j , (j=1, . . . J) over the entire pattern is calculated and stored in the pattern change amount memory 43. On the other hand, the control section 70
Now, the compression ratio is determined based on the standard pattern length J.

次に第3図に示した圧縮処理部においては、定
数CJにより、圧縮ベクトル数Kが圧縮率決定回路
71により決定される。圧縮ベクトル数Kの決定
により、区分変化量決定回路72では、パタン全
体にわたる総変化量DJをK等分することで、等
分された変化量ΔDを算出する。この等分された
変化量ΔDを基準とし、kを1から順次Kまで変
化させkΔDを乗算回路73により算出し、圧縮
処理部の比較部47に出力する。比較部47で
は、Jを1から順次変化させて全体にわたるパタ
ン変化量DjとkΔDを比較し、DjがkΔDを越えた
点をj=lkとして区切り点を決定する。区切り点
の決定により、kを1づつ増加させ、k=Kまで
処理することで、区切り点列{lkk=1〜Kが決定さ
れる。この区切り点列から、標準パターに対し
て、区切り点間の中央のベクトルを代表ベクトル
bkとして決定し、圧縮パタンメモリ50に{Ck
として格納する。該圧縮パタンの各ベクトルCk
は、それぞれ区間内における代表ベクトルとさ
れ、後に入力される入力パタンAとの間で認識処
理部60により周知のパタンマツチング法が実行
される。
Next, in the compression processing section shown in FIG. 3, the number K of compression vectors is determined by the compression rate determining circuit 71 using the constant C J. By determining the number K of compressed vectors, the section change amount determination circuit 72 calculates the equally divided amount of change ΔD by dividing the total amount of change D J over the entire pattern into K equal parts. Using this equally divided amount of change ΔD as a reference, k is sequentially varied from 1 to K, and kΔD is calculated by the multiplication circuit 73 and output to the comparison unit 47 of the compression processing unit. The comparison unit 47 sequentially changes J from 1 to compare the overall pattern change amount D j and kΔD, and determines a break point by setting the point where D j exceeds kΔD as j=l k . By determining the breakpoints, k is incremented by 1 and processing is performed until k=K, thereby determining the breakpoint sequence {l k } k=1 to K. From this breakpoint sequence, the center vector between the breakpoints is the representative vector for the standard putter.
b k and stored in the compressed pattern memory 50 as {C k }
Store as . Each vector C k of the compression pattern
are respectively taken as representative vectors within the interval, and a well-known pattern matching method is executed by the recognition processing unit 60 between them and the input pattern A that will be input later.

第1の実施例における圧縮ベクトルの決定方で
は、圧縮の対象であるパタンのパタン長Jを基準
に圧縮ベクトル数を決定した。この方法ではパタ
ンの総変化量にかかわらず一律に圧縮ベクトル数
Kがパタン長Jにより決定される。従つてパタン
の総変化量が少ない、いわゆる平坦なパタンに対
する圧縮効果が少ない。この点を改良した第2の
実施例の原理を第4図を用いて説明する。
In the method of determining compression vectors in the first embodiment, the number of compression vectors is determined based on the pattern length J of the pattern to be compressed. In this method, the number K of compressed vectors is uniformly determined by the pattern length J, regardless of the total amount of change in the pattern. Therefore, the compression effect on so-called flat patterns, where the total amount of change in the pattern is small, is small. The principle of the second embodiment, which is improved in this respect, will be explained with reference to FIG.

第4図のa,bは第1の実施例によるパタン圧
縮方法を図示したもので、c,dは第2の実施例
による方法を図示したものである。第1の発明で
は、区切り点数Kは圧縮率を定める定数CJでパタ
ン長Jを除してK=J/CJとして決定される。従
つて、区切り点数Kはパタン長Jから一律に決定
される。第4図aではK=6の場合が示してあ
る。一方、第4図cは、第4図aのパタンB1
同じ長さJのパタンB2に対する圧縮方法を示し
た物で、……線は第一の実施例による圧縮結果を
示している。第4図b,dはパタンB1、パタン
B2の総変化量D1J,D2Jを示したもので、圧縮率CJ
が同じな場合、等分された変化量ΔD1,ΔD2は、
パタンの変動量に依存する。この場合パタンB2
の方がパタンB1より変動量が多いため、ΔD2
ΔD1となる。このことから、第一の実施例による
圧縮法では、圧縮されたパタンと元のパタンとの
近似度が、パタン内の変動量により大きく左右さ
れることになる。第2の実施例はパタン内の変動
量に左右されない圧縮法を実現する。いま、第4
図のc,dにおいて、等分される変化量ΔDを一
定な値CDとして与え、圧縮ベクトル数KをK=
D2J/CDとして決定すると、等分される変化量ΔD
は、パタン長Jに無関係となる。すなわち、等分
される変化量ΔD(=DJ/K)を一定な値CDとし
て、第1の発明の方法により区切り点列{lk}を
決定すれば、パタン変動量に左右されることなく
近似度一定の圧縮パタンが得られる。
In FIG. 4, a and b illustrate the pattern compression method according to the first embodiment, and c and d illustrate the method according to the second embodiment. In the first invention, the number of break points K is determined by dividing the pattern length J by a constant C J that determines the compression ratio, as K=J/C J. Therefore, the number of break points K is uniformly determined from the pattern length J. In FIG. 4a, the case of K=6 is shown. On the other hand, FIG. 4c shows a compression method for pattern B2 having the same length J as pattern B1 in FIG. . Figure 4 b and d are pattern B 1 and pattern
It shows the total amount of change D 1J and D 2J of B 2 , and the compression ratio C J
are the same, the equally divided changes ΔD 1 and ΔD 2 are
Depends on the amount of pattern variation. In this case pattern B 2
Since pattern B 1 has a larger amount of variation than pattern B 1, ΔD 2 >
ΔD becomes 1 . From this, in the compression method according to the first embodiment, the degree of approximation between the compressed pattern and the original pattern is largely influenced by the amount of variation within the pattern. The second embodiment realizes a compression method that is independent of the amount of variation within the pattern. Now, the fourth
In c and d of the figure, the amount of change ΔD divided into equal parts is given as a constant value C D , and the number of compressed vectors K is K=
When determined as D 2J /C D , the amount of change ΔD that is divided into equal parts is
is unrelated to the pattern length J. That is, if the change amount ΔD (=D J /K) to be divided into equal parts is set to a constant value C D , and the break point sequence {l k } is determined by the method of the first invention, it will depend on the pattern change amount. A compression pattern with a constant degree of approximation can be obtained without any problems.

以下、第2の実施例を説明する。第5図は本発
明による圧縮処理部40と制御部70の詳細図で
ある。他の部分は第1の発明による第2図と同じ
機能である。今、音声パタンメモリ30には標準
パタンBが格納されている。第1の実施例と同様
に、(8)式のパタン変化量Djを算出し、パタン変
化量メモリ43に記憶される。制御部70では、
等分される変化量を決定する定数CDにより、圧
縮ベクトル数Kが圧縮ベクトル数決定回路74よ
りパタン総変化量DJをCDで除すことで決定され
る。この圧縮ベクトル数Kの決定により、以後の
処理は第1の実施例とまつたく同様に行なわれ、
区切り点列{lkk=1〜K及び圧縮パタン{Ck}が圧
縮パタンメモリ50に格納され、認識処理部60
によりパタンマツチング法が実行される。
The second embodiment will be described below. FIG. 5 is a detailed diagram of the compression processing section 40 and the control section 70 according to the present invention. The other parts have the same functions as those in FIG. 2 according to the first invention. Standard pattern B is currently stored in the audio pattern memory 30. Similarly to the first embodiment, the pattern change amount D j of equation (8) is calculated and stored in the pattern change amount memory 43. In the control unit 70,
The number K of compressed vectors is determined by the compressed vector number determination circuit 74 by dividing the total amount of pattern change D J by CD, using a constant C D that determines the amount of change to be equally divided. By determining this number of compressed vectors K, the subsequent processing is performed in exactly the same way as in the first embodiment,
The break point sequence {l k } k=1 to K and the compressed pattern {C k } are stored in the compressed pattern memory 50, and the recognition processing unit 60
The pattern matching method is executed.

(発明の効果) 本実施例では標準パタンを、極めて少ない演算
量により代表ベクトルによつて圧縮することが可
能であり、従来方法に較べ、メモリ量・演算量と
もに大幅な削減を可能とする。上記圧縮による誤
差は小であり、認識率を低下させることはない。
なお、音声パタン以外の特徴ベクトル列に対して
も、同様な構成によつて、同様に認識率を低下さ
せることなく、メモリ量・演算量を大幅に低減さ
せることが可能となる。
(Effects of the Invention) In this embodiment, it is possible to compress a standard pattern using a representative vector with an extremely small amount of calculation, and compared to the conventional method, it is possible to significantly reduce both the amount of memory and the amount of calculation. The error caused by the above compression is small and does not reduce the recognition rate.
Note that by using a similar configuration for feature vector sequences other than voice patterns, it is possible to significantly reduce the amount of memory and the amount of calculation without similarly reducing the recognition rate.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明における圧縮処理の原理の説明
する原理説明図、第2図は本発明の第1実施例を
示すブロツク図、第3図は圧縮処理部及び制御部
の構成図、第4図は本発明の第2の実施例の原理
を説明するための図、第5図は本発明の第2の実
施例における圧縮処理部および制御部の構成例を
示す図である。 図において、10……入力端子、20……音声
分析部、50……音声パタンメモリ、40……圧
縮処理部、50……圧縮パタンメモリ、60……
認識処理部、70……制御部、41……距離計算
部、42……累算部、43……パタン変化量メモ
リ、44……比較部、71……圧縮率決定回路、
72……区分変化量決定回路、73……乗算回
路、74……圧縮ベクトル数決定回路である。
Fig. 1 is a principle explanatory diagram explaining the principle of compression processing in the present invention, Fig. 2 is a block diagram showing a first embodiment of the invention, Fig. 3 is a configuration diagram of a compression processing section and a control section, and Fig. 4 The figure is a diagram for explaining the principle of the second embodiment of the present invention, and FIG. 5 is a diagram showing an example of the configuration of a compression processing section and a control section in the second embodiment of the present invention. In the figure, 10...input terminal, 20...speech analysis section, 50...sound pattern memory, 40...compression processing section, 50...compression pattern memory, 60...
Recognition processing unit, 70...Control unit, 41...Distance calculation unit, 42...Accumulation unit, 43...Pattern change amount memory, 44...Comparison unit, 71...Compression rate determination circuit,
72...section change amount determining circuit, 73...multiplying circuit, 74...compression vector number determining circuit.

Claims (1)

【特許請求の範囲】 1 特徴ベクトルの系列{bj}、(j=1、2、…
…、J)として表現される標準パタンを保持する
パタンメモリと、該パタンメモリーに格納された
前記ベクトル列{bj}のパタン変化量Dj、(j=
1、……J)をパタン全体にわたり算出し、パタ
ン長Jから決定される分割数Kにより前記パタン
変化量Djの総変化量DJをK等分するように前記
ベクトル列{bj}をK区間に分割し、上記演算に
よつて得られる区分点列{lk}を決定し、該{lk
により定まる各区間の中央位置のベクトルb′k
前記パタンメモリから読みだし各区間の代表ベク
トルとして圧縮パタンC=c1、c2、……cKを出力
する圧縮処理部と、前記圧縮パタンCを格納する
圧縮パタンメモリと、任意の入力パタンと前記圧
縮パタンとの比較を行う認識処理部とを備えたこ
とを特徴とするパタン認識装置。 2 特徴ベクトルの系列{bj}、(j=1、2、…
…、J)として表現される標準パタンを保持する
パタンメモリと該パタンメモリに格納された前記
ベクトル列{bj}のパタン変化量Dj、(j=1、
2、……、J)をパタン全体にわたり算出し、前
記パタン変化量Djの総変化量DJから決定される
分割数Kにより、前記パタン総変化量DJをK等
分するように前記ベクトル列{bj}をK区分に分
割し、上記演算によつて得られる区分点列{lk
を決定し、該{lk}により定まる各区間の中央位
置のベクトルb′kを前記パタンメモリから読み出
し各区間の代表ベクトルとして圧縮パタンC=
c1、c2、……cKを出力する圧縮処理部と、前記圧
縮パタンCを格納する圧縮パタンメモリと、任意
の入力パタンと前記圧縮パタンとの比較を行う認
識処理部とを備えたことを特徴とするパタン認識
装置。
[Claims] 1. Sequence of feature vectors {b j }, (j=1, 2,...
..., J), and the pattern change amount D j of the vector sequence {b j } stored in the pattern memory, (j=
1,...J) over the entire pattern, and divide the vector sequence {b j } so that the total variation D J of the pattern variation D j is divided into K equal parts by the number of divisions K determined from the pattern length J. Divide into K sections, determine the segment point sequence { l k } obtained by the above calculation, and
a compression processing unit that reads a vector b′ k at the center position of each section determined by the above from the pattern memory and outputs a compressed pattern C=c 1 , c 2 , . . . c K as a representative vector of each section; 1. A pattern recognition device comprising: a compressed pattern memory that stores C; and a recognition processing section that compares an arbitrary input pattern with the compressed pattern. 2 Sequence of feature vectors {b j }, (j=1, 2,...
..., J) and the pattern change amount D j of the vector sequence {b j } stored in the pattern memory, (j=1,
2 , . Divide the vector sequence {b j } into K sections and obtain the segment point sequence {l k } obtained by the above operation.
is determined, and the vector b' k at the center position of each section determined by {l k } is read out from the pattern memory and the compressed pattern C=
A compression processing unit that outputs c 1 , c 2 , ...c K , a compression pattern memory that stores the compression pattern C, and a recognition processing unit that compares an arbitrary input pattern with the compression pattern. A pattern recognition device characterized by:
JP60117135A 1985-05-30 1985-05-30 Pattern recognition equipment Granted JPS61275800A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60117135A JPS61275800A (en) 1985-05-30 1985-05-30 Pattern recognition equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60117135A JPS61275800A (en) 1985-05-30 1985-05-30 Pattern recognition equipment

Publications (2)

Publication Number Publication Date
JPS61275800A JPS61275800A (en) 1986-12-05
JPH0574836B2 true JPH0574836B2 (en) 1993-10-19

Family

ID=14704316

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60117135A Granted JPS61275800A (en) 1985-05-30 1985-05-30 Pattern recognition equipment

Country Status (1)

Country Link
JP (1) JPS61275800A (en)

Also Published As

Publication number Publication date
JPS61275800A (en) 1986-12-05

Similar Documents

Publication Publication Date Title
JP2692581B2 (en) Acoustic category average value calculation device and adaptation device
JPH0361959B2 (en)
US4426551A (en) Speech recognition method and device
JPH0159600B2 (en)
JPS5885499A (en) Continuous voice recognition method and apparatus
JPS6254297A (en) Voice recognition equipment
JP2980026B2 (en) Voice recognition device
EP0162255B1 (en) Pattern matching method and apparatus therefor
JPH0574836B2 (en)
JPS6312312B2 (en)
JPH0887294A (en) Voice recognition device
US4794645A (en) Continuous speech recognition apparatus
JPS59131999A (en) Voice recognition equipment
JP3352144B2 (en) Voice recognition device
JP3226716B2 (en) Voice recognition device
JPS6118200B2 (en)
JPS58149099A (en) Pattern recognition system
JPS6097400A (en) Voice recognition equipment
JPH0436400B2 (en)
JP2577891B2 (en) Word voice preliminary selection device
JP2707577B2 (en) Formant extraction equipment
JPH0223876B2 (en)
JPS59127098A (en) Continuous word voice recognition equipment
JPS61180295A (en) Continuous syllable recognition
JPS58195893A (en) Pretreatment for voice recognition equipment