JPH0731520B2 - Variable length frame type pattern matching vocoder - Google Patents

Variable length frame type pattern matching vocoder

Info

Publication number
JPH0731520B2
JPH0731520B2 JP61069291A JP6929186A JPH0731520B2 JP H0731520 B2 JPH0731520 B2 JP H0731520B2 JP 61069291 A JP61069291 A JP 61069291A JP 6929186 A JP6929186 A JP 6929186A JP H0731520 B2 JPH0731520 B2 JP H0731520B2
Authority
JP
Japan
Prior art keywords
frame
distortion
analysis
representative
frames
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61069291A
Other languages
Japanese (ja)
Other versions
JPS62998A (en
Inventor
哲 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPS62998A publication Critical patent/JPS62998A/en
Publication of JPH0731520B2 publication Critical patent/JPH0731520B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は可変長フレーム型パタンマッチングボコーダに
関し、特に区分的最適関数近似手法によるフレーム選択
と,標準パタンとの照合によるパタンマッチングとをそ
れぞれの処理歪を介して関連づけて実施することによ
り,パタンマッチング歪が大きくなるフレームはこれを
除去することが可能となる可変長フレーム型パタンマッ
チングボコーダに関する。
The present invention relates to a variable-length frame type pattern matching vocoder, and particularly to frame selection by a piecewise optimal function approximation method and pattern matching by matching with a standard pattern. The present invention relates to a variable length frame type pattern matching vocoder that can remove a frame in which pattern matching distortion is large by performing the processing in association with each other through processing distortion.

〔従来の技術〕[Conventional technology]

入力音声信号を分析して得られるスペクトル包絡パラメ
ータと,スペクトル包絡の標準パタンとを照合して最適
な標準パタンを選択し,スペクトル包絡パラメータの代
りに当該標準パタンの指定コードを分析側から合成側に
伝送することによって,必要とする伝送情報量を大幅に
低減しうるパタンマッチングボコーダはよく知られてい
る。
The spectral envelope parameter obtained by analyzing the input speech signal is compared with the standard pattern of the spectral envelope to select the optimal standard pattern. Instead of the spectral envelope parameter, the specified code of the standard pattern is analyzed from the analysis side to the synthesis side. It is well known that a pattern matching vocoder that can significantly reduce the required amount of information to be transmitted by transmitting the pattern matching vocoder.

可変長フレーム型パタンマッチングボコーダは、このよ
うなパタンマッチングボコーダにおいて分析フレームご
とに照合され選択された標準パタンを分析フレームに対
応してすべて送出する代りに、連続するK個の分析フレ
ームから成る区分ごとに抽出されるL個の代表分析フレ
ームに対応するL個ずつ標準パタンを選定しつつ、これ
らL個の標準パタンのそれぞれとともにこれら標準パタ
ンによって代表される分析フレームの数,いわゆるリピ
ートビット(repeat bit)を分析側から合成側に送出す
るものである。この場合,区分ごとに選択される標準パ
タンは,区分ごとに選択された代表分析フレーム(:最
適の標準パタンのラベル,すなわち指定コードのみが合
成側にレピートビットとともに送出される。また,区分
ごとに選択される代表分析フレームは区分ごとの全分析
フレームによって示されるスペクトル包絡パラメータの
分布を最適近似関数で近似せしめることによって得ら
れ,この最適近似関数は矩形,台形もしくは直線等の近
似関数がそれぞれボコーダの運用目的によって使いわけ
られ、かつ通常はDP手法を介して関数設定がなされてい
る。
The variable-length frame type pattern matching vocoder is a section made up of continuous K analysis frames, instead of sending all standard patterns corresponding to the analysis frames which are collated and selected for each analysis frame in such a pattern matching vocoder. While selecting L standard patterns corresponding to L representative analysis frames extracted for each, the number of analysis frames represented by these standard patterns together with each of these L standard patterns, that is, a so-called repeat bit (repeat bit). bit) is sent from the analysis side to the synthesis side. In this case, the standard pattern selected for each segment is the representative analysis frame selected for each segment (: the label of the optimum standard pattern, that is, only the designated code is sent to the synthesis side together with the repeat bit. The representative analysis frame selected for is obtained by approximating the distribution of spectral envelope parameters indicated by all analysis frames for each segment by an optimal approximation function. The optimal approximation function is a rectangle, trapezoid, or straight line approximation function, respectively. It is used properly depending on the operation purpose of the vocoder, and usually the function is set via the DP method.

上述の最適近似関数として矩形近似関数を用いる場合、
具体的には以下のようにフレーム選択が行なわれる。
When using a rectangular approximation function as the above-mentioned optimal approximation function,
Specifically, frame selection is performed as follows.

入力音声信号より10mSEC程度のフレーム周期で分析され
たスペクトル包絡パラメータ系列を単音節程度の一定の
時間長を持つブロック(K個のフレームを含む)に分割
し、各ブロック内で一定の個数(L個)の代表フレーム
および代表フレームが代表する区間の境界を入力音声の
スペクトル包絡パラメータ系列とのスペクトル距離の和
を最小にするように選択する。即ち、区分ごとのK個の
分析フレームの内容が矩形関数を構成するL個の分析フ
レームの内容ならびにこれらL個の分析フレームのそれ
ぞれが代表する分析フレームの数によって表現されるこ
ととなる。
The spectrum envelope parameter sequence analyzed at a frame period of about 10 mSEC from the input speech signal is divided into blocks (including K frames) having a constant time length of about a single syllable, and a fixed number (L Individual) representative frames and the boundaries of the sections represented by the representative frames are selected so as to minimize the sum of the spectral distances from the spectral envelope parameter sequence of the input speech. That is, the contents of the K analysis frames for each section are represented by the contents of the L analysis frames forming the rectangular function and the number of analysis frames represented by each of the L analysis frames.

こうしてパタンマッチングに加えて可変長フレームによ
り所要ビット数の大幅な低減を図っているのが従来の可
変フレーム型パタンマッチングボコーダである。
In this way, the conventional variable frame type pattern matching vocoder is capable of significantly reducing the number of required bits by the variable length frame in addition to the pattern matching.

〔発明が解決しようとする問題点〕[Problems to be solved by the invention]

しかしながら従来のこの種の可変長フレーム型パタンマ
ッチングボコーダは,可変長フレーム構成とする際に必
要な代表フレームの選択と,パタンマッチングによる標
準パタンの選択とはそれぞれ独立的に実施されており、
従ってパタンマッチングに付随して発生するスペクトル
歪すなわち量子化歪と,DPを利用して行なわれる可変長
フレームの選択に付随して発生するスペクトル歪,すな
わちフレームを代表フレームで代替することによって発
生するスペクトル距離の差異発生にもとづく,いわゆる
時間歪とがそれぞれ独立的に含まれた状態で分析,合成
されており、このため合声音質の品質の劣化が避けられ
ないという欠点がある。
However, in the conventional variable length frame type pattern matching vocoder of this type, the selection of the representative frame required for the variable length frame configuration and the selection of the standard pattern by the pattern matching are performed independently.
Therefore, the spectrum distortion or quantization distortion that accompanies pattern matching and the spectrum distortion that accompanies the selection of variable-length frames using DP, that is, the frame distortion, is generated by substituting the representative frame. The so-called time distortion, which is based on the occurrence of the difference in the spectral distance, is analyzed and synthesized independently of each other. Therefore, there is a drawback that the deterioration of the quality of the voice of the voice cannot be avoided.

〔問題点を解決するための手段〕[Means for solving problems]

本発明のボコーダは、入力音声信号を分析して得られる
スペクトル包絡パラメータとスペクトル包絡に関する標
準パタンとを照合してスペクトル距離が最小となる最適
な標準パタンを選択する標準パタン選択手段と,この標
準パタン選択手段による標準パタン選択に付随して算出
されるスペクトル歪とDPを用いたフレーム選択に付随し
て算出されるスペクトル歪とのスカラー加算によって定
義される総歪を評価値とするフレーム選択手段とを備え
且つ、前記DPによるフレーム選択に付随して算出される
スペクトル歪として選択された標準パタンの補間パラメ
ータと分析して得られるスペクトル包絡パラメータとか
ら算出されるスペクトル歪を使用する手段を備えて構成
される。
The vocoder of the present invention is a standard pattern selecting means for selecting an optimum standard pattern having a minimum spectral distance by comparing a spectrum envelope parameter obtained by analyzing an input voice signal with a standard pattern relating to the spectrum envelope, and this standard. A frame selection unit that uses the total distortion defined by the scalar addition of the spectral distortion calculated accompanying the standard pattern selection by the pattern selection unit and the spectral distortion calculated accompanying the frame selection using DP as the evaluation value And means for using the spectral distortion calculated from the interpolation parameter of the standard pattern selected as the spectral distortion calculated accompanying the frame selection by the DP and the spectral envelope parameter obtained by analysis. Consists of

〔実施例〕〔Example〕

次に図面を参照して本発明を詳細に説明する。 The present invention will now be described in detail with reference to the drawings.

第1図は本発明による可変長フレーム型パタンマッチン
グボコーダの一実施例の構成を示すブロック図である。
FIG. 1 is a block diagram showing the configuration of an embodiment of a variable length frame type pattern matching vocoder according to the present invention.

第1図に示す実施例の構成は分析側1と合成側2とから
構成され,また分析側1は,パラメータ分析器11,音源
分析器12,パタン照合器13,標準パタンファイル14,フレ
ーム選択器15およびマルチプレクサ16を備えて構成さ
れ,合成側2は,デマルチプレクサ21,パタン読出し器2
2,音源発生器23,標準パタンファイル24および音声合成
フィルタ25を備えて構成される。
The configuration of the embodiment shown in FIG. 1 comprises an analysis side 1 and a synthesis side 2, and the analysis side 1 has a parameter analyzer 11, a sound source analyzer 12, a pattern collator 13, a standard pattern file 14, and a frame selection. The combination side 2 includes a demultiplexer 21 and a pattern reader 2
2, a sound source generator 23, a standard pattern file 24, and a voice synthesis filter 25.

入力ライン1001を介して入力した音声信号はパラメータ
分析器11と音源分析器12とに供給される。
The audio signal input via the input line 1001 is supplied to the parameter analyzer 11 and the sound source analyzer 12.

パラメータ分析器11は入力音声信号のスペクトル包絡パ
ラメータを分析するもので、本実施例の場合はLSP(Lin
e Spectrum Pairs,線スペクトル対)を利用している
が,これはパタンマッチングに有効なその他のLPC(Lin
ear Prediction Coffieient,線形予測係数)を利用して
も差支えない。
The parameter analyzer 11 analyzes the spectral envelope parameter of the input speech signal, and in the case of the present embodiment, LSP (Lin (Lin
We use e Spectrum Pairs, which is another LPC (Lin) that is effective for pattern matching.
Ear Prediction Coffieient) can be used.

さて,スペクトル包絡パラメータは通常LPC分析を前提
として実施されており,入力音声信号は先ずLPF(Low P
ass Filter)で所要の低域フィルタリングを実施したの
ちA/D(Analog to Digjtal)コンバータによって所定の
ビット数で量子化されたのち所定の窓関数による乗算を
施される。この窓関数による乗算は予め設定する一定周
期ごとに実施され,こうして切出される一定周期ごとの
量子化音声信号が分析フレームとなる。本実施例ではLP
Fの遮断周波数は3.4KH,A/Dコンバータの標本化周波数は
8KHzで,また窓関数処理は量子化音声信号の30mSEC分ず
つを内蔵メモリにストアしつつこれを10mSECの周期で読
出しハミング関数による窓処理を行なって10mSECの分析
フレームとして出力する。また本実施例ではこの分析フ
レームの連続する20個分,すなわち200mSEC分を1区分
としている。
By the way, the spectral envelope parameter is usually implemented on the premise of LPC analysis, and the input speech signal is first LPF (Low P
After performing a required low-pass filtering with an ass filter), the signal is quantized with a predetermined number of bits by an A / D (Analog to Digjtal) converter, and then multiplied by a predetermined window function. The multiplication by the window function is performed at preset constant cycles, and the quantized speech signal thus cut out at constant cycles becomes an analysis frame. In this example, LP
The cutoff frequency of F is 3.4KH, and the sampling frequency of the A / D converter is
At 8 KHz, the window function processing stores 30 mSEC portions of the quantized audio signal in the internal memory, reads this at a cycle of 10 mSEC, performs window processing with the Hamming function, and outputs it as a 10 mSEC analysis frame. Further, in this embodiment, 20 consecutive analysis frames, that is, 200 mSEC, is set as one section.

分析フレームごとの量子化音声信号は次にLPCの分析に
よって所定の次数のαパラメータを抽出したあと,ニュ
ートン(Newton)の反復法を利用する高次方程式を解く
手法,あるいは零点検索法等の公知の手法を利用して予
め設定する次数のLSP係数列を求め,このLSPをパタン照
合器13に供給する。
For the quantized speech signal for each analysis frame, after extracting the α parameter of a predetermined order by LPC analysis, a method of solving a higher-order equation using Newton's iterative method, or a zero-point search method is known. The LSP coefficient sequence of a preset order is obtained by using the method of (1) and this LSP is supplied to the pattern collator 13.

パタン照合器13は区分ごと,かつ分析フレームごとに入
力するスペクトル包絡パラメータとしてのLSPと,標準
パタンファイル14に予めストアされているLSPによるス
ペクトル包絡パラメータの標準パタンとわ照合して最適
のスペクトル包絡標準パタンを選択する。
The pattern collator 13 collates the LSP as a spectrum envelope parameter input for each segment and each analysis frame with the standard pattern of the spectrum envelope parameter by the LSP stored in the standard pattern file 14 in advance to find the optimum spectrum envelope. Select a standard pattern.

パタン照合は,入力する分析フレームごとのLSPによる
スペクトル包絡パタンとスペクトル包絡標準パタンとを
照合して両パタン間のスペクトル距離が最小なものを最
適のスペクトル包絡標準パタンとして選択する。パタン
間の最小スペクトル距離は次の(1)式のDQ(q)で定
義することができる。
In pattern matching, the spectral envelope pattern by the LSP for each input analysis frame is compared with the spectral envelope standard pattern, and the one with the smallest spectral distance between both patterns is selected as the optimal spectral envelope standard pattern. The minimum spectral distance between patterns can be defined by D Q (q) in the following equation (1).

WKはスペクトル包絡パラメータであるN次LSP係数ベク
トルの第K番目の要素の微少な変化に対するスペクトル
包絡の変形の割合を表現する定数で、スペクトル感度と
呼ばれるものであり、予じめ実験的に求められたものを
使用する。
W K is a constant expressing the rate of deformation of the spectrum envelope with respect to a slight change of the Kth element of the Nth order LSP coefficient vector, which is the spectrum envelope parameter, and is called the spectral sensitivity, which has been experimentally predicted. Use what you were asked for.

なお、スペクトル感度についてはY.Tohkura,F.Itakura,
“Spectral Smoothing Technique in PARCOR Speech An
alys is Synthesis"IE3Trans.on A.S.S.P.Vol,ASSP−2
6,NO.6,December1978,P.587〜596のVI.“SST and Spect
ral Sensitivity of Parameters"およびF.Itakura,“Op
timal nonlinear Transformation of LPCs to improve
quantization properties J.A.S.A.Vol.56(supplemen
t)paper H14,P.516,1974に述べられている。またNはL
SP分析次数,PK(Q)は区分ごとに入力する分析フレー
ムのスペクトル包絡パタンであり、QはK個のフレーム
を含むブロックに於いて、ブロックに含まれる各フレー
ムの番号であり、Q=1,2,…Kである。また、R=1〜
M,Mはスペクトル標準パタンの総数で、PK (S1)〜PK (SM)
は1〜M番目までのスペクトル包絡標準パタンである。
For spectral sensitivity, see Y. Tohkura, F. Itakura,
“Spectral Smoothing Technique in PARCOR Speech An
alys is Synthesis "IE 3 Trans.on ASSPVol, ASSP−2
VI, “SST and Spect” of 6, NO.6, December 1978, P. 587-596
ral Sensitivity of Parameters "and F. Itakura,“ Op
timal nonlinear Transformation of LPCs to improve
quantization properties JASA Vol.56 (supplemen
t) paper H14, P.516, 1974. N is L
SP analysis order, P K (Q) is a spectrum envelope pattern of the analysis frame input for each section, Q is the number of each frame included in the block including K frames, and Q = 1,2, ... K. In addition, R = 1 to
M and M are the total number of spectral standard patterns, P K (S1) to P K (SM)
Is a spectrum envelope standard pattern from 1 to Mth.

(1)式にもとづいてM個のスペクトル包絡標準パタン
と,入力した区分ごとの分析フレームのスペクトル包絡
パタンとがLSPの分布を介してパタン照合され最小のDQ
(q)を示すものが標準パタンとして選択され,このよ
うにして選択された標準パタンと、標準パタンを指定す
る指定コードならびにDQ(q)がそれぞれ標準パタンパ
ラメータ、ラベル情報および量子化歪としてフレーム選
択器15に供給される。
Based on equation (1), the M spectral envelope standard patterns and the spectral envelope patterns of the input analysis frames for each segment are pattern-matched via the LSP distribution, and the minimum D Q is obtained.
The one showing (q) is selected as the standard pattern, and the standard pattern selected in this way, the designation code designating the standard pattern, and D Q (q) are respectively defined as the standard pattern parameter, label information, and quantization distortion. It is supplied to the frame selector 15.

(1)式によって示されるDQ(q)は2つのパタン間の
スペクトル距離を示すものであり、パタン照合において
発生するパタン照合歪ともいうべきスペクトル歪,すな
わち量子化歪である。
D Q (q) represented by the equation (1) indicates a spectral distance between two patterns, and is spectral distortion that should be called pattern matching distortion that occurs in pattern matching, that is, quantization distortion.

さて,フレーム選択器15にはまたパラメータ分析器11か
らLSPが提供されフレーム選択器15はこれら入力を利用
しDP手法にもとづいて区分ごとに可変長フレーム化を行
なうための代表分析フレームを選択する。
Now, the frame selector 15 is also provided with the LSP from the parameter analyzer 11, and the frame selector 15 uses these inputs to select a representative analysis frame for performing variable length framing for each section based on the DP method. .

本実施例においては可変長フレーム化を矩形近似且ち、
選択されたパラメータ間を零次補間して他のパラメータ
を代替する方法を利用して行なっているが,これは線形
且ち一時補間を用いたものもしくは台形近似且ち一次補
間と零次補間を組合せたもの等の他の最適関数近似を利
用するものとしても差支えない。
In this embodiment, the variable length framing is approximated by a rectangle,
This is done by using the method of substituting other parameters by performing zero-order interpolation between the selected parameters. This method uses linear and temporary interpolation or trapezoidal approximation and linear and zero-order interpolation. It does not matter even if other optimal function approximations such as a combination are used.

この矩形近似は区分中の分析フレームの中から予め設定
する個数の代表分析フレームを選択し,これら代表分析
フレームによって区分中の全分析フレームを代表せしめ
るものであり,選択される代表分析フレームはDP手法を
利用して次のようにして入力音声信号のスペクトル包絡
パラメータと区分的最適近似する矩形関数を形成するも
のが決定される。
In this rectangular approximation, a preset number of representative analysis frames are selected from the analysis frames in the division, and all the analysis frames in the division are represented by these representative analysis frames. Using the method, the one that forms a rectangular function that is piecewise optimally approximated to the spectral envelope parameter of the input speech signal is determined as follows.

第2図はDPによるフレーム選択の基本的内容を説明する
ためのフレーム選択説明図である。
FIG. 2 is a frame selection explanatory diagram for explaining the basic contents of frame selection by the DP.

本実施例における可変長フレームの設定は、10mSECの分
析フレーム20個より成る200mSECの区分ごとに区分的最
適関数を設定する形式で実施され,この区分を5個の代
表分析フレームとこれら代表分析フレームによる繰返し
情報とによって表現する。すなわち各区分は選択された
5個の代表分析フレームとこれら代表分析フレームのそ
れぞれを代表とする分析フレームの組合せによって表現
され、代表分析フレームはこの代表分析フレームによっ
て設定される近似矩形が入力音声信号のスペクトル包絡
パラメータとのスペクトル距離差を最小とするものがDP
によって選択される形式で行なわれる。
The setting of the variable-length frame in the present embodiment is performed in a format in which a piecewise optimum function is set for each section of 200 mSEC consisting of 20 pieces of analysis frame of 10 mSEC, and this section is divided into five representative analysis frames and these representative analysis frames. It is expressed by the repeated information and. That is, each section is expressed by a combination of the selected five representative analysis frames and an analysis frame having each of these representative analysis frames as a representative, and the representative analysis frame is an approximate rectangle set by the representative analysis frame. The one that minimizes the difference in spectral distance from the spectral envelope parameter of
In the format selected by.

上述した区分の長さ,分析フレーム長ならびに代表フレ
ームの数等はボコーダの運用目的等を勘案し任意に設定
しうるものである。
The length of the section, the analysis frame length, the number of representative frames, and the like described above can be arbitrarily set in consideration of the operation purpose of the vocoder.

第2図に示す第1代表分析フレーム候補〜第5代表分析
フレーム候補は20個の分析フレームから選択される5個
の代表分析フレームの1番目から5番目までのそれぞれ
の候補分析フレームを示したものである。
The first representative analysis frame candidate to the fifth representative analysis frame candidate shown in FIG. 2 indicate the first to fifth candidate analysis frames of the five representative analysis frames selected from the 20 analysis frames. It is a thing.

本実施例においてはこれら第1〜第5の代表分析フレー
ム候補の選択に2つの制限を設けている。
In this embodiment, there are two restrictions on the selection of these first to fifth representative analysis frame candidates.

制限の第一は代替フレーム数に関する。代表分析フレー
ム候補のそれぞれが時間的に先行する。あるいは、時間
的に後続する他のフレームを代替し得る最大数を6フレ
ームとしている。即ち、分析フレーム候補は、候補自身
を含む前後各々最大6フレームまでを代表し得る。従っ
て本実施例の場合、分析フレーム候補が代表し得る連続
したフレームの数は13(=6+1+6)〜1(=0+1
+0)の間で自由である。尚、本実施例においては、先
行又は後続フレームの最大代替数を6としているが、こ
れは合成音声の再現性や所要演算量等を最適評価し任意
に設定しうるものである。
The first limitation relates to the number of alternative frames. Each of the representative analysis frame candidates precedes in time. Alternatively, the maximum number that can replace other temporally subsequent frames is 6 frames. That is, the analysis frame candidates can represent up to 6 frames each before and after including the candidate itself. Therefore, in the case of the present embodiment, the number of consecutive frames that can be represented by the analysis frame candidates is 13 (= 6 + 1 + 6) to 1 (= 0 + 1).
It is free between +0). In this embodiment, the maximum number of substitutions of the preceding or succeeding frame is set to 6, but this can be arbitrarily set by optimally evaluating the reproducibility of the synthesized voice and the required calculation amount.

制限の第二は代表分析フレームの最大間隔である。本実
施例では7としている。最大間隔についても合成音声の
再現性や所要演算量等を最適評価し任意に設定しうるも
のである。
The second limitation is the maximum interval between representative analysis frames. In this embodiment, it is set to 7. Regarding the maximum interval, it is possible to optimally evaluate the reproducibility of the synthesized voice, the required calculation amount, etc., and set it arbitrarily.

さて、第一代表フレーム候補は代替し得る先行フレーム
数が0〜6の制限により、分析フレーム(1)(先行フ
レームの代替数0)から、分析フレーム(7)(先行フ
レームの代替数6)が対象となる。同様に第5代表フレ
ーム候補は代替し得る後続フレーム数が0〜6の制限に
より、分析フレーム(14)(後続フレームの代替数6)
から、分析フレーム(20)(後続フレームの代替数0)
が対象となる。
Now, the first representative frame candidate is limited from the analysis frame (1) (the number of substitutions of the preceding frame is 0) to the analysis frame (7) (the number of substitutions of the preceding frame is 6) due to the restriction that the number of the preceding frames that can be substituted is 0 to 6. Is the target. Similarly, the fifth representative frame candidate has an analysis frame (14) (the number of substitutions of subsequent frames is 6) due to the limitation that the number of subsequent frames that can be substituted is 0 to 6.
From, analysis frame (20) (substituting number of subsequent frames is 0)
Is the target.

また第一代表フレーム候補に引続いて第2代表フレーム
候補となり得る分析フレームは、以下の理由により分析
フレーム(2)〜(14)となる。
The analysis frames that can be the second representative frame candidates following the first representative frame candidates are the analysis frames (2) to (14) for the following reasons.

即ち、仮に第一代表フレームが分析フレーム(1)であ
るとすれば、代表分析フレームの最大間隔に関する制限
と相隣接するフレームが選択される可能性とから、第2
代表フレーム候補となりうる分析フレームは(2)〜
(8)である。又、仮に第一代表フレームが分析フレー
ム(2)であるとすれば、第二代表フレーム候補となり
うる分析フレームは(3)〜(9)である。同様に第一
代表フレームが分析フレーム(7)であるとすれば、第
二代表フレーム候補となりうる分析フレームは(8)〜
(14)となる。故に第2代表フレーム候補となりうる分
析フレームは(2)〜(14)となる。
That is, if the first representative frame is the analysis frame (1), the second representative frame is limited to the second frame because of the limitation on the maximum interval of the representative analysis frames and the possibility that adjacent frames are selected.
Analysis frames that can be representative frame candidates are (2)-
(8). If the first representative frame is the analysis frame (2), the analysis frames that can be the second representative frame candidates are (3) to (9). Similarly, if the first representative frame is the analysis frame (7), the analysis frames that can be the second representative frame candidates are (8) to
(14) Therefore, the analysis frames that can be the second representative frame candidates are (2) to (14).

同様に第5代表フレーム候補との、代表分析フレームの
最大間隔に関する制限から第4代表フレーム候補となり
うる分析フレームは(7)〜(19)となる。
Similarly, the analysis frames that can be the fourth representative frame candidates are (7) to (19) due to the limitation on the maximum interval of the representative analysis frame with the fifth representative frame candidate.

さて第三代表フレーム候補となりうる分析フレームは、
第二代表フレームと第四代表フレームの双方より拘束さ
れる。即ち、必ず、第二代表フレームと第四代表フレー
ムとの間に存在する必要がある。
Now, the analysis frame that can be the third representative frame candidate is
It is constrained by both the second representative frame and the fourth representative frame. That is, it must always exist between the second representative frame and the fourth representative frame.

第二代表フレーム候補との、代表分析フレームの最大間
隔に関する制限と相隣接するフレームが選択される可能
性とから、第3代表フレーム候補となりうる分析フレー
ムは(3)〜(21)となる。又、第四代表フレーム候補
との、代表フレームの最大間隔に関する制限と相隣接す
るフレームが選択される可能性とから、第3代表フレー
ム候補となりうる分析フレームは(0)〜(18)とな
る。上記2つの条件を同時に満足する分析フレーム
(3)〜(18)が第3代表フレーム候補となりうる分析
フレームである。尚、上述の説明に於いてフレーム
(0)および(21)は現実には存在しない。
The analysis frames that can be the third representative frame candidates are (3) to (21) because of the limitation on the maximum interval of the representative analysis frame from the second representative frame candidate and the possibility that adjacent frames are selected. Further, due to the restriction on the maximum interval between the representative frames with the fourth representative frame candidate and the possibility that adjacent frames are selected, the analysis frames that can be the third representative frame candidates are (0) to (18). . Analysis frames (3) to (18) that simultaneously satisfy the above two conditions are analysis frames that can be the third representative frame candidate. In the above description, frames (0) and (21) do not actually exist.

本実施例におけるDPを用いたフレーム選択は、先ず代表
分析フレームによって代替される分析フレームの分析フ
レーム代替によるスペクトル歪,いわゆる時間歪を算出
したあとさらに各分析フレームに含まれる量子化歪すな
わちパタンマッチング処理の際のスペクトル歪を加算
し、これら時間歪と量子化歪とを加算した総歪を評価値
として実施している。本実施例ではこのように時間歪を
算出したあと量子化歪を加算して評価値の総歪を計測し
ているがこれら2つの歪の加算順序を逆にする処理手法
としても容易に実施しうることは明らかである。
In the frame selection using DP in this embodiment, first, the spectrum distortion due to the analysis frame replacement of the analysis frame replaced by the representative analysis frame, so-called temporal distortion is calculated, and then the quantization distortion included in each analysis frame, that is, pattern matching. Spectral distortion at the time of processing is added, and total distortion obtained by adding these temporal distortion and quantization distortion is used as an evaluation value. In this embodiment, after calculating the time distortion in this way, the quantization distortion is added to measure the total distortion of the evaluation values. However, it can be easily implemented as a processing method for reversing the addition order of these two distortions. It is clear that

さて,第2図において,いま仮に分析フレーム(1)が
第1フレームとして選択された場合を考えてみる。これ
に対して第2フレームとなりうる可能性のある分析フレ
ームは(2)〜(8)である。これら第1および第2フ
レーム候補の組合せを例とし発生する時間歪を考えてみ
ると次のようになる。
Now, consider the case where the analysis frame (1) is selected as the first frame in FIG. On the other hand, the analysis frames that may be the second frame are (2) to (8). Taking the combination of the first and second frame candidates as an example, the time distortion that occurs will be as follows.

分析フレーム代替によるスペクトル歪すなわち時間歪
は,最適な標準パタンに代替された代表分析フレームと
代替される分析フレームとのスペクトル距離によって表
わすことができ次の(2)式によって示される。
The spectral distortion or time distortion due to the analysis frame substitution can be represented by the spectral distance between the representative analysis frame substituted with the optimum standard pattern and the substituted analysis frame, and is represented by the following equation (2).

(2)式においてi,jはスペクトル距離di,jの計測を行
なう最適な標準パタンに代替された代表分析フレーム
と、代表分析フレームに代替される分析フレームのフレ
ーム番号であり、PK(si)は標準パタンに代替された代
表分析フレームiのパラメータである。又、他の記号は
(1)式の場合と同じである。(2)の近似式で示され
るdi,jは最適な標準パタンにより代替されたフレーム
iとフレームiに代替されるフレームj間のスペクトル
距離であり、フレームjをiで代替する場合に発生する
スペクトル歪、すなわち時間歪である。
In equation (2), i, j is the frame number of the representative analysis frame replaced by the optimum standard pattern for measuring the spectral distance d i, j and the frame number of the analysis frame replaced by the representative analysis frame, and P K ( si) is a parameter of the representative analysis frame i replaced by the standard pattern. The other symbols are the same as in the case of the formula (1). D i, j shown in the approximate expression of (2) is the spectral distance between the frame i substituted by the optimum standard pattern and the frame j substituted by the frame i, and occurs when the frame j is substituted by i. Spectrum distortion, that is, time distortion.

さて、分析フレーム(1)と(2)とがそれぞれ第1お
よび第2代表分析フレームとなったような場合はフレー
ム代替による時間歪は発生せずそれぞれの含む量子化歪
のみが加算されたものが総歪となる。
When the analysis frames (1) and (2) become the first and second representative analysis frames, respectively, the time distortion due to the frame substitution does not occur and only the quantization distortions included in each are added. Is the total distortion.

次に,第2代表分析フレームとして分析フレーム(3)
が選択された場合を考えてみると次の(3)式に示すD3
(2)が最小の総歪をして定義される。
Next, the analysis frame (3) as the second representative analysis frame
Considering the case where is selected, D 3 shown in the following equation (3)
(2) is defined with the minimum total distortion.

(3)式においてD3 (2)は第2代表分析フレーム候補と
して分析フレーム(3)を選択したときに発生する総歪
であり,またD1 (1)およびD2 (1)はそれぞれ第1代表分析
フレームとして分析フレーム(1)および(2)を選択
したときのそれぞれの総歪を表わす。
In equation (3), D 3 (2) is the total distortion that occurs when analysis frame (3) is selected as the second representative analysis frame candidate, and D 1 (1) and D 2 (1) are respectively the first distortion. The respective total distortions when the analysis frames (1) and (2) are selected as one representative analysis frame are shown.

上述した第1代表分析フレーム候補tにおける総歪は先
行分析フレームとしての分析フレーム(1)〜(t−
1)と最適な標準パタンに代替されたフレーム(t)間
の各々の時間歪を計測し、且つこれら計測値にそれぞれ
の分析フレームの量子化歪を加算して求められる。
(4)式は第1代表分析フレームとして分析フレーム
(1)〜(7)を選択したときのそれぞれの総歪を示
す。
The total distortion in the above-mentioned first representative analysis frame candidate t is the analysis frames (1) to (t-
Each time distortion between 1) and the frame (t) replaced by the optimum standard pattern is measured, and the quantization distortion of each analysis frame is added to these measured values.
Expression (4) shows each total distortion when the analysis frames (1) to (7) are selected as the first representative analysis frame.

(4)式においてD1 (1)〜D7 (1)はそれぞれ分析フレーム
(1)〜(7)の総歪,D1 (q)〜D7 (q)は分析フレーム
(1)〜(7)のそれぞれの量子化歪,d2,1は分析フレ
ーム(1)と最適な標準パタンに代替された分析フレー
ム(2)間の時間歪,また は分析フレーム(1)と最適な標準パタンに代替された
分析フレーム(3)間および分析フレーム(2)と最適
な標準パタンに代替された分析フレーム(3)間の時間
歪の和で, は最適な標準パタンに代替された分析フレーム(7)と
分析フレーム(1)〜(6)との時間歪の和を示す。
In equation (4), D 1 (1) to D 7 (1) are total distortions of analysis frames (1) to (7), respectively, and D 1 ( q ) to D 7 ( q ) are analysis frames (1) to ( 7) Each quantization distortion, d 2,1 is the time distortion between the analysis frame (1) and the analysis frame (2) replaced by the optimal standard pattern, and Is the sum of the time distortion between the analysis frame (1) and the analysis frame (3) replaced by the optimum standard pattern, and between the analysis frame (2) and the analysis frame (3) replaced by the optimum standard pattern, Indicates the sum of the time distortions of the analysis frame (7) substituted with the optimum standard pattern and the analysis frames (1) to (6).

また(3)式におけるD1,3は,次の(5)式で定義さ
れる如く分析フレーム(1)と(3)とがそれぞれ第1
および第2代表分析フレームとなった場合分析フレーム
(2)が分析フレーム(1)もしくは(3)のいずれに
よって代表されるかによって異なる2通りのフレーム代
替歪すなわち時間歪のうちの小なるものを示す。さらに
2,3は分析フレーム(2)と(3)とがそれぞれ第1
および第2代表分析フレームとなった場合に起りうる時
間歪であるが,代表フレーム候補(2)と(3)との間
には代替されるフレームが存在しないので、D2,3=0
となる。なお、D3 (q)は分析フレーム(3)のもつ量子
化歪である。
Further, D 1,3 in the equation (3) is the first in the analysis frames (1) and (3) as defined by the following equation (5).
And when it becomes the second representative analysis frame, the smaller one of the two types of frame alternative distortion, that is, the time distortion, which differs depending on whether the analysis frame (2) is represented by the analysis frame (1) or (3). Show. Further, in D 2,3, the analysis frames (2) and (3) are the first, respectively.
Also, this is a time distortion that may occur when the frame becomes the second representative analysis frame. However, since there is no substitute frame between the representative frame candidates (2) and (3), D 2,3 = 0.
Becomes It should be noted that D 3 ( q ) is the quantization distortion of the analysis frame (3).

(5)式においてd1,2は最適な標準パタンに代替され
た分析フレーム(1)と分析フレーム(2)との(2)
式によるスペクトル距離,d3,2は最適な標準パタンによ
り代替された分析フレーム(3)と分析フレーム(2)
とのスペクトル距離を示す。
In the equation (5), d 1,2 is (2) of the analysis frame (1) and the analysis frame (2) substituted by the optimum standard pattern.
Spectral distance by the formula, d 3,2 is the analysis frame (3) and analysis frame (2) replaced by the optimal standard pattern
Shows the spectral distance between and.

(3)式の意味する所は第2代表分析フレームとして分
析フレーム(3)が選択される場合には第1代表分析フ
レームとして分析フレーム(1)のほかに(2)も可能
性がありこれらのいずれかが選ばれる2通りの場合の総
歪の小さい方を選定するということである。
The expression (3) means that when the analysis frame (3) is selected as the second representative analysis frame, the analysis frame (1) may be used as the first representative analysis frame. This means that the one with the smaller total distortion in the two cases in which one of the above is selected is selected.

さて、次に第2代表分析フレームとして分析フレーム
(4)が選ばれる場合の最小の総歪D4 (2)について考え
てみる。
Now, let us consider the minimum total distortion D 4 (2) when the analysis frame (4) is selected as the second representative analysis frame.

この場合は第1代表分析フレームとして存在しうる可能
性があるのは分析フレーム(1)のほかに(2)および
(3)があり総歪D4 (2)は次の(6)式で示される。
In this case, there is a possibility that the first representative analysis frame may exist, in addition to the analysis frame (1), there are (2) and (3), and the total distortion D 4 (2) is expressed by the following equation (6). Shown.

(6)式においてD1,4,D2,4ならびにD3,4はそれぞれ
時間歪を表わし、たとえばD1,4は次の(6)式で示さ
れる。またD4 (q)は分析フレーム(4)の量子化歪を示
す。
In the equation (6), D 1,4 , D 2,4 and D 3,4 each represent time distortion, and, for example, D 1,4 is represented by the following equation (6). D 4 ( q ) represents the quantization distortion of the analysis frame (4).

(7)式においてd1,2およびd1,3は最適な標準パタン
により代替された分析フレーム(1)と同じく最適な標
準パタンに代替された分析フレーム(4)との間に介在
する分析フレームと(2)と(3)とがいずれも分析フ
レーム(1)によって代表されるときに発生する時間
歪,またd4,2とd4,3とは分析フレーム(2)と(3)
とがいずれも分析フレーム(4)によって代表されると
きの時間歪,さらにd1,2は分析フレーム(2)は分析
フレーム(1)で,またd4,3は分析フレーム(3)が
分析フレーム(4)で代表されるときのそれぞれの時間
歪を示す。D2,4ならびにD3,4についても(7)式と同
様な方針で定義される。前述した(6)式の意味するこ
とは,第2代表分析フレームとして(4)を選択した場
合,これによって最小の総歪を与える第1代表分析フレ
ームならびにこれら第1および第2代表分析フレームに
よって代表される分析フレームの組合せが決定されると
いうことである。このようにして第1から第5までの各
代表分析フレーム候補を対象として次次に同様な手順で
(3)式や(6)式に示すような総歪を第5代表分析フ
レーム候補まで求めていく。このような総歪は入力音声
信号のスペクトル包絡パラメータとの近似処理差いわゆ
る残留歪を最小とする近似矩形関数を設定する尺度とな
るものである。
In the equation (7), d 1,2 and d 1,3 are analyzes interposed between the analysis frame (1) replaced by the optimum standard pattern and the analysis frame (4) replaced by the optimum standard pattern. The time distortion that occurs when each of frames (2) and (3) is represented by analysis frame (1), and d 4,2 and d 4,3 are analysis frames (2) and (3)
Time distortion when and are both represented by analysis frame (4), d 1,2 is analysis frame (2) is analysis frame (1), and d 4,3 is analysis frame (3) is analysis The respective time distortions represented by the frame (4) are shown. D 2,4 and D 3,4 are also defined by the same policy as that of the equation (7). The expression (6) above means that when (4) is selected as the second representative analysis frame, the first representative analysis frame and the first and second representative analysis frames that give the minimum total distortion. That is, the combination of the representative analysis frames is determined. In this way, for each of the first to fifth representative analysis frame candidates, the total distortion as shown in equations (3) and (6) is obtained up to the fifth representative analysis frame candidate in the same procedure as described below. To go. Such total distortion is a measure for setting an approximate rectangular function that minimizes the residual distortion, which is the difference between the approximate processing and the spectral envelope parameter of the input speech signal.

こうしてたとえば分析フレーム(5)を第2代表分析フ
レームとする場合は第1代表分析フレームとしては先行
の分析フレーム(1)〜(4)が,また分析フレーム
(6)が第2代表分析フレームとなる場合は先行の分析
フレーム(1)〜(5)がそれぞれ第1代表分析フレー
ムとなりうる設定で総歪を計算しつつ第5代表分析フレ
ーム候補に及び,この第5代表分析フレーム候補の分析
フレーム(14)〜(20)にはさらに次の演算を実施す
る。
Thus, for example, when the analysis frame (5) is the second representative analysis frame, the preceding analysis frames (1) to (4) are the first representative analysis frames, and the analysis frame (6) is the second representative analysis frame. In such a case, the preceding analysis frames (1) to (5) reach the fifth representative analysis frame candidate while calculating the total distortion with the setting that can be the first representative analysis frame, and the analysis frame of the fifth representative analysis frame candidate. The following calculation is further performed for (14) to (20).

(8)式によって示されるDlは第5代表分析フレームと
して分析フレーム(14)から(20)までのいずれかが選
択されたとき,これによって代表される他の分析フレー
ムによる総歪の影響を最小とするものを選択することを
示し,▲D(5) 14▼〜▲D(5) 20▼はそれぞれ第5代表分
析フレームとして分析フレーム(14)〜(20)のいずれ
かが選択されたときそれら分析フレームに発生する総歪
であり,また は最適な標準パタンにより代替された分析フレーム14と
分析フレーム15から20までのそれぞれとの時間歪の総和
を, は最適な標準パタンに代替された分析フレーム15と分析
フレーム16から20までのそれぞれとの時間歪の総和を,
またd19,20は最適な標準パタンに代替された分析フレ
ーム(19)と分析フレーム(20)間の時間歪を示す。
When any of analysis frames (14) to (20) is selected as the fifth representative analysis frame, Dl represented by equation (8) minimizes the influence of the total distortion due to other analysis frames represented by this. Indicates that one of the analysis frames (14) to (20) is selected as the fifth representative analysis frame, and ▲ D (5) 14 ▼ to ▲ D (5) 20 ▼ is selected. It is the total distortion that occurs in those analysis frames, and Is the sum of the time distortions of the analysis frame 14 and the analysis frames 15 to 20 substituted by the optimum standard pattern, Is the sum of the time distortions of the analysis frame 15 substituted by the optimum standard pattern and the analysis frames 16 to 20, respectively.
Further, d 19,20 represents the time distortion between the analysis frame (19) replaced by the optimum standard pattern and the analysis frame (20).

(8)式によって決定されるDlが区分ごとに決定したと
き,直ちに第1から第5代表分析フレーム候補の組合せ
のうち総歪の最小なDPパスを決定する5個の代表分析フ
レームとこれら代表分析フレームによって代表される分
析フレームが決定され,こうして区分的最適矩形近似に
よる可変長フレーム化が容易に実施される。
When Dl determined by Eq. (8) is determined for each section, immediately, five representative analysis frames that determine the DP path with the minimum total distortion among the combinations of the first to fifth representative analysis frame candidates and these representative frames are selected. An analysis frame represented by the analysis frame is determined, and thus variable length framing by piecewise optimal rectangle approximation is easily implemented.

こうして,パタン照合における量子化歪とDPを用いたフ
レーム選択による時間歪とをスカラー加算した総歪を評
価値とするフレーム選択を行なって選択された5個の代
表分析フレームと,これら代表分析フレームによって代
表される分析フレーム数すなわちリピートビットとが決
定され,代表分析フレームは対応するスペクトル包絡標
準パタンを指定するラベル情報で置換したうえリピート
ビット情報とともにマルチプレクサ16に供給される。
In this way, five representative analysis frames selected by performing frame selection with the total distortion obtained by scalar-adding the quantization distortion in the pattern matching and the time distortion caused by the frame selection using DP as the evaluation value, and these representative analysis frames The number of analysis frames represented by (i.e., repeat bits) is determined, and the representative analysis frame is supplied to the multiplexer 16 together with the repeat bit information after replacing the corresponding spectrum envelope standard pattern with the label information that specifies it.

パタン照合歪としての量子化歪は通常DPパスの設定を介
して行なわれるフレーム選択によるフレーム代替歪に比
し著しく大きく,このようにしてパタン照合歪の大きく
なるフレーム排除しつつ設定する可変長フレーム形式で
パタンマッチング情報を出力することができる。
The quantization distortion as the pattern matching distortion is significantly larger than the frame substitute distortion due to the frame selection normally performed through the setting of the DP path. In this way, the variable length frame is set while excluding the frame with the large pattern matching distortion. The pattern matching information can be output in a format.

次にフレーム選択器15の具体的な構成および動作を図を
参照して説明する。第3図はフレーム選択器15を詳細に
説明するためのブロック図である。
Next, a specific configuration and operation of the frame selector 15 will be described with reference to the drawings. FIG. 3 is a block diagram for explaining the frame selector 15 in detail.

第3図に示すフレーム選択器15はLSPパラメータメモリ5
1,標準パラメータメモリ52,量子化歪メモリ53,ラベルメ
モリ54,DP制御器55,時間歪算出器56,時間歪一時メモリ5
7,フレーム境界決定器58,ノード歪メモリ59,パスメモリ
60,ノード歪算器61,ノード歪一時メモリ62,パス決定器6
3,フレーム決定器64,総歪算出器65,およびタイマ66を備
えて構成される。
The frame selector 15 shown in FIG. 3 is the LSP parameter memory 5
1, standard parameter memory 52, quantization distortion memory 53, label memory 54, DP controller 55, temporal distortion calculator 56, temporal distortion temporary memory 5
7, frame boundary determiner 58, node distortion memory 59, path memory
60, node distortion calculator 61, node distortion temporary memory 62, path determiner 6
3, a frame determiner 64, a total distortion calculator 65, and a timer 66.

タイマ66はフレーム周期信号および区分信号を発生する
ものであり、10msec毎にフレーム周期信号を出力ライン
661を介して、又、200msec毎に区分信号を出力ライン60
2を介してDP制御器55へ出力する。
The timer 66 generates a frame period signal and a division signal, and outputs the frame period signal every 10 msec.
Output line signal via 661 and every 200 msec
2 to the DP controller 55.

DP制御器55はマイクロプロセッサであり内蔵のプログラ
ムにより動作し、フレーム選択器全体を制御する。DP制
御器55は区分信号毎にイニシャライズされる。このイニ
シャライズによりLSPパラメータメモリ51,標準パタンメ
モリ52,量子化歪メモリ53,ラベルメモリ54,ノード歪メ
モリ59,パスメモリ60はクリアされる。
The DP controller 55 is a microprocessor and operates by a built-in program to control the entire frame selector. The DP controller 55 is initialized for each division signal. By this initialization, the LSP parameter memory 51, the standard pattern memory 52, the quantization distortion memory 53, the label memory 54, the node distortion memory 59, and the path memory 60 are cleared.

さて、パラメータ分析器11で分析された10次LSPパラメ
ータはフレーム周期毎にLSPパラメータメモリ51に供給
される。LSPパラメータメモリ51は256wのRAMである。
尚、LSPパラメータメモリ51の容量は10次LSPを1区分長
分、即ち20フレーム分蓄積可能な容量(最低10×20=20
0w)を考慮して決められている。LSPパラメータメモリ5
1は区分信号を基準とするフレームの番号に対応したア
ドレス信号をDP制御器55よりアドレスライン551を介し
て供給され、所望のアドレスにLSPパラメータを記憶す
る。
Now, the 10th-order LSP parameter analyzed by the parameter analyzer 11 is supplied to the LSP parameter memory 51 every frame period. The LSP parameter memory 51 is a 256w RAM.
The LSP parameter memory 51 has a capacity for storing 10th-order LSP for one segment length, that is, 20 frames (minimum 10 × 20 = 20).
0w) is taken into consideration. LSP parameter memory 5
An address signal 1 is supplied from the DP controller 55 via the address line 551 with an address signal corresponding to the frame number based on the division signal, and stores the LSP parameter at a desired address.

標準パタンパラメータメモリ52,量子化歪メモリ53,ラベ
ルメモリ54は各々256,32w,32wのRAMであり、パタン照合
器13より供給される標準パタンパラメータ▲P(SR) K
(k=1,…,10)、量子化歪▲D(q) Q▼、標準パタンラ
ベルRの各情報を各々、DP制御器55より、アドレスライ
ン552,同553,同554を介して供給されるアドレス信号に
より所望のアドレスに記憶する。
The standard pattern parameter memory 52, the quantization distortion memory 53, and the label memory 54 are RAMs of 256, 32w, and 32w, respectively, and standard pattern parameters ▲ P (SR) K ▼ supplied from the pattern collator 13.
(K = 1, ..., 10), quantization distortion ▲ D (q) Q ▼, and standard pattern label R information are supplied from the DP controller 55 via address lines 552, 553, and 554, respectively. The address signal is stored at a desired address.

いま,区分信号を基準として7ケ目のフレーム周期信号
がタイマ66よりDP制御器55へ供給されたものとする。DP
制御器55は以下の手順で第一代表分析フレーム候補に対
応する歪を算出しノード歪メモリ59へ記憶させる。説明
を容易にするためにノード歪メモリ59をサイズ(5,20)
の二次元エリアとする。分析フレーム(1)の量子化歪
▲D(q) 1▼即ち、(4)式から明らかなようにD1 (1)
量子化歪メモリ53より読出され、出力ライン531,DP制御
器55,入出力ライン555を介してノード歪メモリ59の番地
(1,1)に記憶される。尚、番地の指定はアドレスライ
ン556を介して供給されるアドレス信号により行なわれ
る。次に分析フレーム(2)の量子化歪D2 (q)が量子化
歪メモリ53より読出され、DP制御器55を経由し、量子化
歪入力ライン557を介してノード歪算出器61へ供給され
る。また分析フレーム(2)の標準パタンパラメータと
分析フレーム(1)のLSPパラメータは、各々、標準パ
タンメモリ52−出力ライン521−DP制御器55−標準パタ
ンパラメータ入力ライン562,LSPパラメータメモリ51−
出力ライン511−DP制御器55−LSPパラメータ入力ライン
561,を介して時間歪算出器56へ供給される。時間歪算出
器56は分析フレーム(1)のLSPパラメータを分析フレ
ーム(2)の標準パタンパラメータで代替した場合に発
生する時間歪d2,1を前記(2)式を用いて算出する。
次に時間歪算出器56は時間歪d2,1を出力ライン563,DP
制御器55,時間歪入力ライン558を介してノード歪算出器
61へ供給する。ノード歪算出器61は前記量子化歪D2 (q)
と時間歪d2,1との和D2 (1)を前記(4)式の第2行によ
り算出し、出力ライン611,DP制御器55を介して、このD2
(1)をノード歪メモリ59へ供給する。ノード歪メモリ59
はこのD2 (1)を番地(1,2)に記憶する。
Now, it is assumed that the seventh frame cycle signal is supplied from the timer 66 to the DP controller 55 based on the division signal. DP
The controller 55 calculates the distortion corresponding to the first representative analysis frame candidate by the following procedure and stores it in the node distortion memory 59. Size node distortion memory 59 for ease of explanation (5,20)
2D area. Quantization distortion ▲ D (q) 1 ▼ of analysis frame (1), that is, D 1 (1) is read from the quantization distortion memory 53 as is clear from the equation (4), and output line 531 and DP controller 55 Then, it is stored in the address (1, 1) of the node distortion memory 59 via the input / output line 555. The address is specified by an address signal supplied via the address line 556. Next, the quantization distortion D 2 ( q ) of the analysis frame (2) is read from the quantization distortion memory 53 and supplied to the node distortion calculator 61 via the DP controller 55 and the quantization distortion input line 557. To be done. The standard pattern parameter of the analysis frame (2) and the LSP parameter of the analysis frame (1) are the standard pattern memory 52-the output line 521-the DP controller 55-the standard pattern parameter input line 562 and the LSP parameter memory 51-, respectively.
Output line 511-DP controller 55-LSP parameter input line
It is supplied to the time distortion calculator 56 via 561. The time distortion calculator 56 calculates the time distortion d 2,1 generated when the LSP parameter of the analysis frame (1) is replaced with the standard pattern parameter of the analysis frame (2) by using the equation (2).
Next, the time distortion calculator 56 outputs the time distortion d 2,1 to the output line 563, DP
Node distortion calculator via controller 55 and time distortion input line 558
Supply to 61. The node distortion calculator 61 uses the quantization distortion D 2 ( q )
And the time distortion d 2,1 sum D 2 (1) is calculated by the second line of the equation (4), and this D 2 is output via the output line 611 and the DP controller 55.
(1) is supplied to the node distortion memory 59. Node distortion memory 59
Stores this D 2 (1) at address (1,2).

同様に量子化歪D3 (q)が量子化歪メモリ53よりノード歪
算出器61へ供給される。次に分析フレーム(3)の標準
パタンパラメータが標準パタンパラメータメモリ52より
時間歪算出器に供給され、分析フレーム(1)のLSPパ
ラメータがLSPパラメータメモリ51より時間歪算出器に
供給される。時間歪算出器56はこれらのパラメータより
前記(2)式によりd3,1を算出しノード歪算出器61へ
出力する。ノード歪算出器61は量子化歪D3 (q)と時間歪
3,1を加算しD3 (q)+d3,1を求める。次に分析フレー
ム(3)の標準パタンパラメータと分析フレーム(2)
のLSPパラメータとの時間歪d3,2が時間歪算出器56で算
出され、前記加算結果に累算される。この累算結果は前
記(4)式に示すD3 (1)である。D3 (1)はD2 (1)と同様に
ノード歪メモリ59の番地(1,3)に記憶される。
Similarly, the quantization distortion D 3 ( q ) is supplied from the quantization distortion memory 53 to the node distortion calculator 61. Next, the standard pattern parameter of the analysis frame (3) is supplied from the standard pattern parameter memory 52 to the time distortion calculator, and the LSP parameter of the analysis frame (1) is supplied from the LSP parameter memory 51 to the time distortion calculator. The time distortion calculator 56 calculates d 3,1 from these parameters by the equation (2) and outputs it to the node distortion calculator 61. Node distortion calculator 61 obtains the sum of the quantization distortion D 3 (q) and the time distortion d 3,1 D 3 (q) + d 3,1. Next, the standard pattern parameters of analysis frame (3) and analysis frame (2)
The time distortion d3,2 with the LSP parameter is calculated by the time distortion calculator 56 and accumulated in the addition result. The result of this accumulation is D 3 (1) shown in the equation (4). D 3 (1) is stored in the address (1,3) of the node distortion memory 59 similarly to D 2 (1) .

以下同様にD4 (1)〜D7 (1)がノード歪算出器61で累算され
ノード歪メモリ59の番地(1,4)−(1,7)に記憶され
る。
Similarly, D 4 (1) to D 7 (1) are accumulated in the node distortion calculator 61 and stored in the address (1,4)-(1,7) of the node distortion memory 59.

いま、区分信号を基準として14ケ目のフレーム同期信号
がタイマ66よりDP制御器55へ供給されたものとする。DP
制御器55は以下の手順で第2代表分析フレーム候補に対
応する歪と、DPパス、フレーム境界を算出し、歪をノー
ド歪メモリ59にDPパス、フレーム境界データをパスメモ
リ60に記憶させる。
Now, it is assumed that the 14th frame synchronization signal is supplied from the timer 66 to the DP controller 55 with reference to the division signal. DP
The controller 55 calculates the distortion corresponding to the second representative analysis frame candidate, the DP path, and the frame boundary by the following procedure, and stores the distortion in the node distortion memory 59 and the frame boundary data in the path memory 60.

分析フレーム(2)の量子化歪D2 (q)が量子化歪メモリ5
3よりノード歪算出器61に供給される。第2代表分析フ
レームが(2)の場合、第1代表分析フレームは(1)
以外に存在しない。従ってDPパスは1−2となり、代表
分析フレーム間に被代替フレームは存在しないためフレ
ーム境界は1−2間であり、又、総歪D2 (2)はD2 (2)=D1
(1)+D2 (q)により簡単に算出される。本実施例ではDPパ
ス1−2を先行フレーム1で表現し、フレーム境界1−
2を先行フレームが代表する区間1で表現している。説
明を容易にするためにパスメモリ60をサイズ(5,20,2)
の3次元エリアとする。
The quantization distortion D 2 ( q ) of the analysis frame (2) is the quantization distortion memory 5
It is supplied from 3 to the node distortion calculator 61. When the second representative analysis frame is (2), the first representative analysis frame is (1)
Except for Therefore, the DP path is 1-2, the frame boundary is between 1-2 because there is no substitute frame between the representative analysis frames, and the total distortion D 2 (2) is D 2 (2) = D 1
(1) Calculated easily with + D 2 ( q ) . In this embodiment, the DP path 1-2 is represented by the preceding frame 1, and the frame boundary 1-
2 is represented by the section 1 represented by the preceding frame. Size the path memory 60 for ease of explanation (5,20,2)
It will be a three-dimensional area.

さて、第1代表分析フレームを(1)とした場合の総歪
D1 (1)がノード歪メモリ59より入出力ライン555,DP制御
器55,量子化歪入力ライン557を介してノード歪算出器61
へ供給される。ノード歪算出器61は量子化歪D2 (q)にD1
(1)を加算する。加算結果D2 (2)はノード歪メモリ59の番
地(2,2)に記憶される。DP制御器55は入出力ライン601
を介してパスメモリ60の番地(2,2,1)にデータ“1"を
番地(2,2,2)にデータ“1"を書込む。なお番地の指定
はアドレスライン602を介して行なわれる。
Now, the total distortion when the first representative analysis frame is (1)
D 1 (1) is the node distortion calculator 59 from the node distortion memory 59 via the input / output line 555, the DP controller 55, and the quantization distortion input line 557.
Is supplied to. The node distortion calculator 61 converts the quantization distortion D 2 ( q ) into D 1
Add (1) . The addition result D 2 (2) is stored in the address (2, 2) of the node distortion memory 59. DP controller 55 is input / output line 601
The data "1" is written in the address (2,2,1) of the path memory 60 through the and the data "1" is written in the address (2,2,2). The address is designated through the address line 602.

次に第2代表分析フレームをフレーム(3)とした場合
の総歪D3 (2)が以下のように算出される。
Next, the total distortion D 3 (2) when the second representative analysis frame is frame (3) is calculated as follows.

前述の要領で時間歪d3,2,d1,2が時間歪算出器56で算出
され出力ライン564を介して次々と時間歪一時メモリ57
へ出力される。時間歪一時メモリ57はサイズ(20,2)の
2次元エリアである。d3,2,d1,2は各々時間歪一時メモ
リ57の番地(2,1),(2,2)に記憶される。尚番地指定
はアドレスライン571を介して実施される。フレーム境
界決定器58は出力ライン572を介して供給される前述の
3,2とd1,2との大小を比較し、小さい時間歪を選択す
る。この歪は前記(3)式に示されるD1,3であり、d
3,2<d1,2の場合、D1,3=d3,2である。算出された歪
1,3は歪出力ライン581を介してノード歪算出器61へ,
フレーム境界候補、d3,2<d1,2の場合にはフレーム
(2)が(3)に代替されるため“1",データは境界デ
ータ出力ライン582を介してバスメモリ60へ供給され
る。バスメモリ60はこのデータを番地(2,3,2)に書込
む。次にノード歪メモリ59よりD1 (1)が、量子化歪メモ
リ52よりD3 (q)が各々、ノード歪算出器61に供給され、
時間歪D1,3に加算される。この加算結果,D1 (1)+D1,3
+D3 (q)は出力ライン612を介してノード歪一時メモリ62
へ供給される。ノード歪一時メモリは20wのRAMでありア
ドレスライン621を介して番地指定が行なわれる。加算
結果D1 (1)+D1,3+D3 (q)は(1)番地に記憶される。
The time distortions d 3,2 , d 1,2 are calculated by the time distortion calculator 56 in the above-described manner, and the time distortion temporary memory 57 is successively output via the output line 564.
Is output to. The temporal distortion temporary memory 57 is a two-dimensional area of size (20,2). d 3 , 2 , d 1 and 2 are stored in the addresses (2, 1) and (2, 2) of the time distortion temporary memory 57, respectively. The address designation is performed via the address line 571. The frame boundary determiner 58 compares the magnitude of the above-mentioned d 3,2 and d 1,2 supplied via the output line 572, and selects a small time distortion. This distortion is D 1,3 shown in the equation (3), and d
If 3,2 <d 1,2 , then D 1,3 = d 3,2 . The calculated distortion D 1,3 is sent to the node distortion calculator 61 via the distortion output line 581,
If the frame boundary candidate, d 3,2 <d 1,2 , the frame (2) is replaced by (3), so “1”, data is supplied to the bus memory 60 via the boundary data output line 582. It The bus memory 60 writes this data at the address (2,3,2). Next, D 1 (1) from the node distortion memory 59 and D 3 ( q ) from the quantization distortion memory 52 are respectively supplied to the node distortion calculator 61,
It is added to the time distortion D 1,3 . The result of this addition, D 1 (1) + D 1,3
+ D 3 ( q ) is sent to node distortion temporary memory 62 via output line 612.
Is supplied to. The node distortion temporary memory is a 20w RAM, and an address is designated through an address line 621. The addition result D 1 (1) + D 1,3 + D 3 ( q ) is stored in the address (1).

次にノード歪メモリ59よりD2 (1)が、量子化歪メモリ53
よりD3 (q)が各々、ノード歪算出器61に供給され、D2 (1)
+D3 (q)が算出される。算出されたD2 (1)+D3 (q)はノー
ド歪一時メモリ62に供給され、このメモリの(2)番地
に書込まれる。
Next, D 2 (1) from the node distortion memory 59
D 3 ( q ) is supplied to the node distortion calculator 61, respectively, and D 2 (1)
+ D 3 ( q ) is calculated. The calculated D 2 (1) + D 3 ( q ) is supplied to the node distortion temporary memory 62 and written in the address (2) of this memory.

ノード歪一時メモリ62に一時的に記憶された2つの歪量
は出力ライン622を介してバス決定器62へ供給される。
バス決定器63はこの2つの歪量を比較し、小さいものを
選択する。選択された歪は前記(3)式に示すD3 (2)
ある。バス決定器63はこのD3 (2)を歪出力ライン631,DP
制御器55を介してノード歪メモリ59へ供給する。ノード
歪メモリ59はD3 (2)を番地(2,3)に格納する。バス決定
器63は更に、第2代表フレーム候補であるフレーム
(3)に対し最小歪を与えるパスのデータ“1"又は“2"
をパス出力ライン632を介してDP制御器55へ出力する。D
P制御器55はパスのデータをパスメモリ60の番地(2,3,
1)に書込む。また、もし、パスのデータが“2"の場合
には、パスメモリ60の番地(2,3,2)に書込まれている
境界データを修正するために、データ“2"をパスメモリ
60へ送出する。
The two distortion amounts temporarily stored in the node distortion temporary memory 62 are supplied to the bus determiner 62 via the output line 622.
The bus determiner 63 compares the two distortion amounts and selects the smaller one. The selected distortion is D 3 (2) shown in the equation (3). The bus determiner 63 outputs this D 3 (2) to the distortion output line 631, DP
It is supplied to the node distortion memory 59 via the controller 55. The node distortion memory 59 stores D 3 (2) at address (2,3). The bus determiner 63 further determines the path data “1” or “2” that gives the minimum distortion to the frame (3) that is the second representative frame candidate.
Is output to the DP controller 55 via the path output line 632. D
The P controller 55 transfers the path data to the address (2,3,
Write in 1). If the pass data is "2", the data "2" is changed to the pass memory to correct the boundary data written in the address (2,3,2) of the pass memory 60.
Send to 60.

同様に第2代表分析フレームをフレーム(4)とした場
合の総歪D4 (2)が以下のように算出される。まず対応す
る第1代表分析フレームをフレーム(1)と仮定したと
きの総歪が算出されノード歪一時メモリ62の番地(1)
に書込まれる。又、パスデータ“1"とフレーム境界デー
タ“1",“2"、又は“3"とはパスメモリ60の番地(2,4,
1)、(2,4,2)に書込まれる。次に第2代表分析フレー
ム候補(4)に対応する第1代表分析フレームをフレー
ム(2)と仮定したときの総歪が算出されノード歪一時
メモリ62の番地(2)に書込まれる。次に、パス決定器
63はノード歪一時メモリ62に一時的に記憶されている2
つの歪を比較し、小さい歪を選択する。もし、フレーム
(2)に対応する歪が小さい場合には、パスメモリ60の
番地(2,4,1),(2,4,2)は書替えられる。次にフレー
ム(3)に対しても同様の処理を実施する。その結果、
パス決定器63は前記(6)式に示すD4 (2)を求める事に
なる。このD4 (2)はノード歪メモリ59の番地(2,4)に格
納される。
Similarly, the total distortion D 4 (2) when the second representative analysis frame is frame (4) is calculated as follows. First, the total distortion is calculated assuming that the corresponding first representative analysis frame is the frame (1), and the address (1) of the node distortion temporary memory 62 is calculated.
Written in. The path data “1” and the frame boundary data “1”, “2”, or “3” are the addresses (2, 4,
1), written in (2,4,2). Next, the total distortion when the first representative analysis frame corresponding to the second representative analysis frame candidate (4) is assumed to be the frame (2) is calculated and written in the address (2) of the node distortion temporary memory 62. Then the path determiner
63 is 2 temporarily stored in the node distortion temporary memory 62
Compare the three distortions and select the smaller distortion. If the distortion corresponding to the frame (2) is small, the addresses (2,4,1) and (2,4,2) of the path memory 60 are rewritten. Next, the same processing is performed on the frame (3). as a result,
The path determiner 63 determines D 4 (2) shown in the equation (6). This D 4 (2) is stored in the address (2, 4) of the node distortion memory 59.

同様の手順でD5 (2)〜D14 (2)が次々と求められ、ノード
歪メモリ59の番地(2,5)〜(2,14)に格納される。
又、ノード歪算出の過程で決定されたパス及びフレーム
境界データは各々、パスメモリ60の番地{(2,5,1),
(2,5,2)}〜{(2,14,1),(2,14,2)}に格納され
る。
D 5 (2) to D 14 (2) are obtained one after another by the same procedure and are stored in the addresses (2,5) to (2,14) of the node distortion memory 59.
Further, the path and frame boundary data determined in the process of calculating the node distortion are respectively the addresses {(2,5,1),
It is stored in (2,5,2)} to {(2,14,1), (2,14,2)}.

こうして、区分信号を基準として18ケ目のフレーム同期
信号がタイマ66よりDP制御器55へ供給された後に第3代
表フレーム候補に対応する歪と、DPパス、フレーム境界
が算出されノード歪メモリ59およびパスメモリ60に格納
される。同様に19ケ目のフレーム同期信号により第4代
表フレーム候補の、20ケ目のフレーム同期信号により第
5代表フレーム候補の、各々対応する歪と、DPパス、フ
レーム境界が算出され、ノード歪メモリ59およびパスメ
モリ60に格納される。その結果、ノード歪メモリ59の番
地(5,14)〜(5,20)に第5代表フレーム候補として各
々、分析フレーム(14)〜(20)が選択された場合のフ
レーム代替の結果生じる時間歪と、代表フレームの量子
化歪との総和が記憶される。
In this way, the distortion corresponding to the third representative frame candidate, the DP path, and the frame boundary are calculated after the 18th frame synchronization signal is supplied from the timer 66 to the DP controller 55 on the basis of the division signal, and the node distortion memory 59 And stored in the path memory 60. Similarly, the corresponding distortion, DP path, and frame boundary of the fourth representative frame candidate of the 19th frame synchronization signal and the fifth representative frame candidate of the 20th frame synchronization signal are calculated, and the node distortion memory is calculated. 59 and the path memory 60. As a result, the time generated as a result of frame substitution when the analysis frames (14) to (20) are selected as the fifth representative frame candidates at the addresses (5,14) to (5,20) of the node distortion memory 59, respectively. The total sum of the distortion and the quantization distortion of the representative frame is stored.

しかしながら、例えば第5代表フレーム候補として分析
フレーム(14)を選択した場合、分析フレーム(15)〜
(20)がフレーム(14)の標準パタンパラメータにより
代替される結果生じる時間歪がD14 (5)には含まれていな
い。そこで前記(8)式に示す処理が必要となる。本実
施例ではこれを以下のように実施している。
However, for example, when the analysis frame (14) is selected as the fifth representative frame candidate, the analysis frames (15) to
The time distortion resulting from the substitution of (20) by the standard pattern parameters of frame (14) is not included in D 14 (5) . Therefore, the processing shown in the equation (8) is required. In this embodiment, this is carried out as follows.

まず、 が次のように算出される。ノード歪メモリ59に記憶され
ているD14 (5)がノード歪入力ライン651を介して総歪算
出器65へ入力される。次に標準パタンパラメータメモリ
52よりフレーム(14)の標準パタンパラメータが時間歪
算出器56へ供給される。次にLSPパラメータメモリ51よ
りフレーム(15)のLSPパラメータが時間歪算出器56へ
供給される。時間歪算出器56は時間歪d14,15を算出す
る。算出されたd14,15は時間歪入力ライン652を介して
総歪算出器65へ入力される。同様の手順で次々とd
14,16,d14,17…d14,20が総歪算出器65へ入力される。
総歪算出器65は、これらの歪の総和即ち を算出し、結果を出力ライン653を介してフレーム決定
器64へ出力する。フレーム決定器65は20wのRAMを内蔵し
ており、このデータを(14)番地に書込む。
First, Is calculated as follows. D 14 (5) stored in the node distortion memory 59 is input to the total distortion calculator 65 via the node distortion input line 651. Next, the standard pattern parameter memory
The standard pattern parameter of the frame (14) is supplied from 52 to the time distortion calculator 56. Next, the LSP parameter of the frame (15) is supplied from the LSP parameter memory 51 to the time distortion calculator 56. The time distortion calculator 56 calculates the time distortion d 14,15 . The calculated d 14,15 are input to the total distortion calculator 65 via the time distortion input line 652. Follow the same procedure one after another d
14,16 , d14,17 ... d14,20 are input to the total distortion calculator 65.
The total distortion calculator 65 calculates the sum of these distortions, that is, Is calculated and the result is output to the frame determiner 64 via the output line 653. The frame determiner 65 has a 20w RAM built-in and writes this data at address (14).

同様に がフレーム決定器64内のRAMの(15)番地に書込まれ
る。以下、次々とD19 (5)+d19,20までがRAMの(19)番
地までに書込まれる。最後にD20 (5)がノード歪メモリ59
から総歪算出器65を介して直接フレーム決定器64へ供給
され、RAMの(20)番地に書込まれる。フレーム決定器6
4は前記(8)式に基づいてDlを決定し、対応するフレ
ーム番号を出力ライン641を介してDP制御器55へ出力す
る。DP制御器は、このフレーム番号とパスメモリ60に記
憶されているパスデータおよびフレーム境界データよ
り、20フレーム全体を代表する、代表フレーム5ケと、
この代表フレーム5ケが代表する区間を決定し、区間長
に相等するフレーム数をリピートビットの形式で出力ラ
イン151へ出力する。更にこの代表フレームに対応する
標準パタンの番号をラベルメモリ54へ出力する。ラベル
メモリ54は出力ライン541を介してラベルをDP制御器55
へ出力する。DP制御器55はこれを出力ライン152へ出力
する。
As well Is written in the RAM (15) in the frame determiner 64. Thereafter, up to D 19 (5) + d 19,20 are written up to the address (19) of the RAM one after another. Finally, D 20 (5) is the node distortion memory 59
Is directly supplied to the frame determiner 64 via the total distortion calculator 65, and written in the address (20) of the RAM. Frame determiner 6
4 determines Dl based on the equation (8) and outputs the corresponding frame number to the DP controller 55 via the output line 641. Based on the frame number and the path data and the frame boundary data stored in the path memory 60, the DP controller displays five representative frames, which represent all 20 frames,
The section represented by the five representative frames is determined, and the number of frames equal to the section length is output to the output line 151 in the form of repeat bits. Further, the standard pattern number corresponding to this representative frame is output to the label memory 54. The label memory 54 outputs the label to the DP controller 55 via the output line 541.
Output to. DP controller 55 outputs this on output line 152.

さて、音源分析器12はパラメータ分析器11から分析フレ
ームごとの量子化音声信号を入力し、公知の手法により
音源の強さ,有声/無声/無音データならびにピッチ周
期データを抽出しこれら音源情報をマルチプレクサ16に
供給する。
The sound source analyzer 12 inputs the quantized speech signal for each analysis frame from the parameter analyzer 11, extracts sound source strength, voiced / unvoiced / unvoiced data, and pitch period data by a known method, and outputs these sound source information. Supply to the multiplexer 16.

マルチプレクサ16は諸入力を所定の形式で符号化,多重
化して伝送路101を介して合成側2に送出する。
The multiplexer 16 encodes and multiplexes various inputs in a predetermined format and sends them to the synthesizing side 2 via the transmission line 101.

合成側2ではこうして送出されてくる多重化信号の多重
化を分離したのち復号化を行ない,ラベル情報とリピー
トビット情報とはパタン読出し器22に,また音源情報は
音源発生器23にそれぞれ供給する。
The synthesizing side 2 demultiplexes and multiplexes the multiplexed signals thus sent out, and supplies the label information and the repeat bit information to the pattern reader 22 and the sound source information to the sound source generator 23, respectively. .

パタン読出し器22は標準パタンファイル24からラベル情
報に対応するスペクトル包絡標準パタンを読出し、これ
をリピートビットで指定される回数繰返しつつ音声合成
フィルタに送出する。
The pattern reader 22 reads the spectrum envelope standard pattern corresponding to the label information from the standard pattern file 24, and transmits it to the speech synthesis filter while repeating the number of times specified by the repeat bits.

標準パタンファイル24は本実施例においてはパタン照合
器13と同一内容のものをファイルしておりこうしてスペ
クトル包絡パラメータが分析フレーム単位で音声合成フ
ィルタ25に供給される。
In the present embodiment, the standard pattern file 24 has the same contents as the pattern collator 13, and thus the spectral envelope parameters are supplied to the speech synthesis filter 25 in units of analysis frames.

音源発生器23は音源情報を入力し,有声/無声/の有音
に対してはピッチ周期に対応するパルス列で,また無音
のときは白色雑音でモデル化した音源を発生しこれを音
源の強さに対応して増幅しつつ音声合成フィルタ25に供
給する。
The sound source generator 23 inputs sound source information and generates a sound source modeled by a pulse train corresponding to the pitch period for voiced / unvoiced / voiced voices, and white noise when there is no voice, and outputs this as a sound source strength. It is supplied to the voice synthesis filter 25 while being amplified correspondingly.

全極型のデジタルフィルタとして構成される音声合成フ
ィルタ25はパタン読出し器22から受けるスペクトル包絡
パラメータをフィルタ係数とし,音源発生器23から受け
る音源によって駆動されディジタル量の音声を合成し,D
/A(Digital to Anlog)コンバータによってアナログ化
したうえLPFによって不要な高域周波数成分を除去した
うえ出力音声信号として出力ライン2001に送出する。
The speech synthesis filter 25, which is configured as an all-pole digital filter, uses the spectral envelope parameter received from the pattern reader 22 as a filter coefficient and synthesizes a digital amount of speech driven by the sound source received from the sound source generator 23,
/ A (Digital to Anlog) converter to analog, remove unnecessary high frequency components by LPF, and send to output line 2001 as output audio signal.

なお,上述した実施例では分析パラメータとしてLSPを
利用しているが,これはほぼ同様な効率で処理しうる他
のLPC係数等を利用してもよい。また音源分析発生はマ
ルチパルス列等音源波形伝送を利用するものを代替使用
しても容易に実施しうることは明らかである。
Although the LSP is used as the analysis parameter in the above-mentioned embodiment, other LPC coefficients or the like that can be processed with substantially the same efficiency may be used. Further, it is clear that the sound source analysis and generation can be easily performed by using a sound source waveform transmission such as a multi-pulse train instead.

〔発明の効果〕〔The invention's effect〕

以上説明した如く本発明によれば,可変長フレーム型パ
タンマッチングボコーダにおいて,フレーム選択とパタ
ンマッチングによるそれぞれのスペクル歪を関連づけて
処理することによってパタンマッチング歪の大きいフレ
ームを基本的に除去しうる可変長フレーム型パタンマッ
チングボコーダが実現できるという効果がある。
As described above, according to the present invention, in the variable-length frame type pattern matching vocoder, it is possible to basically remove a frame having a large pattern matching distortion by processing the spectrum distortions associated with the frame selection and the pattern matching in association with each other. There is an effect that a long frame type pattern matching vocoder can be realized.

【図面の簡単な説明】[Brief description of drawings]

第1図は本発明の可変長フレーム型パタンマッチングボ
コーダの一実施例の構成を示すブロック図,第2図は第
1図の実施例におけるフレーム選択の基本的内容を説明
するためのフレーム選択説明図,第3図は第1図に示す
フレーム選択器15の詳細ブロック図である。 1……分析側,2……合成側,11……パラメータ分析器,12
……音源分析器,13……パタン照合器,14……標準パタン
ファイル,15……フレーム選択器,16……マルチプレク
サ,21……デマルチプレクサ,22……パタン読出し器,23
……音源発生器,24……標準パタンファイル,25……音声
合成フィルタ,51……LSPパラメータメモリ,52……標準
パラメータメモリ,53……量子化歪メモリ,54……ラベル
メモリ,55……DP制御器,56……時間歪算出器,57……時
間歪一時メモリ,58……フレーム境界決定器,59……ノー
ド歪メモリ,60……パスメモリ,61……ノード歪算出器,6
2……ノード歪一時メモリ,63……パス決定器,64……フ
レーム決定器,65……総歪算出器,66……タイマ。
FIG. 1 is a block diagram showing the configuration of an embodiment of a variable length frame type pattern matching vocoder of the present invention, and FIG. 2 is a frame selection explanation for explaining the basic contents of frame selection in the embodiment of FIG. 3 and FIG. 3 are detailed block diagrams of the frame selector 15 shown in FIG. 1 …… Analysis side, 2 …… Synthesis side, 11 …… Parameter analyzer, 12
...... Sound source analyzer, 13 …… Pattern collator, 14 …… Standard pattern file, 15 …… Frame selector, 16 …… Multiplexer, 21 …… Demultiplexer, 22 …… Pattern reader, 23
...... Sound source generator, 24 …… Standard pattern file, 25 …… Speech synthesis filter, 51 …… LSP parameter memory, 52 …… Standard parameter memory, 53 …… Quantization distortion memory, 54 …… Label memory, 55… … DP controller, 56 …… Time distortion calculator, 57 …… Time distortion temporary memory, 58 …… Frame boundary determiner, 59 …… Node distortion memory, 60 …… Path memory, 61 …… Node distortion calculator, 6
2 ... node distortion temporary memory, 63 ... path determiner, 64 ... frame determiner, 65 ... total distortion calculator, 66 ... timer.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】入力音声信号を分析して得られるスペクト
ル包絡パラメータとスペクトル包絡に関する標準パタン
とを照合しスペクトル距離が最小となる最適な標準パタ
ンを選択する標準パタン選択手段と、この標準パタン選
択手段による標準パタン選択に付随して算出されるスペ
クトル歪とDP(Dynamic Programming,動的計画法)を用
いたフレーム選択に付随して算出されるスペクトル歪と
のスカラー加算によって定義される総歪を評価値とする
フレーム選択手段とを備えて成るパタンマッチングボコ
ーダであって、分析フレーム毎に選択された標準パタン
のパラメータの補間パラメータと分析フレーム毎に分析
されたパラメータとから算出される時間歪と、前記標準
パタンの選択に付随して発生する量子化歪との総和が最
小となるフレームを選択するDP手段を有することを特徴
とする可変長フレーム型パタンマッチングボコーダ。
1. A standard pattern selecting means for selecting an optimum standard pattern having a minimum spectral distance by comparing a spectrum envelope parameter obtained by analyzing an input speech signal with a standard pattern relating to the spectrum envelope, and this standard pattern selecting means. The total distortion defined by the scalar addition of the spectral distortion calculated by the standard pattern selection by the method and the spectral distortion calculated by the frame selection using DP (Dynamic Programming) A pattern matching vocoder comprising a frame selecting means as an evaluation value, the time distortion calculated from the interpolation parameter of the parameter of the standard pattern selected for each analysis frame and the parameter analyzed for each analysis frame, , Select a frame that has the smallest sum of quantization distortions that accompany the selection of the standard pattern. A variable length frame type pattern matching vocoder characterized by having DP means.
JP61069291A 1985-03-26 1986-03-26 Variable length frame type pattern matching vocoder Expired - Lifetime JPH0731520B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP6131785 1985-03-26
JP60-61317 1985-03-26

Publications (2)

Publication Number Publication Date
JPS62998A JPS62998A (en) 1987-01-06
JPH0731520B2 true JPH0731520B2 (en) 1995-04-10

Family

ID=13167651

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61069291A Expired - Lifetime JPH0731520B2 (en) 1985-03-26 1986-03-26 Variable length frame type pattern matching vocoder

Country Status (1)

Country Link
JP (1) JPH0731520B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6254295A (en) * 1985-05-07 1987-03-09 日本電気株式会社 Variable length frame type pattern matching vocoder
JPWO2003042648A1 (en) * 2001-11-16 2005-03-10 松下電器産業株式会社 Speech coding apparatus, speech decoding apparatus, speech coding method, and speech decoding method

Also Published As

Publication number Publication date
JPS62998A (en) 1987-01-06

Similar Documents

Publication Publication Date Title
US6553343B1 (en) Speech synthesis method
KR950035132A (en) How to sum up signals representing human voice
EP1420389A1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
EP0575511A1 (en) Speech coder and method having spectral interpolation and fast codebook search
US20070055504A1 (en) Optimized windows and interpolation factors, and methods for optimizing windows, interpolation factors and linear prediction analysis in the ITU-T G.729 speech coding standard
EP0688010A1 (en) Speech synthesis method and speech synthesizer
KR100497788B1 (en) Method and apparatus for searching an excitation codebook in a code excited linear prediction coder
US4975955A (en) Pattern matching vocoder using LSP parameters
US5027404A (en) Pattern matching vocoder
CN105593935A (en) Method, apparatus, device, computer-readable medium for bandwidth extension of audio signal using scaled high-band excitation
JPH0731520B2 (en) Variable length frame type pattern matching vocoder
JPH11242498A (en) Method and device for pitch encoding of voice and record medium where pitch encoding program for voice is record
JP2829978B2 (en) Audio encoding / decoding method, audio encoding device, and audio decoding device
US4809330A (en) Encoder capable of removing interaction between adjacent frames
JP3088204B2 (en) Code-excited linear prediction encoding device and decoding device
JP3153075B2 (en) Audio coding device
JP2605256B2 (en) LSP pattern matching vocoder
JP2539351B2 (en) Speech synthesis method
JPH0736119B2 (en) Piecewise optimal function approximation method
JPS621000A (en) Voice processor
JP2939999B2 (en) Variable frame vocoder
GB2205469A (en) Multi-pulse type coding system
JPS62102294A (en) Voice coding system
JPS6254295A (en) Variable length frame type pattern matching vocoder
JPH08320700A (en) Sound coding device