JPS62999A - Zonal optimum function approximation - Google Patents
Zonal optimum function approximationInfo
- Publication number
- JPS62999A JPS62999A JP61069292A JP6929286A JPS62999A JP S62999 A JPS62999 A JP S62999A JP 61069292 A JP61069292 A JP 61069292A JP 6929286 A JP6929286 A JP 6929286A JP S62999 A JPS62999 A JP S62999A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- analysis
- representative
- frames
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は人力音声信号を分析して特徴パラメータを抽出
する場合における区分的最適関数近似方法と、この方法
を用いて運用される装置に関する。DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a piecewise optimal function approximation method for analyzing human voice signals and extracting feature parameters, and to a device operated using this method.
入力音声信号を分析してその特徴パラメータを抽出し、
スペクトル包絡データと音源データとからなる特徴パラ
メータを伝送路を介して合成側から合成側に送出し、合
成側ではこれら特徴パラメータにもとづいて入力音声信
号を再生する音声分析合成方法とその装置はよく知られ
ている。Analyze the input audio signal and extract its feature parameters,
A speech analysis and synthesis method and an apparatus for transmitting feature parameters consisting of spectral envelope data and sound source data from the synthesis side to the synthesis side via a transmission path, and reproducing an input speech signal based on these feature parameters on the synthesis side, are well known. Are known.
このような音声分析合成方式とその装置において、入力
音声に関する分析情報のうちの特徴パラメータを分析フ
レーム単位で分析側から合成側に送出する代りに、それ
ぞれ相連続する複数個の分析周期からなる区分を矩形関
数等の階段状関数によって入力音声と最適近似せしめた
うえこれら各区分の分析フレーム数と代表特徴パラメー
タとを音源情報とともに分析側から合成側に供給するこ
とによって伝送データ量の圧縮を図る手法は可変長フレ
ームボコーダ等の応用によっても近時よく知られつつあ
る。可変長フレームとして設定される区分は、入力音声
を矩形近似等を介して入力音声を最適近似せしめて得ら
れるものであり、複数の代表分析フレームの選択方法と
してDPが用いられる。In such a speech analysis and synthesis method and its device, instead of sending the characteristic parameters of the analysis information regarding the input speech from the analysis side to the synthesis side in units of analysis frames, they are divided into sections each consisting of a plurality of consecutive analysis cycles. is optimally approximated to the input audio using a stepwise function such as a rectangular function, and the number of analysis frames and representative feature parameters for each of these sections are supplied together with sound source information from the analysis side to the synthesis side, thereby compressing the amount of transmitted data. The technique has recently become well known due to applications such as variable length frame vocoders. The sections set as variable length frames are obtained by optimally approximating the input audio through rectangular approximation or the like, and DP is used as a method for selecting a plurality of representative analysis frames.
このDPによる各区分ごとの代表分析フレームの選択は
、各区分ごとに設定される最大数M個の代表分析フレー
ム数(1<M<K、ただしKは各区分の分析フレーム数
を残留歪を評価尺度としてこれを最小とする組合せ
の内容を決定するものである。The selection of representative analysis frames for each section by this DP is based on the maximum number M of representative analysis frames set for each section (1<M<K, where K is the number of analysis frames for each section, with the residual distortion The content of the combination that minimizes this as an evaluation scale is determined.
しかしながら上述した矩形関数による最適関数近似には
次に述べるような欠点がある。However, the optimal function approximation using the rectangular function described above has the following drawbacks.
すなわち、本来時間的に連続的に変化する特徴パラメー
タベクトル列を、一部の代表特徴パラメータベクトルを
用いて階段状の関数で代替するため、代替の結果生じる
歪が大きなものとなるという欠点がある。In other words, since a feature parameter vector sequence that originally changes continuously over time is replaced with a step-like function using some representative feature parameter vectors, there is a drawback that the distortion resulting from the replacement becomes large. .
本発明の目的も上述した欠点を除去し、よシ実際の特徴
パラメータベクトル列の時間的変化に適応し得る区分的
最適関数近似方法を提供することにある。Another object of the present invention is to provide a piecewise optimal function approximation method that eliminates the above-mentioned drawbacks and can better adapt to temporal changes in an actual feature parameter vector sequence.
本発明による方法は、入力音声信号を一部フレーム周期
で分析して得られる所定区間の連続した特徴パラメータ
ベクトルから前記所定区間を代表する一部の特徴パラメ
ータベクトルを選択することによシフレーム周期を可変
にする区分的最適関数近似方法において、前記所定区間
を傾斜区間長を可変とし、非傾斜区間長を可愛とする最
適台形近似法を使用して一部の代表特徴パラメータベク
トルにより近似し、且つ前記代表特徴パラメータベクト
ルが代表するフレーム区間を求める方法である。The method according to the present invention selects a portion of feature parameter vectors representative of the predetermined section from continuous feature parameter vectors of a predetermined section obtained by analyzing an input audio signal at a partial frame period. In the piecewise optimal function approximation method that makes variable the predetermined interval, the predetermined interval is approximated by some representative feature parameter vectors using an optimal trapezoidal approximation method in which the length of the sloped interval is made variable and the length of the non-tilted interval is made short; In addition, the present invention is a method for determining a frame section represented by the representative feature parameter vector.
次に図面を参照して本発明の詳細な説明する。 Next, the present invention will be described in detail with reference to the drawings.
第1図は本発明による区1分的最適関数近似方法の一実
施例の構成を示すブロック図である。FIG. 1 is a block diagram showing the configuration of an embodiment of the piecewise optimal function approximation method according to the present invention.
第1図に示す実施例の構成は区分的最適関数近似器1と
して示し、tた音源情報分析器100も併記して示して
いる。区分的最適関数近似器1はLSF分析器11.パ
ラメータメモリ12 、 Drプ四セッサ13および前
区分選択パラメータメモリ14等を備えて構成される。The configuration of the embodiment shown in FIG. 1 is shown as a piecewise optimal function approximator 1, and a sound source information analyzer 100 is also shown. The piecewise optimal function approximator 1 is an LSF analyzer 11. It is comprised of a parameter memory 12, a Drop processor 13, a pre-section selection parameter memory 14, and the like.
LSF分析器11は入力音声を受けると、予め定めた分
析フレームごとにこれをL P C(LinearPr
ediction Coefficient、 線形
予測係数)分析してLPC係数を抽出したあとこれら分
析7L/’−ムごとのLPG係数から公知の技術、たと
えば二ニートン(Newton)の反復法を利用する高
次方程式を各く手法などを利用して予め設定する次数の
LSP (Line 8pectrnm Pa1rs
、線スペクトル対)係数列を求めこれら特徴パラメータ
をパラメータメモリ12に供給する。When the LSF analyzer 11 receives input audio, it converts the input audio into LPC (LinearPr) for each predetermined analysis frame.
After analyzing the LPC coefficients (linear prediction coefficients) and extracting the LPC coefficients, high-order equations using known techniques such as Newton's iterative method are calculated from the LPG coefficients for each 7L/'-m. LSP (Line 8 pectrnm Pa1rs
, line spectra) and supply these characteristic parameters to the parameter memory 12.
DPプロセッサ13はこうしてパラメータメモリ12に
供給された分析フレームごとのパラメータに対し内蔵プ
ログラムの制御のもとに後述する区分的最適関数近似を
DP手法を利用して実施する。DPグロセッサ13はこ
の処理においてパラメータメモリ12から常時前区分で
の最終選択2レームを読出して前区分選択パラメータメ
モリ14に格納せしめ、前区分の最終選択フレームのL
SF係数を含むLAP係数列を対象として区分的最適関
数近似を実行する。The DP processor 13 performs piecewise optimal function approximation, which will be described later, on the parameters of each analysis frame supplied to the parameter memory 12 under the control of a built-in program using the DP method. In this process, the DP grosser 13 constantly reads out the last two frames selected in the previous section from the parameter memory 12, stores them in the previous section selection parameter memory 14, and stores them in the L of the last selected frame in the previous section.
Piecewise optimal function approximation is performed on a LAP coefficient sequence including SF coefficients.
このようにして得られた選択特徴パラメータは音源情報
分析器100によって抽出された音源情報データととも
に伝送路を介して合成側に送出される。The selected feature parameters obtained in this way are sent to the synthesis side via the transmission path together with the sound source information data extracted by the sound source information analyzer 100.
音源情報分析器100は入力音声の音源情報としての音
源の強さ、有声/無声/無音の別ならびにピッチ周期に
関するテークを公知の手段で分析フレームごとに抽出し
出力する。The sound source information analyzer 100 extracts and outputs the sound source information of the input speech regarding the strength of the sound source, voiced/unvoiced/silent classification, and pitch period for each analysis frame using known means.
次に本発明の最も重要な部分であるDrプロセッサ13
の動作を図を用いて説明する。第2図は特徴パラメータ
ベクトル分析周期を10m5ec、区分長を2QQms
ec (従って一区分内に20ケの特徴パラメータベ
クトルが含まれる)、代表特徴パラメータベクトル数を
5とした場合のDrプロセッサ13の説明図である。D
Pプロセッサ13は5ケの代表パラメータベクトルを選
択し、且つ代表パラメータベクトルが代表する区間即ち
非傾斜区間、及び相隣接する代表パラメータベクトルの
補間ベクトルが代表する区間、即ち傾斜区間を決定する
ものであり、その動作は以下の通りである。Next, the Dr processor 13, which is the most important part of the present invention.
The operation will be explained using diagrams. In Figure 2, the feature parameter vector analysis period is 10m5ec, and the segment length is 2QQms.
ec (therefore, 20 feature parameter vectors are included in one section) and the number of representative feature parameter vectors is 5. FIG. D
The P processor 13 selects five representative parameter vectors, and determines the section represented by the representative parameter vector, that is, the non-tilted section, and the section that is represented by the interpolated vector of adjacent representative parameter vectors, that is, the tilted section. Yes, and its operation is as follows.
第2図に於いて■は前区分の最終代表分析フレーム、■
〜[相]は現区分の分析フレーム番号である。In Figure 2, ■ is the final representative analysis frame of the previous section, ■
~[phase] is the analysis frame number of the current section.
さて、第1代表分析フレーム候補としては区分中の時間
的先行順で分析フレーム■〜[相]のうちのいずれかが
対象となる。同様にして第5フレーム候補となるのが分
析フレーム■〜[相]である。Now, as the first representative analysis frame candidate, any one of the analysis frames ① to [phase] in the temporally preceding order in the classification is targeted. Similarly, analysis frames ① to [phase] are candidates for the fifth frame.
また第1代表分析フレーム候補に引続いて第2代表分析
フレーム候補となシうる分析フレームは。Also, which analysis frame can be used as a second representative analysis frame candidate following the first representative analysis frame candidate.
分析フレーム■もしくは[株]が代表分析フレームとし
て指定されることを条件に入れると分析フレーム■〜@
のうちのいずれかが対象となシ、全く同様にして第4フ
レーム候補は分析フレーム■〜0のうちのいずれかが対
象とな多、また第37レーム候補としては分析フレーム
■〜[相]のうちのいずれかが対象となることも自明の
内容である。If analysis frame ■ or [stock] is specified as the representative analysis frame, analysis frame ■~@
In exactly the same way, the fourth frame candidate is any one of the analysis frames ■~0, and the 37th frame candidate is the analysis frames ■~[phase]. It is also self-evident that any one of them is the target.
さて、第2図において、いま仮に分析フレーム■が第1
フレームとして選択された場合を考えてみる。これに対
して第2フレームとな)ウル可能性のある分析クレーム
は■〜@である・これら第1および第2フレーム候補の
組合せを例とし発生する歪を考えてみると次のようにな
る。Now, in Figure 2, suppose that analysis frame ■ is the first
Consider the case where it is selected as a frame. On the other hand, the possible analysis claims for the second frame are ■~@・If we take the combination of these first and second frame candidates as an example and consider the distortion that occurs, we get the following. .
分析フレーム代替によるスペクトル歪すなわち時間歪は
、代表分析フレームと代替される分析フレームとのスペ
クトル距離によって表わすことができ次の(1)式によ
って示される。Spectral distortion, that is, time distortion due to analysis frame substitution, can be expressed by the spectral distance between the representative analysis frame and the replaced analysis frame, and is expressed by the following equation (1).
DB= 1’ W ij” −P ” ) ” 1.
60.” (1)Ic;=I K K
K(1)式においてi、jはスペクトル距離り、・の計
j
測を行なう2つの分析フレームのフレーム番号でフレー
ム’tJの特徴パラメータベクトル要素である。(1)
式で示されるDij はフレーム相互間のスペクトル距
離であるとともに観点を変えると分析フレームjf:i
で代替する場合に発生するスペクトル歪、すなわち時間
歪である。DB=1'Wij"-P")"1.
60. ” (1) Ic;=I K K
In Equation K (1), i and j are the frame numbers of two analysis frames in which the spectral distances, . (1)
Dij shown in the formula is the spectral distance between frames, and from a different perspective, the analysis frame jf:i
This is the spectral distortion, that is, the time distortion, that occurs when replacing with .
さて1分析フレーム■と■とがそれぞれ第1および第2
代雫分析フレームとなったような場合はフレーム代替に
よる時間歪は発生しない。Now, 1 analysis frame ■ and ■ are the first and second analysis frames, respectively.
In the case of a Yoshizuku analysis frame, time distortion due to frame substitution does not occur.
次に、第2代表分析フレームとして分析フレーム■が選
択された場合を考えてみると次の(2)式に示すD(2
)は分析フレーム■〜■を第2代表分析フレームである
分析フレーム■を含む2つの代表分析フレームと前区分
の最終代表分析7レーム■とを用いて代替した場合の最
小の歪である。以下このようにして求められた最小の歪
を「総和」と呼ぶ。Next, considering the case where analysis frame ■ is selected as the second representative analysis frame, D(2
) is the minimum distortion when analysis frames ■ to ■ are replaced by two representative analysis frames including analysis frame ■ which is the second representative analysis frame, and the final representative analysis frame ■ of the previous section. Hereinafter, the minimum distortion determined in this manner will be referred to as the "sum".
に)式においてD3は第2代表分析フレーム候補として
分析フレーム(3)を選択したときに発生する認否であ
プ、またD およびD2はそれぞれ第1代表分析フレー
ムとして分析フレーム(1)または(2)を選択したと
きのそれぞれの認否を表わす。In the formula, D3 is the approval or disapproval that occurs when analysis frame (3) is selected as the second representative analysis frame candidate, and D and D2 are the approval or disapproval that occurs when analysis frame (1) or (2) is selected as the first representative analysis frame candidate, respectively. ) represents the approval or disapproval of each selection.
上述し次第1代表分析フレーム候補における認否は下記
(31式により求められる。As described above, the acceptance or disapproval of one representative analysis frame candidate is determined by the following (Equation 31).
(3)式においてD −’−1)よ、はそれぞれ分析
クレーム■〜[相]の認否%DL2〜DL 16は次
の(4)〜(5)式で定義される時間歪の和を示す。In equation (3), D −'-1) represents the acceptance/disapproval percentage of analysis claim ■~[phase], respectively. DL2~DL 16 indicates the sum of time distortions defined by the following equations (4) and (5). .
D =min(dLs”
ム@2 q”*2*L
°(iji−L、1−2)、1
=mlri
・・・・・・・・・・・・ (4)
(4) 、 (5)式においてdL □ は分析フレー
ム■と0間の時間歪%dL i は分析フレーム■との
間の時間歪である。又q15,16.L は分析フレ
ーム[相]を分析フレ、−ム[相]又は[相]と■との
特徴パラメータベクトルの補間ベクトルで代替したとき
の時間歪の最小値で6D下記(6)式で示される。D = min(dLs” mu@2 q”*2*L °(iji-L, 1-2), 1 = mlri ・・・・・・・・・・・・ (4) (4) , (5 ), dL □ is the time distortion% between analysis frame ■ and 0 dL i is the time distortion between analysis frame ■.Also, q15, 16.L is the time distortion between analysis frame [phase] 6D is the minimum value of time distortion when the feature parameter vectors of [phase] or [phase] and ■ are replaced by interpolated vectors, and are expressed by the following equation (6).
・・・・・・・・・ (6)
なお(6)式においてd(l−11,1−16)、15
は下記(7)式で示される補間ベクトル…(1−L、1
−16)どフレーム[相]とのスペクトル距離、即ちフ
レーム代替によフ発生する時間歪である。・・・・・・・・・ (6) In equation (6), d(l-11, 1-16), 15
is the interpolation vector shown by the following equation (7)...(1-L, 1
-16) It is the spectral distance to which frame [phase], that is, the time distortion that occurs due to frame substitution.
同様にq14,16.Lは分析フレーム0〜[相]を分
析フレーム[相]、又は[株]と■との特徴パラメータ
ベクトルの線形補間ベクトルで代替したときの時間歪の
最小値であシ下記(8)式で示される。Similarly, q14, 16. L is the minimum value of time distortion when analysis frames 0 to [phase] are replaced by linear interpolation vectors of feature parameter vectors of analysis frame [phase] or [stock] and ■. shown.
(8)式においてd(1−L、1−16) 、14
は(6)式のd(1−1,,1−06)、15と同様に
求めら詐る0又1、ワ d((16−i)−L、 (i
−13)−16) 、 iはd(2−L。In equation (8), d(1-L, 1-16), 14
is d(1-1,,1-06) in equation (6), 0 or 1 which can be calculated similarly to 15, d((16-i)-L, (i
-13)-16), i is d(2-L.
1w14
とd との和であ)
1−16) 、14 (1−L、2−16) 、1
5各々は下記(9)〜(10)式で示される補間ベクト
ル■(2−L、1−16) 、u (i−L、2−16
)とyv−*Q。The sum of 1w14 and d) 1-16) , 14 (1-L, 2-16) , 1
5 are interpolation vectors (2-L, 1-16), u (i-L, 2-16) shown by the following equations (9) to (10), respectively.
) and yv-*Q.
■とのフレーム代替歪である。■This is frame substitution distortion.
同様に・・・・・・q3,16.L、 2,16.L
についても分析フレーム[相]、又は[相]と■と
の線形補間ベクトルを用いてフレーム■〜[相]、■〜
[相]を最小の時間歪になる様に代替した場合の歪とし
て表わされる。Similarly...q3,16. L, 2,16. L
Also, analysis frames [phase], or frames ■ ~ [phase], ■ ~ using linear interpolation vectors of [phase] and ■
It is expressed as the distortion when [phase] is replaced so that the time distortion becomes the minimum.
再び(2)式の訝明に戻る。(2)式に於いてDl、3
はフレーム■〜■を代表フレーム■と■とを用いて最適
に近似した場合の歪を表わし下記(11)式で示される
。Returning to the question of equation (2) again. In formula (2), Dl, 3
represents the distortion when frames ■ to ■ are optimally approximated using representative frames ■ and ■, and is expressed by the following equation (11).
又sD2@B はフレーム■、■間に代替すべきフレ
ームが存在しないためDl、s:Qとなる。Also, sD2@B becomes Dl, s:Q because there is no frame to be substituted between frames ① and ①.
さて1次に第2代表分析フレームとして分析フて考えて
みる。First, let's consider the analysis as the second representative analysis frame.
この場合は第1代表分析フレームとして存在しうる可能
性がある9は分析フレーム■のほかに■および■があシ
認否D4は次の(12)式で示される。In this case, 9, which may exist as the first representative analysis frame, is the analysis frame ■, and the approval/disapproval D4 of ■ and ■ is expressed by the following equation (12).
・・・・・・・・・(12)
(12)式においてDltn pDz *41らひにD
j、4はそれぞれ時間歪を表わし、たとえばDl 、4
は次の(13)式で示される。・・・・・・・・・(12) In formula (12), Dltn pDz *41 Rahini D
j, 4 represent time distortions, for example, Dl, 4
is expressed by the following equation (13).
(13)式においてdt、1およびct、 ssは分
析フレーム■と■との間に介在する分析フレーム■と■
とがいずれも分析フレーム■によって代表されるときに
発生する時間歪5qSt4slは分析フレーム■を分析
フレーム■、又は■と■との補間ベクトルを用いて代替
した場合の最小時間歪、q 1 # a * t
ハ分析7 レーム■〜■t−分析7L’−ム■、又は■
と■との線形補間ベクトルを用いて代替した場合の最小
時間歪を表わす0Js4ならびにD3.4についても(
13)式と同様な方針で定義される。前述した(12)
式の意味することは。In equation (13), dt, 1, ct, and ss are the analytical frames ■ and ■ that are interposed between the analytical frames ■ and ■.
The time distortion 5qSt4sl that occurs when both are represented by the analysis frame ■ is the minimum time distortion when the analysis frame ■ is replaced by the analysis frame ■ or the interpolation vector of ■ and ■, q 1 # a *t
C Analysis 7 Rem ■~■t-Analysis 7 L'-mu ■ or ■
Regarding 0Js4 and D3.4, which represent the minimum time distortion when substituted using linear interpolation vectors of and ■, (
13) It is defined according to the same principle as Equation 13). As mentioned above (12)
What does the expression mean?
第2代表分析フレームとして■を選択した場合。When ■ is selected as the second representative analysis frame.
これによって最小の縮歪を与える第1代表分析フレーム
ならびにこれら第1および第2代表分析7レームによっ
て代表される分析フレームの組合せが決定されるという
ことである。このようにして第1から第5までの各代表
分析フレーム得補を対象として次仄に同様な手順で(2
)式や(12)式に示すような縮歪を第5代地分析フレ
ーム候補まで求めていく。このような縮歪は入力音声信
号のスペク。This means that the combination of the first representative analysis frame that provides the minimum shrinkage distortion and the analysis frames represented by these seven first and second representative analysis frames is determined. In this way, each of the representative analysis frames obtained from the first to the fifth are subjected to the same procedure (2
) and equation (12) are calculated up to the fifth land analysis frame candidate. Such compression distortion is a function of the input audio signal.
トル包格パラメータとの近似処理差いわゆる残留歪を最
小とする近似関数を設定する尺度となるものである。This serves as a measure for setting an approximation function that minimizes the approximation process difference with the comprehensive parameter, so-called residual distortion.
こうしてたとえは分析フレーム■を第2代表分析7レー
ムとする場合は第1代表分析フレームとしては先行の分
析フレーム■〜■が、また分析フレーム■が第2代表分
析フレームとなる場合は先行の分析フレーム■〜■がそ
れぞれ第1代表分析フレームとな9うる設定で縮歪を計
算しつつ第5代表分析フレーム候補に及び、この第5代
表分析フレーム候補の分析フレーム■〜[相]にはさら
に次の演算を実施する。In this way, for example, if analysis frame ■ is the second representative analysis frame, then the preceding analysis frames ■ to ■ are the first representative analysis frame, and if analysis frame ■ is the second representative analysis frame, then the preceding analysis Frames ■ to ■ are each the first representative analysis frame, and the contraction distortion is calculated with the 9-channel setting to the fifth representative analysis frame candidate, and the analysis frame ■ to [phase] of this fifth representative analysis frame candidate is further Perform the following calculations.
(14)式によって示されるIIは第5代表分析フレー
ムとして分析フレーム■から[相]までのいずれかが選
択されたとき、これによって代表される他の分析フレー
ムによる縮歪の影響を最小とするものを選択することを
示し、D5〜D2゜はそれぞれ第5代表分析フレームと
して分析7レーム■〜[相]のいずれかが選択されたと
きそれら分析クレームに発生する縮歪であハまた。Σ
dB、iは分析71=6
レーム■と分析フレーム■からQDマでのそれぞれ−ム
■と分析フレーム■から@までのそれぞれとの時間歪の
総和を、またalues・は分析フレーム0,0間の時
間歪を示す。II expressed by equation (14) minimizes the influence of shrinkage distortion caused by other analysis frames represented by this when any of the analysis frames ■ to [phase] is selected as the fifth representative analysis frame. D5 to D2° are shrinkage distortions that occur in the analytical claims when any of the seven analytical frames ■ to [phase] is selected as the fifth representative analytical frame. Σ
dB, i is the sum of time distortions from analysis frame ■ and analysis frame ■ to QD master, respectively, from analysis frame ■ and analysis frame ■ to @, and alues is the sum of time distortions between analysis frame ■ and analysis frame ■ to @, respectively. shows the time distortion of
(14)式によって決定されるDjが区分ごとに決定し
たとき、直ちに第1から第5代表分析フレーム候補の組
合せのうち縮歪の最小なりrパスを決定する5個の代表
分析フレームとこれら代表分析フレーム又は1代表フレ
ームの線形補間ベクトルによって代表される分析フレー
ムが決定され、こうして傾斜区間、非傾斜区間共可変と
した区分的最適関数近似による可変長フレーム化が容易
に実施される。When Dj, which is determined by equation (14), is determined for each section, immediately select the five representative analysis frames that determine the r path with the minimum shrinkage distortion among the combinations of the first to fifth representative analysis frame candidates, and these representatives. An analysis frame or an analysis frame represented by a linear interpolation vector of one representative frame is determined, and in this way, variable-length frames can be easily created by piecewise optimal function approximation in which both the tilted section and the non-tilted section are made variable.
以上が第1図に示すDPプロセッサ13の動作に関する
。第2図を用いての詳細な説明である。The above is regarding the operation of the DP processor 13 shown in FIG. This is a detailed explanation using FIG. 2.
次にDrプ薗セッサ13を図面を用いて詳細に説明する
。第8図はDPプロセッサ13の構成を示すブロック図
であ)、パラメータメモリ12と前区分選択パラメータ
メモリ14とを併記しである。第8図に示すDrプロセ
ッサ13は時間歪算出器131.補間器132と制御演
算器133とで構成されている。制御演長器は例えばマ
イクロプロセッサをベースにした計算システムであ1助
Mを山麓している。この内@RAMを説明の都合上。Next, the Dr processor 13 will be explained in detail using the drawings. FIG. 8 is a block diagram showing the configuration of the DP processor 13), in which the parameter memory 12 and the previous section selection parameter memory 14 are also shown. The Dr processor 13 shown in FIG. 8 includes a time distortion calculator 131. It is composed of an interpolator 132 and a control calculator 133. The control processor is, for example, a calculation system based on a microprocessor, and is at the base of IchisukeM. Of these, @RAM is used for convenience of explanation.
エリア表現する事とする。これらのエリアはFO−RT
RN プログラムで次のように表現されるものである
。We will express the area. These areas are FO-RT
This is expressed in the RN program as follows.
DIMENSION ALSP(N) 、BLsP(2
0、N) 、 IDP(5、20,3)。DIMENSION ALSP(N), BLsP(2
0, N), IDP (5, 20, 3).
l QDP(5、20) 、 IIdAB
l (2鰯) 、Ql(20) 。l QDP(5,20), IIdAB
l (2 sardines), Ql (20).
Q2(20)。Q2 (20).
2 1BIAB2(2+2*N) 、DMA
B3(N) 、QB(20)さて、前区分選択パラメー
タメモリ14に記憶されているフレーム■のN次L8F
パラメータがアドレスライン142よシ供給されるアド
レス信号に対応して、入力ライン141を介して、制御
演算器133へ供給される。制御演算器133はこのデ
ータをエリアAL8P へ記憶する。次にパラメータメ
モリ12に記憶されているフレーム■〜■のN次LSF
パラメータがアドレスライン122よシ供給されるアト
L・黒信号に対応して出力ライン121を介し、制御演
算器133へ供給される。2 1BIAB2(2+2*N), DMA
B3(N), QB(20) Now, the Nth L8F of frame ■ stored in the previous segment selection parameter memory 14
Parameters are supplied to the control calculator 133 via the input line 141 in response to address signals supplied from the address line 142. The control calculator 133 stores this data in area AL8P. Next, the N-order LSF of frames ■ to ■ stored in the parameter memory 12
Parameters are supplied to the control calculator 133 via the output line 121 in response to the at L/black signals supplied via the address line 122.
制御演算器133はこのデータをエリアBLSPへを算
出し、対応するパスを決定する。DIは′″O″である
ため、縮歪を記憶するためのエリアQDP(ltl)を
90”とする。又、フレーム■に代替されるフレームも
フレーム■に代替されるフレームも存在しないため、D
Pパスを記憶するためのエリアIDP(1,1,1)=
0.IDP(1゜1.2)=O、IDP(1,1,3)
=1とする。The control calculator 133 calculates this data to the area BLSP and determines the corresponding path. Since DI is ``O'', the area QDP (ltl) for storing compression distortion is set to 90''. Also, since there is no frame to be replaced by frame ■ or frame to be replaced by frame ■, D
Area IDP (1, 1, 1) for storing P path =
0. IDP (1°1.2) = O, IDP (1, 1, 3)
=1.
尚IDP(1,1,2)には第1代表分析フレーム候補
をフレーム■とした場合の、7レーム■に代替されるフ
レームの範囲をフレーム番号で示す。Note that IDP (1, 1, 2) indicates the range of frames substituted for 7 frames ■ when the first representative analysis frame candidate is frame ■ by frame number.
IDP(1,1,3)はフレーム■に代替されるフレー
ムの範囲fc7レーム番号で示す。IDP(’1.1,
1)はDrパスで、Sカ必らず■であるが。IDP (1, 1, 3) is indicated by the frame number fc7, which is a range of frames to be substituted for frame ■. IDP('1.1,
1) is a Dr pass, and the S card is always ■.
これをここでは@O”で表現する。This is expressed here as @O”.
次にDs (””DL、2 )式によ〕算出する。先ず
d が次のように算出される。エリアDMAB I
L、1
の番地(1)〜(間にALS F の番地(1)〜(
N)のデータが。Next, Ds (""DL, 2)] is calculated using the formula. First, d is calculated as follows. Area DMAB I
Addresses (1) to (1) of L, 1 to (between addresses (1) to (1) of ALS F
N) data.
DjilAB 1の番地(N÷1)〜(2*N)にBL
IPの番地(111)〜(1,N)のデータが転送され
る。制御演算器133はDMAB1のデータを番地(2
*N)よ′り順々に(1)tで連続的に出力ライ2□3
4 tRL、ctIMi:31:ff15131 wt
bカfb。 :制御演算器133は又、このデータ
に同期したパルス、2*N個分をクロックライン135
を介して時間歪算出器131へ出力する@
第9図は時間歪算出器131を詳細に説明するためのブ
ロック図である。第9図に於いて時間歪算出器131は
レジスタ1311−1〜N、1312−1〜N、減算器
1313−1〜N、律−1314−1−N、掛算器13
15−1〜N、およびアキエムレータ1316を有して
構成される。レジスタ1311および1312は例えば
16bitのレジスタであシ、り胃ツクライン135t
−介して供給されるパルスに同期してデータを記憶する
。出力ライ/134を介して供給されたデータは、前述
の2+N個分のパルスにより、次々と記憶され、最終的
にはレジスタ1311−1にDMABI(1)、レジス
タ1311−NKDMABI(M)、レジスタ1312
−1にDMABI(N+1)、レジスタ1312−Nに
DMABI(2*N)の内容が記憶される。即ち、レジ
スタ1311−1〜Nにフレーム■の、レジスタ131
2−1〜Nにフレーム■のN次LAFデータが記憶さ扛
る。減算器1313−1 aレジスタ1311−1に記
憶されているフレーム■のパラメータP1・と、レジス
タ1312−1 に記憶されているフレーム■のパラ
メータPlとの差を算出し掛算器1314−1に出力す
る。掛算器1314はこの差の二乗を算出し、掛算器1
315−1の一つの入力端子へ出力する。掛算器131
5−1の他の入力端子には定数としてスペクトル感度W
1が印加されている。従りて掛算器1315−1の出力
はW、(Pl−Pl) となる。同様に1315−N
の出力はWN(P’ −P” ) となる。その結果
アN
キエムレータ1316の出力は前記(1)式に示す時間
歪をフレーム■、■間で算出した時間歪dL9、となる
。時間歪算出器131は算出したdL、□を入力ライン
136へ出力する。BL at address (N÷1) ~ (2*N) of DjilAB 1
Data at IP addresses (111) to (1,N) is transferred. The control calculator 133 stores the data of DMAB1 at address (2).
*N), then (1) Continuously output line 2 □ 3 at t
4 tRL, ctIMi:31:ff15131 wt
bka fb. : The control calculator 133 also sends 2*N pulses synchronized with this data to the clock line 135.
9 is a block diagram for explaining the time distortion calculator 131 in detail. In FIG. 9, the time distortion calculator 131 includes registers 1311-1 to 1312-N, 1312-1 to 1312-N, subtracters 1313-1 to 1313-N, 1314-1-N, and a multiplier 13.
15-1 to 15-N, and an achievator 1316. The registers 1311 and 1312 are, for example, 16-bit registers, and the stomach line 135t
- storing data synchronously with pulses supplied through the The data supplied via the output line/134 is stored one after another by the aforementioned 2+N pulses, and is finally stored in register 1311-1 as DMABI(1), register 1311-NKDMABI(M), and register 1311-NKDMABI(M). 1312
-1 stores the contents of DMABI (N+1), and register 1312-N stores the contents of DMABI (2*N). That is, the register 131-1 of frame 1 is stored in registers 1311-1 to 1311-N
N-th LAF data of frame (2) is stored in 2-1 to 2-N. Subtractor 1313-1 Calculates the difference between the parameter P1 of frame ■ stored in the a register 1311-1 and the parameter Pl of frame ■ stored in the register 1312-1, and outputs it to the multiplier 1314-1. do. Multiplier 1314 calculates the square of this difference, and multiplier 1
315-1 to one input terminal. Multiplier 131
The other input terminal of 5-1 has spectral sensitivity W as a constant.
1 is applied. Therefore, the output of multiplier 1315-1 is W, (Pl-Pl). Similarly 1315-N
The output of is WN(P' - P'').As a result, the output of the aN key emulator 1316 is the time distortion dL9 calculated between frames ■ and ■ by the time distortion shown in equation (1) above. The calculator 131 outputs the calculated dL, □ to the input line 136.
再び第8図を用いて説明する。制御演算器133は入力
ライン136を介して供給された’ L、 1をエリア
Q1の番地(1)に記憶する。The explanation will be given again using FIG. 8. The control calculator 133 stores 'L, 1 supplied through the input line 136 at address (1) of area Q1.
次にqlmlsLが以下のように算出される。前述のよ
うに
である。d3,1はd と同様に、次のように算り
、 1
出される。エリアDMAB1の番地(1)〜(N)にB
LSF(2,1)〜(2,N)のデータが、DMABI
のBLSF
番地(N+1)〜(2*N)に の番地(1゜1)
〜(1,N)のデータが転送される。制御演算器133
はDMABIのデータを時間歪算出器131へ出力する
。時間歪算出器133はdltlを算出し制御演算器1
33へ出力する。制御演算器133はduelをエリア
Qsの番地(1)に書込む。Next, qlmlsL is calculated as follows. As mentioned above. d3,1 is calculated as follows in the same way as d, and 1 is obtained. B to addresses (1) to (N) of area DMAB1.
The data of LSF (2,1) to (2,N) is
BLSF address (N+1) ~ (2*N) of (1°1)
~(1,N) data is transferred. Control calculator 133
outputs DMABI data to the time distortion calculator 131. The time distortion calculator 133 calculates dltl and the control calculator 1
Output to 33. The control calculator 133 writes DUEL to address (1) of the area Qs.
又、d (1−I、、1−2)、1は次のようにして算
出される。d(l−L、1−2)、1 はフレーム■と
■と(0m間パラメータとフレーム■のパラメータとで
パ算出される時間歪である。まずBLSF(2,1)〜
(2,N)のデータがエリアDMAB2の番地(2+N
+1)〜(2+2本N)へ、AL8F(1)〜(へ)の
データがDMAB2の番地(241)〜(2+N)へ転
送される。次に%DMAB2の番地(2)と(1)とに
補間の重み′″1”が書込まれる。制御演算器133は
DMAB 2のデータを番地(2+2*N)より順序に
(1)まで連続的に出力ライン137を介して補間器1
32へ出力する。制御演算器133は又、このデータに
同期したパルス(2+2*N)個分るクロックライン1
38を介して補間器132へ出力する。Further, d (1-I,, 1-2), 1 is calculated as follows. d(l-L, 1-2), 1 is the time distortion calculated from frames ■ and ■ (0m interval parameters and frame ■ parameters. First, BLSF (2, 1) ~
The data at (2,N) is at address (2+N) in area DMAB2.
+1) to (2+2 N), data of AL8F (1) to (to) is transferred to addresses (241) to (2+N) of DMAB2. Next, an interpolation weight of ``1'' is written to addresses (2) and (1) of %DMAB2. The control calculator 133 sequentially sends the data of DMAB 2 to the interpolator 1 via the output line 137 in order from address (2+2*N) to address (1).
Output to 32. The control calculator 133 also uses a clock line 1 divided into (2+2*N) pulses synchronized with this data.
38 to the interpolator 132.
第10図は補間器132を詳細に説明するためのブロッ
ク図である。第10図に於いて補間器132はレジスタ
1321−1〜N、1322−1〜N、1323−1〜
2.掛算器1324−1〜N、1325−1〜N、13
27−1−N、加算器1326−1〜N、1328.R
t)M1329゜レジスター330−1〜Nを有して構
成される。レジスタ1321−1〜N、1322−1〜
N、1323−1〜2は例えば15bitのレジスタで
あり、クロックライフ138を介して供給されるパルス
に同期してデータを記憶する。出力ライン137を介し
て供給されたデータは、前述の2+2+N個分のパルス
により、次々と記憶され、最終的にはレジスター321
−1〜NK DMAB2(2+1)〜(24N)、レジ
スタ1322−1〜NK DMAB2(2+N+1)→
+2*N)、レジスター323−1−2にDMAB2(
1+2)の内容が記憶される。即ち、レジスター321
−1〜Nに7レーム■のにレジスター322−1〜N
にフレーム■のN次LSPデータが記憶される。レジス
ター323−1〜2には補間の重み′″1″が書込まれ
る。掛算器1324−1〜N1323−1〜N には全
て補間の重み″1”が供給される結果、加算器132.
6−1〜・・・・・・N)、!:7レーム■のパラメー
タP(k==1゜・・・・・・N)の加算値(P’ +
P” )(k=1.・・−・・N)kk
となる。加算器1328は重み1”と′″1”とを加算
し@2”をROM1329へ出力する。R(7M132
9は16Wの几OMであシ、各番地には番地の逆数が1
329は加算器1328より供給された12″を番地デ
ータとして入力されα5を出力し、掛算器1327−1
−%−Nへ供給する。掛算器1327−1〜NはN)を
発生し、L/、ジスタ130−1〜Nへ出力する。FIG. 10 is a block diagram for explaining the interpolator 132 in detail. In FIG. 10, the interpolator 132 includes registers 1321-1 to N, 1322-1 to N, 1323-1 to
2. Multipliers 1324-1 to N, 1325-1 to N, 13
27-1-N, adders 1326-1 to N, 1328. R
t) Constructed with M1329° registers 330-1 to 330-N. Registers 1321-1~N, 1322-1~
N, 1323-1 and 1323-2 are, for example, 15-bit registers that store data in synchronization with pulses supplied via the clock life 138. The data supplied via the output line 137 is stored one after another by the aforementioned 2+2+N pulses, and is finally stored in the register 321.
-1 to NK DMAB2 (2+1) to (24N), register 1322-1 to NK DMAB2 (2+N+1) →
+2*N), DMAB2(
1+2) is stored. That is, register 321
7 frames for -1 to N ■Register 322-1 to N
The N-th LSP data of frame ■ is stored in . Interpolation weight ``1'' is written in registers 323-1 and 323-2. As a result, the interpolation weight "1" is supplied to all the multipliers 1324-1 to N1323-1 to N1323-N.
6-1~...N),! : Added value (P' +
P'') (k=1...-N)kk.The adder 1328 adds the weights 1'' and ``1'' and outputs @2'' to the ROM 1329.R(7M132
9 is a 16W OM, and each address has the reciprocal of the address 1.
329 receives 12'' supplied from adder 1328 as address data, outputs α5, and multiplier 1327-1
-%-N supply. Multipliers 1327-1 to N generate N) and output it to L/ and registers 130-1 to N.
この計算結果は制御演算器よりクロックライン139を
介して供給されるN個のパルスに同期して入カライノ1
40へ出力される。即ちN個のパルスのうち第1番目の
パル゛スで掛算器1327−1〜Nよシのデータをレジ
スタ1330−1〜Nは取込む。このデータ取込により
掛算器1327−1 の出力はレジスタ1330−1
を介して入力ライン140へ出力されている。又、N
個のパルスのうち第2〜N /<ルスにより、レジスタ
は次々とデータを転送し、結果として入力ライン140
へ計算結果を出力する。This calculation result is input to the controller 1 in synchronization with N pulses supplied from the control calculator via the clock line 139.
40. That is, registers 1330-1 to 1330-N take in data from multipliers 1327-1 to 1327-N at the first pulse among N pulses. By taking in this data, the output of multiplier 1327-1 becomes register 1330-1.
is output to input line 140 via. Also, N
The second to N pulses cause the register to transfer data one after another, resulting in input line 140
Output the calculation results to.
再び第8図を用いて説明する。制御演算器133は入力
ライン140を介して供給されたデータをエリアDMA
B5の(1)番地より (N)番地まで順々に書込む。The explanation will be given again using FIG. 8. The control calculator 133 converts the data supplied via the input line 140 into an area DMA.
Write in order from address (1) to address (N) of B5.
この書込まれたデータは7レーム■と■ととの補間パラ
メータである。次にエリアDMABIの番地(1)〜(
N)にDMAB 3(1)〜(N)のデータが、111
0番地(N+1)〜(2*2)にBLSF(1,1)〜
(1,N)のデータが転送される。DMABIのデータ
は時間歪算出器131へ出力され、d(x −L。This written data is an interpolation parameter for 7 frames (2) and (2). Next, address (1) ~ ( of area DMABI)
The data of DMAB 3(1) to (N) is 111 in N).
BLSF (1,1) to address 0 (N+1) to (2*2)
Data (1, N) is transferred. The DMABI data is output to the time distortion calculator 131, and d(x-L.
1−2)1が算出される。このd (1−L、1−2)
は制御演算器133のエリアQ2の番地(2)に書込ま
れる◎
上述のようにQ 2 (1)にはd雪 、鬼が、Q2(
2)にはd (1−L、1−a)、xが記憶されている
。さて制御演算器133はQ 2 (1)のデータとQ
2(2)のデータとの大小を比較し、小さいデータをq
l、2.Lとする。このq は特別にエリアQ1
の番1.2.L
地(2のに書込む。この番地(20)はイメ、−ジ上の
番地(0)に対応する。即ちQl(1)にはdL1□が
Ql(20)にはql、2.Lが書込まれている。制御
演算器133は更にQl(1)のデータとQl(20)
のデータとを比論DL 、 2決定と同時に最小のもの
がdl、1、d(1−1,□−2)、1.dld の
いずれであるか判明している0この判明結果に基づいて
DPパスを記憶するためのエリアIDP(1,2,1)
〜(x 、 2゜3)に次のデータが書込まれる。ID
P(1,2゜1)はDPパスとして■に対応するO”を
書込まれる・IDP(1,2,2)、IDP(1,2゜
3)は代表フレーム■、■に代替されるフレームの範囲
を示し、最小歪に対応して以下のように書込まれる。1-2) 1 is calculated. This d (1-L, 1-2)
is written to address (2) of area Q2 of the control calculator 133 ◎ As mentioned above, Q 2 (1) contains d Yuki, Oniga, and Q2 (
2) stores d (1-L, 1-a) and x. Now, the control calculator 133 uses the data of Q 2 (1) and Q
Compare the size with the data in 2(2) and select the smaller data by q
l, 2. Let it be L. This q is specially for area Q1
Number 1.2. Write in L address (2). This address (20) corresponds to address (0) on the image. That is, dL1□ is written in Ql (1), ql, 2.L is written in Ql (20). The control calculator 133 further writes the data of Ql(1) and the data of Ql(20).
Compare the data with DL, 2 and at the same time the smallest one is dl, 1, d(1-1, □-2), 1. Area IDP (1, 2, 1) for storing the DP path based on this finding result
The next data is written at ~(x, 2°3). ID
P(1,2゜1) is written with O" corresponding to ■ as the DP path. IDP(1,2,2) and IDP(1,2゜3) are replaced by representative frames ■, ■. Indicates the range of the frame and is written as follows, corresponding to the minimum distortion.
次に制御演算器133はD3 (DL 3)を算出する
。まずフレーム■にフレーム■、■が代替される場合の
歪i孟□”+、iが次の手順で算出される。dL 1
が前述の手順で算出されエリアQ1(2)に記憶さ
れる。次にdL、2がd、□と同様に算出される。制御
演算器133はこのd、□とQt(2)の内容の和、即
ち、ΣdL、iを求め、これをエリ1=1
アQ 1 (2)に再び記憶する。Next, the control calculator 133 calculates D3 (DL 3). First, when frames ■ and ■ are substituted for frame ■, the distortion i 孟□”+, i is calculated using the following procedure. dL 1
is calculated using the above-described procedure and stored in area Q1(2). Next, dL,2 is calculated in the same way as d,□. The control calculator 133 calculates the sum of d, □ and the contents of Qt(2), that is, ΣdL,i, and stores this again in ERI1=1AQ1(2).
次にdL 1”q2 3 L が矢のように算出
される。dL □が算出され、エリアQ 1 (1)
に書込まれる。更にq2,3.Lが前述のql、2.L
と同様の手順で求められる。尚% q23 L算出
の課程に於いて求められたd3.!は一時的にQ 2
(2)にQ2(2)にd(1−L、1−3)、2はQ
2(3)に保存される。Next, dL 1"q2 3 L is calculated like an arrow. dL □ is calculated, and area Q 1 (1)
written to. Furthermore, q2,3. L is the aforementioned ql, 2. L
can be obtained using the same procedure as . In addition, %q23 d3. calculated in the process of L calculation. ! is temporarily Q2
(2) has Q2 (2) has d(1-L, 1-3), 2 is Q
2(3).
制御演算器133はこのq23 LとQl(1)
の内容の和、即ち’L、1”q2,3.Lを求め、これ
をエリアQ 1 (1)に再び記憶する。The control calculator 133 uses this q23L and Ql(1)
The sum of the contents, that is, 'L, 1''q2, 3.L, is determined and stored again in area Q 1 (1).
次1cql、3.Lが求められる。ql、3.Lはmi
nめられる。まずd3.1が算出され、エリアQ2(1
)に書込まれる。更に”8mmが算出され、Q2(1)
の内容と加算され、再びQ2(1)に書込まれる。Next 1 cql, 3. L is required. ql, 3. L is mi
I get scolded. First, d3.1 is calculated, and area Q2(1
) is written. Furthermore, “8mm is calculated, Q2 (1)
is added to the contents of and written to Q2(1) again.
次にdmszが算出されQ 2 (2)に書込まれる。Next, dmsz is calculated and written to Q2 (2).
更にd(1−L、1−3)、1が前記d(1−L、1−
a)、zと同様に算出され、これとQ 2 (2)の内
容とが加算され、再びQ 2 (2)に書込まれる。次
に制御演算器133はd(2−L、1−3)、1を求め
る。Furthermore, d(1-L, 1-3), 1 is the above d(1-L, 1-
It is calculated in the same way as a) and z, and this and the contents of Q 2 (2) are added and written to Q 2 (2) again. Next, the control calculator 133 calculates d(2-L, 1-3), 1.
エリアAL8P(1)〜(へ)に記憶されている■のL
8PパラメータがエリアDMAB2(2+1)〜(2十
N)へ。■L stored in area AL8P(1) to (to)
8P parameter goes to area DMAB2 (2+1) to (20N).
エリアBLSF(3,1)〜(3,N)に記憶されてい
る■のL8PパラメータがエリアDMAB2(2+N+
1)〜(2+2*N)へ、それぞれ転送される。次にD
M−AB2の番地(1)に補間の重み@2”が1番地(
2)に補間の重み11”が書込まれる。制御演算器13
3はDMAB2のデータを補間器132へ出力する。The L8P parameter of ■ stored in areas BLSF (3, 1) to (3, N) is
1) to (2+2*N), respectively. Next D
The interpolation weight @2” is set at address (1) of M-AB2.
2), an interpolation weight of 11" is written in the control calculator 13.
3 outputs the data of DMAB2 to the interpolator 132.
補間器132はこのデータを受取る。受取られたデータ
は第10図に於いて、レジスタ1321−1〜Nに■の
、レジスタ1322−1〜Nに■のL8Fパラメータが
保存される。又1重み″2”がレジスタ1323−1に
、重み′″1”がレジスター323−2に保存される。Interpolator 132 receives this data. As for the received data, in FIG. 10, L8F parameters (2) are stored in registers 1321-1 to 1321-N, and L8F parameters (2) are stored in registers 1322-1 to N. Also, the weight "1" is stored in the register 1323-1, and the weight "1" is stored in the register 323-2.
掛算器1324−1−Nに重み@2”が、掛算器132
5−1〜Nに重み@1″が供給される結果、加算器13
26−1〜Nの出力はフレーム■なる。加算器1328
は重み″2”と@1”とを加算し、和@3”をROM1
329へ出力する。ROM1329はα333・・・に
一)を出力し、掛算器1327一1〜Nへ供給する。掛
算器1327−1〜Nは掛算結果として一!−ぞ2・P
(IJ+1・P@)(k=t、・・−・・tN)3
kk
を発生し、レジスター330−1−wへ出力する。この
結果はレジスター330−1〜N を介して入力ライン
140へ出力される。The multiplier 1324-1-N has a weight @2”, and the multiplier 132
As a result of the weight @1'' being supplied to 5-1 to N, the adder 13
The outputs of 26-1 to 26-N become frame (2). Adder 1328
adds the weight “2” and @1, and stores the sum @3” in ROM1
Output to 329. The ROM 1329 outputs 1) to α333, and supplies it to multipliers 1327-1 to N. The multipliers 1327-1 to 1327-N have a multiplication result of 1! -zo2・P
(IJ+1・P@) (k=t,...-...tN)3
kk is generated and output to register 330-1-w. This result is output to input line 140 via registers 330-1 through N.
第8図に於いて、制御演算器133はこのデータをDM
AB5に受取る。制御演算器133はd(、−b、1−
g)、lと同様の方法でd(2−L、1−s)1、を算
出しQ2(3)に書込む。制御演算器133は更にd。In FIG. 8, the control calculator 133 converts this data into DM.
Received at AB5. The control calculator 133 calculates d(, -b, 1-
g), d(2-L, 1-s)1 is calculated in the same manner as l and written in Q2(3). The control calculator 133 further includes d.
−L、2−s)、zを求め、この結果とQ2(3)の内
容全力a算し、再びQ2(3)へ書込む。-L, 2-s) and z, calculate this result and the full content of Q2(3), and write it to Q2(3) again.
制御演算器133はQ 2 (13〜(3)の内容のう
ち最小のものを検索し、その結果をq としてQ
l(20)に書込む。更に制御演算器133.はQl(
1)、Ql(2)、Ql (2のの内容のうち最小のも
DPババスエリアよりP(1,3,1)〜(1゜3.3
)に書込む◎熱論I D、P (1、3、1)はDPパ
スとして■に対応する1o”が書込まれる。The control calculator 133 searches for the minimum value among the contents of Q 2 (13 to (3)) and sets the result as q.
Write to l(20). Further, a control calculator 133. is Ql(
1), Ql(2), Ql (The smallest of the contents of 2 is P(1,3,1)~(1°3.3
) is written in ◎Heat theory ID D, P (1, 3, 1), 1o'' corresponding to ■ is written as the DP path.
IDP(1,3,2)、(1,3,3)は代表フレーム
■、■に代替されるフレームの範囲を示し。IDP (1, 3, 2) and (1, 3, 3) indicate the range of frames substituted for the representative frames ■ and ■.
最小歪に対応して以下のように書込まれる。Corresponding to the minimum distortion, it is written as follows.
D1s (=DL 、□6)を算出し、縮歪をQDP(
1゜4)〜(1,16)へ、DPパスデータをIDP(
1e 4 sμ)〜(1、,1、、,6、、、μ)、(
μ=1゜・・・・・・、3)に香込む。以上が第1代表
分析フレーム候補に関するL)Pプnセッサ13の処理
の詳細である。Calculate D1s (=DL, □6) and calculate the shrinkage strain by QDP (
1゜4) to (1,16), transfer the DP path data to IDP (
1e 4 sμ) ~ (1,,1,,,6,,,μ),(
μ=1°...3). The details of the processing of the L)P processor 13 regarding the first representative analysis frame candidate have been described above.
引続いてOPプロセッサ13は第2代表分析クレーム候
補に関する処理を実施する。前述のように第2代表分析
フレーム候補は■〜@が対象となるO
最初に7レーム■に関する処理が行なわれる。Subsequently, the OP processor 13 performs processing regarding the second representative analysis claim candidate. As described above, the second representative analysis frame candidates are O to @. First, processing is performed on the 7th frame ■.
■は第2代表分析フレーム候補とした場合、バス、の対
象となる第1代表分析フレーム候補は■のみである。又
、フレーム■、■間には被代替7レーであるためDs
=oとなる。制御演算器133は痣歪10′″をQDP
(2,2)に書込む。更に制御演算器133はDrパス
データとしてIDP(2.2.1)に@1″を(262
12)に@1”を(2,2,3)に@2”を書込む。When ■ is the second representative analysis frame candidate, only ■ is the first representative analysis frame candidate that is the target of the bus. Also, since there are 7 relays between frames ■ and ■, Ds
= o. The control calculator 133 QDPs the bruise distortion 10''
Write to (2,2). Furthermore, the control calculator 133 inputs @1'' to IDP (2.2.1) as Dr path data (262
Write @1” to 12) and @2” to (2, 2, 3).
次にフレーム■に関する処理が行なわれる。■を第2代
表分析7レーム候補とした場合、パスの対象となる第1
代表分析7レーム候補は■および■である。まずクレー
ム■、■を代表フレームとして、フレーム■をどちらか
の代表フレーム、もしくはこれらの補間データで代替し
た場合の時間歪D1.sがDL □と同様の方法で算
出され、エリアQB (1)に書込まれる。次にパスの
対象をフレーム■とした場合の時間歪n、os をQB
(2)に書込む。熱論、D、、sは10”である。更に
制御演算器133はQ B (1)の内容にQDP(1
,1)の内容を加算し、これを再びQB(1)に書込む
。同様にQB(2)の内容にQDP (1、2)の内容
を加算し、これを再びQ B (2)に瞥込む。更に制
御演算器133はQB(1)とQ B (2)の内容の
大小を比較し、小さいものを選択し、これをDsとして
QDP(2,3)に書込み、対応するDPパス情報をI
DP(2,3,1)〜(2,3,3)に書込む。なお、
上記のDsを算出する処理は前記(2)式を実行したも
のである。Next, processing regarding frame (2) is performed. If ■ is the second representative analysis 7 frame candidate, the first
Representative analysis 7 frame candidates are ■ and ■. First, time distortion D1 when claims ■ and ■ are taken as representative frames and frame ■ is replaced with one of the representative frames or their interpolated data. s is calculated in the same manner as DL □ and written to area QB (1). Next, when the target of the pass is frame ■, the time distortion n,os is QB
Write in (2). The thermal theory, D,, s is 10''. Furthermore, the control calculator 133 adds QDP(1) to the contents of Q B (1).
, 1) and write this again to QB(1). Similarly, the contents of QDP (1, 2) are added to the contents of QB (2), and this is looked into Q B (2) again. Furthermore, the control calculator 133 compares the magnitude of the contents of QB(1) and QB(2), selects the smaller one, writes it to QDP(2,3) as Ds, and writes the corresponding DP path information to I.
Write to DP (2, 3, 1) to (2, 3, 3). In addition,
The above process for calculating Ds is performed by executing equation (2) above.
次にフレーム■に関する処理が、パスの対象をフレーム
■〜■として実施される。上記と同様の手順でD l
*4 s n、 t4m DI *4がQ B(1)、
QB(2)。Next, processing regarding frame (1) is performed with frames (2) to (2) being passed. D l using the same procedure as above.
*4 s n, t4m DI *4 is Q B (1),
QB (2).
QB(3)に書込まれも次にQntt)(i=1.2.
3)の内容とQDP (1# i ) (i=1.2.
3)の内容の加算結果が再びQ B (*) (x=1
t 2 3 )に書込まれる。QB(3) is then written to Qntt)(i=1.2.
3) contents and QDP (1#i) (i=1.2.
The addition result of the contents of 3) is again Q B (*) (x=1
t 2 3 ).
QB(i)(i=L・・−・・3)の最小値が検索され
、これ■
をD4としてQDP(2,4)に書込み、対応するDr
パス情報をIDP(2,4,1)〜(2’、 4゜3)
に書込む。なお、上記D4に関する処理は前5)〜(2
,17)に書込まれる。熱論Drパス情報もIDPの対
応する番地に書込まれる。The minimum value of QB(i) (i=L...3) is searched, this is written as D4 to QDP(2,4), and the corresponding Dr
Pass information as IDP (2, 4, 1) ~ (2', 4゜3)
write to. Note that the processing related to D4 above is performed in steps 5) to (2) above.
, 17). Thermal Dr path information is also written to the corresponding address of the IDP.
引続きDrプロセッサ13は第3代表フレーム候補に関
する処理をフレーム■〜[相]を対象として、第4代表
フレーム候補に関する処理をフレーム■〜0を対象とし
て、第5代表フレーム候補に関する処理をフレーム■〜
のを対象として実施する。Subsequently, the Dr processor 13 performs processing related to the third representative frame candidate for frames ■~[phase], processes related to the fourth representative frame candidate for frames ■~0, and processes related to the fifth representative frame candidate for frames ~[phase].
This will be carried out targeting the following.
最後にDPプロセッサ13は前記(14)式に示す処理
を以下の手順で実施する。制御演算器133はds、−
を−出し、この結果とQDP (5、5)の内容を加算
し、加算結果をQDP(5,5)へ再び書込む。次にd
I ;?を算出し、同様にQDP(5,5)の内容と加
算し%結果をQDP(5,5)へ書込む。以下1次々と
dm g8 @ d8sl e””・・d@@*@を
QIDPを算出する。更に制御演算器133はQDP
(5゜5)〜Ql)P(5,20)の内容の最小値、即
ち(14)式に示すり、を求め、第5代表フレームを決
定する。Finally, the DP processor 13 executes the process shown in equation (14) above in the following procedure. The control calculator 133 has ds, -
- is output, this result is added to the contents of QDP (5, 5), and the addition result is written to QDP (5, 5) again. then d
I ;? is calculated and similarly added to the contents of QDP (5, 5), and the % result is written to QDP (5, 5). QIDP is calculated from dm g8 @ d8sl e""...d@@*@ one after another. Furthermore, the control calculator 133 is a QDP
(5°5) to Ql) The minimum value of the contents of P(5, 20), ie, as shown in equation (14), is determined to determine the fifth representative frame.
第5代表フレームが決定されるとIDPに記憶されてい
るDPババスータから、第4〜第1代表フレームが同時
に決定され、更に第1〜第5代表フレームが直接他のフ
レームを代替する区間、及び代表フレームの補間データ
が他のフレームを代替する区間が決定される。これらの
区間情報はリピートビットとして符号化器201へ出力
される。When the fifth representative frame is determined, the fourth to first representative frames are determined at the same time from the DP bus master stored in the IDP, and the first to fifth representative frames directly substitute for other frames; A section in which the interpolated data of the representative frame replaces other frames is determined. These section information are output to encoder 201 as repeat bits.
又、第1〜第5代表フレームのパラメータはBLSPよ
シ符号化器201へ出力される。更に第5代表フレーム
のパラメータは次の区分の■として前区分選択パラメー
タメモリ14へ出力される。Further, the parameters of the first to fifth representative frames are output to the BLSP encoder 201. Further, the parameters of the fifth representative frame are outputted to the previous section selection parameter memory 14 as the next section (■).
上述の説明では第1代表分析7レーム候補■〜[相]に
おけ為総長を前区分代表分析フレーム■と代表フレーム
候補■〜[相]により代替されるフレームの歪として説
明したが、これは必ずしもフレーム■を利用しなくても
よい。この場合には前述の(3)式の代りに下記(15
)式を用いる。In the above explanation, the tamed general in the first representative analysis 7 frame candidates ■ ~ [phase] was explained as a distortion of the frame that is replaced by the previous division representative analysis frame ■ and the representative frame candidate ■ ~ [phase]. It is not always necessary to use frame ■. In this case, instead of the above equation (3), the following (15
) formula is used.
熱論(15)式を用いる場合には前区分選択パラメータ
メモリ14は不要となる。When using the thermal theory equation (15), the pre-section selection parameter memory 14 is not required.
第3図は第1図に示す区分的最適関数近似方法ヲ利用L
7’C可変長フレーム型ボコーダの一実施例の構成を示
すブロック図である。Figure 3 shows an example using the piecewise optimal function approximation method shown in Figure 1.
FIG. 2 is a block diagram showing the configuration of an embodiment of a 7'C variable length frame type vocoder.
第3図に示す可変長フレームボコーダは可変長フレーム
ボコーダ分析側2および可変長フレームボコーダ合成側
3t−備えて構成される。さらに申変長フレームボコー
ダ分析側2は区分的最適関数近似器1.音源情報分析器
100.符号化器201゜202およびマルチプレクサ
203を備えて構成され、また可変長フレームボコーダ
合成側3はデマルチプレクサ301.ピッチパルス発生
器302゜雑音発生器303.切替器304.可変増幅
器305゜補間器306.LSF合成フィルタ307
、 D/Aコ/バータ308およびLPF(Low P
a5sFilter)309 を備えて構成される。The variable length frame vocoder shown in FIG. 3 is comprised of a variable length frame vocoder analysis side 2 and a variable length frame vocoder synthesis side 3t. Further, the variable length frame vocoder analysis side 2 includes a piecewise optimal function approximator 1. Sound source information analyzer 100. The variable length frame vocoder synthesis side 3 includes demultiplexers 301 . Pitch pulse generator 302° noise generator 303. Switcher 304. Variable amplifier 305° interpolator 306. LSF synthesis filter 307
, D/A converter 308 and LPF (Low P
a5sFilter) 309.
分析器の区分最適関数近似器1と音源情報分析器100
はそれぞれ選択特徴パラメータデータと音源情報データ
とを出力し符号化器201,202によって符号化を受
けたのちマルチプレクサ203に供給され所定の形式の
多重化処理を行なって伝送ライン2001を介して合成
側に送出される。Piecewise optimal function approximator 1 of analyzer and sound source information analyzer 100
output selected feature parameter data and sound source information data, which are encoded by encoders 201 and 202, and then supplied to a multiplexer 203, where they are multiplexed in a predetermined format and sent to the synthesis side via a transmission line 2001. will be sent to.
本実施例において区分的最適関数近似器1は区分的最適
関数近似を行なってフレーム圧縮を図ったLSP係数を
選択特徴パラメータとして出力する。すなわち予め設定
した分析フレーム数を単位とする区分ごとに予め設定し
た最大数以下の数の代表フレームとこれら代表フレーム
によって表現されるフレーム数のはか可変長傾斜区間に
間する情報を出力し、また音源情報分析器100は音源
の強さ、有声/無声/無音の別、ピッチ周期に関するデ
ータを出力する。In this embodiment, the piecewise optimal function approximator 1 performs piecewise optimal function approximation and outputs LSP coefficients for frame compression as selected feature parameters. That is, outputting information between a number of representative frames equal to or less than a preset maximum number and a variable length slope interval of the number of frames represented by these representative frames for each division with a preset number of analysis frames as a unit; The sound source information analyzer 100 also outputs data regarding the strength of the sound source, voiced/unvoiced/silent, and pitch period.
合成側ではデマルチプレクサ301によって多重化分離
を行ないさらに復号化したデータのうち選択特徴パラメ
ータデータは補間器306に、音源情報データのうちピ
ッチ周期データはピッチパルス発生器302に、有声/
無声/無音判別データは切替器304に、また音源強度
データは可変利得増幅器305にそれぞれ供給される。On the synthesis side, the demultiplexer 301 performs demultiplexing, and among the decoded data, the selected feature parameter data is sent to the interpolator 306, and the pitch period data of the sound source information data is sent to the pitch pulse generator 302.
The silent/silent discrimination data is supplied to a switch 304, and the sound source strength data is supplied to a variable gain amplifier 305.
補間器306は区分ごとに選択された代表フレームによ
るLSF係数列ならびにこの代表7レームによって指定
される分析フレームに関する情報にもとづいて区分ごと
の全分析フレームに関するLAF係数を補間、再生しこ
れt−L8F合成フィルタ307に供給しそのフィルタ
係数として利用せしめる。The interpolator 306 interpolates and reproduces the LAF coefficients for all analysis frames for each section based on the LSF coefficient sequence based on the representative frame selected for each section and the information regarding the analysis frame specified by these 7 representative frames. It is supplied to the synthesis filter 307 and used as its filter coefficient.
一方、切替器304は、入力した有声/無声/無音判別
データが有声を指定するときはピッチパルス発生器30
2の出力を、また無声もしくは無音を指定するときは雑
音発生器303の出力を可変利得増幅器305に供給せ
しめるように切替える。従ってド有声のときはピッチ周
期に対応した繰返し周波数のビヴチパルスが、また無声
もしくは無音のときは雑音発生器3030発生する白色
雑音がそれぞれ可変利得増幅器305に供給される。On the other hand, when the input voiced/unvoiced/silent discrimination data specifies voiced, the switch 304 switches the pitch pulse generator 30
The output of the noise generator 303 is switched so that the output of the noise generator 303 is supplied to the variable gain amplifier 305 when silent or no sound is specified. Therefore, when the signal is voiced, a bibchi pulse with a repetition frequency corresponding to the pitch period is supplied to the variable gain amplifier 305, and when there is no voice or no sound, white noise generated by the noise generator 3030 is supplied to the variable gain amplifier 305.
可変利得増幅器305は音源強匣データに対応した利得
設定を島てビッチノ偽スもしくは白色雑音を増幅したう
えこれらの駆動音源としてLSP合成フィルタ307に
供給し、かくしてL8F合成フィルタ307はディジタ
ル量の入力音声を再生し、このあとD/Aコ/バータ3
08.LPF309を介してアナログ量の音声として出
力される。The variable gain amplifier 305 uses a gain setting corresponding to the sound source data to amplify the bitch noise or white noise and supplies them as a driving sound source to the LSP synthesis filter 307. Thus, the L8F synthesis filter 307 inputs the digital quantity. Play the audio and then D/A/Bata 3
08. The signal is output as analog audio via the LPF 309.
このようにして第1図に示す区分的最適関数近似方法を
用いた可変長フレーム型ボコーダが実現できる。In this way, a variable length frame type vocoder using the piecewise optimal function approximation method shown in FIG. 1 can be realized.
第4図は第1図に示す区分的最適関数近似方法を利用し
、かつ分析データを蓄積しつつ入力音声を合成する音声
合成器の一実施例の構成を示すブロック図である。FIG. 4 is a block diagram showing the configuration of an embodiment of a speech synthesizer that uses the piecewise optimal function approximation method shown in FIG. 1 and synthesizes input speech while accumulating analysis data.
第4図に示す音声合成器4はメモリ310を除く他の構
成要素はすべて第3図に示す可変長フレームボコーダ合
成側3の同一記号のものと同一であるのでこれらに関す
る詳細な説明は省略する。All other components of the speech synthesizer 4 shown in FIG. 4 except for the memory 310 are the same as those of the variable length frame vocoder synthesis side 3 shown in FIG. 3 with the same symbols, so detailed explanations regarding these will be omitted. .
音声合成器4のメモリ310には予め設定した各種音声
資料に対して本発明による区分的最適関数近似を施して
得られた特徴パラメータと音源情報に関する符号化デー
タが蓄積されており、制御ライ/4001を介して受け
る読出しコマンド信号を入力するごとにこの読出しコマ
ンド信号によって指定された内容の音声資料に関する特
徴パラメータ情報と音源情報とを、デマルチプレクサ3
01に出力する。The memory 310 of the speech synthesizer 4 stores encoded data regarding feature parameters and sound source information obtained by subjecting preset various audio materials to piecewise optimal function approximation according to the present invention. Each time a read command signal received via the read command signal 4001 is input, the feature parameter information and sound source information regarding the audio material specified by the read command signal are sent to the demultiplexer 3.
Output to 01.
デマルチプレクサ301はこうして供給された入力デコ
ードし、特徴パラメータデータは補間器306に、また
音源情報のうちピッチ周期データはピッチパルス発生器
302に、有声/無声/無音判別データは切替器304
に、音源強度データは可変利得増幅器305にそれぞれ
供給され。The demultiplexer 301 decodes the thus supplied input, and sends the feature parameter data to the interpolator 306, the pitch period data of the sound source information to the pitch pulse generator 302, and the voiced/unvoiced/silence discrimination data to the switch 304.
Then, the sound source strength data is supplied to variable gain amplifiers 305, respectively.
切替器304は、入力する有声/無声/無音判別データ
が有声を指定するときピッチパルス発生器302の出力
を、また無声/無音を指定するときは雑音発生器303
の出力を可変利得増幅器305に供給するように切替え
る。The switch 304 outputs the output of the pitch pulse generator 302 when input voiced/unvoiced/silent discrimination data specifies voiced, and outputs the output of the pitch pulse generator 303 when input voiced/unvoiced/silent discrimination data specifies voiced/no voice.
is switched to supply the output of the variable gain amplifier 305 to the variable gain amplifier 305.
LSF合成フィルタ307は可変利得増幅器305の出
力を受けるとこれを駆動音源とし、また補間器306か
ら受ける特徴パラメータをフィト夕係数として動作し入
力音声信号を再生する。When the LSF synthesis filter 307 receives the output of the variable gain amplifier 305, it operates using this as a driving sound source and uses the characteristic parameters received from the interpolator 306 as a filter coefficient to reproduce the input audio signal.
このディジタル再生信号はD/Aコンバータ308゜L
PF3Q9を介して所望のアナログ量に変換され出力さ
れる。This digital reproduction signal is converted to a D/A converter 308°L.
It is converted into a desired analog quantity via PF3Q9 and output.
第4図に示す実施例において、メモリ310に蓄積され
る分析データは分析側において第1図に示す区分的最適
関数近似手段にもとづいて抽出された特徴パラメータを
利用するものであシ、本実施例においてはLSF係数列
を特徴パラメータとして利用している。In the embodiment shown in FIG. 4, the analysis data stored in the memory 310 uses feature parameters extracted on the analysis side based on the piecewise optimal function approximation means shown in FIG. In the example, an LSF coefficient sequence is used as a feature parameter.
第5図は第1図に示す区分的最適関数近似方法を利用し
て抽出した入力音声の特徴パラメータを用いる波形符号
化装置の一実施例の構成を示すブロック図である。第5
図に示す波形符号化装置5は区分的最適関数近似器1.
ノイズ重み付は器501、符号化復号化器502.補間
器503゜相関係数算出器504.自己相関係数算出器
505゜マルチパルス検索器506.符号化器507お
よびマルチプレクサ508を備えて構成され、これら構
成要素のうち区分的最適関数近似器1とマルチプレクサ
508以外の部分が区分的最適関数近似器1によって抽
出された特徴パラメータを利用して入力音声の波形符号
化を図る部分であり1本実施例ではこれらの構成要素に
よって音源波形としてのマルチパルスを公知の相関領域
評価手法を利用して求めている。FIG. 5 is a block diagram showing the configuration of an embodiment of a waveform encoding device that uses feature parameters of input speech extracted using the piecewise optimal function approximation method shown in FIG. 1. Fifth
The waveform encoding device 5 shown in the figure is a piecewise optimal function approximator 1.
Noise weighting unit 501, encoding/decoding unit 502. Interpolator 503° Correlation coefficient calculator 504. Autocorrelation coefficient calculator 505° multipulse searcher 506. It is configured with an encoder 507 and a multiplexer 508, and among these components, the parts other than the piecewise optimal function approximator 1 and the multiplexer 508 input using the feature parameters extracted by the piecewise optimal function approximator 1. This is a portion for encoding the waveform of speech, and in this embodiment, multipulses as a sound source waveform are obtained from these components using a known correlation region evaluation method.
入力音声は区分的最適関数近似器1とノイズ重み付は器
501とに供給される。The input speech is supplied to a piecewise optimal function approximator 1 and a noise weighter 501.
ノイズ重み付は器501は区分的最適関数近似器1によ
って抽出される特徴パラメータの次数や音声資料等にも
とづいて決定した伝達関数のノイズフィルタを有し区分
的最適関数近似器1の出力との畳み込み乗算を実施する
。The noise weighting device 501 has a noise filter with a transfer function determined based on the order of the feature parameters extracted by the piecewise optimal function approximator 1, audio materials, etc. Perform convolution multiplication.
区分的最適関数近似器1は所定の次数のLPC係数を区
分的最適関数近似方法によって抽出しこの特徴パラメー
タをノイズ重み付は器501に供給する。この特徴パラ
メータはまた符号化復号化器502にも供給されて符号
化されマルチプレクサ508に特徴パラメータデータと
して供給される。符号化された特徴パラメータはふたた
び復号化されたあと補間器503に供給される。Piecewise optimal function approximator 1 extracts LPC coefficients of a predetermined order by a piecewise optimal function approximation method, and supplies these feature parameters to noise weighting unit 501. This feature parameter is also supplied to an encoder/decoder 502, encoded, and supplied to a multiplexer 508 as feature parameter data. The encoded feature parameters are decoded again and then supplied to the interpolator 503.
補間器503は区分的最適関数近似器1から符号化復号
化器502を介して供給される特徴パラメータが区分ご
とに選択された代表分析7レームとこの代表分析フレー
ムによって指定される分析フレームの情報とを利用し特
徴パラメータを代表分析フレーム間で補間処理し分析7
レームごとに再生したあと声道フィルタのインパルスレ
スポンスを求めこれを相互相関係数算出器505と自己
相関係数算出器505とに供給する。The interpolator 503 uses the characteristic parameters supplied from the piecewise optimal function approximator 1 via the encoder/decoder 502 to represent seven representative analysis frames selected for each section and information on the analysis frame specified by this representative analysis frame. Interpolate the feature parameters between representative analysis frames using
After each frame is reproduced, the impulse response of the vocal tract filter is determined and supplied to a cross-correlation coefficient calculator 505 and an autocorrelation coefficient calculator 505.
相互相関係数算出器504はこうして供給される声道フ
ィルタのインパルスレスポンスとノイズ重み付は後の入
力音声データとの畳み込み積分を行なって両者の相互相
関をとり得られた相互相関係数をマルチパルス検索器5
04に供給する。The cross-correlation coefficient calculator 504 performs convolution integration of the impulse response of the vocal tract filter and the noise weighting supplied in this way with the subsequent input speech data, calculates the cross-correlation between the two, and multiplies the obtained cross-correlation coefficient. Pulse searcher 5
Supply on 04.
自己相関係数算出器505は補間器503から声道フィ
ルタのインパルスレスポンスに関するデータを受けると
この自己相関係数を計算しこれをマルチパルス検索器5
06に供給する。The autocorrelation coefficient calculator 505 receives data regarding the impulse response of the vocal tract filter from the interpolator 503, calculates this autocorrelation coefficient, and uses the multipulse searcher 5 to calculate the autocorrelation coefficient.
Supply to 06.
マルチパルス検索器506はこうして入力した相互相関
係数と自己相関係数とを利用し公知の相開領域評価にも
とづく手法によってマルチパルス列を検索しこれを符号
化器507によって符号化したうえこれを音源データと
してマルチプレクサ508に供給する。この音源データ
は音源波形情報そのものといってよく、このようにして
特徴パラメータを利用する波形符号化装置が実現できる
。The multi-pulse searcher 506 uses the thus input cross-correlation coefficients and auto-correlation coefficients to search for a multi-pulse train using a method based on publicly known phase-open region evaluation, encodes it in the encoder 507, and then encodes it. It is supplied to multiplexer 508 as sound source data. This sound source data can be said to be sound source waveform information itself, and in this way a waveform encoding device that utilizes characteristic parameters can be realized.
なお、この場合符号化すべき波形tiv報は特徴パラメ
ータから得られたマルチパルスを利用しているが他の波
形情報抽出手段、たとえば合成フィルタとは周波数応答
特性が逆なLPC逆なLPC逆フィルタを備え区分的最
適関数近似器1からLPGパラメータの供給を受けつつ
これと入力音声信号とによって残差信号を発生しこの波
形情報を符号化するなどの手段によっても同様に波形符
号化ができることは明らかである。In this case, the waveform information to be encoded uses the multi-pulse obtained from the feature parameters, but other waveform information extraction means, such as an LPC inverse filter whose frequency response characteristic is opposite to that of the synthesis filter, is used. It is clear that waveform encoding can be similarly performed by means such as receiving the LPG parameters from the piecewise optimal function approximator 1, generating a residual signal from this and the input audio signal, and encoding this waveform information. It is.
第6図は第1図に示す区分的最適関数近似方法を利用し
た圧縮Dr型単語音声認識装置の一実施例O構成を示す
ブロック図である。FIG. 6 is a block diagram showing the configuration of an embodiment of the compressed Dr type word speech recognition device using the piecewise optimal function approximation method shown in FIG.
第6図に示す圧縮DP型単語音声認識装置6は区分的最
大関数近似器1のほか切替器601.標準バタンメモリ
602.バタンマツチング器603および最小距離検索
器604を備えて構成される。The compressed DP type word speech recognition device 6 shown in FIG. 6 includes a piecewise maximum function approximator 1 as well as a switch 601. Standard button memory 602. It is configured to include a slam matcher 603 and a minimum distance searcher 604.
第6図に示す圧縮Dr型単語音声認識装置6は特定話者
の発する単語音声に関する特徴パラメータを標準パタ/
として予めストアしておきこれと入力する単語音声の特
徴パラメータのバタンマツチングを実施して入力単語音
声を認識するもので61>その基本動作は次のようであ
る。The compressed Dr type word speech recognition device 6 shown in FIG.
The basic operation is as follows.
すなわち1区分的最大関数近似器1は第1図によって示
した如く入力音声信号の分析フレームごとにLPG係数
を所定の次数で抽出しためと公知の手法でLSPパラメ
ータに変換し、このめとDr千手法よって7レーム圧縮
を予め設定する区分単位で実施する。このフレーム圧縮
は第1図によって説明した内容による近似処理を介して
求めている。こうして区分ごとに予め設定した最大数を
越えない代表フレームと、この代表7レームによって指
定される分析クレームの最適組合せが選択され、このよ
うにして得られた可変長7レームが先ず切替器6010
登鎌時の接続によって標準メタ/メモリ602にストア
される。That is, as shown in FIG. 1, the piecewise maximum function approximator 1 converts the LPG coefficients into LSP parameters using a known method in order to extract the LPG coefficients at a predetermined order for each analysis frame of the input audio signal, and converts them into LSP parameters using a known method. 7-frame compression is performed using a thousand methods in preset segment units. This frame compression is obtained through the approximation process explained in FIG. In this way, the optimal combination of representative frames that do not exceed the maximum number set in advance for each category and analysis claims specified by these 7 representative frames is selected, and the variable length 7 frames obtained in this way are first sent to the switch 6010.
It is stored in the standard meta/memory 602 depending on the connection made at the time of Kamai.
次に切替器601が認識側に切替られ特定話者が標準バ
タンメモリ602に内蔵されている単語音声を発すると
登録時と全く同じ処理を受けてバタンマツチング器60
3にLSPパラメータが供給される。Next, the switching device 601 is switched to the recognition side, and when the specific speaker utters the word sound stored in the standard bang memory 602, it undergoes exactly the same processing as at the time of registration, and the bang matching device 60
3 is supplied with LSP parameters.
バタンマツチング器603鉱スペクトル距離計測器や補
間器等を備え、区分的最大関数近似器1によって圧縮処
理された両人力の区分ごとの代表分析フレーム間に補間
値を設定しつつスペクトル距離計測器で両人力の特徴パ
ラメータパタノのスペクトル距離を予め設定する範囲の
対応点間で求め°これを全標準パタ/について実施した
あと次に最小距離検索器604に標準バタン指定番号と
ともに供給する。Battan matching device 603 is equipped with a spectral distance measuring device, an interpolator, etc., and is a spectral distance measuring device that sets interpolated values between representative analysis frames for each category of human power compressed by the piecewise maximum function approximator 1. After performing this for all standard patterns, the spectral distance of the characteristic parameter pattern for both hands is determined between corresponding points in a preset range, and then supplied to the minimum distance search unit 604 together with the standard pattern designation number.
最小距離検索器604はスペクトル距離が最小の標準バ
タンを選定しその指定番号を認識結果として出力、かく
して圧縮DP型単語音声認識処理が区分的最適関数近似
方法を利用して実現できる。The minimum distance searcher 604 selects the standard button with the minimum spectral distance and outputs its designated number as a recognition result, thus compressed DP type word speech recognition processing can be realized using the piecewise optimal function approximation method.
上述した第3〜第6図はいずれも第1図にょって説明し
た区分的最適関数近似方法を利用する装置であシこれに
よって処理量に比し再生品質の優れた効率のいい近似手
段を実現することができる。3 to 6 described above are all devices that utilize the piecewise optimal function approximation method explained with reference to FIG. It can be realized.
以上説明した如く本発明によれば、近似度対処理量の著
しい効果化が図れる区分的最適関数近似方法とその装置
が実現できるという効果がある。As explained above, according to the present invention, it is possible to realize a piecewise optimal function approximation method and apparatus that can significantly improve the degree of approximation versus processing amount.
第7図は第1図の実施例における区分的最適関数近似に
よる上記効果の一例を示す区分的最適関数近似特性図で
ある。FIG. 7 is a piecewise optimal function approximation characteristic diagram showing an example of the above effect due to the piecewise optimal function approximation in the embodiment of FIG.
第1図は本発明による区分的最適関数近似方法の一実施
例の構成を示すブロック図、第2図は本発明による区分
的最適関数近似方法を詳細に説明するための説明図、第
3図は第1図に示す区分的最適関数近似方法を利用した
可変長フレーム型ボコーダの一実施例の構成を示すブロ
ック図、第4図は第1図に示す区分的最適関数近似方法
を利用し、かつ分析データを蓄積しつつ入力音声を合成
する音声合成器の一実施例の構成を示すブロック図、第
5図は第1図に示す区分的最適関数近似方法を利用して
抽出した入力音声の特徴パラメータを用いる波形符号化
装置の一実施例の構成を示すブロック図、第6図は第1
図に示す区分的最適関数近似方法を利用した圧縮DP型
単語音声認識装置の一実施例のmgを示すブロック図、
第7図は第1図の実施例における区分的最適関数近似に
よる効果の一例を示す区分的最適関数近似特性図、第8
図は第1図に示すDrプロセッサ13の一例第8図に示
す補間器132の一例の詳細ブロック図である。
1・・・・・・区分的最適関数近似器、2・・・・・・
可変長フレームボコーダ分析側、3・・・・・・可変長
フレームボコーダ合成側、4・・・・・・音声合成器、
5・・・・・・波形符号化装置、6・・・・・・圧縮D
P型単語音声認識装置、11、・・・・・LAF分析器
、12・・・・・・パラメータメモリ、13・・・・・
・DP7四セッサ、14・・・・・・前区分選択パラメ
ータメモリ、201・・・・・・符号化器、202・・
・・・・符号化器、203・・・・・・マルチプレクサ
、3o1・・・・・・デマルチプレクサ、3o2・・・
・・・ピッチパルス発生器%303・・・・・・雑音発
生器、3o4・山・・切替器、305・・・・・・可変
利得増幅器、3o6・山・・補間器、307・・・・・
・LSP合成フィルタ、3o8・・・・・・D/Aコン
バータ、3o9・・・・・・LPF、310・・・・・
・メモ!7.501・川・・ノイズ重み付は器、5o2
・・・・・・符号化復号化器、5o3・・・・・・補間
器、5o4・・・・・・相互相関係数算出器、5o5・
・・・・・自己相関係数算出器、506・・・・・・マ
ルチパルス検索4ft、507・・・・・・符号化器、
508・山・・マルチプレクサ、6o1・・・・・・切
替器、602・川・・標準メタ/メモリ、6o3・・・
・・・バタンマツチング器、6o4・・・・・・最小距
離検索器、100・・・・・・音源情報分析器、131
・・・・・・時間歪算出器、132・・・・・・補間器
、133・・・・・・制御演算器、1311−1〜N・
・・・・・レジスタ、 1312−1〜N・山・・レジ
スタ、1313−1〜N・・・・・・減算器%1314
−1〜N・・・・・・掛算器、1315−1〜N・・・
・・・掛算器、1316・・・・・・アキ纂ムレータ。
1321−1〜N・川・・レジスタ、1322−1〜N
・・・・・ルシスタ、1323−1〜2・・・・・ルシ
スタ、1324−1〜N・・・・・・掛算器、1325
−1〜N・・・・・・掛算器、1326−1〜N・・・
・・・加算器、1327−1〜N・・・・・・掛算器、
1328・・・・・・加算器、1329・・・・・・R
OM、1330−1〜N・・・・・・レジスタ。
代理人 弁理士 内 原 晋 t′・−箔1図
′fJZ図
箔7 図
芳δ旧 Dβアa七ッ丈
箔9固 賄藺(算出器FIG. 1 is a block diagram showing the configuration of an embodiment of the piecewise optimal function approximation method according to the present invention, FIG. 2 is an explanatory diagram for explaining in detail the piecewise optimal function approximation method according to the present invention, and FIG. is a block diagram showing the configuration of an embodiment of a variable length frame type vocoder using the piecewise optimal function approximation method shown in FIG. 1, and FIG. FIG. 5 is a block diagram showing the configuration of an embodiment of a speech synthesizer that synthesizes input speech while accumulating analysis data. A block diagram showing the configuration of an embodiment of a waveform encoding device using feature parameters, FIG.
A block diagram showing an example of a compressed DP type word speech recognition device using the piecewise optimal function approximation method shown in the figure.
FIG. 7 is a piecewise optimal function approximation characteristic diagram showing an example of the effect of piecewise optimal function approximation in the embodiment of FIG.
The figure is a detailed block diagram of an example of the interpolator 132 shown in FIG. 8, which is an example of the Dr processor 13 shown in FIG. 1... Piecewise optimal function approximator, 2...
Variable length frame vocoder analysis side, 3...Variable length frame vocoder synthesis side, 4...Speech synthesizer,
5... Waveform encoding device, 6... Compression D
P-type word speech recognition device, 11... LAF analyzer, 12... Parameter memory, 13...
・DP7 four processors, 14... Previous section selection parameter memory, 201... Encoder, 202...
... Encoder, 203 ... Multiplexer, 3o1 ... Demultiplexer, 3o2 ...
...Pitch pulse generator %303...Noise generator, 3o4・mountain...switcher, 305...Variable gain amplifier, 3o6・mountain...interpolator, 307...・・・
・LSP synthesis filter, 3o8...D/A converter, 3o9...LPF, 310...
・Memo! 7.501・River・Noise weighted vessel, 5o2
... Encoder decoder, 5o3 ... Interpolator, 5o4 ... Cross correlation coefficient calculator, 5o5.
... Autocorrelation coefficient calculator, 506 ... Multi-pulse search 4ft, 507 ... Encoder,
508・Mountain...Multiplexer, 6o1...Switcher, 602・River...Standard meta/memory, 6o3...
...Bang matching device, 6o4...Minimum distance search device, 100...Sound source information analyzer, 131
. . . Time distortion calculator, 132 . . . Interpolator, 133 . . . Control calculator, 1311-1 to N.
...Register, 1312-1~N・mountain...Register, 1313-1~N...Subtractor%1314
-1~N... Multiplier, 1315-1~N...
... Multiplier, 1316 ... Accumulator. 1321-1~N River...Register, 1322-1~N
...Lucista, 1323-1~2...Lucista, 1324-1~N...Multiplier, 1325
-1~N... Multiplier, 1326-1~N...
...Adder, 1327-1~N... Multiplier,
1328...Adder, 1329...R
OM, 1330-1~N...Register. Agent Susumu Uchihara Patent attorney
Claims (1)
定区間の連続した特徴パラメータベクトルから前記所定
区間を代表する一部の特徴パラメータベクトルを選択す
ることによりフレーム周期を可変にする区分的最適関数
近似方法において、前記所定区間を傾斜区間長を可変と
し、非傾斜区間長を可変とする最適台形近似法を使用し
て一部の代表特徴パラメータベクトルにより近似し、且
つ前記代表特徴パラメータベクトルが代表するフレーム
区間を求めることを特徴とする区分的最適関数近似方法
。Piecewise optimal function approximation that varies the frame period by selecting some feature parameter vectors representative of the predetermined section from continuous feature parameter vectors in a predetermined section obtained by analyzing an input audio signal at a constant frame period. In the method, the predetermined section is approximated by some representative feature parameter vectors using an optimal trapezoidal approximation method in which a slope section length is variable and a non-slope section length is variable, and the representative feature parameter vector is representative. A piecewise optimal function approximation method characterized by determining a frame interval.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6131685 | 1985-03-26 | ||
JP60-61316 | 1985-03-26 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS62999A true JPS62999A (en) | 1987-01-06 |
JPH0736119B2 JPH0736119B2 (en) | 1995-04-19 |
Family
ID=13167623
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61069292A Expired - Lifetime JPH0736119B2 (en) | 1985-03-26 | 1986-03-26 | Piecewise optimal function approximation method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0736119B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02203398A (en) * | 1988-04-08 | 1990-08-13 | American Teleph & Telegr Co <Att> | Speech processing, synthesization and analysis method and apparatus |
JPH02204800A (en) * | 1988-04-08 | 1990-08-14 | American Teleph & Telegr Co <Att> | Speech processing and synthesization method and apparatus |
WO2003042648A1 (en) * | 2001-11-16 | 2003-05-22 | Matsushita Electric Industrial Co., Ltd. | Speech encoder, speech decoder, speech encoding method, and speech decoding method |
-
1986
- 1986-03-26 JP JP61069292A patent/JPH0736119B2/en not_active Expired - Lifetime
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02203398A (en) * | 1988-04-08 | 1990-08-13 | American Teleph & Telegr Co <Att> | Speech processing, synthesization and analysis method and apparatus |
JPH02204800A (en) * | 1988-04-08 | 1990-08-14 | American Teleph & Telegr Co <Att> | Speech processing and synthesization method and apparatus |
WO2003042648A1 (en) * | 2001-11-16 | 2003-05-22 | Matsushita Electric Industrial Co., Ltd. | Speech encoder, speech decoder, speech encoding method, and speech decoding method |
Also Published As
Publication number | Publication date |
---|---|
JPH0736119B2 (en) | 1995-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3557662B2 (en) | Speech encoding method and speech decoding method, and speech encoding device and speech decoding device | |
JPH06506070A (en) | Speech coder and method with spectral interpolation and fast codebook search | |
JPH06222797A (en) | Voice encoding system | |
US5295224A (en) | Linear prediction speech coding with high-frequency preemphasis | |
WO2003010752A1 (en) | Speech bandwidth extension apparatus and speech bandwidth extension method | |
US5488704A (en) | Speech codec | |
JP2954588B2 (en) | Audio encoding device, decoding device, and encoding / decoding system | |
CN101484937A (en) | Decoding of predictively coded data using buffer adaptation | |
WO2002071394A1 (en) | Sound encoding apparatus and method, and sound decoding apparatus and method | |
JPS62999A (en) | Zonal optimum function approximation | |
JP2615548B2 (en) | Highly efficient speech coding system and its device. | |
JP3088204B2 (en) | Code-excited linear prediction encoding device and decoding device | |
EP0162585B1 (en) | Encoder capable of removing interaction between adjacent frames | |
JP3299099B2 (en) | Audio coding device | |
JPS621000A (en) | Voice processor | |
JPS63118200A (en) | Multi-pulse encoding method and apparatus | |
JPS6162100A (en) | Multipulse type encoder/decoder | |
JP3112462B2 (en) | Audio coding device | |
JPS58188000A (en) | Voice recognition synthesizer | |
JP3010655B2 (en) | Compression encoding apparatus and method, and decoding apparatus and method | |
JP3192051B2 (en) | Audio coding device | |
JP3002299B2 (en) | Audio coding device | |
JPS61252600A (en) | Lsp type pattern matching vocoder | |
JPH03243999A (en) | Voice encoding system | |
JPH077275B2 (en) | Audio signal coding system and its equipment |