JP2016200750A - Encoding device, decoding device and method and program therefor - Google Patents
Encoding device, decoding device and method and program therefor Download PDFInfo
- Publication number
- JP2016200750A JP2016200750A JP2015081771A JP2015081771A JP2016200750A JP 2016200750 A JP2016200750 A JP 2016200750A JP 2015081771 A JP2015081771 A JP 2015081771A JP 2015081771 A JP2015081771 A JP 2015081771A JP 2016200750 A JP2016200750 A JP 2016200750A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- sequence
- coefficient
- encoding
- linear prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 120
- 238000001228 spectrum Methods 0.000 claims abstract description 268
- 238000004458 analytical method Methods 0.000 claims abstract description 66
- 108010076504 Protein Sorting Signals Proteins 0.000 claims abstract description 13
- 238000005314 correlation function Methods 0.000 claims abstract description 12
- 230000003595 spectral effect Effects 0.000 claims description 44
- 230000009466 transformation Effects 0.000 abstract 1
- 239000006185 dispersion Substances 0.000 description 65
- 238000009826 distribution Methods 0.000 description 35
- 238000010606 normalization Methods 0.000 description 31
- 238000012545 processing Methods 0.000 description 28
- 238000013139 quantization Methods 0.000 description 26
- 230000005236 sound signal Effects 0.000 description 21
- 238000006243 chemical reaction Methods 0.000 description 17
- 230000000737 periodic effect Effects 0.000 description 17
- 238000009499 grossing Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000008707 rearrangement Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000002087 whitening effect Effects 0.000 description 3
- 241000209094 Oryza Species 0.000 description 2
- 235000007164 Oryza sativa Nutrition 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 235000009566 rice Nutrition 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
この発明は、音信号等の時系列信号を符号化又は復号する技術に関する。 The present invention relates to a technique for encoding or decoding a time series signal such as a sound signal.
低ビット(例えば10kbit/s〜20kbit/s程度)の音信号の符号化方法として、DFT(離散フーリエ変換)やMDCT(変形離散コサイン変換)などの周波数領域での直交変換係数に対する適応符号化が知られている。例えば標準規格技術であるMEPG USAC(Unified Speech and Audio Coding)は、TCX(transform coded excitation:変換符号化励振)符号化モードを持ち、この中ではMDCT係数をフレームごとに正規化して量子化後に可変長符号化している(例えば、非特許文献1参照)。 As an encoding method for sound signals of low bits (for example, about 10 kbit / s to 20 kbit / s), adaptive encoding for orthogonal transform coefficients in the frequency domain such as DFT (Discrete Fourier Transform) and MDCT (Modified Discrete Cosine Transform) is available. Are known. For example, MEPG USAC (Unified Speech and Audio Coding), a standard technology, has a TCX (transform coded excitation) coding mode, in which MDCT coefficients are normalized for each frame and variable after quantization. Long encoding is performed (for example, see Non-Patent Document 1).
従来のTCXに基づく符号化装置の構成例を図1に示す。以下、図1の各部について説明する。 A configuration example of a conventional TCX-based encoding device is shown in FIG. Hereinafter, each part of FIG. 1 will be described.
<周波数領域変換部11>
周波数領域変換部11には、時間領域の時系列信号である音信号が入力される。音信号は、例えば音声信号又は音響信号である。
<Frequency domain converter 11>
A sound signal which is a time-series signal in the time domain is input to the frequency domain converter 11. The sound signal is, for example, an audio signal or an acoustic signal.
周波数領域変換部11は、所定の時間長のフレーム単位で、入力された時間領域の音信号を周波数領域のN点のMDCT係数列X(0),X(1),…,X(N-1)に変換する。Nは正の整数である。 The frequency domain transform unit 11 converts an input time domain sound signal into N frequency MDCT coefficient sequences X (0), X (1),..., X (N− Convert to 1). N is a positive integer.
変換されたMDCT係数列X(0),X(1),…,X(N-1)は、包絡正規化部14に出力される。
The converted MDCT coefficient sequences X (0), X (1),..., X (N−1) are output to the
<線形予測分析部12>
線形予測分析部12には、時間領域の時系列信号である音信号が入力される。
<Linear
The linear
線形予測分析部12は、フレーム単位で入力された音信号に対する線形予測分析を行うことにより、線形予測係数α1,α2,…,αpを生成する。また、線形予測分析部12は、生成された線形予測係数α1,α2,…,αpを符号化して線形予測係数符号を生成する。線形予測係数符号の例は線形予測係数α1,α2,…,αpに対応するLSP(Line Spectrum Pairs) パラメータ列の量子化値の列に対応する符号であるLSP符号である。pは2以上の整数である。
The linear
また、線形予測分析部12は、生成された線形予測係数符号に対応する線形予測係数である量子化線形予測係数^α1,^α2,…,^αpを生成する。
Further, the linear
生成された量子化線形予測係数^α1,^α2,…,^αpは、平滑化振幅スペクトル包絡系列生成部14及び非平滑化振幅スペクトル包絡系列生成部13に出力される。また、生成された線形予測係数符号は、復号装置に出力される。
The generated quantized linear prediction coefficients ^ α 1 , ^ α 2 ,..., ^ Α p are output to the smoothed amplitude spectrum envelope
線形予測分析には、例えば、フレーム単位で入力された音信号に対する自己相関を求めて、求めた自己相関を利用してLevinson-Durbinアルゴリズムを行うことにより線形予測係数を得る方法が用いられる。または、線形予測分析部12に周波数領域変換部11が求めたMDCT係数列を入力し、MDCT係数列の各係数の自乗値の系列を逆フーリエ変換したものに対して、Levinson-Durbinアルゴリズムを行うことにより線形予測係数を得る方法を用いてもよい。
For the linear prediction analysis, for example, a method of obtaining a linear prediction coefficient by obtaining an autocorrelation for a sound signal input in units of frames and performing a Levinson-Durbin algorithm using the obtained autocorrelation is used. Alternatively, the MDCT coefficient sequence obtained by the frequency domain conversion unit 11 is input to the linear
<平滑化振幅スペクトル包絡系列生成部14>
平滑化振幅スペクトル包絡系列生成部14には、線形予測分析部12が生成した量子化線形予測係数^α1,^α2,…,^αpが入力される。
<Smoothing Amplitude Spectrum Envelope Sequence Generation
Quantized linear prediction coefficients ^ α 1 , ^ α 2 ,..., ^ Α p generated by the linear
平滑化振幅スペクトル包絡系列生成部14は、量子化線形予測係数^α1,^α2,…,^αpを用いて、以下の式(B1)により定義される平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)を生成する。・を実数としてexp(・)はネイピア数を底とする指数関数、jは虚数単位である。γは、1以下の正の定数であり、以下の式(B2)により定義される振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)の振幅の凹凸を鈍らせる係数、言い換えれば振幅スペクトル包絡系列を平滑化する係数である。
The smoothed amplitude spectrum envelope
生成された平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)は、包絡正規化部15と符号化部16の分散パラメータ決定部163に出力される。
The generated smoothed amplitude spectrum envelope sequences ^ Wγ (0), ^ Wγ (1),..., ^ Wγ (N-1) are the
<非平滑化振幅スペクトル包絡系列生成部13>
非平滑化振幅スペクトル包絡系列生成部13には、線形予測分析部12が生成した量子化線形予測係数^α1,^α2,…,^αpが入力される。
<Non-smoothed amplitude spectrum envelope
The textured amplitude spectral envelope
非平滑化振幅スペクトル包絡系列生成部13は、量子化線形予測係数^α1,^α2,…,^αpを用いて、上記の式(B2)により定義される非平滑化振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)を生成する。
The non-smoothed amplitude spectrum envelope
生成された非平滑化振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)は、符号化部16の分散パラメータ決定部163に出力される。
The generated non-smoothed amplitude spectrum envelope sequences ^ W (0), ^ W (1),..., ^ W (N-1) are output to the dispersion
<包絡正規化部15>
包絡正規化部15には、周波数領域変換部11が生成したMDCT係数列X(0),X(1),…,X(N-1)及び平滑化振幅スペクトル包絡系列生成部14が出力した平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)が入力される。
<
The
包絡正規化部15は、MDCT係数列の各係数X(k)を平滑化振幅スペクトル包絡系列の各値^Wγ(k)で正規化することにより、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)を生成する。つまり、XN(k)= X(k)/^Wγ(k) [k=0,1,…,N-1]である。
生成された正規化MDCT係数列XN(0),XN(1),…,XN(N-1)は、符号化部16に出力される。
The generated normalized MDCT coefficient sequences X N (0), X N (1),..., X N (N−1) are output to the
ここでは、聴覚的に歪が小さくなるような量子化の実現のために、包絡正規化部15は、振幅スペクトル包絡を鈍らせた系列である平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)を用いて、フレーム単位でMDCT係数列X(0),X(1),…,X(N-1)を正規化している。
Here, in order to realize quantization that audibly reduces distortion, the
<符号化部16>
符号化部16には、包絡正規化部15が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)、平滑化振幅スペクトル包絡系列生成部14が出力した平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)、非平滑化振幅スペクトル包絡系列生成部13が出力した非平滑化振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)が入力される。
<
The
符号化部16は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)に対応する符号を生成する。
The
生成された正規化MDCT係数列XN(0),XN(1),…,XN(N-1)に対応する符号は、復号装置に出力される。 Codes corresponding to the generated normalized MDCT coefficient sequences X N (0), X N (1),..., X N (N−1) are output to the decoding device.
正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数を利得(グローバルゲイン)gで割り算し、その結果を量子化した整数値による系列である量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を符号化して得られる符号を整数信号符号とする。非特許文献1の技術では、符号化部16は、この整数信号符号のビット数が、予め配分されたビット数である配分ビット数B以下、かつ、なるべく大きな値となるような利得gを決定する。そして、符号化部16は、この決定された利得gに対応する利得符号と、この決定された利得gに対応する整数信号符号とを生成する。
A sequence of integer values obtained by dividing the coefficients of normalized MDCT coefficient sequences X N (0), X N (1), ..., X N (N-1) by gain (global gain) g and quantizing the result A code obtained by encoding the quantized normalized coefficient series X Q (0), X Q (1),..., X Q (N−1) is an integer signal code. In the technique of Non-Patent
この生成された利得符号及び整数信号符号が、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)に対応する符号として復号装置に出力される。 The generated gain code and integer signal code are output to the decoding apparatus as codes corresponding to the normalized MDCT coefficient sequence X N (0), X N (1),..., X N (N−1).
[符号化部16が行う符号化処理の具体例]
符号化部16が行う符号化処理の具体例について説明する。
[Specific Example of Encoding Process Performed by Encoding Unit 16]
A specific example of the encoding process performed by the
符号化部16の具体例の構成例を図2に示す。符号化部16は、図2に示すように、利得取得部161と、量子化部162と、分散パラメータ決定部168と、算術符号化部169と、利得符号化部165と、判定部166と、利得更新部167とを例えば備えている。以下、図2の各部について説明する。
A configuration example of a specific example of the
<利得取得部161>
利得取得部161は、入力された正規化MDCT係数列XN(0),XN(1),…,XN(N-1)から、整数信号符号のビット数が、予め配分されたビット数である配分ビット数B以下、かつ、なるべく大きな値となるようなグローバルゲインgを決定して出力する。利得取得部161が得たグローバルゲインgは、量子化部162で用いられるグローバルゲインの初期値となる。
<Gain
The
<量子化部162>
量子化部162は、入力された正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数を利得取得部161または利得更新部167が得たグローバルゲインgで割り算した結果の整数部分による系列である量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を得て出力する。
<Quantization unit 162>
The quantization unit 162 obtains each coefficient of the input normalized MDCT coefficient sequence X N (0), X N (1),..., X N (N−1) by the
ここで、量子化部162が初回に実行される際に用いられるグローバルゲインgは、利得取得部161が得たグローバルゲインg、すなわちグローバルゲインの初期値である。また、量子化部162が2回目以降に実行される際に用いられるグローバルゲインgは、利得更新部167が得たグローバルゲインg、すなわちグローバルゲインの更新値である。
Here, the global gain g used when the quantization unit 162 is executed for the first time is the global gain g obtained by the
<分散パラメータ決定部163>
分散パラメータ決定部163は、入力された非平滑化振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)と、入力された平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)とから、下記の式(B3)により各周波数に対する分散パラメータφ(0),φ(1),…,φ(N-1)を得て出力する。
<Dispersion
The dispersion
<算術符号化部164>
算術符号化部164は、分散パラメータ決定部163が得た分散パラメータφ(0),φ(1),…,φ(N-1)を用いて、量子化部162が得た量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を算術符号化して整数信号符号を得て、整数信号符号と、整数信号符号のビット数である消費ビット数Cとを出力する。この算術符号は、各周波数k(=0,…,N-1)での量子化正規化済係数系列が以下の確率変数Xに関する例えば以下の式で示されるラプラス分布に従っているときに最適になるようなビットの割り当てを行う。
<
The
<判定部166>
判定部166は、利得の更新回数が予め定めた回数の場合には、整数信号符号を出力するとともに、利得符号化部165に対し利得更新部167が得たグローバルゲインgを符号化する指示信号を出力し、利得の更新回数が予め定めた回数未満である場合には、利得更新部167に対し、算術符号化部164が計測した消費ビット数Cを出力する。
<Determining
The
<利得更新部167>
利得更新部167は、算術符号化部164が計測した消費ビット数Cが配分ビット数Bより多い場合にはグローバルゲインgの値を大きな値に更新して出力し、消費ビット数Cが配分ビット数Bより少ない場合にはグローバルゲインgの値を小さな値に更新し、更新後のグローバルゲインgの値を出力する。
<
When the number of consumed bits C measured by the
<利得符号化部165>
利得符号化部165は、判定部166が出力した指示信号に従って、利得更新部167が得たグローバルゲインgを符号化して利得符号を得て出力する。
<
The
判定部166が出力した整数信号符号と、利得符号化部165が出力した利得符号は、正規化MDCT係数列に対応する符号として、復号装置に出力される。
The integer signal code output from the
以上のように、従来のTCXに基づく符号化では、非平滑化振幅スペクトル包絡を鈍らせた平滑化振幅スペクトル包絡系列を用いてMDCT係数列を正規化した後、正規化MDCT係数列を符号化している。この符号化方法は、上記のMPEG-4 USACなどで採用されている。 As described above, in the coding based on the conventional TCX, after normalizing the MDCT coefficient sequence using the smoothed amplitude spectrum envelope sequence in which the non-smoothed amplitude spectrum envelope is blunted, the normalized MDCT coefficient sequence is encoded. ing. This encoding method is employed in the above MPEG-4 USAC and the like.
従来の符号化装置では、算術符号によりラプラス分布に対して最適なビット割り当てを行っていた。そして、スペクトル包絡の凹凸の情報を算術符号化時に利用するため、上記のラプラス分布の分散に対応する分散パラメータを包絡の値から生成している。しかし、符号化対象の属する確率分布には多様性があり、一概にラプラス分布に従っているというわけではない。このように、仮定から外れた分布に属する符号化対象に対して同様なビット割り当てを行うと、圧縮効率は低下する可能性がある。また、他の分布を導入する際にも、従来の符号化装置と同様、その分布に対する分散パラメータを生成し、スペクトル包絡の凹凸の情報を正しく組み込まなければ効率を改善することは困難である。 In the conventional coding apparatus, optimal bit allocation is performed for the Laplace distribution by arithmetic codes. Then, in order to use the information on the unevenness of the spectrum envelope at the time of arithmetic coding, a dispersion parameter corresponding to the dispersion of the Laplace distribution is generated from the envelope value. However, there is diversity in the probability distribution to which the encoding target belongs, and it does not generally follow the Laplace distribution. As described above, if the same bit allocation is performed on the encoding target belonging to the distribution deviating from the assumption, the compression efficiency may be lowered. Also, when other distributions are introduced, it is difficult to improve efficiency unless a dispersion parameter is generated for the distributions and information on the unevenness of the spectrum envelope is correctly incorporated, as in the case of a conventional encoding device.
本発明は、従来よりも効率の良い符号化又は復号を行うことができる符号化装置、復号装置、これらの方法及びプログラムを提供することを目的とする。 It is an object of the present invention to provide an encoding device, a decoding device, and a method and program thereof that can perform encoding or decoding more efficiently than conventional methods.
本発明の一態様による符号化装置によれば、時系列信号を周波数領域で符号化する符号化装置であって、ηを正の数として、時系列信号に対応する周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做した逆フーリエ変換を行うことにより得られる疑似相関関数信号列に対して線形予測分析を行い線形予測係数に変換可能な係数及び予測残差のエネルギーを得る線形予測分析部と、線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列を得ることによりスペクトル包絡の推定を行う非平滑化スペクトル包絡系列生成部と、予測残差のエネルギーの平方根をモデルパラメータとして、推定されたスペクトル包絡及びモデルパラメータに応じた情報を基に実質的にビット割り当てが変わる符号化を時系列信号に対応する周波数領域サンプル列の各係数に対して行う符号化部と、モデルパラメータに応じた情報を表すモデルパラメータ情報符号を得るモデルパラメータ情報符号化部と、を備えている。 According to the encoding apparatus according to one aspect of the present invention, an encoding apparatus that encodes a time-series signal in the frequency domain, where η is a positive number, and an absolute value of a frequency-domain sample sequence corresponding to the time-series signal Linear prediction that obtains the energy of coefficients and prediction residuals that can be converted into linear prediction coefficients by performing linear prediction analysis on the pseudo correlation function signal sequence obtained by performing inverse Fourier transform with the power of η as the power spectrum A non-smoothed spectral envelope that estimates a spectral envelope by obtaining a non-smoothed spectral envelope sequence that is a series obtained by raising an amplitude spectral envelope sequence corresponding to a coefficient that can be converted into a linear prediction coefficient to the 1 / η power Based on the estimated spectral envelope and the information corresponding to the model parameter, the series generator and the square root of the energy of the prediction residual are used as model parameters. A coding unit that performs coding with different allocations on each coefficient of a frequency domain sample sequence corresponding to a time-series signal, a model parameter information coding unit that obtains a model parameter information code representing information according to model parameters, It is equipped with.
本発明の一態様による復号装置によれば、周波数領域での復号により時系列信号に対応する周波数領域サンプル列を得る復号装置であって、入力された線形予測係数符号を復号して線形予測係数に変換可能な係数を得る線形予測係数復号部と、入力されたモデルパラメータ符号を復号してモデルパラメータに応じた情報を得るモデルパラメータ情報復号部と、ηを所定の正の数として、線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列を得る非平滑化スペクトル包絡系列生成部と、非平滑化スペクトル包絡系列及びモデルパラメータに応じた情報に基づいて実質的に変わるビット割り当てに従って、入力された整数信号符号の復号を行うことにより時系列信号に対応する周波数領域サンプル列を得る復号部と、を備えている。 According to the decoding device according to one aspect of the present invention, a decoding device that obtains a frequency domain sample sequence corresponding to a time-series signal by decoding in the frequency domain, and decodes an input linear prediction coefficient code to generate a linear prediction coefficient A linear prediction coefficient decoding unit that obtains a coefficient that can be converted into a model parameter, a model parameter information decoding unit that decodes an input model parameter code to obtain information according to the model parameter, and linear prediction using η as a predetermined positive number A non-smoothed spectrum envelope sequence generation unit for obtaining a non-smoothed spectrum envelope sequence that is a sequence obtained by raising the amplitude spectrum envelope sequence corresponding to a coefficient that can be converted into a coefficient to the 1 / η power, and a non-smoothed spectrum envelope sequence and model parameters Corresponding to the time series signal by decoding the input integer signal code according to the bit allocation which changes substantially based on the information according to the And a decoding unit for obtaining a frequency domain sample sequence.
従来よりも効率の良い符号化又は復号を行うことができる。 Encoding or decoding can be performed more efficiently than in the past.
[技術的背景]
平滑化振幅スペクトル包絡によるMDCT系列X(0),X(1),…,X(N-1)の正規化は、非平滑化振幅スペクトル包絡系列による正規化よりもMDCT系列X(0),X(1),…,X(N-1)を白色化しない。具体的には、MDCT係数列X(0),X(1),…,X(N-1)を平滑化振幅スペクトル包絡系列^Wγ(0),^Wγ(1),…,^Wγ(N-1)で正規化して得られる正規化MDCT係数列XN(0)=X(0)/^Wγ(0),XN(1)=X(1)/^Wγ(1),…,XN(N-1)=X(N-1)/^Wγ(N-1)は、MDCT係数列X(0),X(1),…,X(N-1)を非平滑化振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)で正規化して得られる正規化後の系列X(0)/^W(0),X(1)/^W(1),…,X(N-1)/^W(N-1)よりも、^W(0)/^Wγ(0),^W(1)/^Wγ(1),…,^W(N-1)/^Wγ(N-1)だけ凸凹が大きい。したがって、MDCT係数列X(0),X(1),…,X(N-1)を非平滑化振幅スペクトル包絡系列^W(0),^W(1),…,^W(N-1)で正規化して得られる正規化後の系列X(0)/^W(0),X(1)/^W(1), …,X(N-1)/^W(N-1)が符号化部16における符号化に適する程度に包絡の凸凹が平坦にされたものとすると、符号化部16に入力される正規化MDCT係数列XN(0),XN(1),…,XN(N-1)には、^W(0)/^Wγ(0),^W(1)/^Wγ(1),…,^W(N-1)/^Wγ(N-1)の系列(以下、正規化振幅スペクトル包絡系列^WN(0),^WN(1),…,^WN(N-1))で表される包絡の凹凸が残されている。
[Technical background]
Normalization of MDCT sequence X (0), X (1), ..., X (N-1) with smoothed amplitude spectrum envelope is more accurate than MDCT sequence X (0), X (1), ..., X (N-1) is not whitened. Specifically, MDCT coefficient sequences X (0), X (1), ..., X (N-1) are smoothed amplitude spectrum envelope sequences ^ W γ (0), ^ W γ (1), ..., ^ Normalized MDCT coefficient sequence X N (0) = X (0) / ^ W γ (0), X N (1) = X (1) / ^ W γ obtained by normalizing with W γ (N-1) (1), ..., X N (N-1) = X (N-1) / ^ W γ (N-1) is the MDCT coefficient sequence X (0), X (1), ..., X (N- Normalized sequence X (0) / ^ W () obtained by normalizing 1) with unsmoothed amplitude spectrum envelope sequence ^ W (0), ^ W (1), ..., ^ W (N-1) Than 0), X (1) / ^ W (1), ..., X (N-1) / ^ W (N-1), ^ W (0) / ^ W γ (0), ^ W (1 ) / ^ W γ (1),…, ^ W (N-1) / ^ W γ (N-1) is large. Therefore, the MDCT coefficient sequence X (0), X (1), ..., X (N-1) is transformed into the unsmoothed amplitude spectrum envelope sequence ^ W (0), ^ W (1), ..., ^ W (N- Normalized sequence X (0) / ^ W (0), X (1) / ^ W (1),…, X (N-1) / ^ W (N-1 ) Is an envelope irregularity flattened to an extent suitable for encoding in the
図16に正規化MDCT系列の包絡の凹凸^W(0)/^Wγ(0),^W(1)/^Wγ(1),…,^W(N-1)/^Wγ(N-1)が各値をとる場合における、正規化MDCT係数列に含まれる各係数の値の出現頻度を示す。envelope:0.2-0.3の曲線は、正規化MDCT系列の包絡の凹凸^W(k)/^Wγ(k)が0.2以上0.3未満であるサンプルkに対応する正規化MDCT係数XN(k)の値の頻度を表す。envelope:0.3-0.4の曲線は、正規化MDCT系列の包絡の凹凸^W(k)/^Wγ(k)が0.3以上0.4未満であるサンプルkに対応する正規化MDCT係数XN(k)の値の頻度を表す。envelope:0.4-0.5の曲線は、正規化MDCT系列の包絡の凹凸^W(k)/^Wγ(k)が0.4以上0.5未満であるサンプルkに対応する正規化MDCT係数XN(k)の値の頻度を表す。 Fig. 16 shows the envelope irregularities of the normalized MDCT sequence ^ W (0) / ^ Wγ (0), ^ W (1) / ^ Wγ (1),…, ^ W (N-1) / ^ Wγ The frequency of appearance of the value of each coefficient included in the normalized MDCT coefficient sequence when (N-1) takes each value is shown. envelope: The curve of 0.2-0.3 is the normalized MDCT coefficient X N (k) corresponding to sample k where the irregularity of the normalized MDCT sequence ^ W (k) / ^ Wγ (k) is 0.2 or more and less than 0.3 Represents the frequency of the values. envelope: The curve of 0.3-0.4 is the normalized MDCT coefficient X N (k) corresponding to the sample k whose envelope irregularities ^ W (k) / ^ Wγ (k) of the normalized MDCT sequence is 0.3 or more and less than 0.4 Represents the frequency of the values. envelope: The curve of 0.4-0.5 is the normalized MDCT coefficient X N (k) corresponding to the sample k whose envelope irregularity ^ W (k) / ^ Wγ (k) is 0.4 or more and less than 0.5 Represents the frequency of the values.
図16を見ると、正規化MDCT係数列に含まれる各係数の値は、平均はほぼ0であるが、分散は包絡の値と関連性をもつことがわかる。すなわち、正規化MDCT系列の包絡の凹凸が大きいほど、頻度を表す曲線の裾野が広がっているため、正規化MDCT系列の包絡の凹凸が大きいことは正規化MDCT係数の値の分散が大きいということと関連性があることがわかる。より効率的な圧縮を実現するため、この関連性を利用した符号化を行う。具体的には、符号化の対象となる周波数領域係数列の各係数に対して、スペクトル包絡を基に実質的にビット割り当てが変わる符号化を行う。 Referring to FIG. 16, it can be seen that the average value of each coefficient included in the normalized MDCT coefficient sequence is almost 0, but the variance is related to the envelope value. That is, the larger the envelope unevenness of the normalized MDCT sequence, the wider the base of the curve representing the frequency. It is clear that there is a relationship. In order to realize more efficient compression, encoding using this relationship is performed. Specifically, encoding in which the bit allocation is substantially changed based on the spectrum envelope is performed on each coefficient of the frequency domain coefficient sequence to be encoded.
そのために、例えば量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を算術符号化する場合には、スペクトル包絡に基づいて決定された分散パラメータを用いる。 For this reason, for example, when the quantized normalized coefficient series X Q (0), X Q (1),..., X Q (N-1) is arithmetically encoded, the variance determined based on the spectrum envelope is used. Use parameters.
また、符号化対象の属する確率分布には多様性があるところ、ある確率分布(例えば、ラプラス分布)に属する符号化対象を仮定した最適なビット割り当てを、その仮定から外れた確率分布に属する符号化対象に対して行うと、圧縮効率は低下する可能性がある。 In addition, since there is diversity in the probability distribution to which the encoding target belongs, an optimal bit allocation assuming the encoding target belonging to a certain probability distribution (for example, Laplace distribution) is assigned to a code belonging to the probability distribution that deviates from the assumption. If it is performed on the conversion target, the compression efficiency may decrease.
そこで、符号化対象の属する確率分布として、様々な確率分布を表現することができる分布である、以下の式で表される一般化ガウス分布を使用する。 Therefore, a generalized Gaussian distribution represented by the following equation, which is a distribution that can express various probability distributions, is used as the probability distribution to which the encoding target belongs.
一般化ガウス分布は形状パラメータであるパラメータη(>0)を変えることにより、図3のようにη=1の時はラプラス分布、η=2の時はガウス分布、といったように様々な分布を表現することができる。ηは、0より大きい所定の数である。ηの値は、予め決めておくか、または所定の時間区間であるフレーム毎に選択又は可変にしてもよい。また、上式のφは分布の分散に対応している値であり、この値を分散パラメータとして、スペクトル包絡の凹凸の情報を組み込む。つまり、分散パラメータφ(0),φ(1),…,φ(N-1)をスペクトル包絡から生成し、各周波数kでの量子化正規化済係数XQ(k)に対して、fGG(X|φ(k),η)に従う場合に最適となるような算術符号を構成し、この構成に基づく算術符号により符号化を行う。 In the generalized Gaussian distribution, by changing the parameter η (> 0) which is a shape parameter, various distributions such as a Laplace distribution when η = 1 and a Gaussian distribution when η = 2 as shown in FIG. Can be expressed. η is a predetermined number greater than zero. The value of η may be determined in advance, or may be selected or varied for each frame that is a predetermined time interval. Also, φ in the above equation is a value corresponding to the dispersion of the distribution, and information on the unevenness of the spectrum envelope is incorporated using this value as a dispersion parameter. That is, the dispersion parameters φ (0), φ (1),..., Φ (N−1) are generated from the spectrum envelope, and for the quantized normalized coefficient X Q (k) at each frequency k, f An arithmetic code that is optimal when GG (X | φ (k), η) is followed is configured, and encoding is performed using the arithmetic code based on this configuration.
例えば、予測残差のエネルギーσ2及びグローバルゲインgの情報に加えて使用する分布の情報を更に取り入れ、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数に対する分散パラメータを例えば以下の式(A1)で算出する。 For example, in addition to the information of the prediction residual energy σ 2 and the global gain g, information on the distribution to be used is further incorporated, and the quantized normalized coefficient series X Q (0), X Q (1) ,. For example, the dispersion parameter for each coefficient of (N-1) is calculated by the following equation (A1).
ただし、モデルパラメータσは、予測残差のエネルギーσ2の平方根である。 However, the model parameter σ is the square root of the energy σ 2 of the prediction residual.
具体的には、Levinson-DurbinアルゴリズムをMDCT係数の絶対値をη乗した値の系列を逆フーリエ変換したものに対して行い、それにより得られる線形予測係数を量子化したものであるβ1,^β2,…,^βpを量子化線形予測係数^α1,^α2,…,^αpの代わりに用い、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)をそれぞれ下記の式(A2)と式(A3) Specifically, the Levinson-Durbin algorithm is performed on the inverse Fourier transform of a series of values obtained by raising the absolute value of the MDCT coefficient to the power of η, and the resulting linear prediction coefficient is quantized β 1 , ^ β 2 ,…, ^ β p is used in place of the quantized linear prediction coefficients ^ α 1 , ^ α 2 ,…, ^ α p and the unsmoothed amplitude spectrum envelope sequence ^ H (0), ^ H (1 ), ..., ^ H (N-1) and smoothed amplitude spectrum envelope sequence ^ H γ (0), ^ H γ (1),…, ^ H γ (N-1) And formula (A3)
から求め、求めた非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)の各係数を対応する平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)の各係数で除算して正規化振幅スペクトル包絡系列^HN(0)=^H(0)/^Hγ(0),^HN(1)=^H(1)/^Hγ(1),…,^HN(N-1)=^H(N-1)/^Hγ(N-1)を得て、正規化振幅スペクトル包絡系列とグローバルゲインgとから上記の式(A1)により分散パラメータを算出する。 Unsmoothed amplitude spectrum envelope series ^ H (0), ^ H (1),…, ^ H (N-1) coefficients corresponding to the smoothed amplitude spectrum envelope series ^ Hγ (0 ), ^ H γ (1),…, ^ H γ (N-1) divided by the coefficients, normalized amplitude spectrum envelope sequence ^ H N (0) = ^ H (0) / ^ H γ (0 ), ^ H N (1) = ^ H (1) / ^ H γ (1),…, ^ H N (N-1) = ^ H (N-1) / ^ H γ (N-1) Then, the dispersion parameter is calculated from the normalized amplitude spectrum envelope sequence and the global gain g by the above equation (A1).
ここで、実際の観測から得られる式(A1)のσ2/η/gの値はばらつきが存在するので、この発明では、所定の時間区間であるフレームごとにσ2/η/gを可変とする。σ2/η/gを考慮することでより精度の高い分散パラメータの割り当てが可能となり、更に効率の良い符号化又は復号を実現することができる。そのために、後述するように、符号化装置はモデルパラメータσに応じた情報を復号装置に送信する。 Here, since the value of σ 2 / η / g in the equation (A1) obtained from actual observation varies, in the present invention, σ 2 / η / g is variable for each frame in a predetermined time interval. And By considering σ 2 / η 2 / g, it is possible to assign a more accurate dispersion parameter, and it is possible to realize more efficient encoding or decoding. Therefore, as will be described later, the encoding apparatus transmits information corresponding to the model parameter σ to the decoding apparatus.
上記技術は、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を算術符号化する際の符号長を規準とする最小化問題に基づくものである。以下に上記技術の導出を述べる。 The above technique is based on the minimization problem based on the code length when the quantized normalized coefficient sequence X Q (0), X Q (1), ..., X Q (N-1) is arithmetically coded. Is. The derivation of the above technique is described below.
量子化正規化済係数XQ(k)をそれぞれ分散パラメータφ(k)により、形状パラメータηの一般化ガウス分布を用いた算術符号で符号化した際の符号長は、量子化が十分細かく行われたとすると、 The code length when the quantized normalized coefficient X Q (k) is encoded by the arithmetic code using the generalized Gaussian distribution of the shape parameter η by the dispersion parameter φ (k) is sufficiently finely quantized. Assuming
に比例する。この符号長を小さくするため、既に量子化及び符号化がなされている線形予測係数を基に分散パラメータ系列φ(0),φ(1),…,φ(N-1)を求めるとする。上の式(A4)は、式変形を行うことにより、 Is proportional to In order to reduce the code length, it is assumed that the dispersion parameter sequence φ (0), φ (1),..., Φ (N−1) is obtained based on the linear prediction coefficients that have already been quantized and encoded. The above equation (A4) is transformed into
と書き直すことができる。ただし、lnはネイピア数を底とする対数、Cは分散パラメータに対する定数、そして DIS(X|Y)はYからのXの板倉斎藤距離 Can be rewritten. Where ln is the logarithm based on the number of Napiers, C is a constant for the dispersion parameter, and D IS (X | Y) is the distance from Y to Itakura Saito
であるものとする。つまり、分散パラメータ系列に対する符号長Lの最小化問題はφη(k)/(ηBη(η))と|XQ(k)|ηとの板倉斎藤距離の総和の最小化問題に帰着される。ここで、分散パラメータ系列φ(0),φ(1),…,φ(N-1)と線形予測係数β1,β2,…,βp、予測残差のエネルギーσ2との対応関係を一つ決めれば、符号長を最小化する線形予測係数を求める最適化問題を立てることができるが、従来の高速解法を用いるためにここでは次のように対応付ける。 Suppose that That is, the minimization problem of code length L for distributed parameter sequence is φ η (k) / (ηB η (η)) and | is reduced to minimize problems of the sum of Itakura Saito distance between η | X Q (k) The Here, the dispersion parameter sequence φ (0), φ (1 ), ..., φ (N-1) and the linear prediction coefficients β 1, β 2, ..., β p, correspondence between the energy sigma 2 prediction residual If one is determined, an optimization problem for obtaining a linear prediction coefficient that minimizes the code length can be established. However, in order to use a conventional fast solution, the following correspondence is made.
量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)は量子化の影響を無視すると、MDCT系列X(0),X(1),…,X(N-1)と平滑化振幅スペクトル包絡^Hγ(0), ^Hγ(1),…, ^Hγ(N-1)、グローバルゲインgを用いてそれぞれXQ(k)= X(k)/(g^Hγ(k))とあらわすことができることから、式(A5)の分散パラメータに依存する項は式(A6)により、 Quantized normalized coefficient series X Q (0), X Q (1), ..., X Q (N-1) ignore the influence of quantization, MDCT series X (0), X (1), ... , X (N-1) and smoothed amplitude spectrum envelope ^ Hγ (0), ^ Hγ (1),…, ^ Hγ (N-1), respectively, using global gain g, X Q (k) = X (k) / (g ^ H γ (k)), the term that depends on the dispersion parameter in equation (A5) is
のように、MDCT係数系列の絶対値と全極型のスペクトル包絡との板倉斎藤距離としてあらわされる。従来の線形予測分析、つまりパワースペクトルを逆フーリエ変換したものに対してLevinson-Durbinアルゴリズムを適用するものは、パワースペクトルと全極型のスペクトル包絡との板倉斎藤距離を最小化する線形予測係数を求める操作であることが知られている。したがって、上記の符号長最小化問題は、振幅スペクトルのη乗、つまりMDCT係数系列の絶対値のη乗を逆フーリエ変換したものに対してLevinson-Durbinアルゴリズムを適用することにより従来法と同様に最適解を求めることができる。 As shown, it is expressed as the Itakura Saito distance between the absolute value of the MDCT coefficient series and the all-pole spectral envelope. The conventional linear prediction analysis, that is, applying the Levinson-Durbin algorithm to the inverse Fourier transform of the power spectrum, has a linear prediction coefficient that minimizes the Itakura Saito distance between the power spectrum and the all-pole spectral envelope. It is known that this is a desired operation. Therefore, the above code length minimization problem is the same as in the conventional method by applying the Levinson-Durbin algorithm to the ηth power of the amplitude spectrum, that is, the ηth power of the absolute value of the MDCT coefficient series. An optimal solution can be obtained.
[第一実施形態]
(符号化)
第一実施形態の符号化装置の構成例を図4に示す。第三実施形態の符号化装置は、図4に示すように、周波数領域変換部21と、線形予測分析部22と、非平滑化振幅スペクトル包絡系列生成部23と、平滑化振幅スペクトル包絡系列生成部24と、包絡正規化部25と、符号化部26と、パラメータ決定部27と、モデルパラメータ情報符号化部29を例えば備えている。この符号化装置により実現される第一実施形態の符号化方法の各処理の例を図5に示す。
[First embodiment]
(Coding)
A configuration example of the encoding apparatus according to the first embodiment is shown in FIG. As shown in FIG. 4, the encoding apparatus of the third embodiment includes a frequency
以下、図4の各部について説明する。 Hereinafter, each part of FIG. 4 will be described.
<パラメータ決定部27>
第一実施形態では、所定の時間区間ごとに複数のパラメータηの何れかがパラメータ決定部27により選択可能とされている。
<
In the first embodiment, any one of a plurality of parameters η can be selected by the
パラメータ決定部27には、複数のパラメータηがパラメータηの候補として記憶されているとする。パラメータ決定部27は、複数のパラメータの中の1つのパラメータηを順次読み出し、線形予測分析部22、非平滑化振幅スペクトル包絡系列生成部23、復号化部26及びモデルパラメータ情報符号化部29に出力する(ステップA0)。
It is assumed that the
周波数領域変換部21、線形予測分析部22、非平滑化振幅スペクトル包絡系列生成部23、平滑化振幅スペクトル包絡系列生成部24、包絡正規化部25、符号化部26及びモデルパラメータ情報符号化部29は、パラメータ決定部27が順次読み出した各パラメータηに基づいて、例えば以下に説明するステップA1からステップA6及びステップA9の処理を行い同一の所定の時間区間の時系列信号に対応する周波数領域サンプル列に対して符号を生成する。一般に、パラメータηを所与として、同一の所定の時間区間の時系列信号に対応する周波数領域サンプル列に対して2個以上の符号が得られる場合がある。この場合、同一の所定の時間区間の時系列信号に対応する周波数領域サンプル列に対する符号は、これらの得られた2個以上の符号をまとめたものである。この例では、符号は、線形予測係数符号と、利得符号と、整数信号符号と、モデルパラメータ情報符号とを合わせたものである。これにより、同一の所定の時間区間の時系列信号に対応する周波数領域サンプル列に対する各パラメータηごとの符号が得られる。
Frequency
ステップA9の処理の後に、パラメータ決定部27は、同一の所定の時間区間の時系列信号に対応する周波数領域サンプル列に対して各パラメータηごとに得られた符号の中から1つの符号を選択し、選択された符号に対応するパラメータηを決定する(ステップA7)。この決定されたパラメータηが、その同一の所定の時間区間の時系列信号に対応する周波数領域サンプル列に対するパラメータηとなる。そして、パラメータ決定部27は、選択された符号及び決定されたパラメータηを表す符号を復号装置に出力する。パラメータ決定部27によるステップA7の処理の詳細については後述する。
After the process of step A9, the
以下では、パラメータ決定部27により1つのパラメータηが読み出されており、この読み出された1つのパラメータηについて処理が行われるとする。
In the following, it is assumed that one parameter η is read by the
<周波数領域変換部21>
周波数領域変換部21には、時間領域の時系列信号である音信号が入力される。音信号の例は、音声ディジタル信号又は音響ディジタル信号である。
<
The
周波数領域変換部21は、所定の時間長のフレーム単位で、入力された時間領域の音信号を周波数領域のN点のMDCT係数列X(0),X(1),…,X(N-1)に変換する(ステップA1)。Nは正の整数である。
The frequency
得られたMDCT係数列X(0),X(1),…,X(N-1)は、線形予測分析部22と包絡正規化部25に出力される。
The obtained MDCT coefficient sequences X (0), X (1),..., X (N-1) are output to the linear
特に断りがない限り、以降の処理はフレーム単位で行われるものとする。 Unless otherwise specified, the subsequent processing is performed in units of frames.
このようにして、周波数領域変換部21は、音信号に対応する、例えばMDCT係数列である周波数領域サンプル列を求める。
In this way, the frequency
<線形予測分析部22>
線形予測分析部22には、周波数領域変換部21が得たMDCT係数列X(0),X(1),…,X(N-1)が入力される。
<Linear
The linear
線形予測分析部22は、MDCT係数列X(0),X(1),…,X(N-1)を用いて、以下の式(A7)により定義される~R(0),~R(1),…,~R(N-1)を線形予測分析して線形予測係数β1,β2,…,βpを生成し、生成された線形予測係数β1,β2,…,βpを符号化して線形予測係数符号と線形予測係数符号に対応する量子化された線形予測係数である量子化線形予測係数^β1,^β2,…,^βpとを生成する(ステップA2)。
The linear
生成された量子化線形予測係数^β1,^β2,…,^βpは、非平滑化スペクトル包絡系列生成部23と平滑化振幅スペクトル包絡系列生成部24に出力される。なお、線形予測分析処理の過程で予測残差のエネルギーσ2が算出される。この場合、算出された予測残差のエネルギーσ2は、モデルパラメータ情報符号化部29及び符号化部26の分散パラメータ決定部268に出力される。
The generated quantized linear prediction coefficients ^ β 1 , ^ β 2 ,..., ^ Β p are output to the non-smoothed spectrum envelope
また、生成された線形予測係数符号は、パラメータ決定部27に送信される。
Further, the generated linear prediction coefficient code is transmitted to the
具体的には、線形予測分析部22は、まずMDCT係数列X(0),X(1),…,X(N-1)の絶対値のη乗をパワースペクトルと見做した逆FFTに相当する演算、すなわち式(A7)の演算を行うことにより、MDCT係数列X(0),X(1),…,X(N-1)の絶対値のη乗に対応する時間領域の信号列である擬似相関関数信号列~R(0),~R(1),…,~R(N-1)を求める。そして、線形予測分析部22は、求まった擬似相関関数信号列~R(0),~R(1),…,~R(N-1)を用いて線形予測分析を行って、線形予測係数β1,β2,…,βpを生成する。そして、線形予測分析部22は、生成された線形予測係数β1,β2,…,βpを符号化することにより、線形予測係数符号と、線形予測係数符号に対応する量子化線形予測係数^β1,^β2,…,^βpとを得る。
Specifically, the linear
線形予測係数β1,β2,…,βpは、MDCT係数列X(0),X(1),…,X(N-1)の絶対値のη乗をパワースペクトルと見做したときの時間領域の信号に対応する線形予測係数である。 The linear prediction coefficients β 1 , β 2 , ..., β p are obtained when the absolute value of the MDCT coefficient sequence X (0), X (1), ..., X (N-1) is considered as the power spectrum Is a linear prediction coefficient corresponding to a signal in the time domain.
線形予測分析部22による線形予測係数符号の生成は、例えば従来的な符号化技術によって行われる。従来的な符号化技術とは、例えば、線形予測係数そのものに対応する符号を線形予測係数符号とする符号化技術、線形予測係数をLSPパラメータに変換してLSPパラメータに対応する符号を線形予測係数符号とする符号化技術、線形予測係数をPARCOR係数に変換してPARCOR係数に対応する符号を線形予測係数符号とする符号化技術などである。例えば、線形予測係数そのものに対応する符号を線形予測係数符号とする符号化技術は、複数の量子化線形予測係数の候補が予め定められ、各候補が線形予測係数符号と予め対応付けられて記憶されており、候補の何れかが生成された線形予測係数に対する量子化線形予測係数として決定され、量子化線形予測係数と線形予測係数符号とが得られる技術である。
The generation of the linear prediction coefficient code by the linear
このようにして、線形予測分析部22は、例えばMDCT係数列である周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做した逆フーリエ変換を行うことにより得られる疑似相関関数信号列に対して線形予測分析を行い線形予測係数に変換可能な係数を生成する。
In this way, the linear
<非平滑化振幅スペクトル包絡系列生成部23>
非平滑化振幅スペクトル包絡系列生成部23には、線形予測分析部22が生成した量子化線形予測係数^β1,^β2,…,^βpが入力される。
<Non-smoothed Amplitude Spectrum Envelope
The unsmoothed amplitude spectrum envelope
非平滑化振幅スペクトル包絡系列生成部23は、量子化線形予測係数^β1,^β2,…,^βpに対応する振幅スペクトル包絡の系列である非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を生成する(ステップA3)。
Textured amplitude spectral envelope
生成された非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)は、符号化部26に出力される。
The generated non-smoothed amplitude spectrum envelope sequences ^ H (0), ^ H (1),..., ^ H (N-1) are output to the
非平滑化振幅スペクトル包絡系列生成部23は、量子化線形予測係数^β1,^β2,…,^βpを用いて、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)として、式(A2)により定義される非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を生成する。
The unsmoothed amplitude spectrum envelope
このようにして、非平滑化振幅スペクトル包絡系列生成部23は、線形予測分析部22により生成された線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列を得ることによりスペクトル包絡の推定を行う。ここで、cを任意の数として、複数の値から構成される系列をc乗した系列とは、複数の値のそれぞれをc乗した値から構成される系列のことである。例えば、振幅スペクトル包絡の系列を1/η乗した系列とは、振幅スペクトル包絡の各係数を1/η乗した値から構成される系列のことである。
In this way, the unsmoothed amplitude spectrum envelope
非平滑化振幅スペクトル包絡系列生成部23による1/η乗の処理は、線形予測分析部22で行われた周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做した処理に起因するものである。すなわち、非平滑化振幅スペクトル包絡系列生成部23による1/η乗の処理は、線形予測分析部22で行われた周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做した処理によりη乗された値を元の値に戻すために行われる。
The 1 / η power processing by the non-smoothed amplitude spectrum envelope
<平滑化振幅スペクトル包絡系列生成部24>
平滑化振幅スペクトル包絡系列生成部24には、線形予測分析部22が生成した量子化線形予測係数^β1,^β2,…,^βpが入力される。
<Smoothing Amplitude Spectrum Envelope
Quantized linear prediction coefficients ^ β 1 , ^ β 2 ,..., ^ Β p generated by the linear
平滑化振幅スペクトル包絡系列生成部24は、量子化線形予測係数^β1,^β2,…,^βpに対応する振幅スペクトル包絡の系列の振幅の凸凹を鈍らせた系列である平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)を生成する(ステップA4)。
Smoothing the amplitude spectral envelope
生成された平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)は、包絡正規化部25及び符号化部26に出力される。
The generated smoothed amplitude spectrum envelope sequences ^ Hγ (0), ^ Hγ (1),..., ^ Hγ (N−1) are output to the
平滑化振幅スペクトル包絡系列生成部24は、量子化線形予測係数^β1,^β2,…,^βpと補正係数γを用いて、平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)として、式(A3)により定義される平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)を生成する。
The smoothed amplitude spectrum envelope
ここで、補正係数γは予め定められた1未満の定数であり非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)の振幅の凹凸を鈍らせる係数、言い換えれば非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を平滑化する係数である。 Here, the correction coefficient γ is a predetermined constant less than 1, and the amplitude unevenness of the unsmoothed amplitude spectrum envelope sequence ^ H (0), ^ H (1),…, ^ H (N-1) The coefficient for blunting, in other words, the coefficient for smoothing the unsmoothed amplitude spectrum envelope sequence ^ H (0), ^ H (1), ..., ^ H (N-1).
<包絡正規化部25>
包絡正規化部25には、周波数領域変換部21が得たMDCT係数列X(0),X(1),…,X(N-1)及び平滑化振幅スペクトル包絡生成部24が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)が入力される。
<
The
包絡正規化部25は、MDCT係数列X(0),X(1),…,X(N-1)の各係数を、対応する平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)の各値で正規化することにより、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)を生成する(ステップA5)。
The
生成された正規化MDCT係数列は、符号化部26に出力される。
The generated normalized MDCT coefficient sequence is output to the
包絡正規化部25は、例えば、k=0,1,…,N-1として、MDCT係数列X(0),X(1),…,X(N-1)の各係数X(k)を平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)で除算することにより、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数XN(k)を生成する。すなわち、k=0,1,…,N-1として、XN(k)=X(k)/^Hγ(k)である。
For example, the
<符号化部26>
符号化部26には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)、非平滑化振幅スペクトル包絡生成部23が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)、平滑化振幅スペクトル包絡生成部24が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)及び線形予測分析部22が算出した予測残差のエネルギーσ2が入力される。
<
The
符号化部26は、図8に示すステップA61からステップA65の処理を例えば行うことにより符号化を行う(ステップA6)。
The
符号化部26は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)に対応するグローバルゲインgを求め(ステップA61)、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数をグローバルゲインgで割り算した結果を量子化した整数値による系列である量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を求め(ステップA62)、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数に対応する分散パラメータφ(0),φ(1),…,φ(N-1)をグローバルゲインgと非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)と平均残差のエネルギーσ2とから式(A1)により求め(ステップA63)、分散パラメータφ(0),φ(1),…,φ(N-1)を用いて量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を算術符号化して整数信号符号を得(ステップA64)、グローバルゲインgに対応する利得符号を得る(ステップA65)。 The encoding unit 26 obtains a global gain g corresponding to the normalized MDCT coefficient sequence X N (0), X N (1),..., X N (N−1) (step A61), and the normalized MDCT coefficient sequence Quantized normalized coefficient series X, which is a series of integer values obtained by quantizing the result of dividing each coefficient of X N (0), X N (1), ..., X N (N-1) by global gain g Q (0), X Q (1), ..., X Q (N-1) is obtained (step A62), and the quantized normalized coefficient series X Q (0), X Q (1), ..., X Q Dispersion parameters φ (0), φ (1), ..., φ (N-1) corresponding to each coefficient of (N-1) are set to global gain g and unsmoothed amplitude spectrum envelope sequence ^ H (0), ^ H (1),…, ^ H (N-1) and smoothed amplitude spectrum envelope series ^ H γ (0), ^ H γ (1),…, ^ H γ (N-1) and the average residual It is obtained from the energy σ 2 by the equation (A1) (step A63), and the quantized normalized coefficient series X Q (0) using the dispersion parameters φ (0), φ (1),. ), X Q (1), ..., X Q (N-1) are arithmetically encoded to obtain an integer signal code ( Step A64), a gain code corresponding to the global gain g is obtained (Step A65).
ここで、上記の式(A1)における正規化振幅スペクトル包絡系列^HN(0),^HN(1),…,^HNは、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)の各値を、対応する平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)の各値で除算したもの、すなわち、以下の式(A8)により求まるものである。 Here, the normalized amplitude spectrum envelope sequence ^ H N (0), ^ H N (1), ..., ^ H N in the above equation (A1) is the unsmoothed amplitude spectrum envelope sequence ^ H (0), ^ H (1),…, ^ H (N-1) values are converted into corresponding smoothed amplitude spectrum envelope sequences ^ H γ (0), ^ H γ (1),…, ^ H γ (N- Divided by each value of 1), that is, obtained by the following equation (A8).
生成された整数信号符号と利得符号は正規化MDCT係数列に対応する符号として、パラメータ決定部27に出力される。
The generated integer signal code and gain code are output to the
符号化部26は、ステップA61からステップA65により、整数信号符号のビット数が、予め配分されたビット数である配分ビット数B以下、かつ、なるべく大きな値となるようなグローバルゲインgを決定し、決定されたグローバルゲインgに対応する利得符号と、この決定されたグローバルゲインgに対応する整数信号符号とを生成する機能を実現している。
In step A61 to step A65, the
符号化部26が行うステップA61からステップA65のうち、の特徴的な処理が含まれるのはステップA63であり、グローバルゲインgと量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)のそれぞれを符号化することにより正規化MDCT係数列に対応する符号を得る符号化処理自体には、非特許文献1に記載された技術を含む様々な公知技術が存在する。以下では符号化部26が行う符号化処理の具体例を2つ説明する。
Of the steps A61 to A65 performed by the
[符号化部26が行う符号化処理の具体例1]
符号化部26が行う符号化処理の具体例1として、ループ処理を含まない例について説明する。
[Specific Example 1 of Encoding Process Performed by Encoder 26]
As a specific example 1 of the encoding process performed by the
具体例1の符号化部26の構成例を図6に示す。具体例1の符号化部26は、図6に示すように、利得取得部261と、量子化部262と、分散パラメータ決定部268と、算術符号化部269と、利得符号化部265とを例えば備えている。以下、図6の各部について説明する。
A configuration example of the
<利得取得部261>
利得取得部261には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)が入力される。
<
The
利得取得部261は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)から、整数信号符号のビット数が、予め配分されたビット数である配分ビット数B以下、かつ、なるべく大きな値となるようなグローバルゲインgを決定して出力する(ステップS261)。利得取得部261は、例えば、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)のエネルギーの合計の平方根と配分ビット数Bと負の相関のある定数との乗算値をグローバルゲインgとして得て出力する。または、利得取得部261は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)のエネルギーの合計と、配分ビット数Bと、グローバルゲインgと、の関係を予めテーブル化しておき、そのテーブルを参照することによりグローバルゲインgを得て出力してもよい。
The
このようにして、利得取得部261は、例えば正規化MDCT係数列である正規化周波数領域サンプル列の全サンプルを除算するための利得を得る。
In this way, the
得られたグローバルゲインgは、量子化部262、分散パラメータ決定部268及びモデルパラメータ情報符号化部29に出力される。
The obtained global gain g is output to the
<量子化部262>
量子化部262には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)及び利得取得部261が得たグローバルゲインgが入力される。
<
The
量子化部262は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数をグローバルゲインgで割り算した結果の整数部分による系列である量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を得て出力する(ステップS262)。
The
このようにして、量子化部262は、例えば正規化MDCT係数列である正規化周波数領域サンプル列の各サンプルを、利得で除算するとともに量子化して量子化正規化済係数系列を求める。
In this way, the
得られた量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)は、算術符号化部269に出力される。
The obtained quantized normalized coefficient series X Q (0), X Q (1),..., X Q (N−1) are output to the
<分散パラメータ決定部268>
分散パラメータ決定部268には、パラメータ決定部27が読み出したパラメータη、利得取得部261が得たグローバルゲインg、非平滑化振幅スペクトル包絡生成部23が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)、平滑化振幅スペクトル包絡生成部24が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)及び線形予測分析部22が得た予測残差のエネルギーσ2が入力される。
<Dispersion
The variance
分散パラメータ決定部268は、グローバルゲインgと、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と、平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)と、予測残差のエネルギーσ2とから、上記の式(A1),式(A8)により分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを得て出力する(ステップS268)。
The dispersion
得られた分散パラメータ系列φ(0),φ(1),…,φ(N-1)は、算術符号化部269に出力される。
The obtained dispersion parameter series φ (0), φ (1),..., Φ (N−1) are output to
<算術符号化部269>
算術符号化部269には、パラメータ決定部27が読み出したパラメータη、量子化部262が得た量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)及び分散パラメータ決定部268が得た分散パラメータ系列φ(0),φ(1),…,φ(N-1)が入力される。
<
The
算術符号化部269は、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数に対応する分散パラメータとして分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを用いて、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を算術符号化して整数信号符号を得て出力する(ステップS269)。
The
算術符号化部269は、算術符号化の際に、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数が一般化ガウス分布fGG(X|φ(k),η)に従うときに最適になるような算術符号を構成し、この構成に基づく算術符号により符号化を行う。この結果、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数へのビット割り当ての期待値が分散パラメータ系列φ(0),φ(1),…,φ(N-1)で決定されることになる。
The
得られた整数信号符号は、パラメータ決定部27に出力される。
The obtained integer signal code is output to the
量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の中の複数の係数に跨って算術符号化が行われてもよい。この場合、分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータは、式(A1),式(A8)からわかるように、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)に基づいているため、算術符号化部269は、推定されたスペクトル包絡(非平滑化振幅スペクトル包絡)を基に実質的にビット割り当てが変わる符号化を行っていると言える。
Arithmetic coding may be performed across a plurality of coefficients in the quantized normalized coefficient series X Q (0), X Q (1),..., X Q (N−1). In this case, the dispersion parameters of the dispersion parameter series φ (0), φ (1),..., Φ (N-1) are unsmoothed amplitude spectrum envelopes as can be seen from equations (A1) and (A8). Since it is based on the sequence ^ H (0), ^ H (1), ..., ^ H (N-1), the
<利得符号化部265>
利得符号化部265には、利得取得部261が得たグローバルゲインgが入力される。
<
The
利得符号化部265は、グローバルゲインgを符号化して利得符号を得て出力する(ステップS265)。
The
生成された整数信号符号と利得符号は正規化MDCT係数列に対応する符号として、パラメータ決定部27に出力される。
The generated integer signal code and gain code are output to the
本具体例1のステップS261,S262,S268,S269,S265がそれぞれ上記のステップA61,A62,A63,A64,A65に対応する。 Steps S261, S262, S268, S269, and S265 of the first specific example correspond to the above steps A61, A62, A63, A64, and A65, respectively.
[符号化部26が行う符号化処理の具体例2]
符号化部26が行う符号化処理の具体例2として、ループ処理を含む例について説明する。
[Specific Example 2 of Encoding Process Performed by Encoder 26]
As a specific example 2 of the encoding process performed by the
具体例2の符号化部26の構成例を図7に示す。具体例2の符号化部26は、図7に示すように、利得取得部261と、量子化部262と、分散パラメータ決定部268と、算術符号化部269と、利得符号化部265と、判定部266と、利得更新部267とを例えば備えている。以下、図7の各部について説明する。
A configuration example of the
<利得取得部261>
利得部261には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)が入力される。
<
The
利得取得部261は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)から、整数信号符号のビット数が、予め配分されたビット数である配分ビット数B以下、かつ、なるべく大きな値となるようなグローバルゲインgを決定して出力する(ステップS261)。利得取得部261は、例えば、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)のエネルギーの合計の平方根と配分ビット数Bと負の相関のある定数との乗算値をグローバルゲインgとして得て出力する。
The
得られたグローバルゲインgは、量子化部262及び分散パラメータ決定部268に出力される。
The obtained global gain g is output to the
利得取得部261が得たグローバルゲインgは、量子化部262及び分散パラメータ決定部268で用いられるグローバルゲインの初期値となる。
The global gain g obtained by the
<量子化部262>
量子化部262には、包絡正規化部25が生成した正規化MDCT係数列XN(0),XN(1),…,XN(N-1)及び利得取得部261又は利得更新部267が得たグローバルゲインgが入力される。
<
The
量子化部262は、正規化MDCT係数列XN(0),XN(1),…,XN(N-1)の各係数をグローバルゲインgで割り算した結果の整数部分による系列である量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を得て出力する(ステップS262)。
The
ここで、量子化部262が初回に実行される際に用いられるグローバルゲインgは、利得取得部261が得たグローバルゲインg、すなわちグローバルゲインの初期値である。また、量子化部262が2回目以降に実行される際に用いられるグローバルゲインgは、利得更新部267が得たグローバルゲインg、すなわちグローバルゲインの更新値である。
Here, the global gain g used when the
得られた量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)は、算術符号化部269に出力される。
The obtained quantized normalized coefficient series X Q (0), X Q (1),..., X Q (N−1) are output to the
<分散パラメータ決定部268>
分散パラメータ決定部268には、パラメータ決定部27が読み出したパラメータη、利得取得部261又は利得更新部267が得たグローバルゲインg、非平滑化振幅スペクトル包絡生成部23が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)、平滑化振幅スペクトル包絡生成部24が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)及び線形予測分析部22が得た予測残差のエネルギーσ2が入力される。
<Dispersion
The dispersion
分散パラメータ決定部268は、グローバルゲインgと、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と、平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)と、予測残差のエネルギーσ2とから、上記の式(A1),式(A8)により分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを得て出力する(ステップS268)。
The dispersion
ここで、分散パラメータ決定部268が初回に実行される際に用いられるグローバルゲインgは、利得取得部261が得たグローバルゲインg、すなわちグローバルゲインの初期値である。また、分散パラメータ決定部268が2回目以降に実行される際に用いられるグローバルゲインgは、利得更新部267が得たグローバルゲインg、すなわちグローバルゲインの更新値である。
Here, the global gain g used when the dispersion
得られた分散パラメータ系列φ(0),φ(1),…,φ(N-1)は、算術符号化部269に出力される。
The obtained dispersion parameter series φ (0), φ (1),..., Φ (N−1) are output to
<算術符号化部269>
算術符号化部269には、パラメータ決定部27が読み出したパラメータη、量子化部262が得た量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)及び分散パラメータ決定部268が得た分散パラメータ系列φ(0),φ(1),…,φ(N-1)が入力される。
<
The
算術符号化部269は、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数に対応する分散パラメータとして分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを用いて、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)を算術符号化して、整数信号符号と整数信号符号のビット数である消費ビット数Cとを得て出力する(ステップS269)。
The
算術符号化部269は、算術符号化の際に、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数が一般化ガウス分布fGG(X|φ(k),η)に従うときに最適になるような算術符号を構成し、この構成に基づく算術符号により符号化を行う。この結果、量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の各係数へのビット割り当ての期待値が分散パラメータ系列φ(0),φ(1),…,φ(N-1)で決定されることになる。
The
得られた整数信号符号及び消費ビット数Cは、判定部266に出力される。
The obtained integer signal code and consumed bit number C are output to the
量子化正規化済係数系列XQ(0),XQ(1),…,XQ(N-1)の中の複数の係数に跨って算術符号化が行われてもよい。この場合、分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータは、式(A1),式(A8)からわかるように、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)に基づいているため、算術符号化部269は、推定されたスペクトル包絡(非平滑化振幅スペクトル包絡)を基に実質的にビット割り当てが変わる符号化を行っていると言える。
Arithmetic coding may be performed across a plurality of coefficients in the quantized normalized coefficient series X Q (0), X Q (1),..., X Q (N−1). In this case, the dispersion parameters of the dispersion parameter series φ (0), φ (1),..., Φ (N-1) are unsmoothed amplitude spectrum envelopes as can be seen from equations (A1) and (A8). Since it is based on the sequence ^ H (0), ^ H (1), ..., ^ H (N-1), the
<判定部266>
判定部266には、算術符号化部269が得た整数信号符号が入力される。
<Determining
The integer signal code obtained by the
判定部266は、利得の更新回数が予め定めた回数の場合には、整数信号符号を出力するとともに、利得符号化部265に対し利得更新部267が得たグローバルゲインgを符号化する指示信号を出力し、利得の更新回数が予め定めた回数未満である場合には、利得更新部267に対し、算術符号化部264が計測した消費ビット数Cを出力する(ステップS266)。
The
<利得更新部267>
利得更新部267には、算術符号化部264が計測した消費ビット数Cが入力される。
<
The
利得更新部267は、消費ビット数Cが配分ビット数Bより多い場合にはグローバルゲインgの値を大きな値に更新して出力し、消費ビット数Cが配分ビット数Bより少ない場合にはグローバルゲインgの値を小さな値に更新し、更新後のグローバルゲインgの値を出力する(ステップS267)。
The
利得更新部267が得た更新後のグローバルゲインgは、量子化部262、利得符号化部265及びモデルパラメータ情報符号化部29に出力される。
The updated global gain g obtained by the
<利得符号化部265>
利得符号化部265には、判定部266からの出力指示及び利得更新部267が得たグローバルゲインgが入力される。
<
The
利得符号化部265は、指示信号に従って、グローバルゲインgを符号化して利得符号を得て出力する(ステップ265)。
The
判定部266が出力した整数信号符号と、利得符号化部265が出力した利得符号は、正規化MDCT係数列に対応する符号として、パラメータ決定部27に出力される。
The integer signal code output from the
すなわち、本具体例2においては、最後に行われたステップS267が上記のステップA61に対応し、ステップS262,S263,S264,S265がそれぞれ上記のステップA62,A63,A64,A65に対応する。 That is, in this specific example 2, step S267 performed last corresponds to step A61, and steps S262, S263, S264, and S265 correspond to steps A62, A63, A64, and A65, respectively.
なお、符号化部26が行う符号化処理の具体例2については、国際公開公報WO2014/054556などに更に詳細に説明されている。
Specific example 2 of the encoding process performed by the
<モデルパラメータ情報符号化部29>
モデルパラメータ情報符号化部29には、線形予測分析部22が得た予測残差のエネルギーσ2、利得取得部261又は利得更新部267が得たグローバルゲインg、パラメータ決定部27が決定したパラメータ符号に対応するパラメータηが、入力される。
<Model Parameter
The model parameter
モデルパラメータ情報符号化部29は、予測残差のエネルギーσ2を少なくとも用いて、モデルパラメータσに応じた情報を表すモデルパラメータ情報符号を得て出力する(ステップA9)。モデルパラメータ情報符号は、パラメータ決定部27に出力される。
The model parameter
モデルパラメータσに応じた情報とは、例えば式(A1)のσ2/η/gである。すなわち、mを正の数として、モデルパラメータσに応じた情報は、例えば、σmとグローバルゲインgとの比の値である。mは、例えば2/ηである。モデルパラメータσ及びグローバルゲインgは、互いに依存する関係にある。より詳細には、モデルパラメータσが大きいほど、スペクトルのダイナミックレンジが大きくなるため、量子化幅すなわちグローバルゲインgが大きくなるという互いに依存する関係がある。このため、σmとグローバルゲインgとの比の値の取り得る範囲は、限定的であることが多い。このため、σmとグローバルゲインgとの比の値をモデルパラメータσに応じた情報とすると、モデルパラメータσに応じた情報を効率良く量子化(符号化)することができる。 The information corresponding to the model parameter σ is, for example, σ 2 / η / g in the formula (A1). That is, information according to the model parameter σ, where m is a positive number, is, for example, the value of the ratio between σ m and the global gain g. For example, m is 2 / η. The model parameter σ and the global gain g are in a mutually dependent relationship. More specifically, since the dynamic range of the spectrum increases as the model parameter σ increases, there is a mutually dependent relationship that the quantization width, that is, the global gain g increases. For this reason, the possible range of the value of the ratio between σ m and the global gain g is often limited. Therefore, if the value of the ratio between σ m and the global gain g is information corresponding to the model parameter σ, the information corresponding to the model parameter σ can be efficiently quantized (encoded).
もちろん、モデルパラメータσに応じた情報は、モデルパラメータσ自体であってもよいし、その他のモデルパラメータσに依拠した情報であってもよい。 Of course, the information corresponding to the model parameter σ may be the model parameter σ itself, or may be information depending on the other model parameter σ.
例えば、モデルパラメータ情報符号化部29には、モデルパラメータに応じた情報の複数の候補が記憶されている。モデルパラメータ情報復号部39は、モデルパラメータに応じた情報の複数の候補の中から、入力されたσ(必要に応じて更にg,η)により定まるモデルパラメータに応じた情報に最も近いモデルパラメータに応じた情報の候補を選択し、その選択されたモデルパラメータに応じた情報の候補を特定する情報をモデルパラメータ情報符号とする。
For example, the model parameter
<パラメータ決定部27>
ステップA1からステップA6及びステップA9の処理により、同一の所定の時間区間の時系列信号に対応する周波数領域サンプル列に対して各パラメータηごとに生成された符号(この例では、線形予測係数符号、利得符号、整数信号符号及びモデルパラメータ情報符号)は、パラメータ決定部27に入力される。
<
Through the processing from step A1 to step A6 and step A9, a code (in this example, a linear prediction coefficient code) generated for each parameter η with respect to a frequency domain sample sequence corresponding to a time-series signal in the same predetermined time interval. , Gain code, integer signal code, and model parameter information code) are input to the
パラメータ決定部27は、同一の所定の時間区間の時系列信号に対応する周波数領域サンプル列に対して各パラメータηごとに得られた符号の中から1つの符号を選択し、選択された符号に対応するパラメータηを決定する(ステップA7)。この決定されたパラメータηが、その同一の所定の時間区間の時系列信号に対応する周波数領域サンプル列に対するパラメータηとなる。そして、パラメータ決定部27は、選択された符号及び決定されたパラメータηを表すパラメータ符号を復号装置に出力する。符号の選択は、符号の符号量及び符号に対応する符号化歪の少なくとも一方に基づいて行われる。例えば、符号量が最も小さい符号又は符号化歪が最も小さい符号が選択される。
The
ここで、符号化歪みとは、入力信号から得られる周波数領域サンプル列と、生成された符号をローカルデコードすることにより得られる周波数領域サンプル列との誤差のことである。符号化装置は、符号化歪みを計算するための符号化歪計算部を備えていてもよい。この符号化歪計算部は、以下に述べる復号装置と同様の処理を行う復号部を備え、この復号部が生成された符号をローカルデコードする。その後、符号化歪計算部は、入力信号から得られる周波数領域サンプル列と、ローカルデコードすることにより得られた周波数領域サンプル列との誤差を計算し、符号化歪とする。 Here, the coding distortion is an error between a frequency domain sample sequence obtained from an input signal and a frequency domain sample sequence obtained by local decoding of a generated code. The encoding apparatus may include an encoding distortion calculation unit for calculating encoding distortion. The encoding distortion calculation unit includes a decoding unit that performs processing similar to that of the decoding device described below, and locally decodes the code generated by the decoding unit. Thereafter, the coding distortion calculation unit calculates an error between the frequency domain sample sequence obtained from the input signal and the frequency domain sample sequence obtained by local decoding, and obtains the coding distortion.
(復号)
符号化装置に対応する復号装置の構成例を図9に示す。第一実施形態の復号装置は、図9に示すように、線形予測係数復号部31と、非平滑化振幅スペクトル包絡系列生成部32と、平滑化振幅スペクトル包絡系列生成部33と、復号部34と、包絡逆正規化部35と、時間領域変換部36と、パラメータ復号部37と、モデルパラメータ情報復号部39を例えば備えている。この復号装置により実現される第一実施形態の復号方法の各処理の例を図10に示す。
(Decryption)
A configuration example of a decoding device corresponding to the encoding device is shown in FIG. As shown in FIG. 9, the decoding device of the first embodiment includes a linear prediction
復号装置には、符号化装置が出力した、パラメータ符号、正規化MDCT係数列に対応する符号及び線形予測係数符号が少なくとも入力される。 The decoding apparatus receives at least the parameter code, the code corresponding to the normalized MDCT coefficient sequence, and the linear prediction coefficient code output from the encoding apparatus.
以下、図9の各部について説明する。 Hereinafter, each part of FIG. 9 will be described.
<パラメータ復号部37>
パラメータ復号部37には、符号化装置が出力したパラメータ符号が入力される。
<
The parameter code output from the encoding device is input to the
パラメータ復号部37は、パラメータ符号を復号することにより復号パラメータηを求める。求まった復号パラメータηは、非平滑化振幅スペクトル包絡系列生成部32、平滑化振幅スペクトル包絡系列生成部33及び復号部34に出力される。パラメータ復号部37には、複数の復号パラメータηが候補として記憶されいる。パラメータ復号部37は、パラメータ符号に対応する復号パラメータηの候補を復号パラメータηとして求める。パラメータ復号部37に記憶されている複数の復号パラメータηは、符号化装置のパラメータ決定部27に記憶された複数のパラメータηと同じである。
The
<モデルパラメータ情報復号部39>
モデルパラメータ情報復号部39には、符号化装置が出力したモデルパラメータ情報符号が入力される。
<Model Parameter
The model parameter
モデルパラメータ情報復号部39は、モデルパラメータ情報符号を復号することにより、モデルパラメータに応じた情報を得る。得られたモデルパラメータに応じた情報は、復号部34の分散パラメータ決定部342に出力される。
The model parameter
例えば、モデルパラメータ情報復号部39には、モデルパラメータに応じた情報の複数の候補が記憶されている。モデルパラメータ情報復号部39は、モデルパラメータに応じた情報の複数の候補の中から、モデルパラメータ情報符号により特定されるモデルパラメータに応じた情報の候補を選択することによりモデルパラメータに応じた情報を得る。モデルパラメータ情報復号部39に記憶されている複数の復号パラメータηは、符号化装置のモデルパラメータ情報符号化部29に記憶された複数のパラメータηと同じである。
For example, the model parameter
<線形予測係数復号部31>
線形予測係数復号部31には、符号化装置が出力した線形予測係数符号が入力される。
<Linear prediction
The linear prediction
線形予測係数復号部31は、フレームごとに、入力された線形予測係数符号を例えば従来的な復号技術によって復号して復号線形予測係数^β1,^β2,…, ^βpを得る(ステップB1)。
Linear prediction
得られた復号線形予測係数^β1,^β2,…, ^βpは、非平滑化振幅スペクトル包絡系列生成部32及び非平滑化振幅スペクトル包絡系列生成部33に出力される。
The obtained decoded linear prediction coefficients ^ β 1 , ^ β 2 ,..., ^ Β p are output to the non-smoothed amplitude spectrum envelope
ここで、従来的な復号技術とは、例えば、線形予測係数符号が量子化された線形予測係数に対応する符号である場合に線形予測係数符号を復号して量子化された線形予測係数と同じ復号線形予測係数を得る技術、線形予測係数符号が量子化されたLSPパラメータに対応する符号である場合に線形予測係数符号を復号して量子化されたLSPパラメータと同じ復号LSPパラメータを得る技術などである。また、線形予測係数とLSPパラメータは互いに変換可能なものであり、入力された線形予測係数符号と後段での処理において必要な情報に応じて、復号線形予測係数と復号LSPパラメータの間での変換処理を行なえばよいのは周知である。以上から、上記の線形予測係数符号の復号処理と必要に応じて行なう上記の変換処理とを包含したものが「従来的な復号技術による復号」ということになる。 Here, the conventional decoding technique is the same as the linear prediction coefficient quantized by decoding the linear prediction coefficient code when the linear prediction coefficient code is a code corresponding to the quantized linear prediction coefficient, for example. A technique for obtaining a decoded linear prediction coefficient, a technique for decoding the linear prediction coefficient code and obtaining the same decoded LSP parameter as the quantized LSP parameter when the linear prediction coefficient code is a code corresponding to the quantized LSP parameter, etc. It is. In addition, linear prediction coefficients and LSP parameters can be converted to each other, and conversion between decoded linear prediction coefficients and decoded LSP parameters is performed according to the input linear prediction coefficient code and information necessary for subsequent processing. What is necessary is just to perform a process. From the above, what includes the decoding process of the linear prediction coefficient code and the conversion process performed as necessary is “decoding by a conventional decoding technique”.
このようにして、線形予測係数復号部31は、入力された線形予測係数符号を復号することにより、時系列信号に対応する周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做した逆フーリエ変換を行うことにより得られる疑似相関関数信号列に対応する線形予測係数に変換可能な係数を生成する。
In this way, the linear prediction
<非平滑化振幅スペクトル包絡系列生成部32>
非平滑化振幅スペクトル包絡系列生成部32には、パラメータ復号部37が求めた復号パラメータη及び線形予測係数復号部31が得た復号線形予測係数^β1,^β2,…,^βpが入力される。
<Non-smoothed Amplitude Spectrum Envelope
The unsmoothed amplitude spectrum envelope
非平滑化振幅スペクトル包絡系列生成部32は、復号線形予測係数^β1,^β2,…,^βpに対応する振幅スペクトル包絡の系列である非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を上記の式(A2)により生成する(ステップB2)。
Textured amplitude spectral envelope
生成された非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)は、復号部34に出力される。
The generated non-smoothed amplitude spectrum envelope sequences ^ H (0), ^ H (1),..., ^ H (N-1) are output to the
このようにして、非平滑化振幅スペクトル包絡系列生成部32は、線形予測係数復号部31により生成された線形予測係数に変換可能な係数に対応するに対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列を得る。
In this way, the unsmoothed amplitude spectrum envelope
<平滑化振幅スペクトル包絡系列生成部33>
平滑化振幅スペクトル包絡系列生成部33には、パラメータ復号部37が求めた復号パラメータη及び線形予測係数復号部31が得た復号線形予測係数^β1,^β2,…,^βpが入力される。
<Smoothing Amplitude Spectrum Envelope
The smoothed amplitude spectrum envelope
平滑化振幅スペクトル包絡系列生成部33は、復号線形予測係数^β1,^β2,…,^βpに対応する振幅スペクトル包絡の系列の振幅の凹凸を鈍らせた系列である平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)を上記の式A(3)により生成する(ステップB3)。
Smoothing the amplitude spectral envelope
生成された平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)は、復号部34及び包絡逆正規化部35に出力される。
The generated smoothed amplitude spectrum envelope sequences ^ Hγ (0), ^ Hγ (1),..., ^ Hγ (N-1) are output to the
<復号部34>
復号部34には、パラメータ復号部37が求めた復号パラメータη、符号化装置が出力した正規化MDCT係数列に対応する符号、非平滑化振幅スペクトル包絡生成部32が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)、平滑化振幅スペクトル包絡生成部33が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)及びモデルパラメータ情報復号部39が得たモデルパラメータに応じた情報が入力される。
<Decoding
The
復号部34は、分散パラメータ決定部342を備えている。
The
復号部34は、図11に示すステップB41からステップB44の処理を例えば行うことにより復号を行う(ステップB4)。すなわち、復号部34は、フレームごとに、入力された正規化MDCT係数列に対応する符号に含まれる利得符号を復号してグローバルゲインgを得る(ステップB41)。復号部34の分散パラメータ決定部342は、グローバルゲインgと非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)と平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)とパラメータηとモデルパラメータに応じた情報とから上記の式(A1)により分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータを求める(ステップB42)。復号部34は、正規化MDCT係数列に対応する符号に含まれる整数信号符号を分散パラメータ系列φ(0),φ(1),…,φ(N-1)の各分散パラメータに対応する算術符号化の構成に従い、算術復号して復号正規化済係数系列^XQ(0),^XQ(1),…,^XQ(N-1)を得(ステップB43)、復号正規化済係数系列^XQ(0),^XQ(1),…,^XQ(N-1)の各係数にグローバルゲインgを乗算して復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)を生成する(ステップB44)。このように、復号部34は、非平滑化スペクトル包絡系列に基づいて実質的に変わるビット割り当てに従って、入力された整数信号符号の復号を行ってもよい。
The
生成された復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)は、包絡逆正規化部35に出力される。 The generated decoded normalized MDCT coefficient sequence ^ X N (0), ^ X N (1),..., ^ X N (N−1) is output to the envelope denormalization unit 35.
<包絡逆正規化部35>
包絡逆正規化部35には、平滑化振幅スペクトル包絡生成部33が生成した平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)及び復号部34が生成した復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)が入力される。
<Envelope inverse normalization unit 35>
The envelope denormalization unit 35 includes a smoothed amplitude spectrum envelope sequence ^ Hγ (0), ^ Hγ (1), ..., ^ Hγ (N-1) generated by the smoothed amplitude spectrum
包絡逆正規化部35は、平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)を用いて、復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)を逆正規化することにより、復号MDCT係数列^X(0),^X(1),…,^X(N-1)を生成する(ステップB5)。 The envelope denormalization unit 35 uses the smoothed amplitude spectrum envelope sequence ^ Hγ (0), ^ Hγ (1),…, ^ Hγ (N-1) to decode the normalized MDCT coefficient sequence ^ X By denormalizing N (0), ^ X N (1), ..., ^ X N (N-1), the decoded MDCT coefficient sequence ^ X (0), ^ X (1), ..., ^ X (N-1) is generated (step B5).
生成された復号MDCT係数列^X(0),^X(1),…,^X(N-1)は、時間領域変換部36に出力される。
The generated decoded MDCT coefficient sequence ^ X (0), ^ X (1),..., ^ X (N-1) is output to the time
例えば、包絡逆正規化部35は、k=0,1,…,N-1として、復号正規化MDCT係数列^XN(0),^XN(1),…,^XN(N-1)の各係数^XN(k)に、平滑化振幅スペクトル包絡系列^Hγ(0),^Hγ(1),…,^Hγ(N-1)の各包絡値^Hγ(k)を乗じることにより復号MDCT係数列^X(0),^X(1),…,^X(N-1)を生成する。すなわち、k=0,1,…,N-1として、^X(k)=^XN(k)×^Hγ(k)である。 For example, the envelope inverse normalization unit 35, k = 0, 1, ..., a N-1, decoding the normalized MDCT coefficients ^ X N (0), ^ X N (1), ..., ^ X N (N -1) for each coefficient ^ X N (k), the smoothed amplitude spectrum envelope series ^ H γ (0), ^ H γ (1),…, ^ H γ (N-1) envelope values ^ H The decoded MDCT coefficient sequence ^ X (0), ^ X (1), ..., ^ X (N-1) is generated by multiplying by γ (k). That is, ^ X (k) = ^ X N (k) × ^ H γ (k) where k = 0, 1,..., N−1.
<時間領域変換部36>
時間領域変換部36には、包絡逆正規化部35が生成した復号MDCT係数列^X(0),^X(1),…,^X(N-1)が入力される。
<Time
The time
時間領域変換部36は、フレームごとに、包絡逆正規化部35が得た復号MDCT係数列^X(0),^X(1),…,^X(N-1)を時間領域に変換してフレーム単位の音信号(復号音信号)を得る(ステップB6)。
The time
このようにして、復号装置は、周波数領域での復号により時系列信号を得る。 In this way, the decoding device obtains a time series signal by decoding in the frequency domain.
[第二実施形態]
第一実施形態の符号化装置及び方法は、複数のパラメータηのそれぞれについて符号化を行い符号を生成し、パラメータηごとに生成された符号の中から最適な符号を選択し、選択された符号及び選択された符号に対応するパラメータ符号を出力するものであった。
[Second Embodiment]
The encoding apparatus and method according to the first embodiment generate a code by performing encoding for each of a plurality of parameters η, select an optimal code from the codes generated for each parameter η, and select the selected code. And a parameter code corresponding to the selected code.
これに対して、第二実施形態の符号化装置及び方法は、まずパラメータ決定部27がパラメータηを決定し、決定されたパラメータηに基づいて符号化を行い符号を生成し出力するものである。第二実施形態では、所定の時間区間ごとにパラメータηがパラメータ決定部27により可変とされている。ここで、所定の時間区間ごとにパラメータηが可変とは、所定の時間区間が変わればパラメータηも変わり得ることを意味し、同一の時間区間ではパラメータηの値は変わらないとする。
On the other hand, in the encoding apparatus and method of the second embodiment, the
以下、第一実施形態と異なる部分を中心に説明する。第一実施形態と同様の部分については重複説明を省略する。 Hereinafter, a description will be given centering on differences from the first embodiment. A duplicate description of the same parts as in the first embodiment is omitted.
(符号化)
第二実施形態の符号化装置の構成例を図12に示す。符号化装置は、図12に示すように、周波数領域変換部21と、線形予測分析部22と、非平滑化振幅スペクトル包絡系列生成部23と、平滑化振幅スペクトル包絡系列生成部24と、包絡正規化部25と、符号化部26と、パラメータ決定部27’と、モデルパラメータ情報符号化部29とを例えば備えている。この符号化装置により実現される符号化方法の各処理の例を図13に示す。
(Coding)
A configuration example of the encoding apparatus according to the second embodiment is shown in FIG. As shown in FIG. 12, the encoding device includes a frequency
以下、図12の各部について説明する。 Hereinafter, each part of FIG. 12 will be described.
<パラメータ決定部27’>
パラメータ決定部27’には、時系列信号である時間領域の音信号が入力される。音信号の例は、音声ディジタル信号又は音響ディジタル信号である。
<Parameter determining unit 27 '>
A time domain sound signal, which is a time-series signal, is input to the
パラメータ決定部27’は、入力された時系列信号に基づいて、後述する処理により、パラメータηを決定する(ステップA7’)。
パラメータ決定部27’により決定されたηは、線形予測分析部22、非平滑化振幅スペクトル包絡推定部23、及び平滑化振幅スペクトル包絡推定部24及び符号化部26に出力される。
The
Η determined by the
また、パラメータ決定部27’は、決定されたηを符号化することによりパラメータ符号を生成する。生成されたパラメータ符号は、復号装置に送信される。また、生成されたパラメータ符号に対応するパラメータηが、モデルパラメータ情報符号化部29に出力される。
The
パラメータ決定部27’の詳細については後述する。 Details of the parameter determination unit 27 'will be described later.
周波数領域変換部21、線形予測分析部22、非平滑化振幅スペクトル包絡系列生成部23、平滑化振幅スペクトル包絡系列生成部24、包絡正規化部25符号化部26及びモデルパラメータ情報符号化部29は、パラメータ決定部27が決定したパラメータηに基づいて、第一実施形態と同様の処理により符号を生成する(ステップA1からステップA6及びステップA9)。この例では、符号は、線形予測係数符号と、利得符号と、整数信号符号と、モデルパラメータ情報符号とを合わせたものである。生成された符号は、復号装置に送信される。
Frequency
パラメータ決定部27’の構成例を図14に示す。パラメータ決定部27’は、図14に示すように、周波数領域変換部41と、スペクトル包絡推定部42と、白色化スペクトル系列生成部43と、パラメータ取得部44とを例えば備えている。スペクトル包絡推定部42は、線形予測分析部421及び非平滑化振幅スペクトル包絡系列生成部422を例えば備えている。例えばこのパラメータ決定部27’により実現されるパラメータ決定方法の各処理の例を図2に示す。
A configuration example of the parameter determination unit 27 'is shown in FIG. As illustrated in FIG. 14, the
以下、図14の各部について説明する。 Hereinafter, each part of FIG. 14 will be described.
<周波数領域変換部41>
周波数領域変換部41には、時系列信号である時間領域の音信号が入力される。音信号の例は、音声ディジタル信号又は音響ディジタル信号である。
<Frequency domain conversion unit 41>
The time domain sound signal, which is a time series signal, is input to the frequency domain transform unit 41. Examples of sound signals are voice digital signals or acoustic digital signals.
周波数領域変換部41は、所定の時間長のフレーム単位で、入力された時間領域の音信号を周波数領域のN点のMDCT係数列X(0),X(1),…,X(N-1)に変換する。Nは正の整数である。 The frequency domain conversion unit 41 converts the input time domain sound signal into N frequency MDCT coefficient sequences X (0), X (1),..., X (N− Convert to 1). N is a positive integer.
得られたMDCT係数列X(0),X(1),…,X(N-1)は、スペクトル包絡推定部42及び白色化スペクトル系列生成部43に出力される。
The obtained MDCT coefficient sequences X (0), X (1),..., X (N−1) are output to the spectrum
特に断りがない限り、以降の処理はフレーム単位で行われるものとする。 Unless otherwise specified, the subsequent processing is performed in units of frames.
このようにして、周波数領域変換部41は、音信号に対応する、例えばMDCT係数列である周波数領域サンプル列を求める(ステップC41)。 In this way, the frequency domain conversion unit 41 obtains a frequency domain sample sequence corresponding to the sound signal, for example, an MDCT coefficient sequence (step C41).
<スペクトル包絡推定部42>
スペクトル包絡推定部42には、周波数領域変換部21が得たMDCT係数列X(0),X(1),…,X(N-1)が入力される。
<Spectrum
The spectrum
スペクトル包絡推定部42は、所定の方法で定められるパラメータη0に基づいて、時系列信号に対応する周波数領域サンプル列の絶対値のη0乗をパワースペクトルとして用いたスペクトル包絡の推定を行う(ステップC42)。
Based on the parameter η 0 determined by a predetermined method, the spectrum
推定されたスペクトル包絡は、白色化スペクトル系列生成部43に出力される。
The estimated spectrum envelope is output to the whitened spectrum
スペクトル包絡推定部42は、例えば以下に説明する線形予測分析部421及び非平滑化振幅スペクトル包絡系列生成部422の処理により、非平滑化振幅スペクトル包絡系列を生成することによりスペクトル包絡の推定を行う。
The spectrum
パラメータη0は所定の方法で定められるとする。例えば、η0を0より大きい所定の数とする。例えば、η0=1とする。また、現在パラメータηを求めようとしているフレームよりも前のフレームで求まったηを用いてもよい。現在パラメータηを求めようとしているフレーム(以下、現フレームとする。)よりも前のフレームとは、例えば現フレームのよりも前のフレームであって現フレームの近傍のフレームである。現フレームの近傍のフレームは、例えば現フレームの直前のフレームである。 It is assumed that the parameter η 0 is determined by a predetermined method. For example, η 0 is a predetermined number greater than zero. For example, η 0 = 1. Moreover, you may use (eta) calculated | required by the flame | frame before the frame which is calculating | requiring the present parameter (eta). The frame before the frame for which the current parameter η is to be obtained (hereinafter referred to as the current frame) is, for example, a frame before the current frame and in the vicinity of the current frame. The frame in the vicinity of the current frame is, for example, a frame immediately before the current frame.
<線形予測分析部421>
線形予測分析部421には、周波数領域変換部41が得たMDCT係数列X(0),X(1),…,X(N-1)が入力される。
<Linear
MDCT coefficient sequences X (0), X (1),..., X (N−1) obtained by the frequency domain transform unit 41 are input to the linear
線形予測分析部421は、MDCT係数列X(0),X(1),…,X(N-1)を用いて、以下の式(C1)により定義される~R(0),~R(1),…,~R(N-1)を線形予測分析して線形予測係数β1,β2,…,βpを生成し、生成された線形予測係数β1,β2,…,βpを符号化して線形予測係数符号と線形予測係数符号に対応する量子化された線形予測係数である量子化線形予測係数^β1,^β2,…,^βpとを生成する。
The linear
生成された量子化線形予測係数^β1,^β2,…,^βpは、非平滑化スペクトル包絡系列生成部422に出力される。
The generated quantized linear prediction coefficients ^ β 1 , ^ β 2 ,..., ^ Β p are output to the non-smoothed spectrum envelope
具体的には、線形予測分析部421は、まずMDCT係数列X(0),X(1),…,X(N-1)の絶対値のη0乗をパワースペクトルと見做した逆FFTに相当する演算、すなわち式(C1)の演算を行うことにより、MDCT係数列X(0),X(1),…,X(N-1)の絶対値のη乗に対応する時間領域の信号列である擬似相関関数信号列~R(0),~R(1),…,~R(N-1)を求める。そして、線形予測分析部421は、求まった擬似相関関数信号列~R(0),~R(1),…,~R(N-1)を用いて線形予測分析を行って、線形予測係数β1,β2,…,βpを生成する。そして、線形予測分析部421は、生成された線形予測係数β1,β2,…,βpを符号化することにより、線形予測係数符号と、線形予測係数符号に対応する量子化線形予測係数^β1,^β2,…,^βpとを得る。
Specifically, the linear
線形予測係数β1,β2,…,βpは、MDCT係数列X(0),X(1),…,X(N-1)の絶対値のη0乗をパワースペクトルと見做したときの時間領域の信号に対応する線形予測係数である。 Linear prediction coefficients β 1, β 2, ..., β p is, MDCT coefficient sequence X (0), X (1 ), ..., and the eta 0 square of the absolute value of X (N-1) was regarded as a power spectrum It is a linear prediction coefficient corresponding to the time domain signal.
線形予測分析部421による線形予測係数符号の生成は、例えば従来的な符号化技術によって行われる。従来的な符号化技術とは、例えば、線形予測係数そのものに対応する符号を線形予測係数符号とする符号化技術、線形予測係数をLSPパラメータに変換してLSPパラメータに対応する符号を線形予測係数符号とする符号化技術、線形予測係数をPARCOR係数に変換してPARCOR係数に対応する符号を線形予測係数符号とする符号化技術などである。
The generation of the linear prediction coefficient code by the linear
このようにして、線形予測分析部421は、例えばMDCT係数列である周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做した逆フーリエ変換を行うことにより得られる疑似相関関数信号列に対して線形予測分析を行い線形予測係数に変換可能な係数を生成する(ステップC421)。
In this way, the linear
<非平滑化振幅スペクトル包絡系列生成部422>
非平滑化振幅スペクトル包絡系列生成部422には、線形予測分析部421が生成した量子化線形予測係数^β1,^β2,…,^βpが入力される。
<Non-smoothed Amplitude Spectrum Envelope
Quantized linear prediction coefficients ^ β 1 , ^ β 2 ,..., ^ Β p generated by the linear
非平滑化振幅スペクトル包絡系列生成部422は、量子化線形予測係数^β1,^β2,…,^βpに対応する振幅スペクトル包絡の系列である非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を生成する。
Textured amplitude spectral envelope
生成された非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)は、白色化スペクトル系列生成部43に出力される。
The generated non-smoothed amplitude spectrum envelope sequences ^ H (0), ^ H (1),..., ^ H (N-1) are output to the whitened spectrum
非平滑化振幅スペクトル包絡系列生成部422は、量子化線形予測係数^β1,^β2,…,^βpを用いて、非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)として、式(C2)により定義される非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)を生成する。
The unsmoothed amplitude spectrum envelope
このようにして、非平滑化振幅スペクトル包絡系列生成部422は、疑似相関関数信号列に対応する振幅スペクトル包絡の系列を1/η0乗した系列である非平滑化スペクトル包絡系列を線形予測分析部421により生成された線形予測係数に変換可能な係数に基づいて得ることによりスペクトル包絡の推定を行う(ステップC422)。
In this way, the unsmoothed amplitude spectrum envelope
<白色化スペクトル系列生成部43>
白色化スペクトル系列生成部43には、周波数領域変換部41が得たMDCT係数列X(0),X(1),…,X(N-1)及び非平滑化振幅スペクトル包絡生成部422が生成した非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)が入力される。
<Whitening spectrum
The whitened spectrum
白色化スペクトル系列生成部43は、MDCT係数列X(0),X(1),…,X(N-1)の各係数を、対応する非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)の各値で除算することにより、白色化スペクトル系列XW(0),XW(1),…,XW(N-1)を生成する。
The whitened spectrum
生成された白色化スペクトル系列XW(0),XW(1),…,XW(N-1)は、パラメータ取得部44に出力される。 The generated whitening spectrum series X W (0), X W (1),..., X W (N−1) are output to the parameter acquisition unit 44.
白色化スペクトル系列生成部43は、例えば、k=0,1,…,N-1として、MDCT係数列X(0),X(1),…,X(N-1)の各係数X(k)を非平滑化振幅スペクトル包絡系列^H(0),^H(1),…,^H(N-1)の各値^H(k)で除算することにより、白色化スペクトル系列XW(0),XW(1),…,XW(N-1)の各値XW(k)を生成する。すなわち、k=0,1,…,N-1として、XW(k)=X(k)/^H(k)である。
For example, the whitening spectrum
このようにして、白色化スペクトル系列生成部43は、例えば非平滑化振幅スペクトル包絡系列であるスペクトル包絡で例えばMDCT係数列である周波数領域サンプル列を除算した系列である白色化スペクトル系列を得る(ステップC43)。
In this way, the whitened spectrum
<パラメータ取得部44>
パラメータ取得部44には、白色化スペクトル系列生成部43が生成した白色化スペクトル系列XW(0),XW(1),…,XW(N-1)が入力される。
<Parameter acquisition unit 44>
The parameter acquisition unit 44 receives the whitened spectrum series X W (0), X W (1),..., X W (N−1) generated by the whitened spectrum
パラメータ取得部44は、パラメータηを形状パラメータとする一般化ガウス分布が白色化スペクトル系列XW(0),XW(1),…,XW(N-1)のヒストグラムを近似するパラメータηを求める(ステップC44)。言い換えれば、パラメータ取得部44は、パラメータηを形状パラメータとする一般化ガウス分布が白色化スペクトル系列XW(0),XW(1),…,XW(N-1)のヒストグラムの分布に近くなるようなパラメータηを決定する。 The parameter acquisition unit 44 approximates the histogram of the whitened spectrum series X W (0), X W (1),..., X W (N−1) with the generalized Gaussian distribution having the parameter η as a shape parameter. Is obtained (step C44). In other words, the parameter acquisition unit 44 is a distribution of histograms in which the generalized Gaussian distribution having the parameter η as a shape parameter is a whitened spectrum series X W (0), X W (1), ..., X W (N-1). The parameter η that is close to is determined.
パラメータηを形状パラメータとする一般化ガウス分布は、例えば以下のように定義される。Γは、ガンマ関数である。 A generalized Gaussian distribution with the parameter η as a shape parameter is defined as follows, for example. Γ is a gamma function.
一般化ガウス分布は、形状パラメータであるηを変えることにより、図3のようにη=1の時はラプラス分布、η=2の時はガウス分布、といったように様々な分布を表現することができるものである。φは分散に対応するパラメータである。 By changing the shape parameter η, the generalized Gaussian distribution can represent various distributions such as a Laplace distribution when η = 1 and a Gaussian distribution when η = 2 as shown in FIG. It can be done. φ is a parameter corresponding to the variance.
ここで、パラメータ取得部44が求めるηは、以下の式により定義される。F-1は、関数Fの逆関数である。この式は、いわゆるモーメント法により導出されるものである。 Here, η obtained by the parameter acquisition unit 44 is defined by the following equation. F −1 is an inverse function of the function F. This equation is derived by the so-called moment method.
逆関数F-1が定式化されている場合には、パラメータ取得部44は、定式化された逆関数F-1にm1/((m2)1/2)の値を入力したときの出力値を計算することによりパラメータηを求めることができる。 When the inverse function F −1 is formulated, the parameter acquisition unit 44 inputs the value of m 1 / ((m 2 ) 1/2 ) into the formulated inverse function F −1 . The parameter η can be obtained by calculating the output value.
逆関数F-1が定式化されていない場合には、パラメータ取得部44は、式(C3)で定義されるηの値を計算するために、例えば以下に説明する第一方法又は第二方法によりパラメータηを求めてもよい。 If the inverse function F −1 is not formulated, the parameter acquisition unit 44 calculates, for example, the first method or the second method described below in order to calculate the value of η defined by the equation (C3). The parameter η may be obtained by
パラメータηを求めるための第一方法について説明する。第一の方法では、パラメータ取得部44は、白色化スペクトル系列に基づいてm1/((m2)1/2)を計算し、予め用意しておいた異なる複数の、ηと対応するF(η)のペアを参照して、計算されたm1/((m2)1/2)に最も近いF(η)に対応するηを取得する。 A first method for obtaining the parameter η will be described. In the first method, the parameter acquisition unit 44 calculates m 1 / ((m 2 ) 1/2 ) based on the whitened spectrum sequence, and a plurality of different F prepared in advance corresponding to η. Η corresponding to F (η) closest to the calculated m 1 / ((m 2 ) 1/2 ) is obtained with reference to the pair of (η).
予め用意しておいた異なる複数の、ηと対応するF(η)のペアは、パラメータ取得部44の記憶部441に予め記憶しておく。パラメータ取得部44は、記憶部441参照して、計算されたm1/((m2)1/2)に最も近いF(η)を見つけ、見つかったF(η)に対応するηを記憶部441から読み込み出力する。
A plurality of different pairs of F (η) corresponding to η prepared in advance are stored in advance in the
計算されたm1/((m2)1/2)に最も近いF(η)とは、計算されたm1/((m2)1/2)との差の絶対値が最も小さくなるF(η)のことである。 The calculated m 1 / closest to ((m 2) 1/2) F (η) , the absolute value of the difference between the calculated m 1 / ((m 2) 1/2) is smallest F (η).
パラメータηを求めるための第二方法について説明する。第二の方法では、逆関数F-1の近似曲線関数を~F-1として、パラメータ取得部44は、白色化スペクトル系列に基づいてm1/((m2)1/2)を計算し、近似曲線関数~F-1に計算されたm1/((m2)1/2)を入力したときの出力値を計算することによりηを求める。 A second method for obtaining the parameter η will be described. In the second method, the approximate curve function of the inverse function F −1 is set to ~ F −1 , and the parameter acquisition unit 44 calculates m 1 / ((m 2 ) 1/2 ) based on the whitened spectrum series. Then, η is obtained by calculating an output value when m 1 / ((m 2 ) 1/2 ) calculated in the approximate curve function ~ F −1 is input.
パラメータ決定部27’は、ループ処理によりパラメータηを求めてもよい。すなわち、パラメータ決定部27’は、パラメータ取得部44で求まるパラメータηを所定の方法で定められるパラメータη0とする、スペクトル包絡推定部42、白色化スペクトル系列生成部43及びパラメータ取得部44の処理を更に1回以上行ってもよい。
The
この場合、例えば、図14で破線で示すように、パラメータ取得部44で求まったパラメータηは、スペクトル包絡推定部42に出力される。スペクトル包絡推定部42は、パラメータ取得部44で求まったηをパラメータη0として用いて、上記説明した処理と同様の処理を行いスペクトル包絡の推定を行う。白色化スペクトル系列生成部43は、新たに推定されたスペクトル包絡に基づいて、上記説明した処理と同様の処理を行い白色化スペクトル系列を生成する。パラメータ取得部44は、新たに生成された白色化スペクトル系列に基づいて、上記説明した処理と同様の処理を行いパラメータηを求める。
In this case, for example, as indicated by a broken line in FIG. 14, the parameter η obtained by the parameter acquisition unit 44 is output to the spectrum
例えば、スペクトル包絡推定部42、白色化スペクトル系列生成部43及びパラメータ取得部44の処理は、所定の回数であるτ回だけ更に行われてもよい。τは所定の正の整数であり、例えばτ=1又はτ=2である。
For example, the processing of the spectrum
また、スペクトル包絡推定部42は、今回求まったパラメータηと前回求まったパラメータηとの差の絶対値が所定の閾値以下となるまで、スペクトル包絡推定部42、白色化スペクトル系列生成部43及びパラメータ取得部44の処理を繰り返してもよい。
Further, the spectrum
(復号)
第二実施形態の復号装置及び方法は、第一実施形態と同様であるため重複説明を省略する。
(Decryption)
Since the decoding apparatus and method of the second embodiment are the same as those of the first embodiment, redundant description is omitted.
[変形例等]
線形予測分析部22及び非平滑化振幅スペクトル包絡系列生成部23を1つのスペクトル包絡推定部2Aとして捉えると、このスペクトル包絡推定部2Aは、時系列信号に対応する例えばMDCT係数列である周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做したスペクトル包絡(非平滑化振幅スペクトル包絡系列)の推定を行っていると言える。ここで、「パワースペクトルと見做した」とは、パワースペクトルを通常用いるところに、η乗のスペクトルを用いることを意味する。
[Modifications, etc.]
When the linear
この場合、スペクトル包絡推定部2Aの線形予測分析部22は、例えばMDCT係数列である周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做した逆フーリエ変換を行うことにより得られる疑似相関関数信号列に対して線形予測分析を行い線形予測係数に変換可能な係数を得ていると言える。また、スペクトル包絡推定部2Aの非平滑化振幅スペクトル包絡系列生成部23は、線形予測分析部22により得られた線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列を得ることによりスペクトル包絡の推定を行っていると言える。
In this case, the linear
また、平滑化振幅スペクトル包絡系列生成部24、包絡正規化部25及び符号化部26を1つの符号化部2Bとして捉えると、この符号化部2Bは、スペクトル包絡推定部2Aにより推定されたスペクトル包絡(非平滑化振幅スペクトル包絡系列)を基に実質的にビット割り当てが変わる符号化を時系列信号に対応する例えばMDCT係数列である周波数領域サンプル列の各係数に対して行っていると言える。
Further, if the smoothed amplitude spectrum envelope
復号部34及び包絡逆正規化部35を1つの復号部3Aとして捉えると、この復号部3Aは、非平滑化スペクトル包絡系列に基づいて実質的に変わるビット割り当てに従って、入力された整数信号符号の復号を行うことにより時系列信号に対応する周波数領域サンプル列を得ていると言える。
When the
符号化部2Bは、スペクトル包絡(非平滑化振幅スペクトル包絡系列)を基に実質的にビット割り当てが変わる符号化を行うのであれば、上記説明した算術符号化以外の符号化処理を行ってもよい。この場合、復号部3Aは、符号化部2Bが行った符号化処理に対応する復号処理を行う。
The
例えば、符号化部2Bは、スペクトル包絡(非平滑化振幅スペクトル包絡系列)に基づいて決定された決定されたRiceパラメータを用いて周波数領域サンプル列をGolomb-Rice符号化してもよい。この場合、復号部3Aは、スペクトル包絡(非平滑化振幅スペクトル包絡系列)に基づいて決定された決定されたRiceパラメータを用いてGolomb-Rice復号してもよい。
For example, the
第一実施形態において、符号化装置は、パラメータηを決定する際に符号化処理を最後まで行わなくてもよい。言い換えれば、パラメータ決定部27は、推定符号量に基づいてパラメータηを決定してもよい。この場合、符号化部2Bは、複数のパラメータηのそれぞれを用いて同一の所定の時間区間の時系列信号に対応する周波数領域サンプル列に対する上記と同様の符号化処理により得られる符号の推定符号量を得る。パラメータ決定部27は、得られた推定符号量に基づいて複数のパラメータηの何れか1つを選択する。例えば、推定符号量が最も小さいパラメータηを選択する。符号化部2Bは、選択されたパラメータηを用いて上記と同様の符号化処理を行うことにより符号を得て出力する。
In the first embodiment, the encoding device may not perform the encoding process to the end when determining the parameter η. In other words, the
同一の所定のパラメータηが、符号化装置及び復号装置に予め定められていてもよい。この場合、パラメータ決定部27,27’は、符号化装置及び復号装置に備えられていなくてもよい。符号化装置及び復号装置のパラメータ決定部27,27’以外の各部は、この予め定められたパラメータηに基づいて、例えば上記の第二実施形態と同様の符号化処理及び復号処理を行う。
The same predetermined parameter η may be predetermined for the encoding device and the decoding device. In this case, the
符号化装置は、図4又は図12に破線で示した分割部28を更に備えていてもよい。分割部28は、周波数領域変換部21が生成した例えばMDCT係数列である周波数領域サンプル列に基づいて、周波数領域サンプル列の周期性成分に対応するサンプルから構成される第一周波数領域サンプル列と、周波数領域サンプル列の周期性成分に対応するサンプル以外のサンプルから構成される第二周波数領域サンプル列とを生成し、周期性成分に対応するサンプルを表す情報を補助情報として復号装置に出力する。
The encoding apparatus may further include a dividing
言い換えれば、第一周波数領域サンプル列は周波数領域サンプル列の山の部分に対応するサンプルから構成されるサンプル列であり、第二周波数領域サンプル列は周波数領域サンプル列の谷の部分に対応するサンプルから構成されるサンプル列である。 In other words, the first frequency domain sample sequence is a sample sequence composed of samples corresponding to the peaks of the frequency domain sample sequence, and the second frequency domain sample sequence is a sample corresponding to the valleys of the frequency domain sample sequence. It is a sample sequence composed of
例えば、周波数領域サンプル列のうちの周波数領域サンプル列に対応する時系列信号の周期性または基本周波数に対応するサンプルを含む一つまたは連続する複数のサンプルおよび、周波数領域サンプル列のうちの周波数領域サンプル列に対応する時系列信号の周期性または基本周波数の整数倍に対応するサンプルを含む一つまたは連続する複数のサンプル、の全部または一部のサンプルにより構成されるサンプル列を第一周波数領域サンプル列と、周波数領域サンプル列のうちの第一周波数領域サンプル列に含まれないサンプルにより構成されるサンプル列を第二周波数領域サンプル列とを生成する。第一周波数領域サンプル列と第二周波数領域サンプル列の生成は、国際公開公報WO2012/046685に記載された方法を用いて行うことができる。 For example, one or a plurality of consecutive samples including a periodicity of a time-series signal corresponding to a frequency domain sample sequence in a frequency domain sample sequence or a sample corresponding to a fundamental frequency, and a frequency domain in a frequency domain sample sequence The first frequency domain includes a sample sequence composed of all or part of one or a plurality of consecutive samples including samples corresponding to the periodicity of the time series signal corresponding to the sample sequence or an integer multiple of the fundamental frequency A second frequency domain sample sequence is generated from the sample sequence and a sample sequence composed of samples not included in the first frequency domain sample sequence of the frequency domain sample sequences. The generation of the first frequency domain sample sequence and the second frequency domain sample sequence can be performed using a method described in International Publication WO2012 / 046685.
線形予測分析部22、非平滑化振幅スペクトル包絡系列生成部23、平滑化振幅スペクトル包絡系列生成部24、包絡正規化部25及び符号化部26及びパラメータ決定部27は、第一周波数領域サンプル列及び第二周波数領域サンプル列のそれぞれについて、第一実施形態又は第二実施形態で説明した符号化処理を行い符号を生成する。すなわち、例えば算術符号化が行われる場合には、第一周波数領域サンプル列に対応するパラメータ符号、線形予測係数符号、整数信号符号及び利得符号が生成され、第二周波数領域サンプル列に対応するパラメータ符号、線形予測係数符号、整数信号符号及び利得符号が生成される。
The linear
このように、第一周波数領域サンプル列及び第二周波数領域サンプル列のそれぞれについて符号化を行うことにより、更に効率良く符号化を行うことができる。 Thus, encoding can be performed more efficiently by encoding each of the first frequency domain sample sequence and the second frequency domain sample sequence.
この場合、復号装置は、図9に破線で示した結合部38を更に備えていてもよい。復号装置は、第一周波数領域サンプル列に対応する符号(例えば、パラメータ符号、線形予測係数符号、整数信号符号及び利得符号)に基づいて、第一実施形態又は第二実施形態で説明した復号処理を行い、復号第一周波数領域サンプル列を求める。また、復号装置は、第二周波数領域サンプル列に対応する符号(例えば、パラメータ符号、線形予測係数符号、整数信号符号及び利得符号)に基づいて、第一実施形態又は第二実施形態で説明した復号処理を行い、復号第二周波数領域サンプル列を求める。結合部38は、入力された補助情報を用いて、復号第一周波数領域サンプル列及び復号第二周波数領域サンプル列を適宜結合することにより例えば復号MDCT係数列^X(0),^X(1),…,^X(N-1)である復号周波数領域サンプル列を求める。時間領域変換部は、復号周波数領域サンプル列を時間領域に変換して時系列信号を求める。補助情報を用いた結合は、国際公開公報WO2012/046685に記載された方法を用いて行うことができる。
In this case, the decoding apparatus may further include a combining
なお、ビットレートが低い場合や符号量を更に少なくしたい場合には、符号化装置では第一周波数領域サンプル列のみを符号化して、第一周波数領域サンプル列に対応する符号のみを生成し、第二周波数領域サンプル列に対応する符号は生成せず、復号装置では、符号から得られる第一周波数領域サンプル列と、サンプルの値を0とした第二周波数領域サンプル列を用いて復号周波数領域サンプル列を求めてもよい。 When the bit rate is low or when it is desired to further reduce the code amount, the encoding device encodes only the first frequency domain sample sequence, generates only the code corresponding to the first frequency domain sample sequence, The code corresponding to the two frequency domain sample sequences is not generated, and the decoding apparatus uses the first frequency domain sample sequence obtained from the code and the second frequency domain sample sequence with the sample value of 0 as a decoded frequency domain sample. A column may be obtained.
また、線形予測分析部22、非平滑化振幅スペクトル包絡系列生成部23、平滑化振幅スペクトル包絡系列生成部24、包絡正規化部25及び符号化部26及びパラメータ決定部27は、第一周波数領域サンプル列と第二周波数領域サンプル列とを結合して得られるサンプル列である並べ替え後サンプル列について、第一実施形態又は第二実施形態で説明した符号化処理を行い符号を生成してもよい。例えば算術符号化が行われる場合には、並べ替え後サンプル列に対応するパラメータ符号、線形予測係数符号、整数信号符号及び利得符号が生成される。
Further, the linear
このように、並べ替え後サンプル列について符号化を行うことにより、更に効率良く符号化を行うことができる。 In this way, encoding can be performed more efficiently by encoding the rearranged sample sequence.
この場合、復号装置は、第一実施形態又は第二実施形態で説明した復号処理を行い、復号並べ替え後サンプル列を求め、入力された補助情報を用いて、復号並べ替え後サンプル列を、符号化装置で第一周波数領域サンプル列と第二周波数領域サンプル列とを生成した規則に対応する規則で並べ替えて、例えば復号MDCT係数列^X(0),^X(1),…,^X(N-1)である復号周波数領域サンプル列を求める。時間領域変換部36は、復号周波数領域サンプル列を時間領域に変換して時系列信号を求める。補助情報を用いた並べ替えは、国際公開公報WO2012/046685に記載された方法を用いて行うことができる。
In this case, the decoding device performs the decoding process described in the first embodiment or the second embodiment, obtains a sample string after decoding rearrangement, and uses the input auxiliary information to obtain the sample string after decoding rearrangement, The first frequency domain sample sequence and the second frequency domain sample sequence are rearranged according to the rule corresponding to the rule generated by the encoder, for example, the decoded MDCT coefficient sequence ^ X (0), ^ X (1),. A decoded frequency domain sample sequence which is ^ X (N-1) is obtained. The time
また、符号化装置は、(1)周波数領域サンプル列について符号化処理を行い符号を生成する方法、(2)第一周波数領域サンプル列及び第二周波数領域サンプル列のそれぞれについて符号化処理を行い符号を生成する方法、(3)第一周波数領域サンプル列のみについて符号化処理を行い符号を生成する方法、(4)第一周波数領域サンプル列と第二周波数領域サンプル列とを結合して得られるサンプル列である並べ替え後サンプル列について符号化処理を行い符号を生成する方法、のうち何れの方法をフレームごとに選択するようにしてもよい。この場合、符号化装置は、(1)から(4)の何れの方法を選択したかを表す符号も出力し、復号装置は、フレームごとに入力された符号に従って上記の何れの方法に対応する復号処理を行う。 Further, the encoding device (1) performs a coding process on the frequency domain sample sequence to generate a code, and (2) performs a coding process on each of the first frequency domain sample sequence and the second frequency domain sample sequence. A method of generating a code, (3) a method of generating a code by encoding only the first frequency domain sample sequence, and (4) obtained by combining the first frequency domain sample sequence and the second frequency domain sample sequence. Any method may be selected for each frame from among the methods for generating a code by performing an encoding process on the rearranged sample sequence that is a sample sequence. In this case, the encoding apparatus also outputs a code indicating which method (1) to (4) is selected, and the decoding apparatus corresponds to any of the above methods according to the code input for each frame. Perform decryption.
なお、符号化装置のパラメータ決定部27及び復号装置のパラメータ復号部37には、上記の(1)から(4)の方法のそれぞれに対応させたパラメータηの候補を記憶させておいてもよい。同様に、符号化装置の線形予測分析部22及び復号装置の線形予測係数復号部31には、上記の(1)から(4)の方法のそれぞれに対応させた量子化線形予測係数の候補及び復号線形予測係数の候補を記憶させておいてもよい。
The
非平滑化振幅スペクトル包絡系列生成部23及び非平滑化振幅スペクトル包絡系列生成部422は、例えばMDCT係数列^X(0),^X(1),…,^X(N-1)である周波数領域サンプル列の周期性成分に基づいて、スペクトル包絡系列(非平滑化振幅スペクトル包絡系列)を変形することにより周期性統合包絡系列を生成してもよい。同様に、非平滑化振幅スペクトル包絡系列生成部32は、例えば復号MDCT係数列^X(0),^X(1),…,^X(N-1)である復号周波数領域サンプル列の周期性成分に基づいてスペクトル包絡系列(非平滑化振幅スペクトル包絡系列)を変形することにより周期性統合包絡系列を生成してもよい。この場合、符号化部26の分散パラメータ決定部268、復号部34及び白色化スペクトル系列生成部43は、スペクトル包絡系列(非平滑化振幅スペクトル包絡系列)の代わりに周期性統合包絡系列を用いて上記と同様の処理を行う。周期性統合包絡系列は時系列信号のピッチ周期に起因するピーク付近での近似精度が良いため、周期性統合包絡系列を用いることにより符号化効率を上げることができる。
The unsmoothed amplitude spectrum envelope
例えば、周波数領域サンプル列の周期が大きいほど、スペクトル包絡系列のうちの少なくとも周波数領域サンプル列の周期の整数倍および周期の整数倍の近傍のサンプルの値を大きく変更して得られる系列を周期性統合包絡系列とする。また、時系列信号の周期性の程度が大きいほど、スペクトル包絡系列のうちの少なくとも周波数領域サンプル列の周期の整数倍および周期の整数倍の近傍のサンプルの値を大きく変更して得られる系列を周期性統合包絡系列としてもよい。また、周波数領域サンプル列の周期が大きいほど、スペクトル包絡系列うちの周波数領域サンプル列の周期の整数倍の近傍の多くのサンプルの値を変更して得られる系列を周期性統合包絡系列としてもよい。 For example, the greater the period of the frequency domain sample sequence, the greater the periodicity of at least the integer multiple of the frequency domain sample sequence in the spectrum envelope sequence and the value of samples in the vicinity of the integer multiple of the period. The integrated envelope series. In addition, as the degree of periodicity of the time-series signal is larger, a sequence obtained by greatly changing the value of a sample in the vicinity of at least an integer multiple of the period of the frequency domain sample sequence and the integer multiple of the period of the spectrum envelope sequence. It may be a periodic integrated envelope sequence. Further, as the period of the frequency domain sample sequence is larger, a sequence obtained by changing the values of many samples in the vicinity of an integer multiple of the period of the frequency domain sample sequence in the spectrum envelope sequence may be used as the periodic integrated envelope sequence. .
さらに、NとUを正の整数、Tを周波数領域サンプル列の周期性を有する成分の間隔、Lを間隔Tの小数点以下の桁数、vを1以上の整数、floor(・)を小数点以下を切り捨てて整数値を返す関数、Round(・)を小数点第一位を四捨五入して整数値を返す関数、T’=T×2L、^H[0],…,^H[N-1]をスペクトル包絡系列、δをスペクトル包絡^H[n]と周期性包絡P[k]の混合比率を決める値とし、
(U×T’)/2L−v−1≦k≦(U×T’)/2L+v−1
の範囲の整数kについて、
Furthermore, N and U are positive integers, T is the interval of the periodic component of the frequency domain sample sequence, L is the number of digits after the decimal point of interval T, v is an integer of 1 or more, and floor (·) is the decimal point A function that returns an integer value by rounding down, Round (·) rounds off the first decimal place, and returns an integer value, T ′ = T × 2 L , ^ H [0],…, ^ H [N-1 ] Is a spectral envelope sequence, δ is a value that determines the mixing ratio of spectral envelope ^ H [n] and periodic envelope P [k],
(U × T ′) / 2 L −v−1 ≦ k ≦ (U × T ′) / 2 L + v−1
For an integer k in the range
のように周期性包絡系列P[1],…,P[N]を求め、求まった周期性包絡系列P[1],…,P[N]を用いて以下の式により定義される周期性統合包絡系列^HM[1],…,^H M[N]を求めてもよい。h及びPDは、上記の例以外の所定の値であってもよい。 P [1], ..., P [N] is obtained as shown below, and the periodicity defined by the following equation using the obtained periodic envelope series P [1], ..., P [N] The integrated envelope sequence ^ H M [1], ..., ^ H M [N] may be obtained. h and PD may be predetermined values other than the above example.
スペクトル包絡^H[n]と周期性包絡P[k]の混合比率を決める値であるδは、符号化装置及び復号装置で予め定めておいてもよいし、符号化装置で定めたδの情報を示す符号を生成して復号装置に出力してもよい。後者の場合、復号装置は入力されたδの情報を示す符号を復号することによりδを求める。復号装置の非平滑化振幅スペクトル包絡系列生成部32は、求まったδを用いることにより符号化装置で生成された周期性統合包絡系列と同じ周期性統合包絡系列を求めることができる。
Δ that is a value that determines the mixing ratio of the spectral envelope ^ H [n] and the periodic envelope P [k] may be determined in advance by the encoding device and the decoding device, or may be a value of δ determined by the encoding device. A code indicating information may be generated and output to the decoding device. In the latter case, the decoding apparatus obtains δ by decoding the code indicating the input information of δ. The non-smoothed amplitude spectrum envelope
上記説明した処理は、記載の順にしたがって時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。 The processes described above are not only executed in chronological order according to the order of description, but may be executed in parallel or individually as required by the processing capability of the apparatus that executes the processes.
また、各方法における各種の処理をコンピュータによって実現してもよい。その場合、各方法の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各方法における各種の処理がコンピュータ上で実現される。 Various processes in each method may be realized by a computer. In that case, the processing content of each method is described by a program. Then, by executing this program on a computer, various processes in each method are realized on the computer.
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。 The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used.
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。 The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Further, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。 A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its storage unit. When executing the process, this computer reads the program stored in its own storage unit and executes the process according to the read program. As another embodiment of this program, a computer may read a program directly from a portable recording medium and execute processing according to the program. Further, each time a program is transferred from the server computer to the computer, processing according to the received program may be executed sequentially. Also, the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition. It is good. Note that the program includes information provided for processing by the electronic computer and equivalent to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).
また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。 In addition, although each device is configured by executing a predetermined program on a computer, at least a part of these processing contents may be realized by hardware.
Claims (7)
ηを正の数として、上記時系列信号に対応する周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做した逆フーリエ変換を行うことにより得られる疑似相関関数信号列に対して線形予測分析を行い線形予測係数に変換可能な係数及び予測残差のエネルギーを得る線形予測分析部と、
上記線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列を得ることによりスペクトル包絡の推定を行う非平滑化スペクトル包絡系列生成部と、
上記予測残差のエネルギーの平方根をモデルパラメータとして、上記推定されたスペクトル包絡及び上記モデルパラメータに応じた情報を基に実質的にビット割り当てが変わる符号化を上記時系列信号に対応する周波数領域サンプル列の各係数に対して行う符号化部と、
上記モデルパラメータに応じた情報を表すモデルパラメータ情報符号を得るモデルパラメータ情報符号化部と、
を含む符号化装置。 An encoding device that encodes a time-series signal in a frequency domain,
η is a positive number, and linear prediction is performed for a pseudo correlation function signal sequence obtained by performing an inverse Fourier transform in which the absolute value of the frequency domain sample sequence corresponding to the time series signal is assumed to be a power spectrum as a power spectrum. A linear prediction analysis unit for performing analysis and obtaining energy of coefficients and prediction residuals that can be converted into linear prediction coefficients;
A non-smoothed spectrum envelope sequence generation unit that estimates a spectrum envelope by obtaining a non-smoothed spectrum envelope sequence that is a sequence obtained by raising the amplitude spectrum envelope sequence corresponding to a coefficient that can be converted into the linear prediction coefficient to the power of 1 / η. When,
A frequency domain sample corresponding to the time-series signal encoding with a bit allocation substantially changed based on the estimated spectral envelope and information according to the model parameter, using the square root of the energy of the prediction residual as a model parameter An encoding unit for each coefficient of the sequence;
A model parameter information encoding unit for obtaining a model parameter information code representing information according to the model parameter;
An encoding device including:
上記符号化部は、上記時系列信号に対応する周波数領域サンプル列の各係数をグローバルゲインで割り算した結果の整数部分による系列に対して符号化を行うものであり、
上記モデルパラメータをσとし、mを正の数として、上記モデルパラメータに応じた情報は、σmと上記グローバルゲインとの比の値である、
符号化装置。 The encoding device according to claim 1, wherein
The encoding unit performs encoding on a sequence by an integer part as a result of dividing each coefficient of a frequency domain sample sequence corresponding to the time series signal by a global gain,
The model parameter is σ, m is a positive number, and the information according to the model parameter is a value of a ratio between σ m and the global gain.
Encoding device.
入力された線形予測係数符号を復号して線形予測係数に変換可能な係数を得る線形予測係数復号部と、
入力されたモデルパラメータ符号を復号してモデルパラメータに応じた情報を得るモデルパラメータ情報復号部と、
ηを所定の正の数として、上記線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列を得る非平滑化スペクトル包絡系列生成部と、
上記非平滑化スペクトル包絡系列及び上記モデルパラメータに応じた情報に基づいて実質的に変わるビット割り当てに従って、入力された整数信号符号の復号を行うことにより上記時系列信号に対応する周波数領域サンプル列を得る復号部と、
を含む復号装置。 A decoding device that obtains a frequency domain sample sequence corresponding to a time-series signal by decoding in the frequency domain,
A linear prediction coefficient decoding unit that obtains a coefficient that can be converted into a linear prediction coefficient by decoding the input linear prediction coefficient code;
A model parameter information decoding unit that decodes the input model parameter code to obtain information according to the model parameter;
Generation of a non-smoothed spectral envelope sequence that obtains a non-smoothed spectral envelope sequence that is a sequence obtained by raising the amplitude spectral envelope sequence corresponding to the coefficient that can be converted to the linear prediction coefficient to the 1 / η power, where η is a predetermined positive number And
The frequency domain sample sequence corresponding to the time-series signal is obtained by decoding the input integer signal code according to the bit allocation that substantially changes based on the non-smoothed spectral envelope sequence and the information corresponding to the model parameter. A decoding unit to obtain;
A decoding device.
上記復号部は、入力された整数信号符号の復号を行うことにより得られた係数系列の各係数にグローバルゲインを乗算することにより上記時系列信号に対応する周波数領域サンプル列を得るものであり、
上記モデルパラメータをσとし、mを正の数として、上記モデルパラメータに応じた情報は、σmと上記グローバルゲインとの比の値である、
復号装置。 The decoding device according to claim 3,
The decoding unit obtains a frequency domain sample sequence corresponding to the time series signal by multiplying each coefficient of the coefficient series obtained by decoding the input integer signal code by a global gain,
The model parameter is σ, m is a positive number, and the information according to the model parameter is a value of a ratio between σ m and the global gain.
Decoding device.
ηを正の数として、上記時系列信号に対応する周波数領域サンプル列の絶対値のη乗をパワースペクトルと見做した逆フーリエ変換を行うことにより得られる疑似相関関数信号列に対して線形予測分析を行い線形予測係数に変換可能な係数及び予測残差のエネルギーを得る線形予測分析ステップと、
上記線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列を得ることによりスペクトル包絡の推定を行う非平滑化スペクトル包絡系列生成ステップと、
上記予測残差のエネルギーの平方根をモデルパラメータとして、上記推定されたスペクトル包絡及び上記モデルパラメータに応じた情報を基に実質的にビット割り当てが変わる符号化を上記時系列信号に対応する周波数領域サンプル列の各係数に対して行う符号化ステップと、
上記モデルパラメータに応じた情報を表すモデルパラメータ情報符号を得るモデルパラメータ情報符号化ステップと、
を含む符号化方法。 An encoding method for encoding a time series signal in a frequency domain,
η is a positive number, and linear prediction is performed for a pseudo correlation function signal sequence obtained by performing an inverse Fourier transform in which the absolute value of the frequency domain sample sequence corresponding to the time series signal is assumed to be a power spectrum as a power spectrum. A linear prediction analysis step for obtaining an energy of a coefficient and a prediction residual that can be analyzed and converted into a linear prediction coefficient;
A non-smoothed spectrum envelope sequence generating step for estimating a spectrum envelope by obtaining a non-smoothed spectrum envelope sequence that is a sequence obtained by raising the amplitude spectrum envelope sequence corresponding to a coefficient that can be converted into the linear prediction coefficient to the 1 / η power. When,
A frequency domain sample corresponding to the time-series signal encoding with a bit allocation substantially changed based on the estimated spectral envelope and information according to the model parameter, using the square root of the energy of the prediction residual as a model parameter An encoding step for each coefficient of the sequence;
A model parameter information encoding step for obtaining a model parameter information code representing information according to the model parameter;
An encoding method including:
入力された線形予測係数符号を復号して線形予測係数に変換可能な係数を得る線形予測係数復号ステップと、
入力されたモデルパラメータ符号を復号してモデルパラメータに応じた情報を得るモデルパラメータ情報復号ステップと、
ηを所定の正の数として、上記線形予測係数に変換可能な係数に対応する振幅スペクトル包絡の系列を1/η乗した系列である非平滑化スペクトル包絡系列を得る非平滑化スペクトル包絡系列生成ステップと、
上記非平滑化スペクトル包絡系列及び上記モデルパラメータに応じた情報に基づいて実質的に変わるビット割り当てに従って、入力された整数信号符号の復号を行うことにより上記時系列信号に対応する周波数領域サンプル列を得る復号ステップと、
を含む復号方法。 A decoding method for obtaining a frequency domain sample sequence corresponding to a time-series signal by decoding in the frequency domain,
A linear prediction coefficient decoding step for obtaining a coefficient that can be converted into a linear prediction coefficient by decoding the input linear prediction coefficient code;
A model parameter information decoding step of decoding the input model parameter code to obtain information according to the model parameter;
Generation of a non-smoothed spectral envelope sequence that obtains a non-smoothed spectral envelope sequence that is a sequence obtained by raising the amplitude spectral envelope sequence corresponding to the coefficient that can be converted to the linear prediction coefficient to the 1 / η power, where η is a predetermined positive number Steps,
The frequency domain sample sequence corresponding to the time-series signal is obtained by decoding the input integer signal code according to the bit allocation that substantially changes based on the non-smoothed spectral envelope sequence and the information corresponding to the model parameter. Obtaining a decryption step;
A decoding method including:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015081771A JP6422813B2 (en) | 2015-04-13 | 2015-04-13 | Encoding device, decoding device, method and program thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015081771A JP6422813B2 (en) | 2015-04-13 | 2015-04-13 | Encoding device, decoding device, method and program thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016200750A true JP2016200750A (en) | 2016-12-01 |
JP6422813B2 JP6422813B2 (en) | 2018-11-14 |
Family
ID=57424163
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015081771A Active JP6422813B2 (en) | 2015-04-13 | 2015-04-13 | Encoding device, decoding device, method and program thereof |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6422813B2 (en) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018225412A1 (en) * | 2017-06-07 | 2018-12-13 | 日本電信電話株式会社 | Encoding device, decoding device, smoothing device, reverse-smoothing device, methods therefor, and program |
CN111788628A (en) * | 2018-03-02 | 2020-10-16 | 日本电信电话株式会社 | Encoding device, encoding method, program, and recording medium |
JP2020204771A (en) * | 2017-11-10 | 2020-12-24 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | Audio encoder, audio decorder, method, and computer program which are compatible with encoding and decoding of the least significant bit |
CN113343608A (en) * | 2021-07-21 | 2021-09-03 | 西北工业大学 | Linear stability analysis method based on initial value proxy model |
US11127408B2 (en) | 2017-11-10 | 2021-09-21 | Fraunhofer—Gesellschaft zur F rderung der angewandten Forschung e.V. | Temporal noise shaping |
US11217261B2 (en) | 2017-11-10 | 2022-01-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding audio signals |
US11315580B2 (en) | 2017-11-10 | 2022-04-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
US11380341B2 (en) | 2017-11-10 | 2022-07-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
US11462226B2 (en) | 2017-11-10 | 2022-10-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
US11545167B2 (en) | 2017-11-10 | 2023-01-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
US11562754B2 (en) | 2017-11-10 | 2023-01-24 | Fraunhofer-Gesellschaft Zur F Rderung Der Angewandten Forschung E.V. | Analysis/synthesis windowing function for modulated lapped transformation |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62224122A (en) * | 1986-03-26 | 1987-10-02 | Nippon Telegr & Teleph Corp <Ntt> | Signal coding method |
JP2003050600A (en) * | 1995-08-01 | 2003-02-21 | Qualcomm Inc | Method and system for generating and encoding line spectrum square root |
-
2015
- 2015-04-13 JP JP2015081771A patent/JP6422813B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62224122A (en) * | 1986-03-26 | 1987-10-02 | Nippon Telegr & Teleph Corp <Ntt> | Signal coding method |
JP2003050600A (en) * | 1995-08-01 | 2003-02-21 | Qualcomm Inc | Method and system for generating and encoding line spectrum square root |
Non-Patent Citations (2)
Title |
---|
FUCHS, GUILLAUME, ET AL.: "MDCT-Based Corder for Highly Adaptive Speech and Audio Coding", PROC. EUSIPCO 2009, JPN7018002268, 24 August 2009 (2009-08-24), GB, pages 1264 - 1268, ISSN: 0003831889 * |
LEFEBVRE, R, ET AL.: "8 kbit/s Coding of Speech with 6 ms Frame-length", PROC. ICASSP 1993, vol. 2, JPN6018025329, 27 April 1993 (1993-04-27), US, pages 612 - 615, XP010110531, ISSN: 0003831888, DOI: 10.1109/ICASSP.1993.319384 * |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11087774B2 (en) * | 2017-06-07 | 2021-08-10 | Nippon Telegraph And Telephone Corporation | Encoding apparatus, decoding apparatus, smoothing apparatus, inverse smoothing apparatus, methods therefor, and recording media |
CN110709927A (en) * | 2017-06-07 | 2020-01-17 | 日本电信电话株式会社 | Encoding device, decoding device, smoothing device, inverse smoothing device, methods therefor, and programs therefor |
JPWO2018225412A1 (en) * | 2017-06-07 | 2020-03-19 | 日本電信電話株式会社 | Encoding device, decoding device, smoothing device, inverse smoothing device, their methods, and programs |
CN110709927B (en) * | 2017-06-07 | 2022-11-01 | 日本电信电话株式会社 | Encoding device, decoding device, smoothing device, inverse smoothing device, method thereof, and recording medium |
WO2018225412A1 (en) * | 2017-06-07 | 2018-12-13 | 日本電信電話株式会社 | Encoding device, decoding device, smoothing device, reverse-smoothing device, methods therefor, and program |
US11315580B2 (en) | 2017-11-10 | 2022-04-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
JP7104749B2 (en) | 2017-11-10 | 2022-07-21 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | Audio encoders, audio decoders, methods, and computer programs that are compatible with the least significant bit encoding and decoding |
US11127408B2 (en) | 2017-11-10 | 2021-09-21 | Fraunhofer—Gesellschaft zur F rderung der angewandten Forschung e.V. | Temporal noise shaping |
US11217261B2 (en) | 2017-11-10 | 2022-01-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding audio signals |
US11315583B2 (en) | 2017-11-10 | 2022-04-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
JP2020204771A (en) * | 2017-11-10 | 2020-12-24 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | Audio encoder, audio decorder, method, and computer program which are compatible with encoding and decoding of the least significant bit |
US11380341B2 (en) | 2017-11-10 | 2022-07-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
US11380339B2 (en) | 2017-11-10 | 2022-07-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
US11386909B2 (en) | 2017-11-10 | 2022-07-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
US12033646B2 (en) | 2017-11-10 | 2024-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
US11462226B2 (en) | 2017-11-10 | 2022-10-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
US11562754B2 (en) | 2017-11-10 | 2023-01-24 | Fraunhofer-Gesellschaft Zur F Rderung Der Angewandten Forschung E.V. | Analysis/synthesis windowing function for modulated lapped transformation |
US11545167B2 (en) | 2017-11-10 | 2023-01-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
CN111788628A (en) * | 2018-03-02 | 2020-10-16 | 日本电信电话株式会社 | Encoding device, encoding method, program, and recording medium |
CN111788628B (en) * | 2018-03-02 | 2024-06-07 | 日本电信电话株式会社 | Audio signal encoding device, audio signal encoding method, and recording medium |
CN113343608B (en) * | 2021-07-21 | 2023-02-07 | 西北工业大学 | Linear stability analysis method based on initial value proxy model |
CN113343608A (en) * | 2021-07-21 | 2021-09-03 | 西北工业大学 | Linear stability analysis method based on initial value proxy model |
Also Published As
Publication number | Publication date |
---|---|
JP6422813B2 (en) | 2018-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6422813B2 (en) | Encoding device, decoding device, method and program thereof | |
JP6633787B2 (en) | Linear prediction decoding apparatus, method, program, and recording medium | |
JP6457552B2 (en) | Encoding device, decoding device, method and program thereof | |
JP6595687B2 (en) | Encoding method, encoding device, program, and recording medium | |
JP6744471B2 (en) | Encoding device, decoding device, encoding method, decoding method, encoding program, decoding program, recording medium | |
CN110491402B (en) | Periodic integrated envelope sequence generating apparatus, method, and recording medium | |
JP6387117B2 (en) | Encoding device, decoding device, these methods, program, and recording medium | |
KR102070145B1 (en) | Parameter determination device, method, program and recording medium | |
JP2011009860A (en) | Encoding method, decoding method, encoder, decoder, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170523 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180525 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180710 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180907 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181016 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181017 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6422813 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |