JP2013195706A - Audio coding device, audio coding method, computer program for audio coding, audio decoding device, audio decoding method, and computer program for audio decoding - Google Patents

Audio coding device, audio coding method, computer program for audio coding, audio decoding device, audio decoding method, and computer program for audio decoding Download PDF

Info

Publication number
JP2013195706A
JP2013195706A JP2012062767A JP2012062767A JP2013195706A JP 2013195706 A JP2013195706 A JP 2013195706A JP 2012062767 A JP2012062767 A JP 2012062767A JP 2012062767 A JP2012062767 A JP 2012062767A JP 2013195706 A JP2013195706 A JP 2013195706A
Authority
JP
Japan
Prior art keywords
prediction coefficient
value
prediction
codebook
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012062767A
Other languages
Japanese (ja)
Other versions
JP5990954B2 (en
Inventor
Masanao Suzuki
政直 鈴木
Yohei Kishi
洋平 岸
Shunsuke Takeuchi
俊輔 武内
Miyuki Shirakawa
美由紀 白川
Akira Nakagawa
章 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012062767A priority Critical patent/JP5990954B2/en
Publication of JP2013195706A publication Critical patent/JP2013195706A/en
Application granted granted Critical
Publication of JP5990954B2 publication Critical patent/JP5990954B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an audio coding device capable of reducing an amount of bits to be assigned to a prediction coefficient.SOLUTION: An audio coding device 1 calculates a pair of such first and second prediction coefficients that an error between a linear sum of a value obtained by multiplying a signal of a first channel by the first prediction coefficient and a value obtained by multiplying a signal of a second channel by the second prediction coefficient and a signal of a third channel is minimum. If one of the first and second prediction coefficient does not influence a minimum value of the error or a value of one of prediction coefficients included in the pair of first and second prediction coefficients minimizing the error is outside a quantization value range including a plurality of quantization values defined by a codebook relating for the one of the prediction coefficients, the audio coding device selects a codebook for the other of the first and second prediction coefficients and, with respect to the prediction coefficient for which the codebook is selected, obtains a quantization value minimizing the error out of the plurality of quantization values defined in this codebook.

Description

本発明は、例えば、オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムに関する。また本発明は、例えば、オーディオ復号装置、オーディオ復号方法ならびにオーディオ復号用コンピュータプログラムに関する。   The present invention relates to, for example, an audio encoding device, an audio encoding method, and an audio encoding computer program. The present invention also relates to, for example, an audio decoding device, an audio decoding method, and an audio decoding computer program.

従来より、3チャネル以上のチャネルを持つマルチチャネルオーディオ信号のデータ量を圧縮するためのオーディオ信号の符号化方式が開発されている。そのような符号化方式の一つとして、Moving Picture Experts Group (MPEG)により標準化されたMPEG Surround方式が知られている。MPEG Surround方式では、例えば、符号化対象となる5.1チャネル(5.1ch)のオーディオ信号が時間周波数変換され、その時間周波数変換により得られた周波数信号がダウンミックスされることにより、一旦3チャネルの周波数信号が生成される。さらに、その3チャネルの周波数信号が再度ダウンミックスされることにより2チャネルのステレオ信号に対応する周波数信号が算出される。そしてステレオ信号に対応する周波数信号は、Advanced Audio Coding(AAC)符号化方式及びSpectral Band Replication(SBR)符号化方式により符号化される。
その一方で、MPEG Surround方式では、5.1chの信号を3チャネルの信号へダウンミックスする際、及び3チャネルの信号を2チャネルの信号へダウンミックスする際、音の広がりまたは定位を表す空間情報が算出され、この空間情報が符号化される。このように、MPEG Surround方式では、マルチチャネルオーディオ信号をダウンミックスすることにより生成されたステレオ信号とデータ量の比較的少ない空間情報が符号化される。これにより、MPEG Surround方式では、マルチチャネルオーディオ信号に含まれる各チャネルの信号を独立に符号化するよりも高い圧縮効率が得られる。
Conventionally, an audio signal encoding method for compressing the data amount of a multi-channel audio signal having three or more channels has been developed. As one of such encoding methods, the MPEG Surround method standardized by the Moving Picture Experts Group (MPEG) is known. In the MPEG Surround system, for example, the 5.1 channel (5.1ch) audio signal to be encoded is time-frequency converted, and the frequency signal obtained by the time-frequency conversion is downmixed, so that the frequency of the 3 channel is once set. A signal is generated. Further, the frequency signal corresponding to the 2-channel stereo signal is calculated by downmixing the 3-channel frequency signal again. A frequency signal corresponding to the stereo signal is encoded by an Advanced Audio Coding (AAC) encoding method and a Spectral Band Replication (SBR) encoding method.
On the other hand, in the MPEG Surround system, when downmixing a 5.1ch signal to a 3-channel signal and when downmixing a 3-channel signal to a 2-channel signal, spatial information indicating the sound spread or localization is present. And this spatial information is encoded. Thus, in the MPEG Surround system, a stereo signal generated by downmixing a multi-channel audio signal and spatial information with a relatively small amount of data are encoded. Thereby, in the MPEG Surround system, higher compression efficiency can be obtained than when the signals of the respective channels included in the multi-channel audio signal are independently encoded.

MPEG Surround方式では、ステレオ周波数信号を生成する際に算出される空間情報を符号化するために、予測係数(channel prediction coefficient)が用いられる(例えば、特許文献1を参照)。予測係数とは、3チャネルのうちの一つのチャネルの信号をその他の二つのチャネルの信号に基づいて予測符号化するための係数である。予測係数は、その他の二つのチャネルのそれぞれについて算出される。その二つの予測係数のそれぞれの複数の量子化値及び対応する量子化値が符号帳と称されるテーブルに格納されており、各予測係数に最も近い量子化値が選択される。そしてこの量子化値に対応するインデックス値が可変長符号化される。この符号帳は、使用ビット効率の向上の為に用いられるものである。符号化器と復号器で予め定められた共通の(あるいは共通の方法で作成する)符号帳を持つことで、符号化器は少ないビット数でより重要な情報を復号器へ送ることができる。復号器は、上述の予測係数に基づいて3チャネルのうちの一つのチャネルの信号を再現する。このため、符号化器は、符号帳から最適な予測係数を選択する必要がある。   In the MPEG Surround system, a channel prediction coefficient is used to encode spatial information calculated when a stereo frequency signal is generated (see, for example, Patent Document 1). The prediction coefficient is a coefficient for predictively encoding a signal of one channel among the three channels based on signals of the other two channels. The prediction coefficient is calculated for each of the other two channels. A plurality of quantized values and corresponding quantized values of the two prediction coefficients are stored in a table called a codebook, and the quantized value closest to each predictive coefficient is selected. The index value corresponding to this quantized value is variable-length encoded. This codebook is used for improving the bit efficiency. By having a common code book (or created by a common method) determined in advance by the encoder and decoder, the encoder can send more important information to the decoder with a small number of bits. The decoder reproduces the signal of one of the three channels based on the above prediction coefficient. For this reason, the encoder needs to select an optimal prediction coefficient from the codebook.

特表2008−517338号公報Special table 2008-517338 gazette

二つの予測係数のそれぞれについて、量子化値の数が増えると、それだけ各量子化値に対応する符号の数も増えることになる。そして符号の数が増えるほど、符号同士の直交性を保つために、個々の符号の長さの平均値も長くなり、その結果として二つの予測係数に割り当てるビット量を増やす必要が生じる。したがって、オーディオデータの圧縮効率を高めるために、二つの予測係数に対して割り当てるビット量を短縮できる技術が求められている。   As the number of quantized values increases for each of the two prediction coefficients, the number of codes corresponding to each quantized value increases accordingly. As the number of codes increases, in order to maintain the orthogonality between codes, the average value of the lengths of the individual codes becomes longer. As a result, it is necessary to increase the amount of bits allocated to the two prediction coefficients. Therefore, in order to increase the compression efficiency of audio data, there is a need for a technique that can reduce the amount of bits allocated to two prediction coefficients.

そこで、本明細書は、予測係数に割り当てるビット量を削減可能なオーディオ符号化装置、及びそのようなオーディオ符号化装置によって符号化されたオーディオ信号を復号するオーディオ復号装置を提供することを目的とする。   Therefore, the present specification aims to provide an audio encoding device capable of reducing the amount of bits allocated to a prediction coefficient, and an audio decoding device that decodes an audio signal encoded by such an audio encoding device. To do.

一つの実施形態によれば、オーディオ信号に含まれる複数のチャネルのうちの第1のチャネルの信号及び第2のチャネルの信号と、該第1のチャネルの信号に乗じる第1の予測係数と該第2のチャネルの信号に乗じる第2の予測係数とに基づいて複数のチャネルのうちの第3のチャネルの信号を予測符号化するオーディオ符号化装置が提供される。このオーディオ符号化装置は、第1のチャネルの信号に第1の予測係数を乗じて得られる値と第2のチャネルの信号に第2の予測係数を乗じて得られる値との線形和である第3のチャネルの信号の予測値と第3のチャネルの信号間の誤差が最小となるときの第1及び第2の予測係数の第1の値の組を算出する最小誤差予測係数算出部と、第1の予測係数及び第2の予測係数のうちの一方が、誤差の最小値に影響しないか、または誤差が最小となるときの第1及び第2の予測係数の組に含まれる予測係数の一方の第1の値が、予測係数の一方についての符号帳に規定された複数の量子化値を含む量子化値の範囲から外れている場合、第1の予測係数及び第2の予測係数のうちの他方の予測係数に対する符号帳を選択し、一方、第1の予測係数及び第2の予測係数の両方が誤差の最小値に影響し、かつ、誤差が最小となるときの第1及び第2の予測係数の組に含まれる第1の予測係数の第1の値及び第2の予測係数の第1の値のそれぞれが、その予測係数についての符号帳に規定された複数の量子化値を含む量子化値の範囲内に含まれる場合、第1及び第2の予測係数のそれぞれごとに符号帳を選択する符号帳選択部と、第1及び第2の予測係数のうち、符号帳が選択された予測係数について、その符号帳に規定されている複数の量子化値のうち、誤差が最小となる量子化値を求め、その量子化値を符号化することで符号化予測係数を求める予測係数符号化部とを有する。   According to one embodiment, a first channel signal and a second channel signal among a plurality of channels included in an audio signal, a first prediction coefficient to be multiplied by the first channel signal, and the An audio encoding device is provided that predictively encodes a third channel signal of a plurality of channels based on a second prediction coefficient multiplied by a second channel signal. This audio encoding device is a linear sum of a value obtained by multiplying a first channel signal by a first prediction coefficient and a value obtained by multiplying a second channel signal by a second prediction coefficient. A minimum error prediction coefficient calculation unit that calculates a set of first values of the first and second prediction coefficients when the error between the predicted value of the third channel signal and the third channel signal is minimized; , One of the first prediction coefficient and the second prediction coefficient does not affect the minimum value of the error, or the prediction coefficient included in the set of the first and second prediction coefficients when the error is the minimum The first prediction coefficient and the second prediction coefficient when the first value of one of the two is out of the range of quantization values including a plurality of quantization values defined in the codebook for one of the prediction coefficients A codebook for the other prediction coefficient is selected, while the first prediction coefficient and Both the second prediction coefficient affects the minimum value of the error, and the first value and the first value of the first prediction coefficient included in the set of the first and second prediction coefficients when the error is minimum When each of the first values of the two prediction coefficients is included in the range of quantization values including a plurality of quantization values defined in the codebook for the prediction coefficient, the first and second prediction coefficients A codebook selection unit that selects a codebook for each of the first and second prediction coefficients, and for a prediction coefficient for which the codebook is selected, a plurality of quantized values defined in the codebook Among them, a prediction coefficient encoding unit that obtains a quantized value that minimizes an error and encodes the quantized value to obtain an encoded prediction coefficient.

また他の実施形態によれば、オーディオ信号に含まれる複数のチャネルのうちの第1及び第2のチャネルの信号が符号化された符号化チャネル信号データと、第1及び第2のチャネルの信号に基づいて複数のチャネルのうちの第3のチャネルの信号を予測するための第1及び第2の予測係数が符号化された符号化予測係数と、第1の予測係数についての複数の量子化値を規定する第1の符号帳及び第2の予測係数についての複数の量子化値を規定する第2の符号帳のうち選択された符号帳を表す符号帳選択情報とを、所定のデータ形式に従って格納する符号化オーディオデータからオーディオ信号を復号するオーディオ復号装置が提供される。このオーディオ復号装置は、そのデータ形式に従って、符号化オーディオデータから、符号化チャネル信号データと、符号化予測係数と、符号帳選択情報とを取り出す分離部と、符号化チャネル信号データを復号することにより第1及び第2のチャネルの信号を再生するチャネル信号復号部と、第1及び第2の符号帳のうち、符号帳選択情報に選択されたことが示された符号帳に規定された複数の量子化値のうち、符号化予測係数に対応する量子化値を特定することにより第1及び第2の予測係数を再生する予測係数復号部と、再生された第1の予測係数に第1のチャネルの信号を乗じて第1の値を求め、かつ、再生された第2の予測係数に第2のチャネルの信号を乗じて第2の値を求め、第1の値と第2の値の和を第3のチャネルの信号として再生する予測復号部とを有する。   According to another embodiment, encoded channel signal data obtained by encoding signals of the first and second channels among a plurality of channels included in the audio signal, and signals of the first and second channels. And a plurality of quantizations for the first prediction coefficient and a first prediction coefficient encoded with the first and second prediction coefficients for predicting a signal of the third channel among the plurality of channels. A codebook selection information representing a codebook selected from among a first codebook defining a value and a second codebook defining a plurality of quantized values for the second prediction coefficient, and a predetermined data format An audio decoding device for decoding an audio signal from encoded audio data stored according to the above is provided. The audio decoding device, according to the data format, a decoding unit that extracts encoded channel signal data, an encoded prediction coefficient, and codebook selection information from encoded audio data, and decodes the encoded channel signal data A channel signal decoding unit that reproduces the first and second channel signals, and a plurality of codebooks defined in the codebook selected from the first and second codebooks as codebook selection information Among the quantized values, a predictive coefficient decoding unit that reproduces the first and second predictive coefficients by specifying a quantized value corresponding to the encoded predictive coefficient, and the reproduced first predictive coefficient in the first The first value is obtained by multiplying the signal of the second channel, the second value is obtained by multiplying the reproduced second prediction coefficient by the signal of the second channel, and the first value and the second value are obtained. Of the third channel signal and And a prediction decoding unit that reproduces Te.

本発明の目的及び利点は、請求項において特に指摘されたエレメント及び組み合わせにより実現され、かつ達成される。
上記の一般的な記述及び下記の詳細な記述の何れも、例示的かつ説明的なものであり、請求項のように、本発明を限定するものではないことを理解されたい。
The objects and advantages of the invention will be realized and attained by means of the elements and combinations particularly pointed out in the appended claims.
It should be understood that both the foregoing general description and the following detailed description are exemplary and explanatory and are not restrictive of the invention as claimed.

本明細書に開示されたオーディオ符号化装置及びオーディオ復号装置は、予測係数に割り当てるビット量を削減できる。   The audio encoding device and audio decoding device disclosed in this specification can reduce the amount of bits allocated to a prediction coefficient.

一つの実施形態によるオーディオ符号化装置の概略構成図である。1 is a schematic configuration diagram of an audio encoding device according to one embodiment. FIG. 類似度に対する量子化テーブルの一例を示す図である。It is a figure which shows an example of the quantization table with respect to similarity. インデックスの差分値と類似度符号の関係を示すテーブルの一例を示す図である。It is a figure which shows an example of the table which shows the relationship between the difference value of an index, and a similarity code. 強度差に対する量子化テーブルの一例を示す図である。It is a figure which shows an example of the quantization table with respect to an intensity difference. 符号化されたオーディオ信号が格納されたデータ形式の一例を示す図である。It is a figure which shows an example of the data format in which the encoded audio signal was stored. 予測符号化部の構成図である。It is a block diagram of a prediction encoding part. 予測係数c1、c2ならびに予測誤差dをそれぞれ互いに直交する座標軸で表す放物線柱面状の予測誤差の分布の概念図である。FIG. 4 is a conceptual diagram of a parabolic columnar prediction error distribution in which prediction coefficients c 1 and c 2 and a prediction error d are expressed by mutually orthogonal coordinate axes. 予測係数c1、c2ならびに予測誤差dをそれぞれ互いに直交する座標軸で表す楕円放物面状の予測誤差の分布の概念図である。FIG. 6 is a conceptual diagram of an elliptic paraboloid prediction error distribution in which prediction coefficients c 1 and c 2 and a prediction error d are expressed by mutually orthogonal coordinate axes. 予測誤差dの分布形状が楕円型である場合における、予測誤差dが最小となるときの予測係数c1min、c2minと予測係数c1、c2の値の範囲との位置関係を表す概念図である。Conceptual diagram showing the positional relationship between the prediction coefficients c 1min and c 2min and the range of values of the prediction coefficients c 1 and c 2 when the prediction error d is minimum when the distribution shape of the prediction error d is elliptical It is. 予測誤差dの分布形状が楕円型である場合における、符号帳に規定された予測係数の量子化値の範囲と予測誤差曲面との接点と、選択される符号帳との関係を示す図である。It is a figure which shows the relationship between the contact of the range of the quantization value of the prediction coefficient prescribed | regulated to the code book, and the prediction error curved surface, and the code book selected when the distribution shape of the prediction error d is elliptical. . 予測誤差dの分布形状が楕円型である場合の符号帳選択処理の動作フローチャートである。It is an operation | movement flowchart of a codebook selection process in case the distribution shape of the prediction error d is elliptical. 予測誤差dの分布形状が放物線型である場合における、予測誤差dの最小値に対応する予測係数c1min、c2minと予測係数の値の範囲との関係を示す図である。FIG. 7 is a diagram illustrating a relationship between prediction coefficients c 1min and c 2min corresponding to the minimum value of the prediction error d and a range of values of the prediction coefficient when the distribution shape of the prediction error d is a parabolic type. 予測誤差dの分布形状が放物線型である場合の符号帳選択処理の動作フローチャートである。It is an operation | movement flowchart of a codebook selection process in case the distribution shape of the prediction error d is a parabolic type. 予測係数の量子化値を格納した符号帳の一例を示す図である。It is a figure which shows an example of the codebook which stored the quantization value of the prediction coefficient. オーディオ符号化処理の動作フローチャートを示す。The operation | movement flowchart of an audio encoding process is shown. 一実施形態によるオーディオ復号装置の概略構成図である。It is a schematic block diagram of the audio decoding apparatus by one Embodiment. オーディオ復号装置により実行されるオーディオ復号処理の動作フローチャートである。It is an operation | movement flowchart of the audio decoding process performed by the audio decoding apparatus.

以下、図を参照しつつ、一つの実施形態によるオーディオ符号化装置について説明する。このオーディオ符号化装置は、3個のチャネルのうちの一つのチャネルの周波数信号を、他の二つのチャネルの周波数信号に予測係数を乗じて得られる値の線形和として予測する。そしてこのオーディオ符号化装置は、予測されるチャネルの周波数信号と上記の線形和間の予測誤差の分布形状を推定し、その分布形状及び予測誤差の最小値に対応する各予測係数に応じて、予測係数のそれぞれについて符号帳を使用するか否か判定する。
なお、本実施形態では、符号化対象となるマルチチャネルオーディオ信号は、5.1chオーディオ信号である。
Hereinafter, an audio encoding device according to an embodiment will be described with reference to the drawings. This audio encoding apparatus predicts the frequency signal of one of the three channels as a linear sum of values obtained by multiplying the frequency signals of the other two channels by a prediction coefficient. And this audio encoding device estimates the distribution shape of the prediction error between the frequency signal of the predicted channel and the above linear sum, and according to each prediction coefficient corresponding to the distribution shape and the minimum value of the prediction error, It is determined whether to use a codebook for each prediction coefficient.
In the present embodiment, the multi-channel audio signal to be encoded is a 5.1ch audio signal.

図1は、一つの実施形態によるオーディオ符号化装置1の概略構成図である。図1に示すように、オーディオ符号化装置1は、時間周波数変換部11と、第1ダウンミックス部12と、第2ダウンミックス部13と、予測符号化部14と、空間情報符号化部15と、チャネル信号符号化部16と、多重化部17とを有する。   FIG. 1 is a schematic configuration diagram of an audio encoding device 1 according to one embodiment. As shown in FIG. 1, the audio encoding device 1 includes a time-frequency conversion unit 11, a first downmix unit 12, a second downmix unit 13, a prediction encoding unit 14, and a spatial information encoding unit 15. A channel signal encoding unit 16 and a multiplexing unit 17.

オーディオ符号化装置1が有するこれらの各部は、それぞれ別個の回路として形成される。あるいはオーディオ符号化装置1が有するこれらの各部は、その各部に対応する回路が集積された一つの集積回路としてオーディオ符号化装置1に実装されてもよい。さらに、オーディオ符号化装置1が有するこれらの各部は、オーディオ符号化装置1が有するプロセッサ上で実行されるコンピュータプログラムにより実現される、機能モジュールであってもよい。   Each of these units included in the audio encoding device 1 is formed as a separate circuit. Alternatively, these units included in the audio encoding device 1 may be mounted on the audio encoding device 1 as one integrated circuit in which circuits corresponding to the respective units are integrated. Furthermore, each of these units included in the audio encoding device 1 may be a functional module realized by a computer program executed on a processor included in the audio encoding device 1.

時間周波数変換部11は、オーディオ符号化装置1に入力されたマルチチャネルオーディオ信号の時間領域の各チャネルの信号をそれぞれフレーム単位で時間周波数変換することにより、各チャネルの周波数信号に変換する。
本実施形態では、時間周波数変換部11は、次式のQuadrature Mirror Filter(QMF)フィルタバンクを用いて、各チャネルの信号を周波数信号に変換する。

Figure 2013195706
ここでnは時間を表す変数であり、1フレームのオーディオ信号を時間方向に128等分したときのn番目の時間を表す。なお、フレーム長は、例えば、10〜80msecの何れかとすることができる。またkは周波数帯域を表す変数であり、周波数信号が有する周波数帯域を64等分したときのk番目の周波数帯域を表す。またQMF(k,n)は、時間n、周波数kの周波数信号を出力するためのQMFである。時間周波数変換部11は、QMF(k,n)を入力されたチャネルの1フレーム分のオーディオ信号に乗じることにより、そのチャネルの周波数信号を生成する。
なお、時間周波数変換部11は、高速フーリエ変換、離散コサイン変換、修正離散コサイン変換など、他の時間周波数変換処理を用いて、各チャネルの信号を、それぞれ、周波数信号に変換してもよい。 The time-frequency conversion unit 11 converts the signal of each channel in the time domain of the multi-channel audio signal input to the audio encoding device 1 into a frequency signal of each channel by performing time-frequency conversion for each frame.
In the present embodiment, the time-frequency converter 11 converts the signal of each channel into a frequency signal using a quadrature mirror filter (QMF) filter bank of the following equation.
Figure 2013195706
Here, n is a variable representing time, and represents the nth time when an audio signal of one frame is equally divided into 128 in the time direction. The frame length can be any of 10 to 80 msec, for example. K is a variable representing the frequency band, and represents the kth frequency band when the frequency band of the frequency signal is divided into 64 equal parts. QMF (k, n) is QMF for outputting a frequency signal of time n and frequency k. The time-frequency converter 11 multiplies the audio signal for one frame of the input channel by QMF (k, n) to generate a frequency signal of that channel.
Note that the time-frequency conversion unit 11 may convert each channel signal into a frequency signal using other time-frequency conversion processing such as fast Fourier transform, discrete cosine transform, and modified discrete cosine transform.

時間周波数変換部11は、フレーム単位で各チャネルの周波数信号を算出する度に、各チャネルの周波数信号を第1ダウンミックス部12へ出力する。   The time frequency conversion unit 11 outputs the frequency signal of each channel to the first downmix unit 12 every time the frequency signal of each channel is calculated in units of frames.

第1ダウンミックス部12は、各チャネルの周波数信号を受け取る度に、それら各チャネルの周波数信号をダウンミックスすることにより、左チャネル、中央チャネル及び右チャネルの周波数信号を生成する。例えば、第1ダウンミックス部12は、次式に従ってこれら3個のチャネルの周波数信号を算出する。

Figure 2013195706
ここでLRe(k,n)は、左前方チャネルの周波数信号L(k,n)のうちの実部を表し、LIm(k,n)は、左前方チャネルの周波数信号L(k,n)のうちの虚部を表す。またSLRe(k,n)は、左後方チャネルの周波数信号SL(k,n)のうちの実部を表し、SLIm(k,n)は、左後方チャネルの周波数信号SL(k,n)のうちの虚部を表す。そしてLin(k,n)は、ダウンミックスにより生成される左チャネルの周波数信号である。なお、LinRe(k,n)は、左チャネルの周波数信号のうちの実部を表し、LinIm(k,n)は、左チャネルの周波数信号のうちの虚部を表す。
同様に、RRe(k,n)は、右前方チャネルの周波数信号R(k,n)のうちの実部を表し、RIm(k,n)は、右前方チャネルの周波数信号R(k,n)のうちの虚部を表す。またSRRe(k,n)は、右後方チャネルの周波数信号SR(k,n)のうちの実部を表し、SRIm(k,n)は、右後方チャネルの周波数信号SR(k,n)のうちの虚部を表す。そしてRin(k,n)は、ダウンミックスにより生成される右チャネルの周波数信号である。なお、RinRe(k,n)は、右チャネルの周波数信号のうちの実部を表し、RinIm(k,n)は、右チャネルの周波数信号のうちの虚部を表す。
さらに、CRe(k,n)は、中央チャネルの周波数信号C(k,n)のうちの実部を表し、CIm(k,n)は、中央チャネルの周波数信号C(k,n)のうちの虚部を表す。またLFERe(k,n)は、重低音チャネルの周波数信号LFE(k,n)のうちの実部を表し、LFEIm(k,n)は、重低音チャネルの周波数信号LFE(k,n)のうちの虚部を表す。そしてCin(k,n)は、ダウンミックスにより生成される中央チャネルの周波数信号である。なお、CinRe(k,n)は、中央チャネルの周波数信号Cin(k,n)のうちの実部を表し、CinIm(k,n)は、中央チャネルの周波数信号Cin(k,n)のうちの虚部を表す。 The first downmix unit 12 generates frequency signals of the left channel, the center channel, and the right channel by downmixing the frequency signals of each channel each time the frequency signal of each channel is received. For example, the first downmix unit 12 calculates the frequency signals of these three channels according to the following equation.
Figure 2013195706
Where L Re (k, n) represents the real part of the left front channel frequency signal L (k, n), and L Im (k, n) represents the left front channel frequency signal L (k, n). represents the imaginary part of n). SL Re (k, n) represents the real part of the left rear channel frequency signal SL (k, n), and SL Im (k, n) represents the left rear channel frequency signal SL (k, n). ) Represents the imaginary part. L in (k, n) is a frequency signal of the left channel generated by downmixing. L inRe (k, n) represents the real part of the left channel frequency signal, and L inIm (k, n) represents the imaginary part of the left channel frequency signal.
Similarly, R Re (k, n) represents the real part of the right front channel frequency signal R (k, n), and R Im (k, n) represents the right front channel frequency signal R (k , n) represents the imaginary part. SR Re (k, n) represents the real part of the right rear channel frequency signal SR (k, n), and SR Im (k, n) represents the right rear channel frequency signal SR (k, n). ) Represents the imaginary part. R in (k, n) is a right channel frequency signal generated by downmixing. R inRe (k, n) represents the real part of the right channel frequency signal, and R inIm (k, n) represents the imaginary part of the right channel frequency signal.
Furthermore, C Re (k, n) represents the real part of the center channel frequency signal C (k, n), and C Im (k, n) represents the center channel frequency signal C (k, n). Represents the imaginary part. LFE Re (k, n) represents the real part of the frequency signal LFE (k, n) of the heavy bass channel, and LFE Im (k, n) represents the frequency signal LFE (k, n) of the heavy bass channel. ) Represents the imaginary part. C in (k, n) is a center channel frequency signal generated by downmixing. C inRe (k, n) represents the real part of the center channel frequency signal C in (k, n), and C inIm (k, n) represents the center channel frequency signal C in (k, n). represents the imaginary part of n).

さらに、第1ダウンミックス部12は、ダウンミックスされる二つのチャネルの周波数信号間の空間情報として、音の定位を表す情報であるその周波数信号間の強度差と、音の広がりを表す情報であるその周波数信号間の類似度を周波数帯域ごとに算出する。第1ダウンミックス部12が算出するこれらの空間情報は、3チャネル空間情報の一例である。本実施形態では、第1ダウンミックス部12は、次式に従って左チャネルについての周波数帯域kの強度差CLDL(k)と類似度ICCL(k)を算出する。

Figure 2013195706
ただしNは、1フレームに含まれる時間方向のサンプル点数であり、本実施形態では、Nは128である。またeL(k)は、左前方チャネルの周波数信号L(k,n)の自己相関値であり、eSL(k)は、左後方チャネルの周波数信号SL(k,n)の自己相関値である。またeLSL(k)は、左前方チャネルの周波数信号L(k,n)と左後方チャネルの周波数信号SL(k,n)との相互相関値である。
同様に、第1ダウンミックス部12は、次式に従って右チャネルについての周波数帯域kの強度差CLDR(k)と類似度ICCR(k)を算出する。
Figure 2013195706
eR(k)は、右前方チャネルの周波数信号R(k,n)の自己相関値であり、eSR(k)は、右後方チャネルの周波数信号SR(k,n)の自己相関値である。またeRSR(k)は、右前方チャネルの周波数信号R(k,n)と右後方チャネルの周波数信号SR(k,n)との相互相関値である。
さらに、第1ダウンミックス部12は、次式に従って中央チャネルについての周波数帯域kの強度差CLDC(k)を算出する。
Figure 2013195706
eC(k)は、中央チャネルの周波数信号C(k,n)の自己相関値であり、eLFE(k)は、重低音チャネルの周波数信号LFE(k,n)の自己相関値である。 Further, the first downmix unit 12 is information indicating the intensity difference between the frequency signals, which is information indicating the localization of the sound, and the information indicating the spread of the sound, as spatial information between the frequency signals of the two channels to be downmixed. The similarity between the frequency signals is calculated for each frequency band. The spatial information calculated by the first downmix unit 12 is an example of 3-channel spatial information. In the present embodiment, the first downmix unit 12 calculates the intensity difference CLD L (k) and the similarity ICC L (k) of the frequency band k for the left channel according to the following equation.
Figure 2013195706
However, N is the number of sample points in the time direction included in one frame, and N is 128 in this embodiment. E L (k) is the autocorrelation value of the frequency signal L (k, n) of the left front channel, and e SL (k) is the autocorrelation value of the frequency signal SL (k, n) of the left rear channel. It is. E LSL (k) is a cross-correlation value between the frequency signal L (k, n) of the left front channel and the frequency signal SL (k, n) of the left rear channel.
Similarly, the first downmix unit 12 calculates the intensity difference CLD R (k) and the similarity ICC R (k) of the frequency band k for the right channel according to the following equation.
Figure 2013195706
e R (k) is the autocorrelation value of the frequency signal R (k, n) of the right front channel, and e SR (k) is the autocorrelation value of the frequency signal SR (k, n) of the right rear channel. is there. E RSR (k) is a cross-correlation value between the frequency signal R (k, n) of the right front channel and the frequency signal SR (k, n) of the right rear channel.
Further, the first downmix unit 12 calculates the intensity difference CLD C (k) of the frequency band k for the center channel according to the following equation.
Figure 2013195706
e C (k) is the autocorrelation value of the center channel frequency signal C (k, n), and e LFE (k) is the autocorrelation value of the heavy bass channel frequency signal LFE (k, n). .

第1ダウンミックス部12は、3チャネルの周波数信号を生成する度に、その3チャネルの周波数信号を第2ダウンミックス部13へ出力し、一方、空間情報を空間情報符号化部15へ出力する。   Each time the first downmix unit 12 generates a 3-channel frequency signal, the first downmix unit 12 outputs the 3-channel frequency signal to the second downmix unit 13, and outputs spatial information to the spatial information encoding unit 15. .

第2ダウンミックス部13は、第1ダウンミックス部12から受け取った左チャネルの周波数信号と中央チャネルの周波数信号をダウンミックスすることにより、ステレオ周波数信号のうちの左側周波数信号を生成する。また第2ダウンミックス部13は、第1ダウンミックス部12から受け取った右チャネルの周波数信号と中央チャネルの周波数信号をダウンミックスすることにより、ステレオ周波数信号のうちの右側周波数信号を生成する。
第2ダウンミックス部13は、例えば、次式に従ってステレオ周波数信号の左側周波数信号Lp0(k,n)及び右側周波数信号Rp0(k,n)を生成する。さらに第2ダウンミックス部13は、符号帳に含まれる予測係数を選択するために利用される中央チャネルの信号Cp0(k,n)を次式に従って算出する。

Figure 2013195706
ここで、Lin(k,n)、Rin(k,n)、Cin(k,n)は、それぞれ、第1ダウンミックス部12により生成された左チャネル、右チャネル及び中央チャネルの周波数信号である。左側周波数信号Lp0(k,n)は、元のマルチチャネルオーディオ信号の左前方チャネル、左後方チャネル、中央チャネル及び重低音チャネルの周波数信号が合成されたものとなる。同様に、右側周波数信号Rp0(k,n)は、元のマルチチャネルオーディオ信号の右前方チャネル、右後方チャネル、中央チャネル及び重低音チャネルの周波数信号が合成されたものとなる。 The second downmix unit 13 generates a left frequency signal among the stereo frequency signals by downmixing the left channel frequency signal and the center channel frequency signal received from the first downmix unit 12. The second downmix unit 13 generates the right frequency signal of the stereo frequency signal by downmixing the right channel frequency signal and the center channel frequency signal received from the first downmix unit 12.
For example, the second downmix unit 13 generates the left frequency signal L p0 (k, n) and the right frequency signal R p0 (k, n) of the stereo frequency signal according to the following equation. Further, the second downmixing unit 13 calculates a center channel signal C p0 (k, n) used for selecting a prediction coefficient included in the codebook according to the following equation.
Figure 2013195706
Here, L in (k, n), R in (k, n), and C in (k, n) are the frequencies of the left channel, the right channel, and the center channel generated by the first downmix unit 12, respectively. Signal. The left frequency signal L p0 (k, n) is obtained by synthesizing the frequency signals of the left front channel, the left rear channel, the center channel, and the heavy bass channel of the original multi-channel audio signal. Similarly, the right frequency signal R p0 (k, n) is obtained by synthesizing the frequency signals of the right front channel, the right rear channel, the center channel, and the heavy bass channel of the original multi-channel audio signal.

第2ダウンミックス部13は、ステレオ周波数信号の左側周波数信号Lp0(k,n)及び右側周波数信号Rp0(k,n)をチャネル信号符号化部16へ出力する。さらに、第2ダウンミックス部13は、その左側周波数信号Lp0(k,n)及び右側周波数信号Rp0(k,n)とともに、中央チャネルの周波数信号Cp0(k,n)を予測符号化部14へ出力する。 The second downmix unit 13 outputs the left frequency signal L p0 (k, n) and the right frequency signal R p0 (k, n) of the stereo frequency signal to the channel signal encoding unit 16. Further, the second downmix unit 13 predictively encodes the center channel frequency signal C p0 (k, n) together with the left frequency signal L p0 (k, n) and the right frequency signal R p0 (k, n). To the unit 14.

予測符号化部14は、周波数帯域ごとに、Lp0(k,n)及びRp0(k,n)を用いてCp0(k,n)を近似的に表す予測係数C1(k)、C2(k)を求める。そして予測符号化部14は、その予測係数C1(k)、C2(k)の量子化値に対応するインデックス値を可変長符号化することにより、予測係数符号idxc1(k)、idxc2(k)を求める。そして予測符号化部14は、予測係数符号idxc1(k)、idxc2(k)を空間情報符号化部15へ出力する。さらに予測符号化部14は、周波数帯域ごとに、予測係数C1(k)、C2(k)を求めるために利用した符号帳を表す符号帳選択情報を多重化部17へ出力する。なお、予測符号化部14の詳細については後述する。 The prediction encoding unit 14 uses, for each frequency band, a prediction coefficient C 1 (k) that approximately represents C p0 (k, n) using L p0 (k, n) and R p0 (k, n), Find C 2 (k). Then, the predictive coding unit 14 performs variable length coding on the index values corresponding to the quantized values of the predictive coefficients C 1 (k) and C 2 (k), so that the predictive coefficient codes idxc 1 (k) and idxc 2 Find (k). Then, the prediction encoding unit 14 outputs the prediction coefficient codes idxc 1 (k) and idxc 2 (k) to the spatial information encoding unit 15. Further, the predictive coding unit 14 outputs code book selection information representing the code book used for obtaining the prediction coefficients C 1 (k) and C 2 (k) to the multiplexing unit 17 for each frequency band. Details of the prediction encoding unit 14 will be described later.

空間情報符号化部15は、第1ダウンミックス部12から受け取った空間情報を符号化する。さらに空間情報符号化部15は、符号化された空間情報とともに、予測符号化部14から受け取った予測係数符号idxc1(k)、idxc2(k)を多重化することによりMPEG Surround符号(以下、MPS符号と呼ぶ)を生成する。 The spatial information encoding unit 15 encodes the spatial information received from the first downmix unit 12. Further, the spatial information encoding unit 15 multiplexes the prediction coefficient codes idxc 1 (k) and idxc 2 (k) received from the predictive encoding unit 14 together with the encoded spatial information to thereby generate an MPEG Surround code (hereinafter referred to as MPEG Surround code). , Called MPS code).

空間情報符号化部15は、空間情報中の類似度の値とインデックス値の対応を示した量子化テーブルを参照する。そして空間情報符号化部15は、量子化テーブルを参照することにより、各周波数帯域についてそれぞれの類似度ICCi(k)(i=L,R,0)と最も値が近いインデックス値を決定する。なお、量子化テーブルは、予め、空間情報符号化部15が有するメモリに格納される。 The spatial information encoding unit 15 refers to a quantization table indicating the correspondence between the similarity value and the index value in the spatial information. Then, the spatial information encoding unit 15 refers to the quantization table to determine an index value that is closest to each similarity ICC i (k) (i = L, R, 0) for each frequency band. . Note that the quantization table is stored in advance in a memory included in the spatial information encoding unit 15.

図2は、類似度に対する量子化テーブルの一例を示す図である。図2に示す量子化テーブル200において、上側の行210の各欄はインデックス値を表し、下側の行220の各欄は、同じ列のインデックス値に対応する類似度の代表値を表す。また、類似度が取りうる値の範囲は-0.99〜+1である。例えば、周波数帯域kに対する類似度が0.6である場合、量子化テーブル200では、インデックス値3に対応する類似度の代表値が、周波数帯域kに対する類似度に最も近い。そこで、空間情報符号化部15は、周波数帯域kに対するインデックス値を3に設定する。   FIG. 2 is a diagram illustrating an example of a quantization table for similarity. In the quantization table 200 shown in FIG. 2, each column in the upper row 210 represents an index value, and each column in the lower row 220 represents a representative value of similarity corresponding to the index value in the same column. The range of values that the similarity can take is -0.99 to +1. For example, when the similarity to the frequency band k is 0.6, in the quantization table 200, the representative value of the similarity corresponding to the index value 3 is closest to the similarity to the frequency band k. Therefore, the spatial information encoding unit 15 sets the index value for the frequency band k to 3.

次に、空間情報符号化部15は、各周波数帯域について、周波数方向に沿ってインデックス間の差分値を求める。例えば、周波数帯域kに対するインデックス値が3であり、周波数帯域(k-1)に対するインデックス値が0であれば、空間情報符号化部15は、周波数帯域kに対するインデックスの差分値を3とする。   Next, the spatial information encoding unit 15 obtains a difference value between indexes along the frequency direction for each frequency band. For example, if the index value for the frequency band k is 3 and the index value for the frequency band (k−1) is 0, the spatial information encoding unit 15 sets the index difference value for the frequency band k to 3.

空間情報符号化部15は、インデックス値の差分値と類似度符号の対応を示した符号化テーブルを参照する。そして空間情報符号化部15は、符号化テーブルを参照することにより、類似度ICCi(k)(i=L,R)の各周波数についてインデックス間の差分値に対する類似度符号idxicci(k)(i=L,R)を決定する。なお、符号化テーブルは、予め、空間情報符号化部15が有するメモリに格納される。また、類似度符号は、例えば、ハフマン符号あるいは算術符号など、出現頻度が高い差分値ほど符号長が短くなる可変長符号とすることができる。 The spatial information encoding unit 15 refers to an encoding table that indicates the correspondence between index value difference values and similarity codes. Then, the spatial information encoding unit 15 refers to the encoding table to determine the similarity code idxicc i (k) for the difference value between the indexes for each frequency of the similarity ICC i (k) (i = L, R). Determine (i = L, R). Note that the encoding table is stored in advance in a memory included in the spatial information encoding unit 15. Also, the similarity code can be a variable length code such as a Huffman code or an arithmetic code, in which the code length is shorter as the difference value has a higher appearance frequency.

図3は、インデックスの差分値と類似度符号の関係を示すテーブルの一例を示す図である。この例では、類似度符号はハフマン符号である。図3に示す符号化テーブル300において、左側の列の各欄はインデックスの差分値を表し、右側の列の各欄は、同じ行のインデックスの差分値に対応する類似度符号を表す。例えば、周波数帯域kの類似度ICCL(k)に対するインデックスの差分値が3である場合、空間情報符号化部15は、符号化テーブル300を参照することにより、周波数帯域kの類似度ICCL(k)に対する類似度符号idxiccL(k)を"111110"に設定する。 FIG. 3 is a diagram illustrating an example of a table indicating the relationship between index difference values and similarity codes. In this example, the similarity code is a Huffman code. In the encoding table 300 shown in FIG. 3, each column in the left column represents an index difference value, and each column in the right column represents a similarity code corresponding to the index difference value in the same row. For example, when the index difference value with respect to the similarity ICC L (k) of the frequency band k is 3, the spatial information encoding unit 15 refers to the encoding table 300 to thereby determine the similarity ICC L of the frequency band k. The similarity code idxicc L (k) for (k) is set to “111110”.

また空間情報符号化部15は、強度差の値とインデックス値との対応関係を示した量子化テーブルを参照する。そして空間情報符号化部15は、量子化テーブルを参照することにより、各周波数についての強度差CLDj(k)(j=L,R,C)と最も値が近いインデックス値を決定する。空間情報符号化部15は、各周波数帯域について、周波数方向に沿ってインデックス間の差分値を求める。例えば、周波数帯域kに対するインデックス値が2であり、周波数帯域(k-1)に対するインデックス値が4であれば、空間情報符号化部15は、周波数帯域kに対するインデックスの差分値を-2とする。 The spatial information encoding unit 15 refers to a quantization table that indicates the correspondence between the intensity difference value and the index value. Then, the spatial information encoding unit 15 determines an index value closest to the intensity difference CLD j (k) (j = L, R, C) for each frequency by referring to the quantization table. The spatial information encoding unit 15 obtains a difference value between indexes along the frequency direction for each frequency band. For example, if the index value for the frequency band k is 2 and the index value for the frequency band (k−1) is 4, the spatial information encoding unit 15 sets the index difference value for the frequency band k to −2. .

図4は、強度差に対する量子化テーブルの一例を示す図である。図4に示す量子化テーブル400において、行410、430及び450の各欄はインデックス値を表し、行420、440及び460の各欄は、それぞれ、同じ列の行410、430及び450の各欄に示されたインデックス値に対応する強度差の代表値を表す。
例えば、周波数帯域kに対する強度差CLDL(k)が10.8dBである場合、量子化テーブル400では、インデックス値5に対応する強度差の代表値がCLDL(k)に最も近い。そこで、空間情報符号化部15は、CLDL(k)に対するインデックス値を5に設定する。
FIG. 4 is a diagram illustrating an example of a quantization table for the intensity difference. In the quantization table 400 shown in FIG. 4, each column of rows 410, 430, and 450 represents an index value, and each column of rows 420, 440, and 460 represents each column of rows 410, 430, and 450 in the same column, respectively. The representative value of the intensity difference corresponding to the index value shown in FIG.
For example, when the intensity difference CLD L (k) with respect to the frequency band k is 10.8 dB, in the quantization table 400, the representative value of the intensity difference corresponding to the index value 5 is closest to CLD L (k). Therefore, the spatial information encoding unit 15 sets the index value for CLD L (k) to 5.

空間情報符号化部15は、インデックス間の差分値と強度差符号の対応を示した符号化テーブルを参照する。そして空間情報符号化部15は、符号化テーブルを参照することにより、強度差CLDj(k)の各周波数帯域kの差分値に対する強度差符号idxcldj(k)(j=L,R,C)を決定する。強度差符号は、類似度符号と同様に、例えば、ハフマン符号あるいは算術符号など、出現頻度が高い差分値ほど符号長が短くなる可変長符号とすることができる。
なお、量子化テーブル及び符号化テーブルは、予め、空間情報符号化部15が有するメモリに格納される。
The spatial information encoding unit 15 refers to an encoding table that indicates the correspondence between the difference value between indexes and the intensity difference code. Then, the spatial information encoding unit 15 refers to the encoding table so that the intensity difference code idxcld j (k) (j = L, R, C) for the difference value of each frequency band k of the intensity difference CLD j (k). ). Similar to the similarity code, the intensity difference code can be a variable length code such as a Huffman code or an arithmetic code, in which the code length is shorter as the difference value has a higher appearance frequency.
Note that the quantization table and the encoding table are stored in advance in a memory included in the spatial information encoding unit 15.

空間情報符号化部15は、類似度符号idxicci(k)、強度差符号idxcldj(k)及び予測係数符号idxcm(k)を用いてMPS符号を生成する。例えば、空間情報符号化部15は、類似度符号idxicci(k)、強度差符号idxcldj(k)及び予測係数符号idxcm(k)を所定の順序に従って配列することにより、MPS符号を生成する。この所定の順序については、例えば、ISO/IEC 23003-1:2007に記述されている。
空間情報符号化部15は、生成したMPS符号を多重化部17へ出力する。
The spatial information encoding unit 15 generates an MPS code using the similarity code idxicc i (k), the intensity difference code idxcld j (k), and the prediction coefficient code idxc m (k). For example, the spatial information encoding unit 15 generates an MPS code by arranging the similarity code idxicc i (k), the intensity difference code idxcld j (k), and the prediction coefficient code idxc m (k) in a predetermined order. To do. This predetermined order is described in, for example, ISO / IEC 23003-1: 2007.
The spatial information encoding unit 15 outputs the generated MPS code to the multiplexing unit 17.

チャネル信号符号化部16は、第2ダウンミックス部13から出力されたステレオ周波数信号を符号化する。そのために、チャネル信号符号化部16は、SBR符号化部161と、周波数時間変換部162と、AAC符号化部163とを有する。   The channel signal encoding unit 16 encodes the stereo frequency signal output from the second downmix unit 13. Therefore, the channel signal encoding unit 16 includes an SBR encoding unit 161, a frequency time conversion unit 162, and an AAC encoding unit 163.

SBR符号化部161は、ステレオ周波数信号を受け取る度に、チャネルごとに、ステレオ周波数信号のうち、高周波数帯域に含まれる成分である高域成分を、SBR符号化方式にしたがって符号化する。これにより、SBR符号化部161は、SBR符号を生成する。
例えば、SBR符号化部161は、特開2008−224902号公報に開示されているように、SBR符号化の対象となる高域成分と強い相関のある各チャネルの周波数信号の低域成分を複製する。なお、低域成分は、SBR符号化部161が符号化対象とする高域成分が含まれる高周波数帯域よりも低い低周波数帯域に含まれる各チャネルの周波数信号の成分であり、後述するAAC符号化部163により符号化される。そしてSBR符号化部161は、複製された高域成分の電力を、元の高域成分の電力と一致するように調整する。またSBR符号化部161は、元の高域成分のうち、低域成分との差異が大きく、低域成分を複写しても、高域成分を近似できない成分を補助情報とする。そしてSBR符号化部161は、複製に利用された低域成分と対応する高域成分の位置関係を表す情報と、電力調整量と補助情報を量子化することにより符号化する。
SBR符号化部161は、上記の符号化された情報であるSBR符号を多重化部17へ出力する。
Each time the SBR encoding unit 161 receives a stereo frequency signal, the SBR encoding unit 161 encodes, for each channel, a high frequency component, which is a component included in the high frequency band, of the stereo frequency signal according to the SBR encoding method. As a result, the SBR encoding unit 161 generates an SBR code.
For example, as disclosed in Japanese Patent Application Laid-Open No. 2008-224902, the SBR encoding unit 161 duplicates the low frequency component of the frequency signal of each channel having a strong correlation with the high frequency component to be SBR encoded. To do. The low frequency component is a component of the frequency signal of each channel included in the low frequency band lower than the high frequency band including the high frequency component to be encoded by the SBR encoding unit 161, and will be described later. The encoding unit 163 performs encoding. Then, the SBR encoding unit 161 adjusts the replicated high frequency component power so as to match the original high frequency component power. In addition, the SBR encoding unit 161 uses, as auxiliary information, a component that has a large difference from the low-frequency component among the original high-frequency components and cannot approximate the high-frequency component even if the low-frequency component is copied. Then, the SBR encoding unit 161 performs encoding by quantizing the information indicating the positional relationship between the low frequency component used for duplication and the corresponding high frequency component, the power adjustment amount, and the auxiliary information.
The SBR encoding unit 161 outputs the SBR code that is the encoded information to the multiplexing unit 17.

周波数時間変換部162は、ステレオ周波数信号を受け取る度に、各チャネルのステレオ周波数信号を時間領域のステレオ信号に変換する。例えば、時間周波数変換部11がQMFフィルタバンクを用いる場合、周波数時間変換部162は、次式に示す複素型のQMFフィルタバンクを用いて各チャネルのステレオ周波数信号を周波数時間変換する。

Figure 2013195706
ここでIQMF(k,n)は、時間n、周波数kを変数とする複素型のQMFである。 The frequency time conversion unit 162 converts the stereo frequency signal of each channel into a time domain stereo signal each time a stereo frequency signal is received. For example, when the time-frequency conversion unit 11 uses a QMF filter bank, the frequency-time conversion unit 162 performs frequency-time conversion of the stereo frequency signal of each channel using a complex QMF filter bank represented by the following equation.
Figure 2013195706
Here, IQMF (k, n) is a complex QMF with time n and frequency k as variables.

なお、時間周波数変換部11が、高速フーリエ変換、離散コサイン変換、修正離散コサイン変換など、他の時間周波数変換処理を用いている場合、周波数時間変換部162は、その時間周波数変換処理の逆変換を使用する。
周波数時間変換部162は、各チャネルの周波数信号を周波数時間変換することにより得られた各チャネルのステレオ信号をAAC符号化部163へ出力する。
When the time frequency conversion unit 11 uses another time frequency conversion process such as fast Fourier transform, discrete cosine transform, or modified discrete cosine transform, the frequency time conversion unit 162 performs inverse conversion of the time frequency conversion process. Is used.
The frequency time conversion unit 162 outputs the stereo signal of each channel obtained by frequency time conversion of the frequency signal of each channel to the AAC encoding unit 163.

AAC符号化部163は、各チャネルのステレオ信号を受け取る度に、各チャネルの信号の低域成分をAAC符号化方式にしたがって符号化することにより、AAC符号を生成する。そこで、AAC符号化部163は、例えば、特開2007−183528号公報に開示されている技術を利用できる。具体的には、AAC符号化部163は、受け取った各チャネルのステレオ信号を離散コサイン変換することにより、再度ステレオ周波数信号を生成する。そしてAAC符号化部163は、再生成したステレオ周波数信号から心理聴覚エントロピー(Perceptual Entropy、PE)を算出する。PEは、リスナーが雑音を知覚することがないようにそのブロックを量子化するために必要な情報量を表す。そしてこのPEは、打楽器が発する音のようなアタック音など、信号レベルが短時間で変化する音に対して大きな値となる特性を持つ。そこで、AAC符号化部163は、PEの値が比較的大きくなるフレームに対しては、窓を短くし、PEの値が比較的小さくなるブロックに対しては、窓を長くする。例えば、短い窓は、256個のサンプルを含み、長い窓は、2048個のサンプルを含む。AAC符号化部163は、決定された長さを持つ窓を用いて各チャネルのステレオ信号に対して修正離散コサイン変換(Modified Discrete Cosine Transform、MDCT)を実行することにより、各チャネルのステレオ信号をMDCT係数の組に変換する。
そしてAAC符号化部163は、MDCT係数の組を量子化し、その量子化されたMDCT係数の組を可変長符号化する。
AAC符号化部163は、可変長符号化されたMDCT係数の組と、量子化係数など関連する情報を、AAC符号として多重化部17へ出力する。
Each time the AAC encoding unit 163 receives a stereo signal of each channel, the AAC encoding unit 163 generates an AAC code by encoding the low frequency component of the signal of each channel according to the AAC encoding method. Therefore, the AAC encoding unit 163 can use, for example, a technique disclosed in Japanese Patent Application Laid-Open No. 2007-183528. Specifically, the AAC encoding unit 163 generates a stereo frequency signal again by performing a discrete cosine transform on the received stereo signal of each channel. Then, the AAC encoding unit 163 calculates psychoacoustic entropy (Perceptual Entropy, PE) from the regenerated stereo frequency signal. The PE represents the amount of information necessary to quantize the block so that the listener does not perceive noise. This PE has a characteristic that becomes a large value for a sound whose signal level changes in a short time, such as an attack sound like a sound emitted by a percussion instrument. Therefore, the AAC encoding unit 163 shortens the window for a frame having a relatively large PE value, and lengthens the window for a block having a relatively small PE value. For example, a short window contains 256 samples and a long window contains 2048 samples. The AAC encoding unit 163 performs a modified discrete cosine transform (MDCT) on the stereo signal of each channel using a window having the determined length, thereby converting the stereo signal of each channel. Convert to a set of MDCT coefficients.
Then, the AAC encoding unit 163 quantizes the set of MDCT coefficients, and variable-length encodes the quantized set of MDCT coefficients.
The AAC encoding unit 163 outputs a set of variable length encoded MDCT coefficients and related information such as a quantization coefficient to the multiplexing unit 17 as an AAC code.

多重化部17は、AAC符号、SBR符号及びMPS符号を所定の順序に従って配列することにより多重化する。そして多重化部17は、その多重化により生成された符号化オーディオ信号を出力する。
図5は、符号化されたオーディオ信号が格納されたデータ形式の一例を示す図である。この例では、符号化されたオーディオ信号は、MPEG-4 ADTS(Audio Data Transport Stream)形式に従って作成される。
図5に示される符号化データ列500において、データブロック510にAAC符号は格納される。またADTS形式のFILLエレメントが格納されるブロック520の一部領域にSBR符号及びMPS符号が格納される。さらに、ブロック520には、予測符号化部14により求められた符号帳選択情報も格納される。
The multiplexing unit 17 multiplexes the AAC code, the SBR code, and the MPS code by arranging them in a predetermined order. The multiplexing unit 17 outputs the encoded audio signal generated by the multiplexing.
FIG. 5 is a diagram illustrating an example of a data format in which an encoded audio signal is stored. In this example, the encoded audio signal is created according to the MPEG-4 ADTS (Audio Data Transport Stream) format.
In the encoded data sequence 500 shown in FIG. 5, the AAC code is stored in the data block 510. In addition, an SBR code and an MPS code are stored in a partial area of the block 520 in which an ADTS type FILL element is stored. Further, in the block 520, codebook selection information obtained by the predictive coding unit 14 is also stored.

次に、予測符号化部14の詳細について説明する。図6は、予測符号化部14の構成図である。予測符号化部14は、予測誤差形状判定部141と、最小誤差予測係数算出部142と、符号帳選択部143と、予測係数符号化部144とを有する。   Next, details of the prediction encoding unit 14 will be described. FIG. 6 is a configuration diagram of the predictive encoding unit 14. The prediction encoding unit 14 includes a prediction error shape determination unit 141, a minimum error prediction coefficient calculation unit 142, a codebook selection unit 143, and a prediction coefficient encoding unit 144.

予測誤差形状判定部141は、第2ダウンミックス部13から受け取った各チャネルの周波数信号に基づいて、予測係数C1(k)、C2(k)から算出される中央チャネルの周波数信号の予測値C'p0(k,n)とCp0(k,n)間の予測誤差の分布形状を判定する。この予測誤差の分布形状は、符号帳を選択するため、及び予測誤差dを最小化するために利用される。 The prediction error shape determination unit 141 predicts the frequency signal of the center channel calculated from the prediction coefficients C 1 (k) and C 2 (k) based on the frequency signal of each channel received from the second downmix unit 13. The distribution shape of the prediction error between the values C ′ p0 (k, n) and C p0 (k, n) is determined. This prediction error distribution shape is used to select a codebook and to minimize the prediction error d.

本願の発明者は、予測値C'p0(k,n)と中央チャネルの信号Cp0(k,n)間の予測誤差の分布形状が、放物線柱面状あるいは楕円放物面状になることを見出した。そこで以下では、先ず、予測誤差の分布形状が放物線柱面状あるいは楕円放物面状になることについて説明する。 The inventor of the present application indicates that the distribution shape of the prediction error between the predicted value C ′ p0 (k, n) and the central channel signal C p0 (k, n) is a parabolic columnar shape or an elliptical parabolic shape. I found. Therefore, first, it will be described that the distribution shape of the prediction error is a parabolic columnar shape or an elliptical parabolic shape.

左側チャネルの予測係数C1(k)及び右側チャネルの予測係数C2(k)より、中央チャネルの信号の予測値C'p0(k,n)及び予測誤差d(k)は次式で定義される。

Figure 2013195706
(10)式を展開して整理すると、(10)式は、次式のように、予測係数C1(k)及びC2(k)の二次曲線として表される。なお、以下では、簡単化のために、予測係数C1(k)、C2(k)及び予測誤差d(k)を、それぞれ単にc1、c2、dと表記する。また左側チャネルの周波数信号Lp0(k,n)、右側チャネルの周波数信号Rp0(k,n)及び中央チャネルの信号Cp0(k,n)を、それぞれ、単にL0、R0、C0と表記する。
Figure 2013195706
なお、(11)式において、関数Re(x)は、パラメータxの実数成分を出力する関数であり、関数Im(x)は、パラメータxの虚数成分を出力する関数である。
(11)式において、予測係数c1、c2の係数及び定数項を以下のように定義する。
Figure 2013195706
上記の定義を用いることにより、(11)式は以下のように表される。
Figure 2013195706
From the prediction coefficient C 1 (k) of the left channel and the prediction coefficient C 2 (k) of the right channel, the predicted value C ′ p0 (k, n) and the prediction error d (k) of the center channel signal are defined by the following equations: Is done.
Figure 2013195706
When the expression (10) is expanded and arranged, the expression (10) is expressed as a quadratic curve of the prediction coefficients C 1 (k) and C 2 (k) as in the following expression. Hereinafter, for simplification, the prediction coefficients C 1 (k), C 2 (k) and the prediction error d (k) are simply expressed as c 1 , c 2 , and d, respectively. Also, the left channel frequency signal L p0 (k, n), the right channel frequency signal R p0 (k, n) and the center channel signal C p0 (k, n) are simply L 0 , R 0 , C, respectively. Indicated as 0 .
Figure 2013195706
In Expression (11), the function Re (x) is a function that outputs a real component of the parameter x, and the function Im (x) is a function that outputs an imaginary component of the parameter x.
In the equation (11), the coefficients and constant terms of the prediction coefficients c 1 and c 2 are defined as follows.
Figure 2013195706
By using the above definition, the expression (11) is expressed as follows.
Figure 2013195706

一般に、二次曲線は、放物線、双曲線、平行2直線、及び楕円のいずれかとなる。以下に、二次曲線が放物線、双曲線、平行2直線、及び楕円のそれぞれとなる条件について説明する。
例えば、(13)式における各係数が以下の条件を満たす場合、(13)式で表される2次曲線は放物線となる。

Figure 2013195706
また、(13)式における各係数が次式の条件を満たす場合、(13)式で表される2次曲線は双曲線となる。
Figure 2013195706
あるいは、(13)式における各係数が次式の条件を満たす場合、(13)式で表される2次曲線は平行2直線となる。
Figure 2013195706
あるいはまた、(13)式における各係数が次式の条件を満たす場合、(13)式で表される2次曲線は楕円となる。
Figure 2013195706
In general, the quadratic curve is one of a parabola, a hyperbola, parallel two straight lines, and an ellipse. Hereinafter, the conditions under which the quadratic curve is a parabola, a hyperbola, two parallel straight lines, and an ellipse will be described.
For example, when each coefficient in the equation (13) satisfies the following condition, the quadratic curve represented by the equation (13) is a parabola.
Figure 2013195706
Further, when each coefficient in the equation (13) satisfies the condition of the following equation, the quadratic curve represented by the equation (13) is a hyperbola.
Figure 2013195706
Alternatively, when each coefficient in the equation (13) satisfies the condition of the following equation, the quadratic curve represented by the equation (13) is a parallel two straight line.
Figure 2013195706
Alternatively, when each coefficient in the equation (13) satisfies the condition of the following equation, the quadratic curve represented by the equation (13) becomes an ellipse.
Figure 2013195706

ここで、左側周波数信号Lp0(k,n)、右側周波数信号Rp0(k,n)、中央チャネルの周波数信号Cp0(k,n)の性質から、(13)式における各係数が放物線となる条件及び双曲線となる条件を満たすことはない。
先ず、(13)式における各係数が、(14)式に示される放物線の条件を満たすことがない理由を説明する。
Here, from the properties of the left frequency signal L p0 (k, n), the right frequency signal R p0 (k, n), and the center channel frequency signal C p0 (k, n), each coefficient in the equation (13) is a parabola. And the condition that becomes a hyperbola is not satisfied.
First, the reason why each coefficient in the equation (13) does not satisfy the parabolic condition shown in the equation (14) will be described.

(14)式において、γ=0と仮定する。γ=0の時、次式より全ての(k,n)において、右側周波数信号Rp0(k,n)=0が満たされることになる。

Figure 2013195706
そのため、次式より、ε=0となる。
Figure 2013195706
同様の計算により、α=0と仮定した場合、δ=0となる。したがって、(14)式に示された条件は常に満たされることはない。 In the equation (14), γ = 0 is assumed. When γ = 0, the right frequency signal R p0 (k, n) = 0 is satisfied in all (k, n) from the following equation.
Figure 2013195706
Therefore, ε = 0 from the following equation.
Figure 2013195706
According to the same calculation, assuming that α = 0, δ = 0. Therefore, the condition shown in the equation (14) is not always satisfied.

次に、(13)式における各係数が、(15)式に示される双曲線の条件を満たすことがない理由を説明する。(14)式は、次式の通りに展開することができる。

Figure 2013195706
(20)式は、コーシーシュワルツの不等式により、次式を満たすことになる。
Figure 2013195706
したがって、(15)式に示される双曲線の条件は常に満たされることはない。 Next, the reason why each coefficient in equation (13) does not satisfy the hyperbolic condition shown in equation (15) will be described. Equation (14) can be expanded as follows:
Figure 2013195706
Equation (20) satisfies the following equation by the Cauchy-Schwarz inequality.
Figure 2013195706
Therefore, the hyperbolic condition shown in the equation (15) is not always satisfied.

したがって、予測誤差dの分布形状の断面の二次曲線は、平行2直線または楕円のいずれかである。平行2直線を予測係数c1、c2に対する二次曲面として規定すると、予測誤差dの分布形状は放物線柱面(すなわち、放物線型)となる。一方、楕円を予測係数c1、c2に対する二次曲面として規定すると、予測誤差dの分布形状は楕円放物面(すなわち、楕円型)となる。 Therefore, the quadratic curve of the cross section of the distribution shape of the prediction error d is either a parallel two straight line or an ellipse. If the parallel two straight lines are defined as a quadric surface with respect to the prediction coefficients c 1 and c 2 , the distribution shape of the prediction error d is a parabolic column surface (ie, a parabolic shape). On the other hand, if the ellipse is defined as a quadric surface with respect to the prediction coefficients c 1 and c 2 , the distribution shape of the prediction error d is an elliptic paraboloid (that is, an elliptic shape).

そこで、予測誤差形状判定部141は、左側周波数信号Lp0(k,n)、右側周波数信号Rp0(k,n)及び中央チャネルの周波数信号Cp0(k,n)に基づいて、(16)式または(17)式の何れの条件が満たされるか判定する。そして(16)式に示される条件が満たされる場合、すなわち、(β2-αγ)=0であれば、予測誤差形状判定部141は、予測誤差dの分布形状は放物線型であると判定する。これは、結局、以下の二つのケースの何れかに相当する。
・左側周波数信号Lp0(k,n)及び右側周波数信号Rp0(k,n)の少なくとも何れかが全ての周波数帯域において0、すなわち、左側チャネルか右側チャネルが無音である場合
・左側周波数信号Lp0(k,n)と右側周波数信号Rp0(k,n)の内積が0、すなわち、左側周波数信号Lp0(k,n)と右側周波数信号Rp0(k,n)とが同相または逆相である場合
Therefore, the prediction error shape determination unit 141 (16) based on the left frequency signal L p0 (k, n), the right frequency signal R p0 (k, n), and the center channel frequency signal C p0 (k, n). ) Or (17) is satisfied. If the condition shown in equation (16) is satisfied, that is, if (β 2 −αγ) = 0, the prediction error shape determination unit 141 determines that the distribution shape of the prediction error d is a parabolic shape. . This eventually corresponds to one of the following two cases.
When at least one of the left frequency signal L p0 (k, n) and the right frequency signal R p0 (k, n) is 0 in all frequency bands, that is, the left channel or the right channel is silent. The inner product of L p0 (k, n) and the right frequency signal R p0 (k, n) is 0, that is, the left frequency signal L p0 (k, n) and the right frequency signal R p0 (k, n) are in phase or When in reverse phase

一方、(17)式に示される条件が満たされる場合、すなわち、(β2-αγ)≠0であれば、予測誤差形状判定部141は、予測誤差dの分布形状は楕円型であると判定する。 On the other hand, if the condition shown in the equation (17) is satisfied, that is, if (β 2 −αγ) ≠ 0, the prediction error shape determination unit 141 determines that the distribution shape of the prediction error d is elliptical. To do.

予測誤差形状判定部141は、予測誤差dの分布形状の判定結果を最小誤差予測係数算出部142及び符号帳選択部143へ通知する。   The prediction error shape determination unit 141 notifies the minimum error prediction coefficient calculation unit 142 and the codebook selection unit 143 of the determination result of the distribution shape of the prediction error d.

最小誤差予測係数算出部142は、予測誤差dの分布形状の判定結果に基づいて、予測誤差が最小となる予測係数c1、c2を算出する。 The minimum error prediction coefficient calculation unit 142 calculates the prediction coefficients c 1 and c 2 that minimize the prediction error based on the determination result of the distribution shape of the prediction error d.

先ず、予測誤差dの分布形状が放物線型になる場合の予測係数c1、c2の算出式について説明する。上記の(16)式の条件が満たされる場合、以下に示す(i)〜(iii)の何れの条件が満たされることになる。

Figure 2013195706
ここで、(22)式の条件(iii)が満たされる場合について説明する。条件(iii)の式は次式の通り表現することが可能である。
Figure 2013195706
ただし、sは任意の実数である。(23)式を(11)式の各項に代入すると、予測誤差dは次式の通り表現することが可能となる。
Figure 2013195706
(24)式において、(c1+sc2)はc1とc2の一次式である。ここで、(24)式の(c1+sc2)を変数zで置換し、左側周波数信号Lp0(k,n)、右側周波数信号Rp0(k,n)、中央チャネルの周波数信号Cp0(k,n)から一意的に定まる値を定数A、B、C、Dで置換すると、(24)式は次式の一般的な放物線の式で表現できる。
Figure 2013195706
First, calculation formulas for the prediction coefficients c 1 and c 2 when the distribution shape of the prediction error d is parabolic will be described. When the condition of the above expression (16) is satisfied, any of the following conditions (i) to (iii) is satisfied.
Figure 2013195706
Here, a case where the condition (iii) of the equation (22) is satisfied will be described. The expression of condition (iii) can be expressed as the following expression.
Figure 2013195706
Here, s is an arbitrary real number. Substituting equation (23) into each term of equation (11), the prediction error d can be expressed as:
Figure 2013195706
In the equation (24), (c 1 + sc 2 ) is a linear equation of c 1 and c 2 . Here, (c 1 + sc 2 ) in the equation (24) is replaced with the variable z, the left frequency signal L p0 (k, n), the right frequency signal R p0 (k, n), and the center channel frequency signal C. When a value uniquely determined from p0 (k, n) is replaced with constants A, B, C, and D, equation (24) can be expressed by the following general parabolic equation.
Figure 2013195706

(11)式より、f(L0,L0)は、左側周波数信号Lp0(k,n)の絶対値の二乗の(k,n)についての総和となるので、常に正の値を有する。そのため、上記の(24)式において、予測係数c1、c2ならびに予測誤差dをそれぞれ互いに直交する座標軸で表す放物線柱面の予測誤差の分布形状は、c1-c2平面に対して最小値を有することになる。 From equation (11), f (L 0 , L 0 ) is the sum of the squares (k, n) of the absolute value of the left frequency signal L p0 (k, n), and therefore always has a positive value. . Therefore, in the above equation (24), the distribution shape of the prediction error of the parabolic column surface in which the prediction coefficients c 1 and c 2 and the prediction error d are expressed by coordinate axes orthogonal to each other is the minimum with respect to the c 1 -c 2 plane. Will have a value.

図7は予測係数c1、c2ならびに予測誤差dをそれぞれ互いに直交する座標軸で表す放物線柱面状の予測誤差の分布の概念図である。図7において、各座標軸は、それぞれ、予測係数c1、c2及び予測誤差dに対応する。3次元グラフ700は、予測誤差dの分布を表す。3次元グラフ700に示されるように、予測誤差dの最小値は、c1-c2平面において直線上に存在し、その直線から放物線上に予測誤差dが大きくなる。なお、放物線型の最小値は次式で表現される直線状となる。

Figure 2013195706
FIG. 7 is a conceptual diagram of a parabolic columnar prediction error distribution in which the prediction coefficients c 1 and c 2 and the prediction error d are represented by mutually orthogonal coordinate axes. In FIG. 7, each coordinate axis corresponds to the prediction coefficients c 1 and c 2 and the prediction error d, respectively. A three-dimensional graph 700 represents the distribution of the prediction error d. As shown in the three-dimensional graph 700, the minimum value of the prediction error d exists on a straight line in the c 1 -c 2 plane, and the prediction error d increases from the straight line to the parabola. Note that the parabolic minimum value is a straight line expressed by the following equation.
Figure 2013195706

なお、全ての(k,n)においてLp0(k,n)=0である場合には、f(L0,L0)は正の値でなく0となる。しかし、この場合には、上記の(22)式における上記(i)が満たされることになる。したがって、(22)式の条件(iii)が満たされる場合には、f(L0,L0)は常に正の値となる。 When L p0 (k, n) = 0 at all (k, n), f (L 0 , L 0 ) is not a positive value but 0. However, in this case, the above (i) in the above equation (22) is satisfied. Therefore, when the condition (iii) of the equation (22) is satisfied, f (L 0 , L 0 ) is always a positive value.

また、(22)式における条件(i)が満たされる場合は、放物線型の予測誤差の最小値は次式で表現される直線状となる。

Figure 2013195706
ただし、この場合において、予測係数c1は任意の値を持つ。一方、(22)式における条件(ii)が満たされる場合は、放物線型の予測誤差の最小値は次式で表現される直線状となる。
Figure 2013195706
ただし、この場合において、予測係数c2は任意の値を持つ。 When the condition (i) in the equation (22) is satisfied, the minimum value of the parabolic prediction error is a linear shape expressed by the following equation.
Figure 2013195706
However, in this case, the prediction coefficient c 1 has an arbitrary value. On the other hand, when the condition (ii) in the equation (22) is satisfied, the minimum value of the parabolic prediction error is a linear shape expressed by the following equation.
Figure 2013195706
However, in this case, prediction coefficients c 2 has any value.

したがって、最小誤差予測係数算出部142は、予測誤差dの分布形状が放物線型である場合、(22)式の条件(i)〜(iii)のうちの満たされる条件に従って、予測誤差dが最小となる予測係数c1min、c2minを算出する。すなわち、(22)式の条件(i)が満たされる場合、最小誤差予測係数算出部142は、(27)式に従って予測係数c1min、c2minを算出する。また、(22)式の条件(ii)が満たされる場合、最小誤差予測係数算出部142は、(28)式に従って予測係数c1min、c2minを算出する。あるいは、(22)式の条件(iii)が満たされる場合、最小誤差予測係数算出部142は、(26)式に従って予測係数c1min、c2minを算出する。 Therefore, when the distribution shape of the prediction error d is parabolic, the minimum error prediction coefficient calculation unit 142 has the smallest prediction error d according to the condition satisfied among the conditions (i) to (iii) of the equation (22). Prediction coefficients c 1min and c 2min are calculated. That is, when the condition (i) of the equation (22) is satisfied, the minimum error prediction coefficient calculation unit 142 calculates the prediction coefficients c 1min and c 2min according to the equation (27). Further, when the condition (ii) of the equation (22) is satisfied, the minimum error prediction coefficient calculation unit 142 calculates the prediction coefficients c 1min and c 2min according to the equation (28). Alternatively, when the condition (iii) of the equation (22) is satisfied, the minimum error prediction coefficient calculation unit 142 calculates the prediction coefficients c 1min and c 2min according to the equation (26).

また、予測誤差dの分布形状が楕円型である場合、予測誤差dが最小となるのは、(10)式を予測係数c1、c2でそれぞれ偏微分した値が0となる場合となる。そのため、最小誤差予測係数算出部142は、予測誤差dの分布形状が楕円型である場合、次式に従って、予測誤差dが最小となる予測係数c1min、c2minを算出する。

Figure 2013195706
When the distribution shape of the prediction error d is elliptical, the prediction error d is minimized when the value obtained by partial differentiation of the equation (10) with the prediction coefficients c 1 and c 2 is 0. . Therefore, when the distribution shape of the prediction error d is elliptical, the minimum error prediction coefficient calculation unit 142 calculates the prediction coefficients c 1min and c 2min that minimize the prediction error d according to the following equation.
Figure 2013195706

図8は予測係数c1、c2ならびに予測誤差dをそれぞれ互いに直交する座標軸で表す楕円放物面状の予測誤差の分布の概念図である。図8において、各座標軸は、それぞれ、予測係数c1、c2及び予測誤差dに対応する。3次元グラフ800は、予測誤差dの分布を表す。3次元グラフ800に示されるように、予測誤差dの最小値は、c1-c2平面において1点となり、その点から楕円状に予測誤差dが大きくなる。 FIG. 8 is a conceptual diagram of an elliptic paraboloid prediction error distribution in which the prediction coefficients c 1 and c 2 and the prediction error d are expressed by mutually orthogonal coordinate axes. In FIG. 8, each coordinate axis corresponds to the prediction coefficients c 1 and c 2 and the prediction error d, respectively. A three-dimensional graph 800 represents the distribution of the prediction error d. As shown in the three-dimensional graph 800, the minimum value of the prediction error d is one point on the c 1 -c 2 plane, and the prediction error d increases in an elliptical shape from that point.

最小誤差予測係数算出部142は、予測誤差dが最小値となるときの予測係数c1min、c2minを符号帳選択部143へ出力する。 The minimum error prediction coefficient calculation unit 142 outputs the prediction coefficients c 1min and c 2min when the prediction error d becomes the minimum value to the codebook selection unit 143.

符号帳選択部143は、予め準備された各予測係数の符号帳の中から、予測誤差dの分布形状、及び、予測誤差dが最小値となるときの予測係数c1min、c2minに基づいて、予測係数c1、c2の量子化値を決定するために利用される符号帳を選択する。 Based on the prediction error c distribution shape and the prediction coefficients c 1min and c 2min when the prediction error d is the minimum value, the code book selection unit 143 is based on the code book of each prediction coefficient prepared in advance. The codebook used for determining the quantized values of the prediction coefficients c 1 and c 2 is selected.

上記のように、予測係数c1、c2の量子化値の数が増えるほど、その予測係数c1、c2に割り当てられる符号の数も増える。そのため、各符号の直交性を保つためには、符号の数が増えるほど、符号の長さの平均値も増大し、その結果として符号化効率が低下する。そのため、符号帳に規定される予測係数c1、c2の量子化値の範囲は限られたものとなる。そのため、予測誤差dが最小となるときの予測係数c1min、c2minの値が、符号帳で規定されたc1、c2の量子化値の範囲から外れることがある。このような場合、その量子化値の範囲内の全ての量子化値に対してそれぞれ符号を割り当てても、使用されない符号が増えるだけであり、冗長となる。そこで本実施形態では、符号帳選択部143は、予測係数c1min、c2minのうちの一方が、符号帳に規定された予測係数の量子化値の範囲から外れる場合、または、その一方が予測誤差dに影響しない場合、他方の予測係数についての符号帳のみを選択する。 As described above, as the number of quantized values of the prediction coefficients c 1, c 2 is increased, increasing the number of codes assigned to the prediction coefficients c 1, c 2. Therefore, in order to maintain the orthogonality of each code, the average value of the code length increases as the number of codes increases, and as a result, the coding efficiency decreases. Therefore, the range of quantized values of the prediction coefficients c 1 and c 2 defined in the codebook is limited. For this reason, the values of the prediction coefficients c 1min and c 2min when the prediction error d is minimized may be out of the range of quantized values of c 1 and c 2 defined by the codebook. In such a case, even if codes are assigned to all quantized values within the range of the quantized values, only codes that are not used are increased, which is redundant. Therefore, in the present embodiment, the codebook selection unit 143 determines whether one of the prediction coefficients c 1min and c 2min is out of the range of the quantized value of the prediction coefficient defined in the codebook, or one of them is predicted. If the error d is not affected, only the codebook for the other prediction coefficient is selected.

先ず、予測誤差dの分布形状が楕円型である場合について説明する。
図9は、予測誤差dの分布形状が楕円型である場合における、予測誤差dが最小となるときの予測係数c1min、c2minと予測係数c1、c2の量子化値の範囲との位置関係を表す概念図である。図9において、予測係数c1、c2の量子化値の範囲900は、予測係数c1、c2をそれぞれ互いに直交する座標軸とするc1-c2平面上に表される。そしてc1t、c1bは、それぞれ、符号帳に規定される予測係数c1の量子化値の上限値及び下限値を表す。またc2t、c2bは、それぞれ、符号帳に規定される予測係数c2の量子化値の上限値及び下限値を表す。
First, the case where the distribution shape of the prediction error d is elliptical will be described.
FIG. 9 shows the prediction coefficients c 1min and c 2min and the range of quantized values of the prediction coefficients c 1 and c 2 when the prediction error d is minimized when the distribution shape of the prediction error d is elliptical. It is a conceptual diagram showing a positional relationship. 9, a range 900 of the quantization values of the prediction coefficients c 1, c 2 are represented the prediction coefficients c 1, c 2 to c 1 -c 2 on a plane whose coordinate axes orthogonal to each other. C 1t and c 1b represent the upper limit value and the lower limit value of the quantized value of the prediction coefficient c 1 defined in the codebook, respectively. C 2t and c 2b represent the upper limit value and the lower limit value of the quantized value of the prediction coefficient c 2 defined in the codebook, respectively.

予測誤差曲面901〜905は、それぞれ、予測誤差dの分布を表す予測誤差曲面の一例である。例えば、予測係数c1minが実際に符号化される予測係数c1の量子化値の上限値よりも大きい場合の予測誤差曲面901は予測係数c1の上限値c1tに沿った直線上の点911において範囲900と接する。したがって、予測係数c1に関しては、実際に符号化されるのはその上限値c1tとなる。そのため、符号帳としては、予測係数c2のみが規定されればよい。同様に、予測係数c1min及びc2minのうちの少なくとも一方が符号帳に規定される量子化値の範囲900から外れる予測誤差曲面902〜904も、範囲900の境界上の点912〜914で範囲900と接する。一方、予測係数c1min及びc2minの両方が範囲900に含まれる予測誤差曲面905は、(c1min,c2min)そのものにて範囲900と接する。 Each of the prediction error curved surfaces 901 to 905 is an example of a prediction error curved surface representing the distribution of the prediction error d. For example, the prediction error curved surface 901 when the prediction coefficient c 1min is larger than the upper limit value of the quantized value of the prediction coefficient c 1 to be actually encoded is a point on a straight line along the upper limit value c 1t of the prediction coefficient c 1 At 911, it touches the range 900. Therefore, regarding the prediction coefficient c 1, it is the upper limit value c 1t that is actually encoded. Therefore, as the codebook, only the prediction coefficients c 2 need be defined. Similarly, at least one of the prediction error surface 902 to 904 outside the scope 900 of the quantization values defined in the codebook also range point 912-914 on the boundary of the range 900 of the prediction coefficients c 1min and c 2min Contact 900. On the other hand, the prediction error curved surface 905 in which both of the prediction coefficients c 1min and c 2min are included in the range 900 is in contact with the range 900 by (c 1min , c 2min ) itself.

図10は、予測誤差dの分布形状が楕円型である場合における、符号帳に規定された予測係数の量子化値の範囲と予測誤差曲面との接点と、選択される符号帳との関係を示す図である。図10は、図9に示したc1-c2平面を上から見た図である。予測誤差曲面と予測係数c1、c2の量子化値の範囲1000との接点1001が予測係数c1の量子化値の上限値c1tに沿った直線上にある場合、選択される符号帳には、範囲1010で示されるように、予測係数c2の複数の量子化値のみが含まれる。また、予測誤差曲面と予測係数c1、c2の値の範囲1000との接点1002が予測係数c2の量子化値の下限値c2bに沿った直線上にある場合、選択される符号帳には、範囲1011で示されるように、予測係数c1の複数の量子化値のみが含まれる。一方、予測誤差曲面の最小値が範囲1000内である場合、選択される符号帳には、その範囲1000内の予測係数c1、c2の両方の量子化値が含まれる。 FIG. 10 shows the relationship between the selected codebook and the contact point between the quantization coefficient range of the prediction coefficient defined in the codebook and the prediction error curved surface when the distribution shape of the prediction error d is elliptical. FIG. FIG. 10 is a view of the c 1 -c 2 plane shown in FIG. 9 as viewed from above. The codebook selected when the contact point 1001 between the prediction error curved surface and the quantization value range 1000 of the prediction coefficients c 1 and c 2 is on a straight line along the upper limit value c 1t of the quantization value of the prediction coefficient c 1 Includes only a plurality of quantized values of the prediction coefficient c 2 as indicated by a range 1010. Further, when the contact point 1002 between the prediction error curved surface and the value range 1000 of the prediction coefficients c 1 and c 2 is on a straight line along the lower limit value c 2b of the quantized value of the prediction coefficient c 2 , the selected codebook Includes only a plurality of quantized values of the prediction coefficient c 1 as indicated by a range 1011. On the other hand, when the minimum value of the prediction error curved surface is within the range 1000, the selected codebook includes the quantized values of both the prediction coefficients c 1 and c 2 within the range 1000.

図11は、予測誤差dの分布形状が楕円型である場合の符号帳選択処理の動作フローチャートである。符号帳選択部143は、予測誤差dの分布形状が楕円型と判定された各フレームの周波数帯域ごとに、この動作フローチャートに従って使用する符号帳を選択する。
符号帳選択部143は、予測誤差dが最小となるときの予測係数の組(c1min,c2min)が、各予測係数の符号帳に規定される予測係数の量子化値の範囲内に含まれるか否か判定する(ステップS101)。
予測係数の組(c1min,c2min)の少なくとも一方が、予測係数の量子化値の範囲から外れる場合(ステップS101−No)、符号帳選択部143は、予測誤差曲面と予測係数の量子化値の範囲との接点を求める(ステップS102)。なお、符号帳選択部143は、(10)式において、予測係数c1min、c2minのうちの量子化値の範囲から外れるものについて、予測係数の値をその量子化値の上限、下限のうちの近い方の値に設定する。例えば、予測係数c1minが量子化値の範囲の下限を下回る場合、符号帳選択部143は、予測係数c1をその下限値c1bに設定する。そして符号帳選択部143は、他方をその取り得る値のうちで変化させたときに予測誤差dが最小となるときの予測係数の組(c1c,c2c)を接点とする。
FIG. 11 is an operation flowchart of the codebook selection process when the distribution shape of the prediction error d is elliptical. The codebook selection unit 143 selects a codebook to be used according to this operation flowchart for each frequency band of each frame in which the distribution shape of the prediction error d is determined to be elliptical.
The codebook selection unit 143 includes a set of prediction coefficients (c 1min , c 2min ) when the prediction error d is minimized within the range of quantized values of the prediction coefficients defined in the codebook of each prediction coefficient. It is determined whether or not (step S101).
When at least one of the pair of prediction coefficients (c 1min , c 2min ) is out of the range of the quantization value of the prediction coefficient (No in step S101), the codebook selection unit 143 quantizes the prediction error curved surface and the prediction coefficient A contact point with the value range is obtained (step S102). Note that the codebook selection unit 143 determines the value of the prediction coefficient among the upper limit and the lower limit of the quantization value for those out of the quantization value range of the prediction coefficients c 1min and c 2min in equation (10). Set the value closer to. For example, when the prediction coefficient c 1min falls below the lower limit of the quantization value range, the codebook selection unit 143 sets the prediction coefficient c 1 to the lower limit value c 1b . Then, the codebook selection unit 143 uses the set of prediction coefficients (c 1c , c 2c ) when the prediction error d is minimized when the other one of the possible values is changed as a contact.

次に、符号帳選択部143は、|c1c-c1min|が|c2c-c2min|より大きいか否か判定する(ステップS103)。|c1c-c1min|が|c2c-c2min|より大きい場合(ステップS103−Yes)、符号帳選択部143は、c1cは、予測係数c1についての量子化値の範囲の上限または下限となっている。そこで符号帳選択部143は、予測係数c2についての符号帳のみを選択する(ステップS104)。一方、|c1c-c1min|が|c2c-c2min|以下である場合(ステップS103−No)、符号帳選択部143は、予測係数c1についての符号帳のみを選択する(ステップS105)。 Next, the codebook selection unit 143 determines whether or not | c 1c -c 1min | is greater than | c 2c -c 2min | (step S103). | c 1c −c 1min | is greater than | c 2c −c 2min | (step S103—Yes), the codebook selection unit 143 determines that c 1c is the upper limit of the range of quantized values for the prediction coefficient c 1 or It is the lower limit. Therefore codebook selecting section 143 selects only the codebook for prediction coefficients c 2 (step S104). On the other hand, | c 1c -c 1min | is | c 2c -c 2min | is less than or equal to (step S103-No), codebook selecting section 143 selects only the codebook for prediction coefficients c 1 (step S105 ).

一方、ステップS101にて、予測係数の組(c1min,c2min)の何れも、符号帳に規定される量子化値の上限と下限の間に含まれる場合(ステップS101−Yes)、符号帳選択部143は、予測係数c1及びc2の両方の符号帳を選択する(ステップS106)。
ステップS104、S105またはS106の後、符号帳選択部143は、符号帳選択処理を終了する。
On the other hand, if any of the prediction coefficient pairs (c 1min , c 2min ) is included between the upper limit and the lower limit of the quantized value defined in the codebook in step S101 (step S101—Yes), the codebook The selection unit 143 selects both codebooks of the prediction coefficients c 1 and c 2 (step S106).
After step S104, S105, or S106, the codebook selection unit 143 ends the codebook selection process.

次に、予測誤差dの分布形状が放物線型である場合における符号帳の選択について説明する。
図12は、予測誤差dの分布形状が放物線型である場合における、予測誤差dの最小値に対応する予測係数の組(c1min,c2min)と予測係数の量子化値の範囲との関係を示す図である。
直線1201は、(22)式の条件(i)が満たされ、(27)式に従って算出される予測係数の組(c1min,c2min)を表す。この場合、予測係数c1minは任意であり、直線1201は、予測係数c1の軸と平行になるので、予測係数c2のみが符号化されればよい。したがって、符号帳選択部143は、予測係数c2についての符号帳のみを選択すればよい。一方、直線1202は、(22)式の条件(ii)が満たされ、(28)式に従って算出される予測係数の組(c1min,c2min)を表す。この場合、予測係数c2minは任意であり、直線1202は、予測係数c2の軸と平行になるので、予測係数c1のみが符号化されればよい。したがって、符号帳選択部143は、予測係数c1についての符号帳のみを選択すればよい。
Next, selection of a codebook when the distribution shape of the prediction error d is parabolic will be described.
FIG. 12 shows the relationship between the prediction coefficient pair (c 1min , c 2min ) corresponding to the minimum value of the prediction error d and the range of quantized values of the prediction coefficient when the distribution shape of the prediction error d is parabolic. FIG.
A straight line 1201 represents a set of prediction coefficients (c 1min , c 2min ) that satisfies the condition (i) of Equation (22) and is calculated according to Equation (27). In this case, the prediction coefficient c 1min is arbitrary, and the straight line 1201 is parallel to the axis of the prediction coefficient c 1 , so only the prediction coefficient c 2 needs to be encoded. Accordingly, codebook selecting section 143 may select only the codebook for prediction coefficients c 2. On the other hand, a straight line 1202 represents a set of prediction coefficients (c 1min , c 2min ) that satisfies the condition (ii) of the equation (22) and is calculated according to the equation (28). In this case, the prediction coefficient c 2min is arbitrary, and the straight line 1202 is parallel to the axis of the prediction coefficient c 2 , so that only the prediction coefficient c 1 needs to be encoded. Accordingly, codebook selecting section 143 may select only the codebook for prediction coefficient c 1.

また、直線1203は、(22)式の条件(iii)が満たされ、(26)式に従って算出される予測係数の組(c1min,c2min)を表す。この場合、予測係数c1minに応じて予測係数c2minも変化する。そのため符号帳選択部143は、予測係数c1及びc2の両方の符号帳を選択する。 A straight line 1203 represents a set of prediction coefficients (c 1min , c 2min ) that satisfies the condition (iii) of the equation (22) and is calculated according to the equation (26). In this case, the prediction coefficient c 2min also changes according to the prediction coefficient c 1min . Therefore, the codebook selection unit 143 selects both codebooks of the prediction coefficients c 1 and c 2 .

図13は、予測誤差dの分布形状が放物線型である場合の符号帳選択処理の動作フローチャートである。符号帳選択部143は、予測誤差dの分布形状が放物線型と判定された各フレームの周波数帯域ごとに、この動作フローチャートに従って使用する符号帳を選択する。
符号帳選択部143は、予測誤差dが最小となる予測係数(c1min,c2min)同士の関係を表す直線Lが予測係数c2の軸と平行か否か、すなわち、(28)式に従って算出されたものか否か判定する(ステップS201)。直線Lが予測係数c2の軸と平行である場合(ステップS201−Yes)、符号帳選択部143は、予測係数c1についての符号帳のみを選択する(ステップS202)。
FIG. 13 is an operation flowchart of the codebook selection process when the distribution shape of the prediction error d is parabolic. The codebook selection unit 143 selects a codebook to be used according to this operation flowchart for each frequency band of each frame in which the distribution shape of the prediction error d is determined to be parabolic.
The codebook selection unit 143 determines whether or not the straight line L representing the relationship between the prediction coefficients (c 1min , c 2min ) that minimizes the prediction error d is parallel to the axis of the prediction coefficient c 2 , that is, according to the equation (28). It is determined whether or not it has been calculated (step S201). If the straight line L is parallel to the prediction coefficients c 2 axes (step S201-Yes), codebook selecting section 143 selects only the codebook for prediction coefficients c 1 (step S202).

一方、直線Lが予測係数c2の軸と平行でない場合(ステップS201−No)、符号帳選択部143は、直線Lが予測係数c1の軸と平行か否か、すなわち、(27)式に従って算出されたものか否か判定する(ステップS203)。直線Lが予測係数c1の軸と平行である場合(ステップS203−Yes)、符号帳選択部143は、予測係数c2についての符号帳のみを選択する(ステップS204)。 On the other hand, if the straight line L is not parallel with the prediction coefficients c 2 axes (step S201-No), codebook selecting section 143, the straight line L whether parallel to the axis prediction coefficients c 1, i.e., (27) It is determined whether it is calculated according to (step S203). If the straight line L is parallel to the prediction coefficients c 1 axis (step S203-Yes), codebook selecting section 143 selects only the codebook for prediction coefficients c 2 (step S204).

一方、直線Lが予測係数c1の軸と平行でない場合(ステップS203−No)、符号帳選択部143は、予測係数c1及びc2の両方の符号帳を選択する(ステップS205)。
ステップS202、S204またはS205の後、符号帳選択部143は、符号帳選択処理を終了する。
On the other hand, if the straight line L is not parallel with the prediction coefficients c 1 axis (step S203-No), codebook selecting section 143 selects a codebook for both predictive coefficients c 1 and c 2 (step S205).
After step S202, S204, or S205, the codebook selection unit 143 ends the codebook selection process.

符号帳選択部143は、周波数帯域ごとに、選択した符号帳を表す符号帳選択情報を予測係数符号化部144へ通知する。例えば、符号帳選択情報は、例えば、2ビットで表される。そして符号帳選択情報が'11'のとき、両方の予測係数に対する符号帳が選択されたことを表す。また符号帳選択情報が'01'のとき、予測係数c1に対する符号帳が選択されたことを表し、'10'のとき、予測係数c2に対する符号帳が選択されたことを表す。 The codebook selection unit 143 notifies the prediction coefficient encoding unit 144 of codebook selection information representing the selected codebook for each frequency band. For example, the codebook selection information is represented by 2 bits, for example. When the codebook selection information is “11”, it indicates that codebooks for both prediction coefficients have been selected. When the code book selection information is “01”, it indicates that the code book for the prediction coefficient c 1 has been selected, and when it is “10”, it indicates that the code book for the prediction coefficient c 2 has been selected.

予測係数符号化部144は、選択された符号帳に従って、予測係数を符号化する。例えば、予測係数符号化部144は、その符号帳に含まれる複数の予測係数の量子化値のうち、予測誤差dを最小化できる量子化値を選択する。そして予測係数符号化部144は、選択した量子化値に対応するインデックス値を求める。   The prediction coefficient encoding unit 144 encodes the prediction coefficient according to the selected codebook. For example, the prediction coefficient encoding unit 144 selects a quantization value that can minimize the prediction error d from among the quantization values of a plurality of prediction coefficients included in the codebook. Then, the prediction coefficient encoding unit 144 obtains an index value corresponding to the selected quantization value.

図14は、予測係数の量子化値を格納した符号帳の一例を示す図である。図14に示されるように、符号帳1400では、二つの行が一組となって予測係数の量子化値が表されている。左端の列に"idx"と示された行1410、1420、1430、1440及び1450の各欄の数値は、インデックス値を表す。また左端の列に"C[idx]"と示された行1415、1425、1435、1445及び1455の各欄の数値は、一つ上のインデックス値に対応する予測係数の量子化値を表す。例えば、欄1401には、インデックス値として'-20'が格納されている。そして欄1402には、インデックス値'-20'に対応する予測係数の量子化値'-2.0'が格納されている。   FIG. 14 is a diagram illustrating an example of a codebook that stores quantization values of prediction coefficients. As shown in FIG. 14, in the codebook 1400, two rows represent a set and represent the quantized values of the prediction coefficients. The numerical values in the respective columns of the rows 1410, 1420, 1430, 1440 and 1450 indicated as “idx” in the leftmost column represent index values. The numerical values in the columns 1415, 1425, 1435, 1445, and 1455 in which “C [idx]” is shown in the leftmost column represent the quantized values of the prediction coefficients corresponding to the index values one level higher. For example, the column 1401 stores “−20” as an index value. The column 1402 stores the prediction coefficient quantization value “−2.0” corresponding to the index value “−20”.

例えば、周波数帯域kに対する予測係数c1が1.21である場合、符号帳1400では、インデックス値'12'に対応する予測係数の量子化値がc1に最も近い。そこで、予測係数符号化部144は、c1に対するインデックス値を'12'に設定する。 For example, when the prediction coefficient c 1 for the frequency band k is 1.21, in the codebook 1400, the quantization value of the prediction coefficient corresponding to the index value “12” is closest to c 1 . Therefore, the prediction coefficient encoding unit 144 sets the index value for c 1 to '12'.

以下、予測誤差dの分布形状が楕円型である場合と放物線型である場合とに分けて、予測係数の量子化値及び対応するインデックス値の決定方法について説明する。
先ず、予測誤差dの分布形状が楕円型である場合におけるその量子化値及びインデックス値の決定方法について説明する。
Hereinafter, the method for determining the quantized value of the prediction coefficient and the corresponding index value will be described separately for the case where the distribution shape of the prediction error d is an elliptical type and the case of a parabolic type.
First, a method for determining the quantization value and the index value when the distribution shape of the prediction error d is elliptic will be described.

予測誤差dの最小値に対応する予測係数の組(c1min,c2min)の両方が符号帳に規定される予測係数の量子化値の範囲内に含まれる場合、予測係数符号化部144は、(c1min,c2min)のそれぞれについて、対応する符号帳を参照して最も近い量子化値を求めればよい。そして予測係数符号化部144は、符号帳を参照して、各予測係数の量子化値に対応するインデックス値を決定する。 When both of the prediction coefficient pairs (c 1min , c 2min ) corresponding to the minimum value of the prediction error d are included in the range of the quantized values of the prediction coefficients defined in the codebook, the prediction coefficient encoding unit 144 , (C 1min , c 2min ), the nearest quantized value may be obtained by referring to the corresponding codebook. And the prediction coefficient encoding part 144 determines the index value corresponding to the quantization value of each prediction coefficient with reference to a codebook.

一方、予測誤差dの最小値に対応する予測係数の組(c1min,c2min)が符号帳に規定される予測係数の量子化値の範囲から外れる場合、予測係数符号化部144は、(10)式に基づいて、予測誤差曲面と予測係数の量子化値の範囲の境界との接点(c1c,c2c)を求める。あるいは、予測係数符号化部144は、符号帳選択部143から接点(c1c,c2c)を受け取ってもよい。 On the other hand, when the set of prediction coefficients (c 1min , c 2min ) corresponding to the minimum value of the prediction error d is out of the range of quantized values of the prediction coefficients specified in the codebook, the prediction coefficient encoding unit 144 ( Based on equation (10), a contact point (c 1c , c 2c ) between the prediction error curved surface and the boundary of the quantized value range of the prediction coefficient is obtained. Alternatively, the prediction coefficient encoding unit 144 may receive the contact (c 1c , c 2c ) from the codebook selection unit 143.

予測係数符号化部144は、予測係数c2についての符号帳のみが選択されている場合、すなわち、接点(c1c,c2c)が予測係数c1の下限値または上限値に沿った直線上にある場合には、予測係数c2についての符号帳を参照する。そして予測係数符号化部144は、接点における予測係数c2cに最も近い量子化値を選択し、その選択した量子化値に対応するインデックス値を求める。なお、c1minが予測係数c1の量子化値の範囲の上限c1tよりも大きい場合には、予測係数符号化部144は、予測係数c1について、その量子化値の範囲の上限c1tに対応するインデックス値を求める。
一方、c1minが予測係数c1の量子化値の範囲の下限c1bよりも小さい場合には、予測係数符号化部144は、予測係数c1について、その量子化値の範囲の下限c1bに対応するインデックス値を求める。
あるいは、c1minが予測係数c1の量子化値の範囲の上限c1tよりも大きい場合、予測係数符号化部144は、予測係数c1について、隣接する周波数帯域についてのインデックス値と同じインデックス値に設定してもよい。またc1minが予測係数c1の量子化値の範囲の下限c1bよりも小さい場合には、予測係数符号化部144は、予測係数c1について、隣接する周波数帯域についてのインデックス値に1を加算したインデックス値に設定してもよい。
When only the codebook for the prediction coefficient c 2 is selected, the prediction coefficient encoding unit 144, that is, the contact (c 1c , c 2c ) is on a straight line along the lower limit value or the upper limit value of the prediction coefficient c 1 If it is, the codebook for the prediction coefficient c 2 is referred to. Then, the prediction coefficient encoding unit 144 selects a quantization value closest to the prediction coefficient c 2c at the contact point, and obtains an index value corresponding to the selected quantization value. Note that if c 1min is larger than the upper limit c 1t range of the quantization value of the prediction coefficients c 1, the prediction coefficient coding unit 144, the prediction coefficients c 1, the upper limit c 1t of range of the quantized value The index value corresponding to is obtained.
On the other hand, when c 1min is smaller than the lower limit c 1b of the quantization value range of the prediction coefficient c 1 , the prediction coefficient encoding unit 144 sets the lower limit c 1b of the quantization value range of the prediction coefficient c 1. The index value corresponding to is obtained.
Alternatively, when c 1min is larger than the upper limit c 1t of the quantization value range of the prediction coefficient c 1 , the prediction coefficient encoding unit 144 uses the same index value as the index value for the adjacent frequency band for the prediction coefficient c 1. May be set. When c 1min is smaller than the lower limit c 1b of the quantized value range of the prediction coefficient c 1 , the prediction coefficient encoding unit 144 sets 1 as the index value for the adjacent frequency band for the prediction coefficient c 1. You may set to the added index value.

同様に、予測係数符号化部144は、予測係数c1についての符号帳のみが選択されている場合、すなわち、接点(c1c,c2c)が予測係数c2の下限値または上限値に沿った直線上にある場合には、予測係数c1についての符号帳を参照する。そして予測係数符号化部144は、接点における予測係数c1cに最も近い量子化値を選択し、その選択した量子化値に対応するインデックス値を求める。
一方、予測係数c2については、予測係数符号化部144は、予測係数c2の量子化値の範囲の上限c2t及び下限c2bのうちのc2minに近い方に対応するインデックス値を求める。
あるいは、c2minが予測係数c2の量子化値の範囲の上限c2tよりも大きい場合、予測係数符号化部144は、予測係数c2について、隣接する周波数帯域についてのインデックス値と同じインデックス値に設定してもよい。またc2minが予測係数c2の量子化値の範囲の下限c2bよりも小さい場合には、予測係数符号化部144は、予測係数c2について、隣接する周波数帯域についてのインデックス値に1を加算したインデックス値に設定してもよい。
Similarly, when only the codebook for the prediction coefficient c 1 is selected, the prediction coefficient encoding unit 144, that is, the contact (c 1c , c 2c ) follows the lower limit value or the upper limit value of the prediction coefficient c 2. If it is on the straight line, the code book for the prediction coefficient c 1 is referred to. Then, the prediction coefficient encoding unit 144 selects a quantization value closest to the prediction coefficient c 1c at the contact point, and obtains an index value corresponding to the selected quantization value.
On the other hand, for the prediction coefficient c 2 , the prediction coefficient encoding unit 144 obtains an index value corresponding to the closer to c 2 min of the upper limit c 2t and the lower limit c 2b of the quantized value range of the prediction coefficient c 2. .
Alternatively, when c 2min is larger than the upper limit c 2t of the quantization value range of the prediction coefficient c 2 , the prediction coefficient encoding unit 144 uses the same index value as the index value for the adjacent frequency band for the prediction coefficient c 2. May be set. When c 2min is smaller than the lower limit c 2b of the quantized value range of the prediction coefficient c 2 , the prediction coefficient encoding unit 144 sets 1 as the index value for the adjacent frequency band for the prediction coefficient c 2. You may set to the added index value.

次に、予測誤差dの分布形状が放物線型である場合におけるその量子化値及びインデックス値の決定方法について説明する。
予測誤差dの最小値に対応する予測係数(c1min,c2min)同士の関係を表す直線Lが(28)式に従って算出されており、その直線Lが予測係数c2の軸と平行であれば、予測係数符号化部144は、予測係数c1についての符号帳を参照する。そして予測係数符号化部144は、c1minに最も近い量子化値を選択し、その選択した量子化値に対応するインデックス値を求める。予測係数c2minについては任意なので、予測係数符号化部144は、予測係数c2の符号化値を省略する。そのため、予測係数c2についてのインデックス値を設定しない。あるいは、予測係数符号化部144は、予測係数c2について適当なインデックス値を設定してもよい。例えば、予測係数符号化部144は、予測係数c2について、隣接する周波数帯域について求められたインデックス値と同じインデックス値に設定する。
Next, a method for determining the quantization value and the index value when the distribution shape of the prediction error d is parabolic will be described.
A straight line L representing the relationship between the prediction coefficients (c 1min , c 2min ) corresponding to the minimum value of the prediction error d is calculated according to the equation (28), and the straight line L is parallel to the axis of the prediction coefficient c 2. For example, the prediction coefficient encoding unit 144 refers to the code book for the prediction coefficient c 1 . Then, the prediction coefficient encoding unit 144 selects a quantized value closest to c 1min and obtains an index value corresponding to the selected quantized value. Since the prediction coefficient c 2min is arbitrary, the prediction coefficient encoding unit 144 omits the encoded value of the prediction coefficient c 2 . Therefore, do not set the index value of the prediction coefficients c 2. Alternatively, predictive coefficient coding section 144 may set the appropriate index value for the prediction coefficient c 2. For example, the prediction coefficient coding unit 144, the prediction coefficients c 2, is set to the same index value as the index value determined for adjacent frequency bands.

また、予測誤差dの最小値に対応する予測係数 (c1min,c2min)同士の関係を表す直線Lが(27)式に従って算出されており、その直線Lが予測係数c1の軸と平行であれば、予測係数符号化部144は、予測係数c2についての符号帳を参照する。そして予測係数符号化部144は、c2minに最も近い量子化値を選択し、その選択した量子化値に対応するインデックス値を求める。予測係数c1minについては任意なので、予測係数符号化部144は、予測係数c1の符号化値を省略する。そのため、予測係数c1についてのインデックス値を設定しない。あるいは、予測係数符号化部144は、予測係数c1について適当なインデックス値を設定してもよい。例えば、予測係数符号化部144は、予測係数c1について、隣接する周波数帯域について求められたインデックス値と同じインデックス値に設定する。 A straight line L representing the relationship between the prediction coefficients (c 1min , c 2min ) corresponding to the minimum value of the prediction error d is calculated according to the equation (27), and the straight line L is parallel to the axis of the prediction coefficient c 1. if, predictive coefficient coding section 144 refers to the codebook for prediction coefficients c 2. Then, the prediction coefficient encoding unit 144 selects a quantization value closest to c 2min and obtains an index value corresponding to the selected quantization value. Since the prediction coefficient c 1min is arbitrary, the prediction coefficient encoding unit 144 omits the encoded value of the prediction coefficient c 1 . Therefore, it does not set the index value for the prediction coefficient c 1. Alternatively, the prediction coefficient encoding unit 144 may set an appropriate index value for the prediction coefficient c 1 . For example, the prediction coefficient encoding unit 144 sets the prediction coefficient c 1 to the same index value as the index value obtained for the adjacent frequency band.

さらに、予測誤差dの最小値に対応する予測係数(c1min,c2min)同士の関係を表す直線Lが(26)式に従って算出されている場合には、予測係数符号化部144は、符号帳に規定された予測係数c1及びc2の量子化値の範囲内にある直線L上の任意の点を選択する。そして予測係数符号化部144は、選択した点に最も近い、c1の量子化値及びc2の量子化値を選択し、それぞれ、その量子化値に対応するインデックス値を求める。 Furthermore, when the straight line L representing the relationship between the prediction coefficients (c 1min , c 2min ) corresponding to the minimum value of the prediction error d is calculated according to the equation (26), the prediction coefficient encoding unit 144 An arbitrary point on the straight line L within the range of the quantized values of the prediction coefficients c 1 and c 2 defined in the book is selected. Then, the prediction coefficient encoding unit 144 selects the c 1 quantized value and the c 2 quantized value closest to the selected point, and obtains an index value corresponding to the quantized value.

なお、直線Lと予測係数c1及びc2の量子化値の範囲が重ならないこともある。この場合には、予測係数符号化部144は、予測係数c1及びc2の量子化値の上限値と下限値の組み合わせからなる4個の点のうち、直線Lに最も近い点を求める。そして予測係数符号化部144は、その最も近い点であるc1及びc2の量子化値に対応するインデックス値をそれぞれ求める。なお、各点と直線Lとの距離の算出方法は既知なので、その詳細な説明は省略する。 Note that the range of quantized values of the straight line L and the prediction coefficients c 1 and c 2 may not overlap. In this case, the prediction coefficient encoding unit 144 obtains a point closest to the straight line L among four points that are combinations of the upper limit value and the lower limit value of the quantized values of the prediction coefficients c 1 and c 2 . Then, the prediction coefficient encoding unit 144 obtains index values corresponding to the quantized values of c 1 and c 2 that are the closest points. In addition, since the calculation method of the distance between each point and the straight line L is known, the detailed description thereof is omitted.

予測係数符号化部144は、各予測係数について、周波数方向に沿って隣接する周波数帯域のインデックス間の差分値を求める。例えば、周波数帯域kに対する予測係数c1のインデックス値が'2'であり、周波数帯域(k-1)に対する予測係数c1のインデックス値が'4'であれば、予測係数符号化部144は、周波数帯域kに対する予測係数c1のインデックスの差分値を'-2'とする。ただし、予測係数符号化部144は、隣接する周波数帯域について符号帳が選択されていない予測係数については、符号帳が選択されている最も近い周波数帯域のインデックス値からの差分値を求めてもよい。 The prediction coefficient encoding unit 144 obtains a difference value between indexes of frequency bands adjacent in the frequency direction for each prediction coefficient. For example, the index value of the prediction coefficients c 1 for the frequency band k is '2', if the index value of the prediction coefficients c 1 for the frequency band (k-1) is '4', predictive coefficient coding section 144 The difference value of the index of the prediction coefficient c 1 with respect to the frequency band k is set to “−2”. However, the prediction coefficient encoding unit 144 may obtain a difference value from the index value of the closest frequency band for which the codebook is selected for the prediction coefficient for which the codebook is not selected for the adjacent frequency band. .

予測係数符号化部144は、インデックス間の差分値と予測係数符号の対応を示した符号化テーブルを参照する。そして予測係数符号化部144は、符号化テーブルを参照することにより、各周波数帯域について、その差分値に対する予測係数符号idxcm(k)(m=1,2)を決定する。予測係数符号は、類似度符号と同様に、例えば、ハフマン符号あるいは算術符号など、出現頻度が高い差分値ほど符号長が短くなる可変長符号とすることができる。特に、符号帳が選択されていない予測係数についてのインデックス値を、隣接する周波数帯域のインデックス値と等しいか1加算した値に設定すると、その差分値も、出現頻度が高い0か1となる。そのため、符号帳が選択されていない予測係数についての予測係数符号を短くできる。
なお、各予測係数の符号帳及び符号化テーブルは、予め、予測符号化部14が有するメモリに格納される。
The prediction coefficient encoding unit 144 refers to an encoding table indicating the correspondence between the difference value between indexes and the prediction coefficient code. Then, the prediction coefficient encoding unit 144 determines a prediction coefficient code idxc m (k) (m = 1, 2) for the difference value for each frequency band by referring to the encoding table. Similar to the similarity code, the prediction coefficient code can be a variable length code such as a Huffman code or an arithmetic code, in which the code length is shorter as the difference value has a higher appearance frequency. In particular, when the index value for a prediction coefficient for which no codebook is selected is set to a value that is equal to or equal to the index value of an adjacent frequency band, the difference value also becomes 0 or 1 with a high appearance frequency. Therefore, the prediction coefficient code for the prediction coefficient for which no codebook is selected can be shortened.
Note that the codebook and coding table of each prediction coefficient are stored in advance in a memory included in the prediction coding unit 14.

予測係数符号化部144は、予測係数符号idxcm(k)(m=1,2)を空間情報符号化部15へ出力する。
さらに、予測係数符号化部144は、符号帳選択情報も、例えば、ハフマン符号あるいは算術符号を用いて可変長符号化してもよい。そして予測係数符号化部144は、符号化された符号帳選択情報を多重化部17へ出力する。
The prediction coefficient encoding unit 144 outputs the prediction coefficient code idxc m (k) (m = 1, 2) to the spatial information encoding unit 15.
Furthermore, the prediction coefficient encoding unit 144 may also perform variable length encoding on the codebook selection information using, for example, a Huffman code or an arithmetic code. Then, the prediction coefficient encoding unit 144 outputs the encoded codebook selection information to the multiplexing unit 17.

なお、変形例によれば、予測係数符号化部144は、各周波数帯域のインデックス値そのものを可変長符号化することにより、各周波数帯域の予測係数符号を求めてもよい。この場合、符号帳を用いずにインデックス値が決定された予測係数については、その予測係数の上限値及び下限値の何れかに対応するインデックス値しか取り得ない。そのため、取り得るインデックス値は2通りしかないので、予測係数符号も短くて済む。   Note that according to the modification, the prediction coefficient encoding unit 144 may obtain the prediction coefficient code of each frequency band by performing variable length encoding on the index value itself of each frequency band. In this case, for a prediction coefficient for which an index value is determined without using a codebook, only an index value corresponding to either the upper limit value or the lower limit value of the prediction coefficient can be taken. Therefore, since there are only two possible index values, the prediction coefficient code can be short.

図15は、オーディオ符号化処理の動作フローチャートを示す。なお、図15に示されたフローチャートは、1フレーム分のマルチチャネルオーディオ信号に対する処理を表す。オーディオ符号化装置1は、マルチチャネルオーディオ信号を受信し続けている間、フレームごとに図15に示されたオーディオ符号化処理の手順を繰り返し実行する。   FIG. 15 shows an operation flowchart of the audio encoding process. Note that the flowchart shown in FIG. 15 represents processing for a multi-channel audio signal for one frame. The audio encoding device 1 repeatedly executes the procedure of the audio encoding process shown in FIG. 15 for each frame while continuing to receive the multi-channel audio signal.

時間周波数変換部11は、各チャネルの信号を周波数信号に変換する(ステップ301)。時間周波数変換部11は、各チャネルの周波数信号を第1ダウンミックス部12へ出力する。   The time-frequency converter 11 converts the signal of each channel into a frequency signal (step 301). The time frequency conversion unit 11 outputs the frequency signal of each channel to the first downmix unit 12.

次に、第1ダウンミックス部12は、各チャネルの周波数信号をダウンミックスすることにより右、左、中央の3チャネルの周波数信号を生成する。さらに第1ダウンミックス部12は、右、左、中央の各チャネルの空間情報を算出する(ステップS302)。第1ダウンミックス部12は、3チャネルの周波数信号を第2ダウンミックス部13へ出力する。また第1ダウンミックス部12は、空間情報を空間情報符号化部15へ出力する。   Next, the first downmix unit 12 generates right, left, and center three frequency signals by downmixing the frequency signals of the respective channels. Further, the first downmix unit 12 calculates spatial information of each of the right, left, and center channels (step S302). The first downmix unit 12 outputs a 3-channel frequency signal to the second downmix unit 13. The first downmix unit 12 outputs the spatial information to the spatial information encoding unit 15.

第2ダウンミックス部13は、第1ダウンミックス部12から受け取った3チャネルの周波数信号をダウンミックスすることにより、ステレオ周波数信号と、予測符号化用の中央チャネルの信号を生成する(ステップS303)。そして第2ダウンミックス部13は、ステレオ周波数信号をチャネル信号符号化部16へ出力する。さらに、第2ダウンミックス部13は、ステレオ周波数信号とともに、中央チャネルの信号を予測符号化部14へ出力する。   The second downmix unit 13 generates a stereo frequency signal and a central channel signal for predictive coding by downmixing the three-channel frequency signals received from the first downmix unit 12 (step S303). . Then, the second downmix unit 13 outputs the stereo frequency signal to the channel signal encoding unit 16. Furthermore, the second downmix unit 13 outputs the center channel signal to the predictive coding unit 14 together with the stereo frequency signal.

予測符号化部14の予測誤差形状判定部141は、ステレオ周波数信号及び中央チャネルの信号に基づいて、予測誤差の分布形状を判定する(ステップS304)。そして予測符号化部14の最小誤差予測係数算出部142は、予測誤差の分布形状に応じて予測誤差が最小値となる予測係数の組(c1min,c2min)を算出する(ステップS305)。さらに予測符号化部14の符号帳選択部143は、予測誤差の分布形状が楕円型か否か判定する(ステップS306)。予測誤差の分布形状が楕円型である場合(ステップS306−Yes)、符号帳選択部143は、図11に示した動作フローに従って、楕円型に対応する符号帳選択処理を実行する(ステップS307)。一方、予測誤差の分布形状が放物線型である場合(ステップS306−No)、符号帳選択部143は、図13に示した動作フローに従って、放物線型に対応する符号帳選択処理を実行する(ステップS308)。 The prediction error shape determination unit 141 of the prediction encoding unit 14 determines the distribution shape of the prediction error based on the stereo frequency signal and the center channel signal (step S304). Then, the minimum error prediction coefficient calculation unit 142 of the prediction encoding unit 14 calculates a set of prediction coefficients (c 1min , c 2min ) in which the prediction error becomes the minimum value according to the distribution shape of the prediction error (step S305). Further, the codebook selection unit 143 of the prediction encoding unit 14 determines whether or not the distribution shape of the prediction error is elliptical (step S306). When the distribution shape of the prediction error is elliptical (step S306-Yes), the codebook selection unit 143 executes codebook selection processing corresponding to the elliptical shape according to the operation flow shown in FIG. 11 (step S307). . On the other hand, when the distribution shape of the prediction error is parabolic (step S306-No), the codebook selection unit 143 executes codebook selection processing corresponding to the parabolic type according to the operation flow shown in FIG. S308).

ステップS307またはS308の後、予測符号化部14の予測係数符号化部144は、選択された符号帳に従って予測係数c1、c2を符号化する(ステップS309)。そして予測符号化部14は、符号化された予測係数を空間情報符号化部15へ渡す。さらに、予測係数符号化部144は、符号帳選択情報も符号化して、その符号化された符号帳選択情報を多重化部17へ出力してもよい。 After step S307 or S308, the prediction coefficient encoding unit 144 of the prediction encoding unit 14 encodes the prediction coefficients c 1 and c 2 according to the selected code book (step S309). Then, the prediction encoding unit 14 passes the encoded prediction coefficient to the spatial information encoding unit 15. Furthermore, the prediction coefficient encoding unit 144 may also encode the codebook selection information and output the encoded codebook selection information to the multiplexing unit 17.

空間情報符号化部15は、第1ダウンミックス部12から受け取った空間情報を符号化し、その符号化された空間情報と符号化された予測係数を多重化することによりMPS符号を生成する(ステップS310)。そして空間情報符号化部15は、そのMPS符号を多重化部17へ出力する。   The spatial information encoding unit 15 encodes the spatial information received from the first downmix unit 12, and generates an MPS code by multiplexing the encoded spatial information and the encoded prediction coefficient (step S310). Then, the spatial information encoding unit 15 outputs the MPS code to the multiplexing unit 17.

一方、チャネル信号符号化部16は、受け取った各チャネルのステレオ周波数信号のうち、低域成分をAAC符号化する。またチャネル信号符号化部16は、受け取った各チャネルのステレオ周波数信号のうち、AAC符号化されない高域成分をSBR符号化する(ステップS311)。そしてチャネル信号符号化部16は、SBR符号とAAC符号とを多重化部17へ出力する。   On the other hand, the channel signal encoding unit 16 AAC encodes a low frequency component in the received stereo frequency signal of each channel. Further, the channel signal encoding unit 16 performs SBR encoding on a high frequency component that is not AAC encoded among the received stereo frequency signals of each channel (step S311). Then, the channel signal encoding unit 16 outputs the SBR code and the AAC code to the multiplexing unit 17.

最後に、多重化部17は、生成されたSBR符号、AAC符号、MPS符号及び符号帳選択情報を多重化することにより、符号化されたオーディオ信号を生成する(ステップS312)。
多重化部17は、符号化されたオーディオ信号を出力する。そしてオーディオ符号化装置1は、符号化処理を終了する。
なお、オーディオ符号化装置1は、ステップS311の処理とステップS304〜S310の処理を並列に実行してもよい。あるいは、オーディオ符号化装置1は、ステップS304〜S310の処理を行う前にステップS310の処理を実行してもよい。
Finally, the multiplexing unit 17 generates an encoded audio signal by multiplexing the generated SBR code, AAC code, MPS code, and codebook selection information (step S312).
The multiplexing unit 17 outputs the encoded audio signal. Then, the audio encoding device 1 ends the encoding process.
Note that the audio encoding device 1 may execute the process of step S311 and the processes of steps S304 to S310 in parallel. Alternatively, the audio encoding device 1 may execute the process of step S310 before performing the processes of steps S304 to S310.

以上に説明してきたように、このオーディオ符号化装置は、中央チャネルの周波数信号の予測値を二つのステレオ周波数信号で表すための二つの予測係数を符号化する。その際に、このオーディオ符号化装置は、予測誤差を最小にする各予測係数のうち、符号帳に規定された量子化値の範囲に含まれるか、予測誤差に影響するものについてのみ符号帳を利用して符号化する。そのため、このオーディオ符号化装置は、予測係数の符号の組み合わせの数を減らすことができるので、予測係数の符号に割り当てるビット量を削減できる。例えば、二つの予測係数の符号帳のそれぞれが、51個の量子化値を有しているとする。そして予測符号化部14が各量子化値に対応するインデックス値を直接符号化する場合、二つの予測係数符号の組み合わせの数は全部で2601個となる。これに対し、一方の予測係数について符号帳が選択されず、予測誤差形状が放物線型である場合のように全く符号化されなければ、予測係数符号の数は51個で済む。また、予測誤差形状が楕円型の場合であっても、符号帳が選択されない方の予測係数については、量子化値の上限値または下限値の何れかであることだけが分かればよいので、二つの予測係数符号の組み合わせの数は全部で102個で済む。その結果として、このオーディオ符号化装置は、マルチチャネルオーディオ信号の全体の符号化データ量を削減することができる。あるいは、このオーディオ符号化装置は、予測係数の符号に割り当てるデータ量が少なくなった分だけ、他の符号、例えば、AAC符号に割り当てることで、マルチチャネルオーディオ信号の全体の符号化データ量を増加させずに、再生音質を向上できる。   As described above, this audio encoding apparatus encodes two prediction coefficients for representing the prediction value of the frequency signal of the center channel by two stereo frequency signals. At this time, the audio encoding apparatus uses the code book only for the prediction coefficient that minimizes the prediction error and that is included in the quantization value range defined in the code book or affects the prediction error. Use and encode. Therefore, since this audio encoding device can reduce the number of combinations of prediction coefficient codes, the amount of bits allocated to the prediction coefficient codes can be reduced. For example, it is assumed that each codebook of two prediction coefficients has 51 quantized values. When the predictive encoding unit 14 directly encodes the index value corresponding to each quantized value, the total number of combinations of two predictive coefficient codes is 2601. On the other hand, if no codebook is selected for one prediction coefficient and the prediction error shape is not encoded at all as in the case of a parabolic shape, the number of prediction coefficient codes is only 51. Even if the prediction error shape is elliptical, the prediction coefficient for which the codebook is not selected only needs to know whether it is either the upper limit value or the lower limit value of the quantization value. The total number of combinations of one prediction coefficient code is 102. As a result, this audio encoding apparatus can reduce the entire encoded data amount of the multi-channel audio signal. Alternatively, this audio encoding apparatus increases the overall encoded data amount of the multi-channel audio signal by allocating to another code, for example, an AAC code, by the amount of data allocated to the prediction coefficient code. The playback sound quality can be improved without doing so.

なお、本発明は上記の実施形態に限定されるものではない。変形例によれば、予測符号化部14は、一方の予測係数についてのみ符号帳を選択した場合、符号帳が選択されなかった方の予測係数が量子化値の上限値か下限値かを表す境界情報を符号帳選択情報とともに多重化部17へ出力してもよい。例えば、境界情報には1ビットが割り当てられ、その1ビットは、予測係数が上限値となる場合に'1'、予測係数が下限値となる場合に'0'の値をとる。予測符号化部14は、一方の予測係数の符号帳のみが選択される場合に限り、この境界情報を多重化部17へ出力してもよい。さらに予測符号化部14は、符号帳選択情報と境界情報とをさらに可変長符号化してから多重化部17へ出力してもよい。この変形例では、予測符号化部14の予測係数符号化部144は、符号帳が選択されなかった方の予測係数符号を出力しなくてもよい。   In addition, this invention is not limited to said embodiment. According to the modified example, when the codebook is selected for only one prediction coefficient, the prediction coding unit 14 indicates whether the prediction coefficient for which the codebook is not selected is the upper limit value or the lower limit value of the quantized value. The boundary information may be output to the multiplexing unit 17 together with the codebook selection information. For example, 1 bit is allocated to the boundary information, and the 1 bit takes a value of “1” when the prediction coefficient becomes the upper limit value and takes a value of “0” when the prediction coefficient becomes the lower limit value. The prediction encoding unit 14 may output this boundary information to the multiplexing unit 17 only when only the codebook of one prediction coefficient is selected. Further, the predictive encoding unit 14 may further perform variable length encoding on the codebook selection information and the boundary information and then output the information to the multiplexing unit 17. In this modification, the prediction coefficient encoding unit 144 of the prediction encoding unit 14 may not output the prediction coefficient code for which no codebook has been selected.

さらに他の実施形態によれば、オーディオ符号化装置のチャネル信号符号化部は、ステレオ周波数信号を他の符号化方式に従って符号化してもよい。例えば、チャネル信号符号化部は、周波数信号全体をAAC符号化方式にしたがって符号化してもよい。この場合、図1に示されたオーディオ符号化装置において、SBR符号化部は省略される。   According to still another embodiment, the channel signal encoding unit of the audio encoding device may encode the stereo frequency signal according to another encoding method. For example, the channel signal encoding unit may encode the entire frequency signal according to the AAC encoding method. In this case, the SBR encoding unit is omitted in the audio encoding device shown in FIG.

また、符号化の対象となるマルチチャネルオーディオ信号は、5.1chオーディオ信号に限られない。例えば、符号化の対象となるオーディオ信号は、3ch、3.1chまたは7.1chなど、複数のチャネルを持つオーディオ信号であってもよい。この場合も、オーディオ符号化装置は、各チャネルのオーディオ信号を時間周波数変換することにより、各チャネルの周波数信号を算出する。そしてオーディオ符号化装置は、各チャネルの周波数信号をダウンミックスすることにより、3チャネルの周波数信号を生成する。そして、オーディオ符号化装置は、その3チャネルのうちの一つを、他の二つのチャネルの周波数信号を用いて予測符号化する際に、上記の実施形態と同様に符号帳を選択すればよい。   Further, the multi-channel audio signal to be encoded is not limited to the 5.1ch audio signal. For example, the audio signal to be encoded may be an audio signal having a plurality of channels such as 3ch, 3.1ch, or 7.1ch. Also in this case, the audio encoding device calculates the frequency signal of each channel by performing time-frequency conversion on the audio signal of each channel. Then, the audio encoding device generates a 3-channel frequency signal by downmixing the frequency signals of each channel. Then, the audio encoding device may select a codebook as in the above embodiment when predictively encoding one of the three channels using the frequency signals of the other two channels. .

次に、上記の実施形態またはその変形例によるオーディオ符号化装置にて符号化されたオーディオデータを復号するオーディオ復号装置について説明する。
図16は、一実施形態によるオーディオ復号装置の概略構成図である。オーディオ復号装置2は、分離部21と、チャネル信号復号部22と、符号帳選択情報復号部23と、予測係数復号部24と、予測復号部25と、空間情報復号部26と、アップミックス部27と、周波数時間変換部28とを有する。
Next, an audio decoding apparatus that decodes audio data encoded by the audio encoding apparatus according to the above-described embodiment or its modification will be described.
FIG. 16 is a schematic configuration diagram of an audio decoding device according to an embodiment. The audio decoding device 2 includes a separation unit 21, a channel signal decoding unit 22, a codebook selection information decoding unit 23, a prediction coefficient decoding unit 24, a prediction decoding unit 25, a spatial information decoding unit 26, and an upmixing unit 27 and a frequency time conversion unit 28.

分離部21は、符号化されたオーディオ信号を含むデータストリームから、符号化されたオーディオ信号が格納されたデータ形式にしたがって、AAC符号、SBR符号などのチャネル信号符号と、MBS符号と、符号化された符号帳選択情報とを取り出す。さらに分離部21は、MBS符号から、空間情報の符号と予測係数符号とを分離する。そして分離部21は、チャネル信号符号をチャネル信号復号部22へ出力し、符号化された符号帳選択情報を符号帳選択情報復号部23へ出力する。さらに分離部21は、予測係数符号を予測係数復号部24へ出力し、空間情報符号を空間情報復号部26へ出力する。   The separation unit 21 encodes a channel signal code such as an AAC code and an SBR code, an MBS code, and an encoding according to a data format in which the encoded audio signal is stored from a data stream including the encoded audio signal. The selected codebook selection information is extracted. Further, the separation unit 21 separates the spatial information code and the prediction coefficient code from the MBS code. Separating section 21 then outputs the channel signal code to channel signal decoding section 22 and outputs the encoded codebook selection information to codebook selection information decoding section 23. Further, the separation unit 21 outputs the prediction coefficient code to the prediction coefficient decoding unit 24 and outputs the spatial information code to the spatial information decoding unit 26.

チャネル信号復号部22は、受け取ったチャネル信号符号を復号する。その際、チャネル信号復号部22は、オーディオ符号化装置1のチャネル信号符号化部16による符号化処理と逆の処理を実行することでチャネル信号符号を復号して、ステレオ周波数信号の各チャネルの信号を再生する。すなわち、チャネル信号復号部22は、AAC符号についてはAAC符号に対する復号処理を実行して左側チャネル及び右側チャネルの低周波数成分を再生する。そしてチャネル信号復号部22は、左側チャネル及び右側チャネルの低周波数成分を時間周波数変換することにより、左側チャネル及び右側チャネルの周波数信号の低周波数成分を得る。
またチャネル信号復号部22は、SBR符号についてはSBR符号に対する復号処理を実行して左側チャネル及び右側チャネルの周波数信号の高周波数成分を復号する。そしてチャネル信号復号部22は、チャネルごとに、その低周波数成分と高周波数成分とを合成することで、ステレオ周波数信号の左側周波数信号Lp0(k,n)及び右側周波数信号Rp0(k,n)を再生する。そしてチャネル信号復号部22は、再生したステレオ周波数信号を予測復号部25へ出力する。
The channel signal decoding unit 22 decodes the received channel signal code. At that time, the channel signal decoding unit 22 decodes the channel signal code by executing a process reverse to the encoding process by the channel signal encoding unit 16 of the audio encoding device 1, so that each channel of the stereo frequency signal is decoded. Play the signal. That is, for the AAC code, the channel signal decoding unit 22 performs a decoding process on the AAC code to reproduce the low frequency components of the left channel and the right channel. And the channel signal decoding part 22 obtains the low frequency component of the frequency signal of a left channel and a right channel by carrying out time frequency conversion of the low frequency component of a left channel and a right channel.
Further, the channel signal decoding unit 22 performs a decoding process on the SBR code for the SBR code, and decodes the high frequency components of the frequency signals of the left channel and the right channel. Then, the channel signal decoding unit 22 combines the low frequency component and the high frequency component for each channel, so that the left frequency signal L p0 (k, n) and the right frequency signal R p0 (k, n) of the stereo frequency signal are combined. Play n). Then, the channel signal decoding unit 22 outputs the reproduced stereo frequency signal to the prediction decoding unit 25.

符号帳選択情報復号部23は、符号化された符号帳選択情報を復号する。例えば、符号帳選択情報復号部23は、符号帳選択情報の各値と、その値ごとに割り当てられているハフマン符号との対応関係を表す参照テーブルを参照して、ハフマン符号に対応する符号帳選択情報の値を復号する。そして符号帳選択情報復号部23は、復号された符号帳選択情報を予測係数復号部24へ通知する。なお、この参照テーブルは、例えば、符号帳選択情報復号部23が有するメモリに予め記憶される。   The codebook selection information decoding unit 23 decodes the encoded codebook selection information. For example, the codebook selection information decoding unit 23 refers to a reference table representing the correspondence between each value of the codebook selection information and the Huffman code assigned for each value, and the codebook corresponding to the Huffman code Decodes the value of the selection information. Then, the codebook selection information decoding unit 23 notifies the prediction coefficient decoding unit 24 of the decoded codebook selection information. The reference table is stored in advance in a memory included in the codebook selection information decoding unit 23, for example.

予測係数復号部24は、周波数帯域ごとに、左右それぞれのチャネルの予測係数符号と予測係数のインデックス値との対応関係を表すテーブルを参照して、予測係数符号に対応するインデックス値を再生する。そして予測係数復号部24は、周波数帯域ごとに、通知された符号帳選択情報に従って選択されている符号帳を予測係数復号部24が有するメモリから読み込む。そして予測係数復号部24は、その符号帳に規定された複数の量子化値のうち、インデックス値に対応する予測係数の量子化値を特定する。また予測係数復号部24は、符号帳が選択されていない予測係数についての予測係数符号については、その予測係数符号と予測係数の量子化値の上限値または下限値との対応を表すテーブルを参照して、その量子化値の上限値または下限値を求める。   The prediction coefficient decoding unit 24 reproduces the index value corresponding to the prediction coefficient code with reference to a table representing the correspondence relationship between the prediction coefficient codes of the left and right channels and the index value of the prediction coefficient for each frequency band. And the prediction coefficient decoding part 24 reads the codebook selected according to the notified codebook selection information from the memory which the prediction coefficient decoding part 24 has for every frequency band. And the prediction coefficient decoding part 24 specifies the quantization value of the prediction coefficient corresponding to an index value among the several quantization values prescribed | regulated by the codebook. Further, the prediction coefficient decoding unit 24 refers to a table representing the correspondence between the prediction coefficient code and the upper limit value or lower limit value of the quantized value of the prediction coefficient for the prediction coefficient code for the prediction coefficient for which no codebook is selected. Then, an upper limit value or a lower limit value of the quantized value is obtained.

また、予測係数符号として、隣接する周波数帯域間のインデックスの差分値がハフマン符号化されている場合には、予測係数復号部24は、その差分値とハフマン符号との対応関係を表すテーブルを参照してインデックスの差分値を再生する。そして予測係数復号部24は、その差分値を周波数帯域ごとに順次加算していくことにより、各周波数帯域のインデックス値を再生し、符号帳を参照して、そのインデックス値に対応する予測係数の量子化値を決定する。   Further, when the difference value of the index between adjacent frequency bands is Huffman-encoded as the prediction coefficient code, the prediction coefficient decoding unit 24 refers to a table representing the correspondence between the difference value and the Huffman code. Then, the index difference value is reproduced. And the prediction coefficient decoding part 24 reproduces | regenerates the index value of each frequency band by adding the difference value sequentially for every frequency band, refers to a codebook, and is the prediction coefficient corresponding to the index value. Determine the quantization value.

また変形例では、符号帳が選択されていない予測係数について、ある周波数帯域のインデックス値が隣接する周波数帯域のインデックス値と同じ(量子化値の範囲との接点が量子化値の上限)、または1加算した値(量子化値の範囲との接点が量子化値の下限)に設定されている。この場合には、予測係数復号部24は、インデックスの差分値が0であれば、その予測係数に対する量子化値の上限値を再生する。一方、インデックス値の差分値が1であれば、その予測係数に対する量子化値の下限値を再生すればよい。   In a modification, for a prediction coefficient for which no codebook is selected, the index value of a certain frequency band is the same as the index value of an adjacent frequency band (the point of contact with the range of quantization values is the upper limit of the quantization value), or The value obtained by adding 1 (the point of contact with the quantization value range is the lower limit of the quantization value). In this case, if the index difference value is 0, the prediction coefficient decoding unit 24 reproduces the upper limit value of the quantization value for the prediction coefficient. On the other hand, if the difference value of the index value is 1, the lower limit value of the quantization value for the prediction coefficient may be reproduced.

さらに、全ての周波数帯域にわたって符号帳が選択されていない予測係数は、予測誤差の分布形状が放物線型となり、かつ、任意の値をとれる予測係数であるため、予測係数復号部24は、その予測係数の値を任意の値、例えば、0とすればよい。
予測係数復号部24は、各周波数帯域の左右のチャネルの予測係数の量子化値を予測復号部25へ出力する。
Furthermore, since the prediction coefficient for which no codebook has been selected over all frequency bands is a prediction coefficient in which the distribution shape of the prediction error is parabolic and can take an arbitrary value, the prediction coefficient decoding unit 24 performs the prediction. The coefficient value may be an arbitrary value, for example, 0.
The prediction coefficient decoding unit 24 outputs the quantized values of the prediction coefficients of the left and right channels of each frequency band to the prediction decoding unit 25.

予測復号部25は、周波数帯域ごとに、ステレオ周波数信号に含まれる各チャネルの周波数信号に、対応する予測係数の量子化値を乗じて得られる値の線形和を計算することで、中央チャネルの周波数信号の予測値C'p0(k,n)を再生する。そして予測復号部25は、ステレオ周波数信号に含まれる左側チャネルの周波数信号Lp0(k,n)と、右側チャネルの周波数信号Rp0(k,n)と、中央チャネルの周波数信号の予測値C'p0(k,n)をアップミックスする。これにより、予測復号部25は、元の5.1chの信号をダウンミックスして得られる3個のチャネルの周波数信号Lin(k,n)、Rin(k,n)、Cin(k,n)を再生する。
予測復号部25は、周波数帯域ごとに、再生した周波数信号Lin(k,n)、Rin(k,n)、Cin(k,n)をアップミックス部27へ出力する。
The prediction decoding unit 25 calculates, for each frequency band, a linear sum of values obtained by multiplying the frequency signal of each channel included in the stereo frequency signal by the quantization value of the corresponding prediction coefficient, so that The predicted value C ′ p0 (k, n) of the frequency signal is reproduced. The predictive decoding unit 25 then includes the left channel frequency signal L p0 (k, n), the right channel frequency signal R p0 (k, n), and the predicted value C of the center channel frequency signal included in the stereo frequency signal. ' Upmix p0 (k, n). As a result, the predictive decoding unit 25 performs frequency signal L in (k, n), R in (k, n), C in (k, n) of three channels obtained by downmixing the original 5.1ch signal. Play n).
The predictive decoding unit 25 outputs the regenerated frequency signals L in (k, n), R in (k, n), and C in (k, n) to the upmix unit 27 for each frequency band.

空間情報復号部26は、分離部21から受け取った空間情報符号を復号する。例えば、類似度及び強度差のそれぞれの符号について、隣接する周波数帯域間のインデックスの差分値がハフマン符号化されている場合には、空間情報復号部26は、その差分値とハフマン符号との対応関係を表すテーブルを参照してインデックスの差分値を再生する。そして空間情報復号部26は、その差分値を周波数帯域ごとに順次加算していくことにより、各周波数帯域のインデックス値を再生する。そして空間情報復号部26は、インデックス値と類似度または強度差の量子化値との対応関係を表すテーブルを参照して、そのインデックス値に対応する類似度及び強度差の量子化値を決定する。
空間情報復号部26は、各周波数帯域の空間情報の量子化値をアップミックス部27へ出力する。
The spatial information decoding unit 26 decodes the spatial information code received from the separation unit 21. For example, when the difference value of the index between adjacent frequency bands is Huffman-encoded for each code of the similarity and the intensity difference, the spatial information decoding unit 26 associates the difference value with the Huffman code. The index difference value is reproduced with reference to the table representing the relationship. And the spatial information decoding part 26 reproduces | regenerates the index value of each frequency band by adding the difference value sequentially for every frequency band. Then, the spatial information decoding unit 26 refers to a table representing the correspondence relationship between the index value and the similarity or the quantized value of the intensity difference, and determines the similarity and the quantized value of the intensity difference corresponding to the index value. .
The spatial information decoding unit 26 outputs the quantized value of the spatial information in each frequency band to the upmix unit 27.

アップミックス部27は、周波数帯域ごとに、3個のチャネルの周波数信号Lin(k,n)、Rin(k,n)、Cin(k,n)を、空間情報に基づいてアップミックスすることにより、5.1chのオーディオ信号の各チャネルの周波数信号を再生する。そしてアップミックス部27は、再生した各チャネルの周波数信号を周波数時間変換部28へ出力する。 The upmix unit 27 upmixes the frequency signals L in (k, n), R in (k, n), and C in (k, n) of three channels for each frequency band based on spatial information. By doing so, the frequency signal of each channel of the 5.1ch audio signal is reproduced. Then, the upmix unit 27 outputs the reproduced frequency signal of each channel to the frequency time conversion unit 28.

周波数時間変換部28は、各チャネルの周波数信号を周波数時間変換することにより、5.1chのオーディオ信号を再生する。そしてオーディオ復号装置2は、再生したオーディオ信号を、例えば、スピーカへ出力する。   The frequency time conversion unit 28 reproduces a 5.1ch audio signal by performing frequency time conversion on the frequency signal of each channel. Then, the audio decoding device 2 outputs the reproduced audio signal to, for example, a speaker.

図17は、オーディオ復号装置2により実行されるオーディオ復号処理の動作フローチャートである。オーディオ復号装置2は、フレームごとに、下記の動作フローチャートに従ってオーディオ信号を再生する。   FIG. 17 is an operation flowchart of audio decoding processing executed by the audio decoding device 2. The audio decoding device 2 reproduces an audio signal for each frame according to the following operation flowchart.

分離部21は、SBR符号、AAC符号、空間情報符号、予測係数符号及び符号帳選択情報を取り出す(ステップS401)。
チャネル信号復号部22は、分離部21から受け取ったSBR符号、AAC符号を復号することにより、ステレオ周波数信号を再生する(ステップS402)。
符号帳選択情報復号部23は、符号帳選択情報を復号する(ステップS403)。
予測係数復号部24は、選択された符号帳を用いて予測係数を再生する(ステップS404)。
予測復号部25は、ステレオ周波数信号及び予測係数に基づいて中央チャネルの周波数信号を再生する(ステップS405)。そして予測復号部25は、ステレオ周波数信号及び中央チャネルの周波数信号をアップミックスすることにより、元の5.1chの周波数信号をダウンミックスして得られる3チャネルの周波数信号を再生する。
The separation unit 21 extracts an SBR code, an AAC code, a spatial information code, a prediction coefficient code, and codebook selection information (Step S401).
The channel signal decoding unit 22 reproduces a stereo frequency signal by decoding the SBR code and the AAC code received from the separation unit 21 (step S402).
The codebook selection information decoding unit 23 decodes the codebook selection information (step S403).
The prediction coefficient decoding unit 24 reproduces the prediction coefficient using the selected codebook (step S404).
The predictive decoding unit 25 reproduces the frequency signal of the center channel based on the stereo frequency signal and the prediction coefficient (step S405). Then, the prediction decoding unit 25 reproduces a 3-channel frequency signal obtained by downmixing the original 5.1ch frequency signal by upmixing the stereo frequency signal and the center channel frequency signal.

一方、空間情報復号部26は、分離部21から受け取った符号化空間情報を復号することにより空間情報を再生する(ステップS406)。そしてアップミックス部27は、空間情報に基づいて3チャネルの周波数信号をアップミックスすることにより5.1chの周波数信号を再生する(ステップS407)。
周波数時間変換部28は、各チャネルの周波数信号周波数時間変換して5.1chのオーディオ信号を再生する(ステップS408)。
そしてオーディオ復号装置は、オーディオ復号処理を終了する。
On the other hand, the spatial information decoding unit 26 reproduces the spatial information by decoding the encoded spatial information received from the separation unit 21 (step S406). Then, the upmixing unit 27 reproduces the 5.1ch frequency signal by upmixing the 3-channel frequency signal based on the spatial information (step S407).
The frequency time conversion unit 28 performs frequency time conversion of the frequency signal of each channel to reproduce a 5.1ch audio signal (step S408).
Then, the audio decoding device ends the audio decoding process.

上記の実施形態または変形例によるオーディオ符号化装置が有する各部の機能をコンピュータに実現させるコンピュータプログラムは、半導体メモリ、磁気記録媒体または光記録媒体などの記録媒体に記憶された形で提供されてもよい。同様に、上記の実施形態または変形例によるオーディオ復号装置が有する各部の機能をコンピュータに実現させるコンピュータプログラムは、半導体メモリ、磁気記録媒体または光記録媒体などの記録媒体に記憶された形で提供されてもよい。   A computer program that causes a computer to realize the functions of the units included in the audio encoding device according to the above-described embodiment or modification may be provided in a form stored in a recording medium such as a semiconductor memory, a magnetic recording medium, or an optical recording medium. Good. Similarly, a computer program that causes a computer to realize the functions of the units included in the audio decoding device according to the above-described embodiment or modification is provided in a form stored in a recording medium such as a semiconductor memory, a magnetic recording medium, or an optical recording medium. May be.

また、上記の実施形態または変形例によるオーディオ符号化装置は、コンピュータ、ビデオ信号の録画機または映像伝送装置など、オーディオ信号を伝送または記録するために利用される各種の機器に実装される。さらに、上記の実施形態または変形例によるオーディオ復号装置は、コンピュータ、ビデオ信号の再生機など、オーディオ信号を再生するために利用される各種の機器に実装される。   The audio encoding device according to the above-described embodiment or modification is mounted on various devices used for transmitting or recording an audio signal, such as a computer, a video signal recorder, or a video transmission device. Furthermore, the audio decoding device according to the above-described embodiment or modification is mounted on various devices used for reproducing an audio signal, such as a computer and a video signal reproducing device.

ここに挙げられた全ての例及び特定の用語は、読者が、本発明及び当該技術の促進に対する本発明者により寄与された概念を理解することを助ける、教示的な目的において意図されたものであり、本発明の優位性及び劣等性を示すことに関する、本明細書の如何なる例の構成、そのような特定の挙げられた例及び条件に限定しないように解釈されるべきものである。本発明の実施形態は詳細に説明されているが、本発明の精神及び範囲から外れることなく、様々な変更、置換及び修正をこれに加えることが可能であることを理解されたい。   All examples and specific terms listed herein are intended for instructional purposes to help the reader understand the concepts contributed by the inventor to the present invention and the promotion of the technology. It should be construed that it is not limited to the construction of any example herein, such specific examples and conditions, with respect to showing the superiority and inferiority of the present invention. Although embodiments of the present invention have been described in detail, it should be understood that various changes, substitutions and modifications can be made thereto without departing from the spirit and scope of the present invention.

1 オーディオ符号化装置
11 時間周波数変換部
12 ダウンミックス部
13 第2ダウンミックス部
14 予測符号化部
141 予測誤差形状判定部
142 最小誤差予測係数算出部
143 符号帳選択部
144 予測係数符号化部
15 空間情報符号化部
16 チャネル信号符号化部
161 SBR符号化部
162 周波数時間変換部
163 AAC符号化部
17 多重化部
2 オーディオ復号装置
21 分離部
22 チャネル信号復号部
23 符号帳選択情報復号部
24 予測係数復号部
25 予測復号部
26 空間情報復号部
27 アップミックス部
28 周波数時間変換部
DESCRIPTION OF SYMBOLS 1 Audio encoding apparatus 11 Time frequency conversion part 12 Downmix part 13 2nd downmix part 14 Prediction encoding part 141 Prediction error shape determination part 142 Minimum error prediction coefficient calculation part 143 Codebook selection part 144 Prediction coefficient encoding part 15 Spatial information encoding unit 16 Channel signal encoding unit 161 SBR encoding unit 162 Frequency time conversion unit 163 AAC encoding unit 17 Multiplexing unit 2 Audio decoding device 21 Separation unit 22 Channel signal decoding unit 23 Codebook selection information decoding unit 24 Prediction coefficient decoding unit 25 Prediction decoding unit 26 Spatial information decoding unit 27 Upmix unit 28 Frequency time conversion unit

Claims (10)

オーディオ信号に含まれる複数のチャネルのうちの第1のチャネルの信号及び第2のチャネルの信号と、該第1のチャネルの信号に乗じる第1の予測係数と該第2のチャネルの信号に乗じる第2の予測係数とに基づいて前記複数のチャネルのうちの第3のチャネルの信号を予測符号化するオーディオ符号化装置であって、
前記第1のチャネルの信号に前記第1の予測係数を乗じて得られる値と前記第2のチャネルの信号に前記第2の予測係数を乗じて得られる値との線形和である前記第3のチャネルの信号の予測値と前記第3のチャネルの信号間の誤差が最小となるときの前記第1及び第2の予測係数の第1の値の組を算出する最小誤差予測係数算出部と、
前記第1の予測係数及び前記第2の予測係数のうちの一方が、前記誤差の最小値に影響しないか、または前記組に含まれる予測係数の一方の前記第1の値が、当該予測係数の一方についての符号帳に規定された複数の量子化値を含む量子化値の範囲から外れている場合、前記第1の予測係数及び前記第2の予測係数のうちの他方の予測係数に対する前記符号帳を選択し、一方、前記第1の予測係数及び前記第2の予測係数の両方が前記誤差の最小値に影響し、かつ、前記組に含まれる前記第1の予測係数の前記第1の値及び前記第2の予測係数の前記第1の値のそれぞれが、当該予測係数についての前記符号帳に規定された複数の量子化値を含む量子化値の範囲内に含まれる場合、前記第1及び第2の予測係数のそれぞれごとに前記符号帳を選択する符号帳選択部と、
前記第1及び第2の予測係数のうち、前記符号帳が選択された予測係数について、前記符号帳に規定されている複数の量子化値のうち、前記誤差が最小となる量子化値を求め、当該量子化値を符号化することで符号化予測係数を求める予測係数符号化部と、
を有するオーディオ符号化装置。
Multiply the first channel signal and the second channel signal among the plurality of channels included in the audio signal, the first prediction coefficient multiplied by the first channel signal, and the second channel signal. An audio encoding device that predictively encodes a signal of a third channel of the plurality of channels based on a second prediction coefficient,
The third is a linear sum of a value obtained by multiplying the first channel signal by the first prediction coefficient and a value obtained by multiplying the second channel signal by the second prediction coefficient. A minimum error prediction coefficient calculation unit for calculating a set of first values of the first and second prediction coefficients when the error between the prediction value of the signal of the second channel and the signal of the third channel is minimized; ,
Either one of the first prediction coefficient and the second prediction coefficient does not affect the minimum value of the error, or one of the prediction coefficients included in the set is the prediction coefficient The first prediction coefficient and the second prediction coefficient for the other prediction coefficient, the first prediction coefficient and the second prediction coefficient are not included in the range of quantization values including a plurality of quantization values defined in the codebook for one of A codebook is selected, while both the first prediction coefficient and the second prediction coefficient affect the minimum value of the error, and the first of the first prediction coefficients included in the set And the first value of the second prediction coefficient are included in a range of quantization values including a plurality of quantization values defined in the codebook for the prediction coefficient, The codebook for each of the first and second prediction coefficients And the codebook selection section for-option,
Among the first and second prediction coefficients, for the prediction coefficient for which the codebook is selected, a quantization value that minimizes the error is obtained from a plurality of quantization values defined in the codebook. A prediction coefficient encoding unit that obtains an encoded prediction coefficient by encoding the quantized value;
An audio encoding device.
前記第1、第2及び第3のチャネルの信号に基づいて前記誤差の分布形状が楕円放物面状か放物線柱面状かを判定する誤差分布形状判定部をさらに有し、
前記最小誤差予測係数算出部は、前記誤差の分布形状が楕円放物面状である場合、前記第1及び第2の予測係数を変数とする楕円放物面の式に従って前記誤差を最小とする前記第1及び第2の予測係数の前記第1の値の組を算出し、一方、前記誤差の分布形状が放物線柱面状である場合、前記第1及び第2の予測係数を変数とする放物線柱面の式に従って前記誤差を最小とする前記第1及び前記第2の予測係数の前記第1の値の組を算出する、請求項1に記載のオーディオ符号化装置。
An error distribution shape determination unit that determines whether the distribution shape of the error is an elliptical paraboloid or a parabolic columnar surface based on the signals of the first, second, and third channels;
When the error distribution shape is an elliptic paraboloid, the minimum error prediction coefficient calculation unit minimizes the error according to an elliptic paraboloid equation using the first and second prediction coefficients as variables. When the first value pair of the first and second prediction coefficients is calculated, and the distribution shape of the error is a parabolic columnar surface, the first and second prediction coefficients are used as variables. The audio encoding device according to claim 1, wherein the first value set of the first and second prediction coefficients that minimizes the error is calculated according to a parabolic column surface equation.
前記予測係数符号化部は、前記誤差の分布形状が楕円放物面状であり、前記組に含まれる前記第1の予測係数の前記第1の値が当該第1の予測係数に対する前記複数の量子化値の上限よりも大きい場合、当該第1の予測係数を該量子化値の範囲の上限としたときに前記誤差が最小となる前記第2の予測係数の第2の値を前記誤差の分布形状を表す楕円放物面の式に従って求め、前記第2の予測係数に対する前記選択された符号帳に規定された複数の量子化値のなかから当該第2の値に最も近い量子化値を選択し、該選択した量子化値を符号化する、請求項2に記載のオーディオ符号化装置。   The prediction coefficient encoding unit is configured such that the distribution shape of the error is an elliptic paraboloid, and the first value of the first prediction coefficient included in the set is a plurality of the plurality of the first prediction coefficients with respect to the first prediction coefficient. When the quantization value is larger than the upper limit of the quantization value, the second value of the second prediction coefficient that minimizes the error when the first prediction coefficient is set to the upper limit of the range of the quantization value is set as the error. A quantized value closest to the second value among the plurality of quantized values defined in the selected codebook for the second prediction coefficient is obtained according to an elliptic paraboloid equation representing a distribution shape. The audio encoding device according to claim 2, wherein the audio encoding device selects and encodes the selected quantized value. 前記予測係数符号化部は、前記誤差の分布形状が楕円放物面状であり、前記第1の予測係数に対する前記符号帳が選択されなかった場合、前記組に含まれる前記第1の予測係数の前記第1の値に応じて、前記第1の予測係数に対する前記量子化値の範囲の上限及び下限のうちの何れかを表す情報を符号化する、請求項2または3に記載のオーディオ符号化装置。   When the error distribution shape is an elliptic paraboloid and the codebook for the first prediction coefficient is not selected, the prediction coefficient encoding unit includes the first prediction coefficient included in the set. 4. The audio code according to claim 2, wherein information representing any one of an upper limit and a lower limit of a range of the quantized value for the first prediction coefficient is encoded according to the first value. Device. 前記予測係数符号化部は、前記誤差の分布形状が放物線柱面状であり、前記組に含まれる前記第1の予測係数の前記第1の値が前記誤差の最小値に影響しない場合、前記第2の予測係数に対する前記選択された符号帳に規定された複数の量子化値のうちの前記組に含まれる前記第2の予測係数の前記第1の値に最も近い量子化値を符号化する、請求項1〜4の何れか一項に記載のオーディオ符号化装置。   The prediction coefficient encoding unit, when the error distribution shape is a parabolic columnar shape, and the first value of the first prediction coefficient included in the set does not affect the minimum value of the error, A quantization value closest to the first value of the second prediction coefficient included in the set among a plurality of quantization values defined in the selected codebook for the second prediction coefficient is encoded. The audio encoding device according to any one of claims 1 to 4. オーディオ信号に含まれる複数のチャネルのうちの第1のチャネルの信号及び第2のチャネルの信号と、該第1のチャネルの信号に乗じる第1の予測係数と該第2のチャネルの信号に乗じる第2の予測係数とに基づいて前記複数のチャネルのうちの第3のチャネルの信号を予測符号化するオーディオ符号化方法であって、
前記第1のチャネルの信号に前記第1の予測係数を乗じて得られる値と前記第2のチャネルの信号に前記第2の予測係数を乗じて得られる値との線形和である前記第3のチャネルの信号の予測値と前記第3のチャネルの信号間の誤差が最小となるときの前記第1及び第2の予測係数の第1の値の組を算出し、
前記第1の予測係数及び前記第2の予測係数のうちの一方が、前記誤差の最小値に影響しないか、または前記組に含まれる予測係数の一方の前記第1の値が、当該予測係数の一方についての符号帳に規定された複数の量子化値を含む量子化値の範囲から外れている場合、前記第1の予測係数及び前記第2の予測係数のうちの他方の予測係数に対する前記符号帳を選択し、一方、前記第1の予測係数及び前記第2の予測係数の両方が前記誤差の最小値に影響し、かつ、前記組に含まれる前記第1の予測係数の前記第1の値及び前記第2の予測係数の前記第1の値のそれぞれが、当該予測係数についての前記符号帳に規定された複数の量子化値を含む量子化値の範囲内に含まれる場合、前記第1及び第2の予測係数のそれぞれごとに前記符号帳を選択し、
前記第1及び第2の予測係数のうち、前記符号帳が選択された予測係数について、前記符号帳に規定されている複数の量子化値のうち、前記誤差が最小となる量子化値を求め、当該量子化値を符号化することで符号化予測係数を求める、
ことを含むオーディオ符号化方法。
Multiply the first channel signal and the second channel signal among the plurality of channels included in the audio signal, the first prediction coefficient multiplied by the first channel signal, and the second channel signal. An audio encoding method for predictively encoding a signal of a third channel of the plurality of channels based on a second prediction coefficient,
The third is a linear sum of a value obtained by multiplying the first channel signal by the first prediction coefficient and a value obtained by multiplying the second channel signal by the second prediction coefficient. Calculating a set of first values of the first and second prediction coefficients when an error between a predicted value of the signal of the second channel and a signal of the third channel is minimized;
Either one of the first prediction coefficient and the second prediction coefficient does not affect the minimum value of the error, or one of the prediction coefficients included in the set is the prediction coefficient The first prediction coefficient and the second prediction coefficient for the other prediction coefficient, the first prediction coefficient and the second prediction coefficient are not included in the range of quantization values including a plurality of quantization values defined in the codebook for one of A codebook is selected, while both the first prediction coefficient and the second prediction coefficient affect the minimum value of the error, and the first of the first prediction coefficients included in the set And the first value of the second prediction coefficient are included in a range of quantization values including a plurality of quantization values defined in the codebook for the prediction coefficient, The codebook for each of the first and second prediction coefficients And-option,
Among the first and second prediction coefficients, for the prediction coefficient for which the codebook is selected, a quantization value that minimizes the error is obtained from a plurality of quantization values defined in the codebook. The encoded prediction coefficient is obtained by encoding the quantized value.
An audio encoding method.
オーディオ信号に含まれる複数のチャネルのうちの第1のチャネルの信号及び第2のチャネルの信号と、該第1のチャネルの信号に乗じる第1の予測係数と該第2のチャネルの信号に乗じる第2の予測係数とに基づいて前記複数のチャネルのうちの第3のチャネルの信号をコンピュータに予測符号化させるオーディオ符号化用コンピュータプログラムであって、
前記第1のチャネルの信号に前記第1の予測係数を乗じて得られる値と前記第2のチャネルの信号に前記第2の予測係数を乗じて得られる値との線形和である前記第3のチャネルの信号の予測値と前記第3のチャネルの信号間の誤差が最小となるときの前記第1及び第2の予測係数の第1の値の組を算出し、
前記第1の予測係数及び前記第2の予測係数のうちの一方が、前記誤差の最小値に影響しないか、または前記組に含まれる予測係数の一方の前記第1の値が、当該予測係数の一方についての符号帳に規定された複数の量子化値を含む量子化値の範囲から外れている場合、前記第1の予測係数及び前記第2の予測係数のうちの他方の予測係数に対する前記符号帳を選択し、一方、前記第1の予測係数及び前記第2の予測係数の両方が前記誤差の最小値に影響し、かつ、前記組に含まれる前記第1の予測係数の前記第1の値及び前記第2の予測係数の前記第1の値のそれぞれが、当該予測係数についての前記符号帳に規定された複数の量子化値を含む量子化値の範囲内に含まれる場合、前記第1及び第2の予測係数のそれぞれごとに前記符号帳を選択し、
前記第1及び第2の予測係数のうち、前記符号帳が選択された予測係数について、前記符号帳に規定されている複数の量子化値のうち、前記誤差が最小となる量子化値を求め、当該量子化値を符号化することで符号化予測係数を求める、
ことをコンピュータに実行させるためのオーディオ符号化用コンピュータプログラム。
Multiply the first channel signal and the second channel signal among the plurality of channels included in the audio signal, the first prediction coefficient multiplied by the first channel signal, and the second channel signal. An audio encoding computer program that causes a computer to predictively encode a signal of a third channel of the plurality of channels based on a second prediction coefficient,
The third is a linear sum of a value obtained by multiplying the first channel signal by the first prediction coefficient and a value obtained by multiplying the second channel signal by the second prediction coefficient. Calculating a set of first values of the first and second prediction coefficients when an error between a predicted value of the signal of the second channel and a signal of the third channel is minimized;
Either one of the first prediction coefficient and the second prediction coefficient does not affect the minimum value of the error, or one of the prediction coefficients included in the set is the prediction coefficient The first prediction coefficient and the second prediction coefficient for the other prediction coefficient, the first prediction coefficient and the second prediction coefficient are not included in the range of quantization values including a plurality of quantization values defined in the codebook for one of A codebook is selected, while both the first prediction coefficient and the second prediction coefficient affect the minimum value of the error, and the first of the first prediction coefficients included in the set And the first value of the second prediction coefficient are included in a range of quantization values including a plurality of quantization values defined in the codebook for the prediction coefficient, The codebook for each of the first and second prediction coefficients And-option,
Among the first and second prediction coefficients, for the prediction coefficient for which the codebook is selected, a quantization value that minimizes the error is obtained from a plurality of quantization values defined in the codebook. The encoded prediction coefficient is obtained by encoding the quantized value.
An audio encoding computer program for causing a computer to execute the above.
オーディオ信号に含まれる複数のチャネルのうちの第1及び第2のチャネルの信号が符号化された符号化チャネル信号データと、前記第1及び第2のチャネルの信号に基づいて前記複数のチャネルのうちの第3のチャネルの信号を予測するための第1及び第2の予測係数が符号化された符号化予測係数と、前記第1の予測係数についての複数の量子化値を規定する第1の符号帳及び前記第2の予測係数についての複数の量子化値を規定する第2の符号帳のうち選択された符号帳を表す符号帳選択情報とを、所定のデータ形式に従って格納する符号化オーディオデータから前記オーディオ信号を復号するオーディオ復号装置であって、
前記データ形式に従って、前記符号化オーディオデータから、前記符号化チャネル信号データと、前記符号化予測係数と、前記符号帳選択情報とを取り出す分離部と、
前記符号化チャネル信号データを復号することにより前記第1及び第2のチャネルの信号を再生するチャネル信号復号部と、
前記第1及び第2の符号帳のうち、前記符号帳選択情報に選択されたことが示された符号帳に規定された複数の量子化値のうち、前記符号化予測係数に対応する量子化値を特定することにより前記第1及び第2の予測係数を再生する予測係数復号部と、
再生された前記第1の予測係数に前記第1のチャネルの信号を乗じて第1の値を求め、かつ、再生された前記第2の予測係数に前記第2のチャネルの信号を乗じて第2の値を求め、該第1の値と該第2の値の和を前記第3のチャネルの信号として再生する予測復号部と、
を有するオーディオ復号装置。
Based on the encoded channel signal data obtained by encoding the signals of the first and second channels among the plurality of channels included in the audio signal, and the signals of the first and second channels, A first prediction coefficient defining a plurality of quantized values for the first prediction coefficient and an encoded prediction coefficient obtained by encoding the first and second prediction coefficients for predicting a signal of the third channel. And a codebook selection information representing a codebook selected from a second codebook that defines a plurality of quantization values for the second prediction coefficient and a second codebook, according to a predetermined data format An audio decoding device for decoding the audio signal from audio data,
In accordance with the data format, a separator that extracts the encoded channel signal data, the encoded prediction coefficient, and the codebook selection information from the encoded audio data;
A channel signal decoding unit for reproducing the signals of the first and second channels by decoding the encoded channel signal data;
Of the first and second codebooks, the quantization corresponding to the encoded prediction coefficient among the plurality of quantization values defined in the codebook indicated to be selected in the codebook selection information A prediction coefficient decoding unit that reproduces the first and second prediction coefficients by specifying a value;
A first value is obtained by multiplying the reproduced first prediction coefficient by the signal of the first channel, and a second value is obtained by multiplying the reproduced second prediction coefficient by the signal of the second channel. A predictive decoding unit that obtains a value of 2 and reproduces the sum of the first value and the second value as a signal of the third channel;
An audio decoding device.
オーディオ信号に含まれる複数のチャネルのうちの第1及び第2のチャネルの信号が符号化された符号化チャネル信号データと、前記第1及び第2のチャネルの信号に基づいて前記複数のチャネルのうちの第3のチャネルの信号を予測するための第1及び第2の予測係数が符号化された符号化予測係数と、前記第1の予測係数についての複数の量子化値を規定する第1の符号帳及び前記第2の予測係数についての複数の量子化値を規定する第2の符号帳のうち選択された符号帳を表す符号帳選択情報とを、所定のデータ形式に従って格納する符号化オーディオデータから前記オーディオ信号を復号するオーディオ復号方法であって、
前記データ形式に従って、前記符号化オーディオデータから、前記符号化チャネル信号データと、前記符号化予測係数と、前記符号帳選択情報とを取り出し、
前記符号化チャネル信号データを復号することにより前記第1及び第2のチャネルの信号を再生し、
前記第1及び第2の符号帳のうち、前記符号帳選択情報に選択されたことが示された符号帳に規定された複数の量子化値のうち、前記符号化予測係数に対応する量子化値を特定することにより前記第1及び第2の予測係数を再生し、
再生された前記第1の予測係数に前記第1のチャネルの信号を乗じて第1の値を求め、かつ、再生された前記第2の予測係数に前記第2のチャネルの信号を乗じて第2の値を求め、該第1の値と該第2の値の和を前記第3のチャネルの信号として再生する、
ことを含むオーディオ復号方法。
Based on the encoded channel signal data obtained by encoding the signals of the first and second channels among the plurality of channels included in the audio signal, and the signals of the first and second channels, A first prediction coefficient defining a plurality of quantized values for the first prediction coefficient and an encoded prediction coefficient obtained by encoding the first and second prediction coefficients for predicting a signal of the third channel. And a codebook selection information representing a codebook selected from a second codebook that defines a plurality of quantization values for the second prediction coefficient and a second codebook, according to a predetermined data format An audio decoding method for decoding the audio signal from audio data,
According to the data format, the encoded channel signal data, the encoded prediction coefficient, and the codebook selection information are extracted from the encoded audio data,
Reproducing the signals of the first and second channels by decoding the encoded channel signal data;
Of the first and second codebooks, the quantization corresponding to the encoded prediction coefficient among the plurality of quantization values defined in the codebook indicated to be selected in the codebook selection information Regenerating the first and second prediction coefficients by specifying a value;
A first value is obtained by multiplying the reproduced first prediction coefficient by the signal of the first channel, and a second value is obtained by multiplying the reproduced second prediction coefficient by the signal of the second channel. 2 is obtained, and the sum of the first value and the second value is reproduced as the signal of the third channel.
An audio decoding method.
オーディオ信号に含まれる複数のチャネルのうちの第1及び第2のチャネルの信号が符号化された符号化チャネル信号データと、前記第1及び第2のチャネルの信号に基づいて前記複数のチャネルのうちの第3のチャネルの信号を予測するための第1及び第2の予測係数が符号化された符号化予測係数と、前記第1の予測係数についての複数の量子化値を規定する第1の符号帳及び前記第2の予測係数についての複数の量子化値を規定する第2の符号帳のうち選択された符号帳を表す符号帳選択情報とを、所定のデータ形式に従って格納する符号化オーディオデータから前記オーディオ信号をコンピュータに復号させるオーディオ復号用コンピュータプログラムであって、
前記データ形式に従って、前記符号化オーディオデータから、前記符号化チャネル信号データと、前記符号化予測係数と、前記符号帳選択情報とを取り出し、
前記符号化チャネル信号データを復号することにより前記第1及び第2のチャネルの信号を再生し、
前記第1及び第2の符号帳のうち、前記符号帳選択情報に選択されたことが示された符号帳に規定された複数の量子化値のうち、前記符号化予測係数に対応する量子化値を特定することにより前記第1及び第2の予測係数を再生し、
再生された前記第1の予測係数に前記第1のチャネルの信号を乗じて第1の値を求め、かつ、再生された前記第2の予測係数に前記第2のチャネルの信号を乗じて第2の値を求め、該第1の値と該第2の値の和を前記第3のチャネルの信号として再生する、
ことを含むオーディオ復号方法。
ことをコンピュータに実行させるオーディオ復号用コンピュータプログラム。
Based on the encoded channel signal data obtained by encoding the signals of the first and second channels among the plurality of channels included in the audio signal, and the signals of the first and second channels, A first prediction coefficient defining a plurality of quantized values for the first prediction coefficient and an encoded prediction coefficient obtained by encoding the first and second prediction coefficients for predicting a signal of the third channel. And a codebook selection information representing a codebook selected from a second codebook that defines a plurality of quantization values for the second prediction coefficient and a second codebook, according to a predetermined data format An audio decoding computer program for causing a computer to decode the audio signal from audio data,
According to the data format, the encoded channel signal data, the encoded prediction coefficient, and the codebook selection information are extracted from the encoded audio data,
Reproducing the signals of the first and second channels by decoding the encoded channel signal data;
Of the first and second codebooks, the quantization corresponding to the encoded prediction coefficient among the plurality of quantization values defined in the codebook indicated to be selected in the codebook selection information Regenerating the first and second prediction coefficients by specifying a value;
A first value is obtained by multiplying the reproduced first prediction coefficient by the signal of the first channel, and a second value is obtained by multiplying the reproduced second prediction coefficient by the signal of the second channel. 2 is obtained, and the sum of the first value and the second value is reproduced as the signal of the third channel.
An audio decoding method.
A computer program for audio decoding that causes a computer to execute the above.
JP2012062767A 2012-03-19 2012-03-19 Audio encoding apparatus, audio encoding method, audio encoding computer program, audio decoding apparatus, audio decoding method, and audio decoding computer program Expired - Fee Related JP5990954B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012062767A JP5990954B2 (en) 2012-03-19 2012-03-19 Audio encoding apparatus, audio encoding method, audio encoding computer program, audio decoding apparatus, audio decoding method, and audio decoding computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012062767A JP5990954B2 (en) 2012-03-19 2012-03-19 Audio encoding apparatus, audio encoding method, audio encoding computer program, audio decoding apparatus, audio decoding method, and audio decoding computer program

Publications (2)

Publication Number Publication Date
JP2013195706A true JP2013195706A (en) 2013-09-30
JP5990954B2 JP5990954B2 (en) 2016-09-14

Family

ID=49394722

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012062767A Expired - Fee Related JP5990954B2 (en) 2012-03-19 2012-03-19 Audio encoding apparatus, audio encoding method, audio encoding computer program, audio decoding apparatus, audio decoding method, and audio decoding computer program

Country Status (1)

Country Link
JP (1) JP5990954B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015118123A (en) * 2013-12-16 2015-06-25 富士通株式会社 Audio encoding device, audio encoding method, audio encoding program, and audio decoding device

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007279385A (en) * 2006-04-06 2007-10-25 Nippon Telegr & Teleph Corp <Ntt> Multichannel encoding method, its device, its program and recording medium
JP2011209588A (en) * 2010-03-30 2011-10-20 Fujitsu Ltd Downmixing device and downmixing method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007279385A (en) * 2006-04-06 2007-10-25 Nippon Telegr & Teleph Corp <Ntt> Multichannel encoding method, its device, its program and recording medium
JP2011209588A (en) * 2010-03-30 2011-10-20 Fujitsu Ltd Downmixing device and downmixing method

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6015052456; 岸 洋平: '予測誤差分布に基づく高音質かつ高速なMPEGサラウンド符号化の検討' 日本音響学会 2012年 春季研究発表会講演論文集 , 201203, PP.815-818 *
JPN6015052456; 岸 洋平: 日本音響学会 2012年 春季研究発表会講演論文集 , 201203 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015118123A (en) * 2013-12-16 2015-06-25 富士通株式会社 Audio encoding device, audio encoding method, audio encoding program, and audio decoding device

Also Published As

Publication number Publication date
JP5990954B2 (en) 2016-09-14

Similar Documents

Publication Publication Date Title
US9741354B2 (en) Bitstream syntax for multi-process audio decoding
US8046214B2 (en) Low complexity decoder for complex transform coding of multi-channel sound
KR101823278B1 (en) Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
JP5533502B2 (en) Audio encoding apparatus, audio encoding method, and audio encoding computer program
TWI657434B (en) Method and apparatus for decoding a compressed hoa representation, and method and apparatus for encoding a compressed hoa representation
EP3164867A1 (en) Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a hoa signal representation
TW201606751A (en) Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation
EP3164868A1 (en) Method and apparatus for decoding a compressed hoa representation, and method and apparatus for encoding a compressed hoa representation
JP5949270B2 (en) Audio decoding apparatus, audio decoding method, and audio decoding computer program
JP5990954B2 (en) Audio encoding apparatus, audio encoding method, audio encoding computer program, audio decoding apparatus, audio decoding method, and audio decoding computer program
JP5799824B2 (en) Audio encoding apparatus, audio encoding method, and audio encoding computer program
JP6179122B2 (en) Audio encoding apparatus, audio encoding method, and audio encoding program
CN106463131B (en) Method and apparatus for encoding/decoding the direction of a dominant direction signal within a subband represented by an HOA signal
JP6051621B2 (en) Audio encoding apparatus, audio encoding method, audio encoding computer program, and audio decoding apparatus
JP6303435B2 (en) Audio encoding apparatus, audio encoding method, audio encoding program, and audio decoding apparatus
JP6299202B2 (en) Audio encoding apparatus, audio encoding method, audio encoding program, and audio decoding apparatus
KR20140037118A (en) Method of processing audio signal, audio encoding apparatus, audio decoding apparatus and terminal employing the same
KR20080010981A (en) Method for encoding and decoding data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141204

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160105

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160303

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160719

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160801

R150 Certificate of patent or registration of utility model

Ref document number: 5990954

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees