JP2013050658A - Multi-channel sound coding device and program thereof - Google Patents

Multi-channel sound coding device and program thereof Download PDF

Info

Publication number
JP2013050658A
JP2013050658A JP2011189680A JP2011189680A JP2013050658A JP 2013050658 A JP2013050658 A JP 2013050658A JP 2011189680 A JP2011189680 A JP 2011189680A JP 2011189680 A JP2011189680 A JP 2011189680A JP 2013050658 A JP2013050658 A JP 2013050658A
Authority
JP
Japan
Prior art keywords
channel
transmission signal
signal
conversion
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011189680A
Other languages
Japanese (ja)
Inventor
Satoshi Oishi
諭 大石
Akio Ando
彰男 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2011189680A priority Critical patent/JP2013050658A/en
Publication of JP2013050658A publication Critical patent/JP2013050658A/en
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a multi-channel sound coding device and a program thereof for performing bit allocation according to the characteristics of individual channels of an input signal when encoding a transmission signal into which the input signal of a multi-channel sound method is converted by matrix conversion.SOLUTION: A multi-channel sound coding device 1 according to the present invention comprises: a matrix converting section 20 that converts, by matrix conversion, an input signal of a multi-channel sound method into a transmission signal having a plurality of channels; and a coding section 50 that performs bit allocation for the transmission signal for each channel of the transmission signal. The multi-channel coding device 1 also comprises: a calculating section 30 that calculates an auditory model of the input signal for each channel of the multi-channel sound method; and a converting section 40 that generates an after-conversion auditory model from each of the auditory models. The coding section 50 performs the bit allocation for the transmission signal on the basis of the after-conversion auditory model.

Description

この発明は、多チャネル音響符号化装置およびそのプログラムに関する。   The present invention relates to a multi-channel acoustic encoding apparatus and a program thereof.

社団法人電波産業会(ARIB)では、22.2チャネル音響を伝送・符号化するために、既存のAAC(Advanced Audio Coding)符号化を用いる方式が標準化されている。AAC方式は、CD(コンパクトディスク)の品質を保ったまま1/10程度のビットレートで符号化可能な方式である(例えば、非特許文献1参照)。   The Japan Radio Industry Association (ARIB) standardizes a method using existing AAC (Advanced Audio Coding) coding to transmit and code 22.2 channel sound. The AAC method is a method capable of encoding at a bit rate of about 1/10 while maintaining the quality of a CD (compact disc) (for example, see Non-Patent Document 1).

22.2チャネル音響の伝送・符号化を行う際に、伝送チャネル数を増やさずに従来の2チャネルステレオなどとの互換性を確保するためには、行列変換などの信号変換を行う必要がある。行列変換を用いた従来のAAC符号化について図2を用いて説明する。図2は、行列変換により22.2チャネル音響信号である入力信号を2チャネルの伝送信号に変換してAAC伝送する処理の概要を示す図である。まず、送信ブロックでは、22.2チャネルの入力信号が行列変換され、例えば、基本信号および補助信号の2つのチャネルを含む伝送信号に変換される。ここで、基本信号とは、22.2チャネル音響信号の主要な空間情報を表す8〜10チャネルの信号であり、補助信号とは、基本信号を補完して元の22.2チャネル音響信号を復元するための信号である。   When performing transmission / coding of 22.2 channel sound, it is necessary to perform signal conversion such as matrix conversion in order to ensure compatibility with the conventional 2-channel stereo without increasing the number of transmission channels. . A conventional AAC encoding using matrix transformation will be described with reference to FIG. FIG. 2 is a diagram illustrating an outline of processing for converting an input signal, which is a 22.2 channel acoustic signal, into a 2-channel transmission signal by matrix conversion and performing AAC transmission. First, in the transmission block, the 22.2 channel input signal is subjected to matrix conversion, for example, converted into a transmission signal including two channels of a basic signal and an auxiliary signal. Here, the basic signal is a signal of 8 to 10 channels representing main spatial information of the 22.2 channel acoustic signal, and the auxiliary signal is the original 22.2 channel acoustic signal by complementing the basic signal. This is a signal for restoration.

次に、送信ブロックにおいては、基本信号および補助信号のAAC符号化がそれぞれ独立に行われる。ここで、AAC符号化では、各伝送信号を周波数分析した後、顕著な周波数成分の検出を行い、この成分によって聞き取れなくなる(マスクされる)周波数成分の上限を表すマスキング曲線を算出し、マスキング曲線以下の周波数成分に対するビット割当てを削減するとともに、マスキング曲線以下に収まる量子化雑音を許容したビット割当てが行われる。   Next, in the transmission block, AAC encoding of the basic signal and the auxiliary signal is performed independently. Here, in AAC coding, after frequency analysis of each transmission signal, significant frequency components are detected, and a masking curve representing the upper limit of frequency components that cannot be heard (masked) by this component is calculated. Bit allocation for the following frequency components is reduced, and bit allocation that allows quantization noise that falls below the masking curve is performed.

送信ブロックから受信ブロックにAAC符号化された伝送信号が伝送されると、受信ブロックでは、基本信号および補助信号がそれぞれ独立にAAC復号が行われ、逆行列変換により22.2チャネル音響信号が復元される。   When an AAC-encoded transmission signal is transmitted from the transmission block to the reception block, the basic signal and the auxiliary signal are independently AAC decoded in the reception block, and the 22.2 channel acoustic signal is restored by inverse matrix transformation. Is done.

Marina Bosi, Richard E. Goldberg, "Introduction to Digital Audio Coding and Standards" Springer, 2002-12-31Marina Bosi, Richard E. Goldberg, "Introduction to Digital Audio Coding and Standards" Springer, 2002-12-31

ここで、従来のAAC符号化では、22.2チャネル音響の入力信号をよりチャネル数の少ない伝送信号にダウンミックスして伝送する場合のように、行列変換を伴う信号の符号化に対する処理が検討されていない。   Here, in the conventional AAC coding, processing for signal coding accompanied by matrix transformation is examined, as in the case of transmitting a 22.2 channel acoustic input signal by downmixing to a transmission signal having a smaller number of channels. It has not been.

例えば、図2に示す従来のAAC符号化では、送信ブロックにおいて、行列変換後の伝送信号の各チャネル(基本信号および補助信号)が独立して処理される。即ち、複数の多チャネル音響信号が行列変換により混在している伝送信号に対して、行列変換後のチャネル毎に、個別にマスキング曲線に基づくビット割当て処理が行われることになる。このため、行列変換後のチャネルによっては、特定の成分が残されたり削除されたりする現象が起こり、結果として、逆行列変換後に、元の多チャネル音響信号の成分を復元できなかったり、あるいは、相殺すべき成分がなくなったため雑音が発生するということが起こっていた。   For example, in the conventional AAC encoding shown in FIG. 2, each channel (basic signal and auxiliary signal) of the transmission signal after matrix conversion is processed independently in the transmission block. That is, a bit allocation process based on a masking curve is individually performed for each channel after matrix transformation on a transmission signal in which a plurality of multi-channel acoustic signals are mixed by matrix transformation. For this reason, depending on the channel after matrix transformation, a phenomenon may occur in which a specific component is left or deleted, and as a result, after the inverse matrix transformation, the original multi-channel acoustic signal component cannot be restored, or There was a problem that noise was generated because there was no component to be canceled.

したがって、かかる点に鑑みてなされた本発明の目的は、多チャネル音響方式の入力信号を行列変換した伝送信号を符号化する際に、入力信号の各チャネルの特性に合わせたビット割当てを行うことが可能な、多チャネル音響符号化装置およびそのプログラムを提供することである。   Accordingly, an object of the present invention made in view of such a point is to perform bit allocation in accordance with the characteristics of each channel of an input signal when encoding a transmission signal obtained by performing matrix transformation on an input signal of a multi-channel acoustic system. A multi-channel audio encoding device and a program thereof are provided.

上述した諸課題を解決すべく、本発明に係る多チャネル音響符号化装置は、多チャネル音響方式の入力信号を行列変換により複数のチャネルの伝送信号に変換する行列変換部と、前記伝送信号のチャネル毎に、前記伝送信号に対するビット割当てを行う符号化部と、を備える多チャネル音響符号化装置であって、前記多チャネル音響方式のチャネル毎に前記入力信号の聴覚モデルを計算する計算部と、前記各聴覚モデルから変換後聴覚モデルを生成する変換部と、を備え、前記符号化部は、前記変換後聴覚モデルに基づき、前記伝送信号に対するビット割当てを行う、ことを特徴とする。   In order to solve the above-described problems, a multi-channel acoustic encoding apparatus according to the present invention includes a matrix conversion unit that converts a multi-channel acoustic input signal into a transmission signal of a plurality of channels by matrix conversion, A multi-channel acoustic coding apparatus comprising: an encoding unit that assigns bits to the transmission signal for each channel; and a calculation unit that calculates an auditory model of the input signal for each channel of the multi-channel acoustic system; A conversion unit that generates a converted auditory model from each of the auditory models, and the encoding unit performs bit allocation for the transmission signal based on the converted auditory model.

また、前記変換部は、前記行列変換部が用いる変換行列の変換係数に応じて、前記各聴覚モデルから前記変換後聴覚モデルを生成する、ことが好ましい。   Moreover, it is preferable that the said conversion part produces | generates the said auditory model after conversion from each said auditory model according to the conversion coefficient of the conversion matrix which the said matrix converter uses.

また、前記符号化部は、AAC符号化を行うものであって、前記変換後聴覚モデルに基づくスケールファクタにより、前記伝送信号に対するビット割当てを行う、ことが好ましい。   Further, it is preferable that the encoding unit performs AAC encoding, and performs bit allocation to the transmission signal by a scale factor based on the post-conversion auditory model.

上述したように本発明の解決手段を装置として説明してきたが、本発明はこれらに実質的に相当する方法、プログラム、プログラムを記録した記憶媒体としても実現し得るものであり、本発明の範囲にはこれらも包含されるものと理解されたい。   As described above, the solution of the present invention has been described as an apparatus. However, the present invention can be realized as a method, a program, and a storage medium storing the program, which are substantially equivalent thereto, and the scope of the present invention. It should be understood that these are also included.

例えば、本発明をプログラムとして実現した発明は、コンピュータに、多チャネル音響方式の入力信号を行列変換により複数のチャネルの伝送信号に変換する手順と、前記多チャネル音響方式のチャネル毎に前記入力信号の聴覚モデルを計算する手順と、前記各聴覚モデルから変換後聴覚モデルを生成する手順と、前記変換後聴覚モデルに基づき、前記伝送信号に対するビット割当てを行う手順と、を実行させるものである。   For example, the invention that implements the present invention as a program includes a computer that converts a multi-channel acoustic system input signal into a transmission signal of a plurality of channels by matrix transformation, and the input signal for each channel of the multi-channel acoustic system. And a procedure for generating a converted auditory model from each auditory model, and a procedure for assigning bits to the transmission signal based on the converted auditory model.

本発明による多チャネル音響符号化装置およびそのプログラムによれば、多チャネル音響方式の入力信号を行列変換した伝送信号を符号化する際に、入力信号の各チャネルの特性に合わせたビット割当てを行うことが可能となる。   According to the multi-channel acoustic encoding apparatus and the program thereof according to the present invention, when encoding a transmission signal obtained by performing matrix conversion on an input signal of a multi-channel acoustic scheme, bit allocation is performed according to the characteristics of each channel of the input signal It becomes possible.

本発明の一実施形態に係る多チャネル音響符号化装置の機能ブロックを示す図である。It is a figure which shows the functional block of the multi-channel acoustic coding apparatus which concerns on one Embodiment of this invention. 多チャネルの入力信号を行列変換により2チャネルの伝送信号に変換してAAC伝送する処理の概要を示す図である。It is a figure which shows the outline | summary of the process which converts a multi-channel input signal into a 2-channel transmission signal by matrix transformation, and carries out AAC transmission.

以降、諸図面を参照しながら、本発明の実施態様を詳細に説明する。ここで、以下の説明においては、多チャネル音響方式として、スーパーハイビジョン用の音響方式である22.2チャネル音響を例に説明を行うが、本発明は22.2チャネル音響のみに限定されるものではない点に留意されたい。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. Here, in the following description, the 22.2 channel sound which is the sound method for Super Hi-Vision will be described as an example of the multi-channel sound method, but the present invention is limited to only 22.2 channel sound. Note that this is not the case.

図1は、本発明の一実施形態に係る多チャネル音響符号化装置1の機能ブロック図である。多チャネル音響符号化装置1は、音響信号入力部10と、行列変換部20と、マスキング曲線計算部30と、マスキング曲線変換部40と、符号化部50と、伝送部60とを備える。   FIG. 1 is a functional block diagram of a multi-channel acoustic encoding apparatus 1 according to an embodiment of the present invention. The multi-channel acoustic encoding apparatus 1 includes an acoustic signal input unit 10, a matrix conversion unit 20, a masking curve calculation unit 30, a masking curve conversion unit 40, an encoding unit 50, and a transmission unit 60.

ここで、多チャネル音響符号化装置1として機能させるために、コンピュータを好適に用いることができ、そのようなコンピュータは、多チャネル音響符号化装置1の各機能を実現する処理内容を記述したプログラムを、当該コンピュータの記憶部(図示せず)に格納しておき、当該コンピュータの中央演算処理装置(CPU)によってこのプログラムを読み出して実行させることで実現することができる。   Here, in order to function as the multi-channel acoustic encoding device 1, a computer can be suitably used, and such a computer is a program describing processing contents for realizing each function of the multi-channel acoustic encoding device 1. Is stored in a storage unit (not shown) of the computer, and this program is read and executed by a central processing unit (CPU) of the computer.

音響信号入力部10は、入力される22.2チャネル音響信号をA/D変換し、デジタル形式の音響信号を、入力信号として行列変換部20およびマスキング曲線計算部30に出力する。   The acoustic signal input unit 10 performs A / D conversion on the input 22.2 channel acoustic signal, and outputs the digital acoustic signal to the matrix conversion unit 20 and the masking curve calculation unit 30 as an input signal.

行列変換部20は、22.2チャネル音響信号である入力信号を行列変換によってよりチャネル数の少ない伝送信号にダウンミックスする。行列変換部20は、行列変換後の伝送信号を符号化部50に出力する。また、行列変換部20は、行列変換に用いた変換行列(変換係数)の情報を、マスキング曲線変換部40に出力する。   The matrix converter 20 downmixes the input signal, which is a 22.2 channel acoustic signal, into a transmission signal with a smaller number of channels by matrix conversion. The matrix conversion unit 20 outputs the transmission signal after the matrix conversion to the encoding unit 50. Further, the matrix conversion unit 20 outputs information on the conversion matrix (conversion coefficient) used for the matrix conversion to the masking curve conversion unit 40.

マスキング曲線計算部30は、22.2チャネル信号のチャネル毎に、入力信号の聴覚モデルを計算する。ここで、各チャネルの聴覚モデルとは、「エネルギーの大きな信号の近傍周波数帯域では比較的小さいエネルギーを有する音は聞き取ることができない」という聴覚特性に基づくマスキング曲線や、「周波数毎に聞き取ることのできないエネルギーの音がある」という聴覚特性に基づく最小可聴曲線などに基づいて計算されるものである。なお、マスキング曲線や最小可聴曲線の計算は当業者にとって公知であるため、本稿において詳述は行わない。これ以降、説明の便宜上、聴覚モデルとしてマスキング曲線を用いる場合を例に説明を行うが、本発明はこれに限定されない。マスキング曲線計算部30は、計算した各チャネルの聴覚モデル(マスキング曲線)をマスキング曲線変換部40に供給する。   The masking curve calculation unit 30 calculates an auditory model of the input signal for each channel of the 22.2 channel signal. Here, the auditory model of each channel is a masking curve based on an auditory characteristic that “a sound having relatively low energy cannot be heard in a frequency band near a high-energy signal” It is calculated based on the minimum audible curve based on the auditory characteristic that there is a sound of energy that cannot be performed. Note that the calculation of the masking curve and the minimum audible curve is known to those skilled in the art and will not be described in detail in this article. Hereinafter, for convenience of explanation, a case where a masking curve is used as an auditory model will be described as an example, but the present invention is not limited to this. The masking curve calculation unit 30 supplies the calculated auditory model (masking curve) of each channel to the masking curve conversion unit 40.

マスキング曲線変換部40は、マスキング曲線計算部30が計算した各チャネルの聴覚モデル(マスキング曲線)を合成し、変換後聴覚モデル(合成マスキング曲線)を生成する。   The masking curve conversion unit 40 synthesizes the auditory model (masking curve) of each channel calculated by the masking curve calculation unit 30 to generate a converted auditory model (synthetic masking curve).

例えば、マスキング曲線変換部40は、式1のように、各チャネルのマスキング曲線の最小値を選択し、合成マスキング曲線を生成することができる。ここで、Gは各チャネルの伝送信号に対する合成マスキング曲線を表し、Fは、チャネル番号jの入力信号のマスキング曲線を表す。例えば、マスキング曲線変換部40は、量子化のスケールファクタに関するサブバンド毎に各チャネルのマスキング曲線の最小値を選択し、合成マスキング曲線を生成することができる。なお、この場合、合成マスキング曲線Gは、伝送信号の各チャネルに対して共通となる。合成マスキング曲線として、各チャネルのマスキング曲線の最小値を合成すると、量子化の粒度が最も細かくなるため、量子化精度は向上するが、量子化効率は低下する。 For example, the masking curve conversion unit 40 can select the minimum value of the masking curve for each channel as shown in Equation 1 to generate a combined masking curve. Here, G represents a combined masking curve for the transmission signal of each channel, and F j represents a masking curve for the input signal of channel number j. For example, the masking curve conversion unit 40 can select the minimum value of the masking curve of each channel for each subband related to the quantization scale factor, and generate a combined masking curve. In this case, the combined masking curve G is common to each channel of the transmission signal. When the minimum value of the masking curve of each channel is combined as the combined masking curve, the quantization granularity becomes the finest, so that the quantization accuracy is improved, but the quantization efficiency is lowered.

また、マスキング曲線変換部40は、式2のように、各チャネルのマスキング曲線の最大値を選択し、合成マスキング曲線を生成することができる。例えば、マスキング曲線変換部40は、量子化のスケールファクタに関するサブバンド毎に各チャネルのマスキング曲線の最大値を選択し、合成マスキング曲線を生成することができる。なお、この場合も、合成マスキング曲線Gは、伝送信号の各チャネルに対して共通となる。合成マスキング曲線として、各チャネルのマスキング曲線の最大値を合成すると、量子化の粒度が最も荒くなるため、量子化精度は低下するが、量子化効率は向上する。   Further, the masking curve conversion unit 40 can select the maximum value of the masking curve of each channel as shown in Equation 2 and generate a combined masking curve. For example, the masking curve conversion unit 40 can select the maximum value of the masking curve for each channel for each subband related to the quantization scale factor, and generate a combined masking curve. Also in this case, the combined masking curve G is common to each channel of the transmission signal. When the maximum value of the masking curve of each channel is combined as the combined masking curve, the quantization granularity becomes the most rough, so that the quantization accuracy is reduced, but the quantization efficiency is improved.

さらに、マスキング曲線変換部40は、式3のように、行列変換部20が用いた変換行列の変換係数に基づき各チャネルのマスキング曲線を合成することができる。式3において、Gは、チャネル番号iの伝送信号に対する合成マスキング曲線を表し、Wijは、チャネル番号iの伝送信号に対するチャネル番号jの入力信号の重み(変換係数)を表す。この場合、合成マスキング曲線Gは、伝送信号のチャネル毎に異なる曲線となる。合成マスキング曲線として、伝送信号に対する入力信号の重みを考慮してマスキング曲線を合成すると、行列変換に応じた量子化精度を維持しながら、伝送信号の各チャネルにあった量子化を行うことが可能となる。 Furthermore, the masking curve conversion unit 40 can synthesize the masking curves of the respective channels based on the conversion coefficients of the conversion matrix used by the matrix conversion unit 20 as shown in Equation 3. In Equation 3, G i represents a combined masking curve for the transmission signal of channel number i, and W ij represents the weight (conversion coefficient) of the input signal of channel number j for the transmission signal of channel number i. In this case, the combined masking curve G is a different curve for each channel of the transmission signal. As a combined masking curve, if the masking curve is synthesized considering the weight of the input signal relative to the transmission signal, it is possible to perform quantization suitable for each channel of the transmission signal while maintaining quantization accuracy according to matrix transformation It becomes.

合成マスキング曲線の生成は式(1)〜(3)に限定されず、例えば、マスキング曲線変換部40は、各チャネルのマスキング曲線の平均値などを合成マスキング曲線として生成することができる。マスキング曲線変換部40は、生成した合成マスキング曲線を符号化部50に出力する。   The generation of the combined masking curve is not limited to the formulas (1) to (3). For example, the masking curve conversion unit 40 can generate an average value of the masking curve of each channel as the combined masking curve. The masking curve conversion unit 40 outputs the generated combined masking curve to the encoding unit 50.

符号化部50は、マスキング曲線変換部40から入力された合成マスキング曲線を用いて、伝送信号のチャネル毎に伝送信号へのビット割当てを行う。即ち、符号化部50は、行列変換後の伝送信号ではなく、行列変化前の入力信号から求めた合成マスキング曲線に基づき伝送信号へのビット割当てを行うことができる。例えば、符号化部50はAAC符号化を行うものであって、合成マスキング曲線(変換後聴覚モデル)に基づくスケールファクタにより、伝送信号に対するビット割当てを行うことができる。符号化部50は、符号化した伝送信号を伝送部60に出力する。   The encoding unit 50 uses the combined masking curve input from the masking curve conversion unit 40 to assign bits to the transmission signal for each channel of the transmission signal. That is, the encoding unit 50 can perform bit allocation to the transmission signal based on the combined masking curve obtained from the input signal before the matrix change, not the transmission signal after matrix conversion. For example, the encoding unit 50 performs AAC encoding, and can perform bit allocation to a transmission signal by a scale factor based on a combined masking curve (transformed auditory model). The encoding unit 50 outputs the encoded transmission signal to the transmission unit 60.

伝送部60は、符号化部50により符号化された伝送信号を受信側に送信する。   The transmission unit 60 transmits the transmission signal encoded by the encoding unit 50 to the reception side.

このように、本実施形態によれば、マスキング曲線計算部30は、入力信号のチャネル毎に入力信号の聴覚モデル(マスキング曲線)を計算し、マスキング曲線変換部40は、各聴覚モデルから変換後聴覚モデル(合成マスキング曲線)を生成し、符号化部50は、変換後聴覚モデル(合成マスキング曲線)に基づき、伝送信号に対するビット割当てを行う。これにより、多チャネル音響方式の入力信号を行列変換した伝送信号を符号化する際に、入力信号の各チャネルの特性に合わせたビット割当てを行うことが可能となる。例えば、入力信号の各チャネルのマスキング曲線の最小値や最大値から、伝送信号の各チャネルに共通の合成マスキング曲線を生成してビット割当てを行うことにより、量子化精度や量子化効率を要求に応じて調整することが可能となる。このため、量子化精度を高めた場合などは、従来問題となった逆行列変換による信号の消失や雑音の発生を低減させることができる。特に、例えば、22.2チャネル音響信号を、主要な空間情報を表す8〜10チャネルの基本信号と、元の信号を復元するための補助信号に分離して伝送し、主要な空間情報に対しては高いビットレートを割当て、補助信号に対してはビットレートを抑制するような場合に対しても、量子化雑音の少ない符号化・伝送が可能となる。   As described above, according to the present embodiment, the masking curve calculation unit 30 calculates the auditory model (masking curve) of the input signal for each channel of the input signal, and the masking curve conversion unit 40 converts the auditory model from each auditory model. An auditory model (synthetic masking curve) is generated, and the encoding unit 50 assigns bits to the transmission signal based on the converted auditory model (synthetic masking curve). Accordingly, when encoding a transmission signal obtained by performing matrix conversion on a multi-channel acoustic input signal, it is possible to perform bit allocation in accordance with the characteristics of each channel of the input signal. For example, by generating a common masking curve for each channel of the transmission signal from the minimum and maximum values of the masking curve for each channel of the input signal and assigning bits, the quantization accuracy and quantization efficiency are required. It is possible to adjust accordingly. For this reason, when the quantization accuracy is increased, it is possible to reduce signal loss and noise generation due to inverse matrix transformation, which has been a problem in the past. In particular, for example, a 22.2 channel acoustic signal is transmitted by being separated into an 8-10 channel basic signal representing main spatial information and an auxiliary signal for restoring the original signal. Therefore, even when a high bit rate is assigned and the bit rate is suppressed for the auxiliary signal, encoding / transmission with less quantization noise is possible.

また、本実施形態によれば、マスキング曲線変換部40は、行列変換部20が用いる変換行列の変換係数に応じて、各聴覚モデル(マスキング曲線)から変換後聴覚モデル(合成マスキング曲線)を生成する。これにより、行列変換に応じた量子化精度を維持しながら、伝送信号の各チャネルにあった量子化を行うことが可能となる。   In addition, according to the present embodiment, the masking curve conversion unit 40 generates a converted auditory model (synthetic masking curve) from each auditory model (masking curve) according to the conversion coefficient of the conversion matrix used by the matrix conversion unit 20. To do. As a result, it is possible to perform quantization suitable for each channel of the transmission signal while maintaining the quantization accuracy corresponding to the matrix transformation.

また、本実施形態によれば、符号化部50は、AAC符号化を行うものであって、変換後聴覚モデル(合成マスキング曲線)に基づくスケールファクタにより、伝送信号に対するビット割当てを行う。これにより、例えば、スーパーハイビジョン用の22.2チャネル音響信号を、2チャネルステレオ信号や5.1チャネル信号として伝送する場合においても、高品質かつ1/10程度のビットレートで符号化・伝送することが可能となる。   In addition, according to the present embodiment, the encoding unit 50 performs AAC encoding, and performs bit allocation for a transmission signal by a scale factor based on a post-conversion auditory model (synthetic masking curve). Thus, for example, even when transmitting a 22.2 channel acoustic signal for Super Hi-Vision as a 2-channel stereo signal or 5.1-channel signal, it is encoded and transmitted at a high quality and a bit rate of about 1/10. It becomes possible.

本発明を諸図面や実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形や修正を行うことが容易であることに注意されたい。従って、これらの変形や修正は本発明の範囲に含まれることに留意されたい。例えば、各部材、各手段、各ステップなどに含まれる機能などは論理的に矛盾しないように再配置可能であり、複数の手段やステップなどを1つに組み合わせたり、或いは分割したりすることが可能である。   Although the present invention has been described based on the drawings and examples, it should be noted that those skilled in the art can easily make various modifications and corrections based on the present disclosure. Therefore, it should be noted that these variations and modifications are included in the scope of the present invention. For example, functions included in each member, each means, each step, etc. can be rearranged so as not to be logically contradictory, and a plurality of means, steps, etc. can be combined or divided into one. Is possible.

例えば、上記実施形態では、多チャネル音響方式の入力信号を22.2チャネル音響、行列変換後の伝送信号を2チャネルステレオ信号として説明を行ったが、本発明は、他の5.1チャネル音響、7.1チャネル音響など任意の多チャネル音響方式であって、符号化伝送に関し信号の行列変換を伴う処理全般に適応可能なことは言うまでもない。また、行列変換などの線形処理を伴う信号として、アンビソニックス等に対しても適用可能である。   For example, in the above embodiment, the input signal of the multi-channel acoustic system is described as 22.2 channel sound, and the transmission signal after matrix conversion is described as 2 channel stereo signal. However, the present invention is not limited to other 5.1 channel sound. It is needless to say that any multi-channel sound system such as 7.1-channel sound can be applied to all processes involving signal matrix transformation with respect to coded transmission. Further, the present invention can be applied to ambisonics or the like as a signal accompanied by linear processing such as matrix transformation.

また、上記実施形態では、符号化方式としてAACを例に説明をしたが、本発明におけるAAC符号化とは、MPEG2−AAC、MPEG4−AAC、HE−AACなど、AACに関するあらゆるバージョンを含むものである。また、本発明が対応可能な符号化方式はAACに限定されず、人間の聴覚特性に基づいて高品質に符号化する方式であれば、任意の符号化方式に対応可能である。   In the above embodiment, AAC is described as an example of the encoding method. However, AAC encoding in the present invention includes all versions of AAC such as MPEG2-AAC, MPEG4-AAC, HE-AAC. In addition, the encoding method that can be supported by the present invention is not limited to AAC, and any encoding method can be used as long as it encodes with high quality based on human auditory characteristics.

本発明によれば、多チャネル音響方式の入力信号を行列変換した伝送信号を符号化する際に、入力信号の各チャネルの特性に合わせたビット割当てを行うことが可能となるという有用性がある。   Advantageous Effects of Invention According to the present invention, when encoding a transmission signal obtained by performing matrix conversion on a multi-channel acoustic input signal, it is possible to perform bit allocation according to the characteristics of each channel of the input signal. .

1 多チャネル音響符号化装置
10 音響信号入力部
20 行列変換部
30 マスキング曲線計算部(計算部)
40 マスキング曲線変換部(変換部)
50 符号化部
60 伝送部
DESCRIPTION OF SYMBOLS 1 Multichannel acoustic coding apparatus 10 Acoustic signal input part 20 Matrix conversion part 30 Masking curve calculation part (calculation part)
40 Masking curve converter (converter)
50 Coding unit 60 Transmission unit

Claims (4)

多チャネル音響方式の入力信号を行列変換により複数のチャネルの伝送信号に変換する行列変換部と、
前記伝送信号のチャネル毎に、前記伝送信号に対するビット割当てを行う符号化部と、を備える多チャネル音響符号化装置であって、
前記多チャネル音響方式のチャネル毎に前記入力信号の聴覚モデルを計算する計算部と、
前記各聴覚モデルから変換後聴覚モデルを生成する変換部と、を備え、
前記符号化部は、前記変換後聴覚モデルに基づき、前記伝送信号に対するビット割当てを行う、ことを特徴とする多チャネル音響符号化装置。
A matrix converter that converts a multi-channel acoustic input signal into a transmission signal of a plurality of channels by matrix conversion;
A multi-channel acoustic encoding device comprising: an encoding unit that performs bit allocation to the transmission signal for each channel of the transmission signal;
A calculation unit for calculating an auditory model of the input signal for each channel of the multi-channel acoustic system;
A conversion unit that generates a converted auditory model from each of the auditory models,
The multi-channel acoustic encoding device, wherein the encoding unit assigns bits to the transmission signal based on the converted auditory model.
前記変換部は、前記行列変換部が用いる変換行列の変換係数に応じて、前記各聴覚モデルから前記変換後聴覚モデルを生成する、ことを特徴とする請求項1に記載の多チャネル音響符号化装置。   The multi-channel acoustic coding according to claim 1, wherein the conversion unit generates the converted auditory model from each of the auditory models according to a conversion coefficient of a conversion matrix used by the matrix converter. apparatus. 前記符号化部は、AAC符号化を行うものであって、前記変換後聴覚モデルに基づくスケールファクタにより、前記伝送信号に対するビット割当てを行う、ことを特徴とする請求項1又は2に記載の多チャネル音響符号化装置。   The multiple encoding according to claim 1, wherein the encoding unit performs AAC encoding, and performs bit allocation to the transmission signal according to a scale factor based on the converted auditory model. Channel acoustic coding device. コンピュータに、
多チャネル音響方式の入力信号を行列変換により複数のチャネルの伝送信号に変換する手順と、
前記多チャネル音響方式のチャネル毎に前記入力信号の聴覚モデルを計算する手順と、
前記各聴覚モデルから変換後聴覚モデルを生成する手順と、
前記変換後聴覚モデルに基づき、前記伝送信号に対するビット割当てを行う手順と、を実行させるためのプログラム。
On the computer,
A procedure for converting a multi-channel acoustic input signal into a transmission signal of a plurality of channels by matrix conversion,
Calculating an auditory model of the input signal for each channel of the multi-channel acoustic scheme;
Generating a converted auditory model from each of the auditory models;
A program for executing a bit allocation for the transmission signal based on the converted auditory model.
JP2011189680A 2011-08-31 2011-08-31 Multi-channel sound coding device and program thereof Pending JP2013050658A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011189680A JP2013050658A (en) 2011-08-31 2011-08-31 Multi-channel sound coding device and program thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011189680A JP2013050658A (en) 2011-08-31 2011-08-31 Multi-channel sound coding device and program thereof

Publications (1)

Publication Number Publication Date
JP2013050658A true JP2013050658A (en) 2013-03-14

Family

ID=48012707

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011189680A Pending JP2013050658A (en) 2011-08-31 2011-08-31 Multi-channel sound coding device and program thereof

Country Status (1)

Country Link
JP (1) JP2013050658A (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012141412A (en) * 2010-12-28 2012-07-26 Fujitsu Ltd Encoder, encoding method, and encoding program
JP2013050540A (en) * 2011-08-30 2013-03-14 Fujitsu Ltd Audio coding device, audio coding method, and computer program for audio coding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012141412A (en) * 2010-12-28 2012-07-26 Fujitsu Ltd Encoder, encoding method, and encoding program
JP2013050540A (en) * 2011-08-30 2013-03-14 Fujitsu Ltd Audio coding device, audio coding method, and computer program for audio coding

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN7014003450; J. Herre, et al.: 'The Reference Model Architecture for MPEG Spatial Audio Coding' Convention Paper of the 118th Convention of AES , 20050528, pp.1-13, AES *
JPN7014003451; Marek Szczerba, et al.: 'Matrixed Multi-Channel Extension for AAC Codec' Convention Paper of the 114th Convention of AES , 20030322, pp.1-9, AES *

Similar Documents

Publication Publication Date Title
KR102230727B1 (en) Apparatus and method for encoding or decoding a multichannel signal using a wideband alignment parameter and a plurality of narrowband alignment parameters
JP5292498B2 (en) Time envelope shaping for spatial audio coding using frequency domain Wiener filters
US8756066B2 (en) Methods and apparatuses for encoding and decoding object-based audio signals
KR101444102B1 (en) Method and apparatus for encoding/decoding stereo audio
RU2406166C2 (en) Coding and decoding methods and devices based on objects of oriented audio signals
TWI584271B (en) Encoding apparatus and encoding method thereof, decoding apparatus and decoding method thereof, computer program
JP2006166447A (en) Apparatus and method for processing multi-channel audio signal, compression efficiency improving method and system for processing multi-channel audio signal
JP6181854B2 (en) Multi-channel audio hybrid encoding
JP4685165B2 (en) Interchannel level difference quantization and inverse quantization method based on virtual sound source position information
JP2015528925A (en) Audio signal processing apparatus and method
JP6732739B2 (en) Audio encoders and decoders
JP5201375B2 (en) Speech signal coding using interchannel and temporal redundancy suppression.
JP6520937B2 (en) Audio signal processing apparatus and method, encoding apparatus and method, and program
JP5309944B2 (en) Audio decoding apparatus, method, and program
JP2017537342A (en) Parametric mixing of audio signals
JP2006325162A (en) Device for performing multi-channel space voice coding using binaural queue
RU2008137596A (en) AUDIO CODING AND DECODING
JP2014026007A (en) Audio decryption device, audio decryption method and audio decryption computer program
JP5345024B2 (en) Three-dimensional acoustic encoding device, three-dimensional acoustic decoding device, encoding program, and decoding program
JP2013050658A (en) Multi-channel sound coding device and program thereof
KR20110108730A (en) Method and apparatus for down mixing multi-channel audio
JP2013050663A (en) Multi-channel sound coding device and program thereof
JP6179122B2 (en) Audio encoding apparatus, audio encoding method, and audio encoding program
JP5680391B2 (en) Acoustic encoding apparatus and program
CN105336334B (en) Multi-channel sound signal coding method, decoding method and device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140109

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141023

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141202

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150331