JP2006259291A - Audio encoder - Google Patents
Audio encoder Download PDFInfo
- Publication number
- JP2006259291A JP2006259291A JP2005077253A JP2005077253A JP2006259291A JP 2006259291 A JP2006259291 A JP 2006259291A JP 2005077253 A JP2005077253 A JP 2005077253A JP 2005077253 A JP2005077253 A JP 2005077253A JP 2006259291 A JP2006259291 A JP 2006259291A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- channel
- encoding
- encoded signal
- downmix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Stereophonic System (AREA)
Abstract
Description
本発明は、マルチチャンネル信号を符号化するオーディオエンコーダに関する。特に、入力のマルチチャンネル信号をステレオ信号にダウンミックスした信号を符号化したダウンミックス部符号化信号と、それをもとのマルチチャンネル信号に戻すための信号を符号化したチャネル拡大部符号化信号とを分離してビットストリームに格納し、しかも、そのビットストリームが、MPEG規格AAC方式のステレオ符号化信号と互換性を持つようなオーディオエンコーダに関する。 The present invention relates to an audio encoder that encodes a multi-channel signal. In particular, a downmix unit encoded signal obtained by encoding a signal obtained by downmixing an input multichannel signal into a stereo signal, and a channel expansion unit encoded signal obtained by encoding a signal for returning it to the original multichannel signal. And an audio encoder in which the bit stream is compatible with the MPEG standard AAC stereo encoded signal.
現在、MPEGオーディオ規格化活動において、Spatial Codecの規格化が進められている。Spatial Codecとは、入力のマルチチャンネル信号をステレオ信号にダウンミックスした信号を符号化したダウンミックス部符号化信号と、それをもとのマルチチャンネル信号に戻すための信号を符号化したチャネル拡大部符号化信号とを分離してビットストリームに格納するような符号化方式である。 Currently, Spatial Codec is being standardized in MPEG audio standardization activities. Spatial Codec is a downmix unit encoded signal obtained by encoding a signal obtained by downmixing an input multichannel signal into a stereo signal, and a channel expansion unit encoding a signal for returning the signal to the original multichannel signal. This is an encoding method in which an encoded signal is separated and stored in a bit stream.
一方、入力の2チャンネルのステレオ信号をモノラル信号にダウンミックスした信号を符号化した符号化信号と、それをもとのステレオ信号に戻すための信号を符号化した符号化信号とを分離してビットストリームに格納するような符号化方式として、既にMPEG規格においてParametric Codingの技術が規格化されている(例えば、非特許文献1参照)。
しかしながら、従来のMPEG規格AAC方式は、入力信号が例えば5.1チャンネルの場合、前方2チャンネルと後方2チャンネルとセンターチャンネルとLFEチャンネルとにそれぞれ分離して圧縮符号化される規格であるので、前記のSpatial Codecのように、入力のマルチチャンネル信号をステレオ信号にダウンミックスした信号を符号化したダウンミックス部符号化信号と、それをもとのマルチチャンネル信号に戻すための信号を符号化したチャネル拡大部符号化信号とを分離してビットストリームに格納する方式は、従来のMPEG規格AAC方式との互換性がとれなくなるという問題が生じる。 However, the conventional MPEG standard AAC system is a standard in which, for example, when the input signal is 5.1 channel, it is compressed and encoded separately into the front 2 channel, the back 2 channel, the center channel, and the LFE channel. Like the Spatial Codec, a downmix unit encoded signal obtained by encoding a signal obtained by downmixing an input multichannel signal into a stereo signal, and a signal for returning it to the original multichannel signal are encoded. The method of separating the channel expansion portion encoded signal and storing it in the bit stream has a problem that compatibility with the conventional MPEG standard AAC method cannot be achieved.
また、MPEG規格におけるParametric Codingの技術では、MPEG規格AAC方式との互換性を取るために、MPEG規格AAC方式におけるfill elementに、モノラル信号をもとのステレオ信号に戻すための信号を符号化した符号化信号を格納することを開示しているが、Spatial Codecにおいて前記チャネル拡大部符号化信号を従来と同じ方法でfill elementに格納すると、下記のような課題が発生する。以下、そのことについて述べる。 In addition, Parametric Coding technology in the MPEG standard encodes a signal for returning a monaural signal to an original stereo signal in the fill element in the MPEG standard AAC system in order to ensure compatibility with the MPEG standard AAC system. Although storing the encoded signal is disclosed, if the channel expansion portion encoded signal is stored in the fill element in the Spatial Codec by the same method as the prior art, the following problems occur. This will be described below.
図4は、前記チャネル拡大部符号化信号をfill elementに格納した場合に予測される問題点を示す図である。図4において、横軸は圧縮符号化におけるビットレートを表し、縦軸は音質を表す。MP2と付された曲線は、MPEG2−Layer2方式におけるビットレートと音質の関係を示す。ビットレートを下げると音質が下がる傾向が示されている。図4は、横軸/縦軸とも具体的で定量的な値は示しておらず、単に傾向のみを示している。MP3と付された曲線は、MPEG2−Layer3方式におけるビットレートと音質の関係を示し、AACと付された曲線は、MPEG2−AAC方式におけるビットレートと音質の関係を示している。 FIG. 4 is a diagram illustrating a problem that is predicted when the channel expansion unit coded signal is stored in a fill element. In FIG. 4, the horizontal axis represents the bit rate in compression encoding, and the vertical axis represents the sound quality. A curve labeled MP2 indicates the relationship between the bit rate and the sound quality in the MPEG2-Layer2 system. There is a tendency that the sound quality decreases when the bit rate is lowered. FIG. 4 does not show specific and quantitative values on the horizontal axis / vertical axis, but merely shows trends. The curve attached with MP3 shows the relationship between the bit rate and the sound quality in the MPEG2-Layer3 system, and the curve attached with AAC shows the relationship between the bit rate and the sound quality in the MPEG2-AAC system.
図4に示すように、何れのビットレートにおいても、新しく開発された符号化方式は、旧式の符号化方式より音質が良い、という特長を備えていた。即ち、MP2の次に開発されたMP3は何れのビットレートにおいてもMP2より音質が優れており、MP3の次に開発されたAACは何れのビットレートにおいてもMP3より音質が優れていた。しかしながら、前記チャネル拡大部符号化信号をfill elementに格納することによってAAC方式と互換性を保持しようとしたSpatial Codecの場合、図4の破線の曲線に示すように、ビットレートが低い場合は、従来の方式より音質がよくなることが期待できるが、ビットレートを上げても、音質が従来の方式よりよくならないという課題がある。 As shown in FIG. 4, at any bit rate, the newly developed encoding method has the feature that the sound quality is better than the old encoding method. That is, MP3 developed after MP2 has better sound quality than MP2 at any bit rate, and AAC developed next to MP3 has better sound quality than MP3 at any bitrate. However, in the case of the Spatial Codec that attempts to maintain compatibility with the AAC scheme by storing the channel expansion portion encoded signal in a fill element, as shown by the dashed curve in FIG. 4, when the bit rate is low, Although it can be expected that the sound quality will be better than the conventional method, there is a problem that even if the bit rate is increased, the sound quality is not better than the conventional method.
低ビットレートにおいて、音質がよくなる理由は、MPEG4規格のParametric Coding方式によって示されたように、2チャネルの信号をモノラル信号にダウンミックスし、それをもとにステレオ信号に戻す場合、チャネル間のゲイン差情報や相関の度合いを用いることで低ビットレートで高音質が得られることが示されており、少なくともそのような技術を用いると、マルチチャネル信号をステレオ信号にダウンミックスした信号をもとのマルチチャネル信号に戻す際に、低ビットレートで高音質が得られるからである。 The reason why the sound quality is improved at a low bit rate is that when the 2-channel signal is downmixed to a monaural signal and returned to a stereo signal based on that as shown by the MPEG4 standard Parametric Coding method, It has been shown that high sound quality can be obtained at a low bit rate by using gain difference information and the degree of correlation. At least using such a technique, a multi-channel signal is based on a signal that is downmixed to a stereo signal. This is because high sound quality can be obtained at a low bit rate when the multi-channel signal is restored.
一方図5は、高ビットレートで音質がよくならない理由を説明するための図である。図5の上段は、128kbosにおけるSpatial Codecの符号化信号の構成の概略を示している。網掛けの部分が、ダウンミックス部符号化信号であり、白抜きの部分がチャンネル拡大部符号化信号である。相対的にダウンミックス部符号化信号がチャンネル拡大部符号化信号より大きい。一方、図5の下段は、320kbspにおけるSpatial Codecの符号化信号の構成の概略を示している。さてここで問題となるのは、網掛け部分のダウンミックス部符号化信号は、2チャネルの信号を符号化したものであるので、図5下段の示すほどビットレートを上げても音質の向上は飽和する。これはAACを用いる場合2チャネルの符号化信号では、128kbpsほどで音質の向上は飽和するからである。そうであれば、網掛け部分のダウンミックス部符号化信号のサイズを低く押さえて、白抜き部分のチャンネル拡大部符号化信号のサイズを上げれば音質が向上することが期待できるが、前記チャネル拡大部符号化信号をfill elementに格納しようとするとそのようにできない。なぜならば、fill elementに格納できる情報のサイズは、AAC規格の規定から269バイトに制限されるからである。それは、AAC規格においてfill elementは図7に示すシンタックスで規定されているので、最大でも269バイトとなるのであるからである(ISO/IEC 13818−7)。このようなチャネル拡大部符号化信号をfill elementに格納しようとした場合の課題を整理したものが、図6である。 On the other hand, FIG. 5 is a diagram for explaining the reason why the sound quality is not improved at a high bit rate. The upper part of FIG. 5 shows an outline of the configuration of an encoded signal of Spatial Codec at 128 kbos. The shaded portion is the downmix portion encoded signal, and the white portion is the channel expansion portion encoded signal. The downmix part encoded signal is relatively larger than the channel expansion part encoded signal. On the other hand, the lower part of FIG. 5 shows an outline of the configuration of an encoded signal of Spatial Codec at 320 kbsp. The problem here is that the downmixed portion encoded signal in the shaded portion is obtained by encoding a two-channel signal. Therefore, as shown in the lower part of FIG. Saturates. This is because when AAC is used, the improvement in sound quality is saturated at about 128 kbps in the case of a 2-channel encoded signal. If so, it can be expected that the sound quality can be improved by reducing the size of the downmixed portion encoded signal in the shaded portion and increasing the size of the channel expanded portion encoded signal in the whitened portion. This is not possible when trying to store a partial encoded signal in a fill element. This is because the size of information that can be stored in the fill element is limited to 269 bytes because of the AAC standard. This is because the fill element is defined by the syntax shown in FIG. 7 in the AAC standard, and is 269 bytes at the maximum (ISO / IEC 13818-7). FIG. 6 shows a summary of the problems when attempting to store such a channel expansion portion encoded signal in a fill element.
即ち、網掛け部分で示すダウンミックス部符号化信号は、ビットレートを上げても(サイズを大きくしても)音質は飽和して向上せず、白抜き部分で示すチャンネル拡大部符号化信号は、fill elementの制約により、ビットレートを上げられない(サイズを大きくできない)ことになる。前記のParametric Codingの場合は、チャネル数を拡大するための情報が、モノラルをステレオにするための情報だけであったのでこのようなfill elementのサイズの制約は無視出来たが、Spatial Codecの場合は、ステレオ信号を、5チャネルや7チャネルというマルチチャネルに拡大するわけであるので、fill elementのサイズの制約が、音質向上の差し障りになるという課題が生じる。 That is, even if the bit rate is increased (the size is increased), the downmix part encoded signal indicated by the shaded part does not improve because the sound quality is saturated, and the channel enlarged part encoded signal indicated by the white part is The bit rate cannot be increased (the size cannot be increased) due to the restriction of the fill element. In the case of Parametric Coding, since the information for expanding the number of channels is only information for making the monaural into stereo, such a restriction on the size of the fill element can be ignored, but in the case of Spatial Codec Since the stereo signal is expanded to multi-channels such as 5 channels and 7 channels, there is a problem that the restriction on the size of the fill element hinders improvement in sound quality.
本発明は、このような従来の問題点に鑑みてなされたものであって、前記ダウンミックス部符号化信号と、前記チャネル拡大部符号化信号とを分離してビットストリームに格納する際に、前記ダウンミックス部符号化信号がステレオ符号化信号として従来のMPEG規格AAC方式との互換性が取れるようにするためのオーディオエンコーダを提供するとともに、前記チャネル拡大部符号化信号のサイズを大きなサイズにして高音質化を図る場合でも従来のMPEG規格AAC方式との互換性が取れるようにするためのオーディオエンコーダを提供することを目的とする。 The present invention has been made in view of such a conventional problem, and when the downmix part encoded signal and the channel expansion part encoded signal are separated and stored in a bitstream, An audio encoder is provided for allowing the downmix part encoded signal to be compatible with the conventional MPEG standard AAC system as a stereo encoded signal, and the size of the channel expansion part encoded signal is increased. Therefore, it is an object of the present invention to provide an audio encoder that can be compatible with the conventional MPEG standard AAC system even when the sound quality is improved.
上記の課題を解決するため、本願の請求項1記載の発明は、Mチャネル(M>2)のマルチチャネル信号をステレオ信号にダウンミックスするダウンミックス手段と、前記ダウンミックス信号を符号化し、ダウンミックス部符号化信号を生成する第1符号化手段と、前記ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化し、チャネル拡大部符号化信号を生成する第2符号化手段と、前記チャネル拡大部符号化信号を、それぞれがNバイト以下のA(A≧1)個の部分信号に分割する分割手段と、前記ダウンミックス部符号化信号と前記A個の部分信号とを多重化する多重化手段とを備えたことを特徴とするものである。
In order to solve the above problems, the invention according to
本願の請求項2記載の発明は、請求項1記載の発明において、さらに、前記多重化手段が、前記Mの値が所定の値以上の場合、前記Aを2以上にすることを特徴とするものである。
The invention described in claim 2 of the present application is characterized in that, in the invention described in
本願の請求項3記載の発明は、請求項1或いは2記載の発明において、さらに、前記第2符号化手段が、前記入力のマルチチャネル信号の所定のチャネル間のゲイン差情報と相関の度合いとを符号化し、前記多重化手段が、前記第2符号化手段が、前記ゲイン差情報と相関の度合いとを所定の時間分解能以上の細かさで符号化する場合は、前記Aを2以上にすることを特徴とするものである。
The invention according to claim 3 of the present application is the invention according to
本願の請求項4記載の発明は、請求項1或いは2記載の発明において、さらに、前記第2符号化手段が、前記入力のマルチチャネル信号の所定のチャネル間のゲイン差情報と相関の度合いとを符号化し、前記多重化手段が、前記第2符号化手段が、前記ゲイン差情報と相関の度合いとを所定の周波数分解能以上の細かさで符号化する場合は、前記Aを2以上にすることを特徴とするものである。
The invention according to
請求項1の発明によれば、前記ダウンミックス部符号化信号と、前記チャネル拡大部符号化信号とを分離してビットストリームに格納する際に、前記ダウンミックス部符号化信号がステレオ符号化信号として従来のMPEG規格AAC方式との互換性が取れることとなる。しかも、前記チャネル拡大部符号化信号のサイズを非常に大きなサイズにして高音質化を図る場合でも従来のMPEG規格AAC方式との互換性が取れることとなる。 According to the first aspect of the present invention, when the downmix section encoded signal and the channel expansion section encoded signal are separated and stored in a bitstream, the downmix section encoded signal is a stereo encoded signal. As a result, compatibility with the conventional MPEG standard AAC system can be obtained. In addition, compatibility with the conventional MPEG standard AAC system can be achieved even when the size of the encoded signal of the channel expansion unit is made very large to improve the sound quality.
請求項2の発明によれば、入力のマルチチャネル信号のチャネル数が大きな場合でも、従来のMPEG規格AAC方式との互換性が取れることとなる。 According to the second aspect of the present invention, even when the number of channels of the input multi-channel signal is large, compatibility with the conventional MPEG standard AAC system can be achieved.
請求項3の発明によれば、時間分解能をあげることによって高音質化を図る場合でも従来のMPEG規格AAC方式との互換性が取れることとなる。 According to the third aspect of the present invention, compatibility with the conventional MPEG standard AAC system can be obtained even when the sound quality is improved by increasing the time resolution.
請求項4の発明によれば、周波数分解能をあげることによって高音質化を図る場合でも従来のMPEG規格AAC方式との互換性が取れることとなる。 According to the fourth aspect of the present invention, compatibility with the conventional MPEG standard AAC system can be obtained even when the sound quality is improved by increasing the frequency resolution.
(実施の形態1)
以下本発明の実施の形態1におけるオーディオエンコーダについて図面を参照しながら説明する。
(Embodiment 1)
The audio encoder according to
図1は本実施の形態1におけるオーディオエンコーダの構成を示す図である。
図1に示されるように、オーディオエンコーダは、Mチャネル(M>2)のマルチチャネル信号をステレオ信号にダウンミックスするダウンミックス部100と、前記ダウンミックス信号を符号化し、ダウンミックス部符号化信号を生成する第1符号化部101と、前記ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化し、チャネル拡大部符号化信号を生成する第2符号化部102と、前記チャネル拡大部符号化信号を、それぞれがNバイト以下のA(A≧1)個の部分信号に分割する分割部103と、前記ダウンミックス部符号化信号と前記A個の部分信号とを多重化する多重化部104とを備える。
FIG. 1 is a diagram showing a configuration of an audio encoder according to the first embodiment.
As shown in FIG. 1, the audio encoder includes a
以上のように構成されたオーディオエンコーダの動作について以下説明する。
まず、前記ダウンミックス部100は、本実施の形態では4チャネル(前左ch、前右ch、後左ch、後右ch)のマルチチャネル信号を入力としステレオ信号にダウンミックスする。その方法は例えば、前左ch+後左chを新たに左chとし、前右ch+後右chを新たに右chとする、というような方法が一般的であるが、たし合わせるときに前方chと後方chとに重み付ける方法などでもよい。
The operation of the audio encoder configured as described above will be described below.
First, in the present embodiment, the
次に前記第1符号化部101は、前記ダウンミックス信号を符号化し、ダウンミックス部符号化信号を生成する。本願では、前記第1符号化部101は前記ダウンミックス信号をMPEG規格AAC方式におけるステレオ信号として符号化する。
Next, the
次に前記第2符号化部102は、前記ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化し、チャネル拡大部符号化信号を生成する。その方法は、例えば、ダウンミックスする前の複数のチャネル信号間のゲイン差や相関の度合いなどを符号化し、その符号化信号をチャネル拡大部符号化信号とするという方法でよい。近年では、Lch、Rchのステレオ信号をモノラル信号にダウンミックスした信号を元のステレオ信号に戻すための情報として上記ゲイン差や相関の度合いを符号化するという技術が、MPEG4規格Parametric Coding方式として規格化されている。本願におけるチャネル拡大部符号化信号も、そのような技術を用いて生成すればよい。
Next, the
次に前記分割部103は、前記チャネル拡大部符号化信号を、それぞれがNバイト以下のA(A≧1)個の部分信号に分割する。その方法は、単に、前記チャネル拡大部符号化信号を、それぞれがNバイト以下のA(A≧1)個の部分信号に分割するようにしてもよいし、あるいは、前左chと後左chとをダウンミックスした信号を元のそれぞれの信号に戻すための符号化信号を1個目の部分信号とし、前右chと後右chとをダウンミックスした信号を元のそれぞれの信号に戻すための符号化信号を2個目の部分信号とする、というように何れのチャネルの関する符号化信号かによって分割してもよい。
Next, the
或いは、前記チャネル拡大部符号化信号のうち、ゲイン差情報を符号化した符号化信号を1個目の部分信号とし、相関の度合いを符号化した符号化信号を2個目の部分信号とするというように、符号化情報の種類によって分割してもよい。あるいは、前記第2符号化部102が、入力の周波数帯域毎にチャネル拡大部符号化信号を生成するような符号化方式の場合は、周波数の低い帯域に対する符号化信号を1個目の部分信号とし、周波数の高い帯域に対する符号化信号を2個目の部分信号とする、というように、入力信号の物理的位置によって分割してもよい。勿論その場合、周波数の位置で分けるのではなく、時間的な前後関係の位置によって分割してもよい。
Alternatively, of the channel expansion unit encoded signal, an encoded signal obtained by encoding gain difference information is used as the first partial signal, and an encoded signal obtained by encoding the degree of correlation is used as the second partial signal. In this way, division may be made according to the type of encoded information. Alternatively, in the case where the
最後に、前記多重化部104で前記ダウンミックス部符号化信号と前記A個の部分信号とを多重化する。ここで、前記多重化部104は前記ダウンミックス部符号化信号についてはMPEG規格AAC方式のステレオ符号化信号として多重化する。また、前記A個の部分信号についてはそれぞれMPEG規格AAC方式におけるfill_elementの形式でフォーマットし多重化する。
Finally, the
ここで注意しなければならないことは、前記Aが2以上の場合、前記部分信号は夫々単独では前記チャネル拡大部符号化信号を構成していないことを示す情報も多重化するということである。言い換えると、前記A個のfill_elementが前記チャネル拡大部符号化信号のどの部分を格納しているかを示す情報も多重化するということである。 It should be noted here that when A is 2 or more, each partial signal alone also multiplexes information indicating that it does not constitute the channel expansion portion encoded signal. In other words, information indicating which part of the channel expansion portion encoded signal is stored in the A fill_elements is also multiplexed.
たとえば、前記分割部103における分離の方法が、単に、前記チャネル拡大部符号化信号を、それぞれがNバイト以下のA(A≧1)個の部分信号に分割するような方法である場合、1個目のfill elementは、完結しておらず、2個目のfill elementに続き、2個目のfill elementでも完結していない場合は3個目のfill elementに続く、或いは完結している場合はこのfill elementで終了である、というような情報をも多重化する。そのような情報は夫々のfill element内に含ませてもよいし、そのような情報だけを別途fill elementとして多重化してもよい。
For example, when the dividing method in the
或いは、前記分割部103における分離の方法が、前左chと後左chとをダウンミックスした信号を元のそれぞれの信号に戻すための符号化信号を1個目の部分信号とし、前右chと後右chとをダウンミックスした信号を元のそれぞれの信号に戻すための符号化信号を2個目の部分信号とする、というような方法の場合、夫々fill elementが含んでいるチャネルの情報を示す情報をも多重化する。そのような情報は夫々のfill element内に含ませてもよいし、そのような情報だけを別途fill elementとして多重化してもよい。
Alternatively, in the separation method in the
或いは、前記分割部103における分離の方法が、前記チャネル拡大部符号化信号のうち、ゲイン差情報を符号化した符号化信号を1個目の部分信号とし、相関の度合いを符号化した符号化信号を2個目の部分信号とするというように、符号化情報の種類で分けるような場合は、夫々のfill elementが含んでいる符号化情報の種類を示す情報をも多重化する。そのような情報は夫々のfill element内に含ませてもよいし、そのような情報だけを別途fill elementとして多重化してもよい。
Alternatively, the separation method in the
或いは、前記第2符号化部102が、入力信号の周波数帯域毎にチャネル拡大部符号化信号を生成するような符号化方式の場合で、前記分割部103における分離の方法が、周波数の低い帯域に対する符号化信号を1個目の部分信号とし、周波数の高い帯域に対する符号化信号を2個目の部分信号とする、というように入力信号の物理的位置で分けるような方法である場合、夫々のfill elementが含んでいる符号化情報の内容を示す情報をも多重化する。そのような情報は夫々のfill element内に含ませてもよいし、そのような情報だけを別途fill elementとして多重化してもよい。勿論その場合、周波数の位置で分けるのではなく、時間的な前後関係の位置で分けてもよいことはいうまでもない。
Alternatively, in the case of an encoding method in which the
上記の説明においては、Aが2以上であることを述べてきたが、Aが1であってもよいことはいうまでもない。例えば、前記第2符号化部102が、入力のマルチチャネル信号をポリフェーズフィルタバンクなどを用いて複数のサブバンド信号に分解し、そのサブバンド信号をいくつかの周波数帯域毎にまとめたり、あるいはそのサブバンド信号をいくつかのタイムスロット毎にまとめたりして、そのそれぞれのまとまりごとに、ゲイン差情報や相関の度合い、等を符号化しているような場合、そのまとめ方の細かさが粗い場合は、符号化信号の量が少ないので、前記Aを2以上にする必要がない。例えば図2に示すように、周波数方向のまとめ方、時間方向のまと方ともそれ程細かくない場合は、前記Aは1でよい、即ち、fill elementは1つでよい。一方図3に示すように、周波数方向のまとめ方や時間方向のまと方が図2より細かくなった場合は、符号化信号の量は大きくなるので、前記Aを2やそれ以上にしなくてはならない場合が生じる。
In the above description, it has been described that A is 2 or more, but it is needless to say that A may be 1. For example, the
上記に説明においては、時間軸方向、周波数軸方向の両方分割してまとめているが、どちらか一方でもよいことはいうまでもない。また、図2、図3では、サブバンドの数は32としてが、勿論これは一例に過ぎず、16や64や、79など、どのような値であってもよいことはいうまでもない。 In the above description, both the time axis direction and the frequency axis direction are divided and collected, but it goes without saying that either one may be used. 2 and 3, the number of subbands is 32. Of course, this is only an example, and it is needless to say that any value such as 16, 64, or 79 may be used.
上記のように、本実施の形態によれば、Mチャネル(M>2)のマルチチャネル信号をステレオ信号にダウンミックスするダウンミックス手段と、前記ダウンミックス信号を符号化し、ダウンミックス部符号化信号を生成する第1符号化手段と、前記ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化し、チャネル拡大部符号化信号を生成する第2符号化手段と、前記チャネル拡大部符号化信号を、それぞれがNバイト以下のA(A≧1)個の部分信号に分割する分割手段と、前記ダウンミックス部符号化信号と前記A個の部分信号とを多重化する多重化手段とを備え、前記第1符号化手段は前記ダウンミックス信号をMPEG規格AAC方式におけるステレオ信号として符号化し、前記多重化手段は前記A個の部分信号を、それぞれMPEG規格AAC方式におけるfill_elementの形式でフォーマットし、該A個のfill_elementを多重化し、かつ、前記Aが2以上の場合、前記部分信号は夫々単独では前記チャネル拡大部符号化信号を構成していないことを示す情報も多重化することによって、前記ダウンミックス信号をMPEG規格AAC方式に準拠させることができ、かつ、前記チャネル拡大部符号化信号がfill elementとして格納されるので、前記チャネル拡大部符号化信号に基づいて、前記ダウンミックス信号をもとにマルチチャネル信号に戻す機能を有したSpatial Codecのデコーダでは、前記多重化手段によって生成されば符号化信号をマルチチャネル信号に復号でき、一方前記Spatial Codecのデコーダでない、旧来のAACデコーダでは、前記チャネル拡大部符号化信号はfill elementとして、無視される存在となるので、ダウンミックスされた2チャネル信号が生成できることとなる。 As described above, according to the present embodiment, downmix means for downmixing an M channel (M> 2) multichannel signal to a stereo signal, the downmix signal is encoded, and a downmix unit encoded signal is encoded. First encoding means for generating a signal, second encoding means for encoding information for returning the downmix signal to a multi-channel signal, and generating a channel expansion part encoded signal, and the channel expansion part encoded signal Is divided into A (A ≧ 1) partial signals each having N bytes or less, and multiplexing means for multiplexing the downmix part encoded signal and the A partial signals. The first encoding means encodes the downmix signal as a stereo signal in the MPEG standard AAC system, and the multiplexing means converts the A partial signals. When each is formatted in the form of fill_element in the MPEG standard AAC system, the A number of fill_elements are multiplexed, and when A is 2 or more, each of the partial signals individually constitutes the channel expansion portion encoded signal. By multiplexing information indicating that there is no signal, the downmix signal can be made to conform to the MPEG standard AAC system, and the channel expansion portion encoded signal is stored as a fill element. A Spatial Codec decoder having a function of converting the downmix signal back to a multi-channel signal based on the encoded signal can decode the encoded signal into a multi-channel signal if generated by the multiplexing means. Spatial Non decoder Odec, the traditional AAC decoder, the channel expansion unit encoded signal as fill element, since the presence is ignored, so that the 2-channel signal down-mix can be generated.
特に、前記チャネル拡大部符号化信号のサイズが非常に大きなサイズになった場合でも複数のfill elementを用いるので、従来のMPEG規格AAC方式との互換性が取れるようになる。ここで注意しなくてはならないことは、複数のfill elementに分けた場合、それぞれ単独ではチャネル拡大部符号化信号として成立しないが、それらを関係付ける情報もfill elementとして多重化しているので、Spatial Codecのデコーダでは、前記多重化手段によって生成されば符号化信号を正確に解釈でき、その結果マルチチャネル信号に復号できるのである。 In particular, even when the size of the channel expansion portion encoded signal is very large, a plurality of fill elements are used, so that compatibility with the conventional MPEG standard AAC system can be achieved. It should be noted here that when divided into a plurality of fill elements, each of them is not established as a channel expansion portion encoded signal alone, but information relating them is also multiplexed as a fill element, so Spatial The Codec decoder can accurately interpret the encoded signal if it is generated by the multiplexing means, and as a result can be decoded into a multi-channel signal.
また、本実施の形態では、マルチチャンネル信号のチャンネル数は説明の簡単化のために4としたが、4でなくてもよく、一般的に広く普及している5.1チャンネルや、7.1チャネルなどあっても良いことはいうまでもない。むしろ、入力のマルチチャネルのチャネル数が、多くなればなるほど、チャネル拡大部符号化信号のサイズが大きくなるので、Aを2以上にしなくてはならないケースがおおくなり、本願発明の趣旨に合致する状況になる。 In the present embodiment, the number of channels of the multi-channel signal is set to 4 for simplification of explanation, but it may not be 4, and 5.1 channels or 7. Needless to say, there may be one channel. Rather, the larger the number of input multi-channel channels, the larger the size of the channel expansion portion encoded signal, so there are many cases where A must be 2 or more, which is consistent with the spirit of the present invention. It becomes a situation.
本発明は、Spatial Codecの符号化信号が大きなサイズになった場合でも従来のMPEG規格AAC方式のステレオ符号化信号と互換性が取れるようにできるので、従来からAACのステレオ方式を用いて実用化されている機器、たとえば、デジタル放送受信機(所謂1Seg受信機)やポータブルオーディオ機器でもちいることによって、機器がさらに高機能化できると同時に、旧来の機器においてもそのユーザーに不便を与えないようにできる。 Since the present invention can be compatible with the conventional MPEG standard AAC stereo encoded signal even when the Spatial Codec encoded signal has a large size, it has been put into practical use by using the AAC stereo system. Devices, such as digital broadcast receivers (so-called 1Seg receivers) and portable audio devices, can further enhance the functionality of the devices, while preventing inconvenience to users of legacy devices. Can be.
100 ダウンミックス部
101 第1符号化部
102 第2符号化部
103 分割部
104 多重化部
DESCRIPTION OF
Claims (4)
前記ダウンミックス信号を符号化し、ダウンミックス部符号化信号を生成する第1符号化手段と、
前記ダウンミックス信号をマルチチャネル信号に戻すための情報を符号化し、チャネル拡大部符号化信号を生成する第2符号化手段と、
前記チャネル拡大部符号化信号を、それぞれがNバイト以下のA(A≧1)個の部分信号に分割する分割手段と、
前記ダウンミックス部符号化信号と前記A個の部分信号とを多重化する多重化手段とを備え、
前記第1符号化手段は前記ダウンミックス信号をMPEG規格AAC方式におけるステレオ信号として符号化し、前記多重化手段は前記A個の部分信号を、それぞれMPEG規格AAC方式におけるfill_elementの形式でフォーマットし、該A個のfill_elementを多重化し、かつ、前記Aが2以上の場合、前記A個のfill_elementが前記チャネル拡大部符号化信号のどの部分を格納しているかを示す情報も多重化する
ことを特徴とするオーディオエンコーダ。 Downmix means for downmixing an M channel (M> 2) multichannel signal to a stereo signal;
A first encoding means for encoding the downmix signal and generating a downmix section encoded signal;
A second encoding means for encoding information for returning the downmix signal to a multi-channel signal and generating a channel extension encoded signal;
Dividing means for dividing the channel extension portion encoded signal into A (A ≧ 1) partial signals each having N bytes or less;
A multiplexing means for multiplexing the downmix part encoded signal and the A partial signals;
The first encoding means encodes the downmix signal as a stereo signal in the MPEG standard AAC system, and the multiplexing means formats the A partial signals in the form of a fill_element in the MPEG standard AAC system, A number of fill_elements is multiplexed, and when A is 2 or more, information indicating which part of the channel expansion portion encoded signal is stored in the A fill_elements is also multiplexed. An audio encoder.
ことを特徴とする請求項1記載のオーディオエンコーダ。 The audio encoder according to claim 1, wherein the multiplexing means sets the A to 2 or more when the value of M is a predetermined value or more.
前記多重化手段は、前記第2符号化手段が、前記ゲイン差情報と相関の度合いとを所定の時間分解能以上の細かさで符号化する場合は、前記Aを2以上にする
ことを特徴とする請求項1或いは請求項2記載のオーディオエンコーダ。 The second encoding means encodes gain difference information and a degree of correlation between predetermined channels of the input multi-channel signal,
The multiplexing means sets the A to 2 or more when the second encoding means encodes the gain difference information and the degree of correlation with a fineness of a predetermined time resolution or more. The audio encoder according to claim 1 or 2.
前記多重化手段は、前記第2符号化手段が、前記ゲイン差情報と相関の度合いとを所定の周波数分解能以上の細かさで符号化する場合は、前記Aを2以上にする
ことを特徴とする請求項1或いは請求項2記載のオーディオエンコーダ。
The second encoding means encodes gain difference information and a degree of correlation between predetermined channels of the input multi-channel signal,
The multiplexing means sets the A to 2 or more when the second encoding means encodes the gain difference information and the degree of correlation at a fineness equal to or higher than a predetermined frequency resolution. The audio encoder according to claim 1 or 2.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005077253A JP2006259291A (en) | 2005-03-17 | 2005-03-17 | Audio encoder |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005077253A JP2006259291A (en) | 2005-03-17 | 2005-03-17 | Audio encoder |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006259291A true JP2006259291A (en) | 2006-09-28 |
Family
ID=37098628
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005077253A Pending JP2006259291A (en) | 2005-03-17 | 2005-03-17 | Audio encoder |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006259291A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011013381A1 (en) * | 2009-07-31 | 2011-02-03 | パナソニック株式会社 | Coding device and decoding device |
KR20120095920A (en) * | 2009-10-15 | 2012-08-29 | 프랑스 텔레콤 | Optimized low-throughput parametric coding/decoding |
-
2005
- 2005-03-17 JP JP2005077253A patent/JP2006259291A/en active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011013381A1 (en) * | 2009-07-31 | 2011-02-03 | パナソニック株式会社 | Coding device and decoding device |
CN102171754A (en) * | 2009-07-31 | 2011-08-31 | 松下电器产业株式会社 | Coding device and decoding device |
CN102171754B (en) * | 2009-07-31 | 2013-06-26 | 松下电器产业株式会社 | Coding device and decoding device |
US9105264B2 (en) | 2009-07-31 | 2015-08-11 | Panasonic Intellectual Property Management Co., Ltd. | Coding apparatus and decoding apparatus |
KR20120095920A (en) * | 2009-10-15 | 2012-08-29 | 프랑스 텔레콤 | Optimized low-throughput parametric coding/decoding |
JP2013508743A (en) * | 2009-10-15 | 2013-03-07 | フランス・テレコム | Optimized low throughput parametric encoding / decoding |
KR101646650B1 (en) * | 2009-10-15 | 2016-08-08 | 오렌지 | Optimized low-throughput parametric coding/decoding |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105580073B (en) | Audio decoder, audio encoder, method, and computer-readable storage medium | |
CA2645912C (en) | Methods and apparatuses for encoding and decoding object-based audio signals | |
CN105637582B (en) | Audio encoding device and audio decoding device | |
JP5934922B2 (en) | Decoding device | |
JP4794448B2 (en) | Audio encoder | |
KR102269858B1 (en) | Decoding audio bitstreams with enhanced spectral band replication metadata in at least one fill element | |
KR20200091880A (en) | Apparatus and method for encoding or decoding directional audio coding parameters using quantization and entropy coding | |
JP6537683B2 (en) | Audio decoder for interleaving signals | |
KR20230020553A (en) | Stereo audio encoder and decoder | |
JP2013174891A (en) | High quality multi-channel audio encoding and decoding apparatus | |
KR20070001139A (en) | An audio distribution system, an audio encoder, an audio decoder and methods of operation therefore | |
KR20060109299A (en) | Method for encoding-decoding subband spatial cues of multi-channel audio signal | |
KR100923156B1 (en) | System and Method for Encoding and Decoding for multi-channel audio | |
JP4809234B2 (en) | Audio encoding apparatus, decoding apparatus, method, and program | |
TW201040941A (en) | Embedding and extracting ancillary data | |
JP2006259291A (en) | Audio encoder | |
KR101434834B1 (en) | Method and apparatus for encoding/decoding multi channel audio signal | |
KR102191260B1 (en) | Apparatus and method for encoding/decoding of audio using multi channel audio codec and multi object audio codec | |
KR20070108314A (en) | Method and apparatus for encoding/decoding an audio signal |