JP2007183528A - Encoding apparatus, encoding method, and encoding program - Google Patents
Encoding apparatus, encoding method, and encoding program Download PDFInfo
- Publication number
- JP2007183528A JP2007183528A JP2006117345A JP2006117345A JP2007183528A JP 2007183528 A JP2007183528 A JP 2007183528A JP 2006117345 A JP2006117345 A JP 2006117345A JP 2006117345 A JP2006117345 A JP 2006117345A JP 2007183528 A JP2007183528 A JP 2007183528A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- complexity
- difference signal
- sum
- bits
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
この発明は、音声や音楽などのオーディオ信号を低ビットレートで圧縮するために、左チャネルと右チャネルとからなるステレオ信号を効率良く符号化する符号化装置、符号化方法、および符号化プログラムに関する。 The present invention relates to an encoding apparatus, an encoding method, and an encoding program for efficiently encoding a stereo signal composed of a left channel and a right channel in order to compress an audio signal such as voice or music at a low bit rate. .
従来、音声や音楽などのオーディオ信号を直交変換して得られる周波数スペクトルを符号化する方式として、ISO/IEC 13818−7 MPEG−2のオーディオ規格であるAAC(Advanced Audio Coding)方式が知られている。AAC方式は、地上波デジタルラジオ放送の音声符号化方式として採用されており、さらに、MS(ミッド・サイド)ステレオ符号化と呼ばれる技術を用いてステレオ信号の圧縮効率を高めている。 Conventionally, an AAC (Advanced Audio Coding) method, which is an audio standard of ISO / IEC 13818-7 MPEG-2, is known as a method for encoding a frequency spectrum obtained by orthogonally transforming audio signals such as voice and music. Yes. The AAC system is adopted as an audio encoding system for terrestrial digital radio broadcasting, and further, the compression efficiency of stereo signals is increased by using a technique called MS (mid side) stereo encoding.
図12は、MSステレオ符号化の符号化手順を示すブロック図である。図12に示したMSステレオ符号化装置1200は、まず左チャネルのオーディオ信号(L)をL直交変換部1201によって直交変換し、右チャネルのオーディオ信号(R)をR直交変換部1202によって直交変換する。変換後のL,Rは、MSステレオ変換部1203へ入力され、入力されたL,Rから和信号M(M=(L+R)/2)と、差信号S(S=(L−R)/2)とにそれぞれ変換される。さらに、和信号Mは、和信号量子化器1204によって符号化される(符号語1)。同様に差信号Sは、差信号量子化器1205によって符号化される(符号語2)。
FIG. 12 is a block diagram illustrating an encoding procedure of MS stereo encoding. The MS
MSステレオ符号化の際、MSステレオ変換部1203において、LとRとの相関が高い、つまり類似性が高い場合は、和信号Mに比べて差信号Sの電力が小さくなる。したがって、差信号Sの符号化ビット数を少なくして、和信号Mの符号化ビット数を多くすることで、符号化効率を向上させることができる。 At the time of MS stereo encoding, when the correlation between L and R is high in the MS stereo conversion unit 1203, that is, the similarity is high, the power of the difference signal S is smaller than that of the sum signal M. Therefore, by reducing the number of encoded bits of the difference signal S and increasing the number of encoded bits of the sum signal M, the encoding efficiency can be improved.
また、MSステレオ符号化による変換に加え、符号化効率を高める方法として、適応的に差信号Sをモノラル化する技術が開示されている(例えば、下記特許文献1参照。)。図13は、適応モノラル化の原理を示す説明図である。図13に示した図表1300を用いて適応モノラル化を説明する。図表1310,1320は、あるオーディオ信号のLとRとの波形を示す図表である。また、図表1330,1340は、LとRを用いて生成した和信号Mと、差信号Sの波形を示す図表である。Lの波形1311と、Rの波形1321とは、それぞれ和信号Mの波形1331と、差信号Sの波形1341とに変換される。
In addition to conversion by MS stereo encoding, a technique for adaptively monauralizing the difference signal S is disclosed as a method for improving encoding efficiency (see, for example,
ここで、L,Rから和信号M、差信号Sへの変換に際して周波数fの信号に着目する。モノラル化では、LとRとの類似度を求め、LとRとの類似度が高い場合は、差信号Sを無音化もしくは小さい振幅を持った信号に変形する。LとRとの類似度が高い場合は差信号S=(L−R)/2≒0となるので差信号Sのビット数を減らして0とする。つまり、差信号Sを示す波形1341では、周波数fの信号が0となり、その分のビットを和信号Mを示す波形1331の周波数fの信号に割り当てている。したがって、和信号Mのビット数が増加し、量子化に伴うオーディオ信号の歪みを小さくすることができる。
Here, attention is focused on a signal of frequency f when converting from L and R into a sum signal M and a difference signal S. In monauralization, the similarity between L and R is obtained. If the similarity between L and R is high, the difference signal S is silenced or transformed into a signal having a small amplitude. When the similarity between L and R is high, the difference signal S = (LR) / 2≈0, so the number of bits of the difference signal S is reduced to zero. That is, in the
しかしながら、地上波デジタルラジオ放送では、CD並みの高品質音声(音楽)と映像を合計330kbps程度で実現するため、音声に割り当てられるビットレートは32kbps〜64kbpsと非常に小さい。したがって、従来のMSステレオ符号化技術では量子化ビット数の不足による音質劣化が避けられないという問題があった。 However, in terrestrial digital radio broadcasting, high-quality audio (music) and video equivalent to CD are realized at a total of about 330 kbps, and therefore the bit rate assigned to audio is as very low as 32 kbps to 64 kbps. Therefore, the conventional MS stereo encoding technique has a problem that sound quality deterioration due to an insufficient number of quantization bits cannot be avoided.
また、上記の特許文献1に記載の適応モノラル化を用いた場合であっても、差信号Sが0の帯域、つまり、モノラル化された帯域においては差信号Sの量子化ビット数を減らすことができるが、モノラル化できない帯域では差信号Sの量子化ビット数を減らすことができないため、低ビットレート条件では十分な音質が得られないという問題があった。
Even when the adaptive monauralization described in
この発明は、上述した従来技術による問題点を解消するため、低ビットレート条件でも音質劣化の少ない符号化を実現する符号化装置、符号化方法、および符号化プログラムを提供することを目的とする。 An object of the present invention is to provide an encoding device, an encoding method, and an encoding program that can realize encoding with little deterioration in sound quality even under a low bit rate condition in order to eliminate the above-described problems caused by the prior art. .
上述した課題を解決し、目的を達成するため、この発明にかかる符号化装置は、ステレオ信号の左成分信号と右成分信号との和信号と、差信号とを用いてステレオ信号を圧縮する符号化装置において、前記和信号の複雑度と、前記差信号の複雑度とをそれぞれ求める複雑度算出手段と、前記複雑度算出手段によって求めた複雑度に応じて前記和信号と、前記差信号とをそれぞれ量子化する際のビット数の分配割合を設定するビット数設定手段と、前記ビット数設定手段によって決定された前記分配割合に応じて前記和信号と、前記差信号をそれぞれ量子化する量子化手段と、を備えることを特徴とする。 In order to solve the above-described problems and achieve the object, an encoding apparatus according to the present invention is a code that compresses a stereo signal using a sum signal of a left component signal and a right component signal of a stereo signal and a difference signal. In the encoding apparatus, complexity calculation means for obtaining the complexity of the sum signal and the complexity of the difference signal, respectively, the sum signal according to the complexity obtained by the complexity calculation means, and the difference signal A bit number setting means for setting a distribution ratio of the number of bits when each of the signals is quantized, and a quantizer for respectively quantizing the sum signal and the difference signal according to the distribution ratio determined by the bit number setting means And a converting means.
この発明によれば、類似度に基づいて差信号をモノラル化することにより量子化ビットを削減することができる。また、和信号Mと修正差信号S’の複雑度に応じて量子化ビット数を適応的に配分することができるため、従来技術に比べて効率のよい符号化を図ることができる。 According to the present invention, it is possible to reduce the number of quantization bits by making the difference signal monaural based on the similarity. In addition, since the number of quantization bits can be adaptively allocated according to the complexity of the sum signal M and the modified difference signal S ′, more efficient encoding can be achieved compared to the prior art.
本発明にかかる符号化装置、符号化方法、および符号化プログラムによれば、低ビットレート条件であっても音質劣化の少ない、高音質な音声(音楽)として再生することができるという効果を奏する。 According to the encoding device, encoding method, and encoding program of the present invention, it is possible to reproduce high-quality sound (music) with little deterioration in sound quality even under low bit rate conditions. .
以下に添付図面を参照して、この発明にかかる符号化装置、符号化方法、および符号化プログラムの好適な実施の形態を詳細に説明する。 Exemplary embodiments of an encoding device, an encoding method, and an encoding program according to the present invention will be explained below in detail with reference to the accompanying drawings.
(符号化の原理)
まず、図1〜図3を用いて本発明にかかる符号化方法の原理を説明する。図1は、通常のモノラル化を示す説明図である。図1に示した図表100は、差信号Sの電力を示す図表110と、和信号Mのビット数を示す図表120と、和信号Mの複雑度を示す図表130とを表している。
(Principle of encoding)
First, the principle of the encoding method according to the present invention will be described with reference to FIGS. FIG. 1 is an explanatory diagram showing normal monauralization. A
図表100に示した周波数f1の信号に注目して通常のモノラル化の手順を説明する。図表110は、横軸が周波数を表し、縦軸が電力を表すことで、差信号Sの周波数ごとの電力を表している。周波数f1の差信号Sは、モノラル化によって電力が0に変換される。この変換によって差信号Sは、ビット数が削減される(図表110の例では−50bit)。
A normal monaural procedure will be described by paying attention to the signal of frequency f1 shown in
図表120は、横軸が周波数を表し、縦軸が量子化した際のビット数を表すことで、和信号Mの周波数ごとの量子化ビット数を表している。図表120においては、図表110に示したモノラル化によって削減された差信号Sのビット(−50bit)が、周波数f1の元のビット数121に新たにビット数122(+50bit)として上乗せされる。
In the
図表130は、横軸が周波数を表し、縦軸が複雑度を表すことで、和信号Mの周波数ごとの複雑度を表している。図表130に示した例では、周波数f1の和信号Mの複雑度131と、周波数f2の和信号Mの複雑度132が高いことがわかる。周波数f1の和信号Mは、図表120で説明したように、周波数f1の差信号Sの削減部分のビット数122が上乗せされている。したがって、周波数f1の和信号Mは、量子化誤差を小さくすることができ、音質の向上が期待できる。
In the
しかしながら、通常のモノラル化の場合、ビット数が上乗せされるのは差信号Sのビット数が削減された周波数の信号に限られている。周波数f1と同様に複雑度が高い周波数f2の和信号Mのビット数123には、新たなビット数の上乗せ(例えば、破線で示したビット数124)は、行われない。したがって、周波数f2の和信号Mは、量子化誤差を小さくできず、音質を向上させることができない。
However, in the case of normal monauralization, the number of bits is added only to a signal having a frequency in which the number of bits of the difference signal S is reduced. Similar to the frequency f1, the number of
本発明では、差信号Sのモノラル化によって削減されたビット数を、周波数に関係なく、同じフレーム内の各信号の複雑度に応じて振り分ける。具体的な振り分け方法としては、和信号Mの複雑度に応じてビット数を振り分ける方法と、差信号Sの複雑度に応じてビット数を振り分ける方法とを用いる。以下、図2,3を用いてそれぞれの振り分け方法について説明する。 In the present invention, the number of bits reduced by making the difference signal S monaural is distributed according to the complexity of each signal in the same frame regardless of the frequency. As a specific distribution method, a method of distributing the number of bits according to the complexity of the sum signal M and a method of distributing the number of bits according to the complexity of the difference signal S are used. Hereinafter, each distribution method will be described with reference to FIGS.
まず、図2は、和信号Mの複雑度に応じてビット数を振り分ける方法を示す説明図である。ここでは、和信号Mの複雑度を調べ、差信号Sで削減したビットを、和信号Mを表すビットのうち、複雑な周波数のビットに振り分ける方法について説明する。図2に示した図表200は、差信号Sの電力を示す図表210と、和信号Mのビット数を示す図表220と、和信号Mの複雑度を示す図表230とを表している。
First, FIG. 2 is an explanatory diagram showing a method of distributing the number of bits according to the complexity of the sum signal M. Here, a method of examining the complexity of the sum signal M and allocating the bits reduced by the difference signal S to bits of a complex frequency among the bits representing the sum signal M will be described. The
図表210は、横軸が周波数を表し、縦軸が電力を表すことで、差信号Sの周波数ごとの電力を表している。ここで、周波数f1の差信号Sは、モノラル化によって電力が0に変換される。この変換によって差信号Sは、ビット数が削減される(図表210の例では−50bit)。
In the
図表220は、横軸が周波数を表し、縦軸が量子化した際のビット数を表すことで、和信号Mの周波数ごとの量子化ビット数を表している。図表210に示したように周波数f1の差信号Sから削減されたビット数(−50bit)を、周波数f1の和信号Mの元のビット数221と、周波数f2の和信号Mの元のビット数224とにそれぞれ振り分け、上乗せする。図表220の例では、周波数f1の和信号Mには、+20bitのビット数222が上乗せされて、周波数f2の和信号Mには、+30bitのビット数223が上乗せされている。
In the
図表230は、横軸が周波数を表し、縦軸が複雑度を表すことで、和信号Mの周波数ごとの複雑度を表している。図表220に示したような和信号Mへのビット数の上乗せは、図表230に示した和信号Mの周波数ごとの複雑度に応じて決定する。したがって、周波数f1の和信号Mの複雑度231と、周波数f2の和信号Mの複雑度232とを、図表220によって振り分けられたビット数222,223に対応させている。
In the
一方、図3は、差信号Sの複雑度に応じてビット数を振り分ける方法を示す説明図である。ここでは、差信号Sの複雑度を調べ、差信号Sで削減したビットを、差信号Sを表すビットのうち、複雑な周波数のビットに振り分ける方法について説明する。図3に示した図表300は、差信号Sの電力を示す図表310と、差信号Sのビット数を示す図表320と、差信号Sの複雑度を示す図表330とを表している。
On the other hand, FIG. 3 is an explanatory diagram showing a method of distributing the number of bits according to the complexity of the difference signal S. Here, a method of examining the complexity of the difference signal S and allocating the bits reduced by the difference signal S to bits having a complex frequency among the bits representing the difference signal S will be described. The
図表310は、横軸が周波数を表し、縦軸が電力を表すことで、差信号Sの周波数ごとの電力を表している。ここで、周波数f1の差信号Sは、モノラル化によって電力が0に変換される。この変換によって差信号Sは、ビット数が削減される(図表310の例では−50bit)。
In the
図表320は、横軸が周波数を表し、縦軸が量子化した際のビット数を表すことで、差信号Sの周波数ごとの量子化ビット数を表している。図表310に示したように周波数f1の差信号Sから削減されたビット数(−50bit)321を、周波数f0の差信号Sの元のビット数322と、周波数f2の差信号Sの元のビット数324とにそれぞれ振り分け、上乗せする。差信号Sにビットを上乗せする場合は、図表310に示したように周波数f1の差信号Sは、0に変換されているため、ビット数321を必要としない。したがって、差信号Sの複雑度に応じて、周波数f0と周波数f2のそれぞれの差信号Sは、ビット数(図3の例ではビット数323,325)の上乗せによりビット数が増加し、量子化誤差が減少する。
In the
図表330は、横軸が周波数を表し、縦軸が複雑度を表すことで、差信号Sの周波数ごとの複雑度を表している。図表330に示したように、周波数f0の差信号Sの複雑度332と、周波数f2の差信号Sの複雑度333とが高いため、図表320に示したようなビット数の割り当てに反映されている。なお、周波数f1の差信号Sは、ビット数が0であるにも拘わらず複雑度331を示しているが、これは、モノラル化され0に変換される前の周波数f1の差信号Sの複雑度を示しているためである。
In the
以上、図1〜図3を用いて説明したように、本発明では、モノラル化によって削減された差信号Sのビット数を複雑度に応じて和信号Mもしくは差信号Sの複雑度の高い信号に振り分ける。ビット数の振り分けの際には、和信号Mと差信号Sとを含む全体の複雑度を求め、重要な信号を抽出する。具体的には、差信号Sよりも和信号Mの複雑度が大きい際には、和信号Mに多くのビット数を割り振る。反対に、和信号Mよりも差信号Sの複雑度が大きい場合は、差信号Sに多くのビット数を割り振る。以下に説明する符号化装置は、説明した原理に基づいて符号化を実現する。 As described above with reference to FIGS. 1 to 3, in the present invention, the number of bits of the difference signal S reduced by monauralization is changed to a sum signal M or a signal having a high complexity of the difference signal S according to the complexity. Sort out. When distributing the number of bits, the overall complexity including the sum signal M and the difference signal S is obtained, and important signals are extracted. Specifically, when the complexity of the sum signal M is larger than the difference signal S, a larger number of bits is assigned to the sum signal M. Conversely, when the complexity of the difference signal S is larger than the sum signal M, a larger number of bits is assigned to the difference signal S. The encoding apparatus described below realizes encoding based on the described principle.
(符号化装置の基本構成)
つぎに、本発明にかかる符号化装置の基本構成を説明する。図4は、本発明にかかる符号化装置の基本構成を示すブロック図である。符号化装置400は、上述した符号化の原理に基づいて符号化を行う。符号化装置400は、L直交変換部401と、R直交変換部402と、MSステレオ変換部403と、比較手段としての類似度計算部404と、修正手段としての差信号修正部405と、複雑度算出手段としての複雑度計算部406と、ビット数設定手段としてのビット割り当て決定部407と、量子化手段としての和信号量子化器408、および差信号量子化器409とから構成される。
(Basic configuration of encoding device)
Next, the basic configuration of the encoding apparatus according to the present invention will be described. FIG. 4 is a block diagram showing the basic configuration of the encoding apparatus according to the present invention. The
L直交変換部401は、時間領域の入力信号(左チャネルのステレオ信号L(t))を直交変換し、スペクトル信号L(f)を出力する。直交変換とは時間領域tの空間座標から、周波数座標fへ変換する処理である。同様に、R直交変換部402は、時間領域の入力信号(右チャネルのステレオ信号R(t))を直交変換し、スペクトル信号R(f)を出力する。
The L
MSステレオ変換部403は、L直交変換部401から入力されたスペクトル信号L(f)と、R直交変換部402から入力されたスペクトル信号R(f)とをMSステレオ変換し、周波数に応じた値を示すスペクトル信号による和信号M(f)と差信号S(f)として出力する。
The MS
類似度計算部404は、L直交変換部401から入力されたスペクトル信号L(f)と、R直交変換部402から入力されたスペクトル信号R(f)との類似度を求める。類似度とはスペクトル信号L(f)とスペクトル信号R(f)との相関を数値的に算出した値である。類似度計算の具体的な内容に関しては、実施の形態の記述の際に詳しく説明する。類似度計算部404によって計算された類似度は、差信号修正部405に入力される。
The
差信号修正部405は、MSステレオ変換部403から入力された差信号S(f)に、類似度計算部404から入力された類似度に基づいて修正を施し、修正差信号S’(f)を作成する。差信号修正部405によって行われる処理は、モノラル化に相当する。具体的な処理内容としては、周波数帯ごとの差信号Sの類似度があらかじめ定めた閾値よりも高いか否かの判断を行う。閾値よりも類似度が高い差信号Sは、すなわち差が≒0となり、モノラル化により修正差信号S’(f)=0として作成される。また、閾値より類似度が低い差信号は、差が大きいため、そのまま、修正差信号S’(f)=S(f)として作成される。
The difference
複雑度計算部406は、MSステレオ変換部403から入力された和信号M(f)を用いて和信号M(f)の複雑度PE_m_aveを求め、差信号修正部405から入力された修正差信号S’(f)を用いて修正差信号S’(f)の複雑度PE_s_aveを求める。さらに、求めた複雑度PEの比を求めビット割り当て決定部407へ出力する。
The
ビット割り当て決定部407は、複雑度計算部406から入力された複雑度PEの比の値に応じてビット数の分配の割合を決定し、和信号量子化器408と、差信号量子化器409とにそれぞれビット割り当て情報を出力する。割り当ての際には、複雑度PEの比と閾値との比較に基づいて行う。
The bit
和信号量子化器408は、MSステレオ変換部403から入力された和信号M(f)を、ビット割り当て決定部407から入力されたビット割り当て情報に基づいて、量子化する。量子化後の和信号M(f)は、符号語1として出力される。同様に、差信号量子化器409は、差信号修正部405から入力された修正差信号S’(f)を、ビット割り当て決定部407から入力されたビット割り当て情報に基づいて、量子化する。量子化後の差信号S(f)は、符号語2として出力される。
The
本発明にかかる符号化装置400は、以上説明したような基本構成を用いてステレオ信号の符号化を行う。つぎに、各機能部の具体的な構成例とその処理内容について詳しく説明する。ここでは、符号化装置の構成例を実施の形態1〜実施の形態3として説明する。
The
(実施の形態1)
実施の形態1では、図4に示した複雑度計算部406に対応する複雑度計算部510(図5−1参照)において、和信号Mと修正差信号S’とのそれぞれの心理視聴エントロピー(PE値)を求め、PE値の比を複雑度として出力する。また、ビット割り当て決定部407では、あらかじめ定めておいた複雑度と修正差信号S’との対応関係に応じてビット数の分配割合を決定する。
(Embodiment 1)
In the first embodiment, in the complexity calculation unit 510 (see FIG. 5A) corresponding to the
図5−1は、実施の形態1にかかる符号化装置の構成を示すブロック図である。図5−1に示した符号化装置500は、図4に示した基本構成の具体的な実施例を示す。以下、図4に示した符号化装置400の類似度計算部404、差信号修正部405、複雑度計算部406、ビット割り当て決定部407、和信号量子化器408および差信号量子化器409の具体的な処理について説明する。
FIG. 5A is a block diagram of the configuration of the encoding apparatus according to the first embodiment. A
図5−2は、実施の形態1にかかる符号化装置の符号化処理の手順を示すフローチャートである。図5−2のフローチャートにおいて、まず、MDCT501およびMDCT502において、左右のステレオ信号L(t),R(t)のMDCT変換を行う(ステップS521)。実施の形態1〜実施の形態3ではL直交変換部401およびR直交変換部402の処理を実現するために、MDCT(Modified Discrete Cosine Transform;変形離散コサイン変換)を用いる。MDCTは、通常のDCT演算では成分抽出時にブロック境界部分でブロック歪みが発生するため、ブロック区間長の50%を隣接ブロックとオーバーラップすることによりブロック歪みを除去する変換処理である。
FIG. 5-2 is a flowchart of an encoding process performed by the encoding apparatus according to the first embodiment. In the flowchart of FIG. 5-2, first, MDCT conversion of the left and right stereo signals L (t) and R (t) is performed in the
続いて、MSステレオ変換部403によって、左右のスペクトル信号L(f),R(f)にMSステレオ変換を行う(ステップS522)。また、類似度計算部404においては、スペクトル信号L(f)とスペクトル信号R(f)との類似度を計算する(ステップS523)。ここで、類似度計算部404における類似度計算について詳しく説明する。類似度は、スペクトル信号L(f)とスペクトル信号R(f)との相関を用いる。
Subsequently, the MS
図6は、信号の帯域の上限と下限の関係を示す図表である。図表600は、横軸が周波数fを表し、縦軸がステレオ信号Lの電力を表す。各信号は、複数の周波数帯域(例えば、周波数帯601〜603で示した帯域i−1,i,i+1)によって構成されているため、周波数帯域ごとに下記(1)式を用いて相関cor(i)を求める。したがって、類似度計算部404から相関cor(i)が差信号修正部405へ入力される。
FIG. 6 is a chart showing the relationship between the upper limit and the lower limit of the signal band. In the
その後、相関cor(i)に基づいて、差信号修正部405によって、MSステレオ変換部403から入力された差信号S(f)の修正を行う(ステップS524)。差信号修正部405は、差信号S(f)の帯域ごとに相関cor(i)と閾値との比較を行う。具体的には、相関cor(i)が閾値以上の場合は、帯域i(図6参照)に含まれる全周波数fについて修正差信号S’(f)=0とする。また、相関cor(i)が閾値以下の場合は、帯域i(図6参照)に含まれる全周波数fについて修正差信号S’(f)=S(f)とする。
Thereafter, based on the correlation cor (i), the difference
つぎに、複雑度計算部510によって行われる複雑度計算の詳細な処理について説明する。複雑度計算部510は、許容誤差計算部503と、電力計算部504と、PE値計算部505と、PE比計算部506とから構成される。複雑度計算部510では、まず、許容誤差計算部503によって、許容誤差計算を行う(ステップS525)。
Next, detailed processing of complexity calculation performed by the
許容誤差計算部503は、MSステレオ変換部403から和信号M(f)が入力され、差信号修正部405から修正差信号S’(f)が入力され、帯域iにおける和信号M(f)の許容誤差電力n_m(i)と、修正差信号S’(f)の許容誤差電力n_s(i)を求める。このステップにおける許容誤差電力の算出としては、例えば、公知の技術である心理視聴モデルにおける許容誤差電力の計算(ISO/IEC 13818−7:2003,Advanced Auduo Coding)を用いることができる。
The allowable
続いて、電力計算部504によって電力計算を行う(ステップS526)。電力計算部504は、MSステレオ変換部403から入力された和信号M(f)の帯域iにおける電力e_m(i)と、差信号修正部405から入力された修正差信号S’(f)の帯域iにおける電力e_s(i)を下記の(2),(3)式から求める。
Subsequently, power calculation is performed by the power calculation unit 504 (step S526). The
続いて、PE値計算部505によって複雑度PE値計算を行う(ステップS527)。PE値計算部505には、許容誤差計算部503から和信号Mの許容誤差電力n_m(P1)と、修正差信号S’の許容誤差電力n_s(P2)が入力され、電力計算部504から、和信号Mの電力e_m(P3)と、修正差信号S’の電力e_s(P4)とが入力される。PE値計算部505は、下記(4)式を用いて、和信号Mの許容誤差電力n_mと、和信号Mの電力e_mとから和信号Mの複雑度PE_mを求める。同様に、下記(5)式を用いて修正差信号S’の許容誤差電力n_sと、修正差信号S’の電力e_sとから修正差信号S’の複雑度PE_sを求める。なお、下記(4),(5)式のシグマに用いているnは帯域の個数を表している。
Subsequently, the PE
つぎに、PE比計算部506によって、PE比計算を行う(ステップS528)。PE比計算部506には、PE値計算部505から和信号Mの複雑度PE_mと、修正差信号S’の複雑度PE_sが入力される。そして、PE比計算部506は、和信号Mの複雑度PE_mに対する修正差信号S’の複雑度PE_sの割合を下記(6)式によって求め、複雑度の比(PE比)をpe_ratioとしてビット割り当て決定部407へ出力する。ここまでのステップにより、複雑度計算部510の処理が終了する。なお、複雑度計算部510は、上述したようなPE比の計算に替わって、PE差を求め、ビット割り当て決定部407に出力してもよい。さらに、PE比、またはPE差を求める際には、各信号の全周波数帯域のPE値の合計や平均を用いてもよい。
Next, the PE
pe_ratio=PE_s/PE_m …(6) pe_ratio = PE_s / PE_m (6)
続いて、ビット割り当て決定部407における処理について説明する。まず、修正差信号S’(f)の総ビット数を決定し(ステップS529)、続いて、和信号M(f)の総ビット数を決定する(ステップS530)。修正差信号S’(f)の総ビット数を決定する具体的な手順としては、複雑度比pe_ratioと修正差信号S’(f)のビット配分量との関係をあらかじめ定めておく手順がある。
Next, processing in the bit
図7は、PE比とビット分配の関係を示す図表である。図表700は、横軸が複雑度比pe_ratioを表し、縦軸が修正差信号S’のビット配分量を表す。また、曲線701は、複雑度比pe_ratioとビット配分の関係を示している。ビット割り当て決定部407は、図表700のような、複雑度比pe_ratioとビット配分の関係をあらかじめ定めておく。具体的には、複雑度比pe_ratioの値が大きいときには、修正差信号S’のビット数分配を多くし、複雑度比pe_ratioの値が小さいときには、修正差信号S’のビット数分配を少なくする。つまり、修正差信号S’の複雑度の大きい帯域に多くのビット数を分配するような曲線701を設定しておく。
FIG. 7 is a chart showing the relationship between PE ratio and bit distribution. In the
和信号Mのビット数は、ステップS529によって決定された修正差信号S’(f)のビット数の分配に基づいて決定される。具体的には、1フレーム当たりの量子化ビット数をbit_totalとすると、図7の曲線701によって修正差信号S’のビット数bit_sを求めbit_totalから修正差信号S’のビット数bit_sを引き、和信号Mのビット数bit_mを求める(bit_m=bit_total−bit_s)。
The number of bits of the sum signal M is determined based on the distribution of the number of bits of the modified difference signal S ′ (f) determined in step S529. Specifically, assuming that the number of quantization bits per frame is bit_total, the number of bits bit_s of the modified difference signal S ′ is obtained from the
以上のようにして求めたビット数に応じて、和信号量子化器408ではビット数bit_mで和信号M(f)の量子化を行い(ステップS531)、差信号量子化器409ではビット数bit_sで修正差信号S’(f)の量子化を行い(ステップS532)、一連の処理を終了する。
In accordance with the number of bits obtained as described above, the
(実施の形態2)
実施の形態2は、複雑度計算部810における複雑度の計算の際に実施の形態1と異なる方法を用いる。また、ビット割り当て決定部407におけるビット割り当ての際には、PE値の重み係数に応じてビット数の分配を行う。
(Embodiment 2)
In the second embodiment, a method different from that in the first embodiment is used when the
図8−1は、実施の形態2にかかる符号化装置の構成を示すブロック図である。実施の形態2にかかる符号化装置800は、実施の形態1の符号化装置500と同じ構成によって符号化を行うが、複雑度計算部810の処理内容が異なり、それに伴いビット割り当て決定部407におけるビット割り当て方法にも変化が生じる。したがって、符号化装置800の特徴となる、PE値計算部505と、PE比計算部506と、ビット割り当て決定部407とについて詳しく説明する。また、他の構成は、符号化装置500と同じであるため、同一の符号を付して説明を省略する。
FIG. 8A is a block diagram of the configuration of the encoding apparatus according to the second embodiment. The
図8−2は、実施の形態2にかかる符号化装置の符号化処理の手順を示すフローチャートである。図8−2のフローチャートにおいて、ステップS821〜ステップS824は、図5−2に示したフローチャートのステップS521〜ステップS524と同様の処理を行う。つぎに、複雑度計算部810における処理を説明する。
FIG. 8-2 is a flowchart of an encoding process performed by the encoding apparatus according to the second embodiment. In the flowchart of FIG. 8B, steps S821 to S824 perform the same processes as steps S521 to S524 of the flowchart shown in FIG. Next, processing in the
許容量誤差計算部503における許容量誤差計算(ステップS825)と、電力計算部504における電力計算(ステップS826)は、図5−2に示したフローチャートのステップS525、ステップS526と同様の処理を行う。つぎに、PE値計算部505によってPE値計算を行う(ステップS827)。ここで、PE値計算部505には、許容誤差計算部503から和信号Mの許容誤差電力n_mと、修正差信号S’の許容誤差電力n_sが入力され、電力計算部504から、和信号Mの電力e_mと、修正差信号S’の電力e_sとが入力される。
The tolerance error calculation (step S825) in the tolerance
そして、実施の形態2のPE値計算部505は、下記(7)式を用いて、和信号Mの許容誤差電力n_mと、和信号Mの電力e_mとから和信号Mの複雑度PE_m(i)を求める。同様に、実施の形態2のPE値計算部505は、下記(8)式を用いて修正差信号S’の許容誤差電力n_sと、修正差信号S’の電力e_sとから修正差信号S’の複雑度PE_s(i)を求める。
Then, the PE
つぎに、PE比計算部506によって、PE比計算を行う(ステップS828)。PE比計算部506には、PE値計算部505から和信号Mの複雑度PE_m(i)と、修正差信号S’の複雑度PE_s(i)が入力される。そして、PE比計算部506は、和信号Mの複雑度PE_mに対する修正差信号S’の複雑度PE_sの割合を下記(9)式によって求め、複雑度の比(PE比)をpe_ratioとしてビット割り当て決定部407へ出力する。さらに、PE値計算部505によって求められた和信号Mの複雑度PE_m(i)をビット割り当て決定部407へ出力する。ここまでのステップにより、複雑度計算部810の処理が終了する。
Next, the PE
続いて、ビット割り当て決定部407における処理について説明する。まず、修正差信号S’(f)の総ビット数を決定し(ステップS829)、続いて、和信号M(f)の総ビット数を決定する(ステップS830)。修正差信号S’(f)の総ビット数を決定する具体的な手順としては、実施の形態1と同様に、まず、複雑度PE_ratioに応じて、修正差信号S’(f)の量子化ビット数bit_sをあらかじめ定めておく。つぎに、1フレームで使用できる量子化ビット数bit_totalからbit_sを引いた残りを和信号Mの量子化ビット数bit_mとする。ここで、和信号Mの各周波数帯域に分配するビット数の上限を決定しておく。
Next, processing in the bit
続いて、重み係数w_m(i)を決定する(ステップS831)。図9は、複雑度PE_mと重み係数w_mの関係を示す図表である。図表900は、横軸が複雑度PE_m(i)を表し、縦軸が重み係数w_m(i)を表す。また、曲線901は、複雑度PE_mと重み係数w_mの関係を示している。和信号Mの各周波数帯域に分配するビット数の上限を決定するには、曲線901のような関係をあらかじめ定めておく。各周波数帯域iについて複雑度PE_m(i)の値と図表900の関係から重み係数w_m(i)を決定する。
Subsequently, a weight coefficient w_m (i) is determined (step S831). FIG. 9 is a chart showing the relationship between the complexity PE_m and the weighting factor w_m. In the
つぎに、重み係数の総和sum_wの算出を行う(ステップS832)重み係数w_m(i)の総和sum_wは、下記(10)式を用いて求める。さらに、重み係数の修正を行うために、下記(11)式を用いて重み係数w_m(i)を正規化(w_m2(i))する。なお、総和で正規化するため、w_m2の総和は1になる。 Next, the summation sum_w of the weighting coefficients is calculated (step S832). The summation sum_w of the weighting coefficient w_m (i) is obtained using the following equation (10). Further, in order to correct the weighting factor, the weighting factor w_m (i) is normalized (w_m2 (i)) using the following equation (11). Since the sum is normalized by the sum, the sum of w_m2 is 1.
その後、和信号Mの各周波数帯域に分配するビット数の上限bit_m(i)を、下記(12)式を用いて決定し、ビット割り当て決定部407の処理を終了する。
Thereafter, the upper limit bit_m (i) of the number of bits distributed to each frequency band of the sum signal M is determined using the following equation (12), and the processing of the bit
以上のようにして求めたビット数に応じて、和信号量子化器408ではビット数bit_mで和信号M(f)の量子化を行い(ステップS834)、差信号量子化器409ではビット数bit_sで修正差信号S’(f)の量子化を行い(ステップS835)、一連の処理を終了する。
In accordance with the number of bits obtained as described above, the
(実施の形態3)
実施の形態3は、和信号M(f)と、修正差信号S’(f)との電力の比に基づいて和信号M(f)と、修正差信号S’(f)とのビット数の分配の割合を決定する。したがって、実施の形態3にかかる符号化装置1000は、実施の形態1において説明した符号化装置500の複雑度計算部510を簡易化した複雑度計算部1010を備えた構成からなる。
(Embodiment 3)
In the third embodiment, the number of bits of the sum signal M (f) and the corrected difference signal S ′ (f) based on the power ratio of the sum signal M (f) and the corrected difference signal S ′ (f). Determine the proportion of distribution. Therefore, the
図10−1は、実施の形態3にかかる符号化装置の構成を示すブロック図である。図10−1に示した符号化装置1000は、図5−1に示した符号化装置500の複雑度計算部510に代わり、複雑度計算部1010を備えている。この複雑度計算部1010は、電力計算部504と、電力比計算部1001とによって構成される。なお、符号化装置1000の他の構成は、符号化装置500と同じであるため、同一の符号を付して説明を省略する。また、ビット割り当て決定部407は、複雑度計算部1010によって計算された複雑度に応じてビット割り当てを決定する。
FIG. 10A is a block diagram of the configuration of the encoding apparatus according to the third embodiment. The
続いて、実施の形態3にかかる符号化装置1000の符号化処理の手順を説明する。図10−2は、実施の形態3にかかる符号化装置の符号化処理の手順を示すフローチャートである。図10−2のフローチャートにおいて、まず、MDCT501およびMDCT502において、左右のステレオ信号L(t),R(t)のMDCT変換を行う(ステップS1021)。
Subsequently, the procedure of the encoding process of the
続いて、MSステレオ変換部403によって、左右のスペクトル信号L(f),R(f)にMSステレオ変換を行う(ステップS1022)。また、類似度計算部404においては、左右のステレオ信号L(t),R(t)の相関に基づいて和信号M(f)と差信号S(f)との類似度(相関cor(i))を計算する(ステップS1023)。そして、ステップS1021において計算された類似度(相関cor(i))に基づいて、差信号修正部405によって差信号S(f)を修正する(ステップS1024)。
Subsequently, the MS
つぎに、複雑度計算部1010における処理について説明する。まず、電力計算部504によって、和信号M(f)と修正差信号S’(f)との電力計算を行う(ステップS1025)。電力計算部504で計算された和信号Mの電力e_mと、修正差信号S’の電力e_sとは、電力比計算部1001に出力される。なお、複雑度計算部1010は、上述したような電力比の計算に替わって、電力差を求め、ビット割り当て決定部407に出力してもよい。さらに、電力比、または電力差を求める際には、各信号の全周波数帯域の電力の合計や平均を用いてもよい。
Next, processing in the
続いて、電力比計算部1001によって、和信号Mの電力e_mと、修正差信号S’の電力e_sとの電力比を計算する(ステップS1026)。和信号Mと、修正差信号S’との電力比pow_ratioは、e_s/e_mによって求められる。そして、求められた電力比pow_ratioは、ビット割り当て決定部407に出力される。
Subsequently, the power
つぎに、ビット割り当て決定部407における処理について説明する。まず、修正差信号S’(f)の総ビット数を決定し(ステップS1027)、続いて、和信号M(f)の総ビット数を決定する(ステップS1028)。修正差信号S’(f)の総ビット数を決定する具体的な手順としては、電力比pow_ratioビット数と修正差信号S’(f)とのビット配分の関係をあらかじめ定めておく手順がある。
Next, processing in the bit
図11は、電力比pow_ratioとビット配分の関係の一例を示す図表である。図表1100は、横軸が電力比pow_ratioを表し、縦軸が修正差信号S’のビット配分量を表す。また、曲線1101は、電力比pow_ratioとビット配分の関係を示している。ビット割り当て決定部407は、図表1100のような、電力比pow_ratioとビット配分の関係をあらかじめ定めておく。具体的には、電力比pow_ratioの値が大きいときには、修正差信号S’のビット数分配を多くし、電力比pow_ratioの値が小さいときには、修正差信号S’のビット数分配を少なくする。つまり、修正差信号S’の電力の大きい帯域に多くのビット数を分配するような、曲線1101を設定しておく。
FIG. 11 is a chart showing an example of the relationship between the power ratio pow_ratio and bit allocation. In the
和信号Mのビット数は、ステップS1027によって決定された修正差信号S’(f)のビット数の分配に基づいて決定される。具体的には、1フレーム当たりの量子化ビット数をbit_totalとすると、図11の曲線1101によって修正差信号S’のビット数bit_sを求め、bit_totalから修正差信号S’のビット数bit_sを引き、和信号Mのビット数bit_mを求める(bit_m=bit_total−bit_s)。
The number of bits of the sum signal M is determined based on the distribution of the number of bits of the modified difference signal S ′ (f) determined in step S1027. Specifically, assuming that the number of quantization bits per frame is bit_total, the number of bits bit_s of the modified difference signal S ′ is obtained from the
以上のようにして求めたビット数に応じて、和信号量子化器408ではビット数bit_mで和信号M(f)の量子化を行い(ステップS1029)、差信号量子化器409ではビット数bit_sで修正差信号S’(f)の量子化を行い(ステップS1030)、一連の処理を終了する。
In accordance with the number of bits obtained as described above, the
以上説明したように、符号化装置、符号化方法、および符号化プログラムによれば、低ビットレート条件であっても音質劣化の少ない、高音質な音声(音楽)として再生することができる。 As described above, according to the encoding device, the encoding method, and the encoding program, it is possible to reproduce high-quality sound (music) with little deterioration in sound quality even under a low bit rate condition.
なお、本実施の形態1〜3で説明した符号化方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーションなどのコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVDなどのコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネットなどのネットワークを介して配布することが可能な伝送媒体であってもよい。 Note that the encoding methods described in the first to third embodiments can be realized by executing a program prepared in advance on a computer such as a personal computer or a workstation. This program is recorded on a computer-readable recording medium such as a hard disk, a flexible disk, a CD-ROM, an MO, and a DVD, and is executed by being read from the recording medium by the computer. The program may be a transmission medium that can be distributed via a network such as the Internet.
(付記1)ステレオ信号の左成分信号と右成分信号との和信号と、差信号とを用いてステレオ信号を圧縮する符号化装置において、
前記和信号の複雑度と、前記差信号の複雑度とをそれぞれ求める複雑度算出手段と、
前記複雑度算出手段によって求めた複雑度に応じて前記和信号と、前記差信号とをそれぞれ量子化する際のビット数の分配割合を設定するビット数設定手段と、
前記ビット数設定手段によって決定された前記分配割合に応じて前記和信号と、前記差信号をそれぞれ量子化する量子化手段と、
を備えることを特徴とする符号化装置。
(Supplementary note 1) In an encoding apparatus that compresses a stereo signal using a sum signal of a left component signal and a right component signal of a stereo signal and a difference signal,
Complexity calculation means for respectively determining the complexity of the sum signal and the complexity of the difference signal;
A bit number setting means for setting a distribution ratio of the number of bits when each of the sum signal and the difference signal is quantized according to the complexity obtained by the complexity calculating means;
Quantization means for quantizing each of the sum signal and the difference signal according to the distribution ratio determined by the bit number setting means,
An encoding device comprising:
(付記2)前記複雑度算出手段の前段にモノラル化手段を備え、
前記モノラル化手段は、周波数帯ごとに前記差信号の出力を所定の閾値と比較する比較手段と、
前記比較手段による比較結果における前記差信号が前記閾値よりも低い場合には、前記差信号の値を零に修正する修正手段と、
を備えることを特徴とする付記1に記載の符号化装置。
(Supplementary Note 2) A monaural unit is provided before the complexity calculating unit.
The monaural unit includes a comparing unit that compares the output of the difference signal with a predetermined threshold value for each frequency band;
A correction means for correcting the value of the difference signal to zero when the difference signal in the comparison result by the comparison means is lower than the threshold;
The encoding apparatus according to
(付記3)前記ビット数設定手段は、所定のビット数を、所定の間隔で時分割されたフレームごとの前記和信号および前記差信号に分配することを特徴とする付記1または2に記載の符号化装置。
(Supplementary note 3) The
(付記4)前記ビット数設定手段は、前記量子化手段によって量子化を行う際に、複雑度の低い信号にはビット数の分配割合を低くし、複雑度の高い信号にはビット数の分配割合を高くすることを特徴とする付記1〜3のいずれか一つに記載の符号化装置。
(Supplementary Note 4) When the quantization is performed by the quantization unit, the bit number setting unit reduces the bit number distribution ratio for a low complexity signal and distributes the bit number for a high complexity signal. The encoding device according to any one of
(付記5)前記複雑度算出手段は、前記和信号と、前記差信号とのそれぞれの心理聴覚エントロピー値(PE値)を求め、前記和信号および前記差信号のPE値の比もしくは差を複雑度とすることを特徴とする付記1〜4のいずれか一つに記載の符号化装置。
(Additional remark 5) The said complexity calculation means calculates | requires each psychoacoustic entropy value (PE value) of the said sum signal and the said difference signal, Complicates the ratio or difference of the PE value of the said sum signal and the said difference signal. The encoding device according to any one of
(付記6)前記複雑度算出手段は、前記和信号および前記差信号の全周波数帯域のPE値の平均もしくは合計から前記複雑度を求めることを特徴とする付記5に記載の符号化装置。 (Additional remark 6) The said complexity calculation means calculates | requires the said complexity from the average or the sum total of PE value of all the frequency bands of the said sum signal and the said difference signal, The encoding apparatus of Additional remark 5 characterized by the above-mentioned.
(付記7)前記複雑度算出手段は、前記和信号と、前記差信号とのそれぞれの電力値を求め、前記和信号と、前記差信号との電力値の比もしくは差を複雑度とすることを特徴とする付記1〜4のいずれか一つに記載の符号化装置。
(Supplementary note 7) The complexity calculation means obtains respective power values of the sum signal and the difference signal, and sets the ratio or difference of the power values of the sum signal and the difference signal as complexity. The encoding device according to any one of
(付記8)前記複雑度算出手段は、前記和信号および前記差信号の全周波数帯域の電力値の平均もしくは合計から前記複雑度を求めることを特徴とする付記7に記載の符号化装置。 (Additional remark 8) The said complexity calculation means calculates | requires the said complexity from the average or the sum total of the electric power value of the all frequency band of the said sum signal and the said difference signal, The encoding apparatus of Additional remark 7 characterized by the above-mentioned.
(付記9)前記ビット数設定手段は、あらかじめ定めた前記差信号の複雑度と前記分配割合との対応関係に応じてビット数の分配割合を設定することを特徴とする付記1〜8のいずれか一つに記載の符号化装置。
(Supplementary note 9) Any one of
(付記10)前記ビット数設定手段は、あらかじめ定めた前記和信号の複雑度と前記分配割合との対応関係に応じてビット数の分配割合を設定することを特徴とする付記1〜8のいずれか一つに記載の符号化装置。
(Supplementary note 10) Any one of
(付記11)ステレオ信号の左成分信号と右成分信号との和信号と、差信号とを用いてステレオ信号を圧縮する符号化方法において、
前記和信号の複雑度と、前記差信号の複雑度とをそれぞれ求める複雑度算出工程と、
前記複雑度算出工程によって求めた複雑度に応じて前記和信号と、前記差信号とをそれぞれ量子化する際のビット数の分配割合を設定するビット数設定工程と、
前記ビット数設定工程によって決定された前記分配割合に応じて前記和信号と、前記差信号をそれぞれ量子化する量子化工程と、
を含むことを特徴とする符号化方法。
(Supplementary note 11) In an encoding method for compressing a stereo signal using a sum signal of a left component signal and a right component signal of a stereo signal and a difference signal,
A complexity calculation step for determining the complexity of the sum signal and the complexity of the difference signal;
A bit number setting step for setting a distribution ratio of the number of bits when each of the sum signal and the difference signal is quantized according to the complexity obtained by the complexity calculation step;
A quantization step of quantizing the sum signal and the difference signal according to the distribution ratio determined by the bit number setting step;
The encoding method characterized by including.
(付記12)ステレオ信号の左成分信号と右成分信号との和信号と、差信号とを用いてステレオ信号を圧縮する符号化プログラムにおいて、
前記和信号の複雑度と、前記差信号の複雑度とをそれぞれ求める複雑度算出工程と、
前記複雑度算出工程によって求めた複雑度に応じて前記和信号と、前記差信号とをそれぞれ量子化する際のビット数の分配割合を設定するビット数設定工程と、
前記ビット数設定工程によって決定された前記分配割合に応じて前記和信号と、前記差信号をそれぞれ量子化する量子化工程と、
をコンピュータに実行させることを特徴とする符号化プログラム。
(Additional remark 12) In the encoding program which compresses a stereo signal using the sum signal of the left component signal and right component signal of a stereo signal, and a difference signal,
A complexity calculation step for determining the complexity of the sum signal and the complexity of the difference signal;
A bit number setting step of setting a distribution ratio of the number of bits when each of the sum signal and the difference signal is quantized according to the complexity obtained by the complexity calculation step;
A quantization step of quantizing the sum signal and the difference signal according to the distribution ratio determined by the bit number setting step;
An encoding program for causing a computer to execute.
以上のように、本発明にかかる符号化装置、符号化方法、および符号化プログラムは、ステレオ音声データの圧縮に有用であり、特に、低ビットレートの圧縮条件に適している。 As described above, the encoding apparatus, the encoding method, and the encoding program according to the present invention are useful for compressing stereo audio data, and are particularly suitable for low bit rate compression conditions.
400 符号化装置
401 L直交変換部
402 R直交変換部
403 MSステレオ変換部
404 類似度計算部
405 差信号修正部
406 複雑度計算部
407 ビット割り当て決定部
408 和信号量子化器
409 差信号量子化器
400 Encoder 401 L Orthogonal Transformer 402
Claims (10)
前記和信号の複雑度と、前記差信号の複雑度とをそれぞれ求める複雑度算出手段と、
前記複雑度算出手段によって求めた複雑度に応じて前記和信号と、前記差信号とをそれぞれ量子化する際のビット数の分配割合を設定するビット数設定手段と、
前記ビット数設定手段によって決定された前記分配割合に応じて前記和信号と、前記差信号をそれぞれ量子化する量子化手段と、
を備えることを特徴とする符号化装置。 In an encoding device that compresses a stereo signal using a sum signal of a left component signal and a right component signal of a stereo signal and a difference signal,
Complexity calculation means for respectively determining the complexity of the sum signal and the complexity of the difference signal;
A bit number setting means for setting a distribution ratio of the number of bits when each of the sum signal and the difference signal is quantized according to the complexity obtained by the complexity calculating means;
Quantization means for quantizing each of the sum signal and the difference signal according to the distribution ratio determined by the bit number setting means,
An encoding device comprising:
前記モノラル化手段は、周波数帯ごとに前記差信号の出力を所定の閾値と比較する比較手段と、
前記比較手段による比較結果における前記差信号が前記閾値よりも低い場合には、前記差信号の値を零に修正する修正手段と、
を備えることを特徴とする請求項1に記載の符号化装置。 A monaural unit is provided before the complexity calculating unit,
The monaural unit includes a comparison unit that compares the output of the difference signal with a predetermined threshold for each frequency band;
A correction means for correcting the value of the difference signal to zero when the difference signal in the comparison result by the comparison means is lower than the threshold;
The encoding apparatus according to claim 1, further comprising:
前記和信号の複雑度と、前記差信号の複雑度とをそれぞれ求める複雑度算出工程と、
前記複雑度算出工程によって求めた複雑度に応じて前記和信号と、前記差信号とをそれぞれ量子化する際のビット数の分配割合を設定するビット数設定工程と、
前記ビット数設定工程によって決定された前記分配割合に応じて前記和信号と、前記差信号をそれぞれ量子化する量子化工程と、
を含むことを特徴とする符号化方法。 In an encoding method for compressing a stereo signal using a sum signal of a left component signal and a right component signal of a stereo signal and a difference signal,
A complexity calculation step for determining the complexity of the sum signal and the complexity of the difference signal;
A bit number setting step for setting a distribution ratio of the number of bits when each of the sum signal and the difference signal is quantized according to the complexity obtained by the complexity calculation step;
A quantization step of quantizing the sum signal and the difference signal according to the distribution ratio determined by the bit number setting step;
The encoding method characterized by including.
前記和信号の複雑度と、前記差信号の複雑度とをそれぞれ求める複雑度算出工程と、
前記複雑度算出工程によって求めた複雑度に応じて前記和信号と、前記差信号とをそれぞれ量子化する際のビット数の分配割合を設定するビット数設定工程と、
前記ビット数設定工程によって決定された前記分配割合に応じて前記和信号と、前記差信号をそれぞれ量子化する量子化工程と、
をコンピュータに実行させることを特徴とする符号化プログラム。 In an encoding program for compressing a stereo signal using a sum signal of a left component signal and a right component signal of a stereo signal and a difference signal,
A complexity calculation step for determining the complexity of the sum signal and the complexity of the difference signal;
A bit number setting step of setting a distribution ratio of the number of bits when each of the sum signal and the difference signal is quantized according to the complexity obtained by the complexity calculation step;
A quantization step for quantizing the sum signal and the difference signal according to the distribution ratio determined by the bit number setting step;
An encoding program for causing a computer to execute.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006117345A JP2007183528A (en) | 2005-12-06 | 2006-04-21 | Encoding apparatus, encoding method, and encoding program |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005352470 | 2005-12-06 | ||
JP2006117345A JP2007183528A (en) | 2005-12-06 | 2006-04-21 | Encoding apparatus, encoding method, and encoding program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007183528A true JP2007183528A (en) | 2007-07-19 |
Family
ID=38339676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006117345A Pending JP2007183528A (en) | 2005-12-06 | 2006-04-21 | Encoding apparatus, encoding method, and encoding program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007183528A (en) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009530653A (en) * | 2006-03-13 | 2009-08-27 | フランス テレコム | Method for encoding sound source signal, corresponding encoding device, decoding method and device, signal, computer program product |
JP2012141412A (en) * | 2010-12-28 | 2012-07-26 | Fujitsu Ltd | Encoder, encoding method, and encoding program |
EP2618330A2 (en) | 2012-01-18 | 2013-07-24 | Fujitsu Limited | Audio coding device and method |
EP2690622A1 (en) | 2012-07-24 | 2014-01-29 | Fujitsu Limited | Audio decoding device and audio decoding method |
US8818539B2 (en) | 2009-07-03 | 2014-08-26 | Fujitsu Limited | Audio encoding device, audio encoding method, and video transmission device |
US8818764B2 (en) | 2010-03-30 | 2014-08-26 | Fujitsu Limited | Downmixing device and method |
EP2770505A1 (en) | 2013-02-20 | 2014-08-27 | Fujitsu Limited | Audio coding device and method |
US8831960B2 (en) | 2011-08-30 | 2014-09-09 | Fujitsu Limited | Audio encoding device, audio encoding method, and computer-readable recording medium storing audio encoding computer program for encoding audio using a weighted residual signal |
US8862479B2 (en) | 2010-01-20 | 2014-10-14 | Fujitsu Limited | Encoder, encoding system, and encoding method |
EP2876640A2 (en) | 2013-11-22 | 2015-05-27 | Fujitsu Limited | Audio encoding device and audio coding method |
US9111533B2 (en) | 2010-11-30 | 2015-08-18 | Fujitsu Limited | Audio coding device, method, and computer-readable recording medium storing program |
WO2020009082A1 (en) * | 2018-07-03 | 2020-01-09 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Encoding device and encoding method |
JP2021047431A (en) * | 2015-09-25 | 2021-03-25 | ヴォイスエイジ・コーポレーション | Method and system using long-term correlation difference between left and right channels for time domain down-mixing stereo audio signal into primary and secondary channels |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0787033A (en) * | 1993-09-17 | 1995-03-31 | Sharp Corp | Stereo audio signal coder |
JP2001053617A (en) * | 1999-08-05 | 2001-02-23 | Ricoh Co Ltd | Device and method for digital sound single encoding and medium where digital sound signal encoding program is recorded |
JP2001255892A (en) * | 2000-03-13 | 2001-09-21 | Nippon Telegr & Teleph Corp <Ntt> | Coding method of stereophonic signal |
JP2002268694A (en) * | 2001-03-13 | 2002-09-20 | Nippon Hoso Kyokai <Nhk> | Method and device for encoding stereophonic signal |
JP2003044096A (en) * | 2001-08-03 | 2003-02-14 | Matsushita Electric Ind Co Ltd | Method and device for encoding multi-channel audio signal, recording medium and music distribution system |
JP2003516555A (en) * | 1999-12-08 | 2003-05-13 | フラオホッフェル−ゲゼルシャフト ツル フェルデルング デル アンゲヴァンドテン フォルシュング エー.ヴェー. | Stereo sound signal processing method and apparatus |
JP2003271199A (en) * | 2002-03-15 | 2003-09-25 | Nippon Hoso Kyokai <Nhk> | Encoding method and encoding system for audio signal |
JP2004053626A (en) * | 2002-07-16 | 2004-02-19 | Nippon Telegr & Teleph Corp <Ntt> | Noise superposition quantity evaluating method, method and apparatus for noise suppression, noise superposition quantity evaluating program, noise suppressing program, and recording medium where noise superposition quantity evaluating program or/and noise suppressing program is/are recorded |
JP2005522722A (en) * | 2002-04-10 | 2005-07-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Stereo signal encoding |
JP2005202248A (en) * | 2004-01-16 | 2005-07-28 | Fujitsu Ltd | Audio encoding device and frame region allocating circuit of audio encoding device |
JP2005265865A (en) * | 2004-02-16 | 2005-09-29 | Matsushita Electric Ind Co Ltd | Method and device for bit allocation for audio encoding |
JP2005328542A (en) * | 2004-05-12 | 2005-11-24 | Samsung Electronics Co Ltd | Digital signal encoding method and apparatus using plurality of lookup tables, and method of generating plurality of lookup tables |
-
2006
- 2006-04-21 JP JP2006117345A patent/JP2007183528A/en active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0787033A (en) * | 1993-09-17 | 1995-03-31 | Sharp Corp | Stereo audio signal coder |
JP2001053617A (en) * | 1999-08-05 | 2001-02-23 | Ricoh Co Ltd | Device and method for digital sound single encoding and medium where digital sound signal encoding program is recorded |
JP2003516555A (en) * | 1999-12-08 | 2003-05-13 | フラオホッフェル−ゲゼルシャフト ツル フェルデルング デル アンゲヴァンドテン フォルシュング エー.ヴェー. | Stereo sound signal processing method and apparatus |
JP2001255892A (en) * | 2000-03-13 | 2001-09-21 | Nippon Telegr & Teleph Corp <Ntt> | Coding method of stereophonic signal |
JP2002268694A (en) * | 2001-03-13 | 2002-09-20 | Nippon Hoso Kyokai <Nhk> | Method and device for encoding stereophonic signal |
JP2003044096A (en) * | 2001-08-03 | 2003-02-14 | Matsushita Electric Ind Co Ltd | Method and device for encoding multi-channel audio signal, recording medium and music distribution system |
JP2003271199A (en) * | 2002-03-15 | 2003-09-25 | Nippon Hoso Kyokai <Nhk> | Encoding method and encoding system for audio signal |
JP2005522722A (en) * | 2002-04-10 | 2005-07-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Stereo signal encoding |
JP2004053626A (en) * | 2002-07-16 | 2004-02-19 | Nippon Telegr & Teleph Corp <Ntt> | Noise superposition quantity evaluating method, method and apparatus for noise suppression, noise superposition quantity evaluating program, noise suppressing program, and recording medium where noise superposition quantity evaluating program or/and noise suppressing program is/are recorded |
JP2005202248A (en) * | 2004-01-16 | 2005-07-28 | Fujitsu Ltd | Audio encoding device and frame region allocating circuit of audio encoding device |
JP2005265865A (en) * | 2004-02-16 | 2005-09-29 | Matsushita Electric Ind Co Ltd | Method and device for bit allocation for audio encoding |
JP2005328542A (en) * | 2004-05-12 | 2005-11-24 | Samsung Electronics Co Ltd | Digital signal encoding method and apparatus using plurality of lookup tables, and method of generating plurality of lookup tables |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009530653A (en) * | 2006-03-13 | 2009-08-27 | フランス テレコム | Method for encoding sound source signal, corresponding encoding device, decoding method and device, signal, computer program product |
US8818539B2 (en) | 2009-07-03 | 2014-08-26 | Fujitsu Limited | Audio encoding device, audio encoding method, and video transmission device |
US8862479B2 (en) | 2010-01-20 | 2014-10-14 | Fujitsu Limited | Encoder, encoding system, and encoding method |
US8818764B2 (en) | 2010-03-30 | 2014-08-26 | Fujitsu Limited | Downmixing device and method |
US9111533B2 (en) | 2010-11-30 | 2015-08-18 | Fujitsu Limited | Audio coding device, method, and computer-readable recording medium storing program |
JP2012141412A (en) * | 2010-12-28 | 2012-07-26 | Fujitsu Ltd | Encoder, encoding method, and encoding program |
US8831960B2 (en) | 2011-08-30 | 2014-09-09 | Fujitsu Limited | Audio encoding device, audio encoding method, and computer-readable recording medium storing audio encoding computer program for encoding audio using a weighted residual signal |
EP2618330A2 (en) | 2012-01-18 | 2013-07-24 | Fujitsu Limited | Audio coding device and method |
EP2690622A1 (en) | 2012-07-24 | 2014-01-29 | Fujitsu Limited | Audio decoding device and audio decoding method |
EP2770505A1 (en) | 2013-02-20 | 2014-08-27 | Fujitsu Limited | Audio coding device and method |
EP2876640A2 (en) | 2013-11-22 | 2015-05-27 | Fujitsu Limited | Audio encoding device and audio coding method |
US9837085B2 (en) | 2013-11-22 | 2017-12-05 | Fujitsu Limited | Audio encoding device and audio coding method |
JP2021047431A (en) * | 2015-09-25 | 2021-03-25 | ヴォイスエイジ・コーポレーション | Method and system using long-term correlation difference between left and right channels for time domain down-mixing stereo audio signal into primary and secondary channels |
JP7140817B2 (en) | 2015-09-25 | 2022-09-21 | ヴォイスエイジ・コーポレーション | Method and system using long-term correlation difference between left and right channels for time-domain downmixing of stereo audio signals into primary and secondary channels |
WO2020009082A1 (en) * | 2018-07-03 | 2020-01-09 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Encoding device and encoding method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2007183528A (en) | Encoding apparatus, encoding method, and encoding program | |
JP4741476B2 (en) | Encoder | |
EP1796081A2 (en) | Encoding apparatus, encoding method, and computer product | |
US9659573B2 (en) | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program | |
JP5485909B2 (en) | Audio signal processing method and apparatus | |
AU2016202800B2 (en) | Signal processing apparatus and method, and program | |
JP5267362B2 (en) | Audio encoding apparatus, audio encoding method, audio encoding computer program, and video transmission apparatus | |
JP6133408B2 (en) | Efficient encoding and decoding of multi-channel audio signals with multiple substreams | |
JP6474845B2 (en) | Reduced complexity converter SNR calculation | |
US20090106030A1 (en) | Method of signal encoding | |
IL201469A (en) | Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering | |
US9076440B2 (en) | Audio signal encoding device, method, and medium by correcting allowable error powers for a tonal frequency spectrum | |
KR20160120713A (en) | Decoding device, encoding device, decoding method, encoding method, terminal device, and base station device | |
JP4947145B2 (en) | Decoding device, decoding method, and program | |
JP2003345398A (en) | Audio signal encoding method | |
KR100928967B1 (en) | Method and apparatus for encoding / decoding audio signal | |
JP3725876B2 (en) | Audio encoder and its encoding processing program | |
JP2006276877A (en) | Decoding method for converted and encoded data and decoding device for converted and encoded data | |
Kurniawati et al. | Decoder Based Approach to Enhance Low Bit Rate Audio | |
JP2008015357A (en) | Encoding device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110301 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110502 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110531 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110801 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110906 |