JP2007183528A - Encoding apparatus, encoding method, and encoding program - Google Patents

Encoding apparatus, encoding method, and encoding program Download PDF

Info

Publication number
JP2007183528A
JP2007183528A JP2006117345A JP2006117345A JP2007183528A JP 2007183528 A JP2007183528 A JP 2007183528A JP 2006117345 A JP2006117345 A JP 2006117345A JP 2006117345 A JP2006117345 A JP 2006117345A JP 2007183528 A JP2007183528 A JP 2007183528A
Authority
JP
Japan
Prior art keywords
signal
complexity
difference signal
sum
bits
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006117345A
Other languages
Japanese (ja)
Inventor
Masanao Suzuki
政直 鈴木
Masakiyo Tanaka
正清 田中
Yoshiteru Tsuchinaga
義照 土永
Miyuki Shirakawa
美由紀 白川
Takashi Makiuchi
孝志 牧内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006117345A priority Critical patent/JP2007183528A/en
Publication of JP2007183528A publication Critical patent/JP2007183528A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To perform encoding with less deterioration in sound quality even under a low-bit-rate condition. <P>SOLUTION: An encoding apparatus 400 compresses a stereo signal by using a sum signal and a difference signal of a left component signal and a right component signal of the stereo signal. The encoding apparatus includes: a complexity calculating unit 406 that calculates complexity of the sum signal and complexity of the difference signal; a bit allocation setting unit 407 that sets, based on the complexities calculated by the complexity calculating unit 406, an allocation rate of bits to be allocated in quantizing the sum signal and the difference signal; and a sum signal quantizing unit 408 and a difference signal quantizing unit 409 that quantize the sum signal and the difference signal based on the allocation rate set by the bit allocation setting unit 407. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

この発明は、音声や音楽などのオーディオ信号を低ビットレートで圧縮するために、左チャネルと右チャネルとからなるステレオ信号を効率良く符号化する符号化装置、符号化方法、および符号化プログラムに関する。   The present invention relates to an encoding apparatus, an encoding method, and an encoding program for efficiently encoding a stereo signal composed of a left channel and a right channel in order to compress an audio signal such as voice or music at a low bit rate. .

従来、音声や音楽などのオーディオ信号を直交変換して得られる周波数スペクトルを符号化する方式として、ISO/IEC 13818−7 MPEG−2のオーディオ規格であるAAC(Advanced Audio Coding)方式が知られている。AAC方式は、地上波デジタルラジオ放送の音声符号化方式として採用されており、さらに、MS(ミッド・サイド)ステレオ符号化と呼ばれる技術を用いてステレオ信号の圧縮効率を高めている。   Conventionally, an AAC (Advanced Audio Coding) method, which is an audio standard of ISO / IEC 13818-7 MPEG-2, is known as a method for encoding a frequency spectrum obtained by orthogonally transforming audio signals such as voice and music. Yes. The AAC system is adopted as an audio encoding system for terrestrial digital radio broadcasting, and further, the compression efficiency of stereo signals is increased by using a technique called MS (mid side) stereo encoding.

図12は、MSステレオ符号化の符号化手順を示すブロック図である。図12に示したMSステレオ符号化装置1200は、まず左チャネルのオーディオ信号(L)をL直交変換部1201によって直交変換し、右チャネルのオーディオ信号(R)をR直交変換部1202によって直交変換する。変換後のL,Rは、MSステレオ変換部1203へ入力され、入力されたL,Rから和信号M(M=(L+R)/2)と、差信号S(S=(L−R)/2)とにそれぞれ変換される。さらに、和信号Mは、和信号量子化器1204によって符号化される(符号語1)。同様に差信号Sは、差信号量子化器1205によって符号化される(符号語2)。   FIG. 12 is a block diagram illustrating an encoding procedure of MS stereo encoding. The MS stereo encoding apparatus 1200 shown in FIG. 12 first orthogonally transforms the left channel audio signal (L) by the L orthogonal transform unit 1201, and orthogonal transforms the right channel audio signal (R) by the R orthogonal transform unit 1202. To do. The converted L and R are input to the MS stereo conversion unit 1203. From the input L and R, the sum signal M (M = (L + R) / 2) and the difference signal S (S = (LR) / And 2). Furthermore, the sum signal M is encoded by the sum signal quantizer 1204 (codeword 1). Similarly, the difference signal S is encoded by the difference signal quantizer 1205 (codeword 2).

MSステレオ符号化の際、MSステレオ変換部1203において、LとRとの相関が高い、つまり類似性が高い場合は、和信号Mに比べて差信号Sの電力が小さくなる。したがって、差信号Sの符号化ビット数を少なくして、和信号Mの符号化ビット数を多くすることで、符号化効率を向上させることができる。   At the time of MS stereo encoding, when the correlation between L and R is high in the MS stereo conversion unit 1203, that is, the similarity is high, the power of the difference signal S is smaller than that of the sum signal M. Therefore, by reducing the number of encoded bits of the difference signal S and increasing the number of encoded bits of the sum signal M, the encoding efficiency can be improved.

また、MSステレオ符号化による変換に加え、符号化効率を高める方法として、適応的に差信号Sをモノラル化する技術が開示されている(例えば、下記特許文献1参照。)。図13は、適応モノラル化の原理を示す説明図である。図13に示した図表1300を用いて適応モノラル化を説明する。図表1310,1320は、あるオーディオ信号のLとRとの波形を示す図表である。また、図表1330,1340は、LとRを用いて生成した和信号Mと、差信号Sの波形を示す図表である。Lの波形1311と、Rの波形1321とは、それぞれ和信号Mの波形1331と、差信号Sの波形1341とに変換される。   In addition to conversion by MS stereo encoding, a technique for adaptively monauralizing the difference signal S is disclosed as a method for improving encoding efficiency (see, for example, Patent Document 1 below). FIG. 13 is an explanatory diagram showing the principle of adaptive monauralization. The adaptive monauralization will be described with reference to the chart 1300 shown in FIG. Charts 1310 and 1320 are charts showing waveforms of L and R of an audio signal. Charts 1330 and 1340 are charts showing the waveforms of the sum signal M and the difference signal S generated using L and R, respectively. The L waveform 1311 and the R waveform 1321 are converted into a waveform 1331 of the sum signal M and a waveform 1341 of the difference signal S, respectively.

ここで、L,Rから和信号M、差信号Sへの変換に際して周波数fの信号に着目する。モノラル化では、LとRとの類似度を求め、LとRとの類似度が高い場合は、差信号Sを無音化もしくは小さい振幅を持った信号に変形する。LとRとの類似度が高い場合は差信号S=(L−R)/2≒0となるので差信号Sのビット数を減らして0とする。つまり、差信号Sを示す波形1341では、周波数fの信号が0となり、その分のビットを和信号Mを示す波形1331の周波数fの信号に割り当てている。したがって、和信号Mのビット数が増加し、量子化に伴うオーディオ信号の歪みを小さくすることができる。   Here, attention is focused on a signal of frequency f when converting from L and R into a sum signal M and a difference signal S. In monauralization, the similarity between L and R is obtained. If the similarity between L and R is high, the difference signal S is silenced or transformed into a signal having a small amplitude. When the similarity between L and R is high, the difference signal S = (LR) / 2≈0, so the number of bits of the difference signal S is reduced to zero. That is, in the waveform 1341 indicating the difference signal S, the signal of the frequency f is 0, and the corresponding bit is assigned to the signal of the frequency f of the waveform 1331 indicating the sum signal M. Therefore, the number of bits of the sum signal M increases, and the distortion of the audio signal accompanying quantization can be reduced.

特開2001−255892号公報Japanese Patent Laid-Open No. 2001-255892

しかしながら、地上波デジタルラジオ放送では、CD並みの高品質音声(音楽)と映像を合計330kbps程度で実現するため、音声に割り当てられるビットレートは32kbps〜64kbpsと非常に小さい。したがって、従来のMSステレオ符号化技術では量子化ビット数の不足による音質劣化が避けられないという問題があった。   However, in terrestrial digital radio broadcasting, high-quality audio (music) and video equivalent to CD are realized at a total of about 330 kbps, and therefore the bit rate assigned to audio is as very low as 32 kbps to 64 kbps. Therefore, the conventional MS stereo encoding technique has a problem that sound quality deterioration due to an insufficient number of quantization bits cannot be avoided.

また、上記の特許文献1に記載の適応モノラル化を用いた場合であっても、差信号Sが0の帯域、つまり、モノラル化された帯域においては差信号Sの量子化ビット数を減らすことができるが、モノラル化できない帯域では差信号Sの量子化ビット数を減らすことができないため、低ビットレート条件では十分な音質が得られないという問題があった。   Even when the adaptive monauralization described in Patent Document 1 is used, the number of quantization bits of the difference signal S is reduced in the band where the difference signal S is 0, that is, in the monaural band. However, since the number of quantized bits of the difference signal S cannot be reduced in a band that cannot be monaural, there is a problem that sufficient sound quality cannot be obtained under low bit rate conditions.

この発明は、上述した従来技術による問題点を解消するため、低ビットレート条件でも音質劣化の少ない符号化を実現する符号化装置、符号化方法、および符号化プログラムを提供することを目的とする。   An object of the present invention is to provide an encoding device, an encoding method, and an encoding program that can realize encoding with little deterioration in sound quality even under a low bit rate condition in order to eliminate the above-described problems caused by the prior art. .

上述した課題を解決し、目的を達成するため、この発明にかかる符号化装置は、ステレオ信号の左成分信号と右成分信号との和信号と、差信号とを用いてステレオ信号を圧縮する符号化装置において、前記和信号の複雑度と、前記差信号の複雑度とをそれぞれ求める複雑度算出手段と、前記複雑度算出手段によって求めた複雑度に応じて前記和信号と、前記差信号とをそれぞれ量子化する際のビット数の分配割合を設定するビット数設定手段と、前記ビット数設定手段によって決定された前記分配割合に応じて前記和信号と、前記差信号をそれぞれ量子化する量子化手段と、を備えることを特徴とする。   In order to solve the above-described problems and achieve the object, an encoding apparatus according to the present invention is a code that compresses a stereo signal using a sum signal of a left component signal and a right component signal of a stereo signal and a difference signal. In the encoding apparatus, complexity calculation means for obtaining the complexity of the sum signal and the complexity of the difference signal, respectively, the sum signal according to the complexity obtained by the complexity calculation means, and the difference signal A bit number setting means for setting a distribution ratio of the number of bits when each of the signals is quantized, and a quantizer for respectively quantizing the sum signal and the difference signal according to the distribution ratio determined by the bit number setting means And a converting means.

この発明によれば、類似度に基づいて差信号をモノラル化することにより量子化ビットを削減することができる。また、和信号Mと修正差信号S’の複雑度に応じて量子化ビット数を適応的に配分することができるため、従来技術に比べて効率のよい符号化を図ることができる。   According to the present invention, it is possible to reduce the number of quantization bits by making the difference signal monaural based on the similarity. In addition, since the number of quantization bits can be adaptively allocated according to the complexity of the sum signal M and the modified difference signal S ′, more efficient encoding can be achieved compared to the prior art.

本発明にかかる符号化装置、符号化方法、および符号化プログラムによれば、低ビットレート条件であっても音質劣化の少ない、高音質な音声(音楽)として再生することができるという効果を奏する。   According to the encoding device, encoding method, and encoding program of the present invention, it is possible to reproduce high-quality sound (music) with little deterioration in sound quality even under low bit rate conditions. .

以下に添付図面を参照して、この発明にかかる符号化装置、符号化方法、および符号化プログラムの好適な実施の形態を詳細に説明する。   Exemplary embodiments of an encoding device, an encoding method, and an encoding program according to the present invention will be explained below in detail with reference to the accompanying drawings.

(符号化の原理)
まず、図1〜図3を用いて本発明にかかる符号化方法の原理を説明する。図1は、通常のモノラル化を示す説明図である。図1に示した図表100は、差信号Sの電力を示す図表110と、和信号Mのビット数を示す図表120と、和信号Mの複雑度を示す図表130とを表している。
(Principle of encoding)
First, the principle of the encoding method according to the present invention will be described with reference to FIGS. FIG. 1 is an explanatory diagram showing normal monauralization. A chart 100 shown in FIG. 1 represents a chart 110 showing the power of the difference signal S, a chart 120 showing the number of bits of the sum signal M, and a chart 130 showing the complexity of the sum signal M.

図表100に示した周波数f1の信号に注目して通常のモノラル化の手順を説明する。図表110は、横軸が周波数を表し、縦軸が電力を表すことで、差信号Sの周波数ごとの電力を表している。周波数f1の差信号Sは、モノラル化によって電力が0に変換される。この変換によって差信号Sは、ビット数が削減される(図表110の例では−50bit)。   A normal monaural procedure will be described by paying attention to the signal of frequency f1 shown in chart 100. The chart 110 represents the power for each frequency of the difference signal S by representing the frequency on the horizontal axis and representing the power on the vertical axis. The difference signal S having the frequency f1 is converted into 0 by monauralization. The number of bits of the difference signal S is reduced by this conversion (−50 bits in the example of the chart 110).

図表120は、横軸が周波数を表し、縦軸が量子化した際のビット数を表すことで、和信号Mの周波数ごとの量子化ビット数を表している。図表120においては、図表110に示したモノラル化によって削減された差信号Sのビット(−50bit)が、周波数f1の元のビット数121に新たにビット数122(+50bit)として上乗せされる。   In the chart 120, the horizontal axis represents the frequency, and the vertical axis represents the number of bits when quantized, thereby representing the number of quantization bits for each frequency of the sum signal M. In the chart 120, the bit (−50 bits) of the difference signal S reduced by monauralization shown in the chart 110 is newly added as the number of bits 122 (+50 bits) to the original number of bits 121 of the frequency f1.

図表130は、横軸が周波数を表し、縦軸が複雑度を表すことで、和信号Mの周波数ごとの複雑度を表している。図表130に示した例では、周波数f1の和信号Mの複雑度131と、周波数f2の和信号Mの複雑度132が高いことがわかる。周波数f1の和信号Mは、図表120で説明したように、周波数f1の差信号Sの削減部分のビット数122が上乗せされている。したがって、周波数f1の和信号Mは、量子化誤差を小さくすることができ、音質の向上が期待できる。   In the chart 130, the horizontal axis represents the frequency, and the vertical axis represents the complexity, so that the complexity for each frequency of the sum signal M is represented. In the example shown in the chart 130, it can be seen that the complexity 131 of the sum signal M at the frequency f1 and the complexity 132 of the sum signal M at the frequency f2 are high. As described in the chart 120, the sum signal M of the frequency f1 is added with the number of bits 122 of the reduced portion of the difference signal S of the frequency f1. Therefore, the sum signal M having the frequency f1 can reduce the quantization error and can be expected to improve the sound quality.

しかしながら、通常のモノラル化の場合、ビット数が上乗せされるのは差信号Sのビット数が削減された周波数の信号に限られている。周波数f1と同様に複雑度が高い周波数f2の和信号Mのビット数123には、新たなビット数の上乗せ(例えば、破線で示したビット数124)は、行われない。したがって、周波数f2の和信号Mは、量子化誤差を小さくできず、音質を向上させることができない。   However, in the case of normal monauralization, the number of bits is added only to a signal having a frequency in which the number of bits of the difference signal S is reduced. Similar to the frequency f1, the number of bits 123 of the sum signal M of the frequency f2 having high complexity is not added with a new number of bits (for example, the number of bits 124 indicated by a broken line). Therefore, the sum signal M of the frequency f2 cannot reduce the quantization error and cannot improve the sound quality.

本発明では、差信号Sのモノラル化によって削減されたビット数を、周波数に関係なく、同じフレーム内の各信号の複雑度に応じて振り分ける。具体的な振り分け方法としては、和信号Mの複雑度に応じてビット数を振り分ける方法と、差信号Sの複雑度に応じてビット数を振り分ける方法とを用いる。以下、図2,3を用いてそれぞれの振り分け方法について説明する。   In the present invention, the number of bits reduced by making the difference signal S monaural is distributed according to the complexity of each signal in the same frame regardless of the frequency. As a specific distribution method, a method of distributing the number of bits according to the complexity of the sum signal M and a method of distributing the number of bits according to the complexity of the difference signal S are used. Hereinafter, each distribution method will be described with reference to FIGS.

まず、図2は、和信号Mの複雑度に応じてビット数を振り分ける方法を示す説明図である。ここでは、和信号Mの複雑度を調べ、差信号Sで削減したビットを、和信号Mを表すビットのうち、複雑な周波数のビットに振り分ける方法について説明する。図2に示した図表200は、差信号Sの電力を示す図表210と、和信号Mのビット数を示す図表220と、和信号Mの複雑度を示す図表230とを表している。   First, FIG. 2 is an explanatory diagram showing a method of distributing the number of bits according to the complexity of the sum signal M. Here, a method of examining the complexity of the sum signal M and allocating the bits reduced by the difference signal S to bits of a complex frequency among the bits representing the sum signal M will be described. The chart 200 shown in FIG. 2 represents a chart 210 showing the power of the difference signal S, a chart 220 showing the number of bits of the sum signal M, and a chart 230 showing the complexity of the sum signal M.

図表210は、横軸が周波数を表し、縦軸が電力を表すことで、差信号Sの周波数ごとの電力を表している。ここで、周波数f1の差信号Sは、モノラル化によって電力が0に変換される。この変換によって差信号Sは、ビット数が削減される(図表210の例では−50bit)。   In the chart 210, the horizontal axis represents the frequency, and the vertical axis represents the power, so that the power for each frequency of the difference signal S is represented. Here, the power of the difference signal S of the frequency f1 is converted to 0 by monauralization. This conversion reduces the number of bits of the difference signal S (−50 bits in the example of the chart 210).

図表220は、横軸が周波数を表し、縦軸が量子化した際のビット数を表すことで、和信号Mの周波数ごとの量子化ビット数を表している。図表210に示したように周波数f1の差信号Sから削減されたビット数(−50bit)を、周波数f1の和信号Mの元のビット数221と、周波数f2の和信号Mの元のビット数224とにそれぞれ振り分け、上乗せする。図表220の例では、周波数f1の和信号Mには、+20bitのビット数222が上乗せされて、周波数f2の和信号Mには、+30bitのビット数223が上乗せされている。   In the chart 220, the horizontal axis represents frequency, and the vertical axis represents the number of bits when quantized, so that the number of quantization bits for each frequency of the sum signal M is represented. As shown in FIG. 210, the number of bits (−50 bits) reduced from the difference signal S of the frequency f1 is changed to the original number of bits 221 of the sum signal M of the frequency f1 and the original number of bits of the sum signal M of the frequency f2. 224 and add to each. In the example of the chart 220, the sum signal M of the frequency f1 is added with a bit number 222 of +20 bits, and the sum signal M of the frequency f2 is added with a bit number 223 of +30 bits.

図表230は、横軸が周波数を表し、縦軸が複雑度を表すことで、和信号Mの周波数ごとの複雑度を表している。図表220に示したような和信号Mへのビット数の上乗せは、図表230に示した和信号Mの周波数ごとの複雑度に応じて決定する。したがって、周波数f1の和信号Mの複雑度231と、周波数f2の和信号Mの複雑度232とを、図表220によって振り分けられたビット数222,223に対応させている。   In the chart 230, the horizontal axis represents the frequency, and the vertical axis represents the complexity, so that the complexity of each frequency of the sum signal M is represented. The addition of the number of bits to the sum signal M as shown in the chart 220 is determined according to the complexity of each frequency of the sum signal M shown in the chart 230. Therefore, the complexity 231 of the sum signal M at the frequency f1 and the complexity 232 of the sum signal M at the frequency f2 are made to correspond to the number of bits 222 and 223 distributed by the chart 220.

一方、図3は、差信号Sの複雑度に応じてビット数を振り分ける方法を示す説明図である。ここでは、差信号Sの複雑度を調べ、差信号Sで削減したビットを、差信号Sを表すビットのうち、複雑な周波数のビットに振り分ける方法について説明する。図3に示した図表300は、差信号Sの電力を示す図表310と、差信号Sのビット数を示す図表320と、差信号Sの複雑度を示す図表330とを表している。   On the other hand, FIG. 3 is an explanatory diagram showing a method of distributing the number of bits according to the complexity of the difference signal S. Here, a method of examining the complexity of the difference signal S and allocating the bits reduced by the difference signal S to bits having a complex frequency among the bits representing the difference signal S will be described. The chart 300 shown in FIG. 3 represents a chart 310 that shows the power of the difference signal S, a chart 320 that shows the number of bits of the difference signal S, and a chart 330 that shows the complexity of the difference signal S.

図表310は、横軸が周波数を表し、縦軸が電力を表すことで、差信号Sの周波数ごとの電力を表している。ここで、周波数f1の差信号Sは、モノラル化によって電力が0に変換される。この変換によって差信号Sは、ビット数が削減される(図表310の例では−50bit)。   In the chart 310, the horizontal axis represents the frequency, and the vertical axis represents the power, so that the power for each frequency of the difference signal S is represented. Here, the power of the difference signal S of the frequency f1 is converted to 0 by monauralization. The number of bits of the difference signal S is reduced by this conversion (−50 bits in the example of the chart 310).

図表320は、横軸が周波数を表し、縦軸が量子化した際のビット数を表すことで、差信号Sの周波数ごとの量子化ビット数を表している。図表310に示したように周波数f1の差信号Sから削減されたビット数(−50bit)321を、周波数f0の差信号Sの元のビット数322と、周波数f2の差信号Sの元のビット数324とにそれぞれ振り分け、上乗せする。差信号Sにビットを上乗せする場合は、図表310に示したように周波数f1の差信号Sは、0に変換されているため、ビット数321を必要としない。したがって、差信号Sの複雑度に応じて、周波数f0と周波数f2のそれぞれの差信号Sは、ビット数(図3の例ではビット数323,325)の上乗せによりビット数が増加し、量子化誤差が減少する。   In the chart 320, the horizontal axis represents the frequency, and the vertical axis represents the number of bits when quantized, thereby representing the number of quantization bits for each frequency of the difference signal S. As shown in the chart 310, the number of bits (−50 bits) 321 reduced from the difference signal S of the frequency f1 is changed to the original number of bits 322 of the difference signal S of the frequency f0 and the original bits of the difference signal S of the frequency f2. Each is assigned to Formula 324 and added. When a bit is added to the difference signal S, the difference signal S of the frequency f1 is converted to 0 as shown in the chart 310, so that the number of bits 321 is not required. Therefore, according to the complexity of the difference signal S, the difference signal S of each of the frequency f0 and the frequency f2 is increased in the number of bits due to the addition of the number of bits (the number of bits 323 and 325 in the example of FIG. 3). The error is reduced.

図表330は、横軸が周波数を表し、縦軸が複雑度を表すことで、差信号Sの周波数ごとの複雑度を表している。図表330に示したように、周波数f0の差信号Sの複雑度332と、周波数f2の差信号Sの複雑度333とが高いため、図表320に示したようなビット数の割り当てに反映されている。なお、周波数f1の差信号Sは、ビット数が0であるにも拘わらず複雑度331を示しているが、これは、モノラル化され0に変換される前の周波数f1の差信号Sの複雑度を示しているためである。   In the chart 330, the horizontal axis represents frequency, and the vertical axis represents complexity, so that the complexity of the difference signal S for each frequency is represented. As shown in the chart 330, since the complexity 332 of the difference signal S at the frequency f0 and the complexity 333 of the difference signal S at the frequency f2 are high, it is reflected in the allocation of the number of bits as shown in the chart 320. Yes. Note that the difference signal S of the frequency f1 indicates the complexity 331 even though the number of bits is 0, but this is the complexity of the difference signal S of the frequency f1 before being converted to monaural and converted to 0. This is because the degree is shown.

以上、図1〜図3を用いて説明したように、本発明では、モノラル化によって削減された差信号Sのビット数を複雑度に応じて和信号Mもしくは差信号Sの複雑度の高い信号に振り分ける。ビット数の振り分けの際には、和信号Mと差信号Sとを含む全体の複雑度を求め、重要な信号を抽出する。具体的には、差信号Sよりも和信号Mの複雑度が大きい際には、和信号Mに多くのビット数を割り振る。反対に、和信号Mよりも差信号Sの複雑度が大きい場合は、差信号Sに多くのビット数を割り振る。以下に説明する符号化装置は、説明した原理に基づいて符号化を実現する。   As described above with reference to FIGS. 1 to 3, in the present invention, the number of bits of the difference signal S reduced by monauralization is changed to a sum signal M or a signal having a high complexity of the difference signal S according to the complexity. Sort out. When distributing the number of bits, the overall complexity including the sum signal M and the difference signal S is obtained, and important signals are extracted. Specifically, when the complexity of the sum signal M is larger than the difference signal S, a larger number of bits is assigned to the sum signal M. Conversely, when the complexity of the difference signal S is larger than the sum signal M, a larger number of bits is assigned to the difference signal S. The encoding apparatus described below realizes encoding based on the described principle.

(符号化装置の基本構成)
つぎに、本発明にかかる符号化装置の基本構成を説明する。図4は、本発明にかかる符号化装置の基本構成を示すブロック図である。符号化装置400は、上述した符号化の原理に基づいて符号化を行う。符号化装置400は、L直交変換部401と、R直交変換部402と、MSステレオ変換部403と、比較手段としての類似度計算部404と、修正手段としての差信号修正部405と、複雑度算出手段としての複雑度計算部406と、ビット数設定手段としてのビット割り当て決定部407と、量子化手段としての和信号量子化器408、および差信号量子化器409とから構成される。
(Basic configuration of encoding device)
Next, the basic configuration of the encoding apparatus according to the present invention will be described. FIG. 4 is a block diagram showing the basic configuration of the encoding apparatus according to the present invention. The encoding device 400 performs encoding based on the above-described encoding principle. The encoding apparatus 400 includes an L orthogonal transform unit 401, an R orthogonal transform unit 402, an MS stereo transform unit 403, a similarity calculation unit 404 as a comparison unit, a difference signal correction unit 405 as a correction unit, A complexity calculation unit 406 as a degree calculation unit, a bit allocation determination unit 407 as a bit number setting unit, a sum signal quantizer 408 and a difference signal quantizer 409 as quantization units.

L直交変換部401は、時間領域の入力信号(左チャネルのステレオ信号L(t))を直交変換し、スペクトル信号L(f)を出力する。直交変換とは時間領域tの空間座標から、周波数座標fへ変換する処理である。同様に、R直交変換部402は、時間領域の入力信号(右チャネルのステレオ信号R(t))を直交変換し、スペクトル信号R(f)を出力する。   The L orthogonal transform unit 401 orthogonally transforms the time domain input signal (left channel stereo signal L (t)) and outputs a spectrum signal L (f). Orthogonal transformation is a process of transforming from space coordinates in the time domain t to frequency coordinates f. Similarly, the R orthogonal transform unit 402 performs orthogonal transform on the time domain input signal (right channel stereo signal R (t)) and outputs a spectrum signal R (f).

MSステレオ変換部403は、L直交変換部401から入力されたスペクトル信号L(f)と、R直交変換部402から入力されたスペクトル信号R(f)とをMSステレオ変換し、周波数に応じた値を示すスペクトル信号による和信号M(f)と差信号S(f)として出力する。   The MS stereo transform unit 403 performs MS stereo transform on the spectrum signal L (f) input from the L orthogonal transform unit 401 and the spectrum signal R (f) input from the R orthogonal transform unit 402, and according to the frequency The sum signal M (f) and difference signal S (f) are output as a spectrum signal indicating the value.

類似度計算部404は、L直交変換部401から入力されたスペクトル信号L(f)と、R直交変換部402から入力されたスペクトル信号R(f)との類似度を求める。類似度とはスペクトル信号L(f)とスペクトル信号R(f)との相関を数値的に算出した値である。類似度計算の具体的な内容に関しては、実施の形態の記述の際に詳しく説明する。類似度計算部404によって計算された類似度は、差信号修正部405に入力される。   The similarity calculation unit 404 obtains the similarity between the spectrum signal L (f) input from the L orthogonal transform unit 401 and the spectrum signal R (f) input from the R orthogonal transform unit 402. The similarity is a value obtained by numerically calculating the correlation between the spectrum signal L (f) and the spectrum signal R (f). Specific contents of the similarity calculation will be described in detail when the embodiment is described. The similarity calculated by the similarity calculation unit 404 is input to the difference signal correction unit 405.

差信号修正部405は、MSステレオ変換部403から入力された差信号S(f)に、類似度計算部404から入力された類似度に基づいて修正を施し、修正差信号S’(f)を作成する。差信号修正部405によって行われる処理は、モノラル化に相当する。具体的な処理内容としては、周波数帯ごとの差信号Sの類似度があらかじめ定めた閾値よりも高いか否かの判断を行う。閾値よりも類似度が高い差信号Sは、すなわち差が≒0となり、モノラル化により修正差信号S’(f)=0として作成される。また、閾値より類似度が低い差信号は、差が大きいため、そのまま、修正差信号S’(f)=S(f)として作成される。   The difference signal correction unit 405 corrects the difference signal S (f) input from the MS stereo conversion unit 403 based on the similarity input from the similarity calculation unit 404, and the correction difference signal S ′ (f). Create The process performed by the difference signal correction unit 405 corresponds to monauralization. As specific processing contents, it is determined whether or not the similarity of the difference signal S for each frequency band is higher than a predetermined threshold. The difference signal S having a similarity higher than the threshold value, that is, the difference becomes ≈0, and is created as a corrected difference signal S ′ (f) = 0 by monauralization. In addition, the difference signal having a similarity lower than the threshold value has a large difference, so that the difference signal S ′ (f) = S (f) is generated as it is.

複雑度計算部406は、MSステレオ変換部403から入力された和信号M(f)を用いて和信号M(f)の複雑度PE_m_aveを求め、差信号修正部405から入力された修正差信号S’(f)を用いて修正差信号S’(f)の複雑度PE_s_aveを求める。さらに、求めた複雑度PEの比を求めビット割り当て決定部407へ出力する。   The complexity calculation unit 406 obtains the complexity PE_m_ave of the sum signal M (f) using the sum signal M (f) input from the MS stereo conversion unit 403, and the corrected difference signal input from the difference signal correction unit 405. The complexity PE_s_ave of the corrected difference signal S ′ (f) is obtained using S ′ (f). Further, the ratio of the obtained complexity PE is obtained and output to the bit allocation determining unit 407.

ビット割り当て決定部407は、複雑度計算部406から入力された複雑度PEの比の値に応じてビット数の分配の割合を決定し、和信号量子化器408と、差信号量子化器409とにそれぞれビット割り当て情報を出力する。割り当ての際には、複雑度PEの比と閾値との比較に基づいて行う。   The bit allocation determination unit 407 determines the distribution ratio of the number of bits according to the ratio value of the complexity PE input from the complexity calculation unit 406, and performs a sum signal quantizer 408 and a difference signal quantizer 409. And bit allocation information are output respectively. Allocation is performed based on a comparison between the ratio of the complexity PE and a threshold value.

和信号量子化器408は、MSステレオ変換部403から入力された和信号M(f)を、ビット割り当て決定部407から入力されたビット割り当て情報に基づいて、量子化する。量子化後の和信号M(f)は、符号語1として出力される。同様に、差信号量子化器409は、差信号修正部405から入力された修正差信号S’(f)を、ビット割り当て決定部407から入力されたビット割り当て情報に基づいて、量子化する。量子化後の差信号S(f)は、符号語2として出力される。   The sum signal quantizer 408 quantizes the sum signal M (f) input from the MS stereo conversion unit 403 based on the bit allocation information input from the bit allocation determination unit 407. The quantized sum signal M (f) is output as codeword 1. Similarly, the difference signal quantizer 409 quantizes the modified difference signal S ′ (f) input from the difference signal correcting unit 405 based on the bit allocation information input from the bit allocation determining unit 407. The quantized difference signal S (f) is output as codeword 2.

本発明にかかる符号化装置400は、以上説明したような基本構成を用いてステレオ信号の符号化を行う。つぎに、各機能部の具体的な構成例とその処理内容について詳しく説明する。ここでは、符号化装置の構成例を実施の形態1〜実施の形態3として説明する。   The encoding apparatus 400 according to the present invention encodes a stereo signal using the basic configuration as described above. Next, a specific configuration example and processing contents of each functional unit will be described in detail. Here, a configuration example of the encoding device will be described as Embodiment 1 to Embodiment 3.

(実施の形態1)
実施の形態1では、図4に示した複雑度計算部406に対応する複雑度計算部510(図5−1参照)において、和信号Mと修正差信号S’とのそれぞれの心理視聴エントロピー(PE値)を求め、PE値の比を複雑度として出力する。また、ビット割り当て決定部407では、あらかじめ定めておいた複雑度と修正差信号S’との対応関係に応じてビット数の分配割合を決定する。
(Embodiment 1)
In the first embodiment, in the complexity calculation unit 510 (see FIG. 5A) corresponding to the complexity calculation unit 406 shown in FIG. 4, the psychological viewing entropy of the sum signal M and the corrected difference signal S ′ ( PE value) is obtained, and the ratio of PE values is output as complexity. Also, the bit allocation determining unit 407 determines the distribution ratio of the number of bits according to the correspondence between the complexity determined in advance and the correction difference signal S ′.

図5−1は、実施の形態1にかかる符号化装置の構成を示すブロック図である。図5−1に示した符号化装置500は、図4に示した基本構成の具体的な実施例を示す。以下、図4に示した符号化装置400の類似度計算部404、差信号修正部405、複雑度計算部406、ビット割り当て決定部407、和信号量子化器408および差信号量子化器409の具体的な処理について説明する。   FIG. 5A is a block diagram of the configuration of the encoding apparatus according to the first embodiment. A coding apparatus 500 illustrated in FIG. 5A illustrates a specific example of the basic configuration illustrated in FIG. 4. Hereinafter, the similarity calculation unit 404, the difference signal correction unit 405, the complexity calculation unit 406, the bit allocation determination unit 407, the sum signal quantizer 408, and the difference signal quantizer 409 of the encoding device 400 illustrated in FIG. Specific processing will be described.

図5−2は、実施の形態1にかかる符号化装置の符号化処理の手順を示すフローチャートである。図5−2のフローチャートにおいて、まず、MDCT501およびMDCT502において、左右のステレオ信号L(t),R(t)のMDCT変換を行う(ステップS521)。実施の形態1〜実施の形態3ではL直交変換部401およびR直交変換部402の処理を実現するために、MDCT(Modified Discrete Cosine Transform;変形離散コサイン変換)を用いる。MDCTは、通常のDCT演算では成分抽出時にブロック境界部分でブロック歪みが発生するため、ブロック区間長の50%を隣接ブロックとオーバーラップすることによりブロック歪みを除去する変換処理である。   FIG. 5-2 is a flowchart of an encoding process performed by the encoding apparatus according to the first embodiment. In the flowchart of FIG. 5-2, first, MDCT conversion of the left and right stereo signals L (t) and R (t) is performed in the MDCT 501 and the MDCT 502 (step S521). In Embodiments 1 to 3, MDCT (Modified Discrete Cosine Transform) is used to realize the processing of L orthogonal transform unit 401 and R orthogonal transform unit 402. MDCT is a conversion process that removes block distortion by overlapping 50% of the block section length with an adjacent block because block distortion occurs at the block boundary portion during component extraction in normal DCT calculation.

続いて、MSステレオ変換部403によって、左右のスペクトル信号L(f),R(f)にMSステレオ変換を行う(ステップS522)。また、類似度計算部404においては、スペクトル信号L(f)とスペクトル信号R(f)との類似度を計算する(ステップS523)。ここで、類似度計算部404における類似度計算について詳しく説明する。類似度は、スペクトル信号L(f)とスペクトル信号R(f)との相関を用いる。   Subsequently, the MS stereo conversion unit 403 performs MS stereo conversion on the left and right spectrum signals L (f) and R (f) (step S522). In addition, the similarity calculation unit 404 calculates the similarity between the spectrum signal L (f) and the spectrum signal R (f) (step S523). Here, the similarity calculation in the similarity calculation unit 404 will be described in detail. For the similarity, the correlation between the spectrum signal L (f) and the spectrum signal R (f) is used.

図6は、信号の帯域の上限と下限の関係を示す図表である。図表600は、横軸が周波数fを表し、縦軸がステレオ信号Lの電力を表す。各信号は、複数の周波数帯域(例えば、周波数帯601〜603で示した帯域i−1,i,i+1)によって構成されているため、周波数帯域ごとに下記(1)式を用いて相関cor(i)を求める。したがって、類似度計算部404から相関cor(i)が差信号修正部405へ入力される。   FIG. 6 is a chart showing the relationship between the upper limit and the lower limit of the signal band. In the chart 600, the horizontal axis represents the frequency f, and the vertical axis represents the power of the stereo signal L. Since each signal is composed of a plurality of frequency bands (for example, bands i-1, i, i + 1 shown by frequency bands 601 to 603), the correlation cor ( i) is determined. Therefore, the correlation cor (i) is input from the similarity calculation unit 404 to the difference signal correction unit 405.

Figure 2007183528
Figure 2007183528

その後、相関cor(i)に基づいて、差信号修正部405によって、MSステレオ変換部403から入力された差信号S(f)の修正を行う(ステップS524)。差信号修正部405は、差信号S(f)の帯域ごとに相関cor(i)と閾値との比較を行う。具体的には、相関cor(i)が閾値以上の場合は、帯域i(図6参照)に含まれる全周波数fについて修正差信号S’(f)=0とする。また、相関cor(i)が閾値以下の場合は、帯域i(図6参照)に含まれる全周波数fについて修正差信号S’(f)=S(f)とする。   Thereafter, based on the correlation cor (i), the difference signal correction unit 405 corrects the difference signal S (f) input from the MS stereo conversion unit 403 (step S524). The difference signal correction unit 405 compares the correlation cor (i) with a threshold value for each band of the difference signal S (f). Specifically, when the correlation cor (i) is equal to or greater than the threshold value, the corrected difference signal S ′ (f) = 0 is set for all frequencies f included in the band i (see FIG. 6). When the correlation cor (i) is equal to or smaller than the threshold value, the corrected difference signal S ′ (f) = S (f) is set for all the frequencies f included in the band i (see FIG. 6).

つぎに、複雑度計算部510によって行われる複雑度計算の詳細な処理について説明する。複雑度計算部510は、許容誤差計算部503と、電力計算部504と、PE値計算部505と、PE比計算部506とから構成される。複雑度計算部510では、まず、許容誤差計算部503によって、許容誤差計算を行う(ステップS525)。   Next, detailed processing of complexity calculation performed by the complexity calculator 510 will be described. The complexity calculation unit 510 includes an allowable error calculation unit 503, a power calculation unit 504, a PE value calculation unit 505, and a PE ratio calculation unit 506. In the complexity calculation unit 510, first, an allowable error calculation is performed by the allowable error calculation unit 503 (step S525).

許容誤差計算部503は、MSステレオ変換部403から和信号M(f)が入力され、差信号修正部405から修正差信号S’(f)が入力され、帯域iにおける和信号M(f)の許容誤差電力n_m(i)と、修正差信号S’(f)の許容誤差電力n_s(i)を求める。このステップにおける許容誤差電力の算出としては、例えば、公知の技術である心理視聴モデルにおける許容誤差電力の計算(ISO/IEC 13818−7:2003,Advanced Auduo Coding)を用いることができる。   The allowable error calculation unit 503 receives the sum signal M (f) from the MS stereo conversion unit 403, receives the correction difference signal S ′ (f) from the difference signal correction unit 405, and adds the sum signal M (f) in the band i. The allowable error power n_m (i) and the allowable error power n_s (i) of the corrected difference signal S ′ (f) are obtained. As calculation of allowable error power in this step, for example, calculation of allowable error power in a psychological viewing model (ISO / IEC 13818-7: 2003, Advanced Audio Coding), which is a known technique, can be used.

続いて、電力計算部504によって電力計算を行う(ステップS526)。電力計算部504は、MSステレオ変換部403から入力された和信号M(f)の帯域iにおける電力e_m(i)と、差信号修正部405から入力された修正差信号S’(f)の帯域iにおける電力e_s(i)を下記の(2),(3)式から求める。   Subsequently, power calculation is performed by the power calculation unit 504 (step S526). The power calculation unit 504 includes the power e_m (i) in the band i of the sum signal M (f) input from the MS stereo conversion unit 403 and the corrected difference signal S ′ (f) input from the difference signal correction unit 405. The power e_s (i) in the band i is obtained from the following equations (2) and (3).

Figure 2007183528
Figure 2007183528

続いて、PE値計算部505によって複雑度PE値計算を行う(ステップS527)。PE値計算部505には、許容誤差計算部503から和信号Mの許容誤差電力n_m(P1)と、修正差信号S’の許容誤差電力n_s(P2)が入力され、電力計算部504から、和信号Mの電力e_m(P3)と、修正差信号S’の電力e_s(P4)とが入力される。PE値計算部505は、下記(4)式を用いて、和信号Mの許容誤差電力n_mと、和信号Mの電力e_mとから和信号Mの複雑度PE_mを求める。同様に、下記(5)式を用いて修正差信号S’の許容誤差電力n_sと、修正差信号S’の電力e_sとから修正差信号S’の複雑度PE_sを求める。なお、下記(4),(5)式のシグマに用いているnは帯域の個数を表している。   Subsequently, the PE value calculation unit 505 performs complexity PE value calculation (step S527). The PE value calculation unit 505 receives the allowable error power n_m (P1) of the sum signal M and the allowable error power n_s (P2) of the correction difference signal S ′ from the allowable error calculation unit 503, and from the power calculation unit 504, The power e_m (P3) of the sum signal M and the power e_s (P4) of the corrected difference signal S ′ are input. The PE value calculation unit 505 obtains the complexity PE_m of the sum signal M from the allowable error power n_m of the sum signal M and the power e_m of the sum signal M using the following equation (4). Similarly, the complexity PE_s of the corrected difference signal S ′ is obtained from the allowable error power n_s of the corrected difference signal S ′ and the power e_s of the corrected difference signal S ′ using the following equation (5). Note that n used in the sigma of the following equations (4) and (5) represents the number of bands.

Figure 2007183528
Figure 2007183528

つぎに、PE比計算部506によって、PE比計算を行う(ステップS528)。PE比計算部506には、PE値計算部505から和信号Mの複雑度PE_mと、修正差信号S’の複雑度PE_sが入力される。そして、PE比計算部506は、和信号Mの複雑度PE_mに対する修正差信号S’の複雑度PE_sの割合を下記(6)式によって求め、複雑度の比(PE比)をpe_ratioとしてビット割り当て決定部407へ出力する。ここまでのステップにより、複雑度計算部510の処理が終了する。なお、複雑度計算部510は、上述したようなPE比の計算に替わって、PE差を求め、ビット割り当て決定部407に出力してもよい。さらに、PE比、またはPE差を求める際には、各信号の全周波数帯域のPE値の合計や平均を用いてもよい。   Next, the PE ratio calculation unit 506 performs PE ratio calculation (step S528). The PE ratio calculation unit 506 receives the complexity PE_m of the sum signal M and the complexity PE_s of the correction difference signal S ′ from the PE value calculation unit 505. Then, the PE ratio calculation unit 506 obtains the ratio of the complexity PE_s of the modified difference signal S ′ to the complexity PE_m of the sum signal M by the following equation (6), and assigns the bit as the complexity ratio (PE ratio) as pe_ratio. The data is output to the determination unit 407. With the steps so far, the processing of the complexity calculator 510 ends. The complexity calculation unit 510 may obtain a PE difference and output it to the bit allocation determination unit 407 instead of calculating the PE ratio as described above. Furthermore, when calculating the PE ratio or PE difference, the sum or average of PE values in all frequency bands of each signal may be used.

pe_ratio=PE_s/PE_m …(6)   pe_ratio = PE_s / PE_m (6)

続いて、ビット割り当て決定部407における処理について説明する。まず、修正差信号S’(f)の総ビット数を決定し(ステップS529)、続いて、和信号M(f)の総ビット数を決定する(ステップS530)。修正差信号S’(f)の総ビット数を決定する具体的な手順としては、複雑度比pe_ratioと修正差信号S’(f)のビット配分量との関係をあらかじめ定めておく手順がある。   Next, processing in the bit allocation determination unit 407 will be described. First, the total number of bits of the modified difference signal S ′ (f) is determined (step S529), and then the total number of bits of the sum signal M (f) is determined (step S530). As a specific procedure for determining the total number of bits of the correction difference signal S ′ (f), there is a procedure for predetermining the relationship between the complexity ratio pe_ratio and the bit allocation amount of the correction difference signal S ′ (f). .

図7は、PE比とビット分配の関係を示す図表である。図表700は、横軸が複雑度比pe_ratioを表し、縦軸が修正差信号S’のビット配分量を表す。また、曲線701は、複雑度比pe_ratioとビット配分の関係を示している。ビット割り当て決定部407は、図表700のような、複雑度比pe_ratioとビット配分の関係をあらかじめ定めておく。具体的には、複雑度比pe_ratioの値が大きいときには、修正差信号S’のビット数分配を多くし、複雑度比pe_ratioの値が小さいときには、修正差信号S’のビット数分配を少なくする。つまり、修正差信号S’の複雑度の大きい帯域に多くのビット数を分配するような曲線701を設定しておく。   FIG. 7 is a chart showing the relationship between PE ratio and bit distribution. In the chart 700, the horizontal axis represents the complexity ratio pe_ratio, and the vertical axis represents the bit allocation amount of the correction difference signal S '. A curve 701 indicates the relationship between the complexity ratio pe_ratio and bit allocation. The bit allocation determining unit 407 previously determines the relationship between the complexity ratio pe_ratio and the bit allocation as shown in the chart 700. Specifically, when the value of the complexity ratio pe_ratio is large, the bit number distribution of the correction difference signal S ′ is increased. When the value of the complexity ratio pe_ratio is small, the bit number distribution of the correction difference signal S ′ is decreased. . That is, a curve 701 is set so that a large number of bits are distributed to a band with a high complexity of the correction difference signal S ′.

和信号Mのビット数は、ステップS529によって決定された修正差信号S’(f)のビット数の分配に基づいて決定される。具体的には、1フレーム当たりの量子化ビット数をbit_totalとすると、図7の曲線701によって修正差信号S’のビット数bit_sを求めbit_totalから修正差信号S’のビット数bit_sを引き、和信号Mのビット数bit_mを求める(bit_m=bit_total−bit_s)。   The number of bits of the sum signal M is determined based on the distribution of the number of bits of the modified difference signal S ′ (f) determined in step S529. Specifically, assuming that the number of quantization bits per frame is bit_total, the number of bits bit_s of the modified difference signal S ′ is obtained from the curve 701 in FIG. 7, and the number of bits bit_s of the modified difference signal S ′ is subtracted from the bit_total. The number of bits bit_m of the signal M is obtained (bit_m = bit_total−bit_s).

以上のようにして求めたビット数に応じて、和信号量子化器408ではビット数bit_mで和信号M(f)の量子化を行い(ステップS531)、差信号量子化器409ではビット数bit_sで修正差信号S’(f)の量子化を行い(ステップS532)、一連の処理を終了する。   In accordance with the number of bits obtained as described above, the sum signal quantizer 408 quantizes the sum signal M (f) with the bit number bit_m (step S531), and the difference signal quantizer 409 performs the bit number bit_s. Then, the corrected difference signal S ′ (f) is quantized (step S532), and the series of processes is terminated.

(実施の形態2)
実施の形態2は、複雑度計算部810における複雑度の計算の際に実施の形態1と異なる方法を用いる。また、ビット割り当て決定部407におけるビット割り当ての際には、PE値の重み係数に応じてビット数の分配を行う。
(Embodiment 2)
In the second embodiment, a method different from that in the first embodiment is used when the complexity calculation unit 810 calculates the complexity. Further, when bit allocation is performed by the bit allocation determination unit 407, the number of bits is distributed according to the weight coefficient of the PE value.

図8−1は、実施の形態2にかかる符号化装置の構成を示すブロック図である。実施の形態2にかかる符号化装置800は、実施の形態1の符号化装置500と同じ構成によって符号化を行うが、複雑度計算部810の処理内容が異なり、それに伴いビット割り当て決定部407におけるビット割り当て方法にも変化が生じる。したがって、符号化装置800の特徴となる、PE値計算部505と、PE比計算部506と、ビット割り当て決定部407とについて詳しく説明する。また、他の構成は、符号化装置500と同じであるため、同一の符号を付して説明を省略する。   FIG. 8A is a block diagram of the configuration of the encoding apparatus according to the second embodiment. The encoding apparatus 800 according to the second embodiment performs encoding with the same configuration as the encoding apparatus 500 of the first embodiment, but the processing content of the complexity calculation unit 810 is different, and accordingly the bit allocation determination unit 407 There is also a change in the bit allocation method. Therefore, the PE value calculation unit 505, the PE ratio calculation unit 506, and the bit allocation determination unit 407, which are features of the encoding apparatus 800, will be described in detail. In addition, since the other configuration is the same as that of the encoding apparatus 500, the same reference numerals are given and description thereof is omitted.

図8−2は、実施の形態2にかかる符号化装置の符号化処理の手順を示すフローチャートである。図8−2のフローチャートにおいて、ステップS821〜ステップS824は、図5−2に示したフローチャートのステップS521〜ステップS524と同様の処理を行う。つぎに、複雑度計算部810における処理を説明する。   FIG. 8-2 is a flowchart of an encoding process performed by the encoding apparatus according to the second embodiment. In the flowchart of FIG. 8B, steps S821 to S824 perform the same processes as steps S521 to S524 of the flowchart shown in FIG. Next, processing in the complexity calculator 810 will be described.

許容量誤差計算部503における許容量誤差計算(ステップS825)と、電力計算部504における電力計算(ステップS826)は、図5−2に示したフローチャートのステップS525、ステップS526と同様の処理を行う。つぎに、PE値計算部505によってPE値計算を行う(ステップS827)。ここで、PE値計算部505には、許容誤差計算部503から和信号Mの許容誤差電力n_mと、修正差信号S’の許容誤差電力n_sが入力され、電力計算部504から、和信号Mの電力e_mと、修正差信号S’の電力e_sとが入力される。   The tolerance error calculation (step S825) in the tolerance error calculation unit 503 and the power calculation (step S826) in the power calculation unit 504 perform the same processing as steps S525 and S526 in the flowchart shown in FIG. . Next, the PE value calculation unit 505 performs PE value calculation (step S827). Here, the allowable error power n_m of the sum signal M and the allowable error power n_s of the corrected difference signal S ′ are input from the allowable error calculator 503 to the PE value calculator 505, and the sum signal M is input from the power calculator 504. Power e_m and the power e_s of the corrected difference signal S ′ are input.

そして、実施の形態2のPE値計算部505は、下記(7)式を用いて、和信号Mの許容誤差電力n_mと、和信号Mの電力e_mとから和信号Mの複雑度PE_m(i)を求める。同様に、実施の形態2のPE値計算部505は、下記(8)式を用いて修正差信号S’の許容誤差電力n_sと、修正差信号S’の電力e_sとから修正差信号S’の複雑度PE_s(i)を求める。   Then, the PE value calculation unit 505 of the second embodiment uses the following equation (7) to calculate the complexity PE_m (i of the sum signal M from the allowable error power n_m of the sum signal M and the power e_m of the sum signal M. ) Similarly, the PE value calculation unit 505 of the second embodiment uses the following equation (8) to calculate the corrected difference signal S ′ from the allowable error power n_s of the corrected difference signal S ′ and the power e_s of the corrected difference signal S ′. The complexity PE_s (i) is obtained.

Figure 2007183528
Figure 2007183528

つぎに、PE比計算部506によって、PE比計算を行う(ステップS828)。PE比計算部506には、PE値計算部505から和信号Mの複雑度PE_m(i)と、修正差信号S’の複雑度PE_s(i)が入力される。そして、PE比計算部506は、和信号Mの複雑度PE_mに対する修正差信号S’の複雑度PE_sの割合を下記(9)式によって求め、複雑度の比(PE比)をpe_ratioとしてビット割り当て決定部407へ出力する。さらに、PE値計算部505によって求められた和信号Mの複雑度PE_m(i)をビット割り当て決定部407へ出力する。ここまでのステップにより、複雑度計算部810の処理が終了する。   Next, the PE ratio calculation unit 506 performs PE ratio calculation (step S828). The PE ratio calculation unit 506 receives the complexity PE_m (i) of the sum signal M and the complexity PE_s (i) of the correction difference signal S ′ from the PE value calculation unit 505. Then, the PE ratio calculation unit 506 obtains the ratio of the complexity PE_s of the modified difference signal S ′ to the complexity PE_m of the sum signal M by the following equation (9), and assigns the bit as the complexity ratio (PE ratio) as pe_ratio. The data is output to the determination unit 407. Further, the complexity PE_m (i) of the sum signal M obtained by the PE value calculation unit 505 is output to the bit allocation determination unit 407. With the steps so far, the processing of the complexity calculation unit 810 ends.

Figure 2007183528
Figure 2007183528

続いて、ビット割り当て決定部407における処理について説明する。まず、修正差信号S’(f)の総ビット数を決定し(ステップS829)、続いて、和信号M(f)の総ビット数を決定する(ステップS830)。修正差信号S’(f)の総ビット数を決定する具体的な手順としては、実施の形態1と同様に、まず、複雑度PE_ratioに応じて、修正差信号S’(f)の量子化ビット数bit_sをあらかじめ定めておく。つぎに、1フレームで使用できる量子化ビット数bit_totalからbit_sを引いた残りを和信号Mの量子化ビット数bit_mとする。ここで、和信号Mの各周波数帯域に分配するビット数の上限を決定しておく。   Next, processing in the bit allocation determination unit 407 will be described. First, the total number of bits of the modified difference signal S ′ (f) is determined (step S829), and then the total number of bits of the sum signal M (f) is determined (step S830). As a specific procedure for determining the total number of bits of the corrected difference signal S ′ (f), as in the first embodiment, first, the quantization of the corrected difference signal S ′ (f) is performed according to the complexity PE_ratio. The number of bits bit_s is determined in advance. Next, the remainder obtained by subtracting bit_s from the number of quantization bits bit_total usable in one frame is set as the number of quantization bits bit_m of the sum signal M. Here, the upper limit of the number of bits distributed to each frequency band of the sum signal M is determined.

続いて、重み係数w_m(i)を決定する(ステップS831)。図9は、複雑度PE_mと重み係数w_mの関係を示す図表である。図表900は、横軸が複雑度PE_m(i)を表し、縦軸が重み係数w_m(i)を表す。また、曲線901は、複雑度PE_mと重み係数w_mの関係を示している。和信号Mの各周波数帯域に分配するビット数の上限を決定するには、曲線901のような関係をあらかじめ定めておく。各周波数帯域iについて複雑度PE_m(i)の値と図表900の関係から重み係数w_m(i)を決定する。   Subsequently, a weight coefficient w_m (i) is determined (step S831). FIG. 9 is a chart showing the relationship between the complexity PE_m and the weighting factor w_m. In the chart 900, the horizontal axis represents the complexity PE_m (i), and the vertical axis represents the weighting factor w_m (i). A curve 901 indicates the relationship between the complexity PE_m and the weight coefficient w_m. In order to determine the upper limit of the number of bits distributed to each frequency band of the sum signal M, a relationship like a curve 901 is determined in advance. For each frequency band i, the weighting factor w_m (i) is determined from the relationship between the value of the complexity PE_m (i) and the chart 900.

つぎに、重み係数の総和sum_wの算出を行う(ステップS832)重み係数w_m(i)の総和sum_wは、下記(10)式を用いて求める。さらに、重み係数の修正を行うために、下記(11)式を用いて重み係数w_m(i)を正規化(w_m2(i))する。なお、総和で正規化するため、w_m2の総和は1になる。   Next, the summation sum_w of the weighting coefficients is calculated (step S832). The summation sum_w of the weighting coefficient w_m (i) is obtained using the following equation (10). Further, in order to correct the weighting factor, the weighting factor w_m (i) is normalized (w_m2 (i)) using the following equation (11). Since the sum is normalized by the sum, the sum of w_m2 is 1.

Figure 2007183528
Figure 2007183528

その後、和信号Mの各周波数帯域に分配するビット数の上限bit_m(i)を、下記(12)式を用いて決定し、ビット割り当て決定部407の処理を終了する。   Thereafter, the upper limit bit_m (i) of the number of bits distributed to each frequency band of the sum signal M is determined using the following equation (12), and the processing of the bit allocation determination unit 407 is terminated.

Figure 2007183528
Figure 2007183528

以上のようにして求めたビット数に応じて、和信号量子化器408ではビット数bit_mで和信号M(f)の量子化を行い(ステップS834)、差信号量子化器409ではビット数bit_sで修正差信号S’(f)の量子化を行い(ステップS835)、一連の処理を終了する。   In accordance with the number of bits obtained as described above, the sum signal quantizer 408 quantizes the sum signal M (f) with the bit number bit_m (step S834), and the difference signal quantizer 409 performs the bit number bit_s. Then, the corrected difference signal S ′ (f) is quantized (step S835), and the series of processing ends.

(実施の形態3)
実施の形態3は、和信号M(f)と、修正差信号S’(f)との電力の比に基づいて和信号M(f)と、修正差信号S’(f)とのビット数の分配の割合を決定する。したがって、実施の形態3にかかる符号化装置1000は、実施の形態1において説明した符号化装置500の複雑度計算部510を簡易化した複雑度計算部1010を備えた構成からなる。
(Embodiment 3)
In the third embodiment, the number of bits of the sum signal M (f) and the corrected difference signal S ′ (f) based on the power ratio of the sum signal M (f) and the corrected difference signal S ′ (f). Determine the proportion of distribution. Therefore, the encoding apparatus 1000 according to the third embodiment has a configuration including a complexity calculation unit 1010 obtained by simplifying the complexity calculation unit 510 of the encoding apparatus 500 described in the first embodiment.

図10−1は、実施の形態3にかかる符号化装置の構成を示すブロック図である。図10−1に示した符号化装置1000は、図5−1に示した符号化装置500の複雑度計算部510に代わり、複雑度計算部1010を備えている。この複雑度計算部1010は、電力計算部504と、電力比計算部1001とによって構成される。なお、符号化装置1000の他の構成は、符号化装置500と同じであるため、同一の符号を付して説明を省略する。また、ビット割り当て決定部407は、複雑度計算部1010によって計算された複雑度に応じてビット割り当てを決定する。   FIG. 10A is a block diagram of the configuration of the encoding apparatus according to the third embodiment. The encoding apparatus 1000 illustrated in FIG. 10A includes a complexity calculation unit 1010 instead of the complexity calculation unit 510 of the encoding apparatus 500 illustrated in FIG. The complexity calculation unit 1010 includes a power calculation unit 504 and a power ratio calculation unit 1001. Since the other configuration of the encoding apparatus 1000 is the same as that of the encoding apparatus 500, the same reference numerals are given and description thereof is omitted. Also, the bit allocation determination unit 407 determines bit allocation according to the complexity calculated by the complexity calculation unit 1010.

続いて、実施の形態3にかかる符号化装置1000の符号化処理の手順を説明する。図10−2は、実施の形態3にかかる符号化装置の符号化処理の手順を示すフローチャートである。図10−2のフローチャートにおいて、まず、MDCT501およびMDCT502において、左右のステレオ信号L(t),R(t)のMDCT変換を行う(ステップS1021)。   Subsequently, the procedure of the encoding process of the encoding apparatus 1000 according to the third embodiment will be described. FIG. 10-2 is a flowchart of an encoding process performed by the encoding apparatus according to the third embodiment. 10-2, first, MDCT conversion of the left and right stereo signals L (t) and R (t) is performed in the MDCT 501 and the MDCT 502 (step S1021).

続いて、MSステレオ変換部403によって、左右のスペクトル信号L(f),R(f)にMSステレオ変換を行う(ステップS1022)。また、類似度計算部404においては、左右のステレオ信号L(t),R(t)の相関に基づいて和信号M(f)と差信号S(f)との類似度(相関cor(i))を計算する(ステップS1023)。そして、ステップS1021において計算された類似度(相関cor(i))に基づいて、差信号修正部405によって差信号S(f)を修正する(ステップS1024)。   Subsequently, the MS stereo conversion unit 403 performs MS stereo conversion on the left and right spectrum signals L (f) and R (f) (step S1022). Further, the similarity calculation unit 404 determines the similarity (correlation cor (i)) between the sum signal M (f) and the difference signal S (f) based on the correlation between the left and right stereo signals L (t) and R (t). )) Is calculated (step S1023). Then, based on the similarity (correlation cor (i)) calculated in step S1021, the difference signal correcting unit 405 corrects the difference signal S (f) (step S1024).

つぎに、複雑度計算部1010における処理について説明する。まず、電力計算部504によって、和信号M(f)と修正差信号S’(f)との電力計算を行う(ステップS1025)。電力計算部504で計算された和信号Mの電力e_mと、修正差信号S’の電力e_sとは、電力比計算部1001に出力される。なお、複雑度計算部1010は、上述したような電力比の計算に替わって、電力差を求め、ビット割り当て決定部407に出力してもよい。さらに、電力比、または電力差を求める際には、各信号の全周波数帯域の電力の合計や平均を用いてもよい。   Next, processing in the complexity calculator 1010 will be described. First, the power calculator 504 calculates the power of the sum signal M (f) and the corrected difference signal S ′ (f) (step S1025). The power e_m of the sum signal M calculated by the power calculation unit 504 and the power e_s of the correction difference signal S ′ are output to the power ratio calculation unit 1001. Note that the complexity calculation unit 1010 may obtain a power difference instead of calculating the power ratio as described above, and output the power difference to the bit allocation determination unit 407. Furthermore, when calculating | requiring a power ratio or a power difference, you may use the sum total and average of the electric power of all the frequency bands of each signal.

続いて、電力比計算部1001によって、和信号Mの電力e_mと、修正差信号S’の電力e_sとの電力比を計算する(ステップS1026)。和信号Mと、修正差信号S’との電力比pow_ratioは、e_s/e_mによって求められる。そして、求められた電力比pow_ratioは、ビット割り当て決定部407に出力される。   Subsequently, the power ratio calculation unit 1001 calculates the power ratio between the power e_m of the sum signal M and the power e_s of the correction difference signal S ′ (step S1026). The power ratio pow_ratio between the sum signal M and the corrected difference signal S ′ is obtained by e_s / e_m. Then, the obtained power ratio pow_ratio is output to the bit allocation determination unit 407.

つぎに、ビット割り当て決定部407における処理について説明する。まず、修正差信号S’(f)の総ビット数を決定し(ステップS1027)、続いて、和信号M(f)の総ビット数を決定する(ステップS1028)。修正差信号S’(f)の総ビット数を決定する具体的な手順としては、電力比pow_ratioビット数と修正差信号S’(f)とのビット配分の関係をあらかじめ定めておく手順がある。   Next, processing in the bit allocation determination unit 407 will be described. First, the total number of bits of the modified difference signal S ′ (f) is determined (step S1027), and then the total number of bits of the sum signal M (f) is determined (step S1028). As a specific procedure for determining the total number of bits of the correction difference signal S ′ (f), there is a procedure for predetermining the bit distribution relationship between the power ratio pow_ratio bit number and the correction difference signal S ′ (f). .

図11は、電力比pow_ratioとビット配分の関係の一例を示す図表である。図表1100は、横軸が電力比pow_ratioを表し、縦軸が修正差信号S’のビット配分量を表す。また、曲線1101は、電力比pow_ratioとビット配分の関係を示している。ビット割り当て決定部407は、図表1100のような、電力比pow_ratioとビット配分の関係をあらかじめ定めておく。具体的には、電力比pow_ratioの値が大きいときには、修正差信号S’のビット数分配を多くし、電力比pow_ratioの値が小さいときには、修正差信号S’のビット数分配を少なくする。つまり、修正差信号S’の電力の大きい帯域に多くのビット数を分配するような、曲線1101を設定しておく。   FIG. 11 is a chart showing an example of the relationship between the power ratio pow_ratio and bit allocation. In the chart 1100, the horizontal axis represents the power ratio pow_ratio, and the vertical axis represents the bit allocation amount of the correction difference signal S '. A curve 1101 shows the relationship between the power ratio pow_ratio and bit allocation. The bit allocation determining unit 407 previously determines the relationship between the power ratio pow_ratio and the bit allocation as shown in the chart 1100. Specifically, when the value of the power ratio pow_ratio is large, the bit number distribution of the correction difference signal S ′ is increased, and when the value of the power ratio pow_ratio is small, the bit number distribution of the correction difference signal S ′ is decreased. That is, the curve 1101 is set so that a large number of bits are distributed to the band where the power of the correction difference signal S ′ is large.

和信号Mのビット数は、ステップS1027によって決定された修正差信号S’(f)のビット数の分配に基づいて決定される。具体的には、1フレーム当たりの量子化ビット数をbit_totalとすると、図11の曲線1101によって修正差信号S’のビット数bit_sを求め、bit_totalから修正差信号S’のビット数bit_sを引き、和信号Mのビット数bit_mを求める(bit_m=bit_total−bit_s)。   The number of bits of the sum signal M is determined based on the distribution of the number of bits of the modified difference signal S ′ (f) determined in step S1027. Specifically, assuming that the number of quantization bits per frame is bit_total, the number of bits bit_s of the modified difference signal S ′ is obtained from the curve 1101 in FIG. 11, and the number of bits bit_s of the modified difference signal S ′ is subtracted from bit_total. The number of bits bit_m of the sum signal M is obtained (bit_m = bit_total−bit_s).

以上のようにして求めたビット数に応じて、和信号量子化器408ではビット数bit_mで和信号M(f)の量子化を行い(ステップS1029)、差信号量子化器409ではビット数bit_sで修正差信号S’(f)の量子化を行い(ステップS1030)、一連の処理を終了する。   In accordance with the number of bits obtained as described above, the sum signal quantizer 408 quantizes the sum signal M (f) with the bit number bit_m (step S1029), and the difference signal quantizer 409 performs the bit number bit_s. Then, the corrected difference signal S ′ (f) is quantized (step S1030), and the series of processes is terminated.

以上説明したように、符号化装置、符号化方法、および符号化プログラムによれば、低ビットレート条件であっても音質劣化の少ない、高音質な音声(音楽)として再生することができる。   As described above, according to the encoding device, the encoding method, and the encoding program, it is possible to reproduce high-quality sound (music) with little deterioration in sound quality even under a low bit rate condition.

なお、本実施の形態1〜3で説明した符号化方法は、あらかじめ用意されたプログラムをパーソナル・コンピュータやワークステーションなどのコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVDなどのコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネットなどのネットワークを介して配布することが可能な伝送媒体であってもよい。   Note that the encoding methods described in the first to third embodiments can be realized by executing a program prepared in advance on a computer such as a personal computer or a workstation. This program is recorded on a computer-readable recording medium such as a hard disk, a flexible disk, a CD-ROM, an MO, and a DVD, and is executed by being read from the recording medium by the computer. The program may be a transmission medium that can be distributed via a network such as the Internet.

(付記1)ステレオ信号の左成分信号と右成分信号との和信号と、差信号とを用いてステレオ信号を圧縮する符号化装置において、
前記和信号の複雑度と、前記差信号の複雑度とをそれぞれ求める複雑度算出手段と、
前記複雑度算出手段によって求めた複雑度に応じて前記和信号と、前記差信号とをそれぞれ量子化する際のビット数の分配割合を設定するビット数設定手段と、
前記ビット数設定手段によって決定された前記分配割合に応じて前記和信号と、前記差信号をそれぞれ量子化する量子化手段と、
を備えることを特徴とする符号化装置。
(Supplementary note 1) In an encoding apparatus that compresses a stereo signal using a sum signal of a left component signal and a right component signal of a stereo signal and a difference signal,
Complexity calculation means for respectively determining the complexity of the sum signal and the complexity of the difference signal;
A bit number setting means for setting a distribution ratio of the number of bits when each of the sum signal and the difference signal is quantized according to the complexity obtained by the complexity calculating means;
Quantization means for quantizing each of the sum signal and the difference signal according to the distribution ratio determined by the bit number setting means,
An encoding device comprising:

(付記2)前記複雑度算出手段の前段にモノラル化手段を備え、
前記モノラル化手段は、周波数帯ごとに前記差信号の出力を所定の閾値と比較する比較手段と、
前記比較手段による比較結果における前記差信号が前記閾値よりも低い場合には、前記差信号の値を零に修正する修正手段と、
を備えることを特徴とする付記1に記載の符号化装置。
(Supplementary Note 2) A monaural unit is provided before the complexity calculating unit.
The monaural unit includes a comparing unit that compares the output of the difference signal with a predetermined threshold value for each frequency band;
A correction means for correcting the value of the difference signal to zero when the difference signal in the comparison result by the comparison means is lower than the threshold;
The encoding apparatus according to Supplementary Note 1, further comprising:

(付記3)前記ビット数設定手段は、所定のビット数を、所定の間隔で時分割されたフレームごとの前記和信号および前記差信号に分配することを特徴とする付記1または2に記載の符号化装置。 (Supplementary note 3) The supplementary note 1 or 2, wherein the bit number setting means distributes a predetermined number of bits to the sum signal and the difference signal for each frame time-divided at a predetermined interval. Encoding device.

(付記4)前記ビット数設定手段は、前記量子化手段によって量子化を行う際に、複雑度の低い信号にはビット数の分配割合を低くし、複雑度の高い信号にはビット数の分配割合を高くすることを特徴とする付記1〜3のいずれか一つに記載の符号化装置。 (Supplementary Note 4) When the quantization is performed by the quantization unit, the bit number setting unit reduces the bit number distribution ratio for a low complexity signal and distributes the bit number for a high complexity signal. The encoding device according to any one of appendices 1 to 3, wherein the ratio is increased.

(付記5)前記複雑度算出手段は、前記和信号と、前記差信号とのそれぞれの心理聴覚エントロピー値(PE値)を求め、前記和信号および前記差信号のPE値の比もしくは差を複雑度とすることを特徴とする付記1〜4のいずれか一つに記載の符号化装置。 (Additional remark 5) The said complexity calculation means calculates | requires each psychoacoustic entropy value (PE value) of the said sum signal and the said difference signal, Complicates the ratio or difference of the PE value of the said sum signal and the said difference signal. The encoding device according to any one of supplementary notes 1 to 4, wherein the encoding device is a degree.

(付記6)前記複雑度算出手段は、前記和信号および前記差信号の全周波数帯域のPE値の平均もしくは合計から前記複雑度を求めることを特徴とする付記5に記載の符号化装置。 (Additional remark 6) The said complexity calculation means calculates | requires the said complexity from the average or the sum total of PE value of all the frequency bands of the said sum signal and the said difference signal, The encoding apparatus of Additional remark 5 characterized by the above-mentioned.

(付記7)前記複雑度算出手段は、前記和信号と、前記差信号とのそれぞれの電力値を求め、前記和信号と、前記差信号との電力値の比もしくは差を複雑度とすることを特徴とする付記1〜4のいずれか一つに記載の符号化装置。 (Supplementary note 7) The complexity calculation means obtains respective power values of the sum signal and the difference signal, and sets the ratio or difference of the power values of the sum signal and the difference signal as complexity. The encoding device according to any one of appendices 1 to 4, characterized by:

(付記8)前記複雑度算出手段は、前記和信号および前記差信号の全周波数帯域の電力値の平均もしくは合計から前記複雑度を求めることを特徴とする付記7に記載の符号化装置。 (Additional remark 8) The said complexity calculation means calculates | requires the said complexity from the average or the sum total of the electric power value of the all frequency band of the said sum signal and the said difference signal, The encoding apparatus of Additional remark 7 characterized by the above-mentioned.

(付記9)前記ビット数設定手段は、あらかじめ定めた前記差信号の複雑度と前記分配割合との対応関係に応じてビット数の分配割合を設定することを特徴とする付記1〜8のいずれか一つに記載の符号化装置。 (Supplementary note 9) Any one of Supplementary notes 1 to 8, wherein the bit number setting means sets a distribution ratio of the number of bits according to a predetermined correspondence relationship between the complexity of the difference signal and the distribution ratio. The encoding device according to claim 1.

(付記10)前記ビット数設定手段は、あらかじめ定めた前記和信号の複雑度と前記分配割合との対応関係に応じてビット数の分配割合を設定することを特徴とする付記1〜8のいずれか一つに記載の符号化装置。 (Supplementary note 10) Any one of Supplementary notes 1 to 8, wherein the bit number setting means sets a distribution ratio of the number of bits according to a predetermined correspondence relationship between the complexity of the sum signal and the distribution ratio. The encoding device according to claim 1.

(付記11)ステレオ信号の左成分信号と右成分信号との和信号と、差信号とを用いてステレオ信号を圧縮する符号化方法において、
前記和信号の複雑度と、前記差信号の複雑度とをそれぞれ求める複雑度算出工程と、
前記複雑度算出工程によって求めた複雑度に応じて前記和信号と、前記差信号とをそれぞれ量子化する際のビット数の分配割合を設定するビット数設定工程と、
前記ビット数設定工程によって決定された前記分配割合に応じて前記和信号と、前記差信号をそれぞれ量子化する量子化工程と、
を含むことを特徴とする符号化方法。
(Supplementary note 11) In an encoding method for compressing a stereo signal using a sum signal of a left component signal and a right component signal of a stereo signal and a difference signal,
A complexity calculation step for determining the complexity of the sum signal and the complexity of the difference signal;
A bit number setting step for setting a distribution ratio of the number of bits when each of the sum signal and the difference signal is quantized according to the complexity obtained by the complexity calculation step;
A quantization step of quantizing the sum signal and the difference signal according to the distribution ratio determined by the bit number setting step;
The encoding method characterized by including.

(付記12)ステレオ信号の左成分信号と右成分信号との和信号と、差信号とを用いてステレオ信号を圧縮する符号化プログラムにおいて、
前記和信号の複雑度と、前記差信号の複雑度とをそれぞれ求める複雑度算出工程と、
前記複雑度算出工程によって求めた複雑度に応じて前記和信号と、前記差信号とをそれぞれ量子化する際のビット数の分配割合を設定するビット数設定工程と、
前記ビット数設定工程によって決定された前記分配割合に応じて前記和信号と、前記差信号をそれぞれ量子化する量子化工程と、
をコンピュータに実行させることを特徴とする符号化プログラム。
(Additional remark 12) In the encoding program which compresses a stereo signal using the sum signal of the left component signal and right component signal of a stereo signal, and a difference signal,
A complexity calculation step for determining the complexity of the sum signal and the complexity of the difference signal;
A bit number setting step of setting a distribution ratio of the number of bits when each of the sum signal and the difference signal is quantized according to the complexity obtained by the complexity calculation step;
A quantization step of quantizing the sum signal and the difference signal according to the distribution ratio determined by the bit number setting step;
An encoding program for causing a computer to execute.

以上のように、本発明にかかる符号化装置、符号化方法、および符号化プログラムは、ステレオ音声データの圧縮に有用であり、特に、低ビットレートの圧縮条件に適している。   As described above, the encoding apparatus, the encoding method, and the encoding program according to the present invention are useful for compressing stereo audio data, and are particularly suitable for low bit rate compression conditions.

通常のモノラル化を示す説明図である。It is explanatory drawing which shows normal monauralization. 和信号Mの複雑度に応じてビット数を振り分ける方法を示す説明図である。It is explanatory drawing which shows the method of distributing bit number according to the complexity of the sum signal M. 差信号Sの複雑度に応じてビット数を振り分ける方法を示す説明図である。4 is an explanatory diagram showing a method of distributing the number of bits according to the complexity of the difference signal S. FIG. 本発明にかかる符号化装置の基本構成を示すブロック図である。It is a block diagram which shows the basic composition of the encoding apparatus concerning this invention. 実施の形態1にかかる符号化装置の構成を示すブロック図である。1 is a block diagram showing a configuration of an encoding apparatus according to a first embodiment. 実施の形態1にかかる符号化装置の符号化処理の手順を示すフローチャートである。3 is a flowchart illustrating a procedure of encoding processing of the encoding device according to the first exemplary embodiment; 信号の帯域の上限と下限の関係を示す図表である。It is a graph which shows the relationship between the upper limit and the lower limit of the band of a signal. PE比とビット分配の関係を示す図表である。It is a graph which shows the relationship between PE ratio and bit distribution. 実施の形態2にかかる符号化装置の構成を示すブロック図である。FIG. 3 is a block diagram illustrating a configuration of an encoding apparatus according to a second embodiment. 実施の形態2にかかる符号化装置の符号化処理の手順を示すフローチャートである。10 is a flowchart illustrating a procedure of encoding processing of the encoding device according to the second exemplary embodiment; 複雑度PE_mと重み係数w_mの関係を示す図表である。It is a graph which shows the relationship between complexity PE_m and weighting factor w_m. 実施の形態3にかかる符号化装置の構成を示すブロック図である。FIG. 6 is a block diagram illustrating a configuration of an encoding apparatus according to a third embodiment. 実施の形態3にかかる符号化装置の符号化処理の手順を示すフローチャートである。10 is a flowchart illustrating a procedure of encoding processing of the encoding device according to the third exemplary embodiment; 電力比pow_ratioとビット配分の関係の一例を示す図表である。It is a graph which shows an example of the relationship between power ratio pow_ratio and bit allocation. MSステレオ符号化の符号化手順を示すブロック図である。It is a block diagram which shows the encoding procedure of MS stereo encoding. 適応モノラル化の原理を示す説明図である。It is explanatory drawing which shows the principle of adaptive monauralization.

符号の説明Explanation of symbols

400 符号化装置
401 L直交変換部
402 R直交変換部
403 MSステレオ変換部
404 類似度計算部
405 差信号修正部
406 複雑度計算部
407 ビット割り当て決定部
408 和信号量子化器
409 差信号量子化器
400 Encoder 401 L Orthogonal Transformer 402 R Orthogonal Transformer 403 MS Stereo Transformer 404 Similarity Calculation Unit 405 Difference Signal Correction Unit 406 Complexity Calculation Unit 407 Bit Allocation Determination Unit 408 Sum Signal Quantizer 409 Difference Signal Quantization vessel

Claims (10)

ステレオ信号の左成分信号と右成分信号との和信号と、差信号とを用いてステレオ信号を圧縮する符号化装置において、
前記和信号の複雑度と、前記差信号の複雑度とをそれぞれ求める複雑度算出手段と、
前記複雑度算出手段によって求めた複雑度に応じて前記和信号と、前記差信号とをそれぞれ量子化する際のビット数の分配割合を設定するビット数設定手段と、
前記ビット数設定手段によって決定された前記分配割合に応じて前記和信号と、前記差信号をそれぞれ量子化する量子化手段と、
を備えることを特徴とする符号化装置。
In an encoding device that compresses a stereo signal using a sum signal of a left component signal and a right component signal of a stereo signal and a difference signal,
Complexity calculation means for respectively determining the complexity of the sum signal and the complexity of the difference signal;
A bit number setting means for setting a distribution ratio of the number of bits when each of the sum signal and the difference signal is quantized according to the complexity obtained by the complexity calculating means;
Quantization means for quantizing each of the sum signal and the difference signal according to the distribution ratio determined by the bit number setting means,
An encoding device comprising:
前記複雑度算出手段の前段にモノラル化手段を備え、
前記モノラル化手段は、周波数帯ごとに前記差信号の出力を所定の閾値と比較する比較手段と、
前記比較手段による比較結果における前記差信号が前記閾値よりも低い場合には、前記差信号の値を零に修正する修正手段と、
を備えることを特徴とする請求項1に記載の符号化装置。
A monaural unit is provided before the complexity calculating unit,
The monaural unit includes a comparison unit that compares the output of the difference signal with a predetermined threshold for each frequency band;
A correction means for correcting the value of the difference signal to zero when the difference signal in the comparison result by the comparison means is lower than the threshold;
The encoding apparatus according to claim 1, further comprising:
前記ビット数設定手段は、所定のビット数を、所定の間隔で時分割されたフレームごとの前記和信号および前記差信号に分配することを特徴とする請求項1または2に記載の符号化装置。   3. The encoding apparatus according to claim 1, wherein the bit number setting unit distributes a predetermined number of bits to the sum signal and the difference signal for each frame time-divided at a predetermined interval. . 前記ビット数設定手段は、前記量子化手段によって量子化を行う際に、複雑度の低い信号にはビット数の分配割合を低くし、複雑度の高い信号にはビット数の分配割合を高くすることを特徴とする請求項1〜3のいずれか一つに記載の符号化装置。   When the quantization is performed by the quantization unit, the bit number setting unit lowers the bit number distribution ratio for a low complexity signal and increases the bit number distribution ratio for a high complexity signal. The encoding apparatus according to any one of claims 1 to 3, wherein 前記複雑度算出手段は、前記和信号と、前記差信号とのそれぞれの心理聴覚エントロピー値(PE値)を求め、前記和信号および前記差信号のPE値の比もしくは差を複雑度とすることを特徴とする請求項1〜4のいずれか一つに記載の符号化装置。   The complexity calculation means obtains a psychoacoustic entropy value (PE value) of each of the sum signal and the difference signal, and sets a ratio or difference between the sum signal and the PE value of the difference signal as the complexity. The encoding device according to any one of claims 1 to 4, wherein: 前記複雑度算出手段は、前記和信号および前記差信号の全周波数帯域のPE値の平均もしくは合計から前記複雑度を求めることを特徴とする請求項5に記載の符号化装置。   6. The encoding apparatus according to claim 5, wherein the complexity calculation unit obtains the complexity from an average or a sum of PE values in all frequency bands of the sum signal and the difference signal. 前記複雑度算出手段は、前記和信号と、前記差信号とのそれぞれの電力値を求め、前記和信号と、前記差信号との電力値の比もしくは差を複雑度とすることを特徴とする請求項1〜4のいずれか一つに記載の符号化装置。   The complexity calculating means obtains respective power values of the sum signal and the difference signal, and uses a ratio or difference between the power values of the sum signal and the difference signal as complexity. The encoding apparatus as described in any one of Claims 1-4. 前記複雑度算出手段は、前記和信号および前記差信号の全周波数帯域の電力値の平均もしくは合計から前記複雑度を求めることを特徴とする請求項7に記載の符号化装置。   The encoding apparatus according to claim 7, wherein the complexity calculation unit obtains the complexity from an average or a sum of power values in all frequency bands of the sum signal and the difference signal. ステレオ信号の左成分信号と右成分信号との和信号と、差信号とを用いてステレオ信号を圧縮する符号化方法において、
前記和信号の複雑度と、前記差信号の複雑度とをそれぞれ求める複雑度算出工程と、
前記複雑度算出工程によって求めた複雑度に応じて前記和信号と、前記差信号とをそれぞれ量子化する際のビット数の分配割合を設定するビット数設定工程と、
前記ビット数設定工程によって決定された前記分配割合に応じて前記和信号と、前記差信号をそれぞれ量子化する量子化工程と、
を含むことを特徴とする符号化方法。
In an encoding method for compressing a stereo signal using a sum signal of a left component signal and a right component signal of a stereo signal and a difference signal,
A complexity calculation step for determining the complexity of the sum signal and the complexity of the difference signal;
A bit number setting step for setting a distribution ratio of the number of bits when each of the sum signal and the difference signal is quantized according to the complexity obtained by the complexity calculation step;
A quantization step of quantizing the sum signal and the difference signal according to the distribution ratio determined by the bit number setting step;
The encoding method characterized by including.
ステレオ信号の左成分信号と右成分信号との和信号と、差信号とを用いてステレオ信号を圧縮する符号化プログラムにおいて、
前記和信号の複雑度と、前記差信号の複雑度とをそれぞれ求める複雑度算出工程と、
前記複雑度算出工程によって求めた複雑度に応じて前記和信号と、前記差信号とをそれぞれ量子化する際のビット数の分配割合を設定するビット数設定工程と、
前記ビット数設定工程によって決定された前記分配割合に応じて前記和信号と、前記差信号をそれぞれ量子化する量子化工程と、
をコンピュータに実行させることを特徴とする符号化プログラム。
In an encoding program for compressing a stereo signal using a sum signal of a left component signal and a right component signal of a stereo signal and a difference signal,
A complexity calculation step for determining the complexity of the sum signal and the complexity of the difference signal;
A bit number setting step of setting a distribution ratio of the number of bits when each of the sum signal and the difference signal is quantized according to the complexity obtained by the complexity calculation step;
A quantization step for quantizing the sum signal and the difference signal according to the distribution ratio determined by the bit number setting step;
An encoding program for causing a computer to execute.
JP2006117345A 2005-12-06 2006-04-21 Encoding apparatus, encoding method, and encoding program Pending JP2007183528A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006117345A JP2007183528A (en) 2005-12-06 2006-04-21 Encoding apparatus, encoding method, and encoding program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005352470 2005-12-06
JP2006117345A JP2007183528A (en) 2005-12-06 2006-04-21 Encoding apparatus, encoding method, and encoding program

Publications (1)

Publication Number Publication Date
JP2007183528A true JP2007183528A (en) 2007-07-19

Family

ID=38339676

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006117345A Pending JP2007183528A (en) 2005-12-06 2006-04-21 Encoding apparatus, encoding method, and encoding program

Country Status (1)

Country Link
JP (1) JP2007183528A (en)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009530653A (en) * 2006-03-13 2009-08-27 フランス テレコム Method for encoding sound source signal, corresponding encoding device, decoding method and device, signal, computer program product
JP2012141412A (en) * 2010-12-28 2012-07-26 Fujitsu Ltd Encoder, encoding method, and encoding program
EP2618330A2 (en) 2012-01-18 2013-07-24 Fujitsu Limited Audio coding device and method
EP2690622A1 (en) 2012-07-24 2014-01-29 Fujitsu Limited Audio decoding device and audio decoding method
US8818539B2 (en) 2009-07-03 2014-08-26 Fujitsu Limited Audio encoding device, audio encoding method, and video transmission device
US8818764B2 (en) 2010-03-30 2014-08-26 Fujitsu Limited Downmixing device and method
EP2770505A1 (en) 2013-02-20 2014-08-27 Fujitsu Limited Audio coding device and method
US8831960B2 (en) 2011-08-30 2014-09-09 Fujitsu Limited Audio encoding device, audio encoding method, and computer-readable recording medium storing audio encoding computer program for encoding audio using a weighted residual signal
US8862479B2 (en) 2010-01-20 2014-10-14 Fujitsu Limited Encoder, encoding system, and encoding method
EP2876640A2 (en) 2013-11-22 2015-05-27 Fujitsu Limited Audio encoding device and audio coding method
US9111533B2 (en) 2010-11-30 2015-08-18 Fujitsu Limited Audio coding device, method, and computer-readable recording medium storing program
WO2020009082A1 (en) * 2018-07-03 2020-01-09 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ Encoding device and encoding method
JP2021047431A (en) * 2015-09-25 2021-03-25 ヴォイスエイジ・コーポレーション Method and system using long-term correlation difference between left and right channels for time domain down-mixing stereo audio signal into primary and secondary channels

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0787033A (en) * 1993-09-17 1995-03-31 Sharp Corp Stereo audio signal coder
JP2001053617A (en) * 1999-08-05 2001-02-23 Ricoh Co Ltd Device and method for digital sound single encoding and medium where digital sound signal encoding program is recorded
JP2001255892A (en) * 2000-03-13 2001-09-21 Nippon Telegr & Teleph Corp <Ntt> Coding method of stereophonic signal
JP2002268694A (en) * 2001-03-13 2002-09-20 Nippon Hoso Kyokai <Nhk> Method and device for encoding stereophonic signal
JP2003044096A (en) * 2001-08-03 2003-02-14 Matsushita Electric Ind Co Ltd Method and device for encoding multi-channel audio signal, recording medium and music distribution system
JP2003516555A (en) * 1999-12-08 2003-05-13 フラオホッフェル−ゲゼルシャフト ツル フェルデルング デル アンゲヴァンドテン フォルシュング エー.ヴェー. Stereo sound signal processing method and apparatus
JP2003271199A (en) * 2002-03-15 2003-09-25 Nippon Hoso Kyokai <Nhk> Encoding method and encoding system for audio signal
JP2004053626A (en) * 2002-07-16 2004-02-19 Nippon Telegr & Teleph Corp <Ntt> Noise superposition quantity evaluating method, method and apparatus for noise suppression, noise superposition quantity evaluating program, noise suppressing program, and recording medium where noise superposition quantity evaluating program or/and noise suppressing program is/are recorded
JP2005522722A (en) * 2002-04-10 2005-07-28 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Stereo signal encoding
JP2005202248A (en) * 2004-01-16 2005-07-28 Fujitsu Ltd Audio encoding device and frame region allocating circuit of audio encoding device
JP2005265865A (en) * 2004-02-16 2005-09-29 Matsushita Electric Ind Co Ltd Method and device for bit allocation for audio encoding
JP2005328542A (en) * 2004-05-12 2005-11-24 Samsung Electronics Co Ltd Digital signal encoding method and apparatus using plurality of lookup tables, and method of generating plurality of lookup tables

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0787033A (en) * 1993-09-17 1995-03-31 Sharp Corp Stereo audio signal coder
JP2001053617A (en) * 1999-08-05 2001-02-23 Ricoh Co Ltd Device and method for digital sound single encoding and medium where digital sound signal encoding program is recorded
JP2003516555A (en) * 1999-12-08 2003-05-13 フラオホッフェル−ゲゼルシャフト ツル フェルデルング デル アンゲヴァンドテン フォルシュング エー.ヴェー. Stereo sound signal processing method and apparatus
JP2001255892A (en) * 2000-03-13 2001-09-21 Nippon Telegr & Teleph Corp <Ntt> Coding method of stereophonic signal
JP2002268694A (en) * 2001-03-13 2002-09-20 Nippon Hoso Kyokai <Nhk> Method and device for encoding stereophonic signal
JP2003044096A (en) * 2001-08-03 2003-02-14 Matsushita Electric Ind Co Ltd Method and device for encoding multi-channel audio signal, recording medium and music distribution system
JP2003271199A (en) * 2002-03-15 2003-09-25 Nippon Hoso Kyokai <Nhk> Encoding method and encoding system for audio signal
JP2005522722A (en) * 2002-04-10 2005-07-28 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Stereo signal encoding
JP2004053626A (en) * 2002-07-16 2004-02-19 Nippon Telegr & Teleph Corp <Ntt> Noise superposition quantity evaluating method, method and apparatus for noise suppression, noise superposition quantity evaluating program, noise suppressing program, and recording medium where noise superposition quantity evaluating program or/and noise suppressing program is/are recorded
JP2005202248A (en) * 2004-01-16 2005-07-28 Fujitsu Ltd Audio encoding device and frame region allocating circuit of audio encoding device
JP2005265865A (en) * 2004-02-16 2005-09-29 Matsushita Electric Ind Co Ltd Method and device for bit allocation for audio encoding
JP2005328542A (en) * 2004-05-12 2005-11-24 Samsung Electronics Co Ltd Digital signal encoding method and apparatus using plurality of lookup tables, and method of generating plurality of lookup tables

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009530653A (en) * 2006-03-13 2009-08-27 フランス テレコム Method for encoding sound source signal, corresponding encoding device, decoding method and device, signal, computer program product
US8818539B2 (en) 2009-07-03 2014-08-26 Fujitsu Limited Audio encoding device, audio encoding method, and video transmission device
US8862479B2 (en) 2010-01-20 2014-10-14 Fujitsu Limited Encoder, encoding system, and encoding method
US8818764B2 (en) 2010-03-30 2014-08-26 Fujitsu Limited Downmixing device and method
US9111533B2 (en) 2010-11-30 2015-08-18 Fujitsu Limited Audio coding device, method, and computer-readable recording medium storing program
JP2012141412A (en) * 2010-12-28 2012-07-26 Fujitsu Ltd Encoder, encoding method, and encoding program
US8831960B2 (en) 2011-08-30 2014-09-09 Fujitsu Limited Audio encoding device, audio encoding method, and computer-readable recording medium storing audio encoding computer program for encoding audio using a weighted residual signal
EP2618330A2 (en) 2012-01-18 2013-07-24 Fujitsu Limited Audio coding device and method
EP2690622A1 (en) 2012-07-24 2014-01-29 Fujitsu Limited Audio decoding device and audio decoding method
EP2770505A1 (en) 2013-02-20 2014-08-27 Fujitsu Limited Audio coding device and method
EP2876640A2 (en) 2013-11-22 2015-05-27 Fujitsu Limited Audio encoding device and audio coding method
US9837085B2 (en) 2013-11-22 2017-12-05 Fujitsu Limited Audio encoding device and audio coding method
JP2021047431A (en) * 2015-09-25 2021-03-25 ヴォイスエイジ・コーポレーション Method and system using long-term correlation difference between left and right channels for time domain down-mixing stereo audio signal into primary and secondary channels
JP7140817B2 (en) 2015-09-25 2022-09-21 ヴォイスエイジ・コーポレーション Method and system using long-term correlation difference between left and right channels for time-domain downmixing of stereo audio signals into primary and secondary channels
WO2020009082A1 (en) * 2018-07-03 2020-01-09 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ Encoding device and encoding method

Similar Documents

Publication Publication Date Title
JP2007183528A (en) Encoding apparatus, encoding method, and encoding program
JP4741476B2 (en) Encoder
EP1796081A2 (en) Encoding apparatus, encoding method, and computer product
US9659573B2 (en) Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
JP5485909B2 (en) Audio signal processing method and apparatus
AU2016202800B2 (en) Signal processing apparatus and method, and program
JP5267362B2 (en) Audio encoding apparatus, audio encoding method, audio encoding computer program, and video transmission apparatus
JP6133408B2 (en) Efficient encoding and decoding of multi-channel audio signals with multiple substreams
JP6474845B2 (en) Reduced complexity converter SNR calculation
US20090106030A1 (en) Method of signal encoding
IL201469A (en) Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering
US9076440B2 (en) Audio signal encoding device, method, and medium by correcting allowable error powers for a tonal frequency spectrum
KR20160120713A (en) Decoding device, encoding device, decoding method, encoding method, terminal device, and base station device
JP4947145B2 (en) Decoding device, decoding method, and program
JP2003345398A (en) Audio signal encoding method
KR100928967B1 (en) Method and apparatus for encoding / decoding audio signal
JP3725876B2 (en) Audio encoder and its encoding processing program
JP2006276877A (en) Decoding method for converted and encoded data and decoding device for converted and encoded data
Kurniawati et al. Decoder Based Approach to Enhance Low Bit Rate Audio
JP2008015357A (en) Encoding device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110301

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110502

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110801

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110906