JP2002311994A - Method and device for coding stereophonic audio signal - Google Patents

Method and device for coding stereophonic audio signal

Info

Publication number
JP2002311994A
JP2002311994A JP2001119266A JP2001119266A JP2002311994A JP 2002311994 A JP2002311994 A JP 2002311994A JP 2001119266 A JP2001119266 A JP 2001119266A JP 2001119266 A JP2001119266 A JP 2001119266A JP 2002311994 A JP2002311994 A JP 2002311994A
Authority
JP
Japan
Prior art keywords
intensity
stereo
audio signal
band
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001119266A
Other languages
Japanese (ja)
Inventor
Kiyotaka Nagai
清隆 永井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2001119266A priority Critical patent/JP2002311994A/en
Publication of JP2002311994A publication Critical patent/JP2002311994A/en
Pending legal-status Critical Current

Links

Landscapes

  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PROBLEM TO BE SOLVED: To solve the problem that spectra are suddenly changed at the boundary of a non-intensity stereophonic process and an intensity stereophonic process while conducting an intensity stereophonic coding, distortion is generated by the change and the tone quality is deteriorated. SOLUTION: The stereophonic audio signal coding device is provided with time/frequency converting sections 110 and 111 which convert stereophonic audio signals to frequency spectra, an intensity signal generating section 120 which conducts a high efficiency coding using the intensity stereophonic coding, a switching section 130 and a quantization and coding section 150. Moreover, the device is provided with an intensity boundary spectrum interpolation section 140 to replace non-intensity stereophonic process frequency spectra in the vicinity of the boundary of the non-intensity stereophonic process and the intensity stereophonic process with the frequency spectra which are interpolated by the non-intensity stereophonic process frequency spectra and the intensity stereophonic process frequency spectra.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、ステレオオーディ
オ信号をインテンシティステレオ符号化を用いて高能率
符号化する方法及び装置に関する。
[0001] 1. Field of the Invention [0002] The present invention relates to a method and apparatus for efficiently encoding a stereo audio signal using intensity stereo encoding.

【0002】[0002]

【従来の技術】近年、低いビットレート、例えば64k
bps、におけるステレオオーディオ信号の高能率符号
化方式として、インテンシティステレオ符号化を利用し
た方式が広く用いられている。インテンシティステレオ
を利用した方式としては、MPEG−1オーディオ及び
MPEG−2オーディオ、MPEG−2のAAC(Adva
nced Audio Coding)が挙げられる。
2. Description of the Related Art In recent years, low bit rates, for example, 64k
As a high-efficiency encoding method for stereo audio signals in bps, a method using intensity stereo encoding is widely used. Methods using intensity stereo include MPEG-1 audio and MPEG-2 audio, and MPEG-2 AAC (Adva
nced Audio Coding).

【0003】従来、インテンシティステレオ符号化を用
いたステレオオーディオ信号符号化方法として、例え
ば、MPEG−2 AACの規格書(ISO/IEC 13818-7,
Information technology - Generic coding of moving
pictures and associated audio information - Part
7: Advanced Audio Coding (AAC))に記載されたものが
知られている。
Conventionally, as a stereo audio signal encoding method using intensity stereo encoding, for example, the MPEG-2 AAC standard (ISO / IEC 13818-7,
Information technology-Generic coding of moving
pictures and associated audio information-Part
7: Advanced Audio Coding (AAC)).

【0004】図9に従来のインテンシティ符号化を用い
たステレオオーディオ信号符号化装置のブロック図を示
す。図9において、910と911は時間/周波数変換
部、920はインテンシティ信号生成部、930は非イ
ンテンシティ/インテンシティステレオ処理の切換情報
に応じて左右のチャンネルの周波数スペクトルを切り換
える切換部、940は量子化及び符号化部である。以上
のように構成されたステレオオーディオ信号符号化装置
について、その動作を以下に述べる。
FIG. 9 shows a block diagram of a conventional stereo audio signal encoding apparatus using intensity coding. In FIG. 9, 910 and 911 are time / frequency conversion units, 920 is an intensity signal generation unit, 930 is a switching unit that switches the frequency spectrum of left and right channels according to switching information of non-intensity / intensity stereo processing, 940 Is a quantization and coding unit. The operation of the stereo audio signal encoding device configured as described above will be described below.

【0005】入力された左チャンネルの時間軸のオーデ
ィオ信号(左時間信号)は、時間/周波数変換部910
において、図10に示すように直交変換されて周波数軸
のスペクトル(左スペクトル)に変換され、変換された
スペクトルはバンド単位でグループ化される。直交変換
としては、主としてMDCT(Modified Discrete Cosi
ne Transform:変形離散コサイン変換)やFFT(Fast
Fourier Transform:高速フーリエ変換)が用いられ
る。また、一つのバンド当たりのスペクトル本数は均一
でなく、周波数が高くなるにつれて一つのバンド当たり
のスペクトル本数が増加する場合が多い。
An input audio signal (left time signal) on the time axis of the left channel is converted into a time / frequency converter 910.
In FIG. 10, orthogonal transform is performed as shown in FIG. 10 to transform the spectrum into a spectrum on the frequency axis (left spectrum), and the transformed spectrum is grouped in band units. As the orthogonal transform, MDCT (Modified Discrete Cosi
ne Transform: Modified discrete cosine transform) or FFT (Fast
Fourier Transform) is used. Also, the number of spectra per band is not uniform, and the number of spectra per band often increases as the frequency increases.

【0006】同様に、入力された右チャンネルの時間軸
のオーディオ信号(右時間信号)は、時間/周波数変換
部911において、図10に示すように直交変換されて
周波数軸のスペクトル(右スペクトル)に変換され、変
換されたスペクトルはバンド単位でグループ化される。
Similarly, the input right channel time axis audio signal (right time signal) is orthogonally transformed by a time / frequency converter 911 as shown in FIG. 10 to obtain a frequency axis spectrum (right spectrum). And the converted spectra are grouped in band units.

【0007】次にインテンシティ信号生成部920にお
いて、上記左スペクトルと右スペクトルを入力としてイ
ンテンシティステレオ符号化に必要な信号を生成する。
Next, an intensity signal generation section 920 generates a signal necessary for intensity stereo coding using the left spectrum and the right spectrum as inputs.

【0008】最初にインテンシティステレオ符号化の方
式について説明する。図11にインテンシティステレオ
符号化の方式説明図を示す。インテンシティステレオと
は、所定の周波数(通常3kHzから6kHz)以上で
は、聴覚的には、スペクトルの微細構造よりもスペクト
ルのエンベロープ(概形)の方が重要であること、また
左右のチャンネルの信号レベルの差により音源の方向を
感じることを利用して、前記所定の周波数以上では、左
右のチャンネルの周波数スペクトルの和信号(MPEG
−2のAACでは、正確には前記和信号を左チャンネル
の信号レベルに合わせるように補正した周波数スペクト
ル)と左右のチャンネルの信号レベルの比を符号化する
ことにより、符号化効率を改善するものである。インテ
ンシティステレオ符号化では、伝送が必要な周波数スペ
クトル情報は一つのチャンネルのみでよいので高い符号
化効率を実現できるが、スペクトルの微細構造が再現で
きないことにより、音質劣化を生じることがある。
First, the intensity stereo coding method will be described. FIG. 11 shows an explanatory diagram of the intensity stereo coding method. Intensity stereo means that at a predetermined frequency (usually 3 kHz to 6 kHz) or higher, the spectral envelope (rough shape) is more important than the fine structure of the spectrum, and the signals of the left and right channels Utilizing the fact that the direction of the sound source is sensed by the level difference, the sum signal (MPEG) of the frequency spectra of the left and right channels above the predetermined frequency is used.
In the AAC of -2, the coding efficiency is improved by coding the ratio between the sum signal and the signal level of the left and right channels (corrected to match the signal level of the left channel) and the signal level of the left and right channels. It is. In intensity stereo coding, only one channel needs to be transmitted for frequency spectrum information that needs to be transmitted, so that high coding efficiency can be realized. However, sound quality may deteriorate due to the inability to reproduce the fine structure of the spectrum.

【0009】MPEG−2のAACでは、インテンシテ
ィステレオ符号化を表す情報として、バンド毎に、非イ
ンテンシティステレオ処理かインテンシティステレオ処
理かを表す非インテンシティ/インテンシティステレオ
処理の切換情報、左チャンネルのインテンシティステレ
オ処理時のスペクトルを表す左インテンシティスペクト
ル、左チャンネルのスペクトルと右チャンネルのスペク
トルの位相関係が同相か逆相かを表す位相情報、左イン
テンシティスペクトルから右チャンネルのインテンシテ
ィステレオ処理時のスペクトルを表す右インテンシティ
スペクトルを求めるための左チャンネルに対する右チャ
ンネルの信号レベルの比を表す方向性情報とを用いてい
る。
In the MPEG-2 AAC, as information indicating intensity stereo coding, switching information of non-intensity / intensity stereo processing indicating whether non-intensity stereo processing or intensity stereo processing is performed for each band, Left intensity spectrum that represents the spectrum during the intensity stereo processing of the channel, phase information that indicates whether the phase relationship between the spectrum of the left channel and the spectrum of the right channel is in phase or opposite phase, and the intensity stereo of the right channel from the left intensity spectrum Directivity information indicating the ratio of the signal level of the right channel to the left channel for obtaining the right intensity spectrum representing the spectrum at the time of processing is used.

【0010】図12は、前記従来のオーディオ信号符号
化方法におけるインテンシティ符号化処理のステップを
示すフローチャートである。
FIG. 12 is a flowchart showing steps of intensity coding processing in the conventional audio signal coding method.

【0011】ステップ1201でインテンシティステレ
オ処理を行うバンドとインテンシティステレオ処理を行
わないバンドを決定する。ここでは、周波数が6kHz
以上のバンドをインテンシティステレオ処理を行うバン
ドに決定する。すなわち、周波数6kHz以上のインテ
ンシティステレオスタートバンドBsからインテンシテ
ィステレオエンドバンドBeまでをインテンシティステ
レオ処理を行うバンドに決定する。
In step 1201, a band to be subjected to intensity stereo processing and a band not to be subjected to intensity stereo processing are determined. Here, the frequency is 6 kHz
The above bands are determined to be bands on which intensity stereo processing is performed. That is, a band from the intensity stereo start band Bs having a frequency of 6 kHz or more to the intensity stereo end band Be is determined as a band for performing intensity stereo processing.

【0012】次にステップ1202で、インテンシティ
ステレオ処理を行うバンド毎に、左チャンネル、右チャ
ンネル、左右のチャンネルの和信号のエネルギー、それ
ぞれ、EL(B)、ER(B)、EL+R(B)を算出す
る。ここでBはバンド番号である。
Next, at step 1202, the energy of the sum signal of the left channel, the right channel, and the left and right channels, E L (B), E R (B), and E L , for each band for which intensity stereo processing is performed. + R (B) is calculated. Here, B is a band number.

【0013】ステップ1203で、バンド毎の位相情報
をすべて同相に設定する。ここでは、位相情報は、同相
の場合に1、逆相の場合に−1の値をとるものとする。
In step 1203, all phase information for each band is set to the same phase. Here, it is assumed that the phase information takes a value of 1 in the case of in-phase and a value of -1 in the case of out-of-phase.

【0014】ステップ1204では、バンド毎に方向性
情報を算出する。方向性情報は、左右のチャンネルのエ
ネルギーの比の平方根、すなわち、SQRT(E
L(B)/ER(B))で算出する。ここで、SQRT
(X)はXの平方根を表す関数である。
In step 1204, direction information is calculated for each band. The direction information is the square root of the energy ratio of the left and right channels, that is, SQRT (E
L (B) / E R (B)). Where SQRT
(X) is a function representing the square root of X.

【0015】次にステップ1205で、バンド毎に左チ
ャンネルのインテンシティステレオ処理のスペクトルを
表す左インテンシティスペクトルを(数1)で算出す
る。
Next, at step 1205, a left intensity spectrum representing the spectrum of the intensity stereo processing of the left channel for each band is calculated by (Equation 1).

【0016】[0016]

【数1】 (Equation 1)

【0017】(数1)で、Lspec(i)とRspe
c(i)は、それぞれ左と右のチャンネルのスペクトル
番号iのスペクトルを、また、is(B)はバンドBの
最初のスペクトル番号を表す。
In equation (1), Lspec (i) and Rspec
c (i) represents the spectrum of spectrum number i of the left and right channels, respectively, and is (B) represents the first spectrum number of band B.

【0018】インテンシティ信号生成部920では、上
記ステップ1201からステップ1205までの処理を
行い、インテンシティステレオ処理に必要な非インテン
シティ/インテンシティステレオ処理の切換情報、左イ
ンテンシティスペクトル、位相情報、方向性情報とを生
成し、出力する。
The intensity signal generation section 920 performs the processing from step 1201 to step 1205 to switch information of non-intensity / intensity stereo processing required for intensity stereo processing, left intensity spectrum, phase information, Generate and output direction information.

【0019】次に図12のステップ1206では、左チ
ャンネルのスペクトルを左インテンシティスペクトル
で、また、右チャンネルのスペクトルを零スペクトルに
置き換える。
Next, in step 1206 of FIG. 12, the spectrum of the left channel is replaced with a left intensity spectrum, and the spectrum of the right channel is replaced with a zero spectrum.

【0020】上記スペクトルの置換処理は図9の切換部
930で行う。切換部930では非インテンシティ/イ
ンテンシティステレオ処理の切換情報に応じて、非イン
テンシティステレオ処理時には、図9の各スイッチを上
側に接続して左スペクトルと右スペクトルを出力し、イ
ンテンシティステレオ処理時にはスイッチを下側に接続
して左インテンシティスペクトルと零スペクトルとを出
力する。なお、この零スペクトルは符号化データとして
は伝送されない。
The above spectrum replacement process is performed by the switching unit 930 in FIG. According to the switching information of the non-intensity / intensity stereo processing, the switching unit 930 connects the switches of FIG. 9 to the upper side to output the left spectrum and the right spectrum during the non-intensity stereo processing, and outputs the intensity stereo processing. Sometimes a switch is connected to the lower side to output a left intensity spectrum and a zero spectrum. This zero spectrum is not transmitted as encoded data.

【0021】図13に以上のようにして求めた左右のチ
ャンネルのスペクトルの概念を示す。
FIG. 13 shows the concept of the spectrum of the left and right channels obtained as described above.

【0022】図9の量子化及び符号化部940では、切
換部930の出力である2つのスペクトルに対して、聴
覚モデルに基づいてスペクトルのマスキングレベル、す
なわち許容量子化ノイズレベルを算出し、算出された許
容量子化ノイズレベルに基づいてスペクトルの量子化を
行い、ハフマン符号化等の符号化処理を行い、高能率符
号化データを出力する。
The quantization and coding section 940 of FIG. 9 calculates the masking level of the spectrum, that is, the permissible quantization noise level, based on the auditory model, for the two spectra output from the switching section 930, and calculates the level. The spectrum is quantized on the basis of the permissible quantization noise level thus obtained, coding processing such as Huffman coding is performed, and highly efficient coded data is output.

【0023】図14に、上記インテンシティステレオ符
号化を用いた高能率符号化データを復号化するステレオ
オーディオ信号復号化装置のブロック図を示す。図14
において、1410は復号化及び逆量子化部、1420
は右インテンシティスペクトル再生部、1430は非イ
ンテンシティ/インテンシティステレオ処理の切換情報
に応じて右チャンネルの非インテンシティステレオ処理
のスペクトルとインテンシティステレオ処理のスペクト
ル(右インテンシティスペクトル)を切り換える切換
部、1440と1441は周波数/時間変換部である。
以上のように構成されたステレオオーディオ信号復号化
装置について、その動作を以下に述べる。
FIG. 14 is a block diagram of a stereo audio signal decoding apparatus for decoding highly efficient encoded data using the intensity stereo encoding. FIG.
, 1410 is a decoding and inverse quantization unit, 1420
Is a right intensity spectrum reproducing section, and 1430 is a switch for switching between a spectrum of the non-intensity stereo processing and a spectrum of the intensity stereo processing (right intensity spectrum) of the right channel according to switching information of the non-intensity / intensity stereo processing. And 1440 and 1441 are frequency / time conversion units.
The operation of the stereo audio signal decoding device configured as described above will be described below.

【0024】ステレオオーディオ信号復号化装置に入力
された符号化データは、復号化及び逆量子化部1410
で復号化と逆量子化される。右インテンシティスペクト
ル再生部1420では、復号化及び逆量子化部1410
からの左インテンシティスペクトルと位相情報と方向性
情報とを用いて右インテンシティスペクトルを再生す
る。
The encoded data input to the stereo audio signal decoding device is decoded and dequantized by
Are decoded and dequantized. The right intensity spectrum reproducing unit 1420 includes a decoding and inverse quantization unit 1410
The right intensity spectrum is reproduced using the left intensity spectrum, the phase information, and the direction information from.

【0025】図15は、右インテンシティスペクトル再
生部1420の構成を示すブロック図である。同図に示
すように、右インテンシティスペクトルは、左インテン
シティスペクトルに、位相情報が同相の場合「1」を、
また、逆相の場合「−1」を掛け、次に方向性情報SQ
RT(EL(B)/ER(B))で割ることにより再生さ
れる。
FIG. 15 is a block diagram showing a configuration of the right intensity spectrum reproducing section 1420. As shown in the figure, the right intensity spectrum has "1" in the left intensity spectrum when the phase information is in-phase,
In the case of opposite phase, multiply by “−1” and then directional information SQ
Reproduction is performed by dividing by RT (E L (B) / E R (B)).

【0026】切換部1430では、復号化及び逆量子化
部1410からの非インテンシティ/インテンシティス
テレオ処理の切換情報に応じて、右チャンネルのスペク
トルとして、非インテンシティステレオ処理時にはスイ
ッチを上側に接続して復号化及び逆量子下部からの右チ
ャンネルのスペクトルをそのまま出力し、インテンシテ
ィステレオ処理時には、スイッチを下側に接続して右イ
ンテンシティスペクトル再生部1420からの右インテ
ンシティスペクトルを出力する。
In switching section 1430, according to the switching information of non-intensity / intensity stereo processing from decoding and inverse quantization section 1410, a switch is connected to the upper side during non-intensity stereo processing as the spectrum of the right channel. Then, the right channel spectrum from the decoding and inverse quantum lower part is output as it is, and at the time of intensity stereo processing, the switch is connected to the lower side to output the right intensity spectrum from the right intensity spectrum reproducing unit 1420.

【0027】周波数/時間変換部1440では、入力さ
れた左チャンネルの周波数軸のスペクトル(左スペクト
ル)を逆直交変換することにより、左チャンネルの時間
軸のオーディオ信号(左時間信号)に変換し、出力す
る。同様に周波数/時間変換部1441では、入力され
た右チャンネルの周波数軸のスペクトル(右スペクト
ル)を逆直交変換することにより、右チャンネルの時間
軸のオーディオ信号(右時間信号)に変換し、出力す
る。
The frequency / time conversion section 1440 performs an inverse orthogonal transform of the input left-channel frequency axis spectrum (left spectrum) to convert it into a left-channel time axis audio signal (left time signal). Output. Similarly, the frequency / time conversion unit 1441 performs an inverse orthogonal transform on the input right-channel frequency axis spectrum (right spectrum) to convert it into a right-channel time axis audio signal (right time signal) and output it. I do.

【0028】[0028]

【発明が解決しようとする課題】しかしながら、上記従
来のステレオオーディオ信号符号化方法及び装置では、
非インテンシティステレオ処理のバンドとインテンシテ
ィステレオ処理のバンド境界でスペクトルが急激に変化
することにより、歪み成分が発生し、特にトーン性の高
い信号が前記境界付近にあると、音質が劣化することが
あるという課題があった。
However, in the above-mentioned conventional stereo audio signal encoding method and apparatus,
A sharp change in the spectrum at the band of the non-intensity stereo processing and the band boundary of the intensity stereo processing causes distortion components, and the sound quality is degraded, especially when a signal having a high tone property is near the boundary. There was a problem that there is.

【0029】また、インテンシティステレオ符号化の左
右のチャンネルが同相か、逆相かを表す位相情報が時間
フレーム毎に頻繁に変化する、あるいは周波数バンド毎
に頻繁に変化すると、歪み成分が発生し、音質が劣化す
るという課題があった。
If the phase information indicating whether the left and right channels of the intensity stereo coding are in phase or opposite phase changes frequently every time frame, or changes frequently every frequency band, a distortion component is generated. However, there is a problem that sound quality is deteriorated.

【0030】本発明は上記問題点を解決するもので、イ
ンテンシティステレオ符号化を用いたステレオオーディ
オ信号符号化方法及び装置であって、非インテンシティ
ステレオ処理のバンドとインテンシティステレオ処理の
バンドの境界のスペクトルを滑らかに接続することによ
り、歪み成分の発生を低減し、従来よりも音質を向上し
たステレオオーディオ信号符号化方法及び装置を提供す
ることを目的とする。
The present invention solves the above-mentioned problems and provides a method and apparatus for encoding a stereo audio signal using intensity stereo encoding, wherein a band for non-intensity stereo processing and a band for intensity stereo processing are used. It is an object of the present invention to provide a stereo audio signal encoding method and apparatus in which the generation of distortion components is reduced and the sound quality is improved as compared with the related art by smoothly connecting the spectra at the boundaries.

【0031】また、インテンシティステレオ符号化の位
相情報を以前の時間フレーム位相情報、あるいは以前の
時間フレームの左右のチャンネル間の相関関係を考慮し
て設定することにより、位相情報の頻繁な変化を抑え、
歪み成分の発生を低減し、従来よりも音質の向上したス
テレオオーディオ信号符号化方法及び装置を提供するこ
とを目的とする。
Further, by setting the phase information of the intensity stereo coding in consideration of the previous time frame phase information or the correlation between the left and right channels of the previous time frame, frequent changes in the phase information can be prevented. Hold down,
It is an object of the present invention to provide a stereo audio signal encoding method and apparatus capable of reducing the generation of distortion components and improving the sound quality as compared with the related art.

【0032】また、インテンシティステレオ符号化の位
相情報を隣接する周波数バンドの位相情報、あるいは隣
接する周波数バンドの左右のチャンネル間の相関関係を
考慮して設定することにより、位相情報の頻繁な変化を
抑え、歪み成分の発生を低減し、従来よりも音質の向上
したステレオオーディオ信号符号化方法及び装置を提供
することを目的とする。
Further, by setting the phase information of the intensity stereo coding in consideration of the phase information of the adjacent frequency band or the correlation between the left and right channels of the adjacent frequency band, frequent changes in the phase information are performed. It is an object of the present invention to provide a stereo audio signal encoding method and apparatus capable of suppressing the occurrence of distortion components, reducing the occurrence of distortion components, and improving the sound quality as compared with the related art.

【0033】[0033]

【課題を解決するための手段】この課題を解決するため
に、本発明のステレオオーディオ信号符号化方法は、ス
テレオオーディオ信号を周波数スペクトルに変換し、イ
ンテンシティステレオ符号化を用いて高能率符号化する
方法であって、非インテンシティステレオ処理とインテ
ンシティステレオ処理の境界近傍の非インテンシティス
テレオ処理周波数スペクトルを非インテンシティステレ
オ処理周波数スペクトルとインテンシティステレオ処理
周波数スペクトルとで補間した周波数スペクトルで置き
換えるステップを備えたものである。
In order to solve this problem, a stereo audio signal encoding method according to the present invention converts a stereo audio signal into a frequency spectrum, and performs high-efficiency encoding using intensity stereo encoding. A non-intensity stereo processing frequency spectrum near a boundary between the non-intensity stereo processing and the intensity stereo processing is replaced with a frequency spectrum interpolated by the non-intensity stereo processing frequency spectrum and the intensity stereo processing frequency spectrum. It has steps.

【0034】また、本発明のステレオオーディオ信号符
号化方法は、ステレオオーディオ信号をフレーム毎に周
波数スペクトルに変換し、インテンシティステレオ符号
化を用いて高能率符号化する方法であって、フレーム毎
に前記ステレオオーディオ信号の周波数スペクトル間の
相関関係を決定するステップと、現在のフレームと以前
のフレームの前記相関関係に応じて、インテンシティス
テレオ復号化時のステレオオーディオ信号の周波数スペ
クトルの位相関係を表す位相情報を設定するステップと
を備えたものである。
The stereo audio signal encoding method of the present invention is a method of converting a stereo audio signal into a frequency spectrum for each frame, and performing high-efficiency encoding using intensity stereo encoding. Determining a correlation between frequency spectra of the stereo audio signal, and representing a phase relationship of a frequency spectrum of the stereo audio signal during intensity stereo decoding according to the correlation between a current frame and a previous frame. Setting phase information.

【0035】また、本発明のステレオオーディオ信号符
号化方法は、ステレオオーディオ信号を周波数スペクト
ルに変換し、前記周波数スペクトルをバンド単位でグル
ープ化し、インテンシティステレオ符号化を用いて高能
率符号化する方法であって、バンド毎に前記ステレオオ
ーディオ信号の周波数スペクトル間の相関関係を決定す
るステップと、現在のバンドと隣接するバンドの前記相
関関係に応じて、インテンシティステレオ復号化時のス
テレオオーディオ信号の周波数スペクトルの位相関係を
表す位相情報を設定するステップとを備えたものであ
る。
Also, the stereo audio signal encoding method of the present invention converts a stereo audio signal into a frequency spectrum, groups the frequency spectrum in band units, and performs high efficiency encoding using intensity stereo encoding. Determining the correlation between the frequency spectra of the stereo audio signal for each band, and according to the correlation between a current band and an adjacent band, the stereo audio signal at the time of intensity stereo decoding. Setting phase information indicating the phase relationship of the frequency spectrum.

【0036】本発明のステレオオーディオ信号符号化装
置は、ステレオオーディオ信号を周波数スペクトルに変
換する手段と、インテンシティステレオ符号化を用いて
高能率符号化する手段とを備えた装置であって、非イン
テンシティステレオ処理とインテンシティステレオ処理
の境界近傍の非インテンシティステレオ処理周波数スペ
クトルを非インテンシティステレオ処理周波数スペクト
ルとインテンシティステレオ処理周波数スペクトルとで
補間した周波数スペクトルで置き換える手段を備えたも
のである。
The stereo audio signal encoding apparatus according to the present invention is an apparatus provided with means for converting a stereo audio signal into a frequency spectrum and means for performing efficient encoding using intensity stereo encoding. Means for replacing the intensity stereo processing and the non-intensity stereo processing frequency spectrum near the boundary of the intensity stereo processing with a frequency spectrum interpolated between the non-intensity stereo processing frequency spectrum and the intensity stereo processing frequency spectrum. .

【0037】また、本発明のステレオオーディオ信号符
号化装置は、ステレオオーディオ信号をフレーム毎に周
波数スペクトルに変換する手段と、インテンシティステ
レオ符号化を用いて高能率符号化する手段とを備えた装
置であって、フレーム毎に前記ステレオオーディオ信号
の周波数スペクトル間の相関関係を決定する手段と、現
在のフレームと以前のフレームの前記相関関係に応じ
て、インテンシティステレオ復号化時のステレオオーデ
ィオ信号の周波数スペクトルの位相関係を表す位相情報
を設定する手段とを備えたものである。
Further, the stereo audio signal encoding apparatus of the present invention is an apparatus comprising means for converting a stereo audio signal into a frequency spectrum for each frame, and means for performing high-efficiency encoding using intensity stereo encoding. Means for determining a correlation between the frequency spectra of the stereo audio signal for each frame, and, for the stereo audio signal at the time of intensity stereo decoding, according to the correlation between a current frame and a previous frame. Means for setting phase information indicating the phase relationship of the frequency spectrum.

【0038】また、本発明のステレオオーディオ信号符
号化装置は、ステレオオーディオ信号を周波数スペクト
ルに変換し、前記周波数スペクトルをバンド単位でグル
ープ化する手段と、インテンシティステレオ符号化を用
いて高能率符号化する手段を備えた装置であって、バン
ド毎に前記ステレオオーディオ信号の周波数スペクトル
間の相関関係を決定する手段と、現在のバンドと隣接す
るバンドの前記相関関係に応じて、インテンシティステ
レオ復号化時のステレオオーディオ信号の周波数スペク
トルの位相関係を表す位相情報を設定する手段とを備え
たものである。
Further, the stereo audio signal encoding apparatus of the present invention converts a stereo audio signal into a frequency spectrum, and groups the frequency spectrum in band units, and a high-efficiency encoding using intensity stereo encoding. Means for determining a correlation between frequency spectra of the stereo audio signal for each band, and intensity stereo decoding according to the correlation between a current band and an adjacent band. Means for setting phase information indicating the phase relationship of the frequency spectrum of the stereo audio signal at the time of conversion.

【0039】[0039]

【発明の実施の形態】以下、本発明の実施の形態につい
て、図面を用いて説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0040】(実施の形態1)図1は、本発明の実施の
形態によるステレオオーディオ信号符号化装置の構成を
示すブロック図である。
(Embodiment 1) FIG. 1 is a block diagram showing a configuration of a stereo audio signal encoding apparatus according to an embodiment of the present invention.

【0041】図1において、110と111は時間/周
波数変換部、120はインテンシティ信号生成部、13
0は非インテンシティ/インテンシティステレオ処理の
切換情報に応じて左右のチャンネルの周波数スペクトル
を切り換える切換部、140はインテンシティステレオ
処理の境界近傍のスペクトルを補間するインテンシティ
境界スペクトル補間部、150は量子化及び符号化部で
ある。以上のように構成されたステレオオーディオ信号
符号化装置について、その動作を以下に述べる。
In FIG. 1, 110 and 111 are time / frequency converters, 120 is an intensity signal generator, 13
0 is a switching unit that switches the frequency spectrum of the left and right channels according to the switching information of the non-intensity / intensity stereo processing, 140 is an intensity boundary spectrum interpolation unit that interpolates the spectrum near the boundary of the intensity stereo processing, and 150 is It is a quantization and coding unit. The operation of the stereo audio signal encoding device configured as described above will be described below.

【0042】入力された左チャンネルの時間軸のオーデ
ィオ信号(左時間信号)は、時間/周波数変換部110
において、MDCT(変形離散コサイン変換)されて周
波数軸のスペクトル(左スペクトル)に変換され、変換
されたスペクトルはバンド単位でグループ化される。本
実施の形態では、バンド当たりのスペクトル本数は均一
でなく、周波数が高くなるにつれて一つのバンド当たり
のスペクトル本数は増加する。
The input audio signal on the time axis of the left channel (left time signal) is converted into a time / frequency
In, the data is subjected to MDCT (Modified Discrete Cosine Transform), converted into a spectrum on the frequency axis (left spectrum), and the converted spectrum is grouped in band units. In the present embodiment, the number of spectra per band is not uniform, and the number of spectra per band increases as the frequency increases.

【0043】同様に、入力された右チャンネルの時間軸
のオーディオ信号(右時間信号)は、時間/周波数変換
部111において、MDCTされて周波数軸のスペクト
ル(右スペクトル)に変換され、変換されたスペクトル
はバンド単位でグループ化される。
Similarly, the input right-channel audio signal on the time axis (right time signal) is MDCT-converted by the time / frequency converter 111 into a spectrum on the frequency axis (right spectrum) and converted. The spectra are grouped by band.

【0044】次に、インテンシティ信号生成部120で
は、上記左チャンネルの周波数スペクトルと右チャンネ
ルの周波数スペクトルを入力として、バンド毎に、非イ
ンテンシティステレオ処理か、インテンシティステレオ
処理かを表す切換情報、左チャンネルのインテンシティ
ステレオ処理のスペクトルを表す左インテンシティスペ
クトル、左チャンネルと右チャンネルの位相関係が同相
か逆相かを表す位相情報、左チャンネルに対する右チャ
ンネルの信号レベルの比を表す方向性情報とを生成、出
力する。
Next, the intensity signal generating section 120 receives the frequency spectrum of the left channel and the frequency spectrum of the right channel as input, and performs switching information indicating non-intensity stereo processing or intensity stereo processing for each band. , Left intensity spectrum indicating the spectrum of the intensity stereo processing of the left channel, phase information indicating whether the phase relationship between the left channel and the right channel is in phase or out of phase, and directionality indicating the ratio of the signal level of the right channel to the left channel. Generate and output information.

【0045】図2は、インテンシティステレオ信号生成
部120の構成を示すブロック図である。図2におい
て、210は左チャンネルのインテンシティ処理のスペ
クトルを算出する左インテンシティスペクトル算出部、
220は位相情報を算出する位相情報算出部、230は
左右のチャンネルと左右のチャンネルの和信号と差信
号、及び左チャネルの周波数スペクトル(左スペクト
ル)と右チャンネルの周波数スペクトル(右スペクト
ル)の相関係数を算出するエネルギー及び相関係数算出
部、240は方向性情報算出部である。以上のように構
成されたインテンシティ信号生成部120について、そ
の動作を以下に述べる。
FIG. 2 is a block diagram showing a configuration of intensity stereo signal generating section 120. In FIG. 2, reference numeral 210 denotes a left intensity spectrum calculation unit that calculates a spectrum of the intensity processing of the left channel;
220 is a phase information calculation unit for calculating phase information, 230 is the sum signal and difference signal of the left and right channels and the left and right channels, and the phase of the left channel frequency spectrum (left spectrum) and the right channel frequency spectrum (right spectrum). The energy and correlation coefficient calculation unit 240 for calculating the number of relations is a direction information calculation unit. The operation of the intensity signal generator 120 configured as described above will be described below.

【0046】図3はインテンシティステレオ信号生成部
120と切換部130の処理ステップを示すフローチャ
ートである。同図で、ステップ301から306までが
インテンシティステレオ信号生成部120の処理を表
し、ステップ307が切換部130の処理を表す。
FIG. 3 is a flowchart showing processing steps of intensity stereo signal generating section 120 and switching section 130. In the figure, steps 301 to 306 represent the processing of the intensity stereo signal generation unit 120, and step 307 represents the processing of the switching unit 130.

【0047】最初にステップ301でインテンシティス
テレオ処理を行うバンドとインテンシティステレオ処理
を行わないバンドを決定する。本実施の形態では、周波
数が6kHz以上のバンドをインテンシティステレオ処
理を行うバンドに決定する。すなわち、周波数6kHz
以上のスタートバンドBsからエンドバンドBeまでを
インテンシティステレオ処理を行うバンドに決定し、こ
れに対応した非インテンシティ/インテンシティステレ
オ処理の切換情報を出力する。
First, in step 301, a band to be subjected to intensity stereo processing and a band not to be subjected to intensity stereo processing are determined. In the present embodiment, a band having a frequency of 6 kHz or more is determined as a band for performing intensity stereo processing. That is, a frequency of 6 kHz
The above-described band from the start band Bs to the end band Be is determined as a band for performing intensity stereo processing, and switching information of non-intensity / intensity stereo processing corresponding to this is output.

【0048】次にステップ302で、バンド毎に、バン
ドBの左チャンネル、右チャンネル、左右のチャンネル
の和信号と差信号のエネルギー、それぞれ、E(B)L
E(B)R、E(B)L+R、E(B)L-Rを(数2)により算
出する。以下では、E(B)L、E(B)R、E(B)L+R
E(B)L-Rを合わせたものをエネルギー情報と呼ぶ。
Next, in step 302, for each band, the energy of the sum signal and the difference signal of the left channel, the right channel, and the left and right channels of band B are E (B) L ,
E (B) R , E (B) L + R , and E (B) LR are calculated by (Equation 2). In the following, E (B) L , E (B) R , E (B) L + R ,
The sum of E (B) LR is called energy information.

【0049】[0049]

【数2】 (Equation 2)

【0050】(数2)で、Lspec(i)とRspe
c(i)は、それぞれ左と右のチャンネルのスペクトル
番号iのスペクトルを、またis(B)はバンドBの最
初のスペクトル番号を表す。
In equation (2), Lspec (i) and Rspec
c (i) represents the spectrum of spectrum number i of the left and right channels, respectively, and is (B) represents the first spectrum number of band B.

【0051】次にステップ304では、バンド毎に、バ
ンドBの相互相関係数C(B)を(数3)で算出する。
Next, in step 304, the cross-correlation coefficient C (B) of the band B is calculated by (Equation 3) for each band.

【0052】[0052]

【数3】 (Equation 3)

【0053】次に、正規化相互相関係数Cn(B)を、
Cn(B)=C(B)/SQRT(E(B)L・E(B)R)で算出する。
Next, the normalized cross-correlation coefficient Cn (B) is
Cn (B) = C (B) / SQRT (E (B) L · E (B) R ).

【0054】エネルギー及び相関係数算出部230で
は、ステップ301からステップ303までの処理を行
い、位相情報算出部220に正規化相互相関係数を出力
し、左インテンシティスペクトル算出部210と方向性
情報算出部240にバンド毎のエネルギー情報を出力
し、非インテンシティ/インテンシティステレオ処理の
切換情報を切換部130、インテンシティ境界スペクト
ル補間部140と量子化及び符号化部150に出力す
る。
The energy and correlation coefficient calculating section 230 performs the processing from step 301 to step 303, outputs the normalized cross-correlation coefficient to the phase information calculating section 220, and makes the left intensity spectrum calculating section 210 The energy information for each band is output to the information calculation unit 240, and the switching information for non-intensity / intensity stereo processing is output to the switching unit 130, the intensity boundary spectrum interpolation unit 140, and the quantization and encoding unit 150.

【0055】次にステップ304で位相情報を算出す
る。図4に位相情報算出ステップ304の詳細フローチ
ャートを示す。位相情報の算出は、インテンシティステ
レオ処理のバンド毎に行う。ステップ401でバンドB
をインテンシティステレオ処理のスタートバンドBsに
設定する。次にステップ402で正規化相互相関係数C
n(B)が零以上か否かの判定を行う。正規化相互相関
係数が零以上の時には、ステップ403に行き、位相情
報を同相に設定する。また、正規化相互相関係数が負の
時にはステップ404に行き、位相情報を逆相に設定す
る。次にステップ405でバンド番号Bを1増加する。
ステップ406でバンド番号BがエンドバンドBeを越
えているか否かを判定し、越えていないときには、ステ
ップ402から405までの処理を繰り返して各バンド
の位相情報を設定する。また、BがBeを越えていると
きには処理を終了する。
Next, in step 304, phase information is calculated. FIG. 4 shows a detailed flowchart of the phase information calculation step 304. The calculation of the phase information is performed for each band of the intensity stereo processing. Band 401 in step 401
Is set to the start band Bs of the intensity stereo processing. Next, at step 402, the normalized cross-correlation coefficient C
It is determined whether n (B) is equal to or greater than zero. When the normalized cross-correlation coefficient is equal to or greater than zero, the process proceeds to step 403, where the phase information is set to the same phase. When the normalized cross-correlation coefficient is negative, the procedure goes to step 404, where the phase information is set to the opposite phase. Next, in step 405, the band number B is incremented by one.
In step 406, it is determined whether or not the band number B exceeds the end band Be. If not, the process from steps 402 to 405 is repeated to set phase information of each band. If B exceeds Be, the process ends.

【0056】位相情報算出部220でステップ304の
上記位相情報算出処理を行う。
The phase information calculation processing of step 304 is performed by the phase information calculation section 220.

【0057】次にステップ305では、方向性情報を算
出する。方向性情報は、バンド毎に左チャンネルのエネ
ルギーに対する右チャネルのエネルギーの比の平方根、
すなわち、SQRT(EL(B)/ER(B))で算出す
る。方向性情報算出部240では、以上のようにして方
向性情報を算出し、出力する。
Next, in step 305, direction information is calculated. The direction information is, for each band, the square root of the ratio of the right channel energy to the left channel energy,
That is, it is calculated by SQRT (E L (B) / E R (B)). The direction information calculation unit 240 calculates and outputs the direction information as described above.

【0058】次にステップ306で左チャンネルのイン
テンシティステレオ処理の周波数スペクトル(左インテ
ンシティスペクトル)を、ステップ304で算出した位
相情報を用いて、左右のチャンネルの和信号(位相情報
が同相の場合)、あるいは差信号(位相情報が逆相の場
合)のエネルギーが元の左チャンネルのエネルギーと同
一になるように前記和信号、あるいは差信号を補正し
て、各バンド毎に算出する。すなわち、位相情報が同相
の場合には、左インテンシティスペクトルを(数4)で
算出する。
Next, in step 306, the frequency spectrum (left intensity spectrum) of the intensity stereo processing of the left channel is converted to the sum signal of the left and right channels using the phase information calculated in step 304 (when the phase information is in phase). ) Or the difference signal (when the phase information is in the opposite phase), the sum signal or the difference signal is corrected such that the energy of the original left channel is the same as that of the original left channel, and calculation is performed for each band. That is, when the phase information is in-phase, the left intensity spectrum is calculated by (Equation 4).

【0059】[0059]

【数4】 (Equation 4)

【0060】また、位相情報が逆相の場合には、左イン
テンシティスペクトルを(数5)で算出する。
When the phase information is out of phase, the left intensity spectrum is calculated by (Equation 5).

【0061】[0061]

【数5】 (Equation 5)

【0062】左インテンシティスペクトル算出部210
では、左チャンネルの周波数スペクトル(左スペクト
ル)と右チャンネルの周波数スペクトル(右スペクト
ル)とエネルギー及び相関係数算出部230からのエネ
ルギー情報を入力として、ステップ306の左インテン
シティスペクトルの算出を行い、左インテンシティスペ
クトルを出力する。
Left intensity spectrum calculator 210
Then, the left intensity spectrum is calculated in step 306 by using as input the frequency spectrum of the left channel (left spectrum), the frequency spectrum of the right channel (right spectrum), and the energy information from the energy and correlation coefficient calculator 230. Outputs the left intensity spectrum.

【0063】以上がインテンシティ信号生成部120の
動作である。
The operation of the intensity signal generator 120 has been described above.

【0064】次にステップ307では、インテンシティ
ステレオ処理のバンドに対して、左チャンネルの周波数
スペクトルを左インテンシティスペクトルで、また、右
チャンネルのスペクトルを零スペクトルに置き換える。
Next, in step 307, the frequency spectrum of the left channel is replaced with the left intensity spectrum and the spectrum of the right channel is replaced with the zero spectrum for the band of the intensity stereo processing.

【0065】切換部130でステップ307のスペクト
ルの置換処理を行う。すなわち、切換部130では、イ
ンテンシティ信号生成部120からのバンド毎の非イン
テンシティ/インテンシティステレオ処理の切換情報に
したがって、非インテンシティステレオ処理時には各ス
イッチを図1の上側に接続し、インテンシティステレオ
処理時にはスイッチを下側に接続する。これにより、非
インテンシティ/インテンシティステレオ処理に応じ
て、左チャンネルに関しては、左スペクトル/左インテ
ンシティスペクトルを、また、右チャンネルに関して
は、右スペクトル/零スペクトルをそれぞれ切り換え
て、図13に示すようなスペクトルを生成し、出力す
る。
The switching unit 130 performs a spectrum replacement process in step 307. That is, the switching unit 130 connects the respective switches to the upper side of FIG. 1 during the non-intensity stereo processing according to the switching information of the non-intensity / intensity stereo processing for each band from the intensity signal generation unit 120, and At the time of city stereo processing, connect the switch to the lower side. Accordingly, the left channel is switched between the left spectrum and the left intensity spectrum and the right channel is switched between the right spectrum and the zero spectrum according to the non-intensity / intensity stereo processing, as shown in FIG. Such a spectrum is generated and output.

【0066】インテンシティ境界スペクトル補間部14
0では、切換部130からのスペクトルを入力として、
非インテンシティステレオ処理とインテンシティステレ
オ処理の境界近傍バンドの非インテンシティステレオ処
理周波数スペクトルを非インテンシティステレオ処理周
波数スペクトルとインテンシティステレオ処理周波数ス
ペクトルで補間したスペクトルで置き換える。すなわ
ち、図13のバンド(Bs−1)の非インテンシティス
テレオ処理の周波数スペクトルを補間した周波数スペク
トルで置き換える。バンド(Bs−1)の左右のチャン
ネルのインテンシティステレオ処理周波数スペクトルL
Ispec(i)、RIspec(i)は、バンドBの
位相情報を用いて次のようにして求める。
Intensity boundary spectrum interpolation section 14
0, the spectrum from the switching unit 130 is used as an input,
The non-intensity stereo processing frequency spectrum in the band near the boundary between the non-intensity stereo processing and the intensity stereo processing is replaced with a spectrum interpolated by the non-intensity stereo processing frequency spectrum and the intensity stereo processing frequency spectrum. That is, the frequency spectrum of the non-intensity stereo processing of the band (Bs-1) in FIG. 13 is replaced with the interpolated frequency spectrum. Intensity stereo processing frequency spectrum L of left and right channels of band (Bs-1)
Ispec (i) and RIspec (i) are obtained as follows using the band B phase information.

【0067】すなわち、バンドBの位相情報が同相の場
合には、(数6)で算出する。
That is, when the phase information of the band B is in phase, it is calculated by (Equation 6).

【0068】[0068]

【数6】 (Equation 6)

【0069】また、位相情報が逆相の場合には、(数
7)で算出する。
If the phase information is in the opposite phase, it is calculated by (Equation 7).

【0070】[0070]

【数7】 (Equation 7)

【0071】次に、置き換える左右のチャンネルの補間
スペクトルL’spec(i)、R’spec(i)
(ただし、is(Bs−1)≦i≦is(Bs)−1)
を(数8)で算出する。
Next, the interpolation spectra L'spec (i) and R'spec (i) of the left and right channels to be replaced are shown.
(However, is (Bs-1) ≤i≤is (Bs) -1)
Is calculated by (Equation 8).

【0072】[0072]

【数8】 (Equation 8)

【0073】以上のようにして算出した補間スペクトル
L’spec(i)とR’spec(i)でバンド(B
s−1)の非インテンシティステレオ処理周波数スペク
トルLspec(i)、Rspec(i)をそれぞれ置
き換える。
The interpolation spectrum L'spec (i) and R'spec (i) calculated as described above are used for the band (B
The non-intensity stereo processing frequency spectra Lspec (i) and Rspec (i) of s-1) are respectively replaced.

【0074】量子化及び符号化部130では、以上のよ
うにして算出した周波数スペクトルを用いて、聴覚モデ
ルに基づいてスペクトルのマスキングレベル、すなわち
許容量子化ノイズレベルを算出し、算出された許容量子
化ノイズレベルを基づいてスペクトルの量子化を行い、
ハフマン符号化等の符号化処理を行い、高能率符号化デ
ータを出力する。
The quantization and encoding section 130 calculates a masking level of the spectrum, that is, an allowable quantization noise level based on the auditory model using the frequency spectrum calculated as described above, and calculates the calculated allowable quantum noise level. Quantization of the spectrum based on the quantization noise level,
It performs encoding processing such as Huffman encoding and outputs highly efficient encoded data.

【0075】以上のように本実施の形態では、インテン
シティ境界スペクトル補間処理を設けることにより、非
インテンシティステレオ処理とインテンシティステレオ
処理の境界近傍のスペクトルを滑らかに接続することが
でき、従来のインテンシティステレオ符号化におけるイ
ンテンシティステレオ処理周波数スペクトルと非インテ
ンシティステレオ処理周波数スペクトルの急激な切り換
えによる歪み成分の発生を低減することができる。
As described above, in the present embodiment, the spectrum near the boundary between the non-intensity stereo processing and the intensity stereo processing can be connected smoothly by providing the intensity boundary spectrum interpolation processing. It is possible to reduce the occurrence of distortion components due to abrupt switching between the intensity stereo processing frequency spectrum and the non-intensity stereo processing frequency spectrum in intensity stereo coding.

【0076】(実施の形態2)本発明の実施の形態2に
よるステレオオーディオ信号符号化装置の構成及びイン
テンシティ信号生成部の構成は、実施の形態1と同一
で、それぞれ、図1及び図2で示される。実施の形態1
と実施の形態2の相違点は、位相情報算出部220の処
理内容にあるので、以下、実施の形態2における位相情
報算出部220の処理内容について説明し、それ以外の
動作については説明を省略する。
(Embodiment 2) The configuration of a stereo audio signal encoding apparatus and the configuration of an intensity signal generator according to Embodiment 2 of the present invention are the same as those of Embodiment 1, and are respectively shown in FIGS. Indicated by Embodiment 1
The difference between the second embodiment and the second embodiment resides in the processing contents of the phase information calculation section 220. Hereinafter, the processing contents of the phase information calculation section 220 in the second embodiment will be described, and the description of the other operations will be omitted. I do.

【0077】図5に実施の形態2における位相情報算出
処理ステップのフローチャートを示す。位相情報の算出
はインテンシティステレオ処理のバンド毎に行う。ステ
ップ501でバンドBをインテンシティステレオ処理の
スタートバンドBsに設定する。次にステップ502で
正規化相互相関係数Cn(B)が所定の閾値TH(B)
以上であるか否かの判定を行う。本実施の形態では、閾
値TH(B)の初期値は、零に設定する。正規化相互相
関係数が前記閾値以上の時には、ステップ503に行
き、位相情報を同相に設定するとともにTH(B)の値
を所定の負の値−OFFS(ただし、0≦OFFS≦
1)に設定する。また、正規化相互相関関数が前記閾値
より小さい時にはステップ504に行き、位相情報を逆
相に設定するとともにTH(B)の値を所定の値OFF
Sに設定する。次にステップ505でバンド番号Bを1
増加する。ステップ506でバンド番号Bがエンドバン
ドBeを越えていないかを判定し、越えていないときに
は、ステップ502から505までの処理を繰り返して
各バンドの位相情報を設定する。BがBeを越えている
ときには処理を終了する。
FIG. 5 shows a flowchart of the phase information calculation processing step in the second embodiment. The calculation of the phase information is performed for each band of the intensity stereo processing. In step 501, band B is set as a start band Bs for intensity stereo processing. Next, at step 502, the normalized cross-correlation coefficient Cn (B) is set to a predetermined threshold value TH (B).
It is determined whether or not this is the case. In the present embodiment, the initial value of the threshold value TH (B) is set to zero. When the normalized cross-correlation coefficient is equal to or larger than the threshold value, the process proceeds to step 503, where the phase information is set to the same phase and the value of TH (B) is set to a predetermined negative value −OFFS (where 0 ≦ OFFS ≦
Set to 1). When the normalized cross-correlation function is smaller than the threshold value, the process proceeds to step 504, where the phase information is set to the opposite phase and the value of TH (B) is set to the predetermined value OFF.
Set to S. Next, in step 505, the band number B is set to 1
To increase. In step 506, it is determined whether the band number B does not exceed the end band Be. If not, the process from step 502 to step 505 is repeated to set the phase information of each band. If B exceeds Be, the process ends.

【0078】以上のように実施の形態2では、位相情報
の判定条件にヒステリシスをもたせ、前のフレームの位
相情報が同相であると、同相に入りやすくし、また前の
フレームの逆相であると逆相に入りやすくすることによ
り、時間フレーム毎の位相情報の頻繁な変化を抑え、イ
ンテンシティステレオ符号化の時間フレーム毎の位相情
報の頻繁な切り換えによる音質劣化を低減することがで
きる。
As described above, in the second embodiment, the condition for judging the phase information is given a hysteresis, and if the phase information of the previous frame is in phase, it is easy to enter the same phase, and the phase is opposite to that of the previous frame. Frequent change of phase information for each time frame can be suppressed, and sound quality deterioration due to frequent switching of phase information for each time frame of intensity stereo coding can be reduced.

【0079】(実施の形態3)本発明の実施の形態3に
よるステレオオーディオ信号符号化装置の構成及びイン
テンシティ信号生成部の構成は、実施の形態1と同一
で、それぞれ、図1及び図2で示される。実施の形態1
と実施の形態3の相違点は、位相情報算出部220の処
理内容にあるので、以下実施の形態3における位相情報
算出部220の処理内容について説明し、それ以外の動
作については説明を省略する。
(Embodiment 3) The configuration of a stereo audio signal encoding device and the configuration of an intensity signal generator according to Embodiment 3 of the present invention are the same as those of Embodiment 1, and are respectively shown in FIGS. Indicated by Embodiment 1
The difference between the third embodiment and the third embodiment resides in the processing contents of the phase information calculating section 220. Therefore, the processing contents of the phase information calculating section 220 in the third embodiment will be described below, and the description of the other operations will be omitted. .

【0080】図6に実施の形態3における位相情報算出
処理ステップのフローチャートを示す。位相情報の算出
は、インテンシティステレオ処理のバンド毎に行う。ス
テップ601でバンドBをインテンシティステレオ処理
のスタートバンドBsに設定する。次にステップ602
で現在のフレームの正規化相互相関係数Cn(B)と前
のフレームの正規化相互相関係数Cnprev(B)か
ら、CC(B)=kCn(B)+(1-k)Cnprev(B)により、重み付け正
規化相互相関係数CC(B)を算出する。ここでCnp
rev(B)の初期値は零に設定する。また、ここで、
k(ただし、0≦k≦1)は重み付け係数で、例えば、
k=0.75の値に設定する。
FIG. 6 shows a flowchart of the phase information calculation processing step in the third embodiment. The calculation of the phase information is performed for each band of the intensity stereo processing. In step 601, band B is set as a start band Bs for intensity stereo processing. Next, step 602
From the normalized cross-correlation coefficient Cn (B) of the current frame and the normalized cross-correlation coefficient Cnprev (B) of the previous frame, CC (B) = kCn (B) + (1-k) Cnprev (B ), A weighted normalized cross-correlation coefficient CC (B) is calculated. Where Cnp
The initial value of rev (B) is set to zero. Also, where
k (where 0 ≦ k ≦ 1) is a weighting coefficient, for example,
Set k to a value of 0.75.

【0081】次にステップ603で重み付け正規化相互
相関係数が零以上か否かの判定を行う。重み付け正規化
相互相関係数が零以上の時には、ステップ604に行
き、位相情報を同相に設定する。また、重み付け正規化
相互相関係数が負の時にはステップ605に行き、位相
情報を逆相に設定する。
Next, at step 603, it is determined whether or not the weighted normalized cross-correlation coefficient is equal to or larger than zero. When the weighted normalized cross-correlation coefficient is equal to or greater than zero, the process proceeds to step 604, and the phase information is set to the same phase. When the weighted normalized cross-correlation coefficient is negative, the procedure goes to step 605 to set the phase information to the opposite phase.

【0082】ステップ606では、次のフレームの処理
に備えて、前のフレームの正規化相互相関係数Cnpr
ev(B)を現在のフレームの正規化相互相関係数Cn
(B)で置き換える。
In step 606, the normalized cross-correlation coefficient Cnpr of the previous frame is prepared in preparation for the processing of the next frame.
ev (B) is the normalized cross-correlation coefficient Cn of the current frame.
Replace with (B).

【0083】次にステップ607でバンド番号Bを1増
加する。ステップ608でバンド番号Bがエンドバンド
Beを越えていないかを判定し、越えていないときに
は、ステップ602から607までの処理を繰り返して
各バンドの位相情報を設定する。BがBeを越えている
ときには処理を終了する。
Next, at step 607, the band number B is incremented by one. In step 608, it is determined whether the band number B does not exceed the end band Be. If the band number B does not exceed the end band Be, the processing of steps 602 to 607 is repeated to set phase information of each band. If B exceeds Be, the process ends.

【0084】以上のように実施の形態3では、位相情報
の判定を重み付け正規化相互相関係数を用いて行うこと
により、前のフレームの正規化相互相関係数を考慮して
現在のフレームの位相情報を設定することができ、前の
フレームの正規化相互相関係数が正もしくは零である
と、同相に入りやすく、また、前のフレームの正規化相
互相関係数が負であると逆相に入りやすくなり、時間フ
レーム毎の位相情報の頻繁な変化を抑え、インテンシテ
ィステレオ符号化の位相情報の時間フレーム毎の頻繁な
切り換えによる音質劣化を低減することができる。
As described above, in the third embodiment, the determination of the phase information is performed using the weighted normalized cross-correlation coefficient, so that the current frame of the current frame is considered in consideration of the normalized cross-correlation coefficient of the previous frame. Phase information can be set, and if the normalized cross-correlation coefficient of the previous frame is positive or zero, it is easy to enter in-phase, and if the normalized cross-correlation coefficient of the previous frame is negative, the inverse This makes it easier to enter a phase, suppresses frequent changes in phase information for each time frame, and reduces sound quality degradation due to frequent switching of phase information for intensity stereo coding for each time frame.

【0085】なお、以上の説明では、一つ前のフレーム
の正規化相互相関係数のみを考慮した例を示したが、そ
れ以前のフレームの正規化相互相関係数を考慮してもよ
い。
In the above description, an example is shown in which only the normalized cross-correlation coefficient of the immediately preceding frame is considered, but the normalized cross-correlation coefficient of the previous frame may be considered.

【0086】また、以上の説明では、重み付け正規化相
互相関係数の算出にFIRフィルタを用いた例を示した
が、IIRフィルタを用いてもよい。
In the above description, an example is shown in which an FIR filter is used to calculate the weighted normalized cross-correlation coefficient. However, an IIR filter may be used.

【0087】(実施の形態4)本発明の実施の形態4に
よるステレオオーディオ信号符号化装置の構成及びイン
テンシティ信号生成部の構成は、実施の形態1と同一
で、それぞれ、図1及び図2で示される。実施の形態1
と実施の形態4の相違点は、位相情報算出部220の処
理内容にあるので、以下実施の形態4における位相情報
算出部220の処理内容について説明し、それ以外の動
作については説明を省略する。
(Embodiment 4) The configuration of a stereo audio signal encoding apparatus and the configuration of an intensity signal generator according to Embodiment 4 of the present invention are the same as those of Embodiment 1, and are respectively shown in FIGS. Indicated by Embodiment 1
The difference between the second embodiment and the fourth embodiment lies in the processing contents of the phase information calculation section 220. Therefore, the processing contents of the phase information calculation section 220 in the fourth embodiment will be described below, and the description of the other operations will be omitted. .

【0088】図7に実施の形態4における位相情報算出
処理ステップのフローチャートを示す。位相情報の算出
は、インテンシティステレオ処理のバンド毎に行う。ス
テップ701でバンドBをインテンシティステレオ処理
のスタートバンドBsに設定する。次にステップ702
で正規化相互相関係数Cn(B)が所定の閾値TH
(B)以上であるか否かの判定を行う。本実施の形態で
は、閾値TH(B)の初期値は、零に設定する。正規化
相互相関係数が前記閾値以上の時には、ステップ703
に行き、位相情報を同相に設定するとともに隣のバンド
の閾値TH(B+1)の値を所定の負の値−OFFS
(ただし、0≦OFFS≦1)に設定する。また、正規
化相互相関係数が前記閾値より小さい時にはステップ7
04に行き、位相情報を逆相に設定するとともにTH
(B+1)の値をOFFSに設定する。次にステップ7
05でバンド番号Bを1増加する。ステップ706でバ
ンド番号BがエンドバンドBeを越えていないかを判定
し、越えていないときには、ステップ702から705
までの処理を繰り返して各バンドの位相情報を設定す
る。バンド番号BがエンドバンドBeを越えているとき
には処理を終了する。
FIG. 7 shows a flowchart of the phase information calculation processing step in the fourth embodiment. The calculation of the phase information is performed for each band of the intensity stereo processing. In step 701, band B is set as a start band Bs for intensity stereo processing. Next, step 702
And the normalized cross-correlation coefficient Cn (B) becomes a predetermined threshold TH.
(B) It is determined whether or not this is the case. In the present embodiment, the initial value of the threshold value TH (B) is set to zero. If the normalized cross-correlation coefficient is equal to or larger than the threshold, step 703
To set the phase information to the same phase and set the value of the threshold value TH (B + 1) of the adjacent band to a predetermined negative value −OFFS
(However, 0 ≦ OFFS ≦ 1) is set. When the normalized cross-correlation coefficient is smaller than the threshold value, step 7
04 and sets the phase information to reverse phase and
The value of (B + 1) is set to OFFS. Then step 7
At 05, the band number B is incremented by one. In step 706, it is determined whether the band number B does not exceed the end band Be. If the band number does not exceed end band Be, steps 702 to 705 are performed.
By repeating the above processing, the phase information of each band is set. When the band number B exceeds the end band Be, the process ends.

【0089】以上のように実施の形態4では、位相情報
の判定条件にヒステリシスをもたせ、隣のバンドの位相
情報が同相であると、同相に入りやすくし、また隣のバ
ンドの位相情報が逆相であると逆相に入りやすくするこ
とにより、周波数バンド毎の位相情報の頻繁な変化を抑
え、インテンシティステレオ符号化の位相情報の周波数
バンド毎の頻繁な切り換えによる音質劣化を低減するこ
とができる。
As described above, in the fourth embodiment, the determination condition of the phase information is given a hysteresis, and if the phase information of the adjacent band is in phase, it is easy to enter the same phase, and the phase information of the adjacent band is inverted. By making the phase easier to enter the opposite phase, it is possible to suppress frequent changes in phase information for each frequency band, and reduce sound quality degradation due to frequent switching of phase information for intensity stereo coding for each frequency band. it can.

【0090】なお、以上の説明では、一つ下のバンドの
位相情報の影響を考慮する例を示したが、一つ上のバン
ドの位相情報の影響を考慮するようにしてもよい。
In the above description, an example in which the influence of the phase information of the band immediately below is taken into consideration, but the influence of the phase information of the band immediately above may be taken into consideration.

【0091】(実施の形態5)本発明の実施の形態5に
よるステレオオーディオ信号符号化装置の構成及びイン
テンシティステレオ信号生成部の構成は、実施の形態1
と同一で、それぞれ、図1及び図2で示される。実施の
形態1と実施の形態5の相違点は、位相情報算出部22
0の処理内容にあるので、以下実施の形態5における位
相情報算出部220の処理内容について説明し、それ以
外の動作については説明を省略する。
(Embodiment 5) The configuration of a stereo audio signal encoding apparatus and the configuration of an intensity stereo signal generator according to Embodiment 5 of the present invention are described in Embodiment 1.
And are shown in FIGS. 1 and 2, respectively. The difference between the first embodiment and the fifth embodiment is that
Since the processing content is 0, the processing content of the phase information calculation unit 220 in the fifth embodiment will be described below, and the description of the other operations will be omitted.

【0092】図8に実施の形態5における位相情報算出
処理ステップのフローチャートを示す。位相情報の算出
は、インテンシティステレオ処理のバンド毎に行う。ス
テップ801でバンドBをインテンシティステレオ処理
のスタートバンドBsに設定する。次にステップ802
で現在のバンドの正規化相互相関係数Cn(B)と一つ
下と上のバンド正規化相互相関係数Cn(B−1)とC
n(B+1)から、CC(B)=k1(B)・Cn(B-1)+k2(B)・Cn(B)
+k3(b)・Cn(B+1)により、重み付け正規化相互相関係数C
C(B)を算出する。ただし、k1(B)+k2(B)+k3(B)=1と
する。
FIG. 8 shows a flowchart of the phase information calculation processing step in the fifth embodiment. The calculation of the phase information is performed for each band of the intensity stereo processing. In step 801, band B is set as a start band Bs for intensity stereo processing. Next, step 802
And the normalized cross-correlation coefficient Cn (B) of the current band and the band-normalized cross-correlation coefficients Cn (B-1) and C
From n (B + 1), CC (B) = k1 (B) · Cn (B-1) + k2 (B) · Cn (B)
+ k3 (b) · Cn (B + 1) gives a weighted normalized cross-correlation coefficient C
Calculate C (B). However, k1 (B) + k2 (B) + k3 (B) = 1.

【0093】ここで、k1(B)、k2(B)、k3
(B)は重み付け係数で、正もしくは零の値をとる。本
実施の形態では、例えば、B=Bsに対しては、k1
(Bs)=0、k2(Bs)=0.875、k3(B
s)=0.125、Bs<B<BeのBに対しては、k
1(B)=0125、k2(B)=0.75、k3(B
s)=0.125、B=Beに対しては、k1(Be)
=0.125、k2(Bs)=0.875、k3(B
e)=0の値に設定する。
Here, k1 (B), k2 (B), k3
(B) is a weighting coefficient, which takes a positive or zero value. In the present embodiment, for example, for B = Bs, k1
(Bs) = 0, k2 (Bs) = 0.875, k3 (B
s) = 0.125, and for B where Bs <B <Be, k
1 (B) = 0125, k2 (B) = 0.75, k3 (B
s) = 0.125, for B = Be, k1 (Be)
= 0.125, k2 (Bs) = 0.875, k3 (B
e) Set to a value of = 0.

【0094】次にステップ803で重み付け正規化相互
相関係数が零以上か否かの判定を行う。重み付け正規化
相互相関係数が零以上の時には、ステップ804に行
き、バンドBの位相情報を同相に設定する。また、重み
付け正規化相関関数が負の時にはステップ805に行
き、位相情報を逆相に設定する。
Next, at step 803, it is determined whether or not the weighted normalized cross-correlation coefficient is equal to or greater than zero. When the weighted normalized cross-correlation coefficient is equal to or greater than zero, the process proceeds to step 804, and the phase information of band B is set to the same phase. When the weighted normalized correlation function is negative, the procedure goes to step 805 to set the phase information to the opposite phase.

【0095】次にステップ806でバンド番号Bを1増
加する。ステップ807でバンド番号Bがエンドバンド
Beを越えていないかを判定し、越えていないときに
は、ステップ802から806までの処理を繰り返して
各バンドの位相情報を設定する。BがBeを越えている
ときには処理を終了する。
Next, at step 806, the band number B is incremented by one. In step 807, it is determined whether the band number B does not exceed the end band Be. If the band number B does not exceed the end band Be, the process of steps 802 to 806 is repeated to set phase information of each band. If B exceeds Be, the process ends.

【0096】以上のように実施の形態5では、位相情報
の判定を重み付け正規化相互相関係数を用いて行うこと
により、隣接するバンドの正規化相互相関係数を考慮し
て現在のバンドの位相情報を設定するので、隣接するバ
ンドの正規化相互相関係数が正であると、同相に入りや
すく、また、隣接するバンドの正規化相互相関係数が負
であると逆相に入りやすくなり、周波数バンド毎の位相
情報の頻繁な変化を抑え、インテンシティステレオ符号
化の位相情報の周波数バンド毎の頻繁な切り換えによる
音質劣化を低減することができる。
As described above, in the fifth embodiment, the determination of the phase information is performed using the weighted normalized cross-correlation coefficient, and the current band of the current band is considered in consideration of the normalized cross-correlation coefficient of the adjacent band. Since the phase information is set, if the normalized cross-correlation coefficient of the adjacent band is positive, it is easy to enter the same phase, and if the normalized cross-correlation coefficient of the adjacent band is negative, it is likely to enter the opposite phase. That is, frequent changes in phase information for each frequency band can be suppressed, and sound quality deterioration due to frequent switching of phase information for intensity stereo coding for each frequency band can be reduced.

【0097】[0097]

【発明の効果】以上のように本発明によれば、非インテ
ンシティステレオ処理とインテンシティステレオ処理の
境界近傍のスペクトルを補間により、滑らかに接続する
ことができ、非インテンシティステレオ処理のスペクト
ルとインテンシティステレオ処理のスペクトルの急激な
切り換えによる歪み成分の発生を低減することができ
る。
As described above, according to the present invention, the spectrum near the boundary between the non-intensity stereo processing and the intensity stereo processing can be connected smoothly by interpolation, and the spectrum of the non-intensity stereo processing can be smoothly connected. It is possible to reduce the generation of distortion components due to abrupt switching of the spectrum of the intensity stereo processing.

【0098】また、インテンシティステレオ符号化の位
相情報を、以前の時間フレームの位相情報、あるいは以
前の時間フレームの左右のチャンネル間の相関関係に応
じて設定することにより、位相情報の時間フレーム毎の
頻繁な切り換えによる音質劣化を低減することができ
る。
Also, by setting the phase information of the intensity stereo coding in accordance with the phase information of the previous time frame or the correlation between the left and right channels of the previous time frame, the phase information of each time frame of the phase information is set. Frequency degradation due to frequent switching can be reduced.

【0099】また、インテンシティステレオ符号化の位
相情報を、隣接する周波数バンドの位相情報、あるいは
隣接する周波数バンドの左右のチャンネル間の相関関係
に応じて設定することにより、位相情報の周波数バンド
毎の頻繁な切り換えによる音質劣化を低減することがで
きる。
Also, by setting the phase information of the intensity stereo coding according to the phase information of the adjacent frequency band or the correlation between the left and right channels of the adjacent frequency band, the phase information of each frequency band of the phase information is set. Frequency degradation due to frequent switching can be reduced.

【0100】以上にように本発明によれば、インテンシ
ティステレオ符号化の音質劣化を低減したステレオオー
ディオ信号符号化方法及び装置を実現することができ
る。
As described above, according to the present invention, it is possible to realize a stereo audio signal encoding method and apparatus in which the sound quality deterioration of intensity stereo encoding is reduced.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態1によるステレオオーディ
オ信号符号化装置の構成を示すブロック図
FIG. 1 is a block diagram illustrating a configuration of a stereo audio signal encoding device according to a first embodiment of the present invention.

【図2】同ステレオオーディオ信号符号化装置における
インテンシティ信号生成部の構成を示すブロック図
FIG. 2 is a block diagram showing a configuration of an intensity signal generation unit in the stereo audio signal encoding device.

【図3】本発明の実施の形態1によるステレオオーディ
オ信号符号化方法におけるインテンシティ符号化処理の
ステップを示すフローチャート
FIG. 3 is a flowchart showing steps of an intensity encoding process in the stereo audio signal encoding method according to the first embodiment of the present invention.

【図4】同ステレオオーディオ信号符号化方法における
位相情報算出処理ステップを示すフローチャート
FIG. 4 is a flowchart showing phase information calculation processing steps in the stereo audio signal encoding method.

【図5】本発明の実施の形態2のステレオオーディオ信
号符号化方法における位相情報算出処理ステップを示す
フローチャート
FIG. 5 is a flowchart showing phase information calculation processing steps in a stereo audio signal encoding method according to Embodiment 2 of the present invention;

【図6】同実施の形態3のステレオオーディオ信号符号
化方法における位相情報算出処理ステップを示すフロー
チャート
FIG. 6 is a flowchart showing phase information calculation processing steps in the stereo audio signal encoding method according to the third embodiment;

【図7】同実施の形態4のステレオオーディオ信号符号
化方法における位相情報算出処理ステップを示すフロー
チャート
FIG. 7 is a flowchart showing phase information calculation processing steps in the stereo audio signal encoding method according to the fourth embodiment;

【図8】同実施の形態5のステレオオーディオ信号符号
化方法における位相情報算出処理ステップを示すフロー
チャート
FIG. 8 is a flowchart showing phase information calculation processing steps in the stereo audio signal encoding method according to the fifth embodiment;

【図9】従来のステレオオーディオ信号符号化装置の構
成を示すブロック図
FIG. 9 is a block diagram showing a configuration of a conventional stereo audio signal encoding device.

【図10】同従来例における動作を説明するための時間
/周波数変換説明図
FIG. 10 is an explanatory diagram of time / frequency conversion for explaining an operation in the conventional example.

【図11】同従来例における動作を説明するためのイン
テンシティステレオ符号化の方式説明図
FIG. 11 is an explanatory diagram of a method of intensity stereo coding for explaining an operation in the conventional example.

【図12】同従来例のステレオオーディオ信号符号化方
法におけるインテンシティ符号化処理ステップを示すフ
ローチャート
FIG. 12 is a flowchart showing intensity encoding processing steps in the conventional stereo audio signal encoding method.

【図13】同従来例における動作を説明するための非イ
ンテンシティ/インテンシティステレオ処理スペクトル
説明図
FIG. 13 is an explanatory diagram of a spectrum of non-intensity / intensity stereo processing for explaining an operation in the conventional example.

【図14】従来のステレオオーディオ信号復号化装置の
全体構成を示すブロック図
FIG. 14 is a block diagram showing the overall configuration of a conventional stereo audio signal decoding device.

【図15】同従来例のステレオオーディオ信号復号化装
置における右インテンシティスペクトル再生部の構成を
示すブロック図
FIG. 15 is a block diagram showing a configuration of a right intensity spectrum reproducing unit in the stereo audio signal decoding device of the conventional example.

【符号の説明】[Explanation of symbols]

110,111 時間/周波数変換部 120 インテンシティ信号生成部 130 切換部 140 インテンシティ境界スペクトル補間部 150 量子化及び符号化部 210 左インテンシティスペクトル算出部 220 位相情報算出部 230 エネルギー及び相関係数算出部 240 方向性情報算出部 110, 111 Time / frequency conversion unit 120 Intensity signal generation unit 130 Switching unit 140 Intensity boundary spectrum interpolation unit 150 Quantization and encoding unit 210 Left intensity spectrum calculation unit 220 Phase information calculation unit 230 Energy and correlation coefficient calculation Unit 240 Direction information calculation unit

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 ステレオオーディオ信号を周波数スペク
トルに変換し、インテンシティステレオ符号化を用いて
高能率符号化する方法であって、非インテンシティステ
レオ処理とインテンシティステレオ処理の境界近傍の非
インテンシティステレオ処理周波数スペクトルを非イン
テンシティステレオ処理周波数スペクトルとインテンシ
ティステレオ処理周波数スペクトルとで補間した周波数
スペクトルで置き換えるステップを備えたことを特徴と
するステレオオーディオ信号符号化方法。
1. A method for converting a stereo audio signal into a frequency spectrum and performing high-efficiency coding using intensity stereo coding, wherein the non-intensity stereo processing and the non-intensity near the boundary between the intensity stereo processing are performed. A stereo audio signal encoding method, comprising a step of replacing a stereo processing frequency spectrum with a frequency spectrum interpolated between a non-intensity stereo processing frequency spectrum and an intensity stereo processing frequency spectrum.
【請求項2】 ステレオオーディオ信号をフレーム毎に
周波数スペクトルに変換し、インテンシティステレオ符
号化を用いて高能率符号化する方法であって、フレーム
毎に前記ステレオオーディオ信号の周波数スペクトル間
の相関関係を決定するステップと、現在のフレームと以
前のフレームの前記相関関係に応じて、インテンシティ
ステレオ復号化時のステレオオーディオ信号の周波数ス
ペクトルの位相関係を表す位相情報を設定するステップ
とを備えたことを特徴とするステレオオーディオ信号符
号化方法。
2. A method for converting a stereo audio signal into a frequency spectrum for each frame and performing high-efficiency coding using intensity stereo coding, wherein a correlation between the frequency spectra of the stereo audio signal for each frame is provided. And setting phase information indicating a phase relationship of a frequency spectrum of a stereo audio signal at the time of intensity stereo decoding according to the correlation between a current frame and a previous frame. A stereo audio signal encoding method.
【請求項3】 ステレオオーディオ信号を周波数スペク
トルに変換し、前記周波数スペクトルをバンド単位でグ
ループ化し、インテンシティステレオ符号化を用いて高
能率符号化する方法であって、バンド毎に前記ステレオ
オーディオ信号の周波数スペクトル間の相関関係を決定
するステップと、現在のバンドと隣接するバンドの前記
相関関係に応じて、インテンシティステレオ復号化時の
ステレオオーディオ信号の周波数スペクトルの位相関係
を表す位相情報を設定するステップとを備えたことを特
徴とするステレオオーディオ信号符号化方法。
3. A method for converting a stereo audio signal into a frequency spectrum, grouping the frequency spectrum in band units, and performing high-efficiency encoding using intensity stereo encoding, wherein the stereo audio signal is divided into bands. Determining the correlation between the frequency spectra of the current band and the phase information representing the phase relationship of the frequency spectrum of the stereo audio signal at the time of intensity stereo decoding according to the correlation between the current band and the adjacent band. A stereo audio signal encoding method.
【請求項4】 前記相関関係は、相互相関係数に基づく
ものであることを特徴とする請求項2または3記載のス
テレオオーディオ信号符号化方法。
4. The stereo audio signal encoding method according to claim 2, wherein the correlation is based on a cross-correlation coefficient.
【請求項5】 ステレオオーディオ信号を周波数スペク
トルに変換する手段と、インテンシティステレオ符号化
を用いて高能率符号化する手段とを備えた装置であっ
て、非インテンシティステレオ処理とインテンシティス
テレオ処理の境界近傍の非インテンシティステレオ処理
周波数スペクトルを非インテンシティステレオ処理周波
数スペクトルとインテンシティステレオ処理周波数スペ
クトルとで補間した周波数スペクトルで置き換える手段
を備えたことを特徴とするステレオオーディオ信号符号
化装置。
5. An apparatus comprising: means for converting a stereo audio signal into a frequency spectrum; and means for performing high-efficiency coding using intensity stereo coding, wherein the non-intensity stereo processing and the intensity stereo processing are performed. A stereo audio signal encoding apparatus characterized by comprising means for replacing a non-intensity stereo processing frequency spectrum near a boundary with a frequency spectrum interpolated by a non-intensity stereo processing frequency spectrum and an intensity stereo processing frequency spectrum.
【請求項6】 ステレオオーディオ信号をフレーム毎に
周波数スペクトルに変換する手段と、インテンシティス
テレオ符号化を用いて高能率符号化する手段とを備えた
装置であって、フレーム毎に前記ステレオオーディオ信
号の周波数スペクトル間の相関関係を決定する手段と、
現在のフレームと以前のフレームの前記相関関係に応じ
て、インテンシティステレオ復号化時のステレオオーデ
ィオ信号の周波数スペクトルの位相関係を表す位相情報
を設定する手段とを備えたことを特徴とするステレオオ
ーディオ信号符号化装置。
6. An apparatus comprising: means for converting a stereo audio signal into a frequency spectrum for each frame; and means for performing high-efficiency coding using intensity stereo coding, wherein the stereo audio signal is provided for each frame. Means for determining the correlation between the frequency spectra of
Means for setting phase information indicating a phase relationship of a frequency spectrum of a stereo audio signal at the time of intensity stereo decoding, according to the correlation between a current frame and a previous frame. Signal encoding device.
【請求項7】 ステレオオーディオ信号を周波数スペク
トルに変換し、前記周波数スペクトルをバンド単位でグ
ループ化する手段と、インテンシティステレオ符号化を
用いて高能率符号化する手段とを備えた装置であって、
バンド毎に前記ステレオオーディオ信号の周波数スペク
トル間の相関関係を決定する手段と、現在のバンドと隣
接するバンドの前記相関関係に応じて、インテンシティ
ステレオ復号化時のステレオオーディオ信号の周波数ス
ペクトルの位相関係を表す位相情報を設定する手段とを
備えたことを特徴とするステレオオーディオ信号符号化
装置。
7. An apparatus comprising: means for converting a stereo audio signal into a frequency spectrum, grouping the frequency spectrum in band units, and means for performing high-efficiency coding using intensity stereo coding. ,
Means for determining a correlation between frequency spectra of the stereo audio signal for each band, and a phase of a frequency spectrum of the stereo audio signal at the time of intensity stereo decoding according to the correlation between a current band and an adjacent band. Means for setting phase information indicating the relationship.
【請求項8】 前記相関関係は、相互相関係数に基づく
ものであることを特徴とする請求項6または7記載のス
テレオオーディオ信号符号化装置。
8. The stereo audio signal encoding apparatus according to claim 6, wherein the correlation is based on a cross-correlation coefficient.
JP2001119266A 2001-04-18 2001-04-18 Method and device for coding stereophonic audio signal Pending JP2002311994A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001119266A JP2002311994A (en) 2001-04-18 2001-04-18 Method and device for coding stereophonic audio signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001119266A JP2002311994A (en) 2001-04-18 2001-04-18 Method and device for coding stereophonic audio signal

Publications (1)

Publication Number Publication Date
JP2002311994A true JP2002311994A (en) 2002-10-25

Family

ID=18969518

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001119266A Pending JP2002311994A (en) 2001-04-18 2001-04-18 Method and device for coding stereophonic audio signal

Country Status (1)

Country Link
JP (1) JP2002311994A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003098602A1 (en) * 2002-05-20 2003-11-27 Sony Corporation Acoustic signal encoding method and encoding device, acoustic signal decoding method and decoding device, program, and recording medium image display device
JP2009501948A (en) * 2005-07-19 2009-01-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ A concept to bridge the gap between parametric multi-channel audio coding and matrix surround multi-channel coding
JP2019028419A (en) * 2017-07-28 2019-02-21 富士通株式会社 Audio encoding apparatus, audio encoding method, and audio encoding program

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003098602A1 (en) * 2002-05-20 2003-11-27 Sony Corporation Acoustic signal encoding method and encoding device, acoustic signal decoding method and decoding device, program, and recording medium image display device
US7627482B2 (en) 2002-05-20 2009-12-01 Sony Corporation Methods, storage medium, and apparatus for encoding and decoding sound signals from multiple channels
US7912731B2 (en) 2002-05-20 2011-03-22 Sony Corporation Methods, storage medium and apparatus for encoding and decoding sound signals from multiple channels
KR101144696B1 (en) 2002-05-20 2012-05-25 소니 주식회사 Acoustic signal, encoding method and encoding device, acoustic signal, decoding method and decoding device, and recording medium image display device
JP2009501948A (en) * 2005-07-19 2009-01-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ A concept to bridge the gap between parametric multi-channel audio coding and matrix surround multi-channel coding
JP2019028419A (en) * 2017-07-28 2019-02-21 富士通株式会社 Audio encoding apparatus, audio encoding method, and audio encoding program

Similar Documents

Publication Publication Date Title
US10269364B2 (en) Reconstructing audio signals with multiple decorrelation techniques
JP4772279B2 (en) Multi-channel / cue encoding / decoding of audio signals
JP6407928B2 (en) Audio processing system
US10902859B2 (en) Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US9218818B2 (en) Efficient and scalable parametric stereo coding for low bitrate audio coding applications
US8046214B2 (en) Low complexity decoder for complex transform coding of multi-channel sound
RU2407227C2 (en) Concept for combination of multiple parametrically coded audio sources
JP6155274B2 (en) Upsampling with oversampled SBR
CN102016983A (en) Apparatus for mixing a plurality of input data streams
US8619999B2 (en) Audio decoding method and apparatus
JPWO2006022190A1 (en) Audio encoder
JP4413480B2 (en) Voice processing apparatus and mobile communication terminal apparatus
US6614365B2 (en) Coding device and method, decoding device and method, and recording medium
KR101926209B1 (en) Processing stereophonic audio signals
WO2006001159A1 (en) Signal encoding device and method, and signal decoding device and method
JP2004198485A (en) Device and program for decoding sound encoded signal
JP3519859B2 (en) Encoder and decoder
JP2004325633A (en) Method and program for encoding signal, and recording medium therefor
JP2002311994A (en) Method and device for coding stereophonic audio signal
JP3193515B2 (en) Voice coded communication system and apparatus therefor
JP4125520B2 (en) Decoding method for transform-coded data and decoding device for transform-coded data
JP2005004119A (en) Sound signal encoding device and sound signal decoding device