JPH0964751A - Multichannel audio encoder and encoding method - Google Patents

Multichannel audio encoder and encoding method

Info

Publication number
JPH0964751A
JPH0964751A JP7211828A JP21182895A JPH0964751A JP H0964751 A JPH0964751 A JP H0964751A JP 7211828 A JP7211828 A JP 7211828A JP 21182895 A JP21182895 A JP 21182895A JP H0964751 A JPH0964751 A JP H0964751A
Authority
JP
Japan
Prior art keywords
channel
signal
audio signal
stereo
bit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7211828A
Other languages
Japanese (ja)
Other versions
JP3342996B2 (en
Inventor
Choken Kyo
丁權 許
Einan Go
永南 呉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Priority to JP21182895A priority Critical patent/JP3342996B2/en
Publication of JPH0964751A publication Critical patent/JPH0964751A/en
Application granted granted Critical
Publication of JP3342996B2 publication Critical patent/JP3342996B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

PROBLEM TO BE SOLVED: To efficiently encode the audio signals of multiple channels with a small quantity of bit by APCM-quantizing the multiple channels audio signals of a frequency area through the use of the result of bit allocation in a bit a location unit. SOLUTION: An APCM pre-processing part 120 inputting the stereo audio signals, and the multiple channel audio signals of the frequency area and calculating information on the size of respective frequency identification signals and a multiple channel processor 130 allocating the channels through the use of a correlation among the multiple channels and signals size information are provided. The bit allocation unit 140 allocating the bits to the respective audio signals by using the result of the multiple channel processor 130 and the result of a psychological acoustic part 170 and a quantizer 150 quantizing the multiple channel audio signals in the frequency area by using the bit allocated to the bit allocation unit 140 are provided. Thus, the audio signals of the multiple channels can be transmitted by encoding the audio signals of the multiple channels by using APCM and the correlation among the channels.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は多チャネルオーディ
オ符号化器及び符号化方法に係り、特にAPCM(Ad
aptive Pluse Coded Modula
tion)と各チャネル間の相関関係を用いて多チャネ
ルのオーディオ信号を少量のビットで効率的に符号化す
るための符号化器及び符号化方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a multi-channel audio coder and a coding method, and more particularly to APCM (Ad
adaptive Plus Coded Module
and an encoding method for efficiently encoding a multi-channel audio signal with a small number of bits by using the correlation between each channel.

【0002】[0002]

【従来の技術】従来の多チャネルオーディオの符号化器
と復号化器の場合、与えられる伝送チャネルの数が制限
されている反面、元の信号チャネルは増える趨勢なので
十分な音質を有して伝送することが困難になる。このよ
うな理由により一部オーディオコデックアルゴリズムは
音の正しい伝送より再生時の音の方向性に重点を置く場
合もある。
2. Description of the Related Art In the case of conventional multi-channel audio encoders and decoders, although the number of transmission channels provided is limited, the number of original signal channels tends to increase, so that transmission is performed with sufficient sound quality. Difficult to do. For this reason, some audio codec algorithms may place more emphasis on the directionality of the sound during reproduction than on the correct transmission of the sound.

【0003】従来のオーディオコデックアルゴリズムは
既存のステレオシステムとの交換性を有するため元の信
号を混ぜてステレオチャネルを作るが、この場合復号化
時ステレオチャネルで再び多チャネル信号を作ると、ス
テレオ再生時には聞こえなかった量子化歪曲が生じる場
合がある。これは伝送された多チャネル信号をさらに混
合して使用すると、深刻な問題となる場合がある。
Since the conventional audio codec algorithm has interchangeability with the existing stereo system, the original signals are mixed to form a stereo channel. In this case, when a multi-channel signal is recreated in the stereo channel at the time of decoding, stereo reproduction is performed. Occasionally, audible quantization distortion may occur. This can be a serious problem when the transmitted multi-channel signals are used with further mixing.

【0004】一方、MPEGー2オーディオ標準案であ
るISO/IEC 13818ー3によるオーディオコ
ーデックアルゴリズムは、サブバンドフィルタリング過
程、マトリックシング過程、第1スケールファクタ算出
過程、第1伝送パターン算出過程、心理音響モデルによ
るSMR(Signal−to−Masking Ra
tio)値の算出過程と、伝送チャネル割当過程、ダイ
ナミック漏話抑制過程、遅延補償値、予測係数及び予測
利得値算出過程、予測選択情報算出過程、修正されたS
MR値の算出過程、予測係数量子化過程、初期予測エラ
ー信号算出過程、第2スケールファクタ算出過程、第2
伝送パターン算出過程、修正されたSMR値を使用した
ビット割当過程、第1サブバンドサンプル量子化過程、
サブバンドサンプルの逆量子化過程、逆量子化されたサ
ブバンドサンプルを利用した最終予測エラー信号算出過
程、第3スケールファクタ算出過程、第3伝送パターン
算出過程、第2サブバンドサンプル量子化過程及びビッ
トストリームフォーマット過程よりなる。前記のオーデ
ィオコーデックアルゴリズムは極めて複雑であるだけで
なく、スケールファクタ算出過程と伝送パターン算出過
程を3回繰り返して行うなどのようにルーチンを数回繰
り返すべきであり、初期に入力された多チャネルオーデ
ィオ信号に対してのみ心理音響モデルが適用できる短所
があった。
On the other hand, an audio codec algorithm according to ISO / IEC 13818-3, which is a proposed MPEG-2 audio standard, includes a subband filtering process, a matrixing process, a first scale factor calculating process, a first transmission pattern calculating process, and a psychoacoustic process. Model-based SMR (Signal-to-Masking Ra)
tio) value calculation process, transmission channel allocation process, dynamic crosstalk suppression process, delay compensation value, prediction coefficient and prediction gain value calculation process, prediction selection information calculation process, and modified S
MR value calculation process, prediction coefficient quantization process, initial prediction error signal calculation process, second scale factor calculation process, second
A transmission pattern calculation process, a bit allocation process using the modified SMR value, a first subband sample quantization process,
Dequantization process of subband samples, final prediction error signal calculation process using dequantized subband samples, third scale factor calculation process, third transmission pattern calculation process, second subband sample quantization process, and It consists of a bitstream formatting process. The above audio codec algorithm is not only complicated but it should repeat the routine several times, such as repeating the scale factor calculation process and the transmission pattern calculation process three times. However, the psychoacoustic model can be applied only to signals.

【0005】[0005]

【発明が解決しようとする課題】したがって、本発明の
目的は前述した問題点を解決するためにAPCMと各チ
ャネル間の相関関係を利用して多チャネルのオーディオ
信号を少量のビットで効率的に符号化するための多チャ
ネルオーディオ符号化方法を提供するにある。
SUMMARY OF THE INVENTION Therefore, the object of the present invention is to solve the above-mentioned problems by efficiently utilizing the correlation between APCM and each channel to efficiently convert a multi-channel audio signal with a small number of bits. A multi-channel audio coding method for coding is provided.

【0006】本発明の他の目的は前記他チャネルオーデ
ィオ符号化方法を実現するに最も適合な符号化器を提供
するにある。
Another object of the present invention is to provide an encoder most suitable for realizing the other channel audio encoding method.

【0007】[0007]

【課題を解決するための手段】前記の目的を達成するた
めに他チャネルオーディオ符号化方法は、多チャネルに
入力されるオーディオ信号を符号化するための多チャネ
ルオーディオ符号化器において、時間領域のステレオオ
ーディオ信号と多チャネルオーディオ信号に対して計算
された各チャネルのマスキングレベルと、周波数領域の
ステレオオーディオ信号と多チャネルオーディオ信号に
対する各周波数別信号の大きさ情報と、各チャネル間の
相関関係に応じて前記各チャネルのオーディオ信号に対
して伝送するか否かを判断し、チャネルを割当てる多チ
ャネル処理過程と、前記多チャネル処理過程のチャネル
割当の結果と前記マスキングレベルに応じて前記各オー
ディオ信号に対するビットを割当てるビット割当過程
と、前記ビット割当過程でのビット割当の結果を利用し
て前記周波数領域の多チャネルオーディオ信号をAPC
M量子化する量子化過程とを含むことを特徴とする。
In order to achieve the above object, another channel audio encoding method is a multi-channel audio encoder for encoding audio signals input to multiple channels. The masking level of each channel calculated for the stereo audio signal and the multi-channel audio signal, the signal size information of each frequency for the stereo audio signal and the multi-channel audio signal in the frequency domain, and the correlation between the channels According to the masking level, a multi-channel processing step of deciding whether or not to transmit the audio signal of each channel and allocating channels, a result of the channel allocation in the multi-channel processing step, and the masking level. Bit allocation process for allocating bits for The multi-channel audio signal APC in the frequency domain by using the results of the bit allocation in extent
And a quantization process of M quantization.

【0008】前記他の目的を達成するために本発明によ
る多チャネルオーディオ符号化器は、時間領域に存する
多チャネルオーディオ信号を入力してステレオオーディ
オ信号を形成するための第1ミキサーと、周波数領域に
変換された多チャネルオーディオ信号を入力してステレ
オオーディオ信号を形成するための第2ミキサーと、前
記第1ミキサーから出力される時間領域のステレオオー
ディオ信号と前記時間領域の多チャネルオーディオ信号
を入力して各チャネルのマスキングレベルを計算するた
めの心理音響部と、前記第2ミキサーから出力される周
波数領域のステレオオーディオ信号と周波数領域の多チ
ャネルオーディオ信号に対する各周波数別信号の大きさ
情報と、前記心理音響部で計算されたマスキングレベル
を入力して前記各チャネルのオーディオ信号に対して伝
送するか否かを判断し、チャネルを割当てるための多チ
ャネル処理器と、前記多チャネル処理器でのチャネル割
当の結果と前記マスキングレベルを入力して前記各オー
ディオ信号に対するビットを割当てるためのビット割当
器と、前記ビット割当器でのビット割当の結果を用いて
前記周波数領域の多チャネルオーディオ信号をAPCM
量子化するための量子化器とを含むことを特徴とする。
In order to achieve the above-mentioned another object, a multi-channel audio encoder according to the present invention comprises a first mixer for inputting a multi-channel audio signal existing in the time domain to form a stereo audio signal, and a frequency domain. A second mixer for inputting the converted multi-channel audio signal to form a stereo audio signal, and a time domain stereo audio signal output from the first mixer and the time domain multi channel audio signal A psychoacoustic section for calculating a masking level of each channel, and size information of each frequency-based signal for the frequency domain stereo audio signal and the frequency domain multi-channel audio signal output from the second mixer, By inputting the masking level calculated by the psychoacoustic unit, A multi-channel processor for deciding whether or not to transmit a channel audio signal and allocating channels, a result of channel allocation in the multi-channel processor, and the masking level are input to input each audio signal. A bit allocator for allocating bits to the ACM and a result of the bit allocation in the bit allocator, and APCM the multi-channel audio signal in the frequency domain.
And a quantizer for quantizing.

【0009】[0009]

【発明の実施の形態】以下、添付した図面に基づき本発
明を詳細に説明する。
BEST MODE FOR CARRYING OUT THE INVENTION The present invention will be described in detail below with reference to the accompanying drawings.

【0010】図1は本発明による多チャネルオーディオ
符号化器の一実施例によるブロック図である。
FIG. 1 is a block diagram of an embodiment of a multi-channel audio encoder according to the present invention.

【0011】図1に示されたブロック図の構成は、多チ
ャネルオーディオ信号を周波数領域の信号に変えるフィ
ルタ100と、フィルタ100から出力される周波数領
域の多チャネルオーディオ信号をスレテオ信号とする第
2ミキサー110と、第2ミキサー110から出力され
る周波数領域のステレオオーディオ信号と多チャネルオ
ーディオ信号を入力して各周波数別信号の大きさ情報を
計算するAPCM前処理部120と、多チャネル間の相
関関係と信号の大きさ情報とを利用してチャネルを割当
てる多チャネル処理器130と、時間領域の多チャネル
オーディオ信号をステレオ信号とする第1ミキサー16
0と、時間領域の多チャネルオーディオ信号とスレテオ
信号を入力して各チャネルのマスキングレベルを計算す
る心理音響部170と、多チャネル処理器130の結果
と心理音響部170の結果を利用して各オーディオ信号
にビットを割当てるビット割当器140と、ビット割当
器140で割当てられたビットを利用して周波数領域の
多チャネルオーディオ信号を量子化する量子化器150
よりなる。
The configuration of the block diagram shown in FIG. 1 has a filter 100 for converting a multi-channel audio signal into a frequency domain signal and a second frequency channel multi-channel audio signal output from the filter 100 as a threshold signal. The mixer 110, the APCM preprocessor 120 that inputs the stereo audio signal in the frequency domain and the multi-channel audio signal output from the second mixer 110, and calculates the magnitude information of each frequency signal, and the correlation between the multi-channels A multi-channel processor 130 for allocating channels using the relationship and signal size information, and a first mixer 16 for converting a time-domain multi-channel audio signal into a stereo signal.
0, a psychoacoustic unit 170 that inputs a multi-channel audio signal and a stereo signal in the time domain to calculate the masking level of each channel, and a result of the multi-channel processor 130 and a result of the psychoacoustic unit 170 A bit allocator 140 that allocates bits to an audio signal, and a quantizer 150 that quantizes a multi-channel audio signal in the frequency domain using the bits allocated by the bit allocator 140
Consists of.

【0012】図2は図1において多チャネル処理器13
0の詳細ブロック図であって、周波数領域の多チャネル
オーディオ信号の大きさを各周波数別に比較して最も小
さい信号を伝送する信号として定めてチャネルを割当て
るチャネル割当器131と、各チャネル間の相関係数に
応じて伝送するか否かを定めてチャネルを割当てる相関
係数処理器132より構成される。
FIG. 2 shows a multi-channel processor 13 in FIG.
FIG. 2 is a detailed block diagram of 0, showing a channel allocator 131 for allocating channels by comparing the sizes of multi-channel audio signals in the frequency domain for each frequency, determining the signal as the smallest signal to be transmitted, and the phase between the channels. The correlation coefficient processor 132 determines whether or not to transmit according to the number of relations and allocates a channel.

【0013】図3は図1において量子化器150の詳細
ブロック図であって、ビット割当器140でのビット割
当の結果を用いて周波数領域の多チャネルオーディオ信
号を量子化する第1量子化器151と、第1量子化器1
51で量子化された信号を量子化以前の信号として復元
する逆量子化器152と、逆量子化器152で復元され
たオーディオ信号と周波数領域の多チャネルオーディオ
信号とを混合してステレオ信号を形成するステレオ信号
形成器153と、ビット割当器140でのビット割当の
結果を用いてステレオ信号形成器153から出力される
周波数領域のステレオオーディオ信号を量子化する第2
量子化器154と、第1量子化器151で量子化された
信号と第2量子化器154で量子化された信号とを用い
てビットストリームを形成するビットストリーム形成器
155より構成される。
FIG. 3 is a detailed block diagram of the quantizer 150 shown in FIG. 1. The first quantizer quantizes a multi-channel audio signal in the frequency domain using the bit allocation result of the bit allocator 140. 151 and the first quantizer 1
A dequantizer 152 that restores the signal quantized by 51 as a signal before quantization, and an audio signal restored by the dequantizer 152 and a multi-channel audio signal in the frequency domain are mixed to form a stereo signal. A stereo signal former 153 to be formed, and a second audio signal quantized by the bit allocator 140 to quantize the frequency domain stereo audio signal output from the stereo signal former 153;
It comprises a quantizer 154 and a bitstream former 155 which forms a bitstream using the signal quantized by the first quantizer 151 and the signal quantized by the second quantizer 154.

【0014】図4は図2において相関係数処理器132
の動作を説明するためのフローチャートであり、400
段階ないし403段階は与えられた多チャネルオーディ
オ信号のうち最も高い周波数で信号間の相関係数を求
め、相関係数を相互比較して最も大きい相関係数を有す
るチャネルを求める過程であり、404段階ないし40
6段階は最も大きい相関係数を有するチャネルがステレ
オチャネルであるかを判断して当たる処理を行う過程で
あり、407段階ないし410段階は予想ビット発生量
が使用可能なビット量より多い場合、選ばれた周波数領
域の全てのオーディオ信号に対して前記過程を繰り返す
過程である。
FIG. 4 shows the correlation coefficient processor 132 in FIG.
Is a flow chart for explaining the operation of
Steps 403 to 403 are steps of obtaining a correlation coefficient between signals at the highest frequency among the given multi-channel audio signals and comparing the correlation coefficients with each other to obtain a channel having the largest correlation coefficient. Steps to 40
Step 6 is a process of determining whether the channel having the largest correlation coefficient is a stereo channel and performing a corresponding process. Steps 407 to 410 are selected when the expected bit generation amount is larger than the usable bit amount. The above process is repeated for all audio signals in the selected frequency domain.

【0015】さて、本発明の動作を図1乃至図4を参照
して説明する。
The operation of the present invention will be described with reference to FIGS.

【0016】まず、図1を参照すれば、入力される多チ
ャネルオーディオ信号はフィルタ100を通じて周波数
領域の信号に変わるようになる。
First, referring to FIG. 1, an input multi-channel audio signal is converted into a frequency domain signal through the filter 100.

【0017】与えられた時間領域のオーディオ信号は既
存のステレオシステムで再生するに適合な形態に第1ミ
キサー160で混合される。一方、フィルタ100で周
波数領域に変わったオーディオ信号も第2ミキサー11
0で混合されてステレオシステムに当たる周波数領域の
オーディオ信号が形成される。
The given time domain audio signals are mixed in the first mixer 160 in a form suitable for reproduction on an existing stereo system. On the other hand, the audio signal changed to the frequency domain by the filter 100 also receives the second mixer 11
The audio signals in the frequency domain that are mixed with 0 and hit the stereo system are formed.

【0018】第1ミキサー160から出力される時間領
域のステレオオーディオ信号と元の時間領域の多チャネ
ルオーディオ信号は心理音響部170に入力されてそれ
ぞれのマスキングレベルが計算される。
The time-domain stereo audio signal output from the first mixer 160 and the original time-domain multi-channel audio signal are input to the psycho-acoustic section 170, and their masking levels are calculated.

【0019】周波数領域での元の多チャネルオーディオ
信号とステレオオーディオ信号はAPCM前処理部12
0に入力されてAPCMに必要な各周波数別オーディオ
信号の大きさ情報が計算される。
The original multi-channel audio signal and the stereo audio signal in the frequency domain are APCM preprocessing section 12
0 is input to calculate the size information of each frequency-specific audio signal required for APCM.

【0020】APCM前処理部120から出力されるA
PCMに必要な各周波数別オーディオ信号の大きさ情報
と、心理音響部170から出力されるマスキングレベル
値は多チャネル処理器130に入力されてチャネル間の
相関関係とチャネル間の信号レベルの大きさの違いに応
じて伝送する信号と伝送しなくても良い信号とを区別す
る。この区別が不要な理由は伝送チャネルのチャネル容
量が与えられた多チャネル信号と新たに形成されたステ
レオ信号の両方を伝送するほど大きくないからである。
多チャネル処理器130の動作を図2を参照してさらに
詳細に説明すると次の通りである。
A output from the APCM preprocessor 120
The information about the size of the audio signal for each frequency required for PCM and the masking level value output from the psychoacoustic unit 170 are input to the multi-channel processor 130, and the correlation between the channels and the level of the signal level between the channels are input. The signal to be transmitted and the signal that may not be transmitted are distinguished according to This distinction is not necessary because the channel capacity of the transmission channels is not so great as to transmit both the given multi-channel signal and the newly formed stereo signal.
The operation of the multi-channel processor 130 will be described in more detail with reference to FIG.

【0021】図2において、チャネル割当器131はA
PCM前処理部(図1の120)から与えられた信号間
の大きさ情報を利用してオーディオ信号を伝送するか否
かを定めるが、即ち、多チャネルオーディオ信号を各周
波数別に大きさを比較して最も小さい信号を伝送する信
号として定める。一方、一定な時間区間で平均大きさが
最も小さい信号を伝送する信号として定める場合もあ
る。
In FIG. 2, the channel allocator 131 is A
Whether or not to transmit the audio signal is determined by using the size information between the signals provided from the PCM pre-processing unit (120 in FIG. 1), that is, the size of the multi-channel audio signal is compared for each frequency. Then, the smallest signal is determined as the signal to be transmitted. On the other hand, there is a case where a signal having the smallest average magnitude is set as a signal to be transmitted in a certain time period.

【0022】相関係数処理器132は各チャネル間の相
関係数を利用してオーディオ信号を伝送するか否かを定
める。これを図4に示されたフローチャートを参照して
さらに詳細に説明すれば次の通りである。
The correlation coefficient processor 132 determines whether or not to transmit the audio signal using the correlation coefficient between the channels. This will be described in more detail with reference to the flowchart shown in FIG.

【0023】図4において、400段階では時間領域の
多チャネル信号から変換された周波数周波数領域の多チ
ャネル信号と周波数領域の多チャネル信号とを混合して
作った周波数領域のステレオ信号を入力し、401段階
〜403段階では最も高い周波数領域で最も大きさ相関
係数を有するチャネルを選択した後、404段階〜40
5段階ではこのチャネルのうち一つがステレオチャネル
である場合、これに合うチャネルは大きさ成分のみ残し
て伝送しないと定める。406段階では若し元の多チャ
ネル中の二つが最も大きい相関係数を有すると、二つの
チャネルの平均値を一チャネルに入れ、残りチャネルは
大きさ成分のみ残して伝送しない。
In FIG. 4, in step 400, a frequency domain stereo signal generated by mixing a frequency domain multi channel signal and a frequency domain multi channel signal converted from a time domain multi channel signal is input. In steps 401 to 403, the channel having the highest magnitude correlation coefficient in the highest frequency domain is selected, and then steps 404 to 40.
In step 5, if one of the channels is a stereo channel, it is determined that the matching channel does not transmit, leaving only the magnitude component. In step 406, if two of the original multiple channels have the largest correlation coefficient, the average value of the two channels is put into one channel, and the remaining channels leave only the magnitude component and do not transmit.

【0024】407段階〜408段階では予想ビット発
生量を計算して使用可能なビット量より少ない場合本フ
ローチャートを終了し、大きい場合選ばれた周波数領域
の全てのオーディオ信号が処理されたかを判断する(4
09段階)。
In steps 407 to 408, the expected bit generation amount is calculated, and if it is less than the usable bit amount, this flow chart is terminated, and if it is larger, it is determined whether all audio signals in the selected frequency domain have been processed. (4
09).

【0025】409段階での判断の結果、選ばれた周波
数領域の信号の全てが処理された場合、410段階で最
も高い周波数領域より低い周波数領域の信号を選択して
402段階に復帰し、全部処理されない場合411段階
でその次の大きい相関係数を有するチャネルを選んで前
述したように同一な方法で処理する。
When all the signals in the selected frequency domain are processed as a result of the determination in step 409, the signal in the frequency domain lower than the highest frequency domain is selected in step 410, and the process returns to step 402. If not processed, in step 411, the channel having the next largest correlation coefficient is selected and processed in the same manner as described above.

【0026】このように過程を繰り返して全てのチャネ
ルを使用しても生成されるデータの量が多ければ、その
下の周波数領域に行って全体過程を繰り返す。この際、
生成されるデータ量は伝送される信号のマスキングレベ
ルより所定値ほど低い水準に量子化歪曲が生じるように
するビット数から算出することができる。
If the amount of data generated is large even if all the channels are used by repeating the process as described above, the process is repeated in the frequency region below. On this occasion,
The amount of generated data can be calculated from the number of bits that causes quantization distortion at a level lower than the masking level of the transmitted signal by a predetermined value.

【0027】心理音響部170で計算された各チャネル
のマスキングレベル、多チャネル処理器130の処理結
果、APCM前処理部120の処理結果とを利用してビ
ット割当器140では各オーディオ信号にビットを割当
てる。即ち、多チャネル処理器130で伝送しないと定
められた信号にはビットを割り当てず、伝送されると定
められた信号とステレオ信号に対してのみビットを割当
てる。
Using the masking level of each channel calculated by the psychoacoustic section 170, the processing result of the multi-channel processor 130, and the processing result of the APCM preprocessor 120, the bit allocator 140 assigns a bit to each audio signal. Allocate. That is, no bits are assigned to the signals determined not to be transmitted by the multi-channel processor 130, and bits are assigned only to the signals determined to be transmitted and the stereo signals.

【0028】量子化器150ではビット割当器140の
結果を用いてフィルタ100の出力信号に対してAPC
M量子化を遂行し、この結果を他の情報と共に伝送す
る。これを図3を参照して、さらに詳細に説明すれば、
量子化器150は先ず割当てられたビットを利用してフ
ィルタ100から出力される元の他チャネル信号を符号
化した後、この信号を復号化して伝送しない信号と共に
混合して更にステレオ信号を作る。このステレオ信号を
割当てられたビットを利用して符号化する。
The quantizer 150 uses the result of the bit allocator 140 to APC the output signal of the filter 100.
Perform M quantisation and transmit the result with other information. This will be described in more detail with reference to FIG.
The quantizer 150 first encodes the original other channel signal output from the filter 100 using the allocated bits, and then decodes this signal and mixes it with the signal not to be transmitted to form a further stereo signal. This stereo signal is encoded using the allocated bits.

【0029】[0029]

【発明の効果】前述したように本発明による多チャネル
オーディオ符号化器及び符号化方法ではAPCMと各チ
ャネル間の相関関係を利用して多チャネルのオーディオ
信号を符号化することにより、少ない数の伝送チャネル
でも多くのチャネルのオーディオ信号を伝送することが
でき、既存のAPCM復号化器と互換されるように伝送
することが可能である。
As described above, in the multi-channel audio encoder and encoding method according to the present invention, the multi-channel audio signal is encoded by utilizing the correlation between the APCM and each channel. It is possible to transmit audio signals of many channels on the transmission channel, and it is possible to transmit audio signals compatible with existing APCM decoders.

【0030】また、復号化してステレオシステムで再生
することも可能であり、伝送されたステレオ信号で更に
多チャネルオーディオ信号を作ったり、この信号を再び
混合してスレテオ信号とする場合にも符号化歪曲が耳に
は聞こえなくなる。
It is also possible to decode and reproduce in a stereo system, and to encode even when multi-channel audio signals are made from the transmitted stereo signals, or when these signals are mixed again into a stereo signal. The distortion is inaudible.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明による多チャネルオーディオ符号化器の
一実施例によるブロック図である。
FIG. 1 is a block diagram of an embodiment of a multi-channel audio encoder according to the present invention.

【図2】図1において多チャネル処理器の詳細ブロック
図である。
FIG. 2 is a detailed block diagram of a multi-channel processor in FIG.

【図3】図1において量子化器の詳細ブロック図であ
る。
FIG. 3 is a detailed block diagram of a quantizer in FIG.

【図4】図2において相関係数処理器の動作を説明する
ためのフローチャートである。
4 is a flowchart for explaining the operation of the correlation coefficient processor in FIG.

Claims (10)

【特許請求の範囲】[Claims] 【請求項1】 時間領域に存する多チャネルオーディオ
信号を入力してステレオオーディオ信号を形成するため
の第1ミキサーと、 周波数領域に変換された多チャネルオーディオ信号を入
力してステレオオーディオ信号を形成するための第2ミ
キサーと、 前記第1ミキサーから出力される時間領域のステレオオ
ーディオ信号と前記時間領域の多チャネルオーディオ信
号を入力して各チャネルのマスキングレベルを計算する
ための心理音響部と、 前記第2ミキサーから出力される周波数領域のステレオ
オーディオ信号と周波数領域の多チャネルオーディオ信
号に対する各周波数別信号の大きさ情報と、前記心理音
響部から計算されたマスキングレベルを入力して前記各
チャネルのオーディオ信号に対して伝送するか否かを判
断し、チャネルを割当てるための多チャネル処理器と、 前記多チャネル処理器のチャネル割当の結果と前記マス
キングレベルを入力して前記各オーディオ信号に対する
ビットを割当てるためのビット割当器と、 前記ビット割当器でのビット割当の結果を用いて前記周
波数領域の多チャネルオーディオ信号をAPCM量子化
するための量子化器とを含むことを特徴とする多チャネ
ルオーディオ符号化器。
1. A first mixer for inputting a multi-channel audio signal existing in a time domain to form a stereo audio signal, and a multi-channel audio signal converted to a frequency domain to form a stereo audio signal. A second mixer for calculating a masking level of each channel by inputting a time-domain stereo audio signal output from the first mixer and the time-domain multi-channel audio signal; The magnitude information of each frequency signal for the frequency-domain stereo audio signal and the frequency-domain multi-channel audio signal output from the second mixer, and the masking level calculated from the psychoacoustic unit are input to input each channel. Determine whether to transmit the audio signal and allocate the channel. A multi-channel processor for applying the same, a bit allocator for allocating a bit for each audio signal by inputting the result of the channel allocation of the multi-channel processor and the masking level, and bit allocation in the bit allocator And a quantizer for APCM-quantizing the multi-channel audio signal in the frequency domain by using the result of (1).
【請求項2】 前記多チャネル処理器は、 前記周波数領域の多チャネルオーディオ信号の大きさを
各周波数別に比較して最も小さい大きさの信号を伝送す
る信号として定めてチャネルを割当てるチャネル割当器
と、 前記各チャネル間の相関係数を算出し、算出された相関
係数に応じて伝送するか否かを定める相関係数処理器よ
り構成されることを特徴とする請求項1記載の多チャネ
ルオーディオ符号化器。
2. The channel allocator, wherein the multi-channel processor allocates channels by comparing the sizes of the multi-channel audio signals in the frequency domain for each frequency and determining the signal as the signal that transmits the smallest signal. 2. The multi-channel according to claim 1, further comprising: a correlation coefficient processor that calculates a correlation coefficient between the channels and determines whether or not to transmit according to the calculated correlation coefficient. Audio encoder.
【請求項3】 前記チャネル割当器は前記多チャネルオ
ーディオ信号の各周波数帯域で所定の時間の間最も小さ
い平均大きさを有する信号を伝送信号として定めてチャ
ネルを割当てることを特徴とする請求項2記載の多チャ
ネルオーディオ符号化器。
3. The channel allocator determines a signal having the smallest average magnitude in each frequency band of the multi-channel audio signal for a predetermined time as a transmission signal and allocates a channel. A multi-channel audio encoder as described.
【請求項4】 前記相関係数処理器は最も高い周波数帯
域でステレオチャネルが最も大きい相関係数を有するチ
ャネルとして選ばれる場合、前記ステレオチャネルに合
う信号は大きさ成分のみ残して伝送しないと定めること
を特徴とする請求項2記載の多チャネルオーディオ符号
化器。
4. The correlation coefficient processor determines that, when a stereo channel is selected as a channel having the largest correlation coefficient in the highest frequency band, a signal matching the stereo channel is not transmitted while leaving only a magnitude component. A multi-channel audio encoder according to claim 2, characterized in that
【請求項5】 前記相関係数処理器は最も高い周波数帯
域で二つのチャネルが最も大きい相関係数を有するチャ
ネルとして選ばれる場合、前記二つのチャネルに伝送さ
れるオーディオ信号の平均値を一チャネルに入れ、残り
チャネルは大きさ成分のみ残して伝送しないと定めるこ
とを特徴とする請求項2記載の多チャネルオーディオ符
号化器。
5. The correlation coefficient processor, when the two channels are selected as the channels having the highest correlation coefficient in the highest frequency band, determines the average value of the audio signals transmitted to the two channels as one channel. 3. The multi-channel audio encoder according to claim 2, wherein the remaining channels are determined not to be transmitted while leaving only the magnitude component.
【請求項6】 前記相関係数処理器は最も高い周波数帯
域に対して最も大きい相関係数を有するチャネルを選択
し、そのチャネルの特性に応じて伝送するか否かを定
め、前記最も高い周波数帯域に対して全ての多チャネル
オーディオ信号が処理されれば、その下の周波数領域に
対して前記処理過程を繰り返すことを特徴とする請求項
2記載の多チャネルオーディオ符号化器。
6. The correlation coefficient processor selects a channel having the largest correlation coefficient with respect to the highest frequency band, determines whether to transmit according to the characteristics of the channel, and determines the highest frequency. 3. The multi-channel audio encoder according to claim 2, wherein, when all the multi-channel audio signals have been processed for the band, the processing steps are repeated for the frequency domain thereunder.
【請求項7】 前記相関係数処理器は前記マスキングレ
ベルを用いて予想ビット発生量を計算し、前記予想ビッ
ト発生量の使用可能なビット量より多い場合、前記その
下の周波数領域に対して前記処理過程を繰り返すことを
特徴とする請求項6記載の多チャネルオーディオ符号化
器。
7. The correlation coefficient processor uses the masking level to calculate a predicted bit generation amount, and if the predicted bit generation amount is larger than the usable bit amount, the frequency band below the predicted bit generation amount is calculated. 7. The multi-channel audio encoder according to claim 6, wherein the processing steps are repeated.
【請求項8】 前記量子化器は、前記ビット割当器での
ビット割当の結果を用いて前記周波数領域の多チャネル
オーディオ信号を量子化する第1量子化器と、 前記第1量子化器で量子化された信号を量子化以前の信
号として復元する逆量子化器と、 前記逆量子化器で復元されたオーディオ信号と前記周波
数領域の多チャネルオーディオ信号を混合してステレオ
信号を形成するステレオ信号形成器と、 前記ビット割当器でのビット割当の結果を用いて前記ス
テレオ信号形成器から出力される周波数領域のステレオ
オーディオ信号を量子化する第2量子化器と、 前記第1量子化器で量子化された信号と前記第2量子化
器で量子化された信号とを用いてビットストリームを形
成するビットストリーム形成器より構成されることを特
徴とする請求項1記載の多チャネルオーディオ符号化
器。
8. The quantizer includes: a first quantizer that quantizes the multi-channel audio signal in the frequency domain using a result of bit allocation in the bit allocator; and the first quantizer. An inverse quantizer that restores a quantized signal as a signal before quantization, and a stereo that mixes the audio signal restored by the inverse quantizer and the multi-channel audio signal in the frequency domain to form a stereo signal A signal former, a second quantizer for quantizing the frequency domain stereo audio signal output from the stereo signal former using the bit allocation result of the bit allocation unit, and the first quantizer 7. A bitstream forming unit for forming a bitstream using the signal quantized by the above and the signal quantized by the second quantizer. Multi-channel audio encoder according.
【請求項9】 多チャネルに入力されるオーディオ信号
を符号化するための多チャネルオーディオ符号化器にお
いて、 時間領域のステレオオーディオ信号と多チャネルオーデ
ィオ信号に応じて計算された各チャネルのマスキングレ
ベルと、周波数領域のステレオオーディオ信号と多チャ
ネルオーディオ信号に対する各周波数別信号の大きさ情
報と、各チャネル間の相関関係により前記各チャネルの
オーディオ信号に対して伝送するか否かを判断し、チャ
ネルを割当てる多チャネル処理過程と、 前記多チャネル処理過程でのチャネル割当の結果と前記
マスキングレベルに応じて前記各オーディオ信号に対す
るビットを割当てるビット割当過程と、 前記ビット割当過程でのビット割当の結果を用いて前記
周波数領域の多チャネルオーディオ信号をAPCM量子
化する量子化過程とを含むことを特徴とする多チャネル
オーディオ符号化方法。
9. A multi-channel audio encoder for encoding an audio signal input to multiple channels, wherein a stereo audio signal in a time domain and a masking level of each channel calculated according to the multi-channel audio signal are used. , It is determined whether or not to transmit the audio signal of each channel according to the size information of the signal for each frequency for the stereo audio signal in the frequency domain and the multi-channel audio signal and the correlation between the channels, and the channel is determined. A multi-channel processing step of allocating, a bit allocation step of allocating bits for each audio signal according to the result of channel allocation in the multi-channel processing step and the masking level, and a result of bit allocation in the bit allocation step are used. The multi-channel audio signal in the frequency domain A multi-channel audio coding method, comprising: a quantization process for APCM quantization.
【請求項10】 前記量子化過程は、 前記ビット割当過程で割当てられたビットを用いて周波
数領域の多チャネルオーディオ信号をAPCM量子化す
る第1量子化段階と、 前記第1量子化段階で量子化された信号を復元するため
に逆量子化する逆量子化段階と、 前記逆量子化段階で復元されたオーディオ信号と前記周
波数領域の多チャネルオーディオ信号とを混合してステ
レオ信号を形成するステレオ信号形成段階と、 前記ビット割当過程で割当てられたビットを用いて前記
ステレオ信号形成過程で形成される周波数領域のステレ
オオーディオ信号をさらにAPCM量子化する第2量子
化過程とを含むことを特徴とする請求項9記載の多チャ
ネルオーディオ符号化方法。
10. The quantizing process includes a first quantizing step of APCM quantizing a multi-channel audio signal in a frequency domain using the bits assigned in the bit assigning step, and a quantizing step in the first quantizing step. A dequantization step of dequantizing to reconstruct the reconstructed signal, and a stereo forming a stereo signal by mixing the audio signal reconstructed in the dequantization step and the multi-channel audio signal in the frequency domain. A signal forming step and a second quantizing step of further APCM quantizing the frequency-domain stereo audio signal formed in the stereo signal forming step using the bits allocated in the bit allocating step. The multi-channel audio encoding method according to claim 9.
JP21182895A 1995-08-21 1995-08-21 Multi-channel audio encoder and encoding method Expired - Fee Related JP3342996B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21182895A JP3342996B2 (en) 1995-08-21 1995-08-21 Multi-channel audio encoder and encoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21182895A JP3342996B2 (en) 1995-08-21 1995-08-21 Multi-channel audio encoder and encoding method

Publications (2)

Publication Number Publication Date
JPH0964751A true JPH0964751A (en) 1997-03-07
JP3342996B2 JP3342996B2 (en) 2002-11-11

Family

ID=16612271

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21182895A Expired - Fee Related JP3342996B2 (en) 1995-08-21 1995-08-21 Multi-channel audio encoder and encoding method

Country Status (1)

Country Link
JP (1) JP3342996B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100773539B1 (en) * 2004-07-14 2007-11-05 삼성전자주식회사 Multi channel audio data encoding/decoding method and apparatus
WO2022247651A1 (en) * 2021-05-28 2022-12-01 华为技术有限公司 Encoding method and apparatus for multi-channel audio signals

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101756834B1 (en) * 2008-07-14 2017-07-12 삼성전자주식회사 Method and apparatus for encoding and decoding of speech and audio signal

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100773539B1 (en) * 2004-07-14 2007-11-05 삼성전자주식회사 Multi channel audio data encoding/decoding method and apparatus
WO2022247651A1 (en) * 2021-05-28 2022-12-01 华为技术有限公司 Encoding method and apparatus for multi-channel audio signals

Also Published As

Publication number Publication date
JP3342996B2 (en) 2002-11-11

Similar Documents

Publication Publication Date Title
US6766293B1 (en) Method for signalling a noise substitution during audio signal coding
KR100261253B1 (en) Scalable audio encoder/decoder and audio encoding/decoding method
KR100261254B1 (en) Scalable audio data encoding/decoding method and apparatus
KR100335611B1 (en) Scalable stereo audio encoding/decoding method and apparatus
CN1926610B (en) Method for synthesizing a mono audio signal, audio decodeer and encoding system
KR101192241B1 (en) Mixing of input data streams and generation of an output data stream therefrom
KR100991450B1 (en) Audio coding system using spectral hole filling
KR100986924B1 (en) Information Signal Encoding
US6295009B1 (en) Audio signal encoding apparatus and method and decoding apparatus and method which eliminate bit allocation information from the encoded data stream to thereby enable reduction of encoding/decoding delay times without increasing the bit rate
JP3513292B2 (en) Noise weight filtering method
JP3186292B2 (en) High efficiency coding method and apparatus
USRE46082E1 (en) Method and apparatus for low bit rate encoding and decoding
US7003449B1 (en) Method of encoding an audio signal using a quality value for bit allocation
KR20090007396A (en) Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
US7583804B2 (en) Music information encoding/decoding device and method
KR20030068716A (en) Method for compressing audio signal using wavelet packet transform and apparatus thereof
JP4843142B2 (en) Use of gain-adaptive quantization and non-uniform code length for speech coding
JP2000151413A (en) Method for allocating adaptive dynamic variable bit in audio encoding
JP3342996B2 (en) Multi-channel audio encoder and encoding method
US20030220800A1 (en) Coding multichannel audio signals
JPH0870252A (en) Multichannel audio encoder and encoding method
KR970006827B1 (en) Audio signal encoding apparatus
KR100195708B1 (en) A digital audio encoder
JPH07327014A (en) Audio signal high efficiency coder
JPH06291670A (en) Encoding method for digital audio signal

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020806

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080823

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080823

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090823

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees