WO2006041137A1 - 音響信号符号化装置及び音響信号復号装置 - Google Patents

音響信号符号化装置及び音響信号復号装置 Download PDF

Info

Publication number
WO2006041137A1
WO2006041137A1 PCT/JP2005/018885 JP2005018885W WO2006041137A1 WO 2006041137 A1 WO2006041137 A1 WO 2006041137A1 JP 2005018885 W JP2005018885 W JP 2005018885W WO 2006041137 A1 WO2006041137 A1 WO 2006041137A1
Authority
WO
WIPO (PCT)
Prior art keywords
level difference
downmix
signal
difference information
acoustic signal
Prior art date
Application number
PCT/JP2005/018885
Other languages
English (en)
French (fr)
Inventor
Yoshiaki Takagi
Naoya Tanaka
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Priority to US11/577,151 priority Critical patent/US7689428B2/en
Priority to CN2005800352141A priority patent/CN101040323B/zh
Priority to EP05793725A priority patent/EP1865497B1/en
Priority to KR1020077008302A priority patent/KR101129877B1/ko
Publication of WO2006041137A1 publication Critical patent/WO2006041137A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/006Systems employing more than two channels, e.g. quadraphonic in which a plurality of audio signals are transformed in a combination of audio signals and modulated signals, e.g. CD-4 systems

Definitions

  • the present invention relates to an acoustic signal encoding device that encodes a multi-channel signal and an acoustic signal decoding device that decodes a signal encoded by the acoustic signal encoding device.
  • FIG. 1 is a block diagram showing a configuration of a conventional acoustic signal encoding device 10 and acoustic signal decoding device 20.
  • the multi-channel signal is a 2-channel signal
  • the acoustic signal encoding apparatus 10 downmixes the 2-channel signal to a 1-channel.
  • a downmix coefficient storage unit 11 stores a downmix coefficient indicating a downmix ratio, and the downmix coefficient is output to the downmix unit 12.
  • the downmix unit 12 mixes the input two-channel signal (multichannel signal) according to the downmix coefficient to form a one-channel downmix signal, and outputs the downmix signal to the multiplexing unit 14.
  • the level difference calculation unit 13 receives the same two-channel signal as the signal input to the downmix unit 12, calculates the level difference between the two input channel signals, and calculates the calculated level difference ( Level difference information) is output to the multiplexing unit 14.
  • the multiplexing unit 14 forms a bit stream by multiplexing the one-channel downmix signal output from the downmix unit 12 and the level difference information output from the level difference calculation unit 13. And output the formed bit stream from the acoustic signal encoding device 10.
  • the demultiplexing unit 21 also extracts the down stream signal and the level difference information from the bit stream power output from the acoustic signal encoder 10 and outputs the extracted down mix signal and the level difference information. Output to separator 22. [0008] Using the level difference information output from the demultiplexing unit 21, the demultiplexing unit 22 forms a 2-channel signal from the 1-channel downmix signal output from the demultiplexing unit 21.
  • the separation unit 22 uses only the level difference information to separate into two channel signals
  • the correlation information and phase information of the two channel signals are used. Can do.
  • a multi-channel signal can be encoded with a small number of channels (for example, see Non-Patent Document 1).
  • Non-Patent Document 1 "Text of lSO / IEC 14496-3: 2001 / FPDAM2 (Parametric Audio)" July 2003
  • the acoustic signal encoding device and the acoustic signal decoding device described above are designed for the purpose of downmixing a stereo signal into a monaural signal, and the two-channel signal to be downmixed is generated. It is assumed that the mixing ratio is 1: 1. On the other hand, when downmixing multi-channels typified by 5. lch surround, it is recommended that the two signals be downmixed at a mixing ratio other than 1: 1, such as 1 to 0.7.
  • the acoustic signal encoding device and the acoustic signal decoding device described above cannot correctly form the original multi-channel signal for such a downmix signal.
  • An object of the present invention is to provide an acoustic signal encoding apparatus that performs downmixing at different ratios and encodes a multi-channel signal with a small number of channels, and a signal encoded by the acoustic signal encoding apparatus. And an acoustic signal decoding device for decoding the.
  • the acoustic signal encoding apparatus includes a downmix unit that mixes a signal of a plurality of channels into a one-channel downmix signal at a ratio indicated by a downmix coefficient, and level difference information of the signals of the plurality of channels.
  • Level difference calculation means to calculate and level difference information Quantization means for quantizing the level difference information calculated by the level difference calculation means with a quantization characteristic that becomes lower resolution as the magnitude of the report deviates from 0, and a downmix signal mixed by the downmit means means
  • multiplexing means for forming a bitstream by multiplexing the level difference information quantized by the quantization means.
  • the acoustic signal decoding device of the present invention is a level difference obtained by quantizing a level difference between a single-channel downmix signal in which a plurality of channels of signals are mixed at a ratio indicated by a downmix coefficient and the plurality of channels of signals.
  • the bit stream force formed by the information and the demultiplexing means for extracting the quantized signal and the quantization level difference information, and the level difference information before quantization of the quantization level difference information extracted by the demultiplexing means By the inverse quantization means for converting to, the weighting means for weighting the level difference information converted by the inverse quantization means in accordance with the downmix coefficient used for forming the bit stream, and the weighting means Using the weighted level difference information, the downmix signal extracted by the demultiplexing means is mixed before mixing. It adopts a configuration comprising a separating means for separation into several channels.
  • the acoustic signal encoding method includes a step of mixing a signal of a plurality of channels into a downmix signal of one channel at a ratio indicated by a downmix coefficient, and calculating level difference information of the signals of the plurality of channels.
  • a step of forming a bit stream by multiplexing the converted level difference information is a step of mixing a signal of a plurality of channels into a downmix signal of one channel at a ratio indicated by a downmix coefficient, and calculating level difference information of the signals of the plurality of channels.
  • an acoustic signal encoding device that performs downmixing at different ratios and encodes a multi-channel signal with a small number of V ⁇ channels, and a signal encoded by the acoustic signal encoding device.
  • an acoustic signal decoding apparatus that decodes.
  • FIG. 1 is a block diagram showing a configuration of a conventional acoustic signal encoding device and acoustic signal decoding device.
  • FIG. 2 is a diagram of an acoustic signal encoding device and an acoustic signal decoding device according to Embodiment 1 of the invention. Block diagram showing the configuration
  • FIG. 4 Block diagram showing the configuration of the acoustic signal encoding apparatus and the acoustic signal decoding apparatus according to the second embodiment.
  • FIG. 6 is a block diagram showing a configuration of an acoustic signal encoding device and an acoustic signal decoding device according to the third embodiment.
  • FIG. 2 is a diagram showing a configuration of acoustic signal encoding apparatus 100 and acoustic signal decoding apparatus 200 according to Embodiment 1 of the present invention.
  • the multi-channel signal is a 2-channel signal and the acoustic signal encoding apparatus 100 downmixes the 2-channel signal to 1 channel will be described.
  • the downmix coefficient storage unit 101 stores a downmix coefficient indicating a downmix ratio.
  • the downmix coefficient is output to the downmix unit 102 and the weighting unit 103.
  • the downmix unit 102 mixes the input two-channel signal (multi-channel signal) according to the downmix coefficient from the downmix coefficient storage unit 101 to obtain a one-channel downmix signal, and converts the downmix signal into a downmix signal. Output to multiplexing section 105.
  • Weighting section 103 receives the same two-channel signal as the signal input to downmix section 102, and weights the level of the input two-channel signal according to the downmix coefficient. The weighted input signals of the two channels are output to the level difference calculation unit 104.
  • Level difference calculation section 104 calculates the level difference between the weighted two-channel signals, and outputs the calculated level difference (level difference information) to multiplexing section 105.
  • the multiplexing unit 105 multiplexes the one-channel downmix signal output from the downmix unit 102 and the level difference information output from the level difference calculation unit 104 to form a bitstream,
  • the formed bit stream is output from the acoustic signal encoding apparatus 100.
  • the demultiplexing unit 201 also extracts the downmix signal and the level difference information from the bitstream power output from the acoustic signal coding apparatus 100, and separates the extracted downmix signal and the level difference information from each other. Output to.
  • Separation section 202 uses the level difference information output from demultiplexing section 201 to form a 2-channel signal from the 1-channel downmix signal output from demultiplexing section 201.
  • the two-channel signal input to the acoustic signal encoding device 100 is mixed in the downmix unit 102 into the one-channel signal at the mixing ratio of the downmix coefficient stored in the downmix coefficient storage unit 101. .
  • the downmix signal mixed in one channel is output to multiplexing section 105.
  • the two-channel signals L 1 and L 2 input to the acoustic signal encoding apparatus 100 are weights
  • the level is changed by weighting according to the downmix coefficient ⁇ , a stored in the downmix coefficient storage unit 101, and the level is changed.
  • the two-channel signal whose level is changed is output to the level difference calculation unit 104.
  • the signal level of the two channels can be set to a level corresponding to the mixing ratio.
  • it can be realized by repeatedly downmixing 2 channels into 1 channel.
  • the level difference calculation unit 104 calculates the level difference of the weighted two-channel signals, and the calculated level difference is output to the multiplexing unit 105.
  • the downmix signal output from the downmix unit 102 and the level difference calculation unit 104 The output level difference information is multiplexed by the multiplexing unit 105 and output as a bit stream.
  • the bit stream input to the acoustic signal decoding apparatus 200 is separated into a downmix signal and level difference information in the demultiplexer 201.
  • the separated downmix signal is separated into two-channel signals in the separation unit 202 based on the separated level difference information.
  • the accuracy of the separation unit 202 can be improved by using information such as the cross-correlation and phase difference between the signals of the two channels in addition to the level difference information.
  • the calculation example of separation processing is shown below.
  • L is the separated left channel signal
  • R is the separated right channel signal
  • M is the downmix signal
  • M ' is the downmix signal force
  • the generated pseudo signal is the energy of the downmix signal
  • ILD is level difference information.
  • the 2-channel input signal is weighted according to the downmix coefficient, and the weighted 2-channel signal level is set.
  • the mixing ratio of the downmix coefficient is not superimposed on the level difference of the output signal in the acoustic signal decoding apparatus. Therefore, it is possible to prevent the level difference from being shifted.
  • FIG. 4 is a block diagram showing configurations of acoustic signal encoding apparatus 110 and acoustic signal decoding apparatus 210 according to Embodiment 2 of the present invention.
  • the level difference calculation unit 104 in the acoustic signal encoding device 110 receives the same 2-channel signal as the signal input to the downmix unit 102, and calculates the level difference between the input 2-channel signal.
  • the calculated level difference (level difference information) is output to the quantization unit 111.
  • the quantization unit 111 performs quantization with the resolution that the level difference information (input) output from the level difference calculation unit 104 is close to 0, high in the region, and high in resolution.
  • the quantization characteristic is that quantization is performed with a lower resolution as the level difference information level goes away from 0. To do. Then, the level difference information output from the level difference calculation unit 104 is compressed by quantization, and the quantized level difference information is output to the multiplexing unit 105.
  • Demultiplexing section 201 in acoustic signal decoding apparatus 210 extracts a downmix signal and quantization level difference information from the input bitstream, outputs the downmix signal to separation section 202, The quantization level difference information is output to the inverse quantization unit 211.
  • Dequantization section 211 converts the quantization level difference information output from demultiplexing section 201 into level difference information, and outputs the level difference information to weighting section 213.
  • the downmix coefficient storage unit 212 stores the same downmix coefficient as the downmix coefficient stored in the downmix coefficient storage unit 101 in the acoustic signal coding apparatus 110, and stores the stored downmix coefficient. Is output to the weighting unit 213.
  • the weighting unit 213 performs weighting according to the downmix coefficient output from the downmix coefficient storage unit 212 on the level difference information output from the inverse quantization unit 211, and separates the weighted level difference information. Output to part 202.
  • Level difference information is calculated in the level difference calculation unit 104 for the two-channel signal input to the acoustic signal encoding device 110, and the calculated level difference information is quantized in the quantization unit 111. .
  • the downmix signal and the quantized level difference information are multiplexed by the multiplexing unit 105 and output as a bit stream.
  • the bit stream input to the acoustic signal decoding device 210 is separated into a downmix signal and quantization level difference information by the demultiplexing unit 201, and the downmix signal is separated to the separation unit 202 by the quantization level difference.
  • Information is output to inverse quantization section 211.
  • the quantization level difference information is converted into level difference information before quantization by the inverse quantization unit 211, and the converted level difference information is used by the weighting unit 213 in the acoustic signal encoding apparatus 110. It is corrected from the fact that weighting is performed according to the same downmix coefficient as the downmix coefficient. A calculation example of the weighting process is shown below.
  • I and D ILD— org + 20 * log ( ⁇ ⁇ / ⁇ 3)
  • ILD is the level difference information used in the separation process
  • ILD_org is the dequantized level.
  • the difference information, ⁇ 0 and a 3 are downmix coefficients.
  • the downmix signal is based on the level difference information corrected by the separation unit 202! /, Separated into 2 channel signals.
  • a calculation example of separation processing is shown below.
  • L is a separated left channel signal
  • R is a separated right channel signal
  • M is a downmix signal
  • M ' is a downmix signal force generated pseudo signal
  • energy_dB is the energy of the downmix signal
  • ILD is level difference information.
  • the acoustic signal coding apparatus 100 shown in FIG. 2 includes the quantization unit 111 and downmixing is performed at a mixing ratio other than 1: 1, the weighting unit 103 Since weighting is performed according to the downmix coefficient, the level difference becomes large and quantization must be performed with low resolution.
  • the input 2-channel signal is not weighted, and weighting according to the downmix coefficient is performed after the inverse quantization process in acoustic signal decoding apparatus 210.
  • the mixing ratio of the downmix coefficient is superimposed on the level difference of the output signal in the acoustic signal decoding device 210.
  • Embodiment 2 in the acoustic signal encoding device, quantization is performed with high resolution in a region where the level difference information is close to 0, and the level difference information has a size of 0.
  • the level difference information of the input signals of the two channels is quantized with the quantization characteristic that quantization is performed at a lower resolution as the distance increases, and the level difference information before quantization is quantized by the acoustic signal decoding device.
  • FIG. 6 is a block diagram showing configurations of acoustic signal encoding apparatus 120 and acoustic signal decoding apparatus 220 according to Embodiment 3 of the present invention.
  • an acoustic signal encoding device 1 The downmix coefficient storage unit 121 in FIG. 20 stores a plurality of downmix coefficients indicating a plurality of different mixing ratios.
  • Coefficient selection section 122 selects which downmix coefficient to use from among a plurality of downmix coefficients stored in downmix coefficient storage section 121, and transmits the selected downmix coefficient to downmix section 102.
  • the coefficient selection information indicating the selected downmix coefficient is output to the multiplexing unit 105.
  • Multiplexing section 105 includes a one-channel downmix signal output from downmix section 102, quantization level difference information output from quantization section 111, and coefficient selection output from coefficient selection section 122.
  • a bit stream is formed by multiplexing the information, and the formed bit stream is output from the acoustic signal encoding device 120.
  • the demultiplexing unit 201 in the acoustic signal decoding device 220 extracts a downmix signal, quantization level difference information, and coefficient selection information from the input bitstream, and separates the downmit- ter signal from the separation unit 202.
  • the quantization level difference information is output to the inverse quantization unit 211, and the coefficient selection information is output to the coefficient selection unit 222.
  • the downmix coefficient storage unit 221 stores a plurality of downmix coefficients that are the same as the downmix coefficients stored in the downmix coefficient storage unit 121 in the acoustic signal coding apparatus 120.
  • Coefficient selection section 222 selects a downmix coefficient from downmix coefficient storage section 221 based on the coefficient selection information output from demultiplexing section 201, and outputs the selected downmix coefficient to weighting section 213. To do.
  • the down-mix coefficient storage unit 121 selects which down-mittance coefficient to use from the coefficient selection unit 122.
  • the following equation can be given.
  • Lmix 0 * Lf, al * Rf, a 2 * C, a 3 * Ls, a 4 * Rs, a 5 * LFE
  • Rmix ⁇ l * Rf, j8 0 * Lf, j8 2 * C, j8 3 * Ls J8 4 * Rs j8 5 * LFE
  • Lmix is a downmixed left channel signal
  • Rmix is a downmixed right channel signal
  • Lf is a left front channel signal
  • Rf is a right front channel.
  • Yannel signal C is center channel signal
  • Ls is left rear channel signal
  • Rs is right rear channel signal
  • LFE is subwoofer channel signal
  • ⁇ ⁇ , ⁇ ⁇ , ⁇ 2, ⁇ 3, ⁇ 4, ⁇ 5, ⁇ ⁇ , ⁇ 1, ⁇ 2, ⁇ 3, ⁇ 4, j8 5 represent downmix coefficients.
  • the following coefficients are defined by the ITU.
  • the two-channel signal input to the acoustic signal encoding device 120 is mixed into the one-channel signal in the downmix unit 102 at the mixing ratio of the downmix coefficient selected by the coefficient selection unit 122. .
  • level difference information is calculated in the level difference calculation unit 104 for the two-channel signal input to the acoustic signal encoding device 120, and the calculated level difference information is stored in the quantization unit.
  • the downmix signal, the quantization level difference information, and the coefficient selection information are output as a bit stream by being multiplexed in the multiplexing unit 105.
  • the bit stream input to the acoustic signal decoding device 220 is separated into a downmix signal, quantization level difference information, and coefficient selection information in the demultiplexing unit 201.
  • the coefficient selection unit 222 selects the same downmix coefficient as the downmix coefficient used in the acoustic signal encoding device 120 from the downmix coefficient storage unit 221.
  • the quantization level difference information is converted into level difference information before quantization by the inverse quantization unit 211.
  • the converted level difference information is corrected by weighting in accordance with the downmix coefficient selected by the coefficient selection unit 222 in the weighting unit 213.
  • the downmix signal is based on the level difference information corrected by the separation unit 202! /, Separated into 2 channel signals.
  • a 2-channel signal is mixed into one channel with a downmix coefficient selected from a plurality of different downmix coefficients, and is selected.
  • the audio signal decoding apparatus is notified of the downmix coefficients, and the audio signal decoding apparatus corrects the level difference information according to the notified downmix coefficients, so that the audio signal decoding apparatus can be used even when a plurality of downmix coefficients are used. It is possible to avoid the mixing ratio of the downmix coefficient from being superimposed on the level difference of the output signal in the output signal, thereby preventing the level difference from being shifted.
  • the case where coefficient selection information is transmitted has been described as an example.
  • the present invention is not limited to this, and the selected downmix coefficient itself may be transmitted.
  • the acoustic signal decoding device it is not necessary for the acoustic signal decoding device to include a plurality of downmix coefficients and a coefficient selection unit.
  • a downmix means for mixing an input signal of a plurality of channels into a single channel downmix signal at a mixing ratio indicated by a downmix coefficient, and the input signals of the plurality of channels.
  • weighting means for weighting each level according to the downmix coefficient
  • level difference calculating means for calculating the level difference of the signals of the plurality of channels weighted by the weighting means
  • downmix signal and the level difference calculating means are mixed by weighting means for weighting each level according to the downmix coefficient, level difference calculating means for calculating the level difference of the signals of the plurality of channels weighted by the weighting means.
  • a multiplexing means for forming a bit stream by multiplexing the level difference information calculated in this way.
  • downmix means for mixing an input signal of a plurality of channels into a single channel downmix signal at a mixing ratio indicated by a downmix coefficient, and the input signals of the plurality of channels
  • Level difference calculating means for calculating the level difference of the level difference
  • quantization means for quantizing the level difference information calculated by the level difference calculating means with a quantization characteristic that decreases as the size of the level difference information goes away from 0
  • a multiplexing means for forming a bitstream by multiplexing the downmix signal mixed by the downmixing means and the level difference information quantized by the quantizing means. It is an acoustic signal encoding device.
  • a level difference between a single-channel downmix signal obtained by mixing a plurality of input channel signals at a mixing ratio indicated by a downmix coefficient and the input plurality of channel signals is calculated.
  • Bitstream force formed by quantized level difference information Demultiplexing means for extracting a downmix signal and quantization level difference information, and quantization level difference information extracted by the demultiplexing means
  • Dequantization means for converting to level difference information before quantization, and weighting means for weighting the level difference information converted by the inverse quantization means in accordance with the downmix coefficient used to form the bitstream;
  • the down-difference extracted by the demultiplexing means using the level difference information weighted by the weighting means.
  • Separating means for separating the scan signals to multiple channels prior to mixing, an acoustic signal decoding apparatus comprising.
  • a coefficient selecting means that has a plurality of different downmix coefficients and selects any one of the downmix coefficients in the above aspect, and the multiplexing means.
  • the multiplexing means Is an acoustic signal encoding device that multiplexes coefficient selection information indicating a downmix coefficient selected by the coefficient selection means.
  • a 1-channel downmix signal obtained by mixing an input multi-channel signal at a mixing ratio indicated by a selected down-mittance coefficient, and the input multi-channel signal.
  • a demultiplexer for converting the quantization level difference information extracted by the demultiplexer into level difference information before quantization, and a plurality of different downmix coefficients
  • the demultiplexer Coefficient selection means for selecting a downmix coefficient based on the coefficient selection information extracted by the means, and the level converted by the inverse quantization means.
  • the weighting means for weighting the bell difference information according to the downmix coefficient selected by the coefficient selecting means and the level difference information weighted by the weighting means
  • the down-multiplexing means extracted by the demultiplexing means is used. Separating means for separating the mixed signal into a plurality of channels before mixing.
  • this method even when downmixing is performed at a mixing ratio other than one-to-one by performing weighting according to the downmix coefficient on the input signal levels of the plurality of channels, respectively. Mixing ratios other than one-to-one can be reflected in the level difference of the signals of multiple channels, so in the acoustic signal decoding device, avoiding the mixing ratio of the downmix coefficient superimposed on the level difference of the output signal. Can do.
  • the acoustic signal encoding device has an effect when downmixing is performed at different ratios, multichannel signals are encoded with a small number of channels, and needs to be downsized.
  • the acoustic signal decoding device can be applied to a portable device and the like.
  • the acoustic signal decoding device has an effect of decoding a signal encoded by the acoustic signal encoding device and needs to be downsized. Etc. can be applied.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

 異なる比率でダウンミックスを行い、マルチチャンネル信号を少ないチャンネル数で符号化する音響信号符号化装置と、当該音響信号符号化装置で符号化された信号を復号する音響信号復号装置とを開示する。これらの装置では、音響信号符号化装置(100)における重み付け手段(103)が2チャンネルの入力信号にダウンミックス係数に従った重み付けをそれぞれ行い、レベル差算出部(104)が重み付けを行った2チャンネルの信号のレベル差を算出し、音響信号復号装置(200)における分離部(202)が重み付けされたレベル差情報を用いてダウンミックス信号を2チャンネルの信号に分離する。

Description

明 細 書
音響信号符号化装置及び音響信号復号装置
技術分野
[0001] 本発明は、マルチチャンネル信号を符号化する音響信号符号化装置及び当該音 響信号符号化装置で符号化された信号を復号する音響信号復号装置に関する。 背景技術
[0002] 図 1は、従来の音響信号符号化装置 10及び音響信号復号装置 20の構成を示す ブロック図である。ここでは、マルチチャンネル信号を 2チャンネルの信号とし、音響 信号符号ィ匕装置 10が 2チャンネルの信号を 1チャンネルにダウンミックスする場合に ついて説明する。
[0003] まず、音響信号符号化装置 10について説明する。図 1において、ダウンミックス係 数記憶部 11は、ダウンミックスの比率を示すダウンミックス係数が記憶されており、ダ ゥンミックス係数がダウンミックス部 12に出力される。
[0004] ダウンミックス部 12は、入力された 2チャンネルの信号(マルチチャンネル信号)をダ ゥンミックス係数に従って混合することにより 1チャンネルのダウンミックス信号とし、ダ ゥンミックス信号を多重化部 14に出力する。
[0005] レベル差算出部 13は、ダウンミックス部 12に入力された信号と同一の 2チャンネル の信号が入力され、入力された 2チャンネルの信号のレベル差を算出し、算出したレ ベル差 (レベル差情報)を多重化部 14に出力する。
[0006] 多重化部 14は、ダウンミックス部 12から出力された 1チャンネルのダウンミックス信 号と、レベル差算出部 13から出力されたレベル差情報とを多重化することによりビット ストリームを形成し、形成したビットストリームを音響信号符号ィ匕装置 10から出力する
[0007] 次に、音響信号復号装置 20について説明する。図 1において、逆多重化部 21は、 音響信号符号ィ匕装置 10から出力されたビットストリーム力もダウンミックス信号とレべ ル差情報とを抽出し、抽出したダウンミックス信号とレベル差情報とを分離部 22に出 力する。 [0008] 分離部 22は、逆多重化部 21から出力されたレベル差情報を用いて、同じく逆多重 化部 21から出力された 1チャンネルのダウンミックス信号から 2チャンネルの信号を形 成する。
[0009] ここでは、分離部 22がレベル差情報のみを用いて、 2チャンネル信号に分離するよ う記載した力 レベル差情報に加えて 2チャンネルの信号の相関情報や位相情報な どを用いることができる。
[0010] このように、上述した音響信号符号化装置 10及び音響信号復号装置 20によれば、 マルチチャンネル信号を少ないチャンネル数で符号ィ匕することができる(例えば、非 特許文献 1参照)。
非特許文献 1 : "Text of lSO/IEC 14496- 3:2001/FPDAM2 (Parametric Audio)" 2003 年 7月
発明の開示
発明が解決しょうとする課題
[0011] しかしながら、上述した音響信号符号化装置及び音響信号復号装置は、ステレオ 信号をモノラル信号にダウンミックスすることを目的として発案されたものであり、ダウ ンミックス対象となる 2チャンネルの信号の混合比率が 1対 1であることを前提とするも のである。一方、 5. lchサラウンドに代表されるマルチチャンネルをダウンミックスす る際には、 2つの信号をたとえば 1対 0. 7など、 1対 1以外の混合比率でダウンミックス することが推奨されており、上述した音響信号符号化装置及び音響信号復号装置で はこのようなダウンミックス信号に対して正しく元のマルチチャンネル信号を形成でき ない。
[0012] 本発明の目的は、異なる比率でダウンミックスを行 ヽ、マルチチャンネル信号を少 ¾ ヽチャンネル数で符号化する音響信号符号化装置と、当該音響信号符号化装置 で符号化された信号を復号する音響信号復号装置とを提供することである。
課題を解決するための手段
[0013] 本発明の音響信号符号ィ匕装置は、複数チャンネルの信号をダウンミックス係数の 示す比率で 1チャンネルのダウンミックス信号に混合するダウンミックス手段と、前記 複数チャンネルの信号のレベル差情報を算出するレベル差算出手段と、レベル差情 報の大きさが 0から離れるにつれて低い分解能となる量子化特性で前記レベル差算 出手段によって算出されたレベル差情報を量子化する量子化手段と、前記ダウンミツ タス手段によって混合されたダウンミックス信号と、前記量子化手段によって量子化さ れたレベル差情報とを多重化することによりビットストリームを形成する多重化手段と、 を具備する構成を採る。
[0014] 本発明の音響信号復号装置は、複数チャンネルの信号がダウンミックス係数の示 す比率で混合された 1チャンネルのダウンミックス信号と前記複数チャンネルの信号 のレベル差が量子化されたレベル差情報とによって形成されたビットストリーム力 ダ ゥンミックス信号と量子化レベル差情報とを抽出する逆多重化手段と、前記逆多重化 手段によって抽出された量子化レベル差情報を量子化前のレベル差情報に変換す る逆量子化手段と、前記逆量子化手段によって変換されたレベル差情報に、前記ビ ットストリームの形成に用いられたダウンミックス係数に従って重み付けを行う重み付 け手段と、前記重み付け手段によって重み付けされたレベル差情報を用いて、前記 逆多重化手段によって抽出されたダウンミックス信号を混合前の複数チャンネルに分 離する分離手段と、を具備する構成を採る。
[0015] 本発明の音響信号符号ィ匕方法は、複数チャンネルの信号をダウンミックス係数の 示す比率で 1チャンネルのダウンミックス信号に混合するステップと、前記複数チャン ネルの信号のレベル差情報を算出するステップと、前記レベル差情報の大きさが 0か ら離れるにつれて低!、分解能となる量子化特性で前記レベル差情報を量子化するス テツプと、前記混合されたダウンミックス信号と、前記量子化されたレベル差情報とを 多重化することによりビットストリームを形成するステップと、を具備するようにした。 発明の効果
[0016] 本発明によれば、異なる比率でダウンミックスを行 ヽ、マルチチャンネル信号を少な Vヽチャンネル数で符号化する音響信号符号化装置と、当該音響信号符号化装置で 符号化された信号を復号する音響信号復号装置とを提供することができる。
図面の簡単な説明
[0017] [図 1]従来の音響信号符号化装置及び音響信号復号装置の構成を示すブロック図 [図 2]本発明の実施の形態 1に係る音響信号符号化装置及び音響信号復号装置の 構成を示すブロック図
[図 3]重み付け部の構成を示す図
圆 4]本実施の形態 2における音響信号符号ィ匕装置及び音響信号復号装置の構成 を示すブロック図
[図 5]量子化ステップを示す図
[図 6]本実施の形態 3における音響信号符号ィヒ装置及び音響信号復号装置の構成 を示すブロック図 発明を実施するための最良の形態
[0018] 以下、本発明の実施の形態について、図面を参照して詳細に説明する。なお、実 施の形態において、同一機能を有する構成には同一符号を付し、重複する説明は 省略する。
[0019] (実施の形態 1)
図 2は、本発明の実施の形態 1に係る音響信号符号ィ匕装置 100及び音響信号復 号装置 200の構成を示す図である。ここでは、マルチチャンネル信号を 2チャンネル の信号とし、音響信号符号ィ匕装置 100が 2チャンネルの信号を 1チャンネルにダウン ミックスする場合にっ 、て説明する。
[0020] まず、音響信号符号ィ匕装置 100について説明する。図 2において、ダウンミックス係 数記憶部 101には、ダウンミックスの比率を示すダウンミックス係数が記憶されており
、ダウンミックス係数がダウンミックス部 102及び重み付け部 103に出力される。
[0021] ダウンミックス部 102は、入力された 2チャンネルの信号(マルチチャンネル信号)を ダウンミックス係数記憶部 101からのダウンミックス係数に従って混合することにより 1 チャンネルのダウンミックス信号とし、ダウンミックス信号を多重化部 105に出力する。
[0022] 重み付け部 103は、ダウンミックス部 102に入力された信号と同一の 2チャンネルの 信号が入力され、入力された 2チャンネルの信号のレベルをダウンミックス係数に従 つてそれぞれ重み付けする。重み付けされた 2チャンネルの入力信号はレベル差算 出部 104に出力される。
[0023] レベル差算出部 104は、重み付けされた 2チャンネルの信号のレベル差を算出し、 算出したレベル差 (レベル差情報)を多重化部 105に出力する。 [0024] 多重化部 105は、ダウンミックス部 102から出力された 1チャンネルのダウンミックス 信号と、レベル差算出部 104から出力されたレベル差情報とを多重化することにより ビットストリームを形成し、形成したビットストリームを音響信号符号ィ匕装置 100から出 力する。
[0025] 次に、音響信号復号装置 200について説明する。図 2において、逆多重化部 201 は、音響信号符号ィ匕装置 100から出力されたビットストリーム力もダウンミックス信号と レベル差情報を抽出し、抽出したダウンミックス信号とレベル差情報とを分離部 202 に出力する。
[0026] 分離部 202は、逆多重化部 201から出力されたレベル差情報を用いて、同じく逆 多重化部 201から出力された 1チャンネルのダウンミックス信号から 2チャンネルの信 号を形成する。
[0027] 次に、上記構成を有する音響信号符号化装置 100及び音響信号復号装置 200の 動作について説明する。まず、音響信号符号ィ匕装置 100に入力された 2チャンネル の信号は、ダウンミックス部 102において、ダウンミックス係数記憶部 101に記憶され たダウンミックス係数の混合比率で 1チャンネルの信号に混合される。このとき、ダウン ミックス信号を圧縮符号ィ匕することも可能であるが、ここではその詳細な説明は省略 する。 1チャンネルに混合されたダウンミックス信号は多重化部 105に出力される。
[0028] また、音響信号符号ィ匕装置 100に入力された 2チャンネルの信号 L , Lは、重み
F S
付け部 103において、図 3に示すように、ダウンミックス係数記憶部 101に記憶された ダウンミックス係数 α , a に従って重み付けされることによりレベルが変更され、レべ
0 3
ルが変更された 2チャンネルの信号はレベル差算出部 104に出力される。これにより 、ダウンミックス係数が 1対 1以外の混合比率、例えば 1対ルート 2などであった場合で も、 2チャンネルの信号レベルをその混合比率に応じたレベルにすることができる。ま た、 2チャンネルより多くの信号をダウンミックスする際には、 2チャンネルを 1チャンネ ルにダウンミックスする作業を繰り返して行うことにより実現できる。
[0029] 重み付けされた 2チャンネルの信号は、レベル差算出部 104において、レベル差が 算出され、算出されたレベル差が多重化部 105に出力される。
[0030] ダウンミックス部 102から出力されたダウンミックス信号と、レベル差算出部 104から 出力されたレベル差情報とは、多重化部 105において、多重化されることによりビット ストリームとして出力される。
[0031] 音響信号復号装置 200に入力されたビットストリームは、逆多重化部 201において 、ダウンミックス信号とレベル差情報とに分離される。分離されたダウンミックス信号は 、分離部 202において、分離されたレベル差情報に基づいて 2チャンネルの信号に 分離される。このとき、レベル差情報にカ卩えて 2チャンネルの信号の相互相関や位相 差などの情報を使用することにより、分離部 202の精度を高めることができる。以下に 分離処理の計算例を示す。
L = M * l(T(energy— dB - ILD/2)
R = M' * l(T(energy— dB + ILD/2)
[0032] ここで、 Lは分離された左チャンネル信号、 Rは分離された右チャンネル信号、 Mは ダウンミックス信号、 M'はダウンミックス信号力 生成された擬似信号、 energy_dBは ダウンミックス信号のエネルギ、 ILDはレベル差情報である。
[0033] このように実施の形態 1によれば、音響信号符号化装置において、 2チャンネルの 入力信号にダウンミックス係数に従った重み付けをそれぞれ行って、重み付けを行つ た 2チャンネルの信号のレベル差を算出することにより、 1対 1以外の混合比率でダウ ンミックスを行った場合でも、音響信号復号装置における出力信号のレベル差にダウ ンミックス係数の混合比率が重畳されることを回避し、よって、レベル差にずれが生じ ることを防止することができる。
[0034] (実施の形態 2)
図 4は、本発明の実施の形態 2に係る音響信号符号ィ匕装置 110及び音響信号復 号装置 210の構成を示すブロック図である。この図において、音響信号符号化装置 1 10におけるレベル差算出部 104は、ダウンミックス部 102に入力された信号と同一の 2チャンネルの信号が入力され、入力された 2チャンネルの信号のレベル差を算出し 、算出したレベル差 (レベル差情報)を量子化部 111に出力する。
[0035] 量子化部 111は、図 5に示すように、レベル差算出部 104から出力されたレベル差 情報 (入力)の大きさが 0に近 、領域では高!、分解能で量子化を行 、、レベル差情 報の大きさが 0から離れるにつれて低い分解能で量子化を行うという量子化特性を有 する。そして、レベル差算出部 104から出力されたレベル差情報を量子化することに より圧縮し、量子化レベル差情報を多重化部 105に出力する。
[0036] 音響信号復号装置 210における逆多重化部 201は、入力されたビットストリームか らダウンミックス信号と量子化レベル差情報とを抽出し、ダウンミックス信号を分離部 2 02に出力し、量子化レベル差情報を逆量子化部 211に出力する。
[0037] 逆量子化部 211は、逆多重化部 201から出力された量子化レベル差情報をレベル 差情報に変換し、レベル差情報を重み付け部 213に出力する。
[0038] ダウンミックス係数記憶部 212には、音響信号符号ィ匕装置 110におけるダウンミック ス係数記憶部 101に記憶されたダウンミックス係数と同一のダウンミックス係数が記憶 され、記憶されたダウンミックス係数が重み付け部 213に出力される。
[0039] 重み付け部 213は、ダウンミックス係数記憶部 212から出力されたダウンミックス係 数に従った重み付けを逆量子化部 211から出力されたレベル差情報に行い、重み 付けしたレベル差情報を分離部 202に出力する。
[0040] 次に、上記構成を有する音響信号符号化装置 110及び音響信号復号装置 210の 動作について説明する。音響信号符号ィ匕装置 110に入力された 2チャンネルの信号 は、レベル差算出部 104においてレベル差情報が算出され、算出されたレベル差情 報は量子化部 111にお 、て量子化される。
[0041] ダウンミックス信号と量子化されたレベル差情報は、多重化部 105において多重化 されることによりビットストリームとして出力される。
[0042] 音響信号復号装置 210に入力されたビットストリームは、逆多重化部 201において 、ダウンミックス信号と量子化レベル差情報とに分離され、ダウンミックス信号は分離 部 202に、量子化レベル差情報は逆量子化部 211にそれぞれ出力される。
[0043] 量子化レベル差情報は逆量子化部 211にお 、て量子化前のレベル差情報に変換 され、変換されたレベル差情報は重み付け部 213において音響信号符号ィ匕装置 11 0で使用されたダウンミックス係数と同一のダウンミックス係数に従って重み付けが行 われること〖こより補正される。以下に重み付け処理の計算例を示す。
Iし D = ILD— org + 20 * log( α θ / α 3)
[0044] ここで、 ILDは分離処理で使用されるレベル差情報、 ILD_orgは逆量子化されたレべ ル差情報、 α 0と a 3はそれぞれダウンミックス係数である。
[0045] ダウンミックス信号は、分離部 202にお 、て、補正されたレベル差情報に基づ!/、て 2チャンネルの信号に分離される。以下に分離処理の計算例を示す。
L = M * l(T(energy— dB - ILD/2)
R = M' * l(T(energy— dB + ILD/2)
[0046] ここで、 Lは分離された左チャンネル信号、 Rは分離された右チャンネル信号、 Mは ダウンミックス信号、 M'はダウンミックス信号力 生成された擬似信号、 energy_dBは ダウンミックス信号のエネルギ、 ILDはレベル差情報である。
[0047] ここで、図 2に示した音響信号符号ィ匕装置 100に量子化部 111を備えた場合を想 定し、 1対 1以外の混合比率でダウンミックスを行うと、重み付け部 103によってダウン ミックス係数に従った重み付けが行われるため、レベル差が大きくなり、低い分解能 で量子化を行わなければならなくなる。
[0048] これに対し、本実施の形態では、入力された 2チャンネルの信号に重み付けを行わ ず、ダウンミックス係数に従った重み付けを音響信号復号装置 210において逆量子 化処理後に行うことにより、高い分解能で量子化を行うと共に、 1対 1以外の混合比率 でダウンミックスを行った場合でも、音響信号復号装置 210における出力信号のレべ ル差にダウンミックス係数の混合比率が重畳されることを回避し、よって、レベル差に ずれが生じることを防止することができる。
[0049] このように実施の形態 2によれば、音響信号符号化装置において、レベル差情報の 大きさが 0に近い領域では高い分解能で量子化を行い、レベル差情報の大きさが 0 カゝら離れるにつれて低い分解能で量子化を行うという量子化特性で 2チャンネルの 入力信号のレベル差情報を量子化し、音響信号復号装置において、量子化された レベル差情報を量子化前のレベル差情報に変換し、変換されたレベル差情報を音 響信号符号ィ匕装置で用いられたダウンミックス係数に従って補正することにより、量 子化によるレベル差情報の劣化を低減することができる。
[0050] (実施の形態 3)
図 6は、本発明の実施の形態 3に係る音響信号符号ィ匕装置 120及び音響信号復 号装置 220の構成を示すブロック図である。この図において、音響信号符号化装置 1 20におけるダウンミックス係数記憶部 121には、複数の異なる混合比率を示す複数 のダウンミックス係数が記憶されて 、る。
[0051] 係数選択部 122は、ダウンミックス係数記憶部 121に記憶された複数のダウンミック ス係数のうち、いずれのダウンミックス係数を用いるか選択し、選択したダウンミックス 係数をダウンミックス部 102に出力し、選択したダウンミックス係数を示す係数選択情 報を多重化部 105に出力する。
[0052] 多重化部 105は、ダウンミックス部 102から出力された 1チャンネルのダウンミックス 信号と、量子化部 111から出力された量子化レベル差情報と、係数選択部 122から 出力された係数選択情報とを多重化することによりビットストリームを形成し、形成した ビットストリームを音響信号符号ィ匕装置 120から出力する。
[0053] 音響信号復号装置 220における逆多重化部 201は、入力されたビットストリームか らダウンミックス信号と、量子化レベル差情報と、係数選択情報とを抽出し、ダウンミツ タス信号を分離部 202に出力し、量子化レベル差情報を逆量子化部 211に出力し、 係数選択情報を係数選択部 222に出力する。
[0054] ダウンミックス係数記憶部 221には、音響信号符号ィ匕装置 120におけるダウンミック ス係数記憶部 121に記憶されたダウンミックス係数と同一の複数のダウンミックス係数 が記憶されている。
[0055] 係数選択部 222は、逆多重化部 201から出力された係数選択情報に基づいて、ダ ゥンミックス係数をダウンミックス係数記憶部 221から選択し、選択したダウンミックス 係数を重み付け部 213に出力する。
[0056] 次に、上記構成を有する音響信号符号化装置 120及び音響信号復号装置 220の 動作について説明する。まず、ダウンミックス係数記憶部 121からいずれのダウンミツ タス係数を用いるかが係数選択部 122によって選択される。ダウンミックスの例として 、次式が挙げられる。
Lmix = 0*Lf 士 a l*Rf 士 a 2*C 士 a 3*Ls士 a 4*Rs士 a 5*LFE Rmix = β l*Rf 士 j8 0*Lf 士 j8 2*C士 j8 3*Ls士 j8 4*Rs士 j8 5*LFE
[0057] 上記の式において、 Lmixはダウンミックスされた左チャンネルの信号、 Rmixはダウ ンミックスされた右チャンネルの信号、 Lfは左前方チャンネルの信号、 Rfは右前方チ ヤンネルの信号、 Cはセンターチャンネルの信号、 Lsは左後方チャンネルの信号、 Rs は右後方チャンネルの信号、 LFEはサブウーハーチャンネルの信号を表し、 α θ, α ΐ , α 2, α 3, α 4, α 5, β θ, β 1, β 2, β 3, β 4, j8 5はそれぞれダウンミックス係数を 表す。
[0058] ダウンミックス係数の一例として、以下の係数が ITUによって定義されている。
[数 1]
«0 = 0.5
«1 = 0
Figure imgf000012_0001
«3 = 0.5/^2
«4 = 0
«5 = 0
β0 = 0
βΙ = 0.5
Figure imgf000012_0002
β5 = 0
[0059] 上記の係数はあくまで一例であり、各種の係数がダウンミックス作業者によって定義 され、用いられている。
[0060] 音響信号符号ィ匕装置 120に入力された 2チャンネルの信号は、係数選択部 122に よって選択されたダウンミックス係数の混合比率でダウンミックス部 102において 1チ ヤンネルの信号に混合される。
[0061] 一方、音響信号符号化装置 120に入力された 2チャンネルの信号は、レベル差算 出部 104においてレベル差情報が算出され、算出されたレベル差情報は、量子化部
111にお 、て量子化される。
[0062] ダウンミックス信号、量子化レベル差情報及び係数選択情報は、多重化部 105〖こ おいて多重化されることによりビットストリームとして出力される。 [0063] 音響信号復号装置 220に入力されたビットストリームは、逆多重化部 201において 、ダウンミックス信号、量子化レベル差情報及び係数選択情報に分離される。
[0064] 係数選択部 222では、係数選択情報に基づ!/、てダウンミックス係数記憶部 221から 音響信号符号ィ匕装置 120で使用されたダウンミックス係数と同一のダウンミックス係 数が選択される。
[0065] 量子化レベル差情報は、逆量子化部 211にお 、て、量子化前のレベル差情報に 変換される。変換されたレベル差情報は、重み付け部 213において、係数選択部 22 2によって選択されたダウンミックス係数に従って重み付けされることにより補正される
[0066] ダウンミックス信号は、分離部 202にお 、て、補正されたレベル差情報に基づ!/、て 2チャンネルの信号に分離される。
[0067] このように実施の形態 3によれば、音響信号符号化装置において、複数の異なるダ ゥンミックス係数から選択されたダウンミックス係数で 2チャンネルの信号を 1チャンネ ルに混合すると共に、選択されたダウンミックス係数を音響信号復号装置に通知し、 音響信号復号装置において、通知されたダウンミックス係数に従ってレベル差情報 を補正することにより、複数のダウンミックス係数を用いても、音響信号復号装置にお ける出力信号のレベル差にダウンミックス係数の混合比率が重畳されることを回避し 、よって、レベル差にずれが生じることを防止することができる。
[0068] なお、本実施の形態では、係数選択情報を伝送する場合を例に挙げて説明したが 、本発明はこれに限らず、選択されたダウンミックス係数自身を伝送してもよぐこの場 合、音響信号復号装置が複数のダウンミックス係数と係数選択部を備える必要がなく なる。
[0069] 本発明の第 1の態様は、入力された複数チャンネルの信号をダウンミックス係数の 示す混合比率で 1チャンネルのダウンミックス信号に混合するダウンミックス手段と、 前記入力された複数チャンネルの信号のレベルに前記ダウンミックス係数に従った 重み付けをそれぞれ行う重み付け手段と、前記重み付け手段によって重み付けされ た前記複数チャンネルの信号のレベル差を算出するレベル差算出手段と、前記ダウ ンミックス手段によって混合されたダウンミックス信号と、前記レベル差算出手段によ つて算出されたレベル差情報とを多重化することによりビットストリームを形成する多 重化手段と、を具備する音響信号符号化装置である。
[0070] この構成によれば、入力された複数チャンネルの信号のレベルにダウンミックス係 数に従った重み付けをそれぞれ行うことにより、 1対 1以外の混合比率でダウンミック スを行った場合でも、 1対 1以外の混合比率を複数チャンネルの信号のレベル差に 反映することができるので、音響信号復号装置において、出力信号のレベル差にダ ゥンミックス係数の混合比率が重畳されることを回避することができる。
[0071] 本発明の第 2の態様は、入力された複数チャンネルの信号をダウンミックス係数の 示す混合比率で 1チャンネルのダウンミックス信号に混合するダウンミックス手段と、 前記入力された複数チャンネルの信号のレベル差を算出するレベル差算出手段と、 レベル差情報の大きさが 0から離れるにつれて低い分解能となる量子化特性で前記 レベル差算出手段によって算出されたレベル差情報を量子化する量子化手段と、前 記ダウンミックス手段によって混合されたダウンミックス信号と、前記量子化手段によ つて量子化されたレベル差情報とを多重化することによりビットストリームを形成する 多重化手段と、を具備する音響信号符号化装置である。
[0072] 本発明の第 3の態様は、入力された複数チャンネルの信号をダウンミックス係数の 示す混合比率で混合された 1チャンネルのダウンミックス信号と前記入力された複数 チャンネルの信号のレベル差を量子化されたレベル差情報とによって形成されたビッ トストリーム力 ダウンミックス信号と量子化レベル差情報とを抽出する逆多重化手段 と、前記逆多重化手段によって抽出された量子化レベル差情報を量子化前のレベル 差情報に変換する逆量子化手段と、前記逆量子化手段によって変換されたレベル 差情報に、前記ビットストリームの形成に用いられたダウンミックス係数に従って重み 付けを行う重み付け手段と、前記重み付け手段によって重み付けされたレベル差情 報を用いて、前記逆多重化手段によって抽出されたダウンミックス信号を混合前の複 数チャンネルに分離する分離手段と、を具備する音響信号復号装置である。
[0073] これらの構成によれば、音響信号符号化装置において、レベル差情報の大きさが 0 力 離れるにつれて低い分解能となる量子化特性でレベル差情報を量子化しても、 音響信号復号装置においてダウンミックス係数に従った重み付けを逆量子化処理後 に行うことにより、量子化によるレベル差情報の劣化を低減することができる。
[0074] 本発明の第 4の態様は、上記態様にぉ 、て、複数の異なるダウンミックス係数を有 し、いずれかのダウンミックス係数を選択する係数選択手段を具備し、前記多重化手 段は、前記係数選択手段によって選択されたダウンミックス係数を示す係数選択情 報を多重化する音響信号符号化装置である。
[0075] 本発明の第 5の態様は、入力された複数チャンネルの信号を選択されたダウンミツ タス係数の示す混合比率で混合された 1チャンネルのダウンミックス信号と前記入力 された複数チャンネルの信号のレベル差を量子化されたレベル差情報と選択された ダウンミックス係数を示す係数選択情報とによって形成されたビットストリームカゝらダウ ンミックス信号、量子化レベル差情報及び係数選択情報を抽出する逆多重化手段と 、前記逆多重化手段によって抽出された量子化レベル差情報を量子化前のレベル 差情報に変換する逆量子化手段と、複数の異なるダウンミックス係数を有し、前記逆 多重化手段によって抽出された係数選択情報に基づいてダウンミックス係数を選択 する係数選択手段と、前記逆量子化手段によって変換されたレベル差情報に、前記 係数選択手段によって選択されたダウンミックス係数に従って重み付けを行う重み付 け手段と、前記重み付け手段によって重み付けされたレベル差情報を用いて、前記 逆多重化手段によって抽出されたダウンミックス信号を混合前の複数チャンネルに分 離する分離手段と、を具備する音響信号復号装置である。
[0076] これらの構成によれば、音響信号符号ィ匕装置において複数のダウンミックス係数を 用いても、音響信号復号装置の出力信号のレベル差にダウンミックス係数の混合比 率が重畳されることを回避することができる。
[0077] 本発明の第 6の態様は、入力された複数チャンネルの信号をダウンミックス係数の 示す混合比率で 1チャンネルのダウンミックス信号に混合するステップと、前記入力さ れた複数チャンネルの信号のレベルに前記ダウンミックス係数に従った重み付けをそ れぞれ行うステップと、前記重み付けされた複数チャンネルの信号のレベル差を算出 するステップと、前記混合されたダウンミックス信号と、前記算出されたレベル差情報 とを多重化することによりビットストリームを形成するステップと、を具備する音響信号 符号化方法である。 [0078] この方法によれば、入力された複数チャンネルの信号のレベルにダウンミックス係 数に従った重み付けをそれぞれ行うことにより、 1対 1以外の混合比率でダウンミック スを行った場合でも、 1対 1以外の混合比率を複数チャンネルの信号のレベル差に 反映することができるので、音響信号復号装置において、出力信号のレベル差にダ ゥンミックス係数の混合比率が重畳されることを回避することができる。
[0079] 本明細書は、 2004年 10月 14曰出願の特願 2004— 300441に基づくものである 。この内容は全てここに含めておく。
産業上の利用可能性
[0080] 本発明にかかる音響信号符号化装置は、異なる比率でダウンミックスを行 ヽ、マル チチャンネル信号を少な 、チャンネル数で符号ィ匕すると ヽぅ効果を有し、小型化が必 要な携帯機器等に適用することができ、また、本発明にかかる音響信号復号装置は 、音響信号符号ィ匕装置で符号化された信号を復号するという効果を有し、小型化が 必要な携帯機器等に適用することができる。

Claims

請求の範囲
[1] 複数チャンネルの信号をダウンミックス係数の示す比率で 1チャンネルのダウンミツ タス信号に混合するダウンミックス手段と、
前記複数チャンネルの信号のレベル差情報を算出するレベル差算出手段と、 レベル差情報の大きさが 0から離れるにつれて低い分解能となる量子化特性で前 記レベル差算出手段によって算出されたレベル差情報を量子化する量子化手段と、 前記ダウンミックス手段によって混合されたダウンミックス信号と、前記量子化手段 によって量子化されたレベル差情報とを多重化することによりビットストリームを形成 する多重化手段と、
を具備する音響信号符号化装置。
[2] 複数の異なるダウンミックス係数のうち、いずれかのダウンミックス係数を選択する係 数選択手段を具備し、
前記多重化手段は、前記係数選択手段によって選択されたダウンミックス係数を示 す係数選択情報を多重化する
請求項 1に記載の音響信号符号化装置。
[3] 複数チャンネルの信号がダウンミックス係数の示す比率で混合された 1チャンネル のダウンミックス信号と前記複数チャンネルの信号のレベル差が量子化されたレベル 差情報とによって形成されたビットストリーム力 ダウンミックス信号と量子化レベル差 情報とを抽出する逆多重化手段と、
前記逆多重化手段によって抽出された量子化レベル差情報を量子化前のレベル 差情報に変換する逆量子化手段と、
前記逆量子化手段によって変換されたレベル差情報に、前記ビットストリームの形 成に用いられたダウンミックス係数に従って重み付けを行う重み付け手段と、 前記重み付け手段によって重み付けされたレベル差情報を用いて、前記逆多重化 手段によって抽出されたダウンミックス信号を混合前の複数チャンネルに分離する分 離手段と、
を具備する音響信号復号装置。
[4] 複数チャンネルの信号をダウンミックス係数の示す比率で 1チャンネルのダウンミツ タス信号に混合するステップと、
前記複数チャンネルの信号のレベル差情報を算出するステップと、
前記レベル差情報の大きさが 0から離れるにつれて低い分解能となる量子化特性 で前記レベル差情報を量子化するステップと、
前記混合されたダウンミックス信号と、前記量子化されたレベル差情報とを多重化 することによりビットストリームを形成するステップと、
を具備する音響信号符号化方法。
PCT/JP2005/018885 2004-10-14 2005-10-13 音響信号符号化装置及び音響信号復号装置 WO2006041137A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US11/577,151 US7689428B2 (en) 2004-10-14 2005-10-13 Acoustic signal encoding device, and acoustic signal decoding device
CN2005800352141A CN101040323B (zh) 2004-10-14 2005-10-13 音响信号编解码装置和音响信号编码方法
EP05793725A EP1865497B1 (en) 2004-10-14 2005-10-13 Acoustic signal decoding
KR1020077008302A KR101129877B1 (ko) 2004-10-14 2005-10-13 음향 신호 복호 장치

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004-300441 2004-10-14
JP2004300441A JP4892184B2 (ja) 2004-10-14 2004-10-14 音響信号符号化装置及び音響信号復号装置

Publications (1)

Publication Number Publication Date
WO2006041137A1 true WO2006041137A1 (ja) 2006-04-20

Family

ID=36148424

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/018885 WO2006041137A1 (ja) 2004-10-14 2005-10-13 音響信号符号化装置及び音響信号復号装置

Country Status (6)

Country Link
US (1) US7689428B2 (ja)
EP (1) EP1865497B1 (ja)
JP (1) JP4892184B2 (ja)
KR (1) KR101129877B1 (ja)
CN (1) CN101040323B (ja)
WO (1) WO2006041137A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010005050A1 (ja) * 2008-07-11 2010-01-14 日本電気株式会社 信号分析装置、信号制御装置及びその方法と、プログラム
CN101568958B (zh) * 2006-12-07 2012-07-18 Lg电子株式会社 用于处理音频信号的方法和装置

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4896449B2 (ja) * 2005-06-29 2012-03-14 株式会社東芝 音響信号処理方法、装置及びプログラム
US8271290B2 (en) * 2006-09-18 2012-09-18 Koninklijke Philips Electronics N.V. Encoding and decoding of audio objects
CN102227769A (zh) * 2008-10-01 2011-10-26 Gvbb控股股份有限公司 解码装置、解码方法、编码装置、编码方法和编辑装置
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
WO2011097903A1 (zh) * 2010-02-11 2011-08-18 华为技术有限公司 多声道信号编码、解码方法、装置及编解码系统
CN102157149B (zh) * 2010-02-12 2012-08-08 华为技术有限公司 立体声信号下混方法、编解码装置和编解码系统
KR101227932B1 (ko) * 2011-01-14 2013-01-30 전자부품연구원 다채널 멀티트랙 오디오 시스템 및 오디오 처리 방법
JP5715514B2 (ja) * 2011-07-04 2015-05-07 日本放送協会 オーディオ信号ミキシング装置およびそのプログラム、ならびに、オーディオ信号復元装置およびそのプログラム
CN102395097A (zh) * 2011-09-29 2012-03-28 深圳市万兴软件有限公司 一种多声道音频信号缩混方法及系统
ITTO20120274A1 (it) * 2012-03-27 2013-09-28 Inst Rundfunktechnik Gmbh Dispositivo per il missaggio di almeno due segnali audio.
KR20140016780A (ko) * 2012-07-31 2014-02-10 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 방법 및 장치
JP2016174257A (ja) * 2015-03-17 2016-09-29 ヤマハ株式会社 レベル制御装置
CN105812986A (zh) * 2016-05-09 2016-07-27 中山奥凯华泰电子有限公司 将多声道缩混成无线两声道的音箱和处理方法
CN108269577B (zh) 2016-12-30 2019-10-22 华为技术有限公司 立体声编码方法及立体声编码器
US11545165B2 (en) * 2018-07-03 2023-01-03 Panasonic Intellectual Property Corporation Of America Encoding device and encoding method using a determined prediction parameter based on an energy difference between channels

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06319200A (ja) * 1993-05-10 1994-11-15 Fujitsu General Ltd ステレオ用バランス調整装置
WO2004072956A1 (en) 2003-02-11 2004-08-26 Koninklijke Philips Electronics N.V. Audio coding
JP2004300441A (ja) 1998-05-25 2004-10-28 Daicel Chem Ind Ltd フォトレジスト用化合物およびフォトレジスト用樹脂組成物

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JPH10215500A (ja) * 1997-01-30 1998-08-11 Matsushita Electric Ind Co Ltd テレビジョン受像機の多チャンネル音声出力回路
US6961432B1 (en) * 1999-04-29 2005-11-01 Agere Systems Inc. Multidescriptive coding technique for multistream communication of signals
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
CN1650528B (zh) * 2002-05-03 2013-05-22 哈曼国际工业有限公司 多信道下混频设备
DE60317203T2 (de) * 2002-07-12 2008-08-07 Koninklijke Philips Electronics N.V. Audio-kodierung
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
KR101106026B1 (ko) * 2003-10-30 2012-01-17 돌비 인터네셔널 에이비 오디오 신호 인코딩 또는 디코딩
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06319200A (ja) * 1993-05-10 1994-11-15 Fujitsu General Ltd ステレオ用バランス調整装置
JP2004300441A (ja) 1998-05-25 2004-10-28 Daicel Chem Ind Ltd フォトレジスト用化合物およびフォトレジスト用樹脂組成物
WO2004072956A1 (en) 2003-02-11 2004-08-26 Koninklijke Philips Electronics N.V. Audio coding

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FALLER C. AND BAUMGARTE F.: "Binaural Cue Coding Applied to Audio Compression with Flexible Rendering", PROC. AES 113TH CONVENTION, October 2002 (2002-10-01), LOS ANGELES USA, XP009024736 *
See also references of EP1865497A4

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101568958B (zh) * 2006-12-07 2012-07-18 Lg电子株式会社 用于处理音频信号的方法和装置
US8311227B2 (en) 2006-12-07 2012-11-13 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
US8340325B2 (en) 2006-12-07 2012-12-25 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
US8428267B2 (en) 2006-12-07 2013-04-23 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
US8488797B2 (en) 2006-12-07 2013-07-16 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
WO2010005050A1 (ja) * 2008-07-11 2010-01-14 日本電気株式会社 信号分析装置、信号制御装置及びその方法と、プログラム

Also Published As

Publication number Publication date
EP1865497A4 (en) 2010-07-14
KR20070065370A (ko) 2007-06-22
EP1865497B1 (en) 2012-03-28
US20090030704A1 (en) 2009-01-29
EP1865497A1 (en) 2007-12-12
CN101040323A (zh) 2007-09-19
CN101040323B (zh) 2011-01-26
JP2006113294A (ja) 2006-04-27
US7689428B2 (en) 2010-03-30
KR101129877B1 (ko) 2012-03-23
JP4892184B2 (ja) 2012-03-07

Similar Documents

Publication Publication Date Title
WO2006041137A1 (ja) 音響信号符号化装置及び音響信号復号装置
KR101395254B1 (ko) 부가정보 비트스트림 변환을 포함하는 다양한 채널로 구성된 다객체 오디오 신호의 부호화 및 복호화 장치 및 방법
US8756066B2 (en) Methods and apparatuses for encoding and decoding object-based audio signals
KR20230110842A (ko) 양자화 및 엔트로피 코딩을 이용한 방향성 오디오 코딩파라미터들을 인코딩 또는 디코딩하기 위한 장치 및 방법
JP5053849B2 (ja) マルチチャンネル音響信号処理装置およびマルチチャンネル音響信号処理方法
WO2007010785A1 (ja) オーディオデコーダ
JP5377505B2 (ja) 結合装置、遠隔通信システム及び結合方法
KR20080093342A (ko) 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치
WO2010005050A1 (ja) 信号分析装置、信号制御装置及びその方法と、プログラム
EP1779385B1 (en) Method and apparatus for encoding and decoding multi-channel audio signal using virtual source location information
US20240185869A1 (en) Combining spatial audio streams
JP2006337767A (ja) 低演算量パラメトリックマルチチャンネル復号装置および方法
KR20080035448A (ko) 다채널 오디오 신호의 부호화/복호화 방법 및 장치
KR20070041336A (ko) 오디오 신호의 인코딩 및 디코딩 방법, 및 이를 구현하기위한 장치
KR20150045879A (ko) 공간 필터를 이용한 다채널 오디오 부호화/복호화 장치 및 방법
KR20140122990A (ko) 다채널 오디오 신호 부호화/복호화 장치 및 방법
KR20070108313A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS KE KG KM KP KR KZ LC LK LR LS LT LU LV LY MA MD MG MK MN MW MX MZ NA NG NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU LV MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 1020077008302

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 2005793725

Country of ref document: EP

Ref document number: 200580035214.1

Country of ref document: CN

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 11577151

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 2005793725

Country of ref document: EP