KR20080030847A - Method for encoding and decoding an audio signal - Google Patents

Method for encoding and decoding an audio signal Download PDF

Info

Publication number
KR20080030847A
KR20080030847A KR1020060097311A KR20060097311A KR20080030847A KR 20080030847 A KR20080030847 A KR 20080030847A KR 1020060097311 A KR1020060097311 A KR 1020060097311A KR 20060097311 A KR20060097311 A KR 20060097311A KR 20080030847 A KR20080030847 A KR 20080030847A
Authority
KR
South Korea
Prior art keywords
channel
tweeter
information
audio signal
generation information
Prior art date
Application number
KR1020060097311A
Other languages
Korean (ko)
Inventor
방희석
오현오
김동수
임재현
정양원
윤성용
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR1020060097311A priority Critical patent/KR20080030847A/en
Publication of KR20080030847A publication Critical patent/KR20080030847A/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Abstract

A method for decoding and encoding an audio signal is provided to restore a tweeter channel effectively with a small amount of data, by copying a multi-channel to generate the tweeter channel. An encoded down-mix signal is core-decoded(301). A high-frequency range of signal of a multi-channel is copied to generate a tweeter channel by using the core-decoded down-mix signal and tweeter channel generation information(305). The tweeter channel generation information is a value or a default value generated while a multi-channel is generated by using the encoded down-mix signal. The tweeter channel generation information is extracted from space information restored while the multi-channel is generated by using the encoded down-mix signal.

Description

오디오 신호 인코딩 및 디코딩 방법{Method for encoding and decoding an audio signal}Method for encoding and decoding an audio signal

도 1은 본 발명의 일 실시 예에 따른 오디오 신호 디코딩 방법을 수행하는 오디오 신호 디코딩 장치의 블럭도이다.1 is a block diagram of an audio signal decoding apparatus for performing an audio signal decoding method according to an embodiment of the present invention.

도 2는 본 발명의 다른 실시 예에 따른 오디오 신호 디코딩 방법을 수행하는 오디오 신호 디코딩 장치의 블럭도이다.2 is a block diagram of an audio signal decoding apparatus for performing an audio signal decoding method according to another embodiment of the present invention.

도 3은 본 발명의 또 다른 실시 예에 따른 오디오 신호 디코딩 방법을 개략적으로 나타낸 순서도이다.3 is a flowchart schematically illustrating an audio signal decoding method according to another embodiment of the present invention.

도 4는 본 발명의 또 다른 실시 예에 따른 트위터 채널 생성 정보를 공간 정보에 포함시키는 방법을 개략적으로 나타낸 순서도이다.4 is a flowchart schematically illustrating a method of including tweeter channel generation information in spatial information according to another embodiment of the present invention.

<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>

101 : 역다중화부 103 : 코어 디코딩부101: demultiplexer 103: core decoding unit

105 : 멀티 채널 생성부 201 : 트위터 채널 생성 정보 생성부105: multi-channel generator 201: Twitter channel generation information generator

일반적으로 멀티 채널 오디오 코딩의 경우, 인코딩 장치에서 멀티 채널 오디 오 신호의 채널들 각각을 압축하는 대신에, 오디오 신호를 모노 혹은 스테레오 형태의 다운 믹스 신호로 압축하고, 압축된 다운 믹스 신호와 공간 정보(또는, 부가 정보)를 함께 디코딩 장치로 전송하거나 압축된 다운 믹스 신호를 공간 정보와 함께 저장 매체에 저장한다. 여기서, 공간 정보는 압축된 다운 믹스 신호로부터 원래의 멀티 채널 오디오 신호를 복원할 때 사용되는 공간 파라미터(spatial parameter or spatial cue)들을 표현하기 위해 이용된다.In general, in the case of multichannel audio coding, instead of compressing each of the channels of the multichannel audio signal in the encoding apparatus, the audio signal is compressed into a downmix signal in mono or stereo form, and the compressed downmix signal and spatial information are compressed. (Or additional information) are transmitted together to the decoding apparatus or the compressed downmix signal is stored together with the spatial information in the storage medium. Here, spatial information is used to represent spatial parameters or spatial cues used when reconstructing the original multi-channel audio signal from the compressed downmix signal.

일반적으로 5.1 채널의 경우, 중앙 채널, 왼쪽 채널, 오른쪽 채널, 배후 오른쪽 채널, 배후 왼쪽 채널 및 우퍼(LFE:Low Frequency Enhancement) 채널로 구성된다. 이 때, 주파수 대역에서 주로 고주파 대역의 성분만을 갖는 트위터(tweeter) 채널이 5.1 채널에 더 부가될 수 있다. 예를 들어, 차량의 경우는 음장의 특성상 5.1 채널과는 독립적인 트위터 채널이 더 추가될 수 있다. 전술한 일반적인 압축 방식으로 트위터 채널을 포함한 멀티 채널 오디오 신호를 압축할 경우, 트위터 채널은 5.1 채널들과 다운 믹싱된다.In general, a 5.1 channel is composed of a center channel, a left channel, a right channel, a rear right channel, a rear left channel, and a low frequency enhancement channel (LFE). At this time, a tweeter channel having only components of a high frequency band in the frequency band may be further added to the 5.1 channel. For example, in the case of a vehicle, a tweeter channel independent of the 5.1 channel may be further added due to the characteristics of the sound field. When the multi-channel audio signal including the tweeter channel is compressed by the general compression method described above, the tweeter channel is down mixed with the 5.1 channels.

일반적인 5.1 채널에 트위터 채널을 부가할 경우, 오디오 신호 인코딩 장치는 트위터 채널을 5.1 채널들과 다운 믹싱하여 전송하고 오디오 신호 디코딩 장치는 전송된 신호를 다시 업 믹싱하여 5.1 채널들과 트위터 채널을 복원한다. 따라서 트위터 채널을 복원하기 위해서는 트위터 채널에 대한 부가 정보가 필요하게 된다.When the tweeter channel is added to the general 5.1 channel, the audio signal encoding apparatus downmixes the tweeter channel with the 5.1 channels, and the audio signal decoding apparatus remixes the transmitted signal to restore the 5.1 channels and the tweeter channel. . Therefore, in order to restore the Twitter channel, additional information about the Twitter channel is required.

본 발명이 이루고자 하는 기술적 과제는, 멀티 채널을 복사하여 트위터 채널을 생성함으로써 적은 데이터로 트위터 채널을 복원할 수 있는 오디오 신호 인코딩 및 디코딩 방법을 제공하는 데 있다.An object of the present invention is to provide an audio signal encoding and decoding method capable of restoring a tweeter channel with less data by generating a tweeter channel by copying multiple channels.

상기 과제를 이루기 위한 본 발명에 의한 오디오 신호 디코딩 방법은, 인코딩된 다운믹스 신호를 코어 디코딩하는 단계 및 상기 코어 디코딩된 다운믹스 신호와 트위터 채널 생성 정보를 이용하여 멀티 채널의 고주파 범위의 신호를 복제하여 트위터 채널을 생성하는 단계를 포함하는 것이 바람직하다.In accordance with another aspect of the present invention, there is provided a method of decoding an audio signal, the method including core decoding an encoded downmix signal and replicating a signal having a high frequency range of a multi-channel using the core decoded downmix signal and tweeter channel generation information. Preferably generating a tweeter channel.

또한, 본 발명에 의한 오디오 신호 인코딩 방법은, 트위터 채널 생성 정보를 생성하는 단계 및 상기 생성된 트위터 채널 생성 정보를 공간 정보에 포함하는 단계를 포함하는 것이 바람직하다.In addition, the audio signal encoding method according to the present invention preferably comprises the steps of generating the Twitter channel generation information and the step of including the generated Twitter channel generation information in the spatial information.

또한, 본 발명에 의한 오디오 신호 디코딩 방법은 (a) 멀티 채널을 복제한 트위터 채널과 믹싱된 멀티 채널의 종류를 인식하는 단계 및 (b) 상기 인식된 멀티 채널의 종류에 따라 공간 파라미터를 선택적으로 이용하여 다운 믹스 신호로부터 상기 트위터 채널을 복원하는 단계를 포함하는 것이 바람직하다. In addition, the audio signal decoding method according to the present invention comprises the steps of (a) recognizing the type of the multi-channel and the mixed tweeter channel duplicated multi-channel and (b) selectively select the spatial parameters according to the type of the recognized multi-channel Preferably recovering the tweeter channel from the downmix signal.

또한, 본 발명에 의한 오디오 신호 인코딩 방법은 (c) 멀티 채널을 복제하여 트위터 채널을 생성하는 단계, (d) 상기 생성된 트위터 채널과 멀티 채널을 다운 믹싱하는 단계 및 (e) 상기 다운 믹싱된 트위터 채널과 멀티 채널 간의 관계를 나타내는 정보를 공간 정보에 삽입하는 단계를 포함하는 것이 바람직하다.In addition, the audio signal encoding method according to the present invention comprises the steps of (c) replicating the multi-channel to generate a tweeter channel, (d) downmixing the generated tweeter channel and the multi-channel and (e) the downmixed And inserting information representing the relationship between the tweeter channel and the multi-channel into the spatial information.

이어서, 첨부한 도면들을 참조하여 본 발명의 바람직한 실시 예를 상세히 설명하기로 한다.Next, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시 예에 따른 오디오 신호 디코딩 방법을 수행하는 오디오 신호 디코딩 장치의 블럭도이다. 도 1에 따른 오디오 신호 디코딩 장치는 역다중화부(101), 코어 디코딩부(103) 및 멀티 채널 생성부(105)를 포함한다.1 is a block diagram of an audio signal decoding apparatus for performing an audio signal decoding method according to an embodiment of the present invention. The audio signal decoding apparatus according to FIG. 1 includes a demultiplexer 101, a core decoder 103, and a multi-channel generator 105.

오디오 신호 인코딩 장치(미도시)는 멀티 채널, 예컨대 5.1 채널 또는 7.1 채널을 다운 믹싱하고 이 과정에서 공간 정보를 추출한다. 이 때, 오디오 신호 인코딩 장치는 트위터 채널을 별도로 다운 믹싱하지 않는다. 오디오 신호 인코딩 장치는 다운 믹싱된 오디오 신호와 공간 정보를 각각 인코딩하고, 인코딩된 다운믹스 신호와 인코딩된 공간 정보를 다중화하여 비트 스트림 형태로 오디오 신호 디코딩 장치로 전송한다. An audio signal encoding apparatus (not shown) downmixes multiple channels, such as 5.1 or 7.1 channels, and extracts spatial information in this process. At this time, the audio signal encoding apparatus does not separately downmix the tweeter channel. The audio signal encoding apparatus encodes the downmixed audio signal and the spatial information, respectively, and multiplexes the encoded downmix signal and the encoded spatial information and transmits them in the form of a bit stream to the audio signal decoding apparatus.

오디오 신호 디코딩 장치는 오디오 신호 인코딩 장치가 전송한 비트 스트림을 수신한다. 오디오 신호 디코딩 장치의 역다중화부(101)는 수신한 비트 스트림을 인코딩된 다운믹스 신호와 인코딩된 공간 정보로 분리한다. 역다중화부(101)에 의해 분리된 인코딩된 다운믹스 신호는 코어 디코딩부(103)에서 복호화되어 멀티 채널 생성부(105)로 전송되고, 역다중화부(101)에 의해 분리된 인코딩된 공간 정보는 멀티 채널 생성부(105)로 전송된다. 멀티 채널 생성부(105)는 복호화된 다운믹스 신호와 공간 정보를 이용하여 멀티 채널을 복원하여 출력한다. 즉, 멀티 채널 생성부(105)는 복호화된 다운믹스 신호와 공간 정보에 포함된 공간 파라미터를 이용하여 멀티 채널을 복원한다. 이 때, 공간 정보에는 트위터 채널을 생성하기 위한 트위터 채널 생성 정보가 포함되어 있다. 멀티 채널 생성부(105)는 멀티 채널을 복원함과 동시에, 트위터 채널 생성 정보를 이용하여 멀티 채널을 복제하여 트위터 채 널을 생성한다.The audio signal decoding apparatus receives a bit stream transmitted by the audio signal encoding apparatus. The demultiplexer 101 of the audio signal decoding apparatus separates the received bit stream into an encoded downmix signal and encoded spatial information. The encoded downmix signal separated by the demultiplexer 101 is decoded by the core decoder 103 and transmitted to the multi-channel generator 105, and the encoded spatial information separated by the demultiplexer 101. Is transmitted to the multi-channel generator 105. The multi channel generator 105 restores and outputs a multi channel using the decoded downmix signal and spatial information. That is, the multi-channel generator 105 restores the multi-channel by using the decoded downmix signal and the spatial parameter included in the spatial information. In this case, the spatial information includes Twitter channel generation information for generating a Twitter channel. The multi-channel generator 105 restores the multi-channel and simultaneously generates a tweeter channel by replicating the multi-channel using the tweeter channel generation information.

여기서 트위터 채널 생성 정보는 오디오 신호 인코딩 장치에서 멀티 채널을 다운 믹싱할 때 추출되는 공간 정보에 삽입할 수도 있고, 인코딩된 다운 믹스 신호와 인코딩된 공간 정보를 다중화하여 비트스트림을 전송할 때, 비트스트림에 삽입할 수도 있다. 또한, 오디오 신호 디코딩 장치에서 트위터 채널 생성 정보를 생성할 수도 있다. 한 실시 예로, 전송된 오디오 비트스트림을 인코딩된 다운믹스 신호와 인코딩된 공간 정보로 분리하는 과정에서 공간 정보에 트위터 채널 생성 정보를 삽입할 수도 있다. 오디오 신호 인코딩 장치에서 공간 정보에 트위터 채널 생성 정보를 삽입한 경우에는 오디오 신호 디코딩 장치에서 공간 정보로부터 트위터 채널 생성 정보를 추출하여 트위터 채널을 생성한다. 또한, 오디오 신호 디코딩 장치는 오디오 신호 디코딩 장치가 미리 설정하여 저장한 디폴트 값을 트위터 채널 생성 정보로 이용하여 트위터 채널을 생성할 수도 있다.Here, the tweeter channel generation information may be inserted into spatial information extracted when downmixing the multichannels in the audio signal encoding apparatus, or when the bitstream is transmitted by multiplexing the encoded downmix signal and the encoded spatial information, Can also be inserted. Also, the tweeter channel generation information may be generated by the audio signal decoding apparatus. As an example, the Twitter channel generation information may be inserted into the spatial information in the process of separating the transmitted audio bitstream into the encoded downmix signal and the encoded spatial information. When the tweeter channel generation information is inserted into the spatial information in the audio signal encoding apparatus, the tweeter channel generation information is generated by extracting the tweeter channel generation information from the spatial information in the audio signal decoding apparatus. In addition, the audio signal decoding apparatus may generate a tweeter channel using the default value preset and stored by the audio signal decoding apparatus as the tweeter channel generation information.

여기서 트위터 채널 생성 정보는 멀티 채널 중 특정 채널의 신호 또는 특정 채널들간의 조합으로 생성된 신호를 복제하여 트위터 채널을 생성하기 위한 것으로 복제할 멀티 채널을 선택하는 멀티 채널 선택 정보 또는 멀티 채널 신호 중 복제할 멀티 채널 신호의 주파수 범위에 대한 정보 등을 포함할 수 있다.Here, the tweeter channel generation information is for generating a tweeter channel by copying a signal of a specific channel or a combination of specific channels among the multi-channels. Information about a frequency range of the multi-channel signal to be performed.

오디오 신호 디코딩 장치는 트위터 채널 생성 정보를 이용하여 멀티 채널 중 특정 채널의 신호 또는 특정 채널들간의 조합으로 생성된 신호를 선택하고, 선택한 채널 신호의 특정 주파수 범위를 복제하여 트위터 채널을 생성한다.The audio signal decoding apparatus selects a signal generated from a signal of a specific channel or a combination of specific channels using the tweeter channel generation information, and generates a tweeter channel by replicating a specific frequency range of the selected channel signal.

도 2는 본 발명의 다른 실시 예에 따른 오디오 신호 디코딩 방법을 수행하는 오디오 신호 디코딩 장치의 블럭도이다. 도 2에 따른 오디오 신호 디코딩 장치는 역다중화부(101), 코어 디코딩부(103), 멀티 채널 생성부(105) 그리고 트위터 채널 생성 정보 생성부(201)를 포함한다. 오디오 신호 인코딩 장치(미도시)는 다운 믹싱한 오디오 신호와 그로부터 추출한 공간 정보를 각각 인코딩하고, 인코딩한 다운믹스 신호와 인코딩한 공간 정보를 다중화하여 비트 스트림 형태로 오디오 신호 디코딩 장치로 전송한다. 2 is a block diagram of an audio signal decoding apparatus for performing an audio signal decoding method according to another embodiment of the present invention. The audio signal decoding apparatus according to FIG. 2 includes a demultiplexer 101, a core decoder 103, a multi-channel generator 105, and a tweeter channel generation information generator 201. The audio signal encoding apparatus (not shown) encodes the downmixed audio signal and the spatial information extracted therefrom, and multiplexes the encoded downmix signal and the encoded spatial information and transmits them in the form of a bit stream to the audio signal decoding apparatus.

오디오 신호 디코딩 장치는 오디오 신호 인코딩 장치가 전송한 비트 스트림을 수신하고 비트 스트림을 인코딩된 다운믹스 신호와 인코딩된 공간 정보로 분리한다. 오디오 신호 디코딩 장치의 역다중화부(101)에 의해 분리된 인코딩된 다운믹스 신호는 코어 디코딩부(103)에서 복호화되어 멀티 채널 생성부(105)로 전송되고, 역다중화부(101)에 의해 분리된 인코딩된 공간 정보는 멀티 채널 생성부(105)로 전송된다. 멀티 채널 생성부(105)는 트위터 채널 생성 정보를 이용하여 멀티 채널을 복제한 트위터 채널을 생성한다.The audio signal decoding apparatus receives the bit stream transmitted by the audio signal encoding apparatus and separates the bit stream into an encoded downmix signal and encoded spatial information. The encoded downmix signal separated by the demultiplexer 101 of the audio signal decoding apparatus is decoded by the core decoder 103 and transmitted to the multi-channel generator 105, and separated by the demultiplexer 101. The encoded spatial information is transmitted to the multi-channel generator 105. The multi-channel generator 105 generates a tweeter channel that duplicates a multi-channel by using tweeter channel generation information.

오디오 신호 인코딩 장치에서 공간 정보에 트위터 채널 생성 정보를 삽입하거나 오디오 신호 디코딩 장치에서 인코딩된 공간 정보에 트위터 채널 생성 정보를 별도로 삽입하는 대신, 오디오 신호 디코딩 장치에 트위터 채널 생성 정보를 생성하는 트위터 채널 생성 정보 생성부(201)를 별도로 포함시킬 수 있다. 트위터 채널 생성 정보 생성부(201)는 트위터 채널 생성 정보를 공간 정보에 삽입했는가를 판단하여 공간 정보에 트위터 채널 생성 정보가 포함되어 있지 않은 경우에만 트위터 채널 생성 정보를 생성하여 멀티 채널 생성부(105)로 전송할 수도 있다.Instead of inserting the tweeter channel generation information into the spatial information in the audio signal encoding apparatus or separately inserting the tweeter channel generation information into the spatial information encoded in the audio signal decoding apparatus, the tweeter channel generation generating the tweeter channel generation information into the audio signal decoding apparatus. The information generator 201 may be separately included. The Twitter channel generation information generator 201 determines whether the Twitter channel generation information is inserted into the spatial information, and generates the Twitter channel generation information only when the spatial information does not include the Twitter channel generation information. Can also be sent.

트위터 채널 생성 정보 생성부(201)는 멀티 채널을 복사하여 트위터 채널을 생성하기 위한 트위터 채널 생성 정보를 생성하고, 이를 멀티 채널 생성부(105)로 전송한다. 트위터 채널 생성 정보는 복제할 멀티 채널을 선택하는 멀티 채널 선택 정보 또는 멀티 채널 신호 중 복제할 멀티 채널 신호의 주파수 범위에 대한 정보 등을 포함할 수 있다. 복제할 멀티 채널 신호의 주파수 범위에 대한 정보는 복제할 멀티 채널 신호의 최소 주파수 값 또는 최대 주파수 값을 포함할 수 있으며, 여기서 최대 주파수 값은 샘플링 주파수의 최대값 또는 트위터 채널의 특성에 의해 결정되는 값으로 설정할 수도 있다. 또한, 트위터 채널 생성 정보에 게인 조정 값을 포함하여 조정된 게인 값을 갖는 트위터 채널을 생성할 수도 있다. 트위터 채널 생성 정보는 멀티 채널 생성부(105)가 복원할 수 있는 채널의 수와 오디오 신호 인코딩 장치에 입력되는 멀티 채널의 수를 비교하여 복원할 수 있는 채널 수가 오디오 신호 인코딩 장치에 입력되는 멀티 채널 수를 초과하는지에 대한 정보를 포함하여 복원할 수 있는 채널 수가 오디오 신호 인코딩 장치에 입력되는 채널 수를 초과할 때에만 트위터 채널을 생성하도록 할 수도 있다.The tweeter channel generation information generator 201 generates the tweeter channel generation information for generating the tweeter channel by copying the multi channel, and transmits the tweeter channel generation information to the multi channel generator 105. The tweeter channel generation information may include multichannel selection information for selecting a multichannel to be duplicated or information on a frequency range of the multichannel signal to be duplicated among the multichannel signals. The information on the frequency range of the multichannel signal to be replicated may include the minimum or maximum frequency value of the multichannel signal to be replicated, where the maximum frequency value is determined by the maximum value of the sampling frequency or the characteristics of the tweeter channel. Can also be set to a value. In addition, a tweeter channel having a gain value adjusted by including a gain adjustment value in the tweeter channel generation information may be generated. The tweeter channel generation information is obtained by comparing the number of channels that can be restored by the multi-channel generator 105 with the number of multi-channels that are input to the audio signal encoding apparatus. The tweeter channel may be generated only when the number of recoverable channels exceeds the number of channels input to the audio signal encoding apparatus.

멀티 채널 생성부(105)는 복호화된 다운믹스 신호와 인코딩된 공간 정보를 이용하여 멀티 채널을 생성함과 동시에 트위터 채널 생성 정보 생성부(201)에서 전송된 트위터 채널 생성 정보를 이용하여 멀티 채널을 복제하여 트위터 채널을 생성한다. 멀티 채널 생성부(105)는 생성한 멀티 채널과 트위터 채널을 출력한다.The multi-channel generator 105 generates a multi-channel using the decoded downmix signal and the encoded spatial information and simultaneously generates a multi-channel using the tweeter channel generation information transmitted from the tweeter channel generation information generator 201. Duplicate the Twitter channel. The multi channel generator 105 outputs the generated multi channel and the tweeter channel.

도 3은 본 발명의 또 다른 실시 예에 따른 오디오 신호 디코딩 방법을 개략적으로 나타낸 순서도이다. 오디오 신호 디코딩 장치는 오디오 신호 인코딩 장치로 부터 인코딩된 다운믹스 신호와 인코딩된 공간 정보를 비트 스트림 형태로 수신한 후, 수신한 비트 스트림을 역다중화부(101)를 이용하여 인코딩된 다운 믹스 신호와 인코딩된 공간 정보로 분리한다. 코어 디코딩부(103)는 인코딩된 다운 믹스 신호를 디코딩한다(단계 301). 멀티 채널 생성부(105)는 복호화된 다운 믹스 신호와 인코딩된 공간 정보를 이용하여 멀티 채널을 생성한다. 멀티 채널 생성부(105)는 멀티 채널을 생성함과 동시에, 트위터 채널 생성 정보를 이용하여 멀티 채널의 고주파 범위의 신호를 복제한다(단계 303). 3 is a flowchart schematically illustrating an audio signal decoding method according to another embodiment of the present invention. The audio signal decoding apparatus receives the encoded downmix signal and the encoded spatial information from the audio signal encoding apparatus in the form of a bit stream, and then receives the received bit stream with the downmix signal encoded using the demultiplexer 101. Separate into encoded spatial information. The core decoding unit 103 decodes the encoded downmix signal (step 301). The multi channel generator 105 generates a multi channel using the decoded downmix signal and the encoded spatial information. The multi-channel generator 105 generates a multi-channel and at the same time duplicates a signal having a high frequency range of the multi-channel using the tweeter channel generation information (step 303).

트위터 채널 생성 정보는 앞에서 살핀 바와 같이 오디오 신호 인코딩 장치에서 멀티 채널을 다운 믹싱할 때 추출되는 공간 정보에 삽입할 수도 있고, 인코딩된 다운 믹스 신호와 인코딩된 공간 정보를 다중화하여 비트스트림을 전송할 때, 비트스트림에 삽입할 수도 있다. 또한, 오디오 신호 디코딩 장치에서 전송된 오디오 비트스트림을 인코딩된 다운믹스 신호와 인코딩된 공간 정보로 분리하는 과정에서 공간 정보에 트위터 채널 생성 정보를 삽입할 수도 있다. 오디오 신호 인코딩 장치에서 공간 정보에 트위터 채널 생성 정보를 삽입한 경우에는 오디오 신호 디코딩 장치에서 공간 정보로부터 트위터 채널 생성 정보를 추출하여 트위터 채널을 생성한다. 또한, 오디오 신호 디코딩 장치는 오디오 신호 디코딩 장치가 미리 설정하여 저장한 디폴트 값을 트위터 채널 생성 정보로 이용하여 트위터 채널을 생성할 수도 있다. 오디오 신호 디코딩 장치에 트위터 채널 생성 정보 생성부(201)를 별도로 포함시켜 트위터 채널 생성 정보를 생성할 수도 있다.As described above, the tweeter channel generation information may be inserted into spatial information extracted when downmixing multichannels in an audio signal encoding apparatus, or when multiplexing an encoded downmix signal and encoded spatial information to transmit a bitstream. It can also be inserted into the bitstream. In addition, the tweeter channel generation information may be inserted into the spatial information in the process of separating the audio bitstream transmitted from the audio signal decoding apparatus into the encoded downmix signal and the encoded spatial information. When the tweeter channel generation information is inserted into the spatial information in the audio signal encoding apparatus, the tweeter channel generation information is generated by extracting the tweeter channel generation information from the spatial information in the audio signal decoding apparatus. In addition, the audio signal decoding apparatus may generate a tweeter channel using the default value preset and stored by the audio signal decoding apparatus as the tweeter channel generation information. The tweeter channel generation information may be separately included in the audio signal decoding apparatus to generate the tweeter channel generation information.

멀티 채널 생성부(105)는 트위터 채널 생성 정보를 이용하여 트위터 채널을 생성한다(단계 305).The multi-channel generator 105 generates a tweeter channel using the tweeter channel generation information (step 305).

도 4는 본 발명의 또 다른 실시 예에 따른 트위터 채널 생성 정보를 공간 정보에 포함시키는 방법을 개략적으로 나타낸 순서도이다. 오디오 신호 인코딩 장치는 멀티 채널을 다운 믹스 신호와 공간 정보로 분리하는데, 이 때 트위터 채널 생성 정보를 생성하여 공간 정보에 포함시킬 수 있다(단계 401, 403). 또는 오디오 신호 인코딩 장치에서 인코딩된 공간 정보에 트위터 채널 생성 정보를 생성하여 삽입할 수도 있다(단계 401, 403). 또는 인코딩된 다운 믹스 신호와 인코딩된 공간 정보를 다중화하여 비트 스트림으로 오디오 신호 디코딩 장치로 전송할 때, 비트 스트림 형태의 공간 정보에 트위터 채널 생성 정보를 생성하여 삽입할 수도 있다(단계 401, 403). 또는 오디오 신호 디코딩 장치에서 역다중화부가 전송된 비트 스트림을 인코딩된 다운 믹스 신호와 인코딩된 공간 정보로 분리할 때 트위터 채널 생성 정보를 생성하여 인코딩된 공간 정보에 삽입할 수도 있다(단계 401, 403).4 is a flowchart schematically illustrating a method of including tweeter channel generation information in spatial information according to another embodiment of the present invention. The audio signal encoding apparatus separates the multi-channel into a downmix signal and spatial information. At this time, the tweeter channel generation information may be generated and included in the spatial information (steps 401 and 403). Alternatively, the tweeter channel generation information may be generated and inserted into the spatial information encoded by the audio signal encoding apparatus (steps 401 and 403). Alternatively, when the encoded downmix signal and the encoded spatial information are multiplexed and transmitted to the audio signal decoding apparatus as a bit stream, tweeter channel generation information may be generated and inserted into the spatial information in the form of a bit stream (steps 401 and 403). Alternatively, when the demultiplexer separates the transmitted bit stream into the encoded downmix signal and the encoded spatial information in the audio signal decoding apparatus, the Twitter channel generation information may be generated and inserted into the encoded spatial information (steps 401 and 403). .

도 5는 본 발명의 또 다른 실시 예에 따른 오디오 신호 인코딩 및 디코딩 방법을 나타낸 순서도이다. 오디오 신호 인코딩 장치는 입력되는 멀티 채널 중 특정 멀티 채널 또는 조합한 멀티 채널의 특정 고주파 범위의 신호를 복제하여 트위터 채널을 생성한다(단계 501). 오디오 신호 인코딩 장치의 다운 믹싱부는 멀티 채널과 트위터 채널을 다운 믹싱한다(단계 503). 다운 믹싱부는 멀티 채널과 트위터 채널을 다운 믹싱하면서 이로부터 공간 정보를 추출한다. 공간 정보는 멀티 채널과 트위터 채널의 다운 믹싱 여부를 나타내는 정보를 포함할 수 있다. 5 is a flowchart illustrating a method of encoding and decoding an audio signal according to another embodiment of the present invention. The audio signal encoding apparatus generates a tweeter channel by replicating a signal of a specific high frequency range of a specific multi-channel or a combined multi-channel among the input multi-channels (step 501). The downmixing unit of the audio signal encoding apparatus downmixes the multi-channel and the tweeter channel (step 503). The down mixing section down-mixes the multi-channel and tweeter channels and extracts spatial information therefrom. The spatial information may include information indicating whether the multi channel and the tweeter channel are down mixed.

이 때, 오디오 신호 인코딩 장치는 멀티 채널을 복제한 트위터 채널과 믹싱 된 멀티 채널의 종류를 인식한다(단계 505). 오디오 신호 인코딩 장치는 인식된 멀티 채널의 종류에 따라 공간 정보, 더 구체적으로는 공간 파라미터를 선택적으로 생성한다. 즉, 트위터 채널과 다운 믹싱된 채널이 일반 채널인 경우-여기서 일반 채널은 저주파 신호만으로 이루어진 채널을 제외한다-공간 파라미터를 생성하고(단계 507), 트위터 채널과 다운 믹싱된 채널이 저주파 신호만으로 이루어진 저주파 채널일 경우 고주파 채널인 트위터 채널과 저주파 채널 사이에는 공간 정보가 필요하지 않으므로 공간 파라미터를 생성하지 않는다. 오디오 신호 인코딩 장치는 다운 믹스 신호와 공간 정보를 각각 인코딩한 후 인코딩된 다운 믹스 신호와 인코딩된 공간 정보를 다중화하여 비트 스트림 형태로 오디오 신호 디코딩 장치로 전송한다(단계 509). At this time, the audio signal encoding apparatus recognizes the type of the multi-channel mixed with the tweeter channel that duplicates the multi-channel (step 505). The audio signal encoding apparatus selectively generates spatial information, more specifically, spatial parameters according to the recognized multi-channel type. That is, if the tweeter channel and the downmixed channel are normal channels, where the normal channel excludes the channel consisting only of low frequency signals, a spatial parameter is generated (step 507), and the tweeter channel and the downmixed channel consist of only low frequency signals. In the case of the low frequency channel, spatial information is not required between the high frequency channel and the low frequency channel, and thus no spatial parameter is generated. The audio signal encoding apparatus encodes the downmix signal and the spatial information, respectively, and then multiplexes the encoded downmix signal and the encoded spatial information and transmits them in the form of a bit stream to the audio signal decoding apparatus (step 509).

오디오 신호 디코딩 장치의 역다중화부(101)는 전송된 비트 스트림을 인코딩된 다운 믹스 신호와 인코딩된 공간 정보로 분리한다. 인코딩된 다운 믹스 신호는 코어 디코딩부(103)를 통해 복호화되어 공간 정보와 함께 멀티 채널 생성부(105)로 전송된다. 멀티 채널 생성부(105)는 공간 정보를 이용하여 멀티 채널과 트위터 채널을 복원한다(단계 511). 트위터 채널이 일반 채널과 다운 믹싱된 경우에는 트위터 채널과 일반 채널 간의 관계를 나타내는 공간 파라미터를 이용하여 트위터 채널을 생성한다(단계 511). The demultiplexer 101 of the audio signal decoding apparatus separates the transmitted bit stream into an encoded downmix signal and encoded spatial information. The encoded downmix signal is decoded by the core decoding unit 103 and transmitted to the multi-channel generating unit 105 along with the spatial information. The multi channel generator 105 restores the multi channel and the tweeter channel using the spatial information (step 511). If the tweeter channel is downmixed with the normal channel, a tweeter channel is generated using spatial parameters representing the relationship between the tweeter channel and the normal channel (step 511).

본 발명에 의한 오디오 신호 인코딩 및 디코딩 방법은 멀티 채널을 복사하여 트위터 채널을 생성함으로써 적은 데이터로 트위터 채널을 복원하는 효과를 갖는 다.The audio signal encoding and decoding method according to the present invention has the effect of restoring a tweeter channel with less data by generating a tweeter channel by copying multiple channels.

Claims (15)

인코딩된 다운믹스 신호를 코어 디코딩하는 단계; 및Core decoding the encoded downmix signal; And 상기 코어 디코딩된 다운믹스 신호와 트위터 채널 생성 정보를 이용하여 멀티 채널의 고주파 범위의 신호를 복제하여 트위터 채널을 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 디코딩 방법.And generating a tweeter channel by copying a signal having a high frequency range of a multi-channel by using the core decoded downmix signal and tweeter channel generation information. 제1 항에 있어서, 상기 트위터 채널 생성 정보는The method of claim 1, wherein the Twitter channel generation information 인코딩된 다운믹스 신호를 이용하여 멀티 채널을 생성하는 단계에서 생성되는 값이거나 또는 디폴트 값인 것을 특징으로 하는 오디오 신호 디코딩 방법.And a default value or a value generated in generating a multi-channel using an encoded downmix signal. 제2 항에 있어서, 상기 트위터 채널 생성 정보는The method of claim 2, wherein the tweeter channel generation information 인코딩된 다운믹스 신호를 이용하여 멀티 채널을 생성하는 단계에서 복원된 공간 정보로부터 추출되는 것을 특징으로 하는 오디오 신호 디코딩 방법.And extracting from the reconstructed spatial information in the step of generating a multi-channel using the encoded downmix signal. 제1 항에 있어서, 상기 트위터 채널 생성 정보는The method of claim 1, wherein the Twitter channel generation information 상기 복제할 멀티 채널 선택 정보 또는 상기 복제할 멀티 채널 신호의 주파수 범위 중 적어도 하나를 포함하는 것을 특징으로 하는 오디오 신호 디코딩 방법.And at least one of the multi-channel selection information to be duplicated or a frequency range of the multi-channel signal to be duplicated. 제1 항에 있어서, 상기 트위터 채널 생성 정보는 The method of claim 1, wherein the Twitter channel generation information 상기 복제할 멀티 채널 신호의 최소 주파수 값 또는 최대 주파수 값 중 적어도 하나를 포함하는 것을 특징으로 하는 오디오 신호 디코딩 방법. And at least one of a minimum frequency value and a maximum frequency value of the multi-channel signal to be duplicated. 제5 항에 있어서, 상기 최대 주파수 값은 The method of claim 5, wherein the maximum frequency value is 샘플링 주파수의 최대값 또는 상기 트위터 채널의 특성에 의해 결정되는 값 중 어느 하나인 것을 특징으로 하는 오디오 신호 디코딩 방법.And a value determined by a maximum value of a sampling frequency or a characteristic of the tweeter channel. 제1 항에 있어서, 상기 트위터 채널 생성 정보에 포함된 게인 조정값을 이용하여 상기 트위터 채널의 게인을 조정하는 것을 특징으로 하는 오디오 신호 디코딩 방법.The audio signal decoding method of claim 1, wherein the gain of the tweeter channel is adjusted using a gain adjustment value included in the tweeter channel generation information. 제1 항에 있어서, 복원 채널의 수가 채널수의 임계 값을 초과할 때, 상기 트위터 채널을 생성하는 것을 특징으로 하는 오디오 신호 디코딩 방법.2. The method of claim 1, wherein the tweeter channel is generated when the number of reconstructed channels exceeds a threshold of the number of channels. 트위터 채널 생성 정보를 생성하는 단계; 및Generating twitter channel creation information; And 상기 생성된 트위터 채널 생성 정보를 공간 정보에 포함하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 인코딩 방법.And including the generated tweeter channel generation information in spatial information. (a) 멀티 채널을 복제한 트위터 채널과 믹싱된 멀티 채널의 종류를 인식하는 단계; 및(a) recognizing a type of the multi-channel mixed with the tweeter channel that duplicates the multi-channel; And (b) 상기 인식된 멀티 채널의 종류에 따라 공간 파라미터를 선택적으로 이용하여 다운 믹스 신호로부터 상기 트위터 채널을 복원하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 디코딩 방법.and restoring the tweeter channel from a downmix signal by selectively using a spatial parameter according to the recognized multi-channel type. 제10 항에 있어서, 상기 (b) 단계는The method of claim 10, wherein step (b) 상기 트위터 채널과 다운 믹싱된 채널이 일반 채널일 경우 상기 공간 파라미터를 이용하여 상기 다운 믹스 신호로부터 상기 트위터 채널을 복원하고, 상기 트위터 채널과 다운 믹싱된 채널이 저주파 채널일 경우 상기 공간 파라미터를 이용하지 않고 상기 다운 믹스 신호로부터 상기 트위터 채널을 복원하는 것을 특징으로 하는 오디오 신호 디코딩 방법. If the tweeter channel and the downmixed channel are normal channels, the tweeter channel is restored from the downmix signal using the spatial parameter. If the tweeter channel and the downmixed channel are low frequency channels, the spatial parameter is not used. And recovering the tweeter channel from the downmix signal without using it. (c) 멀티 채널을 복제하여 트위터 채널을 생성하는 단계;(c) creating a tweeter channel by replicating the multi-channel; (d) 상기 생성된 트위터 채널과 멀티 채널을 다운 믹싱하는 단계; 및(d) downmixing the generated tweeter channel and the multi-channel; And (e) 상기 다운 믹싱된 트위터 채널과 멀티 채널 간의 관계를 나타내는 정보를 공간 정보에 삽입하는 단계를 포함하는 것을 특징으로 하는 오디오 신호를 인코딩하는 방법.(e) inserting into the spatial information information representing the relationship between the downmixed tweeter channel and the multi-channel. 제12 항에 있어서, 상기 다운 믹싱된 트위터 채널과 멀티 채널 간의 관계를 나타내는 정보는The method of claim 12, wherein the information representing the relationship between the downmixed tweeter channel and the multi-channel is 상기 멀티 채널과 상기 트위터 채널의 다운 믹싱 여부를 나타내는 정보인 것 을 특징으로 하는 오디오 신호 인코딩 방법.And information indicating whether the multi-channel and the tweeter channel are down mixed. 제12 항에 있어서, 상기 (e) 단계는The method of claim 12, wherein step (e) 상기 트위터 채널과 다운 믹싱된 상기 멀티 채널의 종류에 따라 공간 정보의 공간 파라미터를 선택적으로 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 인코딩 방법.And selectively generating a spatial parameter of spatial information according to the type of the multi-channel downmixed with the tweeter channel. 제14 항에 있어서, 상기 트위터 채널이 저주파 채널과 다운 믹싱될 때 공간 파라미터를 생성하지 않고, 상기 트위터 채널이 일반 채널과 다운 믹싱될 때 상기 공간 파라미터를 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 인코딩 방법.15. The method of claim 14, comprising generating the spatial parameter when the tweeter channel is downmixed with the normal channel, without generating the spatial parameter when the tweeter channel is downmixed with the low frequency channel. Signal Encoding Method.
KR1020060097311A 2006-10-02 2006-10-02 Method for encoding and decoding an audio signal KR20080030847A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060097311A KR20080030847A (en) 2006-10-02 2006-10-02 Method for encoding and decoding an audio signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060097311A KR20080030847A (en) 2006-10-02 2006-10-02 Method for encoding and decoding an audio signal

Publications (1)

Publication Number Publication Date
KR20080030847A true KR20080030847A (en) 2008-04-07

Family

ID=39532738

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060097311A KR20080030847A (en) 2006-10-02 2006-10-02 Method for encoding and decoding an audio signal

Country Status (1)

Country Link
KR (1) KR20080030847A (en)

Similar Documents

Publication Publication Date Title
KR101506837B1 (en) Method and apparatus for generating side information bitstream of multi object audio signal
JP4601669B2 (en) Apparatus and method for generating a multi-channel signal or parameter data set
KR101283783B1 (en) Apparatus for high quality multichannel audio coding and decoding
RU2618383C2 (en) Encoding and decoding of audio objects
JP4603037B2 (en) Apparatus and method for displaying a multi-channel audio signal
KR100955361B1 (en) Adaptive residual audio coding
KR100917843B1 (en) Apparatus and method for coding and decoding multi-object audio signal with various channel
JP4616349B2 (en) Stereo compatible multi-channel audio coding
KR100908081B1 (en) Apparatus and method for generating encoded and decoded multichannel signals
US8712784B2 (en) Encoding method and encoding device, decoding method and decoding device and transcoding method and transcoder for multi-object audio signals
JP7413418B2 (en) Audio decoder for interleaving signals
JP2014089467A (en) Encoding/decoding system for multi-channel audio signal, recording medium and method
KR20090082927A (en) A method and an apparatus for decoding an audio signal
KR102172279B1 (en) Encoding and decdoing apparatus for supprtng scalable multichannel audio signal, and method for perporming by the apparatus
KR20070001139A (en) An audio distribution system, an audio encoder, an audio decoder and methods of operation therefore
US20080288263A1 (en) Method and Apparatus for Encoding/Decoding
KR20070003544A (en) Clipping restoration by arbitrary downmix gain
JP2009532712A (en) Media signal processing method and apparatus
JP5113151B2 (en) Media signal processing apparatus and method
KR20080030847A (en) Method for encoding and decoding an audio signal
KR102191260B1 (en) Apparatus and method for encoding/decoding of audio using multi channel audio codec and multi object audio codec
KR20080030848A (en) Method and apparatus for encoding and decoding an audio signal

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination