KR20070037977A - 다채널 오디오 신호의 인코딩 방법 및 장치 그리고인코딩된 신호의 디코딩 방법 - Google Patents

다채널 오디오 신호의 인코딩 방법 및 장치 그리고인코딩된 신호의 디코딩 방법 Download PDF

Info

Publication number
KR20070037977A
KR20070037977A KR1020060055018A KR20060055018A KR20070037977A KR 20070037977 A KR20070037977 A KR 20070037977A KR 1020060055018 A KR1020060055018 A KR 1020060055018A KR 20060055018 A KR20060055018 A KR 20060055018A KR 20070037977 A KR20070037977 A KR 20070037977A
Authority
KR
South Korea
Prior art keywords
signal
downmix signal
spatial information
downmix
correction
Prior art date
Application number
KR1020060055018A
Other languages
English (en)
Inventor
방희석
오현오
김동수
임재현
정양원
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of KR20070037977A publication Critical patent/KR20070037977A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 다채널 오디오 신호의 인코딩 방법을 제공하기 위한 것으로, 다채널 오디오 입력신호를 다운믹스하여 다운믹스 신호를 생성하고, 공간정보를 추출하는 단계; 상기 다채널 오디오 입력신호와 상기 다운믹스 신호의 에너지 레벨을 구하여, 상기 다채널 오디오 입력신호와 상기 다운믹스 신호의 레벨 차이를 계산하는 단계; 및 상기 레벨 차이를 계산하는 단계에서 계산된 결과를 이용하여 상기 다운믹스 신호를 보정하고, 상기 보정된 다운믹스 신호와 상기 공간정보를 결합하여 부호화된 오디오 신호를 생성하는 단계를 포함한다.

Description

다채널 오디오 신호의 인코딩 방법 및 장치 그리고 인코딩된 신호의 디코딩 방법{METHOD AND APPARATUS FOR ENCODING MULTI-CHANNEL AUDIO SIGNALS, METHOD FOR DECODING ENCODED SIGNALS}
도 1은 본 발명의 일실시예에 의한 다채널 오디오 신호의 인코딩 방법의 흐름도이고,
도 2, 도 3은 본 발명의 일실시예에 의한 다채널 오디오 신호의 인코딩 장치의 블록 구성도이고,
도 4, 도 5는 본 발명의 일실시예에 의한 다채널 오디오 신호의 디코딩 방법이 수행되는 디코딩 장치의 블록 구성도이다.
* 도면의 주요 부분에 대한 부호의 설명 *
10: 공간 인코더 20: 다운믹스 신호 보정부
30: 비트 스트림 포맷터 40: 에너지 분석부
50: 공간정보 수정부 60: 신호 분리부
70: 오디오 디코더 80,80a: 다채널 오디오 생성부
90: 에너지 보정부 100: 다채널 오디오 입력신호
110: 공간정보 120: 보정된 다운믹스 신호
130: 다운믹스 신호 140,140a: 오디오 비트 스트림
200,200′: 오디오 비트 스트림 210,210a:공간정보
220: 부호화된 다운믹스 비트 스트림 230a: 보정정보
본 발명은 다채널(멀티채널, Multi-channel) 오디오 코딩에 관한 것으로, 특히, 에너지 보정을 수행하여 인코딩하는 방법 및 장치 그리고 그 인코딩 방법에 의해 인코딩된 신호를 복호화하는 디코딩 방법에 관한 것이다.
디지털 비디오, 디지털 오디오에 대한 표준은 각각의 신호에 대한 압축 및 복원에 대한 규격이다. 또한, 디지털 시스템에 대한 표준은 압축된 비디오와 오디오 각각을 일정한 크기의 패킷으로 분할한 후 타이밍 정보, 스트림 관련 정보 등을 추가하여 다중화하여 전송하고, 그 반대로 역 다중화 과정을 통해 타이밍 정보, 스트림 관련 정보 등을 얻어내고, 또한 압축된 비디오와 오디오를 각각 분리해 내는데 필요한 규격이다.
최근에 디지털 오디오 신호에 대한 다양한 코딩기술 및 방법들이 개발되고 있으며, 이와 관련된 제품들이 생산되고 있다. 또한 멀티채널 오디오 신호의 공간 정보를 이용하여 모노 또는 스테레오 오디오 신호를 디코딩 단계에서 멀티채널로 바꾸는 코딩방법들이 개발되고 있으며, 이에 대한 제품이 실용화되고 있다.
그러나 상기와 같은 제품들을 이용한 멀티 채널 오디오 신호 처리 기법은 신호 처리과정에서 데이터량을 줄일 수 있다는 장점은 있지만 센터 채널 등 특정 채 널에서 에너지 레벨 변화가 발생하여 신호의 왜곡이 발생한다는 문제점이 있었다.
이에 본 발명은 상기와 같은 종래의 제반 문제점을 해결하기 위해 제안된 것으로, 본 발명의 목적은 다채널 오디오 입력신호와 다운믹스 신호와의 에너지 레벨 차이를 구하여, 그 차이를 이용하여 다운믹스 신호를 보정하여 부호화하는 다채널 오디오 신호의 인코딩 방법 및 장치를 제공하는데 있다.
또한, 본 발명의 또다른 목적은 상기 인코딩 방법으로 부호화된 오디오 신호를 복호화하는 디코딩 방법을 제공하는데 있다.
본 발명에 따른 다채널 오디오 신호의 인코딩 방법은 다채널 오디오 입력신호를 다운믹스하여 다운믹스 신호를 생성하고, 공간정보를 추출하는 단계; 상기 다채널 오디오 입력신호와 상기 다운믹스 신호의 에너지 레벨을 구하여, 상기 다채널 오디오 입력신호와 상기 다운믹스 신호의 레벨 차이를 계산하는 단계; 및 상기 레벨 차이를 계산하는 단계에서 계산된 결과를 이용하여 상기 다운믹스 신호를 보정하고, 상기 보정된 다운믹스 신호와 상기 공간정보를 결합하여 부호화된 오디오 신호를 생성하는 단계를 포함한다.
한편, 본 발명에 따른 다채널 오디오 신호의 디코딩 방법은 부호화된 오디오 신호를 부호화된 아티스틱 다운믹스 신호와 공간정보로 분리하는 단계; 및 상기 아티스틱 다운믹스 신호의 이득을 보정한 후, 상기 이득이 보정된 아티스틱 다운믹스 신호에 에너지 레벨 보정을 수행하고, 상기 에너지 레벨이 보정된 다운믹스 신호와 상기 공간정보로 다채널 오디오 신호를 생성하는 단계를 포함하여 수행된다.
또한, 본 발명에 따른 다채널 오디오 신호의 디코딩 방법은 보정된 다운믹스 신호가 포함되어 부호화된 오디오 신호를 부호화된 보정 다운믹스 신호와 공간정보로 분리하는 단계; 및 상기 부호화된 보정 다운믹스 신호를 복호화하여 다운믹스 신호를 생성하는 단계를 포함하여 수행된다.
또한, 본 발명에 따른 다채널 오디오 신호의 인코딩 장치는 다채널 오디오 입력신호를 다운믹스하여 다운믹스 신호를 생성하고, 공간정보를 추출하는 공간 인코더; 및 상기 다채널 오디오 신호의 에너지 레벨과 상기 다운믹스 신호의 에너지 레벨과의 차이를 이용하여 상기 다운믹스 신호를 보정하는 다운믹스 신호 보정부를 포함한다.
또한, 본 발명에 따른 다채널 오디오 신호의 인코딩 장치는 다채널 오디오 입력신호를 다운믹스하여 다운믹스 신호를 생성하고, 공간정보를 추출하는 공간 인코더; 상기 다채널 오디오 신호의 에너지 레벨과 상기 다운믹스 신호의 에너지 레벨과의 차이를 구하여 보정정보를 생성하는 에너지 분석부; 및 상기 보정정보에 따라 공간정보를 수정하는 공간정보 수정부를 포함한다.
이하, 상기와 같은 본 발명, 다채널 오디오 신호의 인코딩 방법 및 장치 그리고 그 인코딩 방법에 의해 인코딩된 신호의 디코딩 방법의 기술적 사상에 따른 일실시예를 도면을 참조하여 설명하면 다음과 같다.
도 1은 본 발명의 일실시예에 의한 다채널 오디오 신호의 인코딩 방법의 흐름도이다.
이에 도시된 바와 같이, 먼저 인코딩 될 다채널 오디오 입력신호를 다운믹스하여 다운믹스 신호를 생성한다. 이 경우 전술한 다운믹스 신호를 생성하면서 함께 공간정보도 추출하는 단계를 거친다(S10).
S20단계는 전술한 다채널 오디오 입력신호와 다운믹스 신호와의 에너지 레벨을 계산하여 보정정보를 추출한다. 여기서 언급된 보정정보는 다채널 오디오 입력신호의 에너지 레벨과 다운믹스 신호의 에너지 레벨과의 차이를 이용하여 구한다. 즉, 다채널 오디오 입력신호를 다운믹스 할 때 발생하는 에너지의 왜곡을 보정하는 것이다.
한편, 다채널 오디오 입력신호와 다운믹스 신호는 적절한 변환이나 필터링 과정을 통해 주파수 특성을 알 수 있다. 이 때, 적절한 변환이나 필터링을 이용하면, 전술한 다채널 오디오 입력신호와 다운믹스 신호의 주파수 밴드별 에너지 레벨을 구하여 주파수 밴드별 에너지 레벨을 비교하고 그 차이를 보정정보로 추출할 수 있다. 적절한 변환의 예로 FFT(Fast Fourier Transform), DCT(Discrete Cosine Transform), QMF(Quadrature Fourier Transform) 등이 있다. 또한, 전술한 필터링을 할 때, 사용하는 필터로는 로패스 필터(Lowpass Filter), 밴드패스 필터(Bandpass Filter), 하이패스 필터(Highpass Filter) 등이 있다.
또한, 상기에서 언급된 변환과정이나 필터링을 조합하여 얻어진 다채널 오디오 입력신호와 다운믹스 신호의 에너지 레벨 차이를 이용하여 보정정보를 추출할 수도 있다.
S30단계는 S20단계에서 추출된 보정정보를 어떻게 이용할지 여부를 판단하는 단계로서, 이는 보정수행 경로를 판단하는 단계라고 할 수 있다.
우선, 첫 번째 경로를 선택한 경우 S40단계로 진행하여 다운믹스 신호를 보정한다. 이 경우 S20단계에서 언급된 변환이나 필터링을 통해 보정정보를 추출한 경우는 전술한 변환이나 필터링을 수행하는 과정에서 발생되는 지연시간을 고려하여 보정을 수행하는 것이 바람직하다. 예를 들어, 주파수 분석을 위해 변환이나 필터링을 이용한 경우에 지연(delay)가 100 time sample가 발생한다면 실제 보정은 이 100 time sample을 고려하여 100 time sample을 앞당긴 신호에 적용하여 보정한다.
그리고 S50단계로 진행하여 보정된 다운믹스 신호와 공간정보를 결합하여 부호화하는 과정을 거치게 된다.
한편, 두 번째 경로를 선택한 경우는 S60단계로 진행하여 전술한 보정정보를 이용하여 공간정보에 수정을 가한다. 그리고 S70단계로 진행하여 수정된 공간정보와 다운믹스 신호를 결합하여 부호화된 오디오 신호를 생성한다.
또한, 세 번째 경로를 선택한 경우는 S80단계로 진행하여 S20단계에서 추출된 보정정보를 공간정보에 포함시킨다. 그리고 S90단계로 진행하여 보정정보가 포함된 공간정보와 다운믹스 신호를 결합하여 부호화된 오디오 신호를 생성한다.
도 2는 본 발명의 일실시예에 의한 다채널 오디오 신호의 인코딩 장치의 블록 구성도로서, 도시된 인코딩 장치는 공간 인코더(10)와 다운믹스 신호 보정부(20)와 비트 스트림 포맷터(30)로 구성된다.
이에 도시된 바와 같이, 공간 인코더(10)는 다채널 오디오 입력신호(100)를 다운믹스하여 다운믹스 신호(130)를 생성하고, 다운믹스 신호(130)를 생성하는 과정에서 공간정보(110)를 추출해 낸다.
다운믹스 신호(130)는 다운믹스 신호 보정부(20)로 전송되어 보정과정을 거치는데, 그 보정은 다음과 같이 수행된다. 다운믹스 신호 보정부(20)는 다채널 오디오 입력신호(100)와 다운믹스 신호(130)를 인가받아 양 신호(100, 130)에 대한 에너지 레벨을 계산하여 그 차이를 구한다. 그리고 계산된 에너지 레벨 차이를 이용하여 다운믹스 신호(130)를 보정한다.
전술한 에너지 레벨 차이는 다양한 방법으로 구해질 수 있다. 예를 들면, 다채널 오디오 입력신호(100)를 채널별로 에너지를 구하여 다 합한 후, 다운믹스 신호(130)의 에너지 레벨과의 차이를 계산할 수 있다. 또한, 다채널 오디오 입력신호(100)와 다운믹스 신호(130)는 적절한 변환이나 필터링을 하면 주파수 특성을 분석할 수 있는데, 상기와 같은 변환이나 필터링을 통해 주파수 분석을 수행한 후, 다채널 오디오 입력신호(100)와 다운믹스 신호(130)의 주파수 밴드별 에너지 레벨을 구하여 주파수 밴드별 에너지 레벨 차이를 계산할 수도 있다.
전술한 변환의 예로는 FFT, DCT, QMF 등이 있다. 또한 필터링을 수행할 때, 사용하는 필터로는 로패스 필터(Lowpass Filter), 밴드패스 필터(Bandpass Filter), 하이패스 필터(Highpass Filter) 등이 있다.
다운믹스 신호 보정부(20)는 상술한 변환이나 필터를 사용하여 주파수 분석을 수행할 때, 발생하는 지연시간을 고려하여 보정을 수행한다. 예를 들어, 주파수 분석을 위해 변환이나 필터링을 이용한 경우에 지연(delay)가 100 time sample가 발생한다면 실제 보정은 이 100 time sample을 고려하여 100 time sample을 앞당긴 신호에 적용하여 보정한다.
그리고 비트 스트림 포맷터(30)에서는 다운믹스 신호 보정부(20)에서 보정된 다운믹스 신호(120)와 공간정보(110)로 오디오 비트 스트림(140)을 생성한다.
도 3은 본 발명의 일실시예에 의한 다채널 오디오 신호의 인코딩 장치의 블록 구성도로서, 도시된 인코딩 장치는 공간 인코더(10)와 에너지 분석부(40)와 공간정보 수정부(50)와 비트 스트림 포맷터(30)로 구성한다.
이에 도시된 바와 같이, 공간 인코더(10)는 다채널 오디오 입력신호(100)를 다운믹스하여 다운믹스 신호(130)를 생성하고, 다운믹스 신호(130)를 생성하는 과정에서 공간정보(110)를 추출해 낸다.
다운믹스 신호(130)는 에너지 분석부(40)로 전송되어 에너지 분석과정을 거치는데, 이 때, 다채널 오디오 입력신호(100)도 함께 전송된다. 그러면 에너지 분석부(40)에서는 다채널 오디오 입력신호(100)와 다운믹스 신호(130)의 에너지 레벨을 분석하여 보정정보(120a)를 생성한다. 그리고 공간정보 수정부(50)에서는 생성된 보정정보(120a)를 이용하여 공간정보(110)의 값을 수정한다. 여기서 공간정보(110)의 값을 수정한다는 의미는 공간정보(110) 값 자체를 수정하는 경우도 있지만, 공간정보(110)에 보정정보(120a)를 포함시키는 것도 포함한다. 보정정보(120a)는 다채널 오디오 입력신호(100)와 다운믹스 신호(130)는 적절한 변환이나 필터링을 이용한 주파수 분석을 통해 얻어질 수 있다. 상기와 같은 변환이나 필터링을 통해 주파수 분석을 수행한 후, 다채널 오디오 입력신호(100)와 다운믹스 신호(130) 의 주파수 밴드별 에너지 레벨을 구하여 주파수 밴드별 에너지 레벨 차이를 계산하여 그것을 보정정보(120a)로 할 수도 있다.
전술한 변환의 예로는 FFT, DCT, QMF 등이 있다. 또한 필터링을 수행할 때, 사용하는 필터로는 로패스 필터(Lowpass Filter), 밴드패스 필터(Bandpass Filter), 하이패스 필터(Highpass Filter) 등이 있다.
한편, 공간정보 수정부(50)는 상술한 변환이나 필터를 사용하여 주파수 분석을 수행할 때, 발생하는 지연시간을 고려하여 보정을 수행한다.
상술한 방법으로 수정된 공간정보(111)는 다운믹스 신호(130)와 함께 비트 스트림 포맷터(30)로 전송되고, 비트 스트림 포맷터(30)에서는 전송받은 수정된 공간정보(111)는 다운믹스 신호(130)를 결합하여 부호화된 신호인 오디오 비트 스트림(140a)을 생성한다.
도 4는 본 발명의 일실시예에 의한 다채널 오디오 신호의 디코딩 방법이 수행되는 디코딩 장치의 블록 구성도로서, 도시된 디코딩 장치는 신호 분리부(60)와 오디오 디코더(70)와 다채널 오디오 생성부(90)로 구성된다.
이에 도시된 바와 같이, 도 2와 같은 인코딩 장치로 부호화된 오디오 비트 스트림(200)이 신호 분리부(60)에 인가되면, 신호 분리부(60)에서는 비트 스트림 형태인 보정된 다운믹스 비트 스트림(220)과 공간정보(210)를 추출해 낸다. 오디오 비트 스트림(200)은 보정된 다운믹스 신호(120)를 포함하고 있다. 따라서 보정된 다운믹스 비트 스트림(220)은 오디오 디코더(70)로 전송되어 복호화된 후, 다운믹스 오디오 신호(230)를 생성한다.
그리고 다채널 오디오 생성부(80)는 공간정보(210)와 다운믹스 오디오 신호(230)을 결합하여 다채널 오디오 신호(240)를 생성한다.
한편, 아티스틱(artistic) 다운믹스 신호가 포함된 오디오 비트 스트림(200′)이 신호 분리부(60)로 인가되는 경우는 신호 분리부(60)에서 공간정보(210)와 부호화된 아티스틱 다운믹스(220′)를 분리 추출하고, 부호화된 아티스틱 다운믹스 신호(220′)는 오디오 인코더(70)에서 복호화된 후 아티스틱 다운믹스 오디오 신호(230′)로 출력된다. 아틱스틱 다운믹스 신호는 사용자의 의도에 의해 인위적으로 다운믹스된 신호이다.
한편, 다채널 오디오 생성부(80)에서는 아티스틱 다운믹스 오디오 신호(230′)와 공간정보(210)를 이용하여 다채널 오디오 신호(240)를 생성할 수 있다. 이 경우 아티스틱 다운믹스 오디오 신호(230′)는 먼저 ADG(Arbitary Dowmmix Gain)을 통한 보정을 수행하는 작업이 선행된 후에, 공간정보(210)와 결합하는 작업이 수행된다. 여기서 언급된 ADG는 일반적인 다운믹스 신호와 아티스틱 다운믹스 신호와의 레벨 차이를 근거로한 이득값을 말한다. 따라서 아티스틱 다운믹스 오디오 신호(230′)를 이용하여 다채널 오디오 신호(240)를 생성할 때, 에너지 레벨 보정을 수행할 때는 ADG를 통해 보정된 아티스틱 다운믹스 오디오 신호(230′)에 에너지 레벨 보정을 수행하는 것이 바람직하다. 물론 경우에 따라서는 아티스틱 다운믹스 오디오 신호(230′)는 에너지 레벨 보정을 수행하지 않는 것이 더 바람직할 때도 있다.
상술한 보정을 수행할 때, 지연시간이 발생한 경우는 그것을 고려하여 보정 을 수행하는 것이 바람직하다. 또한, 에너지 보정을 수행하는 방법은 다양하게 존재한다. 그 예로 주파수 밴드상에서 에너지 보상을 수행할 수도 있고, 시간축상에서 다채널 오디오 신호에 에너지 보상을 수행할 수도 있고, 언급된 2가지 방법을 적절히 조합하여 보정을 수행할 수도 있다. 또한, 보정이 대상이 되는 신호가 드라이 시그널(dry signal) 및 웨트 시그널(wet signal)의 부분으로 나눠질 경우, 이 중 특정한 신호에만 보정을 수행하거나, 두 신호 모두에 보정을 수행하거나 언급된 2가지 방법을 적절히 조합하여 보정을 수행할 수 있다. 드라이 시그널이란 공간정보(110)에 포함되는 CLD(Channel Level Difference) 등으로 단순히 상대적 에너지 레벨값을 조정하여 만들어진 신호로 코릴레이션(correlation)이 1인 신호를 말한다. 이에 반해, 웨트 시그널은 디코릴레이션(decorrelation)과정을 거쳐 에너지 레벨은 드라이 시그널과 같으나 코릴레이션 값이 0인 신호를 말한다. 양신호(dry signal과 wet signal)을 적당히 섞어주게 되면 ICC(Inter Channel Correlation/Coherences)값을 만족시키는 신호를 만들 수 있다.
도 5는 본 발명의 일실시예에 의한 다채널 오디오 신호의 디코딩 방법이 수행되는 디코딩 장치의 블록 구성도로서, 도시된 디코딩 장치는 신호 분리부(60)와 오디오 디코더(70)와 다채널 오디오 생성부(80a)와 에너지 보정부(90)로 구성된다.
이에 도시된 바와 같이, 도 3에 도시된 인코딩 장치로 부호화된 오디오 비트 스트림(200a)이 신호 분리부(60)에 인가되면, 신호 분리부(60)에서는 비트 스트림 형태인 다운믹스 비트 스트림(220a)과 공간정보(210a)를 추출해 낸다. 오디오 비트 스트림(200a)은 보정정보를 이용하여 수정이 가해진 공간정보를 포함하고 있다. 수 정이 가해진 공간정보라는 의미는 도 3에서 언급된 바와 같이 보정정보에 따라 공간정보 자체가 수정된 것을 의미할 수도 있고, 공간정보에 보정정보를 포함한 것을 의미할 수도 있다.
우선, 공간정보 자체를 수정한 것인 경우는 수정된 공간정보(210a)와 다운믹스 오디오 신호(240a)가 다채널 오디오 생성부(80a)로 인가되어 다채널 오디오 신호(250a)를 생성한다. 다운믹스 오디오 신호(240a)는 부호화된 다운믹스 신호(220a)를 오디오 디코더(70)를 거치면서 복호화된 신호이다.
한편, 공간정보에 보정정보가 포함된 것인 경우는 신호 분리부(60)에서는 부호화된 다운믹스 신호(220a)나 공간정보(210a) 외에 보정정보(230a)도 함께 추출한다. 이 경우 부호화된 다운믹스 신호(220a)는 오디오 디코더(70)를 거치면서 복호화되어 다운믹스 오디오 신호(240a)가 출력된다. 그리고 공간정보(210a)와 다운믹스 오디오 신호(240a)는 다채널 오디오 생성부(80a)로 인가되어 다채널 오디오 신호(250a)를 생성한다. 생성된 다채널 오디오 신호(250a)는 에너지 보정부(90)로 인가되고 보정이 수행된다. 이 때, 보정은 신호 분리부(60)에서 추출된 보정정보(230a)를 이용하여 수행하게 된다. 그리고 보정된 다채널 오디오 신호(260a)가 출력된다.
한편, 아티스틱(artistic) 다운믹스 신호가 포함된 오디오 비트 스트림(200a′)이 신호 분리부(60)로 인가되는 경우는 신호 분리부(60)에서 공간정보(210a)와 부호화된 아티스틱 다운믹스(220a′)와 보정정보(230a)를 분리 추출하고, 부호화된 아티스틱 다운믹스 신호(220a′)는 오디오 인코더(70)에서 복호화된 후 아티스틱 다운믹스 오디오 신호(240a′)로 출력된다. 아틱스틱 다운믹스 신호는 사용자의 의도에 의해 인위적으로 다운믹스된 신호이다.
한편, 다채널 오디오 생성부(80a)에서는 아티스틱 다운믹스 오디오 신호(240a′)와 공간정보(210a)를 이용하여 다채널 오디오 신호(250a′)를 생성할 수 있다. 이 경우 아티스틱 다운믹스 오디오 신호(240a′)는 먼저 ADG(Arbitary Dowmmix Gain)을 통한 보정을 수행하는 작업이 선행된 후에, 공간정보(210a)와 결합하여 다채널 오디오 신호(250a′)를 생성하는 작업이 수행된다. 여기서 언급된 ADG는 일반적인 다운믹스 신호와 아티스틱 다운믹스 신호와의 레벨 차이를 근거로한 이득값을 말한다. 그렇게 생성된 다채널 오디오 신호(250a′)는 에너지 보정부(90)로 인가되어 보정과정을 거친 후에 보정된 다채널 오디오 신호(260a′)로 출력된다. 이 보정과정 역시 보정정보(230a)를 이용하여 수행하는 것이 바람직하다.
상술한 보정을 수행할 때, 지연시간이 발생한 경우는 그것을 고려하여 보정을 수행하는 것이 바람직하다. 또한, 에너지 보정을 수행하는 방법은 다양하게 존재한다. 그 예로 주파수 밴드상에서 에너지 보상을 수행할 수도 있고, 시간축상에서 다채널 오디오 신호에 에너지 보상을 수행할 수도 있고, 언급된 2가지 방법을 적절히 조합하여 보정을 수행할 수도 있다. 또한, 보정이 대상이 되는 신호가 드라이 시그널(dry signal) 및 웨트 시그널(wet signal)의 부분으로 나눠질 경우, 이 중 특정한 신호에만 보정을 수행하거나, 두 신호 모두에 보정을 수행하거나 언급된 2가지 방법을 적절히 조합하여 보정을 수행할 수 있다. 드라이 시그널이란 공간정보(210a)에 포함되는 CLD(Channel Level Difference) 등으로 단순히 상대적 에너지 레벨값을 조정하여 만들어진 신호로 코릴레이션(correlation)이 1인 신호를 말한다. 이에 반해, 웨트 시그널은 디코릴레이션(decorrelation)과정을 거쳐 에너지 레벨은 드라이 시그널과 같으나 코릴레이션 값이 0인 신호를 말한다. 양신호(dry signal과 wet signal)을 적당히 섞어주게 되면 ICC(Inter Channel Correlation/Coherences)값을 만족시키는 신호를 만들 수 있다.
이상에서 본 발명의 바람직한 실시예를 설명하였으나, 본 발명은 다양한 변화와 변경 및 균등물을 사용할 수 있다. 본 발명은 상기 실시예를 적절히 변형하여 동일하게 응용할 수 있음이 명확하다. 따라서 상기 기재 내용은 하기 특허청구범위의 한계에 의해 정해지는 본 발명의 범위를 한정하는 것이 아니다.
이상에서 살펴본 바와 같이, 본 발명에 의한 다채널 오디오 신호의 인코딩 방법 및 장치 그리고 그 인코딩 방법에 의해 인코딩된 신호의 디코딩 방법은 다채널 오디오 코딩 과정에서 스테레오 혹은 모노 사운드로의 다운믹스 과정 및 다채널 신호로의 복원 시, 특정 채널, 특정 주파수 밴드의 신호들에 대해서 에너지 레벨 변화가 일어난 경우, 그 레벨 변화를 보정하여 음질 저하를 개선할 수 있는 효과가 있다.

Claims (18)

  1. (a) 다채널 오디오 입력신호를 다운믹스하여 다운믹스 신호를 생성하고, 공간정보를 추출하는 단계;
    (b) 상기 다채널 오디오 입력신호와 상기 다운믹스 신호의 에너지 레벨을 구하여, 상기 다채널 오디오 입력신호와 상기 다운믹스 신호의 레벨 차이를 계산하는 단계; 및
    (c) 상기 (b)단계에서 계산된 결과를 이용하여 상기 다운믹스 신호를 보정하고, 상기 보정된 다운믹스 신호와 상기 공간정보를 결합하여 부호화된 오디오 신호를 생성하는 단계를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 인코딩 방법.
  2. 제 1 항에 있어서, 상기 (b)단계는
    상기 다채널 오디오 입력신호와 상기 다운믹스 신호를 변환 또는 필터링을 통해 주파수 분석을 수행한 후, 상기 다채널 오디오 입력신호와 상기 다운믹스 신호의 주파수 밴드별 에너지 레벨을 구하여 상기 다채널 오디오 입력신호와 상기 다운믹스 신호의 주파수 밴드별 에너지 레벨 차이를 계산하는 것을 특징으로 하는 다채널 오디오 신호의 인코딩 방법.
  3. 제 2 항에 있어서, 상기 변환은
    FFT, DCT, QMF 중 적어도 하나의 변환인 것을 특징으로 하는 다채널 오디오 신호의 인코딩 방법.
  4. 제 2 항에 있어서, 상기 필터링은
    로패스 필터, 밴드패스 필터, 하이패스 필터 중 적어도 하나의 필터를 사용하여 수행되는 것을 특징으로 다채널 오디오 신호의 인코딩 방법.
  5. 제 2 항에 있어서, 상기 (c)단계는
    상기 변환 또는 필터링을 수행할 때, 발생하는 지연시간을 고려하여 상기 다운믹스 신호를 보정하고, 상기 보정된 다운믹스 신호와 상기 공간정보를 결합하여 부호화된 오디오 신호를 생성하는 것을 특징으로 하는 다채널 오디오 신호의 인코딩 방법.
  6. 제 1 항에 있어서, 상기 (c)단계는
    상기 (b)단계에서 계산된 결과를 이용하여 구해진 에너지 보정정보를 상기 공간정보에 포함시켜, 상기 에너지 보정정보가 포함된 공간정보와 상기 다운믹스 신호를 결합하여 부호화된 오디오 신호를 생성하는 것을 특징으로 하는 다채널 오디오 신호의 인코딩 방법.
  7. 제 1 항에 있어서, 상기 (c)단계는
    상기 (b)단계에서 계산된 결과를 이용하여 상기 공간정보를 수정하고, 상기 수정된 공간정보와 상기 다운믹스 정보를 결합하여 부호화된 오디오 신호를 생성하는 것을 특징으로 하는 다채널 오디오 신호의 인코딩 방법.
  8. (a) 부호화된 오디오 신호를 부호화된 아티스틱 다운믹스 신호와 공간정보로 분리하는 단계; 및
    (b) 상기 아티스틱 다운믹스 신호의 이득을 보정한 후, 상기 이득이 보정된 아티스틱 다운믹스 신호에 에너지 레벨 보정을 수행하고, 상기 에너지 레벨이 보정된 아트스틱 다운믹스 신호와 상기 공간정보를 결합하여 다채널 오디오 신호를 생성하는 단계를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 디코딩 방법.
  9. 제 8 항에 있어서, 상기 (b)단계에서 에너지 레벨 보정은
    상기 부호화된 오디오 신호에 포함된 에너지 보정정보에 따라 수행하는 것을 특징으로 하는 다채널 오디오 신호의 디코딩 방법.
  10. 제 8 항에 있어서, 상기 (b)단계에서 에너지 레벨 보정은
    상기 이득이 보정된 아티스틱 다운믹스 신호와 상기 공간정보를 이용하여 계산된 채널별, 주파수 밴드별 제1에너지 레벨과 상기 이득이 보정된 아티스틱 다운믹스 신호와 상기 공간정보를 결합하여 생성된 다채널 오디오 신호의 채널별, 주파수 밴드별 제2에너지 레벨의 차이를 보정하는 것을 특징으로 하는 다채널 오디오 신호의 디코딩 방법.
  11. 제 8 항에 있어서, 상기 (b)단계에서 에너지 레벨 보정은
    상기 다채널 오디오 신호를 생성할 때 수행되는 변환이나 필터링을 통해 발생되는 지연시간을 고려하여 보정하는 것을 특징으로 하는 다채널 오디오 신호의 디코딩 방법.
  12. (a) 보정된 다운믹스 신호가 포함되어 부호화된 오디오 신호를 부호화된 보정 다운믹스 신호와 공간정보로 분리하는 단계; 및
    (b) 상기 부호화된 보정 다운믹스 신호를 복호화하여 다운믹스 신호를 생성하는 단계를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 디코딩 방법.
  13. 제 10 항에 있어서, 상기 디코딩 방법은
    상기 (b)단계에서 생성된 다운믹스 신호와 상기 공간정보로 다채널 오디오 신호를 생성하는 단계를 더 포함하는 것을 특징으로 하는 다채널 오디오 신호의 디코딩 방법.
  14. 다채널 오디오 입력신호를 다운믹스하여 다운믹스 신호를 생성하고, 공간정보를 추출하는 공간 인코더; 및
    상기 다채널 오디오 신호의 에너지 레벨과 상기 다운믹스 신호의 에너지 레 벨과의 차이를 이용하여 상기 다운믹스 신호를 보정하는 다운믹스 신호 보정부를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 인코딩 장치.
  15. 제 14 항에 있어서, 상기 다운믹스 신호 보정부는
    상기 다채널 오디오 입력신호와 상기 다운믹스 신호를 변환이나 필터링을 통해 주파수 분석을 수행한 후, 상기 다채널 오디오 입력신호와 상기 다운믹스 신호의 주파수 밴드별 에너지 레벨을 구하여 상기 계산된 주파수 밴드별 에너지 레벨 차이를 이용하여 상기 다운믹스 신호를 보정하는 것을 특징으로 하는 다채널 오디오 신호의 인코딩 장치.
  16. 다채널 오디오 입력신호를 다운믹스하여 다운믹스 신호를 생성하고, 공간정보를 추출하는 공간 인코더;
    상기 다채널 오디오 신호의 에너지 레벨과 상기 다운믹스 신호의 에너지 레벨과의 차이를 구하여 보정정보를 생성하는 에너지 분석부; 및
    상기 보정정보에 따라 공간정보를 수정하는 공간정보 수정부를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 인코딩 장치.
  17. 제 16 항에 있어서, 상기 공간정보 수정부는
    상기 보정정보를 상기 공간정보에 포함하는 것을 특징으로 하는 다채널 오디오 신호의 인코딩 장치.
  18. 제 16 항에 있어서, 상기 공간정보 수정부는
    상기 보정정보에 따라 상기 공간정보에 해당하는 값을 수정하는 것을 특징으로 하는 다채널 오디오 신호의 인코딩 장치.
KR1020060055018A 2005-10-04 2006-06-19 다채널 오디오 신호의 인코딩 방법 및 장치 그리고인코딩된 신호의 디코딩 방법 KR20070037977A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US72300005A 2005-10-04 2005-10-04
US60/723,000 2005-10-04

Publications (1)

Publication Number Publication Date
KR20070037977A true KR20070037977A (ko) 2007-04-09

Family

ID=38159533

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060055018A KR20070037977A (ko) 2005-10-04 2006-06-19 다채널 오디오 신호의 인코딩 방법 및 장치 그리고인코딩된 신호의 디코딩 방법

Country Status (1)

Country Link
KR (1) KR20070037977A (ko)

Similar Documents

Publication Publication Date Title
CA2589623C (en) Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering
RU2332727C2 (ru) Устройство и способ обработки многоканального сигнала
JP7033182B2 (ja) 信号をインタリーブするためのオーディオ復号器
US8332229B2 (en) Low complexity MPEG encoding for surround sound recordings
US9293146B2 (en) Intensity stereo coding in advanced audio coding
US20080201152A1 (en) Apparatus for Encoding and Decoding Audio Signal and Method Thereof
US20080212803A1 (en) Apparatus For Encoding and Decoding Audio Signal and Method Thereof
KR20070005477A (ko) 다채널 오디오 코딩에서의 채널 신호의 에너지 레벨보정방법, 그리고 그 보정 기능을 수행하는 인코딩 및디코딩 장치
KR20190134821A (ko) 스테레오 오디오 인코더 및 디코더
TWI521502B (zh) 多聲道音訊的較高頻率和降混低頻率內容的混合編碼
JPWO2006003891A1 (ja) 音声信号復号化装置及び音声信号符号化装置
KR20070003594A (ko) 멀티채널 오디오 신호에서 클리핑된 신호의 복원방법
US11810583B2 (en) Method and device for processing internal channels for low complexity format conversion
CN110648674B (zh) 多声道音频内容的编码
KR20160072130A (ko) 2개 이상의 기본 신호로부터 다채널 신호의 유도
CN112424861A (zh) 多声道音频编码
Lindblom et al. Flexible sum-difference stereo coding based on time-aligned signal components
KR20070037977A (ko) 다채널 오디오 신호의 인코딩 방법 및 장치 그리고인코딩된 신호의 디코딩 방법
US8781134B2 (en) Method and apparatus for encoding and decoding stereo audio
RU2798009C2 (ru) Стереофонический кодер и декодер аудиосигналов
US20150170656A1 (en) Audio encoding device, audio coding method, and audio decoding device
KR20070038020A (ko) 오디오 신호 처리 방법 및 장치와 프로그램을 기록하는컴퓨터로 읽을 수 있는 기록 매체

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination