KR20070005468A - 부호화된 오디오 신호의 생성방법, 그 부호화된 오디오신호를 생성하는 인코딩 장치 그리고 그 부호화된 오디오신호를 복호화하는 디코딩 장치 - Google Patents

부호화된 오디오 신호의 생성방법, 그 부호화된 오디오신호를 생성하는 인코딩 장치 그리고 그 부호화된 오디오신호를 복호화하는 디코딩 장치 Download PDF

Info

Publication number
KR20070005468A
KR20070005468A KR1020060055035A KR20060055035A KR20070005468A KR 20070005468 A KR20070005468 A KR 20070005468A KR 1020060055035 A KR1020060055035 A KR 1020060055035A KR 20060055035 A KR20060055035 A KR 20060055035A KR 20070005468 A KR20070005468 A KR 20070005468A
Authority
KR
South Korea
Prior art keywords
signal
information
audio
audio signal
channel
Prior art date
Application number
KR1020060055035A
Other languages
English (en)
Inventor
방희석
오현오
김동수
임재현
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of KR20070005468A publication Critical patent/KR20070005468A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Abstract

본 발명은 부호화된 오디오 신호의 생성방법을 제공하기 위한 것으로, 다채널 오디오 코딩에서 다채널 오디오 입력신호를 다운믹스하고, 다채널 오디오 입력신호에서 공간정보를 추출하여, 다운믹스 신호와 공간정보로 부호화된 오디오 신호를 생성하는 부호화된 오디오 신호 생성방법에 있어서, 부호화된 오디오 신호는 채널별, 주파수 밴드별 에너지 보정정보를 포함하여 구성하되, 에너지 보정정보는 보정이 적용될 주파수 밴드가 표시되는 색인정보와, 밴드에 적용되는 에너지 보정정도를 나타내는 크기정보를 포함한다.
다채널, 오디오, 에너지, 레벨 , 보정, multi-channel, level, 변화, 게인

Description

부호화된 오디오 신호의 생성방법, 그 부호화된 오디오 신호를 생성하는 인코딩 장치 그리고 그 부호화된 오디오 신호를 복호화하는 디코딩 장치{METHOD FOR GENERATING ENCODED AUDIO SIGNAL, APPARATUS FOR ENCODING MULTI-CHANNEL AUDIO SIGNALS GENERATING THE SIGNAL AND APPARATUS FOR DECODING THE SIGNAL}
도 1 및 도 2는 본 발명의 일실시예에 의한 부호화된 오디오 신호의 생성방법에 의해 생성된 비트 스트림의 구조도이고,
도 3, 도 4 및 도 5는 본 발명의 일실시예에 의한 부호화된 오디오 신호를 생성하는 인코딩 장치의 블록 구성도이고,
도 6, 도 7은 본 발명의 일실시예에 의한 부호화된 오디오 신호를 복호화하는 디코딩 장치의 블록 구성도이다.
* 도면의 주요 부분에 대한 부호의 설명 *
10: 신호 분리부 20: 오디오 디코더
30, 30a: 다채널 오디오 생성부 31a: 에너지 보상 어댑터
40: 에너지 레벨 보상부 50: 다운믹스부
50b: 다채널 오디오 인코딩부 60: 공간정보 추출부
60b: 디코딩부 70, 70a: 오디오 인코더
71a: 에너지 레벨 보정부 80: 에너지 보정정보 생성부
90: 비트 스트림 포맷터 100: 오디오 비트 스트림
110: 다운믹스 비트 스트림 120: 다운믹스 오디오 신호
130: 에너지 보정정보 140: 공간정보
150: 다운믹스 신호정보 160: 다채널 오디오 신호
160a: 다채널 오디오 신호정보 170a: 어댑테이션 정보
170, 180a: 보정이 가해진 다채널 오디오 신호
본 발명은 다채널 오디오 코딩에 관한 것으로, 특히 에너지 보정정보를 포함하는 부호화된 오디오 신호의 생성방법, 그 부호화된 오디오 신호를 생성하는 인코딩 장치 그리고 그 부호화된 오디오 신호를 이용하여 복호화하는 디코딩 장치에 관한 것이다.
최근에 디지털 오디오 신호에 대한 다양한 코딩기술 및 방법들이 개발되고 있으며, 이와 관련된 제품들이 생산되고 있다. 또한 멀티채널 오디오 신호의 공간 정보를 이용하여 모노 또는 스테레오 오디오 신호를 디코딩 단계에서 멀티채널로 바꾸는 코딩방법들이 개발되고 있으며, 이에 대한 제품이 실용화되고 있다.
그러나 상기와 같은 제품들을 이용한 멀티 채널 오디오 신호 처리 기법은 신호 처리과정에서 데이터량을 줄일 수 있다는 장점은 있지만 특정 채널별, 주파수 밴드별 에너지 레벨 변화가 발생하여 신호의 왜곡이 발생한다는 문제점이 있었다.
이에 본 발명은 상기와 같은 종래의 제반 문제점을 해결하기 위해 제안된 것으로, 본 발명의 목적은 다채널 오디오 신호의 특성에 따라서 특정 채널, 특정 주파수 밴드에서 원래 신호와 출력 신호와의 차이를 계산 또는 예측하고 그 차이에 관한 정보를 부호화하여 오디오 신호를 생성하는 방법을 제공하는데 있다.
또한, 본 발명의 또다른 목적은 상기 오디오 신호를 생성하는 인코딩 장치를 제공하는데 있다.
또한, 본 발명의 또다른 목적은 상기 오디오 신호를 이용하여 다채널 오디오 신호를 복호화하는 디코딩 장치를 제공하는데 있다.
본 발명에 따른 부호화된 오디오 신호 생성방법은 다채널 오디오 코딩에서 다채널 오디오 입력신호를 다운믹스하고, 상기 다채널 오디오 입력신호에서 공간정보를 추출하여, 상기 다운믹스 신호와 공간정보로 부호화된 오디오 신호를 생성하는 부호화된 오디오 신호 생성방법에 있어서, 상기 부호화된 오디오 신호는 채널별, 주파수 밴드별 에너지 보정정보를 포함하여 구성하되, 상기 에너지 보정정보는 보정이 적용될 주파수 밴드가 표시되는 색인정보와, 상기 밴드에 적용되는 에너지 보정정도를 나타내는 크기정보를 포함한다.
또한, 본 발명에 따른 다채널 오디오 신호의 인코딩 장치는 다채널 오디오 입력신호를 부호화하는 인코딩 장치에 있어서, 상기 다채널 오디오 입력신호를 다운믹스하여 다운믹스 신호를 생성하는 다운믹스부와; 상기 다채널 오디오 입력신호 에서 공간정보를 추출하는 공간정보 추출부와; 상기 다운믹스 오디오 신호를 부호화하는 오디오 인코더와; 및 상기 다채널 오디오 입력신호로부터 추출한 다채널 신호정보와, 상기 오디오 인코더로부터 추출된 다운믹스 신호 부호화에 관계되는 신호정보와, 상기 공간정보 추출부로부터 추출된 공간정보를 이용하여 채널별 및 주파수 밴드별 에너지 보정정보를 생성하는 에너지 보정정보 생성부를 포함한다.
또한, 본 발명에 따른 다채널 오디오 신호의 인코딩 장치는 다채널 오디오 입력신호를 부호화하는 인코딩 장치에 있어서, 상기 다채널 오디오 입력신호를 다운믹스하여 다운믹스 신호를 생성하는 다운믹스부와; 상기 다채널 오디오 입력신호에서 공간정보를 추출하는 공간정보 추출부와; 및 상기 다채널 오디오 입력신호로부터 추출된 다채널 신호정보와, 상기 공간정보 추출부로부터 추출된 공간정보를 이용하여 계산된 채널별, 주파수 밴드별 에너지 보정값에 따라 상기 다운믹스부로부터 출력되는 상기 다운믹스 오디오 신호를 보정하고 부호화하는 오디오 인코더를 포함할 수도 있다.
또한, 본 발명에 따른 다채널 오디오 신호의 인코딩 장치는 다채널 오디오 입력신호를 부호화하는 인코딩 장치에 있어서, 상기 다채널 오디오 입력신호로부터 다운믹스 신호와 공간정보를 생성하고, 다채널 아웃풋 신호정보와 상기 다채널 오디오 입력신호의 차이에 해당하는 정보를 채널별 및 주파수 밴드별 에너지 보정정보로서 생성하여 상기 에너지 보정정보가 포함되게 부호화된 오디오 신호를 생성하는 다채널 오디오 인코딩부와; 및 상기 다채널 오디오 인코딩부에서 부호화된 다채널 신호정보를 추출하여 복호화하여 다채널 아웃풋 신호정보를 생성하는 디코딩부 를 포함할 수도 있다.
한편, 본 발명에 따른 다채널 오디오 신호의 디코딩 장치는 부호화된 오디오 신호를 복호화하는 다채널 오디오 신호의 디코딩 장치에 있어서, 에너지 보정정보를 포함하는 부호화된 오디오 신호로부터 부호화된 다운믹스 신호와 공간정보와 채널별 및 주파수 밴드별 에너지 보정정보를 분리하는 신호 분리부와; 상기 부호화된 다운믹스 신호를 복호화하여 다운믹스 오디오 신호를 생성하는 오디오 디코더와; 상기 공간정보와 상기 다운믹스 오디오 신호로부터 다채널 오디오 신호를 생성하는 다채널 오디오 생성부와; 및 상기 다채널 오디오 신호를 상기 에너지 보정정보에 따라 보정하여 보정된 다채널 오디오 신호를 생성하는 에너지 레벨 보상부를 포함한다.
또한, 본 발명에 따른 다채널 오디오 신호의 디코딩 장치는 부호화된 오디오 신호를 복호화하는 다채널 오디오 신호의 디코딩 장치에 있어서, 에너지 보정정보를 포함하는 부호화된 오디오 신호로부터 부호화된 다운믹스 신호와 공간정보와 채널별 및 주파수 밴드별 에너지 보정정보를 분리하는 신호 분리부와; 상기 부호화된 다운믹스 신호를 복호화하여 다운믹스 오디오 신호를 생성하는 오디오 디코더와; 및 상기 공간정보와 상기 다운믹스 오디오 신호로 다채널 오디오 신호를 생성하는 다채널 오디오 생성부를 포함하여 구성된다.
그리고 상기 다채널 오디오 생성부는 상기 다채널 오디오 신호생성과 관계되는 정보, 상기 공간정보, 상기 에너지 보정정보 중 적어도 하나를 이용하여 상기 공간정보의 파라미터 값을 조정하여 어댑테이션 정보를 산출하는 에너지 보상 어댑 터를 구비한다.
또한, 상기 다채널 생성부는 오디오 상기 어댑테이션 정보에 따라 상기 다채널 오디오 신호를 보정하여 보정된 다채널 오디오 신호를 생성한다.
이하, 상기와 같은 본 발명, 부호화된 오디오 신호의 생성방법, 그 부호화된 오디오 신호를 생성하는 인코딩 장치 그리고 그 부호화된 오디오 신호를 이용하여 복호화하는 디코딩 장치의 기술적 사상에 따른 일실시예를 도면을 참조하여 설명하면 다음과 같다.
도 1 및 도 2는 본 발명의 일실시예에 의한 부호화된 오디오 신호의 생성방법에 의해 생성된 비트 스트림의 구조도이다.
이에 도시된 바와 같이, 오디오 비트 스트림 내에 구성되는 에너지 보정정보는 색인정보(I1, I2...)와 크기정보(CL1, CL2...)로 구성될 수도 있고, 크기정보(CL′1, CL′2....)만으로 구성될 수도 있다. 에너지 보정정보가 색인정보(I1, I2...)와 크기정보(CL1, CL2...)로 구성된 형태가 도 1에 도시되어 있고, 크기정보(CL′1, CL′2....)만으로 구성된 형태가 도 2에 도시되어 있다. 크기정보(CL′1, CL′2....)만 구성된 경우는 미리 정해지 약속에 따라 특정 범위의 주파수 밴드를 보정할 수도 있고, 모든 주파수 밴드를 보정할 수도 있다.
색인정보(I1, I2...)는 보정이 적용될 주파수 밴드를 표현하는 정보로서, 그 값은 시간에 따라 고정될 수도 있고, 변할 수도 있다. 왜냐하면, 시간에 따라 보정이 되어야할 주파수 밴드가 변할 수도 있고, 고정될 수도 있기 때문이다. 그리고 보정 적용될 밴드의 수를 N이라고 표현한다면 이 N역시 시간에 따라 고정되거나 변 할 수 있다. 특히 N은 공간정보(spatial cue)와 관련된 파라미터 밴드를 적절히 조합하여 구성할 수 있다.
예를 들어, 파라미터 밴드 수가 20일 경우 전체 주파수를 20개로 나누게 되는데, 에너지 보정을 특정 주파수 범위에서 수행하고자 할 경우 "몇 번째 밴드에서 몇 번째 밴드까지"라는 식으로 보정이 적용될 밴드를 표현할 수 있다.
한편, 공간정보에는 CLD(Channel Level Difference), ICC(Inter Channel Correlation/Coherencds), CPC(Channel Prediction Coefficients) 등이 있는데, CLD, ICC, CPC 등의 부가정보가 전송되는 주파수 밴드를 파라미터 밴드라 일컫는다.
또한, 에너지 보정이 적용될 주파수 밴드는 저주파 대역, 중간 주파수 대역, 고주파 대역 등의 일반적으로 사용되는 대역들로 나누어 구성할 수도 있다.
크기정보(CL1, CL2... 또는 CL′1, CL′2...)는 시간에 따라 고정될 수도, 변할 수도 있다. 크기정보(CL1, CL2... 또는 CL′1, CL′2...)의 수를 M이라고 한다면 M은 N과 같을 수도 있고, 다를 수도 있다.
예를 들어, 밴드 하나하나마다 크기정보(CL1, CL2...)에 해당하는 값을 다 보내준다면 M과 N이 같은 경우가 되고, 밴드를 복수개 단위로 묶어서 같은 크기정보(CL1, CL2...)의 값을 전송한다면 M과 N이 다른 경우에 해당된다.
크기정보(CL1, CL2... 또는 CL′1, CL′2...)는 밴드별 보정값들의 평균으로 표현할 수도 있고, 크기 차이를 표현할 수 있는 직선의 기울기 값으로 표현할 수도 있고, 기타 다차 함수 또는 특정 함수의 특성을 나타내는 값으로 표현할 수도 있 다.
크기정보(CL1, CL2... 또는 CL′1, CL′2...)를 직선의 기울기로 나타낼 수 있는 이유는 에너지 레벨이 주파수에 비례하여 다소 선형성을 가지고 증가하는 경향을 보이기 때문이다. 시작점과 끝점 또는 시작점만을 주파수 밴드 또는 특정 주파수로 설정하고 그 지점부터 특정한 기울기를 갖는 직선을 설정하면 고주파로 갈수록 더 많은 에너지 레벨을 변화시킬 수 있게 된다. 따라서 인코더(도면상 미도시)에서 에너지 레벨 보상정도를 분석하고, 직선의 기울기는 미리 설정해 놓은 값(예를 들어 1dB 또는 0.5dB)에서 가까운 값을 고르는 것이 크기정보(CL1, CL2... 또는 CL′1, CL′2...)를 직선의 기울기를 나타내는 방법의 일례가 될 수 있다.
또한, 보다 정확한 에너지 레벨 보정을 위해 크기정보(CL1, CL2... 또는 CL′1, CL′2...)에 다차 함수 또는 특정 함수의 특성을 나타내는 값이 표현될 수 있는 것이다.
또한, 오디오 비트 스트림 내에 포함되는 에너지 보정정보는 색인정보(I1, I2...)와 크기정보(CL1, CL2...)를 각각 독립적으로 존재하도록 구성하거나, 두 정보(I1, I2...와 CL1, CL2...)를 묶어서 하나의 값으로 표현하여 구성할 수도 있다. 또한, 두 정보(I1, I2...와 CL1, CL2...)를 부가적인 다른 정보들과 결합하여 하나의 값으로 표현하여 구성할 수도 있다.
도 3은 본 발명의 일실시예에 의한 부호화된 오디오 신호를 생성하는 인코딩 장치의 블록 구성도로서, 도시된 인코딩 장치는 다운믹스부(50)와 공간정보 추출부(60)와, 오디오 인코더(70)와, 에너지 보정정보 생성부(80)와, 비트 스트림 포맷 터(90)로 구성된다.
이에 도시된 바와 같이, 다채널 오디오 입력신호(200)는 다운믹스부(50)와 공간정보 추출부(60)로 인가되고, 다운믹스부(50)에서는 다채널 오디오 입력신호(200)를 다운믹스하여 다운믹스 신호(210)를 생성하고, 공간정보 추출부(60)에서는 다채널 오디오 입력신호(200)가 다운믹스되는 과정에서 발생하는 공간정보(230)를 추출해낸다. 다운믹스 신호(210)의 예로 모노 신호나 스테레오 신호 등이 있다.
오디오 인코더(70)는 다운믹스 신호(210)를 부호화하여 비트 스트림 형태의 다운믹스 비트 스트림(220)을 생성한다.
한편, 에너지 보정정보 생성부(80)에서는 오디오 인코더(70)에서 추출된 다운믹스 신호정보(240)와 다채널 오디오 입력신호(200)와 공간정보(230)를 분석하여 채널별, 주파수 밴드별 에너지 보정정보(250)를 생성하여 출력한다.
다운믹스 신호정보(240)라 함은 오디오 디코더(70)에서 복호할 때, 발생하는 정보를 말한다. 예를 들어, QMF(Quadrature Mirror Filter), MDCT(Modified Discrete Cosine Transform), PCM(Pulse Code Modulation) 등의 변환과정에서 발생하는 정보라고 할 수 있다.
에너지 보정정보(250)를 생성하는 방법은 다양하게 존재하지만 그 일례로 다음과 같은 방법이 존재할 수 있다.
오리지널 다채널 오디오 입력신호(200)를 아이디얼(ideal)하게 다운믹스한 신호와 MPEG Surround 인코더에서 만들어진 다운믹스 신호를 비교하고, 주파수 밴드별로 얼마만큼의 에너지 레벨 차이가 나는지를 계산하여 미리 정해진 에너지 레 벨 보정단계가 있을 때 가장 가까운 값으로 할당하는 것이다.
한편, 비트 스트림 포맷터(90)에서는 에너지 보정정보(250)와 다운믹스 비트 스트림(220)과 공간정보(230)로 오디오 비트 스트림(260)을 생성하는데, 오디오 비트 스트림(260)에는 에너지 보정정보(250)가 포함되어 있다.
도 4는 본 발명의 일실시예에 의한 부호화된 오디오 신호를 생성하는 인코딩 장치의 블록 구성도로서, 도시된 인코딩 장치는 다운믹스부(50)와, 공간정보 추출부(60)와, 오디오 인코더(70a)와, 비트 스트림 포맷터(90)로 구성된다.
이에 도시된 바와 같이, 다채널 오디오 입력신호(200) 다운믹스부(50)와 공간정보 추출부(60)로 인가되고, 다운믹스부(50)에서는 다채널 오디오 입력신호(200)를 다운믹스하여 다운믹스 신호(210)를 생성하고, 공간정보 추출부(60)에서는 다채널 오디오 입력신호(200)가 다운믹스되는 과정에서 발생하는 공간정보(230)를 추출해낸다.
다운믹스 신호(210)는 오디오 인코더(70a)로 인가되는데, 오디오 인코더(70a)는 그 내부에 에너지 레벨 보정부(71a)를 구비하여, 다운믹스 신호(210)를 채널별, 주파수 밴드별로 보정하여 보정된 다운믹스 비트 스트림(220a)을 생성한다. 그 보정은 계산되거나 예측된 채널별, 주파수 밴드별 에너지 보정정보에 따라 수행한다.
그리고 비트 스트림 포맷터(90)에서는 다운믹스 비트 스트림(220a)과 공간정보(230)로 오디오 비트 스트림(260a)을 생성한다. 오디오 비트 스트림(260a)은 에너지 보정정보가 포함되어 있지는 않지만 보정이 가해진 다운믹스 신호가 포함되어 있다.
도 5는 본 발명의 일실시예에 의한 부호화된 오디오 신호를 생성하는 인코딩 장치의 블록 구성도로서, 도시된 인코딩 장치는 다채널 오디오 인코딩부(50b)와, 디코딩부(60b)로 구성된다.
이에 도시된 바와 같이, 도시된 인코딩 장치는 다채널 오디오 인코딩부(50b)와 디코딩부(60b)로 구성되어 다채널 오디오 입력신호(200)의 부호화 및 복호화를 모두 수행한다. 다채널 오디오 인코딩부(50b)는 다채널 오디오 입력신호(200)를 인가받아 다운믹스 신호(도면상 미도시)를 생성하고, 공간정보(도면상 미도시)를 추출하여 다운믹스 신호와 공간정보로 오디오 비트 스트림(260b)을 생성하는데, 오디오 비트 스트림(260b)에는 후술할 에너지 보정정보가 포함되어 있다.
한편, 디코딩부(60b)는 다채널 오디오 인코딩부(50b)에서 부호화된 다채널 신호정보(210b)를 추출하여 복호화한다. 그리고 복호화의 결과로서 다채널 아웃풋 신호정보(220b)를 생성하여 다시 다채널 오디오 인코딩부(50b)로 전송하게 된다. 그러면 다채널 오디오 인코딩부(50b)에서는 다채널 오디오 입력신호(200)와 다채널 아웃풋 신호정보(220b)를 비교하여 그 차이에 해당하는 부분을 에너지 보정정보로 이용하게 된다.
또한, 다채널 오디오 인코딩부(50b)는 디코딩부(60b)에서 수행되는 OMF(Quadrature Mirror Filter) 단계, 하이브리드 필터 단계, 프리 매트릭스 단계, 디코릴레이션(De-correlation) 단계, 믹스 매트릭스(Mix-Matrix) 단계, TP(Temporal Processing) 단계, TES(Temporal Envelope Shaping) 단계 중 적어도 어느 한 단계에서 수행되는 결과를 이용하여 에너지 보정정보를 산출하고, 산출된 에너지 보정정보를 오디오 비트 스트림(260b)에 포함시켜 오디오 비트 스트림(260b)을 생성할 수도 있다.
또한, 다채널 오디오 인코딩부(50b)는 에너지 보정정보를 이용하여 공간정보에 수정을 가하고, 수정이 가해진 공간정보와 다운믹스 신호로 오디오 비트 스트림(260b)을 생성할 수도 있다.
도 6은 본 발명의 일실시예에 의한 부호화된 오디오 신호를 복호화하는 디코딩 장치의 블록 구성도로서, 도시된 디코딩 장치는 신호 분리부(10)와, 오디오 디코더(20)와, 다채널 오디오 생성부(30)와, 에너지 레벨 보상부(40)로 구성된다.
이에 도시된 바와 같이, 인코딩 과정에서 부호화된 오디오 비트 스트림(100)이 신호 분리부(10)에 인가되면, 신호 분리부(10)에서는 비트 스트림 형태인 다운믹스 비트 스트림(110)과 공간정보(140)를 추출해 낸다. 오디오 비트 스트림(100)은 인코딩 과정에서 채널별, 주파수 밴드별 에너지 보정정보 포함하여 생성하기에 신호 분리부(10)에서는 에너지 보정정보(130)도 함께 추출된다. 다운믹스 비트 스트림(110)의 일례로 모노 비트 스트림 또는 스테레오 비트 스트림 등이 있다.
그리고 오디오 인코더(20)에서는 다운믹스 비트 스트림(110)을 복호화하여 다운믹스 오디오 신호(120)를 생성한다.
그리고 다채널 오디오 생성부(30)는 신호 분리부(10)에서 추출된 공간정보(140)와 다운믹스 오디오 신호(120)로 다채널 오디오 신호(160)를 생성한다. 다채널 오디오 신호(160)는 에너지 레벨 보상부(40)로 인가된다. 그러면 에너지 레벨 보상부(40)에서는 신호 분리부(10)에서 추출된 에너지 보정정보(130), 오디오 디코더(20)에서 추출된 다운믹스 신호정보(150), 공간정보(140)를 모두 이용하거나 그 중 일부를 이용하여 다채널 오디오 신호(160)를 보정하고 보정된 다채널 오디오 신호(170)를 생성한다.
한편, 에너지 레벨 보상부(40)에서는 에너지 보정정보(130)만을 가지고 보정을 수행할 수 있으나, 에너지 보정정보(130)를 그대로 적용하기 힘든 경우도 있기에 세 정보(130, 140, 150)를 모두 이용하거나 일부를 이용한다는 것을 언급한 것이다.
예를 들어, 인코딩 및/또는 디코딩 과정에서의 신호 왜곡 때문에 특정 부분이 출력되는 소리에서 미치는 영향이 미미하다고 판단될 때에는 전송된 에너지 보정정보(130)를 그대로 이용하는 것 보다는 에너지 보정정보(130) 외에 다른 정보(140, 150)를 이용하는 것이 효과적인 경우가 있기 때문이다.
도 7은 본 발명의 일실시예에 의한 부호화된 오디오 신호를 복호화하는 디코딩 장치의 블록 구성도로서, 신호 분리부(10)와, 오디오 디코더(20)와, 다채널 오디오 생성부(30a)로 구성된다. 그리고 다채널 오디오 생성부(30a)는 에너지 보상 어댑터(31a)를 구비하여 후술할 공간정보의 파라미터 값을 조정하여 어댑테이션 정보(170a)를 생성한다.
이에 도시된 바와 같이, 인코딩 과정에서 부호화된 오디오 비트 스트림(100)이 신호 분리부(10)에 인가되면, 신호 분리부(10)에서는 다운믹스 비트 스트림(110)과 공간정보(140)를 분리하여 추출해 낸다. 오디오 비트 스트림(100)은 인 코딩 과정에서 채널별, 주파수 밴드별 에너지 보정정보 포함하여 생성하기에 신호 분리부(10)에서는 에너지 보정정보(130)도 함께 추출된다. 다운믹스 비트 스트림(110)의 일례로 모노 비트 스트림 또는 스테레오 비트 스트림 등이 있다.
그리고 오디오 인코더(20)에서는 다운믹스 비트 스트림(110)을 복호화하여 다운믹스 오디오 신호(120)를 생성한다.
그리고 다채널 오디오 생성부(30a)는 신호 분리부(10)에서 추출된 공간정보(140)와 다운믹스 오디오 신호(120)로 다채널 오디오 신호(180a)를 생성하는데, 생성된 다채널 오디오 신호(180a) 다채널 오디오 생성부(30a) 내에 구비된 에너지 보상 어댑터(31a)로부터 생성된 어댑테이션 정보(170a)에 따라 보정을 한 것이다. 어댑테이션 정보(170a)는 공간정보의 파라미터 값을 조정하여 산출한다.
구체적으로 공간정보(140)의 파라미터 값은 다채널 오디오 신호(180a)를 생성하는 단계에서 발생하는 다채널 오디오 신호정보(160a), 공간정보(140), 다운믹스 신호정보(150), 에너지 보정정보(130) 중 적어도 하나가 이용되어 조정된다. 상술한 방법에 따라 공간정보(140)의 파라미터 값을 조정하여 산출한 어댑테이션 정보(170a)에 따라 다채널 오디오 신호(180a)를 생성하는 단계마다 또는 어느 특정 단계에서 보정을 수행하여 다채널 오디오 신호(180a)를 생성하는 것이다.
한편, 도면에 도시하지는 않았지만 다채널 오디오 신호(180a)에 보정을 가하여 출력을 할 수 있도록 다채널 오디오 신호(180a)가 출력되는 단부에 에너지 레벨 보상부를 독립적으로 구성하여 디코딩 장치를 구성할 수도 있다.
이상에서 본 발명의 바람직한 실시예를 설명하였으나, 본 발명은 다양한 변 화와 변경 및 균등물을 사용할 수 있다. 본 발명은 상기 실시예를 적절히 변형하여 동일하게 응용할 수 있음이 명확하다. 따라서 상기 기재 내용은 하기 특허청구범위의 한계에 의해 정해지는 본 발명의 범위를 한정하는 것이 아니다.
이상에서 살펴본 바와 같이, 본 발명에 의한 다채널 오디오 코딩에서 채널별, 주파수 밴드별 에너지 보정정보가 포함된 비트 스트림 생성방법, 그 비트 스트림을 이용하여 다채널 오디오 신호를 복호화하는 디코딩 장치, 그리고 에너지 보정정보를 이용하여 부호화하는 인코딩 장치는 다채널 오디오 코딩 과정에서 스테레오 혹은 모노 사운드로의 다운믹스 과정 및 다채널 신호로의 복원 시, 특정 채널, 특정 주파수 밴드의 신호들에 대해서 에너지 레벨 변화가 일어난 경우, 그 레벨 변화를 보정하여 음질 저하를 개선할 수 있는 효과가 있다.

Claims (16)

  1. 다채널 오디오 코딩에서 다채널 오디오 입력신호를 다운믹스하고, 상기 다채널 오디오 입력신호에서 공간정보를 추출하여, 상기 다운믹스 신호와 공간정보를 결합하여 부호화된 오디오 신호 생성방법에 있어서, 상기 부호화된 오디오 신호는
    채널별, 주파수 밴드별 에너지 보정정보를 포함하여 구성하되, 상기 에너지 보정정보는 보정이 적용될 주파수 밴드가 표시되는 색인정보와, 상기 주파수 밴드에 적용되는 에너지 보정정도를 나타내는 크기정보를 포함하는 것을 특징으로 하는 부호화된 오디오 신호 생성방법.
  2. 제 1 항에 있어서, 상기 에너지 보정정보는
    에너지 보정정도를 나타내는 크기정보만으로 이루어지는 것을 특징으로 하는 부호화된 오디오 신호 생성방법.
  3. 제 1 항에 있어서, 상기 보정이 적용될 주파수 밴드는
    공간정보와 관련된 파라미터 밴드를 조합하는 것을 특징으로 하는 부호화된 오디오 신호 생성방법.
  4. 제 1 항 또는 제 2 항에 있어서, 상기 크기정보는
    밴드별 에너지 보정값들의 평균을 갖는 것을 특징으로 하는 부호화된 오디오 신호 생성방법.
  5. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서, 상기 크기정보는
    밴드별 에너지 크기 차이를 나타내는 직선의 기울기를 갖는 것을 특징으로 하는 부호화된 오디오 신호 생성방법.
  6. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서, 상기 크기정보는
    다차함수 또는 특정함수의 특성을 표현하는 값을 갖는 것을 특징으로 하는 부호화된 오디오 신호 생성방법.
  7. 제 1 항 또는 제 3 항에 있어서, 상기 부호화된 오디오 신호는
    상기 색인정보와 상기 크기정보를 독립적으로 갖는 것을 특징으로 하는 부호화된 오디오 신호 생성방법.
  8. 제 1 항 또는 제 3 항에 있어서, 부호화된 오디오 신호는
    상기 색인정보와 상기 크기정보를 하나의 값으로 표현하거나 또는 부가적인 다른 정보와 상기 두 정보를 합하여 하나의 값으로 표현하는 것을 특징으로 하는 부호화된 오디오 신호 생성방법.
  9. 다채널 오디오 입력신호를 부호화하는 인코딩 장치에 있어서,
    상기 다채널 오디오 입력신호를 다운믹스하여 다운믹스 신호를 생성하는 다운믹스부와;
    상기 다채널 오디오 입력신호에서 공간정보를 추출하는 공간정보 추출부와;
    상기 다운믹스 오디오 신호를 부호화하는 오디오 인코더와; 및
    상기 다채널 오디오 입력신호로부터 추출한 다채널 신호정보와, 상기 오디오 인코더로부터 추출된 다운믹스 신호 부호화에 관계되는 신호정보와, 상기 공간정보 추출부로부터 추출된 공간정보를 이용하여 채널별 및 주파수 밴드별 에너지 보정정보를 생성하는 에너지 보정정보 생성부를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 인코딩 장치.
  10. 다채널 오디오 입력신호를 부호화하는 인코딩 장치에 있어서,
    상기 다채널 오디오 입력신호를 다운믹스하여 다운믹스 신호를 생성하는 다운믹스부와;
    상기 다채널 오디오 입력신호에서 공간정보를 추출하는 공간정보 추출부와; 및
    상기 다채널 오디오 입력신호로부터 추출된 다채널 신호정보와, 상기 공간정보 추출부로부터 추출된 공간정보를 이용하여 계산된 채널별, 주파수 밴드별 에너지 보정값에 따라 상기 다운믹스부로부터 출력되는 상기 다운믹스 오디오 신호를 보정하고 부호화하는 오디오 인코더를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 인코딩 장치.
  11. 다채널 오디오 입력신호를 부호화하는 인코딩 장치에 있어서,
    상기 다채널 오디오 입력신호로부터 다운믹스 신호와 공간정보를 생성하고, 다채널 아웃풋 신호정보와 상기 다채널 오디오 입력신호의 차이에 해당하는 정보를 채널별 및 주파수 밴드별 에너지 보정정보로서 생성하여 상기 에너지 보정정보가 포함되게 부호화된 오디오 신호를 생성하는 다채널 오디오 인코딩부와; 및
    상기 다채널 오디오 인코딩부에서 부호화된 다채널 신호정보를 추출하고 복호화하여 상기 다채널 아웃풋 신호정보를 생성하는 디코딩부를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 인코딩 장치.
  12. 제 11 항에 있어서, 상기 다채널 오디오 인코딩부는
    상기 에너지 보정정보를 이용하여 상기 공간정보를 수정하고, 상기 수정된 공간정보와 상기 다운믹스 신호로 부호화된 오디오 신호를 생성하는 것을 특징으로 하는 다채널 오디오 신호의 인코딩 장치.
  13. 부호화된 오디오 신호를 복호화하는 다채널 오디오 신호의 디코딩 장치에 있어서,
    에너지 보정정보를 포함하는 부호화된 오디오 신호로부터 부호화된 다운믹스 신호와 공간정보와 채널별 및 주파수 밴드별 에너지 보정정보를 분리하는 신호 분리부와;
    상기 부호화된 다운믹스 신호를 복호화하여 다운믹스 오디오 신호를 생성하는 오디오 디코더와;
    상기 공간정보와 상기 다운믹스 오디오 신호로부터 다채널 오디오 신호를 생성하는 다채널 오디오 생성부와; 및
    상기 다채널 오디오 신호를 상기 에너지 보정정보에 따라 보정하는 에너지 레벨 보상부를 포함하는 것을 특징으로 하는 다채널 오디오 신호의 디코딩 장치.
  14. 제 13 항에 있어서, 상기 에너지 레벨 보상부는
    상기 신호 분리부에서 분리된 상기 공간정보와 상기 다운믹스 신호 복호화에 관계되는 신호정보 중 적어도 하나를 상기 에너지 보정정보와 종합하여 상기 다채널 오디오 생성부에서 생성된 다채널 오디오 신호를 보정하는 것을 특징으로 하는 다채널 오디오 신호의 디코딩 장치.
  15. 제 13항 또는 제 14 항에 있어서, 상기 에너지 레벨 보상부는
    상기 다채널 오디오 생성부에서 생성된 상기 다채널 오디오 신호에 소정의 게인값을 곱하여 보정하는 것을 특징으로 하는 다채널 오디오 신호의 디코딩 장치.
  16. 부호화된 오디오 신호를 복호화하는 다채널 오디오 신호의 디코딩 장치에 있어서,
    에너지 보정정보를 포함하는 부호화된 오디오 신호로부터 부호화된 다운믹스 신호와 공간정보와 채널별 및 주파수 밴드별 에너지 보정정보를 분리하는 신호 분리부와;
    상기 부호화된 다운믹스 신호를 복호화하여 다운믹스 오디오 신호를 생성하는 오디오 디코더와; 및
    상기 공간정보와 상기 다운믹스 오디오 신호로 다채널 오디오 신호를 생성하는 다채널 오디오 생성부를 포함하되, 상기 다채널 오디오 생성부는
    상기 다채널 오디오 신호생성과 관계되는 정보, 상기 공간정보, 상기 에너지 보정정보 중 적어도 하나를 이용하여 상기 공간정보의 파라미터 값을 조정하여 어댑테이션 정보를 산출하는 에너지 보상 어댑터를 구비하고, 상기 어댑테이션 정보에 따라 상기 다채널 오디오 신호를 보정하여 보정된 다채널 오디오 신호를 생성하는 것을 특징으로 하는 다채널 오디오 신호의 디코딩 장치.
KR1020060055035A 2005-07-05 2006-06-19 부호화된 오디오 신호의 생성방법, 그 부호화된 오디오신호를 생성하는 인코딩 장치 그리고 그 부호화된 오디오신호를 복호화하는 디코딩 장치 KR20070005468A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US69585805P 2005-07-05 2005-07-05
US60/695,858 2005-07-05

Publications (1)

Publication Number Publication Date
KR20070005468A true KR20070005468A (ko) 2007-01-10

Family

ID=37871111

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020060055035A KR20070005468A (ko) 2005-07-05 2006-06-19 부호화된 오디오 신호의 생성방법, 그 부호화된 오디오신호를 생성하는 인코딩 장치 그리고 그 부호화된 오디오신호를 복호화하는 디코딩 장치
KR1020060055040A KR20070005469A (ko) 2005-07-05 2006-06-19 다채널 오디오 신호의 디코딩 장치 및 디코딩 방법
KR1020060058120A KR20070005477A (ko) 2005-06-30 2006-06-27 다채널 오디오 코딩에서의 채널 신호의 에너지 레벨보정방법, 그리고 그 보정 기능을 수행하는 인코딩 및디코딩 장치

Family Applications After (2)

Application Number Title Priority Date Filing Date
KR1020060055040A KR20070005469A (ko) 2005-07-05 2006-06-19 다채널 오디오 신호의 디코딩 장치 및 디코딩 방법
KR1020060058120A KR20070005477A (ko) 2005-06-30 2006-06-27 다채널 오디오 코딩에서의 채널 신호의 에너지 레벨보정방법, 그리고 그 보정 기능을 수행하는 인코딩 및디코딩 장치

Country Status (1)

Country Link
KR (3) KR20070005468A (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008133400A1 (en) * 2007-04-30 2008-11-06 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding high frequency band
KR101024924B1 (ko) * 2008-01-23 2011-03-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
US8615088B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal using preset matrix for controlling gain or panning
US8615316B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal
KR101506837B1 (ko) * 2008-03-31 2015-03-31 한국전자통신연구원 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
WO2021177659A1 (ko) * 2020-03-03 2021-09-10 삼성전자 주식회사 음질 개선 방법 및 그 장치

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100803212B1 (ko) 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
KR101218776B1 (ko) 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
KR100773560B1 (ko) 2006-03-06 2007-11-05 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
KR100763920B1 (ko) 2006-08-09 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치
DE102008004020A1 (de) 2007-01-18 2008-07-24 Samsung Electronics Co., Ltd., Suwon Zugriffsvorrichtung mit vertikalem Kanal, entsprechende Halbleitervorrichtung und Herstellungsverfahren für die Zugriffsvorrichtung

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008133400A1 (en) * 2007-04-30 2008-11-06 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding high frequency band
US8560304B2 (en) 2007-04-30 2013-10-15 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding high frequency band
USRE47824E1 (en) 2007-04-30 2020-01-21 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding high frequency band
KR101024924B1 (ko) * 2008-01-23 2011-03-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
US8615088B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal using preset matrix for controlling gain or panning
US8615316B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US9319014B2 (en) 2008-01-23 2016-04-19 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US9787266B2 (en) 2008-01-23 2017-10-10 Lg Electronics Inc. Method and an apparatus for processing an audio signal
KR101506837B1 (ko) * 2008-03-31 2015-03-31 한국전자통신연구원 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
WO2021177659A1 (ko) * 2020-03-03 2021-09-10 삼성전자 주식회사 음질 개선 방법 및 그 장치

Also Published As

Publication number Publication date
KR20070005469A (ko) 2007-01-10
KR20070005477A (ko) 2007-01-10

Similar Documents

Publication Publication Date Title
KR20070005468A (ko) 부호화된 오디오 신호의 생성방법, 그 부호화된 오디오신호를 생성하는 인코딩 장치 그리고 그 부호화된 오디오신호를 복호화하는 디코딩 장치
CA2589623C (en) Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering
KR102168140B1 (ko) 예측 모드 또는 비예측 모드에서 동작 가능한 오디오 업믹서
TWI521502B (zh) 多聲道音訊的較高頻率和降混低頻率內容的混合編碼
US9779738B2 (en) Efficient encoding and decoding of multi-channel audio signal with multiple substreams
KR20070088329A (ko) 멀티채널 합성장치 제어 신호를 발생하기 위한 장치 및방법과 멀티채널 합성을 위한 장치 및 방법
KR20080086550A (ko) 멀티채널 오디오 신호의 부호화 및 복호화 방법과 그 장치
RU2799737C2 (ru) Устройство повышающего микширования звука, выполненное с возможностью работы в режиме с предсказанием или в режиме без предсказания
RU2798024C1 (ru) Устройство повышающего микширования звука, выполненное с возможностью работы в режиме с предсказанием или в режиме без предсказания
RU2803142C1 (ru) Устройство повышающего микширования звука, выполненное с возможностью работы в режиме с предсказанием или в режиме без предсказания
AU2012205170B2 (en) Temporal Envelope Shaping for Spatial Audio Coding using Frequency Domain Weiner Filtering
KR20070003600A (ko) 오디오 신호 인코딩 및 디코딩 방법 및 장치
KR20070075237A (ko) 멀티채널 오디오 신호의 인코딩 및 디코딩 방법
KR20070037977A (ko) 다채널 오디오 신호의 인코딩 방법 및 장치 그리고인코딩된 신호의 디코딩 방법

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination