KR100663729B1 - 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치 - Google Patents

가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치 Download PDF

Info

Publication number
KR100663729B1
KR100663729B1 KR1020050061425A KR20050061425A KR100663729B1 KR 100663729 B1 KR100663729 B1 KR 100663729B1 KR 1020050061425 A KR1020050061425 A KR 1020050061425A KR 20050061425 A KR20050061425 A KR 20050061425A KR 100663729 B1 KR100663729 B1 KR 100663729B1
Authority
KR
South Korea
Prior art keywords
audio signal
sound source
source position
channel
vector
Prior art date
Application number
KR1020050061425A
Other languages
English (en)
Other versions
KR20060049941A (ko
Inventor
서정일
문한길
백승권
강경옥
장인선
성굉모
한민수
홍진우
Original Assignee
한국전자통신연구원
재단법인서울대학교산학협력재단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원, 재단법인서울대학교산학협력재단 filed Critical 한국전자통신연구원
Priority to DE602005023738T priority Critical patent/DE602005023738D1/de
Priority to PCT/KR2005/002213 priority patent/WO2006006809A1/en
Priority to US11/631,009 priority patent/US7783495B2/en
Priority to CN2005800232313A priority patent/CN101002261B/zh
Priority to EP05774399A priority patent/EP1779385B1/en
Priority to AT05774399T priority patent/ATE482451T1/de
Publication of KR20060049941A publication Critical patent/KR20060049941A/ko
Application granted granted Critical
Publication of KR100663729B1 publication Critical patent/KR100663729B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution

Abstract

본 발명은 가상 음원 위치 정보(Virtual Sound Location Information: VSLI)를 이용하여 멀티채널 오디오 신호를 효율적으로 부호화/복호화하는 방법 및 장치에 관한 것이다. 본 발명에 따른 멀티채널 오디오 신호 부호화 장치는, 멀티채널 오디오 신호를 프레임화된 오디오 신호로 변환하기 위한 프레임 변환 수단과, 상기 프레임화된 오디오 신호를 다운믹싱하기 위한 수단과, 상기 다운믹스된 오디오 신호를 부호화하기 위한 수단과, 상기 프레임화된 오디오 신호로부터 음원위치정보를 추정하기 위한 음원위치정보 추정 수단과, 상기 추정된 음원위치정보를 양자화하기 위한 수단과, 상기 부호화된 다운믹스 오디오 신호와 상기 양자화된 음원위치정보를 합산하여 최종적으로 부호화된 멀티채널 오디오 신호를 생성하기 위한 수단을 포함한다.
멀티채널 오디오 신호 부호화, 복호화, 가상음원위치정보(virtual source location information: VSLI)

Description

가상 음원 위치 정보를 이용한 멀티채널 오디오 신호 부호화 및 복호화 방법 및 장치{Method and apparatus for encoding and decoding multi-channel audio signal using virtual source location information}
도 1은 본 발명의 일실시예에 따른 멀티채널 오디오 신호 부호화 장치의 구성을 나타낸 블록도이다.
도 2는 ERB 필터뱅크를 이용한 시간/주파수 격자 개념도를 나타낸다.
도 3은 다운믹스된 멀티채널 오디오 신호가 모노 신호인 경우에 본 발명에 따라 추정되는 음원 위치 벡터를 개념적으로 나타낸다.
도 4는 다운믹스된 멀티채널 오디오 신호가 스테레오 신호인 경우에 본 발명에 따라 추정되는 음원 위치 벡터를 개념적으로 나타낸다.
도 5는 본 발명의 일실시예에 따른 가상음원 위치정보 추출 과정을 개념적으로 도시한다.
도 6은 5.1채널 스피커 배치를 이용한 경우에 채널별 에너지 벡터를 표현한 예를 도시한다.
도 7은 본 발명에 따라 좌측 반면 음원 위치 벡터(LHV) 및 우측 반면 음원 위치 벡터(RHV)를 추정하는 과정을 개념적으로 도시한다.
도 8은 본 발명에 따라 좌측 보조 위치 벡터(LSV) 및 우측 보조 위치 벡터(RSV)를 추정하는 과정을 개념적으로 도시한다.
도 9는 본 발명에 따른 전체 위치 벡터(GV) 추정과정을 개념적으로 도시한다.
도 10은 본 발명에 따라 추정된 위치 벡터들을 표현하는 방위각들을 도시한다.
도 11은 본 발명에 따라 부호화된 멀티채널 오디오 신호를 복호화하는 멀티채널 오디오 신호 복호화 장치의 일실시예를 도시한 블록도이다.
도 12는 본 발명의 일실시예에 따라 가상음원 위치정보(VSLI)를 이용하여 다운믹스 오디오 신호의 채널별 이득을 계산하는 과정을 블록도로 나타낸다.
본 발명은 멀티채널 오디오 신호의 부호화/복호화를 수행하는 방법 및 장치에 관한 것으로서, 보다 상세하게는 가상 음원 위치 정보(Virtual Sound Location Information: VSLI)를 이용하여 멀티채널 오디오 신호를 효율적으로 부호화/복호화하는 방법 및 장치에 관한 것이다.
일반적으로, 멀티채널 오디오 신호를 압축하기 위한 연구는 1990년대 중반 MPEG을 중심으로 이루어졌다. DVD를 중심으로 한 멀티채널 콘텐츠의 폭발적인 증 가, 사용자들의 멀티채널에 대한 욕구 증가 및 방송 통신 환경 등을 통한 멀티채널 오디오 서비스의 필요성 증가가 멀티채널 오디오 압축 기술에 대한 연구를 더욱 촉진시켰다.
이러한 이유로 MPEG에서는 MPEG-2 BC(Backward Compatability), MPEG-2 AAC(Advanced Audio Coding), MPEG-4 AAC 등의 멀티채널 오디오 압축 기술을 표준화하였으며, Dolby사의 AC-3, DTS(Digital Theater System) 등의 멀티채널 오디오 압축기술이 DVD와 디지털 방송을 위한 오디오 압축기술로 채택되는 등 상업적으로 큰 실효를 거두고 있다.
최근에는 BCC(Binaural Cue Coding)로 대표되는 혁신적인 멀티채널 오디오 신호 압축방식에 대한 연구가 활발히 진행되고 있는데(C. Faller, 2002 & 2003; F.Baumgarte, 2001 & 2002), 이를 통해 더욱 현실감있는 오디오 데이터의 전달을 꽤하고 있다.
BCC는 음향공간에서 사람이 느낄 수 있는 공간감이 주로 양귀효과(Binaural Effect) 때문인 것에 착안하여 멀티채널 오디오 신호를 효과적으로 압축하는 기술로서, 사람은 양귀에 도달하는 소리의 크기 차이(Interaural Level Difference)와 시간 지연차이(Interaural Time Difference)를 이용하여 특정 음원의 위치를 인지한다는 점을 이용한다. 따라서, BCC는 멀티채널 오디오 신호를 모노 또는 스테레오 신호로 다운믹스하고, 채널에 대한 정보는 채널간의 신호 크기차이(Inter-channel Level Difference: ICLD) 및 시간지연(Inter-channel Time Difference: ICTD) 등의 바이노럴 인지 파라미터(Binaural Cue Parameter)들로 표현하는 것이 통상적이다.
그러나, 이러한 ICLD 및 ICTD와 같은 채널 정보들을 양자화하기 위해서는 많은 량의 비트를 필요로 하며 이에 따라 전송시에도 넓은 대역폭을 필요로 하는 문제점이 있다.
따라서, 본 발명은 전술한 문제점을 해결하기 위해 고안된 것으로서, 본 발명의 목적은 멀티채널 오디오 신호를 다운믹스된 오디오 신호와 적은 양의 부가정보만을 이용하여 부호화/복호화하는 방법을 제공함으로써 수신측의 멀티채널 환경에서 실재감 있는 오디오 신호가 재생될 수 있도록 하는데 있다.
본 발명의 다른 목적은 멀티채널 오디오 신호의 채널별 음원을 분석하고 적은 양의 가상 음원 위치 정보를 추출하여 다운믹스된 오디오 신호와 함께 전송함으로써 전송 효율을 극대화시키는데 있다.
전술한 목적 달성을 위해, 본 발명의 일측면에 따른 멀티채널 오디오 부호화 장치는, 멀티채널 오디오 신호를 프레임화된 오디오 신호로 변환하기 위한 프레임 변환 수단과, 상기 프레임화된 오디오 신호를 다운믹싱하기 위한 수단과, 상기 다운믹스된 오디오 신호를 부호화하기 위한 부호화 수단과, 상기 프레임화된 오디오 신호로부터 음원위치정보를 추정하기 위한 음원위치정보 추정 수단과, 상기 추정된 음원위치정보를 양자화하기 위한 수단과, 상기 부호화된 다운믹스 오디오 신호와 상기 양자화된 음원위치정보를 합산하여 최종적으로 부호화된 멀티채널 오디오 신 호를 생성하기 위한 수단을 포함한다. 상기 음원위치정보 추정 수단은, 상기 프레임화된 오디오 신호를 스펙트럼값으로 변환하기 위한 시간/주파수 변환 수단과, 상기 스펙트럼값을 밴드별로 분리하기 위한 분리 수단과, 상기 밴드별로 분리된 스펙트럼값들로부터 채널별 에너지벡터를 검출하기 위한 에너지벡터 검출 수단과, 상기 에너지벡터 검출 수단에 의해 검출된 채널별 에너지 벡터를 이용하여 가상 음원 위치 벡터(VSLI)를 추정하기 위한 VSLI 추정수단을 포함한다.
본 발명의 제2 측면에 따른 멀티채널 오디오 신호 복호화 장치는, 멀티채널 오디오 신호를 수신하기 위한 수단과, 상기 수신된 멀티채널 오디오 신호로부터 부호화된 다운믹스 오디오 신호와 양자화된 가상음원 위치벡터 신호를 각각 분리하기 위한 신호 분배 수단과, 상기 부호화된 다운믹스 오디오 신호를 복호화하기 위한 수단과, 상기 복호화된 다운믹스 오디오 신호를 주파수축 신호로 변환하기 위한 수단과, 상기 양자화된 가상음원 위치벡터 신호를 분석하여 밴드별 가상 음원 위치 벡터 정보를 추출하기 위한 수단과, 상기 밴드별 가상음원 위치벡터 정보로부터 밴드별 채널 이득값을 계산하기 위한 수단과, 상기 주파수축으로 변환된 다운믹스 신호와 상기 계산된 밴드별 채널 이득값을 이용하여 멀티채널 오디오 신호 스펙트럼을 합성하기 위한 수단과, 상기 합성된 멀티채널 스펙트럼으로부터 멀티채널 오디오 신호를 산출하기 위한 수단을 포함한다.
본 발명의 제3 측면에 따른 멀티채널 오디오 신호 부호화 방법은, 멀티채널 오디오 신호를 프레임화된 오디오 신호로 변환하는 단계와, 상기 프레임화된 오디오 신호를 다운믹싱하는 단계와, 상기 다운믹스된 오디오 신호를 부호화하는 단계 와, 상기 프레임화된 오디오 신호로부터 음원위치정보를 추정하는 단계와, 상기 추정된 음원위치정보를 양자화하는 단계와, 상기 부호화된 다운믹스 오디오 신호와 상기 양자화된 음원위치정보를 합산하여 최종적으로 부호화된 멀티채널 오디오 신호를 생성하는 단계를 포함한다.
본 발명의 제4 측면에 따른 멀티채널 오디오 신호 복호화 방법은, 멀티채널 오디오 신호를 수신하는 단계와, 상기 수신된 멀티채널 오디오 신호로부터 부호화된 다운믹스 오디오 신호와 양자화된 가상음원 위치벡터 신호를 각각 분리하는 단계와, 상기 부호화된 다운믹스 오디오 신호를 복호화하는 단계와, 상기 복호화된 다운믹스 오디오 신호를 주파수축 신호로 변환하는 단계와, 상기 양자화된 가상음원 위치벡터 신호를 분석하여 밴드별 가상 음원 위치 벡터 정보를 추출하는 단계와, 상기 밴드별 가상음원 위치벡터 정보로부터 밴드별 채널 이득값을 계산하는 단계와, 상기 주파수축으로 변환된 다운믹스 신호와 상기 계산된 밴드별 채널 이득값을 이용하여 멀티채널 오디오 신호 스펙트럼을 합성하는 단계와, 상기 합성된 멀티채널 스펙트럼으로부터 멀티채널 오디오 신호를 산출하는 단계를 포함한다.
이하에서는 본 발명을 첨부된 도면에 도시된 실시예들과 관련하여 예시적으로 상세히 설명하겠다. 그러나, 이하의 상세한 설명은 단지 예시적인 목적으로 제공되는 것이며 본 발명의 개념을 임의의 특정된 물리적 구성에 한정하는 것으로 해석되어서는 안 될 것이다.
도 1은 본 발명의 일실시예에 따른 멀티채널 오디오 부호화 장치의 구성을 나타낸 블록도이다. 도시된 바와 같이, 멀티채널 오디오 부호화 장치는, 프레임 변환기(100), 다운믹서(110), AAC(Advanced Audio Coding) 부호화기(120), 합산기(130), 양자화기(140) 및 가상음원위치정보(VLSI) 검출기(150)를 포함한다.
프레임 변환기(100)는 멀티채널 오디오 신호의 블록별 처리를 위하여 Sine Window등과 같은 창함수(Window Function)를 이용하여 멀티채널 오디오 신호를 프레임화한다. 다운믹서(110)는 프레임 변환기(100)로부터 출력된 프레임화된 멀티채널 오디오 신호를 모노신호 또는 스테레오 신호로 다운믹스된 오디오 신호를 생성한다. AAC 부호화기(120)는 상기 다운믹서(110)로부터 출력된 다운믹스 오디오 신호를 압축하여 AAC 부호화 신호를 생성한 후에 합산기(130)로 전달한다.
한편, 가상음원 위치정보(VSLI) 추출기(150)는 프레임 변환기(100)로부터 프레임화된 오디오 신호로부터 가상음원위치정보를 추출하는 기능을 수행한다. 이를 위해, 가상음원 위치정보(VSLI) 추출기(150)는 시간/주파수 변환부(151), ERB(Equivalent Rectangular Bandwidth) 필터뱅크(152), 에너지벡터 검출부(153) 및 위치 추정부(154)를 세부적으로 포함한다.
시간/주파수 변환부(151)는 프레임화된 오디오 신호를 주파수축 신호로 변환하기 위해 복수의 FFT(Fast Fourier Transform)로 이루어지며, ERB 필터뱅크(152)는 시간/주파수 변환부(151)에 의해 변환된 주파수축 신호(스펙트럼값)를 밴드별(예, 20개)로 분리한다. 도 2는 ERB 필터뱅크를 이용한 시간/주파수 격자 개념도를 도시한다.
에너지벡터 검출부(153)는 ERB 필터뱅크(152)에 의해 밴드별로 분리된 스펙트럼값들로부터 채널별 에너지벡터를 검출한다.
위치 추정부(154)는 에너지벡터 검출부(153)에 의해 검출된 채널별 에너지 벡터를 이용하여 가상 음원 위치 벡터(VSLI)를 추정한다. 일 실시예에서, VSLI는 중앙 채널과 이루는 방위각으로 표현된다. 후술하는 바와 같이, 위치 추정부(154)에 의해 추정되는 음원 위치 벡터는 다운믹스 신호의 종류(즉, 모노 또는 스테레오)에 따라 달라질 수 있다.
도 3은 다운믹스된 멀티채널 오디오 신호가 모노 신호인 경우에 본 발명에 따라 추정되는 음원 위치 벡터의 유형을 개념적으로 나타낸다. 도시된 바와 같이, 다운믹스된 모노 신호로부터 추정되는 음원 위치 벡터는, 좌측 및 우측 반면 음원위치벡터(Left Half-plane vector: LHV, Right Half-plane vector: RHV), 좌측 및 우측 보조 음원위치 벡터(Left subsequent vector: LSV, Right Subsequent vector: RSV) 및 전체위치벡터(Global vector: GV)를 포함한다. 모노 신호인 경우에는 채널 이득이 좌측과 우측중 어느 쪽에 치우치는지 알 수 없으므로 전체 위치 벡터(GV)가 필요하다.
도 4는 다운믹스된 멀티채널 오디오 신호가 스테레오 신호인 경우에 본 발명에 따라 추정되는 음원 위치 벡터의 유형을 개념적으로 나타낸다. 도시된 바와 같이, 다운믹스된 스테레오 신호로부터 추정되는 음원 위치 벡터는, 전체위치벡터(GV)를 제외한, 좌측/우측 반면 음원위치벡터(LHV, RHV) 및 좌측/우측 보조음원위치 벡터(LSV, RSV)를 포함한다.
도 1을 다시 참조하면, 양자화기(140)는 가상음원 위치정보(VSLI) 추출기(150)로부터 출력된 가상음원 위치벡터(방위각)들을 양자화한 후에 VSLI 부호화 신 호로 생성하여 합산기(130)에 전달한다. 합산기(multiplexer, 130)는 AAC 부호화기(120)기로부터 출력된 AAC 부호화 신호와 양자화기(140)로부터 출력된 VSLI 부호화 신호를 다중화(multiplexing)하여 부호화된 멀티채널 오디오 신호(즉, AAC+VSLI 부호화 신호)를 생성한다.
도 5는 본 발명의 일실시예에 따른 가상음원 위치정보 추정 과정을 개념적으로 도시한다. 도시된 바와 같이, 중앙(C), 전방 좌측(L), 전방 우측(R), 후방 좌측(LS) 및 후방 우측(RS)의 5채널 신호로 구성된 멀티채널 오디오 신호가 입력되는 경우에, 상기 신호들은 복수개의 FFT를 통해 주파수축 신호로 변환되고, ERB 필터뱅크를 통해 N개의 주파수 밴드(BAND 1, BAND 2, ..., BAND N)로 분리된다.
다음, 밴드별로 분리된 5채널의 파워(예, C1 PWR, L1 PWR, R1 PWR, LS1 PWR, RS1 PWR)로부터 채널별 에너지 벡터가 검출된다. 인접 채널 사이의 신호 크기 값을 조정하여 음상을 정위하는 방식(Constant Power Panning: CPP) 방식을 이용하여 검출된 채널별 에너지 벡터로부터 음원 위치 벡터가 추정되고, 중앙 채널과 이루는 방위각이 추정된다.
도 6 내지 도 9는 본 발명에 따른 가상음원 위치 정보 추정 과정을 구체적으로 도시한 도면들이다. 구체적으로, 도 6에 도시된 바와 같이, 에너지 벡터 추정부에 의해 추정된 채널별 에너지 벡터가, 중앙 채널 에너지벡터(C), 전방 좌측 채널 에너지 벡터(L), 후방 좌측 채널 에너지 벡터(LS), 전방 우측 채널 에너지 벡터(R) 및 후방 우측 채널 에너지 벡터(RS)라 가정한다. 이러한 경우에, 전방 좌측 채널 에너지 벡터(L)와 후방 좌측 채널 에너지 벡터(LS)를 이용하여 좌측 반면 음원 위치벡터(LHV)를 추정하고, 전방 우측 채널 에너지 벡터(R)와 후방 우측 채널 에너지 벡터(RS)를 이용하여 우측 반면 음원 위치벡터(RHV)를 추정한다(도 7 참조).
이와 같이 계산된 좌/우측 반면 음원 위치벡터(LHV, RHV)와 중앙 채널 에너지 벡터(C)를 이용하여 좌우측 보조 음원 위치 벡터(LSV, RSV)를 추정할 수 있다(도 8 참조).
다운믹스된 신호가 스테레오 신호인 경우에는 좌우측 반면 음원 위치벡터(LHV, RHV) 및 좌우측 보조 음원 위치벡터(LSV, RSV)만으로 멀티채널을 구성하는 각 채널별 이득값을 계산할 수 있지만, 모노 신호인 경우에는 채널 이득이 좌측과 우측중 어느 쪽에 치우치는지 알 수 없으므로 전체 위치 벡터(GV)가 필요하다. 전체 위치 벡터(GV)는 좌우측 보조 음원 위치벡터(LSV, RSV)를 이용하여 계산할 수 있다(도 9 참조). 한편, 전체위치벡터(GV)의 크기는 다운믹스 오디오 신호 크기로 설정된다.
전술한 방식에 따라 추출된 음원 위치벡터는 중앙 채널과 이루는 방위각으로 표현될 수 있다. 도 10은 도 6 내지 9에 도시된 과정으로 추출된 음원 위치벡터의 방위각들을 도시한 것이다. 도시된 바와 같이, 좌측반면각(Left Half-plane vector angle: LHa), 우측반면각(Right Half-plane vector angle: RHa), 좌측보조평면각(Left Subsequent vector angle: LSa) 및 우측보조평면각(Right Subsequent vector angle: RSa)과, 다운믹스된 오디오 신호가 모노 신호인 경우에는 전체위치 각(Global vector angle: Ga)을 더 포함하는 5개의 방위각으로 가상음원 위치정보가 표현된다. 각 값들은 한정된 표현영역(dynamic range)을 갖기 때문에, 기존의 채널간의 신호크기 차(ICLD)보다 적은 비트로 양자화가 가능하다.
각각의 정보를 양자화하는 방법은 등간격으로 양자화하는 선형 양자화 방법과 비균등한 간격으로 양자화하는 비선형 양자화 방법이 있다.
일실시예에서, 각각의 정보에 대한 선형 양자화 방법은 하기의 수학식 1을 따른다.
Figure 112005036911515-pat00001
여기서, θ는 양자화될 각의 정보이며 양자화 레벨 Q 에 의해 양자화 인덱스를 얻는다. i는 5개의 각에 대한 인덱스이고(Ga:i=1, RHa:i=2, LHa:i=3, LSa:i=4, RSa:i=5), b는 각 서브밴드에 대한 인덱스이다. Δθi,max는 각각이 표현될 수 있는 최대 변화 레벨로서, Δθ1,max=180°, Δθ2,max=Δθ3,max=15°, Δθ4,max=Δθ5,max=55°로 정의된다. 즉, 앞서 언급한 바와 같이 각각의 정보는 그 최대 변화 구간이 한정되어 있으므로 양자화 수단에 있어서 보다 효율적이고 높은 분해능을 나타낼 수 있다.
일반적으로, RHa, LHa, LSa, RSa는 그 발생빈도에 대한 통계적 정보가 불확실하다. 그러나, 전체 위치각(Ga)의 경우, 중앙 스피커를 기준으로 그 발생빈도가 정규적 분포에 가깝게 발생한다. 즉, Ga의 경우, 중앙 스피커를 기준으로 변화하므로 그 발생분포의 평균 기대치가 0°로 가정할 수 있다. 따라서, Ga는 비선형 양자화를 통하여 양자화될 경우에 보다 효율적인 양자화 레벨을 얻을 수 있다.
대표적으로, 본 비선형 양자화 방법은 일반적인 μ-law방식을 따르며, μ값은 양자화 레벨의 분해능에 따라 결정될 수 있다. 예를 들어 분해능이 작을 경우 상대적으로 큰 μ값을 사용하고(15<μ≤255), 큰 분해능을 나타낼 경우보다 작은 μ값(0μ≤15)을 사용하여 비선형 양자화를 수행한다.
도 11은 본 발명에 따라 부호화된 멀티채널 오디오 신호를 복호화하는 멀티채널 오디오 신호 복호화 장치의 일실시예를 도시한 블록도이다. 도시된 바와 같이, 멀티채널 오디오 신호 복호화 장치는, 신호분배기(1110), AAC 복호화기(1120), 시간/주파수 변환기(1130), 역양자화기(1140), 밴드별 채널 이득 분배기(1150), 멀티채널 스펙트럼 합성기(1160) 및 주파수/시간 변환기(1170)를 포함한다.
신호분배기(1110)는, 부호화된 멀티채널 오디오 신호(즉, AAC+VSLI 부호화신호)를 AAC 부호화 신호와 VSLI부호화 신호로 각각 분리한다. AAC 복호화기(1120)는 신호분배기(1110)에 의해 분리된 AAC 부호화 신호를 다운믹스 신호(모노 또는 스테레오)로 변환한다. AAC 복호화기(1120)에 의해 변환된 다운믹스 신호는 모노 또는 스테레오 오디오 서비스를 제공할 수 있다. 시간/주파수 변환기(1130)는 다운믹스 신호를 주파수축 신호로 변환하여 멀티채널 스펙트럼 합성기(1160)에 전송한다.
한편, 역양자화기(1140)는 신호분배기(1110)로부터 분리된 부호화된 VSLI 신 호를 입력받아 밴드별 음원 위치 벡터 정보를 산출한다. 부호화 과정에서 전술한 바와 같이, VSLI 신호에는 밴드별 음원 위치 벡터를 표현한 방위각 정보(예, 모노 다운믹스 신호인 경우에, Ga, LHa, RHa, LSa, RSa)가 포함되어 있으며, 이로부터 음원 위치 벡터가 산출된다.
밴드별 채널 이득 분배기(1150)는 역양자화기(1140)에 의해 변환된 밴드별 VSLI 신호를 이용하여 각 채널당 분배되는 이득값을 계산하여 멀티채널 스펙트럼 합성기(1160)에 전송한다.
멀티채널 스펙트럼 합성기(1160)는 시간/주파수 변환기(1130)로부터 출력된 다운믹스 신호의 스펙트럼값을 ERB 필터뱅크를 이용하여 주파수 밴드별로 분리하고, 밴드별 채널 이득 분배기(1150)로부터 출력된 밴드별 채널 이득값을 이용하여 멀티채널 신호의 스펙트럼을 복구한다. 주파수/시간 변환기(1170)(예, IFFF)는 복구된 멀티채널 신호의 스펙트럼 값들을 시간축 신호로 변환하여 멀티채널 오디오 신호를 생성한다.
도 12는 본 발명의 일실시예에 따라 가상음원 위치정보(VSLI)를 이용하여 다운믹스 오디오 신호의 채널별 이득을 계산하는 과정을 블록도로 나타낸다. 상기 예는 다운믹스 오디오 신호가 모노 신호인 경우를 도시한 것으로서, 다운믹스 오디오 신호가 스테레오 신호인 경우에는 블록(1210)이 생략될 것이다.
먼저, 블록(1210)에서 전체위치 벡터(GV)의 크기인 모노 다운믹스 신호 크기와 GV의 각도(Ga)를 이용하여 LSV와 RSV 벡터 크기를 계산한다. 다음, LSV 벡터 크기와 각도(LSa)를 이용하여 중앙채널(C)의 제1 이득값과 LHV 벡터의 크기를 계산 하고(1220), RSV 벡터의 크기와 각도(RSa)를 이용하여 중앙채널(C)의 제2 이득값과 RHV 벡터 크기를 계산한다(1230). 중앙채널(C)의 이득은 상기 과정에서 계산된 제1 이득값 및 제2 이득값의 합으로 이루어진다(1240).
마지막으로, LHV 벡터의 크기와 각도(LHa)를 이용하여 전방 좌측 채널(L)과 후방 좌측 채널(LS)의 이득값을 계산하고(1250), RHV 벡터의 크기와 각도(RHa)를 이용하여 전방 우측 채널(R)과 후방 우측 채널(RS)의 이득값을 계산한다(1260). 전술한 과정에 따라 모든 채널의 이득값이 계산될 수 있다.
이상에서, 특정 실시예와 관련하여 본 발명을 설명하였으나, 본 발명은 전술한 실시예 및 첨부된 도면에 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서, 여러 치환, 변형 및 변경이 가능하다는 것이 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.
본 발명에 따르면, 가상음원위치정보를 이용함으로써 멀티채널 오디오 신호를 보다 효율적으로 부호화/복호화할 수 있으며, 수신측의 멀티채널 환경에서 보다 실재감있는 오디오 신호로 재생될 수 있다.

Claims (31)

  1. 멀티채널 오디오 신호를 프레임화된 오디오 신호로 변환하기 위한 프레임 변환 수단과,
    상기 프레임화된 오디오 신호를 다운믹싱하기 위한 수단과,
    상기 다운믹스된 오디오 신호를 부호화하기 위한 수단과,
    상기 프레임화된 오디오 신호로부터 음원위치정보를 추정하기 위한 음원위치정보 추정 수단과,
    상기 추정된 음원위치정보를 양자화하기 위한 수단과,
    상기 부호화된 다운믹스 오디오 신호와 상기 양자화된 음원위치정보를 합산하여 최종적으로 부호화된 멀티채널 오디오 신호를 생성하기 위한 수단
    을 포함하는 멀티채널 오디오 신호 부호화 장치.
  2. 제 1항에 있어서, 상기 다운믹싱 수단은 상기 프레임화된 오디오 신호를 모노 신호 및 스테레오 신호중 어느 하나의 신호로 다운믹싱하는 멀티채널 오디오 신호 부호화 장치.
  3. 제 2항에 있어서, 상기 다운믹싱 수단에 의해 다운믹스된 오디오 신호가 모노 신호인 경우에, 상기 음원위치정보 추정 수단은, 좌측 및 우측 반면 음원위치벡터(LHV, RHV), 좌측 및 우측 보조 음원위치 벡터(LSV, RSV) 및 전체위치벡터(GV)를 추정하는 멀티채널 오디오 신호 부호화 장치.
  4. 제 2항에 있어서, 상기 다운믹싱 수단에 의해 다운믹스된 오디오 신호가 스테레오 신호인 경우에, 상기 음원위치정보 추정 수단은, 좌측 및 우측 반면 음원위치벡터(LHV, RHV)와, 좌측 및 우측 보조 음원위치 벡터(LSV, RSV)를 추정하는 멀티채널 오디오 신호 부호화 장치.
  5. 제 1항에 있어서, 상기 음원위치정보 추정 수단은,
    상기 프레임화된 오디오 신호를 스펙트럼값으로 변환하기 위한 시간/주파수 변환 수단과,
    상기 스펙트럼값을 밴드별로 분리하기 위한 분리 수단과,
    상기 밴드별로 분리된 스펙트럼값들로부터 채널별 에너지벡터를 검출하기 위한 에너지벡터 검출 수단과,
    상기 에너지벡터 검출 수단에 의해 검출된 채널별 에너지 벡터를 이용하여 가상 음원 위치 벡터(VSLI)를 추정하기 위한 VSLI 추정수단
    을 포함하는 멀티채널 오디오 신호 부호화 장치.
  6. 제 5항에 있어서, 상기 시간/주파수 변환 수단은 복수의 FFT(Fast Fourier Transform)를 이용하여 상기 프레임화된 오디오 신호를 스펙트럼값으로 변환하는 멀티채널 오디오 신호 부호화 장치.
  7. 제 5항에 있어서, 상기 분리 수단은 ERB(Equivalent Rectangular Bandwidth) 필터 뱅크를 이용하여 상기 스펙트럼값을 밴드별로 분리하는 멀티채널 오디오 신호 부호화 장치.
  8. 제 5항에 있어서, 상기 에너지벡터 검출 수단에 의해 검출된 채널별 에너지 벡터는, 중앙채널 에너지벡터(C), 전방 좌측 채널 에너지 벡터(L), 후방 좌측 채널 에너지 벡터(LS), 전방 우측 채널 에너지 벡터(R) 및 후방 우측 채널 에너지 벡터(RS)인 멀티채널 오디오 신호 부호화 장치.
  9. 제 5항에 있어서, 상기 가상음원 위치 벡터(VSLI) 정보는 중앙채널을 기준으로 한 방위각 정보로 표현되며, 상기 방위각 정보는 좌측반면각(LHa), 우측반면각(RHa), 좌측보조평면각(LSa) 및 우측보조평면각(RSa)을 포함하는 멀티채널 오디오 신호 부호화 장치.
  10. 제 9항에 있어서, 상기 다운믹스된 오디오 신호가 모노 신호인 경우에, 상기 방위각 정보는 전체위치각(Ga)을 더 포함하는 멀티채널 오디오 신호 부호화 장치.
  11. 멀티채널 오디오 신호를 수신하기 위한 수단과,
    상기 수신된 멀티채널 오디오 신호로부터 부호화된 다운믹스 오디오 신호와 양자화된 가상음원 위치벡터 신호를 각각 분리하기 위한 신호 분배 수단과,
    상기 부호화된 다운믹스 오디오 신호를 복호화하기 위한 수단;
    상기 복호화된 다운믹스 오디오 신호를 주파수축 신호로 변환하기 위한 수단과
    상기 양자화된 가상음원 위치벡터 신호로부터 밴드별 가상 음원 위치 벡터(VSLI) 정보를 추출하기 위한 VSLI 추출 수단과,
    상기 추출된 밴드별 가상음원 위치벡터 정보를 이용하여 밴드별 채널 이득값을 계산하기 위한 채널 이득 계산 수단과,
    상기 주파수축으로 변환된 다운믹스 신호와 상기 계산된 밴드별 채널 이득값을 이용하여 멀티채널 오디오 신호 스펙트럼을 합성하기 위한 수단과,
    상기 합성된 멀티채널 스펙트럼으로부터 멀티채널 오디오 신호를 생성하기 위한 수단
    을 포함하는 멀티채널 오디오 신호 복호화 장치.
  12. 제 11항에 있어서, 상기 VSLI 추출 수단은, 상기 양자화된 가상음원 위치벡터 신호로부터 밴드별 가상 음원 방위각 정보를 추출하고, 상기 추출된 방위각 정보로부터 가상 음원 위치 벡터를 구성하는 멀티채널 오디오 신호 복호화 장치.
  13. 제 12항에 있어서, 상기 가상 음원 방위각 정보는 밴드별 좌측 및 우측 반면각(LHa, RHa) 및 좌측 및 우측 보조 평면각(LSa, LHa) 정보를 포함하고, 상기 방위각 정보로부터 구성되는 가상 음원 위치 벡터는 좌측 및 우측 반면 음원 위치 벡터(LHV, RHV)와, 좌측 및 우측 보조 음원 위치 벡터(LSV, RSV)를 포함하는 멀티채널 오디오 신호 복호화 장치.
  14. 제 13항에 있어서, 상기 부호화된 다운믹스 오디오 신호가 모노 신호인 경우에, 상기 가상 음원 방위각 정보는 전체위치각(Ga) 정보를 더 포함하고, 상기 전체위치각(Ga) 정보로부터 전체 위치 벡터(GV)가 구성되는 멀티채널 오디오 신호 복호화 장치.
  15. 멀티채널 오디오 신호를 프레임화된 오디오 신호로 변환하는 단계와,
    상기 프레임화된 오디오 신호를 다운믹싱하는 단계와,
    상기 다운믹스된 오디오 신호를 부호화하는 단계와,
    상기 프레임화된 오디오 신호로부터 음원위치정보를 추정하는 단계와,
    상기 추정된 음원위치정보를 양자화하는 단계와,
    상기 부호화된 다운믹스 오디오 신호와 상기 양자화된 음원위치정보를 합산하여 최종적으로 부호화된 멀티채널 오디오 신호를 생성하는 단계
    을 포함하는 멀티채널 오디오 신호 부호화 방법.
  16. 제15항에 있어서, 상기 프레임화된 오디오 신호는 모노 신호 및 스테레오 신호중 어느 하나의 신호로 다운믹싱되는 멀티채널 오디오 신호 부호화 방법.
  17. 제16항에 있어서, 상기 다운믹스된 오디오 신호가 모노 신호인 경우에, 상기 추정된 음원위치 정보는, 좌측 및 우측 반면 음원 위치 벡터(LHV, RHV), 좌측 및 우측 보조 음원위치 벡터(LSV, RSV) 및 전체위치벡터(GV)를 포함하는 멀티채널 오디오 신호 부호화 방법.
  18. 제16항에 있어서, 상기 다운믹스된 오디오 신호가 스테레오 신호인 경우에, 상기 추정된 음원위치정보는, 좌측 및 우측 반면 음원 위치 벡터(LHV, RHV)와, 좌측 및 우측 보조 음원위치 벡터(LSV, RSV)를 포함하는 멀티채널 오디오 신호 부호화 방법.
  19. 제15항에 있어서, 상기 음원위치정보 추정 단계는,
    상기 프레임화된 오디오 신호를 스펙트럼값으로 변환하는 단계와,
    상기 스펙트럼값을 밴드별로 분리하는 단계와,
    상기 밴드별로 분리된 스펙트럼값들로부터 채널별 에너지벡터를 검출하는 단계와,
    상기 검출된 채널별 에너지 벡터를 이용하여 가상 음원 위치 벡터(VSLI)를 추정하는 단계
    을 포함하는 멀티채널 오디오 신호 부호화 방법.
  20. 제 19항에 있어서, 상기 검출된 채널별 에너지 벡터는, 중앙채널 에너지벡터(C), 전방 좌측 채널 에너지 벡터(L), 후방 좌측 채널 에너지 벡터(LS), 전방 우측 채널 에너지 벡터(R) 및 후방 우측 채널 에너지 벡터(RS)를 포함하는 멀티채널 오디오 신호 부호화 방법.
  21. 제 20항에 있어서, 상기 VLSI 추정 단계는,
    전방 좌측 채널 에너지 벡터(L)와 후방 좌측 채널 에너지 벡터(LS)를 이용하여 좌측 반면 음원 위치벡터(LHV)를 추정하는 단계와,
    전방 우측 채널 에너지 벡터(R)와 후방 우측 채널 에너지 벡터(RS)를 이용하여 우측 반면 음원 위치벡터(RHV)를 추정하는 단계와,
    상기 추정된 좌측음원 위치벡터(LV)와 중앙 채널 에너지 벡터(C)를 이용하여 좌측 보조 음원 위치 벡터(LSV)를 추정하는 단계와,
    상기 추정된 우측음원 위치벡터(RV)와 중앙 채널 에너지 벡터(C)를 이용하여 우측 보조 음원 위치 벡터(RSV)를 추정하는 단계
    을 포함하는 멀티채널 오디오 신호 부호화 방법.
  22. 제 21항에 있어서, 상기 다운믹스된 오디오 신호가 모노 신호인 경우에, 상 기 추정된 VLSI 벡터에는 전체 위치 벡터(GV)가 더 포함되고, 상기 VLSI 추정 단계는, 상기 추정된 좌측 보조 음원 위치 벡터(LSV) 및 우측 보조 음원 위치 벡터(RSV)를 이용하여 상기 전체 위치 벡터(GV)를 추정하는 단계를 더 포함하는 멀티채널 오디오 신호 부호화 방법.
  23. 제 19항에 있어서, 상기 다운믹스된 오디오 신호가 스테레오 신호인 경우에, 상기 가상음원 위치벡터(VSLI)는 중앙 채널을 기준으로 한 좌측반면각(LHa), 우측평면값(RHa), 좌측보조평면각(LSa) 및 우측보조평면각(RSa)으로 표현되는 멀티채널 오디오 신호 부호화 방법.
  24. 제 19항에 있어서, 상기 다운믹스된 오디오 신호가 모노 신호인 경우에, 상기 가상음원 위치벡터(VSLI)는, 전체위치각(Ga), 좌측반면각(LHa), 우측평면값(RHa), 좌측보조평면각(LSa) 및 우측보조평면각(RSa)으로 표현되는 멀티채널 오디오 신호 부호화 방법.
  25. 멀티채널 오디오 신호를 수신하는 단계와,
    상기 수신된 멀티채널 오디오 신호로부터 부호화된 다운믹스 오디오 신호와 양자화된 가상음원 위치벡터 신호를 각각 분리하는 단계와,
    상기 부호화된 다운믹스 오디오 신호를 복호화하는 단계와,
    상기 복호화된 다운믹스 오디오 신호를 주파수축 신호로 변환하는 단계와,
    상기 양자화된 가상음원 위치벡터 신호를 분석하여 밴드별 가상 음원 위치 벡터 정보를 추출하는 단계와,
    상기 밴드별 가상음원 위치벡터 정보로부터 밴드별 채널 이득값을 계산하는 단계와,
    상기 주파수축으로 변환된 다운믹스 신호와 상기 계산된 밴드별 채널 이득값을 이용하여 멀티채널 오디오 신호 스펙트럼을 합성하는 단계와,
    상기 합성된 멀티채널 스펙트럼으로부터 멀티채널 오디오 신호를 산출하는 단계
    를 포함하는 멀티채널 오디오 신호 복호화 방법.
  26. 제25항에 있어서, 상기 밴드별 가상 음원 위치 벡터 정보를 추출하는 단계는, 상기 양자화된 가상음원 위치벡터 신호로부터 밴드별 가상 음원 방위각 정보를 추출하고, 상기 추출된 방위각 정보로부터 가상 음원 위치 벡터를 구성하는 멀티채널 오디오 신호 복호화 방법.
  27. 제 26항에 있어서, 상기 가상 음원 방위각 정보는 밴드별 좌측 및 우측 반면각(LHa, RHa) 및 좌측 및 우측 보조 평면각(LSa, LHa) 정보를 포함하고, 상기 방위각 정보로부터 구성되는 가상 음원 위치 벡터는 좌측 및 우측 반면 음원 위치 벡터(LHV, RHV)와, 좌측 및 우측 보조 음원 위치 벡터(LSV, RSV)를 포함하는 멀티채널 오디오 신호 복호화 방법.
  28. 제 27항에 있어서, 상기 부호화된 다운믹스 오디오 신호가 모노 신호인 경우에, 상기 가상 음원 방위각 정보는 전체위치각(Ga) 정보를 더 포함하고, 상기 전체위치각(Ga) 정보로부터 전체 위치 벡터(GV)가 구성되는 멀티채널 오디오 신호 복호화 방법.
  29. 제 27항에 있어서, 상기 채널 이득 계산 단계는, 각각의 밴드에 대하여,
    상기 다운믹스 오디오 신호 크기를 이용하여 좌측 및 우측 보조 음원 위치 벡터(LSV, RSV)의 크기를 계산하는 단계와,
    상기 좌측 보조 음원 위치 벡터(LSV) 크기와 상기 좌측 보조 평면각(LSa)을 이용하여 중앙 채널(C)의 제1 이득값과 좌측 반면 음원 위치 벡터(LHV)의 크기를 계산하는 단계와,
    상기 우측 보조 음원 위치 벡터(RSV)의 크기와 상기 우측 보조 평면각(RSa)을 이용하여 중앙채널(C)의 제2 이득값과 우측 반면 음원 위치 벡터(RHV)의 크기를 계산하는 단계와,
    상기 중앙채널(C)의 제1 이득값 및 제2 이득값을 합하여 상기 중앙채널(C)의 이득값을 산출하는 단계와,
    상기 좌측 반면 음원 위치 벡터(LHV)의 크기와 상기 좌측 반면각(LHa)을 이용하여 전방 좌측채널(L)과 후방 좌측 채널(LS)의 이득값을 계산하는 단계와,
    상기 우측 반면 음원 위치 벡터(RHV)의 크기와 상기 우측 반면각(RHa)을 이 용하여 전방 우측 채널(R)과 후방 우측 채널(RS)의 이득값을 계산하는 단계
    를 포함하는 멀티채널 오디오 신호 복호화 방법.
  30. 제15항 내지 제24항중 어느 하나의 항에 따른 멀티채널 오디오 신호 부호화 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 기록매체.
  31. 제25항 내지 제29항중 어느 하나의 항에 따른 멀티채널 오디오 신호 복호화 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 기록매체.
KR1020050061425A 2004-07-09 2005-07-07 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치 KR100663729B1 (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
DE602005023738T DE602005023738D1 (de) 2004-07-09 2005-07-08 Verfahren und vorrichtung zum codieren und decodieren eines mehrkanaligen audiosignals unter verwendung von virtuelle-quelle-ortsinformationen
PCT/KR2005/002213 WO2006006809A1 (en) 2004-07-09 2005-07-08 Method and apparatus for encoding and cecoding multi-channel audio signal using virtual source location information
US11/631,009 US7783495B2 (en) 2004-07-09 2005-07-08 Method and apparatus for encoding and decoding multi-channel audio signal using virtual source location information
CN2005800232313A CN101002261B (zh) 2004-07-09 2005-07-08 使用虚拟源位置信息编码和解码多声道音频信号的方法和装置
EP05774399A EP1779385B1 (en) 2004-07-09 2005-07-08 Method and apparatus for encoding and decoding multi-channel audio signal using virtual source location information
AT05774399T ATE482451T1 (de) 2004-07-09 2005-07-08 Verfahren und vorrichtung zum codieren und decodieren eines mehrkanaligen audiosignals unter verwendung von virtuelle-quelle-ortsinformationen

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20040053665 2004-07-09
KR1020040053665 2004-07-09
KR20040081303 2004-10-12
KR1020040081303 2004-10-12

Publications (2)

Publication Number Publication Date
KR20060049941A KR20060049941A (ko) 2006-05-19
KR100663729B1 true KR100663729B1 (ko) 2007-01-02

Family

ID=37149973

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050061425A KR100663729B1 (ko) 2004-07-09 2005-07-07 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치

Country Status (5)

Country Link
US (1) US7783495B2 (ko)
KR (1) KR100663729B1 (ko)
CN (1) CN101002261B (ko)
AT (1) ATE482451T1 (ko)
DE (1) DE602005023738D1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100829560B1 (ko) 2006-08-09 2008-05-14 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 방법 및 장치,멀티채널이 다운믹스된 신호를 2 채널로 출력하는 복호화방법 및 장치
WO2015129977A1 (ko) * 2014-02-27 2015-09-03 전자부품연구원 대역별 정확도에 따른 가중 평균을 이용한 음원 위치 검출 방법 및 장치

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
CA2620030C (en) * 2005-08-30 2011-08-23 Lg Electronics Inc. Method and apparatus for decoding an audio signal
KR101218776B1 (ko) 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
KR100803212B1 (ko) 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
KR100773560B1 (ko) 2006-03-06 2007-11-05 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
ATE527833T1 (de) 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
US7876904B2 (en) * 2006-07-08 2011-01-25 Nokia Corporation Dynamic decoding of binaural audio signals
KR100763920B1 (ko) 2006-08-09 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치
RU2551797C2 (ru) 2006-09-29 2015-05-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов
CN101529898B (zh) 2006-10-12 2014-09-17 Lg电子株式会社 用于处理混合信号的装置及其方法
WO2008060111A1 (en) 2006-11-15 2008-05-22 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
KR100891671B1 (ko) * 2006-12-01 2009-04-03 엘지전자 주식회사 믹스신호 제어 방법 및 장치
EP2102855A4 (en) 2006-12-07 2010-07-28 Lg Electronics Inc METHOD AND APPARATUS FOR DECODING AUDIO SIGNAL
AU2007328614B2 (en) 2006-12-07 2010-08-26 Lg Electronics Inc. A method and an apparatus for processing an audio signal
JP2010518452A (ja) * 2007-02-13 2010-05-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
JP5220840B2 (ja) * 2007-03-30 2013-06-26 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート マルチチャネルで構成されたマルチオブジェクトオーディオ信号のエンコード、並びにデコード装置および方法
US8175295B2 (en) 2008-04-16 2012-05-08 Lg Electronics Inc. Method and an apparatus for processing an audio signal
EP2111062B1 (en) 2008-04-16 2014-11-12 LG Electronics Inc. A method and an apparatus for processing an audio signal
KR101061128B1 (ko) 2008-04-16 2011-08-31 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
KR101614160B1 (ko) * 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
HUE041788T2 (hu) * 2008-10-06 2019-05-28 Ericsson Telefon Ab L M Eljárás és berendezés igazított többcsatornás hang szállítására
EP2214161A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal
WO2011061174A1 (en) * 2009-11-20 2011-05-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear combination parameter
CN102157151B (zh) 2010-02-11 2012-10-03 华为技术有限公司 一种多声道信号编码方法、解码方法、装置和系统
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
KR101963440B1 (ko) 2012-06-08 2019-03-29 삼성전자주식회사 복수의 뉴런 회로들을 이용하여 음원의 방향을 추정하는 뉴로모픽 신호 처리 장치 및 그 장치를 이용한 방법
US9190065B2 (en) * 2012-07-15 2015-11-17 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
US9336791B2 (en) * 2013-01-24 2016-05-10 Google Inc. Rearrangement and rate allocation for compressing multichannel audio
RU2667377C2 (ru) * 2013-04-26 2018-09-19 Сони Корпорейшн Способ и устройство обработки звука и программа
CN105657633A (zh) 2014-09-04 2016-06-08 杜比实验室特许公司 生成针对音频对象的元数据
RU2687882C1 (ru) 2016-03-15 2019-05-16 Фраунхофер-Гезеллшафт Цур Фёрдерунг Дер Ангевандтен Форшунг Е.В. Устройство, способ формирования характеристики звукового поля и машиночитаемый носитель информации
KR101695432B1 (ko) * 2016-08-10 2017-01-23 (주)넥스챌 무대 공연을 위한 방위각 생성 및 방위각 음상 정보 전달 장치 및 그 방법

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6128597A (en) 1996-05-03 2000-10-03 Lsi Logic Corporation Audio decoder with a reconfigurable downmixing/windowing pipeline and method therefor
US5946352A (en) 1997-05-02 1999-08-31 Texas Instruments Incorporated Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain
US6016473A (en) 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
US7660424B2 (en) * 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US20030014243A1 (en) 2001-07-09 2003-01-16 Lapicque Olivier D. System and method for virtual localization of audio signals
JP4714416B2 (ja) 2002-04-22 2011-06-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間的オーディオのパラメータ表示
US7257231B1 (en) * 2002-06-04 2007-08-14 Creative Technology Ltd. Stream segregation for stereo signals
US20030223602A1 (en) * 2002-06-04 2003-12-04 Elbit Systems Ltd. Method and system for audio imaging
SE0400997D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100829560B1 (ko) 2006-08-09 2008-05-14 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 방법 및 장치,멀티채널이 다운믹스된 신호를 2 채널로 출력하는 복호화방법 및 장치
US8867751B2 (en) 2006-08-09 2014-10-21 Samsung Electronics Co., Ltd. Method, medium, and system encoding/decoding a multi-channel audio signal, and method medium, and system decoding a down-mixed signal to a 2-channel signal
WO2015129977A1 (ko) * 2014-02-27 2015-09-03 전자부품연구원 대역별 정확도에 따른 가중 평균을 이용한 음원 위치 검출 방법 및 장치

Also Published As

Publication number Publication date
US20080167880A1 (en) 2008-07-10
CN101002261B (zh) 2012-05-23
CN101002261A (zh) 2007-07-18
US7783495B2 (en) 2010-08-24
DE602005023738D1 (de) 2010-11-04
ATE482451T1 (de) 2010-10-15
KR20060049941A (ko) 2006-05-19

Similar Documents

Publication Publication Date Title
KR100663729B1 (ko) 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치
KR101117336B1 (ko) 오디오 신호 부호화 장치 및 오디오 신호 복호화 장치
KR101395254B1 (ko) 부가정보 비트스트림 변환을 포함하는 다양한 채널로 구성된 다객체 오디오 신호의 부호화 및 복호화 장치 및 방법
KR101662681B1 (ko) 멀티채널 오디오 인코더 및 멀티채널 오디오 신호 인코딩 방법
US7719445B2 (en) Method and apparatus for encoding/decoding multi-channel audio signal
EP2612322B1 (en) Method and device for decoding a multichannel audio signal
EP1779385B1 (en) Method and apparatus for encoding and decoding multi-channel audio signal using virtual source location information
RU2608847C1 (ru) Кодирование звуковых сцен
Moon et al. A multi-channel audio compression method with virtual source location information for MPEG-4 SAC
US20130343551A1 (en) Method and apparatus for encoding/decoding stereo audio
US8706508B2 (en) Audio decoding apparatus and audio decoding method performing weighted addition on signals
KR101662682B1 (ko) 채널간 차이 추정 방법 및 공간적 오디오 코딩 장치
WO2006041137A1 (ja) 音響信号符号化装置及び音響信号復号装置
US20120163608A1 (en) Encoder, encoding method, and computer-readable recording medium storing encoding program
JP6686015B2 (ja) オーディオ信号のパラメトリック混合
KR20110018108A (ko) 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
Cheng et al. A spatial squeezing approach to ambisonic audio compression
EP4315324A1 (en) Combining spatial audio streams
Jang et al. Sound source location cue coding system for compact representation of multi-channel audio
KR20070108314A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
N231 Notification of change of applicant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121129

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20131128

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20141010

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20151120

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20161114

Year of fee payment: 11

LAPS Lapse due to unpaid annual fee