KR100755471B1 - 가상음원위치정보에 기반한 채널간 크기 차이 양자화 및역양자화 방법 - Google Patents

가상음원위치정보에 기반한 채널간 크기 차이 양자화 및역양자화 방법 Download PDF

Info

Publication number
KR100755471B1
KR100755471B1 KR1020060066822A KR20060066822A KR100755471B1 KR 100755471 B1 KR100755471 B1 KR 100755471B1 KR 1020060066822 A KR1020060066822 A KR 1020060066822A KR 20060066822 A KR20060066822 A KR 20060066822A KR 100755471 B1 KR100755471 B1 KR 100755471B1
Authority
KR
South Korea
Prior art keywords
cld
quantization
vsli
channel
audio
Prior art date
Application number
KR1020060066822A
Other languages
English (en)
Other versions
KR20070011136A (ko
Inventor
서정일
강경옥
홍진우
김광기
백승권
한민수
전상배
성굉모
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to AT06783342T priority Critical patent/ATE511691T1/de
Priority to CN2006800259842A priority patent/CN101223598B/zh
Priority to JP2008522700A priority patent/JP4685165B2/ja
Priority to EP06783342A priority patent/EP1905034B1/en
Priority to PCT/KR2006/002824 priority patent/WO2007011157A1/en
Publication of KR20070011136A publication Critical patent/KR20070011136A/ko
Application granted granted Critical
Publication of KR100755471B1 publication Critical patent/KR100755471B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 멀티채널 오디오 신호의 공간 오디오 부호화(SAC: Spatial Audio Coding) 및 이에 따라 생성된 오디오 비트스트림의 복호화에 관한 것으로서, 구체적으로는 멀티채널 오디오 신호의 SAC-기반 부호화시에 공간 파라미터로 이용되는 채널간 크기 차이(Channel Level Difference: CLD)의 효율적인 양자화 및 역양자화에 관한 것이다.
본 발명에 따른 CLD 양자화 방법은 N-채널(N>1) 오디오 신호로부터 서브밴드별 CLD를 추출하는 단계와, N-채널 오디오 신호의 가상음원위치정보(virtual source location information: VSLI) 양자화값으로부터 도출된 CLD 양자화값을 이용하여 설계된 VSLI-기반 CLD 양자화 테이블을 참조하여 상기 CLD를 양자화하는 단계를 포함한다.
공간 오디오 부호화(SAC: Spatial Audio Coding), 가상음원위치정보(VirtualSource Location Information: VSLI), 채널간 신호 차이(Channel Level Difference: CLD), 양자화, 허프만 부호화

Description

가상음원위치정보에 기반한 채널간 크기 차이 양자화 및 역양자화 방법{Virtual source location information based channel level difference quantization and dequantization method}
도 1a 및 1b는 멀티채널 신호들로부터 채널간 크기 차이(channel level difference: CLD) 값을 추출하는 과정을 개념적으로 도시한 도면.
도 2는 본 발명이 적용될 공간 오디오 부호화(spatial audio coding: SAC) 시스템의 구성을 개략적으로 도시한 도면.
도 3a 및 도 3b는 본 발명에 따라 CLD 양자화 기준이 되는 가상음원위치정보(virtual source locaton information: VSLI)의 개념을 설명하기 위한 도면.
도 4는 본 발명에 따라 VSLI 양자화값으로부터 도출된 CDL 양자화값을 그래프로 표현한 도면.
본 발명은 멀티채널 오디오 신호의 공간 오디오 부호화(SAC: Spatial Audio Coding) 및 이에 따라 생성된 오디오 비트스트림의 복호화에 관한 것으로서, 구체적으로는 멀티채널 오디오 신호의 SAC-기반 부호화시에 공간 파라미터로 이용되는 채널간 크기 차이(Channel Level Difference: CLD)의 효율적인 양자화 및 역양자화에 관한 것이다.
공간 오디오 부호화(SAC)는 기존의 스테레오 오디오 시스템과 호환성을 유지하면서 멀티채널 오디오 신호를 효과적으로 압축하기 위한 기술이다. MPEG에서는 2002년부터 "MPEG Surround"란 이름으로 SAC 기술에 대한 표준화가 진행중이다. SAC에 대한 구체적인 기술적 사항은 ISO/IEC의 작업문서 ISO/IEC CD 14996-x(이하, "SAC 표준 문서"라 함, 2005년 2월 18일 공개됨)에 상세히 기재되어 있으므로, 이를 참조하기 바란다.
구체적으로, SAC 기법은 N(N>2)개의 멀티채널 오디오 신호를 모노 또는 스테레오로 합쳐진 다운믹스 신호와 멀티채널 오디오 신호에 대한 인간의 지각 특성을 나타내는 부가적인 공간 파라미터 집합을 이용하여 부호화함으로써 전송 효율을 향상시키는 부호화 기법이다. 공간 파라미터로서, 시간-주파수에 따른 2개 채널간 크기 차이(Channel Level Difference:CLD), 시간-주파수에 따른 2개 채널간 유사도(Inter channel Correlation/Coherences: ICC), 예측에 의해 2개 채널로부터 제3 채널의 재생을 가능하게 하기 위한 채널예측계수(Channel Prediction Coefficient: CPC) 등이 이용될 수 있다.
CLD는 각 채널의 파워 이득을 복원하는데 핵심이 되는 요소로서, SAC 부호화 과정에서 CLD를 추출하는 방식에는 여러 가지가 있다. 도 1a에 도시된 바와 같이, 1개의 기준 채널에 기반하여 기준채널과 나머지 다른 채널간의 파워비로 CLD를 표현하는 방식이 있다. 예를 들어, 6개의 채널 신호(L,R, C, LFE, Ls, Rs)가 존재할 경우에, 1개의 기준채널로부터 5개의 파워비를 얻을 수 있으며 각각에 상용로그를 취한 값이 CLD1 내지 CLD5에 해당한다.
한편, 도 1b에 도시된 바와 같이, 멀티채널을 여러 개의 채널 쌍으로 나누어 각 쌍을 스테레오 기반으로 해석하고 각각의 해석 단계에서 1개의 CLD값을 추출하는 방식이 있다. 이는 2개의 입력 채널을 취하여 1개의 출력 채널을 산출하는 복수의 OTT(One-To-Two) 모듈들을 단계적으로 이용하여 이루어지는데, 각 OTT에서는 입력된 스테레오 신호중 하나의 신호를 기준 채널로 인지하고 또다른 채널과의 파워비의 상용로그값을 CLD값으로 출력한다.
CLD 값은 그 변위 범위(dynamic range)가 에서 이기 때문에 한정된 비트수로 표현하기 위해서는 효율적인 양자화가 필요하다. 통상적으로, 정규화된 양자화 테이블을 이용하여 CLD 양자화를 수행하게 된다. 이러한 양자화 테이블의 일예가 SAC 표준 문서에 기재되어 있다(SAC 표준 문서 41쪽, 테이블 57 참조). 이와 같이, 한정된 비트수만으로는 CLD의 전체 값을 표현할 수 없으므로, CLD의 변위 범위를 일정값 이하로 제한하게 됨에 따라, 양자화 오차가 발생하고 이에 따라 스펙트럼 정보의 왜곡현상이 발생한다. 예를 들어, CLD 양자화에 5 비트를 이용한다고 할 때, CLD의 변위 범위는 -25dB에서 +25 dB로 제한될 것이다.
따라서, 본 발명의 목적은 멀티채널 오디오 신호의 SAC-기반 부호화 과정에 서 청각적 열화를 최소화시킬 수 있는 CLD 양자화 및 역양자화 방법을 제공하는 것이다.
본 발명의 다른 목적은 멀티채널 오디오 신호의 SAC-기반 부호화 과정에서 CLD와 교체가능한 가상음원위치정보(virtual source location information: VSLI)의 양자화 장점을 이용하여 청각적 열화를 최소화시킬 수 있는 CLD 양자화 및 역양자화 방법을 제공하는 것이다.
본 발명의 또다른 목적은 MPEG-4 SAC 시스템에서 CLD 양자화 및 역양자화에 이용되는 CLD 양자화 테이블을 교체할 수 있는 VSLI-기반 CLD 양자화 테이블을 제공함으로써 부가적인 복잡도의 증가없이 음질을 향상시키는 것이다.
전술한 목적을 달성하기 위해, 본 발명의 제1 측면에 따르면, N-채널(N>1) 오디오 신호를 공간 오디오 부호화(Spatial Audio coding: SAC) 방식에 기반한 부호화시에 공간 파라미터로 이용되는 채널간 레벨 차이(Channel Level Difference: CLD) 파라미터를 양자화하기 위한 방법이 제공된다. 상기 방법은, 상기 N-채널 오디오 신호로부터 서브밴드별 CLD를 추출하는 단계와, N-채널(N>1) 오디오 신호의 가상음원위치정보(VSLI) 양자화값으로부터 도출된 CLD 양자화값을 이용하여 설계된 VSLI-기반 CLD 양자화 테이블을 참조하여 상기 CLD를 양자화하는 단계를 포함한다.
본 발명의 제2 측면에 따르면, 전술한 CLD 양자화 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터에 의해 판독가능한 기록매체가 제공된다.
본 발명의 제3 측면에 따르면, N-채널 오디오 신호(N>1)를 공간 오디오 부호 화(SAC) 방식에 근거하여 부호화하기 위한 방법이 제공되고, 상기 방법은, 상기 N-채널 오디오 신호를 다운믹싱 및 부호화하는 단계와, 상기 N-채널 오디오 신호로부터 채널간 크기 차이(CLD), 채널간 유사도(Inter channel Correlation/Coherences: ICC) 및 채널예측계수(Channel Prediction Coefficient: CPC)를 포함하는 공간 파라미터를 서브밴드별로 추출하는 단계와, 상기 추출된 공간 파라미터를 양자화하는 단계를 포함하고, 상기 양자화 단계에서 상기 CLD는 N-채널(N>1) 오디오 신호의 가상음원위치정보(VSLI) 양자화값으로부터 도출된 CLD 양자화값을 이용하여 설계된 VSLI-기반 CLD 양자화 테이블을 참조하여 양자화되는 것을 특징으로 한다.
본 발명의 제4 측면에 따르면, N-채널 오디오 신호(N>1)를 공간 오디오 부호화(SAC) 방식에 근거하여 부호화하기 위한 장치가 제공된다. 상기 부호화 장치는 상기 N-채널 오디오 신호를 다운믹싱하여 다운믹스 신호를 생성하고 상기 N-채널 오디오 신호로부터 채널간 크기차이(CLD), 채널간 유사도(ICC) 및 채널예측계수(CPC)를 포함하는 공간 파라미터를 서브밴드별로 추출하기 위한 SAC 부호화 수단과, 상기 SAC 부호화 수단으로부터 생성된 다운믹스 신호로부터 압축된 오디오 비트스트림을 생성하기 위한 오디오 부호화 수단과, 상기 SAC 부호화 수단으로부터 생성된 공간 파라미터를 양자화하기 위한 공간 파라미터 양자화 수단과, 상기 양자화된 공간 파라미터값을 부호화하기 위한 공간 파라미터 부호화 수단을 포함하고, 상기 양자화 수단은 상기 CLD를 N-채널(N>1) 오디오 신호의 가상음원위치정보(VSLI) 양자화값으로부터 도출된 CLD 양자화값을 이용하여 설계된 VSLI-기반 CLD 양자화 테이블을 참조하여 양자화하는 것을 특징으로 한다.
본 발명의 제5 측면에 따르면, 공간 오디오 부호화(SAC) 방식에 기반하여 부호화된 N-채널(N>1) 오디오 비트스트림의 복호화시에 부호화된 채널간 크기 차이(CLD) 양자화값을 역양자화하기 위한 방법이 제공된다. 상기 부호화된 CLD 양자화 값을 허프만 복호화하는 단계와, N-채널(N>1) 오디오 신호의 가상음원위치정보(VSLI) 양자화값으로부터 도출된 CLD 양자화값을 이용하여 설계된 VSLI-기반 CLD 양자화 테이블을 이용하여 상기 복호화된 CLD 양자화 값을 역양자화하는 단계를 포함한다.
본 발명의 제6 측면에 따르면 전술한 CLD 역양자화 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터에 의해 판독가능한 기록매체가 제공된다.
본 발명의 제7 측면에 따르면, 공간 오디오 부호화(SAC) 방식에 기반하여 부호화된 N-채널(N>1) 오디오 비트스트림의 복호화 방법이 제공된다. 상기 방법은, 상기 부호화된 오디오 비트스트림을 복호화하는 단계와, 상기 부호화된 오디오 비트스트림과 함께 수신된 공간 파라미터의 양자화값을 역양자화하는 단계와, 상기 역양자화된 공간 파라미터에 기반하여 상기 복호화된 오디오 비트스트림을 합성하여 N-채널 오디오 신호를 복원하는 단계를 포함하고,상기 공간 파라미터의 양자화값을 역양자화하는 단계에서 상기 공간 파라미터에 포함되는 CLD는 N-채널(N>1) 오디오 신호의 가상음원위치정보(VSLI) 양자화값으로부터 도출된 CLD 양자화값을 이용하여 설계된 VSLI-기반 CLD 양자화 테이블을 참조하여 역양자화되는 것을 특징으로 한다.
본 발명의 제8 측면에 따르면, 공간 오디오 부호화(SAC) 방식에 기반하여 부 호화된 N-채널(N>1) 오디오 비트스트림을 복호화하기 위한 장치가 제공된다. 상기 장치는, 상기 부호화된 오디오 비트스트림을 복호화하기 위한 수단과, 상기 부호화된 오디오 비트스트림과 함께 수신된 부호화된 공간 파라미터의 양자화값을 복호화하기 위한 수단과, 상기 복호화된 공간 파라미터의 양자화값을 역양자화하기 위한 수단과, 상기 역양자화된 공간 파라미터에 기반하여 상기 복호화된 오디오 비트스트림을 합성하여 N-채널 오디오 신호를 복원하기 위한 수단을 포함하고, 상기 공간 파라미터의 양자화값을 역양자화하기 위한 수단은 상기 공간 파라미터에 포함되는 CLD를 N-채널(N>1) 오디오 신호의 가상음원위치정보(VSLI) 양자화값으로부터 도출된 CLD 양자화값을 이용하여 설계된 VSLI-기반 CLD 양자화 테이블을 참조하여 역양자화하는 것을 특징으로 한다.
이하에서는 본 발명을 첨부된 도면에 도시된 실시예들과 관련하여 예시적으로 상세히 설명하겠다. 그러나, 이하의 상세한 설명은 단지 예시적인 목적으로 제공되는 것이며 본 발명의 개념을 임의의 특정된 물리적 구성에 한정하는 것으로 해석되어서는 안 될 것이다.
도 2는 본 발명이 적용될 공간 오디오 부호화(SAC) 시스템의 구성을 개략적으로 도시한 도면이다. 도시된 바와 같이, SAC 시스템은 N-채널 오디오 신호로부터 다운믹스 신호 및 공간 파라미터를 생성하고 이를 부호화하여 전송하는 부호화측과, 부호화측으로부터 전송된 오디오 비트스트림 및 공간 파라미터를 이용하여 N-채널 오디오 신호를 복원하는 복호화측으로 나뉠 수 있다. 부호화측에는 SAC 부호화기(210), 오디오 부호화기(220), 공간 파라미터 양자화기 및 부호화기(230, 240)가 포함되며, 복호화측에는 오디오 복호화기(250), 공간 파라미터 복호화 및 역양자화기(250, 260), SAC 복호화기(260)가 포함된다.
SAC 부호화기(210)는 입력받은 N-채널 오디오 신호로부터 다운믹스 신호를 생성하고, N-채널 오디오 신호에 대한 공간 특성들을 분석함으로써 채널간 크기 차이(CLD), 채널간 유사도(ICC), 채널 예측 계수(CPC) 등과 같은 공간 파라미터를 추출한다.
구체적으로, SAC 부호화기(210)에 입력된 N(N>1)개의 멀티채널 신호는 해석 필터뱅크(analysis filter bank)에 의해 주파수 밴드로 분해된다. 주파수 영역의 서브 밴드로 분할하는 방법으로서 낮은 복잡도로 이를 수행하기 위하여 QMF (quadrature mirror filter)가 사용된다. 서브밴드 신호들로부터 공간 지각과 관련된 공간 특성들을 해석하며, 채널 간 크기 차이(CLD), 채널 간 유사도(ICC), 채널 예측 계수(CPC) 등의 공간 파라미터들이 부호화 동작 모드에 따라 선택적으로 추출된다. 또한, 서브밴드 신호들은 다운믹싱되고 QMF 합성 뱅크를 통해 시간영역의 다운믹스 신호로 변환된다.
대안적으로, 다운믹스 신호는 음향엔지니어에 의해 사전-제작된 다운믹스(artistic/hand-mixed downmix) 신호로 대체될 수 있다. 이 때, SAC부호화기(210)에서는 제공된 다운믹스 신호에 기반하여 공간 파라미터를 조정한 후 전송함으로써 복호화기에서의 멀티채널 복원을 최적화한다.
오디오 부호화기(220)는 SAC 부호화기(210)로부터 생성되거나 사전-제작된 다운믹스 신호를 기존의 오디오 압축 기술(예, MPEG-4 AAC, MPEG-4 HE-AAC 및 MPEG-4 BSAC 등)을 이용하여 압축함으로써 압축된 오디오 비트스트림을 생성한다.
한편, SAC 부호화기(210)에 의해 생성된 공간 파라미터들은 공간 파라미터 양자화기 및 부호화기(230, 240)에 의해 양자화 및 부호화되어 전송된다. 공간 파라미터 양자화기(230)는 공간 파라미터로 이용되는 CLD, ICC, CPC 각각의 양자화에 이용될 양자화 테이블을 구비한다. 후술하는 바와 같이, 공간 파라미터 양자화기(230)에 기존의 정규화된 CLD 양자화 테이블을 이용하여 CLD를 양자화함에 따른 청각적 열화를 최소화시키기 위해 본 발명에서 제안하는 VSLI-기반 CLD 양자화 테이블이 이용될 수 있다.
공간 파라미터 부호화기(240)는 양자화기(230)에 의해 양자화된 공간 파라미터값들을 압축하기 위해 엔트로피 부호화를 수행한다. 바람직하게는 허프만 코드북을 이용하여 공간 파라미터의 양자화 인덱스에 대한 허프만 부호화가 수행될 수 있다. 후술하는 바와 같이, 본 발명에서는 CLD 양자화 인덱스의 전송 효율을 최대화시키기 위해 새로운 허프만 코드북을 제안한다.
오디오 복호화기(250)는 기존의 오디오 압축 기술(예, MPEG-4 AAC, MPEG-4 HE-AAC 및 MPEG-4 BSAC 등)을 통해 압축된 오디오 비트스트림을 복호화한다.
공간 파라미터 복호화기 및 역양자화기(260, 270)는 양자화기 및 부호화기(230, 240)에 의해 수행된 양자화 및 부호화의 역과정을 수행하는 모듈들이다. 복호화기(260)는 허프만 코드북에 기반하여 부호화된 공간 파라미터의 양자화 인덱 스를 복호화하고 역양자화기(270)는 양자화 테이블로부터 양자화 인덱스에 대응하는 공간파라미터 값을 구한다. 공간 파라미터의 양자화 및 부호화와 마찬가지로, 공간 파라미터의 복호화 및 역양자화 과정에서도 본 발명에 제안하는 VSLI-기반 CLD 양자화 테이블 및 허프만 코드북이 이용될 것이다.
SAC 복호화기(280)는 오디오 복호화기(250)에 의해 복호화된 오디오 비트 스트림과 역양자화기(270)에 의해 구해진 공간 파라미터를 합성하여 N개의 멀티채널 오디오 신호를 복원한다. 대안적으로, 멀티채널 오디오의 복호화가 불가능한 경우에는 기존의 오디오 복호화기를 이용하여 다운믹스 신호만을 복호화할 수 있으므로 독립적인 서비스가 가능하다. 따라서, 기존의 모노 또는 스테레오 오디오 부호화 시스템과 호환성을 제공할 수 있다.
본 발명의 핵심은 멀티채널 오디오 신호의 공간상 오디오 이미지를 표현하는 가상음원위치정보(VSLI)의 양자화 장점을 활용하여 양자화에 의한 청각적 열화를 최소화시킬 수 있는 CLD 양자화 및 이에 따라 산출된 CLD 양자화 테이블을 제공하는 것이다. 본 발명은 공간상 오디오 이미지의 방위각 표현에 있어서 3도 이내의 오차는 인간의 청각이 인지하기 힘들다는 점에 착안한다. 따라서, 방위각으로 표현되는 VSLI는 90도의 한정된 변위 범위를 가지므로 양자화하는데 있어서 변위 범위 제한으로 인해 발생하는 양자화 오차를 피할 수 있다. 이러한 VSLI의 양자화 장점에 기반하여 CLD 양자화 테이블을 설계한다면 양자화에 의한 청각적 열화를 최소화시킬 수 있을 것이다.
도 3a 및 도 3b는 본 발명에 따라 CLD 양자화의 기준이 되는 가상음원위치정 보(VSLI)의 개념을 설명하기 위한 도면이다. 도 3a는 2개의 스피커가 60도의 각을 이루는 스테레오 스피커 환경을 도시한 도면이고, 도 3b는 도 3a에 도시된 스테레오 스피커 환경에서의 스테레오 오디오 신호를 다운믹스된 신호의 파워와 가상 음원 위치 정보(VSLI)로 표현한 도면이다. 도시된 바와 같이, 스테레오 또는 멀티채널 오디오 신호는 다운믹스 오디오 신호의 크기 벡터와 멀티채널 오디오 신호의 채널별 파워를 분석함으로써 얻을 수 있는 가상음원위치정보(VSLI)로 표현될 수 있다. 이렇게 표현된 멀티채널 오디오 신호는 크기 벡터를 음원의 위치 벡터에 따라 투사시킴으로써 복원될 수 있다.
도 3a 및 도 3b에 도시된 바와 같이, 왼쪽 스피커에서 나오는 신호의 파워를 PL , 오른 쪽에서 나오는 신호의 파워를 PR이라고 하고, 왼쪽 스피커와 오른쪽 스피커의 각을 각각 AL과 AR이라고 하면 음원의 VSLI는 수학식 1과 수학식 2로 구할 수 있다.
Figure 112006050802476-pat00001
Figure 112006050802476-pat00002
이렇게 구한 VSLI는 AL과 AR 사이의 값을 가지며, VSLI로부터 PL과 PR은 다음과 같이 복원될 수 있다. 먼저 VSLI를 수학식 3과 같이 CPP(Constant Power Panning) 법칙을 이용하여 0도에서 90도 사이의 값(VSLI')으로 매핑한다.
Figure 112006050802476-pat00003
이렇게 매핑된 VSLI'와 다운믹스된 신호의 파워 PD를 이용하여 수학식 4와 수학식 5와 같이 PL과 P R을 구한다
Figure 112006050802476-pat00004
Figure 112006050802476-pat00005
앞서 설명한 바와 같이, 본 발명의 핵심은 전술한 VSLI의 양자화 장점을 공간 파라미터인 CLD 양자화에 적용시키는데 있다. 도 3a의 스테레오 스피커 환경에서 CLD는 수학식 6과 같이 표현될 수 있다.
Figure 112006050802476-pat00006
CLD는 VSLI로부터 수학식 7에 따라 도출될 수 있다.
Figure 112006050802476-pat00007
또한, 다음 수학식에 정의된 바와 같이, CLD는 가상음원위치정보(VSLI)에 상용로그 대신 자연로그를 취하여 구해질 수도 있다.
Figure 112006050802476-pat00008
상기 수학식 7 또는 8에 따라 구해진 CLD값은 일반적인 SAC 시스템의 공간 파라미터로서 바로 사용가능하다.
앞서 설명한 바와 같이, CLD는 -∞에서 ∞의 변위 범위를 가지므로 한정된 비트 수를 가지고 양자화 하는데 있어서 문제점이 발생한다. 대표적인 것이 변위 범위 제한으로 인해 생기는 양자화 오차이다. 한정된 비트 수를 가지고 CLD의 전체 변위 범위를 표현할 수 없으므로 CLD의 변위 범위를 일정 값 이하로 제한을 하게 된다. 이로 인해 양자화 오차가 발생하게 되고 스펙트럼 정보 왜곡현상이 생기게 된다. CLD 양자화에 5 비트를 사용한다고 했을 때 CLD의 변위 범위는 일반적으로 -25dB 에서 +25dB로 제한된다.
이에 반해 VSLI는 90도라는 한정된 변위 범위를 가지므로 양자화 하는데 있 어서 변위 범위 제한으로 인해 발생하는 양자화 오차를 피할 수 있다.
일실시예에서, VSLI 양자화시에 CLD 양자화에 사용되는 5 비트를 그대로 사용하고 선형 양자화기를 적용했을 경우 양자화 레벨은 31이 되고 양자화 간격은 3도가 된다. 인간이 오디오 신호의 공간상 이미지를 인지하는데 있어서 3도 이하의 차이는 인지하지 못한다는 사실로부터 VSLI 양자화 기법의 타당성을 확인할 수 있다.
이러한 VSLI가 가지는 양자화의 장점을 스테레오 코딩 방법의 CLD 양자화에 적용함으로써 기존의 SAC 시스템에서 이용된 CLD 양자화 테이블을 VSLI-기반 CLD 양자화 테이블로 교체할 수 있다.
일실시예에서, VSLI를 3도의 양자화 간격으로 5 비트 선형 양자화한 VSLI 양자화 값과 이에 대응하는 CLD 변환 값은 표 1과 같다.
Figure 112006050802476-pat00009
또한, VSLI 양자화를 위한 VSLI 경계값(decision level)은 인접 양자화 값들 사이의 중간 값으로 결정되며, 이 중간 값을 CLD로 변환하여 CLD 양자화의 경계 값으로 이용된다. VSLI 기반의 CLD 양자화 경계 값은 일반적인 CLD 양자화에서의 경계 값이 인접 양자화 값의 중간 값을 가지는 것과는 달리 표 2에서 보는 바와 같이 인접 양자화 값의 중간 값이 아닌 다른 값을 갖게 된다.
도 4는 본 발명에 따라 VSLI의 양자화값으로부터 변환된 CDL 양자화값을 그래프로 표현한 도면이다. 도시된 바와 같이, 45도를 기준으로 균일한 각도로 VSLI를 양자화한 경우에 양자화된 각들 사이의 경계값은 두 각사이의 중간값이 되지만, 이러한 VSLI 경계값을 CLD 값으로 변환하면 인접한 두 CLD값의 중간값이 아닌 다른 값으로 표현됨을 알 수 있다. 하기의 표 2는 VSLI 양자화의 경계값과 이에 대응하는 CLD 변환값을 나타낸다.
Figure 112006050802476-pat00010
하기의 표 3 내지 7은 표 1과 표 2의 값들을 이용하여 생성된 VSLI 기반의 CLD 양자화 테이블을 나타내며, 표 3은 소수 넷째자리까지 CLD 양자화값을 표현하였으며, 표 4는, 소수 셋째자리, 표 5는 소수 둘째자리, 표 6은 소수 첫째자리까지, 표 7은 정수로 CLD 양자화값을 표현하였다.
VSLI를 이용한 CLD 양자화 변환 값은 상용로그 또는 자연로그를 취하여 구할 수 있다. 자연로그를 취한 경우, CLD 값을 이용하여 스펙트럼 정보를 복원할 때 밑을 10이 아닌 exponential을 사용하면 된다.
Figure 112006050802476-pat00011
Figure 112006050802476-pat00012
Figure 112006050802476-pat00013
Figure 112006050802476-pat00014
Figure 112006050802476-pat00015
다음, VSLI 기반의 CLD 양자화 테이블에 대한 각 소수점 자리별 경계 값은
표 8, 9, 10, 11, 12와 같다.
Figure 112006050802476-pat00016
Figure 112006050802476-pat00017
Figure 112006050802476-pat00018
Figure 112006050802476-pat00019
Figure 112006050802476-pat00020
표 7과 표 12에 기재된 바와 같이, CLD 양자화 및 양자화 경계값을 상용로그를 취하여 정수로 표현하는 경우에 일부의 CLD 양자화 값과 경계 값이 같아지는 문제점이 발생함을 알 수 있다. 따라서, 바람직하게는 자연로그를 이용한 CLD 양자화 값과 중간 값을 실제 양자화에 이용한다. 즉, 정수로 표현된 VSLI 기반의 CLD 양자화 테이블 및 양자화 경계값을 이용하고자 하는 경우에는 VSLI에 상용로그가 아닌 자연로그를 취함으로써 CLD 양자화값을 도출한다.
이와 같이 생성된 VSLI-기반 CLD 양자화 테이블을 도 2에 도시된 SAC 시스템의 공간 파라미터 양자화기(230) 및 역영자화기(270)에 채용함으로써 CLD 양자화 오차에 의한 청각적 열화를 최소화시킬 수 있다.
또한, 본 발명에서는 전술한 VSLI-기반 CLD 양자화 테이블에 기반하여 도출된 CLD의 양자화 인덱스에 대한 허프만 부호화를 최적화시킬 수 있는 허프만 코드북을 제안한다.
SAC 시스템에서 멀티채널 오디오 신호는 필터뱅크에 의해 주파수 영역의 서브밴드로 분할되어 처리된다. 20개의 서브밴드로 분할되어 처리되는 경우에, 이러한 서브밴드별 양자화 인덱스에 차분(differential) 코딩 방법을 적용하여 첫 번째 밴드의 양자화 인덱스와 나머지 19개 인접 밴드간의 차분 인덱스로 분류한다. 대안적으로, 인접한 프레임간의 차분 인덱스로도 나눌 수 있다. 이렇게 분류된 3 종류의 인덱스 각각에 대해 확률 분포를 계산한 후 허프만 코딩 방법을 적용하여 하기의 표 13, 14에 기재된 허프만 코드북을 얻을 수 있다. 표 13은 첫번째 밴드의 인덱스에 대한 허프만 코드북이고, 표 14는 나머지 인접밴드간의 차분 인덱스에 대한 허프만 코드북이다.
Figure 112006050802476-pat00021
Figure 112006050802476-pat00022
이와 같이 본 발명에서 제안하는 허프만 코드북을 도 2에 도시된 SAC 시스템의 공간 파라미터 부호화기(240) 및 복호화기(260)에 채용함으로써 CLD 양자화 인덱스를 전송하는데 필요한 비트율을 줄일 수 있다.
대안적으로, 20개의 서브밴드에 허프만 부호화에 사용되는 비트수가 100이 넘으면 각 서브밴드별 5비트 PCM 코딩을 수행할 수 있다.
본 발명은 하나 이상의 제조물상에 구현된 하나 이상의 컴퓨터 판독가능 매체로서 제공될 수 있다. 제조물은, 플로피 디스크, 하드 디스크, CD ROM, 플래시 메모리 카드,PROM, RAM, ROM, 또는 자기 테이프를 들 수 있다. 일반적으로, 컴퓨터 판독가능 프로그램은 임의의 프로그래밍 언어로 구현될 수 있다. 사용될 수 있는 언어의 일부 예에는 C, C++, 또는 JAVA가 포함된다.
이상에서, 특정 실시예와 관련하여 본 발명을 설명하였으나, 본 발명은 전술한 실시예 및 첨부된 도면에 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서, 여러 치환, 변형 및 변경이 가능하다는 것이 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.
본 발명에 따라 생성된 VSLI-기반 CLD 양자화 테이블은 기존의 SAC 시스템에서 이용되는 CLD 양자화 테이블 대신에 이용될 수 있다. 본 발명에 따른 CLD 양자화 테이블을 이용함으로써 청각적 열화를 최대한 방지할 수 있으며, CLD 인덱스의 압축을 위해 본 발명에서 제안하는 허프만 코드북을 이용함으로써 CLD를 전송하는데 필요한 비트율을 감소시킬 수 있다.

Claims (26)

  1. N-채널(N>1) 오디오 신호를 공간 오디오 부호화(Spatial Audio coding: SAC) 방식에 기반한 부호화시에 공간 파라미터로 이용되는 채널간 레벨 차이(Channel Level Difference: CLD) 파라미터를 양자화하기 위한 방법에 있어서,
    상기 N-채널 오디오 신호로부터 서브밴드별 CLD를 추출하는 단계와,
    N-채널(N>1) 오디오 신호의 가상음원위치정보(virtual source location information: VSLI) 양자화값으로부터 도출된 CLD 양자화값을 이용하여 설계된 VSLI-기반 CLD 양자화 테이블을 참조하여 상기 CLD를 양자화하는 단계
    를 포함하는 CLD 양자화 방법.
  2. 제1항에 있어서, 상기 VSLI의 양자화값은 0도에서 90도 사이에서 일정한 양자화 간격으로 양자화된 CLD 양자화 방법.
  3. 제2항에 있어서, 상기 일정한 양자화 간격은 3도인 CLD 양자화 방법.
  4. 제1항에 있어서, 상기 CLD 양자화값은 다음 수식에 따라 VSLI 양자화값으로부터 도출되는 CLD 양자화 방법.
    Figure 112006050802476-pat00023
  5. 제1항에 있어서, 상기 CLD 양자화값은 다음 수식에 따라 VSLI 양자화값으로부터 도출되는 CLD 양자화 방법.
    Figure 112006050802476-pat00024
  6. 제1항에 있어서, 상기 CLD 양자화를 위한 경계값(decision level)은 VSLI 양자화를 위한 VSLI 경계값으로부터 도출되는 CLD 양자화 방법.
  7. 제1항에 있어서, 상기 VSLI-기반 CLD 양자화 테이블은
    Figure 112006050802476-pat00025
    인 CLD 양자화 방법.
  8. 제7항에 있어서, 상기 VSLI-기반 CLD 양자화 테이블에 연관된 CLD 양자화 경계값은
    Figure 112006050802476-pat00026
    인 CLD 양자화 방법.
  9. 제1항에 있어서, 상기 CLD의 양자화 인덱스에 대하여 허프만 부호화를 수행하는 단계를 더 포함하는 CLD 양자화 방법.
  10. 제9항에 있어서, 상기 허프만 부호화는 제1 서브밴드의 양자화 인덱스에 대하여 하기 허프만 코드북
    Figure 112006050802476-pat00027
    을 참조하여 수행되는 CLD 양자화 방법.
  11. 제10항에 있어서, 상기 허프만 부호화는 상기 제1 서브밴드 이외의 나머지 서브밴드의 양자화 인덱스에 대하여 하기 허프만 코드북
    인덱스 비트수 코드워드(16진수) 인덱스 비트수 코드워드(16진수) 0 2 0x00003 16 10 0x00206 1 2 0x00001 17 10 0x00006 2 3 0x00005 18 11 0x0040e 3 3 0x00001 19 11 0x0000e 4 4 0x00009 20 12 0x0081f 5 4 0x00001 21 12 0x0001f 6 5 0x00011 22 13 0x0103c 7 5 0x00001 23 13 0x0003d 8 6 0x00021 24 14 0x0207a 9 6 0x00001 25 14 0x00079 10 7 0x00041 26 14 0x00078 11 7 0x00001 27 15 0x040f6 12 8 0x00080 28 16 0x081ef 13 8 0x00000 29 17 0x103dd 14 9 0x00102 30 17 0x103dc 15 9 0x00002
    을 참조하여 수행되는 CLD 양자화 방법.
  12. 제1항 내지 제11항중 어느 하나의 항에 따른 CLD 양자화 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터에 의해 판독가능한 기록매체.
  13. N-채널 오디오 신호(N>1)를 공간 오디오 부호화(SAC) 방식에 근거하여 부호화하기 위한 방법에 있어서,
    상기 N-채널 오디오 신호를 다운믹싱 및 부호화하는 단계와,
    상기 N-채널 오디오 신호로부터 채널간 크기 차이(CLD), 채널간 유사도(Inter channel Correlation/Coherences: ICC) 및 채널예측계수(Channel Prediction Coefficient: CPC)를 포함하는 공간 파라미터를 서브밴드별로 추출하는 단계와,
    상기 추출된 공간 파라미터를 양자화하는 단계를 포함하고,
    상기 양자화 단계에서 상기 CLD는 N-채널(N>1) 오디오 신호의 가상음원위치정보(VSLI) 양자화값으로부터 도출된 CLD 양자화값을 이용하여 설계된 VSLI-기반 CLD 양자화 테이블을 참조하여 양자화되는 것을 특징으로 하는 N-채널 오디오 신호의 SAC-기반 부호화 방법.
  14. N-채널 오디오 신호(N>1)를 공간 오디오 부호화(SAC) 방식에 근거하여 부호화하기 위한 장치에 있어서, 상기 장치는
    상기 N-채널 오디오 신호를 다운믹싱하여 다운믹스 신호를 생성하고 상기 N-채널 오디오 신호로부터 채널간 크기차이(CLD), 채널간 유사도(ICC) 및 채널예측계수(CPC)를 포함하는 공간 파라미터를 서브밴드별로 추출하기 위한 SAC 부호화 수단과,
    상기 SAC 부호화 수단으로부터 생성된 다운믹스 신호로부터 압축된 오디오 비트스트림을 생성하기 위한 오디오 부호화 수단과,
    상기 SAC 부호화 수단으로부터 생성된 공간 파라미터를 양자화하기 위한 공간 파라미터 양자화 수단과,
    상기 양자화된 공간 파라미터값을 부호화하기 위한 공간 파라미터 부호화 수단을 포함하고,
    상기 양자화 수단은 상기 CLD를 N-채널(N>1) 오디오 신호의 가상음원위치정 보(VSLI) 양자화값으로부터 도출된 CLD 양자화값을 이용하여 설계된 VSLI-기반 CLD 양자화 테이블을 참조하여 양자화하는 것을 특징으로 하는 SAC-기반 오디오 부호화 장치.
  15. 제14항에 있어서, 상기 VSLI-기반 CLD 양자화 테이블은
    Figure 112006050802476-pat00028
    인 SAC-기반 오디오 부호화 장치.
  16. 제15항에 있어서, 상기 VSLI-기반 CLD 양자화 테이블에 연관된 CLD 양자화 경계값은
    Figure 112006050802476-pat00029
    인 SAC-기반 오디오 부호화 장치.
  17. 공간 오디오 부호화(SAC) 방식에 기반하여 부호화된 N-채널(N>1) 오디오 비트스트림의 복호화시에 부호화된 채널간 크기 차이(CLD) 양자화값을 역양자화하기 위한 방법에 있어서,
    상기 부호화된 CLD 양자화 값을 허프만 복호화하는 단계와,
    N-채널(N>1) 오디오 신호의 가상음원위치정보(VSLI) 양자화값으로부터 도출된 CLD 양자화값을 이용하여 설계된 VSLI-기반 CLD 양자화 테이블을 이용하여 상기 복호화된 CLD 양자화 값을 역양자화하는 단계
    를 포함하는 CLD 역양자화 방법.
  18. 제17항에 있어서, 상기 VSLI-기반 CLD 양자화 테이블은
    Figure 112006050802476-pat00030
    인 CLD 역양자화 방법.
  19. 제18항에 있어서, 상기 VSLI-기반 CLD 양자화 테이블에 연관된 CLD 양자화 경계값은
    Figure 112006050802476-pat00031
    인 CLD 역양자화 방법.
  20. 제17항에 있어서, 상기 부호화된 CLD 양자화 값을 허프만 복호화하는 단계에서, 제1 서브밴드의 CLD 양자화값은 하기 허프만 코드북
    Figure 112006050802476-pat00032
    을 참조하여 복호화되는 CLD 역양자화 방법.
  21. 제20항에 있어서, 상기 부호화된 CLD 양자화 값을 허프만 복호화하는 단계에서, 상기 제1 서브밴드 이외의 나머지 밴드의 CLD 양자화값은 하기 허프만 코드북
    인덱스 비트수 코드워드(16진수) 인덱스 비트수 코드워드(16진수) 0 2 0x00003 16 10 0x00206 1 2 0x00001 17 10 0x00006 2 3 0x00005 18 11 0x0040e 3 3 0x00001 19 11 0x0000e 4 4 0x00009 20 12 0x0081f 5 4 0x00001 21 12 0x0001f 6 5 0x00011 22 13 0x0103c 7 5 0x00001 23 13 0x0003d 8 6 0x00021 24 14 0x0207a 9 6 0x00001 25 14 0x00079 10 7 0x00041 26 14 0x00078 11 7 0x00001 27 15 0x040f6 12 8 0x00080 28 16 0x081ef 13 8 0x00000 29 17 0x103dd 14 9 0x00102 30 17 0x103dc 15 9 0x00002
    을 참조하여 복호화되는 CLD 역양자화 방법.
  22. 제17항 내지 제21항중 어느 하나의 항에 따른 CLD 역양자화 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터에 의해 판독가능한 기록 매체.
  23. 공간 오디오 부호화(SAC) 방식에 기반하여 부호화된 N-채널(N>1) 오디오 비트스트림의 복호화 방법에 있어서,
    상기 부호화된 오디오 비트스트림을 복호화하는 단계와,
    상기 부호화된 오디오 비트스트림과 함께 수신된 공간 파라미터의 양자화값을 역양자화하는 단계와,
    상기 역양자화된 공간 파라미터에 기반하여 상기 복호화된 오디오 비트스트 림을 합성하여 N-채널 오디오 신호를 복원하는 단계를 포함하고,
    상기 공간 파라미터의 양자화값을 역양자화하는 단계에서 상기 공간 파라미터에 포함되는 CLD는 N-채널(N>1) 오디오 신호의 가상음원위치정보(VSLI) 양자화값으로부터 도출된 CLD 양자화값을 이용하여 설계된 VSLI-기반 CLD 양자화 테이블을 참조하여 역양자화되는 것을 특징으로 하는 SAC-기반 오디오 복호화 방법.
  24. 공간 오디오 부호화(SAC) 방식에 기반하여 부호화된 N-채널(N>1) 오디오 비트스트림을 복호화하기 위한 장치에 있어서, 상기 장치는,
    상기 부호화된 오디오 비트스트림을 복호화하기 위한 수단과,
    상기 부호화된 오디오 비트스트림과 함께 수신된 부호화된 공간 파라미터의 양자화값을 복호화하기 위한 수단과,
    상기 복호화된 공간 파라미터의 양자화값을 역양자화하기 위한 수단과,
    상기 역양자화된 공간 파라미터에 기반하여 상기 복호화된 오디오 비트스트림을 합성하여 N-채널 오디오 신호를 복원하기 위한 수단을 포함하고,
    상기 공간 파라미터의 양자화값을 역양자화하기 위한 수단은 상기 공간 파라미터에 포함되는 CLD를 N-채널(N>1) 오디오 신호의 가상음원위치정보(VSLI) 양자화값으로부터 도출된 CLD 양자화값을 이용하여 설계된 VSLI-기반 CLD 양자화 테이블을 참조하여 역양자화하는 것을 특징으로 하는 SAC-기반 오디오 복호화 장치.
  25. 제24항에 있어서, 상기 VSLI-기반 CLD 양자화 테이블은
    Figure 112006050802476-pat00033
    인 SAC-기반 오디오 복호화 장치.
  26. 제25항에 있어서, 상기 VSLI-기반 CLD 양자화 테이블에 연관된 CLD 양자화 경계값은
    Figure 112006050802476-pat00034
    인 SAC-기반 오디오 복호화 장치.
KR1020060066822A 2005-07-19 2006-07-18 가상음원위치정보에 기반한 채널간 크기 차이 양자화 및역양자화 방법 KR100755471B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
AT06783342T ATE511691T1 (de) 2005-07-19 2006-07-19 Auf virtuellen quellenpositionsinformationen basierte quantisierung und dequantisierung von kanalniveauunterschieden
CN2006800259842A CN101223598B (zh) 2005-07-19 2006-07-19 基于虚拟源位置信息的通道等级差量化和解量化方法
JP2008522700A JP4685165B2 (ja) 2005-07-19 2006-07-19 仮想音源位置情報に基づいたチャネル間レベル差量子化及び逆量子化方法
EP06783342A EP1905034B1 (en) 2005-07-19 2006-07-19 Virtual source location information based channel level difference quantization and dequantization
PCT/KR2006/002824 WO2007011157A1 (en) 2005-07-19 2006-07-19 Virtual source location information based channel level difference quantization and dequantization method

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20050065515 2005-07-19
KR1020050065515 2005-07-19
KR1020050096256 2005-10-12
KR20050096256 2005-10-12

Publications (2)

Publication Number Publication Date
KR20070011136A KR20070011136A (ko) 2007-01-24
KR100755471B1 true KR100755471B1 (ko) 2007-09-05

Family

ID=38012181

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060066822A KR100755471B1 (ko) 2005-07-19 2006-07-18 가상음원위치정보에 기반한 채널간 크기 차이 양자화 및역양자화 방법

Country Status (4)

Country Link
JP (1) JP4685165B2 (ko)
KR (1) KR100755471B1 (ko)
CN (1) CN101223598B (ko)
AT (1) ATE511691T1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101268616B1 (ko) * 2008-07-14 2013-05-29 한국전자통신연구원 오디오 채널 코딩의 성능 향상을 위한 채널간 정보 파라미터 양자화 방법 및 그 장치

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008120933A1 (en) * 2007-03-30 2008-10-09 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi object audio signal with multi channel
JP5098458B2 (ja) * 2007-06-20 2012-12-12 カシオ計算機株式会社 音声符号化装置、音声符号化方法、及び、プログラム
KR101613975B1 (ko) * 2009-08-18 2016-05-02 삼성전자주식회사 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
WO2011097903A1 (zh) * 2010-02-11 2011-08-18 华为技术有限公司 多声道信号编码、解码方法、装置及编解码系统
CN102157151B (zh) * 2010-02-11 2012-10-03 华为技术有限公司 一种多声道信号编码方法、解码方法、装置和系统
JP5533502B2 (ja) * 2010-09-28 2014-06-25 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
KR20120038311A (ko) 2010-10-13 2012-04-23 삼성전자주식회사 공간 파라미터 부호화 장치 및 방법,그리고 공간 파라미터 복호화 장치 및 방법
ES2560402T3 (es) 2012-04-05 2016-02-18 Huawei Technologies Co., Ltd Método para la codificación y la decodificación de audio espacial paramétrica, codificador de audio espacial paramétrico y decodificador de audio espacial paramétrico
CN104464742B (zh) * 2014-12-31 2017-07-11 武汉大学 一种3d音频空间参数全方位非均匀量化编码系统及方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH102006A (ja) * 1996-06-18 1998-01-06 Ykk Architect Prod Kk 建物の柵構造
US6016473A (en) * 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
KR20020077959A (ko) * 2001-04-03 2002-10-18 엘지전자 주식회사 디지탈 오디오 부호화기 및 복호화 방법
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
KR20030076725A (ko) * 2001-03-07 2003-09-26 닛본 덴끼 가부시끼가이샤 음성 부호화 장치와 방법, 및 음성 복호화 장치와 방법
WO2003090208A1 (en) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. pARAMETRIC REPRESENTATION OF SPATIAL AUDIO
KR20060043701A (ko) * 2004-07-14 2006-05-15 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
KR100923297B1 (ko) * 2002-12-14 2009-10-23 삼성전자주식회사 스테레오 오디오 부호화 방법, 그 장치, 복호화 방법 및그 장치

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH102006A (ja) * 1996-06-18 1998-01-06 Ykk Architect Prod Kk 建物の柵構造
US6016473A (en) * 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
KR20030076725A (ko) * 2001-03-07 2003-09-26 닛본 덴끼 가부시끼가이샤 음성 부호화 장치와 방법, 및 음성 복호화 장치와 방법
KR20020077959A (ko) * 2001-04-03 2002-10-18 엘지전자 주식회사 디지탈 오디오 부호화기 및 복호화 방법
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
WO2003090208A1 (en) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. pARAMETRIC REPRESENTATION OF SPATIAL AUDIO
KR20060043701A (ko) * 2004-07-14 2006-05-15 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
10-2006-0043701
특2002-0077959
특2003-0076725

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101268616B1 (ko) * 2008-07-14 2013-05-29 한국전자통신연구원 오디오 채널 코딩의 성능 향상을 위한 채널간 정보 파라미터 양자화 방법 및 그 장치

Also Published As

Publication number Publication date
JP2009502086A (ja) 2009-01-22
KR20070011136A (ko) 2007-01-24
CN101223598B (zh) 2011-07-20
JP4685165B2 (ja) 2011-05-18
CN101223598A (zh) 2008-07-16
ATE511691T1 (de) 2011-06-15

Similar Documents

Publication Publication Date Title
KR100755471B1 (ko) 가상음원위치정보에 기반한 채널간 크기 차이 양자화 및역양자화 방법
KR101139880B1 (ko) 주파수 영역 위너 필터링을 사용한 공간 오디오 코딩을 위한 시간적 엔벨로프 정형화
US11727944B2 (en) Apparatus and method for stereo filling in multichannel coding
EP1905034B1 (en) Virtual source location information based channel level difference quantization and dequantization
KR101664434B1 (ko) 오디오 신호의 부호화 및 복호화 방법 및 그 장치
KR101428487B1 (ko) 멀티 채널 부호화 및 복호화 방법 및 장치
EP2186087B1 (en) Improved transform coding of speech and audio signals
JP2013506164A (ja) オーディオ信号デコーダ、オーディオ信号エンコーダ、アップミックス信号表現の生成方法、ダウンミックス信号表現の生成方法、コンピュータプログラム、及び共通するオブジェクト間相関パラメータ値を用いるビットストリーム
KR20070098930A (ko) 근접-투명 또는 투명 멀티-채널 인코더/디코더 구성
JP2009510514A (ja) マルチチャネルオーディオ信号の符号化/復号化方法及び装置
US20110238424A1 (en) Method and apparatus for encoding and decoding excitation patterns from which the masking levels for an audio signal encoding and decoding are determined
WO2009048239A2 (en) Encoding and decoding method using variable subband analysis and apparatus thereof
KR20060109298A (ko) 멀티채널 오디오 신호에 대한 서브밴드별 공간 정보의적응적 양자화
US20110311063A1 (en) Embedding and extracting ancillary data
US20240153512A1 (en) Audio codec with adaptive gain control of downmixed signals
US11176954B2 (en) Encoding and decoding of multichannel or stereo audio signals
KR101735619B1 (ko) 멀티 채널 신호의 부호화/복호화 장치 및 방법
KR101635099B1 (ko) 멀티 채널 신호의 부호화/복호화 장치 및 방법
KR20070035410A (ko) 멀티 채널 오디오 신호의 공간 정보 부호화/복호화 방법 및장치
KR20070108313A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
MXPA06009933A (en) Device and method for processing a multi-channel signal

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120730

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20130717

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150723

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20160712

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee