KR20100007256A - 멀티 채널 부호화 및 복호화 방법 및 장치 - Google Patents

멀티 채널 부호화 및 복호화 방법 및 장치 Download PDF

Info

Publication number
KR20100007256A
KR20100007256A KR1020080067815A KR20080067815A KR20100007256A KR 20100007256 A KR20100007256 A KR 20100007256A KR 1020080067815 A KR1020080067815 A KR 1020080067815A KR 20080067815 A KR20080067815 A KR 20080067815A KR 20100007256 A KR20100007256 A KR 20100007256A
Authority
KR
South Korea
Prior art keywords
channel
signal
phase difference
gain value
reference signal
Prior art date
Application number
KR1020080067815A
Other languages
English (en)
Other versions
KR101428487B1 (ko
Inventor
김중회
주기현
키릴 유르코프
보리스 쿠드야쇼브
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020080067815A priority Critical patent/KR101428487B1/ko
Priority to EP09794678A priority patent/EP2312851A4/en
Priority to JP2011517358A priority patent/JP5462256B2/ja
Priority to US12/458,450 priority patent/US20100014679A1/en
Priority to CN2009801346358A priority patent/CN102144392A/zh
Priority to PCT/KR2009/003831 priority patent/WO2010005272A2/ko
Publication of KR20100007256A publication Critical patent/KR20100007256A/ko
Priority to JP2014006222A priority patent/JP5922684B2/ja
Application granted granted Critical
Publication of KR101428487B1 publication Critical patent/KR101428487B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 멀티-채널 신호를 부호화하거나 복호화함에 있어서 다운믹스 신호를 이용하지 않고 멀티-채널 사이의 중복 정보를 제거함으로써 잔여 신호를 부호화하고 복호화하는 방법 및 장치에 관한 것으로, 멀티-채널 신호 가운데 부호화하는 기준이 되는 기준 신호, 기준 신호에 대한 각 멀티-채널 신호의 위상차, 기준 신호에 대한 각 멀티-채널 신호의 크기의 비율을 이득값 및 위상차와 이득값을 기준 신호에 적용하여 예측된 각 멀티-채널 신호와 실제 멀티-채널 신호의 오차에 해당하는 잔여 신호를 부호화하고 복호화한다.

Description

멀티 채널 부호화 및 복호화 방법 및 장치{Method and apparatus for encoding and decoding multi-channel}
본 발명은 오디오 신호와 음성 신호를 부호화하거나 복호화하는 방법 및 장치에 관한 것으로, 보다 상세하게는 복수의 채널을 구비하는 멀티-채널 신호(multi-channel signal)를 부호화하고 복호화하는 방법 및 장치에 관한 것이다.
일반적으로 멀티-채널 신호를 부호화하는 방식은 웨이브폼(waveform) 부호화 방식과 파라메트릭(parametric) 부호화 방식이 있다. 여기서, 파라메트릭 부호화 방식은 낮은 비트레이트(bitrate)로 공간 정보(spatial cue)를 전송하여 멀티-채널 이미지(multi-channel image)를 형성하는 방식으로 보통 40kbps 정도 미만에서만 사용한다. 이러한 파라메트릭 부호화 방식은 멀티-채널 신호를 다운믹스(downmix)하고 이 과정에서 추출된 공간 정보를 멀티-채널 신호 사이의 에너지 차이, 멀티-채널 사이의 유사도, 멀티-채널 사이의 위상 차이로 표현함으로써 부호화한다. 파라메트릭 부호화 방식의 대표적인 실시예로 MPEG 써라운드(surround)와 바이너럴 큐 코딩(Binaural Cue Coding)이 있다. 그러나 이러한 기술들은 반향(reverberation)을 정확하게 표현할 수 없기 때문에 비트레이트를 증가시켜도 원 음에 가까워지기 어려운 문제점을 갖는다.
본 발명이 이루고자 하는 기술적 과제는, 다운믹스 신호를 이용하지 않고 멀티-채널 사이의 중복 정보를 제거함으로써 잔여 신호를 부호화하고 복호화하는 멀티-채널 부호화 및 복호화 방법 및 장치를 제공하는 것이다.
상기의 과제를 이루기 위한 본 발명에 의한 멀티 채널 부호화 장치는, 멀티-채널 신호 가운데 부호화하는 기준이 되는 기준 신호를 선택하여 부호화하는 기준신호 부호화부; 상기 기준 신호에 대한 상기 각 멀티-채널 신호의 위상차를 계산하여 부호화하는 위상차 부호화부; 상기 기준 신호에 대한 상기 각 멀티-채널 신호의 크기의 비율을 이득값으로 계산하여 부호화하는 이득값 부호화부; 및 상기 위상차와 상기 이득값을 상기 기준 신호에 적용하여 예측된 각 멀티-채널 신호와 실제 멀티-채널 신호의 오차에 해당하는 잔여 신호를 추출하여 부호화하는 잔여신호 부호화부를 포함하는 것을 특징으로 한다.
상기의 과제를 이루기 위한 본 발명에 의한 멀티 채널 복호화 장치는, 멀티-채널 신호 가운데 복호화하는 기준이 되는 기준 신호를 복호화하는 기준신호 복호화부; 상기 기준 신호에 대한 상기 각 멀티-채널 신호의 위상차를 복호화하는 위상차 복호화부; 상기 기준 신호에 대한 상기 각 멀티-채널 신호의 크기의 비율에 해당하는 이득값을 복호화하는 이득값 복호화부; 상기 위상차와 상기 이득값을 상기 기준 신호에 적용하여 예측된 각 멀티-채널 신호와 실제 멀티-채널 신호의 오차에 해당하는 잔여 신호를 복호화하는 잔여신호 복호화부; 및 상기 위상차, 상기 이득값 및 상기 잔여 신호를 이용하여 상기 멀티-채널 신호를 복원하는 멀티채널 복원부를 포함하는 것을 특징으로 한다.
상기의 과제를 이루기 위한 본 발명에 의한 멀티 채널 부호화 방법은, 멀티-채널 신호 가운데 부호화하는 기준이 되는 기준 신호를 선택하여 부호화하는 단계; 상기 기준 신호에 대한 상기 각 멀티-채널 신호의 위상차를 계산하여 부호화하는 단계; 상기 기준 신호에 대한 상기 각 멀티-채널 신호의 크기의 비율을 이득값으로 계산하여 부호화하는 단계; 및 상기 위상차와 상기 이득값을 상기 기준 신호에 적용하여 예측된 각 멀티-채널 신호와 실제 멀티-채널 신호의 오차에 해당하는 잔여 신호를 추출하여 부호화하는 단계를 포함하는 것을 특징으로 한다.
상기의 과제를 이루기 위한 본 발명에 의한 멀티 채널 복호화 방법은, 멀티-채널 신호 가운데 복호화하는 기준이 되는 기준 신호를 복호화하는 단계; 상기 기준 신호에 대한 상기 각 멀티-채널 신호의 위상차를 복호화하는 단계; 상기 기준 신호에 대한 상기 각 멀티-채널 신호의 크기의 비율에 해당하는 이득값을 복호화하는 단계; 상기 위상차와 상기 이득값을 상기 기준 신호에 적용하여 예측된 각 멀티-채널 신호와 실제 멀티-채널 신호의 오차에 해당하는 잔여 신호를 복호화하는 단계; 및 상기 위상차, 상기 이득값 및 상기 잔여 신호를 이용하여 상기 멀티-채널 신호를 복원하는 단계를 포함하는 것을 특징으로 한다.
상기의 과제를 이루기 위한 본 발명에 의한 기록매체는, 멀티-채널 신호 가운데 부호화하는 기준이 되는 기준 신호를 선택하여 부호화하는 단계; 상기 기준 신호에 대한 상기 각 멀티-채널 신호의 위상차를 계산하여 부호화하는 단계; 상기 기준 신호에 대한 상기 각 멀티-채널 신호의 크기의 비율을 이득값으로 계산하여 부호화하는 단계; 및 상기 위상차와 상기 이득값을 상기 기준 신호에 적용하여 예측된 각 멀티-채널 신호와 실제 멀티-채널 신호의 오차에 해당하는 잔여 신호를 추출하여 부호화하는 단계를 포함하는 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한다.
상기의 과제를 이루기 위한 본 발명에 의한 기록매체는, 멀티-채널 신호 가운데 복호화하는 기준이 되는 기준 신호를 복호화하는 단계; 상기 기준 신호에 대한 상기 각 멀티-채널 신호의 위상차를 복호화하는 단계; 상기 기준 신호에 대한 상기 각 멀티-채널 신호의 크기의 비율에 해당하는 이득값을 복호화하는 단계; 상기 위상차와 상기 이득값을 상기 기준 신호에 적용하여 예측된 각 멀티-채널 신호와 실제 멀티-채널 신호의 오차에 해당하는 잔여 신호를 복호화하는 단계; 및 상기 위상차, 상기 이득값 및 상기 잔여 신호를 이용하여 상기 멀티-채널 신호를 복원하는 단계를 포함하는 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한다.
이하, 첨부된 도면들을 참조하여 본 발명에 따른 멀티 채널 부호화 및 복호화 방법 및 장치의 실시예에 대해 상세히 설명한다.
도 1은 본 발명에 의한 멀티 채널 부호화 장치에 대한 일 실시예를 블록도로 도시한 것으로서, 멀티 채널 부호화 장치는 선처리부(100), 변환부(110), 기준스펙트럼 양자화부(120), 위상차 계산부(130), 위상차 양자화부(135), 이득값 계산 부(140), 이득값 양자화부(145), 잔여스펙트럼 추출부(150), 잔여스펙트럼 양자화부(155), 예측 검사부(160), 멀티채널 양자화부(170), 무손실 부호화부(180) 및 다중화부(190)를 포함하여 이루어진다.
선처리부(100, preprocessing unit)는 입력단자 IN 1 내지 N을 통해 N개의 채널 신호들에 해당하는 멀티-채널 신호(multi-channel signal)를 입력받아 멀티-채널 신호 가운데 부호화하는 기준이 되는 기준 신호를 선택한다. 여기서, 선처리부(100)는 멀티-채널 신호 가운데 선택할 뿐만 아니라 기 설정된 방식으로 신호를 생성할 수 있다. 예를 들어, 선처리부(100)는 만일 멀티-채널 신호가 2개의 채널 신호로 구성된 경우 수학식 1에 기재된 행렬들을 이용하여 기준 신호를 선택하거나 생성할 수 있다.
Figure 112008050206814-PAT00001
또한, 선처리부(100)에 의해 N개의 채널 신호들 가운데 기준이 되는 기준 신호를 바크 밴드(bark band) 단위로 변경할 수 있다.
그러나 본 발명에 의한 멀티 채널 부호화 장치는 선처리부(100)를 반드시 포함하여 실시해야 하는 것은 아니다.
변환부(110)는 각 멀티-채널 신호의 크기와 위상을 모두 표현할 수 있도록 멀티-채널 신호를 주파수 도메인으로 변환하여 멀티-채널 스펙트럼(multi-channel spectrum)을 생성한다. 예를 들어, 변환부(110)에서는 복소수 변환(complex valued transform)을 이용하여 각 멀티-채널 신호를 복소수로 스펙트럼을 표현할 수 있다. 변환부(110)에서 복소수 변환을 이용할 경우 변환부(110)는 시간 도메인에 해당하는 멀티-채널 신호에 MDCT(Modified Discrete Cosine Transform)를 적용하여 실수부를 계산하고, MDST(Modified Discrete Sine Transform)를 적용하여 허수부를 계산한다.
예를 들어, 변환부(110)는 만일 멀티-채널 신호가 스테레오 신호와 같은 2개의 채널 신호로 구성된 경우 좌측 신호와 우측 신호를 수학식 2에 기재된 바와 같이 x(t)와 y(t)로 변환한다.
Figure 112008050206814-PAT00002
여기서, x(t)는 제1 멀티-채널 신호인 좌측 신호가 변환부(110)에서 변환된 스펙트럼이며, y(t)는 제2 멀티-채널 신호인 우측 신호가 변환부(110)에서 변환된 스펙트럼이고,
Figure 112008050206814-PAT00003
는 제i 멀티-채널 스펙트럼의 크기이며,
Figure 112008050206814-PAT00004
는 제i 멀티-채널 스펙트럼의 위상이다.
기준스펙트럼 양자화부(120)는 멀티-채널 신호 가운데 선처리부(100)에서 기준 신호로 선택되어 변환부(110)에서 변환된 기준 스펙트럼을 양자화한다. 만일 변환부(110)에서 MDCT와 MDST에 의해 복소수 변환을 수행할 경우, 기준스펙트럼 양자화부(120)는 MDCT에 의해 변환된 기준 스펙트럼만 양자화할 수 있다. 또한, 기 준스펙트럼 양자화부(120)에서는 심리 음향 모델을 통해 양자화 스텝 크기(quantization step size)를 결정하여 비트량을 제어함으로써 기준 스펙트럼을 양자화한다.
위상차 계산부(130)는 기준 스펙트럼에 대한 각 멀티-채널 스펙트럼의 위상차를 계산한다. 예를 들어, 위상차 계산부(130)는 수학식 3에 의해 위상차를 계산할 수 있다.
Figure 112008050206814-PAT00005
여기서,
Figure 112008050206814-PAT00006
는 기준 스펙트럼에 대한 제i 멀티-채널 스펙트럼의 위상차이고,
Figure 112008050206814-PAT00007
는 기준 스펙트럼의 위상이며,
Figure 112008050206814-PAT00008
는 제i 멀티-채널 스펙트럼의 위상이다.
이득값 계산부(140)는 기준 스펙트럼의 크기에 대한 각 멀티-채널 스펙트럼의 크기의 비율에 해당하는 이득값을 계산한다. 예를 들어, 이득값 계산부(140)는 수학식 4를 이용하여 이득값을 계산할 수 있다.
Figure 112008050206814-PAT00009
여기서,
Figure 112008050206814-PAT00010
는 제i 멀티-채널 스펙트럼의 이득값이고,
Figure 112008050206814-PAT00011
는 기준 스펙트럼 의 크기이며,
Figure 112008050206814-PAT00012
는 제i 멀티-채널 스펙트럼의 크기이다.
위상차 계산부(130) 및 이득값 계산부(140)에서 각 멀티-채널 스펙트럼의 위상차와 이득값을 계산하는 예를 입력 신호인 멀티-채널 신호가 좌측 신호와 우측 신호에 해당하는 2개의 채널로 구성되었다고 가정하고 설명하기로 한다.
우선, 선처리부(100)에서 좌측 신호가 기준 신호로 선택되고, 변환부(110)에서는 좌측 신호와 우측 신호를 수학식 5와 같이 복소수 변환에 의해 주파수 도메인으로 변환하여 좌측 스펙트럼과 우측 스펙트럼을 생성한다.
Figure 112008050206814-PAT00013
여기서, L은 변환부(110)에서 변환된 좌측 스펙트럼이고, R은 변환부(110)에서 변환된 좌측 스펙트럼이며,
Figure 112008050206814-PAT00014
는 좌측 스펙트럼의 크기이고,
Figure 112008050206814-PAT00015
는 우측 스펙트럼의 크기이며,
Figure 112008050206814-PAT00016
는 좌측 스펙트럼의 위상이고,
Figure 112008050206814-PAT00017
은 우측 스펙트럼의 위상이다.
위상차 계산부(130)와 이득값 계산부(140)는 수학식 6을 최소로 하는 위상차와 이득값을 계산한다.
Figure 112008050206814-PAT00018
여기서, g는 이득값이며,
Figure 112008050206814-PAT00019
는 위상차이다.
수학식 7에 기재된 바와 같이 수학식 6을 g와
Figure 112008050206814-PAT00020
에 대해 편미분한다.
Figure 112008050206814-PAT00021
이득값 g와 위상차
Figure 112008050206814-PAT00022
를 기준 신호인 좌측 신호에 적용하여 예측한 우측 신호가 실제 우측 신호와 평균 제곱 오차(mean squared error)가 최소화될 수 있도록 수학식 7에 의해 편미분된 식의 값이 '0'이 되는 이득값 g와 위상차
Figure 112008050206814-PAT00023
를 수학식 8에 의해 계산함으로써 위상차 계산부(130)와 이득값 계산부(140)는 최종적으로 위상차
Figure 112008050206814-PAT00024
와 이득값 g을 계산한다.
Figure 112008050206814-PAT00025
잔여스펙트럼 추출부(150)는 각 멀티-채널 스펙트럼에 대하여 위상차 계산부(130) 및 이득값 계산부(140)에서 계산된 위상차 및 이득값을 기준 스펙트럼에 적용함으로써 예측된 스펙트럼과 실제 스펙트럼의 오차에 해당하는 잔여 스펙트럼(residual spectrum)을 추출한다. 예를 들어, 잔여스펙트럼 추출부(150)는 수학식 9에 의해 잔여 스펙트럼을 추출할 수 있다.
Figure 112008050206814-PAT00026
여기서,
Figure 112008050206814-PAT00027
는 제i 멀티-채널 스펙트럼에 대응하는 잔여 스펙트럼이며,
Figure 112008050206814-PAT00028
는 제i 멀티-채널 스펙트럼의 실제 크기이고,
Figure 112008050206814-PAT00029
는 제i 멀티-채널 스펙트럼의 위상이며,
Figure 112008050206814-PAT00030
는 위상차 및 이득값을 기준 스펙트럼에 적용함으로써 예측된 스펙트럼의 실수부이고 수학식 10에 의해 계산할 수 있다.
Figure 112008050206814-PAT00031
여기서, g는 이득값 계산부(140)에서 계산된 이득값이고,
Figure 112008050206814-PAT00032
는 위상차 계산부(130)에서 계산된 위상차이며,
Figure 112008050206814-PAT00033
는 기준 스펙트럼의 크기이고,
Figure 112008050206814-PAT00034
는 기준 스펙트럼의 위상이다.
위상차 양자화부(135)는 위상차 계산부(130)에서 계산된 기준 스펙트럼에 대한 각 멀티-채널 스펙트럼의 위상차를 양자화한다. 위상차 양자화부(135)에서는 위상차를 유니폼 스케일(uniform scale)로 양자화할 수 있다.
이득값 양자화부(145)는 이득값 계산부(140)에서 계산된 각 멀티-채널 스펙트럼의 이득값을 양자화한다. 이득값 양자화부(145)에서는 이득값을 로그 스케일(log scale) 또는 유니폼 스케일로 양자화할 수 있다.
잔여스펙트럼 양자화부(155)는 잔여스펙트럼 추출부(150)에서 추출된 각 멀티-채널 스펙트럼에 대한 잔여 스펙트럼을 양자화한다. 잔여스펙트럼 양자화부(155)는 심리 음향 모델을 통해 양자화 스텝 크기를 결정하여 비트량을 제어함으로써 잔여 스펙트럼을 양자화한다.
또한, 선처리부(100), 기준스펙트럼 양자화부(120), 위상차 계산부(130), 위상차 양자화부(135), 이득값 계산부(140), 이득값 양자화부(145), 잔여스펙트럼 추출부(150) 및 잔여스펙트럼 양자화부(155)는 크리티컬 밴드(critical band)를 고려한 바크 밴드 단위로 처리된다.
예측 검사부(160)는 각 멀티-채널 스펙트럼에 대하여 위상차 계산부(130)에서 계산된 위상차와 이득값 계산부(140)에서 계산된 이득값을 기준 스펙트럼에 적용함으로써 예측된 스펙트럼이 실제 스펙트럼에 비하여 얼마나 정확하게 예측되었는지 검사한다.
예측 검사부(160)에서는 잔여스펙트럼 추출부(150)에서 추출된 잔여 스펙트럼의 에너지와 실제 각 멀티-채널 스펙트럼의 에너지를 비교하여 예측의 정확도를 검사할 수 있다.
또한, 예측 검사부(160)는 예측의 정확도를 기준으로 프레임을 기 설정된 타입 별로 분류하여 각 프레임의 타입에 대응하는 잔여 스펙트럼을 상이하게 적응적으로 부호화할 수 있다. 예를 들어, 예측 검사부(160)는 수학식 11과 같이 예측의 정확도를 기준으로 프레임의 타입을 3가지로 분류할 수 있다.
Figure 112008050206814-PAT00035
또한, 각 프레임의 타입을 잔여 스펙트럼을 부호화함에 있어서 엔트로피 부호화(entropy coding)의 문맥(context)으로 이용할 수 있다.
그러나 본 발명에 의한 멀티 채널 부호화 장치는 예측 검사부(160)를 반드시 포함하여 실시해야 하는 것은 아니며, 예측 정확도와 상관없이 기준 스펙트럼, 위상차, 이득값 및 잔여 스펙트럼을 부호화할 수도 있다.
멀티채널 양자화부(170)는 수학식 11에서 제3 프레임 타입과 같이 예측 검사부(160)에서 계산된 실제 스펙트럼에 대한 예측 스펙트럼의 에너지 비율이 기 설정된 임계값 보다 크면, 해당 멀티-채널 스펙트럼을 양자화하고 이득값과 위상차를 '0'으로 설정한다. 그리고 해당 멀티-채널 스펙트럼에 대하여 위상차 양자화부(135)에서 위상차를 양자화하지 않고 이득값 양자화부(145)에서 이득값을 양자화하지 않는다. 왜냐하면 해당 멀티-채널 스펙트럼에 대하여 위상차 계산부(130)에서 계산된 위상차와 이득값 계산부(140)에서 계산된 이득값을 기준 스펙트럼에 적용하여 예측된 스펙트럼이 정확하지 않으므로 해당 멀티-채널 스펙트럼은 개별적으로 부호화하는 것이 더 효율적이기 때문이다.
무손실 부호화부(180)는 기준스펙트럼 양자화부(120)에서 양자화된 기준 스펙트럼, 위상차 양자화부(135)에서 양자화된 각 멀티-채널 스펙트럼에 대한 위상차, 이득값 양자화부(145)에서 양자화된 각 멀티-채널 스펙트럼에 대한 이득값 및 잔여스펙트럼 양자화부(155)에서 양자화된 잔여 스펙트럼을 무손실 부호화(lossless coding)한다. 그러나 무손실 부호화부(180)는 예측 검사부(160)에서 계산된 실제 스펙트럼에 대한 예측 스펙트럼의 에너지 비율이 기 설정된 임계값 보다 큰 바크 밴드에 마련된 멀티-채널 스펙트럼(들)의 경우 위상차, 이득값 및 잔여 스펙트럼 대신에 해당 멀티-채널 스펙트럼(들)을 무손실 부호화한다.
다중화부(190)는 무손실 부호화부(180)에서 무손실 부호화된 기준 스펙트럼, 위상차, 이득값 및 잔여 스펙트럼을 포함하여 다중화함으로써 비트스트림을 생성하고 출력단자 OUT을 통해 출력한다. 그러나 다중화부(190)는 예측 검사부(160)에서 계산된 실제 스펙트럼에 대한 예측 스펙트럼의 에너지 비율이 기 설정된 임계값 보다 큰 바크 밴드에 마련된 멀티-채널 스펙트럼(들)의 경우 위상차, 이득값 및 잔여 스펙트럼 대신에 해당 멀티-채널 스펙트럼(들)을 다중화한다.
도 2는 본 발명에 의한 멀티 채널 복호화 장치에 대한 일 실시예를 블록도로 도시한 것으로서, 멀티 채널 복호화 장치는 역다중화부(200), 무손실 복호화부(210), 기준스펙트럼 역양자화부(220), 제1 역변환부(225), 변환부(230), 위상차 역양자화부(235), 이득값 역양자화부(240), 잔여스펙트럼 역양자화부(245), 멀티채널 스펙트럼 복원부(250), 제2 역변환부(255) 및 후처리부(260)를 포함하여 이루어진다.
역다중화부(200)는 부호화단으로부터 전송된 비트스트림을 입력단자 IN을 통해 입력받아 역다중화한다. 역다중화부(200)에서 역다중화되는 비트스트림은 각 바크 밴드(bark band)에 대하여 기준 스펙트럼, 기준 스펙트럼에 대한 각 멀티-채널 스펙트럼의 위상차, 기준 스펙트럼의 크기에 대한 각 멀티-채널 스펙트럼의 크기의 비율에 해당하는 이득값 및 잔여 스펙트럼(residual spectrum)을 포함하거나 소정의 멀티-채널 스펙트럼을 포함한다. 여기서, 기준 스펙트럼은 멀티-채널 신호 가운데 부호화하는 기준이 되는 기준 신호를 변환한 스펙트럼을 말하고, 잔여 스펙트럼은 위상차와 이득값을 기준 스펙트럼에 적용함으로써 예측된 스펙트럼과 실제 스펙트럼의 오차에 해당하는 스펙트럼을 말한다.
무손실 복호화부(210)는 역다중화부(200)에서 역다중화된 기준 스펙트럼, 위상차, 이득값 및 잔여 스펙트럼을 무손실 복호화하거나 소정의 멀티-채널 스펙트럼을 무손실 복호화한다.
기준스펙트럼 역양자화부(220)는 무손실 복호화부(210)에서 무손실 복호화된 기준 스펙트럼을 역양자화한다.
제1 역변환부(225)는 기준스펙트럼 역양자화부(220)에서 역양자화된 기준 스펙트럼을 제1 역-변환(inverse-transform)에 의해 시간 도메인으로 역변환하여 기준 신호를 생성한다. 여기서, 제1 역-변환의 예로 복소수 변환에서 실수부에 해당하는 IMDCT(Inverse Modified Discrete Cosine Transform)가 있다.
그러나 후술할 변환부(230)에서 1 프레임이 지연되므로 제1 역변환부(225)에서 후처리부(260)로 출력하는 기준 신호에 한하여 1 프레임을 지연시켜 출력한다.
변환부(230)는 제1 역변환부(225)에서 역변환된 기준 신호를 제2 변환(transform)에 의해 주파수 도메인으로 변환한다. 여기서, 제2 변환의 예로 복소수 변환에서 허수부에 해당하는 MDST(Modified Discrete Sine Transform)가 있다. 그러나 제1 역변환부(225)에서 제1 역-변환에 의해 역변환된 기준 신호를 변환부(230)에서 다시 제2 변환에 의해 변환하므로 1 프레임이 지연(delay)된다.
위상차 역양자화부(235)는 무손실 복호화부(210)에서 복호화된 각 멀티-채널 스펙트럼의 위상차를 역양자화한다. 위상차 역양자화부(235)에서는 위상차를 유니폼 스케일(uniform scale)로 역양자화할 수 있다.
이득값 역양자화부(240)는 무손실 복호화부(210)에서 복호화된 각 멀티-채널 스펙트럼의 이득값을 역양자화한다. 이득값 역양자화부(240)에서는 이득값을 로그 스케일(log scale) 또는 유니폼 스케일로 역양자화할 수 있다.
잔여스펙트럼 역양자화부(245)는 무손실 복호화부(210)에서 복호화된 각 멀티-채널 스펙트럼에 대한 잔여 스펙트럼을 역양자화한다.
멀티채널스펙트럼 복원부(250)는 기준스펙트럼 역양자화부(220)에서 역양자화하고 변환부(230)에서 변환함으로써 각 멀티-채널 신호의 크기와 위상을 모두 표현할 수 있는 기준 스펙트럼에 위상차 역양자화부(235)에서 역양자화된 위상차, 이득값 역양자화부(240)에서 역양자화된 이득값 및 잔여스펙트럼 역양자화부(245)에서 역양자화된 잔여 스펙트럼을 적용하여 각 멀티-채널 스펙트럼을 복원한다. 다시 말하면, 멀티채널스펙트럼 복원부(250)는 위상차만큼 기준 스펙트럼의 위상을 이동시키고 이득값의 비율로 기준 스펙트럼의 크기를 조절한 후 잔여 스펙트럼을 가산함으로써 각 멀티-채널 스펙트럼을 복원한다.
그러나 변환부(230)에서 1 프레임이 지연되므로 멀티채널스펙트럼 복원부(250)은 1 프레임을 지연하여 수행하기 시작한다.
제2 역변환부(255)는 멀티채널스펙트럼 복원부(250)에서 복원된 각 멀티-채널 스펙트럼을 시간 도메인으로 역변환한다.
멀티채널 역양자화부(260)는 멀티 채널 부호화 장치에서 위상차와 이득값을 기준 스펙트럼에 적용하여 예측된 스펙트럼이 실제 스펙트럼에 대하여 정확하게 예측되지 않다고 판단되기 때문에 위상차, 이득값 및 잔여 스펙트럼을 부호화하는 대신에 멀티-채널 스펙트럼을 부호화한 멀티 채널 스펙트럼을 역양자화한다.
제2 역변환부(255)는 멀티채널 역양자화부(260)에서 역양자화된 멀티-채널 스펙트럼을 시간 도메인으로 역변환한다.
후처리부(260)는 제1 역변환부(225)에서 역변환되고 1 프레임이 지연된 기준 신호와 제2 역변환부(255)에서 역변환된 멀티-채널 신호를 도 1의 선처리부(100)에서 수행된 연산의 역과정을 수행함으로써 출력단자 OUT을 통해 멀티-채널 신호를 출력한다.
도 3은 본 발명에 의한 멀티 채널 부호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
먼저, N개의 채널 신호들에 해당하는 멀티-채널 신호(multi-channel signal)를 입력받아 멀티-채널 신호 가운데 부호화하는 기준이 되는 기준 신호를 선택한다(제300단계). 제300단계에서는 멀티-채널 신호 가운데 선택할 뿐만 아니라 기 설정된 방식으로 신호를 생성할 수도 있다. 예를 들어, 제300단계에서는 만일 멀티-채널 신호가 2개의 채널 신호로 구성된 경우 수학식 12에 기재된 행렬들을 이용하여 기준 신호를 선택하거나 생성할 수 있다.
Figure 112008050206814-PAT00036
또한, 제300단계에 의해 N개의 채널 신호들 가운데 기준이 되는 기준 신호를 바크 밴드(bark band) 단위로 변경할 수 있다.
그러나 본 발명에 의한 멀티 채널 부호화 방법은 제300단계를 반드시 포함하 여 실시해야 하는 것은 아니다.
각 멀티-채널 신호의 크기와 위상을 모두 표현할 수 있도록 멀티-채널 신호를 주파수 도메인으로 변환하여 멀티-채널 스펙트럼(multi-channel spectrum)을 생성한다(제310단계). 예를 들어, 제310단계에서는 복소수 변환(complex valued transform)을 이용하여 각 멀티-채널 신호를 복소수로 스펙트럼을 표현할 수 있다. 제310단계에서 복소수 변환을 이용할 경우 제310단계에서는 시간 도메인에 해당하는 멀티-채널 신호에 MDCT(Modified Discrete Cosine Transform)를 적용하여 실수부를 계산하고, MDST(Modified Discrete Sine Transform)를 적용하여 허수부를 계산한다.
예를 들어, 제310단계에서는 만일 멀티-채널 신호가 스테레오 신호와 같은 2개의 채널 신호로 구성된 경우 좌측 신호와 우측 신호를 수학식 13에 기재된 바와 같이 x(t)와 y(t)로 변환한다.
Figure 112008050206814-PAT00037
여기서, x(t)는 제1 멀티-채널 신호인 좌측 신호가 제310단계에서 변환된 스펙트럼이며, y(t)는 제2 멀티-채널 신호인 우측 신호가 제310단계에서 변환된 스펙트럼이고,
Figure 112008050206814-PAT00038
는 제i 멀티-채널 스펙트럼의 크기이며,
Figure 112008050206814-PAT00039
는 제i 멀티-채널 스펙트럼의 위상이다.
멀티-채널 신호 가운데 제300단계에서 기준 신호로 선택되어 제310단계에서 변환된 기준 스펙트럼을 양자화한다(제320단계). 만일 제310단계에서 MDCT와 MDST에 의해 복소수 변환을 수행할 경우, 제320단계에서는 MDCT에 의해 변환된 기준 스펙트럼만 양자화할 수 있다. 또한, 제320단계에서는 심리 음향 모델을 통해 양자화 스텝 크기(quantization step size)를 결정하여 비트량을 제어함으로써 기준 스펙트럼을 양자화한다.
기준 스펙트럼에 대한 각 멀티-채널 스펙트럼의 위상차를 계산한다(제330단계). 예를 들어, 제330단계에서는 수학식 14에 의해 위상차를 계산할 수 있다.
Figure 112008050206814-PAT00040
여기서,
Figure 112008050206814-PAT00041
는 기준 스펙트럼에 대한 제i 멀티-채널 스펙트럼의 위상차이고,
Figure 112008050206814-PAT00042
는 기준 스펙트럼의 위상이며,
Figure 112008050206814-PAT00043
는 제i 멀티-채널 스펙트럼의 위상이다.
기준 스펙트럼의 크기에 대한 각 멀티-채널 스펙트럼의 크기의 비율에 해당하는 이득값을 계산한다(제340단계). 예를 들어, 제340단계에서는 수학식 15를 이용하여 이득값을 계산할 수 있다.
Figure 112008050206814-PAT00044
여기서,
Figure 112008050206814-PAT00045
는 제i 멀티-채널 스펙트럼의 이득값이고,
Figure 112008050206814-PAT00046
는 기준 스펙트럼의 크기이며,
Figure 112008050206814-PAT00047
는 제i 멀티-채널 스펙트럼의 크기이다.
제330단계 및 제340단계에서 각 멀티-채널 스펙트럼의 위상차와 이득값을 계산하는 예를 입력 신호인 멀티-채널 신호가 좌측 신호와 우측 신호에 해당하는 2개의 채널로 구성되었다고 가정하고 설명하기로 한다.
우선, 제300단계에서 좌측 신호가 기준 신호로 선택되고, 제310단계에서는 좌측 신호와 우측 신호를 수학식 16과 같이 복소수 변환에 의해 주파수 도메인으로 변환하여 좌측 스펙트럼과 우측 스펙트럼을 생성한다.
Figure 112008050206814-PAT00048
여기서, L은 제310단계에서 변환된 좌측 스펙트럼이고, R은 제310단계에서 변환된 좌측 스펙트럼이며,
Figure 112008050206814-PAT00049
는 좌측 스펙트럼의 크기이고,
Figure 112008050206814-PAT00050
는 우측 스펙트럼의 크기이며,
Figure 112008050206814-PAT00051
는 좌측 스펙트럼의 위상이고,
Figure 112008050206814-PAT00052
은 우측 스펙트럼의 위상이다.
제330단계와 제340단계는 수학식 17을 최소로 하는 위상차와 이득값을 계산한다.
Figure 112008050206814-PAT00053
여기서, g는 이득값이며,
Figure 112008050206814-PAT00054
는 위상차이다.
수학식 18에 기재된 바와 같이 수학식 17을 g와
Figure 112008050206814-PAT00055
에 대해 편미분한다.
Figure 112008050206814-PAT00056
이득값 g와 위상차
Figure 112008050206814-PAT00057
를 기준 신호인 좌측 신호에 적용하여 예측한 우측 신호가 실제 우측 신호와 평균 제곱 오차(mean squared error)가 최소화될 수 있도록 수학식 18에 의해 편미분된 식의 값이 '0'이 되는 이득값 g와 위상차
Figure 112008050206814-PAT00058
를 수학식 19에 의해 계산함으로써 제330단계와 제340단계에서는 최종적으로 위상차
Figure 112008050206814-PAT00059
와 이득값 g을 계산한다.
Figure 112008050206814-PAT00060
각 멀티-채널 스펙트럼에 대하여 제330단계 및 제340단계에서 계산된 위상차 및 이득값을 기준 스펙트럼에 적용함으로써 예측된 스펙트럼과 실제 스펙트럼의 오 차에 해당하는 잔여 스펙트럼(residual spectrum)을 추출한다(제350단계). 예를 들어, 제350단계는 수학식 20에 의해 잔여 스펙트럼을 추출할 수 있다.
Figure 112008050206814-PAT00061
여기서,
Figure 112008050206814-PAT00062
는 제i 멀티-채널 스펙트럼에 대응하는 잔여 스펙트럼이며,
Figure 112008050206814-PAT00063
는 제i 멀티-채널 스펙트럼의 실제 크기이고,
Figure 112008050206814-PAT00064
는 제i 멀티-채널 스펙트럼의 위상이며,
Figure 112008050206814-PAT00065
는 위상차 및 이득값을 기준 스펙트럼에 적용함으로써 예측된 스펙트럼의 실수부이고 수학식 21에 의해 계산할 수 있다.
Figure 112008050206814-PAT00066
여기서, g 는 제340단계에서 계산된 이득값이고,
Figure 112008050206814-PAT00067
는 제330단계에서 계산된 위상차이며,
Figure 112008050206814-PAT00068
는 기준 스펙트럼의 크기이고,
Figure 112008050206814-PAT00069
는 기준 스펙트럼의 위상이다.
각 멀티-채널 스펙트럼에 대하여 제330단계에서 계산된 위상차와 제340단계에서 계산된 이득값을 기준 스펙트럼에 적용함으로써 예측된 스펙트럼이 실제 스펙트럼에 비하여 얼마나 정확하게 예측되었는지 검사한다(제355단계).
제355단계에서는 제350단계에서 추출된 잔여 스펙트럼의 에너지와 실제 각 멀티-채널 스펙트럼의 에너지를 비교하여 예측의 정확도를 검사할 수 있다.
또한, 제355단계에서는 예측의 정확도를 기준으로 프레임을 기 설정된 타입 별로 분류하여 각 프레임의 타입에 대응하는 잔여 스펙트럼을 상이하게 적응적으로 부호화할 수 있다. 예를 들어, 제355단계에서는 수학식 22와 같이 예측의 정확도를 기준으로 프레임의 타입을 3가지로 분류할 수 있다.
Figure 112008050206814-PAT00070
또한, 각 프레임의 타입을 잔여 스펙트럼을 부호화함에 있어서 엔트로피 부호화(entropy coding)의 문맥(context)으로 이용할 수 있다.
제355단계에서 검사된 예측의 정확도가 기 설정된 임계값 보다 큰지 여부를 판단한다(제360단계).
만일 제360단계에서 예측의 정확도가 기 설정된 임계값 보다 크다고 판단되면, 제330단계에서 계산된 기준 스펙트럼에 대한 각 멀티-채널 스펙트럼의 위상차를 양자화한다(제335단계). 제335단계에서는 위상차를 유니폼 스케일(uniform scale)로 양자화할 수 있다.
제340단계에서 계산된 각 멀티-채널 스펙트럼의 이득값을 양자화한다(제370 단계). 제370단계에서는 이득값을 로그 스케일(log scale) 또는 유니폼 스케일로 양자화할 수 있다.
제350단계에서 추출된 각 멀티-채널 스펙트럼에 대한 잔여 스펙트럼을 양자화한다(제375단계). 제375단계에서는 심리 음향 모델을 통해 양자화 스텝 크기를 결정하여 비트량을 제어함으로써 잔여 스펙트럼을 양자화한다.
또한, 제300단계, 제320단계, 제330단계, 제340단계, 제350단계, 제365단계, 제370단계 및 제375단계는 크리티컬 밴드(critical band)를 고려한 바크 밴드 단위로 처리된다.
만일 제360단계에서 예측의 정확도가 기 설정된 임계값 보다 작다고 판단되면, 해당 멀티-채널 스펙트럼을 양자화하고 이득값과 위상차를 '0'으로 설정한다(제380단계). 왜냐하면 해당 멀티-채널 스펙트럼에 대하여 제330단계에서 계산된 위상차와 제340단계에서 계산된 이득값을 기준 스펙트럼에 적용하여 예측된 스펙트럼이 정확하지 않으므로 해당 멀티-채널 스펙트럼은 개별적으로 부호화하는 것이 더 효율적이기 때문이다.
제320단계에서 양자화된 기준 스펙트럼, 제365단계에서 양자화된 각 멀티-채널 스펙트럼에 대한 위상차, 제370단계에서 양자화된 각 멀티-채널 스펙트럼에 대한 이득값 및 제375단계에서 양자화된 잔여 스펙트럼을 무손실 부호화(lossless coding)하거나 멀티-채널 스펙트럼을 무손실 부호화한다(제385단계).
제385단계에서 무손실 부호화된 기준 스펙트럼, 위상차, 이득값 및 잔여 스펙트럼을 포함하거나 멀티-채널 스펙트럼을 포함하여 다중화함으로써 비트스트림을 생성한다(제390단계).
도 4는 본 발명에 의한 멀티 채널 복호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
먼저, 부호화단으로부터 전송된 비트스트림을 입력받아 역다중화한다(제400단계). 제400단계에서 역다중화되는 비트스트림은 각 바크 밴드(bark band)에 대하여 기준 스펙트럼, 기준 스펙트럼에 대한 각 멀티-채널 스펙트럼의 위상차, 기준 스펙트럼의 크기에 대한 각 멀티-채널 스펙트럼의 크기의 비율에 해당하는 이득값 및 잔여 스펙트럼(residual spectrum)을 포함하거나 소정의 멀티-채널 스펙트럼을 포함한다. 여기서, 기준 스펙트럼은 멀티-채널 신호 가운데 부호화하는 기준이 되는 기준 신호를 변환한 스펙트럼을 말하고, 잔여 스펙트럼은 위상차와 이득값을 기준 스펙트럼에 적용함으로써 예측된 스펙트럼과 실제 스펙트럼의 오차에 해당하는 스펙트럼을 말한다.
제400단계에서 역다중화된 기준 스펙트럼, 위상차, 이득값 및 잔여 스펙트럼을 무손실 복호화하거나 소정의 멀티-채널 스펙트럼을 무손실 복호화한다(제410단계).
제410단계에서 무손실 복호화된 기준 스펙트럼을 역양자화한다(제420단계).
제420단계에서 역양자화된 기준 스펙트럼을 제1 역-변환(inverse-transform)에 의해 시간 도메인으로 역변환하여 기준 신호를 생성한다(제425단계). 여기서, 제1 역-변환의 예로 복소수 변환에서 실수부에 해당하는 MDCT(Modified Discrete Cosine Transform)가 있다.
제425단계 후에, 멀티 채널 부호화 방법에서 예측의 정확도가 낮다고 판단하여 개별적으로 부호화된 멀티-채널 신호에 해당하는지 여부를 판단한다(제427단계)
만일 멀티 채널 부호화 방법에서 개별적으로 부호화된 멀티-채널 신호에 해당하지 않는다고 제427단계에서 판단되면, 제425단계에서 역변환된 기준 신호를 제2 변환(transform)에 의해 주파수 도메인으로 변환한다(제430단계). 여기서, 제2 변환의 예로 복소수 변환에서 허수부에 해당하는 MDST(Modified Discrete Sine Transform)가 있다. 그러나 제425단계에서 제1 역-변환에 의해 역변환된 기준 신호를 제430단계에서 다시 제2 변환에 의해 변환하므로 1 프레임이 지연(delay)된다.
제410단계에서 복호화된 각 멀티-채널 스펙트럼의 위상차를 역양자화한다(제435단계). 제435단계에서는 위상차를 유니폼 스케일(uniform scale)로 역양자화할 수 있다.
제410단계에서 복호화된 각 멀티-채널 스펙트럼의 이득값을 역양자화한다(제440단계). 제440단계에서는 이득값을 로그 스케일(log scale) 또는 유니폼 스케일로 역양자화할 수 있다.
제410단계에서 복호화된 각 멀티-채널 스펙트럼에 대한 잔여 스펙트럼을 역양자화한다(제445단계).
제420단계에서 역양자화하고 제430단계에서 변환함으로써 각 멀티-채널 신호의 크기와 위상을 모두 표현할 수 있는 기준 스펙트럼에 제435단계에서 역양자화된 위상차, 제440단계에서 역양자화된 이득값 및 제445단계에서 역양자화된 잔여 스펙 트럼을 적용하여 각 멀티-채널 스펙트럼을 복원한다(제450단계). 다시 말하면, 제450단계에서는 위상차만큼 기준 스펙트럼의 위상을 이동시키고 이득값의 비율로 기준 스펙트럼의 크기를 조절한 후 잔여 스펙트럼을 가산함으로써 각 멀티-채널 스펙트럼을 복원한다. 그러나 제430단계에서 1 프레임이 지연되므로 제450단계에서는 1 프레임을 지연하여 수행하기 시작한다.
제450단계에서 복원된 각 멀티-채널 스펙트럼을 시간 도메인으로 역변환한다(제455단계).
만일 멀티 채널 부호화 방법에서 예측의 정확도가 낮다고 판단하여 개별적으로 부호화된 멀티-채널 신호이라고 제427단계에서 판단되면, 멀티 채널 부호화 방법에서 위상차와 이득값을 기준 스펙트럼에 적용하여 예측된 스펙트럼이 실제 스펙트럼에 대하여 정확하게 예측되지 않다고 판단되기 때문에 위상차, 이득값 및 잔여 스펙트럼을 부호화하는 대신에 멀티-채널 스펙트럼을 부호화한 멀티-채널 스펙트럼을 역양자화한다(제455단계).
제450단계에서 복원된 멀티-채널 스펙트럼 또는 제455단계에서 역양자화된 멀티-채널 스펙트럼을 시간 도메인으로 역변환하여 멀티-채널 신호를 생성한다(제460단계).
제420단계에서 역양자화된 기준 스펙트럼과 제460단계에서 역변환된 멀티 채널 신호를 도 3의 제300단계에서 수행된 연산의 역과정을 수행함으로써 최종적으로 멀티-채널 신호를 출력한다(제470단계). 제427단계에서 멀티 채널 부호화 방법에서 개별적으로 부호화된 멀티-채널 신호에 해당하지 않는다고 판단된 멀티-채널 신 호에 대하여 제470단계에서는 제425단계에서 역변환되고 1 프레임이 지연된 기준 신호와 제460단계에서 역변환된 멀티-채널 신호를 대상으로 수행한다. 왜냐하면, 제427단계에서 멀티 채널 부호화 방법에서 개별적으로 부호화된 멀티-채널 신호에 해당하지 않는다고 판단된 멀티-채널 신호는 제430단계에서 1 프레임이 지연되기 때문에 1 프레임을 지연시킨다.
본 발명에 대한 설명을 용이하게 하기 위하여, 신호는 시간 도메인으로 표현된 데이터이고 스펙트럼은 주파수 도메인으로 표현된 데이터로 구별하여 설명하였으나, 일반적으로 신호는 스펙트럼을 포함하는 개념이다.
이러한 본 발명에 대한 이해를 돕기 위하여 도면에 도시된 실시예를 참고로 설명되었으나, 이는 예시적인 것에 불과하며, 당해 분야에서 통상적 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위에 의해 정해져야 할 것이다.
또한, 본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장 장치 등이 있다.
도 1은 본 발명에 의한 멀티 채널 부호화 장치에 대한 일 실시예를 블록도로 도시한 것이다.
도 2는 본 발명에 의한 멀티 채널 복호화 장치에 대한 일 실시예를 블록도로 도시한 것이다.
도 3은 본 발명에 의한 멀티 채널 부호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
도 4는 본 발명에 의한 멀티 채널 복호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
〈도면의 주요 부호에 대한 간단한 설명〉
200: 역다중화부 210: 무손실 복호화부
220: 기준스펙트럼 역양자화부 225: 제1 역변환부
230: 변환부 235: 위상차 역양자화부
240: 이득값 역양자화부 245: 잔여스펙트럼 역양자화부
250: 멀티채널 스펙트럼 복원부 255: 제2 역변환부
260: 후처리부

Claims (37)

  1. 멀티-채널 신호 가운데 부호화하는 기준이 되는 기준 신호를 선택하여 부호화하는 기준신호 부호화부;
    상기 기준 신호에 대한 상기 각 멀티-채널 신호의 위상차를 계산하여 부호화하는 위상차 부호화부;
    상기 기준 신호에 대한 상기 각 멀티-채널 신호의 크기의 비율을 이득값으로 계산하여 부호화하는 이득값 부호화부; 및
    상기 위상차와 상기 이득값을 상기 기준 신호에 적용하여 예측된 각 멀티-채널 신호와 실제 각 멀티-채널 신호의 오차에 해당하는 잔여 신호를 추출하여 부호화하는 잔여 신호 부호화부를 포함하는 것을 특징으로 하는 멀티 채널 부호화 장치.
  2. 제1항에 있어서,
    상기 멀티-채널 신호의 크기와 위상을 모두 표현할 수 있도록 변환하는 변환부를 더 포함하는 것을 특징으로 하는 멀티 채널 부호화 장치.
  3. 제2항에 있어서, 상기 변환부는
    복소수 변환(complex valued transform)을 이용하여 상기 멀티-채널 신호를 변환하는 것을 특징으로 하는 멀티 채널 부호화 장치.
  4. 제2항에 있어서, 상기 변환부는
    MDCT(Modified Discrete Cosine Transform) 및 MDST(Modified Discrete Sine Transform)를 이용하여 상기 멀티-채널 신호를 변환하는 것을 특징으로 하는 멀티 채널 부호화 장치.
  5. 제1항에 있어서, 상기 위상차 부호화부 및 상기 이득값 부호화부는
    상기 예측된 각 멀티-채널 신호와 상기 실제 각 멀티-채널 신호의 평균 제곱 오차(mean squared error)가 최소화되는 위상차와 이득값을 계산하는 것을 특징으로 하는 멀티 채널 부호화 장치.
  6. 제1항에 있어서, 상기 위상차 부호화부, 상기 이득값 부호화부 및 상기 잔여 신호 부호화부는
    크리티컬 밴드(critical band)를 고려한 바크 밴드(bark band) 단위로 부호화하는 것을 특징으로 하는 멀티 채널 부호화 장치.
  7. 제1항에 있어서,
    상기 예측된 각 멀티-채널 신호에 대한 정확도를 검사하는 예측 검사부; 및
    상기 정확도가 기 설정된 임계값 보다 낮은 멀티-채널 신호에 대해 개별적으로 부호화하는 멀티채널 부호화부를 더 포함하는 것을 특징으로 하는 멀티 채널 부 호화 장치.
  8. 제7항에 있어서, 상기 멀티채널 부호화부는
    상기 위상차와 상기 이득값을 '0'으로 설정하는 것을 특징으로 하는 멀티 채널 부호화 장치.
  9. 제7항에 있어서, 상기 예측 검사부는
    상기 예측된 각 멀티-채널 신호의 에너지와 상기 잔여 신호의 에너지를 비교하여 상기 정확도를 검사하는 것을 특징으로 하는 멀티 채널 부호화 장치.
  10. 제7항에 있어서, 상기 잔여신호 부호화부는
    상기 정확도에 따라 적응적으로 상기 잔여 신호를 부호화하는 것을 특징으로 하는 멀티 채널 부호화 장치.
  11. 멀티-채널 신호 가운데 복호화하는 기준이 되는 기준 신호를 복호화하는 기준신호 복호화부;
    상기 기준 신호에 대한 상기 각 멀티-채널 신호의 위상차를 복호화하는 위상차 복호화부;
    상기 기준 신호에 대한 상기 각 멀티-채널 신호의 크기의 비율에 해당하는 이득값을 복호화하는 이득값 복호화부;
    상기 위상차와 상기 이득값을 상기 기준 신호에 적용하여 예측된 각 멀티-채널 신호와 실제 각 멀티-채널 신호의 오차에 해당하는 잔여 신호를 복호화하는 잔여 신호 복호화부; 및
    상기 위상차, 상기 이득값 및 상기 잔여 신호를 이용하여 상기 멀티-채널 신호를 복원하는 멀티채널 복원부를 포함하는 것을 특징으로 하는 멀티 채널 복호화 장치.
  12. 제11항에 있어서, 상기 멀티채널 복원부는
    상기 위상차만큼 상기 기준 신호의 위상을 이동시키고 상기 이득값의 비율로 상기 기준 신호의 크기를 조절한 후 상기 잔여 신호를 가산함으로써 상기 멀티-채널 신호를 복원하는 것을 특징으로 하는 멀티 채널 복호화 장치.
  13. 제11항에 있어서,
    상기 기준 신호를 시간 도메인으로 역변환하는 역변환부; 및
    상기 역변환된 기준 신호를 주파수 도메인으로 변환하는 변환부를 더 포함하는 것을 특징으로 하는 멀티 채널 복호화 장치.
  14. 제13항에 있어서,
    상기 역변환부는 상기 복호화된 기준 신호에 IMDCT(Inverse Modified Discrete Cosine Transform)를 적용하여 역변환하고,
    상기 변환부는 상기 역변환된 기준 신호에 대해 MDST를 적용하여 변환하는 것을 특징으로 하는 멀티 채널 복호화 장치.
  15. 제13항에 있어서,
    상기 멀티채널 복원부는 1 프레임(frame)을 지연하여 수행하는 것을 특징으로 하는 멀티 채널 복호화 장치.
  16. 제11항에 있어서,
    상기 예측된 각 멀티-채널 신호에 대한 정확도가 낮아서 개별적으로 부호화된 멀티-채널 신호를 복호화하는 멀티채널 복호화부를 더 포함하는 것을 특징으로 하는 멀티 채널 복호화 장치.
  17. 제11항에 있어서, 상기 위상차 복호화부, 상기 이득값 복호화부 및 상기 잔여 신호 복호화부는
    크리티컬 밴드를 고려한 바크 밴드 단위로 복호화하는 것을 특징으로 하는 멀티 채널 복호화 장치.
  18. 제11항에 있어서, 상기 잔여 신호 복호화부는
    상기 예측된 멀티-채널 신호에 대한 정확도에 따라 적응적으로 상기 잔여 신호를 복호화하는 것을 특징으로 하는 멀티 채널 복호화 장치.
  19. 멀티-채널 신호 가운데 부호화하는 기준이 되는 기준 신호를 선택하여 부호화하는 단계;
    상기 기준 신호에 대한 상기 각 멀티-채널 신호의 위상차를 계산하여 부호화하는 단계;
    상기 기준 신호에 대한 상기 각 멀티-채널 신호의 크기의 비율을 이득값으로 계산하여 부호화하는 단계; 및
    상기 위상차와 상기 이득값을 상기 기준 신호에 적용하여 예측된 각 멀티-채널 신호와 실제 각 멀티-채널 신호의 오차에 해당하는 잔여 신호를 추출하여 부호화하는 단계를 포함하는 것을 특징으로 하는 멀티 채널 부호화 방법.
  20. 제19항에 있어서,
    상기 멀티-채널 신호의 크기와 위상을 모두 표현할 수 있도록 변환하는 단계를 더 포함하는 것을 특징으로 하는 멀티 채널 부호화 방법.
  21. 제20항에 있어서, 상기 변환하는 단계는
    복소수 변환을 이용하여 상기 멀티-채널 신호를 변환하는 것을 특징으로 하는 멀티 채널 부호화 방법.
  22. 제20항에 있어서, 상기 변환하는 단계는
    MDCT 및 MDST를 이용하여 상기 멀티-채널 신호를 변환하는 것을 특징으로 하는 멀티 채널 부호화 방법.
  23. 제19항에 있어서, 상기 위상차를 부호화하는 단계 및 상기 이득값을 부호화하는 단계는
    상기 예측된 멀티-채널 신호와 실제 멀티-채널 신호의 평균 제곱 오차가 최소화되는 위상차와 이득값을 계산하는 것을 특징으로 하는 멀티 채널 부호화 방법.
  24. 제19항에 있어서, 상기 위상차를 부호화하는 단계, 상기 이득값을 부호화하는 단계 및 상기 잔여 신호를 부호화하는 단계는
    크리티컬 밴드를 고려한 바크 밴드 단위로 부호화하는 것을 특징으로 하는 멀티 채널 부호화 방법.
  25. 제19항에 있어서,
    상기 예측된 멀티-채널 신호에 대한 정확도를 검사하는 단계; 및
    상기 정확도가 기 설정된 임계값 보다 낮은 멀티-채널 신호에 대해 개별적으로 부호화하는 단계를 더 포함하는 것을 특징으로 하는 멀티 채널 부호화 방법.
  26. 제25항에 있어서, 상기 개별적으로 부호화하는 단계는
    상기 위상차와 상기 이득값을 '0'으로 설정하는 것을 특징으로 하는 멀티 채 널 부호화 방법.
  27. 제25항에 있어서, 상기 검사하는 단계는
    상기 예측된 멀티-채널 신호의 에너지와 상기 잔여 신호의 에너지를 비교하여 상기 정확도를 검사하는 것을 특징으로 하는 멀티 채널 부호화 방법.
  28. 제25항에 있어서, 상기 잔여 신호를 부호화하는 단계는
    상기 정확도에 따라 적응적으로 상기 잔여 신호를 부호화하는 것을 특징으로 하는 멀티 채널 부호화 방법.
  29. 멀티-채널 신호 가운데 복호화하는 기준이 되는 기준 신호를 복호화하는 단계;
    상기 기준 신호에 대한 상기 각 멀티-채널 신호의 위상차를 복호화하는 단계;
    상기 기준 신호에 대한 상기 각 멀티-채널 신호의 크기의 비율에 해당하는 이득값을 복호화하는 단계;
    상기 위상차와 상기 이득값을 상기 기준 신호에 적용하여 예측된 각 멀티-채널 신호와 실제 멀티-채널 신호의 오차에 해당하는 잔여 신호를 복호화하는 단계; 및
    상기 위상차, 상기 이득값 및 상기 잔여 신호를 이용하여 상기 멀티-채널 신 호를 복원하는 단계를 포함하는 것을 특징으로 하는 멀티 채널 복호화 방법.
  30. 제29항에 있어서, 상기 복원하는 단계는
    상기 위상차만큼 상기 기준 신호의 위상을 이동시키고 상기 이득값의 비율로 상기 기준 신호의 크기를 조절한 후 상기 잔여 신호를 가산함으로써 상기 멀티-채널 신호를 복원하는 것을 특징으로 하는 멀티 채널 복호화 방법.
  31. 제29항에 있어서,
    상기 기준 신호를 시간 도메인으로 역변환하는 단계; 및
    상기 역변환된 기준 신호를 주파수 도메인으로 변환하는 단계를 더 포함하는 것을 특징으로 하는 멀티 채널 복호화 방법.
  32. 제31항에 있어서,
    상기 역변환하는 단계는 상기 복호화된 기준 신호에 IMDCT를 적용하여 역변환하고,
    상기 변환하는 단계는 상기 역변환된 기준 신호에 대해 MDST를 적용하여 변환하는 것을 특징으로 하는 멀티 채널 복호화 방법.
  33. 제29항에 있어서,
    상기 예측된 멀티-채널 신호에 대한 정확도가 낮아서 개별적으로 부호화된 멀티-채널 신호를 복호화하는 단계를 더 포함하는 것을 특징으로 하는 멀티 채널 복호화 방법.
  34. 제29항에 있어서, 상기 위상차를 복호화하는 단계, 상기 이득값을 복호화하는 단계 및 상기 잔여 신호를 복호화하는 단계는
    크리티컬 밴드를 고려한 바크 밴드 단위로 복호화하는 것을 특징으로 하는 멀티 채널 복호화 방법.
  35. 제29항에 있어서, 상기 잔여 신호를 복호화하는 단계는
    상기 예측된 멀티-채널 신호에 대한 정확도에 따라 적응적으로 상기 잔여 신호를 복호화하는 것을 특징으로 하는 멀티 채널 복호화 방법.
  36. 멀티-채널 신호 가운데 부호화하는 기준이 되는 기준 신호를 선택하여 부호화하는 단계;
    상기 기준 신호에 대한 상기 각 멀티-채널 신호의 위상차를 계산하여 부호화하는 단계;
    상기 기준 신호에 대한 상기 각 멀티-채널 신호의 크기의 비율을 이득값으로 계산하여 부호화하는 단계; 및
    상기 위상차와 상기 이득값을 상기 기준 신호에 적용하여 예측된 각 멀티-채널 신호와 실제 멀티-채널 신호의 오차에 해당하는 잔여 신호를 추출하여 부호화하 는 단계를 포함하는 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록 매체.
  37. 멀티-채널 신호 가운데 복호화하는 기준이 되는 기준 신호를 복호화하는 단계;
    상기 기준 신호에 대한 상기 각 멀티-채널 신호의 위상차를 복호화하는 단계;
    상기 기준 신호에 대한 상기 각 멀티-채널 신호의 크기의 비율에 해당하는 이득값을 복호화하는 단계;
    상기 위상차와 상기 이득값을 상기 기준 신호에 적용하여 예측된 각 멀티-채널 신호와 실제 멀티-채널 신호의 오차에 해당하는 잔여 신호를 복호화하는 단계; 및
    상기 위상차, 상기 이득값 및 상기 잔여 신호를 이용하여 상기 멀티-채널 신호를 복원하는 단계를 포함하는 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록 매체.
KR1020080067815A 2008-07-11 2008-07-11 멀티 채널 부호화 및 복호화 방법 및 장치 KR101428487B1 (ko)

Priority Applications (7)

Application Number Priority Date Filing Date Title
KR1020080067815A KR101428487B1 (ko) 2008-07-11 2008-07-11 멀티 채널 부호화 및 복호화 방법 및 장치
EP09794678A EP2312851A4 (en) 2008-07-11 2009-07-13 METHOD AND DEVICE FOR MULTI-CHANNEL CODING AND DECODING
JP2011517358A JP5462256B2 (ja) 2008-07-11 2009-07-13 マルチチャネルの符号化及び復号化方法並びに装置
US12/458,450 US20100014679A1 (en) 2008-07-11 2009-07-13 Multi-channel encoding and decoding method and apparatus
CN2009801346358A CN102144392A (zh) 2008-07-11 2009-07-13 用于多信道编码和解码的方法及设备
PCT/KR2009/003831 WO2010005272A2 (ko) 2008-07-11 2009-07-13 멀티 채널 부호화 및 복호화 방법 및 장치
JP2014006222A JP5922684B2 (ja) 2008-07-11 2014-01-16 マルチチャネルの復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080067815A KR101428487B1 (ko) 2008-07-11 2008-07-11 멀티 채널 부호화 및 복호화 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20100007256A true KR20100007256A (ko) 2010-01-22
KR101428487B1 KR101428487B1 (ko) 2014-08-08

Family

ID=41507604

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080067815A KR101428487B1 (ko) 2008-07-11 2008-07-11 멀티 채널 부호화 및 복호화 방법 및 장치

Country Status (6)

Country Link
US (1) US20100014679A1 (ko)
EP (1) EP2312851A4 (ko)
JP (2) JP5462256B2 (ko)
KR (1) KR101428487B1 (ko)
CN (1) CN102144392A (ko)
WO (1) WO2010005272A2 (ko)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9330671B2 (en) * 2008-10-10 2016-05-03 Telefonaktiebolaget L M Ericsson (Publ) Energy conservative multi-channel audio coding
EP2486567A1 (en) * 2009-10-09 2012-08-15 Dolby Laboratories Licensing Corporation Automatic generation of metadata for audio dominance effects
EP2369861B1 (en) * 2010-03-25 2016-07-27 Nxp B.V. Multi-channel audio signal processing
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
ES2935911T3 (es) * 2010-04-09 2023-03-13 Dolby Int Ab Descodificación estéreo de predicción compleja basada en MDCT
ES2950751T3 (es) * 2010-04-13 2023-10-13 Fraunhofer Ges Forschung Codificador de audio o vídeo, decodificador de audio o vídeo y métodos relacionados para procesar señales de audio o vídeo multicanal usando una dirección de predicción variable
JP2011257575A (ja) * 2010-06-09 2011-12-22 Cri Middleware Co Ltd 音声処理装置、音声処理方法、プログラムおよび記録媒体
AU2011295367B2 (en) * 2010-08-25 2014-07-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for decoding a signal comprising transients using a combining unit and a mixer
US9219972B2 (en) 2010-11-19 2015-12-22 Nokia Technologies Oy Efficient audio coding having reduced bit rate for ambient signals and decoding using same
KR101943049B1 (ko) * 2011-06-30 2019-01-29 에스케이텔레콤 주식회사 영상 부호화/복호화 방법 및 장치
JP6267860B2 (ja) * 2011-11-28 2018-01-24 三星電子株式会社Samsung Electronics Co.,Ltd. 音声信号送信装置、音声信号受信装置及びその方法
JP6051621B2 (ja) * 2012-06-29 2016-12-27 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、及びオーディオ復号装置
US9711150B2 (en) 2012-08-22 2017-07-18 Electronics And Telecommunications Research Institute Audio encoding apparatus and method, and audio decoding apparatus and method
WO2014030938A1 (ko) * 2012-08-22 2014-02-27 한국전자통신연구원 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법
WO2015150480A1 (en) * 2014-04-02 2015-10-08 Dolby International Ab Exploiting metadata redundancy in immersive audio metadata
US9943879B2 (en) 2014-10-06 2018-04-17 Edgewell Personal Care Brands, Llc Method of shaping a surface coating on a razor blade
US10109284B2 (en) 2016-02-12 2018-10-23 Qualcomm Incorporated Inter-channel encoding and decoding of multiple high-band audio signals
DE102016206327A1 (de) 2016-04-14 2017-10-19 Sivantos Pte. Ltd. Verfahren zum Übertragen eines Audiosignals von einem Sender zu einem Empfänger
DE102016206985A1 (de) 2016-04-25 2017-10-26 Sivantos Pte. Ltd. Verfahren zum Übertragen eines Audiosignals
EP3467824B1 (en) * 2017-10-03 2021-04-21 Dolby Laboratories Licensing Corporation Method and system for inter-channel coding
CN114708874A (zh) 2018-05-31 2022-07-05 华为技术有限公司 立体声信号的编码方法和装置
CN112599133A (zh) * 2020-12-15 2021-04-02 北京百度网讯科技有限公司 基于车辆的语音处理方法、语音处理器、车载处理器
CN117476021A (zh) * 2022-07-27 2024-01-30 华为技术有限公司 量化方法、反量化方法及其装置

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5703999A (en) * 1992-05-25 1997-12-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Process for reducing data in the transmission and/or storage of digital signals from several interdependent channels
US6263312B1 (en) * 1997-10-03 2001-07-17 Alaris, Inc. Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
DE60214599T2 (de) * 2002-03-12 2007-09-13 Nokia Corp. Skalierbare audiokodierung
US7542896B2 (en) * 2002-07-16 2009-06-02 Koninklijke Philips Electronics N.V. Audio coding/decoding with spatial parameters and non-uniform segmentation for transients
WO2004072956A1 (en) * 2003-02-11 2004-08-26 Koninklijke Philips Electronics N.V. Audio coding
EP1683133B1 (en) 2003-10-30 2007-02-14 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
US6980933B2 (en) * 2004-01-27 2005-12-27 Dolby Laboratories Licensing Corporation Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients
ATE430360T1 (de) 2004-03-01 2009-05-15 Dolby Lab Licensing Corp Mehrkanalige audiodekodierung
RU2382419C2 (ru) * 2004-04-05 2010-02-20 Конинклейке Филипс Электроникс Н.В. Многоканальный кодер
BRPI0509113B8 (pt) * 2004-04-05 2018-10-30 Koninklijke Philips Nv codificador de multicanal, método para codificar sinais de entrada, conteúdo de dados codificados, portador de dados, e, decodificador operável para decodificar dados de saída codificados
RU2392671C2 (ru) * 2004-04-05 2010-06-20 Конинклейке Филипс Электроникс Н.В. Способы и устройства для кодирования и декодирования стереосигнала
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
JP4939933B2 (ja) * 2004-05-19 2012-05-30 パナソニック株式会社 オーディオ信号符号化装置及びオーディオ信号復号化装置
ATE416455T1 (de) * 2004-06-21 2008-12-15 Koninkl Philips Electronics Nv Verfahren und vorrichtung zum kodieren und dekodieren von mehrkanaltonsignalen
US20060015329A1 (en) * 2004-07-19 2006-01-19 Chu Wai C Apparatus and method for audio coding
WO2006022190A1 (ja) * 2004-08-27 2006-03-02 Matsushita Electric Industrial Co., Ltd. オーディオエンコーダ
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
MX2007005261A (es) * 2004-11-04 2007-07-09 Koninkl Philips Electronics Nv Codificacion y descodificacion de un conjunto de senales.
RU2407068C2 (ru) * 2004-11-04 2010-12-20 Конинклейке Филипс Электроникс Н.В. Многоканальное кодирование и декодирование
KR20070092240A (ko) * 2004-12-27 2007-09-12 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치 및 음성 부호화 방법
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
KR100707186B1 (ko) * 2005-03-24 2007-04-13 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
JP4887288B2 (ja) * 2005-03-25 2012-02-29 パナソニック株式会社 音声符号化装置および音声符号化方法
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
US20090210219A1 (en) * 2005-05-30 2009-08-20 Jong-Mo Sung Apparatus and method for coding and decoding residual signal
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
KR100803205B1 (ko) * 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
CN101253557B (zh) * 2005-08-31 2012-06-20 松下电器产业株式会社 立体声编码装置及立体声编码方法
KR100904439B1 (ko) * 2006-02-23 2009-06-26 엘지전자 주식회사 오디오 신호의 처리 방법 및 장치
US8571875B2 (en) * 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
KR101450940B1 (ko) * 2007-09-19 2014-10-15 텔레폰악티에볼라겟엘엠에릭슨(펍) 멀티채널 오디오의 조인트 인핸스먼트

Also Published As

Publication number Publication date
WO2010005272A3 (ko) 2010-04-15
US20100014679A1 (en) 2010-01-21
KR101428487B1 (ko) 2014-08-08
CN102144392A (zh) 2011-08-03
JP2014063202A (ja) 2014-04-10
JP2011527763A (ja) 2011-11-04
WO2010005272A2 (ko) 2010-01-14
EP2312851A2 (en) 2011-04-20
EP2312851A4 (en) 2012-06-20
JP5922684B2 (ja) 2016-05-24
JP5462256B2 (ja) 2014-04-02

Similar Documents

Publication Publication Date Title
KR101428487B1 (ko) 멀티 채널 부호화 및 복호화 방법 및 장치
TWI555008B (zh) 使用在智慧間隙填充架構內之雙聲道處理之音頻編碼器、音頻解碼器及相關方法
JP6170520B2 (ja) オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置
JP5219800B2 (ja) コード化されたオーディオの経済的な音量計測
EP2250572B1 (en) Lossless multi-channel audio codec using adaptive segmentation with random access point (rap) capability
KR100803205B1 (ko) 저비트율 오디오 신호 부호화/복호화 방법 및 장치
CN105679327B (zh) 用于对音频信号进行编码和解码的方法及设备
KR101411901B1 (ko) 오디오 신호의 부호화/복호화 방법 및 장치
KR101397058B1 (ko) 신호 처리 방법 및 이의 장치
US8515770B2 (en) Method and apparatus for encoding and decoding excitation patterns from which the masking levels for an audio signal encoding and decoding are determined
KR20080027129A (ko) 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
KR20090083069A (ko) 오디오 신호의 부호화, 복호화 방법 및 장치
JP4685165B2 (ja) 仮想音源位置情報に基づいたチャネル間レベル差量子化及び逆量子化方法
US9240192B2 (en) Device and method for efficiently encoding quantization parameters of spectral coefficient coding
KR100707173B1 (ko) 저비트율 부호화/복호화방법 및 장치
KR102052144B1 (ko) 음성 신호의 대역 선택적 양자화 방법 및 장치
KR100928966B1 (ko) 저비트율 부호화/복호화방법 및 장치
KR101449432B1 (ko) 신호 부호화 및 복호화 방법 및 장치
KR100940532B1 (ko) 저비트율 복호화방법 및 장치
KR20230028912A (ko) 오디오 압축 효율 향상 장치 및 방법
KR20230018838A (ko) 벡터 양자화된 잔여오차 특징을 사용한 오디오 부호화/복호화 장치 및 그 방법
KR20130012972A (ko) 오디오/스피치 신호 부호화방법
KR20120089230A (ko) 신호 복호화 장치
KR20090043352A (ko) 상호 운용성을 지원하는 오디오/스피치 신호의부호화/복호화 방법 및 시스템

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180727

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190730

Year of fee payment: 6