KR101607334B1 - 멀티 채널 오디오 디코딩 방법 및 멀티 채널 오디오 코덱 - Google Patents

멀티 채널 오디오 디코딩 방법 및 멀티 채널 오디오 코덱 Download PDF

Info

Publication number
KR101607334B1
KR101607334B1 KR1020100022234A KR20100022234A KR101607334B1 KR 101607334 B1 KR101607334 B1 KR 101607334B1 KR 1020100022234 A KR1020100022234 A KR 1020100022234A KR 20100022234 A KR20100022234 A KR 20100022234A KR 101607334 B1 KR101607334 B1 KR 101607334B1
Authority
KR
South Korea
Prior art keywords
signal
panning
channel audio
reverberation
energy
Prior art date
Application number
KR1020100022234A
Other languages
English (en)
Other versions
KR20110103094A (ko
Inventor
서정일
유재현
강경옥
홍진우
김진웅
현동일
전세운
박영철
윤대희
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020100022234A priority Critical patent/KR101607334B1/ko
Publication of KR20110103094A publication Critical patent/KR20110103094A/ko
Application granted granted Critical
Publication of KR101607334B1 publication Critical patent/KR101607334B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Stereophonic System (AREA)

Abstract

멀티 채널 오디오 디코딩 방법이 개시된다. 멀티 채널 오디오 디코딩 방법은, 패닝 신호의 방향 정보를 이용하여 패닝 신호를 리패닝하고, 레벨 조절 없이 리패닝된 신호와 레벨이 조정된 잔향 신호를 가산하여 멀티 채널 오디오 신호를 복원할 수 있다. 이에 따라, 복원된 멀티 채널 오디오 신호의 PAR가 원본 멀티 채널 오디오 신호의 PAR와 거의 동일하여 음질 열화가 최소화될 수 있다.

Description

멀티 채널 오디오 디코딩 방법 및 멀티 채널 오디오 코덱{METHOD FOR DECODING MULTI-CHANNEL AUDIO SIGNALS AND MULTI-CHANNEL AUDIO CODEC}
멀티 채널 오디오 디코딩 방법 및 멀티 채널 오디오 코덱이 개시된다. 특히, PCA(Principal Component Analysis)를 기반으로 하는 멀티 채널 오디오 디코딩 기술이 개시된다.
본 발명은 방송통신위원회, 지식경제부 및 한국산업기술평가관리원의 IT 원천기술개발사업의 일환으로 수행한 연구로부터 도출된 것이다 [과제관리번호: 2008-F-011-01, 과제명: 차세대 DTV 핵심기술 개발].
최근, 멀티 미디어 콘텐츠가 보급됨에 따라 더욱 현장감 넘치고, 풍부한 음원 환경을 경험하고자 하는 사용자들의 요구가 증가하고 있다. 이러한 사용자들의 요구를 충족시키기 위해 멀티 채널 오디오에 대한 연구가 진행되고 있다.
멀티 채널 오디오는 전송 환경에 따라 고효율의 데이터 압축률을 요구한다. 특히, 멀티 채널 오디오 신호를 복원하기 위해, 공간 파라미터(Spatial Parameter)가 이용된다. 이때, 공간 파라미터를 추출하는 과정에서 잔향 신호의 영향으로 왜곡이 발생할 수 있다. 그러면, 멀티 채널 오디오 신호를 복원함에 있어서, 음질 열화가 발생할 수 있다.
따라서, 공간 파라미터를 이용하여 멀티 채널 오디오 신호를 복원하는 경우에 발생할 수 있는 음질 열화를 감소 또는 제거할 수 있는 멀티 채널 오디오 코덱 기술이 필요하다.
본 발명은 복원된 신호의 음질 열화를 최소화할 수 있는 PCA 기반의 멀티 채널 오디오 디코딩 방법을 제공한다.
멀티 채널 오디오 디코딩 방법은, 방향 정보 및 에너지 정보를 포함하는 공간 파라미터와 패닝 신호를 수신하는 단계, 상기 방향 정보를 이용하여 상기 패닝 신호의 방향성이 멀티 채널 오디오 신호의 방향성과 동일해도록 상기 패닝 신호를 리패닝하는 단계, 상기 패닝 신호를 디코릴레이션하여 잔향 신호를 생성하는 단계, 상기 방향 정보 및 상기 에너지 정보를 이용하여 상기 생성된 잔향 신호의 레벨을 조정하는 단계, 및 상기 레벨이 조정된 잔향 신호와 상기 리패닝된 신호를 이용하여 상기 원본 입력 신호를 복원하는 단계를 포함할 수 있다.
이때, 상기 복원하는 단계는, 상기 리패닝된 신호를 레벨 조절 없이 바로 입력 받아 상기 레벨이 조정된 잔향 신호와 가산함으로써 상기 원본 입력 신호를 복원할 수 있다.
또한, 상기 잔향 신호의 레벨을 조정하는 단계는, 상기 복원된 원본 입력 신호의 PAR가 상기 원본 입력 신호의 PAR와 동일해지도록 상기 잔향 신호의 레벨을 조정할 수 있다.
또한, 상기 잔향 신호를 생성하는 단계는, 상기 원본 입력 신호가 멀티 채널 오디오 신호인 경우, 멀티 채널들에 해당하는 잔향 신호들 간의 상관도가 제거되도록 상기 패닝 신호를 디코릴레이션하여, 상기 멀티 채널들에 해당하는 잔향 신호들을 생성할 수 있다.
이때, 상기 패닝 신호는, 상기 멀티 채널 오디오 신호에서 방향성을 갖는 신호이다. 그리고, 상기 방향 정보는, 상기 멀티 채널 오디오 신호의 게인을 이용하여 획득된 방향각을 포함하고, 상기 에너지 정보는, 상기 멀티 채널 오디오 신호의 PAR을 포함할 수 있다.
멀티 채널 오디오 디코딩 방법은, 리패닝된 신호의 레벨을 조절없이 그대로 이용하여 원본 입력 신호를 복원함으로써, 복원된 신호의 음질 저하를 감소시킬 수 있다.
또한, 잔향 신호의 레벨 만을 조절하여 원본 입력 신호를 복원함으로써, 패닝 신호의 방향 및 PAR에 상관없이 원본 입력 신호의 PAR를 유지할 수 있다.
도 1은 본 발명의 일 실시예에 따른 멀티 채널 오디오 코덱에서 인코딩 장치의 구성을 도시한 도면이다.
도 2는 멀티 채널 오디오 코덱에서 디코딩 장치 구성을 도시한 도면이다.
도 3 및 도 4는 멀티 채널 오디오 신호를 복원하는 방법을 설명하기 위해 제공되는 도면이다.
도 5는 본 발명의 일 실시예에 따른 멀티 채널 오디오 디코딩 방법을 설명하기 위해 제공되는 흐름도이다.
이하에서는 첨부된 도면을 참조하여, 본 발명의 실시예를 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 멀티 채널 오디오 코덱에서 인코딩 장치의 구성을 도시한 도면이다.
도 1을 참조하면, 인코딩 장치(100)는 T/F 변환부(110), 서브밴드 분석부(120), 다운믹싱부(130), 서브밴드 합성부(140), F/T 변환부(150)를 포함할 수 있다.…
T/F 변환부(110)는 멀티 채널 오디오 신호를 시간 영역에서 주파수 영역으로 변환할 수 있다.
일례로, 2채널의 멀티 채널 오디오 신호인 경우, T/F 변환부(110)는 2채널의 멀티채널 오디오 신호(x1, x2)를 시간 영역에서 주파수 영역으로 변환할 수 있다. 그리고, 멀티 채널 오디오 신호가 3채 널 이상으로 구성된 경우, T/F 변환부(110)는 3채널 이상의 멀티 채널 오디오 신호(x1, x2,…,xn)를 시간 영역에서 주파수 영역으로 변환할 수 있다.
서브밴드 분석부(Subband Analysis: 120)는 T/F 변환부(110)를 통하여 시간 영역에서 주파수 영역으로 변환된 멀티 채널 오디오 신호들을 주파수 영역 상의 제한된 개수(예를 들어, 20개 내외)의 서브밴드들로 분리할 수 있다.
일실시예로, MPEG Surround의 경우, 서브밴드 분석부(120)에서는 Hybrid QMF(Quadrature Mirror Filter) T/F 변환을 수행한 신호들을 제한된 개수(예를 들어 24개)의 서브밴드로 그룹화할 수 있다.
다운믹싱부(Downmixing: 130)는 PCA(Principal Component Analysis) 기법을 이용하여 멀티 채널 오디오 신호로부터 패닝 신호와 잔향 신호를 분리할 수 있다. 여기서, 패닝 신호는, 멀티 채널 오디오 신호에서 방향성을 갖는 신호이고, 잔향 신호는 음원이 동작을 멈추어 직접음을 들을 수 없게 된 뒤에도 주위 물체의 반사로 인해 음이 계속 존재하는 신호이다.
이때, 멀티 채널 오디오 신호는 패닝 신호와 잔향 신호를 포함할 수 있다.
Figure 112010015800762-pat00001
수학식 1에서, k는 채널 번호, xk(n)은 멀티 채널 오디오 신호, ak는 패닝 게인, s(n)은 패닝 신호, nk(n)은 잔향 신호이다. 이때, 채널 별 잔향 신호들(n1(n),…,nk(n))은 독립적(independent)하고, 채널 별 잔향 신호의 에너지(Pn=Pn1=Pn2=…=Pnk)는 동일한 것을 가정한다.
보다 상세하게는, 다운믹싱부(130)는 멀티 채널 오디오 신호를 대상으로, PCA 기법을 이용하여 채널 별로 고유값(eigenvalue) 및 고유벡터(eigenvector)를 계산할 수 있다.
그리고, 다운믹싱부(130)는 멀티 채널 오디오 신호를 대상으로, 계산된 고유값들 중 가장 큰 고유값에 해당하는 고유벡터를 이용하여 프로젝션(projection)된 신호를 패닝 신호로 분리할 수 있다. 일례로, 멀티 채널 오디오 신호가 2채널로 구성된 경우, 다운믹싱부(130)는 아래의 수학식 2와 같이, 패닝 신호를 분리할 수 있다.
Figure 112010015800762-pat00002
수학식 2에서,
Figure 112010015800762-pat00003
은 PCA 기법을 이용하여 분리된 패닝 신호이고,
Figure 112010015800762-pat00004
는 가장 큰 고유값에 해당하는 고유벡터이다.
또한, 다운믹싱부(130)는 PCA 기법을 이용하여 멀티 채널 오디오 신호로부터 공간 파라미터를 추출할 수 있다. 여기서, 공간 파라미터는, 방향 정보 및 에너지 정보를 포함할 수 있다.
일례로, 다운믹싱부(130)는 멀티 채널 오디오 신호의 고유값 및 고유벡터를 기초로 레벨 패닝 기법을 이용하여 채널 별 패닝 게인(Panning Gain)을 계산할 수 있다.
그리고, 다운믹싱부(130)는, 계산된 채널 별 패닝 게인의 비율로써 방향각(
Figure 112010015800762-pat00005
)을 계산할 수 있다. 여기서, 계산된 방향각(
Figure 112010015800762-pat00006
)이 패닝 신호의 방향 정보로 이용될 수 있다. 이때, 계산된 방향각은 입력된 멀티 채널 오디오 신호에서 가정된 패닝 기법에 의해 공간적으로 인지되는 방향을 나타내며, 패닝 기법의 종류에 따라 달라질 수 있다.
그리고, 다운믹싱부(130)는 계산된 고유값(
Figure 112010015800762-pat00007
)을 이용하여 패닝 신호의 에너지 정보를 계산할 수 있다.
이때, 계산된 고유값은 패닝 신호와 잔향 신호의 에너지 합으로 구성된 제1 고유값(
Figure 112010015800762-pat00008
)과 잔향 신호의 에너지만으로 구성된 제2 고유값(
Figure 112010015800762-pat00009
)을 포함할 수 있다.
일례로, 다운믹싱부(130)는 계산된 고유값을 이용하여 패닝 신호의 PAR(Principal to Ambient energy Ratio)을 계산할 수 있다. 이때, 계산된 PAR이 패닝 신호의 에너지 정보로 이용될 수 있으며, PAR는 아래의 수학식 3과 같다.
Figure 112010015800762-pat00010
수학식 3에서, Ps는 패닝 신호의 에너지, Pn은 잔향 신호의 에너지이다. 수학식 3에 따르면, PAR은 패닝 신호 대 잔향 비를 나타낸다.
서브밴드 합성부(Subband Synthesis: 140)는 기정의된 서브밴드 별로 패닝 신호를 합성하여 각 서브밴드 별 패닝 신호를 계산할 수 있다.
F/T 변환부(150)는 서브밴드 합성부(140)에서 합성된 서브밴드 별 패닝 신호를 주파수 영역에서 시간 영역으로 변환하여 출력할 수 있다. 그러면, 시간 영역으로 변환된 패닝 신호(
Figure 112010015800762-pat00011
)는 공간 파라미터와 함께 디코딩 장치로 전송될 수 있다. 여기서, 공간 파라미터는, 패닝 신호의 에너지 정보 및 방향 정보를 포함할 수 있다.
이하에서는, 도 2를 참조하여 디코딩 장치에서 공간 파라미터 및 패닝 신호를 이용하여 멀티 채널 오디오 신호를 복원하는 방법에 대해 설명하기로 한다.
도 2는 멀티 채널 오디오 코덱에서 디코딩 장치 구성을 도시한 도면이다.
도 2를 참조하면, 디코딩 장치(200)는 T/F 변환부(210), 서브밴드 분석부(220), 리패닝부(230), 디콜리레이터(240), 후처리부(250), 가산부(260), 서브밴드 합성부(270), 및 F/T 변환부(280)를 포함할 수 있다.
T/F 변환부(210)는 인코딩 장치(100)로부터 전달된 패닝 신호를 시간 영역에서 주파수 영역으로 변환할 수 있다.
서브밴드 분석부(220)는 T/F 변환부(210)를 통하여 시간 영역에서 주파수 영역으로 변환된 멀티 채널 오디오 신호들을 주파수 영역 상의 제한된 개수(예를 들어, 20개 내외)의 서브밴드들로 분리할 수 있다.
리패닝부(230)는 서브밴드 분석부(220)에서 제한된 개수의 서브밴드들로 분리된 패닝 신호를 리패닝(re-panning)할 수 있다.
이때, 리패닝부(230)는 인코딩 장치(100)로부터 전달된 공간 파라미터에 포함된 방향 정보를 이용하여 패닝 신호를 리패닝할 수 있다. 그러면, 리패닝된 신호는 음원 공간 상에서 원본 멀티 채널 오디오 신호와 동일한 방향성을 가질 수 있다. 즉, 리패닝된 신호는 도 1에서 입력된 원보 멀티 채널 오디오 신호(x1, x2)와 동일한 방향성을 가질 수 있다.
일례로, 도 3 및 도 4와 같이, 리패닝부(230)는 패닝 신호(
Figure 112010015800762-pat00012
)에 채널 별 패닝 게인(
Figure 112010015800762-pat00013
)을 곱함으로써 패닝 신호를 리패닝할 수 있다.
디코릴레이터(decorrelator: 240)는 패닝 신호를 디코릴레이션하여 채널 별 잔향 신호를 생성할 수 있다. 이때, 디코릴레이터(240)는 채널 별 잔향 신호 간의 상관도가 제거되도록 잔향 신호를 생성할 수 있다.
일례로, 디코릴레이터(240)는 채널 별 잔향 신호 간의 상관도가 0 또는 0에 근사한 값이 되도록 잔향 신호를 생성할 수 있다. 그러면, 생성된 잔향 신호는 음원의 공간감을 확장시킬 수 있다.
후처리부(post scaling; 250)는 공간 파라미터를 이용하여 잔향 신호의 레벨을 조정할 수 있다. 이때, 후처리부(250)는 복원될 멀티 채널 오디오 신호의 에너지 레벨이 멀티 채널 오디오 신호의 에너지 레벨과 동일하거나, 또는 멀티 채널 오디오 신호의 에너지 레벨에 최대한 근사해지도록 잔향 신호의 레벨을 조정할 수 있다.
일례로, 공간 파라미터는, 패닝 신호의 방향 정보 및 에너지 정보를 포함할 수 있다. 이때, 방향 정보는 패닝 신호의 방향각을 포함하고, 채널 별 패닝 게인의 비율로서 획득될 수 있다. 그리고, 에너지 정보는 패닝 신호의 PAR를 포함할 수 있다.
가산부(260)는 리패닝된 신호와 레벨이 조절된 채널 별 잔향 신호를 가산하여 멀티 채널 오디오 신호를 복원할 수 있다.
이때, 가산부(260)는 리패닝된 신호의 레벨 조절 없이, 리패닝된 신호를 그대로 이용하여 잔향 신호와 가산할 수 있다. 이에 따라, 복원된 멀티 채널 오디오 신호의 에너지 레벨은 원본 멀티 채널 오디오 신호의 에너지 레벨과 동일할 수 있다.
일례로, 가산부(260)는 아래의 수학식 4와 같이, 리패닝된 신호와 레벨이 조절된 잔향 신호를 가산하여 멀티 채널 오디오 신호를 복원할 수 있다.
Figure 112010015800762-pat00014
수학식 4에서
Figure 112010015800762-pat00015
는 리패닝된 신호,
Figure 112010015800762-pat00016
는 레벨이 조정된 잔향 신호이다.
서브밴드 합성부(270)는 기정의된 서브밴드 별로 멀티 채널 오디오 신호를 합성하여 각 서브밴드 별 멀티 채널 오디오 신호를 계산할 수 있다.
F/T 변환부(280)는 서브밴드 합성부(270)에서 합성된 서브밴드 별 멀티 채널 오디오 신호를 주파수 영역에서 시간 영역으로 변환하여 출력할 수 있다.
도 5는 본 발명의 일 실시예에 따른 멀티 채널 오디오 디코딩 방법을 설명하기 위해 제공되는 흐름도이다.
도 5를 참조하면, 디코딩 장치(200)는 인코딩 장치(100)에서 분리된 패닝 신호와 공간 파라미터를 수신할 수 있다(S510). 여기서, 패닝 신호는, 멀티 채널 오디오 신호에서 방향성을 갖는 신호이다. 그리고, 공간 파라미터는, 패닝 신호의 방향 정보 및 에너지 정보를 포함할 수 있다.
이어, 디코딩 장치(200)는 공간 파라미터를 이용하여 패닝 신호를 리패닝할 수 있다(S520).
일례로, 디코딩 장치(200)는 패닝 신호의 방향 정보를 이용하여 패닝 신호가 방향성을 갖도록 리패닝할 수 있다.
그리고, 디코딩 장치(200)는 패닝 신호를 디코릴레이션하여 채널 별 잔향 신호를 생성할 수 있다(S530).
이어, 디코딩 장치(200)는 공간 파라미터를 이용하여 생성된 잔향 신호의 레벨을 조정할 수 있다(S540).
일례로, 디코딩 장치(200)는 위의 수학식 6과 같이, 방향 정보와 에너지 정보를 이용하여 잔향 신호의 레벨을 조정할 수 있다. 이때, 디코딩 장치(200)는 복원될 멀티 채널 오디오 신호의 에너지 레벨이 멀티 채널 오디오 신호의 에너지 레벨과 동일하거나, 또는 멀티 채널 오디오 신호의 에너지 레벨에 최대한 근사해지도록 잔향 신호의 레벨을 조정할 수 있다.
그리고, 디코딩 장치(200)는 레벨이 조정된 잔향 신호와 리패닝된 신호를 이용하여 멀티 채널 오디오 신호를 복원할 수 있다(S550).
일례로, 디코딩 장치(200)는 수학식 6과 같이, 레벨이 조정된 잔향 신호와 리패닝된 신호를 가산함으로써 멀티 채널 오디오 신호를 복원할 수 있다. 이에 따라, 패닝 게인 또는 원본 멀티 채널 오디오 신호의 PAR와 관계없이 멀티 채널 오디오 신호가 복원될 수 있다. 이때, 복원된 멀티 채널 오디오 신호의 PAR는 원본 멀티 채널 오디오 신호의 PAR와 동일하거나, 또는 근사한 값을 가질 수 있다.
지금까지, 설명의 편의를 위해, 멀티 채널 오디오 신호가 2 채널로 구성된 경우에 공간 파라미터를 이용하여 멀티 채널 오디오 신호를 복원하는 것에 대해 설명하였으나, 이는 실시예에 해당되며, 멀티 채널 오디오 신호는 3 채널 이상으로 구성될 수 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
100: 인코딩 장치
200: 디코딩 장치
110, 210: T/F 변환부
120, 220: 서브밴드 분석부
130: 다운믹싱부
140, 270: 서브밴드 합성부
150, 280: F/T 변환부
230: 리패닝부
240: 디코릴레이터
250: 후처리부
260: 가산부

Claims (12)

  1. 원본 멀티 채널 오디오 신호에서 분리된 패닝 신호, 상기 패닝 신호의 방향 정보, 및 상기 패닝 신호의 에너지 정보를 수신하는 단계;
    상기 방향 정보를 이용하여 상기 패닝 신호를 리패닝하는 단계;
    상기 패닝 신호를 이용하여 잔향 신호를 생성하는 단계;
    상기 방향 정보 및 상기 에너지 정보를 이용하여 상기 잔향 신호의 레벨을 조정하는 단계; 및
    상기 레벨이 조정된 잔향 신호와 상기 리패닝된 패닝 신호를 이용하여 원본 멀티 채널 오디오 신호를 복원하는 단계
    를 포함하고,
    상기 에너지 정보는,
    상기 패닝 신호의 에너지와 잔향 신호의 에너지 간의 비를 나타내는 PAR(Principal to Ambient energy Ratio)을 포함하는 멀티 채널 오디오 디코딩 방법.
  2. 제1항에 있어서,
    상기 잔향 신호의 레벨을 조정하는 단계는,
    복원될 멀티 채널 오디오 신호의 에너지 레벨이 원본 멀티 채널 오디오 신호의 에너지 레벨과 동일해지도록 상기 잔향 신호의 레벨을 조정하는 멀티 채널 오디오 디코딩 방법.
  3. 제1항에 있어서,
    상기 잔향 신호를 생성하는 단계는,
    채널 별 잔향 신호 간의 상관도가 제거되도록 상기 잔향 신호를 생성하는 멀티 채널 오디오 디코딩 방법.
  4. 제1항에 있어서,
    상기 패닝 신호를 리패닝하는 단계는,
    리패닝된 패닝 신호가 음원 공간 상에서 원본 멀티 채널 오디오 신호와 동일한 방향성을 가지도록 리패닝하는 멀티 채널 오디오 디코딩 방법.
  5. 제1항에 있어서,
    상기 패닝 신호를 주파수 영역 상의 제한된 개수의 서브 밴드들로 분리하는 단계
    를 더 포함하고,
    상기 패닝 신호를 리패닝하는 단계는,
    서브 밴드들로 분리된 패닝 신호를 리패닝하는 멀티 채널 오디오 디코딩 방법.
  6. 제5항에 있어서,
    복원한 멀티 채널 오디오 신호를 기정의된 서브 밴드 별로 합성하여 각 서브 밴드별 멀티 채널 오디오 신호를 계산하는 단계
    를 더 포함하는 멀티 채널 오디오 디코딩 방법.
  7. 제1항에 있어서,
    상기 방향 정보는,
    원본 멀티 채널 오디오 신호의 채널별 패닝 게인(Panning Gain)을 이용하여 획득된 방향각을 포함하는 멀티 채널 오디오 디코딩 방법.
  8. 원본 멀티 채널 오디오 신호로부터 잔향 신호와 원본 멀티 채널 오디오 신호에서 방향성을 갖는 패닝 신호를 분리하는 단계;
    원본 멀티 채널 오디오 신호로부터 방향 정보 및 에너지 정보를 추출하는 단계; 및
    상기 방향 정보, 상기 에너지 정보 및 상기 패닝 신호를 전송하는 단계
    를 포함하고,
    상기 에너지 정보는,
    상기 패닝 신호의 에너지와 상기 잔향 신호의 에너지 간의 비를 나타내는 PAR을 포함하는 멀티 채널 오디오 인코딩 방법.
  9. 제8항에 있어서,
    상기 분리하는 단계는
    원본 멀티 채널 오디오 신호의 채널 별로 고유값(eigenvalue) 및 고유벡터(eigenvector)를 계산하고, 상기 고유값들 중 가장 큰 고유값에 해당하는 고유 벡터를 이용하여 프로젝션(projection)된 신호를 패닝 신호로 분리하는 멀티 채널 오디오 인코딩 방법.
  10. 제8항에 있어서,
    상기 추출하는 단계는,
    원본 멀티 채널 오디오 신호에서 패닝 기법에 의해 공간적으로 인지되는 방향을 나타내는 방향각을 계산하여 상기 방향 정보로 추출하는 멀티 채널 오디오 인코딩 방법.
  11. 제8항에 있어서,
    원본 멀티 채널 오디오 신호들을 복수의 서브 밴드들로 분리하는 단계
    를 더 포함하고,
    상기 분리하는 단계는,
    서브 밴드들로 분리된 원본 멀티 채널 오디오 신호로부터 잔향 신호와 패닝 신호를 분리하며,
    상기 추출하는 단계는,
    서브 밴드들로 분리된 원본 멀티 채널 오디오 신호로부터 방향 정보 및 에너지 정보를 추출하는 멀티 채널 오디오 인코딩 방법.
  12. 제11항에 있어서,
    상기 서브 밴드들 별로 상기 패닝 신호를 합성하여 서브밴드 별 패닝 신호를 계산하는 단계
    를 더 포함하는 멀티 채널 오디오 인코딩 방법.
KR1020100022234A 2010-03-12 2010-03-12 멀티 채널 오디오 디코딩 방법 및 멀티 채널 오디오 코덱 KR101607334B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100022234A KR101607334B1 (ko) 2010-03-12 2010-03-12 멀티 채널 오디오 디코딩 방법 및 멀티 채널 오디오 코덱

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100022234A KR101607334B1 (ko) 2010-03-12 2010-03-12 멀티 채널 오디오 디코딩 방법 및 멀티 채널 오디오 코덱

Publications (2)

Publication Number Publication Date
KR20110103094A KR20110103094A (ko) 2011-09-20
KR101607334B1 true KR101607334B1 (ko) 2016-03-30

Family

ID=44954437

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100022234A KR101607334B1 (ko) 2010-03-12 2010-03-12 멀티 채널 오디오 디코딩 방법 및 멀티 채널 오디오 코덱

Country Status (1)

Country Link
KR (1) KR101607334B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015012594A1 (ko) * 2013-07-23 2015-01-29 한국전자통신연구원 잔향 신호를 이용한 다채널 오디오 신호의 디코딩 방법 및 디코더
EP4178231A1 (en) * 2021-11-09 2023-05-10 Nokia Technologies Oy Spatial audio reproduction by positioning at least part of a sound field

Also Published As

Publication number Publication date
KR20110103094A (ko) 2011-09-20

Similar Documents

Publication Publication Date Title
EP2612322B1 (en) Method and device for decoding a multichannel audio signal
US8817991B2 (en) Advanced encoding of multi-channel digital audio signals
US8964994B2 (en) Encoding of multichannel digital audio signals
EP2356653B1 (en) Apparatus and method for generating a multichannel signal
RU2639952C2 (ru) Гибридное усиление речи с кодированием формы сигнала и параметрическим кодированием
JP4918490B2 (ja) エネルギー整形装置及びエネルギー整形方法
US9830918B2 (en) Enhanced soundfield coding using parametric component generation
JP5227946B2 (ja) フィルタ適応周波数分解能
WO2010005050A1 (ja) 信号分析装置、信号制御装置及びその方法と、プログラム
JPWO2006003891A1 (ja) 音声信号復号化装置及び音声信号符号化装置
EP1779385B1 (en) Method and apparatus for encoding and decoding multi-channel audio signal using virtual source location information
KR100763919B1 (ko) 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2 채널의 바이노럴 신호로 복호화하는 방법 및 장치
CN112567765B (zh) 空间音频捕获、传输和再现
US9118805B2 (en) Multi-point connection device, signal analysis and device, method, and program
CN110024421A (zh) 用于自适应控制去相关滤波器的方法和装置
US8977541B2 (en) Speech processing apparatus, speech processing method and program
JP5668923B2 (ja) 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム
KR101607334B1 (ko) 멀티 채널 오디오 디코딩 방법 및 멀티 채널 오디오 코덱
KR20140016780A (ko) 오디오 신호 처리 방법 및 장치
JP2006337767A (ja) 低演算量パラメトリックマルチチャンネル復号装置および方法
EP2172929B1 (en) Transmission unit, signal analysis control system, and methods thereof
JP5340378B2 (ja) チャネル信号生成装置、音響信号符号化装置、音響信号復号装置、音響信号符号化方法及び音響信号復号方法
WO2009087923A1 (ja) 信号分析制御、信号分析、信号制御のシステム、装置、方法及びプログラム
JP2023500631A (ja) 方向メタデータを使用するマルチチャネルオーディオ符号化及び復号化
EP3424048A1 (en) Audio signal encoder, audio signal decoder, method for encoding and method for decoding

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190226

Year of fee payment: 4