KR101666465B1 - 다채널 오디오 신호 부호화/복호화 장치 및 방법 - Google Patents

다채널 오디오 신호 부호화/복호화 장치 및 방법 Download PDF

Info

Publication number
KR101666465B1
KR101666465B1 KR1020100071040A KR20100071040A KR101666465B1 KR 101666465 B1 KR101666465 B1 KR 101666465B1 KR 1020100071040 A KR1020100071040 A KR 1020100071040A KR 20100071040 A KR20100071040 A KR 20100071040A KR 101666465 B1 KR101666465 B1 KR 101666465B1
Authority
KR
South Korea
Prior art keywords
channel
audio signal
channel audio
mixing matrix
channels
Prior art date
Application number
KR1020100071040A
Other languages
English (en)
Other versions
KR20120009150A (ko
Inventor
김미영
김중회
성호상
주기현
오은미
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020100071040A priority Critical patent/KR101666465B1/ko
Priority to EP11173432A priority patent/EP2410518A1/en
Priority to US13/183,858 priority patent/US9305556B2/en
Publication of KR20120009150A publication Critical patent/KR20120009150A/ko
Priority to US15/056,079 priority patent/US20160180855A1/en
Application granted granted Critical
Publication of KR101666465B1 publication Critical patent/KR101666465B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other

Abstract

다채널 오디오 신호 부호화/복호화 장치가 개시된다. 다채널 오디오 신호 부호화 장치는 다채널 오디오 신호의 채널을 그룹핑하고, 위상 정보를 포함하는 믹싱 매트릭스를 이용하여 채널간 중복 제거한 후 주파수 변환하여 부호화할 수 있다.

Description

다채널 오디오 신호 부호화/복호화 장치 및 방법{APPARATUS METHOD FOR ENCODING/DECODING MULTI-CHANNEL AUDIO SIGNAL}
본 발명은 다채널 오디오 신호를 압축 및 복원하는 방법에 관한 것이다.
최근 다채널 오디오 서비스가 발전하면서 10.2 채널, 22.2 채널 등 입력된 오디오 신호의 채널 수가 증가하는 추세에 있다. 채널 수가 증가함에 따라 전송해야 할 비트스트림의 양도 증가되어 기존의 인프라에서는 서비스가 불가능한 문제가 있다.
또한, 채널이 증가하면서 한번에 다운믹싱(downmixing)/업믹싱(upmixing) 할 때 필요한 매트릭스의 규모가 커지면서 연산이 복잡할 수 있다. 그리고, 실감성을 높이기 위해 채널이 증가하는 것에 대응하여 음질도 향상시키는 것이 필요하다.
본 발명의 일실시예에 따른 다채널 오디오 신호 부호화 장치는 다채널 오디오 신호의 채널 특성에 기초하여 채널을 그룹핑하는 채널 그룹핑부; 그룹핑된 채널 간 중복 정보를 제거하여 상기 다채널 오디오 신호를 주파수 변환하는 신호 변환부; 상기 주파수 변환된 다채널 오디오 신호를 양자화하는 양자화부; 및 상기 양자화된 다채널 오디오 신호를 부호화하는 부호화부를 포함할 수 있다.
본 발명의 일실시예에 따른 다채널 오디오 신호 부호화 장치는 그룹별로 다채널 오디오 신호를 복소수 계수로 표현되는 도메인으로 변환하는 도메인 변환부; 및 상기 도메인으로 변환된 다채널 오디오 신호의 채널간 중복 정보를 제거하기 위한 믹싱 매트릭스를 생성하는 매트릭스 생성부를 더 포함할 수 있다.
본 발명의 일실시예에 따른 다채널 오디오 신호 부호화 방법은 다채널 오디오 신호의 채널 특성에 기초하여 채널을 그룹핑하는 단계; 그룹핑된 채널 간 중복 정보를 제거하여 상기 다채널 오디오 신호를 주파수 변환하는 단계; 상기 주파수 변환된 다채널 오디오 신호를 양자화하는 단계; 및 상기 양자화된 다채널 오디오 신호를 부호화하는 단계를 포함할 수 있다.
본 발명의 일실시예에 따른 다채널 오디오 신호 부호화 방법은 그룹별로 다채널 오디오 신호를 복소수 계수로 표현되는 도메인으로 변환하는 단계; 및 상기 도메인으로 변환된 다채널 오디오 신호의 채널간 중복 정보를 제거하기 위한 믹싱 매트릭스를 생성하는 단계를 더 포함할 수 있다.
본 발명의 일실시예에 따르면, 다채널 오디오 신호의 채널을 미리 그룹핑한 후 채널간 중복 정보를 제거함으로써, 매트릭스의 부가 정보를 줄이고 복잡도를 낮출 수 있다.
본 발명의 일실시예에 따르면, 위상 정보를 포함하는 믹싱 매트릭스를 이용하여 채널간 중복 정보를 제거함으로써 다채널 오디오를 생성할 때의 공간감을 향상시킬 수 있다.
도 1은 본 발명의 일실시예에 따른 다채널 오디오 신호 부호화 장치의 전체 구성을 도시한 블록 다이어그램이다.
도 2는 본 발명의 일실시예에 따른 다채널 오디오 신호를 생성하는 과정을 도시한 도면이다.
도 3은 본 발명의 일실시예에 따라 다채널 오디오 신호를 그룹핑하는 과정을 도시한 도면이다.
도 4는 본 발명의 일실시예에 따라 다채널 오디오 신호를 그룹핑한 후, 믹싱 매트릭스를 생성하는 과정을 도시한 도면이다.
도 5는 본 발명의 일실시예에 따라 룸 응답을 도시한 도면이다.
도 6은 본 발명의 일실시예에 따라 룸 응답을 시간에 따라 표현한 도면이다.
도 7은 본 발명의 일실시예에 따라 룸 응답의 위상 응답을 모델링하는 과정을 도시한 도면이다.
도 8은 본 발명의 일실시예에 따라 다채널 오디오 신호를 부호화하는 방법을 도시한 플로우차트이다.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다. 본 발명의 일실시예에 따른 다채널 오디오 신호 부호화 방법은 다채널 오디오 신호 부호화 장치에 의해 수행될 수 있다. 본 명세서에서 다채널 오디오 신호 복호화 장치는 도시되지 않았으나, 다채널 오디오 신호 복호화 장치는 다채널 오디오 신호 부호화 장치의 동작을 역으로 수행함으로써 원래 신호를 복원할 수 있다. 이하에서는, 다채널 오디오 신호 부호화 장치를 중심으로 설명하기로 한다.
도 1은 본 발명의 일실시예에 따른 다채널 오디오 신호 부호화 장치의 전체 구성을 도시한 블록 다이어그램이다.
도 1을 참고하면, 다채널 오디오 신호 부호화 장치(100)는 채널 그룹핑부(101), 도메인 변환부(102), 믹싱 매트릭스 생성부(103), 신호 변환부(104), 양자화부(105) 및 부호화부(106)를 포함할 수 있다.
채널 그룹핑부(101)는 다채널 오디오 신호의 채널 특성에 기초하여 채널을 그룹핑할 수 있다. 채널 그룹핑부(101)는 다채널 심리 음향 모델(multi-channel psychoacoustic model)을 이용하여 채널 그룹핑을 위한 그룹 기준을 결정할 수 있다.
일례로, 채널 그룹핑부(101)는 다채널 오디오 신호의 채널별 지오메트리 구조를 이용하여 채널을 그룹핑할 수 있다. 다른 일례로, 채널 그룹핑부(101)는 다채널 오디오 신호의 채널 간 유사도를 이용하여 채널을 그룹핑할 수 있다. 채널을 그룹핑하는 과정에 대해서는 도 3과 도 4에서 구체적으로 설명하기로 한다.
도메인 변환부(102)는 그룹별로 다채널 오디오 신호를 복소수 계수로 표현되는 도메인으로 변환할 수 있다. 일례로, 도메인 변환부(102)는 다채널 오디오 신호를 Complex QMF 또는 MDCT(Modified Discrete Cosine Transform)&MDST(Modified Discrete Sine Transform) 중 어느 하나를 이용하여 도메인 변환을 할 수 있다.
매트릭스 생성부(103)는 도메인으로 변환된 다채널 오디오 신호의 채널간 중복 정보를 제거하기 위한 믹싱 매트릭스를 생성할 수 있다. 일례로, 매트릭스 생성부(103)는 KLT(Karhunen-Transform)을 이용하여 주파수 대역별로 믹싱 매트릭스를 생성할 수 있다.
신호 변환부(104)는 믹싱 매트릭스를 이용하여 그룹핑된 채널 간 중복 정보를 제거하고, 다채널 오디오 신호를 주파수 변환할 수 있다.
양자화부(105)는 주파수 변화된 다채널 오디오 신호를 양자화할 수 있다.
부호화부(106)는 양자화된 다채널 오디오 신호를 부호화할 수 있다. 부호화부(106)는 믹싱 매트릭스도 함께 부호화할 수 있다. 이 때, 부호화부(106)는 믹싱 매트릭스의 계수를 위상(Phase)와 크기(Magnitude)로 분리하여 부호화할 수 있다. 구체적으로, 부호화부(106)는 밴드 간의 위상 정보에 따라 피크(peak)와 기울기(slope)로 표현된 룸 응답(room response)을 이용하여 위상을 부호화할 수 있다.
도 2는 본 발명의 일실시예에 따른 다채널 오디오 신호를 생성하는 과정을 도시한 도면이다.
도 2는 다채널 오디오 신호의 생성 과정에 대한 일예를 나타낸다. 복수의 마이크를 통해 수집한 오디오 신호를 이용하여 다채널 오디오 신호가 생성된다. 이 때, 복수의 마이크를 통해 수집한 오디오 신호에 적절한 localization, 공간감(ambience) 및 equalization filtering 이 적용됨으로써 다채널 오디오 신호가 생성된다. 이 때, localization은 에너지의 비율로 표현될 수 있다. 그리고, 공간감은 all-pass filtering을 통해 생성될 수 있다.
도 3은 본 발명의 일실시예에 따라 다채널 오디오 신호를 그룹핑하는 과정을 도시한 도면이다.
도 3을 참고하면, 다채널 오디오 신호가 입력되면 채널 그룹핑부(101)는 채널간 유사도를 계산하고, 유사도가 높은 채널끼리 그룹핑할 수 있다. 그러면, 채널 그룹핑부(101)는 그룹핑된 채널 신호와 그룹핑 정보를 생성할 수 있다. 그룹핑 정보는 그룹의 개수, 채널별 그룹 인덱스 정보를 포함할 수 있다. 채널 그룹핑부(101)는 입력된 다채널 오디오 신호를 미리 그룹핑하여 그룹별로 채널 처리함으로써 믹싱 매트릭스의 부가 정보를 줄이고, 연산 처리의 복잡도를 줄일 수 있다.
이 때, 채널 그룹핑부(101)는 다채널 오디오 신호의 채널별 지오메트리 구조를 이용하여 다채널 오디오 신호의 채널을 그룹핑할 수 있다. 이 때, 지오메트리 구조는 각 채널의 레이아웃(layout)을 의미한다. 그리고, 채널 그룹핑부(101)는 다채널 오디오 신호의 채널 간 유사도를 이용하여 다채널 오디오 신호의 채널을 그룹핑할 수 있다.
도 4는 본 발명의 일실시예에 따라 다채널 오디오 신호를 그룹핑한 후, 믹싱 매트릭스를 생성하는 과정을 도시한 도면이다.
먼저, 다채널 오디오 신호가 입력되면 채널 그룹핑부(101)을 통해 채널이 그룹핑된다. 도 9에서 그룹핑된 결과는 g0, g1로 표현된다. 도메인 변환부(102)는 그룹별로 다채널 오디오 신호를 복소수 계수로 표현되는 도메인으로 변환할 수 있다. 이 때, 도메인 변환부(102)는 complex valued filterbank와 같은 변환을 통해 다채널 오디오 신호를 변환할 수 있다. complex valued filterbank는 complex valued QMF 또는 MDCT&MDST를 포함할 수 있다.
매트릭스 생성부(103)는 도메인으로 변환된 다채널 오디오 신호의 채널간 중복 정보를 제거하기 위한 믹싱 매트릭스를 생성할 수 있다. 즉, 그룹에 믹싱 매트릭스가 적용되면 그룹 내에 포함된 채널들은 상관도가 낮게 된다. 이러한 과정은 inter-channel processing으로 불린다.
이 때, 믹싱 매트릭스는 그룹에 따라 생성된다. 일례로, 믹싱 매트릭스는 채널별로 오디오 신호를 다운믹싱하거나 업믹싱하기 위해 사용된다. 이 때, 믹싱 매트릭스는 KLT(Karhunen-Transform)을 통해 주파수 대역별로 생성될 수 있다.
믹싱 매트릭스의 각 계수는 복소수(complex number)이며, 고유 벡터(eigen vector)를 통해 계산될 수 있다. 믹싱 매트릭스의 계수는 크기와 위상으로 분리될 수 있다. 믹싱 매트릭스는 하기 수학식 1과 같다.
Figure 112010047444389-pat00001
수학식 1에서 그룹 내에 포함된 채널 수는 N이며, j는 주파수 밴드의 인덱스를 나타낸다. 믹싱 매트릭스를 크기와 위상으로 분리하면 하기 수학식 2와 같다.
Figure 112010047444389-pat00002
수학식 2와 같은 믹싱 매트릭스의 위상을 주파수 밴드 별로 표현하면 하기 수학식 3과 같다
Figure 112010047444389-pat00003
여기서, J는 총 밴드 개수를 의미하며, 수학식 3은 믹싱 매트릭스의 (0,0)에 대응하는 위상 정보를 의미한다. 이러한 위상 정보는 룸 응답에 대응하며, 주파수 대역별로 기울기와 피크 정보를 통해 표현될 수 있다.
그러면, 신호 변환부(104)는 그룹별 다채널 오디오 신호를 부호화하기 위해 주파수 변환할 수 있다. 일례로, 도메인 변환부(102)에서 다채널 오디오 신호를 complex QMF 분석한 경우, 신호 변환부(104)는 다채널 오디오 신호를 inter-channel processing을 거친 다채널 오디오 신호를 complex QMF 합성(synthesis)를 통해 시간 도메인으로 변환하고, 다시 MDCT를 적용하여 주파수 변환할 수 있다.
다른 일례로, 도메인 변환부(102)에서 다채널 오디오 신호를 complex QMF 분석한 경우, 신호 변환부(104)는 complex QMF를 통해 inter-channel processing을 수행하고, complex-QMF의 서브 샘플에 MDCT를 적용하여 주파수 변환할 수 있다.
또 다른 일례로, 도메인 변환부(102)에서 다채널 오디오 신호에 MDCT와 MDST를 적용하고, 신호 변환부(104)는 다채널 오디오 신호를 inter-channel processing을 거친 다채널 오디오 신호에서 실수 부분인 MDCT만 선택하여 주파수 변환할 수 있다. 이 경우, 복호화 과정에서는 역 inter-channel processing을 위해 MDCT 계수로부터 MDST 계수가 추출되어야 한다.
양자화부(105)는 심리 음향 정보를 이용하여 믹싱 매트릭스, 룸 응답에 대응하는 위상 정보 및 inter-channel processing을 거친 다채널 오디오 신호를 양자화할 수 있다. 이 때, 채널 별로 양자화 정보가 믹싱 매트릭스의 계수와 동시에 양자화될 수 있다.
예를 들어, 특정 채널 i의 j번째 밴드의 양자화 계수가 100이며, 이에 대응하는 믹싱 매트릭스의 계수가 [0.1 0.3 0.5 0 -0.2]라고 가정한다. 그러면, 양자화 계수는 하기 수학식 4와 같이 표현된다.
Figure 112010047444389-pat00004
믹싱 매트릭스의 계수와 양자화 계수는 독립적으로 부호화될 수 있다. 또는, 하기 수학식 5와 같이 양자화 계수가 믹싱 매트릭스의 계수에 포함되어 전송될 수 있다.
Figure 112010047444389-pat00005
그러면, 복호화 장치에서는 전송된 믹싱 매트릭스의 계수를 이용하여 믹싱과 동시에 역양자화를 수행할 수 있다.
도 5는 본 발명의 일실시예에 따라 룸 응답을 도시한 도면이다.
특정 공간 내부에서 악기로부터 오디오 신호를 수집한 경우, 공간에 의한 반사 및 감쇠 정보(attenuation)을 고려하여 다채널 오디오 신호의 각 채널에 출력될 오디오 신호가 생성된다. 만일, 공간 정보를 미리 알고 룸에서 반사를 모델링할 수 있다면, 하나의 음원과 룸 정보로 렌더링을 통해 원음(original sound)와 같은 음질이 제공될 수 있다.
도 6은 본 발명의 일실시예에 따라 룸 응답을 시간에 따라 표현한 도면이다. 구체적으로, 도 6은 룸 응답의 임펄스 응답을 나타낸다. 초기 응답은 직접 수집한 오디오 신호에 관한 것이고, 이후 응답은 룸에서의 반사를 통해 수집한 오디오 신호에 관한 것이다.
도 7은 본 발명의 일실시예에 따라 룸 응답의 위상 응답을 모델링하는 과정을 도시한 도면이다.
그래프(701)은 룸 응답의 주파수 대역별 위상 정보를 나타낸다. 위상의 주기적 특성상 위상이 PI를 넘어가는 경우, 위상은 -PI로 표현된다. 그래프(701)을 참고하면, 각 주파수 대역별로 위상이 다르며, 타임 랙(time lag)이 존재하는 것을 알 수 있다.
이러한 위상 정보는 그래프(702)를 통해 피크와 기울기로 표현될 수 있다. 부호화 장치는 이러한 위상 정보를 예측하여 부가 정보로서 복호화 장치에 전달할 수 있다. 그러면, 복원된 신호는 다채널 오디오 신호의 공간감이 그대로 유지된다.
도 8은 본 발명의 일실시예에 따라 다채널 오디오 신호를 부호화하는 방법을 도시한 플로우차트이다. 다채널 오디오 신호를 복호화하는 방법은 도 8에 도시된 순서의 역이 된다.
다채널 오디오 신호 부호화 장치(100)는 다채널 오디오 신호의 채널 특성에 기초하여 다채널 오디오 신호의 채널을 그룹핑할 수 있다(S801).
일례로, 다채널 오디오 신호 부호화 장치(100)는 다채널 오디오 신호의 채널별 지오메트리 구조를 이용하여 채널 그룹핑할 수 있다. 다른 일례로, 다채널 오디오 신호 부호화 장치(100)는 다채널 오디오 신호의 채널 간 유사도를 이용하여 채널 그룹핑할 수 있다. 이 때, 다채널 오디오 신호 부호화 장치(100)는 다채널 심리 음향 모델을 이용하여 그룹 기준을 결정할 수 있다.
다채널 오디오 신호 부호화 장치(100)는 그룹별로 다채널 오디오 신호를 복소수 계수로 표현되는 도메인으로 변환할 수 있다(S802). 이 때, 다채널 오디오 신호 부호화 장치(100)는 Complex QMF 또는 MDCT&MDST 중 어느 하나를 이용하여 도메인 변환할 수 있다.
다채널 오디오 신호 부호화 장치(100)는 도메인으로 변환된 다채널 오디오 신호의 채널간 중복 정보를 제거하기 위한 믹싱 매트릭스를 생성할 수 있다(S803). 이 때, 다채널 오디오 신호 부호화 장치(100)는 KLT를 이용하여 주파수 대역별로 믹싱 매트릭스를 생성할 수 있다.
다채널 오디오 신호 부호화 장치(100)는 그룹핑된 채널 간 중복 정보를 제거하여 다채널 오디오 신호를 주파수 변환할 수 있다(S804). 이 때, 다채널 오디오 신호 부호화 장치(100)는 믹싱 매트릭스를 적용하고 다채널 오디오 신호를 주파수 변환할 수 있다.
다채널 오디오 신호 부호화 장치(100)는 주파수 변환된 다채널 오디오 신호를 양자화할 수 있다(S805).
다채널 오디오 신호 부호화 장치(100)는 양자화된 다채널 오디오 신호를 부호화할 수 있다(S806). 다채널 오디오 신호 부호화 장치(100)는 밴드 간의 위상 정보에 따라 피크와 기울기로 표현된 룸 응답을 이용하여 위상을 부호화할 수 있다.
본 발명의 실시 예에 따른 방법들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
100: 다채널 오디오 신호 부호화 장치
101: 채널 그룹핑부
102: 도메인 변환부
103: 매트릭스 생성부
104: 신호 변환부
105: 양자화부
106: 부호화부

Claims (20)

  1. 다채널 오디오 신호의 채널 특성에 기초하여 채널을 그룹핑하는 채널 그룹핑부;
    믹싱 매트릭스를 이용하여 그룹핑된 채널 간 중복 정보를 제거하고, 상기 중복 정보가 제거된 그룹핑된 채널을 포함하는 다채널 오디오 신호를 주파수 변환하는 신호 변환부;
    상기 주파수 변환된 다채널 오디오 신호를 양자화하는 양자화부; 및
    상기 믹싱 매트릭스 및 상기 양자화된 다채널 오디오 신호를 부호화하는 부호화부
    를 포함하고,
    상기 믹싱 매트릭스는, 그룹별로 생성되는 다채널 오디오 신호 부호화 장치.
  2. 제1항에 있어서,
    상기 채널 그룹핑부는,
    다채널 오디오 신호의 채널별 지오메트리 구조를 이용하여 채널을 그룹핑하는 것을 특징으로 하는 부호화 장치.
  3. 제1항에 있어서,
    상기 채널 그룹핑부는,
    다채널 오디오 신호의 채널 간 유사도를 이용하여 채널을 그룹핑하는 것을 특징으로 하는 부호화 장치.
  4. 제1항에 있어서,
    상기 채널 그룹핑부는,
    다채널 심리 음향 모델을 이용하여 그룹 기준을 결정하는 것을 특징으로 하는 부호화 장치.
  5. 제1항에 있어서,
    그룹별로 다채널 오디오 신호를 실수(real number)와 허수(imaginary number) 각각을 하나의 축으로 하는 도메인으로 변환하는 도메인 변환부; 및
    상기 도메인으로 변환된 다채널 오디오 신호의 채널간 중복 정보를 제거하기 위한 믹싱 매트릭스를 생성하는 매트릭스 생성부
    를 더 포함하고,
    상기 신호 변환부는,
    상기 믹싱 매트릭스를 적용하고 상기 다채널 오디오 신호를 주파수 변환하는 것을 특징으로 하는 부호화 장치.
  6. 제5항에 있어서,
    상기 매트릭스 생성부는,
    KLT(Karhunen-Transform)을 이용하여 주파수 대역별로 믹싱 매트릭스를 생성하는 것을 특징으로 하는 부호화 장치.
  7. 제5항에 있어서,
    상기 부호화부는,
    상기 믹싱 매트릭스의 계수를 위상과 크기로 분리하여 부호화하는 것을 특징으로 하는 부호화 장치.
  8. 제7항에 있어서,
    상기 부호화부는,
    밴드 간의 위상 정보에 따라 피크와 기울기로 표현된 룸 응답을 이용하여 상기 위상을 부호화하는 것을 특징으로 하는 부호화 장치.
  9. 제5항에 있어서,
    상기 도메인 변환부는,
    Complex QMF 또는 MDCT&MDST 중 어느 하나를 이용하여 도메인 변환하는 것을 특징으로 하는 부호화 장치.
  10. 제1항에 있어서,
    상기 양자화부는,
    양자화 계수에 믹싱 계수를 포함하여 동시에 양자화하는 것을 특징으로 하는 부호화 장치.
  11. 다채널 오디오 신호의 채널 특성에 기초하여 채널을 그룹핑하는 단계;
    믹싱 매트릭스를 이용하여 그룹핑된 채널 간 중복 정보를 제거하고, 상기 중복 정보가 제거된 그룹핑된 채널을 포함하는 다채널 오디오 신호를 주파수 변환하는 단계;
    상기 주파수 변환된 다채널 오디오 신호를 양자화하는 단계; 및
    상기 믹싱 매트릭스 및 상기 양자화된 다채널 오디오 신호를 부호화하는 단계
    를 포함하고,
    상기 믹싱 매트릭스는, 그룹별로 생성되는 다채널 오디오 신호 부호화 방법.
  12. 제11항에 있어서,
    상기 채널을 그룹핑하는 단계는,
    다채널 오디오 신호의 채널별 지오메트리 구조를 이용하여 채널을 그룹핑하는 것을 특징으로 하는 부호화 방법.
  13. 제11항에 있어서,
    상기 채널을 그룹핑하는 단계는,
    다채널 오디오 신호의 채널 간 유사도를 이용하여 채널을 그룹핑하는 것을 특징으로 하는 부호화 방법.
  14. 제11항에 있어서,
    상기 채널을 그룹핑하는 단계는,
    다채널 심리 음향 모델을 이용하여 그룹 기준을 결정하는 것을 특징으로 하는 부호화 방법.
  15. 제11항에 있어서,
    그룹별로 다채널 오디오 신호를 실수와 허수 각각을 하나의 축으로 하는 도메인으로 변환하는 단계; 및
    상기 도메인으로 변환된 다채널 오디오 신호의 채널간 중복 정보를 제거하기 위한 믹싱 매트릭스를 생성하는 단계
    를 더 포함하고,
    상기 다채널 오디오 신호를 주파수 변환하는 단계는,
    상기 믹싱 매트릭스를 적용하여 상기 다채널 오디오 신호를 주파수 변환하는 것을 특징으로 하는 부호화 방법.
  16. 제15항에 있어서,
    상기 믹싱 매트릭스를 생성하는 단계는,
    KLT(Karhunen-Transform)을 이용하여 주파수 대역별로 믹싱 매트릭스를 생성하는 것을 특징으로 하는 부호화 방법.
  17. 제15항에 있어서,
    상기 다채널 오디오 신호를 부호화하는 단계는,
    상기 믹싱 매트릭스의 계수를 위상과 크기로 분리하여 부호화하는 것을 특징으로 하는 부호화 방법.
  18. 제17항에 있어서,
    상기 다채널 오디오 신호를 부호화하는 단계는,
    밴드 간의 위상 정보에 따라 피크와 기울기로 표현된 룸 응답을 이용하여 상기 위상을 부호화하는 것을 특징으로 하는 부호화 방법.
  19. 제15항에 있어서,
    상기 그룹별로 다채널 오디오 신호를 도메인으로 변환하는 단계는,
    Complex QMF 또는 MDCT&MDST 중 어느 하나를 이용하여 도메인 변환하는 것을 특징으로 하는 부호화 방법.
  20. 제11항 내지 제19항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록된 컴퓨터에서 판독 가능한 기록 매체.
KR1020100071040A 2010-07-22 2010-07-22 다채널 오디오 신호 부호화/복호화 장치 및 방법 KR101666465B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020100071040A KR101666465B1 (ko) 2010-07-22 2010-07-22 다채널 오디오 신호 부호화/복호화 장치 및 방법
EP11173432A EP2410518A1 (en) 2010-07-22 2011-07-11 Apparatus and method for encoding and decoding multi-channel audio signal
US13/183,858 US9305556B2 (en) 2010-07-22 2011-07-15 Apparatus and method for encoding and decoding multi-channel audio signal
US15/056,079 US20160180855A1 (en) 2010-07-22 2016-02-29 Apparatus and method for encoding and decoding multi-channel audio signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100071040A KR101666465B1 (ko) 2010-07-22 2010-07-22 다채널 오디오 신호 부호화/복호화 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20120009150A KR20120009150A (ko) 2012-02-01
KR101666465B1 true KR101666465B1 (ko) 2016-10-17

Family

ID=44658582

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100071040A KR101666465B1 (ko) 2010-07-22 2010-07-22 다채널 오디오 신호 부호화/복호화 장치 및 방법

Country Status (3)

Country Link
US (2) US9305556B2 (ko)
EP (1) EP2410518A1 (ko)
KR (1) KR101666465B1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101666465B1 (ko) * 2010-07-22 2016-10-17 삼성전자주식회사 다채널 오디오 신호 부호화/복호화 장치 및 방법
BR112015000247B1 (pt) * 2012-07-09 2021-08-03 Koninklijke Philips N.V. Decodificador, método de decodificação, codificador, método de codificação, e sistema de codificação e decodificação.
US9396732B2 (en) * 2012-10-18 2016-07-19 Google Inc. Hierarchical deccorelation of multichannel audio
KR20140117931A (ko) 2013-03-27 2014-10-08 삼성전자주식회사 오디오 디코딩 장치 및 방법
US11234072B2 (en) 2016-02-18 2022-01-25 Dolby Laboratories Licensing Corporation Processing of microphone signals for spatial playback
KR20190055116A (ko) * 2016-10-04 2019-05-22 옴니오 사운드 리미티드 스테레오 전개 기술
CN111201569B (zh) 2017-10-25 2023-10-20 三星电子株式会社 电子装置及其控制方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE387044T1 (de) * 2000-07-07 2008-03-15 Nokia Siemens Networks Oy Verfahren und vorrichtung für die perzeptuelle tonkodierung von einem mehrkanal tonsignal mit verwendung der kaskadierten diskreten cosinustransformation oder der modifizierten diskreten cosinustransformation
US6735339B1 (en) 2000-10-27 2004-05-11 Dolby Laboratories Licensing Corporation Multi-stage encoding of signal components that are classified according to component value
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP4347634B2 (ja) 2003-08-08 2009-10-21 富士通株式会社 符号化装置及び符号化方法
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
KR20060109299A (ko) * 2005-04-14 2006-10-19 엘지전자 주식회사 멀티채널 오디오 신호에 대한 서브밴드별 공간 정보들의부호-복호화 방법
KR20070003600A (ko) 2005-06-30 2007-01-05 엘지전자 주식회사 오디오 신호 인코딩 및 디코딩 방법 및 장치
ATE538604T1 (de) * 2006-03-28 2012-01-15 Ericsson Telefon Ab L M Verfahren und anordnung für einen decoder für mehrkanal-surroundton
KR101001748B1 (ko) 2007-04-25 2010-12-15 삼성전자주식회사 오디오신호 복호화 방법 및 장치
JP4470122B2 (ja) 2007-06-18 2010-06-02 株式会社アクセル 音声符号化装置、音声復号化装置、音声符号化プログラムおよび音声復号化プログラム
KR100932790B1 (ko) 2007-12-18 2009-12-21 한국전자통신연구원 음원 간 상호상관을 이용한 멀티트랙 다운믹싱 장치 및 그방법
EP2214161A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal
KR101666465B1 (ko) * 2010-07-22 2016-10-17 삼성전자주식회사 다채널 오디오 신호 부호화/복호화 장치 및 방법

Also Published As

Publication number Publication date
US9305556B2 (en) 2016-04-05
EP2410518A1 (en) 2012-01-25
KR20120009150A (ko) 2012-02-01
US20160180855A1 (en) 2016-06-23
US20120020482A1 (en) 2012-01-26

Similar Documents

Publication Publication Date Title
JP6170520B2 (ja) オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置
RU2690885C1 (ru) Стереофонический кодер и декодер аудиосигналов
JP6446407B2 (ja) トランスコーディング方法
KR101428487B1 (ko) 멀티 채널 부호화 및 복호화 방법 및 장치
KR101666465B1 (ko) 다채널 오디오 신호 부호화/복호화 장치 및 방법
TWI555008B (zh) 使用在智慧間隙填充架構內之雙聲道處理之音頻編碼器、音頻解碼器及相關方法
KR101411901B1 (ko) 오디오 신호의 부호화/복호화 방법 및 장치
JP4925671B2 (ja) デジタル信号の符号化/復号化方法及びその装置並びに記録媒体
JP2010515099A5 (ko)
JP4685165B2 (ja) 仮想音源位置情報に基づいたチャネル間レベル差量子化及び逆量子化方法
KR100745688B1 (ko) 다채널 오디오 신호 부호화/복호화 방법 및 장치
KR20230091045A (ko) 복소수 데이터를 이용한 오디오 처리 방법 및 그를 수행하는 장치
JP6179122B2 (ja) オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
TW202123220A (zh) 使用方向性元資料之多通道音頻編碼及解碼
CN105336334B (zh) 多声道声音信号编码方法、解码方法及装置
JP6303435B2 (ja) オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用プログラム、オーディオ復号装置
KR20120089230A (ko) 신호 복호화 장치
KR20130012972A (ko) 오디오/스피치 신호 부호화방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant