KR100829560B1 - 멀티채널 오디오 신호의 부호화/복호화 방법 및 장치,멀티채널이 다운믹스된 신호를 2 채널로 출력하는 복호화방법 및 장치 - Google Patents

멀티채널 오디오 신호의 부호화/복호화 방법 및 장치,멀티채널이 다운믹스된 신호를 2 채널로 출력하는 복호화방법 및 장치 Download PDF

Info

Publication number
KR100829560B1
KR100829560B1 KR1020060075390A KR20060075390A KR100829560B1 KR 100829560 B1 KR100829560 B1 KR 100829560B1 KR 1020060075390 A KR1020060075390 A KR 1020060075390A KR 20060075390 A KR20060075390 A KR 20060075390A KR 100829560 B1 KR100829560 B1 KR 100829560B1
Authority
KR
South Korea
Prior art keywords
channels
channel
sound source
virtual sound
spatial information
Prior art date
Application number
KR1020060075390A
Other languages
English (en)
Other versions
KR20080013628A (ko
Inventor
김영태
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020060075390A priority Critical patent/KR100829560B1/ko
Priority to US11/702,077 priority patent/US8867751B2/en
Priority to PCT/KR2007/003162 priority patent/WO2008018689A1/en
Publication of KR20080013628A publication Critical patent/KR20080013628A/ko
Application granted granted Critical
Publication of KR100829560B1 publication Critical patent/KR100829560B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Abstract

본 발명은 멀티채널 오디오 신호의 부호화/복호화 방법 및 장치, 멀티채널이 다운믹스된 신호를 2 채널로 출력하는 복호화 방법 및 장치에 관한 것으로, 본 발명에 따른 오디오 신호의 부호화 방법은 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들을 생성하고, 상기 복수의 채널 신호들을 다운믹스하며, 본 발명에 따른 오디오 신호의 복호화 방법은 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들 및 복수의 채널 신호들이 다운믹스된 신호를 입력받고, 다운믹스된 신호를 공간 정보들을 이용하여 복수의 채널 신호들로 복원한다. 본 발명에 따르면 주파수 영역에 관계 없이 멀티채널 오디오 신호를 정확도 있게 부호화하고, 복호화할 수 있다.

Description

멀티채널 오디오 신호의 부호화/복호화 방법 및 장치, 멀티채널이 다운믹스된 신호를 2 채널로 출력하는 복호화 방법 및 장치{Method and apparatus for encoding/decoding multi-channel audio signal, Method and apparatus for decoding downmixed singal to 2 channel signal}
도 1은 본 발명의 일 실시예에 따라 멀티채널 신호를 모노 신호로 부호화하고, 모노 신호를 2 채널로 출력하는 시스템의 구성을 나타낸 도면이다.
도 2a는 본 발명의 일 실시예에 따라 복수의 채널들에 의해 형성되는 가상 음원들의 방향 정보를 나타내는 공간 정보들을 생성하는 과정을 설명하기 위한 도면이다.
도 2b는 두 채널을 입력으로 하여 CDD와 가상 음원의 에너지 및 방향 정보를 출력하는 OTT(one to two) 인코더를 나타내는 그림이다.
도 3a는 본 발명의 일 실시예에 따른 5-1-2 트리 구조를 이용한 멀티채널 오디오 신호 부호화 장치의 구성도이다.
도 3b는 도 3a에 도시된 멀티채널 오디오 신호 부호화 장치를 사용하여 부호화하는 과정을 설명하기 위한 채널 레이아웃을 도시한 것이다.
도 4는 본 발명의 일 실시예에 따라 5.1 채널을 부호화하는 방법의 흐름도이다.
도 5는 본 발명의 일 실시예에 따른 5-1-2 트리 구조를 이용한 멀티채널 오디오 신호 복호화 장치의 구성도이다.
도 6은 본 발명의 일 실시예에 따라 5.1 채널이 다운믹스된 모노 신호를 복호화하는 방법의 흐름도이다.
도 7은 본 발명의 일 실시예에 따른 복수의 채널들이 다운믹스된 모노 신호를 2 채널로 출력하는 복호화 장치의 구성도이다.
도 8은 본 발명의 일 실시예에 따른 복수의 채널들이 다운믹스된 모노 신호를 2 채널로 출력하는 복호화 방법의 흐름도이다.
본 발명은 멀티채널 오디오 신호의 부호화/복호화 방법 및 장치에 관한 것으로, 특히 복수의 채널들의 방향 정보를 이용하여 생성된 공간 파라미터를 이용하여 멀티채널 오디오 신호를 부호화/복호화하는 방법, 멀티 채널이 다운믹스된 모노 신호를 2 채널로 출력하는 복호화 방법 및 장치에 관한 것이다.
종래의 멀티채널 오디오 신호의 부호화/복호화 기술에서는 음향공간에서 사람이 느낄 수 있는 공간감이 주로 양귀효과(Binaural Effect) 때문인 것에 착안하여 멀티채널 오디오 신호를 부호화/복호화하는데, 사람은 양귀에 도달하는 소리의 크기 차이(Interaural Level Difference, ILD)와 시간 지연차이(Interaural Time Difference)를 이용하여 특정 음원의 위치를 인지한다는 점을 이용한다. 따라서, 종래에 멀티채널 오디오 신호를 부호화할 때 멀티채널 오디오 신호를 모노 신호로 다운믹스하고, 채널에 대한 정보는 채널간의 신호 크기차이(Interchannel Level Difference: ICLD) 및 시간지연(Inter-channel Time Difference: ICTD) 등의 공간 정보들(spatial cues)로 표현하는 것이 통상적이다. 또한 다운믹스된 멀티채널 오디오 신호를 ICLD 및 ICTD 등의 공간 정보들을 이용하여 복호화하게 된다.
그러나, ICLD에 의한 음원의 위치 인지는 소리의 파장이 머리의 지름보다 적은 고주파 영역의 경우에 한하여 가능하며, 보다 낮은 주파수 영역에서는 그 정확도가 떨어지는 문제점이 있다. 또한 ICTD는 ICLD와는 반대로 소리의 파장이 머리의 지름보다 큰 저주파 영역의 경우에 한하여 음원의 위치 인지가 가능하며, 보다 높은 주파수 영역에서는 그 정확도가 떨어지는 문제점이 있다.
한편, 멀티채널이 다운믹스된 모노 신호를 2 채널의 가상 입체 음향으로 출력하기 위해서는 상기 모노 신호를 ICLD 및 ICTD 등의 공간 정보(spatial cue)를 이용하여 멀티채널 신호로 복원하고 복원된 멀티채널 신호를 2개의 채널 신호로 단순 합성하거나 머리 전달 함수(Head Related Transfer Function, HRTF)를 이용하여 2 채널로 합성한다. 머리 전달 함수란 자유 공간에서 정위된 음원으로부터 사람의 귀로 전달되는 음향적 과정을 표현하며, 사람이 음원의 위치를 판단하는 중요한 정보를 포함한다. 이러한 머리 전달 함수(Head Related Transfer Function, HRTF)는 두 귀간의 시간차와 두 귀간의 레벨차 귓바퀴의 형상을 포함하여 소리가 전달되어 온 공간의 특성을 나타내는 많은 정보를 포함한다
멀티채널 신호를 머리 전달 함수를 이용하여 2채널로 합성하기 위해서는 멀 티채널의 각 채널 별로 우측 귀와 좌측 귀에 해당하는 머리 전달 함수가 필요하며, 따라서 필요한 머리 전달 함수의 수는 멀티채널 수의 2배가 된다. 예를 들면, 5.1 채널 신호를 2 채널로 출력하기 위해서는 모두 10개의 머리 전달 함수가 필요하게 된다. 머리 전달 함수는 시스템 내의 머리 전달 함수 데이터베이스에 저장되어 있는데, 종래와 같이 다수의 머리 전달 함수를 저장하는 데에는 데이터베이스의 저장용량이 많이 필요하게 되는 문제점이 있다.
본 발명이 이루고자 하는 기술적 과제는 멀티채널 오디오 신호의 부호화/복호화 방법에 있어서, 주파수 영역에 관계 없이 정확도 있게 부호화/복호화하는 방법을 제공하는 데 있다. 또한, 상기된 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공하는 데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는 멀티 채널이 다운믹스된 모노 신호를 2 채널로 출력하는 복호화 방법 및 장치에 있어서, 머리 전달 함수를 저장하는 데이터베이스의 용량을 줄일 수 있는 방법 및 장치를 제공하는 데 있다.
상기 기술적 과제를 해결하기 위한 본 발명에 따른 멀티채널 오디오 신호의 부호화 방법은, 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들을 생성하는 단계; 상기 복수의 채널 신호들을 다운믹스하는 단계; 및 상기 다운믹스된 신호 및 상기 공간 정보들을 출력하는 단계를 포함하는 것을 특징으로 한다.
상기 기술적 과제를 해결하기 위한 본 발명에 따른 멀티채널 오디오 신호의 복호화 방법은, 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들 및 상기 복수의 채널 신호들이 다운믹스된 신호를 입력받는 단계; 및 상기 입력받은 다운믹스된 신호를 상기 공간 정보들을 이용하여 복수의 채널 신호들로 복원하는 단계를 포함하는 것을 특징으로 한다.
상기 기술적 과제를 해결하기 위한 본 발명에 따른 멀티채널 오디오 신호의 부호화 장치는, 복수의 채널들 각각의 음원 중 소정 두 채널의 음원에 의해 형성되는 제1 가상 음원의 방향 정보를 나타내는 제1 공간 정보를 생성하고, 상기 제1 공간 정보 및 상기 소정 두 채널의 방향 정보를 이용하여 상기 제1 가상 음원의 방향 정보를 산출하는 제1 인코더; 및 상기 복수의 채널들 각각의 음원 중 상기 소정 두 채널이 아닌 다른 두 채널의 음원에 의해 형성되는 제2 가상 음원의 방향 정보를 나타내는 제2 공간 정보를 생성하고, 상기 제2 공간 정보 및 상기 다른 두 채널의 방향 정보를 이용하여 상기 제2 가상 음원의 방향 정보를 산출하는 제2 인코더를 포함하는 것을 특징으로 한다.
상기 기술적 과제를 해결하기 위한 본 발명에 따른 멀티채널 오디오 신호의 복호화 장치는, 복수의 채널들 각각의 음원 중 소정 두 채널의 음원에 의해 형성된 제1 가상 음원을 입력받아, 제1 공간 정보를 이용하여 상기 소정 두 채널 신호로 복원하는 제1 디코더; 및 상기 복수의 채널들 각각의 음원 중 상기 소정 두 채널이 아닌 다른 두 채널의 음원에 의해 형성된 제2 가상 음원을 입력받아, 제2 공간 정 보를 이용하여 상기 다른 두 채널로 복원하는 제2 디코더를 포함하고, 상기 제1 공간 정보는 상기 제1 가상 음원의 방향 정보를 나타내고, 상기 제2 공간 정보는 상기 제2 가상 음원의 방향 정보를 나타내는 것을 특징으로 한다.
상기 다른 기술적 과제를 해결하기 위한 본 발명에 따른 복수의 채널 신호들이 다운믹스된 신호를 2 채널로 출력하는 복호화 방법은, 상기 다운믹스된 신호를 상기 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들을 이용하여 복수의 채널 신호들로 복원하는 단계; 상기 복수의 채널들 중 소정 채널에 해당하는 머리전달함수와 상기 공간 정보들을 이용하여 상기 소정 채널이 아닌 다른 채널에 해당하는 머리전달함수를 생성하는 단계; 및 상기 복원된 복수의 채널 신호들을 상기 소정 채널에 대응하는 머리전달함수와 상기 생성된 머리전달함수를 이용하여 상기 복수의 채널들 각각의 위치에 음상 정위하여 2채널 신호로 출력하는 단계를 포함하는 것을 특징으로 한다.
상기 다른 기술적 과제를 해결하기 위한 본 발명에 따른 복수의 채널 신호들이 다운믹스된 신호를 2 채널로 출력하는 복호화 장치는, 상기 다운믹스된 신호를 상기 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들을 이용하여 복수의 채널 신호들로 복원하는 업믹스부; 상기 복수의 채널들 중 소정 채널에 해당하는 머리전달함수와 상기 공간 정보들을 이용하여 상기 소정 채널이 아닌 다른 채널에 해당하는 머리전달함수를 생성하는 머리전달함수 생성부; 및 상기 복원된 복수의 채널 신호들을 상기 소정 채널에 대응하는 머리전달함수와 상기 생성된 머리전달함수를 이용하여 상기 복수의 채널들 각각의 위치에 음상 정위하여 2채널 신호로 출력하는 2채널 합성부를 포함하는 것을 특징으로 한다.
이하, 첨부된 도면들을 참조하여 본 발명의 바람직한 실시예들을 상세히 설명한다.
도 1은 본 발명의 일 실시예에 따라 멀티채널 신호를 모노 신호로 부호화하고, 모노 신호를 2 채널로 출력하는 시스템의 구성을 나타낸 도면이다. 본 발명의 일 실시예에 따라 멀티채널 신호를 모노 신호로 부호화하고, 모노 신호를 2 채널로 출력하는 시스템은 부호화부(110) 및 바이노럴 디코더(binaural decoder)(120)를 포함하여 이루어지며, 바이노럴 디코더(120)는 업믹스(upmix)부(130) 및 2채널 합성부(140)를 포함하여 이루어진다.
부호화부(110)에는 복수의 채널 신호들이 입력된다. 도 1에서 상기 복수의 채널 신호들의 예로서 5.1 채널, 즉 전방센터(C) 채널, 전방우측(Rf) 채널, 전방좌측(Lf) 채널, 후방우측(Rs) 채널, 후방좌측(Ls) 채널 및 저음역 효과(LFE) 채널이 입력되고 있으나 본 발명은 이에 국한되지 않으며, 7.1 채널 등에도 적용될 수 있다.
부호화부(110)는 상기 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들을 생성하고, 상기 복수의 채널 신호들을 다운믹스하여, 모노 신호를 출력한다.
본 명세서에서 편의상 상기 공간 정보를 CDD(Channel Directivity Difference)라 하기로 한다.
바이노럴 디코더(120)는 상기 공간 정보(CDD)들 및 상기 모노 신호를 입력받고, 상기 공간 정보(CDD)들을 이용하여 상기 모노 신호를 2채널 신호로 출력한다.
업믹스부(130)는 상기 공간 정보(CDD)들 및 상기 모노 신호를 입력받고, 상기 공간 정보(CDD)들을 이용하여 상기 모노 신호를 복수의 채널 신호들로 복원한다.
2채널 합성부(140)는 상기 공간 정보(CDD)들 및 머리 전달 함수(Head Related Transfer Function, HRTF)를 이용하여 상기 복원된 복수의 채널 신호들을 상기 복수의 채널들 각각의 위치에 음상 정위하여 2채널 신호로 출력한다.
도 2a는 본 발명의 일 실시예에 따라 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보(CDD)들을 생성하는 과정을 설명하기 위한 도면이다. 도 2a에 편의상 채널 i(11)와 채널 j(12)만이 도시되어 있으나, 청취자(23)를 중심으로 다른 채널들(미도시)이 분포되어 있는 것으로 가정한다.
멀티채널 오디오 신호를 부호화할 때 어떤 시점에서 각 채널(채널 i, 채널 j, 및 미도시된 다른 채널들)에 서로 다른 에너지가 분배된다. 이 경우에 채널 i와 채널 j 이외의 채널을 고려하지 않고, 채널 i의 음원과 채널 j의 음원에 의해서 가상 음원 x(14)가 형성된다고 하면 수학식 1과 같이 가상 음원 x(14)의 에너지는 채널 i(11)의 에너지와 채널 j(12)의 에너지의 합과 같게 된다.
Wi 2 + Wj 2 = Wx 2
삭제
여기서 Wi 2은 채널 i의 에너지, Wj 2은 채널 j의 에너지, Wx 2은 채널 j의 에너지니다.
수학식 1의 양변을 Wx 2으로 나누면 수학식 2와 같다.
CDDxi 2 + CDDxj 2 = 1
삭제
여기서 CDDxi =
Figure 112007039227857-pat00015
, CDDxj =
Figure 112007039227857-pat00016
이다.
한편, CDDxi 및 CDDxj와 채널 i(21), 채널 j(22) 및 가상 음원 x(24)의 방향 정보는 수학식 3의 관계를 가진다.
Figure 112007039227857-pat00017
삭제
여기서, θ는 채널의 방향 정보로서, 두 채널 사이의 이등분면과 각 채널 사이의 각도이다. 채널 레이아웃은 멀티채널 오디오 신호의 부호화시에 이미 정해져 있으므로, 채널의 방향 정보는 역시 이미 정해져 있는 값이다. φ는 가상 음원의 방향 정보로서, 상기 이등분면으로부터 가상 음원 x(14)까지의 각도이다. 수학식 3에서 알 수 있듯이, CDDxi, CDDxj 는 두 채널 i, j에 의해 형성되는 가상 음원 x의 방향 정보를 나타내게 된다.
본 발명의 일 실시예에 따라 CDD를 생성하는 과정에서, 수학식 1 및 수학식 2로부터 가상 음원 x(24)의 에너지 Wx 2과 CDDxi 및 CDDxj를 구하고, 수학식 3으로부터 가상 음원 x(24)의 방향 정보를 구한다.
또한, 도 2a에서 채널 i와 채널 j는 각각 가상 음원이 될 수도 있다. 예를 들면, 채널 i와 채널 j이외의 다른 두 채널들로부터 가상 음원 y(미도시)가 생성되었다고 하면, 가상 음원 x(14)와 가상 음원 y(미도시)로부터 또 다른 가상 음원 z(미도시)가 형성되고, 이 경우에 CDDzx, CDDzy를 구하고 가상 음원 z(미도시)의 에너지 및 방향 정보 φ를 구한다. 물론 도 2a에서 채널 i와 채널 j 중 둘 중의 하나가 가상 음원이 되는 경우에도 마찬가지이다.
도 2b는 두 채널을 입력으로 하여 CDD와 가상 음원의 에너지 및 방향 정보를 출력하는 OTT(one to two) 인코더를 나타내는 그림이다.
도 2b를 참조하면, OTT 인코더(17)는 두 채널 i, j의 신호를 입력받아서 CDDxi, CDDxj,가상 음원의 에너지 Wx 및 방향 정보 φ를 출력한다. 물론 OTT 인코더(17)의 입력은 가상 음원이 될 수도 있다.
도 3a는 본 발명의 일 실시예에 따른 5-1-2 트리 구조를 이용한 멀티채널 오디오 신호 부호화 장치의 구성도이다. 도 3b는 도 3a에 도시된 멀티채널 오디오 신호 부호화 장치를 사용하여 부호화하는 과정을 설명하기 위한 채널 레이아웃을 도시한 것이다. 도 4는 본 발명의 일 실시예에 따라 5.1 채널을 부호화하는 방법의 흐름도로서, 도 3a 및 도 3b와 결부시켜 설명하기로 한다.
310단계에서, 제1 OTT 인코더(250)는 Lf 채널과 Ls 채널을 입력받아, CDD1Lf, CDD1Ls를 생성하고, 제1 가상 음원(210)의 에너지 및 방향 정보를 산출한다. CDD1Lf, CDD1Ls에서 아래 첨자 1은 가상 음원을 나타내며 Lf, Ls는 각각 전방좌측(Lf) 채널, 후방좌측(Ls) 채널을 나타낸다. 보다 구체적으로 설명하면, Lf 채널과 Ls 채널의 에너지를 이용하여 제1 가상 음원(210)의 에너지 및 공간 정보 CDD1Lf, CDD1Ls를 생성하고, CDD1Lf, CDD1Ls 및 Lf 채널과 Ls 채널의 방향 정보를 이용하여 제1 가상 음원(210)의 방향 정보를 산출한다.
320단계에서, 제2 OTT 인코더(255)는 Rf 채널과 Rs 채널을 입력받아, CDD2Rf, CDD2Rs를 생성하고 제2 가상 음원(220)의 에너지 및 방향 정보를 산출한다.
330단계에서, 제3 OTT 인코더(260)는 C 채널과 LFE 채널을 입력받아, CDD3C, CDD3LFE를 생성하고 제3 가상 음원(230)의 에너지 및 방향 정보를 산출한다.
340단계에서, 제4 OTT 인코더(265)는 상기 제1 가상 음원과 상기 제2 가상 음원을 입력받는다. 여기서, 다시 도 2a 및 도 2b를 참조하면, 340단계는 도 2a 및 도 2b의 채널 i(11)와 채널 j(12)가 각각 상기 제1 가상 음원과 상기 제2 가상 음원으로 대체된 경우에 해당한다. 340단계에서는, 제1 가상 음원과 제2 가상 음원의 에너지를 이용하여 제4 가상 음원(240)의 에너지 및 공간 정보 CDD41, CDD42를 생성하고, CDD41, CDD42 및 제1 가상 음원과 제2 가상 음원의 방향 정보를 이용하여 제4 가상 음원(240)의 방향 정보를 산출한다.
350단계에서, 제5 OTT 인코더(270)는 상기 제3 가상음원과 상기 제4 가상음원을 입력받아, CDDm4, CDDm3를 생성하고, 5.1 채널 신호들이 다운믹스된 모노 신호를 출력한다. 도 4에 도시된 본 발명의 일 실시예에 따라 5.1 채널을 부호화하는 방법에서, 310단계 내지 350단계를 통하여 5.1 채널 신호들을 다운믹스한다.
360단계에서, 다중화부(미도시)는 CDD들 및 상기 다운믹스된 모노 신호를 포함하는 비트스트림을 생성하여 출력한다.
도 5는 본 발명의 일 실시예에 따른 5-1-5 2 트리 구조를 이용한 멀티채널 오디오 신호 복호화 장치의 구성도이다. 도 6은 본 발명의 일 실시예에 따라 5.1 채널이 다운믹스된 모노 신호를 복호화하는 방법의 흐름도로서, 도 5와 결부시켜 설명하기로 한다.
505단계에서, 역다중화부(미도시)는 복수의 채널들이 다운믹스된 모노 신호 및 CDD들이 포함된 비트스트림을 입력받아, 상기 비트스트림을 상기 다운믹스된 모노 신호와 CDD들로 분리한다.
510단계에서, 제5 OTT 디코더(410)는 상기 다운믹스된 모노 신호를 CDDm4, CDDm3을 이용하여 제3 가상음원과 제4 가상음원으로 복원한다.
520단계에서, 제4 OTT 디코더(420)는 제4 가상 음원을 CDD41, CDD42를 이용하여 제1 가상음원과 제2 가상음원으로 복원한다.
530단계에서, 제1 OTT 디코더(430)는 제1 가상 음원을 CDD1Lf, CDD1Ls를 이용하여 Lf 채널과 Ls 채널로 복원한다.
540단계에서, 제2 OTT 디코더(440)는 제2 가상 음원을 CDD2Rf, CDD2Rs를 이용하여 Rf 채널과 Rs 채널로 복원한다.
550단계에서, 제3 OTT 디코더(450)는 제3 가상 음원을 CDD3C, CDD3LFE를 이용하여 C 채널과 LFE 채널로 복원한다.
도 5에 도시된 멀티채널 오디오 신호 복호화 장치에서 출력되는 전방좌측(Lf) 채널, 후방좌측(Ls) 채널, 전방우측(Rf) 채널, 후방우측(Rs) 채널, 전방센터(C) 채널, 및 저음역 효과(LFE) 채널 신호는 수학식 4-9와 같다.
Lf=CDDm4CDD41CDD1Lfm
Ls=CDDm4CDD41CDD1Lsm
Rf=CDDm4CDD42CDD2Rfm
Rs=CDDm4CDD42CDD2Rsm
C=CDDm3CDD3Cm
LFE=CDDm3CDD3LFEm
삭제
삭제
삭제
삭제
삭제
삭제
도 7은 본 발명의 일 실시예에 따른, 복수의 채널 신호들이 다운믹스된 모노 신호를 2 채널로 출력하는 복호화 장치의 구성도이다.
도 7에서 상기 복수의 채널 신호들의 예로서 5.1 채널, 즉 전방센터(C) 채널, 전방우측(Rf) 채널, 전방좌측(Lf) 채널, 후방우측(Rs) 채널, 후방좌측(Ls) 채널 및 저음역 효과(LFE) 채널이 나타나 있으나 본 발명은 이에 국한되지 않으며, 7.1 채널 등에도 적용될 수 있다. 이 경우 도 5에 따른 5-1-2 트리 구조는 7-1-2 트리 구조로 변경되어야 할 것이다.
도 7을 참조하면, 본 발명의 일 실시예에 따른 복수의 채널들이 다운믹스된 모노 신호를 2 채널로 출력하는 복호화 장치는 시간/주파수 변환부(710), 업믹스부(720), 2채널 합성부(730), 머리전달함수 생성부(750), 기준 머리전달함수 DB(760), 제1 주파수/시간 변환부(770), 제2 주파수/시간 변환부(780)을 포함하여 이루어진다. 또한 2채널 합성부(730)은 음상 정위부(731-740), 우측 채널 혼합부(742), 좌측 채널 혼합부(743)을 포함하여 이루어진다.
시간/주파수 변환부(710)는 복수의 채널 신호들이 다운믹스된 모노 신호를 입력받아 주파수 영역의 신호로 변환하여 출력한다.
업믹스부(720)는 상기 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보(CDD)들 및 시간/주파수 변환부(710)에서 주파수 영역의 신호로 변환된 모노 신호를 입력받아, 상기 모노 신호를 상기 공간정보(CDD)들을 이용하여 전방좌측(Lf) 채널, 후방좌측(Ls) 채널, 전방우측(Rf) 채널, 후방우측(Rs) 채널, 전방센터(C) 채널, 및 저음역 효과(LFE) 채널 신호로 복원한다.
기준 머리전달함수 DB(760)는 전방좌측(Lf) 채널, 후방좌측(Ls) 채널, 전방우측(Rf) 채널, 후방우측(Rs) 채널, 전방센터(C) 채널 중 어느 한 채널에 해당하는 머리전달함수의 세트를 저장하고 있다. 여기서 기준 머리전달함수 DB(760)에 저장된 머리전달함수를 기준 머리전달함수라 하기로 한다. 도 7에서는 기준 머리전달함수 DB(760)가 전방좌측(Lf) 채널에 해당하는 머리전달함수의 세트를 저장하고 있는데 이 경우, 우측 머리전달함수(HRTFR,Lf) 및 좌측 머리전달함수(HRTFL,Lf)를 저장하고 있다.
머리전달함수 생성부(750)는 상기 공간정보(CDD)들 및 기준 머리전달함수 DB(760)에 저장된 기준 머리전달함수를 입력받고, 상기 공간정보(CDD)들과 기준 머리전달함수를 이용하여 다른 채널, 즉 후방좌측(Ls) 채널, 전방우측(Rf) 채널, 후방우측(Rs) 채널, 전방센터(C) 채널에 해당하는 머리전달함수를 생성한다.
머리전달함수 생성부(750)를 이하 수학식 4-9을 참조하여 보다 구체적으로 설명한다. 복호화부(72)에서 출력되는 각 채널 신호의 형태는 수학식 4-9에서 알 수 있듯이, 모노 신호 m에 공간정보(CDD)들이 곱해져 있는 형태이다. 머리전달함수 생성부(750)는 수학식 4-9에서 모노 신호 m에 곱해져 있는 공간정보(CDD)들의 곱 중 기준 머리전달함수에 해당하는 채널에 대응하는 공간정보(CDD)들의 곱과 생성하 고자 하는 채널의 머리전달함수에 해당하는 채널에 대응하는 공간정보(CDD)들의 곱의 비율만큼 기준 머리전달함수에 가중치를 부여하여, 기준 머리전달함수 외의 다른 채널에 대응하는 머리전달함수를 생성한다. 즉, 상기 공간정보(CDD)들의 곱의 비율과 기준 머리전달함수를 컨벌루션하여 기준 머리전달함수 외의 다른 채널에 대응하는 머리전달함수를 생성한다. 예를 들어, 수학식-4에서 기준 머리전달함수에 대응하는 채널인 전방좌측(Lf) 채널 신호는 모노 신호 m에 CDDm4CDD41CDD1Lf가 곱해져 있는 형태이다. 한편, 수학식-7에서 후방우측(Rs) 채널 신호는 모노 신호 m에 CDDm4CDD42CDD2Rs가 곱해져 있는 형태이다. 이 경우 후방우측(Rs) 채널에 해당하는 머리전달함수는 기준 머리전달함수인 전방좌측(Lf) 채널의 머리전달함수에
Figure 112006057070694-pat00004
만큼 가중치를 부여하여, 후방우측(Rs) 채널에 해당하는 머리전달함수를 생성한다.
2채널 합성부(730)는 기준 머리전달함수 DB(760)와 머리전달함수 생성부(750)로부터 각 채널에 해당하는 머리전달함수를 입력받는다. 2채널 합성부(730)에 포함된 음상 정위부(731-740)들은 각 채널 신호를 머리전달함수를 이용하여 각 채널의 위치에 음상 정위하여 출력한다. 도 7에서 기준 머리전달함수가 전방좌측(Lf) 채널의 머리전달함수이므로, 전방좌측(Lf) 채널 음상 정위부(731, 732)는 기준 머리전달함수 DB로부터 머리전달함수를 입력받으며, 전방좌측(Lf) 채널 이외 채널의 음상 정위부(733-740)들은 머리전달함수 생성부(750)로부터 머리전달함수를 입력받는다.
우측 채널 혼합부(742)는 우측 채널 음상 정위부(731, 733, 735, 737, 739)로부터 출력된 신호들을 혼합한다. 좌측 채널 혼합부(743)는 좌측 채널 음상 정위부(732, 734, 736, 738, 740)로부터 출력된 좌측 채널 출력들을 혼합한다.
제1 주파수/시간 변환부(770)는 우측 채널 혼합부(742)에서 혼합된 신호를 입력받아 시간 영역의 신호로 변환하여 우측 채널 신호를 출력한다.
제2 주파수/시간 변환부(780)는 좌측 채널 혼합부(743)에서 혼합된 신호를 입력받아 시간 영역의 신호로 변환하여 좌측 채널 신호를 출력한다.
도 8은 본 발명의 일 실시예에 따른 복수의 채널들이 다운믹스된 모노 신호를 2 채널로 출력하는 복호화 방법의 흐름도이다. 본 실시예에 따른 복호화 방법은 도 7에 도시된 복호화 장치에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 7에 도시된 복호화 장치에 관하여 이상에서 기술된 내용은 본 실시예에 따른 복호화 방법에도 적용된다.
810단계에서, 시간/주파수 변환부(710)는 복수의 채널들이 다운믹스된 모노 신호를 입력받아 주파수 영역의 신호로 변환한다.
820단계에서, 복호화부(720) 및 머리전달함수 생성부(750)는 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보(CDD)들을 입력받는다.
830단계에서, 업믹스부(720)는 상기 공간 정보(CDD)들을 이용하여 상기 다운믹스된 모노 신호를 복수의 채널 신호로 복원한다.
840단계에서, 머리전달함수 생성부(750)는 기준 머리전달함수 DB(760)로부터 상기 복수의 채널들 중 소정 채널에 해당하는 머리전달함수를 입력받고, 상기 입력받은 머리전달함수 및 상기 공간 정보(CDD)들을 이용하여 상기 소정 채널이 아닌 다른 채널에 해당하는 머리전달함수를 생성한다.
850단계에서, 2채널 합성부(730)는 상기 복수의 채널 신호들을 상기 소정 채널에 대응하는 머리전달함수와 상기 생성된 머리전달함수를 이용하여 상기 복수의 채널들 각각의 위치에 음상 정위하여 2 채널 신호로 출력한다.
860단계에서, 제1 주파수/시간 변환부(770) 및 제2 주파수/시간 변환부(780)는 2채널 합성부(730)에서 출력된 신호를 시간 영역의 신호로 변환하여 출력한다.
한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 또한, 상술한 본 발명의 실시예에서 사용된 데이터의 구조는 컴퓨터로 읽을 수 있는 기록매체에 여러 수단을 통하여 기록될 수 있다.
상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드 디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등) 및 캐리어 웨이브(예를 들면, 인터넷을 통한 전송)와 같은 저장매체를 포함한다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다.본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
본 발명에 따르면, 복수의 채널들에 의해 형성되는 가상 음원들의 방향 정보를 나타내는 공간 정보들을 생성하여 멀티채널 오디오 신호를 부호화/복호화하는데, 가상 음원들의 방향 정보는 채널 레이아웃의 정보에 따라 결정되고 주파수와 관계가 없기 때문에 주파수 영역에 관계 없이 멀티채널 오디오 신호를 정확도 있게 부호화/복호화할 수 있는 효과가 있다.
또한 본 발명에 따르면, 복수의 채널들에 의해 형성되는 가상 음원들의 방향 정보를 나타내는 공간 정보들 및 소정 채널에 해당하는 머리전달함수를 이용하여 다른 채널에 해당하는 머리전달함수를 생성함으로써 머리전달함수를 저장하는 데이터베이스의 저장 용량을 줄일 수 있는 효과가 있다.

Claims (20)

  1. (a) 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들 및 상기 복수의 채널 신호들이 다운믹스된 신호를 입력받는 단계; 및
    (b) 상기 입력받은 다운믹스된 신호를 상기 공간 정보들을 이용하여 복수의 채널 신호들로 복원하는 단계를 포함하고,
    상기 공간 정보들은 상기 복수의 채널들 각각의 음원의 에너지 및 상기 가상 음원의 에너지를 이용하여 생성된 정보인 것을 특징으로 하는 멀티채널 오디오 신호 복호화 방법.
  2. 삭제
  3. 제1항에 있어서,
    상기 가상 음원의 방향 정보는 상기 공간 정보들 및 상기 적어도 두 채널의 방향 정보를 이용하여 산출된 정보인 것을 특징으로 하는 멀티채널 오디오 신호 부호화 방법.
  4. 제1항에 있어서,
    상기 (b) 단계는,
    (b1) 상기 입력받은 다운믹스된 신호를 상기 공간 정보들을 이용하여 제1 가상 음원 및 제2 가상 음원으로 복원하는 단계; 및
    (b2) 상기 제1 가상 음원을 상기 공간 정보들을 이용하여 제3 가상 음원과 제 4 가상 음원으로 복원하는 단계를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호 복호화 방법.
  5. 제4항에 있어서,
    상기 (b) 단계는
    (b3) 상기 공간 정보들을 이용하여 상기 제1 내지 제4 가상 음원 중 적어도 하나로부터 상기 복수의 채널 신호들 중 두 채널 신호를 복원하는 단계를 더 포함하는 것을 특징으로 하는 멀티채널 오디오 신호 복호화 방법.
  6. 제1항에 있어서,
    상기 (a) 단계는 상기 다운믹스된 신호 및 상기 공간 정보들이 포함된 비트스트림을 입력받는 것을 특징으로 하고,
    상기 비트스트림을 상기 다운믹스된 신호와 상기 공간 정보들로 분리하는 단계를 더 포함하는 것을 특징을 하는 방법.
  7. (a) 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들을 생성하는 단계;
    (b) 상기 복수의 채널 신호들을 다운믹스하는 단계; 및
    (c) 상기 다운믹스된 신호 및 상기 공간 정보들을 출력하는 단계를 포함하고,
    상기 (a) 단계는 상기 복수의 채널들 각각의 음원의 에너지 및 상기 가상 음원의 에너지를 이용하여 상기 공간 정보들을 생성하는 것을 특징으로 하는 멀티채널 오디오 신호 부호화 방법.
  8. 삭제
  9. 제7항에 있어서,
    상기 가상 음원의 방향 정보는 상기 공간 정보들 및 상기 적어도 두 채널의 방향 정보를 이용하여 산출되는 것을 특징으로 하는 멀티채널 오디오 신호 부호화 방법.
  10. 제7항에 있어서,
    상기 (a) 단계는,
    (a1) 상기 복수의 채널들 각각의 음원 중 소정 두 채널의 음원에 의해 형성되는 제1 가상 음원의 방향 정보를 나타내는 제1 공간 정보를 생성하고, 상기 제1 공간 정보 및 상기 소정 두 채널의 방향 정보를 이용하여 상기 제1 가상 음원의 방 향 정보를 산출하는 단계; 및
    (a2) 상기 복수의 채널들 각각의 음원 중 상기 소정 두 채널이 아닌 다른 두 채널의 음원에 의해 형성되는 제2 가상 음원의 방향 정보를 나타내는 제2 공간 정보를 생성하고, 상기 제2 공간 정보 및 상기 다른 두 채널의 방향 정보를 이용하여 상기 제2 가상 음원의 방향 정보를 산출하는 단계를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호 부호화 방법.
  11. 제10항에 있어서,
    상기 (a) 단계는,
    (a3) 상기 제1 가상 음원 및 상기 제2 가상 음원에 의해 형성되는 제3 가상 음원의 방향 정보를 나타내는 제3 공간 정보를 생성하고, 상기 제3 공간 정보 및 상기 제1 가상 음원과 상기 제2 가상 음원의 방향 정보를 이용하여 상기 제3 가상 음원의 방향 정보를 산출하는 단계를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호 부호화 방법.
  12. 제7항에 있어서,
    상기 (c) 단계는 상기 다운믹스된 신호 및 상기 공간 정보들을 포함하는 비트스트림을 생성하여 출력하는 것을 특징으로 하는 멀티채널 오디오 신호 부호화 방법.
  13. 복수의 채널 신호들이 다운믹스된 신호를 2 채널로 출력하는 복호화 방법에 있어서,
    (a) 상기 다운믹스된 신호를 상기 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들을 이용하여 복수의 채널 신호들로 복원하는 단계; 및
    (b) 상기 복원된 복수의 채널 신호들을 상기 복수의 채널들 각각의 위치에 음상 정위하여 2채널 신호로 출력하는 단계를 포함하고,
    상기 (b) 단계는 머리전달함수(Head Related Transfer Function, HRTF)를 이용하여 음상 정위하는 것을 특징으로 하는 방법.
  14. 삭제
  15. 제13항에 있어서,
    상기 복수의 채널들 중 소정 채널에 해당하는 머리전달함수와 상기 공간 정보들을 이용하여 상기 소정 채널이 아닌 다른 채널에 해당하는 머리전달함수를 생성하는 단계를 더 포함하고,
    상기 (b) 단계는, 상기 복원된 복수의 채널 신호들을 상기 소정 채널에 대응하는 머리전달함수와 상기 생성된 머리전달함수를 이용하여 음상 정위하는 것을 특징으로 하는 방법.
  16. 제15항에 있어서,
    상기 생성하는 단계는 상기 공간 정보들과 상기 소정 채널에 대응하는 머리전달함수를 컨벌루션하여 상기 다른 채널에 해당하는 머리전달함수를 생성하는 것을 특징으로 하는 방법.
  17. 제13항에 있어서,
    상기 다운믹스된 신호를 주파수 영역의 신호로 변환하는 단계; 및
    상기 2채널 신호를 시간 영역의 신호로 변환하여 출력하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  18. 복수의 채널들 각각의 음원 중 소정 두 채널의 음원에 의해 형성된 제1 가상 음원을 입력받아, 제1 공간 정보를 이용하여 상기 소정 두 채널 신호로 복원하는 제1 디코더; 및
    상기 복수의 채널들 각각의 음원 중 상기 소정 두 채널이 아닌 다른 두 채널의 음원에 의해 형성된 제2 가상 음원을 입력받아, 제2 공간 정보를 이용하여 상기 다른 두 채널로 복원하는 제2 디코더를 포함하고,
    상기 제1 공간 정보는 상기 제1 가상 음원의 방향 정보를 나타내고, 상기 제2 공간 정보는 상기 제2 가상 음원의 방향 정보를 나타내는 것을 특징으로 하는 멀티채널 오디오 신호 복호화 장치.
  19. 복수의 채널들 각각의 음원 중 소정 두 채널의 음원에 의해 형성되는 제1 가 상 음원의 방향 정보를 나타내는 제1 공간 정보를 생성하고, 상기 제1 공간 정보 및 상기 소정 두 채널의 방향 정보를 이용하여 상기 제1 가상 음원의 방향 정보를 산출하는 제1 인코더; 및
    상기 복수의 채널들 각각의 음원 중 상기 소정 두 채널이 아닌 다른 두 채널의 음원에 의해 형성되는 제2 가상 음원의 방향 정보를 나타내는 제2 공간 정보를 생성하고, 상기 제2 공간 정보 및 상기 다른 두 채널의 방향 정보를 이용하여 상기 제2 가상 음원의 방향 정보를 산출하는 제2 인코더를 포함하는 것을 특징으로 하는 멀티채널 오디오 신호 부호화 장치.
  20. 복수의 채널 신호들이 다운믹스된 신호를 2 채널로 출력하는 복호화 장치에 있어서,
    상기 다운믹스된 신호를 상기 복수의 채널들 각각의 음원 중 적어도 두 채널의 음원에 의해 형성되는 가상 음원의 방향 정보를 나타내는 공간 정보들을 이용하여 복수의 채널 신호들로 복원하는 업믹스부;
    상기 복수의 채널들 중 소정 채널에 해당하는 머리전달함수와 상기 공간 정보들을 이용하여 상기 소정 채널이 아닌 다른 채널에 해당하는 머리전달함수를 생성하는 머리전달함수 생성부; 및
    상기 복원된 복수의 채널 신호들을 상기 소정 채널에 대응하는 머리전달함수와 상기 생성된 머리전달함수를 이용하여 상기 복수의 채널들 각각의 위치에 음상 정위하여 2채널 신호로 출력하는 2채널 합성부를 포함하는 것을 특징으로 하는 장치.
KR1020060075390A 2006-08-09 2006-08-09 멀티채널 오디오 신호의 부호화/복호화 방법 및 장치,멀티채널이 다운믹스된 신호를 2 채널로 출력하는 복호화방법 및 장치 KR100829560B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020060075390A KR100829560B1 (ko) 2006-08-09 2006-08-09 멀티채널 오디오 신호의 부호화/복호화 방법 및 장치,멀티채널이 다운믹스된 신호를 2 채널로 출력하는 복호화방법 및 장치
US11/702,077 US8867751B2 (en) 2006-08-09 2007-02-05 Method, medium, and system encoding/decoding a multi-channel audio signal, and method medium, and system decoding a down-mixed signal to a 2-channel signal
PCT/KR2007/003162 WO2008018689A1 (en) 2006-08-09 2007-06-29 Method, medium, and system encoding/decoding a multi-channel audio signal, and method medium, and system decoding a down-mixed signal to a 2-channel signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060075390A KR100829560B1 (ko) 2006-08-09 2006-08-09 멀티채널 오디오 신호의 부호화/복호화 방법 및 장치,멀티채널이 다운믹스된 신호를 2 채널로 출력하는 복호화방법 및 장치

Publications (2)

Publication Number Publication Date
KR20080013628A KR20080013628A (ko) 2008-02-13
KR100829560B1 true KR100829560B1 (ko) 2008-05-14

Family

ID=39033186

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060075390A KR100829560B1 (ko) 2006-08-09 2006-08-09 멀티채널 오디오 신호의 부호화/복호화 방법 및 장치,멀티채널이 다운믹스된 신호를 2 채널로 출력하는 복호화방법 및 장치

Country Status (3)

Country Link
US (1) US8867751B2 (ko)
KR (1) KR100829560B1 (ko)
WO (1) WO2008018689A1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
CN101835072B (zh) * 2010-04-06 2011-11-23 瑞声声学科技(深圳)有限公司 虚拟环绕声处理方法
KR101842257B1 (ko) * 2011-09-14 2018-05-15 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
US9706324B2 (en) 2013-05-17 2017-07-11 Nokia Technologies Oy Spatial object oriented audio apparatus
TWI774136B (zh) * 2013-09-12 2022-08-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
US11102601B2 (en) * 2017-09-29 2021-08-24 Apple Inc. Spatial audio upmixing
CN108156561B (zh) * 2017-12-26 2020-08-04 广州酷狗计算机科技有限公司 音频信号的处理方法、装置及终端

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100206333B1 (ko) * 1996-10-08 1999-07-01 윤종용 두개의 스피커를 이용한 멀티채널 오디오 재생장치및 방법
US6205430B1 (en) 1996-10-24 2001-03-20 Stmicroelectronics Asia Pacific Pte Limited Audio decoder with an adaptive frequency domain downmixer
KR20050060552A (ko) * 2003-12-16 2005-06-22 한국전자통신연구원 입체 음향 시스템 및 입체 음향 구현 방법
KR20060049941A (ko) * 2004-07-09 2006-05-19 한국전자통신연구원 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5870480A (en) * 1996-07-19 1999-02-09 Lexicon Multichannel active matrix encoder and decoder with maximum lateral separation
US6072878A (en) * 1997-09-24 2000-06-06 Sonic Solutions Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics
AUPP272598A0 (en) * 1998-03-31 1998-04-23 Lake Dsp Pty Limited Wavelet conversion of 3-d audio signals
JP2001268700A (ja) * 2000-03-17 2001-09-28 Fujitsu Ten Ltd 音響装置
JP4423790B2 (ja) * 2001-01-11 2010-03-03 ソニー株式会社 実演システム、ネットワークを介した実演方法
JP2002345097A (ja) * 2001-05-15 2002-11-29 Sony Corp サラウンド音場再生システム
CN1170374C (zh) 2002-06-20 2004-10-06 大唐移动通信设备有限公司 一种适用于频率选择性衰落信道的空时编译码方法
US20050273324A1 (en) * 2004-06-08 2005-12-08 Expamedia, Inc. System for providing audio data and providing method thereof
JP2005352396A (ja) 2004-06-14 2005-12-22 Matsushita Electric Ind Co Ltd 音響信号符号化装置および音響信号復号装置
WO2007106553A1 (en) * 2006-03-15 2007-09-20 Dolby Laboratories Licensing Corporation Binaural rendering using subband filters

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100206333B1 (ko) * 1996-10-08 1999-07-01 윤종용 두개의 스피커를 이용한 멀티채널 오디오 재생장치및 방법
US6205430B1 (en) 1996-10-24 2001-03-20 Stmicroelectronics Asia Pacific Pte Limited Audio decoder with an adaptive frequency domain downmixer
KR20050060552A (ko) * 2003-12-16 2005-06-22 한국전자통신연구원 입체 음향 시스템 및 입체 음향 구현 방법
KR20060049941A (ko) * 2004-07-09 2006-05-19 한국전자통신연구원 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치
KR100663729B1 (ko) 2004-07-09 2007-01-02 한국전자통신연구원 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치

Also Published As

Publication number Publication date
KR20080013628A (ko) 2008-02-13
WO2008018689A1 (en) 2008-02-14
US20080037809A1 (en) 2008-02-14
US8867751B2 (en) 2014-10-21

Similar Documents

Publication Publication Date Title
US20200335115A1 (en) Audio encoding and decoding
JP5587551B2 (ja) オーディオ符号化
JP4603037B2 (ja) マルチチャネルオーディオ信号を表示するための装置と方法
ES2461601T3 (es) Procedimiento y aparato para generar una señal de audio binaural
US9479871B2 (en) Method, medium, and system synthesizing a stereo signal
KR101058047B1 (ko) 스테레오 신호 생성 방법
US11056122B2 (en) Encoder and encoding method for multi-channel signal, and decoder and decoding method for multi-channel signal
KR100829560B1 (ko) 멀티채널 오디오 신호의 부호화/복호화 방법 및 장치,멀티채널이 다운믹스된 신호를 2 채널로 출력하는 복호화방법 및 장치
KR100763920B1 (ko) 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130429

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140429

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150429

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20160428

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20170427

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee