KR101058047B1 - 스테레오 신호 생성 방법 - Google Patents

스테레오 신호 생성 방법 Download PDF

Info

Publication number
KR101058047B1
KR101058047B1 KR1020110043581A KR20110043581A KR101058047B1 KR 101058047 B1 KR101058047 B1 KR 101058047B1 KR 1020110043581 A KR1020110043581 A KR 1020110043581A KR 20110043581 A KR20110043581 A KR 20110043581A KR 101058047 B1 KR101058047 B1 KR 101058047B1
Authority
KR
South Korea
Prior art keywords
signal
icc
channel
cld
stereo signal
Prior art date
Application number
KR1020110043581A
Other languages
English (en)
Other versions
KR20110068957A (ko
Inventor
김중회
오은미
주기현
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Publication of KR20110068957A publication Critical patent/KR20110068957A/ko
Application granted granted Critical
Publication of KR101058047B1 publication Critical patent/KR101058047B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/308Electronic adaptation dependent on speaker or headphone connection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)

Abstract

본 발명은 멀티 채널(multi-channel)로 오디오 신호를 출력하는 서라운드 오디오 코딩에 관한 것으로, 부호화단에서 다운믹스된 신호를 복호화단에서 멀티채널로 업믹싱하기 위하여 생성된 공간 정보를 이용하여 스테레오 신호를 생성하기 위한 공간 정보를 생성함으로써 다운믹스된 신호를 스테레오 신호로 업믹싱한다.
이렇게 함으로써 멀티채널에서 모노로 다운믹싱된 신호를 스테레오 신호에 보다 적합하게 업믹싱하므로 스테레오 신호의 음질을 향상시킬 수 있는 효과를 거둘 수 있다.

Description

스테레오 신호 생성 방법{Method for generating stereo signal}
본 발명은 오디오 코딩에 관한 것으로, 보다 상세하게는 멀티 채널(multi-channel)로 오디오 신호를 복호화하는 서라운드 오디오 코딩에 관한 것이다.
일반적으로 멀티채널 오디오 코딩에는 웨이브폼(waveform) 멀티채널 오디오 코딩과 파라메트릭(Parametric) 멀티채널 오디오 코딩이 있다. 웨이브폼 멀티채널 오디오 코딩에는 MPEG-2 MC 오디오 코딩, AAC MC 오디오 코딩 및 BSAC/AVS MC 오디오 코딩 등이 있으며, 5개의 채널 신호를 입력으로 하여 5개의 채널 신호로 출력한다. 파라메트릭 멀티채널 오디오 코딩은 MPEG 서라운드 코딩이 있으며, 복호화단에서 1 또는 2 개의 입력 채널을 6 또는 8개의 멀티 채널로 출력한다.
여기서, MPEG 서라운드는 도 1a에 도시된 5-1-5 1 트리 구조와 도 1b에 도시된 5-1-5 2 트리 구조를 이용하여 멀티 채널로 신호를 생성하여 출력한다. 이러한 트리 구조들은 모노(mono) 신호를 입력받아 OTT 모듈(module)들의 조합에서 처리하여 FL(Front Left) 채널, FR(Front Right) 채널, C(Center) 채널, LFE(Low Frequency Enhancement) 채널, BL(Back Left) 채널 및 BR(Back Right) 채널의 멀티 채널 신호를 출력한다.
그러나 모바일 어플레케이션(mobile application)의 이용이 증가함에 따라 멀티 채널보다 스테레오 채널이 더 많이 사용하게 된다. 도 1a 및 1b의 OTT 0 모듈에서 출력되는 신호를 살펴보면, 5-1-5 1 트리 구조에서는 FL 채널, FR 채널, C 채널 및 LFE 채널이 믹스된 신호와 BL 채널 및 BR 채널이 믹스된 신호로 출력된다. 그리고 5-1-5 2 트리 구조에서는 FL 채널, BL 채널, FR 채널 및 BR 채널이 믹스된 신호와 C 채널 및 LFE 채널이 믹스된 신호로 출력된다. 이와 같은 5-1-5 1 트리 구조 및 5-1-5 2 트리 구조의 OTT 0 모듈에서 출력된 신호들을 좌측 채널과 우측 채널로 출력되는 스테레오 신호로 이용하기에는 적합하지 않은 문제점을 갖는다.
본 발명이 이루고자 하는 기술적 과제는, 부호화단에서 다운믹스된 신호를 복호화단에서 멀티채널로 업믹싱하기 위한 공간 정보를 이용하여 스테레오 신호로 업믹싱하기 위한 공간 정보를 생성함으로써 다운믹스된 신호를 스테레오 신호로 업믹싱하는 스테레오 신호 생성 방법 및 장치를 제공하는 것이다.
상기의 과제를 이루기 위한 본 발명에 의한 스테레오 신호 생성 방법은, 다운믹스된(down-mixed) 신호를 멀티채널(multi-channel) 신호로 업믹싱(up-mixing)하는 공간 정보를 이용하여 다운믹스된 신호를 스테레오 신호로 업믹싱하는 공간 정보를 생성하는 단계 및 상기 생성된 공간 정보를 이용하여 상기 다운믹스된 신호를 스테레오 신호로 업믹싱하는 단계를 포함하는 것을 특징으로 한다.
전술된 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체인 것이 바람직하다.
상기의 과제를 이루기 위한 본 발명에 의한 스테레오 신호 생성 장치는, 다운믹스된 신호를 멀티채널 신호로 업믹싱하는 공간 정보를 이용하여 다운믹스된 신호를 스테레오 신호로 업믹싱하는 공간 정보를 생성하는 공간정보 생성부 및 상기 생성된 공간 정보를 이용하여 상기 다운믹스된 신호를 스테레오 신호로 업믹싱하는 업믹싱부를 포함하는 것을 특징으로 한다.
본 발명에 의한 스테레오 신호 생성 방법 및 장치에 의하면, 다운믹스된 신호를 멀티채널로 업믹싱하는 공간 정보를 이용하여 다운믹스된 신호를 스테레오 신호로 업믹싱하는 공간 정보를 생성함으로써 다운믹스된 신호를 스테레오 신호로 업믹싱한다.
이렇게 함으로써 부호화단에서 멀티채널로부터 모노로 다운믹싱된 신호를 스테레오 신호에 보다 적합하게 업믹싱하므로 스테레오 신호의 음질을 향상시킬 수 있는 효과를 거둘 수 있다.
도 1a는 MPEG 서라운드(Surround)의 5-1-5 1 트리 구조(tree structure)를 도시한 것이다.
도 1b는 MPEG 서라운드의 5-1-5 2 트리 구조를 도시한 것이다.
도 2a는 본 발명에 의한 스테레오 신호 생성 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
도 2b는 본 발명에 의한 스테레오 신호 생성 방법의 제230단계에 대한 일 실시예를 흐름도로 도시한 것이다.
도 3은 본 발명에 의한 스테레오 신호 생성 장치의 일 실시예를 블록도로 도시한 것이다.
도 4는 본 발명에 의한 스테레오 신호 생성 방법 및 장치에서 스테레오를 출력하는 구조에 대한 일 실시예를 도시한 것이다.
이하, 첨부된 도면들을 참조하여 본 발명에 따른 스테레오 신호 생성 방법 및 장치에 대해 상세히 설명한다.
도 2a는 본 발명에 의한 스테레오 신호 생성 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
먼저, 복호화단의 멀티채널에 대한 설정을 인식한다(제200단계). 여기서, 복호화단의 멀티채널에 대한 설정은 복호화단에 구비된 스피커(speaker)의 개수, 복호화단에 구비된 스피커 가운데 동작 가능한 스피커의 위치, 부호화단에서 부호화된 멀티채널들 가운데 복호화단에서 이용을 할 수 있는 채널의 정보 등을 말한다.
제200단계에서 인식된 복호화단의 멀티채널에 대한 설정을 이용하여 복호화하는 레벨(level)의 수를 계산한다(제210단계).
제210단계에서 계산된 레벨의 수가 '1'인지 여부를 판단한다(제220단계).
제220단계에서 계산된 레벨의 수가 '1'이라고 판단되면, 부호화단에서 멀티채널로부터 다운믹스된(down-mixed) 신호의 공간(spatial) 정보를 이용하여 스테레오(stereo) 신호를 생성하기 위한 공간 정보를 생성한다(제230단계). 여기서, 레벨의 수가 '1'인 경우는 OTT 모듈이 1개만 사용된 경우로서 스테레오로 설정되어 있음을 의미한다. 이하에서는 공간 정보를 CLD(Channel Level Difference) 또는 ICC(Inter-Channel Correlation)로 예를 들어 설명하지만, 본 발명에 있어서 공간 정보가 CLD 또는 ICC에 한정되지 않음을 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 알 수 있다.
CLD는 멀티채널에서 소정의 채널 간 에너지의 비율 또는 차에 대한 정보로서 입력 신호들의 시간/주파수 타일(tile)에 대응하는 에너지(energy)의 비율을 말한다. 이러한 CLD는 다음에 기재된 수학식에 의하여 계산할 수 있다.
Figure 112011034281598-pat00001
여기서, x1 및 x2는 서브밴드 도메인( subband domain)에서 2 to 1 부호화기로 입력되는 신호이고, n은 시간 슬롯 인덱스(time slot index)이며, m은 서브밴드 인덱스(subband index)이고, *는 complex conjugate를 의미한다.
ICC는 입력 신호들의 시간/주파수 타일에 대응하는 상관관계(correlation) 또는 일관성(coherence)에 대한 정보로서 유사도(similarity measure)를 말한다. 이러한 ICC는 다음에 기재된 수학식에 의하여 계산할 수 있다.
Figure 112011034281598-pat00002
여기서, x1 및 x2는 서브밴드 도메인에서 2 to 1 부호화기로 입력되는 신호이고, n은 시간 슬롯 인덱스이며, m은 서브밴드 인덱스이고, *는 complex conjugate를 의미한다.
제230단계에서 생성된 공간 정보를 이용하여 다운믹스된 신호를 스테레오 신호로 업믹싱한다(제240단계).
제240단계에서 업믹싱된 스테레오 신호에 TP(Temporal Processing) 또는 TES(Temporal Envelope Shaping)를 적용한다(제250단계). 그러나 본 발명에 따른 스테레오 신호 생성 방법은 소정의 경우에 제250단계를 수행하지 않고 실시할 수 있다.
제210단계에서 계산된 레벨의 수가 '1'이 아닌 것으로 판단되면, 제200단계에서 인식된 복호화단의 멀티채널에 대한 설정에 따라 출력한다(제260단계).
도 2b는 본 발명에 의한 스테레오 신호 생성 방법의 제230단계에 대한 일 실시예를 흐름도로 도시한 것이다.
먼저, 부호화단에서 멀티채널 신호로부터 다운믹스된 신호의 CLD들을 이용하여 스테레오 신호를 생성하기 위한 CLD'을 계산한다(제232단계). 이하, CLD를 계산함에 있어서, CLD는 두 채널의 에너지의 데시벨이 아닌 비로 표현하도록 한다. 제232단계에서 CLD'을 계산함에 있어서, 만일 도 1a 및 1b에서 OTT1 모듈의 CLD가 '1'일 경우 CLD'는 '1'로 설정하고, 만일 도 1a 및 1b에서 OTT1 모듈의 CLD가 '1'이 아닐 경우 CLD'는 다음에 기재된 수학식에 의하여 계산할 수 있다.
Figure 112011034281598-pat00003
여기서, P FL은 FL 채널의 에너지이고, P BL은 BL 에너지이며, P FC는 FC 채널의 에너지이고, P FR은 FR 채널의 에너지이고, P BR은 BR 채널 에너지이며, P FC는 FC 채널의 에너지이고, ICC x는 각 OTT x모듈의 ICC를 의미하며, CLD x는 각 OTT x모듈의 CLD를 의미한다.
부호화단에서 멀티채널로부터 다운믹스된 신호의 CLD들 또는 ICC들을 이용하여 스테레오 신호를 생성하기 위한 ICC'를 계산한다(제234단계).
제234단계에서는 ICC'를 다음에 기재된 방식에 의해서 계산할 수 있다.
첫째, 선형 보간법(Linear Interpolation)을 이용하여 ICC'을 계산한다. 여기서, ICC'은 다음에 기재된 수학식에 의하여 계산할 수 있다.
Figure 112011034281598-pat00004
여기서, ICC'은 계산된 ICC이고, ICC x는 각 OTT x모듈의 ICC를 의미하며, CLD x는 각 OTT x모듈의 CLD를 의미하고, a는 상수이다.
둘째, 룩-업 테이블(Look-up Table)을 이용하여 해당하는 ICC'을 독출한다. 여기서, ICC'은 다음 기재된 수학식에 의하여 독출할 수 있다.
Figure 112011034281598-pat00005
여기서, ICC'은 룩-업 테이블에서 독출된 ICC이고, ICC x는 각 OTT x모듈의 ICC를 의미하며, CLD x는 각 OTT x모듈의 CLD를 의미한다.
ICC 0, ... , ICC N, CLD 0, ... , CLD N에 대응하는 ICC'을 기 마련된 룩-업 테이블에서 검색하여 독출한다. 그러나 반드시 모든 ICC 0, ... , ICC N, CLD 0, ... , CLD N를 이용하여 실시하는 것에 한정하지 않으며, 소정의 특정한 ICC x 또는 CLD x만을 선택적으로 이용하여 실시할 수 있다.
셋째, ICC'을 ICC의 correlation 특성을 이용하여 계산한다. 예를 들면, 5-1-5 2 트리 구조에서는 다음 기재된 수학식에 의하여 ICC'을 계산할 수 있다.
Figure 112011034281598-pat00006
여기서, ICC'는 계산된 ICC이고, ICC x는 각 OTT x모듈의 ICC를 의미하며, CLD x는 각 OTT x모듈의 CLD를 의미하고, a 및 b는 상수이다.
수학식 6은 다음에 기재된 수학식들을 이용하여 유도할 수 있다.
Figure 112011034281598-pat00007
Figure 112011034281598-pat00008
Figure 112011034281598-pat00009
Figure 112011034281598-pat00010
Figure 112011034281598-pat00011
Figure 112011034281598-pat00012
여기서, ICC'는 계산된 ICC이며, L'은 타겟 좌측 채널의 서브밴드 신호이고, R'은 타겟 우측 채널의 서브밴드 신호이며, C'은 타겟 센터 채널의 서브밴드 신호이고, P L'은 타겟 좌측 채널의 에너지이며, P R'은 타겟 우측 채널의 에너지이고, P C'은 타겟 센터 채널의 에너지이며, a는 상수이고, *는 complex conjugate를 의미한다. 여기서, a는 1/sqrt(2)로 설정되고, b는 1로 설정되는 것이 바람직하다.
*수학식 6은 수학식 7 내지 11을 대입하여 수학식 12에 기재된 내적(inner product) 원리를 이용하면 구할 수 있다.
도 4는 본 발명에 의한 스테레오 신호 생성 방법에서 스테레오를 출력하는 구조에 대한 일 실시예를 도시한 것이다. 제230단계에서 생성된 CLD' 또는 ICC' 등과 같은 공간 정보를 이용하여 다운믹스된 모노(m, mono) 신호를 입력받고, OTT 모듈(module)에서 좌측 신호(L) 및 우측 신호(R)로 업믹싱함으로써 스테레오 신호를 생성한다.
도 3은 본 발명에 의한 스테레오 신호 생성 장치의 일 실시예를 블록도로 도시한 것으로서, 상기 스테레오 신호 생성 장치는 공간정보 생성부(300), 업믹싱부(310) 및 TP/TES 적용부(320)를 포함하여 이루어진다.
공간정보 생성부(300)는 부호화단에서 멀티채널로부터 다운믹스된 신호의 공간 정보를 이용하여 스테레오 신호를 생성하기 위한 공간 정보를 생성한다. 이하에서는 공간 정보를 CLD(Channel Level Difference) 또는 ICC(Inter-Channel Correlation)로 예를 들어 설명하지만, 본 발명에 있어서 공간 정보가 CLD 또는 ICC에 한정되지 않음을 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 알 수 있다.
CLD는 멀티채널에서 소정의 채널 간 에너지의 비율 또는 차에 대한 정보로서 입력 신호들의 시간/주파수 타일에 대응하는 에너지의 비율을 말한다. 이러한 CLD는 다음에 기재된 수학식에 의하여 계산할 수 있다.
Figure 112011034281598-pat00013
여기서, x1 및 x2는 서브밴드 도메인에서 2 to 1 부호화기로 입력되는 신호이고, n은 시간 슬롯 인덱스이며, m은 서브밴드 인덱스이고, *는 complex conjugate를 의미한다.
ICC는 입력 신호들의 시간/주파수 타일에 대응하는 상관관계 또는 일관성에 대한 정보로서 유사도를 말한다. 이러한 ICC는 다음에 기재된 수학식에 의하여 계산할 수 있다.
Figure 112011034281598-pat00014
여기서, x1 및 x2는 서브밴드 도메인에서 2 to 1 부호화기로 입력되는 신호이고, n은 시간 슬롯 인덱스이며, m은 서브밴드 인덱스이고, *는 complex conjugate를 의미한다.
여기서, 공간정보 생성부(300)는 CLD' 계산부(302) 및 ICC' 계산부(304)를 포함하여 이루어진다.
CLD' 계산부(302)는 입력단자 IN 1을 통하여 입력받은 부호화기에서 멀티채널로부터 다운믹스된 신호의 CLD들을 이용하여 스테레오 신호를 생성하기 위한 CLD'을 계산한다. 이하, CLD를 계산함에 있어서, CLD는 두 채널의 에너지의 데시벨이 아닌 비로 표현하도록 한다. CLD' 계산부(302)에서 CLD'을 계산함에 있어서, 만일 도 1a 및 1b에서 OTT 1 모듈의 CLD가 '1'일 경우, CLD'는 '1'로 설정하고, 만일 도 1a 및 1b에서 OTT 1 모듈의 CLD가 '1'이 아닐 경우, CLD'는 다음에 기재된 수학식에 의하여 계산할 수 있다.
Figure 112011034281598-pat00015
여기서, P FL은 FL 채널의 에너지이고, P BL은 BL 채널의 에너지이며, P FC는 FC 채널의 에너지이고, P FR은 FR 채널의 에너지이고, P BR은 BR 채널의 에너지이며, P FC는 FC 채널의 에너지이고, CLD 0는 도 1a 및 1b에서 OTT 0 모듈의 CLD이며, CLD 1은 도 1a 및 1b에서 OTT 1 모듈의 CLD이다.
ICC' 계산부(304)는 입력단자 IN 2를 통하여 입력받은 다운믹스된 신호의 ICC들을 이용하여 스테레오 신호를 생성하기 위한 ICC'를 계산한다. ICC' 계산부(304)에서 ICC'를 계산함에 있어서, ICC'은 다음에 기재된 방식에 의하여 계산할 수 있다.
첫째, 선형 보간법을 이용하여 ICC'을 계산한다. 여기서, ICC'은 다음에 기재된 수학식에 의하여 계산할 수 있다.
Figure 112011034281598-pat00016
여기서, ICC'은 계산된 ICC이고, ICC x는 각 OTT x모듈의 ICC를 의미하며, CLD x는 각 OTT x모듈의 CLD를 의미하고, a는 상수이다.
둘째, 룩-업 테이블(Look-up Table)을 이용하여 해당하는 ICC'을 독출한다. ICC'은 다음 기재된 수학식에 의하여 독출할 수 있다.
Figure 112011034281598-pat00017
여기서, ICC'은 룩-업 테이블에서 독출된 ICC이고, ICC x는 각 OTT x모듈의 ICC를 의미하며, CLD x는 각 OTT x모듈의 CLD를 의미한다.
ICC 0, ... , ICC N, CLD 0, ... , CLD N에 대응하는 ICC'을 기 마련된 룩-업 테이블에서 검색하여 독출한다. 그러나 반드시 모든 ICC 0, ... , ICC N, CLD 0, ... , CLD N를 이용하여 실시하는 것에 한정하지 않으며, 소정의 특정한 ICC x 또는 CLD x만을 선택적으로 이용하여 실시할 수 있다.
셋째, ICC'을 ICC의 correlation 특성을 이용하여 계산한다. 예를 들면, 5-1-5 2 트리 구조에서는 다음 기재된 수학식에 의하여 ICC'을 계산할 수 있다.
Figure 112011034281598-pat00018
여기서, ICC'는 계산된 ICC이고, ICC x는 각 OTT x모듈의 ICC를 의미하며, CLD x는 각 OTT x모듈의 CLD를 의미하고, a 및 b는 상수이다.
수학식 18은 다음에 기재된 수학식들을 이용하여 유도할 수 있다.
Figure 112011034281598-pat00019
Figure 112011034281598-pat00020
Figure 112011034281598-pat00021
Figure 112011034281598-pat00022
Figure 112011034281598-pat00023
Figure 112011034281598-pat00024
여기서, ICC'는 계산된 ICC이며, L'은 타겟 좌측 채널의 서브밴드 신호이고, R'은 타겟 우측 채널의 서브밴드 신호이며, C'은 타겟 센터 채널의 서브밴드 신호이고, P L'은 타겟 좌측 채널의 에너지이며, P R'은 타겟 우측 채널의 에너지이고, P C'은 타겟 센터 채널의 에너지이며, a는 상수이고, *는 complex conjugate를 의미한다. 여기서, a는 1/sqrt(2)로 설정되고, b는 1로 설정되는 것이 바람직하다.
수학식 18은 수학식 19 내지 23을 대입하여 수학식 24에 기재된 내적 원리를 이용하면 구할 수 있다.
업믹싱부(310)는 CLD' 계산부(302)에서 계산된 CLD' 및 ICC' 계산부(304)에서 계산된 ICC'과 같은 공간정보 생성부(300)에서 생성된 공간 정보를 이용하여 입력 단자 IN0를 통해 입력받은 다운믹스된 신호를 스테레오 신호로 업믹싱한다.
도 4는 본 발명에 의한 스테레오 신호 생성 장치에서 스테레오를 출력하는 구조에 대한 일 실시예를 도시한 것이다. CLD' 계산부(302)에서 계산된 CLD' 및 ICC' 계산부(304)에서 계산된 ICC'과 같은 공간정보 생성부(300)에서 생성된 공간 정보를 이용하여 다운믹스된 모노 신호(m)를 입력받고, OTT 모듈에서 좌측 신호(L) 및 우측 신호(R)로 업믹싱함으로써 스테레오 신호를 생성한다.
TP/TES 적용부(320)는 업믹싱부(310)에서 업믹싱된 스테레오 신호에 TP 또는 TES를 적용한다. 여기서, TP/TES 적용부(320)는 TP 또는 TES를 적용한 결과를 출력 단자 OUT 1을 통해 좌측 신호를 출력하고, 출력 단자 OUT 2를 통해 우측 신호를 출력한다. 그러나 본 발명에 따른 스테레오 신호 생성 장치는 소정의 경우에 TP/TES 적용부(320)를 구비하지 않고 실시할 수 있다.
본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장 장치 등이 있다.
이러한 본 발명에 대한 이해를 돕기 위하여 도면에 도시된 실시예를 참고로 설명되었으나, 이는 예시적인 것에 불과하며, 당해 분야에서 통상적 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위에 의해 정해져야 할 것이다.
300: 공간정보 생성부 302: CLD' 계산부
304: ICC' 계산부 310: 업믹싱부
320: TP/TES 적용부

Claims (1)

  1. 멀티채널 신호의 CLD(Channel level difference)들 및 ICC(Inter-Channel Correlation)들을 포함하며, 다운믹스된 신호를 스테레오 신호로 업믹싱하는 공간정보를 생성하는 단계; 및
    상기 생성된 공간정보를 이용하여 OTT 모듈에 의해 상기 다운믹스된 신호를 스테레오 신호로 업믹싱하는 단계를 포함하고,
    상기 생성된 공간정보는 상기 멀티채널 신호의 전방 좌측 채널, 후방 좌측 채널 및 전방 중앙 채널에서의 에너지와 상기 멀티채널 신호의 전방 우측 채널, 후방 우측 채널 및 전방 중앙 채널에서의 에너지의 비율로부터 얻어지는 것을 특징으로 하는 스테레오 신호 생성 방법.
KR1020110043581A 2006-03-06 2011-05-09 스테레오 신호 생성 방법 KR101058047B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US77893306P 2006-03-06 2006-03-06
US60/778,933 2006-03-06
KR1020060049035 2006-05-30
KR20060049035 2006-05-30

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020070067133A Division KR101044948B1 (ko) 2006-03-06 2007-07-04 스테레오 신호 생성 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20110068957A KR20110068957A (ko) 2011-06-22
KR101058047B1 true KR101058047B1 (ko) 2011-08-19

Family

ID=46045441

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020060111240A KR100773562B1 (ko) 2006-03-06 2006-11-10 스테레오 신호 생성 방법 및 장치
KR1020070067133A KR101044948B1 (ko) 2006-03-06 2007-07-04 스테레오 신호 생성 방법 및 장치
KR1020110043581A KR101058047B1 (ko) 2006-03-06 2011-05-09 스테레오 신호 생성 방법

Family Applications Before (2)

Application Number Title Priority Date Filing Date
KR1020060111240A KR100773562B1 (ko) 2006-03-06 2006-11-10 스테레오 신호 생성 방법 및 장치
KR1020070067133A KR101044948B1 (ko) 2006-03-06 2007-07-04 스테레오 신호 생성 방법 및 장치

Country Status (4)

Country Link
US (2) US9087511B2 (ko)
EP (1) EP1991985B1 (ko)
KR (3) KR100773562B1 (ko)
WO (1) WO2007102675A1 (ko)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US8917874B2 (en) * 2005-05-26 2014-12-23 Lg Electronics Inc. Method and apparatus for decoding an audio signal
KR100857105B1 (ko) * 2005-09-14 2008-09-05 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
JP4814344B2 (ja) * 2006-01-19 2011-11-16 エルジー エレクトロニクス インコーポレイティド メディア信号の処理方法及び装置
WO2007091842A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
KR100773562B1 (ko) 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
KR101453732B1 (ko) * 2007-04-16 2014-10-24 삼성전자주식회사 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
WO2010036062A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
EP2169666B1 (en) * 2008-09-25 2015-07-15 Lg Electronics Inc. A method and an apparatus for processing a signal
WO2010036060A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
US8620008B2 (en) 2009-01-20 2013-12-31 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
KR101211098B1 (ko) 2011-04-25 2012-12-11 (주)엔써즈 클라이언트 단말기측으로 네트워크를 통해 방송에 포함된 광고와 연관된 정보를 제공하는 시스템 및 방법
KR101310943B1 (ko) 2011-09-26 2013-09-23 (주)엔써즈 방송 콘텐츠와 연관된 콘텐츠 연관 정보를 제공하는 시스템 및 방법
KR101404596B1 (ko) 2012-05-03 2014-06-11 (주)엔써즈 이미지에 기반하여 동영상 서비스를 제공하는 시스템 및 방법
US8886635B2 (en) 2012-05-23 2014-11-11 Enswers Co., Ltd. Apparatus and method for recognizing content using audio signal
KR101315970B1 (ko) 2012-05-23 2013-10-08 (주)엔써즈 오디오 신호를 이용한 콘텐츠 인식 장치 및 방법
KR101369475B1 (ko) 2013-01-23 2014-03-06 (주)엔써즈 방송 시청률 조사 시스템 및 방법
KR101456926B1 (ko) 2013-06-14 2014-10-31 (주)엔써즈 핑거프린트에 기반한 광고 검출 시스템 및 방법
US11451919B2 (en) 2021-02-19 2022-09-20 Boomcloud 360, Inc. All-pass network system for colorless decorrelation with constraints

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711552B2 (en) 2006-01-27 2010-05-04 Dolby International Ab Efficient filtering with a complex modulated filterbank

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002007481A2 (en) * 2000-07-19 2002-01-24 Koninklijke Philips Electronics N.V. Multi-channel stereo converter for deriving a stereo surround and/or audio centre signal
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
CN100539742C (zh) * 2002-07-12 2009-09-09 皇家飞利浦电子股份有限公司 多声道音频信号编解码方法和装置
US7305097B2 (en) * 2003-02-14 2007-12-04 Bose Corporation Controlling fading and surround signal level
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7805313B2 (en) 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US20050271214A1 (en) * 2004-06-04 2005-12-08 Kim Sun-Min Apparatus and method of reproducing wide stereo sound
KR100677119B1 (ko) * 2004-06-04 2007-02-02 삼성전자주식회사 와이드 스테레오 재생 방법 및 그 장치
US7727374B2 (en) 2004-09-23 2010-06-01 Skyonic Corporation Removing carbon dioxide from waste streams through co-generation of carbonate and/or bicarbonate minerals
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
US20060093164A1 (en) 2004-10-28 2006-05-04 Neural Audio, Inc. Audio spatial environment engine
US7903824B2 (en) 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
EP1829424B1 (en) * 2005-04-15 2009-01-21 Dolby Sweden AB Temporal envelope shaping of decorrelated signals
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
US8917874B2 (en) * 2005-05-26 2014-12-23 Lg Electronics Inc. Method and apparatus for decoding an audio signal
KR100773562B1 (ko) 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711552B2 (en) 2006-01-27 2010-05-04 Dolby International Ab Efficient filtering with a complex modulated filterbank

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
IEEE Transaction on Multimedia, vol.1 no.3, pp.237-250 (1999.09)

Also Published As

Publication number Publication date
EP1991985B1 (en) 2018-06-20
KR20070091587A (ko) 2007-09-11
US20150312548A1 (en) 2015-10-29
US20070223709A1 (en) 2007-09-27
KR100773562B1 (ko) 2007-11-07
WO2007102675A1 (en) 2007-09-13
KR20110068957A (ko) 2011-06-22
EP1991985A1 (en) 2008-11-19
KR101044948B1 (ko) 2011-06-28
US9087511B2 (en) 2015-07-21
EP1991985A4 (en) 2011-12-28
US9848180B2 (en) 2017-12-19
KR20070091518A (ko) 2007-09-11

Similar Documents

Publication Publication Date Title
KR101058047B1 (ko) 스테레오 신호 생성 방법
JP5563647B2 (ja) マルチチャンネル復号化方法及びマルチチャンネル復号化装置
KR100773560B1 (ko) 스테레오 신호 생성 방법 및 장치
KR101491890B1 (ko) 다운믹스 신호 및 공간 파라메트릭 정보로부터 다이렉트/앰비언스 신호를 추출하기 위한 장치 및 방법
KR100888474B1 (ko) 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
EP2509071B1 (en) Method, medium and apparatus with scalable decoding
KR101756838B1 (ko) 다채널 오디오 신호를 다운 믹스하는 방법 및 장치

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140730

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150730

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160728

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170728

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190730

Year of fee payment: 9