KR101058047B1 - 스테레오 신호 생성 방법 - Google Patents
스테레오 신호 생성 방법 Download PDFInfo
- Publication number
- KR101058047B1 KR101058047B1 KR1020110043581A KR20110043581A KR101058047B1 KR 101058047 B1 KR101058047 B1 KR 101058047B1 KR 1020110043581 A KR1020110043581 A KR 1020110043581A KR 20110043581 A KR20110043581 A KR 20110043581A KR 101058047 B1 KR101058047 B1 KR 101058047B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- icc
- channel
- cld
- stereo signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 17
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 7
- 230000005236 sound signal Effects 0.000 abstract description 2
- 101001062093 Homo sapiens RNA-binding protein 15 Proteins 0.000 description 26
- 102100029244 RNA-binding protein 15 Human genes 0.000 description 26
- 238000004364 calculation method Methods 0.000 description 6
- 238000011965 cell line development Methods 0.000 description 3
- 210000002370 ICC Anatomy 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000010988 intraclass correlation coefficient Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 101000591286 Homo sapiens Myocardin-related transcription factor A Proteins 0.000 description 1
- 102100034099 Myocardin-related transcription factor A Human genes 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/161—Encoding, multiplexing or demultiplexing different image signal components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/308—Electronic adaptation dependent on speaker or headphone connection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Stereophonic System (AREA)
Abstract
본 발명은 멀티 채널(multi-channel)로 오디오 신호를 출력하는 서라운드 오디오 코딩에 관한 것으로, 부호화단에서 다운믹스된 신호를 복호화단에서 멀티채널로 업믹싱하기 위하여 생성된 공간 정보를 이용하여 스테레오 신호를 생성하기 위한 공간 정보를 생성함으로써 다운믹스된 신호를 스테레오 신호로 업믹싱한다.
이렇게 함으로써 멀티채널에서 모노로 다운믹싱된 신호를 스테레오 신호에 보다 적합하게 업믹싱하므로 스테레오 신호의 음질을 향상시킬 수 있는 효과를 거둘 수 있다.
이렇게 함으로써 멀티채널에서 모노로 다운믹싱된 신호를 스테레오 신호에 보다 적합하게 업믹싱하므로 스테레오 신호의 음질을 향상시킬 수 있는 효과를 거둘 수 있다.
Description
본 발명은 오디오 코딩에 관한 것으로, 보다 상세하게는 멀티 채널(multi-channel)로 오디오 신호를 복호화하는 서라운드 오디오 코딩에 관한 것이다.
일반적으로 멀티채널 오디오 코딩에는 웨이브폼(waveform) 멀티채널 오디오 코딩과 파라메트릭(Parametric) 멀티채널 오디오 코딩이 있다. 웨이브폼 멀티채널 오디오 코딩에는 MPEG-2 MC 오디오 코딩, AAC MC 오디오 코딩 및 BSAC/AVS MC 오디오 코딩 등이 있으며, 5개의 채널 신호를 입력으로 하여 5개의 채널 신호로 출력한다. 파라메트릭 멀티채널 오디오 코딩은 MPEG 서라운드 코딩이 있으며, 복호화단에서 1 또는 2 개의 입력 채널을 6 또는 8개의 멀티 채널로 출력한다.
여기서, MPEG 서라운드는 도 1a에 도시된 5-1-5 1 트리 구조와 도 1b에 도시된 5-1-5 2 트리 구조를 이용하여 멀티 채널로 신호를 생성하여 출력한다. 이러한 트리 구조들은 모노(mono) 신호를 입력받아 OTT 모듈(module)들의 조합에서 처리하여 FL(Front Left) 채널, FR(Front Right) 채널, C(Center) 채널, LFE(Low Frequency Enhancement) 채널, BL(Back Left) 채널 및 BR(Back Right) 채널의 멀티 채널 신호를 출력한다.
그러나 모바일 어플레케이션(mobile application)의 이용이 증가함에 따라 멀티 채널보다 스테레오 채널이 더 많이 사용하게 된다. 도 1a 및 1b의 OTT 0 모듈에서 출력되는 신호를 살펴보면, 5-1-5 1 트리 구조에서는 FL 채널, FR 채널, C 채널 및 LFE 채널이 믹스된 신호와 BL 채널 및 BR 채널이 믹스된 신호로 출력된다. 그리고 5-1-5 2 트리 구조에서는 FL 채널, BL 채널, FR 채널 및 BR 채널이 믹스된 신호와 C 채널 및 LFE 채널이 믹스된 신호로 출력된다. 이와 같은 5-1-5 1 트리 구조 및 5-1-5 2 트리 구조의 OTT 0 모듈에서 출력된 신호들을 좌측 채널과 우측 채널로 출력되는 스테레오 신호로 이용하기에는 적합하지 않은 문제점을 갖는다.
본 발명이 이루고자 하는 기술적 과제는, 부호화단에서 다운믹스된 신호를 복호화단에서 멀티채널로 업믹싱하기 위한 공간 정보를 이용하여 스테레오 신호로 업믹싱하기 위한 공간 정보를 생성함으로써 다운믹스된 신호를 스테레오 신호로 업믹싱하는 스테레오 신호 생성 방법 및 장치를 제공하는 것이다.
상기의 과제를 이루기 위한 본 발명에 의한 스테레오 신호 생성 방법은, 다운믹스된(down-mixed) 신호를 멀티채널(multi-channel) 신호로 업믹싱(up-mixing)하는 공간 정보를 이용하여 다운믹스된 신호를 스테레오 신호로 업믹싱하는 공간 정보를 생성하는 단계 및 상기 생성된 공간 정보를 이용하여 상기 다운믹스된 신호를 스테레오 신호로 업믹싱하는 단계를 포함하는 것을 특징으로 한다.
전술된 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체인 것이 바람직하다.
상기의 과제를 이루기 위한 본 발명에 의한 스테레오 신호 생성 장치는, 다운믹스된 신호를 멀티채널 신호로 업믹싱하는 공간 정보를 이용하여 다운믹스된 신호를 스테레오 신호로 업믹싱하는 공간 정보를 생성하는 공간정보 생성부 및 상기 생성된 공간 정보를 이용하여 상기 다운믹스된 신호를 스테레오 신호로 업믹싱하는 업믹싱부를 포함하는 것을 특징으로 한다.
본 발명에 의한 스테레오 신호 생성 방법 및 장치에 의하면, 다운믹스된 신호를 멀티채널로 업믹싱하는 공간 정보를 이용하여 다운믹스된 신호를 스테레오 신호로 업믹싱하는 공간 정보를 생성함으로써 다운믹스된 신호를 스테레오 신호로 업믹싱한다.
이렇게 함으로써 부호화단에서 멀티채널로부터 모노로 다운믹싱된 신호를 스테레오 신호에 보다 적합하게 업믹싱하므로 스테레오 신호의 음질을 향상시킬 수 있는 효과를 거둘 수 있다.
도 1a는 MPEG 서라운드(Surround)의 5-1-5 1 트리 구조(tree structure)를 도시한 것이다.
도 1b는 MPEG 서라운드의 5-1-5 2 트리 구조를 도시한 것이다.
도 2a는 본 발명에 의한 스테레오 신호 생성 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
도 2b는 본 발명에 의한 스테레오 신호 생성 방법의 제230단계에 대한 일 실시예를 흐름도로 도시한 것이다.
도 3은 본 발명에 의한 스테레오 신호 생성 장치의 일 실시예를 블록도로 도시한 것이다.
도 4는 본 발명에 의한 스테레오 신호 생성 방법 및 장치에서 스테레오를 출력하는 구조에 대한 일 실시예를 도시한 것이다.
도 1b는 MPEG 서라운드의 5-1-5 2 트리 구조를 도시한 것이다.
도 2a는 본 발명에 의한 스테레오 신호 생성 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
도 2b는 본 발명에 의한 스테레오 신호 생성 방법의 제230단계에 대한 일 실시예를 흐름도로 도시한 것이다.
도 3은 본 발명에 의한 스테레오 신호 생성 장치의 일 실시예를 블록도로 도시한 것이다.
도 4는 본 발명에 의한 스테레오 신호 생성 방법 및 장치에서 스테레오를 출력하는 구조에 대한 일 실시예를 도시한 것이다.
이하, 첨부된 도면들을 참조하여 본 발명에 따른 스테레오 신호 생성 방법 및 장치에 대해 상세히 설명한다.
도 2a는 본 발명에 의한 스테레오 신호 생성 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
먼저, 복호화단의 멀티채널에 대한 설정을 인식한다(제200단계). 여기서, 복호화단의 멀티채널에 대한 설정은 복호화단에 구비된 스피커(speaker)의 개수, 복호화단에 구비된 스피커 가운데 동작 가능한 스피커의 위치, 부호화단에서 부호화된 멀티채널들 가운데 복호화단에서 이용을 할 수 있는 채널의 정보 등을 말한다.
제200단계에서 인식된 복호화단의 멀티채널에 대한 설정을 이용하여 복호화하는 레벨(level)의 수를 계산한다(제210단계).
제210단계에서 계산된 레벨의 수가 '1'인지 여부를 판단한다(제220단계).
제220단계에서 계산된 레벨의 수가 '1'이라고 판단되면, 부호화단에서 멀티채널로부터 다운믹스된(down-mixed) 신호의 공간(spatial) 정보를 이용하여 스테레오(stereo) 신호를 생성하기 위한 공간 정보를 생성한다(제230단계). 여기서, 레벨의 수가 '1'인 경우는 OTT 모듈이 1개만 사용된 경우로서 스테레오로 설정되어 있음을 의미한다. 이하에서는 공간 정보를 CLD(Channel Level Difference) 또는 ICC(Inter-Channel Correlation)로 예를 들어 설명하지만, 본 발명에 있어서 공간 정보가 CLD 또는 ICC에 한정되지 않음을 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 알 수 있다.
CLD는 멀티채널에서 소정의 채널 간 에너지의 비율 또는 차에 대한 정보로서 입력 신호들의 시간/주파수 타일(tile)에 대응하는 에너지(energy)의 비율을 말한다. 이러한 CLD는 다음에 기재된 수학식에 의하여 계산할 수 있다.
여기서, x1 및 x2는 서브밴드 도메인( subband domain)에서 2 to 1 부호화기로 입력되는 신호이고, n은 시간 슬롯 인덱스(time slot index)이며, m은 서브밴드 인덱스(subband index)이고, *는 complex conjugate를 의미한다.
ICC는 입력 신호들의 시간/주파수 타일에 대응하는 상관관계(correlation) 또는 일관성(coherence)에 대한 정보로서 유사도(similarity measure)를 말한다. 이러한 ICC는 다음에 기재된 수학식에 의하여 계산할 수 있다.
여기서, x1 및 x2는 서브밴드 도메인에서 2 to 1 부호화기로 입력되는 신호이고, n은 시간 슬롯 인덱스이며, m은 서브밴드 인덱스이고, *는 complex conjugate를 의미한다.
제230단계에서 생성된 공간 정보를 이용하여 다운믹스된 신호를 스테레오 신호로 업믹싱한다(제240단계).
제240단계에서 업믹싱된 스테레오 신호에 TP(Temporal Processing) 또는 TES(Temporal Envelope Shaping)를 적용한다(제250단계). 그러나 본 발명에 따른 스테레오 신호 생성 방법은 소정의 경우에 제250단계를 수행하지 않고 실시할 수 있다.
제210단계에서 계산된 레벨의 수가 '1'이 아닌 것으로 판단되면, 제200단계에서 인식된 복호화단의 멀티채널에 대한 설정에 따라 출력한다(제260단계).
도 2b는 본 발명에 의한 스테레오 신호 생성 방법의 제230단계에 대한 일 실시예를 흐름도로 도시한 것이다.
먼저, 부호화단에서 멀티채널 신호로부터 다운믹스된 신호의 CLD들을 이용하여 스테레오 신호를 생성하기 위한 CLD'을 계산한다(제232단계). 이하, CLD를 계산함에 있어서, CLD는 두 채널의 에너지의 데시벨이 아닌 비로 표현하도록 한다. 제232단계에서 CLD'을 계산함에 있어서, 만일 도 1a 및 1b에서 OTT1 모듈의 CLD가 '1'일 경우 CLD'는 '1'로 설정하고, 만일 도 1a 및 1b에서 OTT1 모듈의 CLD가 '1'이 아닐 경우 CLD'는 다음에 기재된 수학식에 의하여 계산할 수 있다.
여기서, P FL은 FL 채널의 에너지이고, P BL은 BL 에너지이며, P FC는 FC 채널의 에너지이고, P FR은 FR 채널의 에너지이고, P BR은 BR 채널 에너지이며, P FC는 FC 채널의 에너지이고, ICC x는 각 OTT x모듈의 ICC를 의미하며, CLD x는 각 OTT x모듈의 CLD를 의미한다.
부호화단에서 멀티채널로부터 다운믹스된 신호의 CLD들 또는 ICC들을 이용하여 스테레오 신호를 생성하기 위한 ICC'를 계산한다(제234단계).
제234단계에서는 ICC'를 다음에 기재된 방식에 의해서 계산할 수 있다.
첫째, 선형 보간법(Linear Interpolation)을 이용하여 ICC'을 계산한다. 여기서, ICC'은 다음에 기재된 수학식에 의하여 계산할 수 있다.
여기서, ICC'은 계산된 ICC이고, ICC x는 각 OTT x모듈의 ICC를 의미하며, CLD x는 각 OTT x모듈의 CLD를 의미하고, a는 상수이다.
둘째, 룩-업 테이블(Look-up Table)을 이용하여 해당하는 ICC'을 독출한다. 여기서, ICC'은 다음 기재된 수학식에 의하여 독출할 수 있다.
여기서, ICC'은 룩-업 테이블에서 독출된 ICC이고, ICC x는 각 OTT x모듈의 ICC를 의미하며, CLD x는 각 OTT x모듈의 CLD를 의미한다.
ICC 0, ... , ICC N, CLD 0, ... , CLD N에 대응하는 ICC'을 기 마련된 룩-업 테이블에서 검색하여 독출한다. 그러나 반드시 모든 ICC 0, ... , ICC N, CLD 0, ... , CLD N를 이용하여 실시하는 것에 한정하지 않으며, 소정의 특정한 ICC x 또는 CLD x만을 선택적으로 이용하여 실시할 수 있다.
셋째, ICC'을 ICC의 correlation 특성을 이용하여 계산한다. 예를 들면, 5-1-5 2 트리 구조에서는 다음 기재된 수학식에 의하여 ICC'을 계산할 수 있다.
여기서, ICC'는 계산된 ICC이고, ICC x는 각 OTT x모듈의 ICC를 의미하며, CLD x는 각 OTT x모듈의 CLD를 의미하고, a 및 b는 상수이다.
수학식 6은 다음에 기재된 수학식들을 이용하여 유도할 수 있다.
여기서, ICC'는 계산된 ICC이며, L'은 타겟 좌측 채널의 서브밴드 신호이고, R'은 타겟 우측 채널의 서브밴드 신호이며, C'은 타겟 센터 채널의 서브밴드 신호이고, P L'은 타겟 좌측 채널의 에너지이며, P R'은 타겟 우측 채널의 에너지이고, P C'은 타겟 센터 채널의 에너지이며, a는 상수이고, *는 complex conjugate를 의미한다. 여기서, a는 1/sqrt(2)로 설정되고, b는 1로 설정되는 것이 바람직하다.
*수학식 6은 수학식 7 내지 11을 대입하여 수학식 12에 기재된 내적(inner product) 원리를 이용하면 구할 수 있다.
도 4는 본 발명에 의한 스테레오 신호 생성 방법에서 스테레오를 출력하는 구조에 대한 일 실시예를 도시한 것이다. 제230단계에서 생성된 CLD' 또는 ICC' 등과 같은 공간 정보를 이용하여 다운믹스된 모노(m, mono) 신호를 입력받고, OTT 모듈(module)에서 좌측 신호(L) 및 우측 신호(R)로 업믹싱함으로써 스테레오 신호를 생성한다.
도 3은 본 발명에 의한 스테레오 신호 생성 장치의 일 실시예를 블록도로 도시한 것으로서, 상기 스테레오 신호 생성 장치는 공간정보 생성부(300), 업믹싱부(310) 및 TP/TES 적용부(320)를 포함하여 이루어진다.
공간정보 생성부(300)는 부호화단에서 멀티채널로부터 다운믹스된 신호의 공간 정보를 이용하여 스테레오 신호를 생성하기 위한 공간 정보를 생성한다. 이하에서는 공간 정보를 CLD(Channel Level Difference) 또는 ICC(Inter-Channel Correlation)로 예를 들어 설명하지만, 본 발명에 있어서 공간 정보가 CLD 또는 ICC에 한정되지 않음을 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 알 수 있다.
CLD는 멀티채널에서 소정의 채널 간 에너지의 비율 또는 차에 대한 정보로서 입력 신호들의 시간/주파수 타일에 대응하는 에너지의 비율을 말한다. 이러한 CLD는 다음에 기재된 수학식에 의하여 계산할 수 있다.
여기서, x1 및 x2는 서브밴드 도메인에서 2 to 1 부호화기로 입력되는 신호이고, n은 시간 슬롯 인덱스이며, m은 서브밴드 인덱스이고, *는 complex conjugate를 의미한다.
ICC는 입력 신호들의 시간/주파수 타일에 대응하는 상관관계 또는 일관성에 대한 정보로서 유사도를 말한다. 이러한 ICC는 다음에 기재된 수학식에 의하여 계산할 수 있다.
여기서, x1 및 x2는 서브밴드 도메인에서 2 to 1 부호화기로 입력되는 신호이고, n은 시간 슬롯 인덱스이며, m은 서브밴드 인덱스이고, *는 complex conjugate를 의미한다.
여기서, 공간정보 생성부(300)는 CLD' 계산부(302) 및 ICC' 계산부(304)를 포함하여 이루어진다.
CLD' 계산부(302)는 입력단자 IN 1을 통하여 입력받은 부호화기에서 멀티채널로부터 다운믹스된 신호의 CLD들을 이용하여 스테레오 신호를 생성하기 위한 CLD'을 계산한다. 이하, CLD를 계산함에 있어서, CLD는 두 채널의 에너지의 데시벨이 아닌 비로 표현하도록 한다. CLD' 계산부(302)에서 CLD'을 계산함에 있어서, 만일 도 1a 및 1b에서 OTT 1 모듈의 CLD가 '1'일 경우, CLD'는 '1'로 설정하고, 만일 도 1a 및 1b에서 OTT 1 모듈의 CLD가 '1'이 아닐 경우, CLD'는 다음에 기재된 수학식에 의하여 계산할 수 있다.
여기서, P FL은 FL 채널의 에너지이고, P BL은 BL 채널의 에너지이며, P FC는 FC 채널의 에너지이고, P FR은 FR 채널의 에너지이고, P BR은 BR 채널의 에너지이며, P FC는 FC 채널의 에너지이고, CLD 0는 도 1a 및 1b에서 OTT 0 모듈의 CLD이며, CLD 1은 도 1a 및 1b에서 OTT 1 모듈의 CLD이다.
ICC' 계산부(304)는 입력단자 IN 2를 통하여 입력받은 다운믹스된 신호의 ICC들을 이용하여 스테레오 신호를 생성하기 위한 ICC'를 계산한다. ICC' 계산부(304)에서 ICC'를 계산함에 있어서, ICC'은 다음에 기재된 방식에 의하여 계산할 수 있다.
첫째, 선형 보간법을 이용하여 ICC'을 계산한다. 여기서, ICC'은 다음에 기재된 수학식에 의하여 계산할 수 있다.
여기서, ICC'은 계산된 ICC이고, ICC x는 각 OTT x모듈의 ICC를 의미하며, CLD x는 각 OTT x모듈의 CLD를 의미하고, a는 상수이다.
둘째, 룩-업 테이블(Look-up Table)을 이용하여 해당하는 ICC'을 독출한다. ICC'은 다음 기재된 수학식에 의하여 독출할 수 있다.
여기서, ICC'은 룩-업 테이블에서 독출된 ICC이고, ICC x는 각 OTT x모듈의 ICC를 의미하며, CLD x는 각 OTT x모듈의 CLD를 의미한다.
ICC 0, ... , ICC N, CLD 0, ... , CLD N에 대응하는 ICC'을 기 마련된 룩-업 테이블에서 검색하여 독출한다. 그러나 반드시 모든 ICC 0, ... , ICC N, CLD 0, ... , CLD N를 이용하여 실시하는 것에 한정하지 않으며, 소정의 특정한 ICC x 또는 CLD x만을 선택적으로 이용하여 실시할 수 있다.
셋째, ICC'을 ICC의 correlation 특성을 이용하여 계산한다. 예를 들면, 5-1-5 2 트리 구조에서는 다음 기재된 수학식에 의하여 ICC'을 계산할 수 있다.
여기서, ICC'는 계산된 ICC이고, ICC x는 각 OTT x모듈의 ICC를 의미하며, CLD x는 각 OTT x모듈의 CLD를 의미하고, a 및 b는 상수이다.
수학식 18은 다음에 기재된 수학식들을 이용하여 유도할 수 있다.
여기서, ICC'는 계산된 ICC이며, L'은 타겟 좌측 채널의 서브밴드 신호이고, R'은 타겟 우측 채널의 서브밴드 신호이며, C'은 타겟 센터 채널의 서브밴드 신호이고, P L'은 타겟 좌측 채널의 에너지이며, P R'은 타겟 우측 채널의 에너지이고, P C'은 타겟 센터 채널의 에너지이며, a는 상수이고, *는 complex conjugate를 의미한다. 여기서, a는 1/sqrt(2)로 설정되고, b는 1로 설정되는 것이 바람직하다.
수학식 18은 수학식 19 내지 23을 대입하여 수학식 24에 기재된 내적 원리를 이용하면 구할 수 있다.
업믹싱부(310)는 CLD' 계산부(302)에서 계산된 CLD' 및 ICC' 계산부(304)에서 계산된 ICC'과 같은 공간정보 생성부(300)에서 생성된 공간 정보를 이용하여 입력 단자 IN0를 통해 입력받은 다운믹스된 신호를 스테레오 신호로 업믹싱한다.
도 4는 본 발명에 의한 스테레오 신호 생성 장치에서 스테레오를 출력하는 구조에 대한 일 실시예를 도시한 것이다. CLD' 계산부(302)에서 계산된 CLD' 및 ICC' 계산부(304)에서 계산된 ICC'과 같은 공간정보 생성부(300)에서 생성된 공간 정보를 이용하여 다운믹스된 모노 신호(m)를 입력받고, OTT 모듈에서 좌측 신호(L) 및 우측 신호(R)로 업믹싱함으로써 스테레오 신호를 생성한다.
TP/TES 적용부(320)는 업믹싱부(310)에서 업믹싱된 스테레오 신호에 TP 또는 TES를 적용한다. 여기서, TP/TES 적용부(320)는 TP 또는 TES를 적용한 결과를 출력 단자 OUT 1을 통해 좌측 신호를 출력하고, 출력 단자 OUT 2를 통해 우측 신호를 출력한다. 그러나 본 발명에 따른 스테레오 신호 생성 장치는 소정의 경우에 TP/TES 적용부(320)를 구비하지 않고 실시할 수 있다.
본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장 장치 등이 있다.
이러한 본 발명에 대한 이해를 돕기 위하여 도면에 도시된 실시예를 참고로 설명되었으나, 이는 예시적인 것에 불과하며, 당해 분야에서 통상적 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위에 의해 정해져야 할 것이다.
300: 공간정보 생성부 302: CLD' 계산부
304: ICC' 계산부 310: 업믹싱부
320: TP/TES 적용부
304: ICC' 계산부 310: 업믹싱부
320: TP/TES 적용부
Claims (1)
- 멀티채널 신호의 CLD(Channel level difference)들 및 ICC(Inter-Channel Correlation)들을 포함하며, 다운믹스된 신호를 스테레오 신호로 업믹싱하는 공간정보를 생성하는 단계; 및
상기 생성된 공간정보를 이용하여 OTT 모듈에 의해 상기 다운믹스된 신호를 스테레오 신호로 업믹싱하는 단계를 포함하고,
상기 생성된 공간정보는 상기 멀티채널 신호의 전방 좌측 채널, 후방 좌측 채널 및 전방 중앙 채널에서의 에너지와 상기 멀티채널 신호의 전방 우측 채널, 후방 우측 채널 및 전방 중앙 채널에서의 에너지의 비율로부터 얻어지는 것을 특징으로 하는 스테레오 신호 생성 방법.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US77893306P | 2006-03-06 | 2006-03-06 | |
US60/778,933 | 2006-03-06 | ||
KR1020060049035 | 2006-05-30 | ||
KR20060049035 | 2006-05-30 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070067133A Division KR101044948B1 (ko) | 2006-03-06 | 2007-07-04 | 스테레오 신호 생성 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110068957A KR20110068957A (ko) | 2011-06-22 |
KR101058047B1 true KR101058047B1 (ko) | 2011-08-19 |
Family
ID=46045441
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020060111240A KR100773562B1 (ko) | 2006-03-06 | 2006-11-10 | 스테레오 신호 생성 방법 및 장치 |
KR1020070067133A KR101044948B1 (ko) | 2006-03-06 | 2007-07-04 | 스테레오 신호 생성 방법 및 장치 |
KR1020110043581A KR101058047B1 (ko) | 2006-03-06 | 2011-05-09 | 스테레오 신호 생성 방법 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020060111240A KR100773562B1 (ko) | 2006-03-06 | 2006-11-10 | 스테레오 신호 생성 방법 및 장치 |
KR1020070067133A KR101044948B1 (ko) | 2006-03-06 | 2007-07-04 | 스테레오 신호 생성 방법 및 장치 |
Country Status (4)
Country | Link |
---|---|
US (2) | US9087511B2 (ko) |
EP (1) | EP1991985B1 (ko) |
KR (3) | KR100773562B1 (ko) |
WO (1) | WO2007102675A1 (ko) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4988716B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
US8917874B2 (en) * | 2005-05-26 | 2014-12-23 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
KR100857105B1 (ko) * | 2005-09-14 | 2008-09-05 | 엘지전자 주식회사 | 오디오 신호의 디코딩 방법 및 장치 |
JP4814344B2 (ja) * | 2006-01-19 | 2011-11-16 | エルジー エレクトロニクス インコーポレイティド | メディア信号の処理方法及び装置 |
WO2007091842A1 (en) * | 2006-02-07 | 2007-08-16 | Lg Electronics Inc. | Apparatus and method for encoding/decoding signal |
KR100773562B1 (ko) | 2006-03-06 | 2007-11-07 | 삼성전자주식회사 | 스테레오 신호 생성 방법 및 장치 |
KR101453732B1 (ko) * | 2007-04-16 | 2014-10-24 | 삼성전자주식회사 | 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치 |
KR101505831B1 (ko) * | 2007-10-30 | 2015-03-26 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 방법 및 장치 |
WO2010036062A2 (en) * | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
EP2169666B1 (en) * | 2008-09-25 | 2015-07-15 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
WO2010036060A2 (en) * | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
US8620008B2 (en) | 2009-01-20 | 2013-12-31 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
US20100324915A1 (en) * | 2009-06-23 | 2010-12-23 | Electronic And Telecommunications Research Institute | Encoding and decoding apparatuses for high quality multi-channel audio codec |
KR101211098B1 (ko) | 2011-04-25 | 2012-12-11 | (주)엔써즈 | 클라이언트 단말기측으로 네트워크를 통해 방송에 포함된 광고와 연관된 정보를 제공하는 시스템 및 방법 |
KR101310943B1 (ko) | 2011-09-26 | 2013-09-23 | (주)엔써즈 | 방송 콘텐츠와 연관된 콘텐츠 연관 정보를 제공하는 시스템 및 방법 |
KR101404596B1 (ko) | 2012-05-03 | 2014-06-11 | (주)엔써즈 | 이미지에 기반하여 동영상 서비스를 제공하는 시스템 및 방법 |
US8886635B2 (en) | 2012-05-23 | 2014-11-11 | Enswers Co., Ltd. | Apparatus and method for recognizing content using audio signal |
KR101315970B1 (ko) | 2012-05-23 | 2013-10-08 | (주)엔써즈 | 오디오 신호를 이용한 콘텐츠 인식 장치 및 방법 |
KR101369475B1 (ko) | 2013-01-23 | 2014-03-06 | (주)엔써즈 | 방송 시청률 조사 시스템 및 방법 |
KR101456926B1 (ko) | 2013-06-14 | 2014-10-31 | (주)엔써즈 | 핑거프린트에 기반한 광고 검출 시스템 및 방법 |
US11451919B2 (en) | 2021-02-19 | 2022-09-20 | Boomcloud 360, Inc. | All-pass network system for colorless decorrelation with constraints |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7711552B2 (en) | 2006-01-27 | 2010-05-04 | Dolby International Ab | Efficient filtering with a complex modulated filterbank |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002007481A2 (en) * | 2000-07-19 | 2002-01-24 | Koninklijke Philips Electronics N.V. | Multi-channel stereo converter for deriving a stereo surround and/or audio centre signal |
US7644003B2 (en) * | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7006636B2 (en) * | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
CN100539742C (zh) * | 2002-07-12 | 2009-09-09 | 皇家飞利浦电子股份有限公司 | 多声道音频信号编解码方法和装置 |
US7305097B2 (en) * | 2003-02-14 | 2007-12-04 | Bose Corporation | Controlling fading and surround signal level |
US7447317B2 (en) * | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
US7394903B2 (en) | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US7805313B2 (en) | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
SE0400998D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
US20050271214A1 (en) * | 2004-06-04 | 2005-12-08 | Kim Sun-Min | Apparatus and method of reproducing wide stereo sound |
KR100677119B1 (ko) * | 2004-06-04 | 2007-02-02 | 삼성전자주식회사 | 와이드 스테레오 재생 방법 및 그 장치 |
US7727374B2 (en) | 2004-09-23 | 2010-06-01 | Skyonic Corporation | Removing carbon dioxide from waste streams through co-generation of carbonate and/or bicarbonate minerals |
US7720230B2 (en) * | 2004-10-20 | 2010-05-18 | Agere Systems, Inc. | Individual channel shaping for BCC schemes and the like |
US20060093164A1 (en) | 2004-10-28 | 2006-05-04 | Neural Audio, Inc. | Audio spatial environment engine |
US7903824B2 (en) | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
EP1829424B1 (en) * | 2005-04-15 | 2009-01-21 | Dolby Sweden AB | Temporal envelope shaping of decorrelated signals |
US7961890B2 (en) * | 2005-04-15 | 2011-06-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Multi-channel hierarchical audio coding with compact side information |
US8917874B2 (en) * | 2005-05-26 | 2014-12-23 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
KR100773562B1 (ko) | 2006-03-06 | 2007-11-07 | 삼성전자주식회사 | 스테레오 신호 생성 방법 및 장치 |
-
2006
- 2006-11-10 KR KR1020060111240A patent/KR100773562B1/ko active IP Right Grant
-
2007
- 2007-02-20 US US11/707,989 patent/US9087511B2/en active Active
- 2007-03-05 EP EP07715471.4A patent/EP1991985B1/en active Active
- 2007-03-05 WO PCT/KR2007/001067 patent/WO2007102675A1/en active Application Filing
- 2007-07-04 KR KR1020070067133A patent/KR101044948B1/ko active IP Right Grant
-
2011
- 2011-05-09 KR KR1020110043581A patent/KR101058047B1/ko active IP Right Grant
-
2015
- 2015-07-08 US US14/794,517 patent/US9848180B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7711552B2 (en) | 2006-01-27 | 2010-05-04 | Dolby International Ab | Efficient filtering with a complex modulated filterbank |
Non-Patent Citations (1)
Title |
---|
IEEE Transaction on Multimedia, vol.1 no.3, pp.237-250 (1999.09) |
Also Published As
Publication number | Publication date |
---|---|
EP1991985B1 (en) | 2018-06-20 |
KR20070091587A (ko) | 2007-09-11 |
US20150312548A1 (en) | 2015-10-29 |
US20070223709A1 (en) | 2007-09-27 |
KR100773562B1 (ko) | 2007-11-07 |
WO2007102675A1 (en) | 2007-09-13 |
KR20110068957A (ko) | 2011-06-22 |
EP1991985A1 (en) | 2008-11-19 |
KR101044948B1 (ko) | 2011-06-28 |
US9087511B2 (en) | 2015-07-21 |
EP1991985A4 (en) | 2011-12-28 |
US9848180B2 (en) | 2017-12-19 |
KR20070091518A (ko) | 2007-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101058047B1 (ko) | 스테레오 신호 생성 방법 | |
JP5563647B2 (ja) | マルチチャンネル復号化方法及びマルチチャンネル復号化装置 | |
KR100773560B1 (ko) | 스테레오 신호 생성 방법 및 장치 | |
KR101491890B1 (ko) | 다운믹스 신호 및 공간 파라메트릭 정보로부터 다이렉트/앰비언스 신호를 추출하기 위한 장치 및 방법 | |
KR100888474B1 (ko) | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 | |
EP2509071B1 (en) | Method, medium and apparatus with scalable decoding | |
KR101756838B1 (ko) | 다채널 오디오 신호를 다운 믹스하는 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20140730 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20150730 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20160728 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20170728 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20190730 Year of fee payment: 9 |