KR100908081B1 - 인코딩 및 디코딩된 다채널 신호를 생성하는 장치 및 방법 - Google Patents

인코딩 및 디코딩된 다채널 신호를 생성하는 장치 및 방법 Download PDF

Info

Publication number
KR100908081B1
KR100908081B1 KR1020077005025A KR20077005025A KR100908081B1 KR 100908081 B1 KR100908081 B1 KR 100908081B1 KR 1020077005025 A KR1020077005025 A KR 1020077005025A KR 20077005025 A KR20077005025 A KR 20077005025A KR 100908081 B1 KR100908081 B1 KR 100908081B1
Authority
KR
South Korea
Prior art keywords
parameter set
parameter
data stream
information
channel
Prior art date
Application number
KR1020077005025A
Other languages
English (en)
Other versions
KR20070051875A (ko
Inventor
쥐르겐 헤르
랄프 스페르슈나이더
요한니스 힐퍼트
카르스튼 린즈메어어
하랄드 팝
Original Assignee
프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. filed Critical 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우.
Publication of KR20070051875A publication Critical patent/KR20070051875A/ko
Application granted granted Critical
Publication of KR100908081B1 publication Critical patent/KR100908081B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Abstract

적어도 하나 이상의 전송 채널을 사용하여 다채널 출력 신호를 복원하기 위해 다수의 다른 파라미터 세트를 생성하는 다채널 인코더에서, 데이터 스트림(26)은 2개의 파라미터 세트가 서로에 관계없이 디코딩할 수 있도록 기록(25)된다. 그러므로, 다채널 디코더는 데이터 스트림에서 판독할 때, 더 높은 버전 번호 및/또는 선택적으로 표기된 파라미터 세트들을 스킵하면서도, 충분히 낮은 버전 번호를 갖는 데이터 세트 또는 필수적으로 표기된 데이터 세트를 사용하여 유효한 다채널 복원을 수행할 수 있다. 이는 역방향 호환성 및 신뢰성으로 특성이 기술되는 미래 업데이트에 적합한 적응성 있는 인코더/디코더 개념을 얻는다.
BCC 인코딩, 디코딩, ICLD, ICTD, ICC, 파라미터 세트, 데이터 스트림

Description

인코딩 및 디코딩된 다채널 신호를 생성하는 장치 및 방법{Generation of a MultiChannel Encoded Signal and Decoding of a MultiChannel Encoded Signal}
본 발명은 파라미터 오디오 다채널 처리 기술에 관한 것으로서, 특히 복원을 위한 몇몇 상이한 파라미터 세트가 존재할 때, 파라미터 부가정보의 능률적인 배열법에 관한 것이다.
2개의 스테레오 채널 외에, 권장하는 다채널 서라운드 표현은 센터 채널 C 및 2개의 서라운드 채널, 즉 좌측 서라운드 채널 Ls 및 우측 서라운드 채널 Rs를 포함하며, LFE(Low Frequency Enhancement) 채널로 불리는 서브우퍼(subwoofer)는 적용가능할 때 추가된다. 이러한 참조 사운드 형식은 3/2(LFE 포함) 스테레오로 일컬어지며, 최근에는 3개의 전방 채널, 2개의 서라운드 채널, 그리고 1개의 LFE 채널로 구성된 5.1 다채널로 일컬어진다. 일반적으로, 권장하는 다채널 서라운드 표현을 위해서는 5개 또는 6개의 전송 채널을 필요로 한다. 재생 환경에 있어서, 정확하게 배치된 5개의 라우드스피커(loudspeaker)로부터 스위트 스팟(sweet spot)으로 불리는 일정 거리에서 최적의 음질을 얻기 위해서는 각각 상이한 5개의 장소에 배치된 라우드스피커가 요구된다. 하지만 그 배치에 있어서, 서브우퍼는 비교적 자유롭게 사용될 수 있다.
다채널 오디오 신호를 전송하는데 요구되는 데이터 량을 감소시키기 위한 기술은 여러 가지가 있다. 이러한 기술은 통합 스테레오(joint stereo) 기술로도 부른다. 이에 대한 목적은, 도 5에 참조 되어 있다. 도 5에는 통합 스테레오 장치(60)가 도시되어 있다. 본 장치는, 예컨대 IS 기술(intensity stereo technique) 또는 BCC(binaural cue coding)를 구현하는 장치일 수 있다. 이러한 장치는 일반적으로 적어도 2개 이상의 채널(CH1, CH2,...CHn)을 입력 신호로서 수신하며 적어도 하나 이상의 단일 캐리어 채널(다운믹스) 및 파라미터 데이터(예: 하나 이상의 파라미터 세트)를 출력한다. 파라미터 데이터는 각각의 원본 채널(CH1, CH2,...CHn)의 근사치가 디코더에서 계산될 수 있도록 정의된다.
보통, 캐리어 채널은 부대역 샘플, 스펙트럼 계수(spectral coefficients), 또는 시간영역 샘플 등을 포함하게 되며, 이들은 기본 신호의 비교적 정교한 표현을 제공하는 반면에, 파라미터 데이터 및/또는 파라미터 세트는 이러한 샘플 또는 스펙트럼 계수를 포함하지 않는다. 그 대신에, 파라미터 데이터는 곱셈, 시간 천이, 주파수 천이, 등에 의한 가중치 부여와 같은 특정한 복원 알고리즘을 제어하는 제어 파라미터를 포함한다. 따라서, 파라미터 데이터는 결합 채널 또는 신호의 비교적 거친 표현만을 포함한다. 수량적으로 표현하면, 캐리어 채널에 요구되는 데이터 량은 60 내지 70 kbit/s의 범위 내에 있는 반면, 파라미터 부가정보에 요구되는 데이터 량은 채널당 1.5 kbit/s가 된다. 파라미터 데이터에 대한 예로서는, 후술하는 바와 같이, 공지된 스케일 인자(scale factor), 인텐시티 스테레오 정보, 또는 바이노럴 큐(binaural cue) 파라미터가 있다.
인텐시티 스테레오 코딩 기술은 「AES preprint 3799, "Intensity Stereo Coding" J. Herre, K. H. Brandenburg, D. Lederer, February 1994, Amsterdam」에 기재되어 있다. 일반적으로, 인텐시티 스테레오의 개념은 2개의 입체음향(stereophonic) 오디오 채널의 데이터에 적용되는 주축(main axis) 변환에 기초한다. 데이터 포인트의 대부분이 제1 주축 주위에 집중되어 있다면, 코딩에 앞서 특정 각도만큼 양측 신호들을 회전시킴으로써 코딩 이득이 얻어질 수 있다. 그러나 이는 실제 입체음향 재생 기술에 있어서 항상 적용되지는 않는다. 좌우 측 채널에 대한 복원된 신호들은 동일한 전송 신호에 대하여 상이하게 가중치가 부여되거나 스케일된 버전으로 구성된다. 한편, 복원된 신호는 진폭에 있어서 상이하지만, 그 위상(phase) 정보는 동일하다. 그러나 양측 원본 오디오 채널의 에너지-시간 포락선은 통상 주파수-선택적 수단으로 동작하는 선택적 스케일 동작에 의해 보존된다. 이는 고주파수에서 인간의 소리 인지력과 일치하여, 에너지 포락선에 의해 주된 공간 큐(dominant spatial cues)가 결정된다.
또한, 실제적인 구현 예에 있어서, 전송 신호, 즉 캐리어 채널이 좌우 측 채널의 양측 성분을 회전시키는 대신, 그 합계 신호에 의해 형성된다. 더욱이, 이러한 처리, 즉 스케일 동작을 수행하기 위한 인텐시티 스테레오 파라미터의 생성은 주파수-선택적으로, 즉, 각 스케일 인자 대역과는 무관하게, 즉, 인코더 주파수 분할과는 무관하게 수행된다. 바람직하게는, 양측 채널은 결합 또는 "캐리어" 채널을 형성하기 위해 결합된다. 결합된 채널에 대하여, 제1 채널의 에너지, 제2 채널의 에너지, 그리고 결합된 또는 통합된 채널의 에너지에 의존하는 인텐시티 스테레오 정보가 결정된다.
BCC 기술은 「AES convention paper 5574 entitled "Binaural Cue Coding Applied to Stereo and Multi-Channel Audio Compression", C. Faller, F. Baumgarte, May 2002, Muenhen」에 기재되어 있다. BCC 코딩에 있어서, 다수의 오디오 입력 신호는 중복 윈도를 갖는 DFT 기반의 변환을 사용하여 스펙트럼 표현으로 변환된다. 그 결과의 스펙트럼은 비중복적인 구획들로 분할된다. 각 구획은 등가 직각 대역폭(ERB: Equivalent Right-angled Bandwidth)에 비례하는 대역폭을 갖는다. 소위 채널간 레벨차(ICLD) 및 소위 채널간 시간차(ICTD)는 각각의 구획을 위해, 즉 각각의 대역 및 각각의 프레임(k: 한 블록의 시간 샘플)을 위해 계산된다. 채널간 레벨차(ICLD) 및 채널간 시간차(ICTD) 파라미터는 BCC 비트 스트림을 얻기 위해 양자화되고 코딩된다. 채널간 레벨차(ICLD) 및 채널간 시간차(ICTD)는 기준 채널에 관계되는 각 채널에 주어진다. 특히, 파라미터는 처리 예정인 신호의 특정한 구획에 의존하는 미리 정해진 공식에 따라 계산된다.
디코더 측에서, 디코더는 모노 신호 및 BCC 비트 스트림, 즉 채널간 시간차(ICTD)를 위한 제1 파라미터 세트 및 채널간 레벨차(ICLD)를 위한 제2 파라미터 세트를 수신한다. 모노 신호는 주파수 영역으로 변환되어, 디코딩된 채널간 레벨차(ICLD) 및 채널간 시간차(ICTD) 값들을 수신한 합성 블록(synthesis block)에 입력된다. 합성 블록 또는 복원 블록에서는, BCC 파라미터(ICLD 및 ICTD)는 다채널 신호를 복원하기 위해 모노 신호의 가중치부여 동작을 수행하는데 사용되고, 주파수/시간 변환 후, 원본 다채널 오디오 신호의 복원을 표현한다.
BCC의 경우, 통합 스테레오 모듈(60)은 파라미터 채널 데이터가 채널간 레벨차(ICLD) 및 채널간 시간차(ICTD) 파라미터들로 양자화 및 코딩 되도록 채널 부가정보를 출력하고, 여기서 원본 채널들 중 하나가 채널 부가정보를 코딩하기 위한 기준 채널로 사용될 수 있다. 보통, 캐리어 채널은 속하는 원본 채널들의 합으로 형성된다.
당연히, 상기한 기술은 디코더를 위한 모노 표현만을 제공할 뿐이며, 이는 캐리어 채널만을 디코딩할 수 있을 뿐, 하나 이상의 입력 채널의 하나 이상의 근사치를 생성하기 위한 파라미터 데이터의 생성은 할 수 없다.
BCC 기술로 알려진 오디오 코딩 기술은 미국 특허 출원 US2003/0219130 A1, 2003/0026441 A1, 그리고 2003/0035553 A1에 더 설명되어 있다. 또한, 「"Binaural Cue Coding. Part II: Schemes and Applications", C. Faller and F. Baumgarte, IEEE: Transactions on Audio and Speech Proc., Vol. 11, No. 6, November 1993」를 더 참조할 수 있다. 추가로, 「C. Faller and F. Baumgarte "Binaural Cue Coding Applied to Stereo and Multi-Channel Audio Compression", Preprint, 112th Convention of the Audio Engineering Society (AES), May 2002, and J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, C. Spenger "MP3 Surround: Efficient and Compatible Coding of Multi-Channel Audio", 116th AES Convention, Berlin, 2004, Preprint 6049」 또한 참조할 수 있다.
이하, 도 6 내지 도 8을 참조하여 다채널 오디오 코딩을 위한 통상적인 BCC 구조를 더욱 상세히 설명한다. 도 6은 다채널 오디오 신호의 코딩/전송을 위한 통 상적인 BCC 코딩 구조를 표현한다. 다채널 오디오 입력 신호는 BCC 인코더(112)의 입력(110)에 입력되고 소위 다운믹스 블록(114)에서 "믹스다운(mixed down)", 즉 단일 합계 채널(single sum channel)로 변환된다. 본 예에 있어서, 입력(11)에서의 신호는 좌측 전방 채널, 우측 전방 채널, 좌측 서라운드 채널, 우측 서라운드 채널, 및 센터 채널을 포함하는 5-채널 서라운드 신호이다. 일반적으로, 다운믹스 블록은 이러한 5개 채널을 모노 신호에 단순히 가산함으로써 합계 신호를 생성한다. 어떠한 경우에도 원본 입력 채널의 수보다 적은, 다수의 다운믹스 채널 또는 단일 채널을 포함한 다운믹스 신호는 다채널 입력 신호를 사용하는 당 업계에 알려진 생성을 초래하는 기타 다운믹스 신호이다. 본 예에 있어서, 만약 4개의 캐리어 채널이 5개의 입력 채널에서 생성되었다면, 다운믹스 동작은 이미 성취되었을 것이다. 단일 출력 채널 및/또는 출력 채널의 수는 합계 신호 라인(115)에서 출력한다.
BCC 분석 블록(116)에 의해 얻은 부가정보는 부가정보 라인(117)에서 출력된다. BCC 분석 블록에서, ICLD를 위한 파라미터 세트, ICTD 또는 채널간 상관(ICC: inter-channel correlation)치가 계산될 수 있다. 그러므로, BCC 합성 블록(122)에서 복원을 위해 최대 3개의 다른 파라미터 세트(ICLD, ICTD, 및 ICC)가 존재한다.
파라미터 세트를 포함하는 합계 신호 및 부가정보는 통상 양자화 및 코딩된 형태로 BCC 디코더(120)에 전송된다. BCC 디코더는 전송된 합계 신호를 다수의 부대역으로 분해하고, 스케일링, 지연(delay) 등의 동작을 수행하고 복원될 몇몇 채널의 부대역 생성을 수행한다. 이러한 처리는 출력(121)에서 복원된 다채널 신호의 ICLD, ICTD, 및 ICC 파라미터(큐)가 BCC 인코더(112)로의 입력(110)에서 원본 다채 널 신호에 대한 각각의 큐들과 유사하게 되도록 수행된다. 이를 위해, BCC 디코더(12)는 BCC 합성 블록(122)과 부가정보 처리 블록(123)을 포함한다.
이하 내용은 BCC 합성 블록(122)의 내부 구성을 도 7의 참조하에 설명한다. 라인(115)의 합계 신호는 일반적으로 필터 뱅크(FB:125)로 표현하는 시간/주파수 변환 블록에 입력된다. 블록(125)의 출력에서 N개의 부대역 신호가 존재하며, 만약 오디오 필터 뱅크(125)가 N개의 시간 영역 샘플로부터 N개의 스펙트럼 계수를 생성하는 변환을 수행하면, 심한 경우, 스펙트럼 계수의 블록이 존재한다.
BCC 합성 블록(122)은 딜레이 단계(126), 레벨 변경단계(127), 상관 처리단계(128) 및 역 필터 뱅크를 표현하는 단계(IFB: inverse filter bank, 129)를 더 포함한다. 단계(129)의 출력에서, 5-채널 서라운드 시스템에서의 5개 채널을 예로 드는 복원된 다채널 오디오 신호는, 도 6에 도시된 바와 같이, 일련의 스피커(124)에 출력될 수 있다.
도 7은 입력 신호(s(n))가 요소(125)의 수단에 의해 주파수 영역 또는 필터 뱅크 영역으로 변환되는 것을 도시한다. 필터 뱅크(element, 125)에 의해 출력된 신호는, 노드(130)에서 나타낸 바와 같이, 동일한 신호의 몇몇 버전을 얻도록 배가된다. 원본 신호의 버전 수는 복원될 출력 신호에서의 출력 채널 수와 동일하다. 만약 원본 신호의 각각의 버전이 노드(130)에서 특정의 딜레이(delay, d1, d2, ...di,...dN)를 거치게 되면, 다른 딜레이(지연)를 가진 동일 신호 버전을 블록(126)에서 출력하게 된다. 딜레이 파라미터는 도 6에 도시된 바와 같이 부가 정 보 처리 블록(123)에 의해 계산되고, BCC 분석 블록(116)에 의해 결정된 바와 같이 채널간 시간차(ICTD)로부터 유도된다.
BCC 분석 블록(116)에 의해 결정된 채널간 레벨차(ICLD)를 기초로 하여 부가 정보 처리 블록(123)에서 승산 파라미터(a1, a2 ... ai, aN)들에 대하여도 동일하게 적용된다.
BCC 분석 블록(116)에 의해 결정된 ICC 파라미터는 결정된 상관치가 블록(128)의 기능을 제어하기 위하여 사용되어 블록(128)의 출력에서 딜레이 되고 레벨-변경된 신호가 얻어지도록 한다. 여기서, 딜레이 단계(126), 레벨 변경단계(127), 및 간섭성 처리단계(128) 사이의 순서는 도 7에 도시된 경우와는 다를 수 있다.
여기서 오디오 신호의 블록별 처리에는, BCC 분석 또한 블록별로 수행한다는 것을 알아야 한다. 추가로, BCC 분석은 주파수별(frequency-wise), 즉 주파수-선택적으로도 수행된다. 이는, 각각의 스펙트럼 대역마다 ICLD 파라미터, ICTD 파라미터, 및 ICC 파라미터가 존재한다는 것이다. 적어도 하나 이상의 채널을 위한 ICTD 파라미터는 모든 대역을 통과하므로, ICTD 파라미터 세트를 표현한다. 이는, 적어도 하나 이상의 출력 채널 복원에 대한 모든 주파수 대역을 위한 모든 ICLD 파라미터 세트를 표현하는 ICLD 파라미터 세트에도 동일하게 적용된다. 이는 합계 채널 또는 입력 채널을 기초로, 적어도 하나 이상의 출력 채널 복원에 대한 다양한 대역을 위한 몇몇의 개별적인 ICC 파라미터를 포함한 ICC 파라미터 세트에서도 동일하 게 적용된다.
이하, BCC 파라미터의 결정(determination)을 볼 수 있는 상황(situation)이 도 8에 도시되어 있다. 일반적으로, ICLD, ICTD 및 ICC 파라미터는 채널 쌍 사이에서 정의될 수 있다. 하지만, 전형적으로, ICLD 및 ICTD 파라미터의 결정은 각각의 입력 채널마다 뚜렷한 파라미터 세트가 존재하도록, 각각의 다른 입력 채널과 기준 채널 사이에서 수행된다. 이는 도 8B에 도시되어 있다.
그렇지만, ICC 파라미터는 상이하게 정의될 수 있다. 일반적으로, ICC 파라미터는 도 8B에서 개략적으로 도시되었듯이, 어느 채널 쌍 사이에서도 인코더에서 생성될 수 있다. 이러한 경우, 디코더는 어느 채널 쌍간의 원본 신호에서 존재하는 것과 대략 동일한 결과를 얻을 수 있도록 ICC 합성을 수행한다. 그러나 매번, 즉 각각의 시간범위마다, 가장 강한 2개의 채널 사이에 있는 ICC 파라미터만 계산하는 것이 제안되었다. 이러한 구성은 도 8C에 도시되어 있는데, 여기 한 시점에서 채널 1과 채널 2 사이에서 ICC 파라미터가 계산 및 전송되고, 또 다른 시점에서 채널 1과 채널 5 사이에서 ICC 파라미터가 계산되는 것이 예로 도시되어 있다. 디코더는 그 후 디코더 내의 가장 강한 2개의 채널 사이에 있는 채널간 상관(correlation)을 합성하고, 잔여 채널 쌍의 채널간 간섭성(inter-channel coherence)을 합성하기 위하여 좀더 전형적으로 휴리스틱 법칙(heuristic rule)을 실행한다.
예컨대, 전송된 ICLD 파라미터들에 기초한 승산 파라미터(a1,...aN)들의 계산에 관하여는, 인용된 「AES convention paper 5574」를 참조하기 바란다. ICLD파 라미터는 원본 다채널 신호 내의 에너지 분포를 표현한다. 보편성에 지장을 주지않고서, 도 8A는 다른 모든 채널과 좌측 전방 채널 사이의 에너지 차를 표현하는 4개의 ICLD 파라미터들을 표현한다. 부가정보 처리 블록(123)에 있어서, 모든 복원된 출력 채널의 총 에너지가 전송된 합계 신호의 에너지와 같거나 적어도 이 에너지에 비례하도록 ICLD 파라미터로부터 승산 파라미터(a1,...aN)가 유도된다. 이러한 파라미터를 결정하기 위한 한가지 방법은 제1 단계에서 전방 좌측 채널에 대한 승산 인자가 1로 설정되는 반면, 도 8C의 다른 채널에 대한 승산 인자는 전송된 ICLD 값에 설정되는 2가지 단계의 처리이다. 다음, 제2 단계에서, 5개 채널 모두의 에너지가 계산되고, 전송된 합계 신호의 에너지와 대조된다. 그 후, 모든 채널은 모든 채널에 대하여 주로 스케일 인자를 사용하여 다운스케일(downscale)되며, 여기서 스케일 인자는 모든 복원 출력 채널의 총 에너지가 스케일된 후에는 전송된 합계 신호 총 에너지와 같도록 선택된다.
BCC 인코더에서 BCC 디코더로 전송된 파라미터 세트로서의 채널간 간섭성 척도(measure) ICC에 관하여, 모든 부대역의 가중치 인자는 20log10-6 내지 20log106 범위의 난수로 곱셈하는 등, 간섭성 조작은 승산 인자의 변형으로 인해 실행될 수 있다. 모든 임계 대역에 대한 변화(분산)가 대략 동일하고 각각의 임계 대역 안에 평균치가 0이 되게끔 전형적으로 의사 난수 시퀀스(pseudo random sequence)는 선택된다. 동일한 시퀀스는 각각 다른 구성 또는 블록의 스펙트럼 계수를 위해 사용된다. 그러므로, 오디오 상황의 폭은 의사 난수 시퀀스의 분산 변형에 의해 제어된 다. 더 큰 분산은 더 큰 청각 폭을 생성한다. 임계 대역을 갖는 개개의 대역에서 분산 변형은 수행될 수 있다. 이는 오디오 상황에서 다수의 목적물이 동시에 존재할 수 있도록 하며, 여기에서 각각의 목적물은 다른 청각 폭을 갖는다. 적합한 진폭 분포는 미국 특허 출원 제2003/0219130 A1에서 표현한 바와 같이, 로그 스케일 상에서 균일한 분포이다.
호환적 방법으로, 즉 보통의 스테레오 디코더에 대하여 이해가능한 비트 스트림 포맷으로 5개의 채널을 전송하기 위하여, 「"MUSICAM surround: a universal multi-channel coding system compatible with ISO/IEC 11172-3", G. Theile and G. Stoll, AES preprint, October 1992, San Francisco」에 설명한 바와 같이 소위 행렬 기법이 사용되었다.
원본 입력 채널로부터 다운믹스 채널을 얻기 위해 호환 행렬이 사용된 다채널 코딩 기술은 공보 「"Improved MPEG 2 Audio multi-channel encoding", B. Grill, J. Herre, K. H. Brandenburg, I. Eberlein, J. Koller, J. Miller, AES Preprint 3865, February 1994, Amsterdam」에 한층 더 설명되어 있다.
간략하면, 전문 공보 「"Low-Complexity Parametric Stereo Coding", E. Schuijers, J. Breebart, H. Purnhagen, J. Engdegard, 119th AES Convention, Preprint 6073, Berlin, 2004」에 기재되 있듯이, BCC 기술은 효율적이며 다채널 오디오 구성의 역호환 코딩 또한 가능하게 한다. MPEG-4 기준 및 특히 파라미터 오디오 기술로의 확장은 ISO/IEC 14496-3: 2001/FDAM 2(파라미터 오디오)에 설명되어 있다. 이에 관하여, 특히 「"Syntax of the ps.data()"」에 기재되어 있는 MPEG-4 기준의 테이블 8.9 신택스도 언급되어야 한다. 이 예에서, 채널간 시간차(ICTD)에 일치하는 위상 및 ICC 파라미터의 전송을 키고 끄는데 사용되는 신택스 요소 "enable_icc" 및 "enable_ipdopd"를 언급해야겠다. 신택스 요소 "icc_data()" "ipd_data()" 및 "opd_data()"에 대해 좀 더 언급되어야 한다.
간략하면, 일반적으로 파라미터 다채널 기술은 1개 또는 다수의 전송 캐리어 채널을 채용하는데 사용되며, 여기에서 M 개의 전송 채널은 N 개의 원본 채널로부터 N 개의 출력 채널 또는 다수의 K 개의 출력 채널을 복원하기 위해 형성되고, 이때 K는 N 개의 원본 채널 수 이하이다.
앞서 설명한 모든 기술의 문제는 BCC 디코더를 위한, 그리고 파라미터 부가정보의 다른 버전을 위한 디코더의 예처럼, 다채널 디코딩을 위한 여러 가지 유형의 디코더 사이에서 포맷 호환이 이루어질 수 있는지 하는 점이다. 특히, 시장에 서로 다른 다채널 디코더가 존재하고, 같은 시기에 다른 디코더에 의해 생성된 다른 파라미터 세트를 포함한 부가정보가 시장에 존재할 때, 1개의 디코더만을 소유한 사용자에게는 문제가 생긴다.
첫 번째 문제는, 디코딩에서 최적한 다채널 음질을 제공하는 높은 계산 용량을 지닌 디코더는 갖고 싶을 것이다. 그러나 같은 시기에 휴대전화와 같은 휴대용 기기의 디코더처럼, 제한적인 상태에서 작동하는 디코더도 있을 것이다. 당연히 그러한 디코더는 최대한 좋은 음질을 가진 다채널 출력을 제공해야 하지만, 제한적인 계산능력밖에 없을 것이다. 이것은, 최적의 음질을 제공하는 아주 복잡한 디코딩 및 저하된 음질에 준하는 덜 복잡한 디코딩의 예와 같은, 그 정도의 확장성을 지원 하는 공간(spatial) 복원의 파라미터 세트를 지닌 비트 스트림 포맷이 존재할 수 있는지가 의문이다.
다음으로 BCC 비트 스트림 및 BCC 인코더의 새로운 세대/버전을 소개할 때 고려해야할 또 다른 문제는 다른 버전의 BCC 비트 스트림과 BCC 디코더 간에 호환성이 유지될 수 있는가 이다. 다른 말로는, 새로운 BCC 파라미터 세트와 업데이트된 구 파라미터 세트가 역방향 호환되는 것을 원할 수 있다. 그러므로, BCC 사용자들에게 기술의 발전으로 인해 새로 향상된 다채널 구성을 허용할 수 있게 향상된 방법을 제공하고 싶은 것은 당연한 것이다. 다른 한편으론, 새로운 BCC 비트 스트림 포맷은 통상 비트 스트림과 다양한(구버전) BCC 디코더 버전끼리의 호환성을 제공하지 못한다.
특히, 다채널 인코더/디코더는 최대의 계산 용량을 지니지 못한 여러 가지의 애플리케이션에서 사용될 것이지만, 항상 최대의 음질을 요구하지 않는다는 것을 명심해야 한다.
본 발명의 목적은, 새로운 파라미터 세트와의 융합 또는 구 파라미터 세트의 업데이트를 허용하는 융통성 있고 효율적인 구상, 그리고 동시에 다양한 여러 가지의 애플리케이션에서 사용할 수 있는 융통성 있고 효율적인 구상을 제공하는 것이다.
이 목적은 제1항에 의한 코딩된 다채널 신호를 생성하는 장치, 제15항에 의한 코딩된 다채널 신호를 디코딩하는 장치, 제21항에 의한 코딩된 다채널 신호를 생성하는 방법, 제22항에 의한 코딩된 다채널 신호를 디코딩하는 방법, 또는 제23항에 의한 컴퓨터 프로그램에 의해 달성될 수 있다.
본 발명에서, 적어도 하나 이상의 전송채널 또는 캐리어 채널에 더하여 적어도 2개의 다른 파라미터 세트를 포함하는, 코딩된 다채널 신호가 데이터 스트림으로서 기록될 때, 효율적이고 역방향 호환되는 코딩된 다채널 신호의 디코딩이 성취된다는 발견에 기초한다. 여기서, 출력 채널의 복원이 적어도 2개 이하의 파라미터 세트들로 수행되게끔 2개의 파라미터 세트가 데이터 스트림으로 기록된다. 본 발명에 의하면, 데이터 스트림은 어떤 파라미터 세트가 복원을 위해 선택적으로 필요한지, 그리고 어떤 파라미터 세트가 복원을 위해 필수인지를 디코더가 식별할 수 있도록 기록된다. 이러한 경우, 디코더는 오직 복원에 절대 필요한(예: 의무적인) 파라미터 세트만 사용할 수 있고, 만약 외부 상황이 요구한다면 선택적인 파라미터 세트는 간단히 무시할 수 있다. 이는, 오직 필수 파라미터 세트만 사용할 때, 디코더는 빠르고 제한적인 계산 용량으로 관리하지만, 다른 디코더는 더 많은 시간 및/또는 더 많은 계산 용량 및/또는, 일반적으로 말하는, 더 많은 디코더 자원을 요구하여 코딩된 다채널 신호를 표현하는 동일한 데이터 스트림을 기초로 높은 품질의 코딩된 다채널 신호 복원을 수행할 수 있다.
본 발명의 바람직한 예에서, 필수 파라미터 세트는 채널간 레벨차(ICLD)를 포함하고 있다. 본 발명에 따르면, 이런 채널간 레벨차(ICLD)는 복원 상황의 모든 유형에 대한 출력 채널간의 기본 다채널 사운드 분배를 정의하는데 절대적으로 중요하다. 채널간 시간차(ICTD)는 선택적 파라미터 세트로 구분될 수 있다. 비교적 "드라이"한 음향 상태(예: 작은 에코가 울리는)에서 다채널 오디오 표현이 이루어지거나, 또는 헤드폰을 이용해 실현될 때, 즉 1개의 전송 채널로부터 2개의 출력 채널이 생길 때 주로 적절하기 때문에, 채널간 시간차(ICTD)는 이미 선택적 파라미터 세트로 분류될 수 있다.
채널간 상관치는 사운드 소스의 폭을 제공하는데 중요하고, 청취자에게 복잡한 사운드 소스, 예를 들어 많은 비간섭성 사운드 구성을 포함한 클래식 오케스트라와 같은 시나리오 속에 있는 것 같은 느낌을 생성하는데 중요하다. ICC 파라미터 세트는 선택적 파라미터 세트로 구분될 수 있는데, 이는 명백히 품질에 상당한 영향력이 있지만, 필수 파라미터인 채널간 레벨차(ICLD)처럼 그렇게 중요하지 아니하고, 채널간 레벨차(ICLD)의 필수 파라미터 세트는 예를 들면, 비교적 효율적인 계산적 노력이 필요한, 오직 가중 동작만이 채널간 레벨차와 다르기 때문이다.
데이터 스트림에서의 파라미터 세트를 포함한 코딩된 다채널 신호의 역방향 호환성 문제에 관해서, 예로서 높은 버전 번호를 가진 파라미터 세트는, 상기 파라미터 세트 없이도 디코더에 의한 복원이 실행될 수 있게 데이터 스트림안에 기록되며, 제2 파라미터 세트는 실행할 수 없다고 판단될 때, 복원을 위한 제1 파라미터 세트만을 사용하고, 제2 파라미터 세트는 스킵하는 결과를 낳는다.
디코더 측에서, 디코더는 파라미터 세트가 필수 파라미터 세트라고 식별할 때, 상기 파라미터 세트를 완벽히 판독하고 실행해야하지만, 복원을 위한 필수 파라미터 세트가 아닌 것, 즉 선택적이라고 표시된 것을 만나면, 파라미터 세트에 속하는 비트 스트림의 비트를 스킵할 것이다. 그러므로, 디코더는 코딩된 다채널 신호를 다루기 위해서, 제2 파라미터 세트의 신택스에 관한 어떤 지식도 가질 필요 없으며, 그저 스킵하고 복원이 아직 필요한 코딩된 다채널 신호의 다음 영역에서 수행하면 된다.
바람직하게, 길이정보는 선택적이라고 표시된, 파라미터 세트를 위한 데이터 스트림속에 추가되는데, 이는 디코더가 상기 파라미터 세트와 결합된 비트를 빠르고 효과적인 방법으로 스킵하도록 하고, 디코딩을 위하여 필수라고 표시된 파라미터 세트만을 취할 수 있게 한다. 역방향 호환성에 대하여, 파라미터 세트가 어떤 인코더 버전에 의해 생성되었는지를 알려주는 버전 번호를 적어도 각각의 선택적 파라미터 세트와 결합시키는 것이 좋다. 예를 들어, 제일 낮은 버전의 채널간 레벨차(ICLD)를 위한 파라미터 세트는 데이터 스트림에 필수 요소로서 표시되는 동안, 더 최근 인코더 버전의 채널간 레벨차(ICLD)를 위한 파라미터 세트는 또 다른 버전 번호를 얻게 되며, 그것으로 인해 디코더가 더 높은 버전 번호의 파라미터 세트를 처리하지 못한다는 것인 때에는, 디코더는 더 낮은 버전 번호의 파라미터 세트를 사용할 것이다.
마지막으로, 다채널 신호를 표현하는 데이터 스트림은 굳이 전송 채널을 포함할 필요가 없다는 것이다. 오히려 BCC 파라미터가 상응하는 채널로서 M(1 이상인)개의 전송 채널을 이미 포함한 CD에 기록되는 것처럼, 상기 전송 채널은 개별적으로 생성되고 전송될 수도 있다.
본 발명의 바람직한 예는 첨부된 도면과 함께 이하에 상세히 설명된다.
도 1A는 본 발명의 실시 예에 따른 결정된 데이터 스트림 신택스를 가진 코딩된 다채널 신호의 개요도이다.
도 1B는 본 발명의 실시 예에 따른 도 1A의 제어 블록의 상세한 표현이다.
도 2A는 본 발명의 실시 예에 따른 인코더의 블록 회로도이다.
도 2B는 본 발명의 실시 예에 따른 디코더의 블록 회로도이다.
도 3A 내지 도 3D는 본 발명에 따른 파라미터 세트 구성을 위한 바람직한 실시 예를 보여 준다.
도 4A 내지 4c는 본 발명에 따른 파라미터 세트 데이터의 바람직한 실시 예를 보여 준다.
도 5는 다채널 인코더의 일반적인 표현이다.
도 6은 BCC 인코더/BCC 디코더를 개략적으로 도시한 블록도이다.
도 7은 도 6의 BCC 합성 블록의 블록 회로도이다.
도 8a 내지 도 8c는 ICLD, ICTD, 및ICC 파라미터 세트의 계산을 위한 전형적인 시나리오의 표현이다.
도 2A는 적어도 2개 이상의 파라미터 세트를 포함한 파라미터 정보 및 M 개의 전송 채널을 제공하기 위한 수단(22)의 입력(20)으로 제공되는 N 개의 원본 채 널을 포함하는 비부호화된 다채널 신호를 표현하는 코딩된 다채널 신호를 생성하는 장치의 바람직한 실시 예이다. 특히, 수단(22)의 출력(23)에서 출력되는 전송 채널의 수 M은 원본 오디오 채널의 수 N보다 적다. K 개의 출력 채널 복원을 위한 파라미터 정보를 표현하는 개별 파라미터 세트는, 제공 수단(22)의 출력(24a, 24b, 24c)으로 공급된다. M 개의 전송 채널은 데이터 스트림을 기록하기 위해 수단(25)에 제공되며, 여기에서 M은 1 이상이며 N 보단 적다. 수단(25)의 출력은, 출력(24a, 24b, 24c)의 파라미터 세트처럼, 출력(26)에 공급된다.
앞서 설명했듯이, 다운 믹스 정보(M 개의 전송 채널)는 파라미터 정보와는 별도로 전송/저장될 수 있다.
코딩된 다채널 신호를 표현하는 데이터 스트림을 기록하기 위한 수단(25)은 M 개의 전송 채널을 데이터 스트림으로 기록하기 위해, 그리고 제1, 제2, 제3 파라미터 세트를 데이터 스트림에 기록하기 위해 디자인되었으며, 그래서 K 개의 출력 채널의 복원은, 3개 중 1개의 파라미터 세트의 사용 없이, 더 나아가 적어도 3개 중 2개의 파라미터 세트의 사용 없이 이루어질 수 있다. 이러한 경우, 제공 수단(22)의 출력(24a 내지 24c)에서의 파라미터 세트는, 제1 파라미터 세트와 같은 1개의 파라미터 세트가 복원에 절대적으로 필요하게끔 표시되는 동안, 2개의 나머지 파라미터 세트, 즉 제2 파라미터 세트 및 제3 파라미터 세트는 복원하기 위한 선택적 요구사항으로 정의된다.
그 후, 이하 설명처럼, 기록 수단(25)은 데이터 스트림에 제1 파라미터 세트를 필수 파라미터 세트로 기록할 것이며, 제2 및 제3 파라미터 세트들은 데이터 스 트림에 오직 선택적 파라미터 세트로만 기록할 것이다.
도 2A의 출력(26)에서의 데이터 스트림은 도 2B에 도시된 다채널 디코더의 데이터 스트림 입력(27)으로 공급된다. 데이터 스트림의 데이터는 데이터 스트림을 판독하기 위한 수단(28)에 제공되며, 도 2A에 도시된 인코더와 같이, 데이터 스트림을 판독하기 위한 수단(28)은 데이터 스트림으로부터 추출된 M 개의 전송 채널을 위한 로직출력(29) 및 데이터 스트림에 포함된 파라미터 세트를 위한 로직출력(30a, 30b)을 포함한다. 제1 파라미터 세트가 복원을 위해 강제 필수적 또는 절대 필수인 것으로 표시되는 본 발명의 바람직한 예에서, 판독 수단(28)은 로직출력(30a)을 통해서 복원하기 위한 수단(31)에 상기 제1 파라미터 세트를 제공할 것이다. 만약 판독 수단(28)이, 예를 들어, 오직 필수 파라미터 세트를 판독하고 그것을 복원을 위해 수단(31)에 제공하는 고정된 세트라면, 수단(28)은 도 2B에서 도시한 차단된(interrupted) 로직출력(30b)이 상징적으로 표현한, 입력(27)에 위치한 데이터 스트림의 제2 파라미터 세트를 단순히 스킵할 것이다.
수단(31)에 제공되고 데이터 스트림으로부터 추출되는 필수적 파라미터 세트 또는 추가되는 선택적인 파라미터 세트 또한 제어 입력(32)에 의해 수단(28)에 제공될 수 있으며, 여기에서 리소스 유용성 정보 및/또는 제어 정보는 제어 입력(32)에 의해 얻어진다.
예를 들어, 건전지-식(battery-powered) 디코더가 아직 충분한 건전지 량이 남았다고 판단할 때, 데이터 스트림의 판독을 위한 수단(28)은 필수적 파라미터 세트뿐만 아니라, 선택적 파라미터 세트 또한 추출하게끔 지시를 받고, 해당 로직출 력을 통하여 복원하기 위한 수단(31)으로 제공되며, 그러므로 이 수단은 출력(33)에 K 개의 출력 채널을 제공한다는 것에서 리소스 유용성 정보는 구성되어 있을 수 있다. 여기서 K는 도 2A의 입력(20)의 원본 입력채널의 수 N 이하이다. 디코더는 가능한 한 데이터 스트림에 코딩된 모든 출력 채널을 생성하고 싶을 것이기에, 되도록이면 K는 N과 동일하다는 것을 언급한다.
데이터 스트림을 판독하는 데이터 스트림 판독 수단(28)은 데이터 스트림에서 확장성이 사용될 때, 즉 데이터 스트림안에 파라미터 세트가 복원을 위해 사용되지 않을 때, 적어도 제1 파라미터 세트를 판독하고 적어도 1개 이상의 제2 파라미터 세트와 같은 파라미터 세트를 스킵할 수 있게 동작한다. 복원 수단(31)은 제2 파라미터 세트의 사용 없이, 제1 파라미터 세트와 M 개의 전송 채널을 사용하여 K 개의 출력 채널을 복원하도록 동작한다.
본 발명의 한 예에서, 제공 수단(22)은 N 개의 원본 채널을 수신하고, 출력 측에서는, 개개의 파라미터 세트와 M 개의 전송 채널을 제공하는 BCC 인코더이다. 다른 대안으로, 제공 수단(22)은 소위 비트 스트림 트랜스코더(transcoder)가 될 수 있는데, 입력 측에서, 예를 들어 트랜스코더는 도 7의 요소(114 및 116)에 의해 생성되고, 상응하게 기록 수단(25)을 확장가능한 형태로 데이터 스트림안에 파라미터 세트를 재기록하도록 지시하는 비-확장적인 포맷(오직 파라미터 세트만, 또는 전송 채널을 지닌 파라미터 세트만을)안에 이미 기록된 정보를 수신한다.
그러므로, 확장가능한 파라미터 세트를 지닌 데이터 스트림의 실제 기록방식은 다양하게 존재한다. 한 예에서, 파라미터 세트를 위한 데이터의 시작은 고정된 데이터 스트림 래스터에 따라 기록된다. 이러한 경우, 선택적 파라미터 세트와 결합된 길이정보의 전송은 필수가 아니다. 그러나 상기 고정된 래스터는 패딩(padding) 비트에 의한 데이터 스트림의 데이터량을 인위적으로 확대하는 결과를 낳을 수 있다. 그러므로 정보가 얻어지면, 길이정보를 기반으로 시리얼 데이터 스트림 내에 다수의 비트를 스킵하는 예처럼 디코더는 선택적 파라미터 세트를 간단히 스킵할 것이고, 그 후 새로운 정보 및/또는 새로운 파라미터 세트를 위한 데이터가 시작할 때, 데이터 스트림의 알맞은 곳에서 판독 및 해석하도록 길이정보는 각각의 선택적 파라미터 세트와 결합시키는 것을 선호한다.
새로운 파라미터 세트의 시작을 신호하는 또 다른 방법은, 예를 들어 단지 비트 패턴 찾기를 기반으로 한 데이터의 실제 분석 없이 식별가능한 특정 비트 패턴을 지닌 실제 데이터보다 우선 되는 동기화 패턴(synchronization pattern)을 포함하여, 파라미터 세트를 위한 데이터가 시작한 곳과 다음의 동기화 패턴이 끝난 다음 곳을 디코더에 신호한다. 파라미터 세트가 선택적 파라미터 세트로 식별된 경우, 디코더는 선택적 파라미터 세트의 시작과 결합된 동기화 패턴을 찾을 것이고, 그 뒤 다음 동기화 패턴과 마주칠 때까지 분석 없이 동기화 패턴에 이은 비트를 가지고 패턴 찾기를 수행할 것이다. 이윽고, 2개의 동기화 패턴 사이의 비트는 복원을 위해 사용되지 않고 간단히 무시되는 동안 만약 이 데이터들이 선택적 파라미터 세트에 속하지 않으면, 선택적 파라미터 세트의 끝을 신호하는 다음 동기화 패턴에서의 데이터는 비트 스트림 신택스가 미리 정해준 대로 사용될 수 있다.
본 발명의 바람직한 예에서, 몇몇 채널의 복원을 위해 요구되는 적어도 2개 이상의 파라미터 세트는 그들의 지각 중요도(perceptional significance)와 관련하여 식별될 것이다. 지각을 위한, 즉 복원된 다채널 신호의 품질을 위한 가장 의미 있는 파라미터 세트는 데이터 스트림에서 필수적인 것으로 표시되는 동안, 다른 파라미터 세트들은 오직 선택적 파라미터 세트로 표시된다. 좀 더 필수적인 것으로 분류하자면, 선택적 그리고, 예를 들면, 오직 스튜디오 복원을 위해 요구되는 파라미터 세트는 단 2개의 스케일링 단계 대신 3개의 스케일링 단계를 얻기 위해 수행될 수 있다. 각기 표시되지 않은 파라미터 세트의 유형은 표식(marking)이 없으면 자동으로 생성되기 때문에, 필수적인 또는 선택적 파라미터 세트 둘 중 하나만 표시해도 충분하다는 것을 언급한다.
도 1A는 데이터 스트림의 구성을 보이고 있는데, 데이터 스트림은 도 1A에 도시된 일 예에서 보인 바와 같이, 11로 지정된 M 개의 전송 채널의 데이터와, 제1 제어 블록(10)과, 파라미터 셋을 위한 블록 12a, 12b, ...12c를 포함한다. 본 발명의 바람직한 일 예에서, 제어 블록(10)은, 도 1B에 계략적으로 도시된 바와 같이, 정보의 다양한 개개 단편들(pieces)을 포함한다. 그러므로 제어 블록(10) 안에 엔트리(100)는 명칭 "numBccDataMand"를 지닌 필드(field)에 의해 필수적 파라미터의 수를 신호한다. 게다가, 필드(101)는 선택적 파라미터 세트가 존재하는지 신호한다. "OptBccDataPresent"로 표시된 필드는 이러한 경우에 사용된다. 또 다른 제어 블록(1)의 필드는 기호 "numBccDataOpt"를 사용해 선택적 파라미터 세트의 수를 신호한다. 블록(103, 104, 105)은 각각의 파라미터 세트마다 파라미터 세트 i의 버전 수 및/또는 유형을 신호한다. "BccDataId"라는 명칭을 가진 필드는 이러한 경우에 사용된다. 필드(106, 107, 108)의 선택적 순차는 "Lengthinfo"로 지정된 선택적 길이정보를 파라미터 세트의 수에 포함된 선택적으로 표시된 각각의 파라미터 세트에 제공한다. 이 길이정보는 길이에 해당 결합 된 ith 파라미터 세트의 비트로서 제공한다. 아래에 논의한 바와 같이, "Lengthinfo"는 길이를 신호하는데 요구되는 비트의 수에 대한 정보, 또는 실제 길이 명세(specification)에 대한 정보를 포함할 수 있다.
도 3A 내지 3D는 파라미터 세트 배치의 바람직한 형태를 보여준다. 파라미터 세트 배치는 각각의 프레임마다 실행될 수 있지만, 많은 프레임을 포함한 파일의 시작부분과 같은 예처럼, 프레임의 그룹에 오직 한번 만 실행될 수도 있다. 그러므로, 도 3A는 존재(presence)의 정의 및 선택적 파라미터 세트의 수에 의사부호(pseudo code)를 부여하며, 여기서 "uimsbf"는 "부호없는(unsigned) 정수(integer) 가장(most) 중요한(significant) 비트(bit) 제1(first)"의 약이며, 즉 어떤 부호도 지정되지 않고 가장 중요한 비트인 정수는 데이터 스트림에서 제1이 된다. 그러므로, 제어 블록(10)의 필드(100)에서처럼, BCC 데이터의 수를 지정하는 변수 "numBccData"는 제1로 표현된다.
더욱이, 필드(101)는 모든 (optBccDaraPresent)에서 선택적 파라미터 세트가 존재하는지를 알리기 위해 사용된다. 그 후, 선택적 파라미터 세트의 번호(numBccDataOpt)는 소위 "청크(chunks)"(OptChunkInfo)라 불리는 선택적 파라미터 세트에 대한 추가 정보를 얻기 위해 판독된다. 변수(numBccDataOptM1)는 "minus 1"을 의미하는 접미사 "M1"을 포함한다. 이것은 도 3D의 "+1"에 의해 균형을 이룬다.
도 3B는 파라미터 세트 데이터 식별자가 필드(103 내지 105)에 존재할 수 있다는 한 실시 예에 대한 값의 개요를 보여준다. 그러므로, 변수 "BccDataId"는 제일 먼저 파라미터의 종류, 즉 ICLD, ICTD, 및 ICC와 같은 예로 이름을 포함하고, 동시에 버전 번호(V1 또는 V2)를 포함한다. 그러므로, 도 3B에서 데이터 스트림은 제1 버전(V1)의 채널간 레벨차(ICLD)를 포함하고, 그 후 제2 버전을 같은 시기에 포함하며, 여기서 제1 버전을 위한 그것에 알맞은 디코더는 간단히 ICLD_V1을 필수적 파라미터 세트로 판독할 수 있으며 ICLD_V2를 무시하는 동안, 더 높은 버전의 디코더는 간단히 ICLD_V2를 주로 필수적 파라미터 세트로서 판독할 수 있지만, 이 시나리오에서는 ICLD_V1을 선택적으로 요구되는 것으로서 무시할 수 있다. 대신으로, 데이터 세트는 데이터 스트림 내에 하나의 버전에서 의무적인 데이터 세트가 항상 존재하도록 기록될 수 있다.
도 3C는 선택적 파라미터 세트의 식별을 보여준다. 그러므로, 선택적 파라미터 세트에 대한 정보에서, 도 1B의 파라미터 세트 식별자(103에서 105)는 각각의 선택적 파라미터 세트에 대한 정보를 얻기 위해 각각의 파라미터 세트를 판독된다. 더구나 만약 비트 스트림으로 전송되었다면, 파라미터 세트의 길이는 각각의 파라미터 세트를 위해, 도 3C의 코맨드(command) "OptChunkLen()"에 의해 표현된 것처럼, 판독된다.
선택적 파라미터 세트를 위한 길이정보의 결정에 관한 본 발명의 바람직한 예에서, 도 3D는 각각의 파라미터 세트와 결합한 데이터로부터 각각의 파라미터 세트를 위해 판독하는 비트 내에 있는 길이를 보여준다.
디코더에 의해 수행된 파라미터 세트를 판독하는 루프(loop)는 도 4A에 도식적으로 표시되어 있다. 그러므로, 도 1의 블록(12A 내지12C) 내에 있는 실제 파라미터 세트 데이터는 BccData()에 의해 판독된다.
길이정보의 판독은 도 4B에 도시되어있다. 예를 들어, BccDataLenBits는 청크의 실제 비트 길이를 신호하기 위해 필요한 비트의 수를 설명한다. 그 후, BccDataLen은 실제로 청크가 가진 비트 내의 길이를 제공한다. 특히 상당히 다른 길이 및 다른 유형의 파라미터 세트에 적용되는 비트 내에서 아주 다양한 길이를 청크가 포함할 때 특히 효율적이므로, 2-단계 시스템은 한편으론 유연하고, 다른 한편으론 데이터를 절약한다. 이것은 비슷한 길이의 다음 청크 정의를 허용하게 될 것이다.
도 4C는 파라미터 세트 스위치(switch)를 최종적으로 표현하는데, 여기서 도 3B에 도시된 바와 같이, 파라미터 세트 식별자는 파라미터 세트가 복원 알고리즘과 결합하는 것처럼, 예를 들면 채널간 레벨차(ICLD)가 채널간 시간차(ICTD) 대신 선택되거나 또는 그 반대의 경우 같은 일이 생기지 않도록 상기 파라미터 세트 식별자가 평가된다.
도 4C는 다음 사항을 보여 준다. 즉 파라미터 세트가 선택적인 것으로 식별되고 선택적 파라미터 세트를 사용한 디코딩의 필요가 없을 때, 모든 필수적 파라미터 세트가 이미 판독되었을 때("분석 정지, 출력 시작")(또는 예를 들어 파라미 터 세트와 같은 디코더에게 알려지지 않은 데이터가 존재할 때), 다른 선택적 파라미터 세트를 고려하지 않은 채 이 파라미터 세트의 비트를 출력시작하도록 스킵하는 것을 보여준다("스킵 및 지속되는"). 적어도 하나 이상의 의무적 청크를 판독하였을 때 이러한 디코더는 출력을 시작하며, 그러므로 데이터 스트림 내의 정보를 분석하지 못한다. 그러므로, 디코더는 해석하지 못하는 데이터 스트림 콘텐츠에 의한 모든 오류로 인한 엑싯(exit)으로 유도되지 않는다. 이는 굉장히 견고한 디코더를 만들어낸다.
발명의 바람직한 예를 기반으로 이하에서 본 발명의 동작을 자세히 설명한다. 예를 들어, ICLD, ICTD, ICC 및 미래에 정의될 수 있는 다른 파라미터 세트 정보와 같은 다양한 유형의 파라미터 정보는 다른 분리된 데이터 부분으로, 즉 다른 스케일링 층으로 공급 저장 된다. 이러한 목적은 도 4A 내지 도 4C를 참조한다. 채널간 레벨차(ICLD) 파라미터 세트는, 채널간 시간차(ICTD) 파라미터 세트와 채널간 상관치 파라미터 세트와 같은 선택적 파라미터 세트와 차별화되어, 필수적(의무적) 파라미터로 인식된다.
선택적 파라미터 세트의 수(numBccDataOpt) 및 BCC 데이터의 존재(OptBccDataPresent), 그리고 필수적 파라미터 세트의 수(numBccDataMand)에 대한 정보가 제공된다. 통상적으로, 필수적 파라미터 세트의 수(numBccDataMand)에 대한 정보는 시스템 명세에 의해 결정되며, 그러므로 굳이 명시적으로(explicitly) 전송할 필요 없지만, 디코더와 인코더 사이에 확고하게 저장될 수 있다. 대조적으로, 선택적 파라미터 세트의 수(numBccDataOpt)를 명시적으로 전송하는 것을 선호 한다. 존재 파라미터(optBccDataPresent)가 선택적 파라미터 세트의 존재를 나타낼 때, 도 3A에 도시된 바와 같이, 선택적 파라미터 세트의 정보에 상응하는 정보의 평가가 시작된다.
본 발명의 바람직한 예에서, 각각의 파라미터 세트를 위해 추가적으로 제공된 식별자(BccDataId)가 존재한다. 상기 식별자는 ICLD, ICTD 또는 ICC, 및/또는 도 3B에도 도시된, 특정 파라미터 세트의 신택스 버전과 같은 파라미터 세트 유형에 대한 정보를 제공한다. 통상적으로, 선택적 파라미터 세트를 위한 식별자가 명시적으로 신호를 받는 동안, 필수적 파라미터 세트를 위한 식별자는 암시적(implicitly)으로 신호를 받는다. 그러나 이러한 경우, 확고하게 저장되는 시나리오에서, 채널간 레벨차(ICLD) 파라미터 세트와 같은 예를 포함하는 필수적 파라미터 세트를 처음으로 만나게 되는 파라미터 세트가 되도록 디코더와 인코더 사이에 저장되어야만 한다. 다른 대안으로, 파라미터 세트 유형 정보는 파라미터 세트의 순서(order)를 미리 설명함으로써 암시적으로 정의될 수 있다.
파라미터 세트는 되도록이면 파라미터 세트 길이정보를 포함할 것이다. 그러한 파라미터 세트 길이정보를 제공함으로써 디코더가 파라미터 세트의 정확한 비트 스트림 신택스도 모르면서도 결합된 비트를 간단히 스킵할 수 있게 한다. 이러한 목적은 도 4B에 도시되어 있다.
본 발명의 바람직한 예에서, 단순히 필수적 파라미터 세트는 길이 정보를 가지고 있지 아니한데, 이는 필수 파라미터 세트의 데이터를 무시하는 대신에 오히려 어떤 경우에도 디코더가 상기 필수 데이터를 분석하고 수행해야 하기 때문이다. 그 러므로 디코더가 어떠한 결합된 추가 정보도 포함하지 않는 파라미터 세트를 찾을 때, 디코더는 파라미터 세트(예: ICLD)를 사용가능한 결정된 파라미터 세트로 추정하고 실행하거나, 상기 디코더가 어떤 상응하는 정보를 포함하지 않는다는 사실 때문에, 상기 파라미터 세트를 필수적 파라미터 세트로 추정하고 실행할 수 있다.
선택적 파라미터 세트에 대해, 파라미터 세트 길이정보는 애플리케이션에 따라서 전송되거나 안 될 수도 있다. 간단한 규칙은, 인코더와 디코더 사이의 상호 동작(interoperability)을 향상시키기 위해, 모든 선택적 파라미터 세트는 파라미터 세트 길이정보를 포함한다는 것이다. 그러나 비트를 절약하기 위해서 마지막 파라미터 세트의 길이정보는 전송되지 않을 수 있는데 이는 이러한 데이터를 스킵하거나 다음 파라미터 세트를 액세스할 필요가 더 이상 없기 때문(어차피 마지막 파라미터 세트이기에)이다. 이 방식은 도 1A에 도시된 바와 같이, 데이터의 블록이 ith 파라미터 세트(12C)에 의해 실제로 차단되고 이어서, 예를 들면, 방금 전송된 M 개의 전송 채널 및/또는 합계 신호의 블록을 위한 제어 정보, 기타 등등이 더 이상 존재하지 않을 때 명백히 유용하다.
명시적으로 신호한다는 것은, 가용 리소스 정보(32, 도 2B)에 의한 예처럼, 파라미터 길이정보의 전송이, 도 3D에서 이미 도시된 바와 같이, 파라미터 세트 길이정보의 길이/존재에 관하여 인코더가 비트 스트림 요소의 수단에 의하여 디코더에 알려주기 때문에 다양하게 신호할 수 있다는 것이다.
이하, 도 2B에 도시된 디코더의 디코딩 처리를 위한 바람직한 예에 대해 설 명할 것이다. 바람직한 디코더는 제일 먼저 필수적(의무적) 파라미터 세트(아마도 채널간 레벨차(ICLD) 파라미터 세트일)의 유용성(사용할 수 있는 것인지)을 확인한다. 게다가 예로서 도 2B의 복원을 위한 수단(31)에의해 신택스 버전 1 내지 n 까지 지원하는 디코더가 스스로 디코딩할 수 있는 버전 번호보다 높은 ICLD 파라미터 세트의 신택스 버전 번호는 디코딩 할 수 없다. 다른 모든 경우에는, 유효한 디코딩 처리의 결정된 형태는 필수적 파라미터 세트를 디코딩하거나, 선택적 파라미터 세트가 사용되지 않을 때 필수적 파라미터 세트만을 사용하여 다채널 합성을 수행함으로써 완료될 수 있다.
그러나 디코더가 선택적 파라미터 세트를 검출할 때, 디코더는 그 콘텐츠를 사용하거나 버릴 수 있다. 이하 설명하는 시나리오에 따라서 2가지 상황 중 하나가 선택된다.
만약 선택적 파라미터 세트의 신택스 버전 번호가 파라미터 세트 유형을 위한 디코더 그 자체의 설치된 버전 능력보다 높으면, 상기 파라미터 세트 유형은 디코더에 의해 처리되지 못하고 스킵된다. 그러나 이러한 경우, 선택적 파라미터 세트를 사용한 향상된 다채널 복원 없이 유효한 디코딩은 여전히 이루어진다. 그러나 만약 선택적 파라미터 세트의 콘텐츠가 고려될 수 있다면, 디코더의 역량에 따라서 더 높은 품질의 복원이 이루어진다.
예를 들어, 채널간 간섭성(ICC) 값을 사용한 합성은 상당한 계산 리소스의 량을 점유할 수 있다. 그러므로 예를 들어, 더 높은 출력 품질을 제공할 수 있는 디코더가 모든 파라미터 세트, 즉 필수적, 선택적 파라미터 세트 모두를 복원을 위 해 추출하고 사용하는 동안, 간단한 디코더는 리소스 제어 정보에 의해 상기 파라미터 세트를 무시한다. 바람직한 예에서, 파라미터 세트를 사용/불사용 결정은 상응하는 시간에서 계산할 수 있느냐 하는 리소스의 능력에 의하여 결정된다.
본 발명의 개념은 필수적이 아닌 비트스트림 형태에 대하여 호환성을 제공한다는 것이다, 즉 종래의 디코더가 디코딩하는데 장애가 될 수 있는 선택적 파라미터 형태에 대하여 호환성을 제공한다는 것이다. 더구나 본 발명은 오래된 디코더들이 잘못된 동작하는 것을 보호하여 준다. 즉 도 3b 설명에서 "BccDataId" 관련하여 설명한 바와 같이, ICLD 정보나 옵션 정보에 의하여 필수 파라미터 세트의 신택스 버전 번호가 증가되어 업그레이드 되었을 때 스피커를 망가트릴 정도의 잘못된 출력을 낼 수 있는 가장 최악의 동작을 막아 준다.
본 발명의 개념은, 도 7에 도시된 것과 같이 먼저 모든 파라미터 세트를 판독할 수 있고, 그 후 상응하는 파라미터 처리 요소를 구동할 수 있는, 비트 스트림 내에서 사용될 수 있는 각각의 파라미터 세트의 전체적 신택스를 디코더가 알아야 하는 고전적인 비트 스트림 신택스와는 다르다. 본 발명의 디코더는 오직 채널간 레벨차(ICLD)가 필수적 파라미터 세트로 추출되었을 때, 낮은 품질일지라도 다채널 복원을 수행하기 위해 블록(126 및 128)을 스킵할 것이다.
이하, 낮은 데이터 율(rate)의 데이터 스트림을 지닌, 효율적이고 높은-품질의 디코딩에 의해 유리하게 사용될 수 있는 인코더의 중요한 특징을 다시 한번 요약해서 설명한다.
만약 파라미터 세트가 복원된 다채널 신호의 품질에 관한 K 개의 출력 채널 의 복원에서 다른 파라미터 세트보다 덜 중요하다면, 기록을 위한 수단(25)은 덜 중요한 데이터 세트의 사용 없이 복원할 수 있도록 데이터 세트를 기록하기 위해 설계된다.
되도록이면, 기록을 위한 수단(25)은 식별자(100 내지 105)와 결합된 파라미터 세트를 제공하도록 디자인되었는데, 여기서 파라미터 세트를 위한 상기 식별자는 파라미터 세트가 단연 복원을 위해서만 사용되어야 한다는 것을 지시하지만, 또 다른 파라미터 세트를 위한 식별자는 복원을 위해 파라미터 세트를 선택적으로만 사용하도록 지시한다.
되도록이면, 기록을 위한 수단(25)은 제2 파라미터 세트 부분(12b)을 판독 및 해석할 필요 없이 디코더가 K 개의 출력 채널을 복원할 수 있도록, 제1 파라미터 세트를 제1 파라미터 세트 부분(12a)으로, 그리고 제2 파라미터 세트를 제2 파라미터 세트 부분(12b)으로 기록하기 위해, 데이터 스트림의 데이터 세트의 전송 채널 부분(11)으로 M 개의 전송 채널을 기록하도록 디자인된다.
만약 파라미터 세트가 채널간 레벨차(ICLD), 채널간 시간차(ICTD), 채널간 위상차(ICPD, inter-channel phase differences), 또는 채널간 간섭성(ICC) 정보를 포함한 그룹에서 선택된다면, 기록수단(25)은 채널간 레벨차(ICLD)파라미터 세트를 디코딩을 위한 필수적인 것으로 표시하고, 적어도 하나 이상의 다른 파라미터 세트를 디코딩을 위한 선택적인 것으로 표시하도록 디자인된다.
되도록이면, 기록 수단(25)은 디코더가 길이정보에 기반을 둔 데이터량을 스킵할 수 있게 데이터 세트 내의 데이터량이 얼만큼 제2 파라미터 세트에 속하는지 를 나타내는 길이정보(106 내지 108)를 지닌 제2 파라미터 세트를 제공하기 위해 디자인되었는데, 여기에서 길이정보는 되도록이면 길이 필드의 비트 내에 길이를 신호하기 위한 제1 필드를 포함하며, 제공된 제2 파라미터 세트의 비트 량에 의해 비트 내에 길이를 포함한다.
되도록이면, 선택적 파라미터 세트 없이도 디코더에 의해 K 개의 출력 채널의 복원될 수 있도록 하는 선택 파라미터 세트의 번호를 가리키는 번호 정보(102)를 데이터 스트림 내에 기록하도록 기록수단(25)이 디자인된다.
되도록이면, 기록을 위한 수단(25)은 신택스 버전 정보가 선결된 상태를 포함할 때에만, 디코더가 상응하는 파라미터 세트를 사용해 복원을 수행하도록 파라미터 세트와 신택스 버전 정보(103 내지 105)를 연합하기 위해 디자인된다.
되도록이면, 제2 파라미터 세트를 위한 신택스 버전 정보만이 존재하고, 만약 적용할 수 있다면 선택적 파라미터 세트 또한 존재한다.
더군다나, 데이터 스트림에서 파라미터 세트의 시퀀스 내의 최후의 선택적 파라미터 세트는 결합된 어떠한 길이정보도 포함하지 않을 수 있다.
더군다나, 기록 수단(25)은 파라미터 세트 길이정보의 길이 및 존재를 데이터 스트림안에 다양하게 신호하도록 디자인될 수 있다.
제공 수단(22)은 적어도 하나 이상의 원본 채널의 시간 샘플의 블록 시퀀스에 기반을 둔 M 개의 전송 채널을 위한 데이터 블록 시퀀스를 제공하도록 디자인될 수 있다.
적용 환경에 따라서, 생성 및/또는 디코딩하는 본 발명의 방법은 소프트웨어 또는 하드웨어에서 구현될 수 있다. 이러한 구현은, 상기 방법이 수행되도록 프로그램 가능한 컴퓨터 시스템에 포함될 수 있는, 제어 신호를 갖는 CD 또는 플로피 디스크 등의 디지털 저장 매체에서 가능하다. 일반적으로, 본 발명은 컴퓨터 프로그램 제품이 컴퓨터에서 작동될 때, 상기 방법을 수행하도록 기계 판독가능한 캐리어에 저장된 컴퓨터 프로그램 제품을 포함한다. 다시 말해, 본 발명은 컴퓨터 프로그램이 컴퓨터상에서 동작하는 경우, 상기 방법들을 수행하기 위해 프로그램 코드를 갖는 컴퓨터 프로그램으로 실현될 수 있다.

Claims (18)

  1. N(2 이상의 수) 개의 원본 채널을 포함하는 비부호화된 다채널 신호를 표현하는 코딩된 다채널 신호를 생성하기 위한 장치로서,
    M 개의 전송 채널(23)로부터 K 개의 출력 채널을 복원하기 위해 파라미터 정보(24a, 24b, 24c)를 제공하는 수단(22)과; 여기서 상기 M은 1 이상이고 N 이하이며, 상기 K는 M보다는 크고 N 이하이며, 상기 파라미터 정보는 출력 채널을 복원하기 위해 적어도 하나 이상의 제1 파라미터 세트 및 제2 파라미터 세트를 포함하며, 여기서 상기 제2 파라미터 세트는 결합 신택스 버전 정보(103에서 105)를 포함하ㄴ는 것이며; 그리고
    데이터 스트림(26)을 기록하기 위한 수단(25), 여기서 상기 기록수단(25)은 상기 제1 및 제2 파라미터 세트를 데이터 스트림으로 기록하도록 디자인되어서, 적어도 하나 이상의 상기 M 개의 전송 채널(23)을 사용하고 상기 제2파라미터 세트의 사용 없이 상기 제1 파라미터 세트를 사용하여 적어도 하나 이상의 상기 M 개의 전송 채널(23)의 복원이 이루어지도록 된 것인 기록수단을 포함하는 코딩된 다채널 신호 생성장치.
  2. N 개의 원본 채널을 포함한 비부호화된 다채널 신호를 표현하는 코딩된 다채널 신호를 디코딩하기 위한 장치로서,
    여기서 상기 코딩된 다채널 신호는 M 개의 전송 채널로부터 K 개의 출력 채널을 복원하기 위한 파라미터 정보를 포함하는 데이터 스트림에 의해 표현되며, 상기 M은 1 이상이고 N 이하이며, 상기 K는 M보다 이상이고 N 이하이며, 상기 파라미터 정보는 출력 채널을 복원하기 위해 적어도 2개 이상의 서로 다른 파라미터 세트를 포함하며, 여기서 제2 파라미터 세트의 사용 없이 제1 파라미터 세트만 사용하여 K 개의 출력 채널의 복원이 이루어질 수 있도록 상기 제1 및 제2 파라미터 세트가 데이터 스트림에 기록되고, 제2 파라미터 세트는 결합 신택스 버전 정보(103 ~ 105)를 포함하며, 코딩된 다채널 신호의 디코딩 장치는:
    상기 제2 파라미터 세트(30b)와 결합된 신택스 버전 정보가 상기 디코딩 장치가 가지고 있는 신택스 버전 정보와 호환되는 것이 아니면, 상기 제2 파라미터 세트를 스킵하고 상기 제1 파라미터 세트(30a) 안에서 읽고, 상기 신택스 버전 정보와 호환되는 것이면, 상기 제2 파라미터 세트 안에서 읽어서 데이터 스트림을 판독하는 데이터 스트림 판독 수단(28)을 포함하는 코딩된 다채널 신호의 디코딩 장치.
  3. 제2항에 있어서,
    상기 제2 파라미터 세트의 이용 없이 상기 제1 파라미터 세트 및 상기 M 개의 전송 채널을 사용해서 K 개의 출력 채널을 복원하는 복원 수단(32)을 추가로 포함하는 코딩된 다채널 신호의 디코딩 장치.
  4. 제2항에 있어서,
    상기 제1 파라미터 세트는 상기 결합 신택스 버전 정보(103에서 105)를 포함하며,
    상기 판독 수단(28)은 상기 결합 신택스 버전 정보를 판독하고, 복원 수단(32)으로 하여금, 디코딩을 위한 장치의 주어진 신택스 버전 정보가 판독된 상기 신택스 버전 정보와 호환될 때에만, 상기 복원 수단에 의해 복원이 이루어질 수 있도록 디자인된 코딩된 다채널 신호의 디코딩 장치.
  5. 제2항에 있어서,
    상기 제2 파라미터 세트가 결합 제2 파라미터 세트의 데이터 양을 표현하는 길이정보를 포함하며, 상기 판독 수단(28)은 제2 파라미터 세트의 데이터 분석 없이 길이정보를 기초로 길이정보가 지시한 데이터 세트 내의 데이터 양을 스킵하도록 디자인된 것인 코딩된 다채널 신호의 디코딩 장치.
  6. 제2항에 있어서,
    상기 판독 수단(28)은 리소스 유용성 정보(32)를 얻기 위해 제어가능하며,
    상기 판독 수단(28)은 상기 리소스 유용성 정보가 리소스가 충분하다고 가리킬 때 제2 파라미터 세트 안에서 판독하며, 또한 리소스 유용성 정보가 리소스가 부족하다고 가르킬 때 제2 파라미터 세트를 스킵하도록 디자인된 것인 코딩된 다채 널 신호의 디코딩 장치.
  7. 제2항에 있어서,
    상기 하나의 파라미터 세트는 상기 K 개의 출력 채널의 복원 안에 있는 또 다른 파라미터 세트보다 상기 복원된 다채널 신호의 품질의 관점에서 덜 중요하며, 데이터 스트림 판독 수단(28)은 중요한 데이터 스트림보다 덜 중요한 데이터 세트를 스킵하도록 디자인된 것인 코딩된 다채널 신호의 디코딩 장치.
  8. 제2항에 있어서,
    상기 데이터 스트림은 결합 식별자(100에서 105)를 지닌 파라미터 세트를 포함하며, 파라미터 세트를 위한 식별자는 상기 파라미터 세트가 무조건 복원을 위해 사용되어야 한다는 것을 가리키거나, 또는 또다른 파라미터 세트에 대한 식별자는 상기 파라미터 세트가 오직 복원을 위해서 선택적으로만 사용될 수 있다는 것을 가리키며, 데이터 스트림 판독 수단(28)은 식별자를 감지하고 감지한 식별자에 기반하여 필수 파라미터 세트를 판독하고 선택적 파라미터 세트를 스킵하도록 디자인된 것인 코딩된 다채널 신호의 디코딩 장치
  9. 제2항에 있어서,
    상기 데이터 스트림은 제1 파라미터 세트 부분(12a) 안에 있는 제1 파라미터 세트 및 제2 파라미터 세트 부분(12b) 안에 있는 제2 파라미터 세트를 포함하며, 상기 데이터 스트림 판독 수단은 상기 파라미터 세트 부분에 관한 데이터 스트림을 해석하고 상기 제1 파라미터 세트 부분을 판독하며 상기 제2 파라미터 세트 부분을 스킵하도록 디자인된 것인 코딩된 다채널 신호의 디코딩 장치
  10. 제2항에 있어서,
    상기 파라미터 세트는 채널간 레벨차(ICLD), 채널간 시간차(ICTD), 채널간 위상차(ICPD) 또는 채널간 간섭성(ICC) 정보를 포함한 그룹에서 선택되며, 상기 데이터 스트림안에서 채널간 레벨차는 디코딩을 위한 절대적 필수조건으로 표시되며, 상기 그룹의 적어도 하나 이상의 상이한 파라미터 세트는 디코딩을 위한 선택조건으로 표시되며, 상기 데이터 스트림 판독 수단(28)은 채널간 레벨차 파라미터 세트를 판독하고 다른 파라미터 세트를 스킵하도록 디자인된 것인 코딩된 다채널 신호의 디코딩 장치
  11. 제2항에 있어서,
    상기 데이터 스트림은 상기 디코더에 의해 생성된 K 개의 출력 채널의 복원에 사용되지 아니할 선택적인 파라미터 세트를 가리키는 번호 정보(102)를 포함하며, 상기 데이터 스트림 판독 수단은 상기 번호 정보를 기반으로하여 적어도 하나 이상의 선택적인 파라미터 세트를 판독하도록 디자인된 것인 코딩된 다채널 신호의 디코딩 장치
  12. 제2항에 있어서,
    상기 제2 파라미터 세트 그리고 만약 적용할 수 있다면 추가 선택적인 파라미터 세트를 위한 데이터 스트림 안에는 결합 신택스 버전 정보가 있으며, 상기 제1 파라미터 세트를 위한 신택스 버전 정보는 존재하지 않는 것이 특징인 코딩된 다채널 신호의 디코딩 장치.
  13. 제1 또는 제2항에 있어서,
    상기 데이터 스트림 내에 있는 파라미터 세트 시퀀스 중에 최후 선택적인 파라미터 세트는 그 어떤 결합 길이정보도 포함하지 않으며, 상기 데이터 스트림 판독 수단(28)은 최후 선택적인 파라미터 세트를 판독하기 전 그 어떤 길이정보도 판독 및 해석하지 않게 디자인된 것인 코딩된 다채널 신호의 디코딩 장치.
  14. 제2항에 있어서,
    상기 파라미터 세트 길이정보의 존재 및 길이는 상기 데이터 스트림 내에서 다양하게 신호를 보내며, 상기 데이터 스트림 판독 수단(28)은 먼저 상기 파라미터 세트 길이정보의 존재를 감지하고나서 감지된 존재를 기초로 상기 데이터 스트림으로부터 파라미터 세트 길이정보의 길이를 추출하도록 디자인된 것인 코딩된 다채널 신호의 디코딩 장치.
  15. 제3항에 있어서,
    상기 M 개의 전송 채널은 BCC 파라미터를 포함한 파라미터 세트 및 BCC 다운믹스 채널이며, 상기 복원 수단(32)은 BCC 합성을 실행하도록 디자인된 것인 코딩된 다채널 신호의 디코딩 장치.
  16. N(N은 2 이상) 개의 원본 채널을 포함한 비부호화된 다채널을 표현하는 코딩된 다채널 신호를 생성하기 위한 방법으로서,
    M 개의 전송 채널(23)로부터 K 개의 출력 채널을 복원하기 위한 파라미터 정보(24a, 24b, 24c)를 제공하는 단계(22), 여기서 M은 1 이상이고 N 이하이며, K는 M보다 크고 N 이하이며, 상기 파라미터 정보는 하나 이상의 출력 채널을 복원하기 위해 적어도 2개 이상의 상이한 파라미터 세트를 포함하는 제공 단계(22); 및
    상기 M 개의 전송 채널(23) 중 적어도 하나 이상을 사용하고 상기 제2 파라미터를 사용하지 아니하고 상기 제1파라미터를 사용함으로써, 상기 K 개의 출력 채널 중 적어도 하나 이상의 복원이 이루어질 수 있게 상기 제1 및 제2 파라미터 세트를 데이터 스트림으로 기록하는 단계(25), 여기서 상기 제2 파라미터 세트가 결합 신택스 버전 정보(103에서 105)를 포함하는 것이 특징인 인코딩된 다채널 신호 생성 방법
  17. N 개의 원본 채널을 포함한 비부호화된 다채널 신호를 표현하는 코딩된 다채널 신호를 디코딩하기 위한 방법으로서,
    여기서 상기 코딩된 다채널 신호는 M 개의 전송 채널로부터 K 개의 출력 채 널을 복원하기 위한 파라미터 정보를 포함한 데이터 스트림에 의해 표현되며, 상기 M은 1 이상이고 N 이하이며, 상기 K는 M보다 크고 N 이하이며, 상기 파라미터 정보는 출력 채널을 복원하기 위해 적어도 2개 이상의 상이한 파라미터 세트를 포함하며, K 개의 출력 채널의 복원이 제2 파라미터 세트의 사용 없이 제1 파라미터 세트만 사용하여 완료될 수 있도록 제1 및 제2 파라미터 세트가 데이터 스트림에 기록되고, 제2 파라미터 세트는 결합 신택스 버전 정보(103에서 105)를 포함하며;
    제2 파라미터 세트(30b)와 결합된 신택스 버전 정보가 디코딩 장치가 가지고 있는 주어진 신택스 버전 정보와 호환되는 것이 아니면, 상기 제2 파라미터 세트를 스킵하고 상기 제1 파라미터 세트(30a) 안에서 읽고, 상기 주어진 신택스 버전 정보와 호환되는 것이면, 상기 제2 파라미터 세트 안에서 읽는 단계를 포함하여 이루어지는 인코딩된 다채널 신호를 디코딩하기 위한 방법.
  18. 컴퓨터 프로그램이 컴퓨터에서 실행될 때, 제16 또는 제17항에 있는 방법을 실행하기 위한 프로그램 코드를 포함하는 컴퓨터 프로그램이 기록된 컴퓨터 판독가능한 저장매체.
KR1020077005025A 2004-09-03 2005-08-29 인코딩 및 디코딩된 다채널 신호를 생성하는 장치 및 방법 KR100908081B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102004042819A DE102004042819A1 (de) 2004-09-03 2004-09-03 Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
DE102004042819.0 2004-09-03
PCT/EP2005/009293 WO2006027138A1 (de) 2004-09-03 2005-08-29 Erzeugung eines codierten multikanalsignals und decodierung eines codierten multikanalsignals

Publications (2)

Publication Number Publication Date
KR20070051875A KR20070051875A (ko) 2007-05-18
KR100908081B1 true KR100908081B1 (ko) 2009-07-15

Family

ID=35094601

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077005025A KR100908081B1 (ko) 2004-09-03 2005-08-29 인코딩 및 디코딩된 다채널 신호를 생성하는 장치 및 방법

Country Status (17)

Country Link
US (1) US8145498B2 (ko)
EP (1) EP1763870B1 (ko)
JP (1) JP4856641B2 (ko)
KR (1) KR100908081B1 (ko)
CN (1) CN101044550B (ko)
AU (1) AU2005281937B2 (ko)
BR (1) BRPI0515623B1 (ko)
CA (1) CA2578190C (ko)
DE (1) DE102004042819A1 (ko)
ES (1) ES2454670T3 (ko)
HK (1) HK1107174A1 (ko)
IL (1) IL181469A (ko)
MX (1) MX2007002569A (ko)
NO (1) NO338928B1 (ko)
PL (1) PL1763870T3 (ko)
RU (1) RU2379768C2 (ko)
WO (1) WO2006027138A1 (ko)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
JP5461835B2 (ja) * 2005-05-26 2014-04-02 エルジー エレクトロニクス インコーポレイティド オーディオ信号の符号化/復号化方法及び符号化/復号化装置
EP1974346B1 (en) * 2006-01-19 2013-10-02 LG Electronics, Inc. Method and apparatus for processing a media signal
US8160258B2 (en) 2006-02-07 2012-04-17 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
JP4875142B2 (ja) * 2006-03-28 2012-02-15 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル・サラウンドサウンドのためのデコーダのための方法及び装置
ATE527833T1 (de) 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
JP5232791B2 (ja) 2006-10-12 2013-07-10 エルジー エレクトロニクス インコーポレイティド ミックス信号処理装置及びその方法
DE102007007830A1 (de) * 2007-02-16 2008-08-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und Vorrichtung und Verfahren zum Lesen eines Datenstroms
US8612237B2 (en) * 2007-04-04 2013-12-17 Apple Inc. Method and apparatus for determining audio spatial quality
KR101024924B1 (ko) * 2008-01-23 2011-03-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
EP2083584B1 (en) 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
WO2009093867A2 (en) 2008-01-23 2009-07-30 Lg Electronics Inc. A method and an apparatus for processing audio signal
WO2010036059A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
US8346380B2 (en) * 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
US8258849B2 (en) * 2008-09-25 2012-09-04 Lg Electronics Inc. Method and an apparatus for processing a signal
KR101600352B1 (ko) 2008-10-30 2016-03-07 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
KR20100137159A (ko) * 2009-06-22 2010-12-30 삼성전자주식회사 방송 수신기 및 그의 채널 전환 방법
US9369718B2 (en) * 2009-10-30 2016-06-14 Sun Patent Trust Decoding method, decoding apparatus, coding method, and coding apparatus using a quantization matrix
EP2544466A1 (en) * 2011-07-05 2013-01-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral subtractor
US9451252B2 (en) 2012-01-14 2016-09-20 Qualcomm Incorporated Coding parameter sets and NAL unit headers for video coding
CN103493127B (zh) * 2012-04-05 2015-03-11 华为技术有限公司 用于参数空间音频编码和解码的方法、参数空间音频编码器和参数空间音频解码器
WO2013156679A1 (en) * 2012-04-16 2013-10-24 Nokia Corporation Method and apparatus for video coding
US9716892B2 (en) 2012-07-02 2017-07-25 Qualcomm Incorporated Video parameter set including session negotiation information
US9288603B2 (en) * 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
EP2717261A1 (en) * 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
RU2015134093A (ru) * 2013-01-14 2017-02-16 Конинклейке Филипс Н.В. Многоканальный кодер и декодер с эффективной передачей информации о положении
US9715880B2 (en) 2013-02-21 2017-07-25 Dolby International Ab Methods for parametric multi-channel encoding
RU2645271C2 (ru) 2013-04-05 2018-02-19 Долби Интернэшнл Аб Стереофонический кодер и декодер аудиосигналов
US9467700B2 (en) 2013-04-08 2016-10-11 Qualcomm Incorporated Non-entropy encoded representation format
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
EP3288025A4 (en) * 2015-04-24 2018-11-07 Sony Corporation Transmission device, transmission method, reception device, and reception method
FR3045915A1 (fr) * 2015-12-16 2017-06-23 Orange Traitement de reduction de canaux adaptatif pour le codage d'un signal audio multicanal
US10356800B2 (en) * 2016-05-09 2019-07-16 Qualcomm Incorporated Scalable numerology with symbol boundary alignment for uniform and non-uniform symbol duration in wireless communication
WO2019088863A1 (ru) * 2017-10-30 2019-05-09 Общество С Ограниченной Ответственностью "Теквел Разработка" Способ и компьютерное устройство для автоматического определения топологии связей
CN108039175B (zh) * 2018-01-29 2021-03-26 北京百度网讯科技有限公司 语音识别方法、装置及服务器
GB2582749A (en) * 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding
US11528574B2 (en) * 2019-08-30 2022-12-13 Sonos, Inc. Sum-difference arrays for audio playback devices

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
KR100335611B1 (ko) 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
JP2000151413A (ja) * 1998-11-10 2000-05-30 Matsushita Electric Ind Co Ltd オーディオ符号化における適応ダイナミック可変ビット割り当て方法
US6266782B1 (en) * 1998-11-30 2001-07-24 Siemens Information And Communication Networks, Inc. Apparatus and methods for inband protocol correction in distributed object networking
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
JP4244492B2 (ja) * 2000-03-24 2009-03-25 ソニー株式会社 情報処理装置、情報配信システム、情報処理方法、及び記録媒体
JP2001339311A (ja) * 2000-05-26 2001-12-07 Yamaha Corp オーディオ信号圧縮回路および伸長回路
US6718507B1 (en) * 2000-09-12 2004-04-06 At&T Corp. System and method for representing compressed information
JP2002175097A (ja) * 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
ATE311727T1 (de) * 2001-08-03 2005-12-15 Koninkl Philips Electronics Nv Datenschutzsystem und -verfahren für audio-video übertragung
KR100978018B1 (ko) 2002-04-22 2010-08-25 코닌클리케 필립스 일렉트로닉스 엔.브이. 공간 오디오의 파라메터적 표현
US8498422B2 (en) 2002-04-22 2013-07-30 Koninklijke Philips N.V. Parametric multi-channel audio representation
WO2004072956A1 (en) 2003-02-11 2004-08-26 Koninklijke Philips Electronics N.V. Audio coding
US6903669B1 (en) * 2003-10-03 2005-06-07 Cirrus Logic, Inc. Systems and methods for decoding compressed data
US7272567B2 (en) * 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Faller C et al., Binaural cue coding - Part II: Schemes and applications, IEEE Transactions on speech and audio processing, vol 11, No.6, 06 October 2003
J Herre et al., MP3 surround: Efficient and compatible coding of multi-channel audio, 116th AES convention, 08 May 2004, Berlin Germany

Also Published As

Publication number Publication date
DE102004042819A1 (de) 2006-03-23
BRPI0515623A8 (pt) 2018-07-31
KR20070051875A (ko) 2007-05-18
ES2454670T3 (es) 2014-04-11
CN101044550A (zh) 2007-09-26
EP1763870A1 (de) 2007-03-21
AU2005281937A1 (en) 2006-03-16
US20070219808A1 (en) 2007-09-20
BRPI0515623A (pt) 2008-07-29
EP1763870B1 (de) 2014-03-05
JP4856641B2 (ja) 2012-01-18
WO2006027138A1 (de) 2006-03-16
CA2578190A1 (en) 2006-03-16
PL1763870T3 (pl) 2014-08-29
NO338928B1 (no) 2016-10-31
BRPI0515623B1 (pt) 2019-05-21
HK1107174A1 (en) 2008-03-28
NO20070903L (no) 2007-04-03
IL181469A0 (en) 2007-07-04
IL181469A (en) 2011-09-27
RU2379768C2 (ru) 2010-01-20
CN101044550B (zh) 2011-05-11
RU2007112113A (ru) 2008-10-20
CA2578190C (en) 2012-09-11
MX2007002569A (es) 2007-07-05
AU2005281937B2 (en) 2008-10-09
JP2008511848A (ja) 2008-04-17
US8145498B2 (en) 2012-03-27

Similar Documents

Publication Publication Date Title
KR100908081B1 (ko) 인코딩 및 디코딩된 다채널 신호를 생성하는 장치 및 방법
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
JP4685925B2 (ja) 適応残差オーディオ符号化
RU2381570C2 (ru) Стереофонически совместимое кодирование многоканального звука
RU2327304C2 (ru) Совместимое многоканальное кодирование/декодирование
RU2407073C2 (ru) Кодирование многоканального аудио
US7961890B2 (en) Multi-channel hierarchical audio coding with compact side information
TWI406267B (zh) 一種音頻解碼器、一種用於對多音頻物件信號進行解碼的方法、以及執行該方法的具有程式碼的程式
US7292901B2 (en) Hybrid multi-channel/cue coding/decoding of audio signals
KR100462615B1 (ko) 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
US20080091439A1 (en) Hybrid multi-channel/cue coding/decoding of audio signals
US20130343551A1 (en) Method and apparatus for encoding/decoding stereo audio
EP3271918B1 (en) Audio signal processing apparatuses and methods
KR20150058120A (ko) 멀티 채널 신호의 복호화방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130628

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140708

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20150706

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20160708

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20170628

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20180628

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20190701

Year of fee payment: 11