KR100878367B1 - 콤팩트 보조 정보를 이용한 다중-채널 계층형 오디오 코딩 - Google Patents

콤팩트 보조 정보를 이용한 다중-채널 계층형 오디오 코딩 Download PDF

Info

Publication number
KR100878367B1
KR100878367B1 KR1020077002055A KR20077002055A KR100878367B1 KR 100878367 B1 KR100878367 B1 KR 100878367B1 KR 1020077002055 A KR1020077002055 A KR 1020077002055A KR 20077002055 A KR20077002055 A KR 20077002055A KR 100878367 B1 KR100878367 B1 KR 100878367B1
Authority
KR
South Korea
Prior art keywords
channel
information
coherence
original
master
Prior art date
Application number
KR1020077002055A
Other languages
English (en)
Other versions
KR20070088461A (ko
Inventor
안드레아스 호엘체르
쥐르겐 헤르
요나스 뢰덴
하이코 푸른하겐
크리스토퍼 크죌링
요나스 엥데가르트
제뢴 브레바트
에릭 슈이예르스
베르너 오멘
라르스 빌레뫼스
Original Assignee
프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우.
돌비 스웨덴 에이비
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우., 돌비 스웨덴 에이비, 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우.
Publication of KR20070088461A publication Critical patent/KR20070088461A/ko
Application granted granted Critical
Publication of KR100878367B1 publication Critical patent/KR100878367B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)

Abstract

제1 채널과 제2 채널 간의 코히어런스를 나타내는 코히어런스 정보를, 청취 위치에 대하여 좌측의 정보만을 포함한 제1 채널을 포함하고 청취 위치에 대하여 우측의 정보만을 포함한 제2 채널을 포함하는 채널 쌍에 대한 계층형 인코딩 프로세스 내에서, 얻는 경우, 다중-채널 오디오 신호의 파라메트릭 표현은 콤팩트 보조 정보를 잘 이용하여 오디오 신호의 공간 특성을 기술한다. 상기 계층형 프로세스 내에서는 오디오 신호의 다수의 오디오 채널을 반복하여 모노포닉 채널로 다운믹싱하므로, 다중-채널 오디오 신호의 공간 특성을 기술하는데 필요한 정보를 전송하는 채널 쌍만을 수반하는 인코딩 단계로부터 관련 파라미터를 선택할 수 있다.
코히어런스, 다중-채널, 계층형, 오디오 채널, 다운믹싱

Description

콤팩트 보조 정보를 이용한 다중-채널 계층형 오디오 코딩{Multi-Channel Hierarchical Audio Coding with Compact Side-Information}
본 발명은 다중-채널 오디오 처리에 관한 것으로, 더욱 상세하게는, 다중-채널 오디오 신호의 공간 특성을 기술하는 콤팩트 파라메트릭 보조 정보의 생성 및 이용에 관한 것이다.
발명의 배경 및 종래 기술
최근, 다중-채널 오디오 재생 기술은 더욱더 중요해지고 있다. 이는, 널리 공지된 mp3 기술과 같은 오디오 압축/인코딩 기술로 인해, 인터넷이나 제한된 대역폭을 갖는 다른 전송 채널을 통하여 오디오 레코드를 분배하는 것이 가능하게 되었기 때문이다. mp3 코딩 기술은, 스테레오 포맷, 즉, 제1 또는 좌측 스테레오 채널 및 제2 또는 우측 스테레오 채널을 포함한 오디오 레코드의 디지털 표현으로 모든 레코드의 분배를 허용하기 때문에, 널리 알려지게 되었다.
그럼에도, 종래 2채널 사운드 시스템의 경우, 기본적인 결점이 존재한다. 따라서, 서라운드 기술이 개발되었다. 추천된 다중-채널 서라운드 표현 포맷은, 2개의 스테레오 채널(L 및 R)에 더하여, 추가 중심 채널(C) 및 2개의 서라운드 채널(Ls 및 Rs)을 포함한다. 또한, 상기 기준 사운드 포맷은 3/2-스테레오라고 지칭 되고, 3개의 정면 채널과 2개의 서라운드 채널을 의미한다. 재생 환경에서는, 5개의 잘 설치된 라우드스피커의 일정 거리에서 최적 스위트 스폿을 얻기 위해, 5개의 적절한 위치에 있는 적어도 5개의 스피커를 필요로 한다.
다중-채널 오디오 신호의 파라메트릭 코딩(PS(parametric stereo), "공간 오디오 코딩", "BCC(binaural cue coding)" 등)에 대한 최근 접근법은, 그 인식된 공간 사운드 스테이지를 특징으로 하는, 다운믹스 신호(모노포닉이거나 여러 채널을 포함할 수 있음)와 파라메트릭 보조 정보(parametric side information, "공간 큐”(spatial cues))에 의해 다중-채널 오디오 신호를 표현한다. 서로 다른 접근법과 기술은 다음 단락에서 간략히 설명한다. 여기서 보조 정보(side information)라는 것은 측부 정보 또는 부수 정보라고도 할 수 있는 용어이다.
파라메트릭 스테레오라고 알려진 관련 기술는, "낮은 비트율에서 고품질 파라메트릭 공간 오디오 코딩(High-Quality Parametric Spatial Audio Coding at Low Bitrates)" (J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, AES 제116차 회의, 베를린, 프리프린트 6072, 2004년 5월) 및 "복잡도가 낮은 파라메트릭 스테레오 코딩" (E. Schuijers, J. Breebaart, H. Purnhagen, J. Engdegard, AES 제116차 회의, 베를린, 프리프린트 6073, 2004년 5월) 등의 문헌에 개시되어 있다.
다중-채널 오디오 신호의 전송에 필요한 데이터량을 줄이기 위한 여러 기술이 당해 기술분야에서 공지되어 있다. 이를 위해, 조인트 스테레오 장치(60)를 나타낸 도 11을 참조한다. 상기 장치는, 예를 들어, IS(Intensity Stereo) 또는 BCC(Binaural Cue Coding)를 구현하는 장치일 수 있다. 통상, 상기 장치는 입력으 로서 적어도 2개의 채널(CH1, CH2, ... CHn)을 수신하고, 단일 반송파 채널 및 파라메트릭 데이터를 출력한다. 파라메트릭 데이터는, 디코더에서, 원래 채널(CH1, CH2, ... CHn)을 계산할 수 있도록 정의된다.
통상, 반송파 채널은, 기초가 되는 신호의 비교적 미세한 표현을 제공하는, 서브밴드 샘플, 공간 계수, 시간 영역 샘플 등을 포함하지만, 파라메트릭 데이터는 상기 스펙트럼 계수의 샘플을 포함하지 않고, 다중화, 시간 변환, 주파수 변환, 위상 변환 등에 의한 가중화와 같은 일정한 재구성 알고리즘을 제어하기 위한 제어 파라미터를 포함한다. 따라서, 파라메트릭 데이터는 신호 또는 결합한 채널의 비교적 거친 표현만을 포함한다. 숫자로 표현하면, 반송파 채널이 필요로 하는 데이터량은 MPEG 코딩 방식에서 60 내지 70 kbit/s의 범위일 수 있으나, 하나의 채널에 대한 파라메트릭 보조 정보가 필요로 하는 데이터량은 5.1 채널 신호에 대하여 약 10 kbit/s의 범위일 수도 있다. 후술하는 바와 같이, 파라메트릭 데이터에 대한 일 예는, 널리 공지된 스케일 인자, 인텐시티 스테레오 정보 또는 바이노럴 큐 파라미터이다.
예를 들어, BCC 기술은, AES 회의 논문 5574, "스테레오 및 다중-채널 오디오 압축에 적용된 바이노럴 큐 코딩" (C. Faller, F. Baumgarte, 2002년 5월, 뮌헨), IEEE WASPAA 논문 "인식 파라미터화를 이용한 공간 오디오의 효율적인 표현" (2001년 10월, 뉴욕, 모홍크) 및 2개의 ICASSP 논문, "바이노럴 큐 코딩을 위한 오디토리 공간 큐의 추정"과 "바이노럴 큐 코딩: 공간 오디오의 신규하고 효율적인 표현" (양쪽 두 논문의 저자는 C. Faller와 F. Baumgarte임, 2002년 5월, 플로리 다, 올랜도)에 개시되어 있다.
BCC 코딩에서, 오디오 입력 채널의 수는, 중첩 윈도를 갖는 DFT(Discrete Fourier Transform) 기반 변환을 이용한 스펙트럼 표현으로 변환된다. 결과로서 생기는 스펙트럼은 비중첩 파티션으로 분할된다. 각각의 파티션은 ERB(Equivalent Rectangular Bandwidth)에 비례하는 대역폭을 갖는다. ICLD(Inter-Channel Level Differences)와 ICTD(Inter-Channel Time Differences)는 각각의 파티션에 대하여 추정된다. 통상, ICLD와 ICTD는 기준 채널에 관하여 각각의 채널에 주어지고 더 양자화된다. 결국, 전송된 파라미터는, 처리되는 특정 신호의 파티션에 의존할 수도 있는, 규정된 공식에 따라 계산된다(인코딩된다).
디코더 측에서, 디코더는 모노 신호와 BCC 비트 스트림을 수신한다. 모노 신호는 주파수 영역으로 변환되고, 디코딩된 ICLD 및 ICTD 값을 수신도 하는 공간 합성 블록에 입력된다. 공간 합성 블록에서, BCC 파라미터(ICLD 및 ICTD)를 이용하여, 주파수/시간 변환 후, 원래 다중-채널 오디오 신호의 재구성을 표현하는, 다중-채널 신호를 합성하기 위해, 모노 신호의 가중 연산을 수행한다.
BCC의 경우, 조인트 스테레오 장치(60)는 채널 보조 정보를 출력하도록 동작하여, 파라메트릭 채널 데이터를 양자화하고 인코딩함으로써, ICLD 또는 ICTD 파라미터를 생성하고, 원래 채널 중 하나는 채널 보조 정보를 코딩하는 동안 기준 채널로서 이용된다.
통상, 반송파 채널은 관계하는 원래 채널의 합으로 형성된다.
따라서, 상기 기술은, 반송파 채널만을 처리할 수 있고 하나 이상의 입력 채 널의 하나 이상의 근사를 생성하기 위한 파라메트릭 데이터를 처리할 수 없는 재생 장비에 대한 적당한 모노 표현을 더 제공한다.
BCC(binaural cue coding)로 알려진 오디오 코딩 기술은 미국 특허 출원 공개공보 US 2003, 0219130 A1, 2003/0026441 A1 및 2003/0035553 A1에도 공지되어 있다. 또한, "바이노럴 큐 코딩. 파트 2: 방식 및 응용" (C. Faller와 F. Baumgarte, IEEE Trnas. on Audio and Speech Proc., Vol. 11, No. 6, 2003년 11월)과 "유연한 렌더링을 갖는 오디오 압축에 적용된 바이노럴 큐" (C. Faller와 F. Baumgarte, AES 제113차 회의, 로스 앤젤레스, 2002년 10월)이 참조된다. Faller와 Baumgarte에 의해 작성된 BCC 기술에 관한 인용된 미국 특허 출원 공개공보와 2개의 인용된 기술 간행물은 그 전체 내용을 여기서 참조로서 포함하고 있다.
ICLD와 ITCD 파라미터가 가장 중요한 사운드 소스 로컬리제이션 파라미터를 표현하지만, 이들 파라미터만을 이용한 공간 표현은 달성될 수 있는 최대 품질을 제한한다. 상기 제한을 해결하여, 고품질 파라메트릭 코딩을 가능케 하기 위해, (J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers (2005년) "스테레오 오디오의 파라메트릭 코딩", Eurasip J. Applied Signal Proc. 9, 1305-1322에 설명되어 있는) 파라메트릭 스테레오는, IIDs(Interchannel Intensity Differences), IPDs(Interchannel Phase Differences), 및 IC(Interchannel Coherence)로서 지칭되는, 3가지 타입의 공간 파라미터를 적용한다. 코히어런스 파라미터로 설정된 공간 파라미터의 확장은 사운드 스테이지의 인식된 공간 "확산성" 또는 공간 "콤팩트성"의 파라미터화를 가능케 한다.
다음으로, 다중-채널 오디오 코딩을 위한 통상 일반적인 BCC 방식을 도 12 내지 도 14를 참조하여 상세히 설명한다. 도 9는 다중-채널 오디오 신호의 코딩/전송을 위한 상기 일반적인 바이노럴 큐 코딩 방식을 나타낸다. BCC 인코더(112)의 입력(110)에 있는 다중-채널 오디오 입력 신호는 다운믹스 블록(114)에서 다운믹싱된다. 본 예에서, 입력(110)에 있는 원래 다중-채널 신호는 정면 좌측 채널, 정면 우측 채널, 좌측 서라운드 채널, 우측 서라운드 채널 및 중심 채널을 포함한 5-채널 서라운드 신호이다. 본 발명의 바람직한 실시예에서, 다운믹스 블록(114)은 이들 5개의 채널을 하나의 모노 신호로 단순히 더하여 합 신호를 생성한다. 다중-채널 입력 신호를 이용하여, 단일 채널을 갖는 다운믹스 신호를 얻을 수 있도록 하는, 다른 다운믹싱 방식이 당해 기술분야에 공지되어 있다. 상기 단일 채널은 합 신호 라인(115)에서 출력된다. BCC 분석 블록(116)에 의해 얻어진 보조 정보는 보조 정보 라인(117)에서 출력된다. BCC 분석 블록에서, ICLD(inter-channel level differences)와 ICTD(inter-channel time differences)는 상술한 바와 같이 계산된다. 또한, BCC 분석 블록(116)은 ICC(inter-channel correlation) 값을 계산하도록 형성된다. 합 신호와 보조 정보는 양자화되어 인코딩된 형태로 BCC 디코더(120)에 전송되는 것이 바람직하다. BCC 디코더(120)는 전송된 합 신호를 다수의 서브밴드로 구성하고, 스케일링, 지연 및 다른 처리를 적용하여, 출력된 다중-채널 오디오 신호의 서브밴드를 생성한다. 상기 처리는, 출력(121)에서 재구성된 다중-채널 신호의 ICLD, ICTD 및 ICC파라미터(큐)가 BCC 인코더(112)의 입력(110)에서 원래 다중-채널 신호에 대한 각각의 큐와 유사하도록, 수행된다. 이를 위해, BCC 디코더(120)는 BCC 합성 블록(122) 및 보조 정보 처리 블록(123)을 포함한다.
다음으로, 도 13을 참조하여, BCC 합성 블록(122)의 내부 구성을 설명한다. 라인(115) 상의 합 신호는 시간/주파수 변환 유닛 또는 FB(125; filter bank)로 입력된다. 블록(125)의 출력에는, N개의 서브밴드 신호가 존재하거나, 극단적인 경우, 오디오 필터 뱅크(125)가 1:1 변환, 즉, N개의 시간 영역 샘플에서 N개의 스펙트럼 계수를 생성하는 변환(임계 서브샘플링)을 수행할 때, 스펙트럼 계수의 블록이 존재한다.
BCC 합성 블록(122)은 디스플레이 스테이지(126), 레벨 변경 스테이지(127), 상관 처리 스테이지(128) 및 IFB(inverse filter bank) 스테이지(129)를 더 포함한다. 스테이지(129)의 출력에서, 예를 들어, 5-채널 서라운드 시스템의 경우 5개의 채널을 갖는 재구성된 다중-채널 오디오 신호는 도 12에 도시된 바와 같은 라우드스피커(124) 세트에 출력될 수 있다.
도 13에 도시된 바와 같이, 입력 신호(s(n))는 요소(125)에 의해 주파수 영역이나 필터 뱅크 영역으로 변환된다. 요소(125)에 의해 출력된 신호를 곱하여, 분기 노드(130)에 의해 표시된 바와 같이, 여러 버전의 같은 신호를 얻는다. 원래 신호의 버전 수는 재구성되는 출력 신호에서 출력 채널의 수와 같다. 통상, 노드(130)에서 원래 신호의 각 버전은 일정한 지연(d1, d2, ..., di, ..., dN)을 받는다. 지연 파라미터는 도 12의 보조 정보 처리 블록(123)에 의해 계산되어, BCC 분석 블록(116)에서 결정된 바와 같은 ICTD로부터 얻어진다.
상기 내용은, BCC 분석 블록(116)에 의해 계산된 것과 같은 ICLD에 기초하여 보조 정보 처리 블록(123)에 의해서도 계산되는, 다중화 파라미터(a1, a2, ..., ai, ..., aN)에 적용된다.
BCC 분석 블록(116)에 의해 계산된 ICC 파라미터를 이용하여, 블록(128)의 기능성을 제어함으로써, 지연되어 레벨-조작된 신호 간의 일정한 상관을 블록(128)의 출력에서 얻는다. 여기서, 스테이지(126, 127, 128)의 순서는 도 13에 도시된 경우와 다를 수도 있다는 것에 주목해야 한다.
오디오 신호의 프레임별 처리에서는, BCC 분석도 프레임별, 즉, 시변, 및 또한 주파수별로 수행된다는 것에 주목해야 한다. 이는, 각각의 스펙트럼 대역의 경우, BCC 파라미터가 개별적으로 얻어진다는 것을 의미한다. 또한, 이는, 오디오 필터 뱅크(125)가, 예를 들어, 32개의 대역 통과 신호로 입력 신호를 분해하는 경우, BCC 분석 블록은 각각의 32개의 대역에 대하여 BCC 파라미터 세트를 얻는 것을 의미한다. 물론, 도 13에 상세히 도시된, 도 12의 BCC 분석 블록(122)은, 본 예에서도 32개의 대역에 기초하는, 재구성을 수행한다.
다음으로, 일정한 BCC 파라미터를 결정하는 설정을 나타낸 도 14를 참조한다. 통상, ICLD, ICTD 및 ICC 파라미터는 임의의 채널 쌍 간에 정의될 수 있다. 여기서 개략적으로 설명되는 한 방법은, 기준 채널과 각각의 다른 채널 간에 ICLD 및 ICTD 파라미터로 이루어진다. 이는 도 14A에 도시되어 있다.
ICC 파라미터는 서로 다른 방법으로 정의될 수 있다. 가장 일반적으로는, 도 14B에 도시된 바와 같이 모든 가능한 채널 쌍 간의 인코더에서 ICC 파라미터를 추정할 수 있다. 이 경우, 디코더는, 모든 가능한 채널 쌍 간의 원래 다중-채널 신호에서와 거의 같도록, ICC를 합성하게 된다. 그러나, 한 번에 가장 강한 2개의 채널 간의 ICC 파라미터만을 추정하는 것이 제안되었다. 상기 방식은 도 14C에 도시되어 있고, 채널1 과 채널 2 간에 ICC 파라미터를 추정하고, 다른 순간에, 채널 1과 채널 5 간에 ICC 파라미터를 추정한다. 그 다음에, 디코더는 디코더에서 가장 강한 채널 간의 ICC를 합성하고, 나머지 채널 쌍에 대한 ICC를 계산하고 합성하기 위한 일부 경험적 규칙을 적용한다.
예를 들어, 전송된 ICLD 파라미터에 기초한 다중화 파라미터(a1, ..., aN)의 계산에 관하여, 상술한 AES 회의 논문 5574를 참조한다. ICLD 파라미터는 원래 다중-채널 신호에서 에너지 분배를 표현한다. 보편성을 잃지 않으면서, 도 14A에는, 모든 다른 채널과 전면 우측 패널 간의 에너지 차이를 나타낸 4개의 ICLD 파라미터가 존재하는 것이 도시되어 있다. 보조 정보 처리 블록(123)에서, 다중화 파라미터(a1, ..., aN)는, 모든 재구성된 출력 채널이 전체 에너지가 전송된 합 신호의 에너지와 같도록(또는 전송된 합 신호의 에너지에 비례하도록), ICLD 파라미터로부터 얻어진다. 이들 파라미터를 결정하기 위한 간단한 방법은 2-스테이지 프로세스로서, 제1 스테이지에서는, 좌측 정면 채널에 대한 다중화 인자를 "1"로 설정하면서, 도 14A에서 다른 채널에 대한 다중화 인자를 전송된 ICLD 값으로부터 결정한다. 그 다음에, 제2 스테이지에서는, 모든 5개 채널의 에너지를 계산하고, 전송된 합 신호의 에너지와 비교한다. 그 다음에, 모든 채널에 대하여 같은 다운스케일링 인자를 이용하여 모든 채널을 다운스케일링하고, 여기서, 다운스케일링 인자는, 다운스케일링 후, 모든 재구성된 출력 채널의 전체 에너지가 전송된 합 신호의 전체 에너지와 같도록, 선택된다.
물론, 2-스테이지 프로세스에 의존하지 않고 1-스테이지 프로세스만을 필요로 하는, 다중화 인자를 계산하기 위한 다른 방법도 존재한다.
지연 파라미터에 관하여, 좌측 정면 채널에 대한 지연 파라미터(d1)를 "0"으로 설정할 때, BCC 인코더로부터 전송되는 지연 파라미터(ICTD)를 직접 이용할 수 있다는 것에 주목해야 한다. 여기서는, 지연이 신호의 에너지를 변경하지 않으므로, 어떤 리스케일링도 수행될 필요가 없다.
도 14를 참조하여 상술한 바와 같이, 각각의 5개 채널에 대하여, 파라메트릭 보조 정보, 즉, ICLD(Interchannel Level Differences), ICTD(Interchannel Time Differences) 또는 ICC(Interchannel Coherence) 파라미터를 계산하여 전송할 수 있다. 이는, 통상, 5개의 채널에 대하여 4개의 ICLD 세트를 전송하는 것을 의미한다. 또한, ICC 파라미터에 관하여, 예를 들어, 2개의 이들 파라미터 세트를 전송하는 것만으로 충분할 수도 있다.
도 13을 참조하여 상술한 바와 같이, 신호의 하나의 프레임 또는 시간 부분에 대하여 단 하나의 레벨 차이 파라미터, 시간 차이 파라미터 또는 코히어런스 파라미터도 존재하지 않는다. 그 대신, 여러 서로 다른 주파수 대역에 대하여 이들 파라미터를 결정하여, 주파수-의존 파라미터화를 얻는다. 예를 들어, 32개의 주파수 채널, 즉, BCC 분석 및 BCC 합성을 위한 32개의 주파수 대역을 갖는 필터 뱅크를 이용하는 것이 바람직하므로, 파라미터는 상당히 많은 데이터를 점유할 수 있다. 다른 다중-채널 전송에 비해, 파라메트릭 표현으로 인해, 데이터 레이트가 상 당히 낮아지더라도, 다중-채널 서라운드 신호와 같은 2개 이상의 채널을 갖는 신호를 표현하는데 필요한 데이터 레이트의 추가 감소에 대한 계속되는 요구가 존재한다.
유리하게도, 다중-채널 오디오 신호의 인코딩은, 단일 모노-채널로의 파라메트릭 스테레오 코딩을 수행하는, 여러 현재 모듈을 이용하여 구현될 수 있다. 국제 특허 출원 WO2004008805 A1은, 소정 수의 입력 오디오 채널이 하나의 단일 모노-채널로 순차적으로 다운믹싱되도록, 파라메트릭 스테레오 코더를 계층형 설정으로 정렬할 수 있는 방법을 나타낸다. 결국, 다운믹스 모노-채널의 공간 특성을 기술하는, 파라메트릭 보조 정보는, 반복적인 다운믹싱 프로세스 동안 순차적으로 생성된 모든 파라메트릭 정보로 이루어진다. 이는, 예를 들어, 최종 모노 신호를 형성하는데 필요한 3개의 스테레오-모노 다운믹싱 프로세스가 존재하면, 다중-채널 오디오 신호의 파라메트릭 표현을 형성하는 최종 파라미터 세트는 모든 단일 스테레오-모노 다운믹싱 프로세스 동안 얻은 3개의 파라미터 세트로 이루어진다.
도 15에는, 종래 방법을 더 상세히 설명하기 위해, 계층형 다운믹싱 인코더가 도시되어 있다. 도 15는, 파라메트릭 보조 정보를 더한 단일 모노포닉 오디오 채널(202)로 변환되는 6개의 원래 오디오 채널(200a 내지 200f)을 나타낸다. 따라서, 6개의 원래 오디오 채널(200a 내지 200f)은 시간 영역에서 주파수 영역으로 변환되어야 하고, 이는, 오디오 채널(200a 내지 200f)을 주파수 영역에서 대응하는 채널(206a 내지 206f)로 변환하는, 변환 유닛(204)에 의해 수행된다. 계층형 접근법을 따라, 채널(206a 내지 206f)은 3개의 모노포닉 채널(L, R 및 C)로 쌍단위 로(pair-wise) 다운믹싱된다(각각, 208a, 208b 및 208c). 3개 쌍의 채널의 다운믹싱 동안, 파라미터 세트는, 모노포닉 신호로 다운믹싱된, 원래 스테레오포닉 신호의 공간 특성을 기술하는, 각각의 채널 쌍에 대하여 얻어진다. 이와 같이, 상기 제1 다운믹싱 단계에서, 3개의 파라미터 세트(210a 내지 210c)를 생성하여, 신호(206a 내지 206f)의 공간 정보를 보존한다.
계층형 다운믹싱의 다음 단계에서, 채널(208a 및 208b)은, 파라미터 세트(210d; 파라미터 세트 4)를 생성하는, 채널(212; LR)로 다운믹싱된다. 최종적으로, 하나의 단일 모노포닉 채널만을 얻기 위해, 채널(208c 및 212)의 다운믹싱을 필요로 하므로, 채널(214; M)에서 다운믹싱을 필요로 한다. 이는, 제5 파라미터 세트(210e; 파라미터 세트 5)를 생성한다. 최종적으로, 다운믹싱된 모노포닉 오디오 신호(214)를 시간 영역으로 역변환하여, 표준 장비에서 재생될 수 있는 오디오 신호(202)를 얻는다.
상술한 바와 같이, 종래 기술에 따른 다운믹스 오디오 신호(202)의 파라메트릭 표현은 모든 파라미터 세트(210a 내지 210e)로 이루어지므로, 모노포닉 오디오 신호(202)로부터 원래 다중-채널 오디오 신호(채널(200a 내지 200f))를 재구성하기를 원하면, 모든 파라미터 세트(210a 내지 210e)를 모노포닉 다운믹스 신호(202)의 보조 정보로서 필요로 하게 된다.
(여기서, 단지 "종래 큐 결합"으로서 지칭되는)미국 특허 출원 11/032,689는, 비계층형 코딩 방식으로 보조 정보를 저장하기 위해, 여러 큐 값을 단일 전송된 값으로 결합시키기 위한 프로세스를 설명한다. 이를 위해, 우선 모든 채널을 다운믹싱한 후, 큐 코드를 결합시켜 전송된 큐 값(하나의 단일 값일 수도 있음)을 형성하고, 상기 결합은, 입력 신호로부터 직접 얻는 공간 파라미터를 변수로서 입력하는, 미리 정의된 수학 함수에 의존한다.
2개("스테레오") 이상("다중-채널")의 오디오 입력 채널의 파라메트릭 코딩을 위한 최신 기술은 입력 신호로부터 직접 공간 파라미터를 얻는다. 상기 파라미터의 예로는, ICLD 또는 IID(Inter-Channel Intensity Differences), ITCD(Inter-Channel Time Display) 또는 IPD(Inter-Channel Phase Differences), 및 ICC(Inter-Channel Correlation/Coherence)가 있고, 그 각각은 주파수-선택 방식, 즉, 주파수 대역에 따라 전송된다. 종래 큐 결합의 응용은, 여러 큐 값을 인코더에서 디코더 측으로 전송되는 단일 값과 결합시킬 수 있음을 나타낸다. 디코딩 프로세스는 원래 개별적으로 전송된 큐 값 대신 전송된 단일 값을 이용하여 다중-채널 출력 신호를 재구성한다. 바람직한 실시예에서, 상기 방식은 ICC 파라미터에 적용되었다. 이로 인해, 큐 보조 정보 크기를 상당히 감소시키면서 대부분 신호의 공간 품질을 보존하게 됨을 알 수 있다. 그러나, 계층형 코딩 방식에서 이를 이용하는 방법은 명확하지 않다.
본 출원 또는 종래 큐 결합은 2개의 전송된 다운믹스 채널에 기초한 시스템에 대한 일 예로서 본 발명의 상세한 원리를 갖는다. 제안된 방법에서, 도 15를 참조하면, Lf/Lr 및 Rf/Rr 채널 쌍의 ICC 값은 단일 전송된 ICC 파라미터로 결합한다. 2개의 결합한 ICC 값은, Lf(front-left) 채널과 Lr(rear-left) 채널의 채널(L)로의 다운믹싱 동안 및 Rf(front-right)채널과 Rr(rear-right) 채널의 채 널(R)로의 다운믹싱 동안 얻어졌다. 따라서, 최종적으로 단일 전송된 ICC 파라미터로 결합하는 2개의 결합한 ICC 값은 모두 원래 채널의 정면/후면 상관에 관한 정보를 전송하고, 이들 2개의 ICC 값의 결합은 일반적으로 상기 정보의 대부분을 보존하게 된다. L 채널과 R 채널을 하나의 단일 모노 채널로 더 다운믹싱하기를 원하면, 다운믹스 채널(L 및 R)의 좌측/우측 상관에 관한 정보를 전송하는, 제3 ICC 값을 얻게 된다. 종래 큐 결합에 따르면, 3개의 ICC 값을 하나의 전송된 ICC 파라미터로 변환하는 소정의 함수를 적용하여 3개의 ICC 값을 결합해야 한다.
그러면, 정면/후면 정보가 좌측/우측 정보와 믹싱되는 문제가 발생하므로, 원래 다중-채널 오디오 채널의 재생에 있어서 명백히 불리하게 된다. 미국 출원 11/032,689에서는, 좌측/우측 정보를 보유한 2개의 다운믹스 채널(L 및 R)을 전송하고, 정면/후면 정보를 보유한 하나의 단일 ICC 값을 추가로 전송함으로써, 상기 문제를 회피할 수 있다. 이로 인해, 상당히 증가한 데이터 레이트를 희생하면서 원래 채널의 공간 특성을 보존하게 되므로, 완전한 추가 다운믹스 채널을 전송하게 된다.
발명의 개요
본 발명의 목적은, 계층형 코딩 방식의 환경에서 콤팩트 보조 정보를 이용한 다중-채널 오디오 신호의 파라메트릭 표현을 생성하고 이용하는 개선된 개념을 제공하는 것이다.
본 발명의 제1 태양에 따르면, 상기 목적은, 청취 위치에 대하여 좌측에 적어도 2개의 원래 좌측 채널 및 우측에 적어도 2개의 원래 우측 채널을 갖는 오디오 신호의 파라메트릭 표현을 생성하기 위한 인코더로서, 파라메트릭 정보를 생성하는 생성기로서, 상기 생성기는 여러 채널 쌍을 개별적으로 처리하여 그 처리된 채널 쌍들에 대한 레벨 정보를 얻고, 좌측의 정보만을 갖는 제1 채널 및 우측의 정보만을 갖는 제2 채널을 포함한 채널 쌍에 대한 코히어런스 정보를 얻도록 동작하는, 생성기; 및 상기 채널 쌍들에 대한 레벨 정보를 선택하고, 상기 코히어런스 정보를 이용하여 좌측/우측 코히어런스 값을 결정하고, 상기 좌측/우측 코히어런스 값을 출력 데이터스트림에 도입함으로써, 상기 파라메트릭 표현을 제공하기 위한 제공기를 포함하는, 상기 인코더에 의해 달성된다.
본 발명의 제2 태양에 따르면, 상기 목적은, 청취 위치에 대하여 좌측에 적어도 2개의 원래 좌측 채널 및 우측에 적어도 2개의 원래 우측 채널을 갖는 원래 오디오 신호의 파라메트릭 표현을 처리하기 위한 디코더로서, 오디오 신호의 파라메트릭 표현을 제공하는 수신기로서, 상기 수신기는 채널 쌍들에 대한 레벨 정보를 제공하고, 좌측 채널 및 우측 채널을 포함한 채널 쌍에 대한 좌측/우측 코히어런스 값을 제공하도록 동작하고, 상기 좌측/우측 코히어런스 값은 상기 좌측의 정보만을 갖는 제1 채널 및 상기 우측의 정보만을 갖는 제2 채널을 포함한 적어도 하나의 채널 쌍 간의 코히어런스 정보를 표현하는, 수신기; 및 상기 채널 쌍에 대한 파라메트릭 정보를 공급하는 프로세서로서, 상기 프로세서는 상기 파라메트릭 표현으로부터 레벨 정보를 선택하고, 상기 좌측/우측 코히어런스 값을 이용하여 적어도 하나의 채널 쌍에 대한 코히어런스 정보를 얻고, 상기 적어도 하나의 채널 쌍은 상기 좌측의 정보만을 갖는 제1 채널 및 상기 우측의 정보만을 갖는 제2 채널을 포함하는, 프로세서를 포함하는 상기 디코더에 의해 달성된다.
본 발명의 제3 태양에 따르면, 상기 목적은, 오디오 신호의 파라메트릭 표현을 생성하기 위한 방법에 의해 달성된다.
본 발명의 제4 태양에 따르면, 상기 목적은, 컴퓨터상에서 실행시, 상기 방법을 구현하는 컴퓨터 프로그램에 의해 달성된다.
본 발명의 제5 태양에 따르면, 상기 목적은, 원래 오디오 신호의 파라메트릭 표현을 처리하기 위한 방법에 의해 달성된다.
본 발명의 제6 태양에 따르면, 상기 목적은, 컴퓨터상에서 실행시, 상기 방법을 구현하는 컴퓨터 프로그램에 의해 달성된다.
본 발명의 제7 태양에 따르면, 상기 목적은, 청취 위치에 대하여 좌측에 적어도 2개의 원래 좌측 채널 및 우측에 적어도 2개의 우측 채널을 갖는 오디오 신호의 파라메트릭 표현을 형성함으로써 생성된 인코딩된 오디오 데이터로서, 파라메트릭 표현은, 채널 쌍에 대한 레벨 차이와, 좌측의 정보만을 갖는 제1 채널 및 우측의 정보만을 갖는 제2 채널을 포함한 채널 쌍의 코히어런스 정보에서 얻은 좌측/우측 코히어런스 값을 포함하는, 상기 인코딩된 오디오 데이터에 의해 달성된다.
본 발명은, 제1 채널과 제2 채널 간의 코히어런스를 기술하는 코히어런스 정보를, 청취 위치에 대하여 좌측의 정보만을 갖는 제1 채널을 포함하고 청취 위치에 대하여 우측의 정보만을 갖는 제2 채널을 포함하는 채널 쌍에 대한 계층형 인코딩 프로세스 내에서 얻는 경우, 다중-채널 오디오 신호의 파라메트릭 표현이 콤팩트 보조 정보를 잘 이용하여 오디오 신호의 공간 특성을 기술한다는 것을 발견한 것에 기초하고 있다. 계층형 프로세스에서, 원래 오디오 신호의 다수의 오디오 채널이 모노포닉 채널로 반복적으로 다운믹싱되는 것이 바람직하므로, 가능한 한 원래 오디오 신호의 공간 특성을 기술하는데 요구되는 원하는 정보를 포함한 채널 쌍만을 수반하는 단계에 대한 인코딩 프로세스 동안 관련 보조 정보 파라미터를 선택할 기회를 갖는다. 이로 인해, 그 선택된 파라미터나 그 파라미터의 결합에 기초하여 원래 오디오 신호의 파라메트릭 표현을 형성할 수 있으므로, 다운믹스 신호의 공간 정보를 보유하고 있는 보조 정보의 크기를 상당히 감소시킬 수 있다.
제안된 개념에 따르면, 단일(모노포닉) 전송 채널만이 실행 가능한 경우에도, 큐 값의 결합은, 다운믹스 오디오 신호의 보조 정보 레이트를 감소시킬 수 있다. 또한, 본 발명의 개념은, 인코더의 서로 다른 계층형 토폴로지를 허용한다. 특히, 이는, 원래 사운드 이미지를 충실히 재생하는 계층형 인코딩/디코딩 접근법을 이용하여 공간 오디오 디코더에서 적용될 수 있는, 적당한 단일 icc 값을 얻을 수 있는 방법을 명확히 설명한다.
본 발명의 일 실시예는, 5.1 채널 오디오 신호의 좌측 정면 및 우측 후면 오디오 채널을 좌측 마스터 채널로 결합하고, 이와 동시에, 우측 정면 및 우측 후면 채널을 우측 마스터 채널로 결합하는, 계층형 인코딩 구조를 구현한다. 좌측 채널과 우측 채널을 별개로 결합할 때, 중요한 좌측/우측 코히어런스 정보가 주로 보존되고, 본 발명에 따라, 좌측 마스터와 우측 마스터 채널이 스테레오 마스터 채널로 다운믹싱되는, 제2 인코딩 단계에서 얻어진다. 상기 다운믹싱 프로세스 동안, 상기 ICC 파라미터가 가장 정확한 좌측/우측 코히어런스를 닮은 ICC 파라미터가 되므로, 전체 시스템에 대한 ICC 파라미터를 얻는다. 본 발명의 본 실시예에서는, 종래 기술에서의 경우와 같이, 임의의 채널 쌍을 설명하는 ICC 파라미터 세트에 일정한 인위적인 함수를 적용하지 않고, 적당한 방법으로 계층형 인코딩 단계를 단순히 배열함으로써, 6개의 오디오 채널의 가장 중요한 좌측/우측 코히어런스를 기술하는 ICC 파라미터를 얻는다.
본 발명의 상술한 실시예의 변형에서는, 저주파수 채널은 사람이 신호의 기원을 거의 찾아낼 수 없는 저주파수를 갖는 신호만을 포함하므로, 5.1 오디오 신호의 중심 채널과 저주파수 채널을 중심 마스터 채널로 다운믹싱하고, 상기 채널은 주로 중심 채널에 관한 정보만을 보유한다. 유리하게도, 중심 마스터 채널을 설명하는 파라미터에 의해, 상술한 바와 같이 얻은 ICC 값을 추가로 조정할 수 있다. 이는, 예를 들어, ICC 값을 에너지 정보와 가중시킴으로써 수행될 수 있고, 에너지 정보는 스테레오 마스터 채널에 대하여 중심 마스터 채널을 통하여 얼마나 많은 에너지가 전송되는지를 알려준다.
본 발명의 다른 실시예에서, 계층형 인코딩 프로세스는, 제1 단계에서, 5.1 오디오 신호의 좌측-정면 및 우측-정면 채널을 정면 마스터 채널로 다운믹싱하지만, 좌측-후면 및 우측-후면 채널을 후면 마스터 채널로 다운믹싱함으로써, 수행된다. 따라서, 각각의 다운믹싱 프로세스에서, 중요한 좌측/우측 코히어런스에 관한 정보를 포함한 ICC 값을 생성한다. 그 다음에, 결합하여 전송된 ICC 파라미터를 2개의 별개의 ICC 값의 결합으로부터 얻고, 전송된 ICC 파라미터를 얻는 유리한 방법은 채널의 레벨 파라미터를 가중값으로서 이용하여, ICC 값의 가중된 합을 형성한다.
본 발명의 변형에서는, 중심 채널과 저주파수 채널을 중심 마스터 채널로 다운믹싱한 후, 중심 마스터 채널과 정면 마스터 채널을 스테레오 마스터 채널로 다운믹싱한다. 나중의 다운믹싱 프로세스에서, 전송된 IC 파라미터를 조정하거나 수정하는데 이용되는, 중심 채널과 스테레오 채널 간의 상관을 수신함으로써, 정면 오디오 신호에 대한 중심 기여도 고려한다. 상술한 시스템의 주요 이점은, 오디오 신호에 대부분 기여하는 채널이 전송된 ICC 값을 주로 정의하도록, 코히어런스 정보를 형성할 수 있다는 것이다. 이는, 통상 정면 채널이 되지만, 예를 들어, 음악 콘서트의 다중-채널 표현에서, 박수 갈채하는 청중의 신호는 후면 채널의 ICC 값을 주로 이용함으로써 강조될 수 있다. 또한, 다중-채널 오디오 신호의 공간 특성에 의존하여, 정면 채널과 후면 채널 간의 가중을 동적으로 변경할 수 있는 다른 이점을 갖는다.
본 발명의 일 실시예에서, 본 발명의 계층형 디코더는 현재 디코딩 단계의 수가 필요로 하는 것보다 적은 ICC 파라미터를 수신하도록 동작한다. 디코더는 수신된 ICC 파라미터에서 각각의 디코딩 단계에 필요한 ICC 파라미터를 얻도록 동작한다.
이는, 대신, 미리 정의된 값을 이용함으로써 또는 수신된 ICC 파라미터와 수신된 ICLD 값에 기초하는 유도 규칙을 이용하여 추가 ICC 파라미터를 얻음으로써 수행될 수도 있다.
그러나, 바람직한 실시예에서, 디코더는, 각각의 개별적인 디코딩 단계에 대한 단일의 전송된 ICC 파라미터를 이용하도록 동작한다. 이는, 가장 중요한 상관, 즉, 좌측/우측 상관이 본 발명의 개념 내에서 전송된 ICC 파라미터에 보전되므로, 유리하다. 상기 경우에서와 같이, 청취자는 원래 신호와 아주 닮은 신호의 재생을 경험하게 된다. ICC 파라미터는 재구성된 신호의 인식 범위를 정의하고 있다는 것에 주목해야 한다. 디코더가 전송 후 전송된 ICC 파라미터를 수정하면, 재구성된 신호의 인식 범위를 설명하는 ICC 파라미터는 계층형 재생 내에서 좌측/우측 상관과 정면/후면 상관에 대하여 서로 다르게 될 수도 있다. 이는, 그 다음에, 그 머리를 움직이거나 회전시키는 청취자가, 지각적으로 더 넓어지거나 더 좁아지게 되고, 물론 가장 교란시키는, 신호를 경험하게 되므로, 가장 불리하게 된다. 이는, 단일의 수신된 ICC 파라미터를 계층형 디코더의 디코딩 유닛에 분배함으로써 회피할 수 있다.
다른 바람직한 실시예에서, 본 발명의 디코더는 ICC 값의 전체 세트 또는 다른 방법으로는 단일 ICC 값을 수신하도록 동작하고, 디코더는 비트스트림 내에서 디코딩 지시를 수신함으로써 적용되는 디코딩 전략을 인식한다. 또한, 이와 같은 후방형(backwards) 호환 디코더는, ICC 데이터의 전체 세트를 전송하는 종래 신호를 디코딩하는, 종래 환경에서 동작가능하다.
이하, 첨부된 도면을 참조하여, 본 발명의 바람직한 실시예를 설명한다.
도 1은 본 발명의 계층형 오디오 인코더의 일 실시예의 블록도를 나타낸다.
도 2는 본 발명의 오디오 인코더의 일 실시예를 나타낸다.
도 2a는 본 발명의 오디오 인코더의 ICC 파라미터의 가능한 조정 방식을 나타낸다.
도 3a 및 도 3b는 보조 채널 정보의 그래프 표현을 나타낸다.
도 4는 본 발명의 오디오 인코더의 제2 실시예를 나타낸다.
도 5는 본 발명의 오디오 인코더의 바람직한 실시예의 블록도를 나타낸다.
도 6은 본 발명의 오디오 디코더의 일 실시예를 나타낸다.
도 7은 본 발명의 오디오 디코더의 다른 실시예를 나타낸다.
도 8은 본 발명의 오디오 레코더의 송신기를 나타낸다.
도 9는 본 발명의 수신기 또는 오디오 재생기를 나타낸다.
도 10은 본 발명의 전송 시스템을 나타낸다.
도 11은 종래 조인트 스테레오 인코더를 나타낸다.
도 12는 종래 BCC 인코더/디코더 체인의 블록도 표현을 나타낸다.
도 13은 BCC 합성 블록의 종래 구현의 블록도를 나타낸다.
도 14는 BCC 파라미터를 결정하기 위한 방식의 표현을 나타낸다.
도 15는 종래 계층형 인코더를 나타낸다.
바람직한 실시예의 상세한 설명
도 1은 오디오 신호의 파라메트릭 표현을 생성하는 본 발명의 인코더의 블록도를 나타낸다. 도 1은, 오디오 채널을 결합한 후, 단일 채널로 결합하는 채널 쌍 의 공간 특성을 기술하는 공간 파라미터를 생성하는 생성기(220)를 나타낸다. 또한, 도 1은, 채널 쌍 간의 레벨 차이 정보를 선택함하고, 생성기(220)에 의해 생성된 코히어런스 정보를 이용하여 좌측/우측 코히어런스 값을 결정함으로써, 다중-채널 오디오 신호의 파라메트릭 표현을 제공하는 제공기(222)를 더 나타낸다.
본 발명의 계층형 다중-채널 오디오 코딩의 개념의 원리를 설명하기 위해, 도 1은, 4개의 원래 오디오 채널(224a 내지 224d)을 반복하여 결합함으로써, 단일 채널(226)로 되는 경우를 나타낸다. 각각, 원래 오디오 채널(224a 및 224b)은 원래 4개의 채널 오디오 신호의 좌측-정면 및 좌측-후면 채널을 표현하고, 채널(224c 및 224d)은 우측-정면 및 우측-후면 채널을 표현한다. 보편성을 잃지 않으면서, 도 1에는 단지 2개의 여러 공간 파라미터만이 도시되어 있다(ICLD 및 ICC). 본 발명에 따르면, 생성기(220)는, 결합 프로세스 동안, 중요한 좌측/우측 코히어런스 정보를 전송하는 ICC 파라미터를 얻을 수 있도록 하는 방법으로, 오디오 채널(224a 내지 224d)을 결합시킨다.
제1 단계에서는, 좌측 정보(224a 및 224b)만을 포함한 채널을 좌측 마스터 채널(228a; L)로 결합하고, 우측 정보(224c 및 224d)만을 포함한 2개의 채널을 우측 마스터 채널(228b; R)로 결합한다. 상기 결합 동안, 생성기는 2개의 ICLD 파라미터(230a 내지 230b)를 생성하고, 양쪽 모두는 하나의 단일 채널로 결합하는 2개의 원래 채널의 레벨 차이에 관한 정보를 포함한 공간 파라미터이다. 또한, 생성기는 단일 채널로 결합하는 2개의 채널 간의 상관을 기술하는 2개의 ICC 파라미터(232a 내지 232b)를 생성한다. ICLD 및 ICC 파라미터(230a, 230b, 232a 및 232b)는 제공기(222)에 전송된다.
계층형 생성 프로세스의 다음 단계에서, 좌측 마스터 채널(228a)은 우측 마스터 채널(228b)과 결합하여 오디오 채널(226)로 되고, 생성기는 ICLD 파라미터(234)와 ICC 파라미터(236)를 제공하고, 양쪽 모두는 제공기(222)에 전송된다. 상기 결합 단계에서 생성된 ICC 파라미터(236)는 오디오 채널(224a 내지 224d)에 의해 표현된 원래 4-채널 오디오 신호의 중요한 좌측/우측 코히어런스 정보를 주로 표현한다는 것에 주목하자.
따라서, 파라메트릭 표현이 파라미터(230a, 230b, 234 및 236)를 포함하도록, 제공기(222)는 이용 가능한 공간 파라미터(230a, 230b, 232a, 232b, 234 및 236)에서 파라메트릭 표현(238)을 형성한다.
도 2는 5.1 다중-채널 신호를 단일 모노포닉 신호로 인코딩하는 본 발명의 오디오 인코더의 바람직한 실시예를 나타낸다.
도 2는, 3개의 변환 유닛(240a 내지 240c), 5개의 2/1(2-to-1)-다운믹서(242a 내지 242c), 파라미터 결합 유닛(244) 및 역변환 유닛(246)을 나타낸다. 원래 5.1 채널 오디오 신호는 좌측-정면 채널(248a), 좌측-후면 채널(248b), 우측-정면 채널(248c), 우측-후면 채널(248d), 중심 채널(248e) 및 저주파수 채널(248f)에 의해 주어진다. 좌측 정보(248a 및 248b)만을 포함한 채널이 하나의 채널 쌍을 형성하고, 우측 정보(248c 및 248d)만을 포함한 채널이 다른 채널 쌍을 형성하고, 중심 채널(248e 및 248f)이 제3 채널 쌍을 형성하도록 하는 방법으로, 원래 채널을 그룹화한다는 것에 주목하는 것이 중요하다.
변환 유닛(240a 내지 240c)은 시간 영역의 채널(248a 내지 248f)을 주파수 서브밴드 영역의 그 공간 표현(250a 내지 250f)으로 변환한다. 제1 계층형 인코딩 단계(252)에서, 좌측 채널(250a 및 250b)은 좌측 마스터 채널(254a)로 인코딩되고, 우측 채널(250c 및 250d)은 우측 마스터 채널(254b)로 인코딩되고, 중심 채널(250e)과 저주파수 채널(254f)은 중심 마스터 채널(256)로 인코딩된다. 상기 제1 계층형 인코딩 단계(252) 동안, 3개의 관련된 2/1-인코더(242a 내지 242c)는 중요한 공간 파라미터 세트(260a, 260b 및 260c)에 더하여, 다운믹싱된 채널(254a, 254b 및 256)을 생성하고, 파라미터 세트(260a; 파라미터 세트 1)는 채널(250a)과 채널(250b) 간의 공간 정보를 설명하고, 파라미터 세트(260b; 파라미터 세트 2)는 채널(250c)과 채널(250d) 간의 공간 관계를 설명하고, 파라미터 세트(260c; 파라미터 세트 3)는 채널(250e)과 채널(250f) 간의 공간 관계를 설명한다.
제2 계층형 단계(262)에서는, 좌측 마스터 채널(254a)과 우측 마스터 채널(254b)을 스테레오 마스터 채널(264)로 다운믹싱하여, 공간 파라미터 세트(266; 파라미터 세트 4)를 생성하고, 상기 파라미터 세트(266)의 ICC 파라미터는 중요한 좌측/우측 상관 정보를 포함한다. 파라미터 세트(266)로부터 결합한 ICC 값을 형성하기 위해, 파라미터 세트(266)는 데이터 접속(268)을 통하여 파라미터 결합 유닛(244)에 전송될 수 있다. 제3 계층형 인코딩 단계(272)에서는, 스테레오 마스터 채널(264)을 중심 마스터 채널(256c)과 결합하여, 모노포닉 결과 채널(274)을 형성한다. 상기 다운믹싱 프로세스 동안 얻은 파라미터 세트(276)는 데이터 접속(278)을 통하여 파라미터 결합 유닛(244)에 전송될 수 있다. 최종적으로, 결과 채 널(274)을 역변환 유닛(246)에 의해 시간 영역으로 변환하여, 오디오 채널(248a 내지 248f)에 의해 표현된 원래 5.1 채널 신호의 최종 모노포닉 표현인, 모노포닉 다운믹스 오디오 신호(280)를 형성한다.
모노포닉 다운믹스 오디오 채널(280)로부터 원래 5.1 채널 오디오 신호를 재구성하기 위해서는, 5.1 채널 오디오 신호의 파라메트릭 표현을 추가로 필요로 한다. 도 2에 도시된 트리 구조의 경우, 좌측 정면 및 후면 채널을 L-신호(254a)로 결합시킬 수 있음을 알 수 있다. 이와 유사하게, 우측 정면 및 후면 채널을 R-신호(254b)로 결합시킬 수 있다. 그 다음에, L 및 R-신호의 결합을 실행하여, 파라미터 세트 번호 4(266)를 생성한다. 상기 계층형 구조의 경우, 결합한 ICC 값을 얻는 간단한 방법은 파라미터 세트 번호 4의 ICC 값을 선택하고, 이 값을 결합한 ICC 값으로서 취한 후, 파라미터 결합 유닛(244)에 의해 5.1 채널 신호의 파라메트릭 표현으로 통합하는 것이다.
또한, 도 2a에 도시된 바와 같이, (예를 들어, 파라미터 세트 번호 5의 파라미터를 이용함으로써) 더 복잡한 방법은 중심 채널의 영향을 고려할 수 있다.
일 예로서, 파라미터 세트 번호 5로부터의 LR 채널(264)에 포함된 에너지와 C 채널(256c)에 포함된 에너지의 에너지 비율(E(LR)/E(C))을 이용하여, ICC 값을 조정할 수 있다. 대부분의 에너지가 LR 경로로부터 발생하는 경우, 전송된 ICC 값은 파라미터 세트 번호 4의 ICC 값(ICC(LR))에 더 가까워야 한다. 다음으로, 도 2a에 도시된 바와 같이, 대부분의 에너지가 C-경로(256)로부터 발생하는 경우, 전송된 ICC 값은 "1"에 가까워야 한다. 상기 도면은, 에너지 비율이 소정의 한계 값(286)을 초과하는 경우 2개의 최고값 간의 전환(조정 함수(288a))에 의해 또는 최고값 간의 평탄한 전이(조정 함수(288b))에 의해 상기 ICC 파라미터의 조정을 구현하는 2개의 가능한 방법을 나타낸다.
도 3a 및 도 3b는, 종래 기술(도 3a) 및 본 발명의 오디오 코딩을 위한 개념(도 3b)을 이용하여 계층형 인코더 구조에서 얻은 5.1 오디오 채널의 가능한 파라메트릭 표현의 비교를 나타낸다.
도 3a는, 종래 기술에 의해 제공되는 바와 같은, 단일 시간 프레임 및 이산 주파수 간격의 파라메트릭 표현을 나타낸다. 도 2의 각각의 2/1 인코더(242a 내지 242e)는 한 쌍의 ICLD 파라미터와 ICC 파라미터를 생성하고, 파라미터 쌍의 기원은 도 3a 내에 표시된다. 종래 접근법에 따르면, 2/1 인코더(242a 내지 242e)에 의해 제공된 것과 같은, 모든 파라미터 세트는 5.1 채널 오디오 신호를 재구성하기 위해 보조 정보로서 다운믹스 모노포닉 오디오 신호(280)와 함께 전송되어야 한다.
도 3b는 본 발명의 개념을 따라 얻은 파라미터를 나타낸다. 각각의 2/1 인코더(242a 내지 242e)는 단지 하나의 파라미터, 즉, ICLD 파라미터에 직접 기여한다. 단일 전송된 ICC 파라미터(ICCc)는 파라미터 결합 유닛(244)에 의해 얻어지나, 2/1 인코더(242a 내지 242e)에 의해 직접 제공되지 않는다. 도 3a 및 도 3b에서 명확히 알 수 있는 바와 같이, 본 발명의 계층형 인코더에 대한 개념은 종래 기술에 비해 보조 정보 데이터량을 상당히 줄일 수 있다.
도 4는, 계층형 인코딩 프로세스에서 5.1 채널 오디오 신호를 모노포닉 오디오 신호로 인코딩하고, 콤팩트 보조 정보를 공급하는 것을 허용하는, 본 발명의 다 른 바람직한 실시예를 나타낸다. 원칙적인 하드웨어 구조는 도 2에서 설명된 것과 같으므로, 2개의 도면에서 같은 항목은 같은 참조 부호를 붙인다. 그 차이는 입력 채널(248a 내지 248f)의 서로 다른 그룹화 때문이므로, 단일 채널을 모노포닉 채널(274)로 다운믹싱하는 순서는 도 2의 다운믹싱 순서와 다르다. 따라서, 다음에서는, 도 4에 도시된 본 발명의 실시예의 이해에 필수적인, 도 2의 설명과 다른 태양만을 설명한다.
좌측-정면 채널(248a)과 우측-정면 채널(248c)을 함께 그룹화하여 채널 쌍을 형성하고, 중심 채널(248e)과 저주파수 채널(248f)은 다른 입력 채널 쌍을 형성하고, 5.1 오디오 신호의 제3 입력 채널 쌍은 좌측-후면 채널(248b)과 우측-후면 채널(248d)에 의해 형성된다.
제1 계층형 인코딩 단계(252)에서는, 좌측-정면 채널(250a)과 우측-정면 채널(250c)을 정면 마스터 채널(290; F)로 다운믹싱하고, 중심 채널(250e)과 저주파수 채널(250f)를 중심 마스터 채널(292; C)로 다운믹싱하고, 좌측-후면 채널(250b)과 우측-후면 채널(250d)을 후면 마스터 채널(294; S)로 다운믹싱한다. 파라미터 세트(300a; 파라미터 세트 1)는 정면 마스터 채널(290)을 설명하고, 파라미터 세트(300b; 파라미터 세트 2)는 중심 마스터 채널(292)을 설명하고, 파라미터 세트(300c; 파라미터 세트 3)는 후면 마스터 채널(294)을 설명한다.
파라미터 세트(300c)뿐만 아니라 파라미터 세트(300a)도 원래 채널(248a 내지 248f) 간의 중요한 좌측/우측 상관을 기술하는 정보를 유지한다는 것에 주목하는 것이 중요하다. 따라서, 파라미터 세트(300a)와 파라미터 세트(300c)는 데이터 링크(302a 및 302b)를 통하여 파라미터 결합 유닛(244)에 이용 가능하게 된다.
제2 인코딩 단계(262)에서는, 정면 마스터 채널(290)과 중심 마스터 채널(292)을 순수 정면 채널(304)로 다운믹싱하여, 파라미터 세트(300d; 파라미터 세트 4)를 생성한다. 또한, 상기 파라미터 세트(300d)는 데이터 링크(306)를 통하여 파라미터 결합 유닛(244)에 이용 가능하게 된다.
제3 계층형 인코딩 단계(272)에서는, 순수 정면 채널(304)을 후면 마스터 채널(294)과 함께 결과 채널(274; M)로 다운믹싱한 후, 역변환 유닛(246)에 의해 시간 영역으로 변환하여 최종 모노포닉 다운믹스 오디오 채널(280)을 형성한다. 또한, 순수 정면 채널(304)과 후면 마스터 채널(294)의 다운믹싱에서 발생하는, 파라미터 세트(300e; 파라미터 세트 5)는 데이터 링크(310)를 통하여 파라미터 결합 유닛(244)에 이용 가능하게 된다.
우선, 도 4의 트리 구조는, 정면 및 후면과 별개로 좌측 및 후면 채널의 결합을 수행한다. 이와 같이, 기본적인 좌측/우측 상관/코히어런스는 파라미터 세트 1 및 파라미터 세트 3(300a 및 300c)에 존재한다. 결합한 ICC 값은 파라미터 세트 1과 파라미터 세트 3의 ICC 값 간의 가중된 평균을 형성함으로써 파라미터 결합 유닛(244)에 의해 형성될 수 있다. 이는, 가중값이 더 커지면 채널 쌍(Lf/Rf 대 Lr/Rr)이 더 강해지게 되는 것을 의미한다. 이는, 가중된 합을 형성하는 결합한 ICC 파라미터(ICCc)를 얻음으로써 달성될 수 있다.
ICCc = (A*ICC1 + B*ICC2)/(A + B)
여기서, A는 ICC1에 대응하는 채널 쌍 내의 에너지를 나타내고, B는 ICC2에 대응하는 채널 쌍 내의 에너지를 나타낸다.
또한, 다른 실시예에서, 더 복잡한 방법은, (예를 들어, 파라미터 세트 번호 4의 파라미터를 고려함으로써) 중심 채널의 영향을 고려할 수 있다.
도 5는, 원래 4-채널 오디오 신호의 파라메트릭 표현인, 수신된 콤팩트 보조 정보를 처리하는 본 발명의 디코더를 나타낸다. 도 5는 4-채널 오디오 신호의 콤팩트 파라메트릭 표현을 제공하는 수신기(310) 및 콤팩트 파라메트릭 표현을 처리하는 프로세서(312)를 포함하므로, 4-채널 오디오 신호의 완전한 파라메트릭 표현을 공급하여, 수신된 모노포닉 오디오 신호로부터 4-채널 오디오 신호를 재구성할 수 있다.
수신기(310)는 공간 파라미터(ICLD(314; B), ICLD(316; F), ICLD(318; R) 및 ICC(320))를 수신한다. 파라미터(314 내지 320)로 이루어진, 제공된 파라메트릭 표현은 원래 오디오 채널(324a 내지 324d)의 공간 특성을 기술한다.
제1 업-믹싱 단계로서, 프로세서(312)는, 2개의 채널(324a 및 324b; Rf 및 Lf)의 결합인 제1 채널 쌍(326a)과 2개의 채널(324c 및 324d; Rd 및 Lr)의 결합인 제2 채널 쌍(326b)을 설명하는 공간 파라미터를 공급한다. 이를 위해서는, 채널 쌍의 레벨 차이(314)를 필요로 한다. 양쪽 채널 쌍(326a 및 326b)이 우측 채널뿐만 아니라 좌측 채널도 포함하므로, 채널 쌍 간의 레벨 차이는 정면/후면 상관을 주로 설명한다. 따라서, 좌측/우측 코히어런스에 관한 정보를 주로 전송하는, 수신된 ICC 파라미터(320)를 프로세서(312)에 의해 제공함으로써, 좌측/우측 코히어런스 정보를 이용하여 채널 쌍(326a 및 326b)에 대한 개별적인 ICC 파라미터를 공 급하는 것이 바람직하다.
다음 단계에서, 프로세서(312)는 공간 파라미터를 적절히 공급하여, 채널(326a)로부터 단일 오디오 채널(324a 및 324b)을 재구성하고, 채널(326b)로부터 채널(324c 및 324d)을 재구성할 수도 있도록 한다. 이를 위해서는, 각각의 채널 쌍(326a 및 326b)이 중요한 좌측/우측 코히어런스 정보를 포함하므로, 프로세서(312)는 레벨 차이(316 및 318)를 공급하고, 프로세서(312)는 2개의 채널 쌍에 대한 ICC 값을 적절히 공급해야 한다.
일 실시예에서, 프로세서(312)는 결합한 ICC 값(320)을 단순히 제공하여, 채널 쌍(326a 및 326b)을 업-믹스할 수 있다. 다른 방법으로는, 수신된 결합한 ICC 값(320)을 가중하여, 2개의 채널 쌍에 대한 개별적인 ICC 값을 얻을 수 있는데, 가중값은, 예를 들어, 2개의 채널 쌍의 레벨 차이(314)에 기초한다.
본 발명의 바람직한 실시예에서, 프로세서는 모든 단일 업믹싱 단계에 수신된 ICC 파라미터(320)를 공급하여, 채널(324a 내지 324d)의 재생 동안 부가적인 구조의 도입을 회피하게 된다.
도 6은, 원래 5.1 오디오 신호의 콤팩트 파라메트릭 표현을 이용하여, 모노포닉 오디오 신호를 5.1 다중-채널 오디오 신호로 디코딩하는, 본 발명에 따른 계층형 디코딩 절차를 통합한 디코더의 바람직한 실시예를 나타낸다.
도 6은 변환 유닛(350), 파라미터 프로세싱 유닛(352), 5개의 1/2 디코더(354a 내지 354e) 및 3개의 역변환 유닛(356a 내지 356c)을 나타낸다.
도 6에 따른 본 발명의 디코더의 실시예는, 도 2에 설명된 인코더의 대응물 이고, 최종적으로 오디오 채널(360a(lf), 360b(lr), 360c(rf), 360d(rr), 360e(co) 및 360f(lfe))로 이루어진 5.1 오디오 신호로 업-믹싱되는, 모노포닉 다운믹스 오디오 채널(358)을 수신하도록 설계된다. 다운믹스 채널(358; m)은 변환 유닛(350)을 이용하여 그 주파수 표현(362)을 시간 영역에서 주파수 영역으로 수신하여 변환한다. 파라미터-프로세싱 유닛(352)은, 다운믹스 채널(358)과 동시에, 결합한, 공간 파라미터(364)의 콤팩트 세트를 수신한다.
계층형 디코딩 프로세스의 제1 단계(363)에서는, 모노포닉 다운믹스 채널(362)을 스테레오 마스터 채널(364; R)과 중심 마스터 채널(366; C)로 업-믹싱한다.
계층형 디코딩 프로세스의 제2 단계(368)에서는, 스테레오 마스터 채널(364)을 좌측 마스터 채널(370; L)과 우측 마스터 채널(372; R)로 업-믹싱한다.
디코딩 프로세스의 제3 단계에서는, 좌측 마스터 채널(370)을 좌측-정면 채널(374a)과 좌측-후면 채널(374b)로 업-믹싱하고, 우측 마스터 채널(372)을 우측-정면 채널(374c)과 우측-후면 채널(374d)로 업-믹싱하고, 중심 마스터 채널(366)을 중심 채널(374e)과 저주파수 채널(374f)로 업-믹싱한다.
최종적으로, 6개의 단일 오디오 채널(374a 내지 374f)을 역변환 유닛(356a 내지 356c)에 의해 시간 영역에서 그 표현으로 변환하여, 6개의 오디오 채널(360a 내지 360f)을 갖는, 재구성된 5.1 오디오 신호를 형성한다. 5.1 오디오 신호의 원래 공간 특성을 보유하기 위해서는, 특히, 파라미터 프로세싱 유닛이 개별적인 파라미터 세트(380a 내지 380e)를 제공하는 방법으로, 파라미터 프로세싱 유닛(352) 은, 특히, 파라미터 프로세싱 유닛(352)이 개별적인 파라미터 세트(380a 내지 380e)를 얻는 방법으로, 필수적이다.
수신된 결합한 ICC 파라미터는 원래 6개의 채널 오디오 신호의 중요한 좌측/우측 코히어런스를 기술한다. 따라서, 파라미터 프로세싱 유닛(352)이 파라미터 세트 4(380d)의 ICC 값을 형성하므로, 이는, 파라미터 세트(364) 내에서 전송되는, 원래 수신된 공간 값의 좌측/우측 상관 정보를 닮는다. 가장 단순한 구현에서는, 파라미터 프로세싱 유닛(352)이 수신된 결합한 ICC 파라미터를 단순히 이용한다.
도 7에는 본 발명의 디코더의 다른 바람직한 실시예가 도시되어 있고, 도 7의 디코더는 도 4의 인코더의 대응물이다.
도 7의 인코더가 도 6의 디코더의 같은 기능 블록을 포함하므로, 다음 설명은, 계층형 디코딩 프로세스가 도 6의 프로세스와 다른 단계에 한정된다. 이는, 주로, 원래 5.1 오디오 신호가 도 6에서 수신된 신호와 다르게 다운믹싱되었으므로, 모노포닉 신호(362)를 서로 다른 순서와 서로 다른 채널 결합으로 업-믹싱하기 때문이다.
계층형 디코딩 프로세스의 제1 단계(363)에서는, 모노포닉 신호(362)를 후면 마스터 채널(400; S)과 순수 정면 채널(402; CF)로 업-믹싱한다.
제2 단계(368)에서는, 순수 정면 채널(402)을 정면 마스터 채널(404)과 중심 마스터 채널(406)로 업-믹싱한다.
제3 단계(372)에서는, 정면 마스터 채널을 좌측-정면 채널(374a)과 우측-정면 채널(374c)로 업-믹싱하고, 중심 마스터 채널(406)을 중심 채널(374e)과 저주파 수 채널(374f)로 업-믹싱하고, 후면 마스터 채널(400)을 좌측-후면 채널(374b)과 후측-후면 채널(374d)로 업-믹싱한다. 최종적으로, 6개의 오디오 채널(374a 내지 374f)을 주파수 영역에서 그 시간-영역 표현(360a 내지 360f)으로 변환하여, 재구성된 5.1 오디오 신호를 형성한다.
인코더에 의해 보조 정보로서 코딩된, 원래 5.1 신호의 공간 특성을 보존하기 위해, 파라미터 프로세싱 유닛(352)은 파라미터 세트(410a 내지 410e)를 1/2 디코더(354a 내지 354e)에 공급한다. 제3 업-믹싱 프로세스(372)에서는, Lf, Rf, Lr 및 Rr 채널을 형성하는데 중요한 좌측/우측 상관 정보를 필요로 하므로, 파라미터-프로세싱 유닛(352)은, 파라미터 세트(410a 및 410c)를 형성하기 위해 전송된 ICC 파라미터를 단순히 취하는 가장 단순한 구현에 있어서, 파라미터 세트(410a 및 410c) 내의 적당한 ICC 값을 공급할 수도 있다. 가능한 다른 방법에 있어서, 수신된 ICC 파라미터는, 가중 함수를 수신된 ICC 파라미터에 적용함으로써 파라미터 세트(410a 및 410c)에 대한 개별적인 파라미터로 변환될 수 있는데, 그 가중값은, 예를 들어, 정면 마스터 채널(404)과 후면 마스터 채널(400)에서 전송된 에너지에 의존한다. 또한, 훨씬 더 복잡한 구현에 있어서, 파라미터-프로세싱 유닛(352)은 중심 채널 정보를 고려하여, 파라미터 세트 5와 파라미터 세트 4(410a 및 410b)에 개별적인 ICC 값을 공급할 수 있다.
도 8은, 인코더(220), 입력 인터페이스(502) 및 출력 인터페이스(504)를 갖고 있는 본 발명의 오디오 송신기 또는 레코더(500)를 나타낸다.
오디오 신호는 송신기/레코더(500)의 입력 인터페이스(502)에서 공급될 수 있다. 오디오 신호는 송신기/레코더 내에서 본 발명의 인코더(220)를 이용하여 인코딩되고, 인코딩된 표현은 송신기/레코더(500)의 출력 인터페이스(504)에서 출력된다. 그 다음에, 인코딩된 표현은 기억 매체 상에 전송되거나 기억될 수도 있다.
도 9는, 본 발명의 디코더(312), 비트 스트림 입력(522) 및 오디오 출력(524)를 갖는, 본 발명의 수신기 또는 오디오 재생기(520)를 나타낸다.
비트 스트림은 본 발명의 수신기/오디오 재생기(520)의 입력(522)에서 입력될 수 있다. 그 다음에, 비트 스트림은 디코더(312)를 이용하여 디코딩되고, 디코딩된 신호는 본 발명의 수신기/오디오 재생기(520)의 출력(524)에서 출력되거나 재생된다.
도 10은 본 발명의 송신기(500) 및 본 발명의 수신기(520)를 포함한 전송 시스템을 나타낸다.
송신기(500)의 입력 인터페이스(502)에서 입력된 오디오 신호를 인코딩하여, 송신기(500)의 출력(504)에서 수신기(520)의 입력(522)으로 전송한다. 수신기는 오디오 신호를 디코딩하고, 그 출력(524)에서 오디오 신호를 재생하거나 출력한다.
상술한 예의 본 발명의 디코더는 다중-채널 오디오 신호를 모노포닉 오디오 신호로 다운믹싱한다. 물론, 다른 방법으로서, 다중-채널 신호를, 예를 들어, 도 2 및 도 4에서 설명된 실시예를 의미하는, 스테레오포닉 신호로 다운믹싱하는 것도 가능하므로, 계층형 인코딩 프로세스에서 한 단계를 우회할 수 있다. 모든 다른 수의 결과로서 생기는 채널도 가능하다.
다수의 ICC 값을 하나의 단일 전송된 ICC 값으로 결합하여 보조 정보를 줄임 으로써, 오디오 신호의 공간 특성의 콤팩트 파라메트릭 표현을 제공/이용하여 다중-채널 오디오 정보를 계층형으로 인코딩 또는 디코딩하는 제안된 방법을 주로 설명하였다. 여기서, 상술한 본 발명은 단지 하나의 결합한 ICC 값의 이용에 결코 한정되지 않는다는 것에 주목해야 한다. 그 대신, 예를 들어, 2개의 결합한 값을 생성할 수 있는데, 그 하나는 중요한 좌측/우측 상관을 기술하고, 다른 하나는 정면/후면 상관을 기술한다.
유리하게도, 이는, 예를 들어, 도 2에 도시된 본 발명의 실시예에서 구현될 수 있는데, 한편으로는, 좌측 정면 채널(250a)과 좌측 후면 채널(250b)을 좌측 마스터 채널(254a)로 결합하고, 우측 정면 채널(250c)과 우측 후면 채널(250d)을 후면 마스터 채널(254b)로 결합한다. 따라서, 이들 2개의 인코딩 단계가 원래 오디오 신호의 정면/후면 상관에 관한 정보를 생성하므로, 정면/후면 상관 정보를 보유하는, 추가 ICC 값을 쉽게 처리하여 제공할 수 있다.
또한, 본 발명의 바람직한 실시예에서는, 종래 개별적으로 전송된 파라미터를 이용할 수도 있고, 인코더에서 디코더로 전송되는 신호 보조 정보에 의존하여, 결합한, 전송된 파라미터를 이용할 수도 있는, 인코딩/디코딩 프로세스를 갖는 것이 유리하다. 유리하게도, 상기 시스템은, (개별적으로 전송된 파라미터를 이용하여) 더 높은 표현 정확도와, 다른 방법으로는, (결합한 파라미터를 이용하여) 낮은 보조 정보 비트 전송률 모두를 달성할 수 있다.
통상, 상기 설정의 선택은, 이용된 전송 시스템에 의해 적응될 수 있는 보조 정보의 양과 같은, 응용 요구 조건에 의존하는 사용자에 의해 이루어진다. 이로 인해, 같이 통합된 인코더/디코더 구조를 이용하면서, 넓은 범위의 보조 정보 비트 전송률/정확도 트레이드-오프 내에서 동작할 수 있게 된다. 이는, 서로 다른 요구 조건과 전송 능력을 갖는 넓은 범위의 가능한 응용을 다루기 위해 중요한 능력이다.
또한, 상기 유리한 실시예의 다른 변형에서, 동작 모드의 선택은, 예를 들어, 결합한 전송 모드를 이용한 경우 이상적인 결과로부터 디코딩된 값의 편차를 분석하는, 인코더에 의해 자동으로 이루어질 수 있다. 어떤 중요한 편차가 발견되지 않으면, 결합한 파라미터 전송을 채용한다. 디코더는, 그 모드가 이용하기에 적당한 모드인, 제공된 보조 정보의 분석에 기초하여, 스스로 결정할 수도 있다. 예를 들어, 단지 하나의 공간 파라미터만이 제공된 경우, 디코더는, 결합한, 전송된 파라미터를 이용하여 디코딩 모드로 자동으로 전환된다.
본 발명의 다른 유리한 변형에서, 인코더/디코더는, 결합한, 전송된 파라미터를 이용하는 모드에서 개별적으로 전송된 파라미터를 이용하는 모드로 자동으로 전환되어, 오디오 재생 품질과 원하는 낮은 보조 정보 비트 전송률 간의 최상의 절충을 보장하게 된다.
도 2, 도 4, 도 6 및 도 7의 인코더/디코더의 상술한 바람직한 실시예에서 알 수 있는 바와 같이, 이들 유닛은 같은 기능 블록을 이용한다. 따라서, 다른 바람직한 실시예는 하나의 케이스 내에서 같은 하드웨어를 이용하여 인코더와 디코더를 형성한다.
본 발명의 다른 바람직한 실시예에서는, 서로 다른 채널을 채널 쌍으로서 함 께 그룹화함으로써 서로 다른 인코딩 방식 간에 동적으로 전환하는 것이 가능하므로, 소정의 다중-채널 오디오 신호에 대한 최상의 오디오 품질을 제공하는 인코딩 방식을 동적으로 이용하는 것이 가능하게 된다.
다중-채널 오디오 신호의 파라메트릭 표현을 따라 모노포닉 다운믹스 채널을 전송하는 것은 필요하지 않다. 또한, 파라메트릭 표현만을 전송하여, 예를 들어, 레코드와 같은, 다중-채널 오디오 신호의 모노포닉 다운믹스를 이미 소유하고 있는 청취자가, 그 현재 다중-채널 장비와 파라메트릭 보조 정보를 이용하여 다중-채널 신호를 재생할 수 있도록 하는 것도 가능하다.
요컨대, 본 발명은, 공지된 종래 파라미터로부터 이들 결합한 파라미터를 유리하게 결정하는 것을 허용한다. 계층형 인코더/디코더 구조에서 파라미터를 결합하는 본 발명의 개념을 적용하면, 다중-채널 오디오 신호를 모노-기반 파라메트릭 표현으로 다운믹싱할 수 있으므로, 낮은 보조 정보율(= 비트 전송률 감소)로 원래 신호의 정확한 파라미터화를 얻을 수 있다.
본 발명의 목적은, 인코더가 일정한 파라미터를 결합시켜, 전송되어야 하는 파라미터의 수를 줄이기 위한 것이다. 그 다음에, 디코더는, 예를 들어, 도 15에 도시된 것과 같은, 종래 시스템의 경우에서와 같이, 디폴트 파라미터 값을 이용하는 대신, 전송된 파라미터로부터 없어진 파라미터를 얻는다.
종래 기술, 즉, 도 15에 도시된 예를 이용하여 계층형 파라메트릭 다중-채널 오디오 코더의 실시예를 다시 검토하면, 상기 이점을 명확히 알 수 있다. 여기서, 입력 신호(각각, 좌측 정면, 우측 정면, 좌측 후면, 우측 후면, 중심 및 저주파수 향상 채널에 대응하는 Lf, Rf, Lr, Rr, C 및 LFE)를 주파수 영역으로 분할 및 변환하여, 필요한 시간/주파수 타이틀을 얻는다. 그 다음에, 결과로서 생기는 신호는 쌍단위 방식으로 결합한다. 예를 들어, 신호(Lf 및 Lr)를 결합시켜 신호 "L"을 형성한다. 대응하는 공간 파라미터 세트 1을 생성하여, (즉, IIDs, ICCs, IPDs 중 하나 이상으로 이루어진) 신호(Lf)와 신호(Lr) 간의 공간 특성을 모델링한다. 도 15에 도시된 종래 기술에 따른 실시예에서는, 단일 출력 채널(M)을 얻을 때까지 상기 프로세스를 반복하는데, 출력 채널은 5개의 파라미터 세트를 필요로 한다. 그러면, 종래 계층형 코딩 기술의 응용은 모든 파라미터 세트의 전송을 의미하게 된다.
그러나, 모든 파라미터 세트가 모든 가능한 공간 파라미터에 대한 값을 포함해야 하는 것은 아님에 주목해야 한다. 예를 들어, 도 15의 파라미터 세트 1은 IID와 ICC 파라미터로 이루어질 수도 있지만, 파라미터 세트 3은 IDD 파라미터만으로 이루어질 수도 있다. 일정한 파라미터가 특정 세트에 대해 전송되지 않으면, 종래 계층형 디코더는 이들 파라미터에 디폴트값을 적용하게 된다(예를 들어, ICC = + 1, IPD = 0 등). 이와 같이, 각각의 파라미터 세트는 특정 신호 결합만을 표현하고, 나머지 채널 쌍의 공간 특성을 기술하지 않는다.
원래 신호의 가장 중요한 공간 특성을 보존하도록, 인코더가 특정 파라미터를 결합하고 있는, 본 발명의 개념을 이용하여, 그 파라미터가 전송되지 않고 있는, 상기 신호의 공간 특성에 관한 지식의 손실을 회피할 수 있다.
예를 들어, ICC 파라미터를 단일 값으로 결합하는 경우, 모든 개별적인 파라 미터에 대한 대체물로서 결합한 파라미터를 디코더에서 이용할 수 있다(또는, 디코더에서 이용된 개별적인 파라미터를 전송된 파라미터로부터 얻을 수 있다). 디코더에 의한 재구성 후 원래 다중-채널 신호의 사운드 이미지를 가능한 한 가깝게 보존하도록, 인코더 파라미터 결합 프로세스를 실행하는 것은 중요한 특징이다. ICC 파라미터를 전송할 때, 이는, 원래 사운드 필드의 폭(역상관)을 보유해야 한다는 것을 의미한다.
여기서, 통상, 청취자가 청취 설정에서 전방을 향하고 있으므로, 가장 중요한 ICC 값이 좌측/우측 축 간에 존재한다는 것에 주목해야 한다. 이를 고려하여, 계층형 인코딩 구조를 형성할 수 있게 됨으로써, 반복적인 인코딩 프로세스 동안 오디오 신호의 적당한 파라메트릭 표현을 얻을 수 있는 것이 유리하고, 결과로서 생기는 결합한 ICC 값은 좌측/우측 표현을 주로 표현한다. 이는, 본 발명의 바람직한 실시예를 설명할 때, 나중에 더 상세히 설명된다.
본 발명의 인코딩/디코딩 방식은, 다음 2개의 수단에 의한 공간 오디오 시스템의 계층형 구조를 이용하여 인코더에서 디코더로 전송된 파라미터의 수를 줄이는 것을 허용한다.
ㆍ 개별적인 파라미터 대신 디코더에 전송되는, 결합한 파라미터로부터 개별적인 인코더 파라미터 결합. 파라미터의 결합은, (L/R 상관/코히어런스를 포함하는) 신호 사운드 이미지를 가능한 한 보존하도록, 실행된다.
ㆍ 전송된 결합한 파라미터는 여러 전송된 개별적인 파라미터 대신 디코더에서 이용된다(또는, 실제로 이용된 파라미터를 결합한 파라미터로부터 얻는다).
본 발명의 방법의 일정한 구현 요구 조건에 의존하여, 본 발명의 방법은 하드웨어나 소프트웨어로 구현될 수 있다. 본 발명의 구현은, 특히, 본 발명의 방법이 수행되도록 프로그램 가능 컴퓨터 시스템과 협조하는, 전자적으로 판독 가능한 제어 신호가 기억된 디스크, DVD 또는 CD와 같은, 디지털 기억 매체를 이용하여 수행될 수 있다. 따라서, 통상, 본 발명은, 프로그램 코드가 기계 판독 가능 반송파 상에 기억된 컴퓨터 프로그램 제품이고, 컴퓨터 프로그램 제품이 컴퓨터상에서 실행될 때, 프로그램 코드는 본 발명의 방법을 수행하도록 동작한다. 따라서, 즉, 본 발명의 방법은, 컴퓨터 프로그램이 컴퓨터상에서 실행될 때, 본 발명의 방법 중 적어도 하나를 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램이다.
이상, 본 발명의 특정 실시예를 참조하여 본 발명을 특별히 나타내고 설명하였지만, 당해 기술분야의 당업자는, 본 발명의 사상과 범위로부터 일탈함이 없이 본 발명의 형태와 상세에서 여러 다른 변형을 이룰 수도 있다는 것을 알 수 있다. 여러 변형은, 여기서 개시되고 다음 청구범위에 의해 포함되는 가장 넓은 개념으로부터 일탈함이 없이 서로 다른 실시예에 적응시킬 때 이루어질 수도 있음을 알 수 있다.

Claims (39)

  1. 청취 위치에 대하여 좌측에 적어도 2개의 원래 좌측 채널 및 우측에 적어도 2개의 원래 우측 채널을 갖는 오디오 신호의 파라메트릭 표현을 생성하기 위한 인코더로서,
    파라메트릭 정보를 생성하는 생성기로서, 상기 생성기는 여러 채널 쌍을 개별적으로 처리하여 그 처리된 채널 쌍들에 대한 레벨 정보를 얻고, 좌측의 정보만을 갖는 제1 채널 및 우측의 정보만을 갖는 제2 채널을 포함한 채널 쌍에 대한 코히어런스 정보를 얻도록 동작하는, 생성기; 및
    상기 채널 쌍들에 대한 레벨 정보를 선택하고, 상기 코히어런스 정보를 이용하여 좌측/우측 코히어런스 값을 결정하고, 상기 좌측/우측 코히어런스 값이 상기 파라메트릭 표현 내에서 상기 오디오 신호의 유일한 코히어런스 정보가 되도록 출력 데이터스트림에 도입함으로써, 상기 파라메트릭 표현을 제공하는 제공기;를 포함하는 인코더.
  2. 제1항에 있어서, 상기 생성기는,
    좌측-정면 채널(lf)과 좌측-후면 채널(lr)을 처리하여 lf/lr 레벨 정보를 얻고, 상기 좌측-정면 채널(lf)과 상기 좌측-후면 채널(lr)의 결합은 좌측 마스터 채널(LM)을 형성하고,
    우측-정면 채널(rf)과 우측-후면 채널(rr)을 처리하여 rf/rr(우측-정면 채널/우측-후면 채널) 레벨 정보를 얻고, 상기 우측-정면 채널(rf)과 상기 우측-후면 채널(rr)의 결합은 우측 마스터 채널(RM)을 형성하고,
    좌측 마스터 채널(LM)과 우측 마스터 채널(RM)을 처리하여 lm/rm(좌측 마스터 채널/우측 마스터 채널) 레벨 정보와 코히어런스 정보를 얻고, 상기 좌측 마스터 채널(LM)과 상기 우측 마스터 채널(RM)의 결합은 스테레오 마스터 채널(SM)을 형성하도록 동작하는 것인, 인코더.
  3. 제2항에 있어서, 상기 생성기는,
    중심 채널(ce)과 저주파수 채널(lo)을 처리하여 ce/lo(중심 채널/저파수 채널) 레벨 정보를 얻고, 상기 중심 채널(ce)과 상기 저주파수 채널(lo)의 결합은 중심 마스터 채널(CM)을 형성하도록 동작하는 것인, 인코더.
  4. 제3항에 있어서,
    상기 생성기는 상기 스테레오 마스터 채널(SM)과 상기 중심 마스터 채널(CM)을 처리하여 sm/cm(스테레오 마스터 채널/중심 마스터 채널) 레벨 정보를 얻도록 동작하는 것이고, 여기서 상기 스테레오 마스터 채널(SM)과 상기 중심 마스터 채널(CM)의 결합은 다운믹스 채널을 형성하고,
    상기 제공기는 상기 코히어런스 정보와 상기 sm/cm 레벨 정보를 이용하여 상기 좌측/우측 코히어런스 값을 결정하도록 동작하는 것인, 인코더.
  5. 제4항에 있어서,
    상기 제공기는, 상기 sm/cm 레벨 정보에 의존하는 상기 좌측/우측 코히어런스 값을 계산하도록 동작하는 것인데, 상기 sm/cm 레벨 정보가 상기 중심 마스터 채널(CM)에서보다 상기 스테레오 마스터 채널(SM)에서 더 많은 에너지가 존재하는 것을 나타내는 경우에는 상기 좌측/우측 코히어런스 값이 상기 코히어런스 정보에 더 가까워지도록 하고, 상기 sm/cm 레벨 정보가 중심 마스터 채널(CM)에서 더 많은 에너지가 존재하는 것으로 나타내는 경우에는 상기 좌측/우측 코히어런스 값이 "1"에 더 가까워지도록 동작하는 것인, 인코더.
  6. 제4항에 있어서,
    상기 제공기는, 상기 sm/cm 레벨 정보에 의존하는 상기 좌측/우측 코히어런스 값을 계산하도록 동작하는 것인데, 상기 sm/cm 레벨 정보가 상기 스테레오 마스터 채널(SM)에서의 에너지와 상기 중심 마스터 채널(CM)에서의 에너지의 비율이 소정의 값을 초과하는 것으로 나타내는 경우에는 상기 좌측/우측 코히어런스 값이 상기 코히어런스 정보로 설정되도록 하고,
    상기 스테레오 마스터 채널(SM)에서의 에너지와 상기 중심 마스터 채널(CM)에서의 에너지의 비율이 소정의 값보다 적거나 같은 경우에는 상기 좌측/우측 코히어런스 값을 "1"로 설정하도록 동작하는 것인, 인코더.
  7. 제1항에 있어서,
    상기 생성기는, 좌측-정면 채널(lf)과 우측-정면 채널(rf)을 처리하여 lf/rf 레벨 정보와 제1 코히어런스 정보를 얻도록 동작하고, 좌측-후면 채널(lr)과 우측-후면 채널(rr)을 처리하여 lr/rr 레벨 정보와 제2 코히어런스 정보를 얻도록, 동작하고,
    상기 좌측-정면 채널(lf)과 상기 우측-정면 채널(rf)의 결합은 정면 마스터 채널(FM)을 형성하고,
    상기 좌측-후면 채널(lr)과 상기 우측-후면 채널(rr)의 결합은 후면 마스터 채널(RM)을 형성하고,
    상기 제공기는 상기 제1 코히어런스 정보와 상기 제2 코히어런스 정보를 결합하여 좌측/우측 코히어런스 값을 결정하도록 동작하는 것인, 인코더.
  8. 제7항에 있어서,
    상기 제공기는, 상기 정면 마스터 채널(FM)의 레벨 정보와 상기 후면 마스터 채널(RM)의 레벨 정보를 가중값으로서 이용하여, 상기 제1 및 제2 코히어런스 정보의 가중된 합에 기초하여 상기 좌측/우측 코히어런스 값을 결정하도록 동작하는 것인, 인코더.
  9. 제7항에 있어서,
    상기 생성기는 중심 채널(ce)과 저주파수 채널(lo)을 처리하여 ce/lo 레벨 정보를 얻도록 동작하고,
    상기 중심 채널(ce)과 상기 저주파수 채널(lo)의 결합은 중심 마스터 채널(CM)을 형성하는 것인, 인코더.
  10. 제9항에 있어서,
    상기 생성기는 상기 정면 마스터 채널(FM)과 상기 중심 마스터 채널(CM)을 처리하여 fm/cm(정면 마스터 채널/중심 마스터 채널) 레벨 정보를 얻도록 동작하고,
    상기 정면 마스터 채널(FM)과 상기 중심 마스터 채널(CM)의 결합은 순수 정면 채널(PF)을 형성하고,
    상기 제공기는, 상기 제1 및 제2 코히어런스 정보를 결합하고 상기 fm/cm 레벨 정보를 추가로 이용하여, 상기 좌측/우측 코히어런스 값을 결정하도록 동작하는 것인, 인코더.
  11. 제10항에 있어서,
    상기 생성기는 상기 순수 정면 채널(PF)과 상기 후면 마스터 채널(RM)을 처리하여 pf/rm(순수 정면 채널/후면 마스터 채널) 레벨 정보를 얻도록 동작하고,
    상기 순수 정면 채널(PF)과 상기 후면 마스터 채널(RM)의 결합은 다운믹스 채널을 형성하는 것인, 인코더.
  12. 제1항에 있어서,
    상기 생성기는 소정 길이의 이산 시간 프레임들내에 상기 채널 쌍들을 처리하도록 동작하는 것인, 인코더.
  13. 제1항에 있어서,
    상기 생성기는 소정 대역폭의 이산 주파수 간격들내에 상기 채널 쌍들을 처리하도록 동작하는 것인, 인코더.
  14. 청취 위치에 대하여 좌측에 적어도 2개의 원래 좌측 채널 및 우측에 적어도 2개의 원래 우측 채널을 갖는 원래 오디오 신호의 파라메트릭 표현을 처리하기 위한 디코더로서,
    오디오 신호의 파라메트릭 표현을 제공하는 수신기로서, 상기 수신기는 채널 쌍들에 대한 레벨 정보를 제공하고, 그리고 좌측 채널 및 우측 채널을 포함한 채널 쌍에 대한 좌측/우측 코히어런스 값을 상기 파라메트릭 표현 내에서 상기 원래 오디오 신호의 코히어런스 정보로 제공하도록 동작하고, 상기 좌측/우측 코히어런스 값은 상기 좌측의 정보만을 갖는 제1 채널 및 우측의 정보만을 갖는 제2 채널을 포함한 적어도 하나의 채널 쌍 간의 코히어런스 정보를 표현하는, 수신기와; 그리고
    상기 채널 쌍에 대한 파라메트릭 정보를 공급하는 프로세서로서, 상기 프로세서는 상기 파라메트릭 표현으로부터 레벨 정보를 선택하고, 상기 좌측/우측 코히어런스 값을 이용하여 적어도 하나의 채널 쌍에 대한 코히어런스 정보를 얻고, 상기 적어도 하나의 채널 쌍은 상기 좌측의 정보만을 갖는 제1 채널 및 상기 우측의 정보만을 갖는 제2 채널을 포함하는 것인 프로세서;를 포함하는 디코더.
  15. 제14항에 있어서,
    상기 수신기는,
    원래 좌측-정면 채널(lf)과 원래 좌측-후면 채널(lr)의 채널 쌍에 대한 lf/lr(좌측-정면 채널/좌측-후면 채널) 레벨 정보를 제공하고, 상기 원래 좌측-정면 채널(lf)과 상기 원래 좌측-후면 채널의 결합은 좌측 마스터 채널(LM)을 형성하고,
    원래 우측-정면 채널(rf)과 원래 우측-후면 채널(rr)의 채널 쌍에 대한 rf/rr(우측-정면 채널/우측-후면 채널) 레벨 정보를 제공하고, 상기 원래 우측-정면 채널(rf)과 상기 원래 우측-후면 채널의 결합은 우측 마스터 채널(RM)을 형성하고,
    좌측 마스터 채널(LM)과 우측 마스터 채널(RM)의 채널 쌍에 대한 lm/rm(좌측 마스터 채널/우측 마스터 채널) 레벨 정보를 제공하도록 동작하고, 상기 좌측 마스터 채널(LM)과 상기 우측 마스터 채널(RM)의 결합은 스테레오 마스터 채널(SM)을 형성하고, 그리고
    상기 프로세서는 상기 좌측/우측 코히어런스 값을 이용하여 상기 좌측 마스터 채널(LM)과 상기 우측 마스터 채널(RM)에 대한 코히어런스 정보를 제공하도록 동작하고,
    상기 디코더는 업믹서를 추가로 포함하는데, 이 업믹서는:
    상기 lm/rm 레벨 정보와 상기 좌측/우측 코히어런스 값을 이용하여 상기 스테레오 마스터 채널(SM)로부터 상기 좌측 마스터 채널(LM)과 상기 우측 마스터 채널(RM)의 생성하는 제1 1/2(1-to-2) 업믹서와;
    상기 lf/lr 레벨 정보와 미리 정의된 코히어런스 정보를 이용하여 상기 좌측 마스터 채널(LM)로부터 상기 원래 좌측-정면 채널(lf)과 상기 원래 좌측-후면 채널(lr)의 생성하는 제2 1/2 업믹서; 및
    상기 rf/rr 정보와 미리 정의된 코히어런스 정보를 이용하여 상기 우측 마스터 채널(RM)로부터 상기 원래 우측-정면(rf) 채널과 상기 원래 우측-후면 채널(rr)의 생성하는 제3 1/2 업믹서;로 이루어진 것인 디코더.
  16. 제15항에 있어서,
    상기 수신기는 원래 중심 채널(ce)과 원래 저주파수 채널(lo)의 채널 쌍에 대한 ce/lo 레벨 정보를 제공하도록 동작하고, 상기 원래 중심 채널(ce)과 상기 원래 저주파수 채널(lo)의 결합은 중심 마스터 채널(CM)을 형성하고,
    상기 업믹서는 상기 ce/lo 레벨 정보와 미리 정의된 코히어런스 정보를 이용하여 상기 중심 마스터 채널(CM)로부터 상기 원래 중심 채널(ce)과 상기 원래 저주파수 채널(lo)의 생성하는 제4 1/2 업믹서를 더 포함하는, 디코더.
  17. 제16항에 있어서,
    상기 수신기는 상기 스테레오 마스터 채널(SM)과 상기 중심 마스터 채널(CM)의 채널 쌍에 대한 sm/cm(스테레오 마스터 채널/중심 마스터 채널) 레벨 정보를 제공하도록 동작하고,
    상기 스테레오 마스터 채널(SM)과 상기 중심 마스터 채널(CM)의 결합은 다운믹스 채널을 형성하고,
    상기 업믹서는 상기 sm/cm 레벨 정보와 미리 정의된 코히어런스 정보를 이용하여 상기 다운믹스 채널로부터 상기 스테레오 마스터 채널(SM)과 상기 중심 마스터 채널(CM)의 생성하는 제5 1/2 업믹서를 더 포함하는 것인, 디코더.
  18. 제14항에 있어서,
    상기 수신기는,
    원래 좌측-정면 채널(lf)과 원래 우측-정면 채널(rf)의 채널 쌍에 대한 lf/rf 레벨 정보를 제공하고, 상기 원래 좌측-정면 채널(lf)과 상기 원래 우측-정면 채널(rf)의 결합은 정면 마스터 채널(FM)을 형성하고,
    원래 좌측-후면 채널(lr)과 원래 우측-후면 채널(rr)의 채널 쌍에 대한 lr/rr 레벨 정보를 제공하도록 동작하고, 상기 원래 좌측-후면 채널(lr)과 상기 원래 우측-후면 채널(rr)의 결합은 후면 마스터 채널(RM)을 형성하고,
    상기 프로세서는, 상기 좌측/우측 코히어런스 값을 이용하여, 상기 원래 좌측-정면 채널(lf)과 상기 원래 우측-정면 채널(rf)에 대한 제1 코히어런스 정보를 공급하고, 상기 원래 좌측-후면 채널(lr)과 상기 원래 우측-후면 채널(rr)에 대한 제2 코히어런스 정보를 공급하도록 동작하고,
    상기 디코더는,
    상기 lf/rf 레벨 정보와 상기 좌측/우측 코히어런스 값을 이용하여 상기 정면 마스터 채널(FM)로부터 상기 원래 좌측-정면 채널(lf)과 상기 원래 우측-정면 채널(rf)의 생성하는 제1 1/2 업믹서; 및
    상기 lr/rr 레벨 정보와 상기 좌측/우측 코히어런스 값을 이용하여 상기 원래 좌측-후면 채널(lr)과 상기 원래 우측-후면 채널(rr)의 생성하는 제2 1/2 업믹서;로 이루어진 업믹서를 더 포함하는 디코더.
  19. 제18항에 있어서,
    상기 수신기는 원래 중심 채널(ce)과 원래 저주파수 채널(lo)의 채널 쌍에 대한 ce/lo 레벨 정보를 제공하도록 동작하고, 상기 원래 중심 채널(ce)과 상기 원래 저주파수 채널(lo)의 결합은 중심 마스터 채널(CM)을 형성하고,
    상기 업믹서는 상기 ce/lo 레벨 정보와 미리 정의된 코히어런스 정보를 이용하여 상기 중심 마스터 채널(CM)로부터 상기 원래 중심 채널(co)과 상기 원래 저주파수 채널(lo)의 생성하는 제3 1/2 업믹서를 더 포함하는 디코더.
  20. 제19항에 있어서,
    상기 수신기는 상기 정면 마스터 채널(FM)과 상기 중심 마스터 채널(CM)의 채널 쌍에 대한 fm/cm(정면 마스터 채널/중심 마스터 채널) 레벨 정보를 제공하도록 동작하고, 상기 정면 마스터 채널(FM)과 상기 중심 마스터 채널(CM)의 결합은 순수 정면 채널(PF)을 형성하고,
    상기 업믹서는 상기 fm/cm 레벨 정보와 미리 정의된 코히어런스 정보를 이용하여 상기 순수 정면 채널(PF)로부터 상기 정면 마스터 채널(FM)과 상기 중심 마스터 채널(CM)의 생성하는 제4 1/2 업믹서를 더 포함하는 디코더.
  21. 제20항에 있어서,
    상기 수신기는 상기 정면 순수 채널(PF)과 상기 후면 마스터 채널(RM)의 채널 쌍에 대한 pf/rm(순수 정면 채널/후면 마스터 채널) 레벨 정보를 제공하도록 동작하고, 상기 순수 정면 채널(PF)과 상기 후면 마스터 채널(RM)의 결합은 다운믹스 채널을 형성하고,
    상기 업믹서는 상기 pf/rm 레벨 정보와 미리 정의된 코히어런스 정보를 이용하여 상기 다운믹스 채널로부터 상기 순수 정면 채널(PF)과 상기 후면 마스터 채널(RM)의 생성하는 제5 1/2 업믹서를 더 포함하는 디코더.
  22. 제14항에 있어서,
    상기 프로세서는 상기 수신된 좌측/우측 코히어런스를 코히어런스 값으로서 분배함으로써 모든 채널 쌍에 대한 코히어런스 값들을 얻도록 동작하는 것인 디코더.
  23. 제14항에 있어서,
    상기 수신기는,
    제1 모드에서, 채널 쌍들에 대한 레벨 정보와 좌측 채널 및 우측 채널을 포함한 채널 쌍에 대한 좌측/우측 코히어런스 값을 상기 파라메트릭 표현 내에서 상기 오디오 신호의 코히어런스 정보로 제공하도록 동작하고, 상기 좌측/우측 코히어런스 값은 청취 위치에 대하여 상기 좌측의 정보만을 갖는 제1 채널 및 상기 우측의 정보만을 갖는 제2 채널을 포함한 적어도 하나의 채널 쌍 간의 코히어런스 정보를 표현하거나, 또는
    제2 모드에서, 채널 쌍에 대한 상기 레벨 정보와 상기 동일한 채널 쌍들에 대한 상기 코히어런스 정보를 제공하도록 동작하고,
    상기 프로세서는,
    채널 쌍에 대한 파라메트릭 정보를 공급하도록 동작하되,
    상기 제1 모드에서, 상기 프로세서는, 상기 파라메트릭 표현으로부터 상기 레벨 정보를 선택하고, 상기 좌측/우측 코히어런스 값을 이용하여 적어도 하나의 채널 쌍에 대한 상기 코히어런스 정보를 얻고, 상기 적어도 하나의 채널 쌍은 상기 좌측의 정보만을 갖는 제1 채널 및 상기 우측의 정보만을 갖는 제2 채널을 포함하고,
    상기 제2 모드에서, 상기 프로세서는, 상기 파라메트릭 표현으로부터 상기 레벨 정보를 선택하고 상기 파라메트릭 표현으로부터 상기 코히어런스 정보를 선택하도록 동작하는 것인, 디코더.
  24. 제23항에 있어서,
    상기 수신기는 수신된 모드 정보를 이용하여 동작 모드를 선택하기 위한 모드 수신기를 더 포함하고, 상기 모드 정보는 이용될 상기 제1 모드 또는 상기 제2 모드를 지시하는 것인, 디코더.
  25. 청취 위치에 대하여 적어도 2개의 원래 좌측 채널 및 적어도 2개의 원래 우측 채널을 갖는 오디오 신호의 파라메트릭 표현을 생성하기 위한 방법으로서,
    여러 채널 쌍을 개별적으로 처리하여 그 처리된 채널 쌍들에 대한 레벨 정보를 얻고, 상기 좌측의 정보만을 갖는 제1 채널 및 상기 우측의 정보만을 갖는 제2 채널을 포함한 채널 쌍에 대한 코히어런스 정보를 얻음으로써, 파라메트릭 정보를 생성하는 단계; 및
    채널 쌍들에 대한 레벨 정보를 선택하고, 코히어런스 정보를 이용하여 좌측/우측 코히어런스 값을 결정하고, 상기 좌측/우측 코히어런스 값을 상기 파라메트릭 표현 내에서 상기 오디오 신호의 코히어런스 정보가 되도록 출력 데이터스트림에 도입함으로써, 상기 파라메트릭 표현을 제공하는 단계를 포함하는 방법.
  26. 청취 위치에 대하여 좌측에 적어도 2개의 원래 좌측 채널 및 우측에 적어도 2개의 원래 우측 채널을 갖는 오디오 신호의 파라메트릭 표현을 생성하기 위한 방법으로서,
    채널 쌍에 대한 레벨 정보를 제공하고, 좌측 채널 및 우측 채널을 포함한 채널 쌍에 대한 좌측/우측 코히어런스 값으로서 상기 좌측의 정보만을 갖는 제1 채널 및 상기 우측의 정보만을 갖는 제2 채널을 포함한 적어도 하나의 채널 쌍 간의 코히어런스 정보를 표현하는 상기 좌측/우측 코히어런스 값을 상기 파라메트릭 표현 내에서 상기 원래 오디오 신호의 코히어런스 정보가 되도록 제공함으로써 오디오 신호의 파라메트릭 표현을 제공하는 단계; 및
    상기 파라메트릭 표현으로부터 레벨 정보를 선택하고, 상기 좌측/우측 코히어런스 값을 이용하여 상기 좌측의 정보만을 갖는 제1 채널 및 상기 우측의 정보만을 갖는 제2 채널을 포함한 적어도 하나의 채널 쌍에 대한 코히어런스 정보를 얻음으로써, 채널 쌍에 대한 파라메트릭 정보를 공급하는 단계;를 포함하는 방법.
  27. 보조 정보를 갖는 인코딩된 오디오 데이터가 저장된 데이터 저장매체로서,
    상기 보조 정보는, 청취 위치에 대하여 좌측에 적어도 2개의 원래 좌측 채널 및 우측에 적어도 2개의 원래 우측 채널을 갖는 오디오 신호의 파라메트릭 표현을 포함하고,
    상기 파라메트릭 표현은, 채널 쌍에 대한 레벨 차이와, 그리고 좌측의 정보만을 갖는 제1 채널 및 우측의 정보만을 갖는 제2 채널을 포함하는 채널 쌍의 코히어런스 정보에서 얻은 좌측/우측 코히어런스 값을 상기 파라메트릭 표현 내에서 상기 원래 오디오 신호의 코히어런스 정보로서 포함하는, 인코딩된 오디오 데이터가 저장된 데이터 저장매체.
  28. 보조 정보를 갖는 인코딩된 오디오 데이터를 저장하고 있는 컴퓨터 판독가능 기억 매체로서,
    상기 보조 정보는, 청취 위치에 대하여 좌측에 적어도 2개의 원래 좌측 채널 및 우측에 적어도 2개의 원래 우측 채널을 갖는 오디오 신호의 파라메트릭 표현을 포함하고,
    상기 파라메트릭 표현은, 채널 쌍에 대한 레벨 차이 및 좌측의 정보만을 갖는 제1 채널 및 우측의 정보만을 갖는 제2 채널을 포함한 채널 쌍의 코히어런스 정보에서 얻은 좌측/우측 코히어런스 값을 상기 파라메트릭 표현 내에서 상기 원래 오디오 신호의 코히어런스 정보로서 포함하는 것인, 컴퓨터 판독가능 기억 매체.
  29. 청취 위치에 대하여 좌측에 적어도 2개의 원래 좌측 채널 및 우측에 적어도 2개의 원래 우측 채널을 갖는 원래 오디오 신호의 파라메트릭 표현을 처리하기 위한 디코더를 갖는 수신기로서,
    오디오 신호의 파라메트릭 표현을 제공하고, 채널 쌍들에 대한 레벨 정보를 제공하고, 상기 좌측 채널 및 상기 우측 채널을 포함한 채널 쌍에 대한 좌측/우측 코히어런스 값을 상기 파라메트릭 표현 내에서 상기 원래 오디오 신호의 코히어런스 정보로 제공하도록 동작하는 수신기로서, 상기 좌측/우측 코히어런스 값은 좌측의 정보만을 갖는 제1 채널 및 우측의 정보만을 갖는 제2 채널을 포함한 적어도 하나의 채널 쌍 간의 코히어런스 정보를 표현하는, 수신기; 및
    채널 쌍에 대한 파라메트릭 정보를 공급하는 프로세서로서, 상기 프로세서는 상기 파라메트릭 표현으로부터 레벨 정보를 선택하고, 상기 좌측/우측 코히어런스 값을 이용하여 적어도 하나의 채널 쌍에 대한 코히어런스 정보를 얻고, 상기 적어도 하나의 채널 쌍은 좌측의 정보만을 갖는 제1 채널 및 우측의 정보만을 갖는 제2 채널을 포함하는, 프로세서;를 포함한 수신기.
  30. 청취 위치에 대하여 좌측에 적어도 2개의 원래 좌측 채널 및 우측에 적어도 2개의 원래 우측 채널을 갖는 오디오 신호의 파라메트릭 표현을 생성하기 위한 인코더를 갖는 송신기로서,
    상기 파라메트릭 정보를 생성하는 생성기로서, 상기 생성기는 여러 채널 쌍을 개별적으로 처리하여 그 처리된 채널 쌍들에 대한 레벨 정보를 얻고, 좌측의 정보만을 갖는 제1 채널 및 우측의 정보만을 갖는 제2 채널을 포함한 채널 쌍에 대한 코히어런스 정보를 얻도록 동작하는, 생성기; 및
    상기 채널 쌍들에 대한 레벨 정보를 선택하고, 상기 코히어런스 정보를 이용하여 좌측/우측 코히어런스 값을 결정하고, 상기 좌측/우측 코히어런스 값을 상기 파라메트릭 표현 내에서 상기 오디오 신호의 코히어런스 정보가 되도록 출력 데이터스트림에 도입함으로써, 상기 파라메트릭 표현을 제공하는 제공기;를 포함한, 송신기.
  31. 청취 위치에 대하여 좌측에 적어도 2개의 원래 좌측 채널 및 우측에 적어도 2개의 원래 우측 채널을 갖는 원래 오디오 신호의 파라메트릭 표현을 처리하기 위한 방법을 갖는, 수신 방법으로서,
    채널 쌍에 대한 레벨 정보를 제공하고, 좌측 채널 및 우측 채널을 포함한 채널 쌍에 대한 좌측/우측 코히어런스 값으로서 상기 좌측의 정보만을 갖는 제1 채널 및 상기 우측의 정보만을 갖는 제2 채널을 포함한 적어도 하나의 채널 쌍 간의 코히어런스 정보를 표현하는 상기 좌측/우측 코히어런스 값을 상기 파라메트릭 표현 내에서 상기 원래 오디오 신호의 코히어런스 정보가 되도록 제공함으로써, 상기 오디오 신호의 상기 파라메트릭 표현을 제공하는 단계; 및
    상기 파라메트릭 표현으로부터 레벨 정보를 선택하고, 상기 좌측/우측 코히어런스 값을 이용하여 상기 좌측의 정보만을 갖는 제1 채널 및 상기 우측의 정보만을 갖는 제2 채널을 포함한 적어도 하나의 채널 쌍에 대한 코히어런스 정보를 얻음으로써, 채널 쌍에 대한 파라메트릭 정보를 공급하는 단계;를 포함하는 수신 방법.
  32. 청취 위치에 대하여 적어도 2개의 원래 좌측 채널 및 적어도 2개의 원래 우측 채널을 갖는, 오디오 신호의 파라메트릭 표현을 생성하기 위한 방법을 갖는, 전송 및 오디오 기록을 하는 방법으로서,
    여러 채널 쌍을 개별적으로 처리하여 그 처리된 채널 쌍들에 대한 레벨 정보를 얻고, 상기 좌측의 정보만을 갖는 제1 채널 및 상기 우측의 정보만을 갖는 제2 채널을 포함한 채널 쌍에 대한 코히어런스 정보를 얻음으로써, 파라메트릭 정보를 생성하는 단계; 및
    채널 쌍들에 대한 레벨 정보를 선택하고, 상기 코히어런스 정보를 이용하여 좌측/우측 코히어런스 값을 결정하고, 상기 좌측/우측 코히어런스 값을 상기 파라메트릭 표현 내에서 상기 원래 오디오 신호의 코히어런스 정보가 되도록 출력 데이터스트림에 도입함으로써, 상기 파라메트릭 표현을 제공하는 단계;를 포함하는 방법.
  33. 송신기와 수신기를 가진 전송시스템으로서,
    상기 송신기는 청취 위치에 대하여 좌측에 적어도 2개의 원래 좌측 채널 및 우측에 적어도 2개의 원래 우측 채널을 갖는 오디오 신호의 파라메트릭 표현을 생성하기 위한 인코더를 가지며, 상기 인코더는:
    파라메트릭 정보를 생성하는 생성기로서, 여러 채널 쌍을 개별적으로 처리하여 그 처리된 채널 쌍들에 대한 레벨 정보를 얻고, 상기 좌측의 정보만을 갖는 제1 채널 및 상기 우측의 정보만을 갖는 제2 채널을 포함한 채널 쌍에 대한 코히어런스 정보를 얻도록 동작하는, 생성기; 및
    채널 쌍들에 대한 레벨 정보를 선택하고, 코히어런스 정보를 이용하여 좌측/우측 코히어런스 값을 결정하고, 상기 좌측/우측 코히어런스 값을 상기 파라메트릭 표현 내에서 상기 원래 오디오 신호의 코히어런스 정보가 되도록 출력 데이터스트림에 도입함으로써, 상기 파라메트릭 표현을 제공하는 제공기;를 포함하고,
    상기 수신기는 청취 위치에 대하여 좌측에 적어도 2개의 원래 좌측 채널 및 우측에 적어도 2개의 원래 우측 채널을 갖는 원래 오디오 신호의 파라메트릭 표현을 처리하기 위한 디코더를 가지며, 상기 디코더는:
    상기 오디오 신호의 파라메트릭 표현을 제공하는 수신기로서, 상기 수신기는 채널 쌍들에 대한 레벨 정보를 제공하고, 좌측 채널 및 우측 채널을 포함한 채널 쌍에 대한 좌측/우측 코히어런스 값을 상기 파라메트릭 표현 내에서 상기 원래 오디오 신호의 상기 코히어런스 정보로 제공하도록 동작하고, 상기 좌측/우측 코히어런스 값은 상기 좌측의 정보만을 갖는 제1 채널 및 상기 우측의 정보만을 갖는 제2 채널을 포함한 적어도 하나의 채널 쌍 간의 코히어런스 정보를 표현하는, 수신기; 및
    상기 채널 쌍에 대한 파라메트릭 정보를 공급하는 프로세서로서, 상기 프로세서는 상기 파라메트릭 표현으로부터 레벨 정보를 선택하고, 상기 좌측/우측 코히어런스 값을 이용하여 적어도 하나의 채널 쌍에 대한 코히어런스 정보를 얻고, 상기 적어도 하나의 채널 쌍은 상기 좌측의 정보만을 갖는 제1 채널 및 상기 우측의 정보만을 갖는 제2 채널을 포함하는, 프로세서를 포함하는 것인, 전송 시스템.
  34. 전송 및 수신 방법으로서,
    상기 전송 방법은 청취 위치에 대하여 적어도 2개의 원래 좌측 채널 및 적어도 2개의 원래 우측 채널을 갖는 오디오 신호의 파라메트릭 표현을 생성하기 위한 방법을 기지며, 상기 전송 방법은:
    여러 채널 쌍을 개별적으로 처리하여 그 처리된 채널 쌍들에 대한 레벨 정보를 얻고, 좌측의 정보만을 갖는 제1 채널 및 우측의 정보만을 갖는 제2 채널을 포함한 채널 쌍에 대한 코히어런스 정보를 얻음으로써, 파라메트릭 정보를 생성하는 단계; 및
    채널 쌍에 대한 레벨 정보를 선택하고, 코히어런스 정보를 이용하여 좌측/우측 코히어런스 값을 결정하고, 상기 좌측/우측 코히어런스 값을 상기 파라메트릭 표현 내에서 상기 원래 오디오 신호의 코히어런스 정보가 되도록 출력 데이터스트림에 도입함으로써, 상기 파라메트릭 표현을 제공하는 단계;를 포함하고,
    상기 수신 방법은, 청취 위치에 대하여 좌측에 적어도 2개의 원래 좌측 채널 및 우측에 적어도 2개의 원래 우측 채널을 갖는 원래 오디오 신호의 파라메트릭 표현을 처리하기 위한 방법을 가지며, 상기 수신 방법은:
    채널 쌍에 대한 레벨 정보를 제공하고, 좌측 채널 및 우측 채널을 포함한 채널 쌍에 대한 좌측/우측 코히어런스 값으로서 좌측의 정보만을 갖는 제1 채널 및 우측의 정보만을 갖는 제2 채널을 포함한 적어도 하나의 채널 쌍 간의 코히어런스 정보를 표현한 상기 좌측/우측 코히어런스 값을 상기 파라메트릭 표현 내에 상기 원래 오디오 신호의 코히어런스 정보가 되도록 제공함으로써, 상기 오디오 신호의 상기 파라메트릭 표현을 제공하는 단계; 및
    상기 파라메트릭 표현으로부터 레벨 정보를 선택하고, 좌측/우측 코히어런스 값을 이용하여 좌측의 정보만을 갖는 제1 채널 및 우측의 정보만을 갖는 제2 채널을 포함한 적어도 하나의 채널 쌍에 대한 코히어런스 정보를 얻음으로써, 상기 채널 쌍에 대한 파라메트릭 정보를 공급하는 단계;를 포함하는 것인, 전송 및 수신 방법.
  35. 컴퓨터상에서 실행시, 제25항, 제26항, 제31항, 제32항 및 제34항 중 어느 한 항의 방법을 수행하기 위한 프로그램 코드를 갖는 컴퓨터.
  36. 청취 위치에 대하여 좌측에 적어도 2개의 원래 좌측 채널 및 우측에 적어도 2개의 원래 우측 채널을 갖는 원래 오디오 신호의 파라메트릭 표현을 처리하기 위한 디코더를 갖는 오디오 재생기로서,
    오디오 신호의 파라메트릭 표현을 제공하고, 채널 쌍들에 대한 레벨 정보를 제공하고, 상기 좌측 채널 및 상기 우측 채널을 포함한 채널 쌍에 대한 좌측/우측 코히어런스 값을 상기 파라메트릭 표현 내에서 상기 원래 오디오 신호의 코히어런스 정보로 제공하도록 동작하는 수신기로서, 상기 좌측/우측 코히어런스 값은 좌측의 정보만을 갖는 제1 채널 및 우측의 정보만을 갖는 제2 채널을 포함한 적어도 하나의 채널 쌍 간의 코히어런스 정보를 표현하는, 수신기; 및
    채널 쌍에 대한 파라메트릭 정보를 공급하는 프로세서로서, 상기 프로세서는 상기 파라메트릭 표현으로부터 레벨 정보를 선택하고, 상기 좌측/우측 코히어런스 값을 이용하여 적어도 하나의 채널 쌍에 대한 코히어런스 정보를 얻고, 상기 적어도 하나의 채널 쌍은 좌측의 정보만을 갖는 제1 채널 및 우측의 정보만을 갖는 제2 채널을 포함하는, 프로세서;를 포함한 오디오 재생기.
  37. 청취 위치에 대하여 좌측에 적어도 2개의 원래 좌측 채널 및 우측에 적어도 2개의 원래 우측 채널을 갖는 오디오 신호의 파라메트릭 표현을 생성하기 위한 인코더를 갖는 오디오 레코더로서,
    상기 파라메트릭 정보를 생성하는 생성기로서, 상기 생성기는 여러 채널 쌍을 개별적으로 처리하여 그 처리된 채널 쌍들에 대한 레벨 정보를 얻고, 좌측의 정보만을 갖는 제1 채널 및 우측의 정보만을 갖는 제2 채널을 포함한 채널 쌍에 대한 코히어런스 정보를 얻도록 동작하는, 생성기; 및
    상기 채널 쌍들에 대한 레벨 정보를 선택하고, 상기 코히어런스 정보를 이용하여 좌측/우측 코히어런스 값을 결정하고, 상기 좌측/우측 코히어런스 값을 상기 파라메트릭 표현 내에서 상기 오디오 신호의 코히어런스 정보가 되도록 출력 데이터스트림에 도입함으로써, 상기 파라메트릭 표현을 제공하는 제공기;를 포함한, 오디오 레코더.
  38. 청취 위치에 대하여 좌측에 적어도 2개의 원래 좌측 채널 및 우측에 적어도 2개의 원래 우측 채널을 갖는 원래 오디오 신호의 파라메트릭 표현을 처리하기 위한 방법을 갖는, 오디오 재생을 하는 방법으로서,
    채널 쌍에 대한 레벨 정보를 제공하고, 좌측 채널 및 우측 채널을 포함한 채널 쌍에 대한 좌측/우측 코히어런스 값으로서 상기 좌측의 정보만을 갖는 제1 채널 및 상기 우측의 정보만을 갖는 제2 채널을 포함한 적어도 하나의 채널 쌍 간의 코히어런스 정보를 표현하는 상기 좌측/우측 코히어런스 값을 상기 파라메트릭 표현 내에서 상기 원래 오디오 신호의 코히어런스 정보가 되도록 제공함으로써, 상기 오디오 신호의 상기 파라메트릭 표현을 제공하는 단계; 및
    상기 파라메트릭 표현으로부터 레벨 정보를 선택하고, 상기 좌측/우측 코히어런스 값을 이용하여 상기 좌측의 정보만을 갖는 제1 채널 및 상기 우측의 정보만을 갖는 제2 채널을 포함한 적어도 하나의 채널 쌍에 대한 코히어런스 정보를 얻음으로써, 채널 쌍에 대한 파라메트릭 정보를 공급하는 단계;를 포함하는 오디오를 재생하는 방법.
  39. 삭제
KR1020077002055A 2005-04-15 2006-02-01 콤팩트 보조 정보를 이용한 다중-채널 계층형 오디오 코딩 KR100878367B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US67154405P 2005-04-15 2005-04-15
US60/671,544 2005-04-15
US11/314,711 US7961890B2 (en) 2005-04-15 2005-12-21 Multi-channel hierarchical audio coding with compact side information
US11/314,711 2005-12-21

Publications (2)

Publication Number Publication Date
KR20070088461A KR20070088461A (ko) 2007-08-29
KR100878367B1 true KR100878367B1 (ko) 2009-01-15

Family

ID=36190759

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077002055A KR100878367B1 (ko) 2005-04-15 2006-02-01 콤팩트 보조 정보를 이용한 다중-채널 계층형 오디오 코딩

Country Status (12)

Country Link
US (1) US7961890B2 (ko)
EP (1) EP1869667B1 (ko)
JP (1) JP4519919B2 (ko)
KR (1) KR100878367B1 (ko)
CN (1) CN101031959B (ko)
BR (1) BRPI0605865B1 (ko)
ES (1) ES2740104T3 (ko)
MY (1) MY147652A (ko)
PL (1) PL1869667T3 (ko)
RU (1) RU2367033C2 (ko)
TW (1) TWI314840B (ko)
WO (1) WO2006108462A1 (ko)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2006126844A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
JP2009508176A (ja) * 2005-09-14 2009-02-26 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
CN101297353B (zh) * 2005-10-26 2013-03-13 Lg电子株式会社 编码和解码多声道音频信号的方法及其装置
KR100953641B1 (ko) * 2006-01-19 2010-04-20 엘지전자 주식회사 미디어 신호 처리 방법 및 장치
WO2007091845A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
EP1989920B1 (en) * 2006-02-21 2010-01-20 Koninklijke Philips Electronics N.V. Audio encoding and decoding
KR100773562B1 (ko) 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
MX2009003570A (es) * 2006-10-16 2009-05-28 Dolby Sweden Ab Codificacion mejorada y representacion de parametros para codificacion de objetos de mezcla descendente de multicanal.
CA2673624C (en) * 2006-10-16 2014-08-12 Johannes Hilpert Apparatus and method for multi-channel parameter transformation
US8571875B2 (en) * 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
EP2097895A4 (en) * 2006-12-27 2013-11-13 Korea Electronics Telecomm DEVICE AND METHOD FOR ENCODING AND DECODING MULTI-OBJECT AUDIO SIGNAL WITH DIFFERENT CHANNELS WITH INFORMATION BIT RATE CONVERSION
ES2593822T3 (es) * 2007-06-08 2016-12-13 Lg Electronics Inc. Método y aparato para procesar una señal de audio
BRPI0806228A8 (pt) * 2007-10-16 2016-11-29 Panasonic Ip Man Co Ltd Dispositivo de sintetização de fluxo, unidade de decodificação e método
US8023660B2 (en) 2008-09-11 2011-09-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
KR101392546B1 (ko) * 2008-09-11 2014-05-08 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 마이크로폰 신호를 기반으로 공간 큐의 세트를 제공하는 장치, 방법 및 컴퓨터 프로그램과, 2채널 오디오 신호 및 공간 큐의 세트를 제공하는 장치
US8258849B2 (en) * 2008-09-25 2012-09-04 Lg Electronics Inc. Method and an apparatus for processing a signal
WO2010036059A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
US8346380B2 (en) * 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
KR101600352B1 (ko) * 2008-10-30 2016-03-07 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
ES2415155T3 (es) 2009-03-17 2013-07-24 Dolby International Ab Codificación estéreo avanzada basada en una combinación de codificación estéreo izquierda/derecha o central/lateral seleccionable de manera adaptativa y de codificación estéreo paramétrica
WO2010105695A1 (en) * 2009-03-20 2010-09-23 Nokia Corporation Multi channel audio coding
KR20110022252A (ko) * 2009-08-27 2011-03-07 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
RU2577199C2 (ru) * 2009-10-20 2016-03-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство для обеспечения представления сигнала повышающего микширования на основе представления сигнала понижающего микширования, устройство для обеспечения битового потока, представляющего многоканальный звуковой сигнал, способы, компьютерная программа и битовый поток, использующий передачу сигналов с контролем искажения
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
EP2369861B1 (en) * 2010-03-25 2016-07-27 Nxp B.V. Multi-channel audio signal processing
KR101641685B1 (ko) * 2010-03-29 2016-07-22 삼성전자주식회사 멀티채널 오디오의 다운믹스 방법 및 장치
ES2935962T3 (es) * 2010-04-09 2023-03-13 Dolby Int Ab Codificación estéreo usando un modo de predicción o un modo de no predicción
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
CN102222505B (zh) * 2010-04-13 2012-12-19 中兴通讯股份有限公司 可分层音频编解码方法系统及瞬态信号可分层编解码方法
JP5533502B2 (ja) * 2010-09-28 2014-06-25 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
EP2464146A1 (en) 2010-12-10 2012-06-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decomposing an input signal using a pre-calculated reference curve
EP2691951B1 (en) 2011-03-28 2016-08-24 Dolby Laboratories Licensing Corporation Reduced complexity transform for a low-frequency-effects channel
US9830917B2 (en) 2013-02-14 2017-11-28 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
EP2956935B1 (en) * 2013-02-14 2017-01-04 Dolby Laboratories Licensing Corporation Controlling the inter-channel coherence of upmixed audio signals
US9478224B2 (en) 2013-04-05 2016-10-25 Dolby International Ab Audio processing system
PL2992529T3 (pl) 2014-07-28 2017-03-31 Telefonaktiebolaget Lm Ericsson (Publ) Wyszukiwanie kształtu przez piramidowy kwantyzator wektorowy
EP2980789A1 (en) * 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhancing an audio signal, sound enhancing system
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
US20190096410A1 (en) * 2016-03-03 2019-03-28 Nokia Technologies Oy Audio Signal Encoder, Audio Signal Decoder, Method for Encoding and Method for Decoding
EP3301673A1 (en) * 2016-09-30 2018-04-04 Nxp B.V. Audio communication method and apparatus
GB2574239A (en) * 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
GB2576769A (en) * 2018-08-31 2020-03-04 Nokia Technologies Oy Spatial parameter signalling
CN110070878B (zh) * 2019-03-26 2021-05-04 苏州科达科技股份有限公司 音频码流的解码方法及电子设备
WO2024073401A2 (en) * 2022-09-30 2024-04-04 Sonos, Inc. Home theatre audio playback with multichannel satellite playback devices

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030219123A1 (en) 2002-05-22 2003-11-27 Hiroo Okamoto Apparatus and method for outputting digital information
US20050074127A1 (en) 2003-10-02 2005-04-07 Jurgen Herre Compatible multi-channel coding/decoding
WO2005101370A1 (en) 2004-04-16 2005-10-27 Coding Technologies Ab Apparatus and method for generating a level parameter and apparatus and method for generating a multi-channel representation

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3912605B4 (de) 1989-04-17 2008-09-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
WO1992005556A1 (en) 1990-09-19 1992-04-02 N.V. Philips' Gloeilampenfabrieken Record carrier on which a main data file and a control file have been recorded, method of and device for recording the main data file and the control file, and device for reading the record carrier
ES2138076T3 (es) 1993-05-05 2000-01-01 Koninkl Philips Electronics Nv Sistema de transmision que comprende al menos un codificador.
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
US5890125A (en) 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6539357B1 (en) 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
WO2004008806A1 (en) 2002-07-16 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030219123A1 (en) 2002-05-22 2003-11-27 Hiroo Okamoto Apparatus and method for outputting digital information
US20050074127A1 (en) 2003-10-02 2005-04-07 Jurgen Herre Compatible multi-channel coding/decoding
WO2005101370A1 (en) 2004-04-16 2005-10-27 Coding Technologies Ab Apparatus and method for generating a level parameter and apparatus and method for generating a multi-channel representation

Also Published As

Publication number Publication date
BRPI0605865B1 (pt) 2019-09-03
WO2006108462A1 (en) 2006-10-19
TW200701822A (en) 2007-01-01
RU2367033C2 (ru) 2009-09-10
BRPI0605865A (pt) 2007-12-18
JP4519919B2 (ja) 2010-08-04
TWI314840B (en) 2009-09-11
US20060233380A1 (en) 2006-10-19
EP1869667B1 (en) 2019-05-08
EP1869667A1 (en) 2007-12-26
ES2740104T3 (es) 2020-02-05
JP2008516275A (ja) 2008-05-15
CN101031959A (zh) 2007-09-05
CN101031959B (zh) 2011-06-22
KR20070088461A (ko) 2007-08-29
PL1869667T3 (pl) 2019-11-29
MY147652A (en) 2012-12-31
US7961890B2 (en) 2011-06-14
RU2007104337A (ru) 2008-08-10

Similar Documents

Publication Publication Date Title
KR100878367B1 (ko) 콤팩트 보조 정보를 이용한 다중-채널 계층형 오디오 코딩
JP5638037B2 (ja) オーディオソースのパラメトリックジョイント符号化
RU2388068C2 (ru) Временное и пространственное генерирование многоканальных аудиосигналов
KR100848367B1 (ko) 레벨 파라미터를 발생하는 장치 및 방법 그리고 멀티채널표현을 발생하는 장치 및 방법
EP2175671B1 (en) Method, device, encoder apparatus, decoder apparatus and audio system
CN101151658B (zh) 多声道音频编码和解码方法、编码器和解码器
CN103489449B (zh) 音频信号译码器、提供上混信号表示型态的方法
US8296155B2 (en) Method and apparatus for decoding a signal
KR101315077B1 (ko) 멀티-채널 오디오 데이터를 인코딩 및 디코딩하기 위한 방법, 및 인코더들 및 디코더들
US7916873B2 (en) Stereo compatible multi-channel audio coding
CA2610430C (en) Channel reconfiguration with side information
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
RU2417458C2 (ru) Генерирование многоканальных звуковых сигналов
TWI455614B (zh) 方法、器件、編碼器裝置、解碼器裝置及聲訊系統

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121228

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20131227

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20141229

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20151230

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20161230

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20171228

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20181228

Year of fee payment: 11