KR20070001139A - 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들 - Google Patents

오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들 Download PDF

Info

Publication number
KR20070001139A
KR20070001139A KR1020067016541A KR20067016541A KR20070001139A KR 20070001139 A KR20070001139 A KR 20070001139A KR 1020067016541 A KR1020067016541 A KR 1020067016541A KR 20067016541 A KR20067016541 A KR 20067016541A KR 20070001139 A KR20070001139 A KR 20070001139A
Authority
KR
South Korea
Prior art keywords
channel
signal
parameters
data
encoded
Prior art date
Application number
KR1020067016541A
Other languages
English (en)
Inventor
레온 엠. 반 데 커크호프
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20070001139A publication Critical patent/KR20070001139A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Abstract

스테레오 오디오 인코더(100)는, 입력 스테레오 신호의 적어도 고주파수 부분을 위한 모노 신호 및 파라메트릭 스테레오 파라미터들을 발생시키는 파라메트릭 스테레오 인코더(115)를 포함한다. 스테레오 강도 인코더(117)는 모노 신호를 위한 스테레오 강도 데이터를 발생시킨다. 모노 신호 및 강도 데이터는 MPEG 계층 II와 같은 인코딩 표준에 따라서 인코딩되고 파라메트릭 스테레오 파라미터들은 출력 프로세서(113)에 의해 보조 데이터 섹션들에 포함된다. 따라서, 레거시 디코더(가령 MPEG 계층 II 디코더)는 스테레오 강도 데이터(stereo intensity data)를 이용하여 스테레오 신호를 발생시키는 반면에, 고도의 복잡성 디코더(complexity decoder)는 파라메트릭 스테레오 파라미터들을 이용하여 고품질 오디오 신호를 발생시킬 수 있다. 스테레오 디코더(200)는 인코더(100)로부터 인코딩된 데이터를 수신한다. 강도 디코더(203)는 강도 데이터를 이용하여 스테레오 신호를 발생시킨다. 이는 추출된 파라메트릭 스테레오 데이터에 따라서 스테레오 신호를 처리하는 파라메트릭 스테레오 디코더(207)로 공급된다.
스테레오 디코더, 인코더, 디코더, 출력 프로세서, 스테레오 강도 데이터

Description

오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및 이들의 동작 방법들{An audio distribution system, an audio encoder, an audio decoder and methods of operation therefore}
본 발명은 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및 이들의 동작 방법에 관한 것이며, 특히 멀티 채널 오디오 인코딩 및 디코딩에 관한 것이다.
최근에, 디지털 형태의 내용 신호들의 분배 및 저장이 실질적으로 증가되어 왔다. 따라서, 많은 수의 인코딩 표준들 및 프로토콜들이 개발되어 왔다.
오디오 신호들의 디지털 오디오 인코딩을 위한 가장 확산된 코딩 표준들 하나는 일반적으로 MP3라 칭하는 이동 화상 전문가 그룹 계층 3 표준이다. 예로서, MP3는 노래의 30 또는 40 메가바이트 디지털 PCM(펄스 코드 변조) 오디오 레코딩을 3 또는 4 메가바이트 MP3 파일로 압축시키는 것이다. 정확한 압축율은 MP3 인코딩된 오디오의 원하는 품질에 좌우된다. 오디오 인코딩 표준들 및 기술들의 다른 예들은 MPEG AAC(고급 오디오 코딩), ATRAC3(적응형 트랜스폼 어쿠스틱 코딩), AC-3, PAC(인식 오디오 코더), DTS(디지털 씨어터 시스템들) 및 오그 보비스(Ogg Vorbis)를 포함한다.
MP3 또는 ACC와 같은 오디오 인코딩 및 압축 기술들은 상대적으로 낮은 데이 터 크기 및 고품질의 오디오 파일들을 예를 들어 인터넷을 포함한 데이터 네트워크들을 통해 간편하게 분배하는 매우 효율적인 오디오 인코딩을 위해 제공된다.
많은 인코딩 프로토콜들은 또한 스테레오(2개의 채널) 신호들의 효율적인 인코딩을 위해 제공된다. 특히, 강도 스테레오 코딩 및 Mid/Side(MS) 코딩은 이 분야에서 잘 알려져 스테레오 채널들 간의 또는 멀티 채널 오디오 코더들 간의 용장성 및 무관성(redundancy and irrelevancy)을 이용하는 기술들이 폭넓게 사용된다. 이들 기술들을 이용하면, 소정의 음질을 위한 낮은 비트율을 얻거나 소정 비트율에서 이 음질을 개선시킬 수 있다. 이들 기술들을 사용하는 오디오 코더들의 예들로서 MPEG 계층 II, MPEG 계층 III(MP3), AAC, ATRAC3 및 AC-3를 들 수 있다.
강도 스테레오 코딩(intensity stereo coding)은 오디오 채널들의 독립적인 코딩과 비교하여 비트율을 크게 감소시킨다. 강도 스테레오에서, 모도 오디오 신호는 신호의 고주파수 범위에 대해 발생된다. 게다가, 별도의 강도 파라미터들은 다른 채널들을 위해 발생된다. 전형적으로, 강도 파라미터들은 좌 및 우 스케일 팩터들의 형태인데, 이 팩터들은 디코더에서 사용되어 모노 오디오 신호로부터 좌 및 우 출력 신호들을 발생시킨다. 변형으로서 단일 스케일 팩터 및 지향성 파라미터의 사용을 들 수 있다.
그러나, 강도 스테레오 코딩 기술은 여러 가지 단점들을 갖는다. 우선, 인코더는 고주파수에 대한 시간 및 위상 정보를 폐기한다. 그러므로, 디코더는 원래 오디오 재료에 존재하는 시간 또는 위상 채널 차들을 재생할 수 없다. 게다가, 일반적으로, 인코딩은 오디오 채널들 간의 상관을 유지할 수 없다. 따라서, 인코더에 의해 발생된 스테레오 신호의 품질 저하를 피할 수 없다.
게다가, 서브밴드 코딩에서, 인코딩 공정의 이웃 주파수 대역들 간의 에일리어싱 소거(aliasing cancellation)는 개별적인 서브밴드들에 대한 인코더 및 디코더를 통한 정확한 총 전달 함수를 따른다. 전달 함수들이 강도 데이터로 인해 여러 서브밴드들에서 다르게 변화될 수 있기 때문에, 이웃 주파수 대역들 간의 에일리어싱 소거는 파괴된다. 유사한 문제는 시간-도메인 에일리어싱 소거를 따른 MDCT 변환을 이용하는 코더들에서 발생된다.
게다가, 스케일 팩터들이 강도 파라미터들로서 사용될 때, 이들 파라미터들의 정확도는 일반적으로 높은 오디오 품질을 얻는데 충분하지 않다.
MS 코딩이 이들 단점들을 겪지 않지 않지만, MS 코딩의 비트 레이트 효율은 일반적으로 크게 낮음으로, 높은 데이터 레이트들을 발생시킨다. 최악의 상황에서, MS 코딩은 좌 및 우 채널들의 독립적인 코팅과 비교하여 비트 레이트 면에서 어떠한 이득도 제공하지 못한다.
결국, 더욱 효율적인 멀티-채널 기술들을 제공하기 위한 중요한 연구가 착수되었다. 그러나, 기존 인코딩 기술들의 광범위한 보급으로 인해, 새로운 기술들은 기존 프로토콜들과 역방향 호환될 수 있는 것이 바람직하다.
멀티-채널 오디오 신호들의 인코딩을 위해 최근 개발된 한 가지 기술은 파라메트릭 스트레오(PS)로서 알려져 있다. 이 기술은 역방향 호환가능한 방식의 다른 오디오 코딩 방법들에 더하여 적용될 수 있다. 특히, PS는 모노 MP3 또는 AAC 인코딩된 신호들에 부가될 스테레오 인핸스먼트 데이터를 발생시킬 수 있다. 인핸스먼 트 데이터는 MP3 또는 AAC 데이터 스트림의 보조 데이터 섹션들에 저장됨으로써, 종래의 디코더들이 부가적인 데이터를 무시하도록 한다.
PS에서, 스테레오 오디오 인코딩은 예를 들어 MP3 또는 AAC를 이용하여 단일 모노 신호만을 인코딩함으로써 성취된다. 게다가, 스테레오 이미징 파라미터들은 인코더에서 결정되고 별도의 확장 데이터(extension data)로서 데이터 스트림에 포함된다. 디코더에서, 모노 인코딩된 채널은 스테레오 이미징 파라미터들에 따라서 2개의 채널들에서 모노 인코딩된 신호를 다르게 처리함으로써 스테레오 채널들로 확장된다. 이들 파라미터들은 채널간 강도 차들(Inter-channel Intensity Difference; IID), 채널간 시간 또는 위상 차들(Inter-channel Time or Phase Differences; ITD 또는 IPD) 및 채널간 교차-상관들(Inter-channel Cross-Correlations; ICC)로 이루어질 수 있다.
PS에 대해, 인핸스먼트 파라미터들이 보조 데이터 섹션들의 이용가능한 용량을 초과하지 않는 한, 인핸스먼트 파라미터들은 코어 코딩 방법들의 보조 데이터 부분으로 효율적으로 인코딩될 수 있다. 대안적으로, 보조 데이터를 위해 예약된 비트들의 량은 필요로 되는 PS 인핸스먼트 데이터가 이에 맞춰지도록 선택될 수 있다. 실험들은 고 품질의 스테레오 인코딩이 모노 인코딩된 신호와 비교하여 단지 몇 kbps 여분만으로 가능하다는 것을 나타낸다.
레거시 디코더들(legacy decoders)은 보조 데이터를 처리하지 않지만 코어 인코딩된 데이터만을 디코딩할 것이고, 이 방식에서, 오디오 신호들이 레거시 디코더들에 의해 발생될 수 있기 때문에 역방향 호환성이 유지된다.
그러나, 이 기술의 단점은 레거시 디코더들이 모노 신호만을 재생한다는 것이다. 따라서, 보조 데이터 섹션들에 포함되는 스테레오 정보는 무시된다. 스테레오 신호의 모노 표현은 통상적으로 수용될 수 없는 심각한 품질 저하를 나타낸다.
그러므로, 개선된 멀티-채널 오디오 코딩/디코딩 기술이 유용하고, 특히, 개선된 수행성능, 개선된 품질, 감소된 데이터 레이트 및/또는 개선된 역방향 호환성을 제공하는 멀티-채널 오디오 코딩/디코딩 기술이 유용하다.
따라서, 본 발명은 상술된 단점들 중 한 가지 이상의 단점을 개별적으로 또는 조합하여 완화, 경감 또는 제거하는 것이다.
본 발명의 제 1 양상을 따르면, 멀티 채널 오디오 인코더는: 입력 멀티 채널 신호를 수신하는 수단; 상기 입력 멀티 채널 신호의 적어도 제 1 부분을 위한 멀티 채널 파라미터들 및 단일 채널 신호를 발생시키는 파라메트릭 멀티 채널 인코더로서, 상기 멀티 채널 파라미터들은 상기 단일 채널 신호와 관련되는 멀티 채널 정보를 포함하는, 파라메트릭 멀티 채널 인코더; 상기 입력 멀티 채널 신호 및 단일 채널 신호에 응답하여 멀티 채널 강도 데이터를 발생시키는 멀티 채널 강도 인코더; 및 상기 단일 채널 신호, 상기 강도 데이터 및 상기 멀티 채널 파라미터들을 포함하는 인코딩된 오디오 출력 데이터를 발생시키는 수단을 포함한다.
멀티 채널 강도 데이터는 MP3, AAC 등과 같은 제 1 코딩 표준과 호환될 수 있다. 단일 채널 신호는 상기 인코딩 표준에 따라서 인코딩될 수 있다. 이 애플리케이션에서, 용어 멀티 채널은 2개 이상의 채널들이라 한다. 멀티 채널 파라미터들은 파라메트릭 확장 데이터일 수 있고 특히 단일 채널 신호로부터 그리고 가능하게는 강도 데이터로부터 스테레오 신호를 제공하도록 사용될 수 있는 파라메트릭 스테레오 데이터일 수 있다. 이 애플리케이션에서, 용어 스테레오 채널은 2개의 채널들과 관련됨으로써, 스테레오 신호는 2개의 채널 신호와 관련된다. 멀티 채널 파라미터들은 단일 채널 신호에 또는 멀티 채널 강도 데이터에 사용되는 인코딩 표준에 포함되지 않는 포맷일 수 있다.
인코더는 멀티 채널 파라미터들을 이용하여 효율적 및/또는 고 품질 멀티 채널 인코딩을 제공할 수 있는 신호를 제공할 수 있다. 디코더가 멀티 채널 파라미터들의 정보를 이용할 수 없는 동안, 예를 들어 레거시 디코더는 (전형적으로 저품질이지만) 멀티 채널 신호를 여전히 제공할 수 있는 동안, 적절한 디코더는 고 품질 멀티 채널을 발생시킬 수 있다. 그러므로, 본 발명은 개선된 수행성능 역방향 호환성을 허용하고, 특히 레거시 디코더들에서 멀티 채널 신호 발생을 허용할 수 있다.
특히, 멀티 채널 파라미터들은 인코딩된 오디오 출력 데이터의 보조(또는 보조의) 데이터 섹션에 포함될 수 있다. 예를 들어, 멀티 채널 파라미터들은 MP3 또는 AAC 데이터 스트림의 보조 데이터 섹션들에 포함될 수 있다. 이는 보조 데이터 섹션들을 간단히 무시할 수 있기 때문에 레거시 인코더들에 영향을 미침이 없이 멀티 채널 파라미터들이 인코딩된 출력 데이터에 포함되도록 한다. 그러나, 적절한 개선된 인코더들은 멀티 채널 파라미터들을 추출할 수 있고 고품질 멀티 채널 신호들을 도출시에 이들을 사용할 수 있다. 대안적으로 또는 부가적으로, 멀티 채널 파라미터들은 예를 들어 시스템 레벨 데이터 스트림에서 인코딩된 오디오 출력 데이터로부터 디코더로 개별적으로 전송될 수 있다.
인코딩된 오디오 출력 데이터는 데이터 스트림일 수 있거나 예를 들어 동일한 디코더에 개별적으로 전송될 수 있다. 입력 멀티 채널 신호는 외부 소스 및/또는 로컬 메모리와 같은 내부 소스로부터 수신될 수 있다.
멀티 채널 파라미터들은 채널간 강도 차(IID) 파라미터들, 채널간 시간 차(ITD) 파라미터들 및/또는 채널간 교차-상관들(ICC) 파라미터들을 포함하는 것이 바람직하다.
채널간 파라미터들을 또한 양귀간 파라미터들(inter-aural parameters)이라 할 수 있고, ICC 파라미터들을 특히 양귀 간 교차 파라미터들이라 할 수 있다.
이들 파라미터들은 특히 유용하고 파라메트릭 스테레오 인코딩된 멀티-채널신호들의 역방향 호환 전송을 허용한다.
본 발명의 특징을 따르면, 채널간 강도 차(IID) 파라미터들은 강도 데이터에 대한 차 파라미터들이다. 이는 IID 파라미터들의 더욱 효율적인 인코딩을 허용하여 감소된 데이터 레이트들을 발생시키며 및/또는 감소된 복잡성 인코딩 또는 디코딩 프로세스를 위해 제공될 수 있다.
본 발명의 다른 특징을 따르면, 강도 데이터는 다수의 채널들을 위한 개별적인 스케일 팩터들을 포함한다. 이 스케일 팩터들은 임의의 적절한 포맷, 예를 들어 극 포맷으로 표시될 수 있다. 이는 파라메트릭 디코딩 및 강도 디코딩 둘 다에 실질적으로 사용될 수 있는 강도 정보를 제공하는 적절한 수단을 제공한다.
본 발명의 또 다른 특징을 따르면, 멀티 채널 파라미터들은 강도 데이터의 개별적인 스케일 팩터들에 대한 스케일 팩터 차 값들을 포함한다. 이 차 값들은 예를 들어 극 성분 차 값들일 수 있다. 이는 인코딩 및/또는 디코딩 프로세스를 구현한는 것을 용이하게 하고 멀티 채널 파라미터들 및 멀티 채널 강도 데이터 둘 다의 효율적인 데이터 레이트 통신을 제공한다.
본 발명의 또 다른 특징을 따르면, 멀티 채널 오디오 인코더는: 입력 멀티 채널 신호를 제 1 부분 및 제 2 부분으로 분할하는 수단; 및, 다수의 개별적으로 인코딩된 단일 채널 신호들로서 상기 제 2 부분을 인코딩하는 수단을 더 포함하는데, 상기 발생 수단은 상기 인코딩된 오디오 출력 데이터에서 개별적으로 인코딩된 단일 채널 신호들을 포함하도록 동작가능하다. 상기 제 2 부분은 상기 입력 신호의 저주파수 대역에 대응하고 상기 제 1 부분은 상기 입력 신호의 고주파수 대역에 대응하는 것이 바람직하다.
이는 높은 인식 품질을 제공하지만 강도 디코딩 및 파라메트릭 디코딩 둘 다에 적합한 멀티 채널 오디오 신호들을 효율적으로 인코딩한다.
멀티 채널 오디오 인코더는 스테레오 오디오 인코더가 바람직하다. 특히, 멀티 채널 파라미터들은 입력 스테레오 신호의 파라메트릭 스테레오 인코딩에 의해 도출되는 파라미터들을 포함하는 것이 바람직하다.
본 발명의 또 다른 특징을 따르면, 멀티 채널 오디오 인코더는: 상기 인코딩된 출력 데이터를 단일 데이터 스트림으로서 전송하는 수단을 더 포함한다. 그러므로, 상기 인코더는 여러 유형들의 디코더들로 고 인코딩 품질 대 데이터 레이트 비를 갖고 멀티 채널로서 디코딩가능한 단일 데이터 스트림을 발생시킬 수 있다. 따라서, 인코더는 데이터 스트림의 분배를 개선시키고, 레거시 디코더들은 두 가지 유형들이 멀티 채널들을 발생시키도록 한다.
본 발명의 제 2 양상을 따르면, 오디오 신호를 인코딩하는 방법은: 입력 멀티 채널 신호를 수신하는 단계; 파라메트릭 멀티 채널 인코딩에 의해 상기 입력 멀티 채널 신호의 적어도 제 1 부분을 위한 멀티 채널 파라미터들 및 단일 채널 신호를 발생시키는 단계로서, 상기 멀티 채널 파라미터들은 단일 채널 신호와 관련된 멀티 채널 정보를 포함하는, 단계; 상기 입력 멀티 채널 신호 및 단일 채널 신호에 응답하여 멀티 채널 강도 데이터를 발생시키는 단계; 및 상기 단일 채널 신호, 상기 강도 데이터 및 상기 멀티 채널 파라미터들을 포함하는 인코딩된 오디오 출력 데이터를 발생시키는 단계를 포함한다.
본 발명의 제 3 양상을 따르면, 멀티 채널 오디오 디코더는: 단일 채널 신호, 상기 단일 채널 신호와 관련된 멀티 채널 정보를 포함하는 파라메트릭하게 인코딩된 멀티 채널 파라미터들 및 상기 단일 채널 신호와 관련된 강도 인코딩된 멀티 채널 강도 데이터를 수신하는 수단; 상기 단일 채널 신호 및 상기 강도 데이터로부터 제 1 디코딩된 신호를 발생시키는 강도 디코더; 및 상기 제 1 디코딩된 신호 및 상기 파라메트릭하게 인코딩된 멀티 채널 파라미터들로부터 디코딩된 멀티 채널 출력 신호를 발생시키도록 동작가능한 파라메트릭 멀티 채널 디코더를 포함한다.
따라서, 본 발명은 파라메트릭하게 인코딩된 멀티 채널 파라미터들 및 멀티 채널 강도 데이터 둘 다를 포함하는 오디오 인코딩 데이터의 디코딩에 적합한 저 복잡성 디코더를 제공할 수 있다.
인코더와 관련한 특징들, 코멘트들 및 변형들이 적절하게 디코더에 적용될 수 있다는 것을 인지할 것이다.
예를 들어, 멀티 채널 강도 데이터는 MP3, AAC 등과 같은 제 1 코딩 표준과 호환될 수 있다. 단일 채널 신호는 동일한 인코딩 표준에 따라서 인코딩될 수 있다. 멀티 채널 파라미터들은 파라메트릭 확장 데이터일 수 있고 특히 단일 채널 신호 및 가능하게는 강도 데이터로부터 스테레오 신호를 제공하도록 사용될 수 있는 파라메트릭 스테레오 데이터일 수 있다. 멀티 채널 파라미터들은 단일 채널 신호 또는 멀티 채널 강도 데이터에 사용되는 인코딩 표준에 포함되지 않는 포맷일 수 있다.
멀티 채널 파라미터들은 인코딩된 오디오 출력 데이터의 보조(또는 보조의) 데이터 섹션에 포함될 수 있다. 예를 들어, 멀티 채널 파라미터들은 MP3 또는 AAC 데이터 스트림의 보조 데이터 섹션들에 포함될 수 있다.
단일 채널 신호, 상기 단일 채널 신호와 관련된 멀티 채널 정보를 포함하는 파라메트릭하게 인코딩된 멀티 채널 파라미터들 및 상기 단일 채널 신호와 관련된 강도 인코딩된 멀티 채널 강도 데이터는 단일 데이터 스트림 또는 파일에 포함될 수 있다.
멀티 채널 파라미터들은 채널간 강도 차(IID) 파라미터들, 채널간 시간 차(ITD) 파라미터들 및/또는 채널간 교차-상관들(ICC) 파라미터들을 포함하는 것이 바람직하다. IID 파라미터들은 강도 데이터에 대한 차 파라미터들인 것이 바람직하다. 특히, 강도 데이터는 다수의 채널들을 위한 개별적인 스케일 팩터들을 포함하는 것이 바람직하고, 멀티 채널 파라미터들은 강도 데이터의 개별적인 스케일 팩터들에 대한 스케일 팩터 차 값들을 포함하는 것이 바람직하다.
멀티 채널 오디오 디코더는 스테레오 오디오 디코더인 것이 바람직하다.
본 발명의 특징을 따르면, 제 1 디코딩된 신호는 멀티 채널 신호이고, 강도 디코더는 파라메트릭하게 인코딩된 멀티 채널 파라미터들의 강도 정보에 응답하여 강도 데이터를 수정하도록 동작가능하다. 이는 적절한 구현방식을 위해 제공되고, 특히, 기존의 강도 데이터 멀티 채널 디코더 알고리즘이 사용되도록 한다.
본 발명의 제 4 양상을 따르면, 멀티 채널 오디오 디코더는: 단일 채널 신호, 상기 단일 채널 신호와 관련된 멀티 채널 정보를 포함하는 파라메트릭하게 인코딩된 멀티 채널 파라미터들 및 상기 단일 채널 신호와 관련된 강도 인코딩된 멀티 채널 강도 데이터를 수신하는 수단; 상기 단일 채널 신호로부터 제 1 디코딩된 신호를 발생시키는 강도 디코더; 및 상기 제 1 디코딩된 신호, 상기 강도 데이터 및 상기 파라메트릭하게 인코딩된 멀티 채널 파라미터들로부터 디코딩된 멀티 채널 출력 신호를 발생시키도록 동작가능한 파라메트릭 멀티 채널 디코더를 포함한다.
본 발명의 또 다른 특징을 따르면, 상기 제 1 디코딩된 신호는 모노 신호이고 상기 파라메트릭 멀티 채널 디코더는 상기 강도 데이터에 응답하여 상기 파라메트릭하게 인코딩된 멀티 채널 파라미터들의 강도 정보를 수정하도록 동작가능하다. 이는 적절한 구현방식을 위해 제공되고, 특히, 간단한 강도 데이터 멀티 채널 디코더 알고리즘이 사용되도록 한다.
본 발명의 제 5 양상을 따르면, 멀티 채널 오디오 디코딩 방법은: 단일 채널 신호, 상기 단일 채널 신호와 관련된 멀티 채널 정보를 포함하는 파라메트릭하게 인코딩된 멀티 채널 파라미터들 및 상기 단일 채널 신호와 관련된 강도 인코딩된 멀티 채널 강도 데이터를 수신하는 단계; 강도 디코딩에 의해 상기 단일 채널 신호및 상기 강도 데이터로부터 제 1 디코딩된 신호를 발생시키는 단계; 및 파라메트릭 멀티 채널 디코딩에 의해 상기 제 1 디코딩된 신호 및 상기 파라메트릭하게 인코딩된 멀티 채널 파라미터들로부터 디코딩된 멀티 채널 출력 신호를 발생시키는 단계를 포함한다.
본 발명의 제 6 양상을 따르면, 멀티 채널 오디오 신호는: 단일 채널 신호 데이터; 상기 단일 채널 신호와 관련되고 제 1 인코딩 프로토콜에 따라서 인코딩되는 강도 인코딩된 멀티 채널 강도 데이터; 및 상기 단일 채널 신호와 관련된 멀티 채널 정보를 포함하고 상기 제 1 인코딩 프로토콜과 다른 제 2 인코딩 프로토콜에 따라서 인코딩되는 파라메트릭하게 인코딩된 멀티 채널 파라미터들을 포함한다. 상기 단일 채널 데이터는 상기 제 1 인코딩 프로토콜에 따라서 인코딩되는 것이 바람직하다.
본 발명의 이들 및 다른 양상들, 특징들 및 장점들이 이하에 설명된 실시예(들)과 관련한 설명으로 명백하게 될 것이다.
본 발명의 실시예는 단지 예로서 도면을 참조하여 설명될 것이다.
도 1은 본 발명의 실시예를 따른 인코더의 블록도.
도 2는 본 발명의 실시예를 따른 디코더의 블록도.
도 3은 본 발명의 실시예를 따른 디코더의 블록도.
이하의 설명은 스테레오 인코더들에 그리고 MPEG 오디오 계층 II(mp2) 인코딩 표준과 호환될 수 있는 오디오 데이터를 포함하고 파라메트릭 스테레오(PS) 파라메트릭 확장 데이터를 더 포함하는 디지털 오디오 데이터의 인코딩 및 디코딩에 적용될 수 있는 본 발명의 실시예에 초점을 맞춘다. 그러나, 본 발명이 이 애플리케이션에 제한되는 것이 아니라 많은 다른 형태들의 멀티 채널 시스템들에 적용될 수 있다는 것을 인지할 것이다.
서술된 실시예를 따르면, 강도 스테레오 인코딩은 인코더에서 사용되어 품질 제한된 스테레오 신호를 위한 정보를 발생시킨다. 강도 스테레오 인코딩은 언더라잉 신호에 사용되는 인코딩 프로토콜에 따라서 수행된다. 특히, mp2 스테레오 강도 인코딩이 사용된다. 동시에, 인코더는 mp2 데이터의 보조 데이터 섹션들에 포함되는 파라미터적으로 인코딩된 PS 확장 데이터를 발생시킨다.
따라서, PS 확장 데이터를 이용할 수 없는 레거시 디코더들은 여전히 스테레오 신호를 발생시킬 수 있지만, 품질 저하와 더불어 강도 스테레오 인코딩과 관련된 전형적인 단점들을 갖는다. 그러나, 업그레이드되거나 개선된 디코더들을 지닌 사용자들은 이들 디코더들이 PS 확장 데이터에 응답하여 인코딩된 신호를 처리할 수 있기 때문에 전형적인 강도 스테레오 아티팩트들 없이 고품질의 스테레오를 수신할 수 있다. 소정 스테레오 품질을 성취하기 위해 인코딩된 데이터의 통신에 필 요로 되는 데이터 레이트는 확장 데이터가 더욱 개선된 스테레오 인코딩을 위해 제공되기 때문에 레거시 시스템들과 비교하여 크게 감소된다.
게다가, PS 확장 데이터 크기는 스테레오 강도 데이터 및 PS 확장 데이터 간의 상관을 이용함으로써 감소될 수 있다. 예를 들어, PS 확장 데이터의 채널간 강도 차(IID) 파라미터들 및 스테레오 강도 데이터 간의 상관은 IID 파라미터들의 인코딩에서 이용될 수 있다. 특히, IID 파라미터들은 스테레오 강도 데이터와 관련하여 다르게 인코딩될 수 있다.
서술된 실시예에서, 스테레오 인코더는 스테레오 신호를 수신한다. (일반적으로, 특정 주파수(fc) 보다 낮은) 저주파수 대역은 2개의 모노 신호들로서 인코딩된다. 게다가, 스테레오 인코더는 (일반적으로 fc를 넘는)고주파수 범위에서 실질적으로 모노 신호를 발생시킨다. 다음에, 이 신호는 스테레어 강도 데이터의 미분에 의해 강도 스테레오 신호로서 인코딩된다. 게다가, PS 스테레오 파라미터들은 모노 신호에 응답하여 발생된다. 다음에, 인코더는 이중 모노 인코딩된 저주파수 신호 들, 모노 신호와, 강도 데이터 및 PS 스테레오 파라미터들 둘 다를 포함하는 출력 데이터를 발생시킨다. 출력 데이터는 mp2와 같은 강도 스테레오를 허용하는 인코딩 표준과 호환될 수 있는 데이터 스트림인 것이 바람직하다. 파라메트릭 스테레오 데이터는 출력 데이터의 보조 데이터 섹션들에 포함될 수 있다. 따라서, 레거시 디코더들은 강도 스테레오 데이터를 이용하여 데이터 스트림을 디코딩함으로써, 감소된 품질의 스테레오 신호를 발생시킨다. 개선된 디코더들은 모든 이용가능한 데이터를 사용할 수 있음으로, 개선된 품질 스테레오 신호들을 발생시킬 수 있다.
도 1은 본 발명의 실시예를 따른 인코더(100)의 블록도를 도시한 것이다.
인코더(100)는 외부 또는 내부 소스(103)로부터 입력 스테레오 신호를 수신하는 수신기(101)를 포함한다. 특정 실시예에서, 입력 스테레오 신호는 좌 채널 펄스 코드 변조된 신호 및 우 채널 펄스 코드 변조된 신호를 포함한다. 수신기(101)는 제 1 및 제 2 분할기(105, 107)에 결합되고 좌 스테레오 채널은 제 1 분할기(105)에 피딩되고 우 스테레오 채널은 제 2 분할기(107)에 피딩된다.
제 1 분할기(105)는 좌 스테레오 채널을 제 1 및 제 2 부분으로 분할한다. 특히, 제 1 부분은 고주파수 범위에 대응하고 제 2 부분은 저주파수 범위에 대응한다. 유사하게, 제 2 분할기(107)는 좌 스테레오 신호를 상위 및 저주파수 범위에 대응하는 제 1 및 제 2 부분으로 분할한다.
서술된 실시예에서, 제 1 및 제 2 분할기들(105, 107)은 저역 통과 필터를 포함하여 저주파수 신호를 추출하고 고역 통과 필터를 포함하여 고주파수 신호를 추출한다. 대안적으로, 레귤러 mp2 인코더의 일부인 분석 서브밴드 필터들은 이 목적을 위해 사용될 수 있는데, 즉 하위 서브밴드들은 제 2 부분을 형성하고 상위 서브밴드들은 제 1 부분을 형성한다.
제 1 분할기(105)는 제 1 모노 오디오 인코더(109)에 결합되고 제 2 분할기(107)는 제 2 모노 오디오 인코더(111)에 결합된다. 좌 저주파수 신호는 제 1 분할기(105)로부터 제 1 모노 오디오 인코더(109)로 공급되고 우 저주파수 신호는 제 2 분할기(107)로부터 제 2 모노 오디오 인코더(111)로 공급된다.
제 1 및 제 2 모노 오디오 인코더들(109, 111)은 예를 들어 mp2 인코딩 프로토콜과 같은 적절한 인코딩 프로토콜에 따라서 좌 및 우 채널 저주파수 신호 각각을 인코딩한다. 제 1 및 제 2 모노 오디오 인코더들(109, 111)은 출력 프로세서(113)에 결합되고 인코딩된 저주파수 범위 우 및 좌 채널 데이터는 출력 프로세서(113)에 공급된다. 따라서, 좌 및 우 입력 신호의 저주파수 범위는 개별적으로 2개의 모노 신호들로서 인코딩된다.
제 1 및 제 2 분할기(105, 107)는 파라메트릭 스테레오 인코더(115)에 부가 결합된다. 제 1 분할기(105)는 좌 채널 고주파수 신호를 파라메트릭 스테레오 인코더(115)로 공급하고 제 2 분할기(107)는 우 채널 고주파수 신호를 파라메트릭 스테레오 인코더(115)로 공급한다.
파라메트릭 스테레오 인코더(115)는 좌 및 우 채널 고주파수 신호들로부터 모노 신호를 발생시킨다. 특히, 모노 신호는 단지 신호들 모두를 가산함으로써 발생될 수 있다. 게다가, 파라메트릭 스테레오 인코더(115)는 입력 스테레오 신호들의 고주파수 범위들을 위한 멀티 채널 파라미터들을 발생시킨다. 특히, 파라메트릭 스테레오 인코더(115)는 파라메트릭 스테레오(PS) 멀티 채널 파라미터들을 발생시킬 수 있다. 따라서, 이 실시예에서 파라메트릭 스테레오 인코더(115)는 채널간 강도차(IID), 채널간 시간 차(ITD) 및 채널간 교차-상관들(ICC) 파라미터들을 발생시킨다.
파라메트릭 스테레오 인코더(115)는 고주파수 범위 모노 신호에 공급되는 스테레오 강도 인코더(117)에 결합된다. 스테레오 강도 인코더(117)는 또한 제 1 및 제 2 분할기(105, 107)에 의해 도출되는 좌 및 우 채널 고주파수 신호들을 공급받는다. 도 1의 예에서, 스테레오 강도 인코더(117)는 제 1 및 제 2 분할기(105, 107)로부터 직접 공급다는 것이라기보다 오히려 스테레오 강도 인코더(117)로부터 좌 및 우 채널 고주파수 신호들을 공급받는다.
이 실시예에서, 스테레오 강도 인코더(117)는 좌 및 우 신호들 각각을 발생시키기 위해 어느 디코더가 파라메트릭 스테레오 인코더(115)에 의해 발생되는 고주파수 범위 모노 신호에 인가될 수 있는지를 강도 데이터를 결정함으로써 좌 및 우 채널 고주파수 신호들의 강도 인코딩을 수행하는 서브밴드 인코더이다.
이 실시예에서, 스테레오 강도 인코더(117)는 또한 적절한 인코딩 프로토콜(가령 mp2)에 따라서 모노 신호의 인코딩을 수행한다. 스테레오 강도 인코더(117)는 특히 좌 및 우 채널 신호들을 도출하기 위해 서브밴드 인코딩된 모노 신호의 서브밴드들에 디코더에 인가되어야 하는 개별적인 좌 및 우 스케일 팩터들로서 스테레오 강도 데이터를 결정한다.
스테레오 강도 인코더(117)는 결정된 강도 데이터(즉, 스케일 팩터들)뿐만 아니라 서브밴드 인코딩된 모노 신호 데이터를 공급받는 출력 프로세서(113)에 결합된다. 따라서, 출력 프로세서(113)에는 제 1 및 제 2 모노 오디오 인코더들(109, 111)로부터 2개의 모노 인코딩된 저주파수 범위 신호들을 상보하는 강도 인코딩된 고주파수 범위 스테레오 신호가 공급된다. 그러므로, 출력 프로세서(113)는 mp2 호환가능한 강도 인코딩된 스테레오 신호를 발생시키도록 데이터를 수신한다.
파라메트릭 스테레오 인코더(115) 및 스테레오 강도 인코더(117)는 또한 PS 스테레오 파라미터 프로세서(119)에 결합된다. 스테레오 파라미터 프로세서(119)는 파라메트릭 스테레오 인코더(115)로부터 IID, ITD 및 ICC PS 스테레오 파라미터들 및 스테레오 강도 인코더(117)로부터 선택적으로 강도 데이터를 공급받는다.
스테레오 파라미터 프로세서(119)는 출력 프로세서(113)에 결합되어 PS 스테레오 파라미터들을 처리하고 이들을 출력 프로세서(113)에 공급한다. 간단한 실시예에서, 스테레오 파라미터 프로세서(119)는 단지 PS 스테레오 파라미터들을 출력 프로세서(119)로 전달한다. 그러나, 서술된 실시예에서, 스테레오 파라미터 프로세서(119)는 ITD 및 ICC 파라미터들을 전달하지만 IID 파라미터들을 처리하여 강도 데이터에 대해 다른 파라미터들을 발생시킨다.
특히, IID 파라미터들은 스테레오 강도 인코더(117)에 의해 결정된 스케일 팩터들 및 파라메트릭 스테레오 인코더(115)에 의해 결정된 스케일 팩터들 간의 스케일 팩터 차로서 결정된다. 스테레오 강도 인코더(117)에 의해 발생된 스케일 팩터들이 전형적으로 파라메트릭 스테레오 인코더(115)에 의해 발생된 스케일 팩터들과 매우 유사하기 때문에, 단지 상대적으로 작은 차 값들만이 포함됨으로써 델타 IID 값들의 효율적인 인코딩을 허용하도록 한다.
도 1의 실시예에서, 출력 프로세서(113)는 mp2 요건들에 따라서 스테레오 강도 인코더(117)로부터 2개의 모노 인코딩된 저주파수 범위 신호들, 인코딩된 고주파수 범위 모노 신호 및 강도 데이터를 결합시킴으로써 단일 mp2 컴플라이언트 비트 스트림을 발생시킨다. 게다가, PS 스테레오 파라미터들은 mp2 데이터 스트림의 보조 데이터 섹션들에 포함된다. 따라서, 모든 레거시 mp2 인코더들에서 강도 스테 레오 신호로서 인코딩될 수 있지만 PS 가능 디코더들에서 고품질 스테레어 신호를 제공할 수 있는 단일 데이터 스트림이 발생된다. 게다가, IID 파라미터들의 차동 인코딩은 단지 모노 신호들이 레거시 디코더들에 의해 발생될 수 있는 종래의 PS 인코딩된 신호보다 단지 한계적으로 높게 되는 데이터 레이트를 발생시킨다.
도 2는 본 발명의 실시예를 따른 스테레오 디코더(200)의 블록도를 도시한 것이다. 도 2의 디코더(200)는 도 1의 인코더에 의해 발생된 신호로부터 고품질 스테레오 신호를 발생시킬 수 있고 이에 대해 설명될 것이다.
디코더(200)는 도 1의 인코더(100)에 의해 발생된 PS 확장 데이터를 포함하는 mp2 데이터 스트림을 수신하는 수신기(201)를 포함한다. 따라서, 수신기는 2개의 모노 인코딩된 저주파수 범위 신호들, 모노 고주파수 범위 신호, 강도 인코딩된 스테레오 데이터(mp2 스케일 팩터들은 스테레오 강도 인코더(117)에 의해 발생된다)및 파라메트릭하게 인코딩된 스테레오 파라미터들(ICC, ITD 및 차 IID 파라미터들)를 포함하는 데이터 스트림을 수신한다.
수신기는 mp2 강도 스테레오 디코딩 알고리즘에 따라서 스테레오 신호를 발생시키도록 동작가능한 mp2 디코딩 프로세서(203)에 결합된다. 수신기(201)는 입력 데이터 스트림의 mp2 호환가능한 데이터를 mp2 디코딩 프로세서(203)에 공급한다(즉, 2개의 모노 인코딩된 저주파수 범위 신호들, 모노 고주파수 범위 신호 및 강도 인코딩된 스테레오 데이터).
게다가, 디코더(200)는 수신기(201)에 결합되고 파라메트릭하게 인코딩된 스테레오 파라미터들을 수신하는 파라미터 디코더(205)를 포함한다. 파라미터 디코 더(205)는 mp2 디코딩 프로세서(203)에 결합되고, 도 2의 실시예에서, 파라미터 디코더(205)는 mp2 디코딩 프로세서(203)에 차 IID 파라미터들을 공급한다.
차 IID 파라미터들은 강도 디코더(203)에 의해 사용되어 mp2 스케일 팩터들을 조정함으로써 더욱 정확한 스케일 팩터들을 사용하도록 한다. 따라서, 강도 디코더(203)는 mp2 스테레오 알고리즘을 따르지만 개선된 스케일 팩터 값들을 사용하여 스테레오 신호를 발생시킨다.
게다가, 디코더(200)는 파라미터 디코더(205) 및 강도 디코더(203)에 결합되는 파라메트릭 스테레오 디코더(207)를 포함한다. 파라메트릭 스테레오 디코더(207)는 강도 디코더(203)로부터 디코딩된 스테레오 신호 및 파라미터 프로세서(205)로부터 ITD 및 ICC 파라미터들을 수신하고 파라메트릭 스테레오 디코딩 프로토콜에 따라서 디코딩된 스테레오 신호에 이들을 인가한다. 따라서, 파라메트릭 스테레오 디코더(207)는 수신된 데이터 스트림의 PS 확장 데이터를 이용하여 파라메트릭 스테레오 디코딩을 수행함으로써 고품질 스테레오 신호를 발생시킨다.
도 2의 실시예에서, PS 인코딩된 신호의 IID 파라미터 디코딩은 강도 디코더(203)에서 수행되고 IIC 및 ITD 파라미터 디코딩은 파라메트릭 스테레오 디코더(207)에서 수행된다. 다른 분배들의 기능성이 적용될 수 있고 강도 디코더(203) 및 파라메트릭 스테레오 디코더(207)의 기능성이 임의의 적절한 방식으로 분할될 수 있다는 것을 인지할 것이다. 특히, 강도 디코더(203) 및 파라메트릭 스테레오 디코더(207)의 기능성은 하나의 처리 블록에서 결합될 수 있다는 것을 인지할 것이다. 이는 프로세싱(의 적어도 일부)이 서브밴드 신호들에 대해 수행되도록 한다.
도 3은 본 발명의 다른 실시예를 따른 디코더(300)의 블록도를 도시한 것이다.
도 2의 디코더(200)와 유사하게, 도 3의 디코더(300)는 도 1의 인코더(100)에 의해 발생되는 PS 확장 데이터를 포함하는 mp2 데이터 스트림을 수신하는 수신기(301)를 포함한다. 그러나, 도 3의 디코더(300)는 모노 신호만을 발생시키는 강도 디코더(303)를 포함한다. 이 실시예에서, 수신기(301)는 단지 고주파수 모노 범위 신호만을 강도 디코더(303)에 공급한다. 강도 디코더(303)는 응답시 mp2 알고리즘에 따라서 고주파수 범위 펄스 코드 변조된(PCM) 모노 신호를 발생시킨다.
게다가, 도 3의 디코더(300)는 수신기(301)에 결합되는 이중 모노 디코더(305)를 포함한다. 이중 모노 디코더(305)는 2개의 모노 인코딩된 저주파수 범위 신호들을 수신하여 이들을 mp2 프로토콜에 따라서 디코딩한다. 단일 서브밴드 디코더는 강도 디코더(303) 및 이중 모노 디코더(305) 둘 다에 사용될 수 있고 고주파수 범위 모노 신호 및 2개의 모노 인코딩된 저주파수 범위 신호들이 순차적으로 이에 의해 디코딩될 수 있다는 것을 인지할 것이다.
게다가, 디코더(300)는 수신기에 결합되고 강도 인코딩된 스테레오 데이터(스테레오 강도 인코더(117)에 의해 발생되는 mp2 스케일 팩터들) 및 파라메트릭하게 인코딩된 스테레오 파라미터들(ICC, ITD 및 차 IID 파라미터들)을 수신하는 파라미터 프로세서(307)를 포함한다.
파라미터 프로세서(307)는 mp2 스케일 팩터들 및 차 IID 파라미터들에 응답하여 절대 IID 파라미터들을 발생시킨다. 게다가, 파라미터 프로세서(307)는 강도 디코더(303)를 위한 모노 스케일 팩터들을 발생시킬 수 있다. 모노 스케일 팩터들은 인코더에 의해 발생되어 보조 데이터로서 전송될 수 있다. 그 후, 이들 모노 스케일 팩터들은 서브밴드 디코더에 공급되어 에일리어싱 왜곡 없이 모노 신호를 발생시킨다.
디코더(300)는 강도 디코더(303)에 결합되는 파라메트릭 스테레오 디코더(309), 이중 모노 디코더(305) 및 파라미터 프로세서(307)를 더 포함한다. 따라서, 파라메트릭 스테레오 디코더(309)는 디코딩된 고주파수 범위 모노 신호, 2개의 저주파수 범위 신호들 및 ICC, ITD 및 절대 IID 파라미터들을 수신한다. 그 후, 파라메트릭 스테레오 디코더(309)는 수신된 데이터 스트림의 PS 확장 데이터를 이용하여 파라메트릭 스테레오 디코딩을 수행함으로써 고품질 스테레오 신호를 발생시키도록 진행한다.
본 발명은 하드웨어, 소프트웨어, 펌웨어 또는 이들의 임의의 조합으로부터 임의의 적절한 형태로 구현될 수 있다. 그러나, 본 발명은 하나 이상의 데이터 프로세서들 및/또는 디지털 신호 프로세서들 상에서 실행되는 컴퓨터 소프트웨어로서 구현되는 것이 바람직하다. 본 발명의 실시예의 소자들 및 구성요소들은 물리적으로, 기능적으로 그리고 논리적으로 임의의 적절한 방식으로 구현될 수 있다. 실제로, 이 기능성은 단일 유닛, 다수의 유닛들 또는 다른 기능 유닛들의 부분으로서 구현될 수 있다. 이와 같이, 본 발명은 단일 유닛으로 구현될 수 있거나 여러 유닛들 및 프로세서들 간에 물리적으로 그리고 기능적으로 분포될 수 있다.
본 발명이 바람직한 실시예와 관련하여 서술되었지만, 이는 본원에 설명된 특정 형태로 제한되지 않는다. 오히려, 본 발명의 범위는 첨부한 청구범위에 의해서만 제한된다. 청구항들에서, 용어 '포함하는(comprising)'은 다른 소자들 또는 단계들의 존재를 배제하지 않는다. 게다가, 개별적으로 목록화되었지만, 다수의 수단, 소자들 또는 방법 단계들은 예를 들어 단일 유닛 또는 프로세서에 의해 구현될 수 있다. 게다가, 개별적인 특징들이 여러 청구항들에 포함될 수 있지만, 이들은 유용하게 결합될 수 있고, 상이한 청구항들에 포함은 특징들의 조합이 가능하지 않고 유용하지 않는다는 것을 의미하지 않는다. 게다가, 단일 참조들은 다수를 배제하지 않는다. 따라서, "하나의('a', 'an')", "제 1", "제 2" 등에 대한 참조들은 다수를 배제하지 않는다.

Claims (22)

  1. 멀티 채널 오디오 인코더에 있어서,
    입력 멀티 채널 신호를 수신하는 수단(101);
    상기 입력 멀티 채널 신호의 적어도 제 1 부분을 위한 멀티 채널 파라미터들 및 단일 채널 신호를 발생시키는 파라메트릭 멀티 채널 인코더(115)로서, 상기 멀티 채널 파라미터들은 상기 단일 채널 신호와 관련된 멀티 채널 정보를 포함하는, 상기 파라메트릭 멀티 채널 인코더(115);
    상기 입력 멀티 채널 신호 및 상기 단일 채널 신호에 응답하여 멀티 채널 강도 데이터를 발생시키는 멀티 채널 강도 인코더(117); 및
    상기 단일 채널 신호, 상기 강도 데이터 및 상기 멀티 채널 파라미터들을 포함하는 인코딩된 오디오 출력 데이터를 발생시키는 수단(113)을 포함하는, 멀티 채널 오디오 인코더.
  2. 제 1 항에 있어서, 상기 멀티 채널 파라미터들은 채널간 강도 차(Inter-channel Intensity Difference; IID) 파라미터들을 포함하는, 멀티 채널 오디오 인코더.
  3. 제 2 항에 있어서, 상기 채널간 강도 차(IID) 파라미터들은 상기 강도 데이터에 대한 차 파라미터들인, 멀티 채널 오디오 인코더.
  4. 제 1 항에 있어서, 상기 멀티 채널 파라미터들은 채널간 시간 차(Inter-channel Time Difference; ITD) 파라미터들을 포함하는, 멀티 채널 오디오 인코더.
  5. 제 1 항에 있어서, 상기 멀티 채널 파라미터들은 채널간 교차-상관들(Inter-channel Cross-Correlations; ICC) 파라미터들을 포함하는, 멀티 채널 오디오 인코더.
  6. 제 1 항에 있어서, 상기 강도 데이터는 멀티 채널들을 위한 개별적인 스케일 팩터들을 포함하는, 멀티 채널 오디오 인코더.
  7. 제 6 항에 있어서, 상기 멀티 채널 파라미터들은 상기 강도 데이터의 개별적인 스케일 팩터들에 대한 스케일 팩터 차 값들을 포함하는, 멀티 채널 오디오 인코더.
  8. 제 1 항에 있어서,
    상기 입력 멀티 채널 신호를 상기 제 1 부분 및 제 2 부분으로 분할하는 수단(105, 107); 및
    다수의 개별적으로 인코딩된 단일 채널 신호들로서 상기 제 2 부분을 인코딩하는 수단(109, 111)을 더 포함하며,
    상기 발생 수단(113)은 상기 인코딩된 오디오 출력 데이터에 상기 개별적으로 인코딩된 단일 채널 신호들을 포함하도록 동작가능한, 멀티 채널 오디오 인코더.
  9. 제 8 항에 있어서, 상기 제 2 부분은 상기 입력 신호의 저주파수 대역에 대응하고 상기 제 1 부분은 상기 입력 신호의 고주파수 대역에 대응하는, 멀티 채널 오디오 인코더.
  10. 제 1 항에 있어서, 상기 멀티 채널 오디오 인코더는 스테레오 오디오 인코더인, 멀티 채널 오디오 인코더.
  11. 제 1 항에 있어서, 단일 데이터 스트림으로서 상기 인코딩된 오디오 출력 데이터를 전송하는 수단을 더 포함하는, 멀티 채널 오디오 인코더.
  12. 오디오 신호를 인코딩하는 방법에 있어서,
    입력 멀티 채널 신호를 수신하는 단계;
    파라메트릭 멀티 채널 인코딩에 의해 상기 입력 멀티 채널 신호의 적어도 제 1 부분을 위한 멀티 채널 파라미터들 및 단일 채널 신호를 발생시키는 단계로서, 상기 멀티 채널 파라미터들은 상기 단일 채널 신호와 관련된 멀티 채널 정보를 포함하는, 상기 발생 단계;
    상기 입력 멀티 채널 신호 및 상기 단일 채널 신호에 응답하여 멀티 채널 강도 데이터를 발생시키는 단계; 및
    상기 단일 채널 신호, 상기 강도 데이터 및 상기 멀티 채널 파라미터들을 포함하는 인코딩된 오디오 출력 데이터를 발생시키는 단계를 포함하는, 오디오 신호 인코딩 방법.
  13. 멀티 채널 오디오 디코더에 있어서,
    단일 채널 신호, 상기 단일 채널 신호와 관련된 멀티 채널 정보를 포함하는 파라메트릭하게 인코딩된 멀티 채널 파라미터들 및 상기 단일 채널 신호와 관련된 강도 인코딩된 멀티 채널 강도 데이터를 수신하는 수단(201);
    상기 단일 채널 신호 및 상기 강도 데이터로부터 제 1 디코딩된 신호를 발생시키는 강도 디코더(203); 및
    상기 제 1 디코딩된 신호 및 상기 파라메트릭하게 인코딩된 멀티 채널 파라미터들로부터 디코딩된 멀티 채널 출력 신호를 발생시키도록 동작가능한 파라메트릭 멀티 채널 디코더(207)를 포함하는, 멀티 채널 오디오 디코더.
  14. 제 13 항에 있어서, 상기 제 1 디코딩된 신호는 멀티 채널 신호이고, 상기 강도 디코더(203)는 상기 파라메트릭하게 인코딩된 멀티 채널 파라미터들의 강도 정보에 응답하여 상기 강도 데이터를 수정하도록 동작가능한, 멀티 채널 오디오 디코더.
  15. 멀티 채널 오디오 디코더에 있어서,
    단일 채널 신호, 상기 단일 채널 신호와 관련된 멀티 채널 정보를 포함하는 파라메트릭하게 인코딩된 멀티 채널 파라미터들 및 상기 단일 채널 신호와 관련된 강도 인코딩된 멀티 채널 강도 데이터를 수신하는 수단(301);
    상기 단일 채널 신호로부터 제 1 디코딩된 신호를 발생시키는 강도 디코더(303); 및
    상기 제 1 디코딩된 신호, 상기 강도 데이터 및 상기 파라메트릭하게 인코딩된 멀티 채널 파라미터들로부터 디코딩된 멀티 채널 출력 신호를 발생시키도록 동작가능한 파라메트릭 멀티 채널 디코더(309)를 포함하는, 멀티 채널 오디오 디코더.
  16. 제 15 항에 있어서, 상기 제 1 디코딩된 신호는 모노 신호이고 상기 파라메트릭 멀티 채널 디코더(309)는 상기 강도 데이터에 응답하여 상기 파라메트릭하게 인코딩된 멀티 채널 파라미터들의 강도 정보를 수정하도록 동작가능한, 멀티 채널 오디오 디코더.
  17. 멀티 채널 오디오 디코딩 방법에 있어서,
    단일 채널 신호, 상기 단일 채널 신호와 관련된 멀티 채널 정보를 포함하는 파라메트릭하게 인코딩된 멀티 채널 파라미터들 및 상기 단일 채널 신호와 관련된 강도 인코딩된 멀티 채널 강도 데이터를 수신하는 단계;
    강도 디코딩에 의해 상기 단일 채널 신호 및 상기 강도 데이터로부터 제 1 디코딩된 신호를 발생시키는 단계; 및
    파라메트릭 멀티 채널 디코딩에 의해 상기 제 1 디코딩된 신호 및 상기 파라메트릭하게 인코딩된 멀티 채널 파라미터들로부터 디코딩된 멀티 채널 출력 신호를 발생시키는 단계를 포함하는, 멀티 채널 오디오 디코딩 방법.
  18. 제 12 항에 따른 방법 또는 제 17 항에 따른 방법을 실행하도록 하는 컴퓨터 프로그램.
  19. 제 18 항에 청구된 바와 같은 컴퓨터 프로그램을 포함하는 레코드 캐리어.
  20. 제 1 항에 따른 멀티 채널 오디오 인코더와 제 1 3항 또는 제 15 항에 따른 멀티 채널 오디오 디코더를 포함하는 멀티 채널 오디오 분배 시스템.
  21. 멀티 채널 오디오 신호에 있어서,
    단일 채널 신호 데이터;
    상기 단일 채널 신호와 관련되고 제 1 인코딩 프로토콜에 따라서 인코딩되는 강도 인코딩된 멀티 채널 강도 데이터; 및
    상기 단일 채널 신호와 관련된 멀티 채널 정보를 포함하고 상기 제 1 인코딩 프로토콜과 다른 제 2 인코딩 프로토콜에 따라서 인코딩되는 파라메트릭하게 인코딩된 멀티 채널 파라미터들을 포함하는, 멀티 채널 오디오 신호.
  22. 제 21 항에 있어서, 상기 단일 채널 데이터는 상기 제 1 인코딩 프로토콜에 따라서 인코딩되는, 멀티 채널 오디오 신호.
KR1020067016541A 2004-02-17 2005-02-11 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들 KR20070001139A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP04100631.3 2004-02-17
EP04100631 2004-02-17

Publications (1)

Publication Number Publication Date
KR20070001139A true KR20070001139A (ko) 2007-01-03

Family

ID=34896077

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067016541A KR20070001139A (ko) 2004-02-17 2005-02-11 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들

Country Status (6)

Country Link
US (1) US20070168183A1 (ko)
EP (1) EP1719115A1 (ko)
JP (1) JP2007528025A (ko)
KR (1) KR20070001139A (ko)
CN (1) CN1922654A (ko)
WO (1) WO2005083679A1 (ko)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101014998B (zh) * 2004-07-14 2011-02-23 皇家飞利浦电子股份有限公司 音频通道转换
KR100857119B1 (ko) * 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7752053B2 (en) 2006-01-13 2010-07-06 Lg Electronics Inc. Audio signal processing using pilot based coding
GB2453117B (en) * 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
CN101594186B (zh) * 2008-05-28 2013-01-16 华为技术有限公司 双通道信号编码中生成单通道信号的方法和装置
US8306233B2 (en) * 2008-06-17 2012-11-06 Nokia Corporation Transmission of audio signals
KR101756834B1 (ko) 2008-07-14 2017-07-12 삼성전자주식회사 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치
US20100098258A1 (en) * 2008-10-22 2010-04-22 Karl Ola Thorn System and method for generating multichannel audio with a portable electronic device
GB2470059A (en) 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
CN201499288U (zh) * 2009-09-09 2010-06-02 鸿富锦精密工业(深圳)有限公司 音频编/解码芯片输出电路
PT2483887T (pt) 2009-09-29 2017-10-23 Dolby Int Ab Descodificador de sinal de áudio mpeg-saoc, método para fornecer uma representação de sinal de mistura ascendente usando descodificação mpeg-saoc e programa de comutador usando um valor comum de parâmetros de correlação inter-objetos dependente de tempo/frequência
US9385674B2 (en) * 2012-10-31 2016-07-05 Maxim Integrated Products, Inc. Dynamic speaker management for multichannel audio systems
CN103413553B (zh) 2013-08-20 2016-03-09 腾讯科技(深圳)有限公司 音频编码方法、音频解码方法、编码端、解码端和系统
TWI774136B (zh) * 2013-09-12 2022-08-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
GB2559200A (en) * 2017-01-31 2018-08-01 Nokia Technologies Oy Stereo audio signal encoder
US11451919B2 (en) * 2021-02-19 2022-09-20 Boomcloud 360, Inc. All-pass network system for colorless decorrelation with constraints

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
KR101021079B1 (ko) * 2002-04-22 2011-03-14 코닌클리케 필립스 일렉트로닉스 엔.브이. 파라메트릭 다채널 오디오 표현
ES2300567T3 (es) * 2002-04-22 2008-06-16 Koninklijke Philips Electronics N.V. Representacion parametrica de audio espacial.
CN100539742C (zh) * 2002-07-12 2009-09-09 皇家飞利浦电子股份有限公司 多声道音频信号编解码方法和装置
US7191136B2 (en) * 2002-10-01 2007-03-13 Ibiquity Digital Corporation Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband
BR0316611A (pt) * 2002-11-28 2005-10-11 Koninkl Philips Electronics Nv Método para codificar um sinal de áudio, codificador para codificar um sinal de áudio, e, aparelho para prover um sinal de áudio
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems

Also Published As

Publication number Publication date
WO2005083679A1 (en) 2005-09-09
JP2007528025A (ja) 2007-10-04
CN1922654A (zh) 2007-02-28
US20070168183A1 (en) 2007-07-19
EP1719115A1 (en) 2006-11-08

Similar Documents

Publication Publication Date Title
KR20070001139A (ko) 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들
KR102230727B1 (ko) 광대역 정렬 파라미터 및 복수의 협대역 정렬 파라미터들을 사용하여 다채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
JP4589962B2 (ja) レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
US9449601B2 (en) Methods and apparatuses for encoding and decoding object-based audio signals
RU2406166C2 (ru) Способы и устройства кодирования и декодирования основывающихся на объектах ориентированных аудиосигналов
JP5455647B2 (ja) オーディオデコーダ
US8817992B2 (en) Multichannel audio coder and decoder
US7848931B2 (en) Audio encoder
US20030236583A1 (en) Hybrid multi-channel/cue coding/decoding of audio signals
EP2082396A1 (en) Audio coding using downmix
EP1934973A1 (en) Temporal and spatial shaping of multi-channel audio signals
JPWO2006003891A1 (ja) 音声信号復号化装置及び音声信号符号化装置
AU2006228821A1 (en) Device and method for producing a data flow and for producing a multi-channel representation
KR20070019718A (ko) 오디오 신호 부호화 장치 및 오디오 신호 복호화 장치
JP2005517987A (ja) パラメトリックオーディオ符号化
JP4809234B2 (ja) オーディオ符号化装置、復号化装置、方法、及びプログラム
Rumsey Data reduction for high quality digital audio storage and transmission
KR20070108314A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid