KR20070001208A - 복수-채널 인코더 - Google Patents

복수-채널 인코더 Download PDF

Info

Publication number
KR20070001208A
KR20070001208A KR1020067020276A KR20067020276A KR20070001208A KR 20070001208 A KR20070001208 A KR 20070001208A KR 1020067020276 A KR1020067020276 A KR 1020067020276A KR 20067020276 A KR20067020276 A KR 20067020276A KR 20070001208 A KR20070001208 A KR 20070001208A
Authority
KR
South Korea
Prior art keywords
channels
channel
signal
data
output
Prior art date
Application number
KR1020067020276A
Other languages
English (en)
Other versions
KR101158698B1 (ko
Inventor
디르크 제이. 브리바트
에릭 지. 피. 슈이저스
제라르드 에이치. 호토
마시엘 더블유. 반 룬
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20070001208A publication Critical patent/KR20070001208A/ko
Application granted granted Critical
Publication of KR101158698B1 publication Critical patent/KR101158698B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic

Abstract

상보적인 파라미터 데이터(370,430,450)와 함께 M개의 출력 채널로 전송된 대응 출력 신호(480,490)를 생성하기 위해 N개의 입력 채널로 전송된 입력 신호(300,310,320,330,340)를 처리하기 위한 복수-채널 인코더(10)가 설명된다(M과 N은 정수이며, N>M). 인코더(10)는 대응 출력 신호(480,490)를 생성하기 위해 입력 신호(300,310,320,330,340)를 다운-믹싱하기 위한 다운-믹서를 포함하며, 상기 인코더는 또한 파라미터 데이터(370,430,450)를 생성하기 위해 입력 신호(300,310,320,330,340)를 처리하기 위한 분석기를 포함하며, 상기 파라미터 데이터는 출력 신호의 M개의 채널로부터 입력 신호의 N개의 채널 중 하나 이상을 디코딩하는 동안 재생성을 허용하기 위해 입력 신호의 N개의 채널 사이의 상호 차이를 설명한다. 이러한 인코더(10)는 매우 효율적인 데이터 인코딩을 제공할 수 있으며 또한 N개 미만의 디코딩 출력 채널을 구비한 비교적 더 단순한 디코더를 가진 후방 호환성일 수 있다. 본 발명은 또한 이러한 복수-채널과 호환가능한 디코더에 관한 것이다.

Description

복수-채널 인코더{MULTI-CHANNEL ENCODER}
본 발명은 공간 오디오의 파라미터 설명을 이용한 복수-채널 오디오 인코더와 같은, 복수-채널 인코더에 관한 것이다. 게다가, 본 발명은 또한 이러한 복수-채널 인코더 내의 공간 오디오 신호와 같은 신호를 처리하는 방법에 관한 것이다. 더욱이, 본 발명은 이러한 복수-채널 인코더로 생성된 신호를 디코딩하기 위해 작동하는 디코더에 관한 것이다.
오디오 기록 및 재생은 최근 수년동안 모노럴(monaural) 단일-채널 포맷에서 이중-채널 스테레오 포맷으로 진보되어 왔으며 더욱 최근에는, 예를 들어 가정용 영화 시스템에서 종종 사용되는 것과 같은 5개 채널 오디오 포맷과 같은 복수-채널 포맷으로 진보되었다. 수퍼 오디오 컴팩트 디스크(SACD)와 디지털 다용도 디스크(DVD) 데이터 캐리어의 도입은 이러한 5개 채널 오디오 재생이 현대의 관심의 대상이 되는 결과를 가져왔다. 많은 사용자들은 현재 그들의 가정에서 5개 채널의 오디오 재생을 제공할 수 있는 장비를 가지고 있으며; 이에 따라, 적절한 데이터 캐리어 상의 5개 채널의 오디오 프로그램 컨텐츠는, 예를 들어 전술한 SACD 및 DVD 유형의 데이터 캐리어와 같이, 더욱 이용가능하게 되고 있다. 복수-채널 프로그램 컨텐츠에 대한 증가하는 관심으로 인해, 복수-채널 오디오 프로그램 컨텐츠의 더욱 효율적인 코딩은, 예를 들어, 개선된 품질, 더욱 길어진 재생 시간 또는 심지어 추가된 채널 중 한 가지 이상을 제공하기 위해, 중요한 사안이 되고 있다.
파라미터 설명기에 의한 오디오 프로그램 컨텐츠에 대한 공간 오디오 정보를 나타낼 수 있는 인코더는 알려져 있다. 예를 들어, 공개된 국제 PCT 특허 출원 PCT/IB2003/002858(재2004/008805)에서, 적어도 제 1 신호 성분(LF), 제 2 신호 성분(LR) 및 제 3 신호 성분(RF)을 포함하는 복수-채널 오디오 신호의 인코딩은 설명된다. 이러한 코딩은:
(a) 제 1 인코딩된 신호(L) 및 제 1 인코딩 파라미터(P2) 집합을 생성하기 위한 제 1 파라미터 인코더를 사용함으로써 제 1 및 제 2 신호 성분을 인코딩하는 단계;
(b) 제 2 인코딩된 신호(T)와 제 2 인코딩 파라미터(P1) 집합을 생성하기 위해 제 2 파라미터 인코더를 사용함으로써 제 1 인코딩된 신호(L)와 추가적 신호(R)를 인코딩하는 단계로서, 추가 신호(R)는 적어도 제 3 신호 성분(RF)으로부터 유도된, 제 1 인코딩된 신호(L)와 추가적 신호(R)를 인코딩하는 단계
(c) 적어도 제 2 인코딩된 신호(T), 제 1 인코딩 파라미터(P2) 집합 및 제 2 인코딩 파라미터(P1) 집합으로부터 유도된 결과 인코딩된 신호(T)에 의해 적어도 복수-채널 오디오 신호를 나타내는 단계
를 포함하는 방법을 사용한다.
오디오 신호의 파라미터 설명은 수년동안 관심을 받아 왔으며, 이는 오디오 신호를 설명하는 양자화된 파라미터를 전송하는 단계는 비교적 작은 전송 용량을 필요로 하는 것으로 나타났기 때문이다. 이들 양자화된 파라미터는 그들의 대응하는 원래 오디오 신호와 상당히 다르지 않은 오디오 신호를 지각적으로 재생성하기 위해 디코더 내에 수신되고 처리될 수 있다.
현대의 복수-채널 인코더는 출력 인코딩된 데이터로 전송된 다수의 오디오 채널로 실질적으로 선형으로 스케일링되는 비트율에서 출력 인코딩된 데이터를 생성한다. 이러한 특성은 문제가 되는 추가적 채널의 포함을 제공하는데, 이는 주어진 데이터 캐리어 저장 용량 또는 오디오 표현의 품질에 대한 재생 지속 기간이 더 많은 채널을 수용하도록 이에 따라 희생되어야 하기 때문이다.
본 발명의 목적은 예를 들어, 복수-채널 오디오 데이터 컨텐츠와 같은, 복수-채널 데이터 컨텐츠의 더욱 효율적인 인코딩을 제공하기 위해 작동하는 복수-채널 인코더를 제공하는 것이다.
발명자는, 적절한 인코딩 방법의 사용을 통해, 출력 인코딩된 데이터는, 예를 들어, 5개 채널의 오디오 프로그램 컨텐츠에 대응하는 정보를 전달하면서, 2개 채널의 오디오 프로그램 컨텐츠, 즉, 스테레오를 전달하는데 통상 필요한 비트율을 사용할 수 있다는 것을 이해했다.
따라서, 본 발명의 제 1 양상에 따라, 파라미터 데이터와 함께 M개의 출력 채널로 전송된 대응 출력 신호를 생성하기 위해 N개의 입력 채널로 전송된 입력 신호를 처리하기 위해 배열된 복수-채널 인코더가 제공되며, 이 때 M과 N은 정수이며 N은 M보다 크고, 상기 인코더는:
(a) 대응하는 출력 신호를 생성하기 위해 입력 신호를 다운-믹싱하는 다운-믹서; 및
(b) 다운-믹싱동안 또는 별도의 프로세스로서 입력 신호를 처리하기 위한 분석기로서, 상기 분석기는 출력 신호에 상보적인 상기 파라미터 데이터를 생성하도록 작동하며, 상기 파라미터 데이터는 출력 신호의 M개의 채널로부터 입력 신호의 N개의 채널 중 하나 이상을 디코딩하는 동안 실질적인 재생성을 허용하기 위해 입력 신호의 N개의 채널 사이에 상호 차이를 설명하며, 상기 출력 신호는 후방 호환성을 가능케 하는 N개 또는 N개 미만의 출력 신호를 제공하는 디코더 내의 재생을 위해 호환가능한 형태인, 입력 신호를 처리하기 위한 분석기
를 포함한다.
본 발명의 이점은 복수-채널 인코더가, 예를 들어, 2개 채널의 스테레오 재생 장치와 호환가능하도록 렌더링될 수 있는 출력 스트림으로 복수-채널 입력 신호를 더 효율적으로 인코딩할 수 있다는 점이다.
이전 유형의 대응 디코더를 구비한 인코더의 이러한 후방 호환성은 세 가지 방법으로 제공된다:
(a) 인코더로부터의 출력 다운-믹싱된 신호는 이들 신호의 재생이, 즉, 추가적 처리 또는 디코딩없이, 대응하는 제한된 수의 고성 스피커의 제한이 주어진 경우, 예컨대, 5개 채널의 공간 이미지의 양호한 근사인 공간 이미지를 초래하는 방식으로 생성된다. 이러한 속성은 후방 재생 호환성을 보장한다;
(b) 다운-믹싱된 신호와 연관된 공간 파라미터는 비트 스트림의 보조적 데이터 부분에 배치된다. 보조적 데이터 부분을 디코딩할 수 없는 디코더는 여전히 전송된 신호를 디코딩할 수 있을 것이다. 이러한 속성은 후방 디코딩 호환성을 보장한다; 및
(c) 비트-스트림의 보조 부분과 디코더 구조에 저장된 파라미터는 파라미터 디코더가 적절한 2개, 3개 및 4개 채널의 신호를 재생성할 수 있는 방법으로 제조된다. 이러한 속성은 이용된 재생 시스템에 대한 융통성을 제공하며, 따라서 2개, 3개 및 4개 채널의 시스템과의 후방 호환성을 제공한다.
바람직하게, 인코더에서, 분석기는 시간 도메인에서 주파수 도메인으로 변환에 의해 입력 신호를 변환하고 파라미터 데이터를 생성하기 위해 이들 변환된 입력 신호를 처리하기 위한 처리 수단을 포함한다. 주파수 도메인 내의 입력 신호의 처리는 인코더 내의 효율적인 인코딩을 제공하는 이점이 있다. 더 바람직하게, 인코더에서, 다운-믹서 및 분석기 중 적어도 하나는 출력 신호를 생성하기 위해 시간-주파수 타일의 시퀀스로서 입력 신호를 처리하기 위해 배열된다.
바람직하게, 인코더에서, 타일들은 서로 중첩하는 분석 윈도우의 변환에 의해 얻어진다. 이러한 중첩은 더 나은 연속성을 허용하며 이에 따라 출력 신호가 입력 신호의 표시를 재생성하기 위해 이후 디코딩될 때 인코딩 결함을 감소시킨다.
바람직하게, 인코더는 M개의 출력 신호에의 포함을 위한 M개의 중간 오디오 데이터 채널을 생성하기 위해 입력 신호를 처리하기 위한 코더를 포함하며, 분석기는:
(a) 인터-채널 입력 신호 제곱 비율 또는 대수의 레벨 차이;
(b) 입력 신호 사이의 인터-채널 통일성;
(c) 하나 이상의 채널의 입력 신호와 하나 이상의 채널의 입력 신호의 제곱의 합 사이의 제곱 비율; 및
(d) 신호 쌍 사이의 위상차 또는 시간차
중 적어도 하나와 관련된 파라미터 데이터 내의 정보를 출력하기 위해 배열된다.
더 바람직하게, (d) 내의 위상차는 평균 위상차이다.
바람직하게, 인코더에서, 위상차, 통일성 데이터 및 제곱 비율 중 적어도 하나의 계산은 출력 신호를 생성하기 위해 주요 성분 분석(PCA) 및/또는 인터-채널 위상 정렬이 후속된다.
바람직하게, 입력 데이터가 재생성될 때 원래 입력 신호와의 더 가까운 근접성(resemblance)을 제공하기 위해, 인코더에서, N개 채널로 전송된 입력 신호들 중 적어도 하나는 효과 채널에 대응한다.
바람직하게, 인코더는 종래의 재생 시스템을 사용하여 재생에 적합한 형태로 출력 신호를 생성하기 위해 적응된다.
본 발명의 제 2 양상에 따라서, 파라미터 데이터와 함께 M개의 출력 채널로 전송된 대응 출력 신호를 생성하기 위해 복수-채널 인코더 내에 N개의 입력 채널로 전송된 입력 신호 인코딩 방법이 제공되며(M과 N은 정수이며 N은 M보다 큼), 상기 방법은:
(a) 상기 대응 출력 신호를 생성하기 위해 입력 신호를 다운-믹싱하는 단계; 및
(b) 분석기에서 다운-믹싱되거나 분리될 때 입력 신호를 처리하는 단계로서, 상기 처리 단계는 출력 신호에 상보적인 상기 파라미터 데이터를 제공하며, 상기 파라미터 데이터는 디코딩 동안 출력 신호의 M개의 채널로부터 입력 신호의 N개의 채널의 재생성을 실질적으로 허용하기 위해 입력 데이터의 N개의 채널 사이의 상호 차이를 설명하며, 상기 출력 신호는 N개 또는 N개 미만의 출력 신호를 제공하는 디코더에서 재생을 위해 호환가능한 형태인, 입력 신호를 처리하는 단계
를 포함한다.
바람직하게, 상기 방법은 5개 채널에 대응하는 입력 신호를 인코딩하고 대응하는 2개 채널의 스테레오 디코더, 3개 채널의 디코더 및 4개 채널의 디코더 중 하나 이상과 호환가능한 형태로 출력 신호와 파라미터 데이터를 생성하기 위해 적응된다.
바람직하게, 상기 방법에서, 상기 처리 단계는 시간 도메인에서 주파수 도메인으로의 변환에 의해 입력 신호를 변환하는 단계를 포함한다.
바람직하게, 상기 방법에서, 입력 신호들 중 적어도 하나는 출력 신호를 생성하기 위해 시간-주파수 타일의 시퀀스로서 처리된다.
바람직하게, 상기 방법에서, 타일들은 상호 중첩하는 분석 윈도우에 대응한다.
바람직하게, 상기 방법은 출력 신호에 포함하기 위한 M개의 중간 오디오 데이터 채널을 생성하도록 입력 신호를 처리하기 위한 코더를 사용하는 단계를 포함하며, 상기 코더는
(a) 인터-채널 입력 신호 제곱 비율 또는 대수의 레벨 차이;
(b) 입력 신호 사이의 인터-채널 통일성;
(c) 하나 이상의 채널의 입력 신호와 하나 이상의 채널의 입력 신호의 제곱의 합 사이의 제곱 비율; 및
(d) 신호 쌍 사이의 위상차 또는 시간차
중 적어도 하나와 관련된 파라미터 데이터 내의 정보를 출력하기 위해 배열된다.
더 바람직하게, (d)에서의 위상차는 평균 위상차이다.
바람직하게, 상기 방법에서, 레벨차, 통일성 데이터 및 제곱 비율 중 적어도 하나는 출력 신호를 생성하기 위해 주요 성분 분석 및/또는 위상 정렬이 후속된다.
바람직하게, 상기 방법에서, N개의 채널로 전송된 입력 신호들 중 적어도 하나는 효과 채널에 대응한다.
본 발명의 제 3 양상에 따라, 데이터 캐리어 상에 저장된 인코딩된 데이터 컨텐츠가 제공되며, 상기 데이터 컨텐츠는 본 발명의 제 2 양상에 따라 방법을 사용하여 생성된다.
본 발명의 제 4 양상에 따라, 본 발명의 제 1 양상에 따른 인코더에 의해 생성된 것과 같은 인코딩된 출력 데이터를 디코딩하도록 작동하는 디코더가 제공되며, 상기 인코딩된 출력 데이터는 M개의 채널과 N개의 채널의 입력 신호로부터 생성된 관련 파라미터 데이터를 포함하며, 이 때 M<N이고, M과 N은 정수이며, 상기 디코더는:
(a) 인코딩된 출력 데이터를 수신하고 이를 시간 도메인에서 주파수 도메인으로 변환하고;
(b) 인코딩된 출력 데이터에 직접 포함되지 않거나 이로부터 생략된 하나 이상의 N개의 채널의 입력 신호에 대응하는 재생성된 데이터 컨텐츠를 M개의 채널로부터 재생성하기 위해 M개의 채널로부터 컨텐츠를 추출하기 위해 주파수 도메인 내의 파라미터 데이터를 적용하며; 그리고
(c) 디코더의 하나 이상의 출력에서 N개의 채널의 하나 이상의 재생성된 입력 신호를 출력하기 위해 재생성된 데이터 컨텐츠를 처리하기 위한 프로세서를 포함한다.
바람직하게, 디코더에서, 프로세서는 디코더에서 N개의 채널의 상기 하나 이상의 입력 신호를 재생성하는데 사용하기 위한 신호의 비상관된 버전을 얻기 위해 모든-통과 비상관 필터를 적용하도록 작동한다.
바람직하게, 디코더에서, 프로세서는 디코더에서 N개의 채널의 상기 하나 이상의 입력 신호를 재생성하기 위해 그들의 구성 성분으로 M개의 채널의 신호와 그 비상관된 버전을 분할하기 위해 역 인코더 회전을 적용하도록 작동한다.
본 발명의 특성은 본 발명의 범위를 이탈하지 않고 임의의 결합으로 조합될 수 있다.
본 발명의 실시예는 이제, 다음 도면을 참조하여, 예로써만 설명될 것이다.
도 1은 본 발명에 따른 제 1 복수-채널 인코더의 개략도.
도 2는 예를 들어 저주파 효과와 같은 효과의 제공을 포함하는 본 발명에 따른 제 2 복수-채널 인코더의 개략도.
도 3은 복수-채널 디코더가 도 1 및 도 2의 인코더에 상보적이며 이러한 인코더로부터 제공된 출력 데이터를 디코딩할 수 있는, 본 발명에 따른 복수-채널 디코더의 개략도.
입력 데이터의 N개의 채널이 제공되고 대응하는 인코딩된 출력 데이터 스트림을 생성하도록 입력 데이터를 인코딩하기 위해 배열된 복수-채널 인코더 내에서 실행된 인코딩을 개선하기 위해, 발명자는 인코더가 유리하게:
(a) N개의 채널의 입력 데이터를 M개의 채널로 다운-믹싱하고(M<N); 및
(b) 출력 데이터 스트림을 생성할 때 M개의 채널의 데이터와 결합하도록 비교적 소량의 파라미터 오버헤드 데이터를 생성하도록, 작동하는 것을 생각하였으며, 상기 파라미터 데이터는 출력 데이터 스트림이 공급된 후속 디코더에서 N개의 채널에 대응하는 데이터의 재구성을 가능케 하도록 배열된다.
예컨대, 복수-채널 인코더는 바람직하게 5개 채널 인코더, 즉 N=5이다. 5개 채널의 인코더는 2개 채널의 중간 데이터(즉, M=2)를 생성하기 위해 5개의 입력 채널에 대응하는 데이터를 다운-믹싱하기 위해 구성된다. 게다가, 5개 채널의 인코더는 출력 데이터 스트림을 생성하기 위해 2개의 채널의 데이터와 결합하도록 연관된 파라미터 오버헤드 데이터를 생성하도록 작동하며, 파라미터 데이터는 디코더가 5 개의 입력 채널의 표시를 구성할 수 있게 하기에 충분하다. 디코더의 장점은 N=2,3,4인, 즉, 2-채널, 3-채널 및 4-채널 출력 상황과 후방 호환가능한 상황을 지원하기 위해 후방 호환가능하다는 것이다.
본 발명의 바람직한 실시예에서, 인코더는 N개의 입력 데이터 채널을 처리하도록 작동한다. N개의 입력 채널은 중앙 오디오 데이터 채널, 왼쪽-전방 오디오 데이터 채널, 왼쪽-후방 오디오 데이터 채널, 오른쪽-전방 오디오 데이터 채널 및 오른쪽 후방 오디오 데이터 채널에 해당하며; 이러한 5개의 채널은 가정용 영화형 프로그램 컨텐츠 재생에 적합한 음향의 명백한 3차원 분산을 생성할 수 있다. N개의 입력 데이터 채널은, 예를 들어, 현대의 스테레오 오디오 코더를 사용하여 인코딩되는 것과 같이, 2개의 중간 오디오 데이터 채널로 다운-믹싱된다. 코더는 유리하게 왼쪽-전방 및 왼쪽-후방 데이터 채널의 주요 성분 분석 및/또는 위상 정렬을 이용한다. 인코더는 또한 오른쪽-전방 및 오른쪽-후방 입력 채널 상의 분리된 주요 성분 분석 및/또는 위상 정렬을 이용하기 위해 배열된다. 게다가, 인코더는 다음과 관련된 정보를 포함하는 파라미터 오버헤드 데이터를 생성하도록 작동한다.
(a) 왼쪽-전방 및 왼쪽-후방 데이터 채널 사이의 인터-채널 레벨 차이;
(b) 오른쪽-전방 및 오른쪽-후방 데이터 채널 사이의 인터-채널 레벨 차이;
(c) 왼쪽-전방 및 왼쪽-후방 채널과 관련된 인터-채널 통일성 데이터;
(d) 오른쪽-전방 및 오른쪽-후방 데이터 채널과 관련된 인터-채널 통일성 데이터; 및
(e) 중앙 데이터 채널과 왼쪽-전방, 왼쪽-후방, 오른쪽-전방 및 오른쪽-후방 데이터 채널의 제곱의 합 사이의 제곱 비율.
2개의 중간 데이터 채널과 파라미터 오버헤드 데이터는 인코더로부터 인코딩된 출력 데이터를 생성하기 위해 결합된다. 선택적으로, 인터-채널 위상차와 한 편으로 왼쪽-전방 및 왼쪽-후방 데이터 채널, 다른 한편으로는 오른쪽-전방 및 오른쪽-후방 데이터 채널 사이의 바람직하게는 전체 위상차이에 관한 데이터는 인코더로부터 인코딩된 출력 데이터에 포함된다. 본 발명의 이러한 예시적인 실시예에 관한 (a) 내지 (e)에서 행해진 파라미터 분석은 시간 및 주파수 분석을 수반하는 것이 바람직하며; 더 바람직하게는, 분석은 이후 더 설명되는 것처럼, 시간-주파수 타일에 의해 수행된다.
본 발명의 바람직한 실시예에서의 인코더 작동은 이제, 그 부분과 신호가 표 1에 제공된 것과 같이 정의된 도 1을 참조하여 관련된 수학적 함수의 관점에서 더 자세히 설명될 것이다.
10 인코더 320 중앙 신호, SC
20 제 1 채널 330 오른쪽-전방 신호, Srf
30 제 2 채널 340 오른쪽-후방 신호, Srr
40 제 3 채널 350 왼쪽 전방 변환된 신호, TSlf
100 세그먼트 및 변환 유닛 360 왼쪽 후방 변환된 신호, TSlr
110 파라미터 분석 유닛 370 제 1 파라미터 세트, PS1
120 파라미터/다운믹스 벡터 유닛 380 왼쪽 중간 신호, L1
130 다운-믹스 유닛 400 중앙 중간 신호, C1
140 세그먼트 및 변환 유닛 410 오른쪽 전방 변환된 신호, TSrf
150 세그먼트 및 변환 유닛 420 오른쪽 후방 변환된 신호, TSrr
160 파라미터 분석 유닛 430 제 2 파라미터 세트, PS2
170 파라미터/다운믹스 벡터 유닛 440 오른쪽 중간 신호, R1
180 다운-믹스 유닛 450 제 3 파라미터 세트, PS3
200 믹싱 및 파라미터 추출 유닛 460 오른쪽 사전-출력 신호, PRout
210 역변환 및 OLA 유닛 470 왼쪽 사전-출력 신호, PLout
300 왼쪽 전방 입력 신호, Slf 480 오른쪽 출력 신호, Rout
310 왼쪽 후방 입력 신호, Slr 490 왼쪽 출력 신호, Lout
도 1에서, 전체적으로 10으로 표시된 인코더가 도시된다. 인코더(10)는 제 1, 제 2 및 제 3 입력 채널(20,30,40)을 각각 포함한다. 이들 세 개의 채널(20,30,40)로부터의 출력 신호(380,400,440), 즉 LI,CI,RI 각각은 믹싱 및 파라미터 추출 유닛(200)과 연결된다. 추출 유닛(200)은 연관된 오른쪽 및 왼쪽 사전-출력 신호(460,470), 즉 PRout, PLout를 포함하며, 이들은 인코딩된 오른쪽 및 왼쪽 출력 신호(480,490), 즉 Rout,Lout 각각을 생성하기 위해 역 변환 및 OLA 유닛(210)과 연결된다.
제 1 채널(20)은, 왼쪽 전방 및 왼쪽 후방 입력 신호(300,310), 즉 Slf,Slr 각각을 수신하기 위한 세그먼트 및 변환 유닛(100)을 포함한다. 대응하는 왼쪽 전방 및 왼쪽 후방 변환된 신호(350,360), 즉 TSlf,TSlr는 채널(20)의 다운-믹스 유닛(130), 그리고 또한 채널(20)의 파라미터 분석 유닛(110)에 연결된다. 제 1 파라미터 세트 신호(370), 즉, PS1은 그 대응 출력이 다운-믹스 유닛(130)에 연결된 파라미터/다운믹스 벡터 변환 유닛(120)의 입력에 연결된다.
제 2 채널(30)은 중앙 입력 신호(320), 즉 Sc을 수신하기 위해 배열된 세그먼트 및 변환 유닛(140)을 포함한다. 중앙 중간 신호(400), 즉 CI는 전술한 것처럼 변환 유닛(140)으로부터 파라미터 추출 유닛(200)으로 연결된다.
제 3 채널(40)은 오른쪽 전방 및 오른쪽 입력 신호(330,340), 즉 Srf,Srr 각각을 수신하기 위한 세그먼트 및 변환 유닛(150)을 포함한다. 대응하는 오른쪽 전방 및 오른쪽 후방 변환된 신호(410,420), 즉 TSrf,TSrr는 채널(40)의 다운-믹스 유닛(180), 및 또한 채널(40)의 파라미터 분석 유닛(160)에 연결된다. 제 2 파라미터 세트 신호(430), 즉 PS2는, 그 대응 출력이 다운-믹스 유닛(180)에 연결된 파라미터/다운믹스 벡터 변환 유닛(170)의 입력에 연결된다.
파라미터 추출 유닛(200)은 OLA 유닛(210)을 위한 사전-출력 신호(470,460), 즉, PRout,PLout뿐만 아니라, 제 3 파리미터 세트 출력(450), 즉 PS3를 생성하기 위해 채널(20,30,40)로부터 신호(380,400,440)를 수신하기 위해 배열된다.
인코더(10)는 전용 하드웨어로 구현될 수 있다. 대안적으로, 인코더(10)는 인코더(10)의 처리 함수를 구현하기 위한 소프트웨어를 실행하기 위해 배열된 컴퓨터 하드웨어에 기초할 수 있다. 추가적 대안으로서, 인코더(10)는 소프트웨어 제어하에서 작동하는 컴퓨터 하드웨어에 연결된 전용 하드웨어의 결합으로 구현될 수 있다.
인코더(10)의 작동은 도 1을 참조하여 이제 설명될 것이다. 신호(Slf[n], Slr[n],Srf[n],Srr[n],Sc[n])는 왼쪽-전방, 왼쪽-후방, 오른쪽-전방, 오른쪽-후방 및 중앙 오디오 신호 각각에 대한 이산 시간 파형을 설명한다. 채널(20,30,40)에서, 이들 5개의 신호들은 공통 분할(segmentation)을 사용하여, 바람직하게는, 중첩된 분석 윈도우를 사용하여 분할된다. 이후, 각 세그먼트는 예를 들어, 푸리에 변환(Fourier transform) 또는 동등한 유형의 변환과 같은 복잡한 변환을 사용하여 시간 도메인에서 주파수 도메인으로 변환되며; 대안적으로, 예를 들어, 적어도 하나의 하드웨어를 사용하여 구현되거나 소프트웨어에 시뮬레이팅된 복잡한 필터-뱅크 구조는, 시간/주파수 타일을 얻기 위해 이용될 수 있다. 이러한 신호 처리는 Lf[k],Lr[k],Rf[k],Rr[k],C[k]로 표시된 주파수 도메인 내의 입력 신호의 세그멘트된 서브-대역 표시를 초래하며, 파라미터(k)는 주파수 색인을 표시하며, L은 왼쪽을 나타내며, R은 오른쪽을 나타내며, f는 전방, r은 후방을 나타내며 C는 중앙을 나타낸다.
파라미터 추출 유닛(200)에서, 데이터 처리는 왼쪽-전방 및 왼쪽-후방 신호 사이의 관련된 파라미터를 평가하기 위한 제 1 단계에서 실행된다. 이들 파라미터들은 레벨 차이(IIDL), 위상차(IPDL) 및 통일성(ICCL)을 포함한다. 바람직하게, 위상차(IPDL)는 평균 위상차에 대응한다. 게다가, 이들 파라미터(IIDL,IPDL 및 ICCL)는 수학식 1 내지 수학식 3에 제공된 것처럼 계산된다.
Figure 112006071194316-PCT00001
Figure 112006071194316-PCT00002
Figure 112006071194316-PCT00003
이 때 기호(*)는 켤레 복소수를 나타낸다.
수학식 1 내지 수학식 3으로 설명된 이 프로세스는 또한 오른쪽-전방 및 오른쪽-후방 신호에 대해 반복되며, 이러한 처리는 레벨차, 위상차 및 통일성 각각과 관련된 대응 파라미터(IIDR,IPDR 및 ICCR)를 야기한다.
파라미터/다운믹스 벡터 변환 유닛(120)에서, 데이터 처리는 2개의 신호 왼쪽-전방(Lf) 및 왼쪽-후방(Lr)의 다운-믹싱을 위한 복소수 가중치를 계산하기 위해 제 2 단계에서 실행된다. 바람직한 실시예에서, 다운-믹스 유닛(130)으로 전송된 다운-믹스 벡터는 입력 신호 공간의 회전(α) 및/또는 복소 위상 정렬을 적용함으로써 다운-믹스 신호(Y[k])의 에너지를 최대화하기 위해 배열된다.
다운-믹스는 다음과 같이 적용된다. 두 개의 신호(Lf 및 Lr)는 수학식 4로 표시된 것과 같은 주 신호(Y[k])의 에너지를 최대화하는 회전각(α)을 사용하여 주 신호(Y[k])와 대응 잔여 신호(Q[k])를 얻기 위해 회전된다.
Figure 112006071194316-PCT00004
이 때 각(OPDL)은 전체 위상 회전각을 표시하는 반면, 위상차(IPDL)는 두 개의 신호(Lf 및 Lr)의 최대 위상-정렬을 보장하기 위해 계산된다. 회전각(α)은 수학식 5와 수학식 6을 사용하여 추출된 파라미터로부터 계산가능하다.
Figure 112006071194316-PCT00005
Figure 112006071194316-PCT00006
수학식 4로부터의 신호(Q[k])는 이후 파라미터 추출 유닛(200)에서 버려지며, 신호(Y[k])는 신호(L[k])가 신호(Q[k])의 제곱과 유사한 제곱에 신호(Y[k])의 제곱을 더한 값을 갖도록 신호(L[k])를 얻기 위해 스칼라(β)만큼 스케일링되는데; 다시 말해, 신호(Q[k])는 버려지는 한편 발생한 신호 제곱 내의 대응하는 손실은 신호(Y[k])를 스케일링함으로써 보상된다. 스칼라(β)는 수학식 7과 수학식 8을 사 용하여 계산가능하다.
Figure 112006071194316-PCT00007
여기서
Figure 112006071194316-PCT00008
제 1 및 제 2 단계는 또한 오른쪽-전방 및 오른쪽-후방 신호 쌍에 대해 반복되며, 대응하는 신호(R[k])의 생성을 초래한다. PCA 회전의 사용은 회전각(α)에 대해 고정된 값을 사용함으로써 우회될 수 있다는 것이 주목되어야 한다.
인코더(10) 내에서 실행된 제 3 처리 단계는 신호(L[k] 및 R[k]) 양자로 중앙 신호(C[k])를 믹싱하는 단계를 포함하며, 이는 사전-출력 신호(470,460), 즉 PLout, PRout 각각의 생성을 초래한다. 이러한 믹싱 단계는 수학식 9에 따라 실행된다.
Figure 112006071194316-PCT00009
파라미터(ε)는 예컨대, 일반적으로 ε=0.707인, 수학식 9와 연관된 믹싱에 서 신호(C[k])의 강도를 결정하는 가중치를 나타낸다. 바람직하게, L,C 및 R의 각 조합은 위상에 대해 정렬되며, 그렇지 않으면 위상 취소가 발생한다.
신호(L 및 R)의 제곱에 대한 신호(C)의 제곱을 설명하는 파라미터(IIDC)는 수학식 10에서 계산가능하다.
Figure 112006071194316-PCT00010
전술한 제 1, 제 2 및 제 3 단계를 포함하는 전술한 프로세스는 각 시간/주파수 타일에 대해 인코더(10)에서 반복된다.
신호(PLout[k] 및 PRout[k])는 이후 인코더에서 임시 도메인으로 변환되며 전술한 출력 신호(490,480), 즉 Lout,Rout를 각각 생성하기 위해 합계의 중복-추가 유형을 사용하여 이전 세그먼트와 결합된다.
인코더(10)로부터의 출력 데이터는, 예컨대 인터넷 또는 다른 유사한 방송 네트워크를 통해, 통신 네트워크에 의해 통신될 수 있다. 대안적으로, 또는 추가적으로, 출력 데이터는, 예를 들어 DVD 광 데이터 디스크 또는 다른 유사한 유형의 데이터 전송 매체와 같은, 데이터 캐리어에 의해 전송될 수 있다.
인코더(10)로부터의 출력 데이터는, 예를 들어, 도 3에서 800으로 표시된 디코더에서, 인코더(10)와 호환가능한 디코더 내에 디코딩될 수 있다. 디코더(800)는 대응 디코딩된 출력 신호(DOP)를 생성하기 위해, 출력 신호(480,490)와 인코 더(10,600)로부터 수신된 연관된 파라미터 데이터(370,430,450,690)의 다양한 수학적 연산을 위한 데이터 처리 유닛(810)을 포함한다.
후방 호환성을 제공하기 위해, 이러한 디코더는 스테레오, 3-채널 및 5-채널 장치 중 적어도 하나가 될 수 있다. 인코더(10)와 호환가능한, 즉, 디코더(800)가 DOP를 위해 오직 2개의 디코딩된 출력을 포함하는, 스테레오-형 디코더에서, 2개의 재생 채널, 즉, 인코더(10)로부터 제공된 신호(Rout,Lout)를 구비한 스테레오-형 디코더는 처리가 추가적으로 행해지는 것 없이 2개의 재생 채널에 대해 스테레오-형 디코더에서 재생된다.
인코더(10)와 호환가능한 3-채널 디코더에서, 3개의 재생 채널을 구비한, 즉 디코더(800)가 DOP에 대해 3개의 디코딩된 출력을 포함하는, 디코더는, DVD 광디스크와 같이, 예컨대, 데이터 캐리어로부터 판독되는, 2개의 신호(Rout,Lout)는 세그멘트된 다음 전술한 주파수 도메인으로 변환된다. 대응하는 재생성된 신호(L[k],R[k] 및 C[k])는 이후 수학식 11 내지 수학식 16을 사용하여 유도된다.
Figure 112006071194316-PCT00011
Figure 112006071194316-PCT00012
Figure 112006071194316-PCT00013
Figure 112006071194316-PCT00014
Figure 112006071194316-PCT00015
Figure 112006071194316-PCT00016
사용자-애플리케이션을 위한 3-채널 오디오 신호는 이후 전술한 것과 유사한 방법으로 신호(L[k],R[k] 및 C[k])로부터 유도된다.
인코더(10)와 호환가능한 5-채널 디코더에서, 즉, 디코더(800)가 5개의 디코딩된 출력을 제공하는 경우, 전술한 것과 같은 3-채널 재생 구조가 이용되며 디코더에서 신호(L[k],R[k] 및 C[k])의 재생성을 야기한다. 5-채널 디코더에서, 추가적 단계가 실행되며, 이는 구성 성분, 즉 전방 왼쪽 성분(Lf[k]) 및 후방 왼쪽 성분(Lr[k])으로 신호(L[k])를 분할하는 단계를 포함하며; 유사하게, 신호(R[k])는 또한 구성 성분, 즉, 전방 오른쪽 성분(Rf[k]) 및 후방 오른쪽 성분(Rr[k])으로 분할 된다. 이러한 신호 분할은 전술한 것처럼, 인코더(10)에서 수행된 회전에 상보적인 역 인코더 회전 작동을 이용한다. 역회전에 필요한 주 신호(Y[k])와 잔여 신호(Q[k])는 수학식 17 및 수학식 18을 사용하여 5가지 디코더에서 유도된다.
Figure 112006071194316-PCT00017
여기서
Figure 112006071194316-PCT00018
파라미터(μ)는 전술한 수학식 8에서 이전에 정의된다. 수학식 17에서, H[k]는 신호 L[k]의 비상관 버전을 얻기 위해 모든-통과 비상관 필터를 표시한다. 이후, 신호(Lf[k] 및 Lr[k])는 수학식 19에서 설명된 역 인코더 회전 함수를 사용하여 생성된다.
Figure 112006071194316-PCT00019
유사한 처리는 또한 오른쪽 채널 성분에 대해 응용된다.
인코더(10)와 호환가능한 4-채널 디코더에서, 4-채널 디코더는 5개의 오디오 신호(Slf,Slr,Srf,Srr 및 Sc)를 생성하기 위해 전술한 5-채널 디코더에서 이용된 것과 유사한 방법으로 우선 5개 채널을 디코딩하도록 작동한다. 이후, 단순한 믹싱은 사용자의 이해를 위해 왼쪽-전방 및 오른쪽-전방 오디오 신호(Slf,playback,Srf,playback)를 생성하기 위해 수학식 20 및 수학식 21에 따라 발생한다.
Figure 112006071194316-PCT00020
Figure 112006071194316-PCT00021
여기서 계수 q=0.707이다.
계수(q)는 4-채널 디코더에 대해, 중앙 신호 성분의 전체 제곱이, 단일한 중앙 고성 스피커를 통한 재생과 무관하게 또는 4-채널 디코더에 연결된 왼쪽 전방 및 오른쪽 전방 고성 스피커에 의해 생성된 사용자에 대한 음향의 환영 추정 소스(phantom apprent source)로서 실질적으로 일정하다는 것을 보장한다.
전술한 내용에서 설명된 본 발명의 실시예는 첨부된 청구항에 의해 한정된 것처럼 본 발명의 범위를 이탈하지 않고 변경할 수 있다는 것이 이해될 것이다.
발명자는, 인코더(10)가 예를 들어 저주파수 효과 채널과 같은, 효과 채널(LFE)의 코딩을 지원하지 않는다는 것을 확인하였다. 이러한 LFE 채널은 예를 들어, 가정용 영화 시스템에서 사용자에게 동시에 제공된 시각 정보를 유리하게 수반 하는 천둥 소리 정보 또는 폭파음 정보와 같은 음향 효과를 전달하기 위해 유리하다. 따라서, 발명자는 본 발명의 실시예에서, 제 2 채널(30)을 강화하고 이에 따라 도 2에 도시되고 일반적으로 600으로 표시된 것과 같이 인코더를 생성하기 위해 인코더(10)를 변경하는 것이 유리하다는 것을 이해하였다. 선택적으로, LFE 채널은, 선택적인 비교적 더 큰 대역폭이 또한 수용될 수 있다고 해도 거의 120Hz의 비교적 제한된 주파수 대역폭을 가진다.
인코더(600)는, 일반적으로 인코더(10)와 유사한데, 단, 인코더(600)의 제 2 채널(30)이 파라미터 분석 유닛(630) 및 제 1 및 제 3 채널(20,40) 각각의 대응 성분과 유사한 방법으로 연결된 다운-믹스 벡터 유닛(640)과 다운-믹스 유닛(650)에 대한 파라미터가 제공되며; 인코더(600)의 채널(30)이 제 4 파라미터 세트(690), 즉 PS4을 출력하도록 작동한다는 점은 제외한다. 게다가, 인코더(600)의 제 2 채널(30)은 저주파 효과 채널(Slfe)을 수신하기 위한 저주파 효과(lfe) 입력(610) 및 또한 전술한 중앙 신호(Sc)를 수신하기 위한 입력(620)을 포함한다. 바람직하게, 신호(Slfe)의 처리는 서브-오디오 주파수 상향에서 120Hz의 주파수 대역폭으로 제한되며 그러므로 잠재적으로 현대의 서브-우퍼형 고성 스피커를 구동하기에 적합하다. 그러나, 본 발명의 실시예들은, 예를 들어, 충격-유사 음향에 해당하는 고주파 신호 정보를 제공하기 위해, 120Hz보다 훨씬 큰 대역폭을 지니는 제 2 채널(30)로 구현될 수 있다.
인코더(600)로부터의 입력 내의 저주파 효과 정보의 포함은 인코더(10)에 비 해 추가적 파라미터의 사용을 요구한다. 입력(610)에 제공된 신호는 인코더(10)를 통해 처리된 다른 전술한 오디오 신호와 유사한 방법으로 시간/주파수 타일에 기초하여 분석된 대응 대표 파라미터를 결정하기 위해 인코더(600)에서 분석된다. 대응 디코더들은, 가정용 영화 시스템 내에서 오디오 서브-우퍼 고성 스피커를 구동하기 위해 증폭에 적합한 신호를 재생성하기 위해 저주파 정보를 디코딩하기 위한 추가적 특성을 포함하도록 바람직하게 배열된다.
첨부된 청구항에서, 괄호 내에 포함된 숫자 및 다른 기호들은 청구항의 이해를 돕기 위해 포함되며 어떠한 방법으로도 청구항의 범위를 제한하는 것으로 의도되지 않는다.
"포함하다", "포괄하다", "결합하다", "함유하다", "한다/이다" 및 "지니다"라는 표현은 설명 및 관련 청구항을 해석할 때 배타적이지 않은 방법으로 해석되는데, 즉, 또한 제공되는 것으로 명시적으로 한정되지 않는 다른 항목 또는 성분을 허용하도록 해석된다. 단수에 대한 참조는 또한 복수에 대한 참조로 해석되며, 반대의 경우 그 역이 적용된다.
본 발명은 공간 오디오의 파라미터 설명을 이용한 복수-채널 오디오 인코더와 같은, 복수-채널 인코더에 관한 것으로서, 복수-채널 인코더 등에 이용가능하다.

Claims (25)

  1. 복수-채널 인코더(10;600)로서, M과 N이 정수이고 N이 M보다 크도록, 파라미터 데이터(450)와 함께 M개의 출력 채널로 전송된 대응 출력 신호(480,490)를 생성하도록 N개의 입력 채널로 전송된 입력 신호(300,310,320,330,340;300,310,610, 620,330,340)를 처리하기 위해 배열된, 복수-채널 인코더(10;600)로서,
    (a) 대응 출력 신호를 생성하기 위해 입력 신호를 다운-믹싱(down-mixing)하기 위한 다운-믹서; 및
    (b) 다운-믹싱동안 또는 별도의 프로세스로서 입력 신호를 처리하기 위한 분석기로서, 상기 분석기는 출력 신호에 상보적인 상기 파라미터 데이터를 생성하도록 작동하며, 상기 파라미터 데이터는 출력 신호의 M개의 채널로부터 입력 신호의 N개의 채널 중 하나 이상을 디코딩하는 동안 실질적으로 재생성을 허용하기 위해 입력 신호의 N개의 채널 사이의 상호 차이를 설명하며, 상기 출력 신호는 후방 호환성을 가능케하기 위해 N개 또는 N개 미만의 출력 채널을 제공하는 디코더 내의 재생을 위해 호환가능한 형태인, 분석기
    를 포함하는, 복수-채널 인코더.
  2. 제 1항에 있어서, 인코더는 대응하는 2개-채널의 스테레오 디코더, 3개-채널 디코더 및 4개-채널 디코더 중 적어도 하나와 호환가능한 형태로 출력 신호와 파라미터 데이터를 생성하기 위해 배열된 5개 채널 인코더인, 복수-채널 인코더.
  3. 제 1항에 있어서, 분석기는 시간 도메인으로부터 주파수 도메인으로의 변환에 의한 입력 신호의 변환 및 파라미터 데이터 생성을 위한 이들 변환된 입력 신호를 처리하기 위한 처리 수단을 포함하는, 복수-채널 인코더.
  4. 제 3항에 있어서, 다운-믹서와 분석기 중 적어도 하나는 출력 신호를 생성하기 위해 시간-주파수 타일의 시퀀스로서 입력 신호를 처리하기 위해 배열된, 복수-채널 인코더.
  5. 제 4항에 있어서, 타일들은 서로 중첩된 분석 윈도우의 변환에 의해 얻어지는, 복수-채널 인코더.
  6. 제 1항에 있어서, M개의 출력 신호 내에 포함을 위한 M개의 중간 오디오 데이터 채널을 생성하기 위해 입력 신호를 처리하기 위한 코더를 포함하며, 상기 분석기는:
    (a) 인터-채널 입력 신호의 제곱 비율 또는 대수 레벨차;
    (b) 입력 신호 사이의 인터-채널 통일성;
    (c) 하나 이상의 채널의 입력 신호와 하나 이상의 채널의 입력 신호의 제곱의 합계 간의 제곱 비율; 및
    (d) 신호 쌍 간의 위상차 또는 시간차
    중 적어도 하나의 관련된 파라미터 데이터 내의 정보를 출력하기 위해 배열된, 복수-채널 인코더.
  7. 제 6항에 있어서, (d)에서 상기 위상차는 평균 위상차인, 복수-채널 인코더.
  8. 제 6항에 있어서, 위상차, 통일성 데이터, 제곱 비율 중 적어도 하나의 계산은 N개의 출력 신호를 생성하기 위해 주요 성분 분석(PCA) 및/또는 인터-채널 위상 정렬이 후속되는, 복수-채널 인코더.
  9. 제 1항에 있어서, N개의 채널로 전송된 입력 신호들 중 적어도 하나는 효과 채널에 대응하는, 복수-채널 인코더.
  10. 제 1항에 있어서, 통상의 재생 시스템을 사용하여 재생에 적합한 형태로 출력 신호를 생성하기 위해 적응된, 복수-채널 인코더.
  11. 입력 신호를 인코딩하는 방법으로서, 파라미터 데이터와 함께 M개의 출력 채널로 전송된 대응 출력 신호를 생성하기 위해 복수-채널 인코더 내의 N개의 입력 채널로 전송된 입력 신호를 인코딩하는 방법은(M과 N이 정수이고 N은 M보다 큼):
    (a) 상기 대응 출력 신호를 생성하기 위해 입력 신호를 다운-믹싱하는 단계; 및
    (b) 다운-믹싱되거나 별도로 될 때 입력 신호를 분석기에서 처리하는 단계로서, 상기 처리 단계는 상기 출력 신호에 상보적인 상기 파라미터 데이터를 제공하며, 상기 파라미터 데이터는 디코딩동안 출력 신호의 M개의 채널로부터 입력 신호의 N개의 채널의 재생성을 실질적으로 허용하기 위해 입력 신호의 N개의 채널 사이의 상호 차이를 설명하며, 상기 출력 신호는 N개 또는 N개 미만의 채널을 제공하는 디코더 내의 재생을 위해 호환가능한 형태인, 입력 신호를 분석기에서 처리하는 단계
    를 포함하는, 입력 신호를 인코딩하는 방법.
  12. 제 11항에 있어서, 5개의 채널에 대응하는 입력 신호를 인코딩하고, 대응하는 2개의 채널 스테레오 디코더, 3개의 채널 디코더 및 4개의 채널 디코더 중 하나 이상과 호환가능한 형태로 출력 신호 및 파라미터 데이터를 생성하기 위해 적응된, 입력 신호를 인코딩하는 방법.
  13. 제 11항에 있어서, 상기 처리 단계는 시간 도메인에서 주파수 도메인으로 변환에 의해 입력 신호를 변환하는 단계를 포함하는, 입력 신호를 인코딩하는 방법.
  14. 제 13항에 있어서, 입력 신호들 중 적어도 하나는 출력 신호를 생성하기 위해 시간-주파수 타일의 시퀀스로서 처리된, 입력 신호를 인코딩하는 방법.
  15. 제 14항에 있어서, 타일은 상호 중첩하는 분석 윈도우에 대응하는, 입력 신호를 인코딩하는 방법.
  16. 제 11항에 있어서, 상기 방법은 출력 신호에 포함하기 위한 M개의 중간 오디오 데이터를 생성하기 위해 입력 신호를 처리하기 위한 코더를 사용하는 단계를 포함하며, 코더는:
    (a) 인터-채널 입력 제곱 비율 또는 대수 레벨 차;
    (b) 입력 신호 사이의 인터-채널 통일성;
    (c) 하나 이상의 채널의 입력 신호와 하나 이상의 채널의 입력 신호의 제곱의 합계 사이의 제곱 비율; 및
    (d) 신호 쌍 사이의 제곱 차 또는 시간차
    중 적어도 하나와 관련된 파라미터 데이터 내의 정보를 출력하기 위해 배열된, 입력 신호를 인코딩하는 방법.
  17. 제 16항에 있어서, 제곱차는 평균 제곱차인, 입력 신호를 인코딩하는 방법.
  18. 제 16항에 있어서, 위상차, 통일성 데이터 및 제곱 비율 중 적어도 하나의 계산은 출력 신호를 생성하기 위해 주요 성분 분석(PCA) 및/또는 인터-채널 위상 정렬이 후속되는, 입력 신호를 인코딩하는 방법.
  19. 제 11항에 있어서, N개 채널로 전달된 입력 신호들 중 적어도 하나는 효과 채널에 대응하는, 입력 신호를 인코딩하는 방법.
  20. 제 11항의 방법을 사용하여 생성된 인코딩된 데이터 컨텐츠.
  21. 제 20항에 청구된 인코딩된 데이터가 저장된 데이터 캐리어.
  22. 제 1항에 따른 인코더(10;600)에 의해 생성된 것과 같은 인코딩된 출력 데이터(370,430,450,480,490,690)를 디코딩하도록 작동하는 디코더(800)로서, 상기 인코딩된 출력 데이터(370,430,450,480,490,690)는 N개의 채널의 입력 신호로부터 생성된 M개의 채널(480,490)과 관련 파라미터 데이터(370,430,450,690)를 포함하며(M<N이며 M과 N은 정수), 상기 디코더(800)는:
    (a) 인코딩된 출력 데이터(370,430,450,460,490,690)를 수신하고 이를 시간 도메인에서 주파수 도메인으로 변환하고;
    (b) 인코딩된 출력 데이터에 직접 포함되지 않거나 이로부터 생략된 하나 이상의 N개의 채널의 입력 신호에 대응하는 M개의 채널 재생성된 데이터 컨텐츠로부터 재생성하기 위해 M개의 채널로부터 컨텐츠를 추출하기 위한 주파수 도메인 내의 파라미터 데이터를 적용하며; 그리고
    (c) 하나 이상의 디코더 출력에서 N개의 채널의 하나 이상의 재생성된 입력 신호를 출력하기 위해 재생성된 데이터 컨텐츠를 처리하기 위한 프로세서(810)를 포함하는, 인코딩된 출력 데이터를 디코딩하도록 작동하는 디코더.
  23. 제 22항에 있어서, 상기 프로세서(810)는 디코더에서 N개의 채널의 상기 하나 이상의 입력 신호를 재생성하는데 사용하기 위한 비상관된 버전의 신호를 얻기 위해 모든-통과 비상관 필터를 적용하도록 작동하는, 인코딩된 출력 데이터를 디코딩하도록 작동하는 디코더.
  24. 제 23항에 있어서, 프로세서는 디코더에서 N개의 채널의 상기 하나 이상의 입력 신호를 재생성하기 위해 그들의 구성 성분으로 M개의 채널 신호와 그 비상관된 버전을 분할하기 위해 역 인코더 회전을 적용하도록 작동하는, 인코딩된 출력 데이터를 디코딩하도록 작동하는 디코더.
  25. 제 24항에 있어서, 상기 디코더(800)는 단지 디코더(800)에서 수신된 상기 인코딩된 출력 데이터(450,480,490)로부터 하나 이상의 디코더 출력(1300 내지 1340)을 생성하기 위해 작동하는, 인코딩된 출력 데이터를 디코딩하도록 작동하는 디코더.
KR1020067020276A 2004-04-05 2005-03-25 복수-채널 인코더, 입력 신호를 인코딩하는 방법, 저장 매체, 및 인코딩된 출력 데이터를 디코딩하도록 작동하는 디코더 KR101158698B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP04101405 2004-04-05
EP04101405.1 2004-04-05
EP04102863 2004-06-22
EP04102863.0 2004-06-22
PCT/IB2005/051037 WO2005098821A2 (en) 2004-04-05 2005-03-25 Multi-channel encoder

Publications (2)

Publication Number Publication Date
KR20070001208A true KR20070001208A (ko) 2007-01-03
KR101158698B1 KR101158698B1 (ko) 2012-06-22

Family

ID=34962299

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067020276A KR101158698B1 (ko) 2004-04-05 2005-03-25 복수-채널 인코더, 입력 신호를 인코딩하는 방법, 저장 매체, 및 인코딩된 출력 데이터를 디코딩하도록 작동하는 디코더

Country Status (14)

Country Link
US (1) US7602922B2 (ko)
EP (1) EP1735774B1 (ko)
JP (2) JP5032977B2 (ko)
KR (1) KR101158698B1 (ko)
CN (1) CN102122509B (ko)
AT (1) ATE395686T1 (ko)
BR (1) BRPI0509113B8 (ko)
DE (1) DE602005006777D1 (ko)
ES (1) ES2307160T3 (ko)
MX (1) MXPA06011361A (ko)
PL (1) PL1735774T3 (ko)
RU (1) RU2390857C2 (ko)
TW (1) TWI393119B (ko)
WO (1) WO2005098821A2 (ko)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
MXPA06011397A (es) 2004-04-05 2006-12-20 Koninkl Philips Electronics Nv Metodo, dispositivo, aparato codificador, aparato decodificador y sistema de audio.
WO2006008697A1 (en) * 2004-07-14 2006-01-26 Koninklijke Philips Electronics N.V. Audio channel conversion
EP1858006B1 (en) * 2005-03-25 2017-01-25 Panasonic Intellectual Property Corporation of America Sound encoding device and sound encoding method
US7840401B2 (en) * 2005-10-24 2010-11-23 Lg Electronics Inc. Removing time delays in signal paths
KR100888474B1 (ko) 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
JP2009524099A (ja) * 2006-01-18 2009-06-25 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7953604B2 (en) 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
KR100904438B1 (ko) 2006-02-23 2009-06-24 엘지전자 주식회사 오디오 신호의 처리 방법 및 장치
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8600740B2 (en) 2008-01-28 2013-12-03 Qualcomm Incorporated Systems, methods and apparatus for context descriptor transmission
EP2293292B1 (en) * 2008-06-19 2013-06-05 Panasonic Corporation Quantizing apparatus, quantizing method and encoding apparatus
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
KR101108061B1 (ko) * 2008-09-25 2012-01-25 엘지전자 주식회사 신호 처리 방법 및 이의 장치
US8258849B2 (en) 2008-09-25 2012-09-04 Lg Electronics Inc. Method and an apparatus for processing a signal
WO2010036059A2 (en) 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
US8346380B2 (en) 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
EP2345027B1 (en) * 2008-10-10 2018-04-18 Telefonaktiebolaget LM Ericsson (publ) Energy-conserving multi-channel audio coding and decoding
JP5163545B2 (ja) 2009-03-05 2013-03-13 富士通株式会社 オーディオ復号装置及びオーディオ復号方法
US8000485B2 (en) * 2009-06-01 2011-08-16 Dts, Inc. Virtual audio processing for loudspeaker or headphone playback
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
EP2323130A1 (en) 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
US8942989B2 (en) 2009-12-28 2015-01-27 Panasonic Intellectual Property Corporation Of America Speech coding of principal-component channels for deleting redundant inter-channel parameters
EP2369861B1 (en) * 2010-03-25 2016-07-27 Nxp B.V. Multi-channel audio signal processing
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
ES2706490T3 (es) 2010-08-25 2019-03-29 Fraunhofer Ges Forschung Un aparato para la codificación de una señal de audio que tiene una pluralidad de canales
CN103262158B (zh) 2010-09-28 2015-07-29 华为技术有限公司 对解码的多声道音频信号或立体声信号进行后处理的装置和方法
KR20120132342A (ko) * 2011-05-25 2012-12-05 삼성전자주식회사 보컬 신호 제거 장치 및 방법
CN104428835B (zh) * 2012-07-09 2017-10-31 皇家飞利浦有限公司 音频信号的编码和解码
US9288603B2 (en) * 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
KR20140016780A (ko) * 2012-07-31 2014-02-10 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 방법 및 장치
ES2653975T3 (es) 2013-07-22 2018-02-09 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador de audio multicanal, codificador de audio multicanal, procedimientos, programa informático y representación de audio codificada mediante el uso de una decorrelación de señales de audio renderizadas
EP2830333A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel decorrelator, multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a premix of decorrelator input signals
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
KR102063790B1 (ko) * 2014-09-24 2020-01-09 한국전자통신연구원 데이터 전송을 위한 도선의 수를 감소시키기 위한 데이터 전송 장치 및 그 방법
CN105897738B (zh) * 2016-05-20 2017-02-22 电子科技大学 一种用于多信道环境的实时流编码方法
WO2018086946A1 (en) 2016-11-08 2018-05-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downmixer and method for downmixing at least two channels and multichannel encoder and multichannel decoder
KR102615903B1 (ko) * 2017-04-28 2023-12-19 디티에스, 인코포레이티드 오디오 코더 윈도우 및 변환 구현들
CN108009347B (zh) * 2017-11-30 2021-06-22 南京理工大学 基于同步压缩联合改进广义s变换的时频分析方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK0520068T3 (da) * 1991-01-08 1996-07-15 Dolby Ray Milton Koder/dekoder for flerdimensionale lydfelter
US5982903A (en) * 1995-09-26 1999-11-09 Nippon Telegraph And Telephone Corporation Method for construction of transfer function table for virtual sound localization, memory with the transfer function table recorded therein, and acoustic signal editing scheme using the transfer function table
US5857026A (en) * 1996-03-26 1999-01-05 Scheiber; Peter Space-mapping sound system
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
EP1062732B1 (en) * 1999-01-07 2012-05-02 Koninklijke Philips Electronics N.V. Efficient coding of side information in a lossless encoder
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
US6480984B1 (en) * 1999-06-23 2002-11-12 Agere Systems Inc. Rate (M/N) code encoder, detector, and decoder for control data
US6208699B1 (en) * 1999-09-01 2001-03-27 Qualcomm Incorporated Method and apparatus for detecting zero rate frames in a communications system
US6970567B1 (en) * 1999-12-03 2005-11-29 Dolby Laboratories Licensing Corporation Method and apparatus for deriving at least one audio signal from two or more input audio signals
US6584438B1 (en) * 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
JP2002175097A (ja) * 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
TW511340B (en) * 2000-12-12 2002-11-21 Elan Microelectronics Corp Method and system for data loss detection and recovery in wireless communication
US20030014579A1 (en) * 2001-07-11 2003-01-16 Motorola, Inc Communication controller and method of transforming information
AU2002318813B2 (en) * 2001-07-13 2004-04-29 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
DE60317203T2 (de) * 2002-07-12 2008-08-07 Koninklijke Philips Electronics N.V. Audio-kodierung
JP3778358B2 (ja) * 2003-05-01 2006-05-24 日本電信電話株式会社 音源分離方法、その装置及びプログラム
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
WO2006103581A1 (en) * 2005-03-30 2006-10-05 Koninklijke Philips Electronics N.V. Scalable multi-channel audio coding

Also Published As

Publication number Publication date
KR101158698B1 (ko) 2012-06-22
BRPI0509113A (pt) 2007-08-28
JP2007531913A (ja) 2007-11-08
US20070194952A1 (en) 2007-08-23
JP2012191625A (ja) 2012-10-04
ES2307160T3 (es) 2008-11-16
JP5032977B2 (ja) 2012-09-26
US7602922B2 (en) 2009-10-13
DE602005006777D1 (de) 2008-06-26
EP1735774A2 (en) 2006-12-27
TWI393119B (zh) 2013-04-11
WO2005098821A2 (en) 2005-10-20
PL1735774T3 (pl) 2008-11-28
EP1735774B1 (en) 2008-05-14
MXPA06011361A (es) 2007-01-16
BRPI0509113B8 (pt) 2018-10-30
RU2006139048A (ru) 2008-05-20
CN102122509B (zh) 2016-03-23
WO2005098821A3 (en) 2006-03-16
CN102122509A (zh) 2011-07-13
BRPI0509113B1 (pt) 2018-08-14
ATE395686T1 (de) 2008-05-15
RU2390857C2 (ru) 2010-05-27
TW200614150A (en) 2006-05-01
JP5311597B2 (ja) 2013-10-09

Similar Documents

Publication Publication Date Title
KR101158698B1 (ko) 복수-채널 인코더, 입력 신호를 인코딩하는 방법, 저장 매체, 및 인코딩된 출력 데이터를 디코딩하도록 작동하는 디코더
US9865270B2 (en) Audio encoding and decoding
KR101315077B1 (ko) 멀티-채널 오디오 데이터를 인코딩 및 디코딩하기 위한 방법, 및 인코더들 및 디코더들
US8065136B2 (en) Multi-channel encoder
JP5455647B2 (ja) オーディオデコーダ
RU2407073C2 (ru) Кодирование многоканального аудио
JP4685925B2 (ja) 適応残差オーディオ符号化
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
JP4939933B2 (ja) オーディオ信号符号化装置及びオーディオ信号復号化装置
RU2396608C2 (ru) Способ, устройство, кодирующее устройство, декодирующее устройство и аудиосистема
WO2005122639A1 (ja) 音響信号符号化装置および音響信号復号装置
JP2011501823A (ja) アップミックスを使用した音声符号器
CN106463126B (zh) 基于对象的音频系统中的残差编码

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150611

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160608

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170612

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190612

Year of fee payment: 8