KR20050116828A - 다채널 신호를 나타내는 주 및 부 신호의 코딩 - Google Patents

다채널 신호를 나타내는 주 및 부 신호의 코딩 Download PDF

Info

Publication number
KR20050116828A
KR20050116828A KR1020057017914A KR20057017914A KR20050116828A KR 20050116828 A KR20050116828 A KR 20050116828A KR 1020057017914 A KR1020057017914 A KR 1020057017914A KR 20057017914 A KR20057017914 A KR 20057017914A KR 20050116828 A KR20050116828 A KR 20050116828A
Authority
KR
South Korea
Prior art keywords
signal
sub
main
parameters
signals
Prior art date
Application number
KR1020057017914A
Other languages
English (en)
Inventor
알버투스 씨. 덴 브린커
안드레아스 제이. 게리츠
로버트 제이. 슬루이터
Original Assignee
코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 코닌클리케 필립스 일렉트로닉스 엔.브이. filed Critical 코닌클리케 필립스 일렉트로닉스 엔.브이.
Publication of KR20050116828A publication Critical patent/KR20050116828A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

다채널 신호는 부 신호를 나타내는 변환 파라미터들의 세트 및 주 신호에 의해 나타내어진다. 상기 다채널 신호의 품질 저하없이 상기 전송된 신호의 비트 레이트를 감소시킬 수 있다.

Description

다채널 신호를 나타내는 주 및 부 신호의 코딩{Coding of main and side signal representing a multichannel signal}
본 발명은 다채널 신호들의 파라미터 코딩을 수행하는 제 1 단계의 결과인 주 및 부 신호(main and side signal)의 코딩에 관한 것이다.
스테레오포닉(stereophonic) 오디오 신호들은 예를 들면 서로 격리되어 있는 마이크들로부터의 스테레오 신호원으로부터 비롯될 수 있는 좌측(L) 및 우측(R) 신호 콤퍼넌트를 포함한다. 오디오 신호들의 코딩은, 예를 들면, 인터넷과 같은 통신 네트워크, 모뎀 및 아날로그 전화회선들, 이동 통신 채널들, 또는 다른 무선 네트워크 등을 통해서 사운드 신호들이 효율적으로 전송되도록, 그리고 스테레오포닉 사운드 신호를 칩 카드나 한정된 기억 용량을 갖는 또 다른 기억 매체에 기억하기 위해서, 스테레오포닉 신호의 비트 레이트를 감소시키는 것을 목표로 한다.
EP 1,107,232는 좌측 채널 신호와 우측 채널 신호로 구성된 스테레오 오디오 신호의 표현을 생성시키기 위해서 파라미터 코딩을 수행하는 방법을 개시한다. 전송 대역폭을 효율적으로 이용하기 위해서, 이러한 표현은 L 및 R 신호들 중 단지 하나만에 관한 정보와, 다른 신호를 복구할 수 있게 하는 근거가 되는 파라미터 정보를 포함한다. 파라미터 코딩의 설계로 인해, 표현은 L 및 R의 세기와 위상 특성들을 포함한, 스테레오 오디오 신호의 국부화 큐들을 유리하게 캡처한다. 결국, 전송된 표현으로부터 복구된 스테레오 오디오 신호는 고 품질의 스테레오를 제공한다.
파라미터 스테레오 코딩이 비트 레이트 이용을 향상시킬지라도, 주어진 사운드 품질을 위해 요구된 비트 레이트를 더욱 감소시킴으로써 이러한 이용을 향상시키는 것이 중요하다.
도 1은 본 발명의 실시예에 따른 스테레오 신호들을 통신하기 위한 시스템의 개략도.
도 2는 제 1 및 제 2 단계를 포함하는 파라미터 엔코딩을 수행하기 위한 장치의 개략도.
도 3은 파라미터 디코딩을 수행하기 위한 장치의 개략도.
도 4는 본 발명에 따른 엔코더의 제 2 단계의 일반 개념을 나타낸 도면.
도 5는 본 발명에 따른 디코더의 제 2 단계의 일반 개념을 나타낸 도면.
도 6은 본 발명의 제 1 실시예에 따른 스테레오 신호를 엔코딩하는 제 2 단계를 위한 장치의 개략도.
도 7은 본 발명의 제 1 실시예에 따른 스테레오 신호를 디코딩하기 위한 장치의 개략도.
도 8은 본 발명의 제 2 실시예에 따른 스테레오 신호를 엔코딩하는 제 2 단계를 위한 장치의 개략도.
도 9는 본 발명의 제 2 실시예에 따른 스테레오 신호를 디코딩하기 위한 장치의 개략도.
도 10은 본 발명의 제 3 실시예에 따른 스테레오 신호를 엔코딩하는 제 2 단계를 위한 장치의 개략도.
도 11은 본 발명의 제 3 실시예에 따른 스테레오 신호를 디코딩하기 위한 장치의 개략도.
본 발명의 목적은 위에 언급한 문제에 대한 해결책을 제공하는 것이다.
본 발명의 목적은 주 및 부 신호(main and side signal)를 엔코딩 방법에 의해 해결되고, 적어도 상기 주 및 부 신호는 다채널 오디오 신호를 나타내며, 상기 주 및 부 신호는 상기 주 및 부 신호들의 파워 스펙트럼 에너지들간의 관계가 사이코-어쿠스틱 밴드(psycho-acoustical band)마다 그대로(intact)인 특징들을 가지고, 상기 부 신호는 상기 주 신호와 사이코-어쿠스틱으로 상관되지 않는, 상기 엔코딩 방법은:
미리결정된 변환에 의해 상기 부 신호를 한 세트의 변환 파라미터들로 변환하는 단계로서, 상기 파라미터들은 상기 부 신호에 대응하고 상기 부 신호의 상기 특징들을 갖는 제 3 신호를 재생하도록 적응되는, 상기 변환 단계; 및
적어도 상기 주 신호 및 상기 변환 파라미터들에 의해 상기 다채널 신호를 나타내는 단계를 포함한다.
그럼으로써, 비트 레이트는 데이터를 전송할 때 감소될 수 있고, 또한 엔코딩된 데이터를 기억할 때 기억공간을 덜 필요로 한다.
실시예에서 미리결정된 변환은 상기 주 및 부 신호로부터 한 세트의 변환 파라미터들을 생성하는 단계를 포함하고, 상기 변환 파라미터들은 상기 주 및 부 신호의 스펙트럼들간의 관계를 규정하는 것이다.
이것은 부 신호로부터 필수 정보를 나타내는 효율적인 방법이다.
특정의 실시예에서, 상기 변환 파라미터들을 생성하는 단계는:
2 세트의 예측 계수들을 얻기위해, 상기 주 신호 및 상기 부 신호 둘 모두에 대해 선형 예측을 수행하는 단계로서, 제 1 세트는 상기 주 신호에 대응하는 계수들을 포함하고 제 2 세트는 상기 부 신호에 대응하는 계수들을 포함하는, 상기 선형 예측 수행 단계; 및
상기 부 신호의 에너지를 결정하는 단계를 포함하고,
상기 변환 파라미터들은 상기 예측 계수들 및 상기 결정된 에너지를 포함하는 것이다.
이들 변환 파라미터들에 기초해서 부 신호는 매우 정확하게 재생될 수 있다.
또 다른 실시예에서, 상기 변환 파라미터들을 생성하는 단계는:
상기 주 및 부 신호의 진폭 스펙트럼들을 결정하는 단계;
상기 주 및 부 신호의 상기 결정된 진폭 스펙트럼들간의 비들을 결정하는 단계;
상기 결정된 비들에 기초한 정보를 예측 시스템으로의 입력으로서 사용함으로써 예측 계수들을 생성하는 단계; 및
상기 부 신호의 에너지를 결정하는 단계를 포함하고, 상기 변환 파라미터들은 상기 예측 계수들 및 상기 결정된 에너지를 포함한다.
단지 한 세트의 예측 계수들만이 필요하고 이는 엔코딩된 신호 전송시 필요 비트 레이트를 더 감소시킨다.
실시예에서, 상기 변환 파라미터들을 생성하는 단계는:
상기 부 신호에 대응하는 계수들을 포함하는 한 세트의 예측 계수들을 얻기위해 상기 부 신호에 대한 선형 예측을 수행하는 단계; 및
상기 부 신호에 대한 시간 포락선(temporal envelope)을 결정하는 단계를 포함하고,
상기 변환 파라미터들은 상기 예측 계수들 및 상기 결정된 시간 포락선을 포함한다.
이것은 매우 단순하며 그럼으로써 변환 파라미터들을 생성하는 자원 효율적인 방법이다.
특정의 실시예에서, 상기 부 신호를 한 세트의 변환 파라미터들로 변환하는 단계는 각 세그먼트에 대응하는 변환 파라미터들을 결정함으로써, 적어도 상기 부 신호의 중첩 세그먼트 상에서, 수행된다. 엔코딩하기 전에 세그먼트화함으로써 파라미터들은 소수의 데이터를 기술하기만 하면 되고, 소수의 파라미터들에 기초해서 세그먼트의 보다 정밀한 재생이 수행될 수 있다. 또한, 스트리밍 데이터의 세그먼트들에 대해서 엔코딩이 수행될 수 있으므로, 신호 변동에 쉽게 추종할 수 있다.
본 발명은 또한 위에 기술한 바와 같은 엔코딩 방법들에 대응하는 디코딩 방법에 관한 것이다. 따라서, 동일한 이점들이 적용된다.
본 발명은 주 및 부 신호 정보를 디코딩하는 방법에 관한 것으로, 적어도 상기 주 및 부 신호는 다채널 오디오 신호를 나타내며, 상기 주 및 부 신호는 이들 신호들의 파워 스펙트럼 에너지들간의 관계가 사이코-어쿠스틱 밴드마다 그대로인 특징들을 가지며, 상기 부 신호는 상기 주 신호와 사이코-어쿠스틱으로 상관되지 않는, 상기 디코딩 방법은:
주 신호 및 한 세트의 변환 파라미터들을 수신하는 단계로서, 상기 변환 파라미터들은 상기 부 신호에 대응하고 상기 부 신호와 동일한 특징들을 갖는 제 3 신호를 재생하도록 적응되는, 상기 수신 단계; 및
상기 미리결정된 변환을 역으로 수행하기 위해 상기 변환 파라미터를 사용함으로써 상기 부 신호의 상기 특징들을 갖는 상기 제 3 신호를 생성하는 단계를 포함한다.
실시예에서, 상기 제 3 신호를 생성하는 단계는:
백색 잡음 시퀀스를 생성하는 단계;
상기 부 신호에 대응하는 상기 예측 계수에 의해 규정된 선형 예측 필터에서 상기 백색 잡음 시퀀스를 필터링함으로써 제 1 신호를 생성하는 단계로서, 상기 예측 계수들은 상기 수신된 변환 파라미터들에 포함되는, 상기 생성 단계; 및
상기 제 2 신호의 에너지가 상기 부 신호의 상기 결정된 에너지에 대응할 때까지 상기 제 2 신호를 감쇄하는 단계로서, 상기 결정된 에너지는 상기 수신된 변환 파라미터들에 포함되는, 상기 감쇄 단계를 포함한다.
특정의 실시예에서, 상기 제 3 신호를 생성하는 단계는:
임시 신호를 생성하는 단계로서, 상기 임시 신호와 상기 주 신호간의 스펙트럼 에너지 관계는 상기 주 신호와 상기 부 신호간의 스펙트럼 에너지 관계에 대응하고, 상기 임시 신호는 필터 파라미터들로서 상기 변환 파라미터들을 사용하여 상기 주 신호를 필터링함으로써 생성되는, 상기 생성 단계; 및
상기 출력 신호가 상기 주 신호와 사이코-어쿠스틱으로 상관되지 않도록 하는 상기 임시 신호를 필터링하는 단계를 포함한다.
특정의 실시예에서, 상기 임시 신호를 생성하는 단계는:
상기 주 신호에 대응하는 상기 예측 계수에 의해 규정된 선형 예측 분석 필터에서 상기 주 신호를 필터링함으로써 제 1 신호를 생성하는 단계로서, 상기 예측 계수들은 상기 수신된 변환 파라미터들에 포함되는, 상기 생성 단계;
상기 수신된 변환 파라미터들에 포함된 예측 계수들에 의해 규정된 선형 예측 합성 필터에서 상기 제 1 신호를 필터링함으로써 제 2 신호를 생성하는 단계로서, 상기 예측 계수들은 상기 부 신호에 대응하는 상기 제 2 신호 생성 단계; 및
상기 제 2 신호의 에너지가 상기 부 신호의 상기 결정된 에너지에 대응할 때까지 상기 제 2 신호를 감쇄하는 단계로서, 상기 결정된 에너지는 상기 수신된 변환 파라미터들에 포함되는, 상기 감쇄 단계를 포함한다.
또 다른 실시예에서, 상기 임시 신호를 생성하는 단계는:
상기 예측 계수에 의해 규정된 선형 예측 필터에서 상기 주 신호를 필터링함으로써 제 1 신호를 생성하는 단계로서, 상기 예측 계수들은 상기 변환 파라미터들에 포함되며, 상기 예측 계수들은 상기 주 및 부 신호의 상기 결정된 진폭 스펙트럼들간의 비들을 결정하고, 상기 결정된 비들의 역 푸리에 변환을 수행하며, 예측 시스템에의 입력으로서 상기 역 푸리에 변환의 결과를 사용함으로써 생성되는, 제 1 신호 생성 단계; 및
상기 변환 파라미터들에 포함된 것인 상기 제 2 신호의 에너지가 상기 부 신호의 상기 결정된 에너지에 대응할 때까지 상기 제 2 신호를 감쇄하는 단계로서, 상기 결정된 에너지는 상기 변환 파라미터들에 포함되는, 상기 감쇄 단계를 포함하고, 상기 변환 파라미터들은 상기 예측 계수들 및 상기 결정된 에너지를 포함한다.
또 다른 실시예에서, 상기 변환 파라미터들이 특정의 세그먼트들에 대응하여 생성될 때, 상기 부 신호와 동일한 특징들을 갖는 상기 제 3 신호를 생성하는 단계는 상기 특정의 세그먼트들간의 변환 파라미터들을 초기에 보간함으로써 수행된다.
본 발명은 예를 들면 위에 기술된 방법들을 통해 다양한 방식들로 구현될 수 있다. 다음은 복수신호들 엔코딩 및 디코딩하는 장치들, 데이터 신호 및 제품수단을 기술할 것이며, 그 각각은 제 1 언급되는 방법에 관련하여 기술된 하나 이상의 이점을 제공하며, 각각은 제 1 언급된 방법에 관련하여 기술되고 종속 청구항들에 개시된 바람직한 실시예들에 대응하는 하나 이상의 바람직한 실시예들을 갖는다.
위에 기술된 방법들의 특징들은 다음에서 소프트웨어로 구현될 수 있고 데이터 처리 시스템에서 혹은 컴퓨터로 실행가능한 명령들의 실행에 의해 야기되는 다른 처리 수단을 통해서 실행될 수 있는 것에 유의한다. 명령들은 기억 매체로부터 혹은 컴퓨터 네트워크를 통해 또 다른 컴퓨터로부터 RAM과 같은 메모리에 로딩되는 프로그램 코드 수단일 수 있다. 또한, 기술된 특징들은 소프트웨어 대신에 혹은 소프트웨어와 조합하여 하드웨어 구성의 회로에 의해 구현될 수 있다.
본 발명은 또한, 적어도 상기 주 및 부 신호는 다채널 오디오 신호를 나타내는 것이며, 상기 주 및 부 신호는 상기 주 및 부 신호의 파워 스펙트럼 에너지들간의 관계가 사이코-어쿠스틱 밴드마다 그대로인 특징들을 가지고, 상기 부 신호는 상기 주 신호와 사이코-어쿠스틱으로 상관되지 않는, 상기 엔코딩하는 장치는,
미리결정된 변환에 의해 상기 부 신호를 한 세트의 변환 파라미터들로 변환하는 제 1 처리 수단으로서, 상기 파라미터들은 상기 부 신호에 대응하고 상기 부 신호와 동일한 특징들을 갖는 제 3 신호를 재생하도록 적응되는, 상기 제 1 처리 수단; 및
적어도 상기 주 신호 및 상기 변환 파라미터들에 의해 상기 다채널 신호를 나타내도록 적응되는 제 2 처리 수단을 포함하는, 엔코딩 장치에 관한 것이다.
본 발명은 또한, 적어도 상기 주 및 부 신호는 다채널 오디오 신호를 나타내며, 상기 주 및 부 신호는 상기 주 및 부 신호의 파워 스펙트럼 에너지들간의 관계가 사이코-어쿠스틱 밴드마다 그대로인 특징들을 가지고, 상기 부 신호는 상기 주 신호와 사이코-어쿠스틱으로 상관되지 않는, 상기 디코딩하는 장치는:
주 신호 및 한 세트의 변환 파라미터들을 수신하는 수신 수단으로서, 상기 변환 파라미터들은 상기 부 신호에 대응하고 상기 부 신호와 동일한 특징들을 갖는 제 3 신호를 재생하도록 적응되는, 상기 수신 수단; 및
상기 미리결정된 변환을 역으로 수행하기 위해 상기 변환 파라미터들을 사용함으로써 상기 부 신호와 동일한 특징들을 갖는 상기 제 3 신호를 생성하는 처리 수단을 포함하는, 디코딩 장치에 관한 것이다.
위의 장치들은 고정 및 휴대 PC들과 같은 컴퓨터들, 고정 및 휴대 무선 통신장치 및 그 외 휴대 장치들, 이를테면 이동전화들, 페이저들, 오디오 플레이어들, 멀티미디어 플레이어들, 통신기들, 즉 전자 오가나이저들, 스마트 폰들, PDA들, 휴대 컴퓨터들 등을 포함하는 어떤 전자 장비의 일부일 수 있다.
처리 수단이라는 용어는 범용 혹은 전용 프로그래머블 마이크로프로세서들, 디지털 신호 프로세서들(DSP), ASCI(Application Specific Integrated Circuits), PLA(Programmable Logic Arrays), FPGA(Field Programmable Gate Arrays), 전용 전자회로들 등, 혹은 이들의 조합들을 포함한다. 위의 제 1 및 제 2 처리 수단은 별도의 처리 수단일 수도 있고 혹은 이들은 한 처리 수단에 포함될 수도 있다.
수신 수단이라는 용어는 예를 들면 유선 혹은 무선 데이터 링크를 통해 데이터를 통신을 할 수 있게 하는데 적합한 회로 및/또는 장치들을 포함한다. 예들은 네트워크 인터페이스, 네트워크 카드, 무선 수신기, 이외 적합한 전자기 신호들, 이를테면 IrDa 포트를 통한 적외광 용의 수신기, 예를 들면 블루투스 송수신기 등을 통한 무선 기반 통신들을 포함한다. 적합한 수신 수단의 또 다른 예들은 케이블 모뎀, 전화 모뎀, ISND(Integrated Services Digital Network) 어댑터, 디지털 가입자 회선(DSL) 어댑터, 위성 송수신기, 이더넷 어댑터 등을 포함한다.
수신 수단이라는 용어는 예를 들면 컴퓨터 판독가능의 매체에 기억된 데이터 신호들을 수신하는 그 외 입력 회로/장치들을 또한 포함한다. 이러한 수신 수단의 예들은 플로피 디스크 드라이브, CD-ROM 드라이브, DVD 드라이브, 혹은 이외 어떤 다른 적합한 디스크 드라이브, 메모리 카드 어댑터, 스마트 카드 어댑터 등을 포함한다.
다음에서, 본 발명의 바람직한 실시예들을 도면을 참조하여 기술한다.
도 1은 본 발명의 실시예에 따라 스테레오 신호들을 통신하기 위한 시스템의 개략도이다. 시스템은 코딩된 스테레오포닉 신호를 생성하는 코딩 장치(101) 및 수신된 코딩된 신호를 스테레오 L' 신호 및 R' 신호 성분으로 디코딩하는 디코딩 장치(105)를 포함한다. 코딩 장치(101) 및 디코딩 장치(105) 각각은 어떤 전자장치 혹은 이러한 장치의 일부일 수 있다. 본 명세서에서 전자장치라는 용어는 고정 및 휴대 PC들과 같은 컴퓨터들, 고정 및 휴대 무선 통신장치 및 그 외 휴대 장치들, 이를테면 이동전화들, 페이저들, 오디오 플레이어들, 멀티미디어 플레이어들, 통신기들, 즉 전자 오가나이저들, 스마트 폰들, PDA들, 휴대 컴퓨터들 등을 포함한다.코딩 장치(101) 및 디코딩 장치는 나중에 재생하기 위해 컴퓨터 판독가능 매체에 스테레오포닉 신호들이 기억되는 한 전자장치 내에 조합될 수 있다.
코딩 장치(101)는 본 발명에 따라 스테레오포닉 신호를 엔코딩하기 위한 엔코더(102)를 포함하는데, 이 스테레오포닉 신호는 L 신호 콤퍼넌트과 R 신호 콤퍼넌트을 포함한다. 엔코더는 L 신호 콤퍼넌트 및 R 신호 콤퍼넌트을 수신하여, 코딩된 신호(T)를 생성한다. 스테레오포닉 신호(L, R)는 예를 들면 다른 전자장치, 이를테면 믹싱장치, 등을 통해 한 세트의 마이크들로부터 기원할 수 있다. 신호들은 또 다른 스테레오 플레이어로부터의 출력으로서, 혹은 무선 신호로서 공중을 통해서, 혹은 그 외 어떤 다른 적합한 수단에 의해 수신될 수도 있다. 본 발명에 따라, 이러한 엔코더의 바람직한 실시예들을 이하 기술한다. 일 실시예에 따라서, 엔코더(102)는 통신 채널(109)을 통해 디코딩 장치(105)에 코딩된 신호(T)를 전송하기 위한 송신기(103)에 접속된다. 송신기(103)는 예를 들면 유선 혹은 무선 데이터 링크(109)를 통해 데이터의 통신을 할 수 있게 하는데 적합한 회로를 포함할 수 있다. 이러한 송신기의 예들은 네트워크 인터페이스, 네트워크 카드, 무선 송신기, 예를 들면 IrDa 포트를 통해 적외광을 전송하기 위한 LED와 같은 그 외 적합한 전자기 신호들을 위한 송신기, 예를 들면 블루투스 송수신기 등을 통한 무선 기반 통신들을 포함한다. 적합한 송신기들의 또 다른 예들은 케이블 모뎀, 전화 모뎀, ISND(Integrated Services Digital Network) 어댑터, 디지털 가입자 회선(DSL) 어댑터, 위성 송수신기, 이더넷 어댑터 등을 포함한다. 대응하여, 통신 채널(109)은 예를 들면 인터넷 혹은 또 다른 TCP/IP 네트워크와 같은 패킷 기반 통신 네트워크의 어떤 적합한 유선 혹은 무선 데이터 링크, 적외 링크와 같은 협범위 통신 링크, 블루투스 접속 혹은 또 다른 무선 기반 링크일 수 있다. 통신 채널의 또 다른 예들은 컴퓨터 네트워크들 및 무선 전기통신 네트워크들, 이를테면 셀룰라 디지털 패킷 데이터(CDPD) 네트워크, 이동용 글러벌 시스템(GSM) 네트워크, 부호분할다중접속(CDMA) 네트워크, 시분할다중접속 네트워크(TDMA), 일반 패킷 무선 서비스(GPRS) 네트워크, 3세대 네트워크, 이를테면 UMTS 네트워크 등을 포함한다. 이 대신에, 혹은 이에 추가로, 코딩 장치는 코딩된 스테레오 신호(T)를 디코딩 장치(105)에 통신하기 위한 하나 이상의 그 외의 인터페이스들(104)을 포함할 수 있다.
이러한 인터페이스들의 예들은 데이터를 컴퓨터 판독가능 매체(110)에 기억하기 위한 디스크, 예를 들면 플로피 디스크 드라이브, 판독/기입 CD-ROM 드라이브, DVD-드라이브 등을 포함한다. 그 외의 예들은 메모리 카드 슬롯, 자기 카드 리더/라이터, 스마트 카드 접속용 인터페이스, 등을 포함한다. 대응하여, 디코딩 장치(105)는 송신기에 의해 송신된 신호를 수신하기 위한 대응하는 수신기(108) 및/또는 인터페이스(104) 및 컴퓨터 판독가능 매체(110)를 통해 통신된 코딩된 스테레오 신호를 수신하기 위한 또 다른 인터페이스(106)를 포함한다. 디코딩 장치는 또한, 수신 신호(T)를 수신하여 이를 대응하는 스테레오 콤포넌트들 L' 및 R'로 디코딩하는 디코더(107)를 포함한다. 본 발명에 따라, 이러한 디코더의 바람직한 실시예들을 이하 기술한다. 디코딩된 신호들 L' 및 R'은 이어서, 한 세트의 스피커들, 헤드폰, 등을 통한 재생을 위해 스테레오 플레이어에 공급될 수 있다.
도 2는 본 발명에 따른 엔코더의 일반적인 개념의 개략도로서, 입력은 L 및 R 성분들이고 출력은 T이다. 제 1 단계(201)에서, L성분 및 R성분은 공지의 파라미터 스테레오 코딩을 사용하여 엔코딩됨으로써 주 신호(m)과 부(side) 신호(s) 및 부 정보(Pr)가 된다. 제 2 단계(203)에서, 파라미터들(Ps)로 나타내지는 파라미터에 의한 방식으로 2차 신호의 관계된 정보를 캡쳐하여, 디코더 측에서 주 신호와 파라미터들(Ps)에 기초하여 사이코-어쿠스틱으로 동일한 2차 신호가 생성될 수 있게 한다. 주 신호와 파라미터들(Ps)이 도 1에 도시된 바와 같이 통신될 때, 정보는 조합기(205)에 공급된다. 조합기(205)는 프레이밍, 비트 레이트 할당 및 무손실 코딩을 수행함으로써, 통신할 조합된 신호(T)가 된다.
도 3은 본 발명에 따른 디코더의 일반적인 개념의 개략도로, 조합된 신호(T)가 수신되는데, 즉, 이것은 도 2에 기술된 바와 같은 엔코더로부터 올 수도 있을 것이다. 디코더는 엔코딩된 정보 m 및 Ps를 추출하기 위한 추출단계(301)를 포함한다. 즉, 조합기(205)의 역의 동작이 수행된다. 먼저, 추출된 정보는 디코더(303)에서 디코딩되는데, 디코딩은 도 2의 제 2 단계(203)에 의해 수행된 엔코딩에 대응하는 것으로 이에 따라 디코딩된 신호들(m, s')이 된다. 이어서, m 및 s 신호가 디코더(305)에 디코딩되는데, 디코딩은 도 2의 제 1 단계(201)에 의해 수행되는 엔코딩에 대응하는 것으로, 디코딩된 성분들 L' 및 R'이 된다.
디코더에서 사용되는 주 신호는 원 m 신호일 수도 있을 것이고, 혹은 예를 들면 양자화에 의해 엔코딩/디코딩된 주 신호일 수도 있을 것이다.
위에 기술된 바와 같이 파라미터 스테레오 엔코딩의 제 1 단계에 의해 생성된 주 및 부 신호는 주 신호의 파형이 그대로 유지되어야 하고 그러나 부 신호는 파형에서 다소 임의이며 단지 두 상태만을 고수한다는 사실인 것이 특징이다. 먼저, 주 및 부 신호의 파워 스펙트럼 에너지들간 관계는 사이코-어쿠스틱 밴드마다 그대로 유지되어야 한다. 두 번째로, 부 신호는 사이코-어쿠스틱 면에서 주 신호와 상관이 없어야 한다. 본 발명에 따라 주 및 부 신호를 엔코딩하는 방법은 이중이다. 먼저, 원하는 스펙트럼 진폭 관계 및 시간적 프로파일을 재형성(re-instate)할 수 있는 필터가 추정된다. 두 번째로, 특정의 실시예들에서, 후술하는 바와 같이, 원하는 무상관성을 보장하는 필터가 도출된다.
도 4에서, 본 발명에 따라, 엔코더의 제 2 단계의 일반적인 개념의 실시예가 도시되었다. 박스(401)은 파라미터 추출 절차이다. s 신호 및 m 신호로부터 필터 특징이 도출되고 필터(pF)의 파라미터들이 출력된다. 특히, 박스(401)는 주 및 부 신호의 스펙트럼들간의 관계를 캡처하는 필터의 파라미터들을 추정한다. 파라미터 추출 절차는 원하는 스펙트럼 에너지 관계를 생성시키는 필터를 확정하는 것만이 필요하다.
도 5는 입력으로서 m 신호 및 파라미터들(pF)을 사용하여, 엔코딩된 m 및 s 신호를 디코딩하기 위한 디코더 부분의 일반적인 개념의 실시예를 도시한 것이다. 주 신호(m)는 본 발명에 따라 파라미터들(pF)을 사용하여 필터(501)에 의해 필터링된다. 필터는 스펙트럼 에너지 관계가 확정된 제 1 신호(s'')를 생성한다. 시불변 무상관(decorrelation) 필터(전역 필터 혹은 이에 근사한 것)인 필터(502)에서, 이의 출력(s')는 m과는 사이코-어쿠스틱으로 무상관될 것이 보장된다.
다음에서, 위에 기술한 m 및 s 신호의 엔코딩과 m 및 s'를 얻기 위한 디코딩의 구체적인 실시예들을 제공한다.
도 6은 본 발명의 제 1 실시예에 따른 스테레오 신호를 엔코딩하는 제 2 단계를 위한 구성의 개략도이다. 이 실시예에서, s 및 m 신호 모두는 초기에는 중첩하는 프레임들로 세그먼트화된다. 이러한 세그먼트화를 수행함으로써 보다 작은 세그먼트에 대해 엔코딩이 수행되고 이에 의해서 엔코딩이 데이터 스트림에 수행될 수 있다. 또한, 작은 세그먼트들에 엔코딩 및 디코딩을 수행할 때 신호들의 보다 정확한 재현이 얻어질 수 있다. 작은 세그먼트들을 사용함에 의해서, 관계들에 변화들이 수반될 수 있다.
m 및 s 신호 모두의 세그먼트화는 세그먼트화 유닛(601)에서 수행된다. 이어서 603에서, m 신호의 각 세그먼트에 선형 예측이 수행되어 한 세트의 예측 계수(a)가 나온다. 605에서 s 신호의 각 세그먼트에 선형 예측이 수행되어 한 세트의 예측 계수들(as)이 나온다. 또한, 607에서, 신호(s)의 각 세그먼트의 에너지(e)가 추정된다. 609에서 예측 계수들(a, as)과 추정된 에너지(e)를 한 세트의 변환 파라미터들(pF)로 다중화한다. m 신호 및 한 세트의 변환 파라미터(pF)는 m 및 s 신호를 나타내며 디코더에서 s 신호에 대응하는 신호를 재현하는 데 사용될 수 있다.
도 7은 본 발명의 제 1 실시예에 따라 스테레오 신호를 디코딩하기 위한 구성의 개략도이다. m 신호 및 변환 파라미터들(pF)는 디코더에 입력으로서 사용된다. 701에서, 변환 파라미터들은 예측 계수들(a, as) 및 추정 에너지(e)로 역다중화된다. 이어서 703에서 예측 계수들(a)은 후속의 프레임들 사이에 보간됨으로써 각 세그먼트에서 예측 계수들이 활용될 수 있게 한다. 705 및 707에서, 예측 계수들(as) 및 추정 에너지(e)에 유사한 보간이 수행된다. 709에서, m 신호는 예측 계수들(a)에 의해 기술된 선형 예측 필터에서 백색화되어, 백색화된 m 신호(mW)가 된다. 다음에 711에서, 필터(709)의 출력(mW)는 원 s 신호에 기초하여 예측 계수들(as)에 의해 기술된 선형 예측 합성필터에 의해 필터링되고, 합성필터의 출력은 신호(s''')이다. 다음에 713에서, 감쇄가 적용되고 출력(s'')의 에너지는 원 s 신호에 대해 추정된 에너지(e)와 확실히 일치하게 된다. 마지막으로, 715에서 신호(s'')는 무상관 필터 혹은 전역통과 필터에서 필터링되어, 생성된 출력(s')와 m 신호간의 사이코-어쿠스틱으로 어떠한 상관이든 제거한다.
도 8은 본 발명의 제 2 실시예에 따른 스테레오 신호를 엔코딩하는 제 2 단계에 대한 구성의 개략도이다. 먼저, 800에서 m 및 s 신호는 도 6에 관련하여 기술된 바와 같이 세그먼트화된다. 이어서, 801에서, 신호(m)의 진폭 스펙트럼(M)은 m 신호의 고속 푸리에 변환을 수행함으로써 결정된다. 유사하게, 803에서, 신호(s)의 진폭 스펙트럼(S)는 s 신호의 고속 푸리에 변환을 수행함으로써 결정된다. 805에서, 비 R=S/M이 결정되고 807에서 역 고속 푸리에 변환이 수행됨으로써 신호(r)이 나온다. 809에서, 선형 예측이 r 신호에 대해 수행되어 한 세트의 예측 계수들이 되고 811에서 신호(s)의 각 세그먼트의 에너지(e)가 추정된다. 예측 계수(ar) 및 추정된 에너지(e)는 813에서 한 세트의 변환 파라미터들(pF)로 다중화된다. m 신호 및 한 세트의 변환 파라미터들(pF)는 m 및 s 신호를 나타내며, 디코더에서 s 신호에 대응하는 신호를 재현하는데 사용될 수 있다. 대안으로서, 예측 계수(ar)는 비 신호(R)로부터 생성될 수도 있을 것이다.
도 9는 본 발명의 제 2 실시예에 따른 스테레오 신호를 디코딩하기 위한 구성의 개략도이다. m 신호 및 변환 파라미터들(pF)는 디코더에 입력으로서 입력된다. 901에서, 변환 파라미터들은 예측 계수들(ar) 및 추정 에너지(e)로 역다중화된다. 이어서, 903에서, 예측 계수들(ar)은 후속의 프레임들간에 보간됨으로써 각 세그먼트에서 예측 계수들이 활용될 수 있게 한다. 905에서, 추정 에너지(e)에 대해 그와 유사한 보간이 수행된다. 907에서, m 신호는 예측 계수들(ar)에 의해 기술된 선형 예측 분석 필터에서 필터링된다. 다음에 909에서, 감쇄가 적용되고 출력(s'')의 에너지가 원 s 신호에 대해 추정된 에너지(e)와 확실히 일치하게 된다. 마지막으로 911에서, 신호(s'')는 무상관 필터 혹은 전역통과 필터에서 필터링되어, 생성된 출력(s')과 m 신호간에 사이코-어쿠스틱 면에서 어떠한 상관이든 제거된다. 위의 대안적인 실시예에서, 필터링하는 순서는 역으로 할 수 있다. 또한, R이 S/M으로서 규정된다면 선형 예측 분석 필터는 디코더에서 사용되어야 한다. 대안적으로, R이 M/S으로서 규정되었다면 선형 예측 합성필터는 디코더에서 사용되었어야 했다.
합성필터를 더 간단하게 되게 하기 위해서(즉, 차수를 낮추기 위해서), 무상관 필터를 예측 계수들로 엔캡슐레이트하는 것이 편리할 수 있다. 예측 계수들에 의해 기술된 필터는 사이코-어쿠스틱 무상관 형태를 수행하고, 이는 결국 더 이상 무상관 필터에 의해 행할 필요가 없다. 그러나, 이러한 엔캡슐화는 엔코더에서 행해져야 하고, 전체 필터(스펙트럼 정형 및 무상관)이 전송되어야 한다. 이것은 통상적으로 비트 레이트를 증가시키게 될 것이다.
도 10은 본 발명의 제 3 실시예에 따른 스테레오 신호를 엔코딩하는 제 2 단계에 대한 구성의 개략도이다. 먼저 1001에서, s 신호는 도 6에 관련하여 기술된 바와 같이 세그먼트화된다. 1003에서, s 신호의 각 세그먼트에 대해 선형 예측이 수행되어 한 세트의 예측 계수들(as)이 나온다. 1005에서, 예측 계수들(as)에 의해 기술된 선형 예측 분선 필터에서 s 신호가 필터링되고, 1007에서 각 세그먼트의 시간 포락선(g)이 결정된다. 시간 포락선은 세그먼트 당 하나 이상의 에너지 측정을 사용함으로써 혹은 시간 잡음 정형화를 적용함으로써 결정될 수도 있을 것이다. 예측 계수들(as) 및 시간 포락선(g)이 1009에서 한 세트의 변환 파라미터들(pF)로 다중화된다. m 신호 및 한 세트의 변환 파라미터들(pF)는 m 및 s 신호를 나타내며 디코더에서 s 신호에 대응하는 신호를 재현하는데 사용될 수 있다.
도 11은 본 발명의 제 3 실시예에 다른 스테레오 신호를 디코딩하기 위한 구성의 개략도이다. m 신호 및 변환 파라미터들(pF)는 디코더에 입력으로서 사용된다. 1101에서, 변환 파라미터들은 예측 계수들(as)과 시간 포락선(g)으로 역다중화된다. 이어서, 1103에서, 예측 계수들(as)은 후속의 세그먼트들 간에 보간되어 각 세그먼트에서 예측 계수들이 활용될 수 있게 한다. 1105에서, 시간 포락선(g)에 대해 그와 유사한 보간이 수행된다. 1107에서, 백색 잡음이 백색 시퀀스를 생성한다. 이어서, 1109에서, 시간 포락선이 1109에서 적용되고, 마지막으로, 1111에서, 백색 시퀀스는 예측 계수들(as)에 의해 기술된 선형 분석 필터에서 필터링됨으로써 출력(s')이 나온다.
오디오 및 음성 코딩 목적을 위해서, 어떻게 하든 청각 필터들을 암시하는 작용을 하는 선형 예측 필터들을 사용하는 것이 효과적이다. 이러한 필터들의 예들은, Kautz 필터들, Laguerre 필터들 및 Gamma-tone 필터들이고 예를 들면 W02002089116에 기술되어 있다.
당업자는 예를 들면 특징들을 부가 혹은 제거함으로써 혹은 위의 실시예들의 특징들을 조합함으로써, 위의 실시예들을 수정할 수 있음을 알 것이다. 본 발명은 스테레오포닉 신호들로 한정되는 것은 아니며 2이상의 입력채널들을 갖는 그 외의 복수-채널 입력신호들에도 적용될 수 있는 것에 또한 유의한다. 이러한 복수-채널 신호들의 예들은 디지털 다기능 디스크(DVD) 혹은 슈퍼 오디오 콤팩트 디스크 등으로부터 수신된 신호들을 포함한다. 이 보다 일반적인 경우에, 주요 성분 신호(y) 및 하나 이상의 잔여 신호들(r)은 여전히 본 발명에 따라 생성될 수 있다. 전송되는 잔여 신호들의 수는 신호품질을 현저히 저하시킴이 없이 고차 잔여신호들을 생략할 수도 있으므로, 채널 수 및 원하는 비트 레이트에 따른다.
일반적으로, 비트-레이트 할당을 적응형으로 가변시킴으로써 적절한 저하가 가능하게 하는 것이 본 발명의 이점이다. 예를 들면, 통신 채널이 잠시, 예를 들면 증가된 네트워크 트래픽, 잡음 등에 기인하여, 감소된 비트 레이트만이 전송되게 한다면, 전송된 신호의 비트 레이트는 신호의 인지될 수 있는 질의 현저한 저하없이 감소될 수도 있다. 예를 들면, 위에 논의된 바와 같이 고정 사운드 원의 경우에, 비트 레이트는 2개 대신 하나의 채널을 전송하는 것에 대응하는 신호 질을 현저히 저하시킴이 없이 대략 2배만큼 감소될 수도 있다.
위의 구성들은 범용 혹은 전용 프로그래머블 마이크로프로세서들, 디지털 신호 프로세서들(DSP), ASCI(Application Specific Integrated Circuits), PLA(Programmable Logic Arrays), FPGA(Field Programmable Gate Arrays), 전용 전자회로들 등, 혹은 이들의 조합들로서 구현될 수 있는 것에 유의한다.
위에 언급된 실시예들은 본 발명을 한정하기보다는 예시하는 것이며 당업자들은 첨부한 청구항들의 범위 내에서 많은 대안적 실시예들을 설계할 수 있을 것임에 유의한다. 청구항들에서, 괄호 내의 참조부호는 청구항은 제한하는 것으로 해석되지 않을 것이다. '포함하다(comprising)'라는 단어는 청구항에 나열된 것들 이외의 구성요소들 혹은 단계들의 존재를 배제하지 않는다. 본 발명은 몇 개의 구별되는 구성요소들을 포함하는 하드웨어에 의해서, 또한 적합하게 프로그램된 컴퓨터에 의해 구현될 수 있다. 몇 개의 수단을 나열한 장치 청구항에서, 이들 수단의 몇몇은 하나의 동일 아이템의 하드웨어로 실현될 수 있다. 서로 다른 종속 청구항들에서 어떤 대책이 인용된 단순한 사실이, 이들 대책들의 조합이 이점이 있게 하는데 사용될 수 없다는 것을 나타내는 것은 아니다.

Claims (17)

  1. 주 및 부 신호(main and side signal)를 엔코딩하는 방법에 있어서,
    적어도 상기 주 및 부 신호는 다채널 오디오 신호를 나타내며, 상기 주 및 부 신호는 상기 주 및 부 신호의 파워 스펙트럼 에너지들간의 관계가 사이코-어쿠스틱 밴드(psycho-acoustical band)마다 그대로(intact)인 특징들을 가지고, 상기 부 신호는 상기 주 신호와 사이코-어쿠스틱으로 상관되지 않는, 상기 엔코딩 방법은:
    미리결정된 변환에 의해 상기 부 신호를 한 세트의 변환 파라미터들로 변환하는 단계로서, 상기 파라미터들은 상기 부 신호에 대응하고 상기 부 신호의 상기 특징들을 갖는 제 3 신호를 재생하도록 적응되는, 상기 변환 단계; 및
    적어도 상기 주 신호 및 상기 변환 파라미터들에 의해 상기 다채널 신호를 나타내는 단계를 포함하는, 엔코딩 방법.
  2. 제 1 항에 있어서,
    상기 미리결정된 변환은 상기 주 및 부 신호로부터 한 세트의 변환 파라미터들을 생성하는 단계를 포함하고, 상기 변환 파라미터들은 상기 주 및 부 신호의 스펙트럼들간의 관계를 규정하는, 엔코딩 방법.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 변환 파라미터들을 생성하는 단계는:
    2 세트들의 예측 계수들을 얻기 위해, 상기 주 신호 및 상기 부 신호 둘 모두에 대해 선형 예측을 수행하는 단계로서, 제 1 세트는 상기 주 신호에 대응하는 계수들을 포함하고 제 2 세트는 상기 부 신호에 대응하는 계수들을 포함하는, 상기 선형 예측 수행 단계; 및
    상기 부 신호의 에너지를 결정하는 단계를 포함하고,
    상기 변환 파라미터들은 상기 예측 계수들 및 상기 결정된 에너지를 포함하는, 엔코딩 방법.
  4. 제 1 항 또는 제 2 항에 있어서,
    상기 변환 파라미터들을 생성하는 단계는:
    상기 주 및 부 신호의 진폭 스펙트럼들을 결정하는 단계;
    상기 주 및 부 신호의 상기 결정된 진폭 스펙트럼들간의 비들을 결정하는 단계;
    상기 결정된 비들에 기초한 정보를 예측 시스템으로의 입력으로서 사용함으로써 예측 계수들을 생성하는 단계; 및
    상기 부 신호의 에너지를 결정하는 단계를 포함하고,
    상기 변환 파라미터들은 상기 예측 계수들 및 상기 결정된 에너지를 포함하는, 엔코딩 방법.
  5. 제 1 항 또는 제 2 항에 있어서,
    상기 변환 파라미터들을 생성하는 단계는:
    상기 부 신호에 대응하는 계수들을 포함하는 한 세트의 예측 계수들을 얻기 위해 상기 부 신호에 대한 선형 예측을 수행하는 단계; 및
    상기 부 신호에 대한 시간 포락선(temporal envelope)을 결정하는 단계를 포함하고,
    상기 변환 파라미터들은 상기 예측 계수들 및 상기 결정된 시간 포락선을 포함하는, 엔코딩 방법.
  6. 제 1 항 내지 제 5 항 중 어느 한 항에 있어서,
    상기 부 신호를 한 세트의 변환 파라미터들로 변환하는 단계는 각 세그먼트에 대응하는 변환 파라미터들을 결정함으로써, 적어도 상기 부 신호의 중첩 세그먼트 들상에서 수행되는, 엔코딩 방법.
  7. 주 및 부 신호 정보를 디코딩하는 방법에 있어서,
    적어도 상기 주 및 부 신호는 다채널 오디오 신호를 나타내며, 상기 주 및 부 신호는 상기 주 및 부 신호의 파워 스펙트럼 에너지들간의 관계가 사이코-어쿠스틱 밴드마다 그대로인 특징들을 가지고, 상기 부 신호는 상기 주 신호와 사이코-어쿠스틱으로 상관되지 않는, 상기 디코딩 방법은:
    주 신호 및 한 세트의 변환 파라미터들을 수신하는 단계로서, 상기 변환 파라미터들은 상기 부 신호에 대응하고 상기 부 신호와 동일한 특징들을 갖는 제 3 신호를 재생하도록 적응되는, 상기 수신 단계; 및
    상기 미리결정된 변환을 역으로 수행하기 위해 상기 변환 파라미터를 사용함으로써 상기 부 신호의 상기 특징들을 갖는 상기 제 3 신호를 생성하는 단계를 포함하는, 디코딩 방법.
  8. 제 7 항에 있어서,
    상기 제 3 신호를 생성하는 단계는:
    백색 잡음 시퀀스를 생성하는 단계;
    상기 부 신호에 대응하는 상기 예측 계수에 의해 규정된 선형 예측 필터에서 상기 백색 잡음 시퀀스를 필터링함으로써 제 1 신호를 생성하는 단계로서, 상기 예측 계수들은 상기 수신된 변환 파라미터들에 포함되는, 상기 생성 단계; 및
    상기 제 2 신호의 에너지가 상기 부 신호의 상기 결정된 에너지에 대응할 때까지 상기 제 2 신호를 감쇄하는 단계로서, 상기 결정된 에너지는 상기 수신된 변환 파라미터들에 포함되는, 상기 감쇄 단계를 포함하는, 디코딩 방법.
  9. 제 7 항에 있어서,
    상기 제 3 신호를 생성하는 단계는:
    임시 신호를 생성하는 단계로서, 상기 임시 신호와 상기 주 신호간의 스펙트럼 에너지 관계는 상기 주 신호와 상기 부 신호간의 스펙트럼 에너지 관계에 대응하고, 상기 임시 신호는 필터 파라미터들로서 상기 변환 파라미터들을 사용하여 상기 주 신호를 필터링함으로써 생성되는, 상기 생성 단계; 및
    상기 출력 신호가 상기 주 신호와 사이코-어쿠스틱으로 상관되지 않도록 하는 상기 임시 신호를 필터링하는 단계를 포함하는, 디코딩 방법.
  10. 제 9 항에 있어서,
    상기 임시 신호를 생성하는 단계는:
    상기 주 신호에 대응하는 상기 예측 계수에 의해 규정된 선형 예측 분석 필터에서 상기 주 신호를 필터링함으로써 제 1 신호를 생성하는 단계로서, 상기 예측 계수들은 상기 수신된 변환 파라미터들에 포함되는, 상기 생성 단계;
    상기 수신된 변환 파라미터들에 포함된 상기 예측 계수들에 의해 규정된 선형 예측 합성 필터에서 상기 제 1 신호를 필터링함으로써 제 2 신호를 생성하는 단계로서, 상기 예측 계수들은 상기 부 신호에 대응하는, 상기 제 2 신호 생성 단계; 및
    상기 제 2 신호의 에너지가 상기 부 신호의 상기 결정된 에너지에 대응할 때까지 상기 제 2 신호를 감쇄하는 단계로서, 상기 결정된 에너지는 상기 수신된 변환 파라미터들에 포함되는, 상기 감쇄 단계를 포함하는, 디코딩 방법.
  11. 제 9 항에 있어서,
    상기 임시 신호를 생성하는 단계는:
    상기 예측 계수에 의해 규정된 선형 예측 필터에서 상기 주 신호를 필터링함으로써 제 1 신호를 생성하는 단계로서, 상기 예측 계수들은 상기 변환 파라미터들에 포함되며, 상기 예측 계수들은 상기 주 및 부 신호의 상기 결정된 진폭 스펙트럼들간의 비들을 결정하고, 상기 결정된 비들의 역 푸리에 변환을 수행하며, 예측 시스템에의 입력으로서 상기 역 푸리에 변환의 결과를 사용함으로써 생성되는, 상기 생성 단계; 및
    상기 제 2 신호의 에너지가 상기 부 신호의 상기 결정된 에너지에 대응할 때까지 상기 제 2 신호를 감쇄하는 단계로서, 상기 결정된 에너지는 상기 변환 파라미터들에 포함되는, 상기 감쇄 단계를 포함하고,
    상기 변환 파라미터들은 상기 예측 계수들 및 상기 결정된 에너지를 포함하는, 디코딩 방법.
  12. 제 7 항 내지 제 11 항 중 어느 한 항에 있어서,
    상기 변환 파라미터들이 특정의 세그먼트들에 대응하여 생성될 때, 상기 부 신호와 동일한 특징들을 갖는 상기 제 3 신호를 생성하는 단계는 상기 특정의 세그먼트들간의 변환 파라미터들을 초기에 보간함으로써 수행되는, 디코딩 방법.
  13. 주 및 부 신호를 엔코딩하는 장치에 있어서,
    적어도 상기 주 및 부 신호는 다채널 오디오 신호를 나타내며, 상기 주 및 부 신호는 상기 주 및 부 신호의 파워 스펙트럼 에너지들간의 관계가 사이코-어쿠스틱 밴드마다 그대로인 특징들을 가지고, 상기 부 신호는 상기 주 신호와 사이코-어쿠스틱으로 상관되지 않는, 상기 엔코딩 장치는:
    미리결정된 변환에 의해 상기 부 신호를 한 세트의 변환 파라미터들로 변환하는 제 1 처리 수단으로서, 상기 파라미터들은 상기 부 신호에 대응하고 상기 부 신호와 동일한 특징들을 갖는 제 3 신호를 재생하도록 적응되는, 상기 제 1 처리 수단; 및
    상기 주 신호 및 상기 변환 파라미터들에 의해 적어도 상기 다채널 신호를 나타내도록 적응된 제 2 처리 수단을 포함하는, 엔코딩 장치.
  14. 주 및 부 신호 정보를 디코딩하는 장치에 있어서,
    적어도 상기 주 및 부 신호는 다채널 오디오 신호를 나타내며, 상기 주 및 부 신호는 상기 주 및 부 신호의 파워 스펙트럼 에너지들간의 관계가 사이코-어쿠스틱 밴드마다 그대로인 특징들을 가지고, 상기 부 신호는 상기 주 신호와 사이코-어쿠스틱으로 상관되지 않는, 상기 디코딩 장치는:
    주 신호 및 한 세트의 변환 파라미터들을 수신하는 수신 수단으로서, 상기 변환 파라미터들은 상기 부 신호에 대응하고 상기 부 신호와 동일한 특징들을 갖는 제 3 신호를 재생하도록 적응되는, 상기 수신 수단; 및
    상기 미리결정된 변환을 역으로 수행하기 위해 상기 변환 파라미터들을 사용함으로써 상기 부 신호와 동일한 특징들을 갖는 상기 제 3 신호를 생성하는 처리 수단을 포함하는, 디코딩 장치.
  15. 다채널 신호 정보를 포함하는 데이터 신호로서, 상기 데이터 신호는 제 1 항 내지 제 6 항 중 어느 한 항에 따른 엔코딩 방법에 의해 엔코딩되는, 데이터 신호.
  16. 제 1 항 내지 제 6 항 중 어느 한 항에 따른 엔코딩 방법에 의해 엔코딩된 다채널 신호 정보를 나타내는 데이터 기록을 포함하는 컴퓨터 판독가능 매체.
  17. 다채널 신호를 통신하는 디바이스에 있어서,
    상기 디바이스는 주 및 부 신호를 엔코딩하는 장치를 포함하고, 적어도 상기 주 및 부 신호는 다채널 오디오 신호를 나타내며, 상기 주 및 부 신호는 상기 주 및 부 신호의 파워 스펙트럼 에너지들간의 관계가 사이코-어쿠스틱 밴드마다 그대로인 특징들을 가지고, 상기 부 신호는 상기 주 신호와 사이코-어쿠스틱으로 상관되지 않으며,
    상기 엔코딩 장치는:
    미리결정된 변환에 의해 상기 부 신호를 한 세트의 변환 파라미터들로 변환하는 제 1 처리 수단으로서, 상기 파라미터들은 상기 부 신호에 대응하고 상기 부 신호와 동일한 특징들을 갖는 제 3 신호를 재생하도록 적응되는, 제 1 처리 수단; 및
    상기 주 신호 및 상기 변환 파라미터들에 의해 적어도 상기 다채널 신호를 나타내도록 적응된 제 2 처리 수단을 포함하는, 통신 디바이스.
KR1020057017914A 2003-03-24 2004-03-18 다채널 신호를 나타내는 주 및 부 신호의 코딩 KR20050116828A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03100752 2003-03-24
EP03100752.9 2003-03-24

Publications (1)

Publication Number Publication Date
KR20050116828A true KR20050116828A (ko) 2005-12-13

Family

ID=33041036

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057017914A KR20050116828A (ko) 2003-03-24 2004-03-18 다채널 신호를 나타내는 주 및 부 신호의 코딩

Country Status (6)

Country Link
US (1) US20060171542A1 (ko)
EP (1) EP1609335A2 (ko)
JP (1) JP2006521577A (ko)
KR (1) KR20050116828A (ko)
CN (1) CN1765153A (ko)
WO (1) WO2004086817A2 (ko)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7805313B2 (en) 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US7720230B2 (en) 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
MX2007005261A (es) * 2004-11-04 2007-07-09 Koninkl Philips Electronics Nv Codificacion y descodificacion de un conjunto de senales.
WO2006060279A1 (en) 2004-11-30 2006-06-08 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
JP5017121B2 (ja) 2004-11-30 2012-09-05 アギア システムズ インコーポレーテッド 外部的に供給されるダウンミックスとの空間オーディオのパラメトリック・コーディングの同期化
US7787631B2 (en) 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US7903824B2 (en) 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
WO2006108543A1 (en) * 2005-04-15 2006-10-19 Coding Technologies Ab Temporal envelope shaping of decorrelated signal
US20070055510A1 (en) 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
WO2007026763A1 (ja) * 2005-08-31 2007-03-08 Matsushita Electric Industrial Co., Ltd. ステレオ符号化装置、ステレオ復号装置、及びステレオ符号化方法
FR2898725A1 (fr) * 2006-03-15 2007-09-21 France Telecom Dispositif et procede de codage gradue d'un signal audio multi-canal selon une analyse en composante principale
EP2054875B1 (en) 2006-10-16 2011-03-23 Dolby Sweden AB Enhanced coding and parameter representation of multichannel downmixed object coding
WO2008046530A2 (en) 2006-10-16 2008-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
US20120045065A1 (en) * 2009-04-17 2012-02-23 Pioneer Corporation Surround signal generating device, surround signal generating method and surround signal generating program
TWI433137B (zh) 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
TWI516138B (zh) * 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
CN108269577B (zh) 2016-12-30 2019-10-22 华为技术有限公司 立体声编码方法及立体声编码器
KR20220009563A (ko) * 2020-07-16 2022-01-25 한국전자통신연구원 오디오 신호의 부호화 및 복호화 방법과 이를 수행하는 부호화기 및 복호화기

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
DE19742655C2 (de) * 1997-09-26 1999-08-05 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
FR2821475B1 (fr) * 2001-02-23 2003-05-09 France Telecom Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
ES2341327T3 (es) * 2002-04-10 2010-06-18 Koninklijke Philips Electronics N.V. Codificacion y decodificacion de señales audio multicanal.
JP4322207B2 (ja) * 2002-07-12 2009-08-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化方法
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel

Also Published As

Publication number Publication date
EP1609335A2 (en) 2005-12-28
JP2006521577A (ja) 2006-09-21
US20060171542A1 (en) 2006-08-03
WO2004086817A3 (en) 2005-02-10
CN1765153A (zh) 2006-04-26
WO2004086817A2 (en) 2004-10-07

Similar Documents

Publication Publication Date Title
KR20050116828A (ko) 다채널 신호를 나타내는 주 및 부 신호의 코딩
JP4322207B2 (ja) オーディオ符号化方法
JP4418493B2 (ja) パラメトリックマルチチャネル符号化システムにおけるチャネルの周波数ベースの符号化
JP4401173B2 (ja) 信号合成方法
JP4939933B2 (ja) オーディオ信号符号化装置及びオーディオ信号復号化装置
CN101385075B (zh) 用于编码/解码信号的装置和方法
JP3203657B2 (ja) 情報符号化方法及び装置,情報復化方法及び装置,情報伝送方法,並びに情報記録媒体
USRE43273E1 (en) Generation of a sound signal
RU2323551C1 (ru) Частотно-ориентированное кодирование каналов в параметрических системах многоканального кодирования
CN104681030A (zh) 用于编码/解码信号的装置和方法
EP1500085A1 (en) Coding of stereo signals
US11096002B2 (en) Energy-ratio signalling and synthesis
JPH07336233A (ja) 情報符号化方法及び装置並びに情報復号化方法及び装置
JP7080262B2 (ja) チャネル間位相差パラメータ符号化方法および装置
WO1995016263A1 (fr) Procede, dispositif et support concernant le traitement de l'information
JP3528260B2 (ja) 符号化装置及び方法、並びに復号化装置及び方法
JP5483813B2 (ja) マルチチャネル音声音響信号符号化装置および方法、並びにマルチチャネル音声音響信号復号装置および方法
KR100224582B1 (ko) Mpeg-2 오디오의 에러 검출 장치 및 방법
JP3513879B2 (ja) 情報符号化方法及び情報復号化方法
JP2000148191A (ja) ディジタルオーディオ信号の符号化装置
JP2000244325A (ja) Mpegオーディオの復号化方法
JPH07181996A (ja) 情報処理方法、情報処理装置、及びメディア
Noll Wideband Audio
Peter ISO/MPEG AUDIO CODING: STATUS AND TRENDS

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid