위의 문제들 및 그 외 다른 문제들은 적어도 제 1 신호 성분, 제 2 신호 성분, 및 제 3 신호 성분을 포함하는 다중-채널 오디오 신호를 인코딩하는 방법에 의해 해결되며, 상기 방법은:
제 1 인코딩 신호 및 제 1 인코딩된 파라미터들의 세트를 야기하는 제 1 파라메트릭 인코더에 의해 상기 제 1 및 제 2 신호 성분들을 인코딩하는 단계;
제 2 인코딩된 신호 및 제 2 인코딩된 파라미터들의 세트를 야기하는 제 2 파라메트릭 인코더에 의해 상기 제 1 인코딩된 신호 및 부가적인 신호를 인코딩하는 단계로서, 상기 부가적인 신호는 적어도 상기 제 3 신호 성분으로부터 도출되는, 상기 제 1 인코딩된 신호 및 부가적인 신호를 인코딩하는 단계; 및
적어도, 결과적인 인코딩된 신호, 상기 제 1 인코딩된 파라미터들의 세트, 및 상기 제 2 인코딩 파라미터들의 세트에 의해 상기 다중 채널 오디오 신호를 표현하는 단계로서, 상기 결과적인 인코딩 신호는 적어도 상기 제 2 인코딩된 신호로부터 도출되는, 상기 다중 채널 오디오 신호를 표현하는 단계를 포함한다.
그러므로, 스테레오 코더들과 같은 복수의 파라메트릭 코더들을 캐스케이딩(cascading)함으로써, 다중-채널 오디오 신호들을 위한 효율적인 코딩 방식이 제공된다. 캐스케이딩 방식을 따르면, 제 1 파라메트릭 인코딩 단계의 출력은 부가적인 입력 신호, 예를 들어 또 다른 제 2 파라메트릭 인코딩 단계의 출력과 함께 다음의 제 2 인코딩 단계에 입력으로서 공급된다.
결국, 본 발명을 따르면, n>2인 오디오 채널들을 갖는 다중-채널 신호는 단일 인코딩된 신호 채널 및 파라메트릭 인코더들에 대응하는 다수의 인코딩 파라미터 비트 스트림들로서 인코딩될 수 있고, 이로 인해, 높은 코딩 효율을 제공한다.
바람직한 실시예에서, 다중-채널 오디오 신호는 제 4 신호 성분을 더 포함하고, 방법은 부가적인 신호 및 제 3 인코딩 파라미터들의 세트를 야기하는 제 3 파라메트릭 인코더에 의해 상기 제 3 및 제 4 신호 성분들을 인코딩하는 단계를 더 포함하고, 상기 다중 오디오 신호를 표현하는 단계는 적어도 결과적인 인코딩된 신호, 상기 제 1 인코딩 파라미터들의 세트, 상기 제 2 인코딩 파라미터들의 세트, 및 상기 제 3 인코딩 파라미터들의 세트에 의해 상기 다중 채널 오디오 신호를 표현하는 단계로서, 상기 결과적인 인코딩된 신호는 적어도 상기 제 2 인코딩된 신호로부터 도출되는, 상기 다중 채널 오디오 신호를 표현하는 단계를 포함한다. 따라서, 제 2 파라메트릭 인코더로의 부가적인 입력 신호는 또한, 이전 인코더의 출력이다.
용어 파라메트릭 인코더는 단일 인코딩된 오디오 채널 및 디코더로 하여금 상기 인코딩된 오디오 채널을 2개의 디코딩된 오디오 채널들로 디코딩하게 허용하는 인코딩 파라미터들의 세트를 야기하는 적어도 2개의 오디오 채널들을 인코딩하기 위한 인코더를 나타낸다. 이러한 파라메트릭 코딩 방식들의 예들은 주성분 신호 및 대응하는 회전 각도로서 스테레오 신호를 코딩하는 것, 스테레오 신호를 스트레오 신호의 공간 속성에 대응하는 다수의 파라미터들 및 조합 신호로 코딩하는 것 등을 포함한다. 그러나, 임의의 알려진 적절한 파라메트릭 인코딩 방식이 사용될 수 있다. 제 1 및 제 2 파라메트릭 인코딩 모듈들은 동일하거나 또는 상이한 파라메트릭 인코딩 방식들을 구현할 수 있다.
결과적인 인코딩된 신호는 단지 제 2 인코딩된 신호로부터 도출될 수 있으며, 즉, 이는 제 2 인코딩된 신호의 변환 결과이거나, 동일할 수 있다. 대안적으로, 결과적인 인코딩된 신호는 제 2 인코딩된 신호 및 또 다른 신호의 조합으로부터 도출될 수 있다. 예를 들어, 제 2 인코딩된 신호는 부가적인 캐스케이딩 단계에 대응하는 부가적인 인코딩 모듈로의 입력으로서 작용할 수 있다.
오디오 코딩 분야 내에서, 좌전방 채널, 좌후방 채널, 우전방 채널 및 우후방 채널을 포함하는 4개의 채널 신호들의 코딩이 특히 관련된다. 본 발명을 따르면, 이와 같은 신호는 3개의 파라메트릭 인코더들의 캐스케이드된 체인에 의해 효율적으로 인코딩될 수 있다. 제 1 인코더는 좌전방 및 좌후방 채널을 인코딩하여 조합된 좌 채널 및 이에 대응하는 인코딩 파라미터들을 야기한다. 제 2 인코더는 우전방 및 우후방 채널을 인코딩하여 조합된 우 채널 및 이에 대응하는 인코딩 파라미터들을 야기한다. 제 3 인코더는 조합된 우 채널 및 조합된 좌 채널을 수신하여 단일 인코딩된 신호 및 대응하는 제 3 인코딩 파라미터들의 세트를 생성한다.
더욱이, DVD(Digital Versatile Disk) 및 SACD(Super Audio Compact Disc)의 최신 기술들은 5개의 오디오 채널들, 즉 상술된 4개의 채널들 및 부가적인 중앙 채널을 포함한다. 본 발명을 따르면, 이와 같은 신호는 4개의 파라메트릭 인코더들을 사용함으로써 효율적으로 인코딩될 수 있다. 3개의 인코더들은 위의 4개의 채널 경우처럼 좌 및 우 채널들을 인코딩하고, 제 4 인코더는 입력들로서 상기 캐스케이드된 체인의 출력 신호 및 중앙 신호를 수신하여 최종 인코딩된 신호를 생성한다.
또 다른 바람직한 실시예에서, 다중-채널 신호는 5개의 채널 오디오 신호를 포함하고, 제 1 신호 성분은 5개의 채널 오디오 신호의 좌전방 채널을 포함하며, 제 2 신호 성분은 5개의 채널 오디오 신호의 좌후방 채널을 포함하며, 제 3 신호 성분은 5개의 채널 오디오 신호의 우전방 채널을 포함하며, 제 4 신호 성분은 5개의 채널 오디오 신호의 우후방 채널을 포함하며, 5개의 채널 오디오 신호는 중앙 신호를 더 포함하고; 제 1 인코딩된 신호 및 부가적인 신호의 인코딩 단계는 제 1 인코딩된 신호 및 부가적인 신호 각각을 중앙 신호와 조합시키는 단계를 더 포함한다. 그러므로, 본 발명을 따르면, 이 중앙 신호는, 최종 인코딩된 신호로서 좌 및 우 채널을 인코딩하기 전에, 인코딩된 좌 채널 및 인코딩된 우 채널과 조합된다.
이 실시예의 부가적인 이점은 단지 3개의 스테레오 인코더들만으로 5개의 채널 신호들에 대한 효율적인 인코딩을 제공한다는 것이다.
본 발명의 또 다른 이점은 수신단에서의 디코더가 수신단에서 이용 가능한 재생 채널들의 수에 적응하도록 허용하는 코딩 방식을 제공한다는 것이다.
본 발명은 상술되고 이하에 설명되는 방법, 인코딩 및 디코딩을 위한 장치들 및 또 다른 생성 수단을 포함한 상이한 방식들로 구현될 수 있고, 이들 각각은 가장 먼저 언급된 방법과 관련하여 서술된 이점들 및 장점들 중 하나 이상을 가지며, 이들 각각은 가장 먼저 언급된 방법과 관련하여 설명되고 종속항들에 개시된 바람직한 실시예들에 대응하는, 하나 이상의 바람직한 실시예들을 갖는다.
상술되고 이하에 설명되는 방법의 특징들은 소프트웨어로 구현될 수 있고 데이터 처리 시스템 또는 컴퓨터-실행가능한 명령들의 실행에 의해 야기되는 다른 처리 수단으로 실행될 수 있다는 점에 유의한다. 이 명령들은 저장 매체 또는 또 다른 컴퓨터로부터 컴퓨터 네트워크를 통해 RAM과 같은 메모리에 로딩되는 프로그램 코드 수단일 수 있다. 대안적으로, 상술된 특징들은 소프트웨어 또는 소프트웨어와의 조합 대신에 하드와이어드 회로(hardwired circuitry)에 의해 구현될 수 있다.
본 발명은 또한, 인코딩된 다중-채널 오디오 신호를 디코딩하는 방법에 관한 것으로서, 방법은 :
인코딩된 다중-채널 오디오 신호로부터 제 1 인코딩된 신호, 제 1 인코딩 파라미터들의 세트 및 제 2 인코딩 파라미터들의 세트를 획득하는 단계;
제 1 인코딩된 신호 및 제 1 인코딩 파라미터들의 세트로부터 제 1 및 제 2 디코딩된 신호들을 획득하는 단계로서, 제 2 디코딩된 신호는 다중-채널 신호의 적어도 제 1 신호 성분을 나타내는, 상기 제 1 및 제 2 디코딩된 신호를 획득하는 단계; 및,
제 1 디코딩된 신호 및 제 2 인코딩 파라미터들의 세트로부터 제 3 및 제 4 디코딩된 신호들을 획득하는 단계를 포함한다.
본 발명은 또한, 적어도 제 1 신호 성분, 제 2 신호 성분 및 제 3 신호 성분을 포함하는 다중-채널 오디오 신호를 인코딩하기 위한 장치에 관한 것으로서, 장치는:
제 1 인코딩된 신호 및 제 1 인코딩 파라미터들의 세트를 야기하는 상기 제 1 및 제 2 신호 성분들을 인코딩하도록 적응된 제 1 파라메트릭 인코더;
제 2 인코딩된 신호 및 제 2 인코딩 파라미터들의 세트를 야기하는 상기 제 1 인코딩된 신호 및 부가적인 신호를 인코딩하도록 적응된 제 2 파라메트릭 인코더로서, 상기 부가적인 신호는 적어도 상기 제 3 신호 성분으로부터 도출되는, 상기 제 2 파라메트릭 인코더를 포함한다.
본 발명은 또한 인코딩된 다중-채널 오디오 신호를 디코딩하기 위한 장치에 관한 것으로서, 장치는:
인코딩된 다중-채널 오디오 신호로부터 제 1 인코딩된 신호, 제 1 인코딩 파라미터들의 세트, 및 제 2 인코딩 파라미터들의 세트를 획득하기 위한 수단;
제 1 인코딩된 신호 및 제 1 인코딩 파라미터들의 세트로부터 제 1 및 제 2 디코딩된 신호들을 획득하도록 적응되는 제 1 디코더로서, 상기 제 2 디코딩된 신호는 다중-채널 신호의 적어도 제 1 신호 성분을 나타내는, 제 1 디코더; 및,
제 1 디코딩된 신호 및 제 2 인코딩 파라미터들의 세트로부터 제 3 및 제 4 디코딩된 신호들을 획득하도록 적응되는 제 2 디코더를 포함한다.
본 발명은 또한 인코딩된 오디오 신호를 공급하기 위한 장치에 관한 것으로서, 그 장치는:
다중-채널 오디오 신호를 수신하기 위한 유닛;
다중-채널 오디오 신호를 인코딩하기 위한, 상술되고 이하에 서술된 바와 같은 인코딩을 위한 장치; 및
인코딩된 오디오 신호를 제공하기 위한 출력 유닛을 포함한다.
본 발명은 또한, 디코딩된 오디오 신호를 공급하기 위한 장치에 관한 것으로서, 상기 장치는:
인코딩된 오디오 신호를 수신하기 위한 입력 유닛;
인코딩된 오디오 신호를 디코딩하기 위한, 상술되고 이하에 설명되는 바와 같은 디코딩을 위한 장치; 및,
디코딩된 오디오 신호를 제공하기 위한 출력 유닛을 포함한다.
본 발명은 또한 오디오 신호와 제 1 및 제 2 파라미터들의 세트들을 포함하는 인코딩된 다중-채널 오디오 신호에 관한 것으로서, 오디오 신호 및 제 1 파라미터들의 세트는 제 1 인코딩된 신호 및 부가적인 신호의 입력시 제 1 파라메트릭 인코더에 의해 생성되며, 제 1 인코딩된 신호 및 제 2 파라미터들의 세트는 다중-채널 신호의 제 1 및 제 2 신호 성분의 입력시 제 2 파라메트릭 인코더에 의해 생성되며, 부가적인 신호는 다중-채널 신호의 적어도 제 3 신호 성분으로부터 도출된다.
본 발명은 또한 인코딩된 오디오 신호를 저장하는 저장 매체에 관한 것이다.
본 발명의 이들 및 다른 양상들이 전체 도면들과 관련하여 이하에 서술된 실시예들로부터 명백하게 설명될 것이다.
도 1은 본 발명의 실시예에 따라 다중-채널 오디오 신호들을 전달하기 위한 시스템을 개략적으로 도시한 것이다. 이 시스템은 코딩된 4-채널 신호를 생성하는 코딩 디바이스(101) 및 수신되어 코딩된 신호를 4-채널 신호로 디코딩하는 디코딩 디바이스(105)를 포함한다. 코딩 디바이스(101) 및 디코딩 디바이스(105) 각각은 임의의 전자 장비 또는 장비의 일부일 수 있다.
여기서, 용어 전자 장비는 고정식 및 휴대용 PC들과 같은 컴퓨터들, 고정식 및 휴대용 무선 통신 장비; 및 가령 이동 전화들, 페이저들, 오디오 플레이어들, 멀티미디어 플레이어들, 커뮤니케이터들, 즉 전자 수첩들(electronic organizers), 스마트 폰들, 개인 휴대 정보 단말기들(PDAs), 핸드헬드 컴퓨터 등과 같은 다른 핸드헬드 또는 휴대용 디바이스들을 포함한다. 코딩 디바이스(101) 및 디코딩 디바이스는 하나의 전자 장비에 결합될 수 있는데, 여기서 오디오 신호들은 나중 재생을 위해 컴퓨터 판독 가능한 매체 상에 저장된다.
코딩 디바이스(101)는 다중-채널 신호를 수신하기 위한 입력 유닛(111) 및 4 채널 오디오 신호를 인코딩하기 위한 인코더(102)를 포함하는데, 이 4-채널 신호는 좌전방 신호 성분(LF), 좌후방 신호 성분(LR), 우전방 신호 성분(RF), 및 우후방 신호 성분(RR)을 포함한다. 인코더(102)는 입력 유닛(111)을 통해서 4개의 신호 성분들을 수신하여 코딩된 신호(T)를 생성한다. 4개의 채널 신호는 예를 들어 혼합 장비 등과 같은 부가적인 전자 장비를 통해서 마이크로폰들의 세트로부터 기원할 수 있다. 이 신호들은 또한, 무선 신호처럼 공중을 통해서 또 다른 오디오 플레이어로부터의 출력으로서 또는 임의의 다른 적절한 수단에 의해 수신될 수 있다. 본 발명을 따른 이와 같은 인코더의 바람직한 실시예들이 후술될 것이다.
하나의 실시예에 따르면, 인코더(102)는 통신 채널(109)을 통해서 코딩된 신호(T)를 디코딩 디바이스(105)에 전송하기 위해 송신기(103)에 접속된다. 송신기(103)는 예를 들어 유선 또는 무선 데이터 링크(109)를 통해서 데이터의 전달을 인에이블하기에 적합한 회로를 포함할 수 있다. 이와 같은 송신기의 예들로서, 네크워크 인터페이스, 네트워크 카드, 무선 송신기, 및 예를 들어 IrDa 포트를 통해서, 무선 기반 통신들 예를 들어 블루투스 송수신기 등을 통해서 적외선 광을 전송하기 위한 LED와 같은 다른 적절한 전자기 신호들을 위한 송신기를 포함할 수 있다. 적절한 송신기들의 또 다른 예들로는, 케이블 모뎀, 전화 모뎀, 통합 서비스 디지털 네트워크(ISDN) 어댑터, 디지털 가입자 라인(DSL) 어댑터, 위성 송수신기,이더넷 어댑터 등을 포함한다. 이에 따라서, 통신 채널(109)은 예를 들어 인터넷 또는 또 다른 TCP/IP 네트워크와 같은 패킷-기반 통신 네트워크, 적외선 링크와 같은 단거리 통신 링크, 블루투스 접속 또는 또 다른 무선-기반 링크의 임의의 적절한 유선 또는 무선 데이터 링크일 수 있다.
통신 채널의 또 다른 예들로서, 셀룰러 디지털 패킷 데이터(CDPD) 네트워크, 이동 통신 글로벌 시스템(GSM) 네트워크, 코드 분할 다중 액세스(CDMA) 네트워크, 시분할 다중 액세스 네트워크(TDMA), 범용 패킷 무선 서비스(GPRS) 네트워크, UMTS 네트워크와 같은 3세대 네트워크 등과 같은 무선 전기통신 네트워크들 및 컴퓨터 네트워크들을 포함한다.
대안적으로 또는 부가적으로, 코딩 디바이스는 코딩된 신호(T)를 디코딩 디바이스(105)로 전달하기 위한 하나 이상의 다른 인터페이스들(104)을 포함할 수 있다. 이와 같은 인터페이스들의 예들로서, 컴퓨터 판독 가능한 매체(110) 상에 데이터를 저장하기 위한 디스크 드라이브, 예를 들어, 플로피 디스크 드라이브, 판독/기록 CD-ROM 드라이브, DVD-드라이브 등을 포함한다. 이외 다른 예들로서, 메모리 카드 슬롯, 자기 카드 판독기/기록기, 스마트 카드를 액세스하기 위한 인터페이스 등을 포함한다.
이에 따라서, 디코딩 디바이스(105)는 인터페이스(104) 및 컴퓨터-판독 가능한 매체(110)를 통해서 전달되는 코딩된 신호를 수신하는 송신기 및/또는 또 다른 인터페이스(106)에 의해 전송되는 신호를 수신하기 위한 대응하는 수신기(108)를 포함한다. 디코딩 디바이스는 수신된 신호(T)를 수신하여 이 신호를 디코딩된 4개의 채널 신호의 대응하는 성분들(LF', LR', RF' 및 RR')로 디코딩하는 디코더(107)를 더 포함한다. 본 발명을 따른 이와 같은 디코더의 바람직한 실시예들이 후술될 것이다. 디코딩 디바이스는 디코딩된 신호들을 출력하는 출력 유닛(112)을 더 포함하는데, 그 후 이 디코딩된 신호들은 재생을 위하여 4개의 스피커들의 세트 등을 통해서 오디오 플레이어로 공급될 수 있다.
도 2는 본 발명의 실시예를 따른 4-채널 오디오 신호를 인코딩하기 위한 인코더를 도시한 블록도이다. 인코더는 입력으로서 4-채널 오디오 신호를 수신하는데, 여기서 인코딩될 4개의 입력 채널들은 4 채널 오디오 시스템의 해당 스피커들에 대응하여 좌전방(LF), 우전방(RF), 좌후방(LR) 및 우후방(RR)으로 지정된다. 인코더는 파라메트릭 인코딩 모듈들(201, 202 및 203)을 포함한다. 인코딩 모듈(202)은 대응하는 파라미터 비트 스트림(P2)과 결합되는 좌측 스피커 신호들(LF 및 LR) 둘 다로부터 단일 오디오 채널(L)을 형성한다. 유사하게, 인코딩 모듈은 대응하는 파라미터 비트 스트림(P3)과 결합되는 우측 스피커 신호들(RF 및 RR) 둘 모두로부터 단일 오디오 채널(R)을 형성한다.
다음에, 인코딩 모듈(201)은 전체-좌(total-left) 및 전체-우(total-right) 신호들(L 및 R) 각각으로부터 하나의 광대역 오디오 신호(T)를 생성한다. 게다가, 이 병합 공정은 전체-좌 및 전체-우 채널들 간의 공간 특성들을 나타내는 제 3 파라미터 비트 스트림(P1)을 생성한다.
인코더는 예를 들어, MPEG(예를 들어, MPEG I 레이어 3(MP3)), 사인곡선 코딩(SSC), 또는 또 다른 적절한 코딩 방식 또는 이들의 조합에 따라서 신호(T)의 적절한 인코딩을 수행하는 조합기 회로(206)를 더 포함한다. 조합기 회로(206)는 또한, 프레이밍(framing), 비트-레이트 할당 및 무손실 코딩(loseless coding)을 수행하여, 전달될 조합된 신호(207)를 생성한다. 대안적으로, 조합기 회로(206)는 2개 이상의 분리된 신호들, 다중화된 신호 등으로서 오디오 신호(T) 및 비트 스트림들을 공급할 수 있다.
따라서, 도 2의 인코더는 수신기로 전달될 및/또는 저장 매체 상에 저장될 하나의 광대역 오디오 신호(T) 및 3개의 파라미터 비트 스트림들(P1, P2, 및 P3)을 포함하는 출력 신호를 생성한다. 예를 들어, 도 2가 4개의 오디오 채널들을 사용할 지라도, 상이한 수의 오디오 채널들을 사용하는 유사한 방식이 사용될 수 있다는 점에 유의한다.
대안적으로, 인코더(202)는 신호들(LR 및 RR)을 인코딩하여 전체 후방 신호를 생성할 수 있는 한편, 인코더(203)는 신호들(LF 및 RF)을 인코딩하여 전체 전방 신호를 생성할 수 있다는 것을 이해할 수 있다. 다음에, 전체 전방 및 전체 후방 신호들은 부가적인 인코더에 의해 조합된다. 그 후, 이 인코더에 의해 생성된 파라미터들은 2D 파라미터 표시를 위하여 사용될 수 있는데, 즉, 이 인코더로부터의 파라미터들은 전체 파라미터들로서 사용되어 좌 및 우 채널들 둘 모두를 위한 후방 채널들로부터 전방을 디코딩한다. 도 3은 본 발명의 실시예를 따른 인코딩된 4 채널 오디오 신호를 디코딩하기 위한 디코더를 도시한 블록도이다. 디코더는 수신된 신호(307)로부터 인코딩된 신호(T) 및 파라미터 스트림들(P1, P2 및 P3)를 추출하기 위한 회로(306)를 포함하는데, 즉, 이 회로(306)는 도 2의 조합기(206)의 역 동작을 수행한다.
디코더는 인코딩 모듈들(201, 202 및 203) 각각에 대응하는 파라메트릭 디코딩 모듈들(301, 302 및 303)을 더 포함한다. 도 2와 관련하여 서술된 캐스케이드된 인코딩 공정은 디코더에서 반전된다. 디코더는 광대역 오디오 신호(T) 및 3개의 파라미터 비트 스트림들(P1, P2 및 P3)를 수신한다. 우선, 디코딩 모듈(301)은 적절한 파라미터들(P1)을 사용하여 단일의 인입하는(incoming) 오디오 신호(T)로부터 전체-좌 및 전체-우 신호들(L 및 R) 각각을 합성한다. 현재 최종-사용자가 단지 2개의 확성기들(loudspeaker)을 갖는 경우, 디코딩 공정은 여기서 종료된다.
최종-사용자가 4개의 확성기들을 갖는 경우, 부가적인 디코딩 단계가 수행된다. 디코더(302)는 전체-좌 신호(L) 및 파라미터 비트 스트림(P2)을 수신하여 이로부터 좌전방 및 좌후방 신호들(LR 및 LR) 각각을 합성한다.
유사하게, 디코더(303)는 전체-우 신호(R) 및 파라미터 비트 스트림(P3)을 수신하여 이로부터 우전방 및 우후방 신호들(RF 및 RR) 각각을 합성한다.
일 실시예에서, 파라미터 비트 스트림들(P2 및 P3)(또는 이들의 조합) 중 단지 한 스트림만이 인코더로부터 디코더로 전송될 필요가 있기 때문에, 동일한 파라미터들이 디코더(302 및 303)를 위하여 사용되고, 그에 의해 다중-채널 신호를 전송하는데 필요한 대역폭을 더욱 감소시킨다. 이 실시예에서, 디코더(301)로 공급되는 파라미터들(P1)은 좌-우 공간 사운드 영상(left-right spatial sound image)을 결정하는 한편, 디코더(302 및 303)에 입력되는 파라미터들은 전-후 공간 영상을 결정한다.
도 4는 본 발명의 실시예를 따른 5 채널 오디오 신호를 인코딩하는 인코더를 도시한 블록도이다. 인코더는 인코딩 모듈들(401, 402, 403 및 404)을 포함한다. 인코더는 입력으로서 5 채널 오디오 신호를 수신하는데, 여기서 인코딩될 5개의 입력 채널들은 5 채널 오디오 시스템의 해당 스피커들에 대응하여 좌전방(LF), 우전방(RF), 좌후방(LR), 우후방(RR), 및 중앙(C)으로 지정된다.
인코딩 모듈들(402 및 403)은 해당 입력 신호들(LF, LR, 및 RF, RR) 각각으로부터, 전체-좌 및 전체-우 신호들(L 및 R) 각각과 대응하는 비트 스트림들(P2 및 P3) 각각을 생성한다.
다음에, 인코딩 모듈(401)은 전체-좌 및 전체-우 신호들(L 및 R) 각각으로부터 오디오 신호(S) 및 대응하는 비트 스트림(P1)을 생성한다. 따라서, 인코딩 모듈들(401, 402 및 403)은 도 2의 인코딩 모듈들(201, 202 및 203)에 대응한다.
도 4의 인코더는 인코더(401)의 출력 신호(S) 및 중앙 신호(C)를 수신하는 인코딩 모듈(404)를 포함하는 부가적인 캐스케이딩 단계를 포함한다. 인코딩 모듈(404)은 오디오 신호의 중간측 특성(mid-side characteristic)을 표시하는 파라미터 비트 스트림 및 광대역 오디오 신호(T)를 생성한다.
인코더는 도 2의 회로(206)와 관련하여 설명되는 바와 같이, 출력 신호(407)를 생성하는 조합기 회로(406)를 더 포함한다. 따라서, 도 4의 인코더는 수신기로 전달될 및/또는 저장 매체 상에 저장될 하나의 광대역 오디오 신호(T) 및 4개의 파라미터 비트 스트림들(P1, P2, P3, 및 P4)을 포함하는 출력 신호(407)를 생성한다.
도 5는 본 발명의 실시예에 따른 인코딩된 5-채널 오디오 신호를 디코딩하기 위한 디코더를 도시한 블록도이다. 디코더는 수신된 신호(507)로부터 인코딩된 신호(T) 및 파라미터 스트림들(P1, P2, P3 및 P4)을 추출하는 회로(506)를 포함하는데, 즉 이 회로(506)는 도 4의 조합기(406)의 역 동작을 수행한다.
디코더는 인코딩 모듈들(401, 402, 403 및 404) 각각에 대응하는 파라메트릭 디코딩 모듈들(501, 502, 503, 및 504)을 더 포함하는데, 도 4와 관련하여 서술된 캐스케이드된 인코딩 공정은 디코더에서 반전된다. 디코더는 광대역 오디오 신호(T) 및 3개의 파라미터 비트 스트림들(P1, P2, P3 및 P4)을 수신한다. 우선, 디코딩 모듈(504)은 파라미터들(P4)을 사용하여 전체 측 신호(S) 및 측 신호(C)를 합성한다.
다음에, 디코더들(501, 502 및 503)은 도 3의 디코더와 관련하여 서술된 바와 같이, 전체 측 신호(S) 및 파라미터 비트 스트림들(P1, P2, 및 P3)로부터의 좌전방, 좌후방, 우전방 및 우후방 신호들(LF, LR, RF 및 RR) 각각을 합성한다.
대안적으로, 5-채널 오디오 전송은 3개의 파라미터 비트 스트림들과 조합된 2개의 오디오 채널들을 전송함으로써, 예를 들어, 도 2 및 도 3과 관련하여 서술된 바와 같은 인코딩된 4-채널 신호 및 하나의 부가적인 모노 채널(mono channel)을 전송함으로써 성취될 수 있다는 것을 알 수 있다.
도 6은 파라메트릭 인코딩 모듈의 제 1 예를 개략적으로 도시한 것이다. 이 장치는 2개의 신호 성분들(L 및 R)을 갖는 오디오 신호를 수신한다. 예를 들어, 이들 신호 성분들은 다중-채널 신호의 인입하는 신호 성분들 중 2개의 신호 성분들, 가령 4개의 채널 신호의 LF 및 LR 신호 성분들 또는 RF 및 RF 신호 성분들 또는 인코더들(402 및 403) 각각에 의해 생성된 인코딩된 전체-좌 및 전체-우 신호들일 수 있다. 파라메트릭 인코딩 모듈은 L-R 공간에서 인입하는 신호를 각도(α) 만큼 회전시켜 변환에 따라서 회전된 신호 성분들(y 및 r)을 생성하기 위한 회로(601)를 포함한다.
y=L cosα+R sinα=wLL+wRR
r=-L sinα+ R cosα=-wRL+wLR
여기서 wL=cosα 및 wR=sinα를 가중 인자들이라 칭할 것이다.
각도(α)는 높은 신호 분산(variance) 방향에 대응하도록 결정되는 것이 바람직하다. 최대 신호 분산의 방향, 즉 주성분은 회전된 y 성분이 대부분의 신호 에너지를 포함하는 주성분 신호에 대응하도록 하고 r이 잔여 신호가 되도록 주성분 분석에 의해 추정될 수 있다. 이에 따라서, 도 6의 인코딩 모듈은 예를 들어 인입하는 신호 샘플들의 주성분 분석(PCA)을 수행함으로써 각도(α) 또는 대안적으로 가중 인자들(wL 및 wR)을 결정하는 회로(602)를 더 포함한다.
일 실시예에서, 도 6의 인코딩 모듈은 주성분 신호(y) 및 회전 파라미터(α) 또는 wL 및 wR 중 하나를 출력한다. 또 다른 실시예에서, 파라메트릭 인코더는 적응형 선형 필터의 필터 파라미터들을 결정하여, 주성분 신호(y)가 입력으로서 필터로 공급될 때 적응형 필터가 잔여 신호(r)의 추정값을 생성하도록 한다. 이 실시예를 따르면, 인입하는 신호는 주성분 신호(y), 회전 파라미터 및 필터 파라미터들의 세트로서 인코딩되고, 그에 의해 수신기에서의 디코더가 수신된 주성분 신호(y)로부터 잔여 신호를 예측하도록 하고 신호를 L 및 R 방향으로 다시 회전시키도록 한다(예를 들어, 2002년 4월 10일 출원된 유럽 특허 출원 제02076410.6호 참조).
도 7은 인코딩 모듈의 제 2 예를 개략적으로 도시한 것이다. 도 7의 인코딩 모듈은 2002년 4월 22일에 출원된 유럽 특허 출원 제02076588.9호에 서술된 바와 같이, 시간 및 주파수 함수에 따라서 음성간 레벨 차(interaural level difference), 음성간 시간(또는 위상) 차, 및 최대 상관을 특정함으로써 다중-채널 오디오 신호의 공간 속성들을 설명한다. 인코딩 모듈은 입력들로서 스테레오 신호의 L 및 R 성분들을 수신한다. 초기에, 시간/주파수 슬라이싱 회로들(time/frequency slicing circuits; 702 및 703)에 의해, R 및 L 성분들 각각은 예를 들어, 변환 동작보다 앞서 시간-윈도우잉(time-windowing)을 함으로써 여러 시간/주파수 슬롯들로 분할된다.
다음에, 분석 회로(704)에서, 매 시간/주파수 슬롯에 대해, 인입하는 신호들의 다음 속성들이 분석된다.
2개의 입력들로부터 기인하는 대응하는 대역 제한된 신호들의 상대 레벨들로 규정되는, 음성간 레벨 차, 즉 ILD.
음성간 교차 상관 함수에서 피크에 대응하는 음성간 지연(또는 위상 시프트)으로 규정되는, 음성간 시간(또는 위상) 차(ITD 또는 IPD).
ITDs 또는 ILDs로 설명될 수 없으며, 교차 상관 함수의 최대 값(즉, 최대 피크의 위치에서 교차 상관 함수의 값)에 의해 파라미터화될 수 있는, 파형들의 (비)유사성.
상술된 3개의 파라미터들은 시간에 걸쳐서 가변된다. 그러나, 스테레오 청각 시스템이 이를 처리하는데 매우 느리다는 것이 알려져 있기 때문에, 이들 속성들의 갱신 속도는 다소 낮다(통상적으로, 수십 밀리세컨드).
분석 회로(704)는 또한, 좌 및 우 신호들의 조합을 포함하는 합(또는 우세(dominant)) 신호(S)를 생성한다. 따라서, L 및 R 신호들은 주파수 및 시간의 함수에 따라서 합 신호(S) 및 파라미터들(P)의 세트로 인코딩되는데, 이 파라미터들(P)은 ILD, ITD/IPD 및 교차 상관 함수의 최대값을 포함한다.
도 8은 본 발명의 실시예를 따른 5-채널 오디오 신호를 인코딩하기 위한 인코더를 도시한 블록도이다. 인코더는 인코딩 모듈들(801, 802, 및 803)을 포함한다. 인코더는 입력으로서 5-채널 오디오 신호를 수신하는데, 여기서 인코딩될 5개의 입력 채널들은 5-채널 오디오 시스템의 해당 스피커들에 대응하여 좌전방(LF), 우전방(RF), 좌후방(LR), 우후방(RR) 및 측(C)으로 지정된다.
인코딩 모듈들(802 및 803)은 대응하는 입력 신호들(LF, LR 및 RF, RR) 각각으로부터 전체-좌 및 전체-우 신호들(L 및 R) 각각과 대응하는 비트 스트림들(P2 및 P3) 각각을 생성한다.
다음에, 인코딩 모듈(801)은 인코딩 모듈들(802 및 803) 각각으로부터 수신되는 전체-좌 및 전체-우 신호들로부터 오디오 신호(T) 및 대응하는 비트 스트림(P1)을 생성한다. 따라서, 인코딩 모듈들(801, 802 및 803)은 도 2의 인코딩 모듈들(201, 202 및 203)에 대응한다.
그러나, 이전 실시예와 대조적으로, 측 신호(C)는 인코더들(802 및 803) 각각에 의해 생성되는 전체-좌 및 전체-우 신호들(L 및 R) 둘 모두와 조합된다. 도 8의 인코더는 측 신호를 전체-좌 및 전체-우 신호들(L 및 R)에 가산하기 위한 합산 회로들(804)을 포함하여, 인코딩 모듈(801)로 공급되는 조합된 신호들(L' 및 R')을 각각 생성한다. 인코더는 도 2의 회로(206)와 관련하여 서술된 바와 같이, 최종 출력 신호(807)를 생성하기 위한 조합기 회로(806)를 포함한다.
이 실시예의 이점은 5 채널 오디오를 코딩하는데 보다 비효율적인 방법을 제공한다는 것이다.
도 9는 본 발명의 실시예를 따라서 인코딩된 5 채널 오디오 신호를 디코딩하기 위한 디코더를 도시한 블록도이다. 도 9의 디코더는 도 8의 인코더에 의해 인코딩되는 신호를 디코딩하는데 적합하다. 디코더는 수신된 신호(907)로부터 인코딩된 신호(T) 및 파라미터 스트림들(P1, P2 및 P3)를 추출하기 위한 회로(906)를 포함하는데, 즉 회로(906)는 도 8의 조합기(806)의 역 동작을 수행한다.
디코더는 디코딩 모듈들(901, 902 및 903)을 더 포함한다. 인코딩 모듈(901)은 인코딩된 오디오 신호(T) 및 대응하는 파라미터들(P1)의 세트를 수신한다. 초기에, 디코딩 모듈(901)은 전송된 파라미터들(P1)을 분석한다. 파라미터들(P1)이 신호가 모노 신호라는 것을 나타내는 경우, 디코더는 측 신호로서 수신된 신호를 출력한다. 따라서, 이 경우에, 신호는 측 스피커로 공급되고, 디코더(901)의 좌 및 우 채널 출력들(L 및 R)로 공급되는 신호는 존재하지 않는다.
전송된 파라미터들(P1)이 신호가 스테레오임을 나타내는 경우, 신호를 좌 및 우 출력들로 분배시킴으로써 이 신호는 디코딩된다.
모노 또는 스테레오 콘텐트(content)를 검출하는데 사용되는 방법은 정확한 코더 구조 및 파라미터 비트 스트림에 좌우된다. 예를 들어, 도 7과 관련하여 서술된 공간 스테레오의 파라메트릭 인코딩을 사용하는 하나의 실시예에서, ITD, ILD 및 상관 파라미터들은 주파수 함수에 따라서 공간 신호 특성들을 결정한다. 따라서, 각각의 주파수 대역에 대해, ITD 및 ILD가 제로에 근접, 예를 들어 미리 정해진 상수 보다 작은 경우 및 상관이 +1에 근접한 경우, 즉 1 빼기 상관의 차가 미리 정해진 상수, 예를 들어 0.1 보다 작은 경우, 대응하는 대역 제한된 신호는 중앙 스피커로 공급된다. 예를 들어, ITD에 대한 미리 정해진 상수는 50-100 마이크로초 정도가 되도록 선택될 수 있고, ILD에 대해서, 미리 정해진 상수는 예를 들어 1 내지 3dB로 선택될 수 있다. 다른 모든 파라미터들의 값들에 대해서, 신호는 좌 및 우 출력들에 걸쳐서 분배된다. 인코딩 모듈(901)의 바람직한 실시예가 도 10과 관련하여 서술될 것이다. 디코딩 모듈(902 및 903)은 상술된 바와 같이 전체-우 및 전체-좌 신호를 디코딩하여, 좌전방, 좌후방, 우전방 및 우후방 신호 성분(LF, LR, RF 및 RR)을 각각 생성한다.
도 10은 본 발명의 실시예를 따른 도 9의 디코더(901)를 도시한 블록도이다. 인코딩 모듈(901)은 인코딩된 오디오 신호(T) 및 대응하는 파라미터들(P1)의 세트를 수신한다. 디코딩 모듈(901)의 일반적인 개념은, 공간 파라미터들이 출력 신호들이 모노라고 나타내는 경우에만(이는 ILD=0, ITD=0, 상관=+1을 의미한다), (특정 주파수 대역의) 입력 신호를 중앙 스피커에 공급하도록 한다. 다른 공간 파라미터들의 값들에 대해서, 신호는 파라메트릭 디코더를 사용하여 좌 및 우 출력들에 전송되어야 한다.
그러나, 공간 파라미터들에 따라서 중앙 출력과 좌 및 우 출력들로의 분배간의 완만한 전이(smooth transition)를 성취하는 것이 보다 바람직하다. 결국, 디코딩 모듈은 파라미터들(P1)을 수신하고 가중 함수들(wc 및 wlr)을 계산하는 회로 (1002)를 포함한다. 여기서, wc는 중앙 출력에 전송되어야 하는 상대적인 모노 입력 신호 량을 나타내는 반면, wlr은 공간 파라미터들에 따라서 디코딩되어 좌 및 우 출력 쌍에 전송되어야 하는 상대적인 입력 신호 량을 나타낸다. 하나의 실시예에서, 가중들 간의 관계는 다음과 같은 제약으로 설정된다.
wc
n + wlr
n =1
여기서, n은 시스템이 전체 진폭(n=1)을 유지해야 하는지, 총 전력량(n=2) 또는 임의의 다른 전체 신호 레벨 측정값을 유지해야 하는지를 나타내는 거듭제곱을 나타낸다. 따라서, wc가 알려지면, wlr은 상기 식에 따라 구해질 수 있으며, 이와 반대로도 될 수 있다.
디코딩 모듈은 파라메트릭 디코더(1004)로의 중앙 출력(C) 및 입력(TLR) 간의 가중 인자들(wc 및 wlr)에 따라서 입력 신호의 각 서브대역을 분할하는 회로(1003)를 더 포함한다. 파라메트릭 디코더는 상술된 바와 같이 스케일링된 신호(TLR)을 디코딩하여, 전체-좌 및 전체-우 신호들(L 및 R)을 각각 생성한다.
회로(1002)는, 어떤 서브대역의 ILD 및 ITD가 0과 동일한 경우 및 상관이 +1과 동일한 경우, wc=1이 되도록 가중 인자(wc)를 결정한다. 다른 파라미터들의 값들에 대해서, wc는 제로를 향하여 감소되어야 한다. 하나의 실시예에서, 이 작용은 다음 방식으로 획득된다. wc는 3개의 함수들(P1, P2 및 P3)의 곱으로 이루어진다. P1은 단지 서브대역의 ILD 값에만 좌우되며, P2는 단지 현재 서브대역의 ITD 값에만 좌우되고, P3는 단지 서브대역의 교차 상관에만 좌우된다. 따라서:
wc=P1(ILD)ㆍP2(ITD)ㆍP3(ρ)
도 11a-c는 도 10의 실시예에서 가중 인자들을 결정하는데 사용되는 3개의 함수들의 기능적인 형태들의 예들을 개략적으로 도시한 것이다.
이 함수들(P1, P2 및 P3)의 기능적인 형태는 다음 제약들에 부합되어야 한다: P1 및 P2는 제로(0)의 ILD(각 ITD)에 대해선 +1의 최대값을 갖고 보다 작거나 큰 값들에 대해선 제로를 향하여 감소된다. P3는 상관 +1에서 +1의 최대값을 갖고 보다 작은 값에 대해선 제로를 향해 감소된다. 도 11a-c는 조건들을 충족하는 함수들(P1, P2 및 P3) 각각의 예들을 도시한다.
중앙 출력(C), 좌 출력(L) 및 우 출력(R)간에 디코딩된 신호(T)를 분배시키는 대안적인 방법들이 사용될 수 있다는 점에 유의하라. 예를 들어, 초기에, 신호(T)는 상술된 바와 같이, 파라미터들(P1)을 사용하여 L 및 R 신호로 디코딩될 수 있다. 다음에, 3개의(좌, 중앙, 우) 출력들에 걸쳐서 2개의 입력 신호들을 재분배시키는 알고리즘이 사용될 수 있다. 따라서, 우선 디코더의 좌 및 우 출력 신호들은 신호들을 3개의(좌, 우 및 중앙) 출력들로 재분배(매트릭싱(matrixing))하는 것 보다 앞서 임의의 알려진 파라메트릭 스테레오 디코더를 사용하여 계산된다. 이와 같은 방법들은 국제 특허 출원 WO 02/07481에 서술된 바와 같은 2-내지-5 채널 프로세서들의 기술에 알려져 있다.
상기 장치들은 범용 또는 특수목적 프로그램가능한 마이크로프로세서들, 디지털 신호 프로세서들(DSP), 애플리케이션 특정 집적 회로(ASIC), 프로그램가능한 논리 어레이들(PLA), 필드 프로그램가능한 게이트 어레이들(FPGA), 특수목적 전자 회로들, 등 또는 이들의 조합으로 구현될 수 있다는 점에 유의하라.
상술된 실시예들은 본 발명을 제한하는 것이 아니라 당업자가 첨부된 청구범위의 범위를 벗어남이 없이 많은 대안적인 실시예들을 설계할 수 있도록 하기 위한 것이라는 점에 유의하여야 한다.
청구항들에서, 괄호안에 기재된 참조 부호들은 청구범위를 제한하는 것으로서 해석되지 않아야 한다. 용어 "포함하다"는 청구범위에 기재된 요소들 또는 단계들 이외의 요소들 또는 단계들의 존재를 배제하지 않는다. 요소 앞에 붙은 단수 표현은 이와 같은 요소가 다수개 존재한다는 것을 배제하지 않는다.
본 발명은 여러 특정 소자들을 포함한 하드웨어 및 적절하게 프로그램된 컴퓨터에 의해 구현될 수 있다. 여러 수단을 열거한 장치 항에서, 이들 여러 수단은 동일한 하드웨어 아이템으로 구현될 수 있다. 서로 다른 종속항들에서 어떤 측정값들을 인용하였지만, 이들 측정값들의 조합 또한 유용하게 사용될 수 있다.