KR20040063155A

KR20040063155A - 인지성 잡음의 대치

Info

Publication number: KR20040063155A
Application number: KR10-2004-7007816A
Authority: KR
Inventors: 반데케르코프레온엠; 오멘아르놀더스더블유.제이.
Original assignee: 코닌클리케 필립스 일렉트로닉스 엔.브이.
Priority date: 2001-11-23
Filing date: 2002-11-04
Publication date: 2004-07-12
Also published as: CN1288623C; EP1451810A1; KR20040066839A; RU2004118840A; CN1589467A; WO2003044775A1; EP1451809A1; TW200407843A; BR0206615A; CN1288624C; US20050004791A1; BR0206611A; JP2005509926A; CN1589466A; JP2005509927A; US20050021328A1; WO2003044776A1; AU2002343151A1; AU2002347474A1

Abstract

서로 상관된 잡음 성분들이 존재하는 한 세트의 오디오 신호들을 부호화하기 위해 다중 채널 오디오 부호화 시스템에서 합성 잡음 소스들을 사용하는 방법. 방법은, 오디오 신호들 간 관계로부터, 잡음 소스들의 구성을 결정하는 단계를 포함하고, 이 구성은 구성 내 잡음 소스들이 서로간에 상관이 없게 하여, 잡음 소스들의 구성이 잡음성분들을 상관이 보존되게 하여 합성되게 하는 구성이다. 방법은 각각의 잡음 소스에 대해서 상기 소스를 합성하기 위한 한 세트의 잡음 파라미터들 및 상기 소스들의 상기 구성을 발생하기 위한 한 세트의 변환 파라미터들을 결정함으로써, 상기 잡음 소스들을 부호화하는 단계를 더 포함할 수 있다.

Description

인지성 잡음의 대치{Perceptual noise substitution}

잡음 소스들의 지각면에서 관계된 양들, 이를테면 특정의 주파수 범위 내 잡음의 총 청각 에너지만을 부호화함으로써, 지각상 무관계한 오디오 정보를 버려 상당한 신호 압축이 얻어질 수 있다. 국제출원 W099/04505에 이러한 방법이 기재되어 있다. 이 방법에서, 입력신호의 잡음 유사 성분들은 주파수 대역을 기초로 하여 검출된다. 잡음 유사 성분들은 파라미터화 되고, 대치된 스펙트럼 계수들의 총 파워만이 송신된다. 복호기에서는, 대치된 스펙트럼 계수들에 대해 소망의 파워를 가진 랜덤 잡음 소스들을 삽입시킴으로써, 부호화된 오디오 채널들이 재구성된다.

이러한 단순한 대치는, 복수의 오디오 채널들이 실제로 상호상관(inter-correlation)을 나타내는 경우엔 부자연한 청취감을 야기한다. 이러한 부자연한 지각은 사람의 귀가 서로 다른 방향들로부터 오는 오디오 신호들 간 상관을 식별할 수 있다는 사실에 기인한다. 신호들 간 상관은 사운드 소스들의 공간적 지각인 "스테레오 이미지"를 결정한다. 2-채널 스피커 셋업에서 좌측신호와 우측신호가 완전히 상관되어 있다면, 사람의 청각 시스템은 이를 스피커들 사이에 위치한 단일의 사운드 소스로서 인지할 것이다. 신호들이 서로 상관이 없다면, 좌측 스피커와 우측 스피커에 위치한 두 개의 사운드 소스들이 따로따로 별개로 인지될 것이다. 부분적으로 상관된 신호들은 일반적으로 스피커들 사이에 광범한 사운드 소스로서 인지될 것이다. 부적 상관(negative correlation)은 사운드 소스 위치들이 스피커베이스 밖에 있는 것으로 인지되게 한다. 그러므로, 좌측 스피커와 우측 스피커에서 사운드의 상관이 상실되면, 의도된 스테레오 효과는 사라지고 청취자는 덜 자연스런 청취감을 인지한다.

즉, 복수의 오디오 채널들로부터 나온 사운드가 상기 채널들을 통해 전에 기록한 단일의 오디오 소스를 반영한다면, 상관되지 않은 잡음 소스들을 사용한 상기 오디오 소스의 재구성은 부자연스러운 것으로 나타나게 될 것이다.

전술의 응용에서는 비트 값을 부호화함으로써 전술한 효과를 보상하려고 하고 있는데, 이 비트 값은 활성상태에서, 동일한 잡음 소스를 양 좌우 채널에 사용하도록 합성기(synthesizer)를 트리거시킨다. 노멀 비활성 상태에서, 좌우 채널들은 독립적인 잡음 소스들로부터 합성된다.

이러한 방식은 본시 상관이 없는 잡음 소스들을 사용한 오디오 채널들의 합성에 비해 개선을 제공하나, 합성된 사운드들은, 실제로는 부호화된 오디오 채널들 내 채널들 간 상관도를 기술한 정보가 사용되지 않기 때문에 여전히 자연스러움이 없다. 그러므로, 원 사운드의 재구성은 공지의 방법을 사용할 때 부분적으로만 가능하고 여전히 사람의 귀는 덜 자연스러운 청취감을 인지한다.

본 발명은 서로 상관된 잡음 성분들이 존재하는 한 세트의 오디오 신호들을 부호화하기 위해 다중 채널 오디오 부호화 시스템에서 합성 잡음 소스들을 사용하는 방법에 관한 것이다.

도 1은 본 발명에 따른 부호화 방법을 구현하는 부호화 장치의 개략도이다.

도 2는 본 발명에 따른 부호화 방법을 구현하는 복호 장치의 개략도이다.

본 발명은 전술한 문제를 제거하고, 채널들간 상관도를 보존시킴으로써 복수 오디오 채널들 내 잡음 성분들을 지각면에서 거의 원래에 가깝게 재구성할 수 있는, 향상된 오디오 부호화를 제공하는 것을 목적으로 한다.

따라서, 본 발명의 방법은 상기 오디오 신호들 간 관계로부터, 잡음 소스들의 구성(composition)을 결정하는 단계를 포함하는 것으로, 상기 구성은 상기 구성 내 잡음 소스들이 서로간에 상관이 없게 하여, 잡음 소스들의 상기 구성이 상기 잡음 성분들을 관계 보존 방식으로 합성되게 한다.

본 발명의 방법에 따라서, 오디오 신호에 있는 잡음성분은 상기 오디오 신호들의 적어도 한 주파수 대역에 있는 지각상 관계된, 상관을 보존한 잡음성분들을 합성하는 잡음 소스들로부터 구성된다. 이들 합성되는 잡음 소스들은 서로간에 상관이 없다. 그러므로, 이들 잡음 소스들은 독립적인 잡음 발생기들에 의해 쉽게 재구성될 수 있다.

비록 본 발명이 부호화하지 않은 잡음 소스들을 송신하는데 적용될 수 있을지라도, 바람직한 실시예에서, 본 발명의 방법은 각각의 잡음 소스에 대해서 상기 소스를 합성하기 위한 한 세트의 잡음 파라미터들 및 상기 잡음 소스들의 구성을 발생하기 위한 한 세트의 변환 파라미터들을 결정함으로써, 상기 잡음 소스들을 부호화하는 단계를 더 포함한다.

또한, 본 발명의 바람직한 실시예는 각각의 잡음 소스를 합성하기 위한 상기 복수 세트들의 잡음 파라미터들을 송신하는 단계 및 상기 복수의 잡음 소스들을 형성하기 위한 상기 한 세트의 변환 파라미터들을 송신하는 단계를 포함한다. 구체적으로, 상기 잡음 파라미터들 및 상기 변환 파라미터들은 상기 한 세트의 오디오 채널들의 상관 행렬을 직교화(orthogonalization)함으로써 결정된다. 이 직교화는 오디오 채널들 간 시변 상호상관에 대해 프레임별로 수행될 수 있다. 프레임의 크기는 상호 채널 상관들이 일정한 것이라 간주될 수 있는 시간 프레임에 따를 수 있다.

본 발명은 한 세트의 오디오 신호들이 선택된 한 세트의 주파수 대역들로 분할되고 주파수 대역들 중 적어도 한 대역이 잡음 유사 신호들을 포함하는 경우에 바람직하게 적용될 수 있다. 상기 오디오 신호들 내 있는 비-잡음 성분들은 정현파 부호화에 의해 부호화될 수 있다.

본 발명은 한 세트의 오디오 채널들을 부호화하는 다중 채널 오디오 부호화 시스템에서 합성 잡음 소스들을 사용하는 방법에 관한 것으로, 이 방법은 잡음 소스들을 합성하기 위한 복수 세트들의 잡음 파라미터들을 수신하고 및 본 발명의 방법에 따라 결정된 한 세트의 변환 파라미터들을 수신하는 단계; 상기 잡음 파라미터들에 응답하여, 한 세트의 합성된 잡음 소스를 발생하는 단계; 및 상기 변환 파라미터들에 따라 복수의 잡음 소스들로서 각각의 오디오 신호를 형성함으로써 한 세트의 오디오 신호들을 발생하는 단계를 포함한다.

이에 따라, 부호화되어 송신된 잡음이 있는 오디오 신호들이 복호될 수 있고 대응하는 다중 채널, 상관이 보존된 오디오 신호가 합성될 수 있다.

또한, 본 발명은 한 세트의 각각의 오디오 신호들간에 자기상관 및 교차상관을 상기 오디오 신호들의 적어도 한 주파수 대역에서 검출하는 수단; 및 상기 오디오 신호들 간 관계로부터, 잡음 소스들의 구성을 결정하는 처리수단을 포함하며, 상기 구성은 상기 구성 내 잡음 소스들이 서로간에 상관이 없게 하여, 잡음 소스들의 상기 구성이 상기 잡음 성분들을 관계 보존 방식으로 합성되게 하는 것인, 오디오 부호화기에 관한 것이다.

부호화기는 상기 잡음 소스들을, 상기 소스들 각각을 합성하기 위한 복수 세트들의 잡음 파라미터들로서 부호화하는 수단, 상기 복수 세트의 잡음 파라미터들을 송신하고 상기 복수의 잡음 소스들을 형성하기 위한 상기 한 세트의 변환 파라미터들을 송신하는 송신수단을 더 포함할 수 있다.

마찬가지로, 본 발명은 잡음 소스들을 합성하기 위한 복수 세트들의 잡음 파라미터들을 수신하고 복수의 상기 잡음 소스들을 형성하기 위한 한 세트의 변환 파라미터들을 수신하는 수신수단; 상기 잡음 파라미터들에 응답하여, 잡음 소스들을 생성하는 한 세트의 잡음 발생기들; 및 상기 한 세트의 변환 파라미터들에 응답하여, 각각의 오디오 신호에 대해 복수의 상기 한 세트의 잡음 소스들을 형성함으로써 지각상 관계된, 상관이 보존된 잡음 성분들로 오디오 신호들을 합성하는 합성수단을 포함하는 오디오 복호기에 관한 것이다.

부호화기 및 복호기는 물리적으로 구별되는 신호 처리 장치일 수도 있고 혹은 단일의 신호 처리 장치 내 하나 혹은 몇 개의 유닛들로서 구비될 수도 있다. 송신은 무선송신, 혹은 인터넷을 통한 송신일 수 있고 사실 임의의 종류의 송신일 수 있다. 송신은 자기 디스크 혹은 CD-rom 등과 같은 물리적 데이터 캐리어를 통해 행해질 수도 있다.

본 발명은 또한 잡음 소스들을 합성하기 위한 한 세트의 잡음 파라미터들을 포함하고 전술한 방법에 따라 복수의 잡음 소스들을 형성하기 위한 한 세트의 변환 파라미터들을 포함하는 데이터 캐리어에 관한 것이다.

본 발명의 목적들 및 특징들은 도면들로부터 명백하게 될 것이다.

도 1은 4채널 오디오 신호를 부호화하는 부호화기(1)를 도시한 것이다. 오디오 채널들을 4개의 복합된 화살표들(2)로 나타내었으며, 각각의 화살표(2)는 4개의 채널들 중 한 오디오 채널을 나타낸다. 본 발명에서, 하나 이상의 채널이 있는 한 어떠한 오디오 시스템이든 이에 본 발명의 방법이 적용될 수 있는 것은 자명하므로, 채널들의 실제 수는 무관하다. 오디오 채널(2)은 적어도 한 주파수 대역에 잡음 성분들을 포함하는 오디오 신호를 포함한다. 실제의 실시예들에서, 본 발명에 따른 방법이 전(full) 대역폭의 오디오 신호들에 직접 수행될 수도 있을지라도, 가청 주파수 성분들을 갖는 오디오 신호는 통상 몇 개의(통상 대수 스케일 상의) 주파수 대역들로 분할된다. 이들 주파수 대역들(특히 상관된 신호들에 사람의 귀가 감응하는 관계된 주파수 대역들) 각각, 혹은 특정 수의 주파수 대역들에, 본 발명의 방법이 적용될 수 있다.

다중 채널 신호(2)는 필터단(filter stage)(3)에서 필터링된다. 필터(3)는 오디오 신호들을 잡음부분들(4)과 비-잡음부분들(5)로 분할한다. 신호(2)의 비-잡음부분들(5)은 정현 부호화 회로(6)로 보내진다. 이 정현 부호화 회로(6)는 상기 오디오 신호들(2)의 비-잡음 오디오 정보를 나타내는 압축 부호화된 데이터(7)를 생성한다.

잡음부분들(4)은 본 발명에 따라 상관이 보존되게 잡음을 부호화하는 회로(8)로 보내진다. 이 회로(8)에서는, 상기 오디오 신호들 간 관계를 결정하고, 잡음 소스들의 구성(composition)을 확인하는데, 이 구성은 이 구성 내 잡음 소스들이 상호간에 상관이 없게 한 구성으로, 이에 따라 잡음 소스들의 상기 구성은 상관이 보존되게 하여 상기 잡음 성분들을 합성한다.

상기 오디오 신호들 간 관계는 오디오 채널들(2)의 자기상관 계수들 및 교차상관 계수들을 측정함으로써 판정된다. 이 상관정보는 자기상관 계수들 및 상호상관(inter-correlation) 계수들을 표현하는 상관 행렬로 나타낼 수 있다. 이 행렬에서, 계수 <S(i)S(i)>는 채널 S(i)의 자기상관을 나타내고, 계수 <S(i)S(j)>는 채널 S(i)와 채널 S(j) 간 상호상관을 나타내며, i 및 j는 상기 다중 채널 시스템의 특정의 한 채널을 표기하는 어떤 정수(integral number)들이다.

이 상관 행렬로부터 한 세트의 변환 파라미터들(9)이 계산된다. 변환 파라미터들(9)은 송신기(10)에 공급된다. 변환 파라미터들(9)은 잡음 소스들을 합성하기 위한 관계된 파라미터들에 관한 것이다. 이들 변환 파라미터들은 각각의 상관이 없는 잡음신호의 에너지에 대응하는, 소스들의 자기상관, 및 상기 잡음 소스들간 특정의 관계를 기술하는 상호상관을 포함할 수 있다. 이들 파라미터들(9)은 한 세트의 생성된 잡음 소스들에 역변환을 수행하는 복호기에 의해 수신될 것이며, 이에 대해선 도 2를 참조하여 설명한다.

다음에, 변환 파라미터들(9)은 부호화된 정현파(sinusoidal) 비-잡음 신호들(7)과 조합되고, 부호화된 신호(11)로서 송신기(10)에 의해 송신된다. 송신은 무선송신, 혹은 인터넷을 통한 송신일 수 있고 사실 임의의 종류의 송신일 수 있다. 송신은 자기 디스크 혹은 CD-rom 등과 같은 물리적 데이터 캐리어를 통해 행해질 수도 있다.

도 2에는, 근본적으로, 신호(11)를 한 세트의 오디오 신호들(21)로 복호하는 복호기(12)에서 도 1의 방식의 역이 도시되었다. 신호(11)는 본 발명의 방법에 따라 복수의 잡음 소스들을 형성하는 한 세트의 변환 파라미터들을 포함한다.

제1 분할단(splitting stage)(13)에서, 변환 파라미터들(9) 및 부호화된 비-잡음 신호들(7)이 신호(11)로부터 추출된다. 비-잡음 신호들(7)은 정현파 복호기(14)에 공급되어 오디오 채널들(21)의 비-잡음 부분들(51)을 출력한다.

변환 파라미터들(9)은 한 세트의 독립된(랜덤한) 잡음 발생기(16)를 포함하는 잡음 소스 발생단(15)에 공급된다. 변환 파라미터들(9)은 각각의 잡음 발생기(16)의 잡음 레벨(있을 수 있는 제로 레벨을 포함함)을 지시하며, 부가적으로, 잡음 소스들에 대해 예를 들면 포락선 형태와 같은 다른 파라미터들이 명시될 수도 있다. 잡음 발생기(16)는 한 세트의 상호간에 상관이 없는 잡음 소스들을 생성하는데 이들 잡음 소스들은 한 세트의 변환 파라미터들(9)에 응답하여 각각의 오디오 신호(1)에 대해 복수의 잡음 소스들로 형성됨으로써, 오디오 신호들(21)에 대해서 지각상 관계된, 상관이 보존된 잡음 성분들(41)이 합성된다. 구성단(composition stage)(17)에서는 상관이 보존된 잡음성분들(41)과 비-잡음 부분들(51)을 조합하여 오디오 채널들(21)을 출력하며, 이들 채널들은 도 1의 오디오 채널들(2)의 지각상 관계된 재구성이다.

본 발명은 도면을 참조로 하여 기술한 실시예들로 제한되는 것이 아니라 모든 종류의 변형예들을 포함할 수 있음이 이 기술에 숙련된 자들에게 명백할 것이다. 예를 들면, 기술한 실시예들에서, 신호의 비-잡음 부분들은 정현파 부호화를 사용하여 부호화되었지만, 파형 부호화 혹은 허프만 부호화와 같은 다른 유형들의 부호화가 적용될 수도 있다. 또한, 비-잡음 부분들을 포함하여 전체로서 오디오 채널들이 전술한 변환 파라미터들에 따라 변환될 수도 있다. 또한, 다른 유형들의 잡음 부호화가, 상이한 파라미터들 등을 사용하여 적용될 수도 있다. 방법은 다중 채널 오디오 시스템의 오디오 채널에 대해 단일의 관계된 주파수 대역에 적용될 수도 있다. 방법은 다중 채널 오디오 시스템의 선택된 수의 채널들에 적용될 수도 있다. 이들 및 다른 변형예들은 첨부된 청구항들의 보호범위 내에 드는 것으로 간주된다.

참조부호:

1. 부호화기

2. 화살표

3. 필터단

4. 잡음 부분

5. 비-잡음 부분

6. 정현파 부호화 회로

7. 부호화된 데이터

8. 잡음 부호화 회로

9. 변환 파라미터

10. 송신기

11. 부호화된 신호

12. 복호기

13. 분할단

14. 정현파 복호기

15. 잡음 소스 발생단

16. 잡음 발생기

17. 구성단

Claims

상관된 잡음성분들이 존재하는 오디오 신호 세트를 부호화하는 다중 채널 오디오 부호화 시스템에서 합성 잡음 소스들을 사용하는 방법에 있어서,

상기 오디오 신호들간의 관계로부터, 잡음 소스들의 구성(composition)을 결정하는 단계로서, 상기 구성은 상기 구성 내 잡음 소스들이 서로간에 상관되지 않고, 잡음 소스들의 상기 구성이 상기 잡음 성분들을 관계 보존 방식으로 합성하는, 상기 결정 단계를 포함하는, 다중 채널 오디오 부호화 시스템의 합성 잡음 소스 사용방법.
제1항에 있어서, 각각의 잡음 소스에 대해서 상기 소스를 합성하기 위한 잡음 파라미터 세트 및 잡음 소스들의 상기 구성을 발생시키기 위한 변환 파라미터 세트를 결정함으로써, 상기 잡음 소스들을 부호화하는 단계를 더 포함하는, 다중 채널 오디오 부호화 시스템의 합성 잡음 소스 사용방법.
제1항 또는 제2항에 있어서, 각각의 잡음 소스를 합성하기 위한 상기 잡음 파라미터 세트들을 송신하고, 상기 복수의 잡음 소스들을 형성하기 위한 상기 변환 파라미터들 세트를 송신하는 단계를 더 포함하는, 다중 채널 오디오 부호화 시스템의 합성 잡음 소스 사용방법.
제1항 내지 제3항 중 어느 한 항에 있어서, 서로간에 상관되지 않은 잡음 소스들은 프레임 단위로 결정되는, 다중 채널 오디오 부호화 시스템의 합성 잡음 소스 사용방법.
제1항 내지 제4항 중 어느 한 항에 있어서, 상기 오디오 신호들내에 존재하는 비-잡음 성분들은 정현파 부호화에 의해 부호화되는, 다중 채널 오디오 부호화 시스템의 합성 잡음 소스 사용방법.
제1항 내지 제5항 중 어느 한 항에 있어서, 상기 변환 파라미터들은 상기 오디오 채널 세트의 상관 행렬을 직교화(orthogonalization)함으로써 결정되는, 다중 채널 오디오 부호화 시스템의 합성 잡음 소스 사용방법.
제1항 내지 제6항 중 어느 한 항에 있어서, 상기 오디오 신호 세트는 선택된 주파수 대역 세트로 분할되고, 상기 주파수 대역들 중 적어도 하나는 잡음 유사 신호들을 포함하는, 다중 채널 오디오 부호화 시스템의 합성 잡음 소스 사용방법.
오디오 채널 세트를 부호화하는 다중 채널 오디오 부호화 시스템에서 합성 잡음 소스들을 사용하는 방법에 있어서,

잡음 소스들을 합성하기 위한 잡음 파라미터 세트들을 수신하고, 제1항의 방법에 따라 결정된 변환 파라미터 세트를 수신하는 단계;

상기 잡음 파라미터들에 응답하여, 합성된 잡음 소스 세트를 발생하는 단계; 및

상기 변환 파라미터들에 따라 각각의 오디오 신호를 복수의 잡음 소스들로서 형성함으로써 오디오 신호 세트를 발생하는 단계를 포함하는, 다중 채널 오디오 부호화 시스템에서 합성 잡음 소스 사용방법.
제1항 내지 제6항 중 어느 한 항에 방법에 따라 부호화된 오디오 채널들을 부호화는 부호화기에 있어서,

상기 오디오 신호들의 적어도 한 주파수 대역에서, 오디오 신호 세트 중 각각의 하나간에 자기상관 및 교차상관을 검출하는 수단; 및

상기 오디오 신호들간의 관계로부터, 잡음 소스들의 구성을 결정하는 처리 수단으로서, 상기 구성은 상기 구성 내 잡음 소스들이 서로간에 상관되지 않고, 잡음 소스들의 상기 구성이 상기 잡음 성분들을 관계 보존 방식으로 합성하는, 상기 처리 수단을 포함하는, 부호화기.
제8항에 있어서, 상기 소스들 각각을 합성하기 위한 잡음 파라미터 세트들로서 상기 잡음 소스들을 부호화하는 수단,

상기 잡음 파라미터 세트들을 송신하고 상기 복수의 잡음 소스들을 형성하기 위한 상기 변환 파라미터 세트를 송신하는 송신 수단을 더 포함하는, 부호화기.
제1항 내지 제6항 중 어느 한 항에 따라 부호화되어 변환된 오디오 채널들을 수신하는 복호기에 있어서,

잡음 소스들을 합성하기 위한 잡음 파라미터 세트들을 수신하고, 복수의 상기 잡음 소스들을 형성하기 위한 변환 파라미터 세트를 수신하는 수신 수단;

상기 잡음 파라미터들에 응답하여, 잡음 소스들을 발생하는 잡음 발생기 세트; 및

상기 변환 파라미터 세트에 응답하여, 각각의 오디오 신호에 대해 복수의 상기 잡음 소스 세트를 형성함으로써, 오디오 신호들을 지각적으로 관련된 상관 보존된 잡음 성분들과 합성하는 합성 수단을 포함하는, 복호기.
상관되지 않는 잡음 소스들을 합성하기 위한 잡음 파라미터 세트를 포함하고, 제1항 내지 제7항 중 어느 한 항의 방법에 따라 복수의 잡음 소스들을 형성하기 위한 변환 파라미터 세트를 포함하는, 데이터 캐리어.