KR20040063155A - 인지성 잡음의 대치 - Google Patents
인지성 잡음의 대치 Download PDFInfo
- Publication number
- KR20040063155A KR20040063155A KR10-2004-7007816A KR20047007816A KR20040063155A KR 20040063155 A KR20040063155 A KR 20040063155A KR 20047007816 A KR20047007816 A KR 20047007816A KR 20040063155 A KR20040063155 A KR 20040063155A
- Authority
- KR
- South Korea
- Prior art keywords
- noise
- noise sources
- sources
- audio
- synthesizing
- Prior art date
Links
- 238000006467 substitution reaction Methods 0.000 title 1
- 230000005236 sound signal Effects 0.000 claims abstract description 40
- 238000000034 method Methods 0.000 claims abstract description 33
- 238000006243 chemical reaction Methods 0.000 claims abstract description 26
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 18
- 230000002596 correlated effect Effects 0.000 claims abstract description 16
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000004321 preservation Methods 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 description 10
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000013707 sensory perception of sound Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/24—Signal processing not specific to the method of recording or reproducing; Circuits therefor for reducing noise
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Abstract
서로 상관된 잡음 성분들이 존재하는 한 세트의 오디오 신호들을 부호화하기 위해 다중 채널 오디오 부호화 시스템에서 합성 잡음 소스들을 사용하는 방법. 방법은, 오디오 신호들 간 관계로부터, 잡음 소스들의 구성을 결정하는 단계를 포함하고, 이 구성은 구성 내 잡음 소스들이 서로간에 상관이 없게 하여, 잡음 소스들의 구성이 잡음성분들을 상관이 보존되게 하여 합성되게 하는 구성이다. 방법은 각각의 잡음 소스에 대해서 상기 소스를 합성하기 위한 한 세트의 잡음 파라미터들 및 상기 소스들의 상기 구성을 발생하기 위한 한 세트의 변환 파라미터들을 결정함으로써, 상기 잡음 소스들을 부호화하는 단계를 더 포함할 수 있다.
Description
잡음 소스들의 지각면에서 관계된 양들, 이를테면 특정의 주파수 범위 내 잡음의 총 청각 에너지만을 부호화함으로써, 지각상 무관계한 오디오 정보를 버려 상당한 신호 압축이 얻어질 수 있다. 국제출원 W099/04505에 이러한 방법이 기재되어 있다. 이 방법에서, 입력신호의 잡음 유사 성분들은 주파수 대역을 기초로 하여 검출된다. 잡음 유사 성분들은 파라미터화 되고, 대치된 스펙트럼 계수들의 총 파워만이 송신된다. 복호기에서는, 대치된 스펙트럼 계수들에 대해 소망의 파워를 가진 랜덤 잡음 소스들을 삽입시킴으로써, 부호화된 오디오 채널들이 재구성된다.
이러한 단순한 대치는, 복수의 오디오 채널들이 실제로 상호상관(inter-correlation)을 나타내는 경우엔 부자연한 청취감을 야기한다. 이러한 부자연한 지각은 사람의 귀가 서로 다른 방향들로부터 오는 오디오 신호들 간 상관을 식별할 수 있다는 사실에 기인한다. 신호들 간 상관은 사운드 소스들의 공간적 지각인 "스테레오 이미지"를 결정한다. 2-채널 스피커 셋업에서 좌측신호와 우측신호가 완전히 상관되어 있다면, 사람의 청각 시스템은 이를 스피커들 사이에 위치한 단일의 사운드 소스로서 인지할 것이다. 신호들이 서로 상관이 없다면, 좌측 스피커와 우측 스피커에 위치한 두 개의 사운드 소스들이 따로따로 별개로 인지될 것이다. 부분적으로 상관된 신호들은 일반적으로 스피커들 사이에 광범한 사운드 소스로서 인지될 것이다. 부적 상관(negative correlation)은 사운드 소스 위치들이 스피커베이스 밖에 있는 것으로 인지되게 한다. 그러므로, 좌측 스피커와 우측 스피커에서 사운드의 상관이 상실되면, 의도된 스테레오 효과는 사라지고 청취자는 덜 자연스런 청취감을 인지한다.
즉, 복수의 오디오 채널들로부터 나온 사운드가 상기 채널들을 통해 전에 기록한 단일의 오디오 소스를 반영한다면, 상관되지 않은 잡음 소스들을 사용한 상기 오디오 소스의 재구성은 부자연스러운 것으로 나타나게 될 것이다.
전술의 응용에서는 비트 값을 부호화함으로써 전술한 효과를 보상하려고 하고 있는데, 이 비트 값은 활성상태에서, 동일한 잡음 소스를 양 좌우 채널에 사용하도록 합성기(synthesizer)를 트리거시킨다. 노멀 비활성 상태에서, 좌우 채널들은 독립적인 잡음 소스들로부터 합성된다.
이러한 방식은 본시 상관이 없는 잡음 소스들을 사용한 오디오 채널들의 합성에 비해 개선을 제공하나, 합성된 사운드들은, 실제로는 부호화된 오디오 채널들 내 채널들 간 상관도를 기술한 정보가 사용되지 않기 때문에 여전히 자연스러움이 없다. 그러므로, 원 사운드의 재구성은 공지의 방법을 사용할 때 부분적으로만 가능하고 여전히 사람의 귀는 덜 자연스러운 청취감을 인지한다.
본 발명은 서로 상관된 잡음 성분들이 존재하는 한 세트의 오디오 신호들을 부호화하기 위해 다중 채널 오디오 부호화 시스템에서 합성 잡음 소스들을 사용하는 방법에 관한 것이다.
도 1은 본 발명에 따른 부호화 방법을 구현하는 부호화 장치의 개략도이다.
도 2는 본 발명에 따른 부호화 방법을 구현하는 복호 장치의 개략도이다.
본 발명은 전술한 문제를 제거하고, 채널들간 상관도를 보존시킴으로써 복수 오디오 채널들 내 잡음 성분들을 지각면에서 거의 원래에 가깝게 재구성할 수 있는, 향상된 오디오 부호화를 제공하는 것을 목적으로 한다.
따라서, 본 발명의 방법은 상기 오디오 신호들 간 관계로부터, 잡음 소스들의 구성(composition)을 결정하는 단계를 포함하는 것으로, 상기 구성은 상기 구성 내 잡음 소스들이 서로간에 상관이 없게 하여, 잡음 소스들의 상기 구성이 상기 잡음 성분들을 관계 보존 방식으로 합성되게 한다.
본 발명의 방법에 따라서, 오디오 신호에 있는 잡음성분은 상기 오디오 신호들의 적어도 한 주파수 대역에 있는 지각상 관계된, 상관을 보존한 잡음성분들을 합성하는 잡음 소스들로부터 구성된다. 이들 합성되는 잡음 소스들은 서로간에 상관이 없다. 그러므로, 이들 잡음 소스들은 독립적인 잡음 발생기들에 의해 쉽게 재구성될 수 있다.
비록 본 발명이 부호화하지 않은 잡음 소스들을 송신하는데 적용될 수 있을지라도, 바람직한 실시예에서, 본 발명의 방법은 각각의 잡음 소스에 대해서 상기 소스를 합성하기 위한 한 세트의 잡음 파라미터들 및 상기 잡음 소스들의 구성을 발생하기 위한 한 세트의 변환 파라미터들을 결정함으로써, 상기 잡음 소스들을 부호화하는 단계를 더 포함한다.
또한, 본 발명의 바람직한 실시예는 각각의 잡음 소스를 합성하기 위한 상기 복수 세트들의 잡음 파라미터들을 송신하는 단계 및 상기 복수의 잡음 소스들을 형성하기 위한 상기 한 세트의 변환 파라미터들을 송신하는 단계를 포함한다. 구체적으로, 상기 잡음 파라미터들 및 상기 변환 파라미터들은 상기 한 세트의 오디오 채널들의 상관 행렬을 직교화(orthogonalization)함으로써 결정된다. 이 직교화는 오디오 채널들 간 시변 상호상관에 대해 프레임별로 수행될 수 있다. 프레임의 크기는 상호 채널 상관들이 일정한 것이라 간주될 수 있는 시간 프레임에 따를 수 있다.
본 발명은 한 세트의 오디오 신호들이 선택된 한 세트의 주파수 대역들로 분할되고 주파수 대역들 중 적어도 한 대역이 잡음 유사 신호들을 포함하는 경우에 바람직하게 적용될 수 있다. 상기 오디오 신호들 내 있는 비-잡음 성분들은 정현파 부호화에 의해 부호화될 수 있다.
본 발명은 한 세트의 오디오 채널들을 부호화하는 다중 채널 오디오 부호화 시스템에서 합성 잡음 소스들을 사용하는 방법에 관한 것으로, 이 방법은 잡음 소스들을 합성하기 위한 복수 세트들의 잡음 파라미터들을 수신하고 및 본 발명의 방법에 따라 결정된 한 세트의 변환 파라미터들을 수신하는 단계; 상기 잡음 파라미터들에 응답하여, 한 세트의 합성된 잡음 소스를 발생하는 단계; 및 상기 변환 파라미터들에 따라 복수의 잡음 소스들로서 각각의 오디오 신호를 형성함으로써 한 세트의 오디오 신호들을 발생하는 단계를 포함한다.
이에 따라, 부호화되어 송신된 잡음이 있는 오디오 신호들이 복호될 수 있고 대응하는 다중 채널, 상관이 보존된 오디오 신호가 합성될 수 있다.
또한, 본 발명은 한 세트의 각각의 오디오 신호들간에 자기상관 및 교차상관을 상기 오디오 신호들의 적어도 한 주파수 대역에서 검출하는 수단; 및 상기 오디오 신호들 간 관계로부터, 잡음 소스들의 구성을 결정하는 처리수단을 포함하며, 상기 구성은 상기 구성 내 잡음 소스들이 서로간에 상관이 없게 하여, 잡음 소스들의 상기 구성이 상기 잡음 성분들을 관계 보존 방식으로 합성되게 하는 것인, 오디오 부호화기에 관한 것이다.
부호화기는 상기 잡음 소스들을, 상기 소스들 각각을 합성하기 위한 복수 세트들의 잡음 파라미터들로서 부호화하는 수단, 상기 복수 세트의 잡음 파라미터들을 송신하고 상기 복수의 잡음 소스들을 형성하기 위한 상기 한 세트의 변환 파라미터들을 송신하는 송신수단을 더 포함할 수 있다.
마찬가지로, 본 발명은 잡음 소스들을 합성하기 위한 복수 세트들의 잡음 파라미터들을 수신하고 복수의 상기 잡음 소스들을 형성하기 위한 한 세트의 변환 파라미터들을 수신하는 수신수단; 상기 잡음 파라미터들에 응답하여, 잡음 소스들을 생성하는 한 세트의 잡음 발생기들; 및 상기 한 세트의 변환 파라미터들에 응답하여, 각각의 오디오 신호에 대해 복수의 상기 한 세트의 잡음 소스들을 형성함으로써 지각상 관계된, 상관이 보존된 잡음 성분들로 오디오 신호들을 합성하는 합성수단을 포함하는 오디오 복호기에 관한 것이다.
부호화기 및 복호기는 물리적으로 구별되는 신호 처리 장치일 수도 있고 혹은 단일의 신호 처리 장치 내 하나 혹은 몇 개의 유닛들로서 구비될 수도 있다. 송신은 무선송신, 혹은 인터넷을 통한 송신일 수 있고 사실 임의의 종류의 송신일 수 있다. 송신은 자기 디스크 혹은 CD-rom 등과 같은 물리적 데이터 캐리어를 통해 행해질 수도 있다.
본 발명은 또한 잡음 소스들을 합성하기 위한 한 세트의 잡음 파라미터들을 포함하고 전술한 방법에 따라 복수의 잡음 소스들을 형성하기 위한 한 세트의 변환 파라미터들을 포함하는 데이터 캐리어에 관한 것이다.
본 발명의 목적들 및 특징들은 도면들로부터 명백하게 될 것이다.
도 1은 4채널 오디오 신호를 부호화하는 부호화기(1)를 도시한 것이다. 오디오 채널들을 4개의 복합된 화살표들(2)로 나타내었으며, 각각의 화살표(2)는 4개의 채널들 중 한 오디오 채널을 나타낸다. 본 발명에서, 하나 이상의 채널이 있는 한 어떠한 오디오 시스템이든 이에 본 발명의 방법이 적용될 수 있는 것은 자명하므로, 채널들의 실제 수는 무관하다. 오디오 채널(2)은 적어도 한 주파수 대역에 잡음 성분들을 포함하는 오디오 신호를 포함한다. 실제의 실시예들에서, 본 발명에 따른 방법이 전(full) 대역폭의 오디오 신호들에 직접 수행될 수도 있을지라도, 가청 주파수 성분들을 갖는 오디오 신호는 통상 몇 개의(통상 대수 스케일 상의) 주파수 대역들로 분할된다. 이들 주파수 대역들(특히 상관된 신호들에 사람의 귀가 감응하는 관계된 주파수 대역들) 각각, 혹은 특정 수의 주파수 대역들에, 본 발명의 방법이 적용될 수 있다.
다중 채널 신호(2)는 필터단(filter stage)(3)에서 필터링된다. 필터(3)는 오디오 신호들을 잡음부분들(4)과 비-잡음부분들(5)로 분할한다. 신호(2)의 비-잡음부분들(5)은 정현 부호화 회로(6)로 보내진다. 이 정현 부호화 회로(6)는 상기 오디오 신호들(2)의 비-잡음 오디오 정보를 나타내는 압축 부호화된 데이터(7)를 생성한다.
잡음부분들(4)은 본 발명에 따라 상관이 보존되게 잡음을 부호화하는 회로(8)로 보내진다. 이 회로(8)에서는, 상기 오디오 신호들 간 관계를 결정하고, 잡음 소스들의 구성(composition)을 확인하는데, 이 구성은 이 구성 내 잡음 소스들이 상호간에 상관이 없게 한 구성으로, 이에 따라 잡음 소스들의 상기 구성은 상관이 보존되게 하여 상기 잡음 성분들을 합성한다.
상기 오디오 신호들 간 관계는 오디오 채널들(2)의 자기상관 계수들 및 교차상관 계수들을 측정함으로써 판정된다. 이 상관정보는 자기상관 계수들 및 상호상관(inter-correlation) 계수들을 표현하는 상관 행렬로 나타낼 수 있다. 이 행렬에서, 계수 <S(i)S(i)>는 채널 S(i)의 자기상관을 나타내고, 계수 <S(i)S(j)>는 채널 S(i)와 채널 S(j) 간 상호상관을 나타내며, i 및 j는 상기 다중 채널 시스템의 특정의 한 채널을 표기하는 어떤 정수(integral number)들이다.
이 상관 행렬로부터 한 세트의 변환 파라미터들(9)이 계산된다. 변환 파라미터들(9)은 송신기(10)에 공급된다. 변환 파라미터들(9)은 잡음 소스들을 합성하기 위한 관계된 파라미터들에 관한 것이다. 이들 변환 파라미터들은 각각의 상관이 없는 잡음신호의 에너지에 대응하는, 소스들의 자기상관, 및 상기 잡음 소스들간 특정의 관계를 기술하는 상호상관을 포함할 수 있다. 이들 파라미터들(9)은 한 세트의 생성된 잡음 소스들에 역변환을 수행하는 복호기에 의해 수신될 것이며, 이에 대해선 도 2를 참조하여 설명한다.
다음에, 변환 파라미터들(9)은 부호화된 정현파(sinusoidal) 비-잡음 신호들(7)과 조합되고, 부호화된 신호(11)로서 송신기(10)에 의해 송신된다. 송신은 무선송신, 혹은 인터넷을 통한 송신일 수 있고 사실 임의의 종류의 송신일 수 있다. 송신은 자기 디스크 혹은 CD-rom 등과 같은 물리적 데이터 캐리어를 통해 행해질 수도 있다.
도 2에는, 근본적으로, 신호(11)를 한 세트의 오디오 신호들(21)로 복호하는 복호기(12)에서 도 1의 방식의 역이 도시되었다. 신호(11)는 본 발명의 방법에 따라 복수의 잡음 소스들을 형성하는 한 세트의 변환 파라미터들을 포함한다.
제1 분할단(splitting stage)(13)에서, 변환 파라미터들(9) 및 부호화된 비-잡음 신호들(7)이 신호(11)로부터 추출된다. 비-잡음 신호들(7)은 정현파 복호기(14)에 공급되어 오디오 채널들(21)의 비-잡음 부분들(51)을 출력한다.
변환 파라미터들(9)은 한 세트의 독립된(랜덤한) 잡음 발생기(16)를 포함하는 잡음 소스 발생단(15)에 공급된다. 변환 파라미터들(9)은 각각의 잡음 발생기(16)의 잡음 레벨(있을 수 있는 제로 레벨을 포함함)을 지시하며, 부가적으로, 잡음 소스들에 대해 예를 들면 포락선 형태와 같은 다른 파라미터들이 명시될 수도 있다. 잡음 발생기(16)는 한 세트의 상호간에 상관이 없는 잡음 소스들을 생성하는데 이들 잡음 소스들은 한 세트의 변환 파라미터들(9)에 응답하여 각각의 오디오 신호(1)에 대해 복수의 잡음 소스들로 형성됨으로써, 오디오 신호들(21)에 대해서 지각상 관계된, 상관이 보존된 잡음 성분들(41)이 합성된다. 구성단(composition stage)(17)에서는 상관이 보존된 잡음성분들(41)과 비-잡음 부분들(51)을 조합하여 오디오 채널들(21)을 출력하며, 이들 채널들은 도 1의 오디오 채널들(2)의 지각상 관계된 재구성이다.
본 발명은 도면을 참조로 하여 기술한 실시예들로 제한되는 것이 아니라 모든 종류의 변형예들을 포함할 수 있음이 이 기술에 숙련된 자들에게 명백할 것이다. 예를 들면, 기술한 실시예들에서, 신호의 비-잡음 부분들은 정현파 부호화를 사용하여 부호화되었지만, 파형 부호화 혹은 허프만 부호화와 같은 다른 유형들의 부호화가 적용될 수도 있다. 또한, 비-잡음 부분들을 포함하여 전체로서 오디오 채널들이 전술한 변환 파라미터들에 따라 변환될 수도 있다. 또한, 다른 유형들의 잡음 부호화가, 상이한 파라미터들 등을 사용하여 적용될 수도 있다. 방법은 다중 채널 오디오 시스템의 오디오 채널에 대해 단일의 관계된 주파수 대역에 적용될 수도 있다. 방법은 다중 채널 오디오 시스템의 선택된 수의 채널들에 적용될 수도 있다. 이들 및 다른 변형예들은 첨부된 청구항들의 보호범위 내에 드는 것으로 간주된다.
참조부호:
1. 부호화기
2. 화살표
3. 필터단
4. 잡음 부분
5. 비-잡음 부분
6. 정현파 부호화 회로
7. 부호화된 데이터
8. 잡음 부호화 회로
9. 변환 파라미터
10. 송신기
11. 부호화된 신호
12. 복호기
13. 분할단
14. 정현파 복호기
15. 잡음 소스 발생단
16. 잡음 발생기
17. 구성단
Claims (12)
- 상관된 잡음성분들이 존재하는 오디오 신호 세트를 부호화하는 다중 채널 오디오 부호화 시스템에서 합성 잡음 소스들을 사용하는 방법에 있어서,상기 오디오 신호들간의 관계로부터, 잡음 소스들의 구성(composition)을 결정하는 단계로서, 상기 구성은 상기 구성 내 잡음 소스들이 서로간에 상관되지 않고, 잡음 소스들의 상기 구성이 상기 잡음 성분들을 관계 보존 방식으로 합성하는, 상기 결정 단계를 포함하는, 다중 채널 오디오 부호화 시스템의 합성 잡음 소스 사용방법.
- 제1항에 있어서, 각각의 잡음 소스에 대해서 상기 소스를 합성하기 위한 잡음 파라미터 세트 및 잡음 소스들의 상기 구성을 발생시키기 위한 변환 파라미터 세트를 결정함으로써, 상기 잡음 소스들을 부호화하는 단계를 더 포함하는, 다중 채널 오디오 부호화 시스템의 합성 잡음 소스 사용방법.
- 제1항 또는 제2항에 있어서, 각각의 잡음 소스를 합성하기 위한 상기 잡음 파라미터 세트들을 송신하고, 상기 복수의 잡음 소스들을 형성하기 위한 상기 변환 파라미터들 세트를 송신하는 단계를 더 포함하는, 다중 채널 오디오 부호화 시스템의 합성 잡음 소스 사용방법.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 서로간에 상관되지 않은 잡음 소스들은 프레임 단위로 결정되는, 다중 채널 오디오 부호화 시스템의 합성 잡음 소스 사용방법.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 오디오 신호들내에 존재하는 비-잡음 성분들은 정현파 부호화에 의해 부호화되는, 다중 채널 오디오 부호화 시스템의 합성 잡음 소스 사용방법.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 변환 파라미터들은 상기 오디오 채널 세트의 상관 행렬을 직교화(orthogonalization)함으로써 결정되는, 다중 채널 오디오 부호화 시스템의 합성 잡음 소스 사용방법.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 오디오 신호 세트는 선택된 주파수 대역 세트로 분할되고, 상기 주파수 대역들 중 적어도 하나는 잡음 유사 신호들을 포함하는, 다중 채널 오디오 부호화 시스템의 합성 잡음 소스 사용방법.
- 오디오 채널 세트를 부호화하는 다중 채널 오디오 부호화 시스템에서 합성 잡음 소스들을 사용하는 방법에 있어서,잡음 소스들을 합성하기 위한 잡음 파라미터 세트들을 수신하고, 제1항의 방법에 따라 결정된 변환 파라미터 세트를 수신하는 단계;상기 잡음 파라미터들에 응답하여, 합성된 잡음 소스 세트를 발생하는 단계; 및상기 변환 파라미터들에 따라 각각의 오디오 신호를 복수의 잡음 소스들로서 형성함으로써 오디오 신호 세트를 발생하는 단계를 포함하는, 다중 채널 오디오 부호화 시스템에서 합성 잡음 소스 사용방법.
- 제1항 내지 제6항 중 어느 한 항에 방법에 따라 부호화된 오디오 채널들을 부호화는 부호화기에 있어서,상기 오디오 신호들의 적어도 한 주파수 대역에서, 오디오 신호 세트 중 각각의 하나간에 자기상관 및 교차상관을 검출하는 수단; 및상기 오디오 신호들간의 관계로부터, 잡음 소스들의 구성을 결정하는 처리 수단으로서, 상기 구성은 상기 구성 내 잡음 소스들이 서로간에 상관되지 않고, 잡음 소스들의 상기 구성이 상기 잡음 성분들을 관계 보존 방식으로 합성하는, 상기 처리 수단을 포함하는, 부호화기.
- 제8항에 있어서, 상기 소스들 각각을 합성하기 위한 잡음 파라미터 세트들로서 상기 잡음 소스들을 부호화하는 수단,상기 잡음 파라미터 세트들을 송신하고 상기 복수의 잡음 소스들을 형성하기 위한 상기 변환 파라미터 세트를 송신하는 송신 수단을 더 포함하는, 부호화기.
- 제1항 내지 제6항 중 어느 한 항에 따라 부호화되어 변환된 오디오 채널들을 수신하는 복호기에 있어서,잡음 소스들을 합성하기 위한 잡음 파라미터 세트들을 수신하고, 복수의 상기 잡음 소스들을 형성하기 위한 변환 파라미터 세트를 수신하는 수신 수단;상기 잡음 파라미터들에 응답하여, 잡음 소스들을 발생하는 잡음 발생기 세트; 및상기 변환 파라미터 세트에 응답하여, 각각의 오디오 신호에 대해 복수의 상기 잡음 소스 세트를 형성함으로써, 오디오 신호들을 지각적으로 관련된 상관 보존된 잡음 성분들과 합성하는 합성 수단을 포함하는, 복호기.
- 상관되지 않는 잡음 소스들을 합성하기 위한 잡음 파라미터 세트를 포함하고, 제1항 내지 제7항 중 어느 한 항의 방법에 따라 복수의 잡음 소스들을 형성하기 위한 변환 파라미터 세트를 포함하는, 데이터 캐리어.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP01204533.2 | 2001-11-23 | ||
EP01204533 | 2001-11-23 | ||
PCT/IB2002/004601 WO2003044775A1 (en) | 2001-11-23 | 2002-11-04 | Perceptual noise substitution |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20040063155A true KR20040063155A (ko) | 2004-07-12 |
Family
ID=8181297
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2004-7007816A KR20040063155A (ko) | 2001-11-23 | 2002-11-04 | 인지성 잡음의 대치 |
KR10-2004-7007805A KR20040066839A (ko) | 2001-11-23 | 2002-11-22 | 오디오 코딩 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2004-7007805A KR20040066839A (ko) | 2001-11-23 | 2002-11-22 | 오디오 코딩 |
Country Status (10)
Country | Link |
---|---|
US (2) | US20050004791A1 (ko) |
EP (2) | EP1451809A1 (ko) |
JP (2) | JP2005509926A (ko) |
KR (2) | KR20040063155A (ko) |
CN (2) | CN1288624C (ko) |
AU (2) | AU2002343151A1 (ko) |
BR (2) | BR0206611A (ko) |
RU (1) | RU2004118840A (ko) |
TW (1) | TW200407843A (ko) |
WO (2) | WO2003044775A1 (ko) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7190449B2 (en) * | 2002-10-28 | 2007-03-13 | Nanopoint, Inc. | Cell tray |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
ATE527654T1 (de) * | 2004-03-01 | 2011-10-15 | Dolby Lab Licensing Corp | Mehrkanal-audiodecodierung |
SE0400998D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
DE602005022235D1 (de) * | 2004-05-19 | 2010-08-19 | Panasonic Corp | Audiosignalkodierer und Audiosignaldekodierer |
CN101116136B (zh) * | 2005-02-10 | 2011-05-18 | 皇家飞利浦电子股份有限公司 | 声音合成的装置和方法 |
WO2006085244A1 (en) * | 2005-02-10 | 2006-08-17 | Koninklijke Philips Electronics N.V. | Sound synthesis |
TWI458365B (zh) * | 2005-04-12 | 2014-10-21 | Dolby Int Ab | 用以產生電平參數之裝置及方法、用以產生多聲道表示之裝置及方法以及儲存參數表示之儲存媒體 |
RU2376655C2 (ru) * | 2005-04-19 | 2009-12-20 | Коудинг Текнолоджиз Аб | Зависящее от энергии квантование для эффективного кодирования пространственных параметров звука |
JP5108767B2 (ja) | 2005-08-30 | 2012-12-26 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号をエンコーディング及びデコーディングするための装置とその方法 |
KR20070025905A (ko) * | 2005-08-30 | 2007-03-08 | 엘지전자 주식회사 | 멀티채널 오디오 코딩에서 효과적인 샘플링 주파수비트스트림 구성방법 |
EP2595152A3 (en) * | 2006-12-27 | 2013-11-13 | Electronics and Telecommunications Research Institute | Transkoding apparatus |
US8046214B2 (en) * | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8249883B2 (en) * | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
CN101662688B (zh) * | 2008-08-13 | 2012-10-03 | 韩国电子通信研究院 | 音频信号的编码和解码方法及其装置 |
US10672408B2 (en) | 2015-08-25 | 2020-06-02 | Dolby Laboratories Licensing Corporation | Audio decoder and decoding method |
CN109215667B (zh) | 2017-06-29 | 2020-12-22 | 华为技术有限公司 | 时延估计方法及装置 |
EP3913626A1 (en) * | 2018-04-05 | 2021-11-24 | Telefonaktiebolaget LM Ericsson (publ) | Support for generation of comfort noise |
CN110267160B (zh) * | 2019-05-31 | 2020-09-22 | 潍坊歌尔电子有限公司 | 声音信号处理方法、装置及设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19730129C2 (de) * | 1997-07-14 | 2002-03-07 | Fraunhofer Ges Forschung | Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals |
US6298322B1 (en) * | 1999-05-06 | 2001-10-02 | Eric Lindemann | Encoding and synthesis of tonal audio signals using dominant sinusoids and a vector-quantized residual tonal signal |
-
2002
- 2002-11-04 US US10/495,942 patent/US20050004791A1/en not_active Abandoned
- 2002-11-04 CN CNB028232267A patent/CN1288624C/zh not_active Expired - Fee Related
- 2002-11-04 RU RU2004118840/09A patent/RU2004118840A/ru not_active Application Discontinuation
- 2002-11-04 EP EP02779819A patent/EP1451809A1/en not_active Withdrawn
- 2002-11-04 WO PCT/IB2002/004601 patent/WO2003044775A1/en not_active Application Discontinuation
- 2002-11-04 JP JP2003546331A patent/JP2005509926A/ja not_active Withdrawn
- 2002-11-04 AU AU2002343151A patent/AU2002343151A1/en not_active Abandoned
- 2002-11-04 KR KR10-2004-7007816A patent/KR20040063155A/ko not_active Application Discontinuation
- 2002-11-04 BR BR0206611-4A patent/BR0206611A/pt not_active IP Right Cessation
- 2002-11-06 TW TW091132675A patent/TW200407843A/zh unknown
- 2002-11-22 CN CNB028232240A patent/CN1288623C/zh not_active Expired - Fee Related
- 2002-11-22 US US10/495,948 patent/US20050021328A1/en not_active Abandoned
- 2002-11-22 AU AU2002347474A patent/AU2002347474A1/en not_active Abandoned
- 2002-11-22 KR KR10-2004-7007805A patent/KR20040066839A/ko not_active Application Discontinuation
- 2002-11-22 BR BR0206615-7A patent/BR0206615A/pt not_active IP Right Cessation
- 2002-11-22 EP EP02783407A patent/EP1451810A1/en not_active Withdrawn
- 2002-11-22 JP JP2003546332A patent/JP2005509927A/ja not_active Withdrawn
- 2002-11-22 WO PCT/IB2002/004869 patent/WO2003044776A1/en not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
AU2002343151A1 (en) | 2003-06-10 |
TW200407843A (en) | 2004-05-16 |
CN1589467A (zh) | 2005-03-02 |
EP1451809A1 (en) | 2004-09-01 |
US20050021328A1 (en) | 2005-01-27 |
CN1288623C (zh) | 2006-12-06 |
WO2003044775A1 (en) | 2003-05-30 |
BR0206615A (pt) | 2004-02-17 |
BR0206611A (pt) | 2004-02-17 |
CN1589466A (zh) | 2005-03-02 |
AU2002347474A1 (en) | 2003-06-10 |
KR20040066839A (ko) | 2004-07-27 |
JP2005509927A (ja) | 2005-04-14 |
WO2003044776A1 (en) | 2003-05-30 |
CN1288624C (zh) | 2006-12-06 |
EP1451810A1 (en) | 2004-09-01 |
RU2004118840A (ru) | 2005-10-10 |
US20050004791A1 (en) | 2005-01-06 |
JP2005509926A (ja) | 2005-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20040063155A (ko) | 인지성 잡음의 대치 | |
CN1758335B (zh) | 用于低比特率音频编码应用的高效可标度参数立体声编码 | |
US9449601B2 (en) | Methods and apparatuses for encoding and decoding object-based audio signals | |
KR100928311B1 (ko) | 오디오 피스 또는 오디오 데이터스트림의 인코딩된스테레오 신호를 생성하는 장치 및 방법 | |
Kelly et al. | The continuity illusion revisited: coding of multiple concurrent sound sources | |
CN118800256A (zh) | 场景音频信号的解码方法和装置 | |
CN118800247A (zh) | 场景音频信号的解码方法和装置 | |
CN118800249A (zh) | 场景音频信号的解码方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |