KR100316582B1 - 스테레오포닉스펙트럼값의부호화및복호화프로세스 - Google Patents
스테레오포닉스펙트럼값의부호화및복호화프로세스 Download PDFInfo
- Publication number
- KR100316582B1 KR100316582B1 KR1019980710868A KR19980710868A KR100316582B1 KR 100316582 B1 KR100316582 B1 KR 100316582B1 KR 1019980710868 A KR1019980710868 A KR 1019980710868A KR 19980710868 A KR19980710868 A KR 19980710868A KR 100316582 B1 KR100316582 B1 KR 100316582B1
- Authority
- KR
- South Korea
- Prior art keywords
- stereo
- section
- audio
- codebook
- intensity
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 99
- 238000001228 spectrum Methods 0.000 title claims description 34
- 230000003595 spectral effect Effects 0.000 claims abstract description 47
- 238000006243 chemical reaction Methods 0.000 claims description 44
- 230000003044 adaptive effect Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000005236 sound signal Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000001427 coherent effect Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereo-Broadcasting Methods (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
스테레오-오디오 스펙트럼값을 부호화하는 방법은 첫째, 환산계수가 결합된 환산계수 밴드(28)에 상기 스테레오-오디오 스펙트럼값들을 그룹화한다. 다음으로 각각이 적어도 하나의 환산계수 밴드(28)를 구비한 섹션들이 형성된다. 상기 스펙트럼값들은 각각이 코드북 숫자(code book number)를 가진 다수의 코드북(code book)들로부터 섹션에 지정된 코드북(code book)을 가지고 적어도 하나의 섹션 내에 부호화된다. 상기 코드북 숫자는 상기 섹션에 지정되며, 상기 코드북의 숫자는 부 정보(side information)로서 부호화된 스테레오-오디오 스펙트럼값에 전송되는데 사용된다. 코드북을 나타내지는 않으나 그것이 할당된 섹션에 관한 정보블 보여주는 적어도 하나의 부가적인 코드북 숫자가 제공된다. 스테레오-오디오 스펙트럼값을 복호화하는 방법은 부가적인 코드북 숫자를 나타내는 관련 정보를 사용하여 스테레오-오디오 스펙트럼값의 이미 존재하는 부호화된 값들을 환원시킨다.
Description
MPEG 레이어 3 표준에 따라 작동하는, 가장 진보된 오디오 부호화/복호화 프로세스는 디지털 오디오 신호의 데이터를 그 품질을 그다지 저하시키지 않고서도 예를 들어 12의 인수배로 압축할 수 있다.
좌측 채널 L과 우측 채널 R과 같은 각각의 채널에서의 큰 부호화 이득(coding gain)은 차치하고서라도, 위 두 채널의 상대적인 여분(redundancy)과 무관성(irrelavance)은 스테레오의 경우에도 이용된다. 이미 사용되어지는 공지의 방법은 소위 MS 스테레오 프로세스(MS = 센터 사이드)와 인텐서티 스테레오 프로세스(IS 프로세스)이다.
통상의 MS 스테레오 프로세스는 실질적으로 두 채널의 합과 두 채널 사이의 차를 계산한 후 이를 좌측 채널과 우측 채널 각각에 변조된 채널 데이터로서 전송함으로써 두 채널의 상대적 여분을 이용한다. 다시 말해, MS 스테레오 프로세스는 정확한 재생과정을 거친다.
MS 스테레오 프로세스와는 달리, 인텐서티 스테레오 프로세스는 주로 스테레오 무관성(stereo irrelevance)을 이용한다. 스테레오 무관성과 관련하여 인간의 청각 시스템의 공간적 인식과정은 인식되는 오디오 신호의 주파수에 의존한다. 낮은 주파수에서는 두 개의 스테레오 신호의 양 정보(amount information)와 위상 정보(phase information) 모두가 인간의 청각 시스템에 의해 평가되고, 고주파수 성분의 인식은 주로 양 채널의 에너지-시간 포락선(envelope)의 분석에 기초하여 이뤄진다. 따라서, 양 채널 신호의 정확한 위상 정보는 공간적 인식에 관계하지 않는다. 이러한 인간의 청각의 특징은 스테레오 무관성을 이용하여 인텐서티 스테레오 프로세스에 의해 오디오 신호의 데이터를 더 감소시키는 데 사용된다.
높은 주파수에서 스테레오 인텐서티 프로세스가 정확한 위치 정보를 분석할 수 없을 때, 부호기에서 정의된 인텐서티 주파수 한계(intensity frequency limit)로부터 두 개의 각각의 스테레오 채널 L, R 대신에 양 채널에 대한 결합 에너지 포락선(joint energy envelope)을 전송하는 것이 가능하다. 결합 에너지 포락선에 덧붙여 역시 개략적으로 양자화(quantization)된 방향 정보가 부 정보(side information)로 역시 전송된다.
인텐서티 스테레오 부호화 프로세스가 이용될 때 하나의 채널만이 부분적으로 전송되는 경우 비트수의 절감은 약 50%까지이다. 그러나, IS 프로세스는 복호기에서 정확한 재생을 이룰 수 없다는 것을 유의해야 한다.
지금까지 MPEG 레이어 3 표준에서 채택된 IS 프로세스에서, IS 프로세스가 스테레오-오디오 스펙트럼값의 블록에 적용된다는 사실은 소위 mode_extension_bit에 의해 알 수 있으며, 각 블록은 그것에 할당된 mode_extension_bit를 가진다.
도 1에는 공지의 IS 프로세스의 이론적 표현이 도시되어 있다. 채널 L(10)과 채널 R(12)의 스테레오-오디오 스펙트럼값이 합산점(summation point)(14)에서 합쳐져 양 채널에 대한 에너지 포락선 I=Li+Ri가 얻어진다. 여기서, Li와 Ri는 임의의 환산계수 밴드(scale factor band)에서의 채널 L, R의 각각의 스테레오-오디오 스펙트럼값을 나타낸다. 전술한 바와 같이, IS 프로세스를 사용하는 것은 어떤 IS 주파수 한계 이상에서만 허용된다. 이는 부호화 에러(coding error)가 부호화된 스테레오-오디오 스펙트럼값에 삽입되는 것을 방지하기 위해 필요하다. 따라서, 좌우 채널은 0 Hz로부터 IS 주파수 한계 내에서 별도로 부호화되어야 한다. 이러한 IS 주파수 한계는 본 발명의 일부를 이루지 않는 별개의 알고리즘에 의해 결정된다. 이 주파수 한계 이상에서 부호기는 합산점(14)에서 형성된 좌측 채널(10)과 우측 채널(12)의 합산값을 부호화한다.
채널 L의 환산정보(scaling information)(16)와 채널 R의 환산정보(18)는 예를 들어, 부호화된 좌측채널로 전송될 수 있는 에너지 포락선, 즉, 좌우 채널의 합산 신호와 함께 복호화에 필요하다. 좌우 채널에 대한 환산계수는 예를 들어 MPEG 레이어 2에서 수행되는 것과 같은 인텐서티 스테레오 프로세스에서 전송되어진다. 그러나, IS 부호화 스테레오-오디오 스펙트럼값(IS-coded stereo audio spectrum value)에 대한 MPEG 레이어 3의 IS 프로세스에서 인텐서티 방향 정보(intensity direction information)는 단지 우측 채널로서만 전송되고, 위 스펙트럼값은 이 정보와 함께 다시 후술하는 바와 같이 복호화된다.
환산계수(16)(18)는 채널 L과 R의 부호화된 스펙트럼값에 덧붙여 부 정보로서 전송된다. 복호화된 채널 L(20)과 채널 R(22)에서 복호화된 오디오 신호값은 복호기에 의해 전달되고, 원래의 부호화된 스테레오-오디오 스펙트럼값을 복호화하기 위한 수단으로서의 L 승산기(24)와 R 승산기(26)에서 채널 R의 환산 정보(16)와 채널 L의 환산 정보(18)에 각 채널의 복호화된 스테레오-오디오 스펙트럼값이 곱해진다.
IS 부호화가 어떤 IS 주파수 한계 이상에서 적용되거나 MS 부호화가 그 한계 이하에서 적용되기 전에 각 채널에 대한 스테레오-오디오 스펙트럼값은 소위 환산계수 밴드로 그룹화된다. 위 밴드들은 청각 시스템의 인식 특성에 따라 조절된다. 각 밴드는 부가 계수, 즉, 소위 환산계수에 의해 증폭될 수 있다. 위 환산계수는 도 1의 환산 정보(16)(18)의 일부를 구성하고, 특정 채널에 대한 부 정보로서 전송된다. 이 계수들에 의하여 양자화(quantization)에 의해 도입된 간섭 잡음이 심리-음향학적(psycho-acoustic)으로 차단되어 들리지 않게 형성될 수 있다.
도 2a는 MPEG 레이어 3 오디오 부호화 프로세스에 사용되는 부호화된 우측 채널 R의 포맷을 나타낸다. 이하 어떠한 인텐서티 스테레오 프로세스에 대한 언급도 MPEG 레이어 3 표준 프로세스와 관계가 있다. 스테레오-오디오 스펙트럼값이 그룹화되어 포함된 개개의 환산계수 밴드(28)가 도 2a의 첫째줄에 개략적으로 나타나있다. 도 2a에서 이러한 밴드들은 편의상 폭이 동일하게 도시되어 있으나 실제로 이들 폭들은 청각 시스템의 심리-음향학적 특성들 때문에 동일하지 않을 것이다.
도 2a의 둘째줄은 IS 주파수 한계(32) 아래에서 0이 아닌, 부호화된 스테레오-오디오 스펙트럼값 sp들을 포함한다. IS 주파수 한계(IS frequency limit) 이상의 우측 채널의 스테레오-오디오 스펙트럼값들은 전술한 바와 같이 0 (zero_part) nsp로 설정된다 (nsp=zero spectrum).
도 2a의 셋째줄은 우측 채널에 대한 부 정보(34)의 일부를 포함한다. 최초로 도시된 위 부 정보(34)의 일부는 IS 주파수 한계(32) 아래 범위에 대한 환산계수 skf와 IS 주파수 한계(32) 이상의 범위에 대한 방향정보 rinfo(36)로 구성된다. 방향정보는 인텐서티 스테레오 프로세스에서 IS 부호화 주파수 영역을 위치에 관하여 대략적으로 분석하는데 이용된다. 따라서, 인텐서티 포지션(is_pos)으로도 일컬어지는 방향정보 rinfo(36)는 환산계수 대신에 우측 채널로 전송된다. 환산계수 밴드(28)에 대응하는 환산계수(34)는 IS 주파수 한계 아래의 우측 채널에 여전히 존재하고 있음을 유의해야 한다. 인텐서티 포지션(36)은 각각의 환산계수 밴드(28) 내에서 신호원(signal source)의 인식된 스테레오 이미징 포지션(stereo imaging position)(좌측 대 우측의 비율)을 나타낸다. IS 주파수 한계 이상의 각 밴드(28)에서 전송된 스테레오-오디오 스펙트럼값의 복호화값들은 아래의 좌측채널의 환산계수(kL)와 우측채널의 환산계수(kR)를 가지고 MPEG 레이어 3 프로세스에 의하여 크기가 조정된다:
kL= is_ratio/(1+is_ratio) (1)
kR= 1/(1+is_ratio) (2)
is_ratio에 대한 수식은 다음과 같다:
is_ratio = tan(is_pos·π/12) (3)
is_pos 값은 3 bit로 표현되고, 0에서 6까지의 값만이 유효한 위치값이 된다. 좌우 채널은 다음 두 식에서와 같이 I 신호(I=Li+Ri)로부터 유도될 수 있다:
Ri= I·is_ratio/(1+is_ratio) = I·kL(4)
Li= I·1/(1+is_ratio) = I·kR(5)
Ri와 Li는 인텐서티 스테레오 프로세스에서 복호화된 스테레오-오디오 스펙트럼값들을 나타낸다. 여기서, 영 스펙트럼보다는 오히려 결합된 스펙트럼 I=Li+Ri이 좌측채널의 Is 주파수 한계(32) 이상에서 발견되고 방향정보 is_pos보다는 오히려 일반적인 환산계수가 좌측채널에 대하여 존재함에도 불구하고, 좌측 채널의 포맷은 도 2a에 도시된 우측 채널 포맷과 유사하다. 우측 채널에서 영이 아닌, 양자화된 총 스펨트럼값으로부터 0값들로의 전이는 MPEG 레이어 3 표준에서 복호기에 대한 IS 주파수 한계를 암시적으로 알려줄 수 있다.
따라서, 전송된 채널 L은 부호기에서 좌우 채널의 합으로 계산되고, 전송된 방향정보는 아래의 식과 같이 정의될 수 있다:
is_pos = nint[arctan(√EL/√ER)·12/π) (6)
nint[x] 함수는 "다음의 전수(全數)(next whole number)" 함수를 나타내고, EL과 ER는 좌우채널의 각각의 환산계수 밴드에서의 에너지를 나타낸다. 부호기/복호기에서의 이러한 공식들은 좌우 채널에서의 개략적인 신호 재생을 나타낸다.
전술한 바와 같이 공지의 오디오 부호화 프로세스(audio coding process)에서는 스테레오-오디오 스펙트럼값들이 청각 시스템의 인지 특성에 따라 적응된 환산계수 밴드로 그룹화되어 있다. MPEG 레이어 3 표준에 따른 오디오 부호화 프로세스에서는 동일한 신호통계(signal statistics)를 가지고 영역을 그룹화할 목적으로 위 환산계수 밴드를 정확하게 3 영역으로 나눈다. 이는 공지의 허프만 부호화(Huffman coding) 방식에 의하여 과잉 부분(redundancy)을 줄이는데 유리하다. 환산계수 밴드(28)의 각 영역에 대해서 다수개의 허프만 테이블 중 하나가 선택되고, 선택되어진 허프만 테이블에 의하여 허프만 부호화 프로세스를 거쳐 과잉 부분을 감소시키는데 있어서 큰 이득을 얻게 된다. 위 테이블은 부호화된 데이터의 비트 스트림(bit stream)에서 각 영역에 대한 5-비트의 값들로 나타내어진다. 30개의 다른 테이블이 존재하고, 테이블 4와 14는 공백(blank)으로 되어 있다.
현재 표준화된 비역방향 호환성 NBC 부호화 프로세스(non-backward compatible NBC coding process)는 위 프로세스의 비트 스트림에 대해 정확하게 3 영역의 환산계수 밴드가 허용되다는 점뿐만 아니라 다수의 소위 "섹션"들이 존재하고 위 섹션들이 다수의 환산계수 밴드를 구비한다는 점에서 특히 MPEG 레이어 3 표준 오디오 부호화 프로세스와는 다르다. MPEG 레이어 3에서의 전술한 프로세스와 유사하게 하나의 섹션은 과잉 부분을 최대한 줄이기 위해 그 섹션에 할당된 다수의 허프만 테이블로부터 적절한 허프만 테이블 하나를 선택하고 이를 복호화하는데 이용한다. 극단적인 경우 하나의 섹션은 단 하나의 환산계수 밴드를 가질 수도 있다. 그러나, 이러한 경우는 너무 많은 부 정보(side information)들이 요구되기 때문에실제로 일어날 가능성은 희박하다. NBC 프로세스에서는 모두 4-비트로 전송되는 모두 16개의 허프만 코드북 숫자(Huffman code book number)가 있다. 따라서, 현재의 12개의 코드북 수들 중 하나가 선택되어질 수 있다.
본 발명의 목적은 부호화 및 복호화에 관련된 정보가 부 정보를 최소한으로 사용하면서 표시될 수 있는, 스테레오-오디오 스펙트럼값의 부호화 및 복호화 방법을 제공하는 것이다.
전술한 문제점은 청구항 1에 따른 스테레오-오디오 스펙트럼값의 부호화 방법과, 청구항 2에 따른, 인텐서티 스테레오 프로세스에 의해 일부가 부호화된 스테레오-오디오 스펙트럼값의 복호화 방법에 의해 해결된다.
본 발명은 코드북을 나타내는데 사용되지 않는 부가적인 코드북 숫자가 섹션에 관한 다른 정보를 나타낼 수 있다는 사실에 기반을 두고 있다. "부가적인" 코드북 숫자란 코드북을 나타내지 않는 숫자이다. 4-bit 부호화에 의해 12개의 다른 코드북 숫자와, 숫자 13, 14 및 15는 어느 정도 자유롭게 다른 정보를 포함할 수 있다. 바람직하게는 3개의 부가적인 코드북 숫자(숫자 13, 14, 15) 중 2개(숫자 14, 15)는 첫째로는 섹션에 있는 인텐서티 부호화(intensity coding)를 나타내고, 다음으로는 두 개의 스테레오 채널의 IS 부호화 스테레오-오디오 스펙트럼값의 상호 위상 포지션(mutual phase position)을 나타내는데 사용된다.
아직 사용되지 않은 부가적인 코드북 숫자 13은 적응형 허프만 부호화를 나타내는데 사용된다.
본 발명은 오디오 신호의 부호화 및 복호화에 관한 것으로 보다 상세하게는 인텐서티-스테레오 부호화가 활성화(active)되어 있다는 사실을 나타내는 방법에 관한 것이다.
본 발명의 바람직한 실시예는 다음의 첨부된 도면을 참고하여 설명된다.
도 1은 인텐서티 스테레오 프로세스를 사용하는 부호화/복호화 다이어그램에 있어서의 신호흐름을 나타낸다.
도 2a는 MPEG 레이어 3 표준에 따른, 우측 채널에 대한 스테레오 인텐서티 부호화가 있을 때의 데이터 포맷을 나타낸다.
도 2b는 MPEG-NBC 프로세스에 따른, 우측 채널에 대한 스테레오 인텐서티 부호화가 있을 때의 데이터 포맷을 나타낸다.
도 3은 본 발명의 복호기의 블록회로도이다.
본 발명의 첫 번째 실시예는 인텐서티 스테레오 프로세스에 의해 일부가 부호화된 스테레오-오디오 스펙트럼값을 부호화 및 복호화하는 방법이 섹션 내에 인텐서티 스테레오 부호화가 존재한다는 것을 새롭게 알려주는 것이다. 본 발명에 따르면 다시 16개의 코드북 숫자가 있다. 그러나, 종래기술과는 달리 처음 12개의 숫자(1~12)만이 실제 코드북(real code book)에 대응된다. 마지막 2개의 코드북 숫자들은 스테레오 인텐서티 프로세스가 그 숫자와 관련된 섹션 내에서 사용되고 있다는 것을 알려주는데 이용된다.
도 2b는 MPEG2-NBC 프로세스를 사용하는 스테레오 인텐서티 부호화를 포함하는, 우측채널 R에 대한 데이터의 포맷을 나타낸다. 도 2a 또는 MPEG 레이어 3 프로세스와의 차이점은 MPEG 레이어 2-NBC 프로세스의 사용자가 각각의 섹션, 즉, IS 주파수 한계(32) 이상까지 미치는, 하나 이상의 환산계수 밴드의 일 그룹에 대해 선택적으로 스테레오-오디오 스펙트럼값들의 인텐서티 스테레오 부호화 프로세스를 "연결"하거나 "연결을 끊을 수 있는" 융통성을 가진다는 점이다. 따라서, NBC 프로세스에서 IS 부호화 프로세스는 IS 주파수 한계 이상에서도 연결 또는 연결되지 않을 수 있기 때문에 IS 주파수 한계는 MPEG 레이어 3과 비교하여 실질적으로 진정한 의미의 주파수 한계는 아니며, 이는 MPEG 레이어 3에서는 가능하지 않다. 다시 말해, MPEG 레이어 3에서는 IS 부호화가 존재할 때 IS 주파수 한계 이상의 스테레오-오디오 스펙트럼값이 스펙트럼 범위의 최상위까지 IS 프로세스에 의해 부호화되는 것이 필수적이었다. 새로운 NBC 프로세스는 IS 주파수 한계 이상까지의 전 범위에 대해 IS 부호화를 활성화시킬 필요가 없다. 즉, 지시가 있다면 IS 부호화 프로세스는 연결이 끊어지게 된다. 본 발명에 따르면 섹션에 대한 비트 스트림 규약이 어떤 경우에든 전송되는 코드북 숫자를 요구하기 때문에 지시 작업이 이루어질 때 부 정보 또는 "오버헤드(overhead)"가 증가되지 않는다.
우측채널에 대한 IS 부호화를 가진 섹션에 전송된 환산계수들 역시 종래기술에서처럼 인텐서티 방향 정보(intensity direction information)(36)를 구성하며, 위 계수들 역시 차분 및 허프만 부호화(differential and Huffman coding) 방식에 의해 처리된다. 전술한 바와 같이, IS 부호화되지 않은 환산계수 밴드에서는 우측채널에 스테레오-오디오 스펙트럼값들보다는 오히려 영 스펙트럼이 있게 된다. 좌측 채널은 IS 부호화 섹션에서의 좌우측 채널에 대한 합산신호를 포함하게 된다. 그러나, 이 합산신호는 IS 복호화 이후 각각의 환산계수 밴드 내의 에너지가 좌측 채널의 에너지와 같아지도록 표준화된다. 따라서, 복호기에서 사용된 IS 부호화의 경우 좌측 채널은 변화되지 않은 채 처리될 수 있으며, 일부러 재환산 명세(re-scaling specification)에 의하여 판단할 필요가 없다. 우측 채널의 스테레오-오디오 스펙트럼값들은 우측 채널의 부 정보에 포함된 인텐서티 방향 정보 is_pos (36)를 사용하여 좌측채널의 스테레오-오디오 스펙트럼값들로부터 유도할 수 있다.
전술한 바와 같이, 종래의 스테레오 인텐서티 프로세스는 단지 진폭, 즉 인텐서티에서만 차이가 나는 좌우측 채널에 대한 두 개의 코히어런트 신호를 준다. 이때, 위 코히어런트 신호는 방향 정보 is_pos(36)(식 (4)와 (5))에 의존한다.
본 발명에서는 인텐서티 스테레오 프로세스의 존재가 두 개의 비실제적 코드북 숫자에 의해 나타내어지기 때문에 두 채널 간의 위상관계가 포함될 수 있다. 만약 두 채널이 동일 위상을 갖는 상태에 있다면, 본 발명의 복호기에서 수행되는 역계산 명세(calculating-back specification)는 다음과 같다:
Ri= 0.5^(0.25·is_pos(sfb))·Li(7)
반면, 위상이 반대가 되는 상태에 있다면 스펙트럼에 -1이 곱해져 아래와 같이 우측 채널에 대한 식으로 나타내어진다:
Ri= (-1)·0.5^(0.25·is_pos(sfb))·Li(7)
위 두 식에서 Ri는 역계산, 즉 복호화된 우측 채널의 스테레오-오디오 스펙트럼값을 나타내고, sfb는 방향정보 is_pos(36)와 관련된 환산계수 밴드(28)를 나타내며, Li는 복호기에서 변화되지 않은 채로 얻어지는 좌측 채널의 스테레오-오디오 스펙트럼값을 나타낸다.
코드북 숫자 15는 최초의 역계산 공식(calculating-back formula)이 사용되는지 여부를 나타내고, 숫자 14는 두 번째의 역계산 공식이 사용되는지, 즉, 두 개의 채널의 위상이 반대인지 여부를 나타낸다. 본 발명에서 "동일 위상(in phase)" 또는 "반대 위상(in phase opposition)"이라는 표현이 넓은 의미로 사용되고 있다는 점은 해당분야의 통상의 기술자에게 자명할 것이다. 예를 들어, 위상 분별기(phase discriminator)가 제공될 수 있다. 위 위상분별기는 주어진 초기값이 90°일 때 신호들의 위상이 반대라고 판단하며, 위상차가 90°이하일 때는 위상이 같은 것으로 여긴다.
전술한 첫 번째 실시예에서 두 채널의 상대적인 위상 포지션(phase position)은 적어도 하나의 환산계수 밴드를 구비한 섹션에 대한 코드북 숫자 14 또는 15에 의해 결정될 수 있다. IS 및 위상 표시(phase indication)에 의해 생성된 부 정보는 하나의 섹션에 대해 8 비트로 구성되어 있으며, 4 비트는 섹션 길이에 대해 할당되고, 4 비트는 코드북 숫자 14 또는 15에 대해 할당된다. 만약 좌우측 채널의 환산계수 밴드에서 위상 포지션이 자주 변하는 오디오 신호를 부호화해야 한다면, 하나의 환산계수 밴드에서 다른 환산계수 밴드까지의 각각의 위상 포지션이 반전될 때마다 새로운 섹션이 시작되어야 한다. 따라서, 위상 포지션이 자주 변하는 신호는 매우 많은 섹션을 가지며, 각 섹션은 관련된 코드북 숫자를 통하여 두 채널의 스테레오-오디오 스펙트럼값들의 위상이 일치하거나 반대라는 것을 알려주게 된다. 결국 바람직하지 못한 신호는 많은 수의 섹션과 많은 양의 부 정보를 가지게 된다.
본 발명의 두 번째 실시예는 인텐서티 부호화가 활성화되어 있는 섹션에서 위상 포지션의 환산계수 밴드 부호화를 가능하게 한다. 두 번째 실시예에 따른 위 발명에 의해, 섹션 수 및 추가적인 지출 없이 후술하는 MS 마스크(MS mask)를 사용하여 위상 포지션의 환산계수 밴드 부호화를 실행할 수 있다.
하나의 환산계수 밴드에서 미들-사이드 프로세스(middle-side process)와 인텐서티 스테레오 프로세스가 상호 배타적이라는 것은 해당 분야의 통상의 기술자에게 자명하다. 즉, 두 프로세스는 "직교(orthogonal)"를 이룬다.
스테레오-오디오 스펙트럼값의 MS 부호화가 비스 스트림에서 사용되면, 지시 비트(indication bit)가 부 정보에 적절히 설정되고 전체 MS 부호화를 연결한다. 비트의 설정은 MS 비트 마스크가 전송되어 각각의 환산계수 밴드(scfbd)에 대해 MS 부호화가 연결 또는 연결되지 않게 한다는 것을 의미한다. MS 비트 마스크의 한 비트는 각 환산계수 밴드에 지정되어 있기 때문에 비트 마스크의 길이는 밴드 수에 대응하게 된다.
IS가 활성화되어 있는 환산계수 밴드에서는 MS 부호화가 활성화되어서는 안 되기 때문에, MS 환산계수 정보가 반드시 위 환산계수 밴드에 있을 필요는 없다. MS 비트 마스크는 그 영역 내에서 다른 지시 목적으로 사용될 수 있다. 따라서, MS 비트 마스크를 이용하여 IS 부호화의 세세한 부분까지를 나타내는 것이 가능하다. 첫 번째 실시예에서처럼 하나의 섹션에서 채널의 위상 포지션에 대한 IS 부호화 정보가 코드북 숫자 14 및 15에 의하여 주어진다. 위 숫자들은 또한 IS 부호화가 섹션 내에서 실제로 활성되어 있다는 점을 나타낸다.
본 발명의 첫 번째 실시예와는 달리, 두 번째 실시예에서 MS 비트 마스크는 환산계수 밴드가 하나의 섹션에서 다른 위상 포지션들을 가질 수 있도록 하기 위해 사용된다. IS 부호화가 한 섹션에서 활성화되어 있다는 것을 나타내는 코드북 숫자와 관련하여, MS 비트 마스크의 기능은 그 섹션에서 개개의 환산계수 밴드의 위상 포지션을 나타내는 것이다. 만약 어떤 환산계수 밴드에 대하여 MS 비트 마스크의 한 비트가 설정되어 있지 않다면(예를 들어, 0이라면), 그 환산계수 밴드를 포함하는 섹션에 대한 코드북 숫자에 의해 나타내어지는 위상 정보는 유지될 것이다. 반면, 만약 그 환산계수 밴드에 대하여 MS 비트 마스크의 한 비트가 설정되어 있으면(예를 들어, 1이라면), 그 환산계수 밴드를 포함하는 섹션에 대한 코드북 숫자에 의해 나타내어지는 위상 정보는 반대가 될 것이다. 따라서, 기본적으로 코드북 숫자에 의해 표시되는 위상 포지션과 MS 비트 마스크 사이에는 EXCLUSIVE-OR 기능이 있다.
좀더 구체적으로, 코드북 숫자와 MS 비트 마스크로부터 계산된, IS 부호화가 사용되는 섹션 내에 포함되는 환산계수 밴드에서의 두 스테레오 채널 L과 R의 위상관계는 다음과 같다:
코드북 숫자(한 섹션당) | 15 | 15 | 14 | 14 |
MS 비트 마스크(한 환산계수 밴드당) | 0 | 1 | 0 | 1 |
L과 R의 위상 포지션 | 0° | 180° | 180° | 0° |
역계산 공식 | 식 (7) | 식 (8) | 식 (8) | 식 (7) |
전술한 본 발명의 두 번째 실시예는 서로 다른 위상 포지션의 스테레오-오디오 스펙트럼값을 갖는 환산계수 밴드가 "하나의" 섹션에 나타날 수 있게 하며, 그에 의해 첫 번째 실시예에서보다 더 적은 섹션들이 부호화를 위해 형성되게 된다. 따라서, 더 적은 부 정보들이 전송되어지게 된다.
전술한 실시예와는 달리, 한 섹션에 관련된 기타 정보 역시 부가적인 코드북 숫자들에 의해 나타내어질 수 있다.
예를 들어, 한 섹션에 관련된 기타 정보는 한 섹션에서 적응형 허프만 부호화를 사용하는지에 대한 참조(reference)가 될 수 있다. 적응형 허프만 부호화를 가졌을 때, 적응형 허프만 테이블이 신호 통계(signal statistics)에 따라 생성될 수 있다. 코드북 숫자 13은 부호기가 12개의 고정형 허프만 테이블 중 어느 것도 사용하지 않고, 복호기에 미리 알려지 있지 않은, 적응형의 테이블 하나를 사용하도록 지시한다. 이것은 한 섹션의 신호 통계가 영구적으로 미리 정해진 고정형 허프만 테이블 중 하나에 의해 최적으로 부호화, 즉, 압축될 수 없을 때 유리하다. 따라서, 부호화는 위 12개의 고정형 테이블에 구속되지 않고 신호 통계에 최적으로 적응된 테이블을 사용할 수 있다. 적응형 코드북(adaptive code book)에 대한 정보가 부가적인 부 정보로서 전송된다.
부호화에 사용된 적응형 허프만 테이블을 유도하기 위해 복호기는 이 부가적인 부 정보를 필요로 하며, 이에 따라 허프만 부호화 스테레오-오디오 스펙트럼값(Huffman-coded stereo audio spectral value)들은 정확하게 복호화될 수 있다.
도 3은 본 발명의 복호화 방법을 수행할 수 있는 복호기의 간단한 블록회로도이다. 인텐서티 스테레오 프로세스에 의하여 부분적으로 부호화된 오디오 스펙트럼값들은 각각의 역양자화기(reverse quantiser)(38)(40)에 수용되고, 역양자화기(38)(40)는부호화 과정시 실행된 양자화 처리를 환원시킨다. 다음 역양자화된 스테레오-오디오 스펙트럼값들은 MS 복호기(42)로 들어간다. MS 복호기(42)는 부호기에서 실행된 미들-사이드 부호화를 환원시킨다. IS 복호기(44)는 전술한 역계산 공식 (7)과 (8)을 사용하여 IS 부호화 환산계수 밴드에 대한 원래의 스테레오-오디오 스펙트럼값을 다시 얻는다. 좌우측 채널에 대한 각각의 역변환 수단(re-conversion means)이 스테레오-오디오 스펙트럼값들을 스테레오-오디오 시간값(stereo audio time value) L(t), R(t)로 변환한다. 위 역변환 수단(46)(48)이 예를 들어 역-MDCT에 의해 동작한다는 것은 해당분야의 통상의 기술자에게 자명하다.
Claims (18)
- 스테레오-오디오 스펙트럼값(stereo audio spectrum value)의 부호화 방법에 있어서,환산계수(scale factor)(34)가 결합된 환산계수 밴드(scale factor band)의 상기 스테레오-오디오 스펙트럼값을 그룹화하는 단계;각각이 적어도 하나의 환산계수 밴드(28)를 포함하는 섹션들을 형성하는 단계; 그리고,각각에 대해 하나의 숫자가 지정된 다수의 코드북(code book)들 중 적어도 하나의 섹션에 할당된 하나의 코드북을 가진 하나 이상의 섹션 내에서 스테레오-오디오 스펙트럼값을 부호화하고, 상기 코드북의 숫자는 부호화된 스테레오-오디오 스펙트럼값에 부 정보(side information)로서 전송되는데 사용되는 단계를 구비하고,코드북을 나타내지는 않으나, 할당된 섹션에 관한 정보를 나타내는 적어도 하나의 부가적인 코드북 숫자(code book number)가 제공되며, 상기 섹션에는 부가적인 코드북 숫자가 지정되며, 또한 하나의 섹션은 부 정보의 양에 영향을 미치지 않고 코드북 숫자나 상기 섹션에 할당된 적어도 하나의 부가적인 코드북 숫자를 가지는 것을 특징으로 하는 스테레오-오디오 스펙트럼값을 부호화하는 방법.
- 상기 부호화된 스테레오-오디오 스펙트럼값의 각 섹션에 대한 부 정보를 기초로 하여 코드북 숫자를 감지하는 단계;코드북을 사용하여 한 섹션의 스테레오-오디오 스펙트럼값을 복호화 하며, 상기 섹션의 코드북 숫자는 대응되는 상기 코드북을 나타내는 단계;를 구비한 부호화된 스테레오-오디오 스펙트럼값의 복호화방법에 있어서,코드북을 나타내지는 않으나, 할당된 다른 섹션에 관한 정보를 나타내는 적어도 하나의 부가적인 코드북 숫자를 가지고 상기 나타나는 정보에 따라서 상기 다른 섹션의 스테레오-오디오 스펙트럼값을 복호화하며, 상기 다른 섹션에는 상기 부가적인 코드북 숫자가 지정되는 단계를 더 포함하는 것을 특징으로 하는 부호화된 스테레오-오디오 스펙트럼값의 복호화 방법.
- 제 1항에 있어서,적어도 하나의 부가적인 코드북 숫자가 연관된 섹션의 스테레오-오디오 스펙트럼값의 인텐서티 스테레오 프로세스에 의한부호화를 나타내는 것을 특징으로 하는 스테레오-오디오 스펙트럼값의 부호화 방법.
- 제 1항 내지 제 3항에 있어서,적어도 하나의 부가적인 코드북 숫자가 연관된 섹션의 스테레오-오디오 스펙트럼값의 적응형 허프만 부호화를 나타내는 것을 특징으로 하는 스테레오-오디오 스펙트럼값의 부호화 방법.
- 제 1항 또는 제 3항에 있어서,인텐서티 스테레오 프로세스에 의해 부호화된 섹션에 대해 상기 적어도 하나의 부가적인 코드북 숫자가 두 스테레오 채널 간의 위상관계도 나타내는 것을 특징으로 하는 스테레오-오디오 스펙트럼값의 부호화 방법.
- 제 5항에 있어서,두 개의 부가적인 코드북 숫자 중 하나는 두 스테레오 채널의 동일한 위상 포지션을 나타내고, 이 경우 아래의 역계산 공식(calculating-back formula)이 인텐서티 복호화를 지원하며,Ri= 0.5^(0.25·is_pos(sfb))·Li ,여기서, Ri는 우측 채널(R)의 스테레오-오디오 스펙트럼값을 나타내고, is_pos는 현재 고려되는 환산계수 밴드 sfb의 인텐서티 방향 정보를 나타내며, Li는 좌측 채널(L)의 스테레오-오디오 스펙트럼값을 나타내는 것을 특징으로 하는 스테레오-오디오 스펙트럼값의 부호화 방법.
- 제 5항에 있어서,두 개의 부가적인 코드북 숫자 중 하나는 두 스테레오 채널의 반대 위상 포지션을 나타내고, 이 경우 아래의 역계산 공식(calculating-back formula)이 인텐서티 복호화를 지원하며,Ri = (-1)·0.5^(0.25·is_pos(sfb))·Li ,여기서, Ri는 우측 채널(R)의 스테레오-오디오 스펙트럼값을 나타내고, is_pos는 현재 고려되는 환산계수 밴드 sfb의 인텐서티 방향 정보를 나타내며, Li는 좌측 채널(L)의 스테레오-오디오 스펙트럼값을 나타내는 것을 특징으로 하는 스테레오-오디오 스펙트럼값의 부호화 방법.
- 제 1항 또는 제 3항에 있어서,인텐서티 스테레오 프로세스가 좌측 채널에서 좌우측 채널의 스테레오-오디오 스펙트럼값의 표준화된 합산 신호를 형성하고, 우측채널에서는 스펙트럼이 0이고 인텐서티 방향 정보가 부 정보로서 부호화되는 것을 특징으로 하는 스테레오-오디오 스펙트럼값의 부호화 방법.
- 제 1항 내지 제 3항에 있어서,각 환산계수를 가진 비트 마스크가 사용되고, 하나의 환산계수 밴드에 대한 비트 마스크 상의 하나의 비트가 두 개의 부가적인 코드북 숫자 중 하나가 지정된 섹션의 부가적인 코드북으로 게이트(gate)됨으로써 두 스테레오 채널에 대한 위상 관계를 결정하는 것을 특징으로 하는 스테레오-오디오 스펙트럼값의 부호화 방법.
- 제 9항에 있어서,상기 비트 마스크는 MS 비트 마스크이고, 상기 부가적인 코드북 숫자들은EXCLUSIVE-OR 게이트에 의하여 MS 비트 마스크 환산계수 밴드와 연결되어 있는 것을 특징으로 하는 스테레오-오디오 스펙트럼값의 부호화 방법.
- 제 2항에 있어서,적어도 하나의 부가적인 코드북 숫자와 연관된 섹션의 스테레오-오디오 스펙트럼값의 인텐서티 스테레오 프로세스에 의한 부호화를 나타내는 것을 특징으로 하는 부호화된 스테레오-오디오 스펙트럼값의 복호화 방법.
- 제 2항 또는 제 11항에 있어서,적어도 하나의 부가적인 코드북 숫자가 연관된 섹션의 스테레오-오디오 스펙트럼 값의 적응형 허프만 부호를 나타내는 것을 특징으로 하는 부호화된 스테레오-오디오 스펙트럼값의 복호화 방법.
- 제 2항 또는 제 11항에 있어서,인텐서티 스테레오 프로세스에 의해 부호화된 섹션에 대해 상기 적어도 하나의 부가적인 코드북 숫자가 두 스테레오 채널 간의 위상관계도 나타내는 것을 특징으로 하는 부호화된 스테레오-오디오 스펙트럼값의 복호화 방법.
- 제 13항에 있어서,두 개의 부가적인 코드북 숫자 중 하나는 두 스테레오 채널의 동일한 위상포지션을 나타내고, 이 경우 아래의 역계산 공식(calculatin-back formula)이 인텐서티 복호화를 지원하며,Ri=0.5^(0.25·is_pos(sfb))·Li,여기서, Ri는 우측 채널(R)의 스테레오-오디오 스펙트럼값을 나타내고, is_pos는 현재 고려되는 환산계수 밴드 sfb의 인텐서티 방향 정보를 나타내며, Li는 좌측 채널(L)의 스테레오-오디오 스펙트럼값을 나타내는 것을 특징으로 하는 부호화된 스테레오-오디오 스펙트럼값의 복호화 방법.
- 제 13항에 있어서,두 개의 부가적인 코드북 숫자 중 하나는 두 스테레오 채널의 반대 위상 포지션을 나타내고, 이 경우 아래의 역계산 공식(calculating-back formula)이 인텐서티 복호화를 지원하며,Ri=(-1)·0.5^(0.25·is_pos(sfb))·Li,여기서, Ri는 우측 채널(R)의 스테레오-오디오 스펙트럼값을 나타내고, is_pos는 현재 고려되는 환산계수 밴드 sfb의 인텐서티 방향 정보를 나타내며, Li는 좌측 채널(L)의 스테레오-오디오 스펙트럼값을 나타내는 것을 특징으로 하는 부호화된 스테레오-오디오 스펙트럼값의 복호화 방법.
- 제 2항 또는 제 11항에 있어서,인텐서티 스테레오 프로세스가 좌측 채널에서 좌우측 채널의 스테레오-오디오 스펙트럼값의 표준화된 합산 신호를 형성하고, 우측채널에서는 스펙트럼이 0이고 인텐서티 방향 정보가 부 정보로서 부호화되는 것을 특징으로 하는 부호화된 스테레오-오디오 스펙트럼값의 복호화 방법.
- 제 2 항 또는 제 11항에 있어서,각 환산계수를 가진 비트 마스크가 사용되고, 하나의 환산계수 밴드에 대한 비트 마스크 상의 하나의 비트가 두 개의 부가적인 코드북 숫자 중 하나가 지정된 섹션의 부가적인 코드북으로 게이트(gate)됨으로써 두 스테레오 채널에 대한 위상관계를 결정하는 것을 특징으로 하는 부호화된 스테레오-오디오 스펙트럼값의 복호화 방법.
- 제 17항에 있어서,상기 비트 마스크는 MS 비트 마스크이고, 상기 부가적인 코드북 숫자들은 EXCLUSIVE-OR 게이트에 의하여 MS 비트 마스크 환산계수 밴드와 연결되어 있는 것을 특징으로 하는 부호화된 스테레오-오디오 스펙트럼 값의 복호화 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19628292.6 | 1996-07-12 | ||
DE19628292A DE19628292B4 (de) | 1996-07-12 | 1996-07-12 | Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten |
PCT/EP1997/002874 WO1998003036A1 (de) | 1996-07-12 | 1997-06-03 | Verfahren zum codieren und decodieren von stereoaudiospektralwerten |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20000022435A KR20000022435A (ko) | 2000-04-25 |
KR100316582B1 true KR100316582B1 (ko) | 2002-02-28 |
Family
ID=7799742
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019980710868A KR100316582B1 (ko) | 1996-07-12 | 1997-06-03 | 스테레오포닉스펙트럼값의부호화및복호화프로세스 |
Country Status (14)
Country | Link |
---|---|
US (1) | US6771777B1 (ko) |
EP (1) | EP0910927B1 (ko) |
JP (1) | JP3622982B2 (ko) |
KR (1) | KR100316582B1 (ko) |
AT (1) | ATE188832T1 (ko) |
AU (1) | AU712196B2 (ko) |
CA (1) | CA2260090C (ko) |
DE (2) | DE19628292B4 (ko) |
DK (1) | DK0910927T3 (ko) |
ES (1) | ES2143868T3 (ko) |
GR (1) | GR3032444T3 (ko) |
NO (1) | NO317570B1 (ko) |
PT (1) | PT910927E (ko) |
WO (1) | WO1998003036A1 (ko) |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6539357B1 (en) * | 1999-04-29 | 2003-03-25 | Agere Systems Inc. | Technique for parametric coding of a signal containing information |
US6735561B1 (en) * | 2000-03-29 | 2004-05-11 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
US7099830B1 (en) | 2000-03-29 | 2006-08-29 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
ATE387044T1 (de) * | 2000-07-07 | 2008-03-15 | Nokia Siemens Networks Oy | Verfahren und vorrichtung für die perzeptuelle tonkodierung von einem mehrkanal tonsignal mit verwendung der kaskadierten diskreten cosinustransformation oder der modifizierten diskreten cosinustransformation |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
WO2003046891A1 (en) | 2001-11-29 | 2003-06-05 | Coding Technologies Ab | Methods for improving high frequency reconstruction |
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7016547B1 (en) | 2002-06-28 | 2006-03-21 | Microsoft Corporation | Adaptive entropy encoding/decoding for screen capture content |
JP4676140B2 (ja) | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
US7433824B2 (en) * | 2002-09-04 | 2008-10-07 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
ATE543179T1 (de) | 2002-09-04 | 2012-02-15 | Microsoft Corp | Entropische kodierung mittels anpassung des kodierungsmodus zwischen niveau- und lauflängenniveau-modus |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
US7782954B2 (en) | 2003-09-07 | 2010-08-24 | Microsoft Corporation | Scan patterns for progressive video content |
US7724827B2 (en) * | 2003-09-07 | 2010-05-25 | Microsoft Corporation | Multi-layer run level encoding and decoding |
US7688894B2 (en) * | 2003-09-07 | 2010-03-30 | Microsoft Corporation | Scan patterns for interlaced video content |
KR20050027179A (ko) * | 2003-09-13 | 2005-03-18 | 삼성전자주식회사 | 오디오 데이터 복원 방법 및 그 장치 |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
JPWO2006004048A1 (ja) * | 2004-07-06 | 2008-04-24 | 松下電器産業株式会社 | オーディオ信号符号化装置、オーディオ信号復号化装置、方法、及びプログラム |
EP1866911B1 (en) * | 2005-03-30 | 2010-06-09 | Koninklijke Philips Electronics N.V. | Scalable multi-channel audio coding |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
US7693709B2 (en) | 2005-07-15 | 2010-04-06 | Microsoft Corporation | Reordering coefficients for waveform coding or decoding |
US7539612B2 (en) * | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
KR100851970B1 (ko) * | 2005-07-15 | 2008-08-12 | 삼성전자주식회사 | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
US7684981B2 (en) | 2005-07-15 | 2010-03-23 | Microsoft Corporation | Prediction of spectral coefficients in waveform coding and decoding |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US7599840B2 (en) * | 2005-07-15 | 2009-10-06 | Microsoft Corporation | Selectively using multiple entropy models in adaptive coding and decoding |
US7565018B2 (en) * | 2005-08-12 | 2009-07-21 | Microsoft Corporation | Adaptive coding and decoding of wide-range coefficients |
US8599925B2 (en) | 2005-08-12 | 2013-12-03 | Microsoft Corporation | Efficient coding and decoding of transform blocks |
US7933337B2 (en) | 2005-08-12 | 2011-04-26 | Microsoft Corporation | Prediction of transform coefficients for image compression |
US7953604B2 (en) | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US8184710B2 (en) | 2007-02-21 | 2012-05-22 | Microsoft Corporation | Adaptive truncation of transform coefficient data in a transform-based digital media codec |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US7774205B2 (en) * | 2007-06-15 | 2010-08-10 | Microsoft Corporation | Coding of sparse digital media spectral data |
US8046214B2 (en) * | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8249883B2 (en) | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
KR101444102B1 (ko) * | 2008-02-20 | 2014-09-26 | 삼성전자주식회사 | 스테레오 오디오의 부호화, 복호화 방법 및 장치 |
US8179974B2 (en) | 2008-05-02 | 2012-05-15 | Microsoft Corporation | Multi-level representation of reordered transform coefficients |
US8406307B2 (en) | 2008-08-22 | 2013-03-26 | Microsoft Corporation | Entropy coding/decoding of hierarchically organized data |
JP6061121B2 (ja) | 2011-07-01 | 2017-01-18 | ソニー株式会社 | オーディオ符号化装置、オーディオ符号化方法、およびプログラム |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3310480C2 (de) * | 1983-03-23 | 1986-02-13 | Seitzer, Dieter, Prof. Dr.-Ing., 8520 Erlangen | Digitales Codierverfahren für Audiosignale |
JPS59188764A (ja) | 1983-04-11 | 1984-10-26 | Hitachi Ltd | メモリ装置 |
DE3943879B4 (de) | 1989-04-17 | 2008-07-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Digitales Codierverfahren |
JP3131249B2 (ja) | 1991-08-23 | 2001-01-31 | 日本放送協会 | 混合音声信号受信装置 |
CA2090052C (en) | 1992-03-02 | 1998-11-24 | Anibal Joao De Sousa Ferreira | Method and apparatus for the perceptual coding of audio signals |
EP0559348A3 (en) | 1992-03-02 | 1993-11-03 | AT&T Corp. | Rate control loop processor for perceptual encoder/decoder |
DE4236989C2 (de) * | 1992-11-02 | 1994-11-17 | Fraunhofer Ges Forschung | Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle |
JP3292522B2 (ja) | 1992-11-25 | 2002-06-17 | 京セラ株式会社 | 携帯電話機 |
JP3150475B2 (ja) | 1993-02-19 | 2001-03-26 | 松下電器産業株式会社 | 量子化方法 |
US5581653A (en) | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
DE4331367C2 (de) * | 1993-09-15 | 1996-04-18 | Lewin Martin | Innenmuffe zur Dichtung von Rohrstößen in Rohrleitungen |
DE4331376C1 (de) | 1993-09-15 | 1994-11-10 | Fraunhofer Ges Forschung | Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen |
US5488665A (en) | 1993-11-23 | 1996-01-30 | At&T Corp. | Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels |
JP3435674B2 (ja) | 1994-05-06 | 2003-08-11 | 日本電信電話株式会社 | 信号の符号化方法と復号方法及びそれを使った符号器及び復号器 |
DE19638997B4 (de) * | 1995-09-22 | 2009-12-10 | Samsung Electronics Co., Ltd., Suwon | Digitales Toncodierungsverfahren und digitale Toncodierungsvorrichtung |
-
1996
- 1996-07-12 DE DE19628292A patent/DE19628292B4/de not_active Expired - Lifetime
-
1997
- 1997-06-03 JP JP50553798A patent/JP3622982B2/ja not_active Expired - Lifetime
- 1997-06-03 US US09/214,656 patent/US6771777B1/en not_active Expired - Lifetime
- 1997-06-03 ES ES97925036T patent/ES2143868T3/es not_active Expired - Lifetime
- 1997-06-03 KR KR1019980710868A patent/KR100316582B1/ko not_active IP Right Cessation
- 1997-06-03 EP EP97925036A patent/EP0910927B1/de not_active Expired - Lifetime
- 1997-06-03 WO PCT/EP1997/002874 patent/WO1998003036A1/de active IP Right Grant
- 1997-06-03 AU AU30318/97A patent/AU712196B2/en not_active Expired
- 1997-06-03 AT AT97925036T patent/ATE188832T1/de active
- 1997-06-03 PT PT97925036T patent/PT910927E/pt unknown
- 1997-06-03 CA CA002260090A patent/CA2260090C/en not_active Expired - Lifetime
- 1997-06-03 DK DK97925036T patent/DK0910927T3/da active
- 1997-06-03 DE DE59701014T patent/DE59701014D1/de not_active Expired - Lifetime
-
1999
- 1999-01-11 NO NO19990106A patent/NO317570B1/no not_active IP Right Cessation
-
2000
- 2000-01-20 GR GR20000400139T patent/GR3032444T3/el unknown
Also Published As
Publication number | Publication date |
---|---|
ATE188832T1 (de) | 2000-01-15 |
NO990106D0 (no) | 1999-01-11 |
AU712196B2 (en) | 1999-10-28 |
AU3031897A (en) | 1998-02-09 |
ES2143868T3 (es) | 2000-05-16 |
DE19628292A1 (de) | 1998-01-15 |
EP0910927B1 (de) | 2000-01-12 |
GR3032444T3 (en) | 2000-05-31 |
NO317570B1 (no) | 2004-11-15 |
PT910927E (pt) | 2000-04-28 |
WO1998003036A1 (de) | 1998-01-22 |
EP0910927A1 (de) | 1999-04-28 |
JP3622982B2 (ja) | 2005-02-23 |
JP2000505266A (ja) | 2000-04-25 |
KR20000022435A (ko) | 2000-04-25 |
DE59701014D1 (de) | 2000-02-17 |
DE19628292B4 (de) | 2007-08-02 |
US6771777B1 (en) | 2004-08-03 |
CA2260090C (en) | 2000-10-17 |
DK0910927T3 (da) | 2000-05-08 |
CA2260090A1 (en) | 1998-01-22 |
NO990106L (no) | 1999-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100316582B1 (ko) | 스테레오포닉스펙트럼값의부호화및복호화프로세스 | |
KR100299528B1 (ko) | 인텐서티-스테레오 프로세스와 예측 프로세스를 이용한 오디오신호의 부호화/복호화 장치 및 그 방법 | |
JP3878952B2 (ja) | オーディオ信号コーディング中にノイズ置換を信号で知らせる方法 | |
US6529604B1 (en) | Scalable stereo audio encoding/decoding method and apparatus | |
FI112979B (fi) | Digitaalisen datan erittäin tehokas koodauslaite | |
KR100395190B1 (ko) | 신호 부호화 또는 복호화 장치, 및 신호 부호화 또는복호화 방법 | |
EP1101289B1 (en) | Method for inserting auxiliary data in an audio data stream | |
JP3449715B2 (ja) | 多次元音場のための符号器・復号器 | |
KR100419546B1 (ko) | 신호부호화방법및장치,신호복호화방법및장치,및신호전송방법 | |
US20070271095A1 (en) | Audio Encoder | |
JPH06149292A (ja) | 高能率符号化方法及び装置 | |
WO1995027335A1 (fr) | Methode et dispositif de codage et de decodage d'informations, methode de transmission d'informations et support d'enregistrement de l'information | |
JPH0865169A (ja) | 符号化方法及び装置、復号化装置、並びに記録媒体 | |
CA2002015C (en) | Perceptual coding of audio signals | |
JPH0685765A (ja) | ディジタル伝達システムにおける送信機,受信機及び記録担体 | |
Davidson | Digital audio coding: Dolby AC-3 | |
JPH061916B2 (ja) | 帯域分割符号化復号化装置 | |
JP3854313B2 (ja) | 複数の情報信号のエンコーディング | |
JPH0519798A (ja) | 信号処理装置 | |
JP3827720B2 (ja) | 差分コーディング原理を用いる送信システム | |
JPH09135173A (ja) | 符号化装置および符号化方法、復号化装置および復号化方法、伝送装置および伝送方法、並びに記録媒体 | |
EP0573103B1 (en) | Digital transmission system | |
JP2000091921A (ja) | エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、ディジタル信号送信方法及びディジタル信号送信装置 | |
JPH11272294A (ja) | エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置 | |
JPH09102741A (ja) | 符号化方法および装置、復号化方法および装置、並びに記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20121112 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20131119 Year of fee payment: 13 |
|
FPAY | Annual fee payment |
Payment date: 20141118 Year of fee payment: 14 |
|
FPAY | Annual fee payment |
Payment date: 20151123 Year of fee payment: 15 |
|
FPAY | Annual fee payment |
Payment date: 20161116 Year of fee payment: 16 |
|
EXPY | Expiration of term |