KR100316582B1 - 스테레오포닉스펙트럼값의부호화및복호화프로세스 - Google Patents

스테레오포닉스펙트럼값의부호화및복호화프로세스 Download PDF

Info

Publication number
KR100316582B1
KR100316582B1 KR1019980710868A KR19980710868A KR100316582B1 KR 100316582 B1 KR100316582 B1 KR 100316582B1 KR 1019980710868 A KR1019980710868 A KR 1019980710868A KR 19980710868 A KR19980710868 A KR 19980710868A KR 100316582 B1 KR100316582 B1 KR 100316582B1
Authority
KR
South Korea
Prior art keywords
stereo
section
audio
codebook
intensity
Prior art date
Application number
KR1019980710868A
Other languages
English (en)
Other versions
KR20000022435A (ko
Inventor
존스톤 제임스
Original Assignee
에이티 앤 티 러보러토리이즈/리서치
슈베르트 헬무트
프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
루슨트 테크놀러지즈, 벨 러보러토리이즈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=7799742&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR100316582(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 에이티 앤 티 러보러토리이즈/리서치, 슈베르트 헬무트, 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베., 루슨트 테크놀러지즈, 벨 러보러토리이즈 filed Critical 에이티 앤 티 러보러토리이즈/리서치
Publication of KR20000022435A publication Critical patent/KR20000022435A/ko
Application granted granted Critical
Publication of KR100316582B1 publication Critical patent/KR100316582B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

스테레오-오디오 스펙트럼값을 부호화하는 방법은 첫째, 환산계수가 결합된 환산계수 밴드(28)에 상기 스테레오-오디오 스펙트럼값들을 그룹화한다. 다음으로 각각이 적어도 하나의 환산계수 밴드(28)를 구비한 섹션들이 형성된다. 상기 스펙트럼값들은 각각이 코드북 숫자(code book number)를 가진 다수의 코드북(code book)들로부터 섹션에 지정된 코드북(code book)을 가지고 적어도 하나의 섹션 내에 부호화된다. 상기 코드북 숫자는 상기 섹션에 지정되며, 상기 코드북의 숫자는 부 정보(side information)로서 부호화된 스테레오-오디오 스펙트럼값에 전송되는데 사용된다. 코드북을 나타내지는 않으나 그것이 할당된 섹션에 관한 정보블 보여주는 적어도 하나의 부가적인 코드북 숫자가 제공된다. 스테레오-오디오 스펙트럼값을 복호화하는 방법은 부가적인 코드북 숫자를 나타내는 관련 정보를 사용하여 스테레오-오디오 스펙트럼값의 이미 존재하는 부호화된 값들을 환원시킨다.

Description

스테레오포닉 스펙트럼값의 부호화 및 복호화 프로세스
MPEG 레이어 3 표준에 따라 작동하는, 가장 진보된 오디오 부호화/복호화 프로세스는 디지털 오디오 신호의 데이터를 그 품질을 그다지 저하시키지 않고서도 예를 들어 12의 인수배로 압축할 수 있다.
좌측 채널 L과 우측 채널 R과 같은 각각의 채널에서의 큰 부호화 이득(coding gain)은 차치하고서라도, 위 두 채널의 상대적인 여분(redundancy)과 무관성(irrelavance)은 스테레오의 경우에도 이용된다. 이미 사용되어지는 공지의 방법은 소위 MS 스테레오 프로세스(MS = 센터 사이드)와 인텐서티 스테레오 프로세스(IS 프로세스)이다.
통상의 MS 스테레오 프로세스는 실질적으로 두 채널의 합과 두 채널 사이의 차를 계산한 후 이를 좌측 채널과 우측 채널 각각에 변조된 채널 데이터로서 전송함으로써 두 채널의 상대적 여분을 이용한다. 다시 말해, MS 스테레오 프로세스는 정확한 재생과정을 거친다.
MS 스테레오 프로세스와는 달리, 인텐서티 스테레오 프로세스는 주로 스테레오 무관성(stereo irrelevance)을 이용한다. 스테레오 무관성과 관련하여 인간의 청각 시스템의 공간적 인식과정은 인식되는 오디오 신호의 주파수에 의존한다. 낮은 주파수에서는 두 개의 스테레오 신호의 양 정보(amount information)와 위상 정보(phase information) 모두가 인간의 청각 시스템에 의해 평가되고, 고주파수 성분의 인식은 주로 양 채널의 에너지-시간 포락선(envelope)의 분석에 기초하여 이뤄진다. 따라서, 양 채널 신호의 정확한 위상 정보는 공간적 인식에 관계하지 않는다. 이러한 인간의 청각의 특징은 스테레오 무관성을 이용하여 인텐서티 스테레오 프로세스에 의해 오디오 신호의 데이터를 더 감소시키는 데 사용된다.
높은 주파수에서 스테레오 인텐서티 프로세스가 정확한 위치 정보를 분석할 수 없을 때, 부호기에서 정의된 인텐서티 주파수 한계(intensity frequency limit)로부터 두 개의 각각의 스테레오 채널 L, R 대신에 양 채널에 대한 결합 에너지 포락선(joint energy envelope)을 전송하는 것이 가능하다. 결합 에너지 포락선에 덧붙여 역시 개략적으로 양자화(quantization)된 방향 정보가 부 정보(side information)로 역시 전송된다.
인텐서티 스테레오 부호화 프로세스가 이용될 때 하나의 채널만이 부분적으로 전송되는 경우 비트수의 절감은 약 50%까지이다. 그러나, IS 프로세스는 복호기에서 정확한 재생을 이룰 수 없다는 것을 유의해야 한다.
지금까지 MPEG 레이어 3 표준에서 채택된 IS 프로세스에서, IS 프로세스가 스테레오-오디오 스펙트럼값의 블록에 적용된다는 사실은 소위 mode_extension_bit에 의해 알 수 있으며, 각 블록은 그것에 할당된 mode_extension_bit를 가진다.
도 1에는 공지의 IS 프로세스의 이론적 표현이 도시되어 있다. 채널 L(10)과 채널 R(12)의 스테레오-오디오 스펙트럼값이 합산점(summation point)(14)에서 합쳐져 양 채널에 대한 에너지 포락선 I=Li+Ri가 얻어진다. 여기서, Li와 Ri는 임의의 환산계수 밴드(scale factor band)에서의 채널 L, R의 각각의 스테레오-오디오 스펙트럼값을 나타낸다. 전술한 바와 같이, IS 프로세스를 사용하는 것은 어떤 IS 주파수 한계 이상에서만 허용된다. 이는 부호화 에러(coding error)가 부호화된 스테레오-오디오 스펙트럼값에 삽입되는 것을 방지하기 위해 필요하다. 따라서, 좌우 채널은 0 Hz로부터 IS 주파수 한계 내에서 별도로 부호화되어야 한다. 이러한 IS 주파수 한계는 본 발명의 일부를 이루지 않는 별개의 알고리즘에 의해 결정된다. 이 주파수 한계 이상에서 부호기는 합산점(14)에서 형성된 좌측 채널(10)과 우측 채널(12)의 합산값을 부호화한다.
채널 L의 환산정보(scaling information)(16)와 채널 R의 환산정보(18)는 예를 들어, 부호화된 좌측채널로 전송될 수 있는 에너지 포락선, 즉, 좌우 채널의 합산 신호와 함께 복호화에 필요하다. 좌우 채널에 대한 환산계수는 예를 들어 MPEG 레이어 2에서 수행되는 것과 같은 인텐서티 스테레오 프로세스에서 전송되어진다. 그러나, IS 부호화 스테레오-오디오 스펙트럼값(IS-coded stereo audio spectrum value)에 대한 MPEG 레이어 3의 IS 프로세스에서 인텐서티 방향 정보(intensity direction information)는 단지 우측 채널로서만 전송되고, 위 스펙트럼값은 이 정보와 함께 다시 후술하는 바와 같이 복호화된다.
환산계수(16)(18)는 채널 L과 R의 부호화된 스펙트럼값에 덧붙여 부 정보로서 전송된다. 복호화된 채널 L(20)과 채널 R(22)에서 복호화된 오디오 신호값은 복호기에 의해 전달되고, 원래의 부호화된 스테레오-오디오 스펙트럼값을 복호화하기 위한 수단으로서의 L 승산기(24)와 R 승산기(26)에서 채널 R의 환산 정보(16)와 채널 L의 환산 정보(18)에 각 채널의 복호화된 스테레오-오디오 스펙트럼값이 곱해진다.
IS 부호화가 어떤 IS 주파수 한계 이상에서 적용되거나 MS 부호화가 그 한계 이하에서 적용되기 전에 각 채널에 대한 스테레오-오디오 스펙트럼값은 소위 환산계수 밴드로 그룹화된다. 위 밴드들은 청각 시스템의 인식 특성에 따라 조절된다. 각 밴드는 부가 계수, 즉, 소위 환산계수에 의해 증폭될 수 있다. 위 환산계수는 도 1의 환산 정보(16)(18)의 일부를 구성하고, 특정 채널에 대한 부 정보로서 전송된다. 이 계수들에 의하여 양자화(quantization)에 의해 도입된 간섭 잡음이 심리-음향학적(psycho-acoustic)으로 차단되어 들리지 않게 형성될 수 있다.
도 2a는 MPEG 레이어 3 오디오 부호화 프로세스에 사용되는 부호화된 우측 채널 R의 포맷을 나타낸다. 이하 어떠한 인텐서티 스테레오 프로세스에 대한 언급도 MPEG 레이어 3 표준 프로세스와 관계가 있다. 스테레오-오디오 스펙트럼값이 그룹화되어 포함된 개개의 환산계수 밴드(28)가 도 2a의 첫째줄에 개략적으로 나타나있다. 도 2a에서 이러한 밴드들은 편의상 폭이 동일하게 도시되어 있으나 실제로 이들 폭들은 청각 시스템의 심리-음향학적 특성들 때문에 동일하지 않을 것이다.
도 2a의 둘째줄은 IS 주파수 한계(32) 아래에서 0이 아닌, 부호화된 스테레오-오디오 스펙트럼값 sp들을 포함한다. IS 주파수 한계(IS frequency limit) 이상의 우측 채널의 스테레오-오디오 스펙트럼값들은 전술한 바와 같이 0 (zero_part) nsp로 설정된다 (nsp=zero spectrum).
도 2a의 셋째줄은 우측 채널에 대한 부 정보(34)의 일부를 포함한다. 최초로 도시된 위 부 정보(34)의 일부는 IS 주파수 한계(32) 아래 범위에 대한 환산계수 skf와 IS 주파수 한계(32) 이상의 범위에 대한 방향정보 rinfo(36)로 구성된다. 방향정보는 인텐서티 스테레오 프로세스에서 IS 부호화 주파수 영역을 위치에 관하여 대략적으로 분석하는데 이용된다. 따라서, 인텐서티 포지션(is_pos)으로도 일컬어지는 방향정보 rinfo(36)는 환산계수 대신에 우측 채널로 전송된다. 환산계수 밴드(28)에 대응하는 환산계수(34)는 IS 주파수 한계 아래의 우측 채널에 여전히 존재하고 있음을 유의해야 한다. 인텐서티 포지션(36)은 각각의 환산계수 밴드(28) 내에서 신호원(signal source)의 인식된 스테레오 이미징 포지션(stereo imaging position)(좌측 대 우측의 비율)을 나타낸다. IS 주파수 한계 이상의 각 밴드(28)에서 전송된 스테레오-오디오 스펙트럼값의 복호화값들은 아래의 좌측채널의 환산계수(kL)와 우측채널의 환산계수(kR)를 가지고 MPEG 레이어 3 프로세스에 의하여 크기가 조정된다:
kL= is_ratio/(1+is_ratio) (1)
kR= 1/(1+is_ratio) (2)
is_ratio에 대한 수식은 다음과 같다:
is_ratio = tan(is_pos·π/12) (3)
is_pos 값은 3 bit로 표현되고, 0에서 6까지의 값만이 유효한 위치값이 된다. 좌우 채널은 다음 두 식에서와 같이 I 신호(I=Li+Ri)로부터 유도될 수 있다:
Ri= I·is_ratio/(1+is_ratio) = I·kL(4)
Li= I·1/(1+is_ratio) = I·kR(5)
Ri와 Li는 인텐서티 스테레오 프로세스에서 복호화된 스테레오-오디오 스펙트럼값들을 나타낸다. 여기서, 영 스펙트럼보다는 오히려 결합된 스펙트럼 I=Li+Ri이 좌측채널의 Is 주파수 한계(32) 이상에서 발견되고 방향정보 is_pos보다는 오히려 일반적인 환산계수가 좌측채널에 대하여 존재함에도 불구하고, 좌측 채널의 포맷은 도 2a에 도시된 우측 채널 포맷과 유사하다. 우측 채널에서 영이 아닌, 양자화된 총 스펨트럼값으로부터 0값들로의 전이는 MPEG 레이어 3 표준에서 복호기에 대한 IS 주파수 한계를 암시적으로 알려줄 수 있다.
따라서, 전송된 채널 L은 부호기에서 좌우 채널의 합으로 계산되고, 전송된 방향정보는 아래의 식과 같이 정의될 수 있다:
is_pos = nint[arctan(√EL/√ER)·12/π) (6)
nint[x] 함수는 "다음의 전수(全數)(next whole number)" 함수를 나타내고, EL과 ER는 좌우채널의 각각의 환산계수 밴드에서의 에너지를 나타낸다. 부호기/복호기에서의 이러한 공식들은 좌우 채널에서의 개략적인 신호 재생을 나타낸다.
전술한 바와 같이 공지의 오디오 부호화 프로세스(audio coding process)에서는 스테레오-오디오 스펙트럼값들이 청각 시스템의 인지 특성에 따라 적응된 환산계수 밴드로 그룹화되어 있다. MPEG 레이어 3 표준에 따른 오디오 부호화 프로세스에서는 동일한 신호통계(signal statistics)를 가지고 영역을 그룹화할 목적으로 위 환산계수 밴드를 정확하게 3 영역으로 나눈다. 이는 공지의 허프만 부호화(Huffman coding) 방식에 의하여 과잉 부분(redundancy)을 줄이는데 유리하다. 환산계수 밴드(28)의 각 영역에 대해서 다수개의 허프만 테이블 중 하나가 선택되고, 선택되어진 허프만 테이블에 의하여 허프만 부호화 프로세스를 거쳐 과잉 부분을 감소시키는데 있어서 큰 이득을 얻게 된다. 위 테이블은 부호화된 데이터의 비트 스트림(bit stream)에서 각 영역에 대한 5-비트의 값들로 나타내어진다. 30개의 다른 테이블이 존재하고, 테이블 4와 14는 공백(blank)으로 되어 있다.
현재 표준화된 비역방향 호환성 NBC 부호화 프로세스(non-backward compatible NBC coding process)는 위 프로세스의 비트 스트림에 대해 정확하게 3 영역의 환산계수 밴드가 허용되다는 점뿐만 아니라 다수의 소위 "섹션"들이 존재하고 위 섹션들이 다수의 환산계수 밴드를 구비한다는 점에서 특히 MPEG 레이어 3 표준 오디오 부호화 프로세스와는 다르다. MPEG 레이어 3에서의 전술한 프로세스와 유사하게 하나의 섹션은 과잉 부분을 최대한 줄이기 위해 그 섹션에 할당된 다수의 허프만 테이블로부터 적절한 허프만 테이블 하나를 선택하고 이를 복호화하는데 이용한다. 극단적인 경우 하나의 섹션은 단 하나의 환산계수 밴드를 가질 수도 있다. 그러나, 이러한 경우는 너무 많은 부 정보(side information)들이 요구되기 때문에실제로 일어날 가능성은 희박하다. NBC 프로세스에서는 모두 4-비트로 전송되는 모두 16개의 허프만 코드북 숫자(Huffman code book number)가 있다. 따라서, 현재의 12개의 코드북 수들 중 하나가 선택되어질 수 있다.
본 발명의 목적은 부호화 및 복호화에 관련된 정보가 부 정보를 최소한으로 사용하면서 표시될 수 있는, 스테레오-오디오 스펙트럼값의 부호화 및 복호화 방법을 제공하는 것이다.
전술한 문제점은 청구항 1에 따른 스테레오-오디오 스펙트럼값의 부호화 방법과, 청구항 2에 따른, 인텐서티 스테레오 프로세스에 의해 일부가 부호화된 스테레오-오디오 스펙트럼값의 복호화 방법에 의해 해결된다.
본 발명은 코드북을 나타내는데 사용되지 않는 부가적인 코드북 숫자가 섹션에 관한 다른 정보를 나타낼 수 있다는 사실에 기반을 두고 있다. "부가적인" 코드북 숫자란 코드북을 나타내지 않는 숫자이다. 4-bit 부호화에 의해 12개의 다른 코드북 숫자와, 숫자 13, 14 및 15는 어느 정도 자유롭게 다른 정보를 포함할 수 있다. 바람직하게는 3개의 부가적인 코드북 숫자(숫자 13, 14, 15) 중 2개(숫자 14, 15)는 첫째로는 섹션에 있는 인텐서티 부호화(intensity coding)를 나타내고, 다음으로는 두 개의 스테레오 채널의 IS 부호화 스테레오-오디오 스펙트럼값의 상호 위상 포지션(mutual phase position)을 나타내는데 사용된다.
아직 사용되지 않은 부가적인 코드북 숫자 13은 적응형 허프만 부호화를 나타내는데 사용된다.
본 발명은 오디오 신호의 부호화 및 복호화에 관한 것으로 보다 상세하게는 인텐서티-스테레오 부호화가 활성화(active)되어 있다는 사실을 나타내는 방법에 관한 것이다.
본 발명의 바람직한 실시예는 다음의 첨부된 도면을 참고하여 설명된다.
도 1은 인텐서티 스테레오 프로세스를 사용하는 부호화/복호화 다이어그램에 있어서의 신호흐름을 나타낸다.
도 2a는 MPEG 레이어 3 표준에 따른, 우측 채널에 대한 스테레오 인텐서티 부호화가 있을 때의 데이터 포맷을 나타낸다.
도 2b는 MPEG-NBC 프로세스에 따른, 우측 채널에 대한 스테레오 인텐서티 부호화가 있을 때의 데이터 포맷을 나타낸다.
도 3은 본 발명의 복호기의 블록회로도이다.
본 발명의 첫 번째 실시예는 인텐서티 스테레오 프로세스에 의해 일부가 부호화된 스테레오-오디오 스펙트럼값을 부호화 및 복호화하는 방법이 섹션 내에 인텐서티 스테레오 부호화가 존재한다는 것을 새롭게 알려주는 것이다. 본 발명에 따르면 다시 16개의 코드북 숫자가 있다. 그러나, 종래기술과는 달리 처음 12개의 숫자(1~12)만이 실제 코드북(real code book)에 대응된다. 마지막 2개의 코드북 숫자들은 스테레오 인텐서티 프로세스가 그 숫자와 관련된 섹션 내에서 사용되고 있다는 것을 알려주는데 이용된다.
도 2b는 MPEG2-NBC 프로세스를 사용하는 스테레오 인텐서티 부호화를 포함하는, 우측채널 R에 대한 데이터의 포맷을 나타낸다. 도 2a 또는 MPEG 레이어 3 프로세스와의 차이점은 MPEG 레이어 2-NBC 프로세스의 사용자가 각각의 섹션, 즉, IS 주파수 한계(32) 이상까지 미치는, 하나 이상의 환산계수 밴드의 일 그룹에 대해 선택적으로 스테레오-오디오 스펙트럼값들의 인텐서티 스테레오 부호화 프로세스를 "연결"하거나 "연결을 끊을 수 있는" 융통성을 가진다는 점이다. 따라서, NBC 프로세스에서 IS 부호화 프로세스는 IS 주파수 한계 이상에서도 연결 또는 연결되지 않을 수 있기 때문에 IS 주파수 한계는 MPEG 레이어 3과 비교하여 실질적으로 진정한 의미의 주파수 한계는 아니며, 이는 MPEG 레이어 3에서는 가능하지 않다. 다시 말해, MPEG 레이어 3에서는 IS 부호화가 존재할 때 IS 주파수 한계 이상의 스테레오-오디오 스펙트럼값이 스펙트럼 범위의 최상위까지 IS 프로세스에 의해 부호화되는 것이 필수적이었다. 새로운 NBC 프로세스는 IS 주파수 한계 이상까지의 전 범위에 대해 IS 부호화를 활성화시킬 필요가 없다. 즉, 지시가 있다면 IS 부호화 프로세스는 연결이 끊어지게 된다. 본 발명에 따르면 섹션에 대한 비트 스트림 규약이 어떤 경우에든 전송되는 코드북 숫자를 요구하기 때문에 지시 작업이 이루어질 때 부 정보 또는 "오버헤드(overhead)"가 증가되지 않는다.
우측채널에 대한 IS 부호화를 가진 섹션에 전송된 환산계수들 역시 종래기술에서처럼 인텐서티 방향 정보(intensity direction information)(36)를 구성하며, 위 계수들 역시 차분 및 허프만 부호화(differential and Huffman coding) 방식에 의해 처리된다. 전술한 바와 같이, IS 부호화되지 않은 환산계수 밴드에서는 우측채널에 스테레오-오디오 스펙트럼값들보다는 오히려 영 스펙트럼이 있게 된다. 좌측 채널은 IS 부호화 섹션에서의 좌우측 채널에 대한 합산신호를 포함하게 된다. 그러나, 이 합산신호는 IS 복호화 이후 각각의 환산계수 밴드 내의 에너지가 좌측 채널의 에너지와 같아지도록 표준화된다. 따라서, 복호기에서 사용된 IS 부호화의 경우 좌측 채널은 변화되지 않은 채 처리될 수 있으며, 일부러 재환산 명세(re-scaling specification)에 의하여 판단할 필요가 없다. 우측 채널의 스테레오-오디오 스펙트럼값들은 우측 채널의 부 정보에 포함된 인텐서티 방향 정보 is_pos (36)를 사용하여 좌측채널의 스테레오-오디오 스펙트럼값들로부터 유도할 수 있다.
전술한 바와 같이, 종래의 스테레오 인텐서티 프로세스는 단지 진폭, 즉 인텐서티에서만 차이가 나는 좌우측 채널에 대한 두 개의 코히어런트 신호를 준다. 이때, 위 코히어런트 신호는 방향 정보 is_pos(36)(식 (4)와 (5))에 의존한다.
본 발명에서는 인텐서티 스테레오 프로세스의 존재가 두 개의 비실제적 코드북 숫자에 의해 나타내어지기 때문에 두 채널 간의 위상관계가 포함될 수 있다. 만약 두 채널이 동일 위상을 갖는 상태에 있다면, 본 발명의 복호기에서 수행되는 역계산 명세(calculating-back specification)는 다음과 같다:
Ri= 0.5^(0.25·is_pos(sfb))·Li(7)
반면, 위상이 반대가 되는 상태에 있다면 스펙트럼에 -1이 곱해져 아래와 같이 우측 채널에 대한 식으로 나타내어진다:
Ri= (-1)·0.5^(0.25·is_pos(sfb))·Li(7)
위 두 식에서 Ri는 역계산, 즉 복호화된 우측 채널의 스테레오-오디오 스펙트럼값을 나타내고, sfb는 방향정보 is_pos(36)와 관련된 환산계수 밴드(28)를 나타내며, Li는 복호기에서 변화되지 않은 채로 얻어지는 좌측 채널의 스테레오-오디오 스펙트럼값을 나타낸다.
코드북 숫자 15는 최초의 역계산 공식(calculating-back formula)이 사용되는지 여부를 나타내고, 숫자 14는 두 번째의 역계산 공식이 사용되는지, 즉, 두 개의 채널의 위상이 반대인지 여부를 나타낸다. 본 발명에서 "동일 위상(in phase)" 또는 "반대 위상(in phase opposition)"이라는 표현이 넓은 의미로 사용되고 있다는 점은 해당분야의 통상의 기술자에게 자명할 것이다. 예를 들어, 위상 분별기(phase discriminator)가 제공될 수 있다. 위 위상분별기는 주어진 초기값이 90°일 때 신호들의 위상이 반대라고 판단하며, 위상차가 90°이하일 때는 위상이 같은 것으로 여긴다.
전술한 첫 번째 실시예에서 두 채널의 상대적인 위상 포지션(phase position)은 적어도 하나의 환산계수 밴드를 구비한 섹션에 대한 코드북 숫자 14 또는 15에 의해 결정될 수 있다. IS 및 위상 표시(phase indication)에 의해 생성된 부 정보는 하나의 섹션에 대해 8 비트로 구성되어 있으며, 4 비트는 섹션 길이에 대해 할당되고, 4 비트는 코드북 숫자 14 또는 15에 대해 할당된다. 만약 좌우측 채널의 환산계수 밴드에서 위상 포지션이 자주 변하는 오디오 신호를 부호화해야 한다면, 하나의 환산계수 밴드에서 다른 환산계수 밴드까지의 각각의 위상 포지션이 반전될 때마다 새로운 섹션이 시작되어야 한다. 따라서, 위상 포지션이 자주 변하는 신호는 매우 많은 섹션을 가지며, 각 섹션은 관련된 코드북 숫자를 통하여 두 채널의 스테레오-오디오 스펙트럼값들의 위상이 일치하거나 반대라는 것을 알려주게 된다. 결국 바람직하지 못한 신호는 많은 수의 섹션과 많은 양의 부 정보를 가지게 된다.
본 발명의 두 번째 실시예는 인텐서티 부호화가 활성화되어 있는 섹션에서 위상 포지션의 환산계수 밴드 부호화를 가능하게 한다. 두 번째 실시예에 따른 위 발명에 의해, 섹션 수 및 추가적인 지출 없이 후술하는 MS 마스크(MS mask)를 사용하여 위상 포지션의 환산계수 밴드 부호화를 실행할 수 있다.
하나의 환산계수 밴드에서 미들-사이드 프로세스(middle-side process)와 인텐서티 스테레오 프로세스가 상호 배타적이라는 것은 해당 분야의 통상의 기술자에게 자명하다. 즉, 두 프로세스는 "직교(orthogonal)"를 이룬다.
스테레오-오디오 스펙트럼값의 MS 부호화가 비스 스트림에서 사용되면, 지시 비트(indication bit)가 부 정보에 적절히 설정되고 전체 MS 부호화를 연결한다. 비트의 설정은 MS 비트 마스크가 전송되어 각각의 환산계수 밴드(scfbd)에 대해 MS 부호화가 연결 또는 연결되지 않게 한다는 것을 의미한다. MS 비트 마스크의 한 비트는 각 환산계수 밴드에 지정되어 있기 때문에 비트 마스크의 길이는 밴드 수에 대응하게 된다.
IS가 활성화되어 있는 환산계수 밴드에서는 MS 부호화가 활성화되어서는 안 되기 때문에, MS 환산계수 정보가 반드시 위 환산계수 밴드에 있을 필요는 없다. MS 비트 마스크는 그 영역 내에서 다른 지시 목적으로 사용될 수 있다. 따라서, MS 비트 마스크를 이용하여 IS 부호화의 세세한 부분까지를 나타내는 것이 가능하다. 첫 번째 실시예에서처럼 하나의 섹션에서 채널의 위상 포지션에 대한 IS 부호화 정보가 코드북 숫자 14 및 15에 의하여 주어진다. 위 숫자들은 또한 IS 부호화가 섹션 내에서 실제로 활성되어 있다는 점을 나타낸다.
본 발명의 첫 번째 실시예와는 달리, 두 번째 실시예에서 MS 비트 마스크는 환산계수 밴드가 하나의 섹션에서 다른 위상 포지션들을 가질 수 있도록 하기 위해 사용된다. IS 부호화가 한 섹션에서 활성화되어 있다는 것을 나타내는 코드북 숫자와 관련하여, MS 비트 마스크의 기능은 그 섹션에서 개개의 환산계수 밴드의 위상 포지션을 나타내는 것이다. 만약 어떤 환산계수 밴드에 대하여 MS 비트 마스크의 한 비트가 설정되어 있지 않다면(예를 들어, 0이라면), 그 환산계수 밴드를 포함하는 섹션에 대한 코드북 숫자에 의해 나타내어지는 위상 정보는 유지될 것이다. 반면, 만약 그 환산계수 밴드에 대하여 MS 비트 마스크의 한 비트가 설정되어 있으면(예를 들어, 1이라면), 그 환산계수 밴드를 포함하는 섹션에 대한 코드북 숫자에 의해 나타내어지는 위상 정보는 반대가 될 것이다. 따라서, 기본적으로 코드북 숫자에 의해 표시되는 위상 포지션과 MS 비트 마스크 사이에는 EXCLUSIVE-OR 기능이 있다.
좀더 구체적으로, 코드북 숫자와 MS 비트 마스크로부터 계산된, IS 부호화가 사용되는 섹션 내에 포함되는 환산계수 밴드에서의 두 스테레오 채널 L과 R의 위상관계는 다음과 같다:
코드북 숫자(한 섹션당) 15 15 14 14
MS 비트 마스크(한 환산계수 밴드당) 0 1 0 1
L과 R의 위상 포지션 180° 180°
역계산 공식 식 (7) 식 (8) 식 (8) 식 (7)
전술한 본 발명의 두 번째 실시예는 서로 다른 위상 포지션의 스테레오-오디오 스펙트럼값을 갖는 환산계수 밴드가 "하나의" 섹션에 나타날 수 있게 하며, 그에 의해 첫 번째 실시예에서보다 더 적은 섹션들이 부호화를 위해 형성되게 된다. 따라서, 더 적은 부 정보들이 전송되어지게 된다.
전술한 실시예와는 달리, 한 섹션에 관련된 기타 정보 역시 부가적인 코드북 숫자들에 의해 나타내어질 수 있다.
예를 들어, 한 섹션에 관련된 기타 정보는 한 섹션에서 적응형 허프만 부호화를 사용하는지에 대한 참조(reference)가 될 수 있다. 적응형 허프만 부호화를 가졌을 때, 적응형 허프만 테이블이 신호 통계(signal statistics)에 따라 생성될 수 있다. 코드북 숫자 13은 부호기가 12개의 고정형 허프만 테이블 중 어느 것도 사용하지 않고, 복호기에 미리 알려지 있지 않은, 적응형의 테이블 하나를 사용하도록 지시한다. 이것은 한 섹션의 신호 통계가 영구적으로 미리 정해진 고정형 허프만 테이블 중 하나에 의해 최적으로 부호화, 즉, 압축될 수 없을 때 유리하다. 따라서, 부호화는 위 12개의 고정형 테이블에 구속되지 않고 신호 통계에 최적으로 적응된 테이블을 사용할 수 있다. 적응형 코드북(adaptive code book)에 대한 정보가 부가적인 부 정보로서 전송된다.
부호화에 사용된 적응형 허프만 테이블을 유도하기 위해 복호기는 이 부가적인 부 정보를 필요로 하며, 이에 따라 허프만 부호화 스테레오-오디오 스펙트럼값(Huffman-coded stereo audio spectral value)들은 정확하게 복호화될 수 있다.
도 3은 본 발명의 복호화 방법을 수행할 수 있는 복호기의 간단한 블록회로도이다. 인텐서티 스테레오 프로세스에 의하여 부분적으로 부호화된 오디오 스펙트럼값들은 각각의 역양자화기(reverse quantiser)(38)(40)에 수용되고, 역양자화기(38)(40)는부호화 과정시 실행된 양자화 처리를 환원시킨다. 다음 역양자화된 스테레오-오디오 스펙트럼값들은 MS 복호기(42)로 들어간다. MS 복호기(42)는 부호기에서 실행된 미들-사이드 부호화를 환원시킨다. IS 복호기(44)는 전술한 역계산 공식 (7)과 (8)을 사용하여 IS 부호화 환산계수 밴드에 대한 원래의 스테레오-오디오 스펙트럼값을 다시 얻는다. 좌우측 채널에 대한 각각의 역변환 수단(re-conversion means)이 스테레오-오디오 스펙트럼값들을 스테레오-오디오 시간값(stereo audio time value) L(t), R(t)로 변환한다. 위 역변환 수단(46)(48)이 예를 들어 역-MDCT에 의해 동작한다는 것은 해당분야의 통상의 기술자에게 자명하다.

Claims (18)

  1. 스테레오-오디오 스펙트럼값(stereo audio spectrum value)의 부호화 방법에 있어서,
    환산계수(scale factor)(34)가 결합된 환산계수 밴드(scale factor band)의 상기 스테레오-오디오 스펙트럼값을 그룹화하는 단계;
    각각이 적어도 하나의 환산계수 밴드(28)를 포함하는 섹션들을 형성하는 단계; 그리고,
    각각에 대해 하나의 숫자가 지정된 다수의 코드북(code book)들 중 적어도 하나의 섹션에 할당된 하나의 코드북을 가진 하나 이상의 섹션 내에서 스테레오-오디오 스펙트럼값을 부호화하고, 상기 코드북의 숫자는 부호화된 스테레오-오디오 스펙트럼값에 부 정보(side information)로서 전송되는데 사용되는 단계를 구비하고,
    코드북을 나타내지는 않으나, 할당된 섹션에 관한 정보를 나타내는 적어도 하나의 부가적인 코드북 숫자(code book number)가 제공되며, 상기 섹션에는 부가적인 코드북 숫자가 지정되며, 또한 하나의 섹션은 부 정보의 양에 영향을 미치지 않고 코드북 숫자나 상기 섹션에 할당된 적어도 하나의 부가적인 코드북 숫자를 가지는 것을 특징으로 하는 스테레오-오디오 스펙트럼값을 부호화하는 방법.
  2. 상기 부호화된 스테레오-오디오 스펙트럼값의 각 섹션에 대한 부 정보를 기초로 하여 코드북 숫자를 감지하는 단계;
    코드북을 사용하여 한 섹션의 스테레오-오디오 스펙트럼값을 복호화 하며, 상기 섹션의 코드북 숫자는 대응되는 상기 코드북을 나타내는 단계;를 구비한 부호화된 스테레오-오디오 스펙트럼값의 복호화방법에 있어서,
    코드북을 나타내지는 않으나, 할당된 다른 섹션에 관한 정보를 나타내는 적어도 하나의 부가적인 코드북 숫자를 가지고 상기 나타나는 정보에 따라서 상기 다른 섹션의 스테레오-오디오 스펙트럼값을 복호화하며, 상기 다른 섹션에는 상기 부가적인 코드북 숫자가 지정되는 단계를 더 포함하는 것을 특징으로 하는 부호화된 스테레오-오디오 스펙트럼값의 복호화 방법.
  3. 제 1항에 있어서,
    적어도 하나의 부가적인 코드북 숫자가 연관된 섹션의 스테레오-오디오 스펙트럼값의 인텐서티 스테레오 프로세스에 의한부호화를 나타내는 것을 특징으로 하는 스테레오-오디오 스펙트럼값의 부호화 방법.
  4. 제 1항 내지 제 3항에 있어서,
    적어도 하나의 부가적인 코드북 숫자가 연관된 섹션의 스테레오-오디오 스펙트럼값의 적응형 허프만 부호화를 나타내는 것을 특징으로 하는 스테레오-오디오 스펙트럼값의 부호화 방법.
  5. 제 1항 또는 제 3항에 있어서,
    인텐서티 스테레오 프로세스에 의해 부호화된 섹션에 대해 상기 적어도 하나의 부가적인 코드북 숫자가 두 스테레오 채널 간의 위상관계도 나타내는 것을 특징으로 하는 스테레오-오디오 스펙트럼값의 부호화 방법.
  6. 제 5항에 있어서,
    두 개의 부가적인 코드북 숫자 중 하나는 두 스테레오 채널의 동일한 위상 포지션을 나타내고, 이 경우 아래의 역계산 공식(calculating-back formula)이 인텐서티 복호화를 지원하며,
    Ri= 0.5(0.25·is_pos(sfb))·Li ,
    여기서, Ri는 우측 채널(R)의 스테레오-오디오 스펙트럼값을 나타내고, is_pos는 현재 고려되는 환산계수 밴드 sfb의 인텐서티 방향 정보를 나타내며, Li는 좌측 채널(L)의 스테레오-오디오 스펙트럼값을 나타내는 것을 특징으로 하는 스테레오-오디오 스펙트럼값의 부호화 방법.
  7. 제 5항에 있어서,
    두 개의 부가적인 코드북 숫자 중 하나는 두 스테레오 채널의 반대 위상 포지션을 나타내고, 이 경우 아래의 역계산 공식(calculating-back formula)이 인텐서티 복호화를 지원하며,
    Ri = (-1)·0.5(0.25·is_pos(sfb))·Li ,
    여기서, Ri는 우측 채널(R)의 스테레오-오디오 스펙트럼값을 나타내고, is_pos는 현재 고려되는 환산계수 밴드 sfb의 인텐서티 방향 정보를 나타내며, Li는 좌측 채널(L)의 스테레오-오디오 스펙트럼값을 나타내는 것을 특징으로 하는 스테레오-오디오 스펙트럼값의 부호화 방법.
  8. 제 1항 또는 제 3항에 있어서,
    인텐서티 스테레오 프로세스가 좌측 채널에서 좌우측 채널의 스테레오-오디오 스펙트럼값의 표준화된 합산 신호를 형성하고, 우측채널에서는 스펙트럼이 0이고 인텐서티 방향 정보가 부 정보로서 부호화되는 것을 특징으로 하는 스테레오-오디오 스펙트럼값의 부호화 방법.
  9. 제 1항 내지 제 3항에 있어서,
    각 환산계수를 가진 비트 마스크가 사용되고, 하나의 환산계수 밴드에 대한 비트 마스크 상의 하나의 비트가 두 개의 부가적인 코드북 숫자 중 하나가 지정된 섹션의 부가적인 코드북으로 게이트(gate)됨으로써 두 스테레오 채널에 대한 위상 관계를 결정하는 것을 특징으로 하는 스테레오-오디오 스펙트럼값의 부호화 방법.
  10. 제 9항에 있어서,
    상기 비트 마스크는 MS 비트 마스크이고, 상기 부가적인 코드북 숫자들은EXCLUSIVE-OR 게이트에 의하여 MS 비트 마스크 환산계수 밴드와 연결되어 있는 것을 특징으로 하는 스테레오-오디오 스펙트럼값의 부호화 방법.
  11. 제 2항에 있어서,
    적어도 하나의 부가적인 코드북 숫자와 연관된 섹션의 스테레오-오디오 스펙트럼값의 인텐서티 스테레오 프로세스에 의한 부호화를 나타내는 것을 특징으로 하는 부호화된 스테레오-오디오 스펙트럼값의 복호화 방법.
  12. 제 2항 또는 제 11항에 있어서,
    적어도 하나의 부가적인 코드북 숫자가 연관된 섹션의 스테레오-오디오 스펙트럼 값의 적응형 허프만 부호를 나타내는 것을 특징으로 하는 부호화된 스테레오-오디오 스펙트럼값의 복호화 방법.
  13. 제 2항 또는 제 11항에 있어서,
    인텐서티 스테레오 프로세스에 의해 부호화된 섹션에 대해 상기 적어도 하나의 부가적인 코드북 숫자가 두 스테레오 채널 간의 위상관계도 나타내는 것을 특징으로 하는 부호화된 스테레오-오디오 스펙트럼값의 복호화 방법.
  14. 제 13항에 있어서,
    두 개의 부가적인 코드북 숫자 중 하나는 두 스테레오 채널의 동일한 위상포지션을 나타내고, 이 경우 아래의 역계산 공식(calculatin-back formula)이 인텐서티 복호화를 지원하며,
    Ri=0.5(0.25·is_pos(sfb))·Li,
    여기서, Ri는 우측 채널(R)의 스테레오-오디오 스펙트럼값을 나타내고, is_pos는 현재 고려되는 환산계수 밴드 sfb의 인텐서티 방향 정보를 나타내며, Li는 좌측 채널(L)의 스테레오-오디오 스펙트럼값을 나타내는 것을 특징으로 하는 부호화된 스테레오-오디오 스펙트럼값의 복호화 방법.
  15. 제 13항에 있어서,
    두 개의 부가적인 코드북 숫자 중 하나는 두 스테레오 채널의 반대 위상 포지션을 나타내고, 이 경우 아래의 역계산 공식(calculating-back formula)이 인텐서티 복호화를 지원하며,
    Ri=(-1)·0.5(0.25·is_pos(sfb))·Li,
    여기서, Ri는 우측 채널(R)의 스테레오-오디오 스펙트럼값을 나타내고, is_pos는 현재 고려되는 환산계수 밴드 sfb의 인텐서티 방향 정보를 나타내며, Li는 좌측 채널(L)의 스테레오-오디오 스펙트럼값을 나타내는 것을 특징으로 하는 부호화된 스테레오-오디오 스펙트럼값의 복호화 방법.
  16. 제 2항 또는 제 11항에 있어서,
    인텐서티 스테레오 프로세스가 좌측 채널에서 좌우측 채널의 스테레오-오디오 스펙트럼값의 표준화된 합산 신호를 형성하고, 우측채널에서는 스펙트럼이 0이고 인텐서티 방향 정보가 부 정보로서 부호화되는 것을 특징으로 하는 부호화된 스테레오-오디오 스펙트럼값의 복호화 방법.
  17. 제 2 항 또는 제 11항에 있어서,
    각 환산계수를 가진 비트 마스크가 사용되고, 하나의 환산계수 밴드에 대한 비트 마스크 상의 하나의 비트가 두 개의 부가적인 코드북 숫자 중 하나가 지정된 섹션의 부가적인 코드북으로 게이트(gate)됨으로써 두 스테레오 채널에 대한 위상관계를 결정하는 것을 특징으로 하는 부호화된 스테레오-오디오 스펙트럼값의 복호화 방법.
  18. 제 17항에 있어서,
    상기 비트 마스크는 MS 비트 마스크이고, 상기 부가적인 코드북 숫자들은 EXCLUSIVE-OR 게이트에 의하여 MS 비트 마스크 환산계수 밴드와 연결되어 있는 것을 특징으로 하는 부호화된 스테레오-오디오 스펙트럼 값의 복호화 방법.
KR1019980710868A 1996-07-12 1997-06-03 스테레오포닉스펙트럼값의부호화및복호화프로세스 KR100316582B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE19628292.6 1996-07-12
DE19628292A DE19628292B4 (de) 1996-07-12 1996-07-12 Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten
PCT/EP1997/002874 WO1998003036A1 (de) 1996-07-12 1997-06-03 Verfahren zum codieren und decodieren von stereoaudiospektralwerten

Publications (2)

Publication Number Publication Date
KR20000022435A KR20000022435A (ko) 2000-04-25
KR100316582B1 true KR100316582B1 (ko) 2002-02-28

Family

ID=7799742

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980710868A KR100316582B1 (ko) 1996-07-12 1997-06-03 스테레오포닉스펙트럼값의부호화및복호화프로세스

Country Status (14)

Country Link
US (1) US6771777B1 (ko)
EP (1) EP0910927B1 (ko)
JP (1) JP3622982B2 (ko)
KR (1) KR100316582B1 (ko)
AT (1) ATE188832T1 (ko)
AU (1) AU712196B2 (ko)
CA (1) CA2260090C (ko)
DE (2) DE19628292B4 (ko)
DK (1) DK0910927T3 (ko)
ES (1) ES2143868T3 (ko)
GR (1) GR3032444T3 (ko)
NO (1) NO317570B1 (ko)
PT (1) PT910927E (ko)
WO (1) WO1998003036A1 (ko)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
US6735561B1 (en) * 2000-03-29 2004-05-11 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
US7099830B1 (en) 2000-03-29 2006-08-29 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
ATE387044T1 (de) * 2000-07-07 2008-03-15 Nokia Siemens Networks Oy Verfahren und vorrichtung für die perzeptuelle tonkodierung von einem mehrkanal tonsignal mit verwendung der kaskadierten diskreten cosinustransformation oder der modifizierten diskreten cosinustransformation
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
WO2003046891A1 (en) 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7016547B1 (en) 2002-06-28 2006-03-21 Microsoft Corporation Adaptive entropy encoding/decoding for screen capture content
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7433824B2 (en) * 2002-09-04 2008-10-07 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
ATE543179T1 (de) 2002-09-04 2012-02-15 Microsoft Corp Entropische kodierung mittels anpassung des kodierungsmodus zwischen niveau- und lauflängenniveau-modus
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7782954B2 (en) 2003-09-07 2010-08-24 Microsoft Corporation Scan patterns for progressive video content
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US7688894B2 (en) * 2003-09-07 2010-03-30 Microsoft Corporation Scan patterns for interlaced video content
KR20050027179A (ko) * 2003-09-13 2005-03-18 삼성전자주식회사 오디오 데이터 복원 방법 및 그 장치
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JPWO2006004048A1 (ja) * 2004-07-06 2008-04-24 松下電器産業株式会社 オーディオ信号符号化装置、オーディオ信号復号化装置、方法、及びプログラム
EP1866911B1 (en) * 2005-03-30 2010-06-09 Koninklijke Philips Electronics N.V. Scalable multi-channel audio coding
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7693709B2 (en) 2005-07-15 2010-04-06 Microsoft Corporation Reordering coefficients for waveform coding or decoding
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
KR100851970B1 (ko) * 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7684981B2 (en) 2005-07-15 2010-03-23 Microsoft Corporation Prediction of spectral coefficients in waveform coding and decoding
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7599840B2 (en) * 2005-07-15 2009-10-06 Microsoft Corporation Selectively using multiple entropy models in adaptive coding and decoding
US7565018B2 (en) * 2005-08-12 2009-07-21 Microsoft Corporation Adaptive coding and decoding of wide-range coefficients
US8599925B2 (en) 2005-08-12 2013-12-03 Microsoft Corporation Efficient coding and decoding of transform blocks
US7933337B2 (en) 2005-08-12 2011-04-26 Microsoft Corporation Prediction of transform coefficients for image compression
US7953604B2 (en) 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8184710B2 (en) 2007-02-21 2012-05-22 Microsoft Corporation Adaptive truncation of transform coefficient data in a transform-based digital media codec
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US7774205B2 (en) * 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
KR101444102B1 (ko) * 2008-02-20 2014-09-26 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
US8179974B2 (en) 2008-05-02 2012-05-15 Microsoft Corporation Multi-level representation of reordered transform coefficients
US8406307B2 (en) 2008-08-22 2013-03-26 Microsoft Corporation Entropy coding/decoding of hierarchically organized data
JP6061121B2 (ja) 2011-07-01 2017-01-18 ソニー株式会社 オーディオ符号化装置、オーディオ符号化方法、およびプログラム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3310480C2 (de) * 1983-03-23 1986-02-13 Seitzer, Dieter, Prof. Dr.-Ing., 8520 Erlangen Digitales Codierverfahren für Audiosignale
JPS59188764A (ja) 1983-04-11 1984-10-26 Hitachi Ltd メモリ装置
DE3943879B4 (de) 1989-04-17 2008-07-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
JP3131249B2 (ja) 1991-08-23 2001-01-31 日本放送協会 混合音声信号受信装置
CA2090052C (en) 1992-03-02 1998-11-24 Anibal Joao De Sousa Ferreira Method and apparatus for the perceptual coding of audio signals
EP0559348A3 (en) 1992-03-02 1993-11-03 AT&T Corp. Rate control loop processor for perceptual encoder/decoder
DE4236989C2 (de) * 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
JP3292522B2 (ja) 1992-11-25 2002-06-17 京セラ株式会社 携帯電話機
JP3150475B2 (ja) 1993-02-19 2001-03-26 松下電器産業株式会社 量子化方法
US5581653A (en) 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
DE4331367C2 (de) * 1993-09-15 1996-04-18 Lewin Martin Innenmuffe zur Dichtung von Rohrstößen in Rohrleitungen
DE4331376C1 (de) 1993-09-15 1994-11-10 Fraunhofer Ges Forschung Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
US5488665A (en) 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
JP3435674B2 (ja) 1994-05-06 2003-08-11 日本電信電話株式会社 信号の符号化方法と復号方法及びそれを使った符号器及び復号器
DE19638997B4 (de) * 1995-09-22 2009-12-10 Samsung Electronics Co., Ltd., Suwon Digitales Toncodierungsverfahren und digitale Toncodierungsvorrichtung

Also Published As

Publication number Publication date
ATE188832T1 (de) 2000-01-15
NO990106D0 (no) 1999-01-11
AU712196B2 (en) 1999-10-28
AU3031897A (en) 1998-02-09
ES2143868T3 (es) 2000-05-16
DE19628292A1 (de) 1998-01-15
EP0910927B1 (de) 2000-01-12
GR3032444T3 (en) 2000-05-31
NO317570B1 (no) 2004-11-15
PT910927E (pt) 2000-04-28
WO1998003036A1 (de) 1998-01-22
EP0910927A1 (de) 1999-04-28
JP3622982B2 (ja) 2005-02-23
JP2000505266A (ja) 2000-04-25
KR20000022435A (ko) 2000-04-25
DE59701014D1 (de) 2000-02-17
DE19628292B4 (de) 2007-08-02
US6771777B1 (en) 2004-08-03
CA2260090C (en) 2000-10-17
DK0910927T3 (da) 2000-05-08
CA2260090A1 (en) 1998-01-22
NO990106L (no) 1999-03-10

Similar Documents

Publication Publication Date Title
KR100316582B1 (ko) 스테레오포닉스펙트럼값의부호화및복호화프로세스
KR100299528B1 (ko) 인텐서티-스테레오 프로세스와 예측 프로세스를 이용한 오디오신호의 부호화/복호화 장치 및 그 방법
JP3878952B2 (ja) オーディオ信号コーディング中にノイズ置換を信号で知らせる方法
US6529604B1 (en) Scalable stereo audio encoding/decoding method and apparatus
FI112979B (fi) Digitaalisen datan erittäin tehokas koodauslaite
KR100395190B1 (ko) 신호 부호화 또는 복호화 장치, 및 신호 부호화 또는복호화 방법
EP1101289B1 (en) Method for inserting auxiliary data in an audio data stream
JP3449715B2 (ja) 多次元音場のための符号器・復号器
KR100419546B1 (ko) 신호부호화방법및장치,신호복호화방법및장치,및신호전송방법
US20070271095A1 (en) Audio Encoder
JPH06149292A (ja) 高能率符号化方法及び装置
WO1995027335A1 (fr) Methode et dispositif de codage et de decodage d'informations, methode de transmission d'informations et support d'enregistrement de l'information
JPH0865169A (ja) 符号化方法及び装置、復号化装置、並びに記録媒体
CA2002015C (en) Perceptual coding of audio signals
JPH0685765A (ja) ディジタル伝達システムにおける送信機,受信機及び記録担体
Davidson Digital audio coding: Dolby AC-3
JPH061916B2 (ja) 帯域分割符号化復号化装置
JP3854313B2 (ja) 複数の情報信号のエンコーディング
JPH0519798A (ja) 信号処理装置
JP3827720B2 (ja) 差分コーディング原理を用いる送信システム
JPH09135173A (ja) 符号化装置および符号化方法、復号化装置および復号化方法、伝送装置および伝送方法、並びに記録媒体
EP0573103B1 (en) Digital transmission system
JP2000091921A (ja) エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、ディジタル信号送信方法及びディジタル信号送信装置
JPH11272294A (ja) エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
JPH09102741A (ja) 符号化方法および装置、復号化方法および装置、並びに記録媒体

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121112

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20131119

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20141118

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20151123

Year of fee payment: 15

FPAY Annual fee payment

Payment date: 20161116

Year of fee payment: 16

EXPY Expiration of term