KR20050007312A - 시간-이산 오디오 신호를 부호화하기 위한 장치 및 방법그리고 부호화 오디오 데이터를 복호화하기 위한 장치 및방법 - Google Patents
시간-이산 오디오 신호를 부호화하기 위한 장치 및 방법그리고 부호화 오디오 데이터를 복호화하기 위한 장치 및방법 Download PDFInfo
- Publication number
- KR20050007312A KR20050007312A KR10-2004-7016744A KR20047016744A KR20050007312A KR 20050007312 A KR20050007312 A KR 20050007312A KR 20047016744 A KR20047016744 A KR 20047016744A KR 20050007312 A KR20050007312 A KR 20050007312A
- Authority
- KR
- South Korea
- Prior art keywords
- block
- integer
- time
- audio data
- quantization
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 77
- 238000000034 method Methods 0.000 title claims abstract description 54
- 230000003595 spectral effect Effects 0.000 claims abstract description 170
- 238000013139 quantization Methods 0.000 claims abstract description 91
- 238000006243 chemical reaction Methods 0.000 claims description 35
- 238000012545 processing Methods 0.000 claims description 33
- 238000001228 spectrum Methods 0.000 claims description 24
- 239000011159 matrix material Substances 0.000 claims description 19
- 230000002123 temporal effect Effects 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 238000007493 shaping process Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 5
- 230000009466 transformation Effects 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 238000007667 floating Methods 0.000 description 6
- 230000002441 reversible effect Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000013144 data compression Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000002592 echocardiography Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 241001122767 Theaceae Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
Description
Claims (33)
- 심리음향(psychoacoustic) 모델(54)을 사용하여 양자화된 시간-이산 오디오 신호의 스펙트럼 값(spectral values)의 양자화 블록(quantization block)을 제공하기 위한 수단(52)과;라운드된 역양자화 스펙트럼 값(rounded inversely quantized spectral values)의 라운딩 블록(rounding block)을 획득하도록 상기 양자화 블록을 역양자화하고 역양자화된 스펙트럼 값을 라운딩하기 위한 수단(58)과;정수 시간-이산 샘플(integer time-discrete samples)의 블록으로부터 스펙트럼 값의 정수 블록(integer block)을 발생하도록 형성된 정수 변환 알고리즘(integer transform algorithm)을 사용하여 정수 스펙트럼 값의 정수 블록을 발생시키기 위한 수단(56)과;차분 스펙트럼 값(difference spectral values)을 갖는 차분 블록(difference block)을 얻기 위하여, 상기 라운딩 블록과 정수 블록의 스펙트럼 값의 차분(spectral value-wise difference)에 따라 하나의 차분 블록을 생성하기 위한 결합 수단(combination means)(58)과;상기 양자화 블록의 정보와 차분 블록의 정보를 포함하는 부호화 오디오 데이터를 생성하기 위하여 상기 양자화 블록과 차분 블록을 처리(processing) 하기 위한 수단(60)을 포함하여 구성되는, 부호화 오디오 데이터를 얻기 위한 시간-이산 오디오 신호 부호화 장치.
- 제1항에 있어서, 상기 양자화 블록 제공 수단(52)이,MDCT를 통해 시간적 오디오 신호(temporal audio signal)값의 시간 블록에서 MDCT 스펙트럼 값의 MDCT 블록을 형성하고, 양자화된 MDCT 스펙트럼 값으로 구성되는 양자화 블록을 생성하도록, 심리음향 모델을 사용하여 상기 MDCT 블록을 양자화하도록 형성된, 부호화 오디오 데이터를 얻기 위한 시간-이산 오디오 신호 부호화 장치.
- 제2항에 있어서, 상기 정수 블록을 발생시키기 위한 수단(56)이,IntMDCT 스펙트럼 값으로 구성되는 정수 블록을 형성하기 위하여 상기 시간 블록에 IntMDCT를 실행하도록 형성된, 부호화 오디오 데이터를 얻기 위한 시간-이산 오디오 신호 부호화 장치.
- 앞의 청구항들 중 어느 한 항에 있어서, 상기 양자화 블록 제공 수단(52)이,부동소수점 변환 알고리즘(floating-point transform algorithm)을 사용하여 양자화 블록을 계산하도록 형성된, 부호화 오디오 데이터를 얻기 위한 시간-이산 오디오 신호 부호화 장치.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 제공 수단(52)이,상기 발생 수단(56)에 의해 발생된 정수 블록을 사용하여 양자화 블록을 계산하도록 형성된, 부호화 오디오 데이터를 얻기 위한 시간-이산 오디오 신호 부호화 장치.
- 앞의 청구항들중의 어느 한 항에 있어서, 상기 프로세싱 수단(60)이,엔트로피-부호화된 양자화 블록(entropy-coded quantization block)을 얻기 위하여 양자화 블록을 엔트로피 부호화시키고(60a),엔트로피-부호화된 라운딩 블록을 얻기 위하여 라운딩 블록을 엔트로피 부호화시키며(60b),엔트로피-부호화된 양자화 블록을 부호화 오디오 데이터를 표시하는 스케일 데이터 스트림(scaled data stream)의 제1 스케일링 레이어(scaling layer)로, 엔트로피-부호화된 라운딩 블록을 스케일 데이터 스트림의 제2 스케일링 레이어로 전환시키도록 형성된, 부호화 오디오 데이터를 얻기 위한 시간-이산 오디오 신호 부호화 장치.
- 제6항에 있어서, 상기 프로세싱 수단(60)이 또한,양자화 블록의 엔트로피 부호화를 위한 양자화 스펙트럼 값에 의존하는 다수의 부호 테이블들 중 하나를 사용하기 위해 형성되고, 차분 블록의 엔트로피 부호화를 위한 양자화 블록을 생성시키기 위해 양자화에 사용가능한 양자화기(quantizer)의 특성에 의존하는 다수의 부호 테이블들 중의 하나를 선택하도록 형성된, 부호화 오디오 데이터를 얻기 위한 시간-이산 오디오 신호 부호화 장치.
- 앞의 청구항들중의 어느 한 항에 있어서,상기 양자화 블록 제공 수단(52)이, 오디오 신호의 특성에 의존하는 오디오 신호 값의 시간 블록(temporal block)을 윈도우화(windowing)하기 위해 다수의 윈도우들 중의 하나를 사용하도록 형성되고,상기 발생 수단(56)이 상기 정수 변환 알고리즘을 위해 상기 시간블록을 윈도우화하기 위해 사용할 윈도우와 같은 윈도우를 선택하도록 형성된, 부호화 오디오 데이터를 얻기 위한 시간-이산 오디오 신호 부호화 장치.
- 제1항 내지 제8항 중 어느 한 항에 있어서,상기 발생 수단이,N개의 입력값으로 N개의 출력값을 발생시킬 수 있는 변환(transform)을 통한 시간-이산 샘플의 스펙트럼 표시로의 전환을 위해 윈도우 처리된 시간-이산 샘플들을 제공하도록, 2N 시간-이산 샘플들에 상응하는 길이를 갖는 윈도우(w)로 상기 시간-이산 샘플들을 윈도우화하는 단계로서,시간-이산 샘플들의 벡터를 얻기 위해 윈도우의 하나의 4분면으로부터 하나의 시간-이산 샘플 그리고 윈도우의 다른 4분면으로부터의 하나의 시간-이산 샘플을 선택하는 소단계(16)와,제1 결과 벡터(result vector)를 얻기 위하여 상기 벡터를 리프팅 매트릭스로 곱하는 부분 단계(18)와, 라운드된 제1 결과 벡터를 얻기 위하여 하나의 실수를하나의 정수로 맵핑(mapping)하는 라운딩 함수(r)로 제1 결과 벡터의 하나의 성분(component)을 라운딩하는 부분 단계(20)를 포함하며, 각기 윈도우(w)에 의존하고 1 또는 0이 아닌 단 하나의 요소(element)를 포함하여 구성되는 다수의 리프팅 매트릭스로 표시될 수 있고, 그 차원(dimension)이 상기 벡터의 차원과 동일한 스퀘어 전환 매트릭스(square rotation matrix)를 상기 벡터에 적용하는 소단계와,윈도우의 하나의 4분면으로부터 얻어진 정수 윈도우 샘플과 윈도우의 다른 4분면으로부터 얻어진 정수 윈도우 샘플을 포함하여 구성되는 하나의 순환 벡터(rotated vector)를 얻기 위하여 모든 리프팅 매트릭스(lifting matrices)들이 처리될 때까지 리프팅 매트릭스로 곱하고(22) 라운딩하는(24) 단계를 연속적으로 실행하는 소단계와, 그리고2N개의 필터링 정수 값(filtered integer values)을 얻기 위하여 남아 있는 윈도우4분면들의 모든 시간-이산 샘플들에 대해 윈도우 처리하는 단계를 수행하는 소 단계를 포함하는 단계와; 그리고N개의 정수 스펙트럼 값을 얻기 위하여 윈도우의 제2 4분면과 윈도우의 제3 4분면의 필터링된 정수 샘플들을 갖는 값들에 대한 정수 DCT처리에 의해 N개의 윈도우 처리된 정수 샘플들을 스펙트럼 표시(representation)로 전환하는 단계(14)를 포함하여 구성된 정수 변환 알고리즘을 사용하기 위해 형성된 것인, 부호화 오디오 데이터를 얻기 위한 시간-이산 오디오 신호 부호화 장치.
- 앞의 청구항들중의 어느 한 항에 있어서,상기 양자화 블록을 제공하는 수단(52)이, 양자화 후에 양자화 블록을 표시할 수 있도록 하는 예측 잔류 스펙트럼 값(prediction residual spectral values)을 얻기 위하여, 양자화 단계(52b) 이전에 예측 필터를 사용하여 주파수에 대한 스펙트럼 값(spectral values over the frequency)을 예측하도록 형성되고;상기 정수 블록의 정수 스펙트럼 값의 주파수에 대한 예측을 하도록 형성된 예측 수단과, 라운딩 블록을 표시할 수 있도록 하는 정수 스펙트럼 값으로 예측 잔류 스펙트럼 값을 라운딩하기 위한 라운딩 수단이 더 구비된, 부호화 오디오 데이터를 얻기 위한 시간-이산 오디오 신호 부호화 장치.
- 앞의 청구항들중 어느 한 항에 있어서,상기 시간-이산 오디오 신호가 적어도 두 개의 채널을 포함하여 구성되고;상기 제공 수단(52)이 중심/측면 스펙트럼 값의 양자화 후의 양자화 블록을 얻기 위하여 시간-이산 오디오 신호의 스펙트럼 값으로 중심/측면(center/side) 부호화를 실행하도록 형성되며; 그리고상기 정수 블록을 발생시키는 수단(56)이 상기 제공 수단(52)의 중심/측면 부호화에 상응하는 중심/측면 부호화를 또한 실행하도록 형성된, 부호화 오디오 데이터를 얻기 위한 시간-이산 오디오 신호 부호화 장치.
- 앞의 청구항들중 어느 한 항에 있어서,상기 프로세싱 수단(60)이 MPEG-2 AAC 데이터 스트림을 발생시키도록 형성되고, ㅂ조 데이터(Ancillary Data)내의 하나의 필드에 정수 변환 알고리즘을 위한 보조 정보(ancillary information)가 도입되는, 부호화 오디오 데이터를 얻기 위한 시간-이산 오디오 신호 부호화 장치.
- 앞의 청구항들중 어느 한 항에 있어서,상기 프로세싱 수단(60)이, 상기 부호화 오디오 데이터들을 다수의 스케일링 레이어들을 갖는 데이터 스트림으로 출력하도록 형성된, 부호화 오디오 데이터를 얻기 위한 시간-이산 오디오 신호 부호화 장치.
- 제13항에 있어서,상기 프로세싱 수단(60)이, 양자화 블록의 정보를 제1 스케일링 레이어(81)로 삽입하고, 차분 블록의 정보를 제2 스케일링 레이어(82)로 삽입하도록 형성된, 부호화 오디오 데이터를 얻기 위한 시간-이산 오디오 신호 부호화 장치.
- 제13항에 있어서,상기 프로세싱 수단(60)이, 양자화 블록의 정보를 제1 스케일링 레이어(81)로 삽입하고, 차분 블록의 정보를 적어도 제2 및 제3 스케일링 레이어로 삽입하도록 형성된, 부호화 오디오 데이터를 얻기 위한 시간-이산 오디오 신호 부호화 장치.
- 제15항에 있어서,정확도가 저하된(with reduced accuracy) 차분 스펙트럼 값이 제2 스케일링 레이어에 포함되고, 상기 차분 스펙트럼 값의 나머지 부분(residual part)이 하나 또는 그 이상의 상위 스케일링 레이어(higher scaling layers)에 포함되는, 부호화 오디오 데이터를 얻기 위한 시간-이산 오디오 신호 부호화 장치.
- 제15항 또는 제16항에 있어서,상기 차분 블록의 정보가 이진 부호화 차분 스펙트럼 값(binarily coded difference spectral values)을 포함하고,상기 차분 블록을 위한 제2 스케일링 레이어가 차분 스펙트럼 값에 대한 최상위 비트(most significant bit; MSB)로부터 하위 비트(less significant bit; MSB-x)까지의 다수의 비트를 포함하며, 그리고제3 스케일링 레이어가 하위 비트(less significant bit; MSB-x-1)로부터 최하위 비트(least significant bit; LSB)까지의 다수의 비트를 포함하는, 부호화 오디오 데이터를 얻기 위한 시간-이산 오디오 신호 부호화 장치.
- 제17항에 있어서,시간-이산 오디오 신호가 24 비트의 폭(width)을 갖는 샘플의 형태로 존재하고,상기 프로세싱 수단(60)이, 차분 스펙트럼 값의 더 유효한 16 비트를 제2 스케일링 레이어에 삽입하고, 상기 차분 스펙트럼 값의 잔류 8 비트를 제3 스케일링 레이어에 삽입하여, 복호기(decoder)가 제2 스케일링 레이어를 사용하여 CD 음질(quality)에 도달하도록 하고 제3 스케일링 레이어를 또한 사용하여 스튜디오 음질(studio quality)에 도달하도록 형성된, 부호화 오디오 데이터를 얻기 위한 시간-이산 오디오 신호 부호화 장치.
- 제15항에 있어서,상기 프로세싱 수단(60)이,저역 통과 신호(low-pass signal)의 표시를 위해 하나의 차분 스펙트럼 값의 적어도 일부를 제2 스케일링 레이어에 삽입하고,제2 스케일링 레이어의 차분 스펙트럼 값과 원래의 차분 스펙트럼 값(original difference spectral values) 사이의 차분(difference)을 적어도 하나의 추가 스케일링 레이어로 삽입하도록 형성된, 부호화 오디오 데이터를 얻기 위한 시간-이산 오디오 신호 부호화 장치.
- 제15항 또는 제19항에 있어서,상기 프로세싱 수단(60)이, 특정(a certain) 차단 주파수(cut-off frequency)까지의 차분 스펙트럼 값의 적어도 일부를 제2 스케일링 레이어에 삽입하고, 상기 특정 차단 주파수로부터 그 보다 높은 주파수까지의 차분 스펙트럼 값의 적어도 일부를 제3 스케일링 레이어에 삽입하도록 형성된, 부호화 오디오 데이터를 얻기 위한 시간-이산 오디오 신호 부호화 장치.
- 심리음향 모델(54)을 사용하여 양자화된 시간-이산 오디오 신호의 스펙트럼 값의 양자화 블록을 제공하는 단계(52)와;라운드된 역양자화 스펙트럼 값의 라운딩 블록을 얻기 위하여 상기 양자화 블록을 역양자화하고 역양자화 스펙트럼 값을 라운딩하는 단계(58)와;정수 시간-이산 샘플의 블록으로부터 스펙트럼 값의 정수 블록을 발생시키도록 형성된 정수 변환 알고리즘을 사용하여 정수 스펙트럼 값의 정수 블록을 발생시키는 단계(56)와;차분 스펙트럼 값을 갖는 차분 블록을 얻기 위하여 라운딩 블록과 정수 블록의 스펙트럼 값 차분(a spectral value-wise difference)에 따른 차분 블록을 형성하는 단계(58)와;양자화 블록의 정보와 차분 블록의 정보를 포함하는 부호화 오디오 데이터를 발생시키기 위하여 양자화 블록과 차분 블록을 처리하는 단계(60)를 포함하여 구성되는, 부호화 오디오 데이터를 얻기 위한 시간-이산 오디오 신호 부호화 방법.
- 심리음향 모델(54)을 사용하여 양자화된 시간-이산 오디오 신호의 스펙트럼 값의 양자화 블록을 제공하고(52), 라운드된 역양자화 스펙트럼 값의 양자화 블록을 얻기 위하여 양자화블록을 역양자화하고 역양자화 스펙트럼값을 라운딩하며(58), 정수 시간-이산 샘플들로부터 스펙트럼 값의 정수 블록을 발생시키도록 형성된 정수 변환 알고리즘을 사용하여 정수 스펙트럼값의 정수블록을 발생시키고(56), 그리고 차분 스펙트럼 값을 갖는 차분 블록을 얻기 위하여 라운딩 블록과 정수 블록의 스펙트럼 값 차분에 따라 하나의 차분 블록을 형성함(58)에 의해 시간-이산 오디오 신호로부터 발생된 부호화 오디오 데이터를 복호화하기 위한 장치에 있어서,하나의 양자화 블록과 하나의 차분 블록을 얻기 위하여 부호화 오디오 데이터를 처리하기 위한 수단(70)과;하나의 정수 역양자화된 양자화 블록(integer inversely quantized quantization block)을 얻기 위하여 양자화 블록을 역양자화하고 라운딩하기 위한 수단(74)과;하나의 결합 블록을 얻기 위하여, 정수 양자화 블록과 차분 블록을 스펙트럼 관련 값으로 결합시키기 위한 수단(78)과; 그리고결합 블록을 사용하고 상기 정수 변환 알고리즘의 역 정수 변환 알고리즘을 사용하여 시간-이산 오디오 신호의 시간 표시(temporal representation)를 발생시키기 위한 수단(82)을 포함하여 구성되는, 시간-이산 오디오 신호로부터 발생된 부호화 오디오 데이터 복호화 장치.
- 제22항에 있어서,상기 부호화 오디오 데이터가 스케일되고(scaled), 복수의 스케일링 레이어들을 포함하며,상기 부호화 오디오 데이터로부터 양자화 블록을 제1 스케일링 레이어로 확인하고(ascertain) 부호화 오디오 데이터로부터의 차분 블록을 제2 스케일링 레이어로 확인하도록 형성된, 시간-이산 오디오 신호로부터 발생된 부호화 오디오 데이터 복호화 장치.
- 제22항에 있어서,차분 블록의 정보가 이진 부호화 차분 스펙트럼 값을 포함하고;상기 부호화 오디오 데이터가 스케일되고 다수의 스케일링 레이어들을 포함하며;상기 부호화 오디오 데이터를 처리하기 위한 수단(70)이 부호화 오디오 데이터로부터 얻어진 양자화 블록을 제1 스케일링 레이어로 확인하고 정확도가 저하된(with reduced accuracy) 차분 스펙트럼 값의 표시(representation)를 제2 스케일링 레이어로 추출하도록(extract) 형성된, 시간-이산 오디오 신호로부터 발생된 부호화 오디오 데이터 복호화 장치.
- 제24항에 있어서,상기 부호화 오디오 데이터를 처리하기 위한 수단(70)이, 최상위 비트(a most significant bit)로부터 차분 스펙트럼 값의 최하위 비트보다는 더 중요한(more significant) 하위 비트(a less significant bit)까지의 다수의 비트를 제2 스케일링 레이어로 추출하도록 형성되고, 그리고시간-이산 오디오 신호의 시간 표시를 발생시키기 위한 수단(82)이 정수 변환 알고리즘의 사용 전에 차분 스펙트럼 값을 위한 분실 비트(missing bits)를 합성적으로(synthetically) 발생시키도록 형성된, 시간-이산 오디오 신호로부터 발생된 부호화 오디오 데이터 복호화 장치.
- 제25항에 있어서,상기 수단(82)이, 2n(여기서 n은 제2스케일링 레이어에 포함되지 않은 하위 비트들의 수이다)과 동일한 하나의 스케일 계수(scale factor)가 사용되는, 합성적 발생(synthetical generation)을 위한 제2 스케일링 레이어의 업스케일링(upscaling)을 실행하거나, 또는 종합적 발생을 위한 디더링 알고리즘(dithering algorithm)을 사용하도록 형성된, 시간-이산 오디오 신호로부터 발생된 부호화 오디오 데이터 복호화 장치.
- 제22항에 있어서,상기 부호화 오디오 데이터가 스케일되고(scaled), 다수의 스케일링 레이어들을 포함하며,상기 부호화 오디오 데이터를 처리하기 위한 수단(70)이 부호화 오디오 데이터로부터 얻어진 양자화 블록을 제1 스케일링 레이어로 확인하고, 저역 필터링된 차분 스펙트럼 값을 제2 스케일링 레이어로 확인하도록 형성된, 시간-이산 오디오신호로부터 발생된 부호화 오디오 데이터 복호화 장치.
- 제22항 또는 제27항에 있어서,상기 부호화 오디오 데이터가 스케일되고 다수의 스케일링 레이어들을 포함하며,상기 부호화 오디오 데이터를 처리하기 위한 수단(70)이 부호화 데이터의 양자화 블록을 제1 스케일링 레이어로 확인하고, 하나의 부호기(corder)에서 발생될 수 있는 차분 스펙트럼 값의 최대 주파수보다 더 작은 제1 차단 주파수까지의 차분 스펙트럼 값을 제2 스케일링 레이어로 확인하도록 형성된, 시간-이산 오디오 신호로부터 발생된 부호화 오디오 데이터 복호화 장치.
- 제28항에 있어서,하나의 시간 표시를 발생시키기 위한 수단(82)이, 제2 스케일링 레이어의 차단 주파수 전체 길이(full length)에 대한 정수 변환 알고리즘내의 입력값을 예정값(a predetermined value)으로 셋팅하고, 하나의 부호기에 의해 발생될 수 있는 차분 스펙트럼 값의 최대 주파수와 차단 주파수의 비율에 상응하여 선택된 하나의 계수(factor)에 의한 역 정수 변환 알고리즘(inverse integer transform algorithm)을 사용한 후에 시간-이산 오디오 신호의 시간 표시를 다운샘플(downsample)하도록 형성된, 시간-이산 오디오 신호로부터 발생된 부호화 오디오 데이터 복호화 장치.
- 제29항에 있어서,차단 주파수상의 모든 입력값에 대해 상기 예정값이 0인, 시간-이산 오디오 신호로부터 발생된 부호화 오디오 데이터 복호화 장치.
- 하나의 양자화 블록과 하나의 차분 블록을 얻기 위하여 부호화 오디오 데이터를 처리하는 단계(70)와;하나의 정수 역양자화된 양자화 블록을 얻기 위하여, 양자화 블록을 역양자화하고 라운딩(rounding)하는 단계(74)와;하나의 결합 블록을 얻기 위하여 정수 양자화 블록과 차분 블록을 스펙트럼 관련 값으로 결합시키는(spectral value-wise combining) 단계(78)와; 그리고하나의 결합 블록을 사용하여 그리고 상기 정수 변환 알고리즘의 역 정수 변환 알고리즘을 사용하여 시간-이산 오디오 신호의 시간 표시를 발생시키는 단계(82)를 포함하여 구성되는, 제공, 역양자화, 발생, 형성 및 처리(processing)단계에 의해 시간-이산 오디오 신호로부터 발생된 부호화 오디오 데이터의 복호화 방법.
- 컴퓨터에 실행될 때, 제21항의 부호화 방법을 실행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램.
- 컴퓨터에 실행될 때 제31항의 복호화 방법을 실행하기 위한 프로그램 부호를 갖는 컴퓨터 프로그램.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10217297.8 | 2002-04-18 | ||
DE10217297A DE10217297A1 (de) | 2002-04-18 | 2002-04-18 | Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten |
PCT/EP2002/013623 WO2003088212A1 (de) | 2002-04-18 | 2002-12-02 | Vorrichtung und verfahren zum codieren eines zeitdiskreten audiosignals und vorrichtung und verfahren zum decodieren von codierten audiodaten |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050007312A true KR20050007312A (ko) | 2005-01-17 |
KR100892152B1 KR100892152B1 (ko) | 2009-04-10 |
Family
ID=28798541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020047016744A KR100892152B1 (ko) | 2002-04-18 | 2002-12-02 | 시간-이산 오디오 신호를 부호화하기 위한 장치 및 방법그리고 부호화 오디오 데이터를 복호화하기 위한 장치 및방법 |
Country Status (9)
Country | Link |
---|---|
EP (1) | EP1495464B1 (ko) |
JP (1) | JP4081447B2 (ko) |
KR (1) | KR100892152B1 (ko) |
CN (1) | CN1258172C (ko) |
AT (1) | ATE305655T1 (ko) |
CA (1) | CA2482427C (ko) |
DE (2) | DE10217297A1 (ko) |
HK (1) | HK1077391A1 (ko) |
WO (1) | WO2003088212A1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008100034A1 (en) * | 2007-02-12 | 2008-08-21 | Samsung Electronics Co., Ltd. | Audio encoding and decoding apparatus and method |
KR20210016839A (ko) * | 2019-08-05 | 2021-02-17 | 국방과학연구소 | 수동 소나의 협대역 신호를 탐지하기 위한 lofar 또는 demon 그램의 압축 장치 |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070276894A1 (en) * | 2003-09-29 | 2007-11-29 | Agency For Science, Technology And Research | Process And Device For Determining A Transforming Element For A Given Transformation Function, Method And Device For Transforming A Digital Signal From The Time Domain Into The Frequency Domain And Vice Versa And Computer Readable Medium |
KR101141247B1 (ko) * | 2003-10-10 | 2012-05-04 | 에이전시 포 사이언스, 테크놀로지 앤드 리서치 | 디지털 신호를 확장성 비트스트림으로 인코딩하는 방법;확장성 비트스트림을 디코딩하는 방법 |
DE102004007200B3 (de) * | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
DE102004007184B3 (de) * | 2004-02-13 | 2005-09-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und Vorrichtung zum Quantisieren eines Informationssignals |
DE102004059979B4 (de) | 2004-12-13 | 2007-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Berechnung einer Signalenergie eines Informationssignals |
US8494667B2 (en) | 2005-06-30 | 2013-07-23 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
ATE455348T1 (de) | 2005-08-30 | 2010-01-15 | Lg Electronics Inc | Vorrichtung und verfahren zur dekodierung eines audiosignals |
KR100878833B1 (ko) | 2005-10-05 | 2009-01-14 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US7653533B2 (en) | 2005-10-24 | 2010-01-26 | Lg Electronics Inc. | Removing time delays in signal paths |
EP1852849A1 (en) | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
EP1883067A1 (en) * | 2006-07-24 | 2008-01-30 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
EP1903559A1 (en) | 2006-09-20 | 2008-03-26 | Deutsche Thomson-Brandt Gmbh | Method and device for transcoding audio signals |
DE102006051673A1 (de) * | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
DE102007003187A1 (de) * | 2007-01-22 | 2008-10-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines zu sendenden Signals oder eines decodierten Signals |
EP2015293A1 (en) * | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
MX2010001763A (es) * | 2007-08-27 | 2010-03-10 | Ericsson Telefon Ab L M | Analisis/sintesis espectral de baja complejidad utilizando la resolucion temporal seleccionable. |
EP2063417A1 (en) * | 2007-11-23 | 2009-05-27 | Deutsche Thomson OHG | Rounding noise shaping for integer transform based encoding and decoding |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
CN102177426B (zh) * | 2008-10-08 | 2014-11-05 | 弗兰霍菲尔运输应用研究公司 | 多分辨率切换音频编码/解码方案 |
CN102918590B (zh) * | 2010-03-31 | 2014-12-10 | 韩国电子通信研究院 | 编码方法和装置、以及解码方法和装置 |
US20120029926A1 (en) * | 2010-07-30 | 2012-02-02 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
JP5799707B2 (ja) * | 2011-09-26 | 2015-10-28 | ソニー株式会社 | オーディオ符号化装置およびオーディオ符号化方法、オーディオ復号装置およびオーディオ復号方法、並びにプログラム |
EP2830058A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frequency-domain audio coding supporting transform length switching |
CN105632503B (zh) * | 2014-10-28 | 2019-09-03 | 南宁富桂精密工业有限公司 | 信息隐藏方法及系统 |
US10354667B2 (en) * | 2017-03-22 | 2019-07-16 | Immersion Networks, Inc. | System and method for processing audio data |
EP3471271A1 (en) * | 2017-10-16 | 2019-04-17 | Acoustical Beauty | Improved convolutions of digital signals using a bit requirement optimization of a target digital signal |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
WO2019091576A1 (en) * | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
CN107911122A (zh) * | 2017-11-13 | 2018-04-13 | 南京大学 | 基于分解压缩的分布式光纤振动传感数据无损压缩方法 |
US11281312B2 (en) | 2018-01-08 | 2022-03-22 | Immersion Networks, Inc. | Methods and apparatuses for producing smooth representations of input motion in time and space |
CN115410583A (zh) | 2018-04-11 | 2022-11-29 | 杜比实验室特许公司 | 基于机器学习的用于音频编码和解码的基于感知的损失函数 |
DE102019204527B4 (de) * | 2019-03-29 | 2020-11-19 | Technische Universität München | Kodierungs-/dekodierungsvorrichtungen und verfahren zur kodierung/dekodierung von vibrotaktilen signalen |
CN118571234A (zh) * | 2023-02-28 | 2024-08-30 | 华为技术有限公司 | 音频编解码方法及相关装置 |
-
2002
- 2002-04-18 DE DE10217297A patent/DE10217297A1/de not_active Withdrawn
- 2002-12-02 JP JP2003585070A patent/JP4081447B2/ja not_active Expired - Lifetime
- 2002-12-02 DE DE50204426T patent/DE50204426D1/de not_active Expired - Lifetime
- 2002-12-02 AT AT02792858T patent/ATE305655T1/de active
- 2002-12-02 CN CNB028289749A patent/CN1258172C/zh not_active Expired - Lifetime
- 2002-12-02 KR KR1020047016744A patent/KR100892152B1/ko active IP Right Grant
- 2002-12-02 EP EP02792858A patent/EP1495464B1/de not_active Expired - Lifetime
- 2002-12-02 CA CA002482427A patent/CA2482427C/en not_active Expired - Lifetime
- 2002-12-02 WO PCT/EP2002/013623 patent/WO2003088212A1/de active IP Right Grant
-
2005
- 2005-10-20 HK HK05109316A patent/HK1077391A1/xx not_active IP Right Cessation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008100034A1 (en) * | 2007-02-12 | 2008-08-21 | Samsung Electronics Co., Ltd. | Audio encoding and decoding apparatus and method |
US8055506B2 (en) | 2007-02-12 | 2011-11-08 | Samsung Electronics Co., Ltd. | Audio encoding and decoding apparatus and method using psychoacoustic frequency |
KR20210016839A (ko) * | 2019-08-05 | 2021-02-17 | 국방과학연구소 | 수동 소나의 협대역 신호를 탐지하기 위한 lofar 또는 demon 그램의 압축 장치 |
Also Published As
Publication number | Publication date |
---|---|
CA2482427A1 (en) | 2003-10-23 |
JP2005527851A (ja) | 2005-09-15 |
DE50204426D1 (de) | 2005-11-03 |
HK1077391A1 (en) | 2006-02-10 |
JP4081447B2 (ja) | 2008-04-23 |
CN1625768A (zh) | 2005-06-08 |
KR100892152B1 (ko) | 2009-04-10 |
WO2003088212A1 (de) | 2003-10-23 |
AU2002358578A1 (en) | 2003-10-27 |
DE10217297A1 (de) | 2003-11-06 |
CN1258172C (zh) | 2006-05-31 |
EP1495464A1 (de) | 2005-01-12 |
EP1495464B1 (de) | 2005-09-28 |
ATE305655T1 (de) | 2005-10-15 |
CA2482427C (en) | 2010-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100892152B1 (ko) | 시간-이산 오디오 신호를 부호화하기 위한 장치 및 방법그리고 부호화 오디오 데이터를 복호화하기 위한 장치 및방법 | |
US7275036B2 (en) | Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data | |
US7343287B2 (en) | Method and apparatus for scalable encoding and method and apparatus for scalable decoding | |
US8620674B2 (en) | Multi-channel audio encoding and decoding | |
US8255234B2 (en) | Quantization and inverse quantization for audio | |
US7801735B2 (en) | Compressing and decompressing weight factors using temporal prediction for audio data | |
US8195730B2 (en) | Apparatus and method for conversion into a transformed representation or for inverse conversion of the transformed representation | |
EP2279562B1 (en) | Factorization of overlapping transforms into two block transforms | |
US7512539B2 (en) | Method and device for processing time-discrete audio sampled values | |
Britanak et al. | Cosine-/Sine-Modulated Filter Banks | |
Geiger et al. | IntMDCT-A link between perceptual and lossless audio coding | |
Geiger et al. | Integer low delay and MDCT filter banks | |
US20170206905A1 (en) | Method, medium and apparatus for encoding and/or decoding signal based on a psychoacoustic model | |
Herre | Audio Coding Based on Integer Transforms | |
Fraunhofer | INTMDCT-A LINK BETWEEN PERCEPTUAL AND LOSSLESS AUDIO CODING |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130325 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20140320 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20160323 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20170323 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20180327 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20190325 Year of fee payment: 11 |