KR100852481B1 - 양자화 스텝 사이즈 결정 장치 및 방법 - Google Patents

양자화 스텝 사이즈 결정 장치 및 방법 Download PDF

Info

Publication number
KR100852481B1
KR100852481B1 KR1020067016577A KR20067016577A KR100852481B1 KR 100852481 B1 KR100852481 B1 KR 100852481B1 KR 1020067016577 A KR1020067016577 A KR 1020067016577A KR 20067016577 A KR20067016577 A KR 20067016577A KR 100852481 B1 KR100852481 B1 KR 100852481B1
Authority
KR
South Korea
Prior art keywords
step size
quantization step
interference
quantization
threshold
Prior art date
Application number
KR1020067016577A
Other languages
English (en)
Other versions
KR20060121973A (ko
Inventor
베른하트 그릴
미첼 슈그
보도 타이크만
니콜라우스 레뗄바흐
Original Assignee
프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. filed Critical 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우.
Publication of KR20060121973A publication Critical patent/KR20060121973A/ko
Application granted granted Critical
Publication of KR100852481B1 publication Critical patent/KR100852481B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Paper (AREA)
  • Soil Working Implements (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Length Measuring Devices With Unspecified Measuring Means (AREA)
  • Measurement Of Optical Distance (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

오디오 또는 비디오 정보를 포함한 신호를 양자화하기 위한 양자화 스텝 사이즈를 결정하기 위해, 간섭 임계치 및 제 1 양자화 스텝 사이즈가 제공된다 (502). 그런 후, 상기 제 1 양자화 스텝 사이즈에 의해 도입된 실제 간섭이 결정되고 (504), 상기 간섭 임계치와 비교된다 (506). 비교 결과 실제 도입된 간섭은 상기 임계치를 초과한다는 사실에도 불구하고, 제 2의 더 큰 양자화 스텝 사이즈가 사용된다 (508). 더 큰 제 2 양자화 스텝 사이즈에 의해 도입된 간섭이 임계치 이하로 떨어지거나, 상기 제 1 양자화 스텝 사이즈에 의해 도입된 간섭 이하로 떨어진 것이 판명된다면 양자화를 위해 이용될 것이다 (512). 따라서 양자화가 거칠게 되면 양자화 간섭이 감소하고 압축 이득이 증가된다.
오디오, 비디오 신호, 양자화 스텝 사이즈, 간섭 임계치, 스펙트럼 표현, 인 스펙트럼 값, 심리음향 마스킹, 주파수 밴드

Description

양자화 스텝 사이즈 결정 장치 및 방법{Device and method for determining a quantiser step size}
본 발명은 오디오 부호기에 관한 것으로, 특히 변환에 기반한 오디오 부호기 (transformation-based audio coder), 즉 부호기 파이프라인의 초기에 시간 표현을 스펙트럼 표현으로 변환하는 오디오 부호기에 관한 것이다.
종래의 변환 기반 오디오 부호기는 도 3에 도시되어 있다. 도 3에 도시된 부호기는 AAC 부호기로도 알려진 국제 표준 ISO/IEC 14496-3: 2001 (E), 서브파트 4, 4페이지에 기재되어 있다.
종래 기술에 따른 부호기는 이하에서 기술된다. 부호화될 오디오 신호가 입력된다 (1000).
이 오디오 신호는 초기에 스케일링 단계 (1002) 에 제공되고, 소위 AAC 이득 제어가 실행되어 오디오 신호의 레벨을 설정한다. 블록 (1002) 및 블록 (1004) 사이에 화살표로 표시된 바와 같이 스케일링으로부터 부가 정보가 비트스트림 포매터 (bit stream formatter)(1004) 에 공급된다. 그 후, 스케일링 된 오디오 신호는 변형 이산 코사인 변환 (modified discrete cosine transform 줄여서 MDCT) 필터 뱅크 (1006) 에 공급된다. AAC 부호기를 이용하여, 상기 필터 뱅크는 윈도우 길이 가 블록 (1008) 에 의해 결정되는 50 % 오버래핑 윈도우를 갖는 변형 이산 코사인 변환을 수행한다.
일반적으로 말하면, 상기 블록 (1008) 은 상대적으로 짧은 윈도우들을 갖는 일시적인 신호들의 윈도윙 및 상대적으로 긴 윈도우들을 갖는 정상 상태의 신호들의 윈도윙을 위해 존재한다. 상대적으로 짧은 윈도우들로 인해 일시적인 신호들에 대해 더 높은 시간 분해능을 얻을 수 있는 반면, 정상 상태 신호들에 대해서는 긴 윈도우들로 인해 고주파수 분해능을 얻을 수 있으므로, 높은 부호화 이득을 얻게 된다. 필터 뱅크 (1006) 의 출력에서, 상기 필터 뱅크의 실행에 따른 MDCT 계수들, 푸리에 계수들 또는 서브밴드 (subband) 신호들인 스펙트럼 값들의 블록들(시간에 따라 연속적인 블록들)이 존재하며, 각 서브밴드 신호는 상기 필터 뱅크 (1006) 내의 각 서브밴드 채널에 의해 특정되는 제한된 밴드 폭을 갖고, 정해진 개수의 서브밴드 샘플들을 갖는다.
이하에서, 상기 필터 뱅크가 일반적으로 입력 (1000) 에서 부호화될 오디오 신호의 연속적인 단기 스펙트럼들을 나타내는 시간적으로 연속적인 MDCT 스펙트럼 계수들의 블록들을 출력하는 경우의 예를 설명한다. MDCT 스펙트럼 값들의 블록이 일시 노이즈 성형 (temporary noise shaping 줄여서 TNS) 프로세싱 블록 (1010) 에 입력되고, 일시 노이즈 성형이 실행된다. TNS 기법은 변환의 각 윈도우 내에서 양자화 노이즈의 순시적 형태를 성형하는데 이용된다. 각 채널의 스펙트럼 데이터의 부분들에 필터링 프로세스를 적용하여 구할 수 있다. 부호화는 윈도우를 기초로 실행된다. 특히 이하의 단계들은 스펙트럼 데이터의 윈도우, 즉 스펙트럼 값들의 블록에 TNS 툴을 적용함으로써 실행된다.
먼저, 상기 TNS 툴을 위한 주파수 범위가 선택된다. 적합한 선택은 필터의 1.5 kHz 주파수 범위를 최고 가능 스케일 팩터 밴드까지 변환하는 것을 포함한다. AAC 표준 (ISO/IEC 14496-3: 2001 (E)) 에 명시된 바와 같이, 이러한 주파수 범위는 샘플링 비율 (sampling rate) 에 따른다는 사실에 주의한다.
그 후, 선형 예측 부호화 (linear predictive coding 줄여서 LPC) 계산이 수행되며, 선택된 목표 주파수 범위에 있는 스펙트럼 MDCT 계수들을 이용하여 정확도를 높인다. 안정성을 높이기 위해, 2.5 kHz 이하의 주파수에 해당하는 계수들은 이 프로세스에서 제외된다. 음성 처리 (speech processing) 에서 알려진 통상의 LPC 과정들, 예를 들면 Levinson-Durbin 알고리즘이 LPC 계산에 이용된다. 상기 계산은 노이즈 성형 필터의 최대 허용 가능 차수에 대해 실행된다.
LPC 계산의 결과로서 기대 예측 이득 (PG) 이 구해진다. 또한, 반사 계수 (reflection coefficients) 또는 PARCOR 계수 (partial correlation coefficients) 가 구해진다.
상기 예측 이득이 특정 임계치 이하인 경우에 TNS 툴은 적용되지 않는다. 이 경우에, 제어 정보가 비트스트림에 기입되어 복호기에 TNS 처리가 수행되지 않았음을 알린다.
반면, 상기 예측 이득이 임계치를 초과하는 경우에 TNS 처리가 적용된다.
다음 단계에서, 상기 반사 계수들이 양자화된다. 사용되는 노이즈 성형 필터의 차수는 반사 계수 어레이의 테일 (tail) 부터 임계치보다 작은 절대값을 갖는 반사 계수들을 제거함으로써 정해진다. 나머지 반사 계수들은 노이즈 성형 필터의 크기 정도이다. 적합한 임계치는 0.1 이다.
나머지 반사 계수들은 통상 선형 예측 계수들로 변환되며, 이 기술은 또한 스텝-업 (step-up) 과정으로서 알려져 있다.
계산된 LPC 계수들은 부호기 노이즈 성형 필터 계수들, 즉 예측 필터 계수들로서 이용된다. 이러한 유한 임펄스 응답 (finite impulse response 줄여서 FIR) 필터는 정해진 목표 주파수 범위에서 필터링하는데 이용된다. AR 필터 (autoregressive filter) 는 복호화에 이용되는 반면 소위 이동 평균 필터 (moving average filter) 는 부호화에 이용된다. 결국, 도 3의 TNS 처리 블록 1010 및 비트스트림 포매터 1004 사이에 도시된 화살표에 의해 나타낸 바와 같이, TNS 툴을 위한 부가 정보가 비트스트림 포매터에 제공된다.
그런 후, 결국 미드/사이드 부호기 (mid/side coder) (1012) 에 도달할 때까지, 도 3에 도시되지 않은 수 개의 선택적인 툴들, 즉 장기 예측 툴 (long-term prediction tool), 세기/결합 툴(intensity/coupling tool), 예측 툴, 노이즈 치환 툴 등과 같은 툴들을 통과한다. 부호화될 오디오 신호가 다중 채널, 즉 좌측 채널 및 우측 채널을 갖는 스테레오 신호일 때, 상기 미드/사이드 부호기 (1012) 가 활성화된다. 이제까지, 도 3의 블록 (1012) 업스트림에서, 좌우측 스테레오 채널들이 처리되었다. 즉 상기 필터 뱅크에 의해 스케일링되고 변환되어, TNS 처리가 선택적으로 행해졌다.
미드/사이드 부호기에서는, 미드/사이드 부호화가 가능한지, 즉 부호화 이득 을 조금이라도 얻을 수 있는지를 확인하기 위해 초기에 검증이 행해진다. 미드/사이드 부호화는 좌우측 채널들이 유사하면 부호화 이득을 얻을 수 있을 것이다. 왜냐하면, 이 경우에, 팩터 1/2 로 스케일링하는 것과 무관하게 좌우측 채널들의 합인 미드 채널이 좌측 또는 우측 채널과 거의 동일하기 때문이다. 반면 사이드 채널은 좌우측 채널들 간의 차이와 같기 때문에 매우 적은 값들만을 갖게 된다. 결과적으로, 좌우측 채널들이 근사적으로 동일할 때, 그 차이는 거의 영이거나, 바람직하게는 후속의 양자화기 (1014) 에서 영으로 양자화되는 매우 적은 값을 포함하게 되어, 엔트로피 부호기 (1016) 가 상기 양자화기 (1014) 로부터 다운스트림으로 연결되어 있기 때문에 매우 효율적으로 전송될 수 있음을 알 수 있다.
상기 양자화기 (1014) 는 심리음향 모델 (psycho-acoustic model) (1020)에 의해 스케일 팩터 밴드 당 허용가능한 간섭이 제공된다. 양자화기는 반복적으로 동작한다. 즉 외부 반복 루프가 초기에 호출되며, 이후에 내부 반복 루프를 호출하여 동작한다. 일반적으로, 양자화 스텝 사이즈 시작값부터 시작하여 값들의 블록의 양자화가 상기 양자화기 (1014) 의 입력에서 초기에 수행된다. 특히, 내부 루프는 MDCT 계수들을 양자화하여, 정해진 수의 비트들은 이 프로세스에서 소모된다. 외부 루프는 스케일 팩터를 이용하여 계수들의 수정된 에너지 및 변형을 계산하고 내부 루프를 다시 호출한다. 이러한 프로세스는 특정 조건 구문을 만날 때까지의 시간 동안 반복된다. 외부 반복 루프의 각 반복 루프에서, 신호가 개조되어 양자화에 의해 도입된 간섭을 계산하고, 이는 심리음향 모델 (1020) 에 의해 제공되어 허용된 간섭과 비교된다. 또한, 이러한 비교 후에 간섭될 것으로 고려되는 이러한 주파수 밴드의 스케일 팩터들은 반복 루프에서 반복 루프로의 하나 이상의 단계들에 의해 증가되어 외부 반복 루프의 각 반복에 대해서 정확하게 된다.
일단 양자화에 의해 도입된 양자화 간섭이 심리음향 모델에 의해 결정되는 허용 간섭 이하가 되고, 동시에 비트 요구사항을 만족했을 때, 정확히 말하면, 최대 비트율을 초과하지 않았을 때, 반복, 즉 합성에 의한 분석 기법 (analysis-by-synthesis method) 이 종료되고, 구한 스케일 팩터들이 블록 (1014) 에서 도시된 바와 같이 부호화되어 블록 (1014) 및 블록 (1004) 사이에서 화살표로 도시된 바와 같이 비트스트림 포매터 (1004) 에 제공된다. 그 후, 양자화된 값들은 수 개의 허프만 부호표들 (Huffman-code tables) 을 이용하여 통상 다양한 스케일 팩터 밴드들에 대해 엔트로피 부호화를 수행하는 엔트로피 부호기 (1016) 에 제공되어 상기 양자화된 값들을 이진 형식 (binary format) 으로 전환한다. 알려진 바와 같이, 허프만 부호화 형태의 엔트로피 부호화는 기대 신호 통계 (expected signal statistics) 를 기반으로 생성된 부호표들로의 회기를 포함하며, 여기서, 자주 발생하는 값들이 그렇지 않은 값들에 비해 짧은 코드 워드들 (code words) 로 주어진다. 이후에 실제의 주된 정보로서 엔트로피 부호화된 값들이 비트스트림 포매터 (1004)에 제공되면, 특정 비트스트림 구문에 따라서 출력측에 부호화된 오디오 신호를 출력한다.
위에서 설명한 바와 같이, 더 세밀한 양자화 스텝 사이즈는 양자화 스텝 사이즈에 의해 도입된 간섭이 상기 임계치보다 더 큰 경우에 이러한 반복적 양자화에서 사용된다. 이것은 수행된 양자화가 세밀하기 때문에 양자화 노이즈가 감소되도 록 하기 위함이다.
이러한 개념은 세밀한 양자화 스텝 사이즈로 인해 전송 데이터량이 자연적으로 증가하게 되어 압축 이득이 감소하게 되는 단점이 있다.
따라서 본 발명의 목적은 낮은 양자화 간섭을 도입하고 높은 압축 이득을 제공하는 양자화 스텝 사이즈를 결정하기 위한 개념을 제공한다.
본 발명의 목적은 청구항 1 항에 따른 양자화 스텝 사이즈를 결정하기 위한 장치, 청구항 8 항에 따른 양자화 스텝 사이즈를 결정하는 방법, 또는 청구항 9 항에 따른 컴퓨터 프로그램에 의하여 성취된다.
본 발명에 따르면 도입된 간섭이 임계치보다 클 때에도 종래 기술에 따라 세밀한 양자화를 수행하기보다 적어도 수 개의 더 큰 (더 거치른) 양자화 스텝 사이즈들이 시도되어 간섭 전력의 감소 및 부호화 이득의 증가 또는 적어도 유지하는 것이 가능하다. 더 큰 양자화 스텝 사이즈들을 이용하여서도 양자화에 의해 유발된 간섭들을 감소시킬 수 있음이 판명되었으며, 정확하게는 더 큰 양자화 스텝 사이즈가 세밀한 양자화 스텝 사이즈보다 양자화될 값에 들어맞을 때에 그러하다. 이러한 효과는 양자화 오차가 양자화 스텝 사이즈에만 관계된 것이 아니라 양자화될 값들에도 의존한다는 사실에 기초한 것이다. 양자화될 값들이 더 큰 양자화 스텝 사이즈에 근접한 경우에는 압축 이득을 증가시킴 (양자화가 거칠게 이루어지기 때문)과 동시에 양자화 노이즈를 감소시킬 것이다.
본 발명은 임계치 비교가 행해진 상태에서 제 1 양자화 스텝 사이즈를 위해 매우 우수한 예상 양자화 스텝 사이즈가 존재하는 경우에 매우 효율적이다. 따라서, 본 발명의 바람직한 실시예에서는 최악의 시나리오에 기초하기보다 평균 노이즈 에너지를 기초로 한 직접 계산을 이용하여 제 1 양자화 스텝 사이즈를 결정하는 것이 바람직하다. 그러므로, 종래 기술에 따른 반복 루프들은 상당히 감소되거나, 완전히 쇠퇴하게 된다.
본 실시예에서 양자화 스텝 사이즈의 후처리는 한층 더 큰 양자화 스텝 사이즈를 다시 한번 시도할 것이며, 이는 양자화될 값과 더 잘 들어맞음으로써 상술한 효과를 얻을 수 있다. 그 결과로서, 더 큰 양자화 스텝 사이즈에 의해 발생한 간섭은 이전의 간섭보다 작거나 임계치보다도 작으며, 더 반복될수록 더 큰 양자화 스텝 사이즈를 시도하게 된다. 양자화 스텝 사이즈를 더 크게 하는 이러한 과정은 유발되는 간섭이 다시 증가할 때까지의 계속된다. 그런 후, 종료 기준에 도달하면, 유발되는 간섭이 최소가 되는 저장된 양자화 스텝 사이즈를 이용하여 양자화가 실행된다.
본 발명의 다른 실시예에서는, 제 1 양자화 스텝 사이즈를 구하기 위해서, 종래 기술에서와 같이 종료 기준에 도달할 때까지 계속되는 합성에 의한 분석 접근법이 실행될 수도 있다. 본 발명의 후처리는 더 큰 양자화 스텝 사이즈를 이용하여 동일하게 우수한 간섭 결과 또는 더 나은 간섭 결과를 얻는 것이 가능한지를 최종적으로 입증하는데 이용될 수 있다. 더 큰 양자화 스텝 사이즈가, 도입된 간섭에 대해 동일하게 우수하거나 더 나은 경우에, 이 스텝 사이즈가 양자화에 사용될 것이다. 반면에, 더 큰 양자화 스텝 사이즈가 긍정적인 효과가 없을 때에는 최종 양자화를 위해 원래 결정된, 예를 들어 합성에 의한 분석 접근법을 이용하여 결정된 양자화 스텝 사이즈를 이용할 것이다.
본 발명에 따라, 제 1 임계치 비교를 위해 임의의 양자화 스텝 사이즈들이 채택될 수도 있다. 이러한 제 1 양자화 스텝 사이즈가 합성에 의한 분석법에 의해서 또는 상기 양자화 스텝 사이즈들의 직접 계산에 의해서 미리 결정되는지에 상관없다.
본 발명의 바람직한 실시예에서, 상기 주파수 범위 내에서 오디오 신호를 양자화하기 위해 이러한 개념이 사용된다. 그러나, 이러한 개념은 오디오 및/또는 비디오 정보를 구비한 시간 영역 신호를 양자화하기 위해서도 이용될 수 있다.
또한, 비교를 위해 사용된 임계치는 심리음향 또는 심리광학적 허용 간섭 또는 후술될 다른 임계치임을 주의한다. 예를 들어, 이러한 임계치는 실제로 심리음향 모델에 의해 제공되는 허용 간섭일 수 있다. 그러나, 이러한 임계치는 원래의 양자화 스텝 사이즈를 위해 사전에 결정되어 도입된 간섭 또는 다른 임계치일 수 있다.
상기 양자화된 값들은 반드시 허프만 부호화될 필요는 없으며, 산술 부호화와 같은 다른 엔트로피 부호화를 이용하여 부호화될 수도 있음에 주의한다. 또한, 상기 양자화된 값들은 또한 이진 방식으로 부호화될 수도 있다. 왜냐하면, 이러한 부호화 역시 작은 값들 또는 영인 값들을 전송할 때는 큰 값들, 일반적으로 영이 아닌 값들을 전송할 때보다 더 적은 비트들이 필요하게 되는 이점이 있기 때문이다.
시작값들, 즉 제 1 양자화 스텝 사이즈를 결정하기 위해서는, 상기 양자화 스텝 사이즈가 직접 노이즈 에너지 추정으로부터 결정된다면, 반복 접근법 (iterative approach) 이 완전히, 혹은 적어도 상당히 필수적이다. 정확한 노이즈 에너지 추정으로부터 양자화 스텝 사이즈를 계산하는 것이 합성에 의한 분석 루프에서 계산하는 것보다 상당히 빠르다. 왜냐하면, 계산을 위한 값들이 직접 존재하기 때문이다. 부호화에 적합한 양자화 스텝 사이즈가 발견될 때까지 수 개의 양자화 시도들을 먼저 실행하고 비교하는 것이 필요하지 않다.
그러나, 사용되는 양자화 특성 곡선이 비선형 특성 곡선이기 때문에, 비선형 특성 곡선은 노이즈 에너지 추정에서 고려되어야 한다. 충분히 정확하지 않기 때문에 선형 양자화를 위해 단순 노이즈 에너지 추정을 사용하는 것은 더 이상 가능하지 않다. 본 발명에 따르면, 다음의 양자화 특성 곡선을 갖는 양자화기가 사용된다.
Figure 112006058667248-pct00001
상기 수식에서 xi 는 양자화될 스펙트럼 값이다. 시작값들은 yi 에 의해 특징되고, yi 는 양자화된 스펙트럼 값이다. q 는 양자화 스텝 사이즈이다. round 는 라운딩 함수, 바람직하게는 nint 함수이며, nint 는 근접 정수를 말한다. 상기 양자화기를 비선형 양자화기로 만드는 지수는 α이며, α는 1 이 아니다. 통상, 지수 α는 1 보다 작으며, 양자화기는 압축 특성을 갖는다. Layer 3 AAC 에서 상기 지수 α는 0.75 이다. 임의의 값이며 영이 될 수도 있는 파라미터 s 는 덧셈 상수이다.
본 발명에 따르면, 다음의 관계는 양자화 스텝 사이즈를 계산하기 위해 사용된다.
Figure 112006058667248-pct00002
α가 3/4 일 때, 다음과 같다.
Figure 112006058667248-pct00003
이러한 수식에서, 좌변은 하나의 주파수 밴드에서 허용되며, 주파수 라인들 (i: i1 내지 i2)을 갖는 하나의 스케일 팩터 밴드에 대해서 심리음향 모듈에 의해 제공되는 간섭 (THR) 을 나타낸다. 상기 식은 지수 α가 1 이 아닌 상기 양자화 특성 곡선을 갖는 비선형 양자화기에 대해 양자화 스텝 사이즈에 의해 도입된 간섭의 가장 정확한 추정을 가능하게 한다. 양자화 수식에서의 nint 함수는 실제 양자화 수식, 즉 다음 정수로의 라운딩을 수행한다.
nint 함수 대신에 임의의 라운딩 함수 round 가 사용될 수도 있으며, 특히, 예를 들어 다음 짝수, 다음 홀수, 또는 다음 10의 배수로 라운딩하는 함수가 사용될 수도 있다. 일반적으로, 라운딩 함수는 특정 개수의 허용치들의 세트의 한 값을 더 적은 특정 개수의 값들의 세트로 매핑 (mapping) 시키는 기능을 한다.
본 발명의 바람직한 실시예에서, 양자화된 스펙트럼 값들은 이전에 TNS 처리되고, 처리된 것이, 예를 들어, 스테레오 신호들이고, 미드/사이드 부호기가 활성화되도록 채널들이 존재한다면 미드/사이드 부호화된다.
따라서, 각 스케일 팩터 밴드를 위한 스케일 팩터는 직접 표시되고, 다음의 식에 따른 양자화 스텝 사이즈 및 스케일 팩터 사이의 관계를 갖고 각 오디오 부호기에 입력될 수 있다.
Figure 112006058667248-pct00004
스케일 팩터는 하기의 수식으로부터 구할 수 있다.
Figure 112006058667248-pct00005
본 발명의 바람직한 실시예에서, 실제 최적의 값을 구하기 위해 각 스케일 팩터 밴드에 대해 반복없이 직접 계산되는 양자화 스텝 사이즈가 약간 변하도록 합성에 의한 분석 원칙에 기반한 전처리 반복에 의해 할 수 있다.
비록 대부분의 경우에 다운스트림 반복이 없어도 됨이 판명되었지만, 종래 기술에 비해서, 이미 매우 정확한 시작값들은 짧은 반복을 가능하게 한다.
종래 기술과 달리, 최악의 시나리오로 동작하지 않고 양자화 오차의 기대값을 기초로서 사용하여 상당히 감소된 비트 개수와 대등한 품질로 데이터의 더욱 효율적인 부호화를 가능하게 하기 때문에, 평균 노이즈 에너지를 이용한 스텝 사이즈 계산에 기반한 바람직한 개념은 우수하고 실제적인 추정을 제공한다. 또한, 반복이 완전히 없어도 된다는 사실 및/또는 반복의 회수가 명백히 감소된다는 사실로 인해 상당히 빠른 부호기를 얻을 수 있다. 특히 종래 기술의 부호기에서 반복 루프들이 부호기의 전체 시간에서 필수적으로 요구하기 때문에, 이것은 주목할 만한 것이다. 따라서, 하나 또는 더 적은 반복 단계들이 감소하더라도, 부호기의 전체로서는 상당한 시간을 줄이게 된다.
이하 첨부한 도면에 의거하여 본 발명의 바람직한 실시예를 상세히 설명하도록 한다.
도 1은 양자화된 오디오 신호를 결정하기 위한 장치의 블록도이다.
도 2는 본 발명의 바람직한 실시예에 따른 후처리를 나타내기 위한 순서도이다.
도 3은 AAC 표준에 따른 종래의 부호기의 블록도를 도시한다.
도 4는 더 큰 (더 거친:coarser) 양자화 스텝 사이즈에 의해 양자화 간섭의 감소를 나타낸 것이다.
도 5는 본 발명의 신호를 양자화하기 위한 양자화 스텝 사이즈를 결정하기 위한 장치의 블록도이다.
본 발명의 개념은 도 5를 참고하여 이하에서 설명될 것이다. 도 5는 오디오 또는 비디오 정보를 구비하고 신호 입력 (500) 을 통해 제공되는 신호를 양자화하기 위한 양자화 스텝 사이즈를 결정하기 위한 장치의 개념도이다. 상기 신호는 제 1 양자화 스텝 사이즈 (QSS) 를 제공하고 이하에서 도입가능한 간섭이라고도 부르는 간섭 임계치를 제공하기 위한 수단 (502) 에 제공된다. 간섭 임계치는 임의의 임계치인 것을 알아야 한다. 그러나, 바람직하게는 심리음향적 또는 심리광학적으로 도입가능한 간섭이며, 이러한 임계치는 간섭이 도입되는 신호가 청취자 또는 보는 이에게 간섭되지 않은 것으로 인지되도록 선택된다.
제 1 양자화 스텝 사이즈 뿐만 아니라 임계치 (THR) 도 상기 제 1 양자화 스텝 사이즈에 의해 도입된 실제 제 1 간섭을 결정하기 위한 수단 (504) 에 제공된다. 실제 도입된 간섭을 결정하는 것은 바람직하게는 상기 제 1 양자화 스텝 사이즈를 이용하여 양자화하고, 상기 제 1 양자화 스텝 사이즈를 이용하여 재양자화 (re-quantize) 하고, 원래 신호와 재양자화된 신호 사이의 차이를 계산함으로써 수행된다. 바람직하게는, 스펙트럼 값들을 처리할 때, 원래 신호 및 재양자화된 신호의 해당 스펙트럼 값들의 제곱의 차이를 구하기 위해 원래 신호 및 재양자화된 신호의 해당 스펙트럼 값들을 제곱한다. 상기 차이를 구하기 위해 다른 방법이 사용될 수도 있다.
상기 수단 (504) 은 상기 제 1 양자화 스텝 사이즈에 의해 실제 도입된 제 1 간섭에 대한 값을 제공한다. 이러한 제 1 간섭이 비교를 위해 임계치 (THR) 와 함께 수단 (506) 에 제공된다. 상기 수단 (506) 은 실제 도입된 제 1 간섭과 임계치 (THR) 를 비교한다. 실제 도입된 제 1 간섭이 상기 임계치보다 클 때, 상기 수단 (506) 이 제 2 양자화 스텝 사이즈를 선택하기 위한 수단 (508) 을 활성화시킬 것이며, 이 수단 (508) 은 상기 제 2 양자화 스텝 사이즈가 더 크도록, 즉 상기 제 1 양자화 스텝 사이즈보다 크도록 선택하게 구성된다. 상기 수단 (508) 에 의해 선택된 제 2 양자화 스텝 사이즈는 실제 도입된 제 2 간섭을 결정하기 위한 수단 (510) 에 제공된다. 결국, 상기 수단 (510) 은 제 2 양자화 스텝 사이즈 뿐만 아니라 원래 신호를 얻고, 상기 제 2 양자화 스텝 사이즈를 이용하여 양자화 및 재양자화를 실행하고, 원래 신호 및 재양자화된 신호 사이의 차이를 계산하여 실제 도입된 제 2 간섭의 측정치와 비교하기 위한 수단 (512) 에 제공한다. 상기 수단 (512) 은 실제 도입된 제 2 간섭과 실제 도입된 제 2 간섭 또는 임계치 (THR) 와 비교한다. 실제 도입된 제 2 간섭이 실제 도입된 제 2 간섭 또는 임계치 (THR) 보다 더 작으면, 상기 제 2 양자화 스텝 사이즈가 상기 신호를 양자화하는데 이용될 것이다.
도 5에 도시된 개념은 개념적인 것임에 주의한다. 상기 블록들 (506 및 512) 에서 비교를 수행하기 위해 반드시 별개의 비교 수단들이 필요한 것은 아니며, 적절히 제어되는 하나의 비교 수단으로도 가능하다. 실제 도입된 간섭을 결정하기 위한 수단들 (504 및 510) 에 대해서도 마찬가지로 적용된다. 반드시 별개의 수단들로 구성될 필요는 없다.
또한, 양자화를 위한 수단도 반드시 상기 수단 (510) 과 별개의 수단으로 구성될 필요가 없다. 자세히 말하면, 상기 제 2 양자화 스텝 사이즈에 의해 양자화된 상기 신호들은 상기 수단 (510) 이 실제로 도입된 간섭을 결정하기 위해 양자화 및 재양자화를 수행할 때 마찬가지로 상기 수단 (510) 에서 통상 발생된다. 비교를 위한 수단 (512) 긍정의 결과를 제공할 때, 거기서 구해진 양자화된 값들은 또 한 양자화된 신호로서 저장 및 출력되어, 양자화를 위한 수단 (514) 이 말하자면 상기 실제 도입되는 제 2 간섭을 결정하기 위한 수단 (510) 과 병합된다.
본 발명의 바람직한 실시예에서, 임계치는 (THR) 심리음향학에 의해 결정된 최대로 도입가능한 간섭이고, 상기 신호는 이 경우에 오디오 신호이다. 여기서 임계치 (THR) 는 종래의 방식대로 동작하는 심리음향 모델에 의해 제공되며, 각 스케일 팩터 밴드에 대해서 이 스케일 팩터 밴드로 도입가능한 예상되는 최대 양자화 간섭을 제공한다. 최대 도입가능한 간섭은 마스킹 임계치에 기반한다. 최대 도입가능한 간섭은 마스킹 임계치이거나, 마스킹 임계치로부터 유도된다. 예를 들어, 도입가능한 간섭이 상기 마스킹 임계치보다 작도록 안전한 간격으로 부호화가 수행되거나, 허용된 간섭이 상기 마스킹 임계치를 초과되도록 비트율 감소의 측면에서 다소 공격적인 부호화가 수행된다.
상기 제 1 양자화 스텝 사이즈를 제공하기 위한 수단 (502) 의 바람직한 실행 방법이 도 1을 참고하여 이하에서 설명된다. 도 2 의 수단 (50) 및 도 5 의 수단 (502) 의 기능들은 서로 동일하다. 바람직하게는, 상기 수단 (502) 는 도 1 의 수단들 (10 및 12) 의 기능들을 갖도록 구성된다. 또한, 도 5 의 양자화기 (514) 는 본 실시예의 도 1 의 양자화기 (14) 와 동일하게 구성된다.
또한, 도입된 간섭이 임계치를 초과하면, 더 큰 양자화 스텝 사이즈들을 시도하는 과정들이 도 2를 참고하여 이하에서 설명된다.
도 2의 본 발명의 개념을 도시한 좌측 부분은 도입된 간섭이 임계치를 초과하는 경우, 양자화 스텝 사이즈를 크게 한 것이 아무 효과를 거두지 못하는 경우, 비트율 요건이 특별히 엄격하지 않고 또는 비트 절감 뱅크에 여유가 있을 때, 더 작은, 즉 세밀한 양자화 스텝 사이즈를 이용하여 반복이 수행될 수 있는 경우에까지 확장된다.
결국, 본 발명으로 인한 효과는 도 4를 참조하여 이하에서 설명된다. 특히 상기 양자화 스텝 사이즈를 크게 함에도 불구하고 감소된 양자화 노이즈와 그에 따른 압축 이득의 증가 등의 효과가 있다.
도 1은 스펙트럼 값들의 형태로 스펙트럼 표현된 양자화된 오디오 신호를 결정하기 위한 장치를 도시한다. 특히, 도 3을 참고하여 TNS 처리 및 미드/사이드 부호화가 수행되지 않은 경우에, 스펙트럼 값들은 바로 필터 뱅크의 시작값들이라는 사실에 주의한다. 그러나, TNS 처리만 수행되고, 미드/사이드 부호화가 수행되지 않은 경우에, 양자화기 (1015) 에 입력된 상기 스펙트럼 값들은 TNS 예측 필터링으로부터 형성된 스펙트럼 잔여 값들 (spectral residual values) 이다.
미드/사이드 부호화를 포함한 TNS 처리가 사용되면, 본 발명의 장치에 입력된 스펙트럼 값들은 미드 채널 또는 사이드 채널의 스펙트럼 값들이다.
우선, 본 발명은 도 1에서 10 이라고 표시된 허용된 간섭을 제공하기 위한 수단을 포함한다. 통상 허용된 간섭 또는 THR 이라고도 부르는 임계치를 제공하도록 구성된 도 3에서 도시된 심리음향 모델 (1020) 은 각 스케일 팩터 밴드, 즉 서로 스펙트럼이 인접한 수 개의 스펙트럼 값들의 군에 대해서 허용된 간섭을 제공하기 위한 수단으로서 기능한다. 상기 허용된 간섭은 심리음향 마스킹 임계치에 기초하며, 인간의 귀에 감지되는 간섭 에너지 없이 원래의 오디오 신호에 도입되는 에너지의 양을 나타낸다. 즉, 상기 허용된 간섭은 실제 오디오 신호에 의해 마스킹되며, 양자화에 의해 인위적으로 도입된 신호 부분이다.
상기 수단 (10) 은 주파수 밴드, 바람직하게는 스케일 팩터 밴드에 대해서 허용된 간섭 (THR) 을 계산하고 이것을 다운스트림 수단 (12) 에 제공하는 것으로 도시되어 있다. 상기 수단 (12) 은 상기 허용된 간섭 (THR) 이 나타내는 주파수 밴드에 대하여 양자화 스텝 사이즈 정보를 계산하는 기능을 한다. 상기 수단 (12) 은 양자화 스텝 사이즈 정보 (q) 를 양자화를 위한 다운스트림 수단 (14) 에 제공하도록 구성된다. 상기 양자화를 위한 수단 (14) 은 블록 (14) 에서 도시된 양자화 규격에 따라 동작한다. 상기 양자화 스텝 사이즈 정보가 사용된다. 도 1에 도시된 경우에서, 스펙트럼 값 xi 를 상기 값 q 로 나누고 1 이 아닌 지수 α로 거듭제곱한 후 덧셈 상수 s 를 더하면 된다.
이어서, 도 1 에 도시된 본 실시예에서 이 결과는 라운딩 함수에 제공되어 바로 다음의 정수를 선택하게 된다. 정의에 따라, 상기 정수는 소수점 이하의 숫자들을 잘라냄으로써, 즉 버림을 함으로써 개개의 실행에 따라 구해진다. 이와 달리, 상기 정수는 0.499 까지는 버림을 하고 0.5 부터는 올림을 함으로써 구할 수도 있다. 또한, 상기 정수는 올림을 함으로써 개개의 실행에 따라 구해질 수도 있다. nint 함수 대신에 다른 라운딩 함수가 이용될 수 있지만, 이 라운딩 함수는 일반적으로 라운딩될 값을 더 큰 세트의 값들 중 하나에서 더 작은 세트의 값들 중 하나로 매핑하는 함수이다.
상기 양자화된 스펙트럼 값이 상기 수단 (14) 의 출력에서 상기 주파수 밴드 내에 존재할 것이다. 블록 (14) 에서 도시된 수식으로부터 알 수 있듯이, 수단 (14) 에는 상기 양자화 스텝 사이즈 (q) 뿐만 아니라 상기 주파수 밴드 내에서 양자화될 스펙트럼 값이 제공된다.
상기 수단 (12) 반드시 직접 양자화 스텝 사이즈 (q) 를 계산할 필요는 없으며, 대안의 양자화 스텝 사이즈 정보로서 종래의 변환 기반 오디오 부호기들에서 사용된 바와 같이 스케일 팩터가 또한 계산될 수도 있다. 상기 스케일 팩터는 도 1 의 블록 (12) 의 우측에 표시된 관계를 통해 실제 양자화 스텝 사이즈와 관련되어 있다. 계산을 위한 수단이 양자화 스텝 사이즈 정보로서 스케일 팩터 (scf) 를 계산하도록 더 구성되면, 이러한 스케일 팩터는 양자화를 위한 수단 (14) 에 제공되며, 상기 수단 (14) 은 값 (q) 대신에 양자화 계산을 위해 21/4 scf 값을 사용할 것이다.
블록 (12) 에 주어진 형태의 유도는 이하에서 주어진다.
블록 (14) 에서 도시된 지수 법칙의 양자화기는 다음의 관계를 만족한다.
Figure 112006058667248-pct00006
역의 관계는 이하의 식과 같다.
Figure 112006058667248-pct00007
따라서, 이 수식은 재양자화를 위해 필요한 동작을 나타내며, 여기서 yi 는 양자화된 스펙트럼 값이고, xi' 는 재양자화된 스펙트럼 값이다. 다시, q 는 도 1 의 블록 (12) 의 오른쪽에 나타낸 관계에 따라 스케일 팩터와 관련된 양자화 스텝 사이즈이다.
예상한 바와 같이, α가 1 인 경우에, 결과는 이 수식과 일치한다.
상기 수식이 스펙트럼 값들의 벡터에 대해 합산되면, 인덱스 i 로 결정된 밴드 내의 총 노이즈 전력은 아래와 같이 주어진다.
Figure 112006058667248-pct00008
요약하면, 벡터의 양자화 노이즈의 기대값은 양자화 스텝 사이즈 (q) 및 소위 상기 벡터 성분의 수량 분포를 나타내는 폼 팩터 (form factor) 에 의해 결정된다.
상기 수식이 다른 정도의 원하는 간섭 레벨들에 대해 계산되더라도, 상기 수식에서 최우측 항인 상기 폼 팩터는 실제 입력 값들에 의존하며, 한 번만 계산되면 된다.
이미 살펴본 바와 같이, α가 3/4인 이러한 수식은 다음과 같이 간단하게 정리된다.
Figure 112006058667248-pct00009
이 수식의 좌측은 경계의 경우에 허용된 노이즈 에너지 (임계치) 에 들어맞도록 하는 양자화 노이즈 에너지의 추정치이다.
따라서, 다음의 접근이 이루어진다.
Figure 112006058667248-pct00010
상기 수식의 우측에서 주파수 라인들의 제곱근들의 합은 주파수 라인들의 균일성의 측정에 해당하며, 부호기에서 폼 팩터로 알려져 있다.
Figure 112006058667248-pct00011
따라서 다음과 같은 결과를 나타낸다.
Figure 112006058667248-pct00012
여기서, q 는 양자화 스텝 사이즈이다. AAC 를 이용하면 아래 수식과 같다.
Figure 112006058667248-pct00013
scf 는 스케일 팩터이다. 스케일 팩터가 정해지면, 스텝 사이즈 및 스케일 팩터 사이의 관계에 기초하여 상기 수식이 아래와 같이 계산된다.
Figure 112006058667248-pct00014
Figure 112006058667248-pct00015
Figure 112006058667248-pct00016
Figure 112006058667248-pct00017
따라서, 본 발명은 특정 폼 팩터를 갖는 스케일 팩터 밴드에 대한 스케일 팩터들 scf 사이의 닫힌 연결 (closed connection) 을 제공하며, 이를 위해 통상 심리음향 모델로부터 얻어진 소정의 간섭 임계치 (THR) 가 주어진다.
이미 설명한 바와 같이, 상기 평균 노이즈 에너지를 이용하여 스텝 사이즈를 계산하는 것은 더 나은 추정치를 제공한다. 왜냐하면, 최악의 시나리오보다는 양자화 오차의 기대값이 기초로서 이용되는 것이 낫기 때문이다.
따라서, 본 발명의 개념은 양자화 스텝 사이즈를 결정하는데 적합하고, 또는 반복 없이 스케일 팩터 밴드에 대한 스케일 팩터의 대해서도 마찬가지이다.
그럼에도 불구하고, 도 2 의 수단에 의해 이하에 나타낸 바와 같이 계산 시간 요건이 매우 엄격하지 않다면 후처리도 수행될 수 있다. 도 2의 제 1 단계에서, 제 1 양자화 스텝 사이즈가 추정된다 (단계 50). 제 1 양자화 스텝 사이즈 (QSS) 의 추정은 도 1 의 수단에 의해 도시된 과정을 이용하여 수행된다. 계속하 여, 상기 제 1 양자화 스텝 사이즈를 이용한 양자화가 단계 52 에서 수행되고, 바람직하게는 도 1 의 블록 (14) 을 이용하여 기술된 양자화기에 따라서 수행된다. 그 후, 상기 제 1 양자화 스텝 사이즈를 이용하여 구한 값들은 재양자화되어 도입된 간섭을 계산한다. 그에 따라서, 도입된 간섭이 미리 정의된 임계치를 초과하는지에 대한 검증이 단계 54 에서 이루어진다.
블록 (12) 에서 나타낸 관계에 의해 계산되는 상기 양자화 스텝 사이즈 (q) (또는 scf) 는 근사치임에 주의한다. 도 1의 블록 (12) 에서 주어진 관계가 실제 정확하다면, 블록 (54) 에서 도입된 간섭이 정확히 임계치에 해당된다고 설정되어야 한다. 도 1의 블록 (12) 의 관계가 근사에 의한 것이기 때문에, 도입된 간섭이 임계치를 초과하거나 임계치 이하로 떨어질 수도 있다.
또한, 임계치로부터 벗어난다 하더라도 임계치로부터 벗어난 정도가 특별히 크기 않다는 사실에 주의한다. 단계 54 에서 제 1 양자화 스텝 사이즈를 이용하여 도입된 간섭이 임계치 이하로 떨어지는 것을 안다면, 즉, 단계 54 에서 질문에 부정적으로 대답하게 된다면, 도 3 에서 오른쪽 부분이 선택될 것이다. 도입된 간섭이 임계치 이하로 떨어지면, 이것은 도 1 의 블록 (12) 에서의 추정치가 매우 비관적이라는 것을 의미하며, 따라서 단계 56 에서, 제 2 양자화 스텝 사이즈보다 더 큰 양자화 스텝 사이즈가 설정된다.
제 1 양자화 스텝 사이즈에 비해 제 2 양자화 스텝 사이즈가 더 커지는 정도는 선택될 수 있다. 그러나, 상대적으로 적은 증가분을 선택하는 것이 바람직하다. 왜냐하면 블록 (50) 에서의 추정치가 이미 상대적으로 정확할 것이기 때문이 다.
단계 58 에서, 제 2 의 더 큰 양자화 스텝 사이즈를 이용하여, 상기 스펙트럼 값들의 양자화, 후속의 재양자화, 및 상기 제 2 양자화 스텝 사이즈에 해당하는 제 2 간섭의 계산이 수행된다.
단계 60 에서, 상기 제 2 양자화 스텝 사이즈에 해당하는 제 2 간섭이 여전히 원래의 임계치 이하로 떨어지는지를 검증한다. 만약 그렇다면, 제 2 양자화 스텝 사이즈가 저장되고 (단계 62), 새로운 반복이 시작되어 단계 56 에서 더 큰 양자화 스텝 사이즈를 설정하도록 한다. 그런 후, 더 큰 양자화 스텝 사이즈를 이용하여 단계 60 및 그 경우에 해당한다면 단계 62 가 다시 수행되어 새로운 반복을 다시 시작하도록 한다. 단계 60 에서의 반복 동안에, 제 2 간섭이 임계치 이하로 떨어지지 않는다고 확인되면, 종료 기준에 도달되어, 양자화는 최종으로 저장된 양자화 스텝 사이즈를 이용하여 수행된다 (단계 64).
최초로 추정된 양자화 스텝 사이즈는 이미 상대적으로 우수한 값이기 때문에, 나쁘게 추정된 시작값들에 비해 반복 회수가 감소될 것이며, 이는 부호화할 때에 계산 시간을 상당히 줄일 수 있다. 왜냐하면 양자화 스텝 사이즈의 계산을 위한 반복이 부호기의 계산 시간의 가장 큰 부분을 차지하기 때문이다.
본 발명에서, 도입된 간섭이 실제로 임계치를 초과할 때에 사용되는 과정은 도 2 의 좌측 부분을 참고하여 이하에서 설명된다.
도입된 간섭이 이미 임계치를 초과한다는 사실에도 불구하고, 더 큰 양자화 스텝 사이즈가 본 발명에 따라 설정되고 (단계 70), 양자화, 재양자화, 및 상기 제 2 양자화 스텝 사이즈에 해당하는 제 2 노이즈 간섭의 계산이 단계 72 에서 실행된다. 그 후, 단계 74 에서 제 2 노이즈 간섭이 이제 임계치 이하로 떨어졌는지 검증한다. 만약에 그렇다면, 단계 74 의 질문에 "예" 로 응답하고, 상기 제 2 양자화 스텝 사이즈는 저장된다 (단계 76). 그러나, 상기 제 2 노이즈 간섭이 임계치를 초과한다고 알게 되면, 상기 저장된 양자화 스텝 사이즈를 이용하여 양자화가 수행되던지, 더 나은 제 2 양자화 스텝 사이즈가 저장되지 않았다면 반복을 통과하여 종래 기술에서와 같이 더 세밀한 양자화 스텝 사이즈를 선택하여 도입된 간섭이 임계치 이하가 되게 한다.
이하에서는 더 큰 양자화 스텝 사이즈를 이용할 때, 특히 도입된 간섭이 임계치를 초과할 때 개선이 이루어지는 이유에 대해 설명한다. 지금까지 사람들은 더 세밀한 양자화 스텝 사이즈가 더 작은 양자화 에너지가 도입되게 하고, 더 큰 양자화 스텝 사이즈가 더 큰 양자화 간섭이 도입되게 한다는 가정에 따라 동작하였다. 이것은 평균적으로는 사실이나, 항상 그런 것은 아니며 그 반대가 옳은 때도 있다. 특히, 양자화기가 비선형 특성 곡선을 가질 때, 가늘게 밀집되어 있는 스케일 팩터 밴드들에 대해서 그러하다. 본 발명에 따르면, 과소 평가되지 않은 많은 경우들에 있어서, 더 큰 양자화 스텝 사이즈는 더 작은 간섭들을 도입되게 함을 알게 된다. 이것은 더 큰 양자화 스텝 사이즈가 세밀한 양자화 스텝 사이즈보다 양자화될 스펙트럼 값에 더 잘 들어맞을 때가 또한 그러한 경우이며, 도 4를 참고하여 아래의 예를 이용하여 설명될 것이다.
예를 통해, 도 4는 0 과 1 사이의 입력 신호들이 양자화될 때, 4 개의 양자 화 단계들 (0, 1, 2, 및 3) 을 제공하는 양자화 특성 곡선 (60) 을 도시한다. 양자화된 값들은 0.0, 0.25, 0.5, 및 0.75 에 해당한다. 비교에서, 서로 상이한 더 큰 양자화 특성 곡선 (62) 이 점선으로 도 4에 도시되어 있으며, 이것은 3 개의 양자화 단계들을 갖고, 0.0, 0.33, 및 0.66 의 절대값들에 해당한다. 따라서, 첫 번째 경우에, 즉 양자화 특성 곡선 (60) 의 경우에, 양자화 스텝 사이즈는 0.25 이고, 반면에 두 번째 경우에, 즉 양자화 특성 곡선 (62) 의 경우에, 양자화 스텝 사이즈는 0.33 이다. 제 2 양자화기 특성 곡선 (62) 은 따라서 세밀한 양자화 특성 곡선을 나타내는 제 1 양자화기 특성 곡선 (60) 보다 더 큰 양자화 스텝 사이즈를 갖는다. 양자화될 xi = 0.33 를 살펴보면, 도 4에서, 4 개의 단계들을 갖는 세밀한 양자화기를 이용한 양자화 오차가 0.33 및 0.25 사이의 차이인 0.08 임을 알 수 있다. 이와는 대조적으로, 3 개의 단계들을 이용한 양자화 오차는 양자화 단계가 정확히 양자화될 값에 들어맞기 때문에 영이 된다.
따라서, 도 4 에서 세밀한 양자화보다 거친 양자화가 양자화 오차를 더 적게 하는 것을 알 수 있다.
또한, 거친 양자화는 더 작은 시작 비트율이 요구된다는 결정적인 요인이 있다. 왜냐하면 거친 양자화에서는 4 개의 단계들 (0, 1, 2, 및 3) 이 반드시 신호되어야 하는 세밀한 양자화의 경우와 달리 가능한 상태들이 3 개의 상태들, 즉 0, 1, 및 2 이기 때문이다. 또한, 더 큰 양자화 스텝 사이즈는 세밀한 양자화 스텝 사이즈에서보다 0 에서 멀리 떨어지게 양자화되는 값들이 더 많아지게 되어 0 으로 양자화되는 값들의 개수가 더 감소하는 장점을 갖는다. 하나의 스케일 팩터 밴드 내의 수개의 스펙트럼 값들을 살펴볼 때, 0 으로 양자화되는 것은 양자화 오차를 증가시키게 되지만, 반드시 문제가 되지는 않는다. 왜냐하면, 더 큰 양자화 스텝 사이즈가 더 중요한 스펙트럼 값들과 더 정확하게 일치하게 되어 양자화 오차가 상쇄되고, 심지어 다른 스펙트럼 값들의 더 거친 양자화에 의해 과잉 보상되어, 더 작은 비트율도 동시에 얻을 수 있다.
즉, 이루어진 부호기 결과는 모든 면에서 더 우수하다. 왜냐하면, 본 발명은 더 적은 상태들이 신호되게 하고 동시에 양자화 단계들에 더 잘 들어맞게 개선되었기 때문이다.
본 발명에 따르면, 도 2 의 좌측 부분에 표현된 바와 같이, 도입된 간섭이 임계치를 초과할 때, 추정치들로부터 시작하여 (도 2 의 단계 50) 한층 더 큰 양자화 스텝 사이즈가 시도되어 도 4 를 이용하여 표현된 효과를 얻을 수 있게 된다. 또한, 이러한 효과는 2 개의 선형 양자화 특성 곡선들이 도시된 도 4의 경우보다 비선형 양자화기들에 있어서 더욱 중요하다.
설명된 양자화 스텝 사이즈 후처리 및/또는 스케일 팩터 후처리의 개념은 스케일 팩터 추정기의 결과를 개선시킨다.
스케일 팩터 추정기에서 결정된 양자화 스텝 사이즈들로부터 시작하여 (도 2 의 단계 50), 오차 에너지가 미리 정의된 임계치 이하로 떨어지도록 가능한 한 큰 새로운 양자화 스텝 사이즈들이 합성에 의한 분석 단계에서 결정된다.
따라서, 스펙트럼이 계산된 양자화 스텝 사이즈들을 이용하여 양자화되고, 오차 신호의 에너지, 즉, 바람직하게는 원래 신호와 양자화된 스펙트럼 값들 사이의 차이들의 제곱의 합이 결정된다. 또는, 스펙트럼 값들이 더 선호되기는 하지만, 오차 결정을 위해 해당 시간 신호들이 이용될 수도 있다.
양자화 스텝 사이즈 및 오차 신호가 지금까지 구해진 최상의 결과로서 저장된다. 계산된 간섭이 임계치를 초과하면, 다음의 접근법이 채택된다.
사전에 정의된 범위 내의 스케일 팩터는 원래 계산된 값들의 근처에서 변하며, 특히 더 큰 양자화 스텝 사이즈들로 만들어진다 (단계 70).
각 새로운 스케일 팩터에 대해서, 스펙트럼은 다시 양자화되고, 오차 신호의 에너지가 계산된다. 오차 신호가 이제까지 계산된 최소치보다 더 작으면, 현재 양자화 스텝 사이즈가 관련된 오차 신호의 에너지와 함께 지금까지 구한 최상의 결과로서 래칭된다.
본 발명에 따르면, 특히 양자화기가 비선형 양자화기일 때, 도 4를 참고하여 기술된 개념으로부터의 효과를 위해 상대적으로 작은 스케일링 팩터 뿐만 아니라 상대적으로 큰 스케일링 팩터들도 여기에서 고려된다.
계산된 간섭이 임계치 이하로 감소되면, 즉, 단계 50 에서의 예측이 매우 비관적이면, 그 스케일 팩터는 원래 계산된 값의 근처의 소정의 범위 내에서 변할 것이다.
각 새로운 스케일 팩터에 대해서, 스펙트럼이 재양자화되고, 오차 신호의 에너지가 계산된다.
오차 신호가 이제까지 계산된 최소치보다 더 작으면, 현재의 양자화 스텝 사 이즈가 관련된 오차 신호의 에너지와 함께 지금까지 구해진 최고의 결과로서 래칭된다.
그러나, 여기서 상대적으로 큰 (coarse) 스케일링 팩터들이 고려되어 오디오 스펙트럼을 부호화하기 위해 필요한 비트 수를 감소시키게 된다.
상황에 따라, 본 발명에 따른 방법이 하드웨어 또는 소프트웨어로 실행될 수 있다. 상기 실행은 디지털 저장 매체 상에 영향을 줄 수 있으며, 특히 상기 방법이 수행되도록 프로그램 가능한 컴퓨터 시스템과 협력하는 전자적으로 판독 가능한 제어 신호들을 갖는 디스크 또는 CD 에서 영향을 줄 수 있다.
일반적으로, 본 발명은 컴퓨터 프로그램 제품이 컴퓨터 상에서 실행될 때 본 발명의 방법을 수행하기 위해 기계 판독 가능한 캐리어 상에 저장된 프로그램 코드를 갖는 상기 컴퓨터 프로그램 제품에 존재한다. 즉, 본 발명은 컴퓨터 프로그램이 컴퓨터 상에서 실행될 때에 상기 방법을 실행하기 위해 프로그램 코드를 갖는 컴퓨터 프로그램으로서 구현될 수 있다.

Claims (10)

  1. 오디오 또는 비디오 정보를 포함한 신호를 양자화하기 위한 양자화 스텝 사이즈를 결정하기 위한 장치로서,
    제 1 양자화 스텝 사이즈 및 간섭 임계치를 제공하기 위한 수단 (502);
    상기 제 1 양자화 스텝 사이즈에 의해 도입된 제 1 간섭을 결정하기 위한 수단 (504);
    상기 제 1 양자화 스텝 사이즈에 의해 도입된 간섭과 상기 간섭 임계치를 비교하기 위한 수단 (506);
    도입된 상기 제 1 간섭이 상기 간섭 임계치를 초과하는 경우에 상기 제 1 양자화 스텝 사이즈보다 더 큰 제 2 양자화 스텝 사이즈를 선택하기 위한 수단 (508);
    상기 제 2 양자화 스텝 사이즈에 의해 도입된 제 2 간섭을 결정하기 위한 수단 (510);
    도입된 상기 제 2 간섭과 상기 간섭 임계치 또는 도입된 상기 제 1 간섭을 비교하기 위한 수단 (512); 및
    도입된 상기 제 2 간섭이 도입된 상기 제 1 간섭보다 작거나, 상기 간섭 임계치보다 작을 경우에, 상기 신호를 상기 제 2 양자화 스텝 사이즈로 양자화하기 위한 수단 (514) 을 포함하는 양자화 스텝 사이즈 결정 장치.
  2. 제 1 항에 있어서,
    상기 신호는 오디오 신호이고, 그리고 상기 오디오 신호의 스펙트럼 표현인 스펙트럼 값들을 포함하여 이루어지고,
    상기 제 1 양자화 스텝 사이즈 및 간섭 임계치를 제공을 위한 수단 (502)이 심리음향 마스킹 임계치를 기반으로 주파수 밴드에 대해 허용되는 간섭을 계산하는 심리음향 모델로서 구성되는 것을 특징으로 하는 양자화 스텝 사이즈 결정 장치.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 도입된 제 1 간섭을 결정하기 위한 수단(504) 또는 상기 도입된 제 2 간섭을 계산하기 위한 수단(510)은 양자화 스텝 사이즈를 이용하여 양자화하고, 상기 양자화 스텝 사이즈를 이용하여 재양자화하고, 상기 재양자화된 신호 및 상기 신호 사이의 차이를 계산하도록 구성하여 상기 도입된 간섭을 구하는 것을 특징으로 하는 양자화 스텝 사이즈 결정 장치.
  4. 제 1 항에 있어서,
    상기 제 1 양자화 스텝 사이즈를 제공하기 위한 수단(502)이 다음의 수식에 따라 상기 양자화 스텝 사이즈를 계산하도록 구성되고,
    Figure 112007083645007-pct00018
    상기 제 2 양자화 스텝 사이즈로 양자화를 위한 수단(514)이 다음의 수식에 따라 양자화하도록 구성되고,
    Figure 112007083645007-pct00019
    여기서, xi 는 양자화될 스펙트럼 값이고, q 는 상기 양자화 스텝 사이즈 정보를 나타내며, s 는 0 또는 0 이 아닌 숫자이고, α는 1 이 아닌 지수이고,
    Figure 112007083645007-pct00020
    는 상기 허용된 간섭이고, i 는 상기 주파수 밴드 내의 스펙트럼 값들에 대한 실행 인덱스인 것을 특징으로 하는 양자화 스텝 사이즈 결정 장치.
  5. 제 1 항에 있어서,
    제 2 양자화 스텝 사이즈를 선택하기 위한 수단(508)은 상기 도입된 간섭이 상기 허용된 간섭보다 작을 때 더 큰 양자화 스텝 사이즈를 선택하도록 더 구성되는 것을 특징으로 하는 양자화 스텝 사이즈 결정 장치.
  6. 제 1 항에 있어서,
    상기 제 1 양자화 스텝 사이즈 및 간섭 임계치를 제공을 위한 수단(502)은 분석/합성 결정의 결과로서 상기 제 1 양자화 스텝 사이즈를 제공하도록 구성되는 것을 특징으로 하는 양자화 스텝 사이즈 결정 장치.
  7. 제 1 항에 있어서,
    제 2 양자화 스텝 사이즈를 선택하기 위한 수단(508)은 하나의 주파수 밴드에 대한 양자화 스텝 사이즈를 다른 주파수 밴드에 대한 양자화 스텝 사이즈와는 독립적으로 바꾸도록 구성되는 것을 특징으로 하는 양자화 스텝 사이즈 결정 장치.
  8. 제 1 항에 있어서,
    상기 제 1 양자화 스텝 사이즈 및 간섭 임계치를 제공을 위한 수단(502)은, 상기 제 1 양자화 스텝 사이즈가 선행 반복 단계에서 이용된 양자화 스텝 사이즈보다 더 거친 것이 되도록, 상기 제 1 양자화 스텝 사이즈를 결정하는 것을 특징으로 하는 양자화 스텝 사이즈 결정 장치.
  9. 오디오 또는 비디오 정보를 포함한 신호를 양자화하기 위한 양자화 스텝 사이즈를 결정하기 위한 방법으로서,
    제 1 양자화 스텝 사이즈 및 간섭 임계치를 제공하는 단계 (502);
    상기 제 1 양자화 스텝 사이즈에 의해 도입된 제 1 간섭을 결정하는 단계 (504);
    상기 제 1 양자화 스텝 사이즈에 의해 도입된 상기 간섭을 상기 간섭 임계치와 비교하는 단계 (506);
    도입된 상기 제 1 간섭이 상기 간섭 임계치를 초과한 경우에, 상기 제 1 양자화 스텝 사이즈보다 더 큰 제 2 양자화 스텝 사이즈를 선택하는 단계 (508);
    상기 제 2 양자화 스텝 사이즈에 의해 도입된 제 2 간섭을 결정하는 단계 (510);
    도입된 상기 제 2 간섭을 상기 간섭 임계치 또는 도입된 상기 제 1 간섭과 비교하는 단계 (512);
    도입된 상기 제 2 간섭이 도입된 상기 제 1 간섭보다 작거나, 상기 간섭 임계치보다 작을 경우에, 상기 제 2 양자화 스텝 사이즈를 이용하여 상기 신호를 양자화하는 단계 (514) 를 구비하는 양자화 스텝 사이즈 결정 방법.
  10. 컴퓨터에 제 9 항의 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.
KR1020067016577A 2004-03-01 2005-02-17 양자화 스텝 사이즈 결정 장치 및 방법 KR100852481B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102004009955A DE102004009955B3 (de) 2004-03-01 2004-03-01 Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite
DE102004009955.3 2004-03-01

Publications (2)

Publication Number Publication Date
KR20060121973A KR20060121973A (ko) 2006-11-29
KR100852481B1 true KR100852481B1 (ko) 2008-08-18

Family

ID=34745332

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067016577A KR100852481B1 (ko) 2004-03-01 2005-02-17 양자화 스텝 사이즈 결정 장치 및 방법

Country Status (17)

Country Link
US (2) US7574355B2 (ko)
EP (1) EP1687810B1 (ko)
JP (1) JP4531805B2 (ko)
KR (1) KR100852481B1 (ko)
CN (1) CN1922656B (ko)
AT (1) ATE386320T1 (ko)
AU (1) AU2005217508B2 (ko)
BR (1) BRPI0507229A (ko)
CA (1) CA2557777C (ko)
DE (2) DE102004009955B3 (ko)
ES (1) ES2302185T3 (ko)
HK (1) HK1093596A1 (ko)
IL (1) IL176688A (ko)
NO (1) NO338935B1 (ko)
PT (1) PT1687810E (ko)
RU (1) RU2329549C2 (ko)
WO (1) WO2005083681A1 (ko)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004009955B3 (de) 2004-03-01 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite
US7702161B2 (en) * 2005-10-28 2010-04-20 Aspeed Technology Inc. Progressive differential motion JPEG codec
FR2898443A1 (fr) * 2006-03-13 2007-09-14 France Telecom Procede de codage d'un signal audio source, dispositif de codage, procede et dispositif de decodage, signal, produits programme d'ordinateur correspondants
EP2122615B1 (en) * 2006-10-20 2011-05-11 Dolby Sweden AB Apparatus and method for encoding an information signal
KR101149448B1 (ko) * 2007-02-12 2012-05-25 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법
CN101308655B (zh) * 2007-05-16 2011-07-06 展讯通信(上海)有限公司 一种音频编解码方法与装置
ATE500588T1 (de) 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
US8559742B2 (en) * 2008-10-10 2013-10-15 Accusoft Corporation Image encoding methods and apparatus providing improved visual results
AU2011237882B2 (en) 2010-04-09 2014-07-24 Dolby International Ab MDCT-based complex prediction stereo coding
WO2012152764A1 (en) 2011-05-09 2012-11-15 Dolby International Ab Method and encoder for processing a digital stereo audio signal
KR20130047643A (ko) * 2011-10-28 2013-05-08 한국전자통신연구원 통신 시스템에서 신호 코덱 장치 및 방법
WO2013113351A1 (en) * 2012-01-30 2013-08-08 Nokia Siemens Networks Oy Processing a signal in station apparatus
US8947274B2 (en) * 2012-06-21 2015-02-03 Mitsubishi Electric Corporation Encoding apparatus, decoding apparatus, encoding method, encoding program, decoding method, and decoding program
CN105723454B (zh) * 2013-09-13 2020-01-24 三星电子株式会社 能量无损编码方法和设备、信号编码方法和设备、能量无损解码方法和设备及信号解码方法和设备
US11227615B2 (en) * 2017-09-08 2022-01-18 Sony Corporation Sound processing apparatus and sound processing method
KR102589303B1 (ko) * 2017-11-02 2023-10-24 삼성전자주식회사 고정 소수점 타입의 뉴럴 네트워크를 생성하는 방법 및 장치
DE102018112215B3 (de) * 2018-04-30 2019-07-25 Basler Ag Quantisiererbestimmung, computerlesbares Medium und Vorrichtung, die mindestens zwei Quantisierer implementiert
US10762910B2 (en) 2018-06-01 2020-09-01 Qualcomm Incorporated Hierarchical fine quantization for audio coding
US11701278B2 (en) 2019-08-23 2023-07-18 Hill-Rom Services. Inc. Technologies for efficiently tracking the location of a patient bed
US11165435B2 (en) 2019-10-08 2021-11-02 Tron Future Tech Inc. Signal converting apparatus
CN115052309A (zh) * 2021-03-09 2022-09-13 中兴通讯股份有限公司 干扰检测方法、装置、设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002080573A1 (en) * 2001-03-28 2002-10-10 Sony Corporation Quantization apparatus, quantization method, quantization program, and recording medium
KR20040065641A (ko) * 2003-01-15 2004-07-23 삼성전자주식회사 양자화 잡음 분포 조절 방법 및 장치
JP2007097005A (ja) * 2005-09-30 2007-04-12 Hitachi Ltd 可変利得増幅器
JP2008000004A (ja) * 2006-06-20 2008-01-10 Shimano Inc 釣り用グローブ
JP2008000002A (ja) * 2004-09-30 2008-01-10 Sysmex Corp リブロース2リン酸カルボキシラーゼスモールチェーン1A(RBCS−1A)遺伝子及び/又は該遺伝子のmRNAを検出するための核酸増幅用プライマ、及び内部標準として該遺伝子及び/又は該遺伝子のmRNAを用いた検査方法。

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4751736A (en) * 1985-01-31 1988-06-14 Communications Satellite Corporation Variable bit rate speech codec with backward-type prediction and quantization
EP0267344B1 (en) * 1986-10-30 1993-09-01 International Business Machines Corporation Process for the multi-rate encoding of signals, and device for carrying out said process
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US5542008A (en) * 1990-02-28 1996-07-30 Victor Company Of Japan, Ltd. Method of and apparatus for compressing image representing signals
EP0520068B1 (en) * 1991-01-08 1996-05-15 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US5664057A (en) * 1993-07-07 1997-09-02 Picturetel Corporation Fixed bit rate speech encoder/decoder
JPH07225598A (ja) * 1993-09-22 1995-08-22 Massachusetts Inst Of Technol <Mit> 動的に決定された臨界帯域を用いる音響コード化の方法および装置
US5682463A (en) * 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
US5754742A (en) * 1995-05-12 1998-05-19 Intel Corporation Setting quantization level to match DCT coefficients
JPH0944198A (ja) * 1995-07-25 1997-02-14 Victor Co Of Japan Ltd 音声の準可逆符号化装置
US5692102A (en) * 1995-10-26 1997-11-25 Motorola, Inc. Method device and system for an efficient noise injection process for low bitrate audio compression
US5924064A (en) * 1996-10-07 1999-07-13 Picturetel Corporation Variable length coding using a plurality of region bit allocation patterns
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
US6064954A (en) * 1997-04-03 2000-05-16 International Business Machines Corp. Digital audio signal coding
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
JP3784993B2 (ja) * 1998-06-26 2006-06-14 株式会社リコー 音響信号の符号化・量子化方法
US6363338B1 (en) * 1999-04-12 2002-03-26 Dolby Laboratories Licensing Corporation Quantization in perceptual audio coders with compensation for synthesis filter noise spreading
US6246345B1 (en) * 1999-04-16 2001-06-12 Dolby Laboratories Licensing Corporation Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
TW499672B (en) * 2000-02-18 2002-08-21 Intervideo Inc Fast convergence method for bit allocation stage of MPEG audio layer 3 encoders
ATE323316T1 (de) * 2001-04-09 2006-04-15 Koninkl Philips Electronics Nv Vorrichtung zur adpcm sprachkodierung mit spezifischer anpassung der schrittweite
DE10129239C1 (de) * 2001-06-18 2002-10-31 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Einbetten eines Wasserzeichens in ein Audiosignal
US6950794B1 (en) * 2001-11-20 2005-09-27 Cirrus Logic, Inc. Feedforward prediction of scalefactors based on allowable distortion for noise shaping in psychoacoustic-based compression
US7027982B2 (en) * 2001-12-14 2006-04-11 Microsoft Corporation Quality and rate control strategy for digital audio
US7146313B2 (en) * 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
US20040002859A1 (en) * 2002-06-26 2004-01-01 Chi-Min Liu Method and architecture of digital conding for transmitting and packing audio signals
WO2005004113A1 (ja) * 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
DE102004007200B3 (de) 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
DE102004007191B3 (de) * 2004-02-13 2005-09-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
DE102004007184B3 (de) 2004-02-13 2005-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Quantisieren eines Informationssignals
DE102004009955B3 (de) 2004-03-01 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite
US7668715B1 (en) * 2004-11-30 2010-02-23 Cirrus Logic, Inc. Methods for selecting an initial quantization step size in audio encoders and systems using the same
JP4921180B2 (ja) 2006-01-25 2012-04-25 キヤノン株式会社 放射線検出装置及び放射線撮像システム
EP2122615B1 (en) * 2006-10-20 2011-05-11 Dolby Sweden AB Apparatus and method for encoding an information signal
US8204744B2 (en) * 2008-12-01 2012-06-19 Research In Motion Limited Optimization of MP3 audio encoding by scale factors and global quantization step size

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002080573A1 (en) * 2001-03-28 2002-10-10 Sony Corporation Quantization apparatus, quantization method, quantization program, and recording medium
KR20040065641A (ko) * 2003-01-15 2004-07-23 삼성전자주식회사 양자화 잡음 분포 조절 방법 및 장치
JP2008000002A (ja) * 2004-09-30 2008-01-10 Sysmex Corp リブロース2リン酸カルボキシラーゼスモールチェーン1A(RBCS−1A)遺伝子及び/又は該遺伝子のmRNAを検出するための核酸増幅用プライマ、及び内部標準として該遺伝子及び/又は該遺伝子のmRNAを用いた検査方法。
JP2007097005A (ja) * 2005-09-30 2007-04-12 Hitachi Ltd 可変利得増幅器
JP2008000004A (ja) * 2006-06-20 2008-01-10 Shimano Inc 釣り用グローブ

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
10-2004-0065641
특1997-0057948
특2000-0023174
특2000-0046467

Also Published As

Publication number Publication date
EP1687810A1 (de) 2006-08-09
IL176688A0 (en) 2006-10-31
JP4531805B2 (ja) 2010-08-25
AU2005217508A1 (en) 2005-09-09
NO20064439L (no) 2006-11-29
US7574355B2 (en) 2009-08-11
RU2006130966A (ru) 2008-03-20
BRPI0507229A (pt) 2007-06-26
HK1093596A1 (en) 2007-03-02
RU2329549C2 (ru) 2008-07-20
DE102004009955B3 (de) 2005-08-11
CA2557777C (en) 2012-07-31
CA2557777A1 (en) 2005-09-09
PT1687810E (pt) 2008-05-23
WO2005083681A8 (de) 2008-03-27
WO2005083681A1 (de) 2005-09-09
NO338935B1 (no) 2016-10-31
US20060293884A1 (en) 2006-12-28
EP1687810B1 (de) 2008-02-13
US8756056B2 (en) 2014-06-17
IL176688A (en) 2011-01-31
JP2007525716A (ja) 2007-09-06
KR20060121973A (ko) 2006-11-29
ES2302185T3 (es) 2008-07-01
DE502005002824D1 (de) 2008-03-27
AU2005217508B2 (en) 2008-05-15
ATE386320T1 (de) 2008-03-15
CN1922656A (zh) 2007-02-28
US20090274210A1 (en) 2009-11-05
CN1922656B (zh) 2010-04-14

Similar Documents

Publication Publication Date Title
KR100852481B1 (ko) 양자화 스텝 사이즈 결정 장치 및 방법
US6064954A (en) Digital audio signal coding
KR100852482B1 (ko) 추정을 결정하는 방법 및 장치
KR101019678B1 (ko) 저비트율 오디오 코딩
US9009036B2 (en) Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding
TWI520129B (zh) 使用改良機率分布估計之基於線性預測的音訊寫碼技術
MX2008014222A (es) Codificacion de señal de informacion.
WO2008021247A9 (en) Arbitrary shaping of temporal noise envelope without side-information
RU2505921C2 (ru) Способ и устройство кодирования и декодирования аудиосигналов (варианты)
RU2762301C2 (ru) Устройство и способ для кодирования и декодирования аудиосигнала с использованием понижающей дискретизации или интерполяции масштабных параметров
WO2003107329A1 (en) Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
US8825494B2 (en) Computation apparatus and method, quantization apparatus and method, audio encoding apparatus and method, and program
CN114258567A (zh) 具有信号依赖数量和精度控制的音频编码器、音频解码器和相关方法与计算机程序
US7181079B2 (en) Time signal analysis and derivation of scale factors
AU2014280256B2 (en) Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding
EP3008726A1 (en) Apparatus and method for audio signal envelope encoding, processing and decoding by modelling a cumulative sum representation employing distribution quantization and coding
EP2192577A1 (en) Optimization of MP3 encoding with complete decoder compatibility
MXPA06009932A (en) Device and method for determining a quantiser step size
MXPA06009933A (en) Device and method for processing a multi-channel signal
BRPI0507229B1 (pt) Equipamento e método para a determinação da dimensão da etapa de quantização

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120727

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20130729

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140804

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150803

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20160808

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20170802

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20180731

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20190730

Year of fee payment: 12