KR20040065641A - 양자화 잡음 분포 조절 방법 및 장치 - Google Patents

양자화 잡음 분포 조절 방법 및 장치 Download PDF

Info

Publication number
KR20040065641A
KR20040065641A KR1020030002718A KR20030002718A KR20040065641A KR 20040065641 A KR20040065641 A KR 20040065641A KR 1020030002718 A KR1020030002718 A KR 1020030002718A KR 20030002718 A KR20030002718 A KR 20030002718A KR 20040065641 A KR20040065641 A KR 20040065641A
Authority
KR
South Korea
Prior art keywords
quantization noise
quantization
noise
calculated
scale factor
Prior art date
Application number
KR1020030002718A
Other languages
English (en)
Other versions
KR100477699B1 (ko
Inventor
장흥엽
장태규
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR10-2003-0002718A priority Critical patent/KR100477699B1/ko
Priority to US10/720,762 priority patent/US7373293B2/en
Priority to CNB2004100015234A priority patent/CN1249671C/zh
Publication of KR20040065641A publication Critical patent/KR20040065641A/ko
Application granted granted Critical
Publication of KR100477699B1 publication Critical patent/KR100477699B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 오디오 데이터의 압축에 관한 것으로, 구체적으로는 낮은 비트율로 오디오 데이터를 압축할 때 발생되는 양자화 잡음의 분포를 조절하는 방법 및 장치에 관한 것이다. 본 발명의 양자화 잡음의 분포 조절방법은 샘플링된 오디오 데이터의 양자화 수행시에 허용되는 소정의 양자화 오차 및 양자화 수행후의 MDCT 계수의 양자화 잡음 에너지 정보를, 가청 주파수를 소정의 간격으로 나눈 주파수 대역별로 입력받는 단계; 및 상기 양자화 오차와 상기 양자화 수행후의 MDCT 계수의 양자화 잡음 에너지의 차이가 큰 주파수 대역부터 소정의 개수만큼 우선적으로 상기 MDCT 계수의 양자화 잡음 에너지를 감소시키는 단계를 구비한다. 본 발명은 허용된 비트율로는 청각심리모델에 따라 얻어지는 임계치 이하로 양자화 잡음을 분포시킬 수는 없더라도 양자화 잡음의 포락선을 임계치 곡선과 동일한 모양으로 조정함으로서 주파수 대역별로 양자화 잡음이 임계치를 초과하는 양이 균등하게 분포되도록 할 수 있어 음질을 개선하는 효과가 있다.

Description

양자화 잡음 분포 조절 방법 및 장치{Quantization noise shaping method and apparatus}
본 발명은 오디오 데이터의 압축에 관한 것으로, 구체적으로는 낮은비트율(bitrate)로 오디오 데이터를 압축할 때 발생되는 양자화 잡음의 분포를 조절하는 방법 및 장치에 관한 것이다.
오디오 데이터의 압축은 샘플링 단계, 양자화 단계 및 인코딩 단계 등을 거쳐 이루어진다. 양자화(quantization)는 샘플링된 신호값을 일정한 대표값으로 나타내기 위하여 스텝모양의 정수값으로 표현하는 것으로 이 과정에서 양자화 잡음이 발생한다. 원래신호와 양자화된 신호와의 오차성분인 양자화 잡음은 양자화에 사용되는 비트수가 많아질수록 작아진다. 동영상 및 음성에 대한 압축 표준인 엠펙(MPEG)에서는, DCT(Discrete Cosine Transform) 또는 MDCT(Modified Discrete Cosine Transform) 변환에 의해 계산된 계수를 어떤 값으로 나누어 작은 값의 계수로 표현함으로써 부호화량을 감소시키는 것이 양자화이다.
오디오 데이터를 압축하는데 있어서 인간의 귀의 특성을 고려하여야 한다. 인간의 귀는 소리의 진원지에서 발생되는 음향의 세기가 어느 수준 이하가 되면 듣지 못한다. 사무실에서 누군가 큰 목소리로 이야기한다면 누가 이야기하는지 쉽게 파악할 수 있다. 하지만 그 순간 비행기가 지나간다면 전혀 들리지 않게 된다. 또한 비행기가 지나간 뒤에도 그 여운이 남아 잘 들리지 않는다. 이를 마스킹 효과라고 한다.
도 1은 마스킹 효과를 설명하기 위한 도면이다.
도 1에서 참조한 바와 같이 가청 주파수 내에서 인간이 들을 수 있는 최소한의 음압 레벨인 마스킹 곡선(130)이 있다고 할 때, 오디오 신호 A(110)는 이 마스킹 곡선(130) 이상의 음압을 가지고 있으므로 인간의 귀로 들을 수 있는 반면, 오디오 신호 B(120)는 마스킹 곡선(130) 이하의 음압을 가지고 있으므로 인간의 귀로 들을 수 없다.
이와 같이 인간의 귀로 들을 수 있는 주파수를 일정간격으로 나누어, 마스킹 임계치 이상의 음압을 가진 오디오 데이터만을 양자화하는 것을 청각심리모델(psychoacoustic model)을 사용한 양자화라고 하고, 엠펙(MPEG)과 같은 압축방법에서 사용된다. 그러나, 64Kbps 이하의 저속의 비트율로 오디오 신호를 압축하는 경우에는 양자화시에 사용될 수 있는 비트의 수에 한계가 있기 때문에 MPEG 표준에서 제시하고 있는 일반적인 오디오 압축방법은 효과적으로 오디오 신호를 압축하는데 적합하지 않다.
도 2a 내지 도 2b는 양자화 수행후에 발생되는 양자화 잡음을 주파수에 대하여 도시한 도면이다.
청각심리모델에서는 오디오 신호를 입력받아 FFT(Fast Fourier Transform)를 수행하여 각 주파수 대역별로 양자화 허용오차(210)를 계산하여 출력한다. 양자화 허용오차는 원래신호와 양자화된 신호의 차이를 인간의 귀로 느낄 수 없을 정도가 되도록 계산될 수 있다. 실제로 양자화를 수행하면 양자화 오차가 220과 같은 형태가 될 수도 있고, 230과 같은 형태가 될 수도 있다. 만일 230과 같은 형태의 양자화 오차가 얻어지면 청각심리모델에 의한 허용오차(210) 이내로 양자화 잡음이 들어오므로 음질에 영향이 없지만, 220과 같은 형태의 양자화 오차가 얻어지면 음질이 나빠지므로 양자화 오차를 허용오차(210) 이내로 들어오도록 조정해야 한다. 그러나, 저속 비트율의 오디오 신호의 경우에는 오디오 데이터를 표현하는데 사용될수 있는 비트의 수와 양자화시에 사용되는 비트의 수에 한계가 있으므로 항상 양자화 잡음을 허용오차이내로 조정할 수 있는 것은 아니다.
따라서, 오디오 신호의 압축에서 사용되는 종래의 양자화 알고리즘에서는 청각심리모델을 적용하여 계산되는 허용오차인 임계치 이하로 양자화 잡음을 분포시킬 수 없는 경우에는, 양자화 잡음 분포를 조정하는 단계의 수행 횟수를 제한하여 양자화 잡음 분포의 조정과정을 종료하는 단순한 방법을 사용하고 있다. 그러므로 경우에 따라서는 양자화 잡음의 분포가 임의의 모양을 가질 수 있어 주파수 대역에 따라서는 양자화 잡음이 청각심리모델에서 계산한 허용오차를 과도하게 초과하여 음질에 심각한 열화를 유발한다는 문제점이 있다.
본 발명이 이루고자 하는 기술적 과제는 비트율이 낮은 오디오 데이터를 양자화할 때 발생되는 양자화 잡음이, 모든 주파수 대역에서 청각심리모델에서 계산된 허용오차인 임계치 이상을 갖는다고 하더라도 양자화 잡음 곡선의 전체적인 형태를 청각심리모델에서 계산된 허용오차인 임계치 곡선 형태와 유사하게 되도록 양자화 잡음을 조정하여 음질의 왜곡을 감소시킬 수 있는 양자화 잡음 분포 조절방법 및 장치를 제공하는데 있다.
도 1은 마스킹 효과를 설명하기 위한 도면이다.
도 2a 내지 도 2b는 양자화 수행후에 발생되는 양자화 잡음을 주파수에 대하여 도시한 도면이다.
도 3은 양자화 잡음 분포를 조절하는 장치의 블록도이다.
도 4는 양자화 잡음 분포 조절방법의 상세 흐름도이다.
도 5a 내지 도 5b는 주파수 대역별 스케일 팩터 밴드 이득을 조정하여 양자화된 MDCT 계수의 잡음 에너지를 조정하는 것을 설명하는 도면이다.
도 6은 스케일 팩터 밴드 이득을 주파수 대역별로 선택적으로 증가시키는 과정을 설명하는 도면이다.
도 7은 본 발명의 양자화 잡음 감소방법의 흐름도이다.
도 8은 본 발명의 양자화 잡음 감소장치의 블록도이다.
상기의 과제를 이루기 위하여 본 발명에 의한 양자화 잡음 분포 조절 방법은, 샘플링된 오디오 데이터의 양자화 수행시에 허용되는 소정의 양자화 오차 및 양자화 수행후의 MDCT 계수의 양자화 잡음 에너지 정보를, 가청 주파수를 소정의간격으로 나눈 주파수 대역별로 입력받는 단계; 및 상기 양자화 오차와 상기 양자화 수행후의 MDCT 계수의 양자화 잡음 에너지의 차이가 큰 주파수 대역부터 소정의 개수만큼 우선적으로 상기 MDCT 계수의 양자화 잡음 에너지의 분포를 조절하는 단계를 구비한다.
상기의 과제를 이루기 위하여 본 발명에 의한 양자화 잡음 분포 조절 방법은, 소정의 비트율로 오디오 신호를 압축시에, 모든 주파수 대역에서의 양자화 잡음이 청각심리모델에 의하여 계산된 임계 잡음치보다 작도록 분포시킬 수 있는가를 판단하는 단계; 및 상기 양자화 잡음이 상기 임계 잡음치보다 작도록 분포시킬 수 없는 경우에는 상기 양자화 잡음의 주파수 대역별 분포가 상기 임계 잡음치의 주파수 대역별 분포 형태에 소정의 오프셋 차이만 존재하고 분포 형태는 동일하도록 상기 양자화 잡음의 주파수 대역별 분포 형태를 조정하는 단계를 구비한다.
상기의 과제를 이루기 위하여 본 발명에 의한 양자화 잡음 분포 조절 방법은, 양자화 수행후의 MDCT 계수의 전체 양자화 잡음과 청각심리모델에서 계산된 양자화 잡음 허용 임계치의 총합을 계산하는 단계; 상기 계산된 MDCT 계수의 전체 양자화 잡음값과 상기 양자화 잡음 허용 임계치의 총합을 비교하는 단계; 및 상기 양자화 수행후의 MDCT 계수의 전체 양자화 잡음값이 크지 않은 경우에는 전체 주파수 대역에서 양자화 잡음 감소를 수행하고, 상기 전체 양자화 잡음의 합이 허용 임계치의 합보다 큰 경우는 대역 선택적 양자화 잡음 감소를 수행하는 단계를 구비한다.
상기의 과제를 이루기 위하여 본 발명에 의한 양자화 잡음 분포 조절 장치는, 양자화 수행후의 MDCT 계수의 전체 양자화 잡음과 청각심리모델에서 계산된 양자화 잡음 허용치의 총합을 계산하는 양자화 잡음 계산부; 상기 계산된 MDCT 계수의 전체 양자화 잡음값과 상기 양자화 잡음 허용치의 총합을 비교하여 모든 주파수 대역에서 양자화 잡음 감소를 수행할 것인가 또는 주파수 대역에 따라서 선택적으로 양자화 잡음 감소를 수행할 것인가를 선택하는 잡음 감소 알고리즘 선택부; 모든 주파수 대역에서 양자화 잡음 감소를 수행하는 양자화 잡음 감소 수행부; 및 주파수 대역별로 선택적으로 양자화 잡음의 감소를 수행하는 대역 선택적 양자화 잡음 감소 수행부를 구비한다.
상기한 과제를 이루기 위하여 본 발명에서는, 상기 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.
도 3은 양자화 잡음 분포를 조절하는 장치의 블록도이다.
MPEG 오디오 인코더의 양자화부는 비트율 조절을 수행하는 비트율 제어부(310), 양자화 잡음 에너지를 계산하는 양자화 잡음 계산부(320), 청각심리모델 수행부로부터 입력받은 양자화 잡음 허용 임계치와 양자화 잡음 계산부(320)로부터 입력받은 양자화 잡음 에너지를 비교하여, 각 주파수 대역별로 주어지는 스케일 팩터 밴드 이득을 조정함으로써, 각 주파수 대역별로 양자화 잡음 곡선의 모양을 조정하는 스케일 팩터 밴드 이득 조절부(330) 및 소정의 조건이 되면 비트율 제어부(310)에게 비트수를 재조정하는 명령을 전달하고 양자화 과정의 종료여부를판단하는 판단부(340)로 구성되어 있다. 각 구성부에서 수행되는 동작은 MPEG 표준(ISO 14496-3 Annex B)에 상세히 설명되어 있다.
비트율 제어부(310)는 하나의 오디오 프레임을 입력받고, 입력받은 오디오 프레임의 MDCT(Modified DCT) 계수에 대해 양자화를 수행한다. 그리고, 양자화된 결과를 허프만(Huffman) 코딩하는데, 코딩시에 사용되는 비트수를 계산한다. 오디오 신호를 코딩하고자 하는 소정의 비트율이 정해져 있다고 할 때, 이 비트율에 해당하는 비트수를 계산하고, 계산된 비트수보다 적은 비트수를 코딩시에 사용할 때까지 공통 이득(common gain)을 조정하며 비트수를 맞춘다.
양자화가 수행된 MDCT 계수를 xquant, 입력받은 MDCT 계수를 mdct_line, 스케일 팩터를 sf 라고 하면 양자화가 수행된 MDCT 계수 xquant는 다음 수학식 1과 같이 표현된다.
그리고 스케일 팩터 sf는 다음 수학식 2에 의해서 계산된다.
sf= common_gain - sfb_gain(sfb)
수학식 2에서 common_gain은 공통 이득으로 하나의 프레임에서 주어진 비트량을 만족시키기 위해 사용되는 값으로 내부 루프에서 결정이 되고, sfb_gain은 양자화 잡음의 분포를 조절하기 위하여 스케일 팩터를 조정한 정도를 의미하는 스케일 팩터 밴드 이득으로, 주파수 대역에 따라서 달라지는 외부 루프에서 결정되는 값이다. 따라서 sfb_gain을 sfb의 함수로 표시하였다. 수학식 1과 수학식 2를 참조하면 알 수 있듯이, 양자화가 수행된 MDCT 계수 xquant와 mdct_line 사이의 오차가 적으려면 공통 이득(common_gain)이 작아야 하고, 스케일 팩터 밴드 이득(sfb_gain)은 커야 한다.
잡음 에너지 계산부(320)는 입력된 MDCT 주파수 계수(mdct_line)와 양자화가 수행된 MDCT 계수(xquant)의 차이로부터 주파수 대역별로 양자화 잡음을 계산한다.
스케일 팩터 밴드 이득 조절부(330)는 잡음 에너지 계산부(320)로부터 입력된 양자화 잡음과 청각심리모델로부터 입력된 양자화 잡음 허용 임계치를 비교하여 각 주파수 대역별로 양자화 잡음의 정도를 조정한다. 각 주파수 대역별로 양자화 잡음의 정도를 조정하는 것은 스케일 팩터 밴드 이득을 조정하여 이루어진다.
판단부(340)는 스케일 팩터를 조정하여 양자화 잡음을 조정한 후 조정된 스케일 팩터 밴드 이득이 소정의 최대값까지 증폭이 되었는가, 주파수 대역별로 조정된 스케일 팩터 밴드 이득의 차이가 소정의 기준치 이상인가 또는 청각심리모델에서 계산된 양자화 잡음 허용 임계치 모든 주파수 대역에서 작은 양자화 잡음을 갖는가를 판단하여 양자화 과정의 종료 여부를 결정한다.
종래의 양자화 잡음 분포 조절 방법에서는 모든 주파수 대역에 공통으로 적용되는 공통 이득(common gain)을 조정하여 정해진 비트율에 비트 사용량을 맞추는 내부 루프와, 각 주파수 대역별로 양자화 잡음의 크기를 조정할 수 있는 스케일 팩터 밴드 이득을 조정하는 외부 루프를 수행한다. 외부 루프에서는 각 주파수 대역별로 조정된 스케일 팩터 밴드 이득을 적용해 부호화하여 사용된 비트량을, 주파수 대역별로 할당된 비트수를 합산하여 이 값이 소정의 허용된 값을 초과하는 경우에는 공통 이득을 증가시켜 비트 사용량을 허용치 이하로 만들고, 다시 각 주파수 대역별로 주어진 임계치를 넘지 않도록 주파수 대역별 스케일 팩터 밴드 이득을 일정한 크기로 증가시키는 외부 루프를 수행하며, 이러한 과정을 반복적으로 수행하여 모든 주파수 대역에서의 양자화 잡음이 임계치를 넘지 않을 때까지 계속한다.
도 4는 양자화 잡음 분포 조절 방법의 상세 흐름도이다.
오디오 신호를 코딩하고자 하는 소정의 비트율이 정해져 있다고 할 때, 이 비트율에 해당하는 비트수를 계산하고, 계산된 비트수보다 적은 비트수를 코딩시에 사용할 때까지 공통 이득(common gain)을 조정하며 비트수를 맞춘다.
비트율 제어를 수행한다(S410). 즉, 하나의 오디오 프레임을 입력받아 MDCT 계수에 대해 양자화를 수행한다. 그리고, 양자화된 결과를 허프만(Huffman) 코딩하는데, 코딩시에 사용되는 비트수를 계산한다. 오디오 신호를 코딩하고자 하는 소정의 비트율이 정해져 있다고 할 때, 이 비트율에 해당하는 비트수를 계산하고, 계산된 비트수보다 적은 비트수를 코딩시에 사용할 때까지 공통 이득(common gain)을 조정하며 비트수를 맞춘다. 예를 들어 44.1KHz로 샘플링된 오디오 신호의 하나의 프레임의 샘플 갯수가 1024 개라고 하고, 이를 128kbps로 코딩할 때 사용되는 비트수는 다음 수학식 3과 같이 계산된다. 그러면 수학식 3에서 얻어진 비트 수보다 작은 값이 될 때까지 공통이득을 조정한다.
다음으로 가청 주파수를 소정의 간격으로 분할한 주파수 대역별로 양자화 잡음 에너지를 계산한다(S420). 즉, 입력된 MDCT 계수(mdct_line)와 양자화된 MDCT 계수(xquant)의 차이로부터 대역별로 양자화 잡음 에너지의 크기를 계산한다. 그리고 이때 사용되는 스케일 팩터를 저장한다(S430). 계산된 양자화 에너지의 크기가 청각심리모델에서 계산된 양자화 잡음 허용 오차인 임계치 이상인가를 판단하여(S440), 양자화 잡음 허용 오차가 임계치 이상이면 양자화가 수행된 MDCT 계수의 잡음 에너지가 작아지도록 한다. 이때 스케일 팩터 밴드 이득을 조정하여 잡음 에너지를 감소시킬 수 있다.
도 5a 내지 도 5b는 주파수 대역별 스케일 밴드 이득을 조정하여 양자화된 MDCT 계수의 잡음 에너지를 조정하는 것을 설명하는 도면이다.
양자화된 계수의 잡음 에너지가 도 5a에 도시한 것과 같은 모양(520)을 갖는다고 가정하면, 도 5a를 참조하여 알 수 있듯이 청각심리모델에서 계산된 허용오차(510)보다 양자화된 MDCT 계수의 잡음 에너지가 크므로, 각 주파수 대역별 스케일 팩터 밴드 이득을 조정하여야 한다(S450). 그리고 나서 모든 주파수 대역의 스케일 팩터 밴드 이득을 증가시켰는가를 판단한다(S460). 모든 주파수 대역의 스케일 팩터 밴드 이득을 증가시켰으면, 주어진 비트율로는 원하는 음질 조건을 만족시킬 수 없다고 판단하여, S430 단계에서 저장하였던 스케일 팩터를 사용하여 양자화 잡음의 조정을 종료하고(S490), 그렇지 않으면 다음 단계를 수행한다.
스케일 팩터 밴드 이득을 조정하면 양자화 잡음이 실선의 화살표(530)와 같이 조정될 수도 있고, 점선의 화살표(540)와 같이 조정될 수도 있다. 그러나 스케일 팩터 밴드 이득을 제한없이 증가시킬 수 있는 것이 아니다. 따라서, 소정의 제한값 이상으로 스케일 팩터 밴드 이득을 증가시켜야만 청각심리모델에 의한 허용오차(510) 이내로 양자화 잡음을 조정할 수 있는가를 판단한다(S470). 만일 소정의 제한값 이상으로 스케일 팩터 밴드 이득을 증가시켜야만 청각심리모델에 의한 허용오차(510) 이내로 양자화 잡음을 조정할 수 있다면, 주어진 비트율로는 원하는 음질 조건을 만족시킬 수 없는 것으로 판단하여 저장된 스케일 팩터를 사용하여 양자화 잡음의 조정을 종료하고(S490), 그렇지 않으면 다음 단계를 수행한다.
적어도 하나의 주파수 대역에서의 양자화 잡음이 임계치 이상인가를 판단하여(S480), 임계치 이상이면 처음 단계인 비트율 제어수행 단계(S410)부터 다시 시작하여 비트수를 조정해 나간다. 즉 비트수를 조금 늘려서 임계치 이하가 되도록 조금씩 조정해 나간다.
도 6은 스케일 팩터 밴드 이득을 주파수 대역별로 선택적으로 증가시키는 과정을 설명하는 도면이다.
도 6에서 도시한 바와 같이 청각심리모델에서 계산된 허용오차(610)가 주어졌고, 양자화된 MDCT 계수의 잡음 에너지(620)가 계산되었다고 하면, 허용오차(610)와 양자화된 MDCT 계수의 잡음 에너지(620)의 차이가 나타나는 소정의 개수의 밴드의 양자화 오차를 먼저 줄인다. 도 6에서는 주파수 밴드1(640), 주파수 밴드2(650), 주파수 밴드3(660)에서 차이가 가장 크게 나타난다. 따라서 이들 주파수 대역에서 양자화 오차를 먼저 줄인다. 다시 말하면, 양자화된 MDCT 계수의 잡음 에너지를 모든 주파수 대역에 대해서 일률적으로 줄이지 않고 소정의 개수의 특정 주파수 대역에서 오차를 줄이는 것을 반복하여 수행함으로써 각 대역별로 발생하는 오차의 양을 균등하게 분포시킨다.
본 발명의 MPEG 오디오 압축시의 양자화 잡음 분포 조절 방법은 허용된 비트율이 너무 낮아 양자화 잡음을 청각심리모델에 의해 산출된 임계 잡음 레벨보다 작게 분포시키지는 못하더라도 양자화 잡음의 주파수 대역별 분포가 청각심리모델에 의한 임계 잡음 레벨의 주파수 대역별 분포 형태와 비슷한 모양을 갖도록 조정하기 위하여 MPEG 표준에서의 스케일 팩터 조절부에서 스케일 팩터 밴드 이득을 조절하는 것을 경우에 따라서 달리 수행하도록 한다.
즉, 종래의 방법에서는 각 주파수 대역별로 양자화 잡음과 허용된 임계치를 비교하여 각 주파수 대역의 스케일 팩터 밴드 이득을 증가시키는 외부 루프의 수행이 대역별로 독립적으로 이루어졌다. 본 발명에서는 이러한 스케일 팩터 밴드 이득의 조정을 수행하는 외부 루프에서 대역별로 임계치를 비교하는 대신에, 각 주파수 대역별로 잡음대 마스크비(Noise to Mask Ratio : NMR)의 순위에 따라 전체 주파수 대역중 양자화 잡음이 가장 큰 상위 일부의 주파수 대역의 스케일 팩터 밴드 이득을 우선적으로 조정하여 외부 루프의 수행을 종료한다.
도 7은 본 발명의 양자화 잡음 감소방법의 흐름도이다.
우선, 양자화 수행후의 MDCT 계수의 전체 양자화 잡음과 청각심리모델에서계산된 양자화 잡음 허용 임계치의 총합을 계산한다(S710). 계산된 MDCT 계수의 전체 양자화 잡음값과 양자화 잡음 허용 임계치의 총합을 비교하여(S720), 양자화 수행후의 MDCT 계수의 전체 양자화 잡음이 크지 않은 경우에는 기존의 방법으로 양자화 잡음 감소를 수행한다(S730). 그리고, 양자화 잡음의 합이 양자화 잡음 허용 임계치의 합보다 큰 경우는 주파수 대역별로 선택적 양자화 잡음 감소를 수행한다(S740). 즉, 양자화 잡음이 양자화 잡음 허용 임계치보다 큰 주파수 대역들을 대상으로 대역별 잡음대 마스크 비(NMR)가 큰 순서에 따라 상위 일부의 주파수 대역의 스케일 팩터 밴드 이득을 조정하여 외부 루프의 수행을 마친다. 전체 주파수 대역에서의 양자화 잡음 감소 과정은 도 4를 참조하여 설명한 것과 동일하다.
도 8은 본 발명의 양자화 잡음 감소장치의 블록도이다.
양자화 잡음 감소장치는 양자화 잡음 계산부(810), 잡음 감소 알고리즘 선택부(820), 양자화 잡음 감소 수행부(830) 및 대역 선택적 양자화 잡음 감소 수행부(840)로 구성되어 있다.
양자화 잡음 계산부(810)는 양자화 수행후의 MDCT 계수의 전체 양자화 잡음과 청각심리모델에서 계산된 양자화 잡음 허용치의 총합을 계산한다.
잡음 감소 알고리즘 선택부(820)는 양자화 잡음 계산부(810)에서 계산된 MDCT 계수의 전체 양자화 잡음값과 양자화 잡음 허용치의 총합을 비교하여 모든 주파수 대역에서 양자화 잡음 감소를 수행할 것인가 또는 주파수 대역에 따라서 선택적으로 양자화 잡음 감소를 수행할 것인가를 선택한다.
양자화 잡음 감소 수행부(830)는 모든 주파수 대역에서 양자화 잡음 감소를수행한다. 즉, 오디오 신호를 압축할 때 사용되는 소정의 비트율이 정해져 있다고 할 때, 그 소정의 비트율에 해당하는 비트수를 계산하고, 계산된 비트수보다 적은 비트수를 코딩시에 사용할 때까지 공통 이득(common gain)을 조정하며 비트수를 조절하고, 스케일 팩터 밴드 이득을 조정하여 주파수 대역별로 양자화 잡음의 감소 정도를 조정한다. 상세한 사항은 도 4를 참조하여 설명한 바와 같다.
대역 선택적 양자화 잡음 감소 수행부(840)는 주파수 대역별 선택적으로 양자화 잡음 감소를 수행한다. 즉, 양자화 수행후의 MDCT 계수의 양자화 잡음이 청각심리모델에서의 양자화 잡음 허용치보다 큰 주파수 대역들의 스케일 팩터 밴드 이득들 중에서, 주파수 대역별 잡음대 마스크 비(NMR)가 큰 순서에 따라 소정의 개수의 주파수 대역의 스케일 팩터를 조정한다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
상술한 바와 같이 본 발명은, 허용된 비트율로는 청각심리모델에 따라 얻어지는 임계치 이하로 양자화 잡음을 분포시킬 수는 없더라도 양자화 잡음의 포락선을 임계치 곡선과 동일한 모양으로 조정함으로서 주파수 대역별로 양자화 잡음이 임계치를 초과하는 양이 균등하게 분포되는 효과를 얻을 수 있으므로, 종래의 방법을 사용한 경우와 같이 일부 주파수 대역에서 과도하게 임계치를 초과하는 현상을 방지하여 음질을 향상시키는 효과가 있다.
기존 MPEG 오디오 압축의 양자화는 제한된 비트수에 대해서 비효율적인 비트 할당을 초래하여 음질 열화에 직접적인 영향을 미친다. 본 발명은 종래의 비트할당방법을 선택적으로 수용하면서 저비트율에서 주파수 대역별 양자화 잡음 감소가 요구되는 대역이 많은 경우 모든 주파수 대역의 양자화 잡음을 감소시키지 않고 일정 비율에 해당하는 주파수 대역의 양자화 잡음을 우선적으로 감소시킨다. 이러한 양자화 과정을 거치면 모든 주파수 대역에 대한 양자화 잡음을 임계치보다 작게 할 수는 없다고 하더라도, 임계치의 크기 분포와 비슷한 형태로 양자화 잡음의 분포를 얻음으로써 음질을 개선시키는 효과가 있다.

Claims (17)

  1. (a) 샘플링된 오디오 데이터의 양자화 수행시에 허용되는 소정의 양자화 오차 및 양자화 수행후의 MDCT 계수의 양자화 잡음 에너지 정보를, 가청 주파수를 소정의 간격으로 나눈 주파수 대역별로 입력받는 단계; 및
    (b) 상기 양자화 오차와 상기 양자화 수행후의 MDCT 계수의 양자화 잡음 에너지의 차이가 큰 주파수 대역부터 소정의 개수만큼 우선적으로 상기 MDCT 계수의 양자화 잡음 에너지를 감소시키는 단계를 포함하는 것을 특징으로 하는 양자화 잡음 분포 조절 방법.
  2. 제1항에 있어서,
    상기 소정의 양자화 오차는 청각심리모델에 의하여 계산되어 입력되는 것을 특징으로 하는 양자화 잡음 분포 조절 방법.
  3. 제1항에 있어서, 상기 양자화 잡음 에너지를 감소시키는 것은
    스케일 팩터 밴드 이득을 증가시켜서 양자화 잡음 에너지를 감소시키는 것을 특징으로 하는 양자화 잡음 분포 조절 방법.
  4. (a) 소정의 비트율로 오디오 신호를 압축시에, 모든 주파수 대역에서의 양자화 잡음이 청각심리모델에 의하여 계산된 임계 잡음치보다 작도록 분포시킬 수 있는가를 판단하는 단계; 및
    (b) 상기 양자화 잡음이 상기 임계 잡음치보다 작도록 분포시킬 수 없는 경우에는 상기 양자화 잡음의 주파수 대역별 분포가 상기 임계 잡음치의 주파수 대역별 분포 형태에 소정의 오프셋 차이만 존재하고 분포 형태는 동일하도록 상기 양자화 잡음의 주파수 대역별 분포 형태를 조정하는 단계를 포함하는 것을 특징으로 하는 양자화 잡음 분포 조절 방법.
  5. 제4항에 있어서 상기 (b) 단계는
    스케일 팩터 밴드 이득을 조정하여 양자화 잡음의 주파수 대역별 분포 형태를 조정하는 것을 특징으로 하는 양자화 잡음 분포 조절 방법.
  6. (a) 양자화 수행후의 MDCT 계수의 전체 양자화 잡음과 청각심리모델에서 계산된 양자화 잡음 허용 임계치의 총합을 계산하는 단계;
    (b) 상기 계산된 MDCT 계수의 전체 양자화 잡음값과 상기 양자화 잡음 허용 임계치의 총합을 비교하는 단계; 및
    (c) 상기 양자화 수행후의 MDCT 계수의 전체 양자화 잡음값이 크지 않은 경우에는 전체 주파수 대역에서 양자화 잡음 감소를 수행하고, 상기 전체 양자화 잡음의 합이 허용 임계치의 합보다 큰 경우는 대역 선택적 양자화 잡음 감소를 수행하는 단계를 포함하는 것을 특징으로 하는 양자화 잡음 분포 조절 방법.
  7. 제6항에 있어서, 상기 (c) 단계의 전체 주파수 대역에서 양자화 잡음 감소의 수행은
    (c1) 오디오 신호를 압축할 때 사용되는 소정의 비트율이 정해져 있다고 할 때, 상기 소정의 비트율에 해당하는 비트수를 계산하고, 계산된 비트수보다 적은 비트수를 코딩시에 사용할 때까지 공통 이득(common gain)을 조정하며 비트수를 설정하는 단계; 및
    (c2) 스케일 팩터 밴드 이득을 조정하여 주파수 대역별로 양자화 잡음의 감소 정도를 조정하는 단계를 포함하는 것을 특징으로 하는 양자화 잡음 분포 조절 방법.
  8. 제6항에 있어서, 상기 (c) 단계의 대역 선택적 양자화 잡음 감소의 수행은
    (c1) 오디오 프레임을 입력받아 MDCT 계수에 대해 양자화를 수행하고 양자화된 결과를 허프만 코딩하며, 압축시에 사용되는 비트수를 계산하여 상기 계산된 비트수보다 적은 비트수를 압축시에 사용하도록 비트수를 설정하여 비트율 제어를 수행하는 단계;
    (c2) 가청 주파수를 소정의 간격으로 분할한 주파수 대역별로 양자화 잡음 에너지를 계산하는 단계;
    (c3) 상기 양자화시에 사용된 스케일 팩터를 저장하는 단계;
    (c4) 상기 계산된 양자화 에너지의 크기가 청각심리모델에서 계산된 양자화 잡음 허용 오차인 임계치 이상인가를 판단하여, 상기 양자화 잡음 허용 오차가 상기 임계치 이상이면 상기 양자화 수행후의 MDCT 계수의 잡음 에너지가 작아지도록 조정하는 단계;
    (c5) 모든 주파수 대역에서 스케일 팩터 밴드 이득을 증가시켰는가를 판단하여, 모든 주파수 대역에서 스케일 팩터 밴드 이득을 증가시켰으면, 상기 저장한 스케일 팩터를 사용하여 양자화 잡음의 조정을 종료하는 단계;
    (c6) 상기 판단결과 일부 주파수 대역의 스케일 팩터 밴드 이득을 증가시켰으면 증가시킨 정도가 소정의 제한값 이상으로 스케일 팩터 밴드 이득을 증가시켜야만 상기 청각심리모델에서의 양자화 잡음 허용치 이내로 양자화 잡음을 조정할 수 있는가를 판단하는 단계; 및
    (c7) 상기 판단결과 만일 소정의 제한값 이상으로 스케일 팩터 밴드 이득을 증가시켜야만 상기 청각심리모델에서의 양자화 잡음 허용치 이내로 양자화 잡음을 조정할 수 있다고 판단되면, 상기 저장된 스케일 팩터를 사용하여 양자화 잡음의 조정을 종료하고, 그렇지 않으면 상기 비트율 제어 수행단계를 다시 수행하는 단계를 포함하는 것을 특징으로 하는 양자화 잡음 분포 조절 방법.
  9. 제8항에 있어서, 상기 (c1) 단계는
    공통이득을 조정하여 비트율 제어를 수행하는 것을 특징으로 하는 양자화 잡음 분포 조절 방법.
  10. 제8항에 있어서, 상기 (c4) 단계는
    스케일 팩터 밴드 이득을 조정하여 상기 양자화 수행후의 MDCT 계수의 양자화 잡음을 조정하는 것을 특징으로 하는 양자화 잡음 분포 조절 방법.
  11. 제6항에 있어서, 상기 (c) 단계의 대역 선택적 양자화 잡음 감소는
    양자화 수행후의 MDCT 계수의 양자화 잡음이 청각심리모델에서의 양자화 잡음 허용치보다 큰 주파수 대역들의 스케일 팩터 밴드 이득들 중에서, 주파수 대역별 잡음대 마스크 비(NMR)가 큰 순서에 따라 소정의 개수의 주파수 대역의 스케일 팩터를 조정하는 것을 특징으로 하는 양자화 잡음 분포 조절 방법.
  12. 양자화 수행후의 MDCT 계수의 전체 양자화 잡음과 청각심리모델에서 계산된 양자화 잡음 허용치의 총합을 계산하는 양자화 잡음 계산부;
    상기 계산된 MDCT 계수의 전체 양자화 잡음값과 상기 양자화 잡음 허용치의 총합을 비교하여 모든 주파수 대역에서 양자화 잡음 감소를 수행할 것인가 또는 주파수 대역에 따라서 선택적으로 양자화 잡음 감소를 수행할 것인가를 선택하는 잡음 감소 알고리즘 선택부;
    모든 주파수 대역에서 양자화 잡음 감소를 수행하는 양자화 잡음 감소 수행부; 및
    주파수 대역별로 선택적으로 양자화 잡음의 감소를 수행하는 대역 선택적 양자화 잡음 감소 수행부를 포함하는 것을 특징으로 하는 양자화 잡음 분포 조절 장치.
  13. 제12항에 있어서 상기 양자화 잡음 감소 수행부는
    오디오 신호를 압축할 때 사용되는 소정의 비트율이 정해져 있다고 할 때, 상기 소정의 비트율에 해당하는 비트수를 계산하고, 계산된 비트수보다 적은 비트수를 코딩시에 사용할 때까지 공통 이득(common gain)을 조정하며 비트수를 설정하고, 스케일 팩터 밴드 이득을 조정하여 주파수 대역별로 양자화 잡음의 감소 정도를 조정하는 것을 특징으로 하는 양자화 잡음 분포 조절 장치.
  14. 제12항에 있어서 상기 대역 선택적 양자화 잡음 감소 수행부는
    양자화 수행후의 MDCT 계수의 양자화 잡음이 청각심리모델에서의 양자화 잡음 허용치보다 큰 주파수 대역들의 스케일 팩터 밴드 이득들 중에서, 주파수 대역별 잡음대 마스크 비(NMR)가 큰 순서에 따라 소정의 개수의 주파수 대역의 스케일 팩터 밴드 이득을 조정하는 것을 특징으로 하는 양자화 잡음 분포 조절 장치.
  15. (a) 샘플링된 오디오 데이터의 양자화 수행시에 허용되는 소정의 양자화 오차 및 양자화 수행후의 MDCT 계수의 양자화 잡음 에너지 정보를, 가청 주파수를 소정의 간격으로 나눈 주파수 대역별로 입력받는 단계; 및
    (b) 상기 양자화 오차와 상기 양자화 수행후의 MDCT 계수의 양자화 잡음 에너지의 차이가 큰 주파수 대역부터 소정의 갯수만큼 우선적으로 상기 MDCT 계수의 양자화 잡음 에너지를 감소시키는 단계를 포함하는 것을 특징으로 하는 양자화 잡음 분포 조절 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  16. (a) 소정의 비트율로 오디오 신호를 압축시에, 모든 주파수 대역에서의 양자화 잡음이 청각심리모델에 의하여 계산된 임계 잡음치보다 작도록 분포시킬 수 있는가를 판단하는 단계; 및
    (b) 상기 양자화 잡음이 상기 임계 잡음치보다 작도록 분포시킬 수 없는 경우에는 상기 양자화 잡음의 주파수 대역별 분포가 상기 임계 잡음치의 주파수 대역별 분포 형태에 소정의 오프셋 차이만 존재하고 분포 형태는 동일하도록 상기 양자화 잡음의 주파수 대역별 분포 형태를 조정하는 단계를 포함하는 것을 특징으로 하는 양자화 잡음 분포 조절 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  17. (a) 양자화 수행후의 MDCT 계수의 전체 양자화 잡음과 청각심리모델에서 계산된 양자화 잡음 허용 임계치의 총합을 계산하는 단계;
    (b) 상기 계산된 MDCT 계수의 전체 양자화 잡음값과 상기 양자화 잡음 허용 임계치의 총합을 비교하는 단계; 및
    (c) 상기 양자화 수행후의 MDCT 계수의 전체 양자화 잡음값이 크지 않은 경우에는 전체 주파수 대역에서 양자화 잡음 감소를 수행하고, 상기 전체 양자화 잡음의 합이 허용 임계치의 합보다 큰 경우는 대역 선택적 양자화 잡음 감소를 수행하는 단계를 포함하는 것을 특징으로 하는 양자화 잡음 분포 조절 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR10-2003-0002718A 2003-01-15 2003-01-15 양자화 잡음 분포 조절 방법 및 장치 KR100477699B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR10-2003-0002718A KR100477699B1 (ko) 2003-01-15 2003-01-15 양자화 잡음 분포 조절 방법 및 장치
US10/720,762 US7373293B2 (en) 2003-01-15 2003-11-25 Quantization noise shaping method and apparatus
CNB2004100015234A CN1249671C (zh) 2003-01-15 2004-01-13 量化噪声整形方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2003-0002718A KR100477699B1 (ko) 2003-01-15 2003-01-15 양자화 잡음 분포 조절 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20040065641A true KR20040065641A (ko) 2004-07-23
KR100477699B1 KR100477699B1 (ko) 2005-03-18

Family

ID=32906497

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2003-0002718A KR100477699B1 (ko) 2003-01-15 2003-01-15 양자화 잡음 분포 조절 방법 및 장치

Country Status (3)

Country Link
US (1) US7373293B2 (ko)
KR (1) KR100477699B1 (ko)
CN (1) CN1249671C (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100852481B1 (ko) * 2004-03-01 2008-08-18 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. 양자화 스텝 사이즈 결정 장치 및 방법
US10515643B2 (en) 2011-04-05 2019-12-24 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder, decoder, program, and recording medium
CN113360124A (zh) * 2020-03-05 2021-09-07 Oppo广东移动通信有限公司 音频输入输出控制方法和装置、电子设备、可读存储介质

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7620545B2 (en) * 2003-07-08 2009-11-17 Industrial Technology Research Institute Scale factor based bit shifting in fine granularity scalability audio coding
CN1588806B (zh) * 2004-09-03 2010-04-28 浙江大学 量化噪声整形调制器及量化噪声整形方法
KR100943606B1 (ko) * 2006-03-30 2010-02-24 삼성전자주식회사 디지털 통신 시스템에서 양자화 장치 및 방법
US20070270987A1 (en) * 2006-05-18 2007-11-22 Sharp Kabushiki Kaisha Signal processing method, signal processing apparatus and recording medium
JP5618826B2 (ja) * 2007-06-14 2014-11-05 ヴォイスエイジ・コーポレーション Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法
JP2010529511A (ja) * 2007-06-14 2010-08-26 フランス・テレコム 符号器の量子化ノイズを復号化中に低減するための後処理方法及び装置
CN101388215B (zh) * 2007-09-15 2011-01-12 华为技术有限公司 一种噪声整形的方法和装置
KR101435411B1 (ko) * 2007-09-28 2014-08-28 삼성전자주식회사 심리 음향 모델의 마스킹 효과에 따라 적응적으로 양자화간격을 결정하는 방법과 이를 이용한 오디오 신호의부호화/복호화 방법 및 그 장치
MX2011000382A (es) * 2008-07-11 2011-02-25 Fraunhofer Ges Forschung Codificador de audio, decodificador de audio, metodos para la codificacion y decodificacion de audio; transmision de audio y programa de computacion.
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8606571B1 (en) * 2010-04-19 2013-12-10 Audience, Inc. Spatial selectivity noise reduction tradeoff for multi-microphone systems
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
WO2012150482A1 (en) * 2011-05-04 2012-11-08 Nokia Corporation Encoding of stereophonic signals
CN104095640A (zh) * 2013-04-03 2014-10-15 达尔生技股份有限公司 血氧饱和度检测方法及装置
US20180317019A1 (en) 2013-05-23 2018-11-01 Knowles Electronics, Llc Acoustic activity detecting microphone
PT3008726T (pt) 2013-06-10 2017-11-24 Fraunhofer Ges Forschung Aparelho e método de codificação, processamento e descodificação de envelope de sinal de áudio por modelação da representação de soma cumulativa empregando codificação e quantização de distribuição
ES2941782T3 (es) * 2013-12-19 2023-05-25 Ericsson Telefon Ab L M Estimación de ruido de fondo en señales de audio
US10045140B2 (en) 2015-01-07 2018-08-07 Knowles Electronics, Llc Utilizing digital microphones for low power keyword detection and noise suppression
US9576589B2 (en) * 2015-02-06 2017-02-21 Knuedge, Inc. Harmonic feature processing for reducing noise
WO2017219277A1 (zh) * 2016-06-22 2017-12-28 张升泽 电子芯片的噪声绘制方法及系统
CN106096174A (zh) * 2016-06-22 2016-11-09 张升泽 电子芯片的噪声绘制方法及系统
JP6816277B2 (ja) * 2017-07-03 2021-01-20 パイオニア株式会社 信号処理装置、制御方法、プログラム及び記憶媒体
US10559315B2 (en) * 2018-03-28 2020-02-11 Qualcomm Incorporated Extended-range coarse-fine quantization for audio coding
US11295750B2 (en) * 2018-09-27 2022-04-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for noise shaping using subspace projections for low-rate coding of speech and audio
US11170799B2 (en) * 2019-02-13 2021-11-09 Harman International Industries, Incorporated Nonlinear noise reduction system
US11418901B1 (en) 2021-02-01 2022-08-16 Harman International Industries, Incorporated System and method for providing three-dimensional immersive sound

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3191457B2 (ja) * 1992-10-31 2001-07-23 ソニー株式会社 高能率符号化装置、ノイズスペクトル変更装置及び方法
AU5663296A (en) * 1995-04-10 1996-10-30 Corporate Computer Systems, Inc. System for compression and decompression of audio signals fo r digital transmission
JP3189660B2 (ja) * 1996-01-30 2001-07-16 ソニー株式会社 信号符号化方法
JP3328532B2 (ja) * 1997-01-22 2002-09-24 シャープ株式会社 デジタルデータの符号化方法
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
DE19736669C1 (de) * 1997-08-22 1998-10-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals
US6466912B1 (en) * 1997-09-25 2002-10-15 At&T Corp. Perceptual coding of audio signals employing envelope uncertainty
JPH11234136A (ja) * 1998-02-19 1999-08-27 Sanyo Electric Co Ltd デジタルデータの符号化方法及び符号化装置
DE69924922T2 (de) * 1998-06-15 2006-12-21 Matsushita Electric Industrial Co., Ltd., Kadoma Audiokodierungsmethode und Audiokodierungsvorrichtung
JP3784993B2 (ja) * 1998-06-26 2006-06-14 株式会社リコー 音響信号の符号化・量子化方法
JP3739959B2 (ja) * 1999-03-23 2006-01-25 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
US6499010B1 (en) * 2000-01-04 2002-12-24 Agere Systems Inc. Perceptual audio coder bit allocation scheme providing improved perceptual quality consistency
CA2418722C (en) * 2000-08-16 2012-02-07 Dolby Laboratories Licensing Corporation Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information
JP2002196792A (ja) * 2000-12-25 2002-07-12 Matsushita Electric Ind Co Ltd 音声符号化方式、音声符号化方法およびそれを用いる音声符号化装置、記録媒体、ならびに音楽配信システム
KR100400226B1 (ko) * 2001-10-15 2003-10-01 삼성전자주식회사 음성 부재 확률 계산 장치 및 방법과 이 장치 및 방법을이용한 잡음 제거 장치 및 방법
US6950794B1 (en) * 2001-11-20 2005-09-27 Cirrus Logic, Inc. Feedforward prediction of scalefactors based on allowable distortion for noise shaping in psychoacoustic-based compression
US7328151B2 (en) * 2002-03-22 2008-02-05 Sound Id Audio decoder with dynamic adjustment of signal modification

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100852481B1 (ko) * 2004-03-01 2008-08-18 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. 양자화 스텝 사이즈 결정 장치 및 방법
US10515643B2 (en) 2011-04-05 2019-12-24 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder, decoder, program, and recording medium
US11024319B2 (en) 2011-04-05 2021-06-01 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder, decoder, program, and recording medium
US11074919B2 (en) 2011-04-05 2021-07-27 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoder, decoder, program, and recording medium
CN113360124A (zh) * 2020-03-05 2021-09-07 Oppo广东移动通信有限公司 音频输入输出控制方法和装置、电子设备、可读存储介质

Also Published As

Publication number Publication date
CN1249671C (zh) 2006-04-05
US7373293B2 (en) 2008-05-13
CN1517980A (zh) 2004-08-04
KR100477699B1 (ko) 2005-03-18
US20040170290A1 (en) 2004-09-02

Similar Documents

Publication Publication Date Title
KR100477699B1 (ko) 양자화 잡음 분포 조절 방법 및 장치
KR100547113B1 (ko) 오디오 데이터 인코딩 장치 및 방법
US7328151B2 (en) Audio decoder with dynamic adjustment of signal modification
US6725192B1 (en) Audio coding and quantization method
US20060074693A1 (en) Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model
JP3336618B2 (ja) 高能率符号化方法及び高能率符号化信号の復号化方法
JP3446216B2 (ja) 音声信号処理方法
US20020138259A1 (en) Audio coding method, audio coding apparatus, and data storage medium
EP1600946A1 (en) Method and apparatus for encoding/decoding a digital signal
JP3765622B2 (ja) オーディオ符号化復号化システム
JP4021124B2 (ja) デジタル音響信号符号化装置、方法及び記録媒体
EP1170727B1 (en) Audio encoder using psychoacoustic bit allocation
KR100512208B1 (ko) 디지탈신호처리방법,디지탈신호처리장치,디지탈신호기록방법,디지탈신호기록장치,기록매체,디지탈신호전송방법,및디지탈신호전송장치
JP2002196792A (ja) 音声符号化方式、音声符号化方法およびそれを用いる音声符号化装置、記録媒体、ならびに音楽配信システム
US20220415334A1 (en) A psychoacoustic model for audio processing
EP1139336A2 (en) Determination of quantizaion coefficients for a subband audio encoder
JP2006018023A (ja) オーディオ信号符号化装置、および符号化プログラム
JP3164038B2 (ja) 音声帯域分割復号装置
JPH08166799A (ja) 高能率符号化方法及び装置
US7668715B1 (en) Methods for selecting an initial quantization step size in audio encoders and systems using the same
JP2003280691A (ja) 音声処理方法および音声処理装置
JP3291948B2 (ja) 高能率符号化方法及び装置、並びに伝送媒体
JP3134363B2 (ja) 量子化方法
JPH0916199A (ja) 音声の準可逆符号化装置
JP3200886B2 (ja) オーディオ信号処理方法

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130227

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20140227

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20150226

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20160226

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20170224

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20180227

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20190227

Year of fee payment: 15

FPAY Annual fee payment

Payment date: 20200227

Year of fee payment: 16