KR100938282B1 - 양자화 잡음 처리를 위한 적용 주파수 대역 결정 방법과,그를 이용한 양자화 잡음 처리 방법 - Google Patents

양자화 잡음 처리를 위한 적용 주파수 대역 결정 방법과,그를 이용한 양자화 잡음 처리 방법 Download PDF

Info

Publication number
KR100938282B1
KR100938282B1 KR1020080048837A KR20080048837A KR100938282B1 KR 100938282 B1 KR100938282 B1 KR 100938282B1 KR 1020080048837 A KR1020080048837 A KR 1020080048837A KR 20080048837 A KR20080048837 A KR 20080048837A KR 100938282 B1 KR100938282 B1 KR 100938282B1
Authority
KR
South Korea
Prior art keywords
frequency band
noise processing
audio signal
determining
quantization noise
Prior art date
Application number
KR1020080048837A
Other languages
English (en)
Other versions
KR20090052790A (ko
Inventor
이태진
김민제
백승권
장대영
강경옥
서정일
홍진우
박호종
김인철
김정근
박영철
Original Assignee
한국전자통신연구원
광운대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원, 광운대학교 산학협력단 filed Critical 한국전자통신연구원
Priority to DE112008003153.3T priority Critical patent/DE112008003153B4/de
Priority to PCT/KR2008/005918 priority patent/WO2009066869A1/en
Publication of KR20090052790A publication Critical patent/KR20090052790A/ko
Application granted granted Critical
Publication of KR100938282B1 publication Critical patent/KR100938282B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 양자화 잡음 처리를 위한 적용 주파수 대역 결정 방법과, 그를 이용한 양자화 잡음 처리 방법에 관한 것으로, 오디오 신호의 양자화 잡음을 적용 주파수 대역에 따라 장구간 블록을 이용하여 처리하되, 그 적용 주파수 대역을 오디오 신호의 과도 유무에 따라 구분하여 일반 주파수 대역 또는 확장된 주파수 대역으로 결정함으로써, 프리에코 및 뮤지컬 노이즈를 용이하게 줄일 수 있게 하는, 양자화 잡음 처리를 위한 적용 주파수 대역 결정 방법과, 그를 이용한 양자화 잡음 처리 방법을 제공하고자 한다.
이를 위하여, 본 발명은, 양자화 잡음 처리를 위한 적용 주파수 대역 결정 방법에 있어서, 저주파 통과 필터링된 오디오 신호가 과도한지 여부를 확인하는 과도여부 확인 단계; 상기 확인 결과, 상기 오디오 신호가 과도하지 않으면 양자화 잡음 처리를 위한 적용 주파수 대역을 기 정해진 적용 주파수 대역으로 결정하는 일반 주파수 결정 단계; 및 상기 확인 결과, 상기 오디오 신호가 과도하면 상기 적용 주파수 대역을 상기 기 정해진 적용 주파수 대역보다 확장된 적용 주파수 대역으로 결정하는 확장 주파수 결정 단계를 포함한다.
TNS, 양자화 잡음, 적용 주파수 대역, 장구간 블록, 단구간 블록, 과도 신호, 프리에코, 뮤지컬 노이즈

Description

양자화 잡음 처리를 위한 적용 주파수 대역 결정 방법과, 그를 이용한 양자화 잡음 처리 방법{METHOD OF DETERMINING FREQUENCY RANGE FOR TRANSIENT NOISE SHAPING AND TRANSIENT NOISE SHAPING METHOD USING THAT}
본 발명은 양자화 잡음 처리를 위한 적용 주파수 대역 결정 방법과, 그를 이용한 양자화 잡음 처리 방법에 관한 것으로, 더욱 상세하게는 오디오 신호의 양자화 잡음을 적용 주파수 대역에 따라 장구간 블록을 이용하여 처리하되, 그 적용 주파수 대역을 오디오 신호의 과도 유무에 따라 구분하여 일반 주파수 대역 또는 확장된 주파수 대역으로 결정함으로써, 프리에코 및 뮤지컬 노이즈를 용이하게 줄일 수 있게 하는, 양자화 잡음 처리를 위한 적용 주파수 대역 결정 방법과, 그를 이용한 양자화 잡음 처리 방법에 관한 것이다.
본 발명은 정보통신부 및 정보통신연구진흥원의 IT성장동력기술개발사업의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호: 2007-S-005-01, 과제명: AV코덱 고도화를 통한 리치미디어 방송 기술개발].
HE-AAC(High Efficiency Advanced Audio Coding) 오디오 부호화 기술에서는 양자화 잡음 처리 알고리즘의 하나인 TNS(Temporal Noise Shaping)라고 불리는 알고리즘을 이용하여, 과도(Transient) 신호를 효과적으로 표현하고 있다. TNS 알고리즘은 프리에코(Pre-echo) 현상을 줄이기 위해 고안된 알고리즘이다.
하지만, HE-AAC 오디오 부호화 기술에서는 TNS 알고리즘을 이용함에도 불구하고 낮은 비트율에서 프리에코가 자주 발생하고 있으며, 프리에코가 발생함에 따라 모자란 비트율로 인한 뮤지컬 노이즈도 발생하고 있다.
한편, HE-AAC 오디오 부호화 기술에서 지각적으로 투명한 코딩 음질을 획득하기 위해서는, 양자화 잡음이 시간 영역의 마스킹 임계값을 초과하지 않아야 한다. 하지만, 주파수 신호 해석법을 이용한 지각적 부호화 기술에서는 양자화 과정에 의한 잡음이 복호화 후에는 시간 영역에 넓게 퍼지기 때문에, 양자화 잡음이 시간 영역의 마스킹 임계값을 초과하지 않아야 한다는 조건을 만족시키기가 용이하지 않게 된다.
예를 들어, 일반적으로 1024개의 변형 이산코사인변환(MDCT: Modified Discrete Cosine Transform) 계수를 사용하는 AAC 오디오 부호화 기술에서 48kHz 샘플링율을 가진 신호의 양자화 잡음은 40ms 이상 분포되게 된다. 이는 신호에 과도 현상이 있을 때에 더욱 큰 문제를 야기할 수 있다. 이때, 지각적으로는 과도 신호가 발생하기 전에 앞쪽에서 발생하는 양자화 잡음을 미리 감지할 수 있다. 이러한 양자화 잡음을 일반적으로 프리에코(pre-echo) 현상이라고 부르고 있다.
프리에코 현상을 효과적으로 해결하기 위해 고안된 TNS 알고리즘은 시간 영 역 상에 넓게 퍼져있는 양자화 잡음의 모양을 조절하여 시간 영역에서의 마스킹 효과를 만족시키도록 만드는 것이다.
이러한 TNS 알고리즘은 시간 영역과 주파수 영역 간의 이중성(Duality)을 기반으로 둔 선형 예측 부호화(LPC: Linear Predictive Coding)를 이용하고 있다. 하기의 [표 1]은 이러한 이중성에 대해서, 톤 신호와 과도 신호에 대한 최적의 부호화 방법을 나타내고 있다.
Figure 112008037476649-pat00001
즉, 일정한 주파수를 갖는 톤 신호에 대한 최적의 부호화 방법은, 주파수 영역에서는 주파수 계수 부호화를 이용한 직접 부호화 방식이 적절하고, 시간 영역에서는 시간 샘플 예측을 이용한 선형 예측 부호화와 같은 예측 부호화 방식이 적절하다.
반대로, 전술한 이중성을 고려한다면, 과도 신호의 최적의 부호화 방법은, 주파수 영역에서 주파수 계수 예측을 이용한 예측 부호화가 방식이 적절하고, 시간 영역에서는 시간 샘플 부호화를 이용한 직접 부호화 방식이 적절하다. 이때, 과도 신호는 주파수 영역에서의 예측 부호화 방식이 효율적이라는 것을 알 수 있다. TNS 알고리즘은 이러한 주파수 영역에서의 예측 부호화 방식을 기반으로 두고 있다.
한편, TNS 알고리즘이 적용되는 주파수 대역은 하기의 [표 2]와 같다.
Figure 112008037476649-pat00002
여기서, TNS 적용 주파수 범위(대역)를 블록 넓이에 따라 종류를 구분하면, 블록 종류는 장구간(Long) 블록과 단구간(Short) 블록이 있다. TNS 알고리즘이 적용되는 주파수 대역은 장구간(Long) 블록에 대해서는 1275Hz 이상이고, 단구간(Short) 블록에 대해서는 2750Hz 이상이다.
즉, TNS 알고리즘은 장구간 블록인 경우에 주파수 대역이 1800Hz에서부터 스펙트럼 대역 복사(SBR: Spectral Band Replication)가 시작되는 경계 주파수까지 적용된다. 반면에, TNS 알고리즘은 단구간 블록인 경우에 2750Hz부터 스펙트럼 대역 복사가 시작되는 경계 주파수까지 적용된다. 이러한 주파수 대역보다 낮은 대역에서는 프리에코가 자주 발생되는 문제점이 있다.
한편, 추가로 프리에코를 줄이기 위한 방법 중에는 블록 전환(Block Switching) 방법이 있다. 예를 들어, 블록 전환 방법은 한 프레임의 길이를 가지는 장구간 윈도우(Long window)를 8개로 나눈 단구간 윈도우(Short Window)로 대체하는 방법을 말한다. 이러한 장구간 블록과 단구간 블록 간의 블록 전환 방법은 양자화 잡음의 영향을 단구간 블록에서만 적용하도록 하여 지각적으로 프리에코를 개선하기 위함이다.
하지만, 단구간 윈도우를 이용하는 것이 안정된 신호와 낮은 비트율에서는 오히려 역효과를 발생하기도 한다. 이는 낮은 비트율에서는 비트가 부족하기 때문에, 각 단구간 블록마다 손실된 주파수 성분이 스펙트럴 홀(Spectral Hole)로 나타나게 된다. 그리고 그 홀들은 해당 프레임 내에서 시간 축으로 불연속적으로 연결되어 있으며, 뮤지컬 노이즈(Musical noise)를 초래하게 된다. 즉, 비트가 부족한 낮은 비트율에서는 단구간 블록 대신 장구간 블록을 이용하면 프리에코가 발생한다. 또한, 비트가 부족한 낮은 비트율에서는 단구간 블록을 과도하게 이용하면 뮤지컬 노이즈가 발생하게 된다는 문제점이 있다.
따라서 상기와 같은 종래 기술은 낮은 비트율에서 프리에코 현상 및 뮤지컬 노이즈가 발생하여 양자화 잡음이 발생한다는 문제점이 있으며, 이러한 문제점을 해결하고자 하는 것이 본 발명의 과제이다.
따라서 본 발명은 오디오 신호의 양자화 잡음을 적용 주파수 대역에 따라 장구간 블록을 이용하여 처리하되, 그 적용 주파수 대역을 오디오 신호의 과도 유무에 따라 구분하여 일반 주파수 대역 또는 확장된 주파수 대역으로 결정함으로써, 프리에코 및 뮤지컬 노이즈를 용이하게 줄일 수 있게 하는, 양자화 잡음 처리를 위한 적용 주파수 대역 결정 방법과, 그를 이용한 양자화 잡음 처리 방법을 제공하는데 그 목적이 있다.
본 발명의 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있으며, 본 발명의 실시예에 의해 보다 분명하게 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.
본 발명은 상기 문제점을 해결하기 위하여, 오디오 신호의 양자화 잡음을 적용 주파수 대역에 따라 장구간 블록을 이용하여 처리하되, 그 적용 주파수 대역을 오디오 신호의 과도 유무에 따라 구분하여 일반 주파수 대역 또는 확장된 주파수 대역으로 결정하는 것을 특징으로 한다.
더욱 구체적으로, 본 발명은, 양자화 잡음 처리를 위한 적용 주파수 대역 결정 방법에 있어서, 저주파 통과 필터링된 오디오 신호가 과도한지 여부를 확인하는 과도여부 확인 단계; 상기 확인 결과, 상기 오디오 신호가 과도하지 않으면 양자화 잡음 처리를 위한 적용 주파수 대역을 기 정해진 적용 주파수 대역으로 결정하는 일반 주파수 결정 단계; 및 상기 확인 결과, 상기 오디오 신호가 과도하면 상기 적용 주파수 대역을 상기 기 정해진 적용 주파수 대역보다 확장된 적용 주파수 대역 으로 결정하는 확장 주파수 결정 단계를 포함한다.
한편, 본 발명은, 양자화 잡음 처리 방법에 있어서, 장구간 블록을 이용하여 오디오 신호의 예측 이득 값을 산출하여 임계치와 비교하는 이득 비교 단계; 상기 예측 이득 값이 상기 임계치를 초과함에 따라, 저주파 통과 필터링된 오디오 신호가 과도한지 여부를 확인하여 양자화 잡음 처리를 위한 적용 주파수 대역을 결정하는 적용 주파수 결정 단계; 및 상기 결정된 적용 주파수 대역에 따라 상기 오디오 신호를 양자화 잡음 처리하는 잡음 처리 단계를 포함한다. 또한, 상기 본 발명은, 상기 예측 이득 값이 상기 임계치를 초과하지 않으면, 상기 확장된 주파수 대역의 예측 이득 값이 상기 임계치를 초과하는지 여부를 확인하여 잡음 처리 여부를 판단하는 잡음 처리 판단 단계를 더 포함한다.
상기와 같은 본 발명은, 오디오 신호의 양자화 잡음을 적용 주파수 대역에 따라 장구간 블록을 이용하여 처리하되, 그 적용 주파수 대역을 오디오 신호의 과도 유무에 따라 구분하여 일반 주파수 대역 또는 확장된 주파수 대역으로 결정함으로써, 프리에코 및 뮤지컬 노이즈를 용이하게 줄일 수 있게 하는 효과가 있다.
즉, 본 발명은, 기존 TNS 알고리즘을 이용한 양자화 잡음 처리 방법에 비해, 프리에코 및 뮤지컬 노이즈 측면에서 음질을 향상시킬 수 있는 효과가 있다. 본 발명은, 기존 TNS 알고리즘보다 장구간 블록만을 이용하여 프리에코를 더욱 효과적으로 처리할 수 있으며, 단구간 블록을 이용하는 만큼의 성능을 제공할 수 있다. 그러므로 본 발명은, 단구간 블록을 과도하게 이용하지 않음에 따라 뮤지컬 노이즈를 줄일 수 있는 효과가 있다.
상술한 목적, 특징 및 장점은 첨부된 도면을 참조하여 상세하게 후술되어 있는 상세한 설명을 통하여 보다 명확해 질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세히 설명하기로 한다.
도 1 은 본 발명이 적용되는 TNS 처리 장치의 일실시예 구성도이다.
도 1에 도시된 바와 같이, 본 발명이 적용되는 TNS 처리 장치(100)는 TNS 결정부(110)와 TNS 부호화부(120)를 포함한다.
TNS 처리 장치(100)는 필터뱅크 윈도우 내에서 시간 영역의 양자화 잡음을 적절하게 조정하여 청각적으로 들리지 않도록 하는 기능을 수행한다. 이하, 일반적인 HE-AAC 부호화 장치에서의 TNS 처리 장치(100)를 살펴보기로 한다.
TNS 결정부(110)는 TNS 과정을 적용할지 여부를 결정하는 기능을 수행한다.
구체적으로 살펴보면, TNS 결정부(110)는 미리 산출된 변형 이산코사인변환 스펙트럼의 선형 예측 부호화 계산을 위해, 하기의 [수학식 1]과 같이 가중치를 곱 한다.
Figure 112008037476649-pat00003
여기서,
Figure 112008037476649-pat00004
을 만족하며, k는 변형 이산코사인 변환의 계수 단위, n은 스케일 팩터 단위를 나타낸다.
즉, 상기 [수학식 1]은 해당 스케일 밴드의 에너지로 정규화(Normalize)시키는 것이다. 이때, 변형 이산코사인변환 스펙트럼 범위는 미리 정해진 범위에 대해 적용된다. 이에 따라, TNS 결정부(110)는 선형 예측 부호화의 적용 주파수 범위(대역)를 정한다.
그리고 TNS 결정부(110)는 정규화된 스펙트럼에 스무딩 필터(Smoothing Filter)를 적용한다. 이는 선형 예측 부호화 분석을 준비하기 위함이다. 스무딩 필터링은 선형 예측 부호화 중단 주파수부터 시행 주파수까지 하기의 [수학식 2]의 과정으로 필터링 다운(Filtering Down)을 실행하는 것이다.
Figure 112008037476649-pat00005
여기서,
Figure 112008037476649-pat00006
을 만족하며, k는 변형 이산코사인 변환의 계수 단위, n은 스케일 팩터 단위를 나타낸다.
반대로, TNS 결정부(110)는 선형 예측 부호화 시행 주파수부터 중단 주파수까지 필터링 업(Filtering Up)을 실행한다. 이에 대한 수식이 하기의 [수학식 3]에 나타나 있다.
Figure 112008037476649-pat00007
여기서,
Figure 112008037476649-pat00008
을 만족하며, k는 변형 이산코사인 변환의 계수 단위, n은 스케일 팩터 단위를 나타낸다.
그리고 TNS 결정부(110)는 레빈슨-더빈(Levinson-Durbin) 알고리즘을 이용하여 자기 상관함수와 선형 예측 부호화를 계산한다. 그리고 TNS 결정부(110)는 그 계산된 결과로부터 편자기 상관(PARCOR: Partial Auto-correlation Coefficient) 계수를 구하고 예측 이득(Prediction Gain)을 산출한다.
이때, TNS 결정부(110)는 산출된 예측 이득이 임계치를 초과하면, 스펙트럼을 선형 예측 부호화하는 것이 적합하다고 판단하고 현재의 윈도우에 대해 TNS 알고리즘을 적용하는 것으로 결정한다.
그리고 TNS 부호화부(120)는 편자기 상관(PARCOR) 계수의 높은 차수부터 양자화 가상시험을 진행하여 임계치(예를 들어, 0.1)보다 작은 값을 가지지 않게 되는 최초 계수의 차수로 TNS 차수를 결정하게 된다. 이는 효율적인 TNS 편자기 상관(PARCOR) 계수만을 이용하기 위함이다.
이어서, TNS 부호화부(120)는 결정된 차수와 계수를 가진 선형 예측 부호화 필터를 거쳐 변형 이산코사인변환 스펙트럼 계수에 TNS 알고리즘을 적용시켜 부호화한다. 이후, 적용된 변형 이산코사인변환 스펙트럼 계수를 기준으로 AAC 부호화 과정이 진행되게 된다.
한편, 본 발명은 TNS 적용 주파수를 100Hz 정도의 낮은 주파수까지 확장하여 적용하기 위한 것이다. 이때, TNS 적용 주파수가 확장 적용됨에 따라 프리에코 현상을 줄일 수 있으나, 확장된 적용 주파수 즉, 낮은 주파수 대역의 톤 성분은 왜곡될 수 있다.
따라서 본 발명은 일반적인 TNS 알고리즘과 확장 TNS 알고리즘을 함께 이용한다. 즉, 본 발명은 일반적인 TNS 알고리즘과 확장 TNS 알고리즘의 적용 여부를 판단하여 그 판단 결과에 따라 TNS 알고리즘을 수행하게 된다. 여기서, 이를 판단하는 기준으로는 확장되는 저주파 대역의 과도한 정도를 고려하게 된다.
이하, TNS 알고리즘과 확장된 TNS 알고리즘을 적용하는 판단 조건을 살펴보면 다음과 같다.
첫 번째로, TNS 결정부(110)는 일반적인 TNS 알고리즘을 적용할 수 있다고 판단되며, 저주파 대역만의 블록 전환의 결과가 과도하게 되면 확장 TNS 알고리즘 을 적용시키는 것으로 판단한다.
두 번째로, TNS 결정부(110)는 100Hz까지 확장된 적용 주파수 대역의 예측 이득 값이 임계치를 넘고, 에너지가 증가하는 과도 신호의 과도 위치가 해당 프레임을 8로 나눈 위치 중에 4 내지 7 사이의 값을 가질 경우에 확장 TNS 알고리즘을 적용하도록 한다. 반대로, TNS 결정부(110)는 에너지가 감소하는 과도 신호의 과도 위치가 해당 프레임을 8로 나눈 위치 중에 0 내지 3 사이의 값을 가질 때, 확장 TNS 알고리즘을 적용하도록 한다.
전술한 0 내지 7까지의 과도 신호의 과도 위치는 장구간과 단구간 사이의 블록 전환에서 결정되는 과도 위치를 말한다. 각 구간은 해당 프레임을 8개로 나눈 지점을 나타낸다. 이 과도 위치는 HE-AAC 부호화에서 효율적인 코딩을 위해 이용되는 값으로, 단구간 블록 적용 시에 8개의 단구간 블록을 4개의 그룹으로 묶을 때 참조하는 값이다. 확장 TNS 알고리즘에 참고할 값으로는 저주파 통과 필터링된 신호의 과도 위치를 참고로 한다.
전술한 두 번째 조건은 프리에코가 미치는 영향의 정도를 추가 고려하여 확장 TNS 알고리즘 적용에 반영한 것이다. 이때, 프리에코 현상이 나타나는 시간은 해당 윈도우 길이와 같다.
즉, 에너지가 증가하는 과도한 부분이 해당 프레임의 앞 부분에 위치할수록 프리에코가 발생하는 범위는 좁아지고, 그 반대로 해당 프레임의 끝 부분에 위치할수록 프리에코의 발생 범위는 넓어지게 된다.
도 2a 및 도 2b 는 과도 위치에 따른 프리에코에 대한 설명도이다.
도 2a에 도시된 바와 같이, 과도 위치(101)가 프레임의 끝 부분에 있는 과도 신호를 나타낸다. 여기서, 프리에코(102)는 과도 위치(101)가 프레임의 끝 부분에 위치하기 때문에, 프리에코(102)의 발생 범위가 넓어지게 된다.
반면, 도 2b에 도시된 바와 같이, 과도 위치(103)가 프레임의 앞 부분에 있는 과도 신호를 나타낸다. 이때, TNS 결정부(110)는 과도 위치(103)가 프레임의 뒤쪽에 위치한 경우, 프리에코(104)가 미치게 되는 영향이 도 2a에 도시된 프리에코(102)보다 큰 것으로 확인하여 확장 TNS 알고리즘을 적용시키는 것으로 판단한다.
도 3 은 본 발명에 따른 장구간 블록을 이용한 양자화 잡음 처리 방법에 대한 일실시예 흐름도이다.
먼저, TNS 결정부(110)는 장구간 블록을 이용해 오디오 신호의 예측 이득 값을 산출한다(302). 즉, TNS 결정부(110)는 르빈슨-더빈(Levinson-Durbin) 알고리즘을 이용하여 자기 상관함수와 선형 예측 부호화를 계산하고, 그 계산된 결과로부터 편자기 상관(PARCOR: Partial Auto-correlation Coefficient) 계수를 구하고 예측 이득(Prediction Gain) 값을 산출한다.
그리고 TNS 결정부(110)는 산출된 예측 이득 값이 임계치를 초과하는지 여부를 확인한다(304).
한편, TNS 결정부(110)는 확장 대역만의 주파수 성분만을 판단하기 위해, 별도로 저주파 통과 필터를 미리 이용하여 저주파 통과 필터링을 수행한다. 이는 장구간 블록만을 이용하기 위함이다. 이러한 저주파 통과 필터 함수의 일례는 하기의 [수학식 4]에 나타나 있다.
Figure 112008037476649-pat00009
여기서,
Figure 112008037476649-pat00010
는 저주파 통과 필터 함수를 나타내며, 다양한 저주파 통과 필터 함수가 적용될 수 있으며, 저주파 통과 필터링 성능에는 큰 차이가 없다. 이때, TNS 결정부(110)는 1kHz 미만의 저주파 대역만의 신호를 획득하기 위해 저주파 통과 필터를 이용하는 것이다.
상기 확인 결과(304), 예측 이득 값이 임계치를 초과하면 TNS 결정부(110)는 저주파 통과 필터링된 신호가 과도한지 여부를 확인한다(306). 즉, TNS 결정부(110)는 저주파 통과 필터링된 오디오 신호가 과도한지 여부에 따라 양자화 잡음 처리를 위한 적용 주파수 대역을 결정한다. 반면에, 예측 이득 값이 임계치를 초과하지 않으면, TNS 결정부(110)는 확장 대역의 예측 이득 값을 구하고, 그 확장 대역의 예측 이득 값이 임계치를 초과하는지 여부를 확인한다(314). 여기서, 저주파 통과 필터링된 신호가 과도한지 여부를 확인하는 과정은 전술된 AAC 부호화 장치에서의 블록 전환(Block Switching) 알고리즘을 이용할 수 있다.
상기 확인 결과(306), 저주파 통과 필터링된 신호가 과도하면 TNS 결정부(110)는 마스킹 임계치를 재조정하지 않는다(308). 반면에, 저주파 통과 필터링 된 신호가 과도하지 않으면, TNS 결정부(110)는 일반 TNS 알고리즘을 적용하는 것으로 결정한다(312).
여기서, 마스킹 임계치를 재조정하지 않는 과정을 살펴보면, 일반적인 TNS 알고리즘에서는 TNS 알고리즘이 적용되지 않는 주파수 대역에 대해서 마스킹 임계치를 낮추어 비트를 효율적으로 이용하고 있다. 반면에, 확장 TNS 알고리즘을 이용하게 되는 본 발명에서는 TNS 알고리즘이 적용되는 주파수 대역이 전 구간에 해당하기 때문에, 마스킹 임계치를 낮추는 과정이 필요 없게 된다.
그리고 TNS 결정부(110)는 마스킹 임계치를 재조정하지 않고, TNS 적용 주파수를 100Hz 정도의 낮은 주파수까지 확장하여 적용하는 것으로 결정한다(310). 이후, TNS 부호화부(120)는 저주파수 대역까지 확장 적용된 TNS 알고리즘에 따라 계수를 재산출하고, TNS 부호화를 수행한다.
한편, 상기 확인 결과(314), 확장 대역의 예측 이득 값이 임계치를 초과하면, TNS 결정부(110)는 저주파 통과 필터링된 신호의 과도 종류 및 과도 위치(Transient index)를 분석하고, 그 분석 결과를 이용해 프리에코의 영향이 기준치를 초과하는지 여부를 확인한다(316). 즉, TNS 결정부(110)는 저주파 통과 필터링된 오디오 신호의 과도 종류 및 과도 위치에 따라 양자화 잡음 처리 여부를 판단한다. 예를 들면, TNS 결정부(110)는 과도 종류 및 과도 위치가 에너지가 증가하고 해당 프레임의 끝 부분에 위치한 경우, 또는 과도 종류 및 과도 위치가 에너지가 감소하고 상기 해당 프레임의 앞 부분에 위치한 경우 중 어느 한 경우에 속하면 프리에코의 영향이 기준치를 초과하는 것으로 판단하여 TNS 알고리즘을 적용하는 것 으로 판단한다.
반면에, 상기 확인 결과(314), 확장 대역의 예측 이득 값이 임계치를 초과하지 않으면, TNS 결정부(110)는 TNS 알고리즘을 적용하지 않는 것으로 결정한다(318).
상기 확인 결과(316), 프리에코의 영향이 크다고 판단되면 TNS 결정부(110)는 "308" 과정으로 진행한다. 반면에, 프리에코의 영향이 작다고 판단되면, TNS 결정부(110)는 "318" 과정으로 진행한다.
한편, 전술한 바와 같은 본 발명의 방법은 컴퓨터 프로그램으로 작성이 가능하다. 그리고 상기 프로그램을 구성하는 코드 및 코드 세그먼트는 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 또한, 상기 작성된 프로그램은 컴퓨터가 읽을 수 있는 기록매체(정보저장매체)에 저장되고, 컴퓨터에 의하여 판독되고 실행됨으로써 본 발명의 방법을 구현한다. 그리고 상기 기록매체는 컴퓨터가 판독할 수 있는 모든 형태의 기록매체를 포함한다.
이상에서 설명한 본 발명은, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 있어 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다.
도 1 은 본 발명이 적용되는 TNS 처리 장치의 일실시예 구성도,
도 2a 및 도 2b 는 과도 위치에 따른 프리에코에 대한 설명도,
도 3 은 본 발명에 따른 낮은 주파수 대역의 양자화 잡음 처리 방법에 대한 일실시예 흐름도이다.
* 도면의 주요 부분에 대한 부호의 설명
100: TNS 처리 장치 110: TNS 결정부
120: TNS 부호화부

Claims (10)

  1. 양자화 잡음 처리를 위한 적용 주파수 대역 결정 방법에 있어서,
    저주파 통과 필터링된 오디오 신호가 과도한지 여부를 확인하는 과도여부 확인 단계;
    상기 확인 결과, 상기 오디오 신호가 과도하지 않으면 양자화 잡음 처리를 위한 적용 주파수 대역을 기 정해진 적용 주파수 대역으로 결정하는 일반 주파수 결정 단계; 및
    상기 확인 결과, 상기 오디오 신호가 과도하면 상기 적용 주파수 대역을 상기 기 정해진 적용 주파수 대역보다 확장된 적용 주파수 대역으로 결정하는 확장 주파수 결정 단계
    를 포함하는 양자화 잡음 처리를 위한 적용 주파수 대역 결정 방법.
  2. 제 1 항에 있어서,
    상기 기 정해진 적용 주파수 대역은,
    일반적인 TNS 알고리즘에 적용되는 소정의 TNS 적용 주파수 대역인 것을 특징으로 하는 양자화 잡음 처리를 위한 적용 주파수 대역 결정 방법.
  3. 제 2 항에 있어서,
    상기 확장된 적용 주파수 대역은,
    상기 소정의 TNS 적용 주파수 대역보다 낮은 주파수 대역까지 확장된 적용 주파수 대역인 것을 특징으로 하는 양자화 잡음 처리를 위한 적용 주파수 대역 결정 방법.
  4. 양자화 잡음 처리 방법에 있어서,
    장구간 블록을 이용하여 오디오 신호의 예측 이득 값을 산출하여 임계치와 비교하는 이득 비교 단계;
    상기 예측 이득 값이 상기 임계치를 초과함에 따라, 저주파 통과 필터링된 오디오 신호가 과도한지 여부를 확인하여 양자화 잡음 처리를 위한 적용 주파수 대역을 결정하는 적용 주파수 결정 단계; 및
    상기 결정된 적용 주파수 대역에 따라 상기 오디오 신호를 양자화 잡음 처리하는 잡음 처리 단계
    를 포함하는 양자화 잡음 처리 방법.
  5. 제 4 항에 있어서,
    상기 적용 주파수 결정 단계는,
    상기 저주파 통과 필터링된 오디오 신호가 과도한지 여부를 확인하는 과도여부 확인 단계;
    상기 확인 결과, 상기 오디오 신호가 과도하지 않으면 양자화 잡음 처리를 위한 적용 주파수 대역을 기 정해진 적용 주파수 대역으로 결정하는 일반 주파수 결정 단계; 및
    상기 확인 결과, 상기 오디오 신호가 과도하면 상기 적용 주파수 대역을 상기 기 정해진 적용 주파수 대역보다 확장된 적용 주파수 대역으로 결정하는 확장 주파수 결정 단계
    를 포함하는 양자화 잡음 처리 방법.
  6. 제 5 항에 있어서,
    상기 예측 이득 값이 상기 임계치를 초과하지 않으면, 상기 확장된 주파수 대역의 예측 이득 값이 상기 임계치를 초과하는지 여부를 확인하여 잡음 처리 여부를 판단하는 잡음 처리 판단 단계
    를 더 포함하는 양자화 잡음 처리 방법.
  7. 제 6 항에 있어서,
    상기 잡음 처리 판단 단계는,
    상기 확장된 주파수 대역의 예측 이득 값이 상기 임계치를 초과함에 따라 상기 오디오 신호의 과도 종류 및 과도 위치를 확인하여 잡음 처리 여부를 판단하는 것을 특징으로 하는 양자화 잡음 처리 방법.
  8. 제 7 항에 있어서,
    상기 잡음 처리 판단 단계는,
    상기 오디오 신호의 과도 종류 및 과도 위치가 에너지가 증가하고 해당 프레임의 끝 부분에 위치하면, 상기 잡음 처리 단계로 진행하는 것을 특징으로 하는 양자화 잡음 처리 방법.
  9. 제 7 항에 있어서,
    상기 잡음 처리 판단 단계는,
    상기 오디오 신호의 과도 종류 및 과도 위치가 에너지가 감소하고 해당 프레임의 앞 부분에 위치하면, 상기 잡음 처리 단계로 진행하는 것을 특징으로 하는 양자화 잡음 처리 방법.
  10. 제 7 항에 있어서,
    상기 잡음 처리 단계는,
    상기 확장된 적용 주파수 대역에 따라 마스킹 임계치를 조정하지 않는 것을 특징으로 하는 양자화 잡음 처리 방법.
KR1020080048837A 2007-11-21 2008-05-26 양자화 잡음 처리를 위한 적용 주파수 대역 결정 방법과,그를 이용한 양자화 잡음 처리 방법 KR100938282B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE112008003153.3T DE112008003153B4 (de) 2007-11-21 2008-10-09 Frequenzband-Bestimmungsverfahren zum Formen von Quantisierungsrauschen
PCT/KR2008/005918 WO2009066869A1 (en) 2007-11-21 2008-10-09 Frequency band determining method for quantization noise shaping and transient noise shaping method using the same

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020070119413 2007-11-21
KR20070119413 2007-11-21

Publications (2)

Publication Number Publication Date
KR20090052790A KR20090052790A (ko) 2009-05-26
KR100938282B1 true KR100938282B1 (ko) 2010-01-22

Family

ID=40860459

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080048837A KR100938282B1 (ko) 2007-11-21 2008-05-26 양자화 잡음 처리를 위한 적용 주파수 대역 결정 방법과,그를 이용한 양자화 잡음 처리 방법

Country Status (2)

Country Link
KR (1) KR100938282B1 (ko)
DE (1) DE112008003153B4 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5886276A (en) 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
US6266644B1 (en) 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
KR20070109982A (ko) * 2004-11-09 2007-11-15 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩 및 디코딩

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7546240B2 (en) * 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
KR100834877B1 (ko) 2006-06-15 2008-06-03 주식회사 나비티엔씨 유동성을 지닌 방수 시트 및 이의 시공방법
KR20080048837A (ko) 2006-11-29 2008-06-03 삼성전자주식회사 촉각 피드백을 출력하는 장치 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5886276A (en) 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
US6266644B1 (en) 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
KR20070109982A (ko) * 2004-11-09 2007-11-15 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩 및 디코딩

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals

Also Published As

Publication number Publication date
DE112008003153T5 (de) 2010-12-23
DE112008003153B4 (de) 2017-01-19
KR20090052790A (ko) 2009-05-26

Similar Documents

Publication Publication Date Title
US8788276B2 (en) Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing
KR101345695B1 (ko) 대역폭 확장 출력 데이터를 생성하기 위한 장치 및 방법
CN110111801B (zh) 音频编码器、音频解码器、方法及编码音频表示
JP5591385B2 (ja) オーディオ信号エンコーダ、オーディオ信号をエンコードするための方法、及びコンピュータープログラム
CN105264597B (zh) 感知转换音频编码中的噪声填充
TWI642053B (zh) 用以編碼音訊信號之音訊編碼器、用以編碼音訊信號之方法、及考量上頻帶中所檢出尖峰頻譜區域的電腦程式
MX2015004022A (es) Aparato y metodo para codificar y decodificador una señal de audio codificada utilizando modelado de ruido temporal/de parche.
KR101792712B1 (ko) 주파수 도메인 내의 선형 예측 코딩 기반 코딩을 위한 저주파수 강조
JP2020512598A (ja) トランジェント位置検出を使用したオーディオ信号の後処理のための装置
US11694701B2 (en) Low-complexity tonality-adaptive audio signal quantization
WO2009066869A1 (en) Frequency band determining method for quantization noise shaping and transient noise shaping method using the same
CA2899072A1 (en) Apparatus and method for generating a frequency enhanced signal using shaping of the enhancement signal
KR100938282B1 (ko) 양자화 잡음 처리를 위한 적용 주파수 대역 결정 방법과,그를 이용한 양자화 잡음 처리 방법
CN110709926A (zh) 用于使用基于预测的整形后处理音频信号的装置和方法
CN112771610A (zh) 用压扩对密集瞬态事件进行译码
AU2013257391B2 (en) An apparatus and a method for generating bandwidth extension output data
Konaté Enhancing speech coder quality: improved noise estimation for postfilters
JP2005351977A (ja) オーディオ信号符号化装置及びオーディオ信号符号化方法

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121206

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20131209

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20141229

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee