KR101170466B1 - Mdct 영역에서의 후처리 방법, 및 장치 - Google Patents

Mdct 영역에서의 후처리 방법, 및 장치 Download PDF

Info

Publication number
KR101170466B1
KR101170466B1 KR1020080131712A KR20080131712A KR101170466B1 KR 101170466 B1 KR101170466 B1 KR 101170466B1 KR 1020080131712 A KR1020080131712 A KR 1020080131712A KR 20080131712 A KR20080131712 A KR 20080131712A KR 101170466 B1 KR101170466 B1 KR 101170466B1
Authority
KR
South Korea
Prior art keywords
band
mdct
post
peaks
mdct coefficients
Prior art date
Application number
KR1020080131712A
Other languages
English (en)
Other versions
KR20100012788A (ko
Inventor
김현우
배현주
이병선
성종모
이미숙
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Publication of KR20100012788A publication Critical patent/KR20100012788A/ko
Application granted granted Critical
Publication of KR101170466B1 publication Critical patent/KR101170466B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 MDCT 계수의 크기에 따라 그 크기를 조절하여 음질을 향상시키는 MDCT 영역에 대한 후처리 방법에 대한 것이다. 본 발명에 따른 MDCT 영역에 대한 후처리 방법은, 입력 프레임의 MDCT 계수에 대한 미분값의 증감을 토대로 MDCT 계수에 의한 피크(peak)와 밸리(valley)를 구하고, 피크와 밸리를 단위로 하는 복수의 서브 대역을 형성하는 단계, 복수의 피크에 대한 미분값의 증감을 토대로 복수의 피크에 대한 글로벌 포먼트와 밸리를 판단하고, 글로벌 포먼트와 밸리에 대한 서브 대역을 통합하여 복수의 대역을 형성하는 단계, 입력신호에 대한 shaping 비율을 대역에 적용하여 각 대역에 대한 필터 계수를 구하는 단계, 및 MDCT 계수에 필터 계수를 승산하여 각 대역의 입출력 MDCT 계수의 이득을 일치시키는 단계를 구비한다.
MDCT, 코덱, 글로벌 포먼트, 밸리, shaping 비율

Description

MDCT 영역에서의 후처리 방법, 및 장치{A method and apparatus of adaptive post-processing in MDCT domain for speech enhancement}
본 발명은 MDCT 영역에서 음질 향상을 위한 적응 후처리 장치와 방법에 대한 것으로 더욱 상세하게는 MDCT 계수의 크기에 따라 그 크기를 조절하여 음질을 향상시키는 MDCT 영역에서 음질 향상을 위한 적응 후처리 장치와 방법에 대한 것이다.
아날로그 음성 신호를 표본화(sampling), 양자화(quantization)를 수행하면 PCM(Pulse Code Modulation) 신호를 얻는다. 이러한 신호를 직접 처리하는 것은 용량이 너무 커서 저장, 전송, 재생에 큰 문제가 있다. 따라서 PCM 신호를 압축, 복원하기 위해 많은 음성 코덱(codec)들이 개발되었다. 300Hz~3,400Hz 대역의 음성을 복부호화하는 협대역 코덱의 경우, 음성 발생 과정을 모델링 하는 CELP(Code Excited Linear Prediction) 기술에 기반을 두어 높은 압축률을 이룬다. 최근에는 협대역 코덱에서 부족한 자연스러움과 명료성을 증가시키기 위해 광대역(50 ~ 7,000Hz), 초광대역(7,000 ~ 14,00Hz) 음성/오디오에 대한 코덱이 개발되었다. 대표으로 G.729.1, AMR-WB(Adaptive Multi-Rate WideBand) 등이 있다. 광대역, 초광대역 코덱은 주로 신호를 시간 영역에서 MDCT(Modified Discrete Cosine Transform) 영역으로 변환하여 양자화하는 방법을 사용한다.
저비트율의 코덱으로 복부호화를 하면 SNR(Signal to Noise Ratio)은 떨어지고 코딩 잡음이 들리게 된다. 이러한 문제를 해결하기 위해 두 가지 방법이 제안이 된 바 있다. 그중 하나는 부호화기에서 코딩 잡음 스펙트럼을 shaping 하는 방법이다. 이 방법은 1970년대 후반에 처음 제안되어 CELP, APC, MPLPC에 성공적으로 적용되었는데, 기본적인 아이디어는 각각의 주파수에서 음성 신호 대 코딩 잡음 파워(power)의 비율이 최소한의 값보다 크도록 코딩 잡음의 스펙트럼을 음성 스펙트럼에 따라 shaping을 하는 것이다. 이러한 방식으로 복부호화를 하게 되면 인간의 청각 시스템의 마스킹 효과로 잡음이 들리지 않는다. 두 번째 방법은 복호화기에서 후처리 필터를 사용하는 방법이다. 이것은 1965년 Schroeder의 U.S. 특허에서 시작하였는데, 음성과 유사한 주파수 응답을 갖는 필터로 잡음 섞인 음성의 음질을 향상시키는 아이디어에 기반을 둔다. Ramamoorthy와 Jayant가 새로운 후처리 필터를 ADPCM에 제안하면서 본격적인 후처리 필터가 사용되기 시작하였다. Yatsuzuka와 Iizuka, Yamazaki는 4.8 ~ 16kb/s APC코덱에서 처음으로 적응 후처리와 잡음 스펙트럼 shaping을 결합해서 사용하였으며 피치(pitch) 주기성을 이용해서 long-term 후처리 필터를 제안하였다.
최근에 광대역 코덱이 등장하면서 광대역을 처리하는 후처리 필터를 사용하기 시작하였다. 대표적으로 2006년 5월에 표준화된 G.729.1에서 마인드스피드 사가 제안한 MDCT 기반의 후처리 필터이다. 하지만 이러한 방법은 SNR과 잡음의 스펙트럼 특성이 다른 입력 신호에 따라 계수의 크기를 조절하지 않아 다양한 입력 신호 에 대해 좋은 성능을 주지 못하는 문제점이 발생한다. 전체 대역에 대해 서브 대역의 크기를 조절하기 때문에 특정 서브 대역이 강조되어 둔탁한 소리가 나타난다. 또한 서브 대역이 고정되어 있어 입력 신호의 피크를 강조하고, 밸리를 감쇄할 수 있는 마스킹(masking) 특성을 덜 반영한다. 본 발명은 명료하고 자연스러운 음질을 제공하기 위해 입력 신호의 피크, 밸리 특성에 따라 서브 대역을 분할하고 글로벌 포먼트(global formant)에 따라 대역을 결정하여 각 대역에서 필터계수를 얻는 후처리 필터 장치와 방법에 관한 것이다.
본 발명의 목적은 MDCT 영역에서 입력신호의 배경 잡음과 양자화 잡음을 줄이기 위해 후처리 필터 계수를 얻고 이것을 MDCT 계수에 적용함으로써 음질 향상을 이루는 MDCT 영역에 대한 후처리 방법, 및 장치를 제공함에 있다.
또한, 본 발명의 다른 목적은 입력 신호의 피크, 밸리 특성에 따라 서브 대역을 분할함으로써 마스킹(masking) 효과를 극대할 수 있도록 하며, 글로벌 포먼트에 따라 대역을 결정하고, 각 대역에서 후처리 과정을 거쳐 명료하고 자연스러운 음질을 제공하는 MDCT 영역에 대한 후처리 방법, 및 장치를 제공함에 있다.
또한, 본 발명의 또 다른 목적은 SNR과 잡음 특성이 다른 입력 신호의 특성에 따라 계수의 크기를 조절하는 비율을 결정하여 다양한 입력 신호에 좋은 음질을 제공하는 MDCT 영역에 대한 후처리 방법, 및 장치를 제공함에 있다.
상기한 목적은 본 발명에 따라, 입력 프레임의 MDCT 계수에 대한 미분값의 증감을 토대로 상기 MDCT 계수에 의한 피크(peak)와 밸리(valley)를 구하고, 상기 피크와 밸리를 단위로 하는 복수의 서브 대역을 형성하는 단계, 복수의 피크에 대한 미분값의 증감을 토대로 상기 복수의 피크에 대한 글로벌 포먼트와 밸리를 판단하고, 상기 글로벌 포먼트와 상기 밸리에 대한 서브 대역을 통합하여 복수의 대역을 형성하는 단계, 상기 입력프레임의 입력신호에 대한 shaping 비율을 상기 대역에 적용하여 각 대역에 대한 필터 계수를 구하는 단계, 및 상기 MDCT 계수에 상기 필터 계수를 승 산하여 상기 각 서브 대역의 입출력 MDCT 계수의 이득을 일치시키는 단계에 의해 달성된다.
상기한 목적은 본 발명에 따라 입력 프레임의 MDCT 계수의 미분값을 토대로 상기 MDCT 계수에 대한 피크와 밸리를 구하고, 상기 피크와 밸리를 단위로 하는 복수의 서브 대역을 형성하는 서브 대역 결정부, 복수의 피크에 대한 미분값을 토대로 상기 복수의 피크에 대한 글로벌 포먼트와 밸리를 판단하고, 상기 글로벌 포먼트와 상기 밸리에 대한 서브 대역을 통합하여 복수의 대역을 형성하는 대역 결정부, 상기 입력 프레임에 대한 shaping 비율을 결정하는 shaping 비율 결정부, 상기 shaping 비율을 상기 각 대역에 대한 서브 대역 단위의 제 1 후처리 필터 계수와 상기 각 서브대역에서 MDCT 계수 단위의 제 2 후처리 필터 계수를 결정하는 대역 필터계수 결정부, 상기 제 1 후처리 필터계수와 상기 MDCT 계수에 승산하고 상기 각 대역의 입력 MDCT 계수와 출력 MDCT 계수의 이득이 동일하도록 이득을 조절하는 제1이득 조절부, 및 상기 제 2후처리 필터계수를 상기 MDCT 계수에 곱하고 상기 각 서브 대역에서 입력 MDCT 계수와 출력 MDCT 계수의 이득이 같도록 이득을 조절하는 제2이득조절부에 의해 달성된다.
이상에서 설명한 바와 같은 본 발명에 따른 MDCT 영역에서 후처리 필터 장치 및 방법은 다음과 같은 효과가 있다.
첫째 기존의 MDCT 영역에서 후처리 필터 방식은 특정 대역이 강조되어 음질 열화가 나타나고 서브 대역이 고정되어 있어 입력 신호의 피크를 강조하고, 밸리를 감쇄하는 마스킹 특성의 이용에 제한이 있지만 본 발명은 입력 신호의 피크, 밸리 특성에 따라 서브 대역을 분할하고 글로벌 포먼트를 같은 가중치를 두어 후처리 필터 계수를 얻고 이것을 MDCT에 적용함으로써 명료하고 자연스러운 음질을 제공하는 효과가 있다.
둘째 기존의 MDCT 영역에서 후처리 필터 방식은 SNR과 잡음의 스펙트럼 특성이 다른 입력 신호에 따라 계수의 크기를 조절하지 않아 다양한 입력 신호에 대해 좋은 성능을 주지 못하지만 본 발명은 입력 신호의 특성에 따라 계수의 shaping 비율을 결정함으로써 음질을 향상시킨다.
이하, 도면을 참조하여 본 발명을 상세히 설명하도록 한다.
도 1은 본 발명에 따른 MDCT 영역에 대한 후처리 방법이 적용되는 영역을 나타낸다.
통상, MDCT 후처리는 비트스트림에 대한 역양자화를 통해 입력신호를 디코딩하는데 필요한 부가정보, 및 MDCT 계수를 획득한다.
획득한 MDCT 계수를 이용하여 입력신호의 양자화 잡음과 배경잡음을 제거하기 위한 후처리 필터 계수를 산출하며, 산출된 후처리 필터 계수를 MDCT 계수에 적용함으로써 음질을 향상시킨다. 이후, 입력신호는 MDCT 역변환(IMDCT : Inverse Modified Discrete Cosine Transform) 처리하여 시간 영역의 PCM 오디오 신호로 변환한다.
도 2는 본 발명에 따른 MDCT 영역에 대한 후처리 장치의 일 실시예에 대한 블록개념도를 나타낸다.
도시된 MDCT 영역에 대한 후처리 장치는, 어뎁티브 서브 대역 결정부(110), 대역 결정부(!20), 대역 필터계수 결정부(130), 서브밴드 필터계수 결정부(160), shaping 비율 결정부(140), 제1이득 조절부(150), 및 제2이득 조절부(170)를 구비한다.
어뎁티브 서브 대역 결정부(110)는 입력신호의 MDCT 계수를 이용하여 복수의 서브 대역을 형성한다. 어뎁티브 서브 대역 결정부(100)는 부호화기에서 전송된 입력신호(비트스트림)을 역 양자화하여 입력신호에 대한 MDCT 계수를 획득하고, 획득한 MDCT 계수에 절대값을 취한 후, 절대값에 대한 미분값을 구한다. 미분값이 0에 수렴하면서 기울기가 양(+)에서 음(-)으로 변하는 경우, MDCT 계수에 대한 미분값은 피크(peak)를 의미하며, 기울기가 음(-)에서 양(+)으로 변할 경우, MDCT 계수에 대한 미분값은 밸리(valley)를 의미한다. MDCT 계수에 대한 피크는 도 3에 도시된 바를 참조하여, MDCT 계수에 대한 밸리는 도 4에 도시된 바를 참조하도록 한다. 어뎁티브 서브 대역 결정부(110)는 MDCT 계수에 대한 미분값이 기준값보다 클 경우, 피크와 밸리를 한 단위로 하는 서브 대역을 결정한다. 여기서 기준값은 0, 또는 -0.5 ~ +0.5 사이의 값이 될 수 있다.
대역 결정부(120)는 서브 대역과 피크로부터 대역을 결정한다.
대역 결정부(120)는 피크들에 대한 미분값을 토대로 글로벌 포먼트, 및 밸리를 산출한다. 대역 결정부(120)는 복수의 피크들에 대한 미분값이 0, 또는 0에 수렴할 때, 미분값이 양(+)에서 음(-)으로 향하는 영역을 포먼트로, 기울기가 음(-) 에서 양(+)으로 향하는 영역을 밸리로 판단한다. 여기서 밸리와 포먼트인 곳에서 MDCT 크기가 미리 결정한 기준값(0, 또는 -0.5 ~ +0.5)보다 커야 한다. 포먼트, 및 밸리의 서브 대역을 묶어 하나의 대역을 형성한다. 이웃한 포먼트가 미리 결정한 기준값 보다 작은 경우 두 대역은 통합한다.
shaping 비율 결정부(140)는 입력신호의 SNR, 잡음의 스펙트럼 분포를 참조하여 입력신호에 대한 shaping 비율을 결정한다. 바람직하게는, shaping 비율 결정부(140)는 SNR, 잡음의 스펙트럼 특성과 shaping 비율을 미리 준비된 실험 데이터를 사용하여 매핑 테이블(mapping table)을 만들고, 매핑 테이블을 참조하여 shaping 비율을 적용한다. 이때, 매핑은 후처리 과정을 거친 음성과 원음과의 차이가 적은 경우에 일어나며, shaping 비율은 양자화 방법, 비트율에 따라서도 조절될 수 있다.
제 1 필터계수 결정부(130)는 shaping 비율 결정부(140)에서 결정된 shaping 비율을 사용하여 각 대역에서 서브 대역 단위로 제 1 후처리 필터 계수를 결정한다. 한 대역에 N개의 서브 대역이 포함된다고 가정하면, 해당 서브 대역의 평균에너지(또는 평균포락선)
Figure 112008088106847-pat00001
를 구하고,
Figure 112008088106847-pat00002
에 대한 정규화를 수행한다. 정규화 방법은 에너지를 구한 후, 제곱근을 취하고, 이 값으로
Figure 112008088106847-pat00003
를 나누거나 최대값으로 나누어 정규화를 수행할 수 있다. 정규화 값은 아래의 수학식 1에 의해 산출된다.
Figure 112008088106847-pat00004
shaping 비율을 사용하여 반영 정도(
Figure 112008088106847-pat00005
)를 구하고, 서브 대역 단위로 후처리 필터 계수
Figure 112008088106847-pat00006
를 결정한다. 제 1 후처리 필터계수는 아래의 수학식 2에 의해 산출된다.
Figure 112008088106847-pat00007
제 2 필터계수 결정부(160)는 shaping 비율 결정부(140)에서 결정된 shaping 비율을 사용하여 각 서브대역에서 MDCT 계수 단위로 제 2 후처리 필터 계수를 결정한다. 임의의 한 서브대역에 M개의 MDCT 계수가 포함된다고 가정하면,
Figure 112008088106847-pat00008
에 대한 정규화를 수행한다. 정규화 방법은 에너지를 구한 후, 제곱근을 취하고, 이 값으로
Figure 112008088106847-pat00009
를 나누거나 최대값으로 나누어 정규화를 수행할 수 있다. 제 2 후처리 필터계수는,
Figure 112008088106847-pat00010
shaping 비율을 사용하여 반영 정도(
Figure 112008088106847-pat00011
)를 구하고 각 서브대역에서 MDCT 계수 단위로 제 2 후처리 필터 계수
Figure 112008088106847-pat00012
를 결정한다. 제 2 후처리 필터계수는 아래의 수학식 4에 의해 산출된다.
Figure 112008088106847-pat00013
제1이득 조절부(150)는 각 대역에서 입력 MDCT 계수에 제 1 후처리 필터계수 결정부(130)에서 결정한 필터 계수
Figure 112008088106847-pat00014
를 곱한 후, 각 대역에서 입력 MDCT 계수와 필터계수를 곱하여 얻은 MDCT 계수의 에너지가 같게 하기 위해 수학식 5에 의해 정규화를 위한 값을 구하고 이것을 각 계수에 곱하여 이득조절을 수행한다. 여기서 같은 서브대역 내(
Figure 112008088106847-pat00015
)에서는 같은 필터 계수를 사용한다.
Figure 112008088106847-pat00016
그리고, 제2이득 조절부(170)는 각 서브밴드에서 제 2 필터계수 결정부(160)에서 획득한 제 2 후처리 필터 계수
Figure 112008088106847-pat00017
를 제1이득 조절부(150)에서 획득한 계수
Figure 112008088106847-pat00018
에 곱하고 각 서브 대역의 입출력 MDCT 계수의 에너지가 같도록 수학식 6에 의해 이득을 조절한다.
Figure 112008088106847-pat00019
도 5는 본 발명의 MDCT 영역에 대한 후처리 방법에 대한 흐름도를 나타낸다.
먼저, 어뎁티브 서브 대역 결정부(110)는 입력신호를 역양자화하여 입력신호에서 MDCT 계수를 획득하며(S201), 획득한 MDCT 계수에 대해 절대값을 취한 후, 미 분을 수행한다(S202). 이어서, 미분값이 0, 또는 0에 수렴하면서, 미분값의 기울기가 양(+)에서 음(-)으로 향하는지, 음(-)에서 양(+)으로 향하는 지를 판단한다(S203). 판단결과, 미분값이 양(+)에서 음(-)으로 향하는 경우, 피크로 판단하고(S204), 미분값이 음(-)에서 양(+)으로 향할 경우, 밸리로 판단한다(S205). 다음으로, 어뎁티브 서브 대역 결정부(110)는 피크와 밸리를 이용하여 복수의 서브 대역을 결정한다(S206). 이때, 피크와 밸리가 기준값(-0.5 ~ +0.5)에 포함될 경우, 이웃하는 피크와 밸리를 하나의 서브 대역으로 결정할 수 있다.
다음으로, 제 1 필터계수 결정부(130)가 복수의 피크를 미분하여 복수의 피크에 대한 글로벌 포먼트와 밸리를 산출한다(S207). 글로벌 포먼트는 복수의 피크들에 대한 미분값이 0, 또는 0에 수렴하는 영역을 의미한다. 다음으로, shaping 비율 결정부(140)가 입력신호에 대한 shaping 비율을 획득하고(S208), 제 1 필터 계수를 산출한다.(S209) 다음으로, 제 2 필터계수 결정부(160)에서 서브밴드 필터 계수를 산출한다.(S210) 제 1이득 조절부(150),제 2 이득 조절부(170)는 산출된 필터 계수를 MDCT 계수에 승산하여(S211), 각 대역에 포함되는 대역의 MDCT 계수들의 이득을 동일하게 일치시킨다.
이상에서와 같이 상세한 설명과 도면을 통해 본 발명의 최적 실시 예를 개시하였다. 용어들은 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미 한정이나 특허청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로 본 기술분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시 예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.
도 1은 본 발명에 따른 MDCT 영역에 대한 후처리 방법이 적용되는 영역을 나타낸다.
도 2는 본 발명에 따른 MDCT 영역에 대한 후처리 장치의 일 실시예에 대한 블록개념도,
도 3과 도 4는 피크와 밸리에 대한 개념도, 그리고
도 5는 본 발명의 MDCT 영역에 대한 후처리 방법에 대한 흐름도를 나타낸다.
*도면의 주요 부분에 대한 부호의 설명*
110 : 어뎁티브 서브대역 결정부 120 : 대역 결정부
130 : 대역 필터계수 결정부 140 : shaping 비율 결정부
150 : 제1이득 조절부 160 : 서브밴드 필터계수 결정부
170 : 제2이득 조절부

Claims (8)

  1. 입력 프레임의 MDCT 계수에 대한 미분값의 증감을 토대로 상기 MDCT 계수에 의한 피크(peak)와 밸리(valley)를 구하고, 상기 피크와 밸리를 단위로 하는 복수의 서브 대역을 형성하는 단계;
    복수의 피크에 대한 미분값의 증감을 토대로 상기 복수의 피크에 대한 글로벌 포먼트와 밸리를 판단하고, 상기 글로벌 포먼트와 상기 밸리에 대한 서브 대역을 통합하여 복수의 대역을 형성하는 단계;
    상기 입력프레임의 입력신호에 대한 shaping 비율을 상기 대역에 적용하여 각 대역에 대한 필터 계수를 구하는 단계; 및
    상기 MDCT 계수에 상기 필터 계수를 승산하여 상기 각 서브 대역의 입출력 MDCT 계수의 이득을 일치시키는 단계;를 포함하는 것을 특징으로 하는 MDCT 영역에서의 후처리 방법.
  2. 제1항에 있어서,
    상기 서브 대역에 대한 피크는,
    상기 미분값이 0에 수렴하면서 미분값에 따른 기울기가 양(+) 에서 음(-)으로 향하는 영역이며,
    상기 서브 대역에 대한 밸리는, 상기 미분값이 0에 수렴하면서, 미분값에 따른 기울기가 음(-)에서 양(+)으로 향하는 영역인 것을 특징으로 하는 MDCT 영역에 서의 후처리 방법.
  3. 제2항에 있어서,
    상기 기울기가 미리 설정한 기준값 보다 작을 경우, 상기 피크와 상기 밸리에 대한 서브 대역을 하나로 통합하여 상기 대역을 형성하는 것을 특징으로 하는 MDCT 영역에서의 후처리 방법.
  4. 제3항에 있어서,
    싱기 기준값은,
    -0.5 ~ +0.5 사이의 값인 것을 특징으로 하는 MDCT 영역에서의 후처리 방법.
  5. 입력 프레임의 MDCT 계수의 미분값을 토대로 상기 MDCT 계수에 대한 피크와 밸리를 구하고, 상기 피크와 밸리를 단위로 하는 복수의 서브 대역을 형성하는 서브 대역 결정부;
    복수의 피크에 대한 미분값을 토대로 상기 복수의 피크에 대한 글로벌 포먼트와 밸리를 판단하고, 상기 글로벌 포먼트와 상기 밸리에 대한 서브 대역을 통합하여 복수의 대역을 형성하는 대역 결정부;
    상기 입력 프레임에 대한 shaping 비율을 결정하는 shaping 비율 결정부;
    상기 shaping 비율을 상기 각 대역에 대한 서브 대역 단위의 제 1 후처리 필 터 계수와 상기 각 서브대역에서 MDCT 계수 단위의 제 2 후처리 필터 계수를 결정하는 대역 필터계수 결정부;
    상기 제 1 후처리 필터계수와 상기 MDCT 계수에 승산하고 상기 각 대역의 입력 MDCT 계수와 출력 MDCT 계수의 이득이 동일하도록 이득을 조절하는 제1이득 조절부; 및
    상기 제 2후처리 필터계수를 상기 MDCT 계수에 곱하고 상기 각 서브 대역에서 입력 MDCT 계수와 출력 MDCT 계수의 이득이 같도록 이득을 조절하는 제2이득조절부;를 포함하는 것을 특징으로 하는 MDCT 영역에 대한 후처리 장치.
  6. 제5항에 있어서,
    상기 서브 대역에 대한 피크는,
    상기 미분값이 0에 수렴하면서 미분값에 따른 기울기가 양(+) 에서 음(-)으로 향하는 영역이며,
    상기 서브 대역에 대한 밸리는, 상기 미분값이 0에 수렴하면서, 미분값에 따른 기울기가 음(-)에서 양(+)으로 향하는 영역인 것을 특징으로 하는 MDCT 영역에 대한 후처리 장치.
  7. 제6항에 있어서,
    상기 기울기가 미리 설정한 기준값 보다 작을 경우, 상기 피크와 상기 밸리에 대한 서브 대역을 하나로 통합하여 상기 대역을 형성하는 것을 특징으로 하는 MDCT 영역에 대한 후처리 장치.
  8. 제7항에 있어서,
    싱기 기준값은,
    -0.5 ~ +0.5 사이의 값인 것을 특징으로 하는 MDCT 영역에 대한 후처리 장치.
KR1020080131712A 2008-07-29 2008-12-22 Mdct 영역에서의 후처리 방법, 및 장치 KR101170466B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020080074173 2008-07-29
KR20080074173 2008-07-29

Publications (2)

Publication Number Publication Date
KR20100012788A KR20100012788A (ko) 2010-02-08
KR101170466B1 true KR101170466B1 (ko) 2012-08-03

Family

ID=42086970

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080131712A KR101170466B1 (ko) 2008-07-29 2008-12-22 Mdct 영역에서의 후처리 방법, 및 장치

Country Status (1)

Country Link
KR (1) KR101170466B1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005338872A (ja) 1999-09-22 2005-12-08 Conexant Systems Inc マルチモードの音声符号器
WO2007093726A2 (fr) 2006-02-14 2007-08-23 France Telecom Dispositif de ponderation perceptuelle en codage/decodage audio
US20080312914A1 (en) 2007-06-13 2008-12-18 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005338872A (ja) 1999-09-22 2005-12-08 Conexant Systems Inc マルチモードの音声符号器
WO2007093726A2 (fr) 2006-02-14 2007-08-23 France Telecom Dispositif de ponderation perceptuelle en codage/decodage audio
US20080312914A1 (en) 2007-06-13 2008-12-18 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding

Also Published As

Publication number Publication date
KR20100012788A (ko) 2010-02-08

Similar Documents

Publication Publication Date Title
RU2667382C2 (ru) Улучшение классификации между кодированием во временной области и кодированием в частотной области
EP2047466B1 (en) Systems, methods, and apparatus for gain factor limiting
RU2734781C1 (ru) Устройство для постобработки звукового сигнала с использованием выявления места всплеска
JP2021502588A (ja) ニューラルネットワークプロセッサを用いた帯域幅が拡張されたオーディオ信号を生成するための装置、方法またはコンピュータプログラム
EP2772909B1 (en) Method for encoding voice signal
WO2009142466A2 (ko) 오디오 신호 처리 방법 및 장치
WO2010028301A1 (en) Spectrum harmonic/noise sharpness control
TWI713927B (zh) 使用尺度參數之降低取樣或內插來編碼及解碼音訊信號之設備及方法
CN101131820A (zh) 编码设备、解码设备、编码方法和解码方法
KR100922897B1 (ko) Mdct 영역에서 음질 향상을 위한 후처리 필터장치 및필터방법
JP7261173B2 (ja) 予測に基づく整形を使用したオーディオ信号の後処理のための装置および方法
KR101170466B1 (ko) Mdct 영역에서의 후처리 방법, 및 장치
CN115843378A (zh) 使用针对多声道音频信号的声道的缩放参数的联合编码的音频解码器、音频编码器以及相关方法
TWI841856B (zh) 音頻量化器和音頻去量化器及相關方法以及電腦程式
Sohn et al. A codebook shaping method for perceptual quality improvement of CELP coders
KR20080034817A (ko) 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee