KR100201414B1 - 오디오 디코더의 스펙트럼 추출 장치 - Google Patents

오디오 디코더의 스펙트럼 추출 장치 Download PDF

Info

Publication number
KR100201414B1
KR100201414B1 KR1019960079129A KR19960079129A KR100201414B1 KR 100201414 B1 KR100201414 B1 KR 100201414B1 KR 1019960079129 A KR1019960079129 A KR 1019960079129A KR 19960079129 A KR19960079129 A KR 19960079129A KR 100201414 B1 KR100201414 B1 KR 100201414B1
Authority
KR
South Korea
Prior art keywords
octave
filter bank
band filter
multiplying
present
Prior art date
Application number
KR1019960079129A
Other languages
English (en)
Other versions
KR19980059784A (ko
Inventor
변정근
Original Assignee
구자홍
엘지전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 구자홍, 엘지전자주식회사 filed Critical 구자홍
Priority to KR1019960079129A priority Critical patent/KR100201414B1/ko
Publication of KR19980059784A publication Critical patent/KR19980059784A/ko
Application granted granted Critical
Publication of KR100201414B1 publication Critical patent/KR100201414B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 오디오 디코더의 스펙트럼 추출 장치에 관한 것으로 특히, 입력 신호를 옥타브 단위로 분할하고 그 분할된 각각의 신호를 고속 푸리에 변환한 후 커널을 곱하여 스펙트럼을 추출함으로서 스펙트럼 추출 추정 연산 시간을 개선함은 물론 시간 해상도에 따른 처리 음역의 제한을 제거하도륵 창안한 것이다. 이러한 본 발명은 입력 신호를 옥타브 단위로 분할하는 옥타브 대역 필터 뱅크(210)와, 이 옥타브 대역 필터 뱅크수단의 복수개의 분할 신호를 각기 고속 푸리에 변환한 후 커널을 곱하여 각기 스펙트럼을 추출하는 스펙트럼 추출부(220-1∼220-4)로 구성한다.

Description

오디오 디코더의 스펙트럼 추출 장치
본 발명은 오디오 디코더에 관한 것으로 특히, 옥타브 대역 필터 뱅크를 이용하여 음성 신호의 스펙트럼을 추출하는 오디오 디코더의 스펙트럼 추출 장치에 관한 것이다.
종래 기술의 일실시예는 인간의 청각 구조에 적합한 형태로 기본 주파수를 추정하기 위한 알고리즘을 사용하는데 도1 의 블럭도에 도시된 바와 같이, 이산 푸리에 변환(DFT ; Discrete Fourier Transform)을 이용한 Q변환을 수행하여 입력 신호에 대한 스펙트럼을 추출한다.
일반적으로 음악 신호에서 음정으로 인식되는 기존 주파수(fc)는 k개의 반음정이 높은 음의 기본 주파수(fc+k)와 다음과 같은 지수 관계식을 갖는다.
(fc+k)/(fc) = Cak
여기서, C,a 는 상수이다.
따라서, 종래의 일실시예는 상기의 관계식때 적합한 구조로 스펙트럼을 추출할 수 있도록 이산 푸리에 변환(DFT ; Discrete Fourier Trarlsform)을 변형하여 스펙트럼의 중심 주파수와 대역폭의 비가 동일한 즉, fc/fB=Q 인 Q변환을 구현한 것이다.
또한, 종래 기술의 다른 실시예는 제2도의 블럭도 도시된 바와 같이, 고속 푸리에 변환(FFT ; Fast Fuurier Transform)을 거친 후 Q 변환의 특성을 지니는 커널(kernel)을 곱하여 첫번째 방법과 같이 스펙트럼의 기본 주파수가 지수적으로 증가되도륵 하는 추출 방법을 사용하여 연산량을 감소시킨다.
상기에서 Q 변환의 커널은 제3도의 예시도와 같으며 이는 1/2 옥타브의 해상도로 만들어진 스펙트럼 커널의 크기이다.
그러나, 종래의 일실시예는 연산량이 많아 처리 속도가 저하되는 단점이 있다.
또한, 종래의 다른 실시매는 연산량은 감소시키지만 고속 푸리에 변환(FFT)의 특성상 시간 해상도를 개선하기 위해서는 처리 음역이나 주파수 해상도를 제한하여야 하고, 처리 음역과 주파수 해상도를 개선하기 위해서는 시간 해상도를 제한하여야 하는 단점이 있다.
따라서, 본 발명은 종래 기술의 단점을 개선하기 위하여 입력 신호를 옥타브 단위로 분할하고 그 분할된 각각의 신호를 고속 푸리에 변환한 후 커널을 곱하여 스펙트럼을 추출함으로서 스펙트럼 추출 추정 연산 시간을 개선함은 물론 시간 해상도에 따른 처리 음역의 제한을 제거하도륵 창안한 오디오 디코더의 스펙트럼 추출 장치를 제공함에 목적이 있다.
제1도 및 제 2도는 종래 기술을 보인 블럭도.
제3도는 제2도에서 Q 변환의 커널을 보인 예시도.
제4도는 본 발명에 따른 실시예의 블럭도.
제5도는 제4도에서 옥타브 밴드 필터 뱅크의 일반적인 블럭도.
제6도는 제5도에서 진폭 응답을 보인 예시도.
제7도는 제4도에서 옥타브 밴드 필터 뱅크의 개선된 불럭도.
제8도는 제7도에서의 진폭 응답을 보인 예시도.
제9도는 종래 기술과 본 발명의 Q 변환이 적용된 영역을 보인 예시도.
* 도면의 주요부분에 대한 부호의 설명
210 : 옥타브 밴드 필터 뱅크 220-1∼220-4 : 스펙트럼 추출부
본 발명은 상기의 목적을 달성하기 위하여 입력 신호를 옥타브 단위로 분할하는 옥타브 대역 필터 뱅크 수단과, 이 옥타브 대역 필터 뱅크 수단의 복수개의 분할 신호를 각기 고속 푸리에 변환한 후 커널을 곱하여 각기 스펙트럼을 추출하는 복수개의 스펙트럼 추출 수단으로 구성한다.
이하, 본 발명을 도면에 의거 상세히 설명하면 다음과 같다.
본 발명의 실시예는 제3도의 블럭도에 도시한 바와 , 입력 신호를 옥타브 단위로 분할하는 옥타브 대역 필터 뱅크(210)와. 이 옥타브 대역 필터 뱅크 수단의 복수개의 분할 신호를 각기 고속 푸리에 변환한 후 커널을 곱하여 각기 스펙트럼을 추출하는 스펙트럼 추출부(220-1∼220-4)로 구성한다.
이와같이 구성한 본 발명의 실시예에 대한 동작 및 작용 효과를 설명하면 다음과 같다.
일반적으로 옥타브 밴드 필터 뱅크(210)는 제5도의 블럭도와 같이 구성되어 아래의 식(1)과 같은 동작을 하며 그의 진폭 응답은 제6도과 같다.
여기서 , [π,2π)구간의 응답은 [0, π]의 응답과 π 에 대하여 대칭이다.
이러한 옥타브 밴드 필터 뱅크(210)는 각각의 필터(Hk(z))마다 별도의 계수를 가지므로 각 필터의 주파수 응답 파형을 동일하게 만들기 어렵다.
따라서, 본 발명에서는 옥타브 밴드 필터 뱅크(210)를 제7도의 블럭도와 같이 2진 트리 구조로 구성한다.
이러한 구성의 옥타브 밴드 필터 뱅크(210)는 입력 신호를 옥타브 대역으로 분할하면 필터 뱅크 수만름의 신호로 분리하여 각기 스펙트럼 추출부(220-1∼220-4)에 입력된다.
즉, 옥타브 밴드 필터 뱅크(210)는 입력 신호중 소정 고역 성분과 소정 저역 성분으로 분리하여 각기 2 데시메이션하고 상기 저역 성분을 데시메이션한 신호에 대하여 일정 고역 성분과 일정 저역 성분을 분리하여 각기 2 데시메이션하며 다시 2차의 저역 성분을 데시메이션한 신호를 고역 성분과 저역 성분으로 분리하여 2 데시메이션하는 동작을 반복함으로써 옥타브 단위로 분할된 복수개의 신호를 출력하는데, 일정 고역 성분이 2 데시메이션된 신호가 옥타브 단위로 분할된 신호이다.
상기와 같은 동작을 수행하는 2진 트리 구조의 옥타브 밴드 필터 뱅크(210)는 제8도와 같이 π/2 를 기준으로 진폭 응답이 대칭인 필터(H(z), G(z))를 갖는다.
이에 따라, 스펙트럼 추출부(220-1∼220-4)는 옥타브 밴드 필터 뱅크(210)에서 분할된 신호를 각기 입력으로 하여 고속 푸리에 변한한 후 Q 변환의 특성을 가진 커널을 곱하여 각기 스펙트럼을 추출하게 된다.
상기와 같은 동작을 수행하는 본 발명을 제2도의 종래의 기술과 비교하면 다음과 같다.
제9도는 종래의 다른 실시예의 방법과 본 발명의 방법에 따른 시간-주파수 영역에서 Q 변환을 적용하는 영역을 비교한 것이다.
종래의 방법은 제9도(a)와 같이 고속 푸리에 변환(FFT)을 이용한 일정 Q 변환의 창길이가 '4T'가 되는 반면 본 발명은 제9도(b)와 같이 필터 뱅크를 통과한 신호의 창길이가 옥타브 대역에 따라 직사각헝 단위로 별도로 처리되므로 처리 음역이 최저 옥타브인 경우 종래의 방법과 동일한 시간 해상도를 갖으면서 한 옥타브씩 증가될 때마다 시간 해상도는 2배씩 증가한다.
따라서, 본 발명은 시간 해상도가 종래의 방법과 동일한 주파수 해상도를 유지하면서도 최저 주파수를 포함하는 옥타브로부터 나이퀴스트 주파수까지 1,2,4,8‥‥배로 개선된다.
즉, 본 발명은 일반적으로 음의 움직임이 빠르고 대역폭이 넓은 고음에서는 높은 시간 해상도를 필요로 하고, 음의 움직임이 느리고 파장이 길고 음간의 대역폭이 좁은 저주파에서는 높은 주파수 해상도를 필요로 하는 특성에 잘 부합된다.
이러한 특성은 종래 방법의 경우 일반적인 고속 푸리에 변환(FFT)의 획일적인 윈도우 크기에 의해 최저 주파수(주파수 해상도) 및 윈도우 크기(시간 해상도)를 결정하지만 본 발명은 다수의 옥타브로 분할함에 의해 얻어지는 결과이다.
따라서, 본 발명은 획일적인 고속 푸리에 변환(FFT)의 창길이 크기를 옥타브마다 다르게 적용함으로써 시간 해상도의 제한으로 인한 처리 음역의 제한을 제거할 수 있다.
한편, 종래 기술과 본 발명에 대한 연산량은 아래의 식과 같다.
종래 기술의 연산량 = FFT 연산량 + 커널 연산량
본 발명에 따른 연산량 = 필터 연산량 +각 옥타브의 FFT 연산량 +커널 연산량
따라서, 본 발명은 필터 연산에 의한 연산량이 추가되지만 일단 필터링이 이루어지면 프레임 간격을 줄여 분석 빈도를 증가시키는 경우에도 필터 연산은 추가되지 않으므로 'Nlog2N'의 FFT 연산량에서 'N' 값이 작아져서 연산량은 상대적으로 줄어들게 된다.
즉, 본 발명은 분석되는 프레임 간격을 줄여 중첩시키며 분석할수륵, 처리 음역을 넓게 설정할수록 또는 주파수 해상도가 증가될수록 연산량은 줄어들게 된다.
상기에서 상세히 설명한 바와 같이 본 발명은 옥타브 대역에 따라 처리 음역을 가변함으로써 시간 해상도가 개선된 스펙트럼을 추출함은 물론 처리 음역의 제한을 제거할 수 있고 필터 연산이 이루어지면 분석 빈도를 증가시켜도 필터 연산이 추가되지 않으므로 연산량이 감소하여 시스템의 성능을 향상시킬 수 있는 효과가 있다.

Claims (3)

  1. 입력 신호를 옥타브 단위로 분할하는 옥타브 대역 필터 뱅크 수단과, 이 옥타브 대역 필터 뱅크 수단의 복수개의 분할 신호를 각기 고속 푸리에 변환한 후 커널을 곱하여 각기 스펙트럼을 추출하는 복수개의 스펙트럼 추출 수단으로 구성한 것을 특징으로 하는 오디오 디코더의 스펙트럼 추출 장치.
  2. 제1항에 있어서, 옥타브 대역 필터 뱅크 수단은 입력 신호중 소정 고역 성분과 소정 저역 성분을 분리하여 각기 2데시메이션하고 상기 저역 성분이 데시메이션된 신호에 대하여 소정 고역 성분과 소정 저역 성분을 분리하여 각기 2 데시메이션하는 동작을 반복하여 고역 성분에 데시메이션한 신호를 옥타브 단위로 분할된 신호로 출력하도록 구성한 것을 특징으로 하는 오디오 디코더의 스펙트럼 추출 장치.
  3. 제2항에 있어서, 동일한 입력에 대한 고역 성분과 저역 성분은 소정 위치를 기준으로 대칭인 진폭 응답을 갖는 것을 특징으로 하는 오디오 디코더의 스펙트럼 추출 장치.
KR1019960079129A 1996-12-31 1996-12-31 오디오 디코더의 스펙트럼 추출 장치 KR100201414B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019960079129A KR100201414B1 (ko) 1996-12-31 1996-12-31 오디오 디코더의 스펙트럼 추출 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019960079129A KR100201414B1 (ko) 1996-12-31 1996-12-31 오디오 디코더의 스펙트럼 추출 장치

Publications (2)

Publication Number Publication Date
KR19980059784A KR19980059784A (ko) 1998-10-07
KR100201414B1 true KR100201414B1 (ko) 1999-06-15

Family

ID=19493038

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960079129A KR100201414B1 (ko) 1996-12-31 1996-12-31 오디오 디코더의 스펙트럼 추출 장치

Country Status (1)

Country Link
KR (1) KR100201414B1 (ko)

Also Published As

Publication number Publication date
KR19980059784A (ko) 1998-10-07

Similar Documents

Publication Publication Date Title
JP3654831B2 (ja) 自動音声認識のための特徴量抽出方法
Abrard et al. A time–frequency blind signal separation method applicable to underdetermined mixtures of dependent sources
US6266003B1 (en) Method and apparatus for signal processing for time-scale and/or pitch modification of audio signals
US7492814B1 (en) Method of removing noise and interference from signal using peak picking
US7676046B1 (en) Method of removing noise and interference from signal
US20050228518A1 (en) Filter set for frequency analysis
EP1914727A1 (en) Noise suppression method and device thereof
US20030123584A1 (en) Trace video filtering using wavelet de-noising techniques
WO2006120829A1 (ja) 混合音分離装置
JP4649859B2 (ja) 信号処理装置および方法、記録媒体、並びにプログラム
Grais et al. Multi-resolution fully convolutional neural networks for monaural audio source separation
Chaudhary et al. Fourier-Bessel representation for signal processing: A review
EP0553906B1 (en) Method and apparatus for sound enhancement with envelopes of multiband passed signals feeding comb filters
CN109525215B (zh) 一种采用峭度谱确定子频带边界的经验小波变换方法
KR100201414B1 (ko) 오디오 디코더의 스펙트럼 추출 장치
Hammam et al. Blind signal separation with noise reduction for efficient speaker identification
FR2648567A1 (fr) Procede de traitement numerique d'un signal par transformation reversible en ondelettes
Sangeetha et al. Design and analysis of digital filters for speech signals using multirate signal processing
Chang et al. Speech enhancement using warped discrete cosine transform
Muralishankar et al. Theoretical complex cepstrum of DCT and warped DCT filters
dos Santos et al. A modified constant-Q transform for audio signals
RU2454735C1 (ru) Способ обработки речевого сигнала в частотной области
Upadhyay et al. A perceptually motivated stationary wavelet packet filterbank using improved spectral over-subtraction for enhancement of speech in various noise environments
JPS6229799B2 (ko)
Usevich et al. Characterization of finite signals with low-rank STFT

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20070221

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee