KR100201414B1

KR100201414B1 - 오디오 디코더의 스펙트럼 추출 장치

Info

Publication number: KR100201414B1
Application number: KR1019960079129A
Authority: KR
Inventors: 변정근
Original assignee: 구자홍; 엘지전자주식회사
Priority date: 1996-12-31
Filing date: 1996-12-31
Publication date: 1999-06-15
Also published as: KR19980059784A

Abstract

본 발명은 오디오 디코더의 스펙트럼 추출 장치에 관한 것으로 특히, 입력 신호를 옥타브 단위로 분할하고 그 분할된 각각의 신호를 고속 푸리에 변환한 후 커널을 곱하여 스펙트럼을 추출함으로서 스펙트럼 추출 추정 연산 시간을 개선함은 물론 시간 해상도에 따른 처리 음역의 제한을 제거하도륵 창안한 것이다. 이러한 본 발명은 입력 신호를 옥타브 단위로 분할하는 옥타브 대역 필터 뱅크(210)와, 이 옥타브 대역 필터 뱅크수단의 복수개의 분할 신호를 각기 고속 푸리에 변환한 후 커널을 곱하여 각기 스펙트럼을 추출하는 스펙트럼 추출부(220-1∼220-4)로 구성한다.

Description

오디오 디코더의 스펙트럼 추출 장치

본 발명은 오디오 디코더에 관한 것으로 특히, 옥타브 대역 필터 뱅크를 이용하여 음성 신호의 스펙트럼을 추출하는 오디오 디코더의 스펙트럼 추출 장치에 관한 것이다.

종래 기술의 일실시예는 인간의 청각 구조에 적합한 형태로 기본 주파수를 추정하기 위한 알고리즘을 사용하는데 도1 의 블럭도에 도시된 바와 같이, 이산 푸리에 변환(DFT ; Discrete Fourier Transform)을 이용한 Q변환을 수행하여 입력 신호에 대한 스펙트럼을 추출한다.

일반적으로 음악 신호에서 음정으로 인식되는 기존 주파수(fc)는 k개의 반음정이 높은 음의 기본 주파수(fc+k)와 다음과 같은 지수 관계식을 갖는다.

(fc+k)/(fc) = C^ak

여기서, C,a 는 상수이다.

따라서, 종래의 일실시예는 상기의 관계식때 적합한 구조로 스펙트럼을 추출할 수 있도록 이산 푸리에 변환(DFT ; Discrete Fourier Trarlsform)을 변형하여 스펙트럼의 중심 주파수와 대역폭의 비가 동일한 즉, fc/f_B=Q 인 Q변환을 구현한 것이다.

또한, 종래 기술의 다른 실시예는 제2도의 블럭도 도시된 바와 같이, 고속 푸리에 변환(FFT ; Fast Fuurier Transform)을 거친 후 Q 변환의 특성을 지니는 커널(kernel)을 곱하여 첫번째 방법과 같이 스펙트럼의 기본 주파수가 지수적으로 증가되도륵 하는 추출 방법을 사용하여 연산량을 감소시킨다.

상기에서 Q 변환의 커널은 제3도의 예시도와 같으며 이는 1/2 옥타브의 해상도로 만들어진 스펙트럼 커널의 크기이다.

그러나, 종래의 일실시예는 연산량이 많아 처리 속도가 저하되는 단점이 있다.

또한, 종래의 다른 실시매는 연산량은 감소시키지만 고속 푸리에 변환(FFT)의 특성상 시간 해상도를 개선하기 위해서는 처리 음역이나 주파수 해상도를 제한하여야 하고, 처리 음역과 주파수 해상도를 개선하기 위해서는 시간 해상도를 제한하여야 하는 단점이 있다.

따라서, 본 발명은 종래 기술의 단점을 개선하기 위하여 입력 신호를 옥타브 단위로 분할하고 그 분할된 각각의 신호를 고속 푸리에 변환한 후 커널을 곱하여 스펙트럼을 추출함으로서 스펙트럼 추출 추정 연산 시간을 개선함은 물론 시간 해상도에 따른 처리 음역의 제한을 제거하도륵 창안한 오디오 디코더의 스펙트럼 추출 장치를 제공함에 목적이 있다.

제1도 및 제 2도는 종래 기술을 보인 블럭도.

제3도는 제2도에서 Q 변환의 커널을 보인 예시도.

제4도는 본 발명에 따른 실시예의 블럭도.

제5도는 제4도에서 옥타브 밴드 필터 뱅크의 일반적인 블럭도.

제6도는 제5도에서 진폭 응답을 보인 예시도.

제7도는 제4도에서 옥타브 밴드 필터 뱅크의 개선된 불럭도.

제8도는 제7도에서의 진폭 응답을 보인 예시도.

제9도는 종래 기술과 본 발명의 Q 변환이 적용된 영역을 보인 예시도.

* 도면의 주요부분에 대한 부호의 설명

210 : 옥타브 밴드 필터 뱅크 220-1∼220-4 : 스펙트럼 추출부

본 발명은 상기의 목적을 달성하기 위하여 입력 신호를 옥타브 단위로 분할하는 옥타브 대역 필터 뱅크 수단과, 이 옥타브 대역 필터 뱅크 수단의 복수개의 분할 신호를 각기 고속 푸리에 변환한 후 커널을 곱하여 각기 스펙트럼을 추출하는 복수개의 스펙트럼 추출 수단으로 구성한다.

이하, 본 발명을 도면에 의거 상세히 설명하면 다음과 같다.

본 발명의 실시예는 제3도의 블럭도에 도시한 바와 , 입력 신호를 옥타브 단위로 분할하는 옥타브 대역 필터 뱅크(210)와. 이 옥타브 대역 필터 뱅크 수단의 복수개의 분할 신호를 각기 고속 푸리에 변환한 후 커널을 곱하여 각기 스펙트럼을 추출하는 스펙트럼 추출부(220-1∼220-4)로 구성한다.

이와같이 구성한 본 발명의 실시예에 대한 동작 및 작용 효과를 설명하면 다음과 같다.

일반적으로 옥타브 밴드 필터 뱅크(210)는 제5도의 블럭도와 같이 구성되어 아래의 식(1)과 같은 동작을 하며 그의 진폭 응답은 제6도과 같다.

여기서 , [π,2π)구간의 응답은 [0, π]의 응답과 π 에 대하여 대칭이다.

이러한 옥타브 밴드 필터 뱅크(210)는 각각의 필터(Hk(z))마다 별도의 계수를 가지므로 각 필터의 주파수 응답 파형을 동일하게 만들기 어렵다.

따라서, 본 발명에서는 옥타브 밴드 필터 뱅크(210)를 제7도의 블럭도와 같이 2진 트리 구조로 구성한다.

이러한 구성의 옥타브 밴드 필터 뱅크(210)는 입력 신호를 옥타브 대역으로 분할하면 필터 뱅크 수만름의 신호로 분리하여 각기 스펙트럼 추출부(220-1∼220-4)에 입력된다.

즉, 옥타브 밴드 필터 뱅크(210)는 입력 신호중 소정 고역 성분과 소정 저역 성분으로 분리하여 각기 2 데시메이션하고 상기 저역 성분을 데시메이션한 신호에 대하여 일정 고역 성분과 일정 저역 성분을 분리하여 각기 2 데시메이션하며 다시 2차의 저역 성분을 데시메이션한 신호를 고역 성분과 저역 성분으로 분리하여 2 데시메이션하는 동작을 반복함으로써 옥타브 단위로 분할된 복수개의 신호를 출력하는데, 일정 고역 성분이 2 데시메이션된 신호가 옥타브 단위로 분할된 신호이다.

상기와 같은 동작을 수행하는 2진 트리 구조의 옥타브 밴드 필터 뱅크(210)는 제8도와 같이 π/2 를 기준으로 진폭 응답이 대칭인 필터(H(z), G(z))를 갖는다.

이에 따라, 스펙트럼 추출부(220-1∼220-4)는 옥타브 밴드 필터 뱅크(210)에서 분할된 신호를 각기 입력으로 하여 고속 푸리에 변한한 후 Q 변환의 특성을 가진 커널을 곱하여 각기 스펙트럼을 추출하게 된다.

상기와 같은 동작을 수행하는 본 발명을 제2도의 종래의 기술과 비교하면 다음과 같다.

제9도는 종래의 다른 실시예의 방법과 본 발명의 방법에 따른 시간-주파수 영역에서 Q 변환을 적용하는 영역을 비교한 것이다.

종래의 방법은 제9도(a)와 같이 고속 푸리에 변환(FFT)을 이용한 일정 Q 변환의 창길이가 '4T'가 되는 반면 본 발명은 제9도(b)와 같이 필터 뱅크를 통과한 신호의 창길이가 옥타브 대역에 따라 직사각헝 단위로 별도로 처리되므로 처리 음역이 최저 옥타브인 경우 종래의 방법과 동일한 시간 해상도를 갖으면서 한 옥타브씩 증가될 때마다 시간 해상도는 2배씩 증가한다.

따라서, 본 발명은 시간 해상도가 종래의 방법과 동일한 주파수 해상도를 유지하면서도 최저 주파수를 포함하는 옥타브로부터 나이퀴스트 주파수까지 1,2,4,8‥‥배로 개선된다.

즉, 본 발명은 일반적으로 음의 움직임이 빠르고 대역폭이 넓은 고음에서는 높은 시간 해상도를 필요로 하고, 음의 움직임이 느리고 파장이 길고 음간의 대역폭이 좁은 저주파에서는 높은 주파수 해상도를 필요로 하는 특성에 잘 부합된다.

이러한 특성은 종래 방법의 경우 일반적인 고속 푸리에 변환(FFT)의 획일적인 윈도우 크기에 의해 최저 주파수(주파수 해상도) 및 윈도우 크기(시간 해상도)를 결정하지만 본 발명은 다수의 옥타브로 분할함에 의해 얻어지는 결과이다.

따라서, 본 발명은 획일적인 고속 푸리에 변환(FFT)의 창길이 크기를 옥타브마다 다르게 적용함으로써 시간 해상도의 제한으로 인한 처리 음역의 제한을 제거할 수 있다.

한편, 종래 기술과 본 발명에 대한 연산량은 아래의 식과 같다.

종래 기술의 연산량 = FFT 연산량 + 커널 연산량

본 발명에 따른 연산량 = 필터 연산량 +각 옥타브의 FFT 연산량 +커널 연산량

따라서, 본 발명은 필터 연산에 의한 연산량이 추가되지만 일단 필터링이 이루어지면 프레임 간격을 줄여 분석 빈도를 증가시키는 경우에도 필터 연산은 추가되지 않으므로 'Nlog₂N'의 FFT 연산량에서 'N' 값이 작아져서 연산량은 상대적으로 줄어들게 된다.

즉, 본 발명은 분석되는 프레임 간격을 줄여 중첩시키며 분석할수륵, 처리 음역을 넓게 설정할수록 또는 주파수 해상도가 증가될수록 연산량은 줄어들게 된다.

상기에서 상세히 설명한 바와 같이 본 발명은 옥타브 대역에 따라 처리 음역을 가변함으로써 시간 해상도가 개선된 스펙트럼을 추출함은 물론 처리 음역의 제한을 제거할 수 있고 필터 연산이 이루어지면 분석 빈도를 증가시켜도 필터 연산이 추가되지 않으므로 연산량이 감소하여 시스템의 성능을 향상시킬 수 있는 효과가 있다.

Claims

입력 신호를 옥타브 단위로 분할하는 옥타브 대역 필터 뱅크 수단과, 이 옥타브 대역 필터 뱅크 수단의 복수개의 분할 신호를 각기 고속 푸리에 변환한 후 커널을 곱하여 각기 스펙트럼을 추출하는 복수개의 스펙트럼 추출 수단으로 구성한 것을 특징으로 하는 오디오 디코더의 스펙트럼 추출 장치.
제1항에 있어서, 옥타브 대역 필터 뱅크 수단은 입력 신호중 소정 고역 성분과 소정 저역 성분을 분리하여 각기 2데시메이션하고 상기 저역 성분이 데시메이션된 신호에 대하여 소정 고역 성분과 소정 저역 성분을 분리하여 각기 2 데시메이션하는 동작을 반복하여 고역 성분에 데시메이션한 신호를 옥타브 단위로 분할된 신호로 출력하도록 구성한 것을 특징으로 하는 오디오 디코더의 스펙트럼 추출 장치.
제2항에 있어서, 동일한 입력에 대한 고역 성분과 저역 성분은 소정 위치를 기준으로 대칭인 진폭 응답을 갖는 것을 특징으로 하는 오디오 디코더의 스펙트럼 추출 장치.