KR101121217B1 - Iir 필터를 이용한 시간 영역에서의 피치 추정 장치 - Google Patents

Iir 필터를 이용한 시간 영역에서의 피치 추정 장치 Download PDF

Info

Publication number
KR101121217B1
KR101121217B1 KR1020110105491A KR20110105491A KR101121217B1 KR 101121217 B1 KR101121217 B1 KR 101121217B1 KR 1020110105491 A KR1020110105491 A KR 1020110105491A KR 20110105491 A KR20110105491 A KR 20110105491A KR 101121217 B1 KR101121217 B1 KR 101121217B1
Authority
KR
South Korea
Prior art keywords
pitch
section
output
iir filter
time domain
Prior art date
Application number
KR1020110105491A
Other languages
English (en)
Inventor
박재숙
Original Assignee
주식회사 스마트송
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 스마트송 filed Critical 주식회사 스마트송
Priority to KR1020110105491A priority Critical patent/KR101121217B1/ko
Application granted granted Critical
Publication of KR101121217B1 publication Critical patent/KR101121217B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

본 발명의 일면에 따른 IIR 필터를 이용한 시간 영역에서의 피치 추정 장치는, 직렬로 연결되는 복수개의 IIR 필터를 포함하여, 음성 신호의 피치 주파수 범위인 50Hz 내지 1000Hz의 대역에 대한 통과 특성과 통과 구간에서 통과율이 단조적으로 감소하는 특성을 가지는 IIR 필터부와, IIR 필터부의 출력 신호를 제공받아 출력 신호를 피치 주기내에 있어서 최대 정수값을 가지는 소정 범위의 정수구간인 액티브구간, 출력 신호의 샘플 값이 기설정된 임계값보다 큰 시점부터 액티브구간의 시작까지의 구간인 임계구간으로 구분하는 엔벨로프처리부와, 출력 신호 및 출력 신호와 부호가 반대인 신호를 입력받으며, 출력 신호를 양의 구간인 양 구간과 음의 구간인 음 구간으로 구분하고, 액티브 구간 및 임계 구간에 있어서, 양 구간과 음 구간이 시작되거나 끝나는 점을 이용하여 피치 구간의 시작점을 찾는 구간 처리부와, 구간 처리부에서의 출력을 기초로 복수개의 피치 후보를 계산하고, 복수개의 피치 후보 중에서 하나를 선택하여 피치를 추정하는 피치 추정부를 포함한다.

Description

IIR 필터를 이용한 시간 영역에서의 피치 추정 장치{APPARATUS FOR ESTIMATING PITCH IN TIME DOMAIN USING IIR FILTER}
본 발명은 IIR 필터를 이용한 시간 영역에서의 피치 추정 장치에 관한 것으로서, 더욱 상세하게는, 시간 영역에서 음성신호의 피치를 추정하는 데 있어서, 연산량을 감소시키고 피치추정의 오류를 감소시키며 시간영역에서 샘플점 단위로 엄밀한 피치 추정이 가능하게 하는 IIR 필터를 이용한 시간 영역에서의 피치 추정 장치에 관한 것이다.
보통 시간영역에서의 피치추출에는 주기특성을 검출하기 위하여 자기상관함수(Autocorrelation function)를 이용하는 경우가 많다.
신호가 주기성을 가지는 경우 자기상관함수는 주기만큼 떨어진 위치에서 극대 값을 가지는 특성으로 하여 주기특성 검출에 효과적이다.
그러나 음성신호가 완전한 주기 신호는 아니며 음성신호의 과도구간(음성이 시작되거나 끝나는 구간, 피치주기가 변하는 구간, 공진특성이 변하는 구간 등)에서는 시간에 따라 음성파형의 모양이 변하게 된다.
이러한 구간에서는 자기상관함수에 의한 주기성 검출이 희미해지는 것이 일반적이다.
자기상관함수에 의한 주기성 검출은 또한 연산비용이 높다는 것이다. 자기상관함수에 따르면 처리할 음성자료의 길이가 N이라고 할 때 자기상관함수의 연산량은 N2에 비례하게 된다.
자기상관함수의 연산의 고속화를 위하여 푸리에 변환을 이용하여 주파수 영역에서 계산하는 경우도 있지만 이때에도 별도의 고속 푸리에 변환을 진행해야 한다.
한편, 피치의 검출을 케프스트럼(cepstrum) 영역에서 진행하는 경우도 많다. 주기신호는 주파수 영역에서 조파구조(harmonic structure)를 가지며 스펙트럼의 절대값 로그를 취하여 한번 더 푸리에 변환을 진행한 케프스트럼 영역에서 조파주기에 해당하는 위치에 피크(peak)가 위치하게 된다.
그러나 케프스트럼 영역에서의 피치 검출방법도 일련의 문제점을 가지고 있다.
우선 푸리예변환의 차수(고속푸리예변환을 진행하는 프레임 길이)를 충분히 크게 하지 않으면 정확한 피치를 얻어내기 어렵다는 점이다. 한편 고속푸리예 변환의 차수를 크게 하면 주파수 분해능이 올라가는 대신 시간분해 능이 떨어진다는 문제가 동시에 발생하게 된다.
또한 과도구간에서 주기성이 불투명해지는 현상도 완벽하게 해결되지는 못한다.
다음으로 2번에 걸친 고속푸리에변환 처리가 필요하며 개략적인 피치를 얻은 다음 샘플점단위로 정확한 피치를 추정하기 위해서는 시간영역에서 추가적인 처리를 해야한다는 약점이 있게된다.
따라서, 종래 기술에 따른 피치 추정 장치는 연산량이 많은데 비해 피치추정의 오류가 빈번히 발생하며, 시간영역에서 엄밀한 피치 추정이 어렵다는 문제가 있었다.
본 발명의 목적은 음성신호를 시간영역에서 다단 IIR필터를 통과시켜 주기성검출에 유리하도록 신호를 변환하고 변환된 신호의 특성을 파악하여, 연산량과 피치추정의 오류가 작으면서도 시간영역에서 엄밀한 피치 추정이 가능한 피치 추정 장치를 제공하는데 있다.
본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 명확하게 이해될 수 있을 것이다.
전술한 목적을 달성하기 위한 본 발명의 일면에 따른 IIR 필터를 이용한 시간 영역에서의 피치 추정 장치는, 직렬로 연결되는 복수개의 IIR 필터를 포함하여, 음성 신호의 피치 주파수 범위인 50Hz 내지 1000Hz의 대역에 대한 통과 특성과 통과 구간에서 통과율이 단조적으로 감소하는 특성을 가지는 IIR 필터부와, IIR 필터부의 출력 신호를 제공받아 출력 신호를 피치 주기 내에 있어서 최대 정수값을 가지는 소정 범위의 정수구간인 액티브구간, 출력 신호의 샘플 값이 기설정된 임계값보다 큰 시점부터 액티브구간의 시작까지의 구간인 임계구간으로 구분하는 엔벨로프처리부와, 출력 신호 및 출력 신호와 부호가 반대인 신호를 입력받으며, 출력 신호를 양의 구간인 양 구간과 음의 구간인 음 구간으로 구분하고, 액티브 구간 및 임계 구간에 있어서, 양 구간과 음 구간이 시작되거나 끝나는 점을 이용하여 피치 구간의 시작점을 찾는 구간 처리부와, 구간 처리부에서의 출력을 기초로 복수개의 피치 후보를 계산하고, 복수개의 피치 후보 중에서 하나를 선택하여 피치를 추정하는 피치 추정부를 포함한다.
본 발명에 따르면, 음성신호를 시간영역에서 다단 IIR필터를 통과시켜 주기성검출에 유리하도록 신호를 변환하고 변환된 신호의 시간에 따른 증가 감소 특성을 따져서 주기성을 검출할 수 있다.
또한, 본 발명에 따르면, 피치구간을 특정의 구간들로 설정하고 피치의 시작점과 구간들을 검출할 수 있으며, 특히 필터출력 신호의 플러스 신호와 마이너스 신호를 얻어 동시에 이용하므로써 피치주기 추정의 오류를 줄일 수 있다.
또한, 본 발명에 따르면, 피치의 시작 위치와 제안 구간들을 추출한 후 조건에따라 피치후보들을 합리적으로 채택하게 되어 피치추정의 정확성과 안정성을 높일 수 있다.
도 1은 본 발명의 실시예에 따른 IIR 필터를 이용한 시간 영역에서의 피치 추정 장치를 도시하는 절차도.
도 2는 본 발명의 실시예에 따른 IIR 필터를 이용한 시간 영역에서의 피치 추정 장치에 있어서 IIR 필터의 구조를 도시한 도면.
도 3은 직렬로 연결되는 복수개의 IIR 필터를 포함하여 다단으로 구성되는 IIR 필터부를 도시하는 도면이다.
도 4는 본 발명의 실시예에 따른 IIR 필터부의 주파수에 따른 통과 특성을 나타내는 도면이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것으로서, 본 발명은 청구항의 기재에 의해 정의될 뿐이다. 한편, 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며, 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 이하, 첨부된 도면을 참조하여 본 발명의 실시예들을 상세히 설명하기로 한다.
본 발명은 기존의 자기상관함수를 이용한 피치추정이나 케프스트럼 영역에서의 주기특성 검출방식과는 다르게 음성신호를 시간영역에서 다단 IIR필터를 통과시켜 주기성검출에 유리하도록 신호를 변환하고 변환된 신호의 시간에 따른 증가 감소 특성을 따져서 주기성을 검출하는 방안을 제시한다.
본 발명의 실시예에 따른 피치 추정 장치는 음성신호를 IIR필터들의 직렬로 처리하여 최종 신호를 얻어낸다.
다단 IIR필터를 통과한 출력신호는 과도구간에서도 피치추정의 오류를 줄일 수 있게 하며 연산비용을 감소시키고 시간영역에서 직접 처리를 하는 것으로 하여 샘플점 단위의 정확도로 피치주기를 검출할 수 있게 한다.
이하, 도 1을 참조하여 본 발명의 실시예에 따른 IIR 필터를 이용한 시간 영역에서의 피치 추정 장치를 설명한다. 도 1은 본 발명의 실시예에 따른 IIR 필터를 이용한 시간 영역에서의 피치 추정 장치를 설명하기 위한 블록도이다.
도 1을 참조하면, 본 발명의 실시예에 따른 IIR 필터를 이용한 시간 영역에서의 피치 추정 장치(10)는 IIR 필터부(100)와, 엔벨로프처리부(200)와, 구간처리부(300) 및 피치추정부(400)를 포함한다.
IIR 필터부(100)는 복수개의 IIR 필터들(제1 필터, 제2 필터 및 제3 필터)로 이루어지며, 음성신호를 시간영역에서 다단 IIR필터를 통과시켜 주기성 검출에 유리하도록 신호를 변환한다.
즉, 다단으로 구성되는 IIR 필터부(100)는 음성의 피치 주파수의 범위를 포함하는 50Hz 내지 1000Hz에서 높은 통과 특성(이득)을 가지며, 목적하는 피치 주파수 범위보다 낮은 주파수 대역 및 직류성분(DC)를 차단하는 특성과, 목적하는 피치 주파수 범위보다 높은 주파수 대역의 성분을 차단시킨다.
한편, IIR 필터부(100)에 포함되는 제1 필터, 제2 필터 및 제3 필터는 각각 고역차단특성, 저역차단특성 및 단조감소 특성을 가진다.
도 2를 참조하면, 본 발명의 실시예에 따른 IIR 필터부(100)는 4개의 지연기(111, 113, 115, 117)와, 5개의 승산기(121, 123, 125, 127, 129)와, 4개의 가산기(131, 133, 135, 137)를 포함하는 복수개의 IIR 필터들로 이루어진다.
더욱 상세하게는, 각각의 IIR 필터는, 입력신호 x(n)을 받아 소정시간 지연시키는 지연기(111)와, 지연기(111)의 출력과 계수 b1을 승산하는 승산기(123)와, 지연기(111)의 출력을 소정시간 지연시키는 지연기(113)와, 지연기(113)의 출력과 계수 b2를 승산하는 승산기(125)와, 승산기(123)의 출력과 승산기(125)의 출력을 가산하는 가산기(133)와, 입력신호 x(n)에 계수 b0를 승산하는 승산기(121)와 승산기(121)의 출력과 가산기(133)의 출력을 가산하는 가산기(131)와, 출력신호 y(n)를 소정시간 지연시키는 지연기(115)와, 지연기(115)의 출력에 계수 a1을 승산하는 승산기(127)와, 지연기(115)의 출력을 소정시간 지연시키는 지연기(117)와, 지연기(117)의 출력에 계수 a2를 승산하는 승산기(129)와, 승산기(127)의 출력과 승산기(129)의 출력을 가산하는 가산기(135)와, 가산기(135)의 출력과 가산기(131)의 출력을 가산하는 가산기(137)를 포함하며, 가산기(137)의 출력에서 출력신호 y(n)가 출력된다.
한편, 본 발명의 실시예에 따른 IIR 필터부(100)는 하기의 수학식들에 따른 계수를 가지는 IIR 필터들(제1 필터, 제2 필터 및 제3 필터)을 포함할 수 있다.
Figure 112011080576394-pat00001
Figure 112011080576394-pat00002
Figure 112011080576394-pat00003
Figure 112011080576394-pat00004
Figure 112011080576394-pat00005
수학식 1은 제1 필터의 계수를 계산하기 위한 식을 나타낸다.
한편,
Figure 112011080576394-pat00006
,
Figure 112011080576394-pat00007
이며,
Figure 112011080576394-pat00008
는 표본화 주파수,
Figure 112011080576394-pat00009
는 필터생성 파라미터를 나타낸다.
Figure 112011080576394-pat00010
Figure 112011080576394-pat00011
Figure 112011080576394-pat00012
Figure 112011080576394-pat00013
Figure 112011080576394-pat00014
수학식 2는 제2 필터의 계수를 계산하기 위한 식을 나타낸다.
한편,
Figure 112011080576394-pat00015
,
Figure 112011080576394-pat00016
이며,
Figure 112011080576394-pat00017
는 표본화 주파수,
Figure 112011080576394-pat00018
는 필터생성 파라미터를 나타낸다.
Figure 112011080576394-pat00019
Figure 112011080576394-pat00020
Figure 112011080576394-pat00021
Figure 112011080576394-pat00022
Figure 112011080576394-pat00023
수학식 3은 제3 필터의 계수를 계산하기 위한 식을 나타낸다.
한편,
Figure 112011080576394-pat00024
이며,
Figure 112011080576394-pat00025
는 표본화 주파수,
Figure 112011080576394-pat00026
는 필터생성 파라미터를 나타낸다.
한편, 복수개의 IIR 필터들(제1 필터, 제2 필터 및 제3 필터)은 도 3에 도시된 바와 같이 직렬로 연결될 수 있다. 도 4는 직렬 연결된 3개의 제1 필터와, 제1 필터의 출력을 입력으로하는 제2 필터 및 제2 필터와 연결되는 제3 필터를 포함하는 다단으로 구성되는 IIR 필터부(100)를 도시하는 도면이다.
도 3에 있어서, F1은 제1 필터, F2는 제2 필터, F3는 제3 필터를 나타낸다.
한편, 제1 필터, 제2 필터 및 제3 필터는 각각 고역차단특성, 저역차단특성 및 단조감소 특성을 가지도록 설계된다.
도 4는 본 발명의 실시예에 따른 IIR 필터부(100)의 주파수에 따른 통과 특성을 나타내는 도면이다.
전술한 바와 같이 다단으로 구성되는 IIR 필터부(100)는 음성의 피치 주파수의 범위를 포함하는 50Hz 내지 1000Hz에서 높은 통과 특성(이득)을 가지며, 목적하는 피치 주파수 범위보다 낮은 주파수 대역 및 직류성분(DC)를 차단하는 특성과, 목적하는 피치 주파수 범위보다 높은 주파수 대역을 차단시키는 특성을 가진다.
따라서, 시간 영역에서 음성 파형에 대한 조작을 통하여 피치를 추출하려고 하는 조건에서 음성 성분의 판단에 방해를 주는 DC 성분이나 음성 파형의 모양을 변화시키는 최소 피치주파수 이하의 저주파 영역의 성분은 약화시킬 수 있다.
또한, 피치 주파수 범위보다 높은 주파수 대역의 주파수 성분을 차단시킬 수 있어, 음성 파형의 증가/감소 특성 분석에 영향을 주는 최대 피치주파수보다 높은 주파수 영역의 성분은 약화시킬 수 있다.
한편, 음성 신호의 최대 피크 점을 잡아서 피치 주기를 구한다고 할 때, 과도 구간이나 잡음의 영향으로 최대 피크 점 보다 낮은 극대점이 일시적으로 커질 수 있으며, 이로인하여 피치 주파수를 잘못 추정할 수 있는데, 다단으로 구성되는 IIR 필터부(100)는 피치주파수 대역에서 단조적으로 감소하는 특성을 가질 수 있어, 기본 주파수 성분에 대한 고조파 성분을 약화시킬 수 있다는 이점이 있다.
엔벨로프처리부(200)는 IIR 필터부(100)의 출력신호를 제공받아 신호구간을 액티브구간(Active Section), 유지구간(Sustain Section), 임계구간(Limit Section)으로 구분하고 엔벨로프 곡선을 만든다.
여기서, 액티브구간은 피치 주기내에 있어서 기본적으로 최대 정수값을 가지는 일정 범위의 정수구간이다. 정수구간은 출력표본 값이 정수값을 유지하는 구간을 말한다.
음성파형에 대한 통상의 지식을 가진 사람은 누구나 알고 있는 바와 같이 피치주기내에서 최대점의 위치는 정상구간에서 일정한 특성이 있지만 과도구간이나 위상이 달라지는 시점에서는 최대점의 위치가 달라진다. 기본적으로 최대 정수값을 가지는 정수 구간, 즉, 액티브 구간이라 함은 약간의 위상변동이나 잡음에 의하여 일시적으로 진폭이 최대로 되는 점은 포함하고 있지 않아도 해당 구간의 특성을 유지하고 있는 구간으로 액티브 곡선이 정수가 되는 구간이다.
최대 정수값을 가진다는 의미는 음성파형에서 위상이나 음가가 크게 변하지 않는 조건을 만족하는 구간, 즉, 정상적인 신호구간에서 피치내 최대값을 가질 확률이 높은 구간을 의미한다.
한편, 엔벨로프처리부(200)는 액티브 구간을 안정적으로 설정하기 위하여 아래와 같은 2가지 방법을 사용한다.
첫번째는, 다단 IIR 필터의 통과 대역에서의 통과 특성이 주파수가 증가하는데 따라 단조 감소하는 특성을 가지게 하여 기본주파수(피치주파수)의 고조파 세력들이 기본 주파수세력에 비하여 상대적으로 작아지도록 하여 고조파 세력에 의하여 최대점이 왜곡되는 경향을 최대한 줄이도록 하였다
두번째는, 액티브 곡선을 정의하고 이 곡선이 여러가지 인자의 영향을 받아 결정되게 하며 단순한 진폭최대점을 포함하는 구간을 액티브 구간으로 설정하지는 않도록 한다.
한편, 정수구간 이외의 구간을 부수구간으로 정의한다.
임계구간은 액티브 구간이 시작되어 입력되는 신호 또는 샘플의 값이 기설정된 임계값보다 큰 시점부터 액티브구간의 시작까지의 구간을 의미한다. 또한, 유지구간은 액티브구간과 임계구간 사이의 구간을 의미한다.
구간처리부(300)는 IIR 필터부(100)의 출력을 그대로 처리하여 얻은 신호인 플러스신호와 부호가 반대인 마이너스 신호 및 엔벨로프처리부(200)에서 구분된 액티브 구간, 유지구간, 임계구간을 이용하여, 피치 구간(피치를 포함하는 소정의 범위에 해당하는 길이)의 시작점을 찾는다.
여기서, IIR 필터부(100)의 출력을 그대로 처리하여 얻은 신호를 플러스피치신호 혹은 플러스신호이라고 부르고 반대부호의 신호를 처리하여 얻은 신호를 마이너스피치신호 혹은 마이너스신호이라고 부른다.
구간처리부(300)는 음성신호의 플러스신호와 마이너스 신호를 동시에 이용하여 피치내 특정 위치를 찾는다. 이는 음성파형의 위상특성이나 과도구간에서의 파형변화에도 로버스트(Robust)하게 처리될 수 있는 요인으로 된다.
즉, 구간처리부(300)는 피치 구간의 시작점을 찾기 위해, IIR 필터부(100)의 출력으로부터 무음 구간과 피치구간을 판정하며, 피치구간을 IIR 필터부(100)의 출력에 있어서 양의 구간인 양 구간과 음의 구간인 음 구간으로 구분한다.
한편, 피치 구간의 시작점은 양 구간이 끝나는 시점(음 구간이 시작되는 점), 즉, 엔벨로프처리부(200)에서 얻은 플러스곡선의 액티브 구간 시작 위치에 근접한 위치에서 찾아질 수 있다.
또한, 양 구간이 시작되는 점(음 구간이 끝나는 점)은 마이너스 곡선의 액티브구간 시작 위치에 근접한 위치가 된다.
즉, 구간처리부(300)는 양 구간 및 음 구간의 시작 또는 끝나는 위치를 찾아 피치 구간의 시작점을 찾을 수 있다.
또한, 피치의 시작점은 유지구간 중에서 찾아질 수 있다.
피치추정부(400)는 구간처리부(300)에서의 출력을 기초로 복수개의 피치 후보를 계산하고, 피치 후보 중 하나를 선택하여 피치로 추정한다.
연결합성방식(TD-PSOLA)을 적용하여 음성을 합성하는 경우, 시간영역에서 피치정정을 하는 경우에 일정한 피치시작점을 찾는 것은 중요한 문제가 되므로, 피치추정부(400)는 구간처리부(300)에서의 양 구간과 음 구간의 길이의 합에 따라 피치 후보를 계산한다.
한편, 피치추정부(400)에 있어서 피치 추정에 있어서 후보 선택의 판단은 이전에 추출한 피치 구간와 현재 후보들 사이의 길이 차이를 가지고 진행한다.
즉, 제1시점에서 추출된 피치 구간와 제1시점 이후의 제2시점에서 추출된 피치 구간의 길이 차이에 기초하여, 그 차이가 기설정된 길이 값 미만인 경우의 피치 후보를 선택하여 피치로 추정한다.
한편, 후보 선택에 있어서, 추정되는 피치 후보의 길이의 2배가 되는 배피치 영역에서 후보가 선택될 수 있다.
또한, 배 피치 영역에서의 후보 선택은 기설정된 횟수(예를 들어 3회) 이상 연속적으로 진행될 수 없다는 제한을 주어 피치추정부(400)에서 있을 수 있는 배 피치 오류를 줄일 수 있다.
피치길이 후보를 배 피치 영역에서도 가지는 것은 엔벨로프처리부(200)에서의 있을 수 있는 반피치 오류에 효과적으로 대응하기 위함이다.
여기서, 반피치 오류는 추정된 피치길이가 원래 피치길이의 절반으로 추정되는 오류를 의미하며, 배피치 오류는 추정된 피치길이가 원래 피치길이의 2배로 추정되는 오류를 의미한다.
전술한 바에 따라, 본 발명의 실시예에 따른 IIR 필터를 이용한 시간 영역에서의 피치 추정 장치(10)는 음성신호를 시간영역에서 다단 IIR필터를 통과시켜 주기성검출에 유리하도록 신호를 변환하고 변환된 신호의 시간에 따른 증가 감소 특성을 따져서 주기성을 검출할 수 있다.
또한, 피치구간을 특정의 구간들로 설정하고 피치의 시작점과 구간들을 검출할 수 있으며, 특히 필터출력 신호의 플러스 신호와 마이너스 신호를 얻어 동시에 이용하므로써 피치주기 추정의 오류를 줄일 수 있다.
또한, 피치의 시작 위치와 제안 구간들을 추출한 후 조건에 따라 피치후보들을 합리적으로 채택하게 되어 피치추정의 정확성과 안정성을 높일 수 있다는 이점이 있다.
본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구의 범위에 의하여 나타내어지며, 특허청구의 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (10)

  1. 직렬로 연결되는 복수개의 IIR 필터를 포함하여, 음성 신호의 피치 주파수 범위인 50Hz 내지 1000Hz의 대역에 대한 통과 특성과 통과 구간에서 통과율이 단조적으로 감소하는 특성을 가지는 IIR 필터부;
    상기 IIR 필터부의 출력 신호를 제공받아 상기 출력 신호를 상기 피치 주기 내에 있어서 최대 정수값을 가지는 소정 범위의 정수구간인 액티브구간, 상기 출력 신호의 샘플 값이 기설정된 임계값보다 큰 시점부터 상기 액티브구간의 시작까지의 구간인 임계구간으로 구분하는 엔벨로프처리부;
    상기 출력 신호 및 상기 출력 신호와 부호가 반대인 신호를 입력받으며, 상기 출력 신호를 양의 구간인 양 구간과 음의 구간인 음 구간으로 구분하고, 상기 액티브 구간 및 상기 임계 구간에 있어서, 상기 양 구간과 상기 음 구간이 시작되거나 끝나는 점을 이용하여 피치 구간의 시작점을 찾는 구간 처리부; 및
    상기 구간 처리부에서의 출력을 기초로 복수개의 피치 후보를 계산하고, 복수개의 상기 피치 후보 중에서 하나를 선택하여 피치를 추정하는 피치 추정부;를 포함하는 것이며,
    상기 피치 추정부는,
    제1시점에서 추출된 피치 구간와 상기 제1시점 이후의 제2시점에서 추출된 피치 구간의 길이 차이에 기초하여, 상기 차이가 기설정된 길이 값 미만인 경우의 상기 피치 후보를 선택하여 상기 피치로 추정하는 것
    인 IIR 필터를 이용한 시간 영역에서의 피치 추정 장치.
  2. 제 1 항에 있어서, 상기 IIR 필터부가 포함하는 IIR 필터는,
    입력신호 x(n)을 받아 소정시간 지연시키는 지연기(111)와, 상기 지연기(111)의 출력과 계수 b1을 승산하는 승산기(123)와, 상기 지연기(111)의 출력을 소정시간 지연시키는 지연기(113)와, 상기 지연기(113)의 출력과 계수 b2를 승산하는 승산기(125)와, 상기 승산기(123)의 출력과 상기 승산기(125)의 출력을 가산하는 가산기(133)와, 상기 입력신호 x(n)에 계수 b0를 승산하는 승산기(121)와 상기 승산기(121)의 출력과 상기 가산기(133)의 출력을 가산하는 가산기(131)와, 출력신호 y(n)를 소정시간 지연시키는 지연기(115)와, 상기 지연기(115)의 출력에 계수 a1을 승산하는 승산기(127)와, 상기 지연기(115)의 출력을 소정시간 지연시키는 지연기(117)와, 상기 지연기(117)의 출력에 계수 a2를 승산하는 승산기(129)와, 상기 승산기(127)의 출력과 상기 승산기(129)의 출력을 가산하는 가산기(135)와, 상기 가산기(135)의 출력과 상기 가산기(131)의 출력을 가산하는 가산기(137)를 포함하며, 상기 가산기(137)의 출력에서 상기 출력신호 y(n)가 출력되는 것
    인 IIR 필터를 이용한 시간 영역에서의 피치 추정 장치.
  3. 제 2 항에 있어서, 상기 IIR 필터는,
    하기의 수학식 4에 따른 계수를 가지는 것이며,
    (수학식 4)
    Figure 112011080576394-pat00027
    ,
    Figure 112011080576394-pat00028
    ,
    Figure 112011080576394-pat00029
    ,
    Figure 112011080576394-pat00030
    ,
    Figure 112011080576394-pat00031

    Figure 112011080576394-pat00032
    ,
    Figure 112011080576394-pat00033
    이며,
    Figure 112011080576394-pat00034
    는 표본화 주파수,
    Figure 112011080576394-pat00035
    는 필터생성 파라미터
    인 IIR 필터를 이용한 시간 영역에서의 피치 추정 장치.
  4. 제 2 항에 있어서, 상기 IIR 필터는,
    하기의 수학식 5에 따른 계수를 가지는 것이며,
    (수학식 5)
    Figure 112011080576394-pat00036

    Figure 112011080576394-pat00037

    Figure 112011080576394-pat00038

    Figure 112011080576394-pat00039

    Figure 112011080576394-pat00040

    Figure 112011080576394-pat00041
    ,
    Figure 112011080576394-pat00042
    이며,
    Figure 112011080576394-pat00043
    는 표본화 주파수,
    Figure 112011080576394-pat00044
    는 필터생성 파라미터
    인 IIR 필터를 이용한 시간 영역에서의 피치 추정 장치.
  5. 제 2 항에 있어서, 상기 IIR 필터는,
    하기의 수학식 6에 따른 계수를 가지는 것이며,
    (수학식 6)
    Figure 112011080576394-pat00045

    Figure 112011080576394-pat00046

    Figure 112011080576394-pat00047

    Figure 112011080576394-pat00048

    Figure 112011080576394-pat00049

    Figure 112011080576394-pat00050
    이며,
    Figure 112011080576394-pat00051
    는 표본화 주파수,
    Figure 112011080576394-pat00052
    는 필터생성 파라미터
    인 IIR 필터를 이용한 시간 영역에서의 피치 추정 장치.
  6. 제 1 항에 있어서, 상기 IIR 필터는,
    음성 신호의 직류 성분을 차단하는 것
    인 IIR 필터를 이용한 시간 영역에서의 피치 추정 장치.
  7. 삭제
  8. 삭제
  9. 제 1 항에 있어서, 상기 피치 추정부는,
    상기 피치 후보의 길이의 2배가 되는 배피치 영역에서 상기 피치를 추정하는 것
    인 IIR 필터를 이용한 시간 영역에서의 피치 추정 장치.
  10. 제 9 항에 있어서, 상기 피치 추정부는,
    상기 배피치 영역에서 상기 피치를 추정하는데 있어서 후보 선택의 횟수를 기설정된 횟수 이하로 제한하는 것
    인 IIR 필터를 이용한 시간 영역에서의 피치 추정 장치.
KR1020110105491A 2011-10-14 2011-10-14 Iir 필터를 이용한 시간 영역에서의 피치 추정 장치 KR101121217B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110105491A KR101121217B1 (ko) 2011-10-14 2011-10-14 Iir 필터를 이용한 시간 영역에서의 피치 추정 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110105491A KR101121217B1 (ko) 2011-10-14 2011-10-14 Iir 필터를 이용한 시간 영역에서의 피치 추정 장치

Publications (1)

Publication Number Publication Date
KR101121217B1 true KR101121217B1 (ko) 2012-03-22

Family

ID=46141591

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110105491A KR101121217B1 (ko) 2011-10-14 2011-10-14 Iir 필터를 이용한 시간 영역에서의 피치 추정 장치

Country Status (1)

Country Link
KR (1) KR101121217B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR980006832A (ko) * 1996-06-28 1998-03-30 김광호 저역통과 11r 필터의 설계방법 및 이에 적합한 저역통과 11r 필터
JP3149466B2 (ja) * 1991-07-26 2001-03-26 カシオ計算機株式会社 ピッチ抽出装置及びそれを用いた電子楽器
JP2008209548A (ja) 2007-02-26 2008-09-11 National Institute Of Advanced Industrial & Technology 音高推定装置、音高推定方法およびプログラム
JP4755585B2 (ja) 2003-03-31 2011-08-24 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声信号に関する周波数領域および時間領域の複合ピッチ抽出のための方法、分散音声認識システム及びコンピュータ可読媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3149466B2 (ja) * 1991-07-26 2001-03-26 カシオ計算機株式会社 ピッチ抽出装置及びそれを用いた電子楽器
KR980006832A (ko) * 1996-06-28 1998-03-30 김광호 저역통과 11r 필터의 설계방법 및 이에 적합한 저역통과 11r 필터
JP4755585B2 (ja) 2003-03-31 2011-08-24 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声信号に関する周波数領域および時間領域の複合ピッチ抽出のための方法、分散音声認識システム及びコンピュータ可読媒体
JP2008209548A (ja) 2007-02-26 2008-09-11 National Institute Of Advanced Industrial & Technology 音高推定装置、音高推定方法およびプログラム

Similar Documents

Publication Publication Date Title
EP1744305B1 (en) Method and apparatus for noise reduction in sound signals
JP4282227B2 (ja) ノイズ除去の方法及び装置
RU2127454C1 (ru) Способ понижения шума и устройство для его осуществления
US10510363B2 (en) Pitch detection algorithm based on PWVT
KR101052445B1 (ko) 잡음 억압을 위한 방법과 장치, 및 컴퓨터 프로그램
US8160732B2 (en) Noise suppressing method and noise suppressing apparatus
JP4886715B2 (ja) 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体
CN103021420B (zh) 一种基于相位调整和幅值补偿的多子带谱减法的语音增强方法
JP6174856B2 (ja) 雑音抑制装置、その制御方法、及びプログラム
JP6136995B2 (ja) 雑音低減装置
RU2587652C2 (ru) Способ и устройство для оценки структуры в сигнале
KR20070007684A (ko) 모폴로지를 이용한 오디오 신호의 피치 정보 추출 방법 및그 장치
JP2005266797A (ja) 音源信号分離装置及び方法、並びにピッチ検出装置及び方法
JP2007006525A (ja) ノイズ除去の方法及び装置
CN102737645A (zh) 一种语音信号的基音周期估计算法
US8280725B2 (en) Pitch or periodicity estimation
KR101121217B1 (ko) Iir 필터를 이용한 시간 영역에서의 피치 추정 장치
JP4395772B2 (ja) ノイズ除去方法及び装置
JP2007072005A (ja) 非定常雑音判別方法、その装置、そのプログラム及びその記録媒体
JP2000010593A (ja) スペクトル雑音除去装置
EP1628397A1 (en) Audio quality adjustment device
JP6059130B2 (ja) 雑音抑圧方法とその装置とプログラム
JP6447357B2 (ja) オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
JP5495858B2 (ja) 音楽音響信号のピッチ推定装置及び方法
JP5418204B2 (ja) 背景雑音レベル推定装置、方法及びプログラム

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20141217

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20151112

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20161209

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20181108

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20200106

Year of fee payment: 9