KR100724736B1 - 스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치 - Google Patents

스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치 Download PDF

Info

Publication number
KR100724736B1
KR100724736B1 KR1020060008161A KR20060008161A KR100724736B1 KR 100724736 B1 KR100724736 B1 KR 100724736B1 KR 1020060008161 A KR1020060008161 A KR 1020060008161A KR 20060008161 A KR20060008161 A KR 20060008161A KR 100724736 B1 KR100724736 B1 KR 100724736B1
Authority
KR
South Korea
Prior art keywords
spectral
pitch
auto
correlation value
speech signal
Prior art date
Application number
KR1020060008161A
Other languages
English (en)
Inventor
오광철
정재훈
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020060008161A priority Critical patent/KR100724736B1/ko
Priority to JP2006234171A priority patent/JP4444254B2/ja
Priority to US11/604,272 priority patent/US8315854B2/en
Application granted granted Critical
Publication of KR100724736B1 publication Critical patent/KR100724736B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B66HOISTING; LIFTING; HAULING
    • B66BELEVATORS; ESCALATORS OR MOVING WALKWAYS
    • B66B9/00Kinds or types of lifts in, or associated with, buildings or other structures
    • B66B9/02Kinds or types of lifts in, or associated with, buildings or other structures actuated mechanically otherwise than by rope or cable
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08LCOMPOSITIONS OF MACROMOLECULAR COMPOUNDS
    • C08L23/00Compositions of homopolymers or copolymers of unsaturated aliphatic hydrocarbons having only one carbon-to-carbon double bond; Compositions of derivatives of such polymers
    • C08L23/02Compositions of homopolymers or copolymers of unsaturated aliphatic hydrocarbons having only one carbon-to-carbon double bond; Compositions of derivatives of such polymers not modified by chemical after-treatment
    • C08L23/04Homopolymers or copolymers of ethene

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Organic Chemistry (AREA)
  • Polymers & Plastics (AREA)
  • Mechanical Engineering (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Structural Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

스펙트럴 자기상관치를 이용하여 입력 음성 신호에 대한 피치를 검출하는 방법 및 장치가 개시된다. 입력 음성 신호에 대한 피치 검출 방법은, 입력된 음성 신호를 전처리하여 퓨리에 변환을 수행하는 단계와, 변환된 음성 신호에 대해 보간(interpolation)을 수행하는 단계와, 변환 및 보간된 음성 신호의 스펙트럼 차이에 의해 스펙트럴 디퍼런스(spectral difference)를 계산하는 단계와, 계산된 스펙트럴 디퍼런스를 이용하여 스펙트럴 자기상관치(auto-correlation)를 계산하는 단계와, 계산된 스펙트럴 자기상관치에 기초하여 유성음(voicing) 구간을 결정하는 단계 및 유성음 구간에 해당하는 스펙트럴 자기상관치를 이용하여 피치를 검출하는 단계를 포함한다.
음성 신호, 피치 검출, 스펙트럴 자기상관치, 유성음

Description

스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치 검출 장치{METHOD AND APPARATUS FOR DETECTING PITCH WITH SPECTRAL AUTO-CORRELATION}
도 1은 본 발명의 일실시예에 따른 피치 검출 장치를 도시한 블록도이다.
도 2는 도 1의 피치 검출 장치가 수행하는 피치 검출 방법을 도시한 흐름도이다.
도 3은 도 2의 피치 검출 방법을 실험적으로 수행하여 나타난 결과 파형을 도시한 도면이다.
도 4는 본 발명의 다른 실시예에 따른 피치 검출 장치를 도시한 블록도이다.
도 5는 도 4의 피치 검출 장치가 수행하는 피치 검출 방법을 도시한 흐름도이다.
도 6은 도 5의 피치 검출 방법을 실험적으로 수행하여 나타난 결과 파형을 도시한 도면이다.
도 7은 스펙트럴 디퍼런스의 파형과 정규화 로컬 무게중심의 파형을 간략히 비교하기 위한 도면이다.
<도면의 주요 부분에 대한 부호의 설명>
100: 피치 검출 장치
101: 전처리부
102: 퓨리에 변환부
103: 보간부
104: 스펙트럴 디퍼런스 계산부
105: 스펙트럴 자기상관치 계산부
106: 유성음 구간 결정부
107: 피치 검출부
본 발명은 스펙트럴 자기상관치를 이용하여 입력 음성 신호에 대한 피치를 검출하는 방법 및 장치에 관한 것이다.
음성 인식, 합성 및 분석과 같은 음성 신호 처리 분야에 있어서 기본 주파수, 즉 피치 주기를 정확히 검출하는 것은 중요하다. 만일, 음성 신호의 기본 주파수를 정확히 검출할 수 있다면 음성 인식에 있어서 화자에 따른 영향을 줄일 수 있기 때문에 인식의 정확도를 높일 수 있고, 음성 합성 시에 자연성과 개성을 쉽게 변경하거나 유지할 수 있다. 또한, 음성 분석시 피치에 동기시켜 분석하면 성문의 영향이 제거된 정확한 성도 파라미터를 얻을 수 있다.
이와 같이, 음성 신호에서 피치 검출을 수행하는 것은 중요한 작업이므로 이를 위한 방법들이 다양하게 제안되었다. 그것은 시간 영역 검출 방법, 주파수 영역 검출 방법, 시간-주파수 혼성 영역 검출 방법으로 구분할 수 있다.
시간 영역 검출 방법은 파형의 주기성을 강조한 후에 결정 논리에 의해 피치를 검출하는 방법으로 병렬처리법, 평균 진폭 차 함수(Average Magnitude Difference Function: AMDF), 자기상관법(Auto-Correlation Method: ACM) 등이 있다. 이러한 방법은 보통 시간 영역에서 수행되므로 영역의 변환이 불필요하고, 합, 차, 비교 논리 등 간단한 연산만 필요하게 된다. 그러나, 음소가 천이 구간에 걸쳐 있는 경우에는 프레임 내의 레벨 변화가 심하고 피치 주기가 변동하기 때문에 피치 검출이 어렵고, 포만트(formant)에 의해 영향을 많이 받게 된다. 특히 잡음이 섞인 음성의 경우에는 피치 검출을 위한 결정 논리가 복잡해져서 검출 오류가 증가되는 단점이 있다.
주파수 영역 검출 방법은 음성 스펙트럼의 고조파 간격을 측정하여 유성음의 기본 주파수를 검출하는 방법으로 고조파 분석법, 리프터(Lifter)법, 콤필터링(Comb-filtering)법 등이 제안되어 있다. 일반적으로 스펙트럼은 한 프레임 단위로 구해지므로, 이 구간에서 음소의 천이나 변동이 일어나거나 배경 잡음이 발생하여도 평균화되므로 그 영향을 적게 받는다. 그러나, 처리 과정상 주파수 영역으로의 변환 과정이 필요함으로 계산이 복잡할 수 있으며, 기본 주파수의 정밀성을 높이기 위해 FFT의 포인터 수를 늘리면 그만큼 시간이 길어지고 변화 특성에 둔해지게 된다.
시간-주파수 혼성 영역 검출 방법은 시간 영역법의 계산 시간 절감과 피치의 정밀성, 그리고 주파수 영역법의 배경 잡음이나 음소 변화에 대해서도 피치를 정확히 구할 수 있는 장점을 취한 것이다. 이러한 방법으로는 켑스트럼(Cepstrum)법, 스펙트럼 비교법 등이 있고, 이 방법은 시간과 주파수 영역을 왕복할 때 오차가 가중되어 나타나므로 피치 추출의 영향을 받을 수 있고, 또한 시간과 주파수 영역을 동시에 적용하기 때문에 계산 과정이 복잡하다는 단점이 있다.
본 발명이 이루고자 하는 기술적 과제는, 스펙트럴 디퍼런스 및 그것의 스펙트럴 자기상관치를 시간 영역의 신호에서와 같이 이용하여 입력 음성 신호에 대한 피치를 검출하는 방법과, 스펙트럼의 정규화 로컬 무게중심 및 그것의 스펙트럴 자기상관치를 시간 영역의 신호에서와 같이 이용하여 입력 음성 신호에 대한 피치를 검출하는 방법, 그리고 상기 방법들을 수행하는 피치 검출 장치를 제공하는데 있다.
상기 기술적 과제를 달성하기 위하여, 본 발명의 일실시예에 따른 피치 검출 장치는, 입력된 음성 신호를 전처리하는 전처리부와, 전처리된 음성 신호에 대하여 퓨리에 변환을 수행하는 퓨리에 변환부와, 변환된 음성 신호에 대해 보간(interpolation)을 수행하는 보간부와, 변환 및 보간된 음성 신호의 스펙트럼 차이에 의해 스펙트럴 디퍼런스(spectral difference)를 계산하는 스펙트럴 디퍼런스 계산부와, 계산된 스펙트럴 디퍼런스를 이용하여 스펙트럴 자기상관치(auto-correlation)를 계산하는 스펙트럴 자기상관치 계산부와, 계산된 스펙트럴 자기상관치에 기초하여 유성음(voicing) 구간을 결정하는 유성음 구간 결정부 및 유성음 구간에 해당하는 스펙트럴 자기상관치를 이용하여 피치를 검출하는 피치 검출부를 포함한다.
본 발명의 다른 실시예에 따른 피치 검출 장치는, 입력된 음성 신호를 전처리하는 전처리부와, 전처리된 음성 신호에 대하여 퓨리에 변환을 수행하는 퓨리에 변환부와, 변환된 음성 신호에 대해 보간을 수행하는 보간부와, 변환 및 보간된 음성 신호의 스펙트럼에 대해 정규화 로컬 무게중심(Normalized Local Center of Gravity: NLCG)을 계산하는 정규화 로컬 무게중심 계산부와, 계산된 정규화 로컬 무게중심을 이용하여 스펙트럴 자기상관치를 계산하는 스펙트럴 자기상관치 계산부와, 계산된 스펙트럴 자기상관치에 기초하여 유성음 구간을 결정하는 유성음 구간 결정부 및 유성음 구간에 해당하는 스펙트럴 자기상관치를 이용하여 피치를 검출하는 피치 검출부를 포함한다.
본 발명의 또 다른 실시예에 따른 피치 검출 방법은, 입력된 음성 신호를 전처리하여 퓨리에 변환을 수행하는 단계와, 변환된 음성 신호에 대해 보간을 수행하는 단계와, 변환 및 보간된 음성 신호의 스펙트럼 차이에 의해 스펙트럴 디퍼런스를 계산하는 단계와, 계산된 스펙트럴 디퍼런스를 이용하여 스펙트럴 자기상관치를 계산하는 단계와, 계산된 스펙트럴 자기상관치에 기초하여 유성음 구간을 결정하는 단계 및 유성음 구간에 해당하는 스펙트럴 자기상관치를 이용하여 피치를 검출하는 단계를 포함한다.
본 발명의 또 다른 실시예에 따른 피치 검출 방법은, 입력된 음성 신호를 전처리하여 퓨리에 변환을 수행하는 단계와, 변환된 음성 신호에 대해 보간을 수행하는 단계와, 변환 및 보간된 음성 신호의 스펙트럼에 대해 정규화 로컬 무게중심을 계산하는 단계와, 계산된 정규화 로컬 무게중심을 이용하여 스펙트럴 자기상관치를 계산하는 단계와, 계산된 스펙트럴 자기상관치에 기초하여 유성음 구간을 결정하는 단계 및 유성음 구간에 해당하는 스펙트럴 자기상관치를 이용하여 피치를 검출하는 단계를 포함한다.
또한, 상기 방법은 컴퓨터에서 실행시키기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록 매체로 구현될 수 있다.
이하, 첨부된 도면을 참조하여 본 발명의 실시예에 대하여 상세하게 설명하기로 한다.
도 1은 본 발명의 일실시예에 따른 피치 검출 장치를 도시한 블록도이다.
도 1에 도시한 것과 같이, 본 실시예에 따른 피치 검출 장치(100)는 전처리부(101), 퓨리에 변환부(102), 보간부(103), 스펙트럴 디퍼런스 계산부(104), 스펙트럴 자기상관치 계산부(105), 유성음 구간 결정부(106) 및 피치 검출부(107)를 포함한다.
본 실시예에 따른 피치 검출 장치(100)는 스펙트럴 디퍼런스 및 그것의 스펙트럴 자기상관치를 이용하여 입력 음성 신호에 대한 피치를 검출하며, 상기 스펙트럴 디퍼런스의 파형은 시간 영역의 파형과 유사한 형태로 나타나며, 상기 스펙트럴 디퍼런스를 이용하여 계산한 스펙트럴 자기상관치의 그래프에서는 피치 주파수에 대응하는 피크들이 나타난다.
도 2는 도 1의 피치 검출 장치가 수행하는 피치 검출 방법을 도시한 흐름도이다.
단계(S201)에서 전처리부(101)는 입력된 음성 신호를 전처리(pre-processing)하며, 단계(S202)에서 퓨리에 변환부(102)는 전처리된 음성 신호에 대하여 아래 수학식 1과 같이 퓨리에 변환(Fourier Transform)을 수행한다.
Figure 112006006171454-pat00001
단계(S203)에서 보간부(103)는 변환된 음성 신호에 대해 아래 수학식 2와 같이 보간(interpolation)을 수행한다.
A(fk) ⇒ A(fi)
k = 1, 2, …, Lk
i = 1, 2, …, Li
R = Li/Lk
단계(S203)에서 보간부(103)는 소정의 저역 주파수 범위(ex. 0 ~ 1.5kHz)에 해당하는 진폭(amplitudes)에 대해 저역통과 보간(low-pass interpolation)을 수행하고, 수학식 2와 같이 최초 샘플 레이트의 R(Li/Lk)배에 해당하도록 시퀀스를 리샘플링(resample)할 수 있다. 이러한 보간에 의해 샘플 간격이 좁아서 해상도(resolution)가 떨어지는 현상을 완화하고 주파수 해상도를 향상시킬 수 있다.
단계(S204)에서 스펙트럴 디퍼런스 계산부(104)는 변환 및 보간된 음성 신호의 스펙트럼의 주파수 사이의 차이에 의해 스펙트럴 디퍼런스(spectral difference)를 계산한다. 이는 아래 수학식 3과 같이 나타낼 수 있다.
Figure 112006006171454-pat00002
단계(S204)에서 스펙트럴 디퍼런스 계산부(104)는 양의 값을 갖는(positive) 스펙트럼의 차이에 의해 상기 스펙트럴 디퍼런스를 계산할 수 있으며, 상기 계산된 스펙트럴 디퍼런스의 파형은 시간 영역의 파형과 유사한 형태로 나타난다.
단계(S205)에서 스펙트럴 자기상관치 계산부(105)는 계산된 스펙트럴 디퍼런스를 이용하여 스펙트럴 자기상관치(auto-correlation)를 계산한다. 이 경우, 스펙트럴 자기상관치 계산부(105)는 아래 수학식 4와 같이, 계산된 스펙트럴 디퍼런스를 이용하고, 정규화 처리(normalization)를 수행하여 상기 스펙트럴 자기상관치를 계산한다.
Figure 112006006171454-pat00003
단계(S206)에서 유성음 구간 결정부(106)는 계산된 스펙트럴 자기상관치의 주파수 성분에 의해 유성음(voicing) 구간을 결정한다. 이 경우, 유성음 구간 결정부(106)는 아래 수학식 5와 같이, 계산된 스펙트럴 자기상관치 중 최대 스펙트럴 자기상관치와 소정의 임계치를 비교하고, 상기 최대 스펙트럴 자기상관치가 상기 임계치보다 큰 구간을 상기 유성음 구간으로 결정할 수 있다.
Figure 112006006171454-pat00004
단계(S207)에서 피치 검출부(107)는 아래 수학식 6과 같이, 유성음 구간에 해당하는 스펙트럴 자기상관치를 이용하여 피치를 검출한다.
Figure 112006006171454-pat00005
단계(S207)에서 피치 검출부(107)는 유성음 구간에 해당하는 스펙트럴 자기상관치에 포물선 보간(parabolic interpolation) 또는 싱크 함수 보간(sinc function interpolation)을 수행하여 상기 피치를 검출할 수 있다. 즉, 피치 검출부(107)는 상기 보간된 스펙트럴 자기상관치 중 최대 스펙트럴 자기상관치에 대응하는 로컬 피크의 위치를 상기 피치로 검출할 수 있다.
도 3은 이상에서 설명한 도 2의 피치 검출 방법을 실험적으로 수행하여 나타난 결과 파형을 도시한 도면이다.
도 3에서 (a)는 입력 신호를 나타내는 것으로서, (a)의 ①은 남자 음성의 신호를, (a)의 ②는 남자 음성과 백색 잡음(white noise)이 섞인 신호를, (a)의 ③은 남자 음성과 비행기 소음이 섞인 신호를 각각 나타내며, (a)의 ④는 여자 음성의 신호를, (a)의 ⑤는 여자 음성과 백색 잡음이 섞인 신호를, (a)의 ⑥은 여자 음성과 비행기 소음이 섞인 신호를 각각 나타낸다.
또한, 도 3에서 (b), (c)는 이렇게 입력된 입력 신호를 도 2와 같이 처리하여 나타난 파형을 도시한 것으로서, (b)는 계산된 스펙트럴 자기상관치와 임계치(Tsa)를 이용하여 유성음 구간을 결정하는 모습을, (c)는 유성음 구간에 해당하는 스펙트럴 자기상관치를 이용하여 피치를 검출한 결과를 각각 나타낸 것이다.
도 4는 본 발명의 다른 실시예에 따른 피치 검출 장치를 도시한 블록도이다.
도 4에 도시한 것과 같이, 본 실시예에 따른 피치 검출 장치(400)는 전처리부(401), 퓨리에 변환부(402), 보간부(403), 정규화 로컬 무게중심 계산부(404), 스펙트럴 자기상관치 계산부(405), 유성음 구간 결정부(406) 및 피치 검출부(407)를 포함한다.
본 실시예에 따른 피치 검출 장치(400)는 정규화 로컬 무게중심 및 그것의 스펙트럴 자기상관치를 이용하여 입력 음성 신호에 대한 피치를 검출하며, 상기 정규화 로컬 무게중심의 파형은 시간 영역의 파형과 유사한 형태로 나타나며, 앞선 실시예에 비해 고조파(harmonics)의 주기적인 구조가 더욱 효과적으로 보존될 수 있으며, 상기 정규화 로컬 무게중심을 이용하여 계산한 스펙트럴 자기상관치의 그래프에서는 피치 주파수에 대응하는 피크들이 나타난다.
도 5는 도 4의 피치 검출 장치가 수행하는 피치 검출 방법을 도시한 흐름도이다.
단계(S501)에서 전처리부(401)는 입력된 음성 신호를 전처리하며, 단계(S502)에서 퓨리에 변환부(402)는 전처리된 음성 신호에 대하여 이미 설명한 수학식 1과 같이 퓨리에 변환을 수행한다.
단계(S503)에서 보간부(403)는 변환된 음성 신호에 대해 이미 설명한 수학식 2와 같이 보간을 수행한다. 이 경우, 보간부(403)는 소정의 저역 주파수 범위(ex. 0 ~ 1.5kHz)에 해당하는 진폭에 대해 저역통과 보간을 수행하고, 수학식 2와 같이 최초 샘플 레이트의 R(Li/Lk)배에 해당하도록 시퀀스를 리샘플링(resample)할 수 있다. 이러한 보간에 의해 샘플 간격이 좁아서 해상도(resolution)가 떨어지는 현상을 완화하고 주파수 해상도를 향상시킬 수 있다.
단계(S504)에서 정규화 로컬 무게중심 계산부(404)는 변환 및 보간된 음성 신호의 스펙트럼에 대해 정규화 로컬 무게중심(Normalized Local Center of Gravity: NLCG)을 계산한다. 이는 아래 수학식 7과 같이 나타낼 수 있다.
Figure 112006006171454-pat00006
여기서 U는 로컬 영역을 나타낸다. 상기 계산된 정규화 로컬 무게중심의 파형은 시간 영역의 파형과 유사한 형태로 나타나며, 앞선 실시예에 비해 고조파의 주기적인 구조가 더욱 효과적으로 보존될 수 있다.
단계(S505)에서 스펙트럴 자기상관치 계산부(405)는 계산된 정규화 로컬 무게중심을 이용하여 스펙트럴 자기상관치(auto-correlation)를 계산한다. 이는 아래 수학식 8과 같이 나타낼 수 있다.
Figure 112006006171454-pat00007
이 경우, 스펙트럴 자기상관치 계산부(405)는 앞선 실시예와는 달리 정규화 처리(normalization)를 별도로 수행하지 않는다. 이는 상기 정규화 로컬 무게중심의 계산 시에 정규화 처리가 이미 수행되었기 때문이다.
단계(S506)에서 유성음 구간 결정부(406)는 계산된 스펙트럴 자기상관치에 기초하여 유성음 구간을 결정한다. 이 경우, 유성음 구간 결정부(406)는 이미 설명한 수학식 5와 같이, 계산된 스펙트럴 자기상관치 중 최대 스펙트럴 자기상관치와 소정의 임계치를 비교하고, 상기 최대 스펙트럴 자기상관치가 상기 임계치보다 큰 구간을 상기 유성음 구간으로 결정할 수 있다.
단계(S507)에서 피치 검출부(407)는 이미 설명한 수학식 6과 같이, 유성음 구간에 해당하는 스펙트럴 자기상관치를 이용하여 피치를 검출한다. 이 경우, 피치 검출부(407)는 유성음 구간에 해당하는 스펙트럴 자기상관치에 포물선 보간 또는 싱크 함수 보간을 수행하여 상기 피치를 검출할 수 있다. 즉, 피치 검출부(407)는 상기 보간된 스펙트럴 자기상관치 중 최대 스펙트럴 자기상관치에 대응하는 로컬 피크의 위치를 상기 피치로 검출할 수 있다.
도 6은 이상에서 설명한 도 5의 피치 검출 방법을 실험적으로 수행하여 나타난 결과 파형을 도시한 도면이다.
도 6에서 (a)는 입력 신호를 나타내는 것으로서, (a)의 ①은 남자 음성의 신 호를, (a)의 ②는 남자 음성과 백색 잡음(white noise)이 섞인 신호를, (a)의 ③은 남자 음성과 비행기 소음이 섞인 신호를 각각 나타내며, (a)의 ④는 여자 음성의 신호를, (a)의 ⑤는 여자 음성과 백색 잡음이 섞인 신호를, (a)의 ⑥은 여자 음성과 비행기 소음이 섞인 신호를 각각 나타낸다.
또한, 도 6에서 (b), (c)는 이렇게 입력된 입력 신호를 도 5와 같이 처리하여 나타난 파형을 도시한 것으로서, (b)는 계산된 스펙트럴 자기상관치와 임계치(Tsa)를 이용하여 유성음 구간을 결정하는 모습을, (c)는 유성음 구간에 해당하는 스펙트럴 자기상관치를 이용하여 피치를 검출하는 모습을 각각 나타낸 것이다.
도 7은 스펙트럴 디퍼런스의 파형과 정규화 로컬 무게중심의 파형을 간략히 비교하기 위한 도면이다.
도 7에는, 잡음에서 남성음의 한 프레임의 스펙트럼(1.5kHz)에 대하여 보간을 수행한 후, 스펙트럴 디퍼런스 및 정규화 로컬 무게중심을 각각 계산한 파형이 도시되어 있다.
도 7에서 상기 파형에 각각 마크(mark)한 것과 같이, 정규화 로컬 무게중심의 파형은 스펙트럴 디퍼런스의 파형보다 고조파(harmonic) 성분을 더 강조함으로써 고조파의 주기적인 구조가 더욱 효과적으로 보존할 수 있다.
본 발명에 따른 피치 검출 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 상기 매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수도 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
본 발명에 따르면, 스펙트럴 디퍼런스 및 그것의 스펙트럴 자기상관치를 시 간 영역의 신호에서와 같이 이용하여 입력 음성 신호에 대한 피치를 검출하는 방법과, 스펙트럼의 정규화 로컬 무게중심 및 그것의 스펙트럴 자기상관치를 시간 영역의 신호에서와 같이 이용하여 입력 음성 신호에 대한 피치를 검출하는 방법, 그리고 상기 방법들을 수행하는 피치 검출 장치가 제공된다.
본 발명에 따르면, 각 주기간 편차가 최소화되고 잡음 환경에서도 큰 영향을 받지 않아, 피치 검출의 정확도를 크게 향상시킬 수 있는 새로운 피치 검출 방법 및 피치 검출 장치가 제공된다.

Claims (21)

  1. 입력 음성 신호에 대한 피치 검출 방법에 있어서,
    입력된 음성 신호를 전처리하여 퓨리에 변환을 수행하는 단계;
    변환된 음성 신호에 대해 보간(interpolation)을 수행하는 단계;
    변환 및 보간된 음성 신호의 스펙트럼 차이에 의해 스펙트럴 디퍼런스(spectral difference)를 계산하는 단계;
    계산된 스펙트럴 디퍼런스를 이용하여 스펙트럴 자기상관치(auto-correlation)를 계산하는 단계;
    계산된 스펙트럴 자기상관치에 기초하여 유성음(voicing) 구간을 결정하는 단계; 및
    유성음 구간에 해당하는 스펙트럴 자기상관치를 이용하여 피치를 검출하는 단계
    를 포함하고,
    계산된 스펙트럴 자기상관치에 기초하여 유성음 구간을 결정하는 상기 단계는,
    계산된 스펙트럴 자기상관치의 주파수 성분에 의해 상기 유성음 구간을 결정하는 것을 특징으로 하는 피치 검출 방법..
  2. 제1항에 있어서,
    변환된 음성 신호에 대해 보간을 수행하는 상기 단계는,
    소정의 저역 주파수 범위에 해당하는 진폭(amplitudes)에 대해 저역통과 보간(low-pass interpolation)을 수행하는 단계; 및
    최초 샘플 레이트의 R배에 해당하도록 시퀀스를 리샘플링(resample)하는 단 계
    를 포함하는 것을 특징으로 하는 피치 검출 방법.
  3. 제1항에 있어서,
    변환 및 보간된 음성 신호의 스펙트럼 차이에 의해 스펙트럴 디퍼런스를 계산하는 상기 단계는,
    양의 값을 갖는(positive) 스펙트럼에 대한 차이에 의해 상기 스펙트럴 디퍼런스를 계산하는 것을 특징으로 하는 피치 검출 방법.
  4. 제1항에 있어서,
    계산된 스펙트럴 디퍼런스를 이용하여 스펙트럴 자기상관치를 계산하는 상기 단계는,
    계산된 스펙트럴 디퍼런스를 이용하고, 정규화 처리(normalization)를 수행하여 상기 스펙트럴 자기상관치를 계산하는 것을 특징으로 하는 피치 검출 방법.
  5. 삭제
  6. 제1항에 있어서,
    계산된 스펙트럴 자기상관치에 기초하여 유성음 구간을 결정하는 상기 단계는,
    계산된 스펙트럴 자기상관치 중 최대 스펙트럴 자기상관치와 소정의 임계치를 비교하는 단계; 및
    상기 최대 스펙트럴 자기상관치가 상기 임계치보다 큰 구간을 상기 유성음 구간으로 결정하는 단계
    를 포함하는 것을 특징으로 하는 피치 검출 방법.
  7. 제1항에 있어서,
    유성음 구간에 해당하는 스펙트럴 자기상관치를 이용하여 피치를 검출하는 상기 단계는,
    유성음 구간에 해당하는 스펙트럴 자기상관치에 포물선 보간(parabolic interpolation) 또는 싱크 함수 보간(sinc function interpolation)을 수행하여 상기 피치를 검출하는 것을 특징으로 하는 피치 검출 방법.
  8. 제7항에 있어서,
    유성음 구간에 해당하는 스펙트럴 자기상관치를 이용하여 피치를 검출하는 상기 단계는,
    상기 보간된 스펙트럴 자기상관치 중 최대 스펙트럴 자기상관치에 대응하는 로컬 피크의 위치를 상기 피치로 검출하는 것을 특징으로 하는 피치 검출 방법.
  9. 입력 음성 신호에 대한 피치 검출 방법에 있어서,
    입력된 음성 신호를 전처리하여 퓨리에 변환을 수행하는 단계;
    변환된 음성 신호에 대해 보간(interpolation)을 수행하는 단계;
    변환 및 보간된 음성 신호의 스펙트럼에 대해 정규화 로컬 무게중심(Normalized Local Center of Gravity: NLCG)을 계산하는 단계;
    계산된 정규화 로컬 무게중심을 이용하여 스펙트럴 자기상관치(auto-correlation)를 계산하는 단계;
    계산된 스펙트럴 자기상관치에 기초하여 유성음(voicing) 구간을 결정하는 단계; 및
    유성음 구간에 해당하는 스펙트럴 자기상관치를 이용하여 피치를 검출하는 단계
    를 포함하는 것을 특징으로 하는 피치 검출 방법.
  10. 제9항에 있어서,
    변환된 음성 신호에 대해 보간을 수행하는 상기 단계는,
    소정의 저역 주파수 범위에 해당하는 진폭(amplitudes)에 대해 저역통과 보간(low-pass interpolation)을 수행하는 단계; 및
    최초 샘플 레이트의 R배에 해당하도록 시퀀스를 리샘플링(resample)하는 단계
    를 포함하는 것을 특징으로 하는 피치 검출 방법.
  11. 제9항에 있어서,
    계산된 스펙트럴 자기상관치에 기초하여 유성음 구간을 결정하는 상기 단계는,
    계산된 스펙트럴 자기상관치 중 최대 스펙트럴 자기상관치와 소정의 임계치를 비교하는 단계; 및
    상기 최대 스펙트럴 자기상관치가 상기 임계치보다 큰 구간을 상기 유성음 구간으로 결정하는 단계
    를 포함하는 것을 특징으로 하는 피치 검출 방법.
  12. 제9항에 있어서,
    유성음 구간에 해당하는 스펙트럴 자기상관치를 이용하여 피치를 검출하는 상기 단계는,
    유성음 구간에 해당하는 스펙트럴 자기상관치에 포물선 보간(parabolic interpolation) 또는 싱크 함수 보간(sinc function interpolation)을 수행하여 상기 피치를 검출하는 것을 특징으로 하는 피치 검출 방법.
  13. 제12항에 있어서,
    유성음 구간에 해당하는 스펙트럴 자기상관치를 이용하여 피치를 검출하는 상기 단계는,
    상기 보간된 스펙트럴 자기상관치 중 최대 스펙트럴 자기상관치에 대응하는 로컬 피크의 위치를 상기 피치로 검출하는 것을 특징으로 하는 피치 검출 방법.
  14. 제1항 내지 제4항, 제6항 내지 제13항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록 매체.
  15. 입력 음성 신호에 대한 피치 검출 장치에 있어서,
    입력된 음성 신호를 전처리하는 전처리부;
    전처리된 음성 신호에 대하여 퓨리에 변환을 수행하는 퓨리에 변환부;
    변환된 음성 신호에 대해 보간(interpolation)을 수행하는 보간부;
    변환 및 보간된 음성 신호의 스펙트럼 차이에 의해 스펙트럴 디퍼런스(spectral difference)를 계산하는 스펙트럴 디퍼런스 계산부;
    계산된 스펙트럴 디퍼런스를 이용하여 스펙트럴 자기상관치(auto-correlation)를 계산하는 스펙트럴 자기상관치 계산부;
    계산된 스펙트럴 자기상관치에 기초하여 유성음(voicing) 구간을 결정하는 유성음 구간 결정부; 및
    유성음 구간에 해당하는 스펙트럴 자기상관치를 이용하여 피치를 검출하는 피치 검출부
    를 포함하고,
    상기 유성음 구간 결정부는,
    계산된 스펙트럴 자기상관치의 주파수 성분에 의해 상기 유성음 구간을 결정하는 것을 특징으로 하는 피치 검출 장치.
  16. 제15항에 있어서,
    상기 보간부는, 소정의 저역 주파수 범위에 해당하는 진폭(amplitudes)에 대해 저역통과 보간(low-pass interpolation)을 수행하고, 최초 샘플 레이트의 R배에 해당하도록 시퀀스를 리샘플링(resample)하는 것을 특징으로 하는 피치 검출 장치.
  17. 제15항에 있어서,
    상기 스펙트럴 자기상관치 계산부는, 계산된 스펙트럴 디퍼런스를 이용하고, 정규화 처리(normalization)를 수행하여 상기 스펙트럴 자기상관치를 계산하는 것을 특징으로 하는 피치 검출 장치.
  18. 제15항에 있어서,
    상기 유성음 구간 결정부는, 계산된 스펙트럴 자기상관치 중 최대 스펙트럴 자기상관치와 소정의 임계치를 비교하고, 상기 최대 스펙트럴 자기상관치가 상기 임계치보다 큰 구간을 상기 유성음 구간으로 결정하는 것을 특징으로 하는 피치 검출 장치.
  19. 제15항에 있어서,
    상기 피치 검출부는, 유성음 구간에 해당하는 스펙트럴 자기상관치에 포물선 보간(parabolic interpolation) 또는 싱크 함수 보간(sinc function interpolation)을 수행하여 상기 피치를 검출하는 것을 특징으로 하는 피치 검출 장치.
  20. 제19항에 있어서,
    상기 피치 검출부는, 상기 보간된 스펙트럴 자기상관치 중 최대 스펙트럴 자기상관치에 대응하는 로컬 피크의 위치를 상기 피치로 검출하는 것을 특징으로 하는 피치 검출 장치.
  21. 입력 음성 신호에 대한 피치 검출 장치에 있어서,
    입력된 음성 신호를 전처리하는 전처리부;
    전처리된 음성 신호에 대하여 퓨리에 변환을 수행하는 퓨리에 변환부;
    변환된 음성 신호에 대해 보간(interpolation)을 수행하는 보간부;
    변환 및 보간된 음성 신호의 스펙트럼에 대해 정규화 로컬 무게중심(Normalized Local Center of Gravity: NLCG)을 계산하는 정규화 로컬 무게중심 계산부;
    계산된 정규화 로컬 무게중심을 이용하여 스펙트럴 자기상관치(auto-correlation)를 계산하는 스펙트럴 자기상관치 계산부;
    계산된 스펙트럴 자기상관치에 기초하여 유성음(voicing) 구간을 결정하는 유성음 구간 결정부; 및
    유성음 구간에 해당하는 스펙트럴 자기상관치를 이용하여 피치를 검출하는 피치 검출부
    를 포함하는 것을 특징으로 하는 피치 검출 장치.
KR1020060008161A 2006-01-26 2006-01-26 스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치 KR100724736B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020060008161A KR100724736B1 (ko) 2006-01-26 2006-01-26 스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치
JP2006234171A JP4444254B2 (ja) 2006-01-26 2006-08-30 スペクトル自己相関値を用いたピッチ検出方法およびピッチ検出装置
US11/604,272 US8315854B2 (en) 2006-01-26 2006-11-27 Method and apparatus for detecting pitch by using spectral auto-correlation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060008161A KR100724736B1 (ko) 2006-01-26 2006-01-26 스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치

Publications (1)

Publication Number Publication Date
KR100724736B1 true KR100724736B1 (ko) 2007-06-04

Family

ID=38286595

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060008161A KR100724736B1 (ko) 2006-01-26 2006-01-26 스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치

Country Status (3)

Country Link
US (1) US8315854B2 (ko)
JP (1) JP4444254B2 (ko)
KR (1) KR100724736B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101336203B1 (ko) * 2007-09-28 2013-12-05 삼성전자주식회사 전자기기에서 음성 검출 방법 및 장치

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7598447B2 (en) * 2004-10-29 2009-10-06 Zenph Studios, Inc. Methods, systems and computer program products for detecting musical notes in an audio signal
US8093484B2 (en) * 2004-10-29 2012-01-10 Zenph Sound Innovations, Inc. Methods, systems and computer program products for regenerating audio performances
CN101542593B (zh) * 2007-03-12 2013-04-17 富士通株式会社 语音波形内插装置及方法
US8666734B2 (en) * 2009-09-23 2014-03-04 University Of Maryland, College Park Systems and methods for multiple pitch tracking using a multidimensional function and strength values
JP2011123529A (ja) * 2009-12-08 2011-06-23 Sony Corp 情報処理装置、情報処理方法、およびプログラム
GB2493470B (en) 2010-04-12 2017-06-07 Smule Inc Continuous score-coded pitch correction and harmony generation techniques for geographically distributed glee club
CN103165133A (zh) * 2011-12-13 2013-06-19 联芯科技有限公司 一种最大相关系数的优化方法及其装置
CN103426441B (zh) * 2012-05-18 2016-03-02 华为技术有限公司 检测基音周期的正确性的方法和装置
JP6904198B2 (ja) * 2017-09-25 2021-07-14 富士通株式会社 音声処理プログラム、音声処理方法および音声処理装置
CN112017639B (zh) * 2020-09-10 2023-11-07 歌尔科技有限公司 语音信号的检测方法、终端设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR960020017A (ko) * 1994-11-16 1996-06-17 이헌조 씨이엘피(celp)부호화기의 피치검색방법
KR19980037190A (ko) * 1996-11-21 1998-08-05 양승택 유성음 구간에서 프레임별 피치 검출 방법
KR19990049148A (ko) * 1997-12-12 1999-07-05 이봉훈 피치 구간별 fo/f1률의 유사성에 의한 음성파형 압축방법
KR100323011B1 (ko) 1994-05-23 2002-06-20 다카노 야스아키 음성신호의피치주기추출장치
KR20020054237A (ko) * 2000-12-27 2002-07-06 오길록 유성음 구간에서의 고속 피치 탐색 방법
KR100421817B1 (ko) 1996-02-01 2004-08-09 소니 가부시끼 가이샤 음성의피치추출방법및장치

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4935963A (en) * 1986-01-24 1990-06-19 Racal Data Communications Inc. Method and apparatus for processing speech signals
US5121428A (en) * 1988-01-20 1992-06-09 Ricoh Company, Ltd. Speaker verification system
US5086475A (en) * 1988-11-19 1992-02-04 Sony Corporation Apparatus for generating, recording or reproducing sound source data
US5764779A (en) * 1993-08-25 1998-06-09 Canon Kabushiki Kaisha Method and apparatus for determining the direction of a sound source
WO1997027578A1 (en) * 1996-01-26 1997-07-31 Motorola Inc. Very low bit rate time domain speech analyzer for voice messaging
JP3266819B2 (ja) * 1996-07-30 2002-03-18 株式会社エイ・ティ・アール人間情報通信研究所 周期信号変換方法、音変換方法および信号分析方法
KR100269216B1 (ko) * 1998-04-16 2000-10-16 윤종용 스펙트로-템포럴 자기상관을 사용한 피치결정시스템 및 방법
US6188979B1 (en) * 1998-05-28 2001-02-13 Motorola, Inc. Method and apparatus for estimating the fundamental frequency of a signal
US7423983B1 (en) * 1999-09-20 2008-09-09 Broadcom Corporation Voice and data exchange over a packet based network
JP2000305599A (ja) * 1999-04-22 2000-11-02 Sony Corp 音声合成装置及び方法、電話装置並びにプログラム提供媒体
US6453284B1 (en) * 1999-07-26 2002-09-17 Texas Tech University Health Sciences Center Multiple voice tracking system and method
US6124544A (en) * 1999-07-30 2000-09-26 Lyrrus Inc. Electronic music system for detecting pitch
US6418407B1 (en) * 1999-09-30 2002-07-09 Motorola, Inc. Method and apparatus for pitch determination of a low bit rate digital voice message
US6772126B1 (en) * 1999-09-30 2004-08-03 Motorola, Inc. Method and apparatus for transferring low bit rate digital voice messages using incremental messages
NL1013500C2 (nl) * 1999-11-05 2001-05-08 Huq Speech Technologies B V Inrichting voor het schatten van de frequentie-inhoud of het spectrum van een geluidssignaal in een ruizige omgeving.
US6587816B1 (en) * 2000-07-14 2003-07-01 International Business Machines Corporation Fast frequency-domain pitch estimation
US7013267B1 (en) * 2001-07-30 2006-03-14 Cisco Technology, Inc. Method and apparatus for reconstructing voice information
US7398204B2 (en) * 2002-08-27 2008-07-08 Her Majesty In Right Of Canada As Represented By The Minister Of Industry Bit rate reduction in audio encoders by exploiting inharmonicity effects and auditory temporal masking
KR100516678B1 (ko) * 2003-07-05 2005-09-22 삼성전자주식회사 음성 코덱의 음성신호의 피치검출 장치 및 방법
GB2405949A (en) * 2003-09-12 2005-03-16 Canon Kk Voice activated device with periodicity determination
SG120121A1 (en) * 2003-09-26 2006-03-28 St Microelectronics Asia Pitch detection of speech signals
FI20045315A (fi) * 2004-08-30 2006-03-01 Nokia Corp Ääniaktiivisuuden havaitseminen äänisignaalissa
KR100653643B1 (ko) * 2006-01-26 2006-12-05 삼성전자주식회사 하모닉과 비하모닉의 비율을 이용한 피치 검출 방법 및피치 검출 장치

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100323011B1 (ko) 1994-05-23 2002-06-20 다카노 야스아키 음성신호의피치주기추출장치
KR960020017A (ko) * 1994-11-16 1996-06-17 이헌조 씨이엘피(celp)부호화기의 피치검색방법
KR100421817B1 (ko) 1996-02-01 2004-08-09 소니 가부시끼 가이샤 음성의피치추출방법및장치
KR19980037190A (ko) * 1996-11-21 1998-08-05 양승택 유성음 구간에서 프레임별 피치 검출 방법
KR19990049148A (ko) * 1997-12-12 1999-07-05 이봉훈 피치 구간별 fo/f1률의 유사성에 의한 음성파형 압축방법
KR20020054237A (ko) * 2000-12-27 2002-07-06 오길록 유성음 구간에서의 고속 피치 탐색 방법

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
10-1996-20017
10-1998-37190
10-1999-49148
10-2002-54237

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101336203B1 (ko) * 2007-09-28 2013-12-05 삼성전자주식회사 전자기기에서 음성 검출 방법 및 장치

Also Published As

Publication number Publication date
JP4444254B2 (ja) 2010-03-31
US20070174048A1 (en) 2007-07-26
US8315854B2 (en) 2012-11-20
JP2007199662A (ja) 2007-08-09

Similar Documents

Publication Publication Date Title
KR100724736B1 (ko) 스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치
KR100653643B1 (ko) 하모닉과 비하모닉의 비율을 이용한 피치 검출 방법 및피치 검출 장치
Boersma Accurate short-term analysis of the fundamental frequency and the harmonics-to-noise ratio of a sampled sound
US10510363B2 (en) Pitch detection algorithm based on PWVT
Gonzalez et al. PEFAC-A pitch estimation algorithm robust to high levels of noise
US8768692B2 (en) Speech recognition method, speech recognition apparatus and computer program
US7567900B2 (en) Harmonic structure based acoustic speech interval detection method and device
EP1587061B1 (en) Pitch detection of speech signals
US8326612B2 (en) Non-speech section detecting method and non-speech section detecting device
EP1309964B1 (en) Fast frequency-domain pitch estimation
US6721699B2 (en) Method and system of Chinese speech pitch extraction
KR100717625B1 (ko) 음성 인식에서의 포먼트 주파수 추정 방법 및 장치
US8086449B2 (en) Vocal fry detecting apparatus
Aneeja et al. Detection of Glottal Closure Instants in Degraded Speech Using Single Frequency Filtering Analysis.
KR100717396B1 (ko) 로컬 스펙트럴 정보를 이용하여 음성 인식을 위한 유성음을판단하는 방법 및 장치
CN106356076A (zh) 基于人工智能的语音活动性检测方法和装置
Bouzid et al. Voice source parameter measurement based on multi-scale analysis of electroglottographic signal
Zhao et al. A processing method for pitch smoothing based on autocorrelation and cepstral F0 detection approaches
Lin et al. A Novel Normalization Method for Autocorrelation Function for Pitch Detection and for Speech Activity Detection.
EP1597720B1 (en) Pitch estimation using low-frequency band noise detection
JP2006215228A (ja) 音声信号分析方法およびこの分析方法を実施する装置、この音声信号分析装置を用いた音声認識装置、この分析方法を実行するプログラムおよびその記憶媒体
KR100194953B1 (ko) 유성음 구간에서 프레임별 피치 검출 방법
Park et al. Pitch detection based on signal-to-noise-ratio estimation and compensation for continuous speech signal
Sorokin et al. Phase Analysis of the Activity of a Voice Source
Shimamura et al. Noise-robust fundamental frequency extraction method based on band-limited amplitude spectrum

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130429

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140429

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150429

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20160428

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20170427

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20180427

Year of fee payment: 12

LAPS Lapse due to unpaid annual fee