KR101666521B1 - 입력 신호의 피치 주기 검출 방법 및 그 장치 - Google Patents

입력 신호의 피치 주기 검출 방법 및 그 장치 Download PDF

Info

Publication number
KR101666521B1
KR101666521B1 KR1020100001900A KR20100001900A KR101666521B1 KR 101666521 B1 KR101666521 B1 KR 101666521B1 KR 1020100001900 A KR1020100001900 A KR 1020100001900A KR 20100001900 A KR20100001900 A KR 20100001900A KR 101666521 B1 KR101666521 B1 KR 101666521B1
Authority
KR
South Korea
Prior art keywords
input signal
frames
pitch period
input
detecting
Prior art date
Application number
KR1020100001900A
Other languages
English (en)
Other versions
KR20110081643A (ko
Inventor
조재연
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Priority to KR1020100001900A priority Critical patent/KR101666521B1/ko
Priority to US12/832,606 priority patent/US8378198B2/en
Publication of KR20110081643A publication Critical patent/KR20110081643A/ko
Application granted granted Critical
Publication of KR101666521B1 publication Critical patent/KR101666521B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/066Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental

Abstract

입력 신호가 수신되면, 시간도메인 상에서 그 입력 신호를 소정 개수의 샘플들 단위로 분할하여 분할 프레임들을 생성하고, 그 분할 프레임들 각각에서 피크 값을 가지는 기준 샘플을 검출하고, 그 분할 프레임들 각각에서의 기준 샘플을 기준으로 소정 개수의 샘플들을 추출하여 추출 프레임들을 생성한 후, 그 추출 프레임들간의 유사도에 기초하여, 입력 신호의 피치 주기를 검출하는 입력 신호의 피치 주기 검출 방법이 개시된다.

Description

입력 신호의 피치 주기 검출 방법 및 그 장치{Method and apparatus for detecting pitch period of input signal}
본 발명은 입력 신호의 피치 주기 검출 방법 및 그 장치에 관한 것이다.
피치 주기 검출 기술이란, 음성이나 음악을 이루는 피치 주기적인 신호들의 기본 주파수를 검출하는 방법을 말한다. 피치 주기 검출 기술들 중에서 가장 널리 알려진 기술은 자기 상관 관계(Auto-correlation)를 이용한 피치 주기 검출 기술로서, 이 기술에서는 샘플을 하나씩 이동해가면서 원신호와 샘플 이동한 신호와의 유사도 연산을 수행하기 때문에 연산량이 많다.
본 발명의 목적은 입력 신호의 피치 주기 검출 방법 및 그 장치를 제공하는 것이다.
상기 목적을 달성하기 위한 본 발명의 일실시예에 따른 입력 신호의 피치 주기 검출 방법은 입력 신호가 수신되면, 시간도메인 상에서 상기 입력 신호를 소정 개수의 샘플들 단위로 분할하여 분할 프레임들을 생성하는 단계; 상기 분할 프레임들 각각에서 피크 값을 가지는 기준 샘플을 검출하는 단계; 상기 분할 프레임들 각각에서의 상기 기준 샘플을 기준으로 소정 개수의 샘플들을 추출하여 추출 프레임들을 생성하는 단계; 및 상기 추출 프레임들간의 유사도에 기초하여, 상기 입력 신호의 피치 주기를 검출하는 단계를 포함한다.
바람직하게는, 상기 분할 프레임들을 생성하는 단계는 상기 입력 신호가 수신되면, 상기 입력 신호의 종류 및 상기 입력 신호의 샘플링 주파수를 검출하는 단계; 상기 검출된 입력 신호의 종류에 기초하여, 상기 입력 신호에 대응되는 주파수 범위를 추정하는 단계; 상기 추정된 주파수 범위 및 상기 입력 신호의 샘플링 주파수에 기초하여, 상기 분할 프레임들을 생성하는 단계를 포함한다.
바람직하게는, 상기 추정된 주파수 범위 및 상기 입력 신호의 샘플링 주파수에 기초하여, 상기 분할 프레임들을 생성하는 단계는 상기 입력 신호의 샘플링 주파수를 상기 추정된 주파수 범위 중 가장 높은 주파수인 최고 추정 주파수로 나눈 값에 해당하는 개수 이하의 샘플들 단위로 상기 입력 신호를 분할하여 상기 분할 프레임들을 생성한다.
바람직하게는, 상기 입력 신호의 피치 주기를 검출하는 단계는 상기 입력 신호의 샘플링 주파수를 상기 추정된 주파수 범위 중 가장 낮은 주파수인 최저 추정 주파수로 나눈 값에 해당하는 개수보다 2배 이상 큰 개수의 샘플들을 저장할 수 있는 크기를 가지는 입력 버퍼를 설정하는 단계; 상기 설정된 입력 버퍼에 상기 입력 버퍼가 최대로 저장할 수 있는 개수만큼의 상기 추출 프레임들을 입력하는 단계;상기 입력 버퍼에 입력된 상기 추출 프레임들인 입력 프레임들간의 유사도에 기초하여, 상기 입력 신호의 피치 주기를 검출하는 단계를 포함한다.
바람직하게는, 상기 입력 프레임들간의 유사도에 기초하여, 상기 입력 신호의 피치 주기를 검출하는 단계는 상기 입력 프레임들을 이용하여 상기 입력 신호의 피치 주기를 검출하지 못한 경우에는 상기 입력 프레임들 중 하나를 상기 입력 버퍼로부터 제거하는 단계; 및 상기 입력 버퍼에 입력되지 않은 상기 추출 프레임들인 비입력 프레임들 중 하나를 상기 입력 버퍼에 입력하는 단계를 더 포함하고, 상기 제거하는 단계 및 상기 비입력 프레임들 중 하나를 상기 입력 버퍼에 입력하는 단계는 상기 입력 프레임들을 이용하여 상기 입력 신호의 피치 주기를 검출할 때까지 반복하여 수행된다.
바람직하게는, 본 발명의 일 실시예에 따른 입력 신호 피치 주기 검출 방법은 상기 입력 신호가 오디오 신호와 잡음 신호를 포함할 때, 상기 분할 프레임들 중에서 상기 잡음 신호에 대응되는 것으로 추정되는 샘플들의 비율이 임계치 이상인 잡음 프레임들을 검출하는 단계를 더 포함하고, 상기 기준 샘플을 검출하는 단계는 상기 잡음 프레임들을 제외한 상기 분할 프레임들에 대해서 수행된다.
바람직하게는, 상기 입력 신호의 피치 주기를 검출하는 단계는 상기 추출 프레임들 중에서 상호간의 상호 상관 관계(cross-correlation)가 임계치 이상인 제1 후보 프레임과 제2 후보 프레임을 검출하는 단계; 상기 제1 후보 프레임의 시작 지점에서부터 상기 제2 후보 프레임의 시작 지점까지의 거리에 해당하는 샘플들의 개수를 나타내는 피치 주기 추정 거리를 검출하는 단계; 및 상기 검출된 피치 주기 추정 거리를 상기 입력 신호의 피치 주기로서 검출하는 단계를 포함한다.
바람직하게는, 상기 입력 신호의 피치 주기를 검출하는 단계는 상기 추출 프레임들 중에서 상호간의 상호 상관 관계가 임계치 이상인 제1 후보 프레임과 제2 후보 프레임을 검출하는 단계; 상기 제1 후보 프레임의 시작 지점에서부터 상기 제2 후보 프레임의 시작 지점까지의 거리에 해당하는 샘플의 개수를 나타내는 피치 주기 추정 거리를 검출하는 단계; 및 상기 추출 프레임들 중에서 상기 제2 후보 프레임의 시작 지점으로부터 상기 피치 주기 추정 거리만큼 떨어진 지점에서 시작하는 제3 후보 프레임을 검출하는 단계; 및 상기 제1 후보 프레임과 상기 제3 후보 프레임간의 상호 상관 관계 또는 상기 제2 후보 프레임과 상기 제3 후보 프레임간의 상호 상관 관계가 임계치 이상인 경우에 상기 피치 주기 추정 거리를 상기 입력 신호의 피치 주기로서 검출하는 단계를 포함한다.
바람직하게는, 상기 기준 샘플을 검출하는 단계는 상기 분할 프레임들 각각에 포함된 샘플들 중에서 앞으로 인접하는 샘플의 에너지 크기 및 뒤로 인접하는 샘플의 에너지 크기를 초과하는 에너지 크기를 가지는 샘플들 중 가장 큰 에너지 크기를 가지는 샘플을 상기 기준 샘플로서 검출한다.
또한, 상기 목적을 달성하기 위한 본 발명의 일실시예에 따른 입력 신호의 피치 주기 검출 장치는 입력 신호를 수신하는 수신부; 시간도메인 상에서 상기 입력 신호를 소정 개수의 샘플들 단위로 분할하여 분할 프레임들을 생성하는 분할 프레임 생성부; 상기 분할 프레임들 각각에서 피크 값을 가지는 기준 샘플을 검출하는 기준 샘플 검출부; 상기 분할 프레임들 각각에서의 상기 기준 샘플을 기준으로 소정 개수의 샘플들을 추출하여 추출 프레임들을 생성하는 추출 프레임 생성부; 및 상기 추출 프레임들간의 유사도에 기초하여, 상기 입력 신호의 피치 주기를 검출하는 피치 주기 검출부를 포함한다. .
또한, 본 발명의 또 다른 실시예는 상기 목적을 달성하기 위하여 입력 신호가 수신되면, 시간도메인 상에서 상기 입력 신호를 소정 개수의 샘플들 단위로 분할하여 분할 프레임들을 생성하는 단계; 상기 분할 프레임들 각각에서 피크 값을 가지는 기준 샘플을 검출하는 단계; 상기 분할 프레임들 각각에서의 상기 기준 샘플을 기준으로 소정 개수의 샘플들을 추출하여 추출 프레임들을 생성하는 단계; 및 상기 추출 프레임들간의 유사도에 기초하여, 상기 입력 신호의 피치 주기를 검출하는 단계를 포함하는 입력 신호의 피치 주기 검출 방법을 실행시키기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체를 제공한다.
도 1은 본 발명의 일실시예에 따른 입력 신호의 피치 주기 검출 방법을 설명하기 위하여 도시한 흐름도이다.
도 2는 본 발명의 일실시예에 따른 기준 샘플을 검출하는 방법을 설명하기 위하여 도시한 도면이다.
도 3은 본 발명의 일실시예에 따라 분할 프레임들을 생성하는 방법에 대하여 설명하기 위하여 도시한 흐름도이다.
도 4는 본 발명의 일실시예에 따라 추출 프레임들간의 유사도에 기초하여 입력 신호의 피치 주기를 검출하는 방법에 대하여 설명하기 위하여 도시한 도면이다.
도 5는 본 발명의 일실시예에 따라 입력 버퍼를 이용하여 입력 신호의 피치 주기를 검출하는 방법에 대하여 설명하기 위하여 도시한 도면이다.
도 6은 본 발명의 일실시예에 따른 입력 신호의 피치 주기 검출 장치를 설명하기 위하여 도시한 흐름도이다.
이하에서는 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 대하여 상세히 설명한다.
도 1은 본 발명의 일실시예에 따른 입력 신호의 피치 주기 검출 방법을 설명하기 위하여 도시한 흐름도이다.
단계 110에서는, 입력 신호가 수신되면, 시간도메인 상에서 그 입력 신호를 소정 개수의 샘플들 단위로 분할하여 분할 프레임들을 생성한다.
본 발명의 일실시예에서는 입력 신호가 디지털 신호라고 가정한다.
예컨대, 디지털 신호인 입력 신호가 5000개의 샘플들로 구성될 때, 그 입력 신호를 50개의 샘플들 단위로 분할하여 100개의 분할 프레임들을 생성할 수 있다. 이에 따라, 분할 프레임들 각각은 50개의 샘플들을 가지게 될 것이다. 이때, 분할 프레임들 각각이 가지게 되는 샘플들의 개수는 소정의 기준에 따라 결정된다.
한편, 입력 신호는 음악에 관한 오디오 신호이거나, 강의나 연설 같은 사람의 음성에 관한 오디오 신호일 수 있다.
단계 110에 대한 보다 구체적인 설명은 도 3을 참조하여 후술한다.
단계 120에서는, 분할 프레임들 각각에서 피크 값을 가지는 기준 샘플을 검출한다.
이때, 기준 샘플은 분할 프레임들 각각에 포함된 샘플들 중에서 앞으로 인접하는 샘플의 에너지 크기 및 뒤로 인접하는 샘플의 에너지 크기를 초과하는 에너지 크기를 가지고 있는 샘플들 중에서 가장 큰 에너지 크기를 가지는 샘플로 결정될 수 있다.
도 2는 본 발명의 일실시예에 따른 기준 샘플을 검출하는 방법을 설명하기 위하여 도시한 도면이다.
도 2를 참조하면, 10개의 샘플들로 구성되는 분할 프레임이 도시되어 있다. 이 중에서, 첫 번째 샘플(210)은 가장 큰 에너지 크기를 가지고 있지만, 그 첫 번째 샘플(210) 뒤로 인접하는 두번째 샘플만이 존재하고, 그 첫 번째 샘플(210) 앞으로 인접하는 샘플은 존재하지 않으므로, 그 첫 번째 샘플(210) 앞으로 인접하는 샘플의 에너지 크기보다 큰 에너지 크기를 가져야 한다는 조건을 만족시키지 못해 피크 값이 될 수 없다.
하지만, 다섯 번째 샘플(220)은 첫 번째 샘플(210)의 에너지 크기보다는 작은 에너지 크기를 가지고 있지만, 첫 번째 샘플(210)을 제외하고는 가장 큰 에너지 크기를 가지고 있고, 다섯 번째 샘플(220)의 에너지 크기가 다섯 번째 샘플(220)의 앞으로 인접하는 네 번째 샘플의 에너지 크기 및 다섯 번째 샘플(220)의 뒤로 인접하는 여섯 번째 샘플의 에너지 크기보다 크기 때문에 피크 값으로 검출된다.
한편, 도 2에 도시된 분할 프레임에서는 기준 샘플이 검출되었지만, 분할 프레임들 중에서는 기준 샘플이 검출되지 않는 분할 프레임도 존재할 수 있다. 예컨대, 어떤 분할 프레임에 포함된 샘플들의 에너지 크기가 꾸준히 작아지고 있는 경우에는 그 분할 프레임에서 기준 샘플이 검출되지 않을 것이다.
다른 실시예에서는, 입력 신호가 오디오 신호와 잡음 신호를 포함할 때, 분할 프레임들 중에서 잡음 신호에 대응되는 것으로 추정되는 샘플들의 비율이 임계치 이상인 잡음 프레임들을 검출한 후, 그와 같은 잡음 프레임들을 제외한 분할 프레임들에 대해서만 기준 샘플을 검출하는 동작을 수행할 수도 있다.
이는, 잡음 프레임들은 입력 신호의 피치 주기 검출에 영향을 주지 않으므로, 그와 같은 잡음 프레임들에서는 기준 샘플을 검출하지 않음으로써, 불필요한 연산을 줄이기 위한 것이다.
단계 130에서는, 분할 프레임들 각각에서의 기준 샘플을 기준으로 소정 개수의 샘플들을 추출하여 추출 프레임들을 생성한다.
이때, 기준 샘플을 기준으로 추출되는 샘플들의 개수는 분할 프레임에 포함되는 샘플들의 개수와 동일할 수도 있고 상이할 수도 있다.
예컨대, 입력 신호를 50개의 샘플들 단위로 분할하여 분할 프레임들을 생성하였다고 가정하면, 추출 프레임들은 그 분할 프레임들 각각에서의 기준 샘플을 기준으로 50개의 샘플들을 추출하여 생성될 수도 있고, 그 분할 프레임들 각각에서의 기준 샘플을 기준으로 30개의 샘플들을 추출하여 생성될 수도 있다. 이때, 전자의 예에서는 추출 프레임이 50개의 샘플들을 포함할 것이고, 후자의 예에서는 추출 프레임이 30개의 샘플들을 포함할 것이다.
단계 140에서는, 추출 프레임들간의 유사도에 기초하여, 입력 신호의 피치 주기를 검출한다.
본 발명의 일 실시예에서는, 추출 프레임들 중에서 상호간의 상호 상관 관계(cross-correlation)가 임계치 이상인 추출 프레임들이 존재하는지 여부에 따라 입력 신호의 피치 주기를 검출하게 된다. 단계 140에 대한 구체적인 설명은 도 4 및 도 5를 참조하여 후술한다.
도 3은 본 발명의 일실시예에 따라 분할 프레임들을 생성하는 방법에 대하여 설명하기 위하여 도시한 흐름도이다.
단계 310에서는, 입력 신호가 수신되면, 그 입력 신호의 종류 및 그 입력 신호의 샘플링 주파수를 검출한다.
이때, 샘플링 주파수는 디지털 신호인 입력 신호를 샘플링할 때 사용된 주파수를 말하는 것이다. 샘플링 주파수가 높을수록 높은 음질을 가지게 된다.
단계 320에서는, 그 검출된 입력 신호의 종류에 기초하여, 입력 신호에 대응되는 주파수 범위를 추정한다.
예컨대, 입력 신호가 사람의 음성에 관한 오디오 신호라면 60Hz 부터 300Hz까지의 주파수 범위를 가질 것이다.
단계 330에서는, 그 추정된 주파수 범위 및 입력 신호의 샘플링 주파수에 기초하여, 분할 프레임들을 생성한다.
보다 구체적으로는, 입력 신호의 샘플링 주파수를 그 추정된 주파수 범위 중 가장 높은 주파수인 최고 추정 주파수로 나눈 값에 해당하는 개수 이하의 샘플들 단위로 입력 신호를 분할하여 분할 프레임들을 생성할 수 있다.
예컨대, 입력 신호가 음성 신호라면 최고 추정 주파수는 300Hz가 될 것이고, 샘플링 주파수가 44.1 kHz라면 44100/300보다 작은 개수인 147개이하의 샘플들 단위로 입력 신호를 분할하여, 분할 프레임들을 생성하게 된다. 이는, 분할 프레임들 각각에 포함되는 샘플들의 개수가 147개 이하가 된다는 것을 의미한다.
이와 같은 방식으로 분할 프레임들에 포함되는 샘플들의 개수를 결정하는 이유는, 하나의 분할 프레임에 많아봐야 한 번의 오디오 신호의 피치 주기에 해당하는 개수의 샘플들만이 포함되도록 하기 위한 것이다. 만일, 분할 프레임들에 포함되는 샘플들의 개수가 상기 기준보다 더 많아지게 되면, 하나의 분할 프레임에 두 번의 오디오 신호의 피치 주기에 해당하는 개수의 샘플들이 포함될 수도 있다.
도 4는 본 발명의 일실시예에 따라 추출 프레임들간의 유사도에 기초하여 입력 신호의 피치 주기를 검출하는 방법에 대하여 설명하기 위하여 도시한 도면이다.
도 4를 참조하면, 다섯 개의 추출 프레임들(410, 420, 430, 440, 450)이 도시되어 있고, 다섯 개의 추출 프레임들(410, 420, 430, 440, 450)의 상단에는 첫 번째 추출 프레임(410)과 두 번째 내지 다섯 번째 추출 프레임(420, 430, 450)간의 상호 상관 관계(cross-correaltion) 값이 도시되어 있고, 다섯 개의 추출 프레임들(410, 420, 430, 440, 450) 하단에는 첫 번째 추출 프레임(410)과 두 번째 내지 다섯 번째 추출 프레임(420, 430, 440, 450)간의 시간 도메인상의 거리가 도시되어 있다. 이때, 첫 번째 추출 프레임(410)과 두 번째 내지 다섯 번째 추출 프레임(420, 430, 450)간의 상호 상관 관계 값이란 첫 번째 추출 프레임(410)에 포함된 샘플들과 두 번째 내지 다섯 번째 추출 프레임(420, 430, 450)에 포함된 샘플들간의 상호 상관 관계 값을 말한다. 또한, 각각의 추출 프레임들(410, 420, 430, 440, 450)은 동일한 개수의 샘플들을 포함하고 있다. 한편, 도 4에는 도시되지 않았지만 첫 번째 추출 프레임(410)과 다섯 번째 이후의 추출 프레임들간의 상호 상관 관계도 계산될 수 있다.
도 4의 실시예에서는 상호 상관 관계 값의 임계치가 0.95로 주어진 것으로 가정하고, 두 개의 추출 프레임들간의 상호 상관 관계 값이 0.95 이상이면 상호간에 유사한 것으로 판단하기로 한다.
도 4에서, 첫 번째 추출 프레임(410)과 두 번째 내지 다섯 번째 추출 프레임(420, 430, 440, 450)간의 상호 상관 관계 값은 각각 0.5, 0.97, 0.7, 0.96이다. 도 4에 도시된 상호 상관 관계 값에 기초하여 볼 때, 첫 번째 추출 프레임(410)과 세 번째 추출 프레임(430)이 유사하다고 판단되고, 첫 번째 추출 프레임(410)과 다섯 번째 추출 프레임(450)도 유사하다고 판단된다.
이와 같은 결과에 기초하여, 입력 신호의 피치 주기를 검출하는 2가지 방법에 대하여 설명한다.
첫 번째 방법은, 두 개의 추출 프레임의 상호 상관 관계 값에 기초하여 입력 신호의 피치 주기를 검출하는 방법이다.
이와 같은 방법에서는, 도 4의 첫번째 추출 프레임(410)과 세 번째 추출 프레임(430)간의 상호 상관 관계 값이 0.97로 임계치 이상이므로, 첫번째 추출 프레임(410)을 제1 후보 프레임으로 검출하고, 세 번째 추출 프레임(430)을 제2 후보 프레임으로 검출한 후, 제1 후보 프레임(410)의 시작 지점에서부터 제2 후보 프레임(430)의 시작 지점까지의 거리인 피치 주기 추정 거리(d2)를 검출한다. 첫번째 방법에서는, 이와 같이 검출된 피치 주기 추정 거리(d2)를 그대로 입력 신호의 피치 주기로 결정하게 된다. 이때, 첫번째 방법에서는 이와 같이 입력 신호의 피치 주기가 결정되면, 첫번째 추출 프레임(410)과 네 번째 추출 프레임(430) 이후의 추출 프레임들간의 상호 상관 관계 값은 계산하지 않는다.
두 번째 방법은, 세 개의 추출 프레임의 상호 상관 관계 값에 기초하여 입력 신호의 피치 주기를 검출하는 방법이다.
두 번째 방법에서도, 첫번째 추출 프레임(410)을 제1 후보 프레임으로 검출하고, 세 번째 추출 프레임(430)을 제2 후보 프레임으로 검출한 후, 제1 후보 프레임(410)의 시작 지점에서부터 제2 후보 프레임(430)의 시작 지점까지의 거리인 피치 주기 추정 거리(d2)를 검출하는 과정까지는 동일하게 수행된다. 다만, 두 번째 방법에서는, 이와 같이 검출된 피치 주기 추정 거리(d2)를 그대로 입력 신호의 피치 주기로 결정하지 않고, 그 피치 주기 추정 거리(d2)가 입력 신호의 피치 주기에 해당하는지 여부를 검증하는 과정을 더 수행하게 된다.
이를 위하여, 두 번째 방법에서는 제2 후보 프레임(430)의 시작 지점으로부터 피치 주기 추정 거리(d2)만큼 떨어진 지점에서 시작하는 다섯 번째 추출 프레임(450)을 제3 후보 프레임으로서 검출한다. 이때, 제1 후보 프레임(410)의 시작 지점으로부터 제3 후보 프레임(450)의 시작지점까지의 거리(d4)는 피치 주기 추정 거리(d2)의 2배가 된다.
이와 같이 제3 후보 프레임(450)이 검출되면, 제1 후보 프레임(410)과 제3 후보 프레임(450)간의 상호 상관 관계 또는 제2 후보 프레임(430)과 제3 후보 프레임(450)간의 상호 상관 관계가 임계치 이상인지를 판단함으로써, 피치 주기 추정 거리(d2)가 입력 신호의 피치 주기에 해당하는지 여부에 대한 검증을 수행한다.
이와 같이 피치 주기 추정 거리(d2)가 입력 신호의 피치 주기에 해당하는지 여부에 대한 검증을 할때 제1 후보 프레임(410)과 제3 후보 프레임(450)간의 상호 상관 관계 또는 제2 후보 프레임(430)과 제3 후보 프레임(450)간의 상호 상관 관계를 이용하는 이유는 피치 주기 추정 거리(d2)가 입력 신호의 피치 주기가 맞다면 피치 주기 추정 거리(d2) 또는 피치 주기 추정 거리(d2)의 배수에 해당하는 거리만큼 떨어진 2개의 추출 프레임들에 포함된 샘플들은 상호간에 매우 유사한 패턴을 가지고 있을 것이기 때문이다.
그와 같은 판단 결과, 제1 후보 프레임(410)과 제3 후보 프레임(450)간의 상호 상관 관계 또는 제2 후보 프레임(430)과 제3 후보 프레임(450)간의 상호 상관 관계가 임계치 이상이면 그 피치 주기 추정 거리(d2)가 입력 신호의 피치 주기인 것으로 판단하고, 그 피치 주기 추정 거리(d2)를 입력 신호의 피치 주기로 결정하게 된다.
하지만 제1 후보 프레임(410)과 제3 후보 프레임(450)간의 상호 상관 관계 값이 임계치 미만이거나 제2 후보 프레임(430)과 제3 후보 프레임(450)간의 상호 상관 관계 값이 임계치 미만이라면 피치 주기 추정 거리(d2)는 입력 신호의 피치 주기가 아닌 것으로 판단된다. 이와 같이 판단되면, 더 이상 첫번째 추출 프레임(410)과 다른 추출 프레임들(420, 430, 440, 450)간의 상호 상관 관계를 계산하지 않고, 두 번째 추출 프레임(420)과 나머지 추출 프레임들(430, 440, 450)간의 상호 상관 관계 값에 기초하여 입력 신호의 피치 주기를 검출하게 될 것이다.
도 4에서는 제1 후보 프레임(410)과 제3 후보 프레임(450)간의 상호 상관 관계 값이 0.96으로 임계치 이상이므로, 피치 주기 추정 거리(d2)가 입력 신호의 피치 주기가 될 것이다.
이와 같이 본 발명의 일실시예는 추출 프레임들간의 상호 상관 관계를 계산하는 것만으로도 입력 신호의 피치 주기를 검출할 수 있기 때문에, 자기 상관 관계를 이용하여 샘플들을 하나씩 이동시키면서 입력 신호의 피치 주기를 계산하는 종래 기술에 비하여, 훨씬 더 적은 연산을 통하여 입력 신호의 피치 주기를 검출할 수 있게 되는 효과가 있다.
한편, 본 발명의 다른 실시예에서는 입력 버퍼를 설정하고, 그 입력 버퍼에 입력되는 추출 프레임들간의 유사도에 기초하여 입력 신호의 피치 주기를 검출하는 방법이 이용될 수도 있다. 이하에서는 도 5를 참조하여 이에 대하여 설명한다.
도 5는 본 발명의 일실시예에 따라 입력 버퍼를 이용하여 입력 신호의 피치 주기를 검출하는 방법에 대하여 설명하기 위하여 도시한 도면이다.
도 5에는 입력 버퍼(510)에 입력된 추출 프레임들(511, 512, 513, 514, 515)인 입력 프레임들(511, 512, 513, 514, 515)과 입력 버퍼(510)에 입력되지 않은 추출 프레임(520)인 비입력 프레임(520)이 도시되어 있다.
도 5의 입력 버퍼(510)에는 입력 버퍼(510)가 최대로 저장할 수 있는 개수인 다섯개 만큼의 입력 프레임들(511, 512, 513, 514, 515)이 입력되어 있고, 입력 신호의 피치 주기는 이와 같이 입력 버퍼(510)에 입력된 다섯 개의 입력 프레임들(511, 512, 513, 514, 515)간의 유사도에 기초하여 검출된다.
다만, 입력 버퍼(510)에 입력된 다섯 개의 입력 프레임들(511, 512, 513, 514, 515)을 이용하여 입력 신호의 피치 주기를 검출하지 못한 경우에는 입력 프레임들(511, 512, 513, 514, 515) 중 하나를 입력 버퍼(510)로부터 제거한 후, 비입력 프레임(520)을 입력 버퍼(510)에 입력할 수 있다.
예컨대, 입력 버퍼(510)의 첫 번째 입력 프레임(511)과 두 번째 내지 다섯 번째 입력 프레임(512, 513, 514, 515)간의 상호 상관 관계 값들 중에 임계치 이상의 값이 없는 경우에는 첫 번째 입력 프레임(511)이 입력 버퍼(510)로부터 제거되고, 비입력 프레임(520)이 입력 버퍼(510)에 입력될 수 있다.
이와 같이 입력 프레임들(511, 512, 513, 514, 515) 중 하나를 입력 버퍼(510)로부터 제거하고, 비입력 프레임(520)을 입력 버퍼(510)에 입력하는 동작은 입력 버퍼(510)에 입력된 입력 프레임들(511, 512, 513, 514, 515)을 이용하여 입력 신호의 피치 주기를 검출할 수 있을때까지 반복하여 수행될 수 있다.
여기서, 입력 버퍼(510)의 크기는 입력 신호의 샘플링 주파수를 입력 신호의 종류에 기초하여 추정되는 주파수 범위 중 가장 낮은 주파수인 최저 추정 주파수로 나눈 값에 해당하는 개수보다 2배 이상 큰 개수의 샘플들을 저장할 수 있는 크기로 결정된다. 예컨대, 입력 신호가 사람의 음성일 경우에 주파수 범위는 60Hz 내지 300Hz이므로 최저 추정 주파수는 60Hz가 되고 샘플링 주파수가 44.1KHz라면, 입력 버퍼는 2 *(44100/60)보다 큰 크기를 가지게 된다. 즉, 입력 버퍼는 1470개 이상의 샘플들로 구성되고, 만일 추출 프레임이 147개의 샘플들을 포함한다고 가정하면 하나의 입력 버퍼는 10개의 추출 프레임들을 저장할 수 있을 것이다.
다른 실시예에서는, 입력 버퍼(510)의 크기가 입력 버퍼(510)에 저장할 수 있는 추출 프레임들의 개수에 기초하여 결정될 수도 있다. 예컨대, 입력 버퍼(510)의 크기는 10개의 추출 프레임들을 저장할 수 있는 크기 또는 5개의 추출 프레임들을 저장할 수 있는 크기로 결정될 수 있다.
도 6은 본 발명의 일실시예에 따른 입력 신호의 피치 주기 검출 장치를 설명하기 위하여 도시한 흐름도이다.
수신부(610)는 입력 신호를 수신한다.
기준 샘플 검출부(620)는 분할 프레임들 각각에서 피크 값을 가지는 기준 샘플을 검출한다.
기준 샘플 검출부(620)는 입력 신호가 오디오 신호와 잡음 신호를 포함할 때, 분할 프레임들 중에서 잡음 신호에 대응되는 것으로 추정되는 샘플들의 비율이 임계치 이상인 잡음 프레임들에 대해서는 기준 샘플을 검출하는 동작을 수행하지 않을 수 있다.
바람직하게는, 본 발명의 일실시예에 따른 입력 신호의 피치 주기 검출 장치는 분할 프레임들 중에서 잡음 프레임들을 검출하는 잡음 프레임 검출부를 더 포함할 수 있다.
추출 프레임 생성부(630)는 분할 프레임들 각각에서의 상기 기준 샘플을 기준으로 소정 개수의 샘플들을 추출하여 추출 프레임들을 생성한다.
피치 주기 검출부(640)는 추출 프레임들간의 유사도에 기초하여, 입력 신호의 피치 주기를 검출한다.
한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다.
상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등)를 포함한다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

Claims (19)

  1. 입력 신호가 수신되면, 상기 입력 신호의 주파수 범위 및 상기 입력 신호의 샘플링 주파수에 기초하여, 시간도메인 상에서 상기 입력 신호를 소정 개수의 샘플들 단위로 분할하여 분할 프레임들을 생성하는 단계;
    상기 분할 프레임들 각각에서 피크 값을 가지는 기준 샘플을 검출하는 단계;
    상기 분할 프레임들 각각에서의 상기 기준 샘플을 기준으로 소정 개수의 샘플들을 추출하여 추출 프레임들을 생성하는 단계; 및
    상기 추출 프레임들간의 유사도에 기초하여, 상기 입력 신호의 피치 주기를 검출하는 단계를 포함하는 것을 특징으로 하는 입력 신호의 피치 주기 검출 방법.
  2. 제1항에 있어서,
    상기 분할 프레임들을 생성하는 단계는
    상기 입력 신호가 수신되면, 상기 입력 신호의 종류 및 상기 입력 신호의 샘플링 주파수를 검출하는 단계; 및
    상기 검출된 입력 신호의 종류에 기초하여, 상기 입력 신호에 대응되는 주파수 범위를 추정하는 단계를 포함하는 것을 특징으로 하는 입력 신호의 피치 주기 검출 방법.
  3. 제2항에 있어서,
    상기 추정된 주파수 범위 및 상기 입력 신호의 샘플링 주파수에 기초하여, 상기 분할 프레임들을 생성하는 단계는
    상기 입력 신호의 샘플링 주파수를 상기 추정된 주파수 범위 중 가장 높은 주파수인 최고 추정 주파수로 나눈 값에 해당하는 개수 이하의 샘플들 단위로 상기 입력 신호를 분할하여 상기 분할 프레임들을 생성하는 것을 특징으로 하는 입력 신호의 피치 주기 검출 방법.
  4. 제3항에 있어서,
    상기 입력 신호의 피치 주기를 검출하는 단계는
    상기 입력 신호의 샘플링 주파수를 상기 추정된 주파수 범위 중 가장 낮은 주파수인 최저 추정 주파수로 나눈 값에 해당하는 개수보다 2배 이상 큰 개수의 샘플들을 저장할 수 있는 크기를 가지는 입력 버퍼를 설정하는 단계;
    상기 설정된 입력 버퍼에 상기 입력 버퍼가 최대로 저장할 수 있는 개수만큼의 상기 추출 프레임들을 입력하는 단계;
    상기 입력 버퍼에 입력된 상기 추출 프레임들인 입력 프레임들간의 유사도에 기초하여, 상기 입력 신호의 피치 주기를 검출하는 단계를 포함하는 것을 특징으로 하는 입력 신호의 피치 주기 검출 방법.
  5. 제4항에 있어서,
    상기 입력 프레임들간의 유사도에 기초하여, 상기 입력 신호의 피치 주기를 검출하는 단계는
    상기 입력 프레임들을 이용하여 상기 입력 신호의 피치 주기를 검출하지 못한 경우에는 상기 입력 프레임들 중 하나를 상기 입력 버퍼로부터 제거하는 단계; 및
    상기 입력 버퍼에 입력되지 않은 상기 추출 프레임들인 비입력 프레임들 중 하나를 상기 입력 버퍼에 입력하는 단계를 더 포함하고,
    상기 제거하는 단계 및 상기 비입력 프레임들 중 하나를 상기 입력 버퍼에 입력하는 단계는 상기 입력 프레임들을 이용하여 상기 입력 신호의 피치 주기를 검출할 때까지 반복하여 수행되는 것을 특징으로 하는 입력 신호의 피치 주기 검출 방법.
  6. 제1항에 있어서,
    상기 입력 신호가 오디오 신호와 잡음 신호를 포함할 때, 상기 분할 프레임들 중에서 상기 잡음 신호에 대응되는 것으로 추정되는 샘플들의 비율이 임계치 이상인 잡음 프레임들을 검출하는 단계를 더 포함하고,
    상기 기준 샘플을 검출하는 단계는 상기 잡음 프레임들을 제외한 상기 분할 프레임들에 대해서 수행되는 것을 특징으로 하는 입력 신호의 피치 주기 검출 방법.
  7. 제1항에 있어서,
    상기 입력 신호의 피치 주기를 검출하는 단계는
    상기 추출 프레임들 중에서 상호간의 상호 상관 관계(cross-correlation)가 임계치 이상인 제1 후보 프레임과 제2 후보 프레임을 검출하는 단계;
    상기 제1 후보 프레임의 시작 지점에서부터 상기 제2 후보 프레임의 시작 지점까지의 거리에 해당하는 샘플들의 개수를 나타내는 피치 주기 추정 거리를 검출하는 단계; 및
    상기 검출된 피치 주기 추정 거리를 상기 입력 신호의 피치 주기로서 검출하는 단계를 포함하는 것을 특징으로 하는 입력 신호의 피치 주기 검출 방법.
  8. 제1항에 있어서,
    상기 입력 신호의 피치 주기를 검출하는 단계는
    상기 추출 프레임들 중에서 상호간의 상호 상관 관계가 임계치 이상인 제1 후보 프레임과 제2 후보 프레임을 검출하는 단계;
    상기 제1 후보 프레임의 시작 지점에서부터 상기 제2 후보 프레임의 시작 지점까지의 거리에 해당하는 샘플의 개수를 나타내는 피치 주기 추정 거리를 검출하는 단계; 및
    상기 추출 프레임들 중에서 상기 제2 후보 프레임의 시작 지점으로부터 상기 피치 주기 추정 거리만큼 떨어진 지점에서 시작하는 제3 후보 프레임을 검출하는 단계; 및
    상기 제1 후보 프레임과 상기 제3 후보 프레임간의 상호 상관 관계 또는 상기 제2 후보 프레임과 상기 제3 후보 프레임간의 상호 상관 관계가 임계치 이상인 경우에 상기 피치 주기 추정 거리를 상기 입력 신호의 피치 주기로서 검출하는 단계를 포함하는 것을 특징으로 하는 입력 신호의 피치 주기 검출 방법.
  9. 제1항에 있어서,
    상기 기준 샘플을 검출하는 단계는
    상기 분할 프레임들 각각에 포함된 샘플들 중에서 앞으로 인접하는 샘플의 에너지 크기 및 뒤로 인접하는 샘플의 에너지 크기를 초과하는 에너지 크기를 가지는 샘플들 중 가장 큰 에너지 크기를 가지는 샘플을 상기 기준 샘플로서 검출하는 것을 특징으로 하는 입력 신호의 피치 주기 검출 방법.
  10. 입력 신호를 수신하는 수신부;
    상기 입력 신호의 주파수 범위 및 상기 입력 신호의 샘플링 주파수에 기초하여, 시간도메인 상에서 상기 입력 신호를 소정 개수의 샘플들 단위로 분할하여 분할 프레임들을 생성하는 분할 프레임 생성부;
    상기 분할 프레임들 각각에서 피크 값을 가지는 기준 샘플을 검출하는 기준 샘플 검출부;
    상기 분할 프레임들 각각에서의 상기 기준 샘플을 기준으로 소정 개수의 샘플들을 추출하여 추출 프레임들을 생성하는 추출 프레임 생성부; 및
    상기 추출 프레임들간의 유사도에 기초하여, 상기 입력 신호의 피치 주기를 검출하는 피치 주기 검출부를 포함하는 것을 특징으로 하는 입력 신호의 피치 주기 검출 장치.
  11. 제10항에 있어서,
    상기 분할 프레임 생성부는
    상기 입력 신호의 종류 및 상기 입력 신호의 샘플링 주파수를 검출하고, 상기 검출된 입력 신호의 종류에 기초하여 상기 입력 신호에 대응되는 주파수 범위를 추정하는 것을 특징으로 하는 입력 신호의 피치 주기 검출 장치.
  12. 제11항에 있어서,
    상기 분할 프레임 생성부는
    상기 입력 신호의 샘플링 주파수를 상기 추정된 주파수 범위 중 가장 높은 주파수인 최고 추정 주파수로 나눈 값에 해당하는 개수 이하의 샘플들 단위로 상기 입력 신호를 분할하여 상기 분할 프레임들을 생성하는 것을 특징으로 하는 입력 신호의 피치 주기 검출 장치.
  13. 제12항에 있어서,
    상기 피치 주기 검출부는
    상기 입력 신호의 샘플링 주파수를 상기 추정된 주파수 범위 중 가장 낮은 주파수인 최저 추정 주파수로 나눈 값에 해당하는 개수보다 2배 이상 큰 개수의 샘플들을 저장할 수 있는 크기를 가지는 입력 버퍼를 설정하고, 상기 설정된 입력 버퍼에 상기 입력 버퍼가 최대로 저장할 수 있는 개수만큼의 상기 추출 프레임들을 입력하고, 상기 입력 버퍼에 입력된 상기 추출 프레임들인 입력 프레임들간의 유사도에 기초하여, 상기 입력 신호의 피치 주기를 검출하는 것을 특징으로 하는 입력 신호의 피치 주기 검출 장치.
  14. 제13항에 있어서,
    상기 피치 주기 검출부는
    상기 입력 프레임들을 이용하여 상기 입력 신호의 피치 주기를 검출하지 못한 경우에는 상기 입력 프레임들 중 하나를 상기 입력 버퍼로부터 제거하는 동작과 상기 입력 버퍼에 입력되지 않은 상기 추출 프레임들인 비입력 프레임들 중 하나를 상기 입력 버퍼에 입력하는 동작을 수행하고,
    상기 제거하는 동작 및 상기 비입력 프레임들 중 하나를 상기 입력 버퍼에 입력하는 동작은 상기 입력 프레임들을 이용하여 상기 입력 신호의 피치 주기를 검출할 때까지 반복하여 수행되는 것을 특징으로 하는 입력 신호의 피치 주기 검출 장치.
  15. 제10항에 있어서,
    상기 입력 신호가 오디오 신호와 잡음 신호를 포함할 때, 상기 분할 프레임들 중에서 상기 잡음 신호에 대응되는 것으로 추정되는 샘플들의 비율이 임계치 이상인 잡음 프레임들을 검출하는 잡음 프레임 검출부를 더 포함하고,
    상기 기준 샘플 검출부는 상기 잡음 프레임들을 제외한 상기 분할 프레임들에 대해서 상기 기준 샘플을 검출하는 것을 특징으로 하는 입력 신호의 피치 주기 검출 장치.
  16. 제10항에 있어서,
    상기 피치 주기 검출부는
    상기 추출 프레임들 중에서 상호간의 상호 상관 관계가 임계치 이상인 제1 후보 프레임과 제2 후보 프레임을 검출하고, 상기 제1 후보 프레임의 시작 지점에서부터 상기 제2 후보 프레임의 시작 지점까지의 거리에 해당하는 샘플들의 개수를 나타내는 피치 주기 추정 거리를 검출한 후, 상기 검출된 피치 주기 추정 거리를 상기 입력 신호의 피치 주기로서 검출하는 것을 특징으로 하는 입력 신호의 피치 주기 검출 장치.
  17. 제10항에 있어서,
    상기 피치 주기 검출부는
    상기 추출 프레임들 중에서 상호간의 상호 상관 관계가 임계치 이상인 제1 후보 프레임과 제2 후보 프레임을 검출하고, 상기 제1 후보 프레임의 시작 지점에서부터 상기 제2 후보 프레임의 시작 지점까지의 거리에 해당하는 샘플의 개수를 나타내는 피치 주기 추정 거리를 검출하고, 상기 추출 프레임들 중에서 상기 제2 후보 프레임의 시작 지점으로부터 상기 피치 주기 추정 거리만큼 떨어진 지점에서 시작하는 제3 후보 프레임을 검출한 후, 상기 제1 후보 프레임과 상기 제3 후보 프레임간의 상호 상관 관계 또는 상기 제2 후보 프레임과 상기 제3 후보 프레임간의 상호 상관 관계가 임계치 이상인 경우에 상기 피치 주기 추정 거리를 상기 입력 신호의 피치 주기로서 검출하는 것을 특징으로 하는 입력 신호의 피치 주기 검출 장치.
  18. 제10항에 있어서,
    상기 기준 샘플 검출부는
    상기 분할 프레임들 각각에 포함된 샘플들 중에서 앞으로 인접하는 샘플의 에너지 크기 및 뒤로 인접하는 샘플의 에너지 크기를 초과하는 에너지 크기를 가지는 샘플들 중 가장 큰 에너지 크기를 가지는 샘플을 상기 기준 샘플로서 검출하는 것을 특징으로 하는 입력 신호의 피치 주기 검출 장치.
  19. 제1항 내지 제9항 중 어느 한 항의 방법을 실행시키기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체.
KR1020100001900A 2010-01-08 2010-01-08 입력 신호의 피치 주기 검출 방법 및 그 장치 KR101666521B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020100001900A KR101666521B1 (ko) 2010-01-08 2010-01-08 입력 신호의 피치 주기 검출 방법 및 그 장치
US12/832,606 US8378198B2 (en) 2010-01-08 2010-07-08 Method and apparatus for detecting pitch period of input signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100001900A KR101666521B1 (ko) 2010-01-08 2010-01-08 입력 신호의 피치 주기 검출 방법 및 그 장치

Publications (2)

Publication Number Publication Date
KR20110081643A KR20110081643A (ko) 2011-07-14
KR101666521B1 true KR101666521B1 (ko) 2016-10-14

Family

ID=44257479

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100001900A KR101666521B1 (ko) 2010-01-08 2010-01-08 입력 신호의 피치 주기 검출 방법 및 그 장치

Country Status (2)

Country Link
US (1) US8378198B2 (ko)
KR (1) KR101666521B1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102423302B1 (ko) 2015-10-06 2022-07-19 삼성전자주식회사 음성 인식에서의 음향 점수 계산 장치 및 방법과, 음향 모델 학습 장치 및 방법
US9756281B2 (en) 2016-02-05 2017-09-05 Gopro, Inc. Apparatus and method for audio based video synchronization
US9697849B1 (en) 2016-07-25 2017-07-04 Gopro, Inc. Systems and methods for audio based synchronization using energy vectors
US9640159B1 (en) 2016-08-25 2017-05-02 Gopro, Inc. Systems and methods for audio based synchronization using sound harmonics
US9653095B1 (en) * 2016-08-30 2017-05-16 Gopro, Inc. Systems and methods for determining a repeatogram in a music composition using audio features
EP3306609A1 (en) * 2016-10-04 2018-04-11 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for determining a pitch information
US9916822B1 (en) 2016-10-07 2018-03-13 Gopro, Inc. Systems and methods for audio remixing using repeated segments
CN106887241A (zh) * 2016-10-12 2017-06-23 阿里巴巴集团控股有限公司 一种语音信号检测方法与装置
CN112274174A (zh) * 2020-10-25 2021-01-29 贵州大学 智能电子听诊控制系统、方法、存储介质、电子听诊器

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000200090A (ja) * 1998-12-29 2000-07-18 Nec Corp ピッチ情報抽出装置及びピッチ情報抽出方法ならびにピッチ情報抽出プログラムを格納した記憶媒体
JP2009003387A (ja) * 2007-06-25 2009-01-08 Nippon Telegr & Teleph Corp <Ntt> ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05265490A (ja) * 1992-03-19 1993-10-15 Kawai Musical Instr Mfg Co Ltd ピッチ周期抽出装置
JP3475446B2 (ja) * 1993-07-27 2003-12-08 ソニー株式会社 符号化方法
WO1997027578A1 (en) * 1996-01-26 1997-07-31 Motorola Inc. Very low bit rate time domain speech analyzer for voice messaging
JPH11305794A (ja) 1998-04-24 1999-11-05 Victor Co Of Japan Ltd ピッチ検出装置及び情報媒体
WO2004084467A2 (en) * 2003-03-15 2004-09-30 Mindspeed Technologies, Inc. Recovering an erased voice frame with time warping
US7752038B2 (en) * 2006-10-13 2010-07-06 Nokia Corporation Pitch lag estimation
WO2008139270A1 (en) * 2007-05-14 2008-11-20 Freescale Semiconductor, Inc. Generating a frame of audio data
MX2011000364A (es) * 2008-07-11 2011-02-25 Ten Forschung Ev Fraunhofer Metodo y discriminador para clasificar distintos segmentos de una señal.

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000200090A (ja) * 1998-12-29 2000-07-18 Nec Corp ピッチ情報抽出装置及びピッチ情報抽出方法ならびにピッチ情報抽出プログラムを格納した記憶媒体
JP2009003387A (ja) * 2007-06-25 2009-01-08 Nippon Telegr & Teleph Corp <Ntt> ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体

Also Published As

Publication number Publication date
US20110167989A1 (en) 2011-07-14
US8378198B2 (en) 2013-02-19
KR20110081643A (ko) 2011-07-14

Similar Documents

Publication Publication Date Title
KR101666521B1 (ko) 입력 신호의 피치 주기 검출 방법 및 그 장치
US9431029B2 (en) Method for detecting voice section from time-space by using audio and video information and apparatus thereof
JP2009151299A (ja) 音声スペクトルピーク検出方法及び装置、音声認識方法およびシステム
US9646625B2 (en) Audio correction apparatus, and audio correction method thereof
US20070220265A1 (en) Searching for a scaling factor for watermark detection
CN106356077B (zh) 一种笑声检测方法及装置
JP5605574B2 (ja) 多チャンネル音響信号処理方法、そのシステム及びプログラム
CN105280196A (zh) 副歌检测方法及系统
CN104937955A (zh) 自动的扬声器极性检测
US10522160B2 (en) Methods and apparatus to identify a source of speech captured at a wearable electronic device
US9747907B2 (en) Digital watermark detecting device, method, and program
JP5395399B2 (ja) 携帯端末、拍位置推定方法および拍位置推定プログラム
JP6306718B2 (ja) 欠落データにわたる正弦波内挿
US11205407B2 (en) Song analysis device and song analysis program
KR101791907B1 (ko) 위치 기반의 음향 처리 장치 및 방법
CN112687274A (zh) 一种语音信息的处理方法、装置、设备及介质
JP2004325127A (ja) 音源検出方法、音源分離方法、およびこれらを実施する装置
CN103531220A (zh) 歌词校正方法及装置
KR102044520B1 (ko) 음성 존재 구간 판별 장치 및 방법
KR101327664B1 (ko) 음성 영역 검출 방법 및 그 장치
JP2019028301A (ja) 音響信号処理装置、方法及びプログラム
JP2019029861A (ja) 音響信号処理装置、方法及びプログラム
KR102002535B1 (ko) 음향 분석 장치 및 방법
KR101600355B1 (ko) 오디오 동기화 방법 및 그 장치
Li Experimental Research on Hiding Capacity of Echo Hiding in Voice

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant