KR19980037190A - 유성음 구간에서 프레임별 피치 검출 방법 - Google Patents
유성음 구간에서 프레임별 피치 검출 방법 Download PDFInfo
- Publication number
- KR19980037190A KR19980037190A KR1019960055906A KR19960055906A KR19980037190A KR 19980037190 A KR19980037190 A KR 19980037190A KR 1019960055906 A KR1019960055906 A KR 1019960055906A KR 19960055906 A KR19960055906 A KR 19960055906A KR 19980037190 A KR19980037190 A KR 19980037190A
- Authority
- KR
- South Korea
- Prior art keywords
- pitch
- peaks
- section
- frame
- voiced sound
- Prior art date
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 33
- 230000008859 change Effects 0.000 claims abstract description 58
- 238000009826 distribution Methods 0.000 claims abstract description 31
- 238000004458 analytical method Methods 0.000 claims abstract description 17
- 230000005236 sound signal Effects 0.000 claims abstract description 11
- 239000011295 pitch Substances 0.000 claims description 122
- 238000000034 method Methods 0.000 claims description 29
- 238000009499 grossing Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 238000012805 post-processing Methods 0.000 claims description 5
- 238000012937 correction Methods 0.000 claims description 3
- 230000006978 adaptation Effects 0.000 claims 1
- 238000011084 recovery Methods 0.000 claims 1
- 238000003672 processing method Methods 0.000 abstract description 2
- 238000012545 processing Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 5
- 210000001260 vocal cord Anatomy 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 238000005311 autocorrelation function Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000013256 coordination polymer Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 208000032041 Hearing impaired Diseases 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000000586 desensitisation Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000016507 interphase Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
Description
Claims (9)
- 입력된 한 프레임의 유성음 신호를 저역 통과시켜 영교차점 구간별 파형의 면적에 의한 진폭 변화 피크를 산출하는 제 1 단계와,상기 산출된 진폭 변화 피크에 대한 유사도 분포에서 최대치를 산출하여 피치를 구하고 최대치 이외에서 후부 피치를 구하는 제 2 단계와,상기 제 2 단계 수행 후 음성 신호의 끝인가를 검사하여 끝이 아닐 경우 상기 제 1 단계로 천이하고, 끝일 경우 후처리 단계로 이동하는 제 3 단계와,상기 제 2 단계에서 검출한 전체 피치의 윤곽선에서 프레임별 피치 변화를 구하고 이들 피치 변화와 후보 피치를 이용하여 에러를 확인하고 피치를 보정하는 제 4 단계로 이루어진 것을 특징으로 하는 유성음 구간에서 프레임별 피치 검출 방법.
- 제 1 항에 있어서, 상기 제 1 단계는 한 프레임의 유성음 신호를 입력하는 단계와,상기 입력된 유성음 신호를 저역통과 필터로 약 500㎐ 이하 성분을 추출한 후 영교차점을 산출하는 단계와,상기 산출된 영교차점 구간별 면적을 신호의 국성에 따라 산출하는 단계와,상기 신호의 극성에 따라 산출된 영교차점 구간 + 극성의 면적과 - 면적의 절대치 합을 산출하는 단계와,상기 산출된 절대치의 합으로 진폭 변화 피크를 산출하고 분석 구간을 적응하는 단계로 이루어진것을 특징으로 하는 유성음 구간에서 프레임별 피치 검출 방법.
- 제 1항에 있어서, 상기 제 2 단계는 진폭변화 피크들의 유사도를 산출하여 두 피크의 간격에 따른 유사도 분포를 구하는 단계와,상기 유사도 분포 봉우리의 수가 6보다 작은지를 검사하는 단계와,상기 분포 봉오리 수의 검사 결과 6보다 크면 첫 번째 봉우리에 해당하는 거리보다 간격이 짧고 크기가 작은 피크를 제거한 후 진폭 변화 피크간의 유사도를 산출하는 단계로 천이하는 단계와,상기 분포 봉우리 수의 검사 결과 6보다 작으면 분포 봉우리 중에서 피치와 후보 피치를 구하는 단계로 이루어진 것을 특징으로 하는 유성음 구간에서 프레임별 피치 검출 방법.
- 제 1항에 있어서, 상기 제 4단계는 전체적인 피치의 윤곽선 상에서 프레임간 피치 변화도를 산출하는 단계와,상기 피치 변화도에서 안정 구간을 결정하는 단계와,상기 안정 구간을 중심으로 에러 발생 구간에서 후보 피치를 이용하여 에러를 복구하는 단계와,상기 에러 복구 과정에서 복구되지 않은 에러를 비선형 스므딩 처리하는 것을 특징으로 하는 유성음 구간에서 프레임별 피치 검출 방법.
- 제 2항에 있어서, 상기 분석 구간 적응은 산출된 진폭 변화 피크들의 수와 최대 크기의 진폭 변화 피크를 구하고 이 최대치의 약1/3이상이 되는 진폭 변화 피크들의 수가 최소 3보다 크고 최대 15보다 적도록 분석 구간을 재조정하는 것을 특징으로 하는 유성음 구간에서 프레임별 피치 검출 방법.
- 제 3 항에 있어서, 상기 피치 및 후보 피치는 산출된 유사도 분포 중에서 최대치의 분포 봉우리의 중심 거리를 피치로 하고 이 봉우리를 제외한 짧은 쪽과 긴 쪽에서 다시 최대치를 각각 구하여 후보 피치로 결정하는 것을 특징으로 하는 유성음 구간에서 프레임별 피치 검출 방법.
- 제 4 항에 있어서, 상기 피치 변화도는 음성 전체에 대한 프레임별 피치들 중에서 각 프레임 간의 피치 차이 값으로 산출하는 것을 특징으로 하는 유성음 구간에서 프레임별 피치 검출 방법.
- 제 4 항에 있어서, 상기 안정 구간은 피치 변화도에서 30 내지 50 프레임 중 피치 변화치가 1msec 이내로 연속되는 가장 긴 구간으로 결정되는 것을 특징으로 하는 유성음 구간에서 프레임별 피치 검출 방법.
- 제 4항에 있어서, 상기 후보 피치를 이용한 피치 수정은 인정 구간을 중심으로 피치 변화치가 1msec를 초과할 경우 현재의 피치와 후보 피치를 비교하여 예상되는 최적의 피치로 수정하는 것을 특징으로 하는 유성음 구간에서 프레임별 피치 검출 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019960055906A KR100194953B1 (ko) | 1996-11-21 | 1996-11-21 | 유성음 구간에서 프레임별 피치 검출 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019960055906A KR100194953B1 (ko) | 1996-11-21 | 1996-11-21 | 유성음 구간에서 프레임별 피치 검출 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR19980037190A true KR19980037190A (ko) | 1998-08-05 |
KR100194953B1 KR100194953B1 (ko) | 1999-06-15 |
Family
ID=66321436
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019960055906A KR100194953B1 (ko) | 1996-11-21 | 1996-11-21 | 유성음 구간에서 프레임별 피치 검출 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100194953B1 (ko) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100714535B1 (ko) * | 2000-09-13 | 2007-05-07 | 가부시키가이샤 에이.지.아이 | 감정검출방법, 감성발생방법 및 그 장치 및 소프트웨어를 저장한 컴퓨터로 읽을 수 있는 기록매체 |
KR100724736B1 (ko) * | 2006-01-26 | 2007-06-04 | 삼성전자주식회사 | 스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치 |
KR100827153B1 (ko) * | 2006-04-17 | 2008-05-02 | 삼성전자주식회사 | 음성 신호의 유성음화 비율 검출 장치 및 방법 |
CN111833899A (zh) * | 2020-07-27 | 2020-10-27 | 腾讯科技(深圳)有限公司 | 一种基于多音区的语音检测方法、相关装置及存储介质 |
CN114283846A (zh) * | 2021-08-27 | 2022-04-05 | 腾讯科技(北京)有限公司 | 发音检测方法、装置、设备及存储介质 |
-
1996
- 1996-11-21 KR KR1019960055906A patent/KR100194953B1/ko not_active IP Right Cessation
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100714535B1 (ko) * | 2000-09-13 | 2007-05-07 | 가부시키가이샤 에이.지.아이 | 감정검출방법, 감성발생방법 및 그 장치 및 소프트웨어를 저장한 컴퓨터로 읽을 수 있는 기록매체 |
KR100724736B1 (ko) * | 2006-01-26 | 2007-06-04 | 삼성전자주식회사 | 스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치 |
KR100827153B1 (ko) * | 2006-04-17 | 2008-05-02 | 삼성전자주식회사 | 음성 신호의 유성음화 비율 검출 장치 및 방법 |
US7835905B2 (en) | 2006-04-17 | 2010-11-16 | Samsung Electronics Co., Ltd | Apparatus and method for detecting degree of voicing of speech signal |
CN111833899A (zh) * | 2020-07-27 | 2020-10-27 | 腾讯科技(深圳)有限公司 | 一种基于多音区的语音检测方法、相关装置及存储介质 |
CN111833899B (zh) * | 2020-07-27 | 2022-07-26 | 腾讯科技(深圳)有限公司 | 一种基于多音区的语音检测方法、相关装置及存储介质 |
US12051441B2 (en) | 2020-07-27 | 2024-07-30 | Tencent Technology (Shenzhen) Company Limited | Multi-register-based speech detection method and related apparatus, and storage medium |
CN114283846A (zh) * | 2021-08-27 | 2022-04-05 | 腾讯科技(北京)有限公司 | 发音检测方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
KR100194953B1 (ko) | 1999-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Drugman et al. | Joint robust voicing detection and pitch estimation based on residual harmonics | |
KR100330230B1 (ko) | 잡음 억제 방법 및 장치 | |
Jouvet et al. | Performance analysis of several pitch detection algorithms on simulated and real noisy speech data | |
Ying et al. | A probabilistic approach to AMDF pitch detection | |
Sukhostat et al. | A comparative analysis of pitch detection methods under the influence of different noise conditions | |
KR100724736B1 (ko) | 스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치 | |
EP1145225A1 (en) | Tone features for speech recognition | |
JP3451146B2 (ja) | スペクトルサブトラクションを用いた雑音除去システムおよび方法 | |
Friedman | Pseudo-maximum-likelihood speech pitch extraction | |
Ishizuka et al. | Study of noise robust voice activity detection based on periodic component to aperiodic component ratio. | |
US6470311B1 (en) | Method and apparatus for determining pitch synchronous frames | |
Zhao et al. | A processing method for pitch smoothing based on autocorrelation and cepstral F0 detection approaches | |
KR100194953B1 (ko) | 유성음 구간에서 프레임별 피치 검출 방법 | |
JP4736632B2 (ja) | ボーカル・フライ検出装置及びコンピュータプログラム | |
Liu et al. | Pitch-synchronous linear prediction analysis of high-pitched speech using weighted short-time energy function | |
Park et al. | Pitch detection based on signal-to-noise-ratio estimation and compensation for continuous speech signal | |
Sudhakar et al. | Automatic speech segmentation to improve speech synthesis performance | |
Shome et al. | Non-negative frequency-weighted energy-based speech quality estimation for different modes and quality of speech | |
Zahorian et al. | A spectral-temporal method for pitch tracking. | |
KR0136608B1 (ko) | 음성신호 검색용 음성인식 장치 | |
Saratxaga et al. | Using harmonic phase information to improve ASR rate. | |
Chisaki et al. | A pitch detection method based on continuous wavelet transform for harmonic signal | |
KR100526110B1 (ko) | 화자인식시스템의 화자 특징벡터 생성방법 및 시스템 | |
KR100283604B1 (ko) | 평탄화된 스펙트럼에서 유성-무성구간 분류방법 | |
Shah et al. | A novel filtering-based F 0 estimation algorithm with an application to voice conversion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 19961121 |
|
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 19961121 Comment text: Request for Examination of Application |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 19981127 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 19990210 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 19990211 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20020131 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20030130 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20040202 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20050131 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20060201 Start annual number: 8 End annual number: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20070131 Start annual number: 9 End annual number: 9 |
|
FPAY | Annual fee payment |
Payment date: 20080131 Year of fee payment: 10 |
|
PR1001 | Payment of annual fee |
Payment date: 20080131 Start annual number: 10 End annual number: 10 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20100109 |