KR20080077717A - 균등최강력 테스트에 기초한 음성 검출 방법 및 음성 검출시스템 - Google Patents
균등최강력 테스트에 기초한 음성 검출 방법 및 음성 검출시스템 Download PDFInfo
- Publication number
- KR20080077717A KR20080077717A KR1020070017236A KR20070017236A KR20080077717A KR 20080077717 A KR20080077717 A KR 20080077717A KR 1020070017236 A KR1020070017236 A KR 1020070017236A KR 20070017236 A KR20070017236 A KR 20070017236A KR 20080077717 A KR20080077717 A KR 20080077717A
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- signal
- noise
- equation
- speech
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 16
- 238000012360 testing method Methods 0.000 title claims description 27
- 238000001514 detection method Methods 0.000 claims abstract description 86
- 239000006185 dispersion Substances 0.000 claims abstract description 5
- 238000009826 distribution Methods 0.000 claims description 49
- 238000004364 calculation method Methods 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 5
- 230000000454 anti-cipatory effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 9
- 238000003657 Likelihood-ratio test Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 5
- 238000013179 statistical model Methods 0.000 description 4
- 206010002953 Aphonia Diseases 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
Abstract
Description
Claims (2)
- 순수 음성과 잡음의 DFT 계수가 가우시안 분포를 따른다고 가정하며,가 k번째 bin의 DFT 계수를 나타내는 경우에 있어서,균등최강력(Uniformly Most Powerful; UMP) 테스트에 기초한 음성 검출(VAD; Voice Activity Detection) 방법으로서,입력된 음성 신호에 대하여 고속 푸리에 변환(FFT)을 수행하여 주파수 영역의 음성 신호로 변환시키는 단계;상기 추정 단계에서 추정된 잡음 신호의 상기 분산()에 기초하여, 고정된 거짓 경고(false alarm) 확률 값()을 이용하여 다음 수학식 1에 의해 임계값()을 계산하는 단계;<수학식 1>상기 임계값 계산 단계에서 계산된 상기 임계값() 및 상기 잡음 음성 신 호의 크기에 대하여 프레임 단위로 구해진 기하평균(geometric mean)을 이용하여 다음 수학식 2에 의해 음성 검출 결정 값(D)을 계산하는 단계; 및<수학식 2>상기 결정 값 계산 단계에서 계산된 상기 결정 값(D)이 0보다 크면 음성이 존재하는 것으로, 아니면 음성이 존재하지 않는 것으로 판단하는 단계를 포함하는 방법.
- 순수 음성과 잡음의 DFT 계수가 가우시안 분포를 따른다고 가정하며,균등최강력(Uniformly Most Powerful; UMP) 테스트에 기초한 음성 검출 시스템(Voice Activity Detecting System)으로서,입력된 음성 신호에 대하여 고속 푸리에 변환(FFT)을 수행하여 주파수 영역의 음성 신호로 변환시키는 고속 푸리에 변환기;상기 잡음 신호 분산 추정부에 의해 추정된 상기 잡음 신호의 분산()에 기초하여, 고정된 거짓 경고(false alarm) 확률 값()을 이용하여 다음 수학식 1에 의해 임계값()을 계산하는 임계값 계산부;<수학식 1>상기 임계값 계산부에 의해 계산된 상기 임계값() 및 상기 잡음 음성 신호의 크기에 대하여 프레임 단위로 구해진 기하평균(geometric mean)을 이용하여 다음 수학식 2에 의해 음성 검출 결정 값(D)을 계산하는 음성 검출 결정 값 계산부; 및<수학식 2>상기 음성 검출 결정 값 계산부에서 계산된 상기 결정 값(D)이 0보다 크면 음성이 존재하는 것으로, 아니면 음성이 존재하지 않는 것으로 판단하는 음성 검출 판단부를 포함하는 음성 검출 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070017236A KR100866580B1 (ko) | 2007-02-21 | 2007-02-21 | 균등최강력 테스트에 기초한 음성 검출 방법 및 음성 검출시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070017236A KR100866580B1 (ko) | 2007-02-21 | 2007-02-21 | 균등최강력 테스트에 기초한 음성 검출 방법 및 음성 검출시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080077717A true KR20080077717A (ko) | 2008-08-26 |
KR100866580B1 KR100866580B1 (ko) | 2008-11-03 |
Family
ID=39880150
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070017236A KR100866580B1 (ko) | 2007-02-21 | 2007-02-21 | 균등최강력 테스트에 기초한 음성 검출 방법 및 음성 검출시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100866580B1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2858068A4 (en) * | 2012-05-31 | 2016-02-24 | Toyota Motor Co Ltd | SOUND SOUND DETECTION DEVICE, NOISE GENERATION EQUIPMENT, NOISE REDUCTION APPARATUS, APPARATUS FOR ESTIMATING SOUND SOURCE DEVICE, DEVICE FOR RECOGNIZING A DEACTIVATIVE VEHICLE, AND NOISE REDUCTION METHOD |
RU2723301C1 (ru) * | 2019-11-20 | 2020-06-09 | Акционерное общество "Концерн "Созвездие" | Способ разделения речи и пауз по значениям дисперсий амплитуд спектральных составляющих |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100513175B1 (ko) * | 2002-12-24 | 2005-09-07 | 한국전자통신연구원 | 복소수 라플라시안 통계모델을 이용한 음성 검출기 및 음성 검출 방법 |
KR100718749B1 (ko) * | 2006-11-29 | 2007-05-15 | 인하대학교 산학협력단 | 복소수 감마 통계 모델에 기초한 음성 검출 방법 및 음성검출기 |
-
2007
- 2007-02-21 KR KR1020070017236A patent/KR100866580B1/ko active IP Right Grant
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2858068A4 (en) * | 2012-05-31 | 2016-02-24 | Toyota Motor Co Ltd | SOUND SOUND DETECTION DEVICE, NOISE GENERATION EQUIPMENT, NOISE REDUCTION APPARATUS, APPARATUS FOR ESTIMATING SOUND SOURCE DEVICE, DEVICE FOR RECOGNIZING A DEACTIVATIVE VEHICLE, AND NOISE REDUCTION METHOD |
RU2723301C1 (ru) * | 2019-11-20 | 2020-06-09 | Акционерное общество "Концерн "Созвездие" | Способ разделения речи и пауз по значениям дисперсий амплитуд спектральных составляющих |
Also Published As
Publication number | Publication date |
---|---|
KR100866580B1 (ko) | 2008-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Davis et al. | Statistical voice activity detection using low-variance spectrum estimation and an adaptive threshold | |
EP1547061B1 (en) | Multichannel voice detection in adverse environments | |
KR100944252B1 (ko) | 오디오 신호 내에서 음성활동 탐지 | |
US8600073B2 (en) | Wind noise suppression | |
CN104464722B (zh) | 基于时域和频域的语音活性检测方法和设备 | |
CN102971789B (zh) | 用于执行话音活动检测的方法和设备 | |
WO2018049282A1 (en) | Robust noise estimation for speech enhancement in variable noise conditions | |
US10783899B2 (en) | Babble noise suppression | |
Mousazadeh et al. | AR-GARCH in presence of noise: Parameter estimation and its application to voice activity detection | |
WO2000065573A1 (en) | Voice detection in audio signals | |
Sakhnov et al. | Approach for Energy-Based Voice Detector with Adaptive Scaling Factor. | |
EP1751740B1 (en) | System and method for babble noise detection | |
CN109102823B (zh) | 一种基于子带谱熵的语音增强方法 | |
KR100866580B1 (ko) | 균등최강력 테스트에 기초한 음성 검출 방법 및 음성 검출시스템 | |
Lee et al. | Statistical model-based VAD algorithm with wavelet transform | |
Jiang et al. | A new voice activity detection method using maximized Sub-band SNR | |
KR100931487B1 (ko) | 노이지 음성 신호의 처리 장치 및 그 장치를 포함하는 음성기반 어플리케이션 장치 | |
Ngo et al. | A flexible speech distortion weighted multi-channel Wiener filter for noise reduction in hearing aids | |
KR100530261B1 (ko) | 통계적 모델에 기초한 유성음/무성음 판별 장치 및 그 방법 | |
KR20000056371A (ko) | 가능성비 검사에 근거한 음성 유무 검출 장치 | |
Asgari et al. | Voice activity detection using entropy in spectrum domain | |
Dahlan et al. | Unbiased noise estimator for Q-spectral subtraction based speech enhancement | |
KR100284772B1 (ko) | 음성 검출 장치 및 그 방법 | |
Hao et al. | A 600BPS MELP vocoder with voice activity detection | |
Dokku et al. | Detection of stop consonants in continuous noisy speech based on an extrapolation technique |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20121008 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20130913 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20141022 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20161028 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20171128 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20190429 Year of fee payment: 11 |