KR20040056977A - 복소수 라플라시안 통계모델을 이용한 음성 검출기 및음성 검출 방법 - Google Patents
복소수 라플라시안 통계모델을 이용한 음성 검출기 및음성 검출 방법 Download PDFInfo
- Publication number
- KR20040056977A KR20040056977A KR1020020083728A KR20020083728A KR20040056977A KR 20040056977 A KR20040056977 A KR 20040056977A KR 1020020083728 A KR1020020083728 A KR 1020020083728A KR 20020083728 A KR20020083728 A KR 20020083728A KR 20040056977 A KR20040056977 A KR 20040056977A
- Authority
- KR
- South Korea
- Prior art keywords
- noise
- voice
- signal
- laplacian
- speech
- Prior art date
Links
- 230000000694 effects Effects 0.000 title claims abstract description 9
- 238000013179 statistical model Methods 0.000 claims abstract description 17
- 238000001514 detection method Methods 0.000 claims abstract description 13
- 238000000034 method Methods 0.000 claims abstract description 5
- 238000012360 testing method Methods 0.000 claims description 8
- 238000003657 Likelihood-ratio test Methods 0.000 abstract description 10
- 238000006243 chemical reaction Methods 0.000 abstract 1
- 238000009826 distribution Methods 0.000 description 16
- 238000001276 Kolmogorov–Smirnov test Methods 0.000 description 6
- 230000001186 cumulative effect Effects 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000005315 distribution function Methods 0.000 description 2
- 206010002953 Aphonia Diseases 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Probability & Statistics with Applications (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
- Complex Calculations (AREA)
Abstract
Description
Claims (5)
- 입력된 음성에 대하여 고속 푸리에 변환을 수행하여, 시간영역의 음성신호를 주파수 영역에서 분석할 수 있도록 하는 고속 주파수 푸리에 변환기;상기 고속 주파수 푸리에 변환기로부터 출력되는 주파수 영역 상의 잡음에 오염된 음성(X(k))으로부터 잡음 신호의 파워()를 추정하는 잡음 파워 추정부;상기 잡음 파워 추정부(20)로부터 추정된 잡음 신호의 파워와 복소수 라플라시안 확률 통계 모델로부터 VAD(voice activity detection)의 결정 규칙을 계산하는 가능성 비율 테스트(LRT) 계산부를 포함하는 복소수 라플라시안 통계 모듈을 이용한 음성 검출기.
- 제1항에 있어서,상기 결정 규칙은 k 번째 주파수에 대한 가능성 비율()의 기하학적 평균이며, 상기 가능성 비율은 다음의 식, - 가설 H0와 H1은 각각 음성신호가 없는 경우와 음성 신호가 있는 경우를 나타내며, Xk는 k 번째 이산 푸리에 계수를 나타냄-으로 결정되는 것을 특징으로 하는 복소수 라플라시안 통계 모듈을 이용한 음성 검출기.
- 제2항에 있어서,상기 라플라시안 통계 모듈을 적용한 가능성 비율은 다음의 수학식으로-여기서,이고, Xk(R)와 Xk(I)는 Xk의 실수부와 허수부를 나타냄-결정되는 것을 특징으로 하는 복소수 라플라시안 통계 모듈을 이용한 음성 검출기.
- 입력된 음성에 대하여 고속 푸리에 변환을 수행하여, 시간영역의 음성신홀르 주파수 영역에서 분석할 수 있도록 잡음 음성(X(k))을 출력하는 단계;상기 단계에서 출력되는 주파수 영역 상의 잡음 음성(X(k))으로부터 잡음 신호의 파워()를 추정하는 단계;상기 추정된 잡음에 오염된 신호의 파워와 복소수 라플라시안 확률 통계 모델로부터 VAD의 결정 규칙을 계산하는 단계를 포함하는 복소수 라플라시안 통계 모듈을 이용한 음성 검출방법.
- 제4항에 있어서,상기 결정 규칙은 k 번째 주파수에 대한 가능성 비율의 기하학적 평균이며, 상기 가능성 비율은 다음의 식-여기서, 가설 H0와 H1은 각각 음성신호가 없는 경우와 음성 신호가 있는 경우를 나타내며, Xk는 k 번째 이산 푸리에 계수,, Xk(R)와 Xk(I)는 Xk의 실수부와 허수부를 나타냄-으로 결정되는 것을 특징으로 하는 복소수 라플라시안 통계 모듈을 이용한 음성 검출 방법.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2002-0083728A KR100513175B1 (ko) | 2002-12-24 | 2002-12-24 | 복소수 라플라시안 통계모델을 이용한 음성 검출기 및 음성 검출 방법 |
US10/699,126 US20040122667A1 (en) | 2002-12-24 | 2003-10-30 | Voice activity detector and voice activity detection method using complex laplacian model |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2002-0083728A KR100513175B1 (ko) | 2002-12-24 | 2002-12-24 | 복소수 라플라시안 통계모델을 이용한 음성 검출기 및 음성 검출 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20040056977A true KR20040056977A (ko) | 2004-07-01 |
KR100513175B1 KR100513175B1 (ko) | 2005-09-07 |
Family
ID=32588928
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2002-0083728A KR100513175B1 (ko) | 2002-12-24 | 2002-12-24 | 복소수 라플라시안 통계모델을 이용한 음성 검출기 및 음성 검출 방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20040122667A1 (ko) |
KR (1) | KR100513175B1 (ko) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100718749B1 (ko) * | 2006-11-29 | 2007-05-15 | 인하대학교 산학협력단 | 복소수 감마 통계 모델에 기초한 음성 검출 방법 및 음성검출기 |
KR100718846B1 (ko) * | 2006-11-29 | 2007-05-16 | 인하대학교 산학협력단 | 음성 검출을 위한 통계 모델을 적응적으로 결정하는 방법 |
KR100745977B1 (ko) * | 2005-09-26 | 2007-08-06 | 삼성전자주식회사 | 음성 구간 검출 장치 및 방법 |
KR100866580B1 (ko) * | 2007-02-21 | 2008-11-03 | 인하대학교 산학협력단 | 균등최강력 테스트에 기초한 음성 검출 방법 및 음성 검출시스템 |
KR100877225B1 (ko) * | 2007-10-05 | 2009-01-07 | 한국항공우주연구원 | 자승신호크기를 제한하는 검파기 |
CN109801646A (zh) * | 2019-01-31 | 2019-05-24 | 北京嘉楠捷思信息技术有限公司 | 一种基于融合特征的语音端点检测方法和装置 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI20045315A (fi) * | 2004-08-30 | 2006-03-01 | Nokia Corp | Ääniaktiivisuuden havaitseminen äänisignaalissa |
KR100631608B1 (ko) * | 2004-11-25 | 2006-10-09 | 엘지전자 주식회사 | 음성 판별 방법 |
GB2426166B (en) * | 2005-05-09 | 2007-10-17 | Toshiba Res Europ Ltd | Voice activity detection apparatus and method |
US8175537B2 (en) * | 2006-07-05 | 2012-05-08 | Telefonaktiebolaget L M Ericsson (Publ) | Method and arrangement for noise floor estimation |
KR100766543B1 (ko) | 2006-10-04 | 2007-10-12 | 주식회사 팬택 | 다중 사용자 환경의 초광대역 무선 통신 시스템을 위한간섭 제어 방법 |
JP5088050B2 (ja) * | 2007-08-29 | 2012-12-05 | ヤマハ株式会社 | 音声処理装置およびプログラム |
EP2107553B1 (en) * | 2008-03-31 | 2011-05-18 | Harman Becker Automotive Systems GmbH | Method for determining barge-in |
US8275136B2 (en) | 2008-04-25 | 2012-09-25 | Nokia Corporation | Electronic device speech enhancement |
US8244528B2 (en) * | 2008-04-25 | 2012-08-14 | Nokia Corporation | Method and apparatus for voice activity determination |
WO2009130388A1 (en) | 2008-04-25 | 2009-10-29 | Nokia Corporation | Calibrating multiple microphones |
US8682612B2 (en) * | 2008-12-18 | 2014-03-25 | Abb Research Ltd | Trend analysis methods and system for incipient fault prediction |
US8626498B2 (en) | 2010-02-24 | 2014-01-07 | Qualcomm Incorporated | Voice activity detection based on plural voice activity detectors |
WO2012083555A1 (en) * | 2010-12-24 | 2012-06-28 | Huawei Technologies Co., Ltd. | Method and apparatus for adaptively detecting voice activity in input audio signal |
CN103646649B (zh) * | 2013-12-30 | 2016-04-13 | 中国科学院自动化研究所 | 一种高效的语音检测方法 |
KR101568937B1 (ko) * | 2014-07-01 | 2015-11-13 | 한양대학교 산학협력단 | 볼테라 필터를 이용한 비선형 반향 신호 억제 장치 및 방법 |
CN105989838B (zh) * | 2015-01-30 | 2019-09-06 | 展讯通信(上海)有限公司 | 语音识别方法及装置 |
KR102302621B1 (ko) | 2015-03-09 | 2021-09-16 | 한국전자통신연구원 | 고차 라플라시안 오브 가우시안 커널을 이용한 이미지의 특징점 추출 장치 및 방법 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5867574A (en) * | 1997-05-19 | 1999-02-02 | Lucent Technologies Inc. | Voice activity detection system and method |
-
2002
- 2002-12-24 KR KR10-2002-0083728A patent/KR100513175B1/ko not_active IP Right Cessation
-
2003
- 2003-10-30 US US10/699,126 patent/US20040122667A1/en not_active Abandoned
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100745977B1 (ko) * | 2005-09-26 | 2007-08-06 | 삼성전자주식회사 | 음성 구간 검출 장치 및 방법 |
US7711558B2 (en) | 2005-09-26 | 2010-05-04 | Samsung Electronics Co., Ltd. | Apparatus and method for detecting voice activity period |
KR100718749B1 (ko) * | 2006-11-29 | 2007-05-15 | 인하대학교 산학협력단 | 복소수 감마 통계 모델에 기초한 음성 검출 방법 및 음성검출기 |
KR100718846B1 (ko) * | 2006-11-29 | 2007-05-16 | 인하대학교 산학협력단 | 음성 검출을 위한 통계 모델을 적응적으로 결정하는 방법 |
KR100866580B1 (ko) * | 2007-02-21 | 2008-11-03 | 인하대학교 산학협력단 | 균등최강력 테스트에 기초한 음성 검출 방법 및 음성 검출시스템 |
KR100877225B1 (ko) * | 2007-10-05 | 2009-01-07 | 한국항공우주연구원 | 자승신호크기를 제한하는 검파기 |
CN109801646A (zh) * | 2019-01-31 | 2019-05-24 | 北京嘉楠捷思信息技术有限公司 | 一种基于融合特征的语音端点检测方法和装置 |
CN109801646B (zh) * | 2019-01-31 | 2021-11-16 | 嘉楠明芯(北京)科技有限公司 | 一种基于融合特征的语音端点检测方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
US20040122667A1 (en) | 2004-06-24 |
KR100513175B1 (ko) | 2005-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100513175B1 (ko) | 복소수 라플라시안 통계모델을 이용한 음성 검출기 및 음성 검출 방법 | |
US8155953B2 (en) | Method and apparatus for discriminating between voice and non-voice using sound model | |
US7596496B2 (en) | Voice activity detection apparatus and method | |
Karray et al. | Towards improving speech detection robustness for speech recognition in adverse conditions | |
US8380497B2 (en) | Methods and apparatus for noise estimation | |
CN112735456B (zh) | 一种基于dnn-clstm网络的语音增强方法 | |
US7072833B2 (en) | Speech processing system | |
US20040158462A1 (en) | Pitch candidate selection method for multi-channel pitch detectors | |
US20050182624A1 (en) | Method and apparatus for constructing a speech filter using estimates of clean speech and noise | |
EP0470245A1 (en) | SPECTRAL EVALUATION PROCEDURE FOR IMPROVING RESISTANCE TO NOISE IN VOICE RECOGNITION. | |
US5787408A (en) | System and method for determining node functionality in artificial neural networks | |
US7343284B1 (en) | Method and system for speech processing for enhancement and detection | |
KR100718846B1 (ko) | 음성 검출을 위한 통계 모델을 적응적으로 결정하는 방법 | |
Chang et al. | Likelihood ratio test with complex laplacian model for voice activity detection. | |
Lee et al. | Statistical model-based VAD algorithm with wavelet transform | |
Ayat et al. | An improved wavelet-based speech enhancement by using speech signal features | |
Fang et al. | Integrating statistical uncertainty into neural network-based speech enhancement | |
KR100718749B1 (ko) | 복소수 감마 통계 모델에 기초한 음성 검출 방법 및 음성검출기 | |
Hizlisoy et al. | Noise robust speech recognition using parallel model compensation and voice activity detection methods | |
Kubichek et al. | Speech quality assessment using expert pattern recognition | |
Ağcaer et al. | Model-based optimization of a low-dimensional modulation filter bank for DRR and T60 estimation | |
Deng et al. | Voice activity detection based on conjugate subspace matching pursuit and likelihood ratio test | |
Pwint et al. | A new speech/non-speech classification method using minimal Walsh basis functions | |
KR101543300B1 (ko) | 다중 선형회귀 분석 기반의 음성 존재 불확실성 추정 방법 | |
Navakpour et al. | An efficient voice activity detector in non-stationary noises incorporating evidence theory to combine multiple statistical models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20021224 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20050221 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20050823 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20050831 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20050901 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20080805 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20091207 Start annual number: 5 End annual number: 5 |
|
FPAY | Annual fee payment |
Payment date: 20091228 Year of fee payment: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20091228 Start annual number: 6 End annual number: 7 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |