WO2009145449A3 - 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터 판독 가능한 기록매체 - Google Patents
노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터 판독 가능한 기록매체 Download PDFInfo
- Publication number
- WO2009145449A3 WO2009145449A3 PCT/KR2009/001642 KR2009001642W WO2009145449A3 WO 2009145449 A3 WO2009145449 A3 WO 2009145449A3 KR 2009001642 W KR2009001642 W KR 2009001642W WO 2009145449 A3 WO2009145449 A3 WO 2009145449A3
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- spectrum
- speech signal
- noisy speech
- frame
- noise estimation
- Prior art date
Links
- 238000000034 method Methods 0.000 title abstract 6
- 238000001228 spectrum Methods 0.000 abstract 9
- 230000003044 adaptive effect Effects 0.000 abstract 2
- 238000012935 Averaging Methods 0.000 abstract 1
- 238000009499 grossing Methods 0.000 abstract 1
- 230000001131 transforming effect Effects 0.000 abstract 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
노이지 음성 신호의 잡음 추정 방법과 이를 위한 장치 및 컴퓨터 판독 가능한 기록매체를 제공한다. 본 발명의 일 실시예에 따른 노이지 음성 신호의 잡음 추정 방법은 입력되는 노이지 음성 신호를 주파수 도메인으로 변환하여 변환 스펙트럼을 구하는 단계, 인접한 프레임들 사이에서 상기 변환 스펙트럼의 크기 차이를 완화한 평활 크기 스펙트럼을 구하는 단계, 직전 프레임의 탐색 프레임만을 이용하거나 및/또는 직전 프레임의 탐색 프레임과 직전 프레임의 평활 크기 스펙트럼 중에서 크기가 작은 스펙트럼과 현재 프레임의 평활 크기 스펙트럼을 이용하여 현재 프레임의 탐색 프레임을 구하는 단계, 상기 평활 크기 스펙트럼과 상기 탐색 스펙트럼을 이용하여 상기 입력 노이지 음성 신호에 포함된 잡음 성분의 비율을 나타내는 식별비를 구하는 단계, 및 상기 식별비를 이용하여 정의되는 적응적 망각 요소를 이용한 순환 평균 기법으로 잡음 스펙트럼을 구하는 단계를 포함한다. 이러한 본 발명의 실시예에 의하면, 잡음 추정을 위한 계산량이 적으며 또한 대용량의 메모리가 필요 없기 때문에, 하드웨어나 소프트웨어로 구현하기가 용이하며, 또한 주파수 서브밴드별로 적응적인 절차의 수행이 가능해서 잡음 추정의 정확도를 높일 수가 있다.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/935,390 US8694311B2 (en) | 2008-03-31 | 2009-03-31 | Method for processing noisy speech signal, apparatus for same and computer-readable recording medium |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2008-0030017 | 2008-03-31 | ||
KR1020080030017A KR101260938B1 (ko) | 2008-03-31 | 2008-03-31 | 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터판독 가능한 기록매체 |
Publications (2)
Publication Number | Publication Date |
---|---|
WO2009145449A2 WO2009145449A2 (ko) | 2009-12-03 |
WO2009145449A3 true WO2009145449A3 (ko) | 2010-01-21 |
Family
ID=41377708
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/KR2009/001642 WO2009145449A2 (ko) | 2008-03-31 | 2009-03-31 | 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터 판독 가능한 기록매체 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8694311B2 (ko) |
KR (1) | KR101260938B1 (ko) |
WO (1) | WO2009145449A2 (ko) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101176207B1 (ko) * | 2010-10-18 | 2012-08-28 | (주)트란소노 | 음성통신 시스템 및 음성통신 방법 |
KR101290997B1 (ko) * | 2012-03-26 | 2013-07-30 | 세종대학교산학협력단 | 적응형 코드벡터를 이용한 코드북 기반 음성 향상 방법 및 그 장치 |
US9484043B1 (en) * | 2014-03-05 | 2016-11-01 | QoSound, Inc. | Noise suppressor |
JP6559576B2 (ja) * | 2016-01-05 | 2019-08-14 | 株式会社東芝 | 雑音抑圧装置、雑音抑圧方法及びプログラム |
US9972134B2 (en) | 2016-06-30 | 2018-05-15 | Microsoft Technology Licensing, Llc | Adaptive smoothing based on user focus on a target object |
KR101943582B1 (ko) * | 2017-04-25 | 2019-01-29 | 연세대학교 산학협력단 | 음향 신호 강조 방법 |
KR20180125384A (ko) * | 2017-05-15 | 2018-11-23 | 한국전기연구원 | 음성 검출기를 구비한 보청기 및 그 방법 |
CN108806712B (zh) * | 2018-04-27 | 2020-08-18 | 深圳市沃特沃德股份有限公司 | 减少频域处理量的方法与装置 |
CN110265055B (zh) * | 2019-06-17 | 2021-04-20 | 杭州叙简科技股份有限公司 | 一种poc对讲的语音去噪增强系统及语音去噪增强方法 |
CN113299308A (zh) * | 2020-09-18 | 2021-08-24 | 阿里巴巴集团控股有限公司 | 一种语音增强方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20000033530A (ko) * | 1998-11-24 | 2000-06-15 | 김영환 | 음성 구간 검출과 스펙트럼 차감법을 이용한 차량 잡음제거방법 |
KR20060010222A (ko) * | 2004-07-27 | 2006-02-02 | 삼성전자주식회사 | 레코더 기기의 잡음 제거 장치 및 그 방법 |
KR100655953B1 (ko) * | 2006-02-06 | 2006-12-11 | 한양대학교 산학협력단 | 웨이블릿 패킷 변환을 이용한 음성 처리 시스템 및 그 방법 |
KR100789084B1 (ko) * | 2006-11-21 | 2007-12-26 | 한양대학교 산학협력단 | 웨이블릿 패킷 영역에서 비선형 구조의 과중 이득에 의한음질 개선 방법 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6523003B1 (en) * | 2000-03-28 | 2003-02-18 | Tellabs Operations, Inc. | Spectrally interdependent gain adjustment techniques |
JP3457293B2 (ja) * | 2001-06-06 | 2003-10-14 | 三菱電機株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
US20050288923A1 (en) * | 2004-06-25 | 2005-12-29 | The Hong Kong University Of Science And Technology | Speech enhancement by noise masking |
-
2008
- 2008-03-31 KR KR1020080030017A patent/KR101260938B1/ko active IP Right Grant
-
2009
- 2009-03-31 US US12/935,390 patent/US8694311B2/en active Active
- 2009-03-31 WO PCT/KR2009/001642 patent/WO2009145449A2/ko active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20000033530A (ko) * | 1998-11-24 | 2000-06-15 | 김영환 | 음성 구간 검출과 스펙트럼 차감법을 이용한 차량 잡음제거방법 |
KR20060010222A (ko) * | 2004-07-27 | 2006-02-02 | 삼성전자주식회사 | 레코더 기기의 잡음 제거 장치 및 그 방법 |
KR100655953B1 (ko) * | 2006-02-06 | 2006-12-11 | 한양대학교 산학협력단 | 웨이블릿 패킷 변환을 이용한 음성 처리 시스템 및 그 방법 |
KR100789084B1 (ko) * | 2006-11-21 | 2007-12-26 | 한양대학교 산학협력단 | 웨이블릿 패킷 영역에서 비선형 구조의 과중 이득에 의한음질 개선 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR101260938B1 (ko) | 2013-05-06 |
WO2009145449A2 (ko) | 2009-12-03 |
US20110022383A1 (en) | 2011-01-27 |
US8694311B2 (en) | 2014-04-08 |
KR20090104559A (ko) | 2009-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2009145449A3 (ko) | 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터 판독 가능한 기록매체 | |
JP6431884B2 (ja) | シングルチャンネル音声残響除去方法及びその装置 | |
US20200273442A1 (en) | Single-channel, binaural and multi-channel dereverberation | |
US20080059163A1 (en) | Method and apparatus for noise suppression, smoothing a speech spectrum, extracting speech features, speech recognition and training a speech model | |
JP4886715B2 (ja) | 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体 | |
JP6533340B2 (ja) | ビーム形成用途のための適応的位相歪曲のない振幅応答等化 | |
JP6894580B2 (ja) | ノイズと残響を減少させた音声信号を提供する信号処理装置及び方法 | |
ATE476733T1 (de) | Verfahren zum verarbeiten eines rauschbehafteten tonsignals und einrichtung zur implementierung des verfahrens | |
KR20100003530A (ko) | 전자기기에서 음성 신호의 잡음 제거 장치 및 방법 | |
JP2008052277A (ja) | 拡張された帯域幅を有する音響信号を提供するための方法およびシステム | |
DK3065417T3 (da) | Fremgangsmåde til undertrykkelse af en interfererende støj i et akustisk system | |
Choi | Noise reduction algorithm in speech by Wiener filter | |
JP5232121B2 (ja) | 信号処理装置 | |
CN106797517B (zh) | 用于净化音频信号的多耳mmse分析技术 | |
US9520137B2 (en) | Method for suppressing the late reverberation of an audio signal | |
CN106340302A (zh) | 一种语音数据的去混响方法及装置 | |
KR20160116440A (ko) | 음성인식 시스템의 신호대잡음비 추정 장치 및 방법 | |
KR101824648B1 (ko) | 음성 신호 처리 방법 및 장치 | |
TW200725308A (en) | Method for removing background noise from a speech signal | |
JP6295650B2 (ja) | 音声信号処理装置及びプログラム | |
KR20180087021A (ko) | 실내전달함수 추정 방법 및 신호 처리 방법 | |
Jeon et al. | Multi-band spectral subtraction based zoom-noise suppression for digital cameras | |
US10109291B2 (en) | Noise suppression device, noise suppression method, and computer program product | |
Iwai et al. | Formant frequency estimation with windowless autocorrelation in the presence of noise | |
Mitani et al. | Cross-correlation functions with binary signal involving phase information for speech enhancement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 09754914 Country of ref document: EP Kind code of ref document: A2 |
|
WWE | Wipo information: entry into national phase |
Ref document number: 12935390 Country of ref document: US |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 09754914 Country of ref document: EP Kind code of ref document: A2 |