KR100751921B1 - 멀티채널 음성신호의 잡음제거 방법 및 장치 - Google Patents
멀티채널 음성신호의 잡음제거 방법 및 장치 Download PDFInfo
- Publication number
- KR100751921B1 KR100751921B1 KR1020050108226A KR20050108226A KR100751921B1 KR 100751921 B1 KR100751921 B1 KR 100751921B1 KR 1020050108226 A KR1020050108226 A KR 1020050108226A KR 20050108226 A KR20050108226 A KR 20050108226A KR 100751921 B1 KR100751921 B1 KR 100751921B1
- Authority
- KR
- South Korea
- Prior art keywords
- noise
- signal
- filter
- voice
- speech
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000012805 post-processing Methods 0.000 claims abstract description 10
- 239000011159 matrix material Substances 0.000 claims description 23
- 238000001914 filtration Methods 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 12
- 238000000926 separation method Methods 0.000 claims description 11
- 230000009467 reduction Effects 0.000 claims description 10
- 230000000694 effects Effects 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 6
- 230000003111 delayed effect Effects 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 6
- 230000001934 delay Effects 0.000 claims description 5
- 230000001360 synchronised effect Effects 0.000 claims description 5
- 230000005236 sound signal Effects 0.000 claims description 3
- 230000002708 enhancing effect Effects 0.000 claims 1
- 238000003672 processing method Methods 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 230000003044 adaptive effect Effects 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
Claims (17)
- (a) 음성신호로부터 환경에 따른 잡음 고유의 성분을 제거하는 단계;(b) 상기 잡음 고유성분이 제거된 음성신호로부터 음성과 잡음을 분리하는 단계; 및(c) 1채널 기반의 잡음추정을 이용하여 상기 분리된 음성에 남아있는 잔여 잡음을 제거하는 후처리 단계를 포함하고,상기 후처리 단계는VAD(Voice activity detection)를 적용하여 음성신호 구간과 잡음구간을 찾는 단계; 및잡음 구간의 잡음신호를 주기적으로 업데이트한 신호를 상기 (b)단계에서 생성된 신호에서 감산하는 단계를 포함함을 특징으로 하는 멀티채널 음성신호의 잡음제거 방법.
- 제1항에 있어서, 상기 (a)단계의 잡음고유 성분 제거는잡음을 주파수 분석하여 고역통과 필터, 저역통과 필터 및 대역통과 필터 중 적어도 하나를 사용하여 잡음 고유성분을 제거함을 특징으로 하는 멀티채널 음성신호의 잡음제거 방법.
- 제1항에 있어서, 상기 (b)단계는(b1) 음원신호로부터 각각의 마이크에 도착하는데 걸리는 입력신호 x1, x2의 시간지연을 보정하여 채널에 포함된 음성신호성분 및 잡음성분을 각각 강화한 y1, y2를 생성하는 단계;(b2) 각 프레임마다 상기 y1, y2 에 대해 데이터 행렬(data matrix) Y를 구하는 단계; 및(b3) 상기 데이터 행렬 Y를 이용하여 eigen 필터 B(z)을 구하여 음성과 잡음을 분리하는 단계를 포함함을 특징으로 하는 멀티채널 음성신호의 잡음제거 방법.
- 제3항에 있어서, 상기 (b3)단계는상기 데이터 행렬 Y를 이용하여 eigen 필터 B(z)을 구하는 단계;선택된 eigenvector의 성분을 이용하여 다항식(ploynomial)을 구성하고 상기 다항식의 근을 구하여 단위원(unit circle)의 안쪽으로 이동시켜 이동된 근을 이용하여 다항식을 구성하여 필터 A(z)를 생성하는 단계; 및상기 eigen 필터 B(z)를 상기 필터 A(z)로 나누어 무한 임펄스 응답필터 H(z)( = B(z) / A(z))를 구하여 음성과 잡음을 분리하는 단계를 구비함을 특징으로 하는 멀티채널 음성신호의 잡음제거 방법.
- 제3항에 있어서, 상기 (b1)단계는입력 신호 x1, x2에 대해 크로스 상관(cross-correlation)을 수행하는 단계;상기 크로스 상관된 정보를 이용하여 음원신호로부터 각각의 마이크에 도착하는데 걸리는 입력신호 x1, x2의 시간지연을 구하는 단계;상기 입력신호 x1, x2 를 시간지연된 값만큼 이동(shift)시켜 동기를 맞춘 신호 x‘1, x’2를 생성하는 단계; 및상기 x‘1, x’2 를 더한 값과 뺀 값의 반을 취하여 각각 y1, y2를 구하는 단계를 포함함을 특징으로 하는 멀티채널 음성신호의 잡음제거 방법.
- 삭제
- 삭제
- 제1항에 있어서, 상기 업데이트는이전 잡음추정값과 현재 잡음값을 가중합(weighted sum)함에 의해 이루어짐을 특징으로 하는 멀티채널 음성신호의 잡음제거 방법.
- 음성신호로부터 환경에 따른 잡음 고유의 성분을 제거하는 고유잡음제거부;상기 잡음 고유성분이 제거된 음성신호로부터 음성과 잡음을 분리하는 음성 잡음 분리부; 및1채널 기반의 잡음추정을 이용하여 상기 분리된 음성에 남아있는 잔여 잡음을 제거하는 후처리부를 포함하고,상기 후처리부는VAD(Voice activity detection)를 적용하여 음성신호 구간과 잡음구간을 찾아, 잡음 구간의 잡음신호를 주기적으로 업데이트한 신호를 상기 음성 잡음분리부에서 출력된 신호에서 감산하는 것을 특징으로 하는 멀티채널 음성신호의 잡음제거 장치.
- 제9항에 있어서, 상기 고유잡음제거부의 잡음고유 성분 제거는잡음을 주파수 분석하여 고역통과 필터, 저역통과 필터 및 대역통과 필터 중 적어도 하나를 사용하여 잡음 고유성분을 제거함을 특징으로 하는 멀티채널 음성신호의 잡음제거 장치.
- 제9항에 있어서, 상기 음성 잡음 분리부는음원신호로부터 각각의 마이크에 도착하는데 걸리는 입력신호 x1, x2의 시간지연을 보정하여 채널에 포함된 음성신호성분 및 잡음성분을 각각 강화한 y1, y2를 생성하는 시간지연보상부;각 프레임마다 상기 y1, y2 에 대해 데이터 행렬(data matrix) Y를 구하는 데이터행렬생성부; 및상기 데이터 행렬 Y를 이용하여 eigen 필터 B(z)을 구하여 음성과 잡음을 분리하는 eigen필터링부를 포함함을 특징으로 하는 멀티채널 음성신호의 잡음제거 장치.
- 제11항에 있어서, 상기 시간지연보상부는입력 신호 x1, x2에 대해 크로스 상관(cross-correlation)을 수행하는 크로스 상관부;상기 크로스 상관된 정보를 이용하여 음원신호로부터 각각의 마이크에 도착하는데 걸리는 입력신호 x1, x2의 시간지연을 구하는 시간지연획득부;상기 입력신호 x1, x2 를 시간지연된 값만큼 이동(shift)시켜 동기를 맞춘 신호 x‘1, x’2를 생성하는 동기화부; 및상기 x‘1, x’2 를 더한 값과 뺀 값의 반을 취하여 각각 y1, y2를 구하는 y1 y2생성부를 포함함을 특징으로 하는 멀티채널 음성신호의 잡음제거 장치.
- 제11항에 있어서, 상기 eigen 필터링부는상기 데이터 행렬 Y를 이용하여 eigen 필터 B(z)을 구하는 eigen 필터 생성부;선택된 eigenvector의 성분을 이용하여 다항식(ploynomial)을 구성하고 상기 다항식의 근을 구하여 단위원(unit circle)의 안쪽으로 이동시켜 이동된 근을 이용하여 다항식을 구성하여 필터 A(z)를 생성하는 A(z) 생성부; 및상기 eigen 필터 B(z)를 상기 필터 A(z)로 나누어 무한 임펄스 응답필터 H(z)( = B(z) / A(z))를 구하여 음성과 잡음을 분리하는 무한 임펄스 응답 필터링부를 구비함을 특징으로 하는 멀티채널 음성신호의 잡음제거 장치.
- 삭제
- 삭제
- 제9항에 있어서, 상기 업데이트는이전 잡음추정값과 현재 잡음값을 가중합(weighted sum)함에 의해 이루어짐을 특징으로 하는 멀티채널 음성신호의 잡음제거 장치.
- 제1항 내지 제5항 또는 제8항 중 어느 한 항에 기재된 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050108226A KR100751921B1 (ko) | 2005-11-11 | 2005-11-11 | 멀티채널 음성신호의 잡음제거 방법 및 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050108226A KR100751921B1 (ko) | 2005-11-11 | 2005-11-11 | 멀티채널 음성신호의 잡음제거 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070050694A KR20070050694A (ko) | 2007-05-16 |
KR100751921B1 true KR100751921B1 (ko) | 2007-08-24 |
Family
ID=38274157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020050108226A KR100751921B1 (ko) | 2005-11-11 | 2005-11-11 | 멀티채널 음성신호의 잡음제거 방법 및 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100751921B1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103781005A (zh) * | 2012-10-25 | 2014-05-07 | 现代摩比斯株式会社 | 利用信号处理的车辆用麦克风系统及噪音能动控制方法 |
US10540995B2 (en) | 2015-11-02 | 2020-01-21 | Samsung Electronics Co., Ltd. | Electronic device and method for recognizing speech |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100890708B1 (ko) * | 2007-06-04 | 2009-03-27 | 에스케이 텔레콤주식회사 | 잔류 잡음 제거 장치 및 방법 |
KR101470528B1 (ko) * | 2008-06-09 | 2014-12-15 | 삼성전자주식회사 | 적응 빔포밍을 위한 사용자 방향의 소리 검출 기반의 적응모드 제어 장치 및 방법 |
KR101225932B1 (ko) * | 2009-08-28 | 2013-01-24 | 포항공과대학교 산학협력단 | 음악 음원 분리 방법 및 장치 |
KR102249685B1 (ko) * | 2018-12-10 | 2021-05-10 | 서울과학기술대학교 산학협력단 | 음원 위치 결정 시스템 및 방법 |
US11415693B2 (en) * | 2019-10-24 | 2022-08-16 | Duke University | Spatial coherence feedback for adaptive clutter filtering |
US11896428B2 (en) | 2019-10-24 | 2024-02-13 | Duke University | Adaptive selection of ultrasound frequency |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5400409A (en) * | 1992-12-23 | 1995-03-21 | Daimler-Benz Ag | Noise-reduction method for noise-affected voice channels |
JPH10171497A (ja) | 1996-12-12 | 1998-06-26 | Oki Electric Ind Co Ltd | 背景雑音除去装置 |
KR20000040570A (ko) * | 1998-12-18 | 2000-07-05 | 김영환 | 두 채널의 마이크를 이용한 차량 잡음 제거 장치 및 방법 |
JP2002023776A (ja) | 2000-07-13 | 2002-01-25 | Univ Kinki | ブラインドセパレーションにおける話者音声と非音声雑音の識別方法及び話者音声チャンネルの特定方法 |
KR20030078218A (ko) * | 2002-03-28 | 2003-10-08 | 삼성전자주식회사 | 음성신호에서 잡음을 제거하는 방법 및 장치 |
JP2005195895A (ja) | 2004-01-07 | 2005-07-21 | Denso Corp | 雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置 |
KR20060055647A (ko) * | 2004-11-18 | 2006-05-24 | 삼성전자주식회사 | 잡음 제거 방법 및 장치 |
-
2005
- 2005-11-11 KR KR1020050108226A patent/KR100751921B1/ko active IP Right Grant
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5400409A (en) * | 1992-12-23 | 1995-03-21 | Daimler-Benz Ag | Noise-reduction method for noise-affected voice channels |
JPH10171497A (ja) | 1996-12-12 | 1998-06-26 | Oki Electric Ind Co Ltd | 背景雑音除去装置 |
KR20000040570A (ko) * | 1998-12-18 | 2000-07-05 | 김영환 | 두 채널의 마이크를 이용한 차량 잡음 제거 장치 및 방법 |
JP2002023776A (ja) | 2000-07-13 | 2002-01-25 | Univ Kinki | ブラインドセパレーションにおける話者音声と非音声雑音の識別方法及び話者音声チャンネルの特定方法 |
KR20030078218A (ko) * | 2002-03-28 | 2003-10-08 | 삼성전자주식회사 | 음성신호에서 잡음을 제거하는 방법 및 장치 |
JP2005195895A (ja) | 2004-01-07 | 2005-07-21 | Denso Corp | 雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置 |
KR20060055647A (ko) * | 2004-11-18 | 2006-05-24 | 삼성전자주식회사 | 잡음 제거 방법 및 장치 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103781005A (zh) * | 2012-10-25 | 2014-05-07 | 现代摩比斯株式会社 | 利用信号处理的车辆用麦克风系统及噪音能动控制方法 |
CN103781005B (zh) * | 2012-10-25 | 2017-06-23 | 现代摩比斯株式会社 | 利用信号处理的车辆用麦克风系统及噪音能动控制方法 |
US10540995B2 (en) | 2015-11-02 | 2020-01-21 | Samsung Electronics Co., Ltd. | Electronic device and method for recognizing speech |
Also Published As
Publication number | Publication date |
---|---|
KR20070050694A (ko) | 2007-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3591068B2 (ja) | 音声信号の雑音低減方法 | |
US8345890B2 (en) | System and method for utilizing inter-microphone level differences for speech enhancement | |
US8447596B2 (en) | Monaural noise suppression based on computational auditory scene analysis | |
CN108172231B (zh) | 一种基于卡尔曼滤波的去混响方法及系统 | |
US7533015B2 (en) | Signal enhancement via noise reduction for speech recognition | |
EP0788089B1 (en) | Method and apparatus for suppressing background music or noise from the speech input of a speech recognizer | |
WO2006116132A2 (en) | Systems and methods for reducing audio noise | |
CN105869651A (zh) | 基于噪声混合相干性的双通道波束形成语音增强方法 | |
KR100647286B1 (ko) | 교차채널 간섭을 제거하기 위한 후처리장치 및 방법과이를 이용한 다채널 음원 분리장치 및 방법 | |
KR101581885B1 (ko) | 복소 스펙트럼 잡음 제거 장치 및 방법 | |
KR100751921B1 (ko) | 멀티채널 음성신호의 잡음제거 방법 및 장치 | |
KR100917460B1 (ko) | 잡음제거 장치 및 방법 | |
JP2836271B2 (ja) | 雑音除去装置 | |
JP3786038B2 (ja) | 入力信号処理方法および入力信号処理装置 | |
CN113744752A (zh) | 语音处理方法及装置 | |
JP2003250193A (ja) | 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体 | |
KR100848789B1 (ko) | 크로스토크를 제거하기 위한 후처리 방법 | |
JP2007511966A (ja) | 通信システムにおけるエコーを低減するための方法および装置 | |
Gui et al. | Adaptive subband Wiener filtering for speech enhancement using critical-band gammatone filterbank | |
KR101022457B1 (ko) | Casa 및 소프트 마스크 알고리즘을 이용한 단일채널 음성 분리방법 | |
Khorram et al. | An optimum MMSE post-filter for Adaptive Noise Cancellation in automobile environment | |
KR100751927B1 (ko) | 멀티음성채널 음성신호의 적응적 잡음제거를 위한 전처리 방법 및 장치 | |
Ramesh Babu et al. | Speech enhancement using beamforming and Kalman Filter for In-Car noisy environment | |
US20080279394A1 (en) | Noise suppressing apparatus and method for noise suppression | |
CN118116402A (zh) | 一类基于双线性滤波的多通道语音降噪方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
G170 | Publication of correction | ||
FPAY | Annual fee payment |
Payment date: 20130621 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20140630 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20151116 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20160726 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20170707 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20180723 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20190808 Year of fee payment: 13 |