KR100870502B1 - 배경잡음의 존재하에 음성 강화를 위한 방법 및 기기 - Google Patents
배경잡음의 존재하에 음성 강화를 위한 방법 및 기기 Download PDFInfo
- Publication number
- KR100870502B1 KR100870502B1 KR1020067015437A KR20067015437A KR100870502B1 KR 100870502 B1 KR100870502 B1 KR 100870502B1 KR 1020067015437 A KR1020067015437 A KR 1020067015437A KR 20067015437 A KR20067015437 A KR 20067015437A KR 100870502 B1 KR100870502 B1 KR 100870502B1
- Authority
- KR
- South Korea
- Prior art keywords
- frequency
- speech
- noise suppression
- delete delete
- bands
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 230000001629 suppression Effects 0.000 claims abstract description 93
- 230000003595 spectral effect Effects 0.000 claims abstract description 38
- 238000001228 spectrum Methods 0.000 claims description 33
- 230000000694 effects Effects 0.000 claims description 23
- 238000009499 grossing Methods 0.000 claims description 20
- 230000001755 vocal effect Effects 0.000 claims description 6
- 230000005764 inhibitory process Effects 0.000 claims 1
- 230000005236 sound signal Effects 0.000 claims 1
- 238000005192 partition Methods 0.000 abstract 1
- 230000009467 reduction Effects 0.000 description 40
- 238000012545 processing Methods 0.000 description 32
- 238000010183 spectrum analysis Methods 0.000 description 20
- 230000007774 longterm Effects 0.000 description 13
- 238000005070 sampling Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000009432 framing Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 230000005534 acoustic noise Effects 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 206010019133 Hangover Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Noise Elimination (AREA)
- Telephone Function (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Devices For Executing Special Programs (AREA)
Abstract
Description
주파수 분석을 수행하여 복수의 주파수빈들을 포함하는 음성신호의 스펙트럼영역 표현을 생성하는 단계; 및
주파수빈들을 다수의 주파수대역들로 그룹화하는 단계를 포함하며,
발성된 음성 활동도가 음성신호에서 검출될 때, 잡음 억제가 제1수의 주파수대역들에 대해 주파수빈마다 수행되고 잡음 억제는 제2수의 주파수대역들에 대해 주파수대역마다 수행되는 것을 특징으로 하는 방법이 제공된다.
본 발명의 다른 양태에서 음성신호의 잡음을 억제하기 위한 기기에 있어서, 상기 기기는,
주파수 분석을 수행하여 복수의 주파수빈들을 포함하는 음성신호의 스펙트럼영역 표현을 생성하도록; 그리고
주파수빈들을 다수의 주파수대역들로 그룹화하도록 구성되며,
상기 기기는 발성된 음성 활동도를 검출하도록 구성되고 발성된 음성 활동도가 음성신호에서 검출될 때, 제1수의 주파수대역들에 대해 주파수빈마다 잡음 억제를 수행하고 제2수의 주파수대역들에 대해 주파수대역마다 잡음 억제를 수행하는 것을 특징으로 하는 기기가 제공된다.
본 발명의 추가의 양태에서 잡음 억제를 위한 기기를 포함하는 음성 부호화기에 있어서,
주파수 분석을 수행하여 복수의 주파수빈들을 포함하는 음성신호의 스펙트럼영역 표현을 생성하도록; 그리고
주파수빈들을 다수의 주파수대역들로 그룹화하도록 구성되며,
상기 기기는 발성된 음성 활동도를 검출하도록 구성되며, 발성된 음성 활동도가 음성신호에서 검출될 때, 제1수의 주파수대역들에 대해 주파수빈마다 잡음 억제를 수행하고 제2수의 주파수대역들에 대해 주파수대역마다 잡음 억제를 수행하는 것을 특징으로 하는 음성 부호화기가 제공된다.
본 발명의 더 추가의 양태에서 잡음 억제를 위한 기기를 포함하는 자동 음성인식 시스템에 있어서, 상기 기기는
주파수 분석을 수행하여 복수의 주파수빈들을 포함하는 음성신호의 스펙트럼영역 표현을 생성하도록; 그리고
주파수빈들을 다수의 주파수대역들로 그룹화하도록 구성되며,
상기 기기는 발성된 음성 활동도를 검출하도록 구성되며, 발성된 음성 활동도가 음성신호에서 검출될 때, 제1수의 주파수대역들에 대해 주파수빈마다 잡음 억제를 수행하고 제2수의 주파수대역들에 대해 주파수대역마다 잡음 억제를 수행하는 것을 특징으로 하는 자동 음성인식 시스템이 제공된다.
본 발명의 또 다른 양태에서 잡음 억제를 위한 기기를 포함하는 이동전화기에 있어서, 상기 이동전화기는
주파수 분석을 수행하여 복수의 주파수빈들을 포함하는 음성신호의 스펙트럼영역 표현을 생성하도록; 그리고
주파수빈들을 다수의 주파수대역들로 그룹화하도록 구성되며,
상기 기기는 발성된 음성 활동도를 검출하도록 구성되며, 발성된 음성 활동도가 음성신호에서 검출될 때, 제1수의 주파수대역들에 대해 주파수빈마다 잡음 억제를 수행하고 제2수의 주파수대역들에 대해 주파수대역마다 잡음 억제를 수행하도록 구성되는 이동전화기가 제공된다.
Claims (125)
- 음성신호의 잡음 억제를 위한 방법에 있어서,주파수 분석을 수행하여 복수의 주파수 빈들을 포함하는 음성신호의 스펙트럼영역 표현을 생성하는 단계; 및주파수 빈들을 다수의 주파수대역들로 그룹화하는 단계를 포함하며,발성된 음성 활동도가 음성 프레임에서 검출될 때, 잡음 억제가 제1수의 주파수대역들에 대해 주파수 빈마다 수행되고 잡음 억제는 제2수의 주파수대역들에 대해 주파수대역마다 수행되는 것을 특징으로 하는 음성 신호의 잡음 억제를 위한 방법.
- 제1항에 있어서, 상기 주파수대역들의 제1수는 발성되는 주파수대역들의 수에 따라 결정되는, 음성 신호의 잡음 억제 방법.
- 제1항에 있어서, 상기 주파수대역들의 제1수는 음성 프레임이 발성된다고 간주되는 상한 주파수인 발성 차단주파수에 대해 결정되는, 음성 신호의 잡음 억제 방법.
- 제3항에 있어서, 상기 제1수의 주파수대역들은 발성 차단주파수를 초과하지 않는 상위주파수를 가지는 음성 프레임의 모든 주파수대역들을 포함하는, 음성 신호의 잡음 억제 방법.
- 제1항에 있어서, 상기 주파수대역들의 제1수는 기설정된 정수인, 음성 신호의 잡음 억제 방법.
- 제1항에 있어서, 음성 프레임의 주파수대역들이 발성되지 않는다면, 잡음 억제는 모든 주파수대역들에 대해 주파수대역마다 수행되는, 음성 신호의 잡음 억제 방법.
- 제6항에 있어서, 상기 음성신호는 다수의 샘플을 포함하는 음성프레임들을 포함하고 제1항의 방법은 음성프레임의 잡음을 억제하는데 적용되는, 음성 신호의 잡음 억제 방법.
- 제7항에 있어서, 음성프레임의 제1샘플에 대해 m개 샘플만큼 오프셋된 분석윈도우를 이용하여 상기 주파수 분석을 수행하는 단계를 포함하는, 음성 신호의 잡음 억제 방법.
- 제7항에 있어서,음성프레임의 제1샘플에 대해 m개 샘플만큼 오프셋된 제1분석윈도우와 음성프레임의 제1샘플에 대해 p개 샘플만큼 오프셋된 제2주파수분석윈도우를 이용하여 제1주파수분석을 수행하는 단계를 포함하는, 음성 신호의 잡음 억제 방법.
- 제9항에 있어서, m = 24이고 p = 128인, 음성 신호의 잡음 억제 방법.
- 제9항에 있어서, 상기 제2분석윈도우는 음성신호의 상기 음성프레임부터 후속하는 음성프레임까지 연장하는 예견능력부를 포함하는, 음성 신호의 잡음 억제 방법.
- 제1항에 있어서, 상기 제1수의 주파수 대역들에 대한 크기조정이득을 주파수 빈들에 적용하고 그리고 상기 제2수의 주파수 대역들에 대해 주파수 대역들의 이득을 크기 조정하는 것에 의해 잡음 억제를 수행하는 단계를 포함하는, 음성 신호의 잡음 억제 방법.
- 제1항에 있어서, 잡음 억제가 주파수빈마다 수행될 때, 상기 방법은 주파수빈에 대해 주파수빈 특화 크기조정이득을 결정하는 단계를 더 포함하는, 음성 신호의 잡음 억제 방법.
- 제1항에 있어서, 잡음 억제가 주파수대역마다 수행될 때, 상기 방법은 주파수대역에 대해 주파수대역 특화 크기조정이득을 결정하는 단계를 더 포함하는, 음성 신호의 잡음 억제 방법.
- 제6항에 있어서, 모든 주파수대역들에 대해 일정한 크기조정이득을 적용함으로써 잡음 억제를 수행하는 단계를 포함하는, 음성 신호의 잡음 억제 방법.
- 제13항에 있어서, 주파수빈에 대해 결정된 신호-대-노이즈비(SNR)에 관련한 주파수빈에 대해 주파수빈 특화 크기조정이득을 위한 값을 결정하는 단계를 포함하는, 음성 신호의 잡음 억제 방법.
- 제14항에 있어서, 주파수대역에 대해 결정된 신호-대-노이즈비(SNR)에 관련한 주파수대역에 대해 주파수대역 특화 크기조정이득을 위한 값을 결정하는 단계를 포함하는, 음성 신호의 잡음 억제 방법.
- 제16항에 있어서, 제1 및 제2 주파수분석들의 각각에 대해 제16항의 단계들을 수행하는 단계를 포함하는, 음성 신호의 잡음 억제 방법.
- 제17항에 있어서, 제1 및 제2 주파수분석들의 각각에 대해 제17항의 단계들을 수행하는 단계를 포함하는, 음성 신호의 잡음 억제 방법.
- 제12항 내지 제14항 중 어느 한 항에 있어서, 상기 크기조정이득은 평활화된 크기조정이득인, 음성 신호의 잡음 억제 방법.
- 제12항 내지 제14항 중 어느 한 항에 있어서, 특정 주파수빈 또는 특정 주파수대역에 대해 크기조정이득에 역 비례하는 값을 가지는 평활화계수를 이용하여 특정 주파수빈 또는 특정 주파수대역에 적용하려는 평활화된 크기조정이득을 계산하는 단계를 포함하는, 음성 신호의 잡음 억제 방법.
- 제12항 내지 제14항 중 어느 한 항에 있어서, 크기조정이득의 값들이 작을수록 평활화가 더 강해지도록 결정된 값을 가지는 평활화계수를 이용하여 특정 주파수빈 또는 특정 주파수대역에 적용하려는 평활화된 크기조정이득을 계산하는 단계를 포함하는, 음성 신호의 잡음 억제 방법.
- 제13항 또는 제14항에 있어서, 크기조정이득의 값을 결정하는 단계는 음성프레임당 n번 발생하고 n은 1보다 큰, 음성 신호의 잡음 억제 방법.
- 제23항에 있어서, n = 2인, 음성 신호의 잡음 억제 방법.
- 제13항 또는 제14항에 있어서, 크기조정이득의 값을 음성프레임당 n번 결정하는 단계로서, n은 1보다 크고, 발성 차단주파수는 적어도 부분적으로는 이전 음성프레임의 음성신호의 함수인, 음성 신호의 잡음 억제 방법.
- 제13항에 있어서, 주파수빈마다의 잡음 억제는 17개 대역에 상응하는 최대 74개 빈들에 대해 수행되는, 음성 신호의 잡음 억제 방법.
- 제13항에 있어서, 주파수빈마다의 잡음 억제는 주파수 3700Hz에 상응하는 최대 수의 주파수빈들에 대해 수행되는, 음성 신호의 잡음 억제 방법.
- 제16항에 있어서, 제1 SNR값에 대해, 크기조정이득의 값은 최소값으로 설정되고, 제1 SNR값보다 큰 제2 SNR값에 대해 크기조정이득 값은 1로 설정되는, 음성 신호의 잡음 억제 방법.
- 제28항에 있어서, 제1 SNR값은 1dB 이하이고, 제2 SNR값은 45dB 이상인, 음성 신호의 잡음 억제 방법.
- 제20항에 있어서, 활동적 음성을 담고 있지 않은 음성신호의 구역들을 검출하는 단계를 더 포함하는, 음성 신호의 잡음 억제 방법.
- 제30항에 있어서, 활동적 음성을 담고 있지 않은 음성신호의 구역을 검출하는 것에 응답하여 평활화된 크기조정이득을 최소값으로 재설정하는 단계를 더 포함하는, 음성 신호의 잡음 억제 방법.
- 제7항에 있어서, 잡음 억제는 복수의 주파수대역들의 최대 잡음에너지가 문턱값 미만일 때에는 수행되지 않는, 음성 신호의 잡음 억제 방법.
- 제7항에 있어서, 단기잔류 음성프레임의 발생에 응답하여, 제1 x개 주파수대역들에 대해 주파수대역마다 결정되는 크기조정이득을 적용함으로써 잡음 억제를 수행하고 나머지 주파수대역들에 대해 크기조정이득의 단일 값을 적용함으로써 잡음 억제를 수행하는, 음성 신호의 잡음 억제 방법.
- 제33항에 있어서, 제1 x개 주파수대역들은 1700Hz까지의 주파수에 상응하는, 음성 신호의 잡음 억제 방법.
- 제20항에 있어서, 협대역 음성신호에 대해 상기 방법은 3700Hz까지의 주파수에 상응하는 제1 x개 주파수대역들에 대해 주파수대역마다 결정되는 평활화된 크기조정이득들을 적용함으로써 잡음 억제를 수행하는 단계, 3700Hz에 상응하는 주파수빈에서의 크기조정이득의 값을 3700Hz와 4000Hz 사이의 주파수빈들에 적용함으로써 잡음 억제를 수행하는 단계, 및 음성신호의 주파수 스펙트럼의 나머지 주파수대역들을 제로화하는 단계를 더 포함하는, 음성 신호의 잡음 억제 방법.
- 제35항에 있어서, 협대역 음성신호는 12800Hz로 업샘플링된 것인, 음성 신호의 잡음 억제 방법.
- 제3항에 있어서, 계산된 발성 계량값을 이용하여 발성 차단주파수를 결정하는 단계를 더 포함하는, 음성 신호의 잡음 억제 방법.
- 제37항에 있어서, 상기 발성 차단주파수를 초과하지 않는 상위주파수를 가지는 다수의 임계대역을 결정하는 단계로서, 경계들은 주파수빈마다의 잡음 억제가 최소 x개 대역 및 최대 y개 대역들에 대해 수행되도록 설정되는 단계를 더 포함하는, 음성 신호의 잡음 억제 방법.
- 제38항에 있어서, x = 3이고 y = 17인, 음성 신호의 잡음 억제 방법.
- 제37항에 있어서, 상기 발성 차단주파수는 325Hz 이상이고 3700Hz 이하가 되도록 경계가 정해지는, 음성 신호의 잡음 억제 방법.
- 음성신호의 잡음을 억제하기 위한 기기에 있어서, 상기 기기는,주파수 분석을 수행하여 복수의 주파수 빈들을 포함하는 음성신호의 스펙트럼영역 표현을 생성하도록; 그리고주파수 빈들을 다수의 주파수대역들로 그룹화하도록 구성되며,상기 기기는 발성된 음성 활동도를 검출하도록 구성되고 발성된 음성 활동도가 음성 프레임에서 검출될 때, 제1수의 주파수대역들에 대해 주파수 빈마다 잡음 억제를 수행하고 제2수의 주파수대역들에 대해 주파수대역마다 잡음 억제를 수행하는 것을 특징으로 하는, 음성 신호의 잡음 억제 기기.
- 제41항에 있어서, 상기 주파수대역들의 제1수는 발성되는 주파수대역들의 수에 따라 결정되는, 음성 신호의 잡음 억제 기기.
- 제41항에 있어서, 상기 기기는 음성 프레임이 발성된다고 간주되는 상한 주파수인 발성 차단주파수에 대해 상기 제1수의 주파수대역들을 결정하도록 구성되는, 음성 신호의 잡음 억제 기기.
- 제43항에 있어서, 상기 제1수의 주파수대역들은 발성 차단주파수를 초과하지 않는 상위주파수를 가지는 음성신호의 모든 주파수대역들을 포함하는, 음성 신호의 잡음 억제 기기.
- 제41항에 있어서, 상기 주파수대역들의 제1수는 기설정된 정수인, 음성 신호의 잡음 억제 기기.
- 제41항에 있어서, 상기 기기는 음성 프레임의 주파수대역들이 발성되지 않을 때 모든 주파수대역들에 대해 주파수대역마다 잡음 억제를 수행하도록 구성된, 음성 신호의 잡음 억제 기기.
- 제41항에 있어서, 상기 음성신호는 다수의 샘플을 포함하는 음성프레임들을 포함하고 상기 기기는 음성프레임의 잡음을 억제하도록 구성된, 음성 신호의 잡음 억제 기기.
- 제47항에 있어서, 상기 기기는 음성프레임의 제1샘플에 대해 m개 샘플만큼 오프셋된 분석윈도우를 이용하여 상기 주파수 분석을 수행하도록 구성된, 음성 신호의 잡음 억제 기기.
- 제47항에 있어서, 음성프레임의 제1샘플에 대해 m개 샘플만큼 오프셋된 제1분석윈도우와 음성프레임의 제1샘플에 대해 p개 샘플만큼 오프셋된 제2주파수분석윈도우를 이용하여 제1주파수분석을 수행하도록 구성된, 음성 신호의 잡음 억제 기기.
- 제49항에 있어서, m = 24이고 p = 128인, 음성 신호의 잡음 억제 기기.
- 제49항에 있어서, 상기 제2분석윈도우는 음성신호의 상기 음성프레임부터 후속하는 음성프레임까지 연장하는 예견능력부를 포함하는, 음성 신호의 잡음 억제 기기.
- 제41항에 있어서, 상기 기기는 상기 제1수의 주파수 대역들에 대한 크기조정이득을 주파수 빈들에 적용하고 그리고 상기 제2수의 주파수 대역들에 대해 주파수 대역들의 이득을 크기 조정하는 것에 의해 잡음 억제를 수행하도록 구성된, 음성 신호의 잡음 억제 기기.
- 제41항에 있어서, 상기 기기가 주파수빈마다 잡음 억제를 수행하도록 구성되고 주파수빈에 대해 주파수빈 특화 크기조정이득을 결정하도록 더 구성되는, 음성 신호의 잡음 억제 기기.
- 제41항에 있어서, 상기 기기가 주파수대역마다 잡음 억제를 수행하도록 구성되고 주파수대역에 대해 주파수대역 특화 크기조정이득을 결정하도록 추가로 구성되는, 음성 신호의 잡음 억제 기기.
- 제46항에 있어서, 상기 기기는 모든 주파수대역들에 대해 일정한 크기조정이득을 적용함으로써 잡음 억제를 수행하는, 음성 신호의 잡음 억제 기기.
- 제53항에 있어서, 상기 기기는 주파수빈에 대해 결정된 신호-대-노이즈비(SNR)에 관련한 주파수빈에 대해 주파수빈 특화 크기조정이득을 위한 값을 결정하도록 구성된, 음성 신호의 잡음 억제 기기.
- 제54항에 있어서, 상기 기기는 주파수대역에 대해 결정된 신호-대-노이즈비(SNR)에 관련한 주파수대역에 대해 주파수대역 특화 크기조정이득을 위한 값을 결정하도록 구성되는, 음성 신호의 잡음 억제 기기.
- 제56항에 있어서, 상기 기기는 제1 및 제2 주파수분석들의 각각에 대해 주파수빈 특화 크기조정이득을 위한 값을 결정하는 것을 수행하도록 구성되는, 음성 신호의 잡음 억제 기기.
- 제57항에 있어서, 상기 기기는 제1 및 제2 주파수분석들의 각각에 대해 주파수빈 특화 크기조정이득을 위한 값을 결정하는 것을 수행하도록 구성되는, 음성 신호의 잡음 억제 기기.
- 제52항 내지 제54항 중 어느 한 항에 있어서, 크기조정이득은 평활화된 크기조정이득인, 음성 신호의 잡음 억제 기기.
- 제52항 내지 제54항 중 어느 한 항에 있어서, 상기 기기는 특정 주파수빈 또는 특정 주파수대역에 대해 크기조정이득에 역 비례하는 값을 가지는 평활화계수를 이용하여 특정 주파수빈 또는 특정 주파수대역에 적용하려는 평활화된 크기조정이득을 계산하도록 구성되는, 음성 신호의 잡음 억제 기기.
- 제52항 내지 제54항 중 어느 한 항에 있어서, 상기 기기는 크기조정이득의 값들이 작을수록 평활화가 더 강해지도록 결정된 값을 가지는 평활화계수를 이용하여 특정 주파수빈 또는 특정 주파수대역에 적용하려는 평활화된 크기조정이득을 계산하도록 구성되는, 음성 신호의 잡음 억제 기기.
- 제53항 또는 제54항에 있어서, 상기 기기는 크기조정이득의 값을 음성프레임당 n번 결정하도록 구성되며 n은 1보다 큰, 음성 신호의 잡음 억제 기기.
- 제63항에 있어서, n = 2인, 음성 신호의 잡음 억제 기기.
- 제53항 또는 제54항에 있어서, 상기 기기는 크기조정이득의 값을 음성프레임당 n번 결정하도록 구성되며, n은 1보다 크고, 발성 차단주파수는 적어도 부분적으로는 이전 음성프레임의 음성신호의 함수인, 음성 신호의 잡음 억제 기기.
- 제53항에 있어서, 상기 기기는 17개 대역에 상응하는 최대 74개 빈들에 대해 주파수빈마다 잡음 억제를 수행하도록 구성되는, 음성 신호의 잡음 억제 기기.
- 제53항에 있어서, 상기 기기는 주파수 3700Hz에 상응하는 최대 수의 주파수빈들에 대해 주파수빈마다 잡음 억제를 수행하도록 구성되는, 음성 신호의 잡음 억제 기기.
- 제56항에 있어서, 상기 기기는 제1 SNR값에 대해, 크기조정이득의 값을 최소값으로 설정하도록, 그리고 제1 SNR값보다 큰 제2 SNR값에 대해 크기조정이득 값을 1로 설정하도록 구성되는, 음성 신호의 잡음 억제 기기.
- 제68항에 있어서, 상기 제1 SNR값은 1dB 이하이고, 상기 제2 SNR값은 45dB 이상인, 음성 신호의 잡음 억제 기기.
- 제60항에 있어서, 상기 기기는 활동적 음성을 담고 있지 않은 음성 프레임의 구역들을 검출하도록 구성되는, 음성 신호의 잡음 억제 기기.
- 제70항에 있어서, 상기 기기는 활동적 음성을 담고 있지 않은 음성 프레임의 구역을 검출하는 것에 응답하여 평활화된 크기조정이득을 최소값으로 재설정하도록 구성되는, 음성 신호의 잡음 억제 기기.
- 제47항에 있어서, 상기 기기는 복수의 주파수대역들에서 최대 잡음에너지가 문턱값 미만일 때에 잡음 억제를 수행하지 않도록 구성되는, 음성 신호의 잡음 억제 기기.
- 제47항에 있어서, 단기잔류 음성프레임의 발생에 응답하여, 제1 x개 주파수대역들에 대해 주파수대역마다 결정되는 크기조정이득을 적용함으로써 잡음 억제를 수행하도록 그리고 나머지 주파수대역들에 대해 크기조정이득의 단일 값을 적용함으로써 잡음 억제를 수행하도록 구성되는, 음성 신호의 잡음 억제 기기.
- 제73항에 있어서, 제1 x개 주파수대역들은 1700Hz까지의 주파수에 상응하는, 음성 신호의 잡음 억제 기기.
- 제60항에 있어서, 협대역 음성신호에 대해 상기 기기는 3700Hz까지의 주파수에 상응하는 제1 x개 주파수대역들에 대해 주파수대역마다 결정되는 평활화된 크기조정이득들을 적용함으로써 잡음 억제를 수행하도록, 3700Hz에 상응하는 주파수빈에서의 크기조정이득의 값을 3700Hz와 4000Hz 사이의 주파수빈들에 적용함으로써 잡음 억제를 수행하도록, 그리고 음성신호의 주파수 스펙트럼의 나머지 주파수대역들을 제로화하도록 구성되는, 음성 신호의 잡음 억제 기기.
- 제75항에 있어서, 협대역 음성신호는 12800Hz로 업샘플링된 것인, 음성 신호의 잡음 억제 기기.
- 제43항에 있어서, 상기 기기는 계산된 발성 계량값을 이용하여 발성 차단주파수를 결정하도록 구성되는, 음성 신호의 잡음 억제 기기.
- 제77항에 있어서, 상기 기기는 상기 발성 차단주파수를 초과하지 않는 상위주파수를 가지는 다수의 임계대역을 결정하도록 구성되며, 경계들은 주파수빈마다의 잡음 억제가 최소 x개 대역 및 최대 y개 대역들에 대해 수행되도록 설정되는, 음성 신호의 잡음 억제 기기.
- 제78항에 있어서, x = 3이고 y = 17인, 음성 신호의 잡음 억제 기기.
- 제77항에 있어서, 상기 발성 차단주파수는 325Hz 이상이고 3700Hz 이하가 되도록 경계가 정해지는, 음성 신호의 잡음 억제 기기.
- 잡음 억제를 위한 기기를 포함하는 음성 부호화기로서, 상기 기기는,주파수 분석을 수행하여 복수의 주파수빈들을 포함하는 음성신호의 스펙트럼영역 표현을 생성하도록; 그리고주파수빈들을 다수의 주파수대역들로 그룹화하도록 구성되며,상기 기기는 발성된 음성 활동도를 검출하도록 구성되며, 발성된 음성 활동도가 음성 프레임에서 검출될 때, 잡음 억제를 제1수의 주파수대역들에 대해 주파수빈마다 수행하고 잡음 억제를 제2수의 주파수대역들에 대해 주파수대역마다 수행하는 것을 특징으로 하는 음성 부호화기.
- 잡음 억제를 위한 기기를 포함하는 자동 음성인식 시스템으로서, 상기 기기는주파수 분석을 수행하여 복수의 주파수빈들을 포함하는 음성신호의 스펙트럼영역 표현을 생성하도록; 그리고주파수빈들을 다수의 주파수대역들로 그룹화하도록 구성되며,상기 기기는 발성된 음성 활동도를 검출하도록 구성되며, 발성된 음성 활동도가 음성 프레임에서 검출될 때, 잡음 억제를 제1수의 주파수대역들에 대해 주파수빈마다 수행하고 잡음 억제를 제2수의 주파수대역들에 대해 주파수대역마다 수행하는 것을 특징으로 하는 자동 음성인식 시스템.
- 잡음 억제를 위한 기기를 포함하는 이동전화기로서, 상기 기기는주파수 분석을 수행하여 복수의 주파수빈들을 포함하는 음성신호의 스펙트럼영역 표현을 생성하도록; 그리고주파수빈들을 다수의 주파수대역들로 그룹화하도록 구성되며,상기 기기는 발성된 음성 활동도를 검출하도록 구성되며, 발성된 음성 활동도가 음성 프레임에서 검출될 때, 제1수의 주파수대역들에 대해 잡음 억제를 주파수빈마다 수행하고 제2수의 주파수대역들에 대해 주파수대역마다 잡음 억제를 수행하도록 구성되는 이동전화기.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CA002454296A CA2454296A1 (en) | 2003-12-29 | 2003-12-29 | Method and device for speech enhancement in the presence of background noise |
CA2454296 | 2003-12-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20060128983A KR20060128983A (ko) | 2006-12-14 |
KR100870502B1 true KR100870502B1 (ko) | 2008-11-25 |
Family
ID=34683070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020067015437A KR100870502B1 (ko) | 2003-12-29 | 2004-12-29 | 배경잡음의 존재하에 음성 강화를 위한 방법 및 기기 |
Country Status (19)
Country | Link |
---|---|
US (1) | US8577675B2 (ko) |
EP (1) | EP1700294B1 (ko) |
JP (1) | JP4440937B2 (ko) |
KR (1) | KR100870502B1 (ko) |
CN (1) | CN100510672C (ko) |
AT (1) | ATE441177T1 (ko) |
AU (1) | AU2004309431C1 (ko) |
BR (1) | BRPI0418449A (ko) |
CA (2) | CA2454296A1 (ko) |
DE (1) | DE602004022862D1 (ko) |
ES (1) | ES2329046T3 (ko) |
HK (1) | HK1099946A1 (ko) |
MX (1) | MXPA06007234A (ko) |
MY (1) | MY141447A (ko) |
PT (1) | PT1700294E (ko) |
RU (1) | RU2329550C2 (ko) |
TW (1) | TWI279776B (ko) |
WO (1) | WO2005064595A1 (ko) |
ZA (1) | ZA200606215B (ko) |
Families Citing this family (92)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7113580B1 (en) * | 2004-02-17 | 2006-09-26 | Excel Switching Corporation | Method and apparatus for performing conferencing services and echo suppression |
JP5230103B2 (ja) * | 2004-02-18 | 2013-07-10 | ニュアンス コミュニケーションズ,インコーポレイテッド | 自動音声認識器のためのトレーニングデータを生成する方法およびシステム |
DE102004049347A1 (de) * | 2004-10-08 | 2006-04-20 | Micronas Gmbh | Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale |
NZ562182A (en) * | 2005-04-01 | 2010-03-26 | Qualcomm Inc | Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal |
TWI324336B (en) | 2005-04-22 | 2010-05-01 | Qualcomm Inc | Method of signal processing and apparatus for gain factor smoothing |
JP4765461B2 (ja) * | 2005-07-27 | 2011-09-07 | 日本電気株式会社 | 雑音抑圧システムと方法及びプログラム |
US7366658B2 (en) * | 2005-12-09 | 2008-04-29 | Texas Instruments Incorporated | Noise pre-processor for enhanced variable rate speech codec |
US7930178B2 (en) * | 2005-12-23 | 2011-04-19 | Microsoft Corporation | Speech modeling and enhancement based on magnitude-normalized spectra |
US9185487B2 (en) | 2006-01-30 | 2015-11-10 | Audience, Inc. | System and method for providing noise suppression utilizing null processing noise subtraction |
US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
US7593535B2 (en) * | 2006-08-01 | 2009-09-22 | Dts, Inc. | Neural network filtering techniques for compensating linear and non-linear distortion of an audio transducer |
CN101246688B (zh) * | 2007-02-14 | 2011-01-12 | 华为技术有限公司 | 一种对背景噪声信号进行编解码的方法、系统和装置 |
US8195454B2 (en) * | 2007-02-26 | 2012-06-05 | Dolby Laboratories Licensing Corporation | Speech enhancement in entertainment audio |
JP5186510B2 (ja) * | 2007-03-19 | 2013-04-17 | ドルビー ラボラトリーズ ライセンシング コーポレイション | スピーチ明瞭度強化方法と装置 |
CN101320559B (zh) * | 2007-06-07 | 2011-05-18 | 华为技术有限公司 | 一种声音激活检测装置及方法 |
US8990073B2 (en) * | 2007-06-22 | 2015-03-24 | Voiceage Corporation | Method and device for sound activity detection and sound signal classification |
US8891778B2 (en) | 2007-09-12 | 2014-11-18 | Dolby Laboratories Licensing Corporation | Speech enhancement |
JPWO2009051132A1 (ja) * | 2007-10-19 | 2011-03-03 | 日本電気株式会社 | 信号処理システムと、その装置、方法及びそのプログラム |
US8688441B2 (en) * | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
US8560307B2 (en) | 2008-01-28 | 2013-10-15 | Qualcomm Incorporated | Systems, methods, and apparatus for context suppression using receivers |
US8433582B2 (en) * | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US20090201983A1 (en) * | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
RU2470385C2 (ru) * | 2008-03-05 | 2012-12-20 | Войсэйдж Корпорейшн | Система и способ улучшения декодированного тонального звукового сигнала |
CN101483042B (zh) * | 2008-03-20 | 2011-03-30 | 华为技术有限公司 | 一种噪声生成方法以及噪声生成装置 |
US8606573B2 (en) * | 2008-03-28 | 2013-12-10 | Alon Konchitsky | Voice recognition improved accuracy in mobile environments |
KR101317813B1 (ko) * | 2008-03-31 | 2013-10-15 | (주)트란소노 | 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터판독 가능한 기록매체 |
US9142221B2 (en) * | 2008-04-07 | 2015-09-22 | Cambridge Silicon Radio Limited | Noise reduction |
US9253568B2 (en) * | 2008-07-25 | 2016-02-02 | Broadcom Corporation | Single-microphone wind noise suppression |
US8515097B2 (en) * | 2008-07-25 | 2013-08-20 | Broadcom Corporation | Single microphone wind noise suppression |
US8463412B2 (en) * | 2008-08-21 | 2013-06-11 | Motorola Mobility Llc | Method and apparatus to facilitate determining signal bounding frequencies |
US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
EP2416315B1 (en) * | 2009-04-02 | 2015-05-20 | Mitsubishi Electric Corporation | Noise suppression device |
JP5648052B2 (ja) * | 2009-07-07 | 2015-01-07 | コーニンクレッカ フィリップス エヌ ヴェ | 呼吸信号のノイズ低減 |
CA2778343A1 (en) * | 2009-10-19 | 2011-04-28 | Martin Sehlstedt | Method and voice activity detector for a speech encoder |
EP2491559B1 (en) * | 2009-10-19 | 2014-12-10 | Telefonaktiebolaget LM Ericsson (publ) | Method and background estimator for voice activity detection |
US9838784B2 (en) | 2009-12-02 | 2017-12-05 | Knowles Electronics, Llc | Directional audio capture |
CA3225485A1 (en) | 2010-01-19 | 2011-07-28 | Dolby International Ab | Improved subband block based harmonic transposition |
PL2532002T3 (pl) * | 2010-03-09 | 2014-06-30 | Fraunhofer Ges Forschung | Urządzenie, sposób i program komputerowy do przetwarzania sygnału audio |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
KR101176207B1 (ko) * | 2010-10-18 | 2012-08-28 | (주)트란소노 | 음성통신 시스템 및 음성통신 방법 |
KR101173980B1 (ko) | 2010-10-18 | 2012-08-16 | (주)트란소노 | 음성통신 기반 잡음 제거 시스템 및 그 방법 |
US8831937B2 (en) * | 2010-11-12 | 2014-09-09 | Audience, Inc. | Post-noise suppression processing to improve voice quality |
EP2458586A1 (en) * | 2010-11-24 | 2012-05-30 | Koninklijke Philips Electronics N.V. | System and method for producing an audio signal |
HUE053127T2 (hu) | 2010-12-24 | 2021-06-28 | Huawei Tech Co Ltd | Eljárás és berendezés hang aktivitás adaptív detektálására egy bemeneti audiójelben |
KR20120080409A (ko) * | 2011-01-07 | 2012-07-17 | 삼성전자주식회사 | 잡음 구간 판별에 의한 잡음 추정 장치 및 방법 |
EP2663903A1 (de) * | 2011-01-11 | 2013-11-20 | Siemens Aktiengesellschaft | Verfahren und vorrichtung zur filterung eines signals und regeleinrichtung für einen prozess |
US8650029B2 (en) * | 2011-02-25 | 2014-02-11 | Microsoft Corporation | Leveraging speech recognizer feedback for voice activity detection |
WO2012153165A1 (en) * | 2011-05-06 | 2012-11-15 | Nokia Corporation | A pitch estimator |
TWI459381B (zh) * | 2011-09-14 | 2014-11-01 | Ind Tech Res Inst | 語音增強方法 |
US8712076B2 (en) | 2012-02-08 | 2014-04-29 | Dolby Laboratories Licensing Corporation | Post-processing including median filtering of noise suppression gains |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
EP3288033B1 (en) | 2012-02-23 | 2019-04-10 | Dolby International AB | Methods and systems for efficient recovery of high frequency audio content |
CN103325380B (zh) | 2012-03-23 | 2017-09-12 | 杜比实验室特许公司 | 用于信号增强的增益后处理 |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
EP2786376A1 (en) | 2012-11-20 | 2014-10-08 | Unify GmbH & Co. KG | Method, device, and system for audio data processing |
JP6335190B2 (ja) | 2012-12-21 | 2018-05-30 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加 |
CN103886867B (zh) * | 2012-12-21 | 2017-06-27 | 华为技术有限公司 | 一种噪声抑制装置及其方法 |
US9495951B2 (en) * | 2013-01-17 | 2016-11-15 | Nvidia Corporation | Real time audio echo and background noise reduction for a mobile device |
CN105264597B (zh) | 2013-01-29 | 2019-12-10 | 弗劳恩霍夫应用研究促进协会 | 感知转换音频编码中的噪声填充 |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
JP6303340B2 (ja) | 2013-08-30 | 2018-04-04 | 富士通株式会社 | 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム |
KR20150032390A (ko) * | 2013-09-16 | 2015-03-26 | 삼성전자주식회사 | 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법 |
DE102013111784B4 (de) * | 2013-10-25 | 2019-11-14 | Intel IP Corporation | Audioverarbeitungsvorrichtungen und audioverarbeitungsverfahren |
US9449609B2 (en) * | 2013-11-07 | 2016-09-20 | Continental Automotive Systems, Inc. | Accurate forward SNR estimation based on MMSE speech probability presence |
US9449610B2 (en) * | 2013-11-07 | 2016-09-20 | Continental Automotive Systems, Inc. | Speech probability presence modifier improving log-MMSE based noise suppression performance |
US9449615B2 (en) * | 2013-11-07 | 2016-09-20 | Continental Automotive Systems, Inc. | Externally estimated SNR based modifiers for internal MMSE calculators |
CN104681034A (zh) | 2013-11-27 | 2015-06-03 | 杜比实验室特许公司 | 音频信号处理 |
GB2523984B (en) * | 2013-12-18 | 2017-07-26 | Cirrus Logic Int Semiconductor Ltd | Processing received speech data |
CN107293287B (zh) | 2014-03-12 | 2021-10-26 | 华为技术有限公司 | 检测音频信号的方法和装置 |
US10176823B2 (en) * | 2014-05-09 | 2019-01-08 | Apple Inc. | System and method for audio noise processing and noise reduction |
KR20160000680A (ko) * | 2014-06-25 | 2016-01-05 | 주식회사 더바인코퍼레이션 | 광대역 보코더용 휴대폰 명료도 향상장치와 이를 이용한 음성출력장치 |
US9870780B2 (en) | 2014-07-29 | 2018-01-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Estimation of background noise in audio signals |
DE112015003945T5 (de) | 2014-08-28 | 2017-05-11 | Knowles Electronics, Llc | Mehrquellen-Rauschunterdrückung |
DE112015004185T5 (de) | 2014-09-12 | 2017-06-01 | Knowles Electronics, Llc | Systeme und Verfahren zur Wiederherstellung von Sprachkomponenten |
US9947318B2 (en) * | 2014-10-03 | 2018-04-17 | 2236008 Ontario Inc. | System and method for processing an audio signal captured from a microphone |
US9886966B2 (en) * | 2014-11-07 | 2018-02-06 | Apple Inc. | System and method for improving noise suppression using logistic function and a suppression target value for automatic speech recognition |
TWI569263B (zh) | 2015-04-30 | 2017-02-01 | 智原科技股份有限公司 | 聲頻訊號的訊號擷取方法與裝置 |
JP6289774B2 (ja) * | 2015-12-01 | 2018-03-07 | 三菱電機株式会社 | 音声認識装置、音声強調装置、音声認識方法、音声強調方法およびナビゲーションシステム |
US9820042B1 (en) | 2016-05-02 | 2017-11-14 | Knowles Electronics, Llc | Stereo separation and directional suppression with omni-directional microphones |
CN108022595A (zh) * | 2016-10-28 | 2018-05-11 | 电信科学技术研究院 | 一种语音信号降噪方法和用户终端 |
CN106782504B (zh) * | 2016-12-29 | 2019-01-22 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
WO2019068915A1 (en) * | 2017-10-06 | 2019-04-11 | Sony Europe Limited | AUDIO FILE ENVELOPE BASED ON RMS POWER IN SUB-WINDOW SEQUENCES |
US10771621B2 (en) * | 2017-10-31 | 2020-09-08 | Cisco Technology, Inc. | Acoustic echo cancellation based sub band domain active speaker detection for audio and video conferencing applications |
RU2701120C1 (ru) * | 2018-05-14 | 2019-09-24 | Федеральное государственное казенное военное образовательное учреждение высшего образования "Военный учебно-научный центр Военно-Морского Флота "Военно-морская академия имени Адмирала флота Советского Союза Н.Г. Кузнецова" | Устройство для обработки речевого сигнала |
US10681458B2 (en) * | 2018-06-11 | 2020-06-09 | Cirrus Logic, Inc. | Techniques for howling detection |
KR102327441B1 (ko) * | 2019-09-20 | 2021-11-17 | 엘지전자 주식회사 | 인공지능 장치 |
US11217262B2 (en) * | 2019-11-18 | 2022-01-04 | Google Llc | Adaptive energy limiting for transient noise suppression |
US11374663B2 (en) * | 2019-11-21 | 2022-06-28 | Bose Corporation | Variable-frequency smoothing |
US11264015B2 (en) | 2019-11-21 | 2022-03-01 | Bose Corporation | Variable-time smoothing for steady state noise estimation |
CN111429932A (zh) * | 2020-06-10 | 2020-07-17 | 浙江远传信息技术股份有限公司 | 语音降噪方法、装置、设备及介质 |
CN112634929B (zh) * | 2020-12-16 | 2024-07-23 | 普联国际有限公司 | 一种语音增强方法、装置及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6317709B1 (en) * | 1998-06-22 | 2001-11-13 | D.S.P.C. Technologies Ltd. | Noise suppressor having weighted gain smoothing |
US20020002455A1 (en) * | 1998-01-09 | 2002-01-03 | At&T Corporation | Core estimator and adaptive gains from signal to noise ratio in a hybrid speech enhancement system |
JP2002149200A (ja) * | 2000-08-31 | 2002-05-24 | Matsushita Electric Ind Co Ltd | 音声処理装置及び音声処理方法 |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57161800A (en) * | 1981-03-30 | 1982-10-05 | Toshiyuki Sakai | Voice information filter |
AU633673B2 (en) * | 1990-01-18 | 1993-02-04 | Matsushita Electric Industrial Co., Ltd. | Signal processing device |
US5432859A (en) * | 1993-02-23 | 1995-07-11 | Novatel Communications Ltd. | Noise-reduction system |
JP3297307B2 (ja) * | 1996-06-14 | 2002-07-02 | 沖電気工業株式会社 | 背景雑音消去装置 |
US6098038A (en) * | 1996-09-27 | 2000-08-01 | Oregon Graduate Institute Of Science & Technology | Method and system for adaptive speech enhancement using frequency specific signal-to-noise ratio estimates |
US6097820A (en) * | 1996-12-23 | 2000-08-01 | Lucent Technologies Inc. | System and method for suppressing noise in digitally represented voice signals |
US6456965B1 (en) * | 1997-05-20 | 2002-09-24 | Texas Instruments Incorporated | Multi-stage pitch and mixed voicing estimation for harmonic speech coders |
US6044341A (en) * | 1997-07-16 | 2000-03-28 | Olympus Optical Co., Ltd. | Noise suppression apparatus and recording medium recording processing program for performing noise removal from voice |
US7209567B1 (en) * | 1998-07-09 | 2007-04-24 | Purdue Research Foundation | Communication system with adaptive noise suppression |
US6351731B1 (en) * | 1998-08-21 | 2002-02-26 | Polycom, Inc. | Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6233549B1 (en) * | 1998-11-23 | 2001-05-15 | Qualcomm, Inc. | Low frequency spectral enhancement system and method |
US6363345B1 (en) * | 1999-02-18 | 2002-03-26 | Andrea Electronics Corporation | System, method and apparatus for cancelling noise |
US6618701B2 (en) * | 1999-04-19 | 2003-09-09 | Motorola, Inc. | Method and system for noise suppression using external voice activity detection |
JP4242516B2 (ja) | 1999-07-26 | 2009-03-25 | パナソニック株式会社 | サブバンド符号化方式 |
FI116643B (fi) * | 1999-11-15 | 2006-01-13 | Nokia Corp | Kohinan vaimennus |
CA2290037A1 (en) * | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
US6366880B1 (en) * | 1999-11-30 | 2002-04-02 | Motorola, Inc. | Method and apparatus for suppressing acoustic background noise in a communication system by equaliztion of pre-and post-comb-filtered subband spectral energies |
US7058572B1 (en) * | 2000-01-28 | 2006-06-06 | Nortel Networks Limited | Reducing acoustic noise in wireless and landline based telephony |
US6704711B2 (en) * | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
US6898566B1 (en) * | 2000-08-16 | 2005-05-24 | Mindspeed Technologies, Inc. | Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal |
US6862567B1 (en) * | 2000-08-30 | 2005-03-01 | Mindspeed Technologies, Inc. | Noise suppression in the frequency domain by adjusting gain according to voicing parameters |
US6947888B1 (en) * | 2000-10-17 | 2005-09-20 | Qualcomm Incorporated | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
US6925435B1 (en) | 2000-11-27 | 2005-08-02 | Mindspeed Technologies, Inc. | Method and apparatus for improved noise reduction in a speech encoder |
JP4282227B2 (ja) * | 2000-12-28 | 2009-06-17 | 日本電気株式会社 | ノイズ除去の方法及び装置 |
US7155385B2 (en) * | 2002-05-16 | 2006-12-26 | Comerica Bank, As Administrative Agent | Automatic gain control for adjusting gain during non-speech portions |
US7492889B2 (en) * | 2004-04-23 | 2009-02-17 | Acoustic Technologies, Inc. | Noise suppression based on bark band wiener filtering and modified doblinger noise estimate |
-
2003
- 2003-12-29 CA CA002454296A patent/CA2454296A1/en not_active Abandoned
-
2004
- 2004-12-22 US US11/021,938 patent/US8577675B2/en active Active
- 2004-12-27 TW TW093140706A patent/TWI279776B/zh active
- 2004-12-27 MY MYPI20045377A patent/MY141447A/en unknown
- 2004-12-29 CN CNB2004800417014A patent/CN100510672C/zh active Active
- 2004-12-29 RU RU2006126530/09A patent/RU2329550C2/ru active
- 2004-12-29 ES ES04802378T patent/ES2329046T3/es active Active
- 2004-12-29 CA CA2550905A patent/CA2550905C/en active Active
- 2004-12-29 MX MXPA06007234A patent/MXPA06007234A/es active IP Right Grant
- 2004-12-29 DE DE602004022862T patent/DE602004022862D1/de active Active
- 2004-12-29 PT PT04802378T patent/PT1700294E/pt unknown
- 2004-12-29 JP JP2006545874A patent/JP4440937B2/ja active Active
- 2004-12-29 WO PCT/CA2004/002203 patent/WO2005064595A1/en active Application Filing
- 2004-12-29 EP EP04802378A patent/EP1700294B1/en active Active
- 2004-12-29 AU AU2004309431A patent/AU2004309431C1/en active Active
- 2004-12-29 AT AT04802378T patent/ATE441177T1/de not_active IP Right Cessation
- 2004-12-29 BR BRPI0418449-1A patent/BRPI0418449A/pt not_active Application Discontinuation
- 2004-12-29 KR KR1020067015437A patent/KR100870502B1/ko active IP Right Grant
-
2006
- 2006-07-27 ZA ZA200606215A patent/ZA200606215B/xx unknown
-
2007
- 2007-07-13 HK HK07107508.3A patent/HK1099946A1/xx unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020002455A1 (en) * | 1998-01-09 | 2002-01-03 | At&T Corporation | Core estimator and adaptive gains from signal to noise ratio in a hybrid speech enhancement system |
US6317709B1 (en) * | 1998-06-22 | 2001-11-13 | D.S.P.C. Technologies Ltd. | Noise suppressor having weighted gain smoothing |
JP2002149200A (ja) * | 2000-08-31 | 2002-05-24 | Matsushita Electric Ind Co Ltd | 音声処理装置及び音声処理方法 |
US20030023430A1 (en) * | 2000-08-31 | 2003-01-30 | Youhua Wang | Speech processing device and speech processing method |
Also Published As
Publication number | Publication date |
---|---|
WO2005064595A1 (en) | 2005-07-14 |
JP2007517249A (ja) | 2007-06-28 |
MY141447A (en) | 2010-04-30 |
MXPA06007234A (es) | 2006-08-18 |
AU2004309431B2 (en) | 2008-10-02 |
RU2006126530A (ru) | 2008-02-10 |
CA2454296A1 (en) | 2005-06-29 |
EP1700294B1 (en) | 2009-08-26 |
EP1700294A1 (en) | 2006-09-13 |
BRPI0418449A (pt) | 2007-05-22 |
RU2329550C2 (ru) | 2008-07-20 |
TWI279776B (en) | 2007-04-21 |
DE602004022862D1 (de) | 2009-10-08 |
AU2004309431C1 (en) | 2009-03-19 |
AU2004309431A1 (en) | 2005-07-14 |
ATE441177T1 (de) | 2009-09-15 |
CA2550905C (en) | 2010-12-14 |
US20050143989A1 (en) | 2005-06-30 |
HK1099946A1 (en) | 2007-08-31 |
PT1700294E (pt) | 2009-09-28 |
TW200531006A (en) | 2005-09-16 |
US8577675B2 (en) | 2013-11-05 |
KR20060128983A (ko) | 2006-12-14 |
CN100510672C (zh) | 2009-07-08 |
CN1918461A (zh) | 2007-02-21 |
ZA200606215B (en) | 2007-11-28 |
EP1700294A4 (en) | 2007-02-28 |
CA2550905A1 (en) | 2005-07-14 |
JP4440937B2 (ja) | 2010-03-24 |
ES2329046T3 (es) | 2009-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100870502B1 (ko) | 배경잡음의 존재하에 음성 강화를 위한 방법 및 기기 | |
JP5395066B2 (ja) | 音声区間検出および音声信号分類ための方法および装置 | |
Ris et al. | Assessing local noise level estimation methods: Application to noise robust ASR | |
JP5247826B2 (ja) | 復号化音調音響信号を増強するためのシステムおよび方法 | |
Ibrahim | Preprocessing technique in automatic speech recognition for human computer interaction: an overview | |
US10783899B2 (en) | Babble noise suppression | |
WO2002029782A1 (en) | Perceptual harmonic cepstral coefficients as the front-end for speech recognition | |
US6996524B2 (en) | Speech enhancement device | |
Jelinek et al. | Noise reduction method for wideband speech coding | |
Kim et al. | Speech enhancement of noisy speech using log-spectral amplitude estimator and harmonic tunneling | |
KR20180010115A (ko) | 스피치를 향상하는 장치 | |
JPH1097288A (ja) | 背景雑音除去装置及び音声認識装置 | |
Hayashi et al. | A subtractive-type speech enhancement using the perceptual frequency-weighting function | |
Kim et al. | Speech enhancement in non-stationary noise environments. | |
Moharir et al. | Spectral enhancement preprocessing for the HNM coding of noisy speech. | |
Kim et al. | Enhancement of noisy speech for noise robust front-end and speech reconstruction at back-end of DSR system. | |
Hayashi et al. | Single channel speech enhancement based on perceptual frequency-weighting | |
Shahnaz et al. | An Approach for Pitch Estimation from Noisy Speech | |
Choi et al. | Efficient Speech Reinforcement Based on Low-Bit-Rate Speech Coding Parameters |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20121031 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20131101 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20141107 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20151016 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20161019 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20171018 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20181018 Year of fee payment: 11 |