KR100330230B1 - 잡음 억제 방법 및 장치 - Google Patents
잡음 억제 방법 및 장치 Download PDFInfo
- Publication number
- KR100330230B1 KR100330230B1 KR1020007005629A KR20007005629A KR100330230B1 KR 100330230 B1 KR100330230 B1 KR 100330230B1 KR 1020007005629 A KR1020007005629 A KR 1020007005629A KR 20007005629 A KR20007005629 A KR 20007005629A KR 100330230 B1 KR100330230 B1 KR 100330230B1
- Authority
- KR
- South Korea
- Prior art keywords
- noise
- input signal
- signal
- band spectrum
- recognizable
- Prior art date
Links
- 230000001629 suppression Effects 0.000 title claims abstract description 57
- 238000001228 spectrum Methods 0.000 claims abstract description 82
- 230000003595 spectral effect Effects 0.000 claims abstract description 65
- 238000000034 method Methods 0.000 claims abstract description 54
- 230000004044 response Effects 0.000 claims abstract description 53
- 230000007774 longterm Effects 0.000 claims abstract description 15
- 238000007493 shaping process Methods 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 11
- 238000009499 grossing Methods 0.000 claims description 9
- 238000005311 autocorrelation function Methods 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 6
- 238000012935 Averaging Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000011045 prefiltration Methods 0.000 claims 2
- 230000007704 transition Effects 0.000 description 21
- 238000004364 calculation method Methods 0.000 description 11
- 238000005259 measurement Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 125000004122 cyclic group Chemical group 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000005314 correlation function Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000005534 acoustic noise Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000000465 moulding Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02168—Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Noise Elimination (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
본 발명은 잡음과 음성의 조합을 반송하는 입력 신호내의 잡음을 억제하는 방법 및 장치를 개시한다. 본 발명에서는 입력 신호를 신호 블록들로 분할하고, 이들 신호 블록들을 처리하여 입력 신호의 단기간 인지가능 대역 스펙트럼 추정치를 제공하고, 각종 시점에서 입력 신호가 잡음만의 신호를 반송하는지 또는 잡음과 음성의 조합을 반송하는지를 판단하여 입력 신호가 잡음만의 신호를 반송하는 경우 그에 대응하는 입력 신호의 단기간 인지가능 대역 스펙트럼 추정치를 사용해서 잡음의 장기간 인지가능 대역 스펙트럼 추정치를 갱신하고, 잡음의 장기간 인지가능 대역 스펙트럼 추정치와 입력 신호의 단기간 인지가능 대역 스펙트럼 추정치에 근거하여 잡음 억제 주파수 응답을 결정하며, 잡음 억제 주파수 응답에 따라 입력 신호의 현재 블록을 성형한다.
Description
본 발명의 기술적 배경은 다음의 종래 기술 문헌에서 볼 수 있다.
"ENHANCED VARIABLE RATE CODEC, SPEECH SERVICE OPTION 3 FOR WIDEBAND SPREAD SPECTRUM DIGITAL SYSTEM", TIA/EIA/IS-127 Standard.
"THE STUDY OF SPEECH/PAUSE DETECTORS FOR SPEECH ENHANCEMENT METHODS", P. Sovka and P. Pollak, Eurospeech 95 Madrid, 1995, pp. 1575-1578.
"SPEECH ENHANCEMENT USING A MINIMUM MEAN-SQUARE ERROR SHORT-TIME SPECTRAL AMPLITUDE ESTIMATOR", Y. Ephraim, D. Malah, IEEE Transactions on Acoustics Speech and Signal Processing, Vol. ASSP-32, No. 6, Dec. 1984, pp. 1105-1121.
"SUPPRESSION OF ACOUSTIC NOISE USING SPECTRAL SUBTRACTION", S. Boll, IEEE Transactions on Acoustics Speech and Signal Processing, Vol. ASSP-27, No. 2, April, 1979, pp. 113-120.
"STATICAL-MODEL-BASED ENHANCEMENT SYSTEMS", Proceedings of the IEEE, Vol. 80, No. 10, October 1992, pp. 1526-1544.
복잡도가 낮은 잡음 억제 알고리즘으로서는 스펙트럼 변형 기법(이 기법은 스펙트럼 감법으로서도 알려져 있음)을 사용하는 것이 있다. 이와 같이 스펙트럼 변형 기법을 사용하는 잡음 억제 알고리즘에서는, 먼저 잡음이 있는 함유(이하에서는 간단히 “잡음 함유”라고 함)(noisy) 음성 신호를 수개의 주파수 대역으로 분할하고, 그다음 전형적으로 그 대역에서 추정되는 신호 대 잡음 비를 기초로 하는 이득을 각 대역에 대해 계산하며, 그다음 이들 이득을 적용하여 신호를 재계산한다. 이같은 유형의 방식에서는 그 관찰하는 잡음 함유 음성 신호로부터 신호 및 잡음 특성을 추정해야만 한다. 스펙트럼 변형 기법의 수개의 구현예는 다음과 같은 미국 특허들 즉, 5,687,285; 5,680,393; 5,668,927; 5,659,622; 5,651,071; 5,630,015; 5,625,684; 5,621,850; 5,617,505; 5,617,472; 5,602,962; 5,577,161; 5,555,287; 5,550,924; 5,544,250; 5,539,859; 5,533,133; 5,530,768; 5,479,560; 5,432,859; 5,406,635; 5,402,496; 5,388,182; 5,388,160; 5,353,376; 5,319,736; 5,278,780; 5,251,263; 5,168,526; 5,133,013; 5,081,681; 5,040,156; 5,012,519; 4,908,855; 4,897,878; 4,811,404; 4,747,143; 4,737,976; 4,630,305; 4,630,304; 4,628,529; 4,468,804에서 볼 수 있다.
스펙트럼 변형 기법은 수개의 바람직한 특성을 가진다. 첫째, 그 기법은 적응적이어서, 잡음 환경 변화에 대응할 수 있다. 둘째, 대다수의 계산을 이산 푸리에 변환(discrete Fourier transform: DFT) 도메인에서 수행할 수 있다. 따라서, (고속 푸리에 변환(fast Fourier transform: FFT)과 같은) 고속 알고리즘을 사용할 수 있다.
그러나, 현재의 기술 수준에서는 수개의 단점이 존재하는데, 이들 단점의 예로서는 다음과 같은 것들이 있다.
(ⅰ) 높은 잡음 레벨을 적절하게 조절할 때 원하는 음성 신호의 바람직하지 못한 왜곡(이러한 왜곡의 원인으로서는 수개가 존재하는데, 이들 중의 몇 개에 대해서는 후술하겠다.).
(ⅱ) 과도한 계산상의 복잡도.
본 발명은 비트 전송 속도가 낮은 음성 코더(low-bitrate speech coder)에 대한 프론트 엔드(front end)로서 사용하는데 적합한 잡음 억제 기법(noise suppression technique)에 관한 것으로서, 본 발명의 잡음 억제 기법은 셀룰러 전화 분야(cellular telephony application)에 사용하기에 특히 적합하다.
도 1은 본 발명에 따른 잡음 억제 알고리즘의 블록도
도 2는 본 발명에 따른 입력 신호 처리 블록을 도시한 도면
도 3은 이산 푸리에 변환(DFT) 빈들을 가지며 서로 다른 대역폭을 가진 각종 잡음 스펙트럼 대역(NS 대역)들간의 상관관계를 도시한 도면
도 4는 음성/중지 검출부의 한 가지 가능한 실시 예에 대한 블록도
도 5는 잡음 함유 음성의 에너지 지수의 일 예를 제공하는 파형도
도 6은 잡음 함유 음성의 스펙트럼 전이 지수의 일 예를 제공하는 파형도
도 7은 잡음 함유 음성의 유사 지수의 일 예를 제공하는 파형도
도 8은 잡음 함유 음성 신호를 모델링 하는 단일-상태 기계를 도시한 도면
도 9는 구분적-일정 주파수 응답을 도시한 도면
도 10은 도 9에 도시한 구분적-일정 주파수 응답에 대한 평활화를 도시한 도면
따라서, 종래 기술의 문제점들을 해결할 수 있는 잡음 억제 기법을 제공하는 것이 바람직할 것이다. 특히, 블록 기반(block based) 잡음 억제 기법에서 전형적인 시간 도메인 불연속성을 감안한 잡음 억제 기법을 제공하는 것이 바람직할 것이다. 또한, 스펙트럼 감법에 내재하는 주파수 도메인 불연속성으로 인한 왜곡을 감소시키는 기법을 제공하는 것이 바람직할 것이다. 또한, 잡음 억제시의 스펙트럼 성형 동작의 복잡도를 감소시키고 잡음 억제 기법에서 추정한 잡음 통계의 신뢰도를 증가시키는 것이 바람직할 것이다.
따라서, 본 발명은 이들 및 기타 다른 장점을 가진 잡음 억제 기법을 제공하고자 하는 것이다.
본 발명에 따르면, 잡음 억제 기법이 제공되는데, 이 기법에서는 블록 기반 억제 기법에서 전형적인 시간 도메인 불연속성으로 인한 왜곡을 감소시킨다. 또한, 이 기법에서는, 스펙트럼 감법에서의 고유한 주파수 도메인 불연속으로 인한 왜곡도 감소시킴은 물론이고, 잡음 억제 프로세스에서 사용되는 스펙트럼 성형 처리의복잡성도 감소시킨다. 본 발명은 또한 개선된 음성 활성 검출부를 사용하여 추정 잡음 통계의 신뢰성을 증대시킨다.
본 발명에 일 실시예에 따른 잡음과 음성의 조합을 반송하는 입력 신호내의 잡음을 억제하는 방법에서는 입력 신호를 신호 블록들로 분할하고, 이들 신호 블록들을 처리하여 입력 신호의 단기간 인지가능 대역 스펙트럼 추정치(estimate of a short term perceptual band spectrum)를 제공하고, 각종 시점에서 입력 신호가 잡음만의 신호를 반송하는지 또는 잡음과 음성의 조합을 반송하는지를 판단하여 입력 신호가 잡음만의 신호를 반송하는 경우 그에 대응하는 입력 신호의 단기간 인지가능 대역 스펙트럼 추정치를 사용해서 잡음의 장기간 인지가능 대역 스펙트럼 추정치(estimate of a long term perceptual band spectrum)를 갱신하고, 잡음의 장기간 인지가능 대역 스펙트럼 추정치와 입력 신호의 단기간 인지가능 대역 스펙트럼 추정치에 근거하여 잡음 억제 주파수 응답을 결정하며, 잡음 억제 주파수 응답에 따라 입력 신호의 현재 블록을 성형한다.
본 발명의 방법은 입력 신호를 사전 필터링하여 그의 고주파수 응답 성분을 강조하는단계를 더 포함한다. 예시적인 실시예에서는, 입력 신호를 처리하는단계가 신호 블록들에 대해 이산 푸리에 변환을 적용하여 각 블록의 복소수값 주파수 도메인 표현을 제공하는단계와, 블록의 주파수 도메인 표현을 크기만의 신호로 변환하는단계와, 크기만의 신호들을 이산 주파수 대역들에 걸쳐 평균화하여 인지가능-대역 스펙트럼으로서 제공하는단계와, 인지가능-대역 스펙트럼의 시간 변동분들을 평활화하여 단기간 인지가능 대역 스펙트럼 추정치를 제공하는단계를 포함한다.
본 발명에서는, 잡음 억제 주파수 응답을 입력 신호의 현재 블록을 성형하는데 사용하기 위한 전극 필터(all-pole filter)를 사용하여 모델링할 수 있다.
본 발명의 다른 실시예에 따른 잡음과 음성의 조합을 반송하는 입력 신호내의 잡음을 억제하기 위한 장치는 입력 신호를 사전 필터링하여 그 신호의 고주파수 성분을 강조할 수 있는 것으로서 입력 신호를 블록들로 분할하는 신호 전처리부와, 블록들을 처리하여 입력 신호의 복소수값 주파수 도메인 스펙트럼을 제공하는 고속 푸리에 변환 처리기와, 복소수값 주파수 도메인 스펙트럼을 폭이 동일하지 않은 주파수 대역들을 포함하는 장기간 인지가능-대역 스펙트럼으로 누적시키는 누적기(accumulator)와, 장기간 인지가능-대역 스펙트럼을 필터링하여 장기간 인지가능-대역 스펙트럼의 현재 세그먼트와 잡음을 포함하는 단기간 인지가능-대역 스펙트럼의 추정치를 발생하는 필터와, 입력 신호가 소정 시점에서 잡음만 인지 또는 잡음과 음성의 조합인지를 판단하는 음성/중지 검출부(speech/pause detector)와, 입력 신호가 잡음만의 신호인 경우 음성/중지 검출부에 응답하여 입력 신호의 단기간 인지가능 대역 스펙트럼에 근거해서 잡음의 장기간 인지가능 대역 스펙트럼 추정치를 갱신하는 잡음 스펙트럼 추정기와, 잡음 스펙트럼 추정기에 응답하여 잡음 억제 주파수 응답을 결정하는 스펙트럼 이득 처리기와, 스펙트럼 이득 처리기에 응답하여 입력 신호의 현재 블록을 성형해서 그 신호 내의 잡음을 억제하는 스펙트럼 성형 처리기를 포함한다.
본 발명의 또 다른 실시예에 따른 잡음과 오디오 정보를 반송하는 입력 신호내의 잡음을 억제하는 방법은 주파수 도메인에서 입력 신호에 대한 잡음 억제 주파수 응답을 계산하는단계와, 그 계산된 잡음 억제 주파수 응답을 주파수 도메인에서 입력 신호에 대해 적용하여 입력 신호내의 잡음을 억제하는단계를 포함한다. 본 발명에 따른 방법은 입력 신호의 잡음 억제 주파수 응답을 계산하기 전에 입력 신호를 블록들로 분할하는단계를 더 포함한다. 예시적인 실시 예에서는, 잡음 억제 주파수 응답의 자기상관 함수(autocorrelation function)를 결정하는 것에 의해서 발생된 전극 필터를 사용하여 잡음 억제 주파수 응답을 입력 신호에 적용한다.
본 발명에 따른 잡음 억제 알고리즘에서는, 시변 필터 응답(time varying filter response)을 계산하여 그 결과를 잡음 함유 음성에 적용한다. 이 알고리즘의 블록도를 도 1에 도시한다. 도 1에서, "AR 파라미터 계산(AR parameter computation)" 블록 및 "AR 스펙트럼 성형(AR spectral shaping)" 블록은 시변 필터 응답의 적용에 관련되며, "AR"은 "자동-회귀(auto-regressive)"를 의미한다. 도 1의 다른 모든 블록은 잡음 음성으로부터의 시변 필터 응답을 계산하는 것에 대응한다.
신호 전처리부(preprocessor)(10)는 잡음 함유 입력 신호를 간단한 고역 통과 필터에 의해서 사전 처리하여 그 신호의 고주파수를 약간 강조한다. 전처리부는 그다음 그 필터링된 신호를 수개의 블록으로 분할하며, 이들 블록은 고속 푸리에 변환(FFT) 모듈(12)에 전달된다. FFT 모듈(12)은 그들 신호 블록에 윈도우(window)를 적용하고 또한 그 신호에 이산 푸리에 변환을 적용한다. 그 결과에 따른 복소수값의 주파수 도메인 표현(complex-valued frequency domain representation)은 소정의 처리를 통해 크기만의 신호(magnitude-only signal)로서 발생된다. 이들 크기만의 신호 값은 이산 주파수 대역(disjoint frequency band)들에서 평균화되어 "인지가능-대역 스펙트럼(perceptual-band spectrum)"으로서 발생된다. 이러한 평균화 처리는 처리해야만 하는 데이터의 양을 감소시킨다.
인지가능-대역 스펙트럼에서의 시간 변동은 신호/잡음 스펙트럼 추정 모듈(14)에서 평활화되어 입력 신호의 단기간 인지가능-대역 스펙트럼의 추정치로서 발생된다. 이 추정치는 음성/중지(speech/pause) 검출부(16), 잡음 스펙트럼 추정기(18) 및 스펙트럼 이득 계산 모듈(20)에 인가된다.
음성/중지 검출부(16)는 현대의 입력 신호가 단순히 잡음인지 또는 음성과 잡음이 조합된 것인지를 판단한다. 이러한 판단은 입력 음성 신호의 수개의 특성을 측정하고, 이들 측정치를 사용하여 입력 신호의 모델을 갱신하며, 이 모델의 상태를 이용해서 최종 음성/중지 판단을 행하는 식으로 이루어진다. 이러한 판단 결과는 그다음 잡음 스펙트럼 추정기에 전달된다.
음성/중지 검출부(16)에 의해 입력 신호가 잡음만으로 이루어져 있다고 판단되면, 잡음 스펙트럼 추정기(18)는 현재의 인지가능-대역 스펙트럼을 이용해서 잡음의 인지가능-대역 스펙트럼 추정치를 갱신한다. 또한, 잡음 스펙트럼 추정기의 어떤 파라미터들은 그 추정기 모듈에서 갱신되어 음성/중지 검출부(16)에 다시 전달된다. 잡음의 인지가능-대역 스펙트럼 추정치는 그다음 스펙트럼 이득 계산 모듈(20)에 전달된다.
스펙트럼 이득 계산 모듈(20)은 현재 신호의 인지가능-대역 스펙트럼 추정치와 잡음의 인지가능-대역 스펙트럼 추정치를 이용하여 잡음 억제 주파수 응답을 판단한다. 이 잡음 억제 주파수 응답은 도 9에 도시한 바와 같이 구분적-일정(piecewise-constant) 주파수 응답이다. 각각의 구분적-일정 세그먼트는 임계 대역 세그먼트의 한 요소에 대응한다. 이 주파수 응답은 AR 파라미터 계산 모듈(22)에 전달된다.
AR 파라미터 계산 모듈은 전극(all-pole) 필터에 의해 잡음 억제 주파수 응답을 모델링한다. 이 잡음 억제 주파수 응답은 구분적-일정 주파수 응답이기 때문에, 그의 자기-상관 함수(auto-correlation function)는 폐쇄 형태로(in closed form) 용이하게 결정될 수 있다. 전극-필터 파라미터들은 이때 자기-상관 함수로부터 효율적으로 계산될 수 있다. 구분적-일정 스펙트럼의 전극 모델링은 잡음 억제에서의 불연속성을 평활화하는 효과를 나타낸다. 당연히 알 수 있듯이, 전극 필터를 사용하는 대신에 현재 알려진 또는 차후 개발될 다른 모델링 기법을 사용할 수도 있을 것인데, 이러한 모든 등가물을 본 발명의 범주에 포함시키고자 한다.
AR 스펙트럼 성형 모듈(24)은 AR 파라미터들을 이용해서 입력 신호의 현재 블록에 필터를 적용한다. 시간 도메인에서 스펙트럼 성형을 실시하는 것에 의해, 블록 처리로 인한 시간 불연속성이 감소된다. 또한, 잡음 억제 주파수를 하위(low-order) 전극 필터에 의해서 모델링하기 때문에, 어떤 프로세서들에서는 시간 도메인 성형을 더욱 더 효과적으로 실시할 수도 있다.
전위처리 모듈(10)에서는, 신호를 먼저 H(z)=1-0.8z-1형태의 고역 통과 필터에 의해서 사전 강조한다. 이 고역 통과 필터는 음성에 내재하는 스펙트럼 경사를 부분적으로 보상할 수 있는 것이 선택된다. 이런 식으로 사전 처리된 신호들은 보다 정확한 잡음 주파수 응답을 발생한다.
도 2에 도시한 바와 같이, 입력 신호(30)는 (샘플링 주파수가 8㎑이고 지속기간이 10㎳인) 80개 샘플의 블록들로 처리된다. 이들 블록을 분석 블록(34)으로서 도시했다. 분석 블록(34)은 도시한 바와 같이 80개 샘플의 길이를 가진다. 더욱 구체적으로 말해서, 도시한 실시예에서, 입력 신호는 128개 샘플의 블록들로 분할된다. 각 블록은 이전 블록으로부터의 최종 24개 샘플(32)과, 80개 새로운 샘플의 분석 블록(34)과, "0"의 24개 샘플(36)로 이루어진다. 각 블록은 해밍 윈도우(Hamming window)에 의해서 윈도우화되며 푸리에 변환된다.
블록 구조에서의 암시적인 제로-패딩(zero-padding)을 더 설명할 필요가 있다. 특히, 신호 처리면에서 볼 때, 제로-패딩은 불필요한데, 이는 이산 푸리에 변환에 의해 (후술하는) 스펙트럼 성형을 실시하지 않기 때문이다. 그러나, 제로-패딩을 포함시키면, 그 알고리즘을 본 발명의 양수인인 Solana Technology Development Corporation이 구현한 기존의 EVRC 음성 코덱(voice codec)에 통합시키는 것이 용이하다. 이러한 블록 구조는 기존 EVRC의 전체 버퍼 관리 방식의 어떠한 변경도 요구하지 않는다.
각각의 잡음 억제 프레임은 128-포인트 시퀀스로서 나타낼 수 있다. 이 시퀀스를 g[n]으로 표기하면, 신호 블록의 주파수-도메인 표현은 다음과 같은 수학식 1의 이산 주파수 변환으로서 정의될 수 있다.
상기 수학식 1에서, C는 비정규화 상수이다.
신호 스펙트럼은 그다음 다음의 수학식 2와 같이 서로 폭이 다른 대역들로 누적된다.
여기서,
상기한 신호 스펙트럼은 인지가능-대역 스펙트럼으로서 언급된다. 상기한 대역들은 도 3에서 대역(50)으로서 도시된다. 도시한 바와 같이, 잡음 스펙트럼 대역들(NS 밴드)은 서로 다른 폭을 가지며 이산 푸리에 변환(DFT) 빈(bin)들과 상관관계를 갖는다.
신호와 잡음이 합해진 조합의 인지가능-대역 스펙트럼 추정치는 모듈(도 1의 14)에서 인지가능-대역 스펙트럼을 예를 들어 단극(single-pole) 순환 필터에 의해 필터링하는 것에 의해서 발생된다. 신호와 잡음이 합해진 조합의 전력 스펙트럼 추정치는 다음의 수학식 3과 같다.
음성의 특성은 비교적 단기간에 걸쳐 정적이기 때문에, 필터 파라미터 β는 단지 몇 개의(예를 들어 2개 내지 4개의) 잡음 억제 블록에 걸쳐 평활 처리를 수행하도록 선택된다. 이 평활 처리는 "단기간(short-time)" 평활 처리로서 언급되는 것으로서, "단기간 인지가능-대역 스펙트럼"의 추정치를 제공한다.
잡음 억제 시스템은 적절한 기능 수행을 위해 정확한 잡음 통계 추정치를 필요로 한다. 이 기능은 음성/중지 검출부 모듈(16)에 의해서 제공된다. 하나의 가능한 실시예에서는, 단일의 마이크로폰에 의해 음성과 잡음을 모두 측정한다. 잡음 억제 알고리즘은 잡음 통계 추정치를 필요로 하기 때문에, 잡음을 함유한 음성 신호와 잡음만의 신호를 구별하기 위한 방법이 필요하다. 이 방법은 기본적으로 잡음 함유 음성의 중지를 검출해야만 하는데, 이러한 작업은 다음과 같은 수개의 요인으로 인해서 더욱 어렵게 된다.
1. 중지 검출은 (0㏈ 내지 5㏈ 정도의) 작은 신호 대 잡음 비로 적절히 수행되어야 한다.
2. 중지 검출은 배경 잡음 통계의 완만한 변동에 민감하기 않아야 한다.
3. 중지 검출은 잡음과 같은 음성(예를 들어, 마찰음)과 배경 잡음을 정확하게 구별해야만 한다.
음성/중지 검출부(16)의 한가지 가능한 실시예에 대한 블록도를 도 4에 도시한다.
중지 검출부는 현재 발생되고 있는 잡음 함유 음성 신호를 유한 수의 신호 모델들간에서 전환시키는 것에 의해 모델링한다. 유한-상태 기계(finite-state machine: FSM)(64)는 모델들간의 전이를 관리한다. 음성/일시정지 판정은 현재 신호에 대한 측정치 및 기타 다른 적절한 상태 변수와 함께 현재 FSM 상태의 함수이다. 상태들 간의 전이는 현재 FSM 상태와 현재 신호에 대한 측정치의 함수이다.
후술하는 측정된 값들은 신호-상태 상태 기계(64)를 구동시키는 이진(binary)값의 파라미터를 결정하는데 사용된다. 일반적으로, 이들 이진값의 파라미터는 정확한 실수값의 측정치를 적응적 임계값과 비교하는 것에 의해서 결정된다. 신호 측정 모듈(60)이 제공하는 신호 측정치에 의해서 다음과 같은 신호 특성이 정량화된다.
1. 에너지 지수에 의해서는 신호가 큰 에너지를 갖는지 또는 작은 에너지를 갖는지가 판단된다. 이 신호 에너지 E[i]는 다음의 수학식 4로서 정의된다.
잡음 함유 음성의 에너지 지수에 대한 일 예는 도 5에 도시된다. 도 5에서는, 개별 음성 샘플의 진폭을 커브(70)로 나타냈고, 대응하는 NS 블록의 에너지 지수를 커브(72)로 나타냈다.
2. 스펙트럼 전이 지수에 의해서는 신호 스펙트럼이 단기간의 윈도우에 걸쳐 정상 상태(steady-state)에 있는지 또는 전이 상태에 있는지가 판단된다. 이 스펙트럼 전이 지수는 인지가능 대역 스펙트럼의 각 대역에 대한 경험적인 평균치 및 변동분을 결정하는 것에 의해 계산된다. 인지가능 대역 스펙트럼의 모드 대역에 대한 변동분들의 합은 스펙트럼 전이 지수로서 사용된다. 구체적으로 말해서, 전이 지수 Ti는 다음과 같이 계산된다. 인지가능 대역 스펙트럼의 각 대역에 대한 평균치는 다음의 수학식 5와 같은 단극 순환 필터에 의해서 계산된다.
인지가능 스펙트럼의 각 대역에 대한 변동분은 순환 필터에 의해서 계산된다.
필터 파라미터 α는 비교적 장기간 즉 10 내지 1 잡음 블록에 걸쳐 평활 처리를 수행하도록 선택된다. 전체적인 변동분은 다음의 수학식 7과 같은 각 대역에 대한 변동분의 합으로서 계산된다.
주목해야 할 것은,의 변동분 자체는 인지가능 대역 스펙트럼이 그의 장기간 평균치로부터 크게 변하지 않을 때에 가장 작다는 것이다. 적절한 스펙트럼 전이 지수는의 변동분으로서, 이것은 다음의 수학식 8과 수학식 9에 의해서 계산된다.
적응적 시정수 ωi는 다음의 수학식 10으로 주어진다.
이 시정수를 적응시키는 것에 의해, 스펙트럼 전이 지수는 정적인 신호의 위치들을 적절히 추적하게 된다. 잡음 음성의 스펙트럼 지수는 도 6에 도시된다. 도 6에서는, 개별 음성 샘플의 진폭을 커브(74)로 나타냈고, 대응하는 NS 블록의 에너지 지수는 커브(75)로 나타냈다.
3. 스펙트럼 유사(similarity) 지수 SSi에 의해서는 현재 신호 스펙트럼과 추정 잡음 스펙트럼의 유사 정도가 측정된다. 스펙트럼 유사 지수를 정의하기 위해, 잡음의 인지가능 대역 스펙트럼 Ni[k]에 대한 로그 추정치가 이용가능한 것으로 가정한다(Ni[k]의 정의는 잡음 스펙트럼 추정기에 대한 설명과 관련해서 후술하겠다.). 스펙트럼 유사 지수는 이때 다음의 수학식 11과 같이 정의된다.
잡음의 스펙트럼 유사 지수에 대한 일 예를 도 7에 도시했다. 도 7에서는, 개별 음성 샘플의 진폭을 커브(76)로 나타냈고, 대응하는 NS 블록의 에너지 지수를 커브(78)로 나타냈다. 주목할 것은, 낮은 값의 스펙트럼 유사 지수는 상당히 유사한 스펙트럼들에 대응하는 반면에, 높은 값의 스펙트럼 유사 지수는 상이한 스펙트럼들에 대응한다는 것이다.
4. 에너지 유사 지수에 의해서는 다음의 수학식 12와 같은 현재 신호 에너지와 추정 잡음 에너지의 유사 여부가 판단된다.
이같은 유사 여부는 신호 에너지를 임계치 적용 모듈(62)이 적용하는 임계치와 비교함으로써 판단된다. 실제 임계치는 임계치 계산 프로세서(66)에 의해 계산된다. 임계치 계산 프로세서(66)는 마이크로프로세서일 수 있다.
이진 파라미터들은 신호 스펙트럼의 현재 추정치를 S[k]로 표기하고, 신호 에너지의 현재 추정치를 Ei로 표기하고, 로그 잡음 스펙트럼의 현재 추정치를 Ni[k]로 표기하고, 잡음 에너지의 현재 추정치를로 표기하며, 잡음 에너지 추정치의 변동분을로 표기하는 것에 의해 정의된다.
파라미터 "고_저_에너지"는 신호가 높은 에너지를 갖는 지의 여부를 나타낸다. 고 에너지는 배경 잡음의 추정 에너지에 대해 정의되는 것으로서, 그것은 현재 신호 프레임의 에너지를 추정하고 임계치를 적용하는 것에 의해 계산되며 다음의 수학식 12로서 정의된다.
수학식 13에서, E는 다음의 수학식 14에 의해서 정의되며, Ei는 적응적 임계치이다.
파라미터 "전이"는 신호 스펙트럼이 전이하고 있는 때를 나타낸다. 이 파라미터 전이는 신호 스펙트럼으로부터 현재 단기간 스펙트럼의 이탈을 관찰하는 것에 의해 측정된다. 수학적으로, 그 파라미터 전이는 다음의 수학식 15에 의해서 정의된다
수학식 15에서, T는 전술한 바와 같이 정의한 스펙트럼 지수이며, Ti는 더욱 상세히 후술하는 바와 같이 적응적으로 계산한 임계치이다.
파라미터 "스펙트럼_유사성"에 의해서 현재 신호 스펙트럼과 추정 잡음 스펙트럼간의 유사성이 측정되는데, 이 파라미터는 현재 신호의 로그 스펙트럼과 잡음의 추정 로그 스펙트럼간의 거리를 측정하는 것에 의해 측정된다.
수학식 16에서, SSi는 전술한 바와 같은 것이며, SSt는 후술하는 바와 같은 임계치(예를 들어, 상수)이다.
파라미터 "에너지_유사성"에 의해서는 현재 신호의 에너지와 추정 잡음 에너지간의 유사성이 측정된다.
수학식 17에서, E는 다음의 수학식 18에 의해서 정의되며, ESi는 후술하는 바와 같이 적응적으로 계산한 임계치이다.
상술한 변수들 모두는 수를 임계치와 비교하는 것에 의해서 계산된다. 앞쪽의 3개의 임계치는 동적 신호의 특성들을 반영하는 것으로서 잡음의 특성들에 의존한다. 이들 3개의 임계치는 추정 평균치와 다수의 표준 편차와의 합이다. 스펙트럼 유사성에 대한 임계치는 잡음의 특정한 특성에 의존하지 않으며 일정한 값으로 설정될 수 있다.
고/저 에너지 임계치는 임계치 계산 프로세서(도 4의 66)에 의해 다음과 같은 수학식 19로서 계산된다.
수학식 19에서,는 다음과 같은 수학식 20으로서 정의된 경험적인 변동분이며,는 다음과 같은 수학식 21로서 정의된 경험적인 평균치이다.
에너지 유사성 임계치는 다음의 수학식 22로서 계산된다.
주목할 것은, 에너지 유사성 임계치의 증가 속도는 본 예에서 1.05의 계수에 의해 제한된다. 따라서, 그 임계치는 높은 잡음 에너지에 의해서 부적절한 영향을 받지 않게 된다.
스펙트럼 전이 임계치는로서 계산된다. 스펙트럼 유사성 임계치는 SSi=10의 상태로 일정하다.
잡음 함유 신호를 모델링하는 신호-상태 상태 기계(64)는 도 8에 더욱 상세히 도시된다. 이 상태 기계의 상태 전이는 전술한 신호 측정에 의해 좌우된다. 신호 상태들은 정상-상태 저 에너지(80), 전이(82) 및 정상-상태 고 에너지(84)이다. 정상-상태 저 에너지 상태 동안에는, 어떠한 스펙트럼 전이도 발생되지 않으며 신호 에너지는 임계치 아래에 있다. 전이 상태 동안에는, 어떠한 스펙트럼 전이도 발생하지 않으며 신호 에너지는 임계치 위에 있다. 상태들 간의 전이는 상술한 신호 측정에 의해 좌우된다.
상태 기계 전이들은 다음과 같은 표 1에서 정의된다.
이 표에서, "X"는 "임의의 값"이다. 주목할 것은, 상태 전이는 어떤 측정의 경우에도 보증된다.
검출부(16)가 제공하는 음성/중지 판정은 신호-상태 상태 기계의 현재 상태에 의존하며 또한 도 4와 관련하여 설명한 신호 측정에 의존한다. 음성/중지는 다음의 의사코드(중지: dec=0; 음성: dec=1)에 의해서 좌우된다.
dec = 1;
스펙트럼-유사성 == 1 이면
dec = 0;
그외에, 현재 상태 == 1 이면
에너지-유사성 == 1 이면
dec = 0;
끝
끝
잡음 스펙트럼은 다음의 수학식을 사용하여 중지로서 분류한 프레임 동안 잡음 파라미터 추정 모듈(도 4의 68)에 의해서 추정된다.
수학식 23에서, β는 0과 1사이의 상수이다. 잡음 에너지의 현재 추정치및 잡음 추정치은 다음의 수학식 24 및 수학식 25로서 정의된다.
상기 수학식 24 및 수학식 25에서, 필터 상수 λ는 10개 내지 20개의 잡음 억제 블록을 평균화하기 위해 선택된다. 스펙트럼 이득은 당해 기술 분야에 잘 알려진 각종 방법에 의해서 계산된다. 다음과 같은 수학식 26으로서 신호 대 잡음 비를 정의하는 것을 포함하는 현재의 구현에 적합한 한가지 방법은 상술한 바와 같다.
수학식 26에서, c는 상수이며, Su[k] 및 Ni[k]는 상술한 바와 같다. 이득의 잡음 종속 성분은 다음의 수학식 27로서 정의된다.
순간 이득은 다음의 수학식 28로서 계산된다.
일단 순간 이득을 계산한 후에는, 그 결과를 다음과 같은 수학식 29를 사용하여 평활화한다.
수학식 29에서, 벡터 Gs[k]는 시점 k에서 평활화된 채널 이득 벡터이다.
일단 목표 주파수 응답을 계산한 후에는, 그 결과를 잡음 함유 음성에 적용해야 한다. 이것은 잡음 함유 신호의 단기간 스펙트럼을 변형하는 (시변) 필터링 동작에 대응하며, 이 필터링 동작의 결과로써 잡음이 억제된 신호가 생성된다. 현재 실시하는 것과는 달리, 주파수 도메인에서의 스펙트럼 변형은 필요하지 않다.실제로, 주파수 도메인 구현 방식은 다음과 같은 단점을 가질 수도 있다.
1. 주파수 도메인 구현 방식은 불필요하게 복잡할 수도 있다.
2. 주파수 도메인 구현 방식에 의하면, 잡음이 억제된 음성의 질이 저하될 수도 있다.
스펙트럼 성형의 시간 도메인 구현 방식은 성형 필터의 임펄스 응답을 선형 위상으로 할 필요가 없게 한다는 장점을 가진다. 또한, 시간 도메인 구현 방식에 의하면, 순환 콘벌루션(circular convolution)으로 인한 인공적인 결함의 발생가능성이 배제된다.
본 명세서에서 설명하는 스펙트럼 성형 기법은 복잡도가 낮은 필터를 설계하는 방법으로 이루어지는데, 이 방법은 그 필터에 의해 잡음 억제 주파수 응답을 구현한다. 이러한 필터는 AR 파라미터 계산 프로세서(22)가 제공하는 파라미터들에 근거한 AR 스펙트럼 성형 모듈(도 1의 24)에 의해서 제공된다.
원하는 주파수 응답은 도 9에 도시한 바와 같이 비교적 적은 수의 세그먼트에 걸친 구분적으로 일정한 주파수 응답이기 때문에, 그 응답의 자기-상관 함수는 폐쇄 형태로 효율적으로 결정될 수 있다. 자기-상관 계수가 주어지면, 구분적-일정 주파수 응답을 근사화하는 전극 필터가 결정될 수 있다. 이 방식은 여러 가지 장점을 제공한다. 첫째, 구분적-일정 주파수 응답에 관련된 스펙트럼 불연속성이 평활화된다. 둘째, FFT 블록 처리와 관련된 시간 불연속성이 제거된다. 셋째, 성형 처리가 시간 도메인에서 적용되기 때문에, 역 DFT가 필요하지 않다. 하위 전극 필터가 주어지면, 고정점(fixed point) 구현에서 계산상의 장점이 제공된다.
이러한 주파수 응답은 다음의 수학식과 같이 수학적으로 표현될 수 있다.
수학식 30에서, Gs[k]는 평활화된 채널 이득으로서 이 이득은 i번째 구분적-일정 세그먼트의 진폭을 설정하며, I(ω, ωi-1, ωi)는 주파수(ωi-1, ωi)에 의해서 경계가 정해지는 구간에 대한 지시기 함수(indicator function)이다. 즉, I(ω, ωi-1, ωi)는 ωi-1,〈ω〈ωi인 경우에는 1이고, 그렇지 않은 경우에는 0이다. 자기-상관 함수는 H2(ω)의 역 푸리에 변환 즉 다음의 수학식 31과 같다.
수학식 31에서, γi=(ωi-ωi-1)이며, βi=(ωi-1+ωi)/2이다. 이러한 자기-상관 함수는 다음과 같은 수학식 32의 값들에 대한 룩업 테이블에 의해 용이하게 구현될 수 있다.
상기한 자기-상관 함수가 주어지면, 스펙트럼의 전극 모델은 수학식들의 해를 구함으로써 결정될 수 있다. 필요한 매트릭스 반전은 예를 들어 레비슨/더빈 순환(Levinson/Durbin recursion)에 의해서 효율적으로 계산될 수 있다.
순서적인 16개 필터에 의한 전극 모델링의 효율성에 대한 일 예를 도 10에 도시한다. 주목할 것은, 스펙트럼 불연속성이 평활화되었다는 것이다. 분명하게 알 수 있듯이, 모델은 전극 필터 순서가 증가함에 따라 더욱 더 정확하게 될 수 있으며, 16개의 필터 순서에 의해 적절한 계산상의 비용으로 양호한 성능이 제공된다.
AR 파라미터 계산 프로세서(22)가 계산한 파라미터들에 의해서 제공되는 전극 필터는 AR 스펙트럼 성형 모듈(24)에서 잡음 함유 입력 신호의 현재 블록에 적용됨으로써 스펙트럼적으로 성형된 출력 신호가 제공된다.
본 발명을 그의 특정 실시 예에 대해 설명하였으나, 당업자라면 알 수 있듯이, 특허청구범위에 기술한 본 발명의 범주를 벗어나지 않는 범위 내에서 다수의 변형 예 및 적용 예가 가능할 수도 있을 것이다.
이제 자명하듯이, 본 발명에 의하면, 각종 특유의 특징을 가진 잡음 억제 방법 및 장치가 제공된다. 특히, 입력 신호에 대한 상태 기계 모듈로 이루어진 음성 상태 검출부가 제공된다. 이 상태 기계는 입력 신호로부터의 다양한 측정치에 의해서 구동된다. 따라서, 이러한 구조에 의하면, 복잡도가 낮으면서도 음성/중지 판정이 아주 정확하게 된다. 또한, 잡음 억제 주파수 응답이 주파수 도메인에서 계산되나 시간 도메인에 적용된다. 따라서, 주파수 도메인에서 잡음 억제 주파수 응답을 적용하는 "블록-기반" 방법의 경우에 발생하는 시간 도메인 불연속성이 배제되는 효과가 제공된다. 또한, 잡음 억제 필터가 잡음 억제 주파수 응답의 자기-상관 함수를 결정하는 새로운 기법에 의해 설계된다. 따라서, 자기-상관 시퀀스가 전극 필터의 생성에 사용된다. 이 전극 필터는 어떤 경우 주파수 도메인 방법을 구현하는데 있어서 덜 복잡할 수도 있다.
비트 전송 속도가 낮은 음성 코더에 대한 프론트 엔드로서 사용하는 데 적합한 본 발명의 잡음 억제 기법은 셀룰러 전화 분야에 사용하기에 특히 적합하다.
Claims (14)
- 잡음과 음성의 조합을 반송하는 입력 신호내의 잡음을 억제하기 위한 방법으로서,상기 입력 신호를 신호 블록들로 분할하는 제1단계와;상기 신호 블록들을 처리하여 상기 입력 신호의 단기간 인지가능 대역 스펙트럼 추정치를 제공하는 제2단계와;각종 시점에서 상기 입력 신호가 잡음만의 신호를 반송하는지 또는 잡음과 음성의 조합을 반송하는지를 판단하여, 상기 입력 신호가 잡음만의 신호를 반송하는 경우에는, 그에 대응하는 상기 입력 신호의 단기간 인지가능 대역 스펙트럼 추정치를 사용해서 상기 잡음의 장기간 인지가능 대역 스펙트럼 추정치를 갱신하는 제3단계와;상기 잡음의 장기간 인지가능 대역 스펙트럼 추정치와 상기 입력 신호의 단기간 인지가능 대역 스펙트럼 추정치에 근거하여 잡음 억제 주파수 응답을 결정하는 제4단계와;상기 잡음 억제 주파수 응답에 따라 상기 입력 신호의 현재 블록을 성형하는 제5단계를 포함하는 잡음 억제 방법.
- 제1항에 있어서,상기 제2단계 전에 상기 입력 신호를 사전 필터링하여 그의 고주파수 응답 성분을 강조하는단계를 더 포함하는 것을 특징으로 잡음 억제 방법.
- 제2항에 있어서,상기 제2단계는:상기 신호 블록들에 대해 이산 푸리에 변환을 적용하여 각 블록의 복소수값 주파수 도메인 표현을 제공하는 단계와;상기 블록의 주파수 도메인 표현을 크기만의 신호로 변환하는 단계와;상기 크기만의 신호들을 이산 주파수 대역들에 걸쳐 평균화하여 인지가능-대역 스펙트럼으로서 제공하는 단계와;상기 인지가능-대역 스펙트럼의 시간 변동분들을 평활화하여 상기 단기간 인지가능 대역 스펙트럼 추정치를 제공하는 단계를 포함하는 것을 특징으로 잡음 억제 방법.
- 제3항에 있어서,상기 잡음 억제 주파수 응답을 상기 제5단계 동안 전극 필터를 사용하여 모델링하는 것을 특징으로 잡음 억제 방법.
- 제1항에 있어서,상기 잡음 억제 주파수 응답을 상기 제5단계 동안 전극 필터를 사용하여 모델링 하는 것을 특징으로 잡음 억제 방법.
- 제1항에 있어서,상기 제2단계는:상기 신호 블록들에 대해 이산 푸리에 변환을 적용하여 각 블록의 복소수값 주파수 도메인 표현을 제공하는 단계와;상기 블록의 주파수 도메인 표현을 크기만의 신호로 변환하는 단계와;상기 크기만의 신호들을 이산 주파수 대역들에 걸쳐 평균화하여 인지가능-대역 스펙트럼으로서 제공하는 단계와;상기 인지가능-대역 스펙트럼의 시간 변동분들을 평활화하여 상기 단기간 인지가능 대역 스펙트럼 추정치를 제공하는 단계를 포함하는 것을 특징으로 잡음 억제 방법.
- 잡음과 음성의 조합을 반송하는 입력 신호내의 잡음을 억제하기 위한 장치로서,상기 입력 신호를 블록들로 분할하는 신호 전처리부와;상기 블록들을 처리하여 상기 입력 신호의 복소수값 주파수 도메인 스펙트럼을 제공하는 고속 푸리에 변환 처리기와;상기 복소수값 주파수 도메인 스펙트럼을 폭이 동일하지 않은 주파수 대역들을 포함하는 장기간 인지가능-대역 스펙트럼으로 누적시키는 누적기와;상기 장기간 인지가능-대역 스펙트럼을 필터링하여 상기 장기간 인지가능-대역 스펙트럼의 현재 세그먼트와 잡음을 포함하는 단기간 인지가능-대역 스펙트럼의 추정치를 발생하는 필터와;상기 입력 신호가 현재 잡음만 인지 또는 잡음과 음성의 조합인지를 판단하는 음성/중지 검출부와;상기 입력 신호가 잡음만의 신호인 경우 상기 음성/중지 검출부에 응답하여 상기 입력 신호의 단기간 인지가능 대역 스펙트럼에 근거해서 상기 잡음의 장기간 인지가능 대역 스펙트럼 추정치를 갱신하는 잡음 스펙트럼 추정기와;상기 잡음 스펙트럼 추정기에 응답하여 잡음 억제 주파수 응답을 결정하는 스펙트럼 이득 처리기와;상기 스펙트럼 이득 처리기에 응답하여 상기 입력 신호의 현재 블록을 성형해서 그 신호내의 잡음을 억제하는 스펙트럼 성형 처리기를 포함하는 잡음 억제 장치.
- 제7항에 있어서,상기 스펙트럼 성형 처리기는 전극 필터를 포함하는 것을 특징으로 하는 잡음 억제 장치.
- 제6항에 있어서,상기 신호 전처리부는 상기 입력 신호를 사전 필터링하여 그 신호의 고주파수 성분을 강조하는 것을 특징으로 하는 잡음 억제 장치.
- 제7항에 있어서,상기 신호 전처리부는 상기 입력 신호를 사전 필터링하여 그 신호의 고주파수 성분을 강조하는 것을 특징으로 하는 잡음 억제 장치.
- 잡음과 오디오 정보를 반송하는 입력 신호내의 잡음을 억제하는 방법으로서,주파수 도메인에서 상기 입력 신호에 대한 잡음 억제 주파수 응답을 계산하는 제1단계와;상기 주파수 도메인에서 상기 입력 신호에 대해 상기 잡음 억제 주파수 응답을 적용하여 상기 입력 신호내의 잡음을 억제하는 제2단계를 포함하는 것을 특징으로 하는 잡음 억제 방법.
- 제11항에 있어서,상기 제1단계 전에 상기 입력 신호를 블록들로 분할하는 단계를 더 포함하는 것을 특징으로 하는 잡음 억제 방법.
- 제12항에 있어서,상기 잡음 억제 주파수 응답의 자기상관 함수를 결정하는 것에 의해서 발생된 전극 필터를 사용하여 상기 잡음 억제 주파수 응답을 상기 입력 신호에 적용하는 것을 특징으로 하는 잡음 억제 방법.
- 제11항에 있어서,기 잡음 억제 주파수 응답의 자기상관 함수를 결정하는 것에 의해서 발생된 전극 필터를 사용하여 상기 잡음 억제 주파수 응답을 상기 입력 신호에 적용하는 것을 특징으로 하는 잡음 억제 방법.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US9/159,358 | 1998-09-23 | ||
US09/159,358 US6122610A (en) | 1998-09-23 | 1998-09-23 | Noise suppression for low bitrate speech coder |
US09/159,358 | 1998-09-23 | ||
PCT/KR1999/000577 WO2000017855A1 (en) | 1998-09-23 | 1999-09-22 | Noise suppression for low bitrate speech coder |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20010032390A KR20010032390A (ko) | 2001-04-16 |
KR100330230B1 true KR100330230B1 (ko) | 2002-05-09 |
Family
ID=22572262
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020017003777A KR20010075343A (ko) | 1998-09-23 | 1999-09-15 | 저비트율 스피치 코더용 노이즈 억제 방법 및 그 장치 |
KR1020007005629A KR100330230B1 (ko) | 1998-09-23 | 1999-09-22 | 잡음 억제 방법 및 장치 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020017003777A KR20010075343A (ko) | 1998-09-23 | 1999-09-15 | 저비트율 스피치 코더용 노이즈 억제 방법 및 그 장치 |
Country Status (10)
Country | Link |
---|---|
US (1) | US6122610A (ko) |
EP (1) | EP1116224A4 (ko) |
JP (1) | JP2003517624A (ko) |
KR (2) | KR20010075343A (ko) |
CN (2) | CN1326584A (ko) |
AU (2) | AU6037899A (ko) |
BR (1) | BR9913011A (ko) |
CA (2) | CA2344695A1 (ko) |
IL (1) | IL136090A0 (ko) |
WO (2) | WO2000017859A1 (ko) |
Families Citing this family (95)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6415253B1 (en) * | 1998-02-20 | 2002-07-02 | Meta-C Corporation | Method and apparatus for enhancing noise-corrupted speech |
US6351731B1 (en) | 1998-08-21 | 2002-02-26 | Polycom, Inc. | Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor |
US6453285B1 (en) * | 1998-08-21 | 2002-09-17 | Polycom, Inc. | Speech activity detector for use in noise reduction system, and methods therefor |
KR100281181B1 (ko) * | 1998-10-16 | 2001-02-01 | 윤종용 | 약전계에서 코드 분할 다중 접속 시스템의 코덱 잡음 제거 방법 |
US7177805B1 (en) * | 1999-02-01 | 2007-02-13 | Texas Instruments Incorporated | Simplified noise suppression circuit |
US6397177B1 (en) * | 1999-03-10 | 2002-05-28 | Samsung Electronics, Co., Ltd. | Speech-encoding rate decision apparatus and method in a variable rate |
US6507623B1 (en) * | 1999-04-12 | 2003-01-14 | Telefonaktiebolaget Lm Ericsson (Publ) | Signal noise reduction by time-domain spectral subtraction |
US6351729B1 (en) * | 1999-07-12 | 2002-02-26 | Lucent Technologies Inc. | Multiple-window method for obtaining improved spectrograms of signals |
US6980950B1 (en) * | 1999-10-22 | 2005-12-27 | Texas Instruments Incorporated | Automatic utterance detector with high noise immunity |
JP3878482B2 (ja) * | 1999-11-24 | 2007-02-07 | 富士通株式会社 | 音声検出装置および音声検出方法 |
US6473733B1 (en) * | 1999-12-01 | 2002-10-29 | Research In Motion Limited | Signal enhancement for voice coding |
JP2001166782A (ja) * | 1999-12-07 | 2001-06-22 | Nec Corp | 報知信号発生方法及び装置 |
US6317456B1 (en) * | 2000-01-10 | 2001-11-13 | The Lucent Technologies Inc. | Methods of estimating signal-to-noise ratios |
US9609278B2 (en) | 2000-04-07 | 2017-03-28 | Koplar Interactive Systems International, Llc | Method and system for auxiliary data detection and delivery |
DE10017646A1 (de) * | 2000-04-08 | 2001-10-11 | Alcatel Sa | Geräuschunterdrückung im Zeitbereich |
US6463408B1 (en) * | 2000-11-22 | 2002-10-08 | Ericsson, Inc. | Systems and methods for improving power spectral estimation of speech signals |
US7617099B2 (en) * | 2001-02-12 | 2009-11-10 | FortMedia Inc. | Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile |
EP1244094A1 (de) * | 2001-03-20 | 2002-09-25 | Swissqual AG | Verfahren und Vorrichtung zur Bestimmung eines Qualitätsmasses eines Audiosignals |
KR20020082643A (ko) * | 2001-04-25 | 2002-10-31 | 주식회사 호서텔넷 | 고속 푸우리에 변환(fft) 및 역고속 푸우리에변환(ifft)을 이용한 송,수신기의 동기검출장치 |
US20040148166A1 (en) * | 2001-06-22 | 2004-07-29 | Huimin Zheng | Noise-stripping device |
US6952482B2 (en) * | 2001-10-02 | 2005-10-04 | Siemens Corporation Research, Inc. | Method and apparatus for noise filtering |
KR100434723B1 (ko) * | 2001-12-24 | 2004-06-07 | 주식회사 케이티 | 음성 신호특성을 이용한 돌발잡음 제거장치 및 그 방법 |
US8718687B2 (en) * | 2002-03-26 | 2014-05-06 | Zoove Corp. | System and method for mediating service invocation from a communication device |
US7885420B2 (en) * | 2003-02-21 | 2011-02-08 | Qnx Software Systems Co. | Wind noise suppression system |
US8271279B2 (en) | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
US7949522B2 (en) | 2003-02-21 | 2011-05-24 | Qnx Software Systems Co. | System for suppressing rain noise |
US8326621B2 (en) * | 2003-02-21 | 2012-12-04 | Qnx Software Systems Limited | Repetitive transient noise removal |
US7593851B2 (en) * | 2003-03-21 | 2009-09-22 | Intel Corporation | Precision piecewise polynomial approximation for Ephraim-Malah filter |
US7330511B2 (en) | 2003-08-18 | 2008-02-12 | Koplar Interactive Systems International, L.L.C. | Method and system for embedding device positional data in video signals |
US7224810B2 (en) * | 2003-09-12 | 2007-05-29 | Spatializer Audio Laboratories, Inc. | Noise reduction system |
US9055239B2 (en) | 2003-10-08 | 2015-06-09 | Verance Corporation | Signal continuity assessment using embedded watermarks |
US7454332B2 (en) * | 2004-06-15 | 2008-11-18 | Microsoft Corporation | Gain constrained noise suppression |
KR100657912B1 (ko) * | 2004-11-18 | 2006-12-14 | 삼성전자주식회사 | 잡음 제거 방법 및 장치 |
US8509703B2 (en) * | 2004-12-22 | 2013-08-13 | Broadcom Corporation | Wireless telephone with multiple microphones and multiple description transmission |
US20070116300A1 (en) * | 2004-12-22 | 2007-05-24 | Broadcom Corporation | Channel decoding for wireless telephones with multiple microphones and multiple description transmission |
US20060133621A1 (en) * | 2004-12-22 | 2006-06-22 | Broadcom Corporation | Wireless telephone having multiple microphones |
US20060147063A1 (en) * | 2004-12-22 | 2006-07-06 | Broadcom Corporation | Echo cancellation in telephones with multiple microphones |
US7983720B2 (en) * | 2004-12-22 | 2011-07-19 | Broadcom Corporation | Wireless telephone with adaptive microphone array |
KR100784456B1 (ko) * | 2005-12-08 | 2007-12-11 | 한국전자통신연구원 | Gmm을 이용한 음질향상 시스템 |
KR100738341B1 (ko) * | 2005-12-08 | 2007-07-12 | 한국전자통신연구원 | 성대신호를 이용한 음성인식 장치 및 그 방법 |
US8345890B2 (en) | 2006-01-05 | 2013-01-01 | Audience, Inc. | System and method for utilizing inter-microphone level differences for speech enhancement |
US9185487B2 (en) * | 2006-01-30 | 2015-11-10 | Audience, Inc. | System and method for providing noise suppression utilizing null processing noise subtraction |
US8744844B2 (en) | 2007-07-06 | 2014-06-03 | Audience, Inc. | System and method for adaptive intelligent noise suppression |
US8194880B2 (en) | 2006-01-30 | 2012-06-05 | Audience, Inc. | System and method for utilizing omni-directional microphones for speech enhancement |
US8204252B1 (en) | 2006-10-10 | 2012-06-19 | Audience, Inc. | System and method for providing close microphone adaptive array processing |
US8204253B1 (en) | 2008-06-30 | 2012-06-19 | Audience, Inc. | Self calibration of audio device |
US8150065B2 (en) | 2006-05-25 | 2012-04-03 | Audience, Inc. | System and method for processing an audio signal |
US8849231B1 (en) | 2007-08-08 | 2014-09-30 | Audience, Inc. | System and method for adaptive power control |
US8949120B1 (en) | 2006-05-25 | 2015-02-03 | Audience, Inc. | Adaptive noise cancelation |
US8934641B2 (en) | 2006-05-25 | 2015-01-13 | Audience, Inc. | Systems and methods for reconstructing decomposed audio signals |
US8259926B1 (en) | 2007-02-23 | 2012-09-04 | Audience, Inc. | System and method for 2-channel and 3-channel acoustic echo cancellation |
US8189766B1 (en) | 2007-07-26 | 2012-05-29 | Audience, Inc. | System and method for blind subband acoustic echo cancellation postfiltering |
US8428661B2 (en) * | 2007-10-30 | 2013-04-23 | Broadcom Corporation | Speech intelligibility in telephones with multiple microphones |
US20090111584A1 (en) | 2007-10-31 | 2009-04-30 | Koplar Interactive Systems International, L.L.C. | Method and system for encoded information processing |
US8296136B2 (en) * | 2007-11-15 | 2012-10-23 | Qnx Software Systems Limited | Dynamic controller for improving speech intelligibility |
US8180064B1 (en) | 2007-12-21 | 2012-05-15 | Audience, Inc. | System and method for providing voice equalization |
US8143620B1 (en) | 2007-12-21 | 2012-03-27 | Audience, Inc. | System and method for adaptive classification of audio sources |
US8194882B2 (en) | 2008-02-29 | 2012-06-05 | Audience, Inc. | System and method for providing single microphone noise suppression fallback |
US8355511B2 (en) | 2008-03-18 | 2013-01-15 | Audience, Inc. | System and method for envelope-based acoustic echo cancellation |
US9142221B2 (en) * | 2008-04-07 | 2015-09-22 | Cambridge Silicon Radio Limited | Noise reduction |
US8774423B1 (en) | 2008-06-30 | 2014-07-08 | Audience, Inc. | System and method for controlling adaptivity of signal modification using a phantom coefficient |
US8521530B1 (en) | 2008-06-30 | 2013-08-27 | Audience, Inc. | System and method for enhancing a monaural audio signal |
CN101770776B (zh) | 2008-12-29 | 2011-06-08 | 华为技术有限公司 | 瞬态信号的编码方法和装置、解码方法和装置及处理系统 |
US8582781B2 (en) | 2009-01-20 | 2013-11-12 | Koplar Interactive Systems International, L.L.C. | Echo modulation methods and systems |
US8715083B2 (en) | 2009-06-18 | 2014-05-06 | Koplar Interactive Systems International, L.L.C. | Methods and systems for processing gaming data |
USRE48462E1 (en) * | 2009-07-29 | 2021-03-09 | Northwestern University | Systems, methods, and apparatus for equalization preference learning |
CN102044241B (zh) | 2009-10-15 | 2012-04-04 | 华为技术有限公司 | 一种实现通信系统中背景噪声的跟踪的方法和装置 |
US20110125497A1 (en) * | 2009-11-20 | 2011-05-26 | Takahiro Unno | Method and System for Voice Activity Detection |
US9008329B1 (en) | 2010-01-26 | 2015-04-14 | Audience, Inc. | Noise reduction using multi-feature cluster tracker |
US9558755B1 (en) | 2010-05-20 | 2017-01-31 | Knowles Electronics, Llc | Noise suppression assisted automatic speech recognition |
US8745403B2 (en) | 2011-11-23 | 2014-06-03 | Verance Corporation | Enhanced content management based on watermark extraction records |
US8712076B2 (en) | 2012-02-08 | 2014-04-29 | Dolby Laboratories Licensing Corporation | Post-processing including median filtering of noise suppression gains |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
US8726304B2 (en) | 2012-09-13 | 2014-05-13 | Verance Corporation | Time varying evaluation of multimedia content |
US9640194B1 (en) | 2012-10-04 | 2017-05-02 | Knowles Electronics, Llc | Noise suppression for speech processing based on machine-learning mask estimation |
JP6059003B2 (ja) * | 2012-12-26 | 2017-01-11 | パナソニック株式会社 | 歪み補償装置及び歪み補償方法 |
US9262794B2 (en) | 2013-03-14 | 2016-02-16 | Verance Corporation | Transactional video marking system |
US9485089B2 (en) | 2013-06-20 | 2016-11-01 | Verance Corporation | Stego key management |
US9536540B2 (en) | 2013-07-19 | 2017-01-03 | Knowles Electronics, Llc | Speech signal separation and synthesis based on auditory scene analysis and speech modeling |
WO2015138798A1 (en) | 2014-03-13 | 2015-09-17 | Verance Corporation | Interactive content acquisition using embedded codes |
US10504200B2 (en) | 2014-03-13 | 2019-12-10 | Verance Corporation | Metadata acquisition using embedded watermarks |
EP3120355B1 (en) * | 2014-03-17 | 2018-08-29 | Koninklijke Philips N.V. | Noise suppression |
US9805434B2 (en) | 2014-08-20 | 2017-10-31 | Verance Corporation | Content management based on dither-like watermark embedding |
WO2016033364A1 (en) | 2014-08-28 | 2016-03-03 | Audience, Inc. | Multi-sourced noise suppression |
EP3225034A4 (en) | 2014-11-25 | 2018-05-02 | Verance Corporation | Enhanced metadata and content delivery using watermarks |
US9942602B2 (en) | 2014-11-25 | 2018-04-10 | Verance Corporation | Watermark detection and metadata delivery associated with a primary content |
US9602891B2 (en) | 2014-12-18 | 2017-03-21 | Verance Corporation | Service signaling recovery for multimedia content using embedded watermarks |
US10257567B2 (en) | 2015-04-30 | 2019-04-09 | Verance Corporation | Watermark based content recognition improvements |
WO2017015399A1 (en) | 2015-07-20 | 2017-01-26 | Verance Corporation | Watermark-based data recovery for content with multiple alternative components |
US20190132652A1 (en) | 2016-04-18 | 2019-05-02 | Verance Corporation | System and method for signaling security and database population |
WO2018237191A1 (en) | 2017-06-21 | 2018-12-27 | Verance Corporation | ACQUISITION AND TREATMENT OF METADATA BASED ON A WATERMARK |
US11468149B2 (en) | 2018-04-17 | 2022-10-11 | Verance Corporation | Device authentication in collaborative content screening |
CN112562701B (zh) * | 2020-11-16 | 2023-03-28 | 华南理工大学 | 心音信号双通道自适应降噪算法、装置、介质及设备 |
US11722741B2 (en) | 2021-02-08 | 2023-08-08 | Verance Corporation | System and method for tracking content timeline in the presence of playback rate changes |
CN115173971B (zh) * | 2022-07-08 | 2023-10-03 | 电信科学技术第五研究所有限公司 | 一种基于频谱数据的宽带信号实时检测方法 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4630305A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
US4630304A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic background noise estimator for a noise suppression system |
US4628529A (en) * | 1985-07-01 | 1986-12-09 | Motorola, Inc. | Noise suppression system |
US4658426A (en) * | 1985-10-10 | 1987-04-14 | Harold Antin | Adaptive noise suppressor |
US4811404A (en) * | 1987-10-01 | 1989-03-07 | Motorola, Inc. | Noise suppression system |
US5341457A (en) * | 1988-12-30 | 1994-08-23 | At&T Bell Laboratories | Perceptual coding of audio signals |
US5040217A (en) * | 1989-10-18 | 1991-08-13 | At&T Bell Laboratories | Perceptual coding of audio signals |
US5450522A (en) * | 1991-08-19 | 1995-09-12 | U S West Advanced Technologies, Inc. | Auditory model for parametrization of speech |
FI92535C (fi) * | 1992-02-14 | 1994-11-25 | Nokia Mobile Phones Ltd | Kohinan vaimennusjärjestelmä puhesignaaleille |
US5432859A (en) * | 1993-02-23 | 1995-07-11 | Novatel Communications Ltd. | Noise-reduction system |
JP3626492B2 (ja) * | 1993-07-07 | 2005-03-09 | ポリコム・インコーポレイテッド | 会話の品質向上のための背景雑音の低減 |
IT1272653B (it) * | 1993-09-20 | 1997-06-26 | Alcatel Italia | Metodo di riduzione del rumore, in particolare per riconoscimento automatico del parlato, e filtro atto ad implementare lo stesso |
WO1995015550A1 (en) * | 1993-11-30 | 1995-06-08 | At & T Corp. | Transmitted noise reduction in communications systems |
JP3484757B2 (ja) * | 1994-05-13 | 2004-01-06 | ソニー株式会社 | 音声信号の雑音低減方法及び雑音区間検出方法 |
US5544250A (en) * | 1994-07-18 | 1996-08-06 | Motorola | Noise suppression system and method therefor |
FR2726392B1 (fr) * | 1994-10-28 | 1997-01-10 | Alcatel Mobile Comm France | Procede et dispositif de suppression de bruit dans un signal de parole, et systeme avec annulation d'echo correspondant |
SE505156C2 (sv) * | 1995-01-30 | 1997-07-07 | Ericsson Telefon Ab L M | Förfarande för bullerundertryckning genom spektral subtraktion |
US5682463A (en) * | 1995-02-06 | 1997-10-28 | Lucent Technologies Inc. | Perceptual audio compression based on loudness uncertainty |
US5659622A (en) * | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
-
1998
- 1998-09-23 US US09/159,358 patent/US6122610A/en not_active Expired - Fee Related
-
1999
- 1999-09-15 JP JP2000571442A patent/JP2003517624A/ja active Pending
- 1999-09-15 EP EP99969525A patent/EP1116224A4/en not_active Withdrawn
- 1999-09-15 CA CA002344695A patent/CA2344695A1/en not_active Abandoned
- 1999-09-15 KR KR1020017003777A patent/KR20010075343A/ko not_active Application Discontinuation
- 1999-09-15 WO PCT/US1999/021033 patent/WO2000017859A1/en not_active Application Discontinuation
- 1999-09-15 CN CN99813506A patent/CN1326584A/zh active Pending
- 1999-09-15 AU AU60378/99A patent/AU6037899A/en not_active Abandoned
- 1999-09-22 KR KR1020007005629A patent/KR100330230B1/ko not_active IP Right Cessation
- 1999-09-22 IL IL13609099A patent/IL136090A0/xx unknown
- 1999-09-22 AU AU60079/99A patent/AU6007999A/en not_active Abandoned
- 1999-09-22 BR BR9913011-4A patent/BR9913011A/pt not_active IP Right Cessation
- 1999-09-22 CN CN99801661A patent/CN1286788A/zh active Pending
- 1999-09-22 WO PCT/KR1999/000577 patent/WO2000017855A1/en active IP Right Grant
- 1999-09-22 CA CA002310491A patent/CA2310491A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
EP1116224A1 (en) | 2001-07-18 |
IL136090A0 (en) | 2001-05-20 |
AU6037899A (en) | 2000-04-10 |
WO2000017855A1 (en) | 2000-03-30 |
KR20010075343A (ko) | 2001-08-09 |
JP2003517624A (ja) | 2003-05-27 |
KR20010032390A (ko) | 2001-04-16 |
BR9913011A (pt) | 2001-03-27 |
WO2000017859A1 (en) | 2000-03-30 |
CA2344695A1 (en) | 2000-03-30 |
CA2310491A1 (en) | 2000-03-30 |
AU6007999A (en) | 2000-04-10 |
WO2000017859A8 (en) | 2000-07-20 |
CN1286788A (zh) | 2001-03-07 |
US6122610A (en) | 2000-09-19 |
EP1116224A4 (en) | 2003-06-25 |
CN1326584A (zh) | 2001-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100330230B1 (ko) | 잡음 억제 방법 및 장치 | |
US6415253B1 (en) | Method and apparatus for enhancing noise-corrupted speech | |
CN109410977B (zh) | 一种基于EMD-Wavelet的MFCC相似度的语音段检测方法 | |
RU2329550C2 (ru) | Способ и устройство для улучшения речевого сигнала в присутствии фонового шума | |
Moattar et al. | A simple but efficient real-time voice activity detection algorithm | |
US6289309B1 (en) | Noise spectrum tracking for speech enhancement | |
US8073689B2 (en) | Repetitive transient noise removal | |
Verteletskaya et al. | Noise reduction based on modified spectral subtraction method | |
EP1386313B1 (en) | Speech enhancement device | |
Zhang et al. | A novel fast nonstationary noise tracking approach based on MMSE spectral power estimator | |
Zhang et al. | Fast nonstationary noise tracking based on log-spectral power mmse estimator and temporal recursive averaging | |
WO2020024787A1 (zh) | 音乐噪声抑制方法及装置 | |
KR101295727B1 (ko) | 적응적 잡음추정 장치 및 방법 | |
KR100784456B1 (ko) | Gmm을 이용한 음질향상 시스템 | |
Nasr et al. | Efficient implementation of adaptive wiener filter for pitch detection from noisy speech signals | |
Elshamy et al. | Two-stage speech enhancement with manipulation of the cepstral excitation | |
KR20000056371A (ko) | 가능성비 검사에 근거한 음성 유무 검출 장치 | |
KR100798056B1 (ko) | 높은 비정적인 잡음 환경에서의 음질 개선을 위한 음성처리 방법 | |
KR100270309B1 (ko) | 신호대 잡음비의 정규화에 의한 특징벡터 추출방법 | |
Islam et al. | Speech enhancement in adverse environments based on non-stationary noise-driven spectral subtraction and snr-dependent phase compensation | |
Ghoreishi et al. | A hybrid speech enhancement system based on HMM and spectral subtraction | |
KR100194953B1 (ko) | 유성음 구간에서 프레임별 피치 검출 방법 | |
Dionelis | On single-channel speech enhancement and on non-linear modulation-domain Kalman filtering | |
Alatwi et al. | A Smoothed and Thresholded Linear Prediction Analysis for Efficient Speech Coding. | |
Verteletskaya et al. | Enhanced spectral subtraction method for noise reduction with minimal speech distortion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |