KR20010032390A - 잡음 억제 방법 및 장치 - Google Patents

잡음 억제 방법 및 장치 Download PDF

Info

Publication number
KR20010032390A
KR20010032390A KR1020007005629A KR20007005629A KR20010032390A KR 20010032390 A KR20010032390 A KR 20010032390A KR 1020007005629 A KR1020007005629 A KR 1020007005629A KR 20007005629 A KR20007005629 A KR 20007005629A KR 20010032390 A KR20010032390 A KR 20010032390A
Authority
KR
South Korea
Prior art keywords
noise
signal
input signal
band spectrum
recognizable
Prior art date
Application number
KR1020007005629A
Other languages
English (en)
Other versions
KR100330230B1 (ko
Inventor
이사벨스티븐에이취.
Original Assignee
윤종용
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 윤종용, 삼성전자 주식회사 filed Critical 윤종용
Publication of KR20010032390A publication Critical patent/KR20010032390A/ko
Application granted granted Critical
Publication of KR100330230B1 publication Critical patent/KR100330230B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02168Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Abstract

본 발명은 잡음과 음성의 조합을 반송하는 입력 신호내의 잡음을 억제하는 방법 및 장치를 개시한다. 본 발명에서는 입력 신호를 신호 블록들로 분할하고, 이들 신호 블록들을 처리하여 입력 신호의 단기간 인지가능 대역 스펙트럼 추정치를 제공하고, 각종 시점에서 입력 신호가 잡음만의 신호를 반송하는지 또는 잡음과 음성의 조합을 반송하는지를 판단하여 입력 신호가 잡음만의 신호를 반송하는 경우 그에 대응하는 입력 신호의 단기간 인지가능 대역 스펙트럼 추정치를 사용해서 잡음의 장기간 인지가능 대역 스펙트럼 추정치를 갱신하고, 잡음의 장기간 인지가능 대역 스펙트럼 추정치와 입력 신호의 단기간 인지가능 대역 스펙트럼 추정치에 근거하여 잡음 억제 주파수 응답을 결정하며, 잡음 억제 주파수 응답에 따라 입력 신호의 현재 블록을 성형한다.

Description

잡음 억제 방법 및 장치{NOISE SUPPRESSION FOR LOW BITRATE SPEECH CODER}
본 발명의 기술적 배경은 다음의 종래 기술 문헌에서 볼 수 있다.
″ENHANCED VARIABLE RATE CODEC, SPEECH SERVICE OPTION 3 FOR WIDEBAND SPREAD SPECTRUM DIGITAL SYSTEM″, TIA/EIA/IS-127 Standard.
″THE STUDY OF SPEECH/PAUSE DETECTORS FOR SPEECH ENHANCEMENT METHODS″, P. Sovka and P. Pollak, Eurospeech 95 Madrid, 1995, pp. 1575-1578.
″SPEECH ENHANCEMENT USING A MINIMUM MEAN-SQUARE ERROR SHORT-TIME SPECTRAL AMPLITUDE ESTIMATOR″, Y. Ephraim, D. Malah, IEEE Transactions on Acoustics Speech and Signal Processing, Vol. ASSP-32, No. 6, Dec. 1984, pp. 1105-1121.
″SUPPRESSION OF ACOUSTIC NOISE USING SPECTRAL SUBTRACTION″, S. Boll, IEEE Transactions on Acoustics Speech and Signal Processing, Vol. ASSP-27, No. 2, April, 1979, pp. 113-120.
″STATICAL-MODEL-BASED ENHANCEMENT SYSTEMS″, Proceedings of the IEEE, Vol. 80, No. 10, October 1992, pp. 1526-1544.
복잡도가 낮은 잡음 억제 알고리즘으로서는 스펙트럼 변형 기법(이 기법은 스펙트럼 감법으로서도 알려져 있음)을 사용하는 것이 있다. 이와 같이 스펙트럼 변형 기법을 사용하는 잡음 억제 알고리즘에서는, 먼저 잡음이 있는 함유(이하에서는 간단히 “잡음 함유”라고 함)(noisy) 음성 신호를 수개의 주파수 대역으로 분할하고, 그다음 전형적으로 그 대역에서 추정되는 신호 대 잡음 비를 기초로 하는 이득을 각 대역에 대해 계산하며, 그다음 이들 이득을 적용하여 신호를 재계산한다. 이같은 유형의 방식에서는 그 관찰하는 잡음 함유 음성 신호로부터 신호 및 잡음 특성을 추정해야만 한다. 스펙트럼 변형 기법의 수개의 구현예는 다음과 같은 미국 특허들 즉, 5,687,285; 5,680,393; 5,668,927; 5,659,622; 5,651,071; 5,630,015; 5,625,684; 5,621,850; 5,617,505; 5,617,472; 5,602,962; 5,577,161; 5,555,287; 5,550,924; 5,544,250; 5,539,859; 5,533,133; 5,530,768; 5,479,560; 5,432,859; 5,406,635; 5,402,496; 5,388,182; 5,388,160; 5,353,376; 5,319,736; 5,278,780; 5,251,263; 5,168,526; 5,133,013; 5,081,681; 5,040,156; 5,012,519; 4,908,855; 4,897,878; 4,811,404; 4,747,143; 4,737,976; 4,630,305; 4,630,304; 4,628,529; 4,468,804에서 볼 수 있다.
스펙트럼 변형 기법은 수개의 바람직한 특성을 가진다. 첫째, 그 기법은 적응적이어서, 잡음 환경 변화에 대응할 수 있다. 둘째, 대다수의 계산을 이산 푸리에 변환(discrete Fourier transform: DFT) 도메인에서 수행할 수 있다. 따라서, (고속 푸리에 변환(fast Fourier transform: FFT)과 같은) 고속 알고리즘을 사용할 수 있다.
그러나, 현재의 기술 수준에서는 수개의 단점이 존재하는데, 이들 단점의 예로서는 다음과 같은 것들이 있다.
(ⅰ) 높은 잡음 레벨을 적절하게 조절할 때 원하는 음성 신호의 바람직하지 못한 왜곡(이러한 왜곡의 원인으로서는 수개가 존재하는데, 이들 중의 몇 개에 대해서는 후술하겠다.).
(ⅱ) 과도한 계산상의 복잡도.
본 발명은 비트 전송 속도가 낮은 음성 코더(low-bitrate speech coder)에 대한 프론트 엔드(front end)로서 사용하는데 적합한 잡음 억제 기법(noise suppression technique)에 관한 것으로서, 본 발명의 잡음 억제 기법은 셀룰러 전화 분야(cellular telephony application)에 사용하기에 특히 적합하다.
도 1은 본 발명에 따른 잡음 억제 알고리즘의 블록도
도 2는 본 발명에 따른 입력 신호 처리 블록을 도시한 도면
도 3은 이산 푸리에 변환(DFT) 빈들을 가지며 서로 다른 대역폭을 가진 각종 잡음 스펙트럼 대역(NS 대역)들간의 상관관계를 도시한 도면
도 4는 음성/중지 검출부의 한 가지 가능한 실시 예에 대한 블록도
도 5는 잡음 함유 음성의 에너지 지수의 일 예를 제공하는 파형도
도 6은 잡음 함유 음성의 스펙트럼 전이 지수의 일 예를 제공하는 파형도
도 7은 잡음 함유 음성의 유사 지수의 일 예를 제공하는 파형도
도 8은 잡음 함유 음성 신호를 모델링 하는 단일-상태 기계를 도시한 도면
도 9는 구분적-일정 주파수 응답을 도시한 도면
도 10은 도 9에 도시한 구분적-일정 주파수 응답에 대한 평활화를 도시한 도면
따라서, 종래 기술의 문제점들을 해결할 수 있는 잡음 억제 기법을 제공하는 것이 바람직할 것이다. 특히, 블록 기반(block based) 잡음 억제 기법에서 전형적인 시간 도메인 불연속성을 감안한 잡음 억제 기법을 제공하는 것이 바람직할 것이다. 또한, 스펙트럼 감법에 내재하는 주파수 도메인 불연속성으로 인한 왜곡을 감소시키는 기법을 제공하는 것이 바람직할 것이다. 또한, 잡음 억제시의 스펙트럼 성형 동작의 복잡도를 감소시키고 잡음 억제 기법에서 추정한 잡음 통계의 신뢰도를 증가시키는 것이 바람직할 것이다.
따라서, 본 발명은 이들 및 기타 다른 장점을 가진 잡음 억제 기법을 제공하고자 하는 것이다.
본 발명에 따르면, 잡음 억제 기법이 제공되는데, 이 기법에서는 블록 기반 억제 기법에서 전형적인 시간 도메인 불연속성으로 인한 왜곡을 감소시킨다. 또한, 이 기법에서는, 스펙트럼 감법에서의 고유한 주파수 도메인 불연속으로 인한 왜곡도 감소시킴은 물론이고, 잡음 억제 프로세스에서 사용되는 스펙트럼 성형 처리의 복잡성도 감소시킨다. 본 발명은 또한 개선된 음성 활성 검출부를 사용하여 추정 잡음 통계의 신뢰성을 증대시킨다.
본 발명에 일 실시예에 따른 잡음과 음성의 조합을 반송하는 입력 신호내의 잡음을 억제하는 방법에서는 입력 신호를 신호 블록들로 분할하고, 이들 신호 블록들을 처리하여 입력 신호의 단기간 인지가능 대역 스펙트럼 추정치(estimate of a short term perceptual band spectrum)를 제공하고, 각종 시점에서 입력 신호가 잡음만의 신호를 반송하는지 또는 잡음과 음성의 조합을 반송하는지를 판단하여 입력 신호가 잡음만의 신호를 반송하는 경우 그에 대응하는 입력 신호의 단기간 인지가능 대역 스펙트럼 추정치를 사용해서 잡음의 장기간 인지가능 대역 스펙트럼 추정치(estimate of a long term perceptual band spectrum)를 갱신하고, 잡음의 장기간 인지가능 대역 스펙트럼 추정치와 입력 신호의 단기간 인지가능 대역 스펙트럼 추정치에 근거하여 잡음 억제 주파수 응답을 결정하며, 잡음 억제 주파수 응답에 따라 입력 신호의 현재 블록을 성형한다.
본 발명의 방법은 입력 신호를 사전 필터링하여 그의 고주파수 응답 성분을 강조하는단계를 더 포함한다. 예시적인 실시예에서는, 입력 신호를 처리하는단계가 신호 블록들에 대해 이산 푸리에 변환을 적용하여 각 블록의 복소수값 주파수 도메인 표현을 제공하는단계와, 블록의 주파수 도메인 표현을 크기만의 신호로 변환하는단계와, 크기만의 신호들을 이산 주파수 대역들에 걸쳐 평균화하여 인지가능-대역 스펙트럼으로서 제공하는단계와, 인지가능-대역 스펙트럼의 시간 변동분들을 평활화하여 단기간 인지가능 대역 스펙트럼 추정치를 제공하는단계를 포함한다.
본 발명에서는, 잡음 억제 주파수 응답을 입력 신호의 현재 블록을 성형하는데 사용하기 위한 전극 필터(all-pole filter)를 사용하여 모델링할 수 있다.
본 발명의 다른 실시예에 따른 잡음과 음성의 조합을 반송하는 입력 신호내의 잡음을 억제하기 위한 장치는 입력 신호를 사전 필터링하여 그 신호의 고주파수 성분을 강조할 수 있는 것으로서 입력 신호를 블록들로 분할하는 신호 전처리부와, 블록들을 처리하여 입력 신호의 복소수값 주파수 도메인 스펙트럼을 제공하는 고속 푸리에 변환 처리기와, 복소수값 주파수 도메인 스펙트럼을 폭이 동일하지 않은 주파수 대역들을 포함하는 장기간 인지가능-대역 스펙트럼으로 누적시키는 누적기(accumulator)와, 장기간 인지가능-대역 스펙트럼을 필터링하여 장기간 인지가능-대역 스펙트럼의 현재 세그먼트와 잡음을 포함하는 단기간 인지가능-대역 스펙트럼의 추정치를 발생하는 필터와, 입력 신호가 소정 시점에서 잡음만 인지 또는 잡음과 음성의 조합인지를 판단하는 음성/중지 검출부(speech/pause detector)와, 입력 신호가 잡음만의 신호인 경우 음성/중지 검출부에 응답하여 입력 신호의 단기간 인지가능 대역 스펙트럼에 근거해서 잡음의 장기간 인지가능 대역 스펙트럼 추정치를 갱신하는 잡음 스펙트럼 추정기와, 잡음 스펙트럼 추정기에 응답하여 잡음 억제 주파수 응답을 결정하는 스펙트럼 이득 처리기와, 스펙트럼 이득 처리기에 응답하여 입력 신호의 현재 블록을 성형해서 그 신호 내의 잡음을 억제하는 스펙트럼 성형 처리기를 포함한다.
본 발명의 또 다른 실시예에 따른 잡음과 오디오 정보를 반송하는 입력 신호내의 잡음을 억제하는 방법은 주파수 도메인에서 입력 신호에 대한 잡음 억제 주파수 응답을 계산하는단계와, 그 계산된 잡음 억제 주파수 응답을 주파수 도메인에서 입력 신호에 대해 적용하여 입력 신호내의 잡음을 억제하는단계를 포함한다. 본 발명에 따른 방법은 입력 신호의 잡음 억제 주파수 응답을 계산하기 전에 입력 신호를 블록들로 분할하는단계를 더 포함한다. 예시적인 실시 예에서는, 잡음 억제 주파수 응답의 자기상관 함수(autocorrelation function)를 결정하는 것에 의해서 발생된 전극 필터를 사용하여 잡음 억제 주파수 응답을 입력 신호에 적용한다.
본 발명에 따른 잡음 억제 알고리즘에서는, 시변 필터 응답(time varying filter response)을 계산하여 그 결과를 잡음 함유 음성에 적용한다. 이 알고리즘의 블록도를 도 1에 도시한다. 도 1에서, ″AR 파라미터 계산(AR parameter computation)″ 블록 및 ″AR 스펙트럼 성형(AR spectral shaping)″ 블록은 시변 필터 응답의 적용에 관련되며, ″AR″은 ″자동-회귀(auto-regressive)″를 의미한다. 도 1의 다른 모든 블록은 잡음 음성으로부터의 시변 필터 응답을 계산하는 것에 대응한다.
신호 전처리부(preprocessor)(10)는 잡음 함유 입력 신호를 간단한 고역 통과 필터에 의해서 사전 처리하여 그 신호의 고주파수를 약간 강조한다. 전처리부는 그다음 그 필터링된 신호를 수개의 블록으로 분할하며, 이들 블록은 고속 푸리에 변환(FFT) 모듈(12)에 전달된다. FFT 모듈(12)은 그들 신호 블록에 윈도우(window)를 적용하고 또한 그 신호에 이산 푸리에 변환을 적용한다. 그 결과에 따른 복소수값의 주파수 도메인 표현(complex-valued frequency domain representation)은 소정의 처리를 통해 크기만의 신호(magnitude-only signal)로서 발생된다. 이들 크기만의 신호 값은 이산 주파수 대역(disjoint frequency band)들에서 평균화되어 ″인지가능-대역 스펙트럼(perceptual-band spectrum)″으로서 발생된다. 이러한 평균화 처리는 처리해야만 하는 데이터의 양을 감소시킨다.
인지가능-대역 스펙트럼에서의 시간 변동은 신호/잡음 스펙트럼 추정 모듈(14)에서 평활화되어 입력 신호의 단기간 인지가능-대역 스펙트럼의 추정치로서 발생된다. 이 추정치는 음성/중지(speech/pause) 검출부(16), 잡음 스펙트럼 추정기(18) 및 스펙트럼 이득 계산 모듈(20)에 인가된다.
음성/중지 검출부(16)는 현대의 입력 신호가 단순히 잡음인지 또는 음성과 잡음이 조합된 것인지를 판단한다. 이러한 판단은 입력 음성 신호의 수개의 특성을 측정하고, 이들 측정치를 사용하여 입력 신호의 모델을 갱신하며, 이 모델의 상태를 이용해서 최종 음성/중지 판단을 행하는 식으로 이루어진다. 이러한 판단 결과는 그다음 잡음 스펙트럼 추정기에 전달된다.
음성/중지 검출부(16)에 의해 입력 신호가 잡음만으로 이루어져 있다고 판단되면, 잡음 스펙트럼 추정기(18)는 현재의 인지가능-대역 스펙트럼을 이용해서 잡음의 인지가능-대역 스펙트럼 추정치를 갱신한다. 또한, 잡음 스펙트럼 추정기의 어떤 파라미터들은 그 추정기 모듈에서 갱신되어 음성/중지 검출부(16)에 다시 전달된다. 잡음의 인지가능-대역 스펙트럼 추정치는 그다음 스펙트럼 이득 계산 모듈(20)에 전달된다.
스펙트럼 이득 계산 모듈(20)은 현재 신호의 인지가능-대역 스펙트럼 추정치와 잡음의 인지가능-대역 스펙트럼 추정치를 이용하여 잡음 억제 주파수 응답을 판단한다. 이 잡음 억제 주파수 응답은 도 9에 도시한 바와 같이 구분적-일정(piecewise-constant) 주파수 응답이다. 각각의 구분적-일정 세그먼트는 임계 대역 세그먼트의 한 요소에 대응한다. 이 주파수 응답은 AR 파라미터 계산 모듈(22)에 전달된다.
AR 파라미터 계산 모듈은 전극(all-pole) 필터에 의해 잡음 억제 주파수 응답을 모델링한다. 이 잡음 억제 주파수 응답은 구분적-일정 주파수 응답이기 때문에, 그의 자기-상관 함수(auto-correlation function)는 폐쇄 형태로(in closed form) 용이하게 결정될 수 있다. 전극-필터 파라미터들은 이때 자기-상관 함수로부터 효율적으로 계산될 수 있다. 구분적-일정 스펙트럼의 전극 모델링은 잡음 억제에서의 불연속성을 평활화하는 효과를 나타낸다. 당연히 알 수 있듯이, 전극 필터를 사용하는 대신에 현재 알려진 또는 차후 개발될 다른 모델링 기법을 사용할 수도 있을 것인데, 이러한 모든 등가물을 본 발명의 범주에 포함시키고자 한다.
AR 스펙트럼 성형 모듈(24)은 AR 파라미터들을 이용해서 입력 신호의 현재 블록에 필터를 적용한다. 시간 도메인에서 스펙트럼 성형을 실시하는 것에 의해, 블록 처리로 인한 시간 불연속성이 감소된다. 또한, 잡음 억제 주파수를 하위(low-order) 전극 필터에 의해서 모델링하기 때문에, 어떤 프로세서들에서는 시간 도메인 성형을 더욱 더 효과적으로 실시할 수도 있다.
전위처리 모듈(10)에서는, 신호를 먼저 H(z)=1-0.8z-1형태의 고역 통과 필터에 의해서 사전 강조한다. 이 고역 통과 필터는 음성에 내재하는 스펙트럼 경사를 부분적으로 보상할 수 있는 것이 선택된다. 이런 식으로 사전 처리된 신호들은 보다 정확한 잡음 주파수 응답을 발생한다.
도 2에 도시한 바와 같이, 입력 신호(30)는 (샘플링 주파수가 8㎑이고 지속기간이 10㎳인) 80개 샘플의 블록들로 처리된다. 이들 블록을 분석 블록(34)으로서 도시했다. 분석 블록(34)은 도시한 바와 같이 80개 샘플의 길이를 가진다. 더욱 구체적으로 말해서, 도시한 실시예에서, 입력 신호는 128개 샘플의 블록들로 분할된다. 각 블록은 이전 블록으로부터의 최종 24개 샘플(32)과, 80개 새로운 샘플의 분석 블록(34)과, ″0″의 24개 샘플(36)로 이루어진다. 각 블록은 해밍 윈도우(Hamming window)에 의해서 윈도우화되며 푸리에 변환된다.
블록 구조에서의 암시적인 제로-패딩(zero-padding)을 더 설명할 필요가 있다. 특히, 신호 처리면에서 볼 때, 제로-패딩은 불필요한데, 이는 이산 푸리에 변환에 의해 (후술하는) 스펙트럼 성형을 실시하지 않기 때문이다. 그러나, 제로-패딩을 포함시키면, 그 알고리즘을 본 발명의 양수인인 Solana Technology Development Corporation이 구현한 기존의 EVRC 음성 코덱(voice codec)에 통합시키는 것이 용이하다. 이러한 블록 구조는 기존 EVRC의 전체 버퍼 관리 방식의 어떠한 변경도 요구하지 않는다.
각각의 잡음 억제 프레임은 128-포인트 시퀀스로서 나타낼 수 있다. 이 시퀀스를 g[n]으로 표기하면, 신호 블록의 주파수-도메인 표현은 다음과 같은 수학식 1의 이산 주파수 변환으로서 정의될 수 있다.
상기 수학식 1에서, C는 비정규화 상수이다.
신호 스펙트럼은 그다음 다음의 수학식 2와 같이 서로 폭이 다른 대역들로 누적된다.
여기서,
상기한 신호 스펙트럼은 인지가능-대역 스펙트럼으로서 언급된다. 상기한 대역들은 도 3에서 대역(50)으로서 도시된다. 도시한 바와 같이, 잡음 스펙트럼 대역들(NS 밴드)은 서로 다른 폭을 가지며 이산 푸리에 변환(DFT) 빈(bin)들과 상관관계를 갖는다.
신호와 잡음이 합해진 조합의 인지가능-대역 스펙트럼 추정치는 모듈(도 1의 14)에서 인지가능-대역 스펙트럼을 예를 들어 단극(single-pole) 순환 필터에 의해 필터링하는 것에 의해서 발생된다. 신호와 잡음이 합해진 조합의 전력 스펙트럼 추정치는 다음의 수학식 3과 같다.
음성의 특성은 비교적 단기간에 걸쳐 정적이기 때문에, 필터 파라미터 β는 단지 몇 개의(예를 들어 2개 내지 4개의) 잡음 억제 블록에 걸쳐 평활 처리를 수행하도록 선택된다. 이 평활 처리는 ″단기간(short-time)″ 평활 처리로서 언급되는 것으로서, ″단기간 인지가능-대역 스펙트럼″의 추정치를 제공한다.
잡음 억제 시스템은 적절한 기능 수행을 위해 정확한 잡음 통계 추정치를 필요로 한다. 이 기능은 음성/중지 검출부 모듈(16)에 의해서 제공된다. 하나의 가능한 실시예에서는, 단일의 마이크로폰에 의해 음성과 잡음을 모두 측정한다. 잡음 억제 알고리즘은 잡음 통계 추정치를 필요로 하기 때문에, 잡음을 함유한 음성 신호와 잡음만의 신호를 구별하기 위한 방법이 필요하다. 이 방법은 기본적으로 잡음 함유 음성의 중지를 검출해야만 하는데, 이러한 작업은 다음과 같은 수개의 요인으로 인해서 더욱 어렵게 된다.
1. 중지 검출은 (0㏈ 내지 5㏈ 정도의) 작은 신호 대 잡음 비로 적절히 수행되어야 한다.
2. 중지 검출은 배경 잡음 통계의 완만한 변동에 민감하기 않아야 한다.
3. 중지 검출은 잡음과 같은 음성(예를 들어, 마찰음)과 배경 잡음을 정확하게 구별해야만 한다.
음성/중지 검출부(16)의 한가지 가능한 실시예에 대한 블록도를 도 4에 도시한다.
중지 검출부는 현재 발생되고 있는 잡음 함유 음성 신호를 유한 수의 신호 모델들간에서 전환시키는 것에 의해 모델링한다. 유한-상태 기계(finite-state machine: FSM)(64)는 모델들간의 전이를 관리한다. 음성/일시정지 판정은 현재 신호에 대한 측정치 및 기타 다른 적절한 상태 변수와 함께 현재 FSM 상태의 함수이다. 상태들 간의 전이는 현재 FSM 상태와 현재 신호에 대한 측정치의 함수이다.
후술하는 측정된 값들은 신호-상태 상태 기계(64)를 구동시키는 이진(binary)값의 파라미터를 결정하는데 사용된다. 일반적으로, 이들 이진값의 파라미터는 정확한 실수값의 측정치를 적응적 임계값과 비교하는 것에 의해서 결정된다. 신호 측정 모듈(60)이 제공하는 신호 측정치에 의해서 다음과 같은 신호 특성이 정량화된다.
1. 에너지 지수에 의해서는 신호가 큰 에너지를 갖는지 또는 작은 에너지를 갖는지가 판단된다. 이 신호 에너지 E[i]는 다음의 수학식 4로서 정의된다.
잡음 함유 음성의 에너지 지수에 대한 일 예는 도 5에 도시된다. 도 5에서는, 개별 음성 샘플의 진폭을 커브(70)로 나타냈고, 대응하는 NS 블록의 에너지 지수를 커브(72)로 나타냈다.
2. 스펙트럼 전이 지수에 의해서는 신호 스펙트럼이 단기간의 윈도우에 걸쳐 정상 상태(steady-state)에 있는지 또는 전이 상태에 있는지가 판단된다. 이 스펙트럼 전이 지수는 인지가능 대역 스펙트럼의 각 대역에 대한 경험적인 평균치 및 변동분을 결정하는 것에 의해 계산된다. 인지가능 대역 스펙트럼의 모드 대역에 대한 변동분들의 합은 스펙트럼 전이 지수로서 사용된다. 구체적으로 말해서, 전이 지수 Ti는 다음과 같이 계산된다. 인지가능 대역 스펙트럼의 각 대역에 대한 평균치는 다음의 수학식 5와 같은 단극 순환 필터에 의해서 계산된다.
인지가능 스펙트럼의 각 대역에 대한 변동분은 순환 필터에 의해서 계산된다.
필터 파라미터 α는 비교적 장기간 즉 10 내지 1 잡음 블록에 걸쳐 평활 처리를 수행하도록 선택된다. 전체적인 변동분은 다음의 수학식 7과 같은 각 대역에 대한 변동분의 합으로서 계산된다.
주목해야 할 것은,의 변동분 자체는 인지가능 대역 스펙트럼이 그의 장기간 평균치로부터 크게 변하지 않을 때에 가장 작다는 것이다. 적절한 스펙트럼 전이 지수는의 변동분으로서, 이것은 다음의 수학식 8과 수학식 9에 의해서 계산된다.
적응적 시정수 ωi는 다음의 수학식 10으로 주어진다.
이 시정수를 적응시키는 것에 의해, 스펙트럼 전이 지수는 정적인 신호의 위치들을 적절히 추적하게 된다. 잡음 음성의 스펙트럼 지수는 도 6에 도시된다. 도 6에서는, 개별 음성 샘플의 진폭을 커브(74)로 나타냈고, 대응하는 NS 블록의 에너지 지수는 커브(75)로 나타냈다.
3. 스펙트럼 유사(similarity) 지수 SSi에 의해서는 현재 신호 스펙트럼과 추정 잡음 스펙트럼의 유사 정도가 측정된다. 스펙트럼 유사 지수를 정의하기 위해, 잡음의 인지가능 대역 스펙트럼 Ni[k]에 대한 로그 추정치가 이용가능한 것으로 가정한다(Ni[k]의 정의는 잡음 스펙트럼 추정기에 대한 설명과 관련해서 후술하겠다.). 스펙트럼 유사 지수는 이때 다음의 수학식 11과 같이 정의된다.
잡음의 스펙트럼 유사 지수에 대한 일 예를 도 7에 도시했다. 도 7에서는, 개별 음성 샘플의 진폭을 커브(76)로 나타냈고, 대응하는 NS 블록의 에너지 지수를 커브(78)로 나타냈다. 주목할 것은, 낮은 값의 스펙트럼 유사 지수는 상당히 유사한 스펙트럼들에 대응하는 반면에, 높은 값의 스펙트럼 유사 지수는 상이한 스펙트럼들에 대응한다는 것이다.
4. 에너지 유사 지수에 의해서는 다음의 수학식 12와 같은 현재 신호 에너지와 추정 잡음 에너지의 유사 여부가 판단된다.
이같은 유사 여부는 신호 에너지를 임계치 적용 모듈(62)이 적용하는 임계치와 비교함으로써 판단된다. 실제 임계치는 임계치 계산 프로세서(66)에 의해 계산된다. 임계치 계산 프로세서(66)는 마이크로프로세서일 수 있다.
이진 파라미터들은 신호 스펙트럼의 현재 추정치를 S[k]로 표기하고, 신호 에너지의 현재 추정치를 Ei로 표기하고, 로그 잡음 스펙트럼의 현재 추정치를 Ni[k]로 표기하고, 잡음 에너지의 현재 추정치를로 표기하며, 잡음 에너지 추정치의 변동분을로 표기하는 것에 의해 정의된다.
파라미터 ″고_저_에너지″는 신호가 높은 에너지를 갖는 지의 여부를 나타낸다. 고 에너지는 배경 잡음의 추정 에너지에 대해 정의되는 것으로서, 그것은 현재 신호 프레임의 에너지를 추정하고 임계치를 적용하는 것에 의해 계산되며 다음의 수학식 12로서 정의된다.
수학식 13에서, E는 다음의 수학식 14에 의해서 정의되며, Ei는 적응적 임계치이다.
파라미터 ″전이″는 신호 스펙트럼이 전이하고 있는 때를 나타낸다. 이 파라미터 전이는 신호 스펙트럼으로부터 현재 단기간 스펙트럼의 이탈을 관찰하는 것에 의해 측정된다. 수학적으로, 그 파라미터 전이는 다음의 수학식 15에 의해서 정의된다
수학식 15에서, T는 전술한 바와 같이 정의한 스펙트럼 지수이며, Ti는 더욱 상세히 후술하는 바와 같이 적응적으로 계산한 임계치이다.
파라미터 ″스펙트럼_유사성″에 의해서 현재 신호 스펙트럼과 추정 잡음 스펙트럼간의 유사성이 측정되는데, 이 파라미터는 현재 신호의 로그 스펙트럼과 잡음의 추정 로그 스펙트럼간의 거리를 측정하는 것에 의해 측정된다.
수학식 16에서, SSi는 전술한 바와 같은 것이며, SSt는 후술하는 바와 같은 임계치(예를 들어, 상수)이다.
파라미터 ″에너지_유사성″에 의해서는 현재 신호의 에너지와 추정 잡음 에너지간의 유사성이 측정된다.
수학식 17에서, E는 다음의 수학식 18에 의해서 정의되며, ESi는 후술하는 바와 같이 적응적으로 계산한 임계치이다.
상술한 변수들 모두는 수를 임계치와 비교하는 것에 의해서 계산된다. 앞쪽의 3개의 임계치는 동적 신호의 특성들을 반영하는 것으로서 잡음의 특성들에 의존한다. 이들 3개의 임계치는 추정 평균치와 다수의 표준 편차와의 합이다. 스펙트럼 유사성에 대한 임계치는 잡음의 특정한 특성에 의존하지 않으며 일정한 값으로 설정될 수 있다.
고/저 에너지 임계치는 임계치 계산 프로세서(도 4의 66)에 의해 다음과 같은 수학식 19로서 계산된다.
수학식 19에서,는 다음과 같은 수학식 20으로서 정의된 경험적인 변동분이며,는 다음과 같은 수학식 21로서 정의된 경험적인 평균치이다.
에너지 유사성 임계치는 다음의 수학식 22로서 계산된다.
주목할 것은, 에너지 유사성 임계치의 증가 속도는 본 예에서 1.05의 계수에 의해 제한된다. 따라서, 그 임계치는 높은 잡음 에너지에 의해서 부적절한 영향을 받지 않게 된다.
스펙트럼 전이 임계치는로서 계산된다. 스펙트럼 유사성 임계치는 SSi=10의 상태로 일정하다.
잡음 함유 신호를 모델링하는 신호-상태 상태 기계(64)는 도 8에 더욱 상세히 도시된다. 이 상태 기계의 상태 전이는 전술한 신호 측정에 의해 좌우된다. 신호 상태들은 정상-상태 저 에너지(80), 전이(82) 및 정상-상태 고 에너지(84)이다. 정상-상태 저 에너지 상태 동안에는, 어떠한 스펙트럼 전이도 발생되지 않으며 신호 에너지는 임계치 아래에 있다. 전이 상태 동안에는, 어떠한 스펙트럼 전이도 발생하지 않으며 신호 에너지는 임계치 위에 있다. 상태들 간의 전이는 상술한 신호 측정에 의해 좌우된다.
상태 기계 전이들은 다음과 같은 표 1에서 정의된다.
이 표에서, ″X″는 ″임의의 값″이다. 주목할 것은, 상태 전이는 어떤 측정의 경우에도 보증된다.
검출부(16)가 제공하는 음성/중지 판정은 신호-상태 상태 기계의 현재 상태에 의존하며 또한 도 4와 관련하여 설명한 신호 측정에 의존한다. 음성/중지는 다음의 의사코드(중지: dec=0; 음성: dec=1)에 의해서 좌우된다.
dec = 1;
스펙트럼-유사성 == 1 이면
dec = 0;
그외에, 현재 상태 == 1 이면
에너지-유사성 == 1 이면
dec = 0;
잡음 스펙트럼은 다음의 수학식을 사용하여 중지로서 분류한 프레임 동안 잡음 파라미터 추정 모듈(도 4의 68)에 의해서 추정된다.
수학식 23에서, β는 0과 1사이의 상수이다. 잡음 에너지의 현재 추정치및 잡음 추정치은 다음의 수학식 24 및 수학식 25로서 정의된다.
상기 수학식 24 및 수학식 25에서, 필터 상수 λ는 10개 내지 20개의 잡음 억제 블록을 평균화하기 위해 선택된다. 스펙트럼 이득은 당해 기술 분야에 잘 알려진 각종 방법에 의해서 계산된다. 다음과 같은 수학식 26으로서 신호 대 잡음 비를 정의하는 것을 포함하는 현재의 구현에 적합한 한가지 방법은 상술한 바와 같다.
수학식 26에서, c는 상수이며, Su[k] 및 Ni[k]는 상술한 바와 같다. 이득의 잡음 종속 성분은 다음의 수학식 27로서 정의된다.
순간 이득은 다음의 수학식 28로서 계산된다.
일단 순간 이득을 계산한 후에는, 그 결과를 다음과 같은 수학식 29를 사용하여 평활화한다.
수학식 29에서, 벡터 Gs[k]는 시점 k에서 평활화된 채널 이득 벡터이다.
일단 목표 주파수 응답을 계산한 후에는, 그 결과를 잡음 함유 음성에 적용해야 한다. 이것은 잡음 함유 신호의 단기간 스펙트럼을 변형하는 (시변) 필터링 동작에 대응하며, 이 필터링 동작의 결과로써 잡음이 억제된 신호가 생성된다. 현재 실시하는 것과는 달리, 주파수 도메인에서의 스펙트럼 변형은 필요하지 않다. 실제로, 주파수 도메인 구현 방식은 다음과 같은 단점을 가질 수도 있다.
1. 주파수 도메인 구현 방식은 불필요하게 복잡할 수도 있다.
2. 주파수 도메인 구현 방식에 의하면, 잡음이 억제된 음성의 질이 저하될 수도 있다.
스펙트럼 성형의 시간 도메인 구현 방식은 성형 필터의 임펄스 응답을 선형 위상으로 할 필요가 없게 한다는 장점을 가진다. 또한, 시간 도메인 구현 방식에 의하면, 순환 콘벌루션(circular convolution)으로 인한 인공적인 결함의 발생가능성이 배제된다.
본 명세서에서 설명하는 스펙트럼 성형 기법은 복잡도가 낮은 필터를 설계하는 방법으로 이루어지는데, 이 방법은 그 필터에 의해 잡음 억제 주파수 응답을 구현한다. 이러한 필터는 AR 파라미터 계산 프로세서(22)가 제공하는 파라미터들에 근거한 AR 스펙트럼 성형 모듈(도 1의 24)에 의해서 제공된다.
원하는 주파수 응답은 도 9에 도시한 바와 같이 비교적 적은 수의 세그먼트에 걸친 구분적으로 일정한 주파수 응답이기 때문에, 그 응답의 자기-상관 함수는 폐쇄 형태로 효율적으로 결정될 수 있다. 자기-상관 계수가 주어지면, 구분적-일정 주파수 응답을 근사화하는 전극 필터가 결정될 수 있다. 이 방식은 여러 가지 장점을 제공한다. 첫째, 구분적-일정 주파수 응답에 관련된 스펙트럼 불연속성이 평활화된다. 둘째, FFT 블록 처리와 관련된 시간 불연속성이 제거된다. 셋째, 성형 처리가 시간 도메인에서 적용되기 때문에, 역 DFT가 필요하지 않다. 하위 전극 필터가 주어지면, 고정점(fixed point) 구현에서 계산상의 장점이 제공된다.
이러한 주파수 응답은 다음의 수학식과 같이 수학적으로 표현될 수 있다.
수학식 30에서, Gs[k]는 평활화된 채널 이득으로서 이 이득은 i번째 구분적-일정 세그먼트의 진폭을 설정하며, I(ω, ωi-1, ωi)는 주파수(ωi-1, ωi)에 의해서 경계가 정해지는 구간에 대한 지시기 함수(indicator function)이다. 즉, I(ω, ωi-1, ωi)는 ωi-1,〈ω〈ωi인 경우에는 1이고, 그렇지 않은 경우에는 0이다. 자기-상관 함수는 H2(ω)의 역 푸리에 변환 즉 다음의 수학식 31과 같다.
수학식 31에서, γi=(ωii-1)이며, βi=(ωi-1i)/2이다. 이러한 자기-상관 함수는 다음과 같은 수학식 32의 값들에 대한 룩업 테이블에 의해 용이하게 구현될 수 있다.
상기한 자기-상관 함수가 주어지면, 스펙트럼의 전극 모델은 수학식들의 해를 구함으로써 결정될 수 있다. 필요한 매트릭스 반전은 예를 들어 레비슨/더빈 순환(Levinson/Durbin recursion)에 의해서 효율적으로 계산될 수 있다.
순서적인 16개 필터에 의한 전극 모델링의 효율성에 대한 일 예를 도 10에 도시한다. 주목할 것은, 스펙트럼 불연속성이 평활화되었다는 것이다. 분명하게 알 수 있듯이, 모델은 전극 필터 순서가 증가함에 따라 더욱 더 정확하게 될 수 있으며, 16개의 필터 순서에 의해 적절한 계산상의 비용으로 양호한 성능이 제공된다.
AR 파라미터 계산 프로세서(22)가 계산한 파라미터들에 의해서 제공되는 전극 필터는 AR 스펙트럼 성형 모듈(24)에서 잡음 함유 입력 신호의 현재 블록에 적용됨으로써 스펙트럼적으로 성형된 출력 신호가 제공된다.
본 발명을 그의 특정 실시 예에 대해 설명하였으나, 당업자라면 알 수 있듯이, 특허청구범위에 기술한 본 발명의 범주를 벗어나지 않는 범위 내에서 다수의 변형 예 및 적용 예가 가능할 수도 있을 것이다.
이제 자명하듯이, 본 발명에 의하면, 각종 특유의 특징을 가진 잡음 억제 방법 및 장치가 제공된다. 특히, 입력 신호에 대한 상태 기계 모듈로 이루어진 음성 상태 검출부가 제공된다. 이 상태 기계는 입력 신호로부터의 다양한 측정치에 의해서 구동된다. 따라서, 이러한 구조에 의하면, 복잡도가 낮으면서도 음성/중지 판정이 아주 정확하게 된다. 또한, 잡음 억제 주파수 응답이 주파수 도메인에서 계산되나 시간 도메인에 적용된다. 따라서, 주파수 도메인에서 잡음 억제 주파수 응답을 적용하는 ″블록-기반″ 방법의 경우에 발생하는 시간 도메인 불연속성이 배제되는 효과가 제공된다. 또한, 잡음 억제 필터가 잡음 억제 주파수 응답의 자기-상관 함수를 결정하는 새로운 기법에 의해 설계된다. 따라서, 자기-상관 시퀀스가 전극 필터의 생성에 사용된다. 이 전극 필터는 어떤 경우 주파수 도메인 방법을 구현하는데 있어서 덜 복잡할 수도 있다.
비트 전송 속도가 낮은 음성 코더에 대한 프론트 엔드로서 사용하는 데 적합한 본 발명의 잡음 억제 기법은 셀룰러 전화 분야에 사용하기에 특히 적합하다.

Claims (14)

  1. 잡음과 음성의 조합을 반송하는 입력 신호내의 잡음을 억제하기 위한 방법으로서,
    상기 입력 신호를 신호 블록들로 분할하는 제1단계와;
    상기 신호 블록들을 처리하여 상기 입력 신호의 단기간 인지가능 대역 스펙트럼 추정치를 제공하는 제2단계와;
    각종 시점에서 상기 입력 신호가 잡음만의 신호를 반송하는지 또는 잡음과 음성의 조합을 반송하는지를 판단하여, 상기 입력 신호가 잡음만의 신호를 반송하는 경우에는, 그에 대응하는 상기 입력 신호의 단기간 인지가능 대역 스펙트럼 추정치를 사용해서 상기 잡음의 장기간 인지가능 대역 스펙트럼 추정치를 갱신하는 제3단계와;
    상기 잡음의 장기간 인지가능 대역 스펙트럼 추정치와 상기 입력 신호의 단기간 인지가능 대역 스펙트럼 추정치에 근거하여 잡음 억제 주파수 응답을 결정하는 제4단계와;
    상기 잡음 억제 주파수 응답에 따라 상기 입력 신호의 현재 블록을 성형하는 제5단계를 포함하는 잡음 억제 방법.
  2. 제1항에 있어서,
    상기 제2단계 전에 상기 입력 신호를 사전 필터링하여 그의 고주파수 응답 성분을 강조하는단계를 더 포함하는 것을 특징으로 잡음 억제 방법.
  3. 제2항에 있어서,
    상기 제2단계는:
    상기 신호 블록들에 대해 이산 푸리에 변환을 적용하여 각 블록의 복소수값 주파수 도메인 표현을 제공하는 단계와;
    상기 블록의 주파수 도메인 표현을 크기만의 신호로 변환하는 단계와;
    상기 크기만의 신호들을 이산 주파수 대역들에 걸쳐 평균화하여 인지가능-대역 스펙트럼으로서 제공하는 단계와;
    상기 인지가능-대역 스펙트럼의 시간 변동분들을 평활화하여 상기 단기간 인지가능 대역 스펙트럼 추정치를 제공하는 단계를 포함하는 것을 특징으로 잡음 억제 방법.
  4. 제3항에 있어서,
    상기 잡음 억제 주파수 응답을 상기 제5단계 동안 전극 필터를 사용하여 모델링하는 것을 특징으로 잡음 억제 방법.
  5. 제1항에 있어서,
    상기 잡음 억제 주파수 응답을 상기 제5단계 동안 전극 필터를 사용하여 모델링 하는 것을 특징으로 잡음 억제 방법.
  6. 제1항에 있어서,
    상기 제2단계는:
    상기 신호 블록들에 대해 이산 푸리에 변환을 적용하여 각 블록의 복소수값 주파수 도메인 표현을 제공하는 단계와;
    상기 블록의 주파수 도메인 표현을 크기만의 신호로 변환하는 단계와;
    상기 크기만의 신호들을 이산 주파수 대역들에 걸쳐 평균화하여 인지가능-대역 스펙트럼으로서 제공하는 단계와;
    상기 인지가능-대역 스펙트럼의 시간 변동분들을 평활화하여 상기 단기간 인지가능 대역 스펙트럼 추정치를 제공하는 단계를 포함하는 것을 특징으로 잡음 억제 방법.
  7. 잡음과 음성의 조합을 반송하는 입력 신호내의 잡음을 억제하기 위한 장치로서,
    상기 입력 신호를 블록들로 분할하는 신호 전처리부와;
    상기 블록들을 처리하여 상기 입력 신호의 복소수값 주파수 도메인 스펙트럼을 제공하는 고속 푸리에 변환 처리기와;
    상기 복소수값 주파수 도메인 스펙트럼을 폭이 동일하지 않은 주파수 대역들을 포함하는 장기간 인지가능-대역 스펙트럼으로 누적시키는 누적기와;
    상기 장기간 인지가능-대역 스펙트럼을 필터링하여 상기 장기간 인지가능-대역 스펙트럼의 현재 세그먼트와 잡음을 포함하는 단기간 인지가능-대역 스펙트럼의 추정치를 발생하는 필터와;
    상기 입력 신호가 현재 잡음만 인지 또는 잡음과 음성의 조합인지를 판단하는 음성/중지 검출부와;
    상기 입력 신호가 잡음만의 신호인 경우 상기 음성/중지 검출부에 응답하여 상기 입력 신호의 단기간 인지가능 대역 스펙트럼에 근거해서 상기 잡음의 장기간 인지가능 대역 스펙트럼 추정치를 갱신하는 잡음 스펙트럼 추정기와;
    상기 잡음 스펙트럼 추정기에 응답하여 잡음 억제 주파수 응답을 결정하는 스펙트럼 이득 처리기와;
    상기 스펙트럼 이득 처리기에 응답하여 상기 입력 신호의 현재 블록을 성형해서 그 신호내의 잡음을 억제하는 스펙트럼 성형 처리기를 포함하는 잡음 억제 장치.
  8. 제7항에 있어서,
    상기 스펙트럼 성형 처리기는 전극 필터를 포함하는 것을 특징으로 하는 잡음 억제 장치.
  9. 제6항에 있어서,
    상기 신호 전처리부는 상기 입력 신호를 사전 필터링하여 그 신호의 고주파수 성분을 강조하는 것을 특징으로 하는 잡음 억제 장치.
  10. 제7항에 있어서,
    상기 신호 전처리부는 상기 입력 신호를 사전 필터링하여 그 신호의 고주파수 성분을 강조하는 것을 특징으로 하는 잡음 억제 장치.
  11. 잡음과 오디오 정보를 반송하는 입력 신호내의 잡음을 억제하는 방법으로서,
    주파수 도메인에서 상기 입력 신호에 대한 잡음 억제 주파수 응답을 계산하는 제1단계와;
    상기 주파수 도메인에서 상기 입력 신호에 대해 상기 잡음 억제 주파수 응답을 적용하여 상기 입력 신호내의 잡음을 억제하는 제2단계를 포함하는 것을 특징으로 하는 잡음 억제 방법.
  12. 제11항에 있어서,
    상기 제1단계 전에 상기 입력 신호를 블록들로 분할하는 단계를 더 포함하는 것을 특징으로 하는 잡음 억제 방법.
  13. 제12항에 있어서,
    상기 잡음 억제 주파수 응답의 자기상관 함수를 결정하는 것에 의해서 발생된 전극 필터를 사용하여 상기 잡음 억제 주파수 응답을 상기 입력 신호에 적용하는 것을 특징으로 하는 잡음 억제 방법.
  14. 제11항에 있어서,
    기 잡음 억제 주파수 응답의 자기상관 함수를 결정하는 것에 의해서 발생된 전극 필터를 사용하여 상기 잡음 억제 주파수 응답을 상기 입력 신호에 적용하는 것을 특징으로 하는 잡음 억제 방법.
KR1020007005629A 1998-09-23 1999-09-22 잡음 억제 방법 및 장치 KR100330230B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US09/159,358 1998-09-23
US09/159,358 US6122610A (en) 1998-09-23 1998-09-23 Noise suppression for low bitrate speech coder
US9/159,358 1998-09-23
PCT/KR1999/000577 WO2000017855A1 (en) 1998-09-23 1999-09-22 Noise suppression for low bitrate speech coder

Publications (2)

Publication Number Publication Date
KR20010032390A true KR20010032390A (ko) 2001-04-16
KR100330230B1 KR100330230B1 (ko) 2002-05-09

Family

ID=22572262

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020017003777A KR20010075343A (ko) 1998-09-23 1999-09-15 저비트율 스피치 코더용 노이즈 억제 방법 및 그 장치
KR1020007005629A KR100330230B1 (ko) 1998-09-23 1999-09-22 잡음 억제 방법 및 장치

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020017003777A KR20010075343A (ko) 1998-09-23 1999-09-15 저비트율 스피치 코더용 노이즈 억제 방법 및 그 장치

Country Status (10)

Country Link
US (1) US6122610A (ko)
EP (1) EP1116224A4 (ko)
JP (1) JP2003517624A (ko)
KR (2) KR20010075343A (ko)
CN (2) CN1326584A (ko)
AU (2) AU6037899A (ko)
BR (1) BR9913011A (ko)
CA (2) CA2344695A1 (ko)
IL (1) IL136090A0 (ko)
WO (2) WO2000017859A1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020082643A (ko) * 2001-04-25 2002-10-31 주식회사 호서텔넷 고속 푸우리에 변환(fft) 및 역고속 푸우리에변환(ifft)을 이용한 송,수신기의 동기검출장치
KR100657912B1 (ko) * 2004-11-18 2006-12-14 삼성전자주식회사 잡음 제거 방법 및 장치
KR100784456B1 (ko) * 2005-12-08 2007-12-11 한국전자통신연구원 Gmm을 이용한 음질향상 시스템

Families Citing this family (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
US6453285B1 (en) * 1998-08-21 2002-09-17 Polycom, Inc. Speech activity detector for use in noise reduction system, and methods therefor
US6351731B1 (en) 1998-08-21 2002-02-26 Polycom, Inc. Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
KR100281181B1 (ko) * 1998-10-16 2001-02-01 윤종용 약전계에서 코드 분할 다중 접속 시스템의 코덱 잡음 제거 방법
US7177805B1 (en) * 1999-02-01 2007-02-13 Texas Instruments Incorporated Simplified noise suppression circuit
US6397177B1 (en) * 1999-03-10 2002-05-28 Samsung Electronics, Co., Ltd. Speech-encoding rate decision apparatus and method in a variable rate
US6507623B1 (en) * 1999-04-12 2003-01-14 Telefonaktiebolaget Lm Ericsson (Publ) Signal noise reduction by time-domain spectral subtraction
US6351729B1 (en) * 1999-07-12 2002-02-26 Lucent Technologies Inc. Multiple-window method for obtaining improved spectrograms of signals
US6980950B1 (en) * 1999-10-22 2005-12-27 Texas Instruments Incorporated Automatic utterance detector with high noise immunity
JP3878482B2 (ja) * 1999-11-24 2007-02-07 富士通株式会社 音声検出装置および音声検出方法
US6473733B1 (en) * 1999-12-01 2002-10-29 Research In Motion Limited Signal enhancement for voice coding
JP2001166782A (ja) * 1999-12-07 2001-06-22 Nec Corp 報知信号発生方法及び装置
US6317456B1 (en) * 2000-01-10 2001-11-13 The Lucent Technologies Inc. Methods of estimating signal-to-noise ratios
US9609278B2 (en) 2000-04-07 2017-03-28 Koplar Interactive Systems International, Llc Method and system for auxiliary data detection and delivery
DE10017646A1 (de) * 2000-04-08 2001-10-11 Alcatel Sa Geräuschunterdrückung im Zeitbereich
US6463408B1 (en) * 2000-11-22 2002-10-08 Ericsson, Inc. Systems and methods for improving power spectral estimation of speech signals
US7617099B2 (en) * 2001-02-12 2009-11-10 FortMedia Inc. Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile
EP1244094A1 (de) * 2001-03-20 2002-09-25 Swissqual AG Verfahren und Vorrichtung zur Bestimmung eines Qualitätsmasses eines Audiosignals
WO2003001173A1 (en) * 2001-06-22 2003-01-03 Rti Tech Pte Ltd A noise-stripping device
US6952482B2 (en) * 2001-10-02 2005-10-04 Siemens Corporation Research, Inc. Method and apparatus for noise filtering
KR100434723B1 (ko) * 2001-12-24 2004-06-07 주식회사 케이티 음성 신호특성을 이용한 돌발잡음 제거장치 및 그 방법
US8718687B2 (en) * 2002-03-26 2014-05-06 Zoove Corp. System and method for mediating service invocation from a communication device
US7949522B2 (en) 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US8326621B2 (en) * 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
US8271279B2 (en) 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US7593851B2 (en) * 2003-03-21 2009-09-22 Intel Corporation Precision piecewise polynomial approximation for Ephraim-Malah filter
US7330511B2 (en) 2003-08-18 2008-02-12 Koplar Interactive Systems International, L.L.C. Method and system for embedding device positional data in video signals
US7224810B2 (en) * 2003-09-12 2007-05-29 Spatializer Audio Laboratories, Inc. Noise reduction system
US9055239B2 (en) 2003-10-08 2015-06-09 Verance Corporation Signal continuity assessment using embedded watermarks
US7454332B2 (en) * 2004-06-15 2008-11-18 Microsoft Corporation Gain constrained noise suppression
US20060133621A1 (en) * 2004-12-22 2006-06-22 Broadcom Corporation Wireless telephone having multiple microphones
US7983720B2 (en) * 2004-12-22 2011-07-19 Broadcom Corporation Wireless telephone with adaptive microphone array
US20070116300A1 (en) * 2004-12-22 2007-05-24 Broadcom Corporation Channel decoding for wireless telephones with multiple microphones and multiple description transmission
US20060147063A1 (en) * 2004-12-22 2006-07-06 Broadcom Corporation Echo cancellation in telephones with multiple microphones
US8509703B2 (en) * 2004-12-22 2013-08-13 Broadcom Corporation Wireless telephone with multiple microphones and multiple description transmission
KR100738341B1 (ko) * 2005-12-08 2007-07-12 한국전자통신연구원 성대신호를 이용한 음성인식 장치 및 그 방법
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8744844B2 (en) * 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8150065B2 (en) 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US8934641B2 (en) 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
US8428661B2 (en) * 2007-10-30 2013-04-23 Broadcom Corporation Speech intelligibility in telephones with multiple microphones
US20090111584A1 (en) 2007-10-31 2009-04-30 Koplar Interactive Systems International, L.L.C. Method and system for encoded information processing
US8296136B2 (en) * 2007-11-15 2012-10-23 Qnx Software Systems Limited Dynamic controller for improving speech intelligibility
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US9142221B2 (en) * 2008-04-07 2015-09-22 Cambridge Silicon Radio Limited Noise reduction
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
CN101770776B (zh) 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理系统
US8582781B2 (en) 2009-01-20 2013-11-12 Koplar Interactive Systems International, L.L.C. Echo modulation methods and systems
US8715083B2 (en) 2009-06-18 2014-05-06 Koplar Interactive Systems International, L.L.C. Methods and systems for processing gaming data
USRE48462E1 (en) * 2009-07-29 2021-03-09 Northwestern University Systems, methods, and apparatus for equalization preference learning
CN102044241B (zh) * 2009-10-15 2012-04-04 华为技术有限公司 一种实现通信系统中背景噪声的跟踪的方法和装置
US20110125497A1 (en) * 2009-11-20 2011-05-26 Takahiro Unno Method and System for Voice Activity Detection
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
US8745403B2 (en) 2011-11-23 2014-06-03 Verance Corporation Enhanced content management based on watermark extraction records
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US8726304B2 (en) 2012-09-13 2014-05-13 Verance Corporation Time varying evaluation of multimedia content
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
JP6059003B2 (ja) * 2012-12-26 2017-01-11 パナソニック株式会社 歪み補償装置及び歪み補償方法
US9262793B2 (en) 2013-03-14 2016-02-16 Verance Corporation Transactional video marking system
US9485089B2 (en) 2013-06-20 2016-11-01 Verance Corporation Stego key management
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
WO2015138798A1 (en) 2014-03-13 2015-09-17 Verance Corporation Interactive content acquisition using embedded codes
US10504200B2 (en) 2014-03-13 2019-12-10 Verance Corporation Metadata acquisition using embedded watermarks
CN106068535B (zh) * 2014-03-17 2019-11-05 皇家飞利浦有限公司 噪声抑制
US9805434B2 (en) 2014-08-20 2017-10-31 Verance Corporation Content management based on dither-like watermark embedding
DE112015003945T5 (de) 2014-08-28 2017-05-11 Knowles Electronics, Llc Mehrquellen-Rauschunterdrückung
WO2016086047A1 (en) 2014-11-25 2016-06-02 Verance Corporation Enhanced metadata and content delivery using watermarks
US9942602B2 (en) 2014-11-25 2018-04-10 Verance Corporation Watermark detection and metadata delivery associated with a primary content
US9602891B2 (en) 2014-12-18 2017-03-21 Verance Corporation Service signaling recovery for multimedia content using embedded watermarks
US10257567B2 (en) 2015-04-30 2019-04-09 Verance Corporation Watermark based content recognition improvements
US10477285B2 (en) 2015-07-20 2019-11-12 Verance Corporation Watermark-based data recovery for content with multiple alternative components
WO2017184648A1 (en) 2016-04-18 2017-10-26 Verance Corporation System and method for signaling security and database population
WO2018237191A1 (en) 2017-06-21 2018-12-27 Verance Corporation ACQUISITION AND TREATMENT OF METADATA BASED ON A WATERMARK
US11468149B2 (en) 2018-04-17 2022-10-11 Verance Corporation Device authentication in collaborative content screening
CN112562701B (zh) * 2020-11-16 2023-03-28 华南理工大学 心音信号双通道自适应降噪算法、装置、介质及设备
US11722741B2 (en) 2021-02-08 2023-08-08 Verance Corporation System and method for tracking content timeline in the presence of playback rate changes
CN115173971B (zh) * 2022-07-08 2023-10-03 电信科学技术第五研究所有限公司 一种基于频谱数据的宽带信号实时检测方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4630304A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
US4628529A (en) * 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US4630305A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US4658426A (en) * 1985-10-10 1987-04-14 Harold Antin Adaptive noise suppressor
US4811404A (en) * 1987-10-01 1989-03-07 Motorola, Inc. Noise suppression system
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
US5450522A (en) * 1991-08-19 1995-09-12 U S West Advanced Technologies, Inc. Auditory model for parametrization of speech
FI92535C (fi) * 1992-02-14 1994-11-25 Nokia Mobile Phones Ltd Kohinan vaimennusjärjestelmä puhesignaaleille
US5432859A (en) * 1993-02-23 1995-07-11 Novatel Communications Ltd. Noise-reduction system
DE69428119T2 (de) * 1993-07-07 2002-03-21 Picturetel Corp Verringerung des hintergrundrauschens zur sprachverbesserung
IT1272653B (it) * 1993-09-20 1997-06-26 Alcatel Italia Metodo di riduzione del rumore, in particolare per riconoscimento automatico del parlato, e filtro atto ad implementare lo stesso
JPH08506434A (ja) * 1993-11-30 1996-07-09 エイ・ティ・アンド・ティ・コーポレーション 通信システムにおける伝送ノイズ低減
JP3484757B2 (ja) * 1994-05-13 2004-01-06 ソニー株式会社 音声信号の雑音低減方法及び雑音区間検出方法
US5544250A (en) * 1994-07-18 1996-08-06 Motorola Noise suppression system and method therefor
FR2726392B1 (fr) * 1994-10-28 1997-01-10 Alcatel Mobile Comm France Procede et dispositif de suppression de bruit dans un signal de parole, et systeme avec annulation d'echo correspondant
SE505156C2 (sv) * 1995-01-30 1997-07-07 Ericsson Telefon Ab L M Förfarande för bullerundertryckning genom spektral subtraktion
US5682463A (en) * 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020082643A (ko) * 2001-04-25 2002-10-31 주식회사 호서텔넷 고속 푸우리에 변환(fft) 및 역고속 푸우리에변환(ifft)을 이용한 송,수신기의 동기검출장치
KR100657912B1 (ko) * 2004-11-18 2006-12-14 삼성전자주식회사 잡음 제거 방법 및 장치
US8255209B2 (en) 2004-11-18 2012-08-28 Samsung Electronics Co., Ltd. Noise elimination method, apparatus and medium thereof
KR100784456B1 (ko) * 2005-12-08 2007-12-11 한국전자통신연구원 Gmm을 이용한 음질향상 시스템

Also Published As

Publication number Publication date
WO2000017859A1 (en) 2000-03-30
US6122610A (en) 2000-09-19
CA2344695A1 (en) 2000-03-30
CN1326584A (zh) 2001-12-12
JP2003517624A (ja) 2003-05-27
IL136090A0 (en) 2001-05-20
AU6037899A (en) 2000-04-10
KR100330230B1 (ko) 2002-05-09
WO2000017859A8 (en) 2000-07-20
WO2000017855A1 (en) 2000-03-30
KR20010075343A (ko) 2001-08-09
CN1286788A (zh) 2001-03-07
AU6007999A (en) 2000-04-10
BR9913011A (pt) 2001-03-27
CA2310491A1 (en) 2000-03-30
EP1116224A4 (en) 2003-06-25
EP1116224A1 (en) 2001-07-18

Similar Documents

Publication Publication Date Title
KR100330230B1 (ko) 잡음 억제 방법 및 장치
US6415253B1 (en) Method and apparatus for enhancing noise-corrupted speech
RU2329550C2 (ru) Способ и устройство для улучшения речевого сигнала в присутствии фонового шума
CN109410977B (zh) 一种基于EMD-Wavelet的MFCC相似度的语音段检测方法
US6289309B1 (en) Noise spectrum tracking for speech enhancement
US8073689B2 (en) Repetitive transient noise removal
Yamashita et al. Nonstationary noise estimation using low-frequency regions for spectral subtraction
Verteletskaya et al. Noise reduction based on modified spectral subtraction method
EP1386313B1 (en) Speech enhancement device
Zhang et al. A novel fast nonstationary noise tracking approach based on MMSE spectral power estimator
WO2020024787A1 (zh) 音乐噪声抑制方法及装置
Zhang et al. Fast nonstationary noise tracking based on log-spectral power mmse estimator and temporal recursive averaging
KR101295727B1 (ko) 적응적 잡음추정 장치 및 방법
CN114005457A (zh) 一种基于幅度估计与相位重构的单通道语音增强方法
CN109102823A (zh) 一种基于子带谱熵的语音增强方法
KR100784456B1 (ko) Gmm을 이용한 음질향상 시스템
Elshamy et al. Two-stage speech enhancement with manipulation of the cepstral excitation
Nasr et al. Efficient implementation of adaptive wiener filter for pitch detection from noisy speech signals
Islam et al. Speech enhancement in adverse environments based on non-stationary noise-driven spectral subtraction and snr-dependent phase compensation
Eaton et al. A comparison of non-intrusive SNR estimation algorithms and the use of mapping functions
Patil et al. Use of baseband phase structure to improve the performance of current speech enhancement algorithms
Dionelis On single-channel speech enhancement and on non-linear modulation-domain Kalman filtering
Verteletskaya et al. Enhanced spectral subtraction method for noise reduction with minimal speech distortion
Alatwi et al. A Smoothed and Thresholded Linear Prediction Analysis for Efficient Speech Coding.
Farahani et al. Consideration of correlation between noise and clean speech signals in autocorrelation-based robust speech recognition

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee