KR100335162B1 - 음성신호의잡음저감방법및잡음구간검출방법 - Google Patents

음성신호의잡음저감방법및잡음구간검출방법 Download PDF

Info

Publication number
KR100335162B1
KR100335162B1 KR1019950011826A KR19950011826A KR100335162B1 KR 100335162 B1 KR100335162 B1 KR 100335162B1 KR 1019950011826 A KR1019950011826 A KR 1019950011826A KR 19950011826 A KR19950011826 A KR 19950011826A KR 100335162 B1 KR100335162 B1 KR 100335162B1
Authority
KR
South Korea
Prior art keywords
value
noise
signal
rms
speech
Prior art date
Application number
KR1019950011826A
Other languages
English (en)
Other versions
KR950034057A (ko
Inventor
찬조셉
니시구찌마사유끼
Original Assignee
소니 가부시끼 가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 가부시끼 가이샤 filed Critical 소니 가부시끼 가이샤
Publication of KR950034057A publication Critical patent/KR950034057A/ko
Application granted granted Critical
Publication of KR100335162B1 publication Critical patent/KR100335162B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02168Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Abstract

입력 음성 신호의 SN비에 따라 최적의 억압 팩터로 조정이 행해지는 잡음저감 방법을 제공한다.
입력 단자(11)로부터 음성과 노이즈가 혼재하는 신호가 입력되고, 잡음 추정 회로(15)에서 입력 신호 중 노이즈를 추정하고, 음성 추정 회로(16)에서 음성을 추정하며, 최대 개연성 필터(19), 연판정 억압 회로(20)의 특성을 적응적으로 제어한다. 연판정 억압 회로(20)으로부터의 출력은 중간 필터를 포함하는 필터 처리 회로(21)을 통해 스펙트럼 수정 회로(23)으로 보내고, 상기 입력 신호의 스펙트럼을 수정함으로써 잡음을 억압한다.

Description

음성 신호의 잡음 저감 방법 및 잡음 구간 검출 방법
본 발명은 음성 신호의 잡음 저감 방법 및 잡음 구간 검출 방법에 관한 것으로, 특히 입력 음성 신호를 기초로 하여 산출된 SN비 및 음성 존재 확률을 기초로 하여 음성 성분을 산출하기 위한 최대 개연성 필터를 적응적으로 제어하여 잡음 억압을 행하는 음성 신호의 잡음 저감 방법 및 이 잡음 저감 방법에 이용하기에 적합한 잡음 구간 검출 방법에 관한 것이다.
휴대용 전화기나 음성 인식 등의 응용에 있어서, 수음된 음성 신호에 포함되는 환경 잡음이나 배경 잡음 등의 잡음을 억압하고, 음성 성분을 강조할 필요가 있다.
이와 같은 음성 강조 또는 잡음 저감 기술로서, 감쇠 팩터의 조정을 위해 조건부 확률 함수를 이용하는 예가 문헌 「연판정 잡음 억압 필터를 이용하는 음성 강조」(Speech Enhancement Using a Soft-Decision Noise Suppression Filter, R.J.McAulay, H.L.Malpass, IEEE Trans. Acoust.,Speech Signal Processing, Vol.28, pp,137-145, April 1980)이나 「이동 전화 시스템에 있어서의 주파수 영역 잡음 억압 연구」(Frequency Domain Noise Suppression Approach in Mobile Telephone Systems, J.Yang, IEEE ICASSP, Vol.II, pp.363-366, April 1993) 등에 개시되어 있다.
그러나, 이들 잡음 억압 기술에서는 부적절한 고정 SNR(신호 대 잡음비)를 기초로 하여 동작을 하기 때문에, 또는 부적절한 억압 팩터에 의해 음색의 부자연스러움이나 왜곡된 음성이 생기는 경우가 있다. 실제의 운용시에 최적의 성능을 얻기 위해 잡음 억압 장치의 파라메타의 하나인 SNR을 조정하는 것은 사용자에게 있어서 바람직하지 않다. 또한, 종래의 음성 신호 강조 기술은 단시간 SNR의 큰 변동이 있는 음성 신호에 대하여 부작용으로서 발생하는 왜곡을 갖지 않고, 충분히 잡음을 제거하기가 곤란하다.
또, 이와 같은 음성 강조 또는 잡음 저감 방법에 있어서는 잡음 구간 검출 기술이 이용되고, 입력 레벨이나 파워 등을 소정의 임계값으로 비교함으로써 잡음구간 판별을 행하고 있지만, 음성에 트랙킹하는 것을 방지하기 위해 임계값의 시정수를 크게 하면 노이즈 레벨이 변화할 때, 특히 증가할 때에는 추종할 수 없게 되고, 오판별을 일으키기 쉽다.
본 발명은 상기 실정을 감안하여 이루어진 것으로, 입력 음성 신호에 따라 실제의 입력의 SNR에 최적화한 억압 팩터로 조정이 행해지고, 사용자가 사용에 앞서 조정 등을 행할 필요가 없으며, 부작용적인 왜곡이 발생하는 일없이 충분한 잡음 제거를 행할 수 있는 음성 신호의 잡음 저감 방법의 제공을 목적으로 한다.
또, 본 발명의 다른 목적은 입력 신호에 따라 최적의 임계값에 의한 잡음 구간 판별이 행해지고, 노이즈 레벨 변동시에도 오판단이 생기지 않는 잡음구간 검출 방법을 제공하는 것이다.
본 발명에 관한 음성 신호의 잡음 저감 방법은 상기 과제를 해결하기 위해 입력 음성 신호를 기초로 하여 산출된 SN비 및 음성 존재 확률을 기초로 하여 잡음 제거를 행하기 위한 최대 개연성 필터를 적응적으로 제어하여 잡음억압을 행하는 음성 신호의 잡음 저감 방법에 있어서, 상기 음성 존재 확률의 산출에 입력 신호의 스펙트럼으로부터 추정 잡음 스펙트럼을 감산한 것을 이용하는 것을 특징으로 한다.
여기서, 상기 음성 존재 확률 산출에는 상기 감산 출력값과 일정값을 비교하여 큰 쪽을 취출한 것을 이용하는 것이 바람직하다. 또, 상기 비교 결과에 관해 현재 프레임의 값과 전 프레임의 값에 일정 감쇠 계수를 승산한 값을 비교하여 큰 쪽을 취출한 것을 이용하는 것이 바람직하다.
또, 상기 최대 개연성 필터 특성에 대하여 주파수축 방향과 시간축 방향의 원활화 필터 처리를 행하는 것을 들면, 상기 주파수측 방향의 원활화 필터 처리에 처리 대상의 주파수 대역의 상기 최대 개연성 필터 특성과 인접하는 주파수 대역의 최적 필터 특성의 중앙값 또는 중간(median)값을 이용하는 것이 바람직하다.
다음으로, 본 발명에 관한 잡음 구간 검출 방법은 입력 음성 신호를 프레임 단위로 구분하여 각 프레임마다 RMS(자승 평균의 평방근) 같을 구하고, 이 RMS값을 임계값 Th1로 비교함으로써 잡음 구간을 검출하는 잡음 구간 검출 방법에서, 상기 임계값 Th1을 구하기 위한 값 th를 현재 프레임의 RMS값과 전 프레임의 값 th에 계수 α를 승산한 것의 작은 쪽 값을 이용하여 산출하고, 계수 α를 현재 프레임의 RMS값에 따라 전환함으로써 상술한 과제를 해결한다. 여기서, 후술하는 실시예에서는 상기 임계값 Th1을 Noise RMSthres[k]로 하고, 이것을 구하기 위한 값 th를 MinNoiseshort[k]로 하고 있다. 또한 k는 프레임 번호를 나타낸다. 이것은 후술하는 (7)식에 나타낸 바와 같이 전 프레임의 값 MinNoiseshort[k-1]에 계수 α[k] 등을 승산한 것 등과 현재 프레임 RMS값 RMS[k]를 비교하여 작은 쪽을 MinNoiseshort[k]로 하고, 계수 α[k]는 RMS값 RMS[k]에 따라 1, 0이 전환된다.
이 경우, 상기 임계값 Th1을 구하기 위한 th를 상기 현재 프레임의 RMS값과 전 프레임의 값 th에 계수 α를 승산한 것의 작은 쪽 값, 즉 후술하는 MinNoiseshort[k]와, 복수 프레임에 걸친 상기 RMS값의 최소값, 즉 후술하는MinNoiselong[k] 중에서 큰 쪽을 이용하는 것이 바람직하다.
또, 상기 입력 음성 신호의 최대 SN비를 이용해서 산출되는 임계값 Th2를 이용하여 현재 프레임의 상대 에너지를 변별한 결과와, 상기 RMS값을 임계값 Th1로 비교한 결과를 기초로 하여 상기 잡음 구간 검출을 행하는 것이 바람직하다. 상기 임계값 Th2는 후술하는 실시예에서는 dBthresrel[k]로 되어 있고, 프레임마다의 상대 에너지는 dBrel로 되어 있다. 또한, 상대 에너지 dBrel은 직전에 존재한 신호 에너지의 로컬 피크를 기초로 한 값과의 상대값에서 현재의 신호 에너지를 기술한 것이다.
이와 같은 특징을 갖는 잡음 구간 검출 방법은 상기 본 발명에 관한 음성 신호의 잡음 저감 방법에 이용하기에 바람직하다.
본 발명에 관한 음성 신호의 잡음 저감 방법에 따르면, 입력 신호의 스펙트럼으로부터 잡음 추정 스펙트럼을 감산하는 스펙트럼 서브 트랙션에 의해 음성 존재 확률을 산출하고, 산출된 음성 존재 확률을 기초로 하여 최대 개연성 필터를 적응적으로 제어하고 있기 때문에 입력 음성 신호의 SNR에 따라 최적의 억압 팩터로 조정이 행해지고, 사용자가 사용에 앞서 조정 등을 행할 필요가 없다.
또, 본 발명에 관한 잡음 구간 검출 방법은 잡음 구간 판별을 위한 임계값 Th1을 구하는데 이용되는 값 th를 현재 프레임의 RMS값과 전 프레임의 값 th에 계수 α를 승산한 것의 작은 쪽 값을 이용하여 산출하고, 계수 α를 현재 프레임의 RMS값에 따라 전환하기 때문에 입력 신호에 따른 최적의 임계값에 의한 잡음 구간 판별이 행해지고, 노이즈 레벨 변동시에도 오판단을 하지 않는다.
이하, 본 발명에 관한 음성 신호의 노이즈 저감 방법의 바람직한 실시예에 관해 도면을 참조해서 설명한다.
제1도는 본 발명의 실시예가 되는 음성 신호의 노이즈 저감 방법이 적용된 노이즈 저감 장치의 개략 구성을 도시한 블럭 회로도이다.
상기 제1도에서 입력 단자(11)에는 음성(speech) 성분과 잡음(noise) 성분을 포함하는 입력 신호 y[k]가 공급되어 있다. 이 입력 신호 y[k]는 예를 들면 샘플링 주파수가 FS의 디지탈 신호로서, 프레임화 ·윈도우 처리 회로(windowing process circuit;12)에 전송되어 프레임 길이가 FL 샘플의 프레임으로 분할되고, 이하 각 프레임마다 처리가 행해진다. 이 프레임의 시간축 방향의 이동량인 프레임 간격은 FI샘플이고, 제 k+1 프레임은 제k 프레임에서 FI 샘플 후에 개시되게 된다. 다음의 직교 변환인 예를 들면 FFT(고속 푸리에 변환) 회로(13)에서의 계산에 앞서 프레임화 · 윈도우 처리 회로(12)에서는 각 프레임의 신호에 대하여 윈도우 함수 winput에 의한 윈도우 처리가 행해진다. 또한, 각 프레임마다의 신호 처리의 종단에서의 후술하는 역 FFT 또는 IFFT 뒤에는 출력 신호에 대하여 윈도우 함수 woutput에 의한 윈도우 처리가 행해진다. 이와 같은 각 윈도우 함수 winput및 woutput의 일례를 다음 (1)식 및 (2)식에 각각 나타낸다.
또, 상기 주파수나 샘플수의 구체예를 들면, 샘플링 주파수 FS를 8000Hz = 8kHz로 할 때, 프레임 간격 FI를 80샘플로 하면 10ms로, 프레임 길이 FL을 160샘플로 하면 20ms에 상당하게 된다.
다음으로, FFT 회로(13)에서는 256 포인트의 FFT처리가 행해지고, 얻어진 주파수 스펙트럼 진폭값은 밴드 분할 회로(14)에 의해 예를 들면 18밴드로 분할된다. 이들 각 밴드의 주파수 범위의 일례를 다음 표 1에 나타낸다.
<표 1>
이들 주파수 대역은 인간의 청각 시스템이 고역인만큼 지각 분해능이 열화하는 것을 기초로 하고 있다. 각 대역의 진폭으로서 대응하는 주파수 범위내의 최대 FFT 진폭을 이용한다.
다음으로, 잡음 추정 회로(15)에서는 입력 신호 y[k] 중의 노이즈를 음성으로부터 구별하고, 노이즈라고 추정되는 프레임을 검출한다. 이 잡음 구간 추정 또는 노이즈 프레임 검출 처리는 예를 들면 3종류의 검출 처리를 조합시키고 있다. 이 잡음 구간 추정의 구체예에 관해 제2도를 참조해서 설명한다.
제2도에서, 입력 단자(11)로부터의 입력 신호 y[k]는 RMS(자승 평균의 평방근, Root Mean Square) 계산 회로(15A)에 전송되어 각 프레임마다 단시간 RMS값이 계산되고, 이 RMS 계산 회로(15A)로부터의 출력이 상대 에너지 계산 회로(15B), 최소 RMS 계산 회로(15C), 최대 신호 계산 회로(15D) 및 잡음 스펙트럼 추정 회로(15E)로 전송된다. 또, 잡음 스펙트럼 추정 회로(15E)에는 이들 상대 에너지 계산 회로(15B), 최소 RMS 계산 회로(15C) 및 최대 신호 계산 회로(15D)로부터의 각 출력과, 상기 밴드 분할 회로(14)로부터의 출력이 전송된다.
RMS 계산 회로(15A)에서는 상기 각 프레임마다 신호의 RMS값의 계산을 행하고 있다. 제k 프레임의 RMS값인 RMS[k]는 다음 식으로 계산된다.
상대 에너지 계산 회로(15B)에서는 전 프레임으로부터의 감쇠 에너지에 관련되는 제k 프레임의 상대 에너지를 나타내는 dBrel[k]을 계산한다. 이 dB 표시의 상대 에너지 dBrel[k]는 다음의 (4)식에 의해 산출되고, 이 (4)식 중의 에너지값 E[k] 및 감쇠 에너지값 Edecay[k]는 각각 다음의 (5)식 및 (6)식에 의해 구해진다.
여기서, 상기 (5)식은 FL · (RMS[k])2으로 나타낼 수 있기 때문에 RMS 계산 회로(15A)로부터의 출력인 RMS[k]를 이용할 수 있지만, RMS 계산 회로(15A)에서의상기 (3)식의 계산 도중에 얻어지는 상기 (5)식의 값을 그대로 상대 에너지 계산 회로(15B)에 전송해도 좋다. 또, 상기 (6)식에서는 감쇠 시간(디케이 타임)을 0.65sec로 한 예를 나타내고 있다.
이와 같은 에너지 E[k] 및 감쇠 에너지 Edecay[k]의 구체예를 제3도에 도시한다.
최소 RMS 계산 회로(15C)에서는 백 그라운드 노이즈 또는 배경 잡음 레벨을 평가하기에 적합한 최소 RMS값을 구한다. 여기서는 상기 프레임마다 단기간(short term) 및 복수 프레임에 걸친 장기간(long term)에서의 최소 RMS값을 계산한다. 상기 장기간값을 이용할 수 있는 것은 단기간값이 노이즈 레벨로의 큰 변화로 트랙킹할 수 없을 때, 즉 추종할 수 없을 때이다. 단기간에서의 최소 노이즈 RMS값 MinNoiseshort는 다음 (7)식에 의해 산출된다.
상기 단기간 최소 노이즈 RMS값 MinNoiseshort는 음성(speech)이 없는 배경 잡음 이른바 백 그라운드 노이즈일 때 상승해 가도록 설정되어 있다. 노이즈 레벨이 높을 때의 상승 레이트는 지수 함수적이지만, 낮은 노이즈 레벨일때에는 보다 큰 상승을 얻기 위해 고정 상승 레이트를 이용할 수 있다.
상기 장기간의 최소 노이즈 RMS값 MinNoiselong는 예를 들면 0.6초마다 산출된다. 이 값 MinNoiselong은 상기 dB 표시의 상대 에너지 dBrel이 19dB를 넘는 프레임의 RMS값, 즉 상기 단시간 RMS값으로 현시점보다 전의 1.8초간에 있어서의 최소값이다. 만약 이 1.8초간에 상기 dBrel이 19dB를 넘는 값이 존재하지 않으면, 상기 장기간값 MinNoiselong은 사용될 수 없다. 왜냐하면, 신호의 현시점보다 전의 1.8초간에는 배경 잡음만의 프레임을 포함하지 않기 때문이다. 상기 각 0.6초마다의 구간에서 만약 MinNoiselong>MinNoiseshort이면 즉시 MinNoiseshort를 MinNoiselong의 값으로 설정한다.
최대 신호 계산 회로(15D)에서는 최대 RMS값이나 최대 SNR(SN비)값을 계산한다. 최대 RMS값은 최적 또는 최대 SNR값을 산출하는데 이용된다. 이최대 RMS값도 단기간과 장기간을 계산한다. 단기간의 최대 RMS값 MaxSignalshort는 다음의 (8)식에 의해 구해진다.
장기간의 최대 신호 RMS값 MaxSignallong은 0.4초마다 산출된다. 이 값 MaxSignalshort는 프레임 RMS값으로 현시점보다 전의 0.8초간에 있어서의 최대값이다. 상기 각 0.4초마다의 구간에서 만약 MaxSignallong이 MaxSignalshort보다 작을 때에는 MaxSignalshort
(0.7 · MaxSignalshort+ 0.3 · MaxSignallong)
의 값으로 설정한다.
이들 단기간 RMS값 RMS[k], 최소 노이즈 RMS값 MinNoise[k] 및 최대신호 RMS값 MaxSignal[k]의 구체예를 제4도에 도시한다. 이 제4도 중에서 최소 노이즈 RMS값 MinNoise[k]는 상기 장기간값 MinNoiselong을 고려해서 상기 단기간값 MinNoiseshort를 나타낸 것이고, 최대 신호 RMS값 MaxSignal[k]도 상기 장기간값 MaxSignallong을 고려한 상기 단기간값 MaxSignalshort를 나타낸 것이다.
상기 단기간 최대 신호 RMS값 MaxSignalshort와 상기 단기간 최소 노이즈 RMS값 MinNoiseshort를 이용함으로써 신호의 최대 SNR값이 추정된다. 노이즈 구간 판정 임계값과 노이즈 억압 특성은 이 추정을 기초로 하여 행해지고, 노이즈가 없는 깨끗한 음성 신호를 왜곡시킬 가능성을 저감시키도록 변경된다. 최대 SNR값 MaxSNR은 다음(9)식에서 산출된다.
또, 이 값 MaxSNR로부터는 상대 노이즈 레벨을 나타내는 0에서 1까지의 범위의 정규화 파라메타 NR_level이 산출된다. 이하 NS_level의 함수가 이용된다.
다음으로, 잡음 스펙트럼 추정 회로(15E)에서의 동작을 설명한다. 상기 상대 에너지 계산 회로(15B), 최소 RMS 계산 회로(15C) 및 최대 신호 계산 회로(15D)에서 산출된 값은 음성(speech)을 배경 잡음(background noise)로부터 구별하기 위해 이용된다. 다음 조건이 정확할 때, 제k 프레임 중의 신호는 배경 잡음으로서 분류된다.
여기서, 제5도는 상기 (11)식 중의 dB 표시의 상대 에너지 dBrel[k]와, 최대 SNR값 MaxSNR[k]와, 잡음 판별 임계값의 하나인 dBthresrel[k]와의 구체예를 나타내고 있다.
또, 제6도는 상기 (10)식의 MaxSNR[k]의 함수로서의 NR_level[k]를 나타내고 있다.
제k 프레임이 배경 잡음 또는 노이즈로서 분류되는 경우, 노이즈 스펙트럼의 시간 평균 추정값 N[w, k]는 현재 프레임 신호의 스펙트럼 Y[w, k]에 의해 다음의 (12)식과 같이 갱신된다. 또한, w는 상기 밴드 분할 밴드의 번호를 나타낸 것이다.
여기서, 제k 프레임이 음성(speech)으로서 분류된 경우, N[w, k]는 N[w, k-1]값을 그대로 이용한다.
이상과 같은 제2도에 도시한 잡음 추정 회로(15)로부터의 출력은 음성 추정 회로(16), Pr(Sp)계산 회로(17), Pr(SplY) 계산 회로(18) 및 최대 개연성 필터 (19)로 전송된다.
음성 추정 회로(16)에서는 상기 밴드 분할된 각 주파수 밴드마다의 SN비를 계산하고 있다. 음성 추정 회로(16)에는 상기 밴드 분할 회로(14)로부터의 스펙트럼 진폭 데이타 Y[w, k]와, 잡음 추정 회로(15)로부터의 노이즈 스펙트럼 진폭 추정 데이타 N[w, k]가 공급되어 있고, 이들 데이타를 기초로 하여 음성 스펙트럼 추정 데이타 S[W, k]를 얻는다. 노이즈가 없는 깨끗한 음성 스펙트럼의 대강의 추정값은 후술하는 확률 Pr(Sp|Y)를 산출하는데 이용된다. 이것은 우선, 다음의 (13)식에 의해 스펙트럼의 차를 취하여 계산된다.
다음으로, 주파수 밴드마다의 시간 평균한 음성 스펙트럼의 추정값 S[w, k]가 상기 (13)식에 의해 산출된 음성 스펙트럼의 대강의 추정값 S'[w, k]를 이용하여 다음의 (14)식에 의해 산출된다. (14)식에서는 감쇠 속도 decay_rate를 식 중의 값으로 하고 있다.
주파수 밴드마다의 SN비 값은 다음의 (15)식에 의해 계산된다. (15)식에서 노이즈 스펙트럼의 추정값 N[]은 상기(12)식에서, 음성 스펙트럼의 추정값 S[]는 상기 (14)식에서 구할 수 있다.
다음으로, Pr(Sp) 계산 회로(17)에서의 동작을 설명한다. 여기서, 확률 Pr(Sp)는 상정된 입력 신호 중에서 음성 신호가 존재하는 확률이다. 종래는 항상 0.5로 고정되어 있었다. 여기서, SN비가 높은 신호에 관해서는 확률 Pr(SP)는 음질 열화를 방지하기 위해 높을수록 좋다. 이와 같은 확률 Pr(Sp)는 최대 신호 계산 회로(15D)에서 산출된 NR_level 함수를 이용하여 (16)식에 의해 계산된다.
Pr(Sp) = 0.5 + 0.45·(1.0 - NR_level) · · · (16)
다음으로, Pr(Sp|Y) 계산 회로(18)에서의 동작을 설명한다 Pr(Sp|Y)는 상기 입력 신호 y[k] 중에 음성 신호가 실제로 존재하는 확률로 Pr(Sp)와 SNR[w, k]를 이용하여 산출된다. 또, Pr(Sp|Y)는 무음성 구획을 보다 좁게 하기 위해 이용된다. 산출에 있어서는 문헌 「연판정 억압 필터를 이용한 음성 강조」(R. McAulay, M. Malpass, "Speech Enhancement Using a Soft-Decision Noise Suppression Filter", IEEE Transactions on Acoustics, Speech and Signal Processing, Vol, ASSP-28, No.2, April 1980)에 개시된 방법을 채용했다. 그 방법을 하기에 나타낸다.
여기서, 상기 (17)식∼(20)식에서 H0은 무음성 사상, 즉 입력 신호 y(t)가 노이즈 신호 n(t)일 때를, H1 음성 사상, 즉 입력 신호 y(t)가 음성 신호 s(t)와 노이즈 신호 n(t)의 합이고, S(t)≠0일 때를 각각 나타내며, W는 상기 분할 밴드의 밴드 번호를, k는 프레임 번호를, Y는 입력 신호 Y[w, k]를, S는 음성 신호 추정값 S[w, k]를, 그리고 σ는 노이즈 신호 추정값의 2승 N[w, k]2을 각각 나타낸다.
(17)식에서 Pr(H1|Y)[w, k]를 산출한다. 또, (17)식 중의 p(Y|H0)는 (18)식에서, p(Y|H1)은 (19)식에서 구한다. 그리고, (20)식에서는 베실 함수Io(|X|)를 산출한다.
베셀 함수는 다음의 (21)식에 의해 근사된다.
종래에는 음성 신호 추정값 S[w, k]를 이용하지 않고 Pr(H1|Y)를 얻기 위해 고정된 SN비 값(SNR=5 등)을 이용하고 있다. 따라서, p(Y|H1)은 다음의 (22)식과 같이 단순화된다.
p(Y|H1)의 산출에서 이용된 SN비의 값 SNR보다 낮은 순간 SN비를 갖는 신호는 크게 억압되어 있다. 여기서, 상기 SN비 값 SNR이 과도하게 높게 설정되었다고 가정하면, 비교적 작은 레벨의 노이즈로 왜곡된 음성이라도 저 레벨의 음성 부분이 과잉으로 약해지고, 이 결과 얻어진 음성은 부자연스러운 것이 되어 버린다. 또한 반대로, 상기 SN비의 값 SNR이 과도하게 낮게 설정되면, 비교적 큰 레벨의 노이즈로 왜곡된 음성으로 저 레벨의 음성 부분에서도 억압이 충분하지 않고, 노이지하게 느낀다. 따라서, 고정된 상기 SN비의 값 SNR을 이용하는 대신 본 실시예에 도시한 바와 같이 가변 SN비의 값 SNRnew[w, k]를 이용하면, 광범위한 백 그라운드/음성 레벨에 대응한 p(Y|H1)이 얻어진다. 상기 SNRnew[w, k]는 다음의 (23)식에 의해 구해진다. (23) 식 중의 MIN_SNR의 값은 (24)식에 의해 구해진 값을 이용한다.
SNRnew[w, k]는 그 최소값에 제한을 가한 제k 프레임에 있어서의 순간 SNR이다. 상기 SNRnew[w, k]는 전체적으로 높은 SN비를 갖는 신호에 대해서는 1.5까지 떨어뜨릴 수 있고, 그와 같은 경우에는 순간 SNR이 낮은 세그먼트에 대하여 억압을 행하지 않도록 하고 있다. 전체적으로 낮은 순간 SN비를 갖는 신호에 대해서는 3보다 작은 값이 되도록 하는 것을 불가능하다. 따라서, 순간 SNR이 낮은 세그먼트에 대해서도 충분한 억압을 유지할 수 있다.
다음으로, 최대 개연성 필터(19)에서의 동작을 설명한다. 이 최대 개연성 필터(19)는 상기 밴드 분할의 각 밴드 입력 신호로부터 잡음 신호를 제거하기 위해 설치된 프리 필터의 하나이다. 이 최대 개연성 필터(19)에서는 상기 밴드 분할 회로(14)로부터의 스펙트럼 진폭 데이타 Y[w, k]를, 잡음 추정 회로(15)로부터의 노이즈 스펙트럼 진폭 데이타 N[w, k]를 이용하여 H[w, k]라는 신호로 변환시킨다.H[w, k]는 다음의 (25)식에 의해 산출된다.
단, α = 0.7 - 0.4·NR_level[k]
상기 (25)식에서, 종래에는 상기 α를 1/2로 했으나, 본 실시예에서는 SNR의 개략값을 알고 있으므로, 잡음 억압의 정도는 최대 SNR에 의존하여 가변으로 할 수 있다.
계속해서, 연판정 억압 회로(20)에서의 동작을 설명한다. 이 연판정 억압 회로(20)는 최대 개연성 필터(19)로부터의 신호 H[w, k]로부터 음성 부분의 신호를 강조하기 위해 설치된 프리 필터의 하나이다. 신호 H[w, k]와 Pr(Sp|Y) 계산 회로(18)로부터의 값 Pr(H1|Y)를 이용하여 다음의 (26)식에 나타낸 방법으로 변환한다.
상기 (26)식 중의 MIN_GAIN이란 최소 이득을 나타내는 파라메터로, 예를 들면 0.1 즉 -15dB로 하면 좋다.
다음으로, 필터 처리 회로(21)에서의 동작을 설명한다. 여기서는 주파수축 방향과 시간축 방향에 관해 연판정 억압 회로(20)로부터의 신호 H[w, k]가 필터 처리된다. 주파수축 방향의 필터 처리는 신호 H[w, k]의 유효 임펄스 응답 길이를 단축시키는 효과가 있다. 이에 따라 주파수 영역에서의 승산에 의한 필터의 실현에 기인하는 환상(環狀) 첩입에 의한 엘리에이징(aliasing)의 발생을 미연에 방지하고 있다. 또, 시간축 방향의 필터 처리는 돌발적인 잡음을 억제하는 필터의 변화 속도를 제한하는 효과가 있다.
우선, 주파수축 방향의 필터 처리에 관한 설명을 한다. 상기 밴드 분할에서 예를 들면 18밴드로 분할된 각 밴드의 신호 H[w, k]의 중간(중앙값) 필터 처리를 행한다. 다음의 (27), (28)식에서 이 방법을 나타낸다.
제1 단계(Step1)에서, H1[w,k]은 단일 또는 독립된 0의 밴드를 없앤 H[w,k]이고, 제2 단계(Step2)에서 H2[w,k]는 단일 또는 독립된 돌출한 밴드를 없앤 H1[w,k]이다. 이 주파수축 방향의 필터 처리에 의해 얻어지는 신호는 H2[w,k]가 된다.
다음으로, 시간축 방향의 필터 처리에 관해 설명한다. 시간축 방향의 필터 처리를 행할 때에 입력 신호에는 음성, 백 그라운드 노이즈, 그리고 음성의 상승 부분인 과도적 상태의 3종류인 것을 고려한다. 음성 신호에 대해서는 다음의 (29)식에 나타낸 바와 같이 시간축에서의 원활화 또는 스무딩을 행한다.
배경 잡음 신호에 대해서는 다음의 (30)식에 도시한 바와 같은 시간축에서의 원활화 또는 스무딩을 행한다.
과도적 상태의 신호에 대해서는 시간축에서의 스무딩은 행하지 않는다. 최종적으로 다음의 (31)식에 의해 원활화 출력 신호 Ht_smooth[w,k]를 얻는 계산이 행해진다.
Ht_smooth[w,k]
여기서, (31)식 중의 αsp는 다음의 (32)식에서, αtr은 다음의 (33)식에서각각 구할 수 있다.
계속해서 밴드 변환 회로(22)에서의 동작을 설명한다. 여기서는 필터 처리회로(21)로부터의 예를 들면 18밴드분의 신호 Ht_smooth[w,k]를 예를 들면 128밴드분의 신호 H128[w,k]에, 보간 처리에 의해 확장 변환된다. 이 변환은, 예를 들면 2단계로 행하고 있고, 18밴드에서 64밴드로의 확장은 제로차 홀드에 의해, 64밴드에서 128 밴드로의 확장은 로우 패스 필터형의 보간 처리에 의해 각각 행한다.
다음으로, 스펙트럼 수정 회로(23)에서의 동작을 설명한다. FFT 회로(13)에서 얻어진 입력 신호의 FFT 계수의 실부와 허부에 각각 상기 신호 H128[w,k]를 실어 스펙트럼 수정을 행한다. 이 결과, 스펙트럼의 진폭은 수정되는 위상이 변형을 받지 않는다.
계속해서 IFFT 회로(24)에서, 스펙트럼 수정 회로(23)에서 얻은 신호를 이용하여 역고속 푸리에 변환(IFFT)을 행한다.
다음으로, 오버랩 가산 회로(25)에서는 각 프레임마다의 IFFT 출력 신호의 프레임 경계 부분에 관한 중복 부분을 가산한다. 출력 단자(26)로부터는 이상 설명한 바와 같은 순서로 잡음 저감 처리된 출력 신호를 얻을 수 있다.
이와 같이 해서 얻어진 출력 신호는 예를 들면 휴대용 전화기의 각종 인코더 회로나 음성 인식 장치의 신호 처리 회로 등에 전송된다. 또는 휴대용 전화기의 디코더 출력 신호에 본 잡음 억압 처리를 행해도 좋다.
또한, 본 발명은 상기 실시예에만 한정되지 않고, 예를 들면 종래 알려진 최대 개연성 필터를 이용하는 잡음 억압 기술에 있어서, 상기 필터 처리 회로(21)에 의한 필터 처리를 해도 된다. 또, 상기 잡음 추정 회로(15)에서의 잡음 구간 검출 방법은 잡음 저감 장치뿐만 아니라, 다른 여러 종류의 장치에 적용할 수 있다.
본 발명에 관한 음성 신호의 잡음 저감 방법에 따르면, 입력 음성 신호를 기초로 하여 산출된 SN비 및 음성 존재 확률을 기초로 하여 음성 성분을 산출하기 위한 최대 개연성 필터를 적응적으로 제어하여 잡음 억압을 행하는 방법에 있어서, 입력 신호의 스펙트럼으로부터 잡음 추정 스펙트럼을 감산하는 스펙트럼 서브 트랙션에 의해 음성 존재 확률을 산출하고, 이 산출된 음성 존재 확률을 기초로 하여 최대 개연성 필터를 적응적으로 제어하기 때문에, 입력 음성 신호의 SN비에 따라 최적의 억압 팩터로 조정하게 되고, 사용자가 사용에 앞서 조정 등을 행할 필요가 없다.
또, SN비가 높은 신호 입력시에는 음성 존재 확률을 높임으로써, 부작용적인왜곡을 발생시키지 않고 충분한 잡음 제거를 행할 수 있다.
또, 본 발명에 관한 잡음 구간 검출 방법은 잡음 구간 판별을 위한 임계값 th1을 구하는데 사용되는 값 th1을 현재 프레임의 RMS값과 전 프레임값 th에 계수 α를 승산한 것의 작은 쪽값을 이용하여 산출하고, 계수 α를 현재 프레임의 RMS 값에 따라 전환하기 때문에 입력 신호에 따른 최적의 임계값에 의한 잡음 구간 판별이 행해지고, 노이즈 레벨 변동시에도 오판단이 일어나지 않는다.
제1도는 본 발명에 관한 음성 신호의 잡음 저감 방법의 실시예가 적용되는 회로 구성을 설명하기 위한 블럭 회로도.
제2도는 제1도에 도시한 실시예에 이용되는 잡음 추정 회로의 구체예를 도시한 블럭 회로도.
제3도는 본 발명의 실시예에 있어서의 에너지 E[k] 및 저감 에너지 Edecay[k]의 구체예를 도시한 도면.
제4도는 본 발명의 실시예에 있어서의 단시간 RMS값 RMS[k], 최소 노이즈 RMS값 MinNoise[k] 및 최대 신호 RMS값 MaxSignal[k]의 구체예를 도시한 도면.
제5도는 본 발명의 실시예에 있어서의 dB 표시의 상대 에너지 dBrel[k], 최대 SNR값 MaxSNR[k], 및 잡음 판별 임계값의 하나인 dBthresrel[k]의 구체예를 도시한 도면.
제6도는 본 발명의 실시예에 있어서의 최대 SNR값 MaxSNR[k]에 대하여 정의되는 함수로서의 NR_level[k]를 도시한 그래프.
도면의 주요 부분에 대한 부호의 설명
13 : FFT(고속 푸리에 변환) 회로
14 : 밴드 분할 회로
15 : 잡음 추정 회로
16 : 음성 추정 회로
17 : Pr(SP) 계산 회로
18 : Pr(SpIY) 계산 회로
19 : 최대 개연성 필터(likelihood filter)
20 : 연(軟)판정 억압 회로
21 : 필터 처리 회로
22 : 밴드 변환 회로
23 : 스펙트럼 수정 회로
24 : IFFT(역 고속 푸리에 변환)회로
25 : 오버랩 가산 회로

Claims (14)

  1. 입력 음성 신호에 기초하여 산출된 SN비 및 음성 존재 확률에 기초하여 음성 성분을 산출하기 위한 최대 개연성 필터(likelihood filtcr)를 적응적으로 제어하여 잡음 억압을 행하는 음성 신호의 잡음 저감 방법에 있어서,
    상기 음성 존재 확률의 산출에, 입력 신호의 스펙트럼으로부터 추정 잡음 스펙트럼을 감산한 것을 이용한 것을 특징으로 하는 음성 신호의 잡음 저감 방법.
  2. 제1항에 있어서, 상기 음성 존재 확률의 산출에는, 상기 감산 출력값과 일정값을 비교하여 큰 쪽을 취출한 것을 이용하는 것을 특징으로 하는 음성 신호의 잡음 저감 방법.
  3. 제1항에 있어서, 상기 음성 존재 확률의 산출에는, 상기 감산 출력값과 일정값을 비교하여 큰 쪽을 취출한 값에 관해 현재 프레임의 값과 선행 프레임의 값에 일정한 감쇠 계수를 승산한 값을 비교하여 큰 쪽을 취출한 것을 이용하는 것을 특징으로 하는 음성 신호의 잡음 저감 방법.
  4. 제1항에 있어서, 상기 최대 개연성 필터의 특성에 대하여, 주파수축 방향과 시간축 방향의 원활화 필터 처리를 행하는 것을 특징으로 하는 음성 신호의 잡음 저감 방법.
  5. 제1항에 있어서, 상기 음성 존재 확률을 구하기 위해 잡음 구간 검출을 행하고, 상기 잡음 구간 검출을 프레임마다의 RMS(자승 평균의 평방근) 값을 임계값 Th1로 비교함으로써 행하고, 상기 임계값 Th1을 구하기 위한 값 th를 현재 프레임의 RMS값과 선행 프레임의 값 th에 계수 α를 승산한 것 중 작은 쪽 값에 따라 구하고, 상기 계수 α를 현재 프레임의 RMS값에 따라 전환하는 것을 특징으로 하는 음성 신호의 잡음 저감 방법.
  6. 제5항에 있어서, 상기 임계값 Th1을 구하기 위한 값 th는, 상기 현재 프레임의 RMS값과 선행 프레임의 값 th에 계수 α를 승산한 것 중 작은 쪽의 값과, 복수 프레임에 걸친 상기 RMS값의 최소값 중의 큰 쪽을 이용해서 구하는 것을 특징으로 하는 음성 신호의 잡음 저감 방법.
  7. 제6항에 있어서, 상기 입력 음성 신호의 최대 SN비를 이용하여 산출되는 임계값 Th2를 이용하여 현재 프레임의 상대 에너지를 판별함으로써 상기 잡음 구간 검출을 행하는 것을 특징으로 하는 음성 신호의 잡음 저감 방법.
  8. 입력 음성 신호에 기초하여 산출된 SN비 및 음성 존재 확률에 기초하여, 음성 성분을 산출하기 위한 최대 개연성 필터를 적응적으로 제어하여 잡음 억압을 행하는 음성 신호 잡음 저감 방법에 있어서,
    상기 최대 개연성 필터의 특성에 대하여, 주파수축 방향과 시간축 방향의 원활화 필터 처리를 행하는 것을 특징으로 하는 음성 신호의 잡음 저감 방법.
  9. 제8항에 있어서, 상기 주파수축 방향의 원활화 필터 처리에, 처리 대상의 주파수 대역의 상기 최대 개연성 필터의 특성과 인접하는 좌우의 주파수 대역의 최대 개연성 필터의 특성의 중간값을 해당 주파수 대역의 최대 개연성 필터 특성으로서 이용하는 것을 특징으로 하는 음성 신호의 잡음 저감 방법.
  10. 제9항에 있어서, 상기 주파수축 방향의 원활화 필터 처리는,
    상기 중간값과 상기 처리 대상의 주파수 대역의 최대 개연성 필터 특성을 비교하여 큰 쪽을 선택하는 공정; 및
    그 처리 결과에 대한 해당 주파수 대역의 중간값과 처리 대상의 주파수 대역의 최대 개연성 필터 특성을 비교하여 작은 쪽을 선택하는 공정
    을 포함하는 것을 특징으로 하는 음성 신호의 잡음 저감 방법.
  11. 제9항에 있어서, 상기 시간축 방향의 원활화 필터 처리는, 음성 부분의 신호에 대한 원활화 처리와, 잡음 부분에 대한 원활화 처리를 갖는 것을 특징으로 하는 음성 신호의 잡음 저감 방법.
  12. 입력 음성 신호를 프레임 단위로 구분하여 각 프레임마다 RMS(자승 평균의 평방근)값을 구하고, 상기 RMS값을 임계값 Th1로 비교함으로써 잡음 구간을 검출하는 잡음 구간 검출 방법에 있어서,
    상기 임계값 Th1을 구하기 위한 값 th를, 현재 프레임의 RMS값과 선행 프레임값 th에 계수 α를 승산한 것 중 작은 쪽 값을 이용해서 산출하고, 상기 계수 α를 현재 프레임의 RMS값에 따라 전환하는 것을 특징으로 하는 잡음 구간 검출 방법.
  13. 제12항에 있어서, 상기 임계값 Th1을 구하기 위한 값 th를, 상기 현재 프레임의 RMS값과 선행 프레임값 th에 계수 α를 승산한 것 중 작은 쪽 값과, 복수 프레임에 걸친 상기 RMS값의 최소값 중에서 큰 쪽을 이용하여 산출하는 것을 특징으로 하는 잡음 구간 검출 방법.
  14. 제13항에 있어서, 상기 입력 음성 신호의 최대 SN비를 이용하여 산출되는 임계값 Th2를 이용하여 현재 프레임의 상대 에너지를 판별한 결과와, 상기 RMS값을 임계값 Th1로 비교한 결과에 기초하여 상기 잡음 구간 검출을 행하는 것을 특징으로 하는 잡음 구간 검출 방법.
KR1019950011826A 1994-05-13 1995-05-13 음성신호의잡음저감방법및잡음구간검출방법 KR100335162B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP09986994A JP3484757B2 (ja) 1994-05-13 1994-05-13 音声信号の雑音低減方法及び雑音区間検出方法
JP94-099869 1994-05-13

Publications (2)

Publication Number Publication Date
KR950034057A KR950034057A (ko) 1995-12-26
KR100335162B1 true KR100335162B1 (ko) 2002-09-27

Family

ID=14258823

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950011826A KR100335162B1 (ko) 1994-05-13 1995-05-13 음성신호의잡음저감방법및잡음구간검출방법

Country Status (8)

Country Link
US (3) US5668927A (ko)
EP (3) EP1065656B1 (ko)
JP (1) JP3484757B2 (ko)
KR (1) KR100335162B1 (ko)
CN (1) CN1113335A (ko)
DE (3) DE69531710T2 (ko)
MY (1) MY121946A (ko)
TW (1) TW262620B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100394759B1 (ko) * 1995-02-17 2004-02-11 소니 가부시끼 가이샤 음성신호에서노이즈를저감시키는방법과장치

Families Citing this family (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3484801B2 (ja) * 1995-02-17 2004-01-06 ソニー株式会社 音声信号の雑音低減方法及び装置
FI100840B (fi) * 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
US6256394B1 (en) * 1996-01-23 2001-07-03 U.S. Philips Corporation Transmission system for correlated signals
JP3483695B2 (ja) * 1996-03-14 2004-01-06 株式会社リコー 音声通信装置
KR100250561B1 (ko) * 1996-08-29 2000-04-01 니시무로 타이죠 잡음소거기 및 이 잡음소거기를 사용한 통신장치
US5933495A (en) * 1997-02-07 1999-08-03 Texas Instruments Incorporated Subband acoustic noise suppression
US6104993A (en) * 1997-02-26 2000-08-15 Motorola, Inc. Apparatus and method for rate determination in a communication system
US6353809B2 (en) * 1997-06-06 2002-03-05 Olympus Optical, Ltd. Speech recognition with text generation from portions of voice data preselected by manual-input commands
DE19747885B4 (de) * 1997-10-30 2009-04-23 Harman Becker Automotive Systems Gmbh Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion
US6175602B1 (en) * 1998-05-27 2001-01-16 Telefonaktiebolaget Lm Ericsson (Publ) Signal noise reduction by spectral subtraction using linear convolution and casual filtering
US6549586B2 (en) * 1999-04-12 2003-04-15 Telefonaktiebolaget L M Ericsson System and method for dual microphone signal noise reduction using spectral subtraction
US7209567B1 (en) 1998-07-09 2007-04-24 Purdue Research Foundation Communication system with adaptive noise suppression
US6351731B1 (en) 1998-08-21 2002-02-26 Polycom, Inc. Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
US6453285B1 (en) 1998-08-21 2002-09-17 Polycom, Inc. Speech activity detector for use in noise reduction system, and methods therefor
US6122610A (en) * 1998-09-23 2000-09-19 Verance Corporation Noise suppression for low bitrate speech coder
US6711540B1 (en) * 1998-09-25 2004-03-23 Legerity, Inc. Tone detector with noise detection and dynamic thresholding for robust performance
US6574334B1 (en) 1998-09-25 2003-06-03 Legerity, Inc. Efficient dynamic energy thresholding in multiple-tone multiple frequency detectors
US6289309B1 (en) 1998-12-16 2001-09-11 Sarnoff Corporation Noise spectrum tracking for speech enhancement
US6363345B1 (en) * 1999-02-18 2002-03-26 Andrea Electronics Corporation System, method and apparatus for cancelling noise
CA2358710A1 (en) * 1999-02-18 2000-08-24 Andrea Electronics Corporation System, method and apparatus for cancelling noise
JP2001016057A (ja) * 1999-07-01 2001-01-19 Matsushita Electric Ind Co Ltd 音響装置
US6349278B1 (en) * 1999-08-04 2002-02-19 Ericsson Inc. Soft decision signal estimation
JP3961290B2 (ja) 1999-09-30 2007-08-22 富士通株式会社 雑音抑圧装置
ATE277400T1 (de) * 1999-10-29 2004-10-15 Ericsson Telefon Ab L M Verfahren und vorrichtung zur robusten merkmalsextraktion für die spracherkennung
JP3454206B2 (ja) * 1999-11-10 2003-10-06 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
US7058572B1 (en) * 2000-01-28 2006-06-06 Nortel Networks Limited Reducing acoustic noise in wireless and landline based telephony
US6804640B1 (en) * 2000-02-29 2004-10-12 Nuance Communications Signal noise reduction using magnitude-domain spectral subtraction
US6898566B1 (en) 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
JP3566197B2 (ja) * 2000-08-31 2004-09-15 松下電器産業株式会社 雑音抑圧装置及び雑音抑圧方法
GB2367467B (en) * 2000-09-30 2004-12-15 Mitel Corp Noise level calculator for echo canceller
SE0003608L (sv) * 2000-10-06 2001-12-17 Xcounter Ab Metod för reducering av högfrekvent brus i bilder med hjälp av medelvärdesbildning av pixlar och parvis addering av pixelpar som uppfyller ett villkor
US7139711B2 (en) * 2000-11-22 2006-11-21 Defense Group Inc. Noise filtering utilizing non-Gaussian signal statistics
US7349841B2 (en) 2001-03-28 2008-03-25 Mitsubishi Denki Kabushiki Kaisha Noise suppression device including subband-based signal-to-noise ratio
US7013273B2 (en) * 2001-03-29 2006-03-14 Matsushita Electric Industrial Co., Ltd. Speech recognition based captioning system
EP1386313B1 (en) * 2001-04-09 2006-06-21 Koninklijke Philips Electronics N.V. Speech enhancement device
US7136813B2 (en) * 2001-09-25 2006-11-14 Intel Corporation Probabalistic networks for detecting signal content
US7096184B1 (en) * 2001-12-18 2006-08-22 The United States Of America As Represented By The Secretary Of The Army Calibrating audiometry stimuli
US7149684B1 (en) 2001-12-18 2006-12-12 The United States Of America As Represented By The Secretary Of The Army Determining speech reception threshold
US6864104B2 (en) 2002-06-28 2005-03-08 Progressant Technologies, Inc. Silicon on insulator (SOI) negative differential resistance (NDR) based memory device with reduced body effects
DE10252946B3 (de) * 2002-11-14 2004-07-15 Atlas Elektronik Gmbh Verfahren zur Unterdrückung des Rauschanteils eines Sensorsignals
US6874796B2 (en) * 2002-12-04 2005-04-05 George A. Mercurio Sulky with buck-bar
JP4128916B2 (ja) 2003-08-15 2008-07-30 株式会社東芝 字幕制御装置および方法ならびにプログラム
US7363221B2 (en) * 2003-08-19 2008-04-22 Microsoft Corporation Method of noise reduction using instantaneous signal-to-noise ratio as the principal quantity for optimal estimation
JP4632047B2 (ja) 2003-09-02 2011-02-16 日本電気株式会社 信号処理方法および装置
JP3909709B2 (ja) * 2004-03-09 2007-04-25 インターナショナル・ビジネス・マシーンズ・コーポレーション 雑音除去装置、方法、及びプログラム
DE102004017486A1 (de) * 2004-04-08 2005-10-27 Siemens Ag Verfahren zur Geräuschreduktion bei einem Sprach-Eingangssignal
US7729456B2 (en) * 2004-11-17 2010-06-01 Via Technologies, Inc. Burst detection apparatus and method for radio frequency receivers
GB2422237A (en) * 2004-12-21 2006-07-19 Fluency Voice Technology Ltd Dynamic coefficients determined from temporally adjacent speech frames
US20060184363A1 (en) * 2005-02-17 2006-08-17 Mccree Alan Noise suppression
US20060206320A1 (en) * 2005-03-14 2006-09-14 Li Qi P Apparatus and method for noise reduction and speech enhancement with microphones and loudspeakers
US7346502B2 (en) * 2005-03-24 2008-03-18 Mindspeed Technologies, Inc. Adaptive noise state update for a voice activity detector
CN1841500B (zh) * 2005-03-30 2010-04-14 松下电器产业株式会社 一种基于自适应非线性谱减的抗噪方法和装置
KR100745977B1 (ko) 2005-09-26 2007-08-06 삼성전자주식회사 음성 구간 검출 장치 및 방법
US20070100611A1 (en) * 2005-10-27 2007-05-03 Intel Corporation Speech codec apparatus with spike reduction
JP4863713B2 (ja) * 2005-12-29 2012-01-25 富士通株式会社 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム
JP4753821B2 (ja) * 2006-09-25 2011-08-24 富士通株式会社 音信号補正方法、音信号補正装置及びコンピュータプログラム
ATE427589T1 (de) * 2006-12-27 2009-04-15 Abb Technology Ag Verfahren zur bestimmung von kanalqualitat und modem
KR20090122143A (ko) * 2008-05-23 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
KR20100006492A (ko) 2008-07-09 2010-01-19 삼성전자주식회사 부호화 방식 결정 방법 및 장치
TWI355771B (en) 2009-02-23 2012-01-01 Acer Inc Multiband antenna and communication device having
EP2401872A4 (en) * 2009-02-25 2012-05-23 Conexant Systems Inc SYSTEM AND METHOD FOR REDUCING SPEAKER DISTORTION
CN101859568B (zh) * 2009-04-10 2012-05-30 比亚迪股份有限公司 一种语音背景噪声的消除方法和装置
FR2944640A1 (fr) * 2009-04-17 2010-10-22 France Telecom Procede et dispositif d'evaluation objective de la qualite vocale d'un signal de parole prenant en compte la classification du bruit de fond contenu dans le signal.
CN101599274B (zh) * 2009-06-26 2012-03-28 瑞声声学科技(深圳)有限公司 语音增强的方法
US8834386B2 (en) * 2009-07-07 2014-09-16 Koninklijke Philips N.V. Noise reduction of breathing signals
US9215538B2 (en) * 2009-08-04 2015-12-15 Nokia Technologies Oy Method and apparatus for audio signal classification
JP2011100029A (ja) * 2009-11-06 2011-05-19 Nec Corp 信号処理方法、情報処理装置、及び信号処理プログラム
JP5609157B2 (ja) * 2010-02-26 2014-10-22 ヤマハ株式会社 係数設定装置および雑音抑圧装置
CN103594094B (zh) * 2012-08-15 2016-09-07 湖南涉外经济学院 自适应谱减法实时语音增强
US9107010B2 (en) * 2013-02-08 2015-08-11 Cirrus Logic, Inc. Ambient noise root mean square (RMS) detector
US9231740B2 (en) 2013-07-12 2016-01-05 Intel Corporation Transmitter noise in system budget
WO2015191470A1 (en) * 2014-06-09 2015-12-17 Dolby Laboratories Licensing Corporation Noise level estimation
US10149047B2 (en) * 2014-06-18 2018-12-04 Cirrus Logic Inc. Multi-aural MMSE analysis techniques for clarifying audio signals
CN106199549B (zh) * 2016-06-30 2019-01-22 南京理工大学 一种采用谱减法提升lfmcw雷达信噪比的方法
CN106885971B (zh) * 2017-03-06 2020-07-03 西安电子科技大学 一种用于电缆故障检测定点仪的智能背景降噪方法
US10504538B2 (en) 2017-06-01 2019-12-10 Sorenson Ip Holdings, Llc Noise reduction by application of two thresholds in each frequency band in audio signals
CN112000047A (zh) * 2020-09-07 2020-11-27 广东众科智能科技股份有限公司 一种远程智能化监控系统
CN113488032A (zh) * 2021-07-05 2021-10-08 湖北亿咖通科技有限公司 车辆以及车辆用语音识别系统和方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0127718B1 (fr) * 1983-06-07 1987-03-18 International Business Machines Corporation Procédé de détection d'activité dans un système de transmission de la voix
EP0140249B1 (en) * 1983-10-13 1988-08-10 Texas Instruments Incorporated Speech analysis/synthesis with energy normalization
US4630305A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US5036540A (en) * 1989-09-28 1991-07-30 Motorola, Inc. Speech operated noise attenuation device
CA2040025A1 (en) * 1990-04-09 1991-10-10 Hideki Satoh Speech detection apparatus with influence of input level and noise reduced
FI92535C (fi) * 1992-02-14 1994-11-25 Nokia Mobile Phones Ltd Kohinan vaimennusjärjestelmä puhesignaaleille
DE4405723A1 (de) * 1994-02-23 1995-08-24 Daimler Benz Ag Verfahren zur Geräuschreduktion eines gestörten Sprachsignals
JP3484801B2 (ja) * 1995-02-17 2004-01-06 ソニー株式会社 音声信号の雑音低減方法及び装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100394759B1 (ko) * 1995-02-17 2004-02-11 소니 가부시끼 가이샤 음성신호에서노이즈를저감시키는방법과장치

Also Published As

Publication number Publication date
DE69529002D1 (de) 2003-01-09
KR950034057A (ko) 1995-12-26
MY121946A (en) 2006-03-31
DE69522605D1 (de) 2001-10-18
DE69529002T2 (de) 2003-07-24
DE69531710T2 (de) 2004-07-15
DE69522605T2 (de) 2002-07-04
EP1065656A3 (en) 2001-01-10
EP0683482A2 (en) 1995-11-22
DE69531710D1 (de) 2003-10-09
CN1113335A (zh) 1995-12-13
TW262620B (en) 1995-11-11
US5668927A (en) 1997-09-16
EP0683482B1 (en) 2001-09-12
EP1065656A2 (en) 2001-01-03
JP3484757B2 (ja) 2004-01-06
US5974373A (en) 1999-10-26
EP1065657B1 (en) 2002-11-27
US5771486A (en) 1998-06-23
EP0683482A3 (en) 1997-12-03
EP1065656B1 (en) 2003-09-03
JPH07306695A (ja) 1995-11-21
EP1065657A1 (en) 2001-01-03

Similar Documents

Publication Publication Date Title
KR100335162B1 (ko) 음성신호의잡음저감방법및잡음구간검출방법
KR100414841B1 (ko) 잡음저감방법및장치
US5752226A (en) Method and apparatus for reducing noise in speech signal
US6023674A (en) Non-parametric voice activity detection
US6487257B1 (en) Signal noise reduction by time-domain spectral subtraction using fixed filters
US5781883A (en) Method for real-time reduction of voice telecommunications noise not measurable at its source
EP1706864B1 (en) Computationally efficient background noise suppressor for speech coding and speech recognition
EP1008140B1 (en) Waveform-based periodicity detector
EP2244254B1 (en) Ambient noise compensation system robust to high excitation noise
US20070232257A1 (en) Noise suppressor
EP1376539A1 (en) Noise suppressor
EP1080463B1 (en) Signal noise reduction by spectral subtraction using spectrum dependent exponential gain function averaging
WO1997022116A2 (en) A noise suppressor and method for suppressing background noise in noisy speech, and a mobile station
US6507623B1 (en) Signal noise reduction by time-domain spectral subtraction
KR101394504B1 (ko) 적응적 잡음 처리 장치 및 방법
JP2003517761A (ja) 通信システムにおける音響バックグラウンドノイズを抑制するための方法と装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130412

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20140411

Year of fee payment: 13

EXPY Expiration of term