KR20000076037A - 잡음 경감 장치 및 잡음 경감 방법 - Google Patents

잡음 경감 장치 및 잡음 경감 방법 Download PDF

Info

Publication number
KR20000076037A
KR20000076037A KR1019997008125A KR19997008125A KR20000076037A KR 20000076037 A KR20000076037 A KR 20000076037A KR 1019997008125 A KR1019997008125 A KR 1019997008125A KR 19997008125 A KR19997008125 A KR 19997008125A KR 20000076037 A KR20000076037 A KR 20000076037A
Authority
KR
South Korea
Prior art keywords
noise
amplitude
subtraction
amplitude spectrum
frame
Prior art date
Application number
KR1019997008125A
Other languages
English (en)
Other versions
KR100314332B1 (ko
Inventor
토미타카즈타카
Original Assignee
다니구찌 이찌로오, 기타오카 다카시
미쓰비시덴키 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 다니구찌 이찌로오, 기타오카 다카시, 미쓰비시덴키 가부시키가이샤 filed Critical 다니구찌 이찌로오, 기타오카 다카시
Publication of KR20000076037A publication Critical patent/KR20000076037A/ko
Application granted granted Critical
Publication of KR100314332B1 publication Critical patent/KR100314332B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)

Abstract

잡음 프레임에의, 또는, 잡음 프레임으로부터의 이동이 빈번하고, 프레임마다 스펙트럼이 일부 주파수에 편향되어 있어도, 불쾌 잔류 잡음이 적은 잡음 경감 방법을 얻는다. 소정의 프레임 길이로 잘린 입력 신호를 직교 변환하여 얻은 진폭 스펙트럼으로부터 추정 잡음 진폭 스펙트럼을 스펙트럼 서브트렉션·필터에 의해 감산하여 출력을 얻는 스펙트럼 서브트렉션 잡음 경감 방법에 있어서, 상기 스펙트럼 서브트렉션·필터의 감산율을 상기 추정 잡음 진폭 스펙트럼에 따라서 가변으로 하여 진폭 조정 필터부(6)를 구비한다. 상기 진폭 조정 필터부(6)는 프레임마다 스펙트럼 서브트렉션·필터에 의한 감산 출력에, 진폭 스펙트럼(9)의 파워와 추정 잡음 진폭 스펙트럼(10)의 파워로 정해지는 진폭 조정 계수를 곱하여 소요 출력을 얻는다.

Description

잡음 경감 장치 및 잡음 경감 방법{Noise Reduction Apparatus And Noise Reduction Method}
종래, 배경 잡음을 경감하는 수단으로서, 이하의 도 15에 나타낸 방법이 알려져 있다. 즉, 음성에 배경 잡음이 중첩된 입력 신호를 A/D(아날로그/디지털)변환하여, 일정 구간(프레임)으로 분할하고, 이 프레임마다 잡음 경감된 신호 출력을 얻기 위해 일정 구간 신호(이후 프레임 신호라 칭한다)를 포함하는 입력 신호열을 이산 푸리에 변환하여 주파수 스펙트럼으로 일단 변환하고, 이것을 진폭 스펙트럼과 위상 스펙트럼으로 분할하여, 이 입력 신호의 진폭 스펙트럼으로부터 무음 구간에서 추정된 추정 잡음 진폭 스펙트럼을 서브트렉션·필터(subtraction filter)를 사용해 감산함으로서, 배경 잡음이 경감된 음성 진폭 스펙트럼(출력 진폭 스펙트럼)을 추정하고, 앞의 위상 스펙트럼과 합쳐서 배경 잡음이 경감된 음성의 주파수 스펙트럼으로 하며, 이 음성의 주파수 스펙트럼을 역이산 푸리에 변환하여 출력 신호를 얻는 스펙트럼 서브트렉션되는 방법이다. 이 방법은, STEVEN F. BALL “Supprssion of acustic noise in speech using spectral subtraction," IEEE Trans. Acoust., Speesh and Signal Proc., vol. ASSP-29, pp. 113-120, Apr. 1979.에서 제안되고 있다.
도 15는 이 잡음 경감 방법의 구성을 도시한 블록도이다.
우선, 도 15에 근거하여 전체 동작을 설명한다.
소정의 프레임 길이로 잘린 입력 신호(107)는 푸리에 변환부(101)에서 주파수 영역으로 변환되어, 입력 위상 스펙트럼(108)과 입력 진폭 스펙트럼(109)이 출력된다. 또한, 상기 입력 신호는 잡음 구간 판정부(102)에 의해, 임계치(TH) 이상이면 음성 프레임(구간), 이하이면 잡음 프레임(구간)이라 판정된다.
추정 잡음 진폭 스펙트럼 산출부(103)는 현 프레임이 잡음 프레임이라 판정되면, 그 때의 입력 진폭 스펙트럼(109)을(그 때까지의 추정 잡음 진폭 스펙트럼에) 중첩 가산하여 갱신한 추정 잡음 진폭 스펙트럼(110)을 출력한다.
서브트렉션·필터부(104)는 그 대표적인 전달 함수가 수학식 1에서 나타나는 특성을 지닌다.
F(ω) : 서브트렉션·필터
S(ω) : 입력 진폭 스펙트럼
E(N(ω)) : 추정 잡음 진폭 스펙트럼
r : 감산율
수학식 1에 있어서, S(ω)는 입력 신호의 진폭 스펙트럼 항, E(N(ω))는 추정 잡음 진폭 스펙트럼 항, r은 추정 잡음 진폭 스펙트럼의 감산율을 나타내는 정수이다. r을 크게 하면 잡음 억압량이 커지며, 반대로, 작게 하면 잡음 억압량이 작아진다.
상기 서브트렉션·필터부(l04)에서는 소정의 수학식에 근거해 감산율(r)을 구한다.
게다가, 이 감산율(r)에 근거해서, 수학식 1과 같이 하여 입력 진폭 스펙트럼과 추정 잡음 진폭 스펙트럼을 감산하여, 차이의 출력 진폭 스펙트럼(111)을 출력한다.
즉, 상기 서브트렉션·필터부(l04)에서는 잡음 프레임이나 자음 등의 파워가 작은 프레임에서는 감산율을 작게 하여 잡음 억압을 약화시킨다.
역 푸리에 변환부(105)에서 시간 영역으로 돌아온 출력 신호가 출력된다.
제1의 종래 스펙트럼 서브트렉션 방법에 있어서는 음성의 시작이나 종결, 자음과 같은 파워가 작은 프레임에서는 음성이 줄어들어 품질이 나빠지는 결점이 있다. 상술한 r을 크게 하면 음성 줄어듬이 보다 커진다.
이를 해결하기 위해 프레임마다 서브트렉션·필터의 감산율을 가변으로 하는 방법이 특개평8-221092에 공지되어 있다. 이 방법에서는 서브트렉션·필터로서 수학식 1의 F(ω)를 사용한 경우는, 입력이 큰 경우를 예로 들면 r을 크게, 입력이 작을 때는 r을 작게 함으로서 음성 줄어듬을 경감하고 있다.
제2의 종래 스펙트럼 서브트렉션 방법으로서, 잡음 경감 효과를 높이기 위해, 푸리에 변환 대상 신호에 창 함수(window function)라 불리는 함수를 시간축으로 구간을 정하고, 곱하여 중첩하는 수법이 사용되고 있다. 예를 들면, 프레임 신호와 이에 연속하는 일정 길이의 신호(오버랩 신호)에 창 함수를 곱해 푸리에 변환하며, 역 푸리에 변환의 출력 프레임 신호는, 선두의 1이하 중첩된 샘플에 직전 프레임의 역 푸리에 변환의 출력 오버랩 신호를 가산하여 출력으로 하는 방법이 북미 CDMA 자동차 전화 시스템(TIA/EIA, IS-127, “Enhanced Variable Rate Codec Service Option 3 for Wideband Spread Spectrum Digital Systems")으로 실용화되어 있다. 여기서 사용되는 창 함수를 도 16에 나타낸다.
여기서, 프레임 신호와 오버랩 신호의 가산시에 대응하는 샘플 중첩의 합계가 1이 되도록, 또한, 푸리에 변환 대상 신호의 양 끝이 원활하게 0에 근접하는 창 함수가 사용된다. 이러한 창 함수에 의한 중첩을 행함으로서 잡음 진폭 스펙트럼의 추정 정밀도가 높아진다는 효과를 얻을 수 있어서 결과적으로 잡음 경감 효과를 높일 수 있다.
또한, 제3의 종래 스펙트럼 서브트렉션 방법으로서 프레임 신호와 이에 연속하는 일정 길이의 신호(오버랩 신호)를 창 함수에 의한 중첩을 하지 않고 푸리에 변환하는 방법이 있으며, 특개평9-34497에 개시된 잡음 삭감 장치로 사용되고 있다. 이 경우, 출력이 프레임 사이에서 원활하게 연결되도록 하기 위해, 역 푸리에 변환 출력 프레임 신호에 대해서 직전 프레임의 역 푸리에 변환 출력의 오버랩 신호를 삼각창으로 겹치게 하는 파형 정형 처리를 실시해 출력하고, 역 푸리에 변환 출력의 오버랩 신호를 다음 프레임의 오버랩 처리를 위해 보존한다. 이 때의 파형 정형 처리를 수학식 2에 나타낸다.
Oj= (j·Dj+ (L - j)·Zj) / L
(j=O∼L-1)
Oj=Dj(j=L∼L+M-1)
Zj=OM+j(j=O∼L-1)
단,
Oj: 출력 신호
Dj: 프레임 신호
Zj :오버랩 신호
M : 프레임 길이
L : 오버랩 신호 길이
이다.
이 방법의 이점을 하기에 설명한다.
스펙트럼 서브트렉션 방법을 실현하기 위해서는, 원리적으로 연산 정밀도에 한계가 있는 16비트 고정 소수점 연산 디지털 신호 프로세서{고정 소수점(DSP)}를 사용하는 일이 많다. 이 고정 소수점(DSP)은 배 정밀 연산(倍精密演算)이나, 시프트(shift)에 의한 자리수 올림으로 연산 정밀도를 올릴 수 있다. 그렇지만, 그 때문에 연산량이 증가해 버리는 문제가 있다.
푸리에 변환 및 역 푸리에 변환은 기본적으로 연산량이 커서, 연산 정밀도를 조금 희생해도 적은 연산량으로 실현하고 싶은 경우가 많이 있다. 이 방법을 사용한 경우, 푸리에 변환하는 프레임 신호에 창 함수에 의한 중첩이 되지 않기 때문에 다이내믹 레인지(dynamic range)가 넓어지지 않고, 연산 정밀도가 한정된 푸리에 변환과 역 푸리에 변환을 거친 출력 프레임 신호의 정밀도 악화가 적다. 이 이유때문에 적은 연산량으로 적합한 고정 소수점(DSP)이 사용된다.
제4의 종래 스펙트럼 서브트렉션을 사용한 잡음 경감 방법은 추정 잡음 진폭 스펙트럼의 산출을 위해 우선 잡음 파워를 추정하고, 이것을 잡음 구간 판정 임계치로 한다. 그리고, 입력 파워가 이 임계치보다 작은 경우에는 잡음 프레임이라 판정한다. 더욱이, 추정 잡음 진폭 스펙트럼은 잡음이라 판정된 구간의 복수 프레임의 입력 신호, 즉, 잡음 신호의 진폭 스펙트럼을 평균하여 산출하는 방법이 일반적이다. 예를 들면, 특개평8-221092 등에 있어서의 스펙트럼 서브트렉션으로, 이 방법이 사용되고 있다.
제5의 종래 배경 잡음을 경감하는 방법으로서, 잡음 구간을 진폭 억압함으로서 잡음감을 경감하는 방법이 있다. 신호의 양태를 나타내는 예정된 유한 상태로부터 현 프레임의 상태를 결정하고, 이 상태가 잡음 프레임 상태에 대응하고 있는 경우, 일정 강도의 진폭 억압을 행하는 방법이 특개평7-38454에서 나타나고 있다.
제1의 종래 스펙트럼 서브트렉션 방법에는 잡음 구간이 변형되어 뮤지컬 노이즈(musical noise)라 불리는 불쾌 잔류 잡음이 되는 결점이 있으며, 실용상의 최대 문제로 되어 있다.
상기 결점은, 잡음 구간에 있어서는 추정 잡음 진폭 스펙트럼이 감산된 출력 진폭 스펙트럼이 일부 주파수에 파워가 집중한 형상이 되며, 또한, 상기 파워가 집중된 주파수가 프레임마다 불규칙하게 변화함으로서 일어난다. 상기 뮤지컬 노이즈를 해결하는 방법으로서, 추정 잡음 진폭 스펙트럼의 감산율을 가변으로 하는 방법을 사용하여 잡음 프레임에서는 감산량을 작게 하면 되지만, 잡음 구간에서는 잡음 억압량 부족이라는 문제가 있다.
제2의 종래 스펙트럼 서브트렉션 방법에 있어서는, 창 함수에 의해 양 끝을 0에 가깝게 중첩한 신호를 푸리에 변환하면 잡음 경감 능력은 향상된다. 그러나, 고정 소수점(DSP)에서 실현할 때, 양 끝의 신호 정밀도가 저하하기 때문에, 역 푸리에 변환의 출력 신호 양 끝이 악화하여 프레임 경계에서 이음(異音)이 일어나는 과제가 있다.
제3의 종래 예처럼, 역으로, 중첩되지 않은 신호를 푸리에 변환하면 고정 소수점(DSP)에서 실현할 때에 정밀도는 얻기 쉽지만, 입력 진폭 스펙트럼에 포함되는 잡음 진폭 스펙트럼 성분의 프레임 사이의 변동은 중첩했을 경우보다 커지므로 결과적으로 잡음 경감 능력은 중첩했을 경우보다 떨어진다.
제4의 종래 스펙트럼 서브트렉션의 잡음 구간 판정에 있어서, 잡음의 파워 변동이 클 경우에, 잡음 프레임을 올바르게 판정할 수 있도록 잡음 구간 판정 임계를 높게 설정하면, 어느 정도 음성 프레임도 잡음 프레음으로 오판정하여, 추정 잡음 진폭 스펙트럼에는 음성 스펙트럼이 누락되어 음성 줄어듬의 원인이 된다는 과제가 있다. 역으로 이를 방지하기 위해 음성 프레임을 잡음 프레임으로 판정하지 않도록 잡음 구간 판정 임계치를 낮게 설정하면 잡음 프레임을 음성 프레임으로 판정해버려 추정 잡음 진폭 스펙트럼의 갱신이 올바르게 행해지지 않아, 결과적으로 잡음 경감 능력이 나빠진다는 문제가 있다.
제5의 잡음 구간을 진폭 억압함으로서 잡음감을 경감하는 방법에서는, 신호 상태를 나타내는 예정된 유한 상태에서 현 프레임의 프레임 상태를 결정하고, 이 프레임 상태가 잡음 프레임 상태인 경우, 일정 강도의 진폭 억압을 하는 방식을 취하면 입력 잡음 종류에 따라서는 단시간 사이에 프레임 상태가 음성 프레임 상태와 잡음 프레임 상태 사이를 빈번하게 이동하여 이에 동반해 진폭 억압 강도가 빈번하게 변화하여, 결과적으로 출력 파워가 불안정해져 청감적으로 떨어진다는 과제가 있었다.
본 발명은 상기 과제를 해결하기 위해 이루어진 것으로, 잡음 프레임에의 또는 잡음 프레임으로부터의 이동이 빈번하고, 프레임마다 스펙트럼이 일부 주파수에 편향되어 있어도, 불쾌 잔류 잡음이 적은 잡음 경감 방법을 얻는 것을 목적으로 한다.
본 발명은 배경 잡음이 있는 환경하에서 사용되는 음성 통신 시스템이나 음성 인식 시스템에 적용되는 입력 음성 신호에서 잡음을 제거 하는 것으로 잡음 억압을 행하는 음성 신호의 잡음 경감 방법 및 잡음 구간의 진폭 억압을 사용한 잡음 경감 방법에 관한 것이다.
도 1은 본 발명의 제1 실시 형태에 있어서의 스펙트럼 서브트렉션 방법의 구성을 도시하는 블록도.
도 2는 제1 실시 형태의 잡음 경감 방법에 있어서 진폭 조정 필터가 행하는 동작 순서도.
도 3은 제1 실시 형태의 잡음 구간 판정부가 행하는 동작을 설명하는 도면.
도 4는 제1 실시 형태의 진폭 조정 필터가 행하는 동작을 설명하는 도면.
도 5는 제1 실시 형태의 스펙트럼 서브트렉션 방법의 출력 신호를 설명하는 도면.
도 6은 본 발명의 제2 실시 형태에 있어서의 스펙트럼 서브트렉션 방법의 구성을 도시하는 블록도.
도 7은 본 발명의 제3 실시 형태에 있어서의 스펙트럼 서브트렉션 방법의 구성을 도시하는 도면.
도 8은 제3 실시 형태의 잡음 경감 방법에 있어서의 입력 신호 예를 도시하는 도면.
도 9는 제3 실시 형태의 잡음 경감 방법에 있어서의 입력 신호 생성부가 승산되는 중첩 함수 예를 도시하는 도면.
도 10은 제3 실시 형태의 잡음 경감 방법에 있어서 역 푸리에 변환부의 출력신호 예를 도시하는 도면.
도 11은 본 발명의 제4 실시 형태에 있어서의 스펙트럼 서브트렉션 방법의 구성을 도시하는 블록도.
도 12는 제4 실시 형태의 잡음 경감 방법에 있어서의 동작을 설명하는 도면.
도 13은 본 발명의 제5 실시 형태에 있어서의 스펙트럼 서브트렉션 방법의 구성을 도시하는 도면.
도 14는 제5 실시 형태의 잡음 경감 방법에 있어서의 동작을 설명하는 도면.
도 15는 종래의 잡음 경감 방법의 구성을 도시하는 도면.
도 16은 종래의 잡음 경감 방법에 사용되는 창 함수를 도시하는 도면.
도 17은 제1 실시 형태의 동작 비교도.
도 18은 제3 실시 형태의 파형 정형 처리를 도시하는 도면.
소정의 프레임 길이로 잘린 입력 신호를 직교 변환하여 얻은 진폭 스펙트럼으로부터 추정 잡음 진폭 스펙트럼을 스펙트럼 서브트렉션·필터에 의해 감산하여 출력을 얻는 본 발명에 관련되는 잡음 경감 장치에 있어서,
프레임마다 상기 스펙트럼 서브트렉션·필터에 의한 감산 출력에, 상기 진폭 스펙트럼의 파워와 상기 추정 잡음 진폭 스펙트럼의 파워에서 정해지는 진폭 조정 계수를 곱하여 소요 출력을 얻는 진폭 조정 필터부를 갖춘 것을 특징으로 한다.
스펙트럼 서브트렉션·필터는 추정 잡음 진폭 스펙트럼의 감산의 감산율을 상기 추정 잡음 진폭 스펙트럼에 따라서 가변으로 하고, 진폭 조정 필터부는 감산율에 따라서 진폭 조정 계수를 가변으로 하는 것을 특징으로 한다.
상기 진폭 조정 필터부는 감산율이 큰 경우, 진폭 조정 계수를 크게 함으로서 음성 구간에서 잡음 억압을 강화시키고, 또한 출력 신호의 출력치를 크게 함과 동시에, 상기 진폭 조정 필터부는 감산율이 작은 경우, 진폭 조정 계수를 작게 함으로서 잡음 구간에서 잡음 억압을 약화시키고 또한 출력 신호의 출력치를 작게 하는 것을 특징으로 한다.
상기 진폭 조정 필터부는 진폭 조정 계수를 스펙트럼 서브트렉션·필터에 의한 감산 출력을 역 직교 변환한 시간 영역의 진폭 스펙트럼에 곱하는 것을 특징으로 한다.
상기 진폭 조정 필터부는 진폭 조정 계수를 필터마다 주파수 영역에서 진폭 스펙트럼에 곱하고, 역 직교 변환하여 출력을 얻도록 한 것을 특징으로 한다.
상기 진폭 조정 계수는 현 프레임의 입력 신호의 진폭 스펙트럼 파워와 현 프레임의 추정 잡음 진폭 스펙트럼 파워와의 차이에 근거하여 얻은 현 프레임의 진폭 조정 계수에 현 프레임에서 얻은 진폭 조정 계수치를 중첩 가산치로 한 것을 특징으로 한다.
소정의 프레임 길이로 잘린 입력 신호를 직교 변환하여 얻은 진폭 스펙트럼으로부터 추정 잡음 진폭 스펙트럼을 스펙트럼 서브트렉션·필터에 의해 감산해 출력을 얻는 본 발명에 관련되는 잡음 경감 장치에 있어서,
현 프레임의 전후 설정 구간을 잘라 끝이 0에 가까워지도록, 1 이하의 중첩 함수를 곱한 후에 현 프레임 전후에 가산하는 입력 신호 생성부를 갖추어 해당 입력 신호 생성부의 출력을 입력 신호로서 진폭 스펙트럼을 구하도록 한 것을 특징으로 한다.
본 발명에 관련되는 잡음 경감 장치는, 1의 중첩 함수가 승산된 이전 프레임의 다음 설정 구간을 사용하여 현 프레임의 파형 정형을 행하는 파형 정형 처리부를 갖춘 것을 특징으로 한다.
소정의 프레임 길이로 잘린 입력 신호를 직교 변환하여 얻은 진폭 스펙트럼으로부터 추정 잡음 진폭 스펙트럼을 스펙트럼 서브트렉션·필터에 의해 감산하여 출력을 얻는 본 발명에 관련되는 잡음 경감 장치에 있어서,
상기 추정 잡음 진폭 스펙트럼의 복수 프레임분으로부터 평균 잡음 파워를 구해 잡음 프레임의 판정 임계치와 비교하여 감산율을 얻는 감산율 산출부를 갖추고,
상기 스펙트럼 서브트렉션·필터의 감산에 사용되는 감산율을 상기 감산율로 한 것을 특징으로 한다.
본 발명에 관련되는 잡음 경감 장치는, 추정 잡음 진폭 스펙트럼의 복수 프레임 분으로부터 평균 잡음 파워를 구하는 평균 잡음 파워 산출부를 갖추고,
진폭 조정 필터부는 프레임마다 스펙트럼 서브트렉션·필터에 의한 감산 출력에 진폭 스펙트럼 파워와 상기 구한 평균 잡음 진폭 파워로 정해지는 진폭 조정 계수를 곱하여 소요 출력을 얻도록 한 것을 특징으로 한다.
소정의 프레임 길이로 잘린 입력 신호를 직교 변환하여 얻은 진폭 스펙트럼으로부터 추정 잡음 진폭 스펙트럼을 스펙트럼 서브트렉션·필터에 의해 감산하여 출력을 얻는 본 발명에 관련되는 잡음 경감 방법에 있어서,
상기 스펙트럼 서브트렉션·필터의 감산율을 상기 추정 잡음 진폭 스펙트럼에 따라서 가변하는 공정과,
프레임마다 상기 스펙트럼 서브트렉션·필터에 의한 감산 출력에, 상기 진폭 스펙트럼의 파워와 상기 추정 잡음 진폭 스펙트럼의 파워로 정해지는 진폭 조정 계수를 승산하여, 소요 출력을 얻는 공정을 갖춘 것을 특징으로 한다.
소정의 프레임 길이로 잘린 입력 신호를 직교 변환하여 얻은 진폭 스펙트럼으로부터 추정 잡음 진폭 스펙트럼을 스펙트럼 서브트렉션·필터에 의해 감산하여 출력을 얻는 본 발명에 관련되는 잡음 경감 방법에 있어서,
상기 추정 잡음 진폭 스펙트럼의 복수 프레임분으로부터 평균 잡음 파워를 구하여 잡음 프레임의 판정 임계치와 비교하여 감산율을 얻는 감산율 산출 공정과,
상기 스펙트럼 서브트렉션·필터의 감산율을 상기 감산율로 하는 공정을 갖춘 것을 특징으로 한다.
(제1 실시 형태)
스펙트럼 서브트렉션·필터의 감산율을 가변으로 하고, 진폭 조정 필터부를 구비하여 통상 출력으로부터 더욱 그 감산율에 의존하는 진폭 감산을 하는 본 발명의 제1 실시 형태에 있어서의 잡음 경감 방법을 설명한다.
도 1은 본 실시 형태에 있어서의 잡음 경감 방법의 구성 블록도이고, 도 2는 도 1에 있어서의 진폭 조정 필터부의 동작 순서도이다.
도 17은 음성 구간과 잡음 구간에 대한 동작 비교를 도시하는 도면이다.
우선, 도 1에 근거하여 전체 동작을 설명한다.
소정의 프레임 길이로 잘린 입력 신호(7)는 푸리에 변환부(1)에서 직교 변환되고, 주파수 영역으로 변환되어, 입력 위상 스펙트럼(8)과, 입력 진폭 스펙트럼 (9)이 출력된다. 또한, 상기 입력 신호는 잡음 구간 판정부(2)에 의해 임계치(TH) 이상이면 음성 프레임(구간), 이하이면 잡음 프레임(구간)이라 판정한다. 여기서, 다음 수학식 3이 성립되면 새로운 임계치(TH)로 교환된다.
Pin〈 2.0 TH
THnew= 0.9 TH + 0.1 Pin
여기서, Pin은 입력 신호 파워, TH는 갱신 전의 잡음 구간 판정 임계치, THnew는 갱신 후의 잡음 구간 판정 임계치이다.
이렇게 하여 도 3에 나타내는 관계가 얻어진다. 추정 잡음 진폭 스펙트럼 산출부(3)는 현 프레임이 잡음 프레임이라 판정되면, 그 때의 입력 진폭 스펙트럼 (9)을(그 때까지의 추정 잡음 진폭 스펙트럼에) 예를 들면, 수학식 5와 같이 중첩 가산하여 갱신된 추정 잡음 진폭 스펙트럼(10)을 출력한다.
E(N(ω)) = Eold(N(ω))α
+ S(ω)·(1-α)
여기서,
E(N(ω))는 갱신 후의 추정 잡음 진폭 스펙트럼,
Eold(N(ω))는 갱신 전의 추정 잡음 진폭 스펙트럼,
S(ω)는 입력 신호의 진폭 스펙트럼,
0〈α〈1
이다.
서브트렉션·필터부(4)에서는 다음 수학식 6에 근거해 감산율(r)을 구하고, 잡음 감산 강도(13)로서 출력한다.
여기서,
POWS는 현 프레임의 모든 주파수의 입력 신호 진폭 스펙트럼의 파워,
POWN은 현 프레임의 모든 주파수의 추정 잡음 진폭 스펙트럼의 파워,
0 〈 rTH〈 1
더욱이, 이 감산율(r)에 근거하여, 수학식 1과 동일하게 하여 입력 진폭 스펙트럼과 추정 잡음 진폭 스펙트럼을 감산하여, 차이의 출력 진폭 스펙트럼(11)을 출력한다.
즉, 상기 서브트렉션·필터부(4)(스펙트럼 서브트렉션·필터)에서는, 잡음 프레임이나 자음 등의 파워가 작은 프레임에서는 감산율을 작게 하여 잡음 억압을 약화시킨다.
역 푸리에 변환부(5)에서 시간 영역으로 돌아간 출력 진폭(12)은, 파워가 작은 프레임에서는 다음의 진폭 조정 필터부(6)에서 진폭 조정 계수가 작아지기 때문에 진폭 억압이 강해지게 된다.
즉, 상기 진폭 조정 필터부(6)는 도 2의 단계(S1 내지 S3)의 3개 동작을 행한다. 최초인 S1에서는, 잡음 감산 강도(13){감산율(r)}를 입력한다. 그리고, 현 프레임의 입력 신호의 음성 구간 진폭 스펙트럼의 파워와 현 프레임의 추정 잡음 진폭 스펙트럼의 파워의 차이로부터 다음 수학식 7에서 프레임마다 진폭 억압 계수(G)를 구한다.
(POWS- POWN 0, 또한, POWS- r·POWN〉 0)
G=0
(POWS- POWN〈0, 또는, POWS- r·POWN 0)
여기서, POWS는 현 프레임 입력 신호의 모든 주파수의 진폭 스펙트럼의 파워, POWn은 현 프레임의 모든 주파수의 추정 잡음 진폭 스펙트럼의 파워, G는 현 프레임의 진폭 억압 계수, r은 감산율이다. 도 17에 나타내는 바와 같이, 상기 감산율(r)이 크면 진폭 억압 계수(G)는 커지며, 감산율(r)이 작으면 진폭 억압 계수 (G)는 작아진다.
더욱이, S2에서는 다음의 수학식 8에 의해 샘플마다 진폭 조정 계수{g(n)}를 구한다.
g(n) = g(n-1) AR + G (1-AR)
단, O 〈 AR 〈 1이다.
또한, g(n)은 현 프레임의 제n 샘플의 진폭 조정 계수, n-1은 그 이전 샘플을 나타낸다. 도 17에 나타내는 바와 같이, 감산율(r)이 크면 진폭 억압 계수(G)및 진폭 조정 계수{g(n)}는 커진다. 감산율(r)이 작으면 진폭 억압 계수(G) 및 진폭 조정 계수{g(n)}는 작아진다.
더욱이, S3에서는 역 푸리에 변환부(5)로부터의 출력 진폭(12)을 Sin으로 나타내며, 다음의 수학식 9에 의해 진폭 조정 계수{g(n)}를 곱하여 출력 신호(14)를 얻는다.
Sout(n) = Sin(n) × g(n)
도 4는 진폭 조정 필터부(6)의 입출력 특성을 나타내는 도면이며, 잡음 구간에서는 감산율(r)이 작기 때문에 진폭 조정 계수{g(n)}가 작으며, 출력 측에서는 억압이 커져 출력치가 적어지고, 음성 구간에서는 반대로 감산율(r)이 크기 때문에 진폭 조정 계수{g(n)}가 크며, 출력 측에서는 억압이 작아져 출력치가 상대적으로 많아진다.
본 실시 형태에 의하면, 잡음 프레임이나 자음 등 파워가 작은 음성 프레임에서는 주파수 영역에 있어서의 잡음의 감산량을 작게 하기 때문에, 잡음 프레임에서 뮤지컬 노이즈의 발생을 억압하여 음성 구간 감소를 방지할 수 있다. 이 때의 감산 전, 감산 후의 잡음 프레임의 진폭 스펙트럼 모양을 나타낸 것이 도 5이다.
상기 감산율(r)을 1.0으로 크게하여 잡음을 뺀 경우는, 감산 후의 잡음 진폭 스펙트럼의 강한 세력인 주파수의 성분만이 잔류하여 뮤지컬 노이즈의 원인이 된다. 감산율(r)을 0.5로서 감산을 약화시킨 경우는, 감산 후의 잡음 진폭 스펙트럼에 있어서의 일부 주파수로의 진폭 치우침이 경감되어 뮤지컬 노이즈는 발생하지 않는다. 상기 감산 양을 줄인 프레임에서는,그것에 따라서 진폭 억압을 하고 있기 때문에, 잡음 억압량이 부족한 것도 방지할 수 있다. 또한, 본 실시 형태에 있어서의 진폭 조정 필터부(6)에서는 수학식 8에 의해서 진폭 조정 계수가 1개의 프레임 내에서도 샘플마다 순서대로 시간축 방향으로 서서히 변화하도록 하여, 음성 구간의 상승 등 급격한 진폭 조정을 해도 자연스러운 출력이 얻어진다.
(제2 실시 형태)
진폭 조정은 주파수 영역에서 실시해도 된다. 즉, 푸리에 변환 후에 진폭 조정 필터부를 설치하여, 진폭 조정 후의 신호를 역 푸리에 변환하는 구성으로 한다.
본 발명의 제2 실시 형태의 방법을 도면에 근거하여 설명한다.
도 6은 본 실시 형태에 관련되는 스펙트럼 서브트렉션 방법의 구성을 나타내는 블록도이다.
도 6에 근거하여 본 방법의 동작을 설명한다.
도 6의 구성은, 도 1에 있어서의 진폭 조정 필터를 서브트렉션·필터(4) 직후에 이동하여 진폭 조정을 주파수 영역에서 행하는 구성을 나타내고 있으며, 그 외 부분의 동작은 제1 실시 형태의 동작과 동일하다.
도면에 있어서, 서브트렉션·필터부(4)는 수학식 6에 따라 감산율을 산출하고, 이 감산율에 근거해 입력 진폭 스펙트럼(9)으로부터 추정 잡음 진폭 스펙트럼 (10)을 감산하여 출력 진폭 스펙트럼을 출력한다. 진폭 조정 필터부(15)는 이 감산율(r)에 근거하여 산출된 진폭 조정 계수를 출력 진폭 스펙트럼에 곱하여 최종적인 출력 진폭 스펙트럼을 출력한다.
본 실시 형태에 의하면, 잡음 프레임이나 자음 등 파워가 작은 음성 프레임에서는 감산 강도를 작게 하기 때문에, 잡음 프레임에서 뮤지컬 노이즈 발생을 억압하여 자음 구간의 변형이나 삭감을 방지할 수 있으며, 또, 감산량을 줄인 프레임에서는 그것에 대응하여 진폭 억압을 하고 있기 때문에 잡음 억압량이 부족한 것도 방지할 수 있다.
또한, 진폭 조정 계수는 프레임에 1회 산출하면 되고, 제1 실시 형태의 도 2의 S3처럼 신호 1 샘플마다 진폭 조정 계수를 계산하지 않아도 되어 적은 연산량으로 실현 가능하다.
(제3 실시 형태)
앞의 실시 형태에서는, 입력 신호는 소정 프레임으로 구분된 구간마다 음성을 추출하고 있었기 때문에, 프레임(구간)의 변화점에서 입력 신호가 불연속이 되어, 이음감이 생기는 경우가 있다. 본 실시 형태에서는, 이를 개선하여 프레임 사이의 신호 변화를 원활화한다.
이하 본 발명의 실시 형태 방법을 도면에 근거하여 설명한다.
도 7은 본 발명의 제3 실시 형태에 있어서의 스펙트럼 서브트렉션 방법의 구성을 나타내는 블록도이다. 입력 신호 생성부(19)와 파형 정형 처리부(20)가 새로운 요소이고, 그 외는, 도 1의 각 요소와 같다.
도 8은 본 제3 실시 형태의 잡음 경감 방법에 있어서의 입력 신호(7) 예를 나타내는 도면이며, 도 9는 본 제3 실시 형태의 잡음 경감 방법에 있어서의 입력 신호 생성부가 행하는 입력 신호에 대하여 곱하는 중첩 함수를 나타낸 도면이다.
또한, 도 10은 본 제3 실시 형태의 잡음 경감 방법에 있어서의 역 푸리에 변환부(5)의 출력 신호(5a)의 예를 나타내는 도면이다.
도 7의 구성도에 근거해, 본 실시 형태에 있어서의 잡음 경감 방법의 동작을 설명한다.
AD변환 후 입력 신호(7)의 시계열 진폭을 나타낸 것이 도 8로, 이것이 상기 입력 신호 생성부(19)에 입력된다. 상기 입력 신호 생성부(19)는 현 프레임에서 잡음 억압 처리하는 프레임 신호를 s(i)(i=n, n+1,···, n+fr)로 한 경우, 프레임 신호에 전후 신호를 더한 s(i)(i= n-a, n-a+1,···, n+fr+sm+a)를 잘라낸다. 도 8의 A는 프레임의 이전 설정 구간이다. 도 8의 B와 C는 프레임의 이후 설정 구간이다. 다음, 도 9의 중첩 함수를 곱하여 다음 수학식 10과 같이 중첩된 신호 s'(i)(i=n-a, n-a+1,···, n+fr+sm+a)를 산출한다. 도 8의 A와 C의 설정 구간에서는, 끝이 0에 가깝게 중첩된다. 도 8의 B의 설정 구간에서는 프레임 신호와 같은 1로 중첩된다.
s'(i)=S(i)·W(i-n+a)
(i=n-a, n-a+1,···, n+fr+sm+a)
이 신호 s'(i)(i=n-a, n-a+1,···, n+fr+sm+a)를 푸리에 변환부(1)가 푸리에 변환한다. 역 푸리에 변환부(5)의 출력 신호를 u(i)(i=0,1,···,2a+fr+sm)로 하면, 도 10은 u(i)를 나타내며, 시간적으로는 u(i)(i=0,1,···,2a+fr+sm)는 s(n-a+i)(i=0,1,···,2a+fr+sm)에 대응한다.
상기 파형 정형 처리부(20)는 도 18에 나타낸 바와 같이, 역 푸리에 변환된 신호로 프레임 신호에 대응되는 u(i)(i=a, a+1,···, a+fr)가 프레임 사이에서 불연속이 되지 않도록 하는 파형 정형 처리를 하여 출력한다. 다음의 수학식 11은 이전 프레임의 이후 설정 구간(B)의 역 푸리에 변환 출력인 u(i)(i=a+fr, a+fr+1,···, a+fr+sm)를 up(i)(i=0,1,···, sm)로 했을 때의 파형 정형 처리 후의 출력 신호를 나타내는 식이다.
u'(i)=(u(i)·i+ up(i-a)
·(sm-i))/sm
(i=a, a+1,···, a+sm)
u'(i) : 파형 정형 처리 후의 신호
본 실시 형태에 의하면, 끝을 0에 가깝게 중첩한 신호를 푸리에 변환하고 있기 때문에, 잡음 경감 능력이 향상한다. 또한, 고정 소수점 연산 디지털 신호 프로세서{고정소수점(DSP)(디지탈 시그널 프로세서)}로 본 시스템을 실현했을 때에, 중첩했기 때문에 정밀도가 악화하는 양 끝의 신호(도 18의 A와 C)를 파형 정형 처리에 사용하지 않기 때문에, 출력의 정밀도 확보가 용이해져 프레임 경계에서의 이음을 방지할 수 있다.
DSP를 사용하면 16비트 정도의 짧은 단어 길이의 고정 소수점 연산을 행하기 때문에, 다이내믹 레인지가 큰 신호를 처리하면 정밀도 악화가 생긴다. 끝을 0에 가깝도록 중첩하면 신호의 다이내믹 레인지가 확대되기 때문에, DSP를 사용하면 정밀도 악화가 일어난다. 본 실시 형태에서는, 정밀도 악화가 일어난 끝의 신호를 파형 정형 처리에 사용하지 않기 때문에 파형 정형 처리의 정밀도가 향상한다.
(제4 실시 형태)
스펙트럼 서브트렉션의 잡음 경감 효과를 높이는 방법으로서, 잡음 구간의 판별을 쉽게 하고, 또한, 지나친 삭제에 의한 음성 삭제를 경감하는 방법을 생각할 수 있다.
이하, 본 발명의 제4 실시 형태의 방법을 도면에 근거하여 설명한다.
도 11은 본 발명의 제4 실시 형태에 있어서의 스펙트럼 서브트렉션 방법의 구성을 나타내는 블록도이다. 도면에 있어서, 신규 요소로 감산율 산출부(16)가 있다. 다른 요소는 도 1의 도면 번호와 같다.
도 12는 본 실시 형태의 잡음 경감 방법에 있어서의 동작을 설명하는 도면이다. 도면에 있어서, 실선은 잡음 구간의 입력 파워(POWS)를, 점선은 평균 잡음 파워(POWAVE)를, 쇄선은 잡음 구간 판정 임계치(POWTH)를 나타낸다. 또한, POWTH는 수학식 3에서 설명한 이전 잡음 프레임에서의 임계치(TH)이다.
도 11의 전체 구성도에 근거하여, 본 실시 형태에 있어서의 잡음 경감 방법의 동작을 설명한다.
본 구성은, 종래법의 스펙트럼 서브트렉션의 전체 구성에 감산율 산출부(16)를 추가한 구성으로 되어있다. 도 11에 있어서, 서브트렉션·필터부(4)의 필터는, 수학식 1의 연산을 행한다. 잡음 구간 판정부(2)에서는, 잡음 구간 판정 임계치 POWTH를 산출하여, 입력 파워가 이 임계치를 밑돌았을 경우, 잡음 프레임이라 판정한다.
상기 감산율 산출부(16)는 이 판정 결과에 근거하여 현재에 가까운 복수 잡음 프레임의 평균 파워를 산출하여 평균 잡음 파워로 하고, 하기의 수학식 12에 근거하여 잡음 구간 판정 임계치를 POWTH, 평균 잡음 파워를 POWAVE로 했을 때의 잡음 구간 판정 임계치(17)와 평균 잡음 파워와의 비(r1)를 계산하여, 이것을 잡음 변동 크기(18)로 출력한다.
이 잡음 변동의 크기(r1)를, 수학식 1의 잡음 스펙트럼의 감산율(r)로 한다. 잡음 구간 판정 임계치 POWTH는 파워 변동이 큰 잡음의 경우에, 올바르게 잡음 구간이라 판정 가능한 높은 쪽의 값을 사용한다. 이 때의 잡음 구간에 있어서의 입력 파워의 변화에 대하여, 평균 잡음 파워와 잡음 구간 판정 임계치의 변화를 도 12에 나타낸다.
본 실시 형태에 의하면, 잡음의 파워 변동이 큰 경우라도, 도 12와 같이, 잡음 프레임의 평균 잡음 파워 POWAVE는 잡음 구간 판정 임계치 POWTH보다도 작은 값을 취하기 때문에, 감산율(r1)은 1보다 작은 값을 취하게 된다. 결과적으로, 추정 잡음 진폭 스펙트럼의 감산을 억압하는 효과가 얻어져, 음성의 줄어듬을 경감할 수 있고, 또한, 추정 잡음 진폭 스펙트럼의 갱신도 정상으로 행해진다.
(제5 실시 형태)
잡음 구간의 잡음으로 간주되는 입력 신호를 진폭 억압하여, 불쾌 잔류 잡음을 경감하는 방법을 설명한다.
이하, 본 발명의 제5 실시 형태의 방법을 도면에 근거하여 설명한다.
도 13은 본 발명의 제5 실시 형태에 있어서의 잡음 경감 방법의 주요 구성부를 나타내는 블록도이다.
또한, 도 14는 본 실시 형태의 잡음 경감 방법에 있어서의 동작을 설명하는 도면이다.
본 구성은, 잡음 구간의 진폭 억압에 의해 잡음을 경감하는 방법으로, 진폭 억압을 하는 진폭 조정 계수를 현재의 입력 파워와 평균 잡음 파워에 의존하여 결정한다.
도 13을 사용하여 동작을 설명한다.
잡음 구간 판정부(301)는 입력 신호(304)로부터 도 12의 실선으로 나타나는 입력 파워 POWS(305)를 산출하여, 제1 실시 형태와 같은 잡음 구간 판정 임계치 POWTH에 의한 잡음 구간 판정을 행한다. 평균 잡음 파워 산출부(302)는 이 잡음 구간 판정 결과에 의해 현재의 프레임에 가까운 과거의 복수 잡음 프레임의 평균 파워를 산출하여, 도 12의 점선으로 나타나는 평균 잡음 파워 POWAVE(306)로 한다.
진폭 조정 필터부(303)는 상기 입력 신호의 입력 파워 POWS(305)와 평균 잡음 파워 POWAVE(306)로부터 수학식 13에 의해 진폭 억압 계수(G)를 산출하고, 이것을 그대로 진폭 조정 계수로 하여, 입력 신호(304)에 얻은 진폭 조정 계수를 곱하여 출력 신호(307)로 한다.
(POWS- POWAVE 0)
G=0
(POWS- POWAVE〈 0)
또한, 수학식 13에서 산출한 진폭 억압 계수(G)를 사용해서, 프레임 사이에서 진폭 조정 계수가 순조롭게 변화하도록 하기 위해, 수학식 8과 같이, G에 1 샘플마다 평활 조작을 하여 최종적인 진폭 조정 계수{g(n)}로 해도 된다.
도 14는 상기 입력 신호(304)의 입력 파워 POWS(305)와 진폭 조정 후의 출력 신호(307)의 출력 파워와의 관계를 나타낸 것이다.
도 14의 점선은 진폭 조정 필터를 쓰지 않고 입력 신호를 그대로 출력한 경우이다. 즉, 점선은 입력 신호의 입력 파워 = 출력 신호의 출력 파워가 되는 경우를 나타내고 있다. 실선은, 진폭 조정 필터를 쓴 경우의 입력 파워 POWS와 출력 파워의 관계를 나타내고 있다. 진폭 억압에 의해 점선보다 작은 값이 출력되는 것을 나타내고 있다. 또한, 입력 파워가 평균 잡음 파워 POWAVE보다 작은 경우는 출력 신호의 파워는 0이 되는 것을 나타내고 있다.
본 실시 형태에 의하면, 감산율을 가변으로 한 데다가, 이에 근거하여 진폭 억압도를 바꾸는 진폭 조정 필터부를 구비하였기 때문에, 진폭 조정 계수를 음성 상태의 판정 결과로부터 직접 결정한 경우처럼 빈번하게, 더구나 심하게 진폭 억압을 변화시키지 않고 음성 출력이 안정된다.
이상과 같이, 본 발명에 의하면 감산율을 가변으로 한 데다가, 이에 근거하여 진폭 억압도를 바꾸는 진폭 조정 필터부를 구비하였기 때문에, 음성 구간의 줄어듬을 방지하기 위한 따위의 목적으로 잡음 필터 등에서의 감산 강도를 작게 해도, 그에 대응한 진폭 억압을 행함으로서 잡음을 억압하기 위해 전체적으로 균형이 잡힌 듣기 용이한 출력을 얻을 수 있는 효과가 있다.
게다가, 진폭 조정을 주파수 영역에서 행하도록 하였기 때문에, 신호 1 샘플마다 진폭 조정 계수를 계산할 필요가 없어 연산량을 적게 할 수 있는 효과가 있다.
게다가, 진폭 조정 계수가 프레임 내에서도 시간축 방향에서 서서히 변화하므로, 음성 구간의 상승 등 급격한 진폭 조정을 해도 자연스러운 출력이 얻어진다.
게다가, 현 프레임의 전후 구간 신호도 중첩 함수를 곱하여 가산되는 입력 신호 생성부를 구비하였기 때문에, 푸리에 변환의 대상 신호가 중첩되어 잡음 스펙트럼의 추정 정밀도가 향상하여 잡음 경감 효과가 높아지며, 또한, 역 푸리에 변환 출력이 중첩되어 있지 않은 신호를 프레임 신호로서 출력하여, 고정 소수점 연산 디지털 신호 프로세서라도 연산이 적고 높은 신호 정밀도가 얻어지는 효과가 있다.
또는, 잡음 구간이라 판정된 구간의 변동성에 따라서 잡음 제거의 강약을 조정하도록 했기 때문에, 잡음의 변동성이 큰 경우도 추출하여 정확한 잡음 판정 임계치를 설정할 수 있고, 또한, 혼입 음성 성분이 음성을 줄이는 것을 막는 효과도 있다.
게다가, 잡음 구간의 판정 결과로부터 직접 진폭 억압량을 정하지 않고, 서서히 변화하는 잡음 구간의 평균 파워를 사용하여 진폭 억압량을 정하도록 하였기 때문에, 출력이 잡음 구간 판정이 빈번한 변화에 의한 악영향을 피할 수 있는 효과가 있다.

Claims (12)

  1. 소정의 프레임 길이로 잘린 입력 신호를 직교 변환하여 얻은 진폭 스펙트럼으로부터 추정 잡음 진폭 스펙트럼을 스펙트럼 서브트렉션·필터에 의해 감산하여 출력을 얻는 잡음 경감 장치에 있어서,
    프레임마다 상기 스펙트럼 서브트렉션·필터에 의한 감산 출력에, 상기 진폭 스펙트럼의 파워와 상기 추정 잡음 진폭 스펙트럼의 파워로 정해지는 진폭 조정 계수를 곱하여 소요 출력을 얻는 진폭 조정 필터부를 구비한 것을 특징으로 하는 잡음 경감 장치.
  2. 제1항에 있어서, 상기 스펙트럼 서브트렉션·필터는 상기 추정 잡음 진폭 스펙트럼의 감산의 감산율을 상기 추정 잡음 진폭 스펙트럼에 따라서 가변으로 하고, 상기 진폭 조정 필터부는 상기 감산율에 따라서 상기 진폭 조정 계수를 가변으로 하는 것을 특징으로 하는 잡음 경감 장치.
  3. 제2항에 있어서, 상기 진폭 조정 필터부는 감산율이 큰 경우,
    진폭 조정 계수를 크게 함으로서 음성 구간에서 잡음 억압을 강화시키고, 또한 출력 신호의 출력치를 크게 함과 동시에, 상기 진폭 조정 필터부는 감산율이 작은 경우, 진폭 조정 계수를 작게 함으로서 잡음 구간에서 잡음 억압을 약화시키고, 또한 출력 신호의 출력치를 작게 하는 것을 특징으로 하는 잡음 경감 장치.
  4. 제1항에 있어서, 상기 진폭 조정 필터부는 상기 진폭 조정 계수를 상기 스펙트럼 서브트렉션·필터에 의한 감산 출력을 역 직교 변환한 시간 영역의 진폭 스펙트럼에 곱하는 것을 특징으로 하는 잡음 경감 장치.
  5. 제1항에 있어서, 상기 진폭 조정 필터부는 상기 진폭 조정 계수를 프레임마다 주파수 영역에서 스펙트럼에 곱하고, 역 직교 변환하여 출력을 얻도록 한 것을 특징으로 하는 잡음 경감 장치.
  6. 제1항에 있어서, 상기 진폭 조정 계수는 현 프레임의 입력 신호 진폭 스펙트럼의 파워와 현 프레임의 추정 잡음 진폭 스펙트럼의 파워의 차이에 근거해 얻은 현 프레임의 진폭 조정 계수에, 전 프레임에서 얻은 진폭 조정 계수치를 중첩 가산한 값으로 한 것을 특징으로 하는 잡음 경감 장치.
  7. 소정의 프레임 길이로 잘라낸 입력 신호를 직교 변환하여 얻은 진폭 스펙트럼으로부터 추정 잡음 진폭 스펙트럼을 스펙트럼 서브트렉션·필터에 의해 감산하여 출력을 얻는 잡음 경감 장치에 있어서,
    현 프레임의 전후 설정 구간을 잘라내어 끝이 0에 가까워 지도록, 1이하의 중첩 함수를 곱한 후에 현 프레임 전후에 부가하는 입력 신호 생성부를 구비하여, 상기 입력 신호 생성부의 출력을 입력 신호로서 상기 진폭 스펙트럼을 구하도록 한 것을 특징으로 하는 잡음 경감 장치.
  8. 제7항에 있어서, 1의 중첩 함수가 승산된 이전 프레임의 이후 설정 구간을 사용하여 현 프레임의 파형 정형을 행하는 파형 정형 처리부를 구비한 것을 특징으로 하는 잡음 경감 장치.
  9. 소정의 프레임 길이로 잘린 입력 신호를 직교 변환하여 얻은 진폭 스펙트럼으로부터 추정 잡음 진폭 스펙트럼을 스펙트럼 서브트렉션·필터에 의해 감산하여 출력을 얻는 잡음 경감 장치에 있어서,
    상기 추정 잡음 진폭 스펙트럼의 복수 프레임분으로부터 평균 잡음 파워를 구해 잡음 프레임의 판정 임계치와 비교해 감산율을 얻는 감산율 산출부를 구비하며,
    상기 스펙트럼 서브트렉션·필터의 감산에 사용되는 감산율을 상기 감산율로 한 것을 특징으로 하는 잡음 경감 장치.
  10. 제1항에 있어서, 상기 추정 잡음 진폭 스펙트럼의 복수 프레임분으로부터 평균 잡음 파워를 구하는 평균 잡음 파워 산출부를 구비하며,
    상기 진폭 조정 필터부는 프레임마다 상기 스펙트럼 서브트렉션·필터에 의한 감산 출력에, 상기 진폭 스펙트럼의 파워와 상기 구한 평균 잡음 진폭 파워로 정해지는 진폭 조정 계수를 곱하여, 소요 출력을 얻도록 한 것을 특징으로 하는 잡음 경감 장치.
  11. 소정의 프레임 길이로 잘린 입력 신호를 직교 변환하여 얻은 진폭 스펙트럼으로부터 추정 잡음 진폭 스펙트럼을 스펙트럼 서브트렉션·필터에 의해 감산하여 출력을 얻는 잡음 경감 방법에 있어서,
    상기 스펙트럼 서브트렉션·필터의 감산율을 상기 추정 잡음 진폭 스펙트럼에 따라서 가변하는 공정과,
    프레임마다 상기 스펙트럼 서브트렉션·필터에 의한 감산 출력에, 상기 진폭 스펙트럼의 파워와 상기 추정 잡음 진폭 스펙트럼의 파워로 정해지는 진폭 조정 계수를 곱하여 소요 출력을 얻는 공정을 구비한 것을 특징으로 하는 잡음 경감 방법.
  12. 소정의 프레임 길이로 잘린 입력 신호를 직교 변환하여 얻은 진폭 스펙트럼으로부터 추정 잡음 진폭 스펙트럼을 스펙트럼 서브트렉션·필터에 의해 감산하여 출력을 얻는 잡음 경감 방법에 있어서,
    상기 추정 잡음 진폭 스펙트럼의 복수 프레임분으로부터 평균 잡음 파워를 구하여 잡음 프레임의 판정 임계치와 비교하여 감산율을 얻는 감산율 산출 공정과,
    상기 스펙트럼 서브트렉션·필터의 감산율을 상기 감산율로 하는 공정을 구비한 것을 특징으로 하는 잡음 경감 방법.
KR1019997008125A 1998-03-30 1999-09-07 잡음 경감 장치 및 잡음 경감 방법 KR100314332B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP8417498 1998-03-30
JP98-84174 1998-03-30

Publications (2)

Publication Number Publication Date
KR20000076037A true KR20000076037A (ko) 2000-12-26
KR100314332B1 KR100314332B1 (ko) 2001-11-16

Family

ID=13823136

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019997008125A KR100314332B1 (ko) 1998-03-30 1999-09-07 잡음 경감 장치 및 잡음 경감 방법

Country Status (6)

Country Link
EP (1) EP0992978A4 (ko)
KR (1) KR100314332B1 (ko)
CN (1) CN1258368A (ko)
AU (1) AU721270B2 (ko)
CA (1) CA2291826A1 (ko)
WO (1) WO1999050825A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8688854B2 (en) 2005-07-08 2014-04-01 Nhn Corporation Messenger notification system and method using synchronization server

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4162604B2 (ja) 2004-01-08 2008-10-08 株式会社東芝 雑音抑圧装置及び雑音抑圧方法
WO2006046293A1 (ja) * 2004-10-28 2006-05-04 Fujitsu Limited 雑音抑圧装置
JP4873913B2 (ja) 2004-12-17 2012-02-08 学校法人早稲田大学 音源分離システムおよび音源分離方法、並びに音響信号取得装置
GB2422237A (en) * 2004-12-21 2006-07-19 Fluency Voice Technology Ltd Dynamic coefficients determined from temporally adjacent speech frames
WO2006123721A1 (ja) * 2005-05-17 2006-11-23 Yamaha Corporation 雑音抑圧方法およびその装置
CN1822092B (zh) * 2006-03-28 2010-05-26 北京中星微电子有限公司 一种消除语音输入中背景噪声的方法及其装置
CN101166232B (zh) * 2006-10-19 2010-05-12 华晶科技股份有限公司 消除马达声音的方法及其数字影像撷取装置
WO2009038136A1 (ja) * 2007-09-19 2009-03-26 Nec Corporation 雑音抑圧装置、その方法及びプログラム
US20120143604A1 (en) * 2010-12-07 2012-06-07 Rita Singh Method for Restoring Spectral Components in Denoised Speech Signals
JP6182895B2 (ja) 2012-05-01 2017-08-23 株式会社リコー 処理装置、処理方法、プログラム及び処理システム
JP6216546B2 (ja) * 2013-06-18 2017-10-18 パイオニア株式会社 ノイズ低減装置、放送受信装置及びノイズ低減方法
JP2015206874A (ja) 2014-04-18 2015-11-19 富士通株式会社 信号処理装置、信号処理方法、及び、プログラム
JP6687453B2 (ja) * 2016-04-12 2020-04-22 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America ステレオ再生装置
JP6668995B2 (ja) * 2016-07-27 2020-03-18 富士通株式会社 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム
CN108831500B (zh) * 2018-05-29 2023-04-28 平安科技(深圳)有限公司 语音增强方法、装置、计算机设备及存储介质

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8801014D0 (en) * 1988-01-18 1988-02-17 British Telecomm Noise reduction
US5710862A (en) * 1993-06-30 1998-01-20 Motorola, Inc. Method and apparatus for reducing an undesirable characteristic of a spectral estimate of a noise signal between occurrences of voice signals
CA2153170C (en) * 1993-11-30 2000-12-19 At&T Corp. Transmitted noise reduction in communications systems
DE69420705T2 (de) * 1993-12-06 2000-07-06 Koninkl Philips Electronics Nv System und vorrichtung zur rauschunterdrückung sowie mobilfunkgerät
JP3437264B2 (ja) * 1994-07-07 2003-08-18 パナソニック モバイルコミュニケーションズ株式会社 雑音抑圧装置
SE505156C2 (sv) * 1995-01-30 1997-07-07 Ericsson Telefon Ab L M Förfarande för bullerundertryckning genom spektral subtraktion
JP3484801B2 (ja) * 1995-02-17 2004-01-06 ソニー株式会社 音声信号の雑音低減方法及び装置
JP3451146B2 (ja) * 1995-02-17 2003-09-29 株式会社日立製作所 スペクトルサブトラクションを用いた雑音除去システムおよび方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8688854B2 (en) 2005-07-08 2014-04-01 Nhn Corporation Messenger notification system and method using synchronization server

Also Published As

Publication number Publication date
CA2291826A1 (en) 1999-10-07
WO1999050825A1 (fr) 1999-10-07
AU721270B2 (en) 2000-06-29
AU1352599A (en) 1999-10-18
KR100314332B1 (ko) 2001-11-16
CN1258368A (zh) 2000-06-28
EP0992978A4 (en) 2002-01-16
EP0992978A1 (en) 2000-04-12

Similar Documents

Publication Publication Date Title
KR100314332B1 (ko) 잡음 경감 장치 및 잡음 경감 방법
JP4863713B2 (ja) 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム
EP1557827B1 (en) Voice intensifier
US7158932B1 (en) Noise suppression apparatus
US6023674A (en) Non-parametric voice activity detection
RU2145737C1 (ru) Способ подавления шума путем спектрального вычитания
US7302065B2 (en) Noise suppressor
KR100414841B1 (ko) 잡음저감방법및장치
US7706550B2 (en) Noise suppression apparatus and method
US20070232257A1 (en) Noise suppressor
US20010005822A1 (en) Noise suppression apparatus realized by linear prediction analyzing circuit
JPH09204196A (ja) 雑音抑圧器及び移動局並びに雑音抑圧方法
JP2004341339A (ja) 雑音抑圧装置
KR100347699B1 (ko) 전력스펙트럼밀도추정방법및장치
JP2000330597A (ja) 雑音抑圧装置
JP2001159899A (ja) 騒音抑圧装置
US20030033139A1 (en) Method and circuit arrangement for reducing noise during voice communication in communications systems
US20030065509A1 (en) Method for improving noise reduction in speech transmission in communication systems
JP2002140100A (ja) 騒音抑圧装置
JP2003058186A (ja) 雑音抑圧方法および雑音抑圧装置
JP3310225B2 (ja) 雑音レベル時間変動率計算方法及び装置と雑音低減方法及び装置
JP2003131689A (ja) ノイズ除去方法及び装置
US7177805B1 (en) Simplified noise suppression circuit
EP1628397A1 (en) Audio quality adjustment device
JP3594356B2 (ja) 音声処理装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
G170 Re-publication after modification of scope of protection [patent]
FPAY Annual fee payment

Payment date: 20041025

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee