KR100468829B1

KR100468829B1 - 잡음제거방법

Info

Publication number: KR100468829B1
Application number: KR10-1998-0022563A
Authority: KR
Inventors: 공병구; 김상룡
Original assignee: 삼성전자주식회사
Priority date: 1998-06-16
Filing date: 1998-06-16
Publication date: 2005-05-03
Also published as: KR20000002024A

Abstract

본 발명은 잡음제거 방법에 관한 것으로, 과거 신호구간들중 잡음 구간들로부터 과거 잡음패턴을 추출하는 제1단계; 현재 입력된 신호구간에서 비음성 대역을 추출하는 제2단계; 과거 잡음패턴에서 비음성 대역과 동일한 대역을 추출하는 제3단계; 제3단계에서 추출된 대역의 패턴을 비음성 대역의 패턴에 일치시켜서 현재 신호구간의 잡음패턴을 생성하는 제4단계; 및 현재 신호구간의 패턴으로부터 현재 신호구간의 잡음패턴을 감산하는 제5단계를 포함한다.

본 발명에 의하면, 잡음제거시 현재 입력된 신호구간의 잡음패턴을 과거 구간과 현재 구간의 정보를 이용하여 추정하여 제거함으로써, 훨씬 뛰어난 잡음제거 효과와 잡음제거로 인한 음성신호의 왜곡을 줄일 수 있다.

Description

잡음제거 방법{Method for noise cancellation}

본 발명은 잡음제거 방법에 관한 것으로, 특히 음성에 혼입되는 잡음을 추정하여 제거하는 방법에 관한 것이다.

잡음제거란 일반적으로 실제 환경의 신호에 섞여있는 목적 신호외의 다른 신호를 제거하는 것을 의미하나, 보통 모든 잡음을 제거하는 것은 아직 실현이 불가능하다.

보통 잡음 환경에서 음성처리를 위한 기술의 구현은 잡음으로 인한 성능저하가 발생하여 잡음처리 기술을 선행하여야한다. 예를 들어, 자동차 운행환경에서 음성을 인식하여 전화를 거는 경우 또는 음성으로 기기를 조작하는 경우와 통화중인 음질을 고려하면 잡음제거 기술은 반드시 필요하다고 볼 수 있다. 또한 일반적인 환경에서도 잡음은 상존하므로 음성처리 기술의 실용화를 가능케하는 기술이다.

음성신호에 있어서, 종래의 잡음 제거기술은 음성 신호 처리 기술의 응용분야에 맞도록 달리 개발되어 왔다. 즉, 통화의 품질을 개선하기 위해서 사용하는 잡음 제거 기술과 음성인식 기술에 사용하는 잡음 제거 기술의 방법은 전혀 다른 기법을 채택하였다. 보통 통화에 사용하는 음성 특징과 인식에 사용하는 음성 특징이 서로 달라 한쪽 특징에 적당한 잡음 제거 기술이 다른쪽 특징에 적용되어 충분한 성능을 보이지 못한 것이 주 원인이다. 즉 통화 품질을 높이기 위한 잡음 제거 기술을 음성 인식 전처리 기술로 사용 했을 때, 낮은 수준의 잡음 환경에서 약간의 성능 개선을 보인 반면 잡음 수준이 올라가면 오히려 인식 성능이 저하되는 현상을 초래한다.

따라서 한가지 시스템에 인식과 통화를 동시에 구현하기 위해서는 별도의 잡음 제거 기술을 각각 사용해왔다. 도 1은 종래의 잡음제거 방법에 대한 개략도이다. 도 1에 따른 잡음제거 방법은 과거 잡음패턴 추정단계(100), 감산단계(102), 음성/잡음 판별단계(104)로 이루어진다. 과거 잡음패턴 추정단계(100)는 과거 데이터 구간으로부터 잡음패턴을 추정한다. 감산단계(102)는 현재 입력된 패턴으로부터 100단계에서 추정된 과거잡음을 감산하여 잡음이 제거된 신호 패턴을 출력한다. 음성/잡음 판별단계(104)는 감산단계(102)에서 출력된 패턴이 음성인지 잡음인지를 판별하여 과거 잡음패턴의 추정시 반영한다.

그러나 이러한 잡음 제거 기법은 음성과 잡음이 섞이는 구간에서 잡음 특성을 추정해야 되나 음성이 없는 구간의 잡음 특성 정보로 혼음(음성+잡음)구간의 잡음 특성을 추정하여 실제 잡음 제거시 음성 신호에서 잘못 추정된 잡음신호를 감산함으로써 음성 특성의 왜곡이 잡음 크기에 따라 매우 커져서 충분한 성능을 보이지 못했다.

이를 해결하기 위하여 복수의 마이크를 사용하거나 스테레오(음성+잡음, 잡음) 데이터를 미리 준비하여 혼음 구간에서 잡음의 특성을 추정하는 기법이 제시되고 있다. 그러나 복수의 마이크 사용시, 양쪽 마이크에 혼음이 입력 될 뿐 만 아니라 각각의 마이크로 입력되는 신호의 특성이 달라 효과를 보지 못하고 있는 실정이며, 스테레오 데이터의 경우 미리 준비한 잡음과 일치되는 잡음 구간에서만 그 효과가 입증되고 있어 실제 환경의 데이터에 적용하는 경우 성능이 현저히 감소된다. 또한 배경 잡음이 수시로 변화하는 경우에는 잡음제거 효과가 거의 없다.

본 발명이 이루고자하는 기술적 과제는 잡음 추정시, 순수 잡음 구간의 특성과 음성과 잡음이 섞여있는 혼음 구간의 잡음 특성을 이용하여 실제 혼음 구간의 잡음특성을 유사하게 추정하여 제거하는 방법을 제공하는데 있다.

상기 기술적 과제를 달성하기 위한 본 발명의 잡음제거 방법은 과거 신호구간들중 잡음 구간들로부터 과거 잡음패턴을 추출하는 제1단계; 현재 입력된 신호구간에서 비음성 대역을 추출하는 제2단계; 상기 과거 잡음패턴에서 상기 비음성 대역과 동일한 대역을 추출하는 제3단계; 상기 제3단계에서 추출된 대역의 패턴을 상기 비음성 대역의 패턴에 일치시켜서 현재 신호구간의 잡음패턴을 생성하는 제4단계; 및 상기 현재 신호구간의 패턴으로부터 상기 현재 신호구간의 잡음패턴을 감산하는 제5단계를 포함한다.

상기 기술적 과제를 달성하기 위한 본 발명의 잡음추정 방법은 과거 신호구간들중 잡음 구간들로부터 과거 잡음패턴을 추출하는 제1단계; 현재 입력된 신호구간에서 비음성 대역을 추출하는 제2단계; 상기 과거 잡음패턴에서 상기 비음성 대역과 동일한 대역을 추출하는 제3단계; 상기 제3단계에서 추출된 대역의 패턴을 상기 비음성 대역의 패턴에 일치시켜서 현재 신호구간의 잡음패턴을 생성하는 제4단계; 및 상기 현재 신호구간의 패턴으로부터 상기 현재 신호구간의 잡음패턴을 감산하는 제5단계; 상기 제5단계의 출력패턴과 상기 과거 잡음패턴을 비교하여 상기 제5단계의 출력패턴이 음성인지 잡음인지를 판별하는 제6단계; 및 상기 제6단계에서 음성으로 판별되면 상기 과거 잡음패턴을 유지하고, 잡음으로 판별되면 상기 현재 신호구간 패턴을 상기 과거 잡음패턴에 반영하여 다음 구간의 과거 잡음패턴으로 생성하는 제7단계를 포함한다.

이하에서 본 발명의 실시예를 보다 상세히 설명하기로 한다. 도 2는 본 발명의 잡음제거 방법을 이용한 음성신호 처리 장치의 개략적인 블록도이다. 도 2에 따른 음성처리 장치는 아날로그/디지털(A/D) 변환부(200), FFT(Fast Fourier Transform)부(202), 잡음추정부(204), 잡음제거부(206), IFFT(Inverse Fast Fourier Transform)부(208) 및 디지털/아날로그(D/A) 변환부(210)를 포함한다.

그 동작은 다음과 같다. 먼저, A/D변환부(200)는 현재 입력된 신호를 디지털 신호로 변환하고, FFT부(202)는 디지털 신호를 주파수 영역으로 변환한다. 잡음추정부(204)는 과거 구간에서 추출된 잡음패턴의 크기 및 위상을 현재 신호구간의 비음성대역에 해당하는 패턴의 크기와 위상에 일치시켜 현재 신호구간 패턴에 혼합된 잡음패턴을 추정한다. 잡음제거부(206)는 현재 신호구간의 패턴에서 추정된 현재 잡음패턴을 감산하여 잡음을 제거한다. IFFT부(208)는 잡음이 제거된 신호패턴을 시간영역으로 변환하고, D/A변환부(210)는 시간영역의 디지털 신호를 아날로그 신호로 변환하여 잡음이 제거된 음성신호를 얻는다.

도 3은 본 발명에 따른 잡음제거 방법에 대한 흐름도이다. 도 3에 따른 잡음제거 방법은 과거 잡음패턴을 추출하는 단계(300), 입력된 현재 신호구간의 잡음을 추정하는 단계(302 내지 306), 추정된 현재 신호구간의 잡음패턴을 이용하여 현재 신호구간에서 잡음을 제거하는 단계(308), 현재 신호구간의 패턴이 잡음인지 아닌지를 판별하는 단계(310), 다음 구간의 과거 잡음패턴 추정단계(312 내지 320)를 포함한다.

상술한 구성에 따른 잡음제거 방법의 동작은 다음과 같다. 먼저, 과거 잡음구간들로부터 잡음패턴을 추출하고(300단계), 입력된 현재 신호구간 패턴중 비음성대역의 패턴을 추출한다(302단계). 추출된 과거 잡음패턴에서 상술한 비음성 대역과 동일한 대역을 추출한다(304단계). 각 단계에서 추출된 패턴의 크기 및 위상을 비교하여 과거 잡음패턴의 크기 및 위상에 대한 비음성 대역 패턴의 크기 및 위상의 비를 구한다. 이렇게 구해진 크기 및 위상의 비를 상술한 과거 잡음패턴의 크기 및 위상에 곱하여, 현재 신호구간에 혼합된 잡음을 추정한다(306단계). 추정된 현재 신호구간의 잡음패턴을 현재 신호구간의 패턴에서 감산하면 잡음이 제거된 패턴을 얻는다(308단계). 이 때, 잡음이 제거된 패턴이 음의 부호를 갖는 부분이 존재한다면, 종래와 같이 0값으로 주기보다는 이를 양의 부호로 변환하여 주는 것이 바람직하다. 308단계의 잡음이 제거된 패턴을 과거 잡음패턴과 비교하여, 잡음이 제거된 패턴이 음성신호인지 잡음인지를 판별한다(310단계). 판별결과, 잡음이면 잡음이 제거된 패턴과 과거 잡음패턴을 가중합하여(312단계), 다음 구간의 과거 추정된 잡음패턴으로 저장한다(314단계). 판별결과, 음성이면 과거 추정된 잡음패턴을 그대로 유지한다(316단계). 모든 구간의 혼음패턴에 대해 상술한 과정을 수행했다면 종료하고(318단계), 그렇지않다면 다음 구간의 혼음패턴에 대해 상술한 과정을 수행한다(320단계).

다음 표는 종래의 잡음제거 방법인 스펙트럼 감산(Spectrum Subtraction )방법, 특징보상 또는 적응방법 및 본 발명에 따른 잡음제거 방법을 사용하여 혼음신호에서 잡음을 제거한 후 음성인식에 적용한 결과, 각 음성인식률을 비교한 것이다. 음성인식은 동적 타임 워핑(Dynamic Time Warping)을 사용한 100단어 화자 종속 고립어 인식기를 통해 이루어진 것이다.

여기서, 클린 환경은 잡음이 없는 경우이고, SNR 10dB는 잡음 약간 있는 경우, SNR 0dB는 잡음과 신호의 파워가 동일한 경우이다. 본 발명에 의한 잡음제거 방법을 사용한 경우 인식률이 높음을 알 수 있다.

다음 표는 스펙트럼 감산 방법과 본 발명에 따른 잡음제거 방법을 현재 이동 통신기에 적용된 코드분할다원접속(CDMA) 보코더(vocoder)인 큐씨이엘피(QCELP)에 적용한 결과이다. 권고안에 따르면, 5.0이 가장 잘 들리는 경우이고, 0이 알아듣기 힘든 상태를 의미한다.

여기서, 클린 환경은 잡음이 없는 경우이고, SNR 10dB는 잡음 약간 있는 경우, SNR 0dB는 잡음과 신호의 파워가 동일한 경우이다. 본 발명에 의한 잡음제거 방법을 사용한 경우 가청률이 높음을 알 수 있다.

본 발명에 의하면, 잡음제거시 현재 입력된 신호구간의 잡음패턴을 과거 구간과 현재 구간의 정보를 이용하여 추정하여 제거함으로써, 잡음으로인한 음성신호의 왜곡을 줄일 수 있다. 또한, 과거 잡음패턴과 현재 잡음 패턴을 가중 합하여 추정하므로, 잡음 수준이 수시로 변하는 경우에도 잡음을 보다 정확하게 추정할 수 있다.

도 1은 종래의 잡음제거 방법에 대한 개략도이다.

도 2는 본 발명의 잡음제거 방법을 이용한 음성신호 처리 장치의 개략적인 블록도이다.

도 3은 본 발명에 따른 잡음제거 방법에 대한 흐름도이다.

Claims

과거 신호구간들중 잡음 구간들로부터 과거 잡음패턴을 추출하는 제1단계;

현재 입력된 신호구간에서 비음성 대역을 추출하는 제2단계;

상기 과거 잡음패턴에서 상기 비음성 대역과 동일한 대역을 추출하는 제3단계;

상기 제3단계에서 추출된 대역의 패턴을 상기 비음성 대역의 패턴에 일치시켜서 현재 신호구간의 잡음패턴을 생성하는 제4단계; 및

상기 현재 신호구간의 패턴으로부터 상기 현재 신호구간의 잡음패턴을 감산하는 제5단계를 포함함을 특징으로하는 잡음제거 방법.
제1항에 있어서, 상기 제4단계는

상기 제3단계에서 추출된 대역의 패턴에 대해 상기 제2단계에서 추출된 대역의 패턴 크기 및 위상 비를 구하는 단계; 및

상기 단계에서 구한 크기 및 위상 비를 상기 과거 잡음패턴에 곱하여 상기 현재 신호구간의 잡음패턴을 생성하는 단계를 구비함을 특징으로하는 잡음제거 방법.
제1항에 있어서,

상기 제5단계의 출력패턴과 상기 과거 잡음패턴을 비교하여 상기 제5단계의 출력패턴이 음성인지 잡음인지를 판별하는 제6단계; 및

상기 제6단계에서 음성으로 판별되면 상기 과거 잡음패턴을 유지하고, 잡음으로 판별되면 상기 현재 신호구간 패턴을 상기 과거 잡음패턴에 반영하여 다음 구간의 과거 잡음패턴으로 생성하는 제7단계를 더 구비함을 특징으로하는 잡음제거 방법.
제3항에 있어서, 상기 다음 구간의 과거 잡음패턴은

상기 현재 신호구간 패턴과 상기 과거 잡음패턴을 가중합하여 생성함을 특징으로하는 잡음제거 방법.
제1항에 있어서, 상기 제5단계는

상기 감산결과, 음의 부호를 갖는 신호패턴에 대해서는 양의 부호로 변환하는 단계를 더 구비함을 특징으로하는 잡음제거 방법.
제3항에 있어서, 상기 제4단계는

상기 제3단계에서 추출된 대역의 패턴에 대해 상기 제2단계에서 추출된 대역의 패턴의 크기 및 위상 비를 구하는 단계; 및

상기 단계에서 구한 크기 및 위상 비를 상기 과거 잡음패턴에 곱하여 상기 현재 신호구간의 잡음패턴으로 생성하는 단계를 구비함을 특징으로하는 잡음추정 방법.