KR100468829B1 - 잡음제거방법 - Google Patents

잡음제거방법 Download PDF

Info

Publication number
KR100468829B1
KR100468829B1 KR10-1998-0022563A KR19980022563A KR100468829B1 KR 100468829 B1 KR100468829 B1 KR 100468829B1 KR 19980022563 A KR19980022563 A KR 19980022563A KR 100468829 B1 KR100468829 B1 KR 100468829B1
Authority
KR
South Korea
Prior art keywords
noise
pattern
past
section
current signal
Prior art date
Application number
KR10-1998-0022563A
Other languages
English (en)
Other versions
KR20000002024A (ko
Inventor
공병구
김상룡
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR10-1998-0022563A priority Critical patent/KR100468829B1/ko
Publication of KR20000002024A publication Critical patent/KR20000002024A/ko
Application granted granted Critical
Publication of KR100468829B1 publication Critical patent/KR100468829B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Noise Elimination (AREA)
  • Telephone Function (AREA)

Abstract

본 발명은 잡음제거 방법에 관한 것으로, 과거 신호구간들중 잡음 구간들로부터 과거 잡음패턴을 추출하는 제1단계; 현재 입력된 신호구간에서 비음성 대역을 추출하는 제2단계; 과거 잡음패턴에서 비음성 대역과 동일한 대역을 추출하는 제3단계; 제3단계에서 추출된 대역의 패턴을 비음성 대역의 패턴에 일치시켜서 현재 신호구간의 잡음패턴을 생성하는 제4단계; 및 현재 신호구간의 패턴으로부터 현재 신호구간의 잡음패턴을 감산하는 제5단계를 포함한다.
본 발명에 의하면, 잡음제거시 현재 입력된 신호구간의 잡음패턴을 과거 구간과 현재 구간의 정보를 이용하여 추정하여 제거함으로써, 훨씬 뛰어난 잡음제거 효과와 잡음제거로 인한 음성신호의 왜곡을 줄일 수 있다.

Description

잡음제거 방법{Method for noise cancellation}
본 발명은 잡음제거 방법에 관한 것으로, 특히 음성에 혼입되는 잡음을 추정하여 제거하는 방법에 관한 것이다.
잡음제거란 일반적으로 실제 환경의 신호에 섞여있는 목적 신호외의 다른 신호를 제거하는 것을 의미하나, 보통 모든 잡음을 제거하는 것은 아직 실현이 불가능하다.
보통 잡음 환경에서 음성처리를 위한 기술의 구현은 잡음으로 인한 성능저하가 발생하여 잡음처리 기술을 선행하여야한다. 예를 들어, 자동차 운행환경에서 음성을 인식하여 전화를 거는 경우 또는 음성으로 기기를 조작하는 경우와 통화중인 음질을 고려하면 잡음제거 기술은 반드시 필요하다고 볼 수 있다. 또한 일반적인 환경에서도 잡음은 상존하므로 음성처리 기술의 실용화를 가능케하는 기술이다.
음성신호에 있어서, 종래의 잡음 제거기술은 음성 신호 처리 기술의 응용분야에 맞도록 달리 개발되어 왔다. 즉, 통화의 품질을 개선하기 위해서 사용하는 잡음 제거 기술과 음성인식 기술에 사용하는 잡음 제거 기술의 방법은 전혀 다른 기법을 채택하였다. 보통 통화에 사용하는 음성 특징과 인식에 사용하는 음성 특징이 서로 달라 한쪽 특징에 적당한 잡음 제거 기술이 다른쪽 특징에 적용되어 충분한 성능을 보이지 못한 것이 주 원인이다. 즉 통화 품질을 높이기 위한 잡음 제거 기술을 음성 인식 전처리 기술로 사용 했을 때, 낮은 수준의 잡음 환경에서 약간의 성능 개선을 보인 반면 잡음 수준이 올라가면 오히려 인식 성능이 저하되는 현상을 초래한다.
따라서 한가지 시스템에 인식과 통화를 동시에 구현하기 위해서는 별도의 잡음 제거 기술을 각각 사용해왔다. 도 1은 종래의 잡음제거 방법에 대한 개략도이다. 도 1에 따른 잡음제거 방법은 과거 잡음패턴 추정단계(100), 감산단계(102), 음성/잡음 판별단계(104)로 이루어진다. 과거 잡음패턴 추정단계(100)는 과거 데이터 구간으로부터 잡음패턴을 추정한다. 감산단계(102)는 현재 입력된 패턴으로부터 100단계에서 추정된 과거잡음을 감산하여 잡음이 제거된 신호 패턴을 출력한다. 음성/잡음 판별단계(104)는 감산단계(102)에서 출력된 패턴이 음성인지 잡음인지를 판별하여 과거 잡음패턴의 추정시 반영한다.
그러나 이러한 잡음 제거 기법은 음성과 잡음이 섞이는 구간에서 잡음 특성을 추정해야 되나 음성이 없는 구간의 잡음 특성 정보로 혼음(음성+잡음)구간의 잡음 특성을 추정하여 실제 잡음 제거시 음성 신호에서 잘못 추정된 잡음신호를 감산함으로써 음성 특성의 왜곡이 잡음 크기에 따라 매우 커져서 충분한 성능을 보이지 못했다.
이를 해결하기 위하여 복수의 마이크를 사용하거나 스테레오(음성+잡음, 잡음) 데이터를 미리 준비하여 혼음 구간에서 잡음의 특성을 추정하는 기법이 제시되고 있다. 그러나 복수의 마이크 사용시, 양쪽 마이크에 혼음이 입력 될 뿐 만 아니라 각각의 마이크로 입력되는 신호의 특성이 달라 효과를 보지 못하고 있는 실정이며, 스테레오 데이터의 경우 미리 준비한 잡음과 일치되는 잡음 구간에서만 그 효과가 입증되고 있어 실제 환경의 데이터에 적용하는 경우 성능이 현저히 감소된다. 또한 배경 잡음이 수시로 변화하는 경우에는 잡음제거 효과가 거의 없다.
본 발명이 이루고자하는 기술적 과제는 잡음 추정시, 순수 잡음 구간의 특성과 음성과 잡음이 섞여있는 혼음 구간의 잡음 특성을 이용하여 실제 혼음 구간의 잡음특성을 유사하게 추정하여 제거하는 방법을 제공하는데 있다.
상기 기술적 과제를 달성하기 위한 본 발명의 잡음제거 방법은 과거 신호구간들중 잡음 구간들로부터 과거 잡음패턴을 추출하는 제1단계; 현재 입력된 신호구간에서 비음성 대역을 추출하는 제2단계; 상기 과거 잡음패턴에서 상기 비음성 대역과 동일한 대역을 추출하는 제3단계; 상기 제3단계에서 추출된 대역의 패턴을 상기 비음성 대역의 패턴에 일치시켜서 현재 신호구간의 잡음패턴을 생성하는 제4단계; 및 상기 현재 신호구간의 패턴으로부터 상기 현재 신호구간의 잡음패턴을 감산하는 제5단계를 포함한다.
상기 기술적 과제를 달성하기 위한 본 발명의 잡음추정 방법은 과거 신호구간들중 잡음 구간들로부터 과거 잡음패턴을 추출하는 제1단계; 현재 입력된 신호구간에서 비음성 대역을 추출하는 제2단계; 상기 과거 잡음패턴에서 상기 비음성 대역과 동일한 대역을 추출하는 제3단계; 상기 제3단계에서 추출된 대역의 패턴을 상기 비음성 대역의 패턴에 일치시켜서 현재 신호구간의 잡음패턴을 생성하는 제4단계; 및 상기 현재 신호구간의 패턴으로부터 상기 현재 신호구간의 잡음패턴을 감산하는 제5단계; 상기 제5단계의 출력패턴과 상기 과거 잡음패턴을 비교하여 상기 제5단계의 출력패턴이 음성인지 잡음인지를 판별하는 제6단계; 및 상기 제6단계에서 음성으로 판별되면 상기 과거 잡음패턴을 유지하고, 잡음으로 판별되면 상기 현재 신호구간 패턴을 상기 과거 잡음패턴에 반영하여 다음 구간의 과거 잡음패턴으로 생성하는 제7단계를 포함한다.
이하에서 본 발명의 실시예를 보다 상세히 설명하기로 한다. 도 2는 본 발명의 잡음제거 방법을 이용한 음성신호 처리 장치의 개략적인 블록도이다. 도 2에 따른 음성처리 장치는 아날로그/디지털(A/D) 변환부(200), FFT(Fast Fourier Transform)부(202), 잡음추정부(204), 잡음제거부(206), IFFT(Inverse Fast Fourier Transform)부(208) 및 디지털/아날로그(D/A) 변환부(210)를 포함한다.
그 동작은 다음과 같다. 먼저, A/D변환부(200)는 현재 입력된 신호를 디지털 신호로 변환하고, FFT부(202)는 디지털 신호를 주파수 영역으로 변환한다. 잡음추정부(204)는 과거 구간에서 추출된 잡음패턴의 크기 및 위상을 현재 신호구간의 비음성대역에 해당하는 패턴의 크기와 위상에 일치시켜 현재 신호구간 패턴에 혼합된 잡음패턴을 추정한다. 잡음제거부(206)는 현재 신호구간의 패턴에서 추정된 현재 잡음패턴을 감산하여 잡음을 제거한다. IFFT부(208)는 잡음이 제거된 신호패턴을 시간영역으로 변환하고, D/A변환부(210)는 시간영역의 디지털 신호를 아날로그 신호로 변환하여 잡음이 제거된 음성신호를 얻는다.
도 3은 본 발명에 따른 잡음제거 방법에 대한 흐름도이다. 도 3에 따른 잡음제거 방법은 과거 잡음패턴을 추출하는 단계(300), 입력된 현재 신호구간의 잡음을 추정하는 단계(302 내지 306), 추정된 현재 신호구간의 잡음패턴을 이용하여 현재 신호구간에서 잡음을 제거하는 단계(308), 현재 신호구간의 패턴이 잡음인지 아닌지를 판별하는 단계(310), 다음 구간의 과거 잡음패턴 추정단계(312 내지 320)를 포함한다.
상술한 구성에 따른 잡음제거 방법의 동작은 다음과 같다. 먼저, 과거 잡음구간들로부터 잡음패턴을 추출하고(300단계), 입력된 현재 신호구간 패턴중 비음성대역의 패턴을 추출한다(302단계). 추출된 과거 잡음패턴에서 상술한 비음성 대역과 동일한 대역을 추출한다(304단계). 각 단계에서 추출된 패턴의 크기 및 위상을 비교하여 과거 잡음패턴의 크기 및 위상에 대한 비음성 대역 패턴의 크기 및 위상의 비를 구한다. 이렇게 구해진 크기 및 위상의 비를 상술한 과거 잡음패턴의 크기 및 위상에 곱하여, 현재 신호구간에 혼합된 잡음을 추정한다(306단계). 추정된 현재 신호구간의 잡음패턴을 현재 신호구간의 패턴에서 감산하면 잡음이 제거된 패턴을 얻는다(308단계). 이 때, 잡음이 제거된 패턴이 음의 부호를 갖는 부분이 존재한다면, 종래와 같이 0값으로 주기보다는 이를 양의 부호로 변환하여 주는 것이 바람직하다. 308단계의 잡음이 제거된 패턴을 과거 잡음패턴과 비교하여, 잡음이 제거된 패턴이 음성신호인지 잡음인지를 판별한다(310단계). 판별결과, 잡음이면 잡음이 제거된 패턴과 과거 잡음패턴을 가중합하여(312단계), 다음 구간의 과거 추정된 잡음패턴으로 저장한다(314단계). 판별결과, 음성이면 과거 추정된 잡음패턴을 그대로 유지한다(316단계). 모든 구간의 혼음패턴에 대해 상술한 과정을 수행했다면 종료하고(318단계), 그렇지않다면 다음 구간의 혼음패턴에 대해 상술한 과정을 수행한다(320단계).
다음 표는 종래의 잡음제거 방법인 스펙트럼 감산(Spectrum Subtraction )방법, 특징보상 또는 적응방법 및 본 발명에 따른 잡음제거 방법을 사용하여 혼음신호에서 잡음을 제거한 후 음성인식에 적용한 결과, 각 음성인식률을 비교한 것이다. 음성인식은 동적 타임 워핑(Dynamic Time Warping)을 사용한 100단어 화자 종속 고립어 인식기를 통해 이루어진 것이다.
여기서, 클린 환경은 잡음이 없는 경우이고, SNR 10dB는 잡음 약간 있는 경우, SNR 0dB는 잡음과 신호의 파워가 동일한 경우이다. 본 발명에 의한 잡음제거 방법을 사용한 경우 인식률이 높음을 알 수 있다.
다음 표는 스펙트럼 감산 방법과 본 발명에 따른 잡음제거 방법을 현재 이동 통신기에 적용된 코드분할다원접속(CDMA) 보코더(vocoder)인 큐씨이엘피(QCELP)에 적용한 결과이다. 권고안에 따르면, 5.0이 가장 잘 들리는 경우이고, 0이 알아듣기 힘든 상태를 의미한다.
여기서, 클린 환경은 잡음이 없는 경우이고, SNR 10dB는 잡음 약간 있는 경우, SNR 0dB는 잡음과 신호의 파워가 동일한 경우이다. 본 발명에 의한 잡음제거 방법을 사용한 경우 가청률이 높음을 알 수 있다.
본 발명에 의하면, 잡음제거시 현재 입력된 신호구간의 잡음패턴을 과거 구간과 현재 구간의 정보를 이용하여 추정하여 제거함으로써, 잡음으로인한 음성신호의 왜곡을 줄일 수 있다. 또한, 과거 잡음패턴과 현재 잡음 패턴을 가중 합하여 추정하므로, 잡음 수준이 수시로 변하는 경우에도 잡음을 보다 정확하게 추정할 수 있다.
도 1은 종래의 잡음제거 방법에 대한 개략도이다.
도 2는 본 발명의 잡음제거 방법을 이용한 음성신호 처리 장치의 개략적인 블록도이다.
도 3은 본 발명에 따른 잡음제거 방법에 대한 흐름도이다.

Claims (6)

  1. 과거 신호구간들중 잡음 구간들로부터 과거 잡음패턴을 추출하는 제1단계;
    현재 입력된 신호구간에서 비음성 대역을 추출하는 제2단계;
    상기 과거 잡음패턴에서 상기 비음성 대역과 동일한 대역을 추출하는 제3단계;
    상기 제3단계에서 추출된 대역의 패턴을 상기 비음성 대역의 패턴에 일치시켜서 현재 신호구간의 잡음패턴을 생성하는 제4단계; 및
    상기 현재 신호구간의 패턴으로부터 상기 현재 신호구간의 잡음패턴을 감산하는 제5단계를 포함함을 특징으로하는 잡음제거 방법.
  2. 제1항에 있어서, 상기 제4단계는
    상기 제3단계에서 추출된 대역의 패턴에 대해 상기 제2단계에서 추출된 대역의 패턴 크기 및 위상 비를 구하는 단계; 및
    상기 단계에서 구한 크기 및 위상 비를 상기 과거 잡음패턴에 곱하여 상기 현재 신호구간의 잡음패턴을 생성하는 단계를 구비함을 특징으로하는 잡음제거 방법.
  3. 제1항에 있어서,
    상기 제5단계의 출력패턴과 상기 과거 잡음패턴을 비교하여 상기 제5단계의 출력패턴이 음성인지 잡음인지를 판별하는 제6단계; 및
    상기 제6단계에서 음성으로 판별되면 상기 과거 잡음패턴을 유지하고, 잡음으로 판별되면 상기 현재 신호구간 패턴을 상기 과거 잡음패턴에 반영하여 다음 구간의 과거 잡음패턴으로 생성하는 제7단계를 더 구비함을 특징으로하는 잡음제거 방법.
  4. 제3항에 있어서, 상기 다음 구간의 과거 잡음패턴은
    상기 현재 신호구간 패턴과 상기 과거 잡음패턴을 가중합하여 생성함을 특징으로하는 잡음제거 방법.
  5. 제1항에 있어서, 상기 제5단계는
    상기 감산결과, 음의 부호를 갖는 신호패턴에 대해서는 양의 부호로 변환하는 단계를 더 구비함을 특징으로하는 잡음제거 방법.
  6. 제3항에 있어서, 상기 제4단계는
    상기 제3단계에서 추출된 대역의 패턴에 대해 상기 제2단계에서 추출된 대역의 패턴의 크기 및 위상 비를 구하는 단계; 및
    상기 단계에서 구한 크기 및 위상 비를 상기 과거 잡음패턴에 곱하여 상기 현재 신호구간의 잡음패턴으로 생성하는 단계를 구비함을 특징으로하는 잡음추정 방법.
KR10-1998-0022563A 1998-06-16 1998-06-16 잡음제거방법 KR100468829B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-1998-0022563A KR100468829B1 (ko) 1998-06-16 1998-06-16 잡음제거방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-1998-0022563A KR100468829B1 (ko) 1998-06-16 1998-06-16 잡음제거방법

Publications (2)

Publication Number Publication Date
KR20000002024A KR20000002024A (ko) 2000-01-15
KR100468829B1 true KR100468829B1 (ko) 2005-05-03

Family

ID=19539659

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-1998-0022563A KR100468829B1 (ko) 1998-06-16 1998-06-16 잡음제거방법

Country Status (1)

Country Link
KR (1) KR100468829B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100399280B1 (ko) * 2001-08-02 2003-09-26 주식회사 자티전자 이동통신단말기 핸즈프리장치의 잡음제거를 위한 캘리브레이션장치
KR101993003B1 (ko) * 2018-01-24 2019-06-26 국방과학연구소 잡음 제거 장치 및 방법

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS593711A (ja) * 1982-06-30 1984-01-10 Hitachi Ltd 雑音除去装置
JPH05347594A (ja) * 1992-06-16 1993-12-27 Matsushita Electric Ind Co Ltd 伝送符号誤り補償装置
JPH06152542A (ja) * 1992-10-31 1994-05-31 Sony Corp 高能率符号化装置、ノイズスペクトル変更装置及び方法
JPH06311143A (ja) * 1993-04-21 1994-11-04 Nec Corp 誤り制御通信システム
JPH07212319A (ja) * 1994-01-17 1995-08-11 Nec Eng Ltd ディジタル音声信号切替ノイズ抑圧装置
JPH08314472A (ja) * 1995-05-16 1996-11-29 Matsushita Electric Works Ltd 雑音除去システム
KR19990011286A (ko) * 1997-07-22 1999-02-18 구자홍 잡음환경하에서 음성인식을 위한 음성구간 검출방법

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS593711A (ja) * 1982-06-30 1984-01-10 Hitachi Ltd 雑音除去装置
JPH05347594A (ja) * 1992-06-16 1993-12-27 Matsushita Electric Ind Co Ltd 伝送符号誤り補償装置
JPH06152542A (ja) * 1992-10-31 1994-05-31 Sony Corp 高能率符号化装置、ノイズスペクトル変更装置及び方法
JPH06311143A (ja) * 1993-04-21 1994-11-04 Nec Corp 誤り制御通信システム
JPH07212319A (ja) * 1994-01-17 1995-08-11 Nec Eng Ltd ディジタル音声信号切替ノイズ抑圧装置
JPH08314472A (ja) * 1995-05-16 1996-11-29 Matsushita Electric Works Ltd 雑音除去システム
KR19990011286A (ko) * 1997-07-22 1999-02-18 구자홍 잡음환경하에서 음성인식을 위한 음성구간 검출방법

Also Published As

Publication number Publication date
KR20000002024A (ko) 2000-01-15

Similar Documents

Publication Publication Date Title
US8010355B2 (en) Low complexity noise reduction method
US7454010B1 (en) Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation
EP1141948B1 (en) Method and apparatus for adaptively suppressing noise
US8521530B1 (en) System and method for enhancing a monaural audio signal
JP4173641B2 (ja) 音声活動に基づくゲイン制限による音声強化
CN111554315B (zh) 单通道语音增强方法及装置、存储介质、终端
KR101737824B1 (ko) 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치
JP2001134287A (ja) 雑音抑圧装置
JP2004502977A (ja) サブバンド指数平滑雑音消去システム
JP2001501327A (ja) ディジタル音声信号における送信チャンネルの影響のブラインド等化のためのプロセスおよび装置
KR20100010136A (ko) 잡음을 제거하는 장치 및 방법
CN113539285B (zh) 音频信号降噪方法、电子装置和存储介质
Wolfe et al. Towards a perceptually optimal spectral amplitude estimator for audio signal enhancement
JP2004341339A (ja) 雑音抑圧装置
JP4434813B2 (ja) 雑音スペクトル推定方法、雑音抑圧方法および雑音抑圧装置
JP2836271B2 (ja) 雑音除去装置
JPH08160994A (ja) 雑音抑圧装置
KR100468829B1 (ko) 잡음제거방법
JP3418855B2 (ja) 雑音除去装置
KR100931487B1 (ko) 노이지 음성 신호의 처리 장치 및 그 장치를 포함하는 음성기반 어플리케이션 장치
EP1729287A1 (en) Method and apparatus for adaptively suppressing noise
Roy et al. An Iterative Kalman Filter with Reduced-Biased Kalman Gain for Single Channel Speech Enhancement in Non-stationary Noise Condition
KR100751927B1 (ko) 멀티음성채널 음성신호의 적응적 잡음제거를 위한 전처리 방법 및 장치
CN114724565A (zh) 基于声纹识别的通话降噪方法、通话降噪装置及耳机
KR100565428B1 (ko) 인간 청각 모델을 이용한 부가잡음 제거장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20111226

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20121228

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee