KR101993003B1 - 잡음 제거 장치 및 방법 - Google Patents

잡음 제거 장치 및 방법 Download PDF

Info

Publication number
KR101993003B1
KR101993003B1 KR1020180008938A KR20180008938A KR101993003B1 KR 101993003 B1 KR101993003 B1 KR 101993003B1 KR 1020180008938 A KR1020180008938 A KR 1020180008938A KR 20180008938 A KR20180008938 A KR 20180008938A KR 101993003 B1 KR101993003 B1 KR 101993003B1
Authority
KR
South Korea
Prior art keywords
noise
energy value
signal
speech signal
frequency
Prior art date
Application number
KR1020180008938A
Other languages
English (en)
Inventor
조영우
박정식
윤정석
Original Assignee
국방과학연구소
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 국방과학연구소 filed Critical 국방과학연구소
Priority to KR1020180008938A priority Critical patent/KR101993003B1/ko
Application granted granted Critical
Publication of KR101993003B1 publication Critical patent/KR101993003B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Noise Elimination (AREA)

Abstract

본 발명의 일 실시예에 따른 잡음 제거 장치는 혼합 신호로부터 음성 신호 구간과 비음성 신호 구간을 검출하는 신호 검출부와, 비음성 신호 구간에 대해 이전 프레임의 잡음 성분을 현재 프레임의 잡음 성분에서 차감하여 현재 프레임의 잡음 성분에 대한 스펙트럼 에너지 값을 산출하고, 음성 신호 구간의 평균 잡음 스펙트럼 에너지 값과 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 각각 추정하는 잡음 추정부와, 음성 신호 구간에 대한 스펙트럼 에너지 값으로부터 음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 차감하고, 비음성 신호 구간에서 현재 프레임의 잡음 성분에 대한 스펙트럼 에너지 값으로부터 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 차감하여 갱신된 혼합 신호를 생성하는 필터부를 포함한다.

Description

잡음 제거 장치 및 방법{APPARATUS AND METHOD FOR NOISE REDUCTION}
본 발명은 잡음 제거 장치 및 방법에 관한 것으로서, 더욱 상세하게는 음성이 포함된 신호에서 잡음을 제거하는 장치 및 방법에 관한 것이다.
최근 음성인식 기술을 적용한 인공지능 개인 비서와 스마트 홈 디바이스와 같은 제품들의 개발이 급증하고 있다. 이를 통해 가정환경에서 가전제품 등을 음성인식 기반 디바이스와 연동하여 사용자의 음성을 통해 편리하게 제어할 수 있게 되었다.
그런데, 음성인식 기반 제어 방식은 대화 또는 TV소리 등과 같이 배경 환경에서 발생되는 잡음이 존재하는 경우에는 음성 인식률이 현저히 저하되며, 이로 인해 심각한 오작동이 발생될 수 있기 때문에 사용자의 음성을 정확히 인식하고 제어하기 위해서는 배경 잡음을 제거하는 것이 매우 중요하다.
이러한 배경 잡음 등과 같은 잡음은 안정적 잡음과 비안정적 잡음으로 분류할 수 있다. 안정적 잡음은 시간에 따라 신호 특성이 거의 변하지 않는 잡음이며, 에어컨 바람이나 자동차, 전투기 엔진소리 등이 있다. 비안정적 잡음은 시간에 따라 신호 특성의 변화가 심한 잡음이며, 사람 간의 대화나 음악 잡음 등이 있다.
종래 기술에 따라 안정적 잡음과 비안정적 잡음을 제거하는 기술로는 위너 필터(Wiener Filter), 주파수 차감법(Spectral Subtraction)을 이용한 잡음 제거 방식 등이 있다. 이 중에서 위너 필터는 적응 필터를 이용하는 것으로, 요구되는 신호와 예측한 신호의 평균 자승 오차가 최소화 되도록 최적의 필터를 설계하는 것이다. 여기에서 "최적"이란 원하는 출력과 실제 출력 간의 제곱-평균 오차를 최소화(Least Mean Square Error)하는 것이다. 주파수 차감법은 시간 영역의 음성 신호를 주파수 영역으로 해석하고 신호의 첫 부분이 비음성 신호 구간이라고 가정하여 잡음 스펙트럼 에너지를 추정한 후, 전체 신호 영역에 대해 일괄적으로 차감한다. 이러한 주파수 차감법은 적은 계산량과 알고리즘이 간단하고 구현이 용이하다는 장점이 있다. 그래서 음성 향상을 위한 대표적인 잡음 제거 기법으로 알려져 있다.
그런데, 주파수 차감법은 몇 가지의 문제점이 있다. 먼저, 동일한 잡음 스펙트럼 에너지 차감에 대한 오류이다. 신호의 첫 부분을 비음성 신호 구간이라고 가정하여 전체 신호 영역에 대해 차감하기 때문에 각 신호 영역의 스펙트럼 에너지 차이에 따라 잔여 잡음이 남아 있다. 다시 말해, 입력 신호의 시작 부분에 포함된 잡음 성분의 정확도에 의존한다. 따라서 음성 신호 구간에 대한 잡음 제거가 정확히 수행되지 않을 수 있다.
대한민국 공개특허공보 제10-2011-0036175호, 공개일자 2011년 4월 7일.
본 발명의 일 실시예에 따르면, 비음성 신호 구간 및 음성 신호 구간에서 모두에서 잡음을 효과적으로 제거할 수 있는 잡음 제거 장치 및 방법을 제공한다.
본 발명의 해결하고자 하는 과제는 이상에서 언급한 것으로 제한되지 않으며, 언급되지 않은 또 다른 해결하고자 하는 과제는 아래의 기재로부터 본 발명이 속하는 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
일 관점에 따르면 잡음 제거 장치는, 혼합 신호로부터 음성 신호 구간과 비음성 신호 구간을 검출하는 신호 검출부와, 상기 비음성 신호 구간에 대해 이전 프레임의 잡음 성분을 현재 프레임의 잡음 성분에서 차감하여 상기 현재 프레임의 잡음 성분에 대한 스펙트럼 에너지 값을 산출하고, 상기 음성 신호 구간의 평균 잡음 스펙트럼 에너지 값과 상기 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 각각 추정하는 잡음 추정부와, 상기 음성 신호 구간에 대한 스펙트럼 에너지 값으로부터 상기 음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 차감하고, 상기 비음성 신호 구간에서 상기 현재 프레임의 잡음 성분에 대한 스펙트럼 에너지 값으로부터 상기 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 차감하여 갱신된 혼합 신호를 생성하는 필터부를 포함한다.
다른 관점에 따르면 잡음 제거 장치가 수행하는 잡음 제거 방법은, 혼합 신호로부터 음성 신호 구간과 비음성 신호 구간을 검출하는 단계와, 상기 비음성 신호 구간에 대해 이전 프레임의 잡음 성분을 현재 프레임의 잡음 성분에서 차감하여 상기 현재 프레임의 잡음 성분에 대한 스펙트럼 에너지 값을 산출하는 단계와, 상기 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 추정한 후, 상기 비음성 신호 구간에서 상기 현재 프레임의 잡음 성분에 대한 스펙트럼 에너지 값으로부터 상기 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 차감하는 단계와, 상기 음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 추정한 후, 상기 음성 신호 구간에 대한 스펙트럼 에너지 값으로부터 상기 음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 차감하는 단계를 포함한다.
본 발명의 일 실시예에 의하면, 혼합 신호로부터 저주파 대역 에너지를 기준으로 삼아 음성 신호 구간을 검출하기 때문에, 전체 대역 에너지를 기준으로 삼아 음성 신호 구간을 검출할 때보다 계산량이 줄어들게 한다.
또, 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 갱신해 가면서 비음성 신호 구간으로부터 갱신된 평균 잡음 스펙트럼 에너지 값을 차감하기 때문에, 음성 신호 구간뿐만 아니라 비음성 신호 구간에서도 잡음을 효과적으로 제거할 수 있다.
도 1은 본 발명의 일 실시예에 따른 잡음 제거 장치의 블록 구성도이다.
도 2는 본 발명의 일 실시예에 따른 잡음 제거 장치가 수행하는 잡음 제거 방법을 설명하기 위한 흐름도이다.
도 3은 음성 신호의 예를 나타낸 그래프로서, (가)는 음성 신호의 한 프레임에 대한 스펙트럼 에너지를 나타낸 그래프이고, (나)는 본 발명의 일 실시예에서 이용하는 저주파 대역의 예를 나타낸 그래프이다.
도 4 내지 도 7은 0dB, 5dB, 10dB, 15dB에 따른 주파수 차감법과 본 발명의 일 실시예에 따른 잡음 제거 방법의 잡음 제거 결과를 나타낸 것이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명의 범주는 청구항에 의해 정의될 뿐이다.
본 발명의 실시예들을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명은 본 발명의 실시예들을 설명함에 있어 실제로 필요한 경우 외에는 생략될 것이다. 그리고 후술되는 용어들은 본 발명의 실시예에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1은 본 발명의 일 실시예에 따른 잡음 제거 장치의 블록 구성도이다.
도 1에 나타낸 바와 같이 일 실시예에 따른 잡음 제거 장치(100)는 주파수 신호 변환부(110), 신호 검출부(120), 잡음 추정부(130), 필터부(140) 및 시간 신호 변환부(150)를 포함한다.
주파수 신호 변환부(110)는 잡음을 제거하여야 할 혼합 신호를 입력 받고, 입력된 혼합 신호를 주파수 영역으로 재해석하여 주파수 신호로 변환한다.
신호 검출부(120)는 주파수 신호로 변환된 혼합 신호로부터 음성 신호 구간과 비음성 신호 구간을 검출한다. 여기서, 신호 검출부(120)는 주파수 신호 변환부(110)에 의해 변환된 주파수 신호 중 기설정된 주파수보다 낮은 저주파 대역 스펙트럼 에너지 값과 기설정된 임계값을 비교한 결과에 기초하여 음성 신호 구간과 상기 비음성 신호 구간을 검출할 수 있다.
잡음 추정부(130)는 신호 검출부(120)에 의해 검출된 비음성 신호 구간에 대해 이전 프레임의 잡음 성분을 현재 프레임의 잡음 성분에서 차감하여 현재 프레임의 잡음 성분에 대한 스펙트럼 에너지 값을 산출하고, 음성 신호 구간의 평균 잡음 스펙트럼 에너지 값과 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 각각 추정한다. 여기서, 잡음 추정부(130)는 현재 프레임의 저주파 대역 스펙트럼 에너지 값이 기설정된 임계치 이하일 경우, 전체 대역의 이전 프레임의 잡음 성분을 현재 프레임의 잡음 성분으로부터 차감할 수 있다. 또, 잡음 추정부(130)는 기설정된 프레임의 수마다 주기적으로 평균 잡음 스펙트럼 에너지 값을 추정할 수 있다.
필터부(140)는 신호 검출부(120)에 의해 검출된 음성 신호 구간에 대한 스펙트럼 에너지 값으로부터 음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 차감하고, 신호 검출부(120)에 의해 검출된 비음성 신호 구간에서 현재 프레임의 잡음 성분에 대한 스펙트럼 에너지 값으로부터 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 차감하여 갱신된 혼합 신호를 생성한다.
시간 신호 변환부(150)는 필터부(140)에 의해 갱신 생성된 혼합 신호를 주파수 영역으로부터 시간 영역으로 변환하여 시간 영역의 혼합 신호를 획득해 출력한다.
도 2는 본 발명의 일 실시예에 따른 잡음 제거 장치가 수행하는 잡음 제거 방법을 설명하기 위한 흐름도이다.
도 2에 나타낸 바와 같이 일 실시예에 따른 잡음 제거 방법은, 잡음을 제거하여야 할 혼합 신호를 주파수 영역으로 재해석하여 주파수 신호로 변환하는 단계(S210)를 포함한다.
그리고, 일 실시예에 따른 잡음 제거 방법은 주파수 신호로 변환된 혼합 신호로부터 음성 신호 구간과 비음성 신호 구간을 검출하는 단계(S220)를 더 포함한다. 여기서, 주파수 신호로 변환된 혼합 신호에 대해 주파수 신호 중 기설정된 주파수보다 낮은 저주파 대역 스펙트럼 에너지 값과 기설정된 임계값을 비교한 결과에 기초하여 음성 신호 구간과 비음성 신호 구간을 검출할 수 있다.
또, 일 실시예에 따른 잡음 제거 방법은 혼합 신호의 비음성 신호 구간에 대해 잔여 프레임이 존재하지 않을 때까지 이전 프레임의 잡음 성분을 현재 프레임의 잡음 성분에서 차감하여 현재 프레임의 잡음 성분에 대한 스펙트럼 에너지 값을 산출한 후, 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 추정하는 단계(S230, S240, S260)를 더 포함한다. 여기서, 현재 프레임의 저주파 대역 스펙트럼 에너지 값이 기설정된 임계치 이하일 경우, 전체 대역의 이전 프레임의 잡음 성분을 현재 프레임의 잡음 성분으로부터 차감할 수 있다. 또, 기설정된 프레임의 수마다 주기적으로 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 추정할 수 있다.
그리고, 일 실시예에 따른 잡음 제거 방법은 비음성 신호 구간에 대해 잔여 프레임이 존재하지 않을 때까지 현재 프레임의 잡음 성분에 대한 스펙트럼 에너지 값으로부터 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 차감하는 단계(S250, S260)를 더 포함한다.
또, 일 실시예에 따른 잡음 제거 방법은 혼합 신호의 음성 신호 구간에 대해 평균 잡음 스펙트럼 에너지 값을 추정한 후, 음성 신호 구간에 대한 스펙트럼 에너지 값으로부터 음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 차감하는 단계(S270, S280)를 더 포함한다.
다음으로, 일 실시예에 따른 잡음 제거 방법은 음성 신호 구간과 비음성 신호 구간에서 각각 평균 잡음 스펙트럼 에너지 값이 차감되어 갱신된 혼합 신호를 주파수 영역으로부터 시간 영역으로 변환하여 시간 영역의 혼합 신호를 획득하는 단계(S290)를 더 포함한다.
이하, 도 1 내지 도 7을 참조하여 본 발명의 일 실시예에 따른 잡음 제거 장치(100)가 수행하는 잡음 제거 방법에 대해 더 자세히 살펴보기로 한다.
잡음 제거는 음성 인식 성능을 높이기 위한 음성 검출 과정의 필수적인 사전 처리 기술이며, 잡음 제거를 위해 주파수 차감법을 사용할 수 있다.
주파수 차감법은 잡음 신호와 음성 신호가 시간 영역에서 비상관적이며, 두 신호를 더할 수 있다는 것을 가정한다. 예컨대,
Figure 112018008524855-pat00001
Figure 112018008524855-pat00002
를 깨끗한 음성 신호와 잡음 신호라고 했을 경우, 수학식 1과 같이 두 신호를 합하여
Figure 112018008524855-pat00003
라는 혼합 신호로 나타낼 수 있다. 이는 잡음 특성이 음성 신호의 잡음 특성에 비해 천천히 변화한다고 가정하고, 수학식 2에서 음성 신호와 잡음 신호 각각의 주파수 영역의 정보를 합하여 새로운 혼합 신호의 주파수 정보로 나타낼 수 있다.
Figure 112018008524855-pat00004
Figure 112018008524855-pat00005
또한, 비음성 신호 구간에서 추정된 잡음 스펙트럼 에너지는 오염된 혼합 신호의 잡음 성분을 제거하기 위해 사용될 수 있다. 즉, 수학식 3의 주파수 차감법 처리에 따라, 원하는 신호를
Figure 112018008524855-pat00006
라고 한다면, 혼합 신호
Figure 112018008524855-pat00007
로부터 평균 잡음 스펙트럼 에너지
Figure 112018008524855-pat00008
를 차감하는 것으로 나타낼 수 있다.
Figure 112018008524855-pat00009
또한, 앞서 설명한 개념들을 종합하여 보았을 때, 주파수 차감법은 이전 수학식에 근거한 수학식 4를 참조하여 다음과 같이 수행된다. 입력된 혼합 신호를 윈도우 창을 적용하여 FFT 취한 후, 일정한 프레임을 잡음 구간이라고 가정하여 잡음 스펙트럼 에너지 값을 계산한다. 그리고 계산된 값을 프레임 단위로 차감하여 원하는 신호의 주파수 정보를 구하고 IFFT(Inverse Fast Fourier Transform) 과정을 통해 시간 영역으로 변환 후 향상된 음성 신호를 얻는 것이다.
Figure 112018008524855-pat00010
또한, 주파수 차감법은 시간의 변화가 적은 안정적 잡음 대해서는 잡음 신호의 변화량이 작기 때문에 효과적이지만, 시간에 따른 변화가 극심한 비안정적 잡음에 대해서는 취약하다. 비음성 신호 구간에서 잔여 잡음이 남아 있으며, 음성 신호 구간에서의 잡음 제거가 정확히 수행되어지지 않는다.
본 발명의 일 실시예에 따른 잡음 제거 장치(100)는 비음성 구간에서 프레임 단위로 잡음 성분을 차감하여 지속적으로 갱신함으로써, 안정적 잡음뿐만 아니라 비안정적 잡음 제거에 대한 신호대비잡음비(이하, SNR)를 높일 수 있다.
먼저, 잡음 제거 장치(100)의 주파수 신호 변환부(110)는 잡음을 제거하여야 할 혼합 신호를 입력 받고, 입력된 혼합 신호를 주파수 영역으로 재해석하여 주파수 신호로 변환한다(S210).
그리고, 잡음 제거 장치(100)의 신호 검출부(120)는 주파수 신호로 변환된 혼합 신호로부터 음성 신호 구간과 비음성 신호 구간을 검출한다(S220). 여기서, 신호 검출부(120)는 주파수 신호 변환부(110)에 의해 변환된 주파수 신호 중 기설정된 주파수보다 낮은 저주파 대역 스펙트럼 에너지 값과 기설정된 임계값을 비교한 결과에 기초하여 음성 신호 구간과 상기 비음성 신호 구간을 검출할 수 있다. 예컨대, 신호 검출부(120)는 혼합 신호를 고정된 길이로 나누고, 해밍 창을 적용하여 FFT를 취한 후, 프레임 단위의 특정 샘플에 대한 스펙트럼 에너지를 구하여 더한다. 그리고 각 프레임 단위로 최적화된 임계치 값과 비교하여, 임계치 값을 기준으로 삼아 음성 구간을 검출하여 음성 신호 구간과 비음성 신호 구간을 판별할 수 있다.
신호 검출부(120)가 혼합 신호로부터 음성 신호 구간과 비음성 신호 구간을 판별하는 과정은 수학식 5와 같이 나타낼 수 있다.
Figure 112018008524855-pat00011
여기서,
Figure 112018008524855-pat00012
는 현재 시간
Figure 112018008524855-pat00013
에 대한 저주파 스펙트럼 에너지 값이다.
Figure 112018008524855-pat00014
는 저주파 대역에 대한 특정 FFT 크기이다.
Figure 112018008524855-pat00015
Figure 112018008524855-pat00016
는 프레임 단위의
Figure 112018008524855-pat00017
번째 샘플의 음성 신호에 대한 실수와 허수를 의미한다. 임계치(
Figure 112018008524855-pat00018
) 값에 따라 에너지 값을 비교함으로써 음성 신호 구간과 비음성 신호 구간을 구분한다. 임계치 값은 실시간으로 입력된 음성 신호에 대한 스펙트럼 에너지 값 중에서 최적의 값이 사용될 수 있다.
신호 검출부(120)는 음성 신호 구간과 비음성 신호 구간을 검출할 때에 기설정된 주파수보다 낮은 저주파 대역 에너지를 기준으로 삼아 음성 신호 구간과 상기 비음성 신호 구간을 검출할 수 있다. 도 3은 음성 신호의 예를 나타낸 그래프로서, (가)는 음성 신호의 한 프레임에 대한 스펙트럼 에너지를 나타낸 그래프이고, (나)는 본 발명의 일 실시예에서 이용하는 저주파 대역의 예를 나타낸 그래프이다. 도 3의 (나)에서 원으로 표시한 바와 같이 일반적으로 음성 신호는 저주파 대역에 분포하며 이는 전체 주파수 대역 에너지를 사용하는 대신 저주파 대역 에너지를 기준으로 음성 구간을 보다 효율적으로 검출할 수 있음을 의미한다.
음성 신호와 비음성 신호를 포함하는 혼합 신호에 대해 잡음 제거 등의 처리를 위해 시간 영역의 프레임 에너지와 FFT(Fast Fourier Transform)를 취하여 전력 에너지를 구하는 방법을 사용할 수 있다. 하지만 주파수 영역의 에너지가 시간 영역의 에너지에 비해 에너지 밀집도가 강하기 때문에 FA(False Alarm)와 FR(False Reject)의 비율이 비교적으로 낮아 음성 구간 검출의 성능이 뛰어나다는 것을 알 수 있다. 그러나 주파수 영역에서도 음성 성분이 분포하는 주요 구간이 동일하기 때문에, 전체 FFT 크기를 사용하여 음성 구간을 검출할 때에는 많은 계산량이 요구된다.
따라서, 본 발명의 일 실시예에 따른 잡음 제거 장치(100)의 신호 검출부(120)는 저주파 대역 에너지를 이용하여 음성 구간을 검출하여, 전체 주파수 대역 에너지를 이용할 때보다 계산량이 줄어들게 한다.
다음으로, 잡음 제거 장치(100)의 잡음 추정부(130)는 신호 검출부(120)에 의해 검출된 비음성 신호 구간에 대해 이전 프레임의 잡음 성분을 현재 프레임의 잡음 성분에서 차감하여 현재 프레임의 잡음 성분에 대한 스펙트럼 에너지 값을 산출해 주파수 정보를 갱신한다(S230).
그리고, 잡음 추정부(130)는 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 계산하기 위해 일정한 프레임 동안 비음성 신호 구간의 잡음 신호 에너지를 더한 후, 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 추정한다(S240). 여기서, 잡음 추정부(130)는 현재 프레임의 저주파 대역 스펙트럼 에너지 값이 기설정된 임계치 이하일 경우, 전체 대역의 이전 프레임의 잡음 성분을 현재 프레임의 잡음 성분으로부터 차감할 수 있다. 또, 잡음 추정부(130)는 기설정된 프레임의 수마다 주기적으로 평균 잡음 스펙트럼 에너지 값을 추정할 수 있다. 예컨대, 잔여 프레임이 존재하지 않을 때까지 5프레임마다 평균 잡음 스펙트럼 에너지 값을 추정할 수 있다.
잡음 추정부(130)가 비음성 신호 구간에서 이전 프레임의 스펙트럼 정보를 현재 프레임으로부터 차감하여 이를 갱신하는 과정은 수학식 6과 같다.
Figure 112018008524855-pat00019
여기서,
Figure 112018008524855-pat00020
Figure 112018008524855-pat00021
는 잡음 성분이 차감된 현재
Figure 112018008524855-pat00022
시간에 대한 프레임이며, 이는 현재 프레임의 저주파 대역 스펙트럼 에너지 값이 임계치보다 작을 경우, 전체 대역의 FFT 크기에 대한
Figure 112018008524855-pat00023
의 이전 프레임의 잡음 성분을 현재 프레임의 잡음 성분으로부터 차감한다.
수학식 5에서 얻은 현재 프레임에 대한 스펙트럼 정보를 이용하여, 잡음 추정부(130)가 비음성 신호 구간의 평균 잡음 스펙트럼 에너지를 구하는 과정은 수학식 7과 같다.
Figure 112018008524855-pat00024
여기서,
Figure 112018008524855-pat00025
은 비음성 구간에 속한 최근
Figure 112018008524855-pat00026
개의 불연속적인 프레임에 따라 더해진 스펙트럼 에너지 값을 프레임 길이에 의해 나눈 평균 잡음 스펙트럼 에너지이다.
Figure 112018008524855-pat00027
은 전체 대역의 FFT 크기를 나타낸 것이며,
Figure 112018008524855-pat00028
은 프레임의 전체 길이를 의미한다.
또, 잡음 추정부(130)는 비음성 신호 구간에서 수학식 8과 같이 잡음 신호의 스펙트럼 에너지를 계산할 수 있다.
Figure 112018008524855-pat00029
여기서,
Figure 112018008524855-pat00030
은 잡음 신호에 대한 스펙트럼 에너지 값이다.
Figure 112018008524855-pat00031
Figure 112018008524855-pat00032
는 비음성 구간에서 현재 시간
Figure 112018008524855-pat00033
에 대한 갱신된 스펙트럼 정보를 나타낸다.
다음으로, 잡음 제거 장치(100)의 필터부(140)는 비음성 신호 구간에서 현재 프레임의 잡음 성분에 대한 스펙트럼 에너지 값으로부터 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 차감한다(S250).
한편, 잡음 추정부(130)가 단계 S230 및 S240을 수행하는 과정과 필터부(140)가 단계 S250을 수행하는 과정은 혼합 신호의 잔여 프레임이 존재하지 않을 때까지 반복하여 수행한다(S260).
또, 잡음 추정부(130)는 신호 검출부(120)에 의해 검출된 음성 신호 구간에 대해서 평균 잡음 스펙트럼 에너지 값을 추정하며(S270), 필터부(140)는 음성 신호 구간에 대한 스펙트럼 에너지 값으로부터 음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 차감하여, 갱신된 혼합 신호를 생성한다(S280).
잡음 추정부(130)가 음성 신호 구간에서 오염된 음성 신호의 스펙트럼 에너지 값을 계산하는 과정은 수학식 9와 같이 나타낼 수 있다.
Figure 112018008524855-pat00034
여기서,
Figure 112018008524855-pat00035
은 현재 시간
Figure 112018008524855-pat00036
프레임의 저주파 대역 스펙트럼 에너지 값이 임계치보다 높을 경우, 전체 대역에 대한 오염된 음성 신호의 스펙트럼 에너지를 구한 값을 나타낸다.
필터부(140)가 음성 신호 구간에서 음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 차감하고, 비음성 신호 구간에서 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 차감하여 갱신된 혼합 신호를 생성하는 과정은 다음의 수학식 10과 같다.
Figure 112018008524855-pat00037
여기서,
Figure 112018008524855-pat00038
은 각 구간에서 구한 오염된 음성 신호 및 갱신된 잡음 신호에 대한 스펙트럼 에너지로부터 평균 잡음 스펙트럼 에너지를 차감하여 얻은 값이다.
다음으로, 잡음 제거 장치(100)의 시간 신호 변환부(150)는 필터부(140)에 의해 갱신 생성된 혼합 신호를 주파수 영역으로부터 시간 영역으로 변환하여 시간 영역의 혼합 신호를 획득해 출력한다(S290).
지금까지 설명한 바와 같이, 본 발명의 일 실시예에 따른 잡음 제거 장치(100)는 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 갱신해 가면서 비음성 신호 구간으로부터 갱신된 평균 잡음 스펙트럼 에너지 값을 차감하기 때문에, 음성 신호 구간뿐만 아니라 비음성 신호 구간에서도 잡음을 효과적으로 제거할 수 있다. 또, 혼합 신호로부터 저주파 대역 에너지를 기준으로 삼아 음성 신호 구간을 검출하기 때문에, 전체 대역 에너지를 기준으로 삼아 음성 신호 구간을 검출할 때보다 계산량이 줄어들게 한다.
혼합 신호로부터 저주파 대역 에너지를 기준으로 삼아 음성 신호 구간을 검출하는 것에 대한 성능은 실험을 통해 검증할 수 있다.
성능 실험에 사용한 음성 신호는 남자 5명이 실시간으로 입력한 음성신호를 사용하였으며, 실험에 사용된 단어는 “마이크 입력”, “오케이 음성” 등의 음성으로 이루어졌다. 음성 검출에 사용된 한 프레임의 샘플의 수는 320개이며, 샘플링 주파수는 16 kHz로 표본화하였다. 또한, 주파수 영역에서 FFT 크기는 512로 설정하였으며, 각 음성 신호에 대해 해밍 창을 적용하였다. 본 실험에서는 주파수 영역의 특성을 고려한 음성 검출 성능을 평가하였으며, 실시간으로 입력된 음성 신호를 전체 대역과 저주파 대역의 FFT 크기를 사용하여 음성 검출에 대한 검증을 수행하였다. 성능 평가 척도로 두 종류의 오차인 FA와 FR를 사용하였으며, 음성 신호와 비음성 신호를 판별하기 위한 임계치는 기울기가 완만한 반비례 그래프를 나타낸 값을 통계적으로 추정하였다. 또한, 음성 검출의 공정한 평가를 위해 실제 환경에서 발생하는 잡음이 결과에 영향을 미치는 것을 고려하여 실시간으로 입력된 음성 신호를 저장한 후, 스테레오 믹스 채녈 상태에서 실험하였다.
표 1은 주파수 영역의 저주파 대역과 전체 대역의 스펙트럼 에너지를 이용한 음성 검출의 FA 및 FR 결과이며, 화자 5명의 각 임계치에 대한 결과를 종합하여 나타낸 것이다.
저주파 대역 전체 대역
임계치 FR FA 임계치 FR FA
5074 9 202 33000 9 261
14203 25 63 83019 25 86
45802 30 46 133240 29 79
55000 38 38 229461 38 61
표 1과 같이 저주파 대역의 스펙트럼 에너지를 이용하여 음성 신호 구간을 검출할 때와 전체 대역 스펙트럼 에너지를 사용할 때를 비교하면, 저주파 대역의 스펙트럼 에너지를 이용하는 경우가 동일한 FR 상황일 때 더 낮은 FA 오류율을 보인다. 이는 저주파 대역 기반으로 음성을 검출하는 것이 전체 대역 기반으로 음성을 검출하는 것에 비하여 높은 음성 검출 성능을 나타낸다는 결과이다. 또한, 전체 대역의 음성 구간 검출 방법에 비해 저주파 대역 기반으로 음성을 검출하는 것이 샘플의 개수를 적게 사용하기 때문에 계산량이 적다는 것을 알 수 있다. 따라서, 동일한 주파수 영역의 음성 구간 검출 방법을 사용하더라도 저주파 대역 에너지를 이용한 방법이 전체 대역 에너지를 이용하는 방법보다 더 용이하게 음성 구간을 검출할 수 있다.
또, 본 발명의 일 실시예에 따른 잡음 제거 장치(100)의 잡음 제거 효과를 검증하기 위해 다음과 같은 실험을 수행하였으며, 음성 구간 검출은 앞서 설명한 바와 같은 저주파 대역 에너지를 이용한 방법을 활용하였다. 잡음 제거의 평가를 위해 오프라인 테스트로 진행하였으며, 음성 신호 파형과 스펙트로그램 기반으로 비교하였다. 음성 신호 구간과 비음성 신호 구간을 판별하기 위한 임계치 값은 통계적으로 추정하였다. 사용한 음성 신호는 0dB, 5dB, 10dB, 15dB의 SNR에 해당되는 차량 소음에 의해 오염된 음성 신호를 사용하였으며, 한 프레임에 사용된 샘플의 수는 320개이며, 샘플링 주파수는 16 kHz로 표본화하였다. 본 실험에서는 주파수 차감법과 본 발명의 일 실시예에 따른 잡음 제거 방법에 의한 잡음 제거 성능을 평가하였으며, 비음성 구간에서 이전 프레임으로부터 구한 잡음 성분을 현재 프레임에서 차감하여 지속적으로 신호를 갱신하는 것에 대한 검증을 수행하였다.
도 4 내지 도 7은 0dB, 5dB, 10dB, 15dB에 따른 주파수 차감법과 본 발명의 일 실시예에 따른 잡음 제거 방법의 잡음 제거 결과를 나타낸 것이다. 맨 위의 그래프는 잡음 제거 전의 오염된 혼합 신호(contaminated signal)이며, 중간의 그래프는 오염된 혼합 신호로부터 주파수 차감법을 이용하여 잡음을 제거한 경우(conventional spectral subtraction)이고, 맨 아래의 그래프는 오염된 혼합 신호로부터 본 발명의 일 실시예에 따라 잡음을 제거한 경우(proposed spectral subtraction)이다.
도 4에 나타낸 바와 같이, 0dB의 오염된 음성 신호의 경우, 잡음이 신호에 비해 상당히 크다. 주파수 차감법에 본 발명의 일 실시예에 따른 잡음 제거 방법이 상대적으로 잡음 성분이 줄었다는 것이 음성 신호 파형으로 나타나며, 스펙트로그램 상에서도 잡음 색깔이 짙음으로써 성능 차이를 눈으로 확인할 수 있다.
도 5에 나타낸 바와 같이, 5dB의 오염된 음성 신호는 0dB에 비해 잡음 비율이 상대적으로 낮다. 주파수 차감법과 본 발명의 일 실시예에 따른 잡음 제거 방법을 비교했을 때 비음성 구간에서의 잡음 제거 성능이 상당히 줄어들었음을 알 수 있다. 또한, 스펙트로그램 상에서도 음성 구간과 비음성 구간에 대한 큰 차이를 보였다.
도 6은 10dB의 오염된 음성 신호를 대상으로 잡음을 제거한 결과이고, 도 7은 15dB의 오염된 음성 신호를 대상으로 잡음을 제거한 결과이다. 도 4 및 도 5에 비하여 잡음 비율이 상당히 낮음에도 불구하고 본 발명의 일 실시예에 따른 잡음 제거 방법이 주파수 차감법에 비해 잡음 제거 성능이 향상되었다는 것을 알 수 있다.
도 4 내지 도 6을 통해 알 수 있는 바와 같이, 각 dB에 따른 오염된 음성 신호에 대한 잡음 제거 성능을 비교할 때에, 주파수 차감법보다 본 발명의 일 실시예에 따른 잡음 제거 방법의 잡음 제거 성능이 상당히 향상되었음을 알 수 있다. 특히, 본 발명의 일 실시예에 따른 잡음 제거 방법은 음압 레벨이 낮을수록 잡음 제거 정도가 전체적으로 향상된다.
본 발명에 첨부된 블록도의 각 블록과 흐름도의 각 단계의 조합들은 컴퓨터 프로그램 인스트럭션들에 의해 수행될 수도 있다. 이들 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수용 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서에 탑재될 수 있으므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서를 통해 수행되는 그 인스트럭션들이 블록도의 각 블록 또는 흐름도의 각 단계에서 설명된 기능들을 수행하는 수단을 생성하게 된다. 이들 컴퓨터 프로그램 인스트럭션들은 특정 방식으로 기능을 구현하기 위해 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 지향할 수 있는 컴퓨터 이용 가능 또는 컴퓨터 판독 가능 기록매체에 저장되는 것도 가능하므로, 그 컴퓨터 이용가능 또는 컴퓨터 판독 가능 기록매체에 저장된 인스트럭션들은 블록도의 각 블록 또는 흐름도 각 단계에서 설명된 기능을 수행하는 인스트럭션 수단을 내포하는 제조 품목을 생산하는 것도 가능하다. 컴퓨터 프로그램 인스트럭션들은 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에 탑재되는 것도 가능하므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에서 일련의 동작 단계들이 수행되어 컴퓨터로 실행되는 프로세스를 생성해서 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 수행하는 인스트럭션들은 블록도의 각 블록 및 흐름도의 각 단계에서 설명된 기능들을 실행하기 위한 단계들을 제공하는 것도 가능하다.
또한, 각 블록 또는 각 단계는 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 실시예들에서는 블록들 또는 단계들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들 또는 단계들은 사실 실질적으로 동시에 수행되는 것도 가능하고 또는 그 블록들 또는 단계들이 때때로 해당하는 기능에 따라 역순으로 수행되는 것도 가능하다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
100 : 잡음 제거 장치 110 : 주파수 신호 변환부
120 : 신호 검출부 130 : 잡음 추정부
140 : 필터부 150 : 시간 신호 변환부

Claims (11)

  1. 혼합 신호로부터 음성 신호 구간과 비음성 신호 구간을 검출하는 신호 검출부와,
    상기 비음성 신호 구간에 대해 이전 프레임의 잡음 성분을 현재 프레임의 잡음 성분에서 차감하여 상기 현재 프레임의 잡음 성분에 대한 스펙트럼 에너지 값을 산출하고, 상기 음성 신호 구간의 평균 잡음 스펙트럼 에너지 값과 상기 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 각각 추정하는 잡음 추정부와,
    상기 음성 신호 구간에 대한 스펙트럼 에너지 값으로부터 상기 음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 차감하고, 상기 비음성 신호 구간에서 상기 현재 프레임의 잡음 성분에 대한 스펙트럼 에너지 값으로부터 상기 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 차감하여 갱신된 혼합 신호를 생성하는 필터부를 포함하는
    잡음 제거 장치.
  2. 제 1 항에 있어서,
    상기 혼합 신호를 주파수 영역으로 재해석하여 주파수 신호로 변환하는 주파수 신호 변환부를 더 포함하며,
    상기 신호 검출부는, 상기 주파수 신호 변환부에 의해 변환된 주파수 신호 중 기설정된 주파수보다 낮은 저주파 대역 스펙트럼 에너지 값과 기설정된 임계값을 비교한 결과에 기초하여 상기 음성 신호 구간과 상기 비음성 신호 구간을 검출하는
    잡음 제거 장치.
  3. 제 2 항에 있어서,
    상기 갱신된 혼합 신호를 주파수 영역으로부터 시간 영역으로 변환하여 시간 영역 신호를 획득하는 시간 신호 변환부를 더 포함하는
    잡음 제거 장치.
  4. 제 2 항에 있어서,
    상기 잡음 추정부는, 현재 프레임의 상기 저주파 대역 스펙트럼 에너지 값이 기설정된 임계치 이하일 경우, 전체 대역의 이전 프레임의 잡음 성분을 현재 프레임의 잡음 성분으로부터 차감하는
    잡음 제거 장치.
  5. 제 1 항에 있어서,
    상기 잡음 추정부는, 기설정된 프레임의 수마다 주기적으로 상기 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 추정하는
    잡음 제거 장치.
  6. 잡음 제거 장치가 수행하는 잡음 제거 방법으로서,
    혼합 신호로부터 음성 신호 구간과 비음성 신호 구간을 검출하는 단계와,
    상기 비음성 신호 구간에 대해 이전 프레임의 잡음 성분을 현재 프레임의 잡음 성분에서 차감하여 상기 현재 프레임의 잡음 성분에 대한 스펙트럼 에너지 값을 산출하는 단계와,
    상기 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 추정한 후, 상기 비음성 신호 구간에서 상기 현재 프레임의 잡음 성분에 대한 스펙트럼 에너지 값으로부터 상기 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 차감하는 단계와,
    상기 음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 추정한 후, 상기 음성 신호 구간에 대한 스펙트럼 에너지 값으로부터 상기 음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 차감하고, 상기 비음성 신호 구간에서 상기 현재 프레임의 잡음 성분에 대한 스펙트럼 에너지 값으로부터 상기 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 차감하여 갱신된 혼합 신호를 생성하는 단계를 포함하는
    잡음 제거 방법.
  7. 제 6 항에 있어서,
    상기 혼합 신호를 주파수 영역으로 재해석하여 주파수 신호로 변환하는 단계를 더 포함하며,
    상기 변환된 주파수 신호 중 기설정된 주파수보다 낮은 저주파 대역 스펙트럼 에너지 값과 기설정된 임계값을 비교한 결과에 기초하여 상기 음성 신호 구간과 상기 비음성 신호 구간을 검출하는
    잡음 제거 방법.
  8. 제 7 항에 있어서,
    상기 갱신된 혼합 신호를 주파수 영역으로부터 시간 영역으로 변환해 시간 영역 신호를 획득하는 단계를 더 포함하는
    잡음 제거 방법.
  9. 제 7 항에 있어서,
    상기 평균 잡음 스펙트럼 에너지 값을 추정하는 단계에서, 현재 프레임의 상기 저주파 대역 스펙트럼 에너지 값이 기설정된 임계치 이하일 경우, 전체 대역의 이전 프레임의 잡음 성분을 현재 프레임의 잡음 성분으로부터 차감하는
    잡음 제거 방법.
  10. 제 6 항에 있어서,
    상기 평균 잡음 스펙트럼 에너지 값을 추정하는 단계에서, 기설정된 프레임의 수마다 주기적으로 상기 비음성 신호 구간의 평균 잡음 스펙트럼 에너지 값을 추정하는
    잡음 제거 방법.
  11. 제 6 항 내지 제 10 항 중 어느 한 항의 잡음 제거 방법을 프로세서가 수행하도록 하는
    컴퓨터 프로그램이 저장된 컴퓨터 판독 가능한 기록매체.
KR1020180008938A 2018-01-24 2018-01-24 잡음 제거 장치 및 방법 KR101993003B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180008938A KR101993003B1 (ko) 2018-01-24 2018-01-24 잡음 제거 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180008938A KR101993003B1 (ko) 2018-01-24 2018-01-24 잡음 제거 장치 및 방법

Publications (1)

Publication Number Publication Date
KR101993003B1 true KR101993003B1 (ko) 2019-06-26

Family

ID=67105016

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180008938A KR101993003B1 (ko) 2018-01-24 2018-01-24 잡음 제거 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101993003B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110580917A (zh) * 2019-09-16 2019-12-17 数据堂(北京)科技股份有限公司 一种语音数据质量检测方法、装置、服务器及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000002024A (ko) * 1998-06-16 2000-01-15 윤종용 잡음 제거 방법
KR20090082700A (ko) * 2008-01-28 2009-07-31 한양대학교 산학협력단 노이지 음성 신호의 처리 장치 및 그 장치를 포함하는 음성기반 어플리케이션 장치
KR20110036175A (ko) 2009-10-01 2011-04-07 삼성전자주식회사 멀티밴드를 이용한 잡음 제거 장치 및 방법
KR20130024156A (ko) * 2011-08-30 2013-03-08 광주과학기술원 잡음 제거 장치 및 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000002024A (ko) * 1998-06-16 2000-01-15 윤종용 잡음 제거 방법
KR20090082700A (ko) * 2008-01-28 2009-07-31 한양대학교 산학협력단 노이지 음성 신호의 처리 장치 및 그 장치를 포함하는 음성기반 어플리케이션 장치
KR20110036175A (ko) 2009-10-01 2011-04-07 삼성전자주식회사 멀티밴드를 이용한 잡음 제거 장치 및 방법
KR20130024156A (ko) * 2011-08-30 2013-03-08 광주과학기술원 잡음 제거 장치 및 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110580917A (zh) * 2019-09-16 2019-12-17 数据堂(北京)科技股份有限公司 一种语音数据质量检测方法、装置、服务器及存储介质

Similar Documents

Publication Publication Date Title
EP2056296B1 (en) Dynamic noise reduction
Abramson et al. Simultaneous detection and estimation approach for speech enhancement
KR20090012154A (ko) 통합적 순음 감소 방식의 노이즈 감소 방법
KR20010075343A (ko) 저비트율 스피치 코더용 노이즈 억제 방법 및 그 장치
Shao et al. A generalized time–frequency subtraction method for robust speech enhancement based on wavelet filter banks modeling of human auditory system
Verteletskaya et al. Noise reduction based on modified spectral subtraction method
Udrea et al. An improved spectral subtraction method for speech enhancement using a perceptual weighting filter
Upadhyay et al. An improved multi-band spectral subtraction algorithm for enhancing speech in various noise environments
Naik et al. Modified magnitude spectral subtraction methods for speech enhancement
KR101993003B1 (ko) 잡음 제거 장치 및 방법
KR20200095370A (ko) 음성 신호에서의 마찰음의 검출
Upadhyay et al. The spectral subtractive-type algorithms for enhancing speech in noisy environments
Thiagarajan et al. Pitch-based voice activity detection for feedback cancellation and noise reduction in hearing aids
Oukherfellah et al. FPGA implementation of voice activity detector for efficient speech enhancement
Sanam et al. A combination of semisoft and μ-law thresholding functions for enhancing noisy speech in wavelet packet domain
Upadhyay An improved multi-band speech enhancement utilizing masking properties of human hearing system
Udrea et al. Reduction of background noise from affected speech using a spectral subtraction algorithm based on masking properties of the human ear
Liu et al. An improved spectral subtraction method
Hendriks et al. Speech reinforcement in noisy reverberant conditions under an approximation of the short-time SII
Ma et al. A perceptual kalman filtering-based approach for speech enhancement
Aicha et al. Reduction of musical residual noise using perceptual tools with classic speech denoising techniques
Verteletskaya et al. Enhanced spectral subtraction method for noise reduction with minimal speech distortion
Upadhyay et al. An auditory perception based improved multi-band spectral subtraction algorithm for enhancement of speech degraded by non-stationary noises
Verteletskaya et al. Speech distortion minimized noise reduction algorithm
Qu et al. A modified a priori SNR estimation for spectral subtraction speech enhancement

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant