KR20100045935A - 잡음 억제 장치 및 잡음 억제 방법 - Google Patents

잡음 억제 장치 및 잡음 억제 방법 Download PDF

Info

Publication number
KR20100045935A
KR20100045935A KR1020090101105A KR20090101105A KR20100045935A KR 20100045935 A KR20100045935 A KR 20100045935A KR 1020090101105 A KR1020090101105 A KR 1020090101105A KR 20090101105 A KR20090101105 A KR 20090101105A KR 20100045935 A KR20100045935 A KR 20100045935A
Authority
KR
South Korea
Prior art keywords
noise
estimate
audio
spectral estimate
input signal
Prior art date
Application number
KR1020090101105A
Other languages
English (en)
Inventor
엔카이 리우
Original Assignee
야마하 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 야마하 가부시키가이샤 filed Critical 야마하 가부시키가이샤
Publication of KR20100045935A publication Critical patent/KR20100045935A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Noise Elimination (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)
  • Control Of Amplification And Gain Control (AREA)

Abstract

잡음 억제 장치에서, 오디오 검출부는 입력 신호 내의 오디오의 유무를 검출한다. 제1 잡음 스펙트럼 추정부는 입력 신호와 오디오 검출부의 검출 결과에 기초하여 입력 신호에 포함된 잡음 스펙트럼을 추정한다. 제2 잡음 스펙트럼 추정부는 오디오 검출부의 검출 결과에 관계없이 입력 신호에 기초하여 잡음 스펙트럼을 추정한다. 오디오 검출부가 오디오를 계속적으로 검출하는 검출 시간의 길이에 따르고, 제1 및 제2 잡음 스펙트럼 추정부에 의한 추정 결과로서 획득된 제1 및 제2 잡음 스펙트럼 추정값에 기초하여 최종 잡음 스펙트럼 추정값을 연산한다. 이득 연산부는 최종 잡음 스펙트럼 추정값에 기초하여 잡음 억제 이득을 연산한다. 잡음 억제부는 잡음 억제 이득을 입력 신호에 적용함으로써 입력 신호에 포함된 잡음을 억제한다.
잡음 억제 장치, 오디오 검출부, 잡음 스펙트럼 추정값, 잡음 억제 이득

Description

잡음 억제 장치 및 잡음 억제 방법{NOISE SUPPRESSION DEVICE AND NOISE SUPPRESSION METHOD}
본 발명은 잡음 억제 장치 및 잡음 억제 방법에 관한 것이다.
입력 입력 신호에 따라 스피커 등과 같은 부하를 구동하는 오디오 재생 장치, 원격지간 음성 통신에 사용되는 음성 통신 장치, 및 음성의 유형 등을 식별하고 인식함으로써 음성의 의미를 판정하는 음성 인식 장치를 포함하는 다양한 오디오 장치가 개발되었다. 이들 장치들 각각이 오디오를 정확하게 재생하고, 전달하고, 또는 인식할 수 있게 하기 위해, 오디오에 포함되는 잡음의 영향을 제거하는 것이 바람직하다.
이러한 잡음 억제 기술의 예들은, 이하의 특허 문헌 1 및 2와, 비특허 문헌 1 및 2에 개시된 사항을 포함한다.
[특허 문헌 1] 일본 특허 공개공보 제2006-126859호
[특허 문헌 2] 미국 특허 제5572621호
[비특허 문헌1] Boll, S., "Suppression of acoustic noise in speech using spectral subtraction", IEEE Trans. Vol. ASSP-27, No.2, pp. 113-120, 1979.
[비특허 문헌2] Doblinger G., "Computationally efficient speech enhancement by spectral minima tracking in subbands", Proc. of Eurospeech EUROSPEECH'95, pp. 1513-1516.
이들 문헌에 개시된 기술은, 적절한 기술을 이용하여 입력 신호의 주파수 영역의 진폭 스펙트럼의 레벨에서 빼는 것(subtraction)에 의해 잡음이 억제되는 소위 소위 스펙트럴 서브트랙션 방법(spectral subtraction method)에 관한 것이다. 이러한 기술들은 모두 일정한 잡음 억제 효과를 달성한다.
그러나, 이들의 문헌은 미개시되거나 미해결된 문제점들을 갖는다.
예를 들어, 스펙트럴 서브트랙션 방법은, 입력 신호에 포함되는 잡음 스펙트럼이 추정되고, 이 잡음 스펙트럼 추정값이 진폭 스펙트럼으로부터 빼지는 구성에 기초한다. 이 경우, 잡음 스펙트럼 추정값의 정확성을 확보하는 것이 곤란하다고 하는 문제가 있다. 즉, 잡음 스펙트럼 추정값은 단지 추정값이므로, 반드시 실제 잡음 스펙트럼을 반영하지는 않는다. 그 결과, 더 많은 억제가 수행되어야 할 위치에서 억제가 불충분하게 수행될 수 있거나, 반대로 억제가 수행되지 않아야 할 위치에서 억제가 과도하게 수행될 수 있다. 따라서, 스펙트럴 억제 방법은, 정확한 잡음 억제를 달성할 수 없는 문제점을 갖는다.
특허 문헌 1은, 입력 신호에 오디오가 포함되어 있는지 여부를 검출하고, 오디오를 포함하지 않는 구간의 평균 스펙트럼을 잡음 스펙트럼으로서 추정하는 방법을 제안한다. 특허 문헌 2 및 비특허 문헌 2는, 오디오 검출을 수행하지 않고, 입력 신호로부터 직접적으로 잡음 스펙트럼이 추정되는 방법을 제안한다.
그러나, 기본적으로, 상술한 모든 문헌에서 잡음 스펙트럼은 여전히 단지 " 추정"이므로, 어떠한 문헌도 상술한 문제점을 확실하게 극복하기 위한 수단을 제공하지 않는다.
또한, 상술한 각 문헌은 개별적으로 이하의 문제점을 갖는다. 첫번째로, 특허 문헌 2에서는, 유한한 시간창(time window) 내에서 입력 신호의 스펙트럼을 평활화(smoothing)함으로써 획득되는 값들 중 최소값이 발견되고, 발견된 최소값이 잡음 스펙트럼으로서 사용된다. 하지만, 이러한 방법은, 스펙트럼을 저장하기 위한 저장 용량이 비교적 커지고, 또한 최소값을 획득하기 위한 연산량도 커지는 문제점을 갖는다.
특허 문헌 2에서는, 잡음 스펙트럼이 최소값을 사용해서 추정되므로, 입력 신호가 잡음만을 포함하는 경우에, 잡음 스펙트럼값을 과소 평가하는 경향이 있다. 동일한 이유로, 입력 신호가 오디오 신호를 포함하는 경우에, 최소값이 사용된다고 할지라도 잡음 스펙트럼값을 과대 평가하는 경향이 있다. 전자의 경우에, 작게 억제된 잡음이 출력되고, 후자의 경우에는, 잡음 스펙트럼의 과도한 서브트랙션으로 인해 음질 열화의 문제점이 있다. 비특허 문헌 2도 이러한 문제점을 갖는다.
특허 문헌 1은, 잡음의 레벨이 급변할 경우에 잘 대응하는 것이 반드시 가능하지는 않은 문제점을 갖는다. 즉, 특허 문헌 1에서는, 입력 신호의 레벨이 급변한 경우에, 그 신호가 오디오를 포함하고 있는 것으로 가정하고 잡음 스펙트럼 추정값이 갱신되지 않는다. 그러나, 급변된 레벨이 오디오(즉, 신호)와 연관되지 않고, 잡음과 연관되는 경우에는 문제가 있다. 이 상황이 계속되면, 잡음 스펙트럼 추정값도 갱신되지 않아서, 급변된 레벨을 갖는 잡음이 유지되고 재생되는 문제점을 유발한다.
본 발명의 목적은 상술한 문제점들 중 적어도 하나를 극복할 수 있는 잡음 억제 장치 및 잡음 억제 방법을 제공하는 것이다.
상술한 본 발명의 목적을 달성하기 위하여, 본 발명에 따른 잡음 억제 장치는 입력 신호 내에서 오디오의 유무를 검출하는 오디오 검출 수단, 상기 입력 신호 및 상기 오디오 검출 수단의 검출 결과에 기초하여, 상기 입력 신호에 포함된 잡음 스펙트럼을 추정하여, 제1 잡음 스펙트럼 추정값을 획득하는 제1 잡음 스펙트럼 추정 수단, 상기 오디오 검출 수단의 검출 결과에 관계없이, 상기 입력 신호에 기초하여 잡음 스펙트럼을 추정하여, 제2 잡음 스펙트럼 추정값을 획득하는 제2 잡음 스펙트럼 추정 수단, 상기 오디오 검출 수단이 상기 오디오를 계속적으로 검출하는 동안의 검출 시간의 길이에 따르고, 상기 제1 잡음 스펙트럼 추정 수단 및 상기 제2 잡음 스펙트럼 추정 수단에 의한 추정 결과로서 획득되는 상기 제1 잡음 스펙트럼 추정값 및 상기 제2 잡음 스펙트럼 추정값에 기초하여 최종 잡음 스펙트럼 추정값을 연산하는 잡음 스펙트럼 연산 수단, 상기 최종 잡음 스펙트럼 추정값에 기초하여, 잡음 억제 이득을 연산하는 이득 연산 수단, 및 상기 입력 신호에 상기 잡음 억제 이득을 적용함으로써, 상기 입력 신호에 포함된 잡음을 억제하는 잡음 억제 수단을 포함한다.
본 발명에 따르면, 제1 및 제2 잡음 스펙트럼 추정 수단은, 오디오 검출 수단의 검출 결과에 기초하여 제1 잡음 스펙트럼 추정값을 획득하고, 검출 결과에 연관되지 않는 제2 잡음 스펙트럼 추정값을 획득한다. 제1 잡음 스펙트럼 추정값은, 오디오 검출에 기초한 추정값이므로 높은 신뢰성을 갖고, 오디오 신호의 유무에 따라 사용되어야 할 잡음 스펙트럼이 선택될 수 있으므로(따라서, 잡음 억제 처리 모드가 선택될 수 있으므로) 잡음 억제 효과의 관점에서 더욱 효과적일 가능성이 높다. 한편, 제2 잡음 스펙트럼 추정값이 최소 잡음 억제 효과를 갖는다고 할지라도, 입력 신호에만 기초하여 추정될 수 있으므로, 입력 신호의 레벨의 변화에 매우 근접하게, 그리고 신속하게 추종할 가능성이 크다.
제1 잡음 스펙트럼 추정값만을 사용하는 경우에는, 상술한 바와 같이 잡음의 레벨이 급격하게 증가한 경우에는 잡음을 효과적으로 억제하는 것이 곤란하고, 제2 잡음 스펙트럼 추정값만을 사용하는 경우에는, 잡음 스펙트럼이 과소 평가되거나 과대 평가될 수 있다.
그러나, 본 발명에 있어서는, 잡음 스펙트럼 연산 수단이, 오디오가 계속적으로 검출되는 동안의 검출 시간의 길이에 따라 최종 잡음 스펙트럼 추정값을 연산한다.
여기에서, 이 "검출 시간의 길이"라는 용어는, 오디오가 계속적으로 검출되는 동안의 구간을 말한다. 그러나, 사람들이 말을 할 때에는 실제로 호흡을 할 필요가 있으므로, 입력 신호에 포함된 오디오 신호의 구간이 매우 길 가능성이 상당 히 낮다는 사실을 고려하면, "오디오"가 검출되는 동안의 시간이 "잡음"만이 존재하는 동안의 시간을 포함할 가능성이 있다. 즉, "오디오"의 검출은 단지 "잡음 레벨의 상승"의 검출일 가능성이 있다. 오히려, 이러한 가능성은 "검출 시간의 길이"가 증가함에 따라 증가할 것으로 추정된다.
본 발명은, 이러한 경우에 적절하게 대응한다. 즉, 상술한 바와 같이 "검출 시간의 길이"에 따라 "최종 잡음 스펙트럼 추정값"을 연산함으로써, 본 발명은 이러한 경우에 대응한다. 예를 들어, 검출 시간의 길이가 매우 긴 경우에는, "오디오" 검출의 시간이 계속된다고 할지라도 입력 신호는 잡음 신호만일 가능성이 있으므로, 최종 잡음 스펙트럼 추정값은 제2 잡음 스펙트럼 추정값의 영향을 증가시킴으로써 연산되어, 잡음을 효과적으로 억제한다.
어떤 경우에든, 본 발명에 따르면, "검출 시간의 길이"에 따른 제1 및 제2 잡음 스펙트럼 추정값의, 단순한 사용 양식을 포함하는 각종 사용 형태 중 하나를 선택할 수 있으므로, 어떤 경우에는, 제1 잡음 스펙트럼 추정값에 연관되는 상술한 이점들이 획득되고(또는, 그 결점을 억제하고), 어떤 경우에는, 제2 잡음 스펙트럼 추정값에 연관되는 상술한 이점이 획득되게 하는(또는, 그 결점을 억제하게 하는) 고려에 기초하여 최종 잡음 추정값을 연산할 수 있다.
본 발명에 따른 잡음 억제 장치에서, 잡음 스펙트럼 연산 수단은, 제1 및 제2 잡음 스펙트럼 추정값에 승산되는, 검출 시간의 길이에 따라 변하는 값을 갖는 가중 계수를 연산하는 계수 연산부를 포함할 수 있고, 잡음 스펙트럼 연산 수단은, 가중 계수를 사용하여 제1 및 제2 잡음 스펙트럼 추정값의 가중 평균을 연산함으로 써 최종 잡음 스펙트럼 추정값을 연산할 수 있다.
본 양태에서, 최종 잡음 스펙트럼 추정값의 연산은 적절하게 수행된다.
구체적으로, 오디오가 계속적으로 검출되는 동안의 검출 시간의 길이에 따른 "가중 계수"를 사용하여 "가중 평균"이 획득되므로, 상술한 본 발명의 유리한 점, 즉 제1 및 제2 잡음 스펙트럼 추정값의 이점이 획득되고 결점이 억제되는 유리한 점이 "중첩적인" 방식으로 획득될 수 있다. 정성적으로 말하면, "중첩적인 방식"이라는 용어는, 제1 및 제2 잡음 스펙트럼 추정값들의 이점을 반 정도씩 획득하기 위해서, 제1 및 제2 잡음 스펙트럼 추정값 모두에 의해 영향을 받는 최종 잡음 스펙트럼 추정값이 연산된다는 것을 나타낸다. 동일한 사항이 이하의 설명에 대해 유효하다.
본 발명에 따른 잡음 억제 장치에서, 잡음 스펙트럼 연산 수단은, 검출 시간의 길이에 따라서 동작하고, 제1 잡음 스펙트럼 추정값을 초기값으로서 사용하고, 제2 잡음 스펙트럼 추정값을 수신할 시에 발동되는 적분기를 포함할 수 있다.
본 양태에 따르면, 최종 잡음 스펙트럼 추정값의 연산이 적절하게 수행된다.
구체적으로, 본 양태에서는, 적분기가 포함되므로, 예를 들어, 검출 시간의 길이에 따라 제1 잡음 스펙트럼 추정값으로부터 제2 잡음 스펙트럼 추정값으로의 연속적인 추이(transition)를 구현할 수 있다. 또한, 본 양태는 이러한 중첩적인 방식으로 상술한 본 발명의 유리한 점을 달성한다.
본 발명에 따른 잡음 억제 장치에서, 잡음 스펙트럼 연산 수단은 검출 시간의 길이가 제1 소정값 이하인 경우에는 제1 잡음 스펙트럼 추정값을 그대로 최종 잡음 스펙트럼 추정값으로서 연산할 수 있고, 검출 시간의 길이가 제2 소정값 이상인 경우에는 제2 잡음 스펙트럼 추정값을 그대로 최종 잡음 스펙트럼 추정값으로서 연산할 수 있고, 검출 시간의 길이가 제1 소정값보다 크고 제2 소정값보다 작은 경우에는 제1 및 제2 잡음 스펙트럼 추정값 간의 중간 잡음 스펙트럼 추정값을 최종 잡음 스펙트럼 추정값으로서 연산할 수 있다.
본 양태에 따르면, 최종 잡음 스펙트럼 추정값의 연산이 적절하게 수행된다.
구체적으로, 본 양태에서는, 검출 시간의 길이와 각 소정값 간의 크기 관계에 따라, 최종 잡음 스펙트럼 추정값이 연산되므로, 예를 들어, 상술한 바와 같이 "오디오"가 잘못 검출되는 경우에 적절하게 대응할 수 있다.
또한, 본 양태에서 사용되는 "중간 잡음 스펙트럼 추정값"의 개념은, 하나의 값만을 취할 수 있는 상수 뿐만 아니라, 후술할 바와 같이 연속적인 값들을 갖는 수들의 집합을 나타내고, 어떤 경우에는, 단계적인 값들을 갖는 수들의 집합을 나타낼 수도 있다. 엄격히 말하자면, "중간"이라는 용어도 제1 및 제2 잡음 스펙트럼 추정값을 연결하는 선분 상에 있고, 제1 및 제2 잡음 스펙트럼 추정값으로부터 등거리에 있는 중점(middle point)을 말하는 것은 아니다.
본 발명에 따른 잡음 억제 장치에서, 중간 잡음 스펙트럼 추정값은, 제1 및 제2 잡음 스펙트럼 추정값 간에 전이하도록 검출 시간의 길이에 따라 변하는 값을 가질 수 있다.
본 양태에 따르면, 중간 잡음 스펙트럼 추정값은 적절하게 특징지워진다. 그러나, 이 경우에, "중간 잡음 스펙트럼 추정값"은, 상술한 바와 같이, "검출 시 간의 길이"가 제1 소정값보다 크고 제2 소정값보다 작은 경우에 사용되는 값으로서 규정되므로, 본 양태에서는, 중간 잡음 스펙트럼 추정값이 검출 시간의 길이에 따라 변하는 값을 갖는 경우에 있어서의 "검출 시간의 길이"의 하한은 제1 소정값이고, 상한은 제2 소정값이다.
따라서, 본 양태의 "중간 잡음 스펙트럼 추정값"은, 검출 시간의 길이가 제1 소정값 이하인 경우에 적용되는 제1 잡음 스펙트럼 추정값과 검출 시간의 길이가 제2 소정값 이상인 경우에 적용되는 제2 잡음 스펙트럼 추정값 사이에서 연속적으로 변하는 값(또는, 값들의 그룹)이 되도록 상정된다. 이러한 "중간 잡음 스펙트럼 추정값"은 제1 및 제2 잡음 스펙트럼 추정값의 특성들을 적절하게 결합하는 값으로 고려될 수 있다.
따라서, 또한 본 양태는 이러한 중첩적인 방식으로 상술한 바와 같은 본 발명의 유리한 점들을 달성한다.
본 발명에 다른 잡음 억제 장치에서, 오디오 검출 수단은 입력 신호 내의 소정의 주파수 대역에 속하는 부분에 대한 입력 신호 내의 오디오 유무를 검출할 수 있다.
본 양태에 따르면, 본 양태에서 언급된 "주파수 대역"이 예를 들어, 오디오를 포함하도록 강하게 예측되는 주파수 밴드를 포함할 수도 있으므로, 오디오 검출 등과 연관된 연산의 속도를 향상시킬 수 있거나, 오디오 검출을 보다 정확하게 수행할 수 있다.
본 발명의 상술한 목적을 달성하기 위하여, 본 발명에 따른 잡음 억제 방법 은 입력 신호 내의 오디오의 유무를 검출하기 위한 오디오 검출 공정과, 오디오 검출 공정의 검출 결과 및 입력 신호에 기초하여 입력 신호에 포함되는 잡음 스펙트럼을 추정하여, 제1 잡음 스펙트럼 추정값을 획득하기 위한 제1 잡음 스펙트럼 추정 공정과, 오디오 검출 공정의 검출 결과에 관계없이, 입력 신호에 기초하여 잡음 스펙트럼을 추정하여 제2 잡음 스펙트럼 추정값을 획득하기 위한 제2 잡음 스펙트럼 추정 공정과, 오디오 검출 공정에서 오디오가 계속적으로 검출되는 동안의 검출 시간의 길이에 따르고, 제1 및 제2 잡음 스펙트럼 추정 공정에서의 추정 결과로서 획득되는 제1 및 제2 잡음 스펙트럼 추정값에 기초하여 최종 잡음 스펙트럼 추정값을 연산하기 위한 잡음 스펙트럼 연산 공정과, 최종 잡음 스펙트럼 추정값에 기초하여 잡음 억제 이득을 연산하기 위한 이득 연산 공정과, 잡음 억제 이득을 입력 신호에 적용함으로써 입력 신호에 포함된 잡음을 억제하기 위한 잡음 억제 공정을 포함한다.
본 발명은, 본 발명에 따른 잡음 억제 장치와 연관되어 상술한 유리한 점과 본질적으로 상이하지 않은 유리한 점들을 달성할 수 있다는 것은 명백하다.
본 발명에 따른 잡음 억제 방법에서, 잡음 스펙트럼 연산 공정은, 제1 및 제2 잡음 스펙트럼 추정값에 승산되는, 검출 시간의 길이에 따라 변하는 값을 갖는 가중 계수를 연산하기 위한 계수 공정을 포함할 수 있고, 잡음 스펙트럼 연산 공정은, 가중 계수를 사용하여 제1 및 제2 잡음 스펙트럼 추정값의 가중 평균을 연산함으로써 최종 잡음 스펙트럼 추정값을 연산할 수 있다.
본 발명에 따르면, 잡음 억제 장치 및 방법을 제공하여, 입력 신호 내의 잡음이 매우 적절하게 억제될 수 있는 효과를 달성할 수 있다.
<발명을 실시하기 위한 최선의 형태>
본 발명의 보다 상세한 양태들 및 그 유리한 점들은 실시예들에 대한 이하의 설명으로부터 명백해질 것이다.
<제1 실시예>
이하, 본 발명의 제1 실시예를 도 1 및 도 2를 참조하여 설명한다. 도 1 및 도 2를 포함하여 이하 참조되는 각 도면 내의 몇몇 부분들의 치수의 비율은, 예를 들어 도 4의 그래프에서 실제 비율로부터 적절하게 변경될 수 있다.
도 1에 도시된 바와 같이, 잡음 억제 장치(1)는, 시간 대 주파수 변환부(10), 스펙트럼 연산부(15), 제1 잡음 스펙트럼 추정부(21), 제2 잡음 스펙트럼 추정부(23), 가중 평균부(30), 잡음 억제 이득 연산부(60) 및 주파수 대 시간 변환부(70), 오디오 검출부(80), 카운터부(85) 및 가중 계수 연산부(90)를 포함한다.
시간 대 주파수 변환부(10)는, 시간 영역의 입력 신호에 푸리에 변환(Fourier transformation)을 수행하여, 입력 신호를 주파수 영역 신호로 변환한다. 이 푸리에 변환은, 입력 신호를 경시적으로(temporally) 소정수의 프레임으로 나누고 그 프레임 각각에 적당한 창(window)을 승산함으로써 수행되는 것이 바람직하다.
스펙트럼 연산부(15)는, 주파수 영역 신호가 나누어지는 진폭 스펙트럼, 위 상 스펙트럼, 및 파워 스펙트럼을 연산한다. 제1 실시예에서는, 특히, 이하의 식(1)에 기초하여, 파워 스펙트럼이 연산된다.
여기에서, P(n)은 입력 신호의 파워 스펙트럼이고, Yr(n)은 입력 신호의 푸리에 변환을 통해 획득된 값의 실수부이고, Yi(n)은 입력 신호의 푸리에 변환을 통해 획득된 값의 허수부이고, n은 주파수 대역이다. 구체적으로, n은 주파수 영역이 나누어지는 N개 주파수 대역들 각각에 할당되는 번호이다.
오디오 검출부(80)는, 입력 신호 내의 오디오 신호의 유무를 검출하는 오디오 검출 수단이다. 상술한 바와 같이, 입력 신호가 프레임으로 나누어지는 경우에, 오디오 검출은 각각의 프레임에 대해 수행된다. 제1 실시예에서는, 이러한 오디오 검출 공정이 수행되는 것이 상정된다. 여기에서, "오디오"라는 용어는 특히 회화, 말하기, 음악 소리, 또는 각종 신호와 같이 인간에게 의미가 있는 음향을 나타낸다. 즉, 입력 신호가 적당한 재생 수단을 사용하여 재생되는 경우, 그 입력 신호에 포함된 "오디오" 신호를 재생함으로써 이러한 음향이 생성되는 것으로 고려될 수 있다. 그러나, 제1 실시예는, 실제로는 잡음인 신호가 이러한 의미에 있어서의 "오디오"로서 인식되는 경우를 고려한다. 이 점의 상세한 사항은 이후의 설명에서 명백해질 것이다.
이 오디오 신호는 이하의 식 (2)를 사용하여 검출된다.
Figure 112009064999314-PAT00002
식 (2)에서의, PS 및 PN은 이하의 식 (3) 및 (4)에 의해 각각 표현된다.
Figure 112009064999314-PAT00003
Figure 112009064999314-PAT00004
여기에서, N1 및 N2는, 주파수 대역 번호이며, 따라서 상술한 N보다 작은 정수이다. P(n)은 입력 신호의 파워 스펙트럼이며(식 (1) 참조), Nt -1(n)은 현재 시점 이전의 일 시점의 공정을 통해 추정된 잡음의 파워 스펙트럼이다.
따라서, PS는 대역 N1부터 대역 N2까지의 입력 신호의 총 파워 스펙트럼이며, 이와 유사하게 PN은 대역 N1부터 대역 N2까지 추정된 총 잡음 파워 스펙트럼이다. 상술한 식 (3) 및 식 (4)로부터, 식 (2)의 SNR은, 입력 신호의 총 파워 스펙트럼과 추정된 총 잡음 파워 스펙트럼 사이의 레벨 차를 나타낸다.
예를 들어, 오디오 검출부(80)는, 식 (2)에 의해 연산된 SNR이 예를 들어, 소정값 TH1 이상인 경우(즉, SNR≥TH1)에는 입력 신호가 오디오라고 판정하고, 연산된 SNR이 소정값 TH1보다 작은 경우(즉,SNR<TH1)에는 입력 신호가 오디오가 아니라고 판정한다. 소정값 TH1은 오디오 검출을 위한 임계값이다. 구체적으로는, 소정값 TH1은 예를 들어, 6[dB]로 설정된다.
오디오 검출부(80)는 이러한 판정을 통해 획득된 오디오 신호의 유무를 나타내는 정보를 유지한다. 예를 들어, 오디오 검출부(80)는, 오디오 신호의 유무에 따라, 1 또는 0의 값으로 설정되는 오디오 검출 플래그 sp_flg를 보유한다(sp_flg는 sp_flg=1인 경우 "오디오 신호의 존재"를 나타내고 sp_flg=0인 경우 "오디오 신호의 부재"를 나타냄). 이는, 오디오 검출부(80)로 하여금 현재 시점의 공정 동안 입력 신호에 오디오 신호가 포함되어 있는지 여부를 항상 알 수 있게 한다.
제1 잡음 스펙트럼 추정부(21)는, 입력 신호에 기초하여 제1 잡음 스펙트럼을 추정하는 제1 잡음 스펙트럼 추정 수단이다. 제1 실시예에서는, 특히, 이하의 식 (5)에 기초하여, 제1 잡음 스펙트럼이 연산된다.
Figure 112009064999314-PAT00005
여기에서, N1t(n)은, 현재 처리 중인 프레임의 제1 잡음 스펙트럼 추정값이고, Nt-1(n)은, 그 직전에 처리된 프레임의 잡음 스펙트럼 추정값이며(따라서, "t"는 현재 처리 중인 프레임을 표현하는 첨자임), μ은 평활화 계수(smoothing factor)이다. 식 (5)에서, case·A는 플래그 sp_flg=O인 경우(즉, 입력 신호가 현재 시점에서 오디오가 아닌 경우)를 표현하고, case·B는, 플래그 sp_flg=1의 경우(즉, 입력 신호가 현재 시점에서 오디오인 경우)를 표현한다.
이러한 방식으로, 제1 잡음 스펙트럼 추정부(21)는, 현재 시점에서 오디오 검출부(80)가 오디오 신호를 검출하였는지의 여부에 따라, 제1 잡음 스펙트럼 추정 값 N1t(n)을 획득하는 데 사용되는 식을 변경한다. 즉, 제1 잡음 스펙트럼 추정부(21)는, sp_flg=1인 경우, 그 직전의 잡음 스펙트럼 추정값 Nt -1(n)을 변경 없이 사용하여 제1 잡음 스펙트럼 추정값 N1t(n)을 구하고, sp_flg=0인 경우, 입력된 파워 스펙트럼을 시간축에서 평활화함으로써, 제1 잡음 스펙트럼 추정값 N1t(n)을 구한다.
제2 잡음 스펙트럼 추정부(23)는, 입력 신호에 기초하여 제2 잡음 스펙트럼을 추정하는 제2 잡음 스펙트럼 추정 수단이다. 제1 실시예에서는, 특히, 이하의 식 (6) 및 (7)에 기초하여, 제2 잡음 스펙트럼이 연산된다.
Figure 112009064999314-PAT00006
Figure 112009064999314-PAT00007
여기에서, PAt(n)은, 현재 처리 중인 프레임의 평활화된 파워 스펙트럼이며, PAt-1(n)은, 그 직전의 프레임의 평활화된 파워 스펙트럼이며, α는 평활화 계수이다.
N2t(n)은, 현재 처리 중인 프레임의 제2 잡음 스펙트럼 추정값이고, N2t -1(n)은, 그 직전에 처리된 프레임의 제2 잡음 스펙트럼 추정값이며, γ 및 β은 제어 파라미터이다. 식 (7)에서, case·C는, PAt(n)>N2t -1(n)이 만족되는 경우를 표현하 고, case·D는, PAt(n)>N2t -1(n)이 만족되지 않는 경우를 표현한다.
이 경우, 식 (7)의 case·D로서 표현되는 식과 식 (6)의 조합은 상술한 식 (5)의 case·A로서 표현되는 식과 실질적으로 동일하다.
한편, 식 (7)의 case·C로서 표현되는 식은, 상술한 식 (5)에 있어서는 대응하는 경우를 갖지 않는다. 그러나, 이 식은, 상술한 바와 같이 PAt(n)>N2t -1(n)이 만족되는 경우, 즉, 현재 처리되는 프레임의 파워 스펙트럼이, 그 직전의 프레임에 있어서의 제2 잡음 스펙트럼 추정값을 초과할 경우에 발동되므로, case·C는, 현재 처리되는 프레임이 오디오 신호를 포함할 가능성을 시사하는 것으로 또한 고려될 수 있다. 이러한 조건이 다수의 대역들(n=0, 1, 2, 3, ...)에 대해서 만족된다면 이 가능성은 높아질 것이다. 그러나, 이 기능성은 단지 "시사(implication)"이다.
이들 식 (6) 및 (7)은 이러한 의미에 있어서 상술한 식 (5)와 공통성을 갖는다.
식 (5)와 대비할 때, 이들 식 (6) 및 (7)의 하나의 중요한 특징은, 식 (5)와는 상이하게 오디오 검출의 결과를 요구하지 않고도 잡음 스펙트럼 추정값을 연산할 수 있다는 것이다. 이는 후에 다시 설명할 것이다.
이하의 식에 의해 표현되는 바와 같이, 가중 평균부(30)는, 제1 잡음 스펙트럼 추정값 N1t(n), 제2 잡음 스펙트럼 추정값 N2t(n), 및 후술하는 가중 계수 연산부(90)에 의해 연산되는 가중 계수를 사용하여, 추정값들의 가중 평균을 구하는 잡음 억제 수단이다.
Figure 112009064999314-PAT00008
이 가중평균 Nt는 최종적으로 적용되어야 할 잡음 스펙트럼 추정값이다.
카운터부(85)는, 오디오 검출부(80)에 의해 오디오가 검출되는 횟수를 각 프레임에 대해 카운트한다. 즉, 카운터부(85)는, 오디오 검출 플래그 sp_flg가 1이 될 때마다 1씩 증가하는 변수를 사용한다. 이 변수가 CNT로 표기되는 경우, sp_flg가 1이면 CNT=CNT+1이고, sp_flg==O이면, CNT=0이다. 따라서, 카운터부(85)는 오디오 검출의 지속 시간(duration)을 제공한다.
가중 계수 연산부(90)는, 가중 평균부(30)의 연산에 사용되는 가중 계수 w를 연산한다. 제1 실시예에서는 특히, 이하의 식 (9)에 기초하여, 가중 계수 연산부(90)가 가중 계수 w를 연산한다.
Figure 112009064999314-PAT00009
여기에서, TH2는 가중 계수 조정 하한이고, TH3은 가중 계수 조정 상한이다. 식 (9)에서, case·E는 CNT≤TH2의 경우를 표현하고, case·F는 TH2<CNT<TH3의 경우를 표현하고, case·G는 CNT≥TH3의 경우를 표현한다. TH2 및 TH3는 각각 "가중 계수 조정 하한" 및 "가중 계수 조정 상한"이라 칭해지는데, 이는 식 (9)의 case·F로서 표현되는 식이 TH2 <CNT <TH3의 경우에 동작하기 때문이다.
식 (9)를 통해 연산되는 가중 계수 w는, 예를 들어 도 2에 도시된 그래프에 의해 표현된다. 도 2에서, TH2는 원래 "횟수"를 표현하지만, 횡으로의 시간축 상의 0.5[s]의 지점에 대응하는 것으로 도시되고, TH3도 횡으로의 시간축 상의 1.0[s] 지점에 대응하는 것으로 도시된다. CNT는, 상술한 바와 같이, 오디오 검출부(80)에 의해 오디오가 계속적으로 검출되는 횟수를 표현하지만, CNT 값에 대응하는 시간 길이를 고유하게 결정할 수 있다. 어떤 경우이든, CNT와 TH2 또는 TH3는 동일한 차원(동일한 "횟수" 또는 "시간")에서 비교될 수 있다.
따라서, 도 2에 도시된 가중 계수 w는, 시간이 O.5[s]의 지점으로부터 증가할수록, 즉, 변수 CNT가 증가할수록, 감소한다. 가중 계수 w의 조정 기한(time limit)은, 1.0[s]로 도시된다(식 (9)의 case·F). CNT가 O.5[s] 이하의 시간을 표현하는 경우에는 w=1.0(식 (9)의 case·E)이고, CNT가 1.0[s] 이상의 시간을 표현하는 경우에는, w=O(식 (9)의 case·G)이다. 도 2에서, 가중 계수 w가 변동할 때의 1-w의 변동이 점선으로 또한 도시된다.
이 결과, 상술한 식 (8)의 설명 및 표현으로부터, 가중 계수 연산부(90)는, CNT가 증가함에 따라, 제1 잡음 스펙트럼 추정값 N1t(n)의 영향을 줄이고, 제2 잡음 스펙트럼 추정값 N2t(n)의 영향을 크게 하기 위한 가중 계수 w를 결정한다는 것을 알 수 있다.
잡음 억제 이득 연산부(60)는, 진폭 스펙트럼과 식 (8)을 사용하여 구해진 잡음 스펙트럼 추정값 Nt(n)에 기초하여 잡음 억제 이득을 연산한다. 제1 실시예에서, 특히, 이하의 식 (10)을 사용하여 잡음 억제 이득이 연산된다.
Figure 112009064999314-PAT00010
여기에서, max(a, b)는, a 및 b 중 더 큰 값을 출력하는 함수를 나타낸다.
이 식 (10)에 따르면, 입력된 진폭 스펙트럼 Y(n)과 잡음 스펙트럼 추정값 Nt(n)과의 관계가 Y(n)<Nt(n)인 경우에는, G(n)=0이고, Y(n)>Nt(n)인 경우에는, G(n)=(Y(n)-Nt(n))/Y(n)이다.
도 1에 도시된 승산기(11)는 상술한 바와 같이 구해진 잡음 억제 이득 G(n)을 진폭 스펙트럼 Y(n)에 승산하는 잡음 억제 수단이다. 즉, 승산기(11)는 S(n)=G(n)·Y(n)의 연산을 수행하여, 최종적으로 얻어야 될 값인 잡음이 억제된 진폭 스펙트럼 S(n)을 구한다.
최종적으로, 주파수 대 시간 변환부(70)는, 시간 대 주파수 변환부(10)로부터 직접 공급되는 위상 스펙트럼과, 상술한 바와 같이 획득된, 잡음이 억제된 진폭 스펙트럼 S(n)에 기초하여, 시간 영역 출력 신호를 생성한다. 제1 실시예에서는, 푸리에 변환이 시간 대 주파수 변환부(10)에 의해 수행되므로, 주파수 대 시간 변환부(70)는 역(inverse) 푸리에 변환을 수행한다.
이제, 상술한 제1 실시예에 연관되는 잡음 억제 장치(1)의 동작 및 효과에 대해, 이전에 참조한 도 1 및 도 2 외에, 도 3 내지 도 8을 참조하여 설명한다.
우선, 시간 대 주파수 변환부(10)는, 입력 신호에 대하여, 푸리에 변환을 수행하여 입력 신호를 주파수 영역 신호로 변환한다(도 3의 스텝 S101). 여기에서, 시간 대 주파수 변환부(10)는, 상술한 바와 같이, 각 프레임에 대해 처리를 수행한다. 스펙트럼 연산부(15)는 상술한 식 (1)에 따라 파워 스펙트럼 P(n)을 연산한다(도 3의 스텝 S102).
오디오 검출부(80)는, 구해진 파워 스펙트럼 P(n) 및 식 (2) 내지 식 (4)에 기초하여, 입력 신호에 오디오 신호가 포함되는지 여부를 판정한다(도 3의 스텝 S201).
이 경우, 예를 들어, 오디오 검출의 정확도를 높일 목적으로, 식 (3) 및 식 (4)의 N1 및 N2가 적당히 설정될 수 있다. 즉, 오디오 신호를 포함할 수 있는 주파수 대역이 특정 대역 내에 한정되는 것이 예측되는 경우, 전 주파수 대역에 대해 오디오 신호의 유무가 판정되는 것보다는, 그 특정 대역을 커버하도록 N1 및 N2를 설정함으로써 오디오 신호의 유무가 판정되는 것이 보다 합리적이다. 이 경우, 오디오 검출의 정확도의 증가 및 연산 속도의 향상과 같은 유리한 점들을 획득할 수 있다. 그러나, N1 및 N2는 전 주파수 대역을 커버하도록 설정될 수도 있다.
상술한 방식으로 대역 N1 및 N2 사이에 오디오 신호가 포함되었는지 여부가 판정되고, 오디오 신호가 포함되었다고 판정되는 경우에는 오디오 검출 플래그 sp_flg가 설정되고(즉, sp_flg=1), 오디오 신호가 포함되지 않았다고 판정되는 경우에는 오디오 검출 플래그 sp_flg가 재설정된다(즉, sp_flg=O).
카운터부(85)는, 오디오 검출부(80)의 오디오 검출 동작에 있어서, sp_flg=1이 만족되는 한, 변수 CNT를 계속 증가시킨다(도 3의 스텝 S202 및 S203 참조).
상술한 오디오 검출 공정에 병행하여, 잡음 억제 장치(1)는, 제1 잡음 스펙 트럼 추정부(21) 및 제2 잡음 스펙트럼 추정부(23)를 통해 제1 잡음 스펙트럼 추정값 N1t(n) 및 제2 잡음 스펙트럼 추정값 N2t(n)을 연산한다(도 3의 스텝 S103 및 S104).
우선, 제1 잡음 스펙트럼 추정부(21)는, 상술한 식 (5)에 기초하여, 제1 잡음 스펙트럼 추정값 N1t(n)을 연산한다. 이 연산 공정은, 상술한 바와 같이, sp_flg의 값에 따라 변한다. 즉, sp_flg=O을 만족하는 경우에는, 식 (5)의 case·A로서 나타내어지는 식을 사용하여 시간축에서 평활화 공정을 수행함으로써, 제1 잡음 스펙트럼 추정부(21)가 제1 잡음 스펙트럼 추정값 N1t(n)을 연산한다. 한편, sp_flg=1을 만족하는 경우에는, 제1 잡음 스펙트럼 추정부(21)는 식 (5)의 case·B로서 나타내어지는 식에 따라 현재 프레임의 제1 잡음 스펙트럼 추정값 N1t(n)이 이전 프레임의 잡음 스펙트럼 추정값 Nt -1(n)과 동등하다고 판정한다.
또한, 제2 잡음 스펙트럼 추정부(23)는, 상술한 식 (6) 및 식 (7)에 기초하여, 제2 잡음 스펙트럼 추정값 N2t(n)을 연산한다. 이 연산 공정은, 상술한 바와 같이, 현재 처리 중이고 평활화 공정을 받은 프레임의 파워 스펙트럼 PAt(n)이 이전에 처리된 프레임의 제2 잡음 스펙트럼 추정값 N2t -1(n)보다 큰지 또는 작은지 여부에 따라 변한다. 즉, 제2 잡음 스펙트럼 추정부(23)는, PAt(n)>N2t -1(n)이 만족되는 경우에는, 식 (7)의 case·C로서 나타내어지는 식을 사용하여 제2 잡음 스펙트럼 추정값 N2t(n)을 구하고, PAt(n)≤N2t -1(n)이 만족되는 경우에는 식 (7)의 case·D로서 나타내어지는 식을 사용하여 제2 잡음 스펙트럼 추정값 N2t(n)을 구한다.
상술한 방식으로 연산되는 제1 및 제2 잡음 스펙트럼 추정값 N1t(n) 및 N2t(n)은, 예를 들어 도 4 및 도 5에 나타낸 바와 같이 표현된다.
도 4는 입력 신호 파형의 일례를 나타내고, 도 5는 도 4에 도시된 입력 신호에 기초하여 연산된 파워 스펙트럼의 일례를 나타낸다. 즉, 도 4는 "라이브(live)" 신호를 도시하고, 도 5는 식(1)에 따른 연산 후(또는, 도 3의 스텝 S102의 처리 후)의 파워 스펙트럼 P(n)을 도시한다. 도 5는 특히 주파수 250[Hz] 주변의 주파수 대역을 나타낸다. 도 5의 좌측 상단부 부근에 나타내어진 점선 화살표는, 표시 한계를 초과하는 레벨 상승의 도시의 생략을 나타낸다.
도 4 및 도 5의 예에서, 제1 잡음 스펙트럼 추정값 N1t(n)은, 도 5의 곡선 S1에 의해 도시되고, 제2 잡음 스펙트럼 추정값 N2t(n)은, 곡선 S2에 의해 도시된다. 이 경우, 2가지 점에 유의해야 한다.
유의해야 할 첫번째 점은, 도 4의 부호 M1로 도시된 잡음 신호 레벨이 급변하고 있는 부분(이하, "잡음 레벨 급변부 M1"이라 함)이 존재함에도 불구하고, 제1 잡음 스펙트럼 추정값 N1t(n) 또는 곡선 S1은, 잡음 레벨 급변부 M1에 추종하는 동작을 보이지 않는다는 것이다. 이것은, 식 (5)의 case·B로서 나타내어지는 식을 이용한 결과이다.
원래, 이 식은 sp_flg=1, 즉 오디오가 존재하는 경우에 발동되는 것으로 규정된다. 상술한 식 (2) 내지 식 (4)에 기초하는 오디오 검출 방법 또는 오디오 검출기(80)가 적용되는 경우에, 도 4의 잡음 레벨 급변부 M1과 같이 잡음 신호의 레벨이 급변된 지점에 오디오 신호가 존재한다고 잘못 인식되는 가능성을 배제할 수는 없다. 이 때문에, 곡선 S1은 도 5에 도시된 형태를 갖는다. 즉, 잡음 레벨 급변부 M1이 오디오 신호로서 잘못 식별되어서, 제1 잡음 스펙트럼 추정값 N1t(n)은 이전의 잡음 스펙트럼 추정값 Nt(n)으로 유지되어, 억제되어야 할 잡음 신호임에도 불구하고, 잡음 레벨 급변부 M1의 레벨을 추종하지 않는다.
다음은 유의해야 할 두번째 점이다. 제2 잡음 스펙트럼 추정값 N2t(n)은 상술한 제1 잡음 스펙트럼 추정값 N1t(n)의 문제점은 없고, 도 5에 나타낸 바와 같이, 파워 스펙트럼P(n)의 변동에 충실히(즉, 근접하게) 추종한다. 그러나, 예를 들어, 도 5에서 부호 M2로 나타낸 오디오 신호가 존재하는 부분(이하, "오디오 신호부 M2"라 함)에 있어서 추정된 제2 잡음 스펙트럼 추정값 N2t(n)의 값은 약간 과도하다.
이들 결과는 모두, 상술한 식 (6) 및 식 (7)의 내재하는 특징에 의해 발생된 것이다. 즉, 제2 잡음 스펙트럼 추정값 N2t(n)은, 오디오 검출 결과를 필요로 하지 않는 연산 원리에 기초해서 구해지고, 그 연산은 거의 완전히 파워 스펙트럼 P(n)에 기초하므로, 제2 잡음 스펙트럼 추정값 N2t(n)이 파워 스펙트럼 P(n)의 변동에 충실히 추종한다고 하더라도, 파워 스펙트럼 P(n)의 값에 의해 과대 평가될 수 있는 위험을 갖는다.
과대 평가된 제2 잡음 스펙트럼 추정값 N2t(n)을 변동 없이 사용하면서 오디오 신호부 M2에 대한 잡음 억제 공정이 수행되면, 필요 이상으로 잡음이 억제되고, 이는 음질의 열화를 야기할 수 있다.
상술한 바와 같이, 제1 및 제2 잡음 스펙트럼 추정값 N1t(n) 및 N2t(n)이 구해진 후, 변수 CNT의 값에 따라 가중 계수 w가 설정된다(도 3의 스텝 S106 내지 S110 참조). 구체적으로, 도 1의 가중 계수 연산부(90)는, CNT가 가중 계수 조정 하한 TH2 이하인 경우, 가중 계수 w를 1로 설정하고(즉, w=1), CNT가 가중 계수 조정 상한 TH3 이상인 경우, 가중 계수 w를 0으로 설정한다(즉, w=0). 다른 경우에는, 즉, TH2 <CNT<TH3이 만족되는 경우에는, 가중 계수 연산부(90)는 가중 계수 w를 p로 설정한다(즉, w=p)(도 3의 스텝 S110). 여기에서, "p"는 상술한 식 (9)의 case·F로서 나타내어지는 식의 우변에 대응하고, 예를 들어, 도 2의 방법에 따라 결정된다.
가중 평균부(30)는 가중 계수 w와 상술한 식 (8)에 따라 잡음 스펙트럼 추정값 Nt(n)을 구한다(도 3의 스텝 S301).
이 경우, 중요한 점은, 가중 계수 w가 CNT 값의 크기에 따라 결정되므로, 잡음 스펙트럼 추정값 Nt(n)도 CNT 값의 크기에 따라 결정된다는 것이다. 즉, CNT가 작은 경우, 즉 오디오 지속 시간이 매우 길지는 않은 경우에는 잡음 스펙트럼 추정 값 Nt(n)은, 제1 잡음 스펙트럼 추정값 N1t(n)의 값과 동등하고, CNT가 큰 경우, 즉 오디오 지속 시간이 매우 긴 경우에는, 제2 잡음 스펙트럼 추정값 N2t(n)의 값과 동등하다.
CNT가 중간인 경우에는, 잡음 스펙트럼 추정값 Nt(n)은, 제1 및 제2 잡음 스펙트럼 추정값 N1t(n) 및 N2t(n)을 적절하게 조합함으로써 구해지는 값과 동등하다.
이 경우에, CNT 값이 증가하면, 잡음 스펙트럼 추정값 Nt(n)을 결정하는 것에 대한 제1 잡음 스펙트럼 추정값 N1t(n)의 영향이 감소하는 반면, 제2 잡음 스펙트럼 추정값 N2t(n)의 영향이 커진다.
상술한 절차를 수행함으로써 구해지는, 최종적으로 적용되어야 할 잡음 스펙트럼 추정값 Nt(n)이 앞서 참조된 도 5에 나타내어진다. 구체적으로, 도 5에서, 잡음 스펙트럼 추정값 Nt(n)은 곡선 Sf에 의해 도시된다. 잡음 스펙트럼 추정값 Nt(n) 또는 곡선 Sf는, 상술한 가중 평균 공정을 거쳤으므로, 도 5에 나타낸 바와 같이, 파워 스펙트럼 P(n)의 변동을 추종하는 특성이 어느 정도 유지되면서, 오디오 신호부 M2에 있어서 과대한 스펙트럼 값이 추정되지 않는다. 도 5에서 곡선 S1, S2 및 Sf를 보기 쉽게 하기 위해서, 곡선 S1, S2 및 Sf는 도 6 내지 도 8에서 각각 개별적으로 도시된다.
최종적으로, 잡음 억제 이득 연산부(60)는, 구해진 잡음 스펙트럼 추정값 Nt(n)을 사용해, 상술한 식 (10)을 따라 잡음 억제 이득 G(n)을 연산한다. 그 후, 잡음 억제 이득 G(n)에, (도 1에 나타낸 승산기(11)를 통해) 원래의 진폭 스펙트럼 Y(n)이 승산되어, 잡음이 억제된 진폭 스펙트럼 S(n)을 연산한다(도 3의 스텝 S302).
상술한 구성 및 동작을 갖는 잡음 억제 장치(1)는, 이하의 유리한 점을 갖는다.
(1) 제1 실시예의 잡음 억제 장치(1)에 따르면, 잡음 스펙트럼 추정값 Nt(n)이, 현실에서 입력 신호에 포함되어 있을 잡음 스펙트럼을 보다 정확하게 반영하므로, 입력 신호 내의 잡음이 매우 적절하게 억제된다. 이는, 상술한 바와 같이, CNT의 크기에 따라 잡음 스펙트럼 추정값 Nt(n)의 설정이 수행되기 때문이다.
일반적으로, 입력 신호에 오디오 신호가 매우 긴 시간동안 포함되는 가능성은 매우 작다. 예를 들어, 사람들이 서로 대화하는 경우에, 화자 교대와 같은 장면에 종종 무음 구간(mute interval)이 포함되거나, 한 사람이 계속해서 이야기하는 경우에는 말하는 중에 호흡 등이 필요하므로, 이러한 추정은 합리적인 근거를 갖는다.
따라서, CNT가 매우 큰 값을 갖는 것은 부자연스러운 일이다. 따라서, CNT가 증가하는 경우, 오디오 신호인 것으로 결정되어서는 안되는 장면(또는 섹션)이 존재할 가능성, 즉 잡음이 오디오 신호로서 잘못 인식될 가능성이 크다.
도 3의 스텝 S107의 "예"로부터 스텝 S109에 이르는 절차에서 이러한 사정이 고려된다. 구체적으로, CNT가 소정값 TH3을 초과하는 경우에는, 상술한 문제되는 상황이 발생할 가능성이 크므로, 가중 계수 w가 0으로 설정된다. 즉, 오디오 검출의 결과는 도 2의 방법 또는 식 (8)을 따라, 잡음 스펙트럼 추정값 Nt(n)을 제2 잡음 스펙트럼 추정값 N2t(n)과 동등하게 설정함으로써 "무시"된다. 따라서, 파워 스펙트럼 P(n)을 충실히 추종하는 제2 잡음 스펙트럼 추정값 N2t(n)에 따라 잡음 억제 공정이 수행되어, 잡음 신호에 대해 적합한 조치(즉, 잡음 신호의 효과적인 억제)를 가능하게 한다.
이러한 절차는, 이상한 상황에 대한 적합한 조치로서의 기능을 하지만, 동일한 의미에서는, 도 3의 스텝 S106의 "예"로부터 스텝 S108에 이르는 절차(즉, 가중 계수 w를 1로 설정하기 위한 절차)는 "통상의 절차"로서의 기능을 한다. 실제로, 오디오 검출 결과를 사용하여 잡음 스펙트럼을 추정하는 것은 오디오 검출 결과를 사용하지 않는 추정보다 높은 신뢰성을 갖는다. 또한, 제1 실시예에서는, 제1 잡음 스펙트럼 추정값 N1t(n)의 값을 결정하는 방법이 식 (5)에 나타낸 바와 같이, 오디오 신호의 유무에 따라서 상이하고, 각각의 적절한 잡음 억제 절차 또한 오디오 신호의 유무에 따라 수행됨으로써, 보다 효과적인 잡음 억제가 달성될 가능성을 높인다. 따라서, 이러한 절차가 "통상의 절차"로서 인식되는 것은 합리적이다. 물론, "이상" 또는 "통상"이라는 용어는 "오디오의 오검출의 가능성"의 유무에만 연관되며, 어떠한 다른 중요한 상황을 상정하지는 않는다.
(2) 한편, 도 3의 스텝 S107의 "아니오"로부터 스텝 S110에 이르는 절차는 상술한 설명과의 대비로부터 명백한 바와 같이, 상술한 2 경우의 중간적인 경우에 대해 적용되는 절차로서의 기능을 한다. 즉, 제1 실시예에 따르면, CNT가 매우 크지 않다고 하더라도, 상술한 관점에서 오인식의 가능성이 있는 값을 갖는 영역에 대해, 상술한 2 경우의 절차의 "절충적인" 절차가 수행된다. 게다가, 제1 실시예에서는, 그 영역에 대해 자동적으로 구해진 특정 중간 잡음 스펙트럼 추정값이 이 경우에 동일하게 사용되지 않지만, 그 대신에 가중 계수 w가 CNT의 값에 따라 조정되고(도 2 참조), 가중 계수 w가 조정될 때마다 잡음 스펙트럼 추정값 Nt(n)을 연산하려는 시도가 이루어진다.
이러한 처리 방법은, 철저한 처리의 변경이 없으므로 보다 실용적인 조치이고, 상술한 2개의 유리한 점, 즉, 급변동된 레벨을 갖는 잡음의 억제와 잡음 스펙트럼의 과대 평가를 회피함으로써 음질 열화를 회피하는 것이 균형잡힌 방식으로 달성된다. 이는 제1 실시예의 하나의 주요한 유리한 점이다.
<제2 실시 형태>
이하, 본 발명의 제2 실시예에 대해 도 9를 참조하여 설명한다. 제2 실시예는, 제1 실시예와 대비해서, 제1 및 제2 잡음 스펙트럼 추정값 N1t(n) 및 N2t(n)을 혼합하는 공정에 연관되는 상이한 특징을 갖는다. 제2 실시예의 다른 특징들은 달리 언급이 없는 한 제1 실시예의 특징들과 모두 동일하다. 따라서, 이하에서는 상이한 특징들에 초점을 맞추어 설명하고, 다른 특징들은 간략하게 설명하거나 설명하지 않을 것이다. 또한, 도 9에서, 상이한 특징들과 연관된 것 외의 요소들은 제 1 실시예의 요소들과 동일한 참조 부호에 의해 표기될 것이다.
제2 실시예의 잡음 억제 장치(1')는, 도 9에 나타낸 바와 같이, 적분기(40), 스위치(45) 및 스위칭 신호 생성부(95)를 포함한다. 스위칭 신호 생성부(95)는, 스위치(45)를 제어하기 위한 스위칭 신호 sw_flg를 생성한다. 스위칭 신호 sw_flg는, 도 1에 나타낸 바와 같이, 카운터부(85)로부터의 입력에 따라 생성된다. 즉, 스위칭 신호 생성부(95)는 오디오 검출의 지속 시간을 나타내는 CNT 값에 기초하여 스위칭 신호 sw_flg를 생성하거나 생성하지 않는다. 바람직하게는, 예를 들어, CNT≥TH4의 경우에는, 스위칭 신호 sw_flg가 생성되고(즉, sw_flg=1), CNT<TH4의 경우에는, 생성되지 않는(즉, sw_flg=0) 기준을 설정할 수 있다. 이하, 이러한 기준에 기초하여 설명할 것이다.
여기에서, 도 9에 도시된 바와 같이, 스위치(45)는 통상적으로 제1 잡음 스펙트럼 추정부(21)에 접속되어 있고, 스위칭 신호 sw_flg가 1로 설정되는 경우(즉, sw_flg=1), 반대측의 제2 잡음 스펙트럼 추정부(23)에 스위칭된다. 스위칭 신호 sw_flg가 0으로 설정되는 경우, 스위치(45)는 제1 잡음 스펙트럼 추정부(21)에 다시 접속된다.
적분기(40)는, 예를 들어, 오피 앰프(연산 증폭기), 용량 소자 및 저항 소자를 포함하며, 이들 모두는 도시되지 않는다. 제1 실시예에서는, 도 1에 나타낸 바와 같이, 제1 잡음 스펙트럼 추정부(21) 및 제2 잡음 스펙트럼 추정부(23) 양쪽의 출력을 받는다. 적분기(40)는 이하의 식 (11)에 따라 동작한다.
Figure 112009064999314-PAT00011
여기에서, Nit(n)은, 현재 시점의 적분기(40)의 출력이고, Nit -1(n)은, 한 시점 전의 적분기(40)의 출력이고, λ는 평활화 계수이다. 식 (11)에서, case·H는, CNT=TH4의 경우를 표현하고, case·I는, CNT>TH4의 경우를 표현한다. 식 (11)에서 TH4는, 이에 기초하여 적분기(40)를 동작시킬 것인지 여부가 결정되는 임계값으로서의 기능을 하지만, 이하의 설명으로부터 이해될 바와 같이, 실제적으로는 제1 실시예의 소정값 TH2로서의 기능을 한다.
식 (11)에서, N1t(n) 및 N2t(n)은, 상술한 바와 같이, 제1 잡음 스펙트럼 추정값 및 제2 잡음 스펙트럼 추정값이므로, 적분기(40)는 case·I의 경우 즉 CNT>TH4의 경우에만 실질적으로 동작하고, 제1 잡음 스펙트럼 추정값 N1t(n)로부터 제2 잡음 스펙트럼 추정값 N2t(n)으로의 평활한 접속(또는 전이)을 구현하기 위한 각 값은 t의 증가에 따라 출력된다.
상술한 제2 실시예의 잡음 억제 장치(1')는 이하의 방식으로 동작한다.
우선, 도 3의 스텝 S101 내지 S104, 그리고 스텝 S201 내지 S203은 제1 실시예의 대응 스텝과 동일하다.
차이점은, CNT가 사용되는 방식이다. 즉, 제1 실시예에서 CNT는 가중 계수 w의 조정을 통해 최종적으로 획득된 잡음 스펙트럼 추정값 Nt(n)을 결정하는 데 사 용되는 반면, 제2 실시예에서 CNT는 적분기(40)를 발동시키기 위한 기준을 제공한다.
즉, 우선, CNT가 점차 증가하면서 TH4에 도달하는 경우, 스위칭 신호 생성부(95)는 스위칭 신호 sw_flg를 1로 설정한다. 이는, 스위치(45)가 제2 잡음 스펙트럼 추정부(23)의 측, 즉 적분기(40)로 스위칭되게 한다.
이와 동시에, 적분기(40)는 식 (11)의 case·H로서 나타내어지는 식을 발동시킨다. 여기에서, 적분기(40)로부터 N1t(n)을 출력(즉, Nit(n)=N1t(n))하는 것은, 적분기(40)가 초기값을 갖게 하는 것과 거의 동일하다.
이후, CNT가 계속하여 증가하는 경우에는, 스위칭 신호 sw_flg는 1로 설정된 채로 있고, 스위치(45)는 적분기(40)에 접속된 상태가 되어, 적분기(40)는 식 (11)의 case·I로서 나타내어지는 식을 발동시킨다. 따라서, 적분기(40)가 최초로 N1t(n)을 출력한 후, 적분기(40)는 제2 잡음 스펙트럼 추정값 N2t(n)에 점차로 접근하는 값을 순차적으로 출력한다.
따라서, CNT가 TH4에 도달할 때까지는, 제1 잡음 스펙트럼 추정값 N1t(n)이 도 9에 도시된 잡음 억제 이득 연산부(60)에 입력되고, CNT가 TH4에 도달한 이후에, 최초로는, 제1 잡음 스펙트럼 추정값 N1t(n)이 잡음 억제 이득 연산부(60)에 입력되고, 최종적으로는 제2 잡음 스펙트럼 추정값 N2t(n)이 입력된다. 바람직하게는, 예를 들어, 그 출력이 N2t(n)에서 포화되도록, 상술한 오피 앰프 등에 제2 잡음 스펙트럼 추정값 N2t(n)을 입력함으로써, 제2 잡음 스펙트럼 추정값 N2t(n)이 잡음 억제 이득 연산부(60)에 최종적으로 입력되는 것을 구현할 수 있다.
이것으로부터 알 수 있는 바와 같이, 임계값 TH4는, 제1 잡음 스펙트럼 추정값 N1t(n)으로부터 제2 잡음 스펙트럼 추정값 N2t(n)으로의 스위칭에 대한 기준점으로서의 기능을 한다. 기능적인 관점에서, 임계값 TH4는 제1 실시예의 TH2와 실질적으로 동일하다.
이와 관련하여, 식 (11)의 평활화 계수 λ는 예를 들어, 0.5[s]의 시상수에 대응하는 값으로 설정될 수 있다. 그 결과, 도 2를 참조하여 상술한 바와 같이, 오디오가 계속적으로 검출될 때까지 0.5[s]의 시간에서 개시되는 "가중 계수 조정" 공정과 거의 동일한 공정이 제2 실시예와 연관된 도 9의 예에서도 구현될 수 있다.
후속 절차는 제1 실시예의 절차와 동일하다. 즉, 잡음 억제 이득 연산부(60)는, 상술한 식 (10)에 따라 잡음 억제 이득 G(n)을 연산한다. 그 후에, 잡음 억제 이득 G(n)이 원래 진폭 스펙트럼 Y(n)에 승산되어 잡음이 억제된 진폭 스펙트럼 S(n)을 연산한다(도 3의 스텝 S302 참조).
제2 실시예는 이하의 유리한 점을 갖는다.
우선, 제2 실시예는 제1 실시예와 실질적으로 동일한 동작 및 유리한 점을 갖는다는 것은 명백하다. 따라서, 제2 실시예는 제1 실시예와 관련하여 상술한 유리한 점 (1) 및 (2)와 거의 동일한 유리한 점을 갖는다.
또한, 제2 실시예에 따르면, 적분기(40)의 사용에 의해, 제1 잡음 스펙트럼 추정값 N1t(n)으로부터 제2 잡음 스펙트럼 추정값 N2t(n)로의 평활한 접속(또는, 전이)이 달성될 수 있고, 제1 실시예와 관련하여 상술한 유리한 점 (2)가 더욱 효과적이다.
본 발명의 실시예들을 상술하였지만, 본 발명에 따른 잡음 억제 장치는 상술한 실시예들에 한정되지 않고, 각종 변형이 가능하다.
(1) 제1 및 제2 실시예에서는, 오디오 검출이, 식 (2) 내지 (4)에 기초하여 수행되지만, 본 발명은 이러한 검출 방법에 한정되지 않는다.
예를 들어, 본 발명은, 입력 신호의 레벨이 소정의 임계값을 초과하는지 여부에 단순히 기초하여 오디오가 검출되는 방법을 채용할 수도 있다. 또한, 본 발명은, 확률적 통계적 방법을 사용해서 오디오 신호의 발생 확률이 추정되는 방법을 채용할 수도 있다. 또한, 본 발명은, 푸리에 변환 후의 입력 신호가 검출 타겟으로서 사용되는 상술한 실시예들과는 달리, 푸리에 변환 전의 신호가 검출 타겟으로서 사용되는 방법을 채용할 수도 있다.
(2) 가중 계수 w가 제1 실시예에서 설명된 예에서 선형적으로 증가한다고 할지라도, 본 발명은 이러한 예에 한정되지 않는다. 예를 들어, 가중 계수 w는 비선형적으로 증가할 수 있다. 즉, 곡선으로 증가할 수 있다.
이와 관련하여, 가중 계수 w는 반드시 연속적으로 증가할 필요는 없다. 예를 들어, 가중 계수 w는 w=O.1, 0.2,…와 같이 단계적인 방식으로 증가할 수도 있다.
보다 일반적으로, CNT가 소정값을 초과하는 상황이 발생한 경우에, 잡음 스펙트럼 추정값이 제1 잡음 스펙트럼 추정값 N1t(n) 및 제2 잡음 스펙트럼 추정값 N2t(n)에 기초하여 결정된 특정값이 되게 연산할 수도 있다.
(3) 제1 및 제2 실시예에서는, 잡음 억제 이득 G(n)이 식(10)을 사용하여 연산되지만, 본 발명은 이러한 연산 방법에 한정되지 않는다. 예를 들어, 본 발명은 위너 필터법(Wiener filtering method) 또는 MMSE(Minimum Mean-Square Error)법과 같은 다른 방법들을 사용할 수도 있다(예를 들어, Lim&Oppenheim, "Enhancement and Bandwidth Compression of Noisy Speech", Proc. IEEE, Vol. 67, No. 12, pp. 1586-1604, 1979, 또는, Y. Ephraim and D. Malah, "Speech Enhancement Usinga Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator", IEEE Trans. Vol. ASSP-32, No. 6, pp. 1109-1121, 1984 참조). 그 외에, SNR(Signal(오디오) to Noise Ratio)이 추정되고, 그 추정된 SNR에 기초하여 잡음 억제 이득 G(n)이 구해질 수도 있다.
도 1은 본 발명의 제1 실시예에 따른 잡음 억제 장치의 구성을 나타내는 블록도.
도 2는 도 1에 도시된 잡음 억제 이득 연산부에서 획득되는 가중 계수 w의 그래프.
도 3은 제1 실시예에 따른 잡음 억제 절차를 나타내는 흐름도.
도 4는 입력 신호의 파형예를 나타내는 그래프.
도 5는 입력 신호의 예시적인 연산된 파워 스펙트럼을 나타내는 그래프.
도 6은 도 5에서 곡선 S1(제1 잡음 스펙트럼 추정값 N1t(n))만을 나타내는 그래프.
도 7은 도 5에서 곡선 S2(제2 잡음 스펙트럼 추정값 N2t(n))만을 나타내는 그래프.
도 8은 도 5에서 곡선 Sf(최종 잡음 스펙트럼 추정값 Nt(n))만을 나타내는 그래프.
도 9는 본 발명의 제2 실시예에 따른 잡음 억제 장치의 구성을 나타내는 블록도.
<도면의 주요부분에 대한 부호의 설명>
1: 잡음 억제 장치
10: 시간 대 주파수 변환부
15: 스펙트럼 연산부
21: 제1 잡음 스펙트럼 추정부
23: 제2 잡음 스펙트럼 추정부
30: 가중 평균부
60: 잡음 억제 이득 연산부
70: 주파수 대 시간 변환부
80: 오디오 검출부
85: 카운터부
90: 가중 계수 연산부
11: 승산기
N1t(n): 제1 잡음 스펙트럼 추정값
N2t(n): 제2 잡음 스펙트럼 추정값
G(n): 잡음 억제 이득

Claims (8)

  1. 입력 신호 내에서 오디오의 유무를 검출하는 오디오 검출 수단;
    상기 입력 신호 및 상기 오디오 검출 수단의 검출 결과에 기초하여, 상기 입력 신호에 포함된 잡음 스펙트럼을 추정하여, 제1 잡음 스펙트럼 추정값을 획득하는 제1 잡음 스펙트럼 추정 수단;
    상기 오디오 검출 수단의 검출 결과에 관계없이, 상기 입력 신호에 기초하여 잡음 스펙트럼을 추정하여, 제2 잡음 스펙트럼 추정값을 획득하는 제2 잡음 스펙트럼 추정 수단;
    상기 오디오 검출 수단이 상기 오디오를 계속적으로 검출하는 동안의 검출 시간의 길이에 따르고, 상기 제1 잡음 스펙트럼 추정 수단 및 상기 제2 잡음 스펙트럼 추정 수단에 의한 추정 결과로서 획득되는 상기 제1 잡음 스펙트럼 추정값 및 상기 제2 잡음 스펙트럼 추정값에 기초하여 최종 잡음 스펙트럼 추정값을 연산하는 잡음 스펙트럼 연산 수단;
    상기 최종 잡음 스펙트럼 추정값에 기초하여, 잡음 억제 이득을 연산하는 이득 연산 수단; 및
    상기 입력 신호에 상기 잡음 억제 이득을 적용함으로써, 상기 입력 신호에 포함된 잡음을 억제하는 잡음 억제 수단
    을 포함하는, 잡음 억제 장치.
  2. 제1항에 있어서,
    상기 잡음 스펙트럼 연산 수단은, 상기 제1 잡음 스펙트럼 추정값 및 상기 제2 잡음 스펙트럼 추정값에 승산하기 위한, 상기 검출 시간의 길이에 따라서 변하는 값을 갖는 가중 계수를 연산하는 계수 연산부를 포함하고,
    상기 잡음 스펙트럼 연산 수단은, 상기 가중 계수를 사용하여 상기 제1 잡음 스펙트럼 추정값 및 상기 제2 잡음 스펙트럼 추정값의 가중 평균을 연산함으로써 상기 최종 잡음 스펙트럼 추정값을 연산하는, 잡음 억제 장치.
  3. 제1항 또는 제2항에 있어서,
    상기 잡음 스펙트럼 연산 수단은 적분기를 포함하고,
    상기 적분기는 상기 검출 시간의 길이에 따라 동작하고, 상기 제1 스펙트럼 추정값을 초기값으로서 사용하고, 상기 제2 잡음 스펙트럼 추정값을 수신할 시에 발동되는, 잡음 억제 장치.
  4. 제1항 또는 제2항에 있어서,
    상기 잡음 스펙트럼 연산 수단은,
    상기 검출 시간의 길이가 제1 소정값 이하인 경우에는, 상기 제1 잡음 스펙트럼 추정값을 그대로 상기 최종 잡음 스펙트럼 추정값으로서 연산하고,
    상기 검출 시간의 길이가 제2 소정값 이상인 경우에는, 상기 제2 잡음 스펙트럼 추정값을 그대로 상기 최종 잡음 스펙트럼 추정값으로서 연산하고,
    상기 검출 시간의 길이가 상기 제1 소정값보다 크고 상기 제2 소정값보다 작은 경우에는, 상기 제1 잡음 스펙트럼 추정값과 상기 제2 잡음 스펙트럼 추정값 사이의 중간 잡음 스펙트럼 추정값을 상기 최종 잡음 스펙트럼 추정값으로서 연산하는, 잡음 억제 장치.
  5. 제4항에 있어서,
    상기 중간 잡음 스펙트럼 추정값은, 상기 제1 잡음 스펙트럼 추정값과 상기 제2 스펙트럼 추정값 사이를 연결하도록, 상기 검출 시간의 길이에 따라 변하는 값을 갖는, 잡음 억제 장치.
  6. 제1항 또는 제2항에 있어서,
    상기 오디오 검출 수단은, 상기 입력 신호의 소정의 주파수 대역에 속하는 부분에 대해 상기 입력 신호 내의 오디오의 유무를 검출하는, 잡음 억제 장치.
  7. 입력 신호 내의 오디오의 유무를 검출하기 위한 오디오 검출 공정;
    상기 입력 신호 및 상기 오디오 검출 공정의 검출 결과에 기초하여, 상기 입력 신호에 포함되는 잡음 스펙트럼을 추정하여, 제1 잡음 스펙트럼 추정값을 획득하는 제1 잡음 스펙트럼 추정 공정;
    상기 오디오 검출 공정의 검출 결과에 관계없이, 상기 입력 신호에 기초하여 상기 잡음 스펙트럼을 추정하여, 제2 잡음 스펙트럼 추정값을 획득하는 제2 잡음 스펙트럼 추정 공정;
    상기 오디오 검출 공정에서 상기 오디오가 계속적으로 검출되는 동안의 검출 시간의 길이에 따르고, 상기 제1 잡음 스펙트럼 추정 공정 및 상기 제2 잡음 스펙트럼 추정 공정에서의 추정 결과로서 획득되는 상기 제1 잡음 스펙트럼 추정값 및 상기 제2 잡음 스펙트럼 추정값에 기초하여 최종 잡음 스펙트럼 추정값을 연산하는 잡음 스펙트럼 연산 공정;
    상기 최종 잡음 스펙트럼 추정값에 기초하여 잡음 억제 이득을 연산하는 이득 연산 공정; 및
    상기 입력 신호에 상기 잡음 억제 이득을 적용함으로써, 상기 입력 신호에 포함된 잡음을 억제하는 잡음 억제 공정
    을 포함하는, 잡음 억제 방법.
  8. 제7항에 있어서,
    상기 잡음 스펙트럼 연산 공정은, 상기 제1 잡음 스펙트럼 추정값 및 상기 제2 잡음 스펙트럼 추정값에 승산하기 위한, 상기 검출 시간의 길이에 따라서 변하는 값을 갖는 가중 계수를 연산하는 계수 연산 공정을 포함하고,
    상기 잡음 스펙트럼 연산 공정은, 상기 가중 계수를 사용하여 상기 제1 잡음 스펙트럼 추정값 및 상기 제2 잡음 스펙트럼 추정값의 가중 평균을 연산함으로써 상기 최종 잡음 스펙트럼 추정값을 연산하는, 잡음 억제 방법.
KR1020090101105A 2008-10-24 2009-10-23 잡음 억제 장치 및 잡음 억제 방법 KR20100045935A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2008-274939 2008-10-24
JP2008274939A JP5071346B2 (ja) 2008-10-24 2008-10-24 雑音抑圧装置及び雑音抑圧方法

Publications (1)

Publication Number Publication Date
KR20100045935A true KR20100045935A (ko) 2010-05-04

Family

ID=41403025

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090101105A KR20100045935A (ko) 2008-10-24 2009-10-23 잡음 억제 장치 및 잡음 억제 방법

Country Status (5)

Country Link
US (1) US8515098B2 (ko)
EP (1) EP2180465B1 (ko)
JP (1) JP5071346B2 (ko)
KR (1) KR20100045935A (ko)
CN (1) CN101727912B (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102010061052A1 (de) 2010-05-17 2011-11-17 Hyundai Motor Co. Antriebsvorrichtung einer Kupplung

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012058358A (ja) * 2010-09-07 2012-03-22 Sony Corp 雑音抑圧装置、雑音抑圧方法およびプログラム
JP2012103395A (ja) * 2010-11-09 2012-05-31 Sony Corp 符号化装置、符号化方法、およびプログラム
JP5768450B2 (ja) * 2011-03-31 2015-08-26 富士通株式会社 騒音推定装置及び騒音推定プログラム
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
JP6182895B2 (ja) * 2012-05-01 2017-08-23 株式会社リコー 処理装置、処理方法、プログラム及び処理システム
CN103077725B (zh) * 2012-12-31 2015-12-23 东莞宇龙通信科技有限公司 语音处理的方法及装置
EP2816557B1 (en) * 2013-06-20 2015-11-04 Harman Becker Automotive Systems GmbH Identifying spurious signals in audio signals
JP6361271B2 (ja) * 2014-05-09 2018-07-25 富士通株式会社 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
JP6379839B2 (ja) * 2014-08-11 2018-08-29 沖電気工業株式会社 雑音抑圧装置、方法及びプログラム
JP6596833B2 (ja) * 2015-02-09 2019-10-30 沖電気工業株式会社 雑音抑圧装置及びプログラム、雑音推定装置及びプログラム、並びに、snr推定装置及びプログラム
JP6559576B2 (ja) 2016-01-05 2019-08-14 株式会社東芝 雑音抑圧装置、雑音抑圧方法及びプログラム
EP3312838A1 (en) 2016-10-18 2018-04-25 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for processing an audio signal
CN107948869B (zh) * 2017-12-12 2021-03-12 深圳Tcl新技术有限公司 音频处理方法、装置、音响系统及存储介质
US10043530B1 (en) * 2018-02-08 2018-08-07 Omnivision Technologies, Inc. Method and audio noise suppressor using nonlinear gain smoothing for reduced musical artifacts
US10043531B1 (en) 2018-02-08 2018-08-07 Omnivision Technologies, Inc. Method and audio noise suppressor using MinMax follower to estimate noise
CN111917427B (zh) * 2020-08-11 2021-06-01 电子科技大学 一种基于功率谱的数字话音静噪方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5572621A (en) 1993-09-21 1996-11-05 U.S. Philips Corporation Speech signal processing device with continuous monitoring of signal-to-noise ratio
US6122384A (en) * 1997-09-02 2000-09-19 Qualcomm Inc. Noise suppression system and method
US6453285B1 (en) * 1998-08-21 2002-09-17 Polycom, Inc. Speech activity detector for use in noise reduction system, and methods therefor
JP2001159899A (ja) * 1999-12-01 2001-06-12 Matsushita Electric Ind Co Ltd 騒音抑圧装置
JP4445460B2 (ja) 2000-08-31 2010-04-07 パナソニック株式会社 音声処理装置及び音声処理方法
JP4282227B2 (ja) * 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
CN1770264A (zh) * 2000-12-28 2006-05-10 日本电气株式会社 噪声估算方法和设备
JP4123835B2 (ja) * 2002-06-13 2008-07-23 松下電器産業株式会社 雑音抑圧装置および雑音抑圧方法
EP1609134A1 (en) 2003-01-31 2005-12-28 Oticon A/S Sound system improving speech intelligibility
JP4283212B2 (ja) * 2004-12-10 2009-06-24 インターナショナル・ビジネス・マシーンズ・コーポレーション 雑音除去装置、雑音除去プログラム、及び雑音除去方法
US7957964B2 (en) * 2004-12-28 2011-06-07 Pioneer Corporation Apparatus and methods for noise suppression in sound signals
JP4454591B2 (ja) * 2006-02-09 2010-04-21 学校法人早稲田大学 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置
US8538763B2 (en) * 2007-09-12 2013-09-17 Dolby Laboratories Licensing Corporation Speech enhancement with noise level estimation adjustment
US8175291B2 (en) * 2007-12-19 2012-05-08 Qualcomm Incorporated Systems, methods, and apparatus for multi-microphone based speech enhancement

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102010061052A1 (de) 2010-05-17 2011-11-17 Hyundai Motor Co. Antriebsvorrichtung einer Kupplung

Also Published As

Publication number Publication date
US20100104113A1 (en) 2010-04-29
CN101727912A (zh) 2010-06-09
EP2180465A3 (en) 2013-09-25
EP2180465A2 (en) 2010-04-28
JP5071346B2 (ja) 2012-11-14
EP2180465B1 (en) 2014-12-10
CN101727912B (zh) 2012-05-30
US8515098B2 (en) 2013-08-20
JP2010102204A (ja) 2010-05-06

Similar Documents

Publication Publication Date Title
KR20100045935A (ko) 잡음 억제 장치 및 잡음 억제 방법
JP4162604B2 (ja) 雑音抑圧装置及び雑音抑圧方法
KR100860805B1 (ko) 음성 강화 시스템
US8194882B2 (en) System and method for providing single microphone noise suppression fallback
US8644496B2 (en) Echo suppressor, echo suppressing method, and computer readable storage medium
EP1806739B1 (en) Noise suppressor
US7912567B2 (en) Noise suppressor
JP5875609B2 (ja) 雑音抑圧装置
KR101624652B1 (ko) 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치, 잡음 환경에서 음성 신호를 강화하는 방법 및 그 장치
KR101737824B1 (ko) 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치
KR101837331B1 (ko) 보청기 시스템을 동작시키는 방법 및 보청기 시스템
US20130138434A1 (en) Noise suppression device
US9082411B2 (en) Method to reduce artifacts in algorithms with fast-varying gain
KR101088627B1 (ko) 잡음 억압 장치 및 잡음 억압 방법
JP2003534570A (ja) 適応ビームフォーマーにおいてノイズを抑制する方法
JP3961290B2 (ja) 雑音抑圧装置
JP2014122939A (ja) 音声処理装置および方法、並びにプログラム
US8744846B2 (en) Procedure for processing noisy speech signals, and apparatus and computer program therefor
KR101088558B1 (ko) 잡음 억압 장치 및 잡음 억압 방법
JP2004341339A (ja) 雑音抑圧装置
US20220078561A1 (en) Apparatus and method for own voice suppression
Lollmann et al. A blind speech enhancement algorithm for the suppression of late reverberation and noise
KR100798056B1 (ko) 높은 비정적인 잡음 환경에서의 음질 개선을 위한 음성처리 방법
JP5131149B2 (ja) 雑音抑圧装置及び雑音抑圧方法
JPH06332491A (ja) 音声区間検出装置と雑音抑圧装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application