KR101768264B1 - 노이즈 억제 방법 및 노이즈 억제 방법을 적용하기 위한 노이즈 억제기 - Google Patents

노이즈 억제 방법 및 노이즈 억제 방법을 적용하기 위한 노이즈 억제기 Download PDF

Info

Publication number
KR101768264B1
KR101768264B1 KR1020137019664A KR20137019664A KR101768264B1 KR 101768264 B1 KR101768264 B1 KR 101768264B1 KR 1020137019664 A KR1020137019664 A KR 1020137019664A KR 20137019664 A KR20137019664 A KR 20137019664A KR 101768264 B1 KR101768264 B1 KR 101768264B1
Authority
KR
South Korea
Prior art keywords
signal
noise
microphone
power spectrum
primary
Prior art date
Application number
KR1020137019664A
Other languages
English (en)
Other versions
KR20140015309A (ko
Inventor
페르 오그렌
안데르스 에릭손
소흐라 위르메체
Original Assignee
텔레폰악티에볼라겟엘엠에릭슨(펍)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 텔레폰악티에볼라겟엘엠에릭슨(펍) filed Critical 텔레폰악티에볼라겟엘엠에릭슨(펍)
Publication of KR20140015309A publication Critical patent/KR20140015309A/ko
Application granted granted Critical
Publication of KR101768264B1 publication Critical patent/KR101768264B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/002Damping circuit arrangements for transducers, e.g. motional feedback circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2410/00Microphones
    • H04R2410/05Noise reduction with a separate noise microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Noise Elimination (AREA)

Abstract

1차 마이크로폰을 통해 캡처된 제1신호의 노이즈를 억제하기 위한 방법이 제공되는데, 1차 및 기준 마이크로폰이 통신 장치 상에 배열되어, 이들이 노이즈 및 단속적인 스피치를 캡처할 수 있도록 한다. 본 방법은, 제1신호가 비정상 신호 성분 또는 실질적으로 정상 노이즈를 포함하여 구성되는 지를 결정하는 단계와, 비정상 신호 성분을 포함하여 구성되는 것이 결정되었던 경우, 제1신호가 실질적으로 파-필드 노이즈를 포함하여 구성되는 지를 결정하는 단계와; 제1신호가 실질적으로 정상 노이즈를 포함하여 구성되는 것으로 고려되면 정상 노이즈 파워 스펙트럼 추정 또는, 제1신호가 실질적으로 파-필드 노이즈를 포함하여 구성되는 것으로 고려되면 파-필드 노이즈 파워 스펙트럼 추정으로, 제1신호의 노이즈 파워 스펙트럼 추정을 갱신하는 단계와; 추정된 노이즈 파워 스펙트럼에 기반해서 주파수 응답을 계산하는 단계와, 상기 제1신호 상에 상기 주파수 응답을 적용함으로써, 제1신호로부터 노이즈를 억제하는 단계를 포함하여 구성된다.

Description

노이즈 억제 방법 및 노이즈 억제 방법을 적용하기 위한 노이즈 억제기{A NOISE SUPPRESSING METHOD AND A NOISE SUPPRESSOR FOR APPLYING THE NOISE SUPPRESSING METHOD}
본 발명은 노이즈를 억제하기 위한 방법과 제안된 노이즈 억제 방법을 실행하기 적합한 노이즈 억제기에 관한 것이다.
일반적으로, 용어 보이스 통신은, 파-엔드(far-end) 또는 떨어진 사용자에 대해서 니어-엔드(near-end) 스피치 신호를 전달하는 것으로 이야기되는데, 여기서 스피치 개선 문제는 캡처된 잡음의 신호로부터의 비교적 깨끗한 스피치 신호의 추정(estimation: 또는 평가)으로 이루어진다. 노이즈의 억제를 고려할 때, 개선을 위한 다수의 신호-마이크로폰 구성이 있게 된다.
사운드 필드를 동시에 캡처하기 위해 2개의 별개의 마이크로폰을 사용하는 것은, 마이크로폰에 의해 캡처된 사운드 필드가 기원하는 사운드 소스의 공간적인 정보 및 특성의 가능한 사용을 허용한다. 이들 특성은, 이동 통신 장치 상의 마이크로폰의 상대 위치만 아니라 통신 장치의 설계 및 사용과 관련될 수 있다. 노이즈 특성의 적합한 추정은, 본 특정 기술 분야에서 일반적으로 사용되는 스펙트럼의 차감(spectral subtraction)에 기반한 알고리즘과 같은, 노이즈 억제 알고리즘의 효과적인 사용을 위한 기반이 된다.
2중-마이크로폰 노이즈 억제를 실행하기 위한 다른 방법은, 마이크로폰에 의해 수신된 신호가 통신 장치의 사용자에 의해 생성된 니어-엔드 신호에 대해 비교적 작은 파워 레벨을 갖는 것으로 상정하는 것에 기반해서 제안된다.
WO2007/059255에 있어서, 노이즈 억제는, 2개의 마이크로폰으로 캡처된 입력 신호로부터 차이 및 합 신호의 비율을 생성함으로써 수행된 후, 그 입력 신호는 처리되어 2개의 입력 신호 중 하나로부터 추정된 노이즈를 억제하도록 된다.
WO2007/059255의 단점은, 마이크로폰에 의해 캡처된 신호 간의 이득 차이가 작거나 또는 심지어 없는 것으로 상정하는 것에 의존하는데, 실제로 이동 통신 장치 상에 나란히 탑재된 2중-마이크로폰은 임의의 이득 차이를 나타내게 된다. 이 차이는, 제작된 마이크로폰 이득의 높은 변동에 대해서 그리고, 장치가 핸드 휴대 모드로 사용될 때, 스피커의 입에 대한 이동 장치의 위치의 작은 변화를 갖는 니어-필드 신호 수신된 레벨에서의 변동 모두에 내재한다.
예를 들어, US2007/0154031에 나타낸 다른 방법은, 시간-주파수 영역에서 스피치와 노이즈를 구별하기 위해서 그리고, 따라서 노이즈를 억제하기 위해서, 수신된 마이크로폰 신호 간의 레벨 차이를 활용한다.
그런데, 노이즈를 캡처하기 위한, 전형적으로 기준 마이크로폰으로 언급되는 마이크로폰의 사용은, 기본적으로 스피치를 캡처하기 위해 사용된, 전형적으로 1차 마이크로폰으로 언급되는, 마이크로폰과 관련되며, 2개의 마이크로폰에서의 결과적인 신호 레벨 차이의 활용이 시간-주파수 영역에서의 스피치 및 노이즈 신호의 상당히 양호한 검출을 허용할 수 있게 하는 반면, 마스킹 접근(masking approach)에 기반한 노이즈 억제는, US2007/0154031에 기재된 바와 같이, 정상적으로, 추출된 스피치 신호의 높은 왜곡으로 귀결되고, 또한 흔히 음악의 노이즈(musical noise)를 도입하게 한다.
2중-마이크로폰 노이즈 억제에 대해서 적용 가능한 스펙트럼의 차감 기반의 방법이 WO2000/062579에 제안되는데, 여기서 스펙트럼의 프로세서가 분리 노이즈 감소 및 노이즈 추정된 신호를 생성하기 위해 사용된다.
WO2000/062579에 개시된 바와 같은 스펙트럼의 차감 기술은, 스피치 소거에 대한 비교적 강건하고, 정상 노이즈의 비교적 양호한 억제를 제공하는 것으로 일반적으로 증명된다. 스펙트럼의 차감과 연관되어 통상적으로 사용되는 필터링 처리는 노이즈의 스펙트럼 및 노이즈가 있는 스피치의 스펙트럼의 추정에 통상 의존한다. 바람직하게는, 노이즈 스펙트럼은 스피치 중지 동안, 노이즈의 정상 부분만의 추정에 기반해서 추정된다. 그런데, 많은 배경 노이즈 환경, 예를 들어 레스토랑, 공항, 거리 및 그 밖의 대중적인 장소가, 공지된 실행을 고려하지 않는 비정상 노이즈의 높은 레벨의 존재에 의해 특정되는데, 이는 스펙트럼의 차감 기술에 기반하고, 그러므로 이들 기술을 적용할 때, 비정상 노이즈 성분이 통신 링크의 파-엔드 사용자에 전달된 신호에 있어서 필터링되지 않고 남는다.
따라서, 본 발명의 목적은 적어도 몇몇 상기 문제점들을 해결하는 것이다. 특히, 본 발명의 목적은, 2개 이상의 마이크로폰에 의해 캡처된 노이즈를 억제하기 위한 방법 및 제안된 방법을 실행하기 위한 노이즈 억제기를 제공하는 것이다.
본 발명의 일 측면에 따르면, 통신 장치 상에 배열된 1차 마이크로폰을 통해 캡처된 제1신호의 노이즈를 억제하는 방법이 제공되는데, 1차 마이크로폰이 통신 장치 상에 배열되어, 노이즈 및 단속적인 스피치를 캡처할 수 있도록 하고, 노이즈 억제는, 제1신호의 신호 파워 스펙트럼 추정과 1차 마이크로폰과 실질적으로 동일한 신호 레벨에서 노이즈를 캡처하고, 1차 마이크로폰보다 낮은 신호 레벨에서 스피치를 캡처할 수 있도록 통신 장치 상에 배열된 기준 마이크로폰을 통해 캡처된 제2신호의 신호 파워 스펙트럼 추정을 처리함으로써 실행된다.
본 방법은, 제1신호가 비정상(non-stationary) 신호 성분 또는 실질적으로 정상(stationary) 노이즈를 포함하여 구성되는 지를 결정하는 단계를 포함하여 구성된다. 제1신호가 비정상 신호 성분을 포함하여 구성되는 것이 결정되었던 경우, 제1신호가 실질적으로 파-필드 노이즈를 포함하여 구성되는 지가 결정된다.
이전 단계에서, 제1신호가 실질적으로 정상 노이즈를 포함하여 구성되는 것으로 고려되면, 제1신호의 노이즈 파워 스펙트럼 추정이 정상 노이즈 파워 스펙트럼 추정으로 갱신하는 반면, 대신 제1신호가 실질적으로 파-필드 노이즈를 포함하여 구성되는 것으로 고려되면, 제1신호가 파-필드 노이즈 파워 스펙트럼 추정으로 갱신된다.
그 다음, 추정된 노이즈 파워 스펙트럼에 기반해서 주파수 응답이 계산되고, 제1신호 상에 주파수 응답을 적용함으로써, 제1신호로부터의 노이즈가 억제된다.
제안된 방법은, 특히 정상만 아니라 비정상 노이즈를 포함하여 구성되는 노이즈를 억제하도록 적용된 개선된 노이즈 억제 방법이다.
상기된 단계는, 전형적으로, 시간 프레임 기반에서 반복되어, 노이즈의 현존하는 본성에 기반해서 주파수 억제가 항상 실행될 수 있도록 한다.
제1신호가 비정상 신호 성분을 포함하여 구성되거나 또는 실질적으로 정상 노이즈를 포함하여 구성되는 지를 결정하는 단계는, 특정 시간 프레임에 대해 결정된 제1신호의 파워 스펙트럼과 제1신호의 평균 파워 스펙트럼 간의 차이를 평가하고, 평가된 차이가 사전에 규정된 문턱을 초과하는 경우, 제1신호가 비정상 신호인 것을 결정함으로써, 달성될 수 있다.
전형적으로, 본 방법은, 제1신호에 대해 추정된 제1파워 스펙트럼과 제2신호에 대해 추정된 제2파워 스펙트럼의 비율로서 규정된 신호 파워 스펙트럼 비율을 계산하는 단계와, 제1신호가 실질적으로 정상 노이즈를 포함하여 구성되는 것으로 고려되었을 때, 파워 스펙트럼 비율이 계산된 것이 결정된 경우, 계산된 파워 스펙트럼 비율에 기반해서 인터-마이크로폰 이득 오프셋을 갱신하는 단계 또는, 제1신호가 비정상 신호 성분을 포함하여 구성되는 것으로 고려되었을 때, 파워 스펙트럼 비율이 계산된 것이 결정된 경우, 계산된 파워 스펙트럼 비율과 이전에 갱신된 인터-마이크로폰 이득 오프셋을 비교함으로써, 제1신호가 실질적으로 파-필드 노이즈를 포함하여 구성되는 지를 결정하는 단계를 포함하여 구성된다.
제1신호 내의 비정상 신호 성분의 부재를 검출함에 따라, 인터-마이크로폰 이득 오프셋을 갱신함으로써, 제1과 제2마이크로폰 간의 고유 이득 차이가 마이크로폰의 소정의 캘리브레이션(calibration)에 대한 필요 없이 보상될 수 있다.
따라서, 제안된 방법은, 갱신된 인터-마이크로폰 이득 오프셋이 사전에 규정된 마진으로 파워 스펙트럼 비율을 초과하는 것으로 결정된 경우, 제1신호가 실질적으로 파-필드 노이즈를 포함하여 구성되는 것으로 고려될 수 있다.
인터-마이크로폰 이득 오프셋의 갱신은, 예를 들어 가장 최근에 계산된 파워 스펙트럼 비율에 기반해서, 사전에-규정된 값으로 가장 최근에 계산된 인터-마이크로폰 이득 오프셋을 증분으로 증가 또는 감소시킴으로써, 증분으로 수행될 수 있어, 더 매끄러운 적용이 달성된다.
대안적인 실시형태에 따라서, 본 발명은, 2개 이상의 1차 마이크로폰 및/또는 2개 이상의 기준 마이크로폰을 구비한 통신 장치 상에 적용될 수 있다.
후자의 경우, 상기된 본 발명 단계들은 마이크로폰들의 1차 마이크로폰 및 기준 마이크로폰의 적어도 하나 이상의 조합에 대해서 반복된다. 더욱이, 1차 마이크로폰 중 하나가 지배적인 1차 마이크로폰으로서 선택된 후, 노이즈는 선택된 지배적인 1차 마이크로폰에 의해 캡처된 신호로부터 억제된다.
마이크로폰의 각각의 조합에 대해서, 파워 스펙트럼 비율의 계산 및 인터-마이크로폰 이득 오프셋의 갱신을 반복함으로써, 제안된 억제 방법의 정확성이 더 개선될 수 있다.
전형적으로 노이즈 억제는, 스펙트럼의 차감 필터에 기반해서, 필터 전달 함수를 계산하는 단계를 포함하여 구성된다.
일 실시형태에 따르면, 최소 이득이, 필터 상에 적용되는 한편, 다른 실시형태에 따르면, 다른 최소 이득이 필터 상에 대신 적용될 수 있는데, 여기서 이러한 다른 이득은, 제1신호가 실질적으로 파-필드 노이즈 또는 실질적으로 정상 노이즈를 포함하여 구성되는 것으로 고려되는 지의 각각에 의존해서, 적용 가능하다.
전형적으로, 노이즈 억제는, 최소 페이즈 방법 또는 선형 페이즈 방법 중 어느 하나에 기반해서, 필터의 필터링 계수를 계산하는 단계를 포함하여 구성된다.
다른 측면에 따르면, 기준 마이크로폰을 통해 캡처된 제1신호 및 제2신호를 처리함으로써 1차 마이크로폰을 통해 캡처된 제1신호의 노이즈를 억제하며, 2개의 마이크로폰이 상기된 방법을 위해 제한된 바와 같이 배열된, 노이즈 억제기가 제공된다.
노이즈 억제기는, 제1신호가 비정상 신호 성분 또는 실질적으로 정상 노이즈를 포함하여 구성되는 지를 결정하도록 구성된 정상성 평가 유닛과; 제1신호가 비정상 신호 성분을 포함하여 구성되는 것이 정상성 평가 유닛에 의해 결정된 경우, 제1신호가 실질적으로 파-필드 노이즈를 포함하여 구성되는 지를 결정하도록 구성된 파-필드 평가 유닛을 포함하여 구성된다.
또한, 노이즈 억제기는, 제1신호가 실질적으로 정상 노이즈를 포함하여 구성되는 것이 정상성 평가 유닛에 의해 고려되는 경우의 정상 노이즈 파워 스펙트럼 추정 또는, 제1신호가 실질적으로 파-필드 노이즈를 포함하여 구성되는 것이 고려되는 경우의 파-필드 노이즈 파워 스펙트럼 추정으로, 제1신호의 노이즈 파워 스펙트럼 추정을 갱신하도록 구성된 노이즈 파워 스펙트럼 갱신 유닛을 포함하여 구성된다.
더욱이, 노이즈 억제기는, 추정된 노이즈 파워 스펙트럼에 기반해서 주파수 응답을 계산하고, 제1신호 상에 상기 주파수 응답을 적용함으로써, 제1신호로부터 노이즈를 억제하도록 구성된 필터링 유닛을 포함하여 구성된다.
전형적으로, 신호 평가 유닛과, 파-필드 신호 평가 유닛, 노이즈 파워 스펙트럼 추정 유닛 및 필터링 유닛이 시간 프레임 기반에서 신호의 처리를 반복적으로 실행하도록 구성된다.
정상성 평가 유닛은, 특정 시간 프레임에 대해 결정된 제1신호의 파워 스펙트럼과 제1신호의 평균 파워 스펙트럼 간의 차이를 평가함으로써 그리고, 상기 차이가 사전에 규정된 문턱을 초과하는 경우, 제1신호가 비정상 신호인 것을 결정함으로써, 제1신호가 비정상 신호 성분을 포함하여 구성되거나 또는 실질적으로 정상 노이즈를 포함하여 구성되는 지를 결정하도록 구성된다.
또한, 노이즈 억제기는, 신호 파워 스펙트럼 비율을 계산하도록 구성된 파워 비율 계산 유닛과, 제1신호가 실질적으로 정상 노이즈를 포함하여 구성되는 것으로 고려되었을 때, 파워 스펙트럼 비율이 계산된 것이 신호 정상성 평가 유닛에 의해 결정된 경우, 계산된 파워 스펙트럼 비율에 기반해서 인터-마이크로폰 이득 오프셋을 갱신하도록 구성된 인터-마이크로폰 이득 오프셋 계산 유닛과, 제1신호가 비정상 신호 성분을 포함하여 구성되는 것으로 고려되었을 때, 파워 스펙트럼 비율이 계산된 것이 신호 정상성 평가 유닛에 의해 결정된 경우, 계산된 파워 스펙트럼과 갱신된 인터-마이크로폰 이득 오프셋을 비교함으로써, 제1신호가 실질적으로 파-필드 노이즈를 포함하여 구성되는 지를 결정하도록 구성된 파-필드 노이즈 파워 스펙트럼 추정 유닛을 포함하여 구성된다.
파-필드 노이즈 파워 스펙트럼 추정 유닛은, 인터-마이크로폰 이득 오프셋이 사전에 규정된 마진으로 파워 비율 계산 유닛으로부터 제공된 파워 스펙트럼 비율을 초과하는 것이 인터-마이크로폰 이득 오프셋 계산 유닛에 의해 지시된 경우, 제1신호가 실질적으로 파-필드 노이즈를 포함하여 구성되는 것으로 고려하도록 구성된다.
인터-마이크로폰 이득 오프셋 계산 유닛은, 가장 최근에 계산된 파워 스펙트럼 비율에 기반해서, 예를 들어 사전에-규정된 값으로 가장 최근에 계산된 인터-마이크로폰 이득 오프셋을 증분으로 증가 또는 감소시킴으로써, 인터-마이크로폰 이득 오프셋을 증분으로 갱신하도록 구성될 수 있다.
한편, 노이즈 억제기는, 2개 이상의 1차 마이크로폰 및/또는 2개 이상의 기준 마이크로폰을 구비할 수 있고, 파워 비율 계산 유닛 및 인터-마이크로폰 이득 오프셋 계산 유닛은, 마이크로폰들의 1차 마이크로폰 및 기준 마이크로폰의 적어도 하나의 추가적인 조합에 대한 각각의 계산을 반복하도록 구성된다.
더욱이, 노이즈 억제기는, 지배적인 1차 마이크로폰으로서, 1차 마이크로폰 중 하나를 선택하고, 선택된 지배적인 마이크로폰의 신호를 노이즈 억제를 위한 필터링 유닛에 제공하도록 구성된 선택 유닛을 포함하여 구성될 수 있다.
필터링 유닛은 스펙트럼의 차감 필터에 기반해서, 필터 전달 함수를 계산하도록 구성될 수 있다.
더욱이, 필터링 유닛은 필터 상에 최소 이득을 적용하도록 구성될 수 있다.
한편, 필터링 유닛은, 제1신호가 실질적으로 파-필드 노이즈 또는 실질적으로 정상 노이즈를 포함하여 구성되기 위해 정상 추정 유닛 및 파-필드 평가 유닛에 의해 고려되는 지에 의존해서, 필터 상에 다른 최소 이득을 적용하도록 구성될 수 있다.
상기된 실시형태와 관련된 상세한 설명 및 예들이, 이하 상세히 설명된다.
본 발명의 목적, 장점 및 효과만 아니라 형태가, 첨부된 도면과 함께 읽힐 때, 본 발명의 예시적인 실시형태의 이하의 상세한 설명으로부터 명백히 이해될 수 있는데:
도 1은 사용자가 2개의 마이크로폰을 통해 스피치 및 노이즈를 캡처하도록 구성된 통신 장치를 사용하는 시나리오의 단순화된 도면,
도 2는 적어도 2개의 마이크로폰을 통해 캡처된 노이즈를 억제하기 위한 방법을 도시한 단순화된 흐름도.
도 3은 2개의 마이크로폰을 통해 캡처된 노이즈를 억제하도록 구성된 노이즈 억제기의 단순화된 블록 방안,
도 4는, 2개 이상의 마이크로폰을 통해 스피치 및 노이즈의 캡처를 가능하게 하기 위한 도 3의 블록 방안의 부분의 변경을 나타내는 다른 단순화된 블록 방안,
도 5는 도 3의 노이즈 억제기에 대응하는 노이즈 억제기의 구성에 기반한 소프트웨어를 나타내는 단순화되 방안이다.
본 발명은 다양한 변경 및 대안을 커버하는 한편, 본 발명의 몇몇 실시형태가 도면에 보이며, 이하 상세히 설명된다. 그런데, 본 상세한 설명 및 도면은 본 발명을 본 명세서에 개시된 특정 형태로 제한하는 의도는 없다. 대신, 본 발명은, 청구된 발명의 범위가 첨부된 청구항 내에 표현되는 바와 같이, 본 발명의 정신 및 범위 내에 포함되는, 모든 변경 및 대안적인 구성을 포함하는 것을 의도한다.
단어 "포함하여 구성되는"은, 리스트된 이외의, 본 발명의 그 밖의 엘리먼트 또는 단계를 제외하지 않고, 단어 엘리먼트에 선행하는 "a" 또는 "an"은 이러한 엘리먼트의 복수의 존재를 제외하는 것을 의미하지 않는다. 소정의 참조부호는 청구항의 범위를 제한하지 않으며, 본 발명은 하드웨어 및 소프트웨어 모두를 사용해서 적어도 부분적으로 실행될 수 있으며, 다수의 "유닛" 또는 "장치"는 동일 항목의 하드웨어로 표현될 수 있다.
본 발명은 단속적인 니어-필드 스피치를 포함하여 구성되는 신호로부터 노이즈를 억제하기 위한 방법을 제안하는데, 여기서 이 신호는, 특히 파-필드 노이즈를 억제하는데 적합한 노이즈 억제기에 의해 캡처된다. 본 표현 니어-필드(near-field)는, 사운드 소스로부터 이격된 파장의 부분 내에서 연장하는 사운드 소스 주변의 스페이스의 구역으로서 규정된 음향의 필드일 수 있는데, 일반적으로 대략 1미터 정도 내로 되는 것으로 고려된다. 또한, 청취자의 관점에서, 니어-필드 구역은 사운드 필드(sound field)를 캡처하는, 청취자의 머리 또는 마이크로폰의 중심으로부터 1미터 내의 스페이스의 구역이다. 따라서, 파-필드(far-field)는 이 경계 너머의 구역으로서 규정된다.
또한, 본 발명은, 사용자로부터의 스피치를 캡처하도록 구성되고, 상기된 바와 같은 노이즈 억제 방법을 실행하기 위해 사용될 수 있는, 소정 타입의 통신 장치 상에서 실행하기 적합한 2중- 또는 다중-마이크로폰 파-필드 노이즈 억제기로서 언급될 수 있는, 노이즈 억제기를 개시한다.
본 명세서에서, 1차 마이크로폰에 의해 캡처된 마이크로폰 입력 신호는, x(t)로서 언급되는데, 스피치 s(t) 성분과 노이즈 n(t) 성분으로 이루어지는 신호로서, 규정된다:
x(t)=s(t)+n(t) (1)
여기서, 노이즈 성분은, 차례로 정상 성분
Figure 112013066869520-pct00001
과 비정상 성분
Figure 112013066869520-pct00002
으로 이루어지는 것으로 고려될 수 있다:
Figure 112013066869520-pct00003
(2)
스펙트럼의 차감 기술을 사용하는 노이즈 억제 필터의 주파수 응답
Figure 112013066869520-pct00004
은 이하와 같이 규정된다:
Figure 112013066869520-pct00005
(3)
여기서,
Figure 112013066869520-pct00006
는 노이즈 파워 스펙트럼 추정이고,
Figure 112013066869520-pct00007
는 1차 신호의 노이즈가 있는 스피치 파워 스펙트럼의 추정이다. 파라미터
Figure 112013066869520-pct00008
는 오버-차감 팩터이며, 노이즈 파워 스펙트럼 추정의 엠퍼시스(emphasis) 또는 디엠퍼시스(de-emphasis)에 대해서 허용된다.
Figure 112013066869520-pct00009
에 대한 전형적인 값은, 예를 들어 1, 2가 될 수 있다.
주파수 응답은 IFFT(Inverse Fast Fourier Transform)를 사용해서 시간 영역 FIR 필터로 변환될 수 있다:
Figure 112013066869520-pct00010
(4)
달성된 시간 영역 필터 h(z)가 노이즈가 있는 스피치 신호 x(t)에 적용되면, 노이즈가 억제된 출력 신호 y(t)가 달성될 수 있다:
Figure 112013066869520-pct00011
(5)
여기서,
Figure 112013066869520-pct00012
는 콘볼루션 연산자이다.
주파수 응답의 노이즈가 있는 스피치 파워 스펙트럼
Figure 112013066869520-pct00013
은 이용 가능한 입력 신호 x(t)에 기반해서 계산될 수 있고, 노이즈 파워 스펙트럼
Figure 112013066869520-pct00014
은 스피치 중지(speech pause) 동안 일반적으로 추정된다. 이 목적을 위해서, 스피치 활동의 검출이 수신된 신호 <!!>의 정상성의 연속적인 측정에 기반할 수 있다. 그러므로, 노이즈 스펙트럼 추정은 노이즈의 정상 부분만의 추정에 의존한다.
정상 노이즈 파워 스펙트럼의 추정
Figure 112013066869520-pct00015
은, x(t)가 정상 신호(stationary signal)로 고려될 때, x(t)의 FFT(Fast Fourier Transform)를 사용해서 달성될 수 있는데, 이하와 같이 표현된다:
Figure 112013066869520-pct00016
(6)
스펙트럼의 차감 기술의 성능을 개선하기 위해서, 정상 노이즈의 검출에 단순히 의존하는 것보다 더 양호한 노이즈 스펙트럼의 추정이 요구된다. 그러므로, 본 목적은, 1차 마이크로폰 상에 지장을 주는 신호의 비-정상성(non-stationarity)이 확인될 때, 니어-필드 스피치로부터 파-필드 노이즈를 구별하는 것이다.
제안된 노이즈 억제 방법은, 니어-필드 스피치를 캡처하기 위한 그리고 파-필드 노이즈를 둘러싸는 적어도 하나의 마이크로폰 쌍의 사용에 기반한다. 본 발명의 문맥에 있어서, 마이크로폰 쌍은, 통신 장치가 정상의 대화 위치 내에 유지될 때, 스피커 입에 비교적 근접하게 위치되어, 노이즈 및 단속적인 스피치를 캡처할 수 있도록 된, 통신 장치 상에 배열되고, 이하 1차 마이크로폰으로서 언급되는 제1마이크로폰과, 통신 장치가 정상의 대화 위치에 유지 또는 위치될 때, 사용자의 입으로부터 더 이격된 위치에서 통신 장치 상에 배열되어, 1차 마이크로폰 및 노이즈보다 낮은 신호 레벨에서 단속적인 스피치를 캡처할 수 있도록 된, 이하 기준 마이크로폰으로 언급되는 제2마이크로폰으로 이루어지는 것으로 고려된다. 결과적으로, 사용자의 입에 관한 각각의 마이크로폰의 위치는, 이들이, 구별할 수 있는 신호를 얼마나 잘 캡처할 수 있는 지를 결정한다.
전형적으로, 제안된 억제 방법은, 예를 들어 이동 전화기와 같은 포터블 핸드 휴대 통신 장치만 아니라, 정상 통신 장치를 포함하는 소정 타입의 통신 장치에 대한 사용에 적용되는데, 이는 적어도 2개의 마이크로폰이 통신 장치 상에 위치되도록 허용하여, 상기된 상태가 수행될 수 있도록 하는 것이, 적용 가능하다.
상기된 바와 같이, 마이크로폰 쌍을 구성하는 2개의 마이크로폰을 배열함으로써, 이하 더 상세히 설명되는 2개의 마이크로폰에 접속된 처리 수단이, 수신된 입력 신호에 기반해서, 니어-필드 스피치의 부재 하에서, 파-필드 노이즈를 추정하기 위해 사용될 수 있다.
하나 이상의 1차 마이크로폰 및/또는 기준 마이크로폰이 사용되면, 각각의 1차 마이크로폰은, 1차 마이크로폰을 하나로부터 각각의 기준 마이크로폰까지의 어느 것과 조합함으로써, 그리고 반대로 조합함으로써, 각각의 마이크로폰 쌍을 형성할 수 있는데, 예를 들어 각각의 조합이 1차 마이크로폰으로서 동작 가능한 제1마이크로폰 및 기준 마이크로폰으로서 동작 가능한 제2마이크로폰으로서 언급되는 한, 그리고 제안된 처리가 각각의 규정된 마이크로폰 쌍에 대해서 수행될 수 있는 양호한 노이즈 억제를 수행하기 위해서, 소정의 조합이 적용될 수 있다.
실질적으로 파-필드 노이즈로 표현되는 것으로 고려되는, 파-필드 신호와 니어-필드 신호 간의 구별이, 제안된 방법에 따라서, 1차 신호가 비정상 신호 성분을 포함하여 구성되는 것이 결정된 후, 인터-마이크로폰 파워 비율의 비교 및 주파수 영역 내의 마이크로폰 쌍의 이득 오프셋을 만듦으로써, 달성된다. 그 다음, 정상만 아니라 비정상 노이즈를 고려하도록 적용된 스펙트럼의 차감 알고리즘이, 시간-주파수 영역에서 식별된, 예를 들어 정상 노이즈, 니어-필드 스피치 또는 파-필드 노이즈인 사운드 소스의 타입에 기반해서, 1차 마이크로폰 신호로부터 파-필드 노이즈의 동적인 억제를 가능하게 하기 위해 사용된다.
기본적으로, 스펙트럼의 차감은, 전형적으로는 노이즈의 스펙트럼의 추정과 캡처된 신호의 노이즈가 있는 스피치에 기반하는, 노이즈 억제 필터의 요구된 주파수 응답의 설계에 의존한다. 노이즈가 있는 스피치 스펙트럼이 1차 마이크로폰의 입력 데이터로부터 달성될 수 있는 반면, 노이즈 스펙트럼은 스피치 동안 추정되며, 노이즈의 정상 부분만의 추정으로 이루어진다.
스펙트럼의 억제 알고리즘의 성능을 개선하는 한 방법은, 시간-주파수 영역에서 액티브로 발견되는 사운드 소스 타입의 식별을 개선함으로써, 정상 노이즈에 추가해서, 비정상 파-필드 노이즈의 검출 및 억제를 포함한다.
그러므로, 목적은, 1차 마이크로폰에 지장을 주는 신호의 비-정상성이 확인될 때, 캡처된 파-필드 노이즈를 니어-필드 스피치로부터 구별하는 것이다. 이러한 구별을 만들기 위한 처리는, 이하 상세히 설명되는 바와 같이, 주파수 영역 내의, 니어-필드 스피치의 부재 하에서 파-필드 노이즈의 존재를 검출하고, 처리 동안 이 정보를 노이즈 억제기에 제공한다.
도 1은, 본 발명에 있어서는 이동 전화기(100)인, 통신 장치의 단순화된 도면으로서, 1차 마이크로폰(102)으로부터 떨어진 위치에 배열된 하나의 기준 마이크로폰(101)을 포함하여 구성되며, 1차 마이크로폰(102)은 사용자의 입(103)에 근접하게 배열된다. 기준 마이크로폰(101) 및 1차 마이크로폰(102)을 이동 전화기(100) 상에서 서로, 스피커의 입(103)으로부터 다른 거리에 분리해서 배열함으로써, 사용자 근처의, 주변에서 기원하는, 이하 니어-필드 신호(105)로 언급되는 신호만 아니라, 이동 전화기(100)로부터 이격된, 본 명세서에서 파-필드 신호(104)로 언급되는 신호를, 상기된 방법에 따라서 2개의 마이크로폰에 의해 캡처된 신호를 처리함으로써 구별할 수 있게 된다.
자체 위치에 기인해서, 기준 마이크로폰(101)은, "니어-입" 1차 마이크로폰(102)보다 상당히 낮은 레벨로, 니어-필드 스피치(105)를 픽업(pick up)하는 한편, 이동 전화기 및 그 밖의 통신 장치의 비교적 작은 디멘전에 기인해서, 그리고 각각의 마이크로폰 쌍 간의 작은 거리에 기인해서, 파-필드 노이즈(104)가 양쪽 마이크로폰에서 기본적으로 유사한 파워 레벨로 수신된다.
스피치의 본성이 단속적이므로, 예를 들어 침묵 주기가 스피치 주기에 의해 인터럽트되는 동안, 동시에 주변 노이즈의 본성이 변하므로, 이러한 변화에 대한 적용 능력은, 얼마나 효과적으로 노이즈 억제가 될 수 있는 지에 영향을 미치게 된다. 제안된 방법은, 이러한 변화에 효과적으로 적용하기 위해, 특히 적합하다.
노이즈 억제 방법에서 개선된 정확성을 달성하는 다른 방법은, 다른 위치에서 이동 전화기(100) 상에 배열된 3개 이상의 마이크로폰을 갖는 이동 전화기(100)를 제공하는 것인데, 이 방법에서, 신호 처리는 하나 이상의 마이크로폰-쌍으로부터의 입력에 기반할 수 있다.
노이즈를 억제하기 위한 방법, 특히 통신 장치에 의해 캡처된 파-필드 노이즈를 억제하는데 적합한 방법이, 이제 도 2를 참조로 더 상세히 설명된다. 제안된 방법은, 전형적으로는 억제되는 노이즈에 대해서 신호의 각각의 시간 프레임에 대해서 전형적으로 반복되는 반복적인 처리로서 실행 가능하다.
제1단계 200에서, 이하 1차 신호로 언급되는 제1신호가 사용자의 입에 근접해서 통신 장치 상에 위치된, 1차 마이크로폰에 의해 캡처되어, 캡처된 1차 신호가 단속적인 스피치 및 노이즈를 포함하도록 된다. 더욱이, 이하 기준 신호로 언급되는 제2신호가 통신 장치 상에 위치된 기준 마이크로폰에 의해 캡처되어, 기준 신호가 1차 신호에 대해서보다 낮은 신호 레벨에서 스피치를 포함하여 구성되는 한편, 양쪽 마이크로폰에 의해 캡처된 노이즈가 비교할 수 있는 신호 레벨을 갖게 된다.
전형적으로, 기준 마이크로폰은, 또한 1차 마이크로폰의 방향과 다른 방향으로 배열되어, 1차 마이크로폰이 선택된 방향으로 배열되도록 하므로, 통신 장치의 니어-필드 내의 말하는 사람의 스피치를 효과적으로 캡처하는 한편, 기준 마이크로폰이 장치의 파-필드에 위치된 다른 사운드 소스로부터 기원하는 사운드 필드를 효과적으로 캡처하도록 하는 방향으로 배열된다.
그 다음, 제2단계 210에 나타낸 바와 같이, 2개의 캡처된 신호는 처리되어, 2개의 캡처된 신호의 각각의 신호 파워 스펙트럼
Figure 112013066869520-pct00017
Figure 112013066869520-pct00018
이 추정된다. 이어지는 단계 220에서, 2개의 신호의 파워 스펙트럼 비율,
Figure 112013066869520-pct00019
이 이하와 같이, 계산되어 기억된다:
Figure 112013066869520-pct00020
(7)
여기서,
Figure 112013066869520-pct00021
는 1차 마이크로폰의 파워 스펙트럼이고,
Figure 112013066869520-pct00022
는 기준 마이크로폰의 파워 스펙트럼이다.
하나 이상의 1차 마이크로폰 또는 하나 이상의 기준 마이크로폰이 입력 신호를 제공하기 위해서 사용되면, 신호 파워 스펙트럼 비율이 단계 220에서, 각각의 규정된 마이크로폰 쌍에 대해서 계산된다. 더욱이, 하나 이상의 1차 마이크로폰이 사용된 경우, 이들 1차 마이크로폰 중 하나는, 선택적인 단계 230에서 신호가 노이즈로부터 필터링되는 마이크로폰으로서 선택된다. 이하, 선택된 1차 마이크로폰은 지배적인 1차 마이크로폰으로서 언급된다. 지배적인 1차 마이크로폰은, 인터-마이크로폰 이득 오프셋의 영향을 감산한 후, 기준 마이크로폰 신호를 갖는 가장 큰 비교 신호 차이를 제공하는 마이크로폰을 선택함으로써 선택될 수 있다.
또 다른 단계 240에 있어서, 1차 신호가 비정상 신호 성분을 포함하여 구성되는 것으로 고려될 수 있는지 또는 신호가 실질적으로 정상 노이즈를 포함하여 구성되는 지가 결정된다. 전형적으로, 노이즈의 타입은, 각각의 시간 프레임 k에 대한 1차 신호의 신호 파워 스펙트럼
Figure 112013066869520-pct00023
가 자체의 장기간 평균값과 얼마나 다른 지를 평가함으로써 결정될 수 있다. 이는, 사전에 규정된 문턱에 대한 자체의 장기간 평균값에 의해 신호 파워 스펙트럼
Figure 112013066869520-pct00024
의 비율을 비교함으로써 결정될 수 있다. 비율이 문턱을 초과하면, 신호는 비정상으로 고려된다.
단계 240에서, 1차 신호가 실질적으로 정상 노이즈를 포함하여 구성되는 것으로 결정되면, 단계 220에서 계산된 신호 파워 스펙트럼 비율은, 단계 250a에서 나타낸 바와 같이, 인터-마이크로폰 이득 오프셋
Figure 112013066869520-pct00025
를 갱신하기 위해 사용된다.
Figure 112013066869520-pct00026
는 이하와 같이 규정될 수 있다:
Figure 112013066869520-pct00027
(8)
여기서,
Figure 112013066869520-pct00028
은 1차 마이크로폰 신호의 파워 스펙트럼인 반면,
Figure 112013066869520-pct00029
는 기준 마이크로폰 신호의 파워 스펙트럼이다. 마이크로폰 수신된 신호 간의 이득 차이가 연속적으로 갱신되어, 개별 마이크로폰 특성에 기인한 마이크로폰 이득의 변동만 아니라, 핸드 휴대 모드에서의 사용 동안 스피커의 입에 대한 통신 장치의 이동에 기인한 수신된 신호 레벨의 변동에 대해서 설명한다.
명백하게, 이득 오프셋은, 1차 신호가 정상 신호로 발견된 경우, 가장 최근에 계산된 파워 스펙트럼 비율을 사용해서 달성된다. 따라서, 스태틱 이득 오프셋(static gain offset)을 고려하는 대신, 공지된 노이즈 억제 처리에서 전형적으로 수행되며, 따라서 이득 오프셋이 마이크로폰 쌍에 의해 캡처된 사운드 필드에 동적으로 적용된다. 전형적인 시나리오에 있어서, 인터-마이크로폰 이득 오프셋은, 더 매끄러운 변화를 얻기 위해서 증분으로 갱신되는데, 여기서 이전에 갱신된 인터-마이크로폰 이득 오프셋은, 가장 최근에 계산된 파워 스펙트럼 비율에 기반해서 사전에-규정된 값으로 증분으로 증가 또는 감소한다. 이득 오프셋이 감소 또는 증가되는 주파수 밴드의 검출은, 단계 220에서 계산된 파워 스펙트럼 비율을 이전에 추정된 이득 오프셋과 비교함으로써 행해진다.
2개 이상의 마이크로폰이 사용되면, 인터-마이크로폰 이득 오프셋이 각각의 마이크로폰 쌍에 대해서 갱신된다.
또한, 단계 240에서, 1차 신호가 실질적으로 정상 노이즈를 포함하여 구성되는 것으로 결정됐으면, 1차 마이크로폰의 정상-노이즈 파워 스펙트럼
Figure 112013066869520-pct00030
또는, 하나 이상의 1차 마이크로폰이 사용되면 지배적인 1차 마이크로폰이, 단계 260a에 나타낸 바와 같이, 추정된다.
대신, 단계 240에서, 1차 신호가 비정상 신호 성분을 포함하여 구성되는 것으로 고려되면, 비정상 신호가 이어지는 단계 250b에서 나타낸 바와 같이, 실질적으로 파-필드 노이즈를 포함하여 구성되는 지를 이어지는 단계에서 결정한다. 단계 250b에서, 제1신호가 실질적으로 파-필드 노이즈를 포함하여 구성되는 것으로 결정되면, 파-필드 노이즈 파워 스펙트럼이, 이어지는 단계 260b에서 나타낸 바와 같이, 각각의 시간 프레임에 대해서 추정된다.
주파수 영역에서의 파-필드와 니어-필드 신호 간의 구별은, 예를 들어 주파수 f 주위에서 중심이 있는 각각의 주파수 밴드에 대해서, 예를 들어 단계 250b의 실행이, 각각의 평가된 시간 프레임에 대한 주파수 영역 내의 인터-마이크로폰 파워 비율과 이득 오프셋의 비교를 실행함으로써 달성될 수 있는데,
Figure 112013066869520-pct00031
(9)이면,
1차 신호는 파-필드 신호로 고려되어, 예를 들어 파-필드 노이즈가 단독으로 1차 신호에서 존재한다. 여기서, β는 계산 에러에 대한 마진을 제공하는 팩터인데, 예를 들어 3dB 마진에 대응하는 β=2로서 선택될 수 있다.
하나 이상의 마이크로폰 쌍이 사용되는 경우, 파-필드 노이즈의 존재에 관한 결정이, 다르게 적용된 마이크로폰 쌍에 기반해서, 단계 250b에서 만들어진 결정을 조합함으로써 개선될 수 있다. 이러한 조합된 결정을 수행하는 하나의 방법은, 각각의 주파수 밴드에 대해서 모든 마이크로폰 쌍에 대한 결정을 평균하는 것이다.
상기된 바와 같이, 특정된 상태 하에서만, 파-필드 노이즈 파워 스펙트럼 또는 정상 노이즈 파워 스펙트럼이 갱신되는데, 예를 들어 각각의 시간 프레임 동안 결정된 노이즈의 타입에 의존해서, 각각의 노이즈 파워 스펙트럼이 그 시간 프레임에 대해서 갱신된다.
이는, 각각의 새로운 시간 프레임에 대해서, 주파수 응답이 도출되는 파워 스펙트럼이 노이즈의 현재의 타입에 적용되도록 하기 위해 갱신되는 것을 의미한다. 그런데, 단계 250b에서, 기본적으로 파-필드 노이즈가 제1신호 내에 존재하지 않은 것으로, 예를 들어 1차 신호가 니어-필드 스피치를 포함하여 구성되는 것으로 고려되는 것이 결정되면, 노이즈 파워 스펙트럼 갱신 처리가, 단계 270에서, 이전에 갱신된 정상 노이즈 파워 스펙트럼에 기반해서 실행된다.
시간 프레임 k에 대한 1차 마이크로폰 또는 지배적인 1차 마이크로폰의 노이즈 파워 스펙트럼의 추정은, 이하와 같이 규정될 수 있다:
Figure 112013066869520-pct00032
(10)
여기서, 시간 프레임 k에서 갱신된 노이즈 파워 스펙트럼은, 이전의 시간 프레임 (k-1)에서 계산된 노이즈 스펙트럼만 아니라 시간 프레임 k에 대해서 추정된 정상 노이즈 파워 스펙트럼 및 파-필드 노이즈 파워 스펙트럼의 함수이다. 파라미터 λ는 0.9로 설정될 수 있는 유니티(unity)보다 작은 양(positive)의 붕괴 팩터이다.
파라미터
Figure 112013066869520-pct00033
은 도 2의 단계 240에서 만들어진, 1차 신호 내의 비정상 신호의 존재 상에서의 결정에 기반한다. 각각의 시간 프레임에 대해서, 파라미터
Figure 112013066869520-pct00034
은 파-필드 노이즈가 실질적으로 1차 마이크로폰 내에 존재하는 것으로 고려되면 1로 설정되고, 니어-필드 스피치가 1차 마이크로폰 내에 존재하는 것으로 고려되면, 0(zero)로 설정된다.
단계 280에서, 주파수 응답이 상기된 바와 같이 갱신되는 노이즈 파워 스펙트럼에 기반해서 계산된다.
다른 단계 290에서, 1차 신호가 필터링 유닛에 공급되는데, 여기서 주파수 응답이 1차 신호에 적용되어, 노이즈가 1차 신호로부터 효과적으로 억제되도록 한다.
상기된 바와 같이, 하나의 마이크로폰 쌍을 사용하기 위한 대안으로서, 본 방법은 복수의 마이크로폰으로부터의 입력에 기반할 수 있다. 복수의 입력 신호를 사용함으로써, 그리고 각각의 시간 순간에서 가장 대표적인 신호를 선택함으로써, 더 효과적인 노이즈 억제가 달성될 수 있다. 그 다음, 가장 지배적인 마이크로폰으로서 지정된 마이크로폰에 의해 캡처된 1차 신호가 단계 290에서 필터링되는 신호로서 사용된다.
필터링은, 스펙트럼의 차감 필터에 기반하는 필터 전달 함수를 계산함으로써, 달성될 수 있다.
노이즈 파워 스펙트럼이 각각의 시간 프레임 k 및 따라서 필터 입력 신호에 대한 스펙트럼의 차감의 주파수 응답
Figure 112013066869520-pct00035
을 계산하기 위해 사용된다:
Figure 112013066869520-pct00036
(11)
실재에 있어서, 노이즈의 랜덤한 본성 및 그 부정확한 추정에 기인해서, 식 (11)의 주파수 응답이 항상 양(positive)일 수는 없다. 그러므로, 스펙트럼의 차감 기술은, 통상 절대 바닥 레벨 또는 노이즈가 있는 스피치 신호의 파워 스펙트럼의 작은 부분으로서 설정될 수 있는 문턱을 적용한다. 노이즈 억제기의 주파수 응답은 요구된 최대 감쇠 레벨
Figure 112013066869520-pct00037
로 조정되어, 시간 프레임 k에 대한 결과적인 주파수 응답
Figure 112013066869520-pct00038
는 이하와 같이 표현될 수 있다:
Figure 112013066869520-pct00039
(12)
여기서, 요구된 최대 감쇠 레벨은, 단계 240 및 250b 각각에서 결정된 정상 노이즈
Figure 112013066869520-pct00040
또는 파-필드 노이즈
Figure 112013066869520-pct00041
의 실질적인 존재 상에서의 결정의 함수로 되는 것으로 설계될 수 있다:
Figure 112013066869520-pct00042
(13)
단계 280에 따른 주파수 응답 계산은, 주파수 응답에 대한, 전형적으로 최대 감쇠 산출의 결정을 포함한다. 상기된 바와 같이, 이러한 최대 감쇠 산출은, 최소 이득을 적용함으로써 달성될 수 있는데, 이는 필터 상에서 고려되는 주파수 밴드를 제한한다.
하나의 실시형태에 따르면, 노이즈가 정상 또는 파-필드 본성인 것으로 발견되는 지에 관계없이, 하나 및 동일한 최소 이득이 선택될 수 있다.
다른 실시형태에 따르면, 다른 최소 이득이, 1차 신호의 결정된 정상성에 의존해서 적용될 수 있다. 하나의 이러한 실현은, 이하에 따른 최소 이득의 계산에 의해 주어진다:
Figure 112013066869520-pct00043
(14)
여기서,
Figure 112013066869520-pct00044
는 정상 노이즈의 억제를 위해 적용된 최소 이득이고,
Figure 112013066869520-pct00045
는 파-필드 노이즈가 비정상 노이즈를 포함하여 구성되는 것으로 고려될 때, 파-필드 노이즈의 억제를 위해 적용된 최소 이득이다.
필터링 처리에 의해 적용된 필터링 계수는, 전형적으로 소정의 최소 페이즈 방법(minimum phase mehtod) 또는 선형 페이즈 방법(linear phase mehtod)에 기반해서 계산될 수 있다.
상기된 방법은, 적어도 하나의 1차 마이크로폰을 통해서 스피치를 캡처하도록 구성된 소정 타입의 통신 장치에 적용하기 적합하며, 적어도 하나의 제2기준 마이크로폰이 1차 마이크로폰으로부터 떨어진 위치에서 장치 상에서 실행될 수 있다. 이러한 통신 장치는, 전형적으로 셀룰러 전화기일 수 있으며, 여기서 마이크로폰 쌍을 이루는 마이크로폰은, 바람직하게는, 필수적이지 않지만, 통신 장치의 대향하는 단부 상에 위치된다.
통신 장치 상에서 실행될 때, 도 2를 참조로 상기된 바와 같이, 노이즈 감쇠 방법을 실행하기 위해 적합한 노이즈 감쇠기가, 도 3을 참조로 더 상세히 설명된다.
도 3의 노이즈 억제기(300)는, 특정 수의 마이크로폰을 위해 구성된 파워 스펙트럼 추정 유닛(310)을 포함하여 구성된다. 따라서, 하나의 마이크로폰 쌍에 대해서 적합한 구성을 위해서, 도 3에 나타낸 바와 같이, 파워 스펙트럼 추정 유닛(310)은, 1차 마이크로폰(301a)에 의해 캡처된 1차 신호의 파워 스펙트럼을 추정하도록 구성된 제1파워 스펙트럼 추정기(311a)와, 기준 마이크로폰(301b)에 의해 캡처된 기준 신호의 파워 스펙트럼을 추정하도록 구성된 제2파워 스펙트럼 추정기(311b)를 포함하여 구성된다.
제1파워 스펙트럼 추정기(311a)에 접속된 정상성 평가 유닛(320)은, 1차 신호가 비정상 신호 성분 또는 실질적으로 정상 노이즈를 포함하여 구성되는 지를 결정하도록 구성된다. 파-필드 평가 유닛(360)은, 1차 신호가 비정상 신호 성분을 포함하여 구성되는 것이 정상성 평가 유닛(320)에 의해 결정된 경우, 1차 신호가 실질적으로 파-필드 노이즈를 포함하여 구성되는 지를 결정하도록 구성된다. 결과적으로, 파-필드 평가 유닛(360)은, 1차 신호 내의 비정상 신호 성분의 존재에 의해 정상성 평가 유닛(320)에 의해 트리거된다. 상기된 바와 같이, 정상성 평가 유닛(320)은, 전형적으로 제1파워 스펙트럼 추정기(311a)로부터 액세스 가능한 파워 스펙트럼과 자체의 장기간 평균을 비교하도록 구성될 수 있다.
또한, 도 3의 노이즈 감쇠기(300)는, 각각의 파워 스펙트럼 추정에 기반해서, 예를 들어 1차 신호의 정상 노이즈 파워 스펙트럼을 추정하도록 구성된 정상 노이즈 파워 스펙트럼 추정 유닛(340) 또는, 1차 신호의 파-필드 노이즈 파워 스펙트럼을 추정하도록 구성된 파-필드 노이즈 파워 스펙트럼 추정 유닛(350)의 어느 하나로부터 제공되면, 1차 신호의 노이즈 파워 스펙트럼을 갱신하도록 구성된 노이즈 파워 스펙트럼 갱신 유닛(330)을 포함하여 구성된다. 노이즈 파워 스펙트럼 갱신 유닛(330)에 의해 사용되기 위한 어느 입력이, 정상성 평가 유닛(320)에 의해 결정되고, 파-필드 평가 유닛(360)이, 1차 신호 또는 특히 1차 신호의 파워 스펙트럼 추정에 기반해서, 1차 신호가 실질적으로 니어-필드 스피치를 포함하여 구성되지 않는 것으로 결정된 시간 프레임마다에 대해서, 정상 노이즈 파워 스펙트럼 추정 유닛(340) 또는 파-필드 노이즈 파워 스펙트럼 추정 유닛(350) 중 어느 하나를 트리거하도록 구성된다.
정상성 평가 유닛(320)에 의해, 1차 신호가 실질적으로 정상 노이즈를 포함하여 구성되는 것이 결정된 경우, 정상성 평가 유닛(320)은 정상 노이즈 파워 스펙트럼 추정 유닛(340)을 트리거해서, 정상 노이즈 파워 스펙트럼 추정을, 이 입력 데이터에 기반해서 노이즈 파워 스펙트럼을 갱신하도록 구성된 노이즈 파워 스펙트럼 갱신 유닛(330)으로 제공한다. 대신, 정상성 평가 유닛(320)이, 1차 신호가 비정상 신호 성분을 포함하여 구성되는 것을 결정하면, 1차 마이크로폰에 의해 캡처된 신호가 실질적으로 파-필드 노이즈 또는 니어-필드 스피치를 포함하여 구성되는 지를 결정하기 위해, 추가적인 기능 유닛을 트리거하도록 구성된다.
또한, 노이즈 억제기(300)는, 제1파워 스펙트럼 추정기(311a)에 의해 추정된 제1파워 스펙트럼과 제2파워 스펙트럼 추정기(311b)에 의해 추정된 제2파워 스펙트럼 사이에서, 신호 파워 스펙트럼 비율을 계산하도록 구성된, 본 명세서에서 파워 비율 계산 유닛(380)으로 언급되는, 기능 유닛을 포함하여 구성된다. 파워 비율 계산 유닛(380)은, 정상성 평가 유닛(320)에 의해 트리거될 때, 예를 들어 1차 신호가 실질적으로 정상 노이즈를 포함하여 구성되는 것으로 고려되는 것이 신호 정상성 평가기(320)에 의해 결정될 때, 파워 비율 계산 유닛(380)의 신호 파워 스펙트럼 비율에 기반해서 인터-마이크로폰 이득 오프셋을 갱신하도록 구성된, 인터-마이크로폰 이득 오프셋 계산 유닛(390)으로서 언급되는 또 다른 기능 유닛에 접속된다.
상기된 파-필드 평가 유닛(360)은, 1차 신호가 실질적으로 파-필드 노이즈를 포함하여 구성되는 지를 결정하도록 구성된다. 이러한 결정을 만드는 것을 가능하게 하기 위해서, 이러한 처리가 정상성 평가 유닛(320)에 의해 트리거되는 경우, 예를 들어 1차 신호가 비정상 신호 성분을 포함하여 구성되는 것이 정상성 평가 유닛(320)에 의해 결정된 경우, 파-필드 평가 유닛(360)은, 파워 비율 계산 유닛(380)에 의해 제공된 계산된 파워 스펙트럼 비율과 식 (9)에 따른 인터-마이크로폰 이득 오프셋 계산 유닛(390)에 의해 제공된 갱신된 인터-마이크로폰 이득 오프셋을 비교하도록 구성된다.
인터-마이크로폰 이득 오프셋 계산 유닛(390)은, 가장 최근에 계산된 인터-마이크로폰 이득 오프셋을 가장 최근에 계산된 파워 스펙트럼 비율에 기반해서 사전에-규정된 값으로, 증분으로 증가 또는 감소시킴으로써, 인터-마이크로폰 이득 오프셋을 적용하도록 구성될 수 있다.
노이즈 파워 스펙트럼 갱신 유닛(330)은, 노이즈 파워 스펙트럼 갱신 유닛(330)으로부터 제공된 추정된 노이즈 파워 스펙트럼에 기반해서 주파수 응답을 계산하고, 제1신호 상에 주파수 응답을 적용함으로써 제1신호로부터의 노이즈를 필터링하도록 구성된 필터링 유닛(370)에 접속된다. 각각의 시간 프레임에 대해서, 노이즈 파워 스펙트럼 갱신 유닛(330)은 필터링 유닛(370)에 대해서 노이즈 파워 스펙트럼 추정을 제공하도록 구성된다.
노이즈 감쇠기(300)는, 예를 들어 1차 신호의 각각의 시간 프레임에 대해서, 정상성이 신호 정상성 평가 유닛(320)에 의해 결정된, 시간 프레임에 기반해서, 필터링이 적응적으로 실행되도록 구성되고, 그 결과에 기반해서, 필터링 유닛(370)이 노이즈 파워 스펙트럼 갱신 유닛(330)으로부터의 입력에 의해 갱신되어, 도 3에 나타낸 바와 같이 필터링 유닛(370)에 제공된 1차 신호의 노이즈의 효과적인 감쇠를 제공할 수 있다. 필터링 유닛(370)은 스펙트럼의 차감 필터에 기반해서 필터 전달 함수를 계산하도록 구성될 수 있다.
도 4는 도 3에 따른 노이즈 감쇠기의 부분을 나타낸 블록 방안으로서, 여기서 도 3의 파워 스펙트럼 추정기(310)는 적용된 파워 스펙트럼 추정 유닛(410)에 의해 대체되어, 감쇠기가 2개 이상의 마이크로폰을 호스트할 수 있는 한편, 도 3의 나머지 기능들이 동일하게 유지될 수 있다.
도 4는, 분리의 파워 스펙트럼 추정기(411a, 411b, 411) 각각에 접속된 3개의 1차 마이크로폰(401a, 401b, 402c)과, 각각의 전용의 파워 추정 유닛(412a, 412b, 412c)에 접속된 3개의 기준 마이크로폰(402a, 402b, 402c)을 포함하여 구성된다. 더욱이, 파워 스펙트럼 비율 계산 유닛(380)과 인터-마이크로폰 이득 오프셋 계산 유닛(390)(도시 생략)은 각각의 선택된 마이크로폰 쌍에 대한 각각의 계산을 반복하도록 구성된다. 본 발명의 예에 있어서, 9개까지의 다른 마이크로폰 쌍이 규정되고, 입력 데이터를 노이즈 억제기에 제공하기 위해 사용될 수 있다. 예를 들어, 3개의 마이크로폰 쌍이 규정되면, 1차 마이크로폰(401a)은, 예를 들어 기준 마이크로폰(402a)을 갖는 마이크로폰 쌍을 형성하는 한편, 마이크로폰(401b 및 402b)은 제2쌍을 형성하고, 마이크로폰(401c 및 402c)은 제3마이크로폰 쌍을 형성하지만, 1차 및 기준 마이크로폰을 포함하는 소정의 가능한 조합이 적용될 수 있다.
더욱이, 파워 스펙트럼 추정 유닛(410)은, 지배적인 1차 마이크로폰으로서 1차 마이크로폰(401a, 401b, 401c) 중 하나를 선택하고, 필터링을 위한 필터링 유닛(370)에 선택된 지배적인 마이크로폰의 신호를 제공하도록 구성된 선택 유닛(420)을 구비한다.
도 3 및 도 4에 개시된 기능 유닛이 통상적인 기억 기능을 제공하여, 적합한 갱신 과정이 이전의 추정 및 계산에 기반해서만 아니라, 상기된 바와 같은 평균 측정에 기반해서 수행될 수 있도록 한 것으로, 이해된다.
더욱이, 본 기술 분야의 당업자는 본 명세서에서 제안된 유닛 및 기능이, 프로그래머블 특정 목적 마이크로프로세서 또는 일반 목적 컴퓨터 단독 또는 ASIC(Application Specific Integrated Circuit)과의 조합과 연관한 소프트웨어 기능을 사용해서 실행될 수 있는 것으로 이해한다. 또한, 본 발명이 주로 방법 및 장치의 형태를 개시하지만, 본 발명은 또한 컴퓨터 프로그램만 아니라 메모리 내에 기억되고 프로세서와 접속된 컴퓨터 프로그램을 포함하여 구성되는 시스템으로 구현될 수도 있다. 여기서, 메모리는 플래시 메모리, RAM(Random-access memory), ROM(Read-Only Memory) 또는 EEPROM(Electrically Erasable Programmable ROM) 중 어느 것일 수 있다.
하나의 실시형태에 따른 소프트웨어 기반의 노이즈 억제기는, 도 5에 나타낸 통신 장치 상에서 실행하기 적합한데, 여기서 노이즈 억제기(500)는, 상기된 바와 같은 노이즈 억제기 방법을 실행하도록 구성된 프로세서(510)를 포함하여 구성된다. 도 5의 노이즈 억제기(500)는 하나의 마이크로폰 쌍(501a, 502b)을 포함하여 구성되는데, 단순화된 도 5에는 도시되지 않으며, 전형적으로 몇몇 종류의 신호 처리 기능을 통해서, 프로세서(500)에 접속될 수 있다. 프로세서는, 노이즈 억제 컴퓨터 프로그램을 구동하도록 적용되는데, 이 컴퓨터 프로그램은 컴퓨터 판독 가능한 코드 수단을 포함하여 구성되어, 통신 장치 상에서 구동될 때, 이 장치가 도 2를 참조로 상기된 바와 같은 대응하는 방법을 실행하도록 한다. 프로세서(510)는 복수의 기능을 실행하도록 구성되는데, 이 기능은 도 5의 실시형태에 따라서 파워 스펙트럼 추정 기능(520), 파워 비율 계산 기능(530), 정상성 평가 기능(540), 파-필드 평가 기능(550), 노이즈 파워 스펙트럼 갱신 기능(560), 인터-마이크로폰 이득 오프셋 계산 기능(570), 정상 노이즈 파워 스펙트럼 추정 기능(580), 파-필드 노이즈 파워 스펙트럼 추정 기능(590) 및 필터링 기능(600)으로서 언급되며, 통신 장치 상에서 구동될 때, 파워 스펙트럼 추정 유닛(310), 파워 비율 계산 유닛(380), 정상성 평가 유닛(320), 파-필드 평가 유닛(350), 노이즈 파워 스펙트럼 갱신 유닛(330), 인터-마이크로폰 이득 오프셋 계산 유닛(390), 정상 노이즈 파워 스펙트럼 추정 유닛(340), 파-필드 노이즈 파워 스펙트럼 추정 유닛(350) 및, 필터링 유닛(370) 각각에 의해 달성된 기능성에 대응한다. 또한, 노이즈 억제기(500)는 기억 유닛(610)과, 노이즈 억제기(500)가 실행된 통신 유닛의 통상적인 신호 처리 기능(도시 생략)에 필터링된 신호를 접속하도록 구성된 접속 유닛(620)을 포함하여 구성된다.
각각의 실시형태와 연관된 상기된 유닛 및 기능은, 제안된 방법이 실행될 수 있게 하는 하나의 방법을 나타내며, 유닛 또는 기능의 다른 조합이, 상기된 바와 같은 일반적인 처리가 실행될 수 있음에 따라, 대안적으로 적용될 수 있다.
본 발명이 특정의 예시적인 실시형태를 참조로 개시되지만, 본 상세한 설명은 본 발명의 개념을 나타내려는 의도이며, 본 발명의 범위를 제한하려는 의도는 아니다. 본 발명은, 첨부된 특허청구범위에 의해 규정된다.
100 - 이동 전화기,
101 - 기준 마이크로폰,
102 - 1차 마이크로폰,
103 - 스피커의 입.

Claims (24)

  1. 통신 장치 상에 배열된 1차 마이크로폰을 통해 캡처된 제1신호의 노이즈를 억제하여, 노이즈 및 단속적인 스피치를 캡처할 수 있도록 하는 통신 장치의 방법으로서,
    노이즈 억제는, 제1신호의 신호 파워 스펙트럼 추정과 1차 마이크로폰과 동일한 신호 레벨에서 노이즈를 캡처하고, 1차 마이크로폰보다 낮은 신호 레벨에서 스피치를 캡처할 수 있도록 통신 장치 상에 배열된 기준 마이크로폰을 통해 캡처된 제2신호의 신호 파워 스펙트럼 추정을 처리함으로써 실행되고, 상기 방법이:
    - 각각의 시간 프레임에 대한 제1신호의 신호 파워 스펙트럼과 자체의 장기간 평균 값 간의 차이에 기반해서, 제1신호가 비정상 신호 성분 또는 정상 노이즈를 포함하여 구성되는 지를 결정(240)하는 단계와;
    - 적용된 인터-마이크로폰 이득 오프셋과 2개의 캡처된 신호의 파워 스펙트럼 비율 간의 비교에 기반해서, 제1신호가 비정상 신호 성분을 포함하여 구성되는 것이 결정되었던 경우, 제1신호가 니어-필드 신호 성분 또는 파-필드 노이즈를 포함하여 구성되는 지를 결정(250b)하는 단계와;
    - 제1신호가 정상 노이즈를 포함하여 구성되는 것으로 고려되면 정상 노이즈 파워 스펙트럼 추정 또는, 제1신호가 파-필드 노이즈를 포함하여 구성되는 것으로 고려되면 파-필드 노이즈 파워 스펙트럼 추정으로, 제1신호의 노이즈 파워 스펙트럼 추정을 갱신(270)하는 단계와;
    - 추정된 노이즈 파워 스펙트럼에 기반해서 노이즈 억제 필터의 주파수 응답을 계산(280)하는 단계와,
    - 상기 제1신호 상에 상기 주파수 응답을 적용함으로써, 제1신호로부터 노이즈를 억제(290)하는 단계를 포함하여 구성되고,
    제1신호가 비정상 신호 성분을 포함하여 구성되거나 또는 정상 노이즈를 포함하여 구성되는 지를 결정하는 단계는:
    - 특정 시간 프레임에 대해 결정된 제1신호의 파워 스펙트럼과 제1신호의 평균 파워 스펙트럼 간의 차이를 평가하는 단계와,
    - 상기 차이가 사전에 규정된 문턱을 초과하는 경우, 제1신호가 비정상 신호인 것을 결정하는 단계를 포함하여 구성되는 것을 특징으로 하는 방법.
  2. 제1항에 있어서,
    - 시간 프레임 기반에서 상기 단계들(240, 250b, 270, 280, 290)을 반복하는 단계를 포함하여 구성되는 것을 특징으로 하는 방법.
  3. 삭제
  4. 제1항 또는 제2항에 있어서,
    - 제1신호에 대해 추정된 제1파워 스펙트럼과 제2신호에 대해 추정된 제2파워 스펙트럼의 비율인, 신호 파워 스펙트럼 비율을 계산(220)하는 단계와,
    - 제1신호가 정상 노이즈를 포함하여 구성되는 것으로 고려되었을 때, 파워 스펙트럼 비율이 계산된 경우, 계산된 파워 스펙트럼 비율에 기반해서 인터-마이크로폰 이득 오프셋을 갱신(250a)하는 단계 또는,
    - 제1신호가 비정상 신호 성분을 포함하여 구성되는 것으로 고려되었을 때, 파워 스펙트럼 비율이 계산된 경우, 계산된 파워 스펙트럼 비율과 가장 최근에 갱신된 인터-마이크로폰 이득 오프셋을 비교함으로써, 제1신호가 파-필드 노이즈를 포함하여 구성되는 지를 결정(250b)하는 단계를 포함하여 구성되는 것을 특징으로 하는 방법.
  5. 제4항에 있어서,
    갱신된 인터-마이크로폰 이득 오프셋이 사전에 규정된 마진으로 파워 스펙트럼 비율을 초과하는 경우, 제1신호가 파-필드 노이즈를 포함하여 구성되는 것으로 고려되는 것을 특징으로 하는 방법.
  6. 제4항에 있어서,
    노이즈 파워 스펙트럼 추정을 갱신하는 단계는:
    - 가장 최근에 계산된 파워 스펙트럼 비율에 기반해서, 사전에-규정된 값으로 가장 최근에 계산된 인터-마이크로폰 이득 오프셋을 증분으로 증가 또는 감소시킴으로써, 인터-마이크로폰 이득 오프셋을 적용하는 단계를 포함하여 구성되는 것을 특징으로 하는 방법.
  7. 제1항 또는 제2항에 있어서,
    통신 장치는 2개 이상의 1차 마이크로폰 및 2개 이상의 기준 마이크로폰을 포함하여 구성되고, 상기 방법은:
    - 상기 마이크로폰들의 1차 마이크로폰 및 기준 마이크로폰의 적어도 하나 이상의 조합에 대해서 상기 단계들을 반복하는 단계와;
    - 지배적인 1차 마이크로폰으로서, 상기 1차 마이크로폰 중 하나를 선택하는 단계와;
    - 상기 지배적인 1차 마이크로폰에 의해 캡처된 신호로부터 노이즈를 억제하는 단계를 포함하여 구성되는 것을 특징으로 하는 방법.
  8. 제7항에 있어서,
    - 마이크로폰의 각각의 조합에 대해서, 파워 스펙트럼 비율의 계산 및 인터-마이크로폰 이득 오프셋의 갱신을 반복하는 단계를 포함하여 구성되는 것을 특징으로 하는 방법.
  9. 제1항에 있어서,
    노이즈 억제가:
    - 스펙트럼의 차감 필터에 기반해서, 필터 전달 함수를 계산하는 단계를 포함하여 구성되는 것을 특징으로 하는 방법.
  10. 제9항에 있어서,
    - 상기 필터 상에 최소 이득을 적용하는 단계를 포함하여 구성되는 것을 특징으로 하는 방법.
  11. 제10항에 있어서,
    제1신호가 파-필드 노이즈 또는 정상 노이즈를 포함하여 구성되는 것으로 고려되는 지의 각각에 의존해서, 상기 필터 상에 다른 최소 이득이 적용 가능한 것을 특징으로 하는 방법.
  12. 제9항 내지 제11항 중 어느 한 항에 있어서,
    노이즈 억제가:
    - 최소 페이즈 방법 또는 선형 페이즈 방법 중 어느 하나에 기반해서, 상기 필터의 필터링 계수를 계산하는 단계를 포함하여 구성되는 것을 특징으로 하는 방법.
  13. 통신 장치 상에 배열된 1차 마이크로폰(301a)을 통해 캡처된 제1신호의 노이즈를 억제하여, 노이즈 및 단속적인 스피치를 캡처할 수 있도록 한 노이즈 억제기(300)로서,
    노이즈 억제기(300)는, 제1신호의 신호 파워 스펙트럼 추정과 1차 마이크로폰(301a)과 동일한 신호 레벨에서 노이즈를 캡처하고, 1차 마이크로폰(301a)보다 낮은 신호 레벨에서 스피치를 캡처할 수 있도록 통신 장치 상에 배열된 기준 마이크로폰(301b)을 통해 캡처된 제2신호의 신호 파워 스펙트럼 추정을 처리함으로써 노이즈를 억제하도록 구성되고:
    - 각각의 시간 프레임에 대한 제1신호의 신호 파워 스펙트럼과 자체의 장기간 평균 값 간의 차이에 기반해서, 제1신호가 비정상 신호 성분 또는 정상 노이즈를 포함하여 구성되는 지를 결정하도록 구성된 정상성 평가 유닛(320)과;
    - 동적으로 적용된 인터-마이크로폰 이득 오프셋과 2개의 캡처된 신호의 파워 스펙트럼 비율 간의 비교에 기반해서, 제1신호가 비정상 신호 성분을 포함하여 구성되는 것이 결정되었던 경우, 제1신호가 니어-필드 신호 성분 또는 파-필드 노이즈를 포함하여 구성되는 지를 결정하도록 구성된 파-필드 평가 유닛(360)과;
    - 제1신호가 정상 노이즈를 포함하여 구성되는 것으로 고려되는 경우 정상 노이즈 파워 스펙트럼 추정 또는, 제1신호가 파-필드 노이즈를 포함하여 구성되는 것으로 고려되는 경우 파-필드 노이즈 파워 스펙트럼 추정으로, 제1신호의 노이즈 파워 스펙트럼 추정을 갱신하도록 구성된 노이즈 파워 스펙트럼 갱신 유닛(330)과;
    - 추정된 노이즈 파워 스펙트럼에 기반해서 주파수 응답을 계산하고, 상기 제1신호 상에 상기 주파수 응답을 적용함으로써, 제1신호로부터 노이즈를 억제하도록 구성된 필터링 유닛(370)을 포함하여 구성되고,
    신호 정상성 평가 유닛(320)은, 특정 시간 프레임에 대해 결정된 제1신호의 파워 스펙트럼과 제1신호의 평균 파워 스펙트럼 간의 차이를 평가함으로써, 그리고 상기 차이가 사전에 규정된 문턱을 초과하는 경우, 제1신호가 비정상 신호인 것을 결정함으로써, 제1신호가 비정상 신호 성분 또는 정상 노이즈를 포함하여 구성되는 지를 결정하도록 구성된 것을 특징으로 하는 노이즈 억제기.
  14. 제13항에 있어서,
    정상성 평가 유닛과, 파-필드 평가 유닛(360), 노이즈 파워 스펙트럼 추정 유닛 및 필터링 유닛(370)이, 시간 프레임 기반에서 그들의 신호 처리를 반복적으로 실행하도록 구성된 것을 특징으로 하는 노이즈 억제기.
  15. 삭제
  16. 제13항 또는 제14항에 있어서,
    - 제1신호에 대해 추정된 제1파워 스펙트럼과 제2신호에 대해 추정된 제2파워 스펙트럼의 비율인, 신호 파워 스펙트럼 비율을 계산하도록 구성된 파워 비율 계산 유닛(380)과,
    - 제1신호가 정상 노이즈를 포함하여 구성되는 것으로 고려되었을 때, 파워 스펙트럼 비율이 계산된 경우, 계산된 파워 스펙트럼 비율에 기반해서 인터-마이크로폰 이득 오프셋을 갱신하도록 구성된 인터-마이크로폰 이득 오프셋 계산 유닛(390)과,
    - 제1신호가 비정상 신호 성분을 포함하여 구성되는 것으로 고려되었을 때, 파워 스펙트럼 비율이 계산된 경우, 계산된 파워 스펙트럼과 이전에 갱신된 인터-마이크로폰 이득 오프셋을 비교함으로써, 제1신호가 파-필드 노이즈를 포함하여 구성되는 지를 결정하도록 구성된 파-필드 노이즈 파워 스펙트럼 추정 유닛(350)을 더 포함하여 구성되는 것을 특징으로 하는 노이즈 억제기.
  17. 제16항에 있어서,
    파-필드 노이즈 파워 스펙트럼 추정 유닛(350)은, 인터-마이크로폰 이득 오프셋이 사전에 규정된 마진으로 파워 비율 계산 유닛(380)으로부터 제공된 파워 스펙트럼 비율을 초과하는 것이 인터-마이크로폰 이득 오프셋 계산 유닛(390)에 의해 지시된 경우, 제1신호가 파-필드 노이즈를 포함하여 구성되는 것으로 고려하도록 구성된 것을 특징으로 하는 노이즈 억제기.
  18. 제16항에 있어서,
    인터-마이크로폰 이득 오프셋 계산 유닛(390)이, 가장 최근에 계산된 파워 스펙트럼 비율에 기반해서, 사전에-규정된 값으로 가장 최근에 계산된 인터-마이크로폰 이득 오프셋을 증분으로 증가 또는 감소시킴으로써, 인터-마이크로폰 이득 오프셋을 갱신하도록 구성된 것을 특징으로 하는 노이즈 억제기.
  19. 제16항에 있어서,
    2개 이상의 1차 마이크로폰(301a) 및 2개 이상의 기준 마이크로폰(301b)을 포함하여 구성되고, 파워 비율 계산 유닛(380) 및 인터-마이크로폰 이득 오프셋 계산 유닛(390)은, 상기 마이크로폰들의 1차 마이크로폰 및 기준 마이크로폰(301a 및 301b)의 적어도 하나의 추가적인 조합에 대한 각각의 계산을 반복하도록 구성되는 것을 특징으로 하는 노이즈 억제기.
  20. 제19항에 있어서,
    지배적인 1차 마이크로폰으로서, 상기 1차 마이크로폰 중 하나를 선택하고, 선택된 지배적인 1차 마이크로폰의 신호를 노이즈 억제를 위한 필터링 유닛(370)에 제공하도록 구성된 선택 유닛(420)을 더 포함하여 구성되는 것을 특징으로 하는 노이즈 억제기.
  21. 제13항 또는 제14항에 있어서,
    필터링 유닛(370)은 스펙트럼의 차감 필터에 기반해서, 필터 전달 함수를 계산하도록 구성되는 것을 특징으로 하는 노이즈 억제기.
  22. 제21항에 있어서,
    필터링 유닛(370)은 상기 필터 상에 최소 이득을 적용하도록 구성된 것을 특징으로 하는 노이즈 억제기.
  23. 제22항에 있어서,
    필터링 유닛(370)은, 제1신호가 파-필드 노이즈 또는 정상 노이즈를 포함하여 구성되는 것이 파-필드 평가 유닛(360)에 의해 고려되었는지에 의존해서, 상기 필터 상에 다른 최소 이득을 적용하도록 구성된 것을 특징으로 하는 노이즈 억제기.
  24. 제13항 또는 제14항에 따른 노이즈 억제기(300)를 포함하여 구성되는 것을 특징으로 하는 통신 장치.
KR1020137019664A 2010-12-29 2010-12-29 노이즈 억제 방법 및 노이즈 억제 방법을 적용하기 위한 노이즈 억제기 KR101768264B1 (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/SE2010/051493 WO2012091643A1 (en) 2010-12-29 2010-12-29 A noise suppressing method and a noise suppressor for applying the noise suppressing method

Publications (2)

Publication Number Publication Date
KR20140015309A KR20140015309A (ko) 2014-02-06
KR101768264B1 true KR101768264B1 (ko) 2017-08-14

Family

ID=46383388

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020137019664A KR101768264B1 (ko) 2010-12-29 2010-12-29 노이즈 억제 방법 및 노이즈 억제 방법을 적용하기 위한 노이즈 억제기

Country Status (8)

Country Link
US (1) US9264804B2 (ko)
EP (1) EP2659487B1 (ko)
JP (1) JP5690415B2 (ko)
KR (1) KR101768264B1 (ko)
CN (1) CN103380456B (ko)
HK (1) HK1190815A1 (ko)
IL (1) IL226415A (ko)
WO (1) WO2012091643A1 (ko)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103380456B (zh) 2010-12-29 2015-11-25 瑞典爱立信有限公司 噪声抑制方法和应用噪声抑制方法的噪声抑制器
JP2013072978A (ja) * 2011-09-27 2013-04-22 Fuji Xerox Co Ltd 音声解析装置および音声解析システム
JP5867066B2 (ja) 2011-12-26 2016-02-24 富士ゼロックス株式会社 音声解析装置
JP6031761B2 (ja) * 2011-12-28 2016-11-24 富士ゼロックス株式会社 音声解析装置および音声解析システム
WO2013164029A1 (en) * 2012-05-03 2013-11-07 Telefonaktiebolaget L M Ericsson (Publ) Detecting wind noise in an audio signal
US9264524B2 (en) 2012-08-03 2016-02-16 The Penn State Research Foundation Microphone array transducer for acoustic musical instrument
US8884150B2 (en) * 2012-08-03 2014-11-11 The Penn State Research Foundation Microphone array transducer for acoustical musical instrument
US20150365762A1 (en) * 2012-11-24 2015-12-17 Polycom, Inc. Acoustic perimeter for reducing noise transmitted by a communication device in an open-plan environment
US9237225B2 (en) 2013-03-12 2016-01-12 Google Technology Holdings LLC Apparatus with dynamic audio signal pre-conditioning and methods therefor
US9258661B2 (en) 2013-05-16 2016-02-09 Qualcomm Incorporated Automated gain matching for multiple microphones
CN104424954B (zh) * 2013-08-20 2018-03-09 华为技术有限公司 噪声估计方法与装置
US9888317B2 (en) 2013-10-22 2018-02-06 Nokia Technologies Oy Audio capture with multiple microphones
CN103854662B (zh) * 2014-03-04 2017-03-15 中央军委装备发展部第六十三研究所 基于多域联合估计的自适应语音检测方法
US9510094B2 (en) 2014-04-09 2016-11-29 Apple Inc. Noise estimation in a mobile device using an external acoustic microphone signal
CN104092802A (zh) * 2014-05-27 2014-10-08 中兴通讯股份有限公司 音频信号的消噪方法及系统
US10163453B2 (en) * 2014-10-24 2018-12-25 Staton Techiya, Llc Robust voice activity detector system for use with an earphone
US9378753B2 (en) 2014-10-31 2016-06-28 At&T Intellectual Property I, L.P Self-organized acoustic signal cancellation over a network
US10127919B2 (en) * 2014-11-12 2018-11-13 Cirrus Logic, Inc. Determining noise and sound power level differences between primary and reference channels
US9736578B2 (en) * 2015-06-07 2017-08-15 Apple Inc. Microphone-based orientation sensors and related techniques
CN105679329B (zh) * 2016-02-04 2019-08-06 厦门大学 可适应强烈背景噪声的麦克风阵列语音增强装置
WO2018127450A1 (en) * 2017-01-03 2018-07-12 Koninklijke Philips N.V. Audio capture using beamforming
US10395667B2 (en) * 2017-05-12 2019-08-27 Cirrus Logic, Inc. Correlation-based near-field detector
CN109686378B (zh) * 2017-10-13 2021-06-08 华为技术有限公司 语音处理方法和终端
US10885907B2 (en) * 2018-02-14 2021-01-05 Cirrus Logic, Inc. Noise reduction system and method for audio device with multiple microphones
JP6948609B2 (ja) * 2018-03-30 2021-10-13 パナソニックIpマネジメント株式会社 騒音低減装置
CN110875054B (zh) * 2018-08-31 2023-07-25 阿里巴巴集团控股有限公司 一种远场噪声抑制方法、装置和系统
US11011182B2 (en) * 2019-03-25 2021-05-18 Nxp B.V. Audio processing system for speech enhancement
CN111970014B (zh) * 2020-08-10 2022-06-14 紫光展锐(重庆)科技有限公司 信号的噪声估计方法及相关产品

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020193130A1 (en) * 2001-02-12 2002-12-19 Fortemedia, Inc. Noise suppression for a wireless communication device
JP2005051761A (ja) * 2003-07-11 2005-02-24 Asahi Kasei Microsystems Kk 音声信号処理装置、音声信号処理方法及びプログラム

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2962572B2 (ja) 1990-11-19 1999-10-12 日本電信電話株式会社 雑音除去装置
SE505156C2 (sv) 1995-01-30 1997-07-07 Ericsson Telefon Ab L M Förfarande för bullerundertryckning genom spektral subtraktion
JP3434215B2 (ja) 1998-02-20 2003-08-04 日本電信電話株式会社 収音装置,音声認識装置,これらの方法、及びプログラム記録媒体
US6549586B2 (en) 1999-04-12 2003-04-15 Telefonaktiebolaget L M Ericsson System and method for dual microphone signal noise reduction using spectral subtraction
JP2001159899A (ja) * 1999-12-01 2001-06-12 Matsushita Electric Ind Co Ltd 騒音抑圧装置
CA2354808A1 (en) * 2001-08-07 2003-02-07 King Tam Sub-band adaptive signal processing in an oversampled filterbank
WO2007059255A1 (en) 2005-11-17 2007-05-24 Mh Acoustics, Llc Dual-microphone spatial noise suppression
US7099821B2 (en) 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
US8345890B2 (en) * 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8744844B2 (en) * 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US9966085B2 (en) * 2006-12-30 2018-05-08 Google Technology Holdings LLC Method and noise suppression circuit incorporating a plurality of noise suppression techniques
CN103137139B (zh) * 2008-06-30 2014-12-10 杜比实验室特许公司 多麦克风语音活动检测器
US8401178B2 (en) * 2008-09-30 2013-03-19 Apple Inc. Multiple microphone switching and configuration
US8724829B2 (en) * 2008-10-24 2014-05-13 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coherence detection
US8229126B2 (en) * 2009-03-13 2012-07-24 Harris Corporation Noise error amplitude reduction
JP2011191668A (ja) 2010-03-16 2011-09-29 Sony Corp 音声処理装置、音声処理方法およびプログラム
WO2011133924A1 (en) * 2010-04-22 2011-10-27 Qualcomm Incorporated Voice activity detection
CN103380456B (zh) 2010-12-29 2015-11-25 瑞典爱立信有限公司 噪声抑制方法和应用噪声抑制方法的噪声抑制器

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020193130A1 (en) * 2001-02-12 2002-12-19 Fortemedia, Inc. Noise suppression for a wireless communication device
JP2005051761A (ja) * 2003-07-11 2005-02-24 Asahi Kasei Microsystems Kk 音声信号処理装置、音声信号処理方法及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
박윤식 외 4명, ‘Soft decision 기반의 새로운 동시 통화 검출 알고리즘’, 제27회 음성통신 및 신호처리 학술대회, Vol.27, No.1, 2010년 8월.*

Also Published As

Publication number Publication date
WO2012091643A1 (en) 2012-07-05
JP2014504743A (ja) 2014-02-24
EP2659487B1 (en) 2016-05-04
KR20140015309A (ko) 2014-02-06
IL226415A0 (en) 2013-07-31
EP2659487A4 (en) 2013-12-18
US9264804B2 (en) 2016-02-16
HK1190815A1 (zh) 2014-07-11
CN103380456A (zh) 2013-10-30
JP5690415B2 (ja) 2015-03-25
EP2659487A1 (en) 2013-11-06
US20130272540A1 (en) 2013-10-17
IL226415A (en) 2016-04-21
CN103380456B (zh) 2015-11-25

Similar Documents

Publication Publication Date Title
KR101768264B1 (ko) 노이즈 억제 방법 및 노이즈 억제 방법을 적용하기 위한 노이즈 억제기
US9966067B2 (en) Audio noise estimation and audio noise reduction using multiple microphones
US9467779B2 (en) Microphone partial occlusion detector
US9082391B2 (en) Method and arrangement for noise cancellation in a speech encoder
US9100756B2 (en) Microphone occlusion detector
US10848887B2 (en) Blocked microphone detection
KR102081568B1 (ko) 주변 잡음 실효치(rms) 검출기
EP2973557B1 (en) Acoustic echo mitigation apparatus and method, audio processing apparatus and voice communication terminal
US8965757B2 (en) System and method for multi-channel noise suppression based on closed-form solutions and estimation of time-varying complex statistics
CN106486135B (zh) 近端语音检测器、语音系统、对语音进行分类的方法
US20070230712A1 (en) Telephony Device with Improved Noise Suppression
KR20190085924A (ko) 빔 조향
JP2014232331A (ja) アダプティブ・インテリジェント・ノイズ抑制システム及び方法
KR20120028347A (ko) 어쿠스틱 다중?채널 캔슬레이션
KR20130085421A (ko) 음성 활동 검출 시스템, 방법, 및 장치
EP1252796A1 (en) System and method for dual microphone signal noise reduction using spectral subtraction
EP0681730A1 (en) Transmitted noise reduction in communications systems
US9330677B2 (en) Method and apparatus for generating a noise reduced audio signal using a microphone array
KR20010043833A (ko) 스펙트럼 종속 지수 이득 함수 평균화를 이용한 스펙트럼공제에 의한 신호 잡음 저감
US9406309B2 (en) Method and an apparatus for generating a noise reduced audio signal
JP2020504966A (ja) 遠距離音の捕捉
CN109308907B (zh) 单信道降噪
Wada et al. Enhancement of residual echo for improved frequency-domain acoustic echo cancellation
Jin et al. Parametric multichannel noise reduction algorithm utilizing temporal correlations in reverberant environment
Sugiyama et al. Two-stage dereverberation with integrated reverberation and noise estimation

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
GRNT Written decision to grant