KR20070037439A - 바크 대역 위너 필터링 및 변형된 도블링거 잡음 추정에기반한 잡음 억제 - Google Patents

바크 대역 위너 필터링 및 변형된 도블링거 잡음 추정에기반한 잡음 억제 Download PDF

Info

Publication number
KR20070037439A
KR20070037439A KR1020067024494A KR20067024494A KR20070037439A KR 20070037439 A KR20070037439 A KR 20070037439A KR 1020067024494 A KR1020067024494 A KR 1020067024494A KR 20067024494 A KR20067024494 A KR 20067024494A KR 20070037439 A KR20070037439 A KR 20070037439A
Authority
KR
South Korea
Prior art keywords
noise
circuit
estimate
band
signal
Prior art date
Application number
KR1020067024494A
Other languages
English (en)
Other versions
KR100851716B1 (ko
Inventor
사무엘 폰바르마 에벤에셀
Original Assignee
어쿠스틱 테크놀로지스, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 어쿠스틱 테크놀로지스, 인코포레이티드 filed Critical 어쿠스틱 테크놀로지스, 인코포레이티드
Publication of KR20070037439A publication Critical patent/KR20070037439A/ko
Application granted granted Critical
Publication of KR100851716B1 publication Critical patent/KR100851716B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)

Abstract

잡음 억제기에서, 입력 신호는 이산 푸리에 분석에 의해 주파수 영역으로 변환되고 바크 대역으로 분할된다. 각 대역(85)에 대한 잡음이 추정된다. 잡음을 추정하는 회로는 말하는 동안보다 잡음이 있는 동안 잡음 추정치를 업데이트하는 느린 시정수를 갖는 평활화 필터를 포함한다. 잡음 억제기는 또한 입력 신호의 각 프레임의 신호대 잡음비에 반비례하게 잡음 억제 인자(89)를 조정하는 회로를 포함한다. 잡음 추정치는 각 대역의 신호로부터 차감된다. 이산 푸리에 역변환은 신호를 다시 시간 영역으로 변환하고, 중첩 및 조합된 윈도우가 처리중에 발생할 수 있었던 아티팩트를 제거한다.

Description

바크 대역 위너 필터링 및 변형된 도블링거 잡음 추정에 기반한 잡음 억제{NOISE SUPPRESSION BASED ON BARK BAND WEINER FILTERING AND MODIFIED DOBLINGER NOISE ESTIMATE}
본 발명은 오디오 신호 처리에 관한 것으로, 특히 잡음을 줄이기 위해 스펙트럼 차감을 이용하는 회로에 관한 것이다.
여기서 사용되는 바와 같이, "전화"는 인가된 서비스 제공자로부터의 발신음을 직접 또는 간접적으로 이용하는 통신 장치에 대한 일반 용어이다. 이와 같이, "전화"는 그 중에서도 특히 탁상 전화(도 1 참고), 무선 전화(도 2 참고), 스피커폰(도 3 참조), 핸즈프리 키트(도 4 참고) 및 셀룰러폰(도 5 참고)을 포함한다. 간소화를 위해, 본 발명은 전화와 관련하여 설명되지만, 예를 들어 무선 주파수 트랜시버나 인터컴 등 발신음을 이용하지 않는 통신 장치와 같이 더 넓은 유틸리티를 갖는다.
전화 시스템에는 많은 잡음 소스가 있다. 어떤 잡음은 원래 가청음인 반면, 다른 잡음 소스는 전자, 예를 들어 전화망이다. 여기서 사용된 바와 같이, "잡음"은 주기적이든, 순전히 랜덤하든 또는 어딘가 중간에 있든 임의의 불필요한 소음을 말한다. 이와 같이, 잡음은 배경음, 원하는 화자 이외의 다른 사람들의 음성, 타 이어 소음, 바람소리 등을 포함한다. 자동차는 특히 시끄러운 환경에 있을 수 있으며, 이는 본 발명을 핸즈프리 키트에 특히 유용하게 한다.
넓게 정의하면, 잡음은 화자의 음성 에코를 포함할 수 있었다. 그러나 전화 시스템에서 에코 상쇄는 개별적으로 취급되고 두 채널에서의 신호 비교를 수반한다. 본 발명은 잡음 억제에 관련되며, 이는 장치가 단일 채널에서 실시간으로 동작함을, 즉 에코 상쇄에서와 같이 지연을 계산하지 않는다는 것을 의미한다.
보편적으로 따르는 것은 아니지만, 종래 기술은 일반적으로 차감에 의한 잡음 "억제" 및 감쇄에 의한 잡음 "감소"와 관련된다. 여기서 사용되는 바와 같이, 잡음 억제는 한 신호에서 다른 신호를 차감하여 잡음의 양을 줄이는 것을 포함한다.
당업자들은 아날로그 신호가 일단 디지털 형태로 변환되면, 이어지는 모든 동작이 적절히 프로그래밍된 하나 이상의 마이크로프로세서에서 일어날 수 있다는 점을 인지하고 있다. 예를 들어 "신호"라는 단어의 사용은 반드시 아날로그 신호나 디지털 신호를 의미하는 것은 아니다. 메모리 내의 데이터, 심지어 단일 비트도 신호일 수 있다.
프로그래밍 의미에서 "효율"은 함수를 실행하는데 필요한 명령의 수이다. 많은 명령보다 소수의 명령이 보다 더 효율적이다. 기계(어셈블리) 언어 외의 언어에서, 코드 라인은 수백 개의 명령을 포함할 수 있다. 여기서 사용된 바와 같이, 단위 시간당 실행될 수 있는 명령의 수가 동작이나 어떤 함수를 실행하는데 얼마나 오래 걸리는지를 결정하기 때문에 "효율"은 코드 라인이 아니라 기계 언어 명 령에 관련된다.
"바크 대역" 또는 "바크 스케일"은 인간의 청각 시스템이 일련의 대역 통과 필터와 유사한 일반적으로 허용되는 인간의 청각 모델을 말한다. 이러한 필터의 대역폭은 주파수에 따라 증가하고 주파수 인식 정확도는 주파수 증가에 따라 감소한다. 대역을 계산하기 위한 약간 다른 몇 가지 공식이 공지되어 있다. 바크 스케일은 24개의 대역을 포함하며, 전화 시스템의 대역폭은 정상적인 인간의 전체 청각 범위보다 좁기 때문에 이들 18개의 하위 대역만이 발명에 사용된다. 다른 애플리케이션에서 발명을 구현하기 위해 다른 대역 및 대역폭이 대신 사용될 수 있다.
종래 기술에서, 잡음 전력의 추정은 계산상으로 집약적이어서, 빠른 계산 또는 계산을 완료하기에 충분한 시간을 요한다. 빠른 계산은 높은 클록 레이트 및 배터리 작동 장치에서 특히 원하는 것보다 많은 전력을 필요로 한다. 계산에 너무 많은 시간이 걸리면 계산 동안 입력 신호가 상당히 변하기 때문에 에러가 발생할 수 있다.
따라서 상술한 관점에서, 본 발명의 목적은 전화기나 다른 통신 장치에서 잡음 억제를 위한 보다 효율적인 시스템을 제공하는 것이다.
본 발명의 다른 목적은 종래 기술의 시스템만큼 또는 더욱 우수하게 수행하는 잡음 억제를 위한 효율적인 시스템을 제공하는 것이다.
본 발명의 또 다른 목적은 종래 기술의 회로보다 왜곡이 적은 잡음 억제 회로를 제공하는 것이다.
상술한 목적은 입력 신호가 이산 푸리에 분석에 의해 주파수 영역으로 변환되고 바크 대역으로 분할되는 본 발명으로 달성된다. 각 대역에 대해 잡음이 추정된다. 잡음을 추정하는 회로는 말하는 동안보다 잡음이 있는 동안 잡음 추정을 업데이트하기 위한 느린 시정수를 갖는 평활화 필터를 포함한다. 잡음 억제기는 입력 신호의 각 프레임의 신호대 잡음비에 반비례하여 잡음 억제 인자를 조정하는 회로를 더 포함한다. 잡음 추정치는 각 대역의 신호로부터 차감된다. 이산 푸리에 역변환은 신호를 다시 시간 영역으로 변환하며, 중첩 및 조합된 윈도우가 처리중에 발생할 수 있었던 아티팩트(artifacts)를 제거한다.
첨부 도면과 관련하여 다음의 상세한 설명을 고려함으로써 발명의 보다 완벽한 이해를 구할 수 있다.
도 1은 탁상 전화의 사시도이다.
도 2는 무선 전화의 사시도이다.
도 3은 회의용 전화 또는 스피커폰의 사시도이다.
도 4는 핸즈프리 키트의 사시도이다.
도 5는 셀룰러폰의 사시도이다.
도 6은 전화기에서 오디오 처리 회로의 일반 블록도이다.
도 7은 본 발명의 바람직한 실시예에 따라 구성된 잡음 억제기의 블록도이다.
도 8은 본 발명에 따라 구성된 잡음 계산 회로의 블록도이다.
도 9는 본 발명에 따라 변형된 도블링거 잡음 추정을 계산하는 프로세스를 설명하는 흐름도이다.
도 10은 잡음에서 음성의 존재 또는 부재를 추정하고 그에 따라 이득 계수를 설정하는 프로세스를 설명하는 흐름도이다.
신호는 아날로그 또는 디지털일 수 있기 때문에, 블록도는 하드웨어, 소프트웨어, 예를 들어 흐름도, 또는 하드웨어와 소프트웨어의 결합으로 해석될 수 있다. 마이크로프로세서의 프로그래밍은 개별적으로 또는 그룹으로 당업자의 능력 내에서 적절하다.
본 발명은 내부적 전자공학은 본질적으로 동일하지만 장치의 외관이 다른 많은 애플리케이션에서 용도를 찾는다. 도 1은 베이스(10), 키패드(11), 디스플레이(13) 및 핸드셋(14)을 포함하는 탁상 전화를 나타낸다. 도 1에 나타낸 바와 같이, 전화기는 스피커(15)와 마이크(16)를 포함하는 스피커폰 능력이 있다. 도 2에 나타낸 무선 전화는 베이스(20) 및 핸드셋(21)이 코드 대신 안테나(23, 24)를 통해 무선 주파수 신호로 연결된다는 점을 제외하고 비슷하다. 핸드셋(21)을 위한 전력은 핸드셋이 거치대(2)에 얹혀 있을 때 베이스(20)에 있는 단자(26, 27)를 통해 충전되는 (도시하지 않은) 내부 배터리에 의해 공급된다.
도 3은 사무실에서 볼 수 있는 것과 같은 회의용 전화 또는 스피커폰을 나타낸다. 전화기(30)는 조각된 케이스 안에 마이크(31) 및 스피커(32)를 포함한다. 전화기(30)는 마이크(34, 35)와 같이 여러 개의 마이크를 구비하여, 미국 특허 5,138,651호(Sudo)에 개시된 바와 같이 에코 거부 또는 잡음 거부를 위해 여러 개의 입력을 제공하거나 음성 수신을 개선할 수 있다.
도 4는 도 5에 나타낸 셀룰러폰에 대한 오디오 결합을 제공하는 핸즈프리 키트로 알려진 것을 나타낸다. 핸즈프리 키트는 다양하게 구현되지만, 일반적으로 차량의 액세서리 콘센트나 담배 라이터 소켓에 맞는 플러그(37)에 부착된 전원 스피커(36)를 포함한다. 또한, 핸즈프리 키트는 플러그(39)에서 끝나는 케이블(38)을 포함한다. 플러그(39)는 셀룰러폰(42)의 소켓(41)(도 5)과 같이 셀룰러폰의 핸드셋 소켓에 맞는다. 어떤 키트는 무선 전화처럼 RF 신호를 사용하여 전화에 연결된다. 또한, 핸즈프리 키트는 일반적으로 볼륨 제어 및 예를 들어 "훅을 들어" 전화에 응답하기 위한 어떤 제어 스위치를 포함한다. 또한, 핸즈프리 키트는 일반적으로 키트에 접속하는 (도시하지 않은) 바이저 마이크를 포함한다. 본 발명에 따라 구성되는 오디오 처리 회로가 핸즈프리 키트나 셀룰러폰에 포함될 수 있다.
다양한 형태의 전화기는 모두 본 발명으로부터 이익을 얻을 수 있다. 도 6은 셀룰러폰의 주요 구성요소의 블록도이다. 통상적으로, 블록들은 지시된 기능을 구현하는 집적 회로에 대응한다. 마이크(51), 스피커(52) 및 키패드(53)가 신호 처리 회로(54)에 연결된다. 회로(54)는 다수의 기능을 수행하며, 기술분야에서는 제조사마다 다른 여러 가지 명칭으로 알려져 있다. 예를 들어, Infineon은 회로(54)를 "단일 칩 기저대역 IC"라 한다. QualComm은 회로(54)를 "이동국 모뎀"이라 한다. 여러 다른 제조사로부터의 회로들은 세부적으로는 명백히 다르지만, 일반적으로는 지시된 기능들이 포함된다.
셀룰러폰은 가청 주파수 및 무선 주파수 회로를 모두 포함한다. 듀플렉서(55)가 안테나(56)를 수신 프로세서(57)에 연결한다. 듀플렉서(55)는 안테나(56)를 전력 증폭기(58)에 연결하고 송신중에는 수신 프로세서(57)를 전력 증폭기에서 분리한다. 송신 프로세서(59)는 회로(54)로부터의 오디오 신호로 무선 주파수 신호를 변조한다. 스피커폰과 같은 비-셀룰러 애플리케이션에는, 다소 간소화될 수 있는 무선 주파수 회로 및 신호 프로세서(54)가 없다. 에코 상쇄 및 잡음의 문제가 여전하며 오디오 프로세서(60)에서 다뤄진다. 본 발명을 포함하도록 변형되는 것이 오디오 프로세서(60)이다.
가장 최신의 잡음 감소 알고리즘은 스펙트럼 감산으로 알려진 기술에 기반한다. 깨끗한 음성 신호가 부가적인 비상관 잡음 신호에 의해 훼손된다면, 잡음이 있는 음성 신호는 단순히 신호들의 합이다. 잡음 소스의 전력 스펙트럼 밀도(PSD)가 완벽하게 알려진다면, 이는 위너 필터를 이용하여 잡음이 있는 음성 신호로부터 차감되어 깨끗한 음성을 발생시킬 수 있으며, J.S. Lim 및 A.V. Oppenheim, "잡음이 있는 음성의 강화 및 대역폭 압축" Proc. IEEE, vol. 67, pp. 1586-1604(1979년 12월)를 참고한다. 보통은, 잡음 소스가 알려져 있지 않으므로 스펙트럼 차감 알고리즘의 중요한 요소는 잡음 신호의 전력 스펙트럼 밀도(PSD)의 추정이다.
스펙트럼 차감을 이용한 잡음 감소는 다음과 같이 기재될 수 있다.
P s (f) = P x (f) - P n (f)
P s (f)는 음성의 전력 스펙트럼이고, P x (f)는 잡음이 있는 음성의 전력 스펙트럼이 며, P n (f)는 잡음의 전력 스펙트럼이다. 감산 프로세스의 주파수 응답은 다음과 같이 기재될 수 있다.
Figure 112006085607848-PCT00001
Figure 112006085607848-PCT00002
는 잡음 추정치의 스펙트럼 밀도이고 β는 부대역 신호대 잡음비에 기초한 스펙트럼 가중 인자이다. 깨끗한 음성 추정치는 다음 식에 의해 얻어진다.
Y(f) = X(f)H(f)
단일 채널 잡음 억제 시스템에서, 잡음 신호의 PSD는 잡음이 있는 음성 신호 자체로부터 추정되며, 잡음이 있는 음성 신호는 이용 가능한 유일한 신호이다. 대부분, 잡음 추정은 정확하지 않다. 따라서 부정확한 잡음 추정을 야기하는 왜곡을 줄이기 위한 프로세스에서 어떤 조정이 이루어질 필요가 있다. 이러한 이유로, 대부분의 잡음 억제 방법은 낮은 신호대 잡음비(S/N)를 갖는 주파수는 감쇄되고 높은 S/N을 갖는 주파수는 변경되지 않도록 스펙트럼 가중 인자를 제어하는 파라미터 β를 도입한다.
도 7은 본 발명의 바람직한 실시예에 따라 구성된 잡음 억제기와 관련된 오디오 프로세서(60)의 일부 블록도이다. 오디오 프로세서(60)는 잡음 억제 외에도 에코 상쇄, 추가 필터링, 및 본 발명과 관련이 없는 다른 기능을 포함한다. 다음 설명에서, 제목의 번호는 도 7의 블록에 관련된다. 라인 입력(66)과 스피커 출력(68) 사이의 점선(79)으로 나타낸 수신 채널에 제 2 잡음 억제 회로가 연결될 수도 있다.
71 - 분석 윈도우
정보 블록들을 처리함으로써 잡음 감소 프로세스가 수행된다. 블록의 크기는 예를 들어 128개의 샘플이다. 본 발명의 일 실시예에서, 입력 프레임 크기는 32개의 샘플이다. 그러므로 입력 데이터는 처리를 위해 버퍼링되어야 한다. 입력 데이터를 윈도윙(windowing)하기 전에 128 워드 크기의 버퍼가 사용된다.
버퍼링된 데이터는 윈도윙 되어 주파수 영역에서의 블록 처리에 의해 유입된 아티팩트를 줄인다. 다른 윈도우 옵션이 이용 가능하다. 윈도우 선택은 다른 인자들, 즉 메인 로브 폭, 사이드 로브 레벨 및 중첩 크기에 기초한다. 전처리에 사용되는 윈도우 타입은 메인 로브 폭 및 사이드 로브 레벨에 영향을 준다. 예를 들어, 해닝(Hanning) 윈도우는 직사각형 윈도우에 비해 넓은 메인 로브 및 낮은 사이드 로브 레벨을 갖는다. 여러 타입의 윈도우가 기술분야에 공지되어 있으며, 이득 및 평활화 계수와 같은 일부 파라미터를 적당히 조정하여 사용될 수 있다.
주파수 영역 처리에 의해 유입된 아티팩트는 보다 작은 중첩이 사용된다면 더욱 악화된다. 그러나 보다 큰 중첩이 사용된다면 계산상의 요건이 늘어나게 될 것이다. 합성 윈도우의 사용은 재구성 단계에서 유입된 아티팩트를 감소시킨다. 상기의 모든 인자를 고려하여, 각각 25% 중첩되는 평탄한 사다리꼴 분석 윈도우 및 평탄한 사다리꼴 합성 윈도우가 사용된다. 128-점 이산 푸리에 변환의 경우, 25% 중첩은 이전 프레임으로부터의 마지막 32개 샘플이 현재 프레임에 대한 최초(가장 오래된) 32개의 샘플로서 사용된다는 것을 의미한다.
중첩 크기 D는 (2·D ana - D syn )과 같다. D ana 가 24와 같고 D syn 이 16과 같다면, D = 32이다. 분석 윈도우 W ana (n)는 다음과 같이 주어진다.
Figure 112006085607848-PCT00003
0 ≤ n < D ana ,
1 D ana n < 128 - D ana ,
Figure 112006085607848-PCT00004
128 - D ana n < 128
합성 윈도우 W syn (n)은 다음과 같이 주어진다.
0 0 ≤ n < (D ana - D syn ),
Figure 112006085607848-PCT00005
(D ana - D syn ) ≤ n < D ana
1 D ana n < 128 - D ana
Figure 112006085607848-PCT00006
128 - D ana n < 128 - (D ana - D syn )
0 128 - (D ana - D syn ) ≤ n < 128
중간 간격은 두 윈도우 모두 동일하다. 완벽한 재구성을 위해, 분석 윈도우 및 합성 윈도우는 다음 조건을 만족한다.
0 ≤ n < D의 구간에서는
W ana (n)W syn (n) + W ana (n + 128 - D)W syn (n + 128 - D) = 1
Dn < 96의 구간에서는
W ana (n)W syn (n) = 1
버퍼링된 데이터는 다음의 분석 윈도우를 이용하여 윈도윙되며, x(m,n)은 프레임(m)에서 버퍼링된 데이터이다.
x w (m,n) = x(m,n)*W ana (n)
72 - 순방향 이산 푸리에 변환( DFT )
윈도윙된 시간 영역 데이터는 다음 변환식으로 주어진 이산 푸리에 변환을 이용하여 주파수 영역으로 변환된다.
Figure 112006085607848-PCT00007
여기서 x w (m,k)는 프레임(m)에서 윈도윙된 시간 영역 데이터이고, X(m,k)는 프레임(m)에서 변환된 데이터이며, N은 DFT 크기이다. 입력된 시간 영역 데이터는 실수이므로, DFT의 출력은 N/2 인자로 정규화된다.
74 - 주파수 영역 처리
잡음 억제 회로의 주파수 응답이 계산되며, 도 8의 블록도에 나타낸 여러 가 지 양상을 갖는다. 다음 설명에서, 제목의 번호는 도 8의 블록을 참조한다.
81 - 전력 스펙트럼 밀도( PSD ) 추정
잡음이 있는 음성의 전력 스펙트럼 밀도는 다음과 같이 정의된 1차 순환 필터를 이용하여 근사화된다.
여기서 P x (m,k)는 프레임(m)에서 잡음이 있는 음성의 전력 스펙트럼 밀도이고, P x (m-1,k)는 프레임(m-1)에서 잡음이 있는 음성의 전력 스펙트럼 밀도이다. |X(m,k)|2은 프레임(m)에서 잡음이 있는 음성의 크기 스펙트럼이고, k는 주파수 인덱스이다. ε s 는 스펙트럼 평활화 계수이다.
82 - 바크 대역 에너지 추정
잡음 감소 프로세스 도중 유입되는 스펙트럼 아티팩트를 감소시키기 위해 부대역 기반 신호 분석이 수행된다. 부대역은 인간의 귀의 지각력을 모델화하는 ("임계 대역"이라고도 하는) 바크 대역에 기반한다. 협대역 음성 스펙트럼에서 바크 대역의 중간 주파수 및 대역 에지가 다음 표에 나타난다.
대역 번호 범위(㎐) 중간 주파수(㎐)
1 0-100 50
2 100-200 150
3 200-300 250
4 300-400 350
5 400-510 450
6 510-630 570
7 630-770 700
8 770-920 840
9 920-1080 1000
10 1080-1270 1175
11 1270-1480 1370
12 1480-1720 1600
13 1720-2000 1850
14 2000-2320 2150
15 2320-2700 2500
16 2700-3150 2900
17 3150-3700 3400
18 3700-4400 4000
잡음이 있는 음성 프레임의 DFT는 17개의 바크 대역으로 분할된다. 128-점 DFT의 경우, 각 바크 대역에 대응하는 스펙트럼 빈 번호는 다음 표에 나타난다.
대역 번호 주파수 범위(㎐) 스펙트럼 빈 번호 지점 개수
1 0-125 0,1,2 3
2 187.5-250 3,4 2
3 312.5-375 5,6 2
4 437.5-500 7,8 2
5 562.5-625 9,10 2
6 687.5-750 11,12 2
7 812.5-875 13,14 2
8 937.5-1062.5 15,16,17 3
9 1125-1250 18,19,20 3
10 1312.5-1437.5 21,22,23 3
11 1500-1687.5 24,25,26,27 4
12 1750-2000 28,29,30,31,32 5
13 2062.5-2312.5 33,34,35,36,37 5
14 2375-2687.5 38,39,40,41,42,43 6
15 2750-3125 44,45,46,47,48,49,50 7
16 3187.5-3687.5 51,52,53,54,55,56,57,58,59 9
17 3750-4000 60,61,62,63,64 5
각 바크 대역에서 잡음이 있는 음성의 에너지는 다음과 같이 계산된다.
Figure 112006085607848-PCT00009
각 바크 대역에서 잡음의 에너지는 다음과 같이 계산된다.
Figure 112006085607848-PCT00010
여기서 f H (i) 및 f L (i)는 바크 대역(i)에서 각각 최고 및 최저 주파수에 대응하는 스펙트럼 빈 번호이고, P x (m,k) 및 P n (m,k)는 각각 잡음이 있는 음성 및 잡음 추정치의 전력 스펙트럼 밀도이다.
84 - 잡음 추정
라이너 마틴(Rainer Martin)은 최소 통계에 기반한 잡음 추정의 초기 제안자였으며, "최소 통계에 기반한 스펙트럼 차감" Proc. 제 7 회 유럽 신호 처리 컨퍼런스, EUSIPCO-94(1994년 9월 13일-16일), pp. 1182-1185를 참고한다. 이 방법은 음성의 휴지를 찾아 배경 잡음을 추정하기 위한 음성 액티비티 검출기를 필요로 하지 않는다. 대신, 이 알고리즘은 유한 시간 윈도우 내의 전력 스펙트럼 밀도의 최소 추정치를 사용하여 잡음 레벨을 추정한다. 이 알고리즘은 각 스펙트럼 빈에서 잡음이 있는 음성 신호의 단기 전력 추정치가 시간에 대해 뚜렷한 피크 및 밸리를 나타낸다는 관찰에 기반한다. 신뢰성 있는 잡음 전력 추정치를 얻기 위해, 데이터 윈도우 또는 버퍼 길이는 상상할 수 있는 가장 긴 음성 액티비티에 걸치도록 충분 히 길어야 하며, 또는 잡음이 대략 변화하지 않고 일정하도록 충분히 짧아야 한다. M개의 부대역 전력 샘플의 윈도우 내의 단기 전력 추정치 P x (m,k)의 최소값으로서 잡음 전력 추정치 P n (m,k)가 구해진다. 알고리즘의 계산상의 복잡성을 줄이고 지연을 줄이기 위해, M 길이의 한 윈도우에 대한 데이터는 l 길이의 w개의 윈도우로 분해되어 l*w = M이다.
최소값을 위해 서브 윈도우 기반 검색을 이용하는 것이 마틴의 잡음 추정 방법의 계산상 복잡성을 줄일지라도, 상기 검색은 부대역마다 각 서브 윈도우에 최소값을 저장하기 위해 상당량의 메모리를 필요로 한다. 게르하르트 도블링거(Gerhard Doblinger)는 최소 통계를 추적하는 계산상 효율적인 알고리즘을 제안하였으며, G. Doblinger, "부대역에서의 스펙트럼 최소값 추적에 의한 계산상 효율적인 음성 증강", Proc. 제 4 회 유럽 컨퍼런스 음성, 통신 및 기술, EUROSPEECH'95 (1995년 9월 18일-21일), pp. 1513-1516을 참고한다. 이 알고리즘의 흐름도는 도 9에서 얇은 선으로 나타낸다. 이 알고리즘에 따르면, 잡음이 있는 음성 스펙트럼의 현재 값(프레임 m)이 이전 프레임(프레임 m-1)의 잡음 추정치보다 작으면, 잡음 추정치가 현재 잡음이 있는 음성 스펙트럼으로 업데이트된다. 그렇지 않으면, 현재 프레임에 대한 잡음 추정치는 1차 평활화 필터에 의해 업데이트된다. 이 1차 평활화는 현재 잡음이 있는 음성 스펙트럼 P x (m,k), 이점 프레임의 잡음 있는 음성 스펙트럼 P x (m-1,k) 및 이전 프레임의 잡음 추정치 P n (m-1,k)의 함수이다. 도 9에서 파라미터(β, γ)는 배경 잡음의 단기 고정 장애에 맞추는데 사용된다. 알고리 즘에 사용되는 β 및 γ의 값은 각각 0.5 및 0.995이며, 달라질 수 있다.
도블링거의 잡음 추정 방법은 보다 적은 메모리를 필요로 하는 단순한 1차 필터를 사용하여 최소 통계를 추적한다. 그러므로 도블링거의 방법은 마틴의 최소 통계 알고리즘보다 효율적이다. 도블링거의 방법은 마틴의 방법과 비교할 때 두 방법 모두 동일한 수렴 시간을 갖더라도 음성 프레임 동안 잡음을 과장한다. 이러한 잡음 과장은 스펙트럼 차감 동안 음성을 왜곡하게 된다.
본 발명에 따르면, 도블링거의 잡음 추정 방법은 도 9에서 두꺼운 선으로 지시하는 바와 같이, 프로세스에 삽입된 부가적인 테스트에 의해 변형된다. 변형에 따르면, 현재 잡음이 있는 음성 스펙트럼이 잡음 추정치에서 상당량 벗어난다면, 매우 느린 시정수를 갖는 1차 지수 평균 평활화 필터가 사용되어 현재 프레임의 잡음 추정치를 업데이트한다. 이러한 느린 시정수 필터의 효과는 잡음 추정치를 감소시키고 추정치의 변화를 느리게 하는 것이다.
도 9에서 파라미터(μ)는 배경 잡음에 갑작스런 변화가 있을 때 잡음 추정치의 수렴 시간을 제어한다. 파라미터(μ)의 값이 높아질수록 수렴 시간은 느려지고 음성 왜곡은 작아진다. 그러므로 파라미터(μ)의 조정은 잡음 추정 수렴 시간과 음성 왜곡과의 균형이다. 파라미터(ν)는 잡음 추정치로부터 잡음이 있는 음성 스펙트럼의 편향 임계치를 제어한다. 본 발명의 일 실시예에서, ν는 3 값을 갖는다. 다른 값들이 대신 사용될 수 있다. 임계치가 낮으면 수렴 시간이 증가한다. 임계치가 높으면 왜곡이 증가한다. 1~9 범위가 유용한 것으로 여겨지지만, 그 한계가 결정적인 것은 아니다.
89 - 스펙트럼 이득 계산
변형된 위너 필터링
다양한 고급 스펙트럼 이득 계산 방법이 논문에서 입수될 수 있다. 예를 들어, Y. Ephraim 및 D. Malah의 "최소 평균 제곱 에러 단기 스펙트럼 진폭 추정기를 이용한 음성 증강", IEEE Trans. 음향, 음성, 신호 처리, vol. ASSP-32, pp. 1109-1121(1984년 12월); Y. Ephraim 및 D. Malah의 "최소 평균 제곱 에러 로그 스펙트럼 진폭 추정기를 이용한 음성 증강", IEEE Trans. 음향, 음성 신호 처리, vol. ASSP-33(2), pp. 443-445(1985년 4월); 및 I. Cohen의 "신호 존재 불확실성 하에서의 음성 증강", 음향, 음성, 신호 처리에 관한 제 26 회 IEEE 국제 컨퍼런스 회보, ICASSP-01(유타 솔트레이크 시티), pp. 7-11(2001년 5월)을 참고한다.
닫혀 있는 형태의 스펙트럼 이득 공식은 음성의 실제 스펙트럼 진폭과 음성의 스펙트럼 진폭 추정치 사이의 평균 제곱 에러를 최소화한다. 다른 닫힌 형태의 스펙트럼 이득 공식은 실제 음성 진폭의 로그와 추정된 음성 진폭의 로그 사이의 평균 제곱 오차를 최소화한다. 이들 알고리즘은 이론적으로는 최적일 수도 있지만, 이들 알고리즘의 실제 성능은 잡음이 매우 많은 조건에서는 상업적으로 실용적이지 않다. 이들 알고리즘은 중간 정도로 잡음이 있는 환경에서도 중대한 음질 아티팩트를 생성한다. 변형된 많은 알고리즘이 상기 두 개요로부터 유도되었다.
일반화된 위너 필터링에 기반하여 신호대 잡음비의 함수로서 스펙트럼 이득을 계산하는 것이 공지되어 있으며; L. Arslan, A. McCree, V. Viswanathan의 "적 응 잡음 억제를 위한 신규 방법", 음향, 음성, 신호 처리에 관한 제 26 회 IEEE 국제 컨퍼런스 회보, ICASSP-01(유타 솔트레이크 시티), pp. 812-815(2001년 5월)를 참고한다. 일반화된 위너 필터는 다음과 같이 주어진다.
Figure 112006085607848-PCT00011
여기서
Figure 112006085607848-PCT00012
는 깨끗한 음성 전력 스펙트럼 추정치이고,
Figure 112006085607848-PCT00013
는 잡음 추정치의 전력 스펙트럼이며, α는 잡음 억제 인자이다. 깨끗한 음성 스펙트럼을 추정하기 위한 많은 방법이 있다. 예를 들어, 깨끗한 음성 스펙트럼은 선형 예측 코딩 모델 스펙트럼으로서 추정될 수 있다. 깨끗한 음성 스펙트럼은 단지 이득이 변경된 잡음 있는 음성 스펙트럼 P x (m,k)으로부터 계산될 수도 있다.
Figure 112006085607848-PCT00014
여기서 Ex(m)은 프레임(m)에서 잡음이 있는 음성 에너지이고, En(m)은 프레임(m)에서 잡음 에너지이다. 신호대 잡음비(SNR)는 다음과 같이 계산된다.
Figure 112006085607848-PCT00015
일반화된 위너 필터 공식에서 상기 식을 빼면 다음 식이 얻어지고,
Figure 112006085607848-PCT00016
여기서 SNR(m)은 프레임 번호(m)에서의 신호대 잡음비이고, α'는 (E x (m)/E n (m))α)와 같은 새로운 잡음 억제 인자이다. H(m,k)는 신호대 잡음비에 따라 변하기 때문에 상기 식은 잡음 있는 프레임에 대해 보다 강한 억제를 유성음 프레임 동안에는 보다 약한 억제를 보장한다.
바크 대역 기반 변형된 위너 필터링
변형된 위너 필터 솔루션은 전체 프레임(m)의 신호대 잡음비에 기반한다. 스펙트럼 이득 함수는 전체 프레임의 신호대 잡음비에 기반하기 때문에, 스펙트럼 이득값은 유성음 프레임 동안에는 더 크고 무성음 프레임 동안에는 더 작을 것이다. 이는 "잡음 펌핑"을 야기하게 되며, 이는 온/오프 전환되는 잡음처럼 들린다. 이러한 문제점을 해결하기 위해, 본 발명의 다른 형태에 따르면, 바크 대역 기반 스펙트럼 분석이 수행된다. 각 프레임의 각 대역에서 다음과 같이 신호대 잡음비가 계산된다.
Figure 112006085607848-PCT00017
여기서 Ex(m,i) 및 En(m,i)는 각각 프레임(m)의 대역(i)에서 각각 잡음 있는 음성 에너지 및 잡음 에너지이다. 결국, 변형된 위너 솔루션에서 바크 대역 SNR을 이용함으로써 바크 대역 기반 스펙트럼 이득값이 계산된다.
Figure 112006085607848-PCT00018
여기서 f L (i) 및 f H (i)는 바크 대역(i)에서 각각 최고 및 최저 주파수의 스펙트럼 빈 번호이다.
스펙트럼 차감 기반 방법의 단점들 중 하나는 음질 아티팩트의 유입이다. 잡음 추정의 불확실성으로 인해, 어떤 스펙트럼 피크는 스펙트럼 차감 뒤에 나머지로서 남게 된다. 이러한 스펙트럼 피크가 음질 자체를 명시한다. 아티팩트를 줄이기 위해, 잡음 억제 인자(α')는 상기에 계산된 것보다 큰 값으로 유지되어야 한다. 그러나 α' 값이 크면 유성음 왜곡이 더 커지게 된다. 파라미터(α')의 조정은 음성 진폭 감소와 음질 아티팩트 간의 균형이다. 이는 대화 도중 잡음 감소량을 제어하는 새로운 메커니즘으로 이끈다.
음성 증강을 개선하기 위해 잡음이 있는 스펙트럼 성분에서 신호 존재의 불확실성을 이용하는 아이디어가 공지되어 있으며; R.J. McAulay 및 M.L. Malpass의 "연판정 잡음 억제 필터를 이용한 음성 증강", IEEE Trans. 음향, 음성 신호 처리, vol. ASSP-28, pp. 137-145(1980년 4월)를 참고한다. 잡음이 있는 환경에 음성이 존재할 확률을 계산한 후, 계산된 확률은 잡음 억제 인자(α)를 조정하는데 사용된다.
유성음을 검출하는 한 가지 방법은 잡음이 있는 음성 에너지 스펙트럼과 잡음 에너지 스펙트럼과의 비를 계산하는 것이다. 이 비율이 매우 크다면, 유성음이 존재하는 것으로 추정할 수 있다. 본 발명의 다른 형태에 따르면, 음성이 존재할 확률은 바크 대역마다 계산된다. 이 바크 대역 분석은 양호한 품질의 음성 증강에 의해 계산이 절약된다. 상기 비를 계산하기 위한 첫 번째 단계는 다음과 같다.
Figure 112006085607848-PCT00019
E x (m,i) 및 E n (m,i)는 상기와 동일한 정의를 갖는다. 상기 비는 임계치(λth)와 비교되어 음성이 존재하는지 여부를 판단한다. 임계치를 초과할 때 음성이 존재하며, 도 10을 참고한다.
음성 존재 확률은 1차 지수 평균(평활화) 필터에 의해 계산된다.
p(m,i) = ε p p(m-1,i) + (1-ε p )I p
여기서 ε p 는 확률 평활화 인자이고, I p 는 음성이 존재할 때는 1과 같고 음성이 존재하지 않을 때는 0과 같다. 연속한 프레임에서 음성 존재의 상관성은 필터에 의해 포착된다.
잡음 억제 인자(α)는 음성 존재 확률을 임계치(p th )와 비교함으로써 결정된다. 구체적으로, α는 임계치를 초과하지 않을 때보다 임계치를 초과하는 경우에 더 낮은 값으로 설정된다. 또, 상기 인자는 대역마다 계산된다는 점에 유의한다.
스펙트럼 이득 제한
스펙트럼 이득은 이득이 최소값, 예를 들어 -20㏈ 이하로 떨어지는 것을 방 지하도록 제한된다. 시스템은 보다 적은 이득이 가능하지만, 최소값 이하로 이득을 감소시키는 것은 허용되지 않는다. 값은 중요하지 않다. 이득 제한은 스펙트럼 이득의 고정 점 계산의 유한한 정확성에 기인할 수 있는 음질 아티팩트 및 음성 왜곡을 줄인다.
이득의 하한은 스펙트럼 이득 계산 프로세스에 의해 조정된다. 바크 대역의 에너지가 어떤 임계값(E th )보다 적다면, 최소 이득은 -1㏈로 설정된다. 단편이 유성음으로 분류된다면, 즉 확률이 p th 를 초과한다면, 최소 이득은 -1로 설정된다. 어떤 조건도 만족하지 않는다면, 최소 이득은 허용되는 최저 이득, 예를 들어 -20㏈로 설정된다. 본 발명의 일 실시예에서, E th 에 적당한 값은 0.01이다. p th 에 적당한 값은 0.1이다. 대역마다 프로세스가 반복되어 각 대역의 이득을 조정한다.
스펙트럼 이득 평활화
모든 블록 변환 기반 처리에서, 윈도윙 및 중첩-가산은 주파수 영역에서 블록의 신호를 처리함으로써 유입되는 아티팩트를 줄이기 위한 공지 기술이다. 이러한 아티팩트의 감소는 윈도우의 메인 로브의 폭, 윈도우에서 사이드 로브의 경사, 및 블록간 중첩량과 같은 여러 가지 인자에 영향을 받는다. 메인 로브의 폭은 사용되는 윈도우 타입에 영향을 받는다. 예를 들어, 해닝(상승 코사인) 윈도우는 직사각형 윈도우보다 넓은 메인 로브 및 낮은 사이드 로브 레벨을 갖는다.
제어된 스펙트럼 이득은 윈도우를 평활화하고 중첩 및 가산 프로세스 동안 중첩 경계에 불연속을 발생시킨다. 이러한 불연속성은 스펙트럼 이득 함수의 시변 특성에 의해 발생한다. 이 아티팩트를 줄이기 위해, 본 발명에 따르면 다음의 기술, 즉 주파수 축을 따른 스펙트럼 이득 평활화, (순간 이득값의 사용 대신) 평균 바크 대역 이득, 시간 축을 따른 스펙트럼 이득 평활화를 채용한다.
92 - 주파수에 따른 이득 평활화
주파수에 따른 갑작스런 이득 변화를 피하기 위해, 다음과 같이 주어진 지수 평균 평활화 필터를 사용하여 주파수 축을 따라 스펙트럼 이득이 평활화된다.
H'(m,k) = ε gf H'(m,k-1) + (1-ε gf )H(m,k)
여기서 ε gf 는 주파수에 따른 이득 평활화 인자이고, H(m,k)는 스펙트럼 빈 번호(k)에서의 순간 스펙트럼 이득이며, H'(m,k-1)는 스펙트럼 빈 번호(k-1)에서 평활화된 스펙트럼 이득이고, H'(m,k)는 스펙트럼 빈 번호(k)에서 평활화된 스펙트럼 이득이다.
93 - 평균 바크 대역 이득 계산
스펙트럼 이득의 갑작스런 변화는 또한 각 바트 대역의 스펙트럼 이득을 평균함으로써 감소한다. 이는 바크 대역의 모든 스펙트럼 빈이 동일한 스펙트럼 이득을 가짐을 의미하며, 그 이득은 해당 바크 대역의 모든 스펙트럼 이득 사이의 평균이다. 대역의 평균 스펙트럼 이득 H' avg (m,k)은 간단히 대역에서 이득의 합을 대 역의 빈 개수로 나눈 것이다. 가장 높은 주파수 대역의 대역폭이 가장 낮은 주파수 대역의 대역폭보다 넓기 때문에, 스펙트럼 이득의 평균은 높은 대역에서의 협대역 잡음 감소에 있어 낮은 대역에서만큼 효과적인 것은 아니다. 따라서 약 1.35㎑보다 낮은 주파수 성분을 갖는 대역에 대해서만 평균이 실행된다. 한계는 중요하지 않으며 취향, 편의 또는 다른 고려사항에 맞게 실험에 의해 조정될 수 있다.
94 - 시간에 따른 이득 평활화
급속히 변화하는 잡음 있는 환경에서는, 증강된 출력 음성에 낮은 주파수 잡음 플러터(flutter)가 유입될 것이다. 이 플러터는 대부분의 스펙트럼 차감 기반 잡음 감소 시스템의 부산물이다. 배경 잡음이 급속히 변화하고 잡음 추정이 급속한 변화에 적응할 수 있다면, 스펙트럼 이득 또한 빠르게 변화하여 플러터를 생성할 것이다. 낮은 주파수 플러터는 다음과 같이 주어진 1차 지수 평균 평활화 필터를 사용하여 시간에 따라 스펙트럼 이득 H"(m,k)을 평활화함으로써 감소한다.
H"(m,k) = ε gf H "(m-1,k) + (1-ε gf )H" avg (m,b(i)) f(k) < 1.35㎑
H"(m,k) = ε gf H "(m-1,k) + (1-ε gf )H'(m,k) f(k) ≥ 1.35㎑
여기서 f(k)는 바크 대역(k)의 중심 주파수이고, ε gf 는 시간에 따른 이득 평활화 인자이고, b(i)는 스펙트럼 빈의 바크 대역 번호(k)이며, H'(m,k)는 프레임 인덱스(m)에서 (주파수에 따라) 평활화된 스펙트럼 이득이고, H'(m-1,k)는 프레임 인덱스(m-1)에서 (주파수에 따라) 평활화된 스펙트럼 이득이며, H" avg (m,k)는 프레임 인덱 스(m)에서 (주파수에 따라) 평활화되고 평균화된 스펙트럼 이득이다.
과도한 평활화는 음성에 끝 부분 에코(여운) 또는 잡음 펌핑을 발생시키게 되므로 평활화는 파라미터(ε gf )에 민감하다. 또한, 이득 평활화가 너무 높게 설정되면 음성 진폭의 상당한 감소가 있을 수 있다. 0.1 ~ 0.3의 값이 ε gf 에 적당하다. 주어진 다른 값들에 대해, 특정 값은 이 동작 전에 신호가 어떻게 처리되었는지에, 즉 사용된 이득에 좌우된다.
76 - 이산 푸리에 역변환
블록(75)에서 잡음이 있는 음성 스펙트럼에 스펙트럼 이득 함수를 곱함으로써 깨끗한 음성 스펙트럼이 얻어진다. 이는 차감과 같이 보이는 것이 아니라, 다음 식에 의해 깨끗한 음성 추정치가 얻어지는 것으로 결론이 나는 상기에 주어진 초기 전개식을 상기시킬 수 있다.
Y(f) = X(f)H(f)
차감은 곱셈기 H(f)에 포함된다.
깨끗한 음성 스펙트럼은 다음 변환식으로 주어진 이산 푸리에 역변환을 이용하여 다시 시간 영역으로 변환된다.
Figure 112006085607848-PCT00020
여기서 X(m,k)H(m,k)는 깨끗한 음성 추정치이고, s(m,n)은 프레임(m)에서 시간 영 역의 깨끗한 음성 추정치이다.
77 - 합성 윈도우
블록화 현상을 줄이기 위해 합성 윈도우를 이용하여 깨끗한 음성이 윈도윙된다.
Figure 112006085607848-PCT00021
78 - 중첩 및 가산
마지막으로, 윈도윙된 깨끗한 음성은 다음과 같이 이전 프레임과 중첩 및 가산된다.
Figure 112006085607848-PCT00022
여기서 s w (m-1,...)은 이전 프레임의 윈도윙된 깨끗한 음성이고, s w (m,n)은 현재 프레임의 윈도윙된 깨끗한 음성이며, D는 중첩량으로, 본 발명의 일 실시예에서는 상술한 바와 같이 32이다.
이와 같이 본 발명은 변형된 도블링거 잡음 추정, 부대역 기반 위너 필터링, 부대역 이득 연산, 각 부대역에서의 SNR 조정 이득, 이득 평활화 및 사다리꼴 윈도우의 25% 중첩을 이용하여 개선된 잡음 억제를 제공한다. 조합은 종래 기술의 대략 5 MIPS와 비교하여 (Texas Instruments C55xx 프로세서를 이용한 2 MIPS보다 낮 고 2k 미만의 데이터 메모리를 사용한 Motorola Starcore SC140의 1 MIPS보다 낮은) 낮은 MIPS로 연산을 감소시킨다. 또한, 억제 후의 나머지 배경 잡음에 눈에 띄는 변화가 없으며 음질 아티팩트가 더 적다.
이와 같이 본 발명에 대해 설명하였지만, 발명의 범위 내에서 다양한 변형이 이루어질 수 있음이 당업자에게 명백할 것이다. 예를 들어, 바크 대역 모델의 사용이 바람직하지만 필수적인 것은 아니다. 대역 통과 필터는 다른 진행 패턴을 따를 수 있다.

Claims (15)

  1. 입력 신호를 다수의 샘플을 각각 포함하는 다수의 프레임으로 분할하는 분석 회로, 잡음 추정치를 계산하는 회로, 상기 입력 신호에서 상기 잡음 추정치를 차감하는 회로, 및 상기 프레임들을 출력 신호로 재구성하는 합성 회로를 포함하는 잡음 억제 회로로서,
    입력 신호를 다수의 대역으로 분할하는 다수의 대역 통과 필터; 및
    각 대역에서 각 프레임의 신호대 잡음비에 반비례하게 잡음 억제 인자를 계산하는 수단을 포함하는, 잡음 억제 회로.
  2. 제 1 항에 있어서,
    상기 대역 통과 필터는 바크 대역을 한정하는 것을 특징으로 하는 잡음 억제 회로.
  3. 제 2 항에 있어서,
    상기 잡음 추정치를 계산하는 회로에서 스펙트럼 이득을 제한하는 회로를 더 포함하는 것을 특징으로 하는 잡음 억제 회로.
  4. 제 3 항에 있어서,
    음성 검출기를 더 포함하며, 상기 스펙트럼 이득 제한은 음성이 검출되지 않 을 때보다 음성이 검출될 때 더 높은 것을 특징으로 하는 잡음 억제 회로.
  5. 제 3 항에 있어서,
    상기 잡음 추정치를 계산하는 회로에 연결된 제 1 평활화 회로를 더 포함하며, 상기 제 1 평활화 회로는 상기 입력 신호의 주파수 스펙트럼에 걸쳐 이득을 평활화하는 것을 특징으로 하는 잡음 억제 회로.
  6. 제 5 항에 있어서,
    상기 제 1 평활화 회로는 대략 2㎑ 이하의 대역에 걸쳐 이득을 평활화하는 것을 특징으로 하는 잡음 억제 회로.
  7. 제 1 항에 있어서,
    상기 잡음 추정치를 계산하는 회로는,
    잡음이 있는 음성 스펙트럼이 잡음 추정치로부터 미리 결정된 양보다 적게 편향할 때보다 상기 잡음이 있는 음성 스펙트럼이 상기 미리 결정된 양보다 많이 편향할 때 프레임의 잡음 추정치를 업데이트함으로써 상기 잡음 추정치를 감소시키고 프레임들 간 추정치 변화를 느리게 하기 위한 느린 시정수를 갖는 평활화 필터를 포함하는 것을 특징으로 하는 잡음 억제 회로.
  8. 제 7 항에 있어서,
    상기 필터는 1차 지수 평균 평활화 필터인 것을 특징으로 하는 잡음 억제 회로.
  9. 입력 신호를 다수의 샘플을 각각 포함하는 다수의 프레임으로 분할하는 분석 회로, 잡음 추정치를 계산하는 회로, 상기 입력 신호에서 상기 잡음 추정치를 차감하는 회로, 및 상기 프레임들을 출력 신호로 재구성하는 합성 회로를 포함하는 잡음 억제 회로로서,
    잡음 추정치를 계산하고, 잡음이 있는 음성 스펙트럼이 상기 잡음 추정치로부터 미리 결정된 양보다 적게 편향할 때보다 상기 잡음이 있는 음성 스펙트럼이 상기 미리 결정된 양보다 많이 편향할 때 프레임의 잡음 추정치를 업데이트함으로써 상기 잡음 추정치를 감소시키고 프레임들 간 추정치 변화를 느리게 하기 위한 느린 시정수를 갖는 평활화 필터를 포함하는, 잡음 억제 회로.
  10. 제 9 항에 있어서,
    각 프레임의 신호대 잡음비에 반비례하게 잡음 억제 인자를 조정하는 회로를 더 포함하는 것을 특징으로 하는 잡음 억제 회로.
  11. 제 10 항에 있어서,
    각 프레임을 주파수 영역으로 변환하기 위해 상기 입력 신호의 각 프레임의 이산 푸리에 변환을 계산하는 회로를 더 포함하는 것을 특징으로 하는 잡음 억제 회로.
  12. 제 11 항에 있어서,
    상기 이산 푸리에 변환을 계산하는 회로는 상기 프레임을 점진적으로 더 높은 중간 주파수를 갖는 다수의 대역으로 분할하는 것을 특징으로 하는 잡음 억제 회로.
  13. 제 12 항에 있어서,
    상기 대역은 바크 대역인 것을 특징으로 하는 잡음 억제 회로.
  14. 수신 채널 및 송신 채널을 포함하는 오디오 처리 회로를 구비한 전화기로서,
    상기 채널들 중 적어도 하나에 제 1 항에 따른 잡음 억제 회로를 포함하는, 전화기.
  15. 수신 채널 및 송신 채널을 포함하는 오디오 처리 회로를 구비한 전화기로서,
    상기 채널들 중 적어도 하나에 제 9 항에 따른 잡음 억제 회로를 포함하는, 전화기.
KR1020067024494A 2004-04-23 2005-04-18 바크 대역 위너 필터링 및 변형된 도블링거 잡음 추정에기반한 잡음 억제 KR100851716B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/830,652 2004-04-23
US10/830,652 US7492889B2 (en) 2004-04-23 2004-04-23 Noise suppression based on bark band wiener filtering and modified doblinger noise estimate

Publications (2)

Publication Number Publication Date
KR20070037439A true KR20070037439A (ko) 2007-04-04
KR100851716B1 KR100851716B1 (ko) 2008-08-11

Family

ID=35137588

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067024494A KR100851716B1 (ko) 2004-04-23 2005-04-18 바크 대역 위너 필터링 및 변형된 도블링거 잡음 추정에기반한 잡음 억제

Country Status (6)

Country Link
US (1) US7492889B2 (ko)
EP (1) EP1745469A4 (ko)
JP (1) JP2007535698A (ko)
KR (1) KR100851716B1 (ko)
CN (1) CN101142800A (ko)
WO (1) WO2005109404A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015061116A1 (en) * 2013-10-25 2015-04-30 Intel IP Corporation Audio processing devices and audio processing methods

Families Citing this family (147)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7117149B1 (en) * 1999-08-30 2006-10-03 Harman Becker Automotive Systems-Wavemakers, Inc. Sound source classification
JP3574123B2 (ja) * 2001-03-28 2004-10-06 三菱電機株式会社 雑音抑圧装置
US7725315B2 (en) * 2003-02-21 2010-05-25 Qnx Software Systems (Wavemakers), Inc. Minimization of transient noises in a voice signal
US7949522B2 (en) * 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US8326621B2 (en) 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
US7895036B2 (en) * 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
US8073689B2 (en) 2003-02-21 2011-12-06 Qnx Software Systems Co. Repetitive transient noise removal
US7885420B2 (en) 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US8271279B2 (en) 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
CA2454296A1 (en) * 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
US7383179B2 (en) * 2004-09-28 2008-06-03 Clarity Technologies, Inc. Method of cascading noise reduction algorithms to avoid speech distortion
US7716046B2 (en) * 2004-10-26 2010-05-11 Qnx Software Systems (Wavemakers), Inc. Advanced periodic signal enhancement
US7610196B2 (en) * 2004-10-26 2009-10-27 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US7949520B2 (en) 2004-10-26 2011-05-24 QNX Software Sytems Co. Adaptive filter pitch extraction
US8170879B2 (en) 2004-10-26 2012-05-01 Qnx Software Systems Limited Periodic signal enhancement system
US8306821B2 (en) * 2004-10-26 2012-11-06 Qnx Software Systems Limited Sub-band periodic signal enhancement system
US7680652B2 (en) 2004-10-26 2010-03-16 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US8543390B2 (en) 2004-10-26 2013-09-24 Qnx Software Systems Limited Multi-channel periodic signal enhancement system
US8284947B2 (en) * 2004-12-01 2012-10-09 Qnx Software Systems Limited Reverberation estimation and suppression system
US20060184363A1 (en) * 2005-02-17 2006-08-17 Mccree Alan Noise suppression
US8027833B2 (en) 2005-05-09 2011-09-27 Qnx Software Systems Co. System for suppressing passing tire hiss
US8170875B2 (en) * 2005-06-15 2012-05-01 Qnx Software Systems Limited Speech end-pointer
US8311819B2 (en) * 2005-06-15 2012-11-13 Qnx Software Systems Limited System for detecting speech with background voice estimates and noise estimates
CN100539437C (zh) * 2005-07-29 2009-09-09 上海杰得微电子有限公司 一种音频编解码器的实现方法
JP4172530B2 (ja) * 2005-09-02 2008-10-29 日本電気株式会社 雑音抑圧の方法及び装置並びにコンピュータプログラム
JP4863713B2 (ja) * 2005-12-29 2012-01-25 富士通株式会社 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム
GB2437559B (en) * 2006-04-26 2010-12-22 Zarlink Semiconductor Inc Low complexity noise reduction method
US7844453B2 (en) 2006-05-12 2010-11-30 Qnx Software Systems Co. Robust noise estimation
JP4753821B2 (ja) * 2006-09-25 2011-08-24 富士通株式会社 音信号補正方法、音信号補正装置及びコンピュータプログラム
KR100835993B1 (ko) * 2006-11-30 2008-06-09 한국전자통신연구원 마스킹 확률을 이용한 음성 인식 전처리 방법 및 전처리장치
US8335685B2 (en) * 2006-12-22 2012-12-18 Qnx Software Systems Limited Ambient noise compensation system robust to high excitation noise
US8326620B2 (en) 2008-04-30 2012-12-04 Qnx Software Systems Limited Robust downlink speech and noise detector
US9966085B2 (en) * 2006-12-30 2018-05-08 Google Technology Holdings LLC Method and noise suppression circuit incorporating a plurality of noise suppression techniques
KR101414233B1 (ko) * 2007-01-05 2014-07-02 삼성전자 주식회사 음성 신호의 명료도를 향상시키는 장치 및 방법
EP2118885B1 (en) 2007-02-26 2012-07-11 Dolby Laboratories Licensing Corporation Speech enhancement in entertainment audio
US8560320B2 (en) * 2007-03-19 2013-10-15 Dolby Laboratories Licensing Corporation Speech enhancement employing a perceptual model
WO2008115435A1 (en) * 2007-03-19 2008-09-25 Dolby Laboratories Licensing Corporation Noise variance estimator for speech enhancement
EP2031583B1 (en) * 2007-08-31 2010-01-06 Harman Becker Automotive Systems GmbH Fast estimation of spectral noise power density for speech signal enhancement
US8850154B2 (en) 2007-09-11 2014-09-30 2236008 Ontario Inc. Processing system having memory partitioning
US8904400B2 (en) 2007-09-11 2014-12-02 2236008 Ontario Inc. Processing system having a partitioning component for resource partitioning
US8538763B2 (en) * 2007-09-12 2013-09-17 Dolby Laboratories Licensing Corporation Speech enhancement with noise level estimation adjustment
WO2009035614A1 (en) * 2007-09-12 2009-03-19 Dolby Laboratories Licensing Corporation Speech enhancement with voice clarity
US8694310B2 (en) 2007-09-17 2014-04-08 Qnx Software Systems Limited Remote control server protocol system
JP5191750B2 (ja) * 2008-01-25 2013-05-08 川崎重工業株式会社 音響装置
US8209514B2 (en) 2008-02-04 2012-06-26 Qnx Software Systems Limited Media processing system having resource partitioning
US8606573B2 (en) * 2008-03-28 2013-12-10 Alon Konchitsky Voice recognition improved accuracy in mobile environments
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
KR101475724B1 (ko) * 2008-06-09 2014-12-30 삼성전자주식회사 오디오 신호 품질 향상 장치 및 방법
JP5453740B2 (ja) * 2008-07-02 2014-03-26 富士通株式会社 音声強調装置
US8538749B2 (en) * 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
EP2164066B1 (en) * 2008-09-15 2016-03-09 Oticon A/S Noise spectrum tracking in noisy acoustical signals
US20110125490A1 (en) * 2008-10-24 2011-05-26 Satoru Furuta Noise suppressor and voice decoder
JP5245714B2 (ja) * 2008-10-24 2013-07-24 ヤマハ株式会社 雑音抑圧装置及び雑音抑圧方法
JP5157852B2 (ja) * 2008-11-28 2013-03-06 富士通株式会社 音声信号処理評価プログラム、音声信号処理評価装置
US9202456B2 (en) * 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
ES2526126T3 (es) 2009-08-14 2015-01-07 Koninklijke Kpn N.V. Método, producto de programa informático y sistema para determinar una calidad percibida de un sistema de audio
CN102117618B (zh) * 2009-12-30 2012-09-05 华为技术有限公司 一种消除音乐噪声的方法、装置及系统
US9449612B2 (en) * 2010-04-27 2016-09-20 Yobe, Inc. Systems and methods for speech processing via a GUI for adjusting attack and release times
US10403302B2 (en) 2010-04-27 2019-09-03 Yobe, Inc. Enhancing audio content for voice isolation and biometric identification by adjusting high frequency attack and release times
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
US8908877B2 (en) 2010-12-03 2014-12-09 Cirrus Logic, Inc. Ear-coupling detection and adjustment of adaptive response in noise-canceling in personal audio devices
KR101909432B1 (ko) 2010-12-03 2018-10-18 씨러스 로직 인코포레이티드 개인용 오디오 디바이스에서 적응형 잡음 제거기의 실수 제어
US20120143604A1 (en) * 2010-12-07 2012-06-07 Rita Singh Method for Restoring Spectral Components in Denoised Speech Signals
US8583429B2 (en) * 2011-02-01 2013-11-12 Wevoice Inc. System and method for single-channel speech noise reduction
FR2974655B1 (fr) * 2011-04-26 2013-12-20 Parrot Combine audio micro/casque comprenant des moyens de debruitage d'un signal de parole proche, notamment pour un systeme de telephonie "mains libres".
CN102208190B (zh) * 2011-05-06 2012-11-28 声科科技(南京)有限公司 抑制非平稳噪声设备收敛时间的测量方法及装置
US9214150B2 (en) 2011-06-03 2015-12-15 Cirrus Logic, Inc. Continuous adaptation of secondary path adaptive response in noise-canceling personal audio devices
US8958571B2 (en) * 2011-06-03 2015-02-17 Cirrus Logic, Inc. MIC covering detection in personal audio devices
US9824677B2 (en) 2011-06-03 2017-11-21 Cirrus Logic, Inc. Bandlimiting anti-noise in personal audio devices having adaptive noise cancellation (ANC)
US9076431B2 (en) 2011-06-03 2015-07-07 Cirrus Logic, Inc. Filter architecture for an adaptive noise canceler in a personal audio device
US9318094B2 (en) 2011-06-03 2016-04-19 Cirrus Logic, Inc. Adaptive noise canceling architecture for a personal audio device
US8948407B2 (en) 2011-06-03 2015-02-03 Cirrus Logic, Inc. Bandlimiting anti-noise in personal audio devices having adaptive noise cancellation (ANC)
US9711162B2 (en) * 2011-07-05 2017-07-18 Texas Instruments Incorporated Method and apparatus for environmental noise compensation by determining a presence or an absence of an audio event
KR101422984B1 (ko) * 2011-07-08 2014-07-23 고어텍 인크 잔류 에코를 억제하는 방법 및 장치
US9325821B1 (en) * 2011-09-30 2016-04-26 Cirrus Logic, Inc. Sidetone management in an adaptive noise canceling (ANC) system including secondary path modeling
JP2013148724A (ja) * 2012-01-19 2013-08-01 Sony Corp 雑音抑圧装置、雑音抑圧方法およびプログラム
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
CN103325380B (zh) 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
US9014387B2 (en) 2012-04-26 2015-04-21 Cirrus Logic, Inc. Coordinated control of adaptive noise cancellation (ANC) among earspeaker channels
US9142205B2 (en) 2012-04-26 2015-09-22 Cirrus Logic, Inc. Leakage-modeling adaptive noise canceling for earspeakers
US9123321B2 (en) 2012-05-10 2015-09-01 Cirrus Logic, Inc. Sequenced adaptation of anti-noise generator response and secondary path response in an adaptive noise canceling system
US9076427B2 (en) 2012-05-10 2015-07-07 Cirrus Logic, Inc. Error-signal content controlled adaptation of secondary and leakage path models in noise-canceling personal audio devices
US9319781B2 (en) 2012-05-10 2016-04-19 Cirrus Logic, Inc. Frequency and direction-dependent ambient sound handling in personal audio devices having adaptive noise cancellation (ANC)
US9082387B2 (en) 2012-05-10 2015-07-14 Cirrus Logic, Inc. Noise burst adaptation of secondary path adaptive response in noise-canceling personal audio devices
US9318090B2 (en) 2012-05-10 2016-04-19 Cirrus Logic, Inc. Downlink tone detection and adaptation of a secondary path response model in an adaptive noise canceling system
WO2014021890A1 (en) * 2012-08-01 2014-02-06 Dolby Laboratories Licensing Corporation Percentile filtering of noise reduction gains
US9805738B2 (en) * 2012-09-04 2017-10-31 Nuance Communications, Inc. Formant dependent speech signal enhancement
US9532139B1 (en) 2012-09-14 2016-12-27 Cirrus Logic, Inc. Dual-microphone frequency amplitude response self-calibration
JP6162254B2 (ja) * 2013-01-08 2017-07-12 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 背景ノイズにおけるスピーチ了解度を増幅及び圧縮により向上させる装置と方法
US9349383B2 (en) * 2013-01-29 2016-05-24 2236008 Ontario Inc. Audio bandwidth dependent noise suppression
US9107010B2 (en) 2013-02-08 2015-08-11 Cirrus Logic, Inc. Ambient noise root mean square (RMS) detector
US9369798B1 (en) 2013-03-12 2016-06-14 Cirrus Logic, Inc. Internal dynamic range control in an adaptive noise cancellation (ANC) system
US9106989B2 (en) 2013-03-13 2015-08-11 Cirrus Logic, Inc. Adaptive-noise canceling (ANC) effectiveness estimation and correction in a personal audio device
US9215749B2 (en) 2013-03-14 2015-12-15 Cirrus Logic, Inc. Reducing an acoustic intensity vector with adaptive noise cancellation with two error microphones
US9414150B2 (en) 2013-03-14 2016-08-09 Cirrus Logic, Inc. Low-latency multi-driver adaptive noise canceling (ANC) system for a personal audio device
US9324311B1 (en) 2013-03-15 2016-04-26 Cirrus Logic, Inc. Robust adaptive noise canceling (ANC) in a personal audio device
US9467776B2 (en) 2013-03-15 2016-10-11 Cirrus Logic, Inc. Monitoring of speaker impedance to detect pressure applied between mobile device and ear
US9635480B2 (en) 2013-03-15 2017-04-25 Cirrus Logic, Inc. Speaker impedance monitoring
US9208771B2 (en) 2013-03-15 2015-12-08 Cirrus Logic, Inc. Ambient noise-based adaptation of secondary path adaptive response in noise-canceling personal audio devices
US10206032B2 (en) 2013-04-10 2019-02-12 Cirrus Logic, Inc. Systems and methods for multi-mode adaptive noise cancellation for audio headsets
US9066176B2 (en) 2013-04-15 2015-06-23 Cirrus Logic, Inc. Systems and methods for adaptive noise cancellation including dynamic bias of coefficients of an adaptive noise cancellation system
US9462376B2 (en) 2013-04-16 2016-10-04 Cirrus Logic, Inc. Systems and methods for hybrid adaptive noise cancellation
US9460701B2 (en) 2013-04-17 2016-10-04 Cirrus Logic, Inc. Systems and methods for adaptive noise cancellation by biasing anti-noise level
US9478210B2 (en) 2013-04-17 2016-10-25 Cirrus Logic, Inc. Systems and methods for hybrid adaptive noise cancellation
US9578432B1 (en) 2013-04-24 2017-02-21 Cirrus Logic, Inc. Metric and tool to evaluate secondary path design in adaptive noise cancellation systems
US9264808B2 (en) 2013-06-14 2016-02-16 Cirrus Logic, Inc. Systems and methods for detection and cancellation of narrow-band noise
US10262680B2 (en) * 2013-06-28 2019-04-16 Adobe Inc. Variable sound decomposition masks
US9392364B1 (en) 2013-08-15 2016-07-12 Cirrus Logic, Inc. Virtual microphone for adaptive noise cancellation in personal audio devices
US9666176B2 (en) 2013-09-13 2017-05-30 Cirrus Logic, Inc. Systems and methods for adaptive noise cancellation by adaptively shaping internal white noise to train a secondary path
US9620101B1 (en) 2013-10-08 2017-04-11 Cirrus Logic, Inc. Systems and methods for maintaining playback fidelity in an audio system with adaptive noise cancellation
US9704472B2 (en) 2013-12-10 2017-07-11 Cirrus Logic, Inc. Systems and methods for sharing secondary path information between audio channels in an adaptive noise cancellation system
US10219071B2 (en) 2013-12-10 2019-02-26 Cirrus Logic, Inc. Systems and methods for bandlimiting anti-noise in personal audio devices having adaptive noise cancellation
US10382864B2 (en) 2013-12-10 2019-08-13 Cirrus Logic, Inc. Systems and methods for providing adaptive playback equalization in an audio device
BR112016014104B1 (pt) * 2013-12-19 2020-12-29 Telefonaktiebolaget Lm Ericsson (Publ) método de estimativa de ruído de fundo, estimador de ruído de fundo, detector de atividade de som, codec, dispositivo sem fio, nó de rede, meio de armazenamento legível por computador
US9369557B2 (en) 2014-03-05 2016-06-14 Cirrus Logic, Inc. Frequency-dependent sidetone calibration
US9479860B2 (en) 2014-03-07 2016-10-25 Cirrus Logic, Inc. Systems and methods for enhancing performance of audio transducer based on detection of transducer status
US9648410B1 (en) 2014-03-12 2017-05-09 Cirrus Logic, Inc. Control of audio output of headphone earbuds based on the environment around the headphone earbuds
US9319784B2 (en) 2014-04-14 2016-04-19 Cirrus Logic, Inc. Frequency-shaped noise-based adaptation of secondary path adaptive response in noise-canceling personal audio devices
EP3152756B1 (en) 2014-06-09 2019-10-23 Dolby Laboratories Licensing Corporation Noise level estimation
US9609416B2 (en) 2014-06-09 2017-03-28 Cirrus Logic, Inc. Headphone responsive to optical signaling
US10181315B2 (en) 2014-06-13 2019-01-15 Cirrus Logic, Inc. Systems and methods for selectively enabling and disabling adaptation of an adaptive noise cancellation system
US9478212B1 (en) 2014-09-03 2016-10-25 Cirrus Logic, Inc. Systems and methods for use of adaptive secondary path estimate to control equalization in an audio device
KR102475869B1 (ko) * 2014-10-01 2022-12-08 삼성전자주식회사 잡음이 포함된 오디오 신호를 처리하는 방법 및 장치
US9886966B2 (en) * 2014-11-07 2018-02-06 Apple Inc. System and method for improving noise suppression using logistic function and a suppression target value for automatic speech recognition
US9552805B2 (en) 2014-12-19 2017-01-24 Cirrus Logic, Inc. Systems and methods for performance and stability control for feedback adaptive noise cancellation
WO2017027397A2 (en) 2015-08-07 2017-02-16 Cirrus Logic International Semiconductor, Ltd. Event detection for playback management in an audio device
US10026388B2 (en) 2015-08-20 2018-07-17 Cirrus Logic, Inc. Feedback adaptive noise cancellation (ANC) controller and method having a feedback response partially provided by a fixed-response filter
US9578415B1 (en) 2015-08-21 2017-02-21 Cirrus Logic, Inc. Hybrid adaptive noise cancellation system with filtered error microphone signal
WO2017072958A1 (ja) * 2015-10-30 2017-05-04 三菱電機株式会社 ハンズフリー制御装置
US10013966B2 (en) 2016-03-15 2018-07-03 Cirrus Logic, Inc. Systems and methods for adaptive active noise cancellation for multiple-driver personal audio device
DE102017215890B4 (de) * 2016-09-11 2020-01-30 Continental Automotive Systems, Inc. Verfahren zur dynamisch erhöhten Geräuschunterdrückung auf der Basis von Eingangsgeräuschkennlinien
GB2558529A (en) * 2016-09-11 2018-07-18 Continental automotive systems inc Dynamically increased noise suppression based on input noise characteristics
US10242696B2 (en) 2016-10-11 2019-03-26 Cirrus Logic, Inc. Detection of acoustic impulse events in voice applications
US10475471B2 (en) 2016-10-11 2019-11-12 Cirrus Logic, Inc. Detection of acoustic impulse events in voice applications using a neural network
US11373667B2 (en) * 2017-04-19 2022-06-28 Synaptics Incorporated Real-time single-channel speech enhancement in noisy and time-varying environments
US10395667B2 (en) 2017-05-12 2019-08-27 Cirrus Logic, Inc. Correlation-based near-field detector
US10297267B2 (en) 2017-05-15 2019-05-21 Cirrus Logic, Inc. Dual microphone voice processing for headsets with variable microphone array orientation
US10504538B2 (en) * 2017-06-01 2019-12-10 Sorenson Ip Holdings, Llc Noise reduction by application of two thresholds in each frequency band in audio signals
US10540983B2 (en) * 2017-06-01 2020-01-21 Sorenson Ip Holdings, Llc Detecting and reducing feedback
CN107437418A (zh) * 2017-07-28 2017-12-05 深圳市益鑫智能科技有限公司 车载语音识别电子娱乐控制系统
CN108022591B (zh) * 2017-12-30 2021-03-16 北京百度网讯科技有限公司 车内环境中语音识别的处理方法、装置和电子设备
US10885907B2 (en) 2018-02-14 2021-01-05 Cirrus Logic, Inc. Noise reduction system and method for audio device with multiple microphones
CN111508519B (zh) * 2020-04-03 2022-04-26 北京达佳互联信息技术有限公司 一种音频信号人声增强的方法及装置
CN111986660A (zh) * 2020-08-26 2020-11-24 深圳信息职业技术学院 一种神经网络子带建模的单通道语音增强方法、系统及存储介质
US11984107B2 (en) * 2022-07-13 2024-05-14 Analog Devices International Unlimited Company Audio signal processing method and system for echo suppression using an MMSE-LSA estimator
CN117434153B (zh) * 2023-12-20 2024-03-05 吉林蛟河抽水蓄能有限公司 基于超声波技术的道路无损检测方法及系统

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3180936A (en) * 1960-12-01 1965-04-27 Bell Telephone Labor Inc Apparatus for suppressing noise and distortion in communication signals
US3403224A (en) * 1965-05-28 1968-09-24 Bell Telephone Labor Inc Processing of communications signals to reduce effects of noise
US4644108A (en) * 1982-10-27 1987-02-17 International Business Machines Corporation Adaptive sub-band echo suppressor
US4630305A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US4811404A (en) * 1987-10-01 1989-03-07 Motorola, Inc. Noise suppression system
IL84948A0 (en) * 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
JPH07261797A (ja) * 1994-03-18 1995-10-13 Mitsubishi Electric Corp 信号符号化装置及び信号復号化装置
US5774846A (en) * 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
US5706395A (en) * 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
US6263307B1 (en) * 1995-04-19 2001-07-17 Texas Instruments Incorporated Adaptive weiner filtering using line spectral frequencies
US6097820A (en) * 1996-12-23 2000-08-01 Lucent Technologies Inc. System and method for suppressing noise in digitally represented voice signals
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
US6088668A (en) * 1998-06-22 2000-07-11 D.S.P.C. Technologies Ltd. Noise suppressor having weighted gain smoothing
US6760435B1 (en) * 2000-02-08 2004-07-06 Lucent Technologies Inc. Method and apparatus for network speech enhancement

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015061116A1 (en) * 2013-10-25 2015-04-30 Intel IP Corporation Audio processing devices and audio processing methods
US10249322B2 (en) 2013-10-25 2019-04-02 Intel IP Corporation Audio processing devices and audio processing methods

Also Published As

Publication number Publication date
US20050240401A1 (en) 2005-10-27
US7492889B2 (en) 2009-02-17
CN101142800A (zh) 2008-03-12
JP2007535698A (ja) 2007-12-06
WO2005109404A2 (en) 2005-11-17
EP1745469A4 (en) 2008-08-27
WO2005109404A3 (en) 2007-11-22
KR100851716B1 (ko) 2008-08-11
EP1745469A2 (en) 2007-01-24

Similar Documents

Publication Publication Date Title
KR100851716B1 (ko) 바크 대역 위너 필터링 및 변형된 도블링거 잡음 추정에기반한 잡음 억제
US7649988B2 (en) Comfort noise generator using modified Doblinger noise estimate
US7454010B1 (en) Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation
US6549586B2 (en) System and method for dual microphone signal noise reduction using spectral subtraction
US6487257B1 (en) Signal noise reduction by time-domain spectral subtraction using fixed filters
EP1252796B1 (en) System and method for dual microphone signal noise reduction using spectral subtraction
US7058572B1 (en) Reducing acoustic noise in wireless and landline based telephony
US6175602B1 (en) Signal noise reduction by spectral subtraction using linear convolution and casual filtering
EP1046273B1 (en) Methods and apparatus for providing comfort noise in communications systems
EP2008379B1 (en) Adjustable noise suppression system
CN111554315B (zh) 单通道语音增强方法及装置、存储介质、终端
EP1080463B1 (en) Signal noise reduction by spectral subtraction using spectrum dependent exponential gain function averaging
JP2003500936A (ja) エコー抑止システムにおけるニアエンド音声信号の改善
US8756055B2 (en) Systems and methods for improving the intelligibility of speech in a noisy environment
US7889874B1 (en) Noise suppressor
US9172791B1 (en) Noise estimation algorithm for non-stationary environments
US6507623B1 (en) Signal noise reduction by time-domain spectral subtraction
JP2002521945A (ja) 通信端末
Nemer Acoustic Noise Reduction for Mobile Telephony
JP2003517761A (ja) 通信システムにおける音響バックグラウンドノイズを抑制するための方法と装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee