KR20070037439A

KR20070037439A - 바크 대역 위너 필터링 및 변형된 도블링거 잡음 추정에기반한 잡음 억제

Info

Publication number: KR20070037439A
Application number: KR1020067024494A
Authority: KR
Inventors: 사무엘 폰바르마 에벤에셀
Original assignee: 어쿠스틱 테크놀로지스, 인코포레이티드
Priority date: 2004-04-23
Filing date: 2005-04-18
Publication date: 2007-04-04
Also published as: US20050240401A1; US7492889B2; CN101142800A; JP2007535698A; WO2005109404A2; EP1745469A4; WO2005109404A3; KR100851716B1; EP1745469A2

Abstract

잡음 억제기에서, 입력 신호는 이산 푸리에 분석에 의해 주파수 영역으로 변환되고 바크 대역으로 분할된다. 각 대역(85)에 대한 잡음이 추정된다. 잡음을 추정하는 회로는 말하는 동안보다 잡음이 있는 동안 잡음 추정치를 업데이트하는 느린 시정수를 갖는 평활화 필터를 포함한다. 잡음 억제기는 또한 입력 신호의 각 프레임의 신호대 잡음비에 반비례하게 잡음 억제 인자(89)를 조정하는 회로를 포함한다. 잡음 추정치는 각 대역의 신호로부터 차감된다. 이산 푸리에 역변환은 신호를 다시 시간 영역으로 변환하고, 중첩 및 조합된 윈도우가 처리중에 발생할 수 있었던 아티팩트를 제거한다.

Description

바크 대역 위너 필터링 및 변형된 도블링거 잡음 추정에 기반한 잡음 억제{NOISE SUPPRESSION BASED ON BARK BAND WEINER FILTERING AND MODIFIED DOBLINGER NOISE ESTIMATE}

본 발명은 오디오 신호 처리에 관한 것으로, 특히 잡음을 줄이기 위해 스펙트럼 차감을 이용하는 회로에 관한 것이다.

여기서 사용되는 바와 같이, "전화"는 인가된 서비스 제공자로부터의 발신음을 직접 또는 간접적으로 이용하는 통신 장치에 대한 일반 용어이다. 이와 같이, "전화"는 그 중에서도 특히 탁상 전화(도 1 참고), 무선 전화(도 2 참고), 스피커폰(도 3 참조), 핸즈프리 키트(도 4 참고) 및 셀룰러폰(도 5 참고)을 포함한다. 간소화를 위해, 본 발명은 전화와 관련하여 설명되지만, 예를 들어 무선 주파수 트랜시버나 인터컴 등 발신음을 이용하지 않는 통신 장치와 같이 더 넓은 유틸리티를 갖는다.

전화 시스템에는 많은 잡음 소스가 있다. 어떤 잡음은 원래 가청음인 반면, 다른 잡음 소스는 전자, 예를 들어 전화망이다. 여기서 사용된 바와 같이, "잡음"은 주기적이든, 순전히 랜덤하든 또는 어딘가 중간에 있든 임의의 불필요한 소음을 말한다. 이와 같이, 잡음은 배경음, 원하는 화자 이외의 다른 사람들의 음성, 타 이어 소음, 바람소리 등을 포함한다. 자동차는 특히 시끄러운 환경에 있을 수 있으며, 이는 본 발명을 핸즈프리 키트에 특히 유용하게 한다.

넓게 정의하면, 잡음은 화자의 음성 에코를 포함할 수 있었다. 그러나 전화 시스템에서 에코 상쇄는 개별적으로 취급되고 두 채널에서의 신호 비교를 수반한다. 본 발명은 잡음 억제에 관련되며, 이는 장치가 단일 채널에서 실시간으로 동작함을, 즉 에코 상쇄에서와 같이 지연을 계산하지 않는다는 것을 의미한다.

보편적으로 따르는 것은 아니지만, 종래 기술은 일반적으로 차감에 의한 잡음 "억제" 및 감쇄에 의한 잡음 "감소"와 관련된다. 여기서 사용되는 바와 같이, 잡음 억제는 한 신호에서 다른 신호를 차감하여 잡음의 양을 줄이는 것을 포함한다.

당업자들은 아날로그 신호가 일단 디지털 형태로 변환되면, 이어지는 모든 동작이 적절히 프로그래밍된 하나 이상의 마이크로프로세서에서 일어날 수 있다는 점을 인지하고 있다. 예를 들어 "신호"라는 단어의 사용은 반드시 아날로그 신호나 디지털 신호를 의미하는 것은 아니다. 메모리 내의 데이터, 심지어 단일 비트도 신호일 수 있다.

프로그래밍 의미에서 "효율"은 함수를 실행하는데 필요한 명령의 수이다. 많은 명령보다 소수의 명령이 보다 더 효율적이다. 기계(어셈블리) 언어 외의 언어에서, 코드 라인은 수백 개의 명령을 포함할 수 있다. 여기서 사용된 바와 같이, 단위 시간당 실행될 수 있는 명령의 수가 동작이나 어떤 함수를 실행하는데 얼마나 오래 걸리는지를 결정하기 때문에 "효율"은 코드 라인이 아니라 기계 언어 명 령에 관련된다.

"바크 대역" 또는 "바크 스케일"은 인간의 청각 시스템이 일련의 대역 통과 필터와 유사한 일반적으로 허용되는 인간의 청각 모델을 말한다. 이러한 필터의 대역폭은 주파수에 따라 증가하고 주파수 인식 정확도는 주파수 증가에 따라 감소한다. 대역을 계산하기 위한 약간 다른 몇 가지 공식이 공지되어 있다. 바크 스케일은 24개의 대역을 포함하며, 전화 시스템의 대역폭은 정상적인 인간의 전체 청각 범위보다 좁기 때문에 이들 18개의 하위 대역만이 발명에 사용된다. 다른 애플리케이션에서 발명을 구현하기 위해 다른 대역 및 대역폭이 대신 사용될 수 있다.

종래 기술에서, 잡음 전력의 추정은 계산상으로 집약적이어서, 빠른 계산 또는 계산을 완료하기에 충분한 시간을 요한다. 빠른 계산은 높은 클록 레이트 및 배터리 작동 장치에서 특히 원하는 것보다 많은 전력을 필요로 한다. 계산에 너무 많은 시간이 걸리면 계산 동안 입력 신호가 상당히 변하기 때문에 에러가 발생할 수 있다.

따라서 상술한 관점에서, 본 발명의 목적은 전화기나 다른 통신 장치에서 잡음 억제를 위한 보다 효율적인 시스템을 제공하는 것이다.

본 발명의 다른 목적은 종래 기술의 시스템만큼 또는 더욱 우수하게 수행하는 잡음 억제를 위한 효율적인 시스템을 제공하는 것이다.

본 발명의 또 다른 목적은 종래 기술의 회로보다 왜곡이 적은 잡음 억제 회로를 제공하는 것이다.

상술한 목적은 입력 신호가 이산 푸리에 분석에 의해 주파수 영역으로 변환되고 바크 대역으로 분할되는 본 발명으로 달성된다. 각 대역에 대해 잡음이 추정된다. 잡음을 추정하는 회로는 말하는 동안보다 잡음이 있는 동안 잡음 추정을 업데이트하기 위한 느린 시정수를 갖는 평활화 필터를 포함한다. 잡음 억제기는 입력 신호의 각 프레임의 신호대 잡음비에 반비례하여 잡음 억제 인자를 조정하는 회로를 더 포함한다. 잡음 추정치는 각 대역의 신호로부터 차감된다. 이산 푸리에 역변환은 신호를 다시 시간 영역으로 변환하며, 중첩 및 조합된 윈도우가 처리중에 발생할 수 있었던 아티팩트(artifacts)를 제거한다.

첨부 도면과 관련하여 다음의 상세한 설명을 고려함으로써 발명의 보다 완벽한 이해를 구할 수 있다.

도 1은 탁상 전화의 사시도이다.

도 2는 무선 전화의 사시도이다.

도 3은 회의용 전화 또는 스피커폰의 사시도이다.

도 4는 핸즈프리 키트의 사시도이다.

도 5는 셀룰러폰의 사시도이다.

도 6은 전화기에서 오디오 처리 회로의 일반 블록도이다.

도 7은 본 발명의 바람직한 실시예에 따라 구성된 잡음 억제기의 블록도이다.

도 8은 본 발명에 따라 구성된 잡음 계산 회로의 블록도이다.

도 9는 본 발명에 따라 변형된 도블링거 잡음 추정을 계산하는 프로세스를 설명하는 흐름도이다.

도 10은 잡음에서 음성의 존재 또는 부재를 추정하고 그에 따라 이득 계수를 설정하는 프로세스를 설명하는 흐름도이다.

신호는 아날로그 또는 디지털일 수 있기 때문에, 블록도는 하드웨어, 소프트웨어, 예를 들어 흐름도, 또는 하드웨어와 소프트웨어의 결합으로 해석될 수 있다. 마이크로프로세서의 프로그래밍은 개별적으로 또는 그룹으로 당업자의 능력 내에서 적절하다.

본 발명은 내부적 전자공학은 본질적으로 동일하지만 장치의 외관이 다른 많은 애플리케이션에서 용도를 찾는다. 도 1은 베이스(10), 키패드(11), 디스플레이(13) 및 핸드셋(14)을 포함하는 탁상 전화를 나타낸다. 도 1에 나타낸 바와 같이, 전화기는 스피커(15)와 마이크(16)를 포함하는 스피커폰 능력이 있다. 도 2에 나타낸 무선 전화는 베이스(20) 및 핸드셋(21)이 코드 대신 안테나(23, 24)를 통해 무선 주파수 신호로 연결된다는 점을 제외하고 비슷하다. 핸드셋(21)을 위한 전력은 핸드셋이 거치대(2)에 얹혀 있을 때 베이스(20)에 있는 단자(26, 27)를 통해 충전되는 (도시하지 않은) 내부 배터리에 의해 공급된다.

도 3은 사무실에서 볼 수 있는 것과 같은 회의용 전화 또는 스피커폰을 나타낸다. 전화기(30)는 조각된 케이스 안에 마이크(31) 및 스피커(32)를 포함한다. 전화기(30)는 마이크(34, 35)와 같이 여러 개의 마이크를 구비하여, 미국 특허 5,138,651호(Sudo)에 개시된 바와 같이 에코 거부 또는 잡음 거부를 위해 여러 개의 입력을 제공하거나 음성 수신을 개선할 수 있다.

도 4는 도 5에 나타낸 셀룰러폰에 대한 오디오 결합을 제공하는 핸즈프리 키트로 알려진 것을 나타낸다. 핸즈프리 키트는 다양하게 구현되지만, 일반적으로 차량의 액세서리 콘센트나 담배 라이터 소켓에 맞는 플러그(37)에 부착된 전원 스피커(36)를 포함한다. 또한, 핸즈프리 키트는 플러그(39)에서 끝나는 케이블(38)을 포함한다. 플러그(39)는 셀룰러폰(42)의 소켓(41)(도 5)과 같이 셀룰러폰의 핸드셋 소켓에 맞는다. 어떤 키트는 무선 전화처럼 RF 신호를 사용하여 전화에 연결된다. 또한, 핸즈프리 키트는 일반적으로 볼륨 제어 및 예를 들어 "훅을 들어" 전화에 응답하기 위한 어떤 제어 스위치를 포함한다. 또한, 핸즈프리 키트는 일반적으로 키트에 접속하는 (도시하지 않은) 바이저 마이크를 포함한다. 본 발명에 따라 구성되는 오디오 처리 회로가 핸즈프리 키트나 셀룰러폰에 포함될 수 있다.

다양한 형태의 전화기는 모두 본 발명으로부터 이익을 얻을 수 있다. 도 6은 셀룰러폰의 주요 구성요소의 블록도이다. 통상적으로, 블록들은 지시된 기능을 구현하는 집적 회로에 대응한다. 마이크(51), 스피커(52) 및 키패드(53)가 신호 처리 회로(54)에 연결된다. 회로(54)는 다수의 기능을 수행하며, 기술분야에서는 제조사마다 다른 여러 가지 명칭으로 알려져 있다. 예를 들어, Infineon은 회로(54)를 "단일 칩 기저대역 IC"라 한다. QualComm은 회로(54)를 "이동국 모뎀"이라 한다. 여러 다른 제조사로부터의 회로들은 세부적으로는 명백히 다르지만, 일반적으로는 지시된 기능들이 포함된다.

셀룰러폰은 가청 주파수 및 무선 주파수 회로를 모두 포함한다. 듀플렉서(55)가 안테나(56)를 수신 프로세서(57)에 연결한다. 듀플렉서(55)는 안테나(56)를 전력 증폭기(58)에 연결하고 송신중에는 수신 프로세서(57)를 전력 증폭기에서 분리한다. 송신 프로세서(59)는 회로(54)로부터의 오디오 신호로 무선 주파수 신호를 변조한다. 스피커폰과 같은 비-셀룰러 애플리케이션에는, 다소 간소화될 수 있는 무선 주파수 회로 및 신호 프로세서(54)가 없다. 에코 상쇄 및 잡음의 문제가 여전하며 오디오 프로세서(60)에서 다뤄진다. 본 발명을 포함하도록 변형되는 것이 오디오 프로세서(60)이다.

가장 최신의 잡음 감소 알고리즘은 스펙트럼 감산으로 알려진 기술에 기반한다. 깨끗한 음성 신호가 부가적인 비상관 잡음 신호에 의해 훼손된다면, 잡음이 있는 음성 신호는 단순히 신호들의 합이다. 잡음 소스의 전력 스펙트럼 밀도(PSD)가 완벽하게 알려진다면, 이는 위너 필터를 이용하여 잡음이 있는 음성 신호로부터 차감되어 깨끗한 음성을 발생시킬 수 있으며, J.S. Lim 및 A.V. Oppenheim, "잡음이 있는 음성의 강화 및 대역폭 압축" Proc. IEEE, vol. 67, pp. 1586-1604(1979년 12월)를 참고한다. 보통은, 잡음 소스가 알려져 있지 않으므로 스펙트럼 차감 알고리즘의 중요한 요소는 잡음 신호의 전력 스펙트럼 밀도(PSD)의 추정이다.

스펙트럼 차감을 이용한 잡음 감소는 다음과 같이 기재될 수 있다.

P _s (f) = P _x (f) - P _n (f)

P _s (f)는 음성의 전력 스펙트럼이고, P _x (f)는 잡음이 있는 음성의 전력 스펙트럼이 며, P _n (f)는 잡음의 전력 스펙트럼이다. 감산 프로세스의 주파수 응답은 다음과 같이 기재될 수 있다.

는 잡음 추정치의 스펙트럼 밀도이고 β는 부대역 신호대 잡음비에 기초한 스펙트럼 가중 인자이다. 깨끗한 음성 추정치는 다음 식에 의해 얻어진다.

Y(f) = X(f)H(f)

단일 채널 잡음 억제 시스템에서, 잡음 신호의 PSD는 잡음이 있는 음성 신호 자체로부터 추정되며, 잡음이 있는 음성 신호는 이용 가능한 유일한 신호이다. 대부분, 잡음 추정은 정확하지 않다. 따라서 부정확한 잡음 추정을 야기하는 왜곡을 줄이기 위한 프로세스에서 어떤 조정이 이루어질 필요가 있다. 이러한 이유로, 대부분의 잡음 억제 방법은 낮은 신호대 잡음비(S/N)를 갖는 주파수는 감쇄되고 높은 S/N을 갖는 주파수는 변경되지 않도록 스펙트럼 가중 인자를 제어하는 파라미터 β를 도입한다.

도 7은 본 발명의 바람직한 실시예에 따라 구성된 잡음 억제기와 관련된 오디오 프로세서(60)의 일부 블록도이다. 오디오 프로세서(60)는 잡음 억제 외에도 에코 상쇄, 추가 필터링, 및 본 발명과 관련이 없는 다른 기능을 포함한다. 다음 설명에서, 제목의 번호는 도 7의 블록에 관련된다. 라인 입력(66)과 스피커 출력(68) 사이의 점선(79)으로 나타낸 수신 채널에 제 2 잡음 억제 회로가 연결될 수도 있다.

71 - 분석 윈도우

정보 블록들을 처리함으로써 잡음 감소 프로세스가 수행된다. 블록의 크기는 예를 들어 128개의 샘플이다. 본 발명의 일 실시예에서, 입력 프레임 크기는 32개의 샘플이다. 그러므로 입력 데이터는 처리를 위해 버퍼링되어야 한다. 입력 데이터를 윈도윙(windowing)하기 전에 128 워드 크기의 버퍼가 사용된다.

버퍼링된 데이터는 윈도윙 되어 주파수 영역에서의 블록 처리에 의해 유입된 아티팩트를 줄인다. 다른 윈도우 옵션이 이용 가능하다. 윈도우 선택은 다른 인자들, 즉 메인 로브 폭, 사이드 로브 레벨 및 중첩 크기에 기초한다. 전처리에 사용되는 윈도우 타입은 메인 로브 폭 및 사이드 로브 레벨에 영향을 준다. 예를 들어, 해닝(Hanning) 윈도우는 직사각형 윈도우에 비해 넓은 메인 로브 및 낮은 사이드 로브 레벨을 갖는다. 여러 타입의 윈도우가 기술분야에 공지되어 있으며, 이득 및 평활화 계수와 같은 일부 파라미터를 적당히 조정하여 사용될 수 있다.

주파수 영역 처리에 의해 유입된 아티팩트는 보다 작은 중첩이 사용된다면 더욱 악화된다. 그러나 보다 큰 중첩이 사용된다면 계산상의 요건이 늘어나게 될 것이다. 합성 윈도우의 사용은 재구성 단계에서 유입된 아티팩트를 감소시킨다. 상기의 모든 인자를 고려하여, 각각 25% 중첩되는 평탄한 사다리꼴 분석 윈도우 및 평탄한 사다리꼴 합성 윈도우가 사용된다. 128-점 이산 푸리에 변환의 경우, 25% 중첩은 이전 프레임으로부터의 마지막 32개 샘플이 현재 프레임에 대한 최초(가장 오래된) 32개의 샘플로서 사용된다는 것을 의미한다.

중첩 크기 D는 (2·D _ana - D _syn )과 같다. D _ana 가 24와 같고 D _syn 이 16과 같다면, D = 32이다. 분석 윈도우 W _ana (n)는 다음과 같이 주어진다.

0 ≤ n < D _ana ,

1 D _ana ≤ n < 128 - D _ana ,

128 - D _ana ≤ n < 128

합성 윈도우 W _syn (n)은 다음과 같이 주어진다.

0 0 ≤ n < (D _ana - D _syn ),

(D _ana - D _syn ) ≤ n < D _ana

1 D _ana ≤ n < 128 - D _ana

128 - D _ana ≤ n < 128 - (D _ana - D _syn )

0 128 - (D _ana - D _syn ) ≤ n < 128

중간 간격은 두 윈도우 모두 동일하다. 완벽한 재구성을 위해, 분석 윈도우 및 합성 윈도우는 다음 조건을 만족한다.

0 ≤ n < D의 구간에서는

W _ana (n)W _syn (n) + W _ana (n + 128 - D)W _syn (n + 128 - D) = 1

D ≤ n < 96의 구간에서는

W _ana (n)W _syn (n) = 1

버퍼링된 데이터는 다음의 분석 윈도우를 이용하여 윈도윙되며, x(m,n)은 프레임(m)에서 버퍼링된 데이터이다.

x _w (m,n) = x(m,n)*W _ana (n)

72 - 순방향 이산 푸리에 변환( DFT )

윈도윙된 시간 영역 데이터는 다음 변환식으로 주어진 이산 푸리에 변환을 이용하여 주파수 영역으로 변환된다.

여기서 x _w (m,k)는 프레임(m)에서 윈도윙된 시간 영역 데이터이고, X(m,k)는 프레임(m)에서 변환된 데이터이며, N은 DFT 크기이다. 입력된 시간 영역 데이터는 실수이므로, DFT의 출력은 N/2 인자로 정규화된다.

74 - 주파수 영역 처리

잡음 억제 회로의 주파수 응답이 계산되며, 도 8의 블록도에 나타낸 여러 가 지 양상을 갖는다. 다음 설명에서, 제목의 번호는 도 8의 블록을 참조한다.

81 - 전력 스펙트럼 밀도( PSD ) 추정

잡음이 있는 음성의 전력 스펙트럼 밀도는 다음과 같이 정의된 1차 순환 필터를 이용하여 근사화된다.

여기서 P _x (m,k)는 프레임(m)에서 잡음이 있는 음성의 전력 스펙트럼 밀도이고, P _x (m-1,k)는 프레임(m-1)에서 잡음이 있는 음성의 전력 스펙트럼 밀도이다. |X(m,k)|²은 프레임(m)에서 잡음이 있는 음성의 크기 스펙트럼이고, k는 주파수 인덱스이다. ε _s 는 스펙트럼 평활화 계수이다.

82 - 바크 대역 에너지 추정

잡음 감소 프로세스 도중 유입되는 스펙트럼 아티팩트를 감소시키기 위해 부대역 기반 신호 분석이 수행된다. 부대역은 인간의 귀의 지각력을 모델화하는 ("임계 대역"이라고도 하는) 바크 대역에 기반한다. 협대역 음성 스펙트럼에서 바크 대역의 중간 주파수 및 대역 에지가 다음 표에 나타난다.

대역 번호	범위(㎐)	중간 주파수(㎐)
1	0-100	50
2	100-200	150
3	200-300	250
4	300-400	350
5	400-510	450
6	510-630	570
7	630-770	700
8	770-920	840
9	920-1080	1000
10	1080-1270	1175
11	1270-1480	1370
12	1480-1720	1600
13	1720-2000	1850
14	2000-2320	2150
15	2320-2700	2500
16	2700-3150	2900
17	3150-3700	3400
18	3700-4400	4000

잡음이 있는 음성 프레임의 DFT는 17개의 바크 대역으로 분할된다. 128-점 DFT의 경우, 각 바크 대역에 대응하는 스펙트럼 빈 번호는 다음 표에 나타난다.

대역 번호	주파수 범위(㎐)	스펙트럼 빈 번호	지점 개수
1	0-125	0,1,2	3
2	187.5-250	3,4	2
3	312.5-375	5,6	2
4	437.5-500	7,8	2
5	562.5-625	9,10	2
6	687.5-750	11,12	2
7	812.5-875	13,14	2
8	937.5-1062.5	15,16,17	3
9	1125-1250	18,19,20	3
10	1312.5-1437.5	21,22,23	3
11	1500-1687.5	24,25,26,27	4
12	1750-2000	28,29,30,31,32	5
13	2062.5-2312.5	33,34,35,36,37	5
14	2375-2687.5	38,39,40,41,42,43	6
15	2750-3125	44,45,46,47,48,49,50	7
16	3187.5-3687.5	51,52,53,54,55,56,57,58,59	9
17	3750-4000	60,61,62,63,64	5

각 바크 대역에서 잡음이 있는 음성의 에너지는 다음과 같이 계산된다.

각 바크 대역에서 잡음의 에너지는 다음과 같이 계산된다.

여기서 f _H (i) 및 f _L (i)는 바크 대역(i)에서 각각 최고 및 최저 주파수에 대응하는 스펙트럼 빈 번호이고, P _x (m,k) 및 P _n (m,k)는 각각 잡음이 있는 음성 및 잡음 추정치의 전력 스펙트럼 밀도이다.

84 - 잡음 추정

라이너 마틴(Rainer Martin)은 최소 통계에 기반한 잡음 추정의 초기 제안자였으며, "최소 통계에 기반한 스펙트럼 차감" Proc. 제 7 회 유럽 신호 처리 컨퍼런스, EUSIPCO-94(1994년 9월 13일-16일), pp. 1182-1185를 참고한다. 이 방법은 음성의 휴지를 찾아 배경 잡음을 추정하기 위한 음성 액티비티 검출기를 필요로 하지 않는다. 대신, 이 알고리즘은 유한 시간 윈도우 내의 전력 스펙트럼 밀도의 최소 추정치를 사용하여 잡음 레벨을 추정한다. 이 알고리즘은 각 스펙트럼 빈에서 잡음이 있는 음성 신호의 단기 전력 추정치가 시간에 대해 뚜렷한 피크 및 밸리를 나타낸다는 관찰에 기반한다. 신뢰성 있는 잡음 전력 추정치를 얻기 위해, 데이터 윈도우 또는 버퍼 길이는 상상할 수 있는 가장 긴 음성 액티비티에 걸치도록 충분 히 길어야 하며, 또는 잡음이 대략 변화하지 않고 일정하도록 충분히 짧아야 한다. M개의 부대역 전력 샘플의 윈도우 내의 단기 전력 추정치 P _x (m,k)의 최소값으로서 잡음 전력 추정치 P _n (m,k)가 구해진다. 알고리즘의 계산상의 복잡성을 줄이고 지연을 줄이기 위해, M 길이의 한 윈도우에 대한 데이터는 l 길이의 w개의 윈도우로 분해되어 l*w = M이다.

최소값을 위해 서브 윈도우 기반 검색을 이용하는 것이 마틴의 잡음 추정 방법의 계산상 복잡성을 줄일지라도, 상기 검색은 부대역마다 각 서브 윈도우에 최소값을 저장하기 위해 상당량의 메모리를 필요로 한다. 게르하르트 도블링거(Gerhard Doblinger)는 최소 통계를 추적하는 계산상 효율적인 알고리즘을 제안하였으며, G. Doblinger, "부대역에서의 스펙트럼 최소값 추적에 의한 계산상 효율적인 음성 증강", Proc. 제 4 회 유럽 컨퍼런스 음성, 통신 및 기술, EUROSPEECH'95 (1995년 9월 18일-21일), pp. 1513-1516을 참고한다. 이 알고리즘의 흐름도는 도 9에서 얇은 선으로 나타낸다. 이 알고리즘에 따르면, 잡음이 있는 음성 스펙트럼의 현재 값(프레임 m)이 이전 프레임(프레임 m-1)의 잡음 추정치보다 작으면, 잡음 추정치가 현재 잡음이 있는 음성 스펙트럼으로 업데이트된다. 그렇지 않으면, 현재 프레임에 대한 잡음 추정치는 1차 평활화 필터에 의해 업데이트된다. 이 1차 평활화는 현재 잡음이 있는 음성 스펙트럼 P _x (m,k), 이점 프레임의 잡음 있는 음성 스펙트럼 P _x (m-1,k) 및 이전 프레임의 잡음 추정치 P _n (m-1,k)의 함수이다. 도 9에서 파라미터(β, γ)는 배경 잡음의 단기 고정 장애에 맞추는데 사용된다. 알고리 즘에 사용되는 β 및 γ의 값은 각각 0.5 및 0.995이며, 달라질 수 있다.

도블링거의 잡음 추정 방법은 보다 적은 메모리를 필요로 하는 단순한 1차 필터를 사용하여 최소 통계를 추적한다. 그러므로 도블링거의 방법은 마틴의 최소 통계 알고리즘보다 효율적이다. 도블링거의 방법은 마틴의 방법과 비교할 때 두 방법 모두 동일한 수렴 시간을 갖더라도 음성 프레임 동안 잡음을 과장한다. 이러한 잡음 과장은 스펙트럼 차감 동안 음성을 왜곡하게 된다.

본 발명에 따르면, 도블링거의 잡음 추정 방법은 도 9에서 두꺼운 선으로 지시하는 바와 같이, 프로세스에 삽입된 부가적인 테스트에 의해 변형된다. 변형에 따르면, 현재 잡음이 있는 음성 스펙트럼이 잡음 추정치에서 상당량 벗어난다면, 매우 느린 시정수를 갖는 1차 지수 평균 평활화 필터가 사용되어 현재 프레임의 잡음 추정치를 업데이트한다. 이러한 느린 시정수 필터의 효과는 잡음 추정치를 감소시키고 추정치의 변화를 느리게 하는 것이다.

도 9에서 파라미터(μ)는 배경 잡음에 갑작스런 변화가 있을 때 잡음 추정치의 수렴 시간을 제어한다. 파라미터(μ)의 값이 높아질수록 수렴 시간은 느려지고 음성 왜곡은 작아진다. 그러므로 파라미터(μ)의 조정은 잡음 추정 수렴 시간과 음성 왜곡과의 균형이다. 파라미터(ν)는 잡음 추정치로부터 잡음이 있는 음성 스펙트럼의 편향 임계치를 제어한다. 본 발명의 일 실시예에서, ν는 3 값을 갖는다. 다른 값들이 대신 사용될 수 있다. 임계치가 낮으면 수렴 시간이 증가한다. 임계치가 높으면 왜곡이 증가한다. 1~9 범위가 유용한 것으로 여겨지지만, 그 한계가 결정적인 것은 아니다.

89 - 스펙트럼 이득 계산

변형된 위너 필터링

다양한 고급 스펙트럼 이득 계산 방법이 논문에서 입수될 수 있다. 예를 들어, Y. Ephraim 및 D. Malah의 "최소 평균 제곱 에러 단기 스펙트럼 진폭 추정기를 이용한 음성 증강", IEEE Trans. 음향, 음성, 신호 처리, vol. ASSP-32, pp. 1109-1121(1984년 12월); Y. Ephraim 및 D. Malah의 "최소 평균 제곱 에러 로그 스펙트럼 진폭 추정기를 이용한 음성 증강", IEEE Trans. 음향, 음성 신호 처리, vol. ASSP-33(2), pp. 443-445(1985년 4월); 및 I. Cohen의 "신호 존재 불확실성 하에서의 음성 증강", 음향, 음성, 신호 처리에 관한 제 26 회 IEEE 국제 컨퍼런스 회보, ICASSP-01(유타 솔트레이크 시티), pp. 7-11(2001년 5월)을 참고한다.

닫혀 있는 형태의 스펙트럼 이득 공식은 음성의 실제 스펙트럼 진폭과 음성의 스펙트럼 진폭 추정치 사이의 평균 제곱 에러를 최소화한다. 다른 닫힌 형태의 스펙트럼 이득 공식은 실제 음성 진폭의 로그와 추정된 음성 진폭의 로그 사이의 평균 제곱 오차를 최소화한다. 이들 알고리즘은 이론적으로는 최적일 수도 있지만, 이들 알고리즘의 실제 성능은 잡음이 매우 많은 조건에서는 상업적으로 실용적이지 않다. 이들 알고리즘은 중간 정도로 잡음이 있는 환경에서도 중대한 음질 아티팩트를 생성한다. 변형된 많은 알고리즘이 상기 두 개요로부터 유도되었다.

일반화된 위너 필터링에 기반하여 신호대 잡음비의 함수로서 스펙트럼 이득을 계산하는 것이 공지되어 있으며; L. Arslan, A. McCree, V. Viswanathan의 "적 응 잡음 억제를 위한 신규 방법", 음향, 음성, 신호 처리에 관한 제 26 회 IEEE 국제 컨퍼런스 회보, ICASSP-01(유타 솔트레이크 시티), pp. 812-815(2001년 5월)를 참고한다. 일반화된 위너 필터는 다음과 같이 주어진다.

여기서

는 깨끗한 음성 전력 스펙트럼 추정치이고,

는 잡음 추정치의 전력 스펙트럼이며, α는 잡음 억제 인자이다. 깨끗한 음성 스펙트럼을 추정하기 위한 많은 방법이 있다. 예를 들어, 깨끗한 음성 스펙트럼은 선형 예측 코딩 모델 스펙트럼으로서 추정될 수 있다. 깨끗한 음성 스펙트럼은 단지 이득이 변경된 잡음 있는 음성 스펙트럼 P _x (m,k)으로부터 계산될 수도 있다.

여기서 Ex(m)은 프레임(m)에서 잡음이 있는 음성 에너지이고, En(m)은 프레임(m)에서 잡음 에너지이다. 신호대 잡음비(SNR)는 다음과 같이 계산된다.

일반화된 위너 필터 공식에서 상기 식을 빼면 다음 식이 얻어지고,

여기서 SNR(m)은 프레임 번호(m)에서의 신호대 잡음비이고, α'는 (E _x (m)/E _n (m))α)와 같은 새로운 잡음 억제 인자이다. H(m,k)는 신호대 잡음비에 따라 변하기 때문에 상기 식은 잡음 있는 프레임에 대해 보다 강한 억제를 유성음 프레임 동안에는 보다 약한 억제를 보장한다.

바크 대역 기반 변형된 위너 필터링

변형된 위너 필터 솔루션은 전체 프레임(m)의 신호대 잡음비에 기반한다. 스펙트럼 이득 함수는 전체 프레임의 신호대 잡음비에 기반하기 때문에, 스펙트럼 이득값은 유성음 프레임 동안에는 더 크고 무성음 프레임 동안에는 더 작을 것이다. 이는 "잡음 펌핑"을 야기하게 되며, 이는 온/오프 전환되는 잡음처럼 들린다. 이러한 문제점을 해결하기 위해, 본 발명의 다른 형태에 따르면, 바크 대역 기반 스펙트럼 분석이 수행된다. 각 프레임의 각 대역에서 다음과 같이 신호대 잡음비가 계산된다.

여기서 Ex(m,i) 및 En(m,i)는 각각 프레임(m)의 대역(i)에서 각각 잡음 있는 음성 에너지 및 잡음 에너지이다. 결국, 변형된 위너 솔루션에서 바크 대역 SNR을 이용함으로써 바크 대역 기반 스펙트럼 이득값이 계산된다.

여기서 f _L (i) 및 f _H (i)는 바크 대역(i)에서 각각 최고 및 최저 주파수의 스펙트럼 빈 번호이다.

스펙트럼 차감 기반 방법의 단점들 중 하나는 음질 아티팩트의 유입이다. 잡음 추정의 불확실성으로 인해, 어떤 스펙트럼 피크는 스펙트럼 차감 뒤에 나머지로서 남게 된다. 이러한 스펙트럼 피크가 음질 자체를 명시한다. 아티팩트를 줄이기 위해, 잡음 억제 인자(α')는 상기에 계산된 것보다 큰 값으로 유지되어야 한다. 그러나 α' 값이 크면 유성음 왜곡이 더 커지게 된다. 파라미터(α')의 조정은 음성 진폭 감소와 음질 아티팩트 간의 균형이다. 이는 대화 도중 잡음 감소량을 제어하는 새로운 메커니즘으로 이끈다.

음성 증강을 개선하기 위해 잡음이 있는 스펙트럼 성분에서 신호 존재의 불확실성을 이용하는 아이디어가 공지되어 있으며; R.J. McAulay 및 M.L. Malpass의 "연판정 잡음 억제 필터를 이용한 음성 증강", IEEE Trans. 음향, 음성 신호 처리, vol. ASSP-28, pp. 137-145(1980년 4월)를 참고한다. 잡음이 있는 환경에 음성이 존재할 확률을 계산한 후, 계산된 확률은 잡음 억제 인자(α)를 조정하는데 사용된다.

유성음을 검출하는 한 가지 방법은 잡음이 있는 음성 에너지 스펙트럼과 잡음 에너지 스펙트럼과의 비를 계산하는 것이다. 이 비율이 매우 크다면, 유성음이 존재하는 것으로 추정할 수 있다. 본 발명의 다른 형태에 따르면, 음성이 존재할 확률은 바크 대역마다 계산된다. 이 바크 대역 분석은 양호한 품질의 음성 증강에 의해 계산이 절약된다. 상기 비를 계산하기 위한 첫 번째 단계는 다음과 같다.

E _x (m,i) 및 E _n (m,i)는 상기와 동일한 정의를 갖는다. 상기 비는 임계치(λ_th)와 비교되어 음성이 존재하는지 여부를 판단한다. 임계치를 초과할 때 음성이 존재하며, 도 10을 참고한다.

음성 존재 확률은 1차 지수 평균(평활화) 필터에 의해 계산된다.

p(m,i) = ε _p p(m-1,i) + (1-ε _p )I _p

여기서 ε _p 는 확률 평활화 인자이고, I _p 는 음성이 존재할 때는 1과 같고 음성이 존재하지 않을 때는 0과 같다. 연속한 프레임에서 음성 존재의 상관성은 필터에 의해 포착된다.

잡음 억제 인자(α)는 음성 존재 확률을 임계치(p _th )와 비교함으로써 결정된다. 구체적으로, α는 임계치를 초과하지 않을 때보다 임계치를 초과하는 경우에 더 낮은 값으로 설정된다. 또, 상기 인자는 대역마다 계산된다는 점에 유의한다.

스펙트럼 이득 제한

스펙트럼 이득은 이득이 최소값, 예를 들어 -20㏈ 이하로 떨어지는 것을 방 지하도록 제한된다. 시스템은 보다 적은 이득이 가능하지만, 최소값 이하로 이득을 감소시키는 것은 허용되지 않는다. 값은 중요하지 않다. 이득 제한은 스펙트럼 이득의 고정 점 계산의 유한한 정확성에 기인할 수 있는 음질 아티팩트 및 음성 왜곡을 줄인다.

이득의 하한은 스펙트럼 이득 계산 프로세스에 의해 조정된다. 바크 대역의 에너지가 어떤 임계값(E _th )보다 적다면, 최소 이득은 -1㏈로 설정된다. 단편이 유성음으로 분류된다면, 즉 확률이 p _th 를 초과한다면, 최소 이득은 -1로 설정된다. 어떤 조건도 만족하지 않는다면, 최소 이득은 허용되는 최저 이득, 예를 들어 -20㏈로 설정된다. 본 발명의 일 실시예에서, E _th 에 적당한 값은 0.01이다. p _th 에 적당한 값은 0.1이다. 대역마다 프로세스가 반복되어 각 대역의 이득을 조정한다.

스펙트럼 이득 평활화

모든 블록 변환 기반 처리에서, 윈도윙 및 중첩-가산은 주파수 영역에서 블록의 신호를 처리함으로써 유입되는 아티팩트를 줄이기 위한 공지 기술이다. 이러한 아티팩트의 감소는 윈도우의 메인 로브의 폭, 윈도우에서 사이드 로브의 경사, 및 블록간 중첩량과 같은 여러 가지 인자에 영향을 받는다. 메인 로브의 폭은 사용되는 윈도우 타입에 영향을 받는다. 예를 들어, 해닝(상승 코사인) 윈도우는 직사각형 윈도우보다 넓은 메인 로브 및 낮은 사이드 로브 레벨을 갖는다.

제어된 스펙트럼 이득은 윈도우를 평활화하고 중첩 및 가산 프로세스 동안 중첩 경계에 불연속을 발생시킨다. 이러한 불연속성은 스펙트럼 이득 함수의 시변 특성에 의해 발생한다. 이 아티팩트를 줄이기 위해, 본 발명에 따르면 다음의 기술, 즉 주파수 축을 따른 스펙트럼 이득 평활화, (순간 이득값의 사용 대신) 평균 바크 대역 이득, 시간 축을 따른 스펙트럼 이득 평활화를 채용한다.

92 - 주파수에 따른 이득 평활화

주파수에 따른 갑작스런 이득 변화를 피하기 위해, 다음과 같이 주어진 지수 평균 평활화 필터를 사용하여 주파수 축을 따라 스펙트럼 이득이 평활화된다.

H'(m,k) = ε _gf H'(m,k-1) + (1-ε _gf )H(m,k)

여기서 ε _gf 는 주파수에 따른 이득 평활화 인자이고, H(m,k)는 스펙트럼 빈 번호(k)에서의 순간 스펙트럼 이득이며, H'(m,k-1)는 스펙트럼 빈 번호(k-1)에서 평활화된 스펙트럼 이득이고, H'(m,k)는 스펙트럼 빈 번호(k)에서 평활화된 스펙트럼 이득이다.

93 - 평균 바크 대역 이득 계산

스펙트럼 이득의 갑작스런 변화는 또한 각 바트 대역의 스펙트럼 이득을 평균함으로써 감소한다. 이는 바크 대역의 모든 스펙트럼 빈이 동일한 스펙트럼 이득을 가짐을 의미하며, 그 이득은 해당 바크 대역의 모든 스펙트럼 이득 사이의 평균이다. 대역의 평균 스펙트럼 이득 H' _avg (m,k)은 간단히 대역에서 이득의 합을 대 역의 빈 개수로 나눈 것이다. 가장 높은 주파수 대역의 대역폭이 가장 낮은 주파수 대역의 대역폭보다 넓기 때문에, 스펙트럼 이득의 평균은 높은 대역에서의 협대역 잡음 감소에 있어 낮은 대역에서만큼 효과적인 것은 아니다. 따라서 약 1.35㎑보다 낮은 주파수 성분을 갖는 대역에 대해서만 평균이 실행된다. 한계는 중요하지 않으며 취향, 편의 또는 다른 고려사항에 맞게 실험에 의해 조정될 수 있다.

94 - 시간에 따른 이득 평활화

급속히 변화하는 잡음 있는 환경에서는, 증강된 출력 음성에 낮은 주파수 잡음 플러터(flutter)가 유입될 것이다. 이 플러터는 대부분의 스펙트럼 차감 기반 잡음 감소 시스템의 부산물이다. 배경 잡음이 급속히 변화하고 잡음 추정이 급속한 변화에 적응할 수 있다면, 스펙트럼 이득 또한 빠르게 변화하여 플러터를 생성할 것이다. 낮은 주파수 플러터는 다음과 같이 주어진 1차 지수 평균 평활화 필터를 사용하여 시간에 따라 스펙트럼 이득 H"(m,k)을 평활화함으로써 감소한다.

H"(m,k) = ε _gf H "(m-1,k) + (1-ε _gf )H" _avg (m,b(i)) f(k) < 1.35㎑

H"(m,k) = ε _gf H "(m-1,k) + (1-ε _gf )H'(m,k) f(k) ≥ 1.35㎑

여기서 f(k)는 바크 대역(k)의 중심 주파수이고, ε _gf 는 시간에 따른 이득 평활화 인자이고, b(i)는 스펙트럼 빈의 바크 대역 번호(k)이며, H'(m,k)는 프레임 인덱스(m)에서 (주파수에 따라) 평활화된 스펙트럼 이득이고, H'(m-1,k)는 프레임 인덱스(m-1)에서 (주파수에 따라) 평활화된 스펙트럼 이득이며, H" _avg (m,k)는 프레임 인덱 스(m)에서 (주파수에 따라) 평활화되고 평균화된 스펙트럼 이득이다.

과도한 평활화는 음성에 끝 부분 에코(여운) 또는 잡음 펌핑을 발생시키게 되므로 평활화는 파라미터(ε _gf )에 민감하다. 또한, 이득 평활화가 너무 높게 설정되면 음성 진폭의 상당한 감소가 있을 수 있다. 0.1 ~ 0.3의 값이 ε _gf 에 적당하다. 주어진 다른 값들에 대해, 특정 값은 이 동작 전에 신호가 어떻게 처리되었는지에, 즉 사용된 이득에 좌우된다.

76 - 이산 푸리에 역변환

블록(75)에서 잡음이 있는 음성 스펙트럼에 스펙트럼 이득 함수를 곱함으로써 깨끗한 음성 스펙트럼이 얻어진다. 이는 차감과 같이 보이는 것이 아니라, 다음 식에 의해 깨끗한 음성 추정치가 얻어지는 것으로 결론이 나는 상기에 주어진 초기 전개식을 상기시킬 수 있다.

Y(f) = X(f)H(f)

차감은 곱셈기 H(f)에 포함된다.

깨끗한 음성 스펙트럼은 다음 변환식으로 주어진 이산 푸리에 역변환을 이용하여 다시 시간 영역으로 변환된다.

여기서 X(m,k)H(m,k)는 깨끗한 음성 추정치이고, s(m,n)은 프레임(m)에서 시간 영 역의 깨끗한 음성 추정치이다.

77 - 합성 윈도우

블록화 현상을 줄이기 위해 합성 윈도우를 이용하여 깨끗한 음성이 윈도윙된다.

78 - 중첩 및 가산

마지막으로, 윈도윙된 깨끗한 음성은 다음과 같이 이전 프레임과 중첩 및 가산된다.

여기서 s _w (m-1,...)은 이전 프레임의 윈도윙된 깨끗한 음성이고, s _w (m,n)은 현재 프레임의 윈도윙된 깨끗한 음성이며, D는 중첩량으로, 본 발명의 일 실시예에서는 상술한 바와 같이 32이다.

이와 같이 본 발명은 변형된 도블링거 잡음 추정, 부대역 기반 위너 필터링, 부대역 이득 연산, 각 부대역에서의 SNR 조정 이득, 이득 평활화 및 사다리꼴 윈도우의 25% 중첩을 이용하여 개선된 잡음 억제를 제공한다. 조합은 종래 기술의 대략 5 MIPS와 비교하여 (Texas Instruments C55xx 프로세서를 이용한 2 MIPS보다 낮 고 2k 미만의 데이터 메모리를 사용한 Motorola Starcore SC140의 1 MIPS보다 낮은) 낮은 MIPS로 연산을 감소시킨다. 또한, 억제 후의 나머지 배경 잡음에 눈에 띄는 변화가 없으며 음질 아티팩트가 더 적다.

이와 같이 본 발명에 대해 설명하였지만, 발명의 범위 내에서 다양한 변형이 이루어질 수 있음이 당업자에게 명백할 것이다. 예를 들어, 바크 대역 모델의 사용이 바람직하지만 필수적인 것은 아니다. 대역 통과 필터는 다른 진행 패턴을 따를 수 있다.

Claims

입력 신호를 다수의 샘플을 각각 포함하는 다수의 프레임으로 분할하는 분석 회로, 잡음 추정치를 계산하는 회로, 상기 입력 신호에서 상기 잡음 추정치를 차감하는 회로, 및 상기 프레임들을 출력 신호로 재구성하는 합성 회로를 포함하는 잡음 억제 회로로서,

입력 신호를 다수의 대역으로 분할하는 다수의 대역 통과 필터; 및

각 대역에서 각 프레임의 신호대 잡음비에 반비례하게 잡음 억제 인자를 계산하는 수단을 포함하는, 잡음 억제 회로.
제 1 항에 있어서,

상기 대역 통과 필터는 바크 대역을 한정하는 것을 특징으로 하는 잡음 억제 회로.
제 2 항에 있어서,

상기 잡음 추정치를 계산하는 회로에서 스펙트럼 이득을 제한하는 회로를 더 포함하는 것을 특징으로 하는 잡음 억제 회로.
제 3 항에 있어서,

음성 검출기를 더 포함하며, 상기 스펙트럼 이득 제한은 음성이 검출되지 않 을 때보다 음성이 검출될 때 더 높은 것을 특징으로 하는 잡음 억제 회로.
제 3 항에 있어서,

상기 잡음 추정치를 계산하는 회로에 연결된 제 1 평활화 회로를 더 포함하며, 상기 제 1 평활화 회로는 상기 입력 신호의 주파수 스펙트럼에 걸쳐 이득을 평활화하는 것을 특징으로 하는 잡음 억제 회로.
제 5 항에 있어서,

상기 제 1 평활화 회로는 대략 2㎑ 이하의 대역에 걸쳐 이득을 평활화하는 것을 특징으로 하는 잡음 억제 회로.
제 1 항에 있어서,

상기 잡음 추정치를 계산하는 회로는,

잡음이 있는 음성 스펙트럼이 잡음 추정치로부터 미리 결정된 양보다 적게 편향할 때보다 상기 잡음이 있는 음성 스펙트럼이 상기 미리 결정된 양보다 많이 편향할 때 프레임의 잡음 추정치를 업데이트함으로써 상기 잡음 추정치를 감소시키고 프레임들 간 추정치 변화를 느리게 하기 위한 느린 시정수를 갖는 평활화 필터를 포함하는 것을 특징으로 하는 잡음 억제 회로.
제 7 항에 있어서,

상기 필터는 1차 지수 평균 평활화 필터인 것을 특징으로 하는 잡음 억제 회로.
입력 신호를 다수의 샘플을 각각 포함하는 다수의 프레임으로 분할하는 분석 회로, 잡음 추정치를 계산하는 회로, 상기 입력 신호에서 상기 잡음 추정치를 차감하는 회로, 및 상기 프레임들을 출력 신호로 재구성하는 합성 회로를 포함하는 잡음 억제 회로로서,

잡음 추정치를 계산하고, 잡음이 있는 음성 스펙트럼이 상기 잡음 추정치로부터 미리 결정된 양보다 적게 편향할 때보다 상기 잡음이 있는 음성 스펙트럼이 상기 미리 결정된 양보다 많이 편향할 때 프레임의 잡음 추정치를 업데이트함으로써 상기 잡음 추정치를 감소시키고 프레임들 간 추정치 변화를 느리게 하기 위한 느린 시정수를 갖는 평활화 필터를 포함하는, 잡음 억제 회로.
제 9 항에 있어서,

각 프레임의 신호대 잡음비에 반비례하게 잡음 억제 인자를 조정하는 회로를 더 포함하는 것을 특징으로 하는 잡음 억제 회로.
제 10 항에 있어서,

각 프레임을 주파수 영역으로 변환하기 위해 상기 입력 신호의 각 프레임의 이산 푸리에 변환을 계산하는 회로를 더 포함하는 것을 특징으로 하는 잡음 억제 회로.
제 11 항에 있어서,

상기 이산 푸리에 변환을 계산하는 회로는 상기 프레임을 점진적으로 더 높은 중간 주파수를 갖는 다수의 대역으로 분할하는 것을 특징으로 하는 잡음 억제 회로.
제 12 항에 있어서,

상기 대역은 바크 대역인 것을 특징으로 하는 잡음 억제 회로.
수신 채널 및 송신 채널을 포함하는 오디오 처리 회로를 구비한 전화기로서,

상기 채널들 중 적어도 하나에 제 1 항에 따른 잡음 억제 회로를 포함하는, 전화기.
수신 채널 및 송신 채널을 포함하는 오디오 처리 회로를 구비한 전화기로서,

상기 채널들 중 적어도 하나에 제 9 항에 따른 잡음 억제 회로를 포함하는, 전화기.