KR100851716B1 - 바크 대역 위너 필터링 및 변형된 도블링거 잡음 추정에기반한 잡음 억제 - Google Patents
바크 대역 위너 필터링 및 변형된 도블링거 잡음 추정에기반한 잡음 억제 Download PDFInfo
- Publication number
- KR100851716B1 KR100851716B1 KR1020067024494A KR20067024494A KR100851716B1 KR 100851716 B1 KR100851716 B1 KR 100851716B1 KR 1020067024494 A KR1020067024494 A KR 1020067024494A KR 20067024494 A KR20067024494 A KR 20067024494A KR 100851716 B1 KR100851716 B1 KR 100851716B1
- Authority
- KR
- South Korea
- Prior art keywords
- noise
- circuit
- estimate
- noise estimate
- signal
- Prior art date
Links
- 230000001629 suppression Effects 0.000 title claims abstract description 33
- 238000001914 filtration Methods 0.000 title description 4
- 238000009499 grossing Methods 0.000 claims abstract description 31
- 238000012545 processing Methods 0.000 claims abstract description 21
- 238000004458 analytical method Methods 0.000 claims abstract description 11
- 230000003595 spectral effect Effects 0.000 claims description 73
- 238000000034 method Methods 0.000 claims description 32
- 238000001228 spectrum Methods 0.000 claims description 31
- 230000008859 change Effects 0.000 claims description 8
- 238000003786 synthesis reaction Methods 0.000 claims description 8
- 230000015572 biosynthetic process Effects 0.000 claims description 7
- 230000007423 decrease Effects 0.000 claims description 3
- 230000000670 limiting effect Effects 0.000 claims description 2
- 238000004422 calculation algorithm Methods 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 230000001413 cellular effect Effects 0.000 description 9
- 230000009467 reduction Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005086 pumping Methods 0.000 description 2
- 238000011946 reduction process Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000012896 Statistical algorithm Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 235000019504 cigarettes Nutrition 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000004941 influx Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- VZUGBLTVBZJZOE-KRWDZBQOSA-N n-[3-[(4s)-2-amino-1,4-dimethyl-6-oxo-5h-pyrimidin-4-yl]phenyl]-5-chloropyrimidine-2-carboxamide Chemical compound N1=C(N)N(C)C(=O)C[C@@]1(C)C1=CC=CC(NC(=O)C=2N=CC(Cl)=CN=2)=C1 VZUGBLTVBZJZOE-KRWDZBQOSA-N 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Noise Elimination (AREA)
Abstract
잡음 억제기에서, 입력 신호는 이산 푸리에 분석에 의해 주파수 영역으로 변환되고 바크 대역으로 분할된다. 각 대역(85)에 대한 잡음이 추정된다. 잡음을 추정하는 회로는 말하는 동안보다 잡음이 있는 동안 잡음 추정치를 업데이트하는 느린 시상수를 갖는 평활화 필터를 포함한다. 잡음 억제기는 또한 입력 신호의 각 프레임의 신호대 잡음비에 반비례하게 잡음 억제 인자(89)를 조정하는 회로를 포함한다. 잡음 추정치는 각 대역의 신호로부터 차감된다. 이산 푸리에 역변환은 신호를 다시 시간 영역으로 변환하고, 중첩 및 조합된 윈도우가 처리중에 발생할 수 있었던 아티팩트를 제거한다.
Description
본 발명은 오디오 신호 처리에 관한 것으로, 특히 잡음을 줄이기 위해 스펙트럼 차감을 이용하는 회로에 관한 것이다.
여기서 사용되는 바와 같이, "전화"는 인가된 서비스 제공자로부터의 발신음을 직접 또는 간접적으로 이용하는 통신 장치에 대한 일반 용어이다. 이와 같이, "전화"는 그 중에서도 특히 탁상 전화(도 1 참고), 무선 전화(도 2 참고), 스피커폰(도 3 참조), 핸즈프리 키트(도 4 참고) 및 셀룰러폰(도 5 참고)을 포함한다. 간소화를 위해, 본 발명은 전화와 관련하여 설명되지만, 예를 들어 무선 주파수 트랜시버나 인터컴 등 발신음을 이용하지 않는 통신 장치와 같이 더 넓은 유틸리티를 갖는다.
전화 시스템에는 많은 잡음 소스가 있다. 어떤 잡음은 원래 가청음인 반면, 다른 잡음 소스는 전자, 예를 들어 전화망이다. 여기서 사용된 바와 같이, "잡음"은 주기적이든, 순전히 랜덤하든 또는 어딘가 중간에 있든 임의의 불필요한 소음을 말한다. 이와 같이, 잡음은 배경음, 원하는 화자 이외의 다른 사람들의 음성, 타 이어 소음, 바람소리 등을 포함한다. 자동차는 특히 시끄러운 환경에 있을 수 있으며, 이는 본 발명을 핸즈프리 키트에 특히 유용하게 한다.
넓게 정의하면, 잡음은 화자의 음성 에코를 포함할 수 있었다. 그러나 전화 시스템에서 에코 상쇄는 개별적으로 취급되고 두 채널에서의 신호 비교를 수반한다. 본 발명은 잡음 억제에 관련되며, 이는 장치가 단일 채널에서 실시간으로 동작함을, 즉 에코 상쇄에서와 같이 지연을 계산하지 않는다는 것을 의미한다.
보편적으로 따르는 것은 아니지만, 종래 기술은 일반적으로 차감에 의한 잡음 "억제" 및 감쇄에 의한 잡음 "감소"와 관련된다. 여기서 사용되는 바와 같이, 잡음 억제는 한 신호에서 다른 신호를 차감하여 잡음의 양을 줄이는 것을 포함한다.
당업자들은 아날로그 신호가 일단 디지털 형태로 변환되면, 이어지는 모든 동작이 적절히 프로그래밍된 하나 이상의 마이크로프로세서에서 일어날 수 있다는 점을 인지하고 있다. 예를 들어 "신호"라는 단어의 사용은 반드시 아날로그 신호나 디지털 신호를 의미하는 것은 아니다. 메모리 내의 데이터, 심지어 단일 비트도 신호일 수 있다.
프로그래밍 의미에서 "효율"은 함수를 실행하는데 필요한 명령의 수이다. 많은 명령보다 소수의 명령이 보다 더 효율적이다. 기계(어셈블리) 언어 외의 언어에서, 코드 라인은 수백 개의 명령을 포함할 수 있다. 여기서 사용된 바와 같이, 단위 시간당 실행될 수 있는 명령의 수가 동작이나 어떤 함수를 실행하는데 얼마나 오래 걸리는지를 결정하기 때문에 "효율"은 코드 라인이 아니라 기계 언어 명 령에 관련된다.
"바크 대역" 또는 "바크 스케일"은 인간의 청각 시스템이 일련의 대역 통과 필터와 유사한 일반적으로 허용되는 인간의 청각 모델을 말한다. 이러한 필터의 대역폭은 주파수에 따라 증가하고 주파수 인식 정확도는 주파수 증가에 따라 감소한다. 대역을 계산하기 위한 약간 다른 몇 가지 공식이 공지되어 있다. 바크 스케일은 24개의 대역을 포함하며, 전화 시스템의 대역폭은 정상적인 인간의 전체 청각 범위보다 좁기 때문에 이들 18개의 하위 대역만이 발명에 사용된다. 다른 애플리케이션에서 발명을 구현하기 위해 다른 대역 및 대역폭이 대신 사용될 수 있다.
종래 기술에서, 잡음 전력의 추정은 계산상으로 집약적이어서, 빠른 계산 또는 계산을 완료하기에 충분한 시간을 요한다. 빠른 계산은 높은 클록 레이트 및 배터리 작동 장치에서 특히 원하는 것보다 많은 전력을 필요로 한다. 계산에 너무 많은 시간이 걸리면 계산 동안 입력 신호가 상당히 변하기 때문에 에러가 발생할 수 있다.
따라서 상술한 관점에서, 본 발명의 목적은 전화기나 다른 통신 장치에서 잡음 억제를 위한 보다 효율적인 시스템을 제공하는 것이다.
본 발명의 다른 목적은 종래 기술의 시스템만큼 또는 더욱 우수하게 수행하는 잡음 억제를 위한 효율적인 시스템을 제공하는 것이다.
본 발명의 또 다른 목적은 종래 기술의 회로보다 왜곡이 적은 잡음 억제 회로를 제공하는 것이다.
상술한 목적은 입력 신호가 이산 푸리에 분석에 의해 주파수 영역으로 변환되고 바크 대역으로 분할되는 본 발명으로 달성된다. 각 대역에 대해 잡음이 추정된다. 잡음을 추정하는 회로는 말하는 동안보다 잡음이 있는 동안 잡음 추정을 업데이트하기 위한 느린 시상수를 갖는 평활화 필터를 포함한다. 잡음 억제기는 입력 신호의 각 프레임의 신호대 잡음비에 반비례하여 잡음 억제 인자를 조정하는 회로를 더 포함한다. 잡음 추정치는 각 대역의 신호로부터 차감된다. 이산 푸리에 역변환은 신호를 다시 시간 영역으로 변환하며, 중첩 및 조합된 윈도우가 처리중에 발생할 수 있었던 아티팩트(artifacts)를 제거한다.
첨부 도면과 관련하여 다음의 상세한 설명을 고려함으로써 발명의 보다 완벽한 이해를 구할 수 있다.
도 1은 탁상 전화의 사시도이다.
도 2는 무선 전화의 사시도이다.
도 3은 회의용 전화 또는 스피커폰의 사시도이다.
도 4는 핸즈프리 키트의 사시도이다.
도 5는 셀룰러폰의 사시도이다.
도 6은 전화기에서 오디오 처리 회로의 일반 블록도이다.
도 7은 본 발명의 바람직한 실시예에 따라 구성된 잡음 억제기의 블록도이다.
도 8은 본 발명에 따라 구성된 잡음 계산 회로의 블록도이다.
도 9는 본 발명에 따라 변형된 도블링거 잡음 추정을 계산하는 프로세스를 설명하는 흐름도이다.
도 10은 잡음에서 음성의 존재 또는 부재를 추정하고 그에 따라 이득 계수를 설정하는 프로세스를 설명하는 흐름도이다.
신호는 아날로그 또는 디지털일 수 있기 때문에, 블록도는 하드웨어, 소프트웨어, 예를 들어 흐름도, 또는 하드웨어와 소프트웨어의 결합으로 해석될 수 있다. 마이크로프로세서의 프로그래밍은 개별적으로 또는 그룹으로 당업자의 능력 내에서 적절하다.
본 발명은 내부적 전자공학은 본질적으로 동일하지만 장치의 외관이 다른 많은 애플리케이션에서 용도를 찾는다. 도 1은 베이스(10), 키패드(11), 디스플레이(13) 및 핸드셋(14)을 포함하는 탁상 전화를 나타낸다. 도 1에 나타낸 바와 같이, 전화기는 스피커(15)와 마이크(16)를 포함하는 스피커폰 능력이 있다. 도 2에 나타낸 무선 전화는 베이스(20) 및 핸드셋(21)이 코드 대신 안테나(23, 24)를 통해 무선 주파수 신호로 연결된다는 점을 제외하고 비슷하다. 핸드셋(21)을 위한 전력은 핸드셋이 거치대(2)에 얹혀 있을 때 베이스(20)에 있는 단자(26, 27)를 통해 충전되는 (도시하지 않은) 내부 배터리에 의해 공급된다.
도 3은 사무실에서 볼 수 있는 것과 같은 회의용 전화 또는 스피커폰을 나타낸다. 전화기(30)는 조각된 케이스 안에 마이크(31) 및 스피커(32)를 포함한다. 전화기(30)는 마이크(34, 35)와 같이 여러 개의 마이크를 구비하여, 미국 특허 5,138,651호(Sudo)에 개시된 바와 같이 에코 거부 또는 잡음 거부를 위해 여러 개의 입력을 제공하거나 음성 수신을 개선할 수 있다.
도 4는 도 5에 나타낸 셀룰러폰에 대한 오디오 결합을 제공하는 핸즈프리 키트로 알려진 것을 나타낸다. 핸즈프리 키트는 다양하게 구현되지만, 일반적으로 차량의 액세서리 콘센트나 담배 라이터 소켓에 맞는 플러그(37)에 부착된 전원 스피커(36)를 포함한다. 또한, 핸즈프리 키트는 플러그(39)에서 끝나는 케이블(38)을 포함한다. 플러그(39)는 셀룰러폰(42)의 소켓(41)(도 5)과 같이 셀룰러폰의 핸드셋 소켓에 맞는다. 어떤 키트는 무선 전화처럼 RF 신호를 사용하여 전화에 연결된다. 또한, 핸즈프리 키트는 일반적으로 볼륨 제어 및 예를 들어 "훅을 들어" 전화에 응답하기 위한 어떤 제어 스위치를 포함한다. 또한, 핸즈프리 키트는 일반적으로 키트에 접속하는 (도시하지 않은) 바이저 마이크를 포함한다. 본 발명에 따라 구성되는 오디오 처리 회로가 핸즈프리 키트나 셀룰러폰에 포함될 수 있다.
다양한 형태의 전화기는 모두 본 발명으로부터 이익을 얻을 수 있다. 도 6은 셀룰러폰의 주요 구성요소의 블록도이다. 통상적으로, 블록들은 지시된 기능을 구현하는 집적 회로에 대응한다. 마이크(51), 스피커(52) 및 키패드(53)가 신호 처리 회로(54)에 연결된다. 회로(54)는 다수의 기능을 수행하며, 기술분야에서는 제조사마다 다른 여러 가지 명칭으로 알려져 있다. 예를 들어, Infineon은 회로(54)를 "단일 칩 기저대역 IC"라 한다. QualComm은 회로(54)를 "이동국 모뎀"이라 한다. 여러 다른 제조사로부터의 회로들은 세부적으로는 명백히 다르지만, 일반적으로는 지시된 기능들이 포함된다.
셀룰러폰은 가청 주파수 및 무선 주파수 회로를 모두 포함한다. 듀플렉서(55)가 안테나(56)를 수신 프로세서(57)에 연결한다. 듀플렉서(55)는 안테나(56)를 전력 증폭기(58)에 연결하고 송신중에는 수신 프로세서(57)를 전력 증폭기에서 분리한다. 송신 프로세서(59)는 회로(54)로부터의 오디오 신호로 무선 주파수 신호를 변조한다. 스피커폰과 같은 비-셀룰러 애플리케이션에는, 다소 간소화될 수 있는 무선 주파수 회로 및 신호 프로세서(54)가 없다. 에코 상쇄 및 잡음의 문제가 여전하며 오디오 프로세서(60)에서 다뤄진다. 본 발명을 포함하도록 변형되는 것이 오디오 프로세서(60)이다.
가장 최신의 잡음 감소 알고리즘은 스펙트럼 감산으로 알려진 기술에 기반한다. 깨끗한 음성 신호가 부가적인 비상관 잡음 신호에 의해 훼손된다면, 잡음이 있는 음성 신호는 단순히 신호들의 합이다. 잡음 소스의 전력 스펙트럼 밀도(PSD)가 완벽하게 알려진다면, 이는 위너 필터를 이용하여 잡음이 있는 음성 신호로부터 차감되어 깨끗한 음성을 발생시킬 수 있으며, J.S. Lim 및 A.V. Oppenheim, "잡음이 있는 음성의 강화 및 대역폭 압축" Proc. IEEE, vol. 67, pp. 1586-1604(1979년 12월)를 참고한다. 보통은, 잡음 소스가 알려져 있지 않으므로 스펙트럼 차감 알고리즘의 중요한 요소는 잡음 신호의 전력 스펙트럼 밀도(PSD)의 추정이다.
스펙트럼 차감을 이용한 잡음 감소는 다음과 같이 기재될 수 있다.
P s (f) = P x (f) - P n (f)
P s (f)는 음성의 전력 스펙트럼이고, P x (f)는 잡음이 있는 음성의 전력 스펙트럼이 며, P n (f)는 잡음의 전력 스펙트럼이다. 감산 프로세스의 주파수 응답은 다음과 같이 기재될 수 있다.
Y(f) = X(f)H(f)
단일 채널 잡음 억제 시스템에서, 잡음 신호의 PSD는 잡음이 있는 음성 신호 자체로부터 추정되며, 잡음이 있는 음성 신호는 이용 가능한 유일한 신호이다. 대부분, 잡음 추정은 정확하지 않다. 따라서 부정확한 잡음 추정을 야기하는 왜곡을 줄이기 위한 프로세스에서 어떤 조정이 이루어질 필요가 있다. 이러한 이유로, 대부분의 잡음 억제 방법은 낮은 신호대 잡음비(S/N)를 갖는 주파수는 감쇄되고 높은 S/N을 갖는 주파수는 변경되지 않도록 스펙트럼 가중 인자를 제어하는 파라미터 β를 도입한다.
도 7은 본 발명의 바람직한 실시예에 따라 구성된 잡음 억제기와 관련된 오디오 프로세서(60)의 일부 블록도이다. 오디오 프로세서(60)는 잡음 억제 외에도 에코 상쇄, 추가 필터링, 및 본 발명과 관련이 없는 다른 기능을 포함한다. 다음 설명에서, 제목의 번호는 도 7의 블록에 관련된다. 라인 입력(66)과 스피커 출력(68) 사이의 점선(79)으로 나타낸 수신 채널에 제 2 잡음 억제 회로가 연결될 수도 있다.
71 - 분석
윈도우
정보 블록들을 처리함으로써 잡음 감소 프로세스가 수행된다. 블록의 크기는 예를 들어 128개의 샘플이다. 본 발명의 일 실시예에서, 입력 프레임 크기는 32개의 샘플이다. 그러므로 입력 데이터는 처리를 위해 버퍼링되어야 한다. 입력 데이터를 윈도윙(windowing)하기 전에 128 워드 크기의 버퍼가 사용된다.
버퍼링된 데이터는 윈도윙 되어 주파수 영역에서의 블록 처리에 의해 유입된 아티팩트를 줄인다. 다른 윈도우 옵션이 이용 가능하다. 윈도우 선택은 다른 인자들, 즉 메인 로브 폭, 사이드 로브 레벨 및 중첩 크기에 기초한다. 전처리에 사용되는 윈도우 타입은 메인 로브 폭 및 사이드 로브 레벨에 영향을 준다. 예를 들어, 해닝(Hanning) 윈도우는 직사각형 윈도우에 비해 넓은 메인 로브 및 낮은 사이드 로브 레벨을 갖는다. 여러 타입의 윈도우가 기술분야에 공지되어 있으며, 이득 및 평활화 계수와 같은 일부 파라미터를 적당히 조정하여 사용될 수 있다.
주파수 영역 처리에 의해 유입된 아티팩트는 보다 작은 중첩이 사용된다면 더욱 악화된다. 그러나 보다 큰 중첩이 사용된다면 계산상의 요건이 늘어나게 될 것이다. 합성 윈도우의 사용은 재구성 단계에서 유입된 아티팩트를 감소시킨다. 상기의 모든 인자를 고려하여, 각각 25% 중첩되는 평탄한 사다리꼴 분석 윈도우 및 평탄한 사다리꼴 합성 윈도우가 사용된다. 128-점 이산 푸리에 변환의 경우, 25% 중첩은 이전 프레임으로부터의 마지막 32개 샘플이 현재 프레임에 대한 최초(가장 오래된) 32개의 샘플로서 사용된다는 것을 의미한다.
중첩 크기 D는 (2·D ana - D syn )과 같다. D ana 가 24와 같고 D syn 이 16과 같다면, D = 32이다. 분석 윈도우 W ana (n)는 다음과 같이 주어진다.
1 D ana ≤ n < 128 - D ana ,
합성 윈도우 W syn (n)은 다음과 같이 주어진다.
0 0 ≤ n < (D ana - D syn ),
1 D ana ≤ n < 128 - D ana
0 128 - (D ana - D syn ) ≤ n < 128
중간 간격은 두 윈도우 모두 동일하다. 완벽한 재구성을 위해, 분석 윈도우 및 합성 윈도우는 다음 조건을 만족한다.
0 ≤ n < D의 구간에서는
W ana (n)W syn (n) + W ana (n + 128 - D)W syn (n + 128 - D) = 1
D ≤ n < 96의 구간에서는
W ana (n)W syn (n) = 1
버퍼링된 데이터는 다음의 분석 윈도우를 이용하여 윈도윙되며, x(m,n)은 프레임(m)에서 버퍼링된 데이터이다.
x w (m,n) = x(m,n)*W ana (n)
72 -
순방향
이산 푸리에 변환(
DFT
)
윈도윙된 시간 영역 데이터는 다음 변환식으로 주어진 이산 푸리에 변환을 이용하여 주파수 영역으로 변환된다.
여기서 x w (m,k)는 프레임(m)에서 윈도윙된 시간 영역 데이터이고, X(m,k)는 프레임(m)에서 변환된 데이터이며, N은 DFT 크기이다. 입력된 시간 영역 데이터는 실수이므로, DFT의 출력은 N/2 인자로 정규화된다.
74 - 주파수 영역 처리
잡음 억제 회로의 주파수 응답이 계산되며, 도 8의 블록도에 나타낸 여러 가 지 양상을 갖는다. 다음 설명에서, 제목의 번호는 도 8의 블록을 참조한다.
81 - 전력 스펙트럼 밀도(
PSD
) 추정
잡음이 있는 음성의 전력 스펙트럼 밀도는 다음과 같이 정의된 1차 순환 필터를 이용하여 근사화된다.
여기서 P x (m,k)는 프레임(m)에서 잡음이 있는 음성의 전력 스펙트럼 밀도이고, P x (m-1,k)는 프레임(m-1)에서 잡음이 있는 음성의 전력 스펙트럼 밀도이다. |X(m,k)|2은 프레임(m)에서 잡음이 있는 음성의 크기 스펙트럼이고, k는 주파수 인덱스이다. ε s 는 스펙트럼 평활화 계수이다.
82 -
바크
대역 에너지 추정
잡음 감소 프로세스 도중 유입되는 스펙트럼 아티팩트를 감소시키기 위해 부대역 기반 신호 분석이 수행된다. 부대역은 인간의 귀의 지각력을 모델화하는 ("임계 대역"이라고도 하는) 바크 대역에 기반한다. 협대역 음성 스펙트럼에서 바크 대역의 중간 주파수 및 대역 에지가 다음 표에 나타난다.
대역 번호 | 범위(㎐) | 중간 주파수(㎐) |
1 | 0-100 | 50 |
2 | 100-200 | 150 |
3 | 200-300 | 250 |
4 | 300-400 | 350 |
5 | 400-510 | 450 |
6 | 510-630 | 570 |
7 | 630-770 | 700 |
8 | 770-920 | 840 |
9 | 920-1080 | 1000 |
10 | 1080-1270 | 1175 |
11 | 1270-1480 | 1370 |
12 | 1480-1720 | 1600 |
13 | 1720-2000 | 1850 |
14 | 2000-2320 | 2150 |
15 | 2320-2700 | 2500 |
16 | 2700-3150 | 2900 |
17 | 3150-3700 | 3400 |
18 | 3700-4400 | 4000 |
잡음이 있는 음성 프레임의 DFT는 17개의 바크 대역으로 분할된다. 128-점 DFT의 경우, 각 바크 대역에 대응하는 스펙트럼 빈 번호는 다음 표에 나타난다.
대역 번호 | 주파수 범위(㎐) | 스펙트럼 빈 번호 | 지점 개수 |
1 | 0-125 | 0,1,2 | 3 |
2 | 187.5-250 | 3,4 | 2 |
3 | 312.5-375 | 5,6 | 2 |
4 | 437.5-500 | 7,8 | 2 |
5 | 562.5-625 | 9,10 | 2 |
6 | 687.5-750 | 11,12 | 2 |
7 | 812.5-875 | 13,14 | 2 |
8 | 937.5-1062.5 | 15,16,17 | 3 |
9 | 1125-1250 | 18,19,20 | 3 |
10 | 1312.5-1437.5 | 21,22,23 | 3 |
11 | 1500-1687.5 | 24,25,26,27 | 4 |
12 | 1750-2000 | 28,29,30,31,32 | 5 |
13 | 2062.5-2312.5 | 33,34,35,36,37 | 5 |
14 | 2375-2687.5 | 38,39,40,41,42,43 | 6 |
15 | 2750-3125 | 44,45,46,47,48,49,50 | 7 |
16 | 3187.5-3687.5 | 51,52,53,54,55,56,57,58,59 | 9 |
17 | 3750-4000 | 60,61,62,63,64 | 5 |
각 바크 대역에서 잡음이 있는 음성의 에너지는 다음과 같이 계산된다.
각 바크 대역에서 잡음의 에너지는 다음과 같이 계산된다.
여기서 f H (i) 및 f L (i)는 바크 대역(i)에서 각각 최고 및 최저 주파수에 대응하는 스펙트럼 빈 번호이고, P x (m,k) 및 P n (m,k)는 각각 잡음이 있는 음성 및 잡음 추정치의 전력 스펙트럼 밀도이다.
84 - 잡음 추정
라이너 마틴(Rainer Martin)은 최소 통계에 기반한 잡음 추정의 초기 제안자였으며, "최소 통계에 기반한 스펙트럼 차감" Proc. 제 7 회 유럽 신호 처리 컨퍼런스, EUSIPCO-94(1994년 9월 13일-16일), pp. 1182-1185를 참고한다. 이 방법은 음성의 휴지를 찾아 배경 잡음을 추정하기 위한 음성 액티비티 검출기를 필요로 하지 않는다. 대신, 이 알고리즘은 유한 시간 윈도우 내의 전력 스펙트럼 밀도의 최소 추정치를 사용하여 잡음 레벨을 추정한다. 이 알고리즘은 각 스펙트럼 빈에서 잡음이 있는 음성 신호의 단기 전력 추정치가 시간에 대해 뚜렷한 피크 및 밸리를 나타낸다는 관찰에 기반한다. 신뢰성 있는 잡음 전력 추정치를 얻기 위해, 데이터 윈도우 또는 버퍼 길이는 상상할 수 있는 가장 긴 음성 액티비티에 걸치도록 충분 히 길어야 하며, 또는 잡음이 대략 변화하지 않고 일정하도록 충분히 짧아야 한다. M개의 부대역 전력 샘플의 윈도우 내의 단기 전력 추정치 P x (m,k)의 최소값으로서 잡음 전력 추정치 P n (m,k)가 구해진다. 알고리즘의 계산상의 복잡성을 줄이고 지연을 줄이기 위해, M 길이의 한 윈도우에 대한 데이터는 l 길이의 w개의 윈도우로 분해되어 l*w = M이다.
최소값을 위해 서브 윈도우 기반 검색을 이용하는 것이 마틴의 잡음 추정 방법의 계산상 복잡성을 줄일지라도, 상기 검색은 부대역마다 각 서브 윈도우에 최소값을 저장하기 위해 상당량의 메모리를 필요로 한다. 게르하르트 도블링거(Gerhard Doblinger)는 최소 통계를 추적하는 계산상 효율적인 알고리즘을 제안하였으며, G. Doblinger, "부대역에서의 스펙트럼 최소값 추적에 의한 계산상 효율적인 음성 증강", Proc. 제 4 회 유럽 컨퍼런스 음성, 통신 및 기술, EUROSPEECH'95 (1995년 9월 18일-21일), pp. 1513-1516을 참고한다. 이 알고리즘의 흐름도는 도 9에서 얇은 선으로 나타낸다. 이 알고리즘에 따르면, 잡음이 있는 음성 스펙트럼의 현재 값(프레임 m)이 이전 프레임(프레임 m-1)의 잡음 추정치보다 작으면, 잡음 추정치가 현재 잡음이 있는 음성 스펙트럼으로 업데이트된다. 그렇지 않으면, 현재 프레임에 대한 잡음 추정치는 1차 평활화 필터에 의해 업데이트된다. 이 1차 평활화는 현재 잡음이 있는 음성 스펙트럼 P x (m,k), 이점 프레임의 잡음 있는 음성 스펙트럼 P x (m-1,k) 및 이전 프레임의 잡음 추정치 P n (m-1,k)의 함수이다. 도 9에서 파라미터(β, γ)는 배경 잡음의 단기 고정 장애에 맞추는데 사용된다. 알고리 즘에 사용되는 β 및 γ의 값은 각각 0.5 및 0.995이며, 달라질 수 있다.
도블링거의 잡음 추정 방법은 보다 적은 메모리를 필요로 하는 단순한 1차 필터를 사용하여 최소 통계를 추적한다. 그러므로 도블링거의 방법은 마틴의 최소 통계 알고리즘보다 효율적이다. 도블링거의 방법은 마틴의 방법과 비교할 때 두 방법 모두 동일한 수렴 시간을 갖더라도 음성 프레임 동안 잡음을 과장한다. 이러한 잡음 과장은 스펙트럼 차감 동안 음성을 왜곡하게 된다.
본 발명에 따르면, 도블링거의 잡음 추정 방법은 도 9에서 두꺼운 선으로 지시하는 바와 같이, 프로세스에 삽입된 부가적인 테스트에 의해 변형된다. 변형에 따르면, 현재 잡음이 있는 음성 스펙트럼이 잡음 추정치에서 상당량 벗어난다면, 매우 느린 시상수를 갖는 1차 지수 평균 평활화 필터가 사용되어 현재 프레임의 잡음 추정치를 업데이트한다. 이러한 느린 시상수 필터의 효과는 잡음 추정치를 감소시키고 추정치의 변화를 느리게 하는 것이다.
도 9에서 파라미터(μ)는 배경 잡음에 갑작스런 변화가 있을 때 잡음 추정치의 수렴 시간을 제어한다. 파라미터(μ)의 값이 높아질수록 수렴 시간은 느려지고 음성 왜곡은 작아진다. 그러므로 파라미터(μ)의 조정은 잡음 추정 수렴 시간과 음성 왜곡과의 균형이다. 파라미터(ν)는 잡음 추정치로부터 잡음이 있는 음성 스펙트럼의 편향 임계치를 제어한다. 본 발명의 일 실시예에서, ν는 3 값을 갖는다. 다른 값들이 대신 사용될 수 있다. 임계치가 낮으면 수렴 시간이 증가한다. 임계치가 높으면 왜곡이 증가한다. 1~9 범위가 유용한 것으로 여겨지지만, 그 한계가 결정적인 것은 아니다.
89 - 스펙트럼 이득 계산
변형된
위너
필터링
다양한 고급 스펙트럼 이득 계산 방법이 논문에서 입수될 수 있다. 예를 들어, Y. Ephraim 및 D. Malah의 "최소 평균 제곱 에러 단기 스펙트럼 진폭 추정기를 이용한 음성 증강", IEEE Trans. 음향, 음성, 신호 처리, vol. ASSP-32, pp. 1109-1121(1984년 12월); Y. Ephraim 및 D. Malah의 "최소 평균 제곱 에러 로그 스펙트럼 진폭 추정기를 이용한 음성 증강", IEEE Trans. 음향, 음성 신호 처리, vol. ASSP-33(2), pp. 443-445(1985년 4월); 및 I. Cohen의 "신호 존재 불확실성 하에서의 음성 증강", 음향, 음성, 신호 처리에 관한 제 26 회 IEEE 국제 컨퍼런스 회보, ICASSP-01(유타 솔트레이크 시티), pp. 7-11(2001년 5월)을 참고한다.
닫혀 있는 형태의 스펙트럼 이득 공식은 음성의 실제 스펙트럼 진폭과 음성의 스펙트럼 진폭 추정치 사이의 평균 제곱 에러를 최소화한다. 다른 닫힌 형태의 스펙트럼 이득 공식은 실제 음성 진폭의 로그와 추정된 음성 진폭의 로그 사이의 평균 제곱 오차를 최소화한다. 이들 알고리즘은 이론적으로는 최적일 수도 있지만, 이들 알고리즘의 실제 성능은 잡음이 매우 많은 조건에서는 상업적으로 실용적이지 않다. 이들 알고리즘은 중간 정도로 잡음이 있는 환경에서도 중대한 음질 아티팩트를 생성한다. 변형된 많은 알고리즘이 상기 두 개요로부터 유도되었다.
일반화된 위너 필터링에 기반하여 신호대 잡음비의 함수로서 스펙트럼 이득을 계산하는 것이 공지되어 있으며; L. Arslan, A. McCree, V. Viswanathan의 "적 응 잡음 억제를 위한 신규 방법", 음향, 음성, 신호 처리에 관한 제 26 회 IEEE 국제 컨퍼런스 회보, ICASSP-01(유타 솔트레이크 시티), pp. 812-815(2001년 5월)를 참고한다. 일반화된 위너 필터는 다음과 같이 주어진다.
여기서 는 깨끗한 음성 전력 스펙트럼 추정치이고, 는 잡음 추정치의 전력 스펙트럼이며, α는 잡음 억제 인자이다. 깨끗한 음성 스펙트럼을 추정하기 위한 많은 방법이 있다. 예를 들어, 깨끗한 음성 스펙트럼은 선형 예측 코딩 모델 스펙트럼으로서 추정될 수 있다. 깨끗한 음성 스펙트럼은 단지 이득이 변경된 잡음 있는 음성 스펙트럼 P x (m,k)으로부터 계산될 수도 있다.
여기서 Ex(m)은 프레임(m)에서 잡음이 있는 음성 에너지이고, En(m)은 프레임(m)에서 잡음 에너지이다. 신호대 잡음비(SNR)는 다음과 같이 계산된다.
일반화된 위너 필터 공식에서 상기 식을 빼면 다음 식이 얻어지고,
여기서 SNR(m)은 프레임 번호(m)에서의 신호대 잡음비이고, α'는 (E x (m)/E n (m))α)와 같은 새로운 잡음 억제 인자이다. H(m,k)는 신호대 잡음비에 따라 변하기 때문에 상기 식은 잡음 있는 프레임에 대해 보다 강한 억제를 유성음 프레임 동안에는 보다 약한 억제를 보장한다.
바크
대역 기반 변형된
위너
필터링
변형된 위너 필터 솔루션은 전체 프레임(m)의 신호대 잡음비에 기반한다. 스펙트럼 이득 함수는 전체 프레임의 신호대 잡음비에 기반하기 때문에, 스펙트럼 이득값은 유성음 프레임 동안에는 더 크고 무성음 프레임 동안에는 더 작을 것이다. 이는 "잡음 펌핑"을 야기하게 되며, 이는 온/오프 전환되는 잡음처럼 들린다. 이러한 문제점을 해결하기 위해, 본 발명의 다른 형태에 따르면, 바크 대역 기반 스펙트럼 분석이 수행된다. 각 프레임의 각 대역에서 다음과 같이 신호대 잡음비가 계산된다.
여기서 Ex(m,i) 및 En(m,i)는 각각 프레임(m)의 대역(i)에서 각각 잡음 있는 음성 에너지 및 잡음 에너지이다. 결국, 변형된 위너 솔루션에서 바크 대역 SNR을 이용함으로써 바크 대역 기반 스펙트럼 이득값이 계산된다.
여기서 f L (i) 및 f H (i)는 바크 대역(i)에서 각각 최고 및 최저 주파수의 스펙트럼 빈 번호이다.
스펙트럼 차감 기반 방법의 단점들 중 하나는 음질 아티팩트의 유입이다. 잡음 추정의 불확실성으로 인해, 어떤 스펙트럼 피크는 스펙트럼 차감 뒤에 나머지로서 남게 된다. 이러한 스펙트럼 피크가 음질 자체를 명시한다. 아티팩트를 줄이기 위해, 잡음 억제 인자(α')는 상기에 계산된 것보다 큰 값으로 유지되어야 한다. 그러나 α' 값이 크면 유성음 왜곡이 더 커지게 된다. 파라미터(α')의 조정은 음성 진폭 감소와 음질 아티팩트 간의 균형이다. 이는 대화 도중 잡음 감소량을 제어하는 새로운 메커니즘으로 이끈다.
음성 증강을 개선하기 위해 잡음이 있는 스펙트럼 성분에서 신호 존재의 불확실성을 이용하는 아이디어가 공지되어 있으며; R.J. McAulay 및 M.L. Malpass의 "연판정 잡음 억제 필터를 이용한 음성 증강", IEEE Trans. 음향, 음성 신호 처리, vol. ASSP-28, pp. 137-145(1980년 4월)를 참고한다. 잡음이 있는 환경에 음성이 존재할 확률을 계산한 후, 계산된 확률은 잡음 억제 인자(α)를 조정하는데 사용된다.
유성음을 검출하는 한 가지 방법은 잡음이 있는 음성 에너지 스펙트럼과 잡음 에너지 스펙트럼과의 비를 계산하는 것이다. 이 비율이 매우 크다면, 유성음이 존재하는 것으로 추정할 수 있다. 본 발명의 다른 형태에 따르면, 음성이 존재할 확률은 바크 대역마다 계산된다. 이 바크 대역 분석은 양호한 품질의 음성 증강에 의해 계산이 절약된다. 상기 비를 계산하기 위한 첫 번째 단계는 다음과 같다.
E x (m,i) 및 E n (m,i)는 상기와 동일한 정의를 갖는다. 상기 비는 임계치(λth)와 비교되어 음성이 존재하는지 여부를 판단한다. 임계치를 초과할 때 음성이 존재하며, 도 10을 참고한다.
음성 존재 확률은 1차 지수 평균(평활화) 필터에 의해 계산된다.
p(m,i) = ε p p(m-1,i) + (1-ε p )I p
여기서 ε p 는 확률 평활화 인자이고, I p 는 음성이 존재할 때는 1과 같고 음성이 존재하지 않을 때는 0과 같다. 연속한 프레임에서 음성 존재의 상관성은 필터에 의해 포착된다.
잡음 억제 인자(α)는 음성 존재 확률을 임계치(p th )와 비교함으로써 결정된다. 구체적으로, α는 임계치를 초과하지 않을 때보다 임계치를 초과하는 경우에 더 낮은 값으로 설정된다. 또, 상기 인자는 대역마다 계산된다는 점에 유의한다.
스펙트럼 이득 제한
스펙트럼 이득은 이득이 최소값, 예를 들어 -20㏈ 이하로 떨어지는 것을 방 지하도록 제한된다. 시스템은 보다 적은 이득이 가능하지만, 최소값 이하로 이득을 감소시키는 것은 허용되지 않는다. 값은 중요하지 않다. 이득 제한은 스펙트럼 이득의 고정 점 계산의 유한한 정확성에 기인할 수 있는 음질 아티팩트 및 음성 왜곡을 줄인다.
이득의 하한은 스펙트럼 이득 계산 프로세스에 의해 조정된다. 바크 대역의 에너지가 어떤 임계값(E th )보다 적다면, 최소 이득은 -1㏈로 설정된다. 단편이 유성음으로 분류된다면, 즉 확률이 p th 를 초과한다면, 최소 이득은 -1로 설정된다. 어떤 조건도 만족하지 않는다면, 최소 이득은 허용되는 최저 이득, 예를 들어 -20㏈로 설정된다. 본 발명의 일 실시예에서, E th 에 적당한 값은 0.01이다. p th 에 적당한 값은 0.1이다. 대역마다 프로세스가 반복되어 각 대역의 이득을 조정한다.
스펙트럼 이득 평활화
모든 블록 변환 기반 처리에서, 윈도윙 및 중첩-가산은 주파수 영역에서 블록의 신호를 처리함으로써 유입되는 아티팩트를 줄이기 위한 공지 기술이다. 이러한 아티팩트의 감소는 윈도우의 메인 로브의 폭, 윈도우에서 사이드 로브의 경사, 및 블록간 중첩량과 같은 여러 가지 인자에 영향을 받는다. 메인 로브의 폭은 사용되는 윈도우 타입에 영향을 받는다. 예를 들어, 해닝(상승 코사인) 윈도우는 직사각형 윈도우보다 넓은 메인 로브 및 낮은 사이드 로브 레벨을 갖는다.
제어된 스펙트럼 이득은 윈도우를 평활화하고 중첩 및 가산 프로세스 동안 중첩 경계에 불연속을 발생시킨다. 이러한 불연속성은 스펙트럼 이득 함수의 시변 특성에 의해 발생한다. 이 아티팩트를 줄이기 위해, 본 발명에 따르면 다음의 기술, 즉 주파수 축을 따른 스펙트럼 이득 평활화, (순간 이득값의 사용 대신) 평균 바크 대역 이득, 시간 축을 따른 스펙트럼 이득 평활화를 채용한다.
92 - 주파수에 따른 이득 평활화
주파수에 따른 갑작스런 이득 변화를 피하기 위해, 다음과 같이 주어진 지수 평균 평활화 필터를 사용하여 주파수 축을 따라 스펙트럼 이득이 평활화된다.
H'(m,k) = ε gf H'(m,k-1) + (1-ε gf )H(m,k)
여기서 ε gf 는 주파수에 따른 이득 평활화 인자이고, H(m,k)는 스펙트럼 빈 번호(k)에서의 순간 스펙트럼 이득이며, H'(m,k-1)는 스펙트럼 빈 번호(k-1)에서 평활화된 스펙트럼 이득이고, H'(m,k)는 스펙트럼 빈 번호(k)에서 평활화된 스펙트럼 이득이다.
93 - 평균
바크
대역 이득 계산
스펙트럼 이득의 갑작스런 변화는 또한 각 바트 대역의 스펙트럼 이득을 평균함으로써 감소한다. 이는 바크 대역의 모든 스펙트럼 빈이 동일한 스펙트럼 이득을 가짐을 의미하며, 그 이득은 해당 바크 대역의 모든 스펙트럼 이득 사이의 평균이다. 대역의 평균 스펙트럼 이득 H' avg (m,k)은 간단히 대역에서 이득의 합을 대 역의 빈 개수로 나눈 것이다. 가장 높은 주파수 대역의 대역폭이 가장 낮은 주파수 대역의 대역폭보다 넓기 때문에, 스펙트럼 이득의 평균은 높은 대역에서의 협대역 잡음 감소에 있어 낮은 대역에서만큼 효과적인 것은 아니다. 따라서 약 1.35㎑보다 낮은 주파수 성분을 갖는 대역에 대해서만 평균이 실행된다. 한계는 중요하지 않으며 취향, 편의 또는 다른 고려사항에 맞게 실험에 의해 조정될 수 있다.
94 - 시간에 따른 이득 평활화
급속히 변화하는 잡음 있는 환경에서는, 증강된 출력 음성에 낮은 주파수 잡음 플러터(flutter)가 유입될 것이다. 이 플러터는 대부분의 스펙트럼 차감 기반 잡음 감소 시스템의 부산물이다. 배경 잡음이 급속히 변화하고 잡음 추정이 급속한 변화에 적응할 수 있다면, 스펙트럼 이득 또한 빠르게 변화하여 플러터를 생성할 것이다. 낮은 주파수 플러터는 다음과 같이 주어진 1차 지수 평균 평활화 필터를 사용하여 시간에 따라 스펙트럼 이득 H"(m,k)을 평활화함으로써 감소한다.
H"(m,k) = ε gf H "(m-1,k) + (1-ε gf )H" avg (m,b(i)) f(k) < 1.35㎑
H"(m,k) = ε gf H "(m-1,k) + (1-ε gf )H'(m,k) f(k) ≥ 1.35㎑
여기서 f(k)는 바크 대역(k)의 중심 주파수이고, ε gf 는 시간에 따른 이득 평활화 인자이고, b(i)는 스펙트럼 빈의 바크 대역 번호(k)이며, H'(m,k)는 프레임 인덱스(m)에서 (주파수에 따라) 평활화된 스펙트럼 이득이고, H'(m-1,k)는 프레임 인덱스(m-1)에서 (주파수에 따라) 평활화된 스펙트럼 이득이며, H" avg (m,k)는 프레임 인덱 스(m)에서 (주파수에 따라) 평활화되고 평균화된 스펙트럼 이득이다.
과도한 평활화는 음성에 끝 부분 에코(여운) 또는 잡음 펌핑을 발생시키게 되므로 평활화는 파라미터(ε gf )에 민감하다. 또한, 이득 평활화가 너무 높게 설정되면 음성 진폭의 상당한 감소가 있을 수 있다. 0.1 ~ 0.3의 값이 ε gf 에 적당하다. 주어진 다른 값들에 대해, 특정 값은 이 동작 전에 신호가 어떻게 처리되었는지에, 즉 사용된 이득에 좌우된다.
76 - 이산 푸리에 역변환
블록(75)에서 잡음이 있는 음성 스펙트럼에 스펙트럼 이득 함수를 곱함으로써 깨끗한 음성 스펙트럼이 얻어진다. 이는 차감과 같이 보이는 것이 아니라, 다음 식에 의해 깨끗한 음성 추정치가 얻어지는 것으로 결론이 나는 상기에 주어진 초기 전개식을 상기시킬 수 있다.
Y(f) = X(f)H(f)
차감은 곱셈기 H(f)에 포함된다.
깨끗한 음성 스펙트럼은 다음 변환식으로 주어진 이산 푸리에 역변환을 이용하여 다시 시간 영역으로 변환된다.
여기서 X(m,k)H(m,k)는 깨끗한 음성 추정치이고, s(m,n)은 프레임(m)에서 시간 영 역의 깨끗한 음성 추정치이다.
77 - 합성
윈도우
블록화 현상을 줄이기 위해 합성 윈도우를 이용하여 깨끗한 음성이 윈도윙된다.
78 - 중첩 및 가산
마지막으로, 윈도윙된 깨끗한 음성은 다음과 같이 이전 프레임과 중첩 및 가산된다.
여기서 s w (m-1,...)은 이전 프레임의 윈도윙된 깨끗한 음성이고, s w (m,n)은 현재 프레임의 윈도윙된 깨끗한 음성이며, D는 중첩량으로, 본 발명의 일 실시예에서는 상술한 바와 같이 32이다.
이와 같이 본 발명은 변형된 도블링거 잡음 추정, 부대역 기반 위너 필터링, 부대역 이득 연산, 각 부대역에서의 SNR 조정 이득, 이득 평활화 및 사다리꼴 윈도우의 25% 중첩을 이용하여 개선된 잡음 억제를 제공한다. 조합은 종래 기술의 대략 5 MIPS와 비교하여 (Texas Instruments C55xx 프로세서를 이용한 2 MIPS보다 낮 고 2k 미만의 데이터 메모리를 사용한 Motorola Starcore SC140의 1 MIPS보다 낮은) 낮은 MIPS로 연산을 감소시킨다. 또한, 억제 후의 나머지 배경 잡음에 눈에 띄는 변화가 없으며 음질 아티팩트가 더 적다.
이와 같이 본 발명에 대해 설명하였지만, 발명의 범위 내에서 다양한 변형이 이루어질 수 있음이 당업자에게 명백할 것이다. 예를 들어, 바크 대역 모델의 사용이 바람직하지만 필수적인 것은 아니다. 대역 통과 필터는 다른 진행 패턴을 따를 수 있다.
Claims (15)
- 잡음 추정치를 계산하기 위한 회로, 입력 신호에서 상기 잡음 추정치를 차감하기 위한 회로, 및 프레임들을 출력 신호로 조합하기 위한 합성 회로를 포함하는 잡음 억제 회로로서,입력 신호를 다수의 대역들로 분할하기 위한 다수의 대역 통과 필터들;각각의 대역의 음성을 검출하기 위한 수단;각각의 상기 필터로부터의 신호를 다수의 프레임들로 분할하기 위한 분석 회로 - 각각의 상기 프레임은 다수의 샘플들을 포함함 -; 및각각의 대역에서 각각의 프레임의 신호 대 잡음비에 반비례하게 잡음 억제 인자를 계산하기 위한 수단을 포함하는 잡음 억제 회로.
- 제 1 항에 있어서,상기 대역 통과 필터들은 바크 대역들을 한정하는 것을 특징으로 하는 잡음 억제 회로.
- 제 2 항에 있어서,상기 잡음 추정치를 계산하기 위한 회로에서 스펙트럼 이득을 제한하는 회로를 더 포함하는 것을 특징으로 하는 잡음 억제 회로.
- 제 3 항에 있어서,음성 검출기를 더 포함하며, 상기 스펙트럼 이득 제한은 음성이 검출되지 않 을 때보다 음성이 검출될 때 더 높은 것을 특징으로 하는 잡음 억제 회로.
- 제 3 항에 있어서,상기 잡음 추정치를 계산하기 위한 회로에 연결된 제 1 평활화 회로를 더 포함하며, 상기 제 1 평활화 회로는 상기 입력 신호의 주파수 스펙트럼에 걸쳐 이득을 평활화하는 것을 특징으로 하는 잡음 억제 회로.
- 제 5 항에 있어서,상기 제 1 평활화 회로는 약 2㎑ 아래의 대역들에 대해 이득을 평활화하는 것을 특징으로 하는 잡음 억제 회로.
- 제 1 항에 있어서,상기 잡음 추정치를 계산하기 위한 회로는 프레임의 잡음 추정치를 업데이트하기 위한 평활화 필터를 포함하고,상기 평활화 필터는, 잡음이 있는 음성 스펙트럼이 미리 결정된 양보다 더 많이 잡음 추정치로부터 벗어날 때 증가하고 상기 잡음이 있는 음성 스펙트럼이 상기 미리 결정된 양보다 더 적게 상기 잡음 추정치로부터 벗어날 때 감소하는, 시상수를 가지며, 이에 따라 잡음 있는 스펙트럼이 미리 결정된 양보다 더 많이 잡음 추정치로부터 벗어날 때 프레임들 간의 추정치 변화를 느리게 하는 것을 특징으로 하는 잡음 억제 회로.
- 제 7 항에 있어서,상기 필터는 1차 지수 평균 평활화 필터인 것을 특징으로 하는 잡음 억제 회로.
- 입력 신호를 다수의 샘플들을 각각 포함하는 다수의 프레임들로 분할하기 위한 분석 회로, 잡음 추정치를 계산하기 위한 회로, 상기 입력 신호에서 상기 잡음 추정치를 차감하기 위한 회로, 및 상기 프레임들을 출력 신호로 재구성하기 위한 합성 회로를 포함하는 잡음 억제 회로로서,잡음 추정치를 계산하기 위한 평활화 필터 - 상기 평활화 필터는 프레임의 잡음 추정치를 업데이트하기 위한 시상수를 갖고, 상기 시상수는 잡음이 있는 음성 스펙트럼이 미리 결정된 양보다 더 많이 상기 잡음 추정치로부터 벗어날 때 증가하며, 상기 시상수는 상기 잡음이 있는 음성 스펙트럼이 상기 미리 결정된 양보다 더 적게 상기 잡음 추정치로부터 벗어날 때 감소하고, 이에 따라 잡음 있는 음성 스펙트럼이 미리 결정된 양보다 더 많이 잡음 추정치로부터 벗어날 때 프레임들 간의 추정치 변화를 느리게 함 -를 포함하는 잡음 억제 회로.
- 제 9 항에 있어서,각 프레임의 신호대 잡음비에 반비례하게 잡음 억제 인자를 조정하는 회로를 더 포함하는 것을 특징으로 하는 잡음 억제 회로.
- 제 10 항에 있어서,각 프레임을 주파수 영역으로 변환하기 위해 상기 입력 신호의 각 프레임의 이산 푸리에 변환을 계산하는 회로를 더 포함하는 것을 특징으로 하는 잡음 억제 회로.
- 제 11 항에 있어서,상기 이산 푸리에 변환을 계산하는 회로는 상기 프레임을 점진적으로 더 높은 중간 주파수를 갖는 다수의 대역들로 분할하는 것을 특징으로 하는 잡음 억제 회로.
- 제 12 항에 있어서,상기 대역들은 바크 대역들인 것을 특징으로 하는 잡음 억제 회로.
- 수신 채널 및 송신 채널을 포함하는 오디오 처리 회로를 구비한 전화기로서,상기 채널들 중 적어도 하나에 제 1 항에 따른 잡음 억제 회로를 포함하는, 전화기.
- 수신 채널 및 송신 채널을 포함하는 오디오 처리 회로를 구비한 전화기로서,상기 채널들 중 적어도 하나에 제 9 항에 따른 잡음 억제 회로를 포함하는, 전화기.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/830,652 US7492889B2 (en) | 2004-04-23 | 2004-04-23 | Noise suppression based on bark band wiener filtering and modified doblinger noise estimate |
US10/830,652 | 2004-04-23 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070037439A KR20070037439A (ko) | 2007-04-04 |
KR100851716B1 true KR100851716B1 (ko) | 2008-08-11 |
Family
ID=35137588
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020067024494A KR100851716B1 (ko) | 2004-04-23 | 2005-04-18 | 바크 대역 위너 필터링 및 변형된 도블링거 잡음 추정에기반한 잡음 억제 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7492889B2 (ko) |
EP (1) | EP1745469A4 (ko) |
JP (1) | JP2007535698A (ko) |
KR (1) | KR100851716B1 (ko) |
CN (1) | CN101142800A (ko) |
WO (1) | WO2005109404A2 (ko) |
Families Citing this family (148)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7117149B1 (en) | 1999-08-30 | 2006-10-03 | Harman Becker Automotive Systems-Wavemakers, Inc. | Sound source classification |
EP1376539B8 (en) * | 2001-03-28 | 2010-12-15 | Mitsubishi Denki Kabushiki Kaisha | Noise suppressor |
US7725315B2 (en) * | 2003-02-21 | 2010-05-25 | Qnx Software Systems (Wavemakers), Inc. | Minimization of transient noises in a voice signal |
US8326621B2 (en) | 2003-02-21 | 2012-12-04 | Qnx Software Systems Limited | Repetitive transient noise removal |
US8073689B2 (en) | 2003-02-21 | 2011-12-06 | Qnx Software Systems Co. | Repetitive transient noise removal |
US7895036B2 (en) * | 2003-02-21 | 2011-02-22 | Qnx Software Systems Co. | System for suppressing wind noise |
US8271279B2 (en) | 2003-02-21 | 2012-09-18 | Qnx Software Systems Limited | Signature noise removal |
US7885420B2 (en) | 2003-02-21 | 2011-02-08 | Qnx Software Systems Co. | Wind noise suppression system |
US7949522B2 (en) * | 2003-02-21 | 2011-05-24 | Qnx Software Systems Co. | System for suppressing rain noise |
CA2454296A1 (en) * | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
US7383179B2 (en) * | 2004-09-28 | 2008-06-03 | Clarity Technologies, Inc. | Method of cascading noise reduction algorithms to avoid speech distortion |
US7680652B2 (en) | 2004-10-26 | 2010-03-16 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US8306821B2 (en) * | 2004-10-26 | 2012-11-06 | Qnx Software Systems Limited | Sub-band periodic signal enhancement system |
US7610196B2 (en) * | 2004-10-26 | 2009-10-27 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US8543390B2 (en) | 2004-10-26 | 2013-09-24 | Qnx Software Systems Limited | Multi-channel periodic signal enhancement system |
US7716046B2 (en) * | 2004-10-26 | 2010-05-11 | Qnx Software Systems (Wavemakers), Inc. | Advanced periodic signal enhancement |
US7949520B2 (en) | 2004-10-26 | 2011-05-24 | QNX Software Sytems Co. | Adaptive filter pitch extraction |
US8170879B2 (en) | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
US8284947B2 (en) * | 2004-12-01 | 2012-10-09 | Qnx Software Systems Limited | Reverberation estimation and suppression system |
US20060184363A1 (en) * | 2005-02-17 | 2006-08-17 | Mccree Alan | Noise suppression |
US8027833B2 (en) | 2005-05-09 | 2011-09-27 | Qnx Software Systems Co. | System for suppressing passing tire hiss |
US8170875B2 (en) | 2005-06-15 | 2012-05-01 | Qnx Software Systems Limited | Speech end-pointer |
US8311819B2 (en) * | 2005-06-15 | 2012-11-13 | Qnx Software Systems Limited | System for detecting speech with background voice estimates and noise estimates |
CN100539437C (zh) * | 2005-07-29 | 2009-09-09 | 上海杰得微电子有限公司 | 一种音频编解码器的实现方法 |
CN101091209B (zh) * | 2005-09-02 | 2010-06-09 | 日本电气株式会社 | 抑制噪声的方法及装置 |
JP4863713B2 (ja) * | 2005-12-29 | 2012-01-25 | 富士通株式会社 | 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム |
GB2437559B (en) * | 2006-04-26 | 2010-12-22 | Zarlink Semiconductor Inc | Low complexity noise reduction method |
US7844453B2 (en) | 2006-05-12 | 2010-11-30 | Qnx Software Systems Co. | Robust noise estimation |
JP4753821B2 (ja) * | 2006-09-25 | 2011-08-24 | 富士通株式会社 | 音信号補正方法、音信号補正装置及びコンピュータプログラム |
KR100835993B1 (ko) * | 2006-11-30 | 2008-06-09 | 한국전자통신연구원 | 마스킹 확률을 이용한 음성 인식 전처리 방법 및 전처리장치 |
US8326620B2 (en) | 2008-04-30 | 2012-12-04 | Qnx Software Systems Limited | Robust downlink speech and noise detector |
US8335685B2 (en) * | 2006-12-22 | 2012-12-18 | Qnx Software Systems Limited | Ambient noise compensation system robust to high excitation noise |
US9966085B2 (en) * | 2006-12-30 | 2018-05-08 | Google Technology Holdings LLC | Method and noise suppression circuit incorporating a plurality of noise suppression techniques |
KR101414233B1 (ko) * | 2007-01-05 | 2014-07-02 | 삼성전자 주식회사 | 음성 신호의 명료도를 향상시키는 장치 및 방법 |
JP5530720B2 (ja) | 2007-02-26 | 2014-06-25 | ドルビー ラボラトリーズ ライセンシング コーポレイション | エンターテイメントオーディオにおける音声強調方法、装置、およびコンピュータ読取り可能な記録媒体 |
KR101163411B1 (ko) * | 2007-03-19 | 2012-07-12 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 지각 모델을 사용한 스피치 개선 |
US8280731B2 (en) * | 2007-03-19 | 2012-10-02 | Dolby Laboratories Licensing Corporation | Noise variance estimator for speech enhancement |
DE602007004217D1 (de) * | 2007-08-31 | 2010-02-25 | Harman Becker Automotive Sys | Schnelle Schätzung der Spektraldichte der Rauschleistung zur Sprachsignalverbesserung |
US8904400B2 (en) | 2007-09-11 | 2014-12-02 | 2236008 Ontario Inc. | Processing system having a partitioning component for resource partitioning |
US8850154B2 (en) | 2007-09-11 | 2014-09-30 | 2236008 Ontario Inc. | Processing system having memory partitioning |
CN101802909B (zh) * | 2007-09-12 | 2013-07-10 | 杜比实验室特许公司 | 通过噪声水平估计调整进行的语音增强 |
EP2191466B1 (en) * | 2007-09-12 | 2013-05-22 | Dolby Laboratories Licensing Corporation | Speech enhancement with voice clarity |
US8694310B2 (en) | 2007-09-17 | 2014-04-08 | Qnx Software Systems Limited | Remote control server protocol system |
JP5191750B2 (ja) * | 2008-01-25 | 2013-05-08 | 川崎重工業株式会社 | 音響装置 |
US8209514B2 (en) | 2008-02-04 | 2012-06-26 | Qnx Software Systems Limited | Media processing system having resource partitioning |
US8606573B2 (en) * | 2008-03-28 | 2013-12-10 | Alon Konchitsky | Voice recognition improved accuracy in mobile environments |
US8831936B2 (en) * | 2008-05-29 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement |
KR101475724B1 (ko) * | 2008-06-09 | 2014-12-30 | 삼성전자주식회사 | 오디오 신호 품질 향상 장치 및 방법 |
JP5453740B2 (ja) * | 2008-07-02 | 2014-03-26 | 富士通株式会社 | 音声強調装置 |
US8538749B2 (en) * | 2008-07-18 | 2013-09-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for enhanced intelligibility |
EP2164066B1 (en) * | 2008-09-15 | 2016-03-09 | Oticon A/S | Noise spectrum tracking in noisy acoustical signals |
CN102150206B (zh) * | 2008-10-24 | 2013-06-05 | 三菱电机株式会社 | 噪音抑制装置以及声音解码装置 |
JP5245714B2 (ja) * | 2008-10-24 | 2013-07-24 | ヤマハ株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
JP5157852B2 (ja) * | 2008-11-28 | 2013-03-06 | 富士通株式会社 | 音声信号処理評価プログラム、音声信号処理評価装置 |
US9202456B2 (en) * | 2009-04-23 | 2015-12-01 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation |
DK2465112T3 (en) | 2009-08-14 | 2015-01-12 | Koninkl Kpn Nv | PROCEDURE, COMPUTER PROGRAM PRODUCT, AND SYSTEM FOR DETERMINING AN EVALUATED QUALITY OF AN AUDIO SYSTEM |
CN102117618B (zh) * | 2009-12-30 | 2012-09-05 | 华为技术有限公司 | 一种消除音乐噪声的方法、装置及系统 |
US10403302B2 (en) | 2010-04-27 | 2019-09-03 | Yobe, Inc. | Enhancing audio content for voice isolation and biometric identification by adjusting high frequency attack and release times |
US9449612B2 (en) * | 2010-04-27 | 2016-09-20 | Yobe, Inc. | Systems and methods for speech processing via a GUI for adjusting attack and release times |
US9053697B2 (en) | 2010-06-01 | 2015-06-09 | Qualcomm Incorporated | Systems, methods, devices, apparatus, and computer program products for audio equalization |
US9142207B2 (en) | 2010-12-03 | 2015-09-22 | Cirrus Logic, Inc. | Oversight control of an adaptive noise canceler in a personal audio device |
US8908877B2 (en) | 2010-12-03 | 2014-12-09 | Cirrus Logic, Inc. | Ear-coupling detection and adjustment of adaptive response in noise-canceling in personal audio devices |
US20120143604A1 (en) * | 2010-12-07 | 2012-06-07 | Rita Singh | Method for Restoring Spectral Components in Denoised Speech Signals |
US8583429B2 (en) * | 2011-02-01 | 2013-11-12 | Wevoice Inc. | System and method for single-channel speech noise reduction |
FR2974655B1 (fr) * | 2011-04-26 | 2013-12-20 | Parrot | Combine audio micro/casque comprenant des moyens de debruitage d'un signal de parole proche, notamment pour un systeme de telephonie "mains libres". |
CN102208190B (zh) * | 2011-05-06 | 2012-11-28 | 声科科技(南京)有限公司 | 抑制非平稳噪声设备收敛时间的测量方法及装置 |
US8958571B2 (en) * | 2011-06-03 | 2015-02-17 | Cirrus Logic, Inc. | MIC covering detection in personal audio devices |
US9214150B2 (en) | 2011-06-03 | 2015-12-15 | Cirrus Logic, Inc. | Continuous adaptation of secondary path adaptive response in noise-canceling personal audio devices |
US9824677B2 (en) | 2011-06-03 | 2017-11-21 | Cirrus Logic, Inc. | Bandlimiting anti-noise in personal audio devices having adaptive noise cancellation (ANC) |
US9318094B2 (en) | 2011-06-03 | 2016-04-19 | Cirrus Logic, Inc. | Adaptive noise canceling architecture for a personal audio device |
US9076431B2 (en) | 2011-06-03 | 2015-07-07 | Cirrus Logic, Inc. | Filter architecture for an adaptive noise canceler in a personal audio device |
US8948407B2 (en) | 2011-06-03 | 2015-02-03 | Cirrus Logic, Inc. | Bandlimiting anti-noise in personal audio devices having adaptive noise cancellation (ANC) |
US9711162B2 (en) * | 2011-07-05 | 2017-07-18 | Texas Instruments Incorporated | Method and apparatus for environmental noise compensation by determining a presence or an absence of an audio event |
JP5479655B2 (ja) * | 2011-07-08 | 2014-04-23 | ゴーアテック インコーポレイテッド | 残留エコーを抑制するための方法及び装置 |
US9325821B1 (en) * | 2011-09-30 | 2016-04-26 | Cirrus Logic, Inc. | Sidetone management in an adaptive noise canceling (ANC) system including secondary path modeling |
JP2013148724A (ja) * | 2012-01-19 | 2013-08-01 | Sony Corp | 雑音抑圧装置、雑音抑圧方法およびプログラム |
US8712076B2 (en) | 2012-02-08 | 2014-04-29 | Dolby Laboratories Licensing Corporation | Post-processing including median filtering of noise suppression gains |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
CN103325380B (zh) | 2012-03-23 | 2017-09-12 | 杜比实验室特许公司 | 用于信号增强的增益后处理 |
US9142205B2 (en) | 2012-04-26 | 2015-09-22 | Cirrus Logic, Inc. | Leakage-modeling adaptive noise canceling for earspeakers |
US9014387B2 (en) | 2012-04-26 | 2015-04-21 | Cirrus Logic, Inc. | Coordinated control of adaptive noise cancellation (ANC) among earspeaker channels |
US9082387B2 (en) | 2012-05-10 | 2015-07-14 | Cirrus Logic, Inc. | Noise burst adaptation of secondary path adaptive response in noise-canceling personal audio devices |
US9076427B2 (en) | 2012-05-10 | 2015-07-07 | Cirrus Logic, Inc. | Error-signal content controlled adaptation of secondary and leakage path models in noise-canceling personal audio devices |
US9319781B2 (en) | 2012-05-10 | 2016-04-19 | Cirrus Logic, Inc. | Frequency and direction-dependent ambient sound handling in personal audio devices having adaptive noise cancellation (ANC) |
US9318090B2 (en) | 2012-05-10 | 2016-04-19 | Cirrus Logic, Inc. | Downlink tone detection and adaptation of a secondary path response model in an adaptive noise canceling system |
US9123321B2 (en) | 2012-05-10 | 2015-09-01 | Cirrus Logic, Inc. | Sequenced adaptation of anti-noise generator response and secondary path response in an adaptive noise canceling system |
EP2880655B8 (en) * | 2012-08-01 | 2016-12-14 | Dolby Laboratories Licensing Corporation | Percentile filtering of noise reduction gains |
DE112012006876B4 (de) * | 2012-09-04 | 2021-06-10 | Cerence Operating Company | Verfahren und Sprachsignal-Verarbeitungssystem zur formantabhängigen Sprachsignalverstärkung |
US9532139B1 (en) | 2012-09-14 | 2016-12-27 | Cirrus Logic, Inc. | Dual-microphone frequency amplitude response self-calibration |
JP6162254B2 (ja) * | 2013-01-08 | 2017-07-12 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 背景ノイズにおけるスピーチ了解度を増幅及び圧縮により向上させる装置と方法 |
US9349383B2 (en) * | 2013-01-29 | 2016-05-24 | 2236008 Ontario Inc. | Audio bandwidth dependent noise suppression |
US9107010B2 (en) * | 2013-02-08 | 2015-08-11 | Cirrus Logic, Inc. | Ambient noise root mean square (RMS) detector |
US9369798B1 (en) | 2013-03-12 | 2016-06-14 | Cirrus Logic, Inc. | Internal dynamic range control in an adaptive noise cancellation (ANC) system |
US9106989B2 (en) | 2013-03-13 | 2015-08-11 | Cirrus Logic, Inc. | Adaptive-noise canceling (ANC) effectiveness estimation and correction in a personal audio device |
US9215749B2 (en) | 2013-03-14 | 2015-12-15 | Cirrus Logic, Inc. | Reducing an acoustic intensity vector with adaptive noise cancellation with two error microphones |
US9414150B2 (en) | 2013-03-14 | 2016-08-09 | Cirrus Logic, Inc. | Low-latency multi-driver adaptive noise canceling (ANC) system for a personal audio device |
US9467776B2 (en) | 2013-03-15 | 2016-10-11 | Cirrus Logic, Inc. | Monitoring of speaker impedance to detect pressure applied between mobile device and ear |
US9324311B1 (en) | 2013-03-15 | 2016-04-26 | Cirrus Logic, Inc. | Robust adaptive noise canceling (ANC) in a personal audio device |
US9635480B2 (en) | 2013-03-15 | 2017-04-25 | Cirrus Logic, Inc. | Speaker impedance monitoring |
US9208771B2 (en) | 2013-03-15 | 2015-12-08 | Cirrus Logic, Inc. | Ambient noise-based adaptation of secondary path adaptive response in noise-canceling personal audio devices |
US10206032B2 (en) | 2013-04-10 | 2019-02-12 | Cirrus Logic, Inc. | Systems and methods for multi-mode adaptive noise cancellation for audio headsets |
US9066176B2 (en) | 2013-04-15 | 2015-06-23 | Cirrus Logic, Inc. | Systems and methods for adaptive noise cancellation including dynamic bias of coefficients of an adaptive noise cancellation system |
US9462376B2 (en) | 2013-04-16 | 2016-10-04 | Cirrus Logic, Inc. | Systems and methods for hybrid adaptive noise cancellation |
US9478210B2 (en) | 2013-04-17 | 2016-10-25 | Cirrus Logic, Inc. | Systems and methods for hybrid adaptive noise cancellation |
US9460701B2 (en) | 2013-04-17 | 2016-10-04 | Cirrus Logic, Inc. | Systems and methods for adaptive noise cancellation by biasing anti-noise level |
US9578432B1 (en) | 2013-04-24 | 2017-02-21 | Cirrus Logic, Inc. | Metric and tool to evaluate secondary path design in adaptive noise cancellation systems |
US9264808B2 (en) | 2013-06-14 | 2016-02-16 | Cirrus Logic, Inc. | Systems and methods for detection and cancellation of narrow-band noise |
US10262680B2 (en) * | 2013-06-28 | 2019-04-16 | Adobe Inc. | Variable sound decomposition masks |
US9392364B1 (en) | 2013-08-15 | 2016-07-12 | Cirrus Logic, Inc. | Virtual microphone for adaptive noise cancellation in personal audio devices |
US9666176B2 (en) | 2013-09-13 | 2017-05-30 | Cirrus Logic, Inc. | Systems and methods for adaptive noise cancellation by adaptively shaping internal white noise to train a secondary path |
US9620101B1 (en) | 2013-10-08 | 2017-04-11 | Cirrus Logic, Inc. | Systems and methods for maintaining playback fidelity in an audio system with adaptive noise cancellation |
DE102013111784B4 (de) * | 2013-10-25 | 2019-11-14 | Intel IP Corporation | Audioverarbeitungsvorrichtungen und audioverarbeitungsverfahren |
US9704472B2 (en) | 2013-12-10 | 2017-07-11 | Cirrus Logic, Inc. | Systems and methods for sharing secondary path information between audio channels in an adaptive noise cancellation system |
US10382864B2 (en) | 2013-12-10 | 2019-08-13 | Cirrus Logic, Inc. | Systems and methods for providing adaptive playback equalization in an audio device |
US10219071B2 (en) | 2013-12-10 | 2019-02-26 | Cirrus Logic, Inc. | Systems and methods for bandlimiting anti-noise in personal audio devices having adaptive noise cancellation |
CN110265058B (zh) * | 2013-12-19 | 2023-01-17 | 瑞典爱立信有限公司 | 估计音频信号中的背景噪声 |
US9369557B2 (en) | 2014-03-05 | 2016-06-14 | Cirrus Logic, Inc. | Frequency-dependent sidetone calibration |
US9479860B2 (en) | 2014-03-07 | 2016-10-25 | Cirrus Logic, Inc. | Systems and methods for enhancing performance of audio transducer based on detection of transducer status |
US9648410B1 (en) | 2014-03-12 | 2017-05-09 | Cirrus Logic, Inc. | Control of audio output of headphone earbuds based on the environment around the headphone earbuds |
US9319784B2 (en) | 2014-04-14 | 2016-04-19 | Cirrus Logic, Inc. | Frequency-shaped noise-based adaptation of secondary path adaptive response in noise-canceling personal audio devices |
WO2015191470A1 (en) | 2014-06-09 | 2015-12-17 | Dolby Laboratories Licensing Corporation | Noise level estimation |
US9609416B2 (en) | 2014-06-09 | 2017-03-28 | Cirrus Logic, Inc. | Headphone responsive to optical signaling |
US10181315B2 (en) | 2014-06-13 | 2019-01-15 | Cirrus Logic, Inc. | Systems and methods for selectively enabling and disabling adaptation of an adaptive noise cancellation system |
US9478212B1 (en) | 2014-09-03 | 2016-10-25 | Cirrus Logic, Inc. | Systems and methods for use of adaptive secondary path estimate to control equalization in an audio device |
US10366703B2 (en) * | 2014-10-01 | 2019-07-30 | Samsung Electronics Co., Ltd. | Method and apparatus for processing audio signal including shock noise |
US9886966B2 (en) * | 2014-11-07 | 2018-02-06 | Apple Inc. | System and method for improving noise suppression using logistic function and a suppression target value for automatic speech recognition |
US9552805B2 (en) | 2014-12-19 | 2017-01-24 | Cirrus Logic, Inc. | Systems and methods for performance and stability control for feedback adaptive noise cancellation |
KR102409536B1 (ko) | 2015-08-07 | 2022-06-17 | 시러스 로직 인터내셔널 세미컨덕터 리미티드 | 오디오 디바이스에서 재생 관리를 위한 사건 검출 |
WO2017029550A1 (en) | 2015-08-20 | 2017-02-23 | Cirrus Logic International Semiconductor Ltd | Feedback adaptive noise cancellation (anc) controller and method having a feedback response partially provided by a fixed-response filter |
US9578415B1 (en) | 2015-08-21 | 2017-02-21 | Cirrus Logic, Inc. | Hybrid adaptive noise cancellation system with filtered error microphone signal |
US10320964B2 (en) * | 2015-10-30 | 2019-06-11 | Mitsubishi Electric Corporation | Hands-free control apparatus |
US10013966B2 (en) | 2016-03-15 | 2018-07-03 | Cirrus Logic, Inc. | Systems and methods for adaptive active noise cancellation for multiple-driver personal audio device |
DE102017215890B4 (de) * | 2016-09-11 | 2020-01-30 | Continental Automotive Systems, Inc. | Verfahren zur dynamisch erhöhten Geräuschunterdrückung auf der Basis von Eingangsgeräuschkennlinien |
GB2558529A (en) * | 2016-09-11 | 2018-07-18 | Continental automotive systems inc | Dynamically increased noise suppression based on input noise characteristics |
US10475471B2 (en) | 2016-10-11 | 2019-11-12 | Cirrus Logic, Inc. | Detection of acoustic impulse events in voice applications using a neural network |
US10242696B2 (en) | 2016-10-11 | 2019-03-26 | Cirrus Logic, Inc. | Detection of acoustic impulse events in voice applications |
US11373667B2 (en) * | 2017-04-19 | 2022-06-28 | Synaptics Incorporated | Real-time single-channel speech enhancement in noisy and time-varying environments |
US10395667B2 (en) | 2017-05-12 | 2019-08-27 | Cirrus Logic, Inc. | Correlation-based near-field detector |
US10297267B2 (en) | 2017-05-15 | 2019-05-21 | Cirrus Logic, Inc. | Dual microphone voice processing for headsets with variable microphone array orientation |
US10540983B2 (en) * | 2017-06-01 | 2020-01-21 | Sorenson Ip Holdings, Llc | Detecting and reducing feedback |
US10504538B2 (en) * | 2017-06-01 | 2019-12-10 | Sorenson Ip Holdings, Llc | Noise reduction by application of two thresholds in each frequency band in audio signals |
CN107437418A (zh) * | 2017-07-28 | 2017-12-05 | 深圳市益鑫智能科技有限公司 | 车载语音识别电子娱乐控制系统 |
CN108022591B (zh) * | 2017-12-30 | 2021-03-16 | 北京百度网讯科技有限公司 | 车内环境中语音识别的处理方法、装置和电子设备 |
US10885907B2 (en) | 2018-02-14 | 2021-01-05 | Cirrus Logic, Inc. | Noise reduction system and method for audio device with multiple microphones |
CN111508519B (zh) * | 2020-04-03 | 2022-04-26 | 北京达佳互联信息技术有限公司 | 一种音频信号人声增强的方法及装置 |
CN111986660A (zh) * | 2020-08-26 | 2020-11-24 | 深圳信息职业技术学院 | 一种神经网络子带建模的单通道语音增强方法、系统及存储介质 |
US11984107B2 (en) * | 2022-07-13 | 2024-05-14 | Analog Devices International Unlimited Company | Audio signal processing method and system for echo suppression using an MMSE-LSA estimator |
CN117434153B (zh) * | 2023-12-20 | 2024-03-05 | 吉林蛟河抽水蓄能有限公司 | 基于超声波技术的道路无损检测方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5706395A (en) * | 1995-04-19 | 1998-01-06 | Texas Instruments Incorporated | Adaptive weiner filtering using a dynamic suppression factor |
US5864794A (en) | 1994-03-18 | 1999-01-26 | Mitsubishi Denki Kabushiki Kaisha | Signal encoding and decoding system using auditory parameters and bark spectrum |
US6415253B1 (en) | 1998-02-20 | 2002-07-02 | Meta-C Corporation | Method and apparatus for enhancing noise-corrupted speech |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3180936A (en) * | 1960-12-01 | 1965-04-27 | Bell Telephone Labor Inc | Apparatus for suppressing noise and distortion in communication signals |
US3403224A (en) * | 1965-05-28 | 1968-09-24 | Bell Telephone Labor Inc | Processing of communications signals to reduce effects of noise |
US4644108A (en) * | 1982-10-27 | 1987-02-17 | International Business Machines Corporation | Adaptive sub-band echo suppressor |
US4630305A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
US4811404A (en) * | 1987-10-01 | 1989-03-07 | Motorola, Inc. | Noise suppression system |
IL84948A0 (en) * | 1987-12-25 | 1988-06-30 | D S P Group Israel Ltd | Noise reduction system |
US5774846A (en) * | 1994-12-19 | 1998-06-30 | Matsushita Electric Industrial Co., Ltd. | Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus |
US6263307B1 (en) * | 1995-04-19 | 2001-07-17 | Texas Instruments Incorporated | Adaptive weiner filtering using line spectral frequencies |
US6097820A (en) * | 1996-12-23 | 2000-08-01 | Lucent Technologies Inc. | System and method for suppressing noise in digitally represented voice signals |
US6088668A (en) * | 1998-06-22 | 2000-07-11 | D.S.P.C. Technologies Ltd. | Noise suppressor having weighted gain smoothing |
US6760435B1 (en) * | 2000-02-08 | 2004-07-06 | Lucent Technologies Inc. | Method and apparatus for network speech enhancement |
-
2004
- 2004-04-23 US US10/830,652 patent/US7492889B2/en active Active
-
2005
- 2005-04-18 CN CNA2005800127571A patent/CN101142800A/zh active Pending
- 2005-04-18 WO PCT/US2005/013164 patent/WO2005109404A2/en active Application Filing
- 2005-04-18 KR KR1020067024494A patent/KR100851716B1/ko not_active IP Right Cessation
- 2005-04-18 EP EP05738461A patent/EP1745469A4/en not_active Withdrawn
- 2005-04-18 JP JP2007509545A patent/JP2007535698A/ja not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5864794A (en) | 1994-03-18 | 1999-01-26 | Mitsubishi Denki Kabushiki Kaisha | Signal encoding and decoding system using auditory parameters and bark spectrum |
US5706395A (en) * | 1995-04-19 | 1998-01-06 | Texas Instruments Incorporated | Adaptive weiner filtering using a dynamic suppression factor |
US6415253B1 (en) | 1998-02-20 | 2002-07-02 | Meta-C Corporation | Method and apparatus for enhancing noise-corrupted speech |
Also Published As
Publication number | Publication date |
---|---|
EP1745469A4 (en) | 2008-08-27 |
EP1745469A2 (en) | 2007-01-24 |
US7492889B2 (en) | 2009-02-17 |
WO2005109404A2 (en) | 2005-11-17 |
JP2007535698A (ja) | 2007-12-06 |
US20050240401A1 (en) | 2005-10-27 |
CN101142800A (zh) | 2008-03-12 |
KR20070037439A (ko) | 2007-04-04 |
WO2005109404A3 (en) | 2007-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100851716B1 (ko) | 바크 대역 위너 필터링 및 변형된 도블링거 잡음 추정에기반한 잡음 억제 | |
US7649988B2 (en) | Comfort noise generator using modified Doblinger noise estimate | |
US7454010B1 (en) | Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation | |
US6549586B2 (en) | System and method for dual microphone signal noise reduction using spectral subtraction | |
US6487257B1 (en) | Signal noise reduction by time-domain spectral subtraction using fixed filters | |
EP1252796B1 (en) | System and method for dual microphone signal noise reduction using spectral subtraction | |
US8521530B1 (en) | System and method for enhancing a monaural audio signal | |
EP2008379B1 (en) | Adjustable noise suppression system | |
EP1046273B1 (en) | Methods and apparatus for providing comfort noise in communications systems | |
EP1080465B1 (en) | Signal noise reduction by spectral substraction using linear convolution and causal filtering | |
CN111554315B (zh) | 单通道语音增强方法及装置、存储介质、终端 | |
US20060229869A1 (en) | Method of and apparatus for reducing acoustic noise in wireless and landline based telephony | |
EP1080463B1 (en) | Signal noise reduction by spectral subtraction using spectrum dependent exponential gain function averaging | |
WO2008121436A1 (en) | Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate | |
JP2003500936A (ja) | エコー抑止システムにおけるニアエンド音声信号の改善 | |
US8756055B2 (en) | Systems and methods for improving the intelligibility of speech in a noisy environment | |
US7889874B1 (en) | Noise suppressor | |
US9172791B1 (en) | Noise estimation algorithm for non-stationary environments | |
US6507623B1 (en) | Signal noise reduction by time-domain spectral subtraction | |
JP2002521945A (ja) | 通信端末 | |
Nemer | Acoustic Noise Reduction for Mobile Telephony | |
JP2003517761A (ja) | 通信システムにおける音響バックグラウンドノイズを抑制するための方法と装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |