KR20080002990A - 오디오 잡음을 감소시키는 시스템 및 방법 - Google Patents
오디오 잡음을 감소시키는 시스템 및 방법 Download PDFInfo
- Publication number
- KR20080002990A KR20080002990A KR1020077027014A KR20077027014A KR20080002990A KR 20080002990 A KR20080002990 A KR 20080002990A KR 1020077027014 A KR1020077027014 A KR 1020077027014A KR 20077027014 A KR20077027014 A KR 20077027014A KR 20080002990 A KR20080002990 A KR 20080002990A
- Authority
- KR
- South Korea
- Prior art keywords
- power spectrum
- noise
- input signal
- value
- detector
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000001228 spectrum Methods 0.000 claims abstract description 113
- 238000001514 detection method Methods 0.000 claims abstract description 30
- 230000000694 effects Effects 0.000 claims description 37
- 230000009467 reduction Effects 0.000 claims description 13
- 238000004891 communication Methods 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 4
- 238000005192 partition Methods 0.000 claims 1
- 230000003595 spectral effect Effects 0.000 description 20
- 230000008569 process Effects 0.000 description 19
- 230000006870 function Effects 0.000 description 9
- 238000005070 sampling Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 208000019300 CLIPPERS Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 208000021930 chronic lymphocytic inflammation with pontine perivascular enhancement responsive to steroids Diseases 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Noise Elimination (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
오디오 잡음을 감소시키는 다양한 시스템 및 방법의 실시예들이 개시된다. 잡음(154, 156) 및 네트워크 톤(158) 등과 같은 하나 또는 그 이상의 음향 성분들이 시간 영역 신호(142)로부터 획득된 파워 스펙트럼(152)을 기초로 검출될 수 있다. 상기 검출의 결과는 파워 스펙트럼에 적용될 수 있는 스펙트럼 조정(164, 166)의 결정에서의 의사 판단(162)시에 사용될 수 있다. 조정된 파워 스펙트럼은 바람직하지 않은 잡음(들)을 실질적으로 제거하고 및/또는 네트워크 톤 등과 같이 공지된 음향 성분을 차지하는 시간 영역 신호(172)로 복귀변환될 수 있다.
잡음, 백색, 톤, 스펙트럼, 시간 영역, 주파수 영역, 신호.
Description
본 출원은 "SYSTEMS AND METHODS FOR REDUCING AUDIO NOISE" 라는 제목으로 2005년 4월 21일에 출원된 미국 가특허출원 제60/673,671호의 이익을 청구하며, 위 특허문헌은 본 명세서내에 참조로서 병합되어 있다.
일반적으로, 본 발명은 신호 처리에 관한 것으로서, 더 구체적으로는, 음성 통신 신호 등과 같은 신호내에서 오디오 잡음을 감소시키는 시스템 및 방법에 관한 것이다.
배경잡음 및 간섭음은 음성 통신 시스템내에서 통화품질과 명료도를 악화시킬 수 있다. 또한, 음성 부재하의 배경잡음과 간섭음의 존재는 듣기에 상당히 거슬릴 수 있다.
이러한 문제점들을 해결하기 위하여, 신호 대 잡음비(SNR)를 개선시키면 통화품질과 명료도를 개선시킬 것이라는 희망에 따라 많은 음성 보강 및 잡음 감소(NR) 기술들이 제안되어 왔다. 하지만, SNR 과 통화품질의 개선간에는 서로 충돌이 발생한다. 비록, SNR을 개선시키면 음성음에 잡음이 덜 발생하게 되지만, 이용가능한 많은 잡음 감소 및 음성 보강 알고리즘과 관련된 인위적 결과(artifact) 또 는 왜곡은 통화품질을 악화시킬 수 있고, 이에 따라 음성음을 덜 듣게좋게 만들수도 있다.
적어도 전술한 문제점들은 본 명세서에서 개시된 오디오 잡음을 감소시키는 다양한 시스템 및 방법의 실시예들에 의해 해결될 수 있다. 잡음 및 네트워크 톤(network tone) 등과 같은 하나 또는 그 이상의 음향 성분들이 시간 영역 신호로부터 획득된 파워 스펙트럼을 기초로 검출될 수 있다. 이 검출의 결과는 파워 스펙트럼에 적용가능한 스펙트럼 조정의 결정에서의 의사 판단시에 이용될 수 있다. 조정된 스펙트럼은 바람직하지 않은 잡음(들)을 실질적으로 제거하고 및/또는 네트워크 톤 등의 공지된 음향 성분을 차지하는 시간 영역 신호로 복귀변환될 수 있다.
본 발명의 하나의 실시예는 오디오 잡음을 감소시키는 시스템에 관한 것이다. 시스템은 시간 영역 입력 신호를 수신하여 주파수 영역 입력 신호 및 주파수 영역 입력 신호의 파워 스펙트럼을 발생시키도록 구성된 입력부를 포함한다. 시스템은 적어도 하나의 검출부를 더 포함한다. 각 검출부는 파워 스펙트럼내에서 선택된 음향 성분의 존재를 검출하도록 구성된다. 시스템은 적어도 하나의 선택된 음향 성분의 존재의 검출을 기초로 조정 파워 스펙트럼을 발생시키고 주파수 영역 출력 신호를 발생시키기 위하여 조정 파워 스펙트럼을 주파수 영역 입력 신호와 결합하도록 구성된 조정부를 더 포함한다. 시스템은 주파수 영역 출력 신호를 기초로 시간 영역 출력 신호를 발생시키도록 구성된 출력부를 더 포함한다.
하나의 실시예에서, 시간 영역 입력 신호는 음성 통신 신호를 포함한다.
하나의 실시예에서, 적어도 하나의 검출부는 잡음 활성 검출기, 백색 잡음 검출기 및 네트워크 톤 검출기(network tone detector) 중에서 적어도 하나를 포함한다. 하나의 실시예에서, 파워 스펙트럼은 시간 영역 입력 신호의 N 개 샘플값에 대응하는 N 개의 주파수 빈(bin)을 포함한다.
하나의 실시예에서, 잡음 활성 검출기는 N 개의 주파수 빈들의 하나 또는 그 이상의 그룹들의 크기를 대응 선택값과 비교하고, 파워 스펙트럼내에의 잡음 활성의 존재 또는 부존재를 표시하는 잡음 활성 지표(指標)를 발생시킨다. 하나의 실시예에서, 잡음 활성 검출기는: N 개의 주파수 빈들을 복수개의 대역들로 분할하고; 복수개의 대역들마다의 크기값을 획득하고; 이 크기값을 복수개의 대역들마다의 임계값과 비교하고; 그리고 복수개의 대역들 중 선택된 번호의 대역에서 이 크기값이 임계값을 초과하면 잡음 활성의 존재를 결정하도록 구성된다.
하나의 실시예에서, 백색 잡음 검출기는 N 개의 주파수 빈들의 합계를 기초로 현재의 에너지값을 획득하고; 현재의 에너지값과 이전의 에너지값사이의 차이값 - 이 차이값은 양의 값을 가짐 - 를 획득하고; 그리고, 이 차이값이 선택된 값보다 크면 파워 스펙트럼내에 백색 잡음의 존재를 표시하는 백색 잡음 지표를 발생시키도록 구성된다.
하나의 실시예에서, 네트워크 톤 검출기는: N 개의 주파수 빈들 중에서 최대값을 갖는 선택된 빈을 식별하고; 그리고, 이 선택된 빈이 하나 또는 그 이상의 조건들을 만족하면 파워 스펙트럼내에서의 네트워크 톤의 존재를 표시하는 네트워크 톤 지표를 발생시키도록 구성된다. 하나의 실시예에서, 선택된 빈이 선택된 양을 초과하여 변경되지 않고, 선택된 빈이 네트워크 톤에 대응하는 주파수 범위내에 있는 경우에 네트워크 톤 지표가 발생된다.
하나의 실시예에서, 조정 파워 스펙트럼은 하나 또는 그 이상의 선택된 음향 성분의 검출을 기초로 조정되는 추정된 파워 스펙트럼을 포함한다. 하나의 실시예에서, 추정된 파워 스펙트럼의 조정은, 만약 네트워크 톤이 네트워크 톤 검출기에 의해 검출되지 않고 잡음 활성이 잡음 활성 검출기에 의해 검출되는 경우에 추정된 파워 스펙트럼을 선택된 양만큼 크기조정하는 것을 포함한다. 하나의 실시예에서, 추정된 파워 스펙트럼의 조정은, 만약 네트워크 톤이 네트워크 톤 검출기에 의해 검출되지 않고 백색 잡음이 백색 잡음 검출기에 의해 검출되는 경우에 백색 잡음을 조정하는 것을 더 포함한다.
하나의 실시예에서, 시스템은 시간 영역 입력 신호를 기초로 검출부와 조정부 중 적어도 하나를 건너뛰게 하도록 구성된 재수렴부를 포함한다. 하나의 실시예에서, 이 건너뜀은, 시간 영역 입력 신호를 나타내는 선택값이 선택구간동안에 임계값보다 낮게 유지되는 경우에 수행된다. 하나의 실시예에서, 임계값은 실질적으로 0 이다.
본 발명의 하나의 실시예는 오디오 잡음을 감소시키는 방법에 관한 것이다. 상기 방법은, 시간 영역 입력 신호를 수신하는 단계와, 주파수 영역 입력 신호 및 주파수 영역 입력 신호의 파워 스펙트럼을 발생시키는 단계를 포함한다. 본 방법은 파워 스펙트럼내에서 하나 또는 그 이상의 음향 성분의 존재를 검출하는 단계를 더 포함한다. 본 방법은 하나 또는 그 이상의 음향 성분의 존재의 검출을 기초로 조정 파워 스펙트럼을 발생시키는 단계를 더 포함한다. 본 방법은 주파수 영역 출력 신호를 발생시키기 위하여 조정 파워 스펙트럼을 주파수 영역 입력 신호와 결합하는 단계를 더 포함한다. 본 방법은 주파수 영역 출력 신호를 기초로 시간 영역 출력 신호를 발생시키는 단계를 더 포함한다.
하나의 실시예에서, 시간 영역 입력 신호는 음성 통신 신호를 포함한다.
하나의 실시예에서, 하나 또는 그 이상의 음향 성분은 잡음 활성, 백색 잡음 및 네트워크 톤 중에서 적어도 하나를 포함한다. 하나의 실시예에서, 파워 스펙트럼은 시간 영역 입력 신호의 N 개 샘플값에 대응하는 N 개의 주파수 빈들을 포함한다.
하나의 실시예에서, 잡음 활성은 N 개 주파수 빈들의 하나 또는 그 이상의 그룹들의 크기를 대응 선택값과 비교하고, 파워 스펙트럼내에 잡음 활성의 존재 또는 부존재를 표시하는 잡음 활성 지표를 발생시킴으로써 검출된다. 하나의 실시예에서, 잡음 활성은: N 개의 주파수 빈들을 복수개의 대역들로 분할하고; 복수개의 대역들마다의 크기값을 획득하고; 이 크기값을 복수개의 대역들마다의 임계값과 비교하고; 그리고 복수개의 대역들 중 선택된 번호의 대역에서 크기값이 임계값을 초과하면 잡음 활성의 존재를 결정함으로써 검출된다.
하나의 실시예에서, 백색 잡음은 N 개의 주파수 빈들의 합계를 기초로 현재의 에너지값을 획득하고; 현재의 에너지값과 이전의 에너지값사이의 차이값 - 이 차이값은 양의 값을 가짐 - 를 획득하고; 그리고, 이 차이값이 선택된 값보다 크면 파워 스펙트럼내에 백색 잡음의 존재를 표시하는 백색 잡음 지표를 발생시킴으로써 검출된다.
하나의 실시예에서, 네트워크 톤은: N 개의 주파수 빈들 중에서 최대값을 갖는 선택된 빈을 식별하고; 그리고, 이 선택된 빈이 하나 또는 그 이상의 조건들을 만족하면 파워 스펙트럼내에서의 네트워크 톤의 존재를 표시하는 네트워크 톤 지표를 발생시킴으로써 검출된다. 하나의 실시예에서, 선택된 빈이 선택된 양을 초과하여 변경되지 않고, 선택된 빈이 네트워크 톤에 대응하는 주파수 범위내에 있는 경우에 네트워크 톤 지표가 발생된다.
하나의 실시예에서, 조정 파워 스펙트럼은 하나 또는 그 이상의 음향 성분의 검출을 기초로 조정되는 추정된 파워 스펙트럼을 포함한다. 하나의 실시예에서, 추정된 파워 스펙트럼의 조정은, 만약 네트워크 톤이 검출되지 않고 잡음 활성이 검출되는 경우에 추정된 파워 스펙트럼을 선택된 양만큼 크기조정하는 것을 포함한다. 하나의 실시예에서, 추정된 파워 스펙트럼의 조정은, 만약 네트워크 톤이 검출되지 않고 백색 잡음이 검출되는 경우에 백색 잡음을 조정하는 것을 더 포함한다.
하나의 실시예에서, 시스템은 시간 영역 입력 신호를 기초로 검출단계를 건너뛰는 단계를 더 포함한다. 하나의 실시예에서, 이 건너뛰는 단계는, 시간 영역 입력 신호를 나타내는 선택값이 선택구간동안에 임계값보다 낮게 유지되는 경우에 수행된다. 하나의 실시예에서, 임계값은 실질적으로 0 이다.
본 발명의 하나의 실시예는 오디오 잡음을 감소시키는 시스템에 관한 것이다. 시스템은 입력 신호(여기서, 입력신호는 신호 대 잡음비를 갖는다)를 수신하고 이 입력 신호에 대응하는 파워 스펙트럼을 발생시키도록 구성된 입력부를 포함한다. 시스템은 파워 스펙트럼내에서 하나 또는 그 이상의 음향 성분의 존재를 검출하도록 구성된 검출기를 더 포함한다. 검출은, 입력 신호의 신호 대 잡음비를 실질적으로 동일 레벨로 유지하면서 수행된다.
본 발명의 하나의 실시예는 오디오 잡음을 감소시키는 시스템에 관한 것이다. 시스템은 입력 신호에 대응하는 파워 스펙트럼을 발생시키는 수단을 포함한다. 시스템은 파워 스펙트럼내에서 하나 또는 그 이상의 음향 성분을 검출하는 수단을 더 포함한다. 시스템은 하나 또는 그 이상의 음향 성분의 검출을 기초로 입력 신호를 조정하는 수단을 더 포함한다.
도 1은 오디오 통신 신호 등과 같은 신호내의 하나 또는 그 이상의 음향 성분을 식별하도록 구성된 다양한 구성부들을 구비하는 시스템에 관한 하나의 실시예의 블럭도를 도시한다.
도 2는 도 1의 시스템에 의해 수행될 수 있는 프로세스에 관한 하나의 실시예를 도시한다.
도 3은 도 1의 시스템에 관한 하나의 예시적인 실시예를 도시한다.
도 4a 및 도 4b 들은 심화 처리에서 신호를 조절하는데에 이용가능한 예시적인 필터부의 예시적인 반응을 도시한다.
도 5는 신호에 대응하는 파워 스펙트럼내에서 백색 잡음을 검출하도록 구성될 수 있는 검출부에 관한 하나의 실시예를 도시한다.
도 6은 신호에 대응하는 파워 스펙트럼내에서 잡음 활성을 검출하도록 구성 될 수 있는 검출부에 관한 하나의 실시예를 도시한다.
도 7은 신호에 대응하는 파워 스펙트럼내에서 네트워크 톤을 검출하도록 구성될 수 있는 검출부에 관한 하나의 실시예를 도시한다.
도 8은 하나의 실시예에서, 신호에 적용될 수 있는 조정 파워 스펙트럼을 결정하는데에 사용될 수 있는 다른 검출부로부터의 결과들을 도시한다.
도 9는 도 1의 시스템에 관한 다른 예시적인 실시예를 도시한다.
본 발명기술의 상기 실시모습 및 다른 실시모습, 장점, 및 신규한 특징들은 첨부되는 도면들을 참조하여 이하에서 설명되는 상세한 설명을 읽음으로써 분명해질 것이다. 도면에서, 유사 구성부는 유사 참조번호를 갖는다.
일반적으로 본 발명은 잡음 감소 기술에 관한 것이다. 일부 실시예들에서, 본 발명의 다양한 특징들 및 기술들은 (유선 또는 무선기반의) 전화기기, 무선기기, 보청기 등과 같은 음성 통신 기기상에서 구현가능하다.
도 1은 입력 신호내에 존재하는 하나 또는 그 이상의 음향 성분의 검출, 및 상기의 검출된 음향 성분을 기초로 입력 신호의 조정을 용이하게 해주는 다양한 구성부들을 갖는 시스템(100)에 관한 하나의 실시예의 블럭도를 도시한다. 하나의 실시예에서, 선택된 음향 성분은 잡음을 포함할 수 있다. 하나의 실시예에서, 선택된 음향 성분은 네트워크 톤과 같은 인공적 유입음을 포함할 수 있다.
본 발명의 설명을 위하여, 시간 영역 신호는 S(n)으로서 표시되고, 대응하는 주파수 영역 신호는 S(k)로서 표시된다. S(k)는 크기 및 위상 정보 모두를 포함하 며; 따라서, 벡터량 또는 복소신호로서 언급될 수 있다. S(k) 의 제곱 크기 부분은 통상적으로서 파워 스펙트럼으로서 언급되고, PowS(k)로서 표시된다. 본 발명의 설명을 위하여, "파워 스펙트럼"은 크기, 제곱 크기, 또는 임의의 크기 기반의 수량으로부터 획득가능하다.
그러므로, 도 1에서 도시된 바와 같이, 시스템(100)의 하나의 실시예는 입력 신호 X(n)를 수신하고, 복소 신호 X(k)를 획득하고, X(k)의 파워 스펙트럼 PowX(k)를 결정하고, PowX(k)를 기초로 조정 파워 스펙트럼 PowA(k)을 결정하고, 조정 파워 스펙트럼 PowA(k)를 기초로 X(k)를 조정하여 조정된 복소 신호 Y(k)를 산출한다. 조정된 복소 신호 Y(k)는 대응하는 시간 영역 신호 Y(n)로 복귀전환될 수 있다.
하나의 실시예에서, 시스템(100)은 이전에서 언급했던 기능들을 제공할 수 있는 입력부(102), 검출부(104), 조정부(106), 및 출력부(110)를 포함한다. 하나의 실시예에서, 시스템은 또한 바이패스부(112)를 포함할 수 있다. 상기 구성부들은 이하에서 더욱 자세하게 설명된다.
일부 실시예들에서, 본 명세서에서 서술된 다양한 특징들의 기능들은 프로세서, 구성부, 및/또는 모듈에 의해 획득되거나 용이해진다. 본 발명의 설명을 위하여, 프로세서는 하나 또는 그 이상의 처리장치 및/또는 하나 또는 그 이상의 프로세스를 포함할 수 있다. 이와 유사하게, 구성부 또는 모듈은 하나 또는 그 이상의 장치 및/또는 하나 또는 그 이상의 프로세스를 포함할 수 있다.
또한, 서로 다른 구성부들은 별개의 장치들로서 존재가능하거나 또는 동일 장치의 일부로서 존재가능하다. 또한, 일부 구성부들은 하나의 장치의 일부로서 존재하는 반면에 다른 구성부(들)은 하나 또는 그 이상의 장치들의 일부가 될 수 있다.
도 1에서 도시된 바와 같이, 대응 복소 신호 X(k) 및 대응 복소 신호 X(k)의 파워 스펙트럼 PowX(k)을 발생시키는 입력부(102)에 의해 입력 신호 X(n)가 수신되는 것이 도시되고 있다. 파워 스펙트럼 PowX(k)이 하나 또는 그 이상의 검출결과를 발생시키는 검출부(104)에 의해 수신되는 것이 도시되고 있다. 하나 또는 그 이상의 검출결과를 기초로 조정 파워 스펙트럼 PowA(k)를 발생시키는 조정부(106)에 의해 하나 또는 그 이상의 검출결과가 수신되는 것이 도시되고 있다. 조정 파워 스펙트럼 PowA(k)은 조정된 복소 신호 Y(k)를 산출하기 위하여 복소 신호 X(k)와 결합될 수 있다. 조정된 복소 신호 Y(k)가 이에 대응하는 시간 영역 출력 신호 Y(n)를 발생시키는 출력부(110)에 의해 수신되는 것이 도시된다.
도 1에 도시된 바와 같이, 하나의 실시예에서, 입력부(102)는 입력 신호 X(n)와 동일하거나 동일하지 않을 수 있는 신호 X'(n)를 바이패스부(112)에 제공할 수 있으며, 이 바이패스부(112)는 X(k)에 대한 조정을 실시해야 할 지의 여부를 결정하거나(화살표(114)에 의해 표시됨) 또는 시스템 상태를 재설정하고 조정 프로세스를 건너뛸지(화살표(116)에 의해 표시됨)를 결정할 수 있다.
도 2는 도 1의 시스템(100)에 관한 일 실시예에 의해 수행될 수 있는 프로세스(120)에 관한 하나의 실시예를 도시한다. 블럭 122 의 프로세스에서, 주파수 영역 복소 신호가 시간 영역 입력 신호로부터 획득된다. 블럭 124 의 프로세스에서, 주파수 영역 복소 신호의 파워 스펙트럼이 획득된다. 블럭 126 의 프로세스에서, 적어도 하나의 선택된 음향 성분의 존재가 파워 스펙트럼을 기초로 검출된다. 블럭 128 의 프로세스에서, 조정 파워 스펙트럼이 적어도 하나의 선택된 음향 성분의 검출을 기초로 발생된다. 블럭 130 의 프로세스에서, 주파수 영역 복소 신호가 조정 파워 스펙트럼과 결합되어 주파수 영역 복소 출력 신호를 발생시킨다. 블럭 132 의 프로세스에서, 시간 영역 출력 신호가 주파수 영역 출력 복소 신호로부터 발생된다.
도 3은 도 2의 프로세스(120)를 수행할 수 있는 시스템(100)에 관한 하나의 예시적인 실시예를 도시한다. 도 3에서의 예시에서는, 도 1을 참조하여 상술된 다양한 구성부들이 꼭 확인되는 것은 아니다. 하지만, 프로세스(120)의 다양한 기능들이 도 3에서 도시된 예시에 의해서 달성될 수 있음을 이해할 수 있을 것이다.
하나의 실시예에서, 시간 영역 입력 신호는 프레임으로서 샘플링될 수 있다. 도 3에서 도시된 예시적인 구성이 입력 신호의 프레임(142) 처리를 수행한다. 본 발명의 설명을 위하여, 하나의 예시적인 8 kHz 샘플링 속도의 경우에서 입력 프레임(142)은 64 개의 샘플값들을 갖는 것으로 가정한다. 하지만, 다른 샘플링 값들도 가능할 수 있음을 이해할 것이다.
도 3에서, 입력 신호 프레임은 X(n)으로서 묘사된다. 본 설명에서, X(n)은 때때로 간단히 입력 신호 또는 시간 영역 입력 신호로서 언급된다.
하나의 실시예에서, 입력 신호 X(n)는 일정한 잡음(들)을 제거하기 위해 필터처리된다. 예를 들어, 고대역 필터처리(HPF, 블럭 144로서 묘사됨)를 실시하여 DC 성분과 일부 저주파 잡음을 제거할 수 있다.
디지털 강화 무선 통신(DECT) 시스템등과 같은 일부 응용예에서, 입력 신호는 대략 100 Hz 에서 음색적 잡음(tonal noise)을 가질 수 있다. 상기와 같은 예시적인 잡음을 처리하기 위하여, 도 4a 및 도 4b에서 도시된 바와 같이, 예시적인 HPF(144)가 대략 100 Hz 의 주파수 응답에서 골짜기형상을 갖도록 구성될 수 있다.
하나의 실시예에서, 필터처리된 신호 X'(n)은 N/2 샘플 오버랩을 갖는 N 개의 샘플 프레임(N = 128)으로 분해될 수 있다. 하나의 실시예에서는, 복소 신호 X(k)(복소 스펙트럼으로도 언급됨)(블럭 150)를 획득하기 위하여 상기 프레임은 하닝 윈도우잉 처리(hanning windowing)(블럭 146) 및 128-FFT 처리(블럭 148)를 받을 수 있다.
도 3에 또한 도시된 바와 같이, 하나의 실시예에서는, 파워 스펙트럼 PowX(k)(k = 1, 2, ..., N/2)이 N-포인트 FFT(블럭 148)을 기초로 획득될 수 있으며(블럭 152), 여기서, k 는 샘플링속도 fS 와 함께 k*fS/N(Hz)값을 갖는 주파수 빈(frequency bin)을 나타낸다.
입력 파워 스펙트럼 PowX(k)를 기초로, 예시적인 검출기기들 - 잡음 활성 검출기(블럭 154), 백색 잡음 검출기(블럭 156), 및 네트워크 톤 검출기(블럭 158) - 은 잡음 활성, 백색 잡음, 및 네트워크 톤을 결정한다. 상기 결정을 기초로, 검출기들(154, 156, 158)은 각각의 출력 플래그들인 N_Flag, W_Flag, 및 T_Flag를 발생시킬 수 있다. 이러한 예시적인 검출기들은 이하에서 보다 자세하게 설명한다.
하나의 실시예에서, 잡음 활성 검출기(152) 및 백색 잡음 검출기는 잔여 잡음 감소용으로서 설계될 수 있다. 하나의 실시예에서, 잡음 활성 검출기(154), 백색 잡음 검출기(156), 및 네트워크 톤 검출기(158)의 임의의 하나 또는 임의의 조합으로부터의 출력(들)은 잡음 파워 추정 및 잡음의 스펙트럼 이득 추정을 위해 사용될 수 있다. 예를 들어, 하나의 실시예에서는, 세 개의 검출기들(154, 156, 158)로부터의 출력들이 잡음 파워 추정 및 잡음의 스펙트럼 이득 추정을 위해 사용가능하다. 하나의 실시예에서는, 네트워크 톤 검출기(158)로부터의 출력은 잡음 파워 추정 및 잡음의 스펙트럼 이득 추정을 위해 사용가능하다.
도 3에 또한 도시된 바와 같이, 하나의 실시예에서는, 세 개의 검출기들(154, 156, 158)의 출력들(이 검출기들 각각의 출력 플래그들을 포함함)이 조정 파워 스펙트럼 발생기(160)에 제공되는 것이 도시된다. 또한, 파워 스펙트럼 PowX(k)이 조정 파워 스펙트럼 발생기(160)에 제공되는 것이 도시된다.
조정 파워 스펙트럼 발생기(160)는 다중 연합 판단(multi decision fusion)(블럭 162), 잡음 파워 스펙트럼 추정(164), 및 스펙트럼 이득 추정(166)을 포함하는 기능들을 포함하는 것이 도시된다. 비록 도 3에서는 (예시적인 화살표들을 통하여) 하나의 예시적인 특정 "흐름"이 도시되고 있지만, 조정 파워 스펙트럼 발생기(160)의 다양한 기능들은 상기의 경로(들)을 꼭 따르지 않아도 됨을 이해할 수 있을 것이다.
하나의 실시예에서, 조정 파워 스펙트럼 발생기(160)는 첫번째로 잡음 파워 스펙트럼(164)의 추정값을 발생시킨다. 하나의 실시예에서, 잡음 파워 스펙트럼은 다음과 같은 예시적인 기술들 - (1) M 개의 프레임들에 대한 파워 스펙트럼들을 획득(예를 들어, 현재의 프레임 PowX(k) 및 이전의 7 개 프레임들을 포함하여, M = 8); 각각의 주파수 빈마다, M 개의 프레임들 중 최소값을 획득; 및 주파수 빈들의 최소값들을 수집하여 추정된 잡음 파워 스펙트럼을 형성 - 에 의해 추정될 수 있다. 예를 들어, 만약 빈-1 이 프레임-7 로부터 2.2 의 최소값을 갖고, 빈-2 가 프레임-2 로부터 1.5 최소값을 갖는 등의 경우라면, 추정된 잡음 파워 스펙트럼은 빈-1 에서 2.2 값을, 빈-2 에서 1.5 값 등등을 가질 것이다.
하나의 실시예에서, 조정 파워 스펙트럼 발생기(160)는 추정된 잡음 파워 스펙트럼(164)을 스펙트럼 이득(166)만큼 조정한다. 스펙트럼 이득은 공지된 일부 기술을 기초로 결정될 수 있거나, 및/또는 검출기들(154, 156, 및 158)의 출력들을 고려한 일부 판단(들)(162)을 기초로 결정될 수 있다. 예를 들어, 스펙트럼 이득[각각의 빈마다의 mSpectralGain(k)]은 Y.Ephraim 및 D.Malah 의 "Speech enhancement using a minimum mean square error short-time spectral amplitude estimator" (IEEE Trans. Acount., Speech, Signal Processing, vol. ASSP-32 (6), pp. 1109-1211, Dec. 1984)에서 소개된 방법을 기초로 계산될 수 있으며, 상기 방법의 전체내용은 본 명세서내에 참조로서 병합되어 있다. 잡음 파워 스펙트럼 조정을 위한 하나의 예시적인 검출 기반 이득 결정이 이하에서 보다 자세하게 설명된다.
도 3에 도시된 바와 같이, 하나의 실시예에서, 복소 입력 스펙트럼 X(k)(블럭 150)은 주파수 영역 필터처리(블럭 166)를 받을 수 있는데, 여기서 (블럭 164 에서) 획득된 스펙트럼 이득이 X(k)에 적용된다. 예를 들어, k 번째 주파수 빈에서의 스펙트럼 이득이 아래와 같이 계산될 수 있다:
mSpectralGain(k,m) = Ratio(k,m)/[Ratio(k,m)+1], k=1,2,...,64,
여기서, Ratio(k,m) = α*mSpectralGain(k,m-1)*PowX(k)*γ+(1-α)*P[PowX(k)].
파라미터 α 는 소위 말하는 "망각 인자(forgetting factor)"(0 < α < 1, 하나의 예로서의 α = 0.98)이다; γ 는 상수이다(예를 들어, 0.0243). P[PowX(k)] 는 조정 함수이며, 하나의 예로서 max(0.0, PowX(k)*γ/EstimatedNoisePow(k)-1) 가 될 수 있다. 본 예시에서, mSpectralGain(k,0) 은 0 으로서 초기화된다. 필터처리(166)의 출력이 복소 스펙트럼 출력 Y(k)(복소 신호로서도 언급됨) 이 되는 것이 도시된다.
도 3에 또한 도시된 바와 같이, 하나의 실시예에서, 시간 영역상으로 맵핑하기 위하여, 복소 스펙트럼 출력 Y(k)은 예를 들어, N 포인트 IFFT(블럭 168)에 의해 심화 처리될 수 있다. 하나의 실시예에서, 오버랩 가산(블럭 170) 기술이 시간 영역 잡음 제거 신호 Y(n)를 나타내는 샘플 프레임(블럭 172)을 재구축하기 위하여 사용될 수 있다.
도 3에 또한 도시된 바와 같이, 하나의 실시예에서, 바이패스 또는 재수렴 메카니즘이 다음과 같이 동작할 수 있다. X'(n) 프레임의 절대값의 합계, InstantLevelSum, 가 블럭 180에서 계산될 수 있다. 하나 또는 그 이상의 이전 프레임(들)에 대해서도 유사한 값(들)이 획득될 수 있다. 판단부(182)는 현재의 값과 하나 또는 그 이상의 이전 값을 기초로, InstantLevelSum 값이 0.0 이거나 또는 일정 기간(예를 들어, 80 ms)동안 선택값보다 작은지를 결정한다. 만약, "Yes" 이면, 시스템 상태는 재설정될 수 있으며, 잡음 감소 처리는 건너뛸 수 있다. 상기 상황에서, Y(k)는 X(k)로 대입되고, 상술한 Y(n)을 발생시키도록 처리된다. 만약, "No"이면, 상술된 바와 같이 잡음 파워 스펙트럼 추정 및/또는 스펙트럼 이득 결정이 파워 스펙트럼 PowX(k)을 기초로 수행될 수 있다.
도 5는 도 3(156)을 참조로 상술된 백색 잡음 검출기(200)에 관한 하나의 실시예를 도시한다. 합산부(202)는 파워 스펙트럼 PowX(k)를 수신하여 빈들(본 예에서는, 64개의 빈)을 합산하고, 합계 를 평활기(smoother)(204)에 제공한다. 평활기(204)는 파라미터 kAlphaW 및 합계 를 수신하여 mSmoothedInstantEnergy = kAlphaW*mSmoothedInstantEnergy + (1-kAlphaW)* 으로 표현될 수 있는 mSmoothedInstantEnergy 량을 발생시키는 것으로서 도시된다. 하나의 실시예에서, 파라미터 kAlphaW 은 대략 0.94818 값을 가지며, mSmoothedInstantEnergy 량은 0으로서 초기화된다.
도 5에 또한 도시된 바와 같이, mSmoothedInstantEnergy 와 구값인 oldSmoothedInstantEnergy 의 차이값(206)의 절대값(208)은 "A" 값을 갖는 것으로서 묘사된다. "B" 값은 oldSmoothedInstantEnergy 와 파라미터 kEnvelopeRatio 의 곱(214)으로서 정의된다. 하나의 실시예에서, kEnvelopeRatio 는 대략 0.0284 의 값을 갖는다. A 와 B 값들은 판단부(210)에서 비교된다. 만약, A 가 B 보다 작다면, 카운터 mWhiteNoiseFrameCount (0 으로서 초기화됨)는 1 로 증분된다(216). 이와 다른 경우에는, 카운터 mWhiteNoiseFrameCount 는 0 으로 재설정된다(218).
도 5에 또한 도시된 바와 같이, 판단 블럭(220)에서, 카운터 mWhiteNoiseFrameCount 의 현재값이 선택된 카운트 값 kNumWhiteNoiseFrames 과 비교된다. 하나의 실시예에서, kNumWhiteNoiseFrames 는 38 의 값을 갖는다. 만약, mWhiteNoiseFrameCount 가 kNumWhiteNoiseFrames 보다 크거나 또는 이와 동일하면, 백색 잡음이 존재하는 것으로 간주되고, 플래그 W_Flag가 하나의 예시적인 값 "1"로 설정된다(222). 카운터 mWhiteNoiseFrameCount 는 또한 kNumWhiteNoiseFrames 값으로 설정된다. 만약, mWhiteNoiseFrameCount 이 kNumWhiteNoiseFrames 보다 작다면, 백색 잡음의 존재는 선언되지 않고, 플래그 W_Flag가 "0" 으로 설정된다(224). 현재값 mSmoothedInstantEnergy 는 이제 다음 프레임에 대한 분석을 위하여 구(舊)값인 oldSmoothedInstantEnergy(226)이 된다.
도 6은 도 3을 참조(154)하여 상술한 잡음 활성 검출기(230)에 관한 하나의 실시예를 도시한다. 64 개의 예시적인 빈들을 갖는 파워 스펙트럼 PowX(k)(232)가 64 개의 빈들을 4 개의 예시적인 대역들(i = 1 내지 4)로 분할(234)시키는 것이 도시된다. 각각의 대역에서(i 번째 대역), 대역내 빈들의 파워 합계는 i 번째 대역에 대한 Mag_i 값을 발생시키기 위하여 제곱근 연산블럭(236)에 의해 처리된다. 하나의 실시예에서, Mag_i 값은 파라미터 kAlphaNad (240)을 또한 수신하는 평활기(smoother) 블럭(238)에 제공된다. 하나의 실시예에서, kAlphaNad 는 대략 0.55 값을 갖는다. 평활기(238)는 Mag_i 와 kAlphaNad 을 기초로 단순화된(smoothed) sMag_i 크기값을 sMag_i = kAlphaNad * sMag_i + (1-kAlphaNad)*Mag_i 와 같이 계산한다.
4 개의 예시적인 대역들에서 i = 1 내지 4 임을 주목한다. 하나의 실시예에서, sMag_i 의 값은 대략 0.925 값으로 초기화된다.
하나의 실시예에서, sMag_i 의 최소값이 선택된 구간동안(예를 들어, 30 프레임) 유지되고 업데이트된다. 따라서, 최소값 MinMag_i 가 업데이트되어야 하는지(242)를 살펴보기 위하여 평활기(238)로부터의 sMag_i 의 현재값은 기존의 최소값과 비교될 수 있다(242). sMag_i 의 현재값은 임계값(246)(예를 들어, 선택된 파라미터를 MinMag_i 와 곱함)과 비교된다(244). 만약 sMag_i 이 임계값보다 크면, 잡음 활성이 존재하는 것으로 간주되고, 본 명세서에서 설명되는 연합 판단(decision fusion)에서 플래그 N_Flag 는 "1" 로 설정된다. 이와 다른 경우에는, N_Flag 는 "0" 으로 설정된다.
도 7은 도 3을 참조(158)하여 상술한 네트워크 톤 검출기(250)에 관한 하나의 실시예를 도시한다. 본 명세서에서 설명되는 바와 같이, 네트워크 톤 검출기(250), 또는 이의 변형예들은 간단하고 효과적인 네트워크 톤 검출 알고리즘을 제공할 수 있다. 전화 시스템 등과 같은 시스템내에 네트워크 톤 정보를 보존하면서 효과적인 잡음 감소를 달성하기 위하여, 네트워크 톤 검출기(250)에 의해 제공되는 하나 또는 그 이상의 기능들은 또한 스펙트럼 감산(spectral subtraction) 기반 잡음 감소 기술과 결합될 수 있다. 게다가, 임의의 유용 정보를 손실하는 것 없 이 보다 나은 에코 소거를 제공하기 위하여, 네트워크 톤 검출 알고리즘은 에코 소거 기법과 통합되어 종합화될 수 있다.
하나의 실시예에서, 도 7 을 설명하기 위하여 다음의 파라미터들이 정의된다. 파라미터 mInPsdMaxIndex 는 현재 프레임에 대한 주파수 빈 번호로서, 이 빈은 예시적인 64 개의 주파수 빈들에서 최대 에너지를 갖는다. 파라미터 oldInPsdMaxIndex 는 이전 프레임에서 최대 에너지를 갖는 주파수 빈을 나타낸다. 파라미터 mMaxPsdRatio 는 0.0 과 1.0 사이에서 조정가능한 양의 인자이다. 파라미터 kNLow 및 kNHigh 는 네트워크 톤이 위치된 주파수 범위를 정의하는 것으로서; kNLow 는 최소 주파수를 정의하고, kNHigh 는 최대 주파수를 정의한다. 파라미터 mToneFrameCount 는 얼마나 많은 연속적인 프레임들이 네트워크 톤의 요건을 만족하는지를 나타내는 카운터이다. 파라미터 kNumToneFrames 는 임계값이다. T_Flag 는 검출된 플래그로서, 여기서 값 1 은 현재의 프레임이 네트워크 톤을 갖는 것으로 간주되는 것을 의미하고, 그렇지 않은 경우에서는, 현재 프레임이 네트워크 톤을 갖지 않는 것으로 간주된다.
도 7에 또한 도시된 바와 같이, 하나의 실시예에서, 네트워크 톤은 다음의 방법으로 검출될 수 있다. 프로세스 블럭 252에서, PowX(k)(예시적인 구성에서, k = 1 내지 64)의 최대값을 갖는 빈이 식별될 수 있으며, 이에 대응하는 빈 번호 k 가 mInPsdMaxIndex 로서 표기될 수 있다. mInPsdMaxIndex 와 oldInPsdMaxIndex 간의 차이값(254)의 절대값(256)은 "A" 로서 표시된다. 따라서, A = │mInPsdMaxIndex - oldInPsdMaxIndex│이다. mInPsdMaxIndex 와 mMaxPsdRatio 의 곱(258)은 "B"로서 표시된다. 그러므로, B = mInPsdMaxIndex*mMaxPsdRatio 이다.
판단 블럭 260 에서, 다음의 조건들, (A < B) 및 (kNLow ≤ mInPsdMaxIndex ≤ kNHigh)이 조사된다. 조건 (A < B)는 최대값을 갖는 현재의 빈들이 이전 빈으로부터 얼마나 많이 변경되었는지를 살펴보기 위하여 조사된다. 조건 (kNLow ≤ mInPsdMaxIndex ≤ kNHigh)는 최대값 빈이 알려진 네트워크 톤 주파수 범위내에 있는지를 살펴보기 위하여 조사된다.
만약 상기 양 조건들이 만족되면, 현재 프레임은 네트워크 톤을 갖는 것으로 간주되며, 프레임 카운터 mToneFrameCount 는 1 로 증분된다(264). 그렇지 않은 경우, 현재 프레임은 네트워크 톤을 갖지 않는 것으로 간주되며, 프레임 카운터 mToneFrameCount 는 0 으로 재설정된다(262).
판단 블럭 266은 T_Flag 를 "1"(네트워크 톤이 신호내에 존재)로서 설정할지 또는 "0"(네트워크 톤이 신호내에 존재하지 않음)으로 설정할지를 결정한다. 만약 mToneFrameCount ≥ kNumToneFrames 이라면, T_Flag 는 "1"로 설정되며(268), 그렇지 않은 경우에서는 "0"으로 설정된다(270). 양쪽 경우에서, 현재값 mInPsdMaxIndex 는 다음 프레임의 분석을 위하여 구값인 oldInPsdMaxIndex(272)이 된다.
하나의 실시예에서, 다음의 값들이 사용될 수 있다: mMaxPsdRatio = 0.21; kNumToneFrames = 19; kNLow = 2 및 kNHigh = 15(128 FFT 예시의 경우).
도 8은 도 3을 참조하여 위에서 언급된 검출 기반 이득 결정에 관한 하나의 예시적인 실시예(280)를 도시한다. mSpectralGain(k) 은 도 3의 블럭 164에서 추정 된 잡음 파워 스펙트럼의 동일 빈에 적용가능한 k 번째 빈에 대한 이득이다. mSpectralGain(k) 은 판단 블럭(282)의 결과를 기초로 조정되는 것이 도시되고 있으며, 여기서는 다음의 조건들: ((T_Flag = 0) 및 (N_Flag = 1)) 또는 (첫번째 M 개의 프레임들에서 현재 프레임이 있는가?)가 조사된다. 하나의 실시예에서, M = 9 이다.
판단 블럭(282)에 대한 답변이 "Yes" 이면, mSpectralGain(k) 은 인자 mNoiseActivityGain (하나의 예시에서, 0.2 < mNoiseActivityGain ≤ 1.0)에 의해 크기조정된다. 하나의 실시예에서, mNoiseActivityGain 은 대략 0.50 의 값을 갖는다. 그런 다음, 판단 블럭 286에서 다른 조건의 세트가 조사된다. 만약 판단 블럭 282 에 대한 답변이 "No" 이면, 판단 블럭(286)이 곧바로 실시된다.
판단 블럭은 다음의 조건들, (T_Flag = 0) 및 (W_Flag = 1)을 조사한다. 만약, 답변이 "Yes" 이면, mSpectralGain(k) 은 mMinSpectralGain*mGainW(288)으로서 추정될 수 있는 mWhiteNoiseSpectralGain 값으로 할당된다. 하나의 실시예에서, mMinSpectralGain 은 대략 0.25 값을 가지며, mGainW 는 대략 0.891 값을 갖는다. 만약, 답변이 "No" 이면, mSpectralGain(k) 은 다음의 예시적인 방법에서 클리퍼(clipper)(290)의 제어하에 놓이게 된다. 만약, mSpectralGain(k) 가 mMinSpectralGain 보다 작으면, mSpectralGain(k) = mMinSpectralGain 이다. 만약, mSpectralGain(k) 가 1.0 보다 크면, 모든 k 값들(본 예시에서는 1 내지 64)에 대하여 mSpectralGain(k) = 1.0 이다.
도 9는 하나의 실시예에서, 상술된 시스템(100)과 유사하게 시스템(300)이 구성될 수 있음을 도시한다. 시스템(300)은 의사 판단에 T_Flag 를 제공할 수 있는 네트워크 톤 검출기(302)를 갖는 것으로 도시되는데, 여기서 상기 플래그는 파워 스펙트럼 PowX(k)을 기초로 결정된다. 예시적인 시스템(100)과 마찬가지로, 의사 판단은 네트워크 톤의 존재 또는 부존재를 기초로 한 선택 스펙트럼 이득 조정을 포함할 수 있다. 하나의 실시예에서, 의사 판단 프로세스는 스펙트럼 이득 조정의 서로 다른 값을 결정하는데에 사용될 수 있는 도 8의 프로세스와 유사하며, 여기서는 기타 다른 검출기 플래그(s)가 아닌 T_Flag 를 기초로 판단이 이뤄진다.
전술한 바를 기초로, 각각의 주파수 빈에 적용되는 스펙트럼 이득은, 잡음 파워 추정뿐만이 아니라, 하나 또는 그 이상의 검출 및 이에 대응하는 판단에 기초될 수 있음을 살펴볼 수 있다. 예시로서 백색 잡음, 잡음 활성, 및 네트워크 톤이 논의되었지만, 잔여 잡음, 강 잡음, 중간 잡음 및 약 잡음 등과 같은 다른 종류의 잡음들 또한 취급될 수 있다. 이러한 연합 판단의 정보로 인하여, 총체적 판단 에러는 감소될 수 있거나 최소화될 수 있으며, 개선되거나 또는 최적화된 필터처리 이득이 주어진 시스템에서 획득될 수 있다.
본 발명의 특징들의 다양한 조합을 이행함으로써, 정적 잡음에 대해 12 - 20 dB (조정가능한 억제량)의 효과적인 잡음 억제를 가지면서 매우 양호한 음성 품질이 획득가능한데, 그 이유는 스펙트럼 필터처리에서 사용되는 이득이 단순히 잡음 추정으로부터 결정되는 것이 아니라, 잡음 파워 추정과 다른 하나 또는 그 이상의 검출 및 이에 대응하는 판단의 통합에 의해 결정될 수 있기 때문이다.
또한, 다음은 본 발명의 비제한적인 일부 주목할만한 특징들이다: (1) 본 발 명의 다양한 특징들은 일반적으로 입력 레벨에 독립적이며, 따라서, 검출(들) 및 판단(들)로부터의 정보가 관련 파워 추정(들)을 표준화하는데에 사용될 수 있다; (2) 본 발명의 다양한 특징들은 일반적으로 AGC (자동 이득 제어, 입력 신호의 신호 대 잡음비는 잡음 감소 처리가 적용되기 전에 변경된다)와 관련된 왜곡을 회피할 수 있다; (3) 본 발명의 기술은 이용가능한 수 많은 다른 NR 시스템(연산 강화 AGC 를 포함)에서 사용되는 크기 스펙트럼대신으로 파워 스펙트럼에 기초되고 있기 때문에, 연산 복잡성이 낮아질 수 있다; (4) 효과적인 네트워크 톤 검출 및 관련 기능들이 제공되기 때문에, 네트워크 톤이 전화 응용예의 수신 경로에서 보존될 수 있다; (5) 다양한 관련 파라미터들이 다양한 측정 결과들에 따라 적응적으로 변경될 수 있기 때문에, 신속하고 조절가능한 수렴 시간, 유연성 있는 제어, 재수렴, 및 초기 수렴이 취득가능하다.
하나의 실시예에서, 본 명세서에서 서술된 하나 또는 그 이상의 특징은 또한 다중 채널 통신 시스템에서 이행될 수 있다. 다중 채널의 경우, 연합 정보는 하나의 채널의 다중 검출들간에서 뿐만이 아니라, 다중 채널간에서도 이행될 수 있다.
네트워크 톤 검출기와 관련하여, 다음을 주목한다. 만약 네트워크 톤이 나타나면, 네트워크 톤이 감소되지 않도록 하기 위하여, 잡음 감소 기법은 입력을 유용 신호로서 취급하고 다른 스펙트럼 이득의 사용으로 전환한다. 이로 인하여, 잡음 감소 기법은 SNR 을 증가시킬 수 있을 뿐만이 아니라, 이용가능한 기타 잡음 감소 알고리즘을 수행하는 동안에 네트워크 톤 정보의 이용이 가능하도록 할 수 있다.
또한, 네트워크 톤 검출기가 스펙트럼 감산 기반 잡음 감소 알고리즘내에서 이용가능한 스펙트럼들에 기초되고 있기 때문에, 파워(또는 크기) 스펙트럼을 획득하는데에 특별한 연산이 필요하지 않게 된다. 그 결과, 네트워크 톤 검출기는 단순화될 수 있고 다른 응용예들에서 용이하게 구현될 수 있다. 게다가, 네트워크 톤 검출기는 간단하게 기존의 신호 채널 잡음 감소 기법들에 부가될 수 있다. 게다가, 네트워크 톤 검출기 및 관련 알고리즘(들)은 일부 전화 시스템내에서 발견되는 주파수 영역 기반의 에코 소거 기법들의 통합으로 종합화될 수 있다. 또한, 본 기술은 시그날링 검출기 등에서도 사용될 수 있다.
일반적으로, 프로세서는, 예를 들어, 본 명세서에서 서술된 바와 같이 동작하는 컴퓨터, 프로그램 논리, 또는 데이터 및 명령어를 표현하는 기타 기판 구성들을 포함할 수 있음을 이해할 수 있을 것이다. 다른 실시예들에서, 프로세서는, 제어 회로, 프로세서 회로, 프로세서, 범용 단일 칩 또는 멀티 칩 마이크로프로세서, 디지탈 신호 프로세서, 내장 마이크로프로세서, 마이크로제어기 등을 포함할 수 있다.
또한, 하나의 실시예에서, 프로그램 논리는 하나 또는 그 이상의 구성부로서 유리하게 구현될 수 있음을 이해할 수 있을 것이다. 구성부는 하나 또는 그 이상의 프로세서상에서 실행되도록 유리하게 구성될 수 있다. 구성부는 소프트웨어 또는 하드웨어 구성부, 소프트웨어 모듈 등과 같은 모듈, 객체 지향 소프트웨어 구성부, 클래스 구성부 및 태스크 구성부, 프로세스 방법, 기능, 속성, 절차, 서브루틴, 프로그램 코드 세그먼트, 드라이버, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조, 테이블, 어레이 및 변수를 포함하며, 상기 예시들에만 국한되 는 것은 아니다.
상기 공개된 실시예들을 통해 상술된 실시예에 적용되는 본 발명의 신규한 기본 특징들을 도시하고, 설명하고, 지적하였지만, 도시된 장치, 시스템 및/또는 방법의 설명에서 다양한 생략, 대체 및 변경이 본 발명의 범위에서 이탈되는 것 없이 당업자에 의해 취해질 수 있음을 이해해야 한다. 결론적으로, 본 발명의 범위는 상술된 설명에 의해 한정되는 것이 아니라 첨부된 청구항들에 의해 정의되어야만 한다.
Claims (32)
- 오디오 잡음을 감소시키는 시스템으로서:시간 영역 입력 신호를 수신하고, 주파수 영역 입력 신호 및 상기 주파수 영역 입력 신호의 파워 스펙트럼을 발생시키도록 구성된 입력부;선택된 음향 성분의 존재를 상기 파워 스펙트럼내에서 검출하도록 각각 구성된 적어도 하나의 검출부;적어도 하나의 상기 선택된 음향 성분의 존재의 검출을 기초로 조정 파워 스펙트럼을 발생시키고; 주파수 영역 출력 신호를 발생시키기 위하여 상기 조정 파워 스펙트럼을 상기 주파수 영역 입력 신호와 결합하도록 구성된 조정부; 및상기 주파수 영역 출력 신호를 기초로 시간 영역 출력 신호를 발생시키도록 구성된 출력부를 포함하는 것을 특징으로 하는 오디오 잡음을 감소시키는 시스템.
- 제 1 항에 있어서, 상기 시간 영역 입력 신호는 음성 통신 신호를 포함하는 것을 특징으로 하는 오디오 잡음을 감소시키는 시스템.
- 제 1 항에 있어서, 상기 적어도 하나의 검출부는 잡음 활성 검출기, 백색 잡음 검출기 및 네트워크 톤 검출기 중에서 적어도 하나를 포함하는 것을 특징으로 하는 오디오 잡음을 감소시키는 시스템.
- 제 3 항에 있어서, 상기 파워 스펙트럼은 상기 시간 영역 입력 신호의 N 개 샘플값에 대응하는 N 개의 주파수 빈(frequency bin)을 포함하는 것을 특징으로 하는 오디오 잡음을 감소시키는 시스템.
- 제 4 항에 있어서, 상기 잡음 활성 검출기는, 상기 N개의 주파수 빈들의 하나 또는 그 이상의 그룹들의 크기를 대응 선택값과 서로 비교하고, 상기 파워 스펙트럼내에 잡음 활성의 존재 또는 부존재를 표시하는 잡음 활성 지표(指標)를 발생시키는 것을 특징으로 하는 오디오 잡음을 감소시키는 시스템.
- 제 5 항에 있어서, 상기 잡음 활성 검출기는:상기 N 개의 주파수 빈들을 복수개의 대역들로 분할하고;상기 복수개의 대역들마다의 크기값을 획득하고;상기 크기값을 상기 복수개의 대역들마다의 임계값과 비교하고; 그리고상기 복수개의 대역들 중 선택된 번호의 대역에서 상기 크기값이 상기 임계값을 초과하면 상기 잡음 활성의 존재를 결정하도록 구성되는 것을 특징으로 하는 오디오 잡음을 감소시키는 시스템.
- 제 4 항에 있어서, 상기 백색 잡음 검출기는:상기 N 개의 주파수 빈들의 합계를 기초로 현재의 에너지값을 획득하고;상기 현재의 에너지값과 이전의 에너지값사이의 차이값 - 상기 차이값은 양 의 값을 가짐 - 를 획득하고; 그리고,상기 차이값이 선택된 값보다 크면, 상기 파워 스펙트럼내에 백색 잡음의 존재를 표시하는 백색 잡음 지표를 발생시키도록 구성되는 것을 특징으로 하는 오디오 잡음을 감소시키는 시스템.
- 제 4 항에 있어서, 상기 네트워크 톤 검출기는:상기 N 개의 주파수 빈들 중에서 최대값을 갖는 선택된 빈을 식별하고; 그리고,상기 선택된 빈이 하나 또는 그 이상의 조건들을 만족하면, 상기 파워 스펙트럼내에서의 네트워크 톤의 존재를 표시하는 네트워크 톤 지표를 발생시키도록 구성된 것을 특징으로 하는 오디오 잡음을 감소시키는 시스템.
- 제 8 항에 있어서, 상기 선택된 빈이 선택된 양을 초과하여 변경되지 않고, 상기 선택된 빈이 상기 네트워크 톤에 대응하는 주파수 범위내에 있는 경우에, 상기 네트워크 톤 지표가 발생되는 것을 특징으로 하는 오디오 잡음을 감소시키는 시스템.
- 제 4 항에 있어서, 상기 조정 파워 스펙트럼은, 상기 하나 또는 그 이상의 선택된 음향 성분의 검출을 기초로 조정되는, 추정된 파워 스펙트럼을 포함하는 것을 특징으로 하는 오디오 잡음을 감소시키는 시스템.
- 제 10 항에 있어서, 상기 추정된 파워 스펙트럼의 조정은, 만약 네트워크 톤이 상기 네트워크 톤 검출기에 의해 검출되지 않고, 잡음 활성이 상기 잡음 활성 검출기에 의해 검출되는 경우에, 상기 추정된 파워 스펙트럼을 선택된 양만큼 크기조정하는 것을 포함하는 것을 특징으로 하는 오디오 잡음을 감소시키는 시스템.
- 제 11 항에 있어서, 상기 추정된 파워 스펙트럼의 조정은, 만약 네트워크 톤이 상기 네트워크 톤 검출기에 의해 검출되지 않고, 백색 잡음이 상기 백색 잡음 검출기에 의해 검출되는 경우에, 백색 잡음을 조정하는 것을 포함하는 것을 특징으로 하는 오디오 잡음을 감소시키는 시스템.
- 제 1 항에 있어서, 상기 시간 영역 입력 신호를 기초로 상기 검출부 및 상기 조정부 중 적어도 하나를 건너뛰게끔 하도록 구성된 재수렴부를 더 포함하는 것을 특징으로 하는 오디오 잡음을 감소시키는 시스템.
- 제 13 항에 있어서, 상기 건너뜀은, 상기 시간 영역 입력 신호를 나타내는 선택값이 선택구간 동안에 임계값보다 낮게 유지되는 경우에 수행되는 것을 특징으로 하는 오디오 잡음을 감소시키는 시스템.
- 제 14 항에 있어서, 상기 임계값은 실질적으로 0 인 것을 특징으로 하는 오 디오 잡음을 감소시키는 시스템.
- 오디오 잡음을 감소시키는 방법으로서:시간 영역 입력 신호를 수신하고, 주파수 영역 입력 신호 및 상기 주파수 영역 입력 신호의 파워 스펙트럼을 발생시키는 단계;상기 파워 스펙트럼내에서 하나 또는 그 이상의 음향 성분의 존재를 검출하는 단계;상기 하나 또는 그 이상의 음향 성분의 존재의 검출을 기초로 조정 파워 스펙트럼을 발생시키는 단계;주파수 영역 출력 신호를 발생시키기 위하여 상기 조정 파워 스펙트럼을 상기 주파수 영역 입력 신호와 결합하는 단계; 및상기 주파수 영역 출력 신호를 기초로 시간 영역 출력 신호를 발생시키는 단계를 포함하는 것을 특징으로 하는 오디오 잡음을 감소시키는 방법.
- 제 16 항에 있어서, 상기 시간 영역 입력 신호는 음성 통신 신호를 포함하는 것을 특징으로 하는 오디오 잡음을 감소시키는 방법.
- 제 16 항에 있어서, 상기 하나 또는 그 이상의 음향 성분은 잡음 활성, 백색 잡음 및 네트워크 톤 중에서 적어도 하나를 포함하는 것을 특징으로 하는 오디오 잡음을 감소시키는 방법.
- 제 18 항에 있어서, 상기 파워 스펙트럼은 상기 시간 영역 입력 신호의 N 개 샘플값에 대응하는 N 개의 주파수 빈을 포함하는 것을 특징으로 하는 오디오 잡음을 감소시키는 방법.
- 제 19 항에 있어서, 상기 잡음 활성은, 상기 N개 주파수 빈들의 하나 또는 그 이상의 그룹들의 크기를 대응 선택값과 비교하는 단계와, 상기 파워 스펙트럼내에 상기 잡음 활성의 존재 또는 부존재를 표시하는 잡음 활성 지표를 발생시키는 단계에 의해 검출되는 것을 특징으로 하는 오디오 잡음을 감소시키는 방법.
- 제 20 항에 있어서, 상기 잡음 활성은:상기 N 개의 주파수 빈들을 복수개의 대역들로 분할하는 단계;상기 복수개의 대역들마다의 크기값을 획득하는 단계;상기 크기값을 상기 복수개의 대역들마다의 임계값과 비교하는 단계; 및상기 복수개의 대역들 중 선택된 번호의 대역에서 상기 크기값이 상기 임계값을 초과하면 상기 잡음 활성의 존재를 결정하는 단계에 의해 검출되는 것을 특징으로 하는 오디오 잡음을 감소시키는 방법.
- 제 19 항에 있어서, 상기 백색 잡음은:상기 N 개의 주파수 빈들의 합계를 기초로 현재의 에너지값을 획득하는 단 계;상기 현재의 에너지값과 이전의 에너지값사이의 차이값 - 상기 차이값은 양의 값을 가짐 - 를 획득하는 단계; 및,상기 차이값이 선택된 값보다 크면, 상기 파워 스펙트럼내에 백색 잡음의 존재를 표시하는 백색 잡음 지표를 발생시키는 단계에 의해 검출되는 것을 특징으로 하는 오디오 잡음을 감소시키는 방법.
- 제 19 항에 있어서, 상기 네트워크 톤은:상기 N 개의 주파수 빈들 중에서 최대값을 갖는 선택된 빈을 식별하는 단계; 및상기 선택된 빈이 하나 또는 그 이상의 조건들을 만족하면, 상기 파워 스펙트럼내에서의 네트워크 톤의 존재를 표시하는 네트워크 톤 지표를 발생시키는 단계에 의해 검출되는 것을 특징으로 하는 오디오 잡음을 감소시키는 방법.
- 제 23 항에 있어서, 상기 네트워크 톤 지표는, 상기 선택된 빈이 선택된 양을 초과하여 변경되지 않고, 상기 선택된 빈이 상기 네트워크 톤에 대응하는 주파수 범위내에 있는 경우에 발생되는 것을 특징으로 하는 오디오 잡음을 감소시키는 방법.
- 제 19 항에 있어서, 상기 조정 파워 스펙트럼은, 상기 하나 또는 그 이상의 음향 성분의 검출을 기초로 조정되는, 추정된 파워 스펙트럼을 포함하는 것을 특징으로 하는 오디오 잡음을 감소시키는 방법.
- 제 25 항에 있어서, 상기 추정된 파워 스펙트럼의 조정은, 만약 상기 네트워크 톤이 검출되지 않고 상기 잡음 활성이 검출되는 경우에, 상기 추정된 파워 스펙트럼을 선택된 양만큼 크기조정하는 것을 포함하는 것을 특징으로 하는 오디오 잡음을 감소시키는 방법.
- 제 26 항에 있어서, 상기 추정된 파워 스펙트럼의 조정은, 만약 상기 네트워크 톤이 검출되지 않고 상기 백색 잡음이 검출되는 경우에, 상기 백색 잡음을 조정하는 것을 더 포함하는 것을 특징으로 하는 오디오 잡음을 감소시키는 방법.
- 제 16 항에 있어서, 상기 시간 영역 입력 신호를 기초로 상기 검출단계를 건너뛰는 단계를 더 포함하는 것을 특징으로 하는 오디오 잡음을 감소시키는 방법.
- 제 28 항에 있어서, 상기 건너뛰는 단계는, 상기 시간 영역 입력 신호를 나타내는 선택값이 선택구간동안에 임계값보다 낮게 유지되는 경우에 수행되는 것을 특징으로 하는 오디오 잡음을 감소시키는 방법.
- 제 29 항에 있어서, 상기 임계값은 실질적으로 0 인 것을 특징으로 하는 오 디오 잡음을 감소시키는 방법.
- 신호 대 잡음비를 갖는 입력 신호를 수신하고, 상기 입력 신호에 대응하는 파워 스펙트럼을 발생시키도록 구성된 입력부; 및상기 파워 스펙트럼내에서 하나 또는 그 이상의 음향 성분의 존재를 검출하도록 구성된 검출기를 포함하며;상기 검출은 상기 입력 신호의 신호 대 잡음 비를 실질적으로 동일 레벨에서 유지하면서 수행되는 것을 특징으로 하는 오디오 잡음을 감소시키는 시스템.
- 입력 신호에 대응하는 파워 스펙트럼을 발생시키는 수단;상기 파워 스펙트럼내에서 하나 또는 그 이상의 음향 성분을 검출하는 수단; 및상기 하나 또는 그 이상의 음향 성분의 검출을 기초로 상기 입력 신호를 조정하는 수단을 포함하는 것을 특징으로 하는 오디오 잡음을 감소시키는 시스템.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US67367105P | 2005-04-21 | 2005-04-21 | |
US60/673,671 | 2005-04-21 | ||
PCT/US2006/015168 WO2006116132A2 (en) | 2005-04-21 | 2006-04-21 | Systems and methods for reducing audio noise |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080002990A true KR20080002990A (ko) | 2008-01-04 |
KR101168466B1 KR101168466B1 (ko) | 2012-07-26 |
Family
ID=36808839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077027014A KR101168466B1 (ko) | 2005-04-21 | 2006-04-21 | 오디오 잡음을 감소시키는 시스템 및 방법 |
Country Status (7)
Country | Link |
---|---|
US (2) | US7912231B2 (ko) |
EP (1) | EP1875466B1 (ko) |
JP (1) | JP5203933B2 (ko) |
KR (1) | KR101168466B1 (ko) |
CN (1) | CN100580775C (ko) |
CA (1) | CA2604210C (ko) |
WO (1) | WO2006116132A2 (ko) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102009004041A1 (de) | 2008-01-10 | 2009-09-17 | Mando Corp., Pyungtaek | Fahrzeugbremsvorrichtung für ein elektronisches Hydraulikbremssystem |
KR101133313B1 (ko) * | 2008-12-24 | 2012-04-04 | 후지쯔 가부시끼가이샤 | 잡음 검출 장치 및 잡음 검출 방법 |
US8874440B2 (en) | 2009-04-17 | 2014-10-28 | Samsung Electronics Co., Ltd. | Apparatus and method for detecting speech |
WO2016053019A1 (ko) * | 2014-10-01 | 2016-04-07 | 삼성전자 주식회사 | 잡음이 포함된 오디오 신호를 처리하는 방법 및 장치 |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007028250A2 (en) * | 2005-09-09 | 2007-03-15 | Mcmaster University | Method and device for binaural signal enhancement |
MX2009008055A (es) * | 2007-03-02 | 2009-08-18 | Ericsson Telefon Ab L M | Metodo y arreglos en una red de telecomunicaciones. |
CN101110217B (zh) * | 2007-07-25 | 2010-10-13 | 北京中星微电子有限公司 | 一种音频信号的自动增益控制方法及装置 |
US8712762B2 (en) * | 2007-07-27 | 2014-04-29 | Vereniging Voor Christelijk Hoger Onderwijs, Wetenschappelijk Onderzoek En Patiëntenzor | Noise suppression in speech signals |
DE602007004217D1 (de) * | 2007-08-31 | 2010-02-25 | Harman Becker Automotive Sys | Schnelle Schätzung der Spektraldichte der Rauschleistung zur Sprachsignalverbesserung |
US9142221B2 (en) * | 2008-04-07 | 2015-09-22 | Cambridge Silicon Radio Limited | Noise reduction |
TWI415484B (zh) * | 2009-01-20 | 2013-11-11 | Green Solution Tech Co Ltd | 具有噪音防止之轉換電路及轉換控制器 |
CN102208190B (zh) * | 2011-05-06 | 2012-11-28 | 声科科技(南京)有限公司 | 抑制非平稳噪声设备收敛时间的测量方法及装置 |
US9117455B2 (en) | 2011-07-29 | 2015-08-25 | Dts Llc | Adaptive voice intelligibility processor |
CN103457453B (zh) * | 2012-06-04 | 2016-05-11 | 台达电子工业股份有限公司 | 一种用于降低音频噪音的控制方法 |
TWI576834B (zh) * | 2015-03-02 | 2017-04-01 | 聯詠科技股份有限公司 | 聲頻訊號的雜訊偵測方法與裝置 |
DE102015207706B3 (de) * | 2015-04-27 | 2016-08-18 | Sivantos Pte. Ltd. | Verfahren zur frequenzabhängigen Rauschunterdrückung eines Eingangssignals |
TWI569594B (zh) * | 2015-08-31 | 2017-02-01 | 晨星半導體股份有限公司 | 突波干擾消除裝置及突波干擾消除方法 |
KR102443637B1 (ko) | 2017-10-23 | 2022-09-16 | 삼성전자주식회사 | 네트워크 연결 정보에 기반하여 잡음 제어 파라미터를 결정하는 전자 장치 및 그의 동작 방법 |
CN109951198B (zh) | 2017-12-20 | 2022-06-07 | 三星电子株式会社 | 执行选择性噪声滤波的无线通信设备及操作该设备的方法 |
JP7042169B2 (ja) * | 2018-06-21 | 2022-03-25 | 日清紡マイクロデバイス株式会社 | 音声認識支援システム |
CN109829035A (zh) * | 2018-12-19 | 2019-05-31 | 平安国际融资租赁有限公司 | 流程搜索方法、装置、计算机设备和存储介质 |
CN112017674B (zh) * | 2020-08-04 | 2024-02-02 | 杭州联汇科技股份有限公司 | 一种基于音频特征检测广播音频信号中噪声的方法 |
US11915715B2 (en) | 2021-06-24 | 2024-02-27 | Cisco Technology, Inc. | Noise detector for targeted application of noise removal |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4358738A (en) * | 1976-06-07 | 1982-11-09 | Kahn Leonard R | Signal presence determination method for use in a contaminated medium |
US4630604A (en) | 1985-04-09 | 1986-12-23 | Siebe North, Inc. | Valve assembly for a replaceable filter respirator |
US4628529A (en) | 1985-07-01 | 1986-12-09 | Motorola, Inc. | Noise suppression system |
US4630305A (en) | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
IL84948A0 (en) * | 1987-12-25 | 1988-06-30 | D S P Group Israel Ltd | Noise reduction system |
JP2919685B2 (ja) * | 1992-11-02 | 1999-07-12 | シャープ株式会社 | 信号識別回路 |
PL174216B1 (pl) | 1993-11-30 | 1998-06-30 | At And T Corp | Sposób redukcji w czasie rzeczywistym szumu transmisji mowy |
US5937060A (en) | 1996-02-09 | 1999-08-10 | Texas Instruments Incorporated | Residual echo suppression |
US5933495A (en) | 1997-02-07 | 1999-08-03 | Texas Instruments Incorporated | Subband acoustic noise suppression |
US6415253B1 (en) | 1998-02-20 | 2002-07-02 | Meta-C Corporation | Method and apparatus for enhancing noise-corrupted speech |
US6289309B1 (en) | 1998-12-16 | 2001-09-11 | Sarnoff Corporation | Noise spectrum tracking for speech enhancement |
DK1141948T3 (da) * | 1999-01-07 | 2007-08-13 | Tellabs Operations Inc | Fremgangsmåde og apparat til adaptiv undertrykkelse af stöj |
FI116643B (fi) | 1999-11-15 | 2006-01-13 | Nokia Corp | Kohinan vaimennus |
US6760435B1 (en) | 2000-02-08 | 2004-07-06 | Lucent Technologies Inc. | Method and apparatus for network speech enhancement |
US6523003B1 (en) | 2000-03-28 | 2003-02-18 | Tellabs Operations, Inc. | Spectrally interdependent gain adjustment techniques |
US6766292B1 (en) | 2000-03-28 | 2004-07-20 | Tellabs Operations, Inc. | Relative noise ratio weighting techniques for adaptive noise cancellation |
US6529868B1 (en) | 2000-03-28 | 2003-03-04 | Tellabs Operations, Inc. | Communication system noise cancellation power signal calculation techniques |
US6671667B1 (en) | 2000-03-28 | 2003-12-30 | Tellabs Operations, Inc. | Speech presence measurement detection techniques |
US7617099B2 (en) | 2001-02-12 | 2009-11-10 | FortMedia Inc. | Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile |
US7206418B2 (en) | 2001-02-12 | 2007-04-17 | Fortemedia, Inc. | Noise suppression for a wireless communication device |
US20040148166A1 (en) | 2001-06-22 | 2004-07-29 | Huimin Zheng | Noise-stripping device |
US7277554B2 (en) | 2001-08-08 | 2007-10-02 | Gn Resound North America Corporation | Dynamic range compression using digital frequency warping |
KR100400226B1 (ko) | 2001-10-15 | 2003-10-01 | 삼성전자주식회사 | 음성 부재 확률 계산 장치 및 방법과 이 장치 및 방법을이용한 잡음 제거 장치 및 방법 |
US20030110029A1 (en) * | 2001-12-07 | 2003-06-12 | Masoud Ahmadi | Noise detection and cancellation in communications systems |
US7146316B2 (en) | 2002-10-17 | 2006-12-05 | Clarity Technologies, Inc. | Noise reduction in subbanded speech signals |
JP4520732B2 (ja) | 2003-12-03 | 2010-08-11 | 富士通株式会社 | 雑音低減装置、および低減方法 |
US8189803B2 (en) * | 2004-06-15 | 2012-05-29 | Bose Corporation | Noise reduction headset |
US7454332B2 (en) | 2004-06-15 | 2008-11-18 | Microsoft Corporation | Gain constrained noise suppression |
US20060111912A1 (en) * | 2004-11-19 | 2006-05-25 | Christian Andrew D | Audio analysis of voice communications over data networks to prevent unauthorized usage |
-
2006
- 2006-04-21 WO PCT/US2006/015168 patent/WO2006116132A2/en active Application Filing
- 2006-04-21 EP EP06751033.9A patent/EP1875466B1/en not_active Not-in-force
- 2006-04-21 CN CN200680013388A patent/CN100580775C/zh not_active Expired - Fee Related
- 2006-04-21 CA CA2604210A patent/CA2604210C/en not_active Expired - Fee Related
- 2006-04-21 KR KR1020077027014A patent/KR101168466B1/ko not_active IP Right Cessation
- 2006-04-21 US US11/408,488 patent/US7912231B2/en not_active Expired - Fee Related
- 2006-04-21 JP JP2008507934A patent/JP5203933B2/ja not_active Expired - Fee Related
-
2011
- 2011-03-21 US US13/053,088 patent/US9386162B2/en not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102009004041A1 (de) | 2008-01-10 | 2009-09-17 | Mando Corp., Pyungtaek | Fahrzeugbremsvorrichtung für ein elektronisches Hydraulikbremssystem |
KR101133313B1 (ko) * | 2008-12-24 | 2012-04-04 | 후지쯔 가부시끼가이샤 | 잡음 검출 장치 및 잡음 검출 방법 |
US8874440B2 (en) | 2009-04-17 | 2014-10-28 | Samsung Electronics Co., Ltd. | Apparatus and method for detecting speech |
WO2016053019A1 (ko) * | 2014-10-01 | 2016-04-07 | 삼성전자 주식회사 | 잡음이 포함된 오디오 신호를 처리하는 방법 및 장치 |
US10366703B2 (en) | 2014-10-01 | 2019-07-30 | Samsung Electronics Co., Ltd. | Method and apparatus for processing audio signal including shock noise |
Also Published As
Publication number | Publication date |
---|---|
US20110172997A1 (en) | 2011-07-14 |
US20060256764A1 (en) | 2006-11-16 |
CN100580775C (zh) | 2010-01-13 |
WO2006116132A2 (en) | 2006-11-02 |
JP2008537185A (ja) | 2008-09-11 |
EP1875466B1 (en) | 2016-06-29 |
US7912231B2 (en) | 2011-03-22 |
EP1875466A2 (en) | 2008-01-09 |
CN101164105A (zh) | 2008-04-16 |
CA2604210A1 (en) | 2006-11-02 |
JP5203933B2 (ja) | 2013-06-05 |
US9386162B2 (en) | 2016-07-05 |
KR101168466B1 (ko) | 2012-07-26 |
WO2006116132A3 (en) | 2007-04-12 |
CA2604210C (en) | 2016-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101168466B1 (ko) | 오디오 잡음을 감소시키는 시스템 및 방법 | |
TWI463817B (zh) | 可適性智慧雜訊抑制系統及方法 | |
KR100860805B1 (ko) | 음성 강화 시스템 | |
KR101210313B1 (ko) | 음성 향상을 위해 마이크로폰 사이의 레벨 차이를 활용하는시스템 및 방법 | |
KR101610656B1 (ko) | 널 프로세싱 노이즈 감산을 이용한 노이즈 억제 시스템 및 방법 | |
US6487257B1 (en) | Signal noise reduction by time-domain spectral subtraction using fixed filters | |
Esch et al. | Efficient musical noise suppression for speech enhancement system | |
CA2638265C (en) | Noise reduction with integrated tonal noise reduction | |
KR100739905B1 (ko) | 소스 음성 신호에서 잡음을 억제하는 방법 및 잡음 억제기 | |
KR20070085729A (ko) | 바크 밴드 위너 필터 및 선형 감쇠를 이용한 노이즈 감소및 컴포트 노이즈 이득 제어 | |
KR101737824B1 (ko) | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치 | |
WO2008104446A2 (en) | Method for reducing noise in an input signal of a hearing device as well as a hearing device | |
JP6857344B2 (ja) | オーディオ信号を処理するための装置および方法 | |
JP2009020472A (ja) | 音処理装置およびプログラム | |
JP2002541529A (ja) | 時間領域スペクトラル減算による信号雑音の低減 | |
KR101993003B1 (ko) | 잡음 제거 장치 및 방법 | |
Adiga et al. | Improving single frequency filtering based Voice Activity Detection (VAD) using spectral subtraction based noise cancellation | |
JP2010217551A (ja) | 音処理装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20150706 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20160706 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20170710 Year of fee payment: 6 |
|
LAPS | Lapse due to unpaid annual fee |