KR20070084312A - 적응 시간-기반 잡음 억제 - Google Patents
적응 시간-기반 잡음 억제 Download PDFInfo
- Publication number
- KR20070084312A KR20070084312A KR1020077011211A KR20077011211A KR20070084312A KR 20070084312 A KR20070084312 A KR 20070084312A KR 1020077011211 A KR1020077011211 A KR 1020077011211A KR 20077011211 A KR20077011211 A KR 20077011211A KR 20070084312 A KR20070084312 A KR 20070084312A
- Authority
- KR
- South Korea
- Prior art keywords
- audio signal
- level
- estimated
- noise level
- signal
- Prior art date
Links
- 230000003044 adaptive effect Effects 0.000 title claims description 4
- 230000001629 suppression Effects 0.000 title description 2
- 230000005236 sound signal Effects 0.000 claims abstract description 101
- 238000000034 method Methods 0.000 claims abstract description 33
- 230000000116 mitigating effect Effects 0.000 claims abstract description 11
- 230000006837 decompression Effects 0.000 claims description 22
- 230000001939 inductive effect Effects 0.000 claims 1
- 238000004891 communication Methods 0.000 description 20
- 230000002238 attenuated effect Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 206010035148 Plague Diseases 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/06—Receivers
- H04B1/10—Means associated with receiver for limiting or suppressing noise or interference
- H04B1/1027—Means associated with receiver for limiting or suppressing noise or interference assessing signal quality or detecting noise/interference for the received signal
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Noise Elimination (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Circuit For Audible Band Transducer (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
오디오 신호와 관련된 잡음을 완화하기 위한 시스템, 장치 및 방법을 제공한다. 오디오 신호와 관련된 잡음을 완화하기 위한 시스템(100)은 추정 모듈(108)을 포함한다. 추정 모듈은 오디오 신호와 관련된 잡음의 추정 레벨을 결정한다. 본 시스템은 신장 모듈(110)을 또한 포함한다. 신장 모듈은 오디오 신호의 레벨이 신호 임계치 이하인 경우에 오디오 신호의 감쇄를 유발한다. 신장 모듈은 신장 모듈이 유발한(606) 감쇄가 추정 모듈이 추정한(602) 잡음 레벨에 기초하도록 적응적으로 조정할 수 있다.
오디오 신호, 잡음, 추정 잡음 레벨, 신호 임계치, 감쇄
Description
본 발명은 전자통신 분야에 관한 것으로서, 특히 오디오 신호에 기초한 전자통신에 관한 것이다.
잡음은 신호 품질을 떨어뜨릴 수 있다. 오디오 신호가 휴대전화 또는 다른 음성-기반 통신 디바이스를 통해 변조 및 전달되는 전자통신 환경에서, 잡음이 신호를 왜곡시킬 수 있어 누군가와 통신하는 청취자는 신호를 이해할 수 없게 되고, 또는 얼마간이라도 불쾌하게 된다. 그와 같은 통신 디바이스의 사용자를 자주 괴롭히는 잡음의 공통적인 형태는 배경 잡음이다. 배경 잡음은 레스토랑 또는 다른 공공 시설물과 같은 공공 장소에서 흔히 퍼지는 누화 간섭 잡음(babble noise)이라고 불리는 이질적인 음성을 포함한다. 또한, 오디오 신호가 전달하는 음성 성분을 방해 또는 왜곡시킬 수 있는 음악 등과 같은 다른 이질적인 소리를 포함한다.
종래의 디바이스는 레거시 잡음 억압기(legacy noise suppressor)에 의지하여 잡음을 처리하는 경향이 있다. 레거시 잡음 억압기의 기능적 접근법은 통상적으로 주파수-기반 알고리즘의 실현에 기초한다. 이 접근법은 백색 잡음을 성공적으로 감소시킬 수 있지만, 배경 잡음으로서 간주하는 것과 같은 다른 타입의 잡음을 처리하기 위한 기법으로서는 효과적이지 않다. 이는, 아마도 배경 잡음으로 나 타내는 종류의 잡음은 통상적으로 오디오 신호의 주파수 스펙트럼의 동일한 영역들을 그 신호의 음성 성분이 차지하는 영역으로서 공유한다는 사실에 기인한다. 그러나 레거시 잡음 억압기는 주로 주파수 스펙트럼의 하단을 차지하는 백색 잡음의 감소에 초점을 맞춘다.
따라서, 본 기술분야는 잡음, 특히 배경 잡음으로서 간주하는 잡음을 충분히 억제하기 위한 효과적이고 유효한 디바이스 또는 기법이 필요하다. 또한, 종래의 디바이스 및 기법, 특히 주파수-기반의 디바이스 및 기법은 오디오 신호와 관련된 잡음의 추정 레벨에 기초하여 잡음을 억제하기 위한 능력이 필요하다. 즉, 종래의 디바이스 및 기법은 오디오 신호와 관련된 잡음의 레벨을 추정하지 않으며, 그 잡음 레벨이 상대적으로 높거나 상대적으로 낮은 레벨로 추정되는지 여부에 따라 오디오 신호를 더 크게 또는 더 작게 억제하지 않는 경향이 있다.
<발명의 개요>
본 발명의 한 양상은 오디오 신호와 관련된 잡음을 완화하기 위한 적응 시간-기반 시스템이다. 시스템은 오디오 신호와 관련된 잡음의 추정 레벨을 결정하는 추정 모듈을 포함할 수 있다. 시스템은 오디오 신호의 레벨이 신호 임계치 이하인 경우에 오디오 신호의 감쇄를 유발하기 위한 신장 모듈을 추가로 포함할 수 있다. 신장 모듈은 그 신장 모듈이 유발하는 오디오 신호의 감쇄는 추정 모듈이 추정하는 잡음 레벨에 근거할 수 있다는 점을 감지하여 적응적으로 조정할 수 있다. 한 실시예에 따르면, 상대적으로 높은 추정 잡음 레벨의 경우에는 신장 모듈은 기본 오디오 신호의 상대적으로 높은 정도의 감쇄를 유발할 수 있다. 반대로, 이 실시예 에 따르면, 상대적으로 낮은 추정 잡음 레벨의 경우에는 신장 모듈은 상대적으로 낮은 정도의 감쇄를 유발할 수 있다.
본 발명의 다른 양상은 오디오 신호와 관련된 잡음을 완화하기 위한 방법이다. 방법은 오디오 신호와 관련된 잡음의 추정 레벨을 결정하는 단계와, 오디오 신호의 레벨이 신호 임계치 이하인 경우에 오디오 신호의 감쇄를 유발하는 단계를 포함할 수 있다. 오디오 신호의 감쇄는 잡음의 추정 레벨에 근거할 수 있다. 특히, 또 다른 실시예에 따르면, 감쇄는 추정 잡음 레벨이 클수록 커질 수 있다.
본 발명의 또 다른 양상은 컴퓨터-판독가능 저장 매체를 포함하는 장치이다. 저장 매체는 오디오 신호와 관련된 잡음을 완화하기 위한 컴퓨터 명령어를 포함할 수 있다. 컴퓨터 명령어는 오디오 신호와 관련된 잡음의 추정 레벨을 결정하기 위한 명령어를 포함할 수 있다. 컴퓨터 명령어는 오디오 신호의 레벨이 신호 임계치 이하인 경우에 오디오 신호의 감쇄를 유발하기 위한 명령어를 또한 포함할 수 있는데, 그 오디오 신호의 감쇄는 잡음의 추정 레벨에 근거한다.
도면은 복수의 실시예를 도시하지만, 본 발명은 도시한 장치 및 수단에 정확하게 한정되지는 않는다는 점을 이해하게 된다.
도 1은 본 발명의 실시예에 따른 오디오 신호와 관련된 잡음을 완화하기 위한 시스템을 구비하는 통신 디바이스의 개략도이다.
도 2는 도 1에 도시한 시스템의 좀더 상세한 개략도이다.
도 3은 본 발명의 실시예에 따른 감쇄된 오디오 신호에 기초한 신장 곡선을 나타낸다.
도 4a 내지 4c는 본 발명의 또 다른 실시예에 따른 감쇄된 오디오 신호에 기초한 신장 곡선을 나타낸다.
도 5는 본 발명의 또 다른 실시예에 따른 오디오 신호와 관련된 잡음의 베타 파라미터와 추정 레벨 간의 함수 관계를 도시하는 곡선이다.
도 6은 본 발명의 또 다른 실시예에 따른 오디오 신호와 관련된 잡음을 완화하는 방법의 플로차트이다.
도 1은 본 명세서에서 개시하는 본 발명에 따른 장치의 실시예에 따라 오디오 신호와 관련된 잡음을 완화하기 위한 시스템(100)의 개략도이다. 도시한 바와 같이, 본 시스템(100)은 휴대전화와 같은 통신 디바이스(102)에 포함되어, 그 디바이스를 사용하여 원격지(106)를 통해 통신 네트워크와 통신하는 개인(104)에 의해 수행되는 통신을 향상시킬 수 있다. 이는, 본 명세서에서 기술하는 바와 같이, 본 시스템(100)이 오디오 신호를 전달, 처리 또는 유사하게 이용하는 다양한 다른 타입의 통신 및 전자 디바이스에 선택적으로 집적, 접속 또는 통신으로 링크될 수 있다는 점을 보증하는 논의로부터 쉽게 확실해진다.
오디오 신호는 스피커(도시하지 않음)와 같은 오디오 출력 디바이스로 인해 음향 진동으로 증폭 및 변환될 때 소리가 되는 어떤 변조된 전기 신호를 포함할 수 있다. 특히, 오디오 신호는 일리노이주 숌버그에 있는 모토롤라사의 iDEN(Integrated Digital Enhanced Network)과 같은 통신 디바이스(102)와 관련된 전기 신호일 수 있다. 선택적으로, 통신 디바이스(102)는 오디오 신호를 이용하여 통신의 다양한 모드에 영향을 미치는 어떤 다른 타입의 전자 디바이스일 수 있는데, 그 오디오 신호는 소리를 제공하도록 처리되는 변조된 전기 신호를 포함하는 입력 및/또는 출력의 형태이다.
오디오 신호와 관련된 잡음은 통신 디바이스(102)에/를 존재/통과하는 신호의 소리 또는 품질을 방해 또는 왜곡시키는 경향이 있는 어떤 이질적인 신호 성분을 포함할 수 있다. 예를 들어 통신 디바이스의 환경에서, 잡음은 음악 또는 소위 누화 간섭 잡음으로 불리는 배경 잡음, 예컨대 레스토랑 또는 다른 공공 시설물과 같은 공공 장소에서 퍼지는 이질적인 음성을 포함할 수 있다.
추가로 도 2를 참조하면, 시스템(100)은 오디오 신호와 관련된 잡음의 추정 레벨을 결정하기 위한 추정 모듈(108)을 예시적으로 포함한다. 시스템(100)은 오디오 신호의 레벨이 신호 임계치 이하인 경우에 오디오 신호의 감쇄를 유발하기 위한 신장 모듈(110)을 또한 예시적으로 포함한다. 신장 모듈(110)은 오디오 신호의 감쇄가 잡음의 추정 레벨에 기초한다는 점을 감지하는 경우에 적응적으로 조정할 수 있다.
이하에서 상세하게 기술하는 한 실시예에 따르면, 적응적인 조정으로 인하여 시스템(100)은 오디오 신호와 관련된 잡음이 적게 존재하는 경우에는 오디오 신호를 적게 감쇄 또는 억제할 수 있고, 오디오 신호와 관련된 잡음이 많이 존재하는 경우에는 많이 감쇄 또는 억제할 수 있다. 이하에서 상세하게 기술하는 또 다른 실시예에 따르면, 임계치는 잡음의 추정 레벨에 기초하여 조절된다. 따라서, 임계 치가 더욱 엄격하게 설정될수록 더 많은 잡음 레벨이 추정되고, 임계치가 엄격하게 설정되지 않을수록 더 적은 잡음이 추정된다.
추정 모듈(108)은 통신 디바이스(102)가 예시적으로 수신하는 오디오 신호와 관련된 잡음의 레벨을 추정한다. 한 실시예에 따르면, 잡음 레벨은 멀티-샘플 음성 프레임을 분석함으로써 추정할 수 있다. 본 기술분야의 당업자가 쉽게 이해하는 바와 같이, 멀티-샘플 음성 프레임은 음성 인코더(도시하지 않음)를 사용하는 통신 디바이스(102)가 생성할 수 있다. 음성 인코더는 오디오 신호를 샘플링하고, 그 샘플을 이용하여 오디오 신호를 나타내는 인코딩된 데이터를 생성한다. 인코딩된 데이터는 명확한 멀티-샘플 음성 프레임을 형성하도록 차례로 집계된다.
예를 들어, 가변 전송률 음성 인코더(variable-rate speech encoder)는 디바이스에 전력을 제공하는 데 사용되는 배터리의 수명을 늘릴 수 있고, 인지되는 음성 품질에 대해서는 상대적으로 경미한 영향을 주면서 시스템 용량을 증가시키기 때문에, 현재 무선 통신 디바이스에 공통으로 사용된다. 미국통신산업협회는 Interim Standard IS-96 및 Interim Standard IS-733과 같은 가장 대중적인 가변 전송률 음성 인코더를 법문화하였다. 이러한 가변 전송률 음성 인코더는 음성 활성도(voice activity)의 레벨에 따라 풀 레이트, ½ 레이트, ¼ 레이트 또는 ⅛ 레이트로서 간주하는 4개의 가능한 속도로 음성 신호를 인코딩하는데, 이러한 속도는 음성의 프레임을 인코딩하는 데 사용되는 비트 수에 대응한다. 그 속도는 프레임별로 변경될 수 있다. 수많은 그와 같은 통신 디바이스에 대하여 음성 프레임은 프레임당 180 샘플을 포함할 수 있다.
한 실시예에 따르면, 추정 모듈(108)은 멀티-샘플 프레임을 포함하는 샘플 각각의 신호 레벨의 절대값 평균 또는 중간을 계산함으로써 잡음 레벨을 추정한다. 본 기술분야의 당업자가 쉽게 이해하는 바와 같이, 신호 레벨은 신호의 에너지 함량(energy content)에 대응한다. 현재의 정황에서, 신호 레벨은 멀티-샘플 프레임의 각 샘플과 관련된 에너지에 예시적으로 대응한다. 그러므로 180-샘플 음성 프레임의 경우, 추정 모듈(108)의 추정에 따른 잡음 레벨은 180개 절대 신호 레벨 값의 합에 근거할 수 있는데, 그 합은 180으로 나뉜다.
또 다른 실시예에 따르면, 추정 모듈(108)은 추정된 잡음 레벨을 진행중인 동적 근거에 대하여 업데이트한다. 동적으로 추정된 잡음 레벨은 예를 들어 다음의 방정식으로 정의될 수 있다.
여기서, EBNi는 통신 디바이스(102)가 수신하는 오디오 신호에 관한 현재 추정된 잡음 레벨을 표시하고, EBNi - 1는 이전 추정된 잡음 레벨을 표시하며, AVSF는 현재 음성 프레임의 절대값을 표시하며, β는 추정된 잡음 레벨이 동적으로 추정되는 속도를 나타내는 파라미터를 표시한다.
방정식 EBNi=EBNi -1+(1-β)*AVSF의 중요 파라미터는 β이다. 파라미터 β는 현재 추정된 잡음 레벨(EBNi)이 업데이트 또는 수정되는 속도를 결정한다. β에 대 한 값은 현재 음성 프레임의 절대값(AVSF)과 계차 방정식 EBNi=EBNi -1+(1-β)*AVSF으로 결정되는 바와 같은 추정된 잡음 레벨을 비교함으로써 계산할 수 있다. β가 업데이트되는 여부와 정도는 통신 디바이스(102)가 오디오 신호를 처리하는 동안 얻게 되는 3개의 특유한 조건 중 어느 조건이 존재하는지에 좌우된다.
먼저, 현재 음성 프레임의 절대값이 추정된 잡음 레벨을 배수(1보다 큼)로 곱한 레벨과 적어도 동일한 경우, 프레임 또는 더욱 자세하게는 프레임으로 나타낸 오디오 신호의 부분은 단순한 잡음 이상을 포함하는, 즉 실제 음성을 포함한다고 가정할 수 있다. 이 경우, β는 1과 동일한 것으로 설정된다. 기본 오디오 신호가 실제 음성을 포함한다는 가정에 모순이 없는 경우, 효과적인 접근법은 2와 같은 1보다 큰 배수를 설정하게 되어 추정된 잡음 레벨은 2로 곱한다. 따라서, β는 AVSF>2*EBNi일때마다 1로 설정될 것이다.
반대로, 현재 음성 프레임의 절대값이 추정된 잡음 레벨보다 작은 경우, β는 수정 또는 업데이트된다. 이는, 기본 신호가 단순한 잡음 이상을 포함하는 경우에는 추정된 잡음 레벨과 적어도 동일해진다고 가정할 수 있기 때문이다. 이 경우, β는 그 파라미터를 바람직하게 업데이트하는 속도를 반영하는 사전설정된 값으로 설정될 수 있다. 제3 및 제4 경우에서, 음성 프레임의 절대값이 추정된 잡음 레벨과 1보다 큰 배수(예컨대, 2)로 추정된 잡음 레벨을 곱한 레벨 사이에 존재하는 경우, β는 다음의 방정식에 따라 업데이트될 수 있다.
여기서, param1 및 param2는 파라미터 β를 업데이트하기 위한 바람직한 속도에 기초하여 선택할 수 있다. 주어진 방정식은 β는 최대값(param1의 포함에 의함)보다 작고, 0보다 크게 유지된다(β가 0이 되는 경우, 업데이트 프로세스는 중지됨)는 점을 보증한다. 일반적으로, 그 방정식은 β가 업데이트되는 속도는 추정된 잡음 레벨에 반비례하여 변하여, 높은 잡음 레벨은 β의 더 느린 업데이트를 유발하고, 낮은 잡음 레벨은 β의 더 빠른 업데이트를 유발한다는 점을 보증한다. 도 5는 파라미터 β와 상술한 수학적인 형태에 따라 추정 모듈(108)이 추정한 잡음 레벨 간에 존재할 수 있는 상이한 함수 관계 중 하나를 나타내는 그래프이다.
신장 모듈(110)은 오디오 신호의 레벨이 임계치 이하로 떨어지면 기본 오디오 신호의 하향 신장을 유발한다. 일반적으로, 임계치는 원하는 레벨 이하의 레벨로 설정되지만, 잡음 플로어(noise floor) 이상이다. 오디오 신호가 임계치 이하로 떨어지는 경우, 신장 모듈(110)은 오디오 신호에서의 감쇄 또는 다른 감소를 유발한다. 신호 레벨에서의 저하는 음성 함량(voice content)의 부족을 나타낸다고 가정하는 것이 적당하므로, 임계 신호 이하로 억제하는 것은 나머지 신호 성분인 잡음을 줄이는 의도가 있다. 따라서, 신호 임계치는 어떤 최소 희망 레벨, 즉 임계치 이하이지만, 잡음 "플로어" 이상이 되도록 설정된다. 오디오 신호가 임계치 이하로 떨어지는 경우, 신장 모듈(110)이 오디오 신호를 억제 또는 감쇄하여 그 오디오 신호의 신호 레벨은 더욱 떨어진다. 한 실시예에 따르면, 신호 억제 또는 감 쇄량은 추정 모듈(108)이 결정하는 추정된 잡음 레벨의 함수이다. 즉, 추정 모듈(108)이 추정하는 잡음 레벨은 신장 모듈(110)이 기본 오디오 신호를 억제 또는 감쇄하는 정도를 결정한다.
도 3은 신장 모듈(110)이 야기한 감쇄가 오디오 신호와 관련된 잡음이 더 크거나 작은지 여부에 따라 더 커지거나 작아지는 실시예를 나타낸다. 곡선 A(BN)이 나타내는 바와 같이, 코너 포인트 C로 표시한 임계치가 존재하고, 그 이하에서 신장 모듈(110)이 오디오 신호의 감쇄를 유발한다. 임계치는 예시적으로 -10㏈의 신호 레벨에 존재한다. 그 포인트를 초과하는 경우, 오디오 신호(즉, 입력) 레벨이 -10㏈ 변하면 감쇄 신호(즉, 출력)는 오디오 신호에서의 각 1㏈마다 -2㏈씩 감쇄된다. 감쇄율은 오디오 신호와 관련된 추정 잡음 레벨(BN)에 기초한다.
이 실시예에 따르면, 도 3에 도시한 바와 같이, 감쇄율은 오디오 신호와 관련된 추정 잡음 레벨이 BN'(BN'>BN)인 경우에 더 크다. 이 경우, 곡선 A(BN')이 나타내는 바와 같이, 오디오 신호가 -10㏈ 임계치(코너 포인트 C) 이하의 레벨로 떨어지기만 하면, 신장 모듈은 오디오 신호에서의 각 1㏈ 강하마다 -4㏈의 감쇄를 유발한다. 따라서, 이 실시예에 따르면, 추정 모듈(108)이 추정하는 잡음 레벨(BN)이 증가하면 적응적으로 조정가능한 신장 모듈(110)이 오디오 신호의 더 큰 감쇄를 유발한다.
또 다른 실시예에 따르면, 도 4a 내지 4c의 상이한 신장 곡선으로 나타낸 바와 같이, 신장 모듈(110)은 추정 모듈(108)이 추정한 잡음 레벨에 기초하여 신호 임계치를 확정함으로써 오디오 신호의 감쇄를 유발한다. 도 4a는, 코너 포인트 C 로 도시한 바와 같이, 임계치가 -20㏈의 신호 레벨에서 설정되는 벤치마크를 예시적으로 제공한다. 오디오 신호와 관련된 추정 잡음 레벨이 증가하는 경우, 도 4b의 코너 포인트 C"로 도시한 바와 같이, 신장 모듈(110)은 임계치를 -10㏈에서 예시적으로 설정한다. 반대로, 도 4c에 나타낸 바와 같이, 추정 잡음 레벨이 상대적으로 더 낮은 경우, 코너 포인트 C'으로 도시한 바와 같이, 신장 모듈(110)은 임계치를 -30㏈에서 설정한다.
도 4a 내지 4c의 각 신장 곡선에 대하여, 코너 포인트가 나타내는 임계치는 추정된 잡음 레벨에 좌우된다는 점을 알아야 한다. 특히, 잡음 레벨이 높을수록 신장 모듈(110)은 더욱 엄격하게 임계치를 설정하는데, 적당한 잡음 레벨의 경우, 오디오 신호에서의 -20㏈ 강하에는 신장기를 권유할 필요가 있다. 상대적으로 높은 잡음 레벨의 경우에는 -10㏈ 강하만이 필요한 반면, 상대적으로 낮은 잡음 레벨의 경우에는 신장 모듈(110)이 오디오 신호의 감쇄를 유발하기 전에 -30㏈ 이상의 강하가 필요하다.
신장 모듈(110)이 결정하는 신호 임계치는 추정 모듈(108)이 결정한 추정 잡음 레벨에 기초한 수학 관계식으로 정의할 수 있다. 예를 들어, 신호 임계치는 다음의 선형 관계식으로 정의할 수 있는데, 이 관계식에서 C는 코너 포인트를 표시하고, BN은 추정된 잡음 레벨을 표시하며, S는 시프트 파라미터를 표시한다.
상술한 예시적인 신장 곡선은 다음의 방정식으로 수학적으로 기술할 수 있는 데, 이 방정식에서 y는 감쇄된 오디오 신호(즉, 출력)를 나타내고, x는 오디오 신호(즉, 입력)를 나타내며, α는 임계치 이하의 입력 신호 레벨에 대응하는 곡선 부분의 기울기를 나타내며, C는 상술한 바와 같이 정의한다.
따라서, 추정 모듈(108)이 결정하는 추정 잡음 레벨에 기초하여 신장 모듈(110)이 유발하는 감쇄량은 다음의 방정식으로 표현할 수 있는데, 감쇄량은 감쇄된 오디오 신호(출력)와 오디오 신호(입력) 간의 차에 대응하고, Δ로 표시한다.
이전 방정식의 C를 BN-S로 대체하여 다음을 얻는다.
오디오 신호가 배경 잡음과 같은 잡음만을 포함하는 경우, 오디오 기반의 입력이 없어 마지막 방정식이 다음의 공식으로 변형된다는 점은 알아야 할 가치가 있다.
신호와 관련된 이득의 양도 또한 계산할 수 있다. 시간 지표 i에 대하여, 이득은 G(i)이다. 일반적으로 ㏈ 도메인의 축척 인자가 선형(시간) 도메인의 압축 과 동등하다는 점을 상기하면, ㏈ 도메인의 a*X(t)는 선형(시간) 도메인의 x(t)a와 동등하게 된다. 상술한 바로부터, ㏈ 도메인에서 Δ=(α-1)(x-c)이다. 따라서, 이득은 다음과 같이 도출할 수 있다.
10[x(α-1)+c(1-α)]=
10x(α-1)/1010c(1-α)/10=
Clog (1-α)ㆍ|x(i)|(α-1)
|x(i)|>Clog에 대하여 이득이 1이라고 가정하면, 이득에 대한 일반적인 방정식을 다음과 같이 얻을 수 있다.
도 6은 또 다른 실시예에 따른 오디오 신호와 관련된 잡음을 완화하기 위한 방법(600)의 플로차트이다. 본 방법은 오디오 신호와 관련된 잡음의 추정 레벨을 결정하는 단계 602를 포함한다. 단계 604에서, 오디오 신호가 사전설정된 임계치 이하인지 여부를 판정한다. 임계치 이하인 경우, 단계 606에서 오디오 신호의 감쇄가 발생하는데, 그 감쇄는 단계 602에서 추정된 잡음 레벨에 기초한다. 본 방 법(600)은 멀티-샘플 음성 프레임으로 나타내는 오디오 신호에 관하여 예시적으로 적용된다. 따라서, 각 단계는 프레임별로 적용될 수 있다. 그러므로 단계 608에서 본 방법이 지금까지 적용되지 않은 멀티-샘플 프레임이 존재하는지 여부를 판정한다. 존재하는 경우, 본 방법(600)은 단계 602로 다시 진행하여 나머지 단계들을 반복한다. 상기 단계들은 본 방법(600)이 단계 610에서 종료될 수 있는 시점에 처리되는 특정 오디오 신호에 대응하는 각 멀티-샘플 프레임에 대하여 본 방법(600)이 적용될 때까지 반복된다.
본 발명은 하드웨어, 소프트웨어 또는 하드웨어와 소프트웨어의 조합으로 실현할 수 있다. 본 발명은 한 컴퓨터 시스템에서의 집중화 방식 또는 상이한 구성요소가 복수의 상호접속된 컴퓨터 시스템에 걸쳐 분산되는 분산 방식으로 실현할 수 있다. 본 명세서에서 기술한 방법을 실행하기 위해서는 어떤 컴퓨터 시스템 또는 다른 장치도 적합하다. 하드웨어와 소프트웨어의 통상적인 조합은 컴퓨터 프로그램을 구비한 범용 컴퓨터 시스템일 수도 있는데, 로드되어 실행되는 컴퓨터 프로그램은 컴퓨터 시스템을 제어하여 본 명세서에 기술한 방법을 실행하게 한다.
본 발명은, 본 명세서에 기술한 방법을 구현할 수 있는 모든 특징을 포함하고, 컴퓨터 시스템에 로드되어 이러한 방법을 실행할 수 있는 컴퓨터 프로그램 제품에 또한 임베드할 수 있다. 본 컨텍스트의 컴퓨터 프로그램은 정보 처리 능력이 있는 시스템이 특정 기능을 직접 또는 a) 또 다른 언어, 코드 또는 표기법으로의 변환, b) 상이한 매체 형태로의 재생 중 하나 혹은 둘 다 후에 실행하게 하는 명령어 세트의 어떤 언어, 코드 또는 표기법에서의 표현을 의미한다.
본 발명은 본 발명의 사상 또는 필수적인 특성을 벗어나지 않는 다양한 형태로 구현할 수 있다. 따라서, 본 발명의 사상은 전술한 명세서보다는 다음의 청구범위를 참조해야 한다.
Claims (10)
- 오디오 신호와 관련된 잡음을 완화하기 위한 적응 시간-기반 시스템으로서,상기 시스템은상기 오디오 신호와 관련된 잡음의 추정 레벨을 결정하기 위한 추정 모듈, 및상기 오디오 신호의 레벨이 신호 임계치 이하인 경우, 상기 오디오 신호의 감쇄를 유발하기 위한 신장 모듈 - 상기 신장 모듈은 상기 오디오 신호의 감쇄가 상기 추정 잡음 레벨에 기초하도록 적응적으로 조정할 수 있음 -을 포함하는 시스템.
- 제1항에 있어서,상기 신장 모듈은 상기 추정 잡음 레벨에 기초하여 상기 신호 임계치를 설정함으로써 상기 추정 잡음 레벨에 기초하여 감쇄를 유발하는 시스템.
- 제2항에 있어서,상기 신호 임계치는 상기 추정 잡음 레벨에 선형적으로 관련되는 시스템.
- 제3항에 있어서,상기 신호 임계치는 C=BN+S로 정의하고, C는 신호 임계치를 표시하며, BN은 추정 잡음 레벨을 표시하며, S는 시프트 파라미터를 표시하는 시스템.
- 제4항에 있어서,상기 오디오 신호의 감쇄는 Δ=(α-1)(x-C)=(α-1)(x-BN-S)로 정의하고, Δ는 감쇄를 표시하고, x는 오디오 신호의 레벨을 표시하며, α는 오디오 신호의 레벨과 오디오 신호에 기초한 출력 간의 정량적인 관계를 표시하며, BN은 추정 잡음 레벨을 표시하며, S는 시프트 파라미터를 표시하는 시스템.
- 제1항에 있어서,상기 추정 잡음 레벨은 이전의 추정 잡음 레벨 및 상기 오디오 신호로부터 도출되는 현재 음성 프레임에 대응하는 평균값에 기초하여 동적으로 추정하는 시스템.
- 제6항에 있어서,상기 동적으로 추정되는 잡음 레벨은 EBNi=EBNi -1+(1-β)*AVSF로 정의하고, EBNi는 현재 추정 잡음 레벨을 표시하며, EBNi -1은 이전 추정 잡음 레벨을 표시하며, AVSF는 현재 음성 프레임에 대응하는 평균값을 표시하며, β는 추정 잡음 레벨이 동적으로 추정되는 속도를 나타내는 파라미터를 표시하는 시스템.
- 오디오 신호와 관련된 잡음을 적응적으로 완화하기 위한 시간-기반 방법으로서,상기 방법은,상기 오디오 신호와 관련된 잡음의 추정 레벨을 결정하는 단계, 및상기 오디오 신호의 레벨이 신호 임계치 이하인 경우, 상기 오디오 신호의 감쇄 - 상기 오디오 신호의 감쇄는 상기 추정 잡음 레벨에 기초함 - 를 유발하는 단계를 포함하는 방법.
- 제8항에 있어서,상기 감쇄를 유발하는 단계는 상기 추정 잡음 레벨에 기초하여 상기 신호 임계치를 결정하는 단계를 포함하는 방법.
- 제9항에 있어서,상기 신호 임계치는 상기 신호 임계치와 상기 추정 잡음 레벨 간의 선형 관계에 기초하여 결정하는 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/992,584 US20060104460A1 (en) | 2004-11-18 | 2004-11-18 | Adaptive time-based noise suppression |
US10/992,584 | 2004-11-18 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20070084312A true KR20070084312A (ko) | 2007-08-24 |
Family
ID=36386295
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077011211A KR20070084312A (ko) | 2004-11-18 | 2005-11-08 | 적응 시간-기반 잡음 억제 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20060104460A1 (ko) |
KR (1) | KR20070084312A (ko) |
CN (1) | CN101060820A (ko) |
AR (1) | AR051241A1 (ko) |
WO (1) | WO2006055354A2 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8879751B2 (en) * | 2010-07-19 | 2014-11-04 | Voyetra Turtle Beach, Inc. | Gaming headset with programmable audio paths |
CN102355616B (zh) * | 2011-06-30 | 2014-06-04 | 深圳华昌视数字移动电视有限公司 | 在公共环境中自动调节音量的方法及设备 |
US9865277B2 (en) | 2013-07-10 | 2018-01-09 | Nuance Communications, Inc. | Methods and apparatus for dynamic low frequency noise suppression |
US9232322B2 (en) * | 2014-02-03 | 2016-01-05 | Zhimin FANG | Hearing aid devices with reduced background and feedback noises |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4887299A (en) * | 1987-11-12 | 1989-12-12 | Nicolet Instrument Corporation | Adaptive, programmable signal processing hearing aid |
US5459814A (en) * | 1993-03-26 | 1995-10-17 | Hughes Aircraft Company | Voice activity detector for speech signals in variable background noise |
US5485522A (en) * | 1993-09-29 | 1996-01-16 | Ericsson Ge Mobile Communications, Inc. | System for adaptively reducing noise in speech signals |
FI108830B (fi) * | 1993-12-23 | 2002-03-28 | Nokia Corp | Menetelmä ja laite kaiun vaimentamiseksi puhelinlaitteessa |
US5657422A (en) * | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
US5867574A (en) * | 1997-05-19 | 1999-02-02 | Lucent Technologies Inc. | Voice activity detection system and method |
US6157906A (en) * | 1998-07-31 | 2000-12-05 | Motorola, Inc. | Method for detecting speech in a vocoded signal |
US6122531A (en) * | 1998-07-31 | 2000-09-19 | Motorola, Inc. | Method for selectively including leading fricative sounds in a portable communication device operated in a speakerphone mode |
US6138040A (en) * | 1998-07-31 | 2000-10-24 | Motorola, Inc. | Method for suppressing speaker activation in a portable communication device operated in a speakerphone mode |
US6223154B1 (en) * | 1998-07-31 | 2001-04-24 | Motorola, Inc. | Using vocoded parameters in a staggered average to provide speakerphone operation based on enhanced speech activity thresholds |
DE19957221A1 (de) * | 1999-11-27 | 2001-05-31 | Alcatel Sa | Exponentielle Echo- und Geräuschabsenkung in Sprachpausen |
US6320968B1 (en) * | 2000-06-28 | 2001-11-20 | Esion-Tech, Llc | Adaptive noise rejection system and method |
US20040078199A1 (en) * | 2002-08-20 | 2004-04-22 | Hanoh Kremer | Method for auditory based noise reduction and an apparatus for auditory based noise reduction |
-
2004
- 2004-11-18 US US10/992,584 patent/US20060104460A1/en not_active Abandoned
-
2005
- 2005-11-08 KR KR1020077011211A patent/KR20070084312A/ko not_active Application Discontinuation
- 2005-11-08 CN CNA2005800393832A patent/CN101060820A/zh active Pending
- 2005-11-08 WO PCT/US2005/040499 patent/WO2006055354A2/en active Application Filing
- 2005-11-16 AR ARP050104829A patent/AR051241A1/es unknown
Also Published As
Publication number | Publication date |
---|---|
US20060104460A1 (en) | 2006-05-18 |
CN101060820A (zh) | 2007-10-24 |
WO2006055354A2 (en) | 2006-05-26 |
WO2006055354A3 (en) | 2007-01-04 |
AR051241A1 (es) | 2006-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7996215B1 (en) | Method and apparatus for voice activity detection, and encoder | |
US7133529B2 (en) | Howling detecting and suppressing apparatus, method and computer program product | |
KR101461141B1 (ko) | 잡음 억제기를 적응적으로 제어하는 시스템 및 방법 | |
US20060126865A1 (en) | Method and apparatus for adaptive sound processing parameters | |
JP4968147B2 (ja) | 通信端末、通信端末の音声出力調整方法 | |
US8645144B2 (en) | Audio signal shaping for playback by audio devices | |
US20020152066A1 (en) | Method and system for noise supression using external voice activity detection | |
CN103270740B (zh) | 声音控制装置、声音控制方法以及移动终端装置 | |
JP6290429B2 (ja) | 音声処理システム | |
US20110125494A1 (en) | Speech Intelligibility | |
US8321215B2 (en) | Method and apparatus for improving intelligibility of audible speech represented by a speech signal | |
US8489393B2 (en) | Speech intelligibility | |
JP3273599B2 (ja) | 音声符号化レート選択器と音声符号化装置 | |
NL2007764A (en) | Intelligibility control using ambient noise detection. | |
US8718562B2 (en) | Processing audio signals | |
US9172791B1 (en) | Noise estimation algorithm for non-stationary environments | |
KR20070084312A (ko) | 적응 시간-기반 잡음 억제 | |
US8804981B2 (en) | Processing audio signals | |
JP5086442B2 (ja) | 雑音抑圧方法及び装置 | |
EP3830823B1 (en) | Forced gap insertion for pervasive listening | |
EP1829028A1 (en) | Method and apparatus for adaptive sound processing parameters | |
JP2001188599A (ja) | オーディオ信号復号装置 | |
KR20130094246A (ko) | 반도체 장치 및 음성 통신 장치 | |
JP2002300687A (ja) | 電子機器 | |
CN116206619A (zh) | 语音处理方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |