KR20070084312A - 적응 시간-기반 잡음 억제 - Google Patents

적응 시간-기반 잡음 억제 Download PDF

Info

Publication number
KR20070084312A
KR20070084312A KR1020077011211A KR20077011211A KR20070084312A KR 20070084312 A KR20070084312 A KR 20070084312A KR 1020077011211 A KR1020077011211 A KR 1020077011211A KR 20077011211 A KR20077011211 A KR 20077011211A KR 20070084312 A KR20070084312 A KR 20070084312A
Authority
KR
South Korea
Prior art keywords
audio signal
level
estimated
noise level
signal
Prior art date
Application number
KR1020077011211A
Other languages
English (en)
Inventor
알리 베흐보디안
막 에이. 보일롯
프래틱 브이. 데사이
친 피. 옹
Original Assignee
모토로라 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 모토로라 인코포레이티드 filed Critical 모토로라 인코포레이티드
Publication of KR20070084312A publication Critical patent/KR20070084312A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/06Receivers
    • H04B1/10Means associated with receiver for limiting or suppressing noise or interference
    • H04B1/1027Means associated with receiver for limiting or suppressing noise or interference assessing signal quality or detecting noise/interference for the received signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Noise Elimination (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

오디오 신호와 관련된 잡음을 완화하기 위한 시스템, 장치 및 방법을 제공한다. 오디오 신호와 관련된 잡음을 완화하기 위한 시스템(100)은 추정 모듈(108)을 포함한다. 추정 모듈은 오디오 신호와 관련된 잡음의 추정 레벨을 결정한다. 본 시스템은 신장 모듈(110)을 또한 포함한다. 신장 모듈은 오디오 신호의 레벨이 신호 임계치 이하인 경우에 오디오 신호의 감쇄를 유발한다. 신장 모듈은 신장 모듈이 유발한(606) 감쇄가 추정 모듈이 추정한(602) 잡음 레벨에 기초하도록 적응적으로 조정할 수 있다.
오디오 신호, 잡음, 추정 잡음 레벨, 신호 임계치, 감쇄

Description

적응 시간-기반 잡음 억제{ADAPTIVE TIME-BASED NOISE SUPPRESSION}
본 발명은 전자통신 분야에 관한 것으로서, 특히 오디오 신호에 기초한 전자통신에 관한 것이다.
잡음은 신호 품질을 떨어뜨릴 수 있다. 오디오 신호가 휴대전화 또는 다른 음성-기반 통신 디바이스를 통해 변조 및 전달되는 전자통신 환경에서, 잡음이 신호를 왜곡시킬 수 있어 누군가와 통신하는 청취자는 신호를 이해할 수 없게 되고, 또는 얼마간이라도 불쾌하게 된다. 그와 같은 통신 디바이스의 사용자를 자주 괴롭히는 잡음의 공통적인 형태는 배경 잡음이다. 배경 잡음은 레스토랑 또는 다른 공공 시설물과 같은 공공 장소에서 흔히 퍼지는 누화 간섭 잡음(babble noise)이라고 불리는 이질적인 음성을 포함한다. 또한, 오디오 신호가 전달하는 음성 성분을 방해 또는 왜곡시킬 수 있는 음악 등과 같은 다른 이질적인 소리를 포함한다.
종래의 디바이스는 레거시 잡음 억압기(legacy noise suppressor)에 의지하여 잡음을 처리하는 경향이 있다. 레거시 잡음 억압기의 기능적 접근법은 통상적으로 주파수-기반 알고리즘의 실현에 기초한다. 이 접근법은 백색 잡음을 성공적으로 감소시킬 수 있지만, 배경 잡음으로서 간주하는 것과 같은 다른 타입의 잡음을 처리하기 위한 기법으로서는 효과적이지 않다. 이는, 아마도 배경 잡음으로 나 타내는 종류의 잡음은 통상적으로 오디오 신호의 주파수 스펙트럼의 동일한 영역들을 그 신호의 음성 성분이 차지하는 영역으로서 공유한다는 사실에 기인한다. 그러나 레거시 잡음 억압기는 주로 주파수 스펙트럼의 하단을 차지하는 백색 잡음의 감소에 초점을 맞춘다.
따라서, 본 기술분야는 잡음, 특히 배경 잡음으로서 간주하는 잡음을 충분히 억제하기 위한 효과적이고 유효한 디바이스 또는 기법이 필요하다. 또한, 종래의 디바이스 및 기법, 특히 주파수-기반의 디바이스 및 기법은 오디오 신호와 관련된 잡음의 추정 레벨에 기초하여 잡음을 억제하기 위한 능력이 필요하다. 즉, 종래의 디바이스 및 기법은 오디오 신호와 관련된 잡음의 레벨을 추정하지 않으며, 그 잡음 레벨이 상대적으로 높거나 상대적으로 낮은 레벨로 추정되는지 여부에 따라 오디오 신호를 더 크게 또는 더 작게 억제하지 않는 경향이 있다.
<발명의 개요>
본 발명의 한 양상은 오디오 신호와 관련된 잡음을 완화하기 위한 적응 시간-기반 시스템이다. 시스템은 오디오 신호와 관련된 잡음의 추정 레벨을 결정하는 추정 모듈을 포함할 수 있다. 시스템은 오디오 신호의 레벨이 신호 임계치 이하인 경우에 오디오 신호의 감쇄를 유발하기 위한 신장 모듈을 추가로 포함할 수 있다. 신장 모듈은 그 신장 모듈이 유발하는 오디오 신호의 감쇄는 추정 모듈이 추정하는 잡음 레벨에 근거할 수 있다는 점을 감지하여 적응적으로 조정할 수 있다. 한 실시예에 따르면, 상대적으로 높은 추정 잡음 레벨의 경우에는 신장 모듈은 기본 오디오 신호의 상대적으로 높은 정도의 감쇄를 유발할 수 있다. 반대로, 이 실시예 에 따르면, 상대적으로 낮은 추정 잡음 레벨의 경우에는 신장 모듈은 상대적으로 낮은 정도의 감쇄를 유발할 수 있다.
본 발명의 다른 양상은 오디오 신호와 관련된 잡음을 완화하기 위한 방법이다. 방법은 오디오 신호와 관련된 잡음의 추정 레벨을 결정하는 단계와, 오디오 신호의 레벨이 신호 임계치 이하인 경우에 오디오 신호의 감쇄를 유발하는 단계를 포함할 수 있다. 오디오 신호의 감쇄는 잡음의 추정 레벨에 근거할 수 있다. 특히, 또 다른 실시예에 따르면, 감쇄는 추정 잡음 레벨이 클수록 커질 수 있다.
본 발명의 또 다른 양상은 컴퓨터-판독가능 저장 매체를 포함하는 장치이다. 저장 매체는 오디오 신호와 관련된 잡음을 완화하기 위한 컴퓨터 명령어를 포함할 수 있다. 컴퓨터 명령어는 오디오 신호와 관련된 잡음의 추정 레벨을 결정하기 위한 명령어를 포함할 수 있다. 컴퓨터 명령어는 오디오 신호의 레벨이 신호 임계치 이하인 경우에 오디오 신호의 감쇄를 유발하기 위한 명령어를 또한 포함할 수 있는데, 그 오디오 신호의 감쇄는 잡음의 추정 레벨에 근거한다.
도면은 복수의 실시예를 도시하지만, 본 발명은 도시한 장치 및 수단에 정확하게 한정되지는 않는다는 점을 이해하게 된다.
도 1은 본 발명의 실시예에 따른 오디오 신호와 관련된 잡음을 완화하기 위한 시스템을 구비하는 통신 디바이스의 개략도이다.
도 2는 도 1에 도시한 시스템의 좀더 상세한 개략도이다.
도 3은 본 발명의 실시예에 따른 감쇄된 오디오 신호에 기초한 신장 곡선을 나타낸다.
도 4a 내지 4c는 본 발명의 또 다른 실시예에 따른 감쇄된 오디오 신호에 기초한 신장 곡선을 나타낸다.
도 5는 본 발명의 또 다른 실시예에 따른 오디오 신호와 관련된 잡음의 베타 파라미터와 추정 레벨 간의 함수 관계를 도시하는 곡선이다.
도 6은 본 발명의 또 다른 실시예에 따른 오디오 신호와 관련된 잡음을 완화하는 방법의 플로차트이다.
도 1은 본 명세서에서 개시하는 본 발명에 따른 장치의 실시예에 따라 오디오 신호와 관련된 잡음을 완화하기 위한 시스템(100)의 개략도이다. 도시한 바와 같이, 본 시스템(100)은 휴대전화와 같은 통신 디바이스(102)에 포함되어, 그 디바이스를 사용하여 원격지(106)를 통해 통신 네트워크와 통신하는 개인(104)에 의해 수행되는 통신을 향상시킬 수 있다. 이는, 본 명세서에서 기술하는 바와 같이, 본 시스템(100)이 오디오 신호를 전달, 처리 또는 유사하게 이용하는 다양한 다른 타입의 통신 및 전자 디바이스에 선택적으로 집적, 접속 또는 통신으로 링크될 수 있다는 점을 보증하는 논의로부터 쉽게 확실해진다.
오디오 신호는 스피커(도시하지 않음)와 같은 오디오 출력 디바이스로 인해 음향 진동으로 증폭 및 변환될 때 소리가 되는 어떤 변조된 전기 신호를 포함할 수 있다. 특히, 오디오 신호는 일리노이주 숌버그에 있는 모토롤라사의 iDEN(Integrated Digital Enhanced Network)과 같은 통신 디바이스(102)와 관련된 전기 신호일 수 있다. 선택적으로, 통신 디바이스(102)는 오디오 신호를 이용하여 통신의 다양한 모드에 영향을 미치는 어떤 다른 타입의 전자 디바이스일 수 있는데, 그 오디오 신호는 소리를 제공하도록 처리되는 변조된 전기 신호를 포함하는 입력 및/또는 출력의 형태이다.
오디오 신호와 관련된 잡음은 통신 디바이스(102)에/를 존재/통과하는 신호의 소리 또는 품질을 방해 또는 왜곡시키는 경향이 있는 어떤 이질적인 신호 성분을 포함할 수 있다. 예를 들어 통신 디바이스의 환경에서, 잡음은 음악 또는 소위 누화 간섭 잡음으로 불리는 배경 잡음, 예컨대 레스토랑 또는 다른 공공 시설물과 같은 공공 장소에서 퍼지는 이질적인 음성을 포함할 수 있다.
추가로 도 2를 참조하면, 시스템(100)은 오디오 신호와 관련된 잡음의 추정 레벨을 결정하기 위한 추정 모듈(108)을 예시적으로 포함한다. 시스템(100)은 오디오 신호의 레벨이 신호 임계치 이하인 경우에 오디오 신호의 감쇄를 유발하기 위한 신장 모듈(110)을 또한 예시적으로 포함한다. 신장 모듈(110)은 오디오 신호의 감쇄가 잡음의 추정 레벨에 기초한다는 점을 감지하는 경우에 적응적으로 조정할 수 있다.
이하에서 상세하게 기술하는 한 실시예에 따르면, 적응적인 조정으로 인하여 시스템(100)은 오디오 신호와 관련된 잡음이 적게 존재하는 경우에는 오디오 신호를 적게 감쇄 또는 억제할 수 있고, 오디오 신호와 관련된 잡음이 많이 존재하는 경우에는 많이 감쇄 또는 억제할 수 있다. 이하에서 상세하게 기술하는 또 다른 실시예에 따르면, 임계치는 잡음의 추정 레벨에 기초하여 조절된다. 따라서, 임계 치가 더욱 엄격하게 설정될수록 더 많은 잡음 레벨이 추정되고, 임계치가 엄격하게 설정되지 않을수록 더 적은 잡음이 추정된다.
추정 모듈(108)은 통신 디바이스(102)가 예시적으로 수신하는 오디오 신호와 관련된 잡음의 레벨을 추정한다. 한 실시예에 따르면, 잡음 레벨은 멀티-샘플 음성 프레임을 분석함으로써 추정할 수 있다. 본 기술분야의 당업자가 쉽게 이해하는 바와 같이, 멀티-샘플 음성 프레임은 음성 인코더(도시하지 않음)를 사용하는 통신 디바이스(102)가 생성할 수 있다. 음성 인코더는 오디오 신호를 샘플링하고, 그 샘플을 이용하여 오디오 신호를 나타내는 인코딩된 데이터를 생성한다. 인코딩된 데이터는 명확한 멀티-샘플 음성 프레임을 형성하도록 차례로 집계된다.
예를 들어, 가변 전송률 음성 인코더(variable-rate speech encoder)는 디바이스에 전력을 제공하는 데 사용되는 배터리의 수명을 늘릴 수 있고, 인지되는 음성 품질에 대해서는 상대적으로 경미한 영향을 주면서 시스템 용량을 증가시키기 때문에, 현재 무선 통신 디바이스에 공통으로 사용된다. 미국통신산업협회는 Interim Standard IS-96 및 Interim Standard IS-733과 같은 가장 대중적인 가변 전송률 음성 인코더를 법문화하였다. 이러한 가변 전송률 음성 인코더는 음성 활성도(voice activity)의 레벨에 따라 풀 레이트, ½ 레이트, ¼ 레이트 또는 ⅛ 레이트로서 간주하는 4개의 가능한 속도로 음성 신호를 인코딩하는데, 이러한 속도는 음성의 프레임을 인코딩하는 데 사용되는 비트 수에 대응한다. 그 속도는 프레임별로 변경될 수 있다. 수많은 그와 같은 통신 디바이스에 대하여 음성 프레임은 프레임당 180 샘플을 포함할 수 있다.
한 실시예에 따르면, 추정 모듈(108)은 멀티-샘플 프레임을 포함하는 샘플 각각의 신호 레벨의 절대값 평균 또는 중간을 계산함으로써 잡음 레벨을 추정한다. 본 기술분야의 당업자가 쉽게 이해하는 바와 같이, 신호 레벨은 신호의 에너지 함량(energy content)에 대응한다. 현재의 정황에서, 신호 레벨은 멀티-샘플 프레임의 각 샘플과 관련된 에너지에 예시적으로 대응한다. 그러므로 180-샘플 음성 프레임의 경우, 추정 모듈(108)의 추정에 따른 잡음 레벨은 180개 절대 신호 레벨 값의 합에 근거할 수 있는데, 그 합은 180으로 나뉜다.
또 다른 실시예에 따르면, 추정 모듈(108)은 추정된 잡음 레벨을 진행중인 동적 근거에 대하여 업데이트한다. 동적으로 추정된 잡음 레벨은 예를 들어 다음의 방정식으로 정의될 수 있다.
EBNi=EBNi -1+(1-β)*AVSF
여기서, EBNi는 통신 디바이스(102)가 수신하는 오디오 신호에 관한 현재 추정된 잡음 레벨을 표시하고, EBNi - 1는 이전 추정된 잡음 레벨을 표시하며, AVSF는 현재 음성 프레임의 절대값을 표시하며, β는 추정된 잡음 레벨이 동적으로 추정되는 속도를 나타내는 파라미터를 표시한다.
방정식 EBNi=EBNi -1+(1-β)*AVSF의 중요 파라미터는 β이다. 파라미터 β는 현재 추정된 잡음 레벨(EBNi)이 업데이트 또는 수정되는 속도를 결정한다. β에 대 한 값은 현재 음성 프레임의 절대값(AVSF)과 계차 방정식 EBNi=EBNi -1+(1-β)*AVSF으로 결정되는 바와 같은 추정된 잡음 레벨을 비교함으로써 계산할 수 있다. β가 업데이트되는 여부와 정도는 통신 디바이스(102)가 오디오 신호를 처리하는 동안 얻게 되는 3개의 특유한 조건 중 어느 조건이 존재하는지에 좌우된다.
먼저, 현재 음성 프레임의 절대값이 추정된 잡음 레벨을 배수(1보다 큼)로 곱한 레벨과 적어도 동일한 경우, 프레임 또는 더욱 자세하게는 프레임으로 나타낸 오디오 신호의 부분은 단순한 잡음 이상을 포함하는, 즉 실제 음성을 포함한다고 가정할 수 있다. 이 경우, β는 1과 동일한 것으로 설정된다. 기본 오디오 신호가 실제 음성을 포함한다는 가정에 모순이 없는 경우, 효과적인 접근법은 2와 같은 1보다 큰 배수를 설정하게 되어 추정된 잡음 레벨은 2로 곱한다. 따라서, β는 AVSF>2*EBNi일때마다 1로 설정될 것이다.
반대로, 현재 음성 프레임의 절대값이 추정된 잡음 레벨보다 작은 경우, β는 수정 또는 업데이트된다. 이는, 기본 신호가 단순한 잡음 이상을 포함하는 경우에는 추정된 잡음 레벨과 적어도 동일해진다고 가정할 수 있기 때문이다. 이 경우, β는 그 파라미터를 바람직하게 업데이트하는 속도를 반영하는 사전설정된 값으로 설정될 수 있다. 제3 및 제4 경우에서, 음성 프레임의 절대값이 추정된 잡음 레벨과 1보다 큰 배수(예컨대, 2)로 추정된 잡음 레벨을 곱한 레벨 사이에 존재하는 경우, β는 다음의 방정식에 따라 업데이트될 수 있다.
β=max[clip(2*EBNi)-param1,param2]
여기서, param1 및 param2는 파라미터 β를 업데이트하기 위한 바람직한 속도에 기초하여 선택할 수 있다. 주어진 방정식은 β는 최대값(param1의 포함에 의함)보다 작고, 0보다 크게 유지된다(β가 0이 되는 경우, 업데이트 프로세스는 중지됨)는 점을 보증한다. 일반적으로, 그 방정식은 β가 업데이트되는 속도는 추정된 잡음 레벨에 반비례하여 변하여, 높은 잡음 레벨은 β의 더 느린 업데이트를 유발하고, 낮은 잡음 레벨은 β의 더 빠른 업데이트를 유발한다는 점을 보증한다. 도 5는 파라미터 β와 상술한 수학적인 형태에 따라 추정 모듈(108)이 추정한 잡음 레벨 간에 존재할 수 있는 상이한 함수 관계 중 하나를 나타내는 그래프이다.
신장 모듈(110)은 오디오 신호의 레벨이 임계치 이하로 떨어지면 기본 오디오 신호의 하향 신장을 유발한다. 일반적으로, 임계치는 원하는 레벨 이하의 레벨로 설정되지만, 잡음 플로어(noise floor) 이상이다. 오디오 신호가 임계치 이하로 떨어지는 경우, 신장 모듈(110)은 오디오 신호에서의 감쇄 또는 다른 감소를 유발한다. 신호 레벨에서의 저하는 음성 함량(voice content)의 부족을 나타낸다고 가정하는 것이 적당하므로, 임계 신호 이하로 억제하는 것은 나머지 신호 성분인 잡음을 줄이는 의도가 있다. 따라서, 신호 임계치는 어떤 최소 희망 레벨, 즉 임계치 이하이지만, 잡음 "플로어" 이상이 되도록 설정된다. 오디오 신호가 임계치 이하로 떨어지는 경우, 신장 모듈(110)이 오디오 신호를 억제 또는 감쇄하여 그 오디오 신호의 신호 레벨은 더욱 떨어진다. 한 실시예에 따르면, 신호 억제 또는 감 쇄량은 추정 모듈(108)이 결정하는 추정된 잡음 레벨의 함수이다. 즉, 추정 모듈(108)이 추정하는 잡음 레벨은 신장 모듈(110)이 기본 오디오 신호를 억제 또는 감쇄하는 정도를 결정한다.
도 3은 신장 모듈(110)이 야기한 감쇄가 오디오 신호와 관련된 잡음이 더 크거나 작은지 여부에 따라 더 커지거나 작아지는 실시예를 나타낸다. 곡선 A(BN)이 나타내는 바와 같이, 코너 포인트 C로 표시한 임계치가 존재하고, 그 이하에서 신장 모듈(110)이 오디오 신호의 감쇄를 유발한다. 임계치는 예시적으로 -10㏈의 신호 레벨에 존재한다. 그 포인트를 초과하는 경우, 오디오 신호(즉, 입력) 레벨이 -10㏈ 변하면 감쇄 신호(즉, 출력)는 오디오 신호에서의 각 1㏈마다 -2㏈씩 감쇄된다. 감쇄율은 오디오 신호와 관련된 추정 잡음 레벨(BN)에 기초한다.
이 실시예에 따르면, 도 3에 도시한 바와 같이, 감쇄율은 오디오 신호와 관련된 추정 잡음 레벨이 BN'(BN'>BN)인 경우에 더 크다. 이 경우, 곡선 A(BN')이 나타내는 바와 같이, 오디오 신호가 -10㏈ 임계치(코너 포인트 C) 이하의 레벨로 떨어지기만 하면, 신장 모듈은 오디오 신호에서의 각 1㏈ 강하마다 -4㏈의 감쇄를 유발한다. 따라서, 이 실시예에 따르면, 추정 모듈(108)이 추정하는 잡음 레벨(BN)이 증가하면 적응적으로 조정가능한 신장 모듈(110)이 오디오 신호의 더 큰 감쇄를 유발한다.
또 다른 실시예에 따르면, 도 4a 내지 4c의 상이한 신장 곡선으로 나타낸 바와 같이, 신장 모듈(110)은 추정 모듈(108)이 추정한 잡음 레벨에 기초하여 신호 임계치를 확정함으로써 오디오 신호의 감쇄를 유발한다. 도 4a는, 코너 포인트 C 로 도시한 바와 같이, 임계치가 -20㏈의 신호 레벨에서 설정되는 벤치마크를 예시적으로 제공한다. 오디오 신호와 관련된 추정 잡음 레벨이 증가하는 경우, 도 4b의 코너 포인트 C"로 도시한 바와 같이, 신장 모듈(110)은 임계치를 -10㏈에서 예시적으로 설정한다. 반대로, 도 4c에 나타낸 바와 같이, 추정 잡음 레벨이 상대적으로 더 낮은 경우, 코너 포인트 C'으로 도시한 바와 같이, 신장 모듈(110)은 임계치를 -30㏈에서 설정한다.
도 4a 내지 4c의 각 신장 곡선에 대하여, 코너 포인트가 나타내는 임계치는 추정된 잡음 레벨에 좌우된다는 점을 알아야 한다. 특히, 잡음 레벨이 높을수록 신장 모듈(110)은 더욱 엄격하게 임계치를 설정하는데, 적당한 잡음 레벨의 경우, 오디오 신호에서의 -20㏈ 강하에는 신장기를 권유할 필요가 있다. 상대적으로 높은 잡음 레벨의 경우에는 -10㏈ 강하만이 필요한 반면, 상대적으로 낮은 잡음 레벨의 경우에는 신장 모듈(110)이 오디오 신호의 감쇄를 유발하기 전에 -30㏈ 이상의 강하가 필요하다.
신장 모듈(110)이 결정하는 신호 임계치는 추정 모듈(108)이 결정한 추정 잡음 레벨에 기초한 수학 관계식으로 정의할 수 있다. 예를 들어, 신호 임계치는 다음의 선형 관계식으로 정의할 수 있는데, 이 관계식에서 C는 코너 포인트를 표시하고, BN은 추정된 잡음 레벨을 표시하며, S는 시프트 파라미터를 표시한다.
C=BN+S
상술한 예시적인 신장 곡선은 다음의 방정식으로 수학적으로 기술할 수 있는 데, 이 방정식에서 y는 감쇄된 오디오 신호(즉, 출력)를 나타내고, x는 오디오 신호(즉, 입력)를 나타내며, α는 임계치 이하의 입력 신호 레벨에 대응하는 곡선 부분의 기울기를 나타내며, C는 상술한 바와 같이 정의한다.
y=αx-C(α-1)
따라서, 추정 모듈(108)이 결정하는 추정 잡음 레벨에 기초하여 신장 모듈(110)이 유발하는 감쇄량은 다음의 방정식으로 표현할 수 있는데, 감쇄량은 감쇄된 오디오 신호(출력)와 오디오 신호(입력) 간의 차에 대응하고, Δ로 표시한다.
Δ=y-x=(α-1)(x-C)
이전 방정식의 C를 BN-S로 대체하여 다음을 얻는다.
Δ=(α-1)(x-BN-S)
오디오 신호가 배경 잡음과 같은 잡음만을 포함하는 경우, 오디오 기반의 입력이 없어 마지막 방정식이 다음의 공식으로 변형된다는 점은 알아야 할 가치가 있다.
Δ=-(α-1)S
신호와 관련된 이득의 양도 또한 계산할 수 있다. 시간 지표 i에 대하여, 이득은 G(i)이다. 일반적으로 ㏈ 도메인의 축척 인자가 선형(시간) 도메인의 압축 과 동등하다는 점을 상기하면, ㏈ 도메인의 a*X(t)는 선형(시간) 도메인의 x(t)a와 동등하게 된다. 상술한 바로부터, ㏈ 도메인에서 Δ=(α-1)(x-c)이다. 따라서, 이득은 다음과 같이 도출할 수 있다.
G(i)=10Δ/10=10(α-1)(x-c)/10
10[x(α-1)+c(1-α)]=
10x(α-1)/1010c(1-α)/10=
Clog (1-α)ㆍ|x(i)|(α-1)
|x(i)|>Clog에 대하여 이득이 1이라고 가정하면, 이득에 대한 일반적인 방정식을 다음과 같이 얻을 수 있다.
G(i)=Clog (1-α)min(Clog,|x(i)|)(α-1), 여기서 Clog=10c/10
도 6은 또 다른 실시예에 따른 오디오 신호와 관련된 잡음을 완화하기 위한 방법(600)의 플로차트이다. 본 방법은 오디오 신호와 관련된 잡음의 추정 레벨을 결정하는 단계 602를 포함한다. 단계 604에서, 오디오 신호가 사전설정된 임계치 이하인지 여부를 판정한다. 임계치 이하인 경우, 단계 606에서 오디오 신호의 감쇄가 발생하는데, 그 감쇄는 단계 602에서 추정된 잡음 레벨에 기초한다. 본 방 법(600)은 멀티-샘플 음성 프레임으로 나타내는 오디오 신호에 관하여 예시적으로 적용된다. 따라서, 각 단계는 프레임별로 적용될 수 있다. 그러므로 단계 608에서 본 방법이 지금까지 적용되지 않은 멀티-샘플 프레임이 존재하는지 여부를 판정한다. 존재하는 경우, 본 방법(600)은 단계 602로 다시 진행하여 나머지 단계들을 반복한다. 상기 단계들은 본 방법(600)이 단계 610에서 종료될 수 있는 시점에 처리되는 특정 오디오 신호에 대응하는 각 멀티-샘플 프레임에 대하여 본 방법(600)이 적용될 때까지 반복된다.
본 발명은 하드웨어, 소프트웨어 또는 하드웨어와 소프트웨어의 조합으로 실현할 수 있다. 본 발명은 한 컴퓨터 시스템에서의 집중화 방식 또는 상이한 구성요소가 복수의 상호접속된 컴퓨터 시스템에 걸쳐 분산되는 분산 방식으로 실현할 수 있다. 본 명세서에서 기술한 방법을 실행하기 위해서는 어떤 컴퓨터 시스템 또는 다른 장치도 적합하다. 하드웨어와 소프트웨어의 통상적인 조합은 컴퓨터 프로그램을 구비한 범용 컴퓨터 시스템일 수도 있는데, 로드되어 실행되는 컴퓨터 프로그램은 컴퓨터 시스템을 제어하여 본 명세서에 기술한 방법을 실행하게 한다.
본 발명은, 본 명세서에 기술한 방법을 구현할 수 있는 모든 특징을 포함하고, 컴퓨터 시스템에 로드되어 이러한 방법을 실행할 수 있는 컴퓨터 프로그램 제품에 또한 임베드할 수 있다. 본 컨텍스트의 컴퓨터 프로그램은 정보 처리 능력이 있는 시스템이 특정 기능을 직접 또는 a) 또 다른 언어, 코드 또는 표기법으로의 변환, b) 상이한 매체 형태로의 재생 중 하나 혹은 둘 다 후에 실행하게 하는 명령어 세트의 어떤 언어, 코드 또는 표기법에서의 표현을 의미한다.
본 발명은 본 발명의 사상 또는 필수적인 특성을 벗어나지 않는 다양한 형태로 구현할 수 있다. 따라서, 본 발명의 사상은 전술한 명세서보다는 다음의 청구범위를 참조해야 한다.

Claims (10)

  1. 오디오 신호와 관련된 잡음을 완화하기 위한 적응 시간-기반 시스템으로서,
    상기 시스템은
    상기 오디오 신호와 관련된 잡음의 추정 레벨을 결정하기 위한 추정 모듈, 및
    상기 오디오 신호의 레벨이 신호 임계치 이하인 경우, 상기 오디오 신호의 감쇄를 유발하기 위한 신장 모듈 - 상기 신장 모듈은 상기 오디오 신호의 감쇄가 상기 추정 잡음 레벨에 기초하도록 적응적으로 조정할 수 있음 -
    을 포함하는 시스템.
  2. 제1항에 있어서,
    상기 신장 모듈은 상기 추정 잡음 레벨에 기초하여 상기 신호 임계치를 설정함으로써 상기 추정 잡음 레벨에 기초하여 감쇄를 유발하는 시스템.
  3. 제2항에 있어서,
    상기 신호 임계치는 상기 추정 잡음 레벨에 선형적으로 관련되는 시스템.
  4. 제3항에 있어서,
    상기 신호 임계치는 C=BN+S로 정의하고, C는 신호 임계치를 표시하며, BN은 추정 잡음 레벨을 표시하며, S는 시프트 파라미터를 표시하는 시스템.
  5. 제4항에 있어서,
    상기 오디오 신호의 감쇄는 Δ=(α-1)(x-C)=(α-1)(x-BN-S)로 정의하고, Δ는 감쇄를 표시하고, x는 오디오 신호의 레벨을 표시하며, α는 오디오 신호의 레벨과 오디오 신호에 기초한 출력 간의 정량적인 관계를 표시하며, BN은 추정 잡음 레벨을 표시하며, S는 시프트 파라미터를 표시하는 시스템.
  6. 제1항에 있어서,
    상기 추정 잡음 레벨은 이전의 추정 잡음 레벨 및 상기 오디오 신호로부터 도출되는 현재 음성 프레임에 대응하는 평균값에 기초하여 동적으로 추정하는 시스템.
  7. 제6항에 있어서,
    상기 동적으로 추정되는 잡음 레벨은 EBNi=EBNi -1+(1-β)*AVSF로 정의하고, EBNi는 현재 추정 잡음 레벨을 표시하며, EBNi -1은 이전 추정 잡음 레벨을 표시하며, AVSF는 현재 음성 프레임에 대응하는 평균값을 표시하며, β는 추정 잡음 레벨이 동적으로 추정되는 속도를 나타내는 파라미터를 표시하는 시스템.
  8. 오디오 신호와 관련된 잡음을 적응적으로 완화하기 위한 시간-기반 방법으로서,
    상기 방법은,
    상기 오디오 신호와 관련된 잡음의 추정 레벨을 결정하는 단계, 및
    상기 오디오 신호의 레벨이 신호 임계치 이하인 경우, 상기 오디오 신호의 감쇄 - 상기 오디오 신호의 감쇄는 상기 추정 잡음 레벨에 기초함 - 를 유발하는 단계
    를 포함하는 방법.
  9. 제8항에 있어서,
    상기 감쇄를 유발하는 단계는 상기 추정 잡음 레벨에 기초하여 상기 신호 임계치를 결정하는 단계를 포함하는 방법.
  10. 제9항에 있어서,
    상기 신호 임계치는 상기 신호 임계치와 상기 추정 잡음 레벨 간의 선형 관계에 기초하여 결정하는 방법.
KR1020077011211A 2004-11-18 2005-11-08 적응 시간-기반 잡음 억제 KR20070084312A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/992,584 US20060104460A1 (en) 2004-11-18 2004-11-18 Adaptive time-based noise suppression
US10/992,584 2004-11-18

Publications (1)

Publication Number Publication Date
KR20070084312A true KR20070084312A (ko) 2007-08-24

Family

ID=36386295

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077011211A KR20070084312A (ko) 2004-11-18 2005-11-08 적응 시간-기반 잡음 억제

Country Status (5)

Country Link
US (1) US20060104460A1 (ko)
KR (1) KR20070084312A (ko)
CN (1) CN101060820A (ko)
AR (1) AR051241A1 (ko)
WO (1) WO2006055354A2 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8879751B2 (en) * 2010-07-19 2014-11-04 Voyetra Turtle Beach, Inc. Gaming headset with programmable audio paths
CN102355616B (zh) * 2011-06-30 2014-06-04 深圳华昌视数字移动电视有限公司 在公共环境中自动调节音量的方法及设备
US9865277B2 (en) 2013-07-10 2018-01-09 Nuance Communications, Inc. Methods and apparatus for dynamic low frequency noise suppression
US9232322B2 (en) * 2014-02-03 2016-01-05 Zhimin FANG Hearing aid devices with reduced background and feedback noises

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4887299A (en) * 1987-11-12 1989-12-12 Nicolet Instrument Corporation Adaptive, programmable signal processing hearing aid
US5459814A (en) * 1993-03-26 1995-10-17 Hughes Aircraft Company Voice activity detector for speech signals in variable background noise
US5485522A (en) * 1993-09-29 1996-01-16 Ericsson Ge Mobile Communications, Inc. System for adaptively reducing noise in speech signals
FI108830B (fi) * 1993-12-23 2002-03-28 Nokia Corp Menetelmä ja laite kaiun vaimentamiseksi puhelinlaitteessa
US5657422A (en) * 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
US5867574A (en) * 1997-05-19 1999-02-02 Lucent Technologies Inc. Voice activity detection system and method
US6138040A (en) * 1998-07-31 2000-10-24 Motorola, Inc. Method for suppressing speaker activation in a portable communication device operated in a speakerphone mode
US6122531A (en) * 1998-07-31 2000-09-19 Motorola, Inc. Method for selectively including leading fricative sounds in a portable communication device operated in a speakerphone mode
US6157906A (en) * 1998-07-31 2000-12-05 Motorola, Inc. Method for detecting speech in a vocoded signal
US6223154B1 (en) * 1998-07-31 2001-04-24 Motorola, Inc. Using vocoded parameters in a staggered average to provide speakerphone operation based on enhanced speech activity thresholds
DE19957221A1 (de) * 1999-11-27 2001-05-31 Alcatel Sa Exponentielle Echo- und Geräuschabsenkung in Sprachpausen
US6320968B1 (en) * 2000-06-28 2001-11-20 Esion-Tech, Llc Adaptive noise rejection system and method
US20040078199A1 (en) * 2002-08-20 2004-04-22 Hanoh Kremer Method for auditory based noise reduction and an apparatus for auditory based noise reduction

Also Published As

Publication number Publication date
AR051241A1 (es) 2006-12-27
WO2006055354A3 (en) 2007-01-04
WO2006055354A2 (en) 2006-05-26
US20060104460A1 (en) 2006-05-18
CN101060820A (zh) 2007-10-24

Similar Documents

Publication Publication Date Title
US7996215B1 (en) Method and apparatus for voice activity detection, and encoder
US7133529B2 (en) Howling detecting and suppressing apparatus, method and computer program product
KR101461141B1 (ko) 잡음 억제기를 적응적으로 제어하는 시스템 및 방법
JP4579273B2 (ja) ステレオ音響信号の処理方法と装置
US20060126865A1 (en) Method and apparatus for adaptive sound processing parameters
JP4968147B2 (ja) 通信端末、通信端末の音声出力調整方法
US8645144B2 (en) Audio signal shaping for playback by audio devices
US20020152066A1 (en) Method and system for noise supression using external voice activity detection
CN103270740B (zh) 声音控制装置、声音控制方法以及移动终端装置
JP6290429B2 (ja) 音声処理システム
US20110125494A1 (en) Speech Intelligibility
US8321215B2 (en) Method and apparatus for improving intelligibility of audible speech represented by a speech signal
US8489393B2 (en) Speech intelligibility
JP3273599B2 (ja) 音声符号化レート選択器と音声符号化装置
NL2007764A (en) Intelligibility control using ambient noise detection.
US8718562B2 (en) Processing audio signals
US9172791B1 (en) Noise estimation algorithm for non-stationary environments
KR20070084312A (ko) 적응 시간-기반 잡음 억제
US20120207327A1 (en) Processing Audio Signals
JP5086442B2 (ja) 雑音抑圧方法及び装置
EP3830823B1 (en) Forced gap insertion for pervasive listening
EP1829028A1 (en) Method and apparatus for adaptive sound processing parameters
JP2001188599A (ja) オーディオ信号復号装置
KR20130094246A (ko) 반도체 장치 및 음성 통신 장치
CN116206619A (zh) 语音处理方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application