KR20070022338A - 강화된 인위적 대역폭 확장 시스템 및 방법 - Google Patents

강화된 인위적 대역폭 확장 시스템 및 방법 Download PDF

Info

Publication number
KR20070022338A
KR20070022338A KR1020067026786A KR20067026786A KR20070022338A KR 20070022338 A KR20070022338 A KR 20070022338A KR 1020067026786 A KR1020067026786 A KR 1020067026786A KR 20067026786 A KR20067026786 A KR 20067026786A KR 20070022338 A KR20070022338 A KR 20070022338A
Authority
KR
South Korea
Prior art keywords
signal
noise
information
speech signals
noise ratio
Prior art date
Application number
KR1020067026786A
Other languages
English (en)
Other versions
KR100909679B1 (ko
Inventor
라우라 라악소넨
파이비 발베
Original Assignee
노키아 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노키아 코포레이션 filed Critical 노키아 코포레이션
Publication of KR20070022338A publication Critical patent/KR20070022338A/ko
Application granted granted Critical
Publication of KR100909679B1 publication Critical patent/KR100909679B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Noise Elimination (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Telephonic Communication Services (AREA)
  • Prostheses (AREA)

Abstract

방법, 장치, 시스템, 및 컴퓨터 프로그램 제품이, 협대역 스피치 신호들을 광대역 스피치 신호들로 확장한다. 그 방법은, 신호로부터 신호 타입 정보를 결정하는 단계, 결정된 신호 타입 정보를 이용하여 상위(upper) 대역 신호를 형성하기 위한 특성들을 획득하는 단계, 신호 잡음 정보를 결정하는 단계, 결정된 신호 잡음 정보를 이용하여, 상위 대역 신호를 형성하기 위해 획득된 특성들을 변경하는 단계, 및 변경된 특성들을 사용하여 상위 대역 신호를 형성하는 단계를 포함한다.

Description

강화된 인위적 대역폭 확장 시스템 및 방법{System and method for enhanced artificial bandwidth expansion}
본 발명은 전기적으로 재생된 스피치 신호의 품질 향상을 위한 시스템 및 방법에 관한 것이다. 보다 상세하게, 본 발명은 신호 품질 향상을 위한 강화된 인위적 대역폭 확장 시스템 및 방법에 대한 것이다.
스피치 신호들은 보통 GSM (Global System for Mobile Communications) 네트워크 같은 전기통신 시스템들의 제한된 대역폭을 통해 전송된다. 스피치가 10 kHz까지의 주파수 성분들을 포함해도 그러한 시스템들의 스피치 신호들에 대한 전통적 대역폭은 4 kHz (0.3 - 3.4 kHz) 미만이다. 제한된 대역폭은 품질과 음성인식도 둘 모두에 있어 빈약한 성능을 가져온다. 스피치 신호의 주파수 대역이 광대역, 즉 8kHz까지 될 때 사람들은 더 나은 품질과 음성인식도를 감지한다.
잡음의 특징은 각양각색일 수 있다. 잡음은 가령 조용한 사무소 잡음, 시끄러운 차량 잡음, 거리 잡음, 또는 다중 누화 잡음 (babble noise) (목소리의 웅성거림, 접시들의 쨍그렁 소리 등등)일 수 있다. 각종 특징에 더해, 잡음은 근단 (near-end)의 모바일 전화 사용자 주변에서 나타나거나 (tx-noise, 전송 잡음), 원단 (far-end)에서 대화하는 상대편 주변에서 나타날 수 있다 (rx-noise, 수신 잡 음). 수신 잡음은 스피치 신호를 손상시키고, 그에 따라, 이 잡음은 스피치와 함께 고 대역으로 확장까지 된다. 높은 수신 잡음 레벨이 발생된 상황에서, 이러한 것은 그 잡음이 인위적으로 생성된 고주파 성분들로 인해 귀찮게 들리기 시작하기 때문에 문제가 된다. 전송 잡은은 수신된 스피치 신호를 가림으로써 음성인식도를 저하시킨다.
종래의 인위적 대역폭 확장 (ABE) 해법들은 잡음이 있는 상황에서 빈약한 성능을 보인다는 문제를 겪고 있다. 종래의 ABE 해법 하나가 본 출원과 동일한 출원인에 의한 미국 특허 출원 시리얼 번호 10/341,332 "스피치 처리시 인위적 대역폭 확장을 위한 방법 및 장치"에 기재되어 있다. 이 앞서 개발된 ABE 알고리즘의 이점은, 그것이 잡음이 있고 부호화된 스피치에 대해 훨씬 더 강력하다는 것이다. 그러나, 이 알고리즘 적용시 전반적인 인식 품질의 자연스러움을 떨어뜨리는 인공물(artifacts)의 존재를 포함한다는 문제가 생긴다. 확장된 스피치 고대역의 급작스런 변화가 청각적 인공물을 일으킬 수 있다. 또, 이러한 종래의 알고리즘은 0-4 kHz의 주파수 대역폭을 포함한다.
잃어버린 주파수 성분들이 특히 마찰음들 (가령 /s/ 및 /z/)같은 스피치 사운드에 중요한데, 그 주파수 성분들의 중요 부분이 4 kHz 이상에 위치하기 때문이다. 파열음들 (/t/, /p/ 등)의 음성인식도 역시 고 주파수들의 부족 때문에 곤란을 겪는데, 이러한 소리들의 주요 정보가 보다 낮은 주파수대에 속함에도 그러하다. 유성음들에 있어서, 주파수들의 부족은 주로 인지되는 자연스러움의 저하로 귀결된다. 고 주파수 성분들의 중요도는 스피치 소리들 사이에서 서로 다르기 때 문에, 확장된 신호 고대역의 생성은 음소들의 각 그룹마다 서로 다르게 수행되어야 한다.
따라서, 서로 다른 음소 그룹들의 분류를 위한 강력한 계산 방법이 필요로 된다. 또, 오분류 및 그에 따라 이전 알고리즘들에서 여전히 존재하는 청각적 인공물을 방지하는 개선된 방법이 필요로 된다. 또, 신호 품질 향상을 위해 강화된 인위적 대역폭 확장 시스템 및 방법이 더 필요로 된다.
본 발명은, 신호와 함께 전송되지 못한 주파수 성분들을 삽입함으로써 스피치 신호의 대역폭을 확장시키는 방법, 장치, 시스템, 및 컴퓨터 프로그램 제품에 관한 것이다. 이 시스템은 인위적 대역폭 확장 알고리즘에 대한 잡음 종속성을 포함한다. 이 특성은 잡음 환경을 고려하여, 양호한 인지 품질을 유지하면서 스피치의 인식도가 최대화되도록 알고리즘을 자동으로 조정한다.
간략히 말해, 전형적 일 실시예는, 협대역 스피치 신호들을 광대역 스피치 신호들로 확장하기 위한 방법에 대한 것이다. 이 방법은, 신호로부터 신호 타입 정보를 결정하는 단계, 결정된 신호 타입 정보를 이용해 상위 대역 신호를 형성하기 위한 특성을 획득하는 단계, 신호 잡음 정보를 결정하는 단계, 결정된 신호 잡음 정보를 이용하여 상위 대역 신호 형성을 위해 획득한 특성들을 수정하는 단계, 및 수정된 특성들을 이용해 상위 대역 신호를 형성하는 단계를 포함한다.
다른 전형적 실시예는 광대역 신호들을 수신하도록 구성되는 단말 장치에 관한 것이다. 이 장치는 무선 네트워크와 통신하는 인터페이스 및, 메모리에 저장되어 있고 잡음 환경에 기초해 인위적 대역폭 확장 알고리즘을 조정해서 수신한 협대역 신호들을 광대역 신호들로 확장하도록 설정된 프로그램 명령어들을 포함한다.
또 다른 전형적 실시예는 협대역 스피치 신호들을 광대역 스피치 신호들로 확장하는 통신 네트워크의 네트워크 장치 또는 모듈에 관한 것이다. 그 장치는, 네트워크에서 협대역 스피치 신호들을 수신하는 협대역 코덱, 네트워크 통신하는 광대역 단말들과 광대역 스피치 신호들을 통신하는 광대역 코덱, 및 잡음 환경에 기초해 인위적 대역폭 확장 알고리즘을 조정해 협대역 스피치 신호들을 광대역 스피치 신호들로 확장하는 프로그램 명령어들을 포함한다.
또 다른 전형적 실시예는 협대역 스피치 신호들을 광대역 스피치 신호들로 확장하기 위한 시스템에 관한 것이다. 이 시스템은, 신호로부터 신호 타입 정보를 결정하는 수단, 결정된 신호 타입 정보를 이용해 상위 대역 신호를 형성하기 위한 특성을 획득하는 수단, 신호 잡음 정보를 결정하는 수단, 결정된 신호 잡음 정보를 이용하여 상위 대역 신호 형성을 위해 획득한 특성들을 수정하는 수단, 및 수정된 특성들을 이용해 상위 대역 신호를 형성하는 수단을 포함한다.
또 다른 전형적 실시예는 협대역 스피치 신호들을 광대역 스피치 신호들로 확장하는 컴퓨터 프로그램 제품에 관한 것이다. 이 컴퓨터 프로그램 제품은, 신호로부터 신호 타입 정보를 결정하고, 결정된 신호 타입 정보를 이용해 상위 대역 신호를 형성하기 위한 특성을 획득하고, 신호 잡음 정보를 결정하고, 결정된 신호 잡음 정보를 이용하여 상위 대역 신호 형성을 위해 획득한 특성들을 수정하고, 수정된 특성들을 이용해 상위 대역 신호를 형성하는 컴퓨터 코드를 포함한다.
본 발명의 다른 원리적 특성들과 이점들은 이 분야의 당업자가 이하의 도면, 상세 설명 및 첨부된 청구범위들을 검토할 때 보다 자명해질 것이다.
지금부터 전형적 실시예들은 첨부된 도면을 참조해 설명될 것이다.
도 1은 전형적 실시예에 따른 잡음 분할을 묘사한 도면이다.
도 2는 전형적 실시예에 따른 프레임 분류 절차상의 동작들을 도시한 도면이다.
도 3은 유성음 처리를 통제하는 유성음 계수에 대한 rx-SNR 추정치의 작용을 나타낸 그래프이다.
도 4는 rx-SNR의 작용이 고려된 뒤 유성음 계수의 tx-SNR 추정치의 작용을 나타낸 그래프이다.
도 5는 유성음 계수가 정의된 후, 치찰음 프레임들의 지속적 감쇠에 대한 정의를 그린 그래프이다.
도 6은 전형적 실시예에 따라 네트워크에 적용된 인위적 대역폭 확장을 그린 도면이다.
도 7은 전형적 실시예에 따라 광대역 단말에 적용된 인위적 대역폭 확장을 도시한 도면이다.
도 1은 프레임 분류 알고리즘에 따라, 통신 신호의 한 프레임(12)으로부터의 잡음을 다중 누화 잡음 (babble noise)(14) 및 정상 잡음 (stationary noise)(17) 으로 분할한 예를 도시한 것이다. 다중 누화 잡음(14)은 유성 프레임들(15)과 폐쇄 자음들(stop consonants)(16)로 나눠질 수 있다. 정상 잡음(17)은 유성 프레임들(18), 폐쇄 자음들(19), 및 치찰음(sibilant) 프레임들(20)로 나눌 수 있다. 다중 누화 잡음은, 주파수 성분들의 스펙트럼 분포를 반영함으로써 저 주파수 잡음과, 더 높은 주파수 성분들을 포함한 다중 누화 잡음 사이를 구별할 수 있는 특징들에 기반한다.
잡음 상태에 대한 고려가, 인지 품질을 유지하면서 스피치 인식도를 향상시킬 수 있다. 잡음 종속관계는 rx-잡음 (수신 잡음) (원단) 종속관계와 tx-잡음 (전송 잡음) (근단) 종속관계로 나눌 수 있다. 수신 잡음 종속관계는, 다중 누화 잡음과 시끄러운 정상 잡음 도중에 고대역으로의 교란 잡음 생성을 피함으로써 오디오 품질을 향상시키게 할 수 있다. 오디오 품질은 잡음 모드와 수신 잡음 레벨 추정치에 기초해 알고리즘을 조정함으로써 향상된다. 한편, 전송 잡음 종속관계는 음성인식도가 극대화될 수 있도록 알고리즘을 튜닝할 수 있게 한다. 시끄러운 전송 잡음 환경에서는, 잡음이, 있을지 모를 인공물을 가리기 때문에 알고리즘이 매우 공격적일 수 있다. 조용한 전송 잡음 환경에서는, 인공물의 량을 극대화시킴으로써오디오 품질이 극대화된다.
도 2는 전형적인 프레임 분류 절차상의 동작을 도시한 것으로서, 서로 다른 음소들의 그룹들을 식별함에 있어 어떤 특징들이 이용되는지를 보이고 있다. 전형적 실시예에서, 프레임들을 서로 다른 음소 그룹들로 분류하는, 예로 든 프레임 분류 알고리즘은 분류 정확도 및 그에 따라 향상되는 인지 오디오 품질을 도모하기 위한 일곱 개의 특징들을 포함한다. 이 일곱 특징들은 더 나은 치찰음 검출 및, 특히 치찰음 프레임들로부터의 우수한 폐쇄 자음 제외와 관련이 있다.
프레임 분류 절차는 이러한 특성 벡터에 기초해 분류 결정을 수행한다. 예로든 실시예에서는 각 특징마다 미리 정해진 문턱치들이 존재하고, 어떤 조건이 만족되는지를 테스트함으로써 결정이 이뤄진다. 일곱 특징들에는 (1) 그래디언트(gradient) 인덱스, (2) rx-배경 잡음 레벨 추정치, (3) rx-SNR 추정치, (4) 그래디언트 인덱스들의 그래디언트 레벨, (4) 협대역 스펙트럼의 기울기, (5) 연속 프레임들의 에너지율, (6) 이전 프레임이 어떻게 처리되었는지에 대한 정보, (7) 알고리즘이 작동한 잡음 모드가 포함된다.
그래디언트 인덱스는 각각의 방향 변화시 스피치 신호의 그래디언트 크기들의 합을 측정한 것이다. 이것은 치찰음 검출에 사용되는데, 그 이유는 치찰음들의 파형들이 주기적 유성음 파형들보다 더 자주, 그리고 급작스럽게 방향을 바꾸기 때문이다. 예를 들어, 한 치찰음 프레임에 있어서, 그래디언트 인덱스 값은 문턱치보다 커야 한다.
그래디언트 인덱스는 다음과 같이 정의될 수 있다:
Figure 112006094140749-PCT00001
상기
Figure 112006094140749-PCT00002
이고,
Figure 112006094140749-PCT00003
는 그래디언트의 부 호(sign)
Figure 112006094140749-PCT00004
이다.
rx-배경 잡음 레벨 추정치는 최소 통계라 불리는 방법에 기반한다. 최소 통계는 짧은 서브 프레임들 안에서 신호 에너지의 필터링과 그 최소값 찾기를 수반한다. 각 프레임의 배경 잡음 레벨 추정치는 이전의 네 서브 프레임들의 최소치들 중 가장 적은 값으로 선택된다. 이러한 추정 방법은, 누군가 말하고 있을 때에도 단어들과 음절들 사이에 배경 잡음만을 포함하는 어떤 짧은 정지기(pause)들이 있다는 것을 전제로 한다. 따라서 신호 에너지의 최소값들을 찾아냄으로써, 정지기들의 순간들을 찾아낼 수 있다. 높은 배경 잡음 레벨을 가진 신호들은 유성 음들로 처리되는데, 이는 높은 대역의 확장이 귀찮은 소리가 나게 만들어 잡음에도 영향을 미치기 때문이다.
rx-SNR 추정치는 평균 프레임 에너지 및 배경 잡음 레벨 추정치로부터 산출될 수 있다:
Figure 112006094140749-PCT00005
그래디언트 인덱스들의 일반 레벨을 나타내는 특징은, 조용한 기간 중에 틀린 치찰음 검출을 막기 위해 필요로 된다. 전반적인 그래디언트 인덱스들의 레벨이 가령 75% 이상으로 높고, 이전의 20 개의 프레임들이 0.6 보다 큰 그래디언트 인덱스를 가지면, 프레임이 하이 패스 (high pass) 특성의 배경 잡음만을 가지고 있고 어떤 치찰음 검출도 일어나지 않았다고 간주된다. 이러한 특성 너머의 동기는, 스피치가 그러한 마찰음들(fricatives)을 그렇게 자주 포함하지 않는다는 것이 다.
협대역 크기 스펙트럼의 기울기는 치찰음들이 있는 동안 정(positive)이고, 반면 유성음들에 대해서는 부(negative)가 된다. 이러한 협대역 경사라는 특징은 여기서 0.3 및 3.0 kHz 주파수들에서의 크기 스펙트럼 차이라고 정의된다.
에너지율은 이전 프레임의 에너지로 현재 프레임의 에너지를 나눈 것이라고 정의한다. 치찰음 검출은, 현재 프레임과 이전 두 프레임들이 너무 큰 에너지율을 가지지 않을 것을 요한다. 한편, 파열음(plosive)의 경우, 에너지율이 크게 되는데, 이는 파열음이 보통 한 치찰음 국면과 그에 뒤이어 버스트 및 호흡(aspiration)으로 이뤄지기 때문이다.
last_frame이라 칭하는 파라미터는 이전 프레임이 어떻게 처리되었는지에 대한 정보를 포함한다. 이것은, 차찰음 프레임들이라 간주되는 첫째 및 둘째 프레임들은 나머지 프레임들과는 다르게 처리되기 때문에 필요하게 된다. 유성음에서 치찰음으로의 천이는 완만해야 한다. 한편, 최초의 두 검출 프레임들이 정말 치찰음인지가 확실하지 않으므로, 청각적 인공물을 피하기 위해 이들을 주의해서 처리하는 것이 중요할 수 있다. 한 마찰음의 존속 기간(duration)은 보통 다른 자음들의 존속기간보다 길다. 좀 더 정확히 말해, 다른 마찰음들의 존속기간은 흔히 치찰음들의 존속기간보다 적다.
파라미터 noise_mode는 알고리즘이 어느 노이즈 모드에서 동작하는지에 관한 정보를 포함한다. 도 1을 참조하여 설명한 것처럼 정상 잡음 모드와 다중 누화 잡음 모드의 두 잡음 모드들이 존재함이 바람직하다.
유성 프레임들의 변경 함수의 최대 감쇠 량은 일반적으로 인접 프레임들 사이에서 단 2 dB 범위로 국한되어야 할 것이다. 이러한 조건이 높은 대역의 완만한 변경을 보장하고 그에 따라 청각적 인공물을 감소시킨다. 치찰음의 고대역 변경율 역시 통제된다. 차찰음으로 간주되는 첫째 프레임은 15 dB 추가(extra) 감쇠를 포함하고, 둘째 프레임은 10 dB 추가 감쇠를 포함한다. 이러한 추가 감쇠들이 유성 음소에서 치찰음으로의 완만한 천이를 보장한다.
도 2를 자세히 참조하면, 본 발명의 일실시예에 따른 프레임 분류 절차의 프로세스 예는, if-then (~면, ...하다) 결정문에 기초한 결정을 위해 if then 문과 블록들을 사용해 도시되고 있다. 에너지율이 0이면, 스피치 신호는 폐쇠 자음이라고 정해진다(블록 22). 그렇지 않으면, 스피치 신호는 유성음 프레임이다(블록 24). 일단 에너지율 검사가 행해졌으면, 사전 설정된 제한치들에 대해 잡음과 그래디언트 인덱스에 대한 체크가 행해진다. 예를 들어, rx_bgnoiserk 미리 정해진 제한치보다 크고, 그래디언트 인덱스가 소정 제한치보다 크고, 에너지율이 0이고, 그래디언트 카운트가 소정 제한치보다 적고, nb_slpe가 소정 제한치보다 크면, 스피치 신호는 온건한 파열음이라고 간주되고(블록 25), last_frame 파라미터는 0으로 세팅된다. 그렇지 않으면, last_frame이 1로 세팅되고 에너지율이 다시 체크된다.
다른 if-then 문이, 스피치 신호가 마일드 파열음(블록 26), 파열음(블록 27), 또는 파열음(블록 28)으로 간주되는지를 결정하는데 사용될 수있고, last_frame 파라미터는 이전 프레임이 어떻게 처리되었는지를 반영하도록 변경된다.
앞에서 언급한 바와 같이, 잡음은 정상 잡음과 다중 누화 잡음으로 나누어 질 수 있다. 다중 누화 잡음 검출은 세 가지 특성인, 그래디언트 인덱스 기반 특성, 에너지 정보 기반 특성, 및 배경 잡음 레벨 추정치에 기반한다. 에너지 정보, Ei
Figure 112006094140749-PCT00006
으로 정의될 수 있고, 여기서 s(n)은 시간 도메인 신호이고, E[s''nb]는 신호의 2차 도함수 에너지이며, E[snb]는 신호의 에너지이다. 다중 누화 잡음 검출에 있어서, 실질적 정보는 딱 Ei의 값이 아니라 그 값이 얼마나 자주 상당히 큰가 하는 것이다. 따라서, 다중 누화 검출에 사용되는 실제 특성은 Ei가 아니고, 그것이 얼마나 자주 소정 문턱치를 초과하는가이다. 또, 장기간 추세가 관련이 있으므로, Ei 값이 큰지 작은지 여부의 정보가 필터링된다. 이러한 것은, 에너지값 정보가 문턱치보다 크면 IIR 필터로의 입력이 1이 되게 하고 그렇지 않으면 0이 되도록 구현된다. IIR 필터는 다음과 같이 표현될 수 있다:
Figure 112006094140749-PCT00007
여기서 a는 에너지 정보의 변경 방향에 따랄 좌우되는 개시(attack) 또는 해제(release) 상수이다.
에너지 정보는 현재의 스피치 음이 가령 /s/ 같이 하이 패스 특성을 가질 때 높은 값을 가질 수도 있다. 이러한 경우들을 IIR 필터 입력에서 배제하기 위해, IIR 필터링된 에너지 정보 특성은 프레임이, 있을 수 있는 치찰음이라고 간주되지 않을 때에만 (즉, 그래디언트 인덱스가 소정 문턱치 보다 작을 때) 업데이트 된다.
그래디언트 인덱스는 다중 누화 잡음 검출에 사용되는 또 다른 특성이다. 다중 누화 잡음 검출시, 그래디언트 인덱스는 에너지 정보 특성에 대해 사용되었던 같은 종류의 필터를 이용해 IIR 필터링된다. 개시 및 해제 상수들도 역시 같을 수 있다. 배경 잡음 추정은 위에서 설명한 최소 통계라 불리는 방법에 기반할 수 있다.
세 특징들 모두 (IIR-필터링된 에너지 정보, IIR-필터링된 그래디언트 인덱스 및 배경 잡음 레벨 추정치) 소정 문턱치들을 초과하면, 그 프레임은 다중 누화 잡음을 포함한다고 간주된다. 적어도 일실시예에서, 이 다중 누화 잡음 검출 알고리즘을 보다 강력히 하기 위해, 연속적인 15개의 정지 프레임들이 사용되어, 이 알고리즘이 정상 잡음 모드에서 동작하는 것을 최종 결정하도록 한다. 한편, 정상 잡음 모드에서 다중 누화 잡음 모드로의 천이는 오직 한 프레임만을 필요로 한다.
노이즈 종속 관계와 관련하여, 세 개의 파라미터들이 사용될 수 있다. 이 파라미터들에는 rx-잡음 모드 결정, rx-신호-대-잡음비 (rx-SNR) 및tx-신호-대-잡음비 (tx-SNR)가 포함될 수 있다. 배경 잡음 레벨들의 추정치들은 최소 통계 방법을 이용해 산출될 수 있다. SNR들은 배경 잡음 레벨 추정치들과 프레임 신호의 평균 에너지로부터 산출될 수 있다:
Figure 112006094140749-PCT00008
SNR 추정치들의 급작스런 점프를 피하기 위해, 이들은 다중 누화 잡음 검출시 사용되는 필터들과 유사하지만 상이한 개시 및 해제 상수들을 가지는 필터들을 통해 IIR 필터링 될 수 있다.
유성음 프레임과 관련해, 새 파라미터인 voiced_const가 정의될 수 있다. 이 파라미터는 유성음 프레임에 대한 데시벨 단위 추가(extra) 상수 이득을 포함하여, 그에 따라 협대역 신호의 미러(mirror) 이미지가 변경되는 정도를 판단할 수 있다. 큰 음의 값은 큰 감쇠와 보다 온건한(conservative) 인위적 대역폭 확장 (ABE) 신호를 나타낸다. 파라미터 voiced_const의 값은 rx-SNR과 tx-SNR에 종속될 수 있다. 먼저, voiced_onst 값이 도 3에 도시된 그래프에 따라 산출될 수 있고, 그 후에 tx-SNR의 결과인, tx_factor (도 4)가 거기에 더해질 수 있다. 파라미터 tx_factor는 tx (전송) 잡음이 존재할 때 양의 값들을 얻으며, 그에 따라 감쇠 정도를 줄이고 알고리즘을 보다 공격적으로 만든다.
알고리즘의 쉬운 튜닝을 지원하기 위해, voiced_const의 산출과, 그에 따른 알고리즘의 총 성능이 다른 새로운 세 가지 파라미터들로서 통제될 수 있다:abe_control, rx_control 및 tx_control. 이들 각각이 가지는 영향에 대해서는 이하에서 설명할 것이다.
파라미터 abe_control은 voiced_const-curve(곡선)의 전반적 레벨과 그에 따른 알고리즘의 전반적 온건성/공격성을 바꾼다. 최대값(1)은 매우 공격적인 성능을 나타낸다. 한편 최소값 (0)은 가장 온건한 성능을 가리킨다. 도 3에 도시된 것처럼, 값의 범위는 [0,1]이고, 두 잡음 모드들 모두에서의 디폴트 값은 0.5이다.
파라미터 rx_control은 voicd_const-curve의 기울기를 바꾼다. 최대값 (1)은 수신 잡음 레벨이 알고리즘에 영향을 미치지 않음을 나타낸다. 한편 최소값 (0)은 매우 가장 밀접한 관련성을 나타낸다. 도 3에 도시된 바와 같이, 값의 범위는 [0, 1]이고, 두 잡음 모드에서의 디폴트 값은 0.5이다.
파라미터 tx_control은 tx-factor (전송 팩터)의 스텝 크기를 바꾼다. 최대값 (1)은 가장 밀접한 관련성을 나타낸다. 한편 최소값 (0)은 전송 잡음 레벨이 알고리즘에 영향을 미치지 않음을 나타낸다. 도 4에 도시된 것처럼, 값의 범위는 [0, 1]이고, 정상 잡음 모드의 디폴트 값은 0.5이고 다중 누화 잡음 모드의 elvfxm 값은 0.4가 된다.
치찰음 처리 역시 잡음 모드와 SNR 추정치들에 좌우될 수 있다. 다중 누화 잡음 모드에서, 모든 프레임들은 유성음 프레임들로서 처리되므로, 어떤 치찰음 검출도 수행되지 않는데 이는 다중 누화 잡음 중 그 검출은 틀린 치찰음 검출을 일으킬 수 있고, 배경 잡음이 치찰음 유사 프레임들을 포함하기 때문이다.
정상 잡음 모드에서, 높은 배경 잡음 레벨을 가진 신호들 역시 유성음들로서 처리되는데, 이는 귀찮은 소리가 나게 함으로써 고대역 확장 역시 잡음에 영향을 미치기 때문이다. 한편, 저레벨 정상 잡음을 가진 신호들의 경우, 치찰음들이 검출될 수 있고 치찰음들에 대한 수정 기능은 파라미터 const_att에 의해 통제된다. 이 파라미터는 유성음 프레임들이 강력하게 감쇠되는 경우 치찰음들 역시 보다 큰 추가적 상수 감쇠를 갖도록 하기 위한 치찰음들에 대한 추가 상수 이득이다. 달리 말해, 도 5에 도시된 것과 같이, const_att 값은 voiced-const의 값에 좌우된다.
용이한 알고리즘 튜닝을 위한 수단을 제공하기 위해, 치찰음 프레임들에 대해 튜닝가능한 파라미터 역시 존재하는데, 이것은 전반적인 치찰음들의 프로세싱을 통제한다. sibilant_const 파라미터는 일정 감쇠 (constant attenuation) 곡선의 전반적 레벨을 변경한다. 최대값 (1)은 매우 공격적(aggressive) 치찰음들을 가리킨다. 한편 최소값 (0)은 가장 온건한 성능을 가리킨다. 도 5에 도시된 바와 같이 그 값의 범위는 [0, 1]이고, 디폴트 값은 0.5이다.
도 6은 인위적 대역폭 확장 (ABE)이 네트워크에서 어떻게 적용될 수 있는지를 예시한 것이다. 네트워크에 적용시, ABE는 협대역과 광대역 코덱을 모두 이용한 네트워크들에서 구현될 수 있다. 도 7은 인위적 대역폭 확장 (ABE)이 단말에서 어떻게 적용될 수 있는지를 예시한 것이다. 단말에 적용시, ABE는 단말에 위치하여 네트워크로부터 협대역 통신신호를 수신한다. ABE는 통신을 단말을 위한 광대역으로 확장한다. ABE 알고리즘은 단말에서 디지털 신호 처리기 (DSP)를 통해 구현될 수 있다.
기술된 알고리즘이 프레임 오분류에 의해 야기되는 인공물들의 수를 감소시킨다. 또, rx- 및 tx-잡음 종속관계가, 오디오 품질과 인식능력이 모든 상황에서 극대화될 수 있도록 상이한 잡음 환경에서 상이하게 알고리즘을 튜닝할 수 있게 한다. 기술된 ABE의 기타 이점들은, 스피치 품질의 자연스러움을 항샹시키기 위해 어떠한 부가 전송 정보도 필요로 하지 않는다는 사실을 포함한다. 또, ABE는 저렴한 계산 가격으로 실시간 구현될 수 있다. 앨리아싱된(aliased) 주파수 성분들의 조정이, 강력한 주파수 도메인 방법을 이용해 계산된다. 이것은 상위 주파수 성분 들의 불충분한 감쇠로 인한 품질 저하의 위험을 감소시킨다.
이러한 상세 설명이, 신호 품질 향상을 위한 개선된 인위적 대역폭 확장 방법, 장치 및 시스템에 대한 실시예들을 약술하고 있다. 상기 설명에서, 설명의 목적으로서, 수많은 특정한 세부사항들이 본 발명의 철저한 이해를 돕기 위해 서술되었다. 그러나, 이 분야의 당업자라면, 이러한 특정한 세부사항들 없이 실시예들이 실시될 수 있다는 것을 잘 알 것이다. 다른 경우들에서, 실시예들의 기재를 돕기 위해 구조들과 장치들이 블록도의 형태로 그려졌다.
도면에 도시되어 위에서 설명된 실시예들은 현재로서 바람직한 것이지만, 이들은 단지 예로서 제공된 것임을 알아야 한다. 다른 실시예들이, 동일한 동작을 수행하는 다른 기술들 등을 포함할 수도 있다. 본 발명은 특정 실시예에 한정되는 것이 아니며, 첨부된 청구항들의 범위와 개념 안에서 다양한 변형, 조합, 및 치환된 것들로 확장될 수 있다.

Claims (22)

  1. 협대역 스피치 신호들을 광대역 스피치 신호들로 확장하는 방법에 있어서,
    신호로부터 신호 타입 정보를 결정하는 단계;
    결정된 신호 타입 정보를 이용하여 상위(upper) 대역 신호를 형성하기 위한 특성들을 획득하는 단계;
    신호 잡음 정보를 결정하는 단계;
    결정된 신호 잡음 정보를 이용하여, 상위 대역 신호를 형성하기 위해 획득된 특성들을 변경하는 단계; 및
    변경된 특성들을 사용하여 상위 대역 신호를 형성하는 단계를 포함함을 특징으로 하는 방법.
  2. 제1항에 있어서, 상기 신호 잡음 정보를 결정하는 단계는, 신호 일부분의 에너지에 대한 정보 및 배경 잡음 레벨 추정치를 이용해 원단(far-end) 신호대 잡음비를 산출하는 단계를 포함함을 특징으로 하는 방법.
  3. 제2항에 있어서, 상기 신호 잡음 정보를 결정하는 단계는, 근단(near-end) 신호대 잡음비를 산출하는 단계를 포함함을 특징으로 하는 방법.
  4. 제1항에 있어서, 상기 신호 타입 정보는, 신호 그래디언트 (gradient) 인덱 스, 신호 원단 신호대 잡음비, 및 신호 근단 신호대 잡음비에 기반해 결정됨을 특징으로 하는 방법.
  5. 제4항에 있어서,
    상기 그래디언트 인덱스 및 원단 신호대 잡음비에 기반하여 상기 신호를 서로 다른 음소(phoneme) 그룹들로 분류하는 단계를 더 포함함을 특징으로 하는 방법.
  6. 제1항에 있어서,
    신호 내 다중 누화 잡음 (babble noise)을 검출하는 단계를 더 포함함을 특징으로 하는 방법.
  7. 제6항에 있어서, 상기 다중 누화 잡음은, 그래디언트 인덱스, 에너지 정보, 및 잡음 레벨 추정치에 기반하여 검출됨을 특징으로 하는 방법.
  8. 제6항에 있어서, 상기 에너지 정보는, 신호의 이차 도함수 기대치에 대한 신호의 기대치에서 얻어짐을 특징으로 하는 방법.
  9. 광대역 신호들을 수신하기로 설정된 통신 장치에 있어서,
    무선 네트워크와 통신하는 인터페이스; 및
    메모리에 저장되고, 잡음 상태에 기반해 인위적 대역폭 확장 알고리즘을 조정함으로써 수신된 협대역 신호를 광대역 신호들로 확장하도록 구성된 프로그램 명령어들을 포함함을 특징으로 하는 장치.
  10. 제9항에 있어서, 상기 잡음 상태는, 원단 신호대 잡음비 및 근단 신호대 잡음비를 포함함을 특징으로 하는 장치.
  11. 제9항에 있어서, 상기 프로그램 명령어들은, 그래디언트 인덱스, 에너지 정보, 및 잡음 레벨 추정치에 기반하여 다중 누화 잡음을 더 검출하도록 구성됨을 특징으로 하는 장치.
  12. 제9항에 있어서, 상기 프로그램 명령어들은 디지털 신호 프로세서 (DSP)를 통해 구현됨을 특징으로 하는 장치.
  13. 협대역 스피치 신호들을 광대역 스피치 신호들로 확장하는 통신 네트워크 내 장치에 있어서,
    네트워크에서 협대역 스피치 신호를 수신하는 협대역 코덱;
    네트워크와 통신하는 광대역 단말들로 광대역 스피치 신호들을 전송하는 광대역 코덱; 및
    잡음 상태에 기반해 인위적 대역폭 확장 알고리즘을 조정함으로써 협대역 스 피치 신호들을 광대역 스피치 신호들로 확장하는 프로그램 명령어들을 포함함을 특징으로 하는 장치.
  14. 제13항에 있어서, 상기 잡음 상태는 원단 신호대 잡음비 및 근단 신호대 잡음비를 포함함을 특징으로 하는 장치.
  15. 제13항에 있어서, 상기 프로그램 명령어들은, 그래디언트 인덱스, 에너지 정보, 및 잡음 레벨 추정치에 기반하여 다중 누화 잡음을 더 검출하도록 구성됨을 특징으로 하는 장치.
  16. 협대역 스피치 신호들을 광대역 스피치 신호들로 확장하는 시스템에 있어서,
    신호로부터 신호 타입 정보를 결정하는 수단;
    결정된 신호 타입 정보를 사용해 상위 대역 신호를 형성하기 위한 특성들을 획득하는 수단;
    신호 잡음 정보를 결정하는 수단;
    결정된 신호 잡음 정보를 이용하여, 상위 대역 신호를 형성하기 위해 획득한 특성들을 변경하도록 하는 수단; 및
    변경된 특성들을 이용해 상위 대역 신호를 형성하는 수단을 포함함을 특징으로 하는 시스템.
  17. 제16항에 있어서, 상기 신호 타입정보는 신호 그래디언트 인덱스, 신호 원단 신호대 잡음비, 신호 근단 신호대 잡음비에 기초해 결정됨을 특징으로 하는 시스템.
  18. 제16항에 있어서,
    신호 내 다중 누화 잡음을 검출하는 동작을 더 포함함을 특징으로 하는 시스템.
  19. 협대역 스피치 신호들을 광대역 스피치 신호들로 확장하는 컴퓨터 프로그램 제품에 있어서,
    신호로부터 신호 타입 정보를 결정하고; 결정된 신호 타입 정보를 이용하여 상위(upper) 대역 신호를 형성하기 위한 특성들을 획득하고; 신호 잡음 정보를 결정하는 단계; 결정된 신호 잡음 정보를 이용하여, 상위 대역 신호를 형성하기 위해 획득된 특성들을 변경하고; 변경된 특성들을 사용하여 상위 대역 신호를 형성하도록 하는 컴퓨터 코드를 포함함을 특징으로 하는 컴퓨터 프로그램 제품.
  20. 제19항에 있어서, 상기 컴퓨터 코드는, 신호 그래디언트 인덱스, 신호 원단 신호대 잡음비, 신호 근단 신호대 잡음비에 기초해, 신호를 협대역 신호에서 광대역 신호로 더 확장함을 특징으로 하는 컴퓨터 프로그램 제품.
  21. 제19항에 있어서, 상기 컴퓨터 코드는 신호 내 다중 누화 잡음을 더 검출함을 특징으로 하는 컴퓨터 프로그램 제품.
  22. 제19항에 있어서, 상기 컴퓨터 코드는 근단 신호대 잡음비를 더 산출함을 특징으로 하는 컴퓨터 프로그램 제품.
KR1020067026786A 2004-05-25 2005-05-25 강화된 인위적 대역폭 확장 시스템 및 방법 KR100909679B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/853,820 2004-05-25
US10/853,820 US8712768B2 (en) 2004-05-25 2004-05-25 System and method for enhanced artificial bandwidth expansion
PCT/IB2005/001416 WO2005115077A2 (en) 2004-05-25 2005-05-25 System and method for enhanced artificial bandwidth expansion

Publications (2)

Publication Number Publication Date
KR20070022338A true KR20070022338A (ko) 2007-02-26
KR100909679B1 KR100909679B1 (ko) 2009-07-29

Family

ID=35426530

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067026786A KR100909679B1 (ko) 2004-05-25 2005-05-25 강화된 인위적 대역폭 확장 시스템 및 방법

Country Status (9)

Country Link
US (1) US8712768B2 (ko)
EP (1) EP1766615B1 (ko)
KR (1) KR100909679B1 (ko)
CN (1) CN1985304B (ko)
AT (1) ATE437432T1 (ko)
BR (1) BRPI0512160A (ko)
DE (1) DE602005015588D1 (ko)
ES (1) ES2329060T3 (ko)
WO (1) WO2005115077A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100905585B1 (ko) * 2007-03-02 2009-07-02 삼성전자주식회사 음성신호의 대역폭 확장 제어 방법 및 장치

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100723409B1 (ko) 2005-07-27 2007-05-30 삼성전자주식회사 프레임 소거 은닉장치 및 방법, 및 이를 이용한 음성복호화 방법 및 장치
US7546237B2 (en) * 2005-12-23 2009-06-09 Qnx Software Systems (Wavemakers), Inc. Bandwidth extension of narrowband speech
JP5126145B2 (ja) * 2009-03-30 2013-01-23 沖電気工業株式会社 帯域拡張装置、方法及びプログラム、並びに、電話端末
EP2444966B1 (en) * 2009-06-19 2019-07-10 Fujitsu Limited Audio signal processing device and audio signal processing method
JP5493655B2 (ja) * 2009-09-29 2014-05-14 沖電気工業株式会社 音声帯域拡張装置および音声帯域拡張プログラム
JP5511839B2 (ja) * 2009-10-26 2014-06-04 パナソニック株式会社 トーン判定装置およびトーン判定方法
CN101763859A (zh) * 2009-12-16 2010-06-30 深圳华为通信技术有限公司 音频数据处理方法、装置和多点控制单元
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US9245538B1 (en) * 2010-05-20 2016-01-26 Audience, Inc. Bandwidth enhancement of speech signals assisted by noise reduction
KR101461774B1 (ko) * 2010-05-25 2014-12-02 노키아 코포레이션 대역폭 확장기
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
JP5589631B2 (ja) * 2010-07-15 2014-09-17 富士通株式会社 音声処理装置、音声処理方法および電話装置
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
CN102436820B (zh) 2010-09-29 2013-08-28 华为技术有限公司 高频带信号编码方法及装置、高频带信号解码方法及装置
CN102610231B (zh) 2011-01-24 2013-10-09 华为技术有限公司 一种带宽扩展方法及装置
EP2716021A4 (en) * 2011-05-23 2014-12-10 Nokia Corp SPATIAL AUDIOVERING DEVICE
PT2951815T (pt) * 2013-01-29 2018-03-29 Fraunhofer Ges Forschung Codificadores de áudio, descodificadores de áudio, sistemas, métodos e programas de computador utilizando uma resolução temporal aumentada na proximidade temporal de inícios ou cessações de fricativos ou africativos
KR101864122B1 (ko) 2014-02-20 2018-06-05 삼성전자주식회사 전자 장치 및 전자 장치의 제어 방법
KR102318763B1 (ko) 2014-08-28 2021-10-28 삼성전자주식회사 기능 제어 방법 및 이를 지원하는 전자 장치
KR102372188B1 (ko) * 2015-05-28 2022-03-08 삼성전자주식회사 오디오 신호의 잡음을 제거하기 위한 방법 및 그 전자 장치

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
US6219642B1 (en) * 1998-10-05 2001-04-17 Legerity, Inc. Quantization using frequency and mean compensated frequency input data for robust speech recognition
EP1147515A1 (en) * 1999-11-10 2001-10-24 Koninklijke Philips Electronics N.V. Wide band speech synthesis by means of a mapping matrix
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
US6898566B1 (en) * 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
DE10041512B4 (de) * 2000-08-24 2005-05-04 Infineon Technologies Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
US20020128839A1 (en) * 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
JP4433668B2 (ja) * 2002-10-31 2010-03-17 日本電気株式会社 帯域拡張装置及び方法
US20040138876A1 (en) * 2003-01-10 2004-07-15 Nokia Corporation Method and apparatus for artificial bandwidth expansion in speech processing
EP1599992B1 (en) * 2003-02-27 2010-01-13 Telefonaktiebolaget L M Ericsson (Publ) Audibility enhancement

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100905585B1 (ko) * 2007-03-02 2009-07-02 삼성전자주식회사 음성신호의 대역폭 확장 제어 방법 및 장치
US8311842B2 (en) 2007-03-02 2012-11-13 Samsung Electronics Co., Ltd Method and apparatus for expanding bandwidth of voice signal

Also Published As

Publication number Publication date
DE602005015588D1 (de) 2009-09-03
ATE437432T1 (de) 2009-08-15
ES2329060T3 (es) 2009-11-20
EP1766615B1 (en) 2009-07-22
US20050267741A1 (en) 2005-12-01
CN1985304A (zh) 2007-06-20
EP1766615A2 (en) 2007-03-28
US8712768B2 (en) 2014-04-29
WO2005115077A3 (en) 2006-03-16
BRPI0512160A (pt) 2008-02-12
WO2005115077A2 (en) 2005-12-08
KR100909679B1 (ko) 2009-07-29
CN1985304B (zh) 2011-06-22

Similar Documents

Publication Publication Date Title
KR100909679B1 (ko) 강화된 인위적 대역폭 확장 시스템 및 방법
US6810273B1 (en) Noise suppression
US7058572B1 (en) Reducing acoustic noise in wireless and landline based telephony
US7492889B2 (en) Noise suppression based on bark band wiener filtering and modified doblinger noise estimate
US8229106B2 (en) Apparatus and methods for enhancement of speech
RU2471253C2 (ru) Способ и устройство для оценивания энергии полосы высоких частот в системе расширения полосы частот
US8219389B2 (en) System for improving speech intelligibility through high frequency compression
EP2517202B1 (en) Method and device for speech bandwidth extension
US8200499B2 (en) High-frequency bandwidth extension in the time domain
US8326617B2 (en) Speech enhancement with minimum gating
EP0681730A1 (en) Transmitted noise reduction in communications systems
EP1769492A1 (en) Comfort noise generator using modified doblinger noise estimate
EP1279163A1 (en) Speech presence measurement detection techniques
WO1998058448A1 (en) Method and apparatus for low complexity noise reduction
JP4509413B2 (ja) 電子機器

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130701

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140703

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20150619

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20160616

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20170616

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee