KR19980701399A - 통신 시스템에서 노이즈를 억압하는 방법 및 장치 - Google Patents

통신 시스템에서 노이즈를 억압하는 방법 및 장치 Download PDF

Info

Publication number
KR19980701399A
KR19980701399A KR1019970704788A KR19970704788A KR19980701399A KR 19980701399 A KR19980701399 A KR 19980701399A KR 1019970704788 A KR1019970704788 A KR 1019970704788A KR 19970704788 A KR19970704788 A KR 19970704788A KR 19980701399 A KR19980701399 A KR 19980701399A
Authority
KR
South Korea
Prior art keywords
estimate
noise
channel
frames
spectrum
Prior art date
Application number
KR1019970704788A
Other languages
English (en)
Other versions
KR100286719B1 (ko
Inventor
제임스 피. 애슐리
Original Assignee
모토롤라, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 모토롤라, 인크. filed Critical 모토롤라, 인크.
Publication of KR19980701399A publication Critical patent/KR19980701399A/ko
Application granted granted Critical
Publication of KR100286719B1 publication Critical patent/KR100286719B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B15/00Suppression or limitation of noise or interference
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Noise Elimination (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

통신 시스템(700)에 구현된 노이즈 억압 시스템(109)는 배경 노이즈 레벨(background noise level)이 급격히 증가하는 경우에 개선된 갱신 결정(improverd update decision)을 제공한다. 노이즈 억압 시스텝(109)는 스펙트럼 에너지의 편차를 계속적으로 모니터하고 기선정된 문턱 기준에 근거하여 갱신을 강제함으로써 갱신을 발생한다. 스펙트럼 에너지 편차는 지수적으로 가중된 전력 스펙트럼 성분의 과거 값들을 갖는 요소를 이용함으로써 결정된다. 지수적 가중(exponential weighting)은 현재의 입력 에너지의 함수이며, 이는 입력 신호 에너지가 더 높을 수록 지수 윈도우(exponential window)가 더 길어지게 됨을 의미한다. 역으로, 신호 에너지가 낮아질수록 지수 윈도우는 더 짧아지게 된다. 노이즈 억압 시스템(109)는 또한 연속적이고 유동적인 입력 신호들(continuous, nos-stationary input signals)(대기중 송출 음악(music-on-hold) 등)의 기간 동안에는 강제 갱신(forced update)을 금지한다.

Description

[발명의 명칭]
통신 시스템에서 노이즈를 억압하는 방법 및 장치
[기술분야]
본 발명은 일반적으로 노이즈 억압(noise suppression)에 관한 것으로서, 보다 상세하게는 통신 시스템에서의 노이즈 억압에 관한 것이다.
[배경기술]
통신 시스템에서의 노이즈 억압 기술은 잘 알려져 있다. 노이즈 억압 기술의 목표는 음성 코딩(speech coding) 동안에 배경 노이즈(background noise)의 양을 저감시킴으로써 사용자의 코딩된 음성 신호의 전체적인 품질을 향상시키려는 것이다. 음성 코딩을 구현하는 통신 시스템으로는 음성 메일 시스템, 셀룰러 무선 전화 시스템, 중계 통신 시스템(trunked communication systems), 항공기 통신 시스템(airline communication systems) 등이 있지만, 이에 한정되는 것은 아니다.
셀룰러 무선 전화 시스템에서 구현된 한 노이즈 억압 기술이 스펙트럼 감산법(spectral subtraction)이다. 이 방법에서는, 오디오 입력이 적당한 스펙트럼 분할기(spectral divider)에 의해 개개의 스펙트럼 대역(채널)로 분할되고, 이 개개의 스펙트럼 채널들은 그 다음에 각 채널의 노이즈 에너지 함유량(noise energy content)에 따라 감쇄(attenuate)된다. 스펙트럼 감산법은 배경 노이즈 전력 스펙트럼 밀도의 추정값을 이용하여 각 채널에서의 음성의 신호 대 잡음비(SNR)을 발생하며, 이 신호 대 잡음비는이어서 각각의 개별 채널에 대한 이득 인자(gain factor)를 계산하는데 사용된다. 이 이득 인자는 그 다음에 개별 스펙트럼 채널들 각각에 대한 채널 이득을 수정하기 위한 입력으로서 사용된다. 채널들은 그 다음에 재결합되어 노이즈 억압된 출력 파형을 생성한다. 아날로그 셀룰러 무선 전화 시스템에서 구현된 스펙트럼 감산법의 일례는 본 출원의 양수인에게 양도된 빌머(Vilmur)의 미국 특허 제 4,811,404호에서 발견된다.
상기한 미국 특허에 기술되어 있는 바와 같이, 종래의 노이즈 억압 기술들은 배경 노이즈 레벨이 갑작스럽게 엄청나게 증가하면 어려움이 있었다. 종래 기술에서의 결점들을 극복하기 위하여, 상기한 빌머의 미국 특허는 배경 노이즈 추정값 갱신 없이 M개의 프레임이 경과한 경우에는 음성 미터합(voice metric sum)에 관계없이 노이즈 추정값을 강제적으로 갱신한다(여기서, M은 빌며 발명에서는 50 내지 300으로 할 것을 권고하고 있다). 빌머 발명에서 프레임은 10밀리초(ms)이고, M은 100으로 가정하고 있기 때문에, 갱신은 음성 미터합, VMSUM에 관계없이(즉, 갱신이 필요하든 않든 간에) 초당 적어도 한번 일어난다.
음성 미터(voice metric)에 관계없이 노이즈 에측값을 강제로 갱신하게 되면 어떤 추가적인 배경 노이즈도 부가되지 않았음에도 불구하고 사용자의 음성 신호의 감쇄(attenuation)가 일어난다. 이것은 차례로 최종 사용자가 인식하는 오디오 품질에 있어서의 열화를 가져온다. 게다가, 사용자의 음성 신호가 아닌 다른 입력 신호들(예를 들면, 대기중 송출 음악(music-on-hold)이 노이즈 추정값의 강제 갱신(forced update)이 연속하는 구간들에 걸쳐 일어날 수 있다는 점에서 문제를 야기시킬 수 있다. 이것은 음악이 배경 노이즈 추정값(background noise estimate)의 정상적인 갱신(normal update)을 가능하게 하는 충분한 중지(pause)없이 몇초(또는 몇분)동안 계속될 수 있다는 사실에 기인한다. 그러므로, 종래 기술은 배경 노이즈와 비정상 상태의 입력 신호(non-stationary input signals)를 구별하기 위한 어떤 메카니즘도 없기 때문에 M개의 프레임마다 강제 갱신을 하게 된다. 이러한 실요성없는 강제 갱신은 입력 신호를 감쇄시킬 뿐만 아니라 중대한 왜곡을 야기시키게 되는데 그 이유는 스펙트럼 추정값이 시간에 따라 변동하는 비정상 상태의 입력에 근거하여 갱신되고 있기 때문이다.
따라서, 통신 시스템에서 사용하기 위한 보다 정확하게 신뢰성있는 노이즈 억압 시스템이 필요하게 된다.
[도면의 간단한 설명]
도 1은 통신 시스템에서 사용하기 위한 음성 코더(speech coder)의 일반적인 블럭선도.
도 2는 본 발명에 따른 노이즈 억압 시스템의 일반적인 블럭선도.
도 3은 본 발명에 따른 노이즈 억압 시스템에서 일어나는 프레임-대-프레임 중복(frame-to-frame overlap)을 도시한 도면.
도 4는 본 발명에 따른 노이즈 억압 시스템에서 일어나는 프리앰퍼시스된 샘플들의 사다리꼴 윈도잉(trapezoidal windowing of preemphasized samples)을 나타낸 도면.
도 5는 본 발명에 따른 노이즈 억압 시스템에서 사용되는 것으로서 도 2에 도시된 스펙트럼 편차 추정기(spectral deviation estimator)의 일반적인 블럭선도.
도 6은 본 발명에 따른 노이즈 억압 시스템에서 사용되는 것으로서 도 2에 도시된 갱신 결정 판정기(update deecision determiner)에서 수행되는 단계들의 흐름선도.
도 7은 본 발명에 따른 노이즈 억압 시스템을 유익하게 구현할 수 있는 통신 시스템의 블럭도.
도 8은 종래 기술에 의해 구현된 음성 신호(voice signal)의 노이즈 억압에 관련한 변수들을 나타낸 도면.
도 9는 본 발명에 따른 노이즈 억압 시스템에 의해 구현된 음성 신호의 노이즈 억압에 관련한 변수들을 나타낸 도면.
도 10은 종래 기술에 의해 구현된 음악 신호의 노이즈 억압에 관련한 변수들을 나타내 도면.
도 11은 본 발명에 따른 노이즈 억압 시스템에 의해 구현된 음악 신호의 노이즈 억압에 관련한 변수들을 나타낸 도면.
[발명의 상세한 설명]
통신 시스템에서 구현된 노이즈 억압 시스템은 배경 노이즈 레벨이 급격히 증가하는 일이 있는 경우에 개선된 갱신 결정을 제공한다. 노이즈 억압 시스템은 특히 스펙트럼 에너지의 편차를 계속적으로 모니터하여 기선정된 문턱값 기준에 근거하여 갱신을 강제함으로써 갱신을 일으킨다. 스펙트럼 에너지 편차(spectral energy deviation)는 지수적으로 가중된 전력 스펙트럼 성분들의 과거값들을 갖는소자들을 이용함으로써 결정된다. 지수적 가중(exponential weighting)은 현재의 입력 에너지의 함수이며, 이는 입력 신호 에너지가 높을 수록 지수 윈도우(exponential window)가 더 길어짐을 의미한다. 역으로, 신호 에너지가 낮아질수록 지수 윈도우는 더 짧아진다. 그에 의해, 노이즈 억압 시스템은 연속적인 비정상 상태의 입력 신호들(대기중 송출 음악)의 기간 동안에는 강제 갱신을 금지한다.
일반적으로 말하면, 음성 코더는 통신 시스템에 노이즈 억압 시스템을 구현한다. 통신 시스템은 채널들에서의 정보의 프레임들을 사용하여 음성 샘플들을 전송하며, 채널들에서의 정보의 프레임들은 그 안에 노이즈를 갖고 있다. 음성 코더는 입력으로서 음성 샘플들을 가지며, 노이즈 억압된 음성 샘플들을 발생시키기 위해 현재의 음성 샘플들의 프레임과 복수의 음성 샘플들의 과거의 프레임들의 평균스펙트럼 에너지간의 편차에 근거하여 노이즈를 억압된 음성 샘플들을 코딩하기 위한 수단은 그 다음에 통신 시스템에 의해 전송하기 위하여 노이즈 억압된 음성 샘플들을 코딩하게 된다. 양호한 실시예에서는, 음성 코더는 통신 시스템의 중앙집중식 기지국 제어기(centralized base station controller, CBSC), 또는 이동국(mobile station, MS)에 위치한다. 그러나, 다른 실시예들에서는, 음성 코더는 이동 교환 센터(mobile switching center, MSC) 또는 기지국 트랜시버(base transeciver station, BTS)에 위치할 수도 있다. 또한, 양호한 실시예에서는, 음성 코더는 코드 분할 다중 접속(CDMA) 통신 시스템에 구현되지만, 기술 분야의 통상의 지식을 가진 자라면 본 발명에 따른 음성 코더 및 노이즈 억압 시스템은 다른 여러가지 유형의 통신 시스템에 적용된다는 것을 잘 알 것이다.
양호한 실시예에서, 한 프레임의 음성 샘플들내의 노이즈를 억압하기 위한 수단은 채널 에너지의 추정값에 근거하여 현재의 음성 샘플들의 프레임내의 총 채널 에너지를 추정하기 위한 수단 및 채널 어너지의 추정값에 근거하여 현재의 음성 샘플들의 프레임의 스펙트럼의 에너지를 추정하는 수단을 포함하고 있다. 또한, 현재의 프레임의 스펙트럼의 전력의 추정값에 근거하여 복수의 과거의 음성 샘플들의 프레임들의 스펙트럼의 전력을 추정하는 수단도 포함하고 있다. 이 정보를 가지고서 현재의 프레임의 스펙트럼의 추정값과 복수의 과거 프레임들의 스펙트럼의 전력의 추정값 사이의 편차를 결정하기 위한 수단은 상기한 바와 같이 스펙트럼 편차를 결정하며, 이 결정된 편차와 총 채널 에너지의 추정값에 근거하여 채널의 노이즈 추정값을 갱신하는 수단은 갱신을 행한다. 노이즈 추정값의 갱신에 근거하여, 채널의 이득을 수정하기 위한 수단은 노이즈 억압된 음성 샘플들을 발생시키기 위해 채널의 이득을 수정한다.
양호한 실시예에서, 정보의 복수의 과거 프레임들의 스펙트럼의 전력을 추정하기 위한 수단은 또한 정보의 과거 프레임들의 지수 가중에 근거하여 복수의 과거 프레임들의 스펙트럼의 전력을 추정하기 위한 수단을 더 구비하며, 여기서 정보의 과거 프레임들의 지수 가중은 정보의 현재 프레임내의 총 채널 에너지의 추정값의 함수이다. 또한, 양호한 실시예에서는, 총 채널 에너지의 추정값과 상기 결정된 편차에 근거하여 채널의 노이즈 추정값을 갱신하기 위한 수단은 총 채널 에너지의 추정값과 제 1문턱값의 비교 및 상기 결정된 편차와 제 2문턱값의 비교에 근거하여 채널의 노이즈 추정값을 갱신하기 위한 수단을 더 구비하고 있다. 보다 상세하게 말하면, 총 채널 에너지의 추정값과 제 1문턱값의 비교 및 상기 결정된 편차와 제 2문턱값의 비교에 근거하여 채널의 노이즈 추정값을 갱신하기 위한 수단은, 총 채널에너지의 추정값이 제 1문턱값보다 작거나 같은 총 채널 에너지의 추정값을 갖는 제 2의 기선정된 수의 연속한 프레임이 없는 제 1의 기선정된 수의 프레임들에 대해 제 1문턱값보다 클 때, 및 상기 결정된 편차가 제 2문턱값 이하일 때, 채널의 노이즈 추정값을 갱신하기 위한 수단을 더 구비하고 있다. 양호한 실시예에서는, 제 1의 기선정된 수의 프레임은 50프레임인 반면, 제 2의 기선정된 수의 연속한 프레임들은 6프레임이다.
도 1은 통신 시스템에 사용하기 위한 음성 코더(speech coder, 100)의 블럭선도를 도시한 것이다. 양호한 실시예에서, 음성 코더(100)은 장점 표준(Interim Standard, IS) 95에 적합한 코드 분할 다중 접속(CDMA) 통신 시스템에서 노이즈를 억압하는데 적절한 가변 레이트 음성 코더(variable rate speech coder, 100)이다.
IS-95에 대한 더 많은 정보를 위해서는, 참고로 여기에 포함시킨 TIA/EIA/IS-95, 1993년 7월의 이중 모드 광대역 확산 스펙트럼 셀룰러 시스템에 대한 이동국-기지국 호환 규격(Mobile Station-Base Station Compatibility Standard for Dual Mode Wideband Spread Spectrum Cellular System)을 참조하기 바란다. 또한, 양호한 실시예에서는, 가변 레이트 음성 코더(100)은 IS-95에 의해 허용된 4가지 비트 레이트 중 3가지 즉 풀-레이트(레이트 1-170비트/프레임), 1/2 레이트(레이트 1/2-80비트/프레임), 및 1/8 레이트(레이트 1/8-16비트/프레임)를 지원한다. 기술 분야에 통상의 지식을 가진 자라면 잘 알 수 있는 바와 같이, 이후부터 기술되는 실시예는 단지 예시적인 것일 뿐이다; 음성 코더(100)는 다른 많은 유형의 통신 시스템에도 적합하다.
도 1을 참조하면, 노이즈 억압된 음성 샘플(102)를 코딩하기 위한 수단은 기술 분야에 공지된 잔차 코드-여기 선형 예측(Residual Code-Excited Linear Prediction, RCELP) 알고리즘에 근거하고 있다. RCELP에 관한 보다 많은 정보를 위해서는, 더블유. 비. 클라이진(W.B.Kleijn), 피.크룬(P. Kroon), 및 디. 나후미(D. Nahumi)의 RCELP 음성-코딩 알고리즘(The RCELP Speech-Coding Algorithm), European Transactions on Telecommunications, Vol. 5, No. 5, 1994년 9월/10월호, pp. 573-582를 참조하기 바란다. CDMA 환경에서 가변 레이트 동작 및 견고성(robustness)을 위해 적절히 수정된 RCELP 알고리즘에 관한 더 많은 정보를 위해서는, 디 나후미(D. Nahumi) 및 더블유. 비. 클라이진(W.B Kleijn)의 개선된 8kb/s RCELP 코더(An Improved 8kb/s RECLP coder), Proc ICASSP 1995를 참조하기 바란다. RECLP는 코드-여기 선형 예측(CELP) 알고리즘을 일반화시킨 것이다. CELP 알고리즘에 관한 더 많은 정보를 위해서는, 비. 에스. 아탈(B.S. Atal) 및 엠.알. 쉬뢰더(M.R. Schroeder)의 아주 낮은 비트 레이트에서의 통계적 음성 코딩(Stochastic coding of speech at very low bit rates), Proc Int, Conf, Comm., Amsterdam, 1984, pp 1610-1613을 참조하기 바란다. 상기한 참조 문헌 각각은 참고로 여기에 포함시켰다.
상기 참조 문헌들이 CELP/RCELP 알고리즘에 대한 완벽한 이해를 제공하기는 하지만, RCELP 알고리즘의 동작을 간단히 설명하는 것이 도움이 될 것이다. CELP 코드와는 달리, RCELP는 원래의 사용자의 음성 신호에 정확하게 일치(match)시키려고 하지는 않는다. 그 대신에, RECLP는 사용자의 음성 신호의 단순화된 피치 칸투어(simplified pitch contour)와 동등한 원래의 잔차(original residual)의 시간-와 핑된 것(time-warped version)에 일치시킨다. 사용자의 음성 신호의 피치 칸투어는 각 프레임에서 한번씩 피치 지연을 추정하고 프레임마다 피치를 선형 보간함으로써 얻어진다. 이러한 단순화된 피치 표현법을 사용하는 것의 잇점은 종래의 단편적인 피치 방법을 사용할 때보다 통계적 여기 및 채널 손상 보호(stochastic excitation and channel impairment protection)를 위해 각 프레임에서 이용할 수 있는 비트가 더 많다는 것이다. 이 결과 클리어 채널 조건(clear channel conditions)에서 인지된 음성 품질에 영향을 주지 않고 프레임 에러 성능을 향상시키게 된다.
도 1을 참조하면, 음성 코더(100)로의 입력은 음성 신호 벡터 s(n)(103) 및 외부 레이트 명령 신호(external rate command signal, 106)가 있다. 음성 신호 벡터(103)은 아날로그 입력으로부터 8000 샘플/초의 레이트로 샘플링하고 이 결과 생기는 음성 샘플들을 적어도 13비트의 다이나믹 레인지(dynamic range)로 선형(균일하게) 양자화함으로써 생성될 수 있다. 그 대신에, 음성 신호 벡터(103)은 8비트 ITU-T 권고안 G. 711에서의 표 2에 따라 균일한 펄스 코드 변조(PCM) 포맷으로 변환함으로써 8비트 μlaw 입력으로부터 생성될 수 있다. 외부 레이트 명령 신호(106)은 코더에 블랭크 패킷 또는 레이트 1패킷 이외의 것을 생성하도록 지시할 수 있다. 외부 레이트 명령 신호(106)이 수신되면, 그 신호(106)은 음성 코더(100)의 내부 레이트 선택 메카니즘(internal rate selection mechanism)을 ????한다.
입력 음성 벡터(103)는 양호한 실시예에서는 노이즈 억압 시스템(109)인 노이즈 억압 수단(101)에 제공된다. 노이즈 억압 시스템(109)는 본 발명에 따라 노이즈 억압을 수행한다. 노이즈 억압된 음성 벡터 s′(n)(112)는 그 다음에 레이트 결정 모듈(rate determination module, 115)와 모델 파라메타 추정 모듈(model parameter estimation module)(118) 양쪽에 제공된다. 레이트 결정 모듈(115)는 발생할 패킷의 타입(레이트 1/8, 1/2 또는 1)을 결정하기 위해 음성 활동 검출(voice activity detection, VAD) 알고리즘과 레이트 선택 로직(rate selection logic)을 적용한다. 모델 파라메타 추정 모듈(118)은 모델 파라메타(121)을 생성하기 위해 선형 예측 코딩(linear predictive coding, LPC) 분석을 수행한다. 모델 파라메타는 선형 예측 계수들(linear prediction coefficients, LPC)의 집합과 최적 피치 지연(optimal pitch delay) (t)를 포함한다. 모델 파라메타 추정 모듈(118)은 또한 LPC를 라인 스펙트럼 쌍(line spectral pairs, LSP)으로 변환하여 장기간 및 단기간 예측 이득(long and short-term prediction gaims)을 산출한다.
모델 파라메타(121)은 선택된 레이트에 적합한 방식으로 여기 신호를 특성화 하고 모델 파라메타를 양자화하는 가변 레이트 코딩 모듈(variable rate coding module characterizes the excitation signal and quantizes the model parameters)(24)에 입력된다. 레이트 정보는 가변 레이트 코딘 모둘(124)에도 입력되는 레이트 결정 신호(139)로부터 얻어진다. 레이트 1/8이 선택된 경우에는, 가변 레이트 코딩 모듈(124)는 음성 잔차(speech residual)에서의 어떤 주기성도 특성화하려고 하지 않게 되지만, 그 대신에 그의 에너지 칸투어(energy contour)를 간단히 특성화시키게 된다. 레이트 1/2과 레이트 1에 대해서는, 가변 레이트 코딩 모듈(variable rate coding module)(124)는 원래의 사용자의 음성 신호 잔차의 시간-와핑된 것(a time-warped version of the original user′s speech signal residual)에 매칭시키기 위해 RCELP 알고리즘을 적용한다. 코딩 후에, 패킷 포맷팅 모듈(packet formatting module)(133)은 가변 레이트 코딩 모듈(124)에서 산출되거나 양자화된 모든 파라메타들을 억셉트하여 선택된 레이트에 적합한 패킷(136)을 포맷한다. 포맷된 패킷(136)은 그 다음에 레이트 결정 신호(rate decision signal)(139)처럼 추가 처리를 위해 다중 서브-계층(multiplex sub-layer)으로 보내진다. 음성 코더(100)의 전체적인 동작에 대한 추가적인 동작에 대한 추가적인 상세한 것에 대해서는, 여기에 참조로 포함한 IS-127 문서 EVRC 규격 초안(IS-127), 제 1판, 기고 번호 TR45.5.1.1/95.10.17.06, 1995년 10월 17일을 참조하기 바란다.
도 2는 본 발명에 다른 개선된 노이즈 억압 시스템(109)의 블럭선도를 나타낸 것이다. 양호한 실시예에서, 노이즈 억압 시스템(109)는 음성 코더(100)의 모델 파라메타 추정 모듈(model parameter estimation module)(118)과 레이트 결정 모듈(rate determination module)(115)에 보내지는 신호 품질을 개선시키는데 사용된다. 그러나, 노이즈 억압 시스템(109)의 동작은 설계 엔지니어가 특정의 통신 시스템에서 구현하고자 할 수 있는 어떤 타입의 음성 코더와도 동작할 수 있다는 점에서 범용적이다. 본 출원의 도 2에 도시된 몇개의 블럭은 빌머(Vilmur)의 미국 특허 제 4,811,404호의 도 1에 도시된 대응 블럭과 유사한 동작을 갖는다는 것에 주의해야 한다. 이와 같이, 본 출원의 양수인에게 양도된 빌머의 미국 특허 제 4,811,404호는 참고로 여기에 포함한다.
노이즈 억압 시스템(109)는 고역 통과 필터(HPF)(200)과 나머지 노이즈 억압 회로를 구비하고 있다. HPF(200)의 출력 Shp(n)은 나머지 노이즈 억압 회로로의 입력으로서 사용된다. 음성 코더의 프레임 사이즈가 20ms(IS-95에 의해 정의됨)이지만, 나머지 노이즈 억압 회로에 대한 프레임 사이즈는 10ms이다. 따라서, 양호한 실시예에서는, 본 발명에 따라 노이즈 억압을 수행하는 단계들은 20ms의 음성 프레임당 2번씩 실행된다.
본 발명에 따라 노이즈 억압을 시작하기 위해, 입력 신호 s(n)은 신호 shp(n)을 생성하기 위해 고역 통과 필터(HPF)(200에 의해 고역 통과 필터링된다. HPF(200)은 기술 분야에서 공지되어 있는 4차 체비셰프 타입 Ⅱ로서 차단 주파수는 120Hz이다. HPF(200)의 전달 함수는 다음과 같이 정의된다:
여기서, 각각의 분자 계수와 분모 계수는 다음과 같이 정의된다:
a={0.898025036, -3.59010601, 5.38416243, -3.59010601, 0.898024917},
b={1.0, -3.78284979, 5.37379122, -3.39733505, 0.806448996}.
당업자라면 잘 알고 있는 바와 같이, 임의의 수의 고역 통과 필터 구성을 사용할 수 있다.
다음에, 프리앰퍼시스 블럭(preemphasis block)(203)에서, 신호 shp(n)는 평활화된 사다리꼴 윈도우(a smoothed trapezoid window)를 사용하여 윈도잉되며, 여기서 입력 프레임(프레임 m)의 처음 D개의 샘플들 d(m)은 이전의 프레임(프레임 m-1)의 마지막 D개의 샘플들과 중첩된다. 이 중첩은 도 3에 잘 도시되어 있다. 달리 언급하지 않는 한, 모든 변수들은 0의 초기값, 예를 들어 d(m) = 0; m ≤ 0을 갖는다. 이것은 다음과 같이 기술할 수 있다:
d(m, n) = d(m-1, L+n); o ≤ n ≤ D,
여기에서, m은 현재의 프레임이고, n은 버퍼{d(m)}에 대한 샘플 인덱스이며, 1=80은 프레임 길이이고, D=24는 샘플들에서의 중첩(또는 지연)이다. 입력 버퍼의 나머지 샘플들은 그 다으멩 이하에 따라 프리앰퍼시스된다:
d(m, D+n) = shp(n) + ζpshp(n-1); 0 ≤ n L,
여기서, ζp= 0.8은 프리앰퍼시스 인자(preemphasis factor)이다. 이 결과 입력 버퍼는 L + d = 104개의 샘플을 포함하게 되며, 여기서 처음 D개의 샘플은 이전의 프레임으로부터의 프리앰프시스된 중첩이고, 다음 L개의 샘플들은 현재의 프레임으로부터의 입력된 것이다.
다음에, 도 2는 윈도잉 블럭(windowing block)(204)에서 평활화된 사다리꼴윈도우(400) (도 4)는 이산 푸리에 변환(Discrete Fourier Transform(DFT))입력 신호 g(n)를 형성하기 위해 샘플들에 적용된다. 양호한 실시예에서, g(n)은 다음과 같이 정의된다:
여기서, M= 128은 DFT 시퀀스 길이(sequence length)이고, 다른 모든 항들은 이미 정의된 것들이다.
도 2의 채널 분할기(channel divider)(206)에서 g(n)의 주파수 영역으로의 변환은 다음과 같이 정의된 이산 푸리에 변환(DFT)를 사용하여 수행된다:
여기서, e는 순간 반경 위치가 ω인 단위 진폭 복소 페이저(a unit amplitude complex phasor with instantaneous radial position ω)이다. 이것은 비정형적인 정의이지만, 복소 고리 푸리에 변환(FFT)의 효율성을 활용한 것이다. 2/M 스케일 인자(scale factor)는 M/2 포인트 복소 FFT를 사용하여 변환되는 M/2 포인트 복소 시퀀스(complex sequence)를 형성하기 위해 M 포인트 실수 시퀀스를 프리컨디션(precondition the M point real sequence)함으로써 생긴 것이다. 양호한 실시예에서, 신호 G(K)는 65개의 고유 채널(65 unique channels)로 이루어져 있다. 이 기술에 대한 상세한 것은 프로아키와 마노라키스(Proakis and Manolakis)의 저서 디지탈 신호 처리 입문(Introduction to Digital Signal Processing), 제 2판, 뉴욕 맥밀란, 1988, 721-722 페이지에서 찾을 수 있다.
신호 G(k)는 그 다음에 채널 에너지 추정기(channel energy estimator)(109)에 입력되어 그곳에서 현재의 프레임 m에 대한 채널 에너지 추정값(channel energy estimate) Ech(m)이 이하의 식을 사용하여 결정된다:
여기서, Emin= 0.0625는 최소 허용 채널 에너지(minimum allowable channel energy)이고, αch(m)은 채널 에너지 평활화 인자(channel energy smoothing factor) (이하에서 정의됨)이고, Nc= 16은 결합된 채널의 수(number of combined channels)이며, fL(i)와 fH(i)는 각각의 로우 및 하이 채널 결합 테이블(low and high channel combining tables) fL와 fH의 i번째 요소이다. 양호한 실시예에서, fL와 fH는 다음과 같이 정의된다:
fL= {2, 4, 6, 8, 10, 12, 14, 17, 20, 23, 27, 31, 36, 42, 49, 56}
fH= {3, 5, 7, 9, 11, 13, 16, 19, 22, 26, 30, 35, 41, 48, 55, 63}
채널 에너지 평활화 인자 αch(m)은 다음과 같이 정의할 수 있다:
이것은 αch(m)이 첫번째 프레임(m=1)에 대해서는 영의 값을, 차후의 모든 프레임들에 대해서는 0.45의 값을 취함을 의미한다. 이렇게 함으로써 채널 에너지 추정값은 첫번째 프레임의 필터링되지 않은 채널 에너지로 초기화될 수 있다. 게다가, 채널 노이즈에너지 추정값(아하에 정의됨)은 첫번째 프레임의 채널 에너지로 초기화되어야만 한다. 즉
En(m, i) = max {Einit, Ech(m, i)} ; m = 1, 0 ≤ i Nc,
여기서, Einit는 최소 허용 채널 노이즈 초기화 에너지(minimum allowagle channel noise initialization energy)이다.
현재의 프레임에 대한 채널 에너지 추정값 Ech(m)은 다음에 양자화된 채널 신호-대-잡음비(signal-to-noise ratio)(SNR) 인덱스를 추정하는데 사용된다. 이 추정은 도 2의 채널 SNR 추정기(218)에서 수행되며, 다음과 같이 결정된다:
여기서, En(m)은 현재의 채널 노이즈 에너지 추정값(이후에 정의됨)이고, {σq}의 값들은 0이상 89이하로 한정된다.
채널 SNR 추정값 {σq}를 사용하여, 음성 메트릭의 합계(the sum of the voice metrics)가 이하의 식을 사용하여 음성 메트릭 산출기(voice metric calculator)(215)에서 결정된다:
여기서, V(k)는 다음과 같이 정의된 90 요소 음성 메트릭 테이블 V의 k번째 값이다:
V = {2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 5, 5, 5,
6, 6, 7, 7, 7, 8, 8, 9, 9, 10, 10, 11, 12, 12, 13, 13, 14, 15, 15, 16,
17, 17, 18, 19, 20, 20, 21, 22, 23, 24, 24, 25, 26, 27, 28, 28, 29, 30,
31, 32, 33, 34, 35, 36, 37, 37, 38, 39, 40. 41, 42, 43, 44, 45, 46, 47
48, 49, 50, 50, 50, 50, 50, 50, 50, 50, 50, 50}.
현재의 프레임에 대한 채널 에너지 추정값 Ech(m)도 또한 스펙트럼 편차 ΔE(m)을 추정하는 스펙트럼 편차 추정기(spectral deviation estimator)(210)으로의 입력으로서 사용된다. 도 5를 참조하면, 채널 에너지 추정값 Ech(m)이 로그 전력 스펙트럼 추정기(log power spectral estimator)(500)으로 입력되며, 여기서 로그 전력 스펙트럼(log power spectra)은 다음과 같이 추정된다:
EdB(m, i) = 10log10(Ech(m, i)); 0 ≤ NC,
현재의 프레임에 대한 채널 에너지 추정값 Ech(m)을 결정하기 위해 총 채널 에너지 추정기(total channel energy estimator)(503)으로 입력된다:
다음에, 지수적 윈도잉 인자(exponential windowing factor), α(m)(총 채널에너지 Etot(m)의 함수)은 이하의 식을 사용하여 지수적 윈도잉 인자 결정기(exponential windowing factor determiner)(506)에서 결정된다:
상기 식은 다음과 같이 αH와 αL사이로 제한된다:
α(m) = max{αL, min{αH,α(m)}},
여기서, EH와 EL는 Etot(m)의 선형 보간을 위한 에너지 양단점(energy endpoints)(단위는 데시벨, 즉(dB) 으로서, 한계값 αL≤ α(m) ≤ αH를 갖는 α(m)으로 변환된다. 이들 상수의 값은 다음과 같이 정의된다: EH=50, EL=30. αH=0.99, αL=0.50. 이러한 경우, 40dB의 상대 에너지를 갖는 신호를 상기 계산을 사용하여 α(m)=0.745의 지수적 윈도잉 인자를 사용하게 된다.
스펙트럼 편차 ΔE(m)은 그 다음에 스펙트럼 편차 추정기(509)에서 추정된다. 스펙트럼 편차 ΔE(m)는 현재의 전력 스펙트럼과 장기간의 평균 전력 스펙트럼 추정값 간의 차이(the differnece between the current power spectrum and an averaged long-term power spectral estimate)이다:
여기서, T-10.1 은 장기간의 평균 전력 스펙트럼 추정값으로서, 이하의 식을 사용하여 장기간 스펙트럼 에너지 추정기(long-term spectral energy estimator) (512)에서 결정된다:
여기서, 모든 변수들은 이미 정의된 것들이다. T-10.1 의 초기값은 프레임 1의 추정된 로그 전력 스펙트럼(estimated log power spectra)으로 정의된다.
즉:
이 시점에서, 음성 메트릭 v(m)의 합산, 현재의 프레임에 대한 총 채널 에너지 추정값 Etot(m) 및 스펙트럼 편차 ΔE(m)이 본 발명에 따라 노이즈 억압을 용이하게 하기 위해 갱신 결정 판별기(update decision determiner)(212)에 입력된다.
이하에 의사 코드로 나타내어져 있고 도 6에 흐름도 형태로 도시된 결정 논리(decision logic)는 어떻게 노이즈 추정값 갱신 결정이 궁극적으로 이루어지는지를 설명한다. 이 과정은 단계(600)에서 시작하여 단계(603)으로 진행해 갱신 플래그(update_flag)가 클리어(clear)된다. 그런 다음에, 단계(604)에서 빌머의 갱신 논리(VMSUM 전용)이 음성 메트릭 v(m)의 합산이 갱신 문턱갑(UPDATE_THLD)보다 작은지 여부를 검사함으로써 구현된다. 음성 메트릭의 합산이 갱신 문턱값보다 작을 경우에는, 갱신 카운터( update_cnt)가 단계(605)에서 클리어되고, 갱신 플레그는 단계(606)에서 세트(set)된다. 단계(603-606)에 대한 의사 코드는 다음과 같다:
update_flag = FALSE;
if(v(m)≤UPDATE_THLD) {
update_flag = TRUE
update_flag = 0
}
음성 메트릭의 합산이 단계(604)에서 갱신 문턱값보다 클 경우에는, 본 발명에 따른 노이즈 억압이 구현된다. 먼저, 단계(607)에서, 현재의 프레임 m에 대한 총 채널 에너지 추정값 Etot(m) 이 단위가 dB인 노이즈 플로어(noise floor in dB) (NOISE_FLOOR_DB)와 비교되고, 스펙트럼 편차 ΔE(m)은 편차 문턱갑(DEV_THLD)와 비교된다. 총 채널 에너지 추정값이 노이즈 플로어보다 더 크고 스펙트럼 편차가 편차 문턱값보다 작을 경우에는, 갱신 카운터는 단계(608)에서 증가된다. 갱신 카운터가 증가된 이후에, 단계(609)에서 갱신 카운터가 갱신 카운터 문턱값(UPDATE_CNT_THLD)보다 크거나 같은지 여부를 판정하기 위한 테스트가 실행된다. 단계(609)에서의 테스트의 결과가 참인 경우에는, 갱신 플래그는 단계(606)에서 세트된다. 단계(607-609)에 대한 의사 코드는 이하와 같다:
else if((Etot(m)NOISE_FLOOR_DB) and (ΔE(m)DEV_THLD)) {
update_cnt = update_cnt +1
if(update_cnt ≥ UPDATE_CNT_THLD)
update_flag = TRUE
}
도 6에서 알 수 있는 바와 같이, 단계(608)과 단계(609)에서의 테스트 중 하나가 거짓인 경우에는, 갱신 카운터의 장기간의 크리핑(creeping)을 방지하기 위한 논리가 구현된다. 이 히스테리시스 논리는 최소 스펙트럼 편차가 장기간에 걸쳐 누적되는 것을 방지하기 위해 구현되며, 무효의 강제 갱신(invalid forced update)을 야기시킨다. 이 과정은 단계(610)에서 시작하며, 이 단계에서는 갱신 카운터가 마지막 6프레임에 대한 마지막 갱신 카운터 값(last_update_cnt)과 같은지 여부를 판정하기 위해 테스트가 실행된다(HYSTER_CNT_THLD). 양호한 실시예에서는, 6프레임이 문턱값으로서 사용되지만, 임의의 수의 프레임이 구현될 수 있다. 단계(610)에서의 테스트가 참인 경우에는, 갱신 카운터가 단계(611)에서 클리어되고, 과정은 단계(612)에서 그 다음 프레임으로 빠져나간다. 단계(610)에서의 테스트가 거짓인 경우에는, 과정은 곧바로 단계(612)에서 그 다음 프레임으로 빠져나간다. 단계(610-612)에 대한 의사 코드는 다음과 같다:
if(update_cnt==last_update_cnt)
hyster_cnt=hyster_cnt+1
else
hyster_cnt=0
last_update_cntHYSTER_CNT_THLD)
update_cnt=0.
양호한 실시예에서는, 이전에 사용된 상수들의 값들은 다음과 같다:
UPDATE_THLD=35,
NOISE_FLOOR_DB=10log10(1),
DEV_THLD=28,
UPDATE_CNT_THLD=50,
HYSTER_CNT_THLD=6.
단계(606)에서 갱신 플레그가 주어진 프레임에 대해 세트되어 있을 때마다, 그 다음 프레임에 대한 채널 노이즈 추정값은 본 발명에 따라 갱신된다. 채널 노이즈 추정값은 이하의 식을 사용하여 평활화 필터(224)에서 갱신된다:
En(m+1, i) = max{EminnEn(m,i) + (1-αn)Ech(m,i)}; 0≤iNc,
여기서, Emin=0.0625는 최소 허용 채널 에너지이고, αn=0.9은 평활화 필터(224)에 국부적으로 저장된 채널 노이즈 평활화 인자(channel noise smoothing factor)이다. 갱신된 채널 노이즈 추정값은 에너지 추정값 저장 장치(energy estimate storage)(225)에 저장되며, 에너지 추정값 저장 장치(225)의 출력은 갱신된 채널 노이즈 추정값 En(m)이 된다. 갱신된 채널 노이즈 추정값 En(m)은 상기한 바와 같이 채널 SNR 추정기(218)로의 입력으로서 사용되며, 이득 산출기(gain calculator)(223)에 대해서도 이하에 기술한다.
다음에는, 노이즈 억압 시스템(109)는 채널 SNR 수정을 해야만 하는지 여부를 판정한다. 이 판정은 인덱스 문턱값을 초과하는 채널 SNR 인덱스값을 갖는 채널들의 수를 카운트하는 채널 SNR 수정기(channel SNR modifier)(227)에서 수행된다. 이 수정 과정 동안에, 채널 SNR 수정기(227)은 저지 문턱값(SETBACK_THLD)보다 작은 SNR 인덱스를 갖는 특정 채널들의 SNR을 감소시키거나 또는 음성 메트릭의 합산이 메트릭 문턱값(MERIC_THLD)보다 작은 경우에는 모든 채널들의 SNR을 감소시킨다. 채널 SNR 수정기(227)에서 일어나는 채널 SNR 수정 과정의 의사 코드 표현이 이하에 제공되어 있다:
index_cnt=0
for(i=NMto Nc-1 step 1) {
if(σq(i)≥INDEX_THLD)
index_cnt=index_cnt+1
}
if(index_cnt INDEX_CNT_THLD)
modify_flag=TRUE
else
modify_flag=FLASE
if(modify_flag==TRUE)
for(i=0 to Nc-1 step 1)
if((v(m)≤METRIC_THLD) or (σq(i)≥SETBACK_THLD))
σ′q(i)=1
else
σ′q(i)=σq(i)
else
{σ′q}={σq}
이 때에, 채널 SNR 인덱스들 {σ′q}는 SNR 문턱값 블럭(230)에서 SNR 문턱값으로 한정된다. 상수 σtn는 SNR 문턱값 블럭(230)에 국부적으로 저장되어 있다. SNR 문턱값 블럭(230)에서 수행되는 과정의 의사 코드 표현이 이하에 주어져 있다:
for(i=0 to Nc-1 step 1)
if(σ′q(i)σtn)
σ″q(i)=σtn
else
σ″q(i)=σq(i)
양호한 실시예에서, 이전의 상수들과 문턱값들은 이하와 같이 주어진다:
NM=5
INDEX_THLD=12,
INDEX_CNT_THLD=5,
METRIC_THLD=45,
SETBACK_THLD=12,
σtn=6.
이 시점에서, 제한된 SNR 인덱스들 {σ″q}는 채널 이득이 결정되는 이득 산출기(233)으로 입력된다. 먼저, 전체 이득 인자가 이하의 식을 사용하여 결정된다:
여기서, γn=-13은 최소 전체 이득이고, Efloor=1은 노이즈 플로어 에너지이고, En(m)은 이전의 프레임 동안에 산출된 추정된 노이즈 스펙트럼이다. 양호한 실시예에서, 상수 γmin과 Efloor는 이득 산출기(233)에 국부적으로 저장된다. 계속하여 채널 이득(단위는 dB)은 이하의 식을 사용하여 결정된다:
γdB(i)=μg(σ″q(i)-σth)+γn; 0≤iNc,
여기서, γs=0.39는 이득 기울기(gain slope)(이득 산출기(233)에 국부적으로 저장됨)이다. 선형 채널 이득은 그 다음에 이하의 식을 사용하여 변환된다:
γch(i)=min{1,10γdB(i)20}; 0 ≤ Nc.
이 시점에서, 상기에서 결정된 채널 이득은 채널 이득 수정기(239)로부터 출력 신호 H(k)를 생성하기 위해 이하의 기준으로 변환된 입력 신호 G(k)에 적용된다:
상기 식에서 그렇지 않은 경우라는 조건은 k의 구간이 0≤M/2인 것으로 가정한다. 게다가, H(k)는 우수 대칭(even symmetric)인 것으로 가정하며, 따라서 이하의 조건도 부가된다:
H(M-k) = H(k); 0kM/2,
신호 H(k)는 그 다음에 (다시) 역 DFT를 사용함으로써 채널 결합기(242)에서 시간 영역으로 변환되며:
이하의 기준에 따른 중첩 가산(overlap-lap-and-add)을 적용함으로써 출력 신호 h′(n)을 생성하기 위해 주파수 영역 필터링 프로세스가 완료된다:
본 발명에 따라 노이즈 억압된 신호 s′(n)을 생성하기 위해 신호 디앰퍼시스가 디앰퍼시스 블럭(245)에 의해 신호 h′(n)에 적용된다:
s′(n)=h′(n)+ζds′(n-1); 0≤nL,
여기서, ζd=0.8은 디앰퍼시스 블럭(245)내에 국부적으로 저장된 디앰퍼시스인자이다.
도 7은 일반적으로 본 발명에 따른 노이즈 억압 시스템을 유익하게 구현할 수 있는 통신시스템(700)의 블럭선도를 나타낸 도면이다.
양호한 실시예에서, 통신 시스템은 코드 분할 다중 접속 셀룰러 무선 전화 시스템(code division multiple access(CDMA) cellular radiotelephone system)이다. 그러나 ,당업자라면 알 수 있는 바와 같이, 본 발명에 따른 노이즈 억압 시스템은 본 시스템으로 득을 보게 되는 임의의 통신 시스템에서 구현될 수 있다. 이러한 시스템으로는 음성메일 시스템(voice mail system), 셀룰러 무선 전화 시스템(cellular radiotelephone system), 중계 통신 시스템(trunked communication system), 항공 통신 시스템(airline communication system) 등이 있지만, 이에 한정되는 것은 아니다. 주지해야 할 중요한 사항은 본 발명에 따른 노이즈 억압 시스템이 음성 코딩, 예를 들면 아날로그 셀룰러 무선 전화 시스템을 포함하지 않는 통신 시스템에서도 유익하게 구현될 수 있다는 것이다.
도 7을 참조하면, 편의상 두문자를 사용한다. 이하는 도 7에서 사용된 두문자에 대한 정의들의 리스트이다:
BTS기지 송수신국(Base Transceiver Station)
CBSC집중 기지국 제어기(Centralized Base Station Controller)
EC에코 제거기(Echo Canceller)
VLR방문자 위치 등록(Visitor Location Register)
HLR홈 위치 등록(Home Location Register)
ISDN종합 정보 통신망(Integrated Services Digital Network)
MS이동국(Mobile Station)
MSC이동 교환 센터(Mobile Switching Center)
MM이동성 관리자(Mobility Manager)
OMCR운영 및 유지 센터 - 무선(Operations and Maintenance Center - Radio)
OMCS운영 및 유지 센터 - 스위치(Operations and Maintenance Center - Switch)
PSTN공중 교환 전화망(Public Switched Telephone Network)
TC트랜스코더(Transcoder)
도 7에서 알 수 있는 바와 같이, BTS(701-703)은 CBSC(704)에 결합되어 있다. 각각의 BTS(701-703)은 MS(705-706)에 무선 주파수(RF) 통신을 제공한다. 양호한 실시예에서, RF 통신을 지원하기 위해 BTS(701-703)과 MS(705-706)로 구현된 송신기/수신기(송수신기) 하드웨어는 전기 통신 산업 협회(Telecommunication Industry Association, TIA)로부터 입수 가능한 문서 TIA/EIA/IS-95, 듀얼 모드 광대역 확산 스펙트럼 셀룰러 시스템에 대한 이동국-기지국 호환성 규격(Mobile Station-Base Station Compatibility Standard for Dual Mode Wideband Spread Spectrum Cellular System), 1993년 7월에 정의되어 있다. CBSC(704)는 그 중에서도 특히 TC(710)을 통한 호출 처리와 MM(709)를 통한 이동성 관리를 맡고 있다. 양호한 실시예에서는, 도 2의 음성 코더(100)의 기능이 TC(704)내에 존재한다. CBSC(704)의 다른 작업들로는 특성 제어 및 전송/네트워킹 인터페이싱(feature control and transmission/networking interfacing)이 있다. CBSC(704)의 기능에 관한 더 많은 정보를 위해서는, 본 출원의 양수인에게 양도된 바흐 등의 미국 특허 출원 제 07/997,997호를 참조하기 바라며, 이는 참고로 여기 포함하였다.
도 7에 도시한 바와 같이, OMCR(712)는 CBSC(704)의 MM(709)에 결합되어 있다. OMCR(712)는 통신 시스템(700)의 무선부(CBSC(704)와 BTS(701-703) 결합부)의 운영 및 일반적인 유지를 맡고 있다. CBSC(704)는 PSTN(720)/ISDN(722)와 CBSC(704) 사이의 스위칭 호환성을 제공하는 MSC(715)에 결합되어 있다. OMSC(724)는 통신 시스템(700)의 스위칭부(MSC(715))의 운영 및 일반적인 유지를 맡고 있다. HLR(716)과 VLR(717)은 주로 과금 목적으로 사용되는 사용자 정보를 통신 시스템(700)에 제공한다. EC(711과 719)는 통신 시스템(700)을 통해 전송된 음성 신호의 품질을 개선하기 위해 구현된다.
CBSC(704), MSC(715), HLR(716)과 VLR(717)의 기능은 도 7에서는 분산되어 있는 것으로 도시되어 있지만, 당업자라면 이 기능은 마찬가지로 단일 요소로 집중될 수 있다는 것을 잘 알 것이다. 또한, 서로 다른 구성에 대해서, TC(710)도 마찬가지로 MSC(715)나 BTS(701-703) 중 어느 하나에 위치할 수 있다. 노이즈 억압 시스템(109)의 기능은 범용이기 때문에, 본 발명은 본 발명에 따른 노이즈 억압을 하나의 요소(예를 들면, MSC(715))에서 실행하되 음성 코딩 기능은 다른 요소(예를 들면, CBSC(704)에서 수행하는 것을 생각하고 있다. 본 실시예에서, 노이즈 억압된 신호 s′(n)(또는 노이즈 억압된 신호 s′(n)를 나타내는 데이타)는 MSC(715)로부터 CBSC(704)로 링크(726)을 통해 전송되어 진다.
양호한 실시예에서, TC(710)은 도 2에 도시된 노이즈 억압 시스템(109)를 이용하여 본 발명에 따른 노이즈 억압을 수행한다. MSC(715)와 CBSC(704)를 결합시키는 링크(726)은 기술 분야에 공지된 T1/E1 링크이다. CBSC에 TC(710)을 배치함으로써, TC(710)에 의한 입력 신호(T1/E1 링크(726)으로부터 입력됨)의 압축으로 인해 링크 버짓(link budget)이 4:1의 개선을 달성하였다. 압축된 신호는 특정 MS(705-706)으로의 전송을 위해 특정 BTS(701-703)으로 전송된다. 주지할 중요한 사항은 특정 BTS(701-703)으로 전송된 압축 신호는 전송이 일어나기 이전에 BTS(701-703)에서 추가적으로 처리된다. 달리 말하면, MS(705-706)으로 전송되는 종국적인 신호는 형태는 서로 다르지만 실질에 있어서는 TC(710)을 빠져나오는 압축된 신호와 동일하다. 어느 경우든지, TC(710)을 빠져나오는 압축된 신호는 노이즈 억압 시스템(109)(도 2에 도시됨)를 사용하여 본 발명에 따라 노이즈 억압을 받게 된다.
MS(705-706)이 BTS(701-703)에 의해 전송된 신호를 수신할 때, MS(705-706)은 본질적으로 BTS(701-703)에서 행해진 모든 처리와 TC(710)에서 행해진 음성 코딩을 복원(undo)(통상 디코드라고 함)하게 된다. MS(705-706)이 신호를 다시 BTS(701-703)으로 전송할 때, MS(705-706)은 마찬가지로 음성 코딩을 구현하게 된다. 이와 같이, 도 1의 음성 코더(100)은 MS(705-706)존재하고, 이와 같이 본 발명에 따른 노이즈 억압은 MS(705-706)에 의해 수행된다. 노이즈 억압을 한 신호가 MS(705-706)(MS는 신호의 형태만 변화시키고 그 실질은 변화시키지 않도록 신호의 추가적 처리를 수행함)에 의해 BTS(701-703)으로 전송된 후에, BTS(701-703)은 신호에 수행된 처리를 복원하여 그 결과 신호를 음성 디코딩을 위해 TC(710)으로 전송한다. TC(710)에 의한 음성 디코딩 후에, 신호는 T1/E1 링크(726)을 통해 최종 사용자에게 전송된다. 최종 사용자와 MS(705-706)내의 사용자 모두는 궁극적으로는 본 발명에 따른 노이즈 억압을 받은 신호를 수신하기 때문에, 각 사용자는 음성코더(100)의 노이즈 억압 시스템(109)에 의해 제공된 잇점을 실현할 수 있다.
도 8은 종래 기술에 의해 구현된 음성 신호의 노이즈 억압과 관련된 변수들을 나타낸 것이며, 도9는 일반적으로 본 발명에 따른 노이즈 억압 시스템에 의해 구현된 음성 신호의 노이즈 억압과 관련한 변수들을 나타낸 것이다. 여기에서, 여러가지 플롯들은 수평축상에 도시된 프레임 수 m의 함수로서 서로 다른 상태 변수들의 값을 나타내고 있다. 도 8 및 9 각각에서의 첫번째 플롯(플롯 1)은 총 채널 에너지 Etot(m)을 나타내고, 다음의 음성 메트릭 합산 v(m), 갱신 카운터(update_cnt 또는 빌머에서는 TIMER), 갱신 플래그(update_flag), 채널 노이즈 추정값의 합산(En(m,i)), 및 추정된 신호 감쇄, 10 log10(Einput/Eoutput)를 나타내며, 여기서 입력은 Shp(n)이고 출력은 s′(n)이다.
도 8 및 도9는 참조하면, 배경 노이즈의 증가는 프레임(600) 바로 전의 플롯 1에서 볼 수 있다. 프레임(600) 이전에는, 입력은 깨끗한(저 배경 노이즈의) 음성 신호(clean (low background noise) voice signal)(801)였다. 배경 노이즈(801)이 갑자기 증가하게 되면, 플롯 2로 표시된 음성 메트릭 합산 v(m)은 그에 비례하여 증가되고 종래 기술의 노이즈 억압 방법은 변변치 못하다. 이 조건으로부터 회복할 수 있는 능력이 플롯 3으로 도시되어있으며, 여기서 갱신 카운터(update_cnt)는 갱신이 수행되고 있지 않는 한 증가될 수 있다. 이 예는 갱신 카운터가 프레임(900) 부근에서 활성 음성(active speech) 동안에 300(빌머의 경우)의 갱신 문턱값(UPDATE_CNT_THLD)에 도달함을 보여준다. 프레임(900) 부근에서, 갱신 플래그(update_flag)는 플롯 4에 도시된 바와 같이 세트되어 있으며, 그 결과 플롯 5에 도시된 바와 같이 활성 음성 신호를 사용하여 배경 노이즈 추정값 갱신이 있게 된다. 이것은 플롯 6에 도시된 바와 같이 활성 음성의 감쇄로서 볼 수 있다. 주지할 중요한 사항은 노이즈 추정값의 갱신은 활성 음성 동안(플롯 1의 프레임(900)은 음성 동안(during speech)임)에 일어나며, 그 결과 갱신이 불필요할 때 음성 신호를 블러저닝(bludgeoning)하게 된다. 또한, 갱신 카운트 문턱값이 정상 음성(normal speech) 동안에 종료할 우려가 있기 때문에, 상대적으로 높은 문턱값(300)이 이러한 갱신을 방지하려고 할 때에 필요하게 된다.
도 9를 참조하면, 갱신 카운터는 배경 노이즈 증가 동안 음성 신호가 시작되기 이전에는 증가하기만 한다. 이와 같이, 갱신 문턱값은 그 값이 50에까지 저하될 수 있지만, 여전히 신뢰성있는 갱신을 유지한다. 여기서, 갱신 카운터는 프레임(650)까지 50의 갱신 카운터 문턱값(UPDATE_CNT_THLD)에 도달하여 노이즈 억압시스템(109)에 프레임(800)에서 음성 신호의 복귀 이전에 새로운 노이즈 조건으로 수렴할 충분한 시간을 주게 된다. 이 시간 동안에, 미음성 프레임 동안에만 감쇄가 일어나며 따라서 음성 신호의 블러저닝은 일어나지 않음을 알 수 있다. 그 결과, 최종 사용자가 듣게 되는 음성 신호가 개선된다.
개선된 음성 신호는 단순히 타이머가 정상 음성 메트릭 갱신이 없을 때에 종료하도록 두지 않고 갱신 결정이 현재의 프레임 에너지와 과거 프레임 에너지의 평균 사이의 스펙트럼 편차에 근거하여 이루어진다는 사실의 결과이다. 전자의 경우에는(빌머의 경우처럼), 시스템은 갑작스런 노이즈 증가를 음성 신호 자체로 보게 되며, 따라서 증가된 배경 노이즈 레벨과 실제의 음성 신호를 분간할 수 없게 된다. 스펙트럼 편차를 사용함으로써, 배경 노이즈는 실제의 음성 신호와 분간할 수 있으며, 개선된 갱신 결정이 그에 따라 행해지게 된다.
도 10은 일반적으로 종래 기술에 의해 구현된 음악 신호의 노이즈 억압에 관련한 변수들을 나타낸 것이며, 도 11은 일반적으로 본 발명에 따른 노이즈 억압 시스템에 의해 구현된 음악 신호의 노이즈 억압과 관련한 변수들을 나타낸 것이다. 이 예의 목적상, 도 10과 도 11에서 프레임(600)까지의 신호는 도 8과 도 9에 도시한 것과 동일한 깨끗한 신호(800)이다. 도 10을 참조하면, 종래 기술의 방법은 도 8에 도시한 배경 노이즈 예와 거의 동일하게 동작한다. 프레임(600)에서, 음악 신호(805)는 종국적으로 프레임(900)에서 갱신 카운터(플롯 3참조)에 의해 압도되는 플롯 2로 도시한 바와 같이 실질적으로 연속적인 음성 메트릭 합산 v(m)을 발생한다. 음악 신호(805)의 특성이 시간에 따라 변하기 때문에, 플롯 6에 도시한 감쇄는 감소되지만, 갱신 카운터는 계속하여 프레임(1800)에 도시한 바와 같이 음성 메트릭을 압도하게 된다. 이와 반대로, 도 11에 잘 나타낸 바와 같이, 갱신 카운터(플롯 3참조)는 결코 문턱값이 50에 도달하지 않으며 따라서 갱신도 일어나지 않는다. 갱신이 일어나지 않는다는 사실은 도 11의 플롯 6을 참조하면 잘 알 수 있는데, 여기서, 음악 신호(805)의 감쇄는 0dB로 일정하다(즉, 감쇄가 일어나지 않음). 이와 같이, 종래 기술에 의해 노이즈 억압된 음악(예를 들면, 대기중 송출 음악)을 듣고 있는 사용자는 바람직하지 않은 음악 레벨의 변화를 듣게 되지만, 본 발명에 따라 노이즈 억압된 음악을 듣고 있는 사용자는 요망대로 일정 레벨로 음악을 듣게 된다.
본 발명은 특정 실시예와 관련하여 도시되고 설명되고 있지만, 당업자라면 본 발명의 정신 및 범위를 벗어나지 않고 형태 및 내용에 있어 여러가지 변경을 할 수 있음을 잘 알 것이다. 첨부된 특허 청구의 범위에서의 모든 수단 또는 단계들에 기능 요소들을 합한 대응하는 구조, 물질, 동작 및 등가물들은 특별히 청구한 그 밖의 요소들과 함께 기능을 수행하기 위한 임의의 구조, 물질 또는 작동을 포함하는 것으로 생각된다.

Claims (31)

  1. 채널의 노이즈 추정값(a noise estimate of channel)으로 되는 노이즈를 갖는 채널내의 여러 프레임의 정보(frames of information in channels)를 사용하여 정보 전송을 구현하는 통신 시스템에서 노이즈를 억압하는 방법에 있어서,
    현재 프레임의 정보내의 채널 에너지(a channel energy within a current frame of information)를 추정(estimate)하는 단계와,
    채널 에너지의 추정값에 근거하여 현재 프레임의 정보내의 총 채널 에너지(a total channel energy within a current frame of information)를 추정하는 단계와,
    채널 에너지의 추정값에 근거하여 현재 프레임의 정보의 스펙트럼의 전력을 추정하는 단계와,
    현재 프레임의 스펙트럼의 전력의 추정값에 근거하여 복수의 과거 프레임의 정보의 스펙트럼의 전력(a power of a spectra of a plurality of past frames of information)을 추정하는 단계와,
    현재 프레임의 스펙트럼의 추정값과 복수의 과거 프레임의 스펙트럼의 전력의 추정값 사이의 편차(deviation)를 결정하는 단계와,
    총 채널 에너지의 추정값과 결정된 편차에 근거하여 채널의 노이즈 추정값(noise estimate)을 갱신(update)하는 단계를 포함하는 것을 특징으로 하는 통신 시스템에서의 노이즈 억압 방법.
  2. 제 1항에 있어서,
    노이즈 억압된 신호를 생성하기 위해 노이즈 추정값의 갱신에 근거하여 채널의 이득을 수정하는 단계를 더 포함하는 것을 특징으로 하는 통신 시스템에서의 노이즈 억압 방법.
  3. 제 1항에 있어서,
    복수의 과거 프렝미의 정보의 스펙트럼의 전력을 추정하는 단계는, 과거 프레임의 정보의 지수적 가중(exponential weighting)에 근거하여 복수의 과거 프레임의 스펙트럼의 전력을 추정하는 단계를 더 포함하는 것을 특징으로 하는 통신 시스템에서의 노이즈 억압 방법.
  4. 제 3항에 있어서,
    과거 프레임의 정보의 지수적 가중은 현재 프레임의 정보내의 총 채널 에너지의 추정값의 함수인 것을 특징으로 하는 통신 시스템에서의 노이즈 억압 방법.
  5. 제 1항에 있어서,
    총 채널 에너지의 추정값과 결정된 편차에 근거하여 채널의 노이즈 추정값을 갱신하는 단계는 총 채널 에너지의 추정값과 제 1의 문턱값의 비교 및 결정된 편차와 제 2의 문턱값의 비교에 근거하여 채널의 노이즈 추정값을 갱신하는 단계를 더 포함하는 것을 특징으로 하는 통신 시스템에서의 노이즈 억압 방법.
  6. 제 5항에 있어서, 총 채널 에너지의 추정값과 제 1의 문턱값의 비교 및 결정된 편차와 제 2의 문턱값의 비교에 근거하여 채널의 노이즈 추정값을 갱신하는 단계는 총 채널 에너지의 추정값이 제 1의 문턱값보다 크고 결정된 편차가 제 2의 추정값 이하일 때 채널의 노이즈 추정값을 갱신하는 단계를 더 포함하는 것을 특징으로 하는 통신 시스템에서의 노이즈 억압 방법.
  7. 제 6항에 있어서,
    총 채널 에너지의 추정값이 제 1의 문턱값보다 크고 결정된 편차가 제 2의 추정값 이하일 때 채널의 노이즈 추정값을 갱신하는 단계는 총 채널 에너지의 추정값이 제 1의 문턱값보다 작거나 같은 제 2의 기선정된 수의 연속한 프레임이 없는 제 1의 기선정된 수의 프레임들에 대해 총 채널 에너지의 추정값이 제 1의 문턱값보다 더 클 때 채널의 노이즈 추정값을 갱신하는 단계를 더 포함하는 것을 특징으로 하는 통신 시스템에서의 노이즈 억압 방법.
  8. 제 7항에 있어서,
    제 1의 기선정된 수의 프레임은 50 프레임으로 이루어져 있는 것을 특징으로 하는 통신 시스템에서의 노이즈 억압 방법.
  9. 제 7항에 있어서,
    제 2의 기선정된 수의 연속한 프레임은 6프레임으로 이루어져 있는 것을 특징으로 하는 통신 시스템에서의 노이즈 억압 방법.
  10. 제 1항에 있어서,
    상기 방법이 이동 교환국(mobile switching center, MSC), 집중 기지국 제어기(centralized base station controller, CBSC), 기지국 송수신국(base transceiver station, BTS) 또는 이동국(mobile station, MS) 중 어느 하나에서 수행되는 것을 특징으로 하는 통신 시스템에서의 노이즈 억압 방법.
  11. 채널의 노이즈 추정값(a noise estimate of channel)으로 되는 노이즈를 갖는 채널내의 여러 프레임의 정보(frames of information in channels)를 사용하여 정보 전송을 구현하는 통신 시스템에서 노이즈를 억압하는 장치에 있어서,
    현재 프레임의 정보내의 채널 에너지(a channel energy within a current frame of information)를 추정(estimate)하는 수단과,
    채널 에너지의 추정값에 근거하여 현재 프레임의 정보내의 총 채널 에너지(a total channel energy within a current frame of information)를 추정하는 수단과,
    채널 에너지의 추정값에 근거하여 현재 프레임의 정보의 스펙트럼의 전력을 추정하는 수단과,
    현재 프레임의 스펙트럼의 전력의 추정값에 근거하여 복수의 과거 프레임의 정보의 스펙트럼의 전력(a power of a spectra of a plurality of past frames of information)을 추정하는 수단과,
    현재 프레임의 스펙트럼의 추정값과 복수의 과거 프레임의 스펙트럼의 전력의 추정값 사이의 편차(deviation)를 결정하는 수단과,
    총 채널 에너지의 추정값과 결정된 편차에 근거하여 채널의 노이즈 추정값(noise estimate)을 갱신(update)하는 수단을 포함하는 통신 시스템에서의 노이즈 억압 장치.
  12. 제 11항에 있어서,
    노이즈 억압된 신호를 생성하기 위하여 노이즈 추정값의 갱신에 근거하여 채널의 이득을 수정하는 수단을 더 구비하는 것을 특징으로 하는 통신 시스템에서의 노이즈 억압 장치.
  13. 제 11항에 있어서,
    상기 장치는 입력으로서 노이즈 억압된 신호를 갖는 음성 코더에 결합되어 있는 것을 특징으로 하는 통신 시스템에서의 노이즈 억압 장치.
  14. 제 11항에 있어서,
    상기 장치가 통신 시스템의 이동 교환국(mobile switching center, MSC), 집중 기지국 제어기(centralized base station controller, CBSC), 기지 송수신국(base transceiver station, BTS) 또는 이동국(mobile station MS) 중 어느 하나에 존재하는 것을 특징으로 하는 통신 시스템에서의 노이즈 억압 장치.
  15. 제 14항에 있어서,
    상기 통신 시스템은 코드 분할 다중 접속(code division multiple asccess, CDMA) 통신 시스템인 것을 특징으로 하는 통신 시스템에서의 노이즈 억압 장치.
  16. 제 11항에 있어서,
    복수의 과거 프레임의 정보의 스펙트럼의 전력을 추정하는 수단은 과거 프레임의 정보의 지수적 가중에 근거하여 복수의 과거 프레임의 스펙트럼의 전력을 추정하는 수단을 더 구비하는 것을 특징으로 하는 통신 시스템의 노이즈 억압 장치.
  17. 제 16항에 있어서,
    과거 프레임의 정보의 지수적 가중은 현재 프레임의 정보내의 총 채널 에너지의 추정값의 함수인 것을 특징으로 하는 통신 시스템에서의 노이즈 억압 장치.
  18. 제 11항에 있어서,
    총 채널 에너지의 추정값과 결정된 편차에 근거하여 채널의 노이즈 추정값을 갱신하는 수단은 총 채널 에너지의 추정값과 제 1의 문턱값의 비교 및 결정된 편차와 제 2의 문턱값의 비교에 근거하여 채널의 노이즈 추정값을 갱신하는 수단을 더 구비하는 것을 특징으로 하는 통신 시스템에서의 노이즈 억압 장치.
  19. 제 18항에 있어서,
    총 채널 에너지의 추정값과 제 1의 문턱값의 비교 및 결정된 편차와 제 2의 문턱값의 비교에 근거하여 채널의 노이즈 추정값을 갱신하는 수단은 총 채널 에너지의 추정값이 제 1의 문턱값보다 크고 결정된 편차가 제 2의 추정값 이하일 때 채널의 노이즈 추정값을 갱신하는 수단을 더 구비하는 것을 특징으로 하는 통신 시스템에서의 노이즈 억압 장치.
  20. 제 19항에 있어서,
    총 채널 에너지의 추정값이 제 1의 문턱값보다 크고 편차가 제 2의 추정값 이하일 때 채널의 노이즈 추정값을 갱신하는 수단은 총 채널 에너지의 추정값이 제 1의 문턱값보다 작거나 같은 제 2의 기선정된 수의 연속한 프레임이 없는 제 1의 기선정된 수의 프레임들에 대해 총 채널 에너지의 추정값이 제 1의 문턱값보다 더 클 때 채널의 노이즈 추정값을 갱신하는 수단을 더 구비하는 것을 특징으로 하는 통신 시스템에서의 노이즈 억압 장치.
  21. 제 20항에 있어서,
    제 1의 기선정된 수의 프레임 50 프레임으로 이루어져 있는 것을 특징으로 하는 통신 시스템에서의 노이즈 억압 장치.
  22. 제 20항에 있어서,
    제 2의 기선정된 수의 연속한 프레임은 6프레임으로 이루어져 있는 것을 특징으로 하는 통신 시스템에서의 노이즈 억압 장치.
  23. 자신에 노이즈를 가지고 있는 채널내의 여러 프레임의 정보를 사용하여 음성 샘플들(speech samples)을 전송하는 통신 시스템에서 음성을 코딩하기 위한 것으로 음성 샘플들을 입력으로서 갖는 음성 코더(speech coder)에 있어서,
    노이즈 억압된 음성 샘플들을 생성하기 위해 현재 프레임의 음성 샘플들과 복수의 과거 프레임의 음성 샘플들의 평균 스펙트럼 에너지 사이의 스펙트럼 에너지의 편차에 근거하여 음성 샘플들의 프레임내의 노이즈를 억압하는 수단과,
    통신 시스템에 의해 전송하기 위해 노이즈 억압된 음성 샘플들을 코딩하는 수단을 구비하는 것을 특징으로 하는 음성 코더.
  24. 제 23항에 있어서,
    상기 음성 코더가 통신 시스템의 이동 교환국(mobile switching center, MSC), 집중 기지국 제어기(centralized base station controller, CBSC), 기지 송수신국(base transceiver station, BTS) 또는 이동국(mobile station, MS) 중 어느 하나에 존재하는 것을 특징으로 하는 음성 코더.
  25. 제 24항에 있어서,
    상기 통신 시스템은 코드 분할 다중 접속(code division multiple access, CDMA) 통신 시스템을 더 구비하는 것을 특징으로 하는 음성 코더.
  26. 제 23항에 있어서,
    음성 샘플들의 프레임내의 노이즈를 억압하는 수단은, 채널 에너지의 추정값에 근거하여 현재 프레임의 음성 샘플들내의 총 채널 에너지(a total channel energy within a current frame of speech samples)를 추정하는 수단과,
    채널 에너지의 추정값에 근거하여 현재 프레임의 음성 샘플들의 스펙트럼의 전력을 추정하는 수단과,
    현재 프레임의 스펙트럼의 전력의 추정값에 근거하여 복수의 과거 프레임의 음성 샘플들의 스펙트럼의 전력(a power of a spectra of a plurality of past frames of speech samples)을 추정하는 수단과,
    현재 프레임의 스펙트럼의 추정값과 복수의 과거 프레임의 스펙트럼의 전력의 추정값 사이의 편차(deviation)를 결정하는 수단과,
    총 채널 에너지의 추정값과 결정된 편차에 근거하여 채널의 노이즈 추정값(noise estimate)을 갱신(update)하는 수단과,
    노이즈 억압된 음성 샘플들을 생성하기 위하여 노이즈 추정값의 갱신에 근거하여 채널의 이득을 수정하는 수단을 더 구비하는 것을 특징으로 하는 음성 코더.
  27. 자신에 노이즈를 가지고 있는 채널내의 여러 프레임의 정보를 사용하여 음성 신호(speech signal)를 전송하는 통신 시스템에서 음성을 코딩하기 위한 것으로 음성 신호를 입력으로서 갖는 음성 코더(speech coder)에 있어서,
    노이즈 억압된 음성 신호를 생성하기 위해 음성 신호를 포함하는 현재 프레임과 음성 신호를 포함하는 복수의 과거 프레임의 평균 스펙트럼 에너지 사이의 스펙트럼 에너지의 편차에 근거하여 음성 신호를 포함하는 프레임내의 노이즈를 억압하는 수단과,
    통신 시스템에 의해 전송하기 위해 노이즈 억압된 음성 신호를 코딩하는 수단을 구비하는 것을 특징으로 하는 음성 코더.
  28. 제 27항에 있어서,
    상기 음성 코더가 통신 시스템의 이동 교환국(mobile switching center, MSC), 집중 기지국 제어기(centralized base station controller, CBSC), 기지 송수신국(base transceiver station, BTS) 또는 이동국(mobile station, MS) 중 어느 하나에 존재하는 것을 특징으로 하는 음성 코더.
  29. 제 28항에 있어서,
    상기 통신 시스템은 코드 분할 다중 접속(code division multiple access, CDMA) 통신 시스템을 더 구비하는 것을 특징으로 하는 음성 코더.
  30. 제 27항에 있어서,
    음성 신호를 포함하는 프레임내의 노이즈를 억압하는 수단은,
    채널 에너지의 추정값에 근거하여 음성 신호를 포함하는 현재 프레임의 총 채널 에너지(a total channel energy within a current frame including the speech signal)를 추정하는 수단과,
    채널 에너지의 추정값에 근거하여 음성 신호를 포함하는 현재 프레임의 스펙트럼의 전력을 추정하는 수단과,
    현재 프레임의 스펙트럼의 전력의 추정값에 근거하여 음성신호를 포함하는 복수의 과거 프레임의 스펙트럼의 전력(a power of a spectra of a plurality of past frames including speech signals)을 추정하는 수단과,
    현재 프레임의 스펙트럼의 추정값과 복수의 과거 프레임의 스펙트럼의 전력의 추정값 사이의 편차(deviation)를 결정하는 수단과,
    총 채널 에너지의 추정값과 결정된 편차에 근거하여 채널의 노이즈 추정값(noise estimate)을 갱신(update)하는 수단과,
    노이즈 억압된 음성 신호를 생성하기 위하여 노이즈 추정값의 갱신에 근거하여 채널의 이득을 수정하는 수단을 더 구비하는 것을 특징으로 하는 음성 코더.
  31. 제 30항에 있어서,
    음성 신호는 아날로그 음성 신호나 디지탈 음성 신호 중 어느 하나인 것을 특징으로 하는 음성 코더.
KR1019970704788A 1995-11-13 1996-09-04 통신 시스템에서 노이즈를 억압하는 방법 및 장치 KR100286719B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/556,358 US5659622A (en) 1995-11-13 1995-11-13 Method and apparatus for suppressing noise in a communication system
US8/556358 1995-11-13
PCT/US1996/014270 WO1997018647A1 (en) 1995-11-13 1996-09-04 Method and apparatus for suppressing noise in a communication system

Publications (2)

Publication Number Publication Date
KR19980701399A true KR19980701399A (ko) 1998-05-15
KR100286719B1 KR100286719B1 (ko) 2001-04-16

Family

ID=24221022

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970704788A KR100286719B1 (ko) 1995-11-13 1996-09-04 통신 시스템에서 노이즈를 억압하는 방법 및 장치

Country Status (17)

Country Link
US (1) US5659622A (ko)
JP (1) JP3842821B2 (ko)
KR (1) KR100286719B1 (ko)
CN (1) CN1075692C (ko)
AU (1) AU689403B2 (ko)
BR (1) BR9607249A (ko)
CA (1) CA2203917C (ko)
DE (1) DE19681070C2 (ko)
FI (1) FI115582B (ko)
FR (1) FR2741217B1 (ko)
GB (1) GB2313266B (ko)
HK (1) HK1005112A1 (ko)
HU (1) HU219255B (ko)
IL (1) IL119226A (ko)
RU (1) RU2169992C2 (ko)
SE (1) SE521679C2 (ko)
WO (1) WO1997018647A1 (ko)

Families Citing this family (86)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IN184794B (ko) * 1993-09-14 2000-09-30 British Telecomm
SE505156C2 (sv) * 1995-01-30 1997-07-07 Ericsson Telefon Ab L M Förfarande för bullerundertryckning genom spektral subtraktion
FI100840B (fi) * 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
US5881091A (en) * 1996-02-05 1999-03-09 Hewlett-Packard Company Spread spectrum linearization for digitizing receivers
JPH09326844A (ja) * 1996-06-03 1997-12-16 Mitsubishi Electric Corp 騒音低減通話装置及び騒音低減通話方法
KR100250561B1 (ko) 1996-08-29 2000-04-01 니시무로 타이죠 잡음소거기 및 이 잡음소거기를 사용한 통신장치
US5937377A (en) * 1997-02-19 1999-08-10 Sony Corporation Method and apparatus for utilizing noise reducer to implement voice gain control and equalization
US6104993A (en) * 1997-02-26 2000-08-15 Motorola, Inc. Apparatus and method for rate determination in a communication system
JPH10247098A (ja) * 1997-03-04 1998-09-14 Mitsubishi Electric Corp 可変レート音声符号化方法、可変レート音声復号化方法
US5893056A (en) * 1997-04-17 1999-04-06 Northern Telecom Limited Methods and apparatus for generating noise signals from speech signals
FR2765715B1 (fr) * 1997-07-04 1999-09-17 Sextant Avionique Procede de recherche d'un modele de bruit dans des signaux sonores bruites
KR19990020369A (ko) * 1997-08-30 1999-03-25 윤종용 무선 사설교환시스템에서 노이즈 제거 방법
FR2768544B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de detection d'activite vocale
TW333610B (en) * 1997-10-16 1998-06-11 Winbond Electronics Corp The phonetic detecting apparatus and its detecting method
DE19747885B4 (de) * 1997-10-30 2009-04-23 Harman Becker Automotive Systems Gmbh Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion
US6070137A (en) * 1998-01-07 2000-05-30 Ericsson Inc. Integrated frequency-domain voice coding using an adaptive spectral enhancement filter
KR100510399B1 (ko) * 1998-02-17 2005-08-30 모토로라 인코포레이티드 고정 코드북내의 최적 벡터의 고속 결정 방법 및 장치
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
US6073152A (en) * 1998-04-03 2000-06-06 Sarnoff Corporation Method and apparatus for filtering signals using a gamma delay line based estimation of power spectrum
US6088668A (en) * 1998-06-22 2000-07-11 D.S.P.C. Technologies Ltd. Noise suppressor having weighted gain smoothing
US6122610A (en) * 1998-09-23 2000-09-19 Verance Corporation Noise suppression for low bitrate speech coder
KR100281181B1 (ko) * 1998-10-16 2001-02-01 윤종용 약전계에서 코드 분할 다중 접속 시스템의 코덱 잡음 제거 방법
US6424938B1 (en) * 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal
US6873837B1 (en) 1999-02-03 2005-03-29 Matsushita Electric Industrial Co., Ltd. Emergency reporting system and terminal apparatus therein
US6453291B1 (en) * 1999-02-04 2002-09-17 Motorola, Inc. Apparatus and method for voice activity detection in a communication system
US6618701B2 (en) 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
DE19920819C1 (de) * 1999-05-06 2000-10-26 Bosch Gmbh Robert Verfahren und Vorrichtung zur Schätzung von gedächtnisbehafteten Übertragungskanälen
GB9912577D0 (en) * 1999-05-28 1999-07-28 Mitel Corp Method of detecting silence in a packetized voice stream
US6633841B1 (en) * 1999-07-29 2003-10-14 Mindspeed Technologies, Inc. Voice activity detection speech coding to accommodate music signals
AU5472199A (en) * 1999-08-10 2001-03-05 Telogy Networks, Inc. Background energy estimation
US6581032B1 (en) * 1999-09-22 2003-06-17 Conexant Systems, Inc. Bitstream protocol for transmission of encoded voice signals
US6366880B1 (en) * 1999-11-30 2002-04-02 Motorola, Inc. Method and apparatus for suppressing acoustic background noise in a communication system by equaliztion of pre-and post-comb-filtered subband spectral energies
KR20020056957A (ko) * 1999-12-03 2002-07-10 비센트 비.인그라시아, 알크 엠 아헨 통신 시스템에서 음향 배경 잡음을 억제하기 위한 방법 및장치
US6963546B2 (en) * 2000-03-15 2005-11-08 Interdigital Technology Corp. Multi-user detection using an adaptive combination of joint detection and successive interface cancellation
JP2001318694A (ja) 2000-05-10 2001-11-16 Toshiba Corp 信号処理装置、信号処理方法および記録媒体
JP2002032096A (ja) 2000-07-18 2002-01-31 Matsushita Electric Ind Co Ltd 雑音区間/音声区間判定装置
JP4533517B2 (ja) * 2000-08-31 2010-09-01 株式会社東芝 信号処理方法および信号処理装置
US7277554B2 (en) 2001-08-08 2007-10-02 Gn Resound North America Corporation Dynamic range compression using digital frequency warping
WO2003063160A1 (en) * 2002-01-25 2003-07-31 Koninklijke Philips Electronics N.V. Method and unit for substracting quantization noise from a pcm signal
US7299173B2 (en) * 2002-01-30 2007-11-20 Motorola Inc. Method and apparatus for speech detection using time-frequency variance
RU2206960C1 (ru) * 2002-06-24 2003-06-20 Общество с ограниченной ответственностью "Центр речевых технологий" Способ подавления шума в информационном сигнале и устройство для его осуществления
US7283956B2 (en) * 2002-09-18 2007-10-16 Motorola, Inc. Noise suppression
US7343283B2 (en) * 2002-10-23 2008-03-11 Motorola, Inc. Method and apparatus for coding a noise-suppressed audio signal
US7809150B2 (en) * 2003-05-27 2010-10-05 Starkey Laboratories, Inc. Method and apparatus to reduce entrainment-related artifacts for hearing assistance systems
JPWO2005124739A1 (ja) * 2004-06-18 2008-04-17 松下電器産業株式会社 雑音抑圧装置および雑音抑圧方法
CN101053161B (zh) * 2004-11-02 2010-09-08 松下电器产业株式会社 噪声抑制装置
KR20060091970A (ko) * 2005-02-16 2006-08-22 엘지전자 주식회사 이동통신단말기에서의 신호 대 잡음비 개선 방법 및 그 이동통신단말기
US20060184363A1 (en) * 2005-02-17 2006-08-17 Mccree Alan Noise suppression
WO2006097886A1 (en) * 2005-03-16 2006-09-21 Koninklijke Philips Electronics N.V. Noise power estimation
WO2006104555A2 (en) * 2005-03-24 2006-10-05 Mindspeed Technologies, Inc. Adaptive noise state update for a voice activity detector
US7596099B2 (en) * 2005-08-22 2009-09-29 Motorola, Inc. Method and apparatus for managing a communication link
US8233636B2 (en) * 2005-09-02 2012-07-31 Nec Corporation Method, apparatus, and computer program for suppressing noise
KR100927897B1 (ko) 2005-09-02 2009-11-23 닛본 덴끼 가부시끼가이샤 잡음억제방법과 장치, 및 컴퓨터프로그램
US8116473B2 (en) * 2006-03-13 2012-02-14 Starkey Laboratories, Inc. Output phase modulation entrainment containment for digital filters
US7555075B2 (en) * 2006-04-07 2009-06-30 Freescale Semiconductor, Inc. Adjustable noise suppression system
KR100883652B1 (ko) * 2006-08-03 2009-02-18 삼성전자주식회사 음성 구간 검출 방법 및 장치, 및 이를 이용한 음성 인식시스템
US8060363B2 (en) * 2007-02-13 2011-11-15 Nokia Corporation Audio signal encoding
US7873114B2 (en) * 2007-03-29 2011-01-18 Motorola Mobility, Inc. Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate
US7809129B2 (en) * 2007-08-31 2010-10-05 Motorola, Inc. Acoustic echo cancellation based on noise environment
CN101889432B (zh) * 2007-12-07 2013-12-11 艾格瑞系统有限公司 处于保持时的音乐的终端用户控制
CN103000178B (zh) 2008-07-11 2015-04-08 弗劳恩霍夫应用研究促进协会 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
CN101770776B (zh) 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理系统
WO2011044848A1 (zh) * 2009-10-15 2011-04-21 华为技术有限公司 信号处理的方法、装置和系统
CN102044241B (zh) 2009-10-15 2012-04-04 华为技术有限公司 一种实现通信系统中背景噪声的跟踪的方法和装置
EP2816560A1 (en) * 2009-10-19 2014-12-24 Telefonaktiebolaget L M Ericsson (PUBL) Method and background estimator for voice activity detection
US9729976B2 (en) * 2009-12-22 2017-08-08 Starkey Laboratories, Inc. Acoustic feedback event monitoring system for hearing assistance devices
US8917891B2 (en) 2010-04-13 2014-12-23 Starkey Laboratories, Inc. Methods and apparatus for allocating feedback cancellation resources for hearing assistance devices
US9654885B2 (en) 2010-04-13 2017-05-16 Starkey Laboratories, Inc. Methods and apparatus for allocating feedback cancellation resources for hearing assistance devices
CN102376303B (zh) * 2010-08-13 2014-03-12 国基电子(上海)有限公司 录音设备及利用该录音设备进行声音处理与录入的方法
SI3493205T1 (sl) 2010-12-24 2021-03-31 Huawei Technologies Co., Ltd. Postopek in naprava za adaptivno zaznavanje glasovne aktivnosti v vstopnem avdio signalu
CN103534754B (zh) * 2011-02-14 2015-09-30 弗兰霍菲尔运输应用研究公司 在不活动阶段期间利用噪声合成的音频编解码器
AU2012217216B2 (en) 2011-02-14 2015-09-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
PL3471092T3 (pl) 2011-02-14 2020-12-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekodowanie pozycji impulsów ścieżek sygnału audio
CN102959620B (zh) 2011-02-14 2015-05-13 弗兰霍菲尔运输应用研究公司 利用重迭变换的信息信号表示
ES2534972T3 (es) 2011-02-14 2015-04-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Predicción lineal basada en esquema de codificación utilizando conformación de ruido de dominio espectral
CA2827000C (en) 2011-02-14 2016-04-05 Jeremie Lecomte Apparatus and method for error concealment in low-delay unified speech and audio coding (usac)
SG192746A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Apparatus and method for processing a decoded audio signal in a spectral domain
JP5480226B2 (ja) * 2011-11-29 2014-04-23 株式会社東芝 信号処理装置および信号処理方法
US8712769B2 (en) * 2011-12-19 2014-04-29 Continental Automotive Systems, Inc. Apparatus and method for noise removal by spectral smoothing
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
EP3152756B1 (en) * 2014-06-09 2019-10-23 Dolby Laboratories Licensing Corporation Noise level estimation
GB201617016D0 (en) * 2016-09-09 2016-11-23 Continental automotive systems inc Robust noise estimation for speech enhancement in variable noise conditions
US10681458B2 (en) 2018-06-11 2020-06-09 Cirrus Logic, Inc. Techniques for howling detection
KR102242457B1 (ko) * 2019-08-08 2021-04-19 주식회사 에스원 Uwb 모듈레이션을 통한 노이즈 추정방법

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1216224B (it) * 1986-03-28 1990-02-22 Giuliani Marcello Complesso pneumatico per la pulitura e l'allontanamento di polveri, fibrille e cascami vari dalle carde laniere e cotoniere dell'industria tessile
US4811404A (en) * 1987-10-01 1989-03-07 Motorola, Inc. Noise suppression system
US5267322A (en) * 1991-12-13 1993-11-30 Digital Sound Corporation Digital automatic gain control with lookahead, adaptive noise floor sensing, and decay boost initialization
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5475686A (en) * 1992-12-28 1995-12-12 Motorola, Inc. Method and apparatus for transferring data in a communication system
IT1270438B (it) * 1993-06-10 1997-05-05 Sip Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce
EP0707763B1 (en) * 1993-07-07 2001-08-29 Picturetel Corporation Reduction of background noise for speech enhancement

Also Published As

Publication number Publication date
SE9701659D0 (sv) 1997-05-02
JP3842821B2 (ja) 2006-11-08
HK1005112A1 (en) 1998-12-24
KR100286719B1 (ko) 2001-04-16
FI972852A0 (fi) 1997-07-03
HUP9800843A3 (en) 1999-03-29
WO1997018647A1 (en) 1997-05-22
CN1075692C (zh) 2001-11-28
CA2203917A1 (en) 1997-05-14
RU2169992C2 (ru) 2001-06-27
BR9607249A (pt) 1997-12-30
DE19681070T1 (de) 1998-02-26
IL119226A (en) 2000-10-31
FI972852A (fi) 1997-07-03
AU1758497A (en) 1997-06-05
JPH10513030A (ja) 1998-12-08
HU219255B (en) 2001-03-28
DE19681070C2 (de) 2002-10-24
US5659622A (en) 1997-08-19
HUP9800843A2 (hu) 1998-07-28
AU689403B2 (en) 1998-03-26
IL119226A0 (en) 1996-12-05
GB2313266A (en) 1997-11-19
GB2313266B (en) 2000-01-26
SE521679C2 (sv) 2003-11-25
FR2741217A1 (fr) 1997-05-16
CA2203917C (en) 2000-06-27
GB9713727D0 (en) 1997-09-03
FR2741217B1 (fr) 2004-08-20
SE9701659L (sv) 1997-09-12
CN1168204A (zh) 1997-12-17
FI115582B (fi) 2005-05-31

Similar Documents

Publication Publication Date Title
KR100286719B1 (ko) 통신 시스템에서 노이즈를 억압하는 방법 및 장치
WO1997018647A9 (en) Method and apparatus for suppressing noise in a communication system
EP0979506B1 (en) Apparatus and method for rate determination in a communication system
US6366880B1 (en) Method and apparatus for suppressing acoustic background noise in a communication system by equaliztion of pre-and post-comb-filtered subband spectral energies
US6453291B1 (en) Apparatus and method for voice activity detection in a communication system
US7058572B1 (en) Reducing acoustic noise in wireless and landline based telephony
US6101466A (en) Method and system for improved discontinuous speech transmission
US6898566B1 (en) Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
US20040153313A1 (en) Method for enlarging the band width of a narrow-band filtered voice signal, especially a voice signal emitted by a telecommunication appliance
JP2002501225A (ja) 適応形後置フィルタを備えた復号化方法およびシステム
US8874437B2 (en) Method and apparatus for modifying an encoded signal for voice quality enhancement
JP2015522847A (ja) デジタル音声信号における効果的なプレエコー減衰
US20060217988A1 (en) Method and apparatus for adaptive level control
JP2003504669A (ja) 符号化領域雑音制御
EP0895688B1 (en) Apparatus and method for non-linear processing in a communication system
US20050102136A1 (en) Speech codecs
Viswanathan et al. Baseband LPC coders for speech transmission over 9.6 kb/s noisy channels
Kato et al. A wideband noise suppressor for the AMR wideband speech codec
MXPA95001343A (en) Transmitted noise reduction in communication systems

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121227

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20131227

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20150106

Year of fee payment: 15

FPAY Annual fee payment

Payment date: 20160108

Year of fee payment: 16

EXPY Expiration of term