KR100754558B1 - 주기 신호 향상 시스템 - Google Patents

주기 신호 향상 시스템 Download PDF

Info

Publication number
KR100754558B1
KR100754558B1 KR1020050101336A KR20050101336A KR100754558B1 KR 100754558 B1 KR100754558 B1 KR 100754558B1 KR 1020050101336 A KR1020050101336 A KR 1020050101336A KR 20050101336 A KR20050101336 A KR 20050101336A KR 100754558 B1 KR100754558 B1 KR 100754558B1
Authority
KR
South Korea
Prior art keywords
signal
filter
adaptive
logic
adaptive filter
Prior art date
Application number
KR1020050101336A
Other languages
English (en)
Other versions
KR20060049382A (ko
Inventor
라지브 농피우르
데이비드 기스브렛트
필립 헤더링톤
Original Assignee
큐엔엑스 소프트웨어 시스템즈 (웨이브마커스) 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/973,575 external-priority patent/US7680652B2/en
Priority claimed from US11/102,251 external-priority patent/US7610196B2/en
Priority claimed from US11/101,796 external-priority patent/US8170879B2/en
Application filed by 큐엔엑스 소프트웨어 시스템즈 (웨이브마커스) 인코포레이티드 filed Critical 큐엔엑스 소프트웨어 시스템즈 (웨이브마커스) 인코포레이티드
Publication of KR20060049382A publication Critical patent/KR20060049382A/ko
Application granted granted Critical
Publication of KR100754558B1 publication Critical patent/KR100754558B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Filters That Use Time-Delay Elements (AREA)

Abstract

신호 향상 시스템은 음성 또는 다른 오디오 신호들의 이해도를 향상시킨다. 시스템은 신호의 선택된 부분들을 보강하고, 신호의 선택된 부분들을 감쇠시킬 수 있으며, SNR을 증가시킬 수 있다. 시스템은 지연 로직, 분할 적응 필터, 및 신호 보강 로직을 포함한다. 분할 적응 필터는 입력 신호에서의 기본 주파수 및 고조파들을 추적하고 향상시킬 수 있다. 분할 필터 출력 신호들은 대략적으로, 입력 신호의 기본 주파수 주기의 정수배만큼 지연된, 입력 신호를 재생할 수 있다. 보강 로직은 입력 신호와 필터링된 신호를 조합하여 향상된 출력 신호를 발생시킨다.
신호 향상 시스템, 오디오 신호, 기본 주파수, 고조파, SNR, 지연 로직, 분할 적응 필터, 보강 로직

Description

주기 신호 향상 시스템 {PERIODIC SIGNAL ENHANCEMENT SYSTEM}
도 1은 선행 및 후행 처리 로직을 갖춘 신호 향상 시스템이다.
도 2는 단일 스테이지의 신호 향상 시스템이다.
도 3은 여성의 음성으로 적응되어 있는 필터에서의 필터 계수들의 플롯이다.
도 4는 남성의 음성으로 적응되어 있는 필터에서의 필터 계수들의 플롯이다.
도 5는 신호 향상의 흐름도이다.
도 6은 다중 스테이지의 신호 향상 시스템이다.
도 7은 분할 적응 필터를 포함하는 신호 향상 시스템이다.
도 8은 분할 적응 필터를 포함하는 신호 향상 시스템의 다른 구현이다.
도 9는 도 2 및 도 8에 나타낸 신호 향상 시스템들의 주파수 성능에 대한 비교이다.
도 10은 도 7 및 도 8에 나타낸 신호 향상 시스템들의 주파수 성능에 대한 비교이다.
도 11은 신호 향상의 흐름도이다.
도 12는 다중 스테이지의 신호 향상 시스템들이다.
<도면의 주요 부분에 대한 부호의 설명>
100 : 향상 시스템
102 : 선행 처리 로직
104 : 후행 처리 로직
106 : 입력 소스들
108 : 마이크로폰
110 : 샘플링 시스템
112 : 통신 인터페이스
114 : 오디오 재생 시스템
116 : 전송 시스템
118 : 비디오 처리 시스템
삭제
1. 기술 분야
본 발명은 신호 처리 시스템에 관한 것으로서, 보다 구체적으로는, 주기 신호 성분들을 향상시킬 수 있는 시스템에 관한 것이다.
2. 관련 기술
신호 처리 시스템들은 많은 역할들을 지원한다. 오디오 신호 처리 시스템들은 분명하고 깨끗하게 사운드를 포착하고, 사운드를 재생하며, 사운드를 다른 장치들에 전달한다. 그러나, 오디오 시스템들은, 신호 내용을 변질시키거나, 차단하거나, 신호 내용에 해로운 영향을 미칠 수 있는 잡음 소스들의 영향을 받을 수 있다.
많은 잡음 소스들이 존재한다. 바람, 비, 엔진 잡음과 같은 배경 잡음, 전자기 간섭, 및 다른 잡음 소스들이 포착될 수 있거나, 재생될 수 있거나, 다른 시스템에 전달되는 신호에 대한 잡음이 될 수 있다. 사운드의 잡음 레벨이 증가하면, 명료성이 감소한다.
일부의 종래 시스템들은 다수의 마이크로폰들을 통해 잡음 신호들을 최소화하려 했다. 각 마이크로폰으로부터의 신호들은 잡음을 제한하도록 지능적으로 조합된다. 그러나, 일부 애플리케이션들에서는, 다수의 마이크로폰들이 사용될 수 없다. 다른 시스템들은 잡음 필터들을 사용해 사운드 신호들을 선택적으로 감쇠시킨다. 상기 필터들은 때로는, 필요한 신호 내용조차도 무차별적으로 제거하거나 최소화한다.
신호들을 향상시키는 시스템에 대한 필요성이 존재한다.
본 발명은 신호 내용을 보강할 수 있으며 신호에서의 SNR을 향상시킬 수 있는 신호 향상 시스템을 제공한다. 상기 시스템은 신호에서의 비-정상 주기 신호 성분들(non-stationary periodic signal components)을 검출하고, 추적하며, 보강한다. 주기 신호 성분들은 모음 사운드들(vowel sounds) 또는 다른 음성 사운드들을 표현할 수 있다. 또한, 상기 시스템은 신호에서의 준-정상 신호 성분들(quasi-stationary periodic signal components)을 검출하고, 추적하며, 감쇠시킬 수 있다.
상기 향상 시스템은 신호 입력, 지연 로직, 분할 적응 필터(partitioned adaptive filter), 및 신호 보강 로직을 포함한다. 상기 분할 적응 필터는 입력 신호의 지연된 버전에 기초해 입력 신호에서의 비-정상 기본 주파수 성분들을 추적할 수 있다. 상기 분할 적응 필터는 다수의 필터링된 신호들을 출력한다. 필터링된 신호들은 입력 신호에서의 주파수 내용을 대략적으로 추적하고 향상시킬 수 있다. 상기 보강 로직은 입력 신호와 필터링된 신호들을 조합하여 향상된 신호를 생성한다. 입력 신호에서의 준-정상 신호 성분들을 추적하고 삭제하기 위해 제 2 적응 필터가 채용될 수 있다.
당업자라면, 다음의 도면들 및 상세한 설명을 살펴봄으로써, 본 발명의 다른 시스템들, 방법들, 사양들 및 이점들을 분명하게 알 수 있을 것이다. 이와 같은 추가적 시스템들, 방법들, 사양들 및 이점들 모두는 이 설명내에 포함되고, 본 발명의 범위내에 해당되며, 다음의 청구항들에 의해 보호되어야 한다.
다음의 도면들 및 설명을 참조함으로써, 본 발명을 좀더 잘 이해할 수 있다. 본 발명의 원리를 도시하는 것에 강조점이 주어지는 대신, 도면들의 컴포넌트들이 축척대로 설계될 필요는 없다. 또한, 도면들에서, 유사한 참조 번호들은 상이한 도면들 전체에 걸쳐 대응되는 부분들을 지시한다.
향상 시스템은 신호에서 하나 이상의 기본 주파수 성분들을 검출하고 추적한다. 상기 신호 향상 시스템은 추적된 주파수 성분들을 보강한다. 상기 향상 시스템은 음성 신호 또는 다른 오디오 신호들에서의 정보에 대한 명료성을 향상시킬 수 있다. 상기 보강된 신호는 향상된 SNR(signal-to-noise ratio)을 가질 수 있다.
도 1에서, 신호 향상 시스템(100)은 선행 처리 로직(preprocessing logic)(102) 및 후행 처리 로직(postprocessing logic)(104)과 함께 동작할 수 있다. 향상 시스템(100)은 하드웨어 및/또는 소프트웨어로 구현될 수 있다. 향상 시스템(100)은 DSP(digital signal processor)를 포함할 수 있다. DSP는 입력 신호들을 지연시키고, 신호의 주파수 성분들을 추적하며, 신호를 필터링하고 그리고/또는 신호의 스펙트럼 내용을 보강하는 명령어들을 실행시킬 수 있다. 다른 방법으로, 향상 시스템(100)은 이산 로직 또는 회로, 이산 로직과 프로세서의 혼합을 포함하거나, 다수 프로세서들 또는 프로그램들에 걸쳐 분산될 수도 있다.
향상 시스템(100)은 입력 소스들(106)로부터의 입력을 수용할 수 있다. 입력 소스들(106)은 디지털 신호 소스들 또는 마이크로폰(108)과 같은 아날로그 신호 소스들을 포함할 수 있다. 마이크로폰(108)은 샘플링 시스템(110)을 통해 향상 시스템(100)에 접속될 수 있다. 샘플링 시스템(110)은 마이크로폰(108)에 의해 감지된 아날로그 신호들을 선택된 샘플링 속도에서의 디지털 형태로 변환할 수 있다.
샘플링 속도는 임의의 소정 주파수 내용을 포착하도록 선택될 수 있다. 음성의 경우, 샘플링 속도는 약 8 kHz 내지 22 kHz일 수 있다. 음악의 경우, 샘플링 속도는 약 22 내지 44 kHz일 수 있다. 음성 및/또는 음악에 대해 다른 샘플링 속도들이 사용될 수도 있다.
디지털 신호 소스들은 통신 인터페이스(112), 향상 시스템(100)이 구현되는 시스템에서의 다른 회로나 로직, 또는 다른 신호 소스들을 포함할 수도 있다. 입력 소스가 디지털 신호 소스일 경우, 향상 시스템(100)은 추가적인 선행-처리와 함께 또는 추가적인 선행-처리없이 디지털 신호 샘플들을 수용할 수 있다.
신호 향상 시스템(100)은 후행-처리 로직(104)에 접속될 수 있다. 후행-처리 로직(104)은 오디오 재생 시스템(114), 디지털 및/또는 아날로그 데이터 전송 시스템들(116), 또는 비디오 처리 로직(118)을 포함할 수 있다. 다른 후행-처리 로직이 사용될 수도 있다.
오디오 재생 시스템(114)은 디지털-아날로그 컨버터들, 필터들, 증폭기들, 및 다른 회로 또는 로직을 포함할 수 있다. 오디오 재생 시스템(114)은 음성 및/또는 음악 재생 시스템일 수 있다. 오디오 재생 시스템(114)은 셀룰러폰, 카폰, 디지털 미디어 플레이어/레코더, 라디오, 스테레오, 휴대용 게임 장치, 또는 사운드 재생을 이용하는 다른 장치에서 구현될 수도 있다.
비디오 처리 시스템(118)은 비주얼 출력을 제공하는 회로 및/또는 로직을 포함할 수 있다. 비주얼 출력을 준비하는데 사용되는 신호는 향상 시스템(100)에 의해 수행되는 처리에 의해 향상될 수 있다. 비디오 처리 시스템(118)은 TV 또는 다른 오락 장치를 제어할 수도 있다. 다른 방법으로, 비디오 처리 시스템(118)은 컴퓨터 모니터 또는 LCD(liquid crystal display)를 제어할 수도 있다.
전송 시스템(116)은 네트워크 접속, 디지털 또는 아날로그 전송기, 또는 다 른 전송 회로 및/또는 로직을 제공할 수 있다. 전송 시스템(116)은 향상 시스템(100)에 의해 발생되는 향상된 신호들을 다른 장치들로 통신할 수 있다. 예를 들어, 카폰에서, 전송 시스템(116)은 카폰으로부터의 향상된 신호들을 ZigBee, Mobile-Fi, Ultrawideband, Wi-fi, 또는 WiMax 네트워크와 같은 무선 접속을 통해 기지국 또는 다른 수신기로 통신할 수 있다.
도 2는 향상 시스템(100)을 예시한다. 향상 시스템(100)은 신호 입력(202)을 포함한다. 신호 입력(202)은 향상 시스템(100)에 의해 처리될 입력 신호를 전달한다. 도 2에서, 입력 신호는 "x"로 표시된다. 입력 신호는 음성의 시간 영역 샘플들일 수 있다. 설명을 용이하게 하기 위해, 다음에서는 음성 신호들이 논의된다. 그러나, 향상 시스템(100)은, 가청 여부와 상관없이, 임의의 다른 주파수 범위의 내용을 가진 신호들도 향상시킬 수 있다.
향상 시스템(100)은 준-정상(quasi-stationary) 또는 비-정상(non-stationary) 신호들을 처리할 수도 있다. 비-정상 신호들은 그들의 주파수 및/또는 진폭 내용이 시간에 걸쳐 비교적 빠르게 변할 수 있다. 음성은 비-정상 신호의 일례이다.
몇가지 예외들이 있기는 하지만, 발화자 음성의 기본 주파수 성분조차도 발성(speech) 중에 달라진다. 기본 주파수의 변화는 100 ms마다 약 50 % 이상이나 변할 수도 있다. 그러나, 사람의 귀에 대해서는, 발화자의 음성이 비교적 일정한 피치(pitch)를 가질 수도 있다.
준-정상 신호들은 주파수 및/또는 진폭에 있어서 비-정상 신호들보다 덜 빈 번하게 변한다. 준-정상 신호들은 기계 잡음, 제어된 인간 음성, 또는 다른 소스들로부터 발생할 수 있다. 느리게 변하는 엔진 잡음 또는 교류 발전기 소리도 준-정상 신호들의 예들이다.
도 2에 나타낸 바와 같이, 입력 신호는 지연 로직(204)에 결합되어 있다. 지연 로직(204)은 입력 신호에 지연을 부여한다. 지연은 향상 시스템(100)의 특정 구현에 따라 크게 달라질 수 있다. 지연은 선택된 최대 피치 주기에 대응될 수 있다. 최대 피치는, 향상 시스템(100)이 향상시키는 입력 신호에서의 최대 피치와 동일할 수 있다. 최대 피치는 입력 신호의 유형 및 특징에 따라 크게 달라질 수 있다.
음성 신호들은 약 70 Hz에서 약 400 Hz까지의 기본 주파수 성분을 포함할 수 있다. 남성의 음성은 대개 약 70 Hz에서 약 200 Hz 사이의 기본 주파수 성분을 포함한다. 여성의 음성은 대개 약 200 Hz에서 약 400 Hz 사이의 기본 주파수 성분을 포함한다. 어린이의 음성은 대개 약 250 Hz에서 약 400 Hz 사이의 기본 주파수 성분을 포함한다.
향상 시스템(100)은, 개별적이거나 동시에 중첩하는, 남성 및 여성 음성들 모두로부터의 발성을 포함하는 입력 신호들을 처리할 수 있다. 이러한 시스템들에서, 최대 피치 주기는 대략적으로 여성 음성의 기본 주파수 주기에 대응될 수 있다. 최대 피치 주기는 약 1/300 Hz(약 3.3 ms)일 수 있거나, 여성의 음성과 관련된 다른 피치 주기일 수 있다.
다른 방법으로, 향상 시스템(100)은 남성들로부터의 발성만을 처리할 수도 있다. 이러한 구현들에서는, 최대 피치 주기가 남성 음성의 기본 주파수 주기에 대응될 수 있다. 최대 피치 주기는 약 1/150 Hz(약 6.6 ms)일 수 있거나, 다른 피치 주기일 수 있다.
지연 로직(204)은 입력 신호를 최대 피치 주기에 대응되는 신호 샘플들의 수만큼 지연시킬 수 있다. 신호 샘플들의 수는 다음과 같이 주어질 수 있는데,
Figure 112005061040213-pat00001
여기에서, 'NSS'는 신호 샘플들의 수이고, 'MPP'는 최대 피치 주기이며, 'fs'는 샘플링 속도이다. 약 3.3 ms의 MPP, 약 8 kHz의 샘플링 속도, 및 약 27개 샘플들의 NSS를 가정한다. 도 2에서, NSS는 Δ F0MAX 에 대응된다.
지연된 입력 신호가 필터(206)에 의해 수신될 수 있다. 필터(206)는, 도 2에서 'y'로 표시되어 있는, 필터링된 출력 신호를 전달하는, 필터 출력(208)을 포함한다. 필터(206)는 지연된 입력 신호에 기초해 입력 신호에서의 하나 이상의 주파수 성분들을 추적할 수 있다. 필터(206)는 발성 중에 피치가 변화함에 따라 입력 신호에서의 기본 주파수들을 추적할 수 있다.
필터(206)는 필터링된 출력 신호에서의 추적된 주파수 내용을 재생하거나, 복제하거나, 근사하거나, 포함할 수 있다. 필터(206)는 FIR(Finite Impulse Response) 필터 또는 다른 유형의 디지털 필터일 수 있다. 필터(206)의 계수들은 조정될 수 있다. 필터(206)는 NLMS(Normalized Least Mean Squares) 기술 또는, RLS(Recursive Least Squares)나 PLMS(Proportional LMS)와 같은, 다른 유형의 적응 필터링 기술에 의해 조정될 수 있다. 다른 필터들을 포함하는 다른 추적 로직이 사용될 수도 있다.
필터(206)는 입력 신호에서의 기본 주파수로 수렴할 수 있다. 필터(206)가 수렴하는 기본 주파수들(fo)의 범위는 다음과 같이 주어질 수 있는데,
Figure 112005061040213-pat00002
여기에서, Δ F0MAX 는 (샘플들의 관점으로 표현된) 최대 피치 동안의 주기이고, fs는 (Hz 단위의) 샘플링 주파수이며, L은 (샘플 단위의) 필터(206) 길이이다. 필터 길이(L)는, 필터(206)가 주파수 성분들을 추적하는 주파수 범위를 증가 또는 감소시키기 위해 증가 또는 감소될 수 있다.
상기 예에서, 최대 피치는 대략 300 Hz였고, 지연 로직(204)은 27 샘플 지연을 구현했다. 64 샘플들의 필터 길이(L)는, 약 88 Hz 내지 약 296 Hz의 주파수 범위에 걸쳐 기본 주파수 내용을 추적하는 필터(206)를 발생시킨다.
Figure 112005061040213-pat00003
필터(206)는 시간을 두고 적응할 수 있다. 필터(206)는 샘플-대-샘플 기반으로 오차 신호 'e'를 평가하는 것에 의해 빠르게 적응할 수 있다. 다른 방법으로는, 필터(206)는 샘플들의 블록들 또는 다른 것에 기초해 적응할 수도 있다.
적응시에, 필터(206)는 그것의 필터 계수들 중 하나 이상을 변경할 수 있다. 필터 계수들은 필터(206)의 응답을 변화시킬 수 있다. 필터 계수들은, 필터(206)가 오차 신호 'e'를 최소화하도록 필터(206)를 적응시킬 수 있다.
오차 추정기(210)는 오차 신호 'e'를 발생시킬 수 있다. 오차 추정기(210)는 가산기, 비교기, 또는 다른 회로나 로직일 수 있다. 오차 추정기(210)는 입력 신호 'x'를 필터링된 출력 신호 'y'와 비교할 수 있다.
필터(206)가 입력 신호의 기본 주파수에 수렴함에 따라, 오차 신호는 감소한다. 오차 신호가 감소함에 따라, 필터링된 출력 신호 'y'는, 신호의 기본 주파수들의 정수배만큼 지연된 입력 신호 'x'를 좀더 닮게 된다. 이득 제어 로직(212)은 오차 신호에 응답할 수 있다.
선택적인 이득 제어 로직(212)은 곱셈기(214) 및 이득 파라미터(216)를 포함할 수 있다. 이득 제어 로직(212)은 필터링된 출력 신호를 감쇠시키거나, 증폭시 키거나, 변경할 수 있다. 도 2는, 이득 제어 로직(212)이 필터링된 출력 신호에 이득 'A'를 적용하여 이득 제어 신호 'Ay'를 발생시키는 것을 나타낸다.
보강 로직(218)은 이득 제어 신호 'Ay'로 입력 신호 'x'의 주파수 내용을 보강할 수 있다. 보강 로직(218)은 가산기 또는 다른 회로 및/또는 로직일 수 있다. 보강 로직(218)은 향상된 출력 신호를 발생시킬 수 있다.
Figure 112005061040213-pat00004
오차 신호가 증가할 경우, 이득 제어 로직(212)은 이득 'A'를 감소시킬 수 있다. 이득이 감소될 때, 필터링된 출력 신호는 향상된 출력 신호에 영향을 덜 미칠 수 있다. 오차 신호와 이득간의 관계는 연속적이거나, 단계적이거나, 선형적이거나 또는 비선형적일 수 있다.
일 구현에서, 향상 시스템(100)은 하나 이상의 오차 임계치들을 확립한다. 오차 신호가 상한 임계치를 초과함에 따라, 이득 제어 로직(212)은 이득 'A'를 0(영)으로 감소시킬 수 있다. 상한 임계치는, e > x라면, 이득 'A'가 0으로 설정될 수 있도록, 입력 신호로 설정될 수 있다. 오차 신호가 하한 임계치 미만으로 떨어짐에 따라, 이득 제어 로직(212)은 이득 'A'를 1(일)로 증가시킬 수 있다.
오차 신호가 상한 임계치를 초과할 경우, 필터 제어 로직(220)은 필터(206)를 리셋할 수 있다. 필터(206)가 리셋되면, 제어 로직(220)은 필터 계수들을 삭감하거나, 필터 계수들을 재-초기화하거나, 다른 액션들을 취할 수 있다. 또한, 제어 로직(220)은 필터 길이를 동적으로 변경하거나, 지연 로직(204)에 의해 구현되는 지연을 변경하거나, 향상 시스템(100)의 다른 특징들을 변경할 수 있다. 또한, 제어 로직(220)은, 향상 시스템(100)을 변경시켜 향상 시스템(100)이 사용되는 가변 환경들에 적응시키고 향상 시스템(100)을 새로운 발화자 또는 다른 애플리케이션들에 적응시킬 수도 있다.
또한, 필터 제어 로직(220)은, 필터(206)가 적응하는 속도, 필터의 적응 여부를 제어할 수 있거나, 다른 필터 특징들을 모니터링하거나 제어할 수도 있다. 비-정상 신호들을 향상시키는 시스템의 맥락에서, 제어 로직(220)은 입력 신호에서의 빠르게 변하는 주파수 및 진폭 성분들을 예상할 수 있다. 또한, 제어 로직(220)은, 입력 신호에서의 소정 주파수 성분들이 우세한 시간을 예상하거나 판정할 수도 있다.
또한, 제어 로직(220)은, 입력 신호가 주파수 내용, 진폭, 또는 예상되는 것 또는 판정되었던 다른 특징들에 있어서 변경되었다고 판정할 수도 있다. 그에 따라, 제어 로직(220)은 필터(206)가 새로운 신호 내용에 적응하고자 하는 것을 중단시키거나, 적응 속도를 감속시키거나, 다른 액션들을 취할 수도 있다. 제어 로직(220)은, 입력 신호 특징들이 예상되는 것으로 되돌아오거나, 미리 정하여진 시간이 경과하거나, 제어를 해제할 것이 지시되거나, 다른 시간 또는 조건이 충족될 때까지, 필터(206)에 대한 제어를 실시할 수 있다.
지연 로직(204)은 필터링된 출력 신호가 현재의 입력 신호 'x'를 정확하게 복제하는 것을 방지한다. 따라서, 필터링된 출력 신호는 입력 신호 'x'에서의 선택된 주기성들을 정확하게 추적할 수 있다. 현재의 입력 신호 'x'가 필터링된 출력 신호 'y'에 의해 보강되어 출력 신호 's'를 발생시킬 때, 주기 신호 성분들은 보강식으로 조합될 수 있고 무작위 잡음 성분들은 소멸식으로 조합될 수 있다. 따라서, 주기 신호 성분들은 잡음보다 더 많이 향상될 수 있다.
지연 로직(204) 및 필터(206)에 의해 도입되는 지연은 필터(206)에 의해 추적되는 기본 주파수 성분의 약 1 주기일 수 있다. 지연은, 모음과 같은, 음성 사운드들에 대한 성문 펄스 지연(glottal pulse delay)에 대응할 수 있다. 필터링된 출력 신호가 입력 신호에 가산될 때, 지연으로 인해 기본 주파수 성분들은 동-위상 또는 대략적인 동-위상으로 가산될 수 있다.
동-위상 가산될 때, 향상된 출력 신호에서의 기본 주파수 내용에 대한 결과적인 이득은 약 6 dB 이상일 수 있다. 입력 신호 및 필터링된 출력 신호에서의 잡음은 위상을 벗어나는 경향이 있다. 입력 신호와 필터링된 출력 신호가 가산될 때, 잡음은 향상된 주파수 내용 미만으로, 예를 들어, 3 dB 이하로 증가될 수 있다. 향상된 출력 신호는 증가된 SNR을 가질 수도 있다.
향상 시스템(100)이 처리하는 입력 신호는 다수의 기본 주파수를 포함할 수 있다. 예를 들어, 2명의 발화자들이 동시에 말하는 경우, 입력 신호는 2개의 비-정상 기본 주파수를 포함할 수 있다. 다수의 기본 주파수가 존재할 경우, 필터(206)는 계속 적응 및 수렴하여, 입력 신호의 지연 버전인 필터링된 출력 신호 'y'를 제공할 수 있다. 보강 로직(218)은 입력 신호에 존재하는 기본 주파수들 중 하나 이상을 보강할 수 있다.
도 3에서, 플롯은 필터(206)에 대한 계수들(300)을 도시한다. 계수들은 수평축상의 계수 번호 및 수직축상의 크기에 의해 플로팅된다. 계수들(300)은 필터가 여성의 음성으로 적응되어 있다는 것을 나타낸다.
임의의 시점에서, 계수들(300)은, 양호한 시간 해상도로 입력 신호의 기본 주파수들에 대한 빠른 추정치를 판정하도록 분석될 수 있다. 계수들(300)은 계수(304;다섯번째 필터 계수), 계수(306;여섯번째 필터 계수), 및 계수(308;일곱번째 필터 계수) 부근에서 피크를 이루기 시작한다. 계수 피크 또는 대략적인 계수 피크를 검색하고 대응되는 계수 인덱스 'c'를 판정하는 것에 의해, 기본 주파수 fa의 빠른 근사가 수행될 수 있다.
Figure 112005061040213-pat00005
Figure 112005061040213-pat00006
도 3에서, 계수 피크는 여섯번째 필터 계수(306)에 위치한다. 8 kHz의 샘플링 속도 및 27 샘플 지연을 가정한다면, 다음과 같다.
Figure 112005061040213-pat00007
도 4에서, 플롯은 필터(206)가 남성의 음성으로 적응되어 있는 필터의 계수(400)를 보여준다. 계수 피크는 계수(402;34번째 필터 계수), 계수(404;35번째 필터 계수), 및 계수(406;36번째 필터 계수) 부근에서 나타난다. 기본 주파수로의 근사는 다음과 같다.
Figure 112005061040213-pat00008
제어 로직(220)은, 입력 신호가 시간에 따라 변화할 때의 기본 주파수를 비롯하여, 입력 신호의 다수 특징들에 관한 이력 데이터를 저장할 수 있다. 제어 로직(220)은, 입력 신호의 특징들이 갑자기 변경되었는지의 여부를 판정할 때의 도움으로서 이력 데이터를 조사할 수 있다. 제어 로직(220)은, 필터(206)에 대한 적응 제어를 실시하거나 다른 액션들을 취함으로써 응답할 수 있다.
도 5는 주기 신호를 향상시키기 위해 취해질 수 있는 동작들의 흐름도(500)를 나타낸다. 향상 시스템(100)에 의한 처리를 위해 최대 피치가 선택된다(동작 502). 지연 로직(204)은 최대 피치의 주기를 구현하도록 설정될 수 있다(동작 504).
향상 시스템(100)이 동작할 주파수 범위도 선택될 수 있다(동작 506). 필터(206)의 필터 길이는 주파수 범위를 수용하도록 설정될 수 있다(동작 508). 필터 길이는, 필터(206)가 동작하는 동안 동적으로 변경될 수도 있다.
입력 신호는 지연되고 필터링된다(동작510). 향상 시스템(100)은 오차 신호를 발생시킬 수 있고 그에 따라 필터(206)를 조정할 수 있다(동작 512). 향상 시스템(100)은 필터링된 출력 신호의 이득을 제어할 수 있다(동작 514).
향상 시스템(100)은 입력 신호와 이득 제어 신호를 가산할 수 있다(동작 516). 향상된 출력 신호가 얻어질 수 있다. 또한, 향상 시스템(100)은 기본 주파수 추정치들을 판정할 수도 있다(동작 518). 향상 시스템(100)은 주파수 추정치들을 이용해 필터(206)에 대한 적응 제어를 실시할 수 있다(동작 520).
도 6은 다중 스테이지의 향상 시스템(600)을 나타낸다. 향상 시스템(600)은 제 1 필터 스테이지(602) 및 제 2 필터 스테이지(604)를 포함한다. 필터 스테이지들(602 및 604)은 상이한 속도로 응답하거나 적응할 수 있다.
제 1 필터 스테이지(602)는 느리게 적응할 수 있고 준-정상 신호 성분들을 억제할 수 있다. 준-정상 신호 성분들은, 엔진 잡음 또는 환경 영향들과 같은, 비교적 일관된 배경 잡음으로 인해 또는 다른 원인들로 인해 입력 신호에 존재할 수 있다.
신호 입력(606)은 제 1 스테이지(602)에 접속한다. 신호 입력(606)은 지연 로직(608)에 접속할 수 있다. 지연 로직은, 제 1 스테이지(602)에 의해 억제될 수 있는 최대 준-정상 주파수의 주기에 대응하는 지연을 구현한다.
최대 준-정상 주파수는, 향상 시스템(600)이 사용되는 환경의 공지 또는 예상 특징들에 따라 선택될 수 있다. 필터 제어 로직(610)은 지연을 동적으로 변경시켜 제 1 스테이지(602)를 환경에 적응시킬 수 있다. 또한, 필터 제어 로직(610)은 준-정상 필터(612)를 제어할 수도 있다.
제 1 스테이지의 필터(612)는 NLMS 적응형 FIR 필터 또는 RLS 적응형 FIR 필터와 같은 신호 성분 추적 로직을 포함할 수 있다. 제 1 스테이지의 필터(612)는, 예를 들어, 8 kHz의 샘플링 속도 및 64의 필터 길이로써 천천히 적응할 수 있고, 0보다 크고 대략 0.01보다 작은 NLMS 스텝 사이즈는 통상적인 음성 신호들의 열화(degrade)를 최소화하면서 준-정상 주기 신호들이 감쇠될 수 있게 한다. 제 1 스테이지의 필터링된 출력(614)은 입력 신호의 준-정상 신호 성분을 대략적으로 재생하는 필터링된 출력 신호를 제공할 수 있다.
억제 로직(616) 및 느린 필터 적응으로 인해, 비-정상 신호 성분들이 제 1 스테이지(602)를 통해 제 2 스테이지(604)로 전달될 수 있다. 한편, 억제 로직(616)은 입력 신호의 준-정상 신호 성분들을 억제할 수 있다. 억제 로직(616)은, 입력 신호에서 필터링된 출력 신호를 감산하는 산술 로직으로 구현될 수도 있다.
필터링된 출력 신호의 복제된 준-정상 신호 내용은 입력 신호에서 삭제된다. 제 1 스테이지(602)에 의해 발생되는 출력 신호는 다음과 같은데,
Figure 112005061040213-pat00009
여기에서, 'e1'은 제 1 스테이지의 출력 신호이고, 'x'는 입력 신호이며, 'y1'은 제 1 스테이지의 필터링된 출력이다.
제 1 스테이지 출력(618)은 제 2 스테이지(604)에 접속될 수 있다. 제 2 스테이지(604)는 적응 필터(206)로 신호 'x2'를 처리할 수 있다. 필터(206)는, 예를 들어, 8 kHz의 샘플링 속도 및 64의 필터 길이로 빠르게 적응할 수 있고, 대략 0.6보다 크고 1.0보다 작은 NLMS 스텝 사이즈로 인해 적응 필터(206)는 통상적인 음성 신호들에서의 기본 주파수들을 추적할 수 있다.
제 2 스테이지(604)는 제 1 스테이지 출력 신호의 비-정상 신호 성분들을 향상시킬 수 있다. 비-정상 신호 성분들은 발화, 음악, 또는 다른 신호 소스들의 결과로서 입력 신호에 존재할 수 있다. 제 2 스테이지(604)는 상술된 바와 같이 제 1 스테이지 출력 신호를 처리할 수 있다.
향상 시스템(600)은 제 2 향상 스테이지(604)가 후속되는 제 1 억제 스테이지(602)를 이용한다. 향상 시스템(600)은, 음성 내용과 같은, 비-정상 신호 내용을 보강하는데 이용될 수 있다. 느리게 변하는 신호 성분들을 도입하는 환경들에서, 향상 시스템(600)은 그 느리게 변하는 신호 성분들을 삭제 또는 억제할 수 있다. 예를 들어, 카폰에서, 제 1 스테이지(602)는 엔진 잡음, 거리 잡음, 또는 다른 잡음들을 삭제 또는 억제할 수 있는 한편, 제 2 스테이지(604)는, 남성 또는 여성의 음성 성분들과 같은, 비-정상 신호 성분들을 향상시킨다.
신호 향상 시스템(100)은 주기 신호 내용을 향상시킬 수 있고, SNR을 증가시킬 수 있으며, 그리고/또는 입력 신호에서의 잡음을 감소시킬 수 있다. 음성 신호에 적용될 경우, 향상 시스템(100)은 기본적인 음성 주파수들을 보강할 수 있고 모음 또는 다른 사운드들을 강화할 수 있다. 향상 시스템(100)은, 가청 여부에 상관없이, 다른 신호들을 향상시킬 수 있다.
또한, 지연 로직(204 또는 608) 및 필터(206 또는 612)에 의해 도입되는 전반적인 지연은 대략적으로, 추적되는 피치 주기의 (1 이상의) 정수배 사이클들일 수 있다. 추가적인 사이클들만큼 지연시키는 것으로 인해, 입력 신호는 1 사이클을 대기하는 것보다 더 많이 변화될 수 있다. 더 길게 지연된 필터링 신호를 현재의 입력 신호에 가산하면, 여전히 기본 주파수 성분들을 향상시키면서도, 출력 신호에는 반향(reverberation)과 같은 특수 효과들이 발생될 수 있다.
도 7에서는, 신호 향상 시스템(700)이 분할 적응 필터(702) 뿐만 아니라 분할 지연 로직(704)을 포함한다. 분할 적응 필터(702)는, 도 7에 1 내지 'i'의 적응 필터들로서 도시되어 있는 다수의 적응 필터들을 포함한다. 적응 필터들(1, 2, 3, 및 'i')은 각각 706, 708, 710, 및 712로 표시되어 있다. 각 적응 필터의 출력은, 고정 또는 가변 이득 파라미터들을 필터 출력들에 적용하는 곱셈기들을 포함하는 이득 로직(744)에 접속될 수 있다. 도 7은 필터들(706-712)의 출력들에 개별적으로 적용되는 이득 파라미터들(714, 716, 718, 및 720)을 도시한다. 이득 및 필터 제어 로직(722)은 이득 파라미터들(714-720)에 대한 제어 및 각각의 개개 필터들(706-712)에 대한 필터 적응을 실시할 수 있다.
하나 이상의 이득 가중 필터 출력들은 보강 로직(724)에 의해 다같이 가산되어 필터 출력들의 가중된 합 'ySUM'을 획득할 수 있다. 보강 로직(726)은 가중 합의 필터 출력들 'ySUM'을 입력 신호 'x'에 가산하여 출력 신호 's'를 발생시킨다. 보강 로직은 가산기 또는 다른 신호 합산기일 수 있다. 분할 지연 로직(704)은, 그들 중 5개가 지연 블록들(728, 730, 732, 734, 및 736)로서 표시되어 있는, 다수의 직렬-접속된 지연 블록들을 포함한다.
각 필터(706-712)는, 분할 지연 로직(704)에 의해 지연된 후의 입력 신호 'x'를 수신하고 'x' 및 그 필터의 출력 신호 'y'에 기초해 그 필터에 대한 개개의 오차 신호 'e'를 판정한다. 예를 들어, 제 1 적응 필터(702)에 대한 오차 신호 'e'는 'e1' = 'x'-'y1'이다. 각각의 적응 필터(706-712)는 그것의 개개 오차 신호 'ei'를 최소화하도록 적응한다.
분할 필터(702)는 다수의 적응 필터들(706-712)에 걸쳐 작업을 추적하는 전체 신호를 분할한다. 각각의 적응 필터(706-712)는 분할 필터(702)의 전체 임펄스 응답의 일부를 처리하고 적응시킬 수 있다. 그 결과, 각각의 적응 필터(706-712)는 도 2에 나타낸 좀더 긴 적응 필터보다 작은 길이(예를 들어, 더 작은 수의 탭들)를 가질 수 있다.
120개의 탭들 및 6개의 적응 필터를 갖고 구현되는 임펄스 응답이 주어질 경우, 각각의 적응 필터는 전체 임펄스 응답의 20개 (또는 다른 임의 갯수의) 탭들을 처리할 수 있다. 다른 구현에서는, 필터(702)에서의 적응 필터 분할들의 수가 전체 임펄스 응답의 길이와 같으므로, 각각의 적응 필터는 1의 길이를 가진다. 분할된 필터(702)의 전체 길이는, 분할된 필터(702)가 추적할 주파수들의 범위와 관련하여 상술된 바와 같이 선택될 수 있다.
적응 필터들(706-712)은 입력 신호에서의 예상되는 기본 주파수들에 따라 길이가 달라질 수 있다. 예상되는 기본 주파수에서 또는 예상되는 기본 주파수 부근에서 임펄스 응답 부분을 처리하기 위해, 적응 필터들(706-712)이 좀더 빠르게 적응하는 더 짧은 필터들로 분할될 수도 있다. 예상되는 기본 주파수를 벗어나면, 적응 필터들(706-712)은 좀더 느리게 적응하는 더 긴 필터들일 수 있다. 따라서, 적응 필터들(706-712)의 길이들은 입력 신호의 관심 주파수들에서 또는 관심 주파수들 부근에서 빠른 적응을 제공하도록 선택될 수 있다.
각각의 적응 필터(706-712)는 개별적으로 더 적은 필터 계수 업데이트들을 사용한다. 적응 필터(706-712)는 더 긴 적응 필터들을 이용하는 구현에서의 필터들보다 좀더 빠르게 업데이트할 수 있다. 좀더 빠른 필터 업데이트는, 특히 높은 주파수들에서, 전반적으로 향상된 추적 성능을 제공한다. 전반적인 추적 성능 증가는, 기본 주파수들이 음성인지 아니면 인위적으로 발생된 것인지에 상관없이, 빠 르게 변하는 기본 주파수들을 추적하기에 적합하다. 개개의 오차 신호들 'ei'에 기초해 필터 계수들을 업데이트하기 위해, LMS(least-mean-square) 알고리즘, RLS(recursive-least-square) 알고리즘, LMS 및 RLS의 변형들, 또는 다른 기술들이 이용될 수 있다.
지연 로직(704)은 필터들(706-712) 중 하나 이상으로의 입력 신호 'x' 도달을 지연시킨다. 도 7은, 각각의 필터(706-712)가 자신만의 지연과 관련되어 있다는 것을 나타낸다. 각각의 지연 블록(728-736)은 임의 갯수의 신호 샘플들의 지연을 구현할 수 있다.
일 구현은 제 1 지연 블록(728)에서 D개 샘플들의 초기 지연을 사용한다. 각각의 후속 지연 로직(730-736)은, 도 7에 M1, M2, M3, 및 Mi개 샘플들의 지연들로서 표시되어 있는, 개별적으로 구성 가능한 지연을 가진다. i번째 필터(712)에 공급하는 i번째 지연 블록(736)에 이르기까지, 지연 블록(730)은 제 1 적응 필터(706)에 공급하고, 지연 블록(732)은 제 2 적응 필터(708)에 공급하며, 제 3 지연 블록(732)은 제 3 적응 필터(710)에 공급하는 식이다.
지연들(D, M1, …, Mi)은 각각 동일하거나 각각 상이할 수 있다. 지연들(M1, …, Mi)은, 지연 블록이 공급하는 적응 필터의 길이(예를 들어, 탭들의 수)에 대응하거나, 지연 블록이 공급하는 적응 필터의 길이와 상이할 수 있다. 예를 들어, 적응 필터(710)의 길이는 M3개 탭들일 수 있고 적응 필터(706)에 공급하는 지연 블록(734)은 신호 샘플들을 M3개 샘플들만큼 지연시킬 수 있다.
적응 필터의 길이 'i'가 그와 관련된 지연 Mi보다 작을 때, 적응 필터는 초기에 좀더 빠르게 수렴할 수 있다. 적응 필터의 길이 'i'가 그와 관련된 지연 Mi보다 클 때, 적응 필터는 수렴시에 더 작은 제곱 평균 오차(mean squared error)를 경험할 수 있다. 필터 길이들 및/또는 지연 로직(730-736)은, 시스템(700)이 이용되는 구현을 위한 구현 가이드라인들에 따라 설정될 수 있다.
지연(D)은 시스템(700)이 적응할 기본 주파수들의 범위를 설정하도록 선택될 수 있다. 필터(700)가 수렴하거나 적응하는 기본 주파수들(fo)이나 피치들의 범위는 다음과 같이 주어지는데,
Figure 112005061040213-pat00010
여기에서, L은 분할 적응 필터(702)의 전체 길이로서, 예를 들어, L = M1 + M2 + … + Mi이고, fs는 샘플링 속도이다.
이득 및 필터 제어 로직(722)은 개별 기초로, 즉, 각각의 개개 필터(706-712)에 대한 이득들(714-720) 및 필터 적응에 대한 제어를 실시할 수 있다. 필터 제어(220)와 관련하여 상술된 제어 기술들이 신호 향상 시스템(700)에 이용될 수 있다. 이득들(714-720)은 입력 신호 'x'의 SNR에 비례하거나 그에 기초해 다르게 설정될 수 있다. SNR이 감소함에 따라, 이득들(714-720) 중 하나 이상은 잡음을 억제하기 위해 증가할 수 있다. SNR이 증가함에 따라, 이득들(714-720) 중 하나 이상은 감소하거나 0으로 설정될 수 있다.
이득들(714-720)은 그것의 대응되는 적응 필터에 대한 필터 계수들의 함수로서 또는 다른 방법들로 판정될 수 있다. 선택적으로 정규화 상수 'k'를 포함하는, 이득들(714-720)을 위한 일 표현은 다음과 같다.
Figure 112007020752210-pat00011
= f(
Figure 112007020752210-pat00012
)/k
함수 f(
Figure 112005061040213-pat00013
) 는 적응 필터 계수들의 함수이고, 원하는 향상에 따라 다수의 방법들로 정의될 수 있다. f(
Figure 112005061040213-pat00014
)의 예들로는 다음과 같은 것들을 들 수 있다.
Figure 112005061040213-pat00015
Figure 112005061040213-pat00016
Figure 112005061040213-pat00017
f( ) = | (n)|
Figure 112005061040213-pat00018
Figure 112005061040213-pat00019
Figure 112005061040213-pat00020
Figure 112005061040213-pat00021
f( ) = | (n)|
Figure 112005061040213-pat00022
Figure 112005061040213-pat00023
f( ) =
Figure 112005061040213-pat00024
Figure 112005061040213-pat00025
f( ) =
Figure 112005061040213-pat00026
Figure 112005061040213-pat00027
f( ) = , m>0
일 구현에서, 수학식 5는 m=2 및 1의 필터 길이로써 이용된다. 증가하는 'm'은 고조파들의 더 큰 향상을 제공할 수 있다. 이득들(714-720)은 필터 계수들과 함께 또는 필터 계수들의 대안으로서 다른 정보에 기초해 선택되거나 판정될 수 있다. 정규화 상수 'k'는 다음과 같이 설정될 수 있다.
Figure 112005061040213-pat00028
이득들(714-720)은 입력 신호의 주기 성분들을 향상시키거나 강화시킬 계수들로 적응 필터의 영향을 증폭시키도록 선택되거나 변경(예를 들어, 증가)될 수 있다. 또한, 이득들(714-720)은 입력 신호의 주기 성분들을 열화시키거나 약화시킬 계수들(일반적으로 음의 계수들)로 적응 필터의 영향을 감소 또는 제거하도록 선택되거나 변경될 수 있다(예를 들어, 감소되거나 0으로 설정될 수 있다). 그러나, 이득들(714-720)은, 필터 계수들의 크기에 따른 다른 방법들로 설정될 수도 있다. 따라서, 향상 시스템(700)은, 시스템(700)에서 향상만이 발생하도록, 개별 기준으로 이득들(714-720)을 설정할 수도 있다.
보강 로직(726)은 다음과 같은 향상된 출력 신호 's'를 발생시킨다.
Figure 112005061040213-pat00029
도 8은, 향상 시스템(700)에 대한 대안을 제공하는 향상 시스템(800)을 나타낸다. 향상 시스템(800)은 개별적으로 제어되는 이득들(714-720)을 이득 로직 (802), 즉, 곱셈기 및 이득 파라미터로 대체한다. 이득 로직(802)은 이득 파라미터 'A'(804)만큼 적응 필터 출력들의 합을 바이어스한다. 보강 로직(806)은 각 적응 필터 출력의 합을 제공할 수 있다.
향상 시스템들(700 및 800)에 의해 발생되는 신호 's'는 강화된 기본 주파수들 및 기본 주파수들의 고조파들을 포함함으로써, 좀더 명료한 오디오 신호를 발생시킨다. 향상 시스템들의 각 적응 필터(706-712)는 자신만의 오차 신호에 의해 독립적으로 업데이트됨으로써, 필터 및 전반에 대해 좀더 빠른 적응을 초래할 수 있다. 다수 적응 필터들로의 분리는 그에 의해 인접 고조파들간의 감소된 손상, 더 작은 고조파들(예를 들어, 잡음 레벨에 가까운 고조파들)의 좀더 양호한 보존, 및 입력 신호의 비-주기 성분들에 대한 보다 작은 왜곡을 초래한다. 더 나아가, 향상 시스템(700)은 심지어 잡음에 매입되어 있는 고조파들도 잡음 이상의 레벨들로 향상시킬 수 있고, 작은 고조파들도 더 양호하게 보존할 수 있다. 구현들 중에서 선택할 때, 향상 시스템(800)은 감소된 복잡도 및 감소된 계산 요구 사항들의 이점들을 갖는 한편, 향상 시스템(700)은 각 적응 필터(702-708)의 이득 및 출력 신호에 대한 그것의 영향을 독립적으로 제어하기 위한 융통성을 제공한다는 이점을 가진다.
도 9는 신호 향상 시스템들(200 및 800)의 주파수 성능에 대한 비교이다. 플롯(902)은, 입력 신호(904) 및 출력 신호(906)를 포함하는, 신호 향상 시스템(200)의 성능을 도시한다. 플롯(908)은, 동일한 입력 신호(904) 및 향상된 출력 신호(910)를 포함하는, 신호 향상 시스템(800)의 성능을 도시한다. 플롯(908)은, 향상된 고주파수 응답을 포함하여, 신호 향상 시스템(200)에 비해 전반적으로 향상된, 향상 시스템(800)의 추적 응답을 나타낸다. 출력 신호(910)는 입력 신호(904)의 고주파수 내용을 훨씬 더 근접하게 추적한다.
또한, 플롯들(902 및 908)은 향상 시스템(800)에 의해 실현되는 고조파들간의 향상된 분리도 나타낸다. 플롯(902)은 입력 신호(904)와 향상된 신호(906)간의 주파수 응답 갭(912)을 나타낸다. 향상 시스템(800)의 성능 플롯(908)은, 참조 번호(914)에 의해 지시되는 바와 같이, 갭이 훨씬 작다는 것을 나타낸다. 출력 신호(910)는 고조파들간의 향상된 분리를 가짐으로써, 출력 신호(910)의 고조파들 사이에서 보다 작은 손상을 초래한다.
도 10은 신호 향상 시스템들(700 및 800)의 주파수 성능에 대한 비교이다. 플롯(1002)은, 향상 시스템에 의해 발생하는 입력 신호(1004) 및 출력 신호(1006)를 포함하는, 신호 향상 시스템(800)의 성능을 도시한다. 플롯(1008)은, 동일한 입력 신호(1004) 및 출력 신호(1010)를 포함하는, 신호 향상 시스템(700)의 성능을 도시한다. 플롯(1008)은, 더 작은 고조파들의 개선된 향상을 포함하는, (개별적으로 제어되는 이득들(714-720)을 가진) 향상 시스템(700)의 전반적으로 향상된 추적 응답을 나타낸다.
향상된 더 작은 고조파들의 예들(1012, 1014, 1016, 및 1018)이 도 10에 표시되어 있다. 향상된 고조파들(1012 및 1014)은 대략적으로 플롯(1002)의 3000 및 3200 Hz에 위치하며 향상 시스템(800)에 의해 강화되었다. 향상 시스템(700)은 플롯(1008)에서의 향상된 고조파들(1016 및 1018)에 의해 지시되는 바와 같이 더 작 은 고조파들에 대해 훨씬 더 큰 향상을 제공한다.
도 11은 주기 신호를 향상시키기 위해 취해질 수 있는 동작들의 흐름도(1100)를 나타낸다. 향상 시스템들(700, 800)이 추적할 최대 피치가 선택된다(동작 1102). 피치는 맞닥뜨릴 것으로 예상되는 신호들의 유형 및, 남성, 여성, 또는 어린이의 음성 특징들과 같은, 그들의 특징들에 따라 선택될 수 있다. 지연 블록들(728-736)에 의해 구현되는 전체 지연은 최대 피치 주기로 설정될 수 있다(동작 1104).
향상 시스템들(700, 800)이 동작할 주파수 범위도 또한 선택될 수 있다(동작 1106). 적응 필터들(702-708)의 전체 필터 길이는 주파수 범위를 수용하도록 설정될 수 있다(동작 1108). 필터 길이, 주파수 범위, 및 최대 피치는 향상 시스템의 동작 동안 동적으로 변경될 수 있다.
향상 시스템은 전체 임펄스 응답을 다수의 적응 필터들(702-708)에 걸쳐 분할한다(동작 1110). 적응 필터는 관심있는 기본 주파수에 대한 임펄스 응답의 크기가 높은 부분들에서 더 작은 블록들로 분할될 수 있다. 임의의 적응 필터(706-712)가 임펄스 응답의 하나 이상의 포인트들을 처리할 수 있다. 각각의 적응 필터(706-712)는 임펄스 응답의 동일하거나 상이한 수의 포인트들을 처리할 수 있다.
향상 시스템들(700 및 800)은 입력 신호를 수신한다(동작 1112). 향상 시스템들(700 및 800)은 분할 적응 필터를 이용하여 입력 신호를 필터링한다(동작 1114). 개별적으로 선택된 이득들이 각 적응 필터의 필터링된 출력 신호에 적용된다(동작 1116). 다음에, 이득 제어된 출력 신호들이 합산된다. 다른 방법으로는, 하나 이상의 필터링된 출력 신호들의 합에 이득이 적용될 수도 있다. 향상 시스템들(700, 800)은 입력 신호와 이득 제어된 출력 신호들을 더한다(동작 1118). 강화된 기본 주파수 및 고조파 내용을 갖춘 향상된 출력 신호가 얻어진다.
향상 시스템들(700 및 800)은 피치 추정 출력 'p'(740)을 포함하는 피치 검출 로직(738)을 포함할 수 있다. 피치 검출 로직(738)은 상술된 바와 같이 입력 신호의 신호 성분들에 대한 기본 주파수 추정치들을 판정할 수 있다(동작 1120). 추정치들은 기본 주파수를 빠르게 추정하기 위해 각 적응 필터(706-712)에 걸친 필터 계수들의 분석에 기초할 수 있다. 주파수 추정치들 또는 다른 정보는, 적응 속도를 증가시키거나 감소시키는 것, 필터 길이들을 변경하는 것, 필터들을 추가하거나 삭제하는 것, 및 다른 적응들과 같은, 향상 시스템들(700 및 800)이 필터들(702-708) 및 이득들에 대한 적응 제어를 실시하기 위한 기초를 제공할 수 있다(동작 1122).
또한, 향상 시스템들(700 및 800)은 음성 검출 출력 'v'(744)를 포함하는 음성 검출 로직(742)을 포함할 수도 있다. 음성 검출 로직(742)은 필터 계수들에서 소정 임계치(예를 들어, 배경 잡음 레벨)를 초과하는 피크들을 찾아낼 수 있다. 이러한 계수들은 입력 신호에 주기 주파수 성분이 있다는 것을 나타낼 수 있다. 모음 사운드들은, 특히 강한 피크들일 수 있는, 배경 잡음 레벨을 초과하는 계수 피크들을 발생시킬 수 있다. 음성 검출 로직(742)은, 임계치를 초과하는 피크들이 존재할 때, 입력 신호가 발성 성분을 포함한다는 것을 나타내는 음성 검출 출력 'v'를 제공할 수 있다.
음성 검출 로직(742)은 검출 측정치를 판정할 수 있다. 검출 측정치는 입력 신호에 음성이 존재하는지에 대한 지시를 제공한다. 검출 측정치는 양의 필터 계수들에 대한 크기들의 합일 수 있다. 합이 임계치를 초과할 때, 음성 검출 로직은 음성 검출 출력 'v'(744)를 제공할 수 있다.
각각의 적응 필터(702-708)는 자신만의 오차 신호를 발생시킨다(동작 1124). 그에 의해, 각각의 적응 필터(702-708)는 자신만의 오차 신호에 기초해 적응한다(동작 1126). 향상 시스템들(700, 800)은 입력 신호의 구간 동안 향상된 출력 신호를 계속 제공할 수 있다(동작 1128).
도 12는 다중 스테이지의 향상 시스템(1202) 및 다중 스테이지의 향상 시스템(1204)을 나타낸다. 시스템(1202)은 신호 향상 시스템(700)에 결합되어 있는 느리게 적응하는 필터 스테이지(예를 들어, 스테이지 602)를 포함한다. 입력 신호 'x'(1206)는 느리게 적응하는 필터 스테이지(602)에 결합되어 있고, 신호 향상 시스템(700)은 향상된 출력 신호 's'(1208)를 발생시킨다. 다중 스테이지의 향상 시스템(1204)은 신호 향상 시스템(800)에 결합되어 있는 느리게 적응하는 필터 스테이지(602)를 이용해 향상된 출력 신호 's'(1210)를 발생시킨다.
느리게 적응하는 필터 스테이지(602)는 준-정상 신호 성분들을 억제할 수 있다. 느리게 변하는 주파수 내용을 가진 배경 잡음으로 인해, 준-정상 신호 성분들이 입력 신호에 존재할 수 있다. 느리게 적응하는 필터 스테이지(602)는 엔진 잡음, 환경 영향들, 또는 비교적 느리게 변하는 주파수 특징들을 가진 다른 잡음 소스들을 억제할 수 있다. 후속하여, 신호 향상 시스템들(700, 800)은 느리게 적응하는 필터 스테이지(602)를 통과하는, 음성 신호에 존재하는 것과 같은, 주기 주파수 내용을 향상시킨다.
신호 향상 시스템들(200, 600, 700, 및 800)은 하드웨어, 소프트웨어, 또는 하드웨어와 소프트웨어의 조합으로 구현될 수 있다. 향상 시스템들은 디스크, EPROM, 플래시 카드, 또는 다른 메모리와 같은 머신 판독 가능 매체에 저장되어 있는 명령어들의 형태를 취할 수 있다. 향상 시스템들(200, 600, 700, 및 800)은 통신 장치들, 사운드 시스템들, 게임 장치들, 신호 처리 소프트웨어, 또는 다른 장치들 및 프로그램들로 통합될 수도 있다. 향상 시스템들(200, 600, 700, 및 800)은 마이크로폰 입력 신호들을 선행-처리하여 후속 처리를 위한 모음 사운드들의 SNR을 향상시킬 수 있다.
본 발명의 다양한 실시예들이 설명되었지만, 당업자들에게는, 본 발명의 범위내에서 더 많은 실시예들 및 구현들이 가능할 수 있다는 것이 명백할 것이다. 따라서, 본 발명은 첨부된 청구항들 및 그들의 등가물들에 의해서만 한정될 것이다.
따라서, 본 발명에 따르면, 본 발명은 신호 내용을 보강할 수 있으며 신호에서의 SNR을 향상시킬 수 있는 신호 향상 시스템이 제공된다.

Claims (18)

  1. 신호 향상 시스템으로서,
    신호 입력과;
    상기 신호 입력에 결합되어 있는 분할 지연 로직과;
    상기 분할 지연 로직에 결합되어 있으며 다수의 적응 필터 출력들을 포함하는 분할 적응 필터와;
    상기 적응 필터 출력들에 결합되어 있는 필터 보강 로직과;
    상기 필터 보강 로직에 결합되어 있는 이득 로직과;
    상기 신호 입력 및 상기 이득 로직에 결합되어 있으며 향상된 신호 출력을 포함하는 신호 보강 로직;
    을 포함하는 신호 향상 시스템.
  2. 제 1 항에 있어서,
    상기 다수의 필터 출력들은 제 1 필터 출력 및 제 2 필터 출력을 포함하고,
    상기 분할 적응 필터는 제 1 적응 필터 및 제 2 적응 필터를 포함하며,
    상기 제 1 적응 필터는,
    제 1 필터 계수들과;
    상기 제 1 필터 출력과;
    제 1 오차 출력을 포함하고,
    상기 제 2 적응 필터는,
    제 2 필터 계수들과;
    상기 제 2 필터 출력과;
    제 2 오차 출력을 포함하며,
    상기 제 1 필터 계수들은 상기 제 1 오차 출력에 기초해 적응되고 상기 제 2 필터 계수들은 상기 제 2 오차 출력에 기초해 적응되는 것인 신호 향상 시스템.
  3. 제 2 항에 있어서,
    상기 제 1 오차 출력은 상기 신호 입력과 상기 제 1 필터 출력간의 제 1 차(first difference)를 포함하고, 상기 제 2 오차 출력은 상기 신호 입력과 상기 제 2 필터 출력간의 제 2 차(second difference)를 포함하는 것인 신호 향상 시스템.
  4. 제 2 항에 있어서,
    상기 지연 로직은 상기 제 1 적응 필터에 결합되어 있는 M1 샘플 지연 및 상기 제 2 적응 필터에 결합되어 있는 M2 샘플 지연을 포함하는 것인 신호 향상 시스템.
  5. 제 4 항에 있어서,
    상기 M2 샘플 지연은 상기 M1 샘플 지연과 직렬 상태인 것인 신호 향상 시스템.
  6. 제 4 항에 있어서,
    상기 제 1 적응 필터는 길이 M1 적응 필터이고 상기 제 2 적응 필터는 길이 M2 적응 필터인 것인 신호 향상 시스템.
  7. 제 6 항에 있어서,
    M1 = M2 또는 M1 = M2 = 1인 것인 신호 향상 시스템.
  8. 제 1 항에 있어서,
    상기 지연 로직은 최대 적응 피치를 설정하기 위해 선택된 D 샘플 지연을 포함하는 것인 신호 향상 시스템.
  9. 제 1 항에 있어서,
    상기 지연 로직은 적응 피치 범위를 설정하기 위해 선택된 L 샘플 지연을 포함하는 것인 신호 향상 시스템.
  10. 제 1 항에 있어서,
    상기 지연 로직은 사람의 음성 피치를 포함하는 적응 피치 범위를 구현하는 것인 신호 향상 시스템.
  11. 제 1 항에 있어서,
    상기 지연 로직은 약 70 Hz와 약 400 Hz 사이에서 적응 피치 범위를 구현하는 것인 신호 향상 시스템.
  12. 신호 향상 방법으로서,
    기본 주파수를 포함하는 입력 신호를 수신하고;
    다수의 상이하게 지연된 입력 신호들을 획득하기 위해, 상기 입력 신호를 다수의 상이한 샘플 지연들만큼 지연시키며;
    다수의 개개 적응 필터들을 포함하는 분할 적응 필터를 상기 다수의 상이하게 지연된 입력 신호들에 적용하고;
    상기 분할 적응 필터로, 대략 상기 기본 주파수의 정수배만큼 지연된 필터링된 출력을 발생시키고;
    상기 다수의 개개 적응 필터들 각각에 대한 오차 신호를 발생시키며;
    상기 개개 적응 필터에 대한 오차 신호에 기초해, 그러한 개개 적응 필터들 각각을 적응시키고;
    상기 필터링된 출력으로 상기 입력 신호를 보강하는 것;
    을 포함하는 신호 향상 방법.
  13. 제 12 항에 있어서,
    상기 다수 적응 필터들의 출력들에 대한 합을 형성하고,
    상기 합을 이득 파라미터만큼 바이어스하는 것을 더 포함하는 신호 향상 방법.
  14. 제 12 항에 있어서,
    추적할 최대 피치를 결정하는 것을 더 포함하고,
    상기 입력 신호를 지연시키는 것은 상기 입력 신호를 D개 샘플들만큼 지연시키는 것을 포함하며,
    상기 D는 상기 최대 피치에 따라 선택되는 것인 신호 향상 방법.
  15. 제 14 항에 있어서,
    피치 추적 범위를 선택하는 것을 더 포함하고,
    상기 입력 신호를 지연시키는 것은 상기 입력 신호를 D + L개 샘플들만큼 지연시키는 것을 포함하며,
    상기 L은 상기 피치 추적 범위를 설정하기 위해 선택되는 것인 신호 향상 방법.
  16. 제 15 항에 있어서,
    상기 피치 범위는 사람의 음성 피치를 포함하는 것인 신호 향상 방법.
  17. 제 15 항에 있어서,
    상기 피치 범위는 약 70 Hz에서 약 400 Hz에 이르는 것인 신호 향상 방법.
  18. 컴퓨터 판독 가능한 기록 매체로서,
    상기 컴퓨터 판독 가능한 기록 매체 상에서 구현되며 프로세스가 제 12 항 내지 제 17 항 중의 어느 한 항에 기재되어 있는 방법을 수행하도록 하는 컴퓨터 판독 가능한 명령어들을 포함하는 컴퓨터 판독 가능한 기록 매체.
KR1020050101336A 2004-10-26 2005-10-26 주기 신호 향상 시스템 KR100754558B1 (ko)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US10/973,575 US7680652B2 (en) 2004-10-26 2004-10-26 Periodic signal enhancement system
US10/973,575 2004-10-26
US11/102,251 US7610196B2 (en) 2004-10-26 2005-04-08 Periodic signal enhancement system
US11/101,796 US8170879B2 (en) 2004-10-26 2005-04-08 Periodic signal enhancement system
US11/102,251 2005-04-08
US11/101,796 2005-04-08

Publications (2)

Publication Number Publication Date
KR20060049382A KR20060049382A (ko) 2006-05-18
KR100754558B1 true KR100754558B1 (ko) 2007-09-05

Family

ID=35698847

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050101336A KR100754558B1 (ko) 2004-10-26 2005-10-26 주기 신호 향상 시스템

Country Status (4)

Country Link
EP (1) EP1653445A1 (ko)
JP (1) JP2006126841A (ko)
KR (1) KR100754558B1 (ko)
CA (1) CA2524162C (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9020158B2 (en) 2008-11-20 2015-04-28 Harman International Industries, Incorporated Quiet zone control system
US8135140B2 (en) 2008-11-20 2012-03-13 Harman International Industries, Incorporated System for active noise control with audio signal compensation
US8718289B2 (en) * 2009-01-12 2014-05-06 Harman International Industries, Incorporated System for active noise control with parallel adaptive filter configuration

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0275416A1 (en) 1986-12-16 1988-07-27 Gte Laboratories Incorporated Method for enhancing the quality of coded speech
KR20000074088A (ko) * 1999-05-18 2000-12-05 윤종용 음성 코딩/디코딩 장치 및 그 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0275416A1 (en) 1986-12-16 1988-07-27 Gte Laboratories Incorporated Method for enhancing the quality of coded speech
KR20000074088A (ko) * 1999-05-18 2000-12-05 윤종용 음성 코딩/디코딩 장치 및 그 방법

Also Published As

Publication number Publication date
JP2006126841A (ja) 2006-05-18
EP1653445A1 (en) 2006-05-03
KR20060049382A (ko) 2006-05-18
CA2524162C (en) 2011-01-11
CA2524162A1 (en) 2006-04-26

Similar Documents

Publication Publication Date Title
US8170879B2 (en) Periodic signal enhancement system
US7610196B2 (en) Periodic signal enhancement system
US7680652B2 (en) Periodic signal enhancement system
EP3439325B1 (en) Automatically tuning an audio compressor to prevent distortion
US8306821B2 (en) Sub-band periodic signal enhancement system
US8447044B2 (en) Adaptive LPC noise reduction system
US8355511B2 (en) System and method for envelope-based acoustic echo cancellation
JP4913155B2 (ja) 音響エコーキャンセラ
US8543390B2 (en) Multi-channel periodic signal enhancement system
EP2987316B1 (en) Echo cancellation
US8472616B1 (en) Self calibration of envelope-based acoustic echo cancellation
US8538052B2 (en) Generation of probe noise in a feedback cancellation system
US9343073B1 (en) Robust noise suppression system in adverse echo conditions
US9454956B2 (en) Sound processing device
CN108172231A (zh) 一种基于卡尔曼滤波的去混响方法及系统
EP3080975A1 (en) Echo cancellation
US10937418B1 (en) Echo cancellation by acoustic playback estimation
KR20160076059A (ko) 디스플레이장치 및 그 반향 제거방법
KR20160113224A (ko) 오디오 신호를 압축하는 오디오 압축 시스템
KR100633213B1 (ko) 불가청 정보를 포함함으로써 적응형 필터 성능을개선시키는 방법 및 장치
US11380312B1 (en) Residual echo suppression for keyword detection
KR100754558B1 (ko) 주기 신호 향상 시스템
JP4690243B2 (ja) デジタルフィルタ、周期性騒音低減装置および騒音低減装置
JP4879195B2 (ja) 騒音低減装置
JP2003250193A (ja) 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120802

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20130801

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140807

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150806

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20160810

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20170811

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20180810

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20190809

Year of fee payment: 13