KR100394759B1 - 음성신호에서노이즈를저감시키는방법과장치 - Google Patents

음성신호에서노이즈를저감시키는방법과장치 Download PDF

Info

Publication number
KR100394759B1
KR100394759B1 KR1019960003843A KR19960003843A KR100394759B1 KR 100394759 B1 KR100394759 B1 KR 100394759B1 KR 1019960003843 A KR1019960003843 A KR 1019960003843A KR 19960003843 A KR19960003843 A KR 19960003843A KR 100394759 B1 KR100394759 B1 KR 100394759B1
Authority
KR
South Korea
Prior art keywords
signal
speech signal
consonant
noise
input
Prior art date
Application number
KR1019960003843A
Other languages
English (en)
Other versions
KR960032293A (ko
Inventor
죠셉 찬
마사유끼 니시구찌
Original Assignee
소니 가부시끼 가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 가부시끼 가이샤 filed Critical 소니 가부시끼 가이샤
Publication of KR960032293A publication Critical patent/KR960032293A/ko
Application granted granted Critical
Publication of KR100394759B1 publication Critical patent/KR100394759B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/09Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being zero crossing rates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Picture Signal Circuits (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

음성 신호에서 노이즈를 저감시켜 입력 신호에서 노이즈를 억제시킬 수 있고 처리 단계수를 축소시키는 방법 및 장치가 도시되었다. 본 장치는 입력 음성 신호를 주파수 도메인 신호로 변환시키는 고속 푸리에 변환 유닛(3), 입력 음성 신호에서 노이즈를 제거하기 위해 사용된 필터 작용의 필터 특성을 제어하는 Hn계산 유닛(7)을 포함한다. 본 장치는 Hn값 계산 유닛(7)이 산출한 필터 특성에 부합하는 필터 작용에 의해 입력 음성 신호를 저감시키는 스펙트럼 수정 유닛(10)을 또한 포함한다. Hn값 계산 유닛(7)은 고속 푸리에 변환 유닛(3)과 산정된 노이즈 레벨에 의해 획득된 입력 신호 스펙트럼의 프레임에 기초한 최대 SN 비율로부터 도출된 값에 응답하여 Hn값을 계산한다.

Description

음성 신호에서 노이즈를 저감시키는 방법과 장치
본 발명은 음성 신호 내에 포함된 노이즈를 억제하거나 저감시키기 위해 음성 신호에 포함된 노이즈를 제거하기 위한 방법과 장치에 관한 것이다.
포터블(portable) 전화 세트 또는 음성 인식 분야에서 음성 성분만을 강화시키기 위해 집합된 음성 신호에 포함된 배경 노이즈 또는 환경 노이즈 등을 억제하는 것이 필요하다. 음성 성분을 강화하고 노이즈를 저감시키는 기술로서, 감쇠 팩터 조정을 위해 확률 조건 함수를 사용하는 기술이 R.J. McAulay 및 M.L. Maplass의 "Speech Enhancement Using a Soft-Decision noise Suppression Filter, in IEEE Trans, Acoust., Speech Signal Processing, Vol 28, pp. 137 to 145, April 1980"에 개시되었다.
상기 노이즈 억제 기술에서는 부적합 억제 필터 또는 부적합하게 고정된 신호 대 잡음비(SNR)에 기초한 작동으로 인해 비즉흥성(unspontaneous) 사운드 톤 또는 변형된 음성의 발생이 자주 일어난다. 실제 작동 상황에서 최적 수행성을 실현키 위해 노이즈 억제 디바이스의 파라미터 중 하나인 SNR을 사용자가 조정해야만 하는 것은 바람직하지 않다. 또한, 종래의 음성 신호 향상 기술로서는 음성 신호에서 짧은 시간에 SNR의 심한 변동으로 감지되는 뒤틀림을 발생시키지 않고서 노이즈를 충분히 제거하는 것이 어렵다.
이런 음성 향상 또는 노이즈 저감 기술은 입력 전력 또는 레벨을 이미 설정된 문턱 값과 비교함으로써 노이즈 영역을 판별하는 기법을 사용한다. 그러나 이런 기법에서 문턱 값이 음성을 추적하지 않도록 방지하고자 할 때 문턱 값의 시정수가 증가된다면 변화하는 노이즈 레벨 특히 증가하는 노이즈 레벨을 적합하게 따라갈 수 없고 따라서 때때로 판별 오류를 일으킨다.
이런 단점을 극복하기 위해 본 발명자는 JP 특허 출원 94-99869에서 음성 신호에서 노이즈를 저감하는 노이즈 저감 방법을 제시했다.
음성 신호에 이 노이즈 저감 방법을 써서, 입력 음성 신호 및 음성 존재 확률로부터 도출된 SNR에 기초하여 음성 성분을 계산하도록 구성된 최대 가능성 필터(maximum liklihood filter)를 적합 제어함으로써 노이즈 억제가 실현되었다. 이 방법은 음성 존재 확률을 계산할 때에 입력 음성 스펙트럼에서 산정된 노이즈 스펙트럼을 뺀 값이 되는 신호를 사용한다.
이런 음성 신호 노이즈 저감법에 의해 최대 가능성 필터가 입력 음성 신호의 SNR에 따라 최적 억제 필터에 맞추어지기 때문에 입력 음성 신호의 노이즈를 충분히 저감시킬 수 있다.
그러나 음성 존재 확률을 계산하는 데에 복잡하고 많은 처리 과정이 요구되기 때문에 처리 과정을 단순화시키는 것이 바람직스럽다.
또한 입력 음성 신호의 자음 특히 배경 노이즈 하에서 입력 음성 신호의 자음이 억제되는 경향이 있다. 따라서 자음부분을 억제하지 않는 것이 바람직하다.
따라서 입력 음성 신호의 노이즈 억제를 위한 처리 과정이 단순화되고 입력 신호의 자음부분의 억제가 방지되는 노이즈 저감법을 제공하는 것이 본 발명의 목적이다.
한 국면에서 본 발명은 노이즈 억제를 이뤄 입력 음성 신호의 노이즈를 저감시키기 위해, 입력 음성 신호에 포함된 자음부분을 검출하는 단계 및 자음부분 검출 단계에서 검출된 자음 검출 결과에 응답하여 입력 음성 신호의 노이즈를 제거할때에 제어된 방식으로 노이즈 저감량을 억제하는 단계를 포함하는 방법을 제공한다.
또 다른 국면에서 본 발명은 노이즈 저감량이 제어 신호에 따라 가변되어 노이즈 억제를 이룸으로써 입력 음성 신호에서 노이즈를 저감시키는 노이즈 저감 유닛, 입력 음성 신호에 포함된 자음부분을 검출하는 수단, 및 자음부분 검출 단계에서의 자음 검출 결과에 따라 제어된 방식으로 노이즈 저감량을 억제하는 수단을 포함하여 음성 신호의 노이즈를 저감시키는 장치를 제공한다.
본 발명에 따른 노이즈 저감 방법 및 장치에 따라서 자음부분이 입력 음성 신호에서 검지되고 자음을 검지했을 때 노이즈 저감량이 억제되는 방식으로 입력 음성 신호에서 노이즈가 제거되기 때문에, 노이즈 억제 동안 자음부분을 피하도록 하여 자음부분의 변질을 회피하는 것이 가능해진다. 또한 입력 음성 신호가 주파수 도메인(domain) 신호로 변환되어 노이즈 억제를 위한 처리를 수행할 때에 입력 음성 신호에 포함된 크리티컬(critical) 특성만이 취해지기 때문에 처리 과정 단계수를 줄이는 것이 가능해진다.
본 발명의 노이즈 저감 방법 및 장치에 따르면, 입력 음성 신호의 짧은 도메인에서 검지된 에너지의 변화량, 입력 음성 신호의 주파수 성분 분포, 입력 음성 신호의 제로 크로싱(zero-crossing) 수 중 적어도 하나에 의해서 자음 검출을 행한다. 자음을 검출했을 때 노이즈 저감량을 억제하는 방식으로 노이즈가 입력 음성 신호에서 제거되기 때문에, 노이즈 억제 동안 자음부분을 피하도록 하여 자음부분의 변질을 회피하고 노이즈 억제 동안 처리 단계수를 줄이는 것이 가능해진다.
또한 본 발명에 따른 노이즈 저감 방법 및 장치에 따라 입력 음성 신호에서 노이즈를 제거하는 필터 작용의 특성이 자음부분 검지에 따른 첫째 값 및 둘째 값을 사용하여 제어되기 때문에, 입력 음성 신호의 최대 SN 비에 맞추어진 필터 작용에 의해 입력 음성 신호에서 노이즈를 제거하는 것이 가능해지고 노이즈 억제 동안 자음부분을 피하도록 하여 자음부분 변질을 회피하고 노이즈 억제 동안 처리 단계수를 줄이는 것이 가능해 진다.
도면을 참조하여 본 발명에 따라 음성 신호에서 노이즈를 저감시키는 방법 및 장치가 상세히 설명될 것이다.
제1도는 본 발명에 따라 음성 신호에서 노이즈를 저감시키는 노이즈 저감 장치 실시예를 도시하였다.
음성 신호에서 노이즈를 저감시키는 장치가 제어 신호에 따라 가변되는 노이즈 저감량으로 노이즈 억제를 이뤄 입력 음성 신호에서 노이즈를 제거하는 노이즈 저감 유닛으로서 스펙트럼 유닛(10)을 포함한다. 음성 신호의 노이즈 저감 장치는 또한 입력 음성 신호에 포함된 자음 부분을 검지하기 위한 자음 부분 검지 수단 및 자음 부분 검지 수단이 산출한 자음 검지 결과에 따라 노이즈 저감량을 억제하는 제어 수단으로서 Hn값 계산 유닛(7)을 포함한다.
음성 신호에서 노이즈를 저감시키는 장치는 또한 입력 음성 신호를 주파수 축상의 신호로 변환시키는 변환 수단으로서 고속 푸리에 변환 유닛(3)을 포함한다.
노이즈 저감 장치의 음성 신호 입력 터미널(13)에 들어오는 입력 음성 신호y(t)는 프레임 유닛(1)에 제공된다. 프레임 유닛(1)이 출력시킨 프레임 신호 y-framej,k는 윈도우 유닛(2), 노이즈 산정 유닛(5) 내의 제곱근 평균 값(RMS) 계산 유닛(21), 및 필터 유닛(8)으로 제공된다.
윈도우 유닛(2)의 출력은 고속 푸리에 변환 유닛(3)으로 제공되는데, 이것의 출력은 스펙트럼 수정 유닛(10)과 밴드 분할 유닛(4)으로 제공된다.
밴드 분할 유닛(4)의 출력은 스펙트럼 수정 유닛(10), 노이즈 산정 유닛(5) 내의 노이즈 스펙트럼 산정 유닛(26), Hn값 계산 유닛(7)과 제로 크로싱 검지 유닛(42) 및 자음 검출 유닛(41) 내의 톤 검지 유닛(43)으로 제공된다. 스펙트럼 수정 유닛(10)의 출력은 고속 푸리에 변환 유닛(11)과 오버랩(overlap) 및 합산 유닛(12)을 통해 음성 신호 출력 터미널(14)에게 제공된다.
RMS 계산 유닛(21)의 출력은 상대적 에너지 계산 유닛(22), 최대 RMS 계산 유닛(23), 산정된 노이즈 레벨 계산 유닛(24), 노이즈 스펙트럼 산정 유닛(26), 인접 음성 프레임 검지 유닛(44) 및 자음 검출 유닛(41) 내의 자음부분 검지 유닛(45)에 제공된다. 최대 RMS 계산 유닛(24)의 출력은 산정된 노이즈 레벨 계산 유닛(24) 및 최대 SNR 계산 유닛(25)으로 제공된다. 상대적 에너지 계산 유닛(22)의 출력은 노이즈 스펙트럼 산정 유닛(26)에게 제공된다. 산정된 노이즈 레벨 계산 유닛(24)의 출력은 필터 유닛(8), 최대 SNR 계산 유닛(25), 노이즈 스펙트럼 산정 유닛(26) 및 NR 값 계산 유닛(8)으로 제공된다. 최대 SNR 계산 유닛(25)의 출력은 NR값 계산 유닛(6) 및 노이즈 스펙트럼 산정 유닛(26)에게 제공되고, 유닛(26)의출력은 Hn값 계산 유닛(7)에서 제공된다.
NR 값 계산 유닛(6)의 출력은 NR 값 계산 유닛(6)에게 다시 제공되고 또한 NRZ 값 계산 유닛(46)에게 제공된다.
제로 크로싱 검지 유닛(42)의 출력은 인접 음성 프레임 검지 유닛(44) 및 자음부분 검출 유닛(45)에게 제공된다. 톤 검지 유닛(43)의 출력은 자음부분 검출 유닛(45)에게 제공된다. 자음부분 검출 유닛(45)의 출력은 NR2값 계산 유닛(46)에게 제공된다.
NR2값 계산 유닛(46)의 출력은 Hn값 계산 유닛(7)에게 제공된다.
Hn값 계산 유닛(7)의 출력은 필터 유닛(8)과 밴드 변환 유닛(9)을 통해 스펙트럼 수정 유닛(10)에게 제공된다.
음성 신호에서 노이즈를 저감시키는 장치의 첫째 실시예 작동이 이후 설명된다. 다음의 설명에서 노이즈 저감 장치의 여러 소자의 작용을 도시한 제2도의 흐름도의 단계 회수가 괄호로 표시되었다.
음성 성분과 노이즈 성분을 포함한 입력 음성 신호 y(t)가 음성 신호 입력 터미널(13)로 제공된다. 예를 들어 샘플링 주파수 FS에서 디지탈 음성 샘플이 되는 입력 음성 신호 y(t)가 프레임 유닛(1)에 제공되는데 여기서 이 음성 신호는 각각이 FL 샘플의 프레임 길이를 갖는 다수의 프레임으로 분할된다. 이렇게 분할된 입력 음성 신호 y(t)는 프레임 베이시스 상에서 이후 처리된다. 시간 축을 따라 프레임 이동량이 되는 프레임 인터벌은 FI 샘플이 되어, (K+1) 번째 프레임이 K번째 프레임으로부터 FI 샘플 후에 시작되도록 한다. 샘플 빈도와 샘플 개수의 예시적 예로서 샘플 빈도 FS가 8 KHZ이면, 80개 샘플의 프레임 인터벌 FI는 10ms에 상응하고, 160개 샘플의 프레임 길이 FL은 20ms에 상응한다.
고속 푸리에 변환 유닛(2)에 의한 직교(orthogonal) 변환 계산 전에 윈도우 유닛(2)은 프레임 유닛(2)으로부터의 각각의 프레임 신호 y-framej,k를 윈도우 함수 Winput와 곱한다. 후에 설명하겠지만, 프레임에 기초한 신호 처리 작동의 종결 단계에서 수행된 역 FFI 후에 출력 신호는 윈도우 함수 Woutput과 곱해진다. 개별적으로 Winput과 Woutput은 다음의 등식 (1) 및 (2)에 의해 예시된다.
고속 푸리에 변환 유닛(3)은 이후 주파수 스펙트럴(spectral) 진폭 값을 산출하기 위해 256-지점 고속 푸리에 변환 작동을 수행하는데, 이 진폭 값은 이후 밴드 분할부(4)에 의해 예를 들어 18개의 밴드로 갈라진다. 이런 밴드의 주파수 범위는 표1에 예로 도시되었다.
표 1
주파수 스펙트럼 분할로 귀결된 주파수 밴드의 진폭 값은 입력 신호 스펙트럼의 진폭 Y[W, K]가 되는데, 이 값들은 이미 설명한 대로 개별 영역으로 출력된다.
상기 주파수 범위는 주파수가 높아질수록 인간 청각 기관의 감지 분해 능력이 떨어진다는 사실에 기초한 것이다. 개별 밴드를 특징짓는 진폭으로서는 관련된 주파수 범위 내의 최대 FFT 진폭을 사용한다.
노이즈 산정 유닛(5)에서 프레임 신호 y-framej,k의 노이즈는 음성에서 분리되며 노이즈라고 추정된 프레임이 검지되고, 산정된 노이즈 레벨 값과 최대 SN 비가 NR 값 계산 유닛(6)에게 제공된다. 노이즈 영역 산정 또는 노이즈 프레임 검지는 예를 들어 세개의 검지 작동의 조합으로 수행된다. 노이즈 영역 산정의 예시 예가 이제 설명된다.
RMS 계산 유닛(21)은 매 프레임마다 신호의 RMS 값을 계산하고 그 결과를 출력시킨다. K 번째 프레임의 RMS값 또는 RMS[k]는 다음 등식(3)에 의해 계산된다.
상대적 에너지 계산 유닛(22)에서 이전 프레임의 감쇠 에너지와 관련된 K 번째 프레임의 상대적 에너지 또는 dBrel[k]이 계산되고 그 결과가 출력된다. dBrel[k]가 되는 dB 단위의 상대적 에너지는 다음 등식(4)에 의해 계산된다.
여기서 에너지 E[k]와 감쇠 에너지 값 Edecay[k]는 다음 등식 (5) 및 (6)으로부터 계산된다.
등식(5)은 FL * (RMS[k])2로서 등식(3)을 이용해 표현된다. 물론 RMS 계산 유닛(21)에 의해 등식(3)의 계산 동안 획득된 등식(5)의 값은 상대적 에너지 계산유닛(21)에게 직접 제공될 수 있다. 등식(6)에서 감쇠 시간은 0.65초에 설정된다.
제3도는 에너지 값 E[k]와 감쇠 에너지 Edecay[k]의 예시 예를 도시한다.
최대 RMS 계산 유닛(23)은 신호 레벨과 노이즈 레벨의 비의 최대치 즉 최대 SN 비를 산정하는 데에 필요한 최대 RMS 값을 계산하고 출력시킨다. 이 최대 RMS 값 MaxRMS[k]는 등식(7)에 의해 계산된다.
여기서 θ는 감쇠 상수가 된다. 이런 θ로는 최대 RMS 값이 3.2초에 1/e 만큼 감쇠되는 값이 되는 θ=0.993769가 사용된다.
산정된 노이즈 레벨 계산 유닛(24)은 배경 노이즈 레벨을 계산하는데에 적합한 최소 RMS 값을 계산하고 출력시킨다. 이렇게 산정된 노이즈 레벨 값 minRMS[k]는 현재 시간 위치에 선행하는 다섯개의 국소 최소값 중 가장 작은 값이 된다. 이 다섯 가지 값은 다음 등식(8)을 만족시키는 값들이 된다.
산정된 노이즈 레벨 값 minRMS[k]는 음성의 배경 노이즈 프리드(freed)에 따라 높아지도록 설정된다. 고 노이즈 레벨의 상승율은 지수 함수적이며, 더 두드러진 상승을 실현시키는 낮은 노이즈 레벨에 대해서는 고정 상승율이 사용된다.
제4도는 RMS값인 RMS[k], 산정된 노이즈 레벨 값 minRMS[k] 및 최대 RMS 값 MaxRMS[k]의 예시 예를 도시한다.
최대 SNR 계산 유닛(25)은 최대 RMS 값과 산정된 노이즈 레벨 값을 사용하여 다음 등식(9)에 의해 최대 SN 비 MaxSNR[k]를 산정하고 계산한다.
최대 SNR값 MaxSNR로부터 상대적 노이즈 레벨을 나타내고 0부터 1까지의 값을 갖는 정규화 파라미터 NR_level이 계산된다. NR_level에 대해 다음 함수가 사용된다.
노이즈 스펙트럼 산정 유닛(26)의 작동이 설명된다. 상대적 에너지 계산 유닛(22), 산정된 노이즈 레벨 계산 유닛(24) 및 최대 SNR 계산 유닛(25)에서 계산된 개별 값들이 배경 노이즈로부터 음성을 구별하기 위해 사용된다. 다음 조건 즉
[여기서
이 만족되면, K 번째 프레임의 신호가 배경 노이즈로 분류된다. 이렇게 분류된 배경 노이즈 진폭이 노이즈 스펙트럼의 시간 평균 산정 값 N[w, k]이 되어 계산되고 출력된다.
제5도는 제11도에 도시한 dB 단위의 상대적 에너지, 즉 dBrel[k], 최대 SNR[k] 및 노이즈 판별용 문턱 값의 하나인 dBthresrel들의 예시적 예를 도시한다. 제6도는 등식(10)에서 MarSN[k]의 함수로서 NR_level[k]를 도시한다.
K번째 프레임이 배경 노이즈 또는 노이즈로서 분류되었다면 노이즈 스펙트럼 2 N[w, k]의 시간 평균 산정 값은 다음 등식(12)에 의해 현행 프레임 신호의 입력 신호 스펙트럼의 진폭 Y[W, k]에 의해 갱신된다.
여기서 W는 밴드 분할에 있어서 밴드 번호를 특정하는 것이다.
K번째 프레임이 음성으로 분류되었다면 N[w, k-1]의 값이 직접 N[w, k]로 사용된다.
NR 값 계산 유닛(61)은 필터 응답이 급격히 변화하는 것을 방지하는 데에 사용되는 값인 NR[w, k]를 계산하고 산출된 값 NR[w, k]를 출력시킨다. 이 NR[w, k]는 0부터 1까지의 범위를 갖는 값이며 등식 (13)에 의해 정의된다.
등식 (13)에서 adj[w, k]는 다음에 설명할 효과를 고려하는 데에 사용되는 파라미터이며 등식 (14)에 의해 정의된다.
등식 (14)에서 adj1[k]는 모든 밴드 영역에 대해 높은 SNR에서의 필터 작용과 다음에 설명할 필터 작용에 의해 노이즈 억제 효과를 억압하는 효과를 갖는 값이 되고 다음 등식 (15)에 의해 정의된다.
등식 (14)에서 adj2[k]는 상기 설명한 필터 작용에 의해 극저 노이즈 레벨 또는 극고 노이즈 레벨에 대해 노이즈 억제율을 억압하는 효과를 갖는 값인데 등식 (16)에 의해 정의된다.
상기 등식 (14)에서 adj3[k]는 2375Hz에서 4000Hz 사이의 주파수 밴드에서 최대 노이즈 저감량을 18dB에서 15dB까지 억제하는 효과를 갖는 값이며 등식 (17)에 의해 정의된다.
한편 제7도에서 상기 NR[w, k] 값과 dB 단위의 최대 노이즈 저감량 사이의 관계가 dB 단위로 선형성을 갖는다는 것이 도시되었다.
제1도의 자음 검출부(41)에서 자음부분은 입력 신호 스펙트럼 Y[w, k]의 진폭 Y로부터 프레임 베이시스 상에서 검지된다. 자음 검출 결과 자음 효과를 특정화하는 값 CE[k]가 계산되고 이렇게 계산된 값 CE[k]가 출력된다. 자음 검출의 한 예시 예가 이제 설명된다.
제로 크로싱 영역(42)에서 사인(sign)이 양에서 음으로 또는 그 반대로 역전되는 Y[w, k]의 인접 샘플 사이의 영역 또는 서로 반대 사인을 갖는 두 샘플 사이에서 값 0을 갖는 샘플이 있는 영역이 제로 크로싱 영역으로 검지된다(단계 S3). 제로 크로싱 영역의 개수는 프레임에서 프레임으로 옮겨가며 검지되고 제로 크로싱의 수 ZC[k]로 출력된다.
톤 검지 유닛(43)에서 Y[w, k]의 주파수 성분 분포를 특정화하는 값 예를 들어 높은 범위의 입력 신호 스펙트럼의 평균 레벨 t'과 낮은 범위의 입력 신호 스펙트럼의 평균 레벨 b'의 비 즉 t'/ b'(=tone[k])인 톤 값이 검지되고(단계 S2) 출력된다. 이런 값 t'과 b'은 다음의 등식(18)에 의해 정의된 에러 함수 ERR(fc, b, t)가 최소치가 되는 t 및 b를 의미한다.
상기 등식 (18)에서 NB는 밴드 개수를 의미하고 Ymax[w, k]는 밴드 w에서 Y[w, k]의 최대값을 나타내고 fc는 서로에 대해 높은 범위와 낮은 범위를 구분하는 지점을 나타낸다. 제8도에서 Y[w, k]의 주파수 fc의 하측 평균값은 b가 되고, Y[w, k]의 주파수 fc의 상측 평균값은 t가 된다.
인접 음성 프레임 검지 유닛(44)에서 발해진 음성 소리가 검지되는 곳인 프레임에 인접한 프레임, 즉 인접 음성 프레임이 RMS 값과 제로 크로싱의 수에 기초하여 검지된다(단계 S4). 이런 프레임 회수, 즉 인접 음절 프레임 spch_prox[k]의 개수가 다음 등식 (19)에 의해 출력으로서 산출된다.
자음부분 검출 유닛(45)에서 각 프레임의 Y[w, k]의 자음부분이 제로 크로싱의 수, 인접 음성 프레임 개수, 톤 및 RMS 값에 기초하여 검지된다(단계 S5). 자음검출 결과는 자음 효과를 특정화하는 값 CE[k]로서 출력된다. 이 값 CE[k]가 다음 등식(20)에 의해 정의된다.
심볼 C1, C2, C3, C4.1에서 C4.7까지가 표2에 도시된 대로 정의된다.
표 2
상기 표 2에서, CDS0, CDS1, CDS2, T, Zlow 및 Zhigh의 값은 자음 검출 감응도를 결정하는 상수가 된다. 예를 들어 CDS0=CDS1=CDS2=1.41, T=20, Zlow=20 및 Zhigh=75가 된다. 또한 등식 (20)의 E는 0부터 1 사이의 값, 예로 0.7과 같은 값을 취한다. 필터 응답 조정이 이뤄져서 E 값이 0에 가까워질수록 보통의 자음 억제량에 더 접근하고, E 값이 1에 가까워질수록, 보통 자음 억제량의 최저값에 더 접근하도록 한다.
상기 표 2에서 심볼 C1이 성립되는 것은 프레임 신호 레벨이 최소 노이즈 레벨보다 더 크다는 것을 의미하는 것이다. 반면에, 심볼 C2가 성립되는 것은 상기 프레임의 제로 크로싱의 수가 여기서 20이 되는 제로 크로싱 기설정 회수 Zlow보다 더 크다는 것을 의미하고, 심볼 C3이 성립되는 것은 상기 프레임이 발해진 음성이검지되는 곳인 프레임으로부터 계수된 T 프레임, 즉 여기서는 20 프레임 내에 있음을 의미한다.
심볼 C4.1이 성립되는 것은 신호 레벨이 상기 프레임 내에서 변화된다는 것을 의미하고 심볼 4.2가 성립되는 것은 상기 프레임이 음성 신호의 변화가 일어났기 때문에 한 프레임 후에 발생하며 신호 레벨 변화를 겪는 프레임이라는 것을 의미한다. 심볼 C4.3이 성립된다는 것은 상기 프레임이 음성 신호의 변화가 일어났기 때문에 두개의 프레임 후에 발생하며 프레임 신호 레벨 변화를 겪는 프레임이라는 것을 의미한다. 심볼 C4.4가 성립된다는 것은 상기 프레임의 제로 크로싱 수가 상기 프레임 내에서 75가 되는 제로 크로싱 기설정 회수 Zhigh 보다 더 크다는 것을 의미한다. 심볼 C4.5가 성립한다는 것은 톤 값이 상기 프레임 내에서 변화된다는 것을 의미하고, 심볼 C4.6이 성립한다는 것은 상기 프레임이 음성 신호의 변화가 일어났기 때문에 일 프레임 후에 발생하며 톤 값 변화를 격는 프레임이라는 것을 의미한다. 심볼 C4.7이 성립하는 것은 상기 프레임이 음성 신호 변화가 일어났기 때문에 두개의 프레임 후에 발생하며 톤 값 변화를 겪는 프레임이라는 것을 의미한다.
등식 (20)에 따라서 자음부분을 포함한 프레임 조건은 심볼 C1에서 C3까지에 대한 조건이 만족되고, tone[k]가 0.6보다 크며 조건 C1에서 C4.7까지 중 최소한 하나가 만족된다는 것이다.
제1도를 참조하면, NR2 계산 유닛(46)이 상기 값 NR[w, k] 및 자음 효과 CE[k]를 특정화하는 상기 값으로부터 등식 (21)에 기초하여 NR2[w, k]를 계산하고NR2[w, k]를 출력시킨다.
Hn 값 계산 유닛(7)은 밴드 분할 입력 신호 스펙트럼의 진폭 Y[w, k], 노이즈 스펙트럼의 시간 평균 산정값 N[w, k] 및 상기 값 NR2[w, k]로부터 밴드 분할 입력 신호 스펙트럼의 진폭 Y[w, k]의 노이즈 성분을 저감시키는 전(前) 필터이다. Y[w, k] 값은 N[w, k]에 응답하여 필터 응답 Hn[w, k]로 변환되어 출력된다. Hn[w, k] 값은 다음 등식 (22)에 따라서 계산된다.
상기 등식 (22) 내에 있는 값 H[w]는 SNR이 2.7과 같은 값 2에 고정되었을 때 노이즈 억제 필터가 최적 특성을 가질 때의 값이 되고 다음 등식 (23)에 의해 계산된다.
한편 이 값은 미리 계산되어 값 Y[w, k]/N[w, k]에 따라서 표에 목록화 된다. 한편 등식 (19)의 x[w, k]는 Y[w, k]/N[w, k]와 동일하고 Gmin은 H[w][S/N=γ]의 최소 이득을 표시하는 파라미터이며 예로 -18 dB을 취할 수 있다. 반면 P(Hi│Yw)[S/N=γ] 및 P(H0│Yw)[S/N=γ]은 각각의 입력 신호 스펙트럼의 진폭 Y[w, k] 상태를 특정화하는 파라미터이고, P(H1│Yw)[S/N=γ]은 그 내에서 음성 성분과 노이즈 성분이 Y[w, k] 내에서 혼합되는 상태를 특정화하는 파라미터이고,P(H0│Yw)[S/N=γ]은 노이즈 성분만이 Y[w, k] 내에 포함된 것을 특정화하는 파라미터이다. 이런 값들은 등식 (24)에 의해 계산된다.
여기서 P(h1) = P(H0) = 0.5
등식 (20)에서 P(H1│Yw)[S/N=γ] 및 P(H0│Yw)[S/N=γ]은 X[w, k]의 함수이며, I0(2×γ×x[w, k])는 베셀 함수이며 γ 및 [w, k] 값에 따라서 계산된다는 것을 알 수 있다. P(H1) 및 P(H0)는 모두 0.5에 고정된다. 처리 단계 수는 상기 설명한 파라미터들을 단순화함으로써 종래의 방법이 갖는 것의 약 1/5만큼 축소된다.
필터 유닛(8)은 주파수 축과 시간 축을 따라 Hn[w, k]를 평활화하기 위해 필터 작용을 수행함으로써 평활화된 신호 Ht_smooth[w, k]가 출력 신호로서 산출되도록 한다. 주파수 축 방향의 필터 작용은 신호 Hn[w, k]의 실효 임펄스 응답 길이를 감소시키는 효과를 나타낸다. 이것은 주파수 도메인에서 승산하는 필터 작용의 실현으로 귀결되는 주기적 컨벌루션으로 인해 얼라이어싱(aliasing)이 발생하는 것을 방지한다. 시간 축 방향 필터 작용은 급격 노이즈 발생을 억제하여 필터 특성의 변화율을 제한시키는 효과를 갖는다.
주파수 축 방향의 필터 작용이 먼저 설명된다. 메디안(median) 필터 작용이 각각의 밴드의 Hn[w, k]에 대해 수행된다. 이 방법은 다음 등식 (25) 및 (26)에 의해 제시된다.
단계 1 :
단계 2:
만약 등식 (25) 및 (26)에서 (w-1) 또는 (w+1)이 존재하지 않는다면, H1[w, k] = Hn[w, k]이 되고 H2[w, k] = H1[w, k]가 된다.
만약 (w-1) 또는 (w+1)이 존재하지 않는다면 단계 1에서 H1[w, k]는 단일 또는 고립된 명(zero) 밴드가 없는 Hn[w, k]가 되고, 한편 단계 2에서 H2[w, k]는 단일이며 고립된 또는 돌출 밴드가 없는 H1[w, k]가 된다. 이런 방식으로 Hn[w, k]는 H2[w, k]로 변환된다.
다음으로 시간 축 방향의 필터 작용이 설명된다. 시간 축 방향의 필터 작용에 대해서는 입력 신호가 음성, 배경 노이즈 및 음성 상승 영역의 과도 상태를 나타내는 과도 상태 등 세 가지 성분을 포함한다는 사실이 고려된다. 음성 신호 Hspeech[w, k]는 등식 (27)에 의해 시간 축을 따라 평활화된다.
배경 노이즈는 등식 (28)에 제시한 대로 축을 따라 평활화된다.
상기 등식 (24)에서 Min_H 및 Max_H는 각각(Min_H=min(H2[w, k], H2[w, k-1]) 및 (Max_H=max(H2[w, k], H2[w, k-1])에 의해 계산된다.
과도 상태 등 신호는 시간 축 방향을 따라 평활화되지 않는다.
상기 평활화된 신호를 사용하여 평활화된 출력 신호 Ht_smooth가 등식 (29)에 의해 산출된다.
상기 등식 (29)에서 αsp 및 αtr은 등식 (30) 및 (31)에 의해 계산된다.
여기서
및 등식(31)에서:
여기서
이후 밴드 변환 유닛(9)에서는 필터 유닛(8)으로부터의 18개의 밴드에 대한 평활화 신호 Ht_smooth[w, k]가 내삽에 의해 예를 들어 128개의 밴드 신호 H128[w, k]로 확장되어 출력된다. 이 변환은 예를 들어 두 단계에 걸쳐 수행되는데, 18 밴드에서 64 밴드까지의 확장과 64 밴드에서 128 밴드까지의 확장은 각각 영차(zero-order) 유지와 저역 필터 유형 내삽에 의해 달성된다.
스펙트럼 수정 유닛(10)은 이후 FET 유닛(31)에 의해 얻은 프레임 신호 y_framej,k를 고속 푸리에 변환하여 획득한 FET 계수의 실수 및 허수부를 노이즈 성분을 저감시키는 구실의 스펙트럼 수정을 수행함으로써 상기 신호 H128[w, k]와 승산하고, 귀결 신호가 출력된다. 그 결과는 스펙트럴 진폭이 위상 변화없이 수정된다는 것이다.
역 FFT 유닛(11)은 귀결 IFFT된 신호를 출력시키기 위해 스펙트럼 수정 유닛(10)의 출력 신호 상에서 역 FET를 이후 수행한다.
오버랩 및 합산 유닛(12)은 프레임 기준 IFFT된 신호의 프레임 경계 영역을 오버랩하고 합산한다. 귀결 음성 신호 출력은 음성 신호 출력 터미널(14)에서 출력된다.
제9도는 본 발명에 따라서 음성 신호에 대해 노이즈 저감법을 수행하는 노이즈 저감 장치의 또 다른 실시예를 도시한다. 제1도에 도시된 실시예와 공통적인 부분과 소자는 동일 참조 번호로 표시되었고 작동 설명은 단순화를 위해 생략했다.
음성 신호 노이즈 저감 장치는 노이즈 저감량이 제어 신호에 따라 가변되도록 하면서 입력 음성 신호로부터 노이즈를 제거하여 노이즈 억제를 이루는 노이즈 저감 유닛으로서 스펙트럼 수정 유닛(10)을 포함한다. 음성 신호 노이즈 저감 장치는 또한 CE 값, (adj1, adj2 및 adj3)을 계산하여 입력 음성 신호에 포함된 자음 부분을 검출하기 위한 검지 수단으로서의 계산 유닛(32)을 포함하고 자음 영역 검출 수단이 생성한 자음 검출 결과에 따라 노이즈 저감량 억제를 제어하는 제어 수단으로서의 Hn값 계산 유닛(7)을 포함한다.
음성 신호 노이즈 저감 장치는 입력 음성 신호를 주파수 축 상의 신호로 변환시키는 변환 수단으로서 고속 푸리에 변환 수단(3)을 더 포함한다.
Hn 계산 유닛(7)과 (adj1, adj2 및 adj3)을 계산하는 계산 유닛(32)을 구비하고 노이즈 억제 필터 특성을 발생시키는 발생 유닛(35)에서, 밴드 분할 유닛(4)은 주파수 스펙트럼의 진폭 값을 예를 들어 18 밴드로 나누며 밴드 기준 진폭 Y[w, k]를 신호 특성을 계산하기 위한 계산 유닛(31), 노이즈 스펙트럼 산정 유닛(26) 및 초기 필터 응답 계산 유닛(33)으로 출력시킨다.
신호 특성을 계산하기 위한 계산 유닛(31)은 프레임 유닛(1)이 출력시킨 y프레임 값 k와 밴드 분할 유닛(4)이 출력한 값 Y[w, k]로부터 프레임 기준 노이즈 레벨 값 MinRMS[k], 산정된 노이즈 레벨값 MinRMS[k], 최대 RMS값 MaxRMS[k], 제로크로싱의 수 ZC[k], 톤 값 tone[k] 및 인접 음성 프레임 개수 spch_prox[k]를 계산하고 이런 값들을 노이즈 스펙트럼 산정 유닛(26)과 (adj1, adj2 및 adj3) 계산 유닛(32)에게 제공한다.
CE 값 및 (adj1, adj2 및 adj3) 값 계산 유닛(32)는 RMS[k], MinRMS[k] 및 MaxRMS[k]에 기초하며 (adj1[k], adj2[k] 및 adj3[w, k]) 값들을 계산하고 zc[k], tone[k], spch_prox[k] 및 MinRMS[k]에 기초하여 음성 신호에서 자음 효과를 특정화하는 CF[k] 값을 계산한다. 그리고 이런 값들을 NR 값 및 NR2 값 계산 유닛(36)으로 제공한다.
초기 필터 응답 계산 유닛(33)은 노이즈 스펙트럼 산정 유닛(26)이 출력한 시간 평균 노이즈 값 N[w, k] 및 밴드 분할 유닛(4)이 출력한 Y[w, k] 값을, 필터 억제 곡선 테이블 유닛(34) 내에 저장된 Y[w, k] 및 N[w, k]에 상응하는 H1[w, k] 값을 계산하기 위한 필터 억제 곡선 테이블 유닛(34)으로 제공하여 이렇게 계산된 값을 Hn값 계산 유닛(7)로 전송한다. 필터 억제 곡선 테이블 유닛(34) 내에는 H[w, k] 값에 대한 테이블이 저장된다.
제1도 및 제9도에 도시된 노이즈 저감 장치가 획득한 출력 음성 신호는 포터블 전화를 위해 다양한 인코드(encode) 회로와 같은 신호 처리 회로 또는 음성 인식 장치로 제공된다. 대안으로 노이즈 억제는 포터블 전화 세트의 디코더 출력 신호 상에서 수행된다.
본 발명에 따른 음성 신호 노이즈 저감 장치의 효과가 제10도에 도시되었는데, 여기서 Y 축과 X 축 각각은 각 프레임 신호의 RMS 레벨과 각 프레임의 프레임번호를 의미한다. 프레임은 20ms 간격으로 분할되었다.
원음성(crude speech) 신호 및 자동차 내의 노이즈가 겹쳐진 음성에 상응한 신호가 제10도에서 각각 곡선 B 및 A로 표시되었다. 곡선 A의 RMS 레벨이 모드 프레임 번호에 대해 곡선 B의 RMS 레벨과 같거나 더 큰 것을 알 수 있다. 이는 노이즈가 섞인 신호가 에너지 값에 있어서 더 높다는 것을 의미한다.
곡선 C 및 D에 대해서는 약 15의 프레임 번호를 갖는 영역 a1, 약 60의 프레임 번호를 갖는 영역 a2, 약 60에서 65 사이의 프레임 번호를 갖는 영역 a3, 약 100에서 105까지의 프레임 번호를 갖는 영역 a4, 약 110의 프레임 번호를 갖는 영역 a5, 약 150에서 160까지의 프레임 번호를 갖는 영역 a6, 및 약 175에서 180까지의 프레임 번호를 갖는 영역 a7에서 곡선 C의 RMS 레벨이 곡선 D의 RMS 레벨보다 더 높다. 즉 노이즈 저감량은 영역 a1에서 a7까지에 상응한 프레임 번호 신호에서 억제된다.
제2도에 도시된 실시예에 따라 음성 신호 노이즈 저감법에 따라, 음성 신호의 제로 크로싱이 tone[k] 값의 검지 후에 검지된다. tone[k]는 주파수 도메인 신호의 진폭 분포를 특정화하는 값이다. 그러나 이는 tone[k] 값이 제로 크로싱을 검지하기 전에 검지되거나 tone[k] 및 제로 크로싱이 동시에 검지될 수 있기 때문에 본 발명을 제한하는 것이 아니다.
제1도는 본 발명에 따라서 노이즈 저감 디바이스의 실시예를 도시한 개략 블럭도.
제2도는 본 발명에 따라서 음성 신호에서 노이즈를 저감시키는 노이즈 저감 방법의 과정을 도시한 흐름도.
제3도는 제1도의 실시예에서 에너지 E[k]와 감쇠 에너지 Edecay[k]의 특정예를 도시한 도면.
제4도는 제1도의 실시예에서 RMS 값 RMS[k], 산정 노이즈 레벨 값 MinRMS[k] 및 최대 RMS 값 MaxRMS[k]의 특정예를 도시한 도면.
제5도는 제1도의 실시예에서 노이즈 판별을 위한 문턱값들의 한 값으로서 상대적 에너지 Brel[k], dB 단위로 매긴 최대 SNR MaxSNR[k], 및 dBthresrel[k] 의 특정예를 도시한 도면.
제6도는 제1도의 실시예에서 최대 SNR MaxSNR[k]에 대해 정의된 함수로서 NR_level[k]을 도시한 그래프.
제7도는 제1도의 실시예에서 NR[W, K]와 최대 노이즈 저감량 사이의 관계를 dB 단위로 도시한 도면.
제8도는 제1도의 실시예에서 입력 신호 스펙트럼의 주파수 밴드 분포치를 발견하는 방법을 도시한 도면.
제9도는 본 발명에 따라서 음성 신호에서 노이즈를 저감시키는 노이즈 저감 장치의 변형예를 도시한 개략 블럭도.
제10도는 본 발명에 따라서 노이즈 저감 장치가 음성 신호에 대해 갖는 효과를 도시한 도면.
도면의 주요 부분에 대한 부호의 설명
1 : 프레임 유닛
2 : 윈도우 유닛
3 : 고속 푸리에 변환 유닛
5 : 노이즈 산정 유닛
7 : Hn값 계산 유닛
10 : 스펙트럼 수정 유닛
21 : RMS 계산 유닛
41 : 자음 검지 유닛

Claims (8)

  1. 입력 음성 신호에서 노이즈를 저감시키는 방법에 있어서,
    상기 입력 음성 신호에 포함되어 있는 자음 부분(consonant portion)을 검출하는 단계; 및
    상기 자음 부분을 검출하는 단계로부터의 자음 검출 결과에 응답하여, 상기 입력 음성 신호의 노이즈 저감을 제어하는 단계
    를 포함하며, 상기 자음 부분을 검출하는 단계는, 상기 입력 음성 신호의 짧은 도메인에서의 에너지의 변화, 상기 입력 음성 신호의 주파수 성분의 분포를 표시하는 값, 및 상기 입력 음성 신호의 제로-크로싱(zero-crossing)의 수 중 적어도 하나를 이용하여, 상기 입력 음성 신호에서 검출되는 음성 신호 부분의 근방에서 자음검출을 행하는 단계를 포함하며,
    상기 입력 음성 신호의 주파수 성분의 분포를 표시하는 값은, 고역(high range)에서의 입력 음성 신호의 스펙트럼의 평균 레벨과, 저역(low range)에서의 입력 음성 신호의 스펙트럼의 평균 레벨과의 비에 기초하여 얻어지는 것을 특징으로 하는 음성 신호의 노이즈 저감 방법.
  2. 제1항에 있어서, 상기 입력 음성 신호를 주파수-도메인의 신호로 변환하는 변환 단계를 더 포함하며, 상기 노이즈 저감을 제어하는 단계는, 상기 변환 단계에 의해 얻어지는 입력 신호 스펙트럼에 기초하여 필터 특성을, 상기 자음 부분을 검출하는 단계에 의해 얻어지는 자음 검출 결과에 따라서 가변 제어하는 단계를 포함하는 것을 특징으로 하는 음성 신호의 노이즈 저감 방법.
  3. 음성 신호에서 노이즈를 저감시키기 위한 장치에 있어서,
    입력 음성 신호로부터 노이즈를 저감하기 위한 것으로, 제어 신호에 따라서 노이즈 저감량이 가변되는 노이즈 저감 유닛;
    상기 입력 음성 신호에 포함되는 자음 부분을 검출하는 수단; 및
    상기 자음 부분 검출에 응답하여, 노이즈 저감량을 제어하는 수단
    을 포함하며, 상기 노이즈 저감량을 제어하는 수단은, 상기 노이즈 저감 유닛의 상기 노이즈 저감량을 결정하는 필터 특성을, 상기 자음 검출 수단에 의해 검출된 상기 자음 부분에 따라서 가변 제어하고,
    상기 필터 특성은, 상기 입력 음성 신호 스펙트럼과, 상기 입력 음성 신호 스펙트럼에 포함되는 추정 노이즈 스펙트럼과의 비에 기초하여 구해지는 제1 값과, 상기 입력 신호 스펙트럼의 신호 레벨과 추정 노이즈 스펙트럼과의 비의 최대치에 기초하여 구해지는 제2 값에 의해 제어되며, 상기 추정 노이즈 스펙트럼과 자음 유효 인자는 자음 검출의 결과로부터 산출되는 것을 특징으로 하는 음성 신호의 노이즈 저감 장치.
  4. 제3항에 있어서, 상기 입력 음성 신호를 주파수-도메인 신호로 변환하기 위한 수단을 더 포함하고, 상기 자음 부분 검출 수단이 상기 변환 수단에 의해 얻어진 상기 입력 신호 스펙트럼으로부터 자음을 검출하는 것을 특징으로 하는 음성 신호의 노이즈 저감 장치.
  5. 입력 음성 신호에서 노이즈를 저감시키는 방법에 있어서,
    상기 입력 음성 신호에 포함되어 있는 자음 부분을 검출하는 단계;
    상기 자음 부분을 검출하는 단계로부터의 자음 검출 결과에 응답하여, 상기 입력 음성 신호의 노이즈 저감을 제어하는 단계; 및
    상기 입력 음성 신호를 주파수-도메인의 신호로 변환하는 변환 단계
    를 포함하며, 상기 노이즈 저감을 제어하는 단계는, 상기 변환 단계에 의해 얻어지는 입력 신호 스펙트럼에 기초하여 필터 특성을, 상기 자음 부분을 검출하는 단계에 의해 얻어지는 자음 검출 결과에 따라서 가변 제어하는 단계를 포함하고,
    상기 필터 특성은, 상기 변환 단계에 의해 얻어진 상기 입력 음성 신호 스펙트럼과, 상기 입력 신호 스펙트럼에 포함되는 추정 노이즈 스펙트럼과의 비에 기초하여 구해지는 제1 값과, 상기 입력 신호 스펙트럼의 신호 레벨과 추정 노이즈 스펙트럼과의 비의 최대치에 기초하여 구해지는 제2 값에 의해 제어되며, 상기 추정 노이즈 스펙트럼과 자음 유효 인자는 자음 검출 결과로부터 산출되는 것을 특징으로 하는 음성 신호의 노이즈 저감 방법.
  6. 제5항에 있어서, 상기 자음 부분을 검출하는 단계는, 상기 입력 음성 신호의 짧은 도메인에서의 에너지의 변화, 상기 입력 음성 신호의 주파수 성분의 분포를표시하는 값, 및 상기 입력 음성 신호의 제로-크로싱의 수 중 적어도 하나를 이용하여 상기 입력 음성 신호에서 검출되는 음성 신호 부분의 근방에서 자음 검출을 행하는 단계를 포함하는 것을 특징으로 하는 음성 신호의 노이즈 저감 방법.
  7. 음성 신호에서 노이즈를 저감시키기 위한 장치에 있어서,
    입력 음성 신호로부터 노이즈를 저감하기 위한 것으로, 제어 신호에 따라서 노이즈 저감량이 가변되는 노이즈 저감 유닛;
    상기 입력 음성 신호에 포함되는 자음 부분을 검출하는 수단; 및
    상기 자음 부분 검출에 응답하여, 노이즈 저감량을 제어하는 수단
    을 포함하며, 상기 노이즈 저감량을 제어하는 수단은, 상기 노이즈 저감 유닛의 상기 노이즈 저감량을 결정하는 필터 특성을, 상기 자음 검출 수단에 의해 검출된 상기 자음 부분에 따라서 가변 제어하고,
    상기 자음 부분을 검출하는 수단은 상기 입력 음성 신호의 짧은 도메인에서의 에너지의 변화, 상기 입력 음성 신호의 주파수 성분의 분포를 표시하는 값, 및 상기 입력 음성 신호의 제로-크로싱의 수 중 적어도 하나를 이용하여 상기 입력 음성 신호에서 검출되는 음성 신호 부분의 근방에서 자음 검출을 행하는 것을 특징으로 하는 음성 신호의 노이즈 저감 장치.
  8. 제7항에 있어서, 상기 입력 음성 신호의 주파수 성분의 분포를 표시하는 값은 고역에서의 입력 음성 신호의 스펙트럼의 평균 레벨과, 저역에서의 입력 음성신호의 스펙트럼의 평균 레벨에 기초하여 얻어지는 것을 특징으로 하는 음성 신호의 노이즈 저감 장치.
KR1019960003843A 1995-02-17 1996-02-16 음성신호에서노이즈를저감시키는방법과장치 KR100394759B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP95-029337 1995-02-17
JP02933795A JP3453898B2 (ja) 1995-02-17 1995-02-17 音声信号の雑音低減方法及び装置

Publications (2)

Publication Number Publication Date
KR960032293A KR960032293A (ko) 1996-09-17
KR100394759B1 true KR100394759B1 (ko) 2004-02-11

Family

ID=12273430

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960003843A KR100394759B1 (ko) 1995-02-17 1996-02-16 음성신호에서노이즈를저감시키는방법과장치

Country Status (17)

Country Link
US (1) US5752226A (ko)
EP (1) EP0727768B1 (ko)
JP (1) JP3453898B2 (ko)
KR (1) KR100394759B1 (ko)
CN (1) CN1083183C (ko)
AT (1) ATE201276T1 (ko)
AU (1) AU695585B2 (ko)
BR (1) BR9600762A (ko)
CA (1) CA2169422C (ko)
DE (1) DE69612770T2 (ko)
ES (1) ES2158992T3 (ko)
MY (1) MY114695A (ko)
PL (1) PL312846A1 (ko)
RU (1) RU2121719C1 (ko)
SG (1) SG52257A1 (ko)
TR (1) TR199600131A2 (ko)
TW (1) TW291556B (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101247652B1 (ko) * 2011-08-30 2013-04-01 광주과학기술원 잡음 제거 장치 및 방법
KR101460059B1 (ko) 2007-12-17 2014-11-12 삼성전자주식회사 잡음 검출 방법 및 장치
KR101491911B1 (ko) 2013-06-27 2015-02-12 고려대학교 산학협력단 소음이 발생되는 환경에서 소음을 제거하는 사운드 획득 시스템

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100250561B1 (ko) * 1996-08-29 2000-04-01 니시무로 타이죠 잡음소거기 및 이 잡음소거기를 사용한 통신장치
TW384434B (en) * 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
FR2765715B1 (fr) * 1997-07-04 1999-09-17 Sextant Avionique Procede de recherche d'un modele de bruit dans des signaux sonores bruites
US6327564B1 (en) * 1999-03-05 2001-12-04 Matsushita Electric Corporation Of America Speech detection using stochastic confidence measures on the frequency spectrum
US7706525B2 (en) * 2001-10-01 2010-04-27 Kyocera Wireless Corp. Systems and methods for side-tone noise suppression
US7096184B1 (en) * 2001-12-18 2006-08-22 The United States Of America As Represented By The Secretary Of The Army Calibrating audiometry stimuli
US7149684B1 (en) 2001-12-18 2006-12-12 The United States Of America As Represented By The Secretary Of The Army Determining speech reception threshold
US7016651B1 (en) 2002-12-17 2006-03-21 Marvell International Ltd. Apparatus and method for measuring signal quality of a wireless communications link
US8073689B2 (en) * 2003-02-21 2011-12-06 Qnx Software Systems Co. Repetitive transient noise removal
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US8271279B2 (en) 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
US7725315B2 (en) * 2003-02-21 2010-05-25 Qnx Software Systems (Wavemakers), Inc. Minimization of transient noises in a voice signal
US7895036B2 (en) * 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
US8326621B2 (en) 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
US7949522B2 (en) 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US7499686B2 (en) * 2004-02-24 2009-03-03 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement on a mobile device
ZA200702870B (en) * 2004-09-07 2010-09-29 Sensear Pty Ltd Apparatus and method for sound enhancement
US20070116300A1 (en) * 2004-12-22 2007-05-24 Broadcom Corporation Channel decoding for wireless telephones with multiple microphones and multiple description transmission
US8509703B2 (en) * 2004-12-22 2013-08-13 Broadcom Corporation Wireless telephone with multiple microphones and multiple description transmission
US20060133621A1 (en) * 2004-12-22 2006-06-22 Broadcom Corporation Wireless telephone having multiple microphones
US7983720B2 (en) * 2004-12-22 2011-07-19 Broadcom Corporation Wireless telephone with adaptive microphone array
KR100657948B1 (ko) * 2005-02-03 2006-12-14 삼성전자주식회사 음성향상장치 및 방법
KR101403340B1 (ko) * 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치
JP5609111B2 (ja) * 2007-08-22 2014-10-22 日本電気株式会社 話者速度変換システム
US8428661B2 (en) * 2007-10-30 2013-04-23 Broadcom Corporation Speech intelligibility in telephones with multiple microphones
US9575715B2 (en) * 2008-05-16 2017-02-21 Adobe Systems Incorporated Leveling audio signals
GB2466668A (en) * 2009-01-06 2010-07-07 Skype Ltd Speech filtering
CN101859568B (zh) * 2009-04-10 2012-05-30 比亚迪股份有限公司 一种语音背景噪声的消除方法和装置
FR2948484B1 (fr) * 2009-07-23 2011-07-29 Parrot Procede de filtrage des bruits lateraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile
TWI413112B (zh) * 2010-09-06 2013-10-21 Byd Co Ltd Method and apparatus for eliminating noise background noise (1)
CN104036777A (zh) * 2014-05-22 2014-09-10 哈尔滨理工大学 一种语音活动检测方法及装置
RU2580796C1 (ru) * 2015-03-02 2016-04-10 Государственное казенное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) Способ (варианты) фильтрации зашумленного речевого сигнала в условиях сложной помеховой обстановки
TWI662544B (zh) * 2018-05-28 2019-06-11 塞席爾商元鼎音訊股份有限公司 偵測環境噪音以改變播放語音頻率之方法及其聲音播放裝置
CN110570875A (zh) * 2018-06-05 2019-12-13 塞舌尔商元鼎音讯股份有限公司 检测环境噪音以改变播放语音频率的方法及声音播放装置
TWI662545B (zh) * 2018-06-22 2019-06-11 塞席爾商元鼎音訊股份有限公司 調整語音頻率之方法及其聲音播放裝置
CN112201272A (zh) * 2020-09-29 2021-01-08 腾讯音乐娱乐科技(深圳)有限公司 音频数据降噪的方法、装置、设备及存储介质
CN114724571B (zh) * 2022-03-29 2024-05-03 大连理工大学 一种鲁棒的分布式说话人噪声消除系统
CN114511474B (zh) * 2022-04-20 2022-07-05 天津恒宇医疗科技有限公司 血管内超声图像的降噪方法、系统、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03236000A (ja) * 1990-02-13 1991-10-21 Matsushita Electric Ind Co Ltd 音声信号処理装置
JPH0483300A (ja) * 1990-07-26 1992-03-17 Kokusai Electric Co Ltd 雑音抑圧型音声検出器
JPH04235600A (ja) * 1991-01-11 1992-08-24 Clarion Co Ltd 適応型フィルタを用いた雑音除去装置
JPH05165495A (ja) * 1991-12-12 1993-07-02 Matsushita Electric Ind Co Ltd 雑音抑圧装置
JPH05259928A (ja) * 1992-03-09 1993-10-08 Oki Electric Ind Co Ltd 適応制御ノイズキャンセラ装置及び適応制御ノイズキャンセル方法
KR100335162B1 (ko) * 1994-05-13 2002-09-27 소니 가부시끼 가이샤 음성신호의잡음저감방법및잡음구간검출방법

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4630304A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
IL84948A0 (en) * 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
US5175793A (en) * 1989-02-01 1992-12-29 Sharp Kabushiki Kaisha Recognition apparatus using articulation positions for recognizing a voice
GB2239971B (en) * 1989-12-06 1993-09-29 Ca Nat Research Council System for separating speech from background noise
DE69121312T2 (de) * 1990-05-28 1997-01-02 Matsushita Electric Ind Co Ltd Geräuschsignalvorhersagevorrichtung
FR2679690B1 (fr) * 1991-07-23 1996-10-25 Thomson Csf Procede et dispositif de reconnaissance de la parole en temps reel.
FR2695750B1 (fr) * 1992-09-17 1994-11-10 Frank Lefevre Dispositif de traitement d'un signal sonore et appareil comportant un tel dispositif.
US5432859A (en) * 1993-02-23 1995-07-11 Novatel Communications Ltd. Noise-reduction system
JP3626492B2 (ja) * 1993-07-07 2005-03-09 ポリコム・インコーポレイテッド 会話の品質向上のための背景雑音の低減
IT1272653B (it) * 1993-09-20 1997-06-26 Alcatel Italia Metodo di riduzione del rumore, in particolare per riconoscimento automatico del parlato, e filtro atto ad implementare lo stesso
US5485522A (en) * 1993-09-29 1996-01-16 Ericsson Ge Mobile Communications, Inc. System for adaptively reducing noise in speech signals
SG49334A1 (en) * 1993-12-06 1998-05-18 Koninkl Philips Electronics Nv A noise reduction system and device and a mobile radio station

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03236000A (ja) * 1990-02-13 1991-10-21 Matsushita Electric Ind Co Ltd 音声信号処理装置
JPH0483300A (ja) * 1990-07-26 1992-03-17 Kokusai Electric Co Ltd 雑音抑圧型音声検出器
JPH04235600A (ja) * 1991-01-11 1992-08-24 Clarion Co Ltd 適応型フィルタを用いた雑音除去装置
JPH05165495A (ja) * 1991-12-12 1993-07-02 Matsushita Electric Ind Co Ltd 雑音抑圧装置
JPH05259928A (ja) * 1992-03-09 1993-10-08 Oki Electric Ind Co Ltd 適応制御ノイズキャンセラ装置及び適応制御ノイズキャンセル方法
KR100335162B1 (ko) * 1994-05-13 2002-09-27 소니 가부시끼 가이샤 음성신호의잡음저감방법및잡음구간검출방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101460059B1 (ko) 2007-12-17 2014-11-12 삼성전자주식회사 잡음 검출 방법 및 장치
KR101247652B1 (ko) * 2011-08-30 2013-04-01 광주과학기술원 잡음 제거 장치 및 방법
KR101491911B1 (ko) 2013-06-27 2015-02-12 고려대학교 산학협력단 소음이 발생되는 환경에서 소음을 제거하는 사운드 획득 시스템

Also Published As

Publication number Publication date
BR9600762A (pt) 1997-12-23
DE69612770D1 (de) 2001-06-21
EP0727768A1 (en) 1996-08-21
TR199600131A2 (tr) 1996-10-21
RU2121719C1 (ru) 1998-11-10
ATE201276T1 (de) 2001-06-15
DE69612770T2 (de) 2001-11-29
CN1083183C (zh) 2002-04-17
CA2169422C (en) 2005-07-26
ES2158992T3 (es) 2001-09-16
CN1141548A (zh) 1997-01-29
TW291556B (ko) 1996-11-21
EP0727768B1 (en) 2001-05-16
JPH08221094A (ja) 1996-08-30
AU695585B2 (en) 1998-08-20
US5752226A (en) 1998-05-12
SG52257A1 (en) 1998-09-28
PL312846A1 (en) 1996-08-19
KR960032293A (ko) 1996-09-17
MY114695A (en) 2002-12-31
CA2169422A1 (en) 1996-08-18
AU4444596A (en) 1996-08-29
JP3453898B2 (ja) 2003-10-06

Similar Documents

Publication Publication Date Title
KR100394759B1 (ko) 음성신호에서노이즈를저감시키는방법과장치
KR100414841B1 (ko) 잡음저감방법및장치
EP1065656B1 (en) Method for reducing noise in an input speech signal
US6487257B1 (en) Signal noise reduction by time-domain spectral subtraction using fixed filters
EP1059628B1 (en) Noise suppression by spectral subtraction
JP3574123B2 (ja) 雑音抑圧装置
JP5203933B2 (ja) オーディオ雑音を減少させるシステムおよび方法
KR100739905B1 (ko) 소스 음성 신호에서 잡음을 억제하는 방법 및 잡음 억제기
JP2004341339A (ja) 雑音抑圧装置
US6507623B1 (en) Signal noise reduction by time-domain spectral subtraction
US20030065509A1 (en) Method for improving noise reduction in speech transmission in communication systems
KR20080068397A (ko) 음성명료도 향상장치 및 방법
JP4098271B2 (ja) 雑音抑圧装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130719

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20140725

Year of fee payment: 12

LAPS Lapse due to unpaid annual fee