KR20180094294A - 단 채널 청력 보조 기기용 환경 분류 기반의 잡음 제거 방법 - Google Patents
단 채널 청력 보조 기기용 환경 분류 기반의 잡음 제거 방법 Download PDFInfo
- Publication number
- KR20180094294A KR20180094294A KR1020170020432A KR20170020432A KR20180094294A KR 20180094294 A KR20180094294 A KR 20180094294A KR 1020170020432 A KR1020170020432 A KR 1020170020432A KR 20170020432 A KR20170020432 A KR 20170020432A KR 20180094294 A KR20180094294 A KR 20180094294A
- Authority
- KR
- South Korea
- Prior art keywords
- noise
- gain
- environment
- hearing aid
- classification
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000001228 spectrum Methods 0.000 claims abstract description 30
- 230000007613 environmental effect Effects 0.000 claims description 11
- 230000000694 effects Effects 0.000 claims description 5
- 238000001514 detection method Methods 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 13
- 238000012545 processing Methods 0.000 description 8
- 230000009467 reduction Effects 0.000 description 8
- 230000008030 elimination Effects 0.000 description 7
- 238000003379 elimination reaction Methods 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 5
- 206010011878 Deafness Diseases 0.000 description 4
- 230000010370 hearing loss Effects 0.000 description 4
- 231100000888 hearing loss Toxicity 0.000 description 4
- 208000016354 hearing loss disease Diseases 0.000 description 4
- 206010002953 Aphonia Diseases 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011946 reduction process Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241000282373 Panthera pardus Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/50—Customised settings for obtaining desired overall acoustical characteristics
- H04R25/505—Customised settings for obtaining desired overall acoustical characteristics using digital signal processing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Otolaryngology (AREA)
- Quality & Reliability (AREA)
- Neurosurgery (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
본 발명은 단 채널 청력 보조 기기용 환경 분류 기반의 잡음 제거 방법에 관한 것이고, 구체적으로 추정 잡음 파워 스펙트럼에 기초하여 주변 소음의 주파수 특성을 탐지하여 미리 결정된 잡음 제거 이득 값과 음성 존재 검출 알고리즘에 기초하여 최종 잡음 제거 이득을 결정하는 단 채널 청력 보조 기기용 환경 분류 기반의 잡음 제거 방법에 관한 것이다. 단 채널 청력 보조 기기용 환경 분류 기반의 잡음 제거 방법은 잡음 신호를 포함하는 음성 신호를 주파수 도메인으로 변환하는 단계; 상기 주파수 도메인에서 잡음 신호의 파워 스펙트럼을 추정하는 단계; 상기 파워 스펙트럼에 기초하여 상기 잡음 신호를 미리 분류된 잡음 환경 중 하나로 분류하는 단계; 및 상기 분류에 기초하여 기본 이득 테이블에 따라 최종 잡음 제거 이득을 결정하는 단계를 포함한다.
Description
본 발명은 단 채널 청력 보조 기기용 환경 분류 기반의 잡음 제거 방법에 관한 것이고, 구체적으로 추정 잡음 파워 스펙트럼에 기초하여 주변 소음의 주파수 특성을 탐지하여 미리 결정된 잡음 제거 이득 값과 음성 존재 검출 알고리즘에 기초하여 최종 잡음 제거 이득을 결정하는 단 채널 청력 보조 기기용 환경 분류 기반의 잡음 제거 방법에 관한 것이다.
다양한 청력 보조 기구의 사용이 증가함에 따라 청력 보조 기구의 품질을 향상 시키기 위한 신호처리 기술 또한 발전하고 있다. 가장 대표적인 청력 보조 기구로 난청을 보상하여 원활한 의사소통을 돕는 보청기가 있다. 평균 수명 증가와 함께 고령화 사회가 진행되면서 노인성 난청이 늘어나고 있을 뿐만 아니라 다양한 소음 환경에 노출된 소음 난청이 또한 증가하고 있어 보청기와 같은 청력 보조 기구의 중요도가 높아지고 있다. 청력 보조 기구는 일반적으로 조용한 실내 외에도 사람이 많은 공공장소, 소음이 심한 실외 등 다양한 환경에서 사용될 수 있고, 이러한 환경에서 목표 음성 신호와 함께 원치 않는 주변 잡음까지 함께 집음 및 증폭이 되어 출력 신호의 품질과 명료도가 떨어지는 불편함이 발생하게 된다. 따라서 청력 보조 기구에 집음 되는 원치 않는 주변 잡음을 적절히 제거하는 잡음 제거 알고리즘이 적용된 기술의 개발이 요구된다.
최근 멀티채널 기술이 활발하게 연구되면서 여러 개의 마이크를 사용하는 다채널 보청기 시스템이 개발되고 있다. 다채널 보청기 시스템은 단이 또는 양이 보청기에 2개 이상의 마이크를 사용하여 시간이나 주파수 특성뿐 아니라 공간 주파수 정보까지 활용하여 음성을 증폭하고 잡음을 제거하는 등 다양한 신호 처리가 가능하다는 장점이 있다. 하지만 다채널 보청기 시스템이 안정적으로 동작하기 위해서는 채널간 원활한 통신이 제공되어야 하고 단 채널 보청기에 비해 고가라는 단점이 있다. 뿐만 아니라 여러 개의 마이크로 들어오는 신호처리를 비롯한 통신 처리로 인하여 추가적인 연산 부담을 가지게 된다. 보청기와 같은 소형 휴대기기의 경우 배터리 지속 시간에 영향을 주는 연산 양 또한 성능을 결정하는 중요 요소가 된다. 이에 따라 경제적이면서 효과적으로 난청을 보상할 수 있는 단 채널 보청기 시스템에 대한 연구 역시 꾸준히 이루어지고 있다.
특허공개번호 제2005-0117850호는 잡음 환경 내에서 보청기 착용 환자가 음성 신호만을 선택적으로 제공받을 수 있는 잡음 제거 기능을 가진 디지털 보청기의 잡음 제거 방법에 대하여 개시한다. 특허공개번호 제2015-0117380호는 보청기 자체의 기저 잡음 및 주변 환경에 따른 주변 환경 잡음을 제거하여 사용자의 청력에 적합하도록 보청기를 보정할 수 있는 보청기 잡음 방법에 대하여 개시한다.
상기 선행기술은 모두 잡음 제거가 된 보청기에 대하여 개시하지만 잡음 환경이 선택되고, 선택된 잡음 환경에 기초하여 이득을 결정하는 과정에 대하여 개시하지 않는다. 잡음 제거를 위하여 다양한 환경에서 발생할 수 있는 잡음이 우선적으로 분류되어야 한다. 그러나 상기 선행기술은 그에 대하여 개시하지 않는다.
본 발명은 선행기술이 가진 문제점을 해결하기 위한 것으로 아래와 같은 목적을 가진다.
본 발명의 목적은 미리 소음이 발생하는 다양한 환경을 결정하고, 입력 음성 신호를 결정된 환경에 따라 분류하여 이득을 결정하는 것에 의하여 전력 소모가 감소되면서 간단한 알고리즘에 따라 효과적으로 잡음이 제거될 수 있도록 하는 단 채널 청력 보조 기기용 환경 분류 기반의 잡음 제거 방법을 제공하는 것이다.
본 발명의 적절한 실시 형태에 따르면, 단 채널 청력 보조 기기용 환경 분류 기반의 잡음 제거 방법은 잡음 신호를 포함하는 음성 신호를 주파수 도메인으로 변환하는 단계; 상기 주파수 도메인에서 잡음 신호의 파워 스펙트럼을 추정하는 단계; 상기 파워 스펙트럼에 기초하여 상기 잡음 신호를 미리 분류된 잡음 환경 중 하나로 분류하는 단계; 및 상기 분류에 기초하여 기본 이득 테이블에 따라 최종 잡음 제거 이득을 결정하는 단계를 포함한다.
본 발명의 다른 적절한 실시 형태에 따르면, 상기 미리 분류된 잡음 환경은 저주파 집중 환경, 여러 대역에 걸쳐 전력이 집중되면서 환경 시간에 따라 특성이 변화하는 버블 잡음 환경 및 고주파 집중 환경을 포함한다.
본 발명의 또 다른 적절한 실시 형태에 따르면, 단 채널 청력 보조 기기를 위한 잡음 제거 방법에 있어서, 유입되는 음성 신호로부터 잡음 파워 스펙트럼을 산출하고, 상기 잡음 파워 스펙트럼으로부터 잡음 환경을 결정하여 잡음 이득을 결정한다.
본 발명의 또 다른 적절한 실시 형태에 따르면, 상기 잡음 이득은 음성 활동 탐지자(Voice Activity Detector)에서 탐지된 음성 신호 구간과 결합된다.
본 발명의 또 다른 적절한 실시 형태에 따르면, 단 방향 채널을 가진 청력 보조 기기에 있어서, 마이크로 유입되는 잡음을 포함하는 음성 신호로부터 현재 환경을 추정하고, 상기 추정된 환경에 기초하여 서로 다른 잡음 환경에 따라 결정된 이득을 적용하여 상기 음성 신호를 스피커로 전송한다.
본 발명에 따른 다양한 환경에서 발생할 수 있는 잡음 또는 소음을 분류하고 그에 기초하여 유입된 음성 신호의 잡음을 제거하는 것에 의하여 잡음 제거 과정이 신속하게 진행되도록 한다. 또한 미리 환경 분류 테이블 및 이득 테이블에 준비하고 그에 기초하여 잡음 제거 및 이득 결정이 이루어지도록 하는 것에 의하여 전체 알고리즘이 간단해지고 이로 인하여 전력 소모가 감소되도록 한다. 본 발명에 따른 간단한 구조를 가지는 단 채널 보청기에 적용되어 간단한 알고리즘에 의하여 잡음이 효과적을 제거되도록 한다.
도 1은 본 발명에 따른 잡음 제거 과정의 실시 예를 도시한 것이다.
도 2는 본 발명에 따른 잡음 제거 과정에서 정해진 환경 분류에 따라 이득이 결정되는 과정의 실시 예를 도시한 것이다.
도 3은 본 발명에 따른 잡음 제거 과정에 적용될 수 있는 이득 테이블의 실시 예를 도시한 것이다.
도 4는 본 발명에 따른 잡음 제거 과정에서 음성 부재/존재 구간에서 잡음 제거에 따른 이득이 결정되는 과정의 실시 예를 도시한 것이다.
도 5는 본 발명에 따른 잡음 제거 방법이 적용된 출력 신호의 실시 예를 도시한 것으로 (a)는 정상 음성 신호, (b)는 f16 잡음이 섞인 5 dB 입력 신호 및 (c)는 잡음 제거 알고리즘이 적용된 출력을 각각 나타낸 것이다.
도 2는 본 발명에 따른 잡음 제거 과정에서 정해진 환경 분류에 따라 이득이 결정되는 과정의 실시 예를 도시한 것이다.
도 3은 본 발명에 따른 잡음 제거 과정에 적용될 수 있는 이득 테이블의 실시 예를 도시한 것이다.
도 4는 본 발명에 따른 잡음 제거 과정에서 음성 부재/존재 구간에서 잡음 제거에 따른 이득이 결정되는 과정의 실시 예를 도시한 것이다.
도 5는 본 발명에 따른 잡음 제거 방법이 적용된 출력 신호의 실시 예를 도시한 것으로 (a)는 정상 음성 신호, (b)는 f16 잡음이 섞인 5 dB 입력 신호 및 (c)는 잡음 제거 알고리즘이 적용된 출력을 각각 나타낸 것이다.
아래에서 본 발명은 첨부된 도면에 제시된 실시 예를 참조하여 상세하게 설명이 되지만 실시 예는 본 발명의 명확한 이해를 위한 것으로 본 발명은 이에 제한되지 않는다. 아래의 설명에서 서로 다른 도면에서 동일한 도면 부호를 가지는 구성요소는 유사한 기능을 가지므로 발명의 이해를 위하여 필요하지 않는다면 반복하여 설명이 되지 않으며 공지의 구성요소는 간략하게 설명이 되거나 생략이 되지만 본 발명의 실시 예에서 제외되는 것으로 이해되지 않아야 한다.
도 1은 본 발명에 따른 잡음 제거 과정의 실시 예를 도시한 것이다.
도 1을 참조하면, 잡음 신호를 포함하는 음성 신호를 주파수 도메인으로 변환하는 단계(P11); 상기 주파수 도메인에서 잡음 신호의 파워 스펙트럼을 추정하는 단계(P13); 상기 파워 스펙트럼에 기초하여 상기 잡음 신호를 미리 분류된 잡음 환경 중 하나로 분류하는 단계(P14); 및 상기 분류에 기초하여 기본 이득 테이블에 따라 최종 잡음 제거 이득을 결정하는 단계(P16)를 포함한다.
보청기와 같은 청력 보조 기기의 마이크로 들어온 입력 신호(IN)는 주파수 도메인에서 다음의 수식 1과 같이 표현될 수 있다.
수식 1:
상기에서 S(k, l)와 N(k, l)은 각각 목표 음성과 잡음 신호, k, l은 주파수와 프레임 인덱스를 나타낸다. 잡음 신호 N(k, l)은 특정한 방향성이 없는 환경 잡음 신호로 목표 음성신호와 매우 낮은 상관도(uncorrelated)를 갖는다. 음질과 명료도가 향상된 최종 출력 신호는 마이크 입력 신호에 잡음 제거 이득을 곱하는 아래의 수식 2에 의하여 얻어질 수 있다.
수식 2:
단일 채널 기반의 잡음 제거 알고리즘은 잡음 제거 이득을 계산하는 부분과 잡음의 파워 스펙트럼을 계산하는 부분으로 이루어질 수 있다. 먼저 잡음 제거 이득을 계산하는 방법으로 가장 일반적으로 이용되는 방법은 Minimum mean square error 기반의 Wiener filter를 적용하는 방법이다(참고 1). 잡음 제거 이득은 깨끗한 정답 음성 신호와 잡음 제거 시스템 출력 신호의 오차의 자승 평균이 최소가 되도록 이득 값을 계산하는 것으로 MMSE Wiener filter를 구하는 수식은 아래의 수식 3 및 4와 같다.
수식 3:
수식 4:
상기에서 ξ(k, l)은 선 신호 대 잡음 비(a priori signal to noise ratio: SNR)을 나타내고, 유도 결정 방법(a decision directed method)을 이용하여 구해질 수 있다(참고 1). 정확하지 않은 잡음 제거 이득은 잔여 잡음 또는 음성의 왜곡을 발생시키기 때문에 정밀한 잡음 제거 이득 계산이 필요하다.
잡음 제거 이득을 구하기 위해 잡음의 파워 스펙트럼을 계산하는 다수의 알고리즘이 존재하다. 가장 널리 이용되는 방법은 음성 존재 확률을 기반으로 음성이 존재하지 않는 구간에서 잡음의 파워 스펙트럼을 추정하는 알고리즘이다(참고 2 내지 4). 상기 알고리즘은 잡음 파워 스펙트럼의 오류로 인해 발생하는 뮤지컬 잡음(musical noise)과 같은 잔여 잡음으로 인하여 품질 저하가 발생될 수 있다. 다른 방법으로 환경 분류 기반의 잡음 제거 기술이 있다(참고 5 및 6). 상기 기술은 두 개 이상의 마이크를 이용한 다채널 환경에서 마이크로 들어온 입력 신호로부터 특징 추출 및 패턴 매칭(matching)을 통해 주변 환경을 분류하고, 잡음 파워 스펙트럼 추정에 필요한 파라미터를 적응적으로 업데이트하는 것을 특징으로 한다. 이러한 경우 주변 환경에 따라 적합한 잡음 제거 이득이 업데이트될 수 있다는 장점이 있지만 다채널 마이크에서 들어오는 정보의 처리로 인하여 연산되어야 하는 양이 증가할 수 있다.
위에서 제시된 알고리즘은 현재 사용자의 주변 환경 특성을 검출하기 위해 다채널 입력 신호를 이용하지만 보청기와 같이 배터리 소모량이 중요한 휴대용 기기의 경우 연산 수준의 증가 또한 중요한 성능 평가 요소가 될 수 있다. 그러므로 적은 연산 수준으로 동작할 수 있는 알고리즘이 요구된다. 또한 잡음 파워 스펙트럼 추정의 에러로 인해 발생하는 뮤지컬 잡음(musical noise) 형태의 잔여 잡음이 음성 품질을 악화시키는 것을 방지하기 위해 다양한 환경에서 강건하게 동작하는 잡음 제거 이득 추정 방법이 적용될 필요가 있다.
본 발명의 하나의 실시 예에 따르면, 하나의 마이크를 가진 단 채널 보청기 시스템에서 얻어진 정보를 통하여 잡음의 특성을 분류하고, 사전에 정의된 잡음 제거 이득 테이블을 이용해 잡음이 제거될 수 있다. 이에 의하여 위에서 개시된 방법에 비하여 잡음 제거 이득에 필요한 연산이 간단해지고 다양한 환경에서 강건하게 동작될 수 있다.
도 1에 도시된 것처럼, 환경 분류 기반의 단 채널 잡음 제거 방법은 보청기 마이크를 통해 들어온 잡음이 섞인 음성 신호(IN)는 먼저 FFT를 통해 주파수 도메인으로 옮겨진다(P11). 이후 대략적인 잡음의 파워 스펙트럼이 추정될 수 있다(P13); 잡음의 파워 스펙트럼은 잡음 제거 알고리즘이 시작되는 초기 150 내지 200ms와 음성 부재 구간에서 추정될 수 있고, 음성 존재/부재 구간은 음성 활동 탐지자(voice activity detector)를 통해 분류될 수 있다(P12). 대략적인 잡음 파워 스펙트럼을 통해 현재 잡음 환경이 미리 정의된 잡음 종류 중 하나로 분류될 수 있다(P14). 분류된 잡음의 종류에 따라 적합한 기본 이득이 이득 테이블로 호출되고(P15), VAD 결과와 결합하여 최종 잡음 제거 이득이 생성될 수 있다(P16). 생성된 잡음 제거 이득은 입력 신호에 적용되어 IFFT를 거쳐 최종 음질과 명료도가 향상되어 스피커를 통하여 출력될 수 있다(P17).
1. 잡음 형태 분류
본 발명의 하나의 실시 예에 따르면, 추정된 대략적인 잡음의 파워 스펙트럼을 기반으로 현재 잡음 환경의 타입이 결정될 수 있다(P14). 잡음의 파워 스펙트럼은 잡음 제거 알고리즘이 실행되면 초기 150 내지 200ms 동안 계산되며 이후 VAD 결과에 따라 음성 부재 구간에 업데이트 되어 변화하는 잡음의 PSD(Power Spectrum Density)가 추적될 수 있다. 잡음 파워 스펙트럼 추정을 위하여 수식 5로 표시되는 1차 재귀 평균 기법이 적용될 수 있다.
수식 5:
본 발명의 하나의 실시 예에 따르면, 잡음은 환경에 따라 분류될 수 있고(P14), 환경 잡음은 미리 분류가 된다.
도 2는 본 발명에 따른 잡음 제거 과정에서 정해진 환경 분류에 따라 이득이 결정되는 과정의 실시 예를 도시한 것이다.
도 2를 참조하면, 잡음을 포함하는 음성 신호(IN)가 유입되면 잡음 평가 모듈(21)에 의하여 소리 신호에 포함된 잡음이 평가되어 환경 결정 모듈(22)로 전송될 수 있다. 환경 결정 모듈(22)은 미리 결정된 환경 분류 데이터(221)와 상기 잡음을 비교하여 음성 신호(IN)의 환경 잡음을 결정할 수 있다.
환경 분류 데이터는 잡음 종류에 따라 환경을 분류할 수 있다. 잡음의 종류에 따른 환경 분류 데이터는 바람 또는 자동차의 내부 소음과 같이 저주파대역에 대부분의 에너지가 몰려있는 환경을 포함할 수 있다(환경 1). 또한 환경 분류 데이터는 저주파 및 중간 대역까지 잡음의 에너지가 분포 되어 있고, 시간에 따라 잡음의 특성이 변화하는 동적(non-stationary) 특성을 지닌 환경으로 카페테리아 같은 곳에서 집음 되는 버블 소음을 포함하는 환경을 포함할 수 있다(환경 2). 그리고 환경 분류 데이터는 전 주파수 대역에 잡음의 에너지가 분포되어 있으며 시간에 따라 잡음의 특성이 천천히 변화하는 동적(stationary) 잡음으로 핑크 잡음(pink noise) 또는 비행기 내부에서 발생하는 기계 소음과 같은 잡음을 가지는 환경을 포함할 수 있다.
포함하는 잡음의 특성에 따라 환경은 다양한 형태로 분류될 수 있고, 본 발명은 제시된 실시 예에 제한되지 않는다.
잡음의 종류는 추정된 잡음 PSD의 정상 상태(stationary state)와 대역 별 에너지 분포도에 따라 분류될 수 있으며 아래와 같이 수식 6, 7로 표시될 수 있다.
수식 6:
수식 7:
상기에서 , , 및 는 각각 저주파와 중간 대역의 주파수 밴드 인덱스를 나타낸다. 잡음 평가 모듈(21)은 예를 들어 수식 6 및 7과 같은 방법을 적용하여 역치값을 설정하여 현재 음성 신호에 포함된 잡음의 종류를 분류하여 환경 결정 모듈(22)로 전송할 수 있다.
2. 음성 활성 탐지자(Voice Activity Detector)
본 발명의 하나의 실시 예에 따르면, 프레임 및 밴드 별 음성 존재 구간을 검출하여 음성이 존재하지 않는 구간에서 잡음의 파워 스펙트럼을 업데이트하고 음성의 존재 구간에서 잡음 제거 이득 값을 1로 설정하여 음성의 왜곡이 방지될 수 있다. 음성 존재 검출을 위한 다양한 알고리즘이 적용될 수 있고, 입력 신호와 추정된 잡음 파워 스펙트럼을 이용한 에너지 기반의 알고리즘이 적용될 수 있다. 프레임 기반의 음성 존재 검출 알고리즘 수식은 아래의 수식 8, 9 및 10으로 표시될 수 있다.
수식 8:
수식 9:
수식 10:
상기에서 b는 밴드 인덱스를 나타내고, 밴드 수는 사용자의 목적에 따라 조정 될 수 있다. 와 는 각각 프레임 그리고 밴드 VAD를 결정하는 임계 값이 되고 실험적으로 결정될 수 있다.
3. 이득 테이블
본 발명의 하나의 실시 예에 따르면, 환경 결정 모듈(22)에 의하여 분류된 잡음의 종류에 따라 사전에 정의된 잡음 제거 이득 테이블(231)에서 잡음 특성에 적합한 이득 데이터가 선택될 수 있다. 적합한 이득 데이터가 선택되면 VAD 산출 모듈(232)에 의하여 VAD 결과와 이득 데이터가 결합될 수 있고, 적어도 하나의 이득 데이터가 하나의 VAD 결과와 결합될 수 있다. 그리고 결합 결과가 이득 결정 모듈(23)로 전송되어 최종 이득이 결정되어 스피커(24)로 전송되어 출력될 수 있다.
도 3은 본 발명에 따른 잡음 제거 과정에 적용될 수 있는 이득 테이블의 실시 예를 도시한 것이다.
도 3을 참조하면, 32밴드 환경에서 위에서 설명된 잡음 분류가 이루어지고, 사전 정의된 잡음 제거 이득 테이블의 실시 예가 제시되어 있다. 잡음의 특성에 따라 정의된 이득의 경향이 다른 것이 확인될 수 있다. 정의된 이득 값은 공지의 잡음 데이터 베이스에 기초하여 실험적으로 결정될 수 있고, 청력 보조 기기는 음성의 명확성을 향상시키는 것이므로 음성의 왜곡을 최소화하는 방향으로 설정될 수 있다.
사전 정의된 이득 테이블에서 읽어온 잡음 제거 이득 값은 VAD 결과 값과 결합될 수 있다. 각 밴드 별로 음성이 존재하는 구간이 검출되고, 음성이 존재하는 구간의 잡음 제거 이득이 1로 설정되어 음성의 왜곡이 최소로 될 수 있다.
도 4는 본 발명에 따른 잡음 제거 과정에서 음성 부재/존재 구간에서 잡음 제거에 따른 이득이 결정되는 과정의 실시 예를 도시한 것이다.
도 4를 참조하면, 위에서 설명된 환경 3의 경우 음성이 존재하지 않는 구간과 존재하는 구간에 대한 각각의 잡음 제거 이득 값의 결과가 제시되어 있다.
사전 정의된 이득 테이블 값을 기반으로 잡음 제거 이득이 결정되기 되므로 잡음 파워 스펙트럼 추정 블록에서 생기는 에러에 의한 성가신 잔여 잡음의 효과가 감소될 수 있다. 또한 이득 계산에 필요한 나누기와 평방근(square root)과 같은 복잡한 연산을 피할 수 있어 연산 수준이 크게 감소될 수 있다.
4. 실시 예
본 발명의 하나의 실시 예에 따른 잡음 제거 방법의 성능을 평가하기 위한 실험이 진행되었다. TIMIT 데이터베이스의 여성 음성이 목표 음성으로 사용되어 Noise-X 데이터베이스의 잡음 신호들과 결합하여 보청기 입력 신호가 생성되었다. 실험은 16 kHz 샘플링 주파수가 이용되었고 입력 신호의 512 샘플을 한 프레임으로 취해 sine 윈도우, 50% overlap-add가 적용되었다. 알고리즘의 객관적인 성능 평가를 위해 segmental SNR이 계산되었다(참고 7). 실험에서 3가지 잡음의 종류가 적절히 섞여 있는 5가지 잡음이 사용되었으며 표 1에 결과가 제시되었다.
SNR [dB] |
Wind | F16 | Babble | Leopard | Factory1 | |||||
input | output | Input | output | Input | output | Input | output | Input | output | |
-5 | -5.4 | 1.4 | -7.3 | -4.4 | -6.9 | -4.8 | -7.1 | -2.2 | -7.2 | -4.4 |
0 | -3.1 | 2.7 | -5.2 | -2.6 | -4.8 | -2.8 | -4.9 | -0.1 | -5.1 | -2.6 |
5 | -0.5 | 3.8 | -2.7 | -0.8 | -2.3 | -0.9 | -2.5 | 1.6 | -2.6 | -0.8 |
실험 결과가 도 5로 제시되었다. 도 5의 (a)는 정답 음성 신호, (b)는 f16 잡음이 혼합된 5 dB 입력 신호 그리고 (c)는 본 발명에 따른 방법이 적용된 출력 신호를 나타낸 것이다. 도 5의 (c)에 제시된 것처럼, 본 발명에 따른 방법은 잡음을 포함하는 음성 신호에서 잡음이 효과적으로 제거되도록 한다는 것을 알 수 있다.
본 발명에 따른 다양한 환경에서 발생할 수 있는 잡음 또는 소음을 분류하여 그에 기초하여 유입된 음성 신호의 잡음을 제거하는 것에 의하여 잡음 제거 과정이 신속하게 진행되도록 한다. 또한 미리 환경 분류 테이블 및 이득 테이블에 준비되어 그에 기초하여 잡음 제거 및 이득 결정이 이루어지도록 하는 것에 의하여 전체 알고리즘이 간단해지고 이로 인하여 전력 소모가 감소되도록 한다. 본 발명에 따른 간단한 구조를 가지는 단 채널 보청기에 적용되어 간단한 알고리즘에 의하여 잡음이 효과적을 제거되도록 한다.
위에서 본 발명은 제시된 실시 예를 참조하여 상세하게 설명이 되었지만 이 분야에서 통상의 지식을 가진 자는 제시된 실시 예를 참조하여 본 발명의 기술적 사상을 벗어나지 않는 범위에서 다양한 변형 및 수정 발명을 만들 수 있을 것이다. 본 발명은 이와 같은 변형 및 수정 발명에 의하여 제한되지 않으며 다만 아래에 첨부된 청구범위에 의하여 제한된다.
참고문헌:
참고 1: Ephraim, Yariv, and David Malah. "Speech enhancement using a minimum-mean square error short-time spectral amplitude estimator." IEEE Transactions on Acoustics, Speech, and Signal Processing 32.6 (1984): 1109-1121.
참고 2: P. C. Loizou, Speech enhancement: theory and practice. CRC press, 2013.
참고 3: I. Cohen and B. Berdugo, "Speech enhancement for nonstationary noise environments," Signal processing, vol. 81, no. 11, pp. 2403-2418, 2001.
참고 4: S. Rangachari and P. C. Loizou, "A noise-estimation algorithm for highly non-stationary environments," Speech communication, vol. 48, no. 2, pp. 220-231, 2006.
참고 5: Zhang, Tao, and Martin Mckinney. "Adaptive hearing assistance device using plural environment detection and classificaiton." U.S. Patent Application No. 13/906,694.
참고 6: Woods, William S. "System for training and improvement of noise reduction in hearing assistance devices." U.S. Patent Application No. 13/550,911.
참고 7: Hu, Yi, and Philipos C. Loizou. "Evaluation of objective quality measures for speech enhancement." IEEE Transactions on audio, speech, and language processing 16.1 (2008): 229-238.
21: 잡음 평가 모듈 22: 환경 결정 모듈
23: 이득 결정 모듈 24: 스피커
221: 환경 분류 데이터 231: 잡음 제거 이득 테이블
232: VAD 산출 모듈 IN: 음성 신호
23: 이득 결정 모듈 24: 스피커
221: 환경 분류 데이터 231: 잡음 제거 이득 테이블
232: VAD 산출 모듈 IN: 음성 신호
Claims (5)
- 잡음 신호를 포함하는 음성 신호를 주파수 도메인으로 변환하는 단계;
상기 주파수 도메인에서 잡음 신호의 파워 스펙트럼을 추정하는 단계;
상기 파워 스펙트럼에 기초하여 상기 잡음 신호를 미리 분류된 잡음 환경 중 하나로 분류하는 단계; 및
상기 분류에 기초하여 기본 이득 테이블에 따라 최종 잡음 제거 이득을 결정하는 단계를 포함하는 단 채널 청력 보조 기기용 환경 분류 기반의 잡음 제거 방법. - 청구항 1에 있어서, 상기 미리 분류된 잡음 환경은 저주파 집중 환경, 여러 대역에 걸쳐 전력이 집중되면서 환경 시간에 따라 특성이 변화하는 버블 잡음 환경 및 고주파 집중 환경을 포함하는 단 채널 청력 보조 기기용 환경 분류 기반의 잡음 제거 방법
- 단 채널 청력 보조 기기를 위한 잡음 제거 방법에 있어서,
유입되는 음성 신호로부터 잡음 파워 스펙트럼을 산출하고, 상기 잡음 파워 스펙트럼으로부터 잡음 환경을 결정하여 잡음 이득을 결정하는 것을 특징으로 하는 단 채널 청력 보조 기기용 환경 분류 기반의 잡음 제거 방법. - 청구항 1에 있어서, 상기 잡음 이득은 음성 활동 탐지자(Voice Activity Detector)에서 탐지된 음성 신호 구간과 결합되는 것을 특징으로 하는 단 채널 청력 보조 기기용 환경 분류 기반의 잡음 제거 방법.
- 단 방향 채널을 가진 청력 보조 기기에 있어서,
마이크로 유입되는 잡음을 포함하는 음성 신호로부터 현재 환경을 추정하고, 상기 추정된 환경에 기초하여 서로 다른 잡음 환경에 따라 결정된 이득을 적용하여 상기 음성 신호를 스피커로 전송하는 것을 특징으로 하는 단 방향 채널의 청력 보조 기기.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170020432A KR20180094294A (ko) | 2017-02-15 | 2017-02-15 | 단 채널 청력 보조 기기용 환경 분류 기반의 잡음 제거 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170020432A KR20180094294A (ko) | 2017-02-15 | 2017-02-15 | 단 채널 청력 보조 기기용 환경 분류 기반의 잡음 제거 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20180094294A true KR20180094294A (ko) | 2018-08-23 |
Family
ID=63454800
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170020432A KR20180094294A (ko) | 2017-02-15 | 2017-02-15 | 단 채널 청력 보조 기기용 환경 분류 기반의 잡음 제거 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20180094294A (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112151053A (zh) * | 2019-06-11 | 2020-12-29 | 北京京东尚科信息技术有限公司 | 语音增强方法、系统、电子设备和存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050117850A (ko) | 2004-06-11 | 2005-12-15 | 한양대학교 산학협력단 | 잡음 제거 기능을 구비한 디지털 보청기 및 잡음 제거 방법 |
KR20150117830A (ko) | 2014-04-11 | 2015-10-21 | 에너진(주) | 등방압 프레스장치 |
-
2017
- 2017-02-15 KR KR1020170020432A patent/KR20180094294A/ko not_active Application Discontinuation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050117850A (ko) | 2004-06-11 | 2005-12-15 | 한양대학교 산학협력단 | 잡음 제거 기능을 구비한 디지털 보청기 및 잡음 제거 방법 |
KR20150117830A (ko) | 2014-04-11 | 2015-10-21 | 에너진(주) | 등방압 프레스장치 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112151053A (zh) * | 2019-06-11 | 2020-12-29 | 北京京东尚科信息技术有限公司 | 语音增强方法、系统、电子设备和存储介质 |
CN112151053B (zh) * | 2019-06-11 | 2024-04-16 | 北京汇钧科技有限公司 | 语音增强方法、系统、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10614788B2 (en) | Two channel headset-based own voice enhancement | |
US8898058B2 (en) | Systems, methods, and apparatus for voice activity detection | |
US7912231B2 (en) | Systems and methods for reducing audio noise | |
US8391507B2 (en) | Systems, methods, and apparatus for detection of uncorrelated component | |
US8712074B2 (en) | Noise spectrum tracking in noisy acoustical signals | |
WO2013162995A2 (en) | Systems and methods for audio signal processing | |
CN111418012A (zh) | 通过修改的广义特征值波束成形器在音频信号中进行话音增强 | |
US11574645B2 (en) | Bone conduction headphone speech enhancement systems and methods | |
CN102543095A (zh) | 用于减少音频处理算法中的非自然信号的方法和装置 | |
CN103813251A (zh) | 一种可调节去噪程度的助听器去噪装置和方法 | |
Jin et al. | Multi-channel noise reduction for hands-free voice communication on mobile phones | |
CN103824563A (zh) | 一种基于模块复用的助听器去噪装置和方法 | |
EP2151820B1 (en) | Method for bias compensation for cepstro-temporal smoothing of spectral filter gains | |
KR20180094294A (ko) | 단 채널 청력 보조 기기용 환경 분류 기반의 잡음 제거 방법 | |
Thiagarajan et al. | Pitch-based voice activity detection for feedback cancellation and noise reduction in hearing aids | |
Gerkmann | Cepstral weighting for speech dereverberation without musical noise | |
Ngo et al. | A flexible speech distortion weighted multi-channel Wiener filter for noise reduction in hearing aids | |
CN104703108A (zh) | 一种处于噪声条件下的数字助听器宽动态压缩算法 | |
Feng et al. | Recurrent Neural Network-based Estimation and Correction of Relative Transfer Function for Preserving Spatial Cues in Speech Separation | |
Dhanaskodi et al. | Speech enhancement algorithm using sub band two step decision directed approach with adaptive weighting factor and noise masking threshold | |
Deepa et al. | Spectral Subtraction Method of Speech Enhancement using Adaptive Estimation of Noise with PDE method as a preprocessing technique | |
KR101394504B1 (ko) | 적응적 잡음 처리 장치 및 방법 | |
Zhang et al. | An improved MMSE-LSA speech enhancement algorithm based on human auditory masking property | |
Defraene et al. | A psychoacoustically motivated speech distortion weighted multi-channel Wiener filter for noise reduction | |
Shanmugapriya et al. | A thorough investigation on speech enhancement techniques for hearing aids |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E601 | Decision to refuse application |