KR20110057596A - 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치, 잡음 환경에서 음성 신호를 강화하는 방법 및 그 장치 - Google Patents
잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치, 잡음 환경에서 음성 신호를 강화하는 방법 및 그 장치 Download PDFInfo
- Publication number
- KR20110057596A KR20110057596A KR1020090114059A KR20090114059A KR20110057596A KR 20110057596 A KR20110057596 A KR 20110057596A KR 1020090114059 A KR1020090114059 A KR 1020090114059A KR 20090114059 A KR20090114059 A KR 20090114059A KR 20110057596 A KR20110057596 A KR 20110057596A
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- noise
- frequency spectrum
- weight
- noise signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 230000002708 enhancing effect Effects 0.000 title description 5
- 238000001228 spectrum Methods 0.000 claims abstract description 116
- 230000003014 reinforcing effect Effects 0.000 claims description 30
- 230000002787 reinforcement Effects 0.000 claims description 18
- 230000005236 sound signal Effects 0.000 claims description 2
- 230000005540 biological transmission Effects 0.000 abstract 1
- 230000003068 static effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/32—Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
- Noise Elimination (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
본 발명의 일 실시예는 송신 단말 주변의 잡음 신호의 주파수 스펙트럼을 검출하고, 음성 신호와 잡음 신호가 혼합된 입력 신호가 수신되면, 그 입력 신호의 주파수 스펙트럼 및 음성 신호의 에너지 크기를 검출하고, 그 음성 신호의 에너지 크기에 기초하여 결정되는 가중치를 잡음 신호의 주파수 스펙트럼에 곱한 후, 그 가중치가 곱해진 잡음 신호의 주파수 스펙트럼을 입력 신호의 주파수 스펙트럼으로부터 차감하는 잡음 제거 방법을 개시한다.
Description
본 발명의 일실시예는 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치, 잡은 환경에서 음성 신호를 강화하는 방법 및 그 장치에 관한 것이다.
잡음 환경에서 음성 신호가 수신되면, 잡음 신호도 음성 신호와 함께 수신된다. 종래에는 이와 같이 음성 신호와 함께 수신되는 잡음 신호를 제거하기 위하여 음성 신호의 주파수 스펙트럼으로부터 잡음 신호의 주파수 스펙트럼을 제거하는 방법이 이용되었다.
본 발명의 일실시예의 목적은 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치, 잡은 환경에서 음성 신호를 강화하는 방법 및 그 장치를 제공하는 것이다.
상기 목적을 달성하기 위한 본 발명의 일실시예에 따른 잡음 환경의 송신 단 말에서 상기 송신 단말에 수신되는 입력 신호에 포함된 잡음을 제거하는 방법은 상기 송신 단말 주변의 잡음 신호의 주파수 스펙트럼을 검출하는 단계; 음성 신호와 상기 잡음 신호가 혼합된 입력 신호가 수신되면, 상기 입력 신호의 주파수 스펙트럼 및 상기 음성 신호의 에너지 크기를 검출하는 단계; 및 상기 음성 신호의 에너지 크기에 기초하여 결정되는 가중치를 상기 잡음 신호의 주파수 스펙트럼에 곱한 후, 상기 가중치가 곱해진 상기 잡음 신호의 주파수 스펙트럼을 상기 입력 신호의 주파수 스펙트럼으로부터 차감하는 단계를 포함하는 것을 특징으로 하는 잡음 제거 방법.
바람직하게는, 상기 음성 신호의 에너지 크기를 검출하는 단계는 상기 입력 신호의 에너지 크기를 검출함으로써 수행된다.
바람직하게는 상기 입력 신호의 주파수 스펙트럼 및 상기 음성 신호의 에너지 크기를 검출하는 단계는 상기 입력 신호를 시간 도메인 상에서 복수개의 프레임들로 분할하는 단계; 및 상기 분할된 프레임들별로 상기 입력 신호의 주파수 스펙트럼 및 상기 음성 신호의 에너지 크기를 검출하는 단계를 포함한다.
바람직하게는 상기 차감하는 단계는 현재의 프레임에서의 상기 음성 신호의 에너지 크기로부터 상기 현재의 프레임 이전의 N개의 프레임들에서의 상기 음성 신호의 에너지 크기들에 대한 평균 값을 차감함으로써 에너지 크기 차이 값을 계산하는 단계; 상기 에너지 크기 차이 값에 기초하여, 상기 가중치를 결정하는 단계; 상기 결정된 가중치를 상기 잡음 신호의 주파수 스펙트럼에 곱하는 단계; 및 상기 가중치가 곱해진 잡음 신호의 주파수 스펙트럼을 상기 각각의 프레임들에서의 상기 입력 신호의 주파수 스펙트럼으로부터 차감하는 단계를 포함한다.
바람직하게는, 상기 가중치는 상기 에너지 크기 차이 값이 커질수록 큰 값을 가지고, 상기 에너지 크기 차이 값이 임계치 이하인 경우에는 1이다.
바람직하게는 상기 송신 단말 주변의 잡음 신호의 주파수 스펙트럼을 검출하는 단계는 상기 잡음 신호를 시간 도메인 상에서 복수개의 프레임들로 분할하는 단계; 및 상기 분할된 프레임들별로 상기 잡음 신호의 주파수 스펙트럼을 검출하는 단계를 포함한다.
또한, 상기 목적을 달성하기 위한 본 발명의 다른 실시예에 따른 잡음 환경의 수신 단말에서 송신 단말로부터 수신된 음성 신호를 강화하는 방법은 상기 수신 단말 주변의 잡음 신호의 에너지 크기를 검출하는 단계; 상기 송신 단말로부터 음성 신호가 수신되는 동안 상기 수신 단말에서 설정되는 볼륨의 레벨을 체크하는 단계; 및 상기 잡음 신호의 에너지 크기와 상기 볼륨 레벨에 기초하여, 상기 음성 신호를 선택적으로 강화하는 단계를 포함한다.
바람직하게는 상기 수신 단말에서 설정되는 볼륨의 레벨을 체크하는 단계는상기 음성 신호를 시간 도메인 상에서 복수개의 프레임들로 분할하는 단계; 상기 분할된 프레임들별로 상기 수신 단말에서 설정되는 볼륨의 레벨을 체크하는 단계를 포함한다.
바람직하게는 상기 음성 신호를 선택적으로 강화하는 단계는 현재의 프레임에서의 상기 수신 단말의 볼륨 레벨로부터 상기 현재의 프레임 이전의 N개의 프레임들에서의 상기 수신 단말의 볼륨 레벨의 평균 값을 차감함으로써 볼륨 레벨 차이 값을 계산하는 단계; 상기 볼륨 레벨 차이 값에 기초하여, 가중치를 결정하는 단계; 상기 결정된 가중치를 상기 잡음 신호의 에너지 크기에 곱하는 단계; 및 상기 가중치가 곱해진 잡음 신호의 에너지 크기에 기초하여 상기 음성 신호를 선택적으로 강화하는 단계를 포함한다.
바람직하게는 상기 가중치는 상기 볼륨 레벨 차이 값이 커질수록 큰 값을 가지고, 상기 볼륨 레벨 차이 값이 임계치 이하인 경우에는 1이다.
바람직하게는 상기 음성 신호를 선택적으로 강화하는 단계는 상기 가중치가 곱해진 잡음 신호의 에너지 크기가 임계치를 초과하는 경우에 상기 음성 신호를 강화하고, 상기 가중치가 곱해진 잡음 신호의 에너지 크기에 따라 미리 정해진 비율로 상기 음성 신호를 강화한다.
또한, 상기 목적을 달성하기 위한 본 발명의 또 다른 실시예에 따른 잡음 환경에서 수신되는 입력 신호에 포함된 잡음을 제거하는 장치는 잡음 신호 및 음성 신호와 상기 잡음 신호가 혼합된 입력 신호를 수신하는 수신부; 상기 잡음 신호의 주파수 스펙트럼을 검출하는 잡음 신호 분석부; 상기 입력 신호의 주파수 스펙트럼 및 상기 음성 신호의 에너지 크기를 검출하는 입력 신호 분석부; 및 상기 음성 신호의 에너지 크기에 기초하여 결정되는 가중치를 상기 잡음 신호의 주파수 스펙트럼에 곱한 후, 상기 가중치가 곱해진 상기 잡음 신호의 주파수 스펙트럼을 상기 입력 신호의 주파수 스펙트럼으로부터 차감하는 잡음 제거부를 포함한다.
바람직하게는 상기 잡음 제거부는 현재의 프레임에서의 상기 음성 신호의 에너지 크기로부터 상기 현재의 프레임 이전의 N개의 프레임들에서의 상기 음성 신호 의 에너지 크기들에 대한 평균 값을 차감함으로써 에너지 크기 차이 값을 계산하는 차이 값 계산부; 상기 에너지 크기 차이 값에 기초하여 상기 가중치를 결정하는 가중치 결정부; 상기 결정된 가중치를 상기 잡음 신호의 주파수 스펙트럼에 곱하는 승산부; 및 상기 가중치가 곱해진 잡음 신호의 주파수 스펙트럼을 상기 각각의 프레임들에서의 상기 입력 신호의 주파수 스펙트럼으로부터 차감하는 차감부를 포함한다.
또한, 상기 목적을 달성하기 위한 본 발명의 또 다른 실시예에 따른 잡음 환경에서 송신 단말로부터 수신된 음성 신호를 강화하는 수신 단말은 상기 송신 단말로부터 음성 신호를 수신하는 음성 신호 수신부; 상기 수신 단말 주변의 잡음 신호를 수신하는 잡음 신호 수신부; 상기 잡음 신호의 에너지 크기를 검출하는 잡음 신호 분석부; 상기 음성 신호가 수신되는 동안 상기 수신 단말에서 설정되는 볼륨의 레벨을 체크하는 볼륨 체크부; 및 상기 잡음 신호의 에너지 크기와 상기 볼륨 레벨에 기초하여, 상기 음성 신호를 선택적으로 강화하는 음성 강화부를 포함한다.
바람직하게는 상기 음성 강화부는 현재의 프레임에서의 상기 수신 단말의 볼륨 레벨로부터 상기 현재의 프레임 이전의 N개의 프레임들에서의 상기 수신 단말의 볼륨 레벨의 평균 값을 차감함으로써 볼륨 레벨 차이 값을 계산하는 차이 값 계산부; 상기 볼륨 레벨 차이 값에 기초하여 가중치를 결정하는 가중치 결정부; 상기 결정된 가중치를 상기 잡음 신호의 에너지 크기에 곱하는 승산부; 및 상기 가중치가 곱해진 잡음 신호의 에너지 크기에 기초하여 상기 음성 신호를 선택적으로 강화하는 신호 강화부를 포함한다.
또한, 본 발명의 또 다른 실시예는 상기 목적을 달성하기 위하여 상기 송신 단말 주변의 잡음 신호의 주파수 스펙트럼을 검출하는 단계; 음성 신호와 상기 잡음 신호가 혼합된 입력 신호가 수신되면, 상기 입력 신호의 주파수 스펙트럼 및 상기 음성 신호의 에너지 크기를 검출하는 단계; 및 상기 음성 신호의 에너지 크기에 기초하여 결정되는 가중치를 상기 잡음 신호의 주파수 스펙트럼에 곱한 후, 상기 가중치가 곱해진 상기 잡음 신호의 주파수 스펙트럼을 상기 입력 신호의 주파수 스펙트럼으로부터 차감하는 단계를 포함하는 잡음 제거 방법을 실행시키기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체를 제공한다.
또한, 본 발명의 또 다른 실시예는 상기 목적을 달성하기 위하여 수신 단말 주변의 잡음 신호의 에너지 크기를 검출하는 단계; 상기 송신 단말로부터 음성 신호가 수신되는 동안 상기 수신 단말에서 설정되는 볼륨의 레벨을 체크하는 단계; 및 상기 잡음 신호의 에너지 크기와 상기 볼륨 레벨에 기초하여, 상기 음성 신호를 선택적으로 강화하는 단계를 포함하는 음성 신호 강화 방법을 실행시키기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체를 제공한다.
이하에서는 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 대하여 상세히 설명한다.
도 1은 본 발명의 일실시예에 따른 잡음 제거 방법을 설명하기 위하여 도시한 흐름도이다. 이하에서는 잡음 환경에서 사용자가 송신 단말에 음성을 입력하는 경우를 가정하여 설명한다.
단계 110에서는, 송신 단말 주변의 잡음 신호의 주파수 스펙트럼을 검출한다.
여기서, 송신 단말 주변의 잡음 신호는 사용자가 송신 단말에 음성을 입력하기 전에 송신 단말의 주변에서 그 송신 단말에 수신되는 잡음 신호를 말한다. 단계 110의 구체적인 동작에 대해서는 도 2를 참조하여 후술한다.
단계 120에서는, 음성 신호와 잡음 신호가 혼합된 입력 신호가 수신되면, 그 입력 신호의 주파수 스펙트럼 및 음성 신호의 에너지 크기를 검출한다.
이때, 본 발명의 일실시예에서는 음성 신호의 에너지 크기는 입력 신호의 에너지 크기를 검출함으로써 검출될 수 있다. 즉, 입력신호에는 음성 신호와 잡음 신호가 혼합되어 있지만, 잡음 신호의 에너지 크기에 비하여 음성 신호의 에너지 크기가 훨씬 더 큰 값을 가지기 때문에 입력 신호의 에너지 크기를 검출한 후 그 검출된 값을 음성 신호의 에너지 크기로 사용하더라도 그 입력 신호의 에너지 크기와 음성 신호의 에너지 크기간의 오차가 매우 작기 때문이다. 예컨대, 송신 단말의 주변이 매우 시끄러운 상황에서도 사용자는 송신 단말의 마이크에 매우 가까운 위치에서 음성을 입력하게 되므로, 잡음 신호의 에너지 크기보다 음성 신호의 에너지 크기가 훨씬 크게 된다.
다만, 음성 신호의 에너지 크기를 검출하는 방법은 상기 방법에 한정되지 않고, 음성 신호와 잡음 신호가 홉합된 입력 신호로부터 음성 신호의 에너지 크기를 계산할 수 있는 모든 기술이 본 발명에 적용될 수 있다.
한편, 입력 신호에 포함된 잡음 신호는 단계 110에서 수신된 잡음 신호와 유 사한 주파수 스펙트럼을 가질 수도 있지만, 단계 110에서 수신된 잡음 신호와 상이한 주파수 스펙트럼을 가질 수도 있다. 예컨대, 단계 110에서 수신된 잡음 신호가 정적 잡음인 경우에는 단계 110에서 수신된 잡음 신호와 입력 신호에 포함된 잡음 신호는 유사한 주파수 스펙트럼을 가질 수 있다. 하지만, 단계 110에서 수신된 잡음 신호가 비정적 잡음인 경우에는 단계 110에서 수신된 잡음 신호와 입력 신호에 포함된 잡음 신호는 상이한 주파수 스펙트럼을 가질 수 있다. 여기서, 입력 신호의 주파수 스펙트럼이란 주파수 도메인에서 주파수 별로 입력 신호의 크기를 표시한 것을 말한다. 단계 120의 구체적인 동작에 대해서는 도 3을 참조하여 후술한다.
단계 130에서는, 음성 신호의 에너지 크기에 기초하여 결정되는 가중치를 잡음 신호의 주파수 스펙트럼에 곱한 후, 그 가중치가 곱해진 잡음 신호의 주파수 스펙트럼을 입력 신호의 주파수 스펙트럼으로부터 차감한다.
이때, 잡음 신호의 주파수 스펙트럼에 가중치를 곱해주게 되면 잡음 신호의 스펙트럼이 보다 큰 크기를 가지게 되므로, 입력 신호의 주파수 스펙트럼으로부터 가중치가 곱해진 잡음 신호의 주파수 스펙트럼을 차감하게 되면 입력 신호로부터 잡음 신호를 보다 강력하게 제거할 수 있게 된다.
여기서, 가중치는 다양한 기준에 따라 결정될 수 있다.
예컨대, 음성 신호의 에너지 크기에 대하여 복수개의 임계치를 정해두고, 그 임계치들마다 그에 대응되는 가중치를 미리 결정해 두는 방법이 이용될 수 있다. 보다 구체적인 예로서, 음성 신호의 에너지 크기가 제1 임계치 이하이면 가중치가 1의 값을 가지고, 제1 임계치를 넘으면 가중치가 1.1의 값을 가지고, 제2 임계치를 넘으면 가중치가 1.2의 값을 가지고, 제3 임계치를 넘으면 가중치가 1.3의 값을 가지도록 가중치가 결정될 수 있다. 다만, 상기 예에서 임계치의 개수와 가중치의 값은 상기 예에서 기술한 개수와 값에 한정되지 않는다.
상기 예에서 음성 신호의 에너지 크기가 클수록 가중치가 더 큰 값을 가지도록 설정한 이유는, 음성 신호의 에너지 크기가 커졌다는 것은 송신 단말 주변의 잡음이 더 커졌거나, 사용자에게 송신 단말 주변이 시끄럽게 느껴져서 사용자가 큰 목소리로 대화하는 것으로 볼 수 있으므로, 음성 신호의 에너지 크기가 커질수록 음성 신호의 주파수 스펙트럼으로부터 차감할 잡음 신호의 주파수 스펙트럼의 크기를 더 크게 하기 위한 것이다. 이와 같이 본 발명의 일실시예는 잡음 신호가 비정적 잡음이었을때 잡음 신호의 주파수 스펙트럼을 새롭게 계산하지는 않지만, 기존에 검출한 잡음 신호의 주파수 스펙트럼의 크기를 키움으로써, 송신 단말의 잡음 환경 변화에 대응하여 입력신호로부터 비정적 잡음을 보다 효과적으로 제거할 수 있게 해준다.
한편, 가중치는 전술한 예와 다른 방식으로 결정될 수도 있는데, 이에 대해서는 도 4를 참조하여 후술한다.
도 2는 본 발명의 일실시예에 따라 잡음 신호의 주파수 스펙트럼을 검출하는 방법을 설명하기 위하여 도시한 흐름도이다.
단계 210에서는, 수신된 잡음 신호를 디지털 신호로 변환한다.
여기서, 디지털 신호로 변환되는 잡음 신호는 입력 신호가 수신되기 전에 수신된 잡음 신호이다.
단계 220에서는, 그 변환된 잡음 신호를 시간 도메인 상에서 복수개의 프레임들로 분할한다.
이때, 잡음 신호는 수 msec 또는 수십 msec 단위로 분할될 수 있고, 이에 따라 수 msec 또는 수십 msec의 크기를 가지는 복수개의 프레임들이 생성될 수 있다.
단계 230에서는, 그 분할된 프레임들별로 잡음 신호의 주파수 스펙트럼을 검출한다. 이때, 잡음 신호의 주파수 스펙트럼을 검출하기 위해서는 잡음 신호를 주파수 도메인으로 변환하는 과정이 수행되어야 하는데, 이와 같이 잡음 신호를 주파수 도메인으로 변환하는 동작은 고속 푸리에 변환(Fast Fourier Transform:FFT)을 이용하여 수행될 수 있다.
도 3은 본 발명의 일실시예에 따라 입력 신호의 주파수 스펙트럼 및 음성 신호의 에너지 크기를 검출하는 방법을 설명하기 위하여 도시한 흐름도이다.
단계 310에서는, 입력 신호를 디지털 신호로 변환한다.
단계 320에서는, 그 변환된 입력 신호를 시간 도메인 상에서 복수개의 프레임들로 분할한다.
이때, 입력 신호는 수 msec 또는 수십 msec 단위로 분할될 수 있고, 이에 따라 수 msec 또는 수십 msec의 크기를 가지는 복수개의 프레임들이 생성될 수 있다.
단계 330에서는, 그 분할된 프레임들별로 입력 신호의 주파수 스펙트럼 및 음성 신호의 에너지 크기를 검출한다. 이때, 입력 신호의 주파수 스펙트럼을 검출하기 위해서는 입력 신호를 주파수 도메인으로 변환하는 과정이 수행되어야 하는데, 이와 같이 입력 신호를 주파수 도메인으로 변환하는 동작은 고속 푸리에 변 환(Fast Fourier Transform:FFT)을 이용하여 수행될 수 있다.
도 4는 본 발명의 일실시예에 따라 입력 신호의 주파수 스펙트럼으로부터 잡음 신호의 주파수 스펙트럼을 차감하는 방법을 설명하기 위하여 도시한 흐름도이다.
이하에서는 프레임들별로 입력 신호의 주파수 스펙트럼 및 음성 신호의 에너지 크기를 검출하는 과정이 이미 수행되었다고 가정하고 설명한다.
단계 410에서는, 현재의 프레임에서의 음성 신호의 에너지 크기로부터 현재의 프레임 이전의 N개의 프레임들에서의 음성 신호의 에너지 크기들에 대한 평균 값을 차감함으로써 에너지 크기 차이 값을 계산한다.
여기서, 현재의 프레임이란 현재 수신되고 있는 입력 신호가 포함되는 시간 구간을 의미한다. 예컨대, 입력 신호가 이미 N개의 프레임들로 분할되었고, 현재 수신되는 입력 신호가 N+1번째 프레임에 해당한다면 현재 프레임은 N+1번째 프레임이 될 것이다.
이때, 에너지 크기 차이 값은 수학식 1과 같이 표시될 수 있다.
[수학식 1]
여기서, S(N+1)은 현재의 프레임(N+1번째 프레임)에서의 입력 신호의 주파수 스펙트럼을 나타내고, |S(N+1)|2은 현재의 프레임의 입력 신호의 에너지 크기를 나 타낸다. 또한, 은 첫 번째 프레임부터 N번째 프레임까지에서의 입력 신호의 에너지 크기들에 대한 평균 값을 나타낸다. 이때, 수학식 1에서 음성 신호의 에너지 크기 대신에 입력 신호의 에너지 크기를 이용하는 이유는, 전술한바와 같이 본 발명의 일실시예에서는 음성 신호의 에너지 크기를 계산할 때, 입력 신호의 에너지 크기를 계산한 후, 그 계산된 값을 그대로 음성 신호의 에너지 크기로 서 이용하기 때문이다. 따라서, |S(N+1)|2은 현재의 프레임의 음성 신호의 에너지 크기를 나타내고, 은 첫 번째 프레임부터 N번째 프레임까지에서의 음성 신호의 에너지 크기들에 대한 평균 값을 나타낸다고 볼 수 있다.
[수학식 2]
단계 420에서는, 에너지 크기 차이 값에 기초하여 가중치를 결정한다.
이때, 가중치는 에너지 크기 차이 값이 커질수록 큰 값을 가지고, 에너지 크기 차이 값이 임계치 이하인 경우에는 1이 되도록 설정될 수 있다.
예컨대, 에너지 크기 차이 값이 수학식 2와 같이 log 스케일로 표시될 때, 가중치는 수학식 3과 같이 표시될 수 있다.
[수학식 3]
W= 1, (Edlog<Th)
W= 1.1 (Edlog=1)
W= 1.2 (Edlog=2)
W= 1.3 (Edlog=3)
수학식 3을 참조하면, 에너지 크기 차이 값(Edlog)이 임계치(Th) 미만일 경우에는 가중치가 1이 되고, 에너지 크기 차이 값(Edlog)이 1일 경우에는 가중치가 1.1이 되고, 에너지 크기 차이 값(Edlog)이 2일 경우에는 가중치가 1.2가 되고, 에너지 크기 차이 값(Edlog)이 3일 경우에는 가중치가 1.3이 되도록 설정되어 있다.
단계 430에서는, 그 결정된 가중치를 잡음 신호의 주파수 스펙트럼에 곱한다.
가중치가 곱해진 잡음 신호의 주파수 스펙트럼은 수학식 4와 같이 표시될 수 있다.
[수학식 4]
H'(f) = W × H(f)
여기서, f는 주파수를 나타내고, H(f)는 잡음 신호의 주파수 스펙트럼을 나타내고, H'(f)는 가중치가 곱해진 잡음 신호의 주파수 스펙트럼을 나타낸다.
단계 440에서는, 그 가중치가 곱해진 잡음 신호의 주파수 스펙트럼을 각각의 프레임들에서의 입력 신호의 주파수 스펙트럼으로부터 차감한다.
단계 440의 동작은 수학식 5와 같이 표시될 수 있다.
[수학식 5]
S'(f) = S(f) - H'(f)
여기서, S(f)는 입력 신호의 주파수 스펙트럼을 나타내고, H'(f)는 가중치가 곱해진 잡음 신호의 주파수 스펙트럼을 나타내고, S'(f)는 잡음이 제거된 입력 신호의 주파수 스펙트럼을 나타낸다.
단계 440을 통하여 각각의 프레임들에서의 입력 신호의 주파수 스펙트럼으로부터 가중치가 곱해진 잡음 신호의 주파수 스펙트럼을 제거함으로써, 최종적으로 음질이 향상된 입력 신호가 생성되면 그 입력 신호를 다시 시간 도메인으로 변환함으로써 입력 신호에서의 잡음 제거는 완료된다.
도 5는 본 발명의 일실시예에 따른 잡음 제거 장치를 설명하기 위하여 도시한 도면이다. 도 5를 참조하면, 본 발명의 일실시예에 따른 잡음 제거 장치는 수신부(510), 잡음 신호 분석부(520), 입력 신호 분석부(530) 및 잡음 제거부(540)를 포함한다.
수신부(510)는 잡음 신호 또는 음성 신호와 잡음 신호가 혼합된 입력 신호를 수신한다.
잡음 신호 분석부(520)는 잡음 신호의 주파수 스펙트럼을 검출한다.
입력 신호 분석부(530)는 입력 신호의 주파수 스펙트럼 및 음성 신호의 에너 지 크기를 검출한다.
전술한바와 같이, 본 발명의 일실시예에서는 입력 신호 분석부(530)가 입력 신호의 에너지 크기를 검출한 후, 그 검출된 값을 그대로 음성 신호의 에너지 크기로서 검출할 수 있다.
잡음 제거부(540)는 음성 신호의 에너지 크기에 기초하여 결정되는 가중치를 잡음 신호의 주파수 스펙트럼에 곱한 후, 그 가중치가 곱해진 잡음 신호의 주파수 스펙트럼을 입력 신호의 주파수 스펙트럼으로부터 차감한다.
도 6은 본 발명의 일실시예에 따른 잡음 제거부의 동작을 설명하기 위하여 도시한 도면이다.
도 6을 참조하면 본 발명의 일실시예에 따른 잡음 제거부(540)는 차이 값 계산부(542), 가중치 결정부(544), 승산부(546) 및 차감부(548)를 포함한다.
차이 값 계산부(542)는 현재의 프레임에서의 음성 신호의 에너지 크기로부터 현재의 프레임 이전의 N개의 프레임들에서의 음성 신호의 에너지 크기들에 대한 평균 값을 차감함으로써 에너지 크기 차이 값을 계산한다.
가중치 결정부(544)는 그 에너지 크기 차이 값에 기초하여 가중치를 결정한다.
승산부(546)는 그 결정된 가중치를 잡음 신호의 주파수 스펙트럼에 곱한다.
차감부(548)는 가중치가 곱해진 잡음 신호의 주파수 스펙트럼을 각각의 프레임들에서의 입력 신호의 주파수 스펙트럼으로부터 차감한다.
지금까지는 송신 단말에서 입력 신호로부터 잡음을 제거하는 방법과 그 장치 에 대하여 설명하였다. 이하에서는 그 송신 단말로부터 음성 신호를 수신한 수신 단말에서 그 수신한 음성 신호를 강화하는 방법에 대하여 설명한다.
도 7은 본 발명의 일실시예에 따른 음성 신호 강화 방법을 설명하기 위하여 도시한 흐름도이다.
단계 710에서는, 수신 단말 주변의 잡음 신호의 에너지 크기를 검출한다.
이때, 수신 단말 주변의 잡음 신호는 수신 단말의 마이크를 통하여 수신될 수 있다. 한편, 수신 단말 주변의 잡음 신호의 에너지 크기를 검출하는 과정은 도 2에서 설명한 방법으로 잡음 신호의 주파수 스펙트럼을 검출한 후에, 그 검출된 주파수 스펙트럼의 에너지의 크기를 계산하면 되므로, 상세한 설명은 생략한다.
단계 720에서는, 송신 단말로부터 음성 신호가 수신되는 동안 수신 단말에서 설정되는 볼륨의 레벨을 체크한다.
이와 같이 수신 단말의 볼륨의 레벨을 체크하는 이유는 사용자가 송신 단말 주변이 시끄럽다고 느끼면 송신 단말로부터 수신되는 음성 신호를 잘 듣기 위하여 볼륨 레벨을 높이게 되는 습성이 있는데, 이와 같은 습성을 음성 신호를 강화하는 데 이용하기 위한 것이다. 이때, 수신 단말의 볼륨 레벨은 소정의 주기마다 한번씩 체크될 수 있다. 한편, 단계 720에서 송신 단말로부터 수신되는 음성 신호는 송신 단말에서 잡음이 제거된 음성 신호일 수 있다.
단계 720에 대한 구체적인 동작에 대해서는 도 8을 참조하여 후술한다.
단계 730에서는, 잡음 신호의 에너지 크기와 수신 단말의 볼륨 레벨에 기초하여 음성 신호를 선택적으로 강화한다.
종래에는 음성 신호를 강화할 때 잡음 신호의 에너지 크기만을 고려하였으나, 본 발명의 일실시예는 음성 신호를 강화할 때 이와 같이 잡음 신호의 에너지 크기와 수신 단말의 볼륨 레벨을 모두 고려함으로써, 수신 단말 주변의 잡음 신호의 크기라는 객관적인 요소뿐만 아니라, 사용자가 설정하는 수신 단말의 볼륨 레벨과 같은 주관적인 요소까지 반영하여 음성 신호를 강화할 수 있게 되는 효과가 있다.
단계 730에 대한 구체적인 동작과 이에 따른 효과에 대해서는 도 9를 참조하여 후술한다.
도 8은 본 발명의 일실시예에 따라 수신 단말의 볼륨 레벨을 체크하는 방법을 설명하기 위하여 도시한 흐름도이다.
단계 810에서는, 송신 단말로부터 수신된 음성 신호를 디지털 신호로 변환한다.
단계 820에서는, 그 변환된 음성 신호를 시간 도메인 상에서 복수개의 프레임들로 분할한다.
단계 830에서는, 그 분할된 각각의 프레임들별로 수신 단말에서 설정되는 볼륨의 레벨을 체크한다.
도 9는 본 발명의 일실시예에 따라 음성 신호를 강화하는 방법을 설명하기 위하여 도시한 흐름도이다.
단계 910에서는, 현재의 프레임에서의 수신 단말의 볼륨 레벨로부터 현재의 프레임 이전의 N개의 프레임들에서의 수신 단말의 볼륨 레벨의 평균 값을 차감함으 로써 볼륨 레벨 차이 값을 계산한다.
이때, 볼륨 레벨 차이 값은 수학식 6과 같이 표시될 수 있다.
[수학식 6]
여기서, V(N+1)은 현재의 프레임(N+1번째 프레임)에서의 수신 단말의 볼륨 레벨을 나타내고, 는 첫 번째 프레임부터 N번째 프레임까지에서의 수신 단말의 볼륨 레벨들의 평균 값을 나타낸다.
이때, 수신 단말의 볼륨 레벨은 정규화된 값을 가진다고 가정한다. 예컨대, 수신 단말의 볼륨 레벨은 0에서 10까지의 레벨을 가질 수 있다.
단계 920에서는, 그 볼륨 레벨 차이 값에 기초하여 가중치를 결정한다.
도 1 내지 도 6에서의 가중치와의 구별을 위하여 이하에서는 볼륨 레벨 차이 값에 기초하여 결정되는 가중치는 볼륨 가중치(Wv)로 명명하기로 한다.
이때, 볼륨 가중치(Wv)는 볼륨 레벨 차이 값이 커질수록 큰 값을 가지고, 볼륨 레벨 차이 값이 임계치 이하인 경우에는 1이 되도록 설정될 수 있다.
예컨대, 볼륨 가중치(Wv)는 수학식 7과 같이 표시될 수 있다.
[수학식 7]
Wv= 1 (Vd≤1)
Wv= 1.2 (Vd=2)
Wv= 1.4 (Vd=3)
Wv= 1.6 (Vd=4)
수학식 7을 참조하면, 볼륨 레벨 차이 값(Vd)이 임계치(Thv)인 1 이하일 경우에는 볼륨 가중치(Wv)가 1이 되고, 볼륨 레벨 차이 값(Vd)이 2일 경우에는 볼륨 가중치(Wv)가 1.2가 되고, 볼륨 레벨 차이 값(Vd)이 3일 경우에는 볼륨 가중치(Wv)가 1.4가 되고, 볼륨 레벨 차이 값(Vd)이 4일 경우에는 볼륨 가중치(Wv)가 1.6이 되도록 설정되어 있다.
단계 930에서는, 그 결정된 가중치(Wv)를 잡음 신호의 에너지 크기에 곱한다.
볼륨 가중치(Wv)가 곱해진 잡음 신호의 에너지 크기는 수학식 8과 같이 표시될 수 있다.
[수학식 8]
E'N = Wv× EN
여기서, EN은 잡음 신호의 에너지 크기를 나타내고, E'N은 볼륨 가중치(Wv)가 곱해진 잡음 신호의 에너지 크기를 나타낸다.
단계 940에서는, 그 가중치(Wv)가 곱해진 잡음 신호의 에너지 크기에 기초하여 음성 신호를 선택적으로 강화한다.
이하에서는 가중치(Wv)가 곱해진 잡음 신호의 에너지 크기(E'N)를 잡음 신호의 가중 에너지 크기(E'N)라고 명명한다.
단계 940에서와 같이 음성 신호를 강화할 때, 잡음 신호의 가중 에너지 크기(E'N)에 기초하여 결정되는 음성 강화 가중치(We)가 이용될 수 있다. 음성 강화 가중치(We)를 이용한 음성 신호 강화 동작은 수학식 9와 같이 표시될 수 있다.
[수학식 9]
S'(f) = We×S(f)
We= 1 (E'N≤10dB)
We= 1.1 (E'N≤15dB)
We= 1.2 (E'N≤20dB)
We= 1.3 (E'N≤25dB)
여기서, S(f)는 음성 신호의 주파수 스펙트럼을 나타내고, S'(f)는 음성 강화 가중치(We)가 곱해진 음성 신호의 주파수 스펙트럼을 나타낸다. 이와 같이 음성 신호의 주파수 스펙트럼에 1을 초과하는 음성 강화 가중치(We)가 곱해지면, 음성이 강화된다.
한편, 수학식 9를 참조하면 잡음 신호의 가중 에너지 크기(E'N)가 임계치(The)인 10dB이하라면 음성 강화 가중치(We)가 1이 되어 음성 신호는 강화되지 않는다. 하지만, 잡음 신호의 가중 에너지 크기(E'N)가 10dB를 초과하고 15dB이하이면 음성 강화 가중치(We)는 1.1이 되고, 잡음 신호의 가중 에너지 크기(E'N)가 15dB를 초과하고 20dB이하이면 음성 강화 가중치(We)는 1.2가 되고, 잡음 신호의 가중 에너지 크기(E'N)가 20dB를 초과하고 25dB이하이면 음성 강화 가중치(We)는 1.3이 되어, 음성 강화 가중치(We)에 비례하여 음성 신호가 강화된다.
수학식 9를 참조하여, 본원 발명과 종래 기술을 비교하면 다음과 같은 차이점이 있다.
만일, 잡음 신호의 에너지 크기(EN)가 9dB이라고 한다면, 종래 기술의 경우에는 음성 신호를 강화할 때 잡음 신호의 에너지 크기(EN)만을 고려하기 때문에, 수학식 9에서 잡음 신호의 가중 에너지 크기(E'N) 대신에 잡음 신호의 에너지 크기(EN)가 임계치(The)인 10dB와 비교되고, 잡음 신호의 에너지 크기(EN)가 임계치(The)인 10dB보다 작으므로 음성 신호는 강화되지 않을 것이다.
하지만, 본원 발명의 일실시예에 따르면 잡음 신호의 에너지 크기(EN)가 9dB인 경우에도 볼륨 레벨 차이 값이 2라고 한다면, 잡음 신호의 에너지 크기(EN)인 9dB에 볼륨 가중치(Wv)인 1.2가 곱해져 잡음 신호의 가중 에너지 크기(E'N)가 10.8dB이 되어, 잡음 신호의 가중 에너지 크기(E'N)가 임계치(The)인 10dB보다 커지게 되므로 음성 신호는 1.1배만큼 강화될 것이다.
이와 같이 본원 발명의 일실시예는 잡음 신호의 에너지 크기(EN)만으로는 음성 신호를 강화할 필요가 없는 상황인 경우에 사용자의 의사를 반영하여 음성 신호를 강화할 수 있게 되는 효과가 있다. 또한, 음성 신호를 강화하여야 할 필요가 있는 경우에는 사용자의 의사를 반영하여 더 높은 비율로 음성 신호를 강화할 수 있게 되는 효과가 있다.
도 10은 본 발명의 일실시예에 따른 송신 단말로부터 수신된 음성 신호를 강화하는 수신 단말을 설명하기 위하여 도시한 도면이다.
본 발명의 일실시예에 따른 수신 단말은 음성 신호 수신부(1010), 잡음 신호 수신부(1020), 잡음 신호 분석부(1030), 볼륨 체크부(1040) 및 음성 강화부(1050)를 포함한다.
음성 신호 수신부(1010)는 송신 단말로부터 음성 신호를 수신한다.
잡음 신호 수신부(1020)는 수신 단말 주변의 잡음 신호를 수신한다.
바람직하게는, 잡음 신호 수신부(102)는 수신 단말에 탑재된 마이크일 수 있다.
잡음 신호 분석부(1030)는 잡음 신호의 에너지 크기를 검출한다.
볼륨 체크부(1040)는 음성 신호가 수신되는 동안 수신 단말에서 설정되는 볼륨의 레벨을 체크한다.
음성 강화부(1050)는 잡음 신호의 에너지 크기와 수신 단말의 볼륨 레벨에 기초하여, 음성 신호를 선택적으로 강화한다.
도 11은 본 발명의 일실시예에 따른 음성 강화부를 설명하기 위하여 도시한 도면이다. 본 발명의 일실시예에 따른 음성 강화부(1050)는 차이 값 계산부(1052), 가중치 결정부(1054), 승산부(1056) 및 신호 강화부(1058)를 포함한다.
차이 값 계산부(1052)는 현재의 프레임에서의 수신 단말의 볼륨 레벨로부터 현재의 프레임 이전의 N개의 프레임들에서의 수신 단말의 볼륨 레벨의 평균 값을 차감함으로써 볼륨 레벨 차이 값을 계산한다.
가중치 결정부(1054)는 수신 단말의 볼륨 레벨 차이 값에 기초하여 가중치(Wv)를 결정한다.
승산부(1056)는 그 결정된 가중치(Wv)를 잡음 신호의 에너지 크기에 곱한다.
신호 강화부(1058)는 그 가중치(Wv)가 곱해진 잡음 신호의 에너지 크기에 기초하여 음성 신호를 선택적으로 강화한다.
이때, 신호 강화부(1058)는 음성 신호의 주파수 스펙트럼에 음성 강화 가중치(We)를 곱함으로써 음성 신호를 강화할 수 있다.
한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다.
상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등) 및 캐리어 웨이브(예를 들면, 인터넷을 통한 전송)와 같은 저장매체를 포함한다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
도 1은 본 발명의 일실시예에 따른 잡음 제거 방법을 설명하기 위하여 도시한 흐름도이다.
도 2는 본 발명의 일실시예에 따라 잡음 신호의 주파수 스펙트럼을 검출하는 방법을 설명하기 위하여 도시한 흐름도이다.
도 3은 본 발명의 일실시예에 따라 입력 신호의 주파수 스펙트럼 및 음성 신
호의 에너지 크기를 검출하는 방법을 설명하기 위하여 도시한 흐름도이다.
도 4는 본 발명의 일실시예에 따라 입력 신호의 주파수 스펙트럼으로부터 잡음 신호의 주파수 스펙트럼을 차감하는 방법을 설명하기 위하여 도시한 흐름도이다.
도 5는 본 발명의 일실시예에 따른 잡음 제거 장치를 설명하기 위하여 도시한 도면이다.
도 6은 본 발명의 일실시예에 따른 잡음 제거부의 동작을 설명하기 위하여 도시한 도면이다.
도 7은 본 발명의 일실시예에 따른 음성 신호 강화 방법을 설명하기 위하여 도시한 흐름도이다.
도 8은 본 발명의 일실시예에 따라 수신 단말의 볼륨 레벨을 체크하는 방법을 설명하기 위하여 도시한 흐름도이다.
도 9는 본 발명의 일실시예에 따라 음성 신호를 강화하는 방법을 설명하기 위하여 도시한 흐름도이다.
도 10은 본 발명의 일실시예에 따른 송신 단말로부터 수신된 음성 신호를 강화하는 수신 단말을 설명하기 위하여 도시한 도면이다.
도 11은 본 발명의 일실시예에 따른 음성 강화부를 설명하기 위하여 도시한 도면이다.
Claims (23)
- 잡음 환경의 송신 단말에서 상기 송신 단말에 수신되는 입력 신호에 포함된 잡음을 제거하는 방법에 있어서,상기 송신 단말 주변의 잡음 신호의 주파수 스펙트럼을 검출하는 단계;음성 신호와 상기 잡음 신호가 혼합된 입력 신호가 수신되면, 상기 입력 신호의 주파수 스펙트럼 및 상기 음성 신호의 에너지 크기를 검출하는 단계; 및상기 음성 신호의 에너지 크기에 기초하여 결정되는 가중치를 상기 잡음 신호의 주파수 스펙트럼에 곱한 후, 상기 가중치가 곱해진 상기 잡음 신호의 주파수 스펙트럼을 상기 입력 신호의 주파수 스펙트럼으로부터 차감하는 단계를 포함하는 것을 특징으로 하는 잡음 제거 방법.
- 제1항에 있어서,상기 음성 신호의 에너지 크기를 검출하는 단계는상기 입력 신호의 에너지 크기를 검출함으로써 수행되는 것을 특징으로 하는 잡음 제거 방법.
- 제1항에 있어서,상기 입력 신호의 주파수 스펙트럼 및 상기 음성 신호의 에너지 크기를 검출하는 단계는상기 입력 신호를 시간 도메인 상에서 복수개의 프레임들로 분할하는 단계; 및상기 분할된 프레임들별로 상기 입력 신호의 주파수 스펙트럼 및 상기 음성 신호의 에너지 크기를 검출하는 단계를 포함하는 것을 특징으로 하는 잡음 제거 방법.
- 제3항에 있어서,상기 차감하는 단계는현재의 프레임에서의 상기 음성 신호의 에너지 크기로부터 상기 현재의 프레임 이전의 N개의 프레임들에서의 상기 음성 신호의 에너지 크기들에 대한 평균 값을 차감함으로써 에너지 크기 차이 값을 계산하는 단계;상기 에너지 크기 차이 값에 기초하여, 상기 가중치를 결정하는 단계;상기 결정된 가중치를 상기 잡음 신호의 주파수 스펙트럼에 곱하는 단계; 및상기 가중치가 곱해진 잡음 신호의 주파수 스펙트럼을 상기 각각의 프레임들에서의 상기 입력 신호의 주파수 스펙트럼으로부터 차감하는 단계를 포함하는 것을 특징으로 하는 잡음 제거 방법.
- 제4항에 있어서,상기 가중치는상기 에너지 크기 차이 값이 커질수록 큰 값을 가지고,상기 에너지 크기 차이 값이 임계치 이하인 경우에는 1인 것을 특징으로 하는 잡음 제거 방법.
- 제1항에 있어서,상기 송신 단말 주변의 잡음 신호의 주파수 스펙트럼을 검출하는 단계는상기 잡음 신호를 시간 도메인 상에서 복수개의 프레임들로 분할하는 단계; 및상기 분할된 프레임들별로 상기 잡음 신호의 주파수 스펙트럼을 검출하는 단계를 포함하는 것을 특징으로 하는 잡음 제거 방법.
- 잡음 환경의 수신 단말에서 송신 단말로부터 수신된 음성 신호를 강화하는 방법에 있어서,상기 수신 단말 주변의 잡음 신호의 에너지 크기를 검출하는 단계;상기 송신 단말로부터 음성 신호가 수신되는 동안 상기 수신 단말에서 설정되는 볼륨의 레벨을 체크하는 단계; 및상기 잡음 신호의 에너지 크기와 상기 볼륨 레벨에 기초하여, 상기 음성 신호를 선택적으로 강화하는 단계를 포함하는 것을 특징으로 하는 음성 신호 강화 방법.
- 제7항에 있어서,상기 수신 단말에서 설정되는 볼륨의 레벨을 체크하는 단계는상기 음성 신호를 시간 도메인 상에서 복수개의 프레임들로 분할하는 단계;상기 분할된 프레임들별로 상기 수신 단말에서 설정되는 볼륨의 레벨을 체크하는 단계를 포함하는 것을 특징으로 하는 음성 신호 강화 방법.
- 제8항에 있어서,상기 음성 신호를 선택적으로 강화하는 단계는현재의 프레임에서의 상기 수신 단말의 볼륨 레벨로부터 상기 현재의 프레임 이전의 N개의 프레임들에서의 상기 수신 단말의 볼륨 레벨의 평균 값을 차감함으로써 볼륨 레벨 차이 값을 계산하는 단계;상기 볼륨 레벨 차이 값에 기초하여, 가중치를 결정하는 단계;상기 결정된 가중치를 상기 잡음 신호의 에너지 크기에 곱하는 단계; 및상기 가중치가 곱해진 잡음 신호의 에너지 크기에 기초하여 상기 음성 신호를 선택적으로 강화하는 단계를 포함하는 것을 특징으로 하는 음성 신호 강화 방법.
- 제9항에 있어서,상기 가중치는상기 볼륨 레벨 차이 값이 커질수록 큰 값을 가지고,상기 볼륨 레벨 차이 값이 임계치 이하인 경우에는 1인 것을 특징으로 하는 음성 신호 강화 방법.
- 제9항에 있어서,상기 음성 신호를 선택적으로 강화하는 단계는상기 가중치가 곱해진 잡음 신호의 에너지 크기가 임계치를 초과하는 경우에 상기 음성 신호를 강화하고,상기 가중치가 곱해진 잡음 신호의 에너지 크기에 따라 미리 정해진 비율로 상기 음성 신호를 강화하는 것을 특징으로 하는 음성 신호 강화 방법.
- 잡음 환경에서 수신되는 입력 신호에 포함된 잡음을 제거하는 장치에 있어서,잡음 신호 및 음성 신호와 상기 잡음 신호가 혼합된 입력 신호를 수신하는 수신부;상기 잡음 신호의 주파수 스펙트럼을 검출하는 잡음 신호 분석부;상기 입력 신호의 주파수 스펙트럼 및 상기 음성 신호의 에너지 크기를 검출하는 입력 신호 분석부; 및상기 음성 신호의 에너지 크기에 기초하여 결정되는 가중치를 상기 잡음 신호의 주파수 스펙트럼에 곱한 후, 상기 가중치가 곱해진 상기 잡음 신호의 주파수 스펙트럼을 상기 입력 신호의 주파수 스펙트럼으로부터 차감하는 잡음 제거부를 포함하는 것을 특징으로 하는 잡음 제거 장치.
- 제12항에 있어서,상기 입력 신호 분석부는상기 입력 신호의 에너지 크기를 검출함으로써 상기 음성 신호의 에너지 크기를 검출하는 것을 특징으로 하는 잡음 제거 장치.
- 제12항에 있어서,상기 입력 신호 분석부는상기 입력 신호를 시간 도메인 상에서 복수개의 프레임들로 분할하고, 상기 분할된 프레임들별로 상기 입력 신호의 주파수 스펙트럼 및 상기 음성 신호의 에너지 크기를 검출하는 것을 특징으로 하는 잡음 제거 장치.
- 제14항에 있어서,상기 잡음 제거부는현재의 프레임에서의 상기 음성 신호의 에너지 크기로부터 상기 현재의 프레임 이전의 N개의 프레임들에서의 상기 음성 신호의 에너지 크기들에 대한 평균 값을 차감함으로써 에너지 크기 차이 값을 계산하는 차이 값 계산부;상기 에너지 크기 차이 값에 기초하여 상기 가중치를 결정하는 가중치 결정부;상기 결정된 가중치를 상기 잡음 신호의 주파수 스펙트럼에 곱하는 승산부; 및상기 가중치가 곱해진 잡음 신호의 주파수 스펙트럼을 상기 각각의 프레임들에서의 상기 입력 신호의 주파수 스펙트럼으로부터 차감하는 차감부를 포함하는 것을 특징으로 하는 잡음 제거 장치.
- 제15항에 있어서,상기 가중치는상기 에너지 크기 차이 값이 커질수록 큰 값을 가지고,상기 에너지 크기 차이 값이 임계치 이하인 경우에는 1인 것을 특징으로 하는 잡음 제거 장치.
- 제12항에 있어서,상기 잡음 신호 분석부는상기 잡음 신호를 시간 도메인 상에서 복수개의 프레임들로 분할하고, 상기 분할된 프레임들별로 상기 잡음 신호의 주파수 스펙트럼을 검출하는 것을 특징으로 하는 잡음 제거 장치.
- 잡음 환경에서 송신 단말로부터 수신된 음성 신호를 강화하는 수신 단말에 있어서,상기 송신 단말로부터 음성 신호를 수신하는 음성 신호 수신부;상기 수신 단말 주변의 잡음 신호를 수신하는 잡음 신호 수신부;상기 잡음 신호의 에너지 크기를 검출하는 잡음 신호 분석부;상기 음성 신호가 수신되는 동안 상기 수신 단말에서 설정되는 볼륨의 레벨을 체크하는 볼륨 체크부; 및상기 잡음 신호의 에너지 크기와 상기 볼륨 레벨에 기초하여, 상기 음성 신호를 선택적으로 강화하는 음성 강화부를 포함하는 것을 특징으로 하는 수신 단말.
- 제18항에 있어서,상기 볼륨 체크부는상기 음성 신호를 시간 도메인 상에서 복수개의 프레임들로 분할하고, 상기 분할된 프레임들별로 상기 수신 단말에서 설정되는 볼륨의 레벨을 체크하는 것을 특징으로 하는 수신 단말.
- 제19항에 있어서,상기 음성 강화부는현재의 프레임에서의 상기 수신 단말의 볼륨 레벨로부터 상기 현재의 프레임 이전의 N개의 프레임들에서의 상기 수신 단말의 볼륨 레벨의 평균 값을 차감함으로써 볼륨 레벨 차이 값을 계산하는 차이 값 계산부;상기 볼륨 레벨 차이 값에 기초하여 가중치를 결정하는 가중치 결정부;상기 결정된 가중치를 상기 잡음 신호의 에너지 크기에 곱하는 승산부; 및상기 가중치가 곱해진 잡음 신호의 에너지 크기에 기초하여 상기 음성 신호를 선택적으로 강화하는 신호 강화부를 포함하는 것을 특징으로 하는 수신 단말.
- 제20항에 있어서,상기 가중치는상기 볼륨 레벨 차이 값이 커질수록 큰 값을 가지고,상기 볼륨 레벨 차이 값이 임계치 이하인 경우에는 1인 것을 특징으로 하는 수신 단말.
- 제20항에 있어서,상기 신호 강화부는상기 가중치가 곱해진 잡음 신호의 에너지 크기가 임계치를 초과하는 경우에 상기 음성 신호를 강화하고,상기 가중치가 곱해진 잡음 신호의 에너지 크기에 따라 미리 정해진 비율로 상기 음성 신호를 강화하는 것을 특징으로 하는 수신 단말.
- 제1항 내지 제11항 중 어느 한 항의 방법을 실행시키기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090114059A KR101624652B1 (ko) | 2009-11-24 | 2009-11-24 | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치, 잡음 환경에서 음성 신호를 강화하는 방법 및 그 장치 |
EP13194327.6A EP2704141B1 (en) | 2009-11-24 | 2010-11-03 | Enhancement of a voice signal in a noisy environment |
EP10189888A EP2333771A1 (en) | 2009-11-24 | 2010-11-03 | Method and apparatus to enhance an audio signal in a noisy environment |
US12/942,069 US8731915B2 (en) | 2009-11-24 | 2010-11-09 | Method and apparatus to remove noise from an input signal in a noisy environment, and method and apparatus to enhance an audio signal in a noisy environment |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090114059A KR101624652B1 (ko) | 2009-11-24 | 2009-11-24 | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치, 잡음 환경에서 음성 신호를 강화하는 방법 및 그 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110057596A true KR20110057596A (ko) | 2011-06-01 |
KR101624652B1 KR101624652B1 (ko) | 2016-05-26 |
Family
ID=43622612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090114059A KR101624652B1 (ko) | 2009-11-24 | 2009-11-24 | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치, 잡음 환경에서 음성 신호를 강화하는 방법 및 그 장치 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8731915B2 (ko) |
EP (2) | EP2333771A1 (ko) |
KR (1) | KR101624652B1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101579689B1 (ko) | 2014-07-23 | 2015-12-23 | 울산대학교 산학협력단 | 음향 방출 신호의 잡음 제거 방법 및 장치 |
WO2016053019A1 (ko) * | 2014-10-01 | 2016-04-07 | 삼성전자 주식회사 | 잡음이 포함된 오디오 신호를 처리하는 방법 및 장치 |
KR101723523B1 (ko) | 2016-11-22 | 2017-04-05 | 주식회사 아이디케이 | 탄성파 신호 추출 성능이 향상된 음향방출 시험장치 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8804984B2 (en) * | 2011-04-18 | 2014-08-12 | Microsoft Corporation | Spectral shaping for audio mixing |
CN102325218B (zh) * | 2011-08-10 | 2013-12-25 | 深圳市无线开锋科技有限公司 | 声控变换手机应用动态显示效果的方法及装置 |
US9282414B2 (en) | 2012-01-30 | 2016-03-08 | Hewlett-Packard Development Company, L.P. | Monitor an event that produces a noise received by a microphone |
JP6135106B2 (ja) | 2012-11-29 | 2017-05-31 | 富士通株式会社 | 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム |
JP6143887B2 (ja) * | 2013-12-26 | 2017-06-07 | 株式会社東芝 | 方法、電子機器およびプログラム |
CN103811017B (zh) * | 2014-01-16 | 2016-05-18 | 浙江工业大学 | 一种基于Welch法的冲床噪声功率谱估计改进方法 |
JP6361271B2 (ja) * | 2014-05-09 | 2018-07-25 | 富士通株式会社 | 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム |
CN105336341A (zh) * | 2014-05-26 | 2016-02-17 | 杜比实验室特许公司 | 增强音频信号中的语音内容的可理解性 |
CN105142067B (zh) * | 2014-05-26 | 2020-01-07 | 杜比实验室特许公司 | 音频信号响度控制 |
TWI576834B (zh) * | 2015-03-02 | 2017-04-01 | 聯詠科技股份有限公司 | 聲頻訊號的雜訊偵測方法與裝置 |
CN107240403B (zh) * | 2016-03-28 | 2021-08-27 | 阿里巴巴集团控股有限公司 | 声波传输方法及装置 |
KR102606789B1 (ko) * | 2018-10-01 | 2023-11-28 | 삼성전자주식회사 | 복수의 음성 인식 장치들을 제어하는 방법 및 그 방법을 지원하는 전자 장치 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6311155B1 (en) * | 2000-02-04 | 2001-10-30 | Hearing Enhancement Company Llc | Use of voice-to-remaining audio (VRA) in consumer applications |
EP1811660B1 (en) * | 1999-03-30 | 2013-10-09 | Qualcomm Incorporated | Method and apparatus for automatically adjusting speaker gain within a mobile telephone |
US6675125B2 (en) * | 1999-11-29 | 2004-01-06 | Syfx | Statistics generator system and method |
KR100343776B1 (ko) * | 1999-12-03 | 2002-07-20 | 한국전자통신연구원 | 디지털 전화 단말기에서 주변소음에 따른 신호음 및/또는수신음 크기 조절장치 및 방법 |
US7089181B2 (en) * | 2001-05-30 | 2006-08-08 | Intel Corporation | Enhancing the intelligibility of received speech in a noisy environment |
RU2206174C2 (ru) * | 2001-03-05 | 2003-06-10 | Журин Дмитрий Вячеславович | Способ регулирования громкости звуковоспроизведения и устройства для его реализации |
US20040148160A1 (en) * | 2003-01-23 | 2004-07-29 | Tenkasi Ramabadran | Method and apparatus for noise suppression within a distributed speech recognition system |
WO2004077806A1 (en) * | 2003-02-27 | 2004-09-10 | Telefonaktiebolaget Lm Ericsson (Publ) | Audibility enhancement |
JP4520732B2 (ja) * | 2003-12-03 | 2010-08-11 | 富士通株式会社 | 雑音低減装置、および低減方法 |
JP4260046B2 (ja) * | 2004-03-03 | 2009-04-30 | アルパイン株式会社 | 音声明瞭度改善装置及び音声明瞭度改善方法 |
JP2007019898A (ja) | 2005-07-08 | 2007-01-25 | Toshiba Corp | 携帯電話機 |
US7567898B2 (en) * | 2005-07-26 | 2009-07-28 | Broadcom Corporation | Regulation of volume of voice in conjunction with background sound |
KR100800725B1 (ko) * | 2005-09-07 | 2008-02-01 | 삼성전자주식회사 | 이동통신 단말의 오디오 재생시 주변 잡음에 적응하는 자동음량 조절 방법 및 장치 |
US8218460B2 (en) * | 2006-12-27 | 2012-07-10 | Laura Laaksonen | Network entity, method and computer program product for mixing signals during a conference session |
JP4818955B2 (ja) * | 2007-02-27 | 2011-11-16 | 三菱電機株式会社 | 雑音除去装置 |
TWI376925B (en) * | 2007-08-28 | 2012-11-11 | Micro Star Int Co Ltd | Adjusting device and method of notification sound according to the environment |
US8050419B2 (en) * | 2008-03-31 | 2011-11-01 | General Motors Llc | Adaptive initial volume settings for a vehicle audio system |
-
2009
- 2009-11-24 KR KR1020090114059A patent/KR101624652B1/ko active IP Right Grant
-
2010
- 2010-11-03 EP EP10189888A patent/EP2333771A1/en not_active Withdrawn
- 2010-11-03 EP EP13194327.6A patent/EP2704141B1/en not_active Not-in-force
- 2010-11-09 US US12/942,069 patent/US8731915B2/en active Active
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101579689B1 (ko) | 2014-07-23 | 2015-12-23 | 울산대학교 산학협력단 | 음향 방출 신호의 잡음 제거 방법 및 장치 |
WO2016053019A1 (ko) * | 2014-10-01 | 2016-04-07 | 삼성전자 주식회사 | 잡음이 포함된 오디오 신호를 처리하는 방법 및 장치 |
US10366703B2 (en) | 2014-10-01 | 2019-07-30 | Samsung Electronics Co., Ltd. | Method and apparatus for processing audio signal including shock noise |
KR101723523B1 (ko) | 2016-11-22 | 2017-04-05 | 주식회사 아이디케이 | 탄성파 신호 추출 성능이 향상된 음향방출 시험장치 |
Also Published As
Publication number | Publication date |
---|---|
US20110125489A1 (en) | 2011-05-26 |
EP2704141A3 (en) | 2014-04-16 |
KR101624652B1 (ko) | 2016-05-26 |
EP2704141B1 (en) | 2017-09-13 |
EP2704141A2 (en) | 2014-03-05 |
EP2333771A1 (en) | 2011-06-15 |
US8731915B2 (en) | 2014-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20110057596A (ko) | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치, 잡음 환경에서 음성 신호를 강화하는 방법 및 그 장치 | |
JP5183828B2 (ja) | 雑音抑圧装置 | |
JP5875609B2 (ja) | 雑音抑圧装置 | |
US8170879B2 (en) | Periodic signal enhancement system | |
EP2982101B1 (en) | Noise reduction | |
JP5071346B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
US20140064476A1 (en) | Systems and methods of echo & noise cancellation in voice communication | |
CN108696648B (zh) | 一种短时语音信号处理的方法、装置、设备及存储介质 | |
KR101737824B1 (ko) | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치 | |
US8543390B2 (en) | Multi-channel periodic signal enhancement system | |
US20170236528A1 (en) | Audio processing circuit and method for reducing noise in an audio signal | |
KR20100010136A (ko) | 잡음을 제거하는 장치 및 방법 | |
CN112309417B (zh) | 风噪抑制的音频信号处理方法、装置、系统和可读介质 | |
CN110431624B (zh) | 残余回声检测方法、残余回声检测装置、语音处理芯片及电子设备 | |
CN104427143B (zh) | 残留回声检测方法及系统 | |
CN106782586B (zh) | 一种音频信号处理方法及装置 | |
JP2005258158A (ja) | ノイズ除去装置 | |
Shajeesh et al. | Speech enhancement based on Savitzky-Golay smoothing filter | |
JP2979714B2 (ja) | 音声信号処理装置 | |
RU2206960C1 (ru) | Способ подавления шума в информационном сигнале и устройство для его осуществления | |
JP5131149B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
JP2006126841A (ja) | 周期信号増強システム | |
EP2816817B1 (en) | Sound field spatial stabilizer with spectral coherence compensation | |
WO2022202012A1 (ja) | エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム | |
JP4209348B2 (ja) | エコー抑圧方法、この方法を実施する装置、プログラムおよび記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |