KR101568937B1 - 볼테라 필터를 이용한 비선형 반향 신호 억제 장치 및 방법 - Google Patents

볼테라 필터를 이용한 비선형 반향 신호 억제 장치 및 방법 Download PDF

Info

Publication number
KR101568937B1
KR101568937B1 KR1020140081748A KR20140081748A KR101568937B1 KR 101568937 B1 KR101568937 B1 KR 101568937B1 KR 1020140081748 A KR1020140081748 A KR 1020140081748A KR 20140081748 A KR20140081748 A KR 20140081748A KR 101568937 B1 KR101568937 B1 KR 101568937B1
Authority
KR
South Korea
Prior art keywords
echo signal
signal
estimating
end speaker
speaker voice
Prior art date
Application number
KR1020140081748A
Other languages
English (en)
Inventor
장준혁
박지환
Original Assignee
한양대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한양대학교 산학협력단 filed Critical 한양대학교 산학협력단
Priority to KR1020140081748A priority Critical patent/KR101568937B1/ko
Priority to US14/788,431 priority patent/US9536539B2/en
Application granted granted Critical
Publication of KR101568937B1 publication Critical patent/KR101568937B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

볼테라 필터를 이용하여 비선형 반향 신호를 억제하는 장치 및 방법이 개시된다. 비선형 반향 신호 억제 장치는, 주파수 영역 상에서 볼테라 필터를 이용하여 비선형 반향 신호를 추정하는 반향 신호 추정부, 및 통계적 모델 기반의 이득 함수를 이용하여 비선형 반향 신호가 억제된 근단 화자 음성 신호를 생성하는 근단 화자 음성 신호 생성부를 포함할 수 있다.

Description

볼테라 필터를 이용한 비선형 반향 신호 억제 장치 및 방법{APPARATUS AND METHOD FOR SUPRESSING NON-LINEAR ECHO TALKER USING VOLTERRA FILTER}
본 발명의 실시예들은 멀티탭 최소자승법(Multi-Tap Least Square; MTLS Estimator)를 이용하여 볼테라 필터의 필터 계수를 추정하고, 데이터-드라이븐(data-driven) 알고리즘을 이용하여 사전 근단 화자 음성 존재 확률 비 (Q)를 추정하여 비선형 반향 신호를 억제하는 기술에 관한 것이다.
일반적으로, 비선형 반향 신호의 전력을 추정하기 직렬 구조, 파워 필터(power filter), 및 볼테라 필터(volterra filter)가 이용된다.
직렬 구조 방식은, raised-cosine 함수 기반의 비선형 반향 신호 추정 방식으로서, 시스템이 가지는 비선형성에 맞게 raised-cosine 함수를 변형할 수 있도록 함수 계수를 적응적으로 변화시킨다. 그리고, 변화된 함수 계수를 이용하여 최적의 비선형 반향 신호의 전력을 추정한다.
파워 필터(power filter)는 비선형 반향 신호를 파워 시리즈(power series)로 모델링하고, 선형 스피커의 출력 신호로부터 비선형 반향 신호를 잘 표현하는 파워 시리즈 계수들을 적응적으로 변화시킨다. 그리고, 변화된 파워 시리즈 계수들을 이용하여 최적의 비선형 반향 신호의 전력을 추정한다. 직렬 구조 및 파워 필터를 이용하는 경우, 볼테라 필터보다 성능이 떨어진다.
볼테라 필터는 비선형 반향 신호를 볼테라 시리즈(volterra series)로 모델링 한다. 그리고, 선형 스피커의 출력 신호로부터 비선형 반향 신호를 잘 표현한 볼테라 시리즈 계수들을 적응적으로 찾아, 최적의 비선형 반향 신호의 전력을 추정한다.
그러나, 볼테라 필터의 경우, 정규화된 최소자승법(Normalized Least Mean square: NLMS)과 같이 적응형 알고리즘을 이용하여 볼테라 필터 계수를 갱신함에 따라, 갑작스러운 환경의 변화와 비선형성의 변화에 빠르게 적응하기 어렵다. 예를 들어, 볼테라 필터의 경우, 고정된 상수를 사용함에 따라, 스피커에서 음성 신호가 출력되어 마이크로 입력될 때까지 스피커 및 마이크 주변 환경의 변화에 적응하기 어렵다.
따라서, 갑작스러운 환경의 변화 및 비선형성의 변화에 빠르게 대응할 수 있는 기술이 필요하다.
본 발명은 갑작스러운 환경의 변화 및 비선형성의 변화에 빠르게 적응할 수 있도록 멀티-탭 최소 자승법(MTLS Estimator)를 이용하여 볼테라 필터의 계수를 추정하고, 데이터-드라이븐 알고리즘에 기초하여 추정된 근단 화자 음성 부재 확률(NSAP)를 이용하여 비선형 반향 신호가 억제된 근단 화자 음성 신호를 출력하기 위한 것이다.
본 발명의 일실시예에 따른 비선형 반향 신호 억제 장치는, 주파수 영역 상에서 볼테라 필터를 이용하여 비선형 반향 신호를 추정하는 반향 신호 추정부, 및 통계적 모델 기반의 이득 함수를 이용하여 상기 비선형 반향 신호가 억제된 근단 화자 음성 신호를 생성하는 근단 화자 음성 신호 생성부를 포함할 수 있다.
일측면에 따르면, 상기 반향 신호 추정부는, 멀티-탭 최소 자승법(Multi-Tap Least Square: MTLS Estimator)을 이용하여 볼테라 필터의 필터 계수를 추정하고, 추정된 볼테라 필터의 필터 계수를 이용하여 상기 비선형 반향 신호를 추정할 수 있다.
다른 측면에 따르면, 상기 근단 화자 음성 신호 생성부는, 데이터-드라이븐(data-driven) 알고리즘에 기초하여 가변적인 사전 근단 화자 음성 존재 확률 비 (Q)를 추정하고, 추정된 사전 근단 화자 음성 존재 확률 비 와 상기 이득 함수에 기초하여 상기 근단 화자 음성 신호를 생성할 수 있다.
또 다른 측면에 따르면, 상기 사전 근단 화자 음성 존재 확률 비 (Q)는, 근단 화자 음성 신호의 변화에 따라 가변되며, 복소 라플라시안 확률 분포에 기초한 근단 화자 음성 부재 확률(Near-end Speech Absence Probability: NSAP)에 적용될 수 있다.
또 다른 측면에 따르면, 상기 근단 화자 음성 신호 생성부는, 복소 라플라시안 모델에 기초하여 근단 화자 음성 부재 확률(Near-end Speech Absence Probability: NSAP)를 계산하고, 상기 근단 화자 음성 부재 확률과 상기 이득 함수에 기초하여 상기 비선형 반향 신호를 억제할 수 있다.
본 발명의 일실시예에 따른 비선형 반향 신호 억제 방법은, 주파수 영역 상에서 볼테라 필터를 이용하여 비선형 반향 신호를 추정하는 단계, 및 통계적 모델 기반의 이득 함수를 이용하여 상기 비선형 반향 신호가 억제된 근단 화자 음성 신호를 생성하는 단계를 포함할 수 있다.
일측면에 따르면, 상기 비선형 반향 신호를 추정하는 단계는, 멀티-탭 최소 자승법(Multi-Tap Least Square: MTLS Estimator)을 이용하여 볼테라 필터의 필터 계수를 추정하고, 추정된 볼테라 필터의 필터 계수를 이용하여 상기 비선형 반향 신호를 추정할 수 있다.
다른 측면에 따르면, 상기 근단 화자 음성 신호를 생성하는 단계는, 데이터-드라이븐(data-driven) 알고리즘에 기초하여 가변적인 사전 근단 화자 음성 존재 확률 비 (Q)를 추정하고, 추정된 사전 근단 화자 음성 존재 확률 비 와 상기 이득 함수에 기초하여 상기 근단 화자 음성 신호를 생성할 수 있다.
또 다른 측면에 따르면, 상기 사전 근단 화자 음성 존재 확률 비 (Q)는, 근단 화자 음성 신호의 변화에 따라 가변되며, 복소 라플라시안 확률 분포에 기초한 근단 화자 음성 부재 확률(Near-end Speech Absence Probability: NSAP)에 적용될 수 있다.
또 다른 측면에 따르면, 상기 근단 화자 음성 신호를 생성하는 단계는, 복소 라플라시안 모델에 기초하여 근단 화자 음성 부재 확률(Near-end Speech Absence Probability: NSAP)를 계산하고, 상기 근단 화자 음성 부재 확률을 상기 이득 함수에 기초하여 상기 비선형 반향 신호를 억제할 수 있다.
본 발명에 의하면, 멀티-탭 최소 자승법(MTLS Estimator)를 이용하여 볼테라 필터의 계수를 추정하고, 데이터-드라이븐 알고리즘에 기초하여 추정된 근단 화자 음성 부재 확률(NSAP)를 이용하여 비선형 반향 신호가 억제된 근단 화자 음성 신호를 출력함에 따라, 갑작스러운 환경의 변화 및 비선형성의 변화에 빠르게 적응할 수 있다.
도 1은 본 발명의 일실시예에 따른 비선형 반향 신호 억제 시스템의 개략적인 구성을 도시한 블록도이다.
도 2는 본 발명의 일실시예에 따른 비선형 반향 신호 억제 장치의 세부 구성을 도시한 블록도이다.
도 3은 본 발명의 일실시예에 따른 비선형 반향 신호 억제 방법을 설명하기 위해 제공되는 흐름도이다.
도 4는 본 발명의 일실시예에 있어서, 데이터-드라이븐 기법에 기초한 근단 화자 음성 존재 확률(NSPP)를 나타내는 그래프이다.
도 5는 본 발명의 일실시예에 있어서, 시간에 따른 ERLE 변화를 나타낸 그래프이다.
도 6은 본 발명의 일실시예에 있어서, 하드 클리핑(hard clipping) 환경에서의 ERLE 및 SA 성능을 도시한 그래프이다.
도 7은 본 발명의 일실시예에 있어서, 소프트 클리핑(soft clipping) 환경에서의 ERLE 및 SA 성능을 도시한 그래프이다.
도 8은 본 발명의 일실시예에 있어서, MOS 테스트 결과를 도시한 도면이다.
이하, 본 발명에 따른 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일실시예에 따른 비선형 반향 신호 억제 시스템의 개략적인 구성을 도시한 블록도이다.
도 1에서, Y(i,k)는 마이크 입력 신호 y(t)를 STFT(Short Time Fourier Transform) 변환한 신호, D(i,k)는 비선형 반향 신호 d(t)를 STFT 변환한 신호, S(i,k)는 깨끗한 근단 화자 음성 신호 s(t)를 STFT 변환한 신호이고, i는 프레임 인덱스, k는 주파수 인덱스를 나타낼 수 있다. 그러면, 마이크 입력 신호, 근단 화자 음성 신호, 및 비선형 반향 신호 간의 관계는 아래의 수학식 1과 같이 표현될 수 있다. 이때, STFT 이외에 FFT(Fast Fourier Transform), DFT(Discrete Fourier Transform)이 이용될 수 도 있다.
Figure 112014061974477-pat00001
수학식 1에서, 그리고, h0는 마이크를 통해 말을 하고 있지 않는 경우에 비선형 반향 신호 d(t)만이 마이크로 입력되는 신호 s(t)임을 나타내고, h1은 마이크를 통해 말을 하는 경우에 비선형 반향 신호 d(t)와 근단 화자 음성 신호 s(t)가 더해져 마이크로 입력되는 신호 s(t)를 나타낼 수 있다.
이처럼, 비선형 반향 신호가 마이크로 입력됨에 따라 근단 화자 음성 신호를 인지하는 데 방해 신호로 작용할 수 있다. 이에 따라, 이하에서는 도면을 참조하여 비선형 반향 신호를 추정하고, 추정된 비선형 반향 신호를 억제하여 근단 화자 음성 신호를 출력하는 동작에 대해 상세히 설명하기로 한다.
도 2는 본 발명의 일실시예에 따른 비선형 반향 신호 억제 장치의 세부 구성을 도시한 블록도이다.
도 2에 따르면, 비선형 반향 신호 억제 장치(200)는, 반향 신호 추정부(201) 및 근단 화자 음성 신호 생성부(202)를 포함할 수 있다.
반향 신호 추정부(201)는 주파수 영역 상에서 볼테라 필터(volterra filter) 를 이용하여 비선형 반향 신호를 추정할 수 있다. 예를 들어, 반향 신호 추정부(201)는 입력 신호 x(n)를 DFT(Discrete Fourier Transform) 변환하고, DFT 변환된 신호 X(i,k)의 주파수 영역 상에서 볼테라 필터를 이용하여 비선형 반향 신호를 추정할 수 있다.
이때, 반향 신호 추정부(201)는 멀티탭- 최소 자승법(Multi-Tap Least Square: MTLS)을 이용하여 볼테라 필터의 필터 계수를 추정하고, 추정된 볼테라 필터의 필터 계수에 기초하여 비선형 반향 신호를 추정할 수 있다. 예를 들어, 반향 신호 추정부(201)는 아래의 수학식 2 내지 수학식 7에 기초하여 볼테라 필터의 필터 계수를 추정 및 비선형 반향 신호를 추정할 수 있다.
Figure 112014061974477-pat00002
수학식 2에서,
Figure 112014061974477-pat00003
는 2차 볼테라 필터의 구성 성분 중 하나인 선형 필터(linear filter)의 추정치이고,
Figure 112014061974477-pat00004
는 2차 볼테라 필터의 구성 성분 중 다른 하나인 쿼드라틱 필터(quadratic filter)의 추정치를 나타낼 수 있다. 그리고, K는 주파수 인덱스의 최고값을 나타낼 수 있다. 그리고, 는 비선형 반향 신호의 추정치이고,
Figure 112014061974477-pat00006
는 Far-end 단에서 DFT(Discrete Fourier Transform) 변환된 신호를 나타낼 수 있다.
이때, 반향 신호 추정부(201)는 쿼드라틱 필터의 인덱스인 p와 q를 아래의 수학식 3에 기초하여 결정할 수 있다. 다시 말해, 반향 신호 추정부(201)는 아래의 수학식 3을 만족하는 p와 q를 결정할 수 있다.
Figure 112014061974477-pat00007
수학식 2 및 3에서 설명한 바와 같이, 반향 신호 추정부(201)는 멀티탭 최소 자승법(MTLS)를 사용하여 주파수 영역 상의 볼테라 필터 계수를 추정할 수 있다.
이처럼, 반향 신호 추정부(201)는 하나의 볼테라 필터 계수를 추정하기 위해 여러 개의 탭(multi-tap)을 사용함에 따라 필터 계수의 추정 정확도를 향상시킬 수 있다. 또한, 싱글탭을 이용할 때 보다 멀티탭을 이용하여 추정된 필터 계수는 더 작은 변통치(variation)을 가질 수 있다. 이에 따라, 보다 정확한 ATF(Acoustic Transfer Function) 추정을 가능하게 할 수 있다.
수학식 2 및 3에서는 2차 볼테라 필터를 이용하여 반향 신호 추정치를 계산함에 따라 비선형 반향 신호를 추정하였으나, 이는 실시예에 해당되며, 반향 신호 추정부(201)는 계산의 복잡도를 고려하여 2차 볼테라 필터 이외에 3차, 4차,...,n차 볼테라 필터를 이용할 수도 있다. 예를 들어, 2차 볼테라 필터 계수를 추정하기 위해 표현된 수학식 2는 ρ 차수를 갖는 볼테라 필터 계수를 추정하기 위해 아래의 수학식 4로 다시 표현될 수 있다.
Figure 112014061974477-pat00008
수학식 4에서, k와 τ는 0과 K-1 사이의 주파수 인덱스, n은 0과 ρ-1 사이의 값을 갖는 필터 차수 인덱스,
Figure 112014061974477-pat00009
은 n차 볼테라 필터의 선형 필터(linear filter)의 추정치,
Figure 112014061974477-pat00010
은 n차 볼테라 필터의 쿼드라틱 필터(quadratic filter)의 추정치를 나타낼 수 있다. 그리고,
Figure 112014061974477-pat00011
Figure 112014061974477-pat00012
는 쿼드라틱 필터의 인덱스로서, 반향 신호 추정부(201)는
Figure 112014061974477-pat00013
를 만족하는 수를
Figure 112014061974477-pat00014
Figure 112014061974477-pat00015
로 결정할 수 있다.
이때, 수학식 4의 비선형 반향 신호
Figure 112014061974477-pat00016
는 아래의 수학식 5와 같이 벡터-매트릭스 형태로 표현될 수 있다.
Figure 112014061974477-pat00017
수학식 5에서,
Figure 112014061974477-pat00018
,
Figure 112014061974477-pat00019
,
Figure 112014061974477-pat00020
,
Figure 112014061974477-pat00021
는 아래의 수학식 6과 같이 표현될 수 있다.
Figure 112014061974477-pat00022
수학식 5에서, 비선형 반향 신호는 볼테라 필터 계수와 입력 신호만을 이용하여 아래의 수학식 7과 같이 간단하게 표현될 수 있다.
Figure 112014061974477-pat00023
수학식 7에서, 볼테라 필터의 추정치
Figure 112014061974477-pat00024
Figure 112014061974477-pat00025
이고, 볼테라 필터로 입력되는 신호
Figure 112014061974477-pat00026
Figure 112014061974477-pat00027
일 수 있다. 여기서, 볼테라 필터의 추정치
Figure 112014061974477-pat00028
는 멀티탭 최소자승법(MTLS)에 기초하여 갱신되며,
Figure 112014061974477-pat00029
로 나타낼 수 있다. 이때,
Figure 112014061974477-pat00030
이고,
Figure 112014061974477-pat00031
는 슈두-인버스(pseudo-inverse)를 나타낼 수 있다.
수학식 7에서 설명하고 있는 바와 같이, 반향 신호 추정부(201)는 멀티탭 최소자승법(MTLS)에 기초하여 볼테라 필터의 필터 계수
Figure 112014061974477-pat00032
를 추정하고, 추정된 볼테라 필터의 필터 계수와 입력 신호
Figure 112014061974477-pat00033
를 이용하여 비선형 반향 신호
Figure 112014061974477-pat00034
를 추정할 수 있다.
그러면, 반향 신호 추정부(201)는 비선형 반향 신호의 크기
Figure 112014061974477-pat00035
와 롱텀 스무딩(long-term smoothing) 기법을 이용하여 비선형 반향 신호의 전력 스펙트럼(spectrum)
Figure 112014061974477-pat00036
을 계산할 수 있다.
예를 들어, 반향 신호 추정부(201)는 근단 화자 음성 신호가 존재하는 않는 구간에서의 상기 전력 스펙트럼을 아래의 수학식 8에 기초하여 계산할 수 있다.
Figure 112014061974477-pat00037
수학식 8에서,
Figure 112014061974477-pat00038
의 예로는 0.92를 들 수 있다.
이때, 동시통화(double-talk)와 같은 근단 화자 음성 신호의 존재는 볼테라 필터 계수 갱신 시 볼테라 필터의 필터 계수
Figure 112014061974477-pat00039
를 발산하게 할 수 있다. 이에 따라, 근단 화자 음성 신호 생성부(202)는 주파수 영역 상에서 동시통화 검출(double-talker detection: DTD) 알고리즘을 이용하여 근단 화자 음성 신호를 생성할 수 있다.
일례로, 반향 신호 추정부(201)에서 비선형 반향 신호의 전력 스펙트럼
Figure 112014061974477-pat00040
이 계산된 경우, 근단 화자 음성 신호 생성부(202)는 상기 계산된 전력 스펙트럼
Figure 112014061974477-pat00041
과 통계적 모델 기반의 이득함수를 이용하여 비선형 반향 신호가 억제된 근단 화자 음성 신호를 생성할 수 있다.
먼저, 근단 화자 음성 신호 생성부(202)는 상기 계산된 전력 스펙트럼
Figure 112014061974477-pat00042
에 기초하여 복소 라플라시안 확률 분포 기반의 근단 화자 음성 부재 확률(Near-end Speech Absence Probability: NSAP)을 계산할 수 있다.
예를 들어, 근단 화자 음성 신호 생성부(202)는 아래의 수학식 9 및 10에 기초하여 확률밀도함수(PDF)를 계산하고, 계산된 확률밀도함수(PDF)와 베이즈 룰(Bayes? rule)을 이용하여 근단 화자 음성 부재 확률(NSAP)을 계산할 수 있다.
Figure 112014061974477-pat00043
Figure 112014061974477-pat00044
수학식 9 및 10은 수학식 1에 복소 라플라시안 확률 분포를 적용한 것으로,
Figure 112014061974477-pat00045
는 말을 하고 있지 않을 때를 나타내는 h0의 PDF(Probability Density Function),
Figure 112014061974477-pat00046
는 말을 하고 있을 때를 나타내는 h1의 PDF를 나타낼 수 있다.
수학식 9 및 10에서,
Figure 112014061974477-pat00047
는 근단 화자 음성 신호의 분산,
Figure 112014061974477-pat00048
Figure 112014061974477-pat00049
의 실수값,
Figure 112014061974477-pat00050
Figure 112014061974477-pat00051
의 허수값을 나타낼 수 있다. 라플라시안 분포는 가우시안 분포보다 주파수 영역에서 잡음이 섞인 음성 신호를 보다 잘 모델링할 수 있다.
이에 따라, 근단 화자 음성 신호 생성부(202)는 위의 수학식 9 및 10에 기초하여 계산된 h0의 PDF 및 h1의 PDF와 베이즈 룰(Bayes? rule)을 이용하여 근단 화자 음성 부재 확률(NSAP)을 계산할 수 있다. 예를 들어, 근단 화자 음성 신호 생성부(202)는 아래의 수학식 11 내지 13에 기초하여 PDF에 베이즈 룰(Bayes? rule)을 적용함에 따라 근단 화자 음성 부재 확률(NSAP)을 계산할 수 있다.
이때, 근단 화자 음성 신호 생성부(202)는 근단 화자 음성 부재 확률(NSAP)을 계산하기 위해 먼저 사전 근단 화자 음성 존재 확률비 Q를 추정할 수 있다. 일례로, 근단 화자 음성 신호 생성부(202)는 데이터-드라이븐(data-driven) 알고리즘을 이용하여 사전 근단 화자 음성 존재 확률비 Q를 적응적으로 추정할 수 있다. 여기서, 데이터-드라이븐 알고리즘은, 방대한 반향 신호와 음성 신호를 이용하여
Figure 112014061974477-pat00052
Figure 112014061974477-pat00053
에 따라 최적의 Q를 미리 결정하여 테이블(table)로 미리 저장하고 있다가, 반향 신호 억제 장치 내부에서 변하는
Figure 112014061974477-pat00054
에 따라 가변적인 Q를 제공하는 알고리즘일 수 있다.
Figure 112014061974477-pat00055
수학식 11에서,
Figure 112014061974477-pat00056
는 근단 화자 음성 부재 확률(NSAP), Q는 사전 근단 화자 음성 존재 확률비를 나타내며,
Figure 112014061974477-pat00057
로 표현될 수 있다. 이때, Q는
Figure 112014061974477-pat00058
Figure 112014061974477-pat00059
에 따라 가변적인 값을 가질 수 있으며,
Figure 112014061974477-pat00060
는 아래의 수학식 12,
Figure 112014061974477-pat00061
Figure 112014061974477-pat00062
는 아래의 수학식 13과 같이 표현될 수 있다.
Figure 112014061974477-pat00063
Figure 112014061974477-pat00064
그리고, 근단 화자 음성 신호 생성부(202)는 DD(Decision Directed) 기법과 비선형 반향 신호의 전력을 이용하여
Figure 112014061974477-pat00065
Figure 112014061974477-pat00066
를 계산할 수 있다. 예를 들어, 근단 화자 음성 신호 생성부(202)는 아래의 수학식 14에 기초하여
Figure 112014061974477-pat00067
를 계산할 수 있다.
Figure 112014061974477-pat00068
수학식 14에서, 근단 화자 음성 신호 생성부(202)는
Figure 112014061974477-pat00069
가 0.3인 DD 기법을 이용하여
Figure 112014061974477-pat00070
를 계산할 수 있다. 그러면, 근단 화자 음성 신호 생성부(202)는, 데이터-드라이븐 기법에 기초하여 기저장된 테이블에서 상기 계산된
Figure 112014061974477-pat00071
에 해당하는 사전 근단 화자 음성 존재 확률비 Q를 획득할 수 있다. 그리고, 근단 화자 음성 신호 생성부(202)는, 획득된 사전 근단 화자 음성 존재 확률비 Q를 이용하여 근단 화자 음성 부재 확률(NSAP)를 계산할 수 있다. 예를 들어,
Figure 112014061974477-pat00072
Figure 112014061974477-pat00073
는 20 dB 간격으로 나누어지고, 각 그리드(grid)마다 최적의 Q(i,k)가 매칭되어 테이블에 기저장될 수 있다. 이때, 각 그리드의 Q(i,k)는
Figure 112014061974477-pat00074
을 최소화하는 값일 수 있다.
근단 화자 음성 신호 생성부(202)는, 상기 근단 화자 음성 부재 확률(NSAP)과 통계적 모델 기반의 이득 함수에 기초하여 비선형 반향 신호가 억제된 근단 화자 음성 신호를 생성할 수 있다. 예를 들어, 근단 화자 음성 신호 생성부(202)는 아래의 수학식 15에 기초하여 비선형 반향 신호가 억제된 근단 화자 음성 신호를 생성하여 출력할 수 있다.
Figure 112014061974477-pat00075
수학식 15에 따르면, 근단 화자 음성 신호 생성부(202)는 MMSE(Minimum Mean Square Error)를 이용하여 통계적 모델 기반의 이득 함수 GMMSE를 계산할 수 있다.
그리고, 근단 화자 음성 신호 생성부(202)는 근단 화자 음성 부재 확률(NSAP)을 이용하여 근단 화자 음성 신호 존재 확률
Figure 112014061974477-pat00076
을 계산할 수 있다. 이어, 근단 화자 음성 신호 생성부(202)는 근단 화자 음성 신호 존재 확률
Figure 112014061974477-pat00077
에 통계적 모델 기반의 이득 함수 GMMSE를 곱함에 따라 비선형 반향 신호가 억제된 근단 화자 음성 신호
Figure 112014061974477-pat00078
를 생성할 수 있다.
도 3은 본 발명의 일실시예에 따른 비선형 반향 신호 억제 방법을 설명하기 위해 제공되는 흐름도이다.
도 3에서, 비선형 반향 신호 억제 방법은 도 2의 비선형 반향 신호 억제 장치에 의해 수행될 수 있다.
도 3을 참고하면, 301 단계에서, 반향 신호 추정부(201)는 주파수 영역 상에서 볼테라 필터를 이용하여 비선형 반향 신호를 추정할 수 있다.
이때, 반향 신호 추정부(201)는 멀티탭 최소자승법(MTLS)을 이용하여 볼테라 필터의 필터 계수
Figure 112014061974477-pat00079
를 추정할 수 있다. 그리고, 반향 신호 추정부(201)는 추정된 볼테라 필터의 필터 계수
Figure 112014061974477-pat00080
와 입력 신호
Figure 112014061974477-pat00081
를 이용하여 비선형 반향 신호
Figure 112014061974477-pat00082
를 추정할 수 있다. 예를 들어, 반향 신호 추정부(201)는 위의 수학식 2 내지 7에 기초하여 2차 볼테라 필터를 이용하여 비선형 반향 신호를 추정할 수 있다.
그러면, 반향 신호 추정부(201)는 비선형 반향 신호의 크기
Figure 112014061974477-pat00083
와 롱텀 스무딩(long-term smoothing) 기법을 이용하여 비선형 반향 신호의 전력 스펙트럼(spectrum)
Figure 112014061974477-pat00084
을 계산할 수 있다.
이어, 302 단계에서, 근단 화자 음성 신호 생성부(202)는 데이터-드라이븐 알고리즘을 이용하여 사전 근단 화자 음성 존재 확률비 Q를 적응적으로 추정할 수 있다. 여기서,
Figure 112014061974477-pat00085
Figure 112014061974477-pat00086
에 따라 가변적인 최적의 Q는 데이터-드라이븐 알고리즘에 기초하여 테이블(table)에 기저장될 수 있다.
그러면, 근단 화자 음성 신호 생성부(202)는
Figure 112014061974477-pat00087
가 0.3인 DD 기법 및 비선형 반향 신호의 전력에 기초하여
Figure 112014061974477-pat00088
Figure 112014061974477-pat00089
를 계산할 수 있다. 예를 들어, 근단 화자 음성 신호 생성부(202)는 위의 수학식 14에 기초하여
Figure 112014061974477-pat00090
를 계산할 수 있다. 그리고, 근단 화자 음성 신호 생성부(202)는 테이블에서
Figure 112014061974477-pat00091
Figure 112014061974477-pat00092
에 해당하는 Q를 획득할 수 있다.
이어, 303 단계에서, 근단 화자 음성 신호 생성부(202)는 사전 근단 화자 음성 존재 확률비 Q를 이용하여 근단 화자 음성 부재 확률(NSAP)를 계산할 수 있다.
그리고, 304 단계에서, 근단 화자 음성 신호 생성부(202)는 근단 화자 음성 부재 확률(NSAP)에 기초하여 근단 화자 음성 존재 확률(NSPP)를 계산할 수 있다.
예를 들어, 근단 화자 음성 신호 생성부(202)는 1에서 근단 화자 음성 부재 확률(NSAP)을 감산함에 따라 근단 화자 음성 존재 확률(NSPP)를 계산할 수 있다.
이어, 305 단계에서, 근단 화자 음성 신호 생성부(202)는 근단 화자 음성 존재 확률(NSPP)과 통계적 모델 기반의 이득 함수에 기초하여 비선형 반향 신호를 억제할 수 있다. 다시 말해, 비선형 반향 신호를 억제 또는 제거하여 근단 화자 음성 신호를 생성할 수 있다.
예를 들어, 근단 화자 음성 신호 생성부(202)는 MMSE(Minimum Mean Square Error)를 이용하여 통계적 모델 기반의 이득 함수 GMMSE를 계산할 수 있다. 그리고, 근단 화자 음성 신호 생성부(202)는 근단 화자 음성 신호 존재 확률
Figure 112014061974477-pat00093
에 통계적 모델 기반의 이득 함수 GMMSE를 곱함에 따라 비선형 반향 신호를 억제 또는 제거할 수 있다. 그러면, 비선형 반향 신호가 억제 또는 제거된 근단 화자 음성 신호
Figure 112014061974477-pat00094
가 생성될 수 있다.
이하에서는 도 4 내지 도 6을 참조하여 본 발명의 일실시예에 따른 비선형 반향 신호 억제 장치 및 방법의 성능을 나타내는 실험 결과에 대해 설명하고자 한다.
먼저, 이러한 실험을 위해, 각각의 마이크 입력 신호는 클리핑(clipping), 라우드 스피커 다이나믹(loudspeaker dynamics), 공간 임펄스 응답(room impulse response)을 고려하여 생성될 수 있다. 이때, 클리핑을 발생시키기 위해 아래의 수학식 16 및 19가 이용될 수 있다.
Figure 112014061974477-pat00095
Figure 112014061974477-pat00096
수학식 16 및 17에서 xmax는 입력 신호의 최고 볼륨을 나타낼 수 있다. 이때, 라우드 스피커의 왜곡(distortion)은 아래의 수학식 18에 기초하여 생성될 수 있다.
Figure 112014061974477-pat00097
수학식 18에서,
Figure 112014061974477-pat00098
는 2로 기설정될 수 있다.
그리고, 이미지 방법(image method) 알고리즘으로부터 생성된 공간 임펄스 응답(room impulse response)을 적용하고,
Figure 112014061974477-pat00099
의 체적을 가지는 사각형 모양의 사무실 환경을 가정하여 근단 화자 음성 존재 확률을 획득하기 위한 실험을 진행하였다. 그리고, 반향신호조건을 시뮬레이션하기 위해, 스피커로 출력된 반향 신호가 마이크로 입력되기까지 거리를 고려하여 3.5dB의 감쇄를 주어 합성하였다. ERLE(echo return loss enhancement)와 SA(speech attenuation)를 객관적 평가지표로 사용하였다.
그리고, 성능 비교를 위해서 기존의 soft decision 기반의 반향 신호 억제기, raised-cosine function을 이용한 비선형 반향 신호 제거기, 주파수 영역 상의 볼테라 필터를 NLMS로 갱신하는 반향 신호 제거기를 본 발명에 따른 비선형 반향 신호 억제 장치 및 방법과 비교하였다. 특히, 본 발명에 따른 비선형 반향 신호 억제 장치 및 방법에서는 K=123로 정의하고, raised-cosine 알고리즘에 대해 128-tap filter, step-size 0.3을 설정하였다. 또한 주파수 영역 상의 볼테라 필터 기반의 반향 신호 제거기에 대해 0.3를 정의하였다.
도 4는 본 발명의 일실시예에 있어서, 데이터-드라이븐 기법에 기초한 근단 화자 음성 존재 확률(NSPP)를 나타내는 그래프이다.
도 4에서, 알고리즘 테스트를 위해 315개의 음성 데이터가 이용되고, 데이터-드라이븐 테이블을 훈련(training)하기 위해 105개의 음성 파일이 이용되었다.
도 4에 따르면, 다양한 차수 ρ에 따른 근단 화자 음성 존재 확률(Near-end Speech Presence Probability: NSPP)은 ρ가 2일 때 ρ가 1 또는 3일 때 보다 뛰어난 성능을 보이는 것을 확인할 수 있다.
도 5는 본 발명의 일실시예에 있어서, 시간에 따른 ERLE 변화를 나타낸 그래프이다.
도 5에 따르면, 멀티탭 최소자승법(MTLS)를 이용하여 볼테라 필터의 필터 계수를 추정하고, 추정된 볼테라 필터 및 통계적 모델 기반의 이득 함수를 이용하여 근단 화자 음성 신호를 생성하는 경우에 ERLE 값이 가장 높은 것을 확인할 수 있다. 다시 말해, 본 발명의 일실시예에 따른 비선형 반향 신호 억제 장치의 ERLE 값(501)이 가장 높은 것을 확인할 수 있다. 이는 근단 화자 음성 신호가 존재하지 않는 구간에서 반향 신호가 잘 억제된 것임을 나타낼 수 있다.
도 6은 본 발명의 일실시예에 있어서, 하드 클리핑(hard clipping) 환경에서의 ERLE 및 SA 성능을 도시한 그래프이고, 도 7은 본 발명의 일실시예에 있어서, 소프트 클리핑(soft clipping) 환경에서의 ERLE 및 SA 성능을 도시한 그래프이다.
도 6 및 도 7에 따르면, 본 발명에 따라 MTLS를 이용한 경우의 ERLEsms 기존의 알고리즘보다 더 높고 SA는 더 낮음을 확인할 수 있다.
여기서, 더 높은 ERLE 점수는 근단 화자 음성이 존재하지 않는 구간에서 반향 신호를 잘 억제하는 것을 의미하며, 더 낮은 SA 점수는 근단 화자 음성이 존재하는 구간에서 음성 왜곡이 덜 발생했음을 의미할 수 있다. 이에 따라, 본 발명의 일실시예에 따른 비선형 반향 신호 억제 장치 및 방법은, 음성 품질이 더 잘 보존할 수 있을 뿐만 아니라, 비선형 반향 신호를 기존의 알고리즘들보다 더욱 잘 제거함을 확인할 수 있다.
도 8은 본 발명의 일실시예에 있어서, MOS 테스트 결과를 도시한 도면이다.
도 8에서, MOS(Mean Opinion Score) 테스트를 통해 본 발명의 일실시예에 따른 비선형 반향 신호 억제 장치 및 방법의 주관적인 음질 평가를 수행하였으며, 도 8은 MOS 테스트 결과를 도시하고 있다.
도 8에 따르면, 하드 클리핑 및 소프트 클리핑 모두에서 본 발명에 따른 비선형 반향 신호 억제 장치의 성능이 기존의 알고리즘들보다 우수함을 확인할 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다.  예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (10)

  1. 주파수 영역 상에서 볼테라 필터를 이용하여 비선형 반향 신호를 추정하는 반향 신호 추정부; 및
    통계적 모델 기반의 이득 함수를 이용하여 상기 비선형 반향 신호가 억제된 근단 화자 음성 신호를 생성하는 근단 화자 음성 신호 생성부
    를 포함하고,
    상기 근단 화자 음성 신호 생성부는,
    데이터-드라이븐(data-driven) 알고리즘에 기초하여 가변적인 사전 근단 화자 음성 존재 확률 비(Q)를 추정하고, 추정된 사전 근단 화자 음성 존재 확률 비와 상기 이득 함수에 기초하여 상기 근단 화자 음성 신호를 생성하는 것을 특징으로 하는 비선형 반향 신호 억제 장치.
  2. 제1항에 있어서,
    상기 반향 신호 추정부는,
    멀티-탭 최소 자승법(Multi-Tap Least Square: MTLS Estimator)을 이용하여 볼테라 필터의 필터 계수를 추정하고, 추정된 볼테라 필터의 필터 계수를 이용하여 상기 비선형 반향 신호를 추정하는 것을 특징으로 하는 비선형 반향 신호 억제 장치.
  3. 삭제
  4. 제1항에 있어서,
    상기 사전 근단 화자 음성 존재 확률 비(Q)는,
    근단 화자 음성 신호의 변화에 따라 가변되며, 복소 라플라시안 확률 분포에 기초한 근단 화자 음성 부재 확률(Near-end Speech Absence Probability: NSAP)에 적용되는 것을 특징으로 하는 비선형 반향 신호 억제 장치.
  5. 주파수 영역 상에서 볼테라 필터를 이용하여 비선형 반향 신호를 추정하는 반향 신호 추정부; 및
    통계적 모델 기반의 이득 함수를 이용하여 상기 비선형 반향 신호가 억제된 근단 화자 음성 신호를 생성하는 근단 화자 음성 신호 생성부
    를 포함하고,
    상기 근단 화자 음성 신호 생성부는,
    복소 라플라시안 모델에 기초하여 근단 화자 음성 부재 확률(Near-end Speech Absence Probability: NSAP)를 계산하고, 상기 근단 화자 음성 부재 확률과 상기 이득 함수에 기초하여 상기 비선형 반향 신호를 억제하는 것을 특징으로 하는 비선형 반향 신호 억제 장치.
  6. 주파수 영역 상에서 볼테라 필터를 이용하여 비선형 반향 신호를 추정하는 단계; 및
    통계적 모델 기반의 이득 함수를 이용하여 상기 비선형 반향 신호가 억제된 근단 화자 음성 신호를 생성하는 단계
    를 포함하고,
    상기 근단 화자 음성 신호를 생성하는 단계는,
    데이터-드라이븐(data-driven) 알고리즘에 기초하여 가변적인 사전 근단 화자 음성 존재 확률 비(Q)를 추정하고, 추정된 사전 근단 화자 음성 존재 확률 비 와 상기 이득 함수에 기초하여 상기 근단 화자 음성 신호를 생성하는 것을 특징으로 하는 비선형 반향 신호 억제 방법.
  7. 제6항에 있어서,
    상기 비선형 반향 신호를 추정하는 단계는,
    멀티-탭 최소 자승법(Multi-Tap Least Square: MTLS Estimator)을 이용하여 볼테라 필터의 필터 계수를 추정하고, 추정된 볼테라 필터의 필터 계수를 이용하여 상기 비선형 반향 신호를 추정하는 것을 특징으로 하는 비선형 반향 신호 억제 방법.
  8. 삭제
  9. 제6항에 있어서,
    상기 사전 근단 화자 음성 존재 확률 비 (Q)는,
    근단 화자 음성 신호의 변화에 따라 가변되며, 복소 라플라시안 확률 분포에 기초한 근단 화자 음성 부재 확률(Near-end Speech Absence Probability: NSAP)에 적용되는 것을 특징으로 하는 비선형 반향 신호 억제 방법.
  10. 주파수 영역 상에서 볼테라 필터를 이용하여 비선형 반향 신호를 추정하는 단계; 및
    통계적 모델 기반의 이득 함수를 이용하여 상기 비선형 반향 신호가 억제된 근단 화자 음성 신호를 생성하는 단계
    를 포함하고,
    상기 근단 화자 음성 신호를 생성하는 단계는,
    복소 라플라시안 모델에 기초하여 근단 화자 음성 부재 확률(Near-end Speech Absence Probability: NSAP)를 계산하고, 상기 근단 화자 음성 부재 확률을 상기 이득 함수에 기초하여 상기 비선형 반향 신호를 억제하는 것을 특징으로 하는 비선형 반향 신호 억제 방법.
KR1020140081748A 2014-07-01 2014-07-01 볼테라 필터를 이용한 비선형 반향 신호 억제 장치 및 방법 KR101568937B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020140081748A KR101568937B1 (ko) 2014-07-01 2014-07-01 볼테라 필터를 이용한 비선형 반향 신호 억제 장치 및 방법
US14/788,431 US9536539B2 (en) 2014-07-01 2015-06-30 Nonlinear acoustic echo signal suppression system and method using volterra filter

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140081748A KR101568937B1 (ko) 2014-07-01 2014-07-01 볼테라 필터를 이용한 비선형 반향 신호 억제 장치 및 방법

Publications (1)

Publication Number Publication Date
KR101568937B1 true KR101568937B1 (ko) 2015-11-13

Family

ID=54610286

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140081748A KR101568937B1 (ko) 2014-07-01 2014-07-01 볼테라 필터를 이용한 비선형 반향 신호 억제 장치 및 방법

Country Status (2)

Country Link
US (1) US9536539B2 (ko)
KR (1) KR101568937B1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107452398B (zh) * 2017-08-09 2021-03-16 深圳创维数字技术有限公司 回声获取方法、电子设备及计算机可读存储介质
CN109346096B (zh) * 2018-10-18 2021-07-06 深圳供电局有限公司 一种用于语音识别过程的回声消除方法及装置
CN109559756B (zh) * 2018-10-26 2021-05-14 北京佳讯飞鸿电气股份有限公司 滤波系数确定方法、回声消除方法、相应装置及设备
US10985951B2 (en) 2019-03-15 2021-04-20 The Research Foundation for the State University Integrating Volterra series model and deep neural networks to equalize nonlinear power amplifiers
CN113345457B (zh) * 2021-06-01 2022-06-17 广西大学 一种基于贝叶斯理论的声学回声消除自适应滤波器及滤波方法
CN113421579B (zh) * 2021-06-30 2024-06-07 北京小米移动软件有限公司 声音处理方法、装置、电子设备和存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020002455A1 (en) * 1998-01-09 2002-01-03 At&T Corporation Core estimator and adaptive gains from signal to noise ratio in a hybrid speech enhancement system
KR100513175B1 (ko) * 2002-12-24 2005-09-07 한국전자통신연구원 복소수 라플라시안 통계모델을 이용한 음성 검출기 및 음성 검출 방법
KR100821177B1 (ko) * 2006-09-29 2008-04-14 한국전자통신연구원 통계적 모델에 기반한 선험적 음성 부재 확률 추정 방법
US9570087B2 (en) * 2013-03-15 2017-02-14 Broadcom Corporation Single channel suppression of interfering sources
US20150003606A1 (en) * 2013-06-28 2015-01-01 Broadcom Corporation Detecting and quantifying non-linear characteristics of audio signals

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Kyu-Ho Lee et al., ‘Frequency-domain double-talk detection based on the Gaussian Mixture Model’, IEEE Signal Processing Letters, Vol.17, No.5, May 2010.*
박지환 외 2명, ‘Least Square 기반의 Volterra Filter를 이용한 비선형 반향신호 억제기’, 전자공학회 논문지, 제50권 제2호, pp.205~209, 2013년 12월.*

Also Published As

Publication number Publication date
US20160005419A1 (en) 2016-01-07
US9536539B2 (en) 2017-01-03

Similar Documents

Publication Publication Date Title
KR101568937B1 (ko) 볼테라 필터를 이용한 비선형 반향 신호 억제 장치 및 방법
US11315587B2 (en) Signal processor for signal enhancement and associated methods
Milani et al. On maximum achievable noise reduction in ANC systems
US20130216056A1 (en) Non-linear echo cancellation
EP3496089A1 (en) Active noise cancellation device
Hamidia et al. Improved variable step-size NLMS adaptive filtering algorithm for acoustic echo cancellation
Huang et al. Practically efficient nonlinear acoustic echo cancellers using cascaded block RLS and FLMS adaptive filters
CN112037809A (zh) 基于多特征流结构深度神经网络的残留回声抑制方法
EP2939405B1 (en) Method and apparatus for audio processing
CN110211602A (zh) 智能语音增强通信方法及装置
KR20150012752A (ko) 비선형 음향 에코 소거 장치 및 그 방법
Hofmann et al. Significance-aware filtering for nonlinear acoustic echo cancellation
Schmid et al. An expectation-maximization algorithm for multichannel adaptive speech dereverberation in the frequency-domain
JP5524316B2 (ja) パラメータ推定装置、エコー消去装置、パラメータ推定方法、及びプログラム
Kamarudin et al. Acoustic echo cancellation using adaptive filtering algorithms for Quranic accents (Qiraat) identification
EP3829151A1 (en) Echo suppression device, echo suppression method, and echo suppression program
JP5583181B2 (ja) 縦続接続型伝達系パラメータ推定方法、縦続接続型伝達系パラメータ推定装置、プログラム
KR102045953B1 (ko) 칼만필터 기반의 다채널 입출력 음향학적 반향 제거 방법
WO2018087855A1 (ja) エコーキャンセラ装置、エコー消去方法、及びエコー消去プログラム
Tedjani et al. A novel cost-effective sparsity-aware algorithm with Kalman-based gain for the identification of long acoustic impulse responses
JP5925149B2 (ja) 音響結合量推定装置、エコー消去装置、その方法及びプログラム
Contan et al. Variable step size adaptive nonlinear echo canceller
JP4094522B2 (ja) 反響消去装置、方法、及び反響消去プログラム、そのプログラムを記録した記録媒体
Schalk-Schupp et al. Combined Linear and Nonlinear Residual Echo Suppression Using a Deficient Distortion Model-A Proof of Concept
JP4094523B2 (ja) 反響消去装置、方法、及び反響消去プログラム、そのプログラムを記録した記録媒体

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20181105

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20190905

Year of fee payment: 5