KR20210142268A - 강인음성인식을 위한 방향벡터 추정을 겸한 온라인 우도최대화를 이용한 빔포밍 방법 및 그 장치 - Google Patents
강인음성인식을 위한 방향벡터 추정을 겸한 온라인 우도최대화를 이용한 빔포밍 방법 및 그 장치 Download PDFInfo
- Publication number
- KR20210142268A KR20210142268A KR1020200058882A KR20200058882A KR20210142268A KR 20210142268 A KR20210142268 A KR 20210142268A KR 1020200058882 A KR1020200058882 A KR 1020200058882A KR 20200058882 A KR20200058882 A KR 20200058882A KR 20210142268 A KR20210142268 A KR 20210142268A
- Authority
- KR
- South Korea
- Prior art keywords
- current frame
- covariance
- beamforming
- results
- variance
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 12
- 238000007476 Maximum Likelihood Methods 0.000 title 1
- 238000000605 extraction Methods 0.000 claims abstract description 97
- 230000002708 enhancing effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 48
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 6
- 229910052709 silver Inorganic materials 0.000 description 6
- 239000004332 silver Substances 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/0308—Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Radar Systems Or Details Thereof (AREA)
Abstract
본 발명의 실시예에 따른 타겟신호 추출장치는 방향 벡터 예측기 및 빔포밍기를 포함할 수 있다. 방향 벡터 예측기는 시간에 따른 주파수별 입력결과들에 따라 입력신호 공분산을 생성하고, 입력결과들에 상응하는 출력결과들에 따라 결정되는 분산에 기초하여 노이즈 공분산을 생성하며, 입력신호 공분산 및 노이즈 공분산에 기초하여 방향 벡터를 생성할 수 있다. 빔포밍기는 분산에 따라 결정되는 빔포밍 공분산 및 방향 벡터에 따라 빔포밍 가중치를 생성하고, 입력결과들 및 빔포밍 가중치에 기초하여 출력결과들을 제공할 수 있다.
본 발명에 따른 타겟신호 추출장치는 입력결과들에 상응하는 출력결과들에 따라 결정되는 분산에 기초하여 노이즈 공분산을 계산하여 방향 벡터를 생성하고, 빔포밍 가중치를 업데이트함으로써 타겟음원에 대한 추출성능을 높일 수 있다.
본 발명에 따른 타겟신호 추출장치는 입력결과들에 상응하는 출력결과들에 따라 결정되는 분산에 기초하여 노이즈 공분산을 계산하여 방향 벡터를 생성하고, 빔포밍 가중치를 업데이트함으로써 타겟음원에 대한 추출성능을 높일 수 있다.
Description
본 발명은 강인음성인식을 위한 방향벡터 추정을 겸한 온라인 우도최대화를 이용한 빔포밍 방법 및 그 장치에 관한 것이다.
마이크를 통해서 입력되는 소리 입력신호는 음성인식에 필요한 타겟 음성뿐만 아니라 음성인식에 방해가 되는 노이즈들이 포함될 수 있다. 소리 입력신호에서 노이즈를 제거하고, 원하는 타겟 음성만을 추출하여 음성인식의 성능을 높이기 위한 다양한 연구가 진행되고 있다.
본 발명이 이루고자 하는 기술적 과제는 입력결과들에 상응하는 출력결과들에 따라 결정되는 분산에 기초하여 노이즈 공분산을 계산하여 방향 벡터를 생성하고, 빔포밍 가중치를 업데이트함으로써 타겟음원에 대한 추출성능을 높일 수 있는 타겟신호 추출장치를 제공하는 것이다.
이러한 과제를 해결하기 위하여 본 발명의 실시예에 따른 타겟신호 추출장치는 방향 벡터 예측기 및 빔포밍기를 포함할 수 있다. 방향 벡터 예측기는 시간에 따른 주파수별 입력결과들에 따라 입력신호 공분산을 생성하고, 상기 입력결과들에 상응하는 출력결과들에 따라 결정되는 분산에 기초하여 노이즈 공분산을 생성하며, 상기 입력신호 공분산 및 상기 노이즈 공분산에 기초하여 방향 벡터를 생성할 수 있다. 빔포밍기는 상기 분산에 따라 결정되는 빔포밍 공분산 및 상기 방향 벡터에 따라 빔포밍 가중치를 생성하고, 상기 입력결과들 및 상기 빔포밍 가중치에 기초하여 상기 출력결과들을 제공할 수 있다.
일 실시예에 있어서, 상기 노이즈 공분산 및 빔포밍 공분산의 분산은 출력 결과들에 기초하여 결정될 수 있다.
일 실시예에 있어서, 상기 노이즈 공분산 및 빔포밍 공분산의 초기값은 상기 입력결과들에 기초하여 결정될 수 있다.
일 실시예에 있어서, 상기 노이즈 공분산은 상기 분산 및 제1 상수값 중 큰 값에 따라 결정될 수 있다.
일 실시예에 있어서, 상기 노이즈 공분산은 상기 분산 및 상기 제1 상수값 중 큰 값에 따라 노말라이제이션(Normalization)될 수 있다.
일 실시예에 있어서, 상기 빔포밍 공분산은 상기 분산 및 제2 상수값 중 큰 값에 따라 결정될 수 있다.
일 실시예에 있어서, 상기 타겟신호 추출장치는 상기 빔포밍 가중치가 수렴할 때까지 상기 방향 벡터 예측기 및 상기 빔포밍기를 반복적으로 동작시킬 수 있다.
이러한 과제를 해결하기 위하여 본 발명의 실시예에 따른 타겟신호 추출시스템은 방향 벡터 예측기 및 빔포밍기를 포함할 수 있다. 방향 벡터 예측기는 시간에 따른 주파수별 입력결과들에 따라 입력신호 공분산을 생성하고, 상기 입력결과들에 상응하는 출력결과들에 따라 결정되는 분산 및 미리 결정된 마스크에 기초하여 노이즈 공분산을 생성하며, 상기 입력신호 공분산 및 상기 노이즈 공분산에 기초하여 방향 벡터를 생성할 수 있다. 빔포밍기는 상기 분산에 따라 결정되는 빔포밍 공분산 및 상기 방향 벡터에 따라 빔포밍 가중치를 생성하고, 상기 입력결과들 및 상기 빔포밍 가중치에 기초하여 상기 출력결과들을 제공할 수 있다.
일 실시예에 있어서, 상기 노이즈 공분산 및 빔포밍 공분산의 초기값은 상기 입력결과들 및 상기 마스크의 곱에 따라 결정될 수 있다.
일 실시예에 있어서, 상기 노이즈 공분산의 입력결과들은 상기 입력 결과들과 상기 마스크의 곱으로 갱신될 수 있다.
일 실시예에 있어서 상기 마스크는 프레임 인덱스 및 주파수 인덱스 별로 계산될 수 있다.
일 실시예에 있어서, 상기 노이즈 공분산은 상기 분산 및 제1 상수값 중 큰 값에 따라 결정되고, 상기 노이즈 공분산은 상기 분산 및 상기 제1 상수값 중 큰 값에 따라 노말라이제이션(Normalization)될 수 있다.
일 실시예에 있어서, 상기 빔포밍 공분산은 상기 분산 및 제2 상수값 중 큰 값에 따라 결정되고, 상기 타겟신호 추출장치는 상기 빔포밍 가중치가 수렴할 때까지 상기 방향 벡터 예측기 및 상기 빔포밍기를 반복적으로 동작시킬 수 있다.
이러한 과제를 해결하기 위하여 본 발명의 실시예에 따른 온라인 타겟신호 추출장치는 방향 벡터 예측기 및 빔포밍기를 포함할 수 있다. 방향 벡터 예측기는 이전프레임에 상응하는 이전프레임 입력신호 공분산 및 현재 프레임에 따른 주파수별 현재프레임 입력결과들에 기초하여 생성되는 현재프레임 입력신호 공분산을 생성하고, 상기 이전프레임에 상응하는 이전프레임 노이즈 공분산, 현재프레임에 상응하는 현재프레임 입력결과들 및 이전프레임에 상응하는 이전프레임 빔포밍 가중치에 따라 생성되는 현재프레임 분산 추정값에 기초하여 현재프레임 노이즈 공분산을 생성하며, 상기 현재프레임 입력신호 공분산, 상기 현재프레임 노이즈 공분산 및 이전프레임에 상응하는 이전프레임 방향 벡터에 기초하여 현재프레임 방향 벡터를 생성할 수 있다. 빔포밍기는 이전프레임에 상응하는 이전프레임 빔포밍 가중치, 현재프레임 입력결과들 및 이전프레임 출력결과들에 상응하는 이전프레임 분산에 따라 생성된 현재프레임 빔포밍 분산 추정값을 생성하고, 이전프레임에 상응하는 이전프레임 역 공분산, 현재프레임 입력결과들 및 상기 현재프레임 빔포밍 분산 추정값에 따라 생성된 현재프레임 빔포밍 역 공분산을 생성하고, 상기 현재프레임 방향 벡터 및 상기 현재프레임 빔포밍 역 공분산에 따라 현재프레임 빔포밍 가중치를 생성하고, 상기 현재프레임 입력결과들 및 상기 현재프레임 빔포밍 가중치에 기초하여 상기 현재프레임 출력결과들을 제공할 수 있다.
일 실시예에 있어서, 상기 현재프레임 노이즈 공분산은 현재프레임 분산 추정값에 의해 노말라이제이션(Normalization)될 수 있다.
이러한 과제를 해결하기 위하여 본 발명의 실시예에 따른 온라인 타겟신호 추출시스템는 방향벡터 예측기 및 빔포밍기를 포함할 수 있다. 방향 벡터 예측기는 이전프레임에 상응하는 이전프레임 입력신호 공분산 및 현재 프레임에 따른 주파수별 현재프레임 입력결과들에 기초하여 생성되는 현재프레임 입력신호 공분산을 생성하고, 상기 이전프레임에 상응하는 이전프레임 노이즈 공분산, 현재프레임에 상응하는 현재프레임 입력결과들 및 미리 결정된 마스크에 따라 생성되는 현재프레임 분산 추정값을 통해 현재프레임 노이즈 공분산을 생성하며, 상기 현재프레임 입력신호 공분산, 상기 현재프레임 노이즈 공분산 및 이전프레임에 상응하는 이전프레임 방향 벡터에 기초하여 현재프레임 방향 벡터를 생성할 수 있다. 빔포밍기는 이전프레임에 상응하는 이전프레임 빔포밍 가중치, 현재프레임 입력결과들, 이전프레임 출력결과들에 상응하는 이전프레임 분산 및 미리 결정된 마스크를 통해 현재프레임 빔포밍 분산 추정값을 생성하고, 이전프레임에 상응하는 이전프레임 역 공분산, 현재프레임 입력결과들 및 상기 현재프레임 빔포밍 분산 추정값에 따라 현재프레임 빔포밍 역 공분산을 생성하고, 상기 현재프레임 방향 벡터 및 상기 현재프레임 빔포밍 역 공분산에 따라 현재프레임 빔포밍 가중치를 생성하고, 상기 현재프레임 입력결과들 및 상기 현재프레임 빔포밍 가중치에 기초하여 상기 현재프레임 출력결과들을 제공할 수 있다.
일 실시예에 있어서, 상기 현재프레임 노이즈 공분산은 상기 이전프레임 노이즈 공분산 및 상기 현재프레임 입력결과들 및 미리 결정된 마스크를 통해 생성된 현재프레임 분산 추정값에 기초하여 생성될 수 있다.
일 실시예에 있어서, 상기 현재프레임 빔포밍 분산 추정값은 상기 이전프레임 빔포밍 가중치, 상기 현재프레임 입력결과들, 상기 이전프레임 분산 및 미리 결정된 마스크에 기초하여 생성될 수 있다.
일 실시예에 있어서, 상기 가중된 공분산 및 상기 가중된 상관 벡터는 분산 및 제2 상수값 중 큰 값에 따라 결정될 수 있고, 상기 타겟신호 추출시스템은 상기 반향제거 필터 및 상기 빔포밍 가중치가 수렴할 때까지 상기 반향 제거기, 상기 방향 벡터 예측기 및 상기 빔포밍기를 반복적으로 동작시킬 수 있다.
이러한 과제를 해결하기 위하여 본 발명의 실시예에 따른 타겟신호 추출장치는 반향 제거기, 반향 벡터 예측기 및 빔포밍기를 포함할 수 있다. 반향 제거기는 시간에 따른 주파수별 과거 입력결과들 및 반향제거된 입력결과들에 상응하는 출력결과들에 따라 결정되는 분산에 기초하여 가중된 공분산을 생성하고, 시간에 따른 주파수별 입력 결과들 및 과거 입력결과들 및 반향제거된 입력결과들에 상응하는 출력결과들에 따라 결정되는 분산에 기초하여 가중된 상관 벡터를 생성하며, 가중된 공분산 및 가중된 상관 벡터에 기초하여 반향 제거 필터를 생성할 수 있으며, 입력결과들, 과거 입력결과들 및 반향 제거 필터에 기초하여 반향 제거된 입력 결과들을 생성할 수 있다. 방향 벡터 예측기는 상기 반향 제거된 입력 결과들에 따라 입력 신호 공분산을 생성하고, 상기 입력결과들에 상응하는 출력결과들에 따라 결정되는 분산에 기초하여 노이즈 공분산을 생성하며, 상기 입력신호 공분산 및 상기 노이즈 공분산에 기초하여 방향 벡터를 생성할 수 있다. 빔포밍기는 상기 분산에 따라 결정되는 빔포밍 공분산 및 상기 방향 벡터에 따라 빔포밍 가중치를 생성하고, 상기 반향 제거된 입력 결과들 및 상기 빔포밍 가중치에 기초하여 상기 출력 결과들을 제공할 수 있다.
일 실시예에 있어서, 상기 가중된 공분산, 상기 가중된 상관 벡터, 상기 노이즈 공분산 및 상기 빔포밍 공분산은 상기 출력결과들에 기초하여 결정될 수 있다.
일 실시예에 있어서, 상기 가중된 공분산 및 상기 가중된 상관 벡터의 초기값은 상기 입력결과들에 기초하여 결정될 수 있다.
일 실시예에 있어서, 상기 가중된 공분산 및 상기 가중된 상관 벡터는 상기 분산 및 제2 상수값 중 큰 값에 따라 결정될 수 있다.
일 실시예에 있어서, 상기 노이즈 공분산 및 상기 빔포밍 공분산의 초기값은 상기 반향 제거된 입력결과들에 기초하여 결정될 수 있다.
일 실시예에 있어서, 상기 노이즈 공분산은 상기 분산 및 제1 상수값 중 큰 값에 따라 결정될 수 있다. 또한, 상기 노이즈 공분산은 상기 분산 및 상기 제1 상수값 중 큰 값에 따라 노말라이제이션(Normalization)될 수 있다.
일 실시예에 있어서, 상기 빔포밍 공분산은 상기 분산 및 상기 제2 상수값 중 큰 값에 따라 결정될 수 있다.
일 실시예에 있어서, 상기 타겟신호 추출장치는 상기 반향 제거 필터 및 상기 빔포밍 가중치가 수렴할 때까지 상기 반향 제거기, 상기 방향 벡터 예측기 및 상기 빔포밍기를 반복적으로 동작시킬 수 있다.
이러한 과제를 해결하기 위하여 본 발명의 실시예에 따른 타겟신호 추출시스템은 반향 제거기, 방향벡터 예측기 및 빔포밍기를 포함할 수 있다. 상기 반향 제거기는 가중된 공분산 생성기, 가중된 상관 벡터 생성기, 반향제거 필터 생성기 및 반향 제거된 신호 생성기를 포함할 수 있다. 상기 반향 제거기는 시간에 따른 주파수별 과거 입력결과들 및 반향 제거된 입력결과들에 상응하는 출력결과들에 따라 결정되는 분산에 기초하여 가중된 공분산를 생성하고, 시간에 따른 주파수별 상기 입력결과들 및 상기 과거 입력결과들 및 상기 반향 제거된 입력결과들에 상응하는 출력결과들에 따라 결정되는 상기 분산에 기초하여 가중된 상관 벡터를 생성하며, 상기 가중된 공분산 및 상기 가중된 상관 벡터에 기초하여 반향 제거 필터를 생성할 수 있으며, 상기 입력결과들, 상기 과거 입력결과들 및 상기 반향 제거 필터에 기초하여 상기 반향 제거된 입력결과들을 생성할 수 있다. 상기 방향 벡터 예측기는 시간에 따른 주파수별 상기 반향 제거된 입력결과들에 따라 입력신호 공분산을 생성하고, 상기 입력결과들에 상응하는 상기 출력결과들에 따라 결정되는 분산 및 미리 결정된 마스크에 기초하여 노이즈 공분산(NC)을 생성하며, 상기 입력신호 공분산 및 상기 노이즈 공분산에 기초하여 방향 벡터를 생성할 수 있다. 상기 빔포밍기는 상기 반향 제거된 입력결과들, 상기 분산에 따라 결정되는 빔포밍 공분산 및 상기 방향 벡터에 따라 빔포밍 가중치를 생성하고, 상기 반향 제거된 입력결과들 및 상기 빔포밍 가중치에 기초하여 상기 출력결과들을 제공할 수 있다.
일 실시예에 있어서, 상기 노이즈 공분산 및 상기 빔포밍 공분산의 초기값은 상기 반향 제거된 입력결과들 및 상기 마스크의 곱에 따라 결정될 수 있다.
일 실시예에 있어서, 상기 노이즈 공분산의 반향 제거된 입력결과들은 상기 반향 제거된 입력결과들과 상기 마스크의 곱으로 갱신될 수 있다.
일 실시예에 있어서 상기 마스크는 프레임 인덱스 및 주파수 인덱스 별로 계산될 수 있다.
일 실시예에 있어서, 상기 노이즈 공분산은 상기 분산 및 제1 상수값 중 큰 값에 따라 결정되고, 상기 노이즈 공분산은 상기 분산 및 상기 제1 상수값 중 큰 값에 따라 노말라이제이션(Normalization)될 수 있다.
일 실시예에 있어서, 상기 빔포밍 공분산은 상기 분산 및 제2 상수값 중 큰 값에 따라 결정되고, 상기 타겟신호 추출시스템은 상기 반향 제거 필터 및 상기 빔포밍 가중치가 수렴할 때까지 상기 반향 제거기, 상기 방향 벡터 예측기 및 상기 빔포밍기를 반복적으로 동작시킬 수 있다.
이러한 과제를 해결하기 위하여 본 발명의 실시예에 따른 온라인 타겟신호 추출장치는 반향 제거기, 방향 벡터 예측기 및 빔포밍기를 포함할 수 있다. 상기 반향 제거기는 이득 벡터 생성기, 가중된 역 공분산 생성기, 반향제거 필터 생성기 및 반향제거 신호 생성기를 포함할 수 있다.
상기 반향 제거기는 현재프레임에 상응하는 현재프레임 입력결과들, 현재프레임 과거 입력결과들 및 이전프레임에 상응하는 이전프레임 반향제거 필터에 기초하여 현재프레임 반향제거 출력 추정값을 생성하고, 이전프레임에 상응하는 이전프레임 분산 및 상기 현재프레임 반향제거 출력 추정값에 기초하여 현재프레임 반향제거 분산 추정값을 생성하고, 이전프레임에 상응하는 이전프레임 가중된 역 공분산, 상기 현재프레임 반향제거 출력 추정값 및 상기 현재프레임 과거 입력결과들에 기초하여 현재프레임 이득 벡터를 생성하며, 상기 이전프레임 가중된 역 공분산, 상기 현재프레임 과거 입력결과들 및 상기 현재프레임 이득 벡터에 기초하여 현재프레임 가중된 역 공분산를 생성하며, 상기 현재프레임 이득 벡터, 상기 현재프레임 과거 입력결과들 및 이전프레임에 상응하는 상기 이전프레임 반향 제거 필터에 기초하여 현재프레임에 상응하는 현재프레임 반향 제거 필터를 생성하고, 상기 현재프레임 입력결과들, 상기 현재프레임 과거 입력결과들 및 상기 현재프레임 반향 제거 필터에 기초하여 현재프레임 반향 제거된 입력결과들을 생성할 수 있다.
상기 방향 벡터 예측기는 이전프레임에 상응하는 이전프레임 입력신호 공분산 및 현재 프레임에 따른 주파수별 상기 현재프레임 반향 제거된 입력결과들에 기초하여 생성되는 현재프레임 입력신호 공분산을 생성하고, 상기 현재프레임 반향 제거된 입력결과들 및 상기 이전프레임 빔포밍 가중치에 기초하여 현재프레임 분산 추정값을 생성하고, 이전프레임에 상응하는 이전프레임 노이즈 공분산 및 상기 현재프레임 분산 추정값에 기초하여 현재프레임 노이즈 공분산을 생성하며, 상기 현재프레임 입력신호 공분산, 상기 현재프레임 노이즈 공분산 및 이전프레임 방향 벡터에 기초하여 현재프레임 방향 벡터를 생성할 수 있다.
상기 빔포밍기는 이전프레임 빔포밍 가중치, 상기 현재프레임 반향 제거된 입력결과들 및 상기 이전프레임 분산에 따라 현재프레임 빔포밍 분산 추정값을 생성하고, 이전프레임 역 공분산, 상기 현재프레임 반향 제거된 입력결과들 및 상기 현재프레임 빔포밍 분산 추정값에 기초하여 현재프레임 빔포밍 역 공분산을 생성하고, 상기 현재프레임 빔포밍 역 공분산 및 상기 현재프레임 방향 벡터에 따라 현재프레임 빔포밍 가중치를 생성하고, 상기 현재프레임 반향 제거된 입력결과들 및 상기 현재프레임 빔포밍 가중치에 기초하여 현재프레임 출력결과들을 제공할 수 있다.
일 실시예에 있어서, 상기 현재프레임 노이즈 공분산은 상기 현재프레임 분산 추정값에 의해 노말라이제이션(Normalization) 될 수 있다.
일 실시예에 있어서, 본 발명에 따른 온라인 타겟신호 추출장치는 상기 현재프레임 입력결과들에 상응하는 상기 현재프레임 출력결과들에 따라 결정되는 상기 현재프레임 분산 추정값에 기초하여 상기 현재프레임 이득 벡터를 생성하고, 상기 현재프레임 반향 제거 필터를 계산하여 상기 현재프레임 반향 제거된 입력결과들을 생성하고, 상기 현재 프레임 노이즈 공분산을 계산하여 상기 현재프레임 방향 벡터를 생성하고, 상기 현재프레임 빔포밍 가중치를 업데이트함으로써 타겟음원에 대한 추출성능을 높일 수 있다.
이러한 과제를 해결하기 위하여 본 발명의 실시예에 따른 온라인 타겟신호 추출시스템은 반향 제거기, 방향 벡터 예측기 및 빔포밍기를 포함할 수 있다. 상기 반향 제거기는 이득 벡터 생성기, 가중된 역 공분산 생성기, 반향제거 필터 생성기 및 반향제거 신호 생성기를 포함할 수 있다.
상기 반향 제거기는 현재프레임에 상응하는 현재프레임 입력결과들, 현재프레임 과거 입력결과들 및 이전프레임에 상응하는 이전프레임 반향제거 필터에 기초하여 현재프레임 반향제거 출력 추정값을 생성하고, 이전프레임에 상응하는 이전프레임 분산 및 상기 반향제거 출력 추정값에 기초하여 현재프레임 반향제거 분산 추정값을 생성하고, 이전프레임에 상응하는 이전프레임 가중된 역 공분산, 상기 현재프레임 반향제거 출력 추정값 및 상기 현재프레임 과거 입력결과들에 기초하여 현재프레임 이득 벡터를 생성하며, 상기 이전프레임 가중된 역 공분산, 상기 현재프레임 과거 입력결과들 및 상기 현재프레임 이득 벡터에 기초하여 현재프레임 가중된 역 공분산을 생성하며, 상기 현재프레임 이득 벡터, 상기 현재프레임 과거 입력결과들 및 이전프레임에 상응하는 상기 이전프레임 반향 제거 필터에 기초하여 현재프레임에 상응하는 현재프레임 반향 제거 필터를 생성하고, 상기 현재프레임 입력결과들, 상기 현재프레임 과거 입력결과들 및 상기 현재프레임 반향 제거 필터에 기초하여 현재프레임 반향 제거된 입력결과들을 생성할 수 있다.
상기 방향 벡터 예측기는 이전프레임에 상응하는 이전프레임 입력신호 공분산 및 현재 프레임에 따른 주파수별 상기 현재프레임 반향 제거된 입력결과들에 기초하여 생성되는 현재프레임 입력신호 공분산을 생성하고, 이전프레임에 상응하는 이전프레임 노이즈 공분산, 상기 현재프레임 반향 제거된 입력결과들 및 미리 결정된 마스크를 통해 생성된 현재프레임 분산 추정값에 기초하여 현재프레임 노이즈 공분산을 생성하며, 상기 현재프레임 입력신호 공분산, 상기 현재프레임 노이즈 공분산 및 이전프레임 방향 벡터에 기초하여 현재프레임 방향 벡터를 생성할 수 있다.
상기 빔포밍기는 이전프레임 빔포밍 가중치, 상기 현재프레임 반향 제거된 입력결과들, 상기 이전프레임 분산 및 상기 미리 결정된 마스크에 따라 현재프레임 빔포밍 분산 추정값을 생성하고, 이전프레임 역 공분산, 상기 현재프레임 반향 제거된 입력결과들 및 상기 현재프레임 빔포밍 분산 추정값에 따라 결정되는 현재프레임 빔포밍 역 공분산을 생성하고, 상기 현재프레임 방향 벡터 및 상기 현재프레임 빔포밍 역 공분산에 따라 현재프레임 빔포밍 가중치를 생성하고, 상기 현재프레임 반향 제거된 입력결과들 및 상기 현재프레임 빔포밍 가중치에 기초하여 현재프레임 출력결과들을 제공할 수 있다.
일 실시예에 있어서, 상기 현재프레임 노이즈 공분산은 상기 이전프레임 노이즈 공분산, 상기 현재프레임 반향 제거된 입력결과들 및 상기 미리 결정된 마스크를 통해 생성된 상기 현재프레임 분산 추정값에 기초하여 생성될 수 있다.
일 실시예에 있어서, 상기 현재프레임 빔포밍 분산 추정값은 상기 이전프레임 빔포밍 가중치, 상기 현재프레임 반향 제거된 입력결과들 및 상기 이전프레임 분산 및 상기 미리 결정된 마스크에 기초하여 생성될 수 있다.
위에서 언급된 본 발명의 기술적 과제 외에도, 본 발명의 다른 특징 및 이점들이 이하에서 기술되거나, 그러한 기술 및 설명으로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
이상과 같은 본 발명에 따르면 다음과 같은 효과가 있다.
본 발명에 따른 타겟신호 추출장치는 입력결과들에 상응하는 출력결과들에 따라 결정되는 분산에 기초하여 노이즈 공분산을 계산하여 방향 벡터를 생성하고, 빔포밍 가중치를 업데이트함으로써 타겟음원에 대한 추출성능을 높일 수 있다.
이 밖에도, 본 발명의 실시 예들을 통해 본 발명의 또 다른 특징 및 이점들이 새롭게 파악될 수도 있을 것이다.
도 1은 본 발명의 실시예들에 따른 타겟신호 추출장치를 나타내는 도면이다.
도 2는 도 1의 타겟신호 추출장치에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이다.
도 3은 도 1의 타겟신호 추출장치에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 4는 본 발명의 실시예들에 따른 타겟신호 추출시스템을 나타내는 도면이다.
도 5는 도 4의 타겟신호 추출시스템에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이다.
도 6은 도 4의 타겟신호 추출시스템에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 7은 본 발명의 실시예들에 따른 온라인 타겟신호 추출장치를 나타내는 도면이다.
도 8은 도 7의 온라인 타겟신호 추출장치에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이다.
도 9는 도 7의 온라인 타겟신호 추출장치에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 10은 본 발명의 실시예들에 따른 온라인 타겟신호 추출시스템을 나타내는 도면이다.
도 11은 도 10의 온라인 타겟신호 추출시스템에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이다.
도 12는 도 10의 온라인 타겟신호 추출시스템에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 13은 본 발명의 실시예들에 따른 타겟신호 추출장치의 일 예를 나타내는 도면이다.
도 14는 도 13의 타겟신호 추출장치에 포함되는 반향 제거기의 일 예를 나타내는 도면이다.
도 15는 도 13의 타겟신호 추출장치에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이다.
도 16은 도 13의 타겟신호 추출장치에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 17은 본 발명의 실시예들에 따른 타겟신호 추출시스템의 일 예를 나타내는 도면이다.
도 18는 도 17의 타겟신호 추출시스템에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이다.
도 19은 도 17의 타겟신호 추출시스템에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 20은 본 발명의 실시예들에 따른 온라인 타겟신호 추출장치의 일 예를 나타내는 도면이다.
도 21는 도 20의 온라인 타겟신호 추출장치에 포함되는 반향 제거기의 일 예를 나타내는 도면이다.
도 22는 도 20의 온라인 타겟신호 추출장치에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이다.
도 23은 도 20의 온라인 타겟신호 추출장치에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 24은 본 발명의 실시예들에 따른 온라인 타겟신호 추출시스템의 일 예를 나타내는 도면이다.
도 25는 도 24의 온라인 타겟신호 추출시스템에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이다.
도 26은 도 24의 온라인 타겟신호 추출시스템에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 2는 도 1의 타겟신호 추출장치에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이다.
도 3은 도 1의 타겟신호 추출장치에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 4는 본 발명의 실시예들에 따른 타겟신호 추출시스템을 나타내는 도면이다.
도 5는 도 4의 타겟신호 추출시스템에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이다.
도 6은 도 4의 타겟신호 추출시스템에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 7은 본 발명의 실시예들에 따른 온라인 타겟신호 추출장치를 나타내는 도면이다.
도 8은 도 7의 온라인 타겟신호 추출장치에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이다.
도 9는 도 7의 온라인 타겟신호 추출장치에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 10은 본 발명의 실시예들에 따른 온라인 타겟신호 추출시스템을 나타내는 도면이다.
도 11은 도 10의 온라인 타겟신호 추출시스템에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이다.
도 12는 도 10의 온라인 타겟신호 추출시스템에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 13은 본 발명의 실시예들에 따른 타겟신호 추출장치의 일 예를 나타내는 도면이다.
도 14는 도 13의 타겟신호 추출장치에 포함되는 반향 제거기의 일 예를 나타내는 도면이다.
도 15는 도 13의 타겟신호 추출장치에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이다.
도 16은 도 13의 타겟신호 추출장치에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 17은 본 발명의 실시예들에 따른 타겟신호 추출시스템의 일 예를 나타내는 도면이다.
도 18는 도 17의 타겟신호 추출시스템에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이다.
도 19은 도 17의 타겟신호 추출시스템에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 20은 본 발명의 실시예들에 따른 온라인 타겟신호 추출장치의 일 예를 나타내는 도면이다.
도 21는 도 20의 온라인 타겟신호 추출장치에 포함되는 반향 제거기의 일 예를 나타내는 도면이다.
도 22는 도 20의 온라인 타겟신호 추출장치에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이다.
도 23은 도 20의 온라인 타겟신호 추출장치에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 24은 본 발명의 실시예들에 따른 온라인 타겟신호 추출시스템의 일 예를 나타내는 도면이다.
도 25는 도 24의 온라인 타겟신호 추출시스템에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이다.
도 26은 도 24의 온라인 타겟신호 추출시스템에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
본 명세서에서 각 도면의 구성 요소들에 참조번호를 부가함에 있어서 동일한 구성 요소들에 한해서는 비록 다른 도면상에 표시되더라도 가능한한 동일한 번호를 가지도록 하고 있음에 유의하여야 한다.
한편, 본 명세서에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.
단수의 표현은 문맥상 명백하게 다르게 정의하지 않는 한, 복수의 표현을 포함하는 것으로 이해되어야 하는 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다.
"포함하다" 또는 "가지다" 등의 용어는 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
이하, 첨부되는 도면을 참고하여 상기 문제점을 해결하기 위해 고안된 본 발명의 바람직한 실시예들에 대해 상세히 설명한다.
도 1은 본 발명의 실시예들에 따른 타겟신호 추출장치를 나타내는 도면이고, 도 2는 도 1의 타겟신호 추출장치에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이고, 도 3은 도 1의 타겟신호 추출장치에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 1 내지 3을 참조하면, 본 발명의 실시예에 따른 타겟신호 추출장치(10)는 방향 벡터 예측기(100) 및 빔포밍기(200)를 포함할 수 있다. 방향 벡터 예측기(100)는 입력신호 공분산 생성기(110), 노이즈 공분산 생성기(120) 및 벡터 생성기(130)를 포함할 수 있다. 방향 벡터 예측기(100)는 시간에 따른 주파수별 입력결과들(XS)에 따라 입력신호 공분산(IC)을 생성하고, 입력결과들(XS)에 상응하는 출력결과들(OR)에 따라 결정되는 분산에 기초하여 노이즈 공분산(NC)을 생성하며, 입력신호 공분산(IC) 및 노이즈 공분산(NC)에 기초하여 방향 벡터(HV)를 생성할 수 있다.
예를 들어, 입력신호 공분산 생성기(110)는 시간에 따른 주파수별 입력결과들(XS)에 따라 입력신호 공분산(IC)을 생성할 수 있다.
입력신호 공분산(IC)은 아래의 [수학식1]과 같이 나타낼 수 있다.
[수학식1]
또한, 노이즈 공분산 생성기(120)는 입력결과들(XS)에 상응하는 출력결과들(OR)에 따라 결정되는 분산에 기초하여 노이즈 공분산(NC)을 생성할 수 있다.
노이즈 공분산(NC)은 아래의 [수학식2]와 같이 나타낼 수 있다.
[수학식2]
또한, 벡터 생성기(130)는 입력신호 공분산(IC) 및 노이즈 공분산(NC)에 기초하여 방향 벡터(HV)를 생성할 수 있다.
방향 벡터(HV)는 아래의 [수학식3]과 같이 나타낼 수 있다.
[수학식3]
빔포밍기(200)는 입력결과들(XS) 및 분산에 따라 결정되는 빔포밍 공분산(BC) 및 방향 벡터(HV)에 따라 빔포밍 가중치(BFW)를 생성하고, 입력결과들(XS) 및 빔포밍 가중치(BFW)에 기초하여 출력결과들(OR)을 제공할 수 있다.
예를 들어, 빔포밍기(200)는 빔포밍 가중치 생성기(210) 및 출력생성기(220)를 포함할 수 있다. 빔포밍 가중치 생성기(210)는 입력결과들(XS) 및 분산에 따라 결정되는 빔포밍 공분산(BC) 및 방향 벡터(HV)에 따라 빔포밍 가중치(BFW)를 생성할 수 있다.
빔포밍 공분산(BC)은 아래의 [수학식4]와 같이 나타낼 수 있다.
[수학식4]
빔포밍 가중치(BFW)는 아래의 [수학식5]와 같이 나타낼 수 있다.
[수학식5]
출력생성기(220)는 입력결과들(XS) 및 빔포밍 가중치(BFW)에 기초하여 출력결과들(OR)을 제공할 수 있다.
출력결과들(OR)은 아래의 [수학식6]과 같이 나타낼 수 있다.
[수학식6]
일 실시예에 있어서, 노이즈 공분산(NC) 및 빔포밍 공분산(BC)의 분산은 출력결과들(OR)에 기초하여 결정될 수 있다. 예를 들어, 노이즈 공분산(NC) 및 빔포밍 공분산(BC)의 분산은 아래의 [수학식7]과 같이 나타낼 수 있다.
[수학식7]
일 실시예에 있어서, 노이즈 공분산(NC) 및 빔포밍 공분산(BC)의 초기값은 입력결과들(XS)에 기초하여 결정될 수 있다. 예를 들어, 노이즈 공분산(NC) 및 빔포밍 공분산(BC)에서 사용되는 분산의 초기값은 아래의 [수학식8]과 같이 나타낼 수 있다.
[수학식8]
일 실시예에 있어서, 노이즈 공분산(NC)은 분산 및 제1 상수값 중 큰 값에 따라 결정될 수 있다. 또한, 노이즈 공분산(NC)은 분산 및 제1 상수값 중 큰 값에 따라 노말라이제이션(Normalization)될 수 있다. 예를 들어, 제1 상수값은 10^-6일 수 있다.
일 실시예에 있어서, 빔포밍 공분산(BC)은 분산 및 제2 상수값 중 큰 값에 따라 결정될 수 있다. 예를 들어, 제2 상수값은 10^-6일 수 있다.
일 실시예에 있어서, 타겟신호 추출장치(10)는 빔포밍 가중치(BFW)가 수렴할 때까지 방향 벡터 예측기(100) 및 빔포밍기(200)를 반복적으로 동작시킬 수 있다. 타겟신호 추출장치(10)는 방향 벡터 예측기(100)를 통해서 방향 벡터(HV)를 생성한 후, 빔포밍기(200)를 통해서 빔포밍 가중치(BFW)를 생성하는 동작을 반복할 수 있다. 본 발명에 따른 타겟신호 추출장치(10)는 입력결과들(XS)에 상응하는 출력결과들(OR)에 따라 결정되는 분산에 기초하여 노이즈 공분산(NC)을 계산하여 방향 벡터(HV)를 생성하고, 빔포밍 가중치(BFW)를 업데이트함으로써 타겟음원에 대한 추출성능을 높일 수 있다.
도 4는 본 발명의 실시예들에 따른 타겟신호 추출시스템을 나타내는 도면이고, 도 5는 도 4의 타겟신호 추출시스템에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이고, 도 6은 도 4의 타겟신호 추출시스템에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 4 내지 6을 참조하면, 본 발명의 실시예에 따른 타겟신호 추출시스템(11)은 방향 벡터 예측기(100) 및 빔포밍기(200)를 포함할 수 있다. 방향 벡터 예측기(100)는 입력신호 공분산 생성기(110), 노이즈 공분산 생성기(120) 및 벡터 생성기(130)를 포함할 수 있다. 방향 벡터 예측기(100)는 시간에 따른 주파수별 입력결과들(XS)에 따라 입력신호 공분산(IC)을 생성하고, 입력결과들(XS)에 상응하는 출력결과들(OR)에 따라 결정되는 분산 및 미리 결정된 마스크(MSK)에 기초하여 노이즈 공분산(NC)을 생성하며, 입력신호 공분산(IC) 및 노이즈 공분산(NC)에 기초하여 방향 벡터(HV)를 생성할 수 있다.
빔포밍기(200)는 입력결과들(XS) 및 분산에 따라 결정되는 빔포밍 공분산(BC) 및 방향 벡터(HV)에 따라 빔포밍 가중치(BFW)를 생성하고, 입력결과들(XS) 및 빔포밍 가중치(BFW)에 기초하여 출력결과들(OR)을 제공할 수 있다.
본 발명에 따른 타겟신호 추출시스템(11)은 도 1 내지 도 3에서 설명되는 [수학식1] 내지 [수학식6]의 내용이 동일하게 적용될 수 있다.
일 실시예에 있어서, 노이즈 공분산(NC) 및 빔포밍 공분산의 초기값은 입력결과들(XS) 및 마스크(MSK)의 곱에 따라 결정될 수 있다. 예를 들어, 노이즈 공분산(NC)에서 사용되는 분산의 초기값은 아래의 [수학식9]과 같이 나타낼 수 있다.
[수학식9]
일 실시예에 있어서, 노이즈 공분산(NC)의 입력결과들(XS)은 입력 결과들(XS)과 마스크(MSK)의 곱으로 갱신될 수 있다. 예를 들어, 노이즈 공분산(NC)에서 사용되는 입력결과들(XS)은 아래의 [수학식10]와 같이 갱신될 수 있다.
[수학식10]
일 실시예에 있어서 마스크(MSK)는 프레임 인덱스 및 주파수 인덱스 별로 계산될 수 있다. 예를 들어, 신경망(Neural network) 혹은 분산도 (Diffuseness)에 기반하여 프레임 인덱스 및 주파수 인덱스 별 마스크가 계산될 수 있다.
일 실시예에 있어서, 노이즈 공분산(NC)은 분산 및 제1 상수값 중 큰 값에 따라 결정되고, 노이즈 공분산(NC)은 분산 및 제1 상수값 중 큰 값에 따라 노말라이제이션(Normalization)될 수 있다.
일 실시예에 있어서, 빔포밍 공분산(BC)은 분산 및 제2 상수값 중 큰 값에 따라 결정되고, 타겟신호 추출시스템(11)은 빔포밍 가중치(BFW)가 수렴할 때까지 방향 벡터 예측기(100) 및 빔포밍기(200)를 반복적으로 동작시킬 수 있다.
도 7은 본 발명의 실시예들에 따른 온라인 타겟신호 추출장치를 나타내는 도면이고, 도 8은 도 7의 온라인 타겟신호 추출장치에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이고, 도 9는 도 7의 온라인 타겟신호 추출장치에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 7 내지 9를 참조하면, 본 발명의 실시예에 따른 온라인 타겟신호 추출장치(20)는 방향 벡터 예측기(100) 및 빔포밍기(200)를 포함할 수 있다. 방향 벡터 예측기(100)는 입력신호 공분산 생성기(110), 노이즈 공분산 생성기(120) 및 벡터 생성기(130)를 포함할 수 있다. 방향 벡터 예측기(100)는 이전프레임에 상응하는 이전프레임 입력신호 공분산(P_IC) 및 현재 프레임에 따른 주파수별 현재프레임 입력결과들(C_XS)에 기초하여 생성되는 현재프레임 입력신호 공분산(C_IC)을 생성하고, 현재프레임 입력결과들(C_XS) 및 이전프레임 빔포밍 가중치(P_BFW)에 기초하여 현재프레임 분산 추정값을 생성하고, 이전프레임에 상응하는 이전프레임 노이즈 공분산(P_NC) 및 현재프레임 분산 추정값에 기초하여 현재프레임 노이즈 공분산(C_NC)을 생성하며, 현재프레임 입력신호 공분산(C_IC) 및 현재프레임 노이즈 공분산(C_NC) 및 이전프레임 방향 벡터(P_HV)에 기초하여 현재프레임 방향 벡터(C_HV)를 생성할 수 있다.
예를 들어, 입력신호 공분산 생성기(110)는 이전프레임에 상응하는 이전프레임 입력신호 공분산(P_IC) 및 현재 프레임에 따른 주파수별 현재프레임 입력결과들(C_XS)에 기초하여 생성되는 현재프레임 입력신호 공분산(C_IC)을 생성할 수 있다.
현재프레임 입력신호 공분산(C_IC)은 아래의 [수학식11]와 같이 나타낼 수 있다.
[수학식11]
또한, 노이즈 공분산 생성기(120)는 이전프레임에 상응하는 이전프레임 노이즈 공분산(P_NC) 및 주파수별 현재프레임 입력결과들(C_XS)과 이전프레임에 입력결과들에 상응하는 이전프레임 빔포밍 가중치(P_BFW)에 따라 생성되는 현재프레임 분산 추정값에 기초하여 현재프레임 노이즈 공분산(C_NC)을 생성할 수 있다.
현재프레임 노이즈 공분산(C_NC)은 아래의 [수학식12]과 같이 나타낼 수 있다.
[수학식12]
여기서, 은 현재프레임 노이즈 공분산, 은 망각 인자, 은 이전프레임 노이즈 공분산, 는 현재프레임 분산 추정값, 는 현재프레임 추정 출력결과들, 는 이전프레임 빔포밍 가중치, 는 현재프레임 입력결과들, 는 제3 상수값일 수 있다.
또한, 벡터 생성기(130)는 현재프레임 입력신호 공분산(C_IC) 및 현재프레임 노이즈 공분산(C_NC)에 기초하여 현재프레임 방향 벡터(C_HV)를 생성할 수 있다.
현재프레임 방향 벡터(C_HV)는 아래의 [수학식13]과 같이 나타낼 수 있다.
[수학식13]
여기서, 는 현재프레임 방향 벡터, 는 이전프레임 방향 벡터, 는 현재프레임 타겟음원 공분산, 은 정규화된 현재프레임 방향 벡터, 은 정규화된 현재프레임 방향 벡터의 한 요소일 수 있다.
빔포밍기(200)는 이전프레임 빔포밍 가중치(P_BFW), 현재프레임 입력결과들(C_XS), 이전프레임 분산(P_V)에 따라 현재프레임 빔포밍 분산 추정값을 생성하고, 이전프레임 역 공분산(P_IBC), 현재프레임 입력결과들(C_XS), 현재프레임 빔포밍 분산 추정값에 기초하여 현재프레임 빔포밍 역 공분산(C_IBC)을 생성하고, 현재프레임 빔포밍 역 공분산(C_IBC) 및 현재프레임 방향 벡터(C_HV)에 따라 현재프레임 빔포밍 가중치(C_BFW)를 생성하고, 현재프레임 입력결과들(C_XS) 및 현재프레임 빔포밍 가중치(C_BFW)에 기초하여 현재프레임 출력결과들(C_OR)을 제공할 수 있다.
예를 들어, 빔포밍기(200)는 빔포밍 가중치 생성기(210) 및 출력생성기(220)를 포함할 수 있다. 빔포밍 가중치 생성기(210)는 현재프레임 입력결과들(C_XS), 이전프레임 빔포밍 가중치(P_BFW) 및 이전프레임 분산(P_V)에 따라 현재프레임 빔포밍 분산 추정값을 생성하고, 현재프레임 입력결과들(C_XS), 이전프레임 빔포밍 역 공분산(P_IBC) 및 현재프레임 빔포밍 분산 추정값을 통해 현재프레임 빔포밍 역 공분산(C_IBC)을 생성하고, 현재프레임 빔포밍 역 공분산(C_IBC) 및 현재프레임 방향 벡터(C_HV)에 따라 현재프레임 빔포밍 가중치(C_BFW)를 생성할 수 있다.
현재프레임 빔포밍 분산 추정값은 아래의 [수학식14]와 같이 나타낼 수 있다.
[수학식14]
현재프레임 빔포밍 가중치(C_BFW)는 아래의 [수학식15]과 같이 나타낼 수 있다.
[수학식15]
출력생성기(220)는 현재프레임 입력결과들(C_XS) 및 현재프레임 빔포밍 가중치(C_BFW)에 기초하여 현재프레임 출력결과들(C_OR)을 제공할 수 있다.
출력결과들은 아래의 [수학식16]와 같이 나타낼 수 있다.
[수학식16]
일 실시예에 있어서, 현재프레임 노이즈 공분산(C_NC)은 현재프레임 분산 추정값에 의해 노말라이제이션(Normalization)될 수 있다. 본 발명에 따른 온라인 타겟신호 추출장치(20)는 현재프레임 입력결과들(C_XS)에 상응하는 현재프레임 출력결과들(C_OR)에 따라 결정되는 현재프레임 분산 추정값에 기초하여 현재 프레임 노이즈 공분산을 계산하여 현재프레임 방향 벡터(C_HV)를 생성하고, 현재프레임 빔포밍 가중치(C_BFW)를 업데이트함으로써 타겟음원에 대한 추출성능을 높일 수 있다.
도 10 내지 12는 본 발명의 실시예들에 따른 온라인 타겟신호 추출시스템을 나타내는 도면이고, 도 11은 도 10의 온라인 타겟신호 추출시스템에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이고, 도 12는 도 10의 온라인 타겟신호 추출시스템에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 10 내지 12를 참조하면, 온라인 타겟신호 추출시스템(21)은 방향 벡터 예측기(100) 및 빔포밍기(200)를 포함할 수 있다. 방향 벡터 예측기(100)는 입력신호 공분산 생성기(110), 노이즈 공분산 생성기(120) 및 벡터 생성기(130)를 포함할 수 있다. 방향 벡터 예측기(100)는 이전프레임에 상응하는 이전프레임 입력신호 공분산(P_IC) 및 현재 프레임에 따른 주파수별 현재프레임 입력결과들(C_XS)에 기초하여 생성되는 현재프레임 입력신호 공분산(C_IC)을 생성하고, 이전프레임에 상응하는 이전프레임 노이즈 공분산(P_NC), 현재프레임 입력결과들(C_XS) 및 미리 결정된 마스크를 통해 생성된 현재프레임 분산 추정값에 기초하여 현재프레임 노이즈 공분산(C_NC)를 생성하며, 현재프레임 입력신호 공분산(C_IC), 현재프레임 노이즈 공분산(C_NC) 및 이전프레임 방향 벡터(P_HV)에 기초하여 현재프레임 방향 벡터(C_HV)를 생성할 수 있다.
빔포밍기(200)는 이전프레임 빔포밍 가중치(P_BFW), 현재프레임 입력결과들(C_XS), 이전프레임 분산 및 미리 결정된 마스크에 따라 현재프레임 빔포밍 분산 추정값을 생성하고, 이전프레임 역 공분산(P_IBC), 현재프레임 입력결과들(C_XS) 및 현재프레임 빔포밍 분산 추정값에 따라 결정되는 현재프레임 빔포밍 역 공분산(C_IBC)을 생성하고, 현재프레임 방향 벡터(C_HV) 및 현재프레임 빔포밍 역 공분산(C_IBC)에 따라 현재프레임 빔포밍 가중치(C_BFW)를 생성하고, 현재프레임 입력결과들(C_XS) 및 현재프레임 빔포밍 가중치(C_BFW)에 기초하여 현재프레임 출력결과들(C_OR)을 제공할 수 있다.
본 발명에 따른 온라인 타겟신호 추출시스템(21)은 도 7 내지 도 9에서 설명되는 [수학식11] 및 [수학식13] 내지 [수학식15]의 내용이 동일하게 적용될 수 있다.
일 실시예에 있어서, 현재프레임 노이즈 공분산(C_NC)은 이전프레임 노이즈 공분산(P_NC), 현재프레임 입력결과들(C_XS) 및 미리 결정된 마스크를 통해 생성된 현재프레임 분산 추정값에 기초하여 생성될 수 있다. 예를 들어, 현재프레임 노이즈 공분산(C_NC)은 아래의 [수학식17]와 같이 나타낼 수 있다.
[수학식17]
여기서, 은 현재프레임 노이즈 공분산, 는 마스크, 은 망각 인자, 은 이전프레임 노이즈 공분산, 는 현재프레임 분산 추정값, 는 현재프레임 입력결과들의 요소, 는 제3 상수값일 수 있다.
일 실시예에 있어서, 현재프레임 빔포밍 분산 추정값은 이전프레임 빔포밍 가중치(P_BFW), 현재프레임 입력결과들(C_XS), 이전프레임 분산(P_V) 및 미리 결정된 마스크에 기초하여 생성될 수 있다. 예를 들어, 현재프레임 빔포밍 분산 추정값은 아래의 [수학식 18]와 같이 나타낼 수 있다.
[수학식 18]
여기서 는 현재 프레임 추정 출력결과들, 는 이전프레임 빔포밍 가중치, 는 현재프레임 입력결과들, 는 마스크,는 현재프레임 빔포밍 분산 추정값, 는 이전프레임 분산, 는 가중치, 는 제4 상수값일 수 있다.
도 13 내지 16은 본 발명의 실시예들에 따른 타겟신호 추출장치의 예들을 나타내는 도면이고, 도 14는 도 13의 타겟신호 추출장치에 포함되는 반향 제거기의 일 예를 나타내는 도면이고, 도 15는 도 13의 타겟신호 추출장치에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이고, 도 16은 도 13의 타겟신호 추출장치에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 13 내지 16을 참조하면, 본 발명의 실시예에 따른 타겟신호 추출장치(30)는 반향 제거기(300), 방향 벡터 예측기(100) 및 빔포밍기(200)를 포함할 수 있다. 반향 제거기(300)는 가중된 공분산 생성기(310), 가중된 상관 벡터 생성기(320), 반향제거 필터 생성기(330) 및 반향 제거된 신호 생성기(340)을 포함할 수 있다. 반향 제거기(300)은 시간에 따른 주파수별 과거 입력결과들(XPS) 및 반향 제거된 입력결과들(DS)에 상응하는 출력결과들(OR)에 따라 결정되는 분산에 기초하여 가중된 공분산(WC)를 생성하고, 시간에 따른 주파수별 입력결과들(XS), 과거 입력결과들(XPS) 및 반향 제거된 입력결과들(DS)에 상응하는 출력결과들(OR)에 따라 결정되는 분산에 기초하여 가중된 상관 벡터(WV)를 생성하며, 가중된 공분산(WC) 및 가중된 상관 벡터(WV)에 기초하여 반향 제거 필터(DF)를 생성할 수 있으며, 입력결과들(XS), 과거 입력결과들(XPS) 및 반향 제거 필터(DF)에 기초하여 반향 제거된 입력결과들(DS)를 생성할 수 있다.
예를 들어, 가중된 공분산 생성기(310)는 과거 입력결과들(XPS) 및 분산에 따라 가중된 공분산(WC)를 생성할 수 있다.
가중된 공분산(WC)은 아래의 [수학식19]과 같이 나타낼 수 있다.
[수학식19]
또한, 가중된 상관 벡터 생성기(320)는 시간에 따른 주파수별 입력결과들(XS), 과거 입력결과들 및 분산에 따라 가중된 상관 벡터(WV)를 생성할 수 있다.
가중된 상관 벡터(WV)는 아래의 [수학식20]와 같이 나타낼 수 있다.
[수학식20]
또한, 반향제거 필터 생성기(330)는 가중된 공분산(WC) 및 가중된 상관 벡터(WV)에 기초하여 반향 제거 필터(DF)를 생성할 수 있다.
반향 제거 필터(DF)는 아래의 [수학식21]와 같이 나타낼 수 있다.
[수학식21]
또한, 반향 제거된 신호 생성기(340)은 입력결과들(XS), 과거 입력결과들(XPS) 및 반향 제거 필터(DF)에 기초하여 반향 제거된 입력결과들(DS)을 생성할 수 있다.
반향 제거된 입력결과들(DS)은 아래의 [수학식22]와 같이 나타낼 수 있다.
[수학식22]
방향 벡터 예측기(100)는 반향 제거된 입력결과들(DS)에 따라 입력신호 공분산(IC)을 생성하고, 입력결과들(XS)에 상응하는 출력결과들(OR)에 따라 결정되는 분산에 기초하여 노이즈 공분산(NC)을 생성하며, 입력신호 공분산(IC) 및 노이즈 공분산(NC)에 기초하여 방향 벡터(HV)를 생성할 수 있다.
예를 들어, 입력신호 공분산 생성기(110)는 반향 제거된 입력 결과들(DS)에 따라 입력신호 공분산(IC)를 생성할 수 있다.
입력신호 공분산(IC)은 아래의 [수학식23]와 같이 나타낼 수 있다.
[수학식23]
또한, 노이즈 공분산 생성기(120)는 반향 제거된 입력결과들(DS)에 상응하는 출력결과들(OR)에 따라 결정되는 분산에 기초하여 노이즈 공분산(NC)을 생성할 수 있다.
노이즈 공분산(NC)은 아래의 [수학식24]와 같이 나타낼 수 있다.
[수학식24]
또한, 벡터 생성기(130)는 입력 신호 공분산(IC) 및 노이즈 공분산(NC)에 기초하여 방향 벡터(HV)를 생성할 수 있다. 예를 들어, 방향 벡터(HV)는 도 1 내지 도3에서 설명되는 [수학식3]의 내용이 동일하게 적용될 수 있다.
빔포밍기(200)는 반향 제거된 입력결과들(DS), 분산에 따라 결정되는 빔포밍 공분산(BS) 및 방향 벡터(HV)에 따라 빔포밍 가중치(BFW)를 생성하고, 반향 제거된 입력결과들(DS) 및 빔포밍 가중치(BFW)에 기초하여 출력결과들(OR)을 제공할 수 있다.
예를 들어, 빔포밍기(200)는 빔포밍 가중치 생성기(210) 및 출력생성기(220)를 포함할 수 있다. 빔포밍 가중치 생성기(210)는 반향 제거된 입력결과들(DS), 분산에 따라 결정되는 빔포밍 공분산(BC) 및 방향 벡터(HV)에 따라 빔포밍 가중치(BFW)를 생성할 수 있다.
빔포밍 공분산(BC)은 아래의 [수학식25]과 같이 나타낼 수 있다.
[수학식25]
빔포밍 가중치(BFW)는 아래의 [수학식26]과 같이 나타낼 수 있다.
[수학식26]
출력생성기(220)는 반향 제거된 입력결과들(DS) 및 빔포밍 가중치(BFW)에 기초하여 출력결과들(OR)을 제공할 수 있다.
출력결과들(OR)은 아래의 [수학식27]과 같이 나타낼 수 있다.
[수학식27]
일 실시예에 있어서, 가중된 공분산(WC), 가중된 상관 벡터(WV) 및 노이즈 공분산(NC) 및 빔포밍 공분산(BC)은 출력결과들(OR)에 기초하여 결정될 수 있다. 예를 들어, 가중된 공분산(WC) 및 가중된 상관 벡터(WV)에서 사용된 분산은 도 1 내지 도 3에서 설명되는 [수학식7]의 내용이 동일하게 적용될 수 있다.
일 실시예에 있어서, 가중된 공분산(WC) 및 가중된 상관 벡터(WV)의 초기값은 입력결과들(XS)에 기초하여 결정될 수 있다. 예를 들어, 가중된 공분산(WC) 및 가중된 상관 벡터(WV)에서 사용되는 분산의 초기값은 아래의 [수학식28]과 같이 나타낼 수 있다.
[수학식28]
일 실시예에 있어서, 가중된 공분산(WC) 및 가중된 상관 벡터(WV)는 분산 및 제2 상수값 중 큰 값에 따라 결정될 수 있다.
일 실시예에 있어서, 노이즈 공분산(NC) 및 빔포밍 공분산(BC)의 초기값은 반향 제거된 입력결과들(DS)에 기초하여 결정될 수 있다. 예를 들어, 노이즈 공분산(NC) 및 빔포밍 공분산(BC)에서 사용되는 분산의 초기값은 아래의 [수학식29]와 같이 나타낼 수 있다.
[수학식29]
일 실시예에 있어서, 노이즈 공분산(NC)은 분산 및 제1 상수값 중 큰 값에 따라 결정될 수 있다. 또한, 노이즈 공분산(NC)은 분산 및 제1 상수값 중 큰 값에 따라 노말라이제이션(Normalization)될 수 있다.
일 실시예에 있어서, 빔포밍 공분산(BC)은 분산 및 제2 상수값 중 큰 값에 따라 결정될 수 있다.
일 실시예에 있어서, 타겟신호 추출장치(30)는 반향 제거 필터(DF) 및 빔포밍 가중치(BFW)가 수렴할 때까지 반향 제거기(300) 및 방향 벡터 예측기(100) 및 빔포밍기(200)를 반복적으로 동작시킬 수 있다. 타겟신호 추출장치(30)는 반향 제거기(300)을 통해서 반향 제거된 입력결과들(DS)를 생성하고, 방향 벡터 예측기(100)를 통해서 방향 벡터(HV)를 생성한 후, 빔포밍기(200)를 통해서 빔포밍 가중치(BFW)를 생성하는 동작을 반복할 수 있다. 본 발명에 따른 타겟신호 추출장치(30)는 입력결과들(XS)에 상응하는 출력결과들(OR)에 따라 결정되는 분산에 기초하여 가중된 공분산(WC) 및 가중된 상관 벡터(WV)를 통해 반향제거 필터(DF)를 계산하여 반향 제거된 입력결과들(DS)를 생성하고, 노이즈 공분산(NC)을 계산하여 방향 벡터(HV)를 생성하고, 빔포밍 가중치(BFW)를 업데이트함으로써 타겟음원에 대한 추출성능을 높일 수 있다.
도 17 내지 19는 본 발명의 실시예들에 따른 타겟신호 추출시스템의 예들을 나타내는 도면이고, 도 18은 도 17의 타겟신호 추출시스템에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이고, 도 19는 도 17의 타겟신호 추출시스템에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 17 내지 19를 참조하면, 본 발명의 실시예에 따른 타겟신호 추출시스템(31)은 반향 제거기(300), 방향벡터 예측기(100) 및 빔포밍기(200)를 포함할 수 있다. 반향 제거기(300)는 가중된 공분산 생성기(310), 가중된 상관 벡터 생성기(320), 반향제거 필터 생성기(330) 및 반향 제거된 신호 생성기(340)를 포함할 수 있다. 반향 제거기(300)는 시간에 따른 주파수별 과거 입력결과들(XPS) 및 반향 제거된 입력결과들(DS)에 상응하는 출력결과들(OR)에 따라 결정되는 분산에 기초하여 가중된 공분산(WC)를 생성하고, 시간에 따른 주파수별 입력결과들(XS), 과거 입력결과들(XPS) 및 반향 제거된 입력결과들(DS)에 상응하는 출력결과들(OR)에 따라 결정되는 분산에 기초하여 가중된 상관 벡터(WV)를 생성하며, 가중된 공분산(WC) 및 가중된 상관 벡터(WV)에 기초하여 반향 제거 필터(DF)를 생성할 수 있으며, 입력결과들(XS), 과거 입력결과들(XPS) 및 반향 제거 필터(DF)에 기초하여 반향 제거된 입력결과들(DS)을 생성할 수 있다. 방향 벡터 예측기(100)는 시간에 따른 주파수별 반향 제거된 입력결과들(DS)에 따라 입력신호 공분산(IC)을 생성하고, 반향 제거된 입력결과들(DS)에 상응하는 출력결과들(OR)에 따라 결정되는 분산 및 미리 결정된 마스크(MSK)에 기초하여 노이즈 공분산(NC)을 생성하며, 입력신호 공분산(IC) 및 노이즈 공분산(NC)에 기초하여 방향 벡터(HV)를 생성할 수 있다. 빔포밍기(200)는 반향 제거된 입력결과들(DS) 및 분산에 따라 결정되는 빔포밍 공분산(BC) 및 방향 벡터(HV)에 따라 빔포밍 가중치(BFW)를 생성하고, 반향 제거된 입력결과들(DS) 및 빔포밍 가중치(BFW)에 기초하여 출력결과들(OR)을 제공할 수 있다.
본 발명에 따른 타겟신호 추출시스템(31)은 도 13 내지 16에서 설명되는 [수학식19] 내지 [수학식23] 및 [수학식25] 내지 [수학식27]의 내용이 동일하게 적용될 수 있다.
일 실시예에 있어서, 노이즈 공분산(NC) 및 빔포밍 공분산(BC)의 초기값은 반향 제거된 입력결과들(DS) 및 마스크(MSK)의 곱에 따라 결정될 수 있다. 예를 들어, 노이즈 공분산(NC) 및 빔포밍 공분산(BC)에서 사용되는 분산의 초기값은 아래의 [수학식30]과 같이 나타낼 수 있다.
[수학식30]
일 실시예에 있어서, 노이즈 공분산(NC)의 반향 제거된 입력결과들(DS)은 반향 제거된 입력결과들(DS)과 마스크(MSK)의 곱으로 갱신될 수 있다. 예를 들어, 노이즈 공분산(NC)에서 사용되는 반향 제거된 입력결과들(DS)은 아래의 [수학식31]와 같이 갱신될 수 있다.
[수학식31]
일 실시예에 있어서 마스크(MSK)는 프레임 인덱스 및 주파수 인덱스 별로 계산될 수 있다. 예를 들어, 신경망(Neural network) 혹은 분산도 (Diffuseness)에 기반하여 프레임 인덱스 및 주파수 인덱스 별 마스크가 계산될 수 있다.
일 실시예에 있어서, 노이즈 공분산(NC)은 분산 및 제1 상수값 중 큰 값에 따라 결정되고, 노이즈 공분산(NC)은 분산 및 제1 상수값 중 큰 값에 따라 노말라이제이션(Normalization)될 수 있다.
일 실시예에 있어서, 빔포밍 공분산(BC)은 분산 및 제2 상수값 중 큰 값에 따라 결정되고, 타겟신호 추출시스템(31)은 반향 제거 필터(DF) 및 빔포밍 가중치(BFW)가 수렴할 때까지 반향 제거기(300) 및 방향 벡터 예측기(100) 및 빔포밍기(200)를 반복적으로 동작시킬 수 있다.
도 20 내지 23은 본 발명의 실시예들에 따른 온라인 타겟신호 추출장치의 예들을 나타내는 나타내는 도면이고, 도 21은 도 20의 온라인 타겟신호 추출장치에 포함되는 반향 제거기의 일 예를 나타내는 도면이고, 도 22는 도 20의 온라인 타겟신호 추출장치에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이고, 도 23은 도 20의 온라인 타겟신호 추출장치에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 20 내지 23을 참조하면, 본 발명의 실시예에 따른 온라인 타겟신호 추출장치(40)는 반향 제거기(300), 방향 벡터 예측기(100) 및 빔포밍기(200)를 포함할 수 있다. 반향 제거기(300)는 이득 벡터 생성기(350), 가중된 역 공분산 생성기(360), 반향제거 필터 생성기(330) 및 반향제거 신호 생성기(340)를 포함할 수 있다.
반향 제거기(300)는 현재프레임에 상응하는 현재프레임 입력결과들(C_XS), 현재프레임 과거 입력결과들(C_XPS) 및 이전프레임에 상응하는 이전프레임 반향제거 필터(P_DF)에 기초하여 현재프레임 반향제거 출력 추정값(C_EDS)을 생성하고, 이전프레임에 상응하는 이전프레임 분산(P_V) 및 현재프레임 반향제거 출력 추정값(C_EDS)에 기초하여 현재프레임 반향제거 분산 추정값을 생성하고, 이전프레임에 상응하는 이전프레임 가중된 역 공분산(P_IWC), 현재프레임 반향제거 출력 추정값(C_EDS) 및 현재프레임 과거 입력결과들(C_XPS)에 기초하여 현재프레임 이득 벡터(C_GV)를 생성하며, 이전프레임 가중된 역 공분산(P_IWC), 현재프레임 과거 입력결과들(C_XPS) 및 현재프레임 이득 벡터(C_GV)에 기초하여 현재프레임 가중된 역 공분산(C_IWC)를 생성하며, 현재프레임 이득 벡터(C_GV), 현재프레임 과거 입력결과들(C_XPS) 및 이전프레임에 상응하는 이전프레임 반향 제거 필터(P_DF)에 기초하여 현재프레임에 상응하는 현재프레임 반향 제거 필터(C_DF)를 생성하고, 현재프레임 입력결과들(C_XS), 현재프레임 과거 입력결과들(C_XPS) 및 현재프레임 반향 제거 필터(C_DF)에 기초하여 현재프레임 반향 제거된 입력결과들(C_DS)을 생성할 수 있다.
예를 들어, 이득 벡터 생성기(350)는 현재프레임 입력결과들(C_XS) 및 현재프레임 과거 입력결과들(C_XPS) 및 이전프레임 반향 제거 필터(P_DF)에 기초하여 현재프레임 반향제거 출력 추정값(C_EDS)을 생성할 수 있다.
현재프레임 반향제거 출력 추정값(C_EDS)은 아래의 [수학식32]와 같이 나타낼 수 있다.
[수학식32]
또한, 이득 벡터 생성기(350)는 이전프레임 분산(P_V) 및 현재프레임 반향제거 출력 추정값(C_EDS)에 기초하여 현재프레임 반향제거 분산 추정값을 생성할 수 있다.
현재프레임 반향제거 분산 추정값은 아래의 [수학식33]과 같이 나타낼 수 있다.
[수학식33]
또한, 이득 벡터 생성기(350)는 이전프레임 가중된 역 공분산(P_IWC), 현재프레임 과거 입력결과들(C_XPS) 및 현재프레임 분산 추정값에 기초하여 현재프레임 이득 벡터(C_GV)를 생성할 수 있다.
현재프레임 이득 벡터(C_GV)는 아래의 [수학식34]와 같이 나타낼 수 있다.
[수학식34]
가중된 역 공분산 생성기(360)는 이전프레임 가중된 역 공분산(P_IWC), 현재프레임 과거 입력결과들(P_XPS) 및 현재프레임 이득 벡터(C_GV)에 기초하여 현재프레임 가중된 역 공분산(C_IWC)를 생성할 수 있다.
현재프레임 가중된 역 공분산(C_IWC)은 아래의 [수학식35]과 같이 나타낼 수 있다.
[수학식35]
반향제거 필터 생성기(330)는 이전프레임 반향 제거 필터(P_DF), 현재프레임 반향제거 출력 추정값(C_EDS) 및 현재프레임 과거 입력결과들(C_XPS)에 기초하여 현재프레임 반향 제거 필터(C_DF)를 생성할 수 있다.
현재프레임 반향 제거 필터(C_DF)는 아래의 [수학식36]과 같이 나타낼 수 있다.
[수학식36]
반향제거 신호 생성기(340)는 현재프레임 입력결과들(C_XS), 현재프레임 반향 제거 필터(C_DF) 및 현재프레임 과거 입력결과들(C_XPS)에 기초하여 현재프레임 반향 제거된 입력결과들(C_DS)를 생성할 수 있다.
현재프레임 반향 제거된 입력결과들(C_DS)는 아래의 [수학식37]과 같이 나타낼 수 있다.
[수학식37]
방향 벡터 예측기(100)는 이전프레임에 상응하는 이전프레임 입력신호 공분산(P_IC) 및 현재 프레임에 따른 주파수별 현재프레임 반향 제거된 입력결과들(C_DS)에 기초하여 생성되는 현재프레임 입력신호 공분산(C_IC)을 생성하고, 현재프레임 반향 제거된 입력결과들(C_DS) 및 이전프레임 빔포밍 가중치(P_BFW)에 기초하여 현재프레임 분산 추정값을 생성하고, 이전프레임에 상응하는 이전프레임 노이즈 공분산(P_NC) 및 현재프레임 분산 추정값에 기초하여 현재프레임 노이즈 공분산(C_NC)을 생성하며, 현재프레임 입력신호 공분산(C_IC), 현재프레임 노이즈 공분산(C_NC) 및 이전프레임 방향 벡터(P_HV)에 기초하여 현재프레임 방향 벡터(C_HV)를 생성할 수 있다.
예를 들어, 입력신호 공분산 생성기(110)는 이전프레임에 상응하는 이전프레임 입력신호 공분산(P_IC) 및 현재 프레임에 따른 주파수별 현재프레임 반향 제거된 입력결과들(C_DS)에 기초하여 생성되는 현재프레임 입력신호 공분산(C_IC)을 생성할 수 있다.
현재프레임 입력신호 공분산(C_IC)은 아래의 [수학식37]와 같이 나타낼 수 있다.
[수학식37]
여기서, 은 현재프레임 입력신호 공분산,은 이전프레임 입력신호 공분산, 은 망각 인자, l은 프레임 인덱스, k는 주파수 인덱스, 는 현재프레임 반향 제거된 입력결과들일 수 있다.
또한, 노이즈 공분산 생성기(120)는 이전프레임에 상응하는 이전프레임 노이즈 공분산(P_NC) 및 주파수별 현재프레임 반향 제거된 입력결과들(C_DS)과 이전프레임에 입력결과들에 상응하는 이전프레임 빔포밍 가중치(P_BFW)에 따라 생성되는 현재프레임 분산 추정값에 기초하여 현재프레임 노이즈 공분산(C_NC)을 생성할 수 있다.
현재프레임 노이즈 공분산(C_NC)은 아래의 [수학식38]과 같이 나타낼 수 있다.
[수학식38]
여기서, 은 현재프레임 노이즈 공분산, 은 망각 인자, 은 이전프레임 노이즈 공분산, 는 현재프레임 분산 추정값, 는 현재프레임 추정 출력결과들, 는 이전프레임 빔포밍 가중치, 는 현재프레임 반향 제거된 입력결과들, 는 제3 상수값일 수 있다.
또한, 벡터 생성기(130)는 현재프레임 입력신호 공분산(C_IC) 및 현재프레임 노이즈 공분산(C_NC)에 기초하여 현재프레임 방향 벡터(C_HV)를 생성할 수 있으며, 도 7 내지 9에서 설명되는 [수학식13]의 내용이 동일하게 적용될 수 있다.
빔포밍기(200)는 이전프레임 빔포밍 가중치(P_BFW), 현재프레임 반향 제거된 입력결과들(C_DS) 및 이전프레임 분산(P_V)에 따라 현재프레임 빔포밍 분산 추정값을 생성하고, 이전프레임 역 공분산(P_IBC), 현재프레임 반향 제거된 입력결과들(C_DS) 및 현재프레임 빔포밍 분산 추정값에 기초하여 현재프레임 빔포밍 역 공분산(C_IBC)을 생성하고, 현재프레임 빔포밍 역 공분산(C_IBC) 및 현재프레임 방향 벡터(C_HV)에 따라 현재프레임 빔포밍 가중치(C_BFW)를 생성하고, 현재프레임 반향 제거된 입력결과들(C_DS) 및 현재프레임 빔포밍 가중치(C_BFW)에 기초하여 현재프레임 출력결과들(C_OR)을 제공할 수 있다.
예를 들어, 빔포밍기(200)는 빔포밍 가중치 생성기(210) 및 출력생성기(220)를 포함할 수 있다. 빔포밍 가중치 생성기(210)는 현재프레임 반향 제거된 입력결과들(C_DS), 이전프레임 빔포밍 가중치(P_BFW) 및 이전프레임 분산(P_V)에 따라 현재프레임 빔포밍 분산 추정값을 생성하고, 현재프레임 반향 제거된 입력결과들(C_DS) 및 이전프레임 빔포밍 역 공분산(P_IBC) 및 현재프레임 빔포밍 분산 추정값을 통해 현재프레임 빔포밍 역 공분산(C_IBC)을 생성하고, 현재프레임 빔포밍 역 공분산(C_IBC) 및 현재프레임 방향 벡터(C_HV)에 따라 현재프레임 빔포밍 가중치(C_BFW)를 생성할 수 있다.
현재프레임 빔포밍 분산 추정값은 도 7 내지 9에서 설명되는 [수학식14]의 내용이 동일하게 적용될 수 있다.
현재프레임 빔포밍 가중치(C_BFW)는 아래의 [수학식39]과 같이 나타낼 수 있다.
[수학식39]
여기서, 는 현재프레임 빔포밍 가중치, 는 이전프레임 빔포밍 역 공분산, 는 현재프레임 방향 벡터, 는 현재프레임 빔포밍 역 공분산, 는 현재프레임 반향 제거된 입력결과들일 수 있다.
출력생성기(220)는 현재프레임 반향 제거된 입력결과들(C_DS) 및 현재프레임 빔포밍 가중치(C_BFW)에 기초하여 현재프레임 출력결과들(C_OR)을 제공할 수 있다.
출력결과들은 아래의 [수학식40]와 같이 나타낼 수 있다.
[수학식40]
일 실시예에 있어서, 현재프레임 노이즈 공분산(C_NC)은 현재프레임 분산 추정값에 의해 노말라이제이션(Normalization) 될 수 있다. 본 발명에 따른 온라인 타겟신호 추출장치(40)는 현재프레임 입력결과들(C_XS)에 상응하는 현재프레임 출력결과들(C_OR)에 따라 결정되는 현재프레임 분산 추정값에 기초하여 현재프레임 이득 벡터(C_GV)를 생성하고, 현재프레임 반향 제거 필터(C_DF)를 계산하여 현재프레임 반향 제거된 입력결과들(C_DS)을 생성하고, 현재 프레임 노이즈 공분산(C_NC)을 계산하여 현재프레임 방향 벡터(C_HV)를 생성하고, 현재프레임 빔포밍 가중치(C_BFW)를 업데이트함으로써 타겟음원에 대한 추출성능을 높일 수 있다.
도 24 내지 26은 본 발명의 실시예들에 따른 온라인 타겟신호 추출시스템을 나타내는 도면이고, 도 25는 도 24의 온라인 타겟신호 추출시스템에 포함되는 방향 벡터 예측기의 일 예를 나타내는 도면이고, 도 26은 도 24의 온라인 타겟신호 추출시스템에 포함되는 빔포밍기의 일 예를 나타내는 도면이다.
도 20 내지 26을 참조하면, 본 발명의 실시예에 따른 온라인 타겟신호 추출시스템(41)은 반향 제거기(300), 방향 벡터 예측기(100) 및 빔포밍기(200)를 포함할 수 있다. 반향 제거기(300)는 이득 벡터 생성기(350), 가중된 역 공분산 생성기(360), 반향제거 필터 생성기(330) 및 반향제거 신호 생성기(340)를 포함할 수 있다.
반향 제거기(300)는 현재프레임에 상응하는 현재프레임 입력결과들(C_XS), 현재프레임 과거 입력결과들(C_XPS) 및 이전프레임에 상응하는 이전프레임 반향제거 필터(P_DF)에 기초하여 현재프레임 반향제거 출력 추정값(C_EDS)을 생성하고, 이전프레임에 상응하는 이전프레임 분산(P_V) 및 반향제거 출력 추정값(C_EDS)에 기초하여 현재프레임 반향제거 분산 추정값을 생성하고, 이전프레임에 상응하는 이전프레임 가중된 역 공분산(P_IWC), 현재프레임 반향제거 출력 추정값(C_EDS) 및 현재프레임 과거 입력결과들(C_XPS)에 기초하여 현재프레임 이득 벡터(C_GV)를 생성하며, 이전프레임 가중된 역 공분산(P_IWC), 현재프레임 과거 입력결과들(C_XPS) 및 현재프레임 이득 벡터(C_GV)에 기초하여 현재프레임 가중된 역 공분산(C_IWC)을 생성하며, 현재프레임 이득 벡터(C_GV), 현재프레임 과거 입력결과들(C_XPS) 및 이전프레임에 상응하는 이전프레임 반향 제거 필터(P_DF)에 기초하여 현재프레임에 상응하는 현재프레임 반향 제거 필터(C_DF)를 생성하고, 현재프레임 입력결과들(C_XS), 현재프레임 과거 입력결과들(C_XPS) 및 현재프레임 반향 제거 필터(C_DF)에 기초하여 현재프레임 반향 제거된 입력결과들(C_DS)를 생성할 수 있다.
방향 벡터 예측기(100)는 이전프레임에 상응하는 이전프레임 입력신호 공분산(P_IC) 및 현재 프레임에 따른 주파수별 현재프레임 반향 제거된 입력결과들(C_DS)에 기초하여 생성되는 현재프레임 입력신호 공분산(C_IC)을 생성하고, 이전프레임에 상응하는 이전프레임 노이즈 공분산(P_NC), 현재프레임 반향 제거된 입력결과들(C_DS) 및 미리 결정된 마스크를 통해 생성된 현재프레임 분산 추정값에 기초하여 현재프레임 노이즈 공분산(C_NC)을 생성하며, 현재프레임 입력신호 공분산(C_IC), 현재프레임 노이즈 공분산(C_NC) 및 이전프레임 방향 벡터(P_HV)에 기초하여 현재프레임 방향 벡터(C_HV)를 생성할 수 있다.
빔포밍기(200)는 이전프레임 빔포밍 가중치(P_BFW) 및 현재프레임 반향 제거된 입력결과들(C_DS), 이전프레임 분산 및 미리 결정된 마스크에 따라 현재프레임 빔포밍 분산 추정값을 생성하고, 이전프레임 역 공분산(P_IBC), 현재프레임 반향 제거된 입력결과들(C_DS) 및 현재프레임 빔포밍 분산 추정값에 따라 결정되는 현재프레임 빔포밍 역 공분산(C_IBC)을 생성하고, 현재프레임 방향 벡터(C_HV) 및 현재프레임 빔포밍 역 공분산(C_IBC)에 따라 현재프레임 빔포밍 가중치(C_BFW)를 생성하고, 현재프레임 반향 제거된 입력결과들(C_DS) 및 현재프레임 빔포밍 가중치(C_BFW)에 기초하여 현재프레임 출력결과들(C_OR)을 제공할 수 있다.
본 발명에 따른 타겟신호 추출시스템(41)은 도 7내지 9에서 설명되는 [수학식13] 내지 [수학식14] 및 도 20 내지 23에서 설명되는 [수학식32] 내지 [수학식37] 및 [수학식39]의 내용이 동일하게 적용될 수 있다.
일 실시예에 있어서, 현재프레임 노이즈 공분산(C_NC)은 이전프레임 노이즈 공분산(P_NC) 및 현재프레임 반향 제거된 입력결과들(C_DS) 및 미리 결정된 마스크를 통해 생성된 현재프레임 분산 추정값에 기초하여 생성될 수 있다. 예를 들어, 현재프레임 노이즈 공분산(C_NC)은 아래의 [수학식41]와 같이 나타낼 수 있다.
[수학식41]
여기서, 은 현재프레임 노이즈 공분산, 는 마스크, 은 망각 인자, 은 이전프레임 노이즈 공분산, 는 현재프레임 분산 추정값, 는 현재프레임 반향 제거된 입력결과들, 는 제3 상수값일 수 있다.
일 실시예에 있어서, 현재프레임 빔포밍 분산 추정값은 이전프레임 빔포밍 가중치(P_BFW), 현재프레임 반향 제거된 입력결과들(C_DS), 이전프레임 분산(P_V) 및 미리 결정된 마스크에 기초하여 생성될 수 있다. 예를 들어, 현재프레임 빔포밍 분산 추정값은 아래의 [수학식 42]와 같이 나타낼 수 있다.
[수학식 42]
여기서 는 현재 프레임 추정 출력결과들, 는 이전프레임 빔포밍 가중치, 는 현재프레임 반향 제거된 입력결과들, 는 마스크,는 현재프레임 빔포밍 분산 추정값, 는 이전프레임 분산, 는 가중치, 는 제4 상수값일 수 있다.
위에서 언급된 본 발명의 기술적 과제 외에도, 본 발명의 다른 특징 및 이점들이 이하에서 기술되거나, 그러한 기술 및 설명으로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
10: 타겟신호 추출장치
100: 방향 벡터 예측기
200: 빔포밍기 110: 입력신호 공분산 생성기
120: 노이즈 공분산 생성기 130: 벡터 생성기
210: 빔포밍 가중치 생성기 220: 출력생성기
300: 반향 제거기 310: 가중된 공분산 생성기
320: 가중된 상관 벡터 생성기 330: 반향제거 필터 생성기
340: 반향 제거된 신호 생성기 350: 이득 벡터 생성기
360: 가중된 역 공분산 생성기
200: 빔포밍기 110: 입력신호 공분산 생성기
120: 노이즈 공분산 생성기 130: 벡터 생성기
210: 빔포밍 가중치 생성기 220: 출력생성기
300: 반향 제거기 310: 가중된 공분산 생성기
320: 가중된 상관 벡터 생성기 330: 반향제거 필터 생성기
340: 반향 제거된 신호 생성기 350: 이득 벡터 생성기
360: 가중된 역 공분산 생성기
Claims (18)
- 시간에 따른 주파수별 입력결과들에 따라 입력신호 공분산을 생성하고, 상기 입력결과들에 상응하는 출력결과들에 따라 결정되는 분산에 기초하여 노이즈 공분산을 생성하며, 상기 입력신호 공분산 및 상기 노이즈 공분산에 기초하여 방향 벡터를 생성하는 방향 벡터 예측기; 및
상기 분산에 따라 결정되는 빔포밍 공분산 및 상기 방향 벡터에 따라 빔포밍 가중치를 생성하고, 상기 입력결과들 및 상기 빔포밍 가중치에 기초하여 상기 출력결과들을 제공하는 빔포밍기를 포함하는 타겟신호 추출장치. - 제1항에 있어서,
상기 노이즈 공분산 및 빔포밍 공분산의 초기값은 상기 입력결과들에 기초하여 결정되는 것을 특징으로 하는 타겟신호 추출장치. - 제2항에 있어서,
상기 노이즈 공분산은 상기 분산 및 제1 상수값 중 큰 값에 따라 결정되는 것을 특징으로 하는 타겟신호 추출장치. - 제3항에 있어서,
상기 노이즈 공분산은 상기 분산 및 상기 제1 상수값 중 큰 값에 따라 노말라이제이션(Normalization)되는 것을 특징으로 하는 타겟신호 추출장치. - 제4항에 있어서,
상기 빔포밍 공분산은 상기 분산 및 제2 상수값 중 큰 값에 따라 결정되는 것을 특징으로 하는 타겟신호 추출장치. - 제5항에 있어서,
상기 타겟신호 추출장치는 상기 빔포밍 가중치가 수렴할 때까지 상기 방향 벡터 예측기 및 상기 빔포밍기를 반복적으로 동작시키는 것을 특징으로 하는 타겟신호 추출장치. - 시간에 따른 주파수별 입력결과들에 따라 입력신호 공분산을 생성하고, 상기 입력결과들에 상응하는 출력결과들에 따라 결정되는 분산 및 미리 결정된 마스크에 기초하여 노이즈 공분산을 생성하며, 상기 입력신호 공분산 및 상기 노이즈 공분산에 기초하여 방향 벡터를 생성하는 방향 벡터 예측기; 및
상기 분산에 따라 결정되는 빔포밍 공분산 및 상기 방향 벡터에 따라 빔포밍 가중치를 생성하고, 상기 입력결과들 및 상기 빔포밍 가중치에 기초하여 상기 출력결과들을 제공하는 빔포밍기를 포함하는 타겟신호 추출시스템. - 제7항에 있어서,
상기 노이즈 공분산의 초기값은 상기 입력결과들 및 상기 마스크의 곱에 따라 결정되는 것을 특징으로 하는 타겟신호 추출시스템. - 제8항에 있어서,
상기 노이즈 공분산은 상기 분산 및 제1 상수값 중 큰 값에 따라 결정되고,
상기 노이즈 공분산은 상기 분산 및 상기 제1 상수값 중 큰 값에 따라 노말라이제이션(Normalization)되는 것을 특징으로 하는 타겟신호 추출시스템. - 제9항에 있어서,
상기 빔포밍 공분산은 상기 분산 및 제2 상수값 중 큰 값에 따라 결정되고,
상기 타겟신호 추출장치는 상기 빔포밍 가중치가 수렴할 때까지 상기 방향 벡터 예측기 및 상기 빔포밍기를 반복적으로 동작시키는 것을 특징으로 하는 타겟신호 추출시스템. - 이전프레임에 상응하는 이전프레임 입력신호 공분산 및 현재 프레임에 따른 주파수별 현재프레임 입력결과들에 기초하여 생성되는 현재프레임 입력신호 공분산을 생성하고, 상기 현재프레임 입력결과들 및 이전프레임 빔포밍 가중치에 기초하여 현재프레임 분산 추정값을 생성하고, 이전프레임에 상응하는 이전프레임 노이즈 공분산 및 현재프레임 분산 추정값에 기초하여 현재프레임 노이즈 공분산을 생성하며, 현재프레임 입력신호 공분산 및 현재프레임 노이즈 공분산 및 이전프레임 방향 벡터에 기초하여 현재프레임 방향 벡터를 생성하는 방향 벡터 예측기; 및
상기 이전프레임 빔포밍 가중치, 상기 현재프레임 입력결과들, 이전프레임 분산에 따라 현재프레임 빔포밍 분산 추정값을 생성하고, 이전프레임 역 공분산, 상기 현재프레임 입력결과들, 상기 현재프레임 빔포밍 분산 추정값에 기초하여 현재프레임 빔포밍 역 공분산을 생성하고, 상기 현재프레임 빔포밍 역 공분산 및 상기 현재프레임 방향 벡터에 따라 현재프레임 빔포밍 가중치를 생성하고, 상기 현재프레임 입력결과들 및 상기 현재프레임 빔포밍 가중치에 기초하여 현재프레임 출력결과들을 제공하는 빔포밍기를 포함하는 온라인 타겟신호 추출장치. - 제11항에 있어서,
상기 현재프레임 노이즈 공분산은 현재프레임 분산 추정값에 의해 노말라이제이션(Normalization)되는 것을 특징으로 하는 온라인 타겟신호 추출장치. - 이전프레임에 상응하는 이전프레임 입력신호 공분산 및 현재 프레임에 따른 주파수별 현재프레임 입력결과들에 기초하여 생성되는 현재프레임 입력신호 공분산을 생성하고, 상기 이전프레임에 상응하는 이전프레임 노이즈 공분산, 상기 현재프레임 입력결과들 및 미리 결정된 마스크를 통해 생성된 현재프레임 분산 추정값에 기초하여 현재프레임 노이즈 공분산을 생성하며, 상기 현재프레임 입력신호 공분산, 상기 현재프레임 노이즈 공분산 및 이전프레임 방향 벡터에 기초하여 현재프레임 방향 벡터를 생성하는 방향 벡터 예측기; 및
이전프레임 빔포밍 가중치, 상기 현재프레임 입력결과들, 이전프레임 분산 및 상기 미리 결정된 마스크에 따라 현재프레임 빔포밍 분산 추정값을 생성하고, 이전프레임 역 공분산, 상기 현재프레임 입력결과들 및 상기 현재프레임 빔포밍 분산 추정값에 따라 결정되는 현재프레임 빔포밍 역 공분산을 생성하고, 상기 현재프레임 방향 벡터 및 상기 현재프레임 빔포밍 역 공분산에 따라 현재프레임 빔포밍 가중치를 생성하고, 상기 현재프레임 입력결과들 및 상기 현재프레임 빔포밍 가중치에 기초하여 현재프레임 출력결과들을 제공하는 빔포밍기를 포함하는 온라인 타겟신호 추출시스템. - 시간에 따른 주파수별 과거 입력결과들, 입력결과들 및 출력결과들에 기초하여 반향 제거된 입력결과들을 제공하는 반향 제거기;
상기 반향 제거된 입력결과들에 따라 입력신호 공분산을 생성하고, 상기 반향 제거된 입력결과들에 상응하는 출력결과들에 따라 결정되는 분산에 기초하여 노이즈 공분산을 생성하며, 상기 입력신호 공분산 및 상기 노이즈 공분산에 기초하여 방향 벡터를 생성하는 방향 벡터 예측기; 및
상기 분산에 따라 결정되는 빔포밍 공분산 및 상기 방향 벡터에 따라 빔포밍 가중치를 생성하고, 상기 반향 제거된 입력결과들 및 상기 빔포밍 가중치에 기초하여 상기 출력결과들을 제공하는 빔포밍기를 포함하는 타겟신호 추출장치. - 제14항에 있어서,
상기 반향 제거기는,
시간에 따른 주파수별 상기 과거 입력결과들 및 상기 반향 제거된 입력결과들에 상응하는 상기 출력결과들에 따라 결정되는 분산에 기초하여 가중된 공분산을 제공하는 가중된 공분산 생성기;
상기 시간에 따른 주파수별 상기 입력결과들 및 상기 과거 입력결과들 및 상기 반향 제거된 입력결과들에 상응하는 상기 출력결과들에 따라 결정되는 분산에 기초하여 가중된 상관 벡터를 제공하는 가중된 상관 벡터 생성기;
상기 가중된 공분산 및 상기 가중된 상관 벡터에 기초하여 반향 제거 필터를 생성하는 반향제거 필터 생성기; 및
상기 입력결과들 및 상기 과거 입력결과들 및 상기 반향 제거 필터에 기초하여 상기 반향 제거된 입력결과들을 생성하는 반향 제거된 신호 생성기를 포함하는 것을 특징으로 하는 타겟신호 추출장치. - 시간에 따른 주파수별 과거 입력결과들, 입력결과들 및 출력결과들에 기초하여 반향 제거된 입력결과들을 제공하는 반향 제거기;
상기 반향 제거된 입력결과들에 따라 입력신호 공분산을 생성하고, 상기 반향 제거된 입력결과들에 상응하는 출력결과들에 따라 결정되는 분산 및 미리 결정된 마스크에 기초하여 노이즈 공분산을 생성하며, 상기 입력신호 공분산 및 노이즈 공분산에 기초하여 방향 벡터를 생성하는 방향 벡터 예측기; 및
상기 반향 제거된 입력결과들 및 분산에 따라 결정되는 빔포밍 공분산 및 상기 방향 벡터에 따라 빔포밍 가중치를 생성하고, 상기 반향 제거된 입력결과들 및 상기 빔포밍 가중치에 기초하여 출력결과들을 제공하는 빔포밍기를 포함하는 타겟신호 추출 시스템. - 현재프레임에 상응하는 현재프레임 입력결과들, 현재프레임 과거 입력결과들에 기초하여 반향 제거된 입력결과들을 생성하는 반향 제거기;
이전프레임에 상응하는 이전프레임 입력신호 공분산 및 현재프레임의 상기 반향 제거된 입력결과들에 기초하여 생성되는 현재프레임 입력신호 공분산을 생성하고, 현재프레임의 상기 반향 제거된 입력결과들 및 이전프레임 빔포밍 가중치에 기초하여 현재프레임 분산 추정값을 생성하고, 상기 이전프레임에 상응하는 이전프레임 노이즈 공분산 및 현재프레임 분산 추정값에 기초하여 현재프레임 노이즈 공분산을 생성하며, 상기 현재프레임 입력신호 공분산, 상기 현재프레임 노이즈 공분산 및 이전프레임 방향 벡터에 기초하여 현재프레임 방향 벡터를 생성하는 방향 벡터 예측기; 및
이전프레임 빔포밍 가중치, 현재프레임의 상기 반향 제거된 입력결과들 및 이전프레임 분산에 따라 현재프레임 빔포밍 분산 추정값을 생성하고, 이전프레임 역 공분산, 현재프레임의 상기 반향 제거된 입력결과들 및 현재프레임 빔포밍 분산 추정값에 기초하여 현재프레임 빔포밍 역 공분산을 생성하고, 상기 현재프레임 빔포밍 역 공분산 및 상기 현재프레임 방향 벡터에 따라 현재프레임 빔포밍 가중치를 생성하고, 현재프레임의 상기 반향 제거된 입력결과들 및 현재프레임 빔포밍 가중치에 기초하여 현재프레임 출력결과들을 제공하는 빔포밍기를 포함하는 온라인 타겟신호 추출장치. - 제17항에 있어서,
상기 온라인 타겟신호 추출장치는,
상기 방향 벡터 예측기 및 상기 빔포밍기에 미리 결정된 마스크를 추가하여 상기 현재프레임 출력결과들을 제공하는 것을 특징으로 하는 온라인 타겟신호 추출장치.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200058882A KR20210142268A (ko) | 2020-05-18 | 2020-05-18 | 강인음성인식을 위한 방향벡터 추정을 겸한 온라인 우도최대화를 이용한 빔포밍 방법 및 그 장치 |
US17/921,074 US20230178089A1 (en) | 2020-05-18 | 2021-05-07 | Beamforming method using online likelihood maximization combined with steering vector estimation for robust speech recognition, and apparatus therefor |
PCT/KR2021/005759 WO2021235750A1 (ko) | 2020-05-18 | 2021-05-07 | 강인음성인식을 위한 방향벡터 추정을 겸한 온라인 우도최대화를 이용한 빔포밍 방법 및 그 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200058882A KR20210142268A (ko) | 2020-05-18 | 2020-05-18 | 강인음성인식을 위한 방향벡터 추정을 겸한 온라인 우도최대화를 이용한 빔포밍 방법 및 그 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20210142268A true KR20210142268A (ko) | 2021-11-25 |
Family
ID=78708776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200058882A KR20210142268A (ko) | 2020-05-18 | 2020-05-18 | 강인음성인식을 위한 방향벡터 추정을 겸한 온라인 우도최대화를 이용한 빔포밍 방법 및 그 장치 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230178089A1 (ko) |
KR (1) | KR20210142268A (ko) |
WO (1) | WO2021235750A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024014797A1 (ko) * | 2022-07-14 | 2024-01-18 | 서강대학교산학협력단 | 강인한 음성인식을 위한 타겟 마스크 및 독립성분분석 기반의 실시간 빔포밍 및 방향 벡터 추정 방법 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101133308B1 (ko) | 2011-02-14 | 2012-04-04 | 신두식 | 에코제거 기능을 갖는 마이크로폰 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8175291B2 (en) * | 2007-12-19 | 2012-05-08 | Qualcomm Incorporated | Systems, methods, and apparatus for multi-microphone based speech enhancement |
KR102048370B1 (ko) * | 2017-12-19 | 2019-11-25 | 서강대학교 산학협력단 | 우도 최대화를 이용한 빔포밍 방법 |
KR102236471B1 (ko) * | 2018-01-26 | 2021-04-05 | 서강대학교 산학협력단 | 재귀적 최소 제곱 기법을 이용한 온라인 cgmm에 기반한 방향 벡터 추정을 이용한 음원 방향 추정 방법 |
KR102076760B1 (ko) * | 2018-09-19 | 2020-02-12 | 한양대학교 산학협력단 | 다채널 마이크를 이용한 칼만필터 기반의 다채널 입출력 비선형 음향학적 반향 제거 방법 |
-
2020
- 2020-05-18 KR KR1020200058882A patent/KR20210142268A/ko not_active Application Discontinuation
-
2021
- 2021-05-07 WO PCT/KR2021/005759 patent/WO2021235750A1/ko active Application Filing
- 2021-05-07 US US17/921,074 patent/US20230178089A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101133308B1 (ko) | 2011-02-14 | 2012-04-04 | 신두식 | 에코제거 기능을 갖는 마이크로폰 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024014797A1 (ko) * | 2022-07-14 | 2024-01-18 | 서강대학교산학협력단 | 강인한 음성인식을 위한 타겟 마스크 및 독립성분분석 기반의 실시간 빔포밍 및 방향 벡터 추정 방법 |
Also Published As
Publication number | Publication date |
---|---|
US20230178089A1 (en) | 2023-06-08 |
WO2021235750A1 (ko) | 2021-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109686381B (zh) | 用于信号增强的信号处理器和相关方法 | |
EP3542547B1 (en) | Adaptive beamforming | |
EP2237271B1 (en) | Method for determining a signal component for reducing noise in an input signal | |
JP5678023B2 (ja) | 高度に相関する混合のための強調ブラインド信号源分離アルゴリズム | |
EP2238592B1 (en) | Method for reducing noise in an input signal of a hearing device as well as a hearing device | |
EP2308044B1 (en) | Audio processing | |
EP2439958B1 (en) | A method of determining parameters in an adaptive audio processing algorithm and an audio processing system | |
EP2675073B1 (en) | Adaptive equalizer, acoustic echo canceller device, and active noise control device | |
Rombouts et al. | Acoustic feedback cancellation for long acoustic paths using a nonstationary source model | |
JP4689269B2 (ja) | 静的スペクトルパワー依存型音響強調システム | |
US11373667B2 (en) | Real-time single-channel speech enhancement in noisy and time-varying environments | |
KR20190091061A (ko) | 재귀적 최소 제곱 기법을 이용한 온라인 cgmm에 기반한 방향 벡터 추정을 이용한 음원 방향 추정 방법 | |
KR20100003530A (ko) | 전자기기에서 음성 신호의 잡음 제거 장치 및 방법 | |
Strasser et al. | Sub-band feedback cancellation with variable step sizes for music signals in hearing aids | |
KR20210142268A (ko) | 강인음성인식을 위한 방향벡터 추정을 겸한 온라인 우도최대화를 이용한 빔포밍 방법 및 그 장치 | |
Lee et al. | Sparsity promoting LMS for adaptive feedback cancellation | |
US20230060081A1 (en) | Signal processing device, signal processing method, and program | |
Strasser et al. | Correlation detection for adaptive feedback cancellation in hearing aids | |
Gupta et al. | Analysis of optimized spectral subtraction method for single channel speech enhancement | |
Schmid et al. | An expectation-maximization algorithm for multichannel adaptive speech dereverberation in the frequency-domain | |
EP3225037B1 (en) | Method and apparatus for generating a directional sound signal from first and second sound signals | |
Rombouts et al. | Generalized sidelobe canceller based combined acoustic feedback-and noise cancellation | |
US20100272274A1 (en) | Methods and systems for robust approximations of impulse reponses in multichannel audio-communication systems | |
US10692514B2 (en) | Single channel noise reduction | |
Braun et al. | Low complexity online convolutional beamforming |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal |