KR20190073852A - 우도 최대화를 이용한 빔포밍 방법 - Google Patents
우도 최대화를 이용한 빔포밍 방법 Download PDFInfo
- Publication number
- KR20190073852A KR20190073852A KR1020170175057A KR20170175057A KR20190073852A KR 20190073852 A KR20190073852 A KR 20190073852A KR 1020170175057 A KR1020170175057 A KR 1020170175057A KR 20170175057 A KR20170175057 A KR 20170175057A KR 20190073852 A KR20190073852 A KR 20190073852A
- Authority
- KR
- South Korea
- Prior art keywords
- filter
- beamforming
- probability density
- density function
- likelihood
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
Abstract
본 발명은 우도 최대화를 이용한 빔포밍 방법에 관한 것이다. 상기 빔포밍 방법은, (a) 시간 프레임 n 및 주파수 k 에서의 잡음이 섞인 입력 신호(Xn,k)를 수신하는 단계; (b) 입력 신호에서 잡음을 제거한 목표 신호(Yn,k)가 시간-주파수 영역에서 평균이 0인 complex generalized Gaussian 분포 또는 complex gamma distribution 을 따른다고 가정하여, 상기 목표 신호(Yn,k)에 대한 확률 밀도 함수를 결정하는 단계; (c) 상기 확률 밀도 함수에 대한 로그 우도를 최대화시키도록 상기 목표 신호의 분산(λn,k)을 추정하는 단계; (d) 상기 확률 밀도 함수에 대한 로그 우도를 최대화시키도록 상기 비용함수를 최대화하는 필터(wk)를 추정하는 단계; (e) 상기 필터(wk)가 수렴될 때까지 상기 (c) 단계와 (d) 단계를 반복적으로 추정하여, 최종적으로 필터(wk)를 얻는 단계; 를 구비한다.
Description
본 발명은 우도 최대화를 이용한 빔포밍 방법에 관한 것으로서, 더욱 구체적으로는 잡음에 의해 왜곡이 발생하는 음향 신호들에 대하여 다중 마이크로폰을 이용한 빔포밍 출력 신호를 complex generalized Gaussian 분포 또는 complex Gamma distribution 을 따르는 것으로 가정하고 확률밀도함수의 로그 우도가 최대화되는 필터를 추정하는 빔포밍 방법에 관한 것이다.
일반적인 실내 환경에서 녹음된 음향 신호는 잡음에 의해서 왜곡이 발생하여 음질이 저하되거나 음성인식의 성능이 떨어지게 된다. 이러한 문제를 극복하기 위해 다중 마이크로폰을 이용한 빔포밍 출력 신호를 최소화 시키는 방향으로 필터를 추정하는 기법을 사용하여 잡음을 제거해오고 있다.
이러한 필터 추정 기법 중 하나가 Minimum Variance Distortionless Response (MVDR) 빔포밍 알고리즘이다. 이하, MVDR 빔포밍 알고리즘에 대하여 개략적으로 설명한다.
단구간 푸리에 변환(Short-time Fourier Transform)을 통해 시간-주파수 영역에서 M개의 마이크로폰으로 취득된 입력 신호(X)는 다음과 같이 표현할 수 있다.
여기서 Xn,k, Sn,k, Nn,k, Hk 는 각각 시간프레임 n, 주파수 k에서 마이크로폰 입력 신호로 구성된 M차원 벡터, 음원 신호, 잡음 신호, 그리고 각 음성과 잡음 신호별 적용되는 공간필터로 이루어진 M × N 차원 행렬을 나타낸다. Hk i는 음원으로부터 마이크로폰까지의 공간 필터를 나타낸다.
음질 또는 음성인식 성능이 떨어지는데 주된 영향을 미치는 잡음 성분을 제거하기 위해서 입력 신호에서 잡음을 제거한 목표 신호(Yn,k)는 다음과 같이 나타낼 수 있다.
여기서, wk는 비용함수를 최대화하는 필터이며, ak는 방향 벡터이며, 위첨자 H는 행렬의 hermitian을 나타낸다.
Lk, d, c, Fs 를 각각 총 주파수 빈의 개수, 음원과 마이크 사이의 거리, 소리의 속도, 샘플링 주파수라 하면 방향 벡터(steering vector ; ak)는 수학식 4와 같이 나타낼 수 있다. 상기 Lk는 이산푸리에변환(discrete Fourier transform)의 DFT 포인트수를 나타낸다.
Lagrange multiplier를 이용하여 조건을 만족하는 비용함수는 다음과 같다.
이 때, 비용함수를 최대화 하는 필터(wk)는 아래와 같다. 여기서, Rk는 프레임 n, 주파수 k에서의 입력신호 Xn,k 에 대한 공분산 행렬을 나타내며, Rk N은 입력신호의 잡음성분인 Nn,k 에 대한 공분산 행렬을 나타낸다.
전술한 MVDR 알고리즘은 목표 음성이 없고 잡음만 존재할 때는 잡음 신호(Nn,k)를 추정이 가능하지만, 목표 음성이 존재하는 구간에서는 잡음 신호를 정확히 추정하기 힘들다.
본 발명에서는 기존의 빔포밍 출력 신호를 최소화 시키는 필터를 추정하는 대신 빔포밍 출력 신호를 complex generalized Gaussian 분포를 따른다고 가정하고 이 확률밀도함수의 로그 우도가 최대화되는 필터를 추정하는 알고리즘을 제안한다.
전술한 문제점을 해결하기 위한 본 발명의 목적은 빔포밍 출력 신호를 complex generalized Gaussian 분포를 따른다고 가정하고 이 확률밀도함수의 로그 우도가 최대화되는 필터를 추정하는 빔포밍 방법을 제공하는 것이다.
전술한 기술적 과제를 달성하기 위한 본 발명의 특징에 따른 우도 최대화를 이용한 빔포밍 방법은, (a) 시간 프레임 n 및 주파수 k 에서의 잡음이 섞인 입력 신호(Xn,k)를 수신하는 단계; (b) 입력 신호에서 잡음을 제거한 목표 신호(Yn,k)가 시간-주파수 영역에서 평균이 0인 complex generalized Gaussian 분포 또는 complex Gamma distibution을 따른다고 가정하여, 상기 목표 신호(Yn,k)에 대한 확률 밀도 함수()를 결정하는 단계; (c) 상기 확률 밀도 함수에 대한 로그 우도를 최대화시키도록 상기 목표 신호의 분산(λn,k)을 추정하는 단계; (d) 상기 확률 밀도 함수에 대한 로그 우도를 최대화시키도록 상기 비용함수를 최대화하는 필터(wk)를 추정하는 단계; (e) 상기 필터(wk)가 수렴될 때가지 상기 (c) 단계와 (d) 단계를 반복적으로 추정하여, 최종적으로 필터(wk)를 얻는 단계; 를 구비한다.
전술한 특징에 따른 우도 최대화를 이용한 빔포밍 방법에 있어서, 상기 필터(wk)는 아래의 수학식에 따라 입력 신호(Xn,k)로부터 목표 신호(Yn,k)를 얻기 위한 필터인 것이 바람직하다.
여기서, α는 가 확률밀도함수가 되도록 하는 상수이며, 양수 c 는 가우시안 분포의 Shape 파라미터로서, c = 1 인 경우 complex Gaussian 분포를 나타내고 c < 1 인 경우 가우시안 분포보다 sparse한 분포를 나타내고 c > 1 인 경우 가우시안 분포보다 덜 sparse 한 분포를 나타낸다.
여기서, α는 │α│> 0 인 복소수 상수이며, β는 양의 실수이다.
전술한 특징에 따른 우도 최대화를 이용한 빔포밍 방법에 있어서, 상기 (c) 단계 및 (d) 단계에서 (여기서, ak 는 방향 벡터임)의 제한 조건을 만족하는 로그 우도를 최대화시켜, 상기 필터와 분산을 추정하는 것이 바람직하다.
본 발명에 따른 빔포밍 방법은 목표 신호인 잡음이 제거된 음성 신호가 complex generalized Gaussian 분포를 따른다고 가정하여 해당 분포의 로그 우도가 최대화되도록 필터와 목표 신호에 대한 분산을 추정한다.
따라서, 본 발명에 따른 빔포밍 방법은 종래의 다른 빔포밍 방법들에 비하여 단어 오 인식률이 낮다.
도 1은 본 발명의 바람직한 실시예에 따른 우도 최대화를 이용한 빔포밍 방법을 도시한 흐름도이다.
도 2는 본 발명의 바람직한 실시예에 따른 우도 최대화를 이용한 빔포밍 방법 및 종래의 방법들을 이용하여 단어 오 인식율을 측정한 결과표를 도시한 도표이다.
도 2는 본 발명의 바람직한 실시예에 따른 우도 최대화를 이용한 빔포밍 방법 및 종래의 방법들을 이용하여 단어 오 인식율을 측정한 결과표를 도시한 도표이다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 따른 우도 최대화를 이용한 빔포밍 방법에 대하여 구체적으로 설명한다.
도 1은 본 발명의 바람직한 실시예에 따른 우도 최대화를 이용한 빔포밍 방법을 도시한 흐름도이다.
전술한 MVDR 알고리즘은 목표 음성이 없고 잡음만 존재할 때는 잡음 신호를 추정이 가능하지만, 목표 음성이 존재하는 구간에서는 잡음 신호를 정확히 추정하기 힘들다. 따라서, 도 1을 참조하면, 본 발명에 따른 빔포밍 방법은 잡음이 섞인 신호가 입력되면(단계 100), Minimum Power Distortionless Response (MPDR) 빔포밍 알고리즘을 이용하여 잡음 신호의 출력 파워를 최소화 하는 대신 입력 신호의 출력의 파워를 최소화하도록 비용함수(Jk)를 수학식 7과 같이 설정한다(단계 110).
여기서 Ln 은 전체 프레임의 개수를 나타낸다.
MVDR과 같은 방법으로 비용함수를 최대화 하는 필터(wk)는 수학식 8과 같다.
만약, Rk가 singular matrix에 가까우면 역행렬을 제대로 추정할 수 없으므로 행렬의 diagonal 부분에 작은 값을 더해주어 최종적으로 추정된 필터는 수학식 9와 같다.
여기서 δ 는 공분산이 singular matrix 가 되지 않도록 하는 작은 상수값이며, Rk 는 프레임 n, 주파수 k 에서의 입력 신호 Xn,k 의 공분산행렬을 나타낸다.
전술한 MPDR 빔포밍 알고리즘은 단구간 푸리에 변환을 통해 시간-주파수 영역에서 빔포밍 출력 신호의 파워를 최소화하도록 필터를 추정하였지만, 잡음 신호의 공분산과 입력 신호의 공분산의 차이로 인하여 잡음이 잘 제거되지 않는다.
따라서, 본 발명에 따른 빔포밍 방법은 Complex Gaussian 분포를 이용한 최대우도 기반 빔포밍 알고리즘을 이용하여 잡음이 제거된 음성 신호가 Gaussian 분포를 따른다고 가정하여 해당 분포의 로그 우도가 최대화 되도록 잡음을 제거한다. 이 때, Yn,k 가 시간-주파수 영역에서 평균이 0인 complex generalized Gaussian 분포를 따른다고 가정하면 Yn,k 의 확률밀도함수는 수학식 10과 같이 나타낼 수 있다.
여기서 α 는 가 확률밀도함수가 되도록 하는 상수이며, 양수 c 는 가우시안 분포의 Shape 파라미터로서, c = 1 인 경우 complex Gaussian 분포를 나타내며 c < 1 인 경우 Gaussian 분포보다 sparse한 분포를 나타내며, c > 1 인 경우 Gaussian 분포보다 덜 sparse한 분포를 나타낸다. λn,k 는 Yn,k 의 분산을 나타낸다.
한편, 수학식 11과 같은 complex Gamma distribution 과 같이 sparse한 분포를 나타낼 수 있는 다양한 분포 함수에도 적용 가능하다.
여기서, α는 │α│> 0 인 복소수 상수이며, β는 양의 실수이다.
로그우도를 최대화하는 분산 λn,k 는 수학식 13 및 수학식 14와 같이 구할 수 있다(단계 120).
처음에는 Yn,k 의 값을 알 수 없으므로 기존의 입력 신호의 출력 파워를 최대화 시키는 필터 wk 를 이용하여 λn,k를 초기화한다.
비슷한 방법으로 로그 우도를 최대화 하는 필터 wk는 수학식 16 및 수학식 17과 같이 구할 수 있다(단계 130).
Pk 는 complex generalized Gaussian 분푸 기반의 우도로부터 계산된 가중치가 적용된 공분산 행렬이다.
위의 λn,k와 wk를 반복적으로 추정하여 최종 필터 wk를 얻고(단계150), 최종 필터를 이용하여 잡음이 제거된 음원 신호를 검출한다(단계 160).
이하, 전술한 구성을 갖는 본 발명에 따른 빔포밍 방법에 대한 성능 평가를 위하여, Kaldi 음성 인식 툴을 이용하여 단어 오 인식률을 측정하였다. 음성 인식기는 Reverb Challenge 2014에 사용된 recipe를 이용하여 DNN학습을 하였고, MC-WSJ-AV를 실환경에서 재녹음하여 Signal-to-Noise (SNR) 비율별로 잡음과 혼합하였다. MVDR 알고리즘은 잡음의 추정을 위해 묵음 구간의 프레임을 이용하여 공분산 추정을 하였고, 최대 우도 기반 빔포밍 알고리즘에 사용된 반복횟수는 7, 값은 2이다.
도 2는 본 발명의 바람직한 실시예에 따른 우도 최대화를 이용한 빔포밍 방법 및 종래의 방법들을 이용하여 단어 오 인식율을 측정한 결과표를 도시한 도표이다. 도 2를 참조하면, 종래의 MVDR 빔포밍 및 MPDR 빔포밍에 비하여 본 발명에 따라 제안된 빔포밍 방법이 잡음이 없는 경우에는 비슷한 수준을 달성하면서도 그 외 잡음이 있는 경우에는 단어 오 인식률이 낮음을 파악할 수 있다. 따라서, 본 발명에 따른 빔포밍 방법이 잡음 환경에서 더욱 강인한 전처리 방법으로 사용될 수 있음을 알 수 있다.
이상에서 본 발명에 대하여 그 바람직한 실시예를 중심으로 설명하였으나, 이는 단지 예시일 뿐 본 발명을 한정하는 것이 아니며, 본 발명이 속하는 분야의 통상의 지식을 가진 자라면 본 발명의 본질적인 특성을 벗어나지 않는 범위에서 이상에 예시되지 않은 여러 가지의 변형과 응용이 가능함을 알 수 있을 것이다. 그리고, 이러한 변형과 응용에 관계된 차이점들은 첨부된 청구 범위에서 규정하는 본 발명의 범위에 포함되는 것으로 해석되어야 할 것이다.
Claims (6)
- (a) 시간 프레임 n 및 주파수 k 에서의 잡음이 섞인 입력 신호(Xn,k)를 수신하는 단계;
(b) 입력 신호에서 잡음을 제거한 목표 신호(Yn,k)가 시간-주파수 영역에서 평균이 0인 complex generalized Gaussian 분포 또는 complex Gamma distribution을 따른다고 가정하여, 상기 목표 신호(Yn,k)에 대한 확률 밀도 함수()를 결정하는 단계;
(c) 상기 확률 밀도 함수에 대한 로그 우도를 최대화시키도록 상기 목표 신호의 분산(λn,k)을 추정하는 단계;
(d) 상기 확률 밀도 함수에 대한 로그 우도를 최대화시키도록 상기 비용함수를 최대화하는 필터(wk)를 추정하는 단계;
(e) 상기 필터(wk)가 수렴될 때가지 상기 (c) 단계와 (d) 단계를 반복적으로 추정하여, 최종적으로 필터(wk)를 얻는 단계;
를 구비하는 것을 특징으로 하는 우도 최대화를 이용한 빔포밍 방법.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170175057A KR102048370B1 (ko) | 2017-12-19 | 2017-12-19 | 우도 최대화를 이용한 빔포밍 방법 |
US16/223,791 US10916239B2 (en) | 2017-12-19 | 2018-12-18 | Method for beamforming by using maximum likelihood estimation for a speech recognition apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170175057A KR102048370B1 (ko) | 2017-12-19 | 2017-12-19 | 우도 최대화를 이용한 빔포밍 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190073852A true KR20190073852A (ko) | 2019-06-27 |
KR102048370B1 KR102048370B1 (ko) | 2019-11-25 |
Family
ID=66815197
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170175057A KR102048370B1 (ko) | 2017-12-19 | 2017-12-19 | 우도 최대화를 이용한 빔포밍 방법 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10916239B2 (ko) |
KR (1) | KR102048370B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021235750A1 (ko) * | 2020-05-18 | 2021-11-25 | 주식회사 엠피웨이브 | 강인음성인식을 위한 방향벡터 추정을 겸한 온라인 우도최대화를 이용한 빔포밍 방법 및 그 장치 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110580911B (zh) * | 2019-09-02 | 2020-04-21 | 青岛科技大学 | 一种可抑制多个非稳定次高斯干扰的波束形成方法 |
CN113283462B (zh) * | 2021-03-24 | 2022-09-20 | 国网四川省电力公司电力科学研究院 | 一种基于改进idnn模型的二次系统故障定位方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130068251A (ko) | 2011-12-15 | 2013-06-26 | 한국전자통신연구원 | 최대 로그 우도법 기반의 최적 음향모델 생성 장치 및 방법 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8290170B2 (en) * | 2006-05-01 | 2012-10-16 | Nippon Telegraph And Telephone Corporation | Method and apparatus for speech dereverberation based on probabilistic models of source and room acoustics |
-
2017
- 2017-12-19 KR KR1020170175057A patent/KR102048370B1/ko active IP Right Grant
-
2018
- 2018-12-18 US US16/223,791 patent/US10916239B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130068251A (ko) | 2011-12-15 | 2013-06-26 | 한국전자통신연구원 | 최대 로그 우도법 기반의 최적 음향모델 생성 장치 및 방법 |
Non-Patent Citations (2)
Title |
---|
반향 필터 추정에서 성김 특성을 이용한 단일채널 음성반향제거 방법 * |
순환 확률분포를 이용한 다중 음원 방향 추정 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021235750A1 (ko) * | 2020-05-18 | 2021-11-25 | 주식회사 엠피웨이브 | 강인음성인식을 위한 방향벡터 추정을 겸한 온라인 우도최대화를 이용한 빔포밍 방법 및 그 장치 |
Also Published As
Publication number | Publication date |
---|---|
KR102048370B1 (ko) | 2019-11-25 |
US20190189114A1 (en) | 2019-06-20 |
US10916239B2 (en) | 2021-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112447191B (zh) | 信号处理装置以及信号处理方法 | |
US10602267B2 (en) | Sound signal processing apparatus and method for enhancing a sound signal | |
US10331396B2 (en) | Filter and method for informed spatial filtering using multiple instantaneous direction-of-arrival estimates | |
KR101934636B1 (ko) | 심화신경망 기반의 잡음 및 에코의 통합 제거 방법 및 장치 | |
US9633651B2 (en) | Apparatus and method for providing an informed multichannel speech presence probability estimation | |
US9984702B2 (en) | Extraction of reverberant sound using microphone arrays | |
US7295972B2 (en) | Method and apparatus for blind source separation using two sensors | |
CN110085248B (zh) | 个人通信中降噪和回波消除时的噪声估计 | |
US7158933B2 (en) | Multi-channel speech enhancement system and method based on psychoacoustic masking effects | |
Taseska et al. | Informed spatial filtering for sound extraction using distributed microphone arrays | |
Thiergart et al. | An informed LCMV filter based on multiple instantaneous direction-of-arrival estimates | |
US11483651B2 (en) | Processing audio signals | |
KR102048370B1 (ko) | 우도 최대화를 이용한 빔포밍 방법 | |
Kodrasi et al. | Late reverberant power spectral density estimation based on an eigenvalue decomposition | |
Habets et al. | Dereverberation | |
Jin et al. | Multi-channel noise reduction for hands-free voice communication on mobile phones | |
Kodrasi et al. | Single-channel Late Reverberation Power Spectral Density Estimation Using Denoising Autoencoders. | |
Mirabilii et al. | Spatial coherence-aware multi-channel wind noise reduction | |
Pfeifenberger et al. | Blind source extraction based on a direction-dependent a-priori SNR. | |
Taseska et al. | Minimum Bayes risk signal detection for speech enhancement based on a narrowband DOA model | |
Schmid et al. | A maximum a posteriori approach to multichannel speech dereverberation and denoising | |
Tanaka et al. | Acoustic beamforming with maximum SNR criterion and efficient generalized eigenvector tracking | |
Gong et al. | Noise power spectral density matrix estimation based on modified IMCRA | |
Hendriks et al. | Estimation of the noise correlation matrix | |
Kako et al. | Wiener filter design by estimating sensitivities between distributed asynchronous microphones and sound sources |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |