JP2018141922A - ステアリングベクトル推定装置、ステアリングベクトル推定方法およびステアリングベクトル推定プログラム - Google Patents
ステアリングベクトル推定装置、ステアリングベクトル推定方法およびステアリングベクトル推定プログラム Download PDFInfo
- Publication number
- JP2018141922A JP2018141922A JP2017037299A JP2017037299A JP2018141922A JP 2018141922 A JP2018141922 A JP 2018141922A JP 2017037299 A JP2017037299 A JP 2017037299A JP 2017037299 A JP2017037299 A JP 2017037299A JP 2018141922 A JP2018141922 A JP 2018141922A
- Authority
- JP
- Japan
- Prior art keywords
- covariance matrix
- steering vector
- vector
- noise
- mask
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
Description
第1の実施形態に係るステアリングベクトル推定装置について説明する。なお、第1の実施形態においては、N個の目的信号(ただし、Nは1以上の整数)と雑音とが混在した状況下で、それぞれ異なる位置で取得されたM個(ただし、Mは2以上の整数)の観測信号がステアリングベクトル推定装置に入力されるものとする。
図1を用いて、第1の実施形態の構成について説明する。図1は、第1の実施形態に係るステアリングベクトル推定装置の構成の一例を示す図である。図1に示すように、ステアリングベクトル推定装置1は、観測信号ベクトル計算部10、マスク推定部20、共分散行列推定部30および一般化固有値解析部40を有する。
C(n)={(t,f)│時間周波数点(t,f)では目的信号のうちn番目の目的信号だけが存在}
とし、目的信号が1つも存在しない時間周波数点(t,f)の全体の集合を、
C(0)={(t,f)│時間周波数点(t,f)では目的信号が1つも存在しない}
とすると、(7)式および(8)式は次の(11)式のように書ける。
第1の実施形態の変形例1として、マスク推定部20における処理は次のようにしてもよい。本変形例に係るマスク推定部20は、時間周波数点(t,f)(t=1〜T、f=1〜F)を、各目的信号に対応するN個の第1のクラスと雑音に対応するL個(ただし、Lは2以上の整数)の第2のクラスとからなるN+L個のクラスに分類することにより、各目的信号に対応するN個の第1の事後確率ξ(n) tf(nは目的信号の番号で、1〜Nの整数をとる)と雑音に対応するL個の第2の事後確率ξ(0,l) tf(l=1〜L)とを時間周波数点ごとに推定し、第1の事後確率ξ(n) tfを第1のマスクγ(n) tfとし、L個の第2の事後確率ξ(0,l) tf(l=1〜L)の和ξ(0,1) tf+・・・+ξ(0,L) tfを第2のマスクγ(0) tfとする。すなわち、マスク推定部20は(18)式により第1のマスクγ(n) tfと第2のマスクγ(0) tfとを推定する。ただし、N+L個の事後確率の総和は1である、すなわち(19)式が成り立つとする。事後確率は、0〜1の実数値をとる事後確率としてもよい(この場合、マスクも0〜1の実数値をとるマスクとなる)し、0または1の2値だけをとる事後確率としてもよい(この場合、マスクも0または1の2値だけをとるマスクとなる)。
第1の実施形態の変形例2として、N=1の場合には、共分散行列推定部30における処理は次のようにしてもよい。本変形例に係る共分散行列推定部30は、N=1の場合には、(20)式のように、観測信号ベクトルytfとそのエルミート転置yH tfとを乗じて得られるM次正方行列ytfyH tfを周波数ごとに時間方向に平均して得られる行列を第1の共分散行列Ψ(1) fとし、(21)式のように、前記M次正方行列ytfyH tfを、第2のマスクγ(0) tfを荷重として周波数ごとに時間方向に荷重平均して得られる行列を第2の共分散行列Ψ(0) fとする。
図2を用いて、ステアリングベクトル推定装置1の処理の流れについて説明する。図2は、第1の実施形態に係るステアリングベクトル推定装置の処理の流れを示すフローチャートである。
上述のように、従来のステアリングベクトルの推定方法は、目的信号に対応する共分散行列から雑音に対応する共分散行列を減算することに基づいている。この減算により雑音の影響を正確に取り除くことができれば、目的信号のステアリングベクトルを高精度に推定できる。しかしながら、従来のステアリングベクトルの推定方法では、この減算により雑音の影響を正確に取り除くことができない場合があるため、目的信号のステアリングベクトルを高精度に推定できない場合があるという問題があった。
第2の実施形態に係るステアリングベクトル推定装置について説明する。本実施形態は、共分散行列推定部30において、初期値に基づいて、目的信号に対応する第1の共分散行列および雑音に対応する第2の共分散行列を推定する例である。
図3を用いて、第2の実施形態の構成について説明する。図3は、第2の実施形態に係るステアリングベクトル推定装置の構成の一例を示す図である。図3に示すように、第2の実施形態に係るステアリングベクトル推定装置2は、観測信号ベクトル計算部10、マスク推定部20、初期値記憶部31、共分散行列推定部30および一般化固有値解析部40を有する。
初期値に基づいて、目的信号に対応する第1の共分散行列および雑音に対応する第2の共分散行列を推定する場合、これらの行列は、スケールのそれぞれ異なる雑音の寄与を含むことがある(例えば、音量の異なるデータからそれぞれの初期値を学習する場合)。この場合、従来のステアリングベクトルの推定方法では、共分散行列の減算により雑音の影響を正確に取り除くことができないため、目的信号のステアリングベクトルを高精度に推定できない。例えば、オンライン処理の場合に、上記スケールの違いが顕著である処理開始直後に、ステアリングベクトルの推定精度が大幅に低下することがある。
本実施形態では、本発明に係るステアリングベクトル推定装置により推定されたステアリングベクトルを用いて、最小分散無歪応答(MVDR:Minimum Variance Distortionless Response)ビームフォーマを設計し、これを用いて観測信号から各目的信号を推定する例を示す。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。さらに、各装置にて行われる各処理機能は、その全部又は任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
一実施形態として、ステアリングベクトル推定装置1は、パッケージソフトウェアやオンラインソフトウェアとして上記のステアリングベクトルの推定を実行するステアリングベクトル推定プログラムを所望のコンピュータにインストールさせることによって実装できる。例えば、上記のステアリングベクトル推定プログラムを情報処理装置に実行させることにより、情報処理装置をステアリングベクトル推定装置1として機能させることができる。ここで言う情報処理装置には、デスクトップ型又はノート型のパーソナルコンピュータが含まれる。また、その他にも、情報処理装置にはスマートフォン、携帯電話機やPHS(Personal Handyphone System)等の移動体通信端末、さらには、PDA(Personal Digital Assistant)等のスレート端末等がその範疇に含まれる。
10 観測信号ベクトル計算部
20 マスク推定部
30 共分散行列推定部
31 初期値記憶部
40 一般化固有値解析部
Claims (8)
- N個の目的信号(ただし、Nは1以上の整数)と雑音とが混在した状況下で、それぞれ異なる位置で取得されたM個(ただし、Mは2以上の整数)の観測信号の時間周波数成分からなるM次元ベクトルである観測信号ベクトルを計算する観測信号ベクトル計算部と、
前記観測信号ベクトルに基づいて、前記目的信号の各々に対応するN個の第1の共分散行列と、前記雑音に対応する第2の共分散行列と、を周波数ごとに推定する共分散行列推定部と、
前記第1の共分散行列と前記第2の共分散行列とで定義される一般化固有値問題の最大固有値に対応する固有ベクトルに、前記第2の共分散行列を乗じて得られるベクトルに基づいて、前記目的信号の各々に対するステアリングベクトルを推定する一般化固有値解析部と、
を備えたことを特徴とするステアリングベクトル推定装置。 - 前記観測信号ベクトルに基づいて、各時間周波数点への前記N個の目的信号の各々の寄与率を表すN個の第1のマスクと、各時間周波数点への前記雑音の寄与率を表す1個の第2のマスクと、からなるN+1個のマスクを推定するマスク推定部をさらに備え、
前記共分散行列推定部は、前記マスク推定部で推定されたマスクに基づいて、前記第1の共分散行列と前記第2の共分散行列とを推定する、
ことを特徴とする請求項1に記載のステアリングベクトル推定装置。 - 前記第1の共分散行列の初期値と前記第2の共分散行列の初期値とを記憶する初期値記憶部をさらに備え、
前記共分散行列推定部は、前記初期値記憶部に記憶されている初期値に基づいて、前記第1の共分散行列と前記第2の共分散行列とを推定する、
ことを特徴とする請求項1または2に記載のステアリングベクトル推定装置。 - 前記マスク推定部は、各時間周波数点を、前記目的信号の各々に対応するN個の第1のクラスと前記雑音に対応するL個(ただし、Lは2以上の整数)の第2のクラスとからなるN+L個のクラスに分類することにより、前記目的信号の各々に対応するN個の第1の事後確率と前記雑音に対応するL個の第2の事後確率とからなるN+L個の事後確率を時間周波数点ごとに推定し、前記第1の事後確率を前記第1のマスクとし、前記L個の第2の事後確率の和を前記第2のマスクとすることを特徴とする請求項2に記載のステアリングベクトル推定装置。
- 前記共分散行列推定部は、前記観測信号ベクトルと前記観測信号ベクトルのエルミート転置とを乗じて得られるM次正方行列を、前記第1のマスクを荷重として周波数ごとに時間方向に荷重平均して得られる行列を前記第1の共分散行列とし、前記M次正方行列を、前記第2のマスクを荷重として周波数ごとに時間方向に荷重平均して得られる行列を前記第2の共分散行列とすることを特徴とする請求項2または4に記載のステアリングベクトル推定装置。
- 前記共分散行列推定部は、N=1の場合には、前記観測信号ベクトルと前記観測信号ベクトルのエルミート転置とを乗じて得られるM次正方行列を周波数ごとに時間方向に平均して得られる行列を前記第1の共分散行列とし、前記M次正方行列を、前記第2のマスクを荷重として周波数ごとに時間方向に荷重平均して得られる行列を前記第2の共分散行列とすることを特徴とする請求項2または4に記載のステアリングベクトル推定装置。
- ステアリングベクトル推定装置で実行されるステアリングベクトル推定方法であって、
N個の目的信号(ただし、Nは1以上の整数)と雑音とが混在した状況下で、それぞれ異なる位置で取得されたM個(ただし、Mは2以上の整数)の観測信号の時間周波数成分からなるM次元ベクトルである観測信号ベクトルを計算する観測信号ベクトル計算工程と、
前記観測信号ベクトルに基づいて、前記目的信号の各々に対応するN個の第1の共分散行列と、前記雑音に対応する第2の共分散行列と、を周波数ごとに推定する共分散行列推定工程と、
前記第1の共分散行列と前記第2の共分散行列とで定義される一般化固有値問題の最大固有値に対応する固有ベクトルに、前記第2の共分散行列を乗じて得られるベクトルに基づいて、前記目的信号の各々に対するステアリングベクトルを推定する一般化固有値解析工程と、
を含んだことを特徴とするステアリングベクトル推定方法。 - コンピュータを、請求項1から6のいずれか1項に記載のステアリングベクトル推定装置として機能させるためのステアリングベクトル推定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017037299A JP6652519B2 (ja) | 2017-02-28 | 2017-02-28 | ステアリングベクトル推定装置、ステアリングベクトル推定方法およびステアリングベクトル推定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017037299A JP6652519B2 (ja) | 2017-02-28 | 2017-02-28 | ステアリングベクトル推定装置、ステアリングベクトル推定方法およびステアリングベクトル推定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018141922A true JP2018141922A (ja) | 2018-09-13 |
JP6652519B2 JP6652519B2 (ja) | 2020-02-26 |
Family
ID=63526730
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017037299A Active JP6652519B2 (ja) | 2017-02-28 | 2017-02-28 | ステアリングベクトル推定装置、ステアリングベクトル推定方法およびステアリングベクトル推定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6652519B2 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021505933A (ja) * | 2017-12-06 | 2021-02-18 | シナプティクス インコーポレイテッド | 修正された一般化固有値ビームフォーマーを用いた音声信号のボイス強調 |
WO2021087632A1 (zh) * | 2019-11-08 | 2021-05-14 | 刘保国 | 一种有限信号的精确分解方程式构建及分解方法 |
CN113782046A (zh) * | 2021-09-09 | 2021-12-10 | 清华大学 | 一种用于远距离语音识别的麦克风阵列拾音方法及系统 |
US11694710B2 (en) | 2018-12-06 | 2023-07-04 | Synaptics Incorporated | Multi-stream target-speech detection and channel fusion |
US11823707B2 (en) | 2022-01-10 | 2023-11-21 | Synaptics Incorporated | Sensitivity mode for an audio spotting system |
US11937054B2 (en) | 2020-01-10 | 2024-03-19 | Synaptics Incorporated | Multiple-source tracking and voice activity detections for planar microphone arrays |
US12015901B2 (en) | 2019-12-20 | 2024-06-18 | Mitsubishi Electric Corporation | Information processing device, and calculation method |
US12057138B2 (en) | 2022-01-10 | 2024-08-06 | Synaptics Incorporated | Cascade audio spotting system |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008060635A (ja) * | 2006-08-29 | 2008-03-13 | Nippon Telegr & Teleph Corp <Ntt> | ブラインド信号抽出装置、その方法、そのプログラム、及びそのプログラムを記録した記録媒体 |
JP2008203474A (ja) * | 2007-02-20 | 2008-09-04 | Nippon Telegr & Teleph Corp <Ntt> | 多信号強調装置、方法、プログラム及びその記録媒体 |
JP2010176105A (ja) * | 2009-02-02 | 2010-08-12 | Xanavi Informatics Corp | 雑音抑制装置、雑音抑制方法、及び、プログラム |
JP2013054258A (ja) * | 2011-09-06 | 2013-03-21 | Nippon Telegr & Teleph Corp <Ntt> | 音源分離装置とその方法とプログラム |
JP2014056181A (ja) * | 2012-09-13 | 2014-03-27 | Honda Motor Co Ltd | 音源方向推定装置、音響処理システム、音源方向推定方法、及び音源方向推定プログラム |
JP2017037269A (ja) * | 2015-08-13 | 2017-02-16 | 日本電信電話株式会社 | クラスタリング装置、クラスタリング方法及びクラスタリングプログラム |
-
2017
- 2017-02-28 JP JP2017037299A patent/JP6652519B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008060635A (ja) * | 2006-08-29 | 2008-03-13 | Nippon Telegr & Teleph Corp <Ntt> | ブラインド信号抽出装置、その方法、そのプログラム、及びそのプログラムを記録した記録媒体 |
JP2008203474A (ja) * | 2007-02-20 | 2008-09-04 | Nippon Telegr & Teleph Corp <Ntt> | 多信号強調装置、方法、プログラム及びその記録媒体 |
JP2010176105A (ja) * | 2009-02-02 | 2010-08-12 | Xanavi Informatics Corp | 雑音抑制装置、雑音抑制方法、及び、プログラム |
JP2013054258A (ja) * | 2011-09-06 | 2013-03-21 | Nippon Telegr & Teleph Corp <Ntt> | 音源分離装置とその方法とプログラム |
JP2014056181A (ja) * | 2012-09-13 | 2014-03-27 | Honda Motor Co Ltd | 音源方向推定装置、音響処理システム、音源方向推定方法、及び音源方向推定プログラム |
JP2017037269A (ja) * | 2015-08-13 | 2017-02-16 | 日本電信電話株式会社 | クラスタリング装置、クラスタリング方法及びクラスタリングプログラム |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021505933A (ja) * | 2017-12-06 | 2021-02-18 | シナプティクス インコーポレイテッド | 修正された一般化固有値ビームフォーマーを用いた音声信号のボイス強調 |
JP7324753B2 (ja) | 2017-12-06 | 2023-08-10 | シナプティクス インコーポレイテッド | 修正された一般化固有値ビームフォーマーを用いた音声信号のボイス強調 |
US11694710B2 (en) | 2018-12-06 | 2023-07-04 | Synaptics Incorporated | Multi-stream target-speech detection and channel fusion |
WO2021087632A1 (zh) * | 2019-11-08 | 2021-05-14 | 刘保国 | 一种有限信号的精确分解方程式构建及分解方法 |
US12015901B2 (en) | 2019-12-20 | 2024-06-18 | Mitsubishi Electric Corporation | Information processing device, and calculation method |
US11937054B2 (en) | 2020-01-10 | 2024-03-19 | Synaptics Incorporated | Multiple-source tracking and voice activity detections for planar microphone arrays |
CN113782046A (zh) * | 2021-09-09 | 2021-12-10 | 清华大学 | 一种用于远距离语音识别的麦克风阵列拾音方法及系统 |
US11823707B2 (en) | 2022-01-10 | 2023-11-21 | Synaptics Incorporated | Sensitivity mode for an audio spotting system |
US12057138B2 (en) | 2022-01-10 | 2024-08-06 | Synaptics Incorporated | Cascade audio spotting system |
Also Published As
Publication number | Publication date |
---|---|
JP6652519B2 (ja) | 2020-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6652519B2 (ja) | ステアリングベクトル推定装置、ステアリングベクトル推定方法およびステアリングベクトル推定プログラム | |
JP6434657B2 (ja) | 空間相関行列推定装置、空間相関行列推定方法および空間相関行列推定プログラム | |
US11763834B2 (en) | Mask calculation device, cluster weight learning device, mask calculation neural network learning device, mask calculation method, cluster weight learning method, and mask calculation neural network learning method | |
US11894010B2 (en) | Signal processing apparatus, signal processing method, and program | |
WO2017141542A1 (ja) | マスク推定装置、マスク推定方法及びマスク推定プログラム | |
JP6517760B2 (ja) | マスク推定用パラメータ推定装置、マスク推定用パラメータ推定方法およびマスク推定用パラメータ推定プログラム | |
CN110998723B (zh) | 使用神经网络的信号处理装置及信号处理方法、记录介质 | |
US20210216687A1 (en) | Mask estimation device, mask estimation method, and mask estimation program | |
JP6845373B2 (ja) | 信号分析装置、信号分析方法及び信号分析プログラム | |
JP6538624B2 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
JP5994639B2 (ja) | 有音区間検出装置、有音区間検出方法、及び有音区間検出プログラム | |
JP7112348B2 (ja) | 信号処理装置、信号処理方法及び信号処理プログラム | |
Chu et al. | A new QR decomposition-based RLS algorithm using the split Bregman method for L1-regularized problems | |
JP6711765B2 (ja) | 形成装置、形成方法および形成プログラム | |
JP7552742B2 (ja) | 音源分離装置、音源分離方法、およびプログラム | |
JP6636973B2 (ja) | マスク推定装置、マスク推定方法およびマスク推定プログラム | |
Chu et al. | A new parametric adaptive nonstationarity detector and application | |
JP7159928B2 (ja) | 雑音空間共分散行列推定装置、雑音空間共分散行列推定方法、およびプログラム | |
WO2019208137A1 (ja) | 音源分離装置、その方法、およびプログラム | |
JP6930408B2 (ja) | 推定装置、推定方法および推定プログラム | |
JP7485050B2 (ja) | 信号処理装置、信号処理方法、信号処理プログラム、学習装置、学習方法、および、学習プログラム | |
JP2019035851A (ja) | 目的音源推定装置、目的音源推定方法及び目的音源推定プログラム | |
Sharma et al. | Bregman Divergence Based Approach for Adaptive System Identification and Line Enhancement | |
WO2023013081A1 (ja) | 学習装置、推定装置、学習方法及び学習プログラム | |
JP6915579B2 (ja) | 信号分析装置、信号分析方法および信号分析プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191210 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200123 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6652519 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |