JP2014048398A - 音響信号解析装置、方法、及びプログラム - Google Patents
音響信号解析装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2014048398A JP2014048398A JP2012190188A JP2012190188A JP2014048398A JP 2014048398 A JP2014048398 A JP 2014048398A JP 2012190188 A JP2012190188 A JP 2012190188A JP 2012190188 A JP2012190188 A JP 2012190188A JP 2014048398 A JP2014048398 A JP 2014048398A
- Authority
- JP
- Japan
- Prior art keywords
- dimensional array
- frequency
- sound source
- time
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】確率更新部241、時変ゲイン更新部242、及び分離行列更新部243により、各周波数に対する各時間フレームにおいて調波構造を有するパワースペクトルテンプレートの各々が音源毎に選択される確率を要素にもつ三次元配列Π^を用いて、観測時間周波数成分の三次元配列Xが与えられたときの三次元配列Π^、各音源のパワーを要素にもつ二次元配列Σ^、及び各周波数ωの分離行列Wω^の事後確率を表す目的関数を最大化するように、三次元配列Π^、二次元配列Σ^、及び各周波数ωの分離行列Wω^を更新することを繰り返す。
【選択図】図1
Description
が優ガウス分布に従うという仮定のもとで最尤となる各帯域の分離フィルタが推定される。また、優ガウス分布の具体的な分布として時変ガウス分布(分散が時刻ごとに変化することを許容したガウス分布)を仮定したIVAを実現する方法も提案されている(非特許文献3)。
の各要素が統計的に独立になるように分離行列Wω^の推定する問題として定式化される。ただし、Yτω^=(Y1τω,...,Ykτω,...,YKτω)Tであり、各音源の時間周波数成分を表わしている。
まず、本発明の原理について説明する。まず、音源の生成モデルについて説明する。
補助変数についての更新式はΣlγ(l) kτω=1の制約のもと、∂Q/∂γ (l) kτω=0を解けば以下の(8)式のとおりに得られる。
π(l) kτとσ2 kτの更新式については、∂Q/∂π(l) kτ=0,∂Q/∂σ2 kτ=0を解くことにより以下の(9)式、(10)式のとおりに得られる。
以上で更新された分離行列を用いて音源信号の推定を以下の(15)式のとおりに更新する。
次に、M個(M≧2)のマイクロホンから得られた音響信号を解析して、既知のK個(K<M)の音源信号に分離する音響信号解析装置に、本発明を適用した場合を例にして、本発明の実施の形態を説明する。
次に、本実施の形態に係る音響信号解析装置100の作用について説明する。まず、解析対象の信号として各マイクロホンからの音響信号の時系列データが音響信号解析装置100に入力され、記憶部30に格納される。そして、音響信号解析装置100において、図3に示す音響信号解析処理ルーチンが実行される。
次に、本実施の形態に係る手法の有用性を示す目的で、単旋律楽器を音源として用いたシミュレーションによる実験を行った結果について説明する。以下の表1に実験条件を示す。
20 演算部
21 時間周波数解析部
22 初期設定部
23 補助変数更新部
24 パラメータ更新部
25 時間周波数成分推定部
26 終了判定部
27 信号変換部
30 記憶部
40 出力部
100 音響信号解析装置
241 確率更新部
242 時変ゲイン更新部
243 分離行列更新部
Claims (5)
- M個(Mは2以上の整数)のマイクロホンmから出力される音響信号の時系列データを入力として、観測時間周波数成分Xmτω(mはマイクロホン、τは時間フレーム、ωは周波数のインデックスである。)を要素にもつ三次元配列Xを出力する時間周波数解析手段と、
M個の音源kの時間周波数成分Ykτω(kは音源、τは時間フレーム、ωは周波数のインデックスである。)を要素にもつ三次元配列Y^、各音源kについて各時間フレームτにおいて調波構造を有するパワースペクトルテンプレートλ(l) ω(lは、パワースペクトルテンプレートのインデックスである。)が選択される確率π(l) kτを要素にもつ三次元配列Π^、各時間フレームτにおける各音源kのパワーσ2 kγを要素にもつ二次元配列Σ^、及び各周波数ωについて、Xτω(=(X1τω,・・・,XMτω))に作用させて音源信号の時間周波数成分Yτω(=(Y1τω,・・・,YKτω))を得るための分離行列Wω^の各々の初期値を設定するパラメータ初期値設定手段と、
(k、τ、ω、zkτ)の全ての組み合わせにおける、zkτとσ2 kγが与えられたときの、λ(zkτ) ω・σ2 kγを分散とするガウス分布で表されるYkτωの確率密度関数、及びπkτが与えられたときのzkτの確率、(k、τ、l)の全ての組み合わせに対する前記確率π(l) kτの事前確率、及び各周波数ωに対する前記分離行列Wω^の行列式を用いて表された、前記三次元配列X^が与えられたときの前記三次元配列Π^、前記二次元配列Σ^、及び各周波数ωの前記分離行列Wω^の事後確率を表す目的関数を最大化するように、前記三次元配列Π^、前記二次元配列Σ^、及び各周波数ωの前記分離行列Wω^を更新するパラメータ更新手段と、
各周波数ωの前記分離行列Wω^及び前記三次元配列X^に基づいて、前記三次元配列Y^を更新する音源信号推定値更新手段と、
予め定められた終了条件を満たすまで、前記パラメータ更新手段による更新、及び前記音源信号推定値更新手段による更新を繰り返し行う終了判定手段と、
を含む音響信号解析装置。 - 前記目的関数を、(k,τ、ω)の全ての組み合わせについて観測時間周波数成分Xmτωが各インデックスlのパワースペクトルテンプレートλ(l) ωに帰属する確率を示す補助変数γ(l) kτωを用いた補助関数とし、
前記パラメータ更新手段は、
前記三次元配列Π^、二次元配列Σ^、及び前記複数のパワースペクトルテンプレートλ(l) ωに基づいて、(k,τ、ω、l)の全ての組み合わせの各々について前記補助変数γ(l) kτωを更新する補助変数更新手段と、
前記補助変数γ(l) kτωに基づいて、前記三次元配列Π^を更新する確率更新手段と、
前記補助変数γ(l) kτω及び前記複数のパワースペクトルテンプレートλ(l) ωに基づいて、前記二次元配列Σを更新するパワー更新手段と、
前記補助変数γ(l) kτω、前記二次元配列Σ^、前記三次元配列X^、及び前記複数のパワースペクトルテンプレートλ(l) ωに基づいて、各周波数ωの前記分離行列Wω^を更新する分離行列更新手段と、
を含む請求項1記載の音響信号解析装置。 - 前記確率π(l) kτの事前分布を、ディレクレ分布とした請求項1又は2記載の音響信号解析装置。
- 時間周波数解析手段によって、M個(Mは2以上の整数)のマイクロホンmから出力される音響信号の時系列データを入力として、観測時間周波数成分Xmτω(mはマイクロホン、τは時間フレーム、ωは周波数のインデックスである。)を要素にもつ三次元配列Xを出力し、
パラメータ初期値設定手段によって、M個の音源kの時間周波数成分Ykτω(kは音源、τは時間フレーム、ωは周波数のインデックスである。)を要素にもつ三次元配列Y^、各音源kについて各時間フレームτにおいて調波構造を有するパワースペクトルテンプレートλ(l) ω(lは、パワースペクトルテンプレートのインデックスである。)が選択される確率π(l) kτを要素にもつ三次元配列Π^、各時間フレームτにおける各音源kのパワーσ2 kγを要素にもつ二次元配列Σ^、及び各周波数ωについて、Xτω(=(X1τω,・・・,XMτω))に作用させて音源信号の時間周波数成分Yτω(=(Y1τω,・・・,YKτω))を得るための分離行列Wω^の各々の初期値を設定し、
パラメータ更新手段によって、(k、τ、ω、zkτ)の全ての組み合わせにおける、zkτとσ2 kγが与えられたときの、λ(zkτ) ω・σ2 kγを分散とするガウス分布で表されたYkτωの確率密度関数、及びπkτが与えられたときのzkτの確率、(k、τ、l)の全ての組み合わせに対する前記確率π(l) kτの事前確率、及び各周波数ωに対する前記分離行列Wω^の行列式を用いて表された、前記三次元配列X^が与えられたときの前記三次元配列Π^、前記二次元配列Σ^、及び各周波数ωの前記分離行列Wω^の事後確率を表す目的関数を最大化するように、前記三次元配列Π^、前記二次元配列Σ^、及び各周波数ωの前記分離行列Wω^を更新し、
音源信号推定値更新手段によって、各周波数ωの前記分離行列Wω^及び前記三次元配列X^に基づいて、前記三次元配列Y^を更新し、
終了判定手段によって、予め定められた終了条件を満たすまで、前記パラメータ更新手段による更新、及び前記音源信号推定値更新手段による更新を繰り返し行う
音響信号解析方法。 - 請求項1〜請求項3の何れか1項に記載の音響信号解析装置の各手段としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012190188A JP5807914B2 (ja) | 2012-08-30 | 2012-08-30 | 音響信号解析装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012190188A JP5807914B2 (ja) | 2012-08-30 | 2012-08-30 | 音響信号解析装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014048398A true JP2014048398A (ja) | 2014-03-17 |
JP5807914B2 JP5807914B2 (ja) | 2015-11-10 |
Family
ID=50608149
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012190188A Active JP5807914B2 (ja) | 2012-08-30 | 2012-08-30 | 音響信号解析装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5807914B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016045221A (ja) * | 2014-08-19 | 2016-04-04 | 日本電信電話株式会社 | 信号解析装置、方法、及びプログラム |
JP2017152825A (ja) * | 2016-02-23 | 2017-08-31 | 日本電信電話株式会社 | 音響信号解析装置、音響信号解析方法、及びプログラム |
CN113889138A (zh) * | 2021-06-07 | 2022-01-04 | 成都启英泰伦科技有限公司 | 一种基于双麦克风阵列的目标语音提取方法 |
CN114385977A (zh) * | 2021-12-13 | 2022-04-22 | 广州方硅信息技术有限公司 | 信号的有效频率检测方法、终端设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009529699A (ja) * | 2006-03-01 | 2009-08-20 | ソフトマックス,インコーポレイテッド | 分離信号を生成するシステムおよび方法 |
US20090222262A1 (en) * | 2006-03-01 | 2009-09-03 | The Regents Of The University Of California | Systems And Methods For Blind Source Signal Separation |
-
2012
- 2012-08-30 JP JP2012190188A patent/JP5807914B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009529699A (ja) * | 2006-03-01 | 2009-08-20 | ソフトマックス,インコーポレイテッド | 分離信号を生成するシステムおよび方法 |
US20090222262A1 (en) * | 2006-03-01 | 2009-09-03 | The Regents Of The University Of California | Systems And Methods For Blind Source Signal Separation |
Non-Patent Citations (2)
Title |
---|
JPN6015019639; 小野 順貴: '補助関数法に基づく独立ベクトル分析の高速学習則' 日本音響学会 2011年 秋季研究発表会講演論文集CD-ROM , 20110913, pp.673-674, 社団法人日本音響学会 * |
JPN6015019640; 小野 拓磨, 小野 順貴, 嵯峨山 茂樹: '音源のアクティベーションを事前情報とした独立ベクトル分析による音源分離' 日本音響学会 2011年 秋季研究発表会講演論文集CD-ROM , 20110913, pp.613-614, 社団法人日本音響学会 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016045221A (ja) * | 2014-08-19 | 2016-04-04 | 日本電信電話株式会社 | 信号解析装置、方法、及びプログラム |
JP2017152825A (ja) * | 2016-02-23 | 2017-08-31 | 日本電信電話株式会社 | 音響信号解析装置、音響信号解析方法、及びプログラム |
CN113889138A (zh) * | 2021-06-07 | 2022-01-04 | 成都启英泰伦科技有限公司 | 一种基于双麦克风阵列的目标语音提取方法 |
CN114385977A (zh) * | 2021-12-13 | 2022-04-22 | 广州方硅信息技术有限公司 | 信号的有效频率检测方法、终端设备及存储介质 |
CN114385977B (zh) * | 2021-12-13 | 2024-05-28 | 广州方硅信息技术有限公司 | 信号的有效频率检测方法、终端设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP5807914B2 (ja) | 2015-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ono | Stable and fast update rules for independent vector analysis based on auxiliary function technique | |
US9668066B1 (en) | Blind source separation systems | |
Yoshii et al. | Student's t nonnegative matrix factorization and positive semidefinite tensor factorization for single-channel audio source separation | |
JP6195548B2 (ja) | 信号解析装置、方法、及びプログラム | |
JP5233827B2 (ja) | 信号分離装置、および信号分離方法、並びにコンピュータ・プログラム | |
CN104737229A (zh) | 用于变换输入信号的方法 | |
JP5807914B2 (ja) | 音響信号解析装置、方法、及びプログラム | |
JP6099032B2 (ja) | 信号処理装置、信号処理方法及びコンピュータプログラム | |
Ono et al. | User-guided independent vector analysis with source activity tuning | |
Simon et al. | A general framework for online audio source separation | |
Duong et al. | Multichannel harmonic and percussive component separation by joint modeling of spatial and spectral continuity | |
Duong et al. | Gaussian modeling-based multichannel audio source separation exploiting generic source spectral model | |
Giacobello et al. | Speech dereverberation based on convex optimization algorithms for group sparse linear prediction | |
Li et al. | Pagan: A phase-adapted generative adversarial networks for speech enhancement | |
JP6448567B2 (ja) | 音響信号解析装置、音響信号解析方法、及びプログラム | |
Harris et al. | Real-time independent vector analysis with Student's t source prior for convolutive speech mixtures | |
JP6910609B2 (ja) | 信号解析装置、方法、及びプログラム | |
JP6142402B2 (ja) | 音響信号解析装置、方法、及びプログラム | |
Albataineh et al. | A RobustICA-based algorithmic system for blind separation of convolutive mixtures | |
JP6644356B2 (ja) | 音源分離システム、方法及びプログラム | |
Lee et al. | Discriminative training of complex-valued deep recurrent neural network for singing voice separation | |
Adiloğlu et al. | A general variational Bayesian framework for robust feature extraction in multisource recordings | |
Sprechmann et al. | Supervised non-negative matrix factorization for audio source separation | |
JP6618493B2 (ja) | 信号解析装置、方法、及びプログラム | |
Watanabe et al. | DNN-based frequency component prediction for frequency-domain audio source separation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140807 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20140807 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150514 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150526 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150715 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150804 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150902 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5807914 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |