JP2018072664A - 信号解析装置、方法、及びプログラム - Google Patents
信号解析装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2018072664A JP2018072664A JP2016214288A JP2016214288A JP2018072664A JP 2018072664 A JP2018072664 A JP 2018072664A JP 2016214288 A JP2016214288 A JP 2016214288A JP 2016214288 A JP2016214288 A JP 2016214288A JP 2018072664 A JP2018072664 A JP 2018072664A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- component sound
- time
- sound
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
Description
<目的関数>
観測信号を
とする。TSFではL個の信号成分
が
を求める手法である。ここで、
を時刻m、周波数kの時間周波数成分を測るための基底関数とする。
の振幅スペクトログラムは、
を用いて
と表される。ただし、(・)Hはベクトルの複素共役転置である。TSFは、目的関数
が推定すべきパラメータであり、βl,k,mはβl,k,m>0、Σlβl,k,m=1を満たすものとする。この問題はβl,k,m の逆数を重みとした重み付き二乗誤差最小化問題として捉えることができる。この重みの重要性については後述する。
の一つ目の項は振幅スペクトログラム
が完全にランク1構造を有したとき0になる。複素NMFと同様、このモデルでは要素ごとに値を相殺することを許容するため
をスパースに誘導するための正則化項が必要になる。
の二つ目の項はこのために導入した
ノルムであり、λ>0は正則化項の強さを決める重みパラメータである。
が有界であり、0<p<2のとき
ノルムは
をスパースに誘導できる。
を有界にするため、
パラメータ
の目的関数を
とするとき
を
の補助関数、
を補助変数と呼ぶ。式(4)を満たすような補助関数を設計できれば、パラメータ
と補助変数
を
を局所最小化する
を得ることができる。従来のNMFの反復アルゴリズムは上述の原理に基づいて導かれる。
目的関数
は
が微分不可能な点を含んでいるため、目的関数を局所最小化する
の更新式は解析的に求まらない。しかし次節に記載する不等式(10)(11) を用いることで
の補助関数
である。補助変数
についての更新式は次の式で得られる。
ここでは補助関数を設計するために用いた不等式をまとめる。
補助関数が最小となる
は、ラグランジェの未定乗数法を用いることで
の更新式として用いられる場合、大きな行列の逆行列を計算する必要があるため計算コストが課題となる。そこで、上記非特許文献2では
において
が単位行列となることに着目し、逆行列計算が不要な方法が提案されているが、βを固定することが信号分解性能に限界を与えることが実験的に明らかになっている。そこで本発明の実施の形態では
の更新に関して射影勾配法を用いることで、βを自由に更新できるようにしつつ逆行列計算を避けることが可能な効率的なアルゴリズムを提案する。
ここでは
に関する更新のみ考えるため、
の他の変数は固定して考える。そのため、
を
の関数とし、
とする。このとき
の偏微分は次の式で得られる。
がSTFTの基底関数の状況について考える。このとき、
は
をSTFTした複素スペクトログラムの(k,m)成分である。そのため式(13)の
は逆STFTを計算することに対応しており、式(16)の初項は
の逆STFTを計算することで得られる。同様に式(14)の
は
の逆STFTを計算することで得られる。以上のことから
の更新は勾配法を用いて効率的に計算可能であり、
はステップサイズである。ここで
は勾配
のリプシッツ定数であり、行列
の最大固有値から得られる。これを効率的に計算するため、次の式で得られるγをステップサイズとして用いる。
はSTFTの窓関数、αmはオーバーラップの割合を示すホップサイズである。
はN×Nの単位行列である。これを用いて線形制約
は
と表記される。また、
への射影は
を
について最小化する更新が得られた。実際はρの上界が
であるため式(18)、(19)で得られるγは
を満たす。従って射影勾配法による更新式は、線形制約の下で
を最小化する値に収束することが保証される。
に関して
の偏微分を0と置くことで更新式
についてはラグランジェの未定乗数法を用いることで
の初期値を設定する。
を更新する。
と重みγとを更新する。
を繰り返し更新する。
を更新する。
実は、上述した補助関数
は複素NMFで得られる補助関数と似たものであることがわかる。
である。また
の補助関数になっている。ただし
が補助変数であり、
である。またβl,k,mはΣlβl,k,m = 1 を満たす正の数であり、Xl,k,mはYk,m=ΣlXl,k,mを満たす。このときXl,k,mが推定されたl番目の音源の複素スペクトログラムの推定値である。
がTSFの補助関数における
とcl,k,m に対応していることがわかる。複素NMFの一つの問題はXl,k,mが複素スペクトログラムが満たすべき条件について考慮できていないという点である。つまり複素NMF アルゴリズムでは広い空間で解を探索することになってしまっている。一方、提案手法ではl番目の複素スペクトログラム
を手がかりに、適切な解空間の中で時間領域信号
を推定することができる。
次に、本発明の実施の形態に係る信号解析装置の構成について説明する。図1に示すように、本発明の実施の形態に係る信号解析装置100は、CPUと、RAMと、後述する学習処理ルーチン及びパラメータ推定処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することができる。この信号解析装置100は、機能的には図1に示すように入力部10と、演算部20と、出力部90と、を含んで構成されている。
の信号から求められる各周波数の各時刻における振幅スペクトルと、基底スペクトルHk,l及びアクティベーションパラメータUl,mの積との誤差の大きさを表す上記(2)式の規準を小さくするように、各構成音lの信号
と、各構成音及び各周波数の基底スペクトルHk,lと、各構成音の各時刻におけるアクティベーションパラメータUl,mとを推定する。
と、各時刻m、各周波数k、及び各構成音lの重みβl,k,mとに初期値を設定する。
と、各構成音信号のアクティベーションパラメータUl,mとに基づいて、上記(8)式〜(9)式に従って、各構成音l、各周波数k、及び各時刻mに対するcl,k,m、各構成音l及び各時刻mに対するVl,mを更新する。
と、各時刻m、各周波数k、及び各構成音lの重みβl,k,mとに基づいて、上記(7)式に示す補助関数を小さくするように、各構成音lの信号
と、各構成音及び各周波数の基底スペクトルHk,lと、各構成音の各時刻におけるアクティベーションパラメータUl,mと、各時刻m、各周波数k、及び各構成音lの重みβl,k,mを更新する。
と、各時刻m、各周波数k、及び各構成音lの重みβl,k,mとに基づいて、上記(16)式、(18)〜(19)式、(25)式に従って、各構成音lの信号
と、ステップサイズγとを更新する。ここで、各構成音の信号を更新する際、各構成音の信号の和が前記観測信号と等しくなる線形制約を満たす空間へ各構成音の信号を射影するように、以下の式に従って、各構成音の信号を繰り返し更新する。
と、各時刻m、各周波数k、及び各構成音lの重みβl,k,mとに基づいて、上記(26)式〜(28)式に従って、各構成音信号の各周波数における基底スペクトルHk,lと、各構成音信号のアクティベーションパラメータUl,mと、各時刻m、各周波数k、及び各構成音lの重みβl,k,mとを更新する。
を出力する。
次に、本発明の実施の形態に係る信号解析装置100の作用について説明する。まず、入力部10において各構成音の構成音信号の時系列データを受け付けると、信号解析装置100は、図2に示す学習処理ルーチンを実行する。
と、各時刻m、各周波数k、及び各構成音lの重みβl,k,mとに初期値を設定する。
と、各構成音信号のアクティベーションパラメータUl,mとに基づいて、上記(8)式〜(9)式に従って、各構成音l、各周波数k、及び各時刻mに対するcl,k,m、各構成音l及び各時刻mに対するVl,mを更新する。
と、各時刻m、各周波数k、及び各構成音lの重みβl,k,mとに基づいて、上記(16)式、(18)〜(19)式、(25)式に従って、各構成音lの信号
と、ステップサイズγとを更新する。ここで、各構成音の信号を更新する際、各構成音の信号の和が前記観測信号と等しくなる線形制約を満たす空間へ各構成音の信号を射影するように、以下の式に従って、各構成音の信号を繰り返し更新する。
と、に基づいて、上記(26)式〜(28)式に従って、各構成音信号の各周波数における基底スペクトルHk,lと、各構成音信号のアクティベーションパラメータUl,mと、各時刻m、各周波数k、及び各構成音lの重みβl,k,mとを更新する。
本実施の形態の手法の有効性を確認するため、SiSEC 2013 Database の"professionally produced music recordings"(5音源からなるポピュラー音楽の音響信号)を用いて3分割交差検証による教師あり音源分離実験を行い,既存のTSF(β1,k,m= ・・・ =βL,k,m)、複素NMF(CNMF-EUC)、Iダイバージェンス規準NMF(NMF-KL)、二乗誤差規準NMF(NMF-EUC)、板倉斎藤擬距離規準NMF(NMF-IS)による各音源のSignal to Distortion Ratio (SDR) 改善値を比較した。図4にその結果を示す。提案手法が他手法に比べて高い改善値を得られていることが確認できた。
20 演算部
24 時間周波数展開部
28 基底スペクトル学習部
30 基底スペクトル記憶部
36 パラメータ推定部
40 初期値設定部
42 補助変数更新部
44 パラメータ更新部
46 収束判定部
90 出力部
100 信号解析装置
Claims (7)
- 各構成音が混合された観測信号の時系列データを入力として、予め学習された各構成音及び各周波数における振幅スペクトルを表す基底スペクトルに基づいて、各構成音の信号から求められる各周波数の各時刻における振幅スペクトルと、前記基底スペクトル及び各構成音の各時刻における音量を表すアクティベーションパラメータの積との誤差の大きさを表す規準を小さくするように、各構成音の信号と、各構成音及び各周波数の基底スペクトルと、各構成音の各時刻におけるアクティベーションパラメータとを推定するパラメータ推定部
を含む信号解析装置であって、
前記パラメータ推定部は、
前記規準の上界関数である補助関数を小さくするように、各構成音の信号と、各構成音及び各周波数の基底スペクトルと、各構成音の各時刻におけるアクティベーションパラメータとを更新するパラメータ更新部であって、各構成音の信号を更新する際、各構成音の信号の和が前記観測信号と等しくなる線形制約を満たす空間へ各構成音の信号を射影するように、各構成音の信号を更新するパラメータ更新部と、
予め定められた収束条件を満たすまで、前記パラメータ更新部による更新を繰り返させる収束判定部と、
を含む信号解析装置。 - 前記パラメータ更新部は、以下の式に従って、各構成音の信号を更新する請求項1記載の信号解析装置。
ただし、slは、構成音lの信号を表し、
は、前記補助関数の偏微分を表し、γはステップサイズを表し、Lは、構成音の数を表し、yは、前記観測信号を表す。 - 前記規準は、以下の式で表わされる請求項1又は2記載の信号解析装置。
ただし、
であり、βl,k,mは、各時刻m、各周波数k、及び各構成音lの重みを表し、ψk,mは、時刻m、周波数kの振幅スペクトルを測るための基底関数を表し、(・)Hは、ベクトルの複素共役転置であり、Hk,lは、各周波数k及び各構成音lの基底スペクトルを表し、Ul,mは、各構成音lの各時刻mにおけるアクティベーションパラメータを表し、λは、重みパラメータであり、pは定数である。 - パラメータ推定部が、各構成音が混合された観測信号の時系列データを入力として、予め学習された各構成音及び各周波数における振幅スペクトルを表す基底スペクトルに基づいて、各構成音の信号から求められる各周波数の各時刻における振幅スペクトルと、前記基底スペクトル及び各構成音の各時刻における音量を表すアクティベーションパラメータの積との誤差の大きさを表す規準を小さくするように、各構成音の信号と、各構成音及び各周波数の基底スペクトルと、各構成音の各時刻におけるアクティベーションパラメータとを推定する
信号解析方法であって、
前記パラメータ推定部が推定することでは、
パラメータ更新部が、前記規準の上界関数である補助関数を小さくするように、各構成音の信号と、各構成音及び各周波数の基底スペクトルと、各構成音の各時刻におけるアクティベーションパラメータとを更新するパラメータ更新部であって、各構成音の信号を更新する際、各構成音の信号の和が前記観測信号と等しくなる線形制約を満たす空間へ各構成音の信号を射影するように、各構成音の信号を更新し、
収束判定部が、予め定められた収束条件を満たすまで、前記パラメータ更新部による更新を繰り返させることを含む信号解析方法。 - 前記パラメータ更新部が更新することでは、以下の式に従って、各構成音の信号を更新する請求項4記載の信号解析方法。
ただし、slは、構成音lの信号を表し、
は、前記補助関数の偏微分を表し、γはステップサイズを表し、Lは、構成音の数を表し、yは、前記観測信号を表す。 - 前記規準は、以下の式で表わされる請求項4又は5記載の信号解析方法。
ただし、
であり、βl,k,mは、各時刻m、各周波数k、及び各構成音lの重みを表し、ψk,mは、時刻m、周波数kの振幅スペクトルを測るための基底関数を表し、(・)Hは、ベクトルの複素共役転置であり、Hk,lは、各周波数k及び各構成音lの基底スペクトルを表し、Ul,mは、各構成音lの各時刻mにおけるアクティベーションパラメータを表し、λは、重みパラメータであり、pは定数である。 - 請求項1〜請求項3の何れか1項に記載の信号解析装置の各部としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016214288A JP6615733B2 (ja) | 2016-11-01 | 2016-11-01 | 信号解析装置、方法、及びプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016214288A JP6615733B2 (ja) | 2016-11-01 | 2016-11-01 | 信号解析装置、方法、及びプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2018072664A true JP2018072664A (ja) | 2018-05-10 |
| JP6615733B2 JP6615733B2 (ja) | 2019-12-04 |
Family
ID=62115365
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2016214288A Active JP6615733B2 (ja) | 2016-11-01 | 2016-11-01 | 信号解析装置、方法、及びプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6615733B2 (ja) |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011133780A (ja) * | 2009-12-25 | 2011-07-07 | Nippon Telegr & Teleph Corp <Ntt> | 信号分析装置、信号分析方法及び信号分析プログラム |
| WO2014079484A1 (en) * | 2012-11-21 | 2014-05-30 | Huawei Technologies Co., Ltd. | Method for determining a dictionary of base components from an audio signal |
| JP2016045221A (ja) * | 2014-08-19 | 2016-04-04 | 日本電信電話株式会社 | 信号解析装置、方法、及びプログラム |
| WO2016130885A1 (en) * | 2015-02-15 | 2016-08-18 | Dolby Laboratories Licensing Corporation | Audio source separation |
-
2016
- 2016-11-01 JP JP2016214288A patent/JP6615733B2/ja active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011133780A (ja) * | 2009-12-25 | 2011-07-07 | Nippon Telegr & Teleph Corp <Ntt> | 信号分析装置、信号分析方法及び信号分析プログラム |
| WO2014079484A1 (en) * | 2012-11-21 | 2014-05-30 | Huawei Technologies Co., Ltd. | Method for determining a dictionary of base components from an audio signal |
| JP2016045221A (ja) * | 2014-08-19 | 2016-04-04 | 日本電信電話株式会社 | 信号解析装置、方法、及びプログラム |
| WO2016130885A1 (en) * | 2015-02-15 | 2016-08-18 | Dolby Laboratories Licensing Corporation | Audio source separation |
Non-Patent Citations (2)
| Title |
|---|
| 亀岡弘和他: "複素NMF:新しいスパース信号分解表現と基底系学習アルゴリズム", 日本音響学会2008年秋季研究発表会講演論文集, JPN6012030553, September 2008 (2008-09-01), pages 657 - 660, ISSN: 0004142345 * |
| 朴玄信他: "制約付き非負行列因子分解を用いた音声特徴抽出の検討", 情報処理学会研究報告, vol. 2008, no. 123, JPN6012030555, December 2008 (2008-12-01), pages 43 - 48, ISSN: 0004142346 * |
Also Published As
| Publication number | Publication date |
|---|---|
| JP6615733B2 (ja) | 2019-12-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US9721202B2 (en) | Non-negative matrix factorization regularized by recurrent neural networks for audio processing | |
| JP6328320B2 (ja) | 入力信号を変換する方法 | |
| US9349375B2 (en) | Apparatus, method, and computer program product for separating time series signals | |
| JP5942420B2 (ja) | 音響処理装置および音響処理方法 | |
| JP6910609B2 (ja) | 信号解析装置、方法、及びプログラム | |
| US9576583B1 (en) | Restoring audio signals with mask and latent variables | |
| JP6976804B2 (ja) | 音源分離方法および音源分離装置 | |
| US10904688B2 (en) | Source separation for reverberant environment | |
| US20140114650A1 (en) | Method for Transforming Non-Stationary Signals Using a Dynamic Model | |
| JP6195548B2 (ja) | 信号解析装置、方法、及びプログラム | |
| JP6099032B2 (ja) | 信号処理装置、信号処理方法及びコンピュータプログラム | |
| JP5807914B2 (ja) | 音響信号解析装置、方法、及びプログラム | |
| JP2019144320A (ja) | 信号解析装置、方法、及びプログラム | |
| JP6448567B2 (ja) | 音響信号解析装置、音響信号解析方法、及びプログラム | |
| JP5726790B2 (ja) | 音源分離装置、音源分離方法、およびプログラム | |
| JP6615733B2 (ja) | 信号解析装置、方法、及びプログラム | |
| JP6618493B2 (ja) | 信号解析装置、方法、及びプログラム | |
| JP6290803B2 (ja) | モデル推定装置、目的音強調装置、モデル推定方法及びモデル推定プログラム | |
| JP6193823B2 (ja) | 音源数推定装置、音源数推定方法および音源数推定プログラム | |
| JP6581054B2 (ja) | 音源分離装置、音源分離方法及び音源分離プログラム | |
| JP6586061B2 (ja) | 信号解析装置、方法、及びプログラム | |
| JP6137479B2 (ja) | 音声信号解析装置、方法、及びプログラム | |
| KR101621718B1 (ko) | 배음 구조 및 성김 구조 제약조건을 이용한 화성악기와 타악기 소리의 분리 방법 | |
| JP6564744B2 (ja) | 信号解析装置、方法、及びプログラム | |
| JP4958241B2 (ja) | 信号処理装置、信号処理方法、信号処理プログラムおよび記録媒体 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181205 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191011 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191029 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191106 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6615733 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |