JP6059072B2 - モデル推定装置、音源分離装置、モデル推定方法、音源分離方法及びプログラム - Google Patents

モデル推定装置、音源分離装置、モデル推定方法、音源分離方法及びプログラム Download PDF

Info

Publication number
JP6059072B2
JP6059072B2 JP2013091223A JP2013091223A JP6059072B2 JP 6059072 B2 JP6059072 B2 JP 6059072B2 JP 2013091223 A JP2013091223 A JP 2013091223A JP 2013091223 A JP2013091223 A JP 2013091223A JP 6059072 B2 JP6059072 B2 JP 6059072B2
Authority
JP
Japan
Prior art keywords
model
sound source
probability
feature vector
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013091223A
Other languages
English (en)
Other versions
JP2014215385A (ja
Inventor
信貴 伊藤
信貴 伊藤
中谷 智広
智広 中谷
荒木 章子
章子 荒木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013091223A priority Critical patent/JP6059072B2/ja
Publication of JP2014215385A publication Critical patent/JP2014215385A/ja
Application granted granted Critical
Publication of JP6059072B2 publication Critical patent/JP6059072B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

この発明は、複数の音が混合した混合信号をもとに、混合前の原音(音源信号)を復元する音源分離技術に関し、特に、音響系に関する事前情報を用いずに音源分離を行うブラインド音源分離技術のうちクラスタリングに基づく音源分離を行う技術に関する。
まず、ブラインド音源分離技術全体における、クラスタリングに基づくブラインド音源分離技術の位置づけを説明する。ブラインド音源分離技術には、単一のマイクロフォンを用いる方法と複数のマイクロフォンを備えるマイクロフォンアレイを用いる方法とがある。後者の方法は、音源分離の手がかりとして音源位置の違いを利用できるため、一般に前者の方法よりも高い音源分離性能を達成することができる。複数のマイクロフォンを用いた音源分離技術としては、独立成分分析による方法とクラスタリングに基づく方法とが一般的である。後者の方法は、音源の数がマイクロフォンの数よりも多い場合にも適用できるという利点がある。
クラスタリングに基づく音源分離技術は、混合信号の各時間周波数成分に寄与する音源信号は高々一つであるという仮定(W-Disjoint Orthogonality: WDO)に基づく(非特許文献1参照)。この仮定は、例えば音声の場合のように、各音源信号が、
・ごく少数の時間周波数成分のみが大きく、
・その他の時間周波数成分はすべて0に近い
というスパース性を満たす場合に、特に精度よく成立することが知られている。
ここで、記法を定義する。m番目のマイクロフォンで観測された混合信号の時間周波数変換をymτωで表す。ここで、τはフレーム番号を表し、ωは角周波数を表す。また、各マイクロフォンで観測された混合信号の時間周波数変換を並べたベクトルを式(1)で表す。
Figure 0006059072
ここで、Mはマイクロフォンの個数であり、・T(上付き文字のT)はベクトル・の転置を表す。また、仮にk番目の音源のみが存在するとしたときに、1番目のマイクロフォンにおいて観測される信号の時間周波数変換をskτωで表す。また、skτωからyτωへの伝達関数をhで表す。skτωを1番目のマイクロフォンにおいて定義したため、hの第1成分は1に等しいことに注意する。
上述の記法を用いて、混合信号のモデルを記述する。まず、WDOを仮定せず、yτωにすべての音源信号が寄与する一般の場合を考えると、混合信号のモデルは式(2)で与えられる。
Figure 0006059072

ここで、Kは音源数(既知と仮定する)である。
一方、WDOを仮定する場合、yτωに寄与する音源信号の番号をd(τ,ω)で表すと、
Figure 0006059072
であるから、式(2)は式(4)のように単純になる。
Figure 0006059072
WDOの仮定のもとでは、各音源skτωを推定する音源分離の問題は、d(τ,ω)を推定する問題と等価である。以下でその理由を説明する。まず、式(4)の第一要素を抜き出すと式(5)を得る。
Figure 0006059072
式(5)と式(3)とにより、各音源信号は次のように表せる。
Figure 0006059072
ただし、mkτωは時間周波数マスクと呼ばれ、式(8)で定義される。
Figure 0006059072
以上より、d(τ,ω)を推定できれば、これを用いて式(8)によりマスクmkτωを計算でき、このマスクmkτωを式(7)のように混合信号y1τωに乗算することによりskτωを計算することができる。
d(τ,ω)の推定は、通常、各時間周波数成分に対して、音源の方向や位置などの特徴量を抽出して、この特徴量に基づいて時間周波数成分を各音源に対応するクラスにクラスタリングすることにより行われる。このクラスタリングの精度は、クラスタリングに基づく音源分離の性能に大きく影響する。
クラスタリングの従来技術として非特許文献2に記載されている方法が挙げられる。この方法では、混合信号の各時間周波数成分に対して、yτωをノルムが1になるように正規化した、式(9)で定義される特徴量を計算し、この特徴量に基づいて周波数ビンごとに時間周波数成分をクラスタリングする。
Figure 0006059072

ここで、||・||はベクトルのユークリッドノルムを表す。
この方法では、ある周波数ビンにおけるi番目のクラスと別の周波数ビンにおけるi番目のクラスとが、必ずしも同じ音源に対応するとは限らないというパーミュテーション問題が生じる。したがって、この方法では、周波数ビンごとのクラスタリングを行った後で、すべての周波数ビンにおけるi番目のクラスが同じ音源に対応するように各周波数ビンにおけるクラス番号を付け替えるパーミュテーション解決を行うというように、二段階の処理が必要であった。
A. Jourjine, S. Rickard, and O. Yilmaz, "Blind separation of disjoint orthogonal signals: demixing N sources from 2 mixtures", in Proceedings of ICASSP, vol. 5, pp. 2985-2988, Jun. 2000. H. Sawada, S. Araki, and S. Makino, "Underdetermined convolutive blind source separation via frequency bin-wise clustering and permutation alignment", IEEE Transactions ASLP, vol. 19, no. 3, pp. 516-527, Mar. 2011.
非特許文献2に記載されたようなクラスタリングに基づく音源分離の従来技術においては、周波数ビンごとのクラスタリングを行った後で、パーミュテーション解決を行うという、二段階の処理が必要であった。
この発明の目的は、パーミュテーション問題を生じず、二段階の処理を必要としない音源分離手法を提供することである。
上記の課題を解決するために、この発明の一態様によるモデル推定装置は、kを音源のインデックスとし、τを時間フレームのインデックスとし、ωを角周波数とし、K個の音源からの信号が混合された混合信号をM個のマイクロフォンで観測した観測信号から、各観測信号の時間周波数成分からなる観測信号ベクトルyτωに対応する特徴ベクトルxτωを抽出する特徴抽出部と、特徴ベクトルxτωを所定の確率モデルにあてはめ、各音源の尤度の時系列が周波数ビン間で同期しているほど高い評価値を与える評価関数を用いて、確率モデルのモデルパラメータを推定するモデル推定部と、を含む。確率モデルは、各音源に関する特徴ベクトルxτωの分布の重み付き和で表される混合モデルであり、確率モデルの混合重みは、時間フレームτに依存し、角周波数ωに依存しない重みであり、確率モデルのモデルパラメータは、混合重みと、各音源に関する特徴ベクトルxτωの分布のパラメータである。
この発明の一態様による音源分離装置は、kを音源のインデックスとし、τを時間フレームのインデックスとし、ωを角周波数とし、K個の音源からの信号が混合された混合信号をM個のマイクロフォンで観測した観測信号から、各観測信号の時間周波数成分からなる観測信号ベクトルyτωに対応する特徴ベクトルxτωを抽出する特徴抽出部と、特徴ベクトルxτωを所定の確率モデルにあてはめ、各音源の尤度の時系列が周波数ビン間で同期しているほど高い評価値を与える評価関数を用いて、確率モデルのモデルパラメータを推定するモデル推定部と、モデルパラメータを用いて音源kに対応するマスクmkτωを求めるマスク作成部と、観測信号ベクトルyτωからマスクmkτωを用いて時間周波数領域の分離音を計算する分離音作成部と、を含む。確率モデルは、各音源に関する特徴ベクトルxτωの分布の重み付き和で表される混合モデルであり、確率モデルの混合重みは、時間フレームτに依存し、角周波数ωに依存しない重みであり、確率モデルのモデルパラメータは、混合重みと、各音源に関する特徴ベクトルxτωの分布のパラメータである。
この発明によれば、パーミュテーション問題を生じず、二段階の処理を必要としない音源分離技術を実現することができる。これにより、例えば、音源位置などが時間的に変化する時変の環境での音声強調のためのオンライン音源分離を容易に実現することが可能となる。
モデル推定装置の機能構成を例示する図。 モデル推定装置の処理フローを例示する図。 音源分離装置の機能構成を例示する図。 音源分離装置の処理フローを例示する図。 実験環境を説明するための図。 実験結果を示す図。 実験結果を示す図。 実験結果を示す図。 実験結果を示す図。
以下、この発明の実施の形態について詳細に説明する。なお、図面中において同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
[発明のポイント]
詳細は後述するが、この発明の音源分離技術のポイントは以下の3点である。
1.一般に音源信号は、「音源信号の時間周波数変換の振幅値の時系列{|skτω|}τが、周波数ビン間で類似する」という共通振幅変調の性質をもつ(例えば、非特許文献「G. J. Brown, “Computational Auditory Scene Analysis: A Representational Approach”, Ph.D. thesis, University of Sheffield, 1992.」を参照)。この発明では、この共通振幅変調の性質を、パーミュテーション問題を回避するための手掛かりとして利用できることに着目した。各音源信号に対する、周波数ビン間での振幅変調の共通性を、時変・周波数非依存の混合重みとしてモデル化することにより、パーミュテーションを引き起こさずに、クラスタリングできる。この時変・周波数非依存の混合重みは、従来用いられてきた時不変の混合重みとは一線を画す画期的なアイディアである。
2.混合重みの事前分布としてディリクレ分布を導入する。このディリクレ分布のハイパーパラメータを調整することにより、時変・周波数非依存の混合重みが極端に変動しすぎないように制御し、音源分離性能の低下を防ぐことができる。
3.パラメータ更新の反復ごとに、目的関数が最大となるように平均方向と密度パラメータを音源間で置換する。これにより、混合重みを時変・周波数非依存にすることによって生じる目的関数の局所解への収束を回避し、適切にモデルパラメータを推定することができる。
[第一実施形態]
この発明の第一実施形態は、複数の音源からの信号を複数個のマイクロフォンで観測し、モデルパラメータを推定するモデル推定装置である。
図1を参照して、第一実施形態のモデル推定装置Aの機能構成例を説明する。モデル推定装置Aは、周波数領域変換部1、特徴抽出部2及びモデル推定部3を含む。モデル推定部3は、事後確率計算部31、パラメータ更新部32及びパラメータ保持部33を含む。パラメータ更新部32は、混合重み更新手段321、相関行列更新手段322、平均方向更新手段323、密度パラメータ更新手段324及びパーミュテーション解決手段325を含む。
図2を参照して、モデル推定装置Aの動作例を手続きの順に従って説明する。
周波数領域変換部1へM個のマイクロフォンにより観測された時間領域の混合信号~ytが入力される。時間領域の混合信号~ytは式(10)で定義される。
Figure 0006059072
ここで、tは時間インデックスを表し、・T(上付き文字のT)はベクトル・の転置を表し、~ymtはm(1≦m≦M)番目のマイクロフォンで観測された時間領域の混合信号を表す。
周波数領域変換部1は入力された時間領域の混合信号~ytから短時間フーリエ変換などにより時間周波数領域の観測信号ベクトルyτωを生成し出力する(ステップS1)。時間周波数領域の観測信号ベクトルyτωは式(11)で定義される。
Figure 0006059072
ここで、τは時間フレームのインデックスを表し、ωは角周波数を表し、ymτωは混合信号~ymtの時間周波数領域での表現である。
特徴抽出部2は、周波数領域変換部1の出力する時間周波数領域の観測信号ベクトルyτωを入力とし、特徴ベクトルxτωを計算し出力する(ステップS2)。特徴ベクトルxτωの計算は、時間周波数領域の観測信号ベクトルyτωを正規化することにより行ってもよいし、時間周波数領域の観測信号ベクトルyτωを白色化した後に正規化することによって行ってもよいし、時間周波数領域の観測信号ベクトルyτωを正規化した後に白色化して再度正規化することにより行ってもよい。例えば、時間周波数領域の観測信号ベクトルyτωを正規化することにより特徴ベクトルxτωを計算する場合は式(12)により計算すればよい。
Figure 0006059072
また、例えば、時間周波数領域の観測信号ベクトルyτωを白色化した後に正規化する場合には、以下のように特徴ベクトルxτωを計算すればよい。まず、時間周波数領域の観測信号ベクトルyτωを用いて、式(13)により時間周波数領域の観測信号ベクトルyτωの標本相関行列Rω を計算する。
Figure 0006059072
ここで、Tはフレームの個数であり、・H(上付き文字のH)はエルミート(Hermite)転置である。
次に、標本相関行列Rω の固有値と固有ベクトルを計算する。計算した標本相関行列Rω の固有値を、大きい順に並べたものをσω1ω2,…,σωMと表す。したがって、式(14)の関係が成り立つ。
Figure 0006059072
ここで、標本相関行列Rω はエルミート行列であるから、固有値σω1ω2,…,σωMはすべて実数であることに注意する。また、固有値σω1ω2,…,σωMに対応し、正規直交系をなす標本相関行列Rω の固有ベクトルをuω1,uω2,…,uωMで表す。ここで、標本相関行列Rω はエルミート行列であるから、このような固有ベクトルが存在することに注意する。
次に、行列Σωを式(15)により求め、行列Uωを式(16)により求める。
Figure 0006059072
次に、行列Uω及び行列Σωを用いて、時間周波数領域の観測信号ベクトルyτωを白色化したベクトルy’τωを式(17)により計算する。
Figure 0006059072
最後に、次式のようにベクトルy’τωをそのノルムで正規化することにより、特徴ベクトルxτωを計算する。
Figure 0006059072
モデル推定部3は、特徴ベクトルxτωを特徴ベクトルの分布を表す確率モデルに当てはめ、確率モデルを評価する所定の評価関数を用いて、信号抽出に適した確率モデルのモデルパラメータを計算する。
特徴ベクトルの分布を表す確率モデルは、例えば、以下のようにモデル化されたものである。音源の位置が固定の場合、各周波数ビンにおいて、特徴ベクトルxτωは理想的にはそれぞれの音源kごとに固有の値をとる。ただし、実際には、雑音・残響の影響、モデル化誤差などに起因する変動が存在するため、特徴ベクトルxτωは音源kごとにある値を中心に分布する。そのため、この発明では、音源kに関する特徴ベクトルxτωの分布を、例えば、以下のようにワトソン(Watson)分布でモデル化する。
Figure 0006059072
ここで、aは音源kに関する特徴ベクトルの分布の中心を表し、平均方向(mean orientation)と呼ばれ、κは音源kに関する特徴ベクトルの分布の広がりの小ささを表し、密度パラメータ(concentration parameter)と呼ばれる。M(a,b,x)はクンマー(Kummer)関数である。クンマー関数についての詳細は「S. Sra and D. Karp, “The multivariate Watson distribution: maximum-likelihood estimation and other aspects”, arXiv: 1104.4422v2, 2012.(参考文献1)」を参照されたい。ここで、特徴ベクトルの分布が周波数ビンごとに定義されることに注意する。
一般に音源信号は、「音源信号の時間周波数変換の振幅値の時系列{|skτω|}τが、周波数ビン間で類似する」という共通振幅変調の性質をもつ(例えば、「G. J. Brown, “Computational Auditory Scene Analysis: A Representational Approach”, Ph.D. thesis, University of Sheffield, 1992.」を参照)。この発明では、この共通振幅変調の性質を、パーミュテーション問題を回避するための手掛かりとして利用できることに着目した。上述のWDO性の仮定にもとづき、この共通振幅変調の性質を、クラスタリングの枠組みにおいて利用しやすい表現で言い換えると、「観測信号に寄与する音源インデックスの時系列{d(τ,ω)}τは、周波数ビン間で類似する」と言える。この発明では、この周波数ビン間での{d(τ,ω)}τの類似性を、「d(τ,ω)の事前分布P(d(τ,ω)=k)が、フレームτに依存(時変)し、周波数ビン(角周波数ω)にはよらない(周波数非依存)」とモデル化する。このような各音源信号に対する、周波数ビン間での振幅変調の共通性を利用することにより、パーミュテーションを引き起こさずに、クラスタリングできる。これが上述で示したこの発明の3つのポイントのうちの第1のポイントである。この事前確率をαにより表す。なお、αはΣk=1 Kα=1を満たす。
この事前確率は、1個の時間フレームごとに変化すると仮定してもよいし、複数の時間フレームからなるブロックごとに変化すると仮定してもよい。事前確率が1個の時間フレームごとに変化すると仮定する場合、任意の音源kと任意の時間フレームτに対して、αは独立変数であり、推定すべきパラメータである。
一方、事前確率が数個の時間フレームからなるブロックごとに変化すると仮定する場合、Bをブロックの総数とし、ブロック番号をb=1,2,…,Bとし、Jを各ブロック内における時間フレームの総数とし、各ブロック内における時間フレームの番号をj=1,2,…,Jとすると、τ=(b−1)×J+jと表せ、αk,(b−1)×J+j(j=1,2,…,J)は等しくなるから、推定すべきパラメータである混合重みは~αkbk,(b−1)×J+1により定義される~αkbである。以下では、特に断りのない限り、事前確率が1個の時間フレームごとに変化すると仮定する場合について説明する。
以上より、特徴ベクトルxτωの尤度関数は、式(20)で表す混合モデルで与えられる。
Figure 0006059072
ここで、Θは、式(21)に示すパラメータ集合である。
Figure 0006059072
ここで、{α}は式(22)により定義される。
Figure 0006059072
他の同様の記法もこれにならって定義される。以降では、αを混合重みと呼ぶ。混合重みαが急激に変動して音源分離性能が低下することを防ぐため、混合重みαの事前分布として式(23)に示すディリクレ(Dirichlet)分布を用いる。これがこの発明の第2のポイントである。
Figure 0006059072
ここで、Γはガンマ関数であり、φはハイパーパラメータと呼ばれる。φの値を十分大きく定めることにより、混合重みαの変動を抑えることができる。φの値を微調整する必要はないが、例えば、φ=1,10,100,1000などの値を用いることができる。
混合重みα以外のパラメータについては一様な事前分布を仮定する。したがって、p(Θ)=Πτp({α}k)である。
モデル推定部3では、特徴ベクトルxτωを以上のようにモデル化された確率モデルに当てはめ、確率モデルを評価する所定の評価関数を用いて、事後確率及び信号抽出に適したパラメータ集合Θを求める。
以下、モデル推定部3の各部の処理を詳細に説明する。モデル推定部3は、図1に示すとおり、事後確率計算部31、パラメータ更新部32及びパラメータ保持部33を含む。モデル推定部3での処理に先立ち、パラメータ集合Θの初期値をパラメータ保持部33に用意しておく(ステップS0)。この初期値は、例えば、α=1/K、κ=20とし、aは{xτω}τωから無作為に選ぶことにより設定することができる。
事後確率計算部31は、パラメータ保持部33に記憶されたパラメータ集合Θから事後確率γkτω、すなわち特徴ベクトルxτωが与えられたもとでd(τ,ω)=kとなる条件付き確率を式(24)により計算する(ステップS31)。
Figure 0006059072
パラメータ更新部32は、図1に示すとおり、混合重み更新手段321、相関行列更新手段322、平均方向更新手段323、密度パラメータ更新手段324及びパーミュテーション解決手段325を含み、現在のパラメータ集合Θを更新して新たなパラメータ集合Θ’を生成する(ステップS32)。
混合重み更新手段321は、事後確率γkτωを用いて、式(25)を計算することにより、混合重みαを新しい値α’に更新する。
Figure 0006059072
ここで、Fは周波数ビンの個数を表す。φ=1のとき、α’は全周波数ビンにわたる事後確率γkτωの平均値となることがわかる。φの増加とともに、α’は定数1/Kに近づく。
相関行列更新手段322は、特徴ベクトルxτωと事後確率γkτωを用いて、式(26)を計算することにより、各音源kに対する相関行列Rを新しい値R’に更新する。
Figure 0006059072
平均方向更新手段323は、相関行列Rの正規化された主成分ベクトルとして、平均方向aを新しい値a’に更新する。
密度パラメータ更新手段324は、相関行列Rの最大固有値λを用いて、密度パラメータкを式(27)により新しい値к’に更新する。
Figure 0006059072
パーミュテーション解決手段325は、式(28)〜(30)に示すように、各周波数ビンにおいて、平均方向a’と密度パラメータк’を、事後確率p(Θ’|{xτω}τω)が最大になるように音源間で置換する(ステップS325)。これがこの発明の第3のポイントである。
Figure 0006059072

ここで、Π:{1,2,…,K}→{1,2,…,K}である。
なお、以上では、混合重みが1個の時間フレームごとに変化する場合の処理について説明したが、混合重みが複数の時間フレームからなるブロックごとに変化する場合は、混合重み更新手段321における混合重みαの更新式(25)において、分子の事後確率γkτωの時間フレームτに含まれるF個の時間周波数成分についての和を事後確率γkτωの時間フレームτを含むブロックbに含まれるF×J個の時間周波数成分の和に置き換え、分母のFをF×Jで置き換えればよい。一方、相関行列更新手段322、平均方向更新手段323、密度パラメータ更新手段324及びパーミュテーション解決手段325においては、混合重みが1個の時間フレームごとに変化する場合の処理と同一の処理を行えばよい。
以下、パラメータ更新部32における各更新式の導出根拠を説明する。パラメータ更新はEM(Expectation-Maximization)アルゴリズムを導入して、それに基づき行う。なお、{d(τ,ω)}τωは、EMアルゴリズムにおける隠れ変数として扱う。
まず、MAP(Maximum a posteriori)推定のためのコスト関数L(Θ)は、式(31)〜(33)により与えられる。
Figure 0006059072
ここで、{xτω}τωは互いに独立であると仮定し、Θに依存しない定数項を無視した。この目的関数を式(34)に示す制約条件のもとで最大化する。
Figure 0006059072
目的関数L(Θ)は、パーミュテーション問題がない場合に大きい値を取るため、L(Θ)の最大化によりパーミュテーション問題が回避できる。実際、式(33)の第一項から分かるように、目的関数L(Θ)が大きくなるのは、混合重みαが大きい値をとるk、τに対し、音源kに対する尤度(もっともらしさ)p(xτω|d(τ,ω)=k,a)が大きい場合である。したがって、L(Θ)の最大化により、音源kに対する尤度の時系列{p(xτω|d(τ,ω)=k,a)}τが周波数ビン間で同期する。このことと、上述の「観測信号に寄与する音源インデックスの時系列{d(τ,ω)}τは、周波数ビン間で類似する」という性質を考え合わせると、L(Θ)はパーミュテーション問題がない場合に大きい値を取ることがわかる。EMアルゴリズムで用いる評価関数(Q関数)は式(35)(36)により与えられる。
Figure 0006059072
更新後のパラメータ集合Θ'は次式により定義され、
Figure 0006059072
Q関数を式(34)の制約のもとで最大にするものとして導かれる。すなわち、混合重みαの新たな値α'を求める式(25)は、ラグランジュ(Lagrange)の未定乗数法によって、式(37)(38)により導出される。
Figure 0006059072
ここで、μはラグランジュの未定乗数である。
平均方向の算出方法は、クーラン・フィッシャー(Courant-Fischer)の定理を式(39)に適用することにより導出される。
Figure 0006059072
また、密度パラメータの更新式(27)については、まず∂Q/∂κ=0より式(40)を得る。
Figure 0006059072
ここで、
Figure 0006059072
であり、λは相関行列Rの最大固有値である。上式は、近似的に次のように解くことができる(詳細は上述の参考文献1参照)。
Figure 0006059072
パラメータ保持部33は、パラメータ更新部32での更新処理により得られたパラメータ集合Θ’を記憶する(ステップS33)。また、事後確率計算部31での次回の処理の際には、記憶したパラメータ集合Θ’をパラメータ集合Θとして提供する。
ステップS31からステップS33までの処理は、事前に設定した最大反復回数max_iterに達するまで、またはパラメータ更新部32における各パラメータの更新による変動幅が収束判定の閾値Δよりも小さくなるまで、反復して行う(ステップS91)。最大反復回数max_iter及び閾値Δの具体的な値は、例えば、max_iter=100、Δ=10-10とすることができる。
ステップS91において、モデル推定部3における処理が最大反復回数max_iterに達した場合、または各パラメータの更新による変動幅が閾値Δよりも小さくなった場合、モデル推定部3は反復終了後の事後確率γo kτωを出力する。
[第二実施形態]
この発明の第二実施形態は、第一実施形態のモデル推定装置Aを用いて音源分離装置として構成した実施形態である。
図3を参照して、第二実施形態の音源分離装置Bの機能構成例を説明する。音源分離装置Bは、第一実施形態のモデル推定装置Aの各部に加えて、音源分離部4及び時間領域変換部5を含む。音源分離部4は、マスク作成部41及び分離音作成部42を含む。
図4を参照して、音源分離装置Bの動作例を手続きの順に従って説明する。ステップS0からステップS91までの処理は第一実施形態のモデル推定装置Aの動作例と同様であるので詳細な説明は省略する。
音源分離部4は、周波数領域変換部1の出力する混合音の時間周波数変換yτωと、事後確率計算部31の出力する反復終了後の事後確率γo kτωとを用いて、分離音の時間周波数変換^skτωを推定する。
マスク作成部41は、反復終了後の事後確率γo kτωを用いて、混合音に含まれる各音源を抽出するマスクmkτωを作成する(ステップS41)。まず、マスク作成部41は、反復終了後の事後確率γo kτωを用いて、式(42)によりd(τ,ω)の推定値^d(τ,ω)を計算する。
Figure 0006059072
次に、マスク作成部41は、マスクmkτωを式(43)により計算する。
Figure 0006059072
なお、マスク作成部41は、マスクmkτωを式(44)により求めてもよい。
Figure 0006059072
分離音作成部42は、式(45)により、マスクmkτωを混合音の時間周波数変換y1τωに乗算し、分離音の時間周波数変換^skτωを計算する。
Figure 0006059072
時間領域変換部5は、音源kごとに、時間周波数領域の分離信号^skτωを時間領域の分離信号~^sktに変換して出力する(ステップS5)。
[実験結果]
この発明の効果を確認するために二通りの実験を行った。
<実験1>
1番目の実験は、以下の二点を実証するための実験である。
・本発明の方法により、パーミュテーション解決の後処理を行わなくても、音源分離が可能であること。
・混合重みのディリクレ事前分布が、音源分離性能の低下を防ぐ効果を持つこと。
そのために、以下に示す3つの異なるクラスタリング方法に基づく音源分離手法により特徴ベクトルxτωを音源分離し、その性能を比較した。
1.本発明の方法1(ディリクレ事前分布あり):時変・周波数非依存の混合重みを持つ混合ワトソンモデルによるクラスタリング方法に基づく音源分離手法である。混合重みの事前分布はディリクレ分布であると仮定し、ディリクレ分布のハイパーパラメータをφ=10,102,103として構成した。
2.本発明の方法2(ディリクレ事前分布なし):本発明の方法1において、ディリクレ分布のハイパーパラメータをφ=1として、ディリクレ事前分布の効果をなくすように構成した。
3.比較手法:時不変・周波数非依存の混合重み0.5を持つ混合ワトソンモデルによる、周波数ビンごとのクラスタリングの後、非特許文献2に記載されているパーミュテーション解決技術を適用するように構成した。混合重みの事前分布は一様であると仮定した。
特徴ベクトルxτωとしては、観測信号ベクトルyτωを正規化したのち、白色化し、再び正規化したものを用いた。
図5を参照して実験環境を説明する。直方体の空間の中央付近に正三角形を描くように3つのマイクロフォンが配置され、それらのマイクロフォンを取り囲む円を描くように4つの音源が配置される。4つの音源は図5の紙面下方向を0°として反時計回りに70°、150°、245°、315°の位置に配置されている。3つのマイクロフォンの描く正三角形の中心から4つの音源までの距離は1.2メートルとした。3つのマイクロフォンと4つの音源は水平に設置され、その床面からの高さは1.2メートルとした。実験では、図5中に太字で描いた紙面右側の2つの音源(70°及び150°の位置)と、紙面左側の2つのマイクロフォン(m=1,2)を用いた。
表1にその他の条件を含めた実験条件をまとめる。
Figure 0006059072
音源分離性能の評価尺度としては、SDR(signal-to-distortion ratio)を、2つの音源と8通りの話者組み合わせとに関して平均したものを用いた。以下では、このSDRの平均値を単にSDRと呼ぶ。SDRが大きいほど音源分離性能が高いことを意味する。SDRについての詳細は、「E. Vincent, H. Sawada, P. Bofill, S. Makino, and J. Rosca, “First stereo audio source separation evaluation campaign: data, algorithms and results”, in Proceedings of ICA, pp. 552-559, 2007.(参考文献2)」を参照されたい。
表2に、異なる残響時間(RT60)それぞれに対する各手法のSDRを示す。
Figure 0006059072
本発明の各方法及び比較手法の実験結果により同等のSDRが得られたことがわかる。特に、本発明の方法1においてφ=103とすると、残響時間が130,200,250,300,370ミリ秒である場合には、比較手法と同じか0.1〜0.4dB大きいSDRが得られた。残響時間が440ミリ秒である場合には比較手法のSDRの方が高かったが、その差はわずか0.1dBであった。この結果から、本発明の方法により、パーミュテーション解決の後処理を行わなくても良好に音源分離ができていることがわかる。
また、本発明の方法1と本発明の方法2とを比較すると、前者の方が高いSDRを与えた。特に、本発明の方法1において、φ=103とすると、本発明の方法2と比べて、0.8〜1.3dB大きいSDRが得られており、比較手法と同等以上のSDRが得られた。このことから、混合重みのディリクレ事前分布が、音源分離性能の低下を防ぐ効果を持つことがわかる。
<実験2>
2番目の実験は、パラメータ更新部におけるパーミュテーション解決手段の有効性を検証するための実験である。これを検証するために、次の二つの方法によるパラメータ推定を比較した。
1.本発明の方法1:実験1で用いた本発明の方法1において、ディリクレ分布のハイパーパラメータをφ=103として構成した。
2.本発明の方法3:本発明の方法1において、パーミュテーション解決手段325における処理を行わない。
平均方向の初期値としては、1〜2kHzの範囲において、真の値を音源間で交換することで得られる、パーミュテーションが生じている初期値を用いた。ここで、真の値は、仮にそれぞれの音源を別個に観測できるとして、それを用いて計算した。他の実験条件は、実験1におけるものと同一である。
本発明の各方法と比較手法とによる平均方向の推定値を比較するために、次式に示す平均方向のマイクロフォン間位相差をプロットした。
Figure 0006059072

ここで、[・]mは、ベクトルの第m要素を表す。
実験2の実験結果を図6〜9に示す。実験結果は、位相差δ(縦軸、単位は度(°))を周波数ω/(2π)(横軸、単位はキロヘルツ(kHz))の関数としてプロットした。各クラスタkに対するプロットを異なるマーカで示しており、クラスタk=1は「+」でプロットし、クラスタk=2は「×」でプロットした。
図6は、本発明の方法3の反復終了後の値である。図7は、本発明の方法1の反復終了後の値である。図8は、初期値である。図9は、真の値である。
図6に示す本発明の方法3の反復終了後のマイクロフォン間位相差は、図8に示す初期値の場合と非常に近い値をとることがわかる。EMアルゴリズムは、局所解への収束性が保証されたアルゴリズムであることから、上述の結果は、パーミュテーションの生じている初期値が目的関数の局所解となっていることを示している。
一方、図7に示す本発明の方法1の反復終了後のマイクロフォン間位相差は、図9に示す真の値の場合と非常に近い値をとることがわかる。
この結果より、本発明のパーミュテーション解決手段はパーミュテーション問題を回避するのに有効であり、本発明の方法においてパーミュテーション解決手段を用いないとパーミュテーション問題の生じている局所解に陥ってしまうことがわかる。
以上に説明したとおり、実験1の結果から、この発明によりパーミュテーション解決の後処理を行わなくても音源分離が可能であること、及び、混合重みのディリクレ事前分布が音源分離性能の低下を防ぐ効果を持つことが確認された。また、実験2の結果から、パラメータ更新部におけるパーミュテーション解決手段の有効性が確認された。
[プログラム、記録媒体]
この発明は上述の実施形態に限定されるものではなく、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。上記実施例において説明した各種の処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
また、上記実施形態で説明した各装置における各種の処理機能をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
A モデル推定装置
B 音源分離装置
1 周波数領域変換部
2 特徴抽出部
3 モデル推定部
31 事後確率計算部
32 パラメータ更新部
321 混合重み更新手段
322 相関行列更新手段
323 平均方向更新手段
324 密度パラメータ更新手段
325 パーミュテーション解決手段
33 パラメータ保持部
4 音源分離部
41 マスク作成部
42 分離音作成部
5 時間領域変換部

Claims (11)

  1. kを音源のインデックスとし、τを時間フレームのインデックスとし、ωを角周波数とし、
    K個の音源からの信号が混合された混合信号をM個のマイクロフォンで観測した観測信号から、各観測信号の時間周波数成分からなる観測信号ベクトルyτωに対応する特徴ベクトルxτωを抽出する特徴抽出部と、
    上記特徴ベクトルxτωを所定の確率モデルにあてはめ、各音源の尤度の時系列が周波数ビン間で同期しているほど高い評価値を与える評価関数を用いて、上記確率モデルのモデルパラメータを推定するモデル推定部と、
    を含み、
    上記確率モデルは、各音源に関する特徴ベクトルxτωの分布の重み付き和で表される混合モデルであり、
    上記確率モデルの混合重みは、時間フレームτに依存し、角周波数ωに依存しない重みであり、
    上記確率モデルのモデルパラメータは、上記混合重みと、各音源に関する上記特徴ベクトルxτωの分布のパラメータである
    モデル推定装置。
  2. 請求項1に記載のモデル推定装置であって、
    音源kに関する上記特徴ベクトルxτωの分布は、平均方向をaとし、密度パラメータをκとするワトソン分布であり、
    音源kに関する上記特徴ベクトルxτωの分布のパラメータは、上記平均方向aと上記密度パラメータκである
    モデル推定装置。
  3. 請求項1に記載のモデル推定装置であって、
    上記混合重みの事前分布は、音源kに依存しないハイパーパラメータφを各混合重みの指数とする上記混合重みについてのディリクレ分布である
    モデル推定装置。
  4. 請求項2に記載のモデル推定装置であって、
    上記混合重みの事前分布は、音源kに依存しないハイパーパラメータφを各混合重みの指数とする上記混合重みについてのディリクレ分布である
    モデル推定装置。
  5. 請求項に記載のモデル推定装置であって、
    上記モデル推定部は、音源kに関する上記特徴ベクトルxτωの分布と音源kの時間フレームτにおける混合重みとの積に基づいて、特徴ベクトルxτωが与えられたもとで、xτωに対応する上記観測信号ベクトルyτωが音源kに対応するクラスタに属する条件付き確率を計算する事後確率計算部と、
    上記条件付き確率と上記ハイパーパラメータφとに基づいて、上記混合重みを更新する混合重み更新手段と、
    上記条件付き確率と上記特徴ベクトルxτωとに基づいて、音源kに対する相関行列Rを計算する相関行列更新手段と、
    上記相関行列Rの正規化された主成分ベクトルを新たな値として上記平均方向aを更新する平均方向更新手段と、
    上記相関行列Rの最大固有値に基づいて、上記密度パラメータκを更新する密度パラメータ更新手段と、
    周波数ビンごとに、上記評価関数が最大になるように、上記平均方向aと上記密度パラメータκとをそれぞれ音源間で並べ替えるパーミュテーション解決手段と、
    を含むモデル推定装置。
  6. 請求項に記載のモデル推定装置であって、
    γkτωを上記条件付き確率とし、αを上記混合重みとし、d(τ,ω)を上記観測信号ベクトルyτωに寄与する音源番号とし、Fを周波数ビンの数とし、・Hを・のエルミート転置とし、λを上記相関行列Rの最大固有値とし、
    上記事後確率計算部は、次式により上記条件付き確率を計算し、
    Figure 0006059072

    上記混合重み更新手段は、次式により求めたα’を新たな値として上記混合重みを更新し、
    Figure 0006059072

    上記相関行列更新手段は、次式により求めたR’を新たな値として上記相関行列Rを更新し、
    Figure 0006059072

    上記密度パラメータ更新手段は、次式により求めたκ’を新たな値として上記密度パラメータκを更新する
    Figure 0006059072

    モデル推定装置。
  7. kを音源のインデックスとし、τを時間フレームのインデックスとし、ωを角周波数とし、
    K個の音源からの信号が混合された混合信号をM個のマイクロフォンで観測した観測信号から、各観測信号の時間周波数成分からなる観測信号ベクトルyτωに対応する特徴ベクトルxτωを抽出する特徴抽出部と、
    上記特徴ベクトルxτωを所定の確率モデルにあてはめ、各音源の尤度の時系列が周波数ビン間で同期しているほど高い評価値を与える評価関数を用いて、上記確率モデルのモデルパラメータを推定するモデル推定部と、
    上記モデルパラメータを用いて音源kに対応するマスクmkτωを求めるマスク作成部と、
    上記観測信号ベクトルyτωから上記マスクmkτωを用いて時間周波数領域の分離音を計算する分離音作成部と、
    を含み、
    上記確率モデルは、各音源に関する特徴ベクトルxτωの分布の重み付き和で表される混合モデルであり、
    上記確率モデルの混合重みは、時間フレームτに依存し、角周波数ωに依存しない重みであり、
    上記確率モデルのモデルパラメータは、上記混合重みと、各音源に関する上記特徴ベクトルxτωの分布のパラメータである
    音源分離装置。
  8. kを音源のインデックスとし、τを時間フレームのインデックスとし、ωを角周波数とし、
    特徴抽出部が、K個の音源からの信号が混合された混合信号をM個のマイクロフォンで観測した観測信号から、各観測信号の時間周波数成分からなる観測信号ベクトルyτωに対応する特徴ベクトルxτωを抽出する特徴抽出ステップと、
    モデル推定部が、上記特徴ベクトルxτωを所定の確率モデルにあてはめ、各音源の尤度の時系列が周波数ビン間で同期しているほど高い評価値を与える評価関数を用いて、上記確率モデルのモデルパラメータを推定するモデル推定ステップと、
    を含み、
    上記確率モデルは、各音源に関する特徴ベクトルxτωの分布の重み付き和で表される混合モデルであり、
    上記確率モデルの混合重みは、時間フレームτに依存し、角周波数ωに依存しない重みであり、
    上記確率モデルのモデルパラメータは、上記混合重みと、各音源に関する上記特徴ベクトルxτωの分布のパラメータである
    モデル推定方法。
  9. kを音源のインデックスとし、τを時間フレームのインデックスとし、ωを角周波数とし、
    特徴抽出部が、K個の音源からの信号が混合された混合信号をM個のマイクロフォンで観測した観測信号から、各観測信号の時間周波数成分からなる観測信号ベクトルyτωに対応する特徴ベクトルxτωを抽出する特徴抽出ステップと、
    モデル推定部が、上記特徴ベクトルxτωを所定の確率モデルにあてはめ、各音源の尤度の時系列が周波数ビン間で同期しているほど高い評価値を与える評価関数を用いて、上記確率モデルのモデルパラメータを推定するモデル推定ステップと、
    マスク作成部が、上記モデルパラメータを用いて音源kに対応するマスクmkτωを求めるマスク作成ステップと、
    分離音作成部が、上記観測信号ベクトルyτωから上記マスクmkτωを用いて時間周波数領域の分離音を計算する分離音作成ステップと、
    を含み、
    上記確率モデルは、各音源に関する特徴ベクトルxτωの分布の重み付き和で表される混合モデルであり、
    上記確率モデルの混合重みは、時間フレームτに依存し、角周波数ωに依存しない重みであり、
    上記確率モデルのモデルパラメータは、上記混合重みと、各音源に関する特徴ベクトルxτωの分布のパラメータである
    音源分離方法。
  10. 請求項1からのいずれかに記載のモデル推定装置としてコンピュータを機能させるためのプログラム。
  11. 請求項に記載の音源分離装置としてコンピュータを機能させるためのプログラム。
JP2013091223A 2013-04-24 2013-04-24 モデル推定装置、音源分離装置、モデル推定方法、音源分離方法及びプログラム Active JP6059072B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013091223A JP6059072B2 (ja) 2013-04-24 2013-04-24 モデル推定装置、音源分離装置、モデル推定方法、音源分離方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013091223A JP6059072B2 (ja) 2013-04-24 2013-04-24 モデル推定装置、音源分離装置、モデル推定方法、音源分離方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2014215385A JP2014215385A (ja) 2014-11-17
JP6059072B2 true JP6059072B2 (ja) 2017-01-11

Family

ID=51941207

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013091223A Active JP6059072B2 (ja) 2013-04-24 2013-04-24 モデル推定装置、音源分離装置、モデル推定方法、音源分離方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6059072B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11373672B2 (en) * 2016-06-14 2022-06-28 The Trustees Of Columbia University In The City Of New York Systems and methods for speech separation and neural decoding of attentional selection in multi-speaker environments

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10878832B2 (en) * 2016-02-16 2020-12-29 Nippon Telegraph And Telephone Corporation Mask estimation apparatus, mask estimation method, and mask estimation program
JP6859235B2 (ja) * 2017-09-07 2021-04-14 本田技研工業株式会社 音響処理装置、音響処理方法及びプログラム
CN115575896B (zh) * 2022-12-01 2023-03-10 杭州兆华电子股份有限公司 一种针对非点声源声源图像的特征增强方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE602004027774D1 (de) * 2003-09-02 2010-07-29 Nippon Telegraph & Telephone Signaltrennverfahren, Signaltrenneinrichtung,und Signaltrennprogramm
EP1752969A4 (en) * 2005-02-08 2007-07-11 Nippon Telegraph & Telephone SIGNAL SEPARATION DEVICE, SIGNAL SEPARATION METHOD, SIGNAL SEPARATION PROGRAM, AND RECORDING MEDIUM
JP4769238B2 (ja) * 2007-08-24 2011-09-07 日本電信電話株式会社 信号分離装置、信号分離方法、プログラム及び記録媒体
JP5337072B2 (ja) * 2010-02-12 2013-11-06 日本電信電話株式会社 モデル推定装置、音源分離装置、それらの方法及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11373672B2 (en) * 2016-06-14 2022-06-28 The Trustees Of Columbia University In The City Of New York Systems and methods for speech separation and neural decoding of attentional selection in multi-speaker environments
US11961533B2 (en) 2016-06-14 2024-04-16 The Trustees Of Columbia University In The City Of New York Systems and methods for speech separation and neural decoding of attentional selection in multi-speaker environments

Also Published As

Publication number Publication date
JP2014215385A (ja) 2014-11-17

Similar Documents

Publication Publication Date Title
CN107564513B (zh) 语音识别方法及装置
US20210327456A1 (en) Anomaly detection apparatus, probability distribution learning apparatus, autoencoder learning apparatus, data transformation apparatus, and program
CN108701468B (zh) 掩码估计装置、掩码估计方法以及记录介质
US20140114650A1 (en) Method for Transforming Non-Stationary Signals Using a Dynamic Model
JP6059072B2 (ja) モデル推定装置、音源分離装置、モデル推定方法、音源分離方法及びプログラム
JP4964259B2 (ja) パラメタ推定装置、音源分離装置、方向推定装置、それらの方法、プログラム
Mohammadiha et al. A state-space approach to dynamic nonnegative matrix factorization
JP6538624B2 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP6441769B2 (ja) クラスタリング装置、クラスタリング方法及びクラスタリングプログラム
Leglaive et al. Student's t source and mixing models for multichannel audio source separation
JP6193823B2 (ja) 音源数推定装置、音源数推定方法および音源数推定プログラム
JP5406866B2 (ja) 音源分離装置、その方法及びプログラム
JP2014021315A (ja) 音源分離定位装置、方法、及びプログラム
JP5726790B2 (ja) 音源分離装置、音源分離方法、およびプログラム
JP2013167698A (ja) 音源ごとに信号のスペクトル形状特徴量を推定する装置、方法、目的信号のスペクトル特徴量を推定する装置、方法、プログラム
Sharma et al. Novel approach to design matched digital filter with Abelian group and fuzzy particle swarm optimization vector quantization
Duong et al. Gaussian modeling-based multichannel audio source separation exploiting generic source spectral model
Singh Support vector machine based approaches for real time automatic speaker recognition system
JP6910609B2 (ja) 信号解析装置、方法、及びプログラム
Gu et al. Speech Separation Using Independent Vector Analysis with an Amplitude Variable Gaussian Mixture Model.
Mo et al. Sparse representation in Szegő kernels through reproducing kernel Hilbert space theory with applications
JP6114053B2 (ja) 音源分離装置、音源分離方法、およびプログラム
Dat et al. Robust speaker verification using low-rank recovery under total variability space
JP5807914B2 (ja) 音響信号解析装置、方法、及びプログラム
Hasumi et al. Empirical Bayesian independent deeply learned matrix analysis for multichannel audio source separation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150629

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160628

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160725

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161208

R150 Certificate of patent or registration of utility model

Ref document number: 6059072

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150