JP6845373B2 - 信号分析装置、信号分析方法及び信号分析プログラム - Google Patents

信号分析装置、信号分析方法及び信号分析プログラム Download PDF

Info

Publication number
JP6845373B2
JP6845373B2 JP2020501644A JP2020501644A JP6845373B2 JP 6845373 B2 JP6845373 B2 JP 6845373B2 JP 2020501644 A JP2020501644 A JP 2020501644A JP 2020501644 A JP2020501644 A JP 2020501644A JP 6845373 B2 JP6845373 B2 JP 6845373B2
Authority
JP
Japan
Prior art keywords
signal
matrix
simultaneous
uncorrelated
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020501644A
Other languages
English (en)
Other versions
JPWO2019163487A1 (ja
Inventor
信貴 伊藤
信貴 伊藤
中谷 智広
智広 中谷
荒木 章子
章子 荒木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2019163487A1 publication Critical patent/JPWO2019163487A1/ja
Application granted granted Critical
Publication of JP6845373B2 publication Critical patent/JP6845373B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2134Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis
    • G06F18/21343Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis using decorrelation or non-stationarity, e.g. minimising lagged cross-correlations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/0308Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/22Source localisation; Inverse modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Complex Calculations (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Description

本発明は、信号分析装置、信号分析方法及び信号分析プログラムに関する。
従来、2個の源信号が混在する状況において、それぞれ異なる位置で取得された複数の観測信号から、各源信号に由来する成分である源信号成分を推定する方法が提案されている。
N.Q.K. Duong, E. Vincent and R. Gribonval, "Under-Determined Reverberant Audio Source Separation Using a Full-Rank Spatial Covariance Model", IEEE Transactions on Audio, Speech, and Language Processing, vol.18, no. 7, pp. 1830−1840, Sep. 2010.
ここで、図24を用いて、従来の信号分析装置について説明する。図24は、従来の信号分析装置の構成を示す図である。図24に示すように、従来の信号分析装置1Pは、マルチチャネルウィーナーフィルタ部10aを有する。なお、ベクトル、行列又はスカラーであるAに対し、“^A”と記載する場合は「“A”の直上に“^”が記された記号」と同じであるとする。
マルチチャネルウィーナーフィルタ部10aは、観測信号y(k)(iは観測信号のインデックス、kはサンプル点のインデックス)と、源信号のサンプル点ごとの分散をモデル化するパラメータである分散パラメータv(k)(jは源信号のインデックス)と、源信号の空間的特性をモデル化するパラメータである空間共分散行列Rと、に基づいて、源信号成分の推定値を計算する。
具体的には、マルチチャネルウィーナーフィルタ部10aは、すべての観測信号を要素とするI次元縦ベクトルである観測信号ベクトルy(k)を次の(1)式により作成する。なお、以降において、上付きのTは、転置を表す。
Figure 0006845373
観測信号ベクトルy(k)は、2個の源信号に由来する成分(源信号成分)x(k),x(k)の和として、次の(2)式によってモデル化される。
Figure 0006845373
マルチチャネルウィーナーフィルタ部10aは、さらに、観測信号ベクトルy(k)にI×Iの行列であるマルチチャネルウィーナーフィルタW(k)を適用することにより、源信号成分x(k)の推定値^x(k)を次の(3)式により計算する。
Figure 0006845373
しかしながら、従来の信号分析装置1Pでは、大きい計算量を必要とする逆行列演算をサンプル点ごとに行う必要があった。具体的には、従来の信号分析装置1Pでは、kごとに逆行列(v(k)R+v(k)R−1を計算する必要があった。このため、従来の信号分析装置1Pでは、源信号に由来する成分である源信号成分の推定値を計算するために大きい計算量が必要であった。
本発明は、上記に鑑みてなされたものであって、源信号成分の推定値を少ない計算量で計算することができる信号分析装置、信号分析方法及び信号分析プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明の信号分析装置は、J個(Jは2以上の整数)の混在する源信号それぞれの空間的特性をモデル化する空間共分散行列R(jは1以上J以下の整数)について、PPがすべて対角行列になるような行列である同時無相関化行列Pまたは/及び、そのエルミート転置Pを、それぞれ異なるI個(Iは2以上の整数)の位置で取得される観測信号による観測信号ベクトルについてJ個の源信号に対応する成分を無相関化するためのパラメータとして得る信号パラメータ分析部を有することを特徴とする。
また、本発明の信号分析装置は、2個の混在する源信号それぞれの空間的特性をモデル化する空間共分散行列R,Rに対するp =0(i,mは1以上I以下の互いに異なる任意の整数)を満たす、それぞれ異なるI個(Iは2以上の整数)の一般化固有ベクトルp,・・・,pを列ベクトルとする行列である同時無相関化行列Pまたはそのエルミート転置Pを、I個の位置で取得される観測信号による観測信号ベクトルについて2個の源信号に対応する成分を無相関化するためのパラメータとして得る信号パラメータ分析部を有することを特徴とする。
また、本発明の信号分析装置は、J個(Jは2以上の整数)の混在する源信号それぞれの空間的特性をモデル化する空間共分散行列R(jは1以上J以下の整数)について、PPがすべて対角行列になるような行列Pを、それぞれ異なるI個(Iは2以上の整数)の位置で取得される観測信号による観測信号ベクトルについてJ個の源信号に対応する成分を無相関化するための同時無相関化行列として、同時無相関化行列のエルミート転置を、観測信号ベクトルに掛けることにより、J個の源信号に対応する成分が無相関化された同時無相関化済観測信号ベクトルを得る同時無相関化部を有することを特徴とする。
また、本発明の信号分析装置は、J個(Jは2以上の整数)の混在する源信号から得た同時無相関化された共分散行列に基づいて、源信号の空間的特性をモデル化するパラメータである空間共分散行列を求める空間共分散行列計算部、または/及び同時無相関化された共分散行列に基づいて、源信号のサンプル点ごとの分散をモデル化するパラメータである分散パラメータを求める分散パラメータ計算部を有することを特徴とする。
本発明によれば、源信号成分の推定値を少ない計算量で計算することができる。
図1は、第1の実施形態に係る信号分析装置の構成の一例を示す図である。 図2は、第1の実施形態に係る信号分析処理の処理手順の一例を示すフローチャートである。 図3は、第2の実施形態に係る信号分析装置の構成の一例を示す図である。 図4は、第2の実施形態に係る信号分析処理の処理手順の一例を示すフローチャートである。 図5は、第3の実施形態に係る信号分析装置の構成の一例を示す図である。 図6は、第3の実施形態に係る信号分析処理の処理手順の一例を示すフローチャートである。 図7は、従来の方法及び第3の実施形態を用いた音源分離実験の実験条件を示す図である。 図8は、従来の方法及び第3の実施形態を用いた音源分離実験結果(real time factor)を示す図である。 図9は、従来の方法及び第3の実施形態を用いた音源分離実験結果(音源分離性能)を示す図である。 図10は、第4の実施形態に係る信号分析装置の構成の一例を示す図である。 図11は、第4の実施形態に係る信号分析処理の処理手順の一例を示すフローチャートである。 図12は、第5の実施形態に係る信号分析装置の構成の一例を示す図である。 図13は、第5の実施形態に係る信号分析処理の処理手順の一例を示すフローチャートである。 図14は、従来の方法及び第5の実施形態を用いた音源分離実験の実験条件を示す図である。 図15は、従来の方法及び第5の実施形態を用いた音源分離実験結果(real time factor)を示す図である。 図16は、従来の方法及び第5の実施形態を用いた音源分離実験結果(音源分離性能)を示す図である。 図17は、第6の実施形態に係る信号分析装置の構成の一例を示す図である。 図18は、第6の実施形態に係る信号分析処理の処理手順の一例を示すフローチャートである。 図19は、周波数領域信号分離部の構成の一例を示す図である。 図20は、周波数領域信号分離処理の処理手順の一例を示すフローチャートである。 図21は、第8の実施形態に係る信号分析装置の構成の一例を示す図である。 図22は、第8の実施形態に係る信号分析処理の処理手順の一例を示すフローチャートである。 図23は、プログラムが実行されることにより、信号分析装置が実現されるコンピュータの一例を示す図である。 図24は、従来の信号分析装置の構成を示す図である。
以下に、本願に係る信号分析装置、信号分析方法及び信号分析プログラムの実施形態を図面に基づいて詳細に説明する。また、本発明は、以下に説明する実施形態により限定されるものではない。なお、以下では、ベクトル、行列又はスカラーであるAに対し、“^A”と記載する場合は「“A”の直上に“^”が記された記号」と同じであるとする。ベクトル、行列又はスカラーであるAに対し、“~A”と記載する場合は「“A”の直上に“~”が記された記号」と同じであるとする。また、以下では、信号分離は、信号分析の下位概念とする。
[第1の実施形態]
まず、第1の実施形態に係る信号分析装置の構成、処理の流れ及び効果について説明する。なお、第1の実施形態においては、2個の源信号が混在する状況において、それぞれ異なる位置でマイクロホンなどのセンサにより取得されたI個(Iは2以上の整数)の観測信号y(k)(i=1,・・・,Iは観測信号のインデックス、kはサンプル点のインデックス)と、源信号のサンプル点ごとの分散(パワー)をモデル化するパラメータである分散パラメータv(k)(j=1,2は源信号のインデックス)と、源信号の空間的特性をモデル化するパラメータである空間共分散行列Rと、が信号分析装置に入力されるものとする。
なお、本第1の実施形態における「信号」の例としては、音、脳波、無線信号などが挙げられる。本第1の実施形態における「観測信号」とは、複数のセンサ(センサアレイ)により取得された信号を指す。センサアレイの例としては、マイクロホンアレイ、脳波計・脳磁計、アンテナアレイなどが挙げられる。また、本第1の実施形態における「源信号」とは、観測信号の構成要素である信号を指す。観測信号は2個の源信号の和としてモデル化される。
また、本第1の実施形態における「信号分離」の問題設定は、2個の目的信号(たとえば音声)が混在する状況においてこれらに対応する成分を推定する問題設定(たとえば音源分離)に加えて、目的信号(たとえば音声)とノイズ(たとえばテレビから流れる音楽や雑踏における喧噪)が混在する状況においてこれらに対応する成分(または目的信号に対応する成分のみ)を推定する問題設定(ノイズ除去とも呼ばれる)をも含むものとする。前者の場合における源信号は、目的信号(たとえば音声)である。後者の場合における源信号は、目的信号(たとえば音声)とノイズ(たとえばテレビから流れる音楽や雑踏における喧噪)とである。なお、「雑踏における喧噪」は、多数のノイズが混ざったものであるが、この場合まとめて1つの源信号とみなす。
[信号分析装置の構成及び処理]
まず、図1及び図2を用いて、第1の実施形態に係る信号分析装置の構成及び信号分析処理の処理手順について説明する。図1は、第1の実施形態に係る信号分析装置の構成の一例を示す図である。図2は、第1の実施形態に係る信号分析処理の処理手順の一例を示すフローチャートである。第1の実施形態に係る信号分析装置1は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、CPU(Central Processing Unit)等を含むコンピュータ等に所定のプログラムが読み込まれて、CPUが所定のプログラムを実行することで実現される。
図1に示すように、信号分析装置1は、観測信号ベクトル作成部10、信号パラメータ分析部20、同時無相関化部30、シングルチャネルウィーナーフィルタ部40及び同時無相関化逆変換部50を有する。
まず、信号分析装置1の各部の概要について説明する。観測信号ベクトル作成部10は、入力された観測信号y(k)を取得し(ステップS10)、(4)式に示す、すべての観測信号からなるI次元縦ベクトルである観測信号ベクトルをサンプル点ごとに作成する(ステップS11)。
Figure 0006845373
信号パラメータ分析部20は、入力された空間共分散行列Rを取得し、一般化固有値問題を解くことにより、一般化固有値行列Λ及び一般化固有ベクトル行列Pを計算する(ステップS12)。
同時無相関化部30は、観測信号ベクトル作成部10からの観測信号ベクトルy(k)と、信号パラメータ分析部20からの一般化固有ベクトル行列Pと、に基づいて、同時無相関化された観測信号ベクトルy´(k)を計算する(ステップS13)。具体的には、同時無相関化部30は、(5)式に示すように、観測信号ベクトルy(k)に、一般化固有ベクトル行列Pのエルミート転置Pを掛けることにより、同時無相関化された観測信号ベクトルy´(k)を計算する。
Figure 0006845373
ここで、「´(上付きのプライム)」は、同時無相関化を施された変数であることを表す。なお、同時無相関化とは、観測信号ベクトルy(k)に含まれる、2個の源信号に対応する成分(源信号成分)を同時に無相関化する線型変換を指す。
シングルチャネルウィーナーフィルタ部40は、入力された分散パラメータv(k)を取得し、信号パラメータ分析部20からの一般化固有値行列Λと、同時無相関化部30からの同時無相関化された観測信号ベクトルy´(k)と、に基づいて、同時無相関化された源信号成分x´(k)の推定値^x´(k)を計算する(ステップS14)。具体的には、シングルチャネルウィーナーフィルタ部40は、同時無相関化された源信号成分x´(k)の推定値^x´(k)を(6),(7)式により計算する。
Figure 0006845373
Figure 0006845373
ただし、ベクトルαに対し、[α]はαの第l要素を表し、行列Aに対し、[A]lmはAの(l,m)要素を表す。また、変数の上の∧(ハット)は、推定値であることを表す。
同時無相関化逆変換部50は、信号パラメータ分析部20からの一般化固有ベクトル行列Pと、シングルチャネルウィーナーフィルタ部40からの同時無相関化された源信号成分x´(k)の推定値^x´(k)と、に基づいて、源信号成分x(k)の推定値^x(k)を計算し、出力する(ステップS15)。具体的には、同時無相関化逆変換部50は、(8)式に示すように、同時無相関化された源信号成分x´(k)の推定値^x´(k)に対し、同時無相関化部30で掛けた一般化固有ベクトル行列Pのエルミート転置Pの逆行列(P−1を掛けることにより、源信号成分x(k)の推定値^x(k)を計算し、出力する。
Figure 0006845373
[第1の実施形態の処理の背景]
次に、第1の実施形態の処理の背景について説明する。なお、以下では、観測信号が複素数で表される場合について説明する(観測信号が実数で表される場合の説明は、ほぼ同様だから省略する)。第1の実施形態においては、観測信号ベクトルy(k)は、2個の源信号に対応する成分(源信号成分)x(k),x(k)の和として、次に示す(9)式でモデル化される。
Figure 0006845373
源信号成分x(k)は、平均が0、共分散行列がS(k)であるとし、2個の源信号成分x(k),x(k)は互いに無相関であるとする。2個の源信号成分x(k),x(k)は、ともに目的信号(たとえば音声)に対応する源信号成分であっても良いし、一方が目的信号(たとえば音声)に対応する源信号成分で他方がノイズ(たとえばテレビからの雑音や雑踏における喧噪)に対応する源信号成分であっても良い。
観測信号ベクトルy(k)から源信号成分x(k)を推定する方法としては、マルチチャネルウィーナーフィルタに基づく方法がある。この方法では、源信号成分x(k)の推定値^x(k)を(10)式により計算する。
Figure 0006845373
すなわち、この方法では、観測信号ベクトルy(k)に対し、I×Iの行列であるマルチチャネルウィーナーフィルタS(k)(S(k)+S(k))−1を掛けることにより、源信号成分x(k)の推定値^x(k)を計算する。
[従来の信号分析方法]
ここで、従来の信号分析方法(例えば、非特許文献1に記載の信号分析方法)では、(10)式に基づいて源信号成分x(k)の推定値^x(k)を計算する。その際、源信号成分x(k)の共分散行列S(k)は、次の(11)式によりモデル化される。なお、(11)式におけるEは、期待値演算である。
Figure 0006845373
ここで、v(k)は、源信号のサンプル点ごと(kごと)の分散をモデル化するパラメータである分散パラメータであり、Rは、源信号の空間的特性をモデル化するパラメータである空間共分散行列である。従来の信号分析方法では、(10)式に(11)式を代入して得られる(12)式を用いて、源信号成分x(k)の推定値^x(k)を計算していた。
Figure 0006845373
上述の従来の信号分析方法の問題点として、膨大な計算量を要するため、大規模なデータセットの処理(サンプル点kの数が膨大になる)や、リアルタイム処理(短時間での処理が要求される)、計算能力の低い機器などへの適用が困難だった。
実際、従来技術では、源信号成分x(k)の推定値^x(k)を計算する際に、逆行列計算(具体的には、(v(k)R+v(k)R−1の計算)をサンプル点毎に(つまり多数回)行う必要があった。逆行列計算は、I次行列に対しO(I)という大きな計算量を要する演算である。また、サンプル点の数は、典型的には数百〜数千万程にもなる。そのため、従来の信号分析方法では、源信号成分x(k)の推定値^x(k)を計算する際に、膨大な計算量を必要としていた。
[第1の実施の形態に係る信号分析方法]
これに対し、第1の実施形態では、2個の源信号成分x(k),x(k)の同時無相関化に基づいて、源信号成分x(k)の推定値^x(k)を少ない計算量で計算する方法を提供する。以下、第1の実施形態における考え方について説明する。
各サンプル点kに対し信号α(k)の共分散行列E(α(k)α(k))が対角行列であるとき、α(k)は無相関であるという。これは、簡単に言えば、「ベクトルα(k)の異なる要素同士は相関を持たない」ということである。いま仮に、(11)式の源信号成分x(k)の共分散行列v(k)R(jは1または2)がいずれも対角行列であるとすると、(12)式における逆行列演算(v(k)R+v(k)R−1は単なる対角要素ごとの逆数演算により実現できるため、少ない計算量で計算できる。しかしながら、通常、源信号成分x(k)の異なる要素同士は互いに強い相関を持つため、その共分散行列v(k)Rは対角行列ではない。そこで、本第1の実施形態では、2個の源信号成分x(k),x(k)を同時無相関化することを考える。
2個の源信号成分x(k),x(k)の同時無相関化とは、(13)式及び(14)式に示すように、x(k),x(k)に正則行列Vを掛ける線型変換を施して、線型変換後の源信号成分x´(k),x´(k)が同時に無相関になるようにする(すなわち、x´(k),x´(k)の共分散行列S´(k),S´(k)が同時に対角行列になるようにする)ことを指すものとする。この同時無相関化により、源信号成分x(k)の共分散行列v(k)Rはいずれも対角行列に変換される。したがって、同時無相関化により、(12)式における逆行列演算(v(k)R+v(k)R−1は、対角行列に対する逆行列演算に変わり、単なる対角要素ごとの逆数演算により実現できるようになるため、少ない計算量で計算できるようになる。
Figure 0006845373
Figure 0006845373
x´(k),x´(k)の共分散行列S´(k),S´(k)を計算すると、次の(15)〜(19)式のようになる。
Figure 0006845373
Figure 0006845373
同時無相関化の条件は、これらが同時に対角行列になること、すなわち以下の(20)式及び(21)式が同時に成り立つことである。なお、Λ,Λは或る対角行列である。
Figure 0006845373
Figure 0006845373
すなわち、同時無相関化の目標は、空間共分散行列R,Rに対し、左から正則行列Vを、右からVのエルミート転置Vを、それぞれ掛けたときに、これらが同時に対角行列になるような正則行列Vを求めること(同時対角化)である。
このような行列Vは、一般化固有値問題に基づいて、以下のようにして求めることができる。(22)式に示す、空間共分散行列R,Rに対する一般化固有値問題を解く。
Figure 0006845373
すると、I個の一般化固有値λ,・・・,λと、λ,・・・,λにそれぞれ対応するI個の一般化固有ベクトルp,・・・,pと、が得られる。ここで、一般化固有ベクトルp,・・・,pは、次の(23)式を満たすように取ることができる。
Figure 0006845373
これらの一般化固有ベクトルp,・・・,pを用いて、行列Pを次の(24)式により定めると、これは、次の(25)式及び(26)式を満たす(例えば、参考文献1「G. Strang, “Linear Algebra and Its Applications”, Harcourt Brace Jovanovich, 1988.」参照)。
Figure 0006845373
Figure 0006845373
Figure 0006845373
ただし、Iは単位行列、Λは一般化固有値λ,・・・,λからなる(27)式の対角行列である。
Figure 0006845373
したがって、行列Vを次の(28)式により定めると、これは同時無相関化の条件である(20)式及び(21)式を満たす(Λ=Λ、Λ=Iである)。
Figure 0006845373
以下、(27)式における一般化固有値からなる対角行列Λを一般化固有値行列と呼び、(24)式における一般化固有ベクトルからなる行列Pを一般化固有ベクトル行列と呼ぶことがある。また、上述のように、Pは同時無相関化を実現する行列でもあるから、その意味でPを同時無相関化行列とも呼ぶ。
信号パラメータ分析部20は、空間共分散行列R,Rに対する一般化固有値λ,・・・,λと、λ,・・・,λにそれぞれ対応する一般化固有ベクトルp,・・・,pであって(23)式を満たすものと、を計算し、一般化固有値λ,・・・,λを対角要素とする対角行列である一般化固有値行列Λと、一般化固有ベクトルp,・・・,pを列ベクトルとする正則行列である一般化固有ベクトル行列Pと、を、(27)式と(24)式とにより作成する。
上述のように、2個の源信号成分x(k),x(k)は、(24)式で定義される行列Pのエルミート転置Pを掛ける線型変換により、同時無相関化される。観測信号ベクトルのモデルを示す(9)式の両辺に対し、この線形変換を施すと、次の(29)式を得る。
Figure 0006845373
ここで、(18)式、(19)式、(25)式、(26)式及び(28)式より、x´(k),x´(k)の共分散行列S´(k),S´(k)は、次の(30)式及び(31)式のように、ともに対角行列である。
Figure 0006845373
Figure 0006845373
ただし、Λは(27)式で定義される対角行列である。(29)式にマルチチャネルウィーナーフィルタを適用する場合、x´(k)の推定値^x´(k)は、次の(32)式で与えられる。
Figure 0006845373
(32)式における共分散行列S´(k),S´(k)は、(30)式及び(31)式に示すように対角行列である。したがって、(32)式は、以下の(36)式及び(40)式に示すように非常に簡単になる。このように、同時無相関化により、(12)式における逆行列演算(v(k)R+v(k)R−1は、(33)式と(37)式のように対角行列に対する逆行列演算(v(k)Λ+v(k)I)−1に変わり、単なる対角要素ごとの逆数演算により実現できるようになるため、少ない計算量で計算できるようになる。
Figure 0006845373
Figure 0006845373
シングルチャネルウィーナーフィルタ部40は、同時無相関化された源信号成分x´(k)の推定値^x´(k)を(36)式及び(40)式により計算する。
(36)式及び(40)式の処理は、シングルチャネルウィーナーフィルタに基づく処理と解釈することもできる。そのことを説明するために、まず、シングルチャネルウィーナーフィルタとは何であるかを説明する。マルチチャネルウィーナーフィルタが複数(I個)の観測信号を用いて推定を行うのに対し、シングルチャネルウィーナーフィルタは1個の観測信号のみを用いて推定を行う。シングルチャネルウィーナーフィルタでは、1個の観測信号(スカラー)y(k)を、2個の源信号成分(スカラー)x(k),x(k)の和として次の(41)式でモデル化する。
Figure 0006845373
ここで、観測信号が1個しかないことに対応して、y(k),x(k),x(k)はいずれもスカラーである。源信号成分x(k)は、平均が0、分散がσ (k)であるとし、2個の源信号成分x(k),x(k)は互いに無相関であるとする。シングルチャネルウィーナーフィルタに基づく方法では、源信号成分x(k)の推定値^x(k)は、次の(42)式により計算される。
Figure 0006845373
すなわち、この方法では、観測信号y(k)に対し、シングルチャネルウィーナーフィルタσ (k)/(σ (k)+σ (k))を掛けることにより、源信号成分x(k)の推定値^x(k)を計算する。
ここで、(29)式を要素ごとに見た場合、第i要素より次の(43)式を得る。
Figure 0006845373
上式に基づくシングルチャネルウィーナーフィルタを用いて、[y´(k)]から[x´(k)]を推定することを考える。一般に、確率ベクトルαの共分散行列がAであるとき、αの第l要素[α]の分散は、Aの(l,l)要素[A]llであることから、[x´(k)]の分散は[S´(k)]iiである。よって、(30)式及び(31)式より、[x´(k)]の分散はv(k)λであり、[x´(k)]の分散はv(k)である。したがって、シングルチャネルウィーナーフィルタに基づく[x´(k)]の推定値[^x´(k)]は、次の(44)式及び(45)式で与えられる。
Figure 0006845373
Figure 0006845373
これらはそれぞれ、(36)式及び(40)式の第i要素に他ならない。
さて、上記のようにして得られた同時無相関化された源信号成分x´(k)=P(k)の推定値^x´(k)は、推定が上手く行っていれば、次の(46)式のように真値に近い値を取ると期待される。
Figure 0006845373
上式の両辺に行列(P−1を掛けると、次の(47)式を得る。
Figure 0006845373
そこで、次の(48)式により、源信号成分x(k)の推定値^x(k)を計算する。
Figure 0006845373
このように、第1の実施形態によれば、源信号成分x(k)の推定値^x(k)の計算において、サンプル点ごとの逆行列演算を行う必要がないため、少ない計算量で信号分離を実現することができる。なお、上式は逆行列(P−1を含むが、これはkに依存しないため、サンプル点ごとではなく1回計算するだけで良いことに注意する。
従来の信号分析方法における源信号成分x(k)の推定値を^x conv(k)で表し、第1の実施形態における源信号成分x(k)の推定値を^x prop(k)で表す。^x conv(k)と^x prop(k)とは理論上一致することが示される。ここで、^x conv(k)は、(49)式によって与えられる。
Figure 0006845373
また、(5)式と、(33)式〜(40)式と、(48)式と、により、^x prop(k)は次の(50)式及び(51)式に等しい。
Figure 0006845373
Figure 0006845373
以下では、j=1の場合について説明する。なお、j=2の場合については、j=1の場合と同様であるから、説明を省略する。(25)式及び(26)式によって、以下の(52)式及び(53)式が導き出される。
Figure 0006845373
Figure 0006845373
これらを、(49)式に代入すると、次の(54)式〜(57)式を得る。
Figure 0006845373
上述のことから、従来の信号分析方法と第1の実施形態とで、源信号成分x(k)の推定値^x(k)の計算結果は理論上一致する。ただし、もちろんコンピュータによる計算誤差が生じることはある。
このように、本実施の形態1に係る信号分析装置1では、信号パラメータ分析部20は、2個の混在する源信号それぞれの空間的特性をモデル化する空間共分散行列R,Rに対するp =0(i,mは1以上I以下の互いに異なる任意の整数)を満たす、それぞれ異なるI個(Iは2以上の整数)の一般化固有ベクトルp,・・・,pを列ベクトルとする行列である同時無相関化行列Pまたはそのエルミート転置Pを、I個の位置で取得される観測信号による観測信号ベクトルについて2個の源信号に対応する成分を無相関化するためのパラメータとして得る。信号分析装置1では、この無相関化するためのパラメータを用いて同時無相関化を行うことによって、フィルタリングでは、計算量の少ない要素ごとの掛け算を行うだけで足り、源信号成分の推定値の計算量を低減することができる。
同時無相関化部30は、信号パラメータ分析部20が得た同時無相関化行列Pのエルミート転置Pを、入力されたI個の観測信号による観測信号ベクトルに掛けることにより、2個の源信号に対応する成分が無相関化された同時無相関化済観測信号ベクトルを得る。
そして、シングルチャネルウィーナーフィルタ部40は、同時無相関化部30が得た同時無相関化済観測信号ベクトルの各要素に、同時無相関化行列Pに基づく行列PP(jは1以上2以下の整数)の対角成分に基づくシングルチャネルウィーナーフィルタを適用して同時無相関化済源信号成分推定値によるベクトルを得る。
さらに、同時無相関化逆変換部50は、シングルチャネルウィーナーフィルタ部40が得た同時無相関化済源信号成分推定値によるベクトルに、同時無相関化行列Pのエルミート転置Pの逆行列(P−1を掛けることにより、源信号成分の推定値を得る。
[第1の実施形態の効果]
このような構成を有する第1の実施形態によれば、上記のように、従来の信号分析方法と比べて、信号分離性能を低下させることなく、より少ない計算量で信号分離を実現することができる。すなわち、第1の実施形態では、観測信号ベクトルに対し、同時無相関化を行ってから、フィルタリングを行い、最後に同時無相関化の逆変換を行うことにより、源信号成分の推定値を計算する。ここで、同時無相関化を実現する行列Pは、空間共分散行列に対する一般化固有値問題を解くことにより、求めることができる。
この結果、第1の実施形態では、従来技術と比べて少ない計算量で源信号成分の推定値を計算できる。これは主に、以下の理由による。
第一に、第1の実施の形態では、同時無相関化により、フィルタリングは要素ごとの掛け算という計算量の小さい処理になり、サンプル点ごとの逆行列演算という計算量の大きい処理が不要になる。第二に、第1の実施の形態では、サンプル点によらない空間共分散行列に対する一般化固有値問題を解いて得られる行列Pを用いて同時無相関化を行うため、一般化固有値問題はサンプル点ごとではなく1回だけ解けば良い。これは、源信号成分の共分散行列が、サンプル点によらない空間共分散行列のスカラー倍であるとモデル化したことにより可能になったことである。第三に、第1の実施の形態では、同時無相関化の逆変換を行う際には、同時無相関化の行列Pの逆行列演算を行う必要があるが、同じ理由により、これはサンプル点ごとではなく1回だけ行えば良い。
さらに、第1の実施の形態では、観測信号ベクトルに対して、同時無相関化を行ってから、フィルタリングを行い、最後に同時無相関化の逆変換を行う、第1の実施形態における処理と、観測信号ベクトルに対して直接フィルタリングを行う従来技術における処理とは、等価である。このため、第1の実施形態によれば、従来技術と比べて信号分離性能を劣化させることなく、従来技術より少ない計算量で源信号成分の推定値を計算することができる。
[第1の実施形態の変形例1]
次に、第1の実施形態の変形例1について説明する。第1の実施形態では、一般化固有ベクトルp,・・・,pは、(23)式の制約条件を満たすものとした。本第1の実施形態の変形例1では、一般化固有ベクトルp,・・・,pが(23)式以外の制約条件を満たすものとした場合の信号分析装置について説明する。本第1の実施形態の変形例1に係る信号分析装置における信号パラメータ分析部では、空間共分散行列R,Rに対する(58)式に示す一般化固有値問題を解く。
Figure 0006845373
この結果、I個の一般化固有値λ,・・・,λとλ,・・・,λにそれぞれ対応するI個の一般化固有ベクトルp,・・・,pと、が得られる。ここで、上に述べた実施の形態1の例では、一般化固有ベクトルp,・・・,pは、次の(59)式を満たすように取る。
Figure 0006845373
これに対して、第1の実施形態の変形例1では、一般化固有ベクトルp,・・・,pを、次の(60)式を満たすように取る(各σは所定の正数)。
Figure 0006845373
これらの一般化固有ベクトルp,・・・,pを用いて、行列Pを次の(61)式により定めると、これは、(62)式及び(63)式を満たす。
Figure 0006845373
Figure 0006845373
Figure 0006845373
ただし、Λ,Λは、次の(64)式及び(65)式に示す対角行列である。
Figure 0006845373
Figure 0006845373
したがって、行列Vを次の(66)式により定めると、これは、同時無相関化の条件(20)式及び(21)式を満たす。ただし、(64)式及び(65)式のΛ及びΛが、(20)式及び(21)式におけるΛ及びΛに相当する。
Figure 0006845373
以下、(27)式における一般化固有値からなる対角行列Λを一般化固有値行列、(61)式における一般化固有ベクトルからなる行列Pを一般化固有ベクトル行列と呼ぶことがある。このようにして求めた行列Pを、同時無相関化行列として用いることができる。本第1の実施形態の変形例1に係る信号分析装置におけるシングルチャネルウィーナーフィルタ部では、同時無相関化された源信号成分x´(k)の推定値^x´(k)を、次の(67)式及び(68)式により計算する。
Figure 0006845373
Figure 0006845373
他の各部における処理は、上記の第1の実施形態と同様である。
このように、第1の実施形態の変形例1では、信号パラメータ分析部20は、2個の混在する源信号それぞれの空間的特性をモデル化する空間共分散行列R,Rに対するp =0(i,mは1以上I以下の互いに異なる任意の整数)を満たす、それぞれ異なるI個(Iは2以上の整数)の一般化固有ベクトルp,・・・,pを列ベクトルとする行列である同時無相関化行列Pまたはそのエルミート転置Pを、I個の位置で取得される観測信号による観測信号ベクトルについて2個の源信号に対応する成分を無相関化するためのパラメータとして得る。
[第1の実施形態の変形例2]
次に、第1の実施形態の変形例2について説明する。第1の実施形態の変形例2では、信号パラメータ分析部における処理のもう一つの変形例について説明する。第1の実施形態では、信号パラメータ分析部20は、固有値分析に基づいて、PPとPPとが対角行列になる行列Pとそのときの対角行列Λ=PPを求めていた。これに対し、本第1の実施形態の変形例2では、信号パラメータ分析部20は、最適化に基づいて、Λ=PPと、Λ=PPとができるだけ、ある対角行列Σ,Σに近づくような行列PとそのときのΛ=PP及びΛ=PPを求める。
すなわち、第1の実施形態の変形例2では、信号パラメータ分析部20は、次のような行列PとそのときのΛ=PP及びΛ=PPを求める((69)式及び(70)式参照)。
Figure 0006845373
Figure 0006845373
具体的には、次の(71)式のコスト関数を行列Pと対角行列ΣとΣに関して最小化することにより、行列Pを求めることができる。
Figure 0006845373
ここで、||A||は、行列Aのフロベニウスノルムを表す。例えば、上式のコスト関数の最小化は、参考文献2「A. Yeredor, “Non-Orthogonal Joint Diagonalization in the Least-Squares Sense with Application in Blind Source Separation”, IEEE Transactions on Signal Processing, vol. 50, no. 7, pp. 1545−1553, Jul. 2002.」に記載のアルゴリズムに従って行うことができる。このようにして求めた行列Pを、同時無相関化行列として用いることができる。
また、Λ=PP及びΛ=PPに基づき、第1の実施形態の変形例1と同様にして、シングルチャネルウィーナーフィルタ部40における同時無相関化された源信号成分x´(k)の推定値^x´(k)を計算することができる。他の各部における処理は、上に述べた第1の実施形態と同様である。
このように、第1の実施形態の変形例2では、信号パラメータ分析部20は、J個(この変形例ではJは2)の混在する源信号それぞれの空間的特性をモデル化する空間共分散行列R(jは1以上J以下の整数)について、PPがすべて対角行列に近づくように求めた行列である同時無相関化行列Pまたは/及びそのエルミート転置Pを、それぞれ異なるI個(Iは2以上の整数)の位置で取得される観測信号による観測信号ベクトルについてJ個の源信号に対応する成分を無相関化するためのパラメータとして得る。
[第1の実施形態の変形例3]
次に、第1の実施形態の変形例3について説明する。本第1の実施形態の変形例3では、第1の実施形態の変形例2の方法に基づき、源信号が2個の場合に限らず、源信号が一般にJ個の場合に拡張する場合について説明する。
なお、第1の実施形態の変形例3においては、J個の源信号が混在する状況において、それぞれ異なる位置で取得されたI個の観測信号y(k)と、源信号のサンプル点ごとの分散(パワー)をモデル化するパラメータである分散パラメータv(k)(j=1,・・・,Jは源信号のインデックス)と、源信号の空間的特性をモデル化するパラメータである空間共分散行列Rと、が信号分析装置1に入力されるものとする。
第1の実施の形態の変形例3では、信号パラメータ分析部20は、最適化に基づいて、Λ=PP,・・・,Λ=PPが、できるだけ、ある対角行列Σ,・・・,Σに近づくような行列Pと、そのときのΛ=PP,・・・,Λ=PPを求める。
すなわち、第1の実施形態の変形例3では、信号パラメータ分析部20は、次の(72)式〜(73)式に示すような行列Pと、そのときのΛ=PP,・・・,Λ=PPを求める。
Figure 0006845373
具体的には、次の(74)式のコスト関数を行列Pと各対角行列Σ(jは1以上J以下の整数)に関して最小化することにより、行列Pを求めることができる。
Figure 0006845373
例えば、上式のコスト関数の最小化は、参考文献2に記載のアルゴリズムに従って行うことができる。本第1の実施形態の変形例3では、このようにして求めたPを、同時無相関化行列として用いることができる。また、Λ=PP,・・・,Λ=PPに基づき、同時無相関化された源信号成分x´(k)の推定値^x´(k)を計算することができる。
次に、源信号がJ個の場合の信号分析装置1の構成と処理について説明する。信号分析装置1は、観測信号ベクトル作成部10、信号パラメータ分析部20、同時無相関化部30、シングルチャネルウィーナーフィルタ部40及び同時無相関化逆変換部50を有する。観測信号ベクトル作成部10は、入力された観測信号y(k)を取得し、すべての観測信号からなるI次元縦ベクトルである観測信号ベクトルy(k)をサンプル点ごとに作成する。観測信号ベクトルy(k)は、次の(75)式で示される。
Figure 0006845373
信号パラメータ分析部20は、入力された空間共分散行列Rを取得する。
Figure 0006845373
そして、上述の(76)〜(78)式で定義される各行列Λ(jは1以上J以下の整数)が対角行列になるような同時無相関化行列Pと、そのときのΛ,・・・,Λを計算する。
同時無相関化部30は、観測信号ベクトル作成部10からの観測信号ベクトルy(k)と、信号パラメータ分析部20からの同時無相関化行列Pと、に基づいて、同時無相関化された観測信号ベクトルy´(k)を計算する。具体的には、(79)式に示すように、同時無相関化部30は、観測信号ベクトルy(k)に同時無相関化行列Pのエルミート転置Pを掛けることにより、同時無相関化された観測信号ベクトルy´(k)を計算する。
Figure 0006845373
なお、同時無相関化とは、観測信号ベクトルy(k)に含まれる、J個の源信号に対応する成分(源信号成分)を同時に無相関化する線型変換を指す。
シングルチャネルウィーナーフィルタ部40は、入力された分散パラメータv(k)を取得し、信号パラメータ分析部20からの行列Λと、同時無相関化部30からの同時無相関化された観測信号ベクトルy´(k)と、に基づいて、同時無相関化された源信号成分x´(k)の推定値^x´(k)を計算する。具体的には、シングルチャネルウィーナーフィルタ部40は、同時無相関化された源信号成分x´(k)の推定値^x´(k)を次の(80)式により計算する。
Figure 0006845373
同時無相関化逆変換部50は、信号パラメータ分析部20からの同時無相関化行列Pと、シングルチャネルウィーナーフィルタ部40からの同時無相関化された源信号成分x´(k)の推定値^x´(k)と、に基づいて、源信号成分x(k)の推定値^x(k)を計算し、出力する。具体的には、同時無相関化逆変換部50は、同時無相関化された源信号成分x´(k)の推定値^x´(k)に対し、(81)式のように、同時無相関化部30で掛けた行列Pの逆行列(P−1を掛けることにより、源信号成分x(k)の推定値^x(k)を計算し、出力する。
Figure 0006845373
このように、第1の実施形態の変形例3では、信号パラメータ分析部20は、J個(Jは2以上の整数)の混在する源信号それぞれの空間的特性をモデル化する空間共分散行列R(jは1以上J以下の整数)について、PPがすべて対角行列に近づくように求めた行列である同時無相関化行列Pまたは/及びそのエルミート転置Pを、それぞれ異なるI個(Iは2以上の整数)の位置で取得される観測信号による観測信号ベクトルについてJ個の源信号に対応する成分を無相関化するためのパラメータとして得る。
[第1の実施形態及び第1の実施形態の変形例1〜3の効果]
このように、本第1の実施形態及び本第1の実施形態の変形例1〜3によれば、源信号成分x(k)の推定値^x(k)を少ない計算量で計算することができる。特に、第1の実施形態の固有値分析に基づく構成によれば、従来技術と比べて信号分離性能を劣化させることなく、従来技術より少ない計算量で信号分離を行うことができる。
なお、第1の実施形態の変形例2,3では、対角行列Σに近づくように行列Λを求める。ただし、行列Λは実際には対角行列にならないことがある。この場合には、対角行列に近い行列Λ=行列PP」の「対角成分」をλとして使ってシングルチャネルウィーナーフィルタの処理を行う。したがって、第1の実施形態の変形例2,3のシングルチャネルウィーナーフィルタの処理では、行列Λの非対角成分は用いず、対角成分のみを用いるので、非対角成分は特定しない構成としても良い。
[第2の実施形態]
次に、第2の実施形態に係る信号分析装置の構成、処理の流れ及び効果について説明する。
第1の実施形態で説明したように、分散パラメータv(k)及び空間共分散行列Rが既知の場合には、これらに基づいて、源信号成分x(k)の推定値^x(k)を計算できる。一方、分散パラメータv(k)及び空間共分散行列Rが未知の場合には、これらを推定する必要がある。
そこで、本第2の実施形態においては、2個の源信号が混在する状況において、分散パラメータv(k)及び空間共分散行列Rと、源信号成分x(k)と、を反復法により同時に推定する方法について説明する。第2の実施形態においては、それぞれ異なる位置で取得されたI個の観測信号y(k)が信号分析装置に入力されるものとする。
[信号分析装置の構成及び処理]
図3及び図4を用いて、第2の実施形態に係る信号分析装置の構成及び信号分析処理の処理手順について説明する。図3は、第2の実施形態に係る信号分析装置の構成の一例を示す図である。図4は、第2の実施形態に係る信号分析処理の処理手順の一例を示すフローチャートである。
図3に示すように、信号分析装置201は、初期化部(図示しない)、観測信号ベクトル作成部210、信号パラメータ分析部220、同時無相関化部230、シングルチャネルウィーナーフィルタ部240、事後共分散行列更新部250、分散パラメータ更新部260、空間共分散行列更新部270、収束判定部(図示しない)及び同時無相関化逆変換部280を有する。
まず、信号分析装置201の各部の概要について説明する。図示しない初期化部は、分散パラメータv(k)の初期推定値^v (0)(k)と、空間共分散行列Rの初期推定値^R (0)と、を設定する(ステップS20)。これらは、例えば乱数に基づいて設定すればよい。
観測信号ベクトル作成部210は、入力された観測信号y(k)を取得し(ステップS21)、すべての観測信号からなるI次元縦ベクトルである観測信号ベクトルy(k)をサンプル点ごとに作成する(ステップS22)。
信号パラメータ分析部220は、空間共分散行列更新部270からの同時無相関化された空間共分散行列R´の推定値^R´(ただし、例外として、信号パラメータ分析部220における最初の処理の際には、入力された空間共分散行列Rの初期推定値^R (0))に基づいて、一般化固有値問題を解くことにより、一般化固有値行列Λ及び一般化固有ベクトル行列Pを更新する(ステップS23)。
同時無相関化部230は、観測信号ベクトル作成部210からの観測信号ベクトルy(k)と、信号パラメータ分析部220からの一般化固有ベクトル行列Pと、に基づいて、同時無相関化された観測信号ベクトルy´(k)を更新する(ステップS24)。
シングルチャネルウィーナーフィルタ部240は、信号パラメータ分析部220からの一般化固有値行列Λと、同時無相関化部230からの同時無相関化された観測信号ベクトルy´(k)と、分散パラメータ更新部260からの分散パラメータv(k)の推定値^v(k)(ただし、例外として、シングルチャネルウィーナーフィルタ部240における最初の処理の際には、入力された分散パラメータv(k)の初期推定値^v (0)(k)と、に基づいて、同時無相関化された源信号成分x´(k)の推定値^x´(k)を更新する(ステップS25)。
事後共分散行列更新部250は、信号パラメータ分析部220からの一般化固有値行列Λと、分散パラメータ更新部260からの分散パラメータv(k)の推定値^v(k)(ただし、例外として、事後共分散行列更新部250における最初の処理の際には、入力された分散パラメータv(k)の初期推定値^v (0)(k))と、に基づいて、同時無相関化された事後共分散行列Σ´(k)を更新する(ステップS26)。
分散パラメータ更新部260は、信号パラメータ分析部220からの一般化固有値行列Λと、シングルチャネルウィーナーフィルタ部240からの同時無相関化された源信号成分x´(k)の推定値^x´(k)と、事後共分散行列更新部250からの同時無相関化された事後共分散行列Σ´(k)と、に基づいて、分散パラメータv(k)の推定値^v(k)を更新する(ステップS27)。
空間共分散行列更新部270は、シングルチャネルウィーナーフィルタ部240からの同時無相関化された源信号成分x´(k)の推定値^x´(k)と、事後共分散行列更新部250からの同時無相関化された事後共分散行列Σ´(k)と、分散パラメータ更新部260からの分散パラメータv(k)の推定値^v(k)と、に基づいて、同時無相関化された空間共分散行列R´の推定値^R´を更新する(ステップS28)。
図示しない収束判定部は、収束したかどうかの判定を行う(ステップS29)。収束判定部が収束していないと判定した場合(ステップS29:No)、ステップS23の信号パラメータ分析部220での処理に戻って、処理が継続される。
一方、収束判定部が収束したと判定した場合(ステップS29:Yes)、同時無相関化逆変換部280での以下の処理が行われる。
具体的には、同時無相関化逆変換部280は、信号パラメータ分析部220からの一般化固有ベクトル行列Pと、シングルチャネルウィーナーフィルタ部240からの同時無相関化された源信号成分x´(k)の推定値^x´(k)と、に基づいて、源信号成分x(k)の推定値^x(k)を計算し、出力する(ステップS30)。
次に、信号分析装置201の各部の詳細について説明する。なお、初期化部については上述の通りである。
観測信号ベクトル作成部210は、入力された観測信号y(k)を取得し、すべての観測信号からなるI次元縦ベクトルである観測信号ベクトルy(k)を次の(82)式により作成する。
Figure 0006845373
信号パラメータ分析部220は、信号パラメータ分析部220における最初の処理の際に、初期化部からの空間共分散行列Rの初期推定値^R (0)を受け取る。そして、信号パラメータ分析部220は、^R (0),^R (0)に対する一般化固有値問題を解くことにより、一般化固有値λ,・・・,λと、λ,・・・,λにそれぞれ対応する一般化固有ベクトルp,・・・,pであって、(83)式を満たすものを計算する。
Figure 0006845373
これによって、信号パラメータ分析部220は、一般化固有値行列Λ及び一般化固有ベクトル行列Pを次の(84)式及び(85)式により更新する。
Figure 0006845373
Figure 0006845373
信号パラメータ分析部220は、信号パラメータ分析部220における2回目以降の処理の際に、空間共分散行列更新部270からの同時無相関化された空間共分散行列R´の推定値^R´を受け取って、^R´,^R´に対する一般化固有値問題を解くことにより、一般化固有値λ,・・・,λと、λ,・・・,λにそれぞれ対応する一般化固有ベクトルq,・・・,qであって、(86)式を満たすものを計算する。
Figure 0006845373
そして、信号パラメータ分析部220は、一般化固有値行列Λ及び行列Qを(87)式及び(88)式により更新する。
Figure 0006845373
Figure 0006845373
そして、信号パラメータ分析部220は、一般化固有ベクトル行列Pを次の(89)式により更新する。
Figure 0006845373
同時無相関化部230は、(90)式に示すように、観測信号ベクトルy(k)に一般化固有ベクトル行列Pのエルミート転置Pを掛けることにより、同時無相関化された観測信号ベクトルy´(k)を更新する。
Figure 0006845373
シングルチャネルウィーナーフィルタ部240は、同時無相関化された源信号成分x´(k)の推定値^x´(k)を(91)式及び(92)式により更新する。
Figure 0006845373
Figure 0006845373
ただし、例外として、シングルチャネルウィーナーフィルタ部240における最初の処理の際に、上の2式において、分散パラメータ更新部260からの分散パラメータv(k)の推定値^v(k)の代わりに、初期化部からの分散パラメータv(k)の初期推定値^v (0)(k)を用いる。
事後共分散行列更新部250は、同時無相関化された事後共分散行列Σ´(k)を、次の(93)式により更新する。
Figure 0006845373
ただし、例外として、事後共分散行列更新部250における最初の処理の際には、上式において、分散パラメータ更新部260からの分散パラメータv(k)の推定値^v(k)の代わりに、初期化部からの分散パラメータv(k)の初期推定値^v (0)(k)を用いる。
分散パラメータ更新部260は、分散パラメータv(k)の推定値^v(k)を次の(94)式により更新する。
Figure 0006845373
空間共分散行列更新部270は、同時無相関化された空間共分散行列R´の推定値^R´を次の(95)式により更新する。(95)式において、Kはサンプル点の数である。
Figure 0006845373
同時無相関化逆変換部280は、源信号成分x(k)の推定値^x(k)を次の(96)式により計算し、出力する。
Figure 0006845373
[第2の実施形態に係る信号分析装置の処理の背景]
[従来の信号分析方法]
次に、信号分析装置201の処理の背景について説明する。まず、従来技術について説明する。2個の源信号が混在する状況において、分散パラメータv(k)及び空間共分散行列Rと、源信号成分x(k)と、を反復法により同時に推定する方法が、非特許文献1に開示されている。
ここで、従来技術における観測信号ベクトルy(k)のモデル化について説明する。(9)式における源信号成分x(k)は、次の(97)式のように平均0、共分散行列v(k)Rの複素ガウス分布に従うものとする。
Figure 0006845373
ここで、N(z;μ,Σ)は、平均がμ、共分散行列がΣの複素ガウス分布((98)式)を表す。
Figure 0006845373
また、2個の源信号成分x(k),x(k)は互いに無相関であると仮定する。観測信号ベクトルy(k)が与えられた条件下での源信号成分x(k)の事後確率密度は、次の(99)式で与えられる(例えば、非特許文献1を参照)。
Figure 0006845373
ここで、平均^x(k)及び共分散行列Σ(k)は、次の(100)式及び(101)式により与えられる。
Figure 0006845373
Figure 0006845373
(100)式における平均^x(k)は、(10)式におけるマルチチャネルウィーナーフィルタに基づく源信号成分x(k)の推定値^x(k)に他ならない(両者に同じ記号を用いているのはそのためである)。したがって、(10)式におけるマルチチャネルウィーナーフィルタに基づく源信号成分x(k)の推定値^x(k)は、観測信号ベクトルy(k)が与えられた条件下での源信号成分x(k)の事後確率密度を最大化する点と解釈できることが分かった。(101)式はjに依らないから、(102)式と書く。
Figure 0006845373
従来技術では、下記第1の処理〜第4の処理により、分散パラメータv(k)及び空間共分散行列Rと、源信号成分x(k)と、を同時に推定する。
第1の処理では、分散パラメータv(k)の推定値^v(k)と、空間共分散行列Rの推定値^Rと、を初期化する。これらは、例えば、乱数に基づいて初期化すればよい。
第2の処理では、分散パラメータv(k)の推定値^v(k)と、空間共分散行列Rの推定値^Rと、に基づいて、源信号成分x(k)を推定する。第1の実施形態では、源信号成分x(k)の1つの推定値^x(k)を計算したのに対し、ここでは源信号成分x(k)の事後確率密度((99)式参照)を更新する。具体的には、(99)式の平均^x(k)と共分散行列Σ(k)((102)式の通りΣ(k)及びΣ(k)に等しい。(101)式も参照。)を次の(103)式及び(104)式により更新する。
Figure 0006845373
Figure 0006845373
第3の処理では、源信号成分x(k)の事後確率密度の平均^x(k)と共分散行列Σ(k)に基づいて、分散パラメータv(k)の推定値^v(k)と、空間共分散行列Rの推定値^Rと、を次の(105)式及び(106)式により更新する。ここで、trはトレースである。
Figure 0006845373
Figure 0006845373
第4の処理では、第2及び第3の処理を、収束するまで交互に反復し、収束した場合に、源信号成分x(k)の推定値^x(k)を出力する。
従来技術の問題点として、膨大な計算量を要するため、サンプル点kの数が膨大になる大規模なデータセットの処理、短時間での処理が要求されるリアルタイム処理、或いは、計算能力の低い機器などへの適用が困難だった。
実際、従来技術では、源信号成分x(k)の推定値^x(k)と事後共分散行列Σ(k)を計算する際に、逆行列計算(具体的には(v(k)R+v(k)R−1の計算)と行列乗算(具体的には(v(k)R)(v(k)R+v(k)R−1(v(k)R)の計算)とを、サンプル点毎に(つまり多数回)行う必要があった。逆行列計算と行列乗算とはともに、I次行列に対し、O(I)という大きな計算量を要する演算である。また、サンプル点の数は、典型的には数百〜数千万程にもなる。
このため、従来の信号分析方法では、源信号成分x(k)の推定値^x(k)と事後共分散行列Σ(k)を計算する際に、膨大な計算量を必要としていた。さらに、従来では、信号分析装置全体として、上記の第4の処理における反復を行う必要がある(反復回数は典型的には数十回にもなる)ため、計算量はさらに膨大となる。
[第2の実施の形態に係る信号分析方法]
これに対し、第2の実施形態では、2個の源信号成分x(k),x(k)の同時無相関化に基づいて、源信号成分x(k)の推定値^x(k)と事後共分散行列Σ(k)と空間共分散行列Rと分散パラメータvとを少ない計算量で計算する方法を提供する。この結果、信号分析装置201全体としても、少ない計算量で信号分析を実現することができる。以下、第2の実施形態における考え方について説明する。
従来技術(非特許文献1参照)の更新則(103)式〜(106)式において、何回目の反復であるかを明示すると、以下の(107)式〜(110)式のようになる。なお、n=1,・・・,Nは何回目の反復であるかを表すインデックス、Nは反復回数である。
Figure 0006845373
Figure 0006845373
Figure 0006845373
Figure 0006845373
空間共分散行列R,Rの推定値^R (n−1),^R (n−1)の一般化固有値問題に対して、第1の実施形態と同様にして定義される一般化固有値行列及び一般化固有ベクトル行列を、Λ(n−1)及びP(n−1)で表す。これらは、(111)式及び(112)式を満たす。
Figure 0006845373
Figure 0006845373
すなわち、Λ(n−1)及びP(n−1)は(113)式及び(114)式を満たす。P(n−1)は同時無相関化(同時対角化)を実現する行列であるから、その意味でP(n−1)を同時無相関化行列とも呼ぶ。
Figure 0006845373
Figure 0006845373
(107)式からサンプル点ごとの逆行列演算を消すために、(107)式に(113)式と(114)式とを代入して整理すると、第1の実施形態と同様に、次の(115)式、(116)式を得る。
Figure 0006845373
同様に、(108)式からサンプル点ごとの逆行列演算を消すために、(108)式に、(113)式と(114)式とを代入すると、次の(118)式〜(121)式を得る。
Figure 0006845373
これで、サンプル点ごとの逆行列演算を消すことができた。しかしながら、(121)式は、まだ、サンプル点ごとの行列の乗算を含んでいる。そこで、Σ(n)(k)の代わりに、(122)式により定義される、Σ´(n)(k)を更新することを考える。
Figure 0006845373
(121)式より、Σ´(n)(k)は、(123)式で表せる。
Figure 0006845373
(123)式には、サンプル点ごとの行列の乗算が含まれない。Σ´(n)(k)は同時無相関化の線型変換を施された事後共分散行列とみなせるから、以下、同時無相関化された事後共分散行列と呼ぶ。
そして、(115)式と(116)式とにおいても、^x (n)(k)の代わりに、(124)式で定義される^x´ (n)(k)を更新することを考える。
Figure 0006845373
(115)式及び(116)式より、(125)式及び(126)式となる。
Figure 0006845373
Figure 0006845373
^x´ (n)(k)は同時無相関化された源信号成分である。
次に、(109)式に着目すると、これは、^x (n)(k)とΣ(n)(k)に依存している。上述のように、第2の実施形態では、^x (n)(k)とΣ(n)(k)の代わりに^x´ (n)(k)とΣ´(n)(k)とを更新する。そこで、(109)式も、^x´ (n)(k)とΣ´(n)(k)とを用いて計算できる形に書き換える必要がある。(124)式及び(122)式より、^x (n)(k)とΣ(n)(k)は(127)式及び(128)式と表せる。
Figure 0006845373
Figure 0006845373
これらを(109)式に代入すると(129)式〜(133)式を経て(134)式が得られる。
Figure 0006845373
(110)式についても同様に、^x´ (n)(k)とΣ´(n)(k)とを用いて計算できる形に書き換えるために、(127)式と(128)式とを代入すると、次の(135)式及び(136)式のようになる。
Figure 0006845373
ここでも、^R (n)の代わりに、(137)式で定義される^R´ (n)を更新することにする。
Figure 0006845373
これにより、逆行列演算と行列の乗算とをいくつか減らせるため、計算量を削減することができる。また、^R´ (n)は、(136)式より、(138)式のように表せる。
Figure 0006845373
^R´ (n)は同時無相関化の線型変換を施された空間共分散行列とみなせるから、以下、同時無相関化された空間共分散行列と呼ぶ。
最後に、一般化固有値行列Λ及び一般化固有ベクトル行列Pの更新について説明する。最初の反復においては、空間共分散行列R,Rの初期推定値^R (0),^R (0)の一般化固有値問題を解くことにより、Λ(0)及びP(0)を求めればよい。
2回目以降の反復においては、同時無相関化された空間共分散行列の推定値^R´ (n),^R´ (n)が得られている。これを同時無相関化の逆変換により^R (n),^R (n)に戻してから、一般化固有値問題を適用することも可能だが、やや無駄な計算が生じる。
そこで、以下のようにすれば、より効率的に計算できる。まず、^R´ (n),^R´ (n)の一般化固有値問題を解いて、一般化固有値を対角成分とする対角行列Λ(n)と、一般化固有ベクトルを列ベクトルとする行列Q(n)と、を求める。これらは、(Q(n)(^R´ (n))Q(n)=Λ(n)及び(Q(n)(^R´ (n))Q(n)=Iを満たすものとする。
次に、P(n)を(139)式により更新する。
Figure 0006845373
このとき、Λ(n)及びP(n)は、^R (n),^R (n)に対する一般化固有値行列及び一般化固有ベクトル行列になる。これは、次の(140)式〜(147)式のようにして確認できる。
Figure 0006845373
Figure 0006845373
[第2の実施形態の効果]
このように、第2の実施形態によれば、(同時無相関化された)源信号成分の推定値及び(同時無相関化された)事後共分散行列と空間共分散行列と分散パラメータとを従来技術と比べて少ない計算量で計算できるため、従来技術と比べて少ない計算量で信号分離を実現できる。
これは以下の理由による。第一に、第1の実施形態と同様に、同時無相関化に基づくことで、サンプル点ごとの逆行列演算が不要になる。第二に、事後共分散行列Σ(n)(k)そのものではなく、同時無相関化された事後共分散行列Σ´(n)(k)を更新するようにすることで、サンプル点ごとの行列の乗算が不要になる。
また、上記のように、従来の信号分析方法の処理と第2の実施形態の処理とは理論上等価であるため、従来の信号分析方法と第2の実施形態とで信号分析結果は理論上一致する(ただし、もちろんコンピュータによる計算誤差が生じることはある)。したがって、第2の実施形態によれば、従来の信号分析方法と比べて、信号分析性能を低下させることなく、より少ない計算量で信号分析を実現することができる。
また、第1の実施形態とは異なり、第2の実施形態によれば、分散パラメータv(k)及び空間共分散行列Rが未知の場合でも、分散パラメータv(k)及び空間共分散行列Rと、源信号成分x(k)と、を同時に推定することができる。
[第3の実施形態]
次に、第3の実施形態に係る信号分析装置の構成、処理の流れ及び効果について説明する。
第3の実施形態においては、2個の音源信号が混在する状況において、それぞれ異なる位置でマイクロホンにより取得されたI個(Iは2以上の整数)の観測信号y(t)が信号分析装置に入力されるものとする。観測信号y(t)は、周波数分解され、周波数ごとに第2の実施形態に記載の方法で信号分離がなされ、最後に時間領域に変換される。
[信号分析装置の構成及び処理]
図5及び図6を用いて、第3の実施形態に係る信号分析装置の構成及び信号分析処理の処理手順について説明する。図5は、第3の実施形態に係る信号分析装置の構成の一例を示す図である。図6は、第3の実施形態に係る信号分析処理の処理手順の一例を示すフローチャートである。
図5に示すように、信号分析装置301は、周波数領域変換部310、周波数領域信号分離部320及び時間領域変換部330を有する。
まず、信号分析装置301の各部の概要について説明する。周波数領域変換部310は、入力された観測信号y(t)を受け取り(ステップS40)、短時間フーリエ変換などにより時間周波数領域の観測信号y(k,f)を計算する(ステップS41)。ここで、kは時間フレームのインデックスであり、fは周波数ビンのインデックスである。以下、y(k,f)をy (k)で表す。
周波数領域信号分離部320は、fごとに第2の実施形態の方法を適用して、周波数領域での信号分離を行う(ステップS42)。すなわち、f=1に対しては、y (k)を入力として、第2の実施形態の方法により源信号成分の推定値^x (k),^x (k)を得る。
そして、f=2に対しては、y (k)を入力として、第2の実施形態の方法により、源信号成分の推定値^x (k),^x (k)を得る。各fについてこれらを繰り返す。
そして、f=Fに対しては、y (k)を入力として、第2の実施形態の方法により、源信号成分の推定値^x (k),^x (k)を得る。以下、^x (k)を、^x(k,f)で表す。
時間領域変換部330は、時間周波数領域の源信号成分の推定値^x(k,f)に基づいて、逆短時間フーリエ変換などにより、時間領域の源信号成分の推定値^x(t)を計算し、出力する(ステップS43)。
このように、第3の実施形態では、時間周波数領域において、周波数ビンfごとに第2の実施形態に係る方法を適用する。これに対し、非特許文献1には、時間周波数領域において、周波数ビンfごとに第2の実施形態に記載した従来技術を適用する方法が開示されている。
この従来技術の問題点として、膨大な計算量を要するため、大規模なデータセットの処理や、リアルタイム処理(短時間での処理が要求される)、計算能力の低い機器などへの適用が困難だった。実際、従来技術では、逆行列計算と行列乗算とを、周波数ビンごと、フレームごと、反復ごとに(つまり多数回)行う必要があった。このため、従来の信号分析方法では、膨大な計算量を必要としていた。
例えば、後述の実験では、8秒の観測信号に対して、周波数ビンの数は256、フレームの数は249、反復数は10であり、処理に750秒を要した。これが80000秒(およそ22時間)のデータセットになれば、処理に7500000秒(およそ87日)掛かる計算になる。
[第3の実施形態の効果]
本発明の効果を確認するために、従来の方法及び第3の実施形態を用いた音源分離実験について説明する。
図7は、従来の方法及び第3の実施形態を用いた音源分離実験の実験条件を示す図である。図8は、従来の方法及び第3の実施形態を用いた音源分離実験結果(real time factor)を示す図である。図9は、従来の方法及び第3の実施形態を用いた音源分離実験結果(音源分離性能)を示す図である。
8秒間の英語音声に、図7に示す実験室で測定された残響インパルス応答を畳み込んで残響音声を生成し、複数人の残響音声を加算することで観測信号を生成した。このとき、観測信号に対して、各方法を用いて音源分離を行った場合の性能を図8及び図9に示す。図8は、real time factor(観測信号長を1としたときの、処理に要した時間)である。また、図9は、音源分離性能である信号対歪み比(値が大きいほど音源分離性能が高い)である。
図8及び図9に示すように、本第3の実施形態に係る方法によれば、従来の方法と比べて音源分離性能を低下させることなく、250倍以上の計算時間削減が実現できたことが分かる。なお、残響時間が130ミリ秒及び440ミリ秒の場合には、本第3の実施形態に係る方法による信号対歪み比は、従来の方法と比べてわずかに低下しているが、これはコンピュータによる計算の誤差によるものである。このように、本第3の実施形態に係る方法は従来の方法と理論的には等価だが、実際には計算誤差に起因して性能差が生じることもあるものの、それは図8のようにごく僅かな差に過ぎない。
このように、第3の実施形態によれば、従来の方法と比べて音源分離性能を低下させることなく、計算時間の大きな削減が実現できる。
[第4の実施形態]
次に、第4の実施形態に係る信号分析装置の構成、処理の流れ及び効果について説明する。
第4の実施形態は、第2の実施形態において、分散パラメータv(k)及び空間共分散行列Rを、補助関数法を用いて推定する構成に変更したものである。
[信号分析装置の構成及び処理]
図10及び図11を用いて、第4の実施形態に係る信号分析装置の構成及び信号分析処理の処理手順について説明する。図10は、第4の実施形態に係る信号分析装置の構成の一例を示す図である。図11は、第4の実施形態に係る信号分析処理の処理手順の一例を示すフローチャートである。
図10に示すように、信号分析装置401は、初期化部(図示しない)、観測信号ベクトル作成部410、信号パラメータ分析部420、同時無相関化部430、分散パラメータ更新部440、空間共分散行列更新部450、収束判定部(図示しない)を有する。
まず、信号分析装置401の各部の概要について説明する。図示しない初期化部は、分散パラメータv(k)の初期推定値^v (0)(k)と、空間共分散行列Rの初期推定値^R (0)と、を設定する(ステップS51)。これらは、例えば乱数に基づいて設定すればよい。
観測信号ベクトル作成部410は、入力された観測信号y(k)を取得し(ステップS52)、すべての観測信号からなるI次元縦ベクトルである観測信号ベクトルy(k)をサンプル点ごとに作成する(ステップS53)。
信号パラメータ分析部420は、空間共分散行列更新部450からの空間共分散行列Rの推定値^Rに基づいて、一般化固有値問題を解くことにより、一般化固有値行列Λ及び一般化固有ベクトル行列Pを更新する(ステップS54)。具体的には、信号パラメータ分析部420は、空間共分散行列R,Rの推定値^R,^Rの一般化固有値問題に対して、第1の実施形態と同様にして定義される一般化固有値行列Λ及び一般化固有ベクトル行列Pを求める。これらは、(148)式及び(149)式を満たすものとする。
Figure 0006845373
Figure 0006845373
ただし、例外として、信号パラメータ分析部420における最初の処理の際には、信号パラメータ分析部420における上述の処理において、空間共分散行列更新部450からの空間共分散行列Rの推定値^Rの代わりに、入力された空間共分散行列Rの初期推定値^R (0)を用いる。
同時無相関化部430は、観測信号ベクトル作成部410からの観測信号ベクトルy(k)と、信号パラメータ分析部420からの一般化固有ベクトル行列Pと、に基づいて、同時無相関化された観測信号ベクトルy´(k)を(90)式により更新する(ステップS55)。
分散パラメータ更新部440は、同時無相関化部430からの同時無相関化された観測信号ベクトルy´(k)と、信号パラメータ分析部420からの一般化固有値行列Λと、に基づいて、分散パラメータv(k)の推定値^v(k)を次の(150)式及び(151)式により更新する(ステップS56)。
Figure 0006845373
Figure 0006845373
ここで、右辺の^v(k)及び^v(k)は、分散パラメータ更新部440における前回の処理で得られた分散パラメータの推定値(ただし、例外として、分散パラメータ更新部440における最初の処理の際には、初期化部からの分散パラメータの初期推定値)を表す。
空間共分散行列更新部450は、同時無相関化部430からの同時無相関化された観測信号ベクトルy´(k)と、信号パラメータ分析部420からの一般化固有ベクトル行列P及び一般化固有値行列Λと、分散パラメータ更新部440からの分散パラメータv(k)の推定値^v(k)と、に基づいて、空間共分散行列Rの推定値^Rを更新する(ステップS57)。具体的には、空間共分散行列更新部450は、まず次の(152)式により行列Cを更新する。
Figure 0006845373
次に、空間共分散行列更新部450は、次の(153)式によりベクトルz(k)を更新する。
Figure 0006845373
次に、空間共分散行列更新部450は、次の(154)式により行列Dを更新する。
Figure 0006845373
次に、空間共分散行列更新部450は、次の(155)式により空間共分散行列Rの推定値^Rを更新する。
Figure 0006845373
図示しない収束判定部は、収束したかどうかの判定を行う(ステップS58)。収束判定部が収束していないと判定した場合(ステップS58:No)、信号パラメータ分析部420での処理(ステップS54)に戻って、処理が継続される。
一方、収束判定部が収束したと判定した場合(ステップS58:Yes)、分散パラメータ更新部440が分散パラメータv(k)の推定値^v(k)を出力し、空間共分散行列更新部450が空間共分散行列Rの推定値^Rを出力する(ステップS59)。
[第4の実施形態の背景]
第4の実施形態の背景について説明する。補助関数法に基づけば、分散パラメータv(k)及び空間共分散行列Rは、次のように推定できる。分散パラメータv(k)及び空間共分散行列Rの推定値はあらかじめ初期化され、以下に述べる反復処理により更新される。分散パラメータv(k)の推定値^v(k)は、次の(156)式により更新される。
Figure 0006845373
空間共分散行列Rの更新においては、まず(157)式及び(158)式により行列C及び行列Dが更新され、次に、(159)式により空間共分散行列Rの推定値^Rが更新される。
Figure 0006845373
Figure 0006845373
Figure 0006845373
ここで、半正定値エルミート行列Aの平方根A1/2は、(160)式をAの固有値分解とすると、(161)式により定義される。ここで、UはAの固有ベクトルからなるユニタリ行列、ΛはAの固有値からなる対角行列、Σ1/2はΣの各対角要素[Σ]iiをその平方根([Σ]ii1/2で置き換えることにより得られる対角行列である。
Figure 0006845373
Figure 0006845373
上記の分散パラメータv(k)の推定値^v(k)及び空間共分散行列Rの推定値^Rの更新は、収束するまで反復される。
上記の分散パラメータv(k)の推定値^v(k)及び空間共分散行列Rの推定値^Rの更新則は、参考文献3「Kazuyoshi Yoshii,Ryota Tomioka,Daichi Mochihashi,and Masataka Goto,“Infnite Positive Semidefinite Tensor Factorization for Source Separation of Mixture Signals”,Proceedings of the 30th International Conference on Machine Learning,2013.」、参考文献4「Hiroshi Sawada,Hirokazu Kameoka,Shoko Araki,and Naonori Ueda,“Multichannel Extensions of Non−Negative Matrix Factorization With Complex−Valued Data”,IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING,VOL.21,No.5,MAY 2013.」に開示されている方法と同様の方法により導出することができる。
上記の方法の問題点として、(156)式〜(158)式の各処理において、サンプル点ごとの逆行列演算を行う必要があるため、膨大な計算量を必要とする。
これに対し、本第4の実施形態では、同時無相関化(同時対角化)に基づいて、サンプル点ごとの逆行列演算を回避することにより、計算量を削減することができる。実際、(148)式及び(149)式を^R、^Rについて解いたものを(156)式〜(158)式に代入することにより、分散パラメータv(k)及び空間共分散行列Rの推定値の更新則が以下のように得られる。
分散パラメータv(k)の推定値^v(k)の更新則は、次の(162)式及び(163)式のようになる。
Figure 0006845373
ここで、y´(k)は、(164)式の同時無相関化済観測信号ベクトルであり、Λは一般化固有値行列Λであり、Λは単位行列Iである。
Figure 0006845373
空間共分散行列Rの推定値^Rの更新則は次の(165)式及び(166)式のようになる。まず、行列Cに関しては、次式のようになる。
Figure 0006845373
行列Dに関しては次の(167)式及び(168)式のようになる。
Figure 0006845373
ただし、ベクトルz(k)は、次の(169)式〜(171)式により定義される。
Figure 0006845373
[第4の実施形態の効果]
このように、同時無相関化(同時対角化)により、サンプル点ごとの逆行列演算を不要にし、計算量を削減することができる。具体的には、同時無相関化(同時対角化)に基づき、分散パラメータv(k)の推定値^v(k)の更新式を(162)式のように対角行列Λ=PPを用いて表すことができ、その結果、(163)式のように逆行列演算を不要にすることができる。空間共分散行列Rの推定値^Rの更新則についても同様である。
なお、(155)式の処理では、(159)式の処理と同様、逆行列演算を行う必要があるが、これはサンプル点ごとではなく各反復にて1回だけ行えば良いため、その計算量は比較的小さい。同様に、(155)式の処理では、(159)式の処理と同様、行列の平方根の計算のために固有値分解を行う必要があるが、これはサンプル点ごとではなく各反復にて2回だけ行えば良いため、その計算量は比較的小さい。また、(166)式、(168)式、及び(155)式の処理では、逆行列演算と同様に計算量の大きい演算である行列の乗算を含んでいるが、これもサンプル点ごとに行う必要はないため、その計算量は比較的小さい。
[第4の実施形態の変形例]
なお、本実施形態においては、源信号が2個の場合について説明したが、第1の実施形態の変形例3と同様の考え方に基づけば、源信号が2個の場合に限らず、源信号が一般にJ個の場合に拡張することができる。
上記のように、第1〜第4の実施形態では、信号パラメータ分析部が、J個(Jは2以上の整数)の混在する源信号それぞれの空間的特性をモデル化する空間共分散行列R(jは1以上J以下の整数)について、PPがすべて対角行列になるような行列である同時無相関化行列Pまたは/及び、そのエルミート転置Pを、それぞれ異なるI個(Iは2以上の整数)の位置で取得される観測信号による観測信号ベクトルについてJ個の源信号に対応する成分を無相関化するためのパラメータとして得る。信号分析装置1,201,301,401では、この無相関化するためのパラメータを用いて同時無相関化を行うことによって、フィルタリングでは、計算量の少ない要素ごとの掛け算を行うだけで足り、源信号成分の推定値の計算量を低減することができる。
[第5の実施形態]
次に、第5の実施形態に係る信号分析装置の構成、処理の流れ及び効果について説明する。第5の実施形態は、第1の実施形態の変形例3のバリエーションである。第1の実施形態の変形例3では、分散パラメータv(k)と空間共分散行列Rが信号分析装置に入力されるとの前提条件がある。これに対し、第5の実施形態では、分散パラメータv(k)と空間共分散行列Rとが信号分析装置に入力される必要はなく、分散パラメータv(k)と、空間共分散行列Rをモデル化するパラメータである同時無相関化行列P及び同時無相関化された空間共分散行列Λと、源信号成分x(k)との同時推定を実現する。
本第5の実施形態では、一般にJ個の源信号が混在し、分散パラメータv(k)及び空間共分散行列Rが未知の状況で、分散パラメータv(k)と、空間共分散行列Rをモデル化するパラメータである同時無相関化行列P及び同時無相関化された空間共分散行列Λと、源信号成分x(k)と、を同時に推定することにより、信号分離を実現する方法について説明する。本第5の実施形態では、それぞれ異なる位置で取得されたI個の観測信号y(k)が信号分析装置に入力されるものとする。
[信号分析装置の構成及び処理]
図12及び図13を用いて、第5の実施形態に係る信号分析装置の構成及び信号分析処理の処理手順について説明する。図12は、第5の実施形態に係る信号分析装置の構成の一例を示す図である。図13は、第5の実施形態に係る信号分析処理の処理手順の一例を示すフローチャートである。
図12に示すように、信号分析装置501は、初期化部(図示しない)、観測信号ベクトル作成部510、同時無相関化部530、シングルチャネルウィーナーフィルタ部540、事後共分散行列更新部550、分散パラメータ更新部560、空間共分散行列更新部570、信号パラメータ分析部520、収束判定部(図示しない)及び同時無相関化逆変換部580を有する。
まず、信号分析装置501の各部の概要について説明する。図示しない初期化部は、分散パラメータv(k)の初期推定値^v (0)(k)と、同時無相関化行列Pの初期推定値^P(0)と、同時無相関化された空間共分散行列Λの初期推定値^Λ (0)と、を設定する(ステップS61)。これらは、例えば乱数に基づいて設定すればよい。
観測信号ベクトル作成部510は、入力されたそれぞれ異なる位置で取得されたI個の観測信号y(k)を取得し(ステップS62)、I次元縦ベクトルである観測信号ベクトルy(k)をサンプル点ごとに(82)式により作成する(ステップS63)。
同時無相関化部530は、観測信号ベクトル作成部510からの観測信号ベクトルy(k)と、信号パラメータ分析部520からの同時無相関化行列Pの推定値^P(ただし例外として、同時無相関化部530における最初の処理の際には、初期化部からの同時無相関化行列Pの初期推定値^P(0))と、に基づいて、同時無相関化された観測信号ベクトルy´(k)を次の(172)式により更新する(ステップS64)。
Figure 0006845373
ただし、同時無相関化部530における最初の処理の際には、(172)式の右辺において、^Pを^P(0)で置き換える。
シングルチャネルウィーナーフィルタ部540は、同時無相関化部530からの同時無相関化された観測信号ベクトルy´(k)と、分散パラメータ更新部560からの分散パラメータv(k)の推定値^v(k)(ただし、例外として、シングルチャネルウィーナーフィルタ部540における最初の処理の際には、初期化部からの分散パラメータv(k)の初期推定値^v (0)(k))と、空間共分散行列更新部570からの同時無相関化された空間共分散行列Λの推定値^Λ(ただし、例外として、シングルチャネルウィーナーフィルタ部540における最初の処理の際には、初期化部からの同時無相関化された空間共分散行列Λの初期推定値^Λ (0))と、に基づいて、同時無相関化された源信号成分x´(k)の推定値^x´(k)を次の(173)式により更新する(ステップS65)。
Figure 0006845373
ただし、シングルチャネルウィーナーフィルタ部540における最初の処理の際には、(173)式の右辺において、^Λ(j=1,・・・,J)を^Λ (0)(j=1,・・・,J)に、^v(k)(j=1,・・・,J;k=1,・・・,K)を^v (0)(k)(j=1,・・・,J;k=1,・・・,K)に、それぞれ置き換える。
事後共分散行列更新部550は、分散パラメータ更新部560からの分散パラメータv(k)の推定値^v(k)(ただし、例外として、事後共分散行列更新部550における最初の処理の際には、初期化部からの分散パラメータv(k)の初期推定値^v (0)(k))と、空間共分散行列更新部570からの同時無相関化された空間共分散行列Λの推定値^Λ(ただし、例外として、事後共分散行列更新部550における最初の処理の際には、初期化部からの同時無相関化された空間共分散行列Λの初期推定値^Λ (0))と、に基づいて、同時無相関化された事後共分散行列Σ´(k)を次の(174)式により更新する(ステップS66)。
Figure 0006845373
ただし、事後共分散行列更新部550における最初の処理の際には、(174)式の右辺において、^Λを^Λ (0)に、^v(k)を^v (0)(k)に、それぞれ置き換える。
分散パラメータ更新部560は、シングルチャネルウィーナーフィルタ部540からの同時無相関化された源信号成分x´(k)の推定値^x´(k)と、事後共分散行列更新部550からの同時無相関化された事後共分散行列Σ´(k)と、空間共分散行列更新部570からの同時無相関化された空間共分散行列Λの推定値^Λ(ただし、例外として、分散パラメータ更新部560における最初の処理の際には、初期化部からの同時無相関化された空間共分散行列Λの初期推定値^Λ (0))と、に基づいて、分散パラメータv(k)の推定値^v(k)を次の(175)式により更新する(ステップS67)。
Figure 0006845373
ただし、分散パラメータ更新部560における最初の処理の際には、(175)式の右辺において、^Λを^Λ (0)に置き換える。
空間共分散行列更新部570は、シングルチャネルウィーナーフィルタ部540からの同時無相関化された源信号成分x´(k)の推定値^x´(k)と、事後共分散行列更新部550からの同時無相関化された事後共分散行列Σ´(k)と、分散パラメータ更新部560からの分散パラメータv(k)の推定値^v(k)と、に基づいて、同時無相関化された空間共分散行列Λの推定値^Λを次の(176)式により更新する(ステップS68)。
Figure 0006845373
信号パラメータ分析部520は、シングルチャネルウィーナーフィルタ部540からの同時無相関化された源信号成分x´(k)の推定値^x´(k)と、事後共分散行列更新部550からの同時無相関化された事後共分散行列Σ´(k)と、分散パラメータ更新部560からの分散パラメータv(k)の推定値^v(k)と、空間共分散行列更新部570からの同時無相関化された空間共分散行列Λの推定値^Λと、(信号パラメータ分析部520における同時無相関化行列Pの推定値^Pの最初の更新の際には、更に、初期化部からの同時無相関化行列Pの初期推定値^P(0)と、)を受け取って、次の(177)式により同時無相関化行列Pの推定値^Pを更新する(ステップS69)。ただし、eは単位行列の第i列を表し、行列Aに対して[A]は、Aの第i列を表す。
Figure 0006845373
ただし、信号パラメータ分析部520における同時無相関化行列Pの推定値^Pの最初の更新の際には、(177)式の右辺において、^Pを^P(0)で置き換える。なお、信号パラメータ分析部520は、(177)式を複数回連続して適用することにより同時無相関化行列Pの推定値^Pを更新してもよい。
図示しない収束判定部は、収束したかどうかの判定を行う(ステップS70)。収束判定部が収束していないと判定した場合(ステップS70:No)、同時無相関化部530によるステップS64の処理に戻って、処理が継続される。
一方、収束判定部が収束したと判定した場合(ステップS70:Yes)、同時無相関化部530における処理(ステップS71)と、シングルチャネルウィーナーフィルタ部540における処理(ステップS72)と、同時無相関化逆変換部580における処理(ステップS73)と、が行われる。同時無相関化部530及びシングルチャネルウィーナーフィルタ部540における処理については上述の通りであるから、同時無相関化逆変換部580での処理について説明する。同時無相関化逆変換部580は、信号パラメータ分析部520からの同時無相関化行列Pの推定値^Pと、シングルチャネルウィーナーフィルタ部540からの同時無相関化された源信号成分x´(k)の推定値^x´(k)と、に基づいて、源信号成分x(k)の推定値^x(k)を次の(178)式により計算し、出力する(ステップS73)。
Figure 0006845373
[信号分析装置の処理の背景]
次に、本第5の実施形態に係る信号分析装置501の処理の背景について説明する。本第5の実施形態においては、観測信号ベクトルy(k)は、J個の源信号成分x(k),・・・,x(k)の和として、次の(179)式でモデル化される。
Figure 0006845373
源信号成分x(k)は、(97)式のように平均0、共分散行列S(k)=v(k)Rの複素ガウス分布に従うとする。ここで、v(k)はj番目の源信号のサンプル点ごとの分散をモデル化する分散パラメータであり、Rはj番目の源信号の空間的特性をモデル化するパラメータである空間共分散行列である。分散パラメータv(k)は正であり、空間共分散行列Rは正定値エルミート行列であると仮定する。J個の源信号成分x(k),・・・,x(k)は互いに無相関であるとする。
観測信号ベクトルy(k)から源信号成分x(k)を推定する方法としては、マルチチャネルウィーナーフィルタに基づく方法がある。この方法では、源信号成分x(k)の推定値^x(k)を次の(180)式により計算する。
Figure 0006845373
本第5の実施形態のように、分散パラメータv(k)及び空間共分散行列Rが未知の状況で(180)式により源信号成分x(k)の推定値^x(k)を計算する(すなわち信号分離を実現する)ためには、これらのパラメータを推定する必要がある。
[従来の信号分析方法]
分散パラメータv(k)及び空間共分散行列Rが未知の状況で、分散パラメータv(k)と、空間共分散行列Rと、源信号成分x(k)と、を同時に推定することにより、信号分離を実現する方法が、非特許文献1に開示されている。
従来技術では、分散パラメータv(k)及び空間共分散行列Rを最尤推定する。この最尤推定は、下記の(181)式の最適化問題として定式化される。
Figure 0006845373
ここで、Ψはパラメータの全体を表し、分散パラメータv(k)(j=1,・・・,J;k=1,・・・,K)及び空間共分散行列R(j=1,・・・,J)からなる。L(Ψ)は、次の(182)式の対数尤度関数を表す。
Figure 0006845373
下の(183)式は、行列Aが正定値エルミート行列であることを表す。
Figure 0006845373
従来技術では、EMアルゴリズムに基づいて最尤推定を行う。このEMアルゴリズムでは、EステップとMステップとが交互に反復される。
Eステップでは、パラメータΨの現在の推定値^Ψに基づく、源信号成分x(k)の事後確率p(x(k)|y(k),^Ψ)を計算する。この事後確率は、次の(184)式のように複素ガウス分布であることが示される。
Figure 0006845373
ただし、平均^x(k)及び共分散行列Σ(k)は、パラメータの現在の推定値^Ψを用いて次の(185)式及び(186)式のように表される(^v(k)は分散パラメータv(k)の現在の推定値であり、^Rは空間共分散行列Rの現在の推定値である)。
Figure 0006845373
Figure 0006845373
したがって、Eステップでは、平均^x(k)及び共分散行列Σ(k)を、(185)式及び(186)式により更新する。なお、(185)式は、(180)式のマルチチャネルウィーナーフィルタによる源信号成分x(k)の推定値に他ならない。以下、^x(k)を源信号成分x(k)の推定値と呼び、Σ(k)を事後共分散行列と呼ぶ。
Mステップでは、Eステップで更新された源信号成分x(k)の推定値^x(k)及び事後共分散行列Σ(k)に基づいて、分散パラメータv(k)の推定値^v(k)及び空間共分散行列Rの推定値^Rを更新する。これらは、下記の更新則((187)式及び(188)式)により更新される。
Figure 0006845373
Figure 0006845373
しかしながら、従来技術では、(185)式の源信号成分x(k)の推定値^x(k)の更新と、(186)式の事後共分散行列Σ(k)の更新と、において、逆行列計算と行列乗算とをサンプル点ごとに行う必要があった。具体的には、(189)式に示す逆行列計算(反復ごとサンプル点ごとに1回)と、(190)式に示す行列乗算(反復ごとサンプル点ごとに2J回)とを行う必要があった。
Figure 0006845373
Figure 0006845373
そのため、従来技術では膨大な計算量を要していたため、リアルタイムでの信号分離や、センサネットワーク等における分散処理など、サンプル点の数Kが大きい(観測信号長が長い)場合や計算資源が限られている状況への適用が困難であった。
[第5の実施形態に係る信号分析方法]
これに対し、本第5の実施形態では、J個の源信号成分x(k),・・・,x(k)の同時無相関化に基づいて、Eステップにおける源信号成分x(k)の推定値^x(k)及び事後共分散行列Σ(k)の更新を少ない計算量で実現することにより、少ない計算量での信号分離を可能にする。以下、本第5の実施形態における考え方について説明する。
いま仮に、(185)式及び(186)式における源信号成分x(k)の共分散行列v(k)Rがいずれも対角行列であるとすると、(185)式及び(186)式における逆行列演算及び行列乗算は単なる対角要素ごとの逆数演算及び乗算に帰着するため、少ない計算量で計算できる。しかしながら、通常、ベクトルx(k)の異なる要素(つまり異なる位置で観測されたj番目の源信号)は互いに相関を持つため、その共分散行列v(k)Rの非対角要素は0ではない、すなわち共分散行列v(k)Rは対角行列ではない。
そこで本第5の実施形態では、J個の源信号成分x(k),・・・,x(k)を、正則行列Pのエルミート転置Pによる次の(191)式の変換により同時無相関化することを考える。
Figure 0006845373
変換後のx´(k)の共分散行列は、次の(192)式及び(193)式で与えられる。
Figure 0006845373
変換後のx´(k)(j=1,・・・,J)がすべて無相関になる条件、すなわち、(193)式で与えられるこれらの共分散行列がすべて対角行列になる条件は、次の(194)式〜(196)式である。
Figure 0006845373
既に述べたように、信号数がJ=2の場合には、一般化固有値問題を解くことにより、(194)式〜(196)式を満たす正則行列P及び対角行列Λ,・・・,Λを得ることができる。これに対し、本第5の実施形態では、J=2の場合に限らず一般の信号数Jの場合に適用可能なアプローチとして、未知のJ個の空間共分散行列R,・・・,Rが、ある正則行列Pにより同時対角化されるという制約条件、すなわち、ある正則行列P及びあるJ個の対角行列Λ,・・・,Λに対し、(194)式〜(196)式が成立するという制約条件の下、正則行列P及び対角行列Λ,・・・,Λを最尤推定する。上述の制約条件は、ある正則行列P及びあるJ個の対角行列Λ,・・・,Λに対し、次の各式((197)式〜(199)式)が成立することと同値である。
Figure 0006845373
本第5の実施形態では、空間共分散行列R,・・・,Rは、パラメータである正則行列Pとパラメータである対角行列Λ,・・・,Λとを用いて、(197)式〜(199)式のように表される(モデル化される)と仮定する。この場合、空間共分散行列R,・・・,Rを推定することは、行列P(同時無相関化を実現する行列であるから、以下、同時無相関化行列と呼ぶ)及び対角行列Λ,・・・,Λ(同時無相関化行列Pを用いて(194)式〜(196)式のように空間共分散行列R,・・・,Rを変換して得られる行列であるから、以下、同時無相関化された空間共分散行列と呼ぶ)を推定することに帰着する。
そこで、本第5の実施形態では、同時無相関化行列Pと、同時無相関化された空間共分散行列Λと、分散パラメータv(k)と、を最尤法により同時推定する。これにより、一般の信号数Jに対しても、源信号成分の同時無相関化(源信号成分の共分散行列の同時対角化)が実現し、少ない計算量での信号分離が可能になる。
上述の最尤推定は、次の最適化問題((200)式)として定式化される。
Figure 0006845373
ここで、Θはすべてのパラメータの全体を表し、分散パラメータv(k)(j=1,・・・,J;k=1,・・・,K)と、同時無相関化行列Pと、同時無相関化された空間共分散行列Λ(j=1,・・・,J)と、からなる。L(Θ)は、次の(201)式の対数尤度関数であり、(182)式に(197)式〜(199)式を代入することにより得られる。なお、GL(I,C)はすべての正則なI次複素行列からなる集合である。
Figure 0006845373
本第5の実施形態では、EMアルゴリズムにより、上述の最尤推定を実現する。このEMアルゴリズムはEステップとMステップとからなる。
Eステップでは、パラメータΘの現在の推定値^Θに基づいて、源信号成分の事後確率を更新する。従来技術の場合と同様に、x(k)の事後確率p(x(k)|y(k),^Θ)は、(184)式の右辺の複素ガウス分布であり、その平均は、(185)式で、その共分散行列は、(186)式で与えられることが示せる。ただし、従来技術の場合とは異なり、(185)式及び(186)式における空間共分散行列Rの推定値^Rは、同時無相関化行列Pの推定値^P及び同時無相関化された空間共分散行列Λの推定値^Λを用いて、次の(202)式〜(204)式のように表される。
Figure 0006845373
(185)式及び(186)式に(202)式〜(204)式を代入することにより、次の(205)式〜(208)式を得る。
Figure 0006845373
Figure 0006845373
したがって、源信号成分x(k)の推定値^x(k)を同時無相関化行列Pの推定値^Pにより基底変換して得られる^x´(k)(以下、同時無相関化された源信号成分の推定値と呼ぶ)は、(173)式により更新でき、事後共分散行列Σ(k)を同時無相関化行列Pの推定値^Pにより基底変換して得られるΣ´(k)(以下、同時無相関化された事後共分散行列と呼ぶ)は、(174)式により更新できる。その際、同時対角化により、逆行列演算及び行列乗算は、対角行列に対する逆行列演算及び行列乗算になっているため、その計算量は、O(I)ではなくO(I)であり少ない計算量で計算できる。
Mステップでは、分散パラメータv(k)の推定値^v(k)と、同時無相関化された空間共分散行列Λの推定値^Λと、同時無相関化行列Pの推定値^Pと、を下記のQ関数の最大化に基づいて更新する((209)式及び(210)式参照)。ただし、(209)式及び(210)式ではΘに依らない定数項は無視してあり、したがって等号はその両辺がΘに依らない定数の差を除いて等しいことを表している。
Figure 0006845373
(210)式のQ関数を分散パラメータv(k)に関して偏微分して0とおくと、次の(211)式及び(212)式を得る。
Figure 0006845373
これで、(175)式の分散パラメータv(k)の推定値^v(k)の更新式が導かれた。
また、(210)式のQ関数を同時無相関化された空間共分散行列Λに関して偏微分したものが零行列に等しいと置くと、次の(213)式及び(214)式を得る。
Figure 0006845373
これで、(176)式の同時無相関化された空間共分散行列Λの推定値^Λの更新則が導かれた。なお、(213)式において、絶対値二乗|・|はベクトルの要素ごとに計算するものとし、ベクトルαに対してdiag(α)は、αの要素を対角要素とする対角行列を表す。
(209)式のQ関数を同時無相関化行列Pの複素共役Pに関して偏微分すると、次の(215)式を得る。
Figure 0006845373
これが零行列に等しいと置いて両辺のvecを取ると、次の(216)式を得る。
Figure 0006845373
ここで、行列Aに対し、vec(A)は、行列Aの列ベクトルを縦に並べて得られる列ベクトルを表す。これに関し、次の(217)式の公式が成り立つ。
Figure 0006845373
また、「×」を丸で囲んだ記号は、クロネッカ積を表す。ブロック対角行列の性質より、(216)式は次の(218)式〜(220)式と等価である。
Figure 0006845373
そこで、不動点法に基づいて、(177)式により、同時無相関化行列Pの推定値^Pを更新すれば良い。このように不動点法に基づくことで、勾配法や自然勾配法とは異なり学習率の調整が不要であるため、安定な最適化が可能である。
以下、事後確率の詳細な導出を述べる。隠れ変数x(k),・・・,xJ−1(k)の対数事後確率は、次の(221)式〜(223)式のように書き下せる。
Figure 0006845373
ここで、等号「=」の上に「c」を付した記号は、両辺がx(k),・・・,xJ−1(k)に依らない定数の差を除いて等しいことを表す。行列Aは、I次の単位行列IをJ−1個横に並べた次の(224)式の行列を表す。また、空間共分散行列R(j=1,・・・,J)は(197)式〜(199)式で与えられる。なお、本明細書では、Iを観測信号の個数(スカラー)と単位行列(行列)との2通りの意味で用いているが、Iがスカラーであるか行列であるかは文脈より明らかであるから、これにより混乱が生じるおそれはない。
Figure 0006845373
~x(k)は、x(k),・・・,xJ−1(k)を縦に並べた次の(225)式のベクトルを表す。
Figure 0006845373
(223)式より、隠れ変数x(k),・・・,xJ−1(k)の事後確率が次の(226)式の複素ガウス分布であることが導かれる。
Figure 0006845373
ここで、共分散行列~Σ(k)及び平均^~x(k)は次の(227)式〜(230)式及び(231)式〜(233)式で与えられる。但し、(227)式から(228)式への式変形の際に逆行列補題を用いた。
Figure 0006845373
Figure 0006845373
後に分かるように、Eステップでは、行列~Σ全体を計算する必要は実はなく、行列~ΣをI次の正方行列を要素とするJ−1次の正方ブロック行列とみなしたときの対角ブロックのみを計算すれば良い。j番目の対角ブロックをΣ(k)と書くことにすると、これは次の(234)式のように計算できる。明らかに、J=2の場合には、(234)式は(101)式と等価である。
Figure 0006845373
また、^x(k)を、^~x(k)をI次元縦ベクトルを要素とするサイズ(J−1)×1のブロック行列とみなしたときの(j,1)ブロックと定義すると、これは次の(235)式のように表される。
Figure 0006845373
^x(k)及びΣ(k)は次の(236)式及び(237)式のようにも表されることに注意する。
Figure 0006845373
Figure 0006845373
ただし、上式においては、j=1,・・・,J−1である。また、E(・|y(k))は、隠れ変数の事後確率p(x(k),・・・,xJ−1(k)|y(k),Θ)に関する期待値((238)式)である。
Figure 0006845373
これにならい、j=Jに対しても、^x(k)及びΣ(k)を次の(239)式〜(243)式及び(244)式〜(251)式のように定義する。
Figure 0006845373
Figure 0006845373
よって、以下の(252)式及び(253)式は、j=1,・・・,Jに対して成立する。
Figure 0006845373
Figure 0006845373
以下、Q関数の詳細な導出について説明する。観測信号ベクトルy(k)と隠れ変数x(k),・・・,xJ−1(k)との同時分布の対数は、次の(254)式〜(256)式のように書き下される。ただし、(254)式〜(256)式では定数項は無視してあり、したがって等号はその両辺が定数の差を除いて等しいことを表している。
Figure 0006845373
ここで、次の各式((257)式〜(262)式)が成立することに注意する。
Figure 0006845373
したがって、Q関数は次式((263)式〜(266)式)で与えられる。(264)式は(209)式に他ならない。
Figure 0006845373
ここで、(266)式における絶対値の二乗|・|は、要素ごとに取るものとする。また、等号「=」の上に「c」を付した記号は、両辺がΘに依らない定数の差を除いて等しいことを表す(先と異なる意味で記号が用いられていることに注意されたい)。
[第5の実施形態の変形例1]
次に、第5の実施形態の変形例1について説明する。本第5の実施形態の変形例1では、信号パラメータ分析部における処理の変形例について説明する。第5の実施形態では、信号パラメータ分析部は、不動点法に基づいて同時無相関化行列Pの推定値^Pを更新していた。これに対し、第5の実施形態の変形例1に掛かる信号パラメータ分析部は、不動点法以外の任意の最適化法(例えば、勾配法、自然勾配法、ニュートン法など)に基づいて、同時無相関化行列Pの推定値^Pを更新する。
例えば、勾配法の場合、本第5の実施形態の変形例1に係る信号パラメータ分析部は、同時無相関化行列Pの推定値^Pを次の(267)式により更新する(これは、(215)式から直ちに導かれる)。
Figure 0006845373
ただし、信号パラメータ分析部における同時無相関化行列Pの推定値^Pの最初の更新の際には、(267)式の右辺において、^Pを^P(0)で置き換える。μは学習率と呼ばれる正の数であり、例えばμ=0.05などと定めればよい。
また、自然勾配法の場合、本第5の実施形態の変形例1に係る信号パラメータ分析部は、同時無相関化行列Pの推定値を次の(268)式により更新する(これも(215)式から直ちに導かれる)。
Figure 0006845373
ただし、信号パラメータ分析部における同時無相関化行列Pの推定値^Pの最初の更新の際には、(268)式の右辺において、^Pを^P(0)で置き換える。μは、学習率と呼ばれる正の数であり、例えば、μ=0.05などと定めればよい。自然勾配法によれば、空間の計量が適切に考慮されるため、一般に勾配法よりも安定な更新が可能であることが知られている。
[第5の実施形態の変形例2]
次に、第5の実施形態の変形例2について説明する。本第5の実施形態の変形例2では、信号パラメータ分析部における処理の変形例について説明する。第5の実施形態や第5の実施形態の変形例1では、信号パラメータ分析部は、Q関数に基づいて同時無相関化行列Pの推定値^Pを更新していた。これに対し、本第5の実施形態の変形例2に係る信号パラメータ分析部は、直接、対数尤度関数L(Θ)に基づいて、同時無相関化行列Pの推定値^Pを更新する。
本第5の実施形態の変形例2に係る信号パラメータ分析部は、同時無相関化部からの同時無相関化された観測信号ベクトルy´(k)と、空間共分散行列更新部からの同時無相関化された空間共分散行列Λの推定値^Λと、分散パラメータ更新部からの分散パラメータv(k)の推定値^v(k)と、(信号パラメータ分析部における同時無相関化行列Pの推定値^Pの最初の更新の際には、更に、初期化部からの同時無相関化行列Pの初期推定値^P(0)と、)に基づいて、同時無相関化行列Pの推定値^Pを次式((269)式)により更新する(Eは単位行列を表すものとする)。
Figure 0006845373
ただし、信号パラメータ分析部における^Pの最初の更新の際には、(269)式の右辺において、^Pを^P(0)で置き換える。なお、信号パラメータ分析部は、(269)式を複数回連続して適用することにより、同時無相関化行列Pの推定値^Pを更新してもよい。
(269)式の対数尤度関数L(Θ)に基づく同時無相関化行列Pの推定値^Pの更新則の導出について説明する。(201)式の対数尤度関数を同時無相関化行列Pの複素共役Pに関して偏微分すると次の(270)式を得る。
Figure 0006845373
(270)式が零行列に等しいと置いて、両辺のvecを取ると、次式((271)式)を得る。
Figure 0006845373
(271)式の右辺の行列は、次の(272)式及び(273)式のように変形できる。
Figure 0006845373
よって次式((274)式及び(275)式)を得る。
Figure 0006845373
(275)式に(276)式を代入することにより、(269)式の不動点法による同時無相関化行列Pの推定値^Pの更新則が得られる。
Figure 0006845373
このように、不動点法に基づくことで、勾配法や自然勾配法とは異なり学習率の調整が不要であるため、安定な最適化が可能である。
また、第5の実施形態の変形例1と同様に、本第5の実施形態の変形例2においても、不動点法に限らず任意の最適化法(勾配法、自然勾配法、ニュートン法など)により同時無相関化行列Pの推定値^Pを更新してよい。以下、そのような例について説明する。
勾配法の場合、本第5の実施形態の変形例2に係る信号パラメータ分析部は、観測信号ベクトル作成部からの観測信号ベクトルy(k)と、空間共分散行列更新部からの同時無相関化された空間共分散行列Λの推定値^Λと、分散パラメータ更新部からの分散パラメータv(k)の推定値^v(k)と、(信号パラメータ分析部における同時無相関化行列Pの推定値^Pの最初の更新の際には、更に、初期化部からの同時無相関化行列Pの初期推定値^P(0)と、)に基づいて、同時無相関化行列Pの推定値^Pを次の(277)式により更新する(これは、(270)式より直ちに導かれる)。
Figure 0006845373
ただし、信号パラメータ分析部における同時無相関化行列Pの推定値^Pの最初の更新の際には、(277)式の右辺において、^Pを^P(0)で置き換える。なお、信号パラメータ分析部は、(277)式を複数回連続して適用することにより同時無相関化行列Pの推定値^Pを更新してもよい。また、信号パラメータ分析部は、(277)式に(276)式を代入することにより得られる、同時無相関化された観測信号ベクトルy´(k)を用いて表した式を、(277)式の代わりに用いても良い。μは、学習率と呼ばれる所定の正の数であり、例えば、μ=0.05などと定めればよい。この勾配法の場合には、(277)式の1回の適用につき逆行列計算が1回のみで行列乗算は不要(対角行列に対する逆行列計算はカウントしていない)であるため、不動点法の場合と比べてより少ない計算量で同時無相関化行列Pの推定値^Pを更新できる。
また、自然勾配法の場合、本第5の実施形態の変形例2に係る信号パラメータ分析部は、観測信号ベクトル作成部からの観測信号ベクトルy(k)と、空間共分散行列更新部からの同時無相関化された空間共分散行列Λの推定値^Λと、分散パラメータ更新部からの分散パラメータv(k)の推定値^v(k)と、(信号パラメータ分析部における同時無相関化行列Pの推定値^Pの最初の更新の際には、更に、初期化部からの同時無相関化行列Pの初期推定値^P(0)と、)に基づいて、同時無相関化行列Pの推定値^Pを次の(278)式により更新する(これも(270)式より直ちに導かれる)。
Figure 0006845373
ただし、信号パラメータ分析部における同時無相関化行列Pの推定値^Pの最初の更新の際には、(278)式の右辺において、^Pを^P(0)で置き換える。なお、信号パラメータ分析部は、(278)式を複数回連続して適用することにより同時無相関化行列Pの推定値^Pを更新してもよい。また、信号パラメータ分析部は、(278)式に(276)式を代入することにより得られる、同時無相関化された観測信号ベクトルy´(k)を用いて表した式を、(278)式の代わりに用いても良い。μは、学習率と呼ばれる所定の正の数であり、例えば、μ=0.05などと定めればよい。また、自然勾配法によれば、空間の計量が適切に考慮されるため、一般に勾配法よりも安定な更新が可能であることが知られている。
[第5の実施形態の変形例3]
次に、第5の実施形態の変形例3について説明する。第5の実施形態の変形例3では、第3の実施形態にならい、周波数ごとに第5の実施形態を適用する。
第5の実施形態の変形例3においては、J個の音源信号が混在する状況において、それぞれ異なる位置でマイクロホンにより取得されたI個(Iは2以上の整数)の観測信号y(t)が信号分析装置に入力されるものとする。観測信号y(t)は、周波数分解され、周波数ごとに第5の実施形態に記載の方法で信号分離がなされ、最後に時間領域に変換される。
図5及び図6を用いて、第5の実施形態の変形例3に係る信号分析装置の構成及び信号分析処理の処理手順について説明する。
周波数領域変換部310(ステップS40、ステップS41)及び時間領域変換部330(ステップS43)での処理は、第3の実施形態と同じである。以下、相違点である周波数領域信号分離部320(ステップS42)での処理について説明する。
周波数領域信号分離部320は、周波数領域変換部310から(279)式に示す時間周波数領域の観測信号を受け取り、fごとに第5の実施形態の方法により周波数領域での信号分離を行うことにより、(280)式に示す時間周波数領域の源信号成分の推定値を計算し、時間領域変換部330に渡す(ステップS42)。
Figure 0006845373
Figure 0006845373
すなわち、f=1に対しては、(281)式に示す観測信号を入力として、第5の実施形態の方法により(282)式の源信号成分の推定値を得る。
Figure 0006845373
Figure 0006845373
そして、f=2に対しては、(283)式に示す観測信号を入力として、第5の実施形形態の方法により(284)式の源信号成分の推定値を得る。
Figure 0006845373
Figure 0006845373
以下、同じ処理を各fに対して繰り返し、最後に、f=Fに対しては、(285)式に示す観測信号を入力として、第5の実施形態の方法により(286)式の源信号成分の推定値を得る。
Figure 0006845373
Figure 0006845373
こうして得られた時間周波数領域の源信号成分の推定値((287)式参照)を時間領域変換部330に渡す。
Figure 0006845373
[第5の実施形態の効果]
本発明の効果を確認するために、従来の方法及び第5の実施形態を用いた音源分離実験について説明する。
図14は、従来の方法及び第5の実施形態を用いた音源分離実験の実験条件を示す図である。図15は、従来の方法及び第5の実施形態を用いた音源分離実験結果(real time factor)を示す図である。図16は、従来の方法及び第5の実施形態を用いた音源分離実験結果(音源分離性能)を示す図である。
8秒の英語音声に、図14に示す実験室で測定された残響インパルス応答を畳み込んで残響音声を生成し、複数人の残響音声を加算することで観測信号を生成した。このとき、観測信号に対して、各方法を用いて信号分離を行った場合の性能を図15及び図16に示す。図15は、real time factor(観測信号長を1としたときの、処理に要した時間)である。また、図16は、音源分離性能である信号対歪み比(値が大きいほど音源分離性能が高い)である。
図15及び図16に示すように、本第5の実施形態に係る方法によれば、音源数が3個以上である場合にも、420倍以上の計算時間削減が実現でき、従来の方法を上回る音源分離性能を得ることができた。
このように、本第5の実施形態によれば、従来の方法と比べて計算時間を大きく削減できるのに加え、従来の方法よりも高い信号分離性能を実現できる。本第5の実施形態は、信号数が2個でない場合にも適用でき、信号数が3個以上の場合にも適用できる。
[第6の実施形態]
次に、第6の実施形態に係る信号分析装置の構成、処理の流れ及び効果について説明する。第6の実施形態では、第4の実施形態の変形例を実施するための具体的な手法について説明する。
本第6の実施形態では、第5の実施形態と同様に、一般にJ個の源信号が混在し、分散パラメータv(k)及び空間共分散行列Rが未知の状況で、分散パラメータv(k)と、空間共分散行列Rをモデル化するパラメータである同時無相関化された空間共分散行列Λ及び同時無相関化行列Pと、源信号成分x(k)と、を同時に推定することにより、信号分離を実現する方法について説明する。
なお、第5の実施形態は、EMアルゴリズムに基づいていたのに対し、本第6の実施形態は補助関数法に基づいている。本第6の実施形態では、それぞれ異なる位置で取得されたI個の観測信号y(k)が信号分析装置に入力されるものとする。
[信号分析装置の構成及び処理]
図17及び図18を用いて、第6の実施形態に係る信号分析装置の構成及び信号分析処理の処理手順について説明する。図17は、第6の実施形態に係る信号分析装置の構成の一例を示す図である。図18は、第6の実施形態に係る信号分析処理の処理手順の一例を示すフローチャートである。
図17に示すように、信号分析装置601は、初期化部(図示しない)、観測信号ベクトル作成部610、同時無相関化部630、シングルチャネルウィーナーフィルタ部640、観測共分散行列更新部650、分散パラメータ更新部660、空間共分散行列更新部670、信号パラメータ分析部620、収束判定部(図示しない)及び同時無相関化逆変換部680を有する。
まず、信号分析装置の各部の概要について説明する。初期化部(図示しない)の処理(ステップS81)、観測信号ベクトル作成部610の処理(ステップS82,S83)、同時無相関化部630の処理(ステップS84)及びシングルチャネルウィーナーフィルタ部640の処理(ステップS85)については、第5の実施形態と同様であるから、説明を省略する。
観測共分散行列更新部650は、分散パラメータ更新部660からの分散パラメータv(k)の推定値^v(k)(ただし例外として、観測共分散行列更新部650における最初の処理の際には、初期化部からの分散パラメータv(k)の初期推定値^v (0)(k))と、空間共分散行列更新部670からの同時無相関化された空間共分散行列Λの推定値^Λ(ただし例外として、観測共分散行列更新部650における最初の処理の際には、初期化部からの同時無相関化された空間共分散行列Λの初期推定値^Λ (0))と、を受け取って、同時無相関化された観測共分散行列U´(k)を次式(288)式により更新する(ステップS86)。
Figure 0006845373
ただし、観測共分散行列更新部650における最初の処理の際には、上式において、^v(k)を^v (0)(k)に、^Λを^Λ (0)に、それぞれ置き換える。
分散パラメータ更新部660は、シングルチャネルウィーナーフィルタ部640からの同時無相関化された源信号成分x´(k)の推定値^x´(k)と、観測共分散行列更新部650からの同時無相関化された観測共分散行列U´(k)と、空間共分散行列更新部670からの同時無相関化された空間共分散行列Λの推定値^Λ(ただし例外として、分散パラメータ更新部660における最初の処理の際には、初期化部からの同時無相関化された空間共分散行列Λの初期推定値^Λ (0))と、を受け取って、分散パラメータv(k)の推定値^v(k)を次式((289)式)により更新する(ステップS87)。
Figure 0006845373
ただし、分散パラメータ更新部660における最初の処理の際には、上式において、^Λを^Λ (0)で置き換える。
空間共分散行列更新部670は、シングルチャネルウィーナーフィルタ部640からの同時無相関化された源信号成分x´(k)の推定値^x´(k)と、観測共分散行列更新部650からの同時無相関化された観測共分散行列U´(k)と、分散パラメータ更新部660からの分散パラメータv(k)の推定値^v(k)と、を受け取って、同時無相関化された空間共分散行列Λの推定値^Λを次の(290)式により更新する(ステップS88)。
Figure 0006845373
信号パラメータ分析部620は、第5の実施形態の変形例2と同様の処理を行って、同時無相関化行列Pの推定値^Pを更新する(ステップS89)。
図示しない収束判定部は、収束したかどうかの判定を行う(ステップS90)。収束判定部が収束していないと判定した場合(ステップS90:No)、同時無相関化部630での処理(ステップS84)に戻って、処理が継続される。
一方、収束判定部が収束したと判定した場合(ステップS90:Yes)、同時無相関化部630における処理(ステップS91)、シングルチャネルウィーナーフィルタ部640における処理(ステップS92)、及び、同時無相関化逆変換部680における処理(ステップS93)が、第5の実施形態と同様にして行われることにより、源信号成分x(k)の推定値^x(k)が計算され、出力される。
[信号分析装置の処理の背景]
次に、第6の実施形態に係る信号分析装置の背景について説明する。第5の実施形態で述べたように、分散パラメータv(k)及び空間共分散行列Rが未知の状況で、(180)式により、源信号成分x(k)の推定値^x(k)を計算する(すなわち信号分離を実現する)ためには、分散パラメータv(k)及び空間共分散行列Rを推定する必要がある。
補助関数法に基づいて、(181)式の最適化問題を解くことにより、分散パラメータv(k)及び空間共分散行列Rを最尤推定することができる。
この補助関数法では、補助変数Φ及び次式を満たす補助関数L (Ψ,Φ)に基づいて、補助関数L (Ψ,Φ)を補助変数Φについて最大化することによりΦを更新するステップと、補助関数L (Ψ,Φ)が減少しないようにパラメータΨを更新するステップと、が交互に反復される((291)式参照)。
Figure 0006845373
本第6の実施形態では、補助関数として(292)式のL (Ψ,Φ)を用いる。
Figure 0006845373
ただし、右辺における「定数」は、パラメータΨ及び補助変数Φによらない定数である。(292)式が(291)式の補助関数の条件を満たすことは、参考文献3及び参考文献4と同様に示すことができる。なお、補助変数Φは、U(k)及びG(k)からなり、U(k)は正定値エルミート行列であり、G(k)は(293)式を満たすものとする。
Figure 0006845373
補助関数L (Ψ,Φ)を補助変数Φについて最大化することによりΦを更新するステップでは、分散パラメータv(k)の推定値^v(k)及び空間共分散行列Rの推定値^Rに基づいて、U(k)及びG(k)を(294)式及び(295)式により更新する。U(k)は観測信号ベクトルy(k)の共分散行列に他ならないから、観測共分散行列と呼ぶ。
Figure 0006845373
Figure 0006845373
補助関数L (Ψ,Φ)が減少しないようにパラメータΨを更新するステップでは、上で更新した補助変数に基づいて、次の(296)式及び(297)式により分散パラメータv(k)の推定値^v(k)と、空間共分散行列Rの推定値^Rと、を更新する。
Figure 0006845373
Figure 0006845373
ここで、A#Bは、(298)式で定義されるAとBとの幾何平均である。
Figure 0006845373
また、行列C及び行列Dは、それぞれ(299)式及び(300)式により計算される。
Figure 0006845373
Figure 0006845373
(294)式〜(300)式の更新式の導出は、参考文献3及び参考文献4と同様にできる。更に、補助変数G(k)を代入消去することにより、補助変数G(k)が現れない更新則を導くことができる。この場合の更新則(1回の反復)を以下の(301)式〜(305)式に示す。明らかに、J=2の場合には、(301)式〜(305)式による更新は、(156)式〜(159)式による更新と等価である。
Figure 0006845373
Figure 0006845373
Figure 0006845373
Figure 0006845373
Figure 0006845373
しかしながら、上記の方法では、(302)式〜(304)式に含まれる、逆行列計算U(k)−1をサンプル点ごとに行う必要があった。そのため、上記の方法は膨大な計算量を要する。
これに対し、本第6の実施形態では、第5の実施形態と同様に、J個の源信号成分x(k),・・・,x(k)の同時無相関化に基づいて、逆行列計算U(k)−1を少ない計算量で計算できる対角行列に対する逆行列計算に帰着させることにより、少ない計算量での信号分離を実現する。具体的には、本第6の実施形態では、第5の実施形態と同様に、J個の空間共分散行列が(197)式〜(199)式の形に表されるという制約条件の下、同時無相関化行列P及び同時無相関化された空間共分散行列Λ,・・・,Λを最尤推定する。この最尤推定は、(200)式の最適化問題として定式化される。本第6の実施形態では、補助関数法に基づいて、上述の最尤推定を実現する。この方法では、補助関数法の1回の反復を適用することにより分散パラメータv(k)の推定値^v(k)及び同時無相関化された空間共分散行列Λの推定値^Λを更新するステップと、同時無相関化行列Pの推定値^Pを更新するステップと、が交互に反復される。
補助関数法に基づいて分散パラメータv(k)の推定値^v(k)及び同時無相関化された空間共分散行列Λの推定値^Λを更新するステップは、(306)式の補助関数L (Θ,Φ)に基づいている。
Figure 0006845373
ただし、右辺の「定数」はパラメータΘ及び補助変数Φによらない定数である。
先と同様に補助変数G(k)を代入消去すると、更新則は下記の(307)式〜(311)式のように与えられる。ただし、(310)式の右辺における斜体のDは、行列の非対角成分を0で置き換える演算子である。
Figure 0006845373
Figure 0006845373
Figure 0006845373
Figure 0006845373
Figure 0006845373
これは、更に次の(312)式〜(315)式に書き直せる。
Figure 0006845373
Figure 0006845373
Figure 0006845373
Figure 0006845373
同時無相関化行列Pの推定値^Pの更新則の導出については、第5の実施形態の変形例2と同様であるから説明を省略する。以上で、第6の実施形態における更新則が導かれた。
[第6の実施形態の変形例]
第6の実施形態では対数尤度に基づいて同時無相関化行列Pの推定値^Pを更新するが、補助関数に基づいて同時無相関化行列Pの推定値^Pを更新してもよい。詳細は、第5の実施形態及び第5の実施形態の変形例1と同様だから省略する。
[第6の実施形態の効果]
第6の実施形態によれば、同時無相関化に基づき、計算量を大幅に削減できる。また、EMアルゴリズムは反復回数が少ない場合には必ずしも高い信号分離性能を実現できないが、第6の実施形態によれば、補助関数法に基づき、反復回数が少ない場合にも高い信号分離性能を実現できる。本第6の実施形態は、信号数が3個以上でも適用できる。
[第7の実施形態]
本第7の実施形態では、観測信号に含まれる源信号の総数LがL≧3の場合でも少ない計算量で信号分離を可能にする方法を示す。第5の実施形態や第6の実施形態でもそのような方法を示したが、本実施形態ではもう一つの実現方法を示す。
第5の実施形態や第6の実施形態は、「すべての時間周波数点において観測信号は、L個すべての源信号を含む」というモデル化((179)式参照)の下、L個すべての源信号の同時無相関化(L個すべての源信号の空間共分散行列の同時対角化)に基づいて、L≧3の場合でも少ない計算量で信号分離を実現していた。この同時無相関化(同時対角化)は、「L個すべての源信号の空間共分散行列が1つの同時無相関化行列によって同時対角化できる」という制約条件((197)式〜(199)式参照)に基づいていた。しかしながら、実際にはこの制約条件は現実に即していない場合もあり、そのような場合には、第5の実施形態や第6の実施形態ではモデル化精度が低下し、結果として信号分離性能が低下するおそれがあった。なお、第5の実施形態や第6の実施形態では、L個すべての源信号の同時無相関化(L個すべての源信号の空間共分散行列の同時対角化)に基づいているため、同時無相関化される源信号の最大個数(同時対角化される源信号の空間共分散行列の最大個数)をJとすれば、J=Lである。したがって、第5の実施形態や第6の実施形態では、これらをともにJで表していた。
一方、本第7の実施形態では、源信号の時間周波数領域におけるスパース性に着目する。源信号は、時間周波数領域におけるスパース性、すなわち、「少数の時間周波数成分にエネルギーが集中する」という性質を持つことが多い(例えば、参考文献5「O. Yilmaz and S. Rickard, “Blind separation of speech mixtures via time-frequency masking”, IEEE Transactions on Signal Processing, vol. 52, no. 7, pp. 1830−1847, Jul. 2004.」参照)。この場合、各時間周波数点において観測信号は、L個すべての源信号を含むのではなく、L個よりも少ない源信号しか含まないとみなせることが多い。
そこで、本第7の実施形態では、「各時間周波数点において観測信号は高々2個の源信号しか含まない」というモデル化の下、各時間周波数点において観測信号に含まれる高々2個の源信号の同時無相関化(各時間周波数点において観測信号に含まれる高々2個の源信号の空間共分散行列の同時対角化)に基づいて、L≧3の場合でも少ない計算量で信号分離を実現する。一般化固有値問題に基づいて2個以下の源信号は常に一つの同時無相関化行列によって同時無相関化できる(2個以下の源信号の空間共分散行列は常に一つの同時無相関化行列によって同時対角化できる)から、本第7の実施形態では、第5の実施形態や第6の実施形態とは異なり、源信号の空間共分散行列に特段の制約条件を課す必要がない。
したがって、本第7の実施形態によれば、「L個すべての源信号の空間共分散行列が1つの同時無相関化行列によって同時対角化できる」という制約条件が現実に即していない場合でも高精度なモデル化が可能であり、結果として、そのような場合でも高い信号分離性能を実現可能である。なお、本第7の実施形態では、同時無相関化される源信号の最大個数J(同時対角化される源信号の空間共分散行列の最大個数J)はJ=2である。
本第7の実施形態では、L個(Lは2以上の自然数)の源信号が混在する状況において、それぞれ異なる位置で取得されたI個(Iは2以上の自然数)の観測信号y(t)が信号分析装置に入力されるものとする。
[信号分析装置の構成及び処理]
図5及び図6を用いて、本第7の実施形態に係る信号分析装置の構成及び信号分析処理の処理手順について説明する。図5は、本第7の実施形態に係る信号分析装置の構成の一例を示す図である。図6は、本第7の実施形態に係る信号分析処理の処理手順の一例を示すフローチャートである。
図5に示すように、信号分析装置301は、周波数領域変換部310、周波数領域信号分離部320、時間領域変換部330からなる。
まず、信号分析装置301の各部の概要について説明する。周波数領域変換部310は、入力された観測信号y(t)を受け取り(ステップS40)、短時間フーリエ変換などにより時間周波数領域の観測信号y(k,f)を計算する(ステップS41)。ここで、kは時間フレームのインデックスであり、fは周波数ビンのインデックスである。y(k,f)をy (k)とも表す。
周波数領域信号分離部320は、fごとに信号分離を行って(ステップS42)、時間周波数領域の源信号成分x(k,f)の推定値^x(k,f)を得る。^x(k,f)を^x (k)とも表す。
時間領域変換部330は、時間周波数領域の源信号成分x(k,f)の推定値^x(k,f)に基づいて、逆短時間フーリエ変換などにより、時間領域の源信号成分x(t)の推定値^x(t)を計算し(ステップS43)、出力する。
次に、周波数領域信号分離部320についてより詳細に説明する。図19及び図20を用いて、周波数領域信号分離部320の構成及び周波数領域信号分離処理の処理手順について説明する。図19は、周波数領域信号分離部320の構成の一例を示す図である。図20は、周波数領域信号分離処理の処理手順の一例を示すフローチャートである。
図19に示すように、周波数領域信号分離部320は、初期化部(図示しない)、観測信号ベクトル作成部710、信号パラメータ分析部720、同時無相関化部730、信号存在事後確率更新部740、シングルチャネルウィーナーフィルタ部750、事後共分散行列更新部760、混合重み更新部770、分散パラメータ更新部780、空間共分散行列更新部790、収束判定部(図示しない)及び源信号成分推定部800を有する。これら周波数領域信号分離部320の各部での処理は、周波数ビン毎に行う。
周波数領域信号分離部320は、f←0により周波数ビンのインデックスfを初期化する(ステップS101)。周波数領域信号分離部320は、f←f+1により周波数ビンのインデックスfを1増やす(ステップS102)。
図示しない初期化部は、混合重みα(f)の初期推定値^α (0)(f)と、分散パラメータv(k,f)の初期推定値^v (0)(k,f)と、空間共分散行列R(f)の初期推定値^R (0)(f)と、を設定する(ステップS103)。これらは、例えば乱数に基づいて設定すればよい。
観測信号ベクトル作成部710は、周波数領域変換部からの時間周波数領域の観測信号y(k,f)を受け取り(ステップS104)、観測信号ベクトルy(k,f)を(316)式により作成する(ステップS105)。
Figure 0006845373
ここで、本第7の実施形態における観測信号ベクトルy(k,f)のモデル化について説明する。本実施形態では、各時間周波数点(k,f)において観測信号ベクトルy(k,f)は高々2個の源信号成分しか含まないと仮定する。各時間周波数点(k,f)において観測信号ベクトルy(k,f)に含まれる源信号成分は、そのような源信号成分のインデックスの全体である集合B(k,f)により表すことができる(ただし、集合B(k,f)の元の個数#B(k,f)は#B(k,f)≦2を満たすものとする)。このとき、観測信号ベクトルy(k,f)は、B(k,f)のすべての元jに対する源信号成分x(k,f)の和として、(317)式によりモデル化される。
Figure 0006845373
例えば、ある時間周波数点(k,f)でB(k,f)={1,3}である場合、(k,f)では、(317)式は、(318)式のようになる。
Figure 0006845373
B(k,f)が取りうる値(集合)の全体を、集合{1,・・・,L}の空でない部分集合からなる集合系(すなわち、冪集合2{1,・・・,L}の部分集合であって空集合を元として含まないもの)Hで表す。例えば、B(k,f)が#B≦2なる任意の空でない集合B⊂{1,・・・,L}になり得る場合、Hは、(319)式及び(320)式で与えられる。
Figure 0006845373
(319)式及び(320)式の集合系HをHmaxで表す。本第7の実施形態では、集合系Hは、あらかじめ与えられており、H⊂Hmaxであるとする。また、#B=2なる集合B∈Hが少なくとも一つはあるものとする。
すなわち、集合系Hの元(集合)Bが存在して、#B=2であるとする。
信号パラメータ分析部720は、空間共分散行列更新部790からの空間共分散行列R(f)の推定値^R(f)(ただし、例外として、信号パラメータ分析部720での最初の処理の際には、初期化部からの空間共分散行列R(f)の初期推定値^R (0)(f))を受け取って、L個の源信号成分のうちの任意の2個x(k,f),x(k,f)(j,lは1以上L以下の相異なる任意の自然数)に対して、同時無相関化行列P{j,l}(f)と対角行列Λj,{j,l}(f)を計算する(ステップS106)。ここで、同時無相関化行列P{j,l}(f)は2個の源信号成分x(k,f),x(k,f)を同時無相関化する行列(すなわち、2個の源信号成分x(k,f),x(k,f)の空間共分散行列を同時対角化する行列)であり、添え字である集合{j,l}は、同時無相関化行列P{j,l}(f)によって同時無相関化される源信号成分x(k,f),x(k,f)のインデックスを表している。また、対角行列Λj,{j,l}(f)は、源信号成分x(k,f)の空間共分散行列を同時無相関化行列P{j,l}(f)によって対角化した際の対角行列である。
具体的には、信号パラメータ分析部720は以下の処理を行う。まず、2個の源信号成分x(k,f),x(k,f)(j,lは、1≦j<l≦Lなる任意の2つの自然数)の空間共分散行列の推定値に対する一般化固有値問題^R(f)p=λ^R(f)pを解くことにより、(ただし、例外として、信号パラメータ分析部720での最初の処理の際には、これらの源信号成分の空間共分散行列の初期推定値に対する一般化固有値問題^R (0)(f)p=λ^R (0)(f)pを解くことにより、)一般化固有値λ1,{j,l}(f),・・・,λI,{j,l}(f)と、一般化固有値λ1,{j,l}(f),・・・,λI,{j,l}(f)にそれぞれ対応する一般化固有ベクトルp1,{j,l}(f),・・・,pI,{j,l}(f)と、を求める。ただし、一般化固有ベクトルp1,{j,l}(f),・・・,pI,{j,l}(f)は、(321)式を満たすように取るものとする。
Figure 0006845373
なお、信号パラメータ分析部720での最初の処理の際には、(321)式において、^R(f)を^R (0)(f)で置き換える。信号パラメータ分析部720は、次に、一般化固有ベクトルp1,{j,l}(f),・・・,pI,{j,l}(f)を列ベクトルとする行列を同時無相関化行列P{j,l}(f)とし、I次単位行列を対角行列Λj,{j,l}(f)とし、一般化固有値λ1,{j,l}(f),・・・,λI,{j,l}(f)を対角要素とする対角行列を対角行列Λl,{j,l}(f)とする。
同時無相関化部730は、観測信号ベクトル作成部710からの観測信号ベクトルy(k,f)と、信号パラメータ分析部720からの同時無相関化行列P{j,l}(f)と、を受け取って、源信号成分x(k,f),x(k,f)(j,lは、1≦j<l≦Lなる任意の2つの自然数)について同時無相関化された観測信号ベクトルy´{j,l}(k,f)を次の(322)式により計算する(ステップS107)。
Figure 0006845373
ここで、添え字である集合{j,l}は、同時無相関化される源信号成分x(k,f),x(k,f)のインデックスを表す。
信号存在事後確率更新部740は、信号パラメータ分析部720からの同時無相関化行列P{j,l}(f)及び対角行列Λj,{j,l}(f)と、同時無相関化部730からの同時無相関化された観測信号ベクトルy´{j,l}(k,f)と、混合重み更新部770からの混合重みα(f)の推定値^α(f)(ただし、例外として、信号存在事後確率更新部740における最初の処理の際には、初期化部からの混合重み^α(f)の初期推定値^α (0)(f))と、分散パラメータ更新部780からの分散パラメータv(k,f)の推定値^v(k,f)(ただし、例外として、信号存在事後確率更新部740における最初の処理の際には、初期化部からの分散パラメータv(k,f)の初期推定値^v (0)(k,f))と、を受け取って、集合系Hの各元(集合)Bに対して、信号存在事後確率γ(k,f)を(323)式により更新する(ステップS108)。
Figure 0006845373
なお、集合系Hの定義によっては、(323)式において、ただ一つの元からなる集合(一元集合){j}に対する同時無相関化行列P{j}(f)、対角行列Λj,{j}(f)及び同時無相関化された観測信号ベクトルy´{j}(k,f)が現れることがあるが、これらは二元集合に対するP{j,l}(f)、Λj,{j,l}(f)及びy´{j,l}(k,f)を用いて、(324)式、(325)式及び(326)式により定義される。
Figure 0006845373
Figure 0006845373
Figure 0006845373
ここで、ρ:{1,...,L}→{1,...,L}は、「すべてのj∈{1,...,L}に対してρ(j)≠j」なる所定の関数である。このように定義する理由は、次の通りである。
すなわち、1個の源信号成分x(k,f)の同時無相関化とは、単なるx(k,f)の無相関化に他ならず、それは2個の源信号成分x(k,f),xρ(j)(k,f)の同時無相関化により当然実現されるからである。
シングルチャネルウィーナーフィルタ部750は、同時無相関化部730からの同時無相関化された観測信号ベクトルy´{j,l}(k,f)と、信号パラメータ分析部720からの対角行列Λj,{j,l}(f)と、分散パラメータ更新部780からの分散パラメータv(k,f)の推定値^v(k,f)(ただし、例外として、シングルチャネルウィーナーフィルタ部750における最初の処理の際には、初期化部からの分散パラメータv(k,f)の初期推定値^v (0)(k,f))と、を受け取って、同時無相関化された事後平均m´j,{j,l}(k,f)(j,lは1以上L以下の相異なる任意の自然数)を(327)式により更新する(ステップS109)。
Figure 0006845373
事後共分散行列更新部760は、信号パラメータ分析部720からの対角行列Λj,{j,l}(f)と、分散パラメータ更新部780からの分散パラメータv(k,f)の推定値^v(k,f)(ただし、例外として、事後共分散行列更新部760における最初の処理の際には、初期化部からの分散パラメータv(k,f)の初期推定値^v (0)(k,f))と、を受け取って、同時無相関化された事後共分散行列Σ´{j,l}(k,f)(j,lは1≦j<l≦Lなる任意の2つの自然数)を次の(328)式により更新する(ステップS110)。
Figure 0006845373
混合重み更新部770は、信号存在事後確率更新部740からの信号存在事後確率γ(k,f)を受け取って、(329)式により混合重みα(f)の推定値^α(f)(Bは集合系Hの任意の元(集合))を更新する(ステップS111)。
Figure 0006845373
分散パラメータ更新部780は、信号パラメータ分析部720からの対角行列Λj,{j,l}(f)と、信号存在事後確率更新部740からの信号存在事後確率γ(k,f)と、シングルチャネルウィーナーフィルタ部750からの同時無相関化された事後平均m´j,{j,l}(k,f)と、事後共分散行列更新部760からの同時無相関化された事後共分散行列Σ´{j,l}(k,f)とを受け取って、分散パラメータv(k,f)の推定値^v(k,f)を(330)式により更新する(ステップS112)。
Figure 0006845373
なお、集合系Hの定義によっては、(330)式において、一元集合{j}に対する同時無相関化された事後平均m´j,{j}(k,f)及び同時無相関化された事後共分散行列Σ´{j}(k,f)が現れることがあるが、これらは(331)式及び(332)式により定義される。
Figure 0006845373
Figure 0006845373
空間共分散行列更新部790は、信号パラメータ分析部720からの同時無相関化行列P{j,l}(f)と、信号存在事後確率更新部740からの信号存在事後確率γ(k,f)と、シングルチャネルウィーナーフィルタ部750からの同時無相関化された事後平均m´j,{j,l}(k,f)と、事後共分散行列更新部760からの同時無相関化された事後共分散行列Σ´{j,l}(k,f)と、分散パラメータ更新部780からの分散パラメータv(k,f)の推定値^v(k,f)と、を受け取って、空間共分散行列R(f)の推定値^R(f)を(333)式により更新する(ステップS113)。
Figure 0006845373
図示しない収束判定部は、収束したかどうかの判定を行う(ステップS114)。収束判定部が収束していないと判定した場合(ステップS114:No)、信号パラメータ分析部720での処理に戻って、処理が継続される。
一方、収束判定部が収束したと判定した場合(ステップS114:Yes)、源信号成分推定部800での処理が行われる。源信号成分推定部800は、信号パラメータ分析部720からの同時無相関化行列P{j,l}(f)と、信号存在事後確率更新部740からの信号存在事後確率γ(k,f)と、シングルチャネルウィーナーフィルタ部750からの同時無相関化された事後平均m´j,{j,l}(k,f)と、を受け取って、源信号成分x(k,f)の推定値^x(k,f)を(334)式により推定し(ステップS115)、出力する。
Figure 0006845373
周波数領域信号分離部320は、f=Fであるかどうか判定する(ステップS116)。f=Fでないと判定された場合(ステップS116:No)、周波数領域信号分離部320でのf←f+1の処理に戻って、処理が継続される。
一方、f=Fであると判定された場合(ステップS116:Yes)、周波数領域信号分離部320での処理は終了する。
[信号分析装置の処理の背景]
次に、本第7の実施形態に係る信号分析装置の処理の背景について説明する。本第7の実施形態では、観測信号ベクトルy(k,f)は、(317)式でモデル化される。
本第7の実施形態では、源信号成分x(k,f)が平均0、共分散行列S(k,f)=v(k,f)R(f)の複素ガウス分布に従うと仮定する。このとき、B(k,f)が値B∈Hを取るという条件下での観測信号ベクトルy(k,f)の確率分布は、次の(335)式で与えられる。
Figure 0006845373
ここで、Φはすべてのモデルパラメータをまとめて表したものである。また、集合B(k,f)の確率分布は次の(336)式で与えられる。
Figure 0006845373
ただし、α(f)は、次の(337)式の制約条件を満たす。
Figure 0006845373
(338)式及び(336)式より、観測信号ベクトルy(k,f)の確率分布は、次の(338)式で与えられる。
Figure 0006845373
以下、α(f)を混合重みと呼ぶ。パラメータΦは、混合重みα(f)、分散パラメータv(k,f)及び空間共分散行列R(f)からなる。パラメータΦは、次の(339)式の尤度関数の最大化により推定できる。
Figure 0006845373
参考文献6「R. Ikeshita, M. Togami, Y. Kawaguchi, Y. Fujita, and K. Nagamatsu, “Local Gaussian model with source-set constraints in audio source separation”, IEEE International Workshop on Machine Learning for Signal Processing, Sept. 2017.」には、EMアルゴリズムに基づいて上式の尤度関数を最大化することにより、パラメータΦを推定する方法が開示されている。この従来技術では、EステップとMステップを交互に反復することにより、パラメータΦを推定する。
Eステップでは、信号存在事後確率γ(k,f)、事後平均mj,B(k,f)及び事後共分散行列Σ(k,f)を次の(340)式〜(344)式により計算する。
Figure 0006845373
Figure 0006845373
Figure 0006845373
Figure 0006845373
Figure 0006845373
ここで、信号存在事後確率γ(k,f)は、観測信号ベクトルy(k,f)が与えられたという条件下での集合B(k,f)の条件付き確率分布である事後分布として、次の(345)式で定義される。
Figure 0006845373
ここで、^ΦはパラメータΦの現在の推定値を表す。また、事後平均mj,B(k,f)及び事後共分散行列Σ(k,f)とは、観測信号ベクトルy(k,f)と集合B(k,f)が与えられたという条件下での源信号成分x(k,f)の条件付き確率分布である事後分布(複素ガウス分布であることが示される)の平均及び共分散行列として定義される。この事後分布は次の(346)式のように表される。
Figure 0006845373
Mステップでは、混合重みα(f)の推定値^α(f)、分散パラメータv(k,f)の推定値^v(k,f)及び空間共分散行列R(f)の推定値^R(f)を、次の(347)式〜(349)式の更新則により更新する。
Figure 0006845373
Figure 0006845373
Figure 0006845373
しかしながら、この従来技術では、(340)式の信号存在事後確率γ(k,f)の更新、(342)式の事後平均mj,B(k,f)の更新、及び(344)式の事後共分散行列Σ{j,l}(k,f)の更新において、行列式計算、逆行列計算及び行列乗算を時間周波数点ごとに行う必要があった。具体的には、(340)式における(350)式の形の行列式計算と、(340)式及び(342)式及び(344)式における(351)式の形の逆行列計算と、(344)式における(352)式の形の行列乗算と、を時間周波数点(k,f)ごとに行う必要があった。
Figure 0006845373
Figure 0006845373
Figure 0006845373
行列式計算、逆行列計算及び行列乗算はいずれもO(I)のオーダーの計算量を必要とする行列演算であり、かつ時間周波数点の数は通常、非常に大きいため、この従来技術では膨大な計算量を要していた。
いま仮に、(350)式〜(352)式における共分散行列^v(k,f)^R(f)及び^v(k,f)^R(f)がともに対角行列であるとすると、(350)式〜(352)式における行列式計算、逆行列計算及び行列乗算は単なる対角要素に対するスカラー演算に帰着するため、少ない計算量で計算できる。しかしながら、通常、源信号成分(ベクトル)の異なる要素は互いに相関を持つため、共分散行列^v(k,f)^R(f)及び^v(k,f)^R(f)は対角行列ではない。
そこで、本第7の実施形態では、一般化固有値問題に基づいて2つの空間共分散行列^R(f),^R(f)を同時対角化することを考える。λ1,{j,l}(f),・・・,λI,{j,l}(f)を空間共分散行列^R(f),^R(f)に対する一般化固有値問題((353)式)の一般化固有値とし、p1,{j,l}(f),・・・,pI,{j,l}(f)を一般化固有値λ1,{j,l}(f),・・・,λI,{j,l}(f)に対応する一般化固有ベクトルとする。
Figure 0006845373
ただし、一般化固有ベクトルp1,{j,l}(f),・・・,pI,{j,l}(f)は、次の(354)式を満たすように取る。
Figure 0006845373
{j,l}(f)を一般化固有ベクトルp1,{j,l}(f),・・・,pI,{j,l}(f)を列ベクトルとする行列、Λ{j,l}(f)を一般化固有値λ1,{j,l}(f),・・・,λI,{j,l}(f)を対角要素とする対角行列とすると、次の(355)式が成り立つ。
Figure 0006845373
(355)式は、行列P{j,l}(f)が2つの空間共分散行列^R(f),^R(f)を同時対角化する(2つの源信号成分x(k,f),x(k,f)を同時無相関化する)ことを示している。そこで、行列P{j,l}(f)を同時無相関化行列と呼ぶ。
(355)式を空間共分散行列^R(f),^R(f)について解いて、(340)式、(342)式及び(344)式に代入し、(356)式〜(358)式と定義する(j,lは1以上L以下の互いに異なる任意の整数)と、(362)、(363)式及び(364)式(後述)を得る。
Figure 0006845373
Figure 0006845373
Figure 0006845373
(356)式及び(357)式を事後平均mj,{j,l}(k,f)及び事後共分散行列Σ{j,l}(k,f)について解き、(348)式及び(349)式に代入すると(366)式及び(368)式を得る。
これで、本第7の実施形態に係る信号分析装置における更新則が導出された。
このように、本第7の実施形態に係る信号分析装置では、信号パラメータ分析部720は、2個の混在する源信号それぞれの空間的特性をモデル化する空間共分散行列^R(f),^R(f)に対するpi,{j,l}(f)^R(f)pm,{j,l}(f)=0(i,mは1以上I以下の互いに異なる任意の整数)を満たす、それぞれ異なるI個(Iは2以上の整数)の一般化固有ベクトルp1,{j,l}(f),・・・,pI,{j,l}(f)を列ベクトルとする行列である同時無相関化行列P{j,l}(f)またはそのエルミート転置P{j,l}(f)を、I個の位置で取得される観測信号による観測信号ベクトルについて2個の源信号に対応する成分を無相関化するためのパラメータとして得る。
[第7の実施形態の実施例]
本実施例では、集合系Hの具体例について説明する。本実施例では、集合系Hを(359)式とする。
Figure 0006845373
これは、各時間周波数点において観測信号ベクトルは、1番目の源信号成分をつねに含み、2番目〜J番目の源信号成分のうちのちょうど1つを含むことを意味する。例えば、1番目の源信号成分は背景雑音のようなスパースでない源信号成分をモデル化し、2番目〜J番目の源信号成分は音声のようなスパースな源信号成分をモデル化する。
信号パラメータ分析部720、同時無相関化部730、信号存在事後確率更新部740、シングルチャネルウィーナーフィルタ部750、事後共分散行列更新部760、混合重み更新部770、分散パラメータ更新部780、空間共分散行列更新部790及び源信号成分推定部800における処理の更新式を(360)式〜(370)式に示す。本第7の実施形態では、Hの元である集合{1,2},{1,3},・・・,{1,J}は、それぞれインデックス2,3,・・・,Jと1対1に対応しているから、簡単のため以下の記法を用いる。すなわち、y´{1,j}(k,f)をy´(k,f)と書き、P{1,j}(f)をP(f)と書き、γ{1,j}(k,f)をγ(k,f)と書き、^α{1,j}(f)を^α(f)と書き、Λl,{1,j}(f)をΛlj(f)と書き、m´l,{1,j}(k,f)をm´lj(k,f)と書き、Σ´{1,j}(k,f)をΣ´(k,f)と書く。ただし、j=2,・・・,Jとし、l=1,jとする(下記の更新式でも同様)。なお、本実施例では、信号パラメータ分析部720は、L個の源信号成分のうちの任意の2個xj(k,f),xl(k,f)(j,lは1以上L以下の相異なる任意の自然数)に対して、同時無相関化行列P{j,l}(f)と対角行列Λj,{j,l}(f)を計算する必要はなく、(360)式にあるように、x1(k,f),xj(k,f)(jは2以上L以下の任意の自然数)に対して、同時無相関化行列P{1,j}(f)(すなわちPj(f))と対角行列Λl,{1,j}(f)(すなわちΛlj(f))を計算すれば十分である。
Figure 0006845373
Figure 0006845373
Figure 0006845373
Figure 0006845373
Figure 0006845373
Figure 0006845373
Figure 0006845373
Figure 0006845373
Figure 0006845373
Figure 0006845373
Figure 0006845373
[第8の実施形態]
本第8の実施形態では、第3の実施形態に係る信号分析装置の他の構成例について説明する。図21は、第8の実施形態に係る信号分析装置の構成の一例を示す図である。図22は、第8の実施形態に係る信号分析処理の処理手順の一例を示すフローチャートである。図21に示すように、第8の実施の形態に係る信号分析装置801は、周波数領域変換部310、周波数領域信号分離部320−1及び時間領域変換部330を有する。
信号分析装置801では、周波数領域信号分離部320−1において、スペクトル基底t(f)と、アクティベーション基底w(k)と、分配関数znjと、同時無相関化された空間共分散行列Λ(f)と、同時無相関化行列P(f)との推定値とを計算する。
スペクトル基底t(f)と、アクティベーション基底w(k)と、分配関数znjとは、分散パラメータv(k,f)をモデル化するパラメータである。分散パラメータv(k,f)は、これらのパラメータを用いて(371)式によりモデル化される。
Figure 0006845373
ここで、nは、スペクトル基底およびアクティベーション基底のインデックスである。Nは、スペクトル基底およびアクティベーション基底の個数である。
周波数領域信号分離部320−1は、初期化部(図示しない)、観測信号ベクトル作成部810、同時無相関化830、シングルチャネルウィーナーフィルタ部840、観測共分散行列更新部850、分散パラメータ更新部860、空間共分散行列更新部870、信号パラメータ分析部820、収束判定部(図示しない)及び同時無相関化逆変換部880を有する。
[信号分析装置の構成及び処理]
図21及び図22を用いて、第8の実施形態に係る信号分析装置の構成及び信号分析処理の処理手順について説明する。
図示しない初期化部は、分散パラメータv(k,f)と、スペクトル基底t(f)と、アクティベーション基底w(k)と、分配関数znjと、同時無相関化された空間共分散行列Λ(f)と、同時無相関化行列P(f)と、の初期推定値を計算する初期化を行う(ステップS121)。初期推定値は、上付きの(0)を付して、^v (0)(k,f)などと表す。
周波数領域変換部310は、観測信号を取得し(ステップS122)、観測信号を周波数領域に変換する(ステップS123)ことにより、時間周波数領域の観測信号y(k,f)を計算する。
観測信号ベクトル作成部810は、観測信号ベクトルy(k,f)を第7の実施形態と同様にして作成する(ステップS124)。
同時無相関化部830は、同時無相関化された観測信号ベクトルy´(k,f)を(372)式により計算し、更新する(ステップS125)。
Figure 0006845373
ここで、^P(f)は信号パラメータ分析部820からの同時無相関化行列の推定値である。
観測共分散行列更新部850は、同時無相関化された観測共分散行列U´(k,f)を(373)式により更新する(ステップS126)。
Figure 0006845373
ここで、^v(k,f)は、分散パラメータ更新部860からの分散パラメータの推定値である。^Λ(f)は、空間共分散行列更新部870からの同時無相関化された空間共分散行列の推定値である。
分散パラメータ更新部860は、次の手順により分散パラメータの推定値^v(k,f)を更新する(ステップS127)。
まず、分散パラメータ更新部860は、n番目の基底に対応する同時無相関化された空間共分散行列Σ(f)を(374)式により更新する。(374)式において、^znjは、分配関数の推定値である。
Figure 0006845373
次に、分散パラメータ更新部はスペクトル基底の推定値^t(f)を(375)式により更新する。(375)式において、^w(k)はアクティベーション基底の推定値である。
Figure 0006845373
次に、分散パラメータ更新部860は、アクティベーション基底の推定値^w(k)を(376)式により更新する。
Figure 0006845373
次に、分散パラメータ更新部860は、分配関数の推定値^znjを(377)式により更新する。
Figure 0006845373
最後に、分散パラメータ更新部860は、分散パラメータの推定値^v(k,f)を(378)式により更新する。
Figure 0006845373
空間共分散行列更新部870は、(379)式により、同時無相関化された空間共分散行列の推定値^Λ(f)を更新する(ステップS128)。
Figure 0006845373
ここで、#は、行列の幾何平均であり、A(f)およびB(f)は、(380)式および(381)式で計算される行列である。
Figure 0006845373
Figure 0006845373
信号パラメータ分析部820は、同時無相関化行列の推定値^P(f)を(382)式により更新する(ステップS129)。
Figure 0006845373
図示しない収束判定部は、収束したかどうかの判定を行う(ステップS130)。収束判定部が収束していないと判定した場合(ステップS130:No)、同時無相関化部830での処理(ステップS125)に戻って、処理が継続される。
一方、収束判定部が収束したと判定した場合(ステップS130:Yes)、シングルチャネルウィーナーフィルタ部840は、同時無相関化された源信号成分の推定値^x´(k,f)を(383)式により計算する(ステップS131)。
Figure 0006845373
シングルチャネルウィーナーフィルタ部840は、同時無相関化された源信号成分の推定値^x´(k,f)を更新する(ステップS132)。
同時無相関化逆変換部880は、源信号成分の推定値^x(k,f)を(384)式により計算する(ステップS133)。
Figure 0006845373
時間領域変換部330は、第7の実施形態と同様の処理を行って、時間領域の源信号成分の推定値^x(t)を計算し、出力する(ステップS134)。
[第8の実施形態の効果]
第3の実施形態では、音の方向性のみを基に信号処理を行っていた。これに対して、本第8の実施形態では、音の構造(パーツ)も考慮して信号分析を行うため、音源分離の精度を向上させることができる。
そして、第8の実施形態では、パーミテーション問題が原理的に起こらないという効果を奏する。本第8の実施形態では、全ての周波数において、どのようなパーツがあるかを考慮した処理を行うため、周波数ごとに独立に処理しないことから、パーミテーション問題が原理的に起こらない。
[システム構成等]
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。さらに、各装置にて行われる各処理機能は、その全部又は任意の一部が、CPU及び当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
また、本実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。すなわち、上記学習方法及び音声認識方法において説明した処理は、記載の順にしたがって時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。
[プログラム]
図23は、プログラムが実行されることにより、信号分析装置1,201,301,401,501,601が実現されるコンピュータの一例を示す図である。コンピュータ1000は、例えば、メモリ1010、CPU1020を有する。また、コンピュータ1000は、ハードディスクドライブインタフェース1030、ディスクドライブインタフェース1040、シリアルポートインタフェース1050、ビデオアダプタ1060、ネットワークインタフェース1070を有する。これらの各部は、バス1080によって接続される。
メモリ1010は、ROM1011及びRAM1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、ハードディスクドライブ1090に接続される。ディスクドライブインタフェース1040は、ディスクドライブ1100に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ1100に挿入される。シリアルポートインタフェース1050は、例えばマウス1110、キーボード1120に接続される。ビデオアダプタ1060は、例えばディスプレイ1130に接続される。
ハードディスクドライブ1090は、例えば、OS(Operating System)1091、アプリケーションプログラム1092、プログラムモジュール1093、プログラムデータ1094を記憶する。すなわち、信号分析装置1,201,301,401,501,601の各処理を規定するプログラムは、コンピュータ1000により実行可能なコードが記述されたプログラムモジュール1093として実装される。プログラムモジュール1093は、例えばハードディスクドライブ1090に記憶される。例えば、信号分析装置1,201,301,401,501,601における機能構成と同様の処理を実行するためのプログラムモジュール1093が、ハードディスクドライブ1090に記憶される。なお、ハードディスクドライブ1090は、SSD(Solid State Drive)により代替されてもよい。
また、上述した実施形態の処理で用いられる設定データは、プログラムデータ1094として、例えばメモリ1010やハードディスクドライブ1090に記憶される。そして、CPU1020が、メモリ1010やハードディスクドライブ1090に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出して実行する。
なお、プログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1090に記憶される場合に限らず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ1100等を介してCPU1020によって読み出されてもよい。あるいは、プログラムモジュール1093及びプログラムデータ1094は、ネットワーク(LAN(Local Area Network)、WAN(Wide Area Network)等)を介して接続された他のコンピュータに記憶されてもよい。そして、プログラムモジュール1093及びプログラムデータ1094は、他のコンピュータから、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
以上、本発明者によってなされた発明を適用した実施形態について説明したが、本実施形態による本発明の開示の一部をなす記述及び図面により本発明は限定されることはない。すなわち、本実施形態に基づいて当業者等によりなされる他の実施形態、実施例及び運用技術等はすべて本発明の範疇に含まれる。
1,201,301,401,501,601,801 信号分析装置
10,210,410,510,610,710,810 観測信号ベクトル作成部
20,220,420,520,620,720,820 信号パラメータ分析部
30,230,430,530,630,730,830 同時無相関化部
40,240,540,640,750,840 シングルチャネルウィーナーフィルタ部
50,280,580,680,880 同時無相関化逆変換部
250,550,760 事後共分散行列更新部
260,440,560,780,860 分散パラメータ更新部
270,450,570,790,870 空間共分散行列更新部
310 周波数領域変換部
320 周波数領域信号分離部
330 時間領域変換部
650,850 観測共分散行列更新部
740 信号存在事後確率更新部
770 混合重み更新部
800 源信号成分推定部

Claims (20)

  1. J個(Jは2以上の整数)の混在する源信号それぞれの空間的特性をモデル化する空間共分散行列R(jは1以上J以下の整数)について、PPがすべて対角行列になるような行列である同時無相関化行列Pまたは/及び、そのエルミート転置Pを、それぞれ異なるI個(Iは2以上の整数)の位置で取得される観測信号による観測信号ベクトルについてJ個の源信号に対応する成分を無相関化するためのパラメータとして得る信号パラメータ分析部
    を有することを特徴とする信号分析装置。
  2. 請求項1に記載の信号分析装置であって、
    前記信号パラメータ分析部は、前記空間共分散行列R(jは1以上J以下の整数)について、PPがすべて対角行列に近づくように求めた行列である同時無相関化行列Pまたは/及びそのエルミート転置Pを、それぞれ異なるI個(Iは2以上の整数)の位置で取得される観測信号による観測信号ベクトルについてJ個の源信号に対応する成分を無相関化するためのパラメータとして得ることを特徴とする信号分析装置。
  3. 請求項1に記載の信号分析装置であって、
    前記信号パラメータ分析部は、不動点法、勾配法、自然勾配法、または、ニュートン法に基づいて、同時無相関化行列Pの推定値を更新することを特徴とする信号分析装置。
  4. 請求項1に記載の信号分析装置であって、
    前記信号パラメータ分析部が得た前記同時無相関化行列Pのエルミート転置Pを、入力されたI個の観測信号による観測信号ベクトルに掛けることにより、J個の源信号に対応する成分が無相関化された同時無相関化済観測信号ベクトルを得る同時無相関化部
    をさらに有することを特徴とする信号分析装置。
  5. 請求項4に記載の信号分析装置であって、
    前記同時無相関化部が得た前記同時無相関化済観測信号ベクトルの各要素に、
    前記同時無相関化行列Pに基づく行列PP(jは1以上J以下の整数)の対角成分に基づくシングルチャネルウィーナーフィルタを適用して同時無相関化済源信号成分推定値によるベクトルを得るウィーナーフィルタ部
    をさらに有することを特徴とする信号分析装置。
  6. 請求項5に記載の信号分析装置であって、
    前記ウィーナーフィルタ部が得た前記同時無相関化済源信号成分推定値によるベクトルに、前記同時無相関化行列Pのエルミート転置Pの逆行列を掛けることにより、源信号成分の推定値を得る同時無相関化逆変換部
    をさらに有することを特徴とする信号分析装置。
  7. 2個の混在する源信号それぞれの空間的特性をモデル化する空間共分散行列R,Rに対するp =0(i,mは1以上I以下の互いに異なる任意の整数)を満たす、それぞれ異なるI個(Iは2以上の整数)の一般化固有ベクトルp,・・・,pを列ベクトルとする行列である同時無相関化行列Pまたはそのエルミート転置Pを、前記I個の位置で取得される観測信号による観測信号ベクトルについて2個の源信号に対応する成分を無相関化するためのパラメータとして得る信号パラメータ分析部
    を有することを特徴とする信号分析装置。
  8. 請求項7に記載の信号分析装置であって、
    前記信号パラメータ分析部が得た前記同時無相関化行列Pのエルミート転置Pを、入力されたI個の観測信号による観測信号ベクトルに掛けることにより、2個の源信号に対応する成分が無相関化された同時無相関化済観測信号ベクトルを得る同時無相関化部
    をさらに有することを特徴とする信号分析装置。
  9. 請求項8に記載の信号分析装置であって、
    前記同時無相関化部が得た前記同時無相関化済観測信号ベクトルの各要素に、
    前記同時無相関化行列Pに基づく行列PP(jは1または2)の対角成分に基づくシングルチャネルウィーナーフィルタを適用して同時無相関化済源信号成分推定値によるベクトルを得るウィーナーフィルタ部
    をさらに有することを特徴とする信号分析装置。
  10. 請求項9に記載の信号分析装置であって、
    前記ウィーナーフィルタ部が得た前記同時無相関化済源信号成分推定値によるベクトルに、前記同時無相関化行列Pのエルミート転置Pの逆行列を掛けることにより、源信号成分の推定値を得る同時無相関化逆変換部
    をさらに有することを特徴とする信号分析装置。
  11. J個(Jは2以上の整数)の混在する源信号それぞれの空間的特性をモデル化する空間共分散行列R(jは1以上J以下の整数)について、PPがすべて対角行列になるような行列Pを、それぞれ異なるI個(Iは2以上の整数)の位置で取得される観測信号による観測信号ベクトルについてJ個の源信号に対応する成分を無相関化するための同時無相関化行列として、前記同時無相関化行列のエルミート転置を、前記観測信号ベクトルに掛けることにより、J個の源信号に対応する成分が無相関化された同時無相関化済観測信号ベクトルを得る同時無相関化部
    を有することを特徴とする信号分析装置。
  12. 請求項11に記載の信号分析装置であって、
    前記同時無相関化部が得た前記同時無相関化済観測信号ベクトルの各要素に、
    前記同時無相関化行列Pに基づく行列PP(jは1以上J以下の整数)の対角成分に基づくシングルチャネルウィーナーフィルタを適用して同時無相関化済源信号成分推定値によるベクトルを得るウィーナーフィルタ部
    をさらに有することを特徴とする信号分析装置。
  13. 請求項12に記載の信号分析装置であって、
    前記ウィーナーフィルタ部が得た前記同時無相関化済源信号成分推定値によるベクトルに、前記同時無相関化行列Pのエルミート転置Pの逆行列を掛けることにより、源信号成分の推定値を得る同時無相関化逆変換部
    をさらに有することを特徴とする信号分析装置。
  14. J個(Jは2以上の整数)の混在する源信号から得た同時無相関化された共分散行列に基づいて、源信号の空間的特性をモデル化するパラメータである空間共分散行列を求める空間共分散行列計算部、または/及び前記同時無相関化された共分散行列に基づいて、源信号のサンプル点ごとの分散をモデル化するパラメータである分散パラメータを求める分散パラメータ計算部
    を有することを特徴とする信号分析装置。
  15. 請求項14に記載の信号分析装置であって、
    補助関数法を用いて、前記空間共分散行列または/及び分散パラメータを求めることを特徴とする信号分析装置。
  16. 信号分析装置が実行する信号分析方法であって、
    J個(Jは2以上の整数)の混在する源信号それぞれの空間的特性をモデル化する空間共分散行列R(jは1以上J以下の整数)について、PPがすべて対角行列になるような行列である同時無相関化行列Pまたは/及び、そのエルミート転置Pを、それぞれ異なるI個(Iは2以上の整数)の位置で取得される観測信号による観測信号ベクトルについてJ個の源信号に対応する成分を無相関化するためのパラメータとして得る工程
    を含んだことを特徴とする信号分析方法。
  17. 信号分析装置が実行する信号分析方法であって、
    2個の混在する源信号それぞれの空間的特性をモデル化する空間共分散行列R,Rに対するp =0(i,mは1以上I以下の互いに異なる任意の整数)を満たす、それぞれ異なるI個(Iは2以上の整数)の一般化固有ベクトルp,・・・,pを列ベクトルとする行列である同時無相関化行列Pまたはそのエルミート転置Pを、前記I個の位置で取得される観測信号による観測信号ベクトルについて2個の源信号に対応する成分を無相関化するためのパラメータとして得る工程
    を含んだことを特徴とする信号分析方法。
  18. 信号分析装置が実行する信号分析方法であって、
    J個(Jは2以上の整数)の混在する源信号それぞれの空間的特性をモデル化する空間共分散行列R(jは1以上J以下の整数)について、PPがすべて対角行列になるような行列Pを、それぞれ異なるI個(Iは2以上の整数)の位置で取得される観測信号による観測信号ベクトルについてJ個の源信号に対応する成分を無相関化するための同時無相関化行列として、前記同時無相関化行列のエルミート転置を、前記観測信号ベクトルに掛けることにより、J個の源信号に対応する成分が無相関化された同時無相関化済観測信号ベクトルを得る工程
    を含んだことを特徴とする信号分析方法。
  19. 信号分析装置が実行する信号分析方法であって、
    J個(Jは2以上の整数)の混在する源信号から得た同時無相関化された共分散行列に基づいて、源信号の空間的特性をモデル化するパラメータである空間共分散行列を求める工程
    を含んだことを特徴とする信号分析方法。
  20. コンピュータを、請求項1〜15のいずれか一つに記載の信号分析装置として機能させるための信号分析プログラム。
JP2020501644A 2018-02-23 2019-02-01 信号分析装置、信号分析方法及び信号分析プログラム Active JP6845373B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
JP2018030701 2018-02-23
JP2018030701 2018-02-23
JP2018133592 2018-07-13
JP2018133592 2018-07-13
JP2018164051 2018-08-31
JP2018164051 2018-08-31
PCT/JP2019/003671 WO2019163487A1 (ja) 2018-02-23 2019-02-01 信号分析装置、信号分析方法及び信号分析プログラム

Publications (2)

Publication Number Publication Date
JPWO2019163487A1 JPWO2019163487A1 (ja) 2020-12-03
JP6845373B2 true JP6845373B2 (ja) 2021-03-17

Family

ID=67688061

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020501644A Active JP6845373B2 (ja) 2018-02-23 2019-02-01 信号分析装置、信号分析方法及び信号分析プログラム

Country Status (3)

Country Link
US (1) US11423924B2 (ja)
JP (1) JP6845373B2 (ja)
WO (1) WO2019163487A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6915579B2 (ja) * 2018-04-06 2021-08-04 日本電信電話株式会社 信号分析装置、信号分析方法および信号分析プログラム
JP6969506B2 (ja) * 2018-06-20 2021-11-24 日本電信電話株式会社 光周波数多重型コヒーレントotdr、試験方法、信号処理装置、及びプログラム
CN113158741B (zh) * 2021-01-29 2023-04-11 中国人民解放军63892部队 一种基于特征值对角加载的信源数估计方法
TWI809390B (zh) * 2021-03-01 2023-07-21 新加坡商台達電子國際(新加坡)私人有限公司 不須計算取樣頻率誤差的盲源分離方法以及音訊處理系統

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3190587B1 (en) * 2012-08-24 2018-10-17 Oticon A/s Noise estimation for use with noise reduction and echo cancellation in personal communication
JP6584930B2 (ja) * 2015-11-17 2019-10-02 株式会社東芝 情報処理装置、情報処理方法およびプログラム
US10878832B2 (en) * 2016-02-16 2020-12-29 Nippon Telegraph And Telephone Corporation Mask estimation apparatus, mask estimation method, and mask estimation program
EP3509325B1 (en) * 2016-05-30 2021-01-27 Oticon A/s A hearing aid comprising a beam former filtering unit comprising a smoothing unit
US10667069B2 (en) * 2016-08-31 2020-05-26 Dolby Laboratories Licensing Corporation Source separation for reverberant environment
US10957337B2 (en) * 2018-04-11 2021-03-23 Microsoft Technology Licensing, Llc Multi-microphone speech separation

Also Published As

Publication number Publication date
US20200411031A1 (en) 2020-12-31
JPWO2019163487A1 (ja) 2020-12-03
US11423924B2 (en) 2022-08-23
WO2019163487A1 (ja) 2019-08-29

Similar Documents

Publication Publication Date Title
JP6845373B2 (ja) 信号分析装置、信号分析方法及び信号分析プログラム
US6622117B2 (en) EM algorithm for convolutive independent component analysis (CICA)
Sprekeler et al. An extension of slow feature analysis for nonlinear blind source separation
Wiesel et al. Time varying autoregressive moving average models for covariance estimation
Hong et al. Optimally weighted PCA for high-dimensional heteroscedastic data
Al-Tmeme et al. Underdetermined convolutive source separation using GEM-MU with variational approximated optimum model order NMF2D
Yoshii et al. Independent low-rank tensor analysis for audio source separation
JP2018141922A (ja) ステアリングベクトル推定装置、ステアリングベクトル推定方法およびステアリングベクトル推定プログラム
Chen et al. Randomly pivoted Cholesky: Practical approximation of a kernel matrix with few entry evaluations
Ito et al. FastFCA-AS: Joint diagonalization based acceleration of full-rank spatial covariance analysis for separating any number of sources
Arjomandi-Lari et al. Generalized YAST algorithm for signal subspace tracking
Mollenhauer et al. Kernel autocovariance operators of stationary processes: Estimation and convergence
Choiruddin et al. Adaptive lasso and Dantzig selector for spatial point processes intensity estimation
Hong et al. Optimally weighted pca for high-dimensional heteroscedastic data
KR102590887B1 (ko) 음원의 공간적 위치 및 비음수 행렬 분해를 이용한 음원 분리 방법 및 장치
Das et al. ICA methods for blind source separation of instantaneous mixtures: A case study
Parathai et al. Single-channel signal separation using spectral basis correlation with sparse nonnegative tensor factorization
Nadakuditi et al. Free component analysis: Theory, algorithms and applications
Lu et al. An Improved Underdetermined Blind Source Separation Method for Insufficiently Sparse Sources
Bonenberger et al. κ-circulant maximum variance bases
JP7243840B2 (ja) 推定装置、推定方法及び推定プログラム
US20240144952A1 (en) Sound source separation apparatus, sound source separation method, and program
Igual et al. Independent component analysis with prior information about the mixing matrix
Li et al. Dictionary learning with the ℓ _ 1/2 ℓ 1/2-regularizer and the coherence penalty and its convergence analysis
EP3281194B1 (en) Method for performing audio restauration, and apparatus for performing audio restauration

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200403

A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A801

Effective date: 20200403

A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20200403

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210225

R150 Certificate of patent or registration of utility model

Ref document number: 6845373

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150