JP6343591B2 - 部分行列領域抽出装置、方法、及びプログラム - Google Patents

部分行列領域抽出装置、方法、及びプログラム Download PDF

Info

Publication number
JP6343591B2
JP6343591B2 JP2015124687A JP2015124687A JP6343591B2 JP 6343591 B2 JP6343591 B2 JP 6343591B2 JP 2015124687 A JP2015124687 A JP 2015124687A JP 2015124687 A JP2015124687 A JP 2015124687A JP 6343591 B2 JP6343591 B2 JP 6343591B2
Authority
JP
Japan
Prior art keywords
submatrix
region
matrix
domain
allocation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015124687A
Other languages
English (en)
Other versions
JP2017010250A (ja
Inventor
勝彦 石黒
勝彦 石黒
允裕 中野
允裕 中野
上田 修功
修功 上田
昭悟 木村
昭悟 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015124687A priority Critical patent/JP6343591B2/ja
Publication of JP2017010250A publication Critical patent/JP2017010250A/ja
Application granted granted Critical
Publication of JP6343591B2 publication Critical patent/JP6343591B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、部分行列領域抽出装置、方法、及びプログラムに係り、特に、特徴となる部分行列を抽出するための部分行列領域抽出装置、方法、及びプログラムに関する。
実務で扱われる多くのデータは2次元のテーブルで表現可能である。これらの2次元のテーブルデータは直ちに行列形式で表現可能である。そのため、行列データに対する統計的機械学習手法が数多く提案されている。ここでは、特に、行列データ全体の中から、一部の特異な特徴をもつ部分だけを抽出する、部分行列抽出という解析タスクを対象とする。
部分行列とは、与えられた行列データの行と列との部分集合の直積、つまり行列の中の小さな矩形領域(インデックスのパーミュテーションを含めれば)の事である。部分行列抽出手法は、データ全体をパターンに分類するのではなく、特異な観測値をもつ部分行列を少数抽出することが目的である。部分行列抽出は、潜在的に興味深いと思われる観測値領域のみを、しかも認知しやすい矩形として抽出してくれるため、データの中の特異的なパターンのみを抽出するというタスクにはより好都合であり、Plaid法(非特許文献1参照)をはじめとして、いくつもの手法が考案されてきた(非特許文献2、及び非特許文献3参照)。図7に従来の抽出法の例を示す。
Lazzeroni and Owen, "Plaid Models for Gene Expression Data", Statistica Sinica, vol. 12, pp. 61-86, 2002. Caldas and Kaski, "Bayesian Biclustering with the Plaid Model", in Proceedings of the IEEE International Workshop on Machine Learning and Signal Processing (MLSP), 2008. Shabalin et al., "Finding Large Average Submatrices in High Dimensional Data", The Annals of Applied Statistics, Vol. 3, issu 3, pp. 995-1012, 2009.
しかし、非特許文献1、及び非特許文献2に代表される手法は次の欠点をもつ。それは、行列データ内に存在するであろう「特異な部分行列領域」の数を、解析に先だって決定しなければならない点である。与えられた行列データの性質が分からないために部分行列領域抽出法を適用して解析する、というのが本来の目的であるにも関わらず、解析に先だって部分行列領域の数を指定しなければならない、という矛盾する問題をもっている。また、非特許文献3では、部分行列領域の数自体は指定しなくても良いが、部分行列とみなすための閾値パラメータを事前に設定しなければならない点で同様の問題を抱えている。
また、部分行列領域の数は領域抽出タスクの精度に大きな影響を及ぼす。また、最適な部分行列領域の数を事後的に評価することも一般には困難であるため、この問題は取り扱われてこなかった。
本発明は、上記問題点を解決するために成されたものであり、最適な数の部分行列領域を抽出することができる部分行列領域抽出装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、第1の発明に係る部分行列領域抽出装置は、第1ドメインの各オブジェクトと第2ドメインの各オブジェクトとのペアの関係についての観測値の各々からなる観測行列から、特徴を持った部分行列領域を抽出する部分行列領域抽出装置であって、前記部分行列領域の数と、前記第1ドメインの各オブジェクト及び第2ドメインの各オブジェクトに対して前記部分行列領域の数だけ存在する前記部分行列領域毎に割り当てられるか否かを表す部分行列領域割当推定値とを初期化する初期化部と、前記第1ドメインの各オブジェクト及び第2ドメインの各オブジェクトに対し、前記部分行列領域の数だけ存在する前記部分行列領域毎に、前記観測行列、前記部分行列領域割当推定値、及び各オブジェクトに対する前記部分行列領域の割り当てに関する部分行列領域ハイパーパラメータに基づいて、前記オブジェクトが、前記部分行列領域に所属すべきか否かを推定して、前記部分行列領域に所属すべきであると推定された場合には前記オブジェクトに対して前記部分行列領域を割り当てると共に、前記観測行列及び前記部分行列領域割当推定値に基づいて、前記オブジェクトを表現するために新たな前記部分行列領域を生成するべきか否かを推定し、新たな前記部分行列領域を生成するべきであると推定された場合には新たな前記部分行列領域を生成し、前記オブジェクトに、生成された新たな前記部分行列領域を割り当てて、前記部分行列領域の数を更新し、割り当てられた前記第1ドメインのオブジェクト数又は前記第2ドメインのオブジェクト数が所定値以下となる前記部分行列領域を削除し、前記部分行列領域の数を更新する部分行列領域割当推定部と、前記部分行列領域割当推定部による推定及び割り当てを予め定めた繰り返し終了条件を満たすまで繰り返す繰り返し判定部と、を含んで構成されている。
また、第1の発明に係る部分行列領域抽出装置において、前記部分行列領域割当推定部は、前記第1ドメインの各オブジェクト及び第2ドメインの各オブジェクトに対し、前記部分行列領域の数だけ存在する前記部分行列領域毎に、前記部分行列領域割当推定値に基づいて推定される、前記オブジェクトが前記部分行列領域に割り当てられる度合い、又は割り当てられない度合いを表す事前適合度と、前記観測行列、前記部分行列領域割当推定値、及び前記部分行列領域ハイパーパラメータに基づいて推定される、前記オブジェクトが前記部分行列領域に割り当てられる尤もらしさ、又は割り当てられない尤もらしさを表すデータ適合度とに基づいて、前記オブジェクトが前記部分行列領域に所属する可能性又は所属しない可能性を算出することにより、前記オブジェクトが、前記部分行列領域に所属すべきか否かを推定してもよい。
また、第1の発明に係る部分行列領域抽出装置において、前記部分行列領域割当推定部は、前記第1ドメインの各オブジェクトに対し、前記部分行列領域割当推定値に基づいて推定される、必要とされる部分行列領域の数に関する事前適合度と、新たに生成される部分行列領域に、前記第2ドメインのオブジェクトが割り当てられる度合いを表す事前適合度と、前記新たな部分行列領域内の観測値についての観測パラメータに関する事前適合度と、前記部分行列領域の数を増やしたことで前記観測行列をよく説明できるようになった度合いを表すデータ適合度とに基づいて、前記新たな部分行列領域を加えた前記部分行列領域の数である可能性を算出することにより、前記オブジェクトを表現するために新たな前記部分行列領域を生成するべきか否かを推定し、前記第2ドメインの各オブジェクトに対し、前記部分行列領域割当推定値に基づいて推定される、必要とされる部分行列領域の数に関する事前適合度と、新たに生成される部分行列領域に、前記第1ドメインのオブジェクトが割り当てられる度合いを表す事前適合度と、前記新たな部分行列領域内の観測値についての観測パラメータに関する事前適合度と、前記部分行列領域の数を増やしたことで前記観測行列をよく説明できるようになった度合いを表すデータ適合度とに基づいて、前記新たな部分行列領域を加えた前記部分行列領域の数である可能性を算出することにより、前記オブジェクトを表現するために新たな前記部分行列領域を生成するべきか否かを推定してもよい。
また、第1の発明に係る部分行列領域抽出装置において、前記部分行列領域割当推定値に基づいて、前記部分行列領域ハイパーパラメータを推定する部分行列領域ハイパーパラメータ推定部を更に含み、前記初期化部は、更に前記部分行列領域ハイパーパラメータを初期化し、前記繰り返し判定部は、前記部分行列領域割当推定部による推定及び割り当て、並びに前記部分行列領域ハイパーパラメータ推定部による推定を予め定めた繰り返し終了条件を満たすまで繰り返してもよい。
第2の発明に係るプログラムは、コンピュータを、上記第1の発明に係る部分行列領域抽出装置の各部として機能させるためのプログラムである。
本発明の部分行列領域抽出装置、方法、及びプログラムによれば、第1ドメインの各オブジェクト及び第2ドメインの各オブジェクトに対し、部分行列領域毎に、観測行列、部分行列領域割当推定値、及び部分行列領域ハイパーパラメータに基づいて、オブジェクトが、部分行列領域に所属すべきか否かを推定して、部分行列領域に所属すべきであると推定された場合にはオブジェクトに対して部分行列領域を割り当てると共に、観測行列及び部分行列領域割当推定値に基づいて、オブジェクトを表現するために新たな部分行列領域を生成するべきか否かを推定し、新たな部分行列領域を生成するべきであると推定された場合には新たな部分行列領域を生成し、オブジェクトに、生成された新たな部分行列領域を割り当てて、部分行列領域の数を更新し、割り当てられた第1ドメインのオブジェクト数又は第2ドメインのオブジェクト数が所定値以下となる部分行列領域を削除し、推定及び割り当てを予め定めた繰り返し終了条件を満たすまで繰り返すことにより、最適な数の特徴となる部分行列領域を抽出することができる、という効果が得られる。
最適な部分行列領域の数を自動的に最適化する例を説明した抽象図である。 本発明の実施の形態に係る部分行列領域抽出装置の構成を示すブロック図である。 本発明の実施の形態に係る部分行列領域抽出装置における部分行列領域抽出処理ルーチンを示すフローチャートである。 本発明の実施の形態に係る部分行列領域抽出装置における推定割当処理ルーチンを示すフローチャートである。 本発明の実施の形態に係る部分行列領域抽出装置における推定割当処理ルーチンを示すフローチャートである。 実際に抽出したものを可視化した例を示す図である。 従来の抽出法の例を示す抽象図である。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
<本発明の実施の形態に係る概要>
まず、本発明の実施の形態における概要を説明する。本発明の実施の形態の部分行列領域抽出装置は、第1ドメインの各オブジェクトと第2ドメインの各オブジェクトとのペアの関係についての観測値の各々からなる観測行列から、特徴を持った部分行列領域を抽出する。本実施の形態の部分行列領域抽出装置は、抽出すべき部分行列領域数を自動的に最適化可能な部分行列領域自動抽出法を用いることにより、上記の課題を解決する。本実施の形態で提案する手法は、図1に示すように、与えられた行列データの性質を捉える上で最適な部分行列領域の数を自動的に最適化する。そのため、部分行列領域の数の事前設定にまつわる精度劣化や部分行列領域の数の選定基準などの問題を回避することが可能となる。
本実施の形態では、アルゴリズムは確率的生成モデルで完全に記述されるものとする。この利点を生かして、その他の事前設定パラメータ(観測パラメータ推定値、観測ハイパーパラメータ推定値など)に関してもデータに自動的にフィットさせる最適化も実現している。したがって、未知のデータに対してもパラメータの探索等の労力を省いて、ほぼ全自動的に高精度な部分行列領域抽出を実施できるようになる。また、本実施の形態で利用するアルゴリズムは様々な形式の行列データ、例えば連続数値量、離散数値量、シンボル量など任意の行列データに対して適用可能であり、適用するデータ形式によって各部の具体的な構成は変化しうる。特に、観測パラメータ推定値、及び観測ハイパーパラメータ推定値、並びにこれらの推定値を推定するための観測パラメータ推定部、及び観測ハイパーパラメータ推定部は各構成に応じて大きく実装が変化する。したがって、これらの部分の構成は本発明の必須要素ではないものとする。これら推定値及び各部の構成法や実際の計算アルゴリズム等については上記非特許文献1、2、及び非特許文献4等を参照することができる。
[非特許文献4]: ビショップ, ”パターン認識と機械学習”, シュプリンガージャパン、2007.
<本発明の実施の形態に係る部分行列領域抽出装置の構成>
次に、本発明の実施の形態に係る部分行列領域抽出装置の構成について説明する。図2に示すように、本発明の実施の形態に係る部分行列領域抽出装置100は、CPUと、RAMと、後述する部分行列領域抽出処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この部分行列領域抽出装置100は、機能的には図2に示すように入力部10と、演算部20と、出力部50とを備えている。
入力部10は、観測行列Xを受け付ける。観測行列Xは、通常N1×N2の行及び列要素からなる行列で、一般に実数値を仮定する。行方向を第1ドメインと呼び、i=1,…,N1と行方向にインデックスする。列方向を第2ドメインと呼び、j=1,…,N2と列方向にインデックスする。なお、入力データ記憶部28に格納されるデータの構成はユーザの目的やタスクに依存する。そのため、最低限上記のデータを備えるものとするが、これに限定されるものではなく、目的やタスクに応じて多様なデータが格納できるものとする。
演算部20は、初期化部26と、入力データ記憶部28と、変数推定部30と、変数記憶部42とを含んで構成されている。
初期化部26は、部分行列領域の数と、第1ドメインの各オブジェクト及び第2ドメインの各オブジェクトに対して部分行列領域の数だけ存在する部分行列領域毎に割り当てられるかを表す部分行列領域割当推定値Zと、部分行列領域ハイパーパラメータαと、観測ハイパーパラメータβとを初期化し、それぞれ部分行列領域数推定値の初期値K(0)、部分行列領域割当推定値の初期値Z(0)、部分行列領域ハイパーパラメータの初期値α(0)、及び観測ハイパーパラメータの初期値β(0)として入力データ記憶部28に格納する。部分行列領域数の初期値K(0)は、初期化の際に仮定する部分行列領域の数である。部分行列領域数Kは、後述する部分行列領域割当推定部32の推定により最適化される。
ここで、部分行列領域割当推定値Zについて詳細に説明する。本実施の形態では、行列の行および列のインデックスがそれぞれオブジェクトを表現する。例えば解析したい観測行列Xについて、行方向において顧客IDを表し、列方向において商品の購買個数データを表す場合を考える。このとき、各行(第1ドメイン)のインデックスiは個々の顧客を、各列(第2ドメイン)のインデックスjは個々の商品に相当する。各部分行列は顧客の部分集合と商品の部分集合を表し、例えば「特定の商品群」を好んで購入する「特定の顧客群」のように行オブジェクトと列オブジェクトの同時クラスタリングを実現する。部分行列はkでインデックスされ、kの総数を部分行列領域の数の推定値Kで表現する。このクラスタリング結果を表すのが部分行列割当推定値Zである。部分行列割当推定値Zは、N1個の第1ドメインのオブジェクトに関する推定値Z1と、N2個の第2ドメインのオブジェクトに関する推定値Z2とからなる。
Z1は、
Z1={Z(1,1),…,Z(1,N1)}
と表され、Z2は、
Z2={Z(2,1),…,Z(2,N2)}
と表される。各推定値Z(1,i)、及びZ(2,j)は、K個の部分行列領域に対して、そのk番目の部分行列領域に含まれるか否かを表現するバイナリ変数、あるいは0から1の間の実数をもつ。すなわち、
Z(1,i)={Z(1,i,1),Z(1,i,2),…,Z(1,i,k),…,Z(1,i,K)}、
Z(2,j)={Z(2,j,1),Z(2,j,2),…,Z(2,j,k),…,Z(2,j,K)}、
であり、Z(1,i,k)=1ならば第1ドメインのi番目のオブジェクトは第k番目の部分行列領域に所属する、Z(1,i,k)=0ならば所属しない、と表現する。実数値を利用する場合には、その中間として所属の度合いも表現する。Z(2,j,k)についても同様である。なお、本実施の形態では、部分行列割当推定値Zに対して何らかの数学的なモデルを仮定することが必要となる。
次に、初期化部26で初期化されるハイパーパラメータについて説明する。部分行列領域ハイパーパラメータの初期値α(0)は、部分行列領域を推定するために利用する数学モデルのパラメータの初期値である。本実施の形態で採用するモデルのパラメータ集合を部分行列領域ハイパーパラメータαとする。モデルは、観測行列Xが与えられた際に、ZおよびKを推定することを主目的とするものである。観測ハイパーパラメータの初期値β(0)は、部分行列領域の観測値の特徴を表現する数学モデルに関するパラメータの初期値である。観測ハイパーパラメータβの表現は目的やデータの性質によって変化する。
入力データ記憶部28には、初期化部26により初期化された部分行列領域の数の初期値K(0)と、部分行列領域ハイパーパラメータの初期値α(0)とが格納される。また、入力データ記憶部28には、入力部10より受け付けた観測行列X、及び終了条件定数が格納される。終了条件定数は、後述する繰り返し判定部40の終了条件判定に用いる定数である。通常、繰り返し計算によって推定計算が実施されるため、終了条件定数には、最大繰り返し回数あるいは評価値の変動幅に対する閾値などを設定する。
変数記憶部42には、後述する変数推定部30で推定された部分行列領域の数K、部分行列割当推定値Z、観測パラメータ推定値θ、及び観測ハイパーパラメータ推定値βが格納される。
変数推定部30は、部分行列領域割当推定部32と、部分行列領域ハイパーパラメータ推定部34と、観測パラメータ推定部36と、観測ハイパーパラメータ推定部38と、繰り返し判定部40とを含んで構成されている。
部分行列領域割当推定部32は、以下に説明する第1〜第3の処理を行う。第1の処理では、既存の部分行列領域割当では既存K個の部分行列それぞれについて、注目しているオブジェクトを所属させるか否かを推定するのみであり、既存の手法といえる。一方、第2の処理では、「新しい部分行列領域を生成するか否か」すなわち部分行列の数を増加させる処理を行う。また第3の処理では、「使用されていない部分行列領域を消去する」すなわち部分行列の数を減少させる処理が組み込まれている。この第2及び第3の処理を適切に実装することによって、行列データに合わせて最適な部分行列領域の数Kを自動的に決定することが可能となる点が、本実施の形態における最大の特徴といえる。
部分行列領域割当推定部32は、第1の処理において、第1ドメインの各オブジェクト及び第2ドメインの各オブジェクトに対し、部分行列領域の数だけ存在する前記部分行列領域毎に、入力データ記憶部28又は変数記憶部42に記憶されている、部分行列領域割当推定値Zに基づいて推定される、当該オブジェクトが当該部分行列領域に割り当てられる度合いを表す事前適合度と、入力データ記憶部28に記憶されている観測行列X、入力データ記憶部28又は変数記憶部42に記憶されている、部分行列領域割当推定値Z、及び部分行列領域ハイパーパラメータαに基づいて推定される、当該オブジェクトが当該部分行列領域に割り当てられる尤もらしさを表すデータ適合度とに基づいて、当該オブジェクトが当該部分行列領域に所属する可能性を算出することにより、当該オブジェクトが、当該部分行列領域に所属すべきか否かを推定する。そして、当該部分行列領域に所属すべきであると推定された場合には当該オブジェクトに対して当該部分行列領域を割り当てるように更新した部分行列割当推定値Zを変数記憶部42に記憶する。
部分行列領域割当推定部32の第1の処理の詳細について以下に説明する。第1の処理では、第1ドメインおよび第2ドメインのすべてのオブジェクトについて部分行列領域の割当の再計算を行う。この再計算の際、オブジェクトの更新順は任意である。説明の便宜のため、現在、第1ドメインのオブジェクトiを選んで推定し、割り当てによる部分行列領域割当推定値Zの更新を行うものとする。
第1の処理において、あるオブジェクトが部分行列領域kに所属しやすいか否かは一般に「他のオブジェクトの所属状況、つまり部分行列領域割当推定値Zから推定される当該オブジェクトが当該部分行列領域に割り当てられる度合い、又は割り当てられない度合い(所属度)」と「部分行列領域kに所属するあるいは所属しないと決めたときに、観測行列Xをどれだけよく説明できるか」の2つの要素により決定される。前者を事前適合度、後者をデータ適合度と呼ぶと、あるオブジェクトが部分行列領域kに所属する可能性は、例えば、以下の(1)式又は(2)式のように計算が可能である。また、同様に、所属しない可能性も計算可能である。
(部分行列領域kに所属する可能性)
=(事前適合度)×(所属すると決めた場合のデータ適合度) ・・・(1)
あるいは
(部分行列領域kに所属する可能性)
=(事前適合度)+(所属すると決めた場合のデータ適合度) ・・・(2)
部分行列領域割当推定部32の第1の処理では、上記の(1)式(又は(2)式)に基づいて、部分行列領域割当推定値Zにおけるオブジェクトiの部分行列領域kへの割当Z(1,i,k)を再計算して更新する。計算方法は、Z(1,i,k)を0又は1の二値として、所属する可能性と所属しない可能性の大きい方へ割り当てる方法、(Z(1,i,k)を0〜1の実数として、所属する可能性と所属しない可能性で按分する方法、Z(1,i,k)を0又は1の二値として、按分結果に基づいて確率的に選択する方法などの方法が考えられる。なお、事前適合度およびデータ適合度の計算方法は任意である。第1の処理において統計的に最適であるとされる実装は、掛け算に基づく可能性計算式をベイズ推定に基づいて定式化する方法である。ベイズ推定に基づく定式化の場合の具体例については実施例において紹介する。なお、特に指針がない場合にはいずれかあるいは両方を定数としてもよい。ただし、数学的に適切な方法で計算していない場合には第2の処理における部分行列領域の数の更新と適合せず、計算が破たんする可能性があるためする計算方法は整合する必要がある。
部分行列領域割当推定部32は、第2の処理において、第1ドメインの各オブジェクトに対し、部分行列領域割当推定値Zに基づいて推定される、必要とされる部分行列領域の数Kに関する事前適合度と、新たに生成される部分行列領域に、第2ドメインのオブジェクトが割り当てられる度合いを表す事前適合度と、新たな部分行列領域内の観測値についての観測パラメータθに関する事前適合度と、部分行列領域の数を増やしたことで観測行列Xをよく説明できるようになった度合いを表すデータ適合度とに基づいて、新たな部分行列領域を加えた部分行列領域の数K+Lである可能性を算出することにより、オブジェクトを表現するために新たな部分行列領域を生成するべきか否かを推定する。また、第2ドメインについても第1ドメインと同様に、各オブジェクトに対し、部分行列領域割当推定値Zに基づいて推定される、必要とされる部分行列領域の数Kに関する事前適合度と、新たに生成される部分行列領域に、第1ドメインのオブジェクトが割り当てられる度合いを表す事前適合度と、新たな部分行列領域内の観測値についての観測パラメータθに関する事前適合度と、部分行列領域の数を増やしたことで観測行列Xをよく説明できるようになった度合いを表すデータ適合度とに基づいて、部分行列領域の数が、新たな部分行列領域を加えたK+Lである可能性を算出することにより、オブジェクトを表現するために新たな部分行列領域を生成するべきか否かを推定する。
部分行列領域割当推定部32の第2の処理では、以下に説明するように、第1の処理において、第1ドメイン又は第2ドメインのあるオブジェクトについてのK個の部分行列領域への所属割当の推定が終了した後に、当該オブジェクトについて、新しい部分行列領域が必要かどうかを計算する。これは、初期化などで適当に部分行列領域の数Kを与えた場合、部分行列領域の数Kが与えられた観測行列Xに潜在する部分行列領域の数としては不足している可能性があるからである。計算方法は第1の処理の部分行列領域にオブジェクトが所属する可能性を計算した場合とほぼ同様である。
具体的には、部分行列領域割当推定部32の第2の処理において、以下に説明する三つの要素に基づいて、L個の新たな部分行列領域を生成するべきか否かを推定する。第2の処理では、考慮すべき一つ目の要素として、「第1の処理の全オブジェクトの部分行列領域の所属状況、すなわち部分行列領域割当推定値Zに基づいて推定される、必要とされる部分行列領域の数Kに関する事前適合度」を推定する。ここでは部分行列領域の数を0個増やすか、2個増やすかを評価する評価値を推定する。ここで、部分行列領域の数をL個増やすとした場合、今現在の処理において注目しているオブジェクトi又はオブジェクトjは必ずL個の部分行列領域に所属するものとする。
次に、第2の処理では、二つ目の要素として、「新たに生成されるL個の部分行列領域に対し、他方のドメインのオブジェクトの割り当ててられる度合い」を計算する。例えば、第1ドメインのオブジェクトに対して新たに生成されるL個の部分行列領域に対しては、第2ドメインのオブジェクトがL個の部分行列領域に所属しなければならない(第2ドメインのオブジェクトに割り当てないと矩形にならない)。従って、今現在の処理において第1ドメインのオブジェクトiに注目しているとすれば、第2ドメインのN2個のオブジェクトについては何らかの指標(例えばランダム)で新たな部分行列領域に所属すると仮定して度合いに関する事前適合度を計算する。
また、第2の処理では、三つ目の要素として、変数記憶部42に記憶されている観測パラメータθに基づいて、新たに生成されるL個の部分行列領域に対する観測パラメータθを設定し、新たな部分行列領域内の観測値についての観測パラメータβに関する事前適合度を得る。
そして、第2の処理では、以上の三つの要素が定まったときに、「部分行列領域の数をK+Lとしたことで観測行列Xをどれだけよく説明できるか」を計算する。
以上の要素を組み合わせて、以下(3)式に基づいて、部分行列領域の数を増やすか否かを推定する。
(部分行列領域の数がK+Lである可能性)

=(部分行列領域割当推定値Zに基づいて推定される、必要とされる部分行列領域の数Kに関する事前適合度)×(新たに生成されるL個の部分行列領域に、他方のドメインのオブジェクトが割り当てられる度合いを表す事前適合度)×(新たな部分行列領域内の観測値についての観測パラメータβに関する事前適合度)×(部分行列領域の数を増やしたことで観測行列Xをよく説明できるようになった度合いを表すデータ適合度)
・・・(3)
上記(3)式では乗算としているが、加減乗除の使い方等は任意である。また、各適合度の計算はユーザの設計した数学モデルに依存する。なお、Lの個数はランダムに決定する。また、後述する実施例では、確率的な意味で最適な実装例を紹介するが、実装方法は実施例における実装例に限定されるものではなく、多様な数学モデルの設計が可能である。
そして、第2の処理では、L個の部分行列領域を生成するべきであると推定された場合には、L個の部分行列領域を生成し、当該オブジェクトに、生成されたL個の部分行列領域を割り当てるように、変数記憶部42に記憶されている部分行列割当推定値Zを更新する。また、部分行列領域の数KをK=K+Lとして変数記憶部42の部分行列領域の数Kを更新する。
部分行列領域割当推定部32は、第3の処理において、上記第1の処理及び第2の処理によって部分行列領域毎に割り当てられた第1ドメインのオブジェクト数又は第2ドメインのオブジェクト数が所定値以下となる部分行列領域を削除し、部分行列領域の数を更新する。
具体的には、部分行列領域割当推定部32の第3の処理では、以下に説明するように部分行列領域割当推定値Zに不必要な部分行列領域がないかを確認し、更新する。ここで、各部分行列領域の大きさは、「第1ドメインで所属するオブジェクト数」×「第2ドメインで所属するオブジェクト数」で決定される。しかし、抽出したい「部分行列領域」は、第1ドメインと第2ドメインとの部分集合の直積で表現されるため、「どちらかのドメインで所属するオブジェクトが一定値以下である」と推定される部分行列領域は、不必要な部分行列領域として削除する。例えば、k番目の部分行列領域に所属する第1ドメインの総オブジェクト数はZ(1,i,k)を全てのiについて和をとれば計算できる。この総オブジェクト数が一定値以下の部分行列領域を削除する。そして、一つの部分行列領域の削除に伴って、部分行列領域の数KをK=K−1と減少させる。また、必要な場合には部分行列領域割当推定値Zおよび観測パラメータθ、観測ハイパーパラメータβなどの部分行列領域のインデックスkを適切に指定しなおす。なお、第3の処理の削除手続きは、本実施の形態では第2の処理の後に実行するが、これに限定されるものではなく、例えば第1の処理又は第2の処理の各オブジェクトの推定が終わる度、あるいは全オブジェクトの推定が終わる度など、任意のタイミングで実行できる。
部分行列領域ハイパーパラメータ推定部34は、変数記憶部42に記憶されている部分行列領域割当推定値Zに基づいて、部分行列領域の数および部分行列領域の割り当てに関する数学モデルに必要な部分行列領域ハイパーパラメータαを推定し、変数記憶部42に記憶する。
観測パラメータ推定部36は、入力部10において受け付けた観測行列Xと、変数記憶部42に記憶されている部分行列領域割当推定値Zとに基づいて、部分行列領域の観測値の表現に用いる数学モデルの観測パラメータθを推定し、変数記憶部42に記憶する。
観測ハイパーパラメータ推定部38は、観測パラメータ推定部36で推定された観測パラメータθに基づいて、観測パラメータθの数学モデルに必要な観測ハイパーパラメータβを推定し、変数記憶部42に記憶する。
なお、部分行列領域ハイパーパラメータ推定部34、観測パラメータ推定部36、及び観測ハイパーパラメータ推定部38による推定を行わずに初期値のままにしてもよい。
繰り返し判定部40は、部分行列領域割当推定部32による推定及び割り当て、並びに部分行列領域ハイパーパラメータ推定部34、観測パラメータ推定部36、及び観測ハイパーパラメータ推定部38による推定を予め定めた繰り返し終了条件を満たすまで繰り返す。ここで繰り返し終了条件には、入力データ記憶部28に記憶されている終了条件定数を用いればよい。
なお、変数推定部30の各部の構成は上記に限定されるものではなく、ユーザが想定する観測モデルなどによって依存するため、一概に記述することはできない。後述する実施例では、具体的に設計したモデルに合わせた実装例を紹介する。
<本発明の実施の形態に係る部分行列領域抽出装置の作用>
次に、本発明の実施の形態に係る部分行列領域抽出装置100の作用について説明する。入力部10において観測行列Xを受け付けると、観測行列Xを入力データ記憶部28に格納するとともに、部分行列領域抽出装置100は、図3に示す部分行列領域抽出処理ルーチンを実行する。
まず、ステップS100では、部分行列領域の数と、第1ドメインの各オブジェクト及び第2ドメインの各オブジェクトに対して部分行列領域毎に割り当てられるかを表す部分行列領域割当推定値と、部分行列領域ハイパーパラメータと、観測ハイパーパラメータとを初期化し、入力データ記憶部28に格納する。
次に、ステップS102では、上記部分行列領域割当推定部32の第1〜第3の処理によって、部分行列割当推定値Z及び部分行列領域の数Kを推定する。
ステップS104では、ステップS102で推定された部分行列割当推定値Zに基づいて、部分行列領域ハイパーパラメータαを推定する。
ステップS106では、入力部10において受け付けた観測行列Xと、ステップS102で推定された部分行列割当推定値Zとに基づいて、観測パラメータθを推定する。
ステップS108では、ステップS106で推定された観測パラメータθに基づいて、観測ハイパーパラメータβを推定する。
ステップS110では、予め定めた繰り返し終了条件を満たすかを判定し、満たしていなければステップS102へ移行してステップS102〜ステップS108の処理を繰り返し、満たしていればステップS108へ移行する。
ステップS112では、ステップS102で推定された部分行列割当推定値Z及び部分行列領域の数Kを出力部50により出力し処理を終了する。
上記ステップS102の処理は、図4及び図5に示す推定割当処理ルーチンにより実現される。
ステップS200では、第1ドメインのオブジェクトiを、i=1と初期化する。
ステップS204では、部分行列領域kを選択する。
ステップS206では、第1ドメインのオブジェクトiに対し、ステップS204で選択した部分行列領域について、上記(1)式に従って、当該オブジェクトiが当該部分行列領域kに割り当てられる度合いを表す事前適合度と、当該オブジェクトiが当該部分行列領域kに割り当てられる尤もらしさを表すデータ適合度とに基づいて、当該オブジェクトiが当該部分行列領域kに所属する可能性を算出する。
ステップS208では、ステップS206の算出結果に基づいて、当該部分行列領域kに所属すべきである否かを判定し、判定結果に応じて更新した部分行列割当推定値Zを変数記憶部42に記憶する。
ステップS210では、当該オブジェクトiに対し、全ての部分行列領域について推定したかを判定し、推定していない部分行列領域が存在する場合には、ステップS204に戻って、当該部分行列領域kを選択し、ステップS206〜S208の処理を繰り返し、全て推定していればステップS212へ移行する。
ステップS212では、上記(3)式に従って、部分行列領域の数がK+Lである可能性を算出する。このとき、Lの値をランダムに決定すればよい。
ステップS214では、ステップS212の算出結果に基づいて、L個の部分行列領域を生成するべきかを判定し、生成すべきでない場合にはステップS218へ移行し、生成すべきであればステップS216へ移行する。
ステップS216では、L個の部分行列領域を生成し、当該オブジェクトiに、生成されたL個の部分行列領域の各々を割り当てて、変数記憶部42に記憶されている部分行列割当推定値Zを更新する。また、変数記憶部42に記憶されている部分行列領域の数Kを更新する。
ステップS218では、第1ドメインの全てのオブジェクトiについて推定及び割り当てをしたかを判定し、していなければステップS220へ移行してi=i+1として、ステップS204〜S216の処理を繰り返し、全て推定していればステップS222へ移行する。
ステップS222では、第2ドメインのオブジェクトjを、j=1と初期化する。
ここで、ステップS224〜S236については、第2ドメインのオブジェクトjについて、上記ステップS204〜S216で説明したオブジェクトiについて行った処理と同様の処理を行えばよいため説明を省略する。
そして、ステップS238では、全てのオブジェクトjについて推定及び割り当てをしたかを判定し、していなければステップS240へ移行してj=j+1として、ステップS224〜S236の処理を繰り返し、全て推定していればステップS240へ移行する。
ステップS242では、部分行列割当推定値Zに基づいて、割り当てられた第1ドメインのオブジェクト数又は第2ドメインのオブジェクト数が所定値以下となる部分行列領域を削除し、変数記憶部42に記憶されている部分行列領域の数を更新し、推定割当処理ルーチンを終了する。
<実施例>
本発明の実施の形態に係る手法の実験結果について説明する。ここでは、実数行列データが与えられた場合に、確率的に最適な実装が可能な数学モデルの設計と具体的な変数や実装する計算式を示す。
本実施例では、Plaidモデル(上記非特許文献1、及び非特許文献2参照)に基づいた確率的なモデルによる例を説明する。Plaidモデルとは、部分行列抽出の既存技術の一つである。Plaidモデルは、連続な実数の観測値を、複数の部分行列領域の平均値パラメータの重ね合わせで表現し、抽出する。本実施例では、上記で説明した実施の形態の構成をこの手法に適用及び拡張することで、必要な部分行列領域の数を自動的に抽出し、各種パラメータも自動的に推定することが可能なPlaidモデルを実現する実験を行った。
以下(4)〜(8)式に示す、Plaidモデルの技術を適用する部分行列領域抽出モデル(拡張Plaid model)の確率的な数式モデルに従って、部分行列領域割当推定値Z、観測パラメータ推定値θ、及び観測行列Xを表現する。
Z(1,i,k)〜BePBerP(α1) ・・・(4)
Z(2,j,k)〜BePBerP(α2) ・・・(5)
θk〜Normal−Wishart(βk) ・・・(6)
θ0〜Normal−Wishart(β0) ・・・(7)
X(i,j)〜Normal(m0+Σ_{k}mk,τ) ・・・(8)
また、上記の変数記憶部42の各要素に対応する観測行列X、部分行列領域ハイパーパラメータα、部分行列領域割当推定値Z、観測パラメータθ、観測ハイパーパラメータβを以下に示す。
X={X(i,j)}
α=(α1,α2)
Z=(Z1,Z2)
Z1={Z(1,i,k)}
Z2={Z(2,j,k)}
θ=(t,θ0,θ1,θ2,...)
θk=(mk,τk)
β=(β0,βk)
上記(4)式〜(8)式の中の確率分布の詳細については上記非特許文献4、及び非特許文献5を参照できる。
[非特許文献5]:Griffiths and Ghahramani, “The Indian Buffet Process: An Introduction and Reivew”, Journal of Machine Learning Research, Vol. 12, pp. 1185-1224, 2011.
上記(4)式〜(8)式の確率モデルに対して、事前適合度、及びデータ適合度の関数を設計することにより本発明の実施の形態における数学モデルの実装が完了する。設計の方法は任意であるが、確率的、統計的に最適な関数の設計方法はベイズ推定(上記非特許文献4参照)である。
部分行列領域割当推定部32における推定処理は、ベイズ推定に従えば、事前適合度は他のパラメータ及び変数が与えられたときの「事前分布」、データ適合度は注目する変数の値を決めた場合の「尤度」として定義され、注目するパラメータの推定は「事後分布の計算」として実装できる。
上記実施の形態における部分行列領域割当推定部32の第1の処理では、以下(9)式に示すに従って、オブジェクトiが、当該部分行列領域kに所属すべきか否かを推定する。
p(Z(1,i,k)|Z1(−ik),Z2,θ)
∝p(X|Z(1,i,k),Z1(−ik),Z2,θ)×p(Z(1,i,k)|Z1(−ik)) ・・・(9)
ここで、Z1(−ik)はZ1の中からZ(1,i,k)の値を取り除いたものである。また、p(X|Z(1,i,k),Z1(−ik),Z2,θ)がデータ適合度であり、p(Z(1,i,k)|Z1(−ik))が事前適合度である。
上記実施の形態における部分行列領域割当推定部32の第2の処理では、以下(10)式に従って、オブジェクトiを表現するために新たなL個の部分行列領域を生成するべきか否かを推定する。
p(L,Z2*,θ*)=min(1.0,p(X|Z1,Z2,Z1*,Z2*,L,θ,θ*)/p(X|Z1,Z2,θ)) ・・・(10)
ここで、Z1*は、L個の新たな部分行列領域に対して割り当てられ、所属する第1ドメインのオブジェクトiの集合であり、Z2*はL個の新たな部分行列領域に対して割り当てられ、所属する第2ドメインのオブジェクトjの集合であり、θ*はL個の新たな部分行列領域に対する観測パラメータである。
次に、上記の部分行列領域ハイパーパラメータ推定部34では、以下(11)式及び(12)式に従って、第1ドメイン及び第2ドメインに対する部分行列領域ハイパーパラメータを推定する。
第1ドメインに対する部分行列領域ハイパーパラメータα1は、以下(11)式に従って推定される。
p(α1|Z1)∝p(α1|Z1)×p(α1) ・・・(11)
第2ドメインに対する部分行列領域ハイパーパラメータα2は、以下(12)式に従って推定される。
p(α2|Z2)∝p(α2|Z2)×p(α2) ・・・(12)
ここで事前分布にはガンマ分布を使用している。
上記(9)式〜(12)式はベイズ推定の1種であるマルコフ連鎖モンテカルロ法を用いた場合の数式となる。各式の具体的な計算方法については、非特許文献4、及び非特許文献5を参照すればよい。
また、観測パラメータ推定部36及び観測ハイパーパラメータ推定部38については、上記(6)式、(7)式に従って、正規ウィシャート分布と正規分布の共役性を利用した事後分布の計算、パラメータの推定を行う(非特許文献4参照)。
以上の数式モデルを構成各部に実装した上で、繰り返し判定部40では、マルコフ連鎖モンテカルロ法の最大繰り返し回数を終了条件定数として利用し、推定の繰り返し回数が定数に達した時点で推定を終了する。
表1に実験結果の例を示す。
実験では、潜在する部分行列領域の数が3あるいは4で設計された人工データを複数準備して、これらの部分行列領域を精度よく抽出できるかどうかを検証した。精度はNormalized Mutual Information(NMI)を用いた(非特許文献6参照)。
表1中の数値は、計算されたNMIである。値は大きいほど良い結果を表す。最大値は1.0であり、このとき完全に部分行列領域を抽出できたことを表す。比較対象は、事前に抽出すべき部分行列領域の数Kを固定して解析する既存手法(非特許文献6)と、この手法を上記実施例の構成で拡張した提案発明手法である。
[非特許文献6]: Lancichinetti, Fortunato, and Kertesz, “Detecting the Overlapping and Hierarchical Community Structure of Complex Networks”, New Journal of Physics, Vol. 11(3), 2009.
両手法とも、Kの初期値K0を、(1)真の部分行列領域の数、(2)K0=10、(3)K0=20と変更して、既存手法はK=K0で固定、提案法はKを自動的に推定させた。表1に示すように、全てのケースで提案法の方が良好な数値を得ている。また、特に人工データ2〜4では提案法の示すNMIはKの数によらず高い値を維持している。これは、提案手法の構成の効果によって、潜在する部分行列領域の数を自動的に推定しながら部分行列領域を抽出することで正しい部分行列領域の数が予めわからなくても精度よく抽出が可能であることを示している。
図6は実際に抽出したものを可視化した例である。提案する手法ではきれいに部分行列領域を抽出できているが、既存手法ではうまくいかない場合の例である。
以上説明したように、本発明の実施の形態に係る部分行列領域抽出装置によれば、第1ドメインの各オブジェクト及び第2ドメインの各オブジェクトに対し、部分行列領域毎に、観測行列X、部分行列領域割当推定値Z、及び部分行列領域ハイパーパラメータαに基づいて、オブジェクトが、部分行列領域に所属すべきか否かを推定して、部分行列領域に所属すべきであると推定された場合にはオブジェクトに対して部分行列領域を割り当てると共に、観測行列X及び部分行列領域割当推定値Zに基づいて、オブジェクトを表現するために新たな部分行列領域を生成するべきか否かを推定し、新たな部分行列領域を生成するべきであると推定された場合には新たな部分行列領域を生成し、オブジェクトに、生成された新たな部分行列領域を割り当てて、部分行列領域の数Kを更新し、割り当てられた第1ドメインのオブジェクト数又は第2ドメインのオブジェクト数が所定値以下となる部分行列領域を削除し、推定及び割り当てを予め定めた繰り返し終了条件を満たすまで繰り返すことにより、最適な数の特徴となる部分行列領域を抽出することができる。
なお、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、上述した実施の形態では、オブジェクトが部分行列領域に割り当てられる度合いを表す事前適合度と、データ適合度とに基づいて、オブジェクトが部分行列領域に所属する可能性を算出する場合を例に説明したが、これに限定されるものではなく、オブジェクトが部分行列領域に割り当てられない度合いを表す事前適合度と、データ適合度とに基づいて、オブジェクトが部分行列領域に所属しない可能性を算出するようにしてもよい。この場合には、オブジェクトが部分行列領域に所属しない可能性に応じて、部分行列領域割当推定値Zを更新すればよい。
10 入力部
20 演算部
26 初期化部
28 入力データ記憶部
30 変数推定部
32 部分行列領域割当推定部
34 部分行列領域ハイパーパラメータ推定部
36 観測パラメータ推定部
38 観測ハイパーパラメータ推定部
40 判定部
42 変数記憶部
50 出力部
100 部分行列領域抽出装置

Claims (5)

  1. 第1ドメインの各オブジェクトと第2ドメインの各オブジェクトとのペアの関係についての観測値の各々からなる観測行列から、特徴を持った部分行列領域を抽出する部分行列領域抽出装置であって、
    前記部分行列領域の数と、前記第1ドメインの各オブジェクト及び第2ドメインの各オブジェクトに対して前記部分行列領域の数だけ存在する前記部分行列領域毎に割り当てられるか否かを表す部分行列領域割当推定値とを初期化する初期化部と、
    前記第1ドメインの各オブジェクト及び第2ドメインの各オブジェクトに対し、前記部分行列領域の数だけ存在する前記部分行列領域毎に、前記観測行列、前記部分行列領域割当推定値、及び各オブジェクトに対する前記部分行列領域の割り当てに関する部分行列領域ハイパーパラメータに基づいて、前記オブジェクトが、前記部分行列領域に所属すべきか否かを推定して、前記部分行列領域に所属すべきであると推定された場合には前記オブジェクトに対して前記部分行列領域を割り当てると共に、前記観測行列及び前記部分行列領域割当推定値に基づいて、前記オブジェクトを表現するために新たな前記部分行列領域を生成するべきか否かを推定し、新たな前記部分行列領域を生成するべきであると推定された場合には新たな前記部分行列領域を生成し、前記オブジェクトに、生成された新たな前記部分行列領域を割り当てて、前記部分行列領域の数を更新し、
    割り当てられた前記第1ドメインのオブジェクト数又は前記第2ドメインのオブジェクト数が所定値以下となる前記部分行列領域を削除し、前記部分行列領域の数を更新する部分行列領域割当推定部と、
    前記部分行列領域割当推定部による推定及び割り当てを予め定めた繰り返し終了条件を満たすまで繰り返す繰り返し判定部と、
    を含む部分行列領域抽出装置。
  2. 前記部分行列領域割当推定部は、前記第1ドメインの各オブジェクト及び第2ドメインの各オブジェクトに対し、前記部分行列領域の数だけ存在する前記部分行列領域毎に、前記部分行列領域割当推定値に基づいて推定される、前記オブジェクトが前記部分行列領域に割り当てられる度合い、又は割り当てられない度合いを表す事前適合度と、前記観測行列、前記部分行列領域割当推定値、及び前記部分行列領域ハイパーパラメータに基づいて推定される、前記オブジェクトが前記部分行列領域に割り当てられる尤もらしさ、又は割り当てられない尤もらしさを表すデータ適合度とに基づいて、前記オブジェクトが前記部分行列領域に所属する可能性又は所属しない可能性を算出することにより、前記オブジェクトが、前記部分行列領域に所属すべきか否かを推定する請求項1に記載の部分行列領域抽出装置。
  3. 前記部分行列領域割当推定部は、前記第1ドメインの各オブジェクトに対し、前記部分行列領域割当推定値に基づいて推定される、必要とされる部分行列領域の数に関する事前適合度と、新たに生成される部分行列領域に、前記第2ドメインのオブジェクトが割り当てられる度合いを表す事前適合度と、前記新たな部分行列領域内の観測値についての観測パラメータに関する事前適合度と、前記部分行列領域の数を増やしたことで前記観測行列をよく説明できるようになった度合いを表すデータ適合度とに基づいて、前記新たな部分行列領域を加えた前記部分行列領域の数である可能性を算出することにより、前記オブジェクトを表現するために新たな前記部分行列領域を生成するべきか否かを推定し、
    前記第2ドメインの各オブジェクトに対し、前記部分行列領域割当推定値に基づいて推定される、必要とされる部分行列領域の数に関する事前適合度と、新たに生成される部分行列領域に、前記第1ドメインのオブジェクトが割り当てられる度合いを表す事前適合度と、前記新たな部分行列領域内の観測値についての観測パラメータに関する事前適合度と、前記部分行列領域の数を増やしたことで前記観測行列をよく説明できるようになった度合いを表すデータ適合度とに基づいて、前記新たな部分行列領域を加えた前記部分行列領域の数である可能性を算出することにより、前記オブジェクトを表現するために新たな前記部分行列領域を生成するべきか否かを推定する請求項2に記載の部分行列領域抽出装置。
  4. 前記部分行列領域割当推定値に基づいて、前記部分行列領域ハイパーパラメータを推定する部分行列領域ハイパーパラメータ推定部を更に含み、
    前記初期化部は、更に前記部分行列領域ハイパーパラメータを初期化し、
    前記繰り返し判定部は、前記部分行列領域割当推定部による推定及び割り当て、並びに前記部分行列領域ハイパーパラメータ推定部による推定を予め定めた繰り返し終了条件を満たすまで繰り返す請求項1〜請求項3に記載の部分行列領域抽出装置。
  5. コンピュータを、請求項1〜請求項4のいずれか1項に記載の部分行列領域抽出装置の各部として機能させるためのプログラム。
JP2015124687A 2015-06-22 2015-06-22 部分行列領域抽出装置、方法、及びプログラム Active JP6343591B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015124687A JP6343591B2 (ja) 2015-06-22 2015-06-22 部分行列領域抽出装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015124687A JP6343591B2 (ja) 2015-06-22 2015-06-22 部分行列領域抽出装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2017010250A JP2017010250A (ja) 2017-01-12
JP6343591B2 true JP6343591B2 (ja) 2018-06-13

Family

ID=57761694

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015124687A Active JP6343591B2 (ja) 2015-06-22 2015-06-22 部分行列領域抽出装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6343591B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3557162B2 (ja) * 2000-09-07 2004-08-25 株式会社東芝 データ抽出方法、データ抽出装置および記録媒体
JP5851205B2 (ja) * 2011-11-01 2016-02-03 日本電信電話株式会社 クラスタリング装置、方法、及びプログラム

Also Published As

Publication number Publication date
JP2017010250A (ja) 2017-01-12

Similar Documents

Publication Publication Date Title
Huh et al. Adaptive data-driven inventory control with censored demand based on Kaplan-Meier estimator
Castle et al. Automatic selection for non-linear models
Graversen et al. Computational aspects of DNA mixture analysis: Exact inference using auxiliary variables in a Bayesian network
Chattopadhyay et al. Fitting truncated geometric distributions in large scale real world networks
CN116304205A (zh) 一种传播网络结构重构方法、装置、设备及存储介质
Ülker B-Spline curve approximation using Pareto envelope-based selection algorithm-PESA
JP6343591B2 (ja) 部分行列領域抽出装置、方法、及びプログラム
KR102352036B1 (ko) 확률적 경사 하강법을 이용한 변수 선택 장치 및 방법
Sevilla et al. Bayesian topology inference on partially known networks from input-output pairs
Martin et al. Using process mining to model interarrival times: investigating the sensitivity of the arpra framework
Wang et al. An estimation of distribution algorithm based on clayton copula and empirical margins
JP6190771B2 (ja) パラメータ推定方法、装置、及びプログラム
JP7014069B2 (ja) データ解析装置、方法、及びプログラム
JP2017151904A (ja) 解析装置、方法、及びプログラム
de Angelis et al. Line sampling for assessing structural reliability with imprecise failure probabilities
van Beek et al. Global emulation through normative decision making and thrifty adaptive batch sampling
JP6745507B2 (ja) パラメータ推定装置、方法、及びプログラム
Zvyagin Iterative and non-iterative methods of Monte Carlo as actual computing methods Bayesian analysis
Roughan et al. Estimating the parameters of the Waxman random graph
JP6517731B2 (ja) 確率密度関数推定装置、連続値予測装置、方法、及びプログラム
JP6558860B2 (ja) 推定装置、予測装置、方法、及びプログラム
Bartlett et al. Estimation for non‐negative time series with heavy‐tail innovations
Iwasaki et al. Comparing graph sampling methods based on the number of queries
CN112086135B (zh) 状态分析方法、装置和设备
JP7036344B2 (ja) 通信品質劣化推定装置、通信品質劣化推定方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170621

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180515

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180521

R150 Certificate of patent or registration of utility model

Ref document number: 6343591

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150