JP6136567B2 - プログラム、情報処理装置、及び情報処理方法 - Google Patents

プログラム、情報処理装置、及び情報処理方法 Download PDF

Info

Publication number
JP6136567B2
JP6136567B2 JP2013109314A JP2013109314A JP6136567B2 JP 6136567 B2 JP6136567 B2 JP 6136567B2 JP 2013109314 A JP2013109314 A JP 2013109314A JP 2013109314 A JP2013109314 A JP 2013109314A JP 6136567 B2 JP6136567 B2 JP 6136567B2
Authority
JP
Japan
Prior art keywords
variables
time
matrix
series data
combination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013109314A
Other languages
English (en)
Other versions
JP2014229142A (ja
Inventor
宏 山川
宏 山川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013109314A priority Critical patent/JP6136567B2/ja
Publication of JP2014229142A publication Critical patent/JP2014229142A/ja
Application granted granted Critical
Publication of JP6136567B2 publication Critical patent/JP6136567B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、プログラム、情報処理装置及び情報処理方法に関する。
従来、データクラスタ化のための距離計算の回数を減らす技術等が提案されている(例えば、特許文献1参照)。
特開平11−219374号公報
しかしながら、従来の技術では、データ間で等価性のある構造を適切に抽出できないという問題があった。
一つの側面では、本発明はデータ間で等価性のある構造を適切に抽出することが可能なプログラム等を提供することを目的とする。
一つの態様では、コンピュータに、複数の変数に対する2値の時系列データから、複数の時間帯及び複数の変数の組み合わせについて、部分的な時系列データを抽出し、抽出した部分的な時系列データに基づき2値の高階テンソルを生成し、生成した高階テンソルに基づき、複数の時間帯及び複数の変数の組み合わせについての第1行列を生成し、相互情報量ベクトルを前記第1行列に乗じて第2行列を生成する処理を実行させる。
一つの側面では、データ間で等価性のある構造を適切に抽出することが可能となる。
情報処理装置のハードウェア群を示すブロック図である。 時系列データを示す説明図である。 部分的な時系列データ及び第1行列を示す説明図である。 分布等価性群の生成手順を示す説明図である。 3階テンソルを示す説明図である。 DEGs状態の一覧を示す説明図である。 修正後DEGs度数行列を示す説明図である。 ヒートマップ及びデンドログラムを示す説明図である。 等価性構造抽出処理の全体的な流れを示すフローチャートである。 DEGs度数行列Fを生成する際の手順を示すフローチャートである。 インデックスの算出手順を示すフローチャートである。 相互情報量の算出手順を示すフローチャートである。 修正DEGs度数行列Gの算出手順を示すフローチャートである。 等価性構造の出力処理手順を示すフローチャートである。 上述した形態のコンピュータの動作を示す機能ブロック図である。 実施の形態2に係るコンピュータのハードウェア群を示すブロック図である。
実施の形態1
以下実施の形態を、図面を参照して説明する。図1は情報処理装置1のハードウェア群を示すブロック図である。情報処理装置1は例えばサーバコンピュータ、パーソナルコンピュータ、携帯電話機、PDA(Personal Digital Assistant)等である。以下ではパーソナルコンピュータ1を用いた例を挙げて説明し、またパーソナルコンピュータ1をコンピュータ1と略して説明する。コンピュータ1は制御部としてのCPU(Central Processing Unit)11、RAM(Random Access Memory)12、入力部13、表示部14、記憶部15、及び通信部16等を含む。CPU11は、バス17を介してハードウェア各部と接続されている。CPU11は記憶部15に記憶された制御プログラム15Pに従いハードウェア各部を制御する。RAM12は例えばSRAM(Static RAM)、DRAM(Dynamic RAM)、フラッシュメモリ等である。RAM12は、記憶部としても機能し、CPU11による各種プログラムの実行時に発生する種々のデータを一時的に記憶する。
入力部13はマウスまたはキーボード、マウスまたはタッチパネル等の入力デバイスであり、受け付けた操作情報をCPU11へ出力する。表示部14は液晶ディスプレイまたは有機EL(electroluminescence)ディスプレイ等であり、CPU11の指示に従い各種情報を表示する。通信部16は通信モジュールであり、通信網Nを介して他のコンピュータ(図示せず)との間で情報の送受信を行う。CPU11は、図示しないカメラ、マイクまたは各種センサ等から、画像データ、音声データまたはセンサデータ等を2値化した時系列データを取り込み、記憶部15に記憶する。CPU11は、時系列データに対し、以下の処理を行う。
図2は時系列データを示す説明図である。図2横軸の系列は時刻であり、縦軸の系列は変数である。各変数は、{A(t),B(t), …, H(t)}とする時系列データを有する。本実施形態ではA〜Hまで8つの変数を有する例を挙げて説明する。なお、変数は2以上の複数であれば良い。枠内に記載した黒色丸印は2値データの1を示し、空欄は2値データの0を示す。図2の例ではt=1の場合、変数Bのみが2値データ1であり、他の変数の2値データは0である。なお、本実施形態では説明を容易にするために2値の例を挙げて説明するが、2以上の多値であれば良い。また本実施形態では複数の変数に対する同期系列として、時系列データを例に挙げるが、これに限るものではない。すなわち、入力の複数の系列変数を同期させる例を物理的な時刻としているが、何らかの同期軸が存在すれば良い。例えば、全ての変数において系列上の位置を共通に表す値(例えばy(1),y(2),y(3)・・・)を用いれば良い。
図3は部分的な時系列データ及び第1行列を示す説明図である。図4は分布等価性群の生成手順を示す説明図である。分布等価性群(以下場合により、DEGsという:Distribution Equivalent Groups)は、二値の多次元同期系列での部分空間において出現するパターンの有無を表す高階二値テンソル表現である。階数は(DEGsのために取り出す)部分空間の次元数であり、2以上の複数階数であれば良い。本実施形態では次元数が3変数{x、x、x}であるので、階数を3であるものとして説明する。CPU11は、複数の変数について、複数の連続する単位時刻の集合である時間帯の2値の時系列データ(以下、局所シークエンス)を抽出する。具体的には、CPU11は、3変数{x、x、x}について,局所時刻(τ)での4時刻分の局所シークエンスから,4つの部分空間パターンb(τ)を取り出す。なお、τ={0,1,2,3}である。なお、2値よりも大きい多値を用いる場合、値数に応じた多値テンソルをDEGsとして用いる。例えば3値の多次元同期系列に対して,5次元の部分空間をDEGsへの入力として用いる場合には〈3,3,3,3,3〉の5階3値テンソルを用いることとなる。
図4Aは局所シークエンスを示す。CPU11は、局所シークエンスから図4Bに示すように部分空間パターンの集合に分解する。b(0)の場合、x=1のため、b(0)=010となる。b(1)の場合、x=1であるため、b(1)=100となる。b(2)の場合、x=1のため、b(2)=010となる。b(3)の場合、x=1のため、b(3)=001となる。3階テンソルの一要素であるDEG状態cbは,8(=23)個のテンソル成分(b=000〜111)において、局所シークエンス内にて、一度以上出現する部分空間パターンbについてはcb=1とし,それ以外はcb=0とする。
図5は3階テンソルを示す説明図である。横方向を変数x1、奥行き方向を変数x2、高さ方向を変数x3とする。図4Cは図5に示す2値の3階テンソル<2,2,2>であるDEGs状態を展開して平面的に表示したものである。ハッチングで示すC010、C100、C001のDEG状態Cb=1となる。それ以外はDEG状態Cb=0となる。
CPU11は、生成した2値の高階テンソル(以下場合によりDEGs状態という)に基づき、変数の組み合わせ(以下場合により部分空間という)を分類するために用いる第1行列を生成する。以下では第1行列をDEGs度数行列Fという。図3にDEGs度数行列Fを示す。DEGs度数行列Fは列値がインデックスvであり、縦方向が変数の組合せuである。本実施形態では変数が8であるため、8P3によりu=336の行が存在する。なお、変数A,B,及びCの組合せを内部空間u=0としている。CPU11は、記憶部15に記憶したDEGs状態に対応するインデックスvの演算式を読み出す。演算式は以下の式(1)により算出できる。
v = c000 + 2 c100 + 22 c010 + , ..., + 27 c111 式(1)
CPU11は、行値である変数の組合せuと、列値である算出したインデックスvとに対応する第1行列の要素をカウントアップする(Fuv= Fuv + 1)。図3の例では、インデックスvは2+4+16で22となる。CPU11は、u0,22の要素をカウントアップする。これにより一局所シークエンスについてのDEGs度数行列F(適宜u,vを省略する)の要素を算出することができる。またCPU11は、特定の部分空間u毎に、局所シークエンスを時刻終端まで1時刻ずつスライドしながら、順次インデックスvを決定してDEGs度数の要素Fuvを引き続き累積する。そして上記の手続を全336(= 8x7x6)通りの順列変数集合である部分空間uについて実行することにより,最終的なDEGs度数行列Fを得る。
具体的には、図3に示すように、最初に太枠で示す変数A,B及びCについて時間帯t=1〜4の局所シークエンスを抽出する。CPU11は、抽出した局所シークエンスの値の有無に応じた2値の高階テンソルを生成し、演算式により高階テンソルの値に応じたインデックスvを求める。次に、CPU11は、点線枠で示すように、時間帯を右方向に1ずらし、変数A,B及びCについて時間帯t=2〜5の局所シークエンスを抽出する。すなわちCPU11は、時間帯を一部重複させ、かつ、一単位時刻後ろにずらし、変数A,B及びCについて時間帯t=2〜5の局所シークエンスを抽出する。同様にCPU11は、抽出した局所シークエンスの値の有無に応じた2値の高階テンソルを生成し、演算式により高階テンソルの値に応じたインデックスvを求める。CPU11は、列値であるインデックスvに対応するDEGs度数行列の要素をカウントアップする。CPU11は、以上の処理を各時間帯について行い、u=0の行の要素を算出する。以下同様に、変数A,B及びCについて次の時間帯t=3〜6の局所シークエンスを抽出する。
CPU11は時間帯が終端に達した場合、複数の変数の他の組合せについても同様の処理を行う。図3の例では、時間帯t=4〜7の場合に終端となる。CPU11は、次の組合せとして変数B,C及びD、時間帯t=1〜4の局所シークエンスを抽出し、高階テンソルを生成する。CPU11は、同様の処理により部分空間u=1のインデックスvを求め、u=1のインデックスvに対応するDEGs度数行列の要素をカウントアップする。CPU11は、再び時間帯をずらして同様の処理を行う。CPU11は、以上の処理を繰り返し行うことで、DEGs度数行列Fの要素を得る。
図6はDEGs状態の一覧を示す説明図である。3階テンソルに依るDEGs状態は23=8通りの部分空間パターンの有無cbにより表現され,そのバリエーションは2を23乗して=256通りである。Ivは相互情報量であり、入力とは無関係にDEGs状態毎に予め決定されている量である。相互情報量は複数の変数の各エントロピーを加算した値から、複数の変数の結合エントロピーを減じた値である。確率変数Xに対するエントロピーはH(X)=-ΣPi log2 Pi として求められる。そして3変数に対する相互情報量は、3つの周辺エントロピーの和から、結合エントロピーを差し引いた値であり、変数間の関係性の強さを表現する。つまり、相互情報量は以下の式2で表される。
相互情報量Iv= H(x1) + H(x2) + H(x3) − H(x1, x2, x3) (式2)
例えば図4および図5に示したv=22の場合では,3変数(成分)を考慮した場合には,8つの要素に対して3要素に値が存在するので,ここに等確率に確率変数(1/3)を割り振ると仮定する。この場合、結合エントロピーは,H(x1, x2, x3) = - 3 Σ (1/3) log2(1/3) =1.59となる。変数x1の成分のみを考慮した場合にはx1=0となる確率が2/3で,x1=1となる確率が1/3であるためその周辺エントロピーはH(x1)= - (2/3) log2(2/3) - (1/3) log2 (1/3) =0.92となる。周辺エントロピーH(x2)とH(x3) もH(x1)と同じ値の0.92をとる。従って、相互情報量Ivは(式2)より,[0.92+0.92+0.92-1.59] = 1.170 となる。
次いでCPU11は、相互情報量IvをDEGs度数行列Fに乗ずることで重み付けがなされた修正後のDEGs度数行列Guv(第2行列)を得る。図7は修正後DEGs度数行列を示す説明図である。図7に示すように、相互情報量Ivを一行、256列の行列として、DEGs度数行列Fuvに左から乗じることにより、修正後のDEGs度数行列Guv(以下、適宜u,vを省略する)を算出する。
CPU11は、DEGs度数行列FまたはDEGs度数行列Gに対し部分空間uに対するクラスタリングを行う。なお、本実施形態ではDEGs度数行列Gに対してクラスタリングを行う例を挙げて説明する。なお、クラスタリングは階層的クラスタリング、K-means法等他のアルゴリズムを用いても良い。本実施形態では一例として階層的クラスタリングを用いる例を説明する。CPU11は、DEGs度数行列Gに含まれる全ての部分空間(複数の変数)ペアの距離を計算する。本例では,336次元なので,(336×335/2)個のユークリッド距離がYとして出力される。CPU11は、距離Yを入力として、近い部分空間同士から順次つなげていくデータ構造を生成し、Zとして出力する。CPU11は、Zを入力として,階段上のデンドログラムを作成する。CPU11は、デンドログラムにおいて適当な閾値を設定することで,様々な粒度のクラスタを得る。
図8はヒートマップ及びデンドログラムを示す説明図である。ヒートマップは白黒の濃淡で示しており、最も濃い黒色が行列の値0であり、色が薄くなるほど行列の値が大きくなることを示す。縦軸方向が部分空間(変数の組み合わせ)を示し、本例では366通り存在する。横軸方向はインデックスvの値である。vは正または0をとり,256通り存在するが、図8の例では有効な正の値をとる要素のみ(6,18,20,7,19,21,22,23)を表示している。
CPU11は、DEGs度数行列Gを参照し、クラスタ内の部分空間に対応する行列Gの値の合計値(修正DEGs度数和)を算出する。CPU11は、合計値を、クラスタ別に算出する。CPU11は、クラスタ内の合計値を、クラスタ内の部分空間総数(変数の組合せ総数)で除すことでクラスタ毎の平均値を算出する。CPU11は、記憶部15に予め記憶した閾値を読み出す。CPU11は、平均値が閾値以上のクラスタを抽出する。CPU11は、抽出したクラスタの部分空間を、等価とみなしうる部分空間の集合である等価性構造として抽出する。図8の例では等価性構造を持つ変数の組合せとして、「E,D,C」、「B,C,D」等が抽出されている。
以上のハードウェアにおいて各ソフトウェア処理を、フローチャートを用いて説明する。図9は等価性構造抽出処理の全体的な流れを示すフローチャートである。CPU11は、制御プログラム15Pを実行し、DEGs度数行列Fの生成を行う(ステップS91)。その後、CPU11は、相互情報量及びDEGs度数行列Fに基づき修正DEGs度数行列Gを算出する(ステップS92)。最後にCPU11は、クラスタリングを行い、等価性構造の抽出を行う(ステップS93)。以下各ステップの詳細を説明する。なお、後述するようにステップS92の処理を行わず、DEGs度数行列F に対して、ステップS93の処理を行っても良い。
図10はDEGs度数行列Fを生成する際の手順を示すフローチャートである。CPU11は、最初に図2に示す複数の変数の2値の時系列データをRAM12に展開する。CPU11は、DEGs度数行列Fを生成し、全ての要素Fuvを0に初期化する(ステップS101)。CPU11は、全ての部分空間を処理したか否かを判断する(ステップS102)。CPU11は、全ての部分空間について処理を行っていないと判断した場合(ステップS102でNO)、処理をステップS103へ移行させる。CPU11は、部分空間uを一つ選択する(ステップS103)。なお、図2の例では、時間帯の初期値がt=1〜4、変数の組み合わせの初期値がA、B、Cとする部分空間が最初に選択される。部分空間uの初期値は0であり、最終値は365である。
CPU11は、記憶部15に記憶した最終の時間帯までの局所シークエンスを処理したか否かを判断する(ステップS104)。図2の例では、CPU11は、最終の時間帯t=4〜7の局所シークエンスを処理したか否かを判断する。CPU11は、最終の時間帯までの局所シークエンスを処理したと判断していない場合(ステップS104でNO)、処理をステップS105へ移行させる。CPU11は、取得した局所シークエンスに対応するインデックスvを取得する(ステップS105)。なお、ステップS105の処理は後述する。
CPU11は、DEGs度数行列Fの対応する要素Fuvに1を加算する(ステップS106)。具体的には、CPU11は、ステップS103で選択した部分空間uの値と、ステップS105で取得したインデックスvとに対応する要素に1を加算する。CPU11は、開始時刻を一つずらし、新たな局所シークエンスを得る(ステップS107)。図2の例では次に、変数A、B、Cについて時間帯t=2〜5の時系列データが選択される。その後処理をステップS104に戻す。以上の処理を繰り返すことにより、u=1、すなわち変数A、B,Cについての各時間帯についてのインデックスvが得られることとなる。
CPU11は、最終の時間帯までの局所シークエンスを処理したと判断した場合(ステップS104でYES)、処理をステップS102に戻す。これにより、次いで、部分空間u=2(変数の組み合わせA、B、D)、3、・・・について順次処理が行われる。CPU11は、全ての部分空間を処理したと判断した場合(ステップS102でYES)、一連の処理を終了する。
図11はインデックスの算出手順を示すフローチャートである。CPU11は、DEGs状態(高階テンソル)を生成し、全ての要素Cbを初期化する(ステップS111)。具体的には本実施形態では2,2,2の3階テンソルのCbを0に初期化する。CPU11は、全ての局所時刻τについての部分空間パターンを取り出したか否かを判断する(ステップS112)。CPU11は、全ての局所時刻τについての部分空間パターンを取り出していないと判断した場合(ステップS112でNO)、処理をステップS113へ移行させる。CPU11は、局所時刻τの部分空間パターンb(τ)を選択する(ステップS113)。
図4に示す例では、最初にb(0)が選択される。CPU11は、DEGs状態においてCb(τ)=0か否かを判断する(ステップS114)。CPU11は、Cb(τ)=0と判断した場合(ステップS114でYES)、処理をステップS112に戻す。具体的には、CPU11は、部分空間パターンb(0)に2値のデータが記憶されていない場合、Cb(τ)=0と判断し、処理をステップS112に戻す。CPU11は、τに1を加算し、同様の処理を繰り返す。CPU11は、Cb(τ)=0でないと判断した場合(ステップS114でNO)、処理をステップS115へ移行させる。CPU11は、Cb(τ)=1に設定する(ステップS115)。具体的には、CPU11は、局所時刻τについての部分空間パターン中、時系列データとして1が記憶されている変数に対応するDEGs状態(高階テンソル)の値を1とする。図4の例では、b(0)=010の場合、変数x2のみが2値データ「1」であるので、C010が「1」となる。また、b(1)=100の場合、変数x1のみが2値データ「1」であるので、C100が「1」となる。b(3)=001の場合、変数x3のみが2値データ「1」であるので、C001が「1」となる。
CPU11は、その後処理をステップS112に戻す。以上の処理を繰り返すことにより、全ての部分空間パターンb(τ)についての処理が終了する。CPU11は、記憶部15に記憶した式(1)で示す演算式を読み出す(ステップS116)。CPU11は、生成したDEGs状態の2値のデータの有無に応じた値を演算式に代入する(ステップS117)。これによりCPU11は、部分空間uに対するインデックスvを取得する(ステップS118)。
図12は相互情報量の算出手順を示すフローチャートである。CPU11は、変数の数及び時間帯と同サイズの高階2値テンソルを生成し、全ての要素を0に初期化する(ステップS121)。本実施形態では<2,2,2>の3階テンソルとなる。CPU11は、相互情報量ベクトルIvを生成し、全ての要素を0に初期化する(ステップS122)。本実施形態では256通り存在する。CPU11は、全てのDEGs状態を処理したか否かを判断する(ステップS123)。具体的には、CPU11は、256通りの全てについて処理したか否かを判断する。
CPU11は、全てのDEGs状態を処理していないと判断した場合(ステップS123でNO)、処理をステップS124へ移行させる。CPU11は、DEG状態を一つ選択する(ステップS124)。図6の例ではv=0が最初に選択される。CPU11は、DEG状態中で、Cb=1である要素を計数し、k個とする(ステップS125)。図6の例ではv=255の場合、k=8となる。CPU11は、高階2値テンソル中でCb=1である要素の確率変数を1/kに設定する(ステップS126)。CPU11は、結合エントロピーH(x1,x2,x3)を計算する(ステップS127)。
CPU11は、全ての成分について処理したか否かを判断する(ステップS128)。具体的には、CPU11は、以下に述べるテンソル成分x1,x2,x3の全てについて処理を行ったか否かを判断する。CPU11は、全ての成分について処理していない場合(ステップS128でNO)、処理をステップS129へ移行させる。CPU11は、テンソル成分xiを一つ選択する(ステップS129)。CPU11は、周辺エントロピーH(xi)を計算する(ステップS1210)。CPU11は、その後処理をステップS128へ戻す。CPU11は、全ての成分を処理したと判断した場合(ステップS128でYES)、処理をステップS1212へ移行させる。
CPU11は、記憶部15から式2を読み出し、各周辺エントロピーの合計値から結合エントロピーを減じることで、相互情報量を計算し、相互情報量ベクトルIのv番目の要素Ivを登録する(ステップS1212)。CPU11はその後処理をステップS123に戻す。CPU11は、以上述べた処理を全てのDEGs状態について処理したと判断した場合(ステップS123でYES)、一連の処理を終了する。
図13は修正DEGs度数行列Gの算出手順を示すフローチャートである。CPU11は、図10で算出したDEGs度数行列Fuvを読み出す(ステップS101)。CPU11は、記憶部15から相互情報量Ivを読み出す(ステップS102)。CPU11は、Iv×Fuvにより修正DEGs度数行列Guvを算出する(ステップS103)。
図14は等価性構造の出力処理手順を示すフローチャートである。CPU11は、修正DEGs度数行列Gに対して、階層クラスタリングを実施し、デンドログラムを得る(ステップS141)。CPU11は、記憶部15に記憶した閾値で、デンドログラムを分離し、部分空間のクラスタを複数生成する(ステップS142)。CPU11は、クラスタ内の部分空間uの要素の合計値を算出する(ステップS143)。例えば、図7の例で部分空間u=0、1、355が同じクラスタにクラスタリングされた場合、G0,0 G0,1 ... G0,v ... G0,255の各要素、G1,0 G1,1 ... G1,v ... G1,255の各要素及びG335,0 G335,1 ... G335,v ... G335,255の各要素を加算し、合計値を求める。なお、本実施形態では修正DEGs度数行列Gについての処理例を挙げたが、DEGs度数行列Fについても同様の処理を行えばよい。
CPU11は、合計値をクラスタ内の部分空間uの総数で除し、平均値を算出する(ステップS144)。上述した例では部分空間uの総数3で、合計値を除し、平均値を算出する。CPU11は、全てのクラスタについて処理を終了したか否かを判断する(ステップS145)。CPU11は、全てのクラスタについて処理を終了していないと判断した場合(ステップS145でNO)、処理をステップS143に戻す。これにより、各クラスタの等価性を評価する指標となる平均値が算出される。
CPU11は、全てのクラスタについて処理を終了したと判断した場合(ステップS145でYES)、処理をステップS146へ移行させる。CPU11は、記憶部15から閾値を読み出す(ステップS146)。CPU11は、読み出した閾値以上のクラスタを抽出する(ステップS147)。CPU11は、抽出したクラスタ内の部分空間を等価性構造として出力する(ステップS148)。これにより、精度良く等価性構造を抽出することが可能となる。またDEGs内部の相互情報量Ivによる修正DEGs度数行列Gを用いることで、予測性への貢献が小さいノイズを排除でき、より有用な等価性構造を抽出することが可能となる。
実施の形態2
図15は上述した形態のコンピュータ1の動作を示す機能ブロック図である。CPU11が制御プログラム15Pを実行することにより、サーバコンピュータ1は以下のように動作する。抽出部101は、複数の変数に対する2値の時系列データから、複数の時間帯及び複数の変数の組み合わせについて、部分的な時系列データを抽出する。生成部102は、抽出部101により抽出した部分的な時系列データに基づき2値の高階テンソルを生成する。第1行列生成部103は生成部102により生成した高階テンソルに基づき、複数の時間帯及び複数の変数の組み合わせについての第1行列を生成する。
図16は実施の形態2に係るコンピュータ1のハードウェア群を示すブロック図である。コンピュータ1を動作させるためのプログラムは、ディスクドライブ等の読み取り部10AにCD-ROM、DVD(Digital Versatile Disc)ディスク、メモリーカード、またはUSB(Universal Serial Bus)メモリ等の可搬型記録媒体1Aを読み取らせて記憶部15に記憶しても良い。また当該プログラムを記憶したフラッシュメモリ等の半導体メモリ1Bをコンピュータ1内に実装しても良い。さらに、当該プログラムは、インターネット等の通信網Nを介して接続される他のサーバコンピュータ(図示せず)からダウンロードすることも可能である。以下に、その内容を説明する。
図16に示すコンピュータ1は、上述した各種ソフトウェア処理を実行するプログラムを、可搬型記録媒体1Aまたは半導体メモリ1Bから読み取り、或いは、通信網Nを介して他のサーバコンピュータ(図示せず)からダウンロードする。当該プログラムは、制御プログラム15Pとしてインストールされ、RAM12にロードして実行される。これにより、上述したコンピュータ1として機能する。
本実施の形態2は以上の如きであり、その他は実施の形態1と同様であるので、対応する部分には同一の参照番号を付してその詳細な説明を省略する。
以上の実施の形態1及び2を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)
コンピュータに、
複数の変数に対する2値の時系列データから、複数の時間帯及び複数の変数の組み合わせについて、部分的な時系列データを抽出し、
抽出した部分的な時系列データに基づき2値の高階テンソルを生成し、
生成した高階テンソルに基づき、複数の時間帯及び複数の変数の組み合わせについての第1行列を生成する
処理を実行させるプログラム。
(付記2)
相互情報量ベクトルを前記第1行列に乗じて第2行列を生成する
処理を実行させる付記1に記載のプログラム。
(付記3)
前記第2行列に対し、クラスタリングを行って複数のクラスタを生成し、
各クラスタ内の複数の変数の組み合わせに対応する前記第2行列の値の合計値を算出し、
前記合計値をクラスタ内の変数の組み合わせ総数で除し、各クラスタの平均値を算出し、
算出した平均値が閾値以上のクラスタ内の変数の組み合わせを抽出する
付記2に記載のプログラム。
(付記4)
前記第1行列に対し、クラスタリングを行って複数のクラスタを生成し、
各クラスタ内の複数の変数の組み合わせに対応する前記第1行列の値の合計値を算出し、
前記合計値をクラスタ内の変数の組み合わせ総数で除し、各クラスタの平均値を算出し、
算出した平均値が閾値以上のクラスタ内の変数の組み合わせを抽出する
付記1に記載のプログラム。
(付記5)
複数の変数に対する2値の時系列データから、時間帯をずらしながら変数の組み合わせに対する部分的な時系列データを複数抽出し、
抽出した部分的な時系列データに基づき時間帯毎に2値の高階テンソルを生成し、
生成した時間帯毎の高階テンソルに基づき、前記変数の組み合わせに対する第1行列の列値を算出する
付記1〜4の何れか一つに記載のプログラム。
(付記6)
複数の変数に対する2値の時系列データから、時間帯をずらしながら、前記変数の組み合わせとは異なる変数の組み合わせに対する部分的な時系列データを複数抽出する
付記5に記載のプログラム。
(付記7)
2値の高階テンソルに対応する演算式を記憶部から読み出し、
生成した高階テンソルの2値データの有無に応じた値を前記演算式に代入することにより、複数の変数に対する第1行列の列値を算出する
付記5または6に記載のプログラム。
(付記8)
相互情報量は、複数の変数の各エントロピーを加算した値から、複数の変数の結合エントロピーを減じた値である
付記2に記載のプログラム。
(付記9)
複数の変数に対する2値の時系列データから、複数の時間帯及び複数の変数の組み合わせについて、部分的な時系列データを抽出する抽出部と、
該抽出部により抽出した部分的な時系列データに基づき2値の高階テンソルを生成する生成部と、
該生成部により生成した高階テンソルに基づき、複数の時間帯及び複数の変数の組み合わせについての第1行列を生成する第1行列生成部と
を備える情報処理装置。
(付記10)
制御部を有するコンピュータを用いた情報処理方法において、
複数の変数に対する2値の時系列データから、前記制御部により複数の時間帯及び複数の変数の組み合わせについて、部分的な時系列データを抽出し、
抽出した部分的な時系列データに基づき前記制御部により2値の高階テンソルを生成し、
生成した高階テンソルに基づき、前記制御部により複数の時間帯及び複数の変数の組み合わせについての第1行列を生成する
情報処理方法。
(付記11)
コンピュータに、
複数の変数に対する多値の同期系列データから、複数の同期帯及び複数の変数の組み合わせについて、部分的な同期系列データを抽出し、
抽出した部分的な同期系列データに基づき多値の高階テンソルを生成し、
生成した高階テンソルに基づき、複数の同期帯及び複数の変数の組み合わせについての第1行列を生成する
処理を実行させるプログラム。
(付記12)
複数の変数に対する多値の同期系列データから、複数の同期帯及び複数の変数の組み合わせについて、部分的な同期系列データを抽出する抽出部と、
該抽出部により抽出した部分的な同期系列データに基づき多値の高階テンソルを生成する生成部と、
該生成部により生成した高階テンソルに基づき、複数の同期帯及び複数の変数の組み合わせについての第1行列を生成する第1行列生成部と
を備える情報処理装置。
(付記13)
制御部を有するコンピュータを用いた情報処理方法において、
複数の変数に対する多値の同期系列データから、前記制御部により複数の同期帯及び複数の変数の組み合わせについて、部分的な同期系列データを抽出し、
抽出した部分的な同期系列データに基づき前記制御部により多値の高階テンソルを生成し、
生成した高階テンソルに基づき、前記制御部により複数の同期帯及び複数の変数の組み合わせについての第1行列を生成する
情報処理方法。
1 コンピュータ
1A 可搬型記録媒体
1B 半導体メモリ
10A 読み取り部
11 CPU
12 RAM
13 入力部
14 表示部
15 記憶部
15P 制御プログラム
16 通信部
101 抽出部
102 生成部
103 第1行列生成部
N 通信網

Claims (13)

  1. コンピュータに、
    複数の変数に対する2値の時系列データから、複数の時間帯及び複数の変数の組み合わせについて、部分的な時系列データを抽出し、
    抽出した部分的な時系列データに基づき2値の高階テンソルを生成し、
    生成した高階テンソルに基づき、複数の時間帯及び複数の変数の組み合わせについての第1行列を生成し、
    相互情報量ベクトルを前記第1行列に乗じて第2行列を生成する
    処理を実行させるプログラム。
  2. 前記第2行列に対し、クラスタリングを行って複数のクラスタを生成し、
    各クラスタ内の複数の変数の組み合わせに対応する前記第2行列の値の合計値を算出し、
    前記合計値をクラスタ内の変数の組み合わせ総数で除し、各クラスタの平均値を算出し、
    算出した平均値が閾値以上のクラスタ内の変数の組み合わせを抽出する
    請求項に記載のプログラム。
  3. 複数の変数に対する2値の時系列データから、複数の時間帯及び複数の変数の組み合わせについて、部分的な時系列データを抽出する抽出部と、
    該抽出部により抽出した部分的な時系列データに基づき2値の高階テンソルを生成する生成部と、
    該生成部により生成した高階テンソルに基づき、複数の時間帯及び複数の変数の組み合わせについての第1行列を生成する第1行列生成部と
    相互情報量ベクトルを前記第1行列に乗じて第2行列を生成する第2行列生成部と
    を備える情報処理装置。
  4. 制御部を有するコンピュータを用いた情報処理方法において、
    複数の変数に対する2値の時系列データから、前記制御部により複数の時間帯及び複数の変数の組み合わせについて、部分的な時系列データを抽出し、
    抽出した部分的な時系列データに基づき前記制御部により2値の高階テンソルを生成し、
    生成した高階テンソルに基づき、前記制御部により複数の時間帯及び複数の変数の組み合わせについての第1行列を生成し、
    相互情報量ベクトルを前記第1行列に乗じて第2行列を生成する
    情報処理方法。
  5. コンピュータに、
    複数の変数に対する多値の同期系列データから、複数の同期帯及び複数の変数の組み合わせについて、部分的な同期系列データを抽出し、
    抽出した部分的な同期系列データに基づき多値の高階テンソルを生成し、
    生成した高階テンソルに基づき、複数の同期帯及び複数の変数の組み合わせについての第1行列を生成し、
    相互情報量ベクトルを前記第1行列に乗じて第2行列を生成する
    処理を実行させるプログラム。
  6. 複数の変数に対する多値の同期系列データから、複数の同期帯及び複数の変数の組み合わせについて、部分的な同期系列データを抽出する抽出部と、
    該抽出部により抽出した部分的な同期系列データに基づき多値の高階テンソルを生成する生成部と、
    該生成部により生成した高階テンソルに基づき、複数の同期帯及び複数の変数の組み合わせについての第1行列を生成する第1行列生成部と
    相互情報量ベクトルを前記第1行列に乗じて第2行列を生成する第2行列生成部と
    を備える情報処理装置。
  7. 制御部を有するコンピュータを用いた情報処理方法において、
    複数の変数に対する多値の同期系列データから、前記制御部により複数の同期帯及び複数の変数の組み合わせについて、部分的な同期系列データを抽出し、
    抽出した部分的な同期系列データに基づき前記制御部により多値の高階テンソルを生成し、
    生成した高階テンソルに基づき、前記制御部により複数の同期帯及び複数の変数の組み合わせについての第1行列を生成し、
    相互情報量ベクトルを前記第1行列に乗じて第2行列を生成する
    情報処理方法。
  8. コンピュータに、
    複数の変数に対する2値の時系列データから、複数の時間帯及び前記複数の変数の一部の複数の変数の組み合わせについて、部分的な時系列データを時間及び変数をずらして複数抽出し、
    抽出した部分的な時系列データに基づき2値の高階テンソルを部分的な時系列データ毎に生成し、
    生成した各高階テンソルに基づき、複数の時間帯及び複数の変数の組み合わせについての第1行列を生成する
    処理を実行させるプログラム。
  9. 複数の変数に対する2値の時系列データから、複数の時間帯及び前記複数の変数の一部の複数の変数の組み合わせについて、部分的な時系列データを時間及び変数をずらして複数抽出する抽出部と、
    抽出した部分的な時系列データに基づき2値の高階テンソルを部分的な時系列データ毎に生成する生成部と、
    生成した各高階テンソルに基づき、複数の時間帯及び複数の変数の組み合わせについての第1行列を生成する第1行列生成部と
    を備える情報処理装置。
  10. コンピュータに、
    複数の変数に対する2値の時系列データから、複数の時間帯及び前記複数の変数の一部の複数の変数の組み合わせについて、部分的な時系列データを時間及び変数をずらして複数抽出し、
    抽出した部分的な時系列データに基づき2値の高階テンソルを部分的な時系列データ毎に生成し、
    生成した各高階テンソルに基づき、複数の時間帯及び複数の変数の組み合わせについての第1行列を生成する
    処理を実行させる情報処理方法。
  11. コンピュータに、
    複数の変数に対する多値の時系列データから、複数の時間帯及び前記複数の変数の一部の複数の変数の組み合わせについて、部分的な時系列データを時間及び変数をずらして複数抽出し、
    抽出した部分的な時系列データに基づき多値の高階テンソルを部分的な時系列データ毎に生成し、
    生成した各高階テンソルに基づき、複数の時間帯及び複数の変数の組み合わせについての第1行列を生成する
    処理を実行させるプログラム。
  12. 複数の変数に対する多値の時系列データから、複数の時間帯及び前記複数の変数の一部の複数の変数の組み合わせについて、部分的な時系列データを時間及び変数をずらして複数抽出する抽出部と、
    抽出した部分的な時系列データに基づき多値の高階テンソルを部分的な時系列データ毎に生成する生成部と、
    生成した各高階テンソルに基づき、複数の時間帯及び複数の変数の組み合わせについての第1行列を生成する第1行列生成部と
    を備える情報処理装置。
  13. コンピュータに、
    複数の変数に対する多値の時系列データから、複数の時間帯及び前記複数の変数の一部の複数の変数の組み合わせについて、部分的な時系列データを時間及び変数をずらして複数抽出し、
    抽出した部分的な時系列データに基づき多値の高階テンソルを部分的な時系列データ毎に生成し、
    生成した各高階テンソルに基づき、複数の時間帯及び複数の変数の組み合わせについての第1行列を生成する
    処理を実行させる情報処理方法。
JP2013109314A 2013-05-23 2013-05-23 プログラム、情報処理装置、及び情報処理方法 Active JP6136567B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013109314A JP6136567B2 (ja) 2013-05-23 2013-05-23 プログラム、情報処理装置、及び情報処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013109314A JP6136567B2 (ja) 2013-05-23 2013-05-23 プログラム、情報処理装置、及び情報処理方法

Publications (2)

Publication Number Publication Date
JP2014229142A JP2014229142A (ja) 2014-12-08
JP6136567B2 true JP6136567B2 (ja) 2017-05-31

Family

ID=52128922

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013109314A Active JP6136567B2 (ja) 2013-05-23 2013-05-23 プログラム、情報処理装置、及び情報処理方法

Country Status (1)

Country Link
JP (1) JP6136567B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10970187B2 (en) * 2018-10-31 2021-04-06 Jpmorgan Chase Bank, N.A. System and method for proactively healing a mainframe computer system

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101789078B1 (ko) 2017-02-16 2017-10-23 전남대학교산학협력단 고차원 시계열 모델링을 위한 은닉 특징 추출 시스템 및 방법
CN116456289B (zh) * 2023-06-13 2023-08-15 安徽创瑞信息技术有限公司 一种富媒体信息处理方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8099381B2 (en) * 2008-05-28 2012-01-17 Nec Laboratories America, Inc. Processing high-dimensional data via EM-style iterative algorithm
JP2011186780A (ja) * 2010-03-09 2011-09-22 Sony Corp 情報処理装置、情報処理方法、およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10970187B2 (en) * 2018-10-31 2021-04-06 Jpmorgan Chase Bank, N.A. System and method for proactively healing a mainframe computer system

Also Published As

Publication number Publication date
JP2014229142A (ja) 2014-12-08

Similar Documents

Publication Publication Date Title
Shrikumar et al. Technical note on transcription factor motif discovery from importance scores (TF-MoDISco) version 0.5. 6.5
CN105989288B (zh) 一种基于深度学习的恶意代码样本分类方法及系统
US10657183B2 (en) Information processing apparatus, similarity search program, and similarity search method
CA3061667C (en) Systems and methods for assessing item compatibility
CN103327092A (zh) 一种信息网络上的社区发现方法和系统
Nikolentzos et al. Learning structural node representations using graph kernels
Lehre et al. On the limitations of the univariate marginal distribution algorithm to deception and where bivariate EDAs might help
JP7119820B2 (ja) 予測プログラム、予測方法および学習装置
JP6136567B2 (ja) プログラム、情報処理装置、及び情報処理方法
Sun et al. Bi-Force: large-scale bicluster editing and its application to gene expression data biclustering
Ma et al. SNEGAN: Signed network embedding by using generative adversarial nets
JP7115207B2 (ja) 学習プログラム、学習方法および学習装置
Castelli et al. A hybrid genetic algorithm for the repetition free longest common subsequence problem
Kondor et al. Diffusion kernels
CN111563535A (zh) 一种基于秩为r的离散非负矩阵分解聚类方法
Pimentel et al. Efficient estimation of node representations in large graphs using linear contexts
JP2012043437A (ja) 画像処理方法及び画像処理装置
CN113112414A (zh) 噪声估计方法、噪声估计程序以及噪声估计设备
Alves et al. An empirical study of the discreteness prior in low-rank matrix completion
Karlebach Inferring Boolean network states from partial information
Yuan et al. Scalable training of sparse linear svms
CN110753913A (zh) 基于样本的多维数据克隆
US11609936B2 (en) Graph data processing method, device, and computer program product
US20230077998A1 (en) Systems and Methods for Smart Instance Selection
Dimopoulos et al. Machine Learning Attacks and Countermeasures on Hardware Binary Edwards Curve Scalar Multipliers

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170104

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170417

R150 Certificate of patent or registration of utility model

Ref document number: 6136567

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150