JP2019016193A - 分析方法、分析装置及び分析プログラム - Google Patents

分析方法、分析装置及び分析プログラム Download PDF

Info

Publication number
JP2019016193A
JP2019016193A JP2017133558A JP2017133558A JP2019016193A JP 2019016193 A JP2019016193 A JP 2019016193A JP 2017133558 A JP2017133558 A JP 2017133558A JP 2017133558 A JP2017133558 A JP 2017133558A JP 2019016193 A JP2019016193 A JP 2019016193A
Authority
JP
Japan
Prior art keywords
series
analysis
time
betch
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017133558A
Other languages
English (en)
Other versions
JP7069581B2 (ja
Inventor
小林 健
Takeshi Kobayashi
健 小林
裕平 梅田
Yuhei Umeda
裕平 梅田
賢 等々力
Masaru Todoroki
賢 等々力
稲越 宏弥
Hiroya Inakoshi
宏弥 稲越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2017133558A priority Critical patent/JP7069581B2/ja
Priority to US16/028,915 priority patent/US11023562B2/en
Publication of JP2019016193A publication Critical patent/JP2019016193A/ja
Application granted granted Critical
Publication of JP7069581B2 publication Critical patent/JP7069581B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing

Abstract

【課題】時系列分析が可能な対象の範囲を拡大する装置、方法及びプログラムを提供する。【解決手段】受付部101は、パラメータの入力を受け付け、パラメータをパラメータ格納部111に格納する。生成部103は、パラメータ格納部に格納されているパラメータと、時系列データ格納部113に格納されている時系列データとを用いて、時系列のベッチ数であるベッチ数系列を生成し、生成したベッチ数系列を系列データ格納部115に格納する。算出部1051は、パラメータ格納部に格納されているパラメータ及び系列データ格納部に格納されているデータを用いて異常スコアを算出し、算出した異常スコアを異常スコア格納部117に格納する。推定部1053は、パラメータ格納部に格納されているパラメータ及び異常スコア格納部に格納されている異常スコアを用いて、変化点を検知する処理を実行し、処理結果を結果格納部119に格納する。【選択図】図7

Description

本発明は、時系列データの分析技術に関する。
カオス性を有する時系列データ(例えば、ジャイロセンサで計測されたデータや株価のデータ等)がある。
例えば株価のデータとして、図1に示すような時系列データが得られたとする。図1は、或る銘柄の株価終値の対数差分の時系列データを示す図である。ここで、対数差分とは、或る日の株価終値の対数とその前の日の株価終値の対数との差分である。
図2は、図1に示した株価の対数差分系列に対する特異スペクトル変換により算出された異常スコアを示す図である。図2の例においては、異常スコアは比較的高い値で推移している。このような場合には、ノイズの影響等により時系列データから変化点を検知することは困難である。
なお、時系列データの分析技術として、位相データ解析により時系列データをベッチ数の系列に変換する技術が知られている。
Yuhei Umeda、"Time Series Classification via Topological Data Analysis"、人工知能学会論文誌、平成29年5月1日、第32号、第3巻
非特許文献1に記載された従来技術による時系列データの分析では、たとえばカオス性を有する時系列データに対しては、ノイズの影響等により適切な分析結果を得られない場合がある。すなわち、時系列データによっては時系列分析が可能ではない場合がある。
本発明の目的は、1つの側面では、時系列分析が可能な対象の範囲を拡大する技術を提供することである。
一態様に係る分析方法は、時系列データに対するパーシステントホモロジ処理の結果に含まれるベッチ数系列を、複数の次元それぞれのベッチ数系列に分割し、複数のベッチ数系列それぞれに対する分析を実行する処理を含む。
1つの側面では、時系列分析が可能な対象の範囲を拡大できる。
図1は、株価の対数差分系列を示す図である。 図2は、異常スコアを示す図である。 図3は、株価の対数差分系列から生成されたベッチ数系列を示す図である。 図4は、異常スコアを示す図である。 図5は、0次についての異常スコアを示す図である。 図6は、1次についての異常スコアを示す図である。 図7は、分析装置の機能ブロック図である。 図8は、第1の実施の形態の分析装置が実行する処理の処理フローを示す図である。 図9は、系列生成処理の処理フローを示す図である。 図10は、疑似アトラクタの生成について説明するための図である。 図11は、バーコード図である。 図12は、バーコードデータの一例を示す図である。 図13は、0次元の穴についてバーコードデータとベッチ数系列との関係を示す図である。 図14は、1次元の穴についてバーコードデータとベッチ数系列との関係を示す図である。 図15は、2次元の穴についてバーコードデータとベッチ数系列との関係を示す図である。 図16は、バーコードデータの一例を示す図である。 図17は、特異スペクトル変換について説明するための図である。 図18は、変化点検知について説明するための図である。 図19は、第2の実施の形態の分析装置が実行する処理の処理フローを示す図である。 図20は、コンピュータの機能ブロック図である。
[実施の形態1]
図3は、非特許文献1の技術を用いて図1の対数差分系列から生成されたベッチ数系列を示す図である。図3において、縦軸の値はベッチ数を表し、横軸の値は半径を示す。図3に示すベッチ数系列においては、0次についてのベッチ数系列と、1次についてのベッチ数系列と、2次についてのベッチ数系列とが連結されている。各ベッチ数系列の半径は0からr_maxまでである。パーシステントホモロジ処理においては時間の経過に伴って球の半径が大きくなるので、0次についてのベッチ数系列は連結成分の数の時系列変化を表し、1次についてのベッチ数系列は穴(すなわちトンネル)の数の時系列変化を表し、2次についてのベッチ数系列は空洞の数の時系列変化を表す。
図3に示したベッチ数系列に対して特異スペクトル変換を実行すると、図4に示すような異常スコアが算出される。図4においては、縦軸の値は異常スコアを表し、横軸の値は日時を表す。
一方、図3に示したベッチ数系列を次元ごとに分割した各ベッチ数系列に対して特異スペクトル変換を実行した場合の結果を図5及び図6に示す。図5は0次についての異常スコアを示す図であり、図6は1次についての異常スコアを示す図である。図5及び図6においては、縦軸の値は異常スコアを表し、横軸の値は日時を表す。
図4と図5及び図6との比較から、図4に示した異常スコアと、図5に示した異常スコアとがほぼ同じであることが分かる。これは、0次についてのベッチ数系列の値のスケールが他の次元についてのベッチ数系列の値のスケールより大きく、他の次元についてのベッチ数系列の値は異常スコアの計算結果に反映されていないことを意味する。従って、図4に示した異常スコアからは適切な変化点を検知することはできない場合がある。
そこで、以下で説明する本実施の形態においては、次元ごとに分割したベッチ数系列の各々に対して変化点検知を実行することで、適切な変化点を検知できるようにする。
図7は、本実施の形態の処理を実行する分析装置1の機能ブロック図である。例えばサーバ或いはパーソナルコンピュータ等である分析装置1は、受付部101と、生成部103と、分析部105と、パラメータ格納部111と、時系列データ格納部113と、系列データ格納部115と、異常スコア格納部117と、結果格納部119とを含む。分析部105は、算出部1051と、推定部1053とを含む。
受付部101、生成部103及び分析部105は、例えば、図20におけるメモリ2501にロードされたプログラムが図20におけるCPU(Central Processing Unit)2503に実行されることで実現される。パラメータ格納部111、時系列データ格納部113、系列データ格納部115、異常スコア格納部117及び結果格納部119は、例えば、図20におけるメモリ2501又は図20におけるHDD(Hard Disk Drive)2505に設けられる。
受付部101は、パラメータ(例えば、ベッチ数の算出に使用されるパラメータ及び時系列分析のパラメータ等)の入力を受け付け、パラメータをパラメータ格納部111に格納する。生成部103は、パラメータ格納部111に格納されているパラメータと、時系列データ格納部113に格納されている時系列データとを用いて、時系列のベッチ数であるベッチ数系列を生成し、生成したベッチ数系列を系列データ格納部115に格納する。算出部1051は、パラメータ格納部111に格納されているパラメータ及び系列データ格納部115に格納されているデータを用いて異常スコアを算出し、算出した異常スコアを異常スコア格納部117に格納する。推定部1053は、パラメータ格納部111に格納されているパラメータ及び異常スコア格納部117に格納されている異常スコアを用いて、変化点を検知する処理を実行し、処理結果を結果格納部119に格納する。
なお、時系列データ格納部113に格納されているデータは、例えば、生体データ(心拍数、脳波、脈拍或いは体温などの時系列データ)、センサにより計測されたデータ(ジャイロセンサ、加速度センサ或いは地磁気センサなどの時系列データ)、金融データ(金利、物価、国際収支或いは株価などの時系列データ)、自然環境のデータ(気温、湿度或いは二酸化炭素濃度などの時系列データ)、又は社会データ(労働統計或いは人口統計などのデータ)等である。
次に、図8乃至図18を用いて、分析装置1が実行する処理を説明する。図8は、分析装置1が実行する処理の処理フローを示す図である。なお、上で述べたように、処理においてはパラメータ格納部111に格納されたパラメータが使用されるが、説明を簡単にするため、以下ではパラメータに関する説明を省略する。
分析装置1の生成部103は、時系列のベッチ数であるベッチ数系列を生成する処理である系列生成処理を実行する(図8:ステップS1)。系列生成処理については、図9乃至図16を用いて説明する。
まず、生成部103は、時系列データ格納部113に格納されている時系列データを読み出す。生成部103は、ターケンスの埋め込み定理に従って、読み出した時系列データから疑似アトラクタを生成する(図9:ステップS21)。なお、厳密には、ステップS21において生成される有限個の点集合は「アトラクタ」ではないため、本明細書ではステップS21において生成される点集合を「疑似アトラクタ」と呼ぶ。
図10を用いて、疑似アトラクタの生成について説明する。例えば図10に示すような、関数f(t)(tは時間を表す)で表される時系列データを考える。そして、実際の値としてf(1),f(2),f(3),...,f(T)が与えられているとする。本実施の形態における疑似アトラクタは、時系列データから遅延時間τ(τ≧1)毎に取り出されたN点の値を成分とする、N次元空間上の点の集合である。ここで、Nは埋め込み次元を表し、一般的にはN=3又は4である。例えばN=3且つτ=1である場合、(T−2)個の点を含む以下の疑似アトラクタが生成される。
Figure 2019016193
ここでは、τ=1であるため1つおきに要素が取り出されているが、例えばτ=2である場合には点(f(1),f(3),f(5))、点(f(2),f(4),f(6))、・・・を含む疑似アトラクタが生成される。
疑似アトラクタの生成過程において、バタフライ効果等による見た目の違いの影響が取り除かれ、疑似アトラクタに元の時系列データの変化のルールが反映される。そして、疑似アトラクタ間の類似関係は、ルール間の類似関係と等価である。従って、或る疑似アトラクタと別の疑似アトラクタとが似ていることは、元の時系列データの変化のルールが似ていることを意味する。変化のルールが同じであるが現象(見た目)が異なる時系列データからは、互いに類似した疑似アトラクタが生成される。変化のルールが異なるが現象が似ている時系列データからは、異なる疑似アトラクタが生成される。
図9の説明に戻り、生成部103は、ステップS21において生成された疑似アトラクタに対するパーシステントホモロジ(Persistent Homology)処理によって、バーコードデータを穴の次元(以下、穴次元と呼ぶ)毎に生成する(ステップS23)。
「ホモロジ」とは、対象の特徴をm(m≧0)次元の穴の数によって表現する手法である。ここで言う「穴」とはホモロジ群の元のことであり、0次元の穴は連結成分であり、1次元の穴は穴(トンネル)であり、2次元の穴は空洞である。各次元の穴の数はベッチ数と呼ばれる。
「パーシステントホモロジ」とは、対象(ここでは、点の集合)におけるm次元の穴の遷移を特徴付けるための手法であり、パーシステントホモロジによって点の配置に関する特徴を調べることができる。この手法においては、対象における各点が球状に徐々に膨らまされ、その過程において各穴が発生した時点(発生時の球の半径で表される)と消滅した時点(消滅時の球の半径で表される)とが特定される。なお、パーシステントホモロジにおける穴の発生した「時点」、消滅した「時点」と、パーシステントホモロジ処理の対象となる疑似アトラクタの生成元である時系列データにおける「時刻」とは、関連するものではない。
穴の発生半径と消滅半径とを用いて、図11に示すようなバーコード図を生成することができる。図11において、横軸の値は半径を表し、各線分は1つの穴に対応する。線分の左端に対応する半径は穴の発生半径であり、線分の右端に対応する半径は穴の消滅半径である。線分はパーシステント区間と呼ばれる。このようなバーコード図から、例えば半径が0.18である時には2つの穴が存在するということがわかる。
図12は、バーコード図を生成するためのデータ(以下、バーコードデータと呼ぶ)の一例を示す図である。図12の例では、穴次元を表す数値と、穴の発生半径と、穴の消滅半径とが含まれる。ステップS23において、バーコードデータは穴次元毎に生成される。
以上のような処理を実行すれば、或る疑似アトラクタから生成されるバーコードデータと他の疑似アトラクタから生成されるバーコードデータとの類似関係は、疑似アトラクタ間の類似関係と等価である。よって、疑似アトラクタが同じである場合、生成されるバーコードデータは同じであり、疑似アトラクタが同じではない場合、疑似アトラクタ間の差が僅かである場合を除きバーコードにも差が表れる。
なお、パーシステントホモロジの詳細については、例えば「平岡裕章、『タンパク質構造とトポロジー パーシステントホモロジー群入門』、共立出版」を参照されたい。
図9の説明に戻り、生成部103は、長さが所定長未満であるパーシステント区間のデータを、ステップS23において生成されたバーコードデータから削除する(ステップS25)。パーシステント区間の長さは、消滅半径から発生半径を差し引くことによって算出される。所定長は、例えば、0次元の穴が発生してから消滅するまでの時間をK等分した時間(以下、ブロックと呼ぶ)の長さである。但し、1ブロックの長さに限られるわけではなく、複数ブロックの長さを所定長としてもよい。
発生から消滅までの時間が短い元は、時系列データに付加されるノイズによって発生するものがほとんどである。長さが所定長未満であるパーシステント区間のデータを削除すれば、ノイズの影響を緩和することができるので、分類性能を向上させることができるようになる。但し、削除の対象は次元が1以上であるパーシステント区間のデータであるとする。
ノイズが発生した場合においては、僅かな時間だけ1次元以上の穴が発生することがある。ステップS25の処理を実行すれば、両ケースにおいて生成されるデータはほぼ同じになるので、ノイズの影響を取り除くことができるようになる。
なお、長さが所定長未満であるパーシステント区間のデータが削除されるので、削除後のバーコードデータ間の類似関係は、元のバーコードデータ間の類似関係と厳密には等価ではない。削除が行われない場合には、類似関係は等価である。
図9の説明に戻り、生成部103は、ステップS25の処理が実行された、各穴次元のバーコードデータから、ベッチ数系列を穴次元毎に生成する(ステップS27)。そして、生成部103は、生成したベッチ数系列を系列データ格納部115に格納し、処理は呼び出し元に戻る。
上で述べたように、バーコードデータは穴次元毎に生成されるので、生成部103は、各穴次元のバーコードデータからベッチ数系列を生成する。ベッチ数系列は、パーシステントホモロジにおける球の半径(すなわち時間)とベッチ数との関係を示すデータである。図13乃至図15を用いて、バーコードデータと生成されるベッチ数系列との関係について説明する。図13は0次元の穴についてバーコードデータとベッチ数系列との関係を示す図であり、図14は1次元の穴についてバーコードデータとベッチ数系列との関係を示す図であり、図15は2次元の穴についてバーコードデータとベッチ数系列との関係を示す図である。図13乃至図15において、上段のグラフはバーコードデータから生成されるグラフであり、横軸の値が半径を表す。下段のグラフはベッチ数系列から生成されるグラフであり、縦軸の値はベッチ数を表し、横軸の値は半径を表す。ベッチ数は穴の数を表すので、例えば図13に示すように、上段のグラフにおいて破線に対応する半径の時には存在している穴の数が10であるので、下段のグラフにおいては破線に対応するベッチ数も10である。ベッチ数は、ブロック毎に計数される。上で述べたように、パーシステントホモロジ処理においては時間の経過に伴って半径が大きくなるので、ベッチ数系列を時系列データと見做すことができる。
基本的には、同じバーコードデータからは同じベッチ数系列が得られる。すなわち、元の疑似アトラクタが同じであれば同じベッチ数系列が得られる。但し、異なるバーコードから同じベッチ数系列が得られるケースが極めて稀に発生する。
例えば図16に示すようなバーコードデータを考える。このバーコードデータは1以上の次元の穴に関するデータであるとする。図16(a)のケースにおいては、パーシステント区間p1が時刻t1で開始し且つ時刻t2で終了し、パーシステント区間p2が時刻t2で開始し且つ時刻t3で終了する。一方、図16(b)のケースにおいては、パーシステント区間p4が時刻t1で開始し且つ時刻t3で終了する。両ケースにおけるパーシステント区間p3は全く同じであるとする。
このような場合、両ケースにおけるバーコードデータからは全く同じベッチ数系列が得られるので、ベッチ数系列によっては両ケースを区別することができない。しかし、このような現象が発生する可能性は極めて低い。
従って、或るバーコードデータから生成されるベッチ数系列と、別のバーコードデータから生成されるベッチ数系列との類似関係は、上で述べた稀なケースが発生しなければ、バーコードデータ間の類似関係と等価である。以上から、データ間の距離の定義は変わるものの、バーコードデータから生成されるベッチ数系列間の類似関係は、元の時系列データ間の類似関係とほぼ等価である。
以上のように、パーシステントホモロジの計算を実行すれば、疑似アトラクタが表す、元の時系列データの変化のルールを、バーコードデータに反映することができる。
パーシステントホモロジの計算は、位相幾何学の手法であり、点の集合で表される静的な対象(例えば、タンパク質、分子の結晶、センサネットワークなど)の構造の解析等に利用されてきた。これに対し本実施の形態においては、時間の経過に伴って連続的に変化するデータの変化のルールを表す点集合(すなわち疑似アトラクタ)を計算の対象としている。本実施の形態の場合、点集合の構造自体を解析することは目的ではないので、一般的なパーシステントホモロジの計算とは対象及び目的が全く異なる。
また、上で述べたように、本実施の形態によれば時系列データに含まれるノイズの影響を取り除くことができる。
図8の説明に戻り、算出部1051は、ステップS1においてベッチ数系列が生成された複数の穴次元のうち未処理の穴次元を1つ特定する(ステップS3)。
算出部1051は、ステップS3において特定された穴次元のベッチ数系列を系列データ格納部115から読み出す。そして、算出部1051は、読み出したベッチ数系列について、履歴行列およびテスト行列を生成する(ステップS5)。
算出部1051は、ステップS5において生成された履歴行列に対する特異値分解と、ステップS5において生成されたテスト行列に対する特異値分解とを実行する(ステップS7)。
算出部1051は、履歴行列について、ステップS7の特異値分解の結果に含まれる左特異ベクトルを成分とする行列(以下、第1の行列と呼ぶ)を生成する(ステップS9)。
算出部1051は、テスト行列について、ステップS7の特異値分解の結果に含まれる左特異ベクトルを成分とする行列(以下、第2の行列と呼ぶ)を生成する(ステップS11)。
算出部1051は、ステップS9において生成された第1の行列とステップS11において生成された第2の行列とのコサイン類似度に基づく異常スコアを算出する(ステップS13)。算出部1051は、算出された異常スコアを異常スコア格納部117に格納する。なお、ステップS5乃至S13の処理は各時刻tについて実行される。
ステップS5乃至S13の処理は特異スペクトル変換の処理である。図17は、特異スペクトル変換について説明するための図である。図17において、グラフの縦軸の値は時系列データの値を表し、グラフの横軸の値は時間を表す。
特異スペクトル変換においては、スライド窓における時系列データの値のセットが複数取得され、取得された複数のセットを含む履歴行列及びテスト行列が生成される。図17の例においては、破線1701で囲まれた複数のセットに含まれる値から履歴行列X(t)が生成され、破線1702で囲まれた複数のセットに含まれる値からテスト行列Z(t)が生成される。矢印1703はラグを表し、ラグは履歴行列とテスト行列の相互位置を定める非負整数である。
履歴行列X(t)に対する特異値分解により、特異値が上位である左特異ベクトルがr本取り出され、取り出されたr本の左特異ベクトルをまとめることで第1の行列{u(t,1),...,u(t,r)}が生成される。また、テスト行列Z(t)に対する特異値分解により、特異値が上位である左特異ベクトルがm本取り出され、取り出されたm本の左特異ベクトルをまとめることで第2の行列{q(t,1),...,q(t,m)}が生成される。
異常スコアは、第1の行列と第2の行列とのコサイン類似度に基づき算出されるが、コサイン類似度ではなく、ユークリッド距離、マンハッタン距離又はDTW(Dynamic Time Warping)距離等に基づき異常スコアを算出してもよい。なお、ステップS13において算出される異常スコアは、一般的には「変化度」とも呼ばれる。
算出部1051は、未処理の穴次元が有るか判定する(ステップS15)。
未処理の穴次元が有る場合(ステップS15:Yesルート)、処理はステップS3に戻る。
一方、未処理の穴次元が無い場合(ステップS15:Noルート)、推定部1053は、以下の処理を実行する。具体的には、推定部1053は、異常スコア格納部117に格納されている異常スコアを読み出す。そして、推定部1053は、読み出された異常スコアを用いて、変化点検知を実行する(ステップS17)。そして、推定部1053は、変化点検知の結果(例えば、変化点に対応する時刻の情報)を結果格納部119に格納する。そして処理は終了する。
図18は、ステップS17の変化点検知について説明するための図である。図18において、横軸の値は0次についての異常スコアを表し、縦軸の値は1次についての異常スコアを表す。各点は0次についての異常スコアと1次についての異常スコアとを成分とするベクトルに相当する。ステップS17においては、各穴次元の異常スコアを確率変数とするウィシャート分布が推定され、ウィシャート分布の累積分布確率に基づいて変化点検知が実行される。等高線181は累積分布確率が90%の等高線であり、等高線182は累積分布確率が95%の等高線である。例えば、等高線182の外側(すなわち、点が疎な側)に含まれる点に対応する時刻が変化点として検知される。
なお、確率分布としてウィシャート分布以外の分布を用いてもよい。例えば、多変量対数正規分布やディリクレ分布など、定義域が非負の多変量確率分布を用いてもよい。
以上のような処理を実行すれば、各穴次元のベッチ数系列の特徴が考慮されるので、振動が激しくカオス性を有する時系列データに対しても適切な時系列分析を実行できるようになる。
例えば図1及び図2を用いて説明した例においては、振動が激しい株価の対数差分系列に対して特異スペクトル変換を実行した場合に、異常スコアが高い値で推移するため変化点を検知することが困難である。
また、図3乃至図4を用いて説明した例においては、各穴次元のベッチ数系列が統合された1つのベッチ数系列から異常スコアが算出される。従って、各穴次元のベッチ数系列のスケールの大きさが原因で、1次以上についてのベッチ数系列の特徴が変化点検知に反映されにくいので、適切な変化点を検出できない場合がある。
一方、本実施の形態においては、元の時系列データが各穴次元のベッチ数系列に変換され、穴次元ごとに異常スコアが算出されるため、各穴次元の穴の特徴を考慮しつつ変化点検知を実行することができる。なお、0次元についてのベッチ数は連結成分の数を表すので時系列データの振幅やばらつきが0次元についてのベッチ数系列に反映される。1次元についてのベッチ数は穴の数を表すので2次元的な力学構造が1次元についてのベッチ数系列に反映される。2次元についてのベッチ数は空洞の数を表すので3次元的な力学構造が2次元についてのベッチ数系列に反映される。
そして、本実施の形態によれば、例えば、人間の脳波、心拍数及び脈拍数等の時系列データから体調の変化を検知すること、あるいは、株価の時系列データからインサイダー取引を検知すること等が可能になる。
[実施の形態2]
ベッチ時系列は時系列分析以外にも利用することができる。例えば非特許文献1においては、各穴次元のベッチ時系列を統合して1つのベッチ時系列が生成され、生成されたベッチ時系列を入力とする機械学習が実行される。従って、分析装置1が実行する系列生成処理の出力として、各穴次元のベッチ時系列が統合された1つのベッチ時系列が生成されてもよい。この場合、分析装置1は第1の実施の形態における処理とは異なった処理を実行する。
図19は、系列生成処理の出力として1つのベッチ数系列が生成された場合に分析装置1が実行する処理の処理フローを示す図である。
分析装置1の生成部103は、時系列のベッチ数であるベッチ数系列を生成する処理である系列生成処理を実行する(図19:ステップS31)。ステップS31の系列生成処理は、基本的にはステップS1の系列生成処理と同じであるが、最終的な出力として各穴次元のベッチ数系列が統合された1つのベッチ数系列が生成される。すなわち、図3に示したようなベッチ数系列が生成される。
算出部1051は、ステップS31において生成された1つのベッチ数系列を、穴次元ごとに分割する(ステップS32)。これにより、0次についてのベッチ数系列、1次についてのベッチ数系列、2次についてのベッチ数系列、・・・が生成される。
ステップS33乃至S47の処理はステップS3乃至S17の処理と同じであるので、説明を省略する。
以上のような処理を実行すれば、系列生成処理において各穴次元のベッチ数系列が統合された1つのベッチ数系列が生成された場合にも、適切な時系列分析を実行できるようになる。
以上本発明の一実施の形態を説明したが、本発明はこれに限定されるものではない。例えば、上で説明した分析装置1の機能ブロック構成は実際のプログラムモジュール構成に一致しない場合もある。
また、上で説明した各テーブルの構成は一例であって、上記のような構成でなければならないわけではない。さらに、処理フローにおいても、処理結果が変わらなければ処理の順番を入れ替えることも可能である。さらに、並列に実行させるようにしても良い。
なお、上で述べた分析装置1は、コンピュータ装置であって、図20に示すように、メモリ2501とCPU2503とHDD2505と表示装置2509に接続される表示制御部2507とリムーバブル・ディスク2511用のドライブ装置2513と入力装置2515とネットワークに接続するための通信制御部2517とがバス2519で接続されている。オペレーティング・システム(OS:Operating System)及び本実施例における処理を実施するためのアプリケーション・プログラムは、HDD2505に格納されており、CPU2503により実行される際にはHDD2505からメモリ2501に読み出される。CPU2503は、アプリケーション・プログラムの処理内容に応じて表示制御部2507、通信制御部2517、ドライブ装置2513を制御して、所定の動作を行わせる。また、処理途中のデータについては、主としてメモリ2501に格納されるが、HDD2505に格納されるようにしてもよい。本発明の実施例では、上で述べた処理を実施するためのアプリケーション・プログラムはコンピュータ読み取り可能なリムーバブル・ディスク2511に格納されて頒布され、ドライブ装置2513からHDD2505にインストールされる。インターネットなどのネットワーク及び通信制御部2517を経由して、HDD2505にインストールされる場合もある。このようなコンピュータ装置は、上で述べたCPU2503、メモリ2501などのハードウエアとOS及びアプリケーション・プログラムなどのプログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。
以上述べた本発明の実施の形態をまとめると、以下のようになる。
本実施の形態の第1の態様に係る分析方法は、(A)時系列データに対するパーシステントホモロジ処理の結果に含まれるベッチ数系列を、複数の次元それぞれのベッチ数系列に分割し、(B)複数のベッチ数系列それぞれに対する分析を実行する処理を含む。
時系列分析が可能な対象の範囲を拡大する(例えば、時系列分析が可能な時系列データの種類を増やす)ことができるようになる。
また、パーシステントホモロジ処理は、アトラクタに含まれる各点を中心とする球の半径を時間の経過に従って拡大した場合におけるベッチ数を計数する処理であってもよい。
ベッチ数系列を適切に生成できるようになる。
また、分析を実行する処理において、(b1)複数のベッチ数系列それぞれに対する特異スペクトル変換により、時系列データの変化点検知を実行してもよい。
但し、変化点検知以外の時系列分析を実行してもよい。
また、分析を実行する処理において、(b2)複数のベッチ数系列それぞれの履歴行列及びテスト行列から、複数の次元それぞれの特異ベクトルを生成し、(b3)複数の次元それぞれについて、生成された特異ベクトルを用いて異常スコアを算出し、(b4)複数の次元それぞれについて算出された異常スコアを用いて、時系列データの変化点検知を実行してもよい。
適切な変化点を検知できるようになる。
また、異常スコアを算出する処理において、(b31)コサイン類似度、ユークリッド距離、マンハッタン距離又はDTW(Dynamic Time Warping)距離に基づき異常スコアを算出してもよい。
本実施の形態の第2の態様に係る分析装置は、(C)時系列データに対するパーシステントホモロジ処理の結果に含まれるベッチ数系列を、複数の次元それぞれのベッチ数系列に分割する分割部(実施の形態における算出部1051は上記分割部の一例である)と、(D)複数のベッチ数系列それぞれに対する分析を実行する分析部(実施の形態における推定部1053は上記分析部の一例である)とを有する。
なお、上記方法による処理をプロセッサに行わせるためのプログラムを作成することができ、当該プログラムは、例えばフレキシブルディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等のコンピュータ読み取り可能な記憶媒体又は記憶装置に格納される。尚、中間的な処理結果はメインメモリ等の記憶装置に一時保管される。
以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。
(付記1)
コンピュータに、
時系列データに対するパーシステントホモロジ処理の結果に含まれるベッチ数系列を、複数の次元それぞれのベッチ数系列に分割し、
前記複数のベッチ数系列それぞれに対する分析を実行する、
処理を実行させる分析プログラム。
(付記2)
前記パーシステントホモロジ処理は、前記アトラクタに含まれる各点を中心とする球の半径を時間の経過に従って拡大した場合におけるベッチ数を計数する処理である、
付記1記載の分析プログラム。
(付記3)
前記分析を実行する処理において、
前記複数のベッチ数系列それぞれに対する特異スペクトル変換により、前記時系列データの変化点検知を実行する、
付記1又は2記載の分析プログラム。
(付記4)
前記分析を実行する処理において、
前記複数のベッチ数系列それぞれの履歴行列及びテスト行列から、前記複数の次元それぞれの特異ベクトルを生成し、
前記複数の次元それぞれについて、生成された前記特異ベクトルを用いて異常スコアを算出し、
前記複数の次元それぞれについて算出された前記異常スコアを用いて、前記時系列データの変化点検知を実行する、
付記3記載の分析プログラム。
(付記5)
前記異常スコアを算出する処理において、
コサイン類似度、ユークリッド距離、マンハッタン距離又はDTW(Dynamic Time Warping)距離に基づき前記異常スコアを算出する、
付記4記載の分析プログラム。
(付記6)
コンピュータが、
時系列データに対するパーシステントホモロジ処理の結果に含まれるベッチ数系列を、複数の次元それぞれのベッチ数系列に分割し、
前記複数のベッチ数系列それぞれに対する分析を実行する、
処理を実行する分析方法。
(付記7)
時系列データに対するパーシステントホモロジ処理の結果に含まれるベッチ数系列を、複数の次元それぞれのベッチ数系列に分割する分割部と、
前記複数のベッチ数系列それぞれに対する分析を実行する分析部と、
を有する分析装置。
1 分析装置 101 受付部
103 生成部 105 分析部
1051 算出部 1053 推定部
111 パラメータ格納部 113 時系列データ格納部
115 系列データ格納部 117 異常スコア格納部
119 結果格納部

Claims (6)

  1. コンピュータに、
    時系列データに対するパーシステントホモロジ処理の結果に含まれるベッチ数系列を、複数の次元それぞれのベッチ数系列に分割し、
    前記複数のベッチ数系列それぞれに対する分析を実行する、
    処理を実行させる分析プログラム。
  2. 前記パーシステントホモロジ処理は、前記アトラクタに含まれる各点を中心とする球の半径を時間の経過に従って拡大した場合におけるベッチ数を計数する処理である、
    請求項1記載の分析プログラム。
  3. 前記分析を実行する処理において、
    前記複数のベッチ数系列それぞれに対する特異スペクトル変換により、前記時系列データの変化点検知を実行する、
    請求項1又は2記載の分析プログラム。
  4. 前記分析を実行する処理において、
    前記複数のベッチ数系列それぞれの履歴行列及びテスト行列から、前記複数の次元それぞれの特異ベクトルを生成し、
    前記複数の次元それぞれについて、生成された前記特異ベクトルを用いて異常スコアを算出し、
    前記複数の次元それぞれについて算出された前記異常スコアを用いて、前記時系列データの変化点検知を実行する、
    請求項3記載の分析プログラム。
  5. コンピュータが、
    時系列データに対するパーシステントホモロジ処理の結果に含まれるベッチ数系列を、複数の次元それぞれのベッチ数系列に分割し、
    前記複数のベッチ数系列それぞれに対する分析を実行する、
    処理を実行する分析方法。
  6. 時系列データに対するパーシステントホモロジ処理の結果に含まれるベッチ数系列を、複数の次元それぞれのベッチ数系列に分割する分割部と、
    前記複数のベッチ数系列それぞれに対する分析を実行する分析部と、
    を有する分析装置。
JP2017133558A 2017-07-07 2017-07-07 分析方法、分析装置及び分析プログラム Active JP7069581B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017133558A JP7069581B2 (ja) 2017-07-07 2017-07-07 分析方法、分析装置及び分析プログラム
US16/028,915 US11023562B2 (en) 2017-07-07 2018-07-06 Analysis method, analysis device, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017133558A JP7069581B2 (ja) 2017-07-07 2017-07-07 分析方法、分析装置及び分析プログラム

Publications (2)

Publication Number Publication Date
JP2019016193A true JP2019016193A (ja) 2019-01-31
JP7069581B2 JP7069581B2 (ja) 2022-05-18

Family

ID=64903228

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017133558A Active JP7069581B2 (ja) 2017-07-07 2017-07-07 分析方法、分析装置及び分析プログラム

Country Status (2)

Country Link
US (1) US11023562B2 (ja)
JP (1) JP7069581B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210311009A1 (en) * 2018-07-31 2021-10-07 Nec Corporation Information processing apparatus, control method, and non-transitory storage medium

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017010397A1 (ja) * 2015-07-15 2017-01-19 国立大学法人大阪大学 画像解析装置、画像解析方法、画像解析システム、画像解析プログラム、および記録媒体
WO2020195258A1 (ja) * 2019-03-26 2020-10-01 国立大学法人大阪大学 画像解析方法、画像解析プログラム、記録媒体、画像解析装置、画像解析システム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2010087112A1 (ja) * 2009-01-27 2012-07-26 国立大学法人大阪大学 画像解析装置、画像解析方法、画像解析プログラムおよび記録媒体
JP2017097643A (ja) * 2015-11-25 2017-06-01 富士通株式会社 機械学習プログラム、機械学習方法及び情報処理装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4953239B2 (ja) 2006-12-11 2012-06-13 インターナショナル・ビジネス・マシーンズ・コーポレーション 観測対象の異常を検出する技術
JP2010087112A (ja) 2008-09-30 2010-04-15 Mitsubishi Paper Mills Ltd セパレータ及びそれを具備してなる固体電解コンデンサ

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2010087112A1 (ja) * 2009-01-27 2012-07-26 国立大学法人大阪大学 画像解析装置、画像解析方法、画像解析プログラムおよび記録媒体
JP2017097643A (ja) * 2015-11-25 2017-06-01 富士通株式会社 機械学習プログラム、機械学習方法及び情報処理装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CASSIO M.M. PEREIRA,外1名: ""Persistent homology for time series and spatial data clustering"", EXPERT SYSTEMS WITH APPLICATIONS 42, JPN6021012231, September 2015 (2015-09-01), pages 6026 - 6038, ISSN: 0004634254 *
井手 剛, 「入門 機械学習による異常検知 Rによる実践ガイド」, JPN6021044249, 13 March 2015 (2015-03-13), pages 199 - 203, ISSN: 0004634252 *
前原 宗太朗,外3名: "「気象時系列データにおける変化点検知の基礎検討」", 一般社団法人 人工知能学会 第31回全国大会論文集DVD [DVD−ROM], JPN6021044245, 26 May 2017 (2017-05-26), pages 1 - 4, ISSN: 0004634253 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210311009A1 (en) * 2018-07-31 2021-10-07 Nec Corporation Information processing apparatus, control method, and non-transitory storage medium

Also Published As

Publication number Publication date
US11023562B2 (en) 2021-06-01
US20190012297A1 (en) 2019-01-10
JP7069581B2 (ja) 2022-05-18

Similar Documents

Publication Publication Date Title
JP6606997B2 (ja) 機械学習プログラム、機械学習方法及び情報処理装置
US20150317563A1 (en) Predicting application performance on hardware accelerators
JP6816481B2 (ja) 削減条件特定方法、削減条件特定プログラム及び削減条件特定装置
JP7069581B2 (ja) 分析方法、分析装置及び分析プログラム
US10635078B2 (en) Simulation system, simulation method, and simulation program
JP6950504B2 (ja) 異常候補抽出プログラム、異常候補抽出方法および異常候補抽出装置
Stief et al. Fault diagnosis using interpolated Kernel density estimate
JPWO2008111349A1 (ja) 生存分析システム、生存分析方法および生存分析用プログラム
JP6992291B2 (ja) 状態識別方法、状態識別装置及び状態識別プログラム
US11640553B2 (en) Method for analyzing time-series data based on machine learning and information processing apparatus
US20210390623A1 (en) Data analysis method and data analysis device
US20220350987A1 (en) Feature amount extraction device, time-sequential inference apparatus, time-sequential learning system, time-sequential feature amount extraction method, time-sequential inference method, and time-sequential learning method
JP2021033711A (ja) 異常検知装置、異常検知方法、及びプログラム
KR102546340B1 (ko) 노이즈 필터를 이용한 이상치 탐지 방법 및 장치
JPWO2020026327A1 (ja) 情報処理装置、制御方法、及びプログラム
US10692256B2 (en) Visualization method, visualization device, and recording medium
JP7040065B2 (ja) 検出プログラム、検出方法および検出装置
US20210248847A1 (en) Storage medium storing anomaly detection program, anomaly detection method, and anomaly detection apparatus
US20190180180A1 (en) Information processing system, information processing method, and recording medium
JP7310884B2 (ja) パラメータ推定装置、パラメータ推定方法、及びパラメータ推定プログラム
JP2010250391A (ja) データ分類方法及び装置及びプログラム
Ravier et al. GeoStat Representations of Time Series for Fast Classification
Swenson et al. Comparative methods and phylogenetic signal
Simon et al. Denoising Gradient Descent in Variational Quantum Algorithms
Ayyıldız et al. Is it necessary to apply the outlier detection for protein-protein interaction data?

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200409

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210325

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210413

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220405

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220418

R150 Certificate of patent or registration of utility model

Ref document number: 7069581

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150