JP4148524B2 - 相関性を評価するシステム、および、その方法 - Google Patents

相関性を評価するシステム、および、その方法 Download PDF

Info

Publication number
JP4148524B2
JP4148524B2 JP2005299028A JP2005299028A JP4148524B2 JP 4148524 B2 JP4148524 B2 JP 4148524B2 JP 2005299028 A JP2005299028 A JP 2005299028A JP 2005299028 A JP2005299028 A JP 2005299028A JP 4148524 B2 JP4148524 B2 JP 4148524B2
Authority
JP
Japan
Prior art keywords
time
series data
value
correlation
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005299028A
Other languages
English (en)
Other versions
JP2007108998A (ja
Inventor
剛 井手
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2005299028A priority Critical patent/JP4148524B2/ja
Priority to US11/548,278 priority patent/US7702714B2/en
Publication of JP2007108998A publication Critical patent/JP2007108998A/ja
Application granted granted Critical
Publication of JP4148524B2 publication Critical patent/JP4148524B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Description

本発明は、相関性を評価するシステム、および、その方法に関する。特に、本発明は、複数の時系列データの相関性を評価するシステム、および、その方法に関する。
ある観測対象の内部に生じた障害を検出するためには、観測対象の各部から観測される観測データの相関関係を解析することが有効である。例えば、観測対象が自動車である場合においては、その自動車のギア位置のみを観測しても自動車の障害を検出しにくい。むしろ、自動車のギア位置がある位置である場合において、他の観測データ、例えばエンジンの回転数がどのような値となるかを検出することによって、その自動車の内部に生じた障害を検出できる場合が多い。
従来、連続値を採る複数の変数について、それらの間の相関関係を共分散行列に基づいて解析する技術が広く用いられている。この技術によれば、ある変数の変数値が大きい時には他の変数の変数値も大きくなる傾向があるというような、線形の相関を解析することができる。具体的には、観測データの時系列データをN次元のベクトル変数xとし、経験分布を以下の式(1)とした場合において、これについての平均を<・>と表すとすれば、共分散行列は<xx>と定義される。ただし、これ以降、データの平均は予めゼロに正規化されているものとする。また、相関係数行列Cの各要素は、以下の式(2)のように定義される。
Figure 0004148524
Figure 0004148524
これ以降、δは、観測データが連続値である場合にはディラックのデルタ関数を表すものとし、観測データが離散値である場合にはクロネッカーのデルタ関数を表すものとする。
非特許文献1および2については後述する。
犬井鉄郎、田辺行人、小野寺嘉孝、「応用群論」(裳華房, 1976) 竹村彰通、谷口正信、「統計学の基礎I」、(岩波書店、2003)
しかしながら、ある変数の組について共分散行列の要素がゼロとなる場合であっても、それらの変数に相関が無いとは限らない。例えば、経験分布が以下の式(3)により表される場合において、p(x|x)はxについて偶関数である。このため、以下の式(4)により、その相関係数は0となる。
Figure 0004148524
Figure 0004148524
しかしながら、式(3)から分かるように、これらの変数の変数値は、半径をrとする円周上に分布する。このように、共分散行列の要素がゼロとなる場合であっても、それらの変数の間には非常に強い相関関係が存在する場合がある。
また、近年、機械学習の分野では、非線形相関を取り込むための手法としてカーネル法が使われるようになってきている。カーネル法を応用すれば、共分散構造解析の基本量である〈xx〉を、カーネル関数Kを用いて〈K(x',x)〉に置き換える。これにより、カーネル主成分分析などを行うことができる。例えば、ベクトルxおよびy、自然数dを用いて、(xy)のように定義される多項式カーネルを考える。この例において、d=2とすれば、このカーネル関数は以下の式(5)によって表される非線形写像を定義している。
Figure 0004148524
即ち、内積Φ(x)Φ(y)が、カーネル関数と一致している。従って、共分散行列の拡張として〈Φ(x)Φ(y)〉のような量を考えることができ、この行列に対して主成分分析を行うことができる。この行列によれば、結果として非線形の相関にも反応する指標値を得ることができる。なお、式(5)は例示であって、Φ(x)は、この例のように明示的に記述できないような式であってもよい。
しかしながら、カーネル法においては、非線形性の取り込みが、カーネル関数というブラックボックスの陰で行われている。即ち、カーネル法は、非線形性の取り込みの一般的な方法を示しているのみであり、変数間の相関関係を検出するために効果的な非線形性を検出することはできなかった。
そこで本発明は、上記の課題を解決することのできるシステム、方法およびプログラムを提供することを目的とする。この目的は特許請求の範囲における独立項に記載の特徴の組み合わせにより達成される。また従属項は本発明の更なる有利な具体例を規定する。
上記課題を解決するために、本発明においては、複数の時系列データの相関性を評価するシステムであって、複数の時系列データの間に存在する非線形の相関性を示す特徴量を算出する算出部と、算出された特徴量に基づいて、複数の時系列データの間の相関性を評価する評価部とを備えるシステム、方法およびプログラムを提供する。
算出部は、複数の時系列データに含まれるデータ値を、各座標軸が各時系列データのデータ値を示す多次元空間にプロットしたグラフにおいて、当該グラフによって描かれる図形の対称性を示す特徴量を算出してもよい。
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではなく、これらの特徴群のサブコンビネーションもまた、発明となりうる。
本発明によれば、複数の時系列データについて、これまでの技術では検出できなかった相関関係を検出することができる。
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
図1は、情報処理システム10の全体構成を示す。情報処理システム10は、データベース20と、解析システム30と、利用者端末50とを有する。データベース20は、観測対象である自動車の各部分を時間の経過に応じて順次観測した結果得られる複数の観測データを含む。この観測データは、例えば、自動車の走行中に自動車のある部分に取り付けたセンサーによって時々刻々と観測された観測値を蓄積した時系列データである。観測の対象は、例えば、自動車のエンジンの回転数、シフトレバーのシフト位置、または、制御用CPUの使用率などであってもよい。
解析システム30は、複数の観測データの相関性を評価する。利用者端末50は、解析システム30の指示に基づき相関性を利用者に表示する。本実施例に係る解析システム30は、これら複数の観測データについて、これまで適切に検出できなかった非線形の相関を検出して、自動車などに発生した異常の原因箇所を探し出し易くすることを目的とする。
図2は、データベース20に含まれる観測データの一例を示す。データベース20は、観測対象に含まれる複数の部分の各々の観測データを含む。図2(a)は、この観測データを時系列データとして示している。例えば、第1観測部分の観測値は、0から100までの値を比較的長い周期で増減を繰り返している。また、第2観測部分の観測値は、14前後の値を短い周期で増減しており、しばしば13付近の値に減少している。なお、本例において観測値は無単位のデータであるが、実際には、回数、重さ、長さ、および、大きさ等の単位を有するデータであってもよい。
図2(b)は、この観測データを確率密度分布として示す。本図の横軸は観測値を示し、縦軸は、各観測値が観測された回数や頻度を示す。例えば、第1観測部分の観測値は、概ね100または0の2つの値を採り、その間の値とはなりにくい。また、第2観測部分の観測値は、概ね14程度の値を採ることが多く、その他の値を採る頻度は、値が14程度から離れるにつれてなだらかに低下する。
図3は、解析システム30の機能構成を示す。解析システム30は、取得部300と、算出部310と、評価部320と、記録部330と、表示制御部340とを有する。取得部300は、複数の観測データをデータベース20から取得する。算出部310は、各々の観測データと、他の各々の観測データとの各組み合わせについて、当該観測データおよび当該他の観測データの間に存在する非線形の相関性を示す特徴量を算出する。例えば、算出部310は、これら複数の観測データに含まれる値を、各座標軸が各観測データのデータ値を示す多次元空間にプロットしたグラフにおいて、そのグラフによって描かれる図形の対称性を示す特徴量を算出する。
評価部320は、算出されたその特徴量に基づいて、複数の観測データの間の相関性を評価する。例えば、評価部320は、算出された各々の特徴量に基づいて、観測対象に生じた異常の原因部分を検出してもよい。記録部330は、正常な観測対象の各部分を時間の経過に応じて順次観測した結果得られる複数の観測データについて、各々の観測データと、他の各々の観測データとの間に存在する相関性を示す特徴量を予め記録している。
表示制御部340は、x軸に各々の観測データを対応付け、かつ、y軸の他の各々の観測データを対応付けた2次元座標平面を表示する。そして、表示制御部340は、各々の観測データおよび他の各々の観測データの組み合わせについて算出された特徴量の差分値を示す図形を、2次元座標平面上に表示する。表示制御部340は、この座標平面上の図形を、例えば、利用者端末50の画面上に表示してもよい。
図4は、記録部330に記録された観測データの一例を示す。図4(a)は、正常な観測対象の各部分を時間の経過に応じて順次観測した結果得られる複数の観測データをグラフとして示す。図4(b)は、正常な観測対象の観測データに含まれる観測値を確率密度分布として示す。記録部330は、このような時系列データを観測データとして記録していてもよい。
図4(c)は、正常な観測対象の各部分を時間の経過に応じて順次観測した結果得られる複数の観測データについて、各々の観測データと、他の各々の観測データとの間に存在する相関性を示す。本図の右上の図形は、第1部分から観測された観測値をy座標とし、それと同時刻に第2部分から観測された観測値をx座標とし、各時刻に観測された観測値の組をプロットしたグラフを示す。同様に、本図の左下の図形は、第1部分から観測された観測値をx座標とし、それと同時刻に第2部分から観測された観測値をy座標とし、各時刻に観測された観測値の組をプロットしたグラフを示す。
ある観測部分とそれ自体との相関を判断する必要はないが、説明の便宜上、左上および右下に、第1観測部分がそれ自体と相関する相関性、および、第2観測部分がそれ自体と相関する相関性を示すグラフを示す。例えば、明らかに、第1観測部分はそれ自体との間で、線形的な正の相関を有する。このため、第1観測部分の観測値をx軸およびy軸の各々に対応付けた2次元平面上に観測値をプロットしたグラフは、傾き1の正比例のグラフとなる。また、第2観測部分についても同様に、第2観測部分はそれ自体との間で線形的な正の相関を有する。
一方で、第1観測部分の観測値と、第2観測部分の観測値とを、2次元平面上にプロットした場合において、プロットされた各点は、概ね傾きが−1の直線の近傍に分布する。このように、複数の観測データの各々を座標軸に対応付けた多次元空間上に描かれた図形の形状によって、それらの観測データの間に存在する相関をある程度うかがい知ることができる。記録部330は、正常時における各々の観測データと、他の各々の観測データとの相関性を示す特徴量として、このような図形の対称性に基づく特徴量を記録している。
図5は、取得部300により取得される観測データを2次元平面上にプロットしたグラフの一例を示す。図4(c)と同様に、本図の右上の図形は、第1部分から観測された観測値をy座標とし、それと同時刻に第2部分から観測された観測値をx座標とし、各時刻に観測された観測値の組をプロットしたグラフを示す。同様に、本図の左下の図形は、第1部分から観測された観測値をx座標とし、それと同時刻に第2部分から観測された観測値をy座標とし、各時刻に観測された観測値の組をプロットしたグラフを示す。但し、図4(c)とは異なり、これらの観測値は、自動車における、異常の発生が疑われている部分から観測されている。
図4(c)および図5を見比べると、相関性を示すグラフによって描かれる図形の形状が異なっている。このため、第1観測部分および第2観測部分の間に存在する相関は、正常時と異常の発生が疑われている時とで異なっているようである。従って、第1観測部分および第2観測部分は、自動車に生じた異常の原因部分であると考えることもできる。しかしながら、自動車などの高度に複雑化された製品をテストする場合には、同じ正常時であっても、そのテストの環境によって観測データが微妙に異なる場合も多い。このため、図形の形状が相違しているからといって、直ちにその部分が異常の発生部分であると断定できない。従って、熟練した技術者であっても、グラフの形状を見比べることによって異常の発生を判断することは困難である。本実施例に係る解析システム30によれば、相関性を示すグラフによって描かれる図形の特徴量を算出することによって、相関性の相違を適切に判断し、異常解析を支援することができる。
図6は、表示制御部340により利用者端末50に表示される表示画面の一例を示す。表示制御部340は、画面上にウィンドウ600およびウィンドウ610を表示する。表示制御部340は、ウィンドウ600内に、表形式の2次元座標平面を表示する。そして、表示制御部340は、2次元座標平面上のx軸に各々の観測データを対応付け、かつ、y軸に他の各々の観測データを対応付けて表示する。具体的には、表示制御部340は、x軸上に、各観測データの観測部部分の番号(1、2、3、4、5…)を表示する。同様に、表示制御部340は、y軸上に、各観測データの観測部分の番号(1、2、3、4、5…)を表示する。
そして、表示制御部340は、各々の観測データおよび他の各々の観測データの組み合わせについて算出された特徴量の差分値を示す図形を、その2次元座標平面上に表示する。例えば、本図の例において、表示制御部340は、その差分値が予め定められた基準値よりも大きいことを条件に、対応する座標上に記号「*」を表示する。これに代えて、表示制御部340は、特徴量の差分値が大きくなるのに従って、より濃い赤色の図形を表示してもよい。これにより、異常の発生が疑われる部分をサーモグラフィーのように直感的に表示して、利用者の注意を喚起することができる。
また、表示制御部340は、2次元平面上のある図形が利用者によってクリックされたことに応じて、正常時の相関を示すグラフ、および、異常が疑われている時の相関を示すグラフを並べてウィンドウ610に表示する。例えば、第1観測部分および第2観測部分の組に対応する図形がクリックされたことに応じ、表示制御部340は、第1観測部分および第2観測部分の相関を示すグラフを表示する。これによって、利用者は、異常の疑われている観測部分を直感的に把握して、必要に応じて更に詳細に原因を検討することができる。
図7は、解析システム30の動作を示すフローチャートの一例を示す。取得部300は、複数の観測データをデータベース20から取得する(S700)。算出部310は、各々の観測データと、他の各々の観測データとの各組み合わせについて、当該観測データおよび当該他の観測データの間に存在する非線形の相関性を示す特徴量を算出する(S710)。具体的には、算出部310は、これら複数の観測データに含まれる値を、各座標軸が各観測データのデータ値を示す多次元空間にプロットしたグラフにおいて、そのグラフによって描かれる図形の対称性を示す特徴量を算出する。
以下、その算出方法を述べる。算出部310は、グラフによって描かれる図形と、その図形に対して非線形の相関性を検出できるよう予め定められた複数の特徴量を算出する。
発明者らは、理論的検討の結果、その特徴量は、2体の交差キュムラントとすることが望ましいことを見出した。キュムラントは統計学における基本的な統計量であって、その定義は、たとえば、上述の非特許文献2に記載されている。多変量系においては、キュムラントは、「xの2乗とxの1乗のキュムラント」のように、異なる変数をまたぐものになりえる。以下、キュムラントを表す記号として〈・〉を使うことにする。これを用いると、上記のキュムラントは〈x と書ける。この〈 〉の中に入る異なる変数の種類がちょうど2である時、これを、2体の交差キュムラント(もしくは2体のクロスキュムラント)と呼ぶ。〈xのようなものは、2体とも「交差(クロス)」とも呼ばないので注意する。
2体のクロスキュムラントについて重要な事実は、まず、もし二つの変数が統計的に独立であれば、その値がゼロになることである。たとえば、二つの変数が、非相関のガウス分布に従う場合、任意の次数の2体交差キュムラントはゼロになる。また、両者が一様分布であるときもゼロになる。実データはしばしばノイジーであるため、このような性質は、ノイズへの頑強性の観点から実用上望ましい。次に、通常の共分散が(平均値がゼロに規格化されていてもいなくても)、たとえばxiとxについて、〈xと表せることである。
従来は、最低次の2体交差キュムラントが、共分散という名前で使われてきた。しかし、その非線形拡張の方法については、確立した手法はなかった。発明者らは、上記ふたつの事実から、非線形相関を記述するために適した量として、高次(例えば次数の合計が3次以上)の2体交差キュムラントが、共分散を一般化した量として有用であることを見出した。
しかしながら、2体の交差キュムラントは、aとbを正数にして、一般に〈x bという形をとり、aおよびbの値に応じて無数に定義することができる。一般の相関関係を、無数の2体交差キュムラントで表すのは明らかに冗長であるし、実用性にも欠ける。
発明者は、理論的検討の結果、群の既約表現を用いることで、その無数の2体交差キュムラントを有限個に自然に分類できることを見出した。そしてそれを用いて、非線形の相関性を定量的に把握するための望ましい特徴量を定義できることを見出した。一般に群とは線形演算子の集合であって、その集合において定義された積演算に対して、閉包および結合律が成立し、また、その集合において単位元および逆元が存在するものを言う。また、一般に、群の既約表現の基底については直交性が成り立つことが知られている(非特許文献1を参照。)。
2体交差キュムラントは二つの変数を含む。このことから、対称操作を定義する空間として、2次元平面を考えることができる。また、自然な対象操作として回転と鏡映を考えることができる。このとき、2次元平面における最も一般的な群は、C4v群と呼ばれる。
以下においては、対称操作の集合がC4v群を構成する場合について説明するが、本発明の本質的な部分は、特にC4v群に限られるものではなく、任意の有限群について当てはまる。たとえば、対称操作を定義する空間として、3次元以上のものを考えることができるし、また、1次元の空間を考えることもできる。
一般に、適切な表現空間を選ぶことによって、群の対称操作のそれぞれは行列と対応付けられることが知られている。その行列を、対称操作の表現行列と呼び、その表現行列の対角和を指標と呼ぶ。既約表現は、指標により一意的に分類できることが知られている。したがって、C4v群の任意の表現が、既約表現に属するかどうか、また、属するとすればどの表現に属するかは、指標を使って判定できる。図8は、C4v群の指標の表を示す。なお、同様の表は、非特許文献1にも記載されている。本図の各列には、C4v群を構成する複数の異なる対称操作を示されている。本図の各列は、C4v群を構成する複数の異なる対称操作を示す。対称操作は、I、C(C )、C、σ(σ)、および、σξ(ση)から構成され、これらは群を構成する。Iは恒等変換を示し、Cは、原点を中心とした角度π/2の回転操作を示し、C は、原点を中心とした角度πの回転操作を示し、C原点を中心とした角度3π/2の回転操作を示し、σは、x−z軸平面に対する鏡像を示し、σξは、原点を中心とした45度の回転操作を示す。
本図の各行は、これらの対称操作によって構成される群の既約表現の指標を示す。C4v群においては、既約表現は、A、A、B、B、および、Eという5種類しかないことが知られており、それぞれが各行にあたる。例えば、基底Aに対応する指標は、恒等変換、鏡像、および、何れの回転操作によっても同一の1という値を採る。
算出部310は、以上の各基底に対応する特徴量を、複数の観測データの各々を変数値とする複数のベクトル型の変数について、これら複数の変数のクロスキュムラントの線形結合によって算出する。より詳細には、算出部310は、第1の観測データを第1の変数(例えばx)の変数値とし、第2の観測データを第2の変数(例えばx)の変数値とし、1次以上の第1の変数、および、1次以上の第2の変数のクロスキュムラントの線形結合によってその特徴量を算出する。また、算出部310は、変数xおよび変数xの値を、特徴量の算出に先立って、平均0および分散1に正規化することが望ましい。
例えば、算出部310は、以下の式(6)から式(10)によって特徴量を算出する。
Figure 0004148524
Figure 0004148524
Figure 0004148524
Figure 0004148524
Figure 0004148524
ここで、Cij(B)は、基底Bに対応する特徴量を示し、Cij(B)は、基底Bに対応する特徴量を示す。また、Cij(A)は、基底Aに対応する特徴量を示し、Cij(A)は、基底Aに対応する特徴量を示す。Cij(E)とCij(E)は、基底Eに対応する特徴量を現す。〈・〉は、クロスキュムラントを示す。また、変数xは、ある観測データを変数値とするベクトル型の変数である。この観測データは、例えば、自動車の第1観測部分から観測された観測値の集合である。また、変数xは、他の観測データを変数値とするベクトル型の変数である。この観測データは、例えば、自動車の第2観測部分から観測された観測値の集合である。
図8を用いることで、それぞれが指定した既約表現に属していることを確認することができる。たとえばA1表現を考える。クロスキュムラントの定義から、〈x =〈x 〉−〈x 〉〈x 〉−2〈x〉が成り立つ。ここで〈・〉は平均を表す。第1項については、たとえば、対称操作Cに対して、対称操作の定義から、〈(−x(−x〉のように変換される。しかし、結局これは何の変化も与えない。第2、第3項についても同様なことが成り立つ。C4v群に属する他の対称操作に対しても同様に調べると、結局、〈x は、C4v群の任意の対称操作に対して不変であることが分かる。任意の対称操作に対して不変ということは、任意の対称操作に対して表現行列が1(正確には1行1列の単位行列)となるということであるから、指標は任意の対称操作に対して1である。図8においてこれを満たすものは、A1表現である。
同様にして、式(6)から式(10)に示した量が、指定された対称性を持つことを確認することができる。
式(6)に示す量は、通常の共分散に他ならない。すなわち、発明者らは、通常の共分散が、実はC4v群のB2既約表現に属するという知見を足がかりに、今まで用いられていなかったほかの既約表現を相関の特徴量として有効に使えることを見出したのである。
先に述べたとおり、この種の数学的論法は、C4v群に限られるものではない。複数の変数の相関を表すパターンが与えられた時、そのパターンを、群を使って特徴付けることができる。具体的には、群の既約表現を実現するような特徴量を定義することにより、そのパターンを定量的に記述できる。
一般に、xの次数およびxの次数が高いと外れ値の影響を受けやすいため、低次のものを使うことが好ましい。発明者らの検討の結果、xの次数およびxの次数は、それぞれを正数として合計4以下が好ましいことが見出された。しかし発明はこの4次以下という制限に限られるものではない。外れ値の少ないデータに関しては、高次の交差キュムラントを使って、同様な特徴量を定義することもできる。
また、好ましくは、算出部310は、各基底に対応する特徴量を求めるための変数の次数を同一とするために、算出された特徴量を、更に、式(11)によって除算してもよい。
Figure 0004148524
この式において、kはキュムラントの次数である。即ち、算出部310は、式(6)を、k=2とする式(11)によって除算し、式(7)および式(8)を、k=3とする式(11)によって除算する。また、算出部310は、式(9)および式(10)を、k=4とする式(11)によって除算する。
図7に戻る。続いて、評価部320は、算出された特徴量に基づいて、複数の観測データの間の相関性を評価する(S720)。例えば、評価部320は、記録部330に記録されている特徴量と、算出部310によって算出された特徴量との差分値が、予め定められた基準値よりも大きい観測データの組み合わせを、観測対象に生じた異常の原因部分を示す観測データの組み合わせとして検出してもよい。この検出結果は、既に図6で述べたように、2次元平面上の図形や色としてウィンドウ600内に表示される(S730)。表示制御部340は、2次元平面上のある部分が選択されたことに応じ(S740:YES)、その部分に対応する観測データの相関性を示すグラフをウィンドウ610内に表示する(S750)。
以上、本図に示す処理によれば、観測データ間の相関性に基づいて異常の原因箇所の候補を直感的に表示することができる。
図9は、観測データの特徴量の具体例を示す。(a)は、変数xが変数xとの間で負の線形相関を有する場合において、これらの変数の変数値をプロットした結果として得られるグラフを示す。(f)は、(a)に対応しており、このグラフによって描かれる図形の対称性を示す特徴量を示している。この図形は、いわゆる逆相関の関係にあるから、基底Bに対応する特徴量は−1という周知の値を採る。
(b)は、(a)とは異なる場合について、変数xの変数値と変数xの変数値とをプロットした結果として得られるグラフを示す。(g)は、(b)に対応しており、このグラフによって描かれる図形の対称性を示す特徴量を例示している。(b)に示すように、これらの変数の変数値によって円形の図形が描かれている。これは、2つの変数に強い相関があるにもかかわらず通常の相関係数がゼロとなる古典的な例であって、実際、従来の共分散(B2)においては、その値はゼロとなっている。すなわち、二つの変数の相関について、なんら情報を与えない。しかしながら、A1に対応する特徴量は、非ゼロの値を採っており、相関を測る定量的な指標になりえていることが見て取れる。
(c)は、更に異なる場合について、変数xの変数値と変数xの変数値とをプロットした結果として得られるグラフを示す。(h)は、(c)に対応しており、このグラフによって描かれる図形の対称性を示す特徴量を例示している。この場合も、伝統的な共分散であるB2特徴量は、2つの変数の相関について何の情報も与えない。一方、新たに定義された特徴量のうち、E1およびE2が相関の指標として有意な値を与えていることが分かる。
(d)は、更に異なる場合について、変数xの変数値と変数xの変数値とをプロットした結果として得られるグラフを示す。(i)は、(d)に対応しており、このグラフによって描かれる図形の特徴量を例示している。この場合も、伝統的な共分散であるB2特徴量は、2つの変数の相関について何の情報も与えない。一方、新たに定義された特徴量のうち、E1およびE2が相関の指標として有意な値を与えていることが分かる。
(e)は、更に異なる場合について、変数xの変数値と変数xの変数値とをプロットした結果として得られるグラフを示す。(j)は、(e)に対応しており、このグラフによって描かれる図形の特徴量を例示している。この場合も、伝統的な共分散であるB2特徴量は、2つの変数の相関について何の情報も与えない。一方、新たに定義された特徴量のうち、A2が相関の指標として有意な値を与えていることが分かる。
このように、本実施例において算出される特徴量によれば、各変数を座標値とした多次元空間上に図形として表される相関性を、適切に捉えることができる。
図10は、算出される特徴量の性質を示すグラフである。このグラフは、式(6)から式(10)のxをxとみなし、xをyとみなし、これらの式の値をz座標の値としたものである。図10(a)は、基底Bの主要項の性質を示す。aおよびbを実数とした時、交差キュムラント〈x の主要項とは、x のことである。図においては簡単のため、xiをx、xをyと表している。すなわち、縦軸をzと表すと、図(a)は、z=xyという曲面を図示したものである。図10(b)および(c)は、基底Eおよび基底Eの主要項の図示である。この基底に対応する特徴量は、図示のように、分布の非対称性を特徴付けることができると考えられる。
図10(d)は、基底Aの主要項の図示である。この基底に対応する特徴量は、図示のように、ドーナツ型の分布を特徴付けることができると考えられる。また、図10(e)は、基底Aの主要項の図示である。この基底に対応する特徴量は、図示のように、まんじ形のようなややゆがんだ相関を特徴付けることができると考えられる。
図11は、解析システム30として機能する情報処理装置500のハードウェア構成の一例を示す。情報処理装置500は、ホストコントローラ1082により相互に接続されるCPU1000、RAM1020、及びグラフィックコントローラ1075を有するCPU周辺部と、入出力コントローラ1084によりホストコントローラ1082に接続される通信インターフェイス1030、ハードディスクドライブ1040、及びCD−ROMドライブ1060を有する入出力部と、入出力コントローラ1084に接続されるROM1010、フレキシブルディスクドライブ1050、及び入出力チップ1070を有するレガシー入出力部とを備える。
ホストコントローラ1082は、RAM1020と、高い転送レートでRAM1020をアクセスするCPU1000及びグラフィックコントローラ1075とを接続する。CPU1000は、ROM1010及びRAM1020に格納されたプログラムに基づいて動作し、各部の制御を行う。グラフィックコントローラ1075は、CPU1000等がRAM1020内に設けたフレームバッファ上に生成する画像データを取得し、表示装置1080上に表示させる。これに代えて、グラフィックコントローラ1075は、CPU1000等が生成する画像データを格納するフレームバッファを、内部に含んでもよい。
入出力コントローラ1084は、ホストコントローラ1082と、比較的高速な入出力装置である通信インターフェイス1030、ハードディスクドライブ1040、及びCD−ROMドライブ1060を接続する。通信インターフェイス1030は、ネットワークを介して外部の装置と通信する。ハードディスクドライブ1040は、情報処理装置500が使用するプログラム及びデータを格納する。CD−ROMドライブ1060は、CD−ROM1095からプログラム又はデータを読み取り、RAM1020又はハードディスクドライブ1040に提供する。
また、入出力コントローラ1084には、ROM1010と、フレキシブルディスクドライブ1050や入出力チップ1070等の比較的低速な入出力装置とが接続される。ROM1010は、情報処理装置500の起動時にCPU1000が実行するブートプログラムや、情報処理装置500のハードウェアに依存するプログラム等を格納する。フレキシブルディスクドライブ1050は、フレキシブルディスク1090からプログラム又はデータを読み取り、入出力チップ1070を介してRAM1020またはハードディスクドライブ1040に提供する。入出力チップ1070は、フレキシブルディスク1090や、例えばパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して各種の入出力装置を接続する。
情報処理装置500に提供されるプログラムは、フレキシブルディスク1090、CD−ROM1095、又はICカード等の記録媒体に格納されて利用者によって提供される。プログラムは、入出力チップ1070及び/又は入出力コントローラ1084を介して、記録媒体から読み出され情報処理装置500にインストールされて実行される。プログラムが情報処理装置500等に働きかけて行わせる動作は、図1から図10において説明した解析システム30における動作と同一であるから、説明を省略する。
以上に示したプログラムは、外部の記憶媒体に格納されてもよい。記憶媒体としては、フレキシブルディスク1090、CD−ROM1095の他に、DVDやPD等の光学記録媒体、MD等の光磁気記録媒体、テープ媒体、ICカード等の半導体メモリ等を用いることができる。また、専用通信ネットワークやインターネットに接続されたサーバシステムに設けたハードディスク又はRAM等の記憶装置を記録媒体として使用し、ネットワークを介してプログラムを情報処理装置500に提供してもよい。
以上、本実施例に係る情報処理システム10によれば、複数の時系列データについて、これまでの技術では検出できなかった相関関係を検出することができる。この相関関係は、時系列データを座標平面上にプロットすることによって描かれる図形の特徴量によって評価される。このため、これまで一般的に用いられた線形の相関関係のみならず、非線形の相関関係までをも適切に評価することができる。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
図1は、情報処理システム10の全体構成を示す。 図2は、データベース20に含まれる観測データの一例を示す。 図3は、解析システム30の機能構成を示す。 図4は、記録部330に記録された観測データの一例を示す。 図5は、取得部300により取得される観測データを2次元平面上にプロットしたグラフの一例を示す。 図6は、表示制御部340により利用者端末50に表示される表示画面の一例を示す。 図7は、解析システム30の動作を示すフローチャートの一例を示す。 図8は、C4v群の指標の表を示す。 図9は、観測データの特徴量の具体例を示す。 図10は、算出される特徴量の性質を示すグラフである。 図11は、解析システム30として機能する情報処理装置500のハードウェア構成の一例を示す。
符号の説明
10 情報処理システム
20 データベース
30 解析システム
50 利用者端末
300 取得部
310 算出部
320 評価部
330 記録部
340 表示制御部
500 情報処理装置
600 ウィンドウ
610 ウィンドウ

Claims (16)

  1. 複数の時系列データの相関性を評価するシステムであって、
    観測対象の各部分を時間の経過に応じて順次観測した結果得られる複数の時系列データについて、各々の前記時系列データと、他の各々の前記時系列データとの各組み合わせについて、当該時系列データおよび当該他の時系列データの間に存在する非線形の相関性を示す特徴量を算出する算出部と、
    正常時における、各々の前記時系列データと、他の各々の前記時系列データとの間に存在する前記相関性を示す特徴量を予め記録している記録部と、
    記録されている特徴量と、前記算出部によって算出された特徴量との差分値が、予め定められた基準値よりも大きい時系列データの組み合わせを、前記観測対象に生じた異常の原因部分を示す時系列データの組み合わせとして検出する評価部と、
    を備えるシステム。
  2. 前記記録部は、正常な前記観測対象の各部分を時間の経過に応じて順次観測した結果得られる複数の時系列データについて、各々の当該時系列データと、他の各々の当該時系列データとの間に存在する前記相関性を示す特徴量を予め記録している請求項1に記載のシステム。
  3. 前記算出部は、前記複数の時系列データに含まれるデータ値を、各座標軸が各時系列データのデータ値を示す多次元空間にプロットしたグラフにおいて、当該グラフによって描かれる図形の対称性を示す特徴量を算出する
    請求項1または2に記載のシステム。
  4. 観測対象の各部分を時間の経過に応じて順次観測した結果得られる複数の時系列データを取得する取得部を更に備え、
    前記算出部は、各々の前記時系列データと、他の各々の前記時系列データとの各組み合わせについて、当該時系列データおよび当該他の時系列データの間に存在する非線形の相関性を示す前記特徴量を算出し、
    前記評価部は、算出された各々の前記特徴量に基づいて、前記観測対象に生じた異常の原因部分を検出する
    請求項1から3のいずれかに記載のシステム。
  5. 2次元座標平面上のx軸に各々の前記時系列データを対応付け、かつ、y軸に他の各々の前記時系列データを対応付けて、各々の前記時系列データおよび他の各々の前記時系列データの組み合わせについて算出された特徴量の前記差分値を示す図形を、前記2次元座標平面上に表示する表示制御部を更に備える
    請求項1または2に記載のシステム。
  6. 前記算出部は、複数の対称操作によって構成される群の既約表現毎に、前記複数の時系列データの間に存在する非線形の相関性を示す前記特徴量を算出し、
    前記評価部は、前記既約表現毎に算出された特徴量に基づいて、前記複数の時系列データの間の相関性を評価する
    請求項1または2に記載のシステム。
  7. 前記算出部は、複数の前記時系列データの各々を変数値とする複数のベクトル型の変数について、複数の前記変数のクロスキュムラントの線形結合によって前記特徴量を算出する
    請求項に記載のシステム。
  8. 前記算出部は、第1の前記時系列データを第1の前記変数の変数値とし、第2の前記時系列データを第2の前記変数の変数値とし、1次以上の前記第1の変数、および、1以上の前記第2の変数のクロスキュムラントの線形結合によって前記特徴量を算出する
    請求項に記載のシステム。
  9. 前記クロスキュムラントにおいて、前記第1の変数の次数および前記第2の変数の次数の合計は3以上かつ4以下である
    請求項に記載のシステム。
  10. 前記算出部は、第1の時系列データを変数xの変数値とし、第2の時系列データを変数xの変数値とし、
    Figure 0004148524
    Figure 0004148524
    Figure 0004148524
    および
    Figure 0004148524
    のうち、少なくとも何れか1つの式によって算出した値を、更に、
    Figure 0004148524
    によって除算することにより前記特徴量を算出する
    請求項に記載のシステム。
  11. 複数の時系列データの相関性を情報処理装置により評価する方法であって、
    観測対象の各部分を時間の経過に応じて順次観測した結果得られる複数の時系列データについて、各々の前記時系列データと、他の各々の前記時系列データとの各組み合わせについて、当該時系列データおよび当該他の時系列データの間に存在する非線形の相関性を示す特徴量を、前記情報処理装置により実現される算出部により算出する段階と、
    正常時における、各々の前記時系列データと、他の各々の前記時系列データとの間に存在する前記相関性を示す特徴量を前記情報処理装置の記録部に予め記録する段階と、
    記録されている特徴量と、前記算出部によって算出された特徴量との差分値が、予め定められた基準値よりも大きい時系列データの組み合わせを、前記観測対象に生じた異常の原因部分を示す時系列データの組み合わせとして、前記情報処理装置により実現される評価部により検出する段階と、
    を備える方法。
  12. 特徴量を前記情報処理装置の記録部に予め記録する前記段階は、正常な前記観測対象の各部分を時間の経過に応じて順次観測した結果得られる複数の時系列データについて、各々の当該時系列データと、他の各々の当該時系列データとの間に存在する前記相関性を示す特徴量を前記記録部に予め記録する請求項11に記載の方法。
  13. 2次元座標平面上のx軸に各々の前記時系列データを対応付け、かつ、y軸に他の各々の前記時系列データを対応付けて、各々の前記時系列データおよび他の各々の前記時系列データの組み合わせについて算出された特徴量の前記差分ねを示す図形を、前記情報処理装置により実現される表示制御部により、前記2次元座標平面上に表示する段階を更に備える請求項11または12に記載の方法。
  14. 複数の時系列データの相関性を評価するシステムとして、情報処理装置を機能させるプログラムであって、
    前記情報処理装置を、
    観測対象の各部分を時間の経過に応じて順次観測した結果得られる複数の時系列データについて、各々の前記時系列データと、他の各々の前記時系列データとの各組み合わせについて、当該時系列データおよび当該他の時系列データの間に存在する非線形の相関性を示す特徴量を算出する算出部と、
    正常時における、各々の前記時系列データと、他の各々の前記時系列データとの間に存在する前記相関性を示す特徴量を予め記録している記録部と、
    記録されている特徴量と、前記算出部によって算出された特徴量との差分値が、予め定められた基準値よりも大きい時系列データの組み合わせを、前記観測対象に生じた異常の原因部分を示す時系列データの組み合わせとして検出する評価部と、
    して機能させるプログラム。
  15. 前記記録部は、正常な前記観測対象の各部分を時間の経過に応じて順次観測した結果得られる複数の時系列データについて、各々の当該時系列データと、他の各々の当該時系列データとの間に存在する前記相関性を示す特徴量を予め記録している請求項14に記載のプログラム。
  16. 当該プログラムは、前記情報処理装置を、
    2次元座標平面上のx軸に各々の前記時系列データを対応付け、かつ、y軸に他の各々の前記時系列データを対応付けて、各々の前記時系列データおよび他の各々の前記時系列データの組み合わせについて算出された特徴量の前記差分値を示す図形を、前記2次元座標平面上に表示する表示制御部
    として更に機能させる請求項14または15に記載のプログラム。
JP2005299028A 2005-10-13 2005-10-13 相関性を評価するシステム、および、その方法 Expired - Fee Related JP4148524B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005299028A JP4148524B2 (ja) 2005-10-13 2005-10-13 相関性を評価するシステム、および、その方法
US11/548,278 US7702714B2 (en) 2005-10-13 2006-10-10 Pairwise symmetry decomposition method for generalized covariance analysis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005299028A JP4148524B2 (ja) 2005-10-13 2005-10-13 相関性を評価するシステム、および、その方法

Publications (2)

Publication Number Publication Date
JP2007108998A JP2007108998A (ja) 2007-04-26
JP4148524B2 true JP4148524B2 (ja) 2008-09-10

Family

ID=38034822

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005299028A Expired - Fee Related JP4148524B2 (ja) 2005-10-13 2005-10-13 相関性を評価するシステム、および、その方法

Country Status (2)

Country Link
US (1) US7702714B2 (ja)
JP (1) JP4148524B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140373031A1 (en) * 2011-12-06 2014-12-18 International Business Machines Corporation Method, Device and Computer Program For Visualizing Risk Assessment Values in Event Sequences
JP6076608B2 (ja) * 2012-04-06 2017-02-08 株式会社匠技研 時系列情報解析装置および時系列情報解析用プログラム
JP5984142B2 (ja) * 2013-05-22 2016-09-06 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 解析装置、解析方法、及び、プログラム
JP6834602B2 (ja) 2017-03-03 2021-02-24 富士通株式会社 データ生成方法、データ生成装置及びデータ生成プログラム
JP6844327B2 (ja) 2017-03-03 2021-03-17 富士通株式会社 データ生成方法、データ生成装置及びデータ生成プログラム
JP6823265B2 (ja) * 2017-03-28 2021-02-03 富士通株式会社 分析装置、分析システム、分析方法および分析プログラム
US11119771B2 (en) * 2018-09-28 2021-09-14 University Of South Florida Computing 2-body statistics on graphics processing units (GPUs)
JP7021052B2 (ja) * 2018-11-06 2022-02-16 株式会社東芝 製品状態推定装置
JP6976537B1 (ja) * 2020-10-08 2021-12-08 株式会社Fronteo 情報検索装置、情報検索方法および情報検索用プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2643422B2 (ja) * 1989-03-14 1997-08-20 松下電器産業株式会社 相関演算装置
US5257364A (en) * 1990-09-12 1993-10-26 Nec Research Institute, Inc. Method for generating a correlated sequence of variates with desired marginal distribution for testing a model of a communications system
JP3821225B2 (ja) * 2002-07-17 2006-09-13 日本電気株式会社 時系列データに対する自己回帰モデル学習装置並びにそれを用いた外れ値および変化点の検出装置
JP2004354373A (ja) * 2003-05-08 2004-12-16 Mitsubishi Research Institute Inc 遺伝子型データ及び表現型データを用いた浸透率推定方法及びディプロタイプ形と表現型との関連性検定方法
JP4485759B2 (ja) * 2003-06-27 2010-06-23 株式会社リコー 異常発生予測方法、状態判定装置及び画像形成装置
US7320014B2 (en) * 2003-12-12 2008-01-15 Tektronix, Inc. Method and apparatus for identifying similar events in long data records
US7225103B2 (en) * 2005-06-30 2007-05-29 Oracle International Corporation Automatic determination of high significance alert thresholds for system performance metrics using an exponentially tailed model

Also Published As

Publication number Publication date
US7702714B2 (en) 2010-04-20
JP2007108998A (ja) 2007-04-26
US20070192066A1 (en) 2007-08-16

Similar Documents

Publication Publication Date Title
JP4148524B2 (ja) 相関性を評価するシステム、および、その方法
US10572512B2 (en) Detection method and information processing device
JP6361175B2 (ja) 異常診断装置及びプログラム
JP5142135B2 (ja) データを分類する技術
Seo et al. On the value of outlier elimination on software effort estimation research
JP4201027B2 (ja) 複数の観測結果の間の差異を検出するシステムおよびその方法
Tenreiro Machado et al. Analysis of financial data series using fractional Fourier transform and multidimensional scaling
Brabec et al. On model evaluation under non-constant class imbalance
JP6315528B1 (ja) 異常検知モデル構築装置、異常検知モデル構築方法及びプログラム
Lim et al. Identifying recurrent and unknown performance issues
JP5780870B2 (ja) 回転機器の健全性診断装置、方法およびプログラム
JP5771317B1 (ja) 異常診断装置及び異常診断方法
US11748321B2 (en) Time-series data condensation and graphical signature analysis
CN105009130A (zh) 基于网络熵的对生物体状态迁移的预兆检测予以辅助的检测装置、检测方法以及检测程序
JP6597453B2 (ja) 異常診断方法、異常診断装置、及び異常診断プログラム
Zhou et al. Automatic feature selection for unsupervised clustering of cycle-based signals in manufacturing processes
JPWO2019026193A1 (ja) 情報処理装置、情報処理システム、情報処理方法、及び、プログラム
Gong et al. Application of improved bubble entropy and machine learning in the adaptive diagnosis of rotating machinery faults
Sipola et al. Gear classification and fault detection using a diffusion map framework
EP3923228B1 (en) Data analysis method, device and program
JP5771318B1 (ja) 異常診断装置及び異常診断方法
Maleki et al. Robust hierarchical clustering for novelty identification in sensor networks: With applications to industrial systems
Meng et al. Gear fault diagnosis based on recurrence network
EP2915059B1 (en) Analyzing data with computer vision
Jia et al. A fault diagnosis scheme for harmonic reducer under practical operating conditions

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080118

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20080130

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20080219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080318

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080617

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20080619

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080623

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110704

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees