JP6616889B2 - ウインドウ評価方法および分析装置 - Google Patents
ウインドウ評価方法および分析装置 Download PDFInfo
- Publication number
- JP6616889B2 JP6616889B2 JP2018512645A JP2018512645A JP6616889B2 JP 6616889 B2 JP6616889 B2 JP 6616889B2 JP 2018512645 A JP2018512645 A JP 2018512645A JP 2018512645 A JP2018512645 A JP 2018512645A JP 6616889 B2 JP6616889 B2 JP 6616889B2
- Authority
- JP
- Japan
- Prior art keywords
- window
- time
- variable
- evaluation
- explanatory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims description 108
- 238000010219 correlation analysis Methods 0.000 claims description 85
- 238000004458 analytical method Methods 0.000 claims description 29
- 238000007405 data analysis Methods 0.000 claims description 11
- 238000001914 filtration Methods 0.000 claims description 6
- 238000000034 method Methods 0.000 description 26
- 238000001514 detection method Methods 0.000 description 23
- 230000002159 abnormal effect Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 14
- 238000012423 maintenance Methods 0.000 description 9
- 230000005856 abnormality Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 2
- 238000012806 monitoring device Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 101100074187 Caenorhabditis elegans lag-1 gene Proteins 0.000 description 1
- 235000008733 Citrus aurantifolia Nutrition 0.000 description 1
- 235000011941 Tilia x europaea Nutrition 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000004571 lime Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
Landscapes
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、システムの状態を多次元時系列データ分析により監視する装置で用いるウインドウを評価する技術に関する。
社会インフラシステムのように、何らかの障害が発生した場合の影響が大きいシステムは障害を未然に防止し、安定して稼働させることが求められる。システムを安定して稼働させることができるように、システムを構成する機器等の状態を監視し、取得した状態を基準として早期の保全を図るシステム保全方法が普及しつつある。このようなシステム保全方法を以下「状態基準保全」という。
状態基準保全では、システムの構成機器などの状態を継続的に計測することによりシステムの状況をモニタリングし、得られたデータから異常の予兆をいち早く発見して対処することにより、システムの信頼性の維持と保全コストの削減を図ることができる。
このような状態基準保全を実現するために多次元時系列データ分析が用いられる。例えば、複数の説明変数時系列と目的変数時系列の相関に着目し、複数の説明変数時系列から目的変数時系列の変化を予測することが出来る。ここで、目的変数時系列とは、システムのアウトプットの量や質を表す指標の時系列データであり、例えば製造装置であれば単位時間あたりの製造量、ガスタービンであれば単位時間あたりの発電量といった指標となる。また、説明変数時系列とは、目的変数時系列を説明することが期待される時系列データであり、例えば製造装置であれば各部位の電流値など、ガスタービンであれば吸気量や温度といった時系列データとなる。
多次元時系列データ分析においては、説明変数時系列に対して適切なタイムラグとウインドウ幅のウインドウ(スライドウインドウとも呼ばれる)を設定し、ウインドウ内で各種統計量を算出し、得られた統計量の値と目的変数の関係を抽出し、抽出した関係を基に目的変数の変化を予測したり、異常の予兆を検出したりする。
ここでいうタイムラグとは、説明変数が目的変数に影響を与えるまでに要する時間の遅れである。また、ここでいうウインドウ幅とは、説明変数が目的変数に影響を与えている時間の長さである。タイムラグとウインドウ幅を適切な値に設定するには、システムの設計および運用を熟知した管理者が過去の経験に基づいて試行錯誤しながら値を決定する必要があった。
これに対して、特許文献1には、タイムラグとウインドウ幅を効率的に設定する方法が開示されている。特許文献1に開示された方法は、説明変数時系列を説明変数の累積値の時系列に変換した上で、説明変数の個数を減らしてモデルの複雑化を防ぐための正則化項を導入するという方法である。特許文献1の方法によれば、説明変数ごとに最適なタイムラグとウインドウ幅を効率的に決定することができる。
社会インフラシステムのように比較的規模が大きく挙動が複雑なシステムは、各構成要素の状態が変化するのに伴ってタイムラグおよびウインドウ幅の適切な値も変化する場合がある。上述した特許文献1に開示された技術は、説明変数ごとにタイムラグとウインドウ幅を最適化することを可能にするものの、システムの状態の変化に対してタイムラグおよびウインドウ幅を適切な値に変化させていくことができなかった。
本発明の目的は、システムの状態の変化に応じてタイムラグおよびウインドウ幅を適切な値に変化させる技術を提供することである。
本発明の一つの実施態様に従う分析装置は、時系列の説明変数および目的変数と、前記目的変数の状態変化に関する教師データとが与えられ、前記説明変数から多次元時系列データ分析により前記目的変数の状態変化を予測するときに前記説明変数に対して設定するウインドウのタイムラグとウインドウ幅を決定する分析装置であって、説明変数拡張部と、相関分析部と、相関分析結果評価部と、を有する。説明変数拡張部は、タイムラグとウインドウ幅の少なくとも一方をパラメータとして異ならせた複数のウインドウを生成する。相関分析部は、複数のウインドウのそれぞれに対して、時系列の目的変数について、ウインドウ内の説明変数と目的変数との相関係数を算出する。相関分析結果評価部は、複数のウインドウのそれぞれについて、相関係数を用いて説明変数から目的変数の状態変化を予測し、予測された目的変数の状態変化と教師データとを用いて、ウインドウを評価する。
本発明によれば、システムの状態が変化しても説明変数のタイムラグおよびウインドウ幅に適切な値を評価することが可能である。
以下、本発明の実施形態について図面を参照して説明する。
図1は、本実施形態による分析システムの構成を示す図である。図2は、本実施形態による分析装置10の全体動作を示すフローチャートである。
分析装置10は、主に社会インフラシステムのような複雑なシステムの将来の状態を予測したり、異常の予兆を検出したりするシステム監視装置(不図示)に対して設定するウインドウのタイムラグおよびウインドウ幅を評価し、決定するための装置である。
システム監視装置は、多次元時系列データ分析を用いて状態基準保全を実現する装置である。分析装置10は、そのシステム監視装置に対して、多次元時系列の予測技術に用いるウインドウのタイムラグおよびウインドウ幅を与える。
図1を参照すると、分析装置10は、システム状態分析部11、説明変数拡張部12、変数カテゴライズ部13、相関分析部14、相関分析結果評価部15、および評価結果出力部16を有する。以下、図2のフローチャートの流れに沿って各部の動作について説明する。
システム状態分析部11は、ステップ201にて、外部記憶装置20から、目的変数時系列21、複数の説明変数時系列22、判定ルール23を取得して記録し、更に、目的変数時系列21の値に基づいてシステムの状態を評価して評価結果を目的変数テーブルに記録する。なお、システム状態分析部11およびステップ201の動作は分析装置10に必須ではない。他の例として、目的変数時系列21の値をそのまま評価結果としてもよい。あるいは更に他の例として分析装置10がシステムの状態を評価しなくてもよい。
説明変数拡張部12は、ステップ202にて、システム状態分析部11が取得した説明変数時系列22に基づき、タイムラグとウインドウ幅の複数の組み合わせについて、ウインドウの内の説明変数の値を設定した拡張説明変数テーブルを生成する。
変数カテゴライズ部13は、ステップ203にて、説明変数拡張部12が生成した拡張説明変数テーブルに設定された各説明変数の値を複数段階(ここでは一例として5段階)のカテゴリ値に量子化し、量子化済み拡張説明変数テーブルを生成する。
相関分析部14は、ステップ204にて、変数カテゴライズ部13が生成した量子化済み拡張説明変数テーブルと、システム状態分析部11が記録した目的変数テーブルとを入力とし、分析パラメータとして予め定められた相関分析の時間範囲で相関分析を行い、ウインドウ内の説明変数と目的変数との相関係数を算出する。相関分析の結果すなわち相関係数は、相関分析結果テーブルとして記録される。ここで、説明変数は、値そのものではなく、ウインドウ内の値の平均値や、中央値、分散などの統計量を採用しても良い。
相関分析結果評価部15は、ステップ205にて、相関分析部14が記録した相関分析結果テーブルと、予め与えられた教師データである判定ルール23とを入力として以下に示すグループ化処理、正誤判定処理、およびランキング処理を行う。
まず、グループ化処理として、相関分析結果評価部15は、相関分析結果テーブルにおける説明変数毎の相関係数の時系列を、分析パラメータとして予め与えられた閾値(グループ化用の相関係数の閾値)と比較し、その閾値以上の値が連続している相関係数の部分を1つのグループとしてグループ化を行う。グループ化処理の詳細は後述する。
更に、正誤判定処理として、相関分析結果評価部15は、グループ化により生じた各グループについて、教師データの異常個所の立上りまたは立下りと一致するか否か、すなわちどれだけ正確にグループが検出されたかという正誤判定を行う。正誤判定の結果として、説明変数とウインドウの組み合わせに対して、相関係数の平均値、どれだけ正確にグループが検出されたか、を含む各種評価値などが評価結果テーブルに記録される。整合判定処理の詳細は後述する。
更に、ランキング処理として、相関分析結果評価部15は、複数のウインドウを与えられたフィルタリング条件で絞りこみ、更に、与えられたランキング条件を用いて各種評価値を重み付けし、複数のウインドウをランク付けする。
評価結果出力部16は、評価結果の情報をディスプレイ装置30に出力し、画面に表示させる。
本実施形態の分析装置10は、時系列の説明変数および目的変数と、前記目的変数の状態変化に関する教師データとが与えられ、説明変数から多次元時系列データ分析により目的変数の変化を予測するときに説明変数に対して設定するウインドウのタイムラグとウインドウ幅を決定する分析装置である。そして、説明変数拡張部12は、タイムラグとウインドウ幅の少なくとも一方をパラメータとして異ならせた複数のウインドウを生成する。相関分析部14は、複数のウインドウのそれぞれに対して、時系列の目的変数について、ウインドウ内の説明変数と目的変数との相関係数を算出する。相関分析結果評価部15は、複数のウインドウのそれぞれについて、相関係数を用いて説明変数から目的変数の変化を予測し、予測された目的変数の変化と教師データとを用いて、ウインドウを評価する。これにより、システムの状態を説明変数と目的変数で表わし、多次元時系列データ分析により、説明変数から目的変数を適切に予測できるウインドウかどうかを評価することができるので、システムの状態が変化しても説明変数のタイムラグおよびウインドウ幅に適切な値を評価することが可能である。
図3は、目的変数および説明変数の一例を示す図である。図3を参照すると、目的変数と2つの説明変数の時間変化の様子が示されている。このように目的変数および説明変数は時系列に与えられる。また、図3には、目的変数が高い値を示す異常個所が矢印によって示されている。時刻t1から時刻t2までが異常個所である。これが上述した判定ルール23となる。
図4A〜4Dは分析装置10への入力データの例である。
図4Aは、目的変数時系列21を示す目的変数テーブルの一例を示す図である。目的変数の例としてCPU使用率が示されている。目的変数テーブルには各時刻におけるCPU使用率が示されている。
図4Bは、説明変数時系列22を示す説明変数テーブルの一例を示す図である。説明変数の例として、ログイン数、メモリ残量、Ping応答時間が示されている。説明変数テーブルには、各時刻における各説明変数の値が示されている。
図4Cは、判定ルール23のテーブルの一例を示す図である。テーブルには、異常個所の識別情報毎に、その異常個所の開始時刻と終了時刻が記録されている。
図4Dは、分析パラメータの一例を示す図である。図4Dを参照すると、分析パラメータとして、相関分析の時間範囲、グループ化用の相関係数の閾値、異常判定用の閾値、およびグループ化の時間間隔のそれぞれの値が指定されている。
相関分析の時間範囲は、相関分析部14が相関分析を行うときに用いるデータの時間範囲を示す。図4Dには、50が設定されているので、時間方向に連続した50個のデータを相関分析に用いる。
グループ化用の相関係数の閾値は、変数カテゴライズ部13が相関係数をグループ化するときに用いる閾値である。図4Dには、0.7が設定されているので、相関係数が0.7以上で連続している部分を1つのグループとすればよい。
異常判定用の閾値は、目的変数の値により異常個所を判定するための時間方向のずれを許容するための閾値である。図4Dには、5が設定されているので、異常個所の開始時刻(または終了時刻)±5以内の範囲をの時間帯を異常個所とみなすことになる。
グループ化の時間間隔は、変数カテゴライズ部13が、相関係数をグループ化するとき、ノイズ成分により1つのグループが複数とカウントされてしまうのを防ぐための閾値である。変数カテゴライズ部13は、相関係数の絶対値が、グループ化用の相関係数の閾値を下回っている時間が、グループ化用の時間間隔以下であれば、相関係数がグループ化用の相関係数の閾値以上で連続しているとみなす。
図5は、システム状態分析部11が、システム状態を評価し、付加した目的変数テーブルの一例を示す図である。図4Aの目的変数テーブルに対して新たにシステム状態という項目が追加され、そこに状態が記録されている。ここでは、目的変数がCPU使用率なので、システム状態として、目的変数の値の大きさによりHigh、Very Highなどが設定されている。
図6は、拡張説明変数テーブルの一例を示す図である。説明変数拡張部12が、タイムラグとウインドウ幅をパラメータとして振って、タイムラグとウインドウ幅の複数の組み合わせを作成した結果、この拡張説明変数テーブルが生成される。拡張説明変数テーブルには、時刻毎に、説明変数とタイムラグおよびウインドウ幅との組み合わせに対して説明変数の値が設定されている。例えば、時刻ti−2において、説明変数がログイン数であり、タイムラグが1(lag1)であり、ウインドウ幅が1(width1)である項目には、説明変数であるログイン数の1.3という値が設定されている。
図7は、量子化済みの拡張説明変数テーブルの一例を示す図である。変数カテゴライズ部13により説明変数が量子化され、テーブルには説明変数の代わりにカテゴリ値が設定されている。
図8は、相関分析結果テーブルの一例を示す図である。相関分析部14による相関分析の結果として図8に示す相関分析結果テーブルが生成される。各時刻について、説明変数とタイムラグおよびウインドウ幅との組み合わせに対して、相関係数が記録されている。
例えば、時刻ti−2において、説明変数がログイン数であり、タイムラグが1であり、ウインドウ幅が1であれば、相関係数は0.58である。
例えば、時刻ti−2において、説明変数がログイン数であり、タイムラグが1であり、ウインドウ幅が1であれば、相関係数は0.58である。
図9は、グループ番号を付加した相関分析結果テーブルの一例を示す図である。説明変数、タイムラグ、およびウインドウ幅の組み合わせにグループ番号を付与し、図9の相関分析結果テーブルにそのグループ番号を記録している。グループ番号の付与の仕方については後述する。
図10は、評価結果テーブルの一例を示す図である。評価結果テーブルには、相関分析結果評価部15による評価結果が示されている。説明変数、ライムラグ、およびウインドウ幅の組み合わせに対して、相関係数の平均値、検出数、検出ミス、検出漏れ、適合率、再現率、F値、および先行する時間の平均値がそれぞれ記録されている。これらが説明変数に対するタイムラグとウインドウ幅の組み合わせ、すなわち、説明変数に対するウインドウを選択するための指標となる。
相関係数の平均値は、各時刻の相関係数の平均値である。
相関係数をグループ化用の閾値と比較して生成したグループが教師データの異常個所の立上りあるいは立下りと一致したとき、検出数としてカウントされる。異常個所の立上りあるいは立下りと一致しないグループが存在したら、検出ミスとしてカウントされる。異常個所の立上りあるいは立下りと一致するグループが存在しなかったら、検出漏れとしてカウントされる。
適合率、再現率、およびF値は、グループの検出に関する質的な指標である。適合率は、検出結果として得られたグループの中に、どれだけ検出されるべきグループが含まれているかという正確性の指標である。再現率は、検出されるべきグループうちでどれだけのグループを検出できたかという網羅性の指標である。
先行する時間の平均値は、説明変数が目的変数にどれだけ先行しているかを示す指標である。説明変数が先行していれば、目的変数が変化する前に余裕をもって対処することができるので、この指標の時間は長い方が好ましい。先行する時間の平均値の算出方法については後述する。
図11は、評価結果出力画面の一例を示す図である。評価結果出力画面は、相関分析結果評価部15の評価結果を評価結果出力部16がディスプレイ装置30に出力し、表示させた画面である。
評価結果出力画面の上部には、相関分析結果評価部15の処理に用いる条件をユーザが入力するためのユーザインタフェースが表示されている。上部左側は、ユーザがフィルタリング条件を入力するためのフィルタリング条件表示部であり、上部の右側は、ユーザがランキング条件を入力するためのランキング条件表示部である。
相関分析結果評価部15は、複数のウインドウを、評価結果出力画面から入力されたフィルタリング条件で絞りこみ、更に、同じ評価結果出力画面から入力されたランキング条件を用いて各種評価値を重み付けして複数のウインドウの総合評価値を算出し、複数のウインドウを総合評価値が高い順にランク付けする。
評価結果出力画面の下部には、総合評価値によるランキングに従って順番にウインドウに関する情報を表示する。表示する情報には、説明変数およびウインドウ(タイムラグおよびウインドウ幅)の情報、および各種評価値(F値、適合率、再現率、先行する時間)の情報が含まれる。また、目的変数であるCPU使用率、ウインドウ内の説明変数であるログイン数、教師データの異常個所の検出の様子などがグラフにより表示されている。
図12は、相関分析結果評価部15によるグループ化処理を示すフローチャートである。
相関分析結果評価部15は、グループ化処理を開始すると、まず、1組の説明変数、タイムラグ、およびウインドウ幅を選択する(ステップ301)。次に、相関分析結果評価部15は、図8に例示した相関分析結果テーブルのステップ301で選択した説明変数、タイムラグ、およびウインドウ幅の組に該当するレコードを先頭から時間の昇順に1つ選択する(ステップ302)。
続いて、相関分析結果評価部15は、選択したレコードの相関係数の絶対値を、図4Dに例示したグループ化用の相関係数の閾値と比較し、相関係数の絶対値が閾値以上で連続しているレコードを1つのグループとしてまとめる(ステップ303)。その際、相関分析結果評価部15は、各グループに対して、時間の昇順に0番から始まるグループ番号を付与する。また、相関分析結果評価部15は、相関係数の絶対値が閾値より小さいレコードのグループには共通の−1というグループ番号を付与する。
相関分析結果評価部15は、相関分析結果テーブルのステップ301で選択した説明変数、タイムラグ、およびウインドウ幅の組に該当する全てのレコードを、ステップ302にて閾値と比較し、得られたグループへのグループ番号が終了したか否か判定する(ステップ304)。相関分析結果評価部15は、グループへのグループ番号の付与が終了していなければステップ302に戻り、グループへのグループ番号の付与が終了していればステップ305へ進む。
ステップ305にて、相関分析結果評価部15は、ステップ301にて、全ての説明変数、タイムラグ、およびウインドウ幅の組を選択し終えたか否か判定する。相関分析結果評価部15は、全ての説明変数、タイムラグ、およびウインドウ幅の組を選択し終えていなければステップ301に戻り、選択し終えていれば、グループ化処理を終了する。
なお、本実施形態では、相関係数のノイズ成分の影響を低減するために、ステップ303の処理において、相関分析結果評価部15は、相関係数の絶対値が閾値を下回っている期間が一定時間(図4Dに例示したグループ化の時間間隔=5タイムステップ)以下であれば、相関係数の絶対値が閾値以上で連続しているとみなすものとする。
図13は、相関分析結果評価部15による正誤判定処理を示すフローチャートである。
整合判定処理を開始すると、相関分析結果評価部15は、まず、1組の説明変数、タイムラグ、およびウインドウ幅を選択する(ステップ401)。
次に、相関分析結果評価部15は、図4Cに例示した異常個所の情報の先頭から開始時刻の昇順に1つのレコードを選択する(ステップ402)。
続いて、相関分析結果評価部15は、ステップ402で選択した異常個所の開始時刻または終了時刻の前後の、図4Dに例示した正誤判定の時間閾値の範囲内に時刻が重なっているグループを選択する(ステップ403)。なお、このときその範囲内に複数のグループがあったら、異常個所の開始時刻または終了時刻に最も近い時刻のグループを選択する。
続いて、相関分析結果評価部15は、ステップ403にてグループが存在していたか否か判定する(ステップ404)。グループが存在していたら、図10に例示した評価結果テーブルにおいて、選択中の説明変数、タイムラグ、およびウインドウ幅の組に対応するレコードの検出数と先行する時間(平均)とを更新する(ステップ405)。検出数の更新は+1カウントアップである。先行時間(平均)の更新は、グループ内の各時刻における、説明変数が目的変数に先行する時間のうち、最も過去(最も小さい)時間を選択することである。
ステップ404においてグループが存在しなかったとき、またはステップ405の処理が終了したとき、相関分析結果評価部15は、ステップ402にて異常個所の情報における全てのレコードを選択し終えたか否か判定する(ステップ406)。相関分析結果評価部15は、全てのレコードを選択し終えていなければステップ402に戻り、全てのレコードを選択し終えていればステップ407に進む。
ステップ407にて、相関分析結果評価部15は、図10に例示した評価結果テーブルの検出ミスと検出漏れを更新する。検出ミスと検出漏れの更新における判定基準は以下の(1)と(2)である
(1) 図4Cに例示した異常個所の情報のレコードのうち、該当するグループが存在しなかったレコードは検出漏れと判定する
(2) 図9に例示した相関分析結果テーブルに挙がったグループのうち、図4Cに例示した異常個所の情報に含まれていなかったグループは検出ミスと判定する。
次に、相関分析結果評価部15は、図10に例示した評価結果テーブルにおける検出数、検出ミス、および検出漏れに基づいて、以下の式を用いて、適合率、再現率、及びF値を算出し、該当するレコードを更新する(ステップ408)。
適合率=検出数/(検出数+検出ミス)
再現率=検出数/正解数
ここで正解数とは、異常個所の情報(判定ルール)のレコード数×2である。×2倍しているのは、異常個所の立上りと立下りとがあるからである。
F値=2×適合率×再現率/(適合率+再現率)
更に、相関分析結果評価部15は、ステップ401にて説明変数、タイムラグ、およびウインドウ幅の全ての組を選択し終えたか否か判定する(ステップ409)。相関分析結果評価部15は、説明変数、タイムラグ、およびウインドウ幅の全ての組を選択し終えていなければステップ401に戻り、選択し終えていれば処理を終了する。
適合率=検出数/(検出数+検出ミス)
再現率=検出数/正解数
ここで正解数とは、異常個所の情報(判定ルール)のレコード数×2である。×2倍しているのは、異常個所の立上りと立下りとがあるからである。
F値=2×適合率×再現率/(適合率+再現率)
更に、相関分析結果評価部15は、ステップ401にて説明変数、タイムラグ、およびウインドウ幅の全ての組を選択し終えたか否か判定する(ステップ409)。相関分析結果評価部15は、説明変数、タイムラグ、およびウインドウ幅の全ての組を選択し終えていなければステップ401に戻り、選択し終えていれば処理を終了する。
以上説明したように、本実施形態によれば、教師データは、目的変数における所定状態(例として異常状態)の開始時刻と終了時刻を含んでいる。相関分析結果評価部15は、ウインドウの評価において、相関係数の時系列において連続して所定の閾値を超える部分をグループとし、そのグループと開始時刻または終了時刻とがどれだけ一致するかにより、ウインドウを評価する。これにより、教師データにおいて目的変数が変化する部分と相関係数が閾値を超える部分との一致の程度でウインドウを評価するので、比較的簡易な演算でウインドウの評価を得ることができる。
また、相関分析結果評価部15は、グループと開始時刻または終了時刻との一致を、適合率、再現率、およびF値の少なくとも1つ(例として全て)により評価する。グループと開始時刻または終了時刻との一致を適合率、再現率、およびF値の少なくとも1つで評価するので、一致の度合いを適切に評価することができる。
また、相関分析結果評価部15は、与えられたフィルタリング条件によりウインドウを絞り込み、与えられたランキング条件でウインドウの総合評価値を算出し、総合評価値によりランク付けする。ユーザの指定によりウインドウを絞りこんだり、ランク付けの条件をユーザが指定したりできるので、ユーザの所望の条件でウインドウを評価することが可能である。
また、評価結果出力部16は、相関分析結果評価部15によるウインドウの評価の結果として、目的変数、説明変数、及び相関係数をタイムチャート形式でディスプレイ装置30に表示させる。これにより、ユーザはタイムチャート形式の画面表示により容易にウインドウの評価結果を把握することができる。
また、目的変数の変化は、システムの対処を要する状態への変化であり、相関分析結果評価部15は、ウインドウの評価指標として、説明変数が目的変数よりどれだけ先行するかを示す先行時間を算出する。システムの対処を要する状態への変化を先行して予測することができれば、それだけ対処が容易となるので、対処を要する状態への変化の検出については先行時間が長い程、好ましい。先行時間を評価指標として算出することにより、より好ましいウインドウを選択しやすくなる。
また、変数カテゴライズ部13が、説明変数を複数段階に量子化し、相関分析部14が、時系列の目的変数のそれぞれについて、ウインドウ内の量子化した説明変数と目的変数との相関係数を算出する。説明変数を量子化して相関係数の算出に用いるので、複雑な時系列のモデルから容易な演算で相関係数を算出することが可能となる。
また、本実施形態の分析装置10は、説明変数から多次元時系列データ分析により目的変数の変化を予測することにより、システムの状態を分析するシステム分析部を更に有してもよい。その場合、相関分析結果評価部15は、評価の結果に基づいて、システムの分析に適用するウインドウを決定し、システム分析部は、説明変数の時系列に対して、決定したタイムラグとウインドウ幅のウインドウを設定し、ウインドウ内で所定の統計量を算出し、得られた統計量の値と目的変数の関係を抽出し、抽出した関係を基に目的変数の変化を予測する。
上述した本発明の実施形態は、本発明の説明のための例示であり、本発明の範囲をそれらの実施形態にのみ限定する趣旨ではない。当業者は、本発明の要旨を逸脱することなしに、他の様々な態様で本発明を実施することができる。
10…分析装置、11…システム状態分析部、12…説明変数拡張部、13…変数カテゴライズ部、14…相関分析部、15…相関分析結果評価部、16…評価結果出力部、20…外部記憶装置、21…目的変数時系列、22…説明変数時系列、23…判定ルール、30…ディスプレイ装置
Claims (11)
- 時系列の説明変数および目的変数と、前記目的変数の状態変化に関する教師データとが与えられ、前記説明変数から多次元時系列データ分析により前記目的変数の状態変化を予測するときに前記説明変数に対して設定するウインドウのタイムラグとウインドウ幅を評価するためのウインドウ評価方法であって、
説明変数拡張手段が、前記タイムラグと前記ウインドウ幅の少なくとも一方をパラメータとして異ならせた複数のウインドウを生成し、
相関分析手段が、前記複数のウインドウのそれぞれに対して、前記時系列の目的変数について、前記ウインドウ内の説明変数と前記目的変数との相関係数を算出し、
相関分析結果評価手段が、前記複数のウインドウのそれぞれについて、前記相関係数を用いて前記説明変数から前記目的変数の状態変化を予測し、予測された前記目的変数の状態変化と前記教師データとを用いて、前記ウインドウを評価する、
ウインドウ評価方法。 - 前記教師データは、前記目的変数における所定状態の開始時刻と終了時刻を含み、
前記相関分析結果評価手段は、前記ウインドウの評価において、前記相関係数の時系列において連続して所定の閾値を超える部分をグループとし、前記グループと前記開始時刻または前記終了時刻とがどれだけ一致するかにより、前記ウインドウを評価する、
請求項1に記載のウインドウ評価方法。 - 前記相関分析結果評価手段は、前記グループと前記開始時刻または前記終了時刻との一致を、適合率、再現率、およびF値の少なくとも1つにより評価する、請求項2に記載のウインドウ評価方法。
- 前記相関分析結果評価手段は、与えられたフィルタリング条件によりウインドウを絞り込み、与えられたランキング条件で前記ウインドウの総合評価値を算出し、前記総合評価値によりランク付けする、請求項1に記載のウインドウ評価方法。
- 評価結果出力手段は、前記相関分析結果評価手段によるウインドウの評価の結果として、前記目的変数、前記説明変数、及び前記相関係数をタイムチャート形式でディスプレイ装置に表示させる、請求項1に記載のウインドウ評価方法。
- 前記目的変数の状態変化は、システムの対処を要する状態への変化であり、
前記相関分析結果評価手段は、ウインドウの評価指標として、説明変数が目的変数よりどれだけ先行するかを示す先行時間を算出する、請求項1に記載のウインドウ評価方法。 - 変数カテゴライズ手段が、前記説明変数を複数段階に量子化し、
前記相関分析手段が、前記時系列の目的変数のそれぞれについて、前記ウインドウ内の量子化した説明変数と前記目的変数との相関係数を算出する、
請求項1に記載のウインドウ評価方法。 - 時系列の説明変数および目的変数と、前記目的変数の状態変化に関する教師データとが与えられ、前記説明変数から多次元時系列データ分析により前記目的変数の状態変化を予測するときに前記説明変数に対して設定するウインドウのタイムラグとウインドウ幅を決定する分析装置であって、
前記タイムラグと前記ウインドウ幅の少なくとも一方をパラメータとして異ならせた複数のウインドウを生成する説明変数拡張部と、
前記複数のウインドウのそれぞれに対して、前記時系列の目的変数について、前記ウインドウ内の説明変数と前記目的変数との相関係数を算出する相関分析部と、
前記複数のウインドウのそれぞれについて、前記相関係数を用いて前記説明変数から前記目的変数の状態変化を予測し、予測された前記目的変数の状態変化と前記教師データとを用いて、前記ウインドウを評価する相関分析結果評価部と、
を有する分析装置。 - 前記教師データは、前記目的変数における所定状態の開始時刻と終了時刻を含み、
前記相関分析結果評価部は、前記ウインドウの評価において、前記相関係数の時系列において連続して所定の閾値を超える部分をグループとし、前記グループと前記開始時刻または前記終了時刻とがどれだけ一致するかにより、前記ウインドウを評価する、
請求項8に記載の分析装置。 - 前記相関分析結果評価部は、前記グループと前記開始時刻または前記終了時刻との一致を、適合率、再現率、およびF値の少なくとも1つにより評価する、請求項9に記載の分析装置。
- 前記説明変数から多次元時系列データ分析により前記目的変数の変化を予測することにより、システムの状態を分析するシステム分析部を更に有し、
前記相関分析結果評価部は、前記評価の結果に基づいて、システムの分析に適用するウインドウを決定し、
前記システム分析部は、説明変数の時系列に対して、決定した前記タイムラグと前記ウインドウ幅のウインドウを設定し、前記ウインドウ内で所定の統計量を算出し、得られた統計量の値と目的変数の関係を抽出し、抽出した関係を基に目的変数の変化を予測する、
請求項8に記載の分析装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2016/062198 WO2017183066A1 (ja) | 2016-04-18 | 2016-04-18 | ウインドウ評価方法および分析装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017183066A1 JPWO2017183066A1 (ja) | 2019-02-14 |
JP6616889B2 true JP6616889B2 (ja) | 2019-12-04 |
Family
ID=60116630
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018512645A Active JP6616889B2 (ja) | 2016-04-18 | 2016-04-18 | ウインドウ評価方法および分析装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6616889B2 (ja) |
WO (1) | WO2017183066A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11609969B2 (en) | 2020-09-15 | 2023-03-21 | Kabushiki Kaisha Toshiba | Information processing apparatus, information processing system, information processing method, and computer program product |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020166442A (ja) * | 2019-03-28 | 2020-10-08 | エヌ・ティ・ティ・コミュニケーションズ株式会社 | 情報処理装置、算出方法および算出プログラム |
JP7519316B2 (ja) | 2021-02-25 | 2024-07-19 | 株式会社日立製作所 | 運転管理支援装置及び運転管理支援方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09179977A (ja) * | 1995-12-21 | 1997-07-11 | Shimadzu Corp | 医用画像の階調自動処理装置 |
CN101854225B (zh) * | 2009-03-30 | 2014-08-13 | 日电(中国)有限公司 | 从位置数据流检测目标状态改变的方法和系统 |
JP2010282556A (ja) * | 2009-06-08 | 2010-12-16 | Sony Corp | 情報処理装置、情報処理方法、及び、プログラム |
WO2013069568A1 (ja) * | 2011-11-08 | 2013-05-16 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 時系列データ分析方法、システム及びコンピュータ・プログラム |
-
2016
- 2016-04-18 JP JP2018512645A patent/JP6616889B2/ja active Active
- 2016-04-18 WO PCT/JP2016/062198 patent/WO2017183066A1/ja active Application Filing
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11609969B2 (en) | 2020-09-15 | 2023-03-21 | Kabushiki Kaisha Toshiba | Information processing apparatus, information processing system, information processing method, and computer program product |
Also Published As
Publication number | Publication date |
---|---|
JPWO2017183066A1 (ja) | 2019-02-14 |
WO2017183066A1 (ja) | 2017-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6616889B2 (ja) | ウインドウ評価方法および分析装置 | |
JP6521096B2 (ja) | 表示方法、表示装置、および、プログラム | |
JP6677575B2 (ja) | 回転機械の運転状態を診断する診断装置及び診断方法 | |
JP2017091113A (ja) | イベント解析装置、イベント解析システム、イベント解析方法、およびイベント解析プログラム | |
WO2016147657A1 (ja) | 情報処理装置、情報処理方法、及び、記録媒体 | |
CN103649858A (zh) | 用于预测组件或系统状况的方法和设备及计算机程序产品 | |
JP6711323B2 (ja) | プロセスの異常状態診断方法および異常状態診断装置 | |
JPWO2018073955A1 (ja) | システム分析方法、システム分析装置、および、プログラム | |
TW201926041A (zh) | 設備保養預測系統及其操作方法 | |
JP7247021B2 (ja) | 情報処理装置、予測判別システム、および予測判別方法 | |
US20210374634A1 (en) | Work efficiency evaluation method, work efficiency evaluation apparatus, and program | |
JP2022040964A (ja) | 製造条件設定自動化装置及び方法 | |
JP2006276924A (ja) | 設備機器診断装置及び設備機器診断プログラム | |
JP6915693B2 (ja) | システム分析方法、システム分析装置、および、プログラム | |
US11449781B2 (en) | Plant abnormality prediction system and method | |
US10853538B2 (en) | Model generation system and model generation method | |
JP2007164346A (ja) | 決定木変更方法、異常性判定方法およびプログラム | |
JP2000198051A (ja) | 設備フロ―の異常抽出装置、設備フロ―の異常抽出方法、及び設備フロ―の異常抽出プログラムを記録した記憶媒体 | |
JP6733656B2 (ja) | 情報処理装置、情報処理システム、プラントシステム、情報処理方法、及び、プログラム | |
JP2005063208A (ja) | ソフトウェア信頼度成長モデル選択方法、ソフトウェア信頼度成長モデル選択装置、ソフトウェア信頼度成長モデル選択プログラム、およびプログラム記録媒体 | |
WO2021025006A1 (ja) | 改善対策リコメンドシステム | |
US20210318672A1 (en) | Manufacturing Defect Factor Searching Method and Manufacturing Defect Factor Searching Apparatus | |
JP6247777B2 (ja) | 異常診断装置および異常診断方法 | |
JP6973445B2 (ja) | 表示方法、表示装置、および、プログラム | |
US11126948B2 (en) | Analysis method and computer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181010 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191015 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191108 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6616889 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |