JP7051503B2 - 多変量時系列データの同期方法および多変量時系列データ処理装置 - Google Patents

多変量時系列データの同期方法および多変量時系列データ処理装置 Download PDF

Info

Publication number
JP7051503B2
JP7051503B2 JP2018045386A JP2018045386A JP7051503B2 JP 7051503 B2 JP7051503 B2 JP 7051503B2 JP 2018045386 A JP2018045386 A JP 2018045386A JP 2018045386 A JP2018045386 A JP 2018045386A JP 7051503 B2 JP7051503 B2 JP 7051503B2
Authority
JP
Japan
Prior art keywords
time
series data
variables
interval
sample value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018045386A
Other languages
English (en)
Other versions
JP2019159779A (ja
Inventor
毅洋 鈴木
純也 西口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Azbil Corp
Original Assignee
Azbil Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Azbil Corp filed Critical Azbil Corp
Priority to JP2018045386A priority Critical patent/JP7051503B2/ja
Priority to PCT/JP2019/002444 priority patent/WO2019176322A1/ja
Priority to CN201980017076.6A priority patent/CN111868715A/zh
Priority to KR1020207025391A priority patent/KR102478796B1/ko
Publication of JP2019159779A publication Critical patent/JP2019159779A/ja
Application granted granted Critical
Publication of JP7051503B2 publication Critical patent/JP7051503B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F7/00Methods or arrangements for processing data by operating upon the order or content of the data handled
    • G06F7/02Comparing digital values

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Automation & Control Theory (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Complex Calculations (AREA)

Description

本発明は、時系列データを時間軸上で同期させる同期処理技術に関する。
近年、製造業の分野では設備や品質の適切な管理が課題となっており、AI(Artificial Intelligence:人工知能)やIoT(Internet of Things)に代表される高度な情報処理技術の応用が期待されている。特に、情報処理技術を応用した異常検知システムの活用が進んでいる。これは設備を自動でリアルタイムに監視し異常を捉え、管理者に通知するシステムである。管理者はその段階で措置を行うことで、設備故障によるプロセスの緊急停止やオフスペック品製造等のリスクを最小限にとどめることができる。
例えば、製品の加工工程や製造工程では、バッチプロセスが繰り替えし実行されるため、サンプル値の時系列データには、一連のバッチプロセスが実行されるバッチ区間ごとに、同様に変化する繰り返しデータが含まれることになる。バッチプロセスとは、品種ごとに原材料の仕込みや加工処理、製品の払い出しを繰り返し行う製造工程のことを指し、重合反応工程や半導体・医薬の製造工程が相当する。したがって、検証の対象となる新たな繰り返しデータである検証データを、過去に得られた繰り返しデータから平均値や中央値を求める統計処理や、典型例として選択した1つのバッチプロセスから導出した、基準となる基準データ(正常データ)と比較することにより、プロセスの異常有無を検知することができる。
図17は、繰り返しデータを示す説明図である。例えば、バッチプロセスを示す繰り返しデータは、時間的に並列に推移する多変量であり、バッチ区間の長さがそれぞれ異なる、という特徴を有している。バッチプロセスの進捗は、外部温度や原材料の純度等、各種の条件に応じてプロセスごとに変化するため、バッチ区間長すなわち繰り返しデータ長も変化する。このような時間軸上における伸縮変化に起因して生じるサンプル値の差異は、検知すべき異常を示していない場合が多い。これを「問題の無い」挙動であると認識するためには、同期処理を実行することにより、各繰り返しデータを時間軸上で予め同期させておく必要がある。この同期処理は「アラインメント」と呼ばれることもある。
時系列データの同期処理を行う最も基本的な手法のひとつとして、DTW(Dynamic Time Warping:動的時間伸縮法)がある。図18は、同期処理で用いられるサンプル同士の対応関係を示す説明図である。DTWは、2つの単変量時系列データx,y間における、各サンプル同士の対応関係を求める手法である。この手法は、主に、2つの単変量時系列データx,yに含まれる各サンプル同士のユークリッド距離を求める処理と、これらユークリッド距離の総和が最小となるサンプル同士の対応関係を探索する処理とから構成されている。
前述したバッチプロセスの繰り返しデータは、多変量の時系列データであるため、すべての変数について、同じ対応関係を適用する必要がある。一方、DTWは、単変量の時系列データを対象としている。このため、DTWを多変量時系列データの同期処理に適用する場合には、上記ユークリッド距離として多変量ユークリッド距離を用いる手法が考えられる。
一般に、多変量の時系列データを構成する変数Zの数をLとし、変数Zkに関する2つの時系列データXk,Ykのサンプル数をPk,Qkとし、Xk,Ykのサンプル値をxki,ykjとした場合、xki,ykjにおけるすべての変数Zに関するユークリッド距離の総和を示す多変量のユークリッド距離d(X,Y)は、次の式(1)で計算される。
Figure 0007051503000001
多変量ユークリッド距離は、すべての変数を同等に扱う。しかしながら、実際のバッチプロセスの繰り返しデータは、変数として、多くのノイズが含まれている変数や、バッチプロセスの進行度合いを表していない変数も含まれている。このような変数に基づいて同期処理を行うと、適切な同期結果を得られない傾向がある。
従来、DTWの1つとして、複数の変数のうちから、ノイズが少なく、時間方向に単調増加し、かつ、バッチプロセスの開始点および終了点におけるサンプル値がすべてのバッチプロセスにおいて一定である変数を指示変数(Indicator Variable)として選択し、この指示変数を仲立ちとして、各変数の対応関係を求める技術が提案されている(非特許文献1など参照)。図19は、従来の同期処理で用いられる指示変数の例を示す説明図である。この指示変数は、バッチプロセスの進捗すなわち時間経過に応じてサンプル値が単調に増加している。
このような手法によれば、一定の効果が得られるものの、指示変数の選択基準である、バッチプロセスの開始点および終了点におけるサンプル値がすべてのバッチプロセスにおいて一定である、という条件を満たす変数は少ない。したがって、バッチプロセスによっては、このような条件に合致する変数が存在せず、上記手法を適用できない場合もある。
このような課題を解決する従来技術として、多変量ユークリッド距離として重み付け多変量ユークリッド距離を用いるとともに、各変数の重みを、同期処理後の誤差に基づいて自動的に計算する技術が提案されている(特許文献1,非特許文献2など参照)。
多変量の時系列データを構成する変数Zの数をLとし、変数Zkに関する2つの時系列データXk,Ykのサンプル数をPk,Qkとし、Xk,Ykのサンプル値をxki,ykjとし、変数Zkの重みをWkとした場合、xki,ykjにおけるすべての変数Zに関するユークリッド距離の総和を示す多変量の重み付けユークリッド距離dw(X,Y)は、次の式(2)で計算される。
Figure 0007051503000002
この技術によれば、まず、各変数の重みを1で初期化し、各変数の重みの値が収束するまで次のステップを繰り返すことにより、各変数の重みが調整される。
・現在の重みを用いてユークリッド距離を計算してDTWを試行
・DTW得られた対応関係に関する誤差を変数ごとに計算
・誤差の大小に応じて各変数の重みを調整
図20は、従来の同期処理で用いられる各変数の重みの調整例であり、ここでは3つの多変量の変数A,B,Cが示されている。図20の例では、変数Aは誤差が中程度であるため変数Aの重みは中程度の値に調整され、変数Bは誤差が小さいため変数Bの重みは大きい値に調整され、変数Cは誤差が大きいため変数Cの重みは小さい値に調整されることになる。
これにより、前述した指示変数が存在しないバッチプロセスであっても、一定の同期結果を得ることができる。
特開2012-097603号公報
Cenk Undey, Bruce A. Williams, Ali Cinar, "Monitoring of Batch Pharmaceutical Fermentations: Data Synchronization, Landmark Alignment, and Real-time Monitoring", 15th Triennial World Congress, Barcelona, Spain, 2002, IFCA Athanassios Kassidas, John F. MacGregor, "Synchronization of batch trajectories using dynamic time warping", Process Systems Engineering, April 1998 Vol.44, No.4, AIChE Journal Eamonn Keogh, Selina Chu, David Hart, Michael Pazzani,"Segmenting Time Series: A Survey and Novel Approach ", http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.12.9924&rep=rep1&type=pdf
しかしながら、このような従来技術では、バッチプロセスの状況を示す多変量の時系列データ(繰り返しデータ)を時間軸上で同期させる場合、これら時系列データを示す変数のうち、重みの大きい変数との距離が多変量ユークリッド距離を大きく左右することになる。このため、重みの大きい変数に異常なサンプル値を示す異常区間が含まれている場合、サンプル間における適切な対応関係が得られなくなる。
図2は、異常なサンプル値による不適切な対応関係を示す例である。図2には、任意の変数に関する基準データと検証データが示されており、時間区間t1以降において、基準データのサンプル値が異常な値を示している。このような異常区間を含む時系列データを同期処理した場合、例えば図2に示すように、時間区間t2における検証データのサンプル値が、時間軸上で大きく乖離した時間区間t1における基準データのサンプル値に対応付けられてしまう場合がある。
適切な同期処理とは、時間軸上で遠いサンプル同士の対応付けが存在しない同期処理のことを指す。これは、同期処理時、基準データのあるサンプルと検証データのあるサンプルとを対応付けるとき、これらサンプルは時間方向とサンプル値方向において互いに近い、という仮定に基づいている。
異常が発生した変数同士で同期処理を実行した場合、図2に示すように、時間軸上で遠いサンプル同士が対応付けられることがある。
このため、重みの大きい変数に含まれる異常区間に起因して、このような不適切な対応関係が特定された場合、他の全ての変数が不適切な対応関係に基づいて、時間軸上で同期処理されることになり、適切な同期結果を得ることができなくなる。図22は、不適切な同期処理を示す説明図である。例えば図2の対応関係に基づいて、変数Aの時間区間taにおけるサンプルが時間区間tbのサンプルに対応付けられた場合、変数Bの全体のサンプルが、同期処理により、時間区間taから時間区間tbまで時間軸上で圧縮されることになる。
このため、本来、変数Bの検証データには異常がないにも関わらず、その一部区間で基準データと検証データのサンプル値の偏差が大きくなって、誤検知が発生する。
本発明はこのような課題を解決するためのものであり、複数の変数の時系列データを時間軸上において互いに同期させるときに、重みの大きい変数に異常なサンプル値が含まれていても、適切な対応関係に基づいて同期させる同期処理技術を提供することを目的としている。
このような目的を達成するために、本発明にかかる多変量時系列データの同期方法は、複数の変数の時系列データを時間軸上において互いに同期させる、多変量時系列データの同期方法であって、前記複数の変数のそれぞれについて、第1の時系列データXおよび第2の時系列データYを取得するデータ取得ステップと、前記複数の変数のそれぞれについて、前記第1の時系列データXおよび前記第2の時系列データYをそれぞれ複数の時間区間に分割し、前記複数の時間区間のそれぞれに対して割り当てられる評価値を計算する評価値計算ステップと、前記複数の変数のそれぞれについて、前記第1の時系列データXに対する評価値の配列と、前記第2の時系列データYに対する評価値の配列と、前記複数の変数のうち前記第1の時系列データXおよび前記第2の時系列データYが表す変数に割り当てられた重みとに基づいて算出される前記第1の時系列データXに対する第1の重み配列および前記第2の時系列データYに対する第2の重み配列に基づいて、前記複数の変数に関する前記第1の時系列データXのサンプル値と前記第2の時系列データYのサンプル値との間の重み付け距離の総和が最も小さくなるような、前記複数の変数の間で共通する、前記第1の時系列データXのサンプル値と前記第2の時系列データYのサンプル値との対応関係を特定し、その対応関係に基づいて前記複数の変数の時系列データを時間軸上において互いに同期させる同期処理ステップとを有する。
また、本発明にかかる上記多変量時系列データの同期方法の一構成例は、前記複数の変数を変数Zk(k=1~Lの整数)としたとき、前記評価値計算ステップは、前記変数Zkのそれぞれについて、前記第1の時系列データXから、予め設定されたMx(Mxは2以上の整数)個の時間区間ti(i=1~Mxの整数)ごとに第1のサンプル値xiを選択し、予め設定されている時間長εに基づいて前記第1のサンプル値xiの時間区間tiに関する探索区間εiを計算するとともに、前記第2の時系列データYから、予め設定されたMy(Myは2以上の整数)個の時間区間ti(i=1~Myの整数)ごとに第2のサンプル値yiを選択し、前記時間長εに基づいて前記第2のサンプル値yiの時間区間tiに関する探索区間εiを計算する探索区間計算ステップと、前記第1の時系列データXのうち、前記探索区間εi内に存在するNx(Nxは1以上の整数)個の前記第1のサンプル値xj(j=1~Nxの整数)ごとに、前記第2のサンプル値yiと前記第1のサンプル値xjとの間の偏差Δxjを計算するとともに、前記第2の時系列データYのうち、前記探索区間εi内に存在するNy(Nyは1以上の整数)個の前記第2のサンプル値yj(j=1~Nyの整数)ごとに、前記第1のサンプル値xiと前記第2のサンプル値yjとの間の偏差Δyjを計算する偏差計算ステップと、前記時間区間tiの探索区間εiに含まれる前記第2のサンプル値yjに関する前記偏差Δyjのすべてが予め設定されている許容誤差σ以下である場合、前記第1のサンプル値xiの時間区間tiに対する評価値を1とし、それ以外の場合は、前記第1のサンプル値xiの時間区間tiに対する評価値を0とするとともに、前記時間区間tiの探索区間εiに含まれる前記第1のサンプル値xjに関する前記偏差Δxjのすべてが前記許容誤差σ以下である場合、前記第2のサンプル値yiの時間区間tiに対する評価値を1とし、それ以外の場合は、前記第2のサンプル値yiの時間区間tiに対する評価値を0として、前記評価値が1の前記時間区間tiを前記第1の時系列データXに関する同期対象区間Txおよび前記第2の時系列データYに関する同期対象区間Tyとして選択する同期対象区間選択ステップと、を含み、前記同期処理ステップは、前記変数Zkに関する前記第1および第2の時系列データXk,Ykを構成する各サンプル値のうち、当該変数Zkの同期対象区間Txk,Tykに該当するサンプル値に基づいて、前記変数Zkで共通する、前記第1および第2の時系列データXk,Yk間におけるサンプル値同士の対応関係を特定し、当該対応関係に基づいて、前記変数Zkのそれぞれに関する第1および第2の時系列データXk,Ykを時間方向に同期させることを特徴とする。
また、本発明にかかる上記多変量時系列データの同期方法の一構成例において、前記同期処理ステップは、さらに、前記第1の時系列データXに対する第1の重み配列として、前記変数Zkのそれぞれに関する同期対象区間Txkに基づいて、各時間区間における、前記変数Zkに関する重みを示す第1の区間重みWxkを計算するとともに、前記第2の時系列データYに対する第2の重み配列として、前記変数Zkのそれぞれに関する同期対象区間Tykに基づいて、各時間区間における、前記変数Zkに関する重みを示す第2の区間重みWykを計算する区間重み計算ステップを含み、前記同期処理実行ステップは、前記変数Zkのそれぞれに関する前記第1の区間重みWxkおよび前記第2の区間重みWykに基づいて、DTW(Dynamic Time Warping)同期処理を実行するDTW同期処理ステップを含むことを特徴とする。
また、本発明にかかる上記多変量時系列データの同期方法の一構成例において、前記DTW同期処理ステップは、前記DTW同期処理で用いるユークリッド距離として、前記変数Zkのそれぞれに関する、第1の時系列データXkおよび第2の時系列データYkと前記第1の区間重みWxkおよび前記第2の区間重みWykとに基づいて、前記変数Zkのすべてに関する第1の時系列データXと第2の時系列データYとの間の重み付けユークリッド距離dw(X,Y)を計算するステップを含んでいてもよい。
また、本発明にかかる上記多変量時系列データの同期方法の他の構成例は、前記同期処理ステップが、前記複数の変数のそれぞれについて、前記第1の時系列データXに対する評価値の配列と、前記第2の時系列データYに対する評価値の配列と、前記複数の変数のうち前記第1の時系列データXおよび前記第2の時系列データYが表す変数に割り当てられた重みとに基づいて、前記第1の時系列データXに対する第1の重み配列と前記第2の時系列データYに対する第2の重み配列とを計算する重み配列計算ステップを含むことを特徴とする。
また、本発明にかかる上記多変量時系列データの同期方法の他の構成例は、前記評価値計算ステップが、前記複数の変数のそれぞれについて、前記第1の時系列データXおよび前記第2の時系列データYをそれぞれ複数の時間区間に分割し、前記複数の時間区間のそれぞれにおける前記第1の時系列データXおよび前記第2の時系列データYそれぞれの特徴量を計算する特徴量計算ステップと、前記複数の変数のそれぞれについて、前記評価値として、前記複数の時間区間のそれぞれにおける前記第1の時系列データXおよび前記第2の時系列データYそれぞれの特徴量から前記複数の時間区間のそれぞれにおけるサンプル値の信頼度を算出する信頼度算出ステップとを含み、前記同期処理ステップが、前記第1の重み配列および前記第2の重み配列として、前記信頼度と前記複数の変数のうち前記第1の時系列データXおよび前記第2の時系列データYが表す変数に割り当てられた重みとの積を求め、前記複数の時間区間に対する重み配列を計算する重み配列計算ステップと、前記複数の変数のそれぞれについて、前記複数の時間区間に対する重み配列に基づいて、前記複数の変数の間で共通する対応関係に基づいて互いに対応付けられた前記第1の時系列データXのサンプル値と前記第2の時系列データYのサンプル値との間の重み付けユークリッド距離の総和が最も小さくなるような、前記第1の時系列データXのサンプル値と前記第2の時系列データYのサンプル値との対応関係を特定し、その対応関係に基づいて前記複数の変数の時系列データを時間軸上において互いに同期させる同期処理実行ステップを含むことを特徴とする。
また、本発明にかかる多変量時系列データ処理装置は、複数の変数の時系列データを時間軸上において互いに同期させる、多変量時系列データ処理装置であって、前記複数の変数のそれぞれについて、第1の時系列データXおよび第2の時系列データYを取得するように構成されたデータ取得部(15A)と、前記複数の変数のそれぞれについて、前記第1の時系列データXおよび前記第2の時系列データYをそれぞれ複数の時間区間に分割し、前記複数の時間区間のそれぞれに対して割り当てられる評価値を計算するように構成された評価値計算部(15B、25B)と、前記複数の変数のそれぞれについて、前記第1の時系列データXに対する評価値の配列と、前記第2の時系列データYに対する評価値の配列と、前記複数の変数のうち前記第1の時系列データXおよび前記第2の時系列データYが表す変数に割り当てられた重みとに基づいて算出される前記第1の時系列データXに対する第1の重み配列および前記第2の時系列データYに対する第2の重み配列に基づいて、前記複数の変数に関する前記第1の時系列データXのサンプル値と前記第2の時系列データYのサンプル値との間の重み付け距離の総和が最も小さくなるような、前記複数の変数の間で共通する、前記第1の時系列データXのサンプル値と前記第2の時系列データYのサンプル値との対応関係を特定し、その対応関係に基づいて前記複数の変数の時系列データを時間軸上において互いに同期させるように構成された同期処理部(15C、25C)と、を有する。
また、本発明にかかる上記多変量時系列データ処理装置の一構成例は、前記複数の変数を変数Zk(k=1~Lの整数)としたとき、前記評価値計算部(15B)が、前記変数Zkのそれぞれについて、前記第1の時系列データXから、予め設定されたMx(Mxは2以上の整数)個の時間区間ti(i=1~Mxの整数)ごとに第1のサンプル値xiを選択し、予め設定されている時間長εに基づいて前記第1のサンプル値xiの時間区間tiに関する探索区間εiを計算するとともに、前記第2の時系列データYから、予め設定されたMy(Myは2以上の整数)個の時間区間ti(i=1~Myの整数)ごとに第2のサンプル値yiを選択し、前記時間長εに基づいて前記第2のサンプル値yiの時間区間tiに関する探索区間εiを計算するように構成された探索区間計算部(16A)と、前記第1の時系列データXのうち、前記探索区間εi内に存在するNx(Nxは1以上の整数)個の前記第1のサンプル値xj(j=1~Nxの整数)ごとに、前記第2のサンプル値yiと前記第1のサンプル値xjとの間の偏差Δxjを計算するとともに、前記第2の時系列データYのうち、前記探索区間εi内に存在するNy(Nyは1以上の整数)個の前記第2のサンプル値yj(j=1~Nyの整数)ごとに、前記第1のサンプル値xiと前記第2のサンプル値yjとの間の偏差Δyjを計算するように構成された偏差計算部(16B)と、前記時間区間tiの探索区間εiに含まれる前記第2のサンプル値yjに関する前記偏差Δyjのすべてが予め設定されている許容誤差σ以下である場合、前記第1のサンプル値xiの時間区間tiに対する評価値を1とし、それ以外の場合は、前記第1のサンプル値xiの時間区間tiに対する評価値を0とするとともに、前記時間区間tiの探索区間εiに含まれる前記第1のサンプル値xjに関する前記偏差Δxjのすべてが前記許容誤差σ以下である場合、前記第2のサンプル値yiの時間区間tiに対する評価値を1とし、それ以外の場合は、前記第2のサンプル値yiの時間区間tiに対する評価値を0として、前記評価値が1の前記時間区間tiを前記第1の時系列データXに関する同期対象区間Txおよび前記第2の時系列データYに関する同期対象区間Tyとして選択するように構成された同期対象区間選択部(16C)と、を含み、前記同期処理部(15C)が、前記変数Zkに関する前記第1および第2の時系列データXk,Ykを構成する各サンプル値のうち、当該変数Zkの同期対象区間Txk,Tykに該当するサンプル値に基づいて、前記変数Zkで共通する、前記第1および第2の時系列データXk,Yk間におけるサンプル値同士の対応関係を特定し、当該対応関係に基づいて、前記変数Zkのそれぞれに関する第1および第2の時系列データXk,Ykを時間方向に同期させるように構成されたことを特徴とする。
また、本発明にかかる上記多変量時系列データ処理装置の一構成例において、前記同期処理部(25C)は、前記複数の変数のそれぞれについて、前記第1の時系列データXに対する評価値の配列と、前記第2の時系列データYに対する評価値の配列と、前記複数の変数のうち前記第1の時系列データXおよび前記第2の時系列データYが表す変数に割り当てられた重みとに基づいて、前記第1の時系列データXに対する第1の重み配列と前記第2の時系列データYに対する第2の重み配列とを計算するように構成された重み配列計算部(26C)を含むことを特徴とする。
また、本発明にかかる上記多変量時系列データ処理装置の他の構成例は、前記評価値計算部(25B)が、前記複数の変数のそれぞれについて、前記第1の時系列データXおよび前記第2の時系列データYをそれぞれ複数の時間区間に分割し、前記複数の時間区間のそれぞれにおける前記第1の時系列データXおよび前記第2の時系列データYそれぞれの特徴量を計算するように構成された特徴量計算部(26A)と、前記複数の変数のそれぞれについて、前記評価値として、前記複数の時間区間のそれぞれにおける前記第1の時系列データXおよび前記第2の時系列データYそれぞれの特徴量から前記複数の時間区間のそれぞれにおけるサンプル値の信頼度を算出するように構成された信頼度算出部(26B)と を含み、前記同期処理部(25C)が、前記第1の重み配列および前記第2の重み配列として、前記信頼度と前記複数の変数のうち前記第1の時系列データXおよび前記第2の時系列データYが表す変数に割り当てられた重みとの積を求め、前記複数の時間区間に対する重み配列を計算するように構成された重み配列計算部(26C)と、前記複数の変数のそれぞれについて、前記複数の時間区間に対する重み配列に基づいて、前記複数の変数の間で共通する対応関係に基づいて互いに対応付けられた前記第1の時系列データXのサンプル値と前記第2の時系列データYのサンプル値との間の重み付けユークリッド距離の総和が最も小さくなるような、前記第1の時系列データXのサンプル値と前記第2の時系列データYのサンプル値との対応関係を特定し、その対応関係に基づいて前記複数の変数の時系列データを時間軸上において互いに同期させるように構成された同期処理実行部(26D)とを含むことを特徴とする。
本発明によれば、複数の変数のそれぞれについて、前記第1の時系列データXに対する評価値の配列と、前記第2の時系列データYに対する評価値の配列と、前記複数の変数のうち前記第1の時系列データXおよび前記第2の時系列データYが表す変数に割り当てられた重みとに基づいて算出される前記第1の時系列データXに対する第1の重み配列および前記第2の時系列データYに対する第2の重み配列に基づいて、前記複数の変数の間で共通する、前記第1の時系列データXのサンプル値と前記第2の時系列データYのサンプル値との対応関係を特定するので、複数の変数の時系列データを時間軸上において互いに同期させるときに、重みの大きい変数に異常なサンプル値が含まれていても、適切な対応関係に基づいて同期させることができる。
図1は、本発明の第1の実施の形態に係るデータ処理装置の構成を示すブロック図である。 図2は、多変量の時系列データの例である。 図3は、同期対象区間データの構成例である。 図4は、区間重みデータの構成例である。 図5は、同期動作を示すフローチャートである。 図6は、同期対象区間特定動作を示すフローチャートである。 図7は、第1の時系列データに関する同期対象区間特定動作の動作例を説明する図である。 図8は、第2の時系列データに関する同期対象区間特定動作の動作例を説明する図である。 図9は、第1の時系列データに関する同期対象区間特定動作の動作例を説明する図である。 図10は、第2の時系列データに関する同期対象区間特定動作の動作例を説明する図である。 図11は、区間重みの算出例を説明する図である。 図12は、本発明の第2の実施の形態に係るデータ処理装置の構成を示すブロック図である。 図13は、本発明の第2の実施の形態に係るデータ処理装置の動作を説明するフローチャートである。 図14は、本発明の第2の実施の形態に係るデータ処理装置、特に評価値計算部の動作を説明するフローチャートである。 図15Aは、時系列データを複数のセグメントに分割する様子を示す概念図である。 図15Bは、評価値(信頼度)の考え方を説明する図である。 図15Cは、評価値(信頼度)の配列を説明する図である。 図16は、同期処理における2つの時系列データの対応関係を説明する図である。 図17は、繰り返しデータを示す説明図である。 図18は、同期処理で用いられるサンプル同士の対応関係を示す説明図である。 図19は、従来の同期処理で用いられる指示変数の例を示す説明図である。 図20は、従来の同期処理で用いられる各変数の重みの調整例である。 図21は、異常なサンプル値による不適切な対応関係を示す例である。 図22は、不適切な同期処理を示す説明図である。
次に、本発明の実施の形態について図面を参照して説明する。
[第1の実施の形態]
[データ処理装置]
まず、図1を参照して、本実施の形態にかかるデータ処理装置10について説明する。図1は、データ処理装置の構成を示すブロック図である。
このデータ処理装置10は、入力された多変量の時系列データを時間軸上で同期させる同期処理を行う装置である。データ処理装置10は、全体としてサーバ装置、パーソナルコンピュータ、産業用コントローラなどの情報処理装置(コンピュータ)により構成されており、通信回線21を介して上位装置20と接続されている。
以下では、上位装置20が、バッチプロセスの状況を示す多変量の時系列データ(繰り返しデータ)に基づいて、バッチプロセスで発生した異常を検知する異常検知装置であり、データ処理装置10が、上位装置20から取得した多変量の時系列データを時間軸上で同期させる同期処理を行い、得られた同期結果データを上位装置20へ出力する場合を例として説明する。なお、本発明にかかるデータ処理装置10は、異常検知用の同期結果データを生成する場合に限定されるものではなく、例えば、多変量の時系列データを時間軸上で同期させる場合であれば、いずれの場合にも適用できる。
図1に示すように、データ処理装置10は、主な構成として、通信I/F部11、操作入力部12、画面表示部13、記憶部14、および演算処理部15を備えている。
通信I/F部11は、通信回線21を介して上位装置20とデータ通信を行うことにより、同期処理の基準となる基準データや、異常検知の対象となる検証データ、さらには同期処理により得られた同期結果データを、上位装置20との間でやり取りする機能を有している。
操作入力部12は、キーボード、マウス、タッチパネルなどの操作入力装置からなり、オペレータの操作を検出して演算処理部15へ出力する機能を有している。
画面表示部13は、LCDなどの画面表示装置からなり、演算処理部15から出力された、メニュー画面、設定画面、処理結果画面などの各種画面データを画面表示する機能を有している。
記憶部14は、ハードディスクや半導体メモリなどの記憶装置からなり、演算処理部15で実行する同期処理で用いる各種の処理データやプログラム14Pを記憶する機能を有している。
プログラム14Pは、データ処理装置10に接続された外部機器や記録媒体(ともに図示せず)から、予め記憶部14に格納される。
記憶部14で記憶する主な処理データとして、時系列データ14A、同期対象区間データ14B、区間重みデータ14C、同期結果データ14Dがある。
時系列データ14Aは、例えばバッチプロセスの進捗を示す多変量の時系列データからなり、一連のバッチプロセスが実行されるバッチ区間ごとに、同様に変化する繰り返しデータが含まれている。図2は、多変量の時系列データの例である。図2の例では、4つの変数A,B,C,Dに関する時系列データ(繰り返しデータ)が示されており、各変数の時系列データには、例えば基準データからなる第1の系列データXと、検証データからなる第2の時系列データYとが含まれている。
同期処理では、これら変数A,B,C,Dのそれぞれに関する2つの時系列データX,Yが、各変数で共通するサンプル値同士の対応関係に基づき時間軸上で伸縮・シフトされて、同一時間長を有する時系列データに変換される。なお、時系列データ14Aの時系列データを構成する各サンプル値は、一定の周期でサンプリングされたデータを示しており、以下では、この周期を時間区間という。したがって、1つの時間区間には1つのサンプル値が対応していることになる。
同期対象区間データ14Bは、各時間区間における各変数のサンプル値が、同期処理の対象として適切であるかどうか、どの時間区間であれば適切な同期処理を実行できるか、を示す配列データである。図3は、同期対象区間データの構成例である。図3の例では、時間区間(サンプル値)ごとに、同期処理の対象として適切である時間区間(サンプル値)が「1」で表され、適切でない時間区間(サンプル値)が「0」で表されている。したがって、例えば時間区間tiにおける変数Cの同期対象区間データが「0」であり、時間区間tiにおいて変数Cは同期対象として適切ではないことを示している。
図3に示すように、同期対象区間データ14Bには、同期対象となる第1および第2の時系列データX,Yに対応して、第1の同期対象区間データ(Tx)と第2の同期対象区間データ(Yy)が存在する。
一方の時系列データのサンプル値を基準として他方の時系列データのサンプル値の異常有無を判定した場合、判定する方向によって、得られる結果、すなわち異常有無が異なる場合があるからである。
以下では、同期対象区間データ14Bとして両方向に関するデータを用いる場合を例として説明するが、これに限定されるものではない。例えば、アプリケーションによって、判定する方向による異常有無の誤差が無視できる程度であれば、いずれか一方の同期対象区間データを両方向のデータとして兼用してもよい。このことは、同期対象区間データ14Bに限らず、区間重みデータ14Cについても同様である。
区間重みデータ14Cは、各時間区間における各変数に関する、同期処理で用いる重みを示す配列データである。図4は、区間重みデータの構成例である。
図4に示すように、区間重みデータ14Cには、同期対象となる第1および第2の時系列データX,Yに対応して、第1の区間重みデータ(Wx)と第2の区間重みデータ(Wy)が存在する。
図4の例では、時間区間(サンプル値)ごとに、変数A,B,C,Dの重みが登録されている。これら変数A,B,C,D重みは、同一時間区間において各重みの合計が「1」となるよう正規化されている。したがって、例えば時間区間tiにおいて変数Cは同期対象として適切ではない場合、変数Cの重みは「0」となり、時間区間ti-1までの変数Cの重みは他の変数A,B,Dに按分されることになる。
同期結果データ14Dは、同期処理により得られた同期結果を示すデータである。この際、各変数で共通するサンプル値同士の対応関係に基づいて、時系列データ14Aを時間軸上で伸縮・シフトして得られた新たな時系列データを、同期結果データ14Dとして出力してもよく、伸縮・シフトの処理内容を示すパラメータを同期結果データ14Dとして出力してもよい。
演算処理部15は、CPUとその周辺回路を備え、記憶部14のプログラム14PをCPUで実行して、ハードウェア(CPU)とソフトウェア(プログラム)とを協働させることにより、同期処理を行う各種の処理部を実現する機能を有している。
演算処理部15で実現される主な処理部として、データ取得部15A、同期対象区間特定部15B、同期処理部15Cがある。
データ取得部15Aは、通信I/F部11および通信回線21を介して上位装置20から時系列データ14Aを取得して記憶部14に保存する機能を有している。
同期対象区間特定部15Bは、L(Lは2以上の整数)個の変数Zk(k=1~Lの整数)ごとに、記憶部14の時系列データ14Aに含まれる、変数Zkに関する2つの時系列データXk,Ykを構成するサンプル値に基づいて同期対象区間Txk,Tykを特定し、同期対象区間データ14Bとして記憶部14に保存する機能を有している。
同期対象区間特定部15Bは、主な処理部として、探索区間計算部16A、偏差計算部16B、および同期対象区間選択部16Cを備えている。
本実施の形態において、同期対象区間特定部15Bは、同期対象区間Txk,Tykを特定するにあたり、2つの時系列データXk,Ykを構成するサンプル値が属する時間区間に対し、選択を表す「1」または選択しないことを表す「0」を評価値として割り当てることから、本発明における「評価値計算部」として作用する。
同期対象区間特定部15Bは、主な処理部として、探索区間計算部16A、偏差計算部16B、および同期対象区間選択部16Cを備えている。
探索区間計算部16Aは、第1の時系列データ(基準データ)Xから、予め設定されたMx(Mxは2以上の整数)個の時間区間ti(i=1~Mxの整数)ごとに第1のサンプル値xiを選択し、予め設定されている時間長εに基づいて第1のサンプル値xiの時間区間tiに関する探索区間εiを計算する機能と、第2の時系列データ(検証データ)Yから、予め設定されたMy(Myは2以上の整数)個の時間区間ti(i=1~Myの整数)ごとに第2のサンプル値yiを選択し、時間長εに基づいて第2のサンプル値yiの時間区間tiに関する探索区間εiを計算する機能とを有している。
この際、Mxは第1の時系列データXのサンプル数に相当し、Myは第2の時系列データYのサンプル数に相当する。また、εiはtiを中心として配置してもよく、tiを先頭または末尾として配置してもよい。これにより、探索区間計算部16Aでは、第1の時系列データXのxiごと、および第2の時系列データYのyiごとに、例えばxi,yiの時間区間tiを中心とした時間長εの幅を有する時間範囲が探索区間εiとして計算される。
偏差計算部16Bは、第2の時系列データYのうち、探索区間εi内に存在するNy(Nyは1以上の整数)個の第2のサンプル値yj(j=1~Nyの整数)ごとに、第1のサンプル値xiと第2のサンプル値yjとの間の偏差Δxjを計算する機能と、第1の時系列データXのうち、探索区間εi内に存在するNx(Nxは1以上の整数)個の第1のサンプル値xj(j=1~Nxの整数)ごとに、第1のサンプル値xjと第2のサンプル値yiとの間の偏差Δyjを計算する機能とを有している。
この際、NyおよびNxは探索区間εi内に含まれるサンプル数に相当する。これにより、偏差計算部16Bでは、Mx個のxiごとに、xiとεi内に存在するNy個のyjとの偏差Δxjが計算され、My個のyiごとに、yiとεi内に存在するNx個のxjとの偏差Δyjが計算される。
同期対象区間選択部16Cは、時間区間tiの探索区間εiに含まれる第2のサンプル値yjに関する偏差Δyjのすべてが予め設定されている許容誤差σ以下である場合、時間区間tiを第1の時系列データXに関する同期対象区間Txとして選択する機能と、時間区間tiの探索区間εiに含まれる第1のサンプル値xjに関する偏差Δxjのすべてが許容誤差σ以下である場合、時間区間tjを第2の時系列データYに関する同期対象区間Tyとして選択する機能とを有している。
これにより、同期対象区間選択部16Cでは、xiに対してεi内に存在するyjのすべてがσの中に納まっている場合、xiすなわちXのtiが同期対象区間Txとして選択され、yiに対してεi内に存在するxjのすべてがσの中に納まっている場合、yiすなわちYのtiが同期対象区間Tyとして選択される。なお、εやσの値については、過去に得られた時系列データから経験的に決定すればよい。εおよびσの値は、基本的には同一変数についてそれぞれ一意である。
同期処理部15Cは、同期対象区間選択部16Cによって選択された区間のデータを用いて同期処理を行う機能部である。本実施の形態においては、同期処理部15Cは、区間重み計算部16Dと同期処理実行部16Eとを含んでいる。
区間重み計算部16Dは、記憶部14の時系列データ14Aと同期対象区間データ14Bを参照して、L(Lは2以上の整数)個の変数Zk(k=1~Lの整数)のそれぞれに関する同期対象区間Txkに基づいて、時間区間tiのそれぞれにおける、変数Zkの第1の時系列データXkに関する重みを示す区間重みWxkを計算する機能と、変数Zkのそれぞれに関する同期対象区間Tykに基づいて、時間区間tiのそれぞれにおける、変数Zkの第2の時系列データYkに関する重みを示す区間重みWykを計算する機能とを備えている。
この際、具体的な区間重みの計算手法については、前述した特許文献1や非特許文献2などで述べられている公知の手法を用いればよい。これにより、区間重み計算部16Dでは、tiのそれぞれにおける、ZkのXkに関するWxkとZkのYkに関するWykとが計算される。
同期処理実行部16Eは、変数Zkに関する第1および第2の時系列データXk,Ykを構成する各サンプル値のうち、当該変数Zkの同期対象区間Txk,Tykの少なくともいずれか一方に該当するサンプル値に基づいて、変数Zkで共通する、第1および第2の時系列データXk,Yk間におけるサンプル値同士の対応関係を特定する機能と、当該対応関係に基づいて、変数Zkのそれぞれに関する第1および第2の時系列データXk,Ykを時間軸上で同期させる同期処理を実行する機能とを有している。
より具体的には、同期処理実行部16Eは、区間重み計算部16Dで計算した変数Zkのそれぞれに関する第1および第2の区間重みWxk,Wykに基づいて、DTW(Dynamic Time Warping)同期処理を実行する機能と、DTW同期処理で用いるユークリッド距離として、変数Zkのそれぞれに関する、第1および第2の時系列データXk,Ykと第1および第2の区間重みWxk,Wykとに基づいて、変数Zkのすべてに関する第1の時系列データXと第2の時系列データYとの間の重み付けユークリッド距離dw(X,Y)を計算する機能とを有している。
変数Zの数をLとし、第1および第2の時系列データXk,Ykのサンプル数をPk,Qkとし、時間区間tiにおけるXk,Ykのサンプル値をxki,ykiとし、時間区間tiにおける第1および第2の区間重みをWxki,Wykiとし、時間区間tjにおける第1および第2の時系列データXk,Ykのサンプル値をxkj,ykjとし、時間区間tjにおける第1および第2の区間重みをWxkj,Wykjとした場合、すべての変数Zに関するユークリッド距離の総和を示す多変量の重み付けユークリッド距離dw(X,Y)は、次の式(3)で計算される。
Figure 0007051503000003
これにより、同期処理実行部16Eでは、Zkの同期対象区間Txk,Tykの少なくともいずれか一方に該当するサンプル値に基づいて同期処理が実行される。より具体的には、区間重み計算部16Dで計算したWxk,Wykに基づいてDTW同期処理が実行され、その際、ユークリッド距離として、Wxk,Wykを用いた重み付けユークリッド距離dw(X,Y)が用いられる。
[本実施の形態の動作]
次に、図5を参照して、本実施の形態にかかるデータ処理装置10の同期動作について説明する。図5は、同期動作を示すフローチャートである。
データ処理装置10の演算処理部15は、操作入力部12で検出されたオペレータ操作や、通信I/F部11で受信した上位装置20からの指示に応じて、図5の同期動作を実行する。
まず、通信I/F部11および通信回線21を介して上位装置20から時系列データ14Aを取得して記憶部14に保存する(ステップS100)。
次に、同期対象区間特定部15Bは、変数Zk(k=1~Lの整数)ごとに、記憶部14の時系列データ14Aに含まれる、変数Zkに関する2つの時系列データXk,Ykを構成するサンプル値に基づいて同期対象区間Txk,Tykを特定し、同期対象区間データ14Bとして記憶部14に保存する(ステップS101)。
この後、区間重み計算部16Dは、記憶部14の時系列データ14Aと同期対象区間データ14Bを参照して、変数Zkごとに、同期対象区間Txkに基づいて、変数Zkの第1の時系列データXkに関する重みを示す区間重みWxkを計算するとともに(ステップS102)、同期対象区間Tykに基づいて、変数Zkの第2の時系列データYkに関する重みを示す区間重みWykを計算する(ステップS103)。
続いて、同期処理実行部16Eは、変数Zkに関する第1および第2の時系列データXk,Ykを構成する各サンプル値のうち、当該変数Zkの同期対象区間Txk,Tykの少なくともいずれか一方に該当するサンプル値に基づいて、変数Zkで共通する、第1および第2の時系列データXk,Yk間におけるサンプル値同士の対応関係を特定した後、当該対応関係に基づいて、変数Zkのそれぞれに関する第1および第2の時系列データXk,Ykを時間軸上で同期させる同期処理を実行し(ステップS104)、一連の同期動作を終了する。
次に、図6を参照して、本実施の形態にかかるデータ処理装置10における同期対象区間特定動作について説明する。図6は、同期対象区間特定動作を示すフローチャートである。
同期対象区間特定部15Bは、図5のステップ101において、変数Zkごとに、図6の同期対象区間特定動作を実行する。図6では、理解を容易とするため変数Zを特定するインデックスkを省略して説明する。また、図6では、第1の時系列データXに関する同期対象区間Txを特定する場合を例として説明するが、第2の時系列データYに関する同期対象区間Tyを特定する場合も同様であり、ここでの説明は省略する。
まず、探索区間計算部16Aは、記憶部14の同期対象区間データ14Bに含まれる、各時間区間tiに関するTxiを、同期処理に適切でない非対象区間を示す「0」でそれぞれ初期化し(ステップS110)、Xに対応する時間区間ti(i=1~Mxの整数)を処理対象として順に選択するループ処理LPiを開始する(ステップS111)。
LPiにおいて、まず、探索区間計算部16Aは、処理対象として選択されたtiにおける第1のサンプル値xiをXから取得し(ステップS112)、予め設定されている時間長εに基づいてtiに関する探索区間εiを計算する(ステップS113)。
次に、偏差計算部16Bは、Yのうち、探索区間εi内に対応する時間区間tj(j=1~Nyの整数)を処理対象として順に選択するループ処理LPjを開始する(ステップS114)。
LPjにおいて、まず、偏差計算部16Bは、処理対象として選択されたtjにおける第2のサンプル値yjをYから取得し(ステップS115)、xiとyjとの間の偏差Δxjを計算する(ステップS116)。
偏差計算部16Bは、jがNyに到達するまで、これらステップS115,S116を繰り返し実行した後、LPjを終了する(ステップS117)。
この後、同期対象区間選択部16Cは、tiのεiに含まれるyjに関する偏差Δyjのすべてが予め設定されている許容誤差σ以下であるか確認し(ステップS118)、Δyjのすべてがσ以下である場合(ステップS118:YES)、Txiに対して同期処理に適切である対象区間を示す「1」を設定して、tiをXに関する同期対象区間として選択する(ステップS119)。また、Δyjのいずれか1つでもσより大きい場合(ステップS118:NO)、tiを同期対象区間として選択せず、Txiは「0」のままとする。
同期対象区間選択部16Cは、iがMxに到達するまで、これらステップS112~S119を繰り返し実行した後、LPiを終了し(ステップS120)、一連の同期対象区間特定動作を終了する。
図7は、第1の時系列データに関する同期対象区間特定動作を示す動作例である。図7では、前述した図2の変数Aにおける第1の時系列データXに関する同期対象区間Txを特定する場合の例が示されている。
図7に示すように、同期対象区間特定動作では、時間区間ti(i=1~Mx)を中心とする時間長εの探索区間εiに対して、tiにおけるXのサンプル値xiを中心とした許容誤差σが設定され、εi内に含まれるYのサンプル値yj(j=1~Ny)のすべてがσ内に納まっているかどうかに基づいて、tiがXの同期対象区間であるか否か判定される。
図7のうち、動作例Ex1では、εi内に含まれるすべてのyjがσ内に納まっているため、この場合のtiはXの同期対象区間であると判定される。
一方、動作例Ex2では、εi内に含まれるすべてのyjがσ内に納まっておらず、一部のyjがσ外であるため、この場合のtiはXの同期対象区間ではないと判定される。
また、動作例Ex3では、εi内に含まれるyjが存在しないため、この場合のtiはXの同期対象区間ではないと判定される。
図8は、第2の時系列データに関する同期対象区間特定動作を示す動作例である。図8では、前述した図2の変数Aにおける第2の時系列データYに関する同期対象区間Tyを特定する場合の例が示されている。
図8に示すように、同期対象区間特定動作では、時間区間ti(i=1~My)を中心とする時間長εの探索区間εiに対して、tiにおけるYのサンプル値yiを中心とした許容誤差σが設定され、εi内に含まれるXのサンプル値xj(j=1~Nx)のすべてがσ内に納まっているかどうかに基づいて、tiがYの同期対象区間であるか否か判定される。
図8のうち、動作例Ex1では、εi内に含まれるすべてのxjがσ内に納まっているため、この場合のtiはYの同期対象区間であると判定される。
一方、動作例Ex2では、εi内に含まれるすべてのxjがσ内に納まっておらず、一部のxjがσ外であるため、この場合のtiはYの同期対象区間ではないと判定される。
図9は、第1の時系列データに関する同期対象区間特定動作を示す他の動作例である。図9では、前述した図2の変数Cにおける第1の時系列データXに関する同期対象区間Txを特定する場合の例が示されている。
図9に示すように、同期対象区間特定動作では、時間区間ti(i=1~Mx)を中心とする時間長εの探索区間εiに対して、tiにおけるXのサンプル値xiを中心とした許容誤差σが設定され、εi内に含まれるYのサンプル値yj(j=1~Ny)のすべてがσ内に納まっているかどうかに基づいて、tiがXの同期対象区間であるか否か判定される。
図9のうち、動作例Ex1では、εi内に含まれるすべてのyjがσ内に納まっているため、この場合のtiはXの同期対象区間であると判定される。
一方、動作例Ex2では、εi内に含まれるすべてのyjがσ外であるため、この場合のtiはXの同期対象区間ではないと判定される。
図10は、第2の時系列データに関する同期対象区間特定動作を示す他の動作例である。図10では、前述した図2の変数Cにおける第2の時系列データYに関する同期対象区間Tyを特定する場合の例が示されている。
図10に示すように、同期対象区間特定動作では、時間区間ti(i=1~My)を中心とする時間長εの探索区間εiに対して、tiにおけるYのサンプル値yiを中心とした許容誤差σが設定され、εi内に含まれるXのサンプル値xj(j=1~Nx)のすべてがσ内に納まっているかどうかに基づいて、tiがYの同期対象区間であるか否か判定される。
図10のうち、動作例Ex1では、εi内に含まれるすべてのxjがσ内に納まっているため、この場合のtiはYの同期対象区間であると判定される。
一方、動作例Ex2では、εi内に含まれるすべてのxjがσ内に納まっておらず、すべてのxjがσ外であるため、この場合のtiはYの同期対象区間ではないと判定される。
図11は、区間重みの算出例である。区間重み計算部16Dは、時系列データ14Aと同期対象区間データ14Bを参照して、時間区間tiのそれぞれにおける、各変数の第1および第2の時系列データX,Yに関する重みを示す区間重みWx,Wyを計算する。
図11のWxでは、変数A,B,C,Dについて、時間区間t1以前の期間が、一部の時間区間を除いて同期対象区間であると特定されており、これら変数A,B,C,Dに対して、総和が「1」となるよう区間重みが按分されている。一方、時間区間t1以降の期間は、変数Cの同期対象区間ではないと特定されており、変数A,B,Dに対して、総和が「1」となるよう区間重みが按分されている。
また、図11のWyでは、変数A,B,C,Dについて、時間区間t2以前の期間が、一部の時間区間を除いて同期対象区間であると特定されており、これら変数A,B,C,Dに対して、総和が「1」となるよう区間重みが按分されている。一方、時間区間t2以降の期間は、変数Cの同期対象区間ではないと特定されており、変数A,B,Dに対して、総和が「1」となるよう区間重みが按分されている。
[本実施の形態の効果]
このように、本実施の形態は、探索区間計算部16Aが、第1の時系列データXから、時間区間tiごとに第1のサンプル値xiを選択し、予め設定されている時間長εに基づいてxiのtiに関する探索区間εiを計算し、偏差計算部16Bが、第2の時系列データYのうちεi内に存在する第2のサンプル値yjごとに、xiとyjとの間の偏差Δyjを計算し、同期対象区間選択部16Cが、εiに含まれるyjに関するΔyjのすべてが予め設定されている許容誤差σ以下である場合、tiをXに関する同期対象区間Txとして選択するようにしたものである。
また、探索区間計算部16Aが、Yからtiごとにyiを選択し、εに基づいてyiのtiに関するεiを計算し、偏差計算部16Bが、Xのうちεi内に存在するxjごとに、yiとxjとの間の偏差Δxjを計算し、同期対象区間選択部16Cが、εiに含まれるxjに関するΔxjのすべてがσ以下である場合、tiをYに関する同期対象区間Tyとして選択するようにしたものである。
これにより、tiにおけるXのxiに対して、時間方向とサンプル値方向において、ある程度近しいサンプル値がYに含まれている場合、tiがXのTxとして選択される。また、tiにおけるYのyiに対して、時間方向とサンプル値方向において、ある程度近しいサンプル値がXに含まれている場合、tiがYのTyとして選択される。このため、Tx,Tyでは、XのxiとYのyiとを対応付ける際、XまたはYのいずれか一方のサンプル値に近してサンプル値が他方のXまたはYに含まれていることになる。
したがって、時系列データから異常区間を省いた同期対象区間を特定し、同期対象区間に該当するサンプル値に基づいて、サンプル値同士の対応関係を特定することできるので、時間方向あるいはサンプル値方向において大きく乖離したサンプル値同士の対応付けを回避することができ、時系列データから同期処理に適用すべき同期対象区間を適切に特定することが可能となる。
また、本実施の形態において、同期対象区間特定部15Bが、前述した同期処理方法に基づいて、変数Zkごとに、第1の時系列データXに関する同期対象区間Txを特定し、同期処理実行部16Eが、Zkに関する第1および第2の時系列データXk,Ykを構成する各サンプル値のうち、ZkのTxkに該当するサンプル値に基づいて、各Zkで共通する、Xk,Yk間におけるサンプル値同士の対応関係を特定し、当該対応関係に基づいて、Zkのそれぞれに関するXk,Ykを時間軸上で同期させる同期処理を実行するようにしてもよい。
また、本実施の形態において、同期対象区間特定部15Bが、前述した同期処理方法に基づいて、変数Zkごとに、第1および第2の時系列データXk,Ykに関する同期対象区間Txk,Tykを特定し、同期処理実行部16Eが、Zkに関するXk,Ykを構成する各サンプル値のうち、ZkのTxk,Tykの少なくともいずれか一方に該当するサンプル値に基づいて、各Zkで共通する、Xk,Yk間におけるサンプル値同士の対応関係を特定し、当該対応関係に基づいて、Zkのそれぞれに関するXk,Ykを時間軸上で同期させる同期処理を実行するようにしてもよい。
これにより、任意の変数に誤差が含まれるような場合であっても、多変量の時系列データを、高い精度で時間軸上で同期させることができる。したがって、本発明にかかる同期処理により、バッチプロセスの進行度合いを表す多変量の時系列データを同期処理した場合には、バッチプロセスに関する異常有無を正確に検知することが可能となる。
また、本実施の形態において、区間重み計算部16Dが、変数Zkのそれぞれに関する同期対象区間Txkに基づいて、時間区間tiのそれぞれにおける、Zkに関する重みを示す第1の区間重みWxkを計算し、同期処理実行部16Eが、Zkのそれぞれに関するWxkに基づいて、DTW同期処理を実行するようにしてもよい。この際、同期処理実行部16Eが、DTW同期処理で用いるユークリッド距離として、Zkのそれぞれに関するXk,YkとWxkとに基づいて、Zkのすべてに関するXとYとの間の重み付けユークリッド距離dw(X,Y)を計算するようにしてもよい。
これにより、Zkに含まれるノイズの影響を抑制でき、安定した同期処理を実現することができる。
また、本実施の形態において、区間重み計算部16Dが、変数Zkのそれぞれに関する同期対象区間Txkに基づいて、時間区間tiのそれぞれにおける、Zkに関する重みを示す区間重みWxkを計算し、Zkのそれぞれに関する同期対象区間Tykに基づいて、tiのそれぞれにおける、Zkに関する重みを示す区間重みWykを計算し、同期処理実行部16Eが、Zkのそれぞれに関するWxk,Wykに基づいて、DTW同期処理を実行するようにしてもよい。この際、同期処理実行部16Eが、DTW同期処理で用いるユークリッド距離として、Zkのそれぞれに関する、Xk,YkとWxk,Wykとに基づいて、Zkのすべてに関するXとYとの間の重み付けユークリッド距離dw(X,Y)を計算するようにしてもよい。
これにより、Zkに含まれるノイズの影響を抑制でき、安定したより高い精度の同期処理を実現することができる。
[第2の実施の形態]
次に本発明の第2の実施の形態に係るデータ処理装置について図12乃至図16を参照して説明する。
[第2の実施の形態の概要]
上述した第1の実施の形態においては、時系列データから異常なサンプル値を除くことによってより高い精度の同期処理を実現した。また、時系列データから異常なサンプル値を除くために、2つの時系列データX、Yに対して「探索区間」を設定し、互いに対応する探索区間εiに含まれるサンプル値の誤差に基づいて、同期処理に用いるサンプル値を含む区間、すなわち同期対象区間を選択する技術についても具体的に説明した。このように同期対象区間を選択する第1の実施の形態は、本発明における「複数の時間区間のそれぞれに対して割り当てられる評価値」が0または1のいずれかを取り得る場合に該当する。
これに対し、第2の実施の形態に係るデータ処理装置においては、「複数の時間区間のそれぞれに対して割り当てられる評価値」は、連続した値(例えば、規格化した場合は0~1までの値)を取り得るものとする。このような評価値は、第1の時系列データXおよび第2の時系列データYの複数の時間区間のそれぞれにおけるサンプル値の、同期処理における信頼度を表すと考え、これを「信頼度」と呼ぶことがある。
複数の時間区間における時系列データの評価値または信頼度は、変数ごとに異なる場合があると考えられる。後述するように、本実施の形態においては、変数毎にこのような評価値または信頼度を算出して、第1の時系列データXおよび第2の時系列データYに関する「評価値の配列」を構成し、この評価値の配列と変数に割り当てられた重みとに基づいて、DTW同期処理その他の同期処理を行って、複数の変数の時系列データを時間軸上において互いに同期させるのである。
[データ処理装置の構成]
図12に第2の実施の形態に係るデータ処理装置100の構成を示す。なお、第1の実施の形態に係るデータ処理装置と同一の構成要素については同一の符号を用いることとし、その詳細な説明は省略する。
第2の実施の形態に係るデータ処理装置100は、主な構成として、通信I/F部11、操作入力部12、画面表示部13、記憶部140、および演算処理部150を備えている。データ処理装置100は、通信I/F部11を介して通信回線21に接続され、上位装置20等の外部装置やセンサ(図示せず)から取得した複数の変数の時系列データを時間軸上において互いに同期させる。
このようなデータ処理装置100は、記憶装置からなる記憶部140および演算処理装置からなる演算処理部150を含むコンピュータと、記憶部140に記憶されたコンピュータプログラム14Pとによって実現することができる。
ここで演算処理部150は、記憶部140に記憶されたプログラム14Pにしたがって動作することによって、複数の変数のそれぞれについて、第1の時系列データXおよび第2の時系列データYを取得するように構成されたデータ取得部15Aと、第1の時系列データXおよび第2の時系列データYをそれぞれ複数の時間区間に分割し、各時間区間に対して割り当てられる評価値を計算するように構成された評価値計算部25Bと、第1の時系列データXに対する評価値の配列と、第2の時系列データYに対する評価値の配列と、第1の時系列データXおよび第2の時系列データYが表す変数に割り当てられた重みとに基づいて複数の変数の時系列データを時間軸上において互いに同期させるように構成された同期処理部25Cとして動作する。
本実施の形態において、評価値計算部25Bは、複数の変数のそれぞれについて、第1の時系列データXおよび第2の時系列データYをそれぞれ複数の時間区間に分割し、それらの時間区間のそれぞれにおける第1の時系列データXおよび第2の時系列データYそれぞれの特徴量を計算するように構成された特徴量計算部26Aと、各変数について、上述した評価値として、複数の時間区間のそれぞれにおける第1の時系列データXおよび第2の時系列データYそれぞれの特徴量から複数の時間区間のそれぞれにおけるサンプル値の信頼度を算出するように構成された信頼度算出部26Bとを備えている。
また、同期処理部25Cは、複数の変数のそれぞれについて、第1の時系列データXに対する評価値の配列(信頼度の配列)と、第2の時系列データYに対する評価値の配列(信頼度の配列)と、第1の時系列データXおよび第2の時系列データYが表す変数に割り当てられた重みとに基づいて、第1の時系列データXに対する第1の重み配列と第2の時系列データYに対する第2の重み配列とを計算するように構成される。
より具体的には、同期処理部25Cは、第1の重み配列および第2の重み配列として、信頼度の配列と、第1の時系列データXおよび第2の時系列データYが表す変数に割り当てられた重みとの要素積を求め、複数の時間区間に対する重み配列を計算するように構成された重み配列計算部26Cと、複数の時間区間に対する重み配列に基づいて、複数の変数の時系列データを時間軸上において互いに同期させるように構成された同期処理実行部26Dを含む。
[データ処理装置の動作]
次に本実施の形態に係るデータ処理装置100の動作について、図13、図14および図15A乃至図15Cを参照して説明する。
まず、データ処理装置100のデータ取得部15Aが、複数の変数のそれぞれについて、第1の時系列データXおよび第2の時系列データYを取得する(図13、ステップS200)。このステップS200で取得された第1の時系列データXおよび第2の時系列データYは、変数ごとに記憶部140に時系列データ14Aとして保存される。
ここで「複数の変数」の例として、プラントやビルディングなどの監視対象の状態を表す温度や圧力、流量などのパラメータが挙げられる。これらの変数に関する時系列データは、周期的な挙動を示すことがある。典型的な例として、監視対象においてバッチ処理が繰り返された場合には、第1の時系列データXおよび第2の時系列データYは、それぞれ1バッチ分の挙動を示すデータとなる。しかしながら、本発明は、監視対象においてバッチ処理が行われることを前提とするものではなく、周期的な挙動を示すものであれば、リアルタイムで取得される時系列データであってもよい。
次に、評価値計算部25Bが、記憶部140に記憶された時系列データ14Aから、変数ごとに第1の時系列データXおよび第2の時系列データYを読み出して、これら第1の時系列データXおよび第2の時系列データYをそれぞれ複数の時間区間に分割し、これら複数の時間区間のそれぞれに対して評価値を計算する(図13、ステップS210)。
ステップS210における評価値の計算の一構成例を図14および図15A乃至図15Cを参照して説明する。
本実施の形態において、評価値の計算は、図14に示すように、第1の時系列データXおよび第2の時系列データYを複数の複数の時間区間(以下、時間区間を「セグメント」ということがある。)に分割し(図14、ステップS211)、第1の時系列データXおよび第2の時系列データYのそれぞれについてセグメント毎の特徴量を計算し(同、ステップS212)、セグメント毎に第1の時系列データXの特徴量と第2の時系列データYの特徴量とからそのセグメントの評価値(以下、「信頼度」ということがある。)を計算する(同、ステップS213)。
ここで時系列データを複数のセグメントに分割する処理(ステップS211)は、評価値計算部25Bの一部を構成する特徴量計算部26Aによって実行され、具体的には、演算処理部150が、例えば、各時系列データの時間変化(一次微分)やその時間変化(二次微分)を算出し、その大きさを所定の閾値と比較する等の処理を行うことによって実現される。図15Aに、第1の時系列データXおよび第2の時系列データYを、それぞれ複数のセグメントに分割する様子を概念的に示す。図15Aは、第1の時系列データXおよび第2の時系列データYのそれぞれについて、データが大きく変化するタイミングで分割され、セグメントが設定される様子を示している。
また、特徴量計算部26Aは、さらに第1の時系列データXおよび第2の時系列データYのそれぞれについて各セグメントの特徴量を計算する(図14、ステップS212)が、このとき各セグメントにおける第1の時系列データXおよび第2の時系列データYそれぞれの特徴量としては、例えば、そのセグメントに含まれる時系列データの平均や分散などを用いることができる。
なお、2つの時系列データを複数のセグメントに分割して比較するには、例えば、非特許文献3に記載された技術を適用すればよい。
さらに、評価値計算部25Bの一部を構成する信頼度算出部26Bは、対応するセグメントにおける第1の時系列データXの特徴量と第2の時系列データYの特徴量とからそのセグメントの評価値を計算するが(図14、ステップS213)、このとき本実施の形態では、評価値は0以上1以下の値をとるものとし、信頼度算出部26Bは、互いに対応するセグメントに含まれる第1の時系列データXの特徴量と第2の時系列データYの特徴量とが互いに近ければ近いほど、評価値をより1に近い値とし、2つの特徴量との間に開きがあれば、評価値をより0に近い値とする。これは、特徴量がほぼ等しければ、第1の時系列データXと第2の時系列データYとのいずれにも異常なデータが含まれている可能性は低く、同期処理においてその区間のデータまたはサンプル値を信頼してよい度合いが高まると考えることができるからである。このような考え方から、本実施の形態においては、評価値を「信頼度」と呼ぶものである。
図15Bは、特徴量として平均値を採用した場合を例に、評価値(信頼度)の考え方を説明する図であり、互いに対応するセグメントSxi、Syiに対しては、平均値が同程度であるので高い信頼度を与え、セグメントSxj、Syjに対しては、平均値が異なるので低い信頼度を与えることを示している。
このような信頼度の演算をすべてのセグメントに対して行うことによって、図15Cに示すように、変数ごとに信頼度の配列を得ることができる。得られた信頼度の配列は、記憶部140に評価値データ24Bとして記憶される。
以上が本実施の形態における信頼度の配列を得る手順である。
このようにして信頼度の配列が得られたら、同期処理部25Cの一部を構成する重み配列計算部26Cが、記憶部140から評価値データ24B、すなわち信頼度の配列を読み出し、信頼度の配列の各要素にその変数に対して予め与えられた重みを乗じて重み配列を計算する(図13、ステップS220)。
なお、変数に予め与えられた重みは、例えば、すべての変数に対して同じ値、すなわち1としてもよいし、特許文献1や非特許文献2に開示されるように、同期処理前の第1の時系列データXと第2の時系列データYのユークリッド距離の総和と同期処理後のユークリッド距離の総和の差に応じて、差が小さな変数にはより大きな重みが与えられるように決められた値でもよい(図20参照。)。
このようにしてすべての変数についてそれぞれ重み配列を求め、それらを記憶部140に重み配列データ24Cとして記憶する。
次に、同期処理部25Cの一部を構成する同期処理実行部26Dが、記憶部140に記憶された時系列データ14Aと重み配列データ24Cを読み出して、複数の変数の時系列データを時間軸方向に同期させる処理を実行する(図13、ステップS230)。
一般に、DTW同期処理は、図16に示すように、一つの変数について、第1の時系列データXのサンプル値Xi(1≦i≦n)と第2の時系列データYのサンプル値Yj(1≦j≦m)とを、両者の距離(ユークリッド距離)の総和が最小となるように対応付ける処理である(図16は、距離(ユークリッド距離)の総和が最小となるような対応関係を「●」で示している。)。
本実施の形態は、これをL個の変数に拡張して、上述した重み配列に基づく重み付けユークリッド距離の総和を最小とするサンプル値Xiとサンプル値Yjの対応関係を求めるものである。L個の変数について第1の時系列データXのi番目のサンプル値Xiと第2の時系列データYのj番目のサンプル値Yjとの重み付けユークリッド距離の総和は、第1の実施の形態の説明で述べた式(3)によって表される。
同期処理部25Cは、変数ごとに、セグメント毎に求めた評価値(信頼度)によってセグメントまたはそのセグメントに属するサンプル値に重み付けした上で、すべての変数に共通な、重み付けユークリッド距離の総和dw(Xi,Yj)が最も小さくなるような対応関係(i,j)を特定する処理を実行する。
このようにして得られた対応関係(i,j)は、同期結果データ14Dとして記憶部140に記憶される。
このようにして、複数の変数の間で共通する、2つの時系列データのサンプル値同士対応関係であって、その対応関係に基づいて互いに対応付けられた第1の時系列データXのサンプル値Xiと第2の時系列データYのサンプル値Yjとの間の重み付けユークリッド距離の総和が最も小さくなるような対応関係を特定することによって、複数の変数の時系列データを時間軸上において互いに同期させることができる。
このときの「重み」には、変数間の重みに加え、時系列データの時間区間(セグメント)毎の信頼度も考慮されている。
したがって、多変量の時系列データに、異常なデータが含まれていたとしても、その異常なデータを含む時間区間(セグメント)に対して低い評価値(信頼度)を与えることによって精度の高い同期処理を行うことができる。
[実施の形態の拡張]
以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しうる様々な変更をすることができる。また、各構成については、矛盾しない範囲で任意に組み合わせて実施することができる。
前述した第1の実施の形態では、本発明にかかるデータ処理装置10を時系列データの同期処理を行う装置として構成した場合を例として説明したが、これに限定されるものではない。例えば、演算処理部15の区間重み計算部16Dおよび同期処理実行部16Eを省き、本発明にかかるデータ処理装置10を時系列データの同期対象区間を特定するための装置として構成してもよい。これにより、得られた同期対象区間データ14Bを既存の同期処理装置で利用でき、既存の同期処理装置での同期処理精度を高めることができる。
また、前述した第1の実施の形態では、同期対象区間Txk,Tykを変数Zkごとに特定し、これらTxk,Tykに基づいて、各時間区間において、同期処理の対象として適切である変数Zkのみを用いて、サンプル同士の対応付けを行う場合を例として説明したが、これに限定されるものではない。例えば、Txk,Tykに基づいて、すべての変数Zkまたは規定数以上の変数が同期処理の対象として適切である時間区間のみを用いて、サンプル同士の対応付けを行うようにしてもよい。
10、100…データ処理装置、11…通信I/F部、12…操作入力部、13…画面表示部、14、140…記憶部、14A…時系列データ、14B…同期対象区間データ、14C…区間重みデータ、14D…同期結果データ、14P…プログラム、15、150…演算処理部、15A…データ取得部、15B…評価値計算部(同期対象区間特定部)、15C…同期処理部、16A…探索区間計算部、16B…偏差計算部、16C…同期対象区間選択部、16D…区間重み計算部、16E…同期処理実行部、20…上位装置、21…通信回線、24B…評価値データ、24C…重み配列データ、25B…評価値計算部、25C…同期処理部、26A…特徴量計算部、26B…信頼度算出部、26C…重み配列計算部、26D…同期処理実行部、Z,Zk…変数、X,Xk…第1の時系列データ、Y,Yk…第2の時系列データ、ti,tj…時間区間、xi,xj…第1のサンプル値、yi,yj…第2のサンプル値、Txk,Tyk…同期対象区間、ε…時間長、εi…探索区間、σ…許容誤差、Δxj,Δyj…偏差、Wxk,Wyk…区間重み、dw(X,Y)…重み付けユークリッド距離。

Claims (12)

  1. CPUと記憶装置とを備えるコンピュータで用いられて、複数の変数の時系列データを時間軸上において互いに同期させる、多変量時系列データの同期方法であって、
    前記CPUが、前記複数の変数のそれぞれについて、第1の時系列データXおよび第2の時系列データYを取得して前記記憶装置に保存するデータ取得ステップと、
    前記CPUが、前記複数の変数のそれぞれについて、前記記憶部装置から読み出した前記第1の時系列データXおよび前記第2の時系列データYをそれぞれ複数の時間区間に分割し、前記複数の時間区間のそれぞれに対して割り当てられる評価値を計算する評価値計算ステップと、
    前記CPUが、前記複数の変数のそれぞれについて、前記第1の時系列データXに対する評価値の配列と、前記第2の時系列データYに対する評価値の配列と、前記複数の変数のうち前記第1の時系列データXおよび前記第2の時系列データYが表す変数に割り当てられた重みとに基づいて算出される前記第1の時系列データXに対する第1の重み配列および前記第2の時系列データYに対する第2の重み配列に基づいて、前記複数の変数に関する前記第1の時系列データXのサンプル値と前記第2の時系列データYのサンプル値との間の重み付け距離の総和が最も小さくなるような、前記複数の変数の間で共通する、前記第1の時系列データXのサンプル値と前記第2の時系列データYのサンプル値との対応関係を特定し、その対応関係に基づいて前記複数の変数の時系列データを時間軸上において互いに同期させる同期処理ステップと、
    を有する多変量時系列データの同期方法。
  2. 請求項1に記載された多変量時系列データの同期方法において、
    前記複数の変数を変数Zk(k=1~Lの整数)としたとき、
    前記評価値計算ステップは、
    前記変数Zkのそれぞれについて、前記第1の時系列データXから、予め設定されたMx(Mxは2以上の整数)個の時間区間ti(i=1~Mxの整数)ごとに第1のサンプル値xiを選択し、予め設定されている時間長εに基づいて前記第1のサンプル値xiの時間区間tiに関する探索区間εiを計算するとともに、前記第2の時系列データYから、予め設定されたMy(Myは2以上の整数)個の時間区間ti(i=1~Myの整数)ごとに第2のサンプル値yiを選択し、前記時間長εに基づいて前記第2のサンプル値yiの時間区間tiに関する探索区間εiを計算する探索区間計算ステップと、
    前記第1の時系列データXのうち、前記探索区間εi内に存在するNx(Nxは1以上の整数)個の前記第1のサンプル値xj(j=1~Nxの整数)ごとに、前記第2のサンプル値yiと前記第1のサンプル値xjとの間の偏差Δxjを計算するとともに、前記第2の時系列データYのうち、前記探索区間εi内に存在するNy(Nyは1以上の整数)個の前記第2のサンプル値yj(j=1~Nyの整数)ごとに、前記第1のサンプル値xiと前記第2のサンプル値yjとの間の偏差Δyjを計算する偏差計算ステップと、
    前記時間区間tiの探索区間εiに含まれる前記第2のサンプル値yjに関する前記偏差Δyjのすべてが予め設定されている許容誤差σ以下である場合、前記第1のサンプル値xiの時間区間tiに対する評価値を1とし、それ以外の場合は、前記第1のサンプル値xiの時間区間tiに対する評価値を0とするとともに、前記時間区間tiの探索区間εiに含まれる前記第1のサンプル値xjに関する前記偏差Δxjのすべてが前記許容誤差σ以下である場合、前記第2のサンプル値yiの時間区間tiに対する評価値を1とし、それ以外の場合は、前記第2のサンプル値yiの時間区間tiに対する評価値を0として、前記評価値が1の前記時間区間tiを前記第1の時系列データXに関する同期対象区間Txおよび前記第2の時系列データYに関する同期対象区間Tyとして選択する同期対象区間選択ステップと、
    を含み、
    前記同期処理ステップは、
    前記変数Zkに関する前記第1および第2の時系列データXk,Ykを構成する各サンプル値のうち、当該変数Zkの同期対象区間Txk,Tykに該当するサンプル値に基づいて、前記変数Zkで共通する、前記第1および第2の時系列データXk,Yk間におけるサンプル値同士の対応関係を特定し、当該対応関係に基づいて、前記変数Zkのそれぞれに関する第1および第2の時系列データXk,Ykを時間方向に同期させる
    ことを特徴とする、多変量時系列データの同期方法。
  3. 請求項2に記載された多変量時系列データの同期方法において、
    前記同期処理ステップは、さらに、
    前記第1の時系列データXに対する第1の重み配列として、前記変数Zkのそれぞれに関する同期対象区間Txkに基づいて、各時間区間における、前記変数Zkに関する重みを示す第1の区間重みWxkを計算するとともに、前記第2の時系列データYに対する第2の重み配列として、前記変数Zkのそれぞれに関する同期対象区間Tykに基づいて、各時間区間における、前記変数Zkに関する重みを示す第2の区間重みWykを計算する区間重み計算ステップ
    前記変数Zkのそれぞれに関する前記第1の区間重みWxkおよび前記第2の区間重みWykに基づいて、DTW(Dynamic Time Warping)同期処理を実行するDTW同期処理ステップ
    を含むことを特徴とする、多変量時系列データの同期方法。
  4. 請求項3に記載された多変量時系列データの同期方法において、
    前記DTW同期処理ステップは、
    前記DTW同期処理で用いるユークリッド距離として、前記変数Zkのそれぞれに関する、第1の時系列データXkおよび第2の時系列データYkと前記第1の区間重みWxkおよび前記第2の区間重みWykとに基づいて、前記変数Zkのすべてに関する第1の時系列データXと第2の時系列データYとの間の重み付けユークリッド距離dw(X,Y)を計算するステップ
    を含むことを特徴とする、多変量時系列データの同期方法。
  5. 請求項1に記載された多変量時系列データの同期方法において、
    前記同期処理ステップは、
    前記複数の変数のそれぞれについて、前記第1の時系列データXに対する評価値の配列と、前記第2の時系列データYに対する評価値の配列と、前記複数の変数のうち前記第1の時系列データXおよび前記第2の時系列データYが表す変数に割り当てられた重みとに基づいて、前記第1の時系列データXに対する第1の重み配列と前記第2の時系列データYに対する第2の重み配列とを計算する重み配列計算ステップ
    を含むことを特徴とする、多変量時系列データの同期方法。
  6. 請求項1に記載された多変量時系列データの同期方法において、
    前記評価値計算ステップは、
    前記複数の変数のそれぞれについて、前記第1の時系列データXおよび前記第2の時系列データYをそれぞれ複数の時間区間に分割し、前記複数の時間区間のそれぞれにおける前記第1の時系列データXおよび前記第2の時系列データYそれぞれの特徴量を計算する特徴量計算ステップと、
    前記複数の変数のそれぞれについて、前記評価値として、前記複数の時間区間のそれぞれにおける前記第1の時系列データXおよび前記第2の時系列データYそれぞれの特徴量から前記複数の時間区間のそれぞれにおけるサンプル値の信頼度を算出する信頼度算出ステップと、
    を含み、
    前記同期処理ステップは、
    前記第1の重み配列および前記第2の重み配列として、前記信頼度と前記複数の変数のうち前記第1の時系列データXおよび前記第2の時系列データYが表す変数に割り当てられた重みとの積を求め、前記複数の時間区間に対する重み配列を計算する重み配列計算ステップと、
    前記複数の変数のそれぞれについて、前記複数の時間区間に対する重み配列に基づいて、前記複数の変数の間で共通する対応関係に基づいて互いに対応付けられた前記第1の時系列データXのサンプル値と前記第2の時系列データYのサンプル値との間の重み付けユークリッド距離の総和が最も小さくなるような、前記第1の時系列データXのサンプル値と前記第2の時系列データYのサンプル値との対応関係を特定し、その対応関係に基づいて前記複数の変数の時系列データを時間軸上において互いに同期させる同期処理実行ステップを含む
    ことを特徴とする、多変量時系列データの同期方法。
  7. 複数の変数の時系列データを時間軸上において互いに同期させる、多変量時系列データ処理装置であって、
    前記複数の変数のそれぞれについて、第1の時系列データXおよび第2の時系列データYを取得するように構成されたデータ取得部と、
    前記複数の変数のそれぞれについて、前記第1の時系列データXおよび前記第2の時系列データYをそれぞれ複数の時間区間に分割し、前記複数の時間区間のそれぞれに対して割り当てられる評価値を計算するように構成された評価値計算部と、
    前記複数の変数のそれぞれについて、前記第1の時系列データXに対する評価値の配列と、前記第2の時系列データYに対する評価値の配列と、前記複数の変数のうち前記第1の時系列データXおよび前記第2の時系列データYが表す変数に割り当てられた重みとに基づいて算出される前記第1の時系列データXに対する第1の重み配列および前記第2の時系列データYに対する第2の重み配列に基づいて、前記複数の変数に関する前記第1の時系列データXのサンプル値と前記第2の時系列データYのサンプル値との間の重み付け距離の総和が最も小さくなるような、前記複数の変数の間で共通する、前記第1の時系列データXのサンプル値と前記第2の時系列データYのサンプル値との対応関係を特定し、その対応関係に基づいて前記複数の変数の時系列データを時間軸上において互いに同期させるように構成された同期処理部と、
    を有する多変量時系列データ処理装置。
  8. 請求項7に記載された多変量時系列データ処理装置において、
    前記複数の変数を変数Zk(k=1~Lの整数)としたとき、
    前記評価値計算部は、
    前記変数Zkのそれぞれについて、前記第1の時系列データXから、予め設定されたMx(Mxは2以上の整数)個の時間区間ti(i=1~Mxの整数)ごとに第1のサンプル値xiを選択し、予め設定されている時間長εに基づいて前記第1のサンプル値xiの時間区間tiに関する探索区間εiを計算するとともに、前記第2の時系列データYから、予め設定されたMy(Myは2以上の整数)個の時間区間ti(i=1~Myの整数)ごとに第2のサンプル値yiを選択し、前記時間長εに基づいて前記第2のサンプル値yiの時間区間tiに関する探索区間εiを計算するように構成された探索区間計算部と、
    前記第1の時系列データXのうち、前記探索区間εi内に存在するNx(Nxは1以上の整数)個の前記第1のサンプル値xj(j=1~Nxの整数)ごとに、前記第2のサンプル値yiと前記第1のサンプル値xjとの間の偏差Δxjを計算するとともに、前記第2の時系列データYのうち、前記探索区間εi内に存在するNy(Nyは1以上の整数)個の前記第2のサンプル値yj(j=1~Nyの整数)ごとに、前記第1のサンプル値xiと前記第2のサンプル値yjとの間の偏差Δyjを計算するように構成された偏差計算部と、
    前記時間区間tiの探索区間εiに含まれる前記第2のサンプル値yjに関する前記偏差Δyjのすべてが予め設定されている許容誤差σ以下である場合、前記第1のサンプル値xiの時間区間tiに対する評価値を1とし、それ以外の場合は、前記第1のサンプル値xiの時間区間tiに対する評価値を0とするとともに、前記時間区間tiの探索区間εiに含まれる前記第1のサンプル値xjに関する前記偏差Δxjのすべてが前記許容誤差σ以下である場合、前記第2のサンプル値yiの時間区間tiに対する評価値を1とし、それ以外の場合は、前記第2のサンプル値yiの時間区間tiに対する評価値を0として、前記評価値が1の前記時間区間tiを前記第1の時系列データXに関する同期対象区間Txおよび前記第2の時系列データYに関する同期対象区間Tyとして選択するように構成された同期対象区間選択部と、
    を含み、
    前記同期処理部は、
    前記変数Zkに関する前記第1および第2の時系列データXk,Ykを構成する各サンプル値のうち、当該変数Zkの同期対象区間Txk,Tykに該当するサンプル値に基づいて、前記変数Zkで共通する、前記第1および第2の時系列データXk,Yk間におけるサンプル値同士の対応関係を特定し、当該対応関係に基づいて、前記変数Zkのそれぞれに関する第1および第2の時系列データXk,Ykを時間方向に同期させるように構成された
    ことを特徴とする、多変量時系列データ処理装置。
  9. 請求項8に記載された多変量時系列データ処理装置において、
    前記同期処理部は、
    前記第1の時系列データXに対する第1の重み配列として、前記変数Zkのそれぞれに関する同期対象区間Txkに基づいて、各時間区間における、前記変数Zkに関する重みを示す第1の区間重みWxkを計算するとともに、前記第2の時系列データYに対する第2の重み配列として、前記変数Zkのそれぞれに関する同期対象区間Tykに基づいて、各時間区間における、前記変数Zkに関する重みを示す第2の区間重みWykを計算するように構成された区間重み計算部と、
    前記変数Zkのそれぞれに関する前記第1の区間重みWxkおよび前記第2の区間重みWykに基づいて、DTW(Dynamic Time Warping)同期処理を実行するように構成されたDTW同期処理部と
    を含むことを特徴とする、多変量時系列データ処理装置。
  10. 請求項9に記載された多変量時系列データ処理装置において、
    前記DTW同期処理部は、
    前記DTW同期処理で用いるユークリッド距離として、前記変数Zkのそれぞれに関する、第1の時系列データXkおよび第2の時系列データYkと前記第1の区間重みWxkおよび前記第2の区間重みWykとに基づいて、前記変数Zkのすべてに関する第1の時系列データXと第2の時系列データYとの間の重み付けユークリッド距離dw(X,Y)を計算するように構成された
    ことを特徴とする、多変量時系列データ処理装置。
  11. 請求項7に記載された多変量時系列データ処理装置において、
    前記同期処理部は、
    前記複数の変数のそれぞれについて、前記第1の時系列データXに対する評価値の配列と、前記第2の時系列データYに対する評価値の配列と、前記複数の変数のうち前記第1の時系列データXおよび前記第2の時系列データYが表す変数に割り当てられた重みとに基づいて、前記第1の時系列データXに対する第1の重み配列と前記第2の時系列データYに対する第2の重み配列とを計算するように構成された重み配列計算部
    を含むことを特徴とする、多変量時系列データ処理装置。
  12. 請求項7に記載された多変量時系列データ処理装置において、
    前記評価値計算部は、
    前記複数の変数のそれぞれについて、前記第1の時系列データXおよび前記第2の時系列データYをそれぞれ複数の時間区間に分割し、前記複数の時間区間のそれぞれにおける前記第1の時系列データXおよび前記第2の時系列データYそれぞれの特徴量を計算するように構成された特徴量計算部と、
    前記複数の変数のそれぞれについて、前記評価値として、前記複数の時間区間のそれぞれにおける前記第1の時系列データXおよび前記第2の時系列データYそれぞれの特徴量から前記複数の時間区間のそれぞれにおけるサンプル値の信頼度を算出するように構成された信頼度算出部と を含み、
    前記同期処理部は、
    前記第1の重み配列および前記第2の重み配列として、前記信頼度と前記複数の変数のうち前記第1の時系列データXおよび前記第2の時系列データYが表す変数に割り当てられた重みとの積を求め、前記複数の時間区間に対する重み配列を計算するように構成された重み配列計算部と、
    前記複数の変数のそれぞれについて、前記複数の時間区間に対する重み配列に基づいて、前記複数の変数の間で共通する対応関係に基づいて互いに対応付けられた前記第1の時系列データXのサンプル値と前記第2の時系列データYのサンプル値との間の重み付けユークリッド距離の総和が最も小さくなるような、前記第1の時系列データXのサンプル値と前記第2の時系列データYのサンプル値との対応関係を特定し、その対応関係に基づいて前記複数の変数の時系列データを時間軸上において互いに同期させるように構成された同期処理実行部とを含む
    ことを特徴とする、多変量時系列データ処理装置。
JP2018045386A 2018-03-13 2018-03-13 多変量時系列データの同期方法および多変量時系列データ処理装置 Active JP7051503B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2018045386A JP7051503B2 (ja) 2018-03-13 2018-03-13 多変量時系列データの同期方法および多変量時系列データ処理装置
PCT/JP2019/002444 WO2019176322A1 (ja) 2018-03-13 2019-01-25 多変量時系列データの同期方法および多変量時系列データ処理装置
CN201980017076.6A CN111868715A (zh) 2018-03-13 2019-01-25 多变量时间序列数据的同步方法以及多变量时间序列数据处理装置
KR1020207025391A KR102478796B1 (ko) 2018-03-13 2019-01-25 다변량 시계열 데이터의 동기 방법 및 다변량 시계열 데이터 처리 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018045386A JP7051503B2 (ja) 2018-03-13 2018-03-13 多変量時系列データの同期方法および多変量時系列データ処理装置

Publications (2)

Publication Number Publication Date
JP2019159779A JP2019159779A (ja) 2019-09-19
JP7051503B2 true JP7051503B2 (ja) 2022-04-11

Family

ID=67907684

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018045386A Active JP7051503B2 (ja) 2018-03-13 2018-03-13 多変量時系列データの同期方法および多変量時系列データ処理装置

Country Status (4)

Country Link
JP (1) JP7051503B2 (ja)
KR (1) KR102478796B1 (ja)
CN (1) CN111868715A (ja)
WO (1) WO2019176322A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7319545B2 (ja) 2019-11-28 2023-08-02 富士通株式会社 判定処理プログラム、判定処理方法および判定処理装置
KR102604219B1 (ko) * 2022-09-07 2023-11-20 주식회사 아인스페이스 고해상도 데이터에 대한 폴트를 검출하는 방법 및 그 시스템

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011036809A1 (ja) 2009-09-28 2011-03-31 株式会社 東芝 異常判定システムおよびその方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002316479A1 (en) * 2001-07-03 2003-01-21 Altaworks Corporation System and methods for monitoring performance metrics
WO2007000893A1 (ja) * 2005-06-14 2007-01-04 Mitsuhiro Tanada 情報空間処理装置、プログラム、および、方法
US7729890B2 (en) * 2006-08-22 2010-06-01 Analog Devices, Inc. Method for determining the change of a signal, and an apparatus including a circuit arranged to implement the method
JP5580716B2 (ja) 2010-10-29 2014-08-27 東京瓦斯株式会社 失火検知方法及び失火検知システム
JPWO2016111069A1 (ja) * 2015-01-05 2017-10-12 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
EP3244321A4 (en) * 2015-01-05 2018-07-04 Sony Corporation Information processing device, information processing method, and program
CN105139289B (zh) * 2015-09-06 2018-10-19 清华大学 一种基于错分代价分类学习的电网暂态电压稳定评估方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011036809A1 (ja) 2009-09-28 2011-03-31 株式会社 東芝 異常判定システムおよびその方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KASSIDAS, Athanassios et al.,Synchronization of Batch Trajectories Using Dynamic Time Warping,AIChE Journal,1998年04月,Vol.44, No.4,pp.864-875,https://onlinelibrary.wiley.com/doi/abs/10.1002/aic.690440412

Also Published As

Publication number Publication date
WO2019176322A1 (ja) 2019-09-19
KR102478796B1 (ko) 2022-12-16
CN111868715A (zh) 2020-10-30
JP2019159779A (ja) 2019-09-19
KR20200112984A (ko) 2020-10-05

Similar Documents

Publication Publication Date Title
JP7051503B2 (ja) 多変量時系列データの同期方法および多変量時系列データ処理装置
CN110286656B (zh) 一种错误数据容忍的虚警过滤方法和装置
US20060269144A1 (en) Data division apparatus, data division method and program
EP3502814B1 (en) Processing loads balancing of control and monitoring functions
JP2015230727A (ja) 時系列データ内の異常を検出する方法
JP2016095751A (ja) 異常機器特定プログラム、異常機器特定方法、及び、異常機器特定装置
JP2019159786A (ja) 情報処理装置、情報処理方法、プログラム
TWI738411B (zh) 裝置診斷裝置、電漿處理裝置及裝置診斷方法
US20220404792A1 (en) Method, system and computer program product for monitoring a shaping process
JP2022003664A (ja) 情報処理装置、プログラム及び監視方法
JPWO2017150286A1 (ja) システム分析装置、システム分析方法、及び、プログラム
JP6966507B2 (ja) 欠損値補完装置、欠損値補完方法及び欠損値補完プログラム
CN112380073B (zh) 一种故障位置的检测方法、装置及可读存储介质
CN116348829A (zh) 异常诊断模型的构建方法、异常诊断方法、异常诊断模型的构建装置以及异常诊断装置
JP6273835B2 (ja) 状態判定装置、状態判定方法および状態判定プログラム
JP6623977B2 (ja) 時間軸伸縮装置、バッチプロセス監視装置、時間軸伸縮システム及びプログラム
JP6953812B2 (ja) 異常検出装置及び異常検出システム
JP6854995B1 (ja) 学習システム、学習方法及びプログラム
JP2020099982A (ja) 工作機械の熱変位補正方法、熱変位補正プログラム、熱変位補正装置
JP6627258B2 (ja) システムモデル生成支援装置、システムモデル生成支援方法、及び、プログラム
JP7256764B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US20210109838A1 (en) Information processing apparatus, method, and non-transitory recording medium
US20210397992A1 (en) Inference apparatus, information processing apparatus, inference method, program and recording medium
CN113302568A (zh) 工序改进支持设备、工序改进支持方法和存储工序改进支持程序的记录介质
US20240037423A1 (en) Information processing apparatus, information processing method, and information processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200911

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211012

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211027

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220330

R150 Certificate of patent or registration of utility model

Ref document number: 7051503

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150