JPWO2018096683A1 - 要因分析方法、要因分析装置および要因分析プログラム - Google Patents

要因分析方法、要因分析装置および要因分析プログラム Download PDF

Info

Publication number
JPWO2018096683A1
JPWO2018096683A1 JP2018552376A JP2018552376A JPWO2018096683A1 JP WO2018096683 A1 JPWO2018096683 A1 JP WO2018096683A1 JP 2018552376 A JP2018552376 A JP 2018552376A JP 2018552376 A JP2018552376 A JP 2018552376A JP WO2018096683 A1 JPWO2018096683 A1 JP WO2018096683A1
Authority
JP
Japan
Prior art keywords
time series
explanation
group
factor
explanation time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018552376A
Other languages
English (en)
Other versions
JP6835098B2 (ja
Inventor
毅彦 溝口
毅彦 溝口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2018096683A1 publication Critical patent/JPWO2018096683A1/ja
Application granted granted Critical
Publication of JP6835098B2 publication Critical patent/JP6835098B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0221Preprocessing measurements, e.g. data collection rate adjustment; Standardization of measurements; Time series or signal analysis, e.g. frequency analysis or wavelets; Trustworthiness of measurements; Indexes therefor; Measurements using easily measured parameters to estimate parameters difficult to measure; Virtual sensor creation; De-noising; Sensor fusion; Unconventional preprocessing inherently present in specific fault detection methods like PCA-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Manufacturing & Machinery (AREA)
  • Automation & Control Theory (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Algebra (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • General Factory Administration (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

要因分析装置は、1つの目的変数の時系列データである目的時系列に対応する複数の説明変数の時系列データである複数の説明時系列を、類似関係にある説明時系列が同一グループに属するように、1つ以上のグループに分けるグルーピング部(501)と、各グループから、代表とする説明時系列を抽出する代表時系列抽出部(502)と、抽出された説明時系列を分析して、目的時系列に対して影響要因とされる説明時系列を特定する分析部(503)とを備える。

Description

本発明は、目的変数の値変化を決定づける要因とされる説明変数を特定するための要因分析方法、要因分析装置および要因分析プログラムに関する。
目的変数と説明変数との関係を分析して、目的変数の値変化に強い影響を持つ説明変数またはその時系列データを特定する技術は、製造工程などの品質管理において広く利用されている。
例えば、上記の技術は、複数の説明変数としてセンサなどから種々の観測値が時々刻々と得られる状況において、製品の品質といった目的変数の値の変化に影響をもつ観測値を特定するために用いられる。
1つの目的変数の時系列データ(以下、目的時系列という)に対応して、複数の説明変数の時系列データ(以下、説明時系列という)が入力される場合に、該目的時系列に強い影響を与えるすなわち目的時系列の値変化を決定づける要因とされる説明時系列を特定するための分析方法の例として、回帰分析などによる統計的手法が挙げられる。回帰分析に代表される多くの分析手法は、センサなどの計測器から観測されるデータが利用可能であることを前提として、観測されるデータを多次元的に解析する方法である。以下、目的時系列の値変化を決定づける要因を、単に影響要因と表現する場合がある。
そのような要因分析技術に関連して、特許文献1には、説明変数に製造装置の名称といった名義尺度データが含まれる場合に、該名義尺度データに基づいて説明変数の時系列データをセグメント化した上でセグメントとそのダミーとからなるデータに対して多変量解析手法を行って要因を特定する方法が記載されている。
また、特許文献2には、複数の説明変数を分割して得られる全ての分割グループに対して線形重回帰分析を行い、説明変数を絞り込む操作を繰り返すことにより、製造ラインの品質変動原因を分析する方法が記載されている。
また、非特許文献1には、標本をランダムサンプリングしてLASSOと呼ばれる回帰手法を繰り返し用いることにより、説明変数の影響度を高い精度で推定できることが記載されている。また、非特許文献2には、要因分析のための分類器として、決定木を複数用いたランダムフォレスト分類器が記載されている。
特開2009−258890号公報 特開2002−110493号公報
Nicolai Meinshausen, Peter Buhlmann, "Stability selection」, Journal of the Royal Statistical Society: Series B (Statistical Methodology)", ISSN: 1467-9868, , Vol.72, Issue 4, 2010, p.417-473. Breiman. L, "Random Forests", Machine Learning, ISSN: 0885-6125, Vol.45, No.1, 2001, p.5-32.
製造工程などの実際の物理システムでは、観測対象となる物理量の1項目に対して、複数の異なる測定方法による測定値や、それらの補正値も同時に収集される。この場合、システムの状態を示す1つの目的時系列に対して、類似したまたは全く同じ振る舞いを持つ説明時系列が多数存在することになる。そのような場合、説明時系列が多重共線性を持つことになり、重回帰分析などの一般的な多変量解析手法による要因分析が困難であるという問題がある。
また、多重共線性の影響を受けない分析手法を用いる場合であっても、目的時系列の値変化に強く関与する第1の説明時系列と類似した振る舞いを持つ第2の説明時系列が多数存在する場合、それらすべてが目的変数に対して高い寄与度を有することになる。その結果、第1の説明時系列と類似しないすなわち第1の説明時系列とは異なる種類の第3の説明時系列の寄与度が相対的に低くなる。このとき、第3の説明時系列の中に影響要因とされる説明時系列が含まれていた場合、第1および第2の説明時系列が寄与度の上位を占めているために、異なる種類の要因である第3の説明時系列を正しく抽出することができないという問題がある。
なお、特許文献1に記載の方法は、説明変数の中に名義尺度データが含まれている場合に、それを利用して要因特定精度を高めようというものであり、1つの目的時系列に対して、類似したまたは全く同じ振る舞いを持つ定量的データが多数存在するような場合の上記課題を解決するものではない。
また、特許文献2に記載の方法を適用しても、多重共線性の問題がある上に、第3の説明時系列が説明変数の絞り込みにより漏れてしまう同様の問題がある。非特許文献1および非特許文献2に記載の方法も、第3の説明時系列が正しく抽出できない問題は同様である。
本発明は、上述した課題に鑑み、1つの目的時系列に対して影響要因とされる説明時系列が複数種類存在し、かつ影響要因とされる説明時系列の中に類似した振る舞いを持つ説明時系列が複数存在する場合であっても、影響要因を正しく特定可能な要因分析方法、要因分析装置および要因分析プログラムを提供することを目的とする。
本発明による要因分析方法は、1つの目的変数の時系列データである目的時系列に対応する複数の説明変数の時系列データである複数の説明時系列が入力されると、類似関係にある説明時系列が同一グループに属するように、説明時系列を1つ以上のグループに分け、各グループから、代表とする説明時系列を抽出し、抽出された説明時系列を分析して、目的時系列に対して影響要因とされる説明時系列を特定することを特徴とする。
本発明による要因分析装置は、1つの目的変数の時系列データである目的時系列に対応する複数の説明変数の時系列データである複数の説明時系列を、類似関係にある説明時系列が同一グループに属するように、1つ以上のグループに分けるグルーピング部と、各グループから、代表とする説明時系列を抽出する代表時系列抽出部と、抽出された説明時系列を分析して、目的時系列に対して影響要因とされる説明時系列を特定する分析部とを備えることを特徴とする。
本発明による要因分析プログラムは、コンピュータに、1つの目的変数の時系列データである目的時系列に対応する複数の説明変数の時系列データである複数の説明時系列を、類似関係にある説明時系列が同一グループに属するように、1つ以上のグループに分ける処理、各グループから、代表とする説明時系列を抽出する処理、および抽出された説明時系列を分析して、目的時系列に対して影響要因とされる説明時系列を特定する処理を実行させることを特徴とする。
本発明によれば、1つの目的時系列に対して影響要因とされる説明時系列が複数種類存在し、かつ影響要因とされる説明時系列の中に類似した振る舞いを持つ説明時系列が複数存在する場合であっても、影響要因を正しく特定できる。
第1の実施形態の要因分析装置の例を示すブロック図である。 第1の実施形態の要因分析装置の動作例を示すフローチャートである。 第1の実施形態の要因分析装置の他の例を示すブロック図である。 グルーピング結果の例を示す説明図である。 寄与度の算出結果の例を示す説明図である。 統合後の寄与度の例を示す説明図である。 要因表示方法の例を示す説明図である。 本発明の各実施形態にかかるコンピュータの構成例を示す概略ブロック図である。 本発明の概要を示すブロック図である。 本発明の要因分析方法の例を示すフローチャートである。 本発明の要因分析装置の他の例を示すブロック図である。 本発明の要因分析方法の他の例を示すフローチャートである。
以下、図面を参照して本発明の実施形態を説明する。
実施形態1.
図1は、第1の実施形態の要因分析装置の例を示すブロック図である。本実施形態では、例として、要因分析装置1が製造工程における製造品の品質管理に適用される場合を説明する。なお、要因分析装置1は、製造工程以外の工程および製造工程における品質管理以外の用途に適用されてもよい。
図1に示すように、本実施形態の要因分析装置1は、被分析装置2と接続されている。なお、図示省略しているが、被分析装置2は複数であってもよい。被分析装置2は、例えば、製造工程で使用される装置である。このように、本実施形態の要因分析装置1は、被分析装置2が使用される製造工程において使用される。
本例において、被分析装置2は、被分析装置2自身に関する複数種目の観測値を所定の時間間隔で計測し、要因分析装置1に送信する。観測値の種目としては、品質指標といった製造品の状態に関する種目と、製造条件に関する種目とがそれぞれ1以上含まれる。製造条件に関する種目の例としては、温度、圧力、ガス流量などが挙げられる。製造条件に関する種目の観測値は、例えば、整数や小数などの数値により表される。また、品質指標に関する種目の観測値は、例えば、「正常」/「異常」や、「開」/「閉」といった記号で表されていてもよい。
本実施形態では、製造品の製造条件に関する種目の観測値を説明変数とし、製造品の状態に関する種目の観測値を目的変数とし、製造品の状態を決定づける要因(影響要因)とされる製造条件の種目またはその観測値の時系列データを特定することを目的とする。なお、説明変数および目的変数はこの限りではない。例えば、システム運用に関する品質管理を行いたい場合には、システムの運用情報といった稼動条件に関する種目の観測値を説明変数とし、システムの運用状態といった該運用情報に対応する性能指標に関する種目の観測値を目的変数としてもよい。一般に、複数の説明変数と、該複数の説明変数によって説明される目的変数とが対応づけて得られるのであれば、いかなる工程や用途であっても本発明は適応可能である。
本実施形態において、「時系列データ」は、センサ等によって観測された1つの項目に関する値を所定の時間間隔で時刻順に並べたデータ群(系列データ)を指す。また、「説明時系列」は、入力される観測値のうち製造条件を表す観測値を、観測対象ごとに時刻順に並べることによって得られる時系列データを指す。なお、説明時系列は、例えば、被分析装置2ごとおよび製造条件に関する項目ごとに、観測された値を時刻順に並べることによって得られる時系列データであってもよい。説明時系列には、装置の調整値、温度、圧力、ガス流量、電圧などの、装置の運転状態を示す製造条件が広く含まれる。ここで、観測対象ごとには、物理項目の別だけでなく、観測を行う装置の別や計測方法の別も含まれる。すなわち、本実施形態では、取得回路が完全に一致するものを同一観測対象とし、それ以外は異なる観測対象として、各観測対象に対して変数名(時系列データの識別子)を割り当てる。このことは、例えば、第1の被分析装置2によって観測された圧力と、第2の被分析装置2によって観測された圧力とは、観測対象が異なることを意味する。同様に、例えば、第1の被分析装置2によって観測された圧力と、該圧力を補正した補正圧力とは、観測対象が異なることを意味する。このように、本実施形態では、説明変数は細分化されていることが好ましい。
また、「目的時系列」は、入力される観測値のうち製造品の状態を表す観測値を、時刻順に並べることによって得られる時系列データを指す。目的時系列は、例えば、被分析装置2ごとに計測された、品質指標を表す観測値を時刻順に並べることによって得られる時系列データであってもよい。この場合、被分析装置2の数分の目的時系列が得られるが、これらは、品質指標という同一種類の項目に対応した目的時系列とされる。以下、本実施形態では、分析対象の目的時系列が1種類である場合を想定するが、目的時系列には品質や収量、効率など、説明時系列によって表現される製造条件のもとで装置を稼働させた際に得られた、製造物などの評価指標が広く含まれていてもよい。
図1に示す要因分析装置1は、データ収集部101と、類似度算出部102と、グルーピング部103と、分析対象決定部104と、寄与度算出部105と、要因特定部106と、結果表示部107と、データ記憶部11とを備える。また、データ記憶部11は、目的時系列記憶部111と、説明時系列記憶部112と、類似度記憶部113と、グループ記憶部114と、被分析時系列記憶部115と、寄与度記憶部116とを含む。
データ収集部101は、被分析装置2から観測値を取得する。また、データ収集部101は、取得した観測値を、その種目に応じて目的時系列記憶部111または説明時系列記憶部112に記憶させる。
目的時系列記憶部111は、データ収集部101が取得した観測値のうち、品質指標に関する観測値を目的時系列として記憶する。目的時系列記憶部111は、例えば、取得された観測値を、その観測対象に対応する項目に対応づけて、かつ時系列に沿って並ぶデータとして記憶してもよい。
説明時系列記憶部112は、データ収集部101が取得した観測値のうち、製造条件に関する観測値を説明時系列として記憶する。説明時系列記憶部112は、例えば、取得された観測値を、その観測対象に対応する項目に対応づけて、かつ時系列に沿って並ぶデータとして記憶してもよい。
類似度算出部102は、説明時系列記憶部112に記憶されている全ての説明時系列を対象に、それら説明時系列の全ての組み合わせである全ペアについて時系列データ間の類似度を算出する。
ここで、時系列データ間の「類似度」は、2つの時系列データの類似度合いを示す指標であり、大きければ大きいほど2つの時系列データが「似ている」ことを意味する。類似度算出部102は、類似度として、例えば、2つの時系列データ間で計算できる相関係数を用いてもよい。
類似度記憶部113は、類似度算出部102が算出した類似度を記憶する。
グルーピング部103は、説明時系列記憶部112から説明時系列の全ペアに対する類似度を読み出し、読み出した類似度に基づいて説明時系列を1つ以上のグループに分けるグルーピングを実行する。本実施形態において、時系列データの「グループ」は、1以上の類似する時系列データの集合である。同一のグループに属する時系列データが1つしかない場合、「自身と似ている他の時系列データが存在しない」ことを意味する。
グループ記憶部114は、グルーピング部103によって分類されたグループの情報を記憶する。グループ記憶部114は、例えば、各説明時系列の識別子に対応づけて、当該説明時系列に割り当てられたグループの識別子を記憶してもよい。また、グループ記憶部114は、例えば、各グループの識別子に対応づけて、当該グループに属する説明時系列の識別子や数(要素数)等を記憶してもよい。
分析対象決定部104は、グループ記憶部114に記憶されているグループの情報を参照し、後段の寄与度算出部105において分析対象(寄与度の算出対象)とする説明時系列を決定する。以下、分析対象決定部104が分析対象に決定した説明時系列を、被分析時系列と表現する場合がある。
分析対象決定部104は、例えば、各グループから代表とされる説明時系列を抽出して被分析時系列としてもよい。また、分析対象決定部104は、例えば、所定のグループに属している説明時系列のみを被分析時系列としてもよい。なお、被分析時系列の決定方法のより具体的な方法は後述する。
被分析時系列記憶部115は、分析対象決定部104によって被分析時系列に決定された説明時系列またはその情報を記憶する。
寄与度算出部105は、目的時系列記憶部111から目的時系列を読み出すとともに、被分析時系列記憶部115から被分析時系列を読み出す。また、寄与度算出部105は、1以上の多変量解析手法を用いて、読み出した被分析時系列の各々について、目的時系列の値変化に対する寄与度を算出する。なお、寄与度の算出方法のより具体的な方法は後述する。
なお、寄与度算出部105が目的時系列と被分析時系列とを読み出す代わりに、分析対象決定部104が、被分析時系列と目的時系列とを読み出して、寄与度算出部105に出力してもよい。
寄与度記憶部116は、寄与度算出部105によって算出された寄与度を記憶する。
要因特定部106は、寄与度記憶部116に記憶されている寄与度に基づいて、目的時系列に対して影響要因とされる被分析時系列またはその候補を特定する。要因特定部106は、例えば、寄与度記憶部116から寄与度を大きい順に読み出し、寄与度が所定値以上の被分析時系列または寄与度の上位n個の被分析時系列を、影響要因またはその候補として特定してもよい。また、要因特定部106は、例えば、被分析時系列の各々に対して、複数の手法による寄与度が記憶されていた場合、それらを総合し、統合後の寄与度に基づいて、影響要因またはその候補を特定してもよい。
結果表示部107は、要因特定部106により特定された影響要因とされる被分析時系列またはその候補を表示する。このとき、結果表示部107は、特定された被分析時系列が属しているグループをグループ記憶部114から読み出し、グループ内に当該被分析時系列以外の説明時系列が含まれている場合、その説明時系列も影響要因またはその候補として表示してもよい。
次に、本実施形態の要因分析装置1の動作を説明する。図2は、要因分析装置1の動作例を示すフローチャートである。
図2に示す例では、まずデータ収集部101が、被分析装置2から観測値を収集する(ステップS101)。次に、データ収集部101は、収集した観測値が説明変数すなわち製造条件に関係する観測値か、目的変数すなわち品質指標に関係する観測値かを確認する(ステップS102)。
ステップS102で、データ収集部101は、収集した観測値が目的変数であれば(ステップS102のYes)、該観測値を目的時系列記憶部111に記憶する(ステップS103)。一方、データ収集部101は、収集した観測値が目的変数でなければ(ステップS102のNo)、該観測値を説明時系列記憶部112に記憶する(ステップS104)。
次に、データ収集部101は、被分析装置2から収集対象とされる観測値をすべて収集したか否かを確認する(ステップS105)。まだ収集していない観測値がある場合(ステップS105のNo)、データ収集部101は、ステップS101からの処理を繰り返す。一方、観測値がすべて収集された場合(ステップS105のYes)、データ収集部101は、ステップS111に処理を進める。
ステップS111では、類似度算出部102が、説明時系列記憶部112に記憶されている説明時系列の中から説明時系列のペアを1つずつ読み出して類似度を算出する。ここで算出された類似度は、ペアの情報とともに類似度記憶部113に記憶される。
また、類似度算出部102は、説明時系列の全ペアに対して類似度が算出されたか否かを確認する(ステップS112)。まだ類似度が算出されていないペアがある場合(ステップS112のNo)、類似度算出部102は、ステップS111の処理を繰り返す。一方、全ペアに対して類似度が算出された場合(ステップS112のYes)、類似度算出部102は、ステップS121に処理を進める。
ステップS121では、グルーピング部103が、ステップS111で算出された類似度に基づき、説明時系列をグルーピングする。ここで生成されたグループの情報は、グループ記憶部114に記憶される。
次に、分析対象決定部104は、ステップS121で生成されたグループの中からグループを1つずつ選択して分析対象とする説明時系列(被分析時系列)を1つ選択する(ステップS122)。ここで選択された被分析時系列の情報は、被分析時系列記憶部115に記憶される。
また、分析対象決定部104は、すべてのグループから被分析時系列が選択されたか否かを確認する(ステップS123)。被分析時系列が選択されていないグループがある場合(ステップS123のNo)、分析対象決定部104は、ステップS122の処理を繰り返す。一方、すべてのグループから被分析時系列が選択された場合(ステップS123のYes)、分析対象決定部104は、ステップS131に処理を進める。
ステップS131では、寄与度算出部105が、ステップS122で選択された説明時系列である被分析時系列の各々について、1以上の多変量解析手法を用いて目的時系列の値変化に対する寄与度を算出する。ここで算出された寄与度は、用いられた多変量解析手法と対応づけて、寄与度記憶部116に記憶される。
次に、要因特定部106は、寄与度記憶部116に記憶されている寄与度に基づいて、影響要因とされる被分析時系列(またはその候補)を特定する(ステップS141)。要因特定部106は、例えば、複数の多変量解析手法を用いて寄与度が算出されている場合、それらを統合するなどして最終的な寄与度を算出してもよい。そして、算出された最終的な寄与度に基づいて影響要因とされる被分析時系列またはその候補を特定する。ステップS141で、要因特定部106は、例えば、算出された最終的な寄与度が上位の被分析時系列を要因として決定してもよい。
次に、結果表示部107は、影響要因(またはその候補)として決定された被分析時系列が属するグループの情報を読み出す(ステップS151)。最後に、結果表示部107は、ステップS141で特定された被分析時系列を影響要因として出力するとともに、ステップS151で読み出したグループに属する被分析時系列以外の説明時系列を、該被分析時系列と併せて表示する(ステップS152)。
以上により、本例の要因分析装置1は、1つの目的時系列に対する一連の要因分析処理を終了する。
このように、本実施形態の要因分析装置1は、複数の説明時系列とそれに対応する目的時系列とが入力される場合に、複数種類の要因を正しく特定できる。特に、影響要因とされる説明時系列が複数種類あり、またそれらに類似する説明時系列が多数ある場合でも、異なる種類の影響要因を正しく特定できる。その理由は、グルーピング部103によって説明時系列を類似度に基づいてグループ化し、分析対象決定部104によってグループ化された説明時系列の中から分析対象とする説明時系列を選別するためである。これにより、他の類似した説明時系列を分析対象から除外することができ、互いに類似していない時系列を用いて影響要因を特定することができるからである。
なお、上記の説明では、分析対象の目的時系列が1つまたは1種類である場合を想定したが、分析対象の目的時系列は、2つ以上または2種以上であってもよい。その場合、要因分析装置1は、目的時系列の各々または各種類に対して、ステップS122以降またはステップS131以降の処理を行えばよい。例えば、要因分析装置1は、目的時系列の各々または各種類に対して、分析時系列を選択した上で、該被分析時系列がもつ寄与度を算出し、算出された寄与度に基づいて影響要因とされる被分析時系列を特定してもよい。このように、それぞれの目的時系列に対して別々に上記の処理を行うことで、それぞれの目的時系列に対して影響要因とされる説明時系列を特定できる。
また、上記の説明では、類似度算出部102が、2つの時系列データ間で計算できる相関係数を類似度として用いる例を示したが、類似度として、2つの時系列データの類似度合いを示す指標であれば、いかなる指標を用いてもよい。例えば、類似度算出部102は、2つの時系列データ間で成立する関係式の適合度を類似度として用いてもよい。より具体的に、類似度算出部102は、2つの時系列データの関係性を入出力関係とみなして、該入出力関係を回帰分析によって関数近似したときの適合度を用いてもよい。
また、グルーピング部103は、説明時系列をグルーピングする手法として、時系列データの類似度に基づく手法であれば、いかなる手法を用いてもよい。また、その際、生成されるグループを構成する時系列データ(説明時系列)は1以上であればよい。グルーピング部103は、例えば、説明時系列の類似度が一定以上の説明時系列同士が同じグループになるようにグループ分けしてもよい。また、グルーピング部103は、例えば、スペクトラルクラスタリングなど、類似度に基づいたクラスタリング手法を用いて、説明時系列をグルーピングしてもよい。
また、被分析時系列の選択方法は、無作為でも数理的手法による選択であってもよい。分析対象決定部104は、数理的手法を用いる場合、例えば、目的時系列との相互情報量に基づいて選択してもよい。さらに、分析対象決定部104は、1つのグループから1以上の説明時系列を被分析時系列として選択してもよい。その場合、多重共線性を回避できる手法で寄与度を算出するのが好ましい。なお、分析対象決定部104は、グループ内の説明時系列同士の類似度のばらつきを基に被分析時系列の数を決定してもよい。
また、分析対象決定部104は、同一グループに属する説明時系列から導出される時系列データ(新たな時系列データ)を、当該グループの被分析時系列として選択することも可能である。分析対象決定部104は、例えば、同一グループに属する説明時系列の各値の総和からなる時系列データを導出し、導出した時系列データを当該グループの被分析時系列としてもよい。
また、寄与度算出部105は、多変量解析手法の1つとして、目的変数の値変化に対する説明変数の寄与度を算出する手法であれば、いかなる手法を用いてもよい。寄与度算出部105は、多変量解析手法の1つに、例えば、L1正則化ロジスティック回帰を用いてもよい。さらに、寄与度算出部105は、多変量解析手法を適用する前に、被分析時系列に対して移動平均や周波数分析などの前処理を施してもよい。その場合、寄与度算出部105は、前処理によって得られたデータを基に該被分析時系列を加工(データの追加、削除、変更等)した上で、寄与度を算出する。
また、目的変数が数値ではなく記号で示される指標の場合、寄与度算出部105は、目的変数の各時刻に対応する値として、該記号に対応する数値を用いてもよい。すなわち、寄与度算出部105は、目的変数が示す記号を数値に変化した上で、寄与度を算出してもよい。たとえば、目的変数が「正常」、「異常」といった記号で示されている場合、「正常」を0、異常を1に置き換えることで、多変量解析手法として、非特許文献1に記載のL1正則化ロジスティック回帰や、非特許文献2に記載のランダムフォレストを用いることができる。なお、説明変数に関しても同様である。
また、本実施形態では、温度、ガス流量など、製造品の製造条件を観測する複数のセンサが使用される製造工程における、複数のセンサを被分析装置2の例として示したが、目的変数の値とそれに対応する説明変数の値とを得ることができるシステムであれば、被分析装置2は他のシステムでもよい。例えば、被分析装置2は、ITシステム、プラントシステム、構造物、輸送機器であってもよい。ITシステムの場合、説明変数としてCPU使用率、メモリ使用率、ディスクアクセス頻度や使用量などの運用情報が用いられる。また、目的変数として、消費電力量や演算回数、演算時間などの性能指標が用いられる。
次に、本実施形態の要因分析装置1のより具体的な構成および動作の一例を、図3〜7を参照して説明する。なお、図4〜7に示す内容は、実際に行った事項に基づく数値計算結果である。
本例における要因分析装置1の構成を図3に示す。図3に示すように、本例における要因分析装置1は、2以上のセンサ2’に接続されている。
また、図3に示すように、要因分析装置1は、演算装置10と、記憶装置11’と、表示装置12とを備える。演算装置10は、データ収集部101と、類似度算出部102と、グルーピング部103と、分析対象決定部104と、寄与度算出部105と、要因表示部106’とを含む。なお、本例では、上記の要因特定部106と結果表示部107の代わりに、1つの要因表示部106’を含むが、要因表示部106’はこれら2つの機能を併せ持つ。
また、記憶装置11’は、観測時系列記憶部117と、類似度記憶部113と、グループ記憶部114と、被分析時系列記憶部115と、寄与度記憶部116とを含む。また、観測時系列記憶部117は、目的時系列記憶部111と、説明時系列記憶部112とを有する。
次に、本例における説明時系列間の類似度の算出方法、説明時系列に対するグルーピング方法、被分析時系列の選択方法、寄与度の算出方法、影響要因の特定方法および影響要因の表示方法を具体的に説明する。
まず、説明時系列間の類似度算出方法について説明する。類似度として相関係数を用いる場合、次のようにして類似度としての相関係数を算出できる。2つの時系列データX,Xの各時刻における値を1つの標本と見なせば、それぞれの標準偏差σX、σXおよび時系列データX,Xの共分散σXを計算することができる。このとき、時系列データXとXとの間の相関係数Rは、R=σX/(σX・σX)と計算することができる。
また、類似度として2つの時系列データの入出力関係の適合度を用いる場合、次のようにして類似度としての適合度を算出できる。まず、類似度算出部102は、2つの時系列データX,Xの一方を入力、もう一方を出力として入出力関係のモデルを仮定して、回帰分析によって関数近似を行う。例えば、類似度算出部102は、Xを入力とし、X を出力としたとき、Xの予測値X’を、X’=f(X)として回帰分析によって学習する。次いで、類似度算出部102は、学習結果の適合度Cを、C=1−(E(X −X’)/E(X−E(X)))と計算する。ここで、E()は()内の平均を表す。
なお、上記の相関係数Rまたは適合度Cをそのまま類似度としてもよいし、それらの加重平均といった相関係数または適合度に基づく値を類似度としてもよい。
次に、説明時系列のグルーピング方法について説明する。本例では、所定の値以上の類似度を持つ時系列データ同士を「類似関係にある」と定義する。グルーピング部103は、このような類似関係にある時系列データの集合を同じグループに属する時系列データとみなすことでグルーピングする。このとき、類似関係にある他の時系列データが存在しない時系列データは、自分自身のみがグループの構成要素となる。
図4は、グルーピング結果の一例を示す説明図である。なお、図4には、類似度として2つの説明時系列の入出力関係の適合度Cを用いた場合のグルーピング結果の一部が示されている。図4からもわかるように、同一グループ内の時系列データは、同じまたは類似した物理量の観測値からなる時系列データとなっている。このようにして、時系列データを構成している観測値が具体的にどのような観測値かが明らかでなくても、複数の説明時系列を、時系列データの振い舞いに応じた1つ以上の種類に分類できる。
次に、被分析時系列の選択方法について説明する。以下では、被分析時系列の選択方法に数理的手法を用いる例を説明する。本例の分析対象決定部104は、目的時系列と説明時系列との間で計算できる相互情報量に基づいて被分析時系列を選択する。目的時系列をY、説明時系列をXとすると、相互情報量I(X,Y)は、I(X,Y)=H(X)+H(Y)−H(X,Y)と計算することができる。ここで、H(X),H(Y)はそれぞれX、Yのエントロピーを表す。また、H(X,Y)はXとYの結合エントロピーを表す。分析対象決定部104は、所定のグループ(例えば、要素数が2以上のグループ)に対して、当該グループに属するすべての説明時系列について、目的時系列との相互情報量Iを計算する。そして、分析対象決定部104は、相互情報量Iが最も大きい説明時系列を当該グループの被分析時系列として選択する。なお、分析対象決定部104は、要素数が1のグループについては、唯一の要素である説明時系列を被分析時系列とすればよい。
次に、寄与度の算出方法について説明する。本例の寄与度算出部105は、目的時系列を出力とし、該出力に対応する被分析時系列を入力として、公知の多変量解析手法を適用して寄与度を算出する。これにより、寄与度として、2つの時系列データの入出力関係から、入力とされる非自明時系列の、出力とされる自明時系列の値変化に対する影響度を算出することができる。
より具体的に、本例の寄与度算出部105は、複数L1正則化ロジスティック回帰(手法1)、ランダムフォレスト(手法2)およびReliefF(手法3)の3種類の多変量解析手法を用いて、1つの被分析時系列に対して、目的時系列の値変化に対する3種類の寄与度を算出する。このとき、各寄与度は最大値が1、最小値が0になるように正規化される。
図5は、本例の被分析時系列の寄与度の算出結果を示す説明図である。図5には、上記3種類の多変量解析手法を用いて算出された各被分析時系列の寄与度のうち、手法ごとに上位10個が示されている。なお、図5(a)が手法1による寄与度の算出結果を示し、図5(b)が手法2による寄与度の算出結果を示し、図5(c)が手法3による寄与度の算出結果を示している。
図5(a)〜(c)において、センサ名の頭に付している“[]”は、当該センサ(より具体的には当該センサによる観測値からなる説明時系列)が属しているグループの識別子を表している。例えば、図5(a)の手法1(L1正則化ロジスティック回帰)において、4番目に寄与度が大きいセンサ名:「液体差圧(b)」の頭に付与してある“[c27]”は、当該センサが対応する説明時系列が属するグループが「c27」であることを表している。なお、グループの識別子の表記が省略されている場合、そのセンサが対応する説明時系列が属しているグループが、その説明時系列のみで構成されていることを表している。
次に、影響要因の特定方法について説明する。本例の要因表示部106’は、まず、各被分析時系列に対して、複数の多変量解析手法を用いて算出された寄与度を統合する。具体的には、要因表示部106’は、被分析時系列ごとに、上記3種類の多変量解析手法を用いて算出された3つの寄与度の和を取る。和のとり方は、単純和でもよいし、手法ごとに重み付けを行った上で和を取る方法でもよい。
図6は、本例の統合後の寄与度を示す説明図である。図6には、統合後の寄与度の上位11個が、センサ名と順位とともに示されている。要因表示部106’は、例えば、統合後の寄与度が高い順にn個の被分析時系列を、影響要因とされる説明時系列またはその一種類に特定してもよい。ここで、影響要因とされる説明時系列の一種類とは、他に同種の説明時系列すなわち同じまたは類似の振い舞いをする説明時系列が存在していることを意味する。この場合、寄与率が上位n個の被分析時系列だけでなく、それらと同じまたは類似の振い舞いをする説明時系列も影響要因またはその候補とされる。図6によれば、例えば、3番目に寄与度が大きいセンサ名:「液体差圧(b)」は、センサ名の頭にグループの識別子が付されていることから、グループ内に他のセンサ(より具体的には他のセンサの観測値からなる説明時系列)が存在していることがわかる。この場合、当該他のセンサもも影響要因またはその候補とされる。
次に、影響要因の表示方法について説明する。本例の要因表示部106’は、まず影響要因と特定した被分析時系列が属しているグループの情報をグループ記憶部114から読み出す。そして、要因表示部106’は、表示装置12に影響要因と特定した被分析時系列を表示するとともに、該被分析時系列と併せて、該被分析時系列が属するグループ内の他の説明時系列を表示する。なお、要因表示部106’は、影響要因として表示する被分析時系列の数を制限せずに、最終的に算出された寄与度が高い順に、被分析時系列の情報および該被分析時系列が属するグループの情報を該寄与度とともに表示してもよい。
図7は、影響要因の表示方法の例を示す説明図である。図7に示す例では、影響要因とされた被分析時系列の1つのセンサ名である「液体差圧(b)」に併せて、該被分析時系列が属するグループの他の説明時系列のセンサ名もツリー形式で表示されている。このように、本例では、影響要因とされる説明時系列の情報として、寄与度が上位の被分析時系列の情報とともに、それに付随する形式で該被分析時系列に類似する説明時系列の情報が表示される。なお、実際には、表示中の被分析時系列に類似する説明時系列は、他の種類(他のグループ)の説明時系列の寄与度に影響を与えておらず、それにより他の種類の説明時系列の寄与度が小さくなることもない。
以上の結果から、要因分析装置1は、影響要因とされる説明時系列が複数種類存在し、それらに類似した振る舞いを持つ説明時系列が多数存在する場合でも、影響要因を正しく特定できたことがわかる。
次に、本発明の各実施形態にかかるコンピュータの構成例を示す。図8は、本発明の各実施形態にかかるコンピュータの構成例を示す概略ブロック図である。コンピュータ1000は、CPU1001と、主記憶装置1002と、補助記憶装置1003と、インタフェース1004と、ディスプレイ装置1005とを備える。
上述の監視システムにおける各処理部(データ収集部101、類似度算出部102、グルーピング部103、分析対象決定部104、寄与度算出部105、要因特定部106および結果表示部107)は、例えば、要因分析装置1として動作するコンピュータ1000に実装されてもよい。その場合、それら各処理部の動作は、プログラムの形式で補助記憶装置1003に記憶されていてもよい。CPU1001は、プログラムを補助記憶装置1003から読み出して主記憶装置1002に展開し、そのプログラムに従って各実施形態における所定の処理を実施する。
補助記憶装置1003は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例として、インタフェース1004を介して接続される磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ1000に配信される場合、配信を受けたコンピュータは1000がそのプログラムを主記憶装置1002に展開し、各実施形態における所定の処理を実行してもよい。
また、プログラムは、各実施形態における所定の処理の一部を実現するためのものであってもよい。さらに、プログラムは、補助記憶装置1003に既に記憶されている他のプログラムとの組み合わせで各実施形態における所定の処理を実現する差分プログラムであってもよい。
また、実施形態における処理内容によっては、コンピュータ1000の一部の要素は省略可能である。例えば、特定結果をネットワークを介して接続されている他のサーバ等に出力する場合などは、ディスプレイ装置1005は省略可能である。また、図8には図示省略しているが、実施形態における処理内容によっては、コンピュータ1000は、入力デバイスを備えていてもよい。例えば、要因分析装置1がユーザから分析開始の指示入力や解析手法の指示入力等を受け付ける場合に、該指示を入力するための入力デバイスを備えていてもよい。
また、各装置の各構成要素の一部または全部は、汎用または専用の回路(Circuitry)、プロセッサ等やこれらの組み合わせによって実施される。これらは単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。また、各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組み合わせによって実現されてもよい。
各装置の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
次に、本発明の概要を説明する。図9は、本発明の主要部を示すブロック図である。図9に示す要因分析装置500は、グルーピング部501と、代表時系列抽出部502と、分析部503とを備える。
グルーピング部501(例えば、グルーピング部103)は、1つの目的時系列に対応する複数の説明時系列が入力されると、類似関係にある説明時系列が同一グループに属するように、入力された説明時系列を1つ以上のグループに分ける。
代表時系列抽出部502(例えば、分析対象決定部104)は、グルーピング部501によって分けられた各グループから、代表とする説明時系列(上記の被分析時系列)を抽出する。代表とする説明時系列の抽出方法は特に限定されないが、グループ内に複数の説明時系列が存在する場合にグループ内の要素数よりも少ない数の説明時系列が抽出されればよい。
分析部503(例えば、要因特定部106)は、代表時系列抽出部502によって抽出された説明時系列を用いて、目的時系列に対して影響要因とされる説明時系列を特定する。
このような構成によれば、目的時系列に対して影響要因とされる説明時系列が複数種類存在し、かつ影響要因とされる説明時系列の中に類似した振る舞いを持つ説明時系列が複数存在する場合であっても、正しく影響要因を特定することができる。すなわち、本発明の要因分析装置は、分析を行う前に、類似関係にある説明時系列が同一のグループに属するようにグループ分けを行い、各グループから分析対象とする代表説明時系列を抽出する。これにより、入力された複数の説明時系列に類似関係にある説明時系列が含まれていても、代表とされる説明時系列のみを分析対象にできる。すなわち、本発明の要因分析装置によれば、代表説明時系列と類似関係にある説明時系列を除外して分析を行うことができる。これにより、目的時系列に対して影響要因とされる説明時系列が複数種類存在し、かつ要因とされる説明時系列の中に類似した振る舞いを持つ説明時系列が複数存在する場合であっても、正しく要因を特定することができる。
また、上記の構成において、代表時系列抽出部502は、グループ内で目的時系列の値変化に最も寄与する説明時系列を、当該グループの代表とする説明時系列として抽出してもよい。また、代表時系列抽出部502は、グループ内の説明時系列に対する数理的な操作により生成される新たな時系列データを、当該グループの代表とする説明時系列として抽出してもよい。
新たな時系列データは、例えば、同一グループに属する説明時系列の各値の総和からなる時系列データであってもよい。
また、図10は、本発明の要因分析装置の他の例を示すブロック図である。図11に示すように、要因分析装置500は、さらに類似度算出部504や、寄与度算出部505や、出力部506を備えていてもよい。
類似度算出部504(例えば、類似度算出部102)は、入力された説明時系列の全てのペアについて類似度を算出する。
そのような場合に、グルーピング部501は、入力された説明時系列の全てのペアについて算出された類似度に基づいて、当該複数の説明時系列をグループ分けしてもよい。グルーピング部501は、例えば、所定の値以上の類似度を有する説明時系列同士は互いに類似関係にあるとして、グループ内の全ての説明時系列が、当該グループ内の他の説明時系列全てと類似関係にある説明時系列の集まりを1つのグループとしてもよい。
このとき、類似度算出部504は、例えば、算出対象とされた2つの時系列データ(説明時系列)間で計算される相関係数または該データ間で成立する関係式の適合度に基づいて類似度を算出してもよい。
また、寄与度算出部505(例えば、寄与度算出部105)は、抽出された説明時系列(代表説明時系列)の各々について、目的時系列の値変化に対する寄与度を算出する。寄与度算出部505は、例えば、1つ以上の多変量解析手法を用いて、各代表説明時系列の目的時系列の値変化に対する寄与度を算出してもよい。
また、寄与度算出部505は、寄与度を算出する際に、前処理として、算出対象の説明時系列に含まれる部分時系列データから数理的な操作により新たな情報を得て、得られる情報に基づいて当該説明時系列を加工する処理を行ってもよい。当該前処理は、算出対象の説明時系列の所定の開始時刻の時間窓に含まれる部分時系列から、数理的な操作によって得られる情報を、時間窓の開始時刻を変化させて1以上抽出し、当該被分析時系列に追加する処理であってもよい。
そのような場合に、分析部503は、算出された寄与度に基づいて、目的時系列に対して影響要因とされる説明時系列を特定してもよい。
出力部506(例えば、結果表示部107)は、分析部503によって特定された説明時系列の情報を出力する。このとき、出力部506は、特定された説明時系列の情報に加えて、説明時系列が属するグループ内の他の説明時系列の情報を出力してもよい。
ここで、分析部503により特定された説明時系列が複数の説明時系列を有するグループの代表説明時系列であった場合、出力部506は、グループ内の全ての説明時系列をまとめて、一種類の影響要因として出力してもよい。
以上のような方法により、1つの物理量の項目に対して、測定方法の異なる測定値や補正値などが各々説明変数として収集されるなど、類似関係にある説明時系列が存在する場合であってもそのうちの1つを分析対象とすることで、多重共線性の問題を回避できる。さらに、本方法によれば、要因とされる物理量の項目が複数種ある場合であっても、振い舞いが類似する複数の時系列データをグループ化して、分析対象を限定することにより、寄与度の高い一種の項目に対応する説明時系列に埋もれることなく、相対的に寄与度が低い他種の項目に対応した説明時系列をも影響要因として正しく特定することができる。
また、図11は、本発明の要因分析方法の概要を示すフローチャートである。なお、各ステップは、例えば、プログラムに従って動作する情報処理装置によって行われる。
図11に示すように、まず、1つの目的時系列に対応する複数の説明時系列が入力されると、類似関係にある説明時系列が同一グループに属するように、入力された複数の説明時系列を1つ以上のグループに分ける(ステップS501)。
次に、各グループから、代表とする説明時系列を抽出する(ステップS502)。
最後に、抽出された説明時系列を分析して、目的時系列に対して影響要因とされる説明時系列を特定する(ステップS503)。
また、図12は、本発明の要因分析方法の他の例を示すフローチャートである。なお、各ステップは、例えば、情報処理装置によって行われる。
図12に示すように、本例では、まず入力された説明時系列の全てのペアについて類似度を算出する(ステップS511)。
次に、グルーピング部501が、算出された類似度に基づいて、入力された説明時系列をグループ化する(ステップS512)。
次に、各グループから代表とする説明時系列を抽出する(ステップS513)。
次に、ステップS513で抽出された説明時系列について、目的時系列の値変化に対する寄与度を算出する(ステップS514)。
次に、ステップS514で算出された寄与度に基づいて、目的時系列に対して影響要因とされる説明時系列を特定する(ステップS515)。
最後に、ステップS515での特定結果に基づいて、影響要因とされる説明時系列の情報を出力する。ステップS515で、例えば、影響要因とされる説明時系列が属するグループに他の説明時系列が含まれている場合に、当該他の説明時系列の情報も併せて出力してもよい。
なお、ステップS513で代表とする説明時系列を寄与度に基づいて抽出する場合、ステップS513の前にステップS514を行ってもよい。その場合、ステップS514では、全ての説明時系列について、目的時系列の値変化に対する寄与度を算出する。
このとき、各説明時系列について、2以上の多変量解析手法を用いて目的時系列の値変化に対する寄与度を算出してもよい。
以上のような方法によれば、さらに、要因分析精度を向上できたり、影響要因とされる物理量の項目の情報をより詳細に提示できる。
また、上記の各実施形態は以下の付記のようにも記載できる。
(付記1)1つの目的変数の時系列データである目的時系列に対応する複数の説明変数の時系列データである複数の説明時系列が入力されると、類似関係にある説明時系列が同一グループに属するように、説明時系列を1つ以上のグループに分け、各グループから、代表とする説明時系列を抽出し、抽出された説明時系列を分析して、目的時系列に対して影響要因とされる説明時系列を特定することを特徴とする要因分析方法。
(付記2)特定された説明時系列の情報に加えて、説明時系列が属するグループ内の他の説明時系列の情報を出力する付記1に記載の要因分析方法。
(付記3)入力された説明時系列の全てのペアについて類似度を算出し、所定の値以上の類似度を有する説明時系列同士は互いに類似関係にあるとして、グループ内の全ての説明時系列が、当該グループ内の他の説明時系列全てと類似関係にある説明時系列の集まりを1つのグループとする付記1または付記2記載の要因分析方法。
(付記4)類似度は、2つの時系列データ間で計算される相関係数または2つの時系列データ間で成立する関係式の適合度に基づいて算出される付記3記載の要因分析方法。
(付記5)グループ内で目的時系列の値変化に最も寄与する説明時系列を、当該グループの代表とする説明時系列として抽出する付記1から付記4のいずれかに記載の要因分析方法。
(付記6)グループ内の説明時系列に対する数理的な操作により生成される新たな時系列データを、当該グループの代表とする説明時系列として抽出する付記1から付記5のいずれかに記載の要因分析方法。
(付記7)2以上の多変量解析手法を用いて、抽出された説明時系列の各々について、目的時系列の値変化に対する寄与度を算出し、算出された寄与度に基づいて、目的時系列に対して影響要因とされる説明時系列を特定する付記1から付記6のいずれかに記載の要因分析方法。
(付記8)寄与度を算出する際に、前処理として、算出対象の説明時系列に含まれる部分時系列データから数理的な操作により新たな情報を得て、得られる情報に基づいて当該説明時系列を加工する処理を行う付記7記載の要因分析方法。
(付記9)説明変数は、システムの稼働条件を示すものであり、目的変数は、システムの状態を示すものである付記1から付記8のいずれかに記載の要因分析方法。
(付記10)1つの目的変数の時系列データである目的時系列に対応する複数の説明変数の時系列データである複数の説明時系列を、類似関係にある説明時系列が同一グループに属するように、1つ以上のグループに分けるグルーピング部と、各グループから、代表とする説明時系列を抽出する代表時系列抽出部と、抽出された説明時系列を分析して、目的時系列に対して影響要因とされる説明時系列を特定する分析部とを備えることを特徴とする要因分析装置。
(付記11)特定された説明時系列の情報に加えて、説明時系列が属するグループ内の他の説明時系列の情報を出力する出力部を備えた付記10記載の要因分析装置。
(付記12)コンピュータに、1つの目的変数の時系列データである目的時系列に対応する複数の説明変数の時系列データである複数の説明時系列を、類似関係にある説明時系列が同一グループに属するように、1つ以上のグループに分ける処理、各グループから、代表とする説明時系列を抽出する処理、および抽出された説明時系列を分析して、目的時系列に対して影響要因とされる説明時系列を特定する処理を実行させるための要因分析プログラム。
(付記13)コンピュータに、特定された説明時系列の情報に加えて、説明時系列が属するグループ内の他の説明時系列の情報を出力する処理を実行させる付記12記載の要因分析プログラム。
以上、本実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
本発明は、複数の説明変数と、該複数の説明変数によって説明される目的変数とが取得可能な装置、システムおよび方法における該目的変数の値変化を決定づける要因の分析用途に広く適用可能である。
1、500 要因分析装置
10 演算装置
101 データ収集部
102 類似度算出部
103 グルーピング部
104 分析対象決定部
105 寄与度算出部
106 要因特定部
107 結果表示部
106’ 要因表示部
11 データ記憶部
11’ 記憶装置
111 目的時系列記憶部
112 説明時系列記憶部
113 類似度記憶部
114 グループ記憶部
115 被分析時系列記憶部
116 寄与度記憶部
117 観測時系列記憶部
12 表示装置
2 被分析装置
2’ センサ
501 グルーピング部
502 代表時系列抽出部
503 分析部
504 類似度算出部
505 寄与度算出部
506 出力部
1000 コンピュータ
1001 CPU
1002 主記憶装置
1003 補助記憶装置
1004 インタフェース
1005 ディスプレイ装

Claims (10)

  1. 1つの目的変数の時系列データである目的時系列に対応する複数の説明変数の時系列データである複数の説明時系列が入力されると、類似関係にある説明時系列が同一グループに属するように、前記説明時系列を1つ以上のグループに分け、
    各グループから、代表とする説明時系列を抽出し、
    抽出された説明時系列を分析して、前記目的時系列に対して影響要因とされる説明時系列を特定する
    ことを特徴とする要因分析方法。
  2. 特定された説明時系列の情報に加えて、前記説明時系列が属するグループ内の他の説明時系列の情報を出力する
    請求項1に記載の要因分析方法。
  3. 入力された説明時系列の全てのペアについて類似度を算出し、
    所定の値以上の類似度を有する説明時系列同士は互いに類似関係にあるとして、グループ内の全ての説明時系列が、当該グループ内の他の説明時系列全てと類似関係にある説明時系列の集まりを1つのグループとする
    請求項1または請求項2記載の要因分析方法。
  4. 類似度は、2つの時系列データ間で計算される相関係数または2つの時系列データ間で成立する関係式の適合度に基づいて算出される
    請求項3記載の要因分析方法。
  5. グループ内で目的時系列の値変化に最も寄与する説明時系列を、当該グループの代表とする説明時系列として抽出する
    請求項1から請求項4のうちのいずれか1項に記載の要因分析方法。
  6. グループ内の説明時系列に対する数理的な操作により生成される新たな時系列データを、当該グループの代表とする説明時系列として抽出する
    請求項1から請求項5のうちのいずれか1項に記載の要因分析方法。
  7. 2以上の多変量解析手法を用いて、抽出された説明時系列の各々について、目的時系列の値変化に対する寄与度を算出し、
    前記寄与度に基づいて、影響要因とされる説明時系列を特定する
    請求項1から請求項6のうちのいずれか1項に記載の要因分析方法。
  8. 寄与度を算出する際に、前処理として、算出対象の説明時系列に含まれる部分時系列データから数理的な操作により新たな情報を得て、得られる情報に基づいて当該説明時系列を加工する処理を行う
    請求項7記載の要因分析方法。
  9. 1つの目的変数の時系列データである目的時系列に対応する複数の説明変数の時系列データである複数の説明時系列を、類似関係にある説明時系列が同一グループに属するように、1つ以上のグループに分けるグルーピング部と、
    各グループから、代表とする説明時系列を抽出する代表時系列抽出部と、
    抽出された説明時系列を分析して、前記目的時系列に対して影響要因とされる説明時系列を特定する分析部とを
    備えることを特徴とする要因分析装置。
  10. コンピュータに、
    1つの目的変数の時系列データである目的時系列に対応する複数の説明変数の時系列データである複数の説明時系列を、類似関係にある説明時系列が同一グループに属するように、1つ以上のグループに分ける処理、
    各グループから、代表とする説明時系列を抽出する処理、および
    抽出された説明時系列を分析して、前記目的時系列に対して影響要因とされる説明時系列を特定する処理
    を実行させるための要因分析プログラム。
JP2018552376A 2016-11-28 2016-11-28 要因分析方法、要因分析装置および要因分析プログラム Active JP6835098B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2016/085214 WO2018096683A1 (ja) 2016-11-28 2016-11-28 要因分析方法、要因分析装置および要因分析プログラム

Publications (2)

Publication Number Publication Date
JPWO2018096683A1 true JPWO2018096683A1 (ja) 2019-10-17
JP6835098B2 JP6835098B2 (ja) 2021-02-24

Family

ID=62194935

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018552376A Active JP6835098B2 (ja) 2016-11-28 2016-11-28 要因分析方法、要因分析装置および要因分析プログラム

Country Status (3)

Country Link
US (1) US20200341454A1 (ja)
JP (1) JP6835098B2 (ja)
WO (1) WO2018096683A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11221607B2 (en) 2018-11-13 2022-01-11 Rockwell Automation Technologies, Inc. Systems and methods for analyzing stream-based data for asset operation
JP7145059B2 (ja) * 2018-12-11 2022-09-30 株式会社日立製作所 モデルの予測根拠提示システム及びモデルの予測根拠提示方法
CN109978384B (zh) * 2019-03-28 2023-04-25 南方电网科学研究院有限责任公司 一种配电网运行效率的主导因素分析方法及相关产品
JP7279473B2 (ja) * 2019-04-03 2023-05-23 株式会社豊田中央研究所 異常検知装置、異常検知方法、および、コンピュータプログラム
JP2021033895A (ja) * 2019-08-29 2021-03-01 株式会社豊田中央研究所 変数選定方法、変数選定プログラムおよび変数選定システム
US11651249B2 (en) * 2019-10-22 2023-05-16 EMC IP Holding Company LLC Determining similarity between time series using machine learning techniques
JP7354844B2 (ja) * 2020-01-08 2023-10-03 富士通株式会社 影響判定プログラム、装置、及び方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015136586A1 (ja) * 2014-03-14 2015-09-17 日本電気株式会社 要因分析装置、要因分析方法および要因分析プログラム
WO2016079972A1 (ja) * 2014-11-19 2016-05-26 日本電気株式会社 要因分析装置、要因分析方法と記録媒体、及び、要因分析システム
WO2016103611A1 (ja) * 2014-12-22 2016-06-30 日本電気株式会社 要因分析装置、要因分析方法、および、プログラムの記録媒体

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6904423B1 (en) * 1999-02-19 2005-06-07 Bioreason, Inc. Method and system for artificial intelligence directed lead discovery through multi-domain clustering
JP4394728B2 (ja) * 2008-04-15 2010-01-06 シャープ株式会社 影響要因特定装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015136586A1 (ja) * 2014-03-14 2015-09-17 日本電気株式会社 要因分析装置、要因分析方法および要因分析プログラム
WO2016079972A1 (ja) * 2014-11-19 2016-05-26 日本電気株式会社 要因分析装置、要因分析方法と記録媒体、及び、要因分析システム
WO2016103611A1 (ja) * 2014-12-22 2016-06-30 日本電気株式会社 要因分析装置、要因分析方法、および、プログラムの記録媒体

Also Published As

Publication number Publication date
WO2018096683A1 (ja) 2018-05-31
US20200341454A1 (en) 2020-10-29
JP6835098B2 (ja) 2021-02-24

Similar Documents

Publication Publication Date Title
WO2018096683A1 (ja) 要因分析方法、要因分析装置および要因分析プログラム
US10496730B2 (en) Factor analysis device, factor analysis method, and factor analysis program
JP2019028929A (ja) プリプロセッサおよび異常予兆診断システム
CN108776831A (zh) 一种基于动态卷积神经网络的复杂工业过程数据建模方法
CN111080117A (zh) 设备风险标签的构建方法、装置、电子设备及存储介质
US9400868B2 (en) Method computer program and system to analyze mass spectra
Tong et al. Soft sensing of non-Gaussian processes using ensemble modified independent component regression
US20220083039A1 (en) Abnormality detection apparatus, abnormality detection system, and learning apparatus, and methods for the same and nontemporary computer-readable medium storing the same
US20150339364A1 (en) Visualization device, visualization method and visualization program
Krishna et al. Selection of data preprocessing techniques and its emergence towards machine learning algorithms using hpi dataset
CN105894138A (zh) 一种制造业发货量的最优加权组合预测方法
US20190180180A1 (en) Information processing system, information processing method, and recording medium
CN117036781A (zh) 一种基于树综合多样性深度森林的图像分类方法
US20180046927A1 (en) Data analysis device and analysis method
Razak et al. ARIMA and VAR modeling to forecast Malaysian economic growth
US11347811B2 (en) State analysis device, state analysis method, and storage medium
US20240054187A1 (en) Information processing apparatus, analysis method, and storage medium
JP2015132939A (ja) データ処理装置及びデータ処理方法及びプログラム
US20200342048A1 (en) Analysis device, analysis method, and recording medium
Merzah Software quality prediction using data mining techniques
CN116153516B (zh) 一种基于分布式计算的疾病大数据挖掘分析系统
WO2023181230A1 (ja) モデル分析装置、モデル分析方法、及び、記録媒体
CN116226767B (zh) 一种电力系统实验数据自动诊断方法
Hakim et al. Implementation of Random Forest Algorithm on Palm Oil Price Data
Grissa et al. A hybrid data mining approach for the identification of biomarkers in metabolomic data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200721

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210118

R150 Certificate of patent or registration of utility model

Ref document number: 6835098

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150