JP2017138643A - 解析対象決定装置及び解析対象決定方法 - Google Patents

解析対象決定装置及び解析対象決定方法 Download PDF

Info

Publication number
JP2017138643A
JP2017138643A JP2016016950A JP2016016950A JP2017138643A JP 2017138643 A JP2017138643 A JP 2017138643A JP 2016016950 A JP2016016950 A JP 2016016950A JP 2016016950 A JP2016016950 A JP 2016016950A JP 2017138643 A JP2017138643 A JP 2017138643A
Authority
JP
Japan
Prior art keywords
data
analysis
determination
determining
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016016950A
Other languages
English (en)
Other versions
JP6633403B2 (ja
Inventor
友近 信行
Nobuyuki Tomochika
信行 友近
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe Steel Ltd
Original Assignee
Kobe Steel Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe Steel Ltd filed Critical Kobe Steel Ltd
Priority to JP2016016950A priority Critical patent/JP6633403B2/ja
Publication of JP2017138643A publication Critical patent/JP2017138643A/ja
Application granted granted Critical
Publication of JP6633403B2 publication Critical patent/JP6633403B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】多種多量のデータから解析に適したデータを決定できる解析対象決定装置及び解析対象決定方法を提供する。【解決手段】解析対象決定装置は、複数のデータ項目を含む複数のデータから一部のデータを選択する。次に解析対象決定装置は、選択されたデータからモデルの生成に適するデータ項目を選択し、モデルが生成可能か否かを判定する。解析対象決定装置は、データの選択処理及びモデルが生成可能か否かの判定処理を複数回繰り返した後、判定処理におけるモデルが生成可能か否かの判定結果に基づいて、解析対象とするデータを決定する。【選択図】図4

Description

本発明は、多種多量のデータから解析対象のデータを決定するための解析対象決定装置及び解析対象決定方法に関する。
事業に役立つ知見を導出するために多種多量のデータ(ビッグデータ)を解析することが行われている。検索、電子商取引、ソーシャルメディア等のウェブサービス分野においては、検索履歴、商品・デジタルコンテンツの購買履歴、決算情報、コミュニケーションの発信履歴等のデータが大量に蓄積される。また、機械、工場内設備においては、各種センサによって機械、設備の状態(温度、圧力、流量等)の多種多量のデータが蓄積される。このようなビッグデータの解析方法の一つとして、重回帰分析によって複数のデータ項目(変数)について成立する関係式(モデル)を導出し、データ項目間の関係を捉えることが行われている。
特許文献1には、プラント設備において蓄積されたデータを重回帰分析し、プロセスの状態を予測する方法が記載されている。この方法では、1つのプラントから複数のデータ項目を含むデータを時系列でサンプリングし、サンプリング時刻毎に重回帰分析に使用するデータ項目(説明変数)をステップワイズ法を用いて絞り込むようになっている。
特開2012−128800号公報
例えば複数の機械を解析する場合、各機械から複数のデータ項目を含むデータをサンプリングし、得られた各機械のデータに対して解析処理を行う。データをサンプリングした複数の機械に異なる種類の機械が含まれていたり、異常が発生している機械が含まれていたりすると、これらの機械からサンプリングされたデータは他の機械からサンプリングされたデータとは傾向が異なる。このため、全ての機械のデータに対してステップワイズ法を適用すると、適切にデータ項目を選択することができず、適切に機械を解析することができない。
本発明は斯かる事情に鑑みてなされたものであり、その主たる目的は、多種多量のデータから解析に適したデータを決定できる解析対象決定装置及び解析対象決定方法を提供することにある。
上述した課題を解決するために、本発明の一の態様の解析対象決定装置は、複数のデータ項目を含むデータを解析する場合に、少なくとも一部のデータ項目を変数として含むモデルを用いた解析の対象を決定する解析対象決定装置であって、複数のデータから毎回異なる一部のデータを選択する選択手段と、前記選択手段によって選択されたデータに基づいて、モデルの生成に適するデータ項目が選択可能であるか否かを判定する判定手段と、前記選択手段及び前記判定手段による処理を複数回繰り返した後、前記判定手段による判定結果に基づいて、解析対象とするデータを決定する決定手段と、を備える。
この態様において、前記解析対象決定装置は、前記選択手段及び前記判定手段による処理を複数回繰り返した後、前記判定手段による判定結果に基づいて、解析に用いられるデータ項目を決定する第2決定手段をさらに備えてもよい。
また、上記態様において、前記決定手段は、前記判定手段によって選択可能とされたデータ項目毎の回数に基づいて、解析に用いられるデータ項目を決定するように構成されていてもよい。
また、上記態様において、前記解析対象決定装置は、前記判定手段によって前記データ項目が選択可能と判定された場合、選択可能とされたデータ項目を用いて生成されたモデルの誤差を評価する評価手段をさらに備え、前記第2決定手段は、前記選択手段、前記判定手段、及び前記評価手段による処理を複数回繰り返した後、前記評価手段による評価結果に基づいて、解析に用いられるデータ項目を決定するように構成されていてもよい。
また、上記態様において、前記解析対象決定装置は、前記決定手段によって決定された解析対象のデータを出力する出力手段をさらに備えてもよい。
また、上記態様において、前記解析対象決定装置は、前記第2決定手段によって決定された解析に用いられるデータ項目を出力する出力手段をさらに備えてもよい。
また、上記態様において、前記解析対象決定装置は、前記解析対象のデータとは異なるデータを解析に適さないデータとして出力する第2出力手段をさらに備えてもよい。
また、上記態様において、前記複数のデータは時系列データであり、前記第2出力手段は、前記判定手段が連続する複数のデータについて前記データ項目が選択可能と判定し、且つ、次の連続する複数のデータについて前記データ項目が選択不可能と判定した場合に、前記次の連続する複数のデータの先頭のデータを異常データとして出力するように構成されていてもよい。
また、上記態様において、前記判定手段は、ステップワイズ法により前記モデルの生成に適するデータ項目が選択可能か否かを判定するように構成されていてもよい。
また、上記態様において、前記解析対象決定装置は、前記判定手段によって前記データ項目を選択可能と複数回判定された場合に、前記選択手段によって共通して選択されたデータを同一のグループとして決定する第3決定手段と、前記第3決定手段によって同一のグループとして決定されたデータを出力する第3出力手段と、をさらに備えてもよい。
本発明の他の態様の解析対象決定方法は、複数のデータ項目を含むデータを解析する場合に、少なくとも一部のデータ項目を変数として含むモデルを用いた解析の対象を決定する解析対象決定方法であって、コンピュータが、複数のデータから毎回異なる一部のデータを選択するステップと、前記コンピュータが、選択されたデータに基づいて、モデルの生成に適するデータ項目が選択可能であるか否かを判定するステップと、前記コンピュータが、前記選択するステップ及び前記判定するステップを複数回繰り返した後、前記判定するステップにおける判定結果に基づいて、解析対象とするデータを決定するステップと、を有する。
本発明によれば、多種多量のデータから解析に適したデータを決定できる。
解析対象決定装置を含む解析システムの一例を示す模式図。 解析対象決定装置を含む解析システムの他の例を示す模式図。 実施の形態1に係る解析対象決定装置の構成を示すブロック図。 実施の形態1に係る解析対象決定装置による解析対象決定処理の手順を示すフローチャート。 処理結果画面の一例を示す図。 処理結果画面の他の例を示す図。 性能評価試験に使用したデータを示すグラフ。 データの選択例を説明するためのグラフ。 目的変数の推定結果を示すグラフ。 時系列データ全体に対して本モデルを適用した場合のグラフ。 ステップワイズ法が成功したときのデータ項目毎の選択率を示すグラフ。 モデルの誤差の評価値が小さい場合におけるデータ項目の選択率を示すグラフ。 ステップワイズ法が失敗したときのデータ毎の選択率を示すグラフ。 実施の形態2に係る解析対象決定装置による解析対象決定処理の手順を示すフローチャート。 処理結果画面の例を示す図。 実施の形態3に係る解析対象決定装置による解析対象決定処理の手順を示すフローチャート。 処理結果画面の例を示す図。
以下、本発明の好ましい実施の形態を、図面を参照しながら説明する。
(実施の形態1)
本実施の形態に係る解析対象決定装置の構成について説明する。本実施の形態に係る解析対象決定装置は、多種多量のデータを収集する。図1は、本実施の形態に係る解析対象決定装置を含む解析システムの一例を示す模式図であり、図2は、他の例を示す模式図である。例えば、生産設備を解析する場合、図1に示すように、解析対象決定装置1は、生産設備に設けられた複数のセンサ2,2,…に接続されており、各センサ2,2,…からの検出信号を受信することで、時系列データを収集する。なお、図1では、圧延鋼板の製造設備を解析するための解析システムを示しており、センサ2,2,…には、振動センサ、速度センサ、張力センサ、厚みセンサ、圧力センサ、温度センサ等の多種のセンサが含まれる。また、複数の機械を解析する場合、図2に示すように、解析対象決定装置1は、複数の機械3,3,…のそれぞれに設けられた複数のセンサ21,21,…に接続されており、各センサ21,21,…からの検出信号を受信することで、複数の機械の状態を示すデータを収集する。なお、図2では、複数の溶接ロボットを解析するための解析システムを示しており、センサ21,21,…には、温度センサ、圧力センサ、角度センサ、速度センサ、加速度センサ、電流センサ等の多種のセンサが含まれる。また、解析対象決定装置1が収集するデータは、センサ情報に限られず、制御系の指令値情報又は誤差情報などでもよい。
検索、電子商取引、ソーシャルメディア等のウェブサービス分野の解析システムの場合、サーバから解析対象決定装置1が検索履歴、商品・デジタルコンテンツの購買履歴、決算情報、コミュニケーションの発信履歴等のデータを受信するようにしてもよい。また、上記のようにして得られたデータを記録した記録媒体から、解析対象決定装置1がデータを読み出すようにしてもよい。
図3は、本実施の形態に係る解析対象決定装置の構成を示すブロック図である。解析対象決定装置1は、コンピュータ10によって実現される。図3に示すように、コンピュータ10は、本体11と、表示部13と、入力部12とを備えている。本体11は、CPU111、ROM112、RAM113、ハードディスク115、読出装置114、入出力インタフェース116、画像出力インタフェース117、及び通信インタフェース118を備えており、CPU111、ROM112、RAM113、ハードディスク115、読出装置114、入出力インタフェース116、画像出力インタフェース117、及び通信インタフェース118は、バスによって接続されている。
CPU111は、RAM113にロードされたコンピュータプログラムを実行することが可能である。そして、解析対象決定処理用のコンピュータプログラムである解析対象決定プログラム110を当該CPU111が実行することにより、コンピュータ10が解析対象決定装置1として機能する。
ROM112は、マスクROM、PROM、EPROM、又はEEPROM等によって構成されており、CPU111に実行されるコンピュータプログラム及びこれに用いるデータ等が記録されている。
RAM113は、SRAMまたはDRAM等によって構成されている。RAM113は、ハードディスク115に記録されている解析対象決定プログラム110の読み出しに用いられる。また、CPU111がコンピュータプログラムを実行するときに、CPU111の作業領域として利用される。
ハードディスク115は、オペレーティングシステム及びアプリケーションプログラム等、CPU111に実行させるための種々のコンピュータプログラム及び当該コンピュータプログラムの実行に用いられるデータがインストールされている。解析対象決定プログラム110も、このハードディスク115にインストールされている。
入出力インタフェース116は、例えばUSB,IEEE1394,又はRS-232C等のシリアルインタフェース、SCSI,IDE,又は IEEE1284等のパラレルインタフェース、及びD/A変換器、A/D変換器等からなるアナログインタフェース等から構成されている。入出力インタフェース116には、キーボード及びマウスからなる入力部12が接続されており、ユーザが当該入力部12を使用することにより、コンピュータ10にデータを入力することが可能である。
画像出力インタフェース117は、LCDまたはCRT等で構成された表示部13に接続されており、CPU111から与えられた画像データに応じた映像信号を表示部13に出力するようになっている。表示部13は、入力された映像信号にしたがって、画像(画面)を表示する。
通信インタフェース118は、外部の機器とデータ通信するためのものである。データを通信によって受信する場合、通信インタフェース118には、各種センサ、又はデータを蓄積するサーバが接続される。例えば、圧延鋼板の製造設備の場合、通信インタフェース118には、振動センサ、速度センサ、張力センサ、厚みセンサ、圧力センサ、温度センサ等のセンサ2,2,…が接続されており、これらのセンサから出力された時系列データが通信インタフェース118によって取り込まれる。
[解析対象決定装置の動作]
以下、本実施の形態に係る解析対象決定装置1の動作について説明する。
図3は、本実施の形態に係る解析対象決定装置1による解析対象決定処理の手順を示すフローチャートである。
CPU111は、解析対象決定処理を開始すると、データのなかからランダムに一部のデータを選択する(ステップS101)。
解析対象決定装置1によって収集されたデータは、次のように表される。
Figure 2017138643
ここで、N,Mは1より大きい整数であり、kは1≦k≦N,Mを満たす整数である。
(1)式においてYは目的変数であり、Xは変数である。上からk番目のデータは、(y,xk1,xk2,…,xkM)である。ステップS101の処理では、CPU111は、ランダムにkを複数選択する。例えば、次に示すように、2番目、p番目、q番目、…(p,qは1≦p,q≦Mを満たす整数)をCPU111は選択する。
Figure 2017138643
次に、CPU111は、ステップS101において選択したデータ(Ysi,Xsi)に対してステップワイズ法を適用し、(3)式に示すモデル(線型モデル)の生成に適したデータ項目(変数)を選択する(ステップS102)。ここで、iは1以上の整数であり、初期値は1である。ステップS102の処理では、XsiのN個の変数の中から、モデルの生成に適した一部の変数が選択される。
Figure 2017138643
ステップS102の処理についてさらに詳しく説明する。ステップS102では、CPU111は、選択されたデータに対してステップワイズ法を適用する。ステップワイズ法については、田中豊、脇本和昌著、「多変量統計解析法」、第9版、現代数学社、1994年2月20日、p.42−47(以下、「参照文献1」という)等に記載されている。以下、ステップワイズ法について説明する。なお、以下のステップワイズ法の説明において、(4)及び(5)式で用いるパラメータの表記は、参照文献1に記載されているパラメータの表記に合わせている。
(ステップI)まず、目的変数yとの単相関が最大の変数を選ぶ。つまり、1つずつ順番に変数(データ項目)を採用してモデル(回帰式)を生成し、回帰係数検定のためのtの絶対値又はF値(下式参照)が最大の変数を選ぶ。選ばれた変数に対する回帰係数が0であるという仮説の検定を行い、棄却されなければどの変数もモデルに含めない。棄却されればこの変数をモデルに取り込んでステップIIに進む。
(ステップII)既にモデルに入っている変数に加えて残りの変数を順番に1つずつ採用し、偏相関が最大(回帰係数検定のためのtの絶対値又はF値が最大)の変数を選ぶ。回帰係数が0であるという仮説の検定を行い棄却されなければ処理を終了する。棄却されれば選ばれた変数をモデルに取り込んでステップIIIに進む。
(ステップIII)モデルを計算して各変数について回帰係数の検定を行い、F値が最小になる変数について仮説が棄却されなければその変数をモデルから除外する。
(ステップIV)全ての変数がモデルに取り込まれていれば処理を終了する。そうでなければステップIIに戻る。
上記のステップワイズ法において、回帰係数の検定は次のようにして行う。p個の変数を含むモデルでの変数xに対する回帰係数が0であるという仮説H:a=0の検定は、次式でt値を求めて自由度n−p−1のt分布の限界値と比較し、|t|≧tα(n−p−1)ならば仮説を棄却し、|t|<tα(n−p−1)ならば仮説を採択する。
Figure 2017138643
ここで、tα(n−p−1)は自由度(n−p−1)のt分布の両側100α%点の限界値(100×(1−α)%の信頼区間の境界値)を、nはステップS101において選択したデータ個数(すなわち、Ysiの要素数あるいはXsiの行数)を、sjjは誤差の分散の不偏推定値を、Veはp個の変数を含むモデルでの説明変数の分散共分散行列において、その逆行列のj番目の対角要素の値をそれぞれ示している。
上記の回帰係数の検定に代えて、t分布とF分布の関係より、次式のFを求めて自由度(1,n−p−1)のF分布の限界値と比較し、|F|≧F n−p−1(α)ならば仮説を棄却するようにしてもよい。
Figure 2017138643
ここでは、ステップワイズ法によりモデルの生成に適した変数を選択したが、総当たり法、前進選択法、後退消去法、ベストサブセット回帰、部分最小二乗法、主成分回帰等のステップワイズ法以外の変数選択法によって変数を選択してもよい。
次にCPU111は、有意なモデルの生成が可能か否か、即ち、モデルの生成に適したデータとデータ項目の組合せの選択に成功したか否かを判定する(ステップS103)。有意なモデルの生成が可能と判定した場合(ステップS103においてYES)、CPU111は、ステップS101において選択されたデータ中のステップS102において選択されたデータ項目を用いてモデルを生成し、目的変数の実際の値Ysiと、モデルから求めた目的変数の値Ymiとを比較し、モデルの誤差を評価する(ステップS104)。ステップS104においては、CPU111は、評価値Jを算出する。評価値Jは、例えば、YsiとYmiとの差の二乗和の平方根とすることができる。
Figure 2017138643
ここで、||●||はユークリッドノルムを、Tは行列又はベクトルの転置を示す。
上記のステップS104の後、CPU111は、そのとき選択されているデータの番号(上記の例では2,p,q,…)と、ステップワイズ法によって選択されたデータ項目の番号をハードディスク115に記憶する(ステップS105)。ステップS105の後、CPU111は、処理をステップS107へ進める。
ステップS103において、モデルの生成が不可能と判定された場合(ステップS103においてNO)、CPU111は、モデルの誤差の評価値Jを∞に設定する(ステップS106)。無限大を表現できない場合は、Jを十分大きな数に設定すればよい。ステップS106の後、CPU111は、処理をステップS107へ進める。
ステップS107において、CPU111は、上記のS101〜S106の処理を規定回数繰り返したか否かを判定する。規定回数繰り返していない場合(ステップS107においてNO)、CPU111は、変数iを1インクリメントし(ステップS108)、ステップS101に処理を戻す。これにより、ステップS101〜S106の処理が規定回数繰り返される。
ステップS101〜S106の処理が規定回数繰り返された場合(ステップS107においてYES)、CPU111は、評価値Jを小さいものの上位1%を選択し、選択された上位1%の評価値が得られた場合に選択されたデータ項目を集計する(ステップS109)。なお、上位1%ではなく上位5%とする等、選択対象の評価値Jの割合は適宜設定することができる。
ステップS109で集計されたデータ項目のうち、選択された回数が多いデータ項目は、目的変数Yに影響を与える因子つまり、解析に適したデータ項目であると考えることができる。CPU111は、ステップS109で集計されたデータ項目のうち、例えば、予め設定された回数以上選択されたデータ項目を、解析に適したデータ項目として決定し、これらのデータ項目の番号をハードディスク115に記憶する(ステップS110)。
また、CPU111は、ステップS103においてモデルの生成が不可能であると判断された場合に(つまり、J=∞の場合に)選択された回数をデータ毎に集計する(ステップS111)。あるデータが選択されているときに、モデルの生成が不可能であると判定されている回数が多い場合、そのデータは解析に適さないデータであると考えることができる。これに対し、解析に適さないデータ以外は、解析可能なデータであると考えることができる。CPU111は、モデルの生成が不可能であると判定された場合に所定回数以上選択されたデータを、解析に適さないデータとして決定し、それ以外のデータを解析対象のデータとして決定し、解析に適さないデータ及び解析対象のデータの番号をそれぞれハードディスク115に記憶する(ステップS112)。
CPU111は、上記のような解析対象決定処理の処理結果画面を表示部13に表示させ(ステップS113)、解析対象決定処理を終了する。
図5は、処理結果画面の一例を示す図である。この例の処理結果画面30は、解析対象として決定されたデータの番号と、解析に適するデータ項目の番号とを含む。これにより、解析対象のデータ、及び、解析に適するデータ項目をユーザが確認できる。また、解析対象のデータ中の解析に適するデータ項目を用いてモデルを生成することで多種多量のデータを解析できる。
図6は、処理結果画面の他の例を示す図である。この例の処理結果画面31は、解析に適するデータ項目の番号と、解析に適さないデータの番号とを含む。解析に適さないデータには異常なデータが含まれる可能性がある。解析に適さないデータを出力することで、異常の可能性があるデータをユーザに通知できる。また、解析に適さないデータ以外のデータを解析対象とすることができ、解析対象のデータの中の解析に適するデータ項目を用いてモデルを生成することで多種多量のデータを解析できる。
(性能評価試験)
発明者は、上記の実施の形態1に係る解析対象決定方法の性能評価試験を実施した。
図7は、性能評価試験に使用したデータを示すグラフである。図7において縦軸は目標変数Yの値を、横軸は時間を示す。このデータは時系列データであり、1つのデータ(つまり、1つの時点におけるデータ)には時間情報を含む20個のデータ項目が含まれる。発明者はこの時系列データ全体に対してステップワイズ法を適用したが、モデルの生成に適するデータ項目を選択することはできなかった。
次に、発明者は、上記の時系列データの中から5割のデータをランダムに選択した。図8は、データの選択例を説明するためのグラフである。図8において、▲マークは、ある場合において選択されたデータを示し、●マークは、その場合において選択されなかったデータを示している。
選択されたデータに対してステップワイズ法を適用すると、20個のデータ項目のうち、8個のデータ項目(変数)が選択された。この8個の変数を使用してモデルを生成し、選択されたデータについて目的変数Yの値を推定した。図9は、目的変数Yの推定結果を示すグラフである。なお、図9において、時間と目的変数との関係を明らかにするために、目的変数の値を他の説明変数の値で修正して、修正後の目的変数の値を対応する時間毎にプロットしている。即ち、回帰モデルが(7)式で表される場合、xが時間情報であるとすると、(8)式の左辺が図9の縦軸に対応している。
Figure 2017138643
図9に示すように、精度の良い回帰式が得られていることが分かる。図10は、時系列データ全体に対して本モデルを適用した場合のグラフである。図10において、▲マークは、選択されたデータを示し、●マークは、選択されなかったデータを示している。選択されなかったデータには、本モデルにしたがわないものが含まれ、選択されたデータとは属性が異なっている可能性があることが分かる。
上記のような処理を10000回繰り返し、ステップワイズ法が成功した(つまり、ステップワイズ法でデータ項目を選択できた)場合における各データ項目の選択率を求めた。図11は、ステップワイズ法が成功したときのデータ項目毎の選択率を示すグラフである。図11において、縦軸は選択率を、横軸はデータ項目の番号を示している。図11に示すように、2番目のデータ項目の選択率が突出して高く、重要なデータ項目であると考えられる。また、6番目、8番目、17番目のデータ項目も選択率が高く、重要なデータ項目であると考えられる。
また、発明者は、ステップワイズ法が成功した場合それぞれにおけるモデルの誤差を評価し、誤差の小さなモデルに共通して選ばれたデータ項目を調査した。図12は、モデルの誤差の評価値が小さい場合におけるデータ項目の選択率を示すグラフである。図12の上のグラフは評価値を誤差の二乗平均平方根とした場合の結果を示し、中央のグラフは評価値を誤差のL1ノルム(絶対値平均)とした場合の結果を示し、下のグラフは評価値を誤差の∞ノルム(最大値)とした場合の結果を示している。各グラフにおいて、縦軸は選択率を示し、横軸はデータ項目の番号を示している。
図12より、6番目、16番目、11番目等のデータ項目が、誤差の小さなモデルに共通して選択されていることが分かり、重要なデータ項目であると考えられる。
また、発明者は、ステップワイズ法が失敗した(つまり、ステップワイズ法ではデータ項目を選択できなかった)場合における各データの選択率を求めた。図13は、ステップワイズ法が失敗したときのデータ毎の選択率を示すグラフである。図13において、縦軸は選択率を、横軸はデータの番号を示している。図13に示すように、11番目のデータが選択されたときには、8割程度の確率でステップワイズ法が失敗している。このデータは異常データである可能性が高く、解析対象から除外すべきデータであることが分かる。
以上のように、実施の形態1に係る解析対象決定方法は、一見関係を見いだせないデータ群からでも、関係性を導出するための解析対象のデータ及びデータ項目を高精度に決定することができる。
(実施の形態2)
本実施の形態に係る解析対象決定装置は、時系列データに対して処理を行い、異常が発生した時点を推定する。本実施の形態に係る解析対象決定装置の構成は、実施の形態1に係る解析対象決定装置1の構成と同様であるので、同一構成要素については同一符号を伏し、その説明を省略する。
本実施の形態に係る解析対象決定装置の動作について説明する。図14は、本実施の形態に係る解析対象決定装置による解析対象決定処理の手順を示すフローチャートである。
ステップS101〜S112の処理は、実施の形態1において説明したものと同様であるので、その説明を省略する。
ステップS112の処理の後、CPU111は、各時刻におけるモデルの生成が可能か否かの判定結果により、ある時刻までは所定回数以上連続してモデルが生成可能と判定され、その時刻の後は所定回数以上連続してモデルが生成不可能と判定される時刻を検出する(ステップS213)。時系列データにおいて、このようなある時刻を挟んでモデルの生成が可能な状態からモデルの生成が不可能な状態に変化する場合、その時刻において異常が発生したと考えることができる。以下、当該時刻を「異常発生時刻」という。
CPU111は、上記のような解析対象決定処理の処理結果画面を表示部13に表示させ(ステップS214)、解析対象決定処理を終了する。図15は、処理結果画面の例を示す図である。ステップS213において異常発生時刻が検出された場合、ステップS214において表示される処理結果画面32には、異常発生時刻の情報(異常発生時刻及びその時刻におけるデータの番号)が含まれる。これにより、ユーザに対して異常が発生したと推定される時刻を通知することができる。また、時系列データのどのデータにおいて異常が発生したかをユーザが特定できる
(実施の形態3)
本実施の形態に係る解析対象決定装置は、解析対象として決定されたデータのグループ分けを行う。本実施の形態に係る解析対象決定装置の構成は、実施の形態1に係る解析対象決定装置1の構成と同様であるので、同一構成要素については同一符号を伏し、その説明を省略する。
本実施の形態に係る解析対象決定装置の動作について説明する。図16は、本実施の形態に係る解析対象決定装置による解析対象決定処理の手順を示すフローチャートである。
ステップS101〜S112の処理は、実施の形態1において説明したものと同様であるので、その説明を省略する。
ステップS112の処理の後、CPU111は、モデルを生成可能と複数回判定された場合に、モデルを生成可能と判定されたときに共通して選択されていた複数のデータを特定し、特定された複数のデータを同一のグループとして決定する(ステップS313)。
例えば、複数の溶接ロボットから取得されたデータの場合、溶接ロボットの構成の違い(例えば、ロボットの大きさの違い、手先トーチの違い、地面据え置きかスライダーに取り付けられているか)、用途の違い(溶接材料の厚みの違い、継ぎ手の違い、ウィビングの仕方の違い)等によって、溶接ロボットの特性の傾向が異なる。このため、モデルの生成が可能か否かの判定対象のデータに、構成、用途等が異なる複数種類の溶接ロボットから収集されたデータが含まれている場合、モデルが生成不可能と判定されることが多い。これに対して、モデルが生成可能と判定された場合に選択されているデータは、構成、用途等が共通する溶接ロボットから収集されたものであると推定できる。したがって、上記のステップS313の処理によって、傾向毎にデータをグループ分けすることができる。各グループのデータを解析することで、グループ毎にデータの傾向を捉えることが可能となる。
CPU111は、上記のような解析対象決定処理の処理結果画面を表示部13に表示させ(ステップS314)、解析対象決定処理を終了する。図17は、処理結果画面の例を示す図である。ステップS314において表示される処理結果画面33には、ステップS313において分けられたグループに含まれるデータの番号が、グループ毎に表示される。これにより、ユーザに対してグループ分けの結果を通知することができる。ユーザは、各グループに含まれるデータを特定することができ、グループ毎にデータの解析を行うことができる。
(その他の実施の形態)
上述した実施の形態1〜3においては、全データからランダムに選択されたデータ(Ysi,Xsi)に対してステップワイズ法を適用する構成について述べたが、これに限定されるものではない。前回以前のモデルの生成が可能か否かの判定結果に基づいて、モデルの生成に適さないデータと推定されるデータをステップワイズ法の適用対象から除外するようにしてもよい。これにより、データの探索範囲を絞ることができ、解析対象決定処理の計算量を低減することができる。
また、上述した実施の形態1〜3においては、ステップワイズ法によって全データ項目からモデルの生成に適したデータ項目を選択する構成について述べたが、これに限定されるものではない。前回以前のステップワイズ法の処理結果に基づいて、モデルの生成に適さないと推定されるデータ項目をステップワイズ法の適用対象から除外するようにしてもよい。これによっても、データの探索範囲を絞ることができ、解析対象決定処理の計算量を低減することができる。
また、上述した実施の形態1〜3においては、解析対象決定装置を1つのコンピュータによって構成したが、これに限定されるものではない。互いにデータ通信可能に接続された複数のコンピュータによって解析対象決定装置を構成し、異なるデータの組み合わせに対して各コンピュータでステップワイズ法を実行する構成とすることも可能である。
本発明の解析対象決定装置及び解析対象決定方法は、多種多量のデータから解析対象のデータを決定するための解析対象決定装置及び解析対象決定方法として有用である。
1 解析対象決定装置
10 コンピュータ
11 本体
12 入力部
13 表示部
110 機器データ処理プログラム
111 CPU
115 ハードディスク
116 入出力インタフェース
117 画像出力インタフェース
118 通信インタフェース

Claims (11)

  1. 複数のデータ項目を含むデータを解析する場合に、少なくとも一部のデータ項目を変数として含むモデルを用いた解析の対象を決定する解析対象決定装置であって、
    複数のデータから毎回異なる一部のデータを選択する選択手段と、
    前記選択手段によって選択されたデータに基づいて、モデルの生成に適するデータ項目が選択可能であるか否かを判定する判定手段と、
    前記選択手段及び前記判定手段による処理を複数回繰り返した後、前記判定手段による判定結果に基づいて、解析対象とするデータを決定する決定手段と、
    を備える、解析対象決定装置。
  2. 前記選択手段及び前記判定手段による処理を複数回繰り返した後、前記判定手段による判定結果に基づいて、解析に用いられるデータ項目を決定する第2決定手段をさらに備える、
    請求項1に記載の解析対象決定装置。
  3. 前記決定手段は、前記判定手段によって選択可能とされたデータ項目毎の回数に基づいて、解析に用いられるデータ項目を決定するように構成されている、
    請求項2に記載の解析対象決定装置。
  4. 前記判定手段によって前記データ項目が選択可能と判定された場合、選択可能とされたデータ項目を用いて生成されたモデルの誤差を評価する評価手段をさらに備え、
    前記第2決定手段は、前記選択手段、前記判定手段、及び前記評価手段による処理を複数回繰り返した後、前記評価手段による評価結果に基づいて、解析に用いられるデータ項目を決定するように構成されている、
    請求項2に記載の解析対象決定装置。
  5. 前記決定手段によって決定された解析対象のデータを出力する出力手段をさらに備える、
    請求項1乃至4の何れかに記載の解析対象決定装置。
  6. 前記第2決定手段によって決定された解析に用いられるデータ項目を出力する出力手段をさらに備える、
    請求項2乃至4の何れかに記載の解析対象決定装置。
  7. 前記解析対象のデータとは異なるデータを解析に適さないデータとして出力する第2出力手段をさらに備える、
    請求項1乃至6の何れかに記載の解析対象決定装置。
  8. 前記複数のデータは時系列データであり、
    前記第2出力手段は、前記判定手段が連続する複数のデータについて前記データ項目が選択可能と判定し、且つ、次の連続する複数のデータについて前記データ項目が選択不可能と判定した場合に、前記次の連続する複数のデータの先頭のデータを異常データとして出力するように構成されている、
    請求項7に記載の解析対象決定装置。
  9. 前記判定手段は、ステップワイズ法により前記モデルの生成に適するデータ項目が選択可能か否かを判定するように構成されている、
    請求項1乃至8の何れかに記載の解析対象決定装置。
  10. 前記判定手段によって前記データ項目を選択可能と複数回判定された場合に、前記選択手段によって共通して選択されたデータを同一のグループとして決定する第3決定手段と、
    前記第3決定手段によって同一のグループとして決定されたデータを出力する第3出力手段と、
    をさらに備える、
    請求項1乃至9の何れかに記載の解析対象決定装置。
  11. 複数のデータ項目を含むデータを解析する場合に、少なくとも一部のデータ項目を変数として含むモデルを用いた解析の対象を決定する解析対象決定方法であって、
    コンピュータが、複数のデータから毎回異なる一部のデータを選択するステップと、
    前記コンピュータが、選択されたデータに基づいて、モデルの生成に適するデータ項目が選択可能であるか否かを判定するステップと、
    前記コンピュータが、前記選択するステップ及び前記判定するステップを複数回繰り返した後、前記判定するステップにおける判定結果に基づいて、解析対象とするデータを決定するステップと、
    を有する、解析対象決定方法。
JP2016016950A 2016-02-01 2016-02-01 解析対象決定装置及び解析対象決定方法 Active JP6633403B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016016950A JP6633403B2 (ja) 2016-02-01 2016-02-01 解析対象決定装置及び解析対象決定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016016950A JP6633403B2 (ja) 2016-02-01 2016-02-01 解析対象決定装置及び解析対象決定方法

Publications (2)

Publication Number Publication Date
JP2017138643A true JP2017138643A (ja) 2017-08-10
JP6633403B2 JP6633403B2 (ja) 2020-01-22

Family

ID=59565902

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016016950A Active JP6633403B2 (ja) 2016-02-01 2016-02-01 解析対象決定装置及び解析対象決定方法

Country Status (1)

Country Link
JP (1) JP6633403B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2018092317A1 (ja) * 2016-11-21 2019-02-14 株式会社日立製作所 選択装置、選択方法、および選択プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005222445A (ja) * 2004-02-09 2005-08-18 Nifty Corp データマイニングにおける情報処理方法及び解析装置
JP2006338265A (ja) * 2005-06-01 2006-12-14 Fujitsu Ltd データ解析方法およびデータ解析プログラム
JP2007329415A (ja) * 2006-06-09 2007-12-20 Fujitsu Ltd データ処理方法、データ処理プログラム、該プログラムを記録した記録媒体およびデータ処理装置
JP2009076037A (ja) * 2007-08-24 2009-04-09 Nippon Steel Engineering Co Ltd プロセスの状態類似事例検索方法、プロセスの状態予測方法及び制御方法
WO2014199920A1 (ja) * 2013-06-12 2014-12-18 日本電気株式会社 予測関数作成装置、予測関数作成方法、及びコンピュータ読み取り可能な記録媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005222445A (ja) * 2004-02-09 2005-08-18 Nifty Corp データマイニングにおける情報処理方法及び解析装置
JP2006338265A (ja) * 2005-06-01 2006-12-14 Fujitsu Ltd データ解析方法およびデータ解析プログラム
JP2007329415A (ja) * 2006-06-09 2007-12-20 Fujitsu Ltd データ処理方法、データ処理プログラム、該プログラムを記録した記録媒体およびデータ処理装置
JP2009076037A (ja) * 2007-08-24 2009-04-09 Nippon Steel Engineering Co Ltd プロセスの状態類似事例検索方法、プロセスの状態予測方法及び制御方法
WO2014199920A1 (ja) * 2013-06-12 2014-12-18 日本電気株式会社 予測関数作成装置、予測関数作成方法、及びコンピュータ読み取り可能な記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2018092317A1 (ja) * 2016-11-21 2019-02-14 株式会社日立製作所 選択装置、選択方法、および選択プログラム

Also Published As

Publication number Publication date
JP6633403B2 (ja) 2020-01-22

Similar Documents

Publication Publication Date Title
JP7244610B2 (ja) 工業プロセス施設に対する工業プロセスパフォーマンスを測定するシステム及びコンピュータ実装方法、並びに金融商品に対して測定された目標変数における外れ値偏りを低減するコンピュータ実装方法
US11216741B2 (en) Analysis apparatus, analysis method, and non-transitory computer readable medium
US7373283B2 (en) Monitoring and fault detection system and method using improved empirical model for range extrema
JP3495705B2 (ja) センサおよびプロセスの超高感度監視
US7739096B2 (en) System for extraction of representative data for training of adaptive process monitoring equipment
US10789257B2 (en) System and method for similarity search in process data
US9779495B2 (en) Anomaly diagnosis method and apparatus
JP4046309B2 (ja) プラント監視装置
CN102209958B (zh) 用于对批处理进行实时分类和性能监控的系统和方法
JP5292477B2 (ja) 診断装置及び診断方法
EP2930579A2 (en) State monitoring system, state monitoring method and state monitoring program
WO2006039760A1 (en) Method of analysing data
JP6708203B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
JP2017194341A (ja) 異常診断方法、異常診断装置、及び異常診断プログラム
Gitzel Data Quality in Time Series Data: An Experience Report.
JP2005092466A (ja) 診断プロセス支援方法とそのためのプログラム
JP6633403B2 (ja) 解析対象決定装置及び解析対象決定方法
JP6302755B2 (ja) プラント診断用データ作成システム
TWI787640B (zh) 可轉移性判定裝置、可轉移性判定方法、及可轉移性判定程式
WO2011163390A1 (en) Systems and methods for impact analysis in a computer network
JP2019204290A (ja) 異常原因推定装置、異常原因推定方法、および異常原因推定プログラム
JP2008117380A (ja) 診断プロセス支援方法とそのためのプログラム
CN106096219B (zh) 一种用于果蔬识别算法性能评价的数据质量分析方法
JP2020201890A (ja) 異常検知装置及び異常検知方法
WO2023119598A1 (ja) 情報処理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191212

R150 Certificate of patent or registration of utility model

Ref document number: 6633403

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150