JP6992922B1 - データ分割装置、データ分割方法、及びプログラム - Google Patents

データ分割装置、データ分割方法、及びプログラム Download PDF

Info

Publication number
JP6992922B1
JP6992922B1 JP2021080213A JP2021080213A JP6992922B1 JP 6992922 B1 JP6992922 B1 JP 6992922B1 JP 2021080213 A JP2021080213 A JP 2021080213A JP 2021080213 A JP2021080213 A JP 2021080213A JP 6992922 B1 JP6992922 B1 JP 6992922B1
Authority
JP
Japan
Prior art keywords
division
result
measurement data
procedure
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021080213A
Other languages
English (en)
Other versions
JP2022174425A (ja
Inventor
直人 石橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Original Assignee
Fuji Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd filed Critical Fuji Electric Co Ltd
Priority to JP2021080213A priority Critical patent/JP6992922B1/ja
Application granted granted Critical
Publication of JP6992922B1 publication Critical patent/JP6992922B1/ja
Publication of JP2022174425A publication Critical patent/JP2022174425A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Testing And Monitoring For Control Systems (AREA)

Abstract

【課題】データ分割の結果をユーザの知識と照合可能にすること。【解決手段】一実施形態に係るデータ分割装置は、機器をセンサにより計測した計測データを収集する収集部と、前記収集部により収集された計測データに含まれる1つ以上の因子を用いて、複数の前記計測データを1以上のクラスタに分割する分割部と、前記1つ以上の因子と、前記分割部による分割の結果との間の関係を分析する分析部と、前記分割部による分割の結果、前記分析部による分析の結果、前記分割の結果と前記分割の結果との両方を反映した相互結果、の少なくとも1つを可視化する可視化部と、を有する。【選択図】図2

Description

本発明は、データ分割装置、データ分割方法、及びプログラムに関する。
近年、センサの発達や通信費の低下等に伴って様々な機器(例えば、プラント、各種設備、装置等)の物理量を計測したデータの収集が容易になってきており、これらのデータを活用して当該機器の運用を支援するサービスの実現が期待されている。例えば、省エネ化や省力化、高品質化等を目的として、AI(Artificial Intelligence)や機械学習技術によりプラントの最適な運用計画の策定を支援したり、プラントの異常を検知したりするサービス等の実現が期待されている。
AIや機械学習技術では、プラント等から収集したデータを用いて、省エネ化や省力化、高品質化等といった目的を実現するためのモデルの構築が行われる。この際に、例えば、異なるデータ傾向の混在やデータの経時的な変化等に起因するモデルの性能低下を防止するため、収集したデータを複数のデータ群に分割した上で、この分割後のデータ群からモデルを構築することが行われている。
例えば、特許文献1には、プラント等の異常検知を対象として、センサから収集したデータをクラスタリングした上で、新しいデータが得られたときは、この新しいデータに近いクラスタに属するデータから正常モデルを構築して異常検知を行う技術が開示されている。
また、例えば、特許文献2には、太陽光発電の予測を対象として、発電量予測に必要なデータをクラスタリングした上で、クラスタ毎にニューラルネットワークを構築し、テストデータと一番近いクラスタのニューラルネットワークにより発電量を予測する技術が開示されている。
特許第5342708号公報 特許第5888640号公報
しかしながら、上記の特許文献1や2等の従来技術は、クラスタリング技術によりデータのみでデータ分割が完結する点で利点があるものの、例えば、データ分割結果と運用者の知識や知見(以下、まとめて「知識」という。)との照合が困難であった。このため、例えば、運用者の知識からするとデータ傾向に差異がなく、データ分割をしない方が良い場合であっても、データ分割が行われてしまうことがある。また、逆に、例えば、運用者の知識からするとデータ傾向に差異があり、データ分割をした方が良い場合であっても、データ分割が行われないこともあり得る。
本発明の一実施形態は、上記の点に鑑みてなされたもので、データ分割の結果をユーザの知識と照合可能にすることを目的とする。
上記目的を達成するため、一実施形態に係るデータ分割装置は、機器をセンサにより計測した計測データを収集する収集部と、前記収集部により収集された計測データに含まれる1つ以上の因子を用いて、複数の前記計測データを1以上のクラスタに分割する分割部と、前記1つ以上の因子と、前記分割部による分割の結果との間の関係を分析する分析部と、前記分割部による分割の結果、前記分析部による分析の結果、前記分割の結果と前記分割の結果との両方を反映した相互結果、の少なくとも1つを可視化する可視化部と、を有する。
データ分割の結果をユーザの知識と照合可能にすることができる。
本実施形態に係るデータ分割装置のハードウェア構成の一例を示す図である。 本実施形態に係るデータ分割装置の機能構成の一例を示す図である。 本実施形態に係るデータ分割処理の流れの一例を示すフローチャートである。 分割対象の計測データ群の一例を示す図である。 データ分割後の計測データ群の一例を示す図である。 分割結果の可視化画面の一例を示す図である。 分析結果の可視化画面の一例を示す図である。 相互結果の可視化画面の一例を示す図である。
以下、本発明の一実施形態について説明する。本実施形態では、機器(例えば、プラント、各種設備、装置等)の物理量を計測したデータ(以下、「計測データ」ともいう。)を対象として、計測データ群のデータ分割結果をユーザの知識(特にドメイン知識)と照合可能なデータ分割装置10について説明する。本実施形態に係るデータ分割装置10を用いることで、ユーザはデータ分割結果を自身の知識と照合できる。このため、適切なデータ分割結果を用いて機械学習等のモデルを構築することが可能となり、ユーザの知識と合致する適切なモデル構築を行うことができるようになる。なお、ドメイン知識とは、計測データの計測対象となる機器やその運用、事業等に関する知識(特に専門知識)のことである。
<ハードウェア構成>
まず、本実施形態に係るデータ分割装置10のハードウェア構成について、図1を参照しながら説明する。図1は、本実施形態に係るデータ分割装置10のハードウェア構成の一例を示す図である。
図1に示すように、本実施形態に係るデータ分割装置10は一般的なコンピュータ又はコンピュータシステムのハードウェア構成で実現され、入力装置101と、表示装置102と、外部I/F103と、通信I/F104と、プロセッサ105と、メモリ装置106とを有する。これら各ハードウェアは、バス107により相互に通信可能に接続されている。
入力装置101は、例えば、キーボード、マウス、タッチパネル、各種ボタン等である。表示装置102は、例えば、ディスプレイ等である。
外部I/F103は、記録媒体103a等の外部装置とのインタフェースである。データ分割装置10は、外部I/F103を介して、記録媒体103aの読み取りや書き込み等を行うことができる。なお、記録媒体103aとしては、例えば、SDメモリカード(SD memory card)、USBメモリ、CD(Compact Disk)、DVD(Digital Versatile Disk)等が挙げられる。
通信I/F104は、データ分割装置10を通信ネットワークに接続するためのインタフェースである。プロセッサ105は、例えば、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)等の各種演算装置である。メモリ装置106は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、RAM(Random Access Memory)、ROM(Read Only Memory)等の各種記憶装置である。
本実施形態に係るデータ分割装置10は、図1に示すハードウェア構成を有することにより、後述するデータ分割処理を実現することができる。なお、図1に示すハードウェア構成は一例であって、データ分割装置10は、他のハードウェア構成を有していてもよい。例えば、データ分割装置10は、複数のプロセッサ105を有していてもよいし、複数のメモリ装置106を有していてもよい。
<機能構成>
次に、本実施形態に係るデータ分割装置10の機能構成について、図2を参照しながら説明する。図2は、本実施形態に係るデータ分割装置10の機能構成の一例を示す図である。
図2に示すように、本実施形態に係るデータ分割装置10は、収集部201と、データ分割部202と、分析部203と、可視化部204とを有する。これら各部は、例えば、データ分割装置10にインストールされた1以上のプログラムが、プロセッサ105等に実行させる処理により実現される。
また、本実施形態に係るデータ分割装置10は、記憶部205を有する。記憶部205は、例えば、メモリ装置106により実現される。ただし、記憶部205は、例えば、データ分割装置10と通信ネットワークを介して接続される記憶装置(例えば、データベースサーバ)等により実現されてもよい。
収集部201は、機器の物理量を計測することで得られた計測データを収集し、記憶部205に格納する。ここで、計測データには、機器が計測された日時と、1以上の因子とが少なくとも含まれる。因子とは機器に影響を与える要因の観測値のことであり、典型的にはセンサ値(計測値)のことである。以下では、因子はセンサ値(計測値)であるものとする。どのような因子が計測データに含まれるかは機器の種類や運用内容、事業内容、またセンサの種類等によって異なり得るが、典型的には、温度、圧力、流量、濃度、電圧値、電流値等といったものが挙げられる。なお、計測データに含まれる1以上の因子は、それぞれが異なるセンサで計測されたセンサ値であってもよい。
以下では、計測データには日時と1以上の因子とが含まれるものとするが、これら以外にも、例えば、計測対象となった機器のID等が含まれていてもよい。
なお、収集部201は、任意の方法で計測データを収集すればよい。例えば、収集部201は、LAN(Local Area Network)等の通信ネットワークを介してセンサ等から計測データを受信することで収集してもよいし、キーボード等の入力装置101によって計測データが入力されることで収集してもよい。
また、収集部201は、計測データ以外にも、例えば、機器の運転データを収集してもよい。運転データには、例えば、機器の計測値の正常範囲や異常範囲、機器の各種イベント(例えば、操業日や設備点検日等)を示す情報等が含まれる。運転データが収集された場合には、これらの運転データも記憶部205に格納される。
データ分割部202は、記憶部205に格納されている計測データのうち、分割対象となる計測データの集合(以下、「分割対象の計測データ群」ともいう。)を分割する。より具体的には、データ分割部202は、分割対象の計測データ群に含まれる因子のうち、計測データの特性を判断可能な1以上の因子を用いて、クラスタリング手法により分割対象の計測データ群を複数のクラスタ(クラスタが1つの場合も含む。)に分割する。なお、どの因子を用いてクラスタリングを行うかはユーザによって指定されてもよい。
クラスタリング手法では、分割対象の計測データ群に含まれる各計測データが何等かの基準に従って複数のクラスタ(クラスタが1つの場合も含む)に分類されることで、データ分割が行われる。また、その分割結果として、各計測データに対して、どのクラスタに分類されたかを示す離散値のラベルが付与される(つまり、各計測データがラベリングされる。)。以下では、ラベルが付与された計測データの集合を「データ分割後の計測データ群」ともいう。
なお、クラスタリング手法としては、既知の手法(例えば、k-means法、Gaussian Mixture Model、DBSCAN、SpectralClustering等)を用いればよい。この際、クラスタ数やそれに相当するパラメータ等といった種々のパラメータは任意に決めることが可能であるが、例えば、AIC(赤池情報量基準)等から決定してもよい。
分析部203は、データ分割部202による分割結果(言い換えれば、データ分割後の計測データ群に対するラベリング結果)を用いて、データ分割後の計測データ群を分析する。より具体的には、分析部203は、データ分割後の計測データ群に対するラベリング結果を目的変数、クラスタリング手法で用いた因子を説明変数として、クラス分類手法により目的変数と説明変数との関係を分析する。
クラス分類手法では、データ分割後の計測データ群に含まれる各計測データの目的変数が説明変数で説明可能なようにパラメータが調整される。本実施形態では、一例として、クラス分類手法として分類二進木と呼ばれる決定木を用いるものとする。ただし、分類ニ進以外の他のクラス分類手法が用いられてもよい。
分類二進木は分岐ノード(ルートノードも含む)を説明変数、リーフノードを目的変数とする決定木であり、各分岐ノードは2つの子ノード(以下、「0-子ノード」、「1-子ノード」ともいう。)を持つ。また、各分岐ノードにはIf-thenルールで記述される条件(例えば、「当該分岐ノードに対応する因子の値が閾値以上」等といった条件)が付与される。この条件はデータが分岐ノードに入力されたときに0-子ノード又は1-子ノードのいずれに分岐されるかを表す条件であり、例えば、当該条件を満たす場合はデータが0-子ノードに分岐され、当該条件を満たさない場合はデータが1-子ノードに分岐される。なお、上記の条件は、説明変数(因子)と閾値の組で表される。
このとき、分析部203は、データ分割後の計測データ群に含まれる各計測データを正しいラベルの値に分類するように分類二進木を構築する。すなわち、分析部203は、データ分割後の計測データ群に含まれる各計測データをルートノードに入力したときに、これらの各計測データが正しいラベル値のリーフノードに分類されるように分類二進木を構築する。
可視化部204は、データ分割部202による分割結果、分析部203による分析結果、及び当該分割結果と当該分析結果とを両方を相互に反映可能な相互結果を可視化する。
記憶部205は、収集部201によって収集された計測データを記憶する。記憶部205には、例えば、機器毎に、計測データが時系列データとして記憶されている。なお、記憶部205には、例えば、機器毎に、運転データが記憶されていてもよい。また、これら以外にも、記憶部205には、種々のデータ(例えば、データ分割部202による分割結果、分析部203による分析結果、これらの分割や分析を行う際の途中の計算結果等)が記憶されていてもよい。
なお、図2に示すデータ分割装置10の構成は一例であって、他の構成であってもよい。例えば、データ分割装置10が複数の装置で構成されており、これら複数の装置に各部(収集部201、データ分割部202、分析部203、可視化部204及び記憶部205)が分散されていてもよい。
<データ分割処理>
次に、本実施形態に係るデータ分割処理について、図3を参照しながら説明する。図3は、本実施形態に係るデータ分割処理の流れの一例を示すフローチャートである。なお、以下では、収集部201によって収集された計測データが記憶部205に格納されているものとする。
ステップS101:まず、データ分割部202は、分割対象の計測データ群を記憶部205から取得する。
なお、データ分割部202は、例えば、ユーザによって指定された計測データ群を分割対象の計測データ群としてもよいし、記憶部205に格納されている全ての計測データを分割対象の計測データ群としてもよいし、或る特定の機器から収集した計測データのみを分割対象の計測データ群としてもよい。
また、データ分割部202は、例えば、運転データに基づいて計測データを絞り込んだ上で、分割対象のデータ群を取得してもよい。例えば、運転データに基づいて、設備点検日(及びその前後等)を除いた計測データに絞り込んだり、特定の操業(例えば、定常的な運用状態となる操業等)を行っているときの計測データに絞り込んだりしてもよい。
以下では、一例として、図4に示すような分割対象の計測データ群がデータ分割部202によって取得されたものとする。図4に示す分割対象の計測データ群にはN件の計測データが含まれており、各計測データには、日時tと、因子xと、因子yとが含まれている。例えば、i∈{0,・・・,N-1}番目の計測データには日時tと因子xと因子yとが含まれている。なお、以下では、「日時t」、「因子x」及び「因子y」をそれぞれ単に「t」、「x」及び「y」とも表す。
ステップS102:次に、データ分割部202は、上記のステップS101で取得された分割対象の計測データ群に含まれる各計測データの1以上の因子を用いて、クラスタリング手法により分割対象の計測データ群を複数のクラスタ(クラスタが1つの場合も含む)に分割する。これにより、分割対象の計測データ群に含まれる各計測データに対してラベルが付与されたデータ分割後の計測データ群が得られる。
図4に示す分割対象の計測データ群に含まれる各計測データに対してラベルが付与されたデータ分割後の計測データ群を図5に示す。図5に示すデータ分割後の計測データ群に含まれる各計測データに対してラベルLが付与されている。ラベルLは、i番目の計測データがどのクラスタに分類されたかを示す離散値を取る。以下では、一例として、因子x及び因子yを用いて、分割対象の計測データ群が2つのクラスタに分割されたものとする。したがって、ラベルLは0又は1の2値を取るものとする。
ステップS103:次に、分析部203は、上記のステップS102の分割結果(データ分割後の計測データ群に対するラベリング結果)を目的変数、上記のステップS102のクラスタリング手法で用いた1以上の因子(つまり、因子x及び因子y)を説明変数として、分類二進木を構築する。これにより、データ分割後の計測データ群の目的変数に対する説明変数での説明可能性が分析されたことになる。なお、以下では、本ステップで構築された分類二進木を単に「決定木」という。
ステップS104:そして、可視化部204は、上記のステップS102の分割結果を可視化した「分割結果の可視化画面」、上記のステップS103の分析結果を可視化した「分析結果の可視化画面」、及び当該分割結果と当該分析結果との両方を相互に反映可能な相互結果を可視化した「相互結果の可視化画面」のうちのいずれかを表示装置102等に表示する。なお、分割結果の可視化画面、分析結果の可視化画面、及び相互結果の可視化画面の3つの画面は相互に表示を切り替えることが可能であってもよい。以下、これら3つの画面について説明する。
≪分割結果の可視化画面≫
分割結果の可視化画面の一例について、図6を参照しながら説明する。図6は、分割結果の可視化画面の一例を示す図である。
図6に示す分割結果の可視化画面1000には、第1の表示欄1100と、第2の表示欄1200とが含まれる。
第1の表示欄1100には、データ分割後の計測データ群の因子x及びyに関する時系列トレンドが表示される。図6に示す例では、縦軸をx、横軸をtとした時系列トレンド1110と、縦軸をy、横軸をtとした時系列トレンド1120とが表示されている。また、このとき、各点はラベルの値に応じた色で色分けされる。
第2の表示欄1200には、データ分割後の計測データ群のヒストグラムと散布図とが表示されている。図6に示す例では、因子xに関するヒストグラム1210と、因子yに関するヒストグラム1220と、縦軸をx、横軸をyとした散布図1230と、縦軸をy、横軸をxとした散布図1240とが表示されている。また、このとき、各ヒストグラムの度数を示す棒、各散布図の点は、ラベルの値に応じた色で色分けされる。
分割結果の可視化画面1000を参照することで、ユーザは、分割対象の計測データ群がどのように分割されたのかを知ることができる。また、因子毎の時系列トレンド、因子毎のヒストグラム、各因子間の関係を表す散布図を確認することで、様々な観点で分割結果を検証することが可能となり、自身の知識(特にドメイン知識)と分割結果との照合が可能になる。
≪分析結果の可視化画面≫
分析結果の可視化画面の一例について、図7を参照しながら説明する。図7は、分析結果の可視化画面の一例を示す図である。
図7に示す分析結果の可視化画面2000には、第1の表示欄2100と、第2の表示欄2200と、第3の表示欄2300とが含まれる。
第1の表示欄2100には、上記のステップS103の分析結果を表す決定木と、この決定木の各分岐ノードに対応するヒストグラムとが表示される。また、各ヒストグラムの度数を示す棒は、ラベルの値に応じた色で色分けされる。
図7に示す例では、ヒストグラム2110~2150はそれぞれ決定木の分岐ノードに対応している。また、各ヒストグラム中の黒い三角形「▲」はノードに付与された条件に含まれる閾値を表し、該当の因子の値が閾値未満である場合は左側の子ノード(0-子ノード)に分岐、閾値以上である場合は右側の子ノード(1-子ノード)に分岐している。
具体的には、ヒストグラム2110と対応する分岐ノード(ルートノード)には因子xに関する条件1「x<5.5」が付与されており、この条件を満たす場合は0-子ノードに分岐し、そうでない場合は1-子ノードに分岐することを表している。同様に、ヒストグラム2120と対応する分岐ノードには因子yに関する条件2「y<2.8」が付与されており、この条件を満たす場合は0-子ノードに分岐し、そうでない場合は1-子ノードに分岐することを表している。その他のヒストグラム2130~2150に対応する分岐ノードに関してもそれぞれ条件3~条件5が付与されており、同様に、当該条件を満たす場合は0-子ノードに分岐し、そうでない場合は1-子ノードに分岐することを表している。
また、リーフノードには、当該リーフノードに分類された計測データの個数nと、この個数の大きさを表す丸とが対応している。図7に示す例では、ヒストグラム2120に対応する分岐ノードの0-子ノードはラベル値「0」を持つリーフノードであり、このリーフノードに分類された計測データの個数はn=6であることを表している。また、ヒストグラム2140に対応する分岐ノードの0-子ノードはラベル値「1」を持つリーフノードであり、このリーフノードに分類された計測データの個数はn=39であることを表している。その他のリーフノードに関しても同様である。
第2の表示欄2200には、データ分割後の計測データ群の因子x及びyに関する時系列トレンドと、因子x及びyに関する条件に含まれる閾値とが表示される。図7に示す例では、縦軸をx、横軸をtとして、条件1に含まれる閾値と条件4に含まれる閾値とが付与された時系列トレンド2210と、縦軸をy、横軸をtとして、条件2に含まれる閾値と条件3に含まれる閾値と条件5に含まれる閾値とが付与された時系列トレンド2220とが表示されている。また、このとき、各点はラベルの値に応じた色で色分けされる。
第3の表示欄2300には、因子x及びy間の散布図と、因子x及びyに関する条件に含まれる閾値とが表示される。図7に示す例では、縦軸をy、横軸をxとして、条件1~条件4に含まれる各閾値を表す線分が付与された散布図2310が表示されている。また、このとき、各散布図の点は、ラベルの値に応じた色で色分けされる。
分析結果の可視化画面2000を参照することで、ユーザは、どのような条件によって分割されたのかを知ることができる。また、特に決定木を確認することで、どのような条件によってどの程度の計測データが各クラスタに分類されるのかを検証することが可能となり、自身の知識(特にドメイン知識)と分割結果との照合が可能になる。
≪相互結果の可視化画面≫
相互結果の可視化画面の一例について、図8を参照しながら説明する。図8は、相互結果の可視化画面の一例を示す図である。
図8に示す相互結果の可視化画面3000には、第1の表示欄3100と、第2の表示欄3200と、第3の表示欄3300とが含まれる。なお、相互結果の可視化画面3000では、データ分割後の計測データ群の中からユーザが1つ以上の計測データを選択し、これらの計測データと他の計測データとの関係を確認することができる。以下では、ユーザによってある1つの計測データが選択されたものとして、この計測データを「サンプル点」という。
第1の表示欄3100には、データ分割後の計測データ群の因子x及びyに関する時系列トレンドと、この時系列トレンド中のサンプル点とが表示される。図8に示す例では、縦軸をx、横軸をtとして、サンプル点の因子xの値を他と異なる色で表した時系列トレンド3110と、縦軸をy、横軸をtとして、サンプル点の因子yの値を他と異なる色で表した時系列トレンド3120とが表示されている。また、このとき、各点はラベルの値に応じた色で色分けされる。
第2の表示欄3200には、因子x及びy間の散布図と、この散布図中のサンプル点とが表示される。図8に示す例では、サンプル点を他と異なる色で表した散布図3210が表示されている。
第3の表示欄3300には、サンプル点を決定木に入力したときに、ルートノードからリーフノードに至るまでの経路(パス)が表示される。図8に示す例では、サンプル点は、ルートノード→その1-子ノード→その0-子ノード(ラベル値「0」を持つリーフノード)というパスを辿ることが表示されている。また、サンプル点の因子xの値と因子yの値も表示されている。
相互結果の可視化画面3000を参照することで、ユーザは、自身が選択したサンプル点がどのように分割されたのかを知ることができる。言い換えれば、ユーザは、自身が選択したサンプル点がどのように分割されたのかを、その分割に関する分析結果から知ることができる。これにより、ユーザは、自身が選択したサンプル点の分割結果及び分析結果と、自身の知識(特にドメイン知識)との照合が可能になる。
<まとめ>
以上のように、本実施形態に係るデータ分割装置10は、機器から収集された計測データ群の分割結果を分析した上で、その分析結果をユーザの知識(特にドメイン知識)と照合可能に可視化する。これにより、ユーザは、その分割結果が妥当なものであるか否かを判断することが可能となる。このため、例えば、この分割結果に基づいて、同一クラスタに属する計測データを用いて機械学習等によりモデルを構築することで、高性能なモデル構築が期待できる。また、このように構築されたモデルは、ユーザの知識に合致するものであるため、ユーザが納得感を持ちやすく、信頼性や安心感の高いものでもある、という利点もあると考えられる。
本発明は、具体的に開示された上記の実施形態に限定されるものではなく、特許請求の範囲の記載から逸脱することなく、種々の変形や変更、既知の技術との組み合わせ等が可能である。
10 データ分割装置
101 入力装置
102 表示装置
103 外部I/F
103a 記録媒体
104 通信I/F
105 プロセッサ
106 メモリ装置
107 バス
201 収集部
202 データ分割部
203 分析部
204 可視化部
205 記憶部

Claims (7)

  1. 機器をセンサにより計測した計測データを収集する収集部と、
    前記収集部により収集された計測データに含まれる1つ以上の因子を用いて、複数の前記計測データを1以上のクラスタに分割する分割部と、
    前記1つ以上の因子と、前記分割部による分割の結果との間の関係を分析する分析部と、
    前記分割部による分割の結果、前記分析部による分析の結果、前記分割の結果と前記分の結果との両方を反映した相互結果、の少なくとも1つを可視化する可視化部と、
    を有し、
    前記分析部は、
    前記1つ以上の因子の各々を説明変数、前記分割部による分割の結果を表すクラスタのラベルを目的変数として、決定木により前記説明変数と前記目的変数との間の関係を分析する、データ分割装置。
  2. 前記可視化部は、
    前記分割部による分割の結果として、前記計測データに関する前記因子毎の時系列トレンドと、前記計測データに関する前記因子毎のヒストグラムと、前記計測データに関する前記因子間の散布図とを可視化し、
    前記時系列トレンド及び前記散布図の各点は、前記点に対応する計測データのラベルに応じた色で可視化され、
    前記ヒストグラムの各度数を表すグラフは、前記度数を構成する計測データ数と、前記計測データのラベルに応じた色とで可視化される、請求項に記載のデータ分割装置。
  3. 前記可視化部は、
    前記分析部による分析の結果として、前記決定木と、前記決定木の各分岐ノードに対応するヒストグラムと、前記計測データに関する前記因子毎の時系列トレンドと、前記因子間の散布図とを可視化し、
    前記時系列トレンド及び前記散布図の各点は、前記点に対応する計測データのラベルに応じた色で可視化され、
    前記ヒストグラムの各度数を表すグラフは、前記度数を構成する計測データ数と、前記計測データのラベルに応じた色とで可視化される、請求項又はに記載のデータ分割装置。
  4. 前記可視化部は、
    前記相互結果として、複数の前記計測データの中からユーザによって選択された計測データを示すサンプル点と、前記計測データに関する前記因子毎の時系列トレンドと、前記因子間の散布図と、前記サンプル点を前記決定木に入力したときのルートノードからリーフノードまでの経路とを可視化し、
    前記時系列トレンド及び前記散布図の各点は、前記点に対応する計測データのラベルに応じた色で可視化され、請求項乃至の何れか一項に記載のデータ分割装置。
  5. 前記可視化部は、
    前記分割部による分割の結果と、前記分析部による分析の結果と、前記相互結果とを相互に切替可能に可視化する、請求項1乃至の何れか一項に記載のデータ分割装置。
  6. 機器をセンサにより計測した計測データを収集する収集手順と、
    前記収集手順により収集された計測データに含まれる1つ以上の因子を用いて、複数の前記計測データを1以上のクラスタに分割する分割手順と、
    前記1つ以上の因子と、前記分割手順による分割の結果との間の関係を分析する分析手順と、
    前記分割手順による分割の結果、前記分析手順による分析の結果、前記分割の結果と前記分の結果との両方を反映した相互結果、の少なくとも1つを可視化する可視化手順と、
    をコンピュータが実行し、
    前記分析手順は、
    前記1つ以上の因子の各々を説明変数、前記分割手順による分割の結果を表すクラスタのラベルを目的変数として、決定木により前記説明変数と前記目的変数との間の関係を分析する、データ分割方法。
  7. 機器をセンサにより計測した計測データを収集する収集手順と、
    前記収集手順により収集された計測データに含まれる1つ以上の因子を用いて、複数の前記計測データを1以上のクラスタに分割する分割手順と、
    前記1つ以上の因子と、前記分割手順による分割の結果との間の関係を分析する分析手順と、
    前記分割手順による分割の結果、前記分析手順による分析の結果、前記分割の結果と前記分の結果との両方を反映した相互結果、の少なくとも1つを可視化する可視化手順と、
    をコンピュータに実行させ
    前記分析手順は、
    前記1つ以上の因子の各々を説明変数、前記分割手順による分割の結果を表すクラスタのラベルを目的変数として、決定木により前記説明変数と前記目的変数との間の関係を分析する、プログラム。
JP2021080213A 2021-05-11 2021-05-11 データ分割装置、データ分割方法、及びプログラム Active JP6992922B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021080213A JP6992922B1 (ja) 2021-05-11 2021-05-11 データ分割装置、データ分割方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021080213A JP6992922B1 (ja) 2021-05-11 2021-05-11 データ分割装置、データ分割方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP6992922B1 true JP6992922B1 (ja) 2022-01-13
JP2022174425A JP2022174425A (ja) 2022-11-24

Family

ID=80213733

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021080213A Active JP6992922B1 (ja) 2021-05-11 2021-05-11 データ分割装置、データ分割方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6992922B1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7468766B1 (ja) 2023-10-18 2024-04-16 富士電機株式会社 運転支援装置、運転支援方法及びプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014178878A (ja) 2013-03-14 2014-09-25 Toshiba Corp ノウハウ可視化装置及びノウハウ可視化方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6823576B2 (ja) * 2017-10-26 2021-02-03 株式会社日立産機システム 異常検出システムおよび異常検出方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014178878A (ja) 2013-03-14 2014-09-25 Toshiba Corp ノウハウ可視化装置及びノウハウ可視化方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7468766B1 (ja) 2023-10-18 2024-04-16 富士電機株式会社 運転支援装置、運転支援方法及びプログラム

Also Published As

Publication number Publication date
JP2022174425A (ja) 2022-11-24

Similar Documents

Publication Publication Date Title
Wen et al. A generalized remaining useful life prediction method for complex systems based on composite health indicator
Aussel et al. Predictive models of hard drive failures based on operational data
CN116450399B (zh) 微服务系统故障诊断及根因定位方法
CN111459700A (zh) 设备故障的诊断方法、诊断装置、诊断设备及存储介质
CN106503086A (zh) 分布式局部离群点的检测方法
Nikolaou et al. Detection of early warning signals in paleoclimate data using a genetic time series segmentation algorithm
JP2013175108A (ja) クラスタリング装置及びクラスタリングプログラム
CN113010389A (zh) 一种训练方法、故障预测方法、相关装置及设备
Miranskyy et al. Using entropy measures for comparison of software traces
Chen et al. Imdiffusion: Imputed diffusion models for multivariate time series anomaly detection
Jiang et al. Independent component analysis-based non-Gaussian process monitoring with preselecting optimal components and support vector data description
JP6992922B1 (ja) データ分割装置、データ分割方法、及びプログラム
CN115034278A (zh) 性能指标异常检测方法、装置、电子设备和存储介质
e Oliveira et al. On the influence of overlap in automatic root cause analysis in manufacturing
Al-Luhaybi et al. Predicting academic performance: A bootstrapping approach for learning dynamic bayesian networks
Zhang et al. Robust KPI anomaly detection for large-scale software services with partial labels
Mishra et al. Graft: A graph based time series data mining framework
CN110321914A (zh) 一种油品质量分析管控系统
Quintana et al. ALDI++: Automatic and parameter-less discord and outlier detection for building energy load profiles
Li et al. A two-phase filtering of discriminative shapelets learning for time series classification
Chaurasia et al. Housing price prediction model using machine learning
Marian et al. Software defect detection using self-organizing maps
Wang et al. Identifying execution anomalies for data intensive workflows using lightweight ML techniques
Herrmann et al. Unmasking overestimation: a re-evaluation of deep anomaly detection in spacecraft telemetry
US20210373987A1 (en) Reinforcement learning approach to root cause analysis

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210511

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210511

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210903

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211109

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211122

R150 Certificate of patent or registration of utility model

Ref document number: 6992922

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150