JP7211562B2 - データ量十分性判定装置、データ量十分性判定方法、データ量十分性判定プログラム、学習モデル生成システム、学習済みの学習モデル生成方法、及び学習済みの学習モデル生成プログラム - Google Patents

データ量十分性判定装置、データ量十分性判定方法、データ量十分性判定プログラム、学習モデル生成システム、学習済みの学習モデル生成方法、及び学習済みの学習モデル生成プログラム Download PDF

Info

Publication number
JP7211562B2
JP7211562B2 JP2022532209A JP2022532209A JP7211562B2 JP 7211562 B2 JP7211562 B2 JP 7211562B2 JP 2022532209 A JP2022532209 A JP 2022532209A JP 2022532209 A JP2022532209 A JP 2022532209A JP 7211562 B2 JP7211562 B2 JP 7211562B2
Authority
JP
Japan
Prior art keywords
data
subsequence
time
data set
probability distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022532209A
Other languages
English (en)
Other versions
JPWO2021260922A1 (ja
Inventor
隆彦 増崎
督 那須
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JPWO2021260922A1 publication Critical patent/JPWO2021260922A1/ja
Application granted granted Critical
Publication of JP7211562B2 publication Critical patent/JP7211562B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本開示は、データ量十分性判定装置、データ量十分性判定方法、データ量十分性判定プログラム、学習モデル生成システム、学習済みの学習モデル生成方法、及び学習済みの学習モデル生成プログラムに関する。
正常な機器の時系列データを用いて学習した学習モデルを用いて、診断対象の機器の時系列データを診断することにより、機器が正常か否かを判定する装置について研究や開発が行われている。ここで、学習モデルを学習させるときに、どれだけのデータを用いて学習を行えばよいかを事前に知っておくことが重要である。早期に異常検知等を行うためには、出来るだけ早期に学習を行いたい一方で、データが十分に集まっていない状態で学習を行い、学習後にデータが不足していることが判明すると、再度学習を行う手戻りが生じてしまう。その一方で、たくさんデータを入力して学習すると学習自体に時間がかかり、また、過学習してしまう可能性もあるため、収集したデータのうち学習に余分なものは捨てる必要がある。
そのため、収集した時系列データのデータ量が、学習モデルの学習を行うのに十分か否かを判定する技術が研究されている。例えば、特許文献1には、データを区分に分けた領域ごとに特徴量を算出して、各領域の特徴量をパターンに分類し、パターン数が収束した場合に学習を終了するデータ処理装置が開示されている。
特開2009-135649号公報
しかしながら、特許文献1に開示されたデータ処理装置は、特徴量のパターン数に基づいてデータの十分性を判断するだけであり、さまざまな特性を有する時系列データに柔軟に対応することができず、時系列データの特性によってはデータ量の十分性を判別する精度が低いという課題があった。
本開示は、上記のような課題を解決するためになされたものであり、より高精度に学習用データのデータ量の十分性を判定することができるデータ量十分性判定装置を得ることを目的とする。
本開示に係るデータ量十分性判定装置は、時系列データを取得する時系列データ取得部と、時系列データを複数の部分列データに分割するデータ分割部と、部分列データの集合である部分列データ集合を複数生成するデータ集合生成部と、部分列データの特徴量を算出する特徴量算出部と、部分列データ集合毎に特徴量の確率分布を生成する確率分布生成部と、確率分布が収束したか否かを判定する判定部と、を備えた。
本開示に係るデータ量十分性判定装置は、部分列データの特徴量を算出する特徴量算出部と、部分列データ集合毎に特徴量の確率分布を生成する確率分布生成部と、確率分布が収束したか否かを判定する判定部と、を備えたので、単に特徴量のパターン数に基づくだけでなく、特徴量の確率分布に基づくことにより、より高精度に学習用データのデータ量の十分性を判定することができる。
実施の形態1に係る学習モデル生成システム1000の構成を示す構成図である。 実施の形態1に係るデータ量十分性判定装置100のハードウェア構成の例を示すハードウェア構成図である。 実施の形態1に係るデータ量十分性判定装置100の動作を示すフローチャートである。 実施の形態1に係るデータ分割部20が時系列データを分割する処理の具体例を説明するための概念図である。 実施の形態1に係るデータ集合生成部30が部分列データ集合を生成する処理の具体例を説明するための概念図である。 実施の形態1に係る確率分布生成部50が確率分布を生成する処理の具体例を説明するための概念図である。 実施の形態1に係る確率分布生成部50が統計量を算出する処理の具体例を説明するための概念図である。 実施の形態2に係る学習モデル生成システム2000の構成を示す構成図である。 実施の形態2に係る特徴量算出部240の処理の具体例を説明するための概念図である。 実施の形態1及び実施の形態2に係るデータ量十分性判定装置の処理の具体例を説明するための概念図である。 実施の形態3に係る学習モデル生成システム3000の構成を示す構成図である。 実施の形態3に係るデータ量十分性判定装置300の処理の具体例を説明するための概念図である。 実施の形態4に係る学習モデル生成システム4000の構成を示す構成図である。 実施の形態4に係るデータ量十分性判定装置400の処理の具体例を説明するための概念図である。 実施の形態5に係る学習モデル生成システム5000の構成を示す構成図である。 実施の形態6に係る学習モデル生成システム6000の構成を示す構成図である。 実施の形態6に係るデータ量十分性判定装置600の処理の具体例を説明するための概念図である。
実施の形態1.
図1は、実施の形態1に係る学習モデル生成システム1000の構成を示す構成図である。
学習モデル生成システム1000は、時系列データの収集及び学習モデルの生成を行うものであり、データ量十分性判定装置100、時系列データ管理装置110、及び学習装置120を備える。
データ量十分性判定装置100は、時系列データ管理装置110が収集したデータが学習装置120で学習モデルの学習を行うのに十分な量集まっているかを判定するものである。
時系列データ管理装置110は、時系列データの管理を行うものであり、時系列データの収集を行う時系列データ収集部111と、収集した時系列データを記憶する時系列データ記憶部112とを備える。
ここで、例えば、時系列データ収集部111には、生産設備に設けられたセンサ等が用いられ、時系列データ記憶部112には、ハードディスク等の記憶装置が用いられる。
学習装置120は、データ量十分性判定装置100が十分なデータ量が集まっていると判定した場合に、時系列データ管理装置110から受信した時系列データを用いて学習モデルの学習を行うものであり、時系列データ管理装置110が記憶する時系列データを学習用データとして取得する学習用データ取得部121と、学習用データ取得部121が取得した学習用データを用いて学習モデルの学習を行い、学習済みの学習モデルを生成する学習済モデル生成部122とを備える。
学習装置120の各機能は、後述するデータ量十分性判定装置100と同様に、記憶装置に記憶されたプログラムを処理装置が実行することにより実現される。
次に、データ量十分性判定装置100の詳細について説明する。
データ量十分性判定装置100は、時系列データ取得部101、データ分割部102、データ集合生成部103、特徴量算出部104、確率分布生成部105、及び判定部106を備える。
時系列データ取得部101は、時系列データを取得するものである。この時系列データは、例えば、製造装置に取り付けたセンサにより取得された電流値や電圧値を示すデータ、振動センサにより検知された機器の振動を示す振動データ、音声センサにより検知された機器の動作音を示す音声データ等である。
実施の形態1において、時系列データ取得部101は、学習対象の時系列データを時系列データ記憶部112から取得する。ここで、時系列データ取得部101は、データ量の十分性を判定する対象としてのまとまった量の時系列データを取得する。取得した時系列データは、時刻とデータが関連付けられており、連続した値を特定のサンプリングレートで離散データに変換したデジタルデータである。
データ分割部102は、時系列データ取得部101が取得した時系列データを複数の部分列データに分割するものである。すなわち、データ分割部102は、時系列データを分割することにより複数の部分列データを生成する。より具体的には、実施の形態1に係るデータ分割部102は、取得した時系列データからW個の時間的に連続するデータを抽出する。この抽出したW個のデータを部分列データと呼ぶ。
ここで、データ分割部102は、複数の部分列データが共通の時間帯のデータを含むように部分列データを生成することができる。そのため、波形の特徴が変化する状況をきめ細やかに捉えることができ、判定精度が向上するという効果を奏する。
データ集合生成部103は、データ分割部102が生成した部分列データの集合である部分列データ集合を複数生成するものである。また、データ集合生成部103は、第一の部分列データ集合に第一の部分列データ集合が含まない部分列データを追加することにより、第二の部分列データ集合を生成する。すなわち、実施の形態1において、データ集合生成部103は、データ量を段階的に増やすことにより、複数の部分列データ集合を生成する。また、実施の形態1において、データ集合生成部103は、複数の部分列データ集合を有する複数のグループを生成する。より具体的には、部分列データ集合を複数有する第一グループと、第一グループと同じ数の部分列データ集合を有し、第一グループが有さない部分列データ集合を少なくとも一つ有する第二グループと、を生成する。
特徴量算出部104は、データ分割部102が生成した部分列データの特徴量を算出するものである。ここで、特徴量は必ずしも部分列データと1対1に対応するものではない。すなわち、特徴量算出部104は、部分列データ毎に特徴量を算出してもよいし、部分列データ同士の関係性から特徴量を算出してもよく、部分列データの特徴量とは、その両者を含むものである。また、特徴量は一つに限らず、複数の特徴量を算出するようにしてもよいが、以下では、特徴量算出部104は、部分列データ毎に特徴量を算出するものとする。また、ここでの特徴量とは、例えば、各部分列データの平均、標準偏差、各部分列データを表す波形の傾きの絶対値の平均、標準偏差等である。
確率分布生成部105は、データ集合生成部103が生成した部分列データ集合毎に特徴量の確率分布を生成するものである。ここで、特徴量の確率分布とは、複数の部分列データにおける各特徴量が取る値の確率の分布である。例えば、特徴量の取る値の範囲を一定幅の区間に区切り、それぞれの区間に含まれる値の数(度数)を求め、正規化することにより得られる。また、実施の形態1において、確率分布生成部105は、異なる部分列データ集合の間でそれぞれから生成された確率分布を比較して、確率分布に基づいた特徴量の統計量を算出する。
実施の形態1において、確率分布生成部105は、統計量として、第一グループが有する部分列データ集合の確率分布と、第二グループが有する部分列データ集合の前記確率分布との類似度を算出する。類似度は、例えば、ユークリッド距離やコサイン類似度が用いられる。
判定部106は、確率分布生成部105が生成した確率分布が収束しているか否かを判定するものである。判定部106は、確率分布が収束しているか否かを判定することにより、データ量が十分か否かを判定する。すなわち、判定部106は、確率分布が収束していることをもって、データ量が十分であると判定する。実施の形態1において、判定部106は、確率分布生成部105が算出した確率分布同士の類似度が収束した場合に、すなわち、確率分布から得られる特徴量の変化が小さくなったり無くなってきた場合に、確率分布が収束したと判定する。判定部106は、判定結果を学習用データ取得部121に出力する。
また、判定部106は、判定結果をディスプレイ等の表示装置(図示せず)に出力し、判定結果を表示装置に表示させる。
次に、実施の形態1におけるデータ量十分性判定装置100のハードウェア構成について説明する。データ量十分性判定装置100の各機能は、コンピュータにより実現される。図2は、実施の形態1に係るデータ量十分性判定装置100を実現するコンピュータのハードウェア構成の例を示すハードウェア構成図である。
図2に示したハードウェアには、CPU(Central Processing Unit)等の処理装置10000と、ROM(Read Only Memory)やRAM(Random Access Memory)、ハードディスク等の記憶装置10001が備えられる。
図1に示す、時系列データ取得部101、データ分割部102、データ集合生成部103、特徴量算出部104、確率分布生成部105、及び判定部106は、記憶装置10001に記憶されたプログラムが処理装置10000で実行されることにより実現される。ここで、上記の構成は、単数の処理装置10000及び記憶装置10001により実現する構成に限らず、複数の処理装置10000及び記憶装置10001により実現する構成であってもよい。
また、データ量十分性判定装置100の各機能を実現する方法は、上記したハードウェアとプログラムの組み合わせに限らず、処理装置にプログラムをインプリメントしたLSI(Large Scale Integrated Circuit)のような、ハードウェア単体で実現するようにしてもよいし、一部の機能を専用のハードウェアで実現し、一部を処理装置とプログラムの組み合わせで実現するようにしてもよい。
以上のように、実施の形態1に係るデータ量十分性判定装置100は構成される。
次に、実施の形態1に係るデータ量十分性判定装置100の動作について説明する。
図3は、実施の形態1に係るデータ量十分性判定装置100の動作を示すフローチャートである。
また、以下において、データ量十分性判定装置100の動作がデータ量十分性判定方法に対応し、データ量十分性判定装置100の動作をコンピュータに実行させるプログラムがデータ量十分性判定プログラムに対応する。また、学習モデル生成システム1000の動作が学習済みの学習モデル生成方法に対応し、学習モデル生成システム1000の動作をコンピュータに実行させるプログラムが学習済みの学習モデル生成プログラムに対応する。また、時系列データ取得部101の動作が時系列データ取得工程に対応し、データ分割部102の動作がデータ分割工程に対応し、データ集合生成部103の動作がデータ集合生成工程に対応し、特徴量算出部104の動作が特徴量算出工程に対応し、確率分布生成部105の動作が確率分布生成工程に対応し、判定部106の動作が判定工程に対応し、学習用データ取得部121の動作が学習用データ取得工程に対応し、学習済モデル生成部122の動作が学習済モデル生成工程に対応する。
まず、ステップS1において、データ量十分性判定装置100の使用者が入力インターフェース(図示せず)を操作してデータ量十分性判定処理を開始する要求を入力すると、時系列データ取得部101は、時系列データ記憶部112から判定対象の時系列データを取得する。
次に、ステップS2において、データ分割部102は、ステップS1で時系列データ取得部101が取得した時系列データを部分列データに分割する。データ分割部102が、時系列データを分割する処理の具体例について、図4を用いて説明する。図4は、実施の形態1に係るデータ分割部102が時系列データを分割する処理の具体例を説明するための概念図である。
図4に示すように、データ分割部102は、取得した時系列データからW個の時間的に連続するデータを部分列データとして抽出する。ここで、Wを部分列データ長と呼ぶ。そして、データ分割部102は、部分列データを抽出する対象の時刻を少しずつずらしながら、複数の部分列データを順次生成する。部分列データをずらす長さをスライド幅Hとする。スライド幅Hは、データ量十分性判定の精度と計算量のトレードオフにより決定される。ここでは、一例としてH=W/2とする。
図3に戻り、続きの動作について説明する。
次に、ステップS3において、データ集合生成部103は、ステップS2で抽出された部分列データを集めて、複数の部分列データ集合を生成する。データ集合生成部103が部分列データ集合を生成する処理の具体例について、図5を用いて説明する。図5は、実施の形態1に係るデータ集合生成部103が部分列データ集合を生成する処理の具体例を説明するための概念図である。
図5に示すように、データ集合生成部103は、複数の部分列データから、a,b,c,・・・と部分列データ集合を生成する。また、データ集合生成部103は、部分列データ集合のデータ量を段階的に増やした複数の部分列データ集合を含む第1グループと第2グループとを生成する。具体的には、グループ生成部13は、図5に示すように、部分列データ全体に対する割合が1/6、2/6、3/6、4/6および5/6である部分列データ集合a、b、c、dおよびeを第1グループとし、時系列データ全体に対する割合が2/6、3/6、4/6、5/6および6/6である部分列データ集合b、c、d、eおよびfを第2グループとする。
図3に戻り、動作の続きについて説明する。
次に、ステップS4において、特徴量算出部104は、各部分列データ集合に対して、複数の特徴量を算出する。例えば、部分列データ集合aが、10個の部分列データを含むとすると、部分列データごとに特徴量を算出することによって、aに対する10個の特徴量を得る。
次に、ステップS5において、確率分布生成部105は、部分列データ集合毎に特徴量の確率分布を生成する。図6を用いて、確率分布生成部105が生成する確率分布の具体例について説明する。図6は、実施の形態1に係る確率分布生成部105が確率分布を生成する処理の具体例を説明するための概念図である。
図6に示すように、確率分布生成部105は、部分列データ集合a、b、c、d、eおよびfのそれぞれについて確率密度yと特徴量xとの関係を表す確率分布を生成する。
図3に戻り、動作の続きについて説明する。
ステップS6において、確率分布生成部105は、各部分列データ集合の確率分布から、特徴量の統計量を算出する。
図7を用いて、確率分布生成部105が統計量を算出する処理の具体例について説明する。図7は、実施の形態1に係る確率分布生成部105が統計量を算出する処理の具体例を説明するための概念図である。
まず、図7に示すように、確率分布生成部105は、第1グループのaと第2グループのbとの確率分布を比較して統計量を算出し、次に、第1グループのbと第2グループのcとの確率分布を比較して統計量を算出する。このようにして、確率分布生成部105は、第1グループのa、b、c、dおよびeと、第2グループのb、c、d、eおよびfとを比較して、5つの統計量を得る。
確率分布生成部105は、確率分布の比較結果の統計量として、例えば、第1グループの特徴量の最頻値m1と第2グループの特徴量の最頻値m2との差の絶対値を算出する。あるいは、第1グループの確率密度をy1(x)、第2グループの確率密度をy2(x)、xの最小値をmin、xの最大値をmaxとして、以下の式で算出しても良い。
Figure 0007211562000001
Figure 0007211562000002
図3に戻り、動作の続きについて説明する。
ステップS7において、判定部106は、ステップS5で生成した確率分布が収束しているかを判定する。ここで、実施の形態1において、判定部106は、ステップS6で算出した統計量が収束しているかを判定することにより、確率分布が収束しているかを判定する。
より具体的には、判定部106は、データ量が少ない部分列データ集合、例えばaとb、の比較結果の統計量と、データ量が多い部分列データ集合、例えばeとf、の比較結果の統計量とを比較して、データ量が多い部分列データ集合の統計量の方が0に近いこと、統計量の差が次第に小さくなっていくこと、部分列データ集合のデータ量に基づく期待値よりも統計量の方が小さいこと等のあらかじめ決められた基準条件、ないしは動的に決まる基準条件を満たすか否かを判定する。そして、判定部106は、基準条件を満たす場合に、時系列データの量が十分であると判定する。
ここで、部分列データ集合のデータ量に基づく期待値とは、例えば比較するうちの小さい方の部分列データ集合に含まれる部分列データの数をn、nが1のときの値をAとして、A/nとするなどの方法がありうる。仮に影響とデータ量が線形な関係の場合は、データ量がn倍になると、同じ量のデータを追加で与えたときの影響が1/nになると考えられるためである。期待値はA/nに限らず、A/(√n)、A/(n^2)などでもよい。
以上でデータ量十分性判定装置100は、動作を終了するが、判定部106は、判定結果を表示装置に送信し、判定結果を表示させたり、学習装置120に送信し、学習モデルの学習を行わせたりするようにしてもよい。
より具体的には、学習用データ取得部121は、判定部106が、確率分布が収束したと判定した場合、すなわち、データ量が十分であると判定した場合に、時系列データ記憶部112から時系列データを学習用データとして、取得する。ここで、学習用データ取得部121が取得する学習用データは、判定部106が判定を出すのに用いた、時系列データ取得部101が取得したデータと同じものである。また、データ量が十分でないと判定した場合には、あらかじめ除外していたデータを追加したり、追加でデータを取得したりするようにしてもよい。
そして、学習済モデル生成部122は、学習用データ取得部121が取得した学習用データを用いて学習モデルの学習を行い、学習済みの学習モデルを生成する。
以上のような動作により、実施の形態1に係るデータ量十分性判定装置100は、単に特徴量のパターン数に基づくだけでなく、特徴量の確率分布に基づくことにより、より高精度に学習用データの十分性を判定することができる
また、実施の形態1に係る学習モデル生成システム1000は、データ量十分性判定装置100が、データ量が十分であると判定した場合に、学習モデルの学習を行うようにしたので、データ量が不足していて適切な推論を行うことができない学習済みの学習モデルを生成したり、再学習の必要が生じたりする可能性を低減することができる。
また、実施の形態1に係るデータ量十分性判定装置100は、第一の部分列データ集合に第一の部分列データ集合が含まない部分列データを追加することにより、第二の部分列データ集合を生成する。すなわち、データ量十分性判定装置100は、ある部分列データ合を生成し、各部分列データ集合の特徴量の確率分布を比較することによって、データ量の十分性を判定する。つまり、実施の形態1は、後述する実施の形態3や実施の形態4と比較すると、確率分布を生成する対象となる区間を広げており、簡易的な手法となっている。そのため、少ない計算量で判定できるという効果を奏する。
また、実施の形態1に係るデータ量十分性判定装置100は、部分列データ集合を複数有する第一グループと、第一グループと同じ数の部分列データ集合を有し、第一グループが有さない部分列データ集合を少なくとも一つ有する第二グループと、を生成し、統計量算出部は、第一グループが有する部分列データ集合の確率分布と、第二グループが有する部分列データ集合の確率分布との類似度を算出し、判定部は、類似度が収束した場合に、確率分布が収束したと判定するので、順序関係が分かりやすく、見通しが良くなりデータ量の十分性の判定が分かりやすいという効果を奏する。
また、ここまで、グループを用いて説明をしてきたが、明示的にグループを構成せずに同様の処理を行ってもよい。すなわち、部分列データ集合aの特徴量の確率密度とbのそれの比較、bのそれと、cのそれの比較と繰り返していくとしてもよい
また、実施の形態1に係るデータ量十分性判定装置100は、部分列データ毎に特徴量を算出するので、後述する実施の形態2と比較して、部分列データ間の関係性ではなく各々の部分列データそのものに着目したときの特徴に基づいて判定できるため、各々の部分列データに特徴がよく現れるときに精度よく判定できるという効果を奏する。
実施の形態2.
次に、実施の形態2に係る学習モデル生成システム2000について説明する。
実施の形態1において、データ量十分性判定装置100が備える特徴量算出部104は、各部分列データの特徴量を算出するものであった。本実施の形態においては、特徴量算出部204が、部分列データ同士の比較対から特徴量を算出する、すなわち、各部分列データと他の部分列データとを比較した特徴量を算出する例を示す。以下、実施の形態1と異なる部分を中心に説明する。
図8は、実施の形態2に係る学習モデル生成システム2000の構成を示す構成図である。学習モデル生成システム2000は、データ量十分性判定装置200、時系列データ管理装置210、及び学習装置220を備える。
時系列データ管理装置210は、実施の形態1と同様に、時系列データ収集部211及び時系列データ記憶部212を備える。また、学習装置220も、実施の形態1と同様に、学習用データ取得部221及び学習済モデル生成部222を備える。
データ量十分性判定装置200は、時系列データ取得部201、データ分割部202、データ集合生成部203、特徴量算出部204、確率分布生成部205、及び判定部206を備える。
実施の形態2において、特徴量算出部204は、各部分列データ集合に含まれる2つの部分列データを比較対として選択し、選択した比較対の特徴量を算出する。すなわち、特徴量算出部240は、第一の部分列データと第二の部分列データとの比較値を特徴量として算出する。具体的には、比較対の特徴量は、部分列を空間上の点とみなした場合のユークリッド距離、部分列をベクトルとみなした場合の角度などの部分列同士の相違度を表したものが該当する。
実施の形態2において、特徴量算出部204は、この比較対の選択と特徴量の算出を繰り返して、複数の比較対の特徴量を算出する。
実施の形態2において、確率分布生成部205は、特徴量算出部204が算出した複数の比較対の特徴量に基づいて、各グループの各部分列データ集合の特徴量の確率分布を生成する。
特徴量算出部204の処理の具体例について、図9を用いて説明する。
図9は、実施の形態2に係る特徴量算出部240の処理の具体例を説明するための概念図である。
特徴量算出部240は、図9に示すように、各グループの各部分列データ集合の先頭の部分列データと2番目の部分列データとを比較対として選択して、特徴量を算出する。次に、特徴量算出部240は、先頭の部分列データと3番目の部分列データとを比較対として選択して、特徴量を算出する。これを繰り返して、抽出した比較対の特徴量をそれぞれ算出する。
なお、特徴量算出部240は、最近傍探索によって算出した最近傍距離を特徴量とする場合、各部分列データ集合内の同一データ部分を除外して、最近傍探索を行う。また、特徴量算出部14は、k近傍探索によって算出したk近傍距離を特徴量としても良い。
その他の構成及び動作については、実施の形態1と同様であるので、説明を省略する。
実施の形態2に係るデータ量十分性判定装置200は、第一の部分列データと第二の部分列データとの比較値を特徴量として算出する。すなわち、データ量十分性判定装置200は、部分列データ同士を比較した特徴量に基づいて、データ量の十分性を判定する。これによって、さまざまな特性を持つ時系列データに柔軟に対応した判定が可能となる。
実施の形態3.
次に、実施の形態3に係るデータ量十分性判定装置300について説明する。
実施の形態1及び実施の形態2においては、図10に示すように、部分列データ集合が徐々に大きくなっていき、前の部分列データ集合を包含する場合を想定していたが、実施の形態3では、異なる方法により、部分列データ集合を生成する例を示す。以下、実施の形態1及び実施の形態2と異なる部分を中心に説明する。
図11は、実施の形態3に係る学習モデル生成システム3000の構成を示す構成図である。学習モデル生成システム3000は、データ量十分性判定装置300、時系列データ管理装置310、及び学習装置320を備える。
時系列データ管理装置310は、他の実施の形態と同様に、時系列データ収集部311及び時系列データ記憶部312を備える。また、学習装置320も、他の実施の形態と同様に、学習用データ取得部321及び学習済モデル生成部322を備える。
データ量十分性判定装置300は、時系列データ取得部301、データ分割部302、データ集合生成部303、特徴量算出部304、確率分布生成部305、及び判定部306を備える。
実施の形態3において、データ集合生成部303は、第一の部分列データ集合と、第一の部分列データ集合と共通の部分列データを含まない第二の部分列データ集合とを生成する。さらに、データ集合生成部303は、第一の部分列データ集合と、第二の部分列データ集合が含む少なくとも一つの部分列データとを合わせた第三の部分列データ集合を生成する。すなわち、実施の形態3において、データ集合生成部303は、複数の部分列データを2つの部分列データ集合に分割するように部分列データ集合を作成することを、部分列データを増やしながら繰り返す。
また、実施の形態3において、確率分布生成部305は、確率分布に基づき、特徴量の平均値を算出し、判定部306は、当該平均値が所定の範囲内に収まっている場合に、確率分布が収束したと判定する。ここで、確率分布生成部305及び判定部306が用いる量は、平均値でなくてもよく、例えば、中央値や、外れ値を除外した上での平均値などでもよい。
実施の形態3に係るデータ量十分性判定装置300の処理の具体例について、図12を用いて説明する。
図12は、実施の形態3に係るデータ量十分性判定装置300の処理の具体例を説明するための概念図である。
図12に示すように、データ集合生成部303は、ある部分列データ集合と、それと重複しない部分列データ集合の組み合わせを生成する。後者を追加部分列データ集合と呼ぶことにする。
また、図12に示すように、確率分布生成部305は、部分列データ集合と追加部分列データ集合のそれぞれについて、特徴量の確率分布を生成する。そして、判定部306は、部分列データ集合の確率分布と追加部分列データ集合の確率分布とを比較する。例えばまず図のaとa’を比較し、次にbとb’を比較し、という具合である。そして、追加部分列データ集合の特徴量の分布が、対応する部分列データ集合の特徴量の分布の範囲の中に収まっていればデータ量が十分と判断する。より具体的には、追加部分列データ集合g’の特徴量の平均が、部分列データ集合gの特徴量の平均±標準偏差区間に含まれれば十分と判断するといった方法がある。特徴量の分布の平均の他、最大値、最小値、四分位点などを利用して判断してもよい。
尚、図12ではaとa’を合わせた部分列データ集合が次の部分列データ集合bとなっているが、これに限らない。aとa’がb全体とb’の一部に対応してもよいし、aとa’がbの一部に対応してもよい。
実施の形態3に係るデータ量十分性判定装置300は、第一の部分列データ集合と、第一の部分列データ集合と共通の部分列データを含まない第二の部分列データ集合とを生成し、さらに、第一の部分列データ集合と、第二の部分列データ集合が含む少なくとも一つの部分列データとを合わせた第三の部分列データ集合を生成する。すなわち、ある部分列データ集合(第一の部分列データ集合)と追加部分列データ集合(第二の部分列データ集合)の確率分布を比較し、その次に、部分列データ集合と追加部分列データ集合を合わせた部分列データ集合(第三の部分列データ集合)と、新たな追加部分列データ集合(第四の部分列データ集合)の確率分布を比較するという動作を繰り返すことにより、データ量の十分性を判定する。
このように、比較する部分列データ集合において、共通の部分列データを含ませないことにより、より詳細に時系列データの特性を捉えることができ、データ量の十分性について、より正確な判定が可能となるという効果を奏する。また、実施の形態1及び2と比較して、より狭い期間の部分列データ集合における分布を参照することになり、より詳細に時系列データの特性を捉えることができ、データ量の十分性について、より正確な判定が可能となる。
また、実施の形態2と組み合わせ、特徴量算出部240は、部分列データの比較対から特徴量を算出するようにしてもよい。
実施の形態4.
次に、実施の形態4に係るデータ量十分性判定装置400について説明する。
実施の形態1から3に係るデータ量十分性判定装置とは、異なる方法により部分列データ集合を生成する実施の形態について説明する。
以下、他の実施の形態と異なる部分を中心に説明する。
図13は、実施の形態4に係る学習モデル生成システム4000の構成を示す構成図である。学習モデル生成システム4000は、データ量十分性判定装置400、時系列データ管理装置410、及び学習装置420を備える。
時系列データ管理装置410は、他の実施の形態と同様に、時系列データ収集部411及び時系列データ記憶部412を備える。また、学習装置420も、他の実施の形態と同様に、学習用データ取得部421及び学習済モデル生成部422を備える。
データ量十分性判定装置400は、時系列データ取得部401、データ分割部402、データ集合生成部403、特徴量算出部404、確率分布生成部405、及び判定部406を備える。
実施の形態4において、データ集合生成部403は、第一の部分列データ集合と、第一の部分列データ集合と共通の部分列データを含まない第二の部分列データ集合とを生成する。また、データ集合生成部403は、第一の部分列データ集合及び第二の部分列データ集合と共通の部分列データを含まない第三の部分列データ集合を生成する。
このように、データ集合生成部403は、他の部分列データ集合と共通の部分列データを含まない部分列データ集合を繰り返し生成する。
また、実施の形態4において、確率分布生成部405は、確率分布に基づき、特徴量の平均値を算出し、判定部406は、当該平均値が所定の範囲内に収まっている場合に、確率分布が収束したと判定する。実施の形態3と同様に、、確率分布生成部405及び判定部406が用いる量は、平均値でなくてもよく、例えば、中央値や、外れ値を除外した上での平均値などでもよい。
実施の形態4に係るデータ量十分性判定装置400の処理の具体例について、図14を用いて説明する。
図14は、実施の形態4に係るデータ量十分性判定装置400の処理の具体例を説明するための概念図である。
図14に示すように、データ集合生成部403は、共通の部分列データを含まない複数の部分列データ集合を生成する。そして、判定部406は、複数の部分列データ集合と1つまたは複数の部分列データ集合の特徴量の確率分布を比較する。例えばa,b,c,d,e,fとgを比較し、次にa,b,c,d,e,f,gとhを比較する。例えば、新たな部分列データ集合の特徴量の確率分布が、これまでの部分列データ集合の特徴量の分布のばらつきの中に収まっていればデータが十分と判断する。具体的には、hの特徴量の平均が、a~gの「特徴量の平均」の平均±標準偏差のN倍区間に収まっていれば十分と判断するなどである。特徴量の分布の平均の他、最大値、最小値、四分位点などを利用して判断してもよい。
実施の形態4に係るデータ量十分性判定装置400は、第一の部分列データ集合と、第一の部分列データ集合と共通の部分列データを含まない第二の部分列データ集合とを生成し、さらに、第一の部分列データ集合及び第二の部分列データ集合と共通の部分列データを含まない第三の部分列データ集合を生成する。すなわち、データ量十分性判定装置400は、共通の部分列データを含まない部分列データ集合を繰り返し生成し、各部分列データ集合の特徴量の確率分布を比較することにより、データ量の十分性を判定する。
このように、比較する部分列データ集合において、共通の部分列データを含ませないことにより、より詳細に時系列データの特性を捉えることができ、データ量の十分性について、より正確な判定が可能となるという効果を奏する。また、実施の形態3に係るデータ量十分性判定装置と比較して、さらに狭い期間の部分列データ集合に分割し、それぞれの分布を参照しているため、より詳細に特性を捉えることができ、より正確な判定が可能となる。
また、実施の形態2と組み合わせ、特徴量算出部240は、部分列データの比較対から特徴量を算出するようにしてもよい。
実施の形態5.
次に、実施の形態5に係るデータ量十分性判定装置500について説明する。
図15は、実施の形態5に係る学習モデル生成システム5000の構成を示す構成図である。学習モデル生成システム5000は、データ量十分性判定装置500、時系列データ管理装置510、及び学習装置520を備える。
時系列データ管理装置510は、他の実施の形態と同様に、時系列データ収集部511及び時系列データ記憶部512を備える。また、学習装置520も、他の実施の形態と同様に、学習用データ取得部521及び学習済モデル生成部522を備える。
データ量十分性判定装置500は、時系列データ取得部501、データ分割部502、データ集合生成部503、特徴量算出部504、確率分布生成部505、及び判定部506を備える。
これまで、1回の比較結果に基づいてデータが十分かどうかを判定する形態を説明してきたが、実施の形態5に係る判定部506は、複数回の比較結果を総合してデータが十分であると判定する。例えば、M回連続して比較結果が基準条件を満たしたときに十分と判定してもよいし、最後のM回中P回以上比較結果が基準条件を満たしたときに十分と判定してもよい。
実施の形態5に係るデータ量十分性判定装置500は、1回ではなく複数回の比較結果に基づき判定するため、誤判定の可能性が削減され、判定精度が向上するという効果を奏する。
また、実施の形態5は、実施の形態1から4と適宜組み合わせてもよい。
実施の形態6.
次に、実施の形態6について説明する。
実施の形態1から実施の形態5までは、部分列データおよび部分列データ集合の取得の際、起点を1つとしてきたが、実施の形態6では、複数の起点に基づく部分列データおよび部分列データ集合の生成を行う。以下では、実施の形態1から実施の形態5までとは異なる部分を中心に説明する。
図16は、実施の形態6に係る学習モデル生成システム6000の構成を示す構成図である。学習モデル生成システム6000は、データ量十分性判定装置600、時系列データ管理装置610、及び学習装置620を備える。
時系列データ管理装置610は、他の実施の形態と同様に、時系列データ収集部611及び時系列データ記憶部612を備える。また、学習装置620も、他の実施の形態と同様に、学習用データ取得部621及び学習済モデル生成部622を備える。
データ量十分性判定装置600は、時系列データ取得部601、データ分割部602、データ集合生成部603、特徴量算出部604、確率分布生成部605、及び判定部606を備える。
実施の形態6において、データ集合生成部603は、第一の時刻から第二の時刻までに含まれる時系列データから複数の部分列データ集合を有する第一セットを生成し、第三の時刻から第四の時刻までに含まれる時系列データから複数の部分列データ集合を有する第二セットを生成する。ここで、セットとは、複数の部分列データ集合を有し、判定部606が基準条件を満たしているか判定を行う単位となる量であり、第一セットが第1の起点に基づく部分列データ集合の集まり、第二セットが第2の起点に基づく部分列データ集合の集まりである。ここで、第一の時刻が第1の起点であり、第三の時刻が第2の起点である。また、第二の時刻、すなわち第1セットの終点と、第三の時刻、すなわち第2セットの終点の位置は任意であり、第二の時刻(第1の終点)と第三の時刻(第2の起点)の順序関係については、どちらが先であってもよいが、第一の時刻(第1の起点)より第三の時刻(第2の起点)の方が後の時刻である状況について考える。
そして、判定部606は、第一セットと第二セットの両方で基準条件を満たしている場合に、時系列データの量が十分であると判定する。ここで、データ集合生成部603は、さらに第三セット以降を生成し、判定部606は、第一セットから第三セットの全てにおいて基準条件を満たしている場合に、時系列データの量が十分であると判定するようにしてもよい。
実施の形態6に係るデータ量十分性判定装置600の処理の具体例について、図17を用いて説明する。
図17は、実施の形態6に係るデータ量十分性判定装置600の処理の具体例を説明するための概念図である。
図17に示すように、データ集合生成部603は、第1の起点に基づく部分列データ集合を1a、1b、1c・・・、第2の起点に基づく部分列データ集合を2a、2b、2c・・・として生成する。そして、判定部606は、それぞれの起点毎に、確率分布が収束しているかを判定することにより、データが十分であるか判定し、それらの判定結果を総合して、最終的な判定結果として、データが十分であるか判定する。この起点の位置は一定間隔で定めても良いし、ランダムに決めても良い。
対象とするデータは周期波形である必要はないが、特定のパターンが繰り返し出る、想定している波形のどれかが任意のタイミングで出現するような波形を想定している。正常波形の場合は、想定していない波形が混在することはなく、もし混在した場合は、それは異常波形である。このような想定より、それぞれの起点の位置における、起点からの十分なデータ量はおおむね同程度のデータ量となることが期待される。よってこの方法が利用できる。
実施の形態6に係るデータ量十分性判定装置600は、データ集合生成部603が、第一の時刻から第二の時刻までに含まれる時系列データから複数の部分列データ集合を有する第一セットを生成し、第三の時刻から第四の時刻までに含まれる時系列データから複数の部分列データ集合を有する第二セットを生成し、判定部606が、第一セットと第二セットの両方で所定の条件を満たしている場合に、時系列データの量が十分であると判定する。すなわち、データ量十分性判定装置600は、1箇所ではなく複数個所の起点に基づき判定するため、誤判定の可能性が削減され、判定精度が向上するという効果を奏する。
また、実施の形態6は、実施の形態1から5と適宜組み合わせてもよい。
以下において、本開示に係るデータ量十分性判定装置の変形例について説明する。
上述の実施の形態において示した部分列データ集合の生成方法はあくまで例示であって、発明の目的および機能を満たすならば、他の生成方法であっても良い。例えば、部分列データ集合のデータ量の増やし方が一定間隔である例を示したが、徐々に間隔を大きくしてもよい(例えば指数的に増やす)し、または徐々に間隔を小さくしてもよい(例えば対数的に増やす)。実施の形態1の場合、データの追加量はそれまでのデータ量に対して相対的に減っていくため、特徴量の分布の比較結果の差が小さくなる場合や、特徴量の分布の比較結果の誤差が期待値に対して大きくなる場合が考えられる。そのため、それらを防ぐために、徐々に間隔を大きくしていくことが有効である。また、データを増やすにつれて十分なデータ量に近づいていくことを想定すると、徐々に細かく確認することでより高精度に十分であると判定できる可能性がある。そのようなときに、間隔を徐々に小さくしていくことが有効である。
また、データ集合生成部は、第1グループの部分列データと、第2グループの部分列データと、をそれぞれ等しいデータ量で生成しても良い。
また、上述の実施の形態において示した確率分布の比較方法はあくまで例示であって、発明の目的および機能を満たすならば、他の比較方法であっても良い。例えば、各グループの確率分布を確率密度関数で近似して、近似した確率密度関数同士を比較しても良い。
さらに、実施の形態2において示した比較対の生成方法はあくまで例示であって、発明の目的および機能を満たすならば、他の生成方法であっても良い。例えば、先頭の部分列データとの組み合わせを比較対とするのではなく、時間的に隣接する部分列データ同士を比較対とする方法でも良い。また、例えば、部分列データ集合aの部分列データと、他の部分列データ集合の部分列データとの比較対を使用して特徴量を算出しても良い。この場合、第1グループのa、b、c、dおよびeから、a対b、a対c、a対d、a対eといった4つの特徴量の確率分布が算出される。
本開示に係るデータ量十分性判定装置は、例えば、工場のFA(Factory Automation)システムや電力プラントの発電システムに用いるのに適している。より具体的には、データ量十分性判定装置が十分性を判定するデータとして、工場のFAシステムにおける製造機器および製造装置に取り付けたセンサから出力される、トルクや電流、電圧などのデータ、または、電力プラント(発電所)内の機器で測定されるデータや別途取り付けたセンサから出力される、電流、電圧、圧力、温度などのデータが想定される。工場では製品が繰り返し製造されることが多く、製造時に取得されるデータは、周期的な波形や、周期的な波形でなくとも、特定の1つまたは複数のパターンが繰り返し出現するような波形であることが想定される。また、電力プラントも、起動、稼働中、停止の処理を1つのサイクルとして繰り返され、また、稼働中であっても、定期的に試験動作が行われ、それに伴う波形パターンが出現することが想定される。
100,200,300,400,500,600 データ量十分性判定装置、110,210,310,410,510,610 時系列データ管理装置、120,220,320,420,520,620 学習装置、1000,2000,3000,4000,5000,6000 学習モデル生成システム、101,201,301,401,501,601 時系列データ取得部、102,202,302,402,502,602 データ分割部、103,203,303,403,503,603 データ集合生成部、104,204,304,404,504,604 特徴量算出部、105,205,305,405,505,605 確率分布生成部、106,206,306,406,506,606 判定部、111,211,311,411,511,611 時系列データ収集部、112,212,312,412,512,612 時系列データ記憶部、121,221,321,421,521,621 学習用データ取得部、122,222,322,422,522,622 学習済モデル生成部。

Claims (14)

  1. 時系列データを取得する時系列データ取得部と、
    前記時系列データを複数の部分列データに分割するデータ分割部と、
    前記部分列データの集合である部分列データ集合を複数生成するデータ集合生成部と、
    前記部分列データの特徴量を算出する特徴量算出部と、
    前記部分列データ集合毎に前記特徴量の確率分布を生成する確率分布生成部と、
    前記確率分布が収束したか否かを判定する判定部と、
    を備えるデータ量十分性判定装置。
  2. 前記データ集合生成部は、第一の部分列データ集合に前記第一の部分列データ集合が含まない部分列データを追加することにより、第二の部分列データ集合を生成する
    ことを特徴とする請求項1に記載のデータ量十分性判定装置。
  3. 前記データ集合生成部は、第一の部分列データ集合と、第一の部分列データ集合と共通の前記部分列データを含まない第二の部分列データ集合とを生成する
    ことを特徴とする請求項1に記載のデータ量十分性判定装置。
  4. 前記データ集合生成部は、前記第一の部分列データ集合と、前記第二の部分列データ集合が含む少なくとも一つの部分列データとを合わせた第三の部分列データ集合を生成する
    ことを特徴とする請求項3に記載のデータ量十分性判定装置。
  5. 前記データ集合生成部は、前記第一の部分列データ集合及び前記第二の部分列データ集合と共通の部分列データを含まない第三の部分列データ集合を生成する
    ことを特徴とする請求項3に記載のデータ量十分性判定装置。
  6. 前記データ集合生成部は、前記部分列データ集合を複数有する第一グループと、前記第一グループと同じ数の前記部分列データ集合を有し、前記第一グループが有さない部分列データ集合を少なくとも一つ有する第二グループと、を生成し、
    前記確率分布生成部は、前記第一グループが有する前記部分列データ集合の前記確率分布と、前記第二グループが有する前記部分列データ集合の前記確率分布との類似度を算出し、
    前記判定部は、前記類似度が収束した場合に、前記確率分布が収束したと判定する
    ことを特徴とする請求項1または2に記載のデータ量十分性判定装置。
  7. 前記特徴量算出部は、前記部分列データ毎に前記特徴量を算出する
    ことを特徴とする請求項1から6のいずれか一項に記載のデータ量十分性判定装置。
  8. 前記特徴量算出部は、第一の部分列データと第二の部分列データとの比較値を前記特徴量として算出する
    ことを特徴とする請求項1から6のいずれか一項に記載のデータ量十分性判定装置。
  9. 前記データ集合生成部は、第一の時刻から第二の時刻までに含まれる前記時系列データから複数の前記部分列データ集合を有する第一セットを生成し、前記第三の時刻から第四の時刻までに含まれる前記時系列データから複数の前記部分列データ集合を有する第二セットを生成し、
    前記判定部は、前記第一セットと前記第二セットの両方で所定の条件を満たしている場合に、前記時系列データの量が十分であると判定する
    ことを特徴とする請求項1から8のいずれか一項に記載のデータ量十分性判定装置。
  10. 時系列データを取得する時系列データ取得部と、
    前記時系列データを複数の部分列データに分割するデータ分割部と、
    前記部分列データの集合である部分列データ集合を複数生成するデータ集合生成部と、
    前記部分列データの特徴量を算出する特徴量算出部と、
    前記部分列データ集合毎に前記特徴量の確率分布を生成する確率分布生成部と、
    前記確率分布が収束したか否かを判定する判定部と、
    前記判定部が、前記確率分布が収束したと判定した場合に、前記時系列データを学習用データとして取得する学習用データ取得部と、
    前記学習用データを用いて学習モデルの学習を行い、学習済みの学習モデルを生成する学習済モデル生成部と、
    を備える学習モデル生成システム。
  11. コンピュータが、時系列データを取得する時系列データ取得工程と、
    コンピュータが、前記時系列データを複数の部分列データに分割するデータ分割工程と、
    コンピュータが、前記部分列データの集合である部分列データ集合を複数生成するデータ集合生成工程と、
    コンピュータが、前記部分列データの特徴量を算出する特徴量算出工程と、
    コンピュータが、前記部分列データ集合毎に前記特徴量の確率分布を生成する確率分布生成工程と、
    コンピュータが、前記確率分布が収束したか否かを判定する判定工程と、
    を含むデータ量十分性判定方法。
  12. 請求項11に記載の全工程をコンピュータに実行させるデータ量十分性判定プログラム。
  13. コンピュータが、時系列データを取得する時系列データ取得工程と、
    コンピュータが、前記時系列データを複数の部分列データに分割するデータ分割工程と、
    コンピュータが、前記部分列データの集合である部分列データ集合を複数生成するデータ集合生成工程と、
    コンピュータが、前記部分列データの特徴量を算出する特徴量算出工程と、
    コンピュータが、前記部分列データ集合毎に前記特徴量の確率分布を生成する確率分布生成工程と、
    コンピュータが、前記確率分布が収束したか否かを判定する判定工程と、
    コンピュータが、前記判定工程において、前記確率分布が収束したと判定した場合に、前記時系列データを学習用データとして取得する学習用データ取得工程と、
    コンピュータが、前記学習用データを用いて学習モデルの学習を行い、学習済みの学習モデルを生成する学習済モデル生成工程と、
    を含む学習済みの学習モデル生成方法。
  14. 請求項13に記載の全工程をコンピュータに実行させる学習済みの学習モデル生成プログラム。
JP2022532209A 2020-06-26 2020-06-26 データ量十分性判定装置、データ量十分性判定方法、データ量十分性判定プログラム、学習モデル生成システム、学習済みの学習モデル生成方法、及び学習済みの学習モデル生成プログラム Active JP7211562B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/025227 WO2021260922A1 (ja) 2020-06-26 2020-06-26 データ量十分性判定装置、データ量十分性判定方法、データ量十分性判定プログラム、学習モデル生成システム、学習済みの学習モデル生成方法、及び学習済みの学習モデル生成プログラム

Publications (2)

Publication Number Publication Date
JPWO2021260922A1 JPWO2021260922A1 (ja) 2021-12-30
JP7211562B2 true JP7211562B2 (ja) 2023-01-24

Family

ID=79282190

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022532209A Active JP7211562B2 (ja) 2020-06-26 2020-06-26 データ量十分性判定装置、データ量十分性判定方法、データ量十分性判定プログラム、学習モデル生成システム、学習済みの学習モデル生成方法、及び学習済みの学習モデル生成プログラム

Country Status (6)

Country Link
US (1) US20230053174A1 (ja)
JP (1) JP7211562B2 (ja)
CN (1) CN115836306A (ja)
DE (1) DE112020007110T5 (ja)
TW (1) TW202201291A (ja)
WO (1) WO2021260922A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009135649A (ja) 2007-11-29 2009-06-18 Mitsubishi Electric Corp データ処理装置及びデータ処理方法及びプログラム
WO2015151558A1 (ja) 2014-03-31 2015-10-08 日本電気株式会社 監視装置、監視システム、監視方法及びプログラム
JP2016133895A (ja) 2015-01-16 2016-07-25 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009135649A (ja) 2007-11-29 2009-06-18 Mitsubishi Electric Corp データ処理装置及びデータ処理方法及びプログラム
WO2015151558A1 (ja) 2014-03-31 2015-10-08 日本電気株式会社 監視装置、監視システム、監視方法及びプログラム
JP2016133895A (ja) 2015-01-16 2016-07-25 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム

Also Published As

Publication number Publication date
CN115836306A (zh) 2023-03-21
WO2021260922A1 (ja) 2021-12-30
US20230053174A1 (en) 2023-02-16
DE112020007110T5 (de) 2023-03-16
TW202201291A (zh) 2022-01-01
JPWO2021260922A1 (ja) 2021-12-30

Similar Documents

Publication Publication Date Title
Garland et al. Model-free quantification of time-series predictability
US12013679B2 (en) Abnormality detection system, abnormality detection apparatus, and abnormality detection method
US8630962B2 (en) Error detection method and its system for early detection of errors in a planar or facilities
CN111767930A (zh) 物联网时序数据异常检测方法及其相关设备
JP6895816B2 (ja) 異常診断装置、異常診断方法及び異常診断プログラム
JP2019028929A (ja) プリプロセッサおよび異常予兆診断システム
JP2012243256A (ja) 情報処理装置、情報処理方法、並びにプログラム
JP6183449B2 (ja) システム分析装置、及び、システム分析方法
JP6164311B1 (ja) 情報処理装置、情報処理方法、及び、プログラム
CN112955837A (zh) 异常诊断装置、异常诊断方法、及程序
Lee et al. Induction motor fault classification based on ROC curve and t-SNE
JP2016537702A (ja) システムから取得される測定値を評価する方法及びシステム
JP7173284B2 (ja) イベント監視装置、方法及びプログラム
Bo et al. Recognition of control chart patterns in auto-correlated process based on random forest
JP7211562B2 (ja) データ量十分性判定装置、データ量十分性判定方法、データ量十分性判定プログラム、学習モデル生成システム、学習済みの学習モデル生成方法、及び学習済みの学習モデル生成プログラム
JP6915693B2 (ja) システム分析方法、システム分析装置、および、プログラム
JP7158624B2 (ja) 異常検知装置
Abramovici et al. Competing fusion for bayesian applications
Zambon et al. Detecting changes in sequences of attributed graphs
KR102486463B1 (ko) 열화에 따른 시계열 데이터를 이용한 실시간 이상 감지 방법 및 그를 위한 장치
CN115249059A (zh) 模型训练及异常数据分析方法、装置及计算机存储介质
JP2011145905A (ja) 予測関数生成装置、方法、及び、プログラム
CN113377630A (zh) 一种通用的kpi异常检测框架实现方法
RU150919U1 (ru) Устройство прогнозирования работоспособности многопараметрических электромеханических систем
WO2021065961A1 (ja) 情報処理装置、算出方法および算出プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220622

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20220622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220921

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221226

R151 Written notification of patent or utility model registration

Ref document number: 7211562

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151