JP7211562B2 - データ量十分性判定装置、データ量十分性判定方法、データ量十分性判定プログラム、学習モデル生成システム、学習済みの学習モデル生成方法、及び学習済みの学習モデル生成プログラム - Google Patents
データ量十分性判定装置、データ量十分性判定方法、データ量十分性判定プログラム、学習モデル生成システム、学習済みの学習モデル生成方法、及び学習済みの学習モデル生成プログラム Download PDFInfo
- Publication number
- JP7211562B2 JP7211562B2 JP2022532209A JP2022532209A JP7211562B2 JP 7211562 B2 JP7211562 B2 JP 7211562B2 JP 2022532209 A JP2022532209 A JP 2022532209A JP 2022532209 A JP2022532209 A JP 2022532209A JP 7211562 B2 JP7211562 B2 JP 7211562B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- subsequence
- time
- data set
- probability distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、実施の形態1に係る学習モデル生成システム1000の構成を示す構成図である。
学習モデル生成システム1000は、時系列データの収集及び学習モデルの生成を行うものであり、データ量十分性判定装置100、時系列データ管理装置110、及び学習装置120を備える。
データ量十分性判定装置100は、時系列データ取得部101、データ分割部102、データ集合生成部103、特徴量算出部104、確率分布生成部105、及び判定部106を備える。
図3は、実施の形態1に係るデータ量十分性判定装置100の動作を示すフローチャートである。
次に、ステップS3において、データ集合生成部103は、ステップS2で抽出された部分列データを集めて、複数の部分列データ集合を生成する。データ集合生成部103が部分列データ集合を生成する処理の具体例について、図5を用いて説明する。図5は、実施の形態1に係るデータ集合生成部103が部分列データ集合を生成する処理の具体例を説明するための概念図である。
次に、ステップS4において、特徴量算出部104は、各部分列データ集合に対して、複数の特徴量を算出する。例えば、部分列データ集合aが、10個の部分列データを含むとすると、部分列データごとに特徴量を算出することによって、aに対する10個の特徴量を得る。
ステップS6において、確率分布生成部105は、各部分列データ集合の確率分布から、特徴量の統計量を算出する。
まず、図7に示すように、確率分布生成部105は、第1グループのaと第2グループのbとの確率分布を比較して統計量を算出し、次に、第1グループのbと第2グループのcとの確率分布を比較して統計量を算出する。このようにして、確率分布生成部105は、第1グループのa、b、c、dおよびeと、第2グループのb、c、d、eおよびfとを比較して、5つの統計量を得る。
ステップS7において、判定部106は、ステップS5で生成した確率分布が収束しているかを判定する。ここで、実施の形態1において、判定部106は、ステップS6で算出した統計量が収束しているかを判定することにより、確率分布が収束しているかを判定する。
次に、実施の形態2に係る学習モデル生成システム2000について説明する。
実施の形態1において、データ量十分性判定装置100が備える特徴量算出部104は、各部分列データの特徴量を算出するものであった。本実施の形態においては、特徴量算出部204が、部分列データ同士の比較対から特徴量を算出する、すなわち、各部分列データと他の部分列データとを比較した特徴量を算出する例を示す。以下、実施の形態1と異なる部分を中心に説明する。
実施の形態2において、確率分布生成部205は、特徴量算出部204が算出した複数の比較対の特徴量に基づいて、各グループの各部分列データ集合の特徴量の確率分布を生成する。
図9は、実施の形態2に係る特徴量算出部240の処理の具体例を説明するための概念図である。
特徴量算出部240は、図9に示すように、各グループの各部分列データ集合の先頭の部分列データと2番目の部分列データとを比較対として選択して、特徴量を算出する。次に、特徴量算出部240は、先頭の部分列データと3番目の部分列データとを比較対として選択して、特徴量を算出する。これを繰り返して、抽出した比較対の特徴量をそれぞれ算出する。
次に、実施の形態3に係るデータ量十分性判定装置300について説明する。
実施の形態1及び実施の形態2においては、図10に示すように、部分列データ集合が徐々に大きくなっていき、前の部分列データ集合を包含する場合を想定していたが、実施の形態3では、異なる方法により、部分列データ集合を生成する例を示す。以下、実施の形態1及び実施の形態2と異なる部分を中心に説明する。
図12は、実施の形態3に係るデータ量十分性判定装置300の処理の具体例を説明するための概念図である。
次に、実施の形態4に係るデータ量十分性判定装置400について説明する。
実施の形態1から3に係るデータ量十分性判定装置とは、異なる方法により部分列データ集合を生成する実施の形態について説明する。
以下、他の実施の形態と異なる部分を中心に説明する。
このように、データ集合生成部403は、他の部分列データ集合と共通の部分列データを含まない部分列データ集合を繰り返し生成する。
図14は、実施の形態4に係るデータ量十分性判定装置400の処理の具体例を説明するための概念図である。
次に、実施の形態5に係るデータ量十分性判定装置500について説明する。
実施の形態5に係るデータ量十分性判定装置500は、1回ではなく複数回の比較結果に基づき判定するため、誤判定の可能性が削減され、判定精度が向上するという効果を奏する。
次に、実施の形態6について説明する。
図17は、実施の形態6に係るデータ量十分性判定装置600の処理の具体例を説明するための概念図である。
また、データ集合生成部は、第1グループの部分列データと、第2グループの部分列データと、をそれぞれ等しいデータ量で生成しても良い。
Claims (14)
- 時系列データを取得する時系列データ取得部と、
前記時系列データを複数の部分列データに分割するデータ分割部と、
前記部分列データの集合である部分列データ集合を複数生成するデータ集合生成部と、
前記部分列データの特徴量を算出する特徴量算出部と、
前記部分列データ集合毎に前記特徴量の確率分布を生成する確率分布生成部と、
前記確率分布が収束したか否かを判定する判定部と、
を備えるデータ量十分性判定装置。 - 前記データ集合生成部は、第一の部分列データ集合に前記第一の部分列データ集合が含まない部分列データを追加することにより、第二の部分列データ集合を生成する
ことを特徴とする請求項1に記載のデータ量十分性判定装置。 - 前記データ集合生成部は、第一の部分列データ集合と、第一の部分列データ集合と共通の前記部分列データを含まない第二の部分列データ集合とを生成する
ことを特徴とする請求項1に記載のデータ量十分性判定装置。 - 前記データ集合生成部は、前記第一の部分列データ集合と、前記第二の部分列データ集合が含む少なくとも一つの部分列データとを合わせた第三の部分列データ集合を生成する
ことを特徴とする請求項3に記載のデータ量十分性判定装置。 - 前記データ集合生成部は、前記第一の部分列データ集合及び前記第二の部分列データ集合と共通の部分列データを含まない第三の部分列データ集合を生成する
ことを特徴とする請求項3に記載のデータ量十分性判定装置。 - 前記データ集合生成部は、前記部分列データ集合を複数有する第一グループと、前記第一グループと同じ数の前記部分列データ集合を有し、前記第一グループが有さない部分列データ集合を少なくとも一つ有する第二グループと、を生成し、
前記確率分布生成部は、前記第一グループが有する前記部分列データ集合の前記確率分布と、前記第二グループが有する前記部分列データ集合の前記確率分布との類似度を算出し、
前記判定部は、前記類似度が収束した場合に、前記確率分布が収束したと判定する
ことを特徴とする請求項1または2に記載のデータ量十分性判定装置。 - 前記特徴量算出部は、前記部分列データ毎に前記特徴量を算出する
ことを特徴とする請求項1から6のいずれか一項に記載のデータ量十分性判定装置。 - 前記特徴量算出部は、第一の部分列データと第二の部分列データとの比較値を前記特徴量として算出する
ことを特徴とする請求項1から6のいずれか一項に記載のデータ量十分性判定装置。 - 前記データ集合生成部は、第一の時刻から第二の時刻までに含まれる前記時系列データから複数の前記部分列データ集合を有する第一セットを生成し、前記第三の時刻から第四の時刻までに含まれる前記時系列データから複数の前記部分列データ集合を有する第二セットを生成し、
前記判定部は、前記第一セットと前記第二セットの両方で所定の条件を満たしている場合に、前記時系列データの量が十分であると判定する
ことを特徴とする請求項1から8のいずれか一項に記載のデータ量十分性判定装置。 - 時系列データを取得する時系列データ取得部と、
前記時系列データを複数の部分列データに分割するデータ分割部と、
前記部分列データの集合である部分列データ集合を複数生成するデータ集合生成部と、
前記部分列データの特徴量を算出する特徴量算出部と、
前記部分列データ集合毎に前記特徴量の確率分布を生成する確率分布生成部と、
前記確率分布が収束したか否かを判定する判定部と、
前記判定部が、前記確率分布が収束したと判定した場合に、前記時系列データを学習用データとして取得する学習用データ取得部と、
前記学習用データを用いて学習モデルの学習を行い、学習済みの学習モデルを生成する学習済モデル生成部と、
を備える学習モデル生成システム。 - コンピュータが、時系列データを取得する時系列データ取得工程と、
コンピュータが、前記時系列データを複数の部分列データに分割するデータ分割工程と、
コンピュータが、前記部分列データの集合である部分列データ集合を複数生成するデータ集合生成工程と、
コンピュータが、前記部分列データの特徴量を算出する特徴量算出工程と、
コンピュータが、前記部分列データ集合毎に前記特徴量の確率分布を生成する確率分布生成工程と、
コンピュータが、前記確率分布が収束したか否かを判定する判定工程と、
を含むデータ量十分性判定方法。 - 請求項11に記載の全工程をコンピュータに実行させるデータ量十分性判定プログラム。
- コンピュータが、時系列データを取得する時系列データ取得工程と、
コンピュータが、前記時系列データを複数の部分列データに分割するデータ分割工程と、
コンピュータが、前記部分列データの集合である部分列データ集合を複数生成するデータ集合生成工程と、
コンピュータが、前記部分列データの特徴量を算出する特徴量算出工程と、
コンピュータが、前記部分列データ集合毎に前記特徴量の確率分布を生成する確率分布生成工程と、
コンピュータが、前記確率分布が収束したか否かを判定する判定工程と、
コンピュータが、前記判定工程において、前記確率分布が収束したと判定した場合に、前記時系列データを学習用データとして取得する学習用データ取得工程と、
コンピュータが、前記学習用データを用いて学習モデルの学習を行い、学習済みの学習モデルを生成する学習済モデル生成工程と、
を含む学習済みの学習モデル生成方法。 - 請求項13に記載の全工程をコンピュータに実行させる学習済みの学習モデル生成プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/025227 WO2021260922A1 (ja) | 2020-06-26 | 2020-06-26 | データ量十分性判定装置、データ量十分性判定方法、データ量十分性判定プログラム、学習モデル生成システム、学習済みの学習モデル生成方法、及び学習済みの学習モデル生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021260922A1 JPWO2021260922A1 (ja) | 2021-12-30 |
JP7211562B2 true JP7211562B2 (ja) | 2023-01-24 |
Family
ID=79282190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022532209A Active JP7211562B2 (ja) | 2020-06-26 | 2020-06-26 | データ量十分性判定装置、データ量十分性判定方法、データ量十分性判定プログラム、学習モデル生成システム、学習済みの学習モデル生成方法、及び学習済みの学習モデル生成プログラム |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230053174A1 (ja) |
JP (1) | JP7211562B2 (ja) |
CN (1) | CN115836306A (ja) |
DE (1) | DE112020007110T5 (ja) |
TW (1) | TW202201291A (ja) |
WO (1) | WO2021260922A1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009135649A (ja) | 2007-11-29 | 2009-06-18 | Mitsubishi Electric Corp | データ処理装置及びデータ処理方法及びプログラム |
WO2015151558A1 (ja) | 2014-03-31 | 2015-10-08 | 日本電気株式会社 | 監視装置、監視システム、監視方法及びプログラム |
JP2016133895A (ja) | 2015-01-16 | 2016-07-25 | キヤノン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
-
2020
- 2020-06-26 WO PCT/JP2020/025227 patent/WO2021260922A1/ja active Application Filing
- 2020-06-26 CN CN202080102303.8A patent/CN115836306A/zh active Pending
- 2020-06-26 JP JP2022532209A patent/JP7211562B2/ja active Active
- 2020-06-26 DE DE112020007110.3T patent/DE112020007110T5/de active Pending
- 2020-09-09 TW TW109130974A patent/TW202201291A/zh unknown
-
2022
- 2022-10-26 US US17/974,040 patent/US20230053174A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009135649A (ja) | 2007-11-29 | 2009-06-18 | Mitsubishi Electric Corp | データ処理装置及びデータ処理方法及びプログラム |
WO2015151558A1 (ja) | 2014-03-31 | 2015-10-08 | 日本電気株式会社 | 監視装置、監視システム、監視方法及びプログラム |
JP2016133895A (ja) | 2015-01-16 | 2016-07-25 | キヤノン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN115836306A (zh) | 2023-03-21 |
WO2021260922A1 (ja) | 2021-12-30 |
US20230053174A1 (en) | 2023-02-16 |
DE112020007110T5 (de) | 2023-03-16 |
TW202201291A (zh) | 2022-01-01 |
JPWO2021260922A1 (ja) | 2021-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Garland et al. | Model-free quantification of time-series predictability | |
US12013679B2 (en) | Abnormality detection system, abnormality detection apparatus, and abnormality detection method | |
US8630962B2 (en) | Error detection method and its system for early detection of errors in a planar or facilities | |
CN111767930A (zh) | 物联网时序数据异常检测方法及其相关设备 | |
JP6895816B2 (ja) | 異常診断装置、異常診断方法及び異常診断プログラム | |
JP2019028929A (ja) | プリプロセッサおよび異常予兆診断システム | |
JP2012243256A (ja) | 情報処理装置、情報処理方法、並びにプログラム | |
JP6183449B2 (ja) | システム分析装置、及び、システム分析方法 | |
JP6164311B1 (ja) | 情報処理装置、情報処理方法、及び、プログラム | |
CN112955837A (zh) | 异常诊断装置、异常诊断方法、及程序 | |
Lee et al. | Induction motor fault classification based on ROC curve and t-SNE | |
JP2016537702A (ja) | システムから取得される測定値を評価する方法及びシステム | |
JP7173284B2 (ja) | イベント監視装置、方法及びプログラム | |
Bo et al. | Recognition of control chart patterns in auto-correlated process based on random forest | |
JP7211562B2 (ja) | データ量十分性判定装置、データ量十分性判定方法、データ量十分性判定プログラム、学習モデル生成システム、学習済みの学習モデル生成方法、及び学習済みの学習モデル生成プログラム | |
JP6915693B2 (ja) | システム分析方法、システム分析装置、および、プログラム | |
JP7158624B2 (ja) | 異常検知装置 | |
Abramovici et al. | Competing fusion for bayesian applications | |
Zambon et al. | Detecting changes in sequences of attributed graphs | |
KR102486463B1 (ko) | 열화에 따른 시계열 데이터를 이용한 실시간 이상 감지 방법 및 그를 위한 장치 | |
CN115249059A (zh) | 模型训练及异常数据分析方法、装置及计算机存储介质 | |
JP2011145905A (ja) | 予測関数生成装置、方法、及び、プログラム | |
CN113377630A (zh) | 一种通用的kpi异常检测框架实现方法 | |
RU150919U1 (ru) | Устройство прогнозирования работоспособности многопараметрических электромеханических систем | |
WO2021065961A1 (ja) | 情報処理装置、算出方法および算出プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220622 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220622 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220816 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220921 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221226 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7211562 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |