JP5957507B2 - データパターン分析最適化処理装置、及びデータパターン分析最適化処理方法 - Google Patents
データパターン分析最適化処理装置、及びデータパターン分析最適化処理方法 Download PDFInfo
- Publication number
- JP5957507B2 JP5957507B2 JP2014219732A JP2014219732A JP5957507B2 JP 5957507 B2 JP5957507 B2 JP 5957507B2 JP 2014219732 A JP2014219732 A JP 2014219732A JP 2014219732 A JP2014219732 A JP 2014219732A JP 5957507 B2 JP5957507 B2 JP 5957507B2
- Authority
- JP
- Japan
- Prior art keywords
- time
- time series
- unit
- item
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
- G06F16/24534—Query rewriting; Transformation
- G06F16/24537—Query rewriting; Transformation of operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2477—Temporal data queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Debugging And Monitoring (AREA)
Description
本発明の実施形態に係るデータパターン分析最適化処理装置は、時系列パターン抽出の処理対象となる時系列データが複数ある場合、それら時系列データを複数のグループに分割する。時系列データは、時刻データと、その時刻データが示す時刻に発生したアイテムとからなるデータの集合である(後述する図2参照。)。アイテムは、時系列データを構成する最小の要素のデータであり、属性と属性値のデータによって構成される。例えば、属性は、状態、気温、湿度などであり、これらの属性値はそれぞれ、異常1、20℃、80%などである。以下では、アイテムを「属性_属性値」のように記述する。また、時系列データのグループとは、計算機が時系列パターン抽出処理を並列分散処理するなどして分割して行う場合に、まとめて時系列パターン抽出処理を行うデータ群である。計算機は、時系列パターンの抽出処理において、時系列データの中に、最小支持度により示されるある一定の頻度以上で時刻順に発生するアイテム群の並びを、時系列パターンとして抽出する(後述する図3参照。)。
図4は、データパターン分析最適化処理装置100におけるデータパターン分析最適化処理の動作を示すフロー図である。予め、時系列データ記憶部11には、分析対象の時系列データを記憶させておく。また、設定情報記憶部12には、系列数の初期値、最小支持度の初期値、最小支持度の設定ステップ、最小支持度調整を許可するか否かの初期設定を記憶させておく。
タイプ1は、発生パターン数の予測上限値及び予測下限値が、計算機が処理するパターン数の上限値及び下限値の範囲内である場合である。タイプ2は、発生パターン数の予測上限値が、計算機が処理するパターン数の上限値を超える場合である。タイプ3は、発生パターン数の予測上限値が、計算機が処理するパターン数の下限値を下回る場合である。同図に示す期待値とは、系列アイテムが時系列データに出現する頻度が最小支持度を上回れば1、下回れば0として算出された、時系列パターン抽出処理において取り扱うパターン数の期待値である。この期待値にはブレがあるため、ステップS110において、そのブレの範囲となる発生パターン数の予測上限値と予測下限値が期待値に基づいて算出される。
また、ステップS125において、比較判定部25が、初期設定は最小支持度調整を許可する設定になっていると判断した場合、最小支持度調整部27は、ステップS130の判定を行わずに、ステップS135の処理を行い、最小支持度を下げてもよい。このように、発生パターン数の予測上限値が、計算機が処理するパターン数の下限値を下回る度合による判断を行わずに最小支持度を調整する処理を行なうことによって、最小支持度を1ステップずつ低くしても差し支えない。つまり、本発明においては、必ずしも下限値を下回る度合を用いることは必須ではない。
また、ステップS125において、比較判定部25が、初期設定は最小支持度調整を不許可とする設定になっていると判断した場合、あるいは、ステップS130において、最小支持度調整部27が、予め設定した割合を上回らないと判断した場合、データパターン分析最適化処理装置100は、ステップS145の処理を実行してもよい。
=アイテム「A_a1」の頻度(0.1)×アイテム「B_b2」の頻度(0.2)
=0.02 …(1)
=アイテム「A_a1」の頻度(0.1)×アイテム「C_c3」の頻度(0.3)
=0.03 …(2)
=アイテム「A_a1」の頻度(0.1)×アイテム「G_g7」の頻度(0.2)
=0.02 …(3)
g(アイテム「A_a1」の頻度(0.1)×アイテム「B_b2」の頻度(0.2))
+
g(アイテム「A_a1」の頻度(0.1)×アイテム「C_c3」の頻度(0.3))
+
g(アイテム「A_a1」の頻度(0.1)×アイテム「G_g7」の頻度(0.2))
+…
=0+1+0+… …(6)
予測部24は、算出した発生パターン数の予測上限値及び予測下限値を出力する(ステップS230)。
12 設定情報記憶部
13 抽出パターン記憶部
21 制御管理部
22 計算機管理部
23 アイテム解析部
24 予測部
25 比較判定部
26 分割部
27 最小支持度調整部
28 グループ統合部
29 時系列パターン抽出部
100 データパターン分析最適化処理装置
Claims (7)
- 属性と当該属性の属性値とにより示される時刻順のアイテムからなる時系列データを複数記憶する時系列データ記憶部と、
各アイテムが出現する前記時系列データの割合に基づいて、時系列パターンを構成するアイテムの数である系列数が所定数である場合に、最小支持度を超える頻度で前記時系列データに出現する時系列パターンのパターン数の上限の予測値を算出する予測処理を行う予測部と、
前記予測部が算出した前記上限の予測値が、パターン分析を行う計算機が処理するパターン数の上限値を超える場合に前記系列数を増加させ、増加させた前記系列数のアイテムからなる系列アイテムに基づいて複数の前記時系列データをグループに分割し、増加させた前記系列数を用いて前記予測処理を実行するよう前記予測部に指示する分割部と、
前記予測部が算出した前記上限の予測値がパターン分析を行う計算機が処理するパターン数の上限値以下である場合に、前記グループごとに時系列パターンを抽出するよう指示する時系列パターン抽出部と、
を備えることを特徴とするデータパターン分析最適化処理装置。 - 前記予測部が算出した前記上限の予測値が、パターン分析を行う計算機が処理するパターン数の下限値を下回る場合、最小支持度を所定だけ低下させ、低下させた前記最小支持度を用いて前記予測処理を実行するよう前記予測部に指示する最小支持度調整部をさらに備える、
ことを特徴とする請求項1に記載のデータパターン分析最適化処理装置。 - 前記最小支持度調整部は、前記予測部が算出した前記上限の予測値が、パターン分析を行う計算機が処理するパターン数の下限値を下回る場合、前記上限の予測値が、計算機が処理するパターン数の下限値を下回る度合を算出し、算出した度合と、前の値の最小支持度のときの前記度合とを比較して変化が所定の基準を超えると判断したきには、前記最小支持度を所定だけ低下させ、低下させた前記最小支持度を用いて前記予測処理を前記予測部に実行するよう指示し、
前記最小支持度調整部により前記変化が前記所定の基準以内であると判断された場合、前記時系列データのグループの一部を統合し、統合されたグループに含まれる前記時系列データについて前記予測処理を実行するよう前記予測部に指示するグループ統合部をさらに備える、
ことを特徴とする請求項2に記載のデータパターン分析最適化処理装置。 - 前記予測部が算出した前記上限の予測値が、パターン分析を行う計算機が処理するパターン数の下限値を下回る場合、前記時系列データのグループの一部を統合し、統合されたグループに含まれる前記時系列データについて前記予測処理を実行するよう前記予測部に指示するグループ統合部をさらに備える、
ことを特徴とする請求項1に記載のデータパターン分析最適化処理装置。 - 前記予測部は、前記予測処理において、
各アイテムが出現する時系列データの割合に基づいて、所定の系列数のアイテムからなる時系列パターンが前記時系列データに出現する頻度を算出し、
前記時系列データに出現する頻度が最小支持度以上である前記時系列パターンの個数によりパターン数の期待値を算出し、
前記期待値に基づいて前記パターン数の上限の予測値を算出する、
ことを特徴とする請求項1から請求項4のいずれか1項に記載のデータパターン分析最適化処理装置。 - 前記分割部は、前記予測部が算出した前記上限の予測値が、パターン分析を行う計算機が処理するパターン数の上限値を超える場合に前記系列数を増加させ、増加させた前記系列数のアイテムからなる系列アイテムを、入力された系列アイテムにより、各アイテムが出現する前記時系列データの割合に基づいて選択したアイテムにより、あるいは、増加させる前の系列数のときに生成された系列アイテムにアイテムを付加することにより生成し、生成した前記系列アイテムに基づいて複数の前記時系列データをグループに分割する、
ことを特徴とする請求項1から請求項5のいずれか1項に記載のデータパターン分析最適化処理装置。 - データパターン分析最適化処理装置が実行するデータパターン分析最適化処理方法であって、
時系列データ記憶部が、属性と当該属性の属性値とにより示される時刻順のアイテムからなる時系列データを複数記憶する時系列データ記憶ステップと、
予測部が、各アイテムが出現する前記時系列データの割合に基づいて、時系列パターンを構成する連続したアイテムの数である系列数が所定数である場合に、最小支持度を超える頻度で前記時系列データに出現する時系列パターンのパターン数の上限の予測値を算出する予測処理ステップと、
分割部が、前記予測処理ステップにおいて算出した前記上限の予測値が、パターン分析を行う計算機が処理するパターン数の上限値を超える場合に前記系列数を増加させ、増加させた前記系列数のアイテムからなる系列アイテムに基づいて複数の前記時系列データをグループに分割し、前記予測部に増加させた前記系列数を用いて前記予測処理ステップの実行を指示する分割ステップと、
時系列パターン抽出部が、前記予測処理ステップにおいて算出した前記上限の予測値がパターン分析を行う計算機が処理するパターン数の上限値以下である場合に、前記グループごとに時系列パターンを抽出するよう指示する時系列パターン抽出ステップと、
を有することを特徴とするデータパターン分析最適化処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014219732A JP5957507B2 (ja) | 2013-11-01 | 2014-10-28 | データパターン分析最適化処理装置、及びデータパターン分析最適化処理方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013228705 | 2013-11-01 | ||
JP2013228705 | 2013-11-01 | ||
JP2014219732A JP5957507B2 (ja) | 2013-11-01 | 2014-10-28 | データパターン分析最適化処理装置、及びデータパターン分析最適化処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015111410A JP2015111410A (ja) | 2015-06-18 |
JP5957507B2 true JP5957507B2 (ja) | 2016-07-27 |
Family
ID=53003906
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014219732A Active JP5957507B2 (ja) | 2013-11-01 | 2014-10-28 | データパターン分析最適化処理装置、及びデータパターン分析最適化処理方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11663210B2 (ja) |
JP (1) | JP5957507B2 (ja) |
WO (1) | WO2015064293A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6223889B2 (ja) | 2014-03-31 | 2017-11-01 | 株式会社東芝 | パターン発見装置、およびプログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11259452A (ja) * | 1998-02-17 | 1999-09-24 | Internatl Business Mach Corp <Ibm> | 高速積分方法及びシステム |
JP3738977B2 (ja) * | 2001-06-27 | 2006-01-25 | 石井 昭良 | 時系列データ解析に基づく連続データ変換方法及び装置 |
JP2005149268A (ja) * | 2003-11-18 | 2005-06-09 | Toru Kinukawa | 計測データ処理装置 |
US7526461B2 (en) * | 2004-11-17 | 2009-04-28 | Gm Global Technology Operations, Inc. | System and method for temporal data mining |
JP2006252394A (ja) * | 2005-03-14 | 2006-09-21 | Sony Corp | 情報処理システム、情報処理装置および方法、並びにプログラム |
US20080126347A1 (en) * | 2006-11-27 | 2008-05-29 | Kabushiki Kaisha Toshiba | Frequent pattern mining system |
JP2008159015A (ja) | 2006-11-27 | 2008-07-10 | Toshiba Corp | 頻出パターン発見装置および頻出パターン発見方法 |
JP5506629B2 (ja) | 2010-10-19 | 2014-05-28 | 日本電信電話株式会社 | 準頻出構造パターンマイニング装置と頻出構造パターンマイニング装置とそれらの方法、及びプログラム |
JP2014191533A (ja) * | 2013-03-27 | 2014-10-06 | Nec Corp | 情報処理装置、方法およびプログラム |
-
2014
- 2014-10-02 WO PCT/JP2014/076383 patent/WO2015064293A1/ja active Application Filing
- 2014-10-28 JP JP2014219732A patent/JP5957507B2/ja active Active
-
2016
- 2016-04-21 US US15/134,631 patent/US11663210B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
WO2015064293A1 (ja) | 2015-05-07 |
US11663210B2 (en) | 2023-05-30 |
US20160232205A1 (en) | 2016-08-11 |
JP2015111410A (ja) | 2015-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11023577B2 (en) | Anomaly detection for time series data having arbitrary seasonality | |
US11410063B2 (en) | Self-intelligent improvement in predictive data models | |
WO2018170454A2 (en) | Using different data sources for a predictive model | |
JP6718500B2 (ja) | 生産システムにおける出力効率の最適化 | |
US10248618B1 (en) | Scheduling snapshots | |
JP2024502098A (ja) | 時系列データの異常監視方法、装置、電子機器及び記憶媒体 | |
JP6176390B2 (ja) | 情報処理装置、解析方法、及び、プログラム記録媒体 | |
JP5957507B2 (ja) | データパターン分析最適化処理装置、及びデータパターン分析最適化処理方法 | |
CN111930602A (zh) | 性能指标预测方法及装置 | |
JP6450098B2 (ja) | 匿名化装置、匿名化方法及び匿名化プログラム | |
CN111819559A (zh) | 以量化步长使用机器学习模型用于恶意软件检测 | |
JP5555238B2 (ja) | ベイジアンネットワーク構造学習のための情報処理装置及びプログラム | |
JP6331549B2 (ja) | 仮想マシン管理装置、仮想マシン管理方法、及び仮想マシン管理システム | |
JP6627258B2 (ja) | システムモデル生成支援装置、システムモデル生成支援方法、及び、プログラム | |
JP5863180B2 (ja) | 映像解析処理装置、映像解析処理方法、および映像解析処理用プログラム | |
JP2015172790A (ja) | 予測システム、予測方法、および予測プログラム | |
JP7400819B2 (ja) | 予測装置、予測方法、及び予測プログラム | |
JP2015200980A (ja) | 検証支援プログラム、検証支援方法および検証支援装置 | |
JP2020181318A (ja) | 最適化装置、最適化方法、及びプログラム | |
JP6745245B2 (ja) | 送信制御装置、送信制御方法及び送信制御プログラム | |
US20170139969A1 (en) | Method for filtering and analyzing big data, electronic device, and non-transitory computer-readable storage medium | |
WO2017212758A1 (ja) | ユーザインタフェース装置 | |
US11314752B2 (en) | Computer system and data analysis method | |
WO2016180350A1 (zh) | 一种终端桌面的智能管理方法、终端及计算机存储介质 | |
US11580146B2 (en) | Inference system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160524 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160620 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5957507 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |