JP6200032B2 - Method and system for dynamically generating a data model for data prediction - Google Patents

Method and system for dynamically generating a data model for data prediction Download PDF

Info

Publication number
JP6200032B2
JP6200032B2 JP2016094474A JP2016094474A JP6200032B2 JP 6200032 B2 JP6200032 B2 JP 6200032B2 JP 2016094474 A JP2016094474 A JP 2016094474A JP 2016094474 A JP2016094474 A JP 2016094474A JP 6200032 B2 JP6200032 B2 JP 6200032B2
Authority
JP
Japan
Prior art keywords
data
statistical
value
variables
aggregate value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016094474A
Other languages
Japanese (ja)
Other versions
JP2016212883A (en
Inventor
クマール エヌ.ヴィノス
クマール エヌ.ヴィノス
泰志 原田
泰志 原田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JP2016212883A publication Critical patent/JP2016212883A/en
Application granted granted Critical
Publication of JP6200032B2 publication Critical patent/JP6200032B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本主題は、一般に、データ予測に関し、限定するものではないが、より詳細には、事象に関するデータ予測に向けてデータ・モデルを動的に生成するための方法及びシステムに関する。   The present subject matter relates generally to, but not limited to, data prediction, and more particularly to a method and system for dynamically generating a data model for event data prediction.

一般には、製品及び/又はサービスに向けた予測用データは、多くの組織にとって極めて重要な関心事項である。予測することにより、様々な形で履歴データ及び判定データに基づいて、製品及び/又はサービスの今後の需要が予想される。需要予測は、様々な事業活動、具体的には、在庫調整と補充、及び/又はサービスの効果的な管理のための重要パラメータであり、したがって、組織の生産性と利益に対して有意に貢献する。しかしながら、自然/人間現象を予測する際にはエラーがあり、それは、当該現象、又は事象に影響を及ぼす要因をすべて徹底的に考慮できないこと、及びセンサが故障しやすく、又はインターフェースにエラーが生じることに起因する。従来の予測方法は、過去のエラー・データを収集し、その確率分布を生成することによってエラーを訂正し、それに基づいて予測値が修正される。しかしながら、これらの従来の方法により抑えられるエラーは、ごくわずかにすぎない。   In general, predictive data for products and / or services is a very important concern for many organizations. By predicting, future demand for products and / or services is expected based on historical data and decision data in various ways. Demand forecasting is a key parameter for various business activities, specifically inventory adjustment and replenishment, and / or effective management of services, and thus contributes significantly to the productivity and profits of the organization To do. However, there is an error in predicting natural / human phenomena, because it cannot thoroughly consider all the factors that affect the phenomenon or event, and the sensor is prone to failure, or the interface is in error Due to that. The conventional prediction method collects error data in the past, generates a probability distribution thereof, corrects the error, and corrects the predicted value based on the error. However, the errors that can be suppressed by these conventional methods are negligible.

そのため、エラーを抑える予測、及び既存の予測用システムの不利点と限界の克服に向けて、データ・モデルを動的に生成するための方法及びシステムの必要性がある。   Therefore, there is a need for a method and system for dynamically generating data models for error-predicting prediction and overcoming the disadvantages and limitations of existing prediction systems.

本開示を通じて、従来技術の1つ又は複数の弱点が克服され、追加の利点が提供される。追加の特徴及び利点は、本開示の技法を通じて認識される。本開示の他の実施例及び態様は、本明細書に詳細に説明され、特許請求される開示の一部と見なされる。   Through this disclosure, one or more of the weaknesses of the prior art are overcome and additional advantages are provided. Additional features and advantages are recognized through the techniques of this disclosure. Other embodiments and aspects of the disclosure are described in detail herein and are considered a part of the claimed disclosure.

したがって、本開示は、事象に関するデータ予測に向けてデータ・モデルを動的に生成する方法に関する。この方法は、過去のデータ(HD:historic data)データベースから複数の過去のデータセットを受信するステップであって、データセットが、データ予測に関連する1つ又は複数の第1及び第2の変数に対応するデータを含む、ステップ、並びに複数の過去のデータセットの統計的参照集計値を決定するステップを含む。方法は、1つ又は複数の第2の変数に基づいて、複数の過去のデータセットを複数のデータセット群に動的に分類するステップ、及び分類された複数のデータセット群のそれぞれの統計的特定集計値を決定するステップをさらに含む。決定と同時に、分類された複数のデータセット群のデータ・モデルは、統計的参照集計値と統計的特定集計値との比較に基づいて生成される。   Accordingly, the present disclosure relates to a method for dynamically generating a data model for data prediction regarding events. The method includes receiving a plurality of past data sets from a historical data (HD) database, wherein the data set includes one or more first and second variables associated with data prediction. As well as determining statistical reference aggregate values for a plurality of past data sets. The method dynamically classifies a plurality of past data sets into a plurality of data sets based on one or more second variables, and a statistical value for each of the classified plurality of data sets. The method further includes the step of determining a specific aggregate value. Simultaneously with the determination, a data model of the plurality of classified data sets is generated based on a comparison between the statistical reference aggregation value and the statistical specific aggregation value.

さらには、本開示は、事象に関するデータ予測に向けてデータ・モデルを動的に生成するためのシステムに関する。このシステムは、プロセッサと結合され、且つデータ予測に関連する1つ又は複数の第1及び第2の変数に対応するデータを含む複数の過去のデータセットを記憶するように構成された過去のデータ(HD)データベースを備える。システムは、プロセッサ、及びプロセッサに通信可能なように結合されたメモリをさらに備え、メモリは、プロセッサ実行可能命令を記憶し、この命令は、実行すると、プロセッサに、HDデータベースから複数の過去のデータセットを受信させる。プロセッサは、複数の過去のデータセットの統計的参照集計値を決定するようにさらに構成されている。プロセッサは、さらに、1つ又は複数の第2の変数に基づいて、複数の過去のデータセットを複数のデータセット群に動的に分類し、分類された複数のデータセット群のそれぞれの統計的特定集計値を決定する。複数の過去のデータセットの動的な分類と同時に、プロセッサは、統計的参照集計値と統計的特定集計値との比較に基づいて、分類された複数のデータセット群のデータ・モデルを生成する。   Furthermore, the present disclosure relates to a system for dynamically generating a data model for data prediction regarding events. Past data coupled to a processor and configured to store a plurality of past data sets including data corresponding to one or more first and second variables associated with data prediction (HD) database. The system further comprises a processor and a memory communicatively coupled to the processor, the memory storing processor executable instructions that, when executed, send the processor a plurality of past data from the HD database. Have the set received. The processor is further configured to determine a statistical reference aggregate value for the plurality of past data sets. The processor further dynamically classifies the plurality of past data sets into a plurality of data set groups based on the one or more second variables, and determines a statistical value for each of the classified plurality of data set groups. Determine a specific summary value. Simultaneously with the dynamic classification of multiple historical datasets, the processor generates a data model for the group of multiple classified datasets based on the comparison of the statistical reference aggregate value with the statistical specific aggregate value .

さらには、本開示は、その上に記憶された命令を含んだ非一時的コンピュータ可読媒体に関し、この命令は、少なくとも1つのプロセッサによって処理されると、システムに、過去のデータ(HD)データベースから複数の過去のデータセットを受信する行為を行わせ、データセットは、データ予測に関連する1つ又は複数の第1及び第2の変数に対応するデータを含む。さらには、命令は、プロセッサに、複数の過去のデータセットの統計的参照集計値を決定させる。   Furthermore, the present disclosure relates to a non-transitory computer readable medium including instructions stored thereon, which instructions are processed by at least one processor from a historical data (HD) database. An act of receiving a plurality of past data sets is performed, the data sets including data corresponding to one or more first and second variables associated with the data prediction. Further, the instructions cause the processor to determine statistical reference aggregate values for a plurality of past data sets.

さらには、命令は、プロセッサに、1つ又は複数の第2の変数に基づいて、複数の過去のデータセットを複数のデータセット群に動的に分類させ、分類された複数のデータセット群のそれぞれの統計的特定集計値を決定させる。複数の過去のデータセットの動的な分類と同時に、命令は、プロセッサに、統計的参照集計値と統計的特定集計値との比較に基づいて、分類された複数のデータセット群のデータ・モデルを生成させる。   Further, the instructions cause the processor to dynamically classify a plurality of past data sets into a plurality of data sets based on one or more second variables, and Each statistical specific summary value is determined. At the same time as the dynamic classification of multiple historical datasets, the instruction tells the processor a data model for the group of multiple classified datasets based on the comparison of the statistical reference aggregate value with the statistical specific aggregate value. Is generated.

前述の概要は、ほんの例示にすぎず、いかなる形にも限定するように意図するものではない。上述の例示的な態様、実施例及び特徴に加えて、さらなる態様、実施例及び特徴は、図面及び次の詳細な説明を参照することによって明らかになるであろう。   The foregoing summary is merely exemplary and is not intended to be limiting in any way. In addition to the illustrative aspects, embodiments, and features described above, further aspects, embodiments, and features will become apparent by reference to the drawings and the following detailed description.

本開示に組み込まれ、本開示の一部として構成される添付の図面は、例示の実施例を示しており、記載とともに、開示される原理を説明するように働く。図では、参照番号の最左桁は、その参照番号が最初に現れる図を識別する。同じ番号が、同様の特徴及び構成要素を参照するのに図全体を通じて使用される。次に、本主題の実施例によるシステム及び/又は方法のいくつかの実施例が、ほんの実例として、添付の図を参照して説明される。   The accompanying drawings, which are incorporated in and constitute a part of this disclosure, illustrate exemplary embodiments and, together with the description, serve to explain the disclosed principles. In the figure, the leftmost digit of a reference number identifies the figure in which that reference number first appears. The same numbers are used throughout the figures to reference like features and components. Several embodiments of systems and / or methods according to embodiments of the present subject matter will now be described, by way of example only, with reference to the accompanying figures.

本開示のいくつかの実施例による、事象に関するデータ予測に向けてデータ・モデルを動的に生成するための例示のシステムのアーキテクチャ図である。FIG. 2 is an architectural diagram of an example system for dynamically generating a data model for data prediction on events according to some embodiments of the present disclosure. 本開示のいくつかの実施例による、図1のデータ・モデリング・システムの例示的なブロック図である。FIG. 2 is an exemplary block diagram of the data modeling system of FIG. 1 according to some embodiments of the present disclosure. 本開示のいくつかの実施例による、事象に関するデータ予測に向けてデータ・モデルを動的に生成する例示の方法の流れ図である。4 is a flow diagram of an example method for dynamically generating a data model for data prediction regarding events according to some embodiments of the present disclosure. 本開示に従う実施例を実装するための例示のコンピュータ・システムのブロック図である。FIG. 6 is a block diagram of an exemplary computer system for implementing an embodiment in accordance with the present disclosure.

本明細書における任意のブロック図が、本主題の原理を具現化する例示的なシステムの概念図を表していることを当業者は認識すべきである。同様に、任意のフロー・チャート、フロー図、状態遷移図、及び疑似コードなどは、コンピュータ可読媒体において実質的に表され、コンピュータ又はプロセッサによって、そのようなコンピュータ又はプロセッサが明示的に示されているか否かにかかわらず、実行され得る様々な処理を表していることが認識されよう。   Those skilled in the art should appreciate that any block diagram herein represents a conceptual diagram of an exemplary system that embodies the principles of the present subject matter. Similarly, any flow charts, flow diagrams, state transition diagrams, pseudocode, etc. may be substantially represented in computer-readable media, with such computers or processors being explicitly indicated by computers or processors. It will be appreciated that it represents various processes that can be performed, whether or not.

本文献では、語「例示の(exemplary)」は、本明細書においては、「実例、事例、又は例示として働く(serving as an example, instance ,or illustration)」ことを意味するのに使用される。「例示の」として本明細書に説明される本主題の何らかの実施例又は実装例が、必ずしも、他の実施例に対して好ましい、又は有利であると解釈すべきではない。   In this document, the word “exemplary” is used herein to mean “serving as an example, instance, or illustration”. . Any embodiment or implementation of the present subject matter described herein as “exemplary” is not necessarily to be construed as preferred or advantageous over other embodiments.

本開示は、様々な修正及び代替の形態に影響されやすいが、その特定の実施例が、図面に例示として示されており、詳細に後述されることになる。しかしながら、開示される具体的な形態に本開示を限定するように意図しておらず、むしろ、本開示が、本開示の範囲に入るすべての修正例、等価例、及び代替例をカバーすべきであることを理解されたい。   While this disclosure is susceptible to various modifications and alternative forms, specific embodiments thereof are shown by way of example in the drawings and will be described in detail below. However, it is not intended to limit the disclosure to the specific forms disclosed, but rather, the disclosure should cover all modifications, equivalents, and alternatives falling within the scope of the disclosure. Please understand that.

用語「備える、含む(comprises)、(comprising)」、又は任意の他のその変形は、非排他的な包含をカバーするように意図されており、したがって、構成要素若しくはステップのリストを備える設定、デバイス、又は方法は、それらの構成要素又はステップしか含んでいないのではなく、明示的にはリストされていない他の構成要素又はステップも、或いはそのような設定若しくはデバイス又は方法に固有の他の構成要素又はステップも含む場合がある。言い換えれば、「〜を備える、含む(comprises…a)」によって処理されるシステム若しくは機器における1つ又は複数の要素は、それ以上の制約はなく、システム若しくは機器における他の要素又は追加の要素の存在を除外していない。   The term “comprises”, “comprising”, or any other variation thereof is intended to cover non-exclusive inclusions, and thus a setting comprising a list of components or steps, A device or method does not include only those components or steps, but other components or steps not explicitly listed, or other such settings or devices or methods specific to the method. It may also include components or steps. In other words, one or more elements in a system or device processed by “comprises… a” are not further constrained and may be other elements or additional elements of the system or device. Do not exclude existence.

本開示は、事象に関するデータ予測に向けてデータ・モデルを動的に生成するための方法及びシステムに関する。1つの実施例においては、この方法は、過去のデータ・データベースに記憶されている過去のデータセットを受信し、過去のデータセットの統計的参照集計値を決定する。方法は、さらに、過去のデータセットを複数のデータセット群に分類し、複数のデータセット群の統計的特定集計値を決定する。さらには、方法は、統計的参照集計値と統計的特定集計値とに基づいて、分類された複数のデータセット群のデータ・モデルを生成する。こうして生成されるデータ・モデルは、エラーを抑えながら、今後の予測済みデータ値の決定を可能にする。したがって、提案されたデータ・モデルは、データを予測する際のエラーを最小限にし、それによって、組織の経済状態及び運用効率を向上させる。   The present disclosure relates to methods and systems for dynamically generating a data model for event prediction of events. In one embodiment, the method receives a past data set stored in a past data database and determines a statistical reference aggregate value for the past data set. The method further classifies past data sets into a plurality of data set groups, and determines a statistically specific aggregate value of the plurality of data set groups. Further, the method generates a data model of the plurality of classified data sets based on the statistical reference aggregation value and the statistical specific aggregation value. The data model thus generated allows future predicted data values to be determined while suppressing errors. Thus, the proposed data model minimizes errors in predicting data, thereby improving the economic status and operational efficiency of the organization.

本開示の実施例の次の詳細な説明においては、その一部を成し、且つ本開示が実践され得る具体的な実施例が実例として示されている添付の図面を参照する。これらの実施例は、当業者が本開示を実践することを可能にするのに十分、詳細に説明されており、他の実施例が利用され得、変更が、本開示の範囲から逸脱することなく行われてもよいことを理解されたい。そのため、次の説明は、限定の意味で解釈すべきではない。   In the following detailed description of embodiments of the present disclosure, reference is made to the accompanying drawings that form a part hereof, and in which are shown by way of illustration specific embodiments in which the disclosure may be practiced. These embodiments are described in sufficient detail to enable those skilled in the art to practice the disclosure, other embodiments may be utilized, and modifications may depart from the scope of the disclosure. It should be understood that it may be done without. Thus, the following description should not be construed in a limiting sense.

図1は、本開示のいくつかの実施例による、事象に関するデータ予測に向けてデータ・モデルを動的に生成するための例示的なシステムのアーキテクチャ図を示している。   FIG. 1 shows an architectural diagram of an exemplary system for dynamically generating a data model for data prediction on events according to some embodiments of the present disclosure.

図1に示されるように、例示のシステム100は、事象に関するデータ予測に向けてデータ・モデルを動的に生成するように構成された1つ又は複数の構成要素を備える。1つの実施例においては、例示のシステム100は、データ・モデリング・システム102と、複数のセンサ104−1、104−2、…、104−N(まとめて、センサ104と参照)と、通信ネットワーク108を介して接続されている過去のデータ(HD)データベース106とを備える。データ・モデリング・システム102は、センサ104によって取り込まれ、且つHDデータベース106に記憶されているデータに基づいて、データ・モデルを動的に生成する。1つの実施例においては、センサ104及びHDデータベース106は、データ・モデリング・システム102内に統合可能である。別の実施例においては、センサ104及びHDデータベース106は、データ・モデリング・システム102とは別に実装可能である。   As shown in FIG. 1, exemplary system 100 comprises one or more components configured to dynamically generate a data model for data prediction regarding events. In one embodiment, exemplary system 100 includes a data modeling system 102, a plurality of sensors 104-1, 104-2,..., 104-N (collectively referred to as sensors 104), a communication network. And a past data (HD) database 106 connected via the network 108. Data modeling system 102 dynamically generates a data model based on data captured by sensor 104 and stored in HD database 106. In one embodiment, sensor 104 and HD database 106 can be integrated within data modeling system 102. In another embodiment, sensor 104 and HD database 106 can be implemented separately from data modeling system 102.

センサ104は、例えば、事象に関するデータを受信するように構成されたデータ・センサとすることができる。データは、これまでの過去の事象に関連する複数の変数に関連するデータを含むことができる。データは、HDデータベースに記憶可能であり、本明細書においては以降、複数の過去のデータと呼ばれる。複数の過去のデータは、リアル・タイムでデータ・モデルを動的に生成するようにデータ・モデリング・システム102によって処理される。   The sensor 104 can be, for example, a data sensor configured to receive data regarding events. The data can include data related to multiple variables related to past events. The data can be stored in the HD database, and is hereinafter referred to as a plurality of past data in this specification. A plurality of past data is processed by the data modeling system 102 to dynamically generate a data model in real time.

1つの実施例においては、データ・モデリング・システム102は、中央処理装置(「CPU」、又は「プロセッサ」)110と、メモリ112と、統計的集計値分析器(SSVA:statistical summary value analyzer)114と、データセット分類器116と、データ・モデル生成器118とを備える。データ・モデリング・システム102は、図2に例示される典型的なデータ・モデリング・システムであってよい。データ・モデリング・システム102は、プロセッサ110と、メモリ112と、I/Oインターフェース202とを備える。I/Oインターフェース202は、プロセッサ110及びI/Oデバイスと結合される。I/Oデバイスは、I/Oインターフェース202を介して入力を受信し、I/Oインターフェース202を介してI/Oデバイスに表示するための出力を送信するように構成されている。   In one embodiment, the data modeling system 102 includes a central processing unit (“CPU” or “processor”) 110, a memory 112, and a statistical summary value analyzer (SSVA) 114. And a data set classifier 116 and a data model generator 118. Data modeling system 102 may be a typical data modeling system illustrated in FIG. The data modeling system 102 includes a processor 110, a memory 112, and an I / O interface 202. I / O interface 202 is coupled to processor 110 and I / O devices. The I / O device is configured to receive input via the I / O interface 202 and send output for display on the I / O device via the I / O interface 202.

データ・モデリング・システム102は、データ204及びモジュール206をさらに備える。1つの実装例においては、データ204及びモジュール206は、メモリ112内に記憶され得る。1つの実例においては、データ204は、過去のデータセット208、統計的参照集計値210、統計的特定集計値212、有意マトリクス214、複数の有意間隔216、及び他のデータ218を含むことができる。1つの実施例においては、データ204は、様々なデータ構造体の形態でメモリ112に記憶され得る。加えて、前述のデータは、関係データ・モデル又は階層データ・モデルなどのデータ・モデルを使用して体系化され得る。他のデータ218はまた、推奨される実装手法を参照データとして記憶するための参照リポジトリと呼ばれてもよい。他のデータ218はまた、システム102の様々な機能を行うためのモジュール206によって生成される時間データ及び時間ファイルを含んだデータを記憶することもできる。   The data modeling system 102 further comprises data 204 and a module 206. In one implementation, data 204 and module 206 may be stored in memory 112. In one example, the data 204 can include a historical data set 208, a statistical reference summary value 210, a statistical specific summary value 212, a significance matrix 214, a plurality of significance intervals 216, and other data 218. . In one embodiment, the data 204 can be stored in the memory 112 in the form of various data structures. In addition, the aforementioned data can be organized using a data model such as a relational data model or a hierarchical data model. Other data 218 may also be referred to as a reference repository for storing recommended implementation techniques as reference data. Other data 218 may also store data including time data and time files generated by module 206 for performing various functions of system 102.

モジュール206は、例えば、統計的集計値分析器114と、データセット分類器116と、データ・モデル生成器118と、データ更新モジュール222と、今後の予測値決定(FFVD:future forecast value determination)モジュール220とを含むことができる。モジュール206はまた、データ・モデリング・システム102の様々な多岐にわたる機能を行う他のモジュール224を備えることもできる。そのような前述のモジュールが、単一のモジュールとして表されても、又は種々のモジュールの組合せとして表されてもよいことは認識されよう。モジュール206は、ソフトウェア、ハードウェア、及び/又はファームウェアの形態で実装可能である。   The module 206 includes, for example, a statistical total value analyzer 114, a data set classifier 116, a data model generator 118, a data update module 222, and a future predictive value determination (FFVD) module. 220. Module 206 may also include other modules 224 that perform various diverse functions of data modeling system 102. It will be appreciated that such a module described above may be represented as a single module or a combination of various modules. Module 206 can be implemented in the form of software, hardware, and / or firmware.

データ・モデリング・システム102は、HDデータベース106から複数の過去のデータセット208を受信する。複数の過去のデータセット208は、1つ又は複数の応答変数若しくは従属変数(本明細書においては以降、第1の変数と呼ばれる)に対応する1つ又は複数のデータと、1つ又は複数の疑わしい予測子変数若しくは独立変数(本明細書においては以降、第2の変数と呼ばれる)に関連するデータとを含む。SSVA114は、知られている技法を使用して、複数の過去のデータセット208の統計的参照集計値210を決定する。1つの実例においては、SSVA114は、1つ又は複数の第1の変数に関するデータに基づいて、複数の過去のデータセットの参照平均値を決定する。統計的参照集計値210の決定と同時に、複数のデータセット群が、分類技法を使用して生成される。   The data modeling system 102 receives a plurality of past data sets 208 from the HD database 106. The plurality of historical data sets 208 includes one or more data corresponding to one or more response variables or dependent variables (hereinafter referred to as first variables) and one or more Data associated with a suspicious predictor variable or independent variable (hereinafter referred to as the second variable herein). SSVA 114 determines a statistical reference aggregate value 210 for a plurality of past data sets 208 using known techniques. In one example, SSVA 114 determines a reference average value for a plurality of past data sets based on data relating to one or more first variables. Simultaneously with the determination of the statistical reference summary value 210, a plurality of data sets are generated using a classification technique.

1つの実施例においては、データセット分類器116は、1つ又は複数の第2の変数に関するデータに基づいて、複数の過去のデータセット208を動的に分類する。データセット分類器116は、1つ又は複数の第2の変数を選択し、1つ又は複数の選択された第2の変数の境界値を決定する。境界値に基づいて、データセット分類器116は、複数の離散間隔値、及び複数の離散間隔値に対応するステップサイズを決定することを繰り返す。別の実施例においては、ユーザが、境界値、複数の離散間隔値、及び対応するステップサイズを手動で提供することができる。決定と同時に、データセット分類器116は、複数の離散間隔値及びステップサイズに基づいて、1つ又は複数の第2の変数の複数のデータセット群を生成する。複数の分類されたデータセット群のそれぞれについて、SSVA114は、知られている技法を使用して、統計的特定集計値212を決定する。1つの実例においては、SSVA114は、1つ又は複数の第2の変数に関するデータに基づいて、複数の分類されたデータセット群のそれぞれの特定平均値を決定する。統計的特定集計値212の決定と同時に、データ・モデルは、統計的参照集計値210と統計的特定集計値212とに基づいて生成される。   In one embodiment, the data set classifier 116 dynamically classifies a plurality of past data sets 208 based on data relating to one or more second variables. The data set classifier 116 selects one or more second variables and determines boundary values for the one or more selected second variables. Based on the boundary value, the data set classifier 116 repeats determining a plurality of discrete interval values and a step size corresponding to the plurality of discrete interval values. In another embodiment, the user can manually provide boundary values, multiple discrete interval values, and corresponding step sizes. Simultaneously with the determination, the data set classifier 116 generates a plurality of data sets of one or more second variables based on the plurality of discrete interval values and step sizes. For each of the plurality of categorized data sets, SSVA 114 determines a statistical specific summary value 212 using known techniques. In one example, SSVA 114 determines a specific average value for each of a plurality of grouped data sets based on data relating to one or more second variables. Concurrently with the determination of the statistical specific summary value 212, a data model is generated based on the statistical reference summary value 210 and the statistical specific summary value 212.

1つの実施例においては、データ・モデル生成器118は、統計的参照集計値210と統計的特定集計値212とを比較し、比較に基づいて、統計的有意係数(k)を決定する。有意係数(k)は、統計的参照集計値210と統計的特定集計値212との間に実質的な差が存在するか否かに関して示す。kの値は、例えば、0から1の間とすることができる。データ・モデル生成器118が、実質的な差が存在することを決定した場合には、有意係数(k)は、1に等しく設定され、統計的特定集計値212が、予測済み統計的集計値として決定される。一方、データ・モデル生成器118が、実質的な差が存在しないことを決定した場合には、有意係数(k)は、0に等しく設定され、統計的参照集計値210が、予測済み統計的集計値として決定される。こうして決定される予測済み統計的集計値に基づいて、データ・モデル生成器118は、1つ又は複数の第2の変数の有意マトリクスを生成する。   In one embodiment, the data model generator 118 compares the statistical reference summary value 210 and the statistical specific summary value 212 and determines a statistical significance factor (k) based on the comparison. The significance coefficient (k) indicates whether there is a substantial difference between the statistical reference aggregate value 210 and the statistical specific aggregate value 212. The value of k can be between 0 and 1, for example. If the data model generator 118 determines that a substantial difference exists, the significance factor (k) is set equal to 1 and the statistical specific summary value 212 is the predicted statistical summary value. As determined. On the other hand, if the data model generator 118 determines that there is no substantial difference, the significance factor (k) is set equal to 0 and the statistical reference summary value 210 is the predicted statistical Determined as an aggregate value. Based on the predicted statistical aggregate value thus determined, the data model generator 118 generates a significance matrix of one or more second variables.

1つの実施例においては、データ・モデル生成器118は、決定された有意係数(k)に基づいて、有意マトリクスを生成する。有意マトリクスは、1つ又は複数の第2の変数の複数の離散間隔(或いは、有意間隔とも呼ばれる)と対照してマッピングされる有意係数(k)のマトリクスとすることができる。有意マトリクスに基づいて、データ・モデル生成器118は、1つ又は複数の第2の変数の対応する予測済み統計的集計値をマッピングすることによって、データ・モデルを決定する。データ・モデルの生成と同時に、今後の予測済みデータ値が決定される。   In one embodiment, the data model generator 118 generates a significance matrix based on the determined significance coefficient (k). The significance matrix may be a matrix of significance coefficients (k) that are mapped against a plurality of discrete intervals (also referred to as significance intervals) of one or more second variables. Based on the significance matrix, the data model generator 118 determines the data model by mapping the corresponding predicted statistical aggregate value of the one or more second variables. Simultaneously with the generation of the data model, future predicted data values are determined.

1つの実施例においては、FFVDモジュール220は、HDデータベース106に記憶されている過去に決定された予測済みデータ値、及びこうして生成されるデータ・モデルに基づいて、今後の予測済みデータ値を決定する。データ更新モジュール222は、さらなるデータ予測に向けて、HDデータベース106における今後の予測済みデータ値、生成済みデータ・モデル、及び予測に対応する実際値を動的に更新する。   In one embodiment, FFVD module 220 determines future predicted data values based on previously determined predicted data values stored in HD database 106 and the data model thus generated. To do. The data update module 222 dynamically updates future predicted data values, generated data models, and actual values corresponding to the predictions in the HD database 106 for further data prediction.

したがって、本開示は、すべての係数又は変数を考慮することによって予測中に起きるエラーを抑え、データ予測の効率を向上させる、事象に関するデータ予測に向けてのデータ・モデルを動的に生成する。   Accordingly, the present disclosure dynamically generates a data model for data prediction for events that suppresses errors that occur during prediction by considering all coefficients or variables and improves the efficiency of data prediction.

図3は、本開示のいくつかの実施例による、事象に関するデータ予測に向けてデータ・モデルを動的に生成する例示の方法の流れ図を示している。   FIG. 3 illustrates a flowchart of an exemplary method for dynamically generating a data model for data prediction regarding events according to some embodiments of the present disclosure.

図3に例示されているように、方法300は、事象に関するデータ予測に向けてデータ・モデルを動的に生成するための、プロセッサ110によって実装される1つ又は複数のブロックを含む。方法300は、コンピュータ実行可能命令の概括的な文脈において説明され得る。概して、コンピュータ実行可能命令は、特定の機能を行い、又は特定の抽象データ・タイプを実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造体、手順、モジュール、及び関数を含むことができる。   As illustrated in FIG. 3, the method 300 includes one or more blocks implemented by the processor 110 for dynamically generating a data model for data prediction regarding events. Method 300 may be described in the general context of computer-executable instructions. In general, computer-executable instructions can include routines, programs, objects, components, data structures, procedures, modules, and functions that perform particular functions or implement particular abstract data types.

方法300が説明されている順序は、限定と解釈すべきように意図されておらず、何らかの数の説明された方法ブロックが、方法300を実装する何らかの順序で組合せ可能である。加えて、個々のブロックは、本明細書に説明される主題の精神及び範囲から逸脱することなく、方法300から削除されてもよい。さらには、方法300は、何らかの適切なハードウェア、ソフトウェア、ファームウェア、又はそれらの組合せで実装可能である。   The order in which method 300 is described is not intended to be construed as limiting, and any number of the described method blocks can be combined in any order that implements method 300. In addition, individual blocks may be deleted from method 300 without departing from the spirit and scope of the subject matter described herein. Moreover, method 300 can be implemented in any suitable hardware, software, firmware, or combination thereof.

ブロック302で、過去のデータセットを受信する。1つの実施例においては、データ・モデリング・システム102は、HDデータベース106から複数の過去のデータセット208を受信する。複数の過去のデータセット208は、1つ又は複数の第1の変数に対応する1つ又は複数のデータ、及び1つ又は複数の第2の変数に関連するデータを含む。   At block 302, a past data set is received. In one embodiment, the data modeling system 102 receives multiple historical data sets 208 from the HD database 106. The plurality of past data sets 208 includes one or more data corresponding to the one or more first variables and data associated with the one or more second variables.

データを・モデリング・システム102が、例えば、特定の時間に特定の場所で取得された電力消費データの予測に関するエラー・データの過去のデータセットを受信する場合の例示するシナリオを考慮されたい。データ・モデリング・システム102は、種々の場所で種々の時間期間における電力消費を監視し、未使用のエネルギーを抑え、それによって、送電網運用の効率を向上させるように、電力消費データの予測中、こうして取得されるエラーを抑えるためのエラー・モデリングを目的とする。種々の場所でこれまでの時間中に取り込まれたエネルギー消費に関する実際のデータは、HDデータベース106に記憶される。さらには、対応する予測済みデータ、及び予測済みデータと実際のデータとの差により取得されるエラー・データが、HDデータベース106に記憶される。したがって、複数の過去のデータセットは、1つ又は複数の第1の変数(y)のデータとしてのエラー・データと、1つ又は複数の第2の変数(a、b)のデータとしての時間的、空間的/地理的データとを含む。1つの実例においては、HDデータベース106が、電力会社からのデータ、すなわち、2014年4月1日から4月3日までの24時間のエラー・データを含むことができ、データ・モデリング・システム102が、2014年4月8日午前2時における場所1での負荷を予測することができることを考慮されたい。   Consider an example scenario where the data modeling system 102 receives a historical data set of error data relating to, for example, prediction of power consumption data acquired at a particular location at a particular time. The data modeling system 102 is predicting power consumption data to monitor power consumption at various locations and at various time periods to reduce unused energy, thereby improving the efficiency of grid operation. It aims at error modeling to suppress the errors thus obtained. The actual data regarding energy consumption captured during the previous time at various locations is stored in the HD database 106. Furthermore, the corresponding predicted data and the error data acquired by the difference between the predicted data and the actual data are stored in the HD database 106. Accordingly, the plurality of past data sets include error data as data of one or more first variables (y) and time as data of one or more second variables (a, b). And spatial / geographic data. In one example, the HD database 106 may include data from a power company, ie, 24-hour error data from April 1, 2014 to April 3, 2014, and the data modeling system 102 However, consider that the load at location 1 at 2 am on April 8, 2014 can be predicted.

ブロック304で、統計的参照集計値を決定する。1つの実施例においては、SSVA114は、複数の過去のデータセット208の統計的参照集計値210を決定する。1つの実例においては、SSVA114は、1つ又は複数の第1の変数に関するデータに基づいて、複数の過去のデータセットの参照平均値(μr)を決定する。1つの態様においては、エラー・データの確立分布は、時間に沿ってグラフ的に決定される。例示されているように、過去のエラー・データの参照平均値μr、すなわち、μr=389MWが決定される。   At block 304, a statistical reference summary value is determined. In one embodiment, SSVA 114 determines a statistical reference aggregate value 210 for multiple historical data sets 208. In one example, SSVA 114 determines a reference average value (μr) for a plurality of past data sets based on data relating to one or more first variables. In one aspect, the probability distribution of error data is determined graphically over time. As illustrated, a reference average value μr of past error data, ie, μr = 389 MW, is determined.

ブロック306で、過去のデータセットをデータセット群に分類する。1つの実施例においては、データセット分類器116は、1つ又は複数の第2の変数に関するデータに基づいて、複数の過去のデータセット208を動的に分類する。データセット分類器116は、1つ又は複数の第2の変数を選択し、1つ又は複数の選択された第2の変数の境界値を決定する。境界値に基づいて、データセット分類器116は、複数の離散間隔値、及び複数の離散間隔値に対応するステップサイズを決定することを繰り返す。例示されているように、データセット分類器116は、複数のデータセット群、すなわち、3日間の午前2時における場所1でエラー・データを生成する。   At block 306, past data sets are classified into data sets. In one embodiment, the data set classifier 116 dynamically classifies a plurality of past data sets 208 based on data relating to one or more second variables. The data set classifier 116 selects one or more second variables and determines boundary values for the one or more selected second variables. Based on the boundary value, the data set classifier 116 repeats determining a plurality of discrete interval values and a step size corresponding to the plurality of discrete interval values. As illustrated, the data set classifier 116 generates error data at a plurality of data sets, ie, location 1 at 2 am for 3 days.

ブロック308で、各データセット群の統計的特定集計値を決定する。複数の分類されたデータセット群のそれぞれについて、SSVA114は、知られている技法を使用して、統計的特定集計値212を決定する。1つの実例においては、SSVA114は、1つ又は複数の第2の変数に関するデータに基づいて、複数の分類されたデータセット群のそれぞれの特定平均値(μ1)を決定する。例示のように、SSVA114は、3日間の午前2時における場所1でのエラー・データに基づいて、特定平均値μ1、すなわち、μ1=292MWを決定する。   At block 308, a statistically specific aggregate value for each data set group is determined. For each of the plurality of categorized data sets, SSVA 114 determines a statistical specific summary value 212 using known techniques. In one example, the SSVA 114 determines a specific average value (μ1) for each of a plurality of grouped data sets based on data relating to one or more second variables. As illustrated, SSVA 114 determines a specific average value μ1, ie μ1 = 292 MW, based on error data at location 1 at 2 am for 3 days.

ブロック310で、データ・モデルを生成する。1つの実施例においては、データ・モデル生成器118は、統計的参照集計値210と統計的特定集計値212とを比較し、比較に基づいて、統計的有意係数(k)を決定する。有意係数(k)は、統計的参照集計値210と統計的特定集計値212との間に実質的な差が存在するか否かに関して示す。kの値は、例えば、0から1の間とすることができる。データ・モデル生成器118が、実質的な差が存在することを決定した場合には、有意係数(k)は、1に等しく設定され、統計的特定集計値212が、予測済み統計的集計値として決定される。一方、データ・モデル生成器118が、実質的な差が存在しないことを決定した場合には、有意係数(k)は、0に等しく設定され、統計的参照集計値210が、予測済み統計的集計値として決定される。例示されているように、データ・モデル生成器118は、μrとμ1との有意差を決定し、そのため、有意係数kの値は、1に設定される。こうして決定される予測済み統計的集計値に基づいて、データ・モデル生成器118は、1つ又は複数の第2の変数の有意マトリクスを生成する。   At block 310, a data model is generated. In one embodiment, the data model generator 118 compares the statistical reference summary value 210 and the statistical specific summary value 212 and determines a statistical significance factor (k) based on the comparison. The significance coefficient (k) indicates whether there is a substantial difference between the statistical reference aggregate value 210 and the statistical specific aggregate value 212. The value of k can be between 0 and 1, for example. If the data model generator 118 determines that a substantial difference exists, the significance factor (k) is set equal to 1 and the statistical specific summary value 212 is the predicted statistical summary value. As determined. On the other hand, if the data model generator 118 determines that there is no substantial difference, the significance factor (k) is set equal to 0 and the statistical reference summary value 210 is the predicted statistical Determined as an aggregate value. As illustrated, the data model generator 118 determines a significant difference between μr and μ1, so the value of the significance coefficient k is set to 1. Based on the predicted statistical aggregate value thus determined, the data model generator 118 generates a significance matrix of one or more second variables.

1つの実施例においては、データ・モデル生成器118は、決定された有意係数(k)に基づいて、有意マトリクスを生成する。有意マトリクスは、1つ又は複数の第2の変数の複数の離散間隔(或いは、有意間隔とも呼ばれる)と対照してマッピングされる有意係数(k)のマトリクスとすることができる。例えば、第2の変数「a」は、時間的変数、例えば、一日のうちの時間、言わば午前1時又は2時とすることができ、「b」は、空間的変数、例えば、地理的場所1及び地理的場所2とすることができる。   In one embodiment, the data model generator 118 generates a significance matrix based on the determined significance coefficient (k). The significance matrix may be a matrix of significance coefficients (k) that are mapped against a plurality of discrete intervals (also referred to as significance intervals) of one or more second variables. For example, the second variable “a” may be a temporal variable, eg, time of day, so to say 1 or 2 am, and “b” is a spatial variable, eg, geographic. Can be location 1 and geographic location 2.

場所1で、午前2時における時間的変数は、こうして生成されるデータ・モデルにおいて有意間隔の高いことが留意され得る。   It can be noted that the temporal variable at 2 am at location 1 is highly significant in the data model thus generated.

有意マトリクスに基づいて、データ・モデル生成器118は、方程式(1)で下記に例示される1つ又は複数の第2の変数の対応する予測済み統計集計値をマッピングすることによって、データ・モデルを決定する。
y1=μr*(1−k)+μ1*k (1)
Based on the significance matrix, the data model generator 118 maps the data model by mapping corresponding predicted statistical aggregate values of one or more second variables exemplified below in equation (1). To decide.
y1 = μr * (1−k) + μ1 * k (1)

データ・モデルの生成と同時に、今後の予測済みデータ値が決定される。1つの実施例においては、FFVDモジュール220は、HDデータベース106に記憶されている過去に決定された予測済みデータ値、及びこうして生成されるエラーのデータ・モデルに基づいて、今後の予測済みデータ値を決定する。   Simultaneously with the generation of the data model, future predicted data values are determined. In one embodiment, the FFVD module 220 may determine future predicted data values based on previously determined predicted data values stored in the HD database 106 and the error data model thus generated. To decide.

従来のデータ・モデルの結果と提案されたデータ・モデルの結果との比較の例示が、下記に示されている。   An illustration of a comparison of the results of the conventional data model with the results of the proposed data model is given below.

次いで、データ更新モジュール222は、さらなるデータ予測に向けて、HDデータベース106における今後の予測済みデータ値、生成済みデータ・モデルを動的に更新する。   The data update module 222 then dynamically updates future predicted data values and generated data models in the HD database 106 for further data prediction.

図4は、本開示に従う実施例を実装するための例示のコンピュータ・システムのブロック図である。   FIG. 4 is a block diagram of an exemplary computer system for implementing embodiments in accordance with the present disclosure.

コンピュータ・システム401の変形例は、本開示の特徴を実装するのに利用され得るコンピューティング・システムをすべて実装するのに使用され得る。コンピュータ・システム401は、中央処理装置(「CPU」、「プロセッサ」)402を備えることができる。プロセッサ402は、ユーザ生成又はシステム生成の要求を実行するためのプログラム・コンポーネントを実行するための少なくとも1つのデータ・プロセッサを備えることができる。プロセッサは、統合型システム(バス)コントローラ、メモリ管理制御装置、浮動小数点演算装置、グラフィックス処理装置、デジタル信号処理装置などの専用処理装置を含むことができる。プロセッサ402は、AMD Athlon、Duron又はOpteron、ARMのアプリケーション、埋込み型プロセッサ又はセキュア・プロセッサ、IBM PowerPC、IntelのCore、Itanium、Xeon、Celeron、又は他の系統のプロセッサなど、マイクロプロセッサを含むことができる。プロセッサ402は、メインフレーム、分散型プロセッサ、マルチコア、パラレル、グリッド、又は他のアーキテクチャを使用して実装可能である。いくつかの実施例は、特定用途向け集積回路(ASIC:application−specific integrated circuit)、デジタル信号プロセッサ(DSP:digital signal processor)、フィールド・プログラマブル・ゲート・アレイ(FPGA:Field Programmable Gate Array)などのような埋込み型技術を利用することができる。   Variations of computer system 401 may be used to implement any computing system that can be utilized to implement the features of the present disclosure. The computer system 401 can include a central processing unit (“CPU”, “processor”) 402. The processor 402 may comprise at least one data processor for executing program components for executing user-generated or system-generated requests. The processor may include a dedicated processing device such as an integrated system (bus) controller, a memory management controller, a floating point arithmetic unit, a graphics processing unit, a digital signal processing unit. Processor 402 may include a microprocessor, such as an AMD Athlon, Duron or Opteron, ARM application, embedded or secure processor, IBM PowerPC, Intel Core, Itanium, Xeon, Celeron, or other family of processors. it can. The processor 402 can be implemented using a mainframe, distributed processor, multi-core, parallel, grid, or other architecture. Some examples include application-specific integrated circuits (ASICs), digital signal processors (DSPs), field programmable gate arrays (FPGAs, etc.). Such embedded technology can be used.

プロセッサ402は、I/Oインターフェース403を介して1つ又は複数の入力/出力(I/O)デバイスと通じて配置可能である。I/Oインターフェース403は、限定はしないが、オーディオ、アナログ、デジタル、モノラル、RCA、ステレオ、IEEE−1394、シリアル・バス、ユニバーサル・シリアル・バス(USB:universal serial bus)、赤外線、PS/2、BNC、同軸、構成要素、複合物、デジタル・ビジュアル・インターフェース(DVI:digital visual interface)、高精細度マルチメディア・インターフェース(HDMI(登録商標):high−definition multimedia interface)、RFアンテナ、S−Video、VGA、IEEE802.n/b/g/n/x、Bluetooth(登録商標)、セルラ(例えば、符号分割多元接続(DCMA:code−division multiple access)、高速パケット接続(HSPA+:high−speed packet access)、グローバル・システム・フォー・モバイル・コミュニケーションズ(GSM(登録商標):global system for mobile communications)、ロングターム・エボリューション(LTE:long−term evolution)、又はWiMaxなど)などの通信プロトコル/方法を採用することができる。   The processor 402 can be placed in communication with one or more input / output (I / O) devices via an I / O interface 403. The I / O interface 403 includes, but is not limited to, audio, analog, digital, monaural, RCA, stereo, IEEE-1394, serial bus, universal serial bus (USB: universal serial bus), infrared, PS / 2 , BNC, coaxial, component, composite, digital visual interface (DVI), high definition multimedia interface (HDMI (registered trademark): high-definition multimedia interface), RF antenna, S- Video, VGA, IEEE802. n / b / g / n / x, Bluetooth (registered trademark), cellular (for example, code-division multiple access (DCMA), high-speed packet access (HSPA +), global system) Communication protocols / methods such as Four Mobile Communications (GSM (registered trademark): global system for communications), Long Term Evolution (LTE), WiMax, etc. can be adopted.

I/Oインターフェース403を使用して、コンピュータ・システム401は、1つ又は複数のI/Oデバイスと通信することができる。例えば、入力デバイス404は、アンテナ、キーボード、マウス、ジョイスティック、(赤外線)遠隔制御部、カメラ、カード・リーダ、ファックス機、ドングル、バイオメトリック・リーダ、マイクロフォン、タッチ画面、タッチパッド、トラックボール、センサ(例えば、加速度計、光センサ(light sensor)、GPS、ジャイロスコープ、又は近接センサなど)、スタイラス、スキャナ、記憶デバイス、送受信器、ビデオ・デバイス/ソース、バイザなどとすることができる。出力デバイス405は、プリンタ、ファックス機、ビデオ・ディスプレイ(例えば、陰極線管(CRT:cathode ray tube)、液晶ディスプレイ(LCD:liquid crystal display)、発光ダイオード(LED:light−emitting diode)、又はプラズマなど)、オーディオ・スピーカなどとすることができる。いくつかの実施例においては、送受信器406は、プロセッサ402と接続して配置可能である。送受信器は、様々なタイプのワイヤレス送信、又はワイヤレス受信を容易にすることができる。例えば、送受信器は、IEEE802.11a/b/g/n、Bluetooth(登録商標)、FM、グローバル・ポジショニング・システム(GPS:global positioning system)、2G/3GのHSDPA/HSUPA通信などを提供する送受信器チップ(例えば、Texas Instruments WiLink WL1283、Broadcom BCM4750IUB8、又はInfineon Technologies X−Gold618−PMB9800など)に動作可能なように接続されているアンテナを含むことができる。   Using the I / O interface 403, the computer system 401 can communicate with one or more I / O devices. For example, the input device 404 includes an antenna, keyboard, mouse, joystick, (infrared) remote control unit, camera, card reader, fax machine, dongle, biometric reader, microphone, touch screen, touch pad, trackball, sensor (Eg, accelerometer, light sensor, GPS, gyroscope, or proximity sensor), stylus, scanner, storage device, transceiver, video device / source, visor, etc. The output device 405 includes a printer, a fax machine, a video display (for example, a cathode ray tube (CRT), a liquid crystal display (LCD), a light-emitting diode (LED), or a plasma. ), Audio speakers and the like. In some embodiments, the transceiver 406 can be placed in connection with the processor 402. The transceiver can facilitate various types of wireless transmission or reception. For example, the transmitter / receiver provides IEEE802.11a / b / g / n, Bluetooth (registered trademark), FM, global positioning system (GPS), 2G / 3G HSDPA / HSUPA communication, etc. May include an antenna operably connected to the instrument chip (e.g., Texas Instruments WiLink WL1283, Broadcom BCM4750IUB8, or Infineon Technologies X-Gold 618-PMB9800).

いくつかの実施例においては、プロセッサ402は、ネットワーク・インターフェース407を介して通信ネットワーク408と通じて配置可能である。ネットワーク・インターフェース407は、通信ネットワーク408と通信することができる。ネットワーク・インターフェース407は、直接接続、Ethernet(登録商標)(例えば、ツイスト・ペア10/40/400Base−T)、伝送制御プロトコル/インターネット・プロトコル(TCP/IP:transmission control protocol/internet protocol)、トークン・リング、IEEE802.11a/b/g/n/xなどを限定ではなく含んだ接続プロトコルを採用することができる。通信ネットワーク408は、限定はしないが、直接相互接続、ローカル・エリア・ネットワーク(LAN:local area network)、広域ネットワーク(WAN:wide area network)、ワイヤレス・ネットワーク(例えば、Wireless Application Protoclを使用して)、Internetなどを含むことができる。ネットワーク・インターフェース407及び通信ネットワーク408を使用して、コンピュータ・システム401は、デバイス409、410、及び411と通信することができる。これらのデバイスは、パーソナル・コンピュータ、サーバ、ファックス機、プリンタ、スキャナ、セルラ電話機などの様々なモバイル・デバイス、スマートフォン(例えば、Apple iPhone(登録商標)、Blackberry、Android方式の電話機など)、タブレット・コンピュータ、eBookリーダ(Amazon Kindle、Nookなど)、ラップトップ・コンピュータ、ノートブック、又はゲーム用コンソール(Microsoft Xbox、Nintendo DS、Sony PlayStationなど)などを限定ではなく含むことができる。いくつかの実施例においては、コンピュータ・システム401はそれ自体、これらのデバイスのうちの1つ又は複数を具現化することができる。   In some embodiments, the processor 402 can be placed in communication with the communication network 408 via the network interface 407. The network interface 407 can communicate with the communication network 408. The network interface 407 includes a direct connection, Ethernet (registered trademark) (for example, twisted pair 10/40 / 400Base-T), transmission control protocol / Internet protocol (TCP / IP), token A connection protocol including, but not limited to, ring, IEEE 802.11a / b / g / n / x, etc. may be employed. The communication network 408 may include, but is not limited to, using direct interconnection, a local area network (LAN), a wide area network (WAN), a wireless network (eg, Wireless Application Protocol). ), Internet, and the like. Using network interface 407 and communication network 408, computer system 401 can communicate with devices 409, 410, and 411. These devices include various mobile devices such as personal computers, servers, fax machines, printers, scanners, cellular phones, smartphones (eg Apple iPhone (registered trademark), Blackberry, Android phones, etc.), tablets, and the like. A computer, an eBook reader (such as Amazon Kindle, Nook), a laptop computer, a notebook, or a gaming console (Microsoft Xbox, Nintendo DS, Sony PlayStation, etc.) may be included without limitation. In some embodiments, the computer system 401 may itself implement one or more of these devices.

いくつかの実施例においては、プロセッサ402は、記憶インターフェース412を介して1つ又は複数のメモリ・デバイス(例えば、RAM413、ROM414など)と通じて配置可能である。記憶インターフェースは、シリアル・アドバンスド・テクノロジー・アタッチメント(SATA:serial advanced technology attachment)、統合ドライブ・エレクトロニクス(IDE:integrated drive electronics)、IEEE−1394、ユニバーサル・シリアル・バス(USB)、ファイバ・チャネル、小型コンピュータ・システム・インターフェース(SCSI:small computer systems interface)などの接続プロトコルを採用するメモリ・ドライブ、取外し可能ディスク・ドライブなどを限定ではなく含んだメモリ・デバイスに接続することができる。メモリ・ドライブは、ドラム、磁気ディスク・ドライブ、光磁気ドライブ、光ドライブ、リダンダント・アレイ・オブ・インディペンデント・ディスクス(RAID:redundant array of independent discs)、固体メモリ・デバイス、固体ドライブなどをさらに含むことができる。   In some embodiments, processor 402 may be placed in communication with one or more memory devices (eg, RAM 413, ROM 414, etc.) via storage interface 412. The storage interface includes serial advanced technology attachment (SATA), integrated drive electronics (IDE), IEEE-1394, universal serial bus (USB), fiber channel, small size It can be connected to memory devices including, but not limited to, memory drives, removable disk drives, etc. that employ connection protocols such as a computer system interface (SCSI: small computer systems interface). Memory drives include drums, magnetic disk drives, magneto-optical drives, optical drives, redundant array of independent disks (RAID), solid-state memory devices, solid-state drives, etc. Further can be included.

メモリ415は、オペレーティング・システム416、ユーザ・インターフェース・アプリケーション417、ウェブ・ブラウザ418、メール・サーバ419、メール・クライアント420、ユーザ/アプリケーション・データ421(例えば、本開示で論じられた任意のデータ変数若しくはデータ・レコード)などを限定ではなく含んだプログラム又はデータベース・コンポーネントの集合を記憶することができる。オペレーティング・システム416は、コンピュータ・システム401のリソース管理及び運用を容易にすることができる。オペレーティング・システムの実例としては、Apple Macintosh OS X、UNIX(登録商標)、Unix(登録商標)のようなシステム配布(例えば、Berkeley Software Distribution(BSD)、FreeBSD、NetBSD、OpenBSDなど)、Linux(登録商標)配布(例えば、Red Hat、Ubuntu、Kubuntuなど)、IBM OS/2、Microsoft Windows(登録商標)(XP、Vista/7/8など)、Apple iOS、Google Android、又はBlackberry OSなどが限定ではなく挙げられる。ユーザ・インターフェース417は、テキスト機能又はグラフィック機能を通じて、プログラム・コンポーネントの表示、実行、対話、操作、又は動作を容易にすることができる。例えば、ユーザ・インターフェースは、カーソル、アイコン、チェック・ボックス、メニュー、スクローラ、ウィンドウ、ウィジェットなど、コンピュータ・システム401に動作可能なように接続されているディスプレイ・システムにおいてコンピュータ対話インターフェース要素を提供することができる。グラフィカル・ユーザ・インターフェース(GUI:Graphical user interface)が、Apple Macintoshオペレーティング・システムのAqua、IBM OS/2、Microsoft Windows(登録商標)(例えば、Aero、Metroなど)、Unix(登録商標) X−Windows(登録商標)、又はウェブ・インターフェース・ライブラリ(例えば、ActiveX、Java(登録商標)、Java(登録商標)script、AJAX、HTML、Adobe Flashなど)などを限定ではなく含んで採用され得る。   Memory 415 includes operating system 416, user interface application 417, web browser 418, mail server 419, mail client 420, user / application data 421 (eg, any data variable discussed in this disclosure). Or a set of database components including but not limited to data records). The operating system 416 can facilitate resource management and operation of the computer system 401. Examples of operating systems include system distributions such as Apple Macintosh OS X, UNIX (registered trademark), Unix (registered trademark) (for example, Berkeley Software Distribution (BSD), FreeBSD, NetBSD, OpenBSD registered, LBSD, etc.) Trademark) distribution (for example, Red Hat, Ubuntu, Kubuntu, etc.), IBM OS / 2, Microsoft Windows (registered trademark) (XP, Vista / 7/8, etc.), Apple iOS, Google Android, etc. are limited to BlackberryOS. It is mentioned without. User interface 417 may facilitate display, execution, interaction, manipulation, or operation of program components through text or graphic functions. For example, the user interface provides computer interaction interface elements in a display system operatively connected to the computer system 401, such as a cursor, icon, check box, menu, scroller, window, widget, etc. Can do. A graphical user interface (GUI) is available for the Apple Macintosh operating system Aqua, IBM OS / 2, Microsoft Windows (registered trademark) (for example, Aero, Metro, etc.), Unix (registered trademark) ow X-W (Registered trademark), or a web interface library (for example, ActiveX, Java (registered trademark), Java (registered trademark) Script, AJAX, HTML, Adobe Flash, etc.) may be employed without limitation.

いくつかの実施例においては、配置コンピュータ・システム401は、プログラム・コンポーネントを記憶しているウェブ・ブラウザ418を実装することができる。ウェブ・ブラウザは、Microsoft Internet Explorer、Google Chrome、Mozilla Firefox、Apple Safariなど、ハイパーテキスト閲覧アプリケーションとすることができる。   In some embodiments, the deployment computer system 401 can implement a web browser 418 that stores program components. The web browser can be a hypertext viewing application such as Microsoft Internet Explorer, Google Chrome, Mozilla Firefox, Apple Safari, etc.

セキュアなウェブ・ブラウジングは、HTTPS(セキュア・ハイパーテキスト・トランスポート・プロトコル)、セキュア・ソケット・レイヤ(SSL:secure sockets layer)、Transport Layer Security(TLS)などを使用して提供され得る。ウェブ・ブラウザは、AJAX、DHTML、Adobe Flash、Java(登録商標)Script、Java(登録商標)、アプリケーション・プログラミング・インターフェース(API:application programming interface)などの機能を利用することができる。いくつかの実施例においては、コンピュータ・システム401は、プログラム・コンポーネントを記憶しているメール・サーバ419を実装することができる。メール・サーバは、Microsoft ExchangeなどのInternetメール・サーバとすることができる。メール・サーバは、ASP、ActiveX、ANSI C++/C#、Microsoft.NET、CGIスクリプト、Java(登録商標)、Java(登録商標)Script、PERL、PHP、Python、WebObjectsなどの機能を利用することができる。メール・サーバは、インターネット・メッセージ・アクセス・プトロコル(IMAP:internet message access protocol)、メッセージング・アプリケーション・プログラミング・インターフェース(MAPI:messaging application programming interface)、Microsoft Exchange、ポスト・オフィス・プロトコル(POP:post office protocol)、又はシンプル・メール・トランスファ・プロトコル(SMTP:simple mail transfer protocol)などの通信プロトコルを利用することができる。いくつかの実施例においては、コンピュータ・システム401は、プログラム・コンポーネントを記憶しているメール・クライアント420を実装することができる。メール・クライアントは、Apple Mail、Microsoft Entourage、Microsoft Outlook、Mozilla Thunderbirdなど、メール閲覧アプリケーションとすることができる。   Secure web browsing can be provided using HTTPS (Secure Hypertext Transport Protocol), Secure Sockets Layer (SSL), Transport Layer Security (TLS), and the like. The web browser can use functions such as AJAX, DHTML, Adobe Flash, Java (registered trademark) Script, Java (registered trademark), and an application programming interface (API). In some embodiments, the computer system 401 may implement a mail server 419 that stores program components. The mail server can be an Internet mail server such as Microsoft Exchange. The mail server is ASP, ActiveX, ANSI C ++ / C #, Microsoft. Functions such as NET, CGI script, Java (registered trademark), Java (registered trademark) Script, PERL, PHP, Python, and WebObjects can be used. The mail server includes an Internet message access protocol (IMAP), a messaging application programming interface (MAPI), a Microsoft Exchange, and a post office p protocol (PO). communication protocol such as simple mail transfer protocol (SMTP) or simple mail transfer protocol (SMTP). In some embodiments, the computer system 401 may implement a mail client 420 that stores program components. The mail client can be a mail viewing application such as Apple Mail, Microsoft Entourage, Microsoft Outlook, Mozilla Thunderbird.

いくつかの実施例においては、コンピュータ・システム401は、本開示に説明されるように、データ、変数、レコードなど、ユーザ/アプリケーション・データ421を記憶することができる。そのようなデータベースは、Oracle又はSybaseなどの耐故障型(fault-tolerant)の、関係型の、スケーラブルな、セキュアなデータベースとして実装可能である。或いは、そのようなデータベースは、アレイ、ハッシュ、リンクト・リスト、構造体、構造化テキスト・ファイル(例えば、XML)、テーブルなど、標準化されたデータ構造体を使用して、又はオブジェクト指向のデータベースとして(例えば、ObjectStore、Poet、Zopeなどを使用して)実装可能である。そのようなデータベースは、本開示で上述された様々なコンピュータ・システムの中に時には統合され、又は時には分散され得る。何らかのコンピュータ又はデータベース・コンポーネントの構造体及び動作が、何らかの運用上の組合せで、組み合わされても、統合されても、又は分散されてもよいことを理解されたい。   In some embodiments, the computer system 401 may store user / application data 421, such as data, variables, records, etc., as described in this disclosure. Such a database can be implemented as a fault-tolerant, relational, scalable, secure database such as Oracle or Sybase. Alternatively, such a database may use standardized data structures such as arrays, hashes, linked lists, structures, structured text files (eg, XML), tables, or as an object-oriented database. (E.g., using ObjectStore, Poet, Zope, etc.). Such databases may sometimes be integrated or sometimes distributed among the various computer systems described above in this disclosure. It should be understood that the structure and operation of any computer or database component may be combined, integrated or distributed in any operational combination.

上述されたように、モジュール206は、とりわけ、特定のタスクを行い、又は特定の抽象データ・タイプを実装するルーチン、プログラム、オブジェクト、コンポーネント、及びデータ構造体を含む。モジュール206はまた、動作命令に基づいて、信号を操作する信号プロセッサ、状態機械、論理回路、及び/又は何らかの他のデバイス若しくは構成要素として実装可能である。さらには、モジュール206は、1つ又は複数のハードウェア構成要素によって、処理装置によって実行されるコンピュータ可読命令によって、或いはそれらの組合せによって実装可能である。   As described above, module 206 includes routines, programs, objects, components, and data structures that perform particular tasks or implement particular abstract data types, among others. Module 206 may also be implemented as a signal processor, state machine, logic circuit, and / or some other device or component that manipulates signals based on operational instructions. Further, module 206 can be implemented by one or more hardware components, by computer readable instructions executed by a processing device, or a combination thereof.

例示されているステップは、示されている例示の実施例を説明するために提示されており、進行中の技術的開発が、特定の機能が行われる方式を変更するであろうことを期待すべきである。これらの実例は、限定ではなく、例示の目的として本明細書に提示されている。さらには、機能的構築ブロックの境界は、説明の便宜上、本明細書に任意に定義されている。代替の境界は、特定の機能及びその関係性が適切に行われる限り、定義され得る。代替例(本明細書に説明されるものの等価例、拡張例、変形例、逸脱例などを含む)は、本明細書に含まれている教示に基づいて当業者には明らかになるであろう。そのような代替例は、開示される実施例の範囲及び精神の範囲内に入る。また、語「備えている(comprising)」、「有する(having)」、「含んでいる(containing)」、及び「含んでいる(including)」、並びに他の類似の形は、これらの語のうちのいずれか1つに続く項目又は複数の項目は、そのような項目又は複数の項目の網羅的なリスト化であること、すなわち、リストされた項目又は複数の項目のみに限定することを意味していないという意味で等価であり、オープン・エンドであると意図される。また、本明細書において、及び添付の特許請求の範囲に使用されるとき、単数形「a」、「an」、及び「the」は、文脈が明瞭に別の形で指示しない限り、複数参照記号を含むことにも留意しなくてはならない。   The illustrated steps are presented to illustrate the illustrated exemplary embodiment, and expect that ongoing technical development will change the way in which specific functions are performed. Should. These examples are presented herein for purposes of illustration and not limitation. Furthermore, the boundaries of functional building blocks are arbitrarily defined herein for convenience of explanation. Alternative boundaries can be defined as long as a particular function and its relationships are performed appropriately. Alternatives (including equivalents, extensions, variations, deviations, etc. of those described herein) will be apparent to those skilled in the art based on the teachings contained herein. . Such alternatives fall within the scope and spirit of the disclosed embodiments. Also, the words “comprising”, “having”, “containing” and “including”, as well as other similar forms, An item or items following any one of them means an exhaustive listing of such items or items, ie limiting to only the listed item or items Are equivalent in the sense that they are not, and are intended to be open-ended. Also, as used herein and in the appended claims, the singular forms “a”, “an”, and “the” have the plural references unless the context clearly dictates otherwise. It must also be noted that symbols are included.

さらには、1つ又は複数のコンピュータ可読記憶媒体は、本開示に従う実施例を実装する際に利用され得る。コンピュータ可読記憶媒体は、プロセッサによって読むことが可能な情報又はデータが記憶され得る任意のタイプの物理メモリを示す。したがって、コンピュータ可読記憶媒体は、本明細書に説明される実施例に従うステップ又は段階をプロセッサに行わせるための命令を含んだ、1つ又は複数のプロセッサによって実行するための命令を記憶することができる。用語「コンピュータ可読媒体(computer−readable medium)」は、有形の品目を含み、且つ搬送波及び過渡信号を含まないと理解すべきであり、すなわち、非一時的である。実例としては、ランダム・アクセス・メモリ(RAM:random access memory)、読取り専用メモリ(ROM:read−only memory)、揮発性メモリ、不揮発性メモリ、ハード・ドライブ、CD ROM、DVD、フラッシュ・メモリ、ディスク、及び任意の他の知られている物理記憶媒体が挙げられる。   Further, one or more computer readable storage media may be utilized in implementing embodiments in accordance with the present disclosure. Computer-readable storage media refers to any type of physical memory that can store information or data readable by a processor. Accordingly, a computer readable storage medium may store instructions for execution by one or more processors, including instructions for causing a processor to perform steps or stages according to embodiments described herein. it can. The term “computer-readable medium” should be understood to include tangible items and not to include carrier waves and transient signals, ie, non-transitory. Examples include random access memory (RAM), read-only memory (ROM), volatile memory, non-volatile memory, hard drive, CD ROM, DVD, flash memory, Discs, and any other known physical storage media.

本開示及び実例は、例示としてのみ考慮され、開示される実施例の真の範囲及び精神は、添付の特許請求の範囲によって示されていることが意図される。   It is intended that the present disclosure and examples be considered as exemplary only, with the true scope and spirit of the disclosed embodiments being indicated by the appended claims.

100 システム
102 データ・モデリング・システム
104、104−1、104−2、…、104−N センサ
106 HDデータベース
108 通信ネットワーク
110 中央処理装置、CPU、プロセッサ
112 メモリ
114 統計的集計値分析器(SSVA)
116 データセット分類器
118 データ・モデル生成器
202 I/Oインターフェース
204 データ
206 モジュール
208 過去のデータセット
210 統計的参照集計値
212 統計的特定集計値
214 有意マトリクス
216 有意間隔
218 他のデータ
220 今後の予測値決定(FFVD)モジュール
222 データ更新モジュール
224 他のモジュール
401 コンピュータ・システム
402 中央処理装置、CPU、プロセッサ
403 I/Oインターフェース
404 入力デバイス
405 出力デバイス
406 送受信器
407 ネットワーク・インターフェース
408 通信ネットワーク
409 デバイス
410 デバイス
411 デバイス
412 記憶インターフェース
413 RAM
414 ROM
415 メモリ
416 オペレーティング・システム
417 ユーザ・インターフェース
418 ウェブ・ブラウザ
419 メール・サーバ
420 メール・クライアント
421 ユーザ/アプリケーション・データ
DESCRIPTION OF SYMBOLS 100 System 102 Data modeling system 104, 104-1, 104-2, ..., 104-N sensor 106 HD database 108 Communication network 110 Central processing unit, CPU, processor 112 Memory 114 Statistical total value analyzer (SSVA)
116 Data Set Classifier 118 Data Model Generator 202 I / O Interface 204 Data 206 Module 208 Historical Data Set 210 Statistical Reference Aggregation Value 212 Statistical Specific Aggregation Value 214 Significant Matrix 216 Significant Interval 218 Other Data 220 Future Data Predictive Value Determination (FFVD) Module 222 Data Update Module 224 Other Module 401 Computer System 402 Central Processing Unit, CPU, Processor 403 I / O Interface 404 Input Device 405 Output Device 406 Transceiver 407 Network Interface 408 Communication Network 409 Device 410 device 411 device 412 storage interface 413 RAM
414 ROM
415 Memory 416 Operating System 417 User Interface 418 Web Browser 419 Mail Server 420 Mail Client 421 User / Application Data

Claims (12)

事象に関するデータ予測に向けてデータ・モデルを動的に生成するための方法であって、
データ・モデリング・システムのプロセッサによって、過去のデータ(HD:historic data)データベースから複数の過去のデータセットを受信するステップであって、前記複数の過去のデータセットが、データ予測に関連する1つ又は複数の第1及び第2の変数に対応するデータを含む、ステップ、
前記複数の過去のデータセットの統計的参照集計値を決定するステップ、
前記複数の過去のデータセットの前記1つ又は複数の第2の変数を選択し、当該選択に基づいて前記1つ又は複数の第2の変数の境界値を決定するステップ、
前記境界値に基づいて、前記1つ又は複数の第2の変数の複数の離散間隔値及び前記複数の離散間隔値に対応するステップサイズを繰り返し決定するステップ、
前記複数の離散間隔値及びステップサイズに基づいて、前記1つ又は複数の第2の変数の前記複数のデータセット群を生成するステップ、
前記生成された複数のデータセット群のそれぞれの統計的特定集計値を決定するステップ、並びに
前記統計的参照集計値と前記統計的特定集計値との比較に基づいて、前記生成された複数のデータセット群のデータ・モデルを生成するステップ
を含む方法
A method for dynamically generating a data model for predicting data about an event, comprising:
Receiving a plurality of past data sets from a historical data (HD) database by a processor of the data modeling system, wherein the plurality of past data sets are associated with data prediction; Or comprising data corresponding to a plurality of first and second variables,
Determining a statistical reference aggregate value of the plurality of past data sets;
Selecting the one or more second variables of the plurality of past data sets and determining a boundary value of the one or more second variables based on the selection;
Repetitively determining a plurality of discrete interval values of the one or more second variables and a step size corresponding to the plurality of discrete interval values based on the boundary value;
Generating the plurality of data sets of the one or more second variables based on the plurality of discrete interval values and a step size;
Determining respective statistical particular aggregate values of a plurality of data set groups the generated, and based on the comparison of the statistical particular aggregate value and the statistical reference aggregate value, the plurality of data the generated steps including how to generate a data model of the set group.
前記データ・モデルを生成するステップが、
前記複数の過去のデータセットの前記統計的参照集計値と前記生成された複数のデータセット群の前記統計的特定集計値とを比較するステップ、
前記統計的参照集計値と前記統計的特定集計値との差が実質的であるかどうかを決定するステップ、
前記決定に基づいて、前記統計的参照集計値及び前記統計的特定集計値のうちの一方を予測済み統計的集計値として推定するステップ、
こうして推定される前記予測済み統計的集計値に基づいて、前記1つ又は複数の第2の変数の有意マトリクスを決定するステップ、並びに
こうして決定される前記有意マトリクスに基づいて、前記データ・モデルを生成するステップ
を含む、請求項1に記載の方法。
Generating the data model comprises:
Comparing the statistical reference aggregate value of the plurality of past data sets with the statistical specific aggregate value of the generated plurality of data sets;
Determining whether a difference between the statistical reference summary value and the statistical specific summary value is substantial;
Estimating one of the statistical reference aggregate value and the statistical specific aggregate value as a predicted statistical aggregate value based on the determination;
Determining a significance matrix of the one or more second variables based on the predicted statistical aggregate value thus estimated, and based on the significance matrix determined in this way, the data model The method of claim 1, comprising generating.
前記HDデータベースに記憶されている前記生成済みデータ・モデル、及び過去に決定された予測済みデータ値に基づいて、今後の予測済みデータ値を決定するステップをさらに含む、請求項1に記載の方法。   The method of claim 1, further comprising determining a future predicted data value based on the generated data model stored in the HD database and a previously determined predicted data value. . さらなるデータ予測に向けて、前記HDデータベースにおける今後の予測済みデータ値、前記生成済みデータ・モデルを動的に更新するステップをさらに含む、請求項1に記載の方法。   The method of claim 1, further comprising dynamically updating future predicted data values in the HD database, the generated data model, for further data prediction. 事象に関するデータ予測に向けてデータ・モデルを動的に生成するためのシステムであって、
プロセッサ、
前記プロセッサと結合され、データ予測に関連する1つ又は複数の第1及び第2の変数に対応するデータを含む複数の過去のデータセットを記憶するように構成された過去のデータ(HD:historic data)データベース、並びに
前記プロセッサと通じて配置され、プロセッサ実行可能命令を記憶するメモリであって、前記命令が、
前記HDデータベースから複数の過去のデータセットを受信し、
前記複数の過去のデータセットの統計的参照集計値を決定し、
前記複数の過去のデータセットの前記1つ又は複数の第2の変数を選択し、当該選択に基づいて前記1つ又は複数の第2の変数の境界値を決定し、
前記境界値に基づいて、前記1つ又は複数の第2の変数の複数の離散間隔値及び前記複数の離散間隔値に対応するステップサイズを繰り返し決定し、
前記複数の離散間隔値及びステップサイズに基づいて、前記1つ又は複数の第2の変数の前記複数のデータセット群を生成し、
前記生成された複数のデータセット群のそれぞれの統計的特定集計値を決定し、
前記統計的参照集計値と前記統計的特定集計値との比較に基づいて、前記生成された複数のデータセット群のデータ・モデルを生成する
ための命令を含む、メモリ
を備るシステム。
A system for dynamically generating a data model for data prediction about events,
Processor,
Past data (HD) that is coupled to the processor and configured to store a plurality of past data sets including data corresponding to one or more first and second variables related to data prediction. data) a database, as well as a memory arranged in communication with the processor and storing processor executable instructions, wherein the instructions are:
Receiving a plurality of past data sets from the HD database;
Determining a statistical reference aggregate value of the plurality of historical data sets;
Selecting the one or more second variables of the plurality of past data sets and determining a boundary value of the one or more second variables based on the selection;
Repetitively determining a plurality of discrete interval values of the one or more second variables and a step size corresponding to the plurality of discrete interval values based on the boundary value;
Generating the plurality of data sets of the one or more second variables based on the plurality of discrete interval values and step sizes;
Determining each statistically specific aggregate value of the plurality of data sets generated;
A system comprising a memory, including instructions for generating a data model of the plurality of generated data sets based on a comparison between the statistical reference aggregate value and the statistical specific aggregate value.
前記プロセッサが、
前記複数の過去のデータセットの前記統計的参照集計値と前記生成された複数のデータセット群の前記統計的特定集計値とを比較するステップ、
前記統計的参照集計値と前記統計的特定集計値との差が実質的であるかどうかを決定するステップ、
前記決定に基づいて、前記統計的参照集計値及び前記統計的特定集計値のうちの一方を予測済み統計的集計値として推定するステップ、
こうして推定される前記予測済み統計的集計値に基づいて、前記1つ又は複数の第2の変数の有意マトリクスを決定するステップ、並びに
こうして決定される前記有意マトリクスに基づいて、前記データ・モデルを生成するステップ
によって前記データ・モデルを生成するように構成されている、請求項に記載のシステム。
The processor is
Comparing the statistical reference aggregate value of the plurality of past data sets with the statistical specific aggregate value of the generated plurality of data sets;
Determining whether a difference between the statistical reference summary value and the statistical specific summary value is substantial;
Estimating one of the statistical reference aggregate value and the statistical specific aggregate value as a predicted statistical aggregate value based on the determination;
Determining a significance matrix of the one or more second variables based on the predicted statistical aggregate value thus estimated, and based on the significance matrix determined in this way, the data model The system of claim 5 , wherein the system is configured to generate the data model by generating.
前記プロセッサが、前記HDデータベースに記憶されている前記生成済みデータ・モデル及び過去に決定された予測済みデータ値に基づいて、今後の予測済みデータ値を決定するようにさらに構成されている、請求項に記載のシステム。 The processor is further configured to determine a future predicted data value based on the generated data model and a previously determined predicted data value stored in the HD database. Item 6. The system according to Item 5 . 前記プロセッサが、さらなるデータ予測に向けて、前記HDデータベースにおける今後の予測済みデータ値、前記生成済みデータ・モデルを動的に更新するようにさらに構成されている、請求項に記載のシステム。 6. The system of claim 5 , wherein the processor is further configured to dynamically update future predicted data values in the HD database, the generated data model, for further data prediction. 命令が記憶された非一時的コンピュータ可読媒体であって、前記命令は、少なくとも1つのプロセッサ
過去のデータ(HD:historic data)データベースから複数の過去のデータセットを受信する行為であって、前記データセットが、データ予測に関連する1つ又は複数の第1及び第2の変数に対応するデータを含む、行為、
前記複数の過去のデータセットの統計的参照集計値を決定する行為、
前記複数の過去のデータセットの前記1つ又は複数の第2の変数を選択し、当該選択に基づいて前記1つ又は複数の第2の変数の境界値を決定する行為、
前記境界値に基づいて、前記1つ又は複数の第2の変数の複数の離散間隔値及び前記複数の離散間隔値に対応するステップサイズを繰り返し決定する行為、
前記複数の離散間隔値及びステップサイズに基づいて、前記1つ又は複数の第2の変数の前記複数のデータセット群を生成する行為、
前記生成された複数のデータセット群のそれぞれの統計的特定集計値を決定する行為、並びに
前記統計的参照集計値と前記統計的特定集計値との比較に基づいて、前記生成された複数のデータセット群のデータ・モデルを生成する行為
を行わせる、
非一時的コンピュータ可読媒体。
Instruction is a non-transitory computer readable medium having stored, which instructions, at least one processor,
An act of receiving a plurality of past data sets from a historical data (HD) database, wherein the data sets correspond to one or more first and second variables associated with data prediction. Actions, including data,
Determining a statistical reference aggregate value of the plurality of past data sets;
Selecting the one or more second variables of the plurality of past data sets and determining a boundary value of the one or more second variables based on the selection;
An act of repeatedly determining a plurality of discrete interval values of the one or more second variables and a step size corresponding to the plurality of discrete interval values based on the boundary value;
Generating the plurality of data sets of the one or more second variables based on the plurality of discrete interval values and step sizes;
Act of determining respective statistical particular aggregate values of a plurality of data set groups the generated, and based on the comparison of the statistical particular aggregate value and the statistical reference aggregate value, the plurality of data the generated The act of generating a data model for the set ,
To do ,
Non-transitory computer readable medium.
前記命令は、さらに前記少なくとも1つのプロセッサに、
前記複数の過去のデータセットの前記統計的参照集計値と前記生成された複数のデータセット群の前記統計的特定集計値とを比較するステップ、
前記統計的参照集計値と前記統計的特定集計値との差が実質的であるかどうかを決定するステップ、
前記決定に基づいて、前記統計的参照集計値及び前記統計的特定集計値のうちの一方を予測済み統計的集計値として推定するステップ、
こうして推定される前記予測済み統計的集計値に基づいて、前記1つ又は複数の第2の変数の有意マトリクスを決定するステップ、並びに
こうして決定される前記有意マトリクスに基づいて、前記データ・モデルを生成するステップ
によって、前記データ・モデルを生成させる、請求項に記載の媒体。
The instructions to the at least one processor to the al,
Comparing the statistical reference aggregate value of the plurality of past data sets with the statistical specific aggregate value of the generated plurality of data sets;
Determining whether a difference between the statistical reference summary value and the statistical specific summary value is substantial;
Estimating one of the statistical reference aggregate value and the statistical specific aggregate value as a predicted statistical aggregate value based on the determination;
Determining a significance matrix of the one or more second variables based on the predicted statistical aggregate value thus estimated, and based on the significance matrix determined in this way, the data model The medium of claim 9 , wherein the generating step causes the data model to be generated.
前記命令は、さらに前記少なくとも1つのプロセッサに、前記HDデータベースに記憶されている前記生成済みデータ・モデル及び過去に決定された予測済みデータ値に基づいて、今後の予測済みデータ値を決定させる、請求項に記載の媒体。 The instructions are in the at least one processor al, based on the prediction Data value determined on the HD database on the generated Data models stored and past, determining the future prediction Data value The medium according to claim 9 . 前記命令は、さらに前記少なくとも1つのプロセッサに、さらなるデータ予測に向けて、前記HDデータベースにおける今後の予測済みデータ値、前記生成済みデータ・モデルを動的に更新させる、請求項に記載の媒体。 The instructions to the at least one processor to the al, for further data predicting the HD future predicted Data values in the database, to dynamically update the already generated data model, according to claim 9 Medium.
JP2016094474A 2015-05-11 2016-05-10 Method and system for dynamically generating a data model for data prediction Active JP6200032B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
IN2390/CHE/2015 2015-05-11
IN2390CH2015 2015-05-11

Publications (2)

Publication Number Publication Date
JP2016212883A JP2016212883A (en) 2016-12-15
JP6200032B2 true JP6200032B2 (en) 2017-09-20

Family

ID=57549732

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016094474A Active JP6200032B2 (en) 2015-05-11 2016-05-10 Method and system for dynamically generating a data model for data prediction

Country Status (1)

Country Link
JP (1) JP6200032B2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004068710A (en) * 2002-08-07 2004-03-04 Tokyo Gas Co Ltd Cogeneration device and its control method
JP4177228B2 (en) * 2003-10-24 2008-11-05 三菱電機株式会社 Prediction device
US8515719B2 (en) * 2009-01-14 2013-08-20 Hitachi, Ltd. Apparatus anomaly monitoring method and system
US9607343B2 (en) * 2013-08-30 2017-03-28 Hewlett Packard Enterprise Development Lp Generating a demand response for an energy-consuming facility

Also Published As

Publication number Publication date
JP2016212883A (en) 2016-12-15

Similar Documents

Publication Publication Date Title
US10728349B2 (en) Tru torrent platform methods, apparatuses and media
EP3525097A1 (en) Method and system for migrating applications into cloud platforms
US11321624B2 (en) Method and system for analyzing internet of things (IoT) data in real-time and providing predictions
EP3489828B1 (en) Method and system for resolving anomaly events occurring in a virtual environment in real-time
US10445696B2 (en) Methods and systems for orchestration of supply chain processes using internet of technology sensor's events
US9886370B2 (en) Method and system for generating a test suite
US20200026787A1 (en) METHOD, SYSTEM, AND FRAMEWORK FOR IMPLEMENTING INTERNET OF THINGS (IoT) APPLICATIONS
US20150186133A1 (en) Systems and methods for enterprise application portfolio management
US11113640B2 (en) Knowledge-based decision support systems and method for process lifecycle automation
US9703607B2 (en) System and method for adaptive configuration of software based on current and historical data
EP3091452B1 (en) Systems and methods for optimized implementation of a data warehouse on a cloud network
EP3404551B1 (en) Method and device for performing testing across a plurality of smart devices
US10452234B2 (en) Method and dashboard server providing interactive dashboard
US20160162522A1 (en) Systems and methods for detecting data leakage in an enterprise
US20140365393A1 (en) Transportation capacity augmentation program methods, apparatuses and media
US9910880B2 (en) System and method for managing enterprise user group
US20170006063A1 (en) Systems and Methods for Managing Performance of Identity Management Services
US20200134534A1 (en) Method and system for dynamically avoiding information technology operational incidents in a business process
US20160117786A1 (en) Residential pipeline platform methods, apparatuses, and media
JP6200032B2 (en) Method and system for dynamically generating a data model for data prediction
US20180367597A1 (en) Method and System of Sharing a File
WO2016107490A1 (en) Method and result summarizing apparatus for providing summary reports options on query results
US20170032029A1 (en) System and method for improving incident ticket classification
US20160048543A1 (en) System and method for determining governance effectiveness of knowledge management system
US9922126B2 (en) System and method for information technology infrastructure transformation

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170510

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170707

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170726

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170824

R150 Certificate of patent or registration of utility model

Ref document number: 6200032

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150