JP6457693B1 - 予測データ分析のためのシステムおよび技術 - Google Patents
予測データ分析のためのシステムおよび技術 Download PDFInfo
- Publication number
- JP6457693B1 JP6457693B1 JP2018187955A JP2018187955A JP6457693B1 JP 6457693 B1 JP6457693 B1 JP 6457693B1 JP 2018187955 A JP2018187955 A JP 2018187955A JP 2018187955 A JP2018187955 A JP 2018187955A JP 6457693 B1 JP6457693 B1 JP 6457693B1
- Authority
- JP
- Japan
- Prior art keywords
- model
- data
- predictive
- input data
- predictive modeling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5011—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Educational Administration (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本願は、2014年5月23日に出願され“Systems and Methods
for Predictive Data Analytics”と題された米国仮特許出願第62/002,469号(代理人管理番号DRB−001PR)の35 U.S.C. 119(e)のもとでの優先権および利益を主張するものであり、該米国仮特許出願は、適用法によって許容される最大の範囲まで参照により本明細書中に援用される。
データ分析者は、運営および評価データを含む、電子データから予測モデルを構築するために、分析技法および計算インフラストラクチャを使用することができる。データ分析者は、概して、予測モデルを構築するために、2つのアプローチのうちの1つを使用する。第1のアプローチを用いると、予測問題を取り扱う団体は、単純に、同一予測問題または類似予測問題のためにすでに開発されている、パッケージ化された予測モデル化ソリューションを使用する。本「大量生産」アプローチは、安価であるが、概して、比較的多数の団体に共通する少数の予測問題(例えば、不正検出、回転売買管理、市場応答等)のためのみに実行可能である。第2のアプローチを用いると、データ分析者のチームが、予測問題のためのカスタマイズされた予測モデル化ソリューションを構築する。本「専門家」アプローチは、概して、高価で時間がかかり、したがって、少数の高額予測問題に使用される傾向がある。
本開示の側面によると、予測問題のための予測モデルを選択するための方法が提供され、本方法は、少なくとも部分的に、予測問題の特性および/またはそれぞれのモデル化プロシージャの属性に基づいて、予測問題のための複数の予測モデル化プロシージャの好適性を判定するステップと、少なくとも部分的に、予測問題の選択されたモデル化プロシージャの判定された好適性に基づいて、予測モデル化プロシージャの少なくともサブセットを選択するステップと、命令を複数の処理ノードに伝送するステップであって、命令は、選択されたモデル化プロシージャの実行のために処理ノードのリソースを割り付ける、リソース割付スケジュールを備え、リソース割付スケジュールは、少なくとも部分的に、予測問題のための選択されたモデル化プロシージャの判定された好適性に基づく、ステップと、リソース割付スケジュールに従った複数の処理ノードによる選択されたモデル化プロシージャの実行の結果を受信するステップであって、結果は、選択されたモデル化プロシージャによって生成される予測モデル、および/または予測問題と関連付けられるデータのモデルのスコアを含む、ステップと、生成された予測モデルから、少なくとも部分的に予測モデルのスコアに基づいて、予測問題のための予測モデルを選択するステップとを含む。
本発明は、例えば、以下を提供する。
(項目1)
予測問題のための予測モデルを選択するための方法であって、前記方法は、
少なくとも部分的に、前記予測問題の特性および/またはそれぞれのモデル化プロシージャの属性に基づいて、前記予測問題のための複数の予測モデル化プロシージャの好適性を判定するステップと、
少なくとも部分的に、前記予測問題の前記選択されたモデル化プロシージャの前記判定された好適性に基づいて、前記予測モデル化プロシージャの少なくともサブセットを選択するステップと、
命令を複数の処理ノードに伝送するステップであって、前記命令は、前記選択されたモデル化プロシージャの実行のために前記処理ノードのリソースを割り付ける、リソース割付スケジュールを備え、前記リソース割付スケジュールは、少なくとも部分的に、前記予測問題のための前記選択されたモデル化プロシージャの前記判定された好適性に基づく、ステップと、
前記リソース割付スケジュールに従った前記複数の処理ノードによる前記選択されたモデル化プロシージャの前記実行の結果を受信するステップであって、前記結果は、前記選択されたモデル化プロシージャによって生成される予測モデル、および/または前記予測問題と関連付けられるデータの前記モデルのスコアを含む、ステップと、
前記生成された予測モデルから、少なくとも部分的に前記予測モデルの前記スコアに基づいて、前記予測問題のための予測モデルを選択するステップと、
を含む、方法。
(項目2)
前記予測問題のための前記複数の予測モデル化プロシージャの前記好適性を判定するステップは、前記予測問題の前記特性と排除されたプロシージャの前記属性との間の1つまたはそれを上回る関係に基づいて、考慮から少なくとも1つの予測モデル化プロシージャを排除するステップを含む、項目1に記載の方法。
(項目3)
前記予測問題のための前記複数の予測モデル化プロシージャの前記好適性を判定するステップは、前記予測問題の前記特性と少なくとも1つの予測モデル化プロシージャの前記属性との間の1つまたはそれを上回る関係に基づいて、好適性値を前記少なくとも1つの予測モデル化プロシージャに割り当てるステップを含む、項目1に記載の方法。
(項目4)
前記予測問題のための前記複数の予測モデル化プロシージャの前記好適性を判定するステップは、
少なくとも部分的に、前記予測問題の特性と前記1つまたはそれを上回る予測問題の特性との間の類似性に基づいて、1つまたはそれを上回る予測問題を選択するステップと、
少なくとも部分的に、第1の予測モデル化プロシージャと前記1つまたはそれを上回る予測モデル化プロシージャとの間の類似性に基づいて、1つまたはそれを上回る予測モデル化プロシージャを選択するステップと、
前記1つまたはそれを上回る予測モデル化プロシージャを前記1つまたはそれを上回る予測問題に適用することの結果を示す、データを処理するステップと、
を含む、
前記予測問題のための前記複数の予測モデル化プロシージャのうちの前記第1のものの好適性を判定するステップを含む、項目1に記載の方法。
(項目5)
少なくとも部分的に、前記予測問題の特性と前記1つまたはそれを上回る予測問題の特性との間の類似性に基づいて、前記1つまたはそれを上回る予測問題を選択するステップは、少なくとも部分的に、前記予測問題と関連付けられるデータの特性と前記1つまたはそれを上回る予測問題と関連付けられるデータの特性との間の類似性に基づいて、前記1つまたはそれを上回る予測問題を選択するステップを含む、項目4に記載の方法。
(項目6)
前記予測問題のための前記第1の予測モデル化プロシージャの前記好適性を判定するステップはさらに、少なくとも部分的に、前記第1のモデル化プロシージャおよび前記1つまたはそれを上回るモデル化プロシージャによって行われる処理ステップに基づいて、前記第1のモデル化プロシージャと前記1つまたはそれを上回るモデル化プロシージャとの間の前記類似性を判定するステップを含む、項目4に記載の方法。
(項目7)
前記1つまたはそれを上回るモデル化プロシージャを前記1つまたはそれを上回る予測問題に適用することの結果を示す、前記データを処理するステップは、前記1つまたはそれを上回るモデル化プロシージャを前記1つまたはそれを上回る予測問題に適用することの結果を示す前記データに、第2の予測モデル化プロシージャを適用することによって、前記予測問題のための前記第1の予測モデル化プロシージャの前記好適性を予測するステップを含む、項目4に記載の方法。
(項目8)
前記予測問題のインスタンスの成果を予測するために、前記選択された予測モデルを使用するステップであって、前記選択された予測モデルは、前記予測モデル化プロシージャのうちの第1のものによって生成される、ステップと、
少なくとも部分的に、前記予測された成果と前記予測問題の前記インスタンスの実際の成果との間の関係に基づいて、前記第1の予測モデル化プロシージャを前記予測問題に適用することの結果を示すデータを更新するステップと、
をさらに含む、項目7に記載の方法。
(項目9)
前記複数の予測モデル化プロシージャの前記好適性を判定するステップは、好適性スコアをそれぞれのモデル化プロシージャに割り当てるステップを含み、前記予測モデル化プロシージャの少なくともサブセットを選択するステップは、閾値好適性スコアを超える好適性スコアを有する、1つまたはそれを上回る予測モデル化プロシージャを選択するステップを含む、項目1に記載の方法。
(項目10)
少なくとも部分的に、前記選択されたモデル化プロシージャの実行のために利用可能な処理リソースの量に基づいて、前記閾値好適性スコアを判定するステップをさらに含む、項目9に記載の方法。
(項目11)
前記複数の予測モデル化プロシージャの前記好適性を判定するステップは、好適性スコアをそれぞれのモデル化プロシージャに割り当てるステップを含み、前記予測モデル化プロシージャの少なくともサブセットを選択するステップは、前記予測問題のための前記予測モデル化プロシージャのうちのいずれかに割り当てられる、最高好適性スコアの規定範囲内の好適性スコアを有する、1つまたはそれを上回る予測モデル化プロシージャを選択するステップを含む、項目1に記載の方法。
(項目12)
前記予測モデル化プロシージャの少なくともサブセットを選択するステップは、最高好適性スコアを有する、前記予測モデル化プロシージャのほぼ規定部分を選択するステップを含む、項目1に記載の方法。
(項目13)
前記予測モデル化プロシージャの少なくともサブセットを選択するステップは、少なくとも部分的にユーザ入力に基づいて、少なくとも1つの予測モデルを選択するステップを含む、項目1に記載の方法。
(項目14)
前記処理ノードの前記割り付けられたリソースは、前記処理ノードの実行サイクル、前記処理ノードの実行時間、および/または前記処理ノードのコンピュータ可読記憶装置を備える、項目1に記載の方法。
(項目15)
前記処理ノードは、1つまたはそれを上回るクラウドベースの処理ノードを備える、項目1に記載の方法。
(項目16)
前記選択されたモデル化プロシージャは、それぞれ、予測された問題の第1および第2の好適性を有すると判定される、第1および第2のモデル化プロシージャを備え、前記第1のモデル化プロシージャの前記第1の好適性は、前記第2のモデル化プロシージャの前記第2の好適性より大きく、前記リソース割付スケジュールは、少なくとも部分的に前記第1および第2の好適性に基づいて、前記処理ノードのリソースを前記第1および第2のモデル化プロシージャに割り付ける、項目1に記載の方法。
(項目17)
前記リソース割付スケジュールは、少なくとも部分的に、前記第2のモデルの前記第2の好適性より優れた前記第1のモデルの前記第1の好適性に基づいて、前記処理ノードリソースの一部を前記第1のモデル化プロシージャに、前記処理ノードリソースのより小さい部分を前記第2のモデル化プロシージャに割り付ける、項目16に記載の方法。
(項目18)
前記リソース割付スケジュールは、それぞれ、第1および第2の時間において、前記処理ノード上の前記第1および第2のモデル化プロシージャの実行をスケジュールに入れ、前記第2の時間は、少なくとも部分的に、前記第2のモデル化プロシージャの前記第2の好適性より優れた前記第1のモデル化プロシージャの前記第1の好適性に基づいて、前記第1の時間の後にある、項目16に記載の方法。
(項目19)
前記リソース割付スケジュールは、第1のデータセット上で前記第1のモデル化プロシージャを実行するために十分な前記処理ノードリソースの第1の部分を前記第1のモデル化プロシージャに割り付け、第2のデータセット上で前記第2のモデル化プロシージャを実行するために十分な前記処理ノードリソースの第2の部分を前記第2のモデル化プロシージャに割り付け、前記第2のデータセットは、前記第1のデータセットより小さい、項目16に記載の方法。
(項目20)
少なくとも部分的に、前記第1のモデル化プロシージャと関連付けられるメタデータに基づいて、前記第1のデータセット上で前記第1のモデル化プロシージャを実行するために十分な前記処理リソースの量を判定するステップをさらに含み、前記メタデータは、前記第1のモデル化プロシージャの処理リソース利用特性および/または並列性特性を示す、項目19に記載の方法。
(項目21)
前記選択されたモデル化プロシージャを実行するための時間的および/またはリソース予算を示す、予算データを受信するステップをさらに含み、前記リソース割付スケジュールは、前記時間的および/またはリソース予算に従って前記処理ノードのリソースを割り付ける、項目1に記載の方法。
(項目22)
前記選択された予測モデル化プロシージャの実行の結果は、前記生成されたモデルを前記予測問題と関連付けられる前記データの第1の部分に適合させ、前記予測問題と関連付けられる前記データの第2の部分で前記適合モデルを試験することの結果を含む、項目1に記載の方法。
(項目23)
前記選択された予測モデル化プロシージャによって生成される前記モデルを前記データの第1の部分に適合させるステップは、前記選択されたモデル化プロシージャの1つまたはそれを上回るパラメータ、および/もしくは前記生成されたモデルの1つまたはそれを上回るパラメータを調整するステップを含む、項目22に記載の方法。
(項目24)
前記選択された予測モデル化技法の実行の前記結果はさらに、前記予測問題と関連付けられる前記データの異なる層を使用して、前記生成されたモデルを交差検証することの結果を含む、項目22に記載の方法。
(項目25)
少なくとも部分的に前記選択されたモデルの前記スコアに基づいて、前記予測問題のための前記選択された予測モデル化プロシージャによって生成される予測モデルを選択するステップは、閾値スコアを超えるスコアを有するモデルを選択するステップを含む、項目1に記載の方法。
(項目26)
少なくとも部分的に前記選択されたモデルの前記スコアに基づいて、前記予測問題のための前記選択された予測モデル化プロシージャによって生成される予測モデルを選択するステップは、前記生成されたモデルのうちのいずれかの最高スコアの規定範囲内のスコアを有する、モデルを選択するステップを含む、項目1に記載の方法。
(項目27)
前記選択された予測モデル化プロシージャによって生成される前記モデルのうちの2つまたはそれを上回るものを組み合わせることによって、混合予測モデルを生成するステップと、前記混合予測モデルを評価するステップとをさらに含む、項目1に記載の方法。
(項目28)
前記選択された予測モデル化プロシージャによって生成される前記モデルの前記スコアを反復して受信するステップと、時間的および/またはリソース予算が使用される、もしくは生成されたモデルのスコアが閾値スコアを超えるまで、少なくとも部分的に前記スコアに基づいて、前記予測問題のための前記選択された予測モデル化プロシージャの前記好適性を再判定するステップとをさらに含む、項目1に記載の方法。
(項目29)
プロセッサ実行可能命令を記憶するように構成されるメモリと、
前記プロセッサ実行可能命令を実行するように構成されるプロセッサであって、前記プロセッサ実行可能命令を実行するステップは、前記装置に、
少なくとも部分的に、予測問題の特性および/またはそれぞれのモデル化プロシージャの属性に基づいて、前記予測問題のための複数の予測モデル化プロシージャの好適性を判定するステップと、
少なくとも部分的に、前記予測問題のための前記選択されたモデル化プロシージャの前記判定された好適性に基づいて、前記予測モデル化プロシージャの少なくともサブセットを選択するステップと、
命令を複数の処理ノードに伝送するステップであって、前記命令は、前記選択されたモデル化プロシージャの実行のために前記処理ノードのリソースを割り付ける、リソース割付スケジュールを備え、前記リソース割付スケジュールは、少なくとも部分的に、前記予測問題のための前記選択されたモデル化プロシージャの前記判定された好適性に基づく、ステップと、
前記リソース割付スケジュールに従った前記複数の処理ノードによる前記選択されたモデル化プロシージャの前記実行の結果を受信するステップであって、前記結果は、前記選択されたモデル化プロシージャによって生成される予測モデル、および/または前記予測問題と関連付けられるデータのための前記モデルのスコアを含む、ステップと、
前記生成された予測モデルから、少なくとも部分的に前記予測モデルの前記スコアに基づいて、前記予測問題のための予測モデルを選択するステップと、
を含む、方法を行わせる、プロセッサと、
を備える、予測モデル化装置。
(項目30)
少なくとも部分的に、予測問題の特性および/またはそれぞれのモデル化プロシージャの属性に基づいて、前記予測問題のための複数の予測モデル化プロシージャの好適性を判定するステップと、
少なくとも部分的に、前記予測問題のための前記選択されたモデル化プロシージャの前記判定された好適性に基づいて、前記予測モデル化プロシージャの少なくともサブセットを選択するステップと、
命令を複数の処理ノードに伝送するステップであって、前記命令は、前記選択されたモデル化プロシージャの実行のために前記処理ノードのリソースを割り付ける、リソース割付スケジュールを備え、前記リソース割付スケジュールは、少なくとも部分的に、前記予測問題のための前記選択されたモデル化プロシージャの前記判定された好適性に基づく、ステップと、
前記リソース割付スケジュールに従った前記複数の処理ノードによる前記選択されたモデル化プロシージャの前記実行の結果を受信するステップであって、前記結果は、前記選択されたモデル化プロシージャによって生成される予測モデル、および/または前記予測問題と関連付けられるデータのための前記モデルのスコアを含む、ステップと、
前記生成された予測モデルから、少なくとも部分的に前記予測モデルの前記スコアに基づいて、前記予測問題のための予測モデルを選択するステップと、
のために、その上に記憶されたコンピュータ可読命令を有する、製造品。
図1を参照すると、いくつかの実施形態では、予測モデル化システム100は、予測モデル化探索エンジン110と、ユーザインターフェース120と、予測モデル化技法のライブラリ130と、予測モデル展開エンジン140とを含む。探索エンジン110は、規定予測問題に好適な予測モデル化ソリューションを生成するように、予測モデル化検索空間を効率的に探索する(例えば、前処理ステップ、モデル化アルゴリズム、および後処理ステップの潜在的組み合わせ)ための検索技法(または「モデル化方法」)を実装してもよい。検索技法は、どの予測モデル化技法が予測問題のための好適な解決策を提供する可能性が高いかという初期評価を含んでもよい。いくつかの実施形態では、検索技法は、(例えば、データセットの増加する部分を使用する)検索空間の漸進的評価と、(例えば、一貫した測定基準を使用する)予測問題のための異なるモデル化ソリューションの好適性の一貫した比較とを含む。いくつかの実施形態では、検索技法は、以前の検索の結果に基づいて適応し、経時的に検索技法の有効性を向上させることができる。
予測モデル化技法のライブラリ130は、完全予測モデル化技法を符号化する機械実行可能テンプレートを含む。いくつかの実施形態では、機械実行可能テンプレートは、1つまたはそれを上回る予測モデル化アルゴリズムと、アルゴリズムとともに使用するために好適なゼロまたはそれを上回る前処理ステップと、アルゴリズムとともに使用するために好適なゼロまたはそれを上回る後処理ステップとを含む。アルゴリズム、前処理ステップ、および/または後処理ステップは、パラメータ化されてもよい。機械実行可能テンプレートは、データセットによって表される予測問題のための潜在的予測モデル化ソリューションを生成するように、データセットに適用されてもよい。
いくつかの実施形態では、一意の識別子(ID)が、モデル化要素(例えば、技法、タスク、およびサブタスク)に割り当てられてもよい。モデル化要素のIDは、モデル化要素のテンプレートと関連付けられるメタデータとして記憶されてもよい。いくつかの実施形態では、これらのモデル化要素IDは、1つまたはそれを上回るモデル化タスクもしくはサブタスクを共有するモデル化技法を効率的に実行するために使用されてもよい。モデル化技法を効率的に実行する方法は、以下でさらに詳細に説明される。
図2の実施例では、探索エンジン110によって生成されるモデル化結果は、モデル化タスクビルダ230、モデル化技法ビルダ220、およびモデル化方法ビルダ210にフィードバックされる。モデル化ビルダは、モデル化結果に基づいて、自動的に(例えば、統計的学習アルゴリズムを使用して)、または手動で(例えば、ユーザによって)適合されてもよい。例えば、モデル化方法ビルダ210は、モデル化結果において観察されるパターンに基づいて、および/またはデータ分析者の経験に基づいて、適合されてもよい。同様に、具体的モデル化技法を実行することからの結果は、これらの技法またはそれらの内側のタスクのデフォルト同調パラメータ値の自動もしくは手動調節を知らせてもよい。いくつかの実施形態では、モデル化ビルダの適合は、半自動であり得る。例えば、予測モデル化システム100は、方法、技法、および/またはタスクへの潜在的改良にフラグを付けてもよく、ユーザは、これらの潜在的改良を実装するかどうかを決定してもよい。
図3は、いくつかの実施形態による、予測問題のための予測モデルを選択するための方法300のフローチャートである。いくつかの実施形態では、方法300は、モデル化方法ライブラリ212の中のモデル化方法に対応してもよい。
上記で説明されるように、モデル化技法130のライブラリは、予測モデル化技法の間の類似性を査定するためのツールを含んでもよく、予測問題のライブラリは、予測問題の間の類似性を査定するためのツールを含んでもよい。探索エンジン110は、問題になっている予測モデル化プロシージャおよび予測問題に類似する予測モデル化プロシージャおよび予測問題を識別するために、これらのツールを使用してもよい。予測問題のための予測モデル化プロシージャの好適性を判定する目的で、探索エンジン110は、問題になっているモデル化プロシージャに最も類似するM個のモデル化プロシージャを選択する、問題になっているモデル化プロシージャに関する閾値類似性値を超える全てのモデル化プロシージャを選択する等してもよい。同様に、予測問題のための予測モデル化プロシージャの好適性を判定する目的で、探索エンジン110は、問題になっている予測問題に最も類似するN個の予測問題を選択する、問題になっている予測問題に関する閾値類似性値を超える全ての予測問題を選択する等してもよい。
図1に戻って、ユーザインターフェース120は、予測モデル化空間の検索を監視および/または誘導するためのツールを提供してもよい。これらのツールは、(例えば、データセットの中の問題のある変数を強調表示すること、データセットの中の変数の間の関係を識別すること等によって)予測問題のデータセットについての洞察、および/または検索の結果についての洞察を提供してもよい。いくつかの実施形態では、データ分析者は、例えば、モデル化ソリューションを評価して比較するために使用される測定基準を規定することによって、好適なモデル化ソリューションを認識するための基準を特定することによって等、検索を誘導するためにインターフェースを使用してもよい。したがって、ユーザインターフェースは、独自の生産性を向上させるために、および/または探索エンジン110の性能を向上させるために、分析者によって使用されてもよい。いくつかの実施形態では、ユーザインターフェース120は、リアルタイムで検索の結果を提示し、リアルタイムで(例えば、検索の範囲、または異なるモデル化ソリューションの評価の間のリソースの割付を調節するように)ユーザが検索を誘導することを可能にする。いくつかの実施形態では、ユーザインターフェース120は、同一の予測問題および/または関連予測問題に取り組む複数のデータ分析者の労力を調整するためのツールを提供する。
モデル展開エンジン140は、動作環境内で予測モデルを展開するためのツールを提供する。いくつかの実施形態では、モデル展開エンジン140は、展開された予測モデルの性能を監視し、性能データが展開されたモデルの性能を正確に反映するように、展開されたモデルを生成したモデル化技法と関連付けられる性能メタデータを更新する。
予測モデル化システム100は、任意の技能レベルで分析者の生産性を有意に向上させ、および/または所与の量のリソースを用いて達成可能な予測モデルの精度を有意に増加させてもよい。プロシージャを自動化することにより、作業負荷を低減させることができ、プロセスを体系化することにより、一貫性を強化して、分析者が一意の洞察を生成することにより多くの時間を費やすことを可能にすることができる。3つの共通シナリオ、すなわち、成果を予想すること、性質を予測すること、および測定を推論することが、これらの利点を例証する。
団体が成果を正確に予想することができる場合には、その挙動をより効果的に計画するとともに増進することができる。したがって、機械学習の一般的用途は、予想を生成するアルゴリズムを開発することである。例えば、多くの業界が、大規模で時間のかかるプロジェクトにおける費用を予測するという問題に直面する。
多くの分野で、団体は、生産プロセスの成果の不確実性に直面し、所与の一式の条件が出力の最終性質にどのように影響を及ぼすであろうかを予測したい。したがって、機械学習の一般的用途は、これらの性質を予測するアルゴリズムを開発することである。例えば、コンクリートは、最終構造性質が状況によって劇的に変動し得る、一般的な建築材料である。時間に伴うコンクリート性質の有意な変動およびその高度可変組成へのそれらの依存性により、第1の原則から開発されるモデルも従来の回帰モデルも、十分な予測精度を提供しない。
いくつかの測定は、他のものより行うことがはるかに高価であるため、団体は、より安価な測定基準をより高価なものの代わりに使うことを望み得る。したがって、機械学習の一般的用途は、より安価な測定の公知の出力から高価な測定の起こり得る出力を推論することである。例えば、「カール」は、紙製品がどのようにして平坦な形状から逸脱する傾向があるかを捕捉する性質であるが、典型的には、製品が完成した後のみ判断されることができる。したがって、製造中に容易に測定される機械的性質から紙のカールを推論できることは、所与のレベルの品質を達成する際に莫大な費用節約をもたらし得る。典型的な最終用途性質に関して、これらの性質と製造プロセス条件との間の関係は、よく理解されていない。
図5を参照すると、いくつかの実施形態では、予測モデル化システム500(例えば、予測モデル化システム100の実施形態)は、少なくとも1つのクライアントコンピュータ510と、少なくとも1つのサーバ550と、1つまたはそれを上回る処理ノード570とを含む。例証的構成は、例示的目的のためにすぎず、任意の数のクライアント510および/またはサーバ550があり得ることが意図される。
対照的に、機械学習モデルを構築して精緻化することは、中間のどこかで相互作用パターンを伴ってもよい。モデル化問題を設定することは、初期の一連の概念的に同期的なステップを伴ってもよい。しかし、ユーザが代替ソリューションを計算し始めるようにシステムに命令するとき、対応する計算の規模を理解するユーザは、即時応答を期待する可能性が低い。具体的には、遅延した結果の本期待は、相互作用の本段階を非同期的に見えさせる。
本明細書で提供される実施例は、別個のコンピュータ上に常駐するものとしてモジュール、または別個のコンピュータによって行われるものとして動作を説明した場合があるが、これらの構成要素の機能性は、単一のコンピュータ上で、または分散型様式において任意の多数のコンピュータ上で実装され得ることを理解されたい。上記の実施形態は、多数の方法のうちのいずれかで実装されてもよい。例えば、実施形態は、ハードウェア、ソフトウェア、またはそれらの組み合わせを使用して実装されてもよい。ソフトウェアで実装されるとき、ソフトウェアコードは、単一のコンピュータの中で提供されるか、または複数のコンピュータの間で分散されるかどうかに関わらず、任意の好適なプロセッサもしくはプロセッサの集合の上で実行されることができる。さらに、コンピュータは、ラックマウント式コンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、またはタブレットコンピュータ等のいくつかの形態のうちのいずれかで具現化され得ることを理解されたい。加えて、コンピュータは、携帯情報端末(PDA)、スマートフォン、または任意の好適な携帯用もしくは固定電子デバイスを含む、概してコンピュータと見なされないが好適な処理能力を伴う、デバイスで具現化されてもよい。そのようなコンピュータは、企業ネットワークまたはインターネットとして等、ローカルエリアネットワークもしくは広域ネットワークとしての形態を含む、任意の好適な形態の1つまたはそれを上回るネットワークによって相互接続されてもよい。そのようなネットワークは、任意の好適な技術に基づいてもよく、任意の好適なプロトコルに従って動作してもよく、無線ネットワーク、有線ネットワーク、または光ファイバネットワークを含んでもよい。
用語
本明細書で使用される表現法および用語は、説明の目的のためであり、限定的と見なされるべきではない。
均等物
このようにして、本発明の少なくとも1つの実施形態のいくつかの側面を説明したが、種々の変更、修正、および改良が、当業者に容易に想起されるであろうことを理解されたい。そのような変更、修正、および改良は、本開示の一部であることを意図し、かつ本発明の精神および範囲内であることを意図している。したがって、前述の説明および図面は、一例にすぎない。
Claims (90)
- 予測モデル化装置であって、前記予測モデル化装置は、
予測モデル化プロシージャを符号化する機械実行可能なモジュールを記憶するように構成されたメモリであって、前記予測モデル化プロシージャは、複数のタスクを含み、前記機械実行可能なモジュールは、前記タスク間の依存性を表す有向グラフを含み、前記複数のタスクは、少なくとも1つの前処理タスク、少なくとも1つのモデル適合タスク、および、少なくとも1つの後処理タスクを含む、メモリと、
前記機械実行可能なモジュールを実行するように構成された少なくとも1つのプロセッサと
を備え、前記機械実行可能なモジュールを実行することは、前記予測モデル化プロシージャを前記装置に行わせ、前記予測モデル化プロシージャを行うことは、
入力データを操作することであって、前記入力データに前記前処理タスクを行うことを含む、ことと、
前記モデル適合タスクを行うことであって、
前記前処理された入力データから訓練データおよび試験データを生成することと、
予測モデルを前記訓練データに適合させることと、
前記適合させられたモデルを前記試験データ上で試験することと
を含む、ことと、
前記後処理タスクを行うことと
を含み、
前記前処理された入力データは、少なくとも1つのデータセットを含み、前記訓練データを生成することは、前記データセットの第1のサブセットを取得することを含み、前記試験データを生成することは、前記データセットの第2のサブセットを取得することを含み、
前記予測モデル化プロシージャを行うことは、前記予測モデルの交差検証を行うことをさらに含み、
前記訓練データは、第1の訓練データであり、前記試験データは、第1の試験データであり、前記適合させられたモデルは、第1の適合させられたモデルであり、前記予測モデルの前記交差検証を行うことは、
(a)前記データセットから第2の訓練データおよび第2の試験データを生成することであって、前記第2の訓練データを生成することは、前記データセットの第3のサブセットを取得することを含み、前記第2の試験データを生成することは、前記データセットの第4のサブセットを取得することを含む、ことと、
(b)前記予測モデルを前記第2の訓練データに適合させることにより、第2の適合させられたモデルを取得することと、
(c)前記第2の適合させられたモデルを前記第2の試験データ上で試験することと
を含む、予測モデル化装置。 - 前記モデル適合タスクを行うことは、少なくとも第1のパーティションおよび第2のパーティションを含む複数のパーティションに前記データセットを分割することをさらに含む、請求項1に記載の予測モデル化装置。
- 複数のパーティションに前記データセットを分割することは、前記データセット内の各データアイテムをそれぞれのパーティションにランダムに割り当てることを含む、請求項2に記載の予測モデル化装置。
- 前記第1の訓練データは、前記データセットの前記第1のパーティションを含み、
前記第1の試験データは、前記第1のパーティションを除く、前記データセットの全パーティションを含み、
前記第2の訓練データは、前記データセットの前記第2のパーティションを含み、
前記第2の試験データは、前記第2のパーティションを除く、前記データセットの全パーティションを含む、請求項2に記載の予測モデル化装置。 - 前記第1の訓練データは、前記データセットの前記第1のパーティションのサブセットを含み、
前記第1の試験データは、前記第1のパーティションを除く、前記データセットの全パーティションのそれぞれのサブセットを含み、
前記第2の訓練データは、前記データセットの前記第2のパーティションのサブセットを含み、
前記第2の試験データは、前記第2のパーティションを除く、前記データセットの全パーティションのそれぞれのサブセットを含む、請求項2に記載の予測モデル化装置。 - 前記前処理された入力データは、第1のパーティションおよび第2のパーティションを含み、
前記データセットは、前記前処理された入力データの前記第1のパーティションを含み、
前記モデル適合タスクを行うことは、前記前処理された入力データの前記第2のパーティションを含むホールドアウトデータ上で前記第1および第2の適合させられたモデルを試験することをさらに含む、請求項1に記載の予測モデル化装置。 - いずれの予測モデルも、前記ホールドアウトデータに適合させられない、請求項6に記載の予測モデル化装置。
- 前記少なくとも1つのプロセッサは、前記予測モデルを再適合させ、前記再適合させられたモデルを展開するようにさらに構成されている、請求項1に記載の予測モデル化装置。
- 前記再適合させられたモデルを展開することは、予測問題のインスタンスを表す他のデータに前記再適合させられたモデルを適用することによって複数の予測を生成することを含み、前記入力データは、前記他のデータを含まない、請求項8に記載の予測モデル化装置。
- 前記再適合させられたモデルを展開することは、前記少なくとも1つのプロセッサがアクセス可能なメモリ内に前記再適合させられたモデルの状態をキャッシュ格納することを含む、請求項8に記載の予測モデル化装置。
- 前記再適合させられたモデルは、第1の表現を有し、前記再適合させられたモデルを展開することは、
前記再適合させられたモデルの第2の表現を生成すること
を含み、前記第2の表現は、1つ以上の条件付き規則のセットを含み、
前記再適合させられたモデルの前記第2の表現は、機械実行可能な表現であり、前記1つ以上の条件付き規則のセットは、1つ以上の機械実行可能なif−then文のセットを含む、請求項8に記載の予測モデル化装置。 - 前記入力データは、第1の入力データであり、前記再適合させられたモデルを展開することは、少なくとも部分的に第2の入力データに基づいて前記再適合させられたモデルをリフレッシュすることをさらに含む、請求項8に記載の予測モデル化装置。
- 前記再適合させられたモデルは、第1の再適合させられたモデルであり、少なくとも部分的に前記第2の入力データに基づいて前記再適合させられたモデルをリフレッシュすることは、
前記第2の入力データに前記予測モデル化プロシージャを行うことにより、第2の再適合させられたモデルを生成することと、
前記第1の再適合させられたモデルおよび前記第2の再適合させられたモデルを混合することにより、リフレッシュされた予測モデルを生成することと
を含む、請求項12に記載の予測モデル化装置。 - 少なくとも部分的に前記第2の入力データに基づいて前記再適合させられたモデルをリフレッシュすることは、
前記第1の入力データの少なくとも一部と前記第2の入力データの少なくとも一部とを含む第3の入力データに前記予測モデル化プロシージャを行うことにより、リフレッシュされた予測モデルを生成すること
を含む、請求項12に記載の予測モデル化装置。 - 前記予測モデルは、第1のタイプの予測モデルであり、前記モデル適合タスクは、第1のモデル適合タスクであり、前記予測モデル化プロシージャを行うことは、
第2のタイプの予測モデルを用いて第2のモデル適合タスクを行うことであって、前記第2のモデル適合タスクを行うことは、前記第2のタイプの予測モデルを適合させることにより第2の適合させられたモデルを取得することを含む、ことと、
前記第1のタイプの前記第1の適合させられたモデルおよび前記第2のタイプの前記第2の適合させられたモデルを混合することにより、混合モデルを生成することと
をさらに含む、請求項1に記載の予測モデル化装置。 - 予測モデル化装置であって、前記予測モデル化装置は、
予測モデル化プロシージャを符号化する機械実行可能なモジュールを記憶するように構成されたメモリであって、前記予測モデル化プロシージャは、複数のタスクを含み、前記機械実行可能なモジュールは、前記タスク間の依存性を表す有向グラフを含み、前記複数のタスクは、少なくとも1つの前処理タスク、少なくとも1つのモデル適合タスク、および、少なくとも1つの後処理タスクを含む、メモリと、
前記機械実行可能なモジュールを実行するように構成された少なくとも1つのプロセッサと
を備え、前記機械実行可能なモジュールを実行することは、前記予測モデル化プロシージャを前記装置に行わせ、前記予測モデル化プロシージャを行うことは、
入力データを操作することであって、前記入力データに前記前処理タスクを行うことを含む、ことと、
前記モデル適合タスクを行うことであって、
前記前処理された入力データから訓練データおよび試験データを生成することと、
予測モデルを前記訓練データに適合させることと、
前記適合させられたモデルを前記試験データ上で試験することと
を含む、ことと、
前記後処理タスクを行うことと
を含み、
前記予測モデル化プロシージャを行うことは、前記予測モデルのネスト化交差検証を行うことをさらに含み、
前記前処理された入力データは、少なくとも1つのデータセットを含み、前記予測モデルの前記ネスト化交差検証を行うことは、
少なくとも前記データセットの第1のパーティションおよび前記データセットの第2のパーティションを含む前記データセットの第1の複数のパーティションに前記データセットを分割することと、
少なくとも前記データセットの前記第1のパーティションの第1のパーティションおよび前記データセットの前記第1のパーティションの第2のパーティションを含む前記データセットの前記第1のパーティションの複数のパーティションに前記データセットの前記第1のパーティションを分割することと
を含み、前記訓練データは、前記データセットの前記第1のパーティションの前記第1のパーティションを含み、前記試験データは、前記データセットの前記第1のパーティションの前記第1のパーティションを除く、前記データセットの前記第1のパーティションの全パーティションを含む、予測モデル化装置。 - 前記訓練データは、第1の訓練データであり、前記試験データは、第1の試験データであり、前記適合させられたモデルは、第1の適合させられたモデルであり、前記予測モデルの前記ネスト化交差検証を行うことは、
(a)前記データセットの前記第1のパーティションから第2の訓練データおよび第2の試験データを生成することであって、前記第2の訓練データは、前記データセットの前記第1のパーティションの前記第2のパーティションを含み、前記第2の試験データは、前記データセットの前記第1のパーティションの前記第2のパーティション以外の前記データセットの前記第1のパーティションの複数のパーティションを含む、ことと、
(b)前記予測モデルを前記第2の訓練データに適合させることにより、第2の適合させられたモデルを取得することと、
(c)前記第2の適合させられたモデルを前記第2の試験データ上で試験することと
をさらに含む、請求項16に記載の予測モデル化装置。 - 前記ネスト化交差検証を行うことは、
前記第1の適合させられたモデルおよび前記第2の適合させられたモデルを前記データセットの前記第2のパーティション上で試験することと、
前記第1および前記第2の適合させられたモデルを前記データセットの前記第2のパーティション上で試験することの結果に基づいて、前記第1の適合させられたモデルを前記第2の適合させられたモデルと比較することと
をさらに含む、請求項17に記載の予測モデル化装置。 - 前記少なくとも1つのプロセッサは、前記予測モデルを再適合させ、前記再適合させられたモデルを展開するようにさらに構成されている、請求項16に記載の予測モデル化装置。
- 前記再適合させられたモデルを展開することは、予測問題のインスタンスを表す他のデータに前記再適合させられたモデルを適用することによって複数の予測を生成することを含み、前記入力データは、前記他のデータを含まない、請求項19に記載の予測モデル化装置。
- 前記再適合させられたモデルを展開することは、前記少なくとも1つのプロセッサがアクセス可能なメモリ内に前記再適合させられたモデルの状態をキャッシュ格納することを含む、請求項19に記載の予測モデル化装置。
- 前記再適合させられたモデルは、第1の表現を有し、前記再適合させられたモデルを展開することは、
前記再適合させられたモデルの第2の表現を生成すること
を含み、前記第2の表現は、1つ以上の条件付き規則のセットを含み、
前記再適合させられたモデルの前記第2の表現は、機械実行可能な表現であり、前記1つ以上の条件付き規則のセットは、1つ以上の機械実行可能なif−then文のセットを含む、請求項19に記載の予測モデル化装置。 - 前記入力データは、第1の入力データであり、前記再適合させられたモデルを展開することは、少なくとも部分的に第2の入力データに基づいて前記再適合させられたモデルをリフレッシュすることをさらに含む、請求項19に記載の予測モデル化装置。
- 前記再適合させられたモデルは、第1の再適合させられたモデルであり、少なくとも部分的に前記第2の入力データに基づいて前記再適合させられたモデルをリフレッシュすることは、
前記第2の入力データに前記予測モデル化プロシージャを行うことにより、第2の再適合させられたモデルを生成することと、
前記第1の再適合させられたモデルおよび前記第2の再適合させられたモデルを混合することにより、リフレッシュされた予測モデルを生成することと
を含む、請求項23に記載の予測モデル化装置。 - 少なくとも部分的に前記第2の入力データに基づいて前記再適合させられたモデルをリフレッシュすることは、
前記第1の入力データの少なくとも一部と前記第2の入力データの少なくとも一部とを含む第3の入力データに前記予測モデル化プロシージャを行うことにより、リフレッシュされた予測モデルを生成すること
を含む、請求項23に記載の予測モデル化装置。 - 前記予測モデルは、第1のタイプの予測モデルであり、前記適合させられたモデルは、第1の適合させられたモデルであり、前記モデル適合タスクは、第1のモデル適合タスクであり、前記予測モデル化プロシージャを行うことは、
第2のタイプの予測モデルを用いて第2のモデル適合タスクを行うことであって、前記第2のモデル適合タスクを行うことは、前記第2のタイプの予測モデルを適合させることにより第2の適合させられたモデルを取得することを含む、ことと、
前記第1のタイプの前記第1の適合させられたモデルおよび前記第2のタイプの前記第2の適合させられたモデルを混合することにより、混合モデルを生成することと
をさらに含む、請求項16に記載の予測モデル化装置。 - 予測モデル化装置であって、前記予測モデル化装置は、
予測モデル化プロシージャを符号化する機械実行可能なモジュールを記憶するように構成されたメモリであって、前記予測モデル化プロシージャは、複数のタスクを含み、前記機械実行可能なモジュールは、前記タスク間の依存性を表す有向グラフを含み、前記複数のタスクは、少なくとも1つの前処理タスク、少なくとも1つのモデル適合タスク、および、少なくとも1つの後処理タスクを含む、メモリと、
前記機械実行可能なモジュールを実行するように構成された少なくとも1つのプロセッサと
を備え、前記機械実行可能なモジュールを実行することは、前記予測モデル化プロシージャを前記装置に行わせ、前記予測モデル化プロシージャを行うことは、
入力データを操作することであって、前記入力データに前記前処理タスクを行うことを含む、ことと、
前記モデル適合タスクを行うことであって、
前記前処理された入力データから訓練データおよび試験データを生成することと、
予測モデルを前記訓練データに適合させることと、
前記適合させられたモデルを前記試験データ上で試験することと
を含む、ことと、
前記後処理タスクを行うことと
を含み、
前記前処理された入力データは、少なくとも1つのデータセットを含み、前記訓練データを生成することは、前記データセットの第1のサブセットを取得することを含み、前記試験データを生成することは、前記データセットの第2のサブセットを取得することを含み、
前記予測モデルは、第1のタイプの予測モデルであり、前記適合させられたモデルは、第1の適合させられたモデルであり、前記モデル適合タスクは、第1のモデル適合タスクであり、前記予測モデル化プロシージャを行うことは、第2のタイプの予測モデルを用いて第2のモデル適合タスクを行うことをさらに含む、予測モデル化装置。 - 前記訓練データは、第1の訓練データであり、前記試験データは、第1の試験データであり、前記第2のタイプの予測モデルを用いて前記第2のモデル適合タスクを行うことは、
(a)前記データセットから第2の訓練データおよび第2の試験データを生成することであって、前記第2の訓練データを生成することは、前記データセットの第3のサブセットを取得することを含み、前記第2の試験データを生成することは、前記データセットの第4のサブセットを取得することを含む、ことと、
(b)前記第2のタイプの予測モデルを前記第2の訓練データに適合させることにより、第2の適合させられたモデルを取得することと、
(c)前記第2の適合させられたモデルを前記第2の試験データ上で試験することと
を含む、請求項27に記載の予測モデル化装置。 - 前記予測モデル化プロシージャを行うことは、前記第1のタイプの前記第1の適合させられたモデルおよび前記第2のタイプの前記第2の適合させられたモデルを混合することにより、混合モデルを生成することをさらに含む、請求項28に記載の予測モデル化装置。
- 前記前処理された入力データは、第1のパーティションおよび第2のパーティションを含み、
前記データセットは、前記前処理された入力データの前記第1のパーティションを含み、
前記第1および第2の適合させられたモデルを混合することは、
前記混合モデルを前記前処理された入力データの前記第2のパーティションの第1のパーティションに適合させることと、
前記適合させられた混合モデルを前記前処理された入力データの前記第2のパーティションの第2のパーティション上で試験することと
を含む、請求項29に記載の予測モデル化装置。 - 前記少なくとも1つのプロセッサは、前記混合モデルを展開するようにさらに構成されている、請求項29に記載の予測モデル化装置。
- 前記混合モデルを展開することは、予測問題のインスタンスを表す他のデータに前記混合モデルを適用することによって複数の予測を生成することを含み、前記入力データは、前記他のデータを含まない、請求項31に記載の予測モデル化装置。
- 前記混合モデルを展開することは、前記少なくとも1つのプロセッサがアクセス可能なメモリ内に前記混合モデルの状態をキャッシュ格納することを含む、請求項31に記載の予測モデル化装置。
- 前記混合モデルは、第1の表現を有し、前記混合モデルを展開することは、
前記混合モデルの第2の表現を生成すること
を含み、前記第2の表現は、1つ以上の条件付き規則のセットを含み、
前記混合モデルの前記第2の表現は、機械実行可能な表現であり、前記1つ以上の条件付き規則のセットは、1つ以上の機械実行可能なif−then文のセットを含む、請求項31に記載の予測モデル化装置。 - 前記入力データは、第1の入力データであり、前記混合モデルを展開することは、少なくとも部分的に第2の入力データに基づいて前記混合モデルをリフレッシュすることをさらに含む、請求項31に記載の予測モデル化装置。
- 前記混合モデルは、第1の混合モデルであり、少なくとも部分的に前記第2の入力データに基づいて前記混合モデルをリフレッシュすることは、
前記第2の入力データに前記予測モデル化プロシージャを行うことにより、第2の混合モデルを生成することと、
前記第1の混合モデルおよび前記第2の混合モデルを混合することにより、リフレッシュされた予測モデルを生成することと
を含む、請求項35に記載の予測モデル化装置。 - 少なくとも部分的に前記第2の入力データに基づいて前記混合モデルをリフレッシュすることは、
前記第1の入力データの少なくとも一部と前記第2の入力データの少なくとも一部とを含む第3の入力データに前記予測モデル化プロシージャを行うことにより、リフレッシュされた混合モデルを生成すること
を含む、請求項36に記載の予測モデル化装置。 - 予測モデル化装置であって、前記予測モデル化装置は、
予測モデル化プロシージャを符号化する機械実行可能なモジュールを記憶するように構成されたメモリであって、前記予測モデル化プロシージャは、複数のタスクを含み、前記機械実行可能なモジュールは、前記タスク間の依存性を表す有向グラフを含み、前記複数のタスクは、少なくとも1つの前処理タスク、少なくとも1つのモデル適合タスク、および、少なくとも1つの後処理タスクを含む、メモリと、
前記機械実行可能なモジュールを実行するように構成された少なくとも1つのプロセッサと
を備え、前記機械実行可能なモジュールを実行することは、前記予測モデル化プロシージャを前記装置に行わせ、前記予測モデル化プロシージャを行うことは、
入力データを操作することであって、前記入力データに前記前処理タスクを行うことを含む、ことと、
前記モデル適合タスクを行うことであって、
前記前処理された入力データから訓練データおよび試験データを生成することと、
予測モデルを前記訓練データに適合させることと、
前記適合させられたモデルを前記試験データ上で試験することと
を含む、ことと、
前記後処理タスクを行うことと
を含み、
前記少なくとも1つのプロセッサは、前記適合させられたモデルを展開するようにさらに構成され、
前記適合させられたモデルは、第1の表現を有し、前記適合させられたモデルを展開することは、
前記適合させられたモデルの第2の表現を生成すること
を含み、前記第2の表現は、1つ以上の条件付き規則のセットを含み、
前記適合させられたモデルの前記第2の表現は、機械実行可能な表現であり、前記1つ以上の条件付き規則のセットは、1つ以上の機械実行可能なif−then文のセットを含む、予測モデル化装置。 - 前記適合させられたモデルを展開することは、予測問題のインスタンスを表す他のデータに前記適合させられたモデルを適用することによって複数の予測を生成することをさらに含み、前記入力データは、前記他のデータを含まない、請求項38に記載の予測モデル化装置。
- 前記適合させられたモデルを展開することは、前記少なくとも1つのプロセッサがアクセス可能なメモリ内に前記適合させられたモデルの状態をキャッシュ格納することをさらに含む、請求項38に記載の予測モデル化装置。
- 予測モデル化装置であって、前記予測モデル化装置は、
予測モデル化プロシージャを符号化する機械実行可能なモジュールを記憶するように構成されたメモリであって、前記予測モデル化プロシージャは、複数のタスクを含み、前記機械実行可能なモジュールは、前記タスク間の依存性を表す有向グラフを含み、前記複数のタスクは、少なくとも1つの前処理タスク、少なくとも1つのモデル適合タスク、および、少なくとも1つの後処理タスクを含む、メモリと、
前記機械実行可能なモジュールを実行するように構成された少なくとも1つのプロセッサと
を備え、前記機械実行可能なモジュールを実行することは、前記予測モデル化プロシージャを前記装置に行わせ、前記予測モデル化プロシージャを行うことは、
入力データを操作することであって、前記入力データに前記前処理タスクを行うことを含む、ことと、
前記モデル適合タスクを行うことであって、
前記前処理された入力データから訓練データおよび試験データを生成することと、
予測モデルを前記訓練データに適合させることと、
前記適合させられたモデルを前記試験データ上で試験することと
を含む、ことと、
前記後処理タスクを行うことと
を含み、
前記少なくとも1つのプロセッサは、前記適合させられたモデルを展開するようにさらに構成され、
前記入力データは、第1の入力データであり、前記適合させられたモデルを展開することは、少なくとも部分的に第2の入力データに基づいて前記適合させられたモデルをリフレッシュすることをさらに含む、予測モデル化装置。 - 前記適合させられたモデルは、第1の適合させられたモデルであり、少なくとも部分的に前記第2の入力データに基づいて前記適合させられたモデルをリフレッシュすることは、
前記第2の入力データに前記予測モデル化プロシージャを行うことにより、第2の適合させられたモデルを生成することと、
前記第1の適合させられたモデルおよび前記第2の適合させられたモデルを混合することにより、リフレッシュされた予測モデルを生成することと
を含む、請求項41に記載の予測モデル化装置。 - 少なくとも部分的に前記第2の入力データに基づいて前記適合させられたモデルをリフレッシュすることは、
前記第1の入力データの少なくとも一部と前記第2の入力データの少なくとも一部とを含む第3の入力データに前記予測モデル化プロシージャを行うことにより、リフレッシュされた予測モデルを生成すること
を含む、請求項41に記載の予測モデル化装置。 - 前記入力データに前記前処理タスクを行うことは、前記入力データを一掃すること、前記入力データに対して特徴選択を行うこと、および/または、前記入力データに対して特徴工学を行うことを含む、請求項41に記載の予測モデル化装置。
- 前記モデル適合タスクを行うことは、複数の予測モデルから前記予測モデルを選択すること、前記予測モデルの少なくとも1つのパラメータの値を決定すること、および/または、前記予測モデル化プロシージャの少なくとも1つのハイパーパラメータの値を決定することをさらに含む、請求項41に記載の予測モデル化装置。
- 前記後処理タスクを行うことは、前記試験されたモデルを処理することを含む、請求項41に記載の予測モデル化装置。
- 前記試験されたモデルを処理することは、前記試験されたモデルを較正すること、および/または、前記試験されたモデルを別の予測モデルと混合することにより、混合予測モデルを生成することを含む、請求項46に記載の予測モデル化装置。
- 予測モデル化方法であって、前記方法は、
予測モデル化プロシージャを符号化する機械実行可能なモジュールにアクセスすることであって、前記予測モデル化プロシージャは、複数のタスクを含み、前記機械実行可能なモジュールは、前記タスク間の依存性を表す有向グラフを含み、前記複数のタスクは、少なくとも1つの前処理タスク、少なくとも1つのモデル適合タスク、および、少なくとも1つの後処理タスクを含む、ことと、
前記機械実行可能なモジュールを実行することと
を含み、前記機械実行可能なモジュールを実行することは、前記予測モデル化プロシージャを行うことを含み、前記予測モデル化プロシージャを行うことは、
入力データを操作することであって、前記入力データに前記前処理タスクを行うことを含む、ことと、
前記モデル適合タスクを行うことであって、
前記前処理された入力データから訓練データおよび試験データを生成することと、
予測モデルを前記訓練データに適合させることと、
前記適合させられたモデルを前記試験データ上で試験することと
を含む、ことと、
前記後処理タスクを行うことと
を含み、
前記前処理された入力データは、少なくとも1つのデータセットを含み、前記訓練データを生成することは、前記データセットの第1のサブセットを取得することを含み、前記試験データを生成することは、前記データセットの第2のサブセットを取得することを含み、
前記予測モデル化プロシージャを行うことは、前記予測モデルの交差検証を行うことをさらに含み、
前記訓練データは、第1の訓練データであり、前記試験データは、第1の試験データであり、前記適合させられたモデルは、第1の適合させられたモデルであり、前記予測モデルの前記交差検証を行うことは、
(a)前記データセットから第2の訓練データおよび第2の試験データを生成することであって、前記第2の訓練データを生成することは、前記データセットの第3のサブセットを取得することを含み、前記第2の試験データを生成することは、前記データセットの第4のサブセットを取得することを含む、ことと、
(b)前記予測モデルを前記第2の訓練データに適合させることにより、第2の適合させられたモデルを取得することと、
(c)前記第2の適合させられたモデルを前記第2の試験データ上で試験することと
を含む、方法。 - 前記モデル適合タスクを行うことは、少なくとも第1のパーティションおよび第2のパーティションを含む複数のパーティションに前記データセットを分割することをさらに含む、請求項48に記載の方法。
- 複数のパーティションに前記データセットを分割することは、前記データセット内の各データアイテムをそれぞれのパーティションにランダムに割り当てることを含む、請求項49に記載の方法。
- 前記第1の訓練データは、前記データセットの前記第1のパーティションを含み、
前記第1の試験データは、前記第1のパーティションを除く、前記データセットの全パーティションを含み、
前記第2の訓練データは、前記データセットの前記第2のパーティションを含み、
前記第2の試験データは、前記第2のパーティションを除く、前記データセットの全パーティションを含む、請求項49に記載の方法。 - 前記第1の訓練データは、前記データセットの前記第1のパーティションのサブセットを含み、
前記第1の試験データは、前記第1のパーティションを除く、前記データセットの全パーティションのそれぞれのサブセットを含み、
前記第2の訓練データは、前記データセットの前記第2のパーティションのサブセットを含み、
前記第2の試験データは、前記第2のパーティションを除く、前記データセットの全パーティションのそれぞれのサブセットを含む、請求項49に記載の方法。 - 前記前処理された入力データは、第1のパーティションおよび第2のパーティションを含み、
前記データセットは、前記前処理された入力データの前記第1のパーティションを含み、
前記モデル適合タスクを行うことは、前記前処理された入力データの前記第2のパーティションを含むホールドアウトデータ上で前記第1および第2の適合させられたモデルを試験することをさらに含む、請求項48に記載の方法。 - いずれの予測モデルも、前記ホールドアウトデータに適合させられない、請求項53に記載の方法。
- 前記予測モデルを再適合させることと、前記再適合させられたモデルを展開することとをさらに含む、請求項48に記載の方法。
- 前記再適合させられたモデルを展開することは、予測問題のインスタンスを表す他のデータに前記再適合させられたモデルを適用することによって複数の予測を生成することを含み、前記入力データは、前記他のデータを含まない、請求項55に記載の方法。
- 前記再適合させられたモデルを展開することは、前記少なくとも1つのプロセッサがアクセス可能なメモリ内に前記再適合させられたモデルの状態をキャッシュ格納することを含む、請求項55に記載の方法。
- 前記再適合させられたモデルは、第1の表現を有し、前記再適合させられたモデルを展開することは、
前記再適合させられたモデルの第2の表現を生成すること
を含み、前記第2の表現は、1つ以上の条件付き規則のセットを含み、
前記再適合させられたモデルの前記第2の表現は、機械実行可能な表現であり、前記1つ以上の条件付き規則のセットは、1つ以上の機械実行可能なif−then文のセットを含む、請求項55に記載の方法。 - 前記入力データは、第1の入力データであり、前記再適合させられたモデルを展開することは、少なくとも部分的に第2の入力データに基づいて前記再適合させられたモデルをリフレッシュすることをさらに含む、請求項55に記載の方法。
- 前記再適合させられたモデルは、第1の再適合させられたモデルであり、少なくとも部分的に前記第2の入力データに基づいて前記再適合させられたモデルをリフレッシュすることは、
前記第2の入力データに前記予測モデル化プロシージャを行うことにより、第2の再適合させられたモデルを生成することと、
前記第1の再適合させられたモデルおよび前記第2の再適合させられたモデルを混合することにより、リフレッシュされた予測モデルを生成することと
を含む、請求項59に記載の方法。 - 少なくとも部分的に前記第2の入力データに基づいて前記再適合させられたモデルをリフレッシュすることは、
前記第1の入力データの少なくとも一部と前記第2の入力データの少なくとも一部とを含む第3の入力データに前記予測モデル化プロシージャを行うことにより、リフレッシュされた予測モデルを生成すること
を含む、請求項59に記載の方法。 - 前記予測モデルは、第1のタイプの予測モデルであり、前記モデル適合タスクは、第1のモデル適合タスクであり、前記予測モデル化プロシージャを行うことは、
第2のタイプの予測モデルを用いて第2のモデル適合タスクを行うことであって、前記第2のモデル適合タスクを行うことは、前記第2のタイプの予測モデルを適合させることにより第2の適合させられたモデルを取得することを含む、ことと、
前記第1のタイプの前記第1の適合させられたモデルおよび前記第2のタイプの前記第2の適合させられたモデルを混合することにより、混合モデルを生成することと
をさらに含む、請求項48に記載の方法。 - 予測モデル化方法であって、前記方法は、
予測モデル化プロシージャを符号化する機械実行可能なモジュールにアクセスすることであって、前記予測モデル化プロシージャは、複数のタスクを含み、前記機械実行可能なモジュールは、前記タスク間の依存性を表す有向グラフを含み、前記複数のタスクは、少なくとも1つの前処理タスク、少なくとも1つのモデル適合タスク、および、少なくとも1つの後処理タスクを含む、ことと、
前記機械実行可能なモジュールを実行することと
を含み、前記機械実行可能なモジュールを実行することは、前記予測モデル化プロシージャを行うことを含み、前記予測モデル化プロシージャを行うことは、
入力データを操作することであって、前記入力データに前記前処理タスクを行うことを含む、ことと、
前記モデル適合タスクを行うことであって、
前記前処理された入力データから訓練データおよび試験データを生成することと、
予測モデルを前記訓練データに適合させることと、
前記適合させられたモデルを前記試験データ上で試験することと
を含む、ことと、
前記後処理タスクを行うことと
を含み、
前記予測モデル化プロシージャを行うことは、前記予測モデルのネスト化交差検証を行うことをさらに含み、
前記前処理された入力データは、少なくとも1つのデータセットを含み、前記予測モデルの前記ネスト化交差検証を行うことは、
少なくとも前記データセットの第1のパーティションおよび前記データセットの第2のパーティションを含む前記データセットの第1の複数のパーティションに前記データセットを分割することと、
少なくとも前記データセットの前記第1のパーティションの第1のパーティションおよび前記データセットの前記第1のパーティションの第2のパーティションを含む前記データセットの前記第1のパーティションの複数のパーティションに前記データセットの前記第1のパーティションを分割することと
を含み、前記訓練データは、前記データセットの前記第1のパーティションの前記第1のパーティションを含み、前記試験データは、前記データセットの前記第1のパーティションの前記第1のパーティションを除く、前記データセットの前記第1のパーティションの全パーティションを含む、方法。 - 前記訓練データは、第1の訓練データであり、前記試験データは、第1の試験データであり、前記適合させられたモデルは、第1の適合させられたモデルであり、前記予測モデルの前記ネスト化交差検証を行うことは、
(a)前記データセットの前記第1のパーティションから第2の訓練データおよび第2の試験データを生成することであって、前記第2の訓練データは、前記データセットの前記第1のパーティションの前記第2のパーティションを含み、前記第2の試験データは、前記データセットの前記第1のパーティションの前記第2のパーティション以外の前記データセットの前記第1のパーティションの複数のパーティションを含む、ことと、
(b)前記予測モデルを前記第2の訓練データに適合させることにより、第2の適合させられたモデルを取得することと、
(c)前記第2の適合させられたモデルを前記第2の試験データ上で試験することと
をさらに含む、請求項63に記載の方法。 - 前記ネスト化交差検証を行うことは、
前記第1の適合させられたモデルおよび前記第2の適合させられたモデルを前記データセットの前記第2のパーティション上で試験することと、
前記第1および前記第2の適合させられたモデルを前記データセットの前記第2のパーティション上で試験することの結果に基づいて、前記第1の適合させられたモデルを前記第2の適合させられたモデルと比較することと
をさらに含む、請求項64に記載の方法。 - 前記予測モデルを再適合させることと、前記再適合させられたモデルを展開することとをさらに含む、請求項63に記載の方法。
- 前記再適合させられたモデルを展開することは、予測問題のインスタンスを表す他のデータに前記再適合させられたモデルを適用することによって複数の予測を生成することを含み、前記入力データは、前記他のデータを含まない、請求項66に記載の方法。
- 前記再適合させられたモデルを展開することは、前記少なくとも1つのプロセッサがアクセス可能なメモリ内に前記再適合させられたモデルの状態をキャッシュ格納することを含む、請求項66に記載の方法。
- 前記再適合させられたモデルは、第1の表現を有し、前記再適合させられたモデルを展開することは、
前記再適合させられたモデルの第2の表現を生成すること
を含み、前記第2の表現は、1つ以上の条件付き規則のセットを含み、
前記再適合させられたモデルの前記第2の表現は、機械実行可能な表現であり、前記1つ以上の条件付き規則のセットは、1つ以上の機械実行可能なif−then文のセットを含む、請求項66に記載の方法。 - 前記入力データは、第1の入力データであり、前記再適合させられたモデルを展開することは、少なくとも部分的に第2の入力データに基づいて前記再適合させられたモデルをリフレッシュすることをさらに含む、請求項66に記載の方法。
- 前記再適合させられたモデルは、第1の再適合させられたモデルであり、少なくとも部分的に前記第2の入力データに基づいて前記再適合させられたモデルをリフレッシュすることは、
前記第2の入力データに前記予測モデル化プロシージャを行うことにより、第2の再適合させられたモデルを生成することと、
前記第1の再適合させられたモデルおよび前記第2の再適合させられたモデルを混合することにより、リフレッシュされた予測モデルを生成することと
を含む、請求項70に記載の方法。 - 少なくとも部分的に前記第2の入力データに基づいて前記再適合させられたモデルをリフレッシュすることは、
前記第1の入力データの少なくとも一部と前記第2の入力データの少なくとも一部とを含む第3の入力データに前記予測モデル化プロシージャを行うことにより、リフレッシュされた予測モデルを生成すること
を含む、請求項70に記載の方法。 - 前記予測モデルは、第1のタイプの予測モデルであり、前記適合させられたモデルは、第1の適合させられたモデルであり、前記モデル適合タスクは、第1のモデル適合タスクであり、前記予測モデル化プロシージャを行うことは、
第2のタイプの予測モデルを用いて第2のモデル適合タスクを行うことであって、前記第2のモデル適合タスクを行うことは、前記第2のタイプの予測モデルを適合させることにより第2の適合させられたモデルを取得することを含む、ことと、
前記第1のタイプの前記第1の適合させられたモデルおよび前記第2のタイプの前記第2の適合させられたモデルを混合することにより、混合モデルを生成することと
をさらに含む、請求項63に記載の方法。 - 予測モデル化方法であって、前記方法は、
予測モデル化プロシージャを符号化する機械実行可能なモジュールにアクセスすることあって、前記予測モデル化プロシージャは、複数のタスクを含み、前記機械実行可能なモジュールは、前記タスク間の依存性を表す有向グラフを含み、前記複数のタスクは、少なくとも1つの前処理タスク、少なくとも1つのモデル適合タスク、および、少なくとも1つの後処理タスクを含む、ことと、
前記機械実行可能なモジュールを実行することと
を含み、前記機械実行可能なモジュールを実行することは、前記予測モデル化プロシージャを行うことを含み、前記予測モデル化プロシージャを行うことは、
入力データを操作することであって、前記入力データに前記前処理タスクを行うことを含む、ことと、
前記モデル適合タスクを行うことであって、
前記前処理された入力データから訓練データおよび試験データを生成することと、
予測モデルを前記訓練データに適合させることと、
前記適合させられたモデルを前記試験データ上で試験することと
を含む、ことと、
前記後処理タスクを行うことと
を含み、
前記前処理された入力データは、少なくとも1つのデータセットを含み、前記訓練データを生成することは、前記データセットの第1のサブセットを取得することを含み、前記試験データを生成することは、前記データセットの第2のサブセットを取得することを含み、
前記予測モデルは、第1のタイプの予測モデルであり、前記適合させられたモデルは、第1の適合させられたモデルであり、前記モデル適合タスクは、第1のモデル適合タスクであり、前記予測モデル化プロシージャを行うことは、第2のタイプの予測モデルを用いて第2のモデル適合タスクを行うことをさらに含む、方法。 - 前記訓練データは、第1の訓練データであり、前記試験データは、第1の試験データであり、前記第2のタイプの予測モデルを用いて前記第2のモデル適合タスクを行うことは、
(a)前記データセットから第2の訓練データおよび第2の試験データを生成することであって、前記第2の訓練データを生成することは、前記データセットの第3のサブセットを取得することを含み、前記第2の試験データを生成することは、前記データセットの第4のサブセットを取得することを含む、ことと、
(b)前記第2のタイプの予測モデルを前記第2の訓練データに適合させることにより、第2の適合させられたモデルを取得することと、
(c)前記第2の適合させられたモデルを前記第2の試験データ上で試験することと
を含む、請求項74に記載の方法。 - 前記予測モデル化プロシージャを行うことは、前記第1のタイプの前記第1の適合させられたモデルおよび前記第2のタイプの前記第2の適合させられたモデルを混合することにより、混合モデルを生成することをさらに含む、請求項75に記載の方法。
- 前記前処理された入力データは、第1のパーティションおよび第2のパーティションを含み、
前記データセットは、前記前処理された入力データの前記第1のパーティションを含み、
前記第1および第2の適合させられたモデルを混合することは、
前記混合モデルを前記前処理された入力データの前記第2のパーティションの第1のパーティションに適合させることと、
前記適合させられた混合モデルを前記前処理された入力データの前記第2のパーティションの第2のパーティション上で試験することと
を含む、請求項76に記載の方法。 - 前記混合モデルを展開することをさらに含む、請求項76に記載の方法。
- 前記混合モデルを展開することは、予測問題のインスタンスを表す他のデータに前記混合モデルを適用することによって複数の予測を生成することを含み、前記入力データは、前記他のデータを含まない、請求項78に記載の方法。
- 前記混合モデルを展開することは、前記少なくとも1つのプロセッサがアクセス可能なメモリ内に前記混合モデルの状態をキャッシュ格納することを含む、請求項78に記載の方法。
- 前記混合モデルは、第1の表現を有し、前記混合モデルを展開することは、
前記混合モデルの第2の表現を生成すること
を含み、前記第2の表現は、1つ以上の条件付き規則のセットを含み、
前記混合モデルの前記第2の表現は、機械実行可能な表現であり、前記1つ以上の条件付き規則のセットは、1つ以上の機械実行可能なif−then文のセットを含む、請求項78に記載の方法。 - 前記入力データは、第1の入力データであり、前記混合モデルを展開することは、少なくとも部分的に第2の入力データに基づいて前記混合モデルをリフレッシュすることをさらに含む、請求項78に記載の方法。
- 前記混合モデルは、第1の混合モデルであり、少なくとも部分的に前記第2の入力データに基づいて前記混合モデルをリフレッシュすることは、
前記第2の入力データに前記予測モデル化プロシージャを行うことにより、第2の混合モデルを生成することと、
前記第1の混合モデルおよび前記第2の混合モデルを混合することにより、リフレッシュされた予測モデルを生成することと
を含む、請求項82に記載の方法。 - 少なくとも部分的に前記第2の入力データに基づいて前記混合モデルをリフレッシュすることは、
前記第1の入力データの少なくとも一部と前記第2の入力データの少なくとも一部とを含む第3の入力データに前記予測モデル化プロシージャを行うことにより、リフレッシュされた混合モデルを生成すること
を含む、請求項82に記載の方法。 - 予測モデル化方法であって、前記方法は、
予測モデル化プロシージャを符号化する機械実行可能なモジュールにアクセスすることであって、前記予測モデル化プロシージャは、複数のタスクを含み、前記機械実行可能なモジュールは、前記タスク間の依存性を表す有向グラフを含み、前記複数のタスクは、少なくとも1つの前処理タスク、少なくとも1つのモデル適合タスク、および、少なくとも1つの後処理タスクを含む、ことと、
前記機械実行可能なモジュールを実行することとであって、前記機械実行可能なモジュールを実行することは、前記予測モデル化プロシージャを行うことを含み、前記予測モデル化プロシージャを行うことは、
入力データを操作することであって、前記入力データに前記前処理タスクを行うことを含む、ことと、
前記モデル適合タスクを行うことであって、
前記前処理された入力データから訓練データおよび試験データを生成することと、
予測モデルを前記訓練データに適合させることと、
前記適合させられたモデルを前記試験データ上で試験することと
を含む、ことと、
前記後処理タスクを行うことと
を含む、ことと、
前記適合させられたモデルを展開することと
を含み、
前記適合させられたモデルは、第1の表現を有し、前記適合させられたモデルを展開することは、
前記適合させられたモデルの第2の表現を生成すること
を含み、前記第2の表現は、1つ以上の条件付き規則のセットを含み、
前記適合させられたモデルの前記第2の表現は、機械実行可能な表現であり、前記1つ以上の条件付き規則のセットは、1つ以上の機械実行可能なif−then文のセットを含む、方法。 - 前記適合させられたモデルを展開することは、予測問題のインスタンスを表す他のデータに前記適合させられたモデルを適用することによって複数の予測を生成することをさらに含み、前記入力データは、前記他のデータを含まない、請求項85に記載の方法。
- 前記適合させられたモデルを展開することは、前記少なくとも1つのプロセッサがアクセス可能なメモリ内に前記適合させられたモデルの状態をキャッシュ格納することをさらに含む、請求項85に記載の方法。
- 予測モデル化方法であって、前記予測モデル化方法は、
予測モデル化プロシージャを符号化する機械実行可能なモジュールにアクセスすることであって、前記予測モデル化プロシージャは、複数のタスクを含み、前記機械実行可能なモジュールは、前記タスク間の依存性を表す有向グラフを含み、前記複数のタスクは、少なくとも1つの前処理タスク、少なくとも1つのモデル適合タスク、および、少なくとも1つの後処理タスクを含む、ことと、
前記機械実行可能なモジュールを実行することであって、前記機械実行可能なモジュールを実行することは、前記予測モデル化プロシージャを行うことを含み、前記予測モデル化プロシージャを行うことは、
入力データを操作することであって、前記入力データに前記前処理タスクを行うことを含む、ことと、
前記モデル適合タスクを行うことであって、
前記前処理された入力データから訓練データおよび試験データを生成することと、
予測モデルを前記訓練データに適合させることと、
前記適合させられたモデルを前記試験データ上で試験することと
を含む、ことと、
前記後処理タスクを行うことと
を含む、ことと、
前記適合させられたモデルを展開することと
を含み、
前記入力データは、第1の入力データであり、前記適合させられたモデルを展開することは、少なくとも部分的に第2の入力データに基づいて前記適合させられたモデルをリフレッシュすることをさらに含む、方法。 - 前記適合させられたモデルは、第1の適合させられたモデルであり、少なくとも部分的に前記第2の入力データに基づいて前記適合させられたモデルをリフレッシュすることは、
前記第2の入力データに前記予測モデル化プロシージャを行うことにより、第2の適合させられたモデルを生成することと、
前記第1の適合させられたモデルおよび前記第2の適合させられたモデルを混合することにより、リフレッシュされた予測モデルを生成することと
を含む、請求項88に記載の方法。 - 少なくとも部分的に前記第2の入力データに基づいて前記適合させられたモデルをリフレッシュすることは、
前記第1の入力データの少なくとも一部と前記第2の入力データの少なくとも一部とを含む第3の入力データに前記予測モデル化プロシージャを行うことにより、リフレッシュされた予測モデルを生成すること
を含む、請求項88に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462002469P | 2014-05-23 | 2014-05-23 | |
US62/002,469 | 2014-05-23 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017513620A Division JP6444494B2 (ja) | 2014-05-23 | 2015-05-22 | 予測データ分析のためのシステムおよび技術 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6457693B1 true JP6457693B1 (ja) | 2019-01-23 |
JP2019023906A JP2019023906A (ja) | 2019-02-14 |
Family
ID=53476966
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017513620A Expired - Fee Related JP6444494B2 (ja) | 2014-05-23 | 2015-05-22 | 予測データ分析のためのシステムおよび技術 |
JP2018187956A Active JP6926047B2 (ja) | 2014-05-23 | 2018-10-03 | 予測問題のための予測モデルを選択するための方法および予測モデル化装置 |
JP2018187955A Expired - Fee Related JP6457693B1 (ja) | 2014-05-23 | 2018-10-03 | 予測データ分析のためのシステムおよび技術 |
JP2020126434A Withdrawn JP2020191114A (ja) | 2014-05-23 | 2020-07-27 | 予測データ分析のためのシステムおよび技術 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017513620A Expired - Fee Related JP6444494B2 (ja) | 2014-05-23 | 2015-05-22 | 予測データ分析のためのシステムおよび技術 |
JP2018187956A Active JP6926047B2 (ja) | 2014-05-23 | 2018-10-03 | 予測問題のための予測モデルを選択するための方法および予測モデル化装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020126434A Withdrawn JP2020191114A (ja) | 2014-05-23 | 2020-07-27 | 予測データ分析のためのシステムおよび技術 |
Country Status (5)
Country | Link |
---|---|
US (5) | US9489630B2 (ja) |
JP (4) | JP6444494B2 (ja) |
DE (1) | DE112015002433T5 (ja) |
GB (1) | GB2541625A (ja) |
WO (1) | WO2015179778A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220107917A (ko) * | 2021-01-26 | 2022-08-02 | 쿠팡 주식회사 | 아이템 유사도를 모델링하고 아이템 정보를 상관시키기 위한 시스템 및 방법 |
Families Citing this family (332)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10839321B2 (en) | 1997-01-06 | 2020-11-17 | Jeffrey Eder | Automated data storage system |
US9940405B2 (en) | 2011-04-05 | 2018-04-10 | Beyondcore Holdings, Llc | Automatically optimizing business process platforms |
US9396283B2 (en) | 2010-10-22 | 2016-07-19 | Daniel Paul Miranker | System for accessing a relational database using semantic queries |
US9069725B2 (en) | 2011-08-19 | 2015-06-30 | Hartford Steam Boiler Inspection & Insurance Company | Dynamic outlier bias reduction system and method |
US10796232B2 (en) * | 2011-12-04 | 2020-10-06 | Salesforce.Com, Inc. | Explaining differences between predicted outcomes and actual outcomes of a process |
US10802687B2 (en) | 2011-12-04 | 2020-10-13 | Salesforce.Com, Inc. | Displaying differences between different data sets of a process |
US11995667B2 (en) | 2012-07-25 | 2024-05-28 | Prevedere Inc. | Systems and methods for business analytics model scoring and selection |
US9524473B2 (en) | 2012-08-31 | 2016-12-20 | Nutonian, Inc. | System and method for auto-query generation |
US9495641B2 (en) | 2012-08-31 | 2016-11-15 | Nutomian, Inc. | Systems and method for data set submission, searching, and retrieval |
US20140372159A1 (en) * | 2013-03-15 | 2014-12-18 | David Bain | System for optimization of group interaction |
CN106471475B (zh) | 2014-04-11 | 2022-07-19 | 哈佛蒸汽锅炉检验和保险公司 | 基于系统操作和性能数据建模来改进未来的可靠性预测 |
US10366346B2 (en) * | 2014-05-23 | 2019-07-30 | DataRobot, Inc. | Systems and techniques for determining the predictive value of a feature |
US10558924B2 (en) | 2014-05-23 | 2020-02-11 | DataRobot, Inc. | Systems for second-order predictive data analytics, and related methods and apparatus |
GB2541625A (en) | 2014-05-23 | 2017-02-22 | Datarobot | Systems and techniques for predictive data analytics |
US10496927B2 (en) | 2014-05-23 | 2019-12-03 | DataRobot, Inc. | Systems for time-series predictive data analytics, and related methods and apparatus |
US9858166B1 (en) * | 2014-08-26 | 2018-01-02 | VCE IP Holding Company LLC | Methods, systems, and computer readable mediums for optimizing the deployment of application workloads in a converged infrastructure network environment |
US10403056B2 (en) * | 2014-12-08 | 2019-09-03 | Nec Corporation | Aging profiling engine for physical systems |
US10460275B2 (en) * | 2015-02-27 | 2019-10-29 | International Business Machines Corporation | Predictive model search by communicating comparative strength |
US9135559B1 (en) * | 2015-03-20 | 2015-09-15 | TappingStone Inc. | Methods and systems for predictive engine evaluation, tuning, and replay of engine performance |
US10713594B2 (en) * | 2015-03-20 | 2020-07-14 | Salesforce.Com, Inc. | Systems, methods, and apparatuses for implementing machine learning model training and deployment with a rollback mechanism |
US20180025276A1 (en) * | 2016-07-20 | 2018-01-25 | Dell Software, Inc. | System for Managing Effective Self-Service Analytic Workflows |
US11443206B2 (en) | 2015-03-23 | 2022-09-13 | Tibco Software Inc. | Adaptive filtering and modeling via adaptive experimental designs to identify emerging data patterns from large volume, high dimensional, high velocity streaming data |
CN107615395B (zh) * | 2015-03-26 | 2021-02-05 | 外科安全技术公司 | 用于事件和差错预测的手术室黑盒设备、系统、方法和计算机可读介质 |
US9665460B2 (en) * | 2015-05-26 | 2017-05-30 | Microsoft Technology Licensing, Llc | Detection of abnormal resource usage in a data center |
US9826041B1 (en) | 2015-06-04 | 2017-11-21 | Amazon Technologies, Inc. | Relative placement of volume partitions |
US9826030B1 (en) * | 2015-06-04 | 2017-11-21 | Amazon Technologies, Inc. | Placement of volume partition replica pairs |
EP3278213A4 (en) * | 2015-06-05 | 2019-01-30 | C3 IoT, Inc. | SYSTEMS, METHODS AND DEVICES FOR AN APPLICATION DEVELOPMENT PLATFORM OF AN INTERNET OF THE THINGS OF A COMPANY |
WO2016205368A1 (en) * | 2015-06-15 | 2016-12-22 | Utility Api | Interface coordination |
US10762517B2 (en) | 2015-07-01 | 2020-09-01 | Ebay Inc. | Subscription churn prediction |
US10474566B2 (en) * | 2015-08-05 | 2019-11-12 | Equifax Inc. | Model integration tool |
US20170063723A1 (en) * | 2015-08-26 | 2017-03-02 | International Business Machines Corporation | Asset arrangement management for a shared pool of configurable computing resources associated with a streaming application |
US10204307B1 (en) * | 2015-09-17 | 2019-02-12 | Microsoft Technology Licensing, Llc | Classification of members in a social networking service |
US10769426B2 (en) | 2015-09-30 | 2020-09-08 | Microsoft Technology Licensing, Llc | Inferring attributes of organizations using member graph |
US11169978B2 (en) | 2015-10-14 | 2021-11-09 | Dr Holdco 2, Inc. | Distributed pipeline optimization for data preparation |
US20200034745A1 (en) * | 2015-10-19 | 2020-01-30 | Nutanix, Inc. | Time series analysis and forecasting using a distributed tournament selection process |
US11347904B2 (en) * | 2015-11-30 | 2022-05-31 | Autodesk, Inc. | Techniques for modeling behaviors of systems via transformations of authoritative models |
US10438132B2 (en) * | 2015-12-16 | 2019-10-08 | Accenture Global Solutions Limited | Machine for development and deployment of analytical models |
US11170445B2 (en) * | 2015-12-16 | 2021-11-09 | Alegeus Technologies, Llc | Systems and methods for allocating resources using information technology infrastructure |
US10387798B2 (en) | 2015-12-16 | 2019-08-20 | Accenture Global Solutions Limited | Machine for development of analytical models |
US10922640B2 (en) * | 2015-12-22 | 2021-02-16 | Sap Se | Smart template for predictive analytics |
US11088912B2 (en) * | 2015-12-26 | 2021-08-10 | Intel Corporation | Distributed framework for resilient machine-to-machine system management |
US20170185904A1 (en) * | 2015-12-29 | 2017-06-29 | 24/7 Customer, Inc. | Method and apparatus for facilitating on-demand building of predictive models |
US11715025B2 (en) * | 2015-12-30 | 2023-08-01 | Nutanix, Inc. | Method for forecasting distributed resource utilization in a virtualization environment |
US20170193371A1 (en) * | 2015-12-31 | 2017-07-06 | Cisco Technology, Inc. | Predictive analytics with stream database |
EP3188041B1 (en) * | 2015-12-31 | 2021-05-05 | Dassault Systèmes | Update of a machine learning system |
EP3188038B1 (en) * | 2015-12-31 | 2020-11-04 | Dassault Systèmes | Evaluation of a training set |
CA2954839A1 (en) | 2016-01-22 | 2017-07-22 | Wal-Mart Stores, Inc. | Systems and methods of enabling forecasting |
US10387909B2 (en) * | 2016-01-25 | 2019-08-20 | Adobe Inc. | Simulation-based evaluation of a marketing channel attribution model |
US10402700B2 (en) * | 2016-01-25 | 2019-09-03 | Deepmind Technologies Limited | Generating images using neural networks |
EP3416105A4 (en) * | 2016-02-12 | 2019-02-20 | Sony Corporation | INFORMATION PROCESSING METHOD AND INFORMATION PROCESSING DEVICE |
US20170255864A1 (en) * | 2016-03-05 | 2017-09-07 | Panoramic Power Ltd. | Systems and Methods Thereof for Determination of a Device State Based on Current Consumption Monitoring and Machine Learning Thereof |
US10541817B2 (en) * | 2016-03-14 | 2020-01-21 | Ricoh Company, Ltd. | Data generation apparatus, data recording system, and program product |
WO2017156791A1 (en) * | 2016-03-18 | 2017-09-21 | Microsoft Technology Licensing, Llc | Method and apparatus for training a learning machine |
CA2961466A1 (en) * | 2016-04-01 | 2017-10-01 | Wal-Mart Stores, Inc. | Systems and methods of controlling quantities of denominations of currency at a retail shopping facility |
US10956823B2 (en) | 2016-04-08 | 2021-03-23 | Cognizant Technology Solutions U.S. Corporation | Distributed rule-based probabilistic time-series classifier |
US10379502B2 (en) * | 2016-04-11 | 2019-08-13 | Accenture Global Solutions Limited | Control system with machine learning time-series modeling |
US11080435B2 (en) | 2016-04-29 | 2021-08-03 | Accenture Global Solutions Limited | System architecture with visual modeling tool for designing and deploying complex models to distributed computing clusters |
US11157854B2 (en) * | 2016-05-09 | 2021-10-26 | Sap Se | Automatic status detection for an asynchronous processing request |
US10168953B1 (en) | 2016-05-20 | 2019-01-01 | Nutanix, Inc. | Dynamic scheduling of distributed storage management tasks using predicted system characteristics |
US10902324B2 (en) | 2016-06-13 | 2021-01-26 | Nutanix, Inc. | Dynamic data snapshot management using predictive modeling |
US11941140B2 (en) | 2016-06-19 | 2024-03-26 | Data.World, Inc. | Platform management of integrated access of public and privately-accessible datasets utilizing federated query generation and query schema rewriting optimization |
US11468049B2 (en) | 2016-06-19 | 2022-10-11 | Data.World, Inc. | Data ingestion to generate layered dataset interrelations to form a system of networked collaborative datasets |
US10824637B2 (en) | 2017-03-09 | 2020-11-03 | Data.World, Inc. | Matching subsets of tabular data arrangements to subsets of graphical data arrangements at ingestion into data driven collaborative datasets |
US11947554B2 (en) | 2016-06-19 | 2024-04-02 | Data.World, Inc. | Loading collaborative datasets into data stores for queries via distributed computer networks |
US10452975B2 (en) | 2016-06-19 | 2019-10-22 | Data.World, Inc. | Platform management of integrated access of public and privately-accessible datasets utilizing federated query generation and query schema rewriting optimization |
US10645548B2 (en) | 2016-06-19 | 2020-05-05 | Data.World, Inc. | Computerized tool implementation of layered data files to discover, form, or analyze dataset interrelations of networked collaborative datasets |
US10853376B2 (en) | 2016-06-19 | 2020-12-01 | Data.World, Inc. | Collaborative dataset consolidation via distributed computer networks |
US11334625B2 (en) | 2016-06-19 | 2022-05-17 | Data.World, Inc. | Loading collaborative datasets into data stores for queries via distributed computer networks |
US11675808B2 (en) | 2016-06-19 | 2023-06-13 | Data.World, Inc. | Dataset analysis and dataset attribute inferencing to form collaborative datasets |
US10747774B2 (en) | 2016-06-19 | 2020-08-18 | Data.World, Inc. | Interactive interfaces to present data arrangement overviews and summarized dataset attributes for collaborative datasets |
US10438013B2 (en) | 2016-06-19 | 2019-10-08 | Data.World, Inc. | Platform management of integrated access of public and privately-accessible datasets utilizing federated query generation and query schema rewriting optimization |
US11755602B2 (en) | 2016-06-19 | 2023-09-12 | Data.World, Inc. | Correlating parallelized data from disparate data sources to aggregate graph data portions to predictively identify entity data |
US10353911B2 (en) | 2016-06-19 | 2019-07-16 | Data.World, Inc. | Computerized tools to discover, form, and analyze dataset interrelations among a system of networked collaborative datasets |
US11023104B2 (en) | 2016-06-19 | 2021-06-01 | data.world,Inc. | Interactive interfaces as computerized tools to present summarization data of dataset attributes for collaborative datasets |
US10324925B2 (en) | 2016-06-19 | 2019-06-18 | Data.World, Inc. | Query generation for collaborative datasets |
WO2018005489A1 (en) * | 2016-06-27 | 2018-01-04 | Purepredictive, Inc. | Data quality detection and compensation for machine learning |
US10223482B2 (en) * | 2016-06-29 | 2019-03-05 | International Business Machines Corporation | Machine learning assisted reservoir simulation |
US10402180B2 (en) * | 2016-06-29 | 2019-09-03 | Google Llc | Latency reduction in feedback-based system performance determination |
US10140164B2 (en) | 2016-07-25 | 2018-11-27 | Accenture Global Solutions Limited | Computer resource allocation to workloads in an information technology environment |
US10871753B2 (en) | 2016-07-27 | 2020-12-22 | Accenture Global Solutions Limited | Feedback loop driven end-to-end state control of complex data-analytic systems |
US20180039905A1 (en) * | 2016-08-03 | 2018-02-08 | International Business Machines Corporation | Large scale distributed training of data analytics models |
US10340734B2 (en) * | 2016-08-22 | 2019-07-02 | Nec Corporation | Power generation systems with monitoring for anomaly detection via nonlinear relationship modeling |
US10650008B2 (en) | 2016-08-26 | 2020-05-12 | International Business Machines Corporation | Parallel scoring of an ensemble model |
US10558919B2 (en) | 2016-09-06 | 2020-02-11 | International Business Machines Corporation | Predictive analysis with large predictive models |
US20180068222A1 (en) * | 2016-09-07 | 2018-03-08 | International Business Machines Corporation | System and Method of Advising Human Verification of Machine-Annotated Ground Truth - Low Entropy Focus |
CN106383766B (zh) * | 2016-09-09 | 2018-09-11 | 北京百度网讯科技有限公司 | 系统监控方法和装置 |
AU2017322386B2 (en) | 2016-09-09 | 2022-02-10 | Equifax Inc. | Updating attribute data structures to indicate joint relationships among attributes and predictive outputs for training automated modeling systems |
US11726979B2 (en) | 2016-09-13 | 2023-08-15 | Oracle International Corporation | Determining a chronological order of transactions executed in relation to an object stored in a storage system |
US10733159B2 (en) | 2016-09-14 | 2020-08-04 | Oracle International Corporation | Maintaining immutable data and mutable metadata in a storage system |
US11308049B2 (en) | 2016-09-16 | 2022-04-19 | Oracle International Corporation | Method and system for adaptively removing outliers from data used in training of predictive models |
US9996074B2 (en) | 2016-09-21 | 2018-06-12 | International Business Machines Corporation | System and predictive modeling method for smelting process control based on multi-source information with heterogeneous relatedness |
US10643154B2 (en) | 2016-09-21 | 2020-05-05 | Equifax Inc. | Transforming attributes for training automated modeling systems |
CN109952581A (zh) | 2016-09-28 | 2019-06-28 | D5A1有限责任公司 | 用于机器学习系统的学习教练 |
US20180096267A1 (en) * | 2016-09-30 | 2018-04-05 | Salesforce.Com, Inc. | Single model-based behavior predictions in an on-demand environment |
US10484301B1 (en) | 2016-09-30 | 2019-11-19 | Nutanix, Inc. | Dynamic resource distribution using periodicity-aware predictive modeling |
US10579751B2 (en) * | 2016-10-14 | 2020-03-03 | International Business Machines Corporation | System and method for conducting computing experiments |
US10691491B2 (en) | 2016-10-19 | 2020-06-23 | Nutanix, Inc. | Adapting a pre-trained distributed resource predictive model to a target distributed computing environment |
JP7107926B2 (ja) * | 2016-10-21 | 2022-07-27 | データロボット, インコーポレイテッド | 予測データ分析のためのシステムおよび関連する方法および装置 |
EP3516510B1 (en) * | 2016-10-24 | 2023-09-27 | Siemens Aktiengesellschaft | House of quality for federated manufacturing apps |
US11036552B2 (en) * | 2016-10-25 | 2021-06-15 | International Business Machines Corporation | Cognitive scheduler |
US10860534B2 (en) | 2016-10-27 | 2020-12-08 | Oracle International Corporation | Executing a conditional command on an object stored in a storage system |
US10275177B2 (en) | 2016-10-31 | 2019-04-30 | Oracle International Corporation | Data layout schemas for seamless data migration |
US10956051B2 (en) | 2016-10-31 | 2021-03-23 | Oracle International Corporation | Data-packed storage containers for streamlined access and migration |
US10191936B2 (en) | 2016-10-31 | 2019-01-29 | Oracle International Corporation | Two-tier storage protocol for committing changes in a storage system |
US10180863B2 (en) | 2016-10-31 | 2019-01-15 | Oracle International Corporation | Determining system information based on object mutation events |
US10169081B2 (en) * | 2016-10-31 | 2019-01-01 | Oracle International Corporation | Use of concurrent time bucket generations for scalable scheduling of operations in a computer system |
US10769549B2 (en) * | 2016-11-21 | 2020-09-08 | Google Llc | Management and evaluation of machine-learned models based on locally logged data |
US10466978B1 (en) | 2016-11-30 | 2019-11-05 | Composable Analytics, Inc. | Intelligent assistant for automating recommendations for analytics programs |
US10956469B2 (en) * | 2017-01-06 | 2021-03-23 | International Business Machines Corporation | System and method for metadata correlation using natural language processing |
US10425353B1 (en) | 2017-01-27 | 2019-09-24 | Triangle Ip, Inc. | Machine learning temporal allocator |
US10776428B2 (en) | 2017-02-16 | 2020-09-15 | Nasdaq Technology Ab | Systems and methods of retrospectively determining how submitted data transaction requests operate against a dynamic data structure |
US10789097B2 (en) * | 2017-02-16 | 2020-09-29 | Nasdaq Technology Ab | Methods and systems of scheduling computer processes or tasks in a distributed system |
US10902357B2 (en) * | 2017-02-28 | 2021-01-26 | International Business Machines Corporation | Dynamic cognitive issue archiving and resolution insight |
US10984352B2 (en) * | 2017-02-28 | 2021-04-20 | International Business Machines Corporation | Dynamic cognitive issue archiving and resolution insight |
US10585737B2 (en) | 2017-02-28 | 2020-03-10 | International Business Machines Corporation | Dynamic cognitive issue archiving and resolution insight |
US11238109B2 (en) * | 2017-03-09 | 2022-02-01 | Data.World, Inc. | Computerized tools configured to determine subsets of graph data arrangements for linking relevant data to enrich datasets associated with a data-driven collaborative dataset platform |
US11068453B2 (en) * | 2017-03-09 | 2021-07-20 | data.world, Inc | Determining a degree of similarity of a subset of tabular data arrangements to subsets of graph data arrangements at ingestion into a data-driven collaborative dataset platform |
US11354565B2 (en) * | 2017-03-15 | 2022-06-07 | Salesforce.Com, Inc. | Probability-based guider |
US11640617B2 (en) * | 2017-03-21 | 2023-05-02 | Adobe Inc. | Metric forecasting employing a similarity determination in a digital medium environment |
US11915152B2 (en) | 2017-03-24 | 2024-02-27 | D5Ai Llc | Learning coach for machine learning system |
JP6823523B2 (ja) * | 2017-03-31 | 2021-02-03 | Kddi株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US10387900B2 (en) | 2017-04-17 | 2019-08-20 | DataRobot, Inc. | Methods and apparatus for self-adaptive time series forecasting engine |
US9785886B1 (en) | 2017-04-17 | 2017-10-10 | SparkCognition, Inc. | Cooperative execution of a genetic algorithm with an efficient training algorithm for data-driven model creation |
US11734584B2 (en) * | 2017-04-19 | 2023-08-22 | International Business Machines Corporation | Multi-modal construction of deep learning networks |
US11354749B2 (en) * | 2017-04-27 | 2022-06-07 | Sap Se | Computing device for machine learning based risk analysis |
US10963790B2 (en) * | 2017-04-28 | 2021-03-30 | SparkCognition, Inc. | Pre-processing for data-driven model creation |
US10944219B2 (en) * | 2017-05-30 | 2021-03-09 | Hubbell Incorporated | Power connector with integrated status monitoring |
US11195601B2 (en) * | 2017-05-31 | 2021-12-07 | International Business Machines Corporation | Constructing prediction targets from a clinically-defined hierarchy |
CN110892417B (zh) | 2017-06-05 | 2024-02-20 | D5Ai有限责任公司 | 具有学习教练的异步代理以及在不降低性能的情况下在结构上修改深度神经网络 |
US10725773B2 (en) * | 2017-06-07 | 2020-07-28 | Articoder, Inc. | Mass propagation of source code changes |
US10769193B2 (en) | 2017-06-20 | 2020-09-08 | International Business Machines Corporation | Predictive model clustering |
US11823067B2 (en) * | 2017-06-27 | 2023-11-21 | Hcl Technologies Limited | System and method for tuning and deploying an analytical model over a target eco-system |
US11531909B2 (en) * | 2017-06-30 | 2022-12-20 | Abeja, Inc. | Computer system and method for machine learning or inference |
US10789301B1 (en) | 2017-07-12 | 2020-09-29 | Groupon, Inc. | Method, apparatus, and computer program product for inferring device rendered object interaction behavior |
CN107231436B (zh) * | 2017-07-14 | 2021-02-02 | 网宿科技股份有限公司 | 一种进行业务调度的方法和装置 |
EP3663992A4 (en) * | 2017-07-31 | 2021-05-05 | Aising Ltd. | METHOD OF INTEGRATING A LEARNING LEARNING MODEL, DEVICE, PROGRAM, IC CHIP AND SYSTEM |
US20180365556A1 (en) * | 2017-07-31 | 2018-12-20 | Seematics Systems Ltd | System and method for generating and using descriptors of artificial neural networks |
US11227188B2 (en) * | 2017-08-04 | 2022-01-18 | Fair Ip, Llc | Computer system for building, training and productionizing machine learning models |
US10572827B2 (en) | 2017-08-08 | 2020-02-25 | International Business Machines Corporation | Prediction quality assessment |
US20190057170A1 (en) * | 2017-08-15 | 2019-02-21 | Arundo Analytics, Inc. | Identifying and Removing Sets of Sensor Data from Models |
CN107491970B (zh) * | 2017-08-17 | 2021-04-02 | 北京三快在线科技有限公司 | 实时反作弊检测监控方法和系统以及计算设备 |
US10984439B2 (en) * | 2017-08-23 | 2021-04-20 | Starcom Mediavest Group | Method and system to account for timing and quantity purchased in attribution models in advertising |
US10984476B2 (en) * | 2017-08-23 | 2021-04-20 | Io Strategies Llc | Method and apparatus for determining inventor impact |
US10628997B2 (en) * | 2017-08-24 | 2020-04-21 | Emilio Santos | Method for generating three-dimensional models from constrained sketches and an instruction set |
EP3451219A1 (en) | 2017-08-31 | 2019-03-06 | KBC Groep NV | Improved anomaly detection |
US10949764B2 (en) | 2017-08-31 | 2021-03-16 | International Business Machines Corporation | Automatic model refreshment based on degree of model degradation |
US11238409B2 (en) | 2017-09-29 | 2022-02-01 | Oracle International Corporation | Techniques for extraction and valuation of proficiencies for gap detection and remediation |
JP6886112B2 (ja) * | 2017-10-04 | 2021-06-16 | 富士通株式会社 | 学習プログラム、学習装置及び学習方法 |
WO2019074494A1 (en) * | 2017-10-10 | 2019-04-18 | Liquid Biosciences, Inc. | METHODS OF IDENTIFYING MODELS FOR ITERATIVE MODEL DEVELOPMENT TECHNIQUES |
US11341429B1 (en) * | 2017-10-11 | 2022-05-24 | Snap Inc. | Distributed machine learning for improved privacy |
US10831704B1 (en) * | 2017-10-16 | 2020-11-10 | BlueOwl, LLC | Systems and methods for automatically serializing and deserializing models |
US11379655B1 (en) | 2017-10-16 | 2022-07-05 | BlueOwl, LLC | Systems and methods for automatically serializing and deserializing models |
US20190130303A1 (en) * | 2017-10-26 | 2019-05-02 | International Business Machines Corporation | Smart default threshold values in continuous learning |
EP3483797A1 (en) * | 2017-11-13 | 2019-05-15 | Accenture Global Solutions Limited | Training, validating, and monitoring artificial intelligence and machine learning models |
US10990901B2 (en) * | 2017-11-13 | 2021-04-27 | Accenture Global Solutions Limited | Training, validating, and monitoring artificial intelligence and machine learning models |
US11170309B1 (en) | 2017-11-22 | 2021-11-09 | Amazon Technologies, Inc. | System for routing machine learning model inferences |
US11977958B2 (en) * | 2017-11-22 | 2024-05-07 | Amazon Technologies, Inc. | Network-accessible machine learning model training and hosting system |
CN113762504A (zh) * | 2017-11-29 | 2021-12-07 | 华为技术有限公司 | 模型训练系统、方法和存储介质 |
KR102052694B1 (ko) * | 2017-12-11 | 2019-12-05 | 주식회사 핀인사이트 | 데이터 그룹의 결합을 통한 데이터 분석 방법, 장치 및 컴퓨터 판독가능 매체 |
WO2019131527A1 (ja) * | 2017-12-26 | 2019-07-04 | 株式会社エイシング | 汎用学習済モデルの生成方法 |
CN108062240A (zh) * | 2017-12-28 | 2018-05-22 | 徐畅畅 | 基于vb和python的问卷录入与绘图系统 |
US11409576B2 (en) | 2017-12-29 | 2022-08-09 | Entefy Inc. | Dynamic distribution of a workload processing pipeline on a computing infrastructure |
US20190208750A1 (en) * | 2018-01-09 | 2019-07-11 | International Business Machines Corporation | Methods and systems for managing aquaculture production |
US10656775B2 (en) | 2018-01-23 | 2020-05-19 | Bank Of America Corporation | Real-time processing of data and dynamic delivery via an interactive interface |
US11321612B2 (en) | 2018-01-30 | 2022-05-03 | D5Ai Llc | Self-organizing partially ordered networks and soft-tying learned parameters, such as connection weights |
US10977106B2 (en) * | 2018-02-09 | 2021-04-13 | Microsoft Technology Licensing, Llc | Tree-based anomaly detection |
US10262271B1 (en) * | 2018-02-14 | 2019-04-16 | DataTron Technologies Inc. | Systems and methods for modeling machine learning and data analytics |
US11205143B2 (en) * | 2018-02-16 | 2021-12-21 | Accenture Global Solutions Limited | Utilizing a machine learning model and natural language processing to manage and allocate tasks |
WO2019161138A1 (en) * | 2018-02-16 | 2019-08-22 | Reneo, Inc. | Scalable life-cycle maintenance of hardware |
US11983623B1 (en) | 2018-02-27 | 2024-05-14 | Workday, Inc. | Data validation for automatic model building and release |
DE102018203851A1 (de) | 2018-03-14 | 2019-09-19 | Robert Bosch Gmbh | Maschinelles Lernverfahren für eine Vorrichtung zur Signalauswertung |
US10684935B2 (en) * | 2018-03-16 | 2020-06-16 | Cisco Technology, Inc. | Deriving the shortest steps to reproduce a device failure condition |
US10922308B2 (en) | 2018-03-20 | 2021-02-16 | Data.World, Inc. | Predictive determination of constraint data for application with linked data in graph-based datasets associated with a data-driven collaborative dataset platform |
US11243960B2 (en) | 2018-03-20 | 2022-02-08 | Data.World, Inc. | Content addressable caching and federation in linked data projects in a data-driven collaborative dataset platform using disparate database architectures |
JP6886935B2 (ja) * | 2018-03-22 | 2021-06-16 | 株式会社日立製作所 | データ分析支援システムおよびデータ分析支援方法 |
US11250951B2 (en) * | 2018-03-30 | 2022-02-15 | Hitachi, Ltd. | Feature engineering method, apparatus, and system |
EP3557510A1 (en) | 2018-04-16 | 2019-10-23 | Siemens Aktiengesellschaft | Method and tool for system development |
CN110389763B (zh) * | 2018-04-20 | 2023-06-16 | 伊姆西Ip控股有限责任公司 | 用于调度专用处理资源的方法、设备和计算机可读介质 |
US11995538B2 (en) * | 2018-05-10 | 2024-05-28 | Microsoft Technology Licensing, Llc | Selecting a neural network architecture for a supervised machine learning problem |
US20190349273A1 (en) * | 2018-05-14 | 2019-11-14 | Servicenow, Inc. | Systems and method for incident forecasting |
USD940732S1 (en) | 2018-05-22 | 2022-01-11 | Data.World, Inc. | Display screen or portion thereof with a graphical user interface |
US11182721B2 (en) * | 2018-05-22 | 2021-11-23 | International Business Machines Corporation | Healthcare risk analytics |
USD940169S1 (en) | 2018-05-22 | 2022-01-04 | Data.World, Inc. | Display screen or portion thereof with a graphical user interface |
US11947529B2 (en) | 2018-05-22 | 2024-04-02 | Data.World, Inc. | Generating and analyzing a data model to identify relevant data catalog data derived from graph-based data arrangements to perform an action |
US11442988B2 (en) | 2018-06-07 | 2022-09-13 | Data.World, Inc. | Method and system for editing and maintaining a graph schema |
WO2019236119A1 (en) * | 2018-06-07 | 2019-12-12 | Hewlett-Packard Development Company, L.P. | Evaluation of a performance parameter of a monitoring service |
JP6983115B2 (ja) * | 2018-06-13 | 2021-12-17 | 株式会社日立物流 | 物流予測システム及び予測方法 |
US11496602B2 (en) * | 2018-06-26 | 2022-11-08 | International Business Machines Corporation | Fence computing |
US11244222B2 (en) * | 2018-06-27 | 2022-02-08 | Sony Corporation | Artificial intelligence-enabled device for network connectivity independent delivery of consumable information |
US11580118B2 (en) | 2018-07-09 | 2023-02-14 | Rutgers, The State University Of New Jersey | Data exploration as search over automated pre-generated plot objects |
US10853718B2 (en) * | 2018-07-20 | 2020-12-01 | EMC IP Holding Company LLC | Predicting time-to-finish of a workflow using deep neural network with biangular activation functions |
US11188930B2 (en) * | 2018-07-26 | 2021-11-30 | EMC IP Holding Company LLC | Dynamically determining customer intent and related recommendations using deep learning techniques |
US20200034665A1 (en) | 2018-07-30 | 2020-01-30 | DataRobot, Inc. | Determining validity of machine learning algorithms for datasets |
JP7099163B2 (ja) * | 2018-08-10 | 2022-07-12 | 株式会社リコー | 学習装置および学習方法 |
WO2020036590A1 (en) * | 2018-08-14 | 2020-02-20 | Connect Financial LLC | Evaluation and development of decision-making models |
US11574233B2 (en) * | 2018-08-30 | 2023-02-07 | International Business Machines Corporation | Suggestion and completion of deep learning models from a catalog |
US20200089650A1 (en) * | 2018-09-14 | 2020-03-19 | Software Ag | Techniques for automated data cleansing for machine learning algorithms |
KR102011220B1 (ko) * | 2018-09-20 | 2019-08-14 | 건국대학교 산학협력단 | 심층 신경망 관리 방법 및 장치 |
WO2020069393A1 (en) | 2018-09-27 | 2020-04-02 | Oracle International Corporation | Techniques for data-driven correlation of metrics |
US11467803B2 (en) | 2019-09-13 | 2022-10-11 | Oracle International Corporation | Identifying regulator and driver signals in data systems |
US11636292B2 (en) | 2018-09-28 | 2023-04-25 | Hartford Steam Boiler Inspection And Insurance Company | Dynamic outlier bias reduction system and method |
CN109462578B (zh) * | 2018-10-22 | 2022-01-11 | 南开大学 | 基于统计学习的威胁情报利用与繁殖方法 |
US11373199B2 (en) | 2018-10-26 | 2022-06-28 | Target Brands, Inc. | Method and system for generating ensemble demand forecasts |
US11170391B2 (en) * | 2018-10-26 | 2021-11-09 | Target Brands, Inc. | Method and system for validating ensemble demand forecasts |
US11295324B2 (en) | 2018-10-26 | 2022-04-05 | Target Brands, Inc. | Method and system for generating disaggregated demand forecasts from ensemble demand forecasts |
US11928985B2 (en) * | 2018-10-30 | 2024-03-12 | International Business Machines Corporation | Content pre-personalization using biometric data |
KR102109886B1 (ko) * | 2018-11-09 | 2020-05-12 | 서울시립대학교 산학협력단 | 로봇 시스템 및 이의 서비스 제공 방법 |
US11262207B2 (en) | 2018-11-27 | 2022-03-01 | International Business Machines Corporation | User interface |
US20200183748A1 (en) * | 2018-12-10 | 2020-06-11 | Vivek Bhatnagar | Methods and systems that generate optimal or near-optimal matching of resources to resource users by employing resource-exchange optimization tools |
US11227295B2 (en) | 2018-12-18 | 2022-01-18 | Kalibrate Technologies Limited | Methods and systems for generating an aggregated data stream |
US10936974B2 (en) * | 2018-12-24 | 2021-03-02 | Icertis, Inc. | Automated training and selection of models for document analysis |
US11315036B2 (en) * | 2018-12-31 | 2022-04-26 | Paypal, Inc. | Prediction for time series data using a space partitioning data structure |
US11055433B2 (en) | 2019-01-03 | 2021-07-06 | Bank Of America Corporation | Centralized advanced security provisioning platform |
US11237713B2 (en) * | 2019-01-21 | 2022-02-01 | International Business Machines Corporation | Graphical user interface based feature extraction application for machine learning and cognitive models |
GB2581140A (en) * | 2019-01-31 | 2020-08-12 | Ernst & Young Gmbh | System and method of obtaining audit evidence |
EP3926410A4 (en) | 2019-02-13 | 2022-11-23 | Fujifilm Business Innovation Corp. | IMAGE FORMING DEVICE |
US10726374B1 (en) | 2019-02-19 | 2020-07-28 | Icertis, Inc. | Risk prediction based on automated analysis of documents |
US11853657B2 (en) | 2019-02-28 | 2023-12-26 | Kalibrate Technologies Limited | Machine-learned model selection network planning |
US11475322B2 (en) * | 2019-03-05 | 2022-10-18 | Synchrony Bank | Methods of explaining an individual predictions made by predictive processes and/or predictive models |
WO2020197601A1 (en) * | 2019-03-26 | 2020-10-01 | Hrl Laboratories, Llc | Systems and methods for forecast alerts with programmable human-machine hybrid ensemble learning |
CA3131688A1 (en) | 2019-03-27 | 2020-10-01 | Olivier Francon | Process and system including an optimization engine with evolutionary surrogate-assisted prescriptions |
US11778945B2 (en) * | 2019-04-10 | 2023-10-10 | Deere & Company | Machine control using real-time model |
US20200334498A1 (en) * | 2019-04-17 | 2020-10-22 | International Business Machines Corporation | User behavior risk analytic system with multiple time intervals and shared data extraction |
CN110022378B (zh) * | 2019-04-22 | 2021-09-10 | 苏州排忧网络技术有限责任公司 | 基于状态的vpn服务器智能分配方法 |
US20200342302A1 (en) * | 2019-04-24 | 2020-10-29 | Accenture Global Solutions Limited | Cognitive forecasting |
EP3969966A4 (en) * | 2019-05-17 | 2023-06-21 | Tata Consultancy Services Limited | METHOD AND SYSTEM FOR ADAPTIVE LEARNING OF MODELS FOR MANUFACTURING SYSTEMS |
WO2020254924A1 (en) * | 2019-06-16 | 2020-12-24 | Way2Vat Ltd. | Systems and methods for document image analysis with cardinal graph convolutional networks |
CA3050951A1 (en) * | 2019-06-21 | 2019-10-11 | Inspectorio Inc. | Factory risk estimation using historical inspection data |
RU2716029C1 (ru) * | 2019-07-04 | 2020-03-05 | Общество с ограниченной ответственностью «Инлексис» (ООО «Инлексис») | Система мониторинга качества и процессов на базе машинного обучения |
US10614382B1 (en) | 2019-07-12 | 2020-04-07 | Capital One Services, Llc | Computer-based systems and methods configured to utilize automating deployment of predictive models for machine learning tasks |
JP7269122B2 (ja) * | 2019-07-18 | 2023-05-08 | 株式会社日立ハイテク | データ分析装置、データ分析方法及びデータ分析プログラム |
US20220261510A1 (en) | 2019-07-23 | 2022-08-18 | Showa Denko K.K. | Material design system, material design method, and material design program |
KR102184927B1 (ko) * | 2019-07-31 | 2020-12-01 | 베스핀글로벌 주식회사 | 예약 인스턴스 재판매 시스템 및 방법 |
US11263050B2 (en) | 2019-08-07 | 2022-03-01 | Bank Of America Corporation | System for generating electronic alerts through predictive optimization analysis of resource conversions |
CA3090143A1 (en) * | 2019-08-14 | 2021-02-14 | Royal Bank Of Canada | Systems and methods of generating resource allocation insights based on datasets |
KR102149495B1 (ko) * | 2019-08-19 | 2020-08-28 | 고려대학교 산학협력단 | 환경 예측 모델의 훈련지표 최적화 장치 및 그 동작방법 |
WO2021033338A1 (ja) * | 2019-08-22 | 2021-02-25 | 日本電気株式会社 | 分析システム、装置、制御方法、及びプログラム |
US20210056490A1 (en) * | 2019-08-22 | 2021-02-25 | Mitchell International, Inc. | Methods for real time management of assignment of electronic bills and devices thereof |
US11144429B2 (en) * | 2019-08-26 | 2021-10-12 | International Business Machines Corporation | Detecting and predicting application performance |
KR102634916B1 (ko) * | 2019-08-29 | 2024-02-06 | 주식회사 엘지에너지솔루션 | 온도 추정 모델 결정 방법 및 장치, 온도 추정 모델이 적용된 배터리 관리 시스템 |
CN114365079A (zh) * | 2019-08-29 | 2022-04-15 | 西门子股份公司 | 作为系统性能模拟的预处理的基于性能的系统配置 |
JP7309533B2 (ja) | 2019-09-06 | 2023-07-18 | 株式会社日立製作所 | モデル改善支援システム |
US11328177B2 (en) | 2019-09-18 | 2022-05-10 | Hartford Steam Boiler Inspection And Insurance Company | Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models |
GB202402945D0 (en) | 2019-09-18 | 2024-04-17 | Hartford Steam Boiler Inspection And Insurance Company | Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models |
US11615348B2 (en) | 2019-09-18 | 2023-03-28 | Hartford Steam Boiler Inspection And Insurance Company | Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models |
EP4040354A4 (en) * | 2019-10-01 | 2023-06-14 | JGC Corporation | WORK MANAGEMENT DEVICE, WORK MANAGEMENT METHOD AND RECORDING MEDIA |
US10963231B1 (en) | 2019-10-15 | 2021-03-30 | UiPath, Inc. | Using artificial intelligence to select and chain models for robotic process automation |
US11593709B2 (en) | 2019-10-15 | 2023-02-28 | UiPath, Inc. | Inserting and/or replacing machine learning models in a pipeline for robotic process automation workflows |
JP2022552320A (ja) * | 2019-10-16 | 2022-12-15 | ピーディーエフ ソリューションズ,インコーポレイテッド | 累積予測による機械学習変数選択および根本原因発見 |
US11699132B1 (en) | 2019-10-23 | 2023-07-11 | Relativity Oda Llc | Methods and systems for facilitating family-based review |
US20230010651A1 (en) * | 2019-10-29 | 2023-01-12 | Abb Schweiz Ag | System and Method for Online Optimization of Sensor Fusion Model |
EP4066168A4 (en) * | 2019-11-25 | 2023-04-05 | Zestfinance, Inc. | AUTOMATIC PATTERN GENERATION SYSTEMS AND METHODS |
KR102235588B1 (ko) * | 2019-12-09 | 2021-04-02 | 한국로봇융합연구원 | 다중 계층을 포함하는 인공지능 모델의 계층별 추론 분류 성능 평가 방법 및 평가 장치 |
CN111177577B (zh) * | 2019-12-12 | 2023-03-28 | 中国科学院深圳先进技术研究院 | 一种群组的项目推荐方法、智能终端以及存储装置 |
CN110991762A (zh) * | 2019-12-13 | 2020-04-10 | 新奥数能科技有限公司 | 预测方法、装置、计算机可读存储介质及电子设备 |
US11640555B2 (en) * | 2019-12-21 | 2023-05-02 | Aptology, Inc. | Machine and deep learning process modeling of performance and behavioral data |
WO2021138216A1 (en) * | 2019-12-30 | 2021-07-08 | Prevedere, Inc. | Systems and methods for business analytics model scoring and selection |
CN111177657B (zh) * | 2019-12-31 | 2023-09-08 | 北京顺丰同城科技有限公司 | 需求确定方法、系统、电子设备及存储介质 |
US11403347B2 (en) * | 2020-01-08 | 2022-08-02 | Sap Se | Automated master data classification and curation using machine learning |
US11374823B2 (en) * | 2020-01-09 | 2022-06-28 | Mitel Networks Corp. | Telemetry-based method and system for predictive resource scaling |
DE102020100565A1 (de) | 2020-01-13 | 2021-07-15 | Aixtron Se | Verfahren zum Abscheiden von Schichten |
US11157823B2 (en) | 2020-02-04 | 2021-10-26 | Vignet Incorporated | Predicting outcomes of digital therapeutics and other interventions in clinical research |
US11195203B2 (en) * | 2020-02-04 | 2021-12-07 | The Rocket Science Group Llc | Predicting outcomes via marketing asset analytics |
US11151462B2 (en) | 2020-02-04 | 2021-10-19 | Vignet Incorporated | Systems and methods for using machine learning to improve processes for achieving readiness |
US11328796B1 (en) | 2020-02-25 | 2022-05-10 | Vignet Incorporated | Techniques for selecting cohorts for decentralized clinical trials for pharmaceutical research |
US11146471B2 (en) | 2020-02-28 | 2021-10-12 | International Business Machines Corporation | Process-aware trace synthesis for training process learning |
JP2021140296A (ja) * | 2020-03-03 | 2021-09-16 | 株式会社日立製作所 | データ価値定義方法、データ収集促進方法、データ価値定義システム並びにデータ収集促進システム |
CN113449008B (zh) * | 2020-03-27 | 2023-06-06 | 华为技术有限公司 | 一种建模方法及装置 |
US11556647B2 (en) * | 2020-03-30 | 2023-01-17 | Bae Systems Information And Electronic Systems Integration Inc. | System for detecting trojans in an artificial network and method therof |
CN111597226B (zh) | 2020-04-26 | 2023-06-16 | 北京百度网讯科技有限公司 | 数据挖掘系统、方法、装置、电子设备及存储介质 |
CN111708814A (zh) * | 2020-04-27 | 2020-09-25 | 广东电网有限责任公司东莞供电局 | 一种数据统计方法、装置、设备和介质 |
US11210197B2 (en) * | 2020-04-28 | 2021-12-28 | Accenture Global Solutions Limited | Prescriptive analytics based multi-parametric database-compute tier requisition stack for cloud computing |
US11681914B2 (en) | 2020-05-08 | 2023-06-20 | International Business Machines Corporation | Determining multivariate time series data dependencies |
US11461216B1 (en) | 2020-05-18 | 2022-10-04 | Vignet Incorporated | Monitoring and improving data collection using digital health technology |
US11605038B1 (en) | 2020-05-18 | 2023-03-14 | Vignet Incorporated | Selecting digital health technology to achieve data collection compliance in clinical trials |
US11775841B2 (en) | 2020-06-15 | 2023-10-03 | Cognizant Technology Solutions U.S. Corporation | Process and system including explainable prescriptions through surrogate-assisted evolution |
JP7001766B2 (ja) * | 2020-06-22 | 2022-01-20 | 株式会社日立製作所 | 予測システムおよび予測方法 |
US11531734B2 (en) * | 2020-06-30 | 2022-12-20 | Bank Of America Corporation | Determining optimal machine learning models |
US11403267B2 (en) | 2020-07-06 | 2022-08-02 | Bank Of America Corporation | Dynamic transformation code prediction and generation for unavailable data element |
US20220019918A1 (en) * | 2020-07-17 | 2022-01-20 | Servicenow, Inc. | Machine learning feature recommendation |
CN112634061A (zh) * | 2020-07-21 | 2021-04-09 | 中国再保险(集团)股份有限公司 | 一种用户数据处理方法及装置 |
US20220067423A1 (en) * | 2020-08-26 | 2022-03-03 | Beijing Didi Infinity Technology And Development Co., Ltd. | Method and system for providing and applying a unified decoding efficiency score with focus on environmental impact |
US11715037B2 (en) | 2020-09-11 | 2023-08-01 | International Business Machines Corporation | Validation of AI models using holdout sets |
US11348035B2 (en) * | 2020-10-27 | 2022-05-31 | Paypal, Inc. | Shared prediction engine for machine learning model deployment |
JP7453895B2 (ja) * | 2020-11-11 | 2024-03-21 | 株式会社日立製作所 | 探索条件提示装置、探索条件提示方法、及び探索条件提示プログラム |
KR102274984B1 (ko) * | 2020-11-12 | 2021-07-09 | 태그하이브 주식회사 | 컨텐츠 스킬 라벨링 적합성 판단 방법 및 이를 실행하는 시스템 |
US11928715B2 (en) | 2020-11-20 | 2024-03-12 | Bespin Global Inc. | System and method for reselling reserved instance |
CN112633334B (zh) * | 2020-12-09 | 2023-08-11 | 西安电子科技大学 | 一种基于卫星测运控资源规划调度的建模方法 |
CN112416602B (zh) * | 2020-12-10 | 2022-09-16 | 清华大学 | 一种分布式数据流资源弹性伸缩增强插件及增强方法 |
US20230162050A1 (en) | 2020-12-29 | 2023-05-25 | Ineeji | Method and device for predicting and controlling time series data based on automatic learning |
CN112597540B (zh) * | 2021-01-28 | 2021-10-01 | 支付宝(杭州)信息技术有限公司 | 基于隐私保护的多重共线性检测方法、装置及系统 |
US11296971B1 (en) | 2021-02-03 | 2022-04-05 | Vignet Incorporated | Managing and adapting monitoring programs |
US11361846B1 (en) | 2021-02-03 | 2022-06-14 | Vignet Incorporated | Systems and methods for customizing monitoring programs involving remote devices |
US11196656B1 (en) | 2021-02-03 | 2021-12-07 | Vignet Incorporated | Improving diversity in cohorts for health research |
US11789837B1 (en) | 2021-02-03 | 2023-10-17 | Vignet Incorporated | Adaptive data collection in clinical trials to increase the likelihood of on-time completion of a trial |
US11316941B1 (en) | 2021-02-03 | 2022-04-26 | Vignet Incorporated | Remotely managing and adapting monitoring programs using machine learning predictions |
US11521714B1 (en) | 2021-02-03 | 2022-12-06 | Vignet Incorporated | Increasing diversity of participants in health research using adaptive methods |
US11501214B2 (en) * | 2021-02-05 | 2022-11-15 | Savvi Ai Inc. | Systems and methods for managing, distributing and deploying a recursive decisioning system based on continuously updating machine learning models |
US20220300520A1 (en) * | 2021-03-16 | 2022-09-22 | Hcl Technologies Limited | Recommender system for tuning parameters to generate data analytics model and method thereof |
EP4083584A1 (en) * | 2021-04-29 | 2022-11-02 | Mettler-Toledo Garvens GmbH | Method for evaluating the performance of a dynamic weighing instrument, weighing system and computer program |
CN113705959B (zh) * | 2021-05-11 | 2023-08-15 | 北京邮电大学 | 网络资源分配方法及电子设备 |
US11227192B1 (en) * | 2021-06-04 | 2022-01-18 | Booz Allen Hamilton Inc. | System and method for data drift detection |
CN113268350B (zh) * | 2021-06-07 | 2024-01-26 | 上海数禾信息科技有限公司 | 基于云的服务构建的资源分配方法、装置、计算机设备 |
US20220405659A1 (en) * | 2021-06-16 | 2022-12-22 | International Business Machines Corporation | Data-driven automated model impact analysis |
US11354599B1 (en) | 2021-06-25 | 2022-06-07 | BRYTER GmbH | Methods and systems for generating a data structure using graphical models |
CN113554180B (zh) * | 2021-06-30 | 2022-05-31 | 北京百度网讯科技有限公司 | 信息预测方法、装置、电子设备及存储介质 |
US11914993B1 (en) * | 2021-06-30 | 2024-02-27 | Amazon Technologies, Inc. | Example-based synthesis of rules for detecting violations of software coding practices |
KR102398317B1 (ko) * | 2021-07-01 | 2022-05-16 | (주)뤼이드 | 교육의 공평성을 위한 교육 컨텐츠 추천 방법, 교육 컨텐츠 추천 장치, 및 교육 컨텐츠 추천 시스템 |
KR20230005737A (ko) * | 2021-07-01 | 2023-01-10 | (주)뤼이드 | 교육의 공평성을 위한 교육 컨텐츠 추천 방법, 교육 컨텐츠 추천 장치, 및 교육 컨텐츠 추천 시스템 |
US20230010019A1 (en) * | 2021-07-08 | 2023-01-12 | International Business Machines Corporation | System and method to optimize processing pipeline for key performance indicators |
KR102626442B1 (ko) * | 2021-07-09 | 2024-01-18 | (주)뤼이드 | 교육 컨텐츠 추천 방법, 교육 컨텐츠 추천 장치, 및 교육 컨텐츠 추천 시스템 |
KR102398319B1 (ko) * | 2021-07-09 | 2022-05-16 | (주)뤼이드 | 교육 컨텐츠 추천 방법, 교육 컨텐츠 추천 장치, 및 교육 컨텐츠 추천 시스템 |
CN113673080B (zh) * | 2021-07-15 | 2023-08-18 | 北京奇艺世纪科技有限公司 | 应用续航时长预测、模型训练方法及装置、设备及介质 |
US11695822B2 (en) * | 2021-07-16 | 2023-07-04 | Adp, Inc. | Unified integration pattern protocol for centralized handling of data feeds |
US11487667B1 (en) | 2021-08-09 | 2022-11-01 | Apple Inc. | Prediction confirmation for cache subsystem |
CN113671913B (zh) * | 2021-08-10 | 2022-09-13 | 河海大学 | 一种智能制造车间隐形扰动应对方法 |
US20230087204A1 (en) * | 2021-09-23 | 2023-03-23 | Tibco Software Inc. | Systems and methods to screen a predictive model for risks of the predictive model |
US11947600B2 (en) | 2021-11-30 | 2024-04-02 | Data.World, Inc. | Content addressable caching and federation in linked data projects in a data-driven collaborative dataset platform using disparate database architectures |
US11361034B1 (en) | 2021-11-30 | 2022-06-14 | Icertis, Inc. | Representing documents using document keys |
US11768753B2 (en) * | 2021-12-29 | 2023-09-26 | Cerner Innovation, Inc. | System and method for evaluating and deploying data models having improved performance measures |
WO2023146549A1 (en) * | 2022-01-28 | 2023-08-03 | Databricks Inc. | Automated processing of multiple prediction generation including model tuning |
US11468369B1 (en) | 2022-01-28 | 2022-10-11 | Databricks Inc. | Automated processing of multiple prediction generation including model tuning |
WO2023172206A1 (en) * | 2022-03-11 | 2023-09-14 | Smudg Company Pte. Ltd. | A system configured with an ever expanding, seuf-cauibrating, array of one or more types of attributes |
US20230297346A1 (en) * | 2022-03-18 | 2023-09-21 | C3.Ai, Inc. | Intelligent data processing system with metadata generation from iterative data analysis |
US20230368066A1 (en) * | 2022-05-16 | 2023-11-16 | Juniper Networks, Inc. | Hierarchical multi-model generation in network and cloud computing systems |
US11897818B2 (en) * | 2022-05-17 | 2024-02-13 | Concrete Ai, Inc. | Machine learning concrete optimization |
US11658881B1 (en) | 2022-06-30 | 2023-05-23 | Bank Of America Corporation | System and method for predicting anomalous requests and preventing anomalous interactions in a network |
WO2024014073A1 (ja) * | 2022-07-14 | 2024-01-18 | 住友電気工業株式会社 | モデル生成装置、モデル生成方法、需要予測装置、及びコンピュータプログラム |
US20240069874A1 (en) * | 2022-08-30 | 2024-02-29 | Fmr Llc | Intelligent generation of code for imputation of missing data in a machine learning dataset |
US11902177B1 (en) | 2022-10-14 | 2024-02-13 | Bank Of America Corporation | System for artificial intelligence-based engine for generating recommendations for resource allocation |
CN115965246B (zh) * | 2023-03-16 | 2023-05-19 | 山东省地质矿产勘查开发局八〇一水文地质工程地质大队(山东省地矿工程勘察院) | 一种岩溶塌陷灾害的预警分析方法 |
KR102616508B1 (ko) * | 2023-08-04 | 2023-12-21 | 주식회사 지뉴소프트 | 인공지능을 활용한 최적화된 건축공법을 선택하는 방법및 시스템 |
Family Cites Families (54)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5123057A (en) * | 1989-07-28 | 1992-06-16 | Massachusetts Institute Of Technology | Model based pattern recognition |
US5761442A (en) | 1994-08-31 | 1998-06-02 | Advanced Investment Technology, Inc. | Predictive neural network means and method for selecting a portfolio of securities wherein each network has been trained using data relating to a corresponding security |
US7072863B1 (en) | 1999-09-08 | 2006-07-04 | C4Cast.Com, Inc. | Forecasting using interpolation modeling |
US6810495B2 (en) * | 2001-03-30 | 2004-10-26 | International Business Machines Corporation | Method and system for software rejuvenation via flexible resource exhaustion prediction |
US7660887B2 (en) * | 2001-09-07 | 2010-02-09 | Sun Microsystems, Inc. | Systems and methods for providing dynamic quality of service for a distributed system |
US7117185B1 (en) | 2002-05-15 | 2006-10-03 | Vanderbilt University | Method, system, and apparatus for casual discovery and variable selection for classification |
US8108656B2 (en) * | 2002-08-29 | 2012-01-31 | Qst Holdings, Llc | Task definition for specifying resource requirements |
US7146361B2 (en) | 2003-05-30 | 2006-12-05 | International Business Machines Corporation | System, method and computer program product for performing unstructured information management and automatic text analysis, including a search operator functioning as a Weighted AND (WAND) |
US7796790B2 (en) * | 2003-10-17 | 2010-09-14 | Koninklijke Philips Electronics N.V. | Manual tools for model based image segmentation |
JP2005135287A (ja) | 2003-10-31 | 2005-05-26 | National Agriculture & Bio-Oriented Research Organization | 予測装置、予測方法および予測プログラム |
US7577935B2 (en) | 2004-02-14 | 2009-08-18 | Matthew T. Reynolds | Generative programming system and method employing focused grammars |
US7580852B2 (en) | 2004-04-15 | 2009-08-25 | Sap Ag | System and method for modeling non-stationary time series using a non-parametric demand profile |
US20100312718A1 (en) | 2004-06-08 | 2010-12-09 | Rosenthal Collins Group, L.L.C. | Method and system for providing electronic information for risk assesement and management via net worth for multi-market electronic trading |
US8108243B2 (en) | 2004-06-18 | 2012-01-31 | Cvidya Networks | Methods, systems and computer readable code for forecasting time series and for forecasting commodity consumption |
US7836059B2 (en) | 2004-10-26 | 2010-11-16 | Hewlett-Packard Development Company, L.P. | System and method for minimally predictive feature identification |
US20060190285A1 (en) | 2004-11-04 | 2006-08-24 | Harris Trevor M | Method and apparatus for storage and distribution of real estate related data |
US8180664B2 (en) | 2004-12-01 | 2012-05-15 | Hewlett-Packard Development Company, L.P. | Methods and systems for forecasting with model-based PDF estimates |
GB0502494D0 (en) | 2005-02-07 | 2005-03-16 | British Telecomm | Time series forecasting |
US8682709B2 (en) | 2006-01-06 | 2014-03-25 | Gregory M. Coldren | System and method for modeling consumer choice behavior |
WO2008115655A1 (en) | 2007-03-19 | 2008-09-25 | Dow Global Technologies Inc. | Inferential sensors developed using three-dimensional pareto-front genetic programming |
US7725409B2 (en) | 2007-06-05 | 2010-05-25 | Motorola, Inc. | Gene expression programming based on Hidden Markov Models |
US8645421B2 (en) | 2008-09-30 | 2014-02-04 | Sas Institute Inc. | Attribute based hierarchy management for estimation and forecasting |
NZ572036A (en) * | 2008-10-15 | 2010-03-26 | Nikola Kirilov Kasabov | Data analysis and predictive systems and related methodologies |
US8498887B2 (en) * | 2008-11-24 | 2013-07-30 | International Business Machines Corporation | Estimating project size |
EP2284540A1 (en) | 2009-07-31 | 2011-02-16 | BIOCRATES Life Sciences AG | Method of diagnosing organ failure |
US20110119100A1 (en) | 2009-10-20 | 2011-05-19 | Jan Matthias Ruhl | Method and System for Displaying Anomalies in Time Series Data |
US8473431B1 (en) * | 2010-05-14 | 2013-06-25 | Google Inc. | Predictive analytic modeling platform |
US8782037B1 (en) | 2010-06-20 | 2014-07-15 | Remeztech Ltd. | System and method for mark-up language document rank analysis |
US20120078678A1 (en) | 2010-09-23 | 2012-03-29 | Infosys Technologies Limited | Method and system for estimation and analysis of operational parameters in workflow processes |
US9032314B2 (en) | 2010-12-01 | 2015-05-12 | Microsoft Technology Licensing, Llc | Proposing visual display components for processing data |
US10409892B2 (en) | 2011-01-26 | 2019-09-10 | Microsoft Technology Licensing, Llc | Formatting data by example |
US20150356576A1 (en) | 2011-05-27 | 2015-12-10 | Ashutosh Malaviya | Computerized systems, processes, and user interfaces for targeted marketing associated with a population of real-estate assets |
US8843427B1 (en) * | 2011-07-01 | 2014-09-23 | Google Inc. | Predictive modeling accuracy |
US8370280B1 (en) * | 2011-07-14 | 2013-02-05 | Google Inc. | Combining predictive models in predictive analytical modeling |
US8930001B2 (en) * | 2011-09-19 | 2015-01-06 | Yokogawa Electric Corporation | Method of model identification for a process with unknown initial conditions in an industrial plant |
US20130096892A1 (en) | 2011-10-17 | 2013-04-18 | Alfred H. Essa | Systems and methods for monitoring and predicting user performance |
US20130290226A1 (en) * | 2012-04-05 | 2013-10-31 | Maynard Dokken | System and method for social graph and graph assets valuation and monetization |
US9524473B2 (en) | 2012-08-31 | 2016-12-20 | Nutonian, Inc. | System and method for auto-query generation |
US9495641B2 (en) | 2012-08-31 | 2016-11-15 | Nutomian, Inc. | Systems and method for data set submission, searching, and retrieval |
US11361246B2 (en) | 2012-08-31 | 2022-06-14 | DataRobot, Inc. | Methods for automating aspects of machine learning, and related systems and apparatus |
WO2014075108A2 (en) | 2012-11-09 | 2014-05-15 | The Trustees Of Columbia University In The City Of New York | Forecasting system using machine learning and ensemble methods |
US8880446B2 (en) * | 2012-11-15 | 2014-11-04 | Purepredictive, Inc. | Predictive analytics factory |
US9411559B2 (en) | 2013-05-28 | 2016-08-09 | The Mathworks, Inc. | Resolution of textual code in a graphical hierarchical model of a technical computing environment |
US20140372172A1 (en) | 2013-06-12 | 2014-12-18 | Telefonica Digital Espana, S.L.U. | Method and computer system to forecast economic time series of a region and computer program thereof |
US20150088606A1 (en) | 2013-09-20 | 2015-03-26 | Tata Consultancy Services Ltd. | Computer Implemented Tool and Method for Automating the Forecasting Process |
GB2541625A (en) | 2014-05-23 | 2017-02-22 | Datarobot | Systems and techniques for predictive data analytics |
US10366346B2 (en) | 2014-05-23 | 2019-07-30 | DataRobot, Inc. | Systems and techniques for determining the predictive value of a feature |
US10496927B2 (en) | 2014-05-23 | 2019-12-03 | DataRobot, Inc. | Systems for time-series predictive data analytics, and related methods and apparatus |
US10558924B2 (en) | 2014-05-23 | 2020-02-11 | DataRobot, Inc. | Systems for second-order predictive data analytics, and related methods and apparatus |
US20160005055A1 (en) | 2014-07-01 | 2016-01-07 | Siar SARFERAZ | Generic time series forecasting |
US9697469B2 (en) | 2014-08-13 | 2017-07-04 | Andrew McMahon | Method and system for generating and aggregating models based on disparate data from insurance, financial services, and public industries |
US10318874B1 (en) | 2015-03-18 | 2019-06-11 | Amazon Technologies, Inc. | Selecting forecasting models for time series using state space representations |
US20160379244A1 (en) | 2015-06-23 | 2016-12-29 | Bidtellect, Inc. | Method and system for forecasting a campaign performance using predictive modeling |
US10387900B2 (en) | 2017-04-17 | 2019-08-20 | DataRobot, Inc. | Methods and apparatus for self-adaptive time series forecasting engine |
-
2015
- 2015-05-22 GB GB1621870.3A patent/GB2541625A/en not_active Withdrawn
- 2015-05-22 DE DE112015002433.6T patent/DE112015002433T5/de not_active Withdrawn
- 2015-05-22 JP JP2017513620A patent/JP6444494B2/ja not_active Expired - Fee Related
- 2015-05-22 WO PCT/US2015/032203 patent/WO2015179778A1/en active Application Filing
- 2015-05-22 US US14/720,079 patent/US9489630B2/en active Active
-
2016
- 2016-07-22 US US15/217,626 patent/US9652714B2/en active Active
- 2016-07-22 US US15/217,640 patent/US9659254B2/en active Active
-
2017
- 2017-05-05 US US15/587,951 patent/US10984367B2/en active Active
-
2018
- 2018-10-03 JP JP2018187956A patent/JP6926047B2/ja active Active
- 2018-10-03 JP JP2018187955A patent/JP6457693B1/ja not_active Expired - Fee Related
-
2020
- 2020-07-27 JP JP2020126434A patent/JP2020191114A/ja not_active Withdrawn
- 2020-12-04 US US17/112,729 patent/US20210326782A1/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220107917A (ko) * | 2021-01-26 | 2022-08-02 | 쿠팡 주식회사 | 아이템 유사도를 모델링하고 아이템 정보를 상관시키기 위한 시스템 및 방법 |
KR102487040B1 (ko) * | 2021-01-26 | 2023-01-11 | 쿠팡 주식회사 | 아이템 유사도를 모델링하고 아이템 정보를 상관시키기 위한 시스템 및 방법 |
US11709997B2 (en) | 2021-01-26 | 2023-07-25 | Coupang Corp. | Systems and methods for modeling item similarity and correlating item information |
Also Published As
Publication number | Publication date |
---|---|
JP2019023906A (ja) | 2019-02-14 |
US9489630B2 (en) | 2016-11-08 |
US20170243140A1 (en) | 2017-08-24 |
US20160335550A1 (en) | 2016-11-17 |
JP2019023907A (ja) | 2019-02-14 |
GB201621870D0 (en) | 2017-02-01 |
US9659254B2 (en) | 2017-05-23 |
US9652714B2 (en) | 2017-05-16 |
DE112015002433T5 (de) | 2017-03-23 |
WO2015179778A1 (en) | 2015-11-26 |
US20210326782A1 (en) | 2021-10-21 |
JP2020191114A (ja) | 2020-11-26 |
JP6926047B2 (ja) | 2021-08-25 |
US20150339572A1 (en) | 2015-11-26 |
JP2017520068A (ja) | 2017-07-20 |
US10984367B2 (en) | 2021-04-20 |
GB2541625A (en) | 2017-02-22 |
US20160364647A1 (en) | 2016-12-15 |
JP6444494B2 (ja) | 2018-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6457693B1 (ja) | 予測データ分析のためのシステムおよび技術 | |
JP7107926B2 (ja) | 予測データ分析のためのシステムおよび関連する方法および装置 | |
US11922329B2 (en) | Systems for second-order predictive data analytics, and related methods and apparatus | |
US10496927B2 (en) | Systems for time-series predictive data analytics, and related methods and apparatus | |
US10366346B2 (en) | Systems and techniques for determining the predictive value of a feature | |
US20220076164A1 (en) | Automated feature engineering for machine learning models | |
US20220199266A1 (en) | Systems and methods for using machine learning with epidemiological modeling | |
Deka | Big data predictive and prescriptive analytics | |
US20230083891A1 (en) | Methods and systems for integrated design and execution of machine learning models | |
US20230091610A1 (en) | Systems and methods of generating and validating time-series features using machine learning | |
US20230051833A1 (en) | Systems and methods for using machine learning with epidemiological modeling | |
US20230065870A1 (en) | Systems and methods of multimodal clustering using machine learning | |
US20230206610A1 (en) | Methods and systems for visual representation of model performance | |
WO2022240860A1 (en) | Methods and systems for identification and visualization of bias and fairness for machine learning models | |
US20230128532A1 (en) | Distributed computing for dynamic generation of optimal and interpretable prescriptive policies with interdependent constraints | |
Vetschera | From Incomplete Information to Strict Rankings: Methods to Exploit Probabilistic Preference Information | |
Prabhu et al. | Intelligent Systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20181116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181128 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181220 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6457693 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |