JPWO2018002967A1 - 情報処理システム、情報処理方法、及び、プログラム - Google Patents
情報処理システム、情報処理方法、及び、プログラム Download PDFInfo
- Publication number
- JPWO2018002967A1 JPWO2018002967A1 JP2018524580A JP2018524580A JPWO2018002967A1 JP WO2018002967 A1 JPWO2018002967 A1 JP WO2018002967A1 JP 2018524580 A JP2018524580 A JP 2018524580A JP 2018524580 A JP2018524580 A JP 2018524580A JP WO2018002967 A1 JPWO2018002967 A1 JP WO2018002967A1
- Authority
- JP
- Japan
- Prior art keywords
- analysis pipeline
- parameter
- pipeline
- analysis
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Pure & Applied Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Debugging And Monitoring (AREA)
Abstract
Description
本発明の第1の実施の形態について説明する。
また、学習済みモデルの処理を行うブロックとして、ブロック「リッジ回帰モデル(LDL)」が設定されている。
バリデーションモジュールには、目的関数から、分析対象のデータと、1以上のパイプラインパラメータの値が設定(適用)された分析パイプラインと、が入力される。
目的関数には、探索モジュールから、引数xが指定(入力)される。引数xには、1以上のパラメータの集合(以下、パラメータセットとも記載する)の各パラメータの値(以下、パラメータセットの値とも記載する)が設定される。パラメータセットには、上述の、1以上のパイプラインパラメータが含まれる。
探索モジュールには、調整部150から、目的関数が入力される。また、探索モジュールには、初期化部110により、目的関数の引数x(パラメータセットの値)の探索範囲が設定される。探索範囲には、利用対象の探索モジュールの探索方法や、利用対象の分析パイプライン、バリデーションモジュールに対応した値の範囲が設定される。なお、探索範囲は、初期化部110の代わりに、調整部150により入力されてもよい。また、探索範囲は、ユーザ等から入力される探索モジュールに、予め、設定されていてもよい。
次に、本発明の第2の実施の形態について説明する。
101 CPU
102 記憶デバイス
103 入出力デバイス
104 通信デバイス
110 初期化部
120 バリデーションモジュール記憶部
130 探索モジュール記憶部
140 分析パイプライン記憶部
150 調整部
Claims (10)
- 分析対象のデータに対する前処理と学習処理とを含み、前記前処理と前記学習処理との内の少なくとも一方に係るパラメータであるパイプラインパラメータの値が適用された分析パイプラインを用いて、前記前処理と前記学習処理により学習された学習済みモデルとを含む分析パイプラインモデルを生成する情報処理システムであって、
入力された前記分析パイプラインを用いて前記分析パイプラインモデルの生成、及び、生成した前記分析パイプラインモデルの評価値の算出を、所定のバリデーション方法に従って行い、生成した前記分析パイプラインモデル、及び、算出した前記評価値を出力するバリデーションモジュールの入力を受け付ける、初期化手段と、
前記パイプラインパラメータを含むパラメータセットの探索範囲内で、所定の探索方法に従って、前記パイプラインパラメータの値が適用された前記分析パイプラインを前記バリデーションモジュールに入力して実行することにより、前記評価値が最適化される前記パラメータセットの値を探索し、最適化されたときの前記分析パイプラインモデルを出力する、調整手段と、
を備えた情報処理システム。 - 目的関数を、入力された前記パラメータセットに含まれる前記パイプラインパラメータの値が適用された前記分析パイプラインを前記バリデーションモジュールに入力して実行することにより得られた前記評価値、及び、前記分析パイプラインモデルを出力する関数と定義した場合に、
さらに、前記初期化手段は、前記パラメータセットの探索範囲内で、所定の探索方法に従って、前記パラメータセットの値を前記目的関数に入力して実行することにより得られる前記評価値が最適化される前記パラメータセットの値を探索し、最適化されたときの前記分析パイプラインモデルを出力する探索モジュールの入力を受け付け、
前記調整手段は、前記目的関数を生成して、前記探索モジュールを実行することにより得られた前記分析パイプラインモデルを出力する、
請求項1に記載の情報処理システム。 - 前記パラメータセットは、さらに、前記分析パイプラインの識別子を含み、
前記バリデーションモジュールを実行する場合、前記パラメータセットに含まれる前記パイプラインパラメータの値が適用された、前記分析パイプラインの識別子で示される前記分析パイプラインが入力される、
請求項1または2に記載の情報処理システム。 - 前記パラメータセットは、さらに、前記所定のバリデーション方法に係るパラメータを含み、
前記バリデーションモジュールは、入力された前記所定のバリデーション方法に係るパラメータの値に応じた前記所定のバリデーション方法に従って前記分析パイプラインモデルの生成、及び、当該分析パイプラインモデルの前記評価値の算出を行い、
前記バリデーションモジュールを実行する場合、前記パラメータセットに含まれる前記パイプラインパラメータの値が適用された前記分析パイプラインに加えて、前記所定のバリデーション方法に係るパラメータの値が入力される、
請求項1乃至3のいずれかに記載の情報処理システム。 - 前記所定のバリデーション方法に係るパラメータは、学習用データの絞り込み割合を指定するパラメータであり、
前記バリデーションモジュールは、前記分析対象のデータを、前記分析パイプラインモデルを生成するための学習用データと前記分析パイプラインモデルの前記評価値を算出するためのテスト用データとに分割したときに、さらに、前記学習用データの絞り込み割合を指定するパラメータの値に従って、前記学習用データとして分割されたデータの絞り込みを行う、
請求項4に記載の情報処理システム。 - 前記所定のバリデーション方法に係るパラメータは、再学習を指定するパラメータであり、
前記バリデーションモジュールは、前記分析対象のデータの内、学習用データを用いた前記学習処理により前記分析パイプラインモデルを生成し、テスト用データを用いて前記分析パイプラインモデルの前記評価値を算出した後で、さらに、前記再学習を指定するパラメータの値に従って、前記学習用データと前記テスト用データとを用いた前記学習処理を再度行うことで、前記分析パイプラインモデルを更新する、
請求項4に記載の情報処理システム。 - 分析対象のデータに対する前処理と学習処理とを含み、前記前処理と前記学習処理との内の少なくとも一方に係るパラメータであるパイプラインパラメータの値が適用された分析パイプラインを用いて、前記前処理と前記学習処理により学習された学習済みモデルとを含む分析パイプラインモデルを生成する情報処理方法であって、
入力された前記分析パイプラインを用いて前記分析パイプラインモデルの生成、及び、生成した前記分析パイプラインモデルの評価値の算出を、所定のバリデーション方法に従って行い、生成した前記分析パイプラインモデル、及び、算出した前記評価値を出力するバリデーションモジュールの入力を受け付け、
前記パイプラインパラメータを含むパラメータセットの探索範囲内で、所定の探索方法に従って、前記パイプラインパラメータの値が適用された前記分析パイプラインを前記バリデーションモジュールに入力して実行することにより、前記評価値が最適化される前記パラメータセットの値を探索し、最適化されたときの前記分析パイプラインモデルを出力する、
情報処理方法。 - 目的関数を、入力された前記パラメータセットに含まれる前記パイプラインパラメータの値が適用された前記分析パイプラインを前記バリデーションモジュールに入力して実行することにより得られた前記評価値、及び、前記分析パイプラインモデルを出力する関数と定義した場合に、
さらに、前記パラメータセットの探索範囲内で、所定の探索方法に従って、前記パラメータセットの値を前記目的関数に入力して実行することにより得られる前記評価値が最適化される前記パラメータセットの値を探索し、最適化されたときの前記分析パイプラインモデルを出力する探索モジュールの入力を受け付け、
前記分析パイプラインモデルを出力する場合、前記目的関数を生成して、前記探索モジュールを実行することにより得られた前記分析パイプラインモデルを出力する、
請求項7に記載の情報処理方法。 - 分析対象のデータに対する前処理と学習処理とを含み、前記前処理と前記学習処理との内の少なくとも一方に係るパラメータであるパイプラインパラメータの値が適用された分析パイプラインを用いて、前記前処理と前記学習処理により学習された学習済みモデルとを含む分析パイプラインモデルを生成するプログラムを格納する記録媒体であって、
コンピュータに、
入力された前記分析パイプラインを用いて前記分析パイプラインモデルの生成、及び、生成した前記分析パイプラインモデルの評価値の算出を、所定のバリデーション方法に従って行い、生成した前記分析パイプラインモデル、及び、算出した前記評価値を出力するバリデーションモジュールの入力を受け付け、
前記パイプラインパラメータを含むパラメータセットの探索範囲内で、所定の探索方法に従って、前記パイプラインパラメータの値が適用された前記分析パイプラインを前記バリデーションモジュールに入力して実行することにより、前記評価値が最適化される前記パラメータセットの値を探索し、最適化されたときの前記分析パイプラインモデルを出力する、
処理を実行させるプログラムを格納する、コンピュータが読み取り可能な記録媒体。 - 目的関数を、入力された前記パラメータセットに含まれる前記パイプラインパラメータの値が適用された前記分析パイプラインを前記バリデーションモジュールに入力して実行することにより得られた前記評価値、及び、前記分析パイプラインモデルを出力する関数と定義した場合に、
さらに、前記パラメータセットの探索範囲内で、所定の探索方法に従って、前記パラメータセットの値を前記目的関数に入力して実行することにより得られる前記評価値が最適化される前記パラメータセットの値を探索し、最適化されたときの前記分析パイプラインモデルを出力する探索モジュールの入力を受け付け、
前記分析パイプラインモデルを出力する場合、前記目的関数を生成して、前記探索モジュールを実行することにより得られた前記分析パイプラインモデルを出力する、
処理を実行させる、請求項9に記載のプログラムを格納する、コンピュータが読み取り可能な記録媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2016/003137 WO2018002967A1 (ja) | 2016-06-30 | 2016-06-30 | 情報処理システム、情報処理方法、及び、記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2018002967A1 true JPWO2018002967A1 (ja) | 2019-04-25 |
JP6648828B2 JP6648828B2 (ja) | 2020-02-14 |
Family
ID=60785368
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018524580A Active JP6648828B2 (ja) | 2016-06-30 | 2016-06-30 | 情報処理システム、情報処理方法、及び、プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20190180180A1 (ja) |
JP (1) | JP6648828B2 (ja) |
WO (1) | WO2018002967A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10698625B2 (en) * | 2017-05-15 | 2020-06-30 | Accenture Global Solutions Limited | Data pipeline architecture for analytics processing stack |
KR102262279B1 (ko) * | 2019-10-02 | 2021-06-08 | (주)디지탈쉽 | 이상치 탐지를 위한 데이터 처리 방법 및 장치 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009187099A (ja) * | 2008-02-04 | 2009-08-20 | Fuji Xerox Co Ltd | 情報処理装置およびプログラム |
JP5182267B2 (ja) * | 2009-10-28 | 2013-04-17 | 株式会社豊田中央研究所 | 識別器構築装置、識別器、プログラム |
US9020871B2 (en) * | 2010-06-18 | 2015-04-28 | Microsoft Technology Licensing, Llc | Automated classification pipeline tuning under mobile device resource constraints |
BR112015029806A2 (pt) * | 2013-05-30 | 2020-04-28 | President And Fellows Of Harvard College | sistemas e métodos para realizar otimização bayesiana |
US10318883B2 (en) * | 2015-03-26 | 2019-06-11 | International Business Machines Corporation | Identifying optimum times at which to retrain a logistic regression model |
-
2016
- 2016-06-30 JP JP2018524580A patent/JP6648828B2/ja active Active
- 2016-06-30 WO PCT/JP2016/003137 patent/WO2018002967A1/ja active Application Filing
- 2016-06-30 US US16/310,851 patent/US20190180180A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP6648828B2 (ja) | 2020-02-14 |
WO2018002967A1 (ja) | 2018-01-04 |
US20190180180A1 (en) | 2019-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Probst et al. | Tunability: Importance of hyperparameters of machine learning algorithms | |
US10380498B1 (en) | Platform services to enable one-click execution of the end-to-end sequence of modeling steps | |
US11693917B2 (en) | Computational model optimizations | |
Onchis et al. | Stable and explainable deep learning damage prediction for prismatic cantilever steel beam | |
US20080228744A1 (en) | Method and a system for automatic evaluation of digital files | |
EP3893169A2 (en) | Method, apparatus and device for generating model and storage medium | |
Jahanshahloo et al. | A linear bilevel programming problem for obtaining the closest targets and minimum distance of a unit from the strong efficient frontier | |
US20240193485A1 (en) | System and method of operationalizing automated feature engineering | |
Yang et al. | A pattern fusion model for multi-step-ahead CPU load prediction | |
JP2024516656A (ja) | 産業特定機械学習アプリケーション | |
Kabaldin et al. | CNC machine tools and digital twins | |
JP6648828B2 (ja) | 情報処理システム、情報処理方法、及び、プログラム | |
de Paula et al. | A gpu-based implementation of the firefly algorithm for variable selection in multivariate calibration problems | |
Yerlikaya-Özkurt et al. | A review and new contribution on conic multivariate adaptive regression splines (CMARS): a powerful tool for predictive data mining | |
Dorado-Moreno et al. | Ordinal multi-class architecture for predicting wind power ramp events based on reservoir computing | |
Heruwidagdo et al. | Performance of Information Technology Infrastructure Prediction using Machine Learning | |
Băroiu et al. | A Descriptive-Predictive–Prescriptive Framework for the Social-Media–Cryptocurrencies Relationship | |
Selvam et al. | tofee-tree: au to matic fe ature e ngineering framework for modeling tre nd-cycl e in time series forecasting | |
Uniyal et al. | Wine Quality Evaluation Using Machine Learning Algorithms | |
Raghava et al. | Machine learning methods for software defect prediction a revisit | |
US11953862B2 (en) | Optimal control configuration engine in a material processing system | |
US20220207391A1 (en) | Integrated feature engineering | |
WO2024070170A1 (ja) | 試作条件提案システム、試作条件提案方法 | |
Sivakumar et al. | Feature selection based on filter approach using mutual information with Genetic algorithm | |
Särkkä et al. | Comparison of missing data handling methods for variant pathogenicity predictors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181218 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181218 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191217 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191230 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6648828 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |