JP2019079392A - 学習装置、分析システム、学習方法および学習プログラム - Google Patents
学習装置、分析システム、学習方法および学習プログラム Download PDFInfo
- Publication number
- JP2019079392A JP2019079392A JP2017207227A JP2017207227A JP2019079392A JP 2019079392 A JP2019079392 A JP 2019079392A JP 2017207227 A JP2017207227 A JP 2017207227A JP 2017207227 A JP2017207227 A JP 2017207227A JP 2019079392 A JP2019079392 A JP 2019079392A
- Authority
- JP
- Japan
- Prior art keywords
- model
- pipelines
- learning
- prediction
- prediction accuracy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本実施形態の学習装置は、入力されたデータのラベルを予測するクラス分類問題について、学習データを用いて機械学習を行って、自動的に予測モデルを構築する。ここで、図1は、クラス分類について説明するための説明図である。クラス分類とは、入力されたデータのラベルを予測する技術である。一般にクラス分類は、図1に示すように、欠損値の補完、カテゴリ変数の変換、各特徴の正規化、データの再変換および推定の5つのフェーズで構成される。図1に示すクラス分類において、データが入力され、ラベルが出力される。
図4は、学習装置の概略構成を例示する模式図である。図4に例示するように、学習装置10は、パソコン等の汎用コンピュータで実現され、入力部11、出力部12、通信制御部13、記憶部14、および制御部15を備える。
次に、図6を参照して、本実施形態に係る学習装置10による学習処理について説明する。図6は、学習処理手順を示すフローチャートである。図6のフローチャートは、例えば、学習処理の開始を指示する操作入力があったタイミングで開始される。
図8は、本実施形態の学習装置の学習処理による効果を説明するための説明図である。図8には、yeast、abalone、krvskp等の10種のデータセットのそれぞれに対するクラス分類について、従来技術による予測精度と本発明の学習処理による予測精度とが例示されている。ここで、従来技術とは、CASH問題+重みを考慮しないアンサンブル(ES、Ensemble Selection)を意味する。また、本発明の学習処理とは、CESH問題を意味する。図8に示すように、本発明の学習処理により、従来技術より予測精度が平均で約1.2%向上することが確認された。
本実施形態の学習装置10は、推薦、分類、または異常検知等の分析タスクを実行する分析システムに用いることができる。図9は、学習装置を含む分析システムの概略構成を示す模式図である。図9に示す例において、分析システム100は、学習装置10と分析装置20とを有し、ネットワークNを介して相互にデータ通信可能に接続される。
上記実施形態に係る学習装置10が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。一実施形態として、学習装置10は、パッケージソフトウェアやオンラインソフトウェアとして上記の学習処理を実行する学習プログラムを所望のコンピュータにインストールさせることによって実装できる。例えば、上記の学習プログラムを情報処理装置に実行させることにより、情報処理装置を学習装置10として機能させることができる。ここで言う情報処理装置には、デスクトップ型またはノート型のパーソナルコンピュータが含まれる。また、その他にも、情報処理装置にはスマートフォン、携帯電話機やPHS(Personal Handyphone System)などの移動体通信端末、さらには、PDA(Personal Digital Assistants)などのスレート端末などがその範疇に含まれる。
11 入力部
12 出力部
13 通信制御部
14 記憶部
15 制御部
15a 生成部
15b 探索部
20 分析装置
21 予測部
100 分析システム
Claims (6)
- 入力されたデータのラベルを予測する予測モデルを構築する際に実行される複数の処理を組み合わせたパイプラインであって、各処理の設定内容がそれぞれ異なる複数のパイプラインを生成する生成部と、
生成されたパイプラインのそれぞれを表すモデルを重み付けして組み合わせたモデルのうち、予測精度が最も高いモデルを予測モデルとして探索する探索部と、
を備えることを特徴とする学習装置。 - 前記探索部は、前記生成部が生成した複数の前記パイプラインを表すモデルのうち、予測精度が最も高いモデルに、前記生成部が再度生成した複数の前記パイプラインを表すモデルのうちのいずれかを重み付けして組み合わせ、予測精度が最も高くなる組み合わせおよび重みを探索し、予測精度が最も高い該組み合わせおよび重みに対し、前記生成部が再度生成した複数の前記パイプラインを表すモデルのうちのいずれかを重み付けして組み合わせ、予測精度が最も高くなる組み合わせおよび重みを探索する処理を所定の回数繰り返すことにより、予測精度が最も高い前記予測モデルを探索することを特徴とする請求項1に記載の学習装置。
- 前記探索部は、前記生成部が生成した所定数の前記パイプラインを表すモデルを、予測精度が高い順に大きい重み付けして組み合わせることにより、予測精度が最も高い前記予測モデルを探索することを特徴とする請求項1に記載の学習装置。
- 学習装置と分析装置とを有する分析システムであって、
前記学習装置は、
入力されたデータのラベルを予測する予測モデルを構築する際に実行される複数の処理を組み合わせたパイプラインであって、各処理の設定内容がそれぞれ異なる複数のパイプラインを生成する生成部と、
生成されたパイプラインのそれぞれを表すモデルを重み付けして組み合わせたモデルのうち、予測精度が最も高いモデルを予測モデルとして探索する探索部と、を備え、
前記分析装置は、
前記学習装置が探索した前記予測モデルを用いて、入力されたデータのラベルを予測する予測部を備える
ことを特徴とする分析システム。 - 学習装置で実行される学習方法であって、
入力されたデータのラベルを予測する予測モデルを構築する際に実行される複数の処理を組み合わせたパイプラインであって、各処理の設定内容がそれぞれ異なる複数のパイプラインを生成する生成工程と、
生成されたパイプラインのそれぞれを表すモデルを重み付けして組み合わせたモデルのうち、予測精度が最も高いモデルを予測モデルとして探索する探索工程と、
を含んだことを特徴とする学習方法。 - 入力されたデータのラベルを予測する予測モデルを構築する際に実行される複数の処理を組み合わせたパイプラインであって、各処理の設定内容がそれぞれ異なる複数のパイプラインを生成する生成ステップと、
生成されたパイプラインのそれぞれを表すモデルを重み付けして組み合わせたもののうち、予測精度が最も高いモデルを予測モデルとして探索する探索ステップと、
をコンピュータに実行させるための学習プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017207227A JP6859247B2 (ja) | 2017-10-26 | 2017-10-26 | 学習装置、分析システム、学習方法および学習プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017207227A JP6859247B2 (ja) | 2017-10-26 | 2017-10-26 | 学習装置、分析システム、学習方法および学習プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019079392A true JP2019079392A (ja) | 2019-05-23 |
JP6859247B2 JP6859247B2 (ja) | 2021-04-14 |
Family
ID=66627901
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017207227A Active JP6859247B2 (ja) | 2017-10-26 | 2017-10-26 | 学習装置、分析システム、学習方法および学習プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6859247B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102201198B1 (ko) * | 2020-05-22 | 2021-01-11 | 서울시립대학교 산학협력단 | 기계학습 및 앙상블 기법을 이용하여 데이터를 분류하는 장치 및 방법 |
US11062792B2 (en) | 2017-07-18 | 2021-07-13 | Analytics For Life Inc. | Discovering genomes to use in machine learning techniques |
US11139048B2 (en) | 2017-07-18 | 2021-10-05 | Analytics For Life Inc. | Discovering novel features to use in machine learning techniques, such as machine learning techniques for diagnosing medical conditions |
KR20220072280A (ko) * | 2020-11-25 | 2022-06-02 | 한국기초과학지원연구원 | 전자현미경의 수차 값을 예측하기 위한 장치 및 그 동작 방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005309920A (ja) * | 2004-04-23 | 2005-11-04 | Alliance Group Inc | 多数決装置及びその学習方法と多クラス識別装置 |
JP2007157130A (ja) * | 2005-12-06 | 2007-06-21 | Mitsubishi Electric Research Laboratories Inc | コンピュータにより実施される強分類器を構築する方法 |
JP2014174693A (ja) * | 2013-03-07 | 2014-09-22 | Toshiba Corp | パターン識別装置、パターン識別方法、プログラム、学習装置および学習方法 |
-
2017
- 2017-10-26 JP JP2017207227A patent/JP6859247B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005309920A (ja) * | 2004-04-23 | 2005-11-04 | Alliance Group Inc | 多数決装置及びその学習方法と多クラス識別装置 |
JP2007157130A (ja) * | 2005-12-06 | 2007-06-21 | Mitsubishi Electric Research Laboratories Inc | コンピュータにより実施される強分類器を構築する方法 |
JP2014174693A (ja) * | 2013-03-07 | 2014-09-22 | Toshiba Corp | パターン識別装置、パターン識別方法、プログラム、学習装置および学習方法 |
Non-Patent Citations (1)
Title |
---|
塩田哲哉、外2名: "サンプリングを用いた機械学習パイプライン探索手法", 一般社団法人 人工知能学会 第31回全国大会論文集DVD, JPN6020040891, 23 May 2017 (2017-05-23), ISSN: 0004374426 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11062792B2 (en) | 2017-07-18 | 2021-07-13 | Analytics For Life Inc. | Discovering genomes to use in machine learning techniques |
US11139048B2 (en) | 2017-07-18 | 2021-10-05 | Analytics For Life Inc. | Discovering novel features to use in machine learning techniques, such as machine learning techniques for diagnosing medical conditions |
KR102201198B1 (ko) * | 2020-05-22 | 2021-01-11 | 서울시립대학교 산학협력단 | 기계학습 및 앙상블 기법을 이용하여 데이터를 분류하는 장치 및 방법 |
KR20220072280A (ko) * | 2020-11-25 | 2022-06-02 | 한국기초과학지원연구원 | 전자현미경의 수차 값을 예측하기 위한 장치 및 그 동작 방법 |
KR102490174B1 (ko) | 2020-11-25 | 2023-01-19 | 한국기초과학지원연구원 | 전자현미경의 수차 값을 예측하기 위한 장치 및 그 동작 방법 |
Also Published As
Publication number | Publication date |
---|---|
JP6859247B2 (ja) | 2021-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6859247B2 (ja) | 学習装置、分析システム、学習方法および学習プログラム | |
Ramezani et al. | A new improved model of marine predator algorithm for optimization problems | |
Lokman et al. | Finding all nondominated points of multi-objective integer programs | |
Yadav et al. | A bi-objective task scheduling approach in fog computing using hybrid fireworks algorithm | |
Liu et al. | Deep learning meets wireless network optimization: Identify critical links | |
Grabocka et al. | Learning surrogate losses | |
CN110929960B (zh) | 策略选择优化方法以及装置 | |
JP6907664B2 (ja) | 非定常時系列データの予測に用いる方法及び装置 | |
Wang et al. | Many-objective cloud manufacturing service selection and scheduling with an evolutionary algorithm based on adaptive environment selection strategy | |
Da Silva et al. | A hybrid memetic approach for fully automated multi-objective web service composition | |
CN113260986A (zh) | 用于发现具有期望特性的材料的机器学习框架 | |
Casas et al. | PSO-DS: a scheduling engine for scientific workflow managers | |
US10915826B2 (en) | Evaluation of predictions in the absence of a known ground truth | |
Ataie et al. | A hybrid machine learning approach for performance modeling of cloud-based big data applications | |
JP2018200524A (ja) | 分類装置、分類方法および分類プログラム | |
Shegay et al. | Guide tree optimization with genetic algorithm to improve multiple protein 3D-structure alignment | |
EP4205043A1 (en) | Hybrid machine learning | |
Strong et al. | MABWiser: parallelizable contextual multi-armed bandits | |
Simaiya et al. | A hybrid cloud load balancing and host utilization prediction method using deep learning and optimization techniques | |
Wang et al. | An intelligent QoS identification for untrustworthy web services via two-phase neural networks | |
JP7424373B2 (ja) | 分析装置、分析方法及び分析プログラム | |
Seno et al. | CLR: Cloud Linear Regression Environment as a More Effective Resource-Task Scheduling Environment (State-of-the-Art). | |
Vlaski et al. | Second-order guarantees in centralized, federated and decentralized nonconvex optimization | |
Radulescu et al. | Cloud provider selection a complex multicriteria problem | |
Laboudi et al. | Efficient service selection in multimedia documents adaptation processes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191206 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201021 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201027 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210323 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210325 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6859247 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |