JPWO2019198408A1 - 学習装置、学習方法、及び学習プログラム - Google Patents
学習装置、学習方法、及び学習プログラム Download PDFInfo
- Publication number
- JPWO2019198408A1 JPWO2019198408A1 JP2020513128A JP2020513128A JPWO2019198408A1 JP WO2019198408 A1 JPWO2019198408 A1 JP WO2019198408A1 JP 2020513128 A JP2020513128 A JP 2020513128A JP 2020513128 A JP2020513128 A JP 2020513128A JP WO2019198408 A1 JPWO2019198408 A1 JP WO2019198408A1
- Authority
- JP
- Japan
- Prior art keywords
- output
- experimental
- model
- learning
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 116
- 239000000463 material Substances 0.000 claims abstract description 68
- 238000009795 derivation Methods 0.000 claims abstract description 67
- 238000011156 evaluation Methods 0.000 claims abstract description 55
- 239000003814 drug Substances 0.000 claims abstract description 30
- 229940079593 drug Drugs 0.000 claims abstract description 30
- 238000010801 machine learning Methods 0.000 claims abstract description 13
- 230000008569 process Effects 0.000 claims description 96
- 230000009471 action Effects 0.000 claims description 25
- 238000002474 experimental method Methods 0.000 claims description 24
- 230000002787 reinforcement Effects 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 9
- 230000002068 genetic effect Effects 0.000 claims description 7
- 230000001186 cumulative effect Effects 0.000 claims description 6
- 238000003860 storage Methods 0.000 description 22
- 238000012545 processing Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 239000000654 additive Substances 0.000 description 4
- 230000013011 mating Effects 0.000 description 4
- 238000012827 research and development Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 206010034960 Photophobia Diseases 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 208000013469 light sensitivity Diseases 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Genetics & Genomics (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Feedback Control In General (AREA)
Abstract
Description
まず、図1を参照して、本実施形態に係る学習フェーズにおける学習装置10の機能的な構成について説明する。図1に示すように、学習装置10は、導出部12及び学習部14を備える。また、学習装置10の記憶部42(図10参照)には、学習用データ20、複数の出力モデル22、及び複数の実験モデル24が記憶される。
(1)入力層のノード数:N×M
なお、Nは、実験条件の項目数を表し、Mは、実験回数を表す。
(2)中間層の構成:カーネルが3×3、フィルタ数が32、ストライドが2、活性化関数がReluの畳み込み層を10層有する。
(3)出力層のノード数:N×1
(4)入力層のノード数:N×1
なお、Nは、実験条件の項目数を表す。
(5)中間層の構成:カーネルが3×3、フィルタ数が32、ストライドが2、活性化関数がReluの畳み込み層を4層有する。
(6)出力層のノード数:1×J
なお、Jは、性能値の種類数を表す。
開示の技術の第2実施形態を説明する。なお、第1実施形態と同一の構成要素については、同一の符号を付して説明を省略する。まず、図14を参照して、本実施形態に係る学習フェーズにおける学習装置10の機能的な構成について説明する。図14に示すように、学習装置10は、導出部12A、学習部14A、及び生成部16を備える。記憶部42には、学習用データ20、複数の出力モデル22B、及び複数の実験モデル24が記憶される。
Claims (16)
- 材料又は薬剤を生成するための実験条件と実験結果の性能値との複数の組み合わせを入力とし、実験条件を出力とした出力モデルに、前記複数の組み合わせを入力することによって出力された実験条件を、仮想的な実験を行う実験モデルに入力することにより得られた実験結果の性能値を用いて前記出力モデルの評価値を導出する導出部と、
前記導出部により導出された評価値を反映させる機械学習によって前記出力モデルを学習させる学習部と、
を備えた学習装置。 - 前記評価値は、複数の前記性能値における目標とする性能を満たす値の比率が高いほど良い値であるか、前記目標とする性能を満たす性能値が得られるまでの仮想的な実験回数が少ないほど良い値であるか、又は前記性能値が前記目標とする性能に近いほど良い値である
請求項1に記載の学習装置。 - 前記導出部は、前記出力モデルから、予め定められた規則を満たさない実験条件が出力された場合、前記評価値を低く補正する
請求項1又は請求項2に記載の学習装置。 - 前記導出部は、前記出力モデルから出力された実験条件を実際の実験に使用可能な実験条件に補正する
請求項1から請求項3の何れか1項に記載の学習装置。 - 前記出力モデルは、遺伝的アルゴリズムを用いて学習されるモデルである
請求項1から請求項4の何れか1項に記載の学習装置。 - 材料又は薬剤を生成するための実験条件と実験結果の性能値との複数の組み合わせ、及び実験条件の候補を入力とし、強化学習における行動価値を出力とした出力モデルに、前記複数の組み合わせと複数の異なる前記実験条件の候補各々とをそれぞれ入力することにより出力された複数の行動価値のうち、所定値以上の行動価値に対応する前記実験条件の候補を、仮想的な実験を行う実験モデルに入力することにより得られた実験結果の性能値に基づいて導出される値を報酬として、前記出力モデルを学習させる学習部
を備えた学習装置。 - 前記報酬は、複数の前記性能値における目標とする性能を満たす値の比率が高いほど良い値であるか、前記目標とする性能を満たす性能値が得られるまでの仮想的な実験回数が少ないほど良い値であるか、又は前記性能値が前記目標とする性能に近いほど良い値である
請求項6に記載の学習装置。 - 前記強化学習は、Q学習であり、
前記行動価値は、Q値である
請求項6又は請求項7に記載の学習装置。 - 前記学習部により学習された出力モデルを用いる場合に、複数の前記実験条件の候補を前記出力モデルに逐次的に複数回入力することにより出力された累計の行動価値が最大となる前記実験条件の候補を次に実験対象とする実験条件の候補として出力する出力部を更に備えた
請求項6から請求項8の何れか1項に記載の学習装置。 - 前記実験モデルは、機械学習により得られたモデルである
請求項1から請求項9の何れか1項に記載の学習装置。 - 前記実験モデルは、複数存在し、
前記複数の前記実験モデルは、それぞれモデルの作成条件が異なる
請求項1から請求項10の何れか1項に記載の学習装置。 - 前記出力モデルは、複数存在し、
前記複数の前記出力モデルは、それぞれモデルの作成条件が異なる
請求項1から請求項11の何れか1項に記載の学習装置。 - 材料又は薬剤を生成するための実験条件と実験結果の性能値との複数の組み合わせを入力とし、実験条件を出力とした出力モデルに、前記複数の組み合わせを入力することによって出力された実験条件を、仮想的な実験を行う実験モデルに入力することにより得られた実験結果の性能値を用いて前記出力モデルの評価値を導出し、
導出した評価値を反映させる機械学習によって前記出力モデルを学習させる
処理をコンピュータが実行する学習方法。 - 材料又は薬剤を生成するための実験条件と実験結果の性能値との複数の組み合わせを入力とし、実験条件を出力とした出力モデルに、前記複数の組み合わせを入力することによって出力された実験条件を、仮想的な実験を行う実験モデルに入力することにより得られた実験結果の性能値を用いて前記出力モデルの評価値を導出し、
導出した評価値を反映させる機械学習によって前記出力モデルを学習させる
処理をコンピュータに実行させるための学習プログラム。 - 材料又は薬剤を生成するための実験条件と実験結果の性能値との複数の組み合わせ、及び実験条件の候補を入力とし、強化学習における行動価値を出力とした出力モデルに、前記複数の組み合わせと複数の異なる前記実験条件の候補各々とをそれぞれ入力することにより出力された複数の行動価値のうち、所定値以上の行動価値に対応する前記実験条件の候補を、仮想的な実験を行う実験モデルに入力することにより得られた実験結果の性能値に基づいて導出される値を報酬として、前記出力モデルを学習させる
処理をコンピュータが実行する学習方法。 - 材料又は薬剤を生成するための実験条件と実験結果の性能値との複数の組み合わせ、及び実験条件の候補を入力とし、強化学習における行動価値を出力とした出力モデルに、前記複数の組み合わせと複数の異なる前記実験条件の候補各々とをそれぞれ入力することにより出力された複数の行動価値のうち、所定値以上の行動価値に対応する前記実験条件の候補を、仮想的な実験を行う実験モデルに入力することにより得られた実験結果の性能値に基づいて導出される値を報酬として、前記出力モデルを学習させる
処理をコンピュータに実行させるための学習プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018076001 | 2018-04-11 | ||
JP2018076001 | 2018-04-11 | ||
PCT/JP2019/010290 WO2019198408A1 (ja) | 2018-04-11 | 2019-03-13 | 学習装置、学習方法、及び学習プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6804009B2 JP6804009B2 (ja) | 2020-12-23 |
JPWO2019198408A1 true JPWO2019198408A1 (ja) | 2021-02-12 |
Family
ID=68163548
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020513128A Active JP6804009B2 (ja) | 2018-04-11 | 2019-03-13 | 学習装置、学習方法、及び学習プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6804009B2 (ja) |
WO (1) | WO2019198408A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230376560A1 (en) * | 2020-10-14 | 2023-11-23 | Nec Corporation | Information processing device, information processing method, information processing system, and storage medium |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003058579A (ja) * | 2001-08-21 | 2003-02-28 | Bridgestone Corp | 設計・配合の最適化方法 |
JP2017107902A (ja) * | 2015-12-07 | 2017-06-15 | ファナック株式会社 | コアシートの積層動作を学習する機械学習器、積層コア製造装置、積層コア製造システムおよび機械学習方法 |
-
2019
- 2019-03-13 WO PCT/JP2019/010290 patent/WO2019198408A1/ja active Application Filing
- 2019-03-13 JP JP2020513128A patent/JP6804009B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003058579A (ja) * | 2001-08-21 | 2003-02-28 | Bridgestone Corp | 設計・配合の最適化方法 |
JP2017107902A (ja) * | 2015-12-07 | 2017-06-15 | ファナック株式会社 | コアシートの積層動作を学習する機械学習器、積層コア製造装置、積層コア製造システムおよび機械学習方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6804009B2 (ja) | 2020-12-23 |
WO2019198408A1 (ja) | 2019-10-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7413580B2 (ja) | ニューラルネットワークを使用した集積回路フロアプランの生成 | |
KR102457974B1 (ko) | 신규 물질 탐색 방법 및 장치 | |
US10496436B2 (en) | Method and apparatus for automatically scheduling jobs in computer numerical control machines using machine learning approaches | |
JP2021507323A5 (ja) | ||
EP3583553A1 (en) | Neural architecture search for convolutional neural networks | |
CN111406264A (zh) | 神经架构搜索 | |
JP2020067980A (ja) | 予測プログラム、予測方法及び予測装置 | |
JP7115207B2 (ja) | 学習プログラム、学習方法および学習装置 | |
JP7303474B2 (ja) | 情報処理装置、作業計画決定方法、および作業計画決定プログラム | |
JP6325762B1 (ja) | 情報処理装置、情報処理方法、および情報処理プログラム | |
JP6804009B2 (ja) | 学習装置、学習方法、及び学習プログラム | |
JP2020064536A (ja) | 最適化装置及び最適化装置の制御方法 | |
Patterson et al. | Empirical design in reinforcement learning | |
Grua et al. | Clustream-GT: Online clustering for personalization in the health domain | |
US20200052635A1 (en) | Method for searching excitation signal of motor, and electronic device | |
US20210397923A1 (en) | Information processing device, regression model generation method, and regression model generation program product | |
CN112905809B (zh) | 知识图谱学习方法和系统 | |
WO2007020391A1 (en) | Electronic circuit design | |
JPWO2014087590A1 (ja) | 最適化装置、最適化方法および最適化プログラム | |
WO2019244804A1 (ja) | 処理装置、方法、及びプログラム | |
JP7359493B2 (ja) | ハイパーパラメータ調整装置、ハイパーパラメータ調整プログラムを記録した非一時的な記録媒体、及びハイパーパラメータ調整プログラム | |
WO2021220775A1 (ja) | 材料の特性値を推定するシステム | |
JP7207128B2 (ja) | 予測システム、予測方法、および予測プログラム | |
US20220138616A1 (en) | Scalable discovery of leaders from dynamic combinatorial search space using incremental pipeline growth approach | |
JP7310827B2 (ja) | 学習装置、学習方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201007 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20201007 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20201027 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201201 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6804009 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |