JP2023023455A - 学習装置、学習方法、および、学習プログラム、並びに、制御装置 - Google Patents
学習装置、学習方法、および、学習プログラム、並びに、制御装置 Download PDFInfo
- Publication number
- JP2023023455A JP2023023455A JP2021129016A JP2021129016A JP2023023455A JP 2023023455 A JP2023023455 A JP 2023023455A JP 2021129016 A JP2021129016 A JP 2021129016A JP 2021129016 A JP2021129016 A JP 2021129016A JP 2023023455 A JP2023023455 A JP 2023023455A
- Authority
- JP
- Japan
- Prior art keywords
- data
- learning
- machine learning
- learning model
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title abstract description 23
- 238000010801 machine learning Methods 0.000 claims abstract description 126
- 230000009471 action Effects 0.000 claims abstract description 87
- 230000002787 reinforcement Effects 0.000 claims abstract description 51
- 230000006399 behavior Effects 0.000 claims description 40
- 238000000605 extraction Methods 0.000 claims description 27
- 239000000284 extract Substances 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 13
- 230000004044 response Effects 0.000 claims description 12
- 238000009826 distribution Methods 0.000 claims description 8
- 230000008859 change Effects 0.000 description 34
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 22
- 238000011156 evaluation Methods 0.000 description 15
- 238000003860 storage Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 238000012545 processing Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 238000010438 heat treatment Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012369 In process control Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 238000010965 in-process control Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000010865 sewage Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
Description
[先行技術文献]
[特許文献]
[特許文献1] 特開2018-202564
20 制御対象
100 学習装置
110 データ取得部
120 抽出部
122 選定部
124 定義部
130 事前学習部
140 モデル記憶部
610 強化学習部
900 制御装置
910 制御部
9900 コンピュータ
9901 DVD-ROM
9910 ホストコントローラ
9912 CPU
9914 RAM
9916 グラフィックコントローラ
9918 ディスプレイデバイス
9920 入/出力コントローラ
9922 通信インターフェイス
9924 ハードディスクドライブ
9926 DVDドライブ
9930 ROM
9940 入/出力チップ
9942 キーボード
Claims (13)
- 設備の状態に応じた行動を出力する機械学習モデルによる前記設備に設けられた制御対象の制御に先立ち、前記設備の状態を示す状態データ、および、前記制御対象に対する行動を示す行動データを含む初期設定データを取得するデータ取得部と、
前記機械学習モデルの強化学習の開始に先立ち、前記初期設定データに基づいて事前学習することによって、前記機械学習モデルを初期設定する事前学習部と
を備える、学習装置。 - 前記初期設定データから前記機械学習モデルの初期設定に用いられるサンプルデータを抽出する抽出部を更に備える、請求項1に記載の学習装置。
- 前記抽出部は、前記初期設定データを選定する選定部を有し、
前記抽出部は、前記選定された初期設定データから前記サンプルデータを抽出する、請求項2に記載の学習装置。 - 前記抽出部は、前記機械学習モデルが前記行動を選択するための選択肢を定義する定義部を有し、
前記抽出部は、前記初期設定データに含まれる前記状態データと前記選択肢に含まれる行動との組み合わせを前記サンプルデータとして抽出する、請求項2または3に記載の学習装置。 - 前記機械学習モデルは、前記初期設定データに含まれる前記状態データと前記選択肢に含まれる各行動との組み合わせに対するそれぞれの重みに基づいて、前記設備の状態に応じた前記行動を出力する、請求項4に記載の学習装置。
- 前記定義部は、前記初期設定データに含まれる前記行動データが示す行動の分布に基づいて、前記選択肢を定義する、請求項4または5に記載の学習装置。
- 前記定義部は、前記設備の状態に関わらない共通の前記選択肢を定義する、請求項4から6のいずれか一項に記載の学習装置。
- 前記定義部は、前記設備の状態に応じた複数の前記選択肢を定義する、請求項4から6のいずれか一項に記載の学習装置。
- 前記データ取得部は、前記機械学習モデルにより前記制御対象が制御されたことに応じて、前記状態データを取得し、
前記状態データ、および、前記状態データを前記機械学習モデルに入力したことに応じて前記機械学習モデルから取得される前記行動データを学習データとして強化学習することによって、前記機械学習モデルを更新する強化学習部を更に備える、
請求項1から8のいずれか一項に記載の学習装置。 - 前記事前学習部は、前記初期設定データに基づいて、前記状態データが入力されたことに応じて、前記状態データに対応する前記行動データにより近い行動を選択するように前記機械学習モデルを初期設定し、
前記強化学習部は、一連の行動によって得られる報酬をより高めるように前記機械学習モデルを更新する、
請求項9に記載の学習装置。 - 請求項1から10のいずれか一項に記載の学習装置と、
前記機械学習モデルにより前記制御対象を制御する制御部と
を備える、制御装置。 - 設備の状態に応じた行動を出力する機械学習モデルによる前記設備に設けられた制御対象の制御に先立ち、前記設備の状態を示す状態データ、および、前記制御対象に対する行動を示す行動データを含む初期設定データを取得することと、
前記機械学習モデルの強化学習の開始に先立ち、前記初期設定データに基づいて事前学習することによって、前記機械学習モデルを初期設定することと
を備える、学習方法。 - コンピュータにより実行されて、前記コンピュータを、
設備の状態に応じた行動を出力する機械学習モデルによる前記設備に設けられた制御対象の制御に先立ち、前記設備の状態を示す状態データ、および、前記制御対象に対する行動を示す行動データを含む初期設定データを取得するデータ取得部と、
前記機械学習モデルの強化学習の開始に先立ち、前記初期設定データに基づいて事前学習することによって、前記機械学習モデルを初期設定する事前学習部と
して機能させる、学習プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021129016A JP2023023455A (ja) | 2021-08-05 | 2021-08-05 | 学習装置、学習方法、および、学習プログラム、並びに、制御装置 |
US17/873,116 US20230045222A1 (en) | 2021-08-05 | 2022-07-25 | Learning device, learning method, recording medium having recorded thereon learning program, and control device |
EP22188054.5A EP4138005A1 (en) | 2021-08-05 | 2022-08-01 | Learning device, learning method, learning program, and control |
CN202210932048.0A CN115705038A (zh) | 2021-08-05 | 2022-08-04 | 学习装置、学习方法、记录介质以及控制装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021129016A JP2023023455A (ja) | 2021-08-05 | 2021-08-05 | 学習装置、学習方法、および、学習プログラム、並びに、制御装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023023455A true JP2023023455A (ja) | 2023-02-16 |
Family
ID=82786317
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021129016A Pending JP2023023455A (ja) | 2021-08-05 | 2021-08-05 | 学習装置、学習方法、および、学習プログラム、並びに、制御装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230045222A1 (ja) |
EP (1) | EP4138005A1 (ja) |
JP (1) | JP2023023455A (ja) |
CN (1) | CN115705038A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7478297B1 (ja) | 2023-09-08 | 2024-05-02 | 三菱重工業株式会社 | 情報処理システム、情報処理方法、学習システム、および学習方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4427074B2 (ja) * | 2007-06-07 | 2010-03-03 | 株式会社日立製作所 | プラントの制御装置 |
JP6235543B2 (ja) * | 2015-09-30 | 2017-11-22 | ファナック株式会社 | 加工機のサイクル加工時間を最適化する機械学習装置、モータ制御装置、加工機、および機械学習方法 |
JP6542839B2 (ja) | 2017-06-07 | 2019-07-10 | ファナック株式会社 | 制御装置及び機械学習装置 |
JP7090243B2 (ja) * | 2018-05-08 | 2022-06-24 | 千代田化工建設株式会社 | プラント運転条件設定支援システム、学習装置、及び運転条件設定支援装置 |
-
2021
- 2021-08-05 JP JP2021129016A patent/JP2023023455A/ja active Pending
-
2022
- 2022-07-25 US US17/873,116 patent/US20230045222A1/en active Pending
- 2022-08-01 EP EP22188054.5A patent/EP4138005A1/en active Pending
- 2022-08-04 CN CN202210932048.0A patent/CN115705038A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7478297B1 (ja) | 2023-09-08 | 2024-05-02 | 三菱重工業株式会社 | 情報処理システム、情報処理方法、学習システム、および学習方法 |
Also Published As
Publication number | Publication date |
---|---|
EP4138005A1 (en) | 2023-02-22 |
CN115705038A (zh) | 2023-02-17 |
US20230045222A1 (en) | 2023-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7331660B2 (ja) | 装置、方法およびプログラム | |
JP7392566B2 (ja) | 制御支援装置、制御支援方法、制御支援プログラム、および制御システム | |
JP2023023455A (ja) | 学習装置、学習方法、および、学習プログラム、並びに、制御装置 | |
US20230129189A1 (en) | Apparatus, method, and computer readable medium | |
US20220291671A1 (en) | Control apparatus, control method and recording medium having recorded thereon control program | |
CN115079567A (zh) | 控制装置、控制方法以及记录有控制程序的记录介质 | |
JP2022035737A (ja) | 制御システム、制御方法、制御装置及びプログラム | |
JP7444186B2 (ja) | モデル検証装置、モデル検証方法、および、モデル検証プログラム | |
US20230341828A1 (en) | Control apparatus, control method, and non-transitory computer readable medium | |
JP7484382B2 (ja) | 制御装置、制御方法および制御プログラム | |
JP7409345B2 (ja) | 学習処理装置、制御装置、学習処理方法、制御方法、学習プログラムおよび制御プログラム | |
WO2024101351A1 (ja) | 装置、方法およびプログラム | |
JP6904473B1 (ja) | モデル作成支援装置、モデル作成支援方法及びプログラム | |
JP7359176B2 (ja) | 判定装置、判定方法、および、判定プログラム | |
JP2023078694A (ja) | 装置、方法およびプログラム | |
EP4283412A1 (en) | Model selection apparatus, model selection method, and model selection program | |
JP2023078710A (ja) | 装置、方法およびプログラム | |
CN111356959B (zh) | 用于计算机辅助地控制技术系统的方法 | |
US20230409928A1 (en) | Estimation apparatus, estimation method, and non-transitory computer-readable medium | |
EP4283424A1 (en) | Remote-control apparatus, local-control apparatus, learning processing apparatus, method, and program | |
CN111356959A (zh) | 用于计算机辅助地控制技术系统、特别是发电设备的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221020 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230913 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231225 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20240402 |