JPWO2021186500A5 - - Google Patents
Download PDFInfo
- Publication number
- JPWO2021186500A5 JPWO2021186500A5 JP2022508616A JP2022508616A JPWO2021186500A5 JP WO2021186500 A5 JPWO2021186500 A5 JP WO2021186500A5 JP 2022508616 A JP2022508616 A JP 2022508616A JP 2022508616 A JP2022508616 A JP 2022508616A JP WO2021186500 A5 JPWO2021186500 A5 JP WO2021186500A5
- Authority
- JP
- Japan
- Prior art keywords
- target system
- determined
- policy
- evaluation
- difficulty level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 claims 19
- 238000000034 method Methods 0.000 claims 6
- 230000007704 transition Effects 0.000 claims 6
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2020/011465 WO2021186500A1 (ja) | 2020-03-16 | 2020-03-16 | 学習装置、学習方法、及び、記録媒体 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JPWO2021186500A1 JPWO2021186500A1 (https=) | 2021-09-23 |
| JPWO2021186500A5 true JPWO2021186500A5 (https=) | 2022-11-08 |
| JP7468619B2 JP7468619B2 (ja) | 2024-04-16 |
Family
ID=77770726
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022508616A Active JP7468619B2 (ja) | 2020-03-16 | 2020-03-16 | 学習装置、学習方法、及び、記録媒体 |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US20240202569A1 (https=) |
| JP (1) | JP7468619B2 (https=) |
| WO (1) | WO2021186500A1 (https=) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114357884B (zh) * | 2022-01-05 | 2022-11-08 | 厦门宇昊软件有限公司 | 一种基于深度强化学习的反应温度控制方法和系统 |
| CN114404977B (zh) * | 2022-01-25 | 2024-04-16 | 腾讯科技(深圳)有限公司 | 行为模型的训练方法、结构扩容模型的训练方法 |
| JP7837854B2 (ja) * | 2022-12-19 | 2026-03-31 | 株式会社東芝 | 学習方法、学習装置、学習プログラム、制御方法、制御装置及び制御プログラム |
| CN119249911B (zh) * | 2024-12-03 | 2025-04-04 | 西北工业大学 | 一种基于迁移学习的流动主动控制增效设计方法 |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP3432230A4 (en) * | 2016-04-18 | 2019-11-20 | Nippon Telegraph And Telephone Corporation | LEARNING DEVICE, LEARNING PROCEDURE AND LEARNING PROGRAM |
| JP6975685B2 (ja) * | 2018-06-15 | 2021-12-01 | 株式会社日立製作所 | 学習制御方法及び計算機システム |
-
2020
- 2020-03-16 JP JP2022508616A patent/JP7468619B2/ja active Active
- 2020-03-16 WO PCT/JP2020/011465 patent/WO2021186500A1/ja not_active Ceased
- 2020-03-16 US US17/909,835 patent/US20240202569A1/en active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPWO2021186500A5 (https=) | ||
| CN113255206A (zh) | 一种基于深度强化学习的水文预报模型参数率定方法 | |
| CN109492763A (zh) | 一种基于强化学习网络训练的自动泊车方法 | |
| WO2013186722A4 (en) | Selectively controlling instruction execution in transactional processing | |
| HRP20190661T1 (hr) | Filtriranje prekidanja programa kod provođenja transakcije | |
| JP2024095538A5 (https=) | ||
| JP2019219741A5 (https=) | ||
| CN108830376B (zh) | 针对时间敏感的环境的多价值网络深度强化学习方法 | |
| JPWO2020009139A5 (ja) | 制御装置、システム、制御方法、方策更新方法、及び生成方法 | |
| JPWO2022172452A5 (https=) | ||
| CN115688893B (zh) | 内存调度方法及装置、电子设备和存储介质 | |
| WO2018227820A1 (zh) | 控制机械臂运动的方法及装置、存储介质和终端设备 | |
| JP2024026661A5 (https=) | ||
| JPWO2023166573A5 (ja) | 学習装置、制御装置、学習方法及びプログラム | |
| JP2024052731A5 (https=) | ||
| JPWO2022049672A5 (ja) | 学習装置、学習方法、制御システムおよびプログラム | |
| JPWO2021220450A5 (https=) | ||
| CN113849134B (zh) | 一种存储区的数据更新方法、设备和计算机可读存储介质 | |
| CN117478538A (zh) | 一种基于深度强化学习的物联网设备探测与控制方法 | |
| JPWO2023084695A5 (https=) | ||
| JP2018077917A5 (ja) | 税計算機、税計算方法、及び税計算プログラム | |
| CN115935812A (zh) | 直拉硅单晶生长过程的硅熔体流速预测方法 | |
| CN109526701B (zh) | 滴灌控制方法及装置 | |
| JPWO2024201751A5 (ja) | 制御装置、制御方法およびプログラム | |
| JP7459856B2 (ja) | 装置、方法およびプログラム |