JPWO2021186500A5 - - Google Patents
Download PDFInfo
- Publication number
- JPWO2021186500A5 JPWO2021186500A5 JP2022508616A JP2022508616A JPWO2021186500A5 JP WO2021186500 A5 JPWO2021186500 A5 JP WO2021186500A5 JP 2022508616 A JP2022508616 A JP 2022508616A JP 2022508616 A JP2022508616 A JP 2022508616A JP WO2021186500 A5 JPWO2021186500 A5 JP WO2021186500A5
- Authority
- JP
- Japan
- Prior art keywords
- target system
- determined
- policy
- evaluation
- difficulty level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 claims 19
- 238000000034 method Methods 0.000 claims 6
- 230000007704 transition Effects 0.000 claims 6
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2020/011465 WO2021186500A1 (ja) | 2020-03-16 | 2020-03-16 | 学習装置、学習方法、及び、記録媒体 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JPWO2021186500A1 JPWO2021186500A1 (https=) | 2021-09-23 |
| JPWO2021186500A5 true JPWO2021186500A5 (https=) | 2022-11-08 |
| JP7468619B2 JP7468619B2 (ja) | 2024-04-16 |
Family
ID=77770726
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022508616A Active JP7468619B2 (ja) | 2020-03-16 | 2020-03-16 | 学習装置、学習方法、及び、記録媒体 |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US20240202569A1 (https=) |
| JP (1) | JP7468619B2 (https=) |
| WO (1) | WO2021186500A1 (https=) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114357884B (zh) * | 2022-01-05 | 2022-11-08 | 厦门宇昊软件有限公司 | 一种基于深度强化学习的反应温度控制方法和系统 |
| CN114404977B (zh) * | 2022-01-25 | 2024-04-16 | 腾讯科技(深圳)有限公司 | 行为模型的训练方法、结构扩容模型的训练方法 |
| JP7837854B2 (ja) * | 2022-12-19 | 2026-03-31 | 株式会社東芝 | 学習方法、学習装置、学習プログラム、制御方法、制御装置及び制御プログラム |
| CN119249911B (zh) * | 2024-12-03 | 2025-04-04 | 西北工业大学 | 一种基于迁移学习的流动主动控制增效设计方法 |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2017183587A1 (ja) | 2016-04-18 | 2017-10-26 | 日本電信電話株式会社 | 学習装置、学習方法および学習プログラム |
| JP6975685B2 (ja) * | 2018-06-15 | 2021-12-01 | 株式会社日立製作所 | 学習制御方法及び計算機システム |
-
2020
- 2020-03-16 US US17/909,835 patent/US20240202569A1/en active Pending
- 2020-03-16 JP JP2022508616A patent/JP7468619B2/ja active Active
- 2020-03-16 WO PCT/JP2020/011465 patent/WO2021186500A1/ja not_active Ceased
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPWO2021186500A5 (https=) | ||
| CN116627027B (zh) | 一种基于改进型pid最优鲁棒性控制方法 | |
| JP2022547596A5 (https=) | ||
| CN113255206A (zh) | 一种基于深度强化学习的水文预报模型参数率定方法 | |
| CN109492763A (zh) | 一种基于强化学习网络训练的自动泊车方法 | |
| JPWO2020234984A5 (https=) | ||
| HRP20190661T1 (hr) | Filtriranje prekidanja programa kod provođenja transakcije | |
| JP2024095538A5 (https=) | ||
| JP2019219741A5 (https=) | ||
| CN108830376B (zh) | 针对时间敏感的环境的多价值网络深度强化学习方法 | |
| JP2024500770A5 (https=) | ||
| JP2023098647A5 (https=) | ||
| JPWO2023166573A5 (ja) | 学習装置、制御装置、学習方法及びプログラム | |
| JPWO2022049672A5 (ja) | 学習装置、学習方法、制御システムおよびプログラム | |
| JPWO2021220450A5 (https=) | ||
| JPWO2022137520A5 (https=) | ||
| JP2018015522A5 (https=) | ||
| CN118133637A (zh) | 一种基于rbf模型的装夹应力场实时仿真及映射方法 | |
| JP2021035547A5 (https=) | ||
| CN113849134B (zh) | 一种存储区的数据更新方法、设备和计算机可读存储介质 | |
| JPWO2024201751A5 (ja) | 制御装置、制御方法およびプログラム | |
| CN117478538A (zh) | 一种基于深度强化学习的物联网设备探测与控制方法 | |
| JPWO2023084695A5 (https=) | ||
| JP2018077917A5 (ja) | 税計算機、税計算方法、及び税計算プログラム | |
| JP2021041300A5 (https=) |