JPWO2021229625A5 - - Google Patents
Download PDFInfo
- Publication number
- JPWO2021229625A5 JPWO2021229625A5 JP2022522086A JP2022522086A JPWO2021229625A5 JP WO2021229625 A5 JPWO2021229625 A5 JP WO2021229625A5 JP 2022522086 A JP2022522086 A JP 2022522086A JP 2022522086 A JP2022522086 A JP 2022522086A JP WO2021229625 A5 JPWO2021229625 A5 JP WO2021229625A5
- Authority
- JP
- Japan
- Prior art keywords
- target
- objective function
- change
- learning
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000006870 function Effects 0.000 claims 15
- 238000000034 method Methods 0.000 claims 7
- 238000005457 optimization Methods 0.000 claims 6
- 230000002787 reinforcement Effects 0.000 claims 3
Claims (10)
- 対象の変更実績を示す意思決定履歴データに基づく逆強化学習で予め生成された目的関数を用いた第一の対象に対する最適化結果である第二の対象を出力する第一出力手段と、
ユーザから受け付けた前記第二の対象に関する変更指示に基づいて、当該第二の対象をさらに変更した結果の対象を示す第三の対象を出力する第二出力手段と、
前記第二の対象から前記第三の対象への変更実績を意思決定履歴データとして出力するデータ出力手段と、
前記意思決定履歴データを用いて前記目的関数を学習する学習手段とを備えた
ことを特徴とする学習装置。 - 第二出力手段は、出力された第二の対象に対する直接的な変更指示をユーザから受け付けて、受け付けた変更指示に基づく結果の対象を第三の対象として出力する
請求項1記載の学習装置。 - 第二出力手段は、線形式で表わされた目的関数に含まれる説明変数の重みに対する変更指示をユーザから受け付け、変更された目的関数を用いた最適化により、第二の対象を変更した結果として第三の対象を出力する
請求項1記載の学習装置。 - 第二出力手段は、目的関数に説明変数を追加する変更指示をユーザから受け付けて、変更された目的関数を用いた最適化により、第二の対象を変更した結果として第三の対象を出力する
請求項1記載の学習装置。 - 学習手段は、追加された説明変数を含む目的関数を学習する
請求項4記載の学習装置。 - 対象の変更実績を示す意思決定履歴データに基づく逆強化学習で予め生成された目的関数を用いた第一の対象に対する最適化結果である第二の対象を出力し、
ユーザから受け付けた前記第二の対象に関する変更指示に基づいて、当該第二の対象をさらに変更した結果の対象を示す第三の対象を出力し、
前記第二の対象から前記第三の対象への変更実績を意思決定履歴データとして出力し、
前記意思決定履歴データを用いて前記目的関数を学習する
ことを特徴とする学習方法。 - 出力された第二の対象に対する直接的な変更指示をユーザから受け付けて、受け付けた変更指示に基づく結果の対象を第三の対象として出力する
請求項6記載の学習方法。 - 線形式で表わされた目的関数に含まれる説明変数の重みに対する変更指示をユーザから受け付け、変更された目的関数を用いた最適化により、第二の対象を変更した結果として第三の対象を出力する
請求項6記載の学習方法。 - 目的関数に説明変数を追加する変更指示をユーザから受け付けて、変更された目的関数を用いた最適化により、第二の対象を変更した結果として第三の対象を出力する
請求項6記載の学習方法。 - コンピュータに、
対象の変更実績を示す意思決定履歴データに基づく逆強化学習で予め生成された目的関数を用いた第一の対象に対する最適化結果である第二の対象を出力する第一出力処理、
ユーザから受け付けた前記第二の対象に関する変更指示に基づいて、当該第二の対象をさらに変更した結果の対象を示す第三の対象を出力する第二出力処理、
前記第二の対象から前記第三の対象への変更実績を意思決定履歴データとして出力するデータ出力処理、および、
前記意思決定履歴データを用いて前記目的関数を学習する学習処理
を実行させるための学習プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/018767 WO2021229625A1 (ja) | 2020-05-11 | 2020-05-11 | 学習装置、学習方法および学習プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2021229625A1 JPWO2021229625A1 (ja) | 2021-11-18 |
JPWO2021229625A5 true JPWO2021229625A5 (ja) | 2023-01-24 |
JP7420236B2 JP7420236B2 (ja) | 2024-01-23 |
Family
ID=78525971
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022522086A Active JP7420236B2 (ja) | 2020-05-11 | 2020-05-11 | 学習装置、学習方法および学習プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230281506A1 (ja) |
JP (1) | JP7420236B2 (ja) |
WO (1) | WO2021229625A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023188061A1 (ja) * | 2022-03-30 | 2023-10-05 | 日本電気株式会社 | トレーニング支援装置、トレーニング支援方法、トレーニング支援プログラム、学習装置、学習方法、および学習プログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102653617B1 (ko) * | 2019-07-03 | 2024-04-01 | 엘지전자 주식회사 | 공기조화기 및 공기조화기의 동작 방법 |
-
2020
- 2020-05-11 WO PCT/JP2020/018767 patent/WO2021229625A1/ja active Application Filing
- 2020-05-11 US US17/922,029 patent/US20230281506A1/en active Pending
- 2020-05-11 JP JP2022522086A patent/JP7420236B2/ja active Active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108628355A (zh) | 伺服控制装置及系统、机器学习装置及方法 | |
US11762679B2 (en) | Information processing device, information processing method, and non-transitory computer-readable storage medium | |
US11669056B2 (en) | Generation of a control system for a target system | |
JP2017049801A5 (ja) | ||
JPWO2020234984A5 (ja) | ||
JPWO2021229625A5 (ja) | ||
JPWO2021130916A5 (ja) | ||
JP2019520642A (ja) | 制御目的関数統合システム、制御目的関数統合方法、および、制御目的関数統合プログラム | |
CN104573331B (zh) | 一种基于MapReduce的K近邻数据预测方法 | |
Chen et al. | A deep-reinforcement-learning-based scheduler for fpga hls | |
JPWO2020075316A1 (ja) | 位置決め制御装置及び位置決め方法 | |
JPWO2021229626A5 (ja) | ||
JP2019219741A5 (ja) | ||
JPWO2022013933A5 (ja) | 制御装置、制御方法及びプログラム | |
JP6977733B2 (ja) | パラメータ最適化装置、パラメータ最適化方法、及びプログラム | |
Bharati et al. | A performance prediction of worm-worm wheel and its multi objective design parameter optimization based on genetic algorithm | |
JP2020198135A (ja) | ハイパーパラメータチューニング方法、装置及びプログラム | |
JP2022026106A5 (ja) | モデル生成方法、探索プログラム及びモデル生成装置 | |
JPWO2022044335A5 (ja) | ||
CN114254764B (zh) | 基于反馈的机器学习模型搜索方法、系统、设备及介质 | |
CN117273392B (zh) | 家具生产决策方法、装置、电子设备及存储介质 | |
JPWO2022044315A5 (ja) | ||
JPWO2022259309A5 (ja) | ||
JP7417922B2 (ja) | 知識モデル構築システム及び知識モデル構築方法 | |
Liu et al. | Extreme learning machine based on improved genetic algorithm |