JPWO2021229625A5 - - Google Patents

Download PDF

Info

Publication number
JPWO2021229625A5
JPWO2021229625A5 JP2022522086A JP2022522086A JPWO2021229625A5 JP WO2021229625 A5 JPWO2021229625 A5 JP WO2021229625A5 JP 2022522086 A JP2022522086 A JP 2022522086A JP 2022522086 A JP2022522086 A JP 2022522086A JP WO2021229625 A5 JPWO2021229625 A5 JP WO2021229625A5
Authority
JP
Japan
Prior art keywords
target
objective function
change
learning
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022522086A
Other languages
English (en)
Other versions
JPWO2021229625A1 (ja
JP7420236B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from PCT/JP2020/018767 external-priority patent/WO2021229625A1/ja
Publication of JPWO2021229625A1 publication Critical patent/JPWO2021229625A1/ja
Publication of JPWO2021229625A5 publication Critical patent/JPWO2021229625A5/ja
Application granted granted Critical
Publication of JP7420236B2 publication Critical patent/JP7420236B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (10)

  1. 対象の変更実績を示す意思決定履歴データに基づく逆強化学習で予め生成された目的関数を用いた第一の対象に対する最適化結果である第二の対象を出力する第一出力手段と、
    ユーザから受け付けた前記第二の対象に関する変更指示に基づいて、当該第二の対象をさらに変更した結果の対象を示す第三の対象を出力する第二出力手段と、
    前記第二の対象から前記第三の対象への変更実績を意思決定履歴データとして出力するデータ出力手段と、
    前記意思決定履歴データを用いて前記目的関数を学習する学習手段とを備えた
    ことを特徴とする学習装置。
  2. 第二出力手段は、出力された第二の対象に対する直接的な変更指示をユーザから受け付けて、受け付けた変更指示に基づく結果の対象を第三の対象として出力する
    請求項1記載の学習装置。
  3. 第二出力手段は、線形式で表わされた目的関数に含まれる説明変数の重みに対する変更指示をユーザから受け付け、変更された目的関数を用いた最適化により、第二の対象を変更した結果として第三の対象を出力する
    請求項1記載の学習装置。
  4. 第二出力手段は、目的関数に説明変数を追加する変更指示をユーザから受け付けて、変更された目的関数を用いた最適化により、第二の対象を変更した結果として第三の対象を出力する
    請求項1記載の学習装置。
  5. 学習手段は、追加された説明変数を含む目的関数を学習する
    請求項4記載の学習装置。
  6. 対象の変更実績を示す意思決定履歴データに基づく逆強化学習で予め生成された目的関数を用いた第一の対象に対する最適化結果である第二の対象を出力し、
    ユーザから受け付けた前記第二の対象に関する変更指示に基づいて、当該第二の対象をさらに変更した結果の対象を示す第三の対象を出力し、
    前記第二の対象から前記第三の対象への変更実績を意思決定履歴データとして出力し、
    前記意思決定履歴データを用いて前記目的関数を学習する
    ことを特徴とする学習方法。
  7. 出力された第二の対象に対する直接的な変更指示をユーザから受け付けて、受け付けた変更指示に基づく結果の対象を第三の対象として出力する
    請求項6記載の学習方法。
  8. 線形式で表わされた目的関数に含まれる説明変数の重みに対する変更指示をユーザから受け付け、変更された目的関数を用いた最適化により、第二の対象を変更した結果として第三の対象を出力する
    請求項6記載の学習方法。
  9. 目的関数に説明変数を追加する変更指示をユーザから受け付けて、変更された目的関数を用いた最適化により、第二の対象を変更した結果として第三の対象を出力する
    請求項6記載の学習方法。
  10. ンピュータに、
    対象の変更実績を示す意思決定履歴データに基づく逆強化学習で予め生成された目的関数を用いた第一の対象に対する最適化結果である第二の対象を出力する第一出力処理、
    ユーザから受け付けた前記第二の対象に関する変更指示に基づいて、当該第二の対象をさらに変更した結果の対象を示す第三の対象を出力する第二出力処理、
    前記第二の対象から前記第三の対象への変更実績を意思決定履歴データとして出力するデータ出力処理、および、
    前記意思決定履歴データを用いて前記目的関数を学習する学習処理
    を実行させるための学習プログラム。
JP2022522086A 2020-05-11 2020-05-11 学習装置、学習方法および学習プログラム Active JP7420236B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/018767 WO2021229625A1 (ja) 2020-05-11 2020-05-11 学習装置、学習方法および学習プログラム

Publications (3)

Publication Number Publication Date
JPWO2021229625A1 JPWO2021229625A1 (ja) 2021-11-18
JPWO2021229625A5 true JPWO2021229625A5 (ja) 2023-01-24
JP7420236B2 JP7420236B2 (ja) 2024-01-23

Family

ID=78525971

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022522086A Active JP7420236B2 (ja) 2020-05-11 2020-05-11 学習装置、学習方法および学習プログラム

Country Status (3)

Country Link
US (1) US20230281506A1 (ja)
JP (1) JP7420236B2 (ja)
WO (1) WO2021229625A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023188061A1 (ja) * 2022-03-30 2023-10-05 日本電気株式会社 トレーニング支援装置、トレーニング支援方法、トレーニング支援プログラム、学習装置、学習方法、および学習プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102653617B1 (ko) * 2019-07-03 2024-04-01 엘지전자 주식회사 공기조화기 및 공기조화기의 동작 방법

Similar Documents

Publication Publication Date Title
CN108628355A (zh) 伺服控制装置及系统、机器学习装置及方法
US11762679B2 (en) Information processing device, information processing method, and non-transitory computer-readable storage medium
US11669056B2 (en) Generation of a control system for a target system
JP2017049801A5 (ja)
JPWO2020234984A5 (ja)
JPWO2021229625A5 (ja)
JPWO2021130916A5 (ja)
JP2019520642A (ja) 制御目的関数統合システム、制御目的関数統合方法、および、制御目的関数統合プログラム
CN104573331B (zh) 一种基于MapReduce的K近邻数据预测方法
Chen et al. A deep-reinforcement-learning-based scheduler for fpga hls
JPWO2020075316A1 (ja) 位置決め制御装置及び位置決め方法
JPWO2021229626A5 (ja)
JP2019219741A5 (ja)
JPWO2022013933A5 (ja) 制御装置、制御方法及びプログラム
JP6977733B2 (ja) パラメータ最適化装置、パラメータ最適化方法、及びプログラム
Bharati et al. A performance prediction of worm-worm wheel and its multi objective design parameter optimization based on genetic algorithm
JP2020198135A (ja) ハイパーパラメータチューニング方法、装置及びプログラム
JP2022026106A5 (ja) モデル生成方法、探索プログラム及びモデル生成装置
JPWO2022044335A5 (ja)
CN114254764B (zh) 基于反馈的机器学习模型搜索方法、系统、设备及介质
CN117273392B (zh) 家具生产决策方法、装置、电子设备及存储介质
JPWO2022044315A5 (ja)
JPWO2022259309A5 (ja)
JP7417922B2 (ja) 知識モデル構築システム及び知識モデル構築方法
Liu et al. Extreme learning machine based on improved genetic algorithm