JP2019219981A5 - 処理装置、方法、およびプログラム - Google Patents

処理装置、方法、およびプログラム Download PDF

Info

Publication number
JP2019219981A5
JP2019219981A5 JP2018117639A JP2018117639A JP2019219981A5 JP 2019219981 A5 JP2019219981 A5 JP 2019219981A5 JP 2018117639 A JP2018117639 A JP 2018117639A JP 2018117639 A JP2018117639 A JP 2018117639A JP 2019219981 A5 JP2019219981 A5 JP 2019219981A5
Authority
JP
Japan
Prior art keywords
value
processing unit
index
state
action
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018117639A
Other languages
English (en)
Other versions
JP7160574B2 (ja
JP2019219981A (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2018117639A priority Critical patent/JP7160574B2/ja
Priority claimed from JP2018117639A external-priority patent/JP7160574B2/ja
Priority to CN201910388236.XA priority patent/CN110633802A/zh
Priority to CN202110147006.1A priority patent/CN112966806A/zh
Publication of JP2019219981A publication Critical patent/JP2019219981A/ja
Publication of JP2019219981A5 publication Critical patent/JP2019219981A5/ja
Application granted granted Critical
Publication of JP7160574B2 publication Critical patent/JP7160574B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (9)

  1. 対象環境に所定の行動を適用したときの状態遷移のシミュレーションを行い、状態遷移後の該対象環境の状態と、第1指標を用いて求められる該適用された行動に対する評価値と、を算出する第1処理部と、
    該対象環境の状態に対する行動の価値を示す価値関数に基づいて行動を選択して前記第1処理部に入力し、前記第1処理部にて算出された該状態と該評価値とに基づいて該価値関数を更新する第2処理部と、を備え、
    前記第2処理部では、前記第1処理部でのシミュレーション結果を第2指標に基づいて選定し、選定したシミュレーション結果と該価値関数とに基づいて施策を定めることを特徴とする処理装置。
  2. 前記第2処理部は、第1指標から評価値を算出する評価値計算関数を予め定めておき、入力された第1指標に基づいて前記評価値計算関数を選択する、
    請求項1に記載の処理装置。
  3. 前記第2処理部は、重みの比較的大きい第2指標を重みの比較的小さい第2指標よりも優先的に良好な値に維持するようにシミュレーション結果選定する
    請求項1に記載の処理装置。
  4. 前記第2処理部は、前記第1指標と前記第2指標との相関係数を算出し、前記相関係数が負であれば警告を提示する、
    請求項1に記載の処理装置。
  5. 前記第2処理部は、前記価値関数に基づいて行動を選択して前記第1処理部に入力し、前記第1処理部にて算出された該状態と該評価値とに基づいて該価値関数を更新することを繰り返す強化学習と並行して前記相関係数を算出し、前記相関係数が負であると判断した段階で前記強化学習を終了する、
    請求項4に記載の処理装置。
  6. 前記第2処理部は、入力された第1指標が、過去の施策探索において第2指標とされた指標であれば、前記過去の施策探索時に得られた価値関数を今回の施策探索における価値関数の初期値として用いる、
    請求項1に記載の処理装置。
  7. 前記第1処理部が前記シミュレーションを行って前記状態と前記評価値とを算出し、前記第2処理部が、前記価値関数に基づいて行動を選択して前記第1処理部に入力し、前記第1処理部にて算出された該状態と該評価値とに基づいて該価値関数を更新するまでの一連の処理を複数回繰り返すエピソードを実行し、前記第2指標が所定の条件を満たしたエピソードを蓄積し、前記蓄積したエピソードに基づいて前記価値関数を改善し、前記エピソードの実行から前記価値関数の改善までの一連の処理を所定の終了条件が満たされるまで繰り返し、得られた前記価値関数に基づいて定まる施策を提示する、
    請求項1に記載の処理装置。
  8. コンピュータが、
    対象環境の状態に対する行動の価値を示す価値関数に基づいて行動を選択して、対象環境に所定の行動を適用したときの状態遷移のシミュレーションを行い状態遷移後の該対象環境の状態と第1指標を用いて求められる該適用された行動に対する評価値とを算出する処理への入力とし、前記処理にて算出された該状態と該評価値とに基づいて該価値関数を更新し、
    前記処理でのシミュレーション結果を第2指標に基づいて選定し、選定したシミュレーション結果と該価値関数とに基づいて施策を定める、
    処理を実行する処理方法。
  9. 対象環境の状態に対する行動の価値を示す価値関数に基づいて行動を選択して、対象環境に所定の行動を適用したときの状態遷移のシミュレーションを行い状態遷移後の該対象環境の状態と第1指標を用いて求められる該適用された行動に対する評価値とを算出する処理への入力とし、前記処理にて算出された該状態と該評価値とに基づいて該価値関数を更新し、
    前記処理でのシミュレーション結果を第2指標に基づいて選定し、選定したシミュレーション結果と該価値関数とに基づいて施策を定める、
    ことをコンピュータに実行させるための処理プログラム。
JP2018117639A 2018-06-21 2018-06-21 処理装置、方法、およびプログラム Active JP7160574B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018117639A JP7160574B2 (ja) 2018-06-21 2018-06-21 処理装置、方法、およびプログラム
CN201910388236.XA CN110633802A (zh) 2018-06-21 2019-05-10 策略搜索装置、方法及记录介质
CN202110147006.1A CN112966806A (zh) 2018-06-21 2019-05-10 处理装置、处理方法及记录介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018117639A JP7160574B2 (ja) 2018-06-21 2018-06-21 処理装置、方法、およびプログラム

Publications (3)

Publication Number Publication Date
JP2019219981A JP2019219981A (ja) 2019-12-26
JP2019219981A5 true JP2019219981A5 (ja) 2021-08-05
JP7160574B2 JP7160574B2 (ja) 2022-10-25

Family

ID=68968563

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018117639A Active JP7160574B2 (ja) 2018-06-21 2018-06-21 処理装置、方法、およびプログラム

Country Status (2)

Country Link
JP (1) JP7160574B2 (ja)
CN (2) CN110633802A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7466479B2 (ja) 2021-02-22 2024-04-12 株式会社日立製作所 業務改善支援装置、プログラムおよびプログラムを格納した記憶媒体
KR102346900B1 (ko) * 2021-08-05 2022-01-04 주식회사 애자일소다 픽 앤 플레이스 시스템을 위한 심층 강화학습 장치 및 방법
JP2023068265A (ja) * 2021-11-02 2023-05-17 株式会社日立製作所 業務設計支援システム、および業務設計支援方法
JP7449982B2 (ja) 2022-07-05 2024-03-14 株式会社日立製作所 施策策定支援システム、施策策定支援方法、および、施策策定支援プログラム
JP2024061314A (ja) * 2022-10-21 2024-05-07 株式会社日立製作所 業務施策評価装置、および、業務施策評価方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004178492A (ja) * 2002-11-29 2004-06-24 Mitsubishi Heavy Ind Ltd 強化学習法を用いたプラントシミュレーション方法
US8626565B2 (en) * 2008-06-30 2014-01-07 Autonomous Solutions, Inc. Vehicle dispatching method and system
JP4975158B2 (ja) * 2010-11-08 2012-07-11 本田技研工業株式会社 プラントの制御装置
JP6453805B2 (ja) * 2016-04-25 2019-01-16 ファナック株式会社 製品の異常に関連する変数の判定値を設定する生産システム

Similar Documents

Publication Publication Date Title
JP2019219981A5 (ja) 処理装置、方法、およびプログラム
JP2016523402A5 (ja)
JP6523379B2 (ja) 情報処理装置
JP2013084251A5 (ja)
JP2016509271A5 (ja)
RU2011129298A (ru) Идентификация отказов в авиационном двигателе
CN107015875B (zh) 一种电子整机贮存寿命评估方法及装置
JP2015210750A5 (ja)
KR101544457B1 (ko) 최적 설계 파라미터 탐색을 위한 최적화 방법
JP2015128129A5 (ja)
US10635078B2 (en) Simulation system, simulation method, and simulation program
JP2016151932A5 (ja)
JP5668532B2 (ja) シミュレーション方法および材料パラメータ同定方法
JP2014229212A5 (ja) 情報処理システム、情報処理装置、プログラム及び情報処理方法
JP2014096400A5 (ja)
JP2018022247A5 (ja)
EP2957883A3 (en) Method for prognostics of an aircraft structure based on structural testing
JP6446740B2 (ja) シミュレーション装置、シミュレーション方法およびプログラム
JP2016018230A (ja) 制御パラメータ適合方法及び制御パラメータ適合支援装置
RU2015134392A (ru) Способ моделирования подземного объема
JPWO2021059375A5 (ja) 学習装置、学習方法、及び、プログラム
JP2014052909A5 (ja)
CN112488319B (zh) 一种具有自适应配置生成器的调参方法和系统
JPWO2020235061A5 (ja) 動作規則決定装置、動作規則決定方法およびプログラム
JP2017076376A5 (ja)