JP2019219981A5 - 処理装置、方法、およびプログラム - Google Patents
処理装置、方法、およびプログラム Download PDFInfo
- Publication number
- JP2019219981A5 JP2019219981A5 JP2018117639A JP2018117639A JP2019219981A5 JP 2019219981 A5 JP2019219981 A5 JP 2019219981A5 JP 2018117639 A JP2018117639 A JP 2018117639A JP 2018117639 A JP2018117639 A JP 2018117639A JP 2019219981 A5 JP2019219981 A5 JP 2019219981A5
- Authority
- JP
- Japan
- Prior art keywords
- value
- processing unit
- index
- state
- action
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 claims 12
- 238000004088 simulation Methods 0.000 claims 9
- 238000000034 method Methods 0.000 claims 8
- 230000006399 behavior Effects 0.000 claims 2
- 238000004364 calculation method Methods 0.000 claims 2
- 230000002787 reinforcement Effects 0.000 claims 2
- 238000003672 processing method Methods 0.000 claims 1
Claims (9)
- 対象環境に所定の行動を適用したときの状態遷移のシミュレーションを行い、状態遷移後の該対象環境の状態と、第1指標を用いて求められる該適用された行動に対する評価値と、を算出する第1処理部と、
該対象環境の状態に対する行動の価値を示す価値関数に基づいて行動を選択して前記第1処理部に入力し、前記第1処理部にて算出された該状態と該評価値とに基づいて該価値関数を更新する第2処理部と、を備え、
前記第2処理部では、前記第1処理部でのシミュレーション結果を第2指標に基づいて選定し、選定したシミュレーション結果と該価値関数とに基づいて施策を定めることを特徴とする処理装置。 - 前記第2処理部は、第1指標から評価値を算出する評価値計算関数を予め定めておき、入力された第1指標に基づいて前記評価値計算関数を選択する、
請求項1に記載の処理装置。 - 前記第2処理部は、重みの比較的大きい第2指標を重みの比較的小さい第2指標よりも優先的に良好な値に維持するようにシミュレーション結果を選定する、
請求項1に記載の処理装置。 - 前記第2処理部は、前記第1指標と前記第2指標との相関係数を算出し、前記相関係数が負であれば警告を提示する、
請求項1に記載の処理装置。 - 前記第2処理部は、前記価値関数に基づいて行動を選択して前記第1処理部に入力し、前記第1処理部にて算出された該状態と該評価値とに基づいて該価値関数を更新することを繰り返す強化学習と並行して前記相関係数を算出し、前記相関係数が負であると判断した段階で前記強化学習を終了する、
請求項4に記載の処理装置。 - 前記第2処理部は、入力された第1指標が、過去の施策探索において第2指標とされた指標であれば、前記過去の施策探索時に得られた価値関数を今回の施策探索における価値関数の初期値として用いる、
請求項1に記載の処理装置。 - 前記第1処理部が前記シミュレーションを行って前記状態と前記評価値とを算出し、前記第2処理部が、前記価値関数に基づいて行動を選択して前記第1処理部に入力し、前記第1処理部にて算出された該状態と該評価値とに基づいて該価値関数を更新するまでの一連の処理を複数回繰り返すエピソードを実行し、前記第2指標が所定の条件を満たしたエピソードを蓄積し、前記蓄積したエピソードに基づいて前記価値関数を改善し、前記エピソードの実行から前記価値関数の改善までの一連の処理を所定の終了条件が満たされるまで繰り返し、得られた前記価値関数に基づいて定まる施策を提示する、
請求項1に記載の処理装置。 - コンピュータが、
対象環境の状態に対する行動の価値を示す価値関数に基づいて行動を選択して、対象環境に所定の行動を適用したときの状態遷移のシミュレーションを行い状態遷移後の該対象環境の状態と第1指標を用いて求められる該適用された行動に対する評価値とを算出する処理への入力とし、前記処理にて算出された該状態と該評価値とに基づいて該価値関数を更新し、
前記処理でのシミュレーション結果を第2指標に基づいて選定し、選定したシミュレーション結果と該価値関数とに基づいて施策を定める、
処理を実行する処理方法。 - 対象環境の状態に対する行動の価値を示す価値関数に基づいて行動を選択して、対象環境に所定の行動を適用したときの状態遷移のシミュレーションを行い状態遷移後の該対象環境の状態と第1指標を用いて求められる該適用された行動に対する評価値とを算出する処理への入力とし、前記処理にて算出された該状態と該評価値とに基づいて該価値関数を更新し、
前記処理でのシミュレーション結果を第2指標に基づいて選定し、選定したシミュレーション結果と該価値関数とに基づいて施策を定める、
ことをコンピュータに実行させるための処理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018117639A JP7160574B2 (ja) | 2018-06-21 | 2018-06-21 | 処理装置、方法、およびプログラム |
CN201910388236.XA CN110633802A (zh) | 2018-06-21 | 2019-05-10 | 策略搜索装置、方法及记录介质 |
CN202110147006.1A CN112966806A (zh) | 2018-06-21 | 2019-05-10 | 处理装置、处理方法及记录介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018117639A JP7160574B2 (ja) | 2018-06-21 | 2018-06-21 | 処理装置、方法、およびプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019219981A JP2019219981A (ja) | 2019-12-26 |
JP2019219981A5 true JP2019219981A5 (ja) | 2021-08-05 |
JP7160574B2 JP7160574B2 (ja) | 2022-10-25 |
Family
ID=68968563
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018117639A Active JP7160574B2 (ja) | 2018-06-21 | 2018-06-21 | 処理装置、方法、およびプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7160574B2 (ja) |
CN (2) | CN110633802A (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7466479B2 (ja) | 2021-02-22 | 2024-04-12 | 株式会社日立製作所 | 業務改善支援装置、プログラムおよびプログラムを格納した記憶媒体 |
KR102346900B1 (ko) * | 2021-08-05 | 2022-01-04 | 주식회사 애자일소다 | 픽 앤 플레이스 시스템을 위한 심층 강화학습 장치 및 방법 |
JP2023068265A (ja) * | 2021-11-02 | 2023-05-17 | 株式会社日立製作所 | 業務設計支援システム、および業務設計支援方法 |
JP7449982B2 (ja) | 2022-07-05 | 2024-03-14 | 株式会社日立製作所 | 施策策定支援システム、施策策定支援方法、および、施策策定支援プログラム |
JP2024061314A (ja) * | 2022-10-21 | 2024-05-07 | 株式会社日立製作所 | 業務施策評価装置、および、業務施策評価方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004178492A (ja) * | 2002-11-29 | 2004-06-24 | Mitsubishi Heavy Ind Ltd | 強化学習法を用いたプラントシミュレーション方法 |
US8626565B2 (en) * | 2008-06-30 | 2014-01-07 | Autonomous Solutions, Inc. | Vehicle dispatching method and system |
JP4975158B2 (ja) * | 2010-11-08 | 2012-07-11 | 本田技研工業株式会社 | プラントの制御装置 |
JP6453805B2 (ja) * | 2016-04-25 | 2019-01-16 | ファナック株式会社 | 製品の異常に関連する変数の判定値を設定する生産システム |
-
2018
- 2018-06-21 JP JP2018117639A patent/JP7160574B2/ja active Active
-
2019
- 2019-05-10 CN CN201910388236.XA patent/CN110633802A/zh active Pending
- 2019-05-10 CN CN202110147006.1A patent/CN112966806A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2019219981A5 (ja) | 処理装置、方法、およびプログラム | |
JP2016523402A5 (ja) | ||
JP6523379B2 (ja) | 情報処理装置 | |
JP2013084251A5 (ja) | ||
JP2016509271A5 (ja) | ||
RU2011129298A (ru) | Идентификация отказов в авиационном двигателе | |
CN107015875B (zh) | 一种电子整机贮存寿命评估方法及装置 | |
JP2015210750A5 (ja) | ||
KR101544457B1 (ko) | 최적 설계 파라미터 탐색을 위한 최적화 방법 | |
JP2015128129A5 (ja) | ||
US10635078B2 (en) | Simulation system, simulation method, and simulation program | |
JP2016151932A5 (ja) | ||
JP5668532B2 (ja) | シミュレーション方法および材料パラメータ同定方法 | |
JP2014229212A5 (ja) | 情報処理システム、情報処理装置、プログラム及び情報処理方法 | |
JP2014096400A5 (ja) | ||
JP2018022247A5 (ja) | ||
EP2957883A3 (en) | Method for prognostics of an aircraft structure based on structural testing | |
JP6446740B2 (ja) | シミュレーション装置、シミュレーション方法およびプログラム | |
JP2016018230A (ja) | 制御パラメータ適合方法及び制御パラメータ適合支援装置 | |
RU2015134392A (ru) | Способ моделирования подземного объема | |
JPWO2021059375A5 (ja) | 学習装置、学習方法、及び、プログラム | |
JP2014052909A5 (ja) | ||
CN112488319B (zh) | 一种具有自适应配置生成器的调参方法和系统 | |
JPWO2020235061A5 (ja) | 動作規則決定装置、動作規則決定方法およびプログラム | |
JP2017076376A5 (ja) |