JP7160574B2 - 処理装置、方法、およびプログラム - Google Patents
処理装置、方法、およびプログラム Download PDFInfo
- Publication number
- JP7160574B2 JP7160574B2 JP2018117639A JP2018117639A JP7160574B2 JP 7160574 B2 JP7160574 B2 JP 7160574B2 JP 2018117639 A JP2018117639 A JP 2018117639A JP 2018117639 A JP2018117639 A JP 2018117639A JP 7160574 B2 JP7160574 B2 JP 7160574B2
- Authority
- JP
- Japan
- Prior art keywords
- index
- action
- state
- value function
- target environment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
Claims (9)
- 行動により状態が遷移し複数の指標が存在する対象環境を疑似するデータを用いて、前記対象環境に所定の行動を適用したときの状態遷移のシミュレーションを行い、状態遷移後の該対象環境の状態と、前記対象環境において向上すべき第1指標を用いて求められる該適用された行動に対する報酬と、を算出する第1処理部と、
該対象環境の状態に対する行動の価値を示す価値関数に基づいて行動を選択して前記第1処理部に入力し、前記第1処理部にて算出された該状態と該報酬とに基づいて該価値関数を更新することを複数回繰り返すエピソードを複数実行する第2処理部と、を備え、
前記第2処理部では、複数の前記エピソードの中から、前記第1指標以外で施策の決定において重視するものとして指定された第2指標が所定の条件を満たすエピソードを選定し、選定したエピソードの価値関数に基づいて施策を定めることを特徴とする処理装置。 - 前記第2処理部は、第1指標から報酬を算出する報酬計算関数を予め定めておき、入力された第1指標に基づいて、前記第1処理部における報酬の算出に用いる報酬計算関数を選択する、
請求項1に記載の処理装置。 - 前記第2処理部は、前記重視するものとして指定された第2指標に基づいてエピソードを選定する、
請求項1に記載の処理装置。 - 前記第2処理部は、前記第1指標と前記第2指標とに一方を改善すると他方が悪化するという関係があれば警告を提示する、
請求項1に記載の処理装置。 - 前記第2処理部は、前記価値関数に基づいて行動を選択して前記第1処理部に入力し、前記第1処理部にて算出された該状態と該報酬とに基づいて該価値関数を更新することを繰り返す強化学習と並行して前記関係の有無を判断し、前記関係があると判断した段階で前記強化学習を終了する、
請求項4に記載の処理装置。 - 前記対象環境に存在する所定個の指標の中から第1指標と第2指標とが指定されるものであり、
前記第2処理部は、今回の施策探索に入力された第1指標が、過去の施策探索において第2指標とされた指標であれば、前記過去の施策探索時に得られた価値関数を今回の施策探索における価値関数の初期値として用いる、
請求項1に記載の処理装置。 - 前記第1処理部が前記シミュレーションを行って前記状態と前記報酬とを算出し、前記第2処理部が、前記価値関数に基づいて行動を選択して前記第1処理部に入力し、前記第1処理部にて算出された該状態と該報酬とに基づいて該価値関数を更新するまでの一連の処理を複数回繰り返すエピソードを実行し、前記第2指標が所定の条件を満たしたエピソードを蓄積し、前記蓄積したエピソードに基づいて前記価値関数を更新し、前記エピソードの実行から前記価値関数の更新までの一連の処理を所定の終了条件が満たされるまで繰り返し、得られた前記価値関数に基づいて定まる施策を提示する、
請求項1に記載の処理装置。 - コンピュータが、
行動により状態が遷移し複数の指標が存在する対象環境を疑似するデータを用いて、前記対象環境の状態に対する行動の価値を示す価値関数に基づいて行動を選択して、前記対象環境に所定の行動を適用したときの状態遷移のシミュレーションを行い状態遷移後の該対象環境の状態と前記対象環境において向上すべき第1指標を用いて求められる該適用された行動に対する報酬とを算出する処理への入力とし、前記処理にて算出された該状態と該報酬とに基づいて該価値関数を更新することを複数回繰り返すエピソードを複数実行し、
複数の前記エピソードの中から、前記第1指標以外で施策の決定において重視するものとして指定された第2指標が所定の条件を満たすエピソードを選定し、選定したエピソードの価値関数に基づいて施策を定める、
処理を実行する処理方法。 - 行動により状態が遷移し複数の指標が存在する対象環境を疑似するデータを用いて、前記対象環境の状態に対する行動の価値を示す価値関数に基づいて行動を選択して、前記対象環境に所定の行動を適用したときの状態遷移のシミュレーションを行い状態遷移後の該対象環境の状態と前記対象環境において向上すべき第1指標を用いて求められる該適用された行動に対する報酬とを算出する処理への入力とし、前記処理にて算出された該状態と該報酬とに基づいて該価値関数を更新することを複数回繰り返すエピソードを複数実行し、
複数の前記エピソードの中から、前記第1指標以外で施策の決定において重視するものとして指定された第2指標が所定の条件を満たすエピソードを選定し、選定したエピソードの価値関数に基づいて施策を定める、
ことをコンピュータに実行させるための処理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018117639A JP7160574B2 (ja) | 2018-06-21 | 2018-06-21 | 処理装置、方法、およびプログラム |
CN202110147006.1A CN112966806A (zh) | 2018-06-21 | 2019-05-10 | 处理装置、处理方法及记录介质 |
CN201910388236.XA CN110633802A (zh) | 2018-06-21 | 2019-05-10 | 策略搜索装置、方法及记录介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018117639A JP7160574B2 (ja) | 2018-06-21 | 2018-06-21 | 処理装置、方法、およびプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019219981A JP2019219981A (ja) | 2019-12-26 |
JP2019219981A5 JP2019219981A5 (ja) | 2021-08-05 |
JP7160574B2 true JP7160574B2 (ja) | 2022-10-25 |
Family
ID=68968563
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018117639A Active JP7160574B2 (ja) | 2018-06-21 | 2018-06-21 | 処理装置、方法、およびプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7160574B2 (ja) |
CN (2) | CN112966806A (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7466479B2 (ja) | 2021-02-22 | 2024-04-12 | 株式会社日立製作所 | 業務改善支援装置、プログラムおよびプログラムを格納した記憶媒体 |
KR102346900B1 (ko) | 2021-08-05 | 2022-01-04 | 주식회사 애자일소다 | 픽 앤 플레이스 시스템을 위한 심층 강화학습 장치 및 방법 |
JP2023068265A (ja) * | 2021-11-02 | 2023-05-17 | 株式会社日立製作所 | 業務設計支援システム、および業務設計支援方法 |
JP7449982B2 (ja) | 2022-07-05 | 2024-03-14 | 株式会社日立製作所 | 施策策定支援システム、施策策定支援方法、および、施策策定支援プログラム |
JP2024061314A (ja) * | 2022-10-21 | 2024-05-07 | 株式会社日立製作所 | 業務施策評価装置、および、業務施策評価方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004178492A (ja) | 2002-11-29 | 2004-06-24 | Mitsubishi Heavy Ind Ltd | 強化学習法を用いたプラントシミュレーション方法 |
JP2012102629A (ja) | 2010-11-08 | 2012-05-31 | Honda Motor Co Ltd | プラントの制御装置 |
US20140100777A1 (en) | 2008-06-30 | 2014-04-10 | Autonomous Solutions, Inc. | Vehicle dispatching method and system |
JP2017199074A (ja) | 2016-04-25 | 2017-11-02 | ファナック株式会社 | 製品の異常に関連する変数の判定値を設定する生産システム |
-
2018
- 2018-06-21 JP JP2018117639A patent/JP7160574B2/ja active Active
-
2019
- 2019-05-10 CN CN202110147006.1A patent/CN112966806A/zh active Pending
- 2019-05-10 CN CN201910388236.XA patent/CN110633802A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004178492A (ja) | 2002-11-29 | 2004-06-24 | Mitsubishi Heavy Ind Ltd | 強化学習法を用いたプラントシミュレーション方法 |
US20140100777A1 (en) | 2008-06-30 | 2014-04-10 | Autonomous Solutions, Inc. | Vehicle dispatching method and system |
JP2012102629A (ja) | 2010-11-08 | 2012-05-31 | Honda Motor Co Ltd | プラントの制御装置 |
JP2017199074A (ja) | 2016-04-25 | 2017-11-02 | ファナック株式会社 | 製品の異常に関連する変数の判定値を設定する生産システム |
Also Published As
Publication number | Publication date |
---|---|
JP2019219981A (ja) | 2019-12-26 |
CN112966806A (zh) | 2021-06-15 |
CN110633802A (zh) | 2019-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7160574B2 (ja) | 処理装置、方法、およびプログラム | |
WO2016152053A1 (ja) | 精度推定モデル生成システムおよび精度推定システム | |
KR101544457B1 (ko) | 최적 설계 파라미터 탐색을 위한 최적화 방법 | |
US20210209468A1 (en) | Learning device, inference device, method, and program | |
JP5460426B2 (ja) | 生産性評価装置、生産性評価方法およびプログラム | |
KR102251807B1 (ko) | 하이퍼파라미터 최적화 알고리즘 추천 방법 및 최적화 알고리즘 추천 시스템 | |
JP7069029B2 (ja) | 自動予測システム、自動予測方法および自動予測プログラム | |
WO2016151620A1 (ja) | シミュレートシステム、シミュレート方法およびシミュレート用プログラム | |
JPWO2013150686A1 (ja) | パラメータ設定装置 | |
JP2015161557A5 (ja) | ||
JP2019505889A (ja) | コスト関数設計システム、コスト関数設計方法、およびコスト関数設計プログラム | |
JP6995717B2 (ja) | 施策探索装置、方法およびプログラム | |
JP2021043561A (ja) | 作業訓練システム及び作業訓練支援方法 | |
WO2019103773A1 (en) | Automatically identifying alternative functional capabilities of designed artifacts | |
US20210097884A1 (en) | Work support apparatus, work support system, and work support method | |
JP2020009122A (ja) | 制御プログラム、制御方法及びシステム | |
JP7173741B2 (ja) | 作業支援装置 | |
US10698968B2 (en) | Information providing apparatus and information providing method | |
US20220147850A1 (en) | Hypothesis verification apparatus, hypothesis verification, and computer-readable recording medium | |
JP6641456B2 (ja) | 計算機システム及びデータの分類方法 | |
WO2022244625A1 (ja) | 修理内容予測方法、修理内容予測装置、プログラム、及び、修理内容予測モデルの作成方法 | |
JP7417922B2 (ja) | 知識モデル構築システム及び知識モデル構築方法 | |
EP4300347A1 (en) | Simulation execution method and program | |
EP4290426A1 (en) | Accuracy calculation program, accuracy calculation method, and information processing device | |
JP2023116906A (ja) | データ処理装置、データ処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210624 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211022 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220419 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220617 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220817 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220913 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221013 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7160574 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |