JP6850313B2 - シミュレーション装置、シミュレーション方法およびシミュレーションプログラム - Google Patents
シミュレーション装置、シミュレーション方法およびシミュレーションプログラム Download PDFInfo
- Publication number
- JP6850313B2 JP6850313B2 JP2019021965A JP2019021965A JP6850313B2 JP 6850313 B2 JP6850313 B2 JP 6850313B2 JP 2019021965 A JP2019021965 A JP 2019021965A JP 2019021965 A JP2019021965 A JP 2019021965A JP 6850313 B2 JP6850313 B2 JP 6850313B2
- Authority
- JP
- Japan
- Prior art keywords
- simulation
- prediction model
- learning
- data
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Feedback Control In General (AREA)
Description
以下の実施の形態では、第1の実施形態に係るシミュレーション装置100の構成、シミュレーション装置100の処理の流れを順に説明し、最後に第1の実施形態による効果を説明する。
まず、図1を用いて、シミュレーション装置100の構成を説明する。図1は、第1の実施形態に係るシミュレーション装置の構成の一例を示すブロック図である。シミュレーション装置100は、例えば、他の情報処理装置から学習用データの入力を受け付ける。シミュレーション装置100は、生成部が、受け付けた学習用データを用いて学習し、予測モデルを生成する。シミュレーション装置100は、シミュレーションに用いる評価用データと、生成された予測モデルと、シミュレーションにおける強化学習を行う強化学習器と、シミュレーションにおける模倣学習を行う模倣学習器とのうち、いずれか1つまたは複数の配置を受け付ける。シミュレーション装置100は、受け付けた配置の状態に基づいて、評価用データと、予測モデルと、強化学習器と、模倣学習器とを用いたシミュレーションを実行する。シミュレーション装置100は、シミュレーションにおける強化学習器の学習結果に基づいて、予測モデルの再生成を行うか否かを判定する。シミュレーション装置100は、予測モデルの再生成を行うと判定した場合、生成部に対して、予測モデルの再生成を指示する。これにより、シミュレーション装置100は、高精度なシミュレーション環境を容易に構築することができる。
次に、第1の実施形態に係るシミュレーション装置100の動作について説明する。図5は、第1の実施形態におけるシミュレーション処理の一例を示すフローチャートである。
このように、シミュレーション装置100は、学習用データの入力を受け付ける。また、シミュレーション装置100は、生成部が、受け付けた学習用データを用いて学習し、予測モデルを生成する。また、シミュレーション装置100は、シミュレーションに用いる評価用データと、生成された予測モデルと、シミュレーションにおける強化学習を行う強化学習器と、シミュレーションにおける模倣学習を行う模倣学習器とのうち、いずれか1つまたは複数の配置を受け付ける。また、シミュレーション装置100は、受け付けた配置の状態に基づいて、評価用データと、予測モデルと、強化学習器と、模倣学習器とを用いたシミュレーションを実行する。また、シミュレーション装置100は、シミュレーションにおける強化学習器の学習結果に基づいて、予測モデルの再生成を行うか否かを判定する。また、シミュレーション装置100は、予測モデルの再生成を行うと判定した場合、生成部に対して、予測モデルの再生成を指示する。その結果、シミュレーション装置100は、高精度なシミュレーション環境を容易に構築することができる。また、シミュレーション装置100は、シミュレーション環境の構築から強化学習の実行までを自動化できるので、人手による構築よりも短時間で高精度なシミュレーション環境を構築することができる。なお、構築するシミュレーション環境は、デジタルツイン環境とも呼ばれるものである。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUやGPUおよび当該CPUやGPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
また、上記実施形態において説明したシミュレーション装置が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。例えば、実施形態に係るシミュレーション装置100が実行する処理をコンピュータが実行可能な言語で記述したシミュレーションプログラムを作成することもできる。この場合、コンピュータがシミュレーションプログラムを実行することにより、上記実施形態と同様の効果を得ることができる。さらに、かかるシミュレーションプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたシミュレーションプログラムをコンピュータに読み込ませて実行することにより上記実施形態と同様の処理を実現してもよい。
110 通信部
111 表示部
112 操作部
120 記憶部
121 学習用データ記憶部
122 予測モデル記憶部
123 評価用データ記憶部
124 配置情報記憶部
125 学習済モデル記憶部
130 制御部
131 第1受付部
132 設定部
133 生成部
134 第2受付部
135 実行部
136 判定部
137 出力制御部
Claims (8)
- 学習用データの入力を受け付ける第1受付部と、
受け付けた前記学習用データを用いて学習し、予測モデルを生成する生成部と、
シミュレーションに用いる評価用データと、生成された前記予測モデルと、前記シミュレーションにおける強化学習を行う強化学習器と、前記シミュレーションにおける模倣学習を行う模倣学習器とのうち、いずれか1つまたは複数の配置を受け付ける第2受付部と、
受け付けた前記配置の状態に基づいて、前記評価用データと、前記予測モデルと、前記強化学習器と、前記模倣学習器とを用いた前記シミュレーションを実行する実行部と、
前記シミュレーションにおける前記強化学習器の学習結果に基づいて、前記予測モデルの再生成を行うか否かを判定し、前記予測モデルの再生成を行うと判定した場合、前記生成部に対して、前記予測モデルの再生成を指示する判定部と、
を有することを特徴とするシミュレーション装置。 - 前記判定部は、実環境における前記強化学習器の学習結果に基づく前記予測モデルの予測値と、前記シミュレーションにおける前記強化学習器の学習結果に基づく前記予測モデルの予測値との誤差の評価値に基づいて、前記予測モデルの再生成を行うか否かを判定する、
ことを特徴とする請求項1に記載のシミュレーション装置。 - 前記判定部は、前記シミュレーションにおける前記強化学習器の学習結果に基づく前記予測モデルの予測値と、実測値との相関度合いに基づいて、前記予測モデルの再生成を行うか否かを判定する、
ことを特徴とする請求項1に記載のシミュレーション装置。 - 前記学習用データは、画像データを含み、
前記生成部は、前記予測モデルとして、さらに、前記画像データに基づいて、予測画像データを生成する予測画像モデルを生成し、
前記第2受付部は、前記予測画像モデルの配置を受け付け、
前記実行部は、前記予測画像モデルを含む前記シミュレーションを実行し、
さらに、前記シミュレーションにおける前記強化学習器の学習結果に基づく前記予測モデルの予測値に対応する前記予測画像データを出力する出力制御部を有する、
ことを特徴とする請求項1〜3のいずれか1つに記載のシミュレーション装置。 - 前記学習用データは、音声データを含み、
前記生成部は、前記予測モデルとして、さらに、前記音声データに基づいて、予測音声データを生成する予測音声モデルを生成し、
前記第2受付部は、前記予測音声モデルの配置を受け付け、
前記実行部は、前記予測音声モデルを含む前記シミュレーションを実行し、
さらに、前記シミュレーションにおける前記強化学習器の学習結果に基づく前記予測モデルの予測値に対応する前記予測音声データを出力する出力制御部を有する、
ことを特徴とする請求項1〜4のいずれか1つに記載のシミュレーション装置。 - 前記判定部は、さらに、前記出力制御部が出力した予測画像データまたは予測音声データに対する評価を受け付け、受け付けた評価に基づいて、前記予測モデルの再生成を行うか否かを判定する、
ことを特徴とする請求項4または5に記載のシミュレーション装置。 - 学習用データの入力を受け付ける第1受付工程と、
受け付けた前記学習用データを用いて学習し、予測モデルを生成する生成工程と、
シミュレーションに用いる評価用データと、生成された前記予測モデルと、前記シミュレーションにおける強化学習を行う強化学習器と、前記シミュレーションにおける模倣学習を行う模倣学習器とのうち、いずれか1つまたは複数の配置を受け付ける第2受付工程と、
受け付けた前記配置の状態に基づいて、前記評価用データと、前記予測モデルと、前記強化学習器と、前記模倣学習器とを用いた前記シミュレーションを実行する実行工程と、
前記シミュレーションにおける前記強化学習器の学習結果に基づいて、前記予測モデルの再生成を行うか否かを判定し、前記予測モデルの再生成を行うと判定した場合、前記生成工程に対して、前記予測モデルの再生成を指示する判定工程と、
をシミュレーション装置が実行することを特徴とするシミュレーション方法。 - 学習用データの入力を受け付ける第1受付ステップと、
受け付けた前記学習用データを用いて学習し、予測モデルを生成する生成ステップと、
シミュレーションに用いる評価用データと、生成された前記予測モデルと、前記シミュレーションにおける強化学習を行う強化学習器と、前記シミュレーションにおける模倣学習を行う模倣学習器とのうち、いずれか1つまたは複数の配置を受け付ける第2受付ステップと、
受け付けた前記配置の状態に基づいて、前記評価用データと、前記予測モデルと、前記強化学習器と、前記模倣学習器とを用いた前記シミュレーションを実行する実行ステップと、
前記シミュレーションにおける前記強化学習器の学習結果に基づいて、前記予測モデルの再生成を行うか否かを判定し、前記予測モデルの再生成を行うと判定した場合、前記生成ステップに対して、前記予測モデルの再生成を指示する判定ステップと、
をコンピュータに実行させることを特徴とするシミュレーションプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019021965A JP6850313B2 (ja) | 2019-02-08 | 2019-02-08 | シミュレーション装置、シミュレーション方法およびシミュレーションプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019021965A JP6850313B2 (ja) | 2019-02-08 | 2019-02-08 | シミュレーション装置、シミュレーション方法およびシミュレーションプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021035735A Division JP7084520B2 (ja) | 2021-03-05 | 2021-03-05 | シミュレーション装置、シミュレーション方法およびシミュレーションプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020129301A JP2020129301A (ja) | 2020-08-27 |
JP6850313B2 true JP6850313B2 (ja) | 2021-03-31 |
Family
ID=72174580
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019021965A Active JP6850313B2 (ja) | 2019-02-08 | 2019-02-08 | シミュレーション装置、シミュレーション方法およびシミュレーションプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6850313B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7359176B2 (ja) | 2021-03-03 | 2023-10-11 | 横河電機株式会社 | 判定装置、判定方法、および、判定プログラム |
WO2023058132A1 (ja) * | 2021-10-05 | 2023-04-13 | 日本電信電話株式会社 | シミュレーションレイヤ選択装置、シミュレーションレイヤ選択方法およびシミュレーションレイヤ選択プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3210473B2 (ja) * | 1993-03-11 | 2001-09-17 | 株式会社東芝 | ビジュアルフィードバック制御装置 |
JP4432042B2 (ja) * | 2004-05-28 | 2010-03-17 | 株式会社国際電気通信基礎技術研究所 | シミュレーションプログラム、シミュレーション方法及びシミュレーション装置 |
JP4585983B2 (ja) * | 2006-03-27 | 2010-11-24 | 株式会社日立製作所 | プラント制御方法及びプラント制御装置 |
DE102007001024B4 (de) * | 2007-01-02 | 2008-10-02 | Siemens Ag | Verfahren zur rechnergestützten Regelung und/oder Steuerung eines technischen Systems insbesondere einer Gasturbine |
-
2019
- 2019-02-08 JP JP2019021965A patent/JP6850313B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020129301A (ja) | 2020-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Muratore et al. | Assessing transferability from simulation to reality for reinforcement learning | |
JP6521578B2 (ja) | プロセス制御システムにおける非侵入的データ分析 | |
CN113039495A (zh) | 工业厂房控制器 | |
JP6850313B2 (ja) | シミュレーション装置、シミュレーション方法およびシミュレーションプログラム | |
CN107636704A (zh) | 从产品生命周期到设计和制造的数据反馈环路 | |
US20210158162A1 (en) | Training reinforcement learning agents to learn farsighted behaviors by predicting in latent space | |
US11762679B2 (en) | Information processing device, information processing method, and non-transitory computer-readable storage medium | |
EP3704550B1 (en) | Generation of a control system for a target system | |
CN110516389B (zh) | 行为控制策略的学习方法、装置、设备及存储介质 | |
WO2021084587A1 (ja) | 機械学習データ生成装置、機械学習装置、作業システム、コンピュータプログラム、機械学習データ生成方法及び作業機械の製造方法 | |
CN108604317A (zh) | 可扩展性持有装置 | |
JP2019206041A5 (ja) | 情報処理装置、ロボット制御装置、情報処理方法及びプログラム | |
JP2022505008A (ja) | 機械の残存耐用寿命を予測するための装置および方法 | |
JP2004178492A (ja) | 強化学習法を用いたプラントシミュレーション方法 | |
JP7084520B2 (ja) | シミュレーション装置、シミュレーション方法およびシミュレーションプログラム | |
CN113614743A (zh) | 用于操控机器人的方法和设备 | |
JP6333160B2 (ja) | プロジェクト評価装置及びプロジェクト評価方法及びプロジェクト評価プログラム | |
CN115135463A (zh) | 工业系统的预测模型学习方法、装置和系统 | |
US20200379452A1 (en) | Plant operating condition setting support system, learning device, and operating condition setting support device | |
TW202006652A (zh) | 具輔助判斷功能之產品測試系統及應用於其上的產品測試輔助方法 | |
JP5125754B2 (ja) | Pidコントローラのチューニング装置、pidコントローラのチューニング用プログラムおよびpidコントローラのチューニング方法 | |
WO2021110388A1 (en) | System, device and method for model based analytics | |
JP2010049392A (ja) | Pidコントローラのチューニング装置、pidコントローラのチューニング用プログラムおよびpidコントローラのチューニング方法 | |
JP2020140641A5 (ja) | 情報処理装置、方法、制御装置及び装置 | |
JPWO2016203757A1 (ja) | 制御装置、それを使用する情報処理装置、制御方法、並びにコンピュータ・プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210120 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210209 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210305 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6850313 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |