JP6947029B2 - 制御装置、それを使用する情報処理装置、制御方法、並びにコンピュータ・プログラム - Google Patents
制御装置、それを使用する情報処理装置、制御方法、並びにコンピュータ・プログラム Download PDFInfo
- Publication number
- JP6947029B2 JP6947029B2 JP2017524608A JP2017524608A JP6947029B2 JP 6947029 B2 JP6947029 B2 JP 6947029B2 JP 2017524608 A JP2017524608 A JP 2017524608A JP 2017524608 A JP2017524608 A JP 2017524608A JP 6947029 B2 JP6947029 B2 JP 6947029B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- output
- controlled object
- input
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 43
- 238000000034 method Methods 0.000 title claims description 14
- 238000004590 computer program Methods 0.000 title claims description 10
- 238000004088 simulation Methods 0.000 claims description 69
- 238000003860 storage Methods 0.000 claims description 35
- 238000012545 processing Methods 0.000 claims description 27
- 230000006870 function Effects 0.000 claims description 23
- 230000000694 effects Effects 0.000 claims description 10
- 238000009826 distribution Methods 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 4
- 238000012886 linear function Methods 0.000 claims description 3
- 230000015654 memory Effects 0.000 claims description 3
- 230000006399 behavior Effects 0.000 claims 3
- 238000010586 diagram Methods 0.000 description 18
- 238000004891 communication Methods 0.000 description 8
- 230000007613 environmental effect Effects 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N99/00—Subject matter not provided for in other groups of this subclass
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Description
記憶手段と、アクチュエータの操作の統計量を基に、シミュレーションを行い、その操作に対する出力に関する情報を求めて、求めた情報を前記記憶手段に保存するシミュレーション手段と、
前記情報を基に学習し、その結果として得られる予測モデルを前記記憶手段に保存する学習手段と、
前記予測モデルを参照して制御問題を生成する生成手段と、
を備える。
上記制御装置と、
前記制御問題を処理する処理手段と、
前記処理手段により求められた情報を出力する出力手段と
を備える。
アクチュエータの操作の統計量を基にシミュレーションを行い、その操作に対する出力に関する情報を求めて、求めた情報を記憶手段に保存し、
前記情報を基に学習し、その結果として得られる予測モデルを前記記憶手段に保存し、
前記予測モデルを参照して制御問題を生成する。
図1は、本発明の第1の実施形態に係る制御装置10の構成を示すブロック図である。
次に上述した第1の実施形態に係る制御装置10を基本とする第2の実施形態について説明する。図2は、本発明の第2の実施形態に係る制御装置101の構成を示すブロック図である。ただし、図2に示す構成は、一例であって、本発明は、図2に示す制御装置101に限定されない。
次に上述した第2の実施形態に係る制御装置101を基本とする第3の実施形態について説明する。図8は、本発明の第3の実施形態に係る情報処理装置100の構成を示すブロック図である。ただし、図8に示す構成は、一例であって、本発明は、図8に示す情報処理装置100に限定されない。
次に上述した第3の実施形態に係る情報処理装置100を基本とする第4の実施形態について説明する。
次に上述した第4の実施形態に係る情報処理装置1001を基本とする第5の実施形態について説明する。
次に上述した第5の実施形態に係る情報処理装置1002を基本とする第6の実施形態について説明する。
11 シミュレーション部
12 学習部
13 生成部
14 記憶部
100 情報処理装置
100A、101B、102B コンピュータ
100B コンピュータシステム
101 制御装置
102 処理装置
105 シミュレーションデータベース
110 シミュレーション部
115 学習データベース
120 学習部
125 予測モデルデータベース
130 生成部
140 処理部
150 出力部
160 判定部
210 駆動部
220 測定部
310、310A、310B CPU
320 記憶部
330、330A、330B 通信部
335 通信経路
340、340A、340B 入力操作部
350、350A、350B 表示部
1001、1002、1003 情報処理装置
2001、2002、2003 制御対象
Claims (10)
- 記憶手段と、
制御対象に作用を与えるアクチュエータの操作の統計量を基に、前記操作を入力とした前記制御対象の動作のシミュレーションによる前記制御対象の出力に関する情報を求めて、前記制御対象の入力に関する情報と求めた前記制御対象の出力に関する情報とを前記記憶手段に保存するシミュレーション手段と、
前記情報を基に学習することにより得られる、前記制御対象の入力と出力の予測値との関係性を表す予測モデルを前記記憶手段に保存する学習手段と、
前記予測モデルを参照して制御問題を生成する生成手段と、
を備えた制御装置。 - 前記予測モデルは、ある時刻の制御対象の出力を目的変数とし、前記時刻以前の制御対象の入力を説明変数に含む関数から成る
請求項1記載の制御装置。 - 前記関数は、区分線形関数である
請求項2記載の制御装置。 - 前記アクチュエータの操作の統計量は、前記アクチュエータの操作の最小値、最大値または確率分布のいずれかを含む
請求項1乃至3の何れか一項に記載の制御装置。 - 前記制御問題を処理する処理手段と、
前記処理手段により求められた出力情報を出力する出力手段と
請求項1乃至4の何れか一項に記載の制御装置と
を備えた情報処理装置。 - 前記出力手段が出力した前記出力情報を基に前記アクチュエータの操作を行う装置に接続された請求項5記載の情報処理装置。
- 前記アクチュエータの操作を行った時の情報を測定した測定情報を前記記憶手段に追加し、追加後の前記記憶手段に保存された測定情報を参照して、前記学習手段が再学習することにより前記予測モデルを作成する請求項6記載の情報処理装置。
- 前記処理手段が処理した結果と、前記測定情報とを比較し、再学習の要否を判定する判定手段をさらに備え、
前記判定手段により再学習が必要と判定された場合に、前記学習手段が再学習することにより前記予測モデルを作成する請求項7記載の情報処理装置。 - 制御対象に作用を与えるアクチュエータの操作の統計量を基に、前記操作を入力とした前記制御対象の動作のシミュレーションによる前記制御対象の出力に関する情報を求めて、前記制御対象の入力に関する情報と求めた前記制御対象の出力に関する情報とを記憶手段に保存し、
前記情報を基に学習することにより得られる、前記制御対象の入力と出力の予測値との関係性を表す予測モデルを前記記憶手段に保存し、
前記予測モデルを参照して制御問題を生成する
制御方法。 - 記憶手段を備えるコンピュータに、
制御対象に作用を与えるアクチュエータの操作の統計量を基に、前記操作を入力とした前記制御対象の動作のシミュレーションによる前記制御対象の出力に関する情報を求めて、前記制御対象の入力に関する情報と求めた前記制御対象の出力に関する情報とを前記記憶手段に保存するシミュレーション機能と、
前記情報を基に学習することにより得られる、前記制御対象の入力と出力の予測値との関係性を表す予測モデルを前記記憶手段に保存する学習機能と、
前記予測モデルを参照して制御問題を生成する生成機能と
を実行させる
コンピュータ・プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015122486 | 2015-06-18 | ||
JP2015122486 | 2015-06-18 | ||
PCT/JP2016/002843 WO2016203757A1 (ja) | 2015-06-18 | 2016-06-13 | 制御装置、それを使用する情報処理装置、制御方法、並びにコンピュータ・プログラムが格納されているコンピュータ読み取り可能な記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2016203757A1 JPWO2016203757A1 (ja) | 2018-05-24 |
JP6947029B2 true JP6947029B2 (ja) | 2021-10-13 |
Family
ID=57545826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017524608A Active JP6947029B2 (ja) | 2015-06-18 | 2016-06-13 | 制御装置、それを使用する情報処理装置、制御方法、並びにコンピュータ・プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6947029B2 (ja) |
WO (1) | WO2016203757A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018143019A1 (ja) * | 2017-01-31 | 2018-08-09 | 日本電気株式会社 | 情報処理装置、情報処理方法およびプログラム記録媒体 |
WO2020121551A1 (ja) * | 2018-12-12 | 2020-06-18 | 日本電信電話株式会社 | マルチデバイス連携制御装置、マルチデバイス連携制御方法およびマルチデバイス連携制御プログラム、並びに、学習装置、学習方法および学習プログラム |
JP7358251B2 (ja) * | 2020-01-17 | 2023-10-10 | 株式会社荏原製作所 | めっき支援システム、めっき支援装置、めっき支援プログラムおよびめっき実施条件決定方法 |
EP3916496A1 (en) * | 2020-05-29 | 2021-12-01 | ABB Schweiz AG | An industrial process model generation system |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4536666B2 (ja) * | 2006-02-13 | 2010-09-01 | 出光興産株式会社 | Pid制御器の最適調整システム及び最適調整方法 |
JP4573783B2 (ja) * | 2006-03-08 | 2010-11-04 | 株式会社日立製作所 | プラントの制御装置と制御方法及び火力発電プラントとその制御方法 |
JP5077831B2 (ja) * | 2008-09-25 | 2012-11-21 | 横河電機株式会社 | プラント制御システムおよびプラント制御方法 |
JP2010191535A (ja) * | 2009-02-16 | 2010-09-02 | Mazda Motor Corp | 車両用サスペンションの設計支援装置、車両用サスペンションの設計支援方法、及び車両用サスペンションの設計支援プログラム |
JP2013109711A (ja) * | 2011-11-24 | 2013-06-06 | Yokogawa Electric Corp | プラントモデル生成装置およびプラント運転支援システム |
JP5768834B2 (ja) * | 2013-04-12 | 2015-08-26 | 横河電機株式会社 | プラントモデル管理装置及び方法 |
-
2016
- 2016-06-13 WO PCT/JP2016/002843 patent/WO2016203757A1/ja active Application Filing
- 2016-06-13 JP JP2017524608A patent/JP6947029B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JPWO2016203757A1 (ja) | 2018-05-24 |
WO2016203757A1 (ja) | 2016-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Böhmer et al. | Autonomous learning of state representations for control: An emerging field aims to autonomously learn state representations for reinforcement learning agents from their real-world sensor observations | |
Reynoso-Meza et al. | Controller tuning using evolutionary multi-objective optimisation: current trends and applications | |
JP6947029B2 (ja) | 制御装置、それを使用する情報処理装置、制御方法、並びにコンピュータ・プログラム | |
US20170372224A1 (en) | Deep learning for imputation of industrial multivariate time-series | |
CN111144580B (zh) | 一种基于模仿学习的层级强化学习训练方法和装置 | |
JP2005523534A (ja) | 自動的ニューラルネットモデル発生及びメインテナンス | |
Nowé et al. | A gentle introduction to reinforcement learning | |
JP2018528511A (ja) | 生産システムにおける出力効率の最適化 | |
CN115135463A (zh) | 工业系统的预测模型学习方法、装置和系统 | |
Hafez et al. | Topological Q-learning with internally guided exploration for mobile robot navigation | |
O’Dowd et al. | The distributed co-evolution of an on-board simulator and controller for swarm robot behaviours | |
CN114529010A (zh) | 一种机器人自主学习方法、装置、设备及存储介质 | |
Dilokthanakul et al. | Deep reinforcement learning with risk-seeking exploration | |
Theodoropoulos et al. | Cyber-physical systems in non-rigid assemblies: A methodology for the calibration of deformable object reconstruction models | |
JP7060130B1 (ja) | 運用支援装置、運用支援方法及びプログラム | |
Contardo et al. | Learning states representations in pomdp | |
Owda et al. | Using artificial neural network techniques for prediction of electric energy consumption | |
Madureira | Ensemble reinforcement learning to forecast time series data: a performance analysis | |
Devidze et al. | Informativeness of Reward Functions in Reinforcement Learning | |
Przybył et al. | The method of the evolutionary designing the elastic controller structure | |
Zeng et al. | Learning evolving Mamdani fuzzy systems based on parameter optimization | |
Chen et al. | Building a Belief–Desire–Intention agent for modeling neural networks | |
CN115293334B (zh) | 基于模型的高样本率深度强化学习的无人设备控制方法 | |
White | Guided policy search for a lightweight industrial robot arm | |
JP2019219756A (ja) | 制御装置、制御方法、プログラム、ならびに、情報記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171204 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200519 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200717 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210219 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210817 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210830 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6947029 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |