JP7191965B2 - 方法、プログラム、機械可読記憶媒体、学習システム、及び、アクチュエータ調整システム - Google Patents
方法、プログラム、機械可読記憶媒体、学習システム、及び、アクチュエータ調整システム Download PDFInfo
- Publication number
- JP7191965B2 JP7191965B2 JP2020542498A JP2020542498A JP7191965B2 JP 7191965 B2 JP7191965 B2 JP 7191965B2 JP 2020542498 A JP2020542498 A JP 2020542498A JP 2020542498 A JP2020542498 A JP 2020542498A JP 7191965 B2 JP7191965 B2 JP 7191965B2
- Authority
- JP
- Japan
- Prior art keywords
- function
- actuator
- variable
- determined
- adjustment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 63
- 238000003860 storage Methods 0.000 title claims description 5
- 230000006870 function Effects 0.000 claims description 130
- 238000012937 correction Methods 0.000 claims description 29
- 230000008569 process Effects 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 7
- 238000004590 computer program Methods 0.000 description 6
- 238000011478 gradient descent method Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000002485 combustion reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001667 episodic effect Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0205—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system
- G05B13/021—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system in which a variable is automatically adjusted to optimise the performance
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/041—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a variable is automatically adjusted to optimise the performance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Pure & Applied Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Automation & Control Theory (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Operations Research (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Algebra (AREA)
- Feedback Control In General (AREA)
Description
調整戦略を特徴付ける変数は、価値関数の関数として決定される。
先行する反復の反復価値関数の代わりに、基本関数の集合が範囲とする線形関数空間へのその射影のみが、ベルマン方程式を解くために使用される。
が値
に初期化される。
xt+1=xt+g(xt,ut). (1)
ここで、
ut=πθ(xt). (1')
K(Z,Z)i,j=k(zi,zj). (3)
によって定義される。
が決定され、これらの反復価値関数のうち最後のものが、エピソードインデックスeに関連付けられた収束した反復価値関数
である。エピソードインデックスeに割り当てられた反復価値関数
を決定する方法の一実施形態が図5に例示される。
との差が、関数Δ1の第1の事前定義可能な制限値未満であるかどうか、すなわち
であるかどうかを検査することにより、エピソードインデックスeに関連付けられた収束した反復価値関数
が収束しているかどうかが検査される。これが該当する場合、続いてステップ1080が行われる。
の収束に至ったと決定された場合、価値関数V*は、エピソードインデックスeに割り当てられた反復価値関数
の価値関数に等しく設定される。これにより方法のこの態様が終了する。
を決定する方法の一実施形態を例示する。明瞭さの理由から、エピソードインデックスeは以下では省略される。上付きのインデックスは、以降、文字tによって表される。方法は、常に先行する価値関数
に基づいて、後続の反復価値関数
を常に計算する。この先行する反復価値関数
は、基本関数
と係数
との線形結合
として与えられる。また、これらの係数
は、簡単に係数ベクトルαtにまとめられる。方法は、インデックスt=0で開始する(1500)。
を近似的に満たし、ここで、例外ケースのみにおいて正確に解くことができるこの式は、実際の価値関数Vt+1が、基本関数Bが範囲とする空間へのその射影に、すなわち反復価値関数
に、置き換えられ、かつ、その結果得られる数値求積を伴う積分方程式が近似的に解かれる場合に、解くことができることが認識された。
が収束している場合、例えば、先行する反復価値関数
との差が、関数Δ2の第2の制限値よりも小さくなる、すなわち
である場合に、満たされ得る。終了基準は、インデックスtが事前定義可能な計画期間Tに達した場合にも満たされるとみなされ得る。
も、値0に初期化される。
が決定される。追加される新しい基本関数
は、好ましくは、平均値s*および共分散行列Σ*のガウス関数として選択される。共分散行列Σ*は、式
を満たすように計算される。
の決定が十分に収束しているかどうかが、例えば、関連付けられた逸脱のノルム(例えばL∞ノルム)が、関数Δ3の第3の事前定義可能な制限値を下回る、すなわち
であるかどうかを検査することにより、検査される。
を使用して計算され、例えば、勾配降下方法を用いて決定され、また、試験点xiと、それぞれに割り当てられた最適な操作変数uiとのペアから、訓練集合M={(x1,u1),(x2,u2),...}が作成される。
によって定義される関連付けられた補正変数uが、勾配降下方法で決定される。
Claims (16)
- アクチュエータの調整変数を事前定義可能な目標変数に調整するために設定されるアクチュエータ調整システムを動作させる方法であって、
前記アクチュエータ調整システムは、調整戦略を特徴付ける変数の関数として補正変数を前記調整変数と前記目標変数の差分に基づいて生成し、この補正変数の関数として前記アクチュエータを制御するように設定され、
前記調整戦略を特徴付ける前記変数は価値関数の関数として決定され、
前記価値関数は、ベルマン方程式を用いて、反復価値関数の連続した反復により、徐々に前記価値関数を近似していくことによって反復的に決定され、
後続の反復の反復価値関数は、先行する反復の反復価値関数から前記ベルマン方程式を用いて決定され、
前記ベルマン方程式を解くために、前記先行する反復の前記反復価値関数の代わりに、基本関数の集合が範囲とする関数空間へのその射影のみが使用され、
前記反復価値関数と、前記集合が範囲とする前記関数空間へのその射影との間の最大剰余がどれほど大きいかに依存して、少なくとも1つのさらなる基本関数を前記集合に追加することにより、基本関数の後続の集合が反復的に決定される、
方法。 - 前記後続の反復の前記反復価値関数の代わりにも、基本関数の第2の集合が範囲とする関数空間へのその射影のみが決定される、
請求項1に記載の方法。 - 基本関数としてガウス関数が使用される、
請求項1又は2に記載の方法。 - 前記ベルマン方程式の積分の値が、数値求積によって決定される、
請求項1から3のいずれかに記載の方法。 - 前記少なくとも1つのさらなる基本関数が、前記剰余が最大になる前記調整変数の最大点に依存して選択される、
請求項1に記載の方法。 - 前記少なくとも1つの追加的な基本関数が、最大点において最大値を取る、
請求項5に記載の方法。 - 前記少なくとも1つの追加的な基本関数が、前記最大点における前記剰余の曲率を特徴付ける変数、詳細には前記最大点における前記剰余のヘッセ行列、に依存して選択される、
請求項5または6に記載の方法。 - 前記少なくとも1つの追加的な基本関数が、前記最大点において、そのヘッセ行列が前記剰余の前記ヘッセ行列と等しくなるように選択される、
請求項7に記載の方法。 - 前記ベルマン方程式が依存する条件付き確率が、前記アクチュエータのモデルを用いて決定される、
請求項1から8のいずれかに記載の方法。 - 前記モデルはガウス過程である、
請求項9に記載の方法。 - 前記調整戦略を特徴付ける前記変数の決定後、前記モデルが前記補正変数の関数として適合され、それが前記アクチュエータの調整時に前記アクチュエータに供給され、前記アクチュエータ調整システムは、前記調整戦略と、その結果得られる前記調整変数とを考慮に入れ、前記モデルの適合後に、前記調整戦略を特徴付ける前記変数が、請求項10または11に記載の方法によって再度決定され、次いで前記条件付き確率が適合済みとなった前記モデルを用いて決定される、
請求項9または10に記載の方法。 - 前記補正変数は、前記調整戦略を特徴付ける前記変数の関数として生成され、前記アクチュエータはこの補正変数の関数として制御される、
請求項1から11までの何れかに記載の方法。 - コンピュータに、請求項1から12のいずれかに記載の方法を実行させるプログラム。
- 請求項13に記載のプログラムを記憶した、機械可読記憶媒体。
- アクチュエータ調整システムの調整戦略を特徴付ける変数を自動的に設定するための学習システムであって、前記アクチュエータ調整システムは、アクチュエータの調整変数を、事前定義可能な目標変数に調整するために設定され、前記学習システムは、請求項1から11のいずれかに記載の方法を実行するように設定される、学習システム。
- 請求項12に記載の方法によりアクチュエータを制御するように設定される、アクチュエータ調整システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102017218811.1A DE102017218811A1 (de) | 2017-10-20 | 2017-10-20 | Verfahren und Vorrichtung zum Betreiben eines Aktorregelungssystems, Computerprogramm und maschinenlesbares Speichermedium |
DE102017218811.1 | 2017-10-20 | ||
PCT/EP2018/071753 WO2019076512A1 (de) | 2017-10-20 | 2018-08-10 | Verfahren und vorrichtung zum betreiben eines aktorregelungssystems, computerprogramm und maschinenlesbares speichermedium |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2020537801A JP2020537801A (ja) | 2020-12-24 |
JP2020537801A5 JP2020537801A5 (ja) | 2021-07-26 |
JP7191965B2 true JP7191965B2 (ja) | 2022-12-19 |
Family
ID=63244585
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020542498A Active JP7191965B2 (ja) | 2017-10-20 | 2018-08-10 | 方法、プログラム、機械可読記憶媒体、学習システム、及び、アクチュエータ調整システム |
Country Status (7)
Country | Link |
---|---|
US (2) | US20210003976A1 (ja) |
EP (1) | EP3698223B1 (ja) |
JP (1) | JP7191965B2 (ja) |
KR (1) | KR102326733B1 (ja) |
CN (1) | CN111406237B (ja) |
DE (1) | DE102017218811A1 (ja) |
WO (1) | WO2019076512A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111505936B (zh) * | 2020-06-09 | 2021-10-01 | 吉林大学 | 一种基于高斯过程pid控制参数的自动安全整定方法 |
US11712804B2 (en) | 2021-03-29 | 2023-08-01 | Samsung Electronics Co., Ltd. | Systems and methods for adaptive robotic motion control |
US11724390B2 (en) | 2021-03-29 | 2023-08-15 | Samsung Electronics Co., Ltd. | Systems and methods for automated preloading of actuators |
US11731279B2 (en) | 2021-04-13 | 2023-08-22 | Samsung Electronics Co., Ltd. | Systems and methods for automated tuning of robotics systems |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110059427A1 (en) | 2009-09-09 | 2011-03-10 | Alexander Hans | Method for the computer-assisted learning of a control and/or a feedback control of a technical system |
JP2015018388A (ja) | 2013-07-10 | 2015-01-29 | 東芝三菱電機産業システム株式会社 | 制御パラメータ調整システム |
JP2017102613A (ja) | 2015-11-30 | 2017-06-08 | ファナック株式会社 | 機械の送り軸の送りの滑らかさを最適化する機械学習装置および方法ならびに該機械学習装置を備えたモータ制御装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5208981A (en) * | 1989-01-19 | 1993-05-11 | Bela Puzsik | Drive shaft support |
DE19527323A1 (de) * | 1995-07-26 | 1997-01-30 | Siemens Ag | Schaltungsanordnung zum Steuern einer Einrichtung in einem Kraftfahrzeug |
DE102007017259B4 (de) * | 2007-04-12 | 2009-04-09 | Siemens Ag | Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems |
DE102008020380B4 (de) * | 2008-04-23 | 2010-04-08 | Siemens Aktiengesellschaft | Verfahren zum rechnergestützten Lernen einer Steuerung und/oder Regelung eines technischen Systems |
JP4924693B2 (ja) * | 2009-11-02 | 2012-04-25 | 株式会社デンソー | エンジン制御装置 |
FI126110B (fi) * | 2011-01-19 | 2016-06-30 | Ouman Oy | Menetelmä, laitteisto ja tietokoneohjelmatuote toimilaitteen ohjaamiseksi lämpötilan säätelyssä |
DE102013212889A1 (de) * | 2013-07-02 | 2015-01-08 | Robert Bosch Gmbh | Verfahren und Vorrichtung zum Erstellen einer Regelungfür eine physikalische Einheit |
GB201319681D0 (en) * | 2013-11-07 | 2013-12-25 | Imp Innovations Ltd | System and method for drug delivery |
AT517251A2 (de) * | 2015-06-10 | 2016-12-15 | Avl List Gmbh | Verfahren zur Erstellung von Kennfeldern |
US10429800B2 (en) * | 2015-06-26 | 2019-10-01 | Honeywell Limited | Layered approach to economic optimization and model-based control of paper machines and other systems |
AT518850B1 (de) * | 2016-07-13 | 2021-11-15 | Avl List Gmbh | Verfahren zur simulationsbasierten Analyse eines Kraftfahrzeugs |
DE102017211209A1 (de) | 2017-06-30 | 2019-01-03 | Robert Bosch Gmbh | Verfahren und Vorrichtung zum Einstellen mindestens eines Parameters eines Aktorregelungssystems, Aktorregelungssystem und Datensatz |
-
2017
- 2017-10-20 DE DE102017218811.1A patent/DE102017218811A1/de active Pending
-
2018
- 2018-08-10 KR KR1020207014310A patent/KR102326733B1/ko active IP Right Grant
- 2018-08-10 CN CN201880067677.3A patent/CN111406237B/zh active Active
- 2018-08-10 EP EP18755774.9A patent/EP3698223B1/de active Active
- 2018-08-10 WO PCT/EP2018/071753 patent/WO2019076512A1/de unknown
- 2018-08-10 US US16/756,953 patent/US20210003976A1/en not_active Abandoned
- 2018-08-10 JP JP2020542498A patent/JP7191965B2/ja active Active
-
2021
- 2021-09-15 US US17/475,911 patent/US20220075332A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110059427A1 (en) | 2009-09-09 | 2011-03-10 | Alexander Hans | Method for the computer-assisted learning of a control and/or a feedback control of a technical system |
JP2011060290A (ja) | 2009-09-09 | 2011-03-24 | Siemens Ag | 技術システムの制御および/または調整をコンピュータ支援により学習する方法 |
JP2015018388A (ja) | 2013-07-10 | 2015-01-29 | 東芝三菱電機産業システム株式会社 | 制御パラメータ調整システム |
JP2017102613A (ja) | 2015-11-30 | 2017-06-08 | ファナック株式会社 | 機械の送り軸の送りの滑らかさを最適化する機械学習装置および方法ならびに該機械学習装置を備えたモータ制御装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2020537801A (ja) | 2020-12-24 |
DE102017218811A1 (de) | 2019-04-25 |
CN111406237B (zh) | 2023-02-17 |
EP3698223B1 (de) | 2022-05-04 |
CN111406237A (zh) | 2020-07-10 |
US20220075332A1 (en) | 2022-03-10 |
KR102326733B1 (ko) | 2021-11-16 |
KR20200081407A (ko) | 2020-07-07 |
US20210003976A1 (en) | 2021-01-07 |
WO2019076512A1 (de) | 2019-04-25 |
EP3698223A1 (de) | 2020-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7191965B2 (ja) | 方法、プログラム、機械可読記憶媒体、学習システム、及び、アクチュエータ調整システム | |
US8447706B2 (en) | Method for computer-aided control and/or regulation using two neural networks wherein the second neural network models a quality function and can be used to control a gas turbine | |
US11366433B2 (en) | Reinforcement learning method and device | |
JP6386698B2 (ja) | 多変数制御装置 | |
US20220236698A1 (en) | Method and device for determining model parameters for a control strategy for a technical system with the aid of a bayesian optimization method | |
JP2010514986A (ja) | 技術システムの、とりわけガスタービンの、計算機支援による閉ループ制御および/または開ループ制御のための方法 | |
JP7379833B2 (ja) | 強化学習方法、強化学習プログラム、および強化学習システム | |
CN113939775B (zh) | 用于确定针对技术系统的调节策略的方法和设备 | |
JP2016100009A5 (ja) | ||
JP4805571B2 (ja) | 目標システムの実行を制御するための方法 | |
JPWO2016047118A1 (ja) | モデル評価装置、モデル評価方法、及び、プログラム記録媒体 | |
CN113728159B (zh) | 发动机控制系统 | |
EP3928167A1 (en) | Apparatus and method for control with data-driven model adaptation | |
CN114193443A (zh) | 用于控制机器人设备的设备和方法 | |
US20200333795A1 (en) | Method and apparatus for controlling movement of real object using intelligent agent trained in virtual environment | |
JP2022529667A (ja) | 内燃エンジンコントローラー | |
CN111971628A (zh) | 求得被测变量的时间曲线的方法、预测系统、致动器控制系统、训练致动器控制系统的方法、训练系统、计算机程序和机器可读的存储介质 | |
CN114518751A (zh) | 基于最小二乘截断时域差分学习的路径规划决策优化方法 | |
JP2020091611A (ja) | 行動決定プログラム、行動決定方法、および行動決定装置 | |
US11628562B2 (en) | Method, device and computer program for producing a strategy for a robot | |
JP4301491B2 (ja) | 電動機制御システムの自律設計方法及び自律設計装置並びに電動機制御システム | |
JP7511775B2 (ja) | 可逆的因果関係に基づいた熱制御のためのシステムおよび方法 | |
Bergmann et al. | Modelling and control of a heavy-duty diesel engine gas path with Gaussian process regression | |
Dutta | Design and certification of industrial predictive controllers | |
JP7572376B2 (ja) | エンジン制御システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20201203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20201203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210527 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210527 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20210527 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210930 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211012 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220112 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220310 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220614 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220912 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221207 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7191965 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |