JP2010515182A - コンピュータ支援によって技術システムを制御および/または調整する方法 - Google Patents
コンピュータ支援によって技術システムを制御および/または調整する方法 Download PDFInfo
- Publication number
- JP2010515182A JP2010515182A JP2009544387A JP2009544387A JP2010515182A JP 2010515182 A JP2010515182 A JP 2010515182A JP 2009544387 A JP2009544387 A JP 2009544387A JP 2009544387 A JP2009544387 A JP 2009544387A JP 2010515182 A JP2010515182 A JP 2010515182A
- Authority
- JP
- Japan
- Prior art keywords
- technical system
- neural network
- state
- recurrent neural
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 91
- 238000013528 artificial neural network Methods 0.000 claims abstract description 95
- 230000000306 recurrent effect Effects 0.000 claims abstract description 68
- 230000009471 action Effects 0.000 claims description 77
- 230000006870 function Effects 0.000 claims description 48
- 238000012549 training Methods 0.000 claims description 29
- 239000011159 matrix material Substances 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 10
- 230000002123 temporal effect Effects 0.000 claims description 10
- 238000011156 evaluation Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 3
- 238000005312 nonlinear dynamic Methods 0.000 claims description 2
- 230000009022 nonlinear effect Effects 0.000 claims description 2
- 230000000875 corresponding effect Effects 0.000 description 13
- 230000002787 reinforcement Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000003767 neural control Effects 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000002485 combustion reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
- G05B13/027—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/33—Director till display
- G05B2219/33011—Link between hidden and input layer is sigmoid, and between output is linear
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/33—Director till display
- G05B2219/33021—Connect plural macrocircuits, neural network modules in a larger network
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/33—Director till display
- G05B2219/33025—Recurrent artificial neural network
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/33—Director till display
- G05B2219/33036—Error back propagation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Automation & Control Theory (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Feedback Control In General (AREA)
- Mobile Radio Communication Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
t∈{m,...,T-n}、ここでTは、トレーニングデータが存在する時点の個数であり、
xτは時点τにおいてリカレントニューラルネットワークによって決定される技術システムの状態を表し、
xτ dはトレーニングデータによる時点τにおける技術システムの状態を表しており、
aτは時点τにおけるアクションを表しており、
sτおよびpτは、リカレントニューラルネットワークの隠れ層の時点τにおける隠れ状態を表しており、
また、Iは単位行列、A,B,C,Dは求めるべき行列、θは求めるべきバイアスである。
EおよびFは求めようとする行列、またbは求めようとするバイアスである。
sτ=tanh(Ipτ+Daτ+θ)
xτ+1=Csτ
ただし pτ=Asτ-1+Bxτ
である。
rτ=tanh(Epτ+b)
が成り立つ。
[1] D.E. Rumelhart, G.E. Hinton, and R. J. Williams, "Learning internal representations by error propagation" , in Parallel Distributed Processing: Explorations in The Microstructure of Cognition, D.E. Rumelhart and J. L. M. et al., Eds. Cambridge: MIT Press, 1986, vol. 1, pp. 318-362
[2] Leslie Pack Kaelbling; Michael L. Littman; Andrew W. Moore, Reinforcement Learning: A Survey, Journal of Artificial Intelligence Research 4 (1996) pp. 237-285
Claims (16)
- コンピュータ支援によって技術システムを制御および/または調整する方法において、
a)複数の時点に対し、技術システムの動特性についての情報を、それぞれ前記技術システムの状態および前記技術システムにおいて実行されるアクションの状態によって特徴付け、ここで、各時点における各アクションはつぎの時点における前記技術システムの新たな状態をもたらし、
b)前記技術システムの動特性は複数の時点(t)における既知の状態(xt)およびアクション(at)を含んだトレーニングデータを用いてモデル化し、ここで、リカレントニューラルネットワークは前記複数の時点(t)において前記技術システムで実行されるアクション(at)および前記技術システムの状態(xt)を含む少なくとも1つの入力層(I)と、隠れ状態(st,pt)を含む少なくとも1つの隠れリカレント層(H)と、前記複数の時点(t)における技術システムの状態(xt)を含む少なくとも1つの出力層(O)とによって形成されており、
c)前記リカレントニューラルネットワークを、現在および将来の時点(t)について、少なくとも1つの入力層(H)、隠れ状態(rt)を含む少なくとも1つの隠れ層(R)、少なくとも1つの出力層(O’)を含む別のニューラルネットワークと結合させて、アクション選択ルールを学習し、ただし、前記別のニューラルネットワークの各時点(t)の入力層(H)は前記リカレントニューラルネットワークの各時点(t)の隠れ状態(pt)の少なくとも一部を含んでおり、前記別のニューラルネットワークの各時点の出力層(O’)は前記技術システム上で各時点に実行されるアクション(at)を含んでおり、
d)前記技術システムの状態(xt)および割り当てられた行動(at)を前記別のニューラルネットワークと結合した前記リカレントニューラルネットワークにより学習したアクション選択ルールを用いて決定する、
ことを特徴とするコンピュータ支援によって技術システムを制御および/または調整する方法。 - 前記アクション選択ルールは、前記技術システムの状態(xt)および/または前記技術システム上で実行されるアクション(at)に関する1つまたは複数の基準を考慮した、および/または前記ステップb)で学習された評価関数に従って学習される、請求項1記載の方法。
- 前記評価関数は前記技術システムの最適な動特性をパラメータ化するように選ばれている、請求項2記載の方法。
- 前記評価関数は最適化されるべきコスト関数によって表される、請求項3記載の方法。
- 前記技術システムの状態(xt)は1つまたは複数の環境変数を含む、および/または前記技術システム上で実行されるべきアクション(at)は1つまたは複数のアクション変数を含む、および/または前記リカレントニューラルネットワークおよび/または前記別のニューラルネットワークの隠れ状態(st,pt,rt)は1つまたは複数の隠れ変数を含む、請求項1から4のいずれか1項記載の方法。
- 前記リカレントニューラルネットワークおよび/または前記別のニューラルネットワークの隠れ状態(st,pt,rt)の隠れ変数の数は前記技術システムの状態(xt)の環境変数の数よりも少ない、請求項5記載の方法。
- 前記技術システムの動特性を前記リカレントニューラルネットワークを用いてモデル化するために、前記リカレントニューラルネットワークにより求められた状態(xt)と前記トレーニングデータの状態(xt)との誤差を最小化する、請求項1から6のいずれか1項記載の方法。
- 請求項1のステップb)において、前記技術システムの非線形の動特性をモデル化する、および/または請求項1のステップc)において、非線形のアクション選択ルールを学習する、請求項1から7のいずれか1項記載の方法。
- 前記ステップb)において前記技術システムの動特性を前記リカレントニューラルネットワークを用いてモデル化するために、および/または前記ステップc)においてアクション選択ルールを学習するために、バックプロパゲーション法を使用する、請求項1から8のいずれか1項記載の方法。
- 前記リカレントニューラルネットワークは未来の状態(xt)およびアクション(at)の考慮の下に動学的一致のある時間的なアンフォールディングを有するネットワークである、請求項1から9のいずれか1項記載の方法。
- 前記リカレントニューラルネットワークによる前記技術システムの動特性のモデル化は以下の式により表される、
t∈{m,...,T-n}、ここでTはトレーニングデータが存在する時点の個数であり、
xτは時点τにおいてリカレントニューラルネットワークによって決定される技術システムの状態を表し、
xτ dはトレーニングデータによる時点τにおける技術システムの状態を表しており、
aτは時点τにおけるアクションを表しており、
sτおよびpτは、リカレントニューラルネットワークの隠れ層の時点τにおける隠れ状態を表しており、
Iは単位行列、A,B,C,Dは求めるべき行列、θは求めるべきバイアスである、
請求項1から10のいずれか1項記載の方法。 - 前記技術システムはタービン、とりわけガスタービンである、請求項1から12のいずれか1項記載の方法。
- 制御方法の始めに、まず請求項1のステップa)〜d)を実行され、引き続き、ここから得られかつ前記別のニューラルネットワークに結合されたリカレントニューラルネットワークと学習したアクション選択ルールとがアクションの決定に使用される、請求項1から13のいずれか1項記載の方法。
- 制御方法のあいだ、規則的な間隔で請求項1のステップa)〜d)を実行する、ただし、これらステップを実行する際、制御中に新たに生じた状態(xt)およびアクション(at)は新しいおよび/または別のトレーニングデータとして考慮され、これらステップを実行した後、ここから得られかつ前記別のニューラルネットワークに結合されたリカレントニューラルネットワークと、学習したアクション選択ルールとが別のアクション(at)の選択に使用される、請求項1から13のいずれか1項記載の方法。
- 計算機上で実行したときに請求項1から15のいずれか1項記載の方法を実行するプログラムコードを機械可読媒体上に記憶させたコンピュータプログラム製品。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102007001025.9 | 2007-01-02 | ||
DE102007001025A DE102007001025B4 (de) | 2007-01-02 | 2007-01-02 | Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems |
PCT/EP2007/064265 WO2008080864A1 (de) | 2007-01-02 | 2007-12-19 | Verfahren zur rechnergestützten steuerung und/oder regelung eines technischen systems |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010515182A true JP2010515182A (ja) | 2010-05-06 |
JP5300739B2 JP5300739B2 (ja) | 2013-09-25 |
Family
ID=39166895
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009544387A Expired - Fee Related JP5300739B2 (ja) | 2007-01-02 | 2007-12-19 | コンピュータ支援によって技術システムを制御および/または調整する方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8554707B2 (ja) |
EP (1) | EP2106576B1 (ja) |
JP (1) | JP5300739B2 (ja) |
AT (1) | ATE552536T1 (ja) |
DE (1) | DE102007001025B4 (ja) |
WO (1) | WO2008080864A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017211913A (ja) * | 2016-05-27 | 2017-11-30 | 日本電信電話株式会社 | 行動決定装置、未来予測モデル学習装置、ネットワーク学習装置、方法、及びプログラム |
JP2018533789A (ja) * | 2015-11-06 | 2018-11-15 | エフアンドピー ロボテックス アクチェンゲゼルシャフト | 意思決定を自動的に行う方法 |
JP2021501433A (ja) * | 2017-11-01 | 2021-01-14 | キュリオス アーイー オーイー | ターゲットシステム用制御システムの生成 |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102008007700A1 (de) | 2007-10-31 | 2009-05-07 | Siemens Aktiengesellschaft | Verfahren zur rechnergestützten Exploration von Zuständen eines technischen Systems |
DE102008020379A1 (de) | 2008-04-23 | 2009-10-29 | Siemens Aktiengesellschaft | Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems |
EP2296062B1 (de) | 2009-09-09 | 2021-06-23 | Siemens Aktiengesellschaft | Verfahren zum rechnergestützten Lernen einer Steuerung und/oder Regelung eines technischen Systems |
US9323639B2 (en) | 2009-09-10 | 2016-04-26 | International Business Machines Corporation | Dynamic recommendation framework for information technology management |
DE102010011221B4 (de) * | 2010-03-12 | 2013-11-14 | Siemens Aktiengesellschaft | Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems |
US9043254B2 (en) | 2010-04-12 | 2015-05-26 | Siemens Aktiengesellschaft | Method for computer-aided closed-loop and/or open-loop control of a technical system |
US8775341B1 (en) | 2010-10-26 | 2014-07-08 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
US9015093B1 (en) | 2010-10-26 | 2015-04-21 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
US9489619B2 (en) * | 2010-12-10 | 2016-11-08 | Siemens Aktiengesellschaft | Method for the computer-assisted modeling of a technical system |
CN103597413B (zh) * | 2011-06-03 | 2017-01-18 | 西门子公司 | 用于在计算机支持下生成技术系统尤其燃气轮机或风力轮机的数据驱动的模型的方法 |
DE102012206651A1 (de) | 2012-04-23 | 2013-10-24 | Siemens Aktiengesellschaft | Verfahren zur Regelung einer Turbine |
DE102012216574A1 (de) | 2012-09-17 | 2014-03-20 | Siemens Aktiengesellschaft | Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems |
DE102013205356B4 (de) * | 2013-03-26 | 2016-07-07 | Siemens Aktiengesellschaft | Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems |
EP3022611B1 (de) | 2013-09-25 | 2019-07-10 | Siemens Aktiengesellschaft | Verfahren zur rechnergestützten steuerung und/oder regelung eines technischen systems |
US9679258B2 (en) | 2013-10-08 | 2017-06-13 | Google Inc. | Methods and apparatus for reinforcement learning |
US10685288B2 (en) | 2014-08-20 | 2020-06-16 | Cassantec Ag | Configuration of malfunction prediction for components and units of technical entities |
EP3183698A1 (en) | 2014-08-20 | 2017-06-28 | Cassantec AG | Malfunction prediction for components and units of technical entities |
US10387775B2 (en) * | 2015-09-09 | 2019-08-20 | Emerson Process Management Power & Water Solutions, Inc. | Model-based characterization of pressure/load relationship for power plant load control |
DE102015226656B4 (de) | 2015-12-23 | 2019-10-10 | Siemens Aktiengesellschaft | Verfahren und Softsensor zum Ermitteln einer Leistung eines Energieerzeugers |
US11670420B2 (en) | 2017-04-12 | 2023-06-06 | Koninklijke Philips N.V. | Drawing conclusions from free form texts with deep reinforcement learning |
US10853724B2 (en) | 2017-06-02 | 2020-12-01 | Xerox Corporation | Symbolic priors for recurrent neural network based semantic parsing |
JP7402165B2 (ja) | 2018-02-19 | 2023-12-20 | ブラウン ゲーエムベーハー | 可動式処置デバイスの位置特定を実施するための装置及び方法 |
US11775982B2 (en) * | 2018-02-26 | 2023-10-03 | Accenture Global Solutions Limited | Augmented intelligence assistant for agents |
DE102018108106B4 (de) | 2018-04-05 | 2020-01-23 | Nolden Regelsysteme GmbH | Verfahren zum Regeln einer Temperatur einer Spritzgießmaschine und Regelsystem |
EP3588211A1 (de) * | 2018-06-27 | 2020-01-01 | Siemens Aktiengesellschaft | Steuereinrichtung zum steuern eines technischen systems und verfahren zum konfigurieren der steuereinrichtung |
US20210318661A1 (en) * | 2018-08-14 | 2021-10-14 | Siemens Aktiengesellschaft | Process controller and method and system therefor |
US10789511B2 (en) | 2018-10-12 | 2020-09-29 | Deepmind Technologies Limited | Controlling agents over long time scales using temporal value transport |
CN110017184B (zh) * | 2019-04-01 | 2024-02-27 | 华电电力科学研究院有限公司 | 一种基于强化学习算法的分布式余压发电系统及其控制方法 |
WO2021220241A1 (en) * | 2020-04-30 | 2021-11-04 | Visa International Service Association | System, method, and computer program product for dynamic user interfaces for rnn-based deep reinforcement machine-learning models |
US11883746B2 (en) * | 2021-02-23 | 2024-01-30 | Electronic Arts Inc. | Adversarial reinforcement learning for procedural content generation and improved generalization |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2533942B2 (ja) * | 1989-03-13 | 1996-09-11 | 株式会社日立製作所 | 知識抽出方法およびプロセス運転支援システム |
US5857321A (en) * | 1996-06-11 | 1999-01-12 | General Electric Company | Controller with neural network for estimating gas turbine internal cycle parameters |
DE19742902A1 (de) * | 1997-09-29 | 1999-04-15 | Abb Patent Gmbh | Verfahren zur Planung und Durchführung von Versuchen |
WO2003061318A1 (de) * | 2002-01-16 | 2003-07-24 | Siemens Aktiengesellschaft | Neuronales modellbasiertes verfahren und vorrichtung zur minimierung von störungen bei variierenden uplink/downlink timeslots in benachbarten zellen |
DE102004011426B3 (de) * | 2004-03-09 | 2005-05-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung zum Erkennen einer in einem Sprachsignal enthaltenen Emotion und Verfahren zum Erkennen einer in einem Sprachsignal enthaltenen Emotion |
-
2007
- 2007-01-02 DE DE102007001025A patent/DE102007001025B4/de not_active Expired - Fee Related
- 2007-12-19 EP EP07857886A patent/EP2106576B1/de not_active Not-in-force
- 2007-12-19 WO PCT/EP2007/064265 patent/WO2008080864A1/de active Application Filing
- 2007-12-19 AT AT07857886T patent/ATE552536T1/de active
- 2007-12-19 US US12/522,040 patent/US8554707B2/en not_active Expired - Fee Related
- 2007-12-19 JP JP2009544387A patent/JP5300739B2/ja not_active Expired - Fee Related
Non-Patent Citations (4)
Title |
---|
CSNC200902269566; 横矢 龍之介 外: 'ロボットの身体経験に基づくRNNPBを用いた模倣動作の自律的獲得' 第24回日本ロボット学会学術講演会予稿集[CD-ROM] , 20060914, pp.1-4 * |
JPN6012015410; LONG-JI LIN: Reinforcement Learning for Robots Using Neural Networks , 19930106, pp.1,14-15,28,109-114 * |
JPN6012015412; 横矢 龍之介 外: 'ロボットの身体経験に基づくRNNPBを用いた模倣動作の自律的獲得' 第24回日本ロボット学会学術講演会予稿集[CD-ROM] , 20060914, pp.1-4 * |
JPN6012015414; ニューラルネットワークの設計と応用 第4巻 初版, 19990630, 第42-45頁, 株式会社昭晃堂 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018533789A (ja) * | 2015-11-06 | 2018-11-15 | エフアンドピー ロボテックス アクチェンゲゼルシャフト | 意思決定を自動的に行う方法 |
JP2017211913A (ja) * | 2016-05-27 | 2017-11-30 | 日本電信電話株式会社 | 行動決定装置、未来予測モデル学習装置、ネットワーク学習装置、方法、及びプログラム |
JP2021501433A (ja) * | 2017-11-01 | 2021-01-14 | キュリオス アーイー オーイー | ターゲットシステム用制御システムの生成 |
US11669056B2 (en) | 2017-11-01 | 2023-06-06 | Canary Capital Llc | Generation of a control system for a target system |
Also Published As
Publication number | Publication date |
---|---|
DE102007001025A1 (de) | 2008-07-03 |
US8554707B2 (en) | 2013-10-08 |
JP5300739B2 (ja) | 2013-09-25 |
EP2106576B1 (de) | 2012-04-04 |
WO2008080864A1 (de) | 2008-07-10 |
ATE552536T1 (de) | 2012-04-15 |
DE102007001025B4 (de) | 2008-11-20 |
EP2106576A1 (de) | 2009-10-07 |
US20100094788A1 (en) | 2010-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5300739B2 (ja) | コンピュータ支援によって技術システムを制御および/または調整する方法 | |
US8160978B2 (en) | Method for computer-aided control or regulation of a technical system | |
JP5448841B2 (ja) | 技術システムの、とりわけガスタービンの、計算機支援による閉ループ制御および/または開ループ制御のための方法 | |
Shakya et al. | Reinforcement learning algorithms: A brief survey | |
Cruz et al. | Path planning of multi-agent systems in unknown environment with neural kernel smoothing and reinforcement learning | |
Sanz-García et al. | GA-PARSIMONY: A GA-SVR approach with feature selection and parameter optimization to obtain parsimonious solutions for predicting temperature settings in a continuous annealing furnace | |
Bai et al. | Prediction of SARS epidemic by BP neural networks with online prediction strategy | |
Li et al. | Forecasting tanker freight rate using neural networks | |
CN101452258A (zh) | 一种与模型无关的自适应控制器及其控制方法 | |
Ünal et al. | Trajectory tracking performance comparison between genetic algorithm and ant colony optimization for PID controller tuning on pressure process | |
Subrahmanya et al. | Constructive training of recurrent neural networks using hybrid optimization | |
Bush et al. | Modeling reward functions for incomplete state representations via echo state networks | |
Senn et al. | Reducing the computational effort of optimal process controllers for continuous state spaces by using incremental learning and post-decision state formulations | |
CN113614743A (zh) | 用于操控机器人的方法和设备 | |
Mahmoud et al. | Direct adaptive control for nonlinear systems using a TSK fuzzy echo state network based on fractional-order learning algorithm | |
Köker | Design and performance of an intelligent predictive controller for a six-degree-of-freedom robot using the Elman network | |
Bakker | Reinforcement learning by backpropagation through an LSTM model/critic | |
Schaefer et al. | A recurrent control neural network for data efficient reinforcement learning | |
Liang et al. | Nonlinear MPC based on elastic autoregressive fuzzy neural network with roasting process application | |
Zhang et al. | A deep reinforcement learning based human behavior prediction approach in smart home environments | |
Anuradha et al. | Direct inverse neural network control of a continuous stirred tank reactor (CSTR) | |
Poczeta et al. | Application of fuzzy cognitive maps with evolutionary learning algorithm to model decision support systems based on real-life and historical data | |
Hoo et al. | Improvements in the predictive capability of neural networks | |
Caamaño et al. | Introducing synaptic delays in the NEAT algorithm to improve modelling in cognitive robotics | |
Suykens et al. | Neural control theory: an overview |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20101228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120328 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120625 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120702 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120726 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120802 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120827 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120903 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120926 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20121116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130318 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20130325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130520 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130618 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |