DE102011075337A1 - Method for controlling system, involves carrying out action to control system by obtaining control information from data of system, where another action or operation is determined according to data to control system - Google Patents
Method for controlling system, involves carrying out action to control system by obtaining control information from data of system, where another action or operation is determined according to data to control system Download PDFInfo
- Publication number
- DE102011075337A1 DE102011075337A1 DE102011075337A DE102011075337A DE102011075337A1 DE 102011075337 A1 DE102011075337 A1 DE 102011075337A1 DE 102011075337 A DE102011075337 A DE 102011075337A DE 102011075337 A DE102011075337 A DE 102011075337A DE 102011075337 A1 DE102011075337 A1 DE 102011075337A1
- Authority
- DE
- Germany
- Prior art keywords
- action
- data
- plant
- determined
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
- 230000009471 action Effects 0.000 title claims abstract description 85
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000004519 manufacturing process Methods 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims abstract description 5
- 238000013528 artificial neural network Methods 0.000 claims description 25
- 238000011217 control strategy Methods 0.000 claims description 16
- 238000009434 installation Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 7
- 238000009826 distribution Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 claims description 2
- 230000001537 neural effect Effects 0.000 description 19
- 230000002787 reinforcement Effects 0.000 description 14
- 238000013459 approach Methods 0.000 description 11
- 238000011161 development Methods 0.000 description 9
- 230000018109 developmental process Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 230000000306 recurrent effect Effects 0.000 description 7
- 238000000605 extraction Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 239000000428 dust Substances 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- BUHVIAUBTBOHAG-FOYDDCNASA-N (2r,3r,4s,5r)-2-[6-[[2-(3,5-dimethoxyphenyl)-2-(2-methylphenyl)ethyl]amino]purin-9-yl]-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound COC1=CC(OC)=CC(C(CNC=2C=3N=CN(C=3N=CN=2)[C@H]2[C@@H]([C@H](O)[C@@H](CO)O2)O)C=2C(=CC=CC=2)C)=C1 BUHVIAUBTBOHAG-FOYDDCNASA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000009022 nonlinear effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000008080 stochastic effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B17/00—Systems involving the use of models or simulators of said systems
- G05B17/02—Systems involving the use of models or simulators of said systems electric
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F03—MACHINES OR ENGINES FOR LIQUIDS; WIND, SPRING, OR WEIGHT MOTORS; PRODUCING MECHANICAL POWER OR A REACTIVE PROPULSIVE THRUST, NOT OTHERWISE PROVIDED FOR
- F03D—WIND MOTORS
- F03D7/00—Controlling wind motors
- F03D7/02—Controlling wind motors the wind motors having rotation axis substantially parallel to the air flow entering the rotor
- F03D7/04—Automatic control; Regulation
- F03D7/042—Automatic control; Regulation by means of an electrical or electronic controller
- F03D7/043—Automatic control; Regulation by means of an electrical or electronic controller characterised by the type of control logic
- F03D7/046—Automatic control; Regulation by means of an electrical or electronic controller characterised by the type of control logic with learning or adaptive control, e.g. self-tuning, fuzzy logic or neural network
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Sustainable Development (AREA)
- Sustainable Energy (AREA)
- Chemical & Material Sciences (AREA)
- Combustion & Propulsion (AREA)
- Mechanical Engineering (AREA)
- General Engineering & Computer Science (AREA)
- Feedback Control In General (AREA)
- Wind Motors (AREA)
Abstract
Description
Die Erfindung betrifft ein Verfahren und eine Vorrichtung zur Ansteuerung einer Anlage. The invention relates to a method and a device for controlling a system.
Es gibt verstärkt Bemühungen, Windturbinen für die Erzeugung erneuerbarer Energien in unterschiedlichen Umgebungen, z.B. an der Küste oder vor der Küste zu errichten. Abhängig von geografischen Bedingungen zeigt der Wind unterschiedliche Charakteristiken, die den Betrieb und auch die Effizienz der Windturbine deutlich beeinflussen. Während die Windturbine die von ihr bereitgestellte Leistung bei hohen Windgeschwindigkeiten begrenzt, wird sie jedoch die meiste Zeit von niedrigeren Windgeschwindigkeiten angetrieben, d.h. die bereitgestellte Leistung liegt zumeist deutlich unter dem maximal möglichen Limit der Windturbine. There are increasing efforts to develop wind turbines for the production of renewable energy in different environments, e.g. to build on the coast or off the coast. Depending on geographical conditions, the wind has different characteristics that significantly affect the operation and efficiency of the wind turbine. However, while the wind turbine limits the power it provides at high wind speeds, it is driven by lower wind speeds most of the time, i. The power provided is usually well below the maximum possible limit of the wind turbine.
Um die von der Windturbine bereitgestellte Leistung zu optimieren, können deren Betriebsparameter angepasst werden. Hierbei ist es jedoch von Nachteil, dass z.B. lokale Bedingungen, z.B. Turbulenzen, Scherwinde, Temperaturschwankungen, Feuchtigkeit, Staub, Eis, etc. nicht geeignet berücksichtigt werden. Dieser Effekt verstärkt sich bei der Verwendung mehrerer Windturbinen in Form sog. Windparks, da die Windturbinen selbst die Windgeschwindigkeiten beeinflussen. In order to optimize the power provided by the wind turbine, its operating parameters can be adjusted. However, it is disadvantageous that e.g. local conditions, e.g. Turbulence, shear winds, temperature fluctuations, moisture, dust, ice, etc. are not considered suitable. This effect is exacerbated by the use of several wind turbines in the form of so-called wind farms, as the wind turbines themselves influence the wind speeds.
Die Aufgabe der Erfindung besteht darin, die vorstehend genannten Nachteile zu vermeiden und insbesondere eine effiziente Lösung zur Einstellung bzw. zum Betrieb (mindestens) einer Windturbine zu schaffen. The object of the invention is to avoid the above-mentioned disadvantages and in particular to provide an efficient solution for setting or for operation (at least) of a wind turbine.
Diese Aufgabe wird gemäß den Merkmalen der unabhängigen Patentansprüche gelöst. Weiterbildungen der Erfindung ergeben sich auch aus den abhängigen Ansprüchen. This object is achieved according to the features of the independent claims. Further developments of the invention will become apparent from the dependent claims.
Zur Lösung der Aufgabe wird ein Verfahren angegeben zur Ansteuerung einer Anlage,
- – bei dem die Anlage mittels einer ersten Aktion angesteuert wird,
- – bei dem Daten der Anlage ermittelt werden als Folge der Ansteuerung mit der ersten Aktion,
- – bei dem anhand der Daten eine zweite Aktion ermittelt wird und die Anlage mit der zweiten Aktion angesteuert wird,
- – bei dem die erste Aktion und/oder die zweite Aktion bestimmt wird, um Teile eines Zustandsraums der Anlage zu explorieren.
- - in which the system is controlled by a first action,
- - in which data of the plant are determined as a result of the control with the first action,
- In which a second action is determined on the basis of the data and the system is activated with the second action,
- - In which the first action and / or the second action is determined to explore parts of a state space of the plant.
Bei dem Ermitteln der Teile des Zustandsraums kann es sich um eine systematische und/oder um eine unsystematische (z.B. zufällige oder pseudozufällige) Erkundung bzw. Exploration des Zustandsraums (oder eines Teils des Zustandsraums) handeln. Determining the parts of the state space may be a systematic and / or unsystematic (e.g., random or pseudorandom) exploration of the state space (or part of the state space).
Somit ist es möglich, durch gezielte Aktionen die Wissensbasis (Daten) für die Modellierung zu vergrößern und damit zu verbessern. Diese Wissensbasis kann zur Modellierung und zur weiteren Ansteuerung der Anlage verwendet werden. Im Ergebnis kann somit wirksam die Effizienz der Anlage gesteigert werden. Thus, it is possible to increase and thus improve the knowledge base (data) for modeling through targeted actions. This knowledge base can be used for modeling and further controlling the plant. As a result, the efficiency of the plant can be effectively increased.
Die vorliegende Lösung ist besonders von Vorteil, wenn die Anlage und das mit ihr verbundene Modell eine zeitliche Dynamik, stochastische Eigenschaften, nichtlineare Effekte und/ oder eine hohe Dimension aufweist. The present solution is particularly advantageous when the system and the model associated with it have temporal dynamics, stochastic properties, non-linear effects and / or a high dimension.
Eine Weiterbildung ist es, dass die erste Aktion und/oder die zweite Aktion eine Aktion ist, für die noch keine Daten vorliegen oder für die vorliegende Daten veraltet sind. A further development is that the first action and / or the second action is an action for which no data is yet available or for which the present data is obsolete.
Somit kann anhand der Aktionen systematisch, unsystematisch, stochastisch oder mit gemischten Strategien der Zustandsraum exploriert werden, d.h. vorgegebene Betriebsparameter eingestellt und zugehörige Daten bestimmt werden. Thus, using the actions systematically, unsystematically, stochastically, or with mixed strategies, the state space can be explored, i. preset operating parameters are set and associated data are determined.
Eine andere Weiterbildung ist es, dass die erste Aktion und die zweite Aktion eine Einstellung von Betriebsparametern der Anlage umfasst. Another development is that the first action and the second action includes a setting of operating parameters of the plant.
Insbesondere ist es eine Weiterbildung, dass die Anlage mindestens eine der folgenden Komponenten umfasst:
- – ein technisches System,
- – eine Automatisierungsanlage,
- – eine Fertigungsanlage,
- – eine Produktionsanlage,
- – eine Maschine,
- – eine Windturbine,
- – eine Gasturbine,
- – eine Strömungsmaschine,
- – ein Energienetz,
- – ein Stromverteilungsnetz,
- – ein Lastverteilungsnetz,
- – ein Kommunikationsnetz.
- - a technical system,
- An automation system,
- - a manufacturing plant,
- - a production plant,
- - a machine,
- - a wind turbine,
- A gas turbine,
- A turbomachine,
- - a power grid,
- A power distribution network,
- - a load distribution network,
- - a communication network.
Auch ist es eine Weiterbildung, dass die ermittelten Daten Messwerte, Informationen und/oder Beobachtungen der Anlage umfassen. It is also a further development that the determined data comprise measured values, information and / or observations of the plant.
Insbesondere können unterschiedliche Sensoren (z.B. Temperatur, Feuchtigkeit, Luftdruck, Geschwindigkeit, Beschleunigung etc.) vorgesehen sein, Daten von der Anlage zu erhalten. In particular, different sensors (e.g., temperature, humidity, air pressure, speed, acceleration, etc.) may be provided to obtain data from the plant.
Ferner ist es eine Weiterbildung, dass die Daten zusammen mit der zugehörigen ersten Aktion gespeichert werden. Furthermore, it is a development that the data is stored together with the associated first action.
Beispielsweise können die Daten in einer Datenbank gespeichert und z.B. über eine vorgegebene Zeitdauer gesammelt werden. Diese Datenbank kann für einen Lernalgorithmus (s.u.) eine Wissensbasis darstellen. For example, the data may be stored in a database, e.g. collected over a predetermined period of time. This database can be a knowledge base for a learning algorithm (s.u.).
Im Rahmen einer zusätzlichen Weiterbildung werden die Daten zusammen mit der zugehörigen ersten Aktion gespeichert. As part of an additional training, the data is stored together with the associated first action.
Somit kann die Datenbank Datensätze aufweisen, die jeweils eine Aktion zusammen mit den zugehörigen Daten enthält. Thus, the database may have records that each contain an action along with the associated data.
Eine nächste Weiterbildung besteht darin, dass anhand der Daten die zweite Aktion ermittelt wird, indem mittels einer Zustandsschätzung ein Zustand, insbesondere ein Markov-Zustand, bestimmt wird. A further development is that the second action is determined on the basis of the data by determining a state, in particular a Markov state, by means of a state estimation.
Beispielsweise kann der Markov-Zustand mittels eines MPEN-Verfahrens (
Eine Ausgestaltung ist es, dass anhand des Zustands mittels einer Kontroll-Strategie eine optimierte Aktion als die zweite Aktion bestimmt wird. An embodiment is that an optimized action is determined as the second action on the basis of a control strategy.
Die Zustandsschätzung stellt somit einen Zustand bereit, der anhand der Kontroll-Strategie eine Auswahl aus einer Vielzahl möglicher Aktionen erlaubt. Diese Aktion kann dann als zweite Aktion zur Ansteuerung der Anlage eingesetzt werden. The state estimation thus provides a state that allows a selection from a variety of possible actions based on the control strategy. This action can then be used as a second action to control the system.
Eine alternative Ausführungsform besteht darin, dass basierend auf Daten der Anlage mittels eines Lernalgorithmus ein Modell der Anlage bestimmt oder modifiziert wird und basierend auf dem Modell die Zustandsschätzung durchgeführt wird. An alternative embodiment is that, based on data of the plant by means of a learning algorithm, a model of the plant is determined or modified and based on the model, the state estimation is performed.
Das Modell kann einer Abbildung der Anlage entsprechen. Aufgrund der in der Datenbank abgespeicherten Datensätze (s.o.) kann das Modell iterativ verfeinert bzw. geändert werden. Beispielsweise kann hierdurch flexibel auf Änderungen der Anlage reagiert werden oder es können Effizienzsteigerungen, die durch eine Erkundung (z.B. ein schrittweises systematisches oder (pseudo-)zufälliges Explorieren) des Zustandsraums erkennbar wurden, berücksichtigt werden. The model can correspond to a picture of the system. Based on the data records stored in the database (see above), the model can be iteratively refined or changed. For example, this may respond flexibly to changes in the plant, or it may take into account efficiency gains that have become apparent through exploration (e.g., a stepwise systematic or (pseudo) random exploration) of the state space.
Somit kann das Modell als ein Prognosemodell eingesetzt werden zur Bestimmung eines Markov-Zustands. Hierbei kann eine Dynamik der Anlage mitberücksichtigt werden, die Zustandsschätzung nähert sich dem Zustandsraum der Markov-Zustände an. Thus, the model can be used as a predictive model to determine a Markov condition. Here, a dynamics of the system can be taken into account, the state estimation approaches the state space of the Markov states.
Als Lernalgorithmus kann beispielsweise
- – ein NFQ-Verfahren (
"Neural Fitted Q Iteration", siehe: M. Riedmiller: Neural Fitted Q Iteration – First Experiences with a Data Efficient Neural Reinforcement Learning Method. In Proc. of the European Conf. on Machine Learning, 2005 - – ein RCNN (
"Recurrent Control Neural Network", siehe: A.M. Schaefer, S. Udluft, and H.-G. Zimmermann. A Recurrent Control Neural Network for Data Efficient Reinforcement Learning. In Proc. of the IEEE International Symposium on Approximate Dynamic Programming and Reinforcement Learning, 2007 A. M. Schäfer, D. Schneegaß, V. Sterzing, and S. Udluft. A Neural Reinforcement Learning Approach to Gas Turbine Control. International Joint Conference on Neural Networks, 2007 - – ein PGNRR-Verfahren (
"Policy Gradient Neural Rewards Regression", siehe: D. Schneegaß, S. Udluft, and Th. Martinetz. Improving Optimality of Neural Rewards Regression for Data-Efficient Batch Near-Optimal Policy Identification. In Proc. of the International Conf. on Artificial Neural Networks, 2007
- - an NFQ procedure (
"Neural Fitted Q Iteration", see: M. Riedmiller: Neural Fitted Q Iteration - First Experiences with a Data Efficient Neural Reinforcement Learning Method. In Proc. of the European Conf. on Machine Learning, 2005 - An RCNN (
"Recurrent Control Neural Network", see: AM Schaefer, S. Udluft, and H.-G. Zimmermann. A Recurrent Neural Network for Data Efficient Reinforcement Learning. In Proc. of the IEEE International Symposium on Approximate Dynamic Programming and Reinforcement Learning, 2007 AM Schäfer, D. Schneegass, V. Sterzing, and S. Udluft. A Neural Reinforcement Learning Approach to Gas Turbine Control. International Joint Conference on Neural Networks, 2007 - - a PGNRR procedure (
"Policy Gradient Neural Rewards Regression", see: D. Schneegass, S. Udluft, and Th. Martinetz. Improving Optimality of Neural Rewards Regression for Data-Efficient Batch Near-Optimal Policy Identification. In Proc. of the International Conf. on Artificial Neural Networks, 2007
Eine nächste Ausgestaltung ist es, dass das Modell der Anlage mittels eines neuronalen Netzes, einer Baumstruktur und/oder Gauß-Prozessen bestimmt wird. A next embodiment is that the model of the plant is determined by means of a neural network, a tree structure and / or Gaussian processes.
Auch ist es eine Ausgestaltung, dass basierend auf Daten der Anlage mittels des Lernalgorithmus und mittels des Modells der Anlage die Kontroll-Strategie zur Auswahl der zweiten Aktion basierend auf dem Zustand eingestellt oder modifiziert wird. It is also an embodiment that based on data of the system by means of the learning algorithm and by means of the model of the system, the control strategy for selecting the second action based on the state is set or modified.
Ein solcher Generator kann als ein Generator für die Zustandsschätzung verstanden werden. Auch kann der Generator zur Erzeugung bzw. Modifikation einer Strategie zum bestärkenden Lernen ("Reinforcement Learning") dienen. Such a generator can be understood as a generator for state estimation. Also, the generator may serve to create or modify a reinforcement learning strategy.
Hierbei ist es von Vorteil, dass der vorgeschlagene Ansatz auf kontinuierliche Zustandsräume anwendbar ist. Beispielsweise kann ein Markov-Zustand auf mindestens eine Aktion abgebildet werden mittels der Kontroll-Strategie, wobei die Kontroll-Strategie selbst ein Resultat des Lernalgorithmus ist. In this case, it is advantageous that the proposed approach is applicable to continuous state spaces. For example, a Markov state may be mapped to at least one action by means of the control strategy, the control strategy itself being a result of the learning algorithm.
Eine Weiterbildung besteht darin, dass die Anlage in einem ersten Betriebsmodus und in einem zweiten Betriebsmodus ansteuerbar ist, wobei der erste Betriebsmodus einen normalen Betrieb der Anlage kennzeichnet und der zweite Betriebsmodus einen Betrieb der Anlage zur Generierung der Daten bezeichnet. A development consists in that the system can be controlled in a first operating mode and in a second operating mode, the first operating mode characterizing normal operation of the system and the second operating mode designating operation of the system for generating the data.
Insbesondere kann eine Umschaltung zwischen den Betriebsmodi erfolgen. Die beiden Betriebsmodi können abwechselnd, zufällig oder regelmäßig aktiviert werden. Auch kann basierend auf einem vorgegebenen Schema eine Aktivierung der Betriebsmodi erfolgen. Alternativ kann eine dynamische Aktivierung der Betriebsmodi erfolgen, z.B. verursacht durch eine Verbesserung der Effizienz der Anlage in dem ersten Betriebsmodus. So ist es weiterhin beispielhaft möglich, dass der zweite Betriebsmodus eher selten aktiviert wird, sofern die Anlage bereits ausreichend effizient läuft bzw. durch zusätzliche Messungen keine (oder kaum mehr eine) Effizienzsteigerung erreicht werden kann. In particular, a switchover between the operating modes can take place. The two operating modes can be activated alternately, randomly or regularly. Also, based on a predetermined scheme, an activation of the operating modes can take place. Alternatively, dynamic activation of the modes of operation may occur, e.g. caused by an improvement in the efficiency of the plant in the first operating mode. Thus, it is also possible by way of example that the second operating mode is rarely activated, if the system is already running sufficiently efficiently or by additional measurements no (or little more) increase in efficiency can be achieved.
Eine zusätzliche Ausgestaltung ist es, dass in dem zweiten Betriebsmodus die Anlage mit einer ersten oder zweiten Aktion angesteuert wird, die der gezielten Beschaffung von noch nicht vorhandenen Daten oder von aktuellen Daten dient. An additional embodiment is that in the second operating mode, the system is controlled with a first or second action, which serves the targeted procurement of not yet existing data or current data.
So kann in dem zweiten Betriebsmodus gezielt der Zustandsraum der Anlage exploriert werden, d.h. ein Verhalten der Anlage mittels der Daten bestimmt werden in Abhängigkeit von den eingestellten Betriebsparametern der Anlage (also den durchgeführten Aktionen). Die gezielte Beschaffung noch nicht vorhandener Daten betreffend den Zustandsraum der Anlage stellt insbesondere darauf ab, dass neue Aktionen durchgeführt werden und anhand der Daten bestimmt wird, ob dies eine Effizienzsteigerung oder eine Effizienzverschlechterung der Anlage bewirkt. Die schrittweise Erkundung des Zustandsraums der Anlage kann zur Modellierung der Anlage dienen und somit die Zustandsschätzung als auch die Kontroll-Strategie – als Resultat des Lernalgorithmus – verbessern. Thus, in the second operating mode, the state space of the plant can be explored specifically, i. A behavior of the system can be determined by means of the data depending on the set operating parameters of the system (ie the actions performed). Targeted procurement of non-existent data on the state space of the plant is in particular dependent on new actions being taken and on the data being determined as to whether this will increase the efficiency or deteriorate the efficiency of the installation. The step-by-step exploration of the state space of the plant can serve to model the plant and thus improve the state estimation as well as the control strategy as a result of the learning algorithm.
Die Erkundung (auch bezeichnet als Exploration) des Zustandsraums kann auch unter Berücksichtigung der Kontroll-Strategie erfolgen. Hierbei sind unterschiedliche Varianten für die Erkundung des Zustandsraums möglich: Beispielsweise kann eine Datendichte erhöht werden oder es kann eine Nähe (in dem Zustandsraum) zwischen bereits ermittelten Daten (und ggf. deren Effizienz) berücksichtigt werden, um weitere vergleichbare oder vollständig andere Daten in dem Zustandsraum zu ermitteln. The exploration (also called exploration) of the state space can also take place under consideration of the control strategy. In this case, different variants for the exploration of the state space are possible: For example, a data density can be increased or a proximity (in the state space) between already determined data (and, if applicable, its efficiency) can be taken into account in order to obtain comparable or completely different data in the state space State space to determine.
Die vorstehend genannte Aufgabe wird auch gelöst durch eine Vorrichtung zur Ansteuerung einer Anlage mit einer Verarbeitungseinheit, die derart eingerichtet ist, dass
- – die Anlage mittels einer ersten Aktion ansteuerbar ist,
- – Daten der Anlage ermittelbar sind als Folge der Ansteuerung mit der ersten Aktion,
- – anhand der Daten eine zweite Aktion ermittelbar ist und die Anlage mit der zweiten Aktion ansteuerbar ist,
- – die erste Aktion und/oder die zweite Aktion bestimmbar ist, um Teile eines Zustandsraums der Anlage zu ermitteln.
- - The system is controllable by means of a first action,
- - data of the system can be determined as a result of the control with the first action,
- A second action can be determined on the basis of the data and the installation can be activated with the second action,
- - The first action and / or the second action is determinable to determine parts of a state space of the plant.
Die Verarbeitungseinheit kann insbesondere eine Prozessoreinheit und/oder eine zumindest teilweise fest verdrahtete oder logische Schaltungsanordnung sein, die beispielsweise derart eingerichtet ist, dass das Verfahren wie hierin beschrieben durchführbar ist. Besagte Verarbeitungseinheit kann jede Art von Prozessor oder Rechner oder Computer mit entsprechend notwendiger Peripherie (Speicher, Input/Output-Schnittstellen, Ein-Ausgabe-Geräte, etc.) sein oder umfassen. In particular, the processing unit may be a processor unit and / or an at least partially hardwired or logic circuit arrangement, which is set up, for example, such that the method can be carried out as described herein. Said processing unit may be or include any type of processor or computer or computer with correspondingly necessary peripherals (memory, input / output interfaces, input / output devices, etc.).
Die vorstehenden Erläuterungen betreffend das Verfahren gelten für die Vorrichtung entsprechend. Die Vorrichtung kann in einer Komponente oder verteilt in mehreren Komponenten ausgeführt sein. Insbesondere kann auch ein Teil der Vorrichtung über eine Netzwerkschnittstelle (z.B. das Internet) angebunden sein. Beispielsweise kann die vorstehend erläuterte Datenbank eine Datenbank in einem Netzwerk sein. The above explanations regarding the method apply to the device accordingly. The device may be implemented in one component or distributed in several components. In particular, a portion of the device may also be connected via a network interface (e.g., the Internet). For example, the database discussed above may be a database in a network.
Gemäß einer Weiterbildung dient die Vorrichtung der Ansteuerung mindestens einer Windturbine. According to a development, the device serves to control at least one wind turbine.
Ausführungsbeispiele der Erfindung werden nachfolgend anhand der Zeichnungen dargestellt und erläutert. Embodiments of the invention are illustrated and explained below with reference to the drawings.
Es zeigen: Show it:
Es wird insbesondere vorgeschlagen, eine Anlage, die mittels Betriebsparametern einstellbar ist, effizient anzusteuern. Bei der Anlage kann es sich um ein beliebiges technisches System handeln, das z.B. elektrische und/oder mechanische Komponenten aufweist. Die Anlage kann z.B. ein technisches System, eine Automatisierungsanlage, eine Fertigungsanlage oder eine Maschine umfassen. Die Anlage kann insbesondere eine Windturbine aufweisen. Auch ist es möglich, dass die Anlage mehrere Windturbinen aufweist, die z.B. in Form eines Windparks zumindest teilweise gemeinsam angesteuert werden können. It is proposed, in particular, to drive a system which can be set by means of operating parameters efficiently. The installation may be any technical system, e.g. having electrical and / or mechanical components. The plant may e.g. a technical system, an automation system, a production plant or a machine. The plant may in particular have a wind turbine. It is also possible for the plant to have several wind turbines, e.g. in the form of a wind farm can be controlled at least partially together.
Betriebsbedingungen der Anlage können eine Zielgröße der Anlage maßgeblich beeinflussen. Beispielsweise kann es sich bei den Betriebsbedingungen um Umgebungsbedingungen, Umwelteinflüsse, etc. handeln. Die Zielgröße der Anlage kann z.B. eine bereitgestellte elektrische Leistung, ein bereitgestelltes Produkt, ein bereitgestellter Dienst, eine Qualität (z.B. des bereitgestellten Produkts oder des bereitgestellten Dienstes) o.ä. sein. Operating conditions of the system can significantly influence a target size of the system. For example, the operating conditions may be environmental conditions, environmental influences, etc. The target size of the plant may e.g. a provided electric power, a provided product, a service provided, a quality (e.g., the product provided or the service provided) or the like. be.
Nachfolgend wird auf eine Windturbine als beispielhafte Anlage eingegangen. Entsprechend sind andere Anlagen möglich. Auch kann die Anlage eine Vielzahl von Windturbinen umfassen. In the following, a wind turbine will be discussed as an example. Accordingly, other systems are possible. Also, the plant may include a variety of wind turbines.
Durch Anpassung der Betriebsparameter der Windturbine ist es (z.B. für eine Klasse oder Gruppe von Windturbinen, die ggf. in einem Windpark aufgestellt sind) möglich, eine optimierte Kontroll-Strategie bereitzustellen bzw. die Kontroll-Strategie aufgrund von vorhandenen Daten zu erlernen und/oder zu modifizieren und so Effekte wie Dichte der Luft, Scherwinde, Anlaufbedingungen der Windturbine und andere Faktoren zu berücksichtigen. By adapting the operating parameters of the wind turbine, it is possible (eg for a class or group of wind turbines, which may be installed in a wind farm) to provide an optimized control strategy or to learn the control strategy on the basis of existing data and / or to take into account effects such as air density, shear winds, wind turbine start-up conditions and other factors.
Die Anpassung der Betriebsparameter kann automatisch erfolgen. Beispielsweise kann eine globale Optimierung der Windturbine erreicht werden, indem ein Zustand der Turbine nur globale Effekte berücksichtigt, z.B.:
- – globale Wetterbedingungen,
- – globale Windbedingungen und/oder
- – allgemeine Turbineneigenschaften.
- - global weather conditions,
- - global wind conditions and / or
- - general turbine characteristics.
Eine lokale Optimierung der Windturbine kann basierend auf einem Zustand erfolgen, der beispielsweise die folgenden ortspezifischen Informationen berücksichtigt:
- – lokale Windrichtungen,
- – lokal vorhandene Turbulenzen und/oder
- – lokal vorhandene Scherwinde.
- - local wind directions,
- - local turbulence and / or
- - Locally available shear winds.
Unter Berücksichtigung von Daten eines Modells (z.B. eines Designmodells) der Windturbine und von Windprofilen unterschiedlicher Turbulenzstärken können
- – eine Drehgeschwindigkeit des Rotors der Windturbine und
- – ein Blattanstellwinkel der Rotorblätter eingestellt werden, um die Effizienz zu verbessern. Eine von der Turbine bereitgestellte Leistung ergibt sich zu:
p(t) = 0,5·ρ(t)·A·Cp(t)·νwind(t)3 – pI(t), (1)
- t
- die Zeit,
- ρ(t)
- eine Luftdichte,
- A
- eine Rotorfläche,
- Cp(t)
- einen Leistungskoeffizienten,
- vwind(t)
- eine Windgeschwindigkeit und
- pI(t)
- Verluste begründet durch Reibung und Hilfsleistung
- A rotational speed of the rotor of the wind turbine and
- - A blade pitch of the rotor blades are adjusted to improve the efficiency. A power provided by the turbine results in:
p (t) = 0.5 · ρ (t) · A · C p (t) · ν wind (t) 3 - p I (t), (1)
- t
- the time,
- ρ (t)
- an air density,
- A
- a rotor surface,
- Cp (t)
- a power coefficient,
- v wind (t)
- a wind speed and
- p I (t)
- Losses due to friction and auxiliary power
Die Leistung kann bei vorgegebener Windgeschwindigkeit optimiert werden, indem ein Leistungskoeffizient verwendet wird, der mittels eines aerodynamischen Modells der Turbine und ihrer Rotorblätter optimiert wird. The power can be optimized at a given wind speed by using a power coefficient optimized by means of an aerodynamic model of the turbine and its rotor blades.
Das Ergebnis einer solchen Optimierung kann durch die Funktion
Zur Berücksichtigung weiterer Einflüsse auf die Windturbine und damit einer Verbesserung der Effizienz der Windturbine im Hinblick auf deren bereitgestellte Leistung als Zielgröße wird insbesondere ein autonomer Lernansatz vorgeschlagen, anhand dessen eine Optimierung der Betriebsparameter der Windturbine erfolgt, indem ein Zustandsraum der für die Windturbine möglichen Betriebsparameter aktiv erkundet bzw. exploriert wird. Die so erhaltenen Informationen, insbesondere ein Einfluss der Betriebsparameter auf die Zielgröße, werden genutzt, um eine optimierte Kontroll-Strategie abzuleiten und zum Betrieb der Windturbine einzusetzen. In order to take into account further influences on the wind turbine and thus an improvement in the efficiency of the wind turbine with regard to their provided power as a target, in particular an autonomous learning approach is proposed on the basis of which an optimization of the operating parameters of the wind turbine takes place by activating a state space of the operating parameters that are possible for the wind turbine explored or explored. The information thus obtained, in particular an influence of the operating parameters on the target size, are used to derive an optimized control strategy and to use it to operate the wind turbine.
Somit ist es möglich, auch lokale Bedingungen, die den Betrieb der Windturbine z.B. in Form von Turbulenzen und Scherwinden beeinflussen, zu berücksichtigen. Außerdem können zusätzliche Faktoren, z.B. Temperatur, Feuchtigkeit, Staub, Eis, etc., die ebenfalls eine Wirkung auf den Betrieb der Windturbine ausüben, berücksichtigt werden. Thus, it is also possible to use local conditions which limit the operation of the wind turbine, e.g. in the form of turbulence and shear winds influence, to take into account. In addition, additional factors, e.g. Temperature, humidity, dust, ice, etc., which also exert an effect on the operation of the wind turbine, are taken into account.
Eine Steuereinheit
Basierend auf den Daten
Hierbei sei angemerkt, dass die Einheit
Beispielhaft sind in
Der Zustandsschätzer
Die Aktion
Somit kann beispielsweise die Windturbine
Der Lernalgorithmus
Anstelle des neuronalen Netzes
Der Lernalgorithmus
Das neuronale Netz liefert basierend auf Eingangsdaten I Zieldaten Ti, wobei i einen Iterationszähler bezeichnet. Das Lernen kann anhand der folgenden drei Schritte veranschaulicht werden: The neural network provides target data T i based on input data I , where i denotes an iteration counter. Learning can be illustrated by the following three steps:
Schritt 1: Step 1:
Variablen des Lernalgorithmus werden initialisiert:
- i
- den Iterationszähler (d.h. einen Schritt i der Iteration),
- r
- ein Vektor von Belohnungen (alternativ auch als Kosten realisierbar),
- s
- ein Vektor von Zuständen,
- a
- ein Vektor von Aktionen,
- s'
- ein Vektor von den Zuständen s nachfolgenden Zuständen,
- freward(...)
- eine Funktion der Belohnung
- T0
- ein Vektor von Zieldaten des neuronalen Netzes für die erste Iteration (i = 0) und
- I
- die Eingangsdaten für das neuronale Netz
- i
- the iteration counter (ie a step i of the iteration),
- r
- a vector of rewards (alternatively available as a cost),
- s
- a vector of states,
- a
- a vector of actions,
- s'
- a vector of the states s subsequent states,
- f reward (...)
- a function of reward
- T 0
- a vector of target data of the neural network for the first iteration (i = 0) and
- I
- the input data for the neural network
Der Vektor r mit mehreren Belohnungen kann basierend auf dem Vektor von Zuständen s und Aktionen a sowie den nachfolgenden Zuständen s' geschätzt werden, da die Funktion der Belohnung freward oft nicht explizit bekannt ist. Die Eingangsdaten I können als eine Menge der vorstehend beschriebenen Daten
Schritt 2: Step 2:
Eine Zuordnung der Eingangsdaten I zu Zieldaten Ti wird mittels einer Funktion Qi anhand des FFNN bestimmt:
Schritt 3: Step 3:
Die Zieldaten der nächsten Iteration Ti+1 werden wie folgt ermittelt: mit γ ∊ [0, 1]. The target data of the next iteration T i + 1 are determined as follows: with γ ε [0, 1].
Die Zieldaten der nächsten Iteration werden bestimmt, indem die Belohnung r und eine geschätzte zusätzliche Belohnung Qi für die Aktion a' in dem Zustand s' addiert werden. Die Aktion a' wird dabei ermittelt aus allen verfügbaren Aktionen A als diejenige Aktion, die die größte Belohnung Qi bewirkt. The target data of the next iteration is determined by adding the reward r and an estimated additional reward Q i for the action a 'in the state s'. The action a 'is determined from all available actions A as the action that causes the greatest reward Q i .
Der Einfluss der Belohnung Qi im Vergleich zu der Belohnung r kann mittels eines Korrekturfaktors γ eingestellt werden, der beispielsweise in einem Intervall zwischen 0 und 1 liegt. The influence of the reward Q i in comparison to the reward r can be set by means of a correction factor γ which lies for example in an interval between 0 and 1.
Die Schritte 2 und 3 können iterativ durchgeführt werden solange bis der Iterationszähler i einen vorgegebenen Schwellwert imax erreicht oder überschreitet oder bis eine vorgegebene Abbruchbedingung erfüllt ist. Steps 2 and 3 can be carried out iteratively until the iteration counter i reaches or exceeds a predefined threshold value i max or until a predetermined termination condition is met.
Der Lernalgorithmus kann auch durch einen Algorithmus eines RCNN (Recurrent Control Neuronal Network, d.h. ein zeitlich entfalteter neuronaler Regler) ersetzt werden, wobei die Kontroll-Strategie (siehe Einheit
Da die Windgeschwindigkeit an der Turbine selbst nicht genau gemessen werden kann, ist es nicht möglich, die Zielfunktion mit der benötigten Genauigkeit zu bestimmen. Es wird daher ein autonomer Lernansatz vorgeschlagen, der keine explizite Zielfunktion benötigt und mittels eines Lernalgorithmus autonom die Zielgröße einer Anlage, hier die ausgegebene Leistung der Windturbine, verbessert. Since the wind speed at the turbine itself can not be measured accurately, it is not possible to determine the target function with the required accuracy. An autonomous learning approach is therefore proposed which does not require an explicit objective function and autonomously improves the target variable of a system, in this case the output of the wind turbine, by means of a learning algorithm.
Die vorliegende Lösung eignet sich zu einem kombinierten Betrieb einer Anlage, eines Systems oder einer Maschine, z.B. mindestens einer Windturbine, wobei zwischen einem ersten Betriebsmodus "effizienter Betrieb" und einem zweiten Betriebsmodus "Sammeln von Informationen betreffend den Zustandsraum der Anlage" gewechselt werden kann. In dem zweiten Betriebsmodus werden, wie vorstehend erläutert, Daten gesammelt als Reaktionen auf mögliche Aktionen (d.h. Einstellungen) der Anlage. Durch eine gezielte Ansteuerung mit vorgegebenen Aktionen ist es somit möglich, den Zustandsraum der Anlage zu erkunden und somit eine Wissensbasis zu vergrößern, anhand derer dann ein verbesserter (z.B. effizienter) Betrieb der Anlage ermöglicht wird. In dem ersten Betriebsmodus wird die Anlage anhand der ermittelten Informationen (und ggf. weiterer vorgegebener Informationen) angesteuert. Die Ansteuerung der Anlage erfolgt durch Einstellung ihrer Betriebsparameter. The present solution is suitable for a combined operation of a plant, a system or a machine, e.g. at least one wind turbine, it being possible to switch between a first operating mode "efficient operation" and a second operating mode "gathering information regarding the state space of the system". In the second mode of operation, as discussed above, data is collected in response to possible actions (i.e., adjustments) to the plant. By means of targeted activation with given actions, it is thus possible to explore the state space of the installation and thus to increase a knowledge base, by means of which an improved (for example more efficient) operation of the installation is made possible. In the first operating mode, the system is controlled based on the determined information (and possibly further specified information). The system is controlled by setting its operating parameters.
Der Wechsel zwischen dem ersten Betriebsmodus und dem zweiten Betriebsmodus kann nach einem vorgegebenen festen oder nach einem dynamischen Schema erfolgen. Beispielsweise kann eine Zeitbasis zur Ansteuerung der Anlage in Zeitintervalle unterteilt werden. Nun können regelmäßig, unregelmäßig oder zufällig Zeitintervalle für den ersten oder für den zweiten Betriebsmodus genutzt werden. Auch ist es möglich, dass die Veränderung der Effizienz als Maß dafür dient, die Dauer bzw. Häufigkeit zumindest eines der Betriebsmodi zu modifizieren: Wenn z.B. durch die iterative Durchführung des zweiten Betriebsmodus eine Effizienzsteigerung kaum mehr oder gar nicht mehr möglich ist, kann der zweite Betriebsmodus entsprechend seltener aktiviert werden. Im anderen Fall, kann das Sammeln von Informationen forciert werden, um die Effizienz weiter zu steigern. Auch kann der zweite Betriebsmodus dann aktiviert werden, wenn die Anlage nicht (effizient) betrieben werden muss (z.B. wenn eine Windturbine keinen Strom bereitstellen muss) oder in einem Fehlermodus – in solchen Fällen können zumindest Daten über die Anlage gesammelt werden. The change between the first operating mode and the second operating mode can take place according to a predetermined fixed or according to a dynamic scheme. For example, a time base for controlling the system can be subdivided into time intervals. Now periodic, irregular or random time intervals can be used for the first or for the second operating mode. It is also possible that the change in efficiency serves as a measure to modify the duration or frequency of at least one of the modes of operation: e.g. As a result of the iterative implementation of the second operating mode, an increase in efficiency is scarcely possible or even no longer possible, the second operating mode can be activated correspondingly less frequently. In the other case, the gathering of information can be forced to further increase the efficiency. Also, the second mode of operation may be activated when the system need not be operated (efficiently) (e.g., when a wind turbine need not provide power) or in a fault mode - in which case at least data on the system may be collected.
ZITATE ENTHALTEN IN DER BESCHREIBUNG QUOTES INCLUDE IN THE DESCRIPTION
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of the documents listed by the applicant has been generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA assumes no liability for any errors or omissions.
Zitierte Nicht-PatentliteraturCited non-patent literature
- "Markov Decisions Process Extraktion Network" siehe z.B.: S. Duell, A. Hans, and S. Udluft: The Markov Decision Process Extraction Network. In Proc. of the European Symposium on Artificial Neural Networks, 2010 [0021] See "Markov Decision's Process Extraction Network", for example: S. Duell, A. Hans, and S. Udluft: The Markov Decision Process Extraction Network. In Proc. of the European Symposium on Artificial Neural Networks, 2010 [0021]
- "Neural Fitted Q Iteration", siehe: M. Riedmiller: Neural Fitted Q Iteration – First Experiences with a Data Efficient Neural Reinforcement Learning Method. In Proc. of the European Conf. on Machine Learning, 2005 [0027] "Neural Fitted Q Iteration", see: M. Riedmiller: Neural Fitted Q Iteration - First Experiences with a Data Efficient Neural Reinforcement Learning Method. In Proc. of the European Conf. on Machine Learning, 2005 [0027]
- "Recurrent Control Neural Network", siehe: A.M. Schaefer, S. Udluft, and H.-G. Zimmermann. A Recurrent Control Neural Network for Data Efficient Reinforcement Learning. In Proc. of the IEEE International Symposium on Approximate Dynamic Programming and Reinforcement Learning, 2007 [0027] "Recurrent Control Neural Network", see: AM Schaefer, S. Udluft, and H.-G. Zimmermann. A Recurrent Neural Network for Data Efficient Reinforcement Learning. In Proc. of the IEEE International Symposium on Approximate Dynamic Programming and Reinforcement Learning, 2007 [0027]
- A. M. Schäfer, D. Schneegaß, V. Sterzing, and S. Udluft. A Neural Reinforcement Learning Approach to Gas Turbine Control. International Joint Conference on Neural Networks, 2007 [0027] AM Schäfer, D. Schneegass, V. Sterzing, and S. Udluft. A Neural Reinforcement Learning Approach to Gas Turbine Control. International Joint Conference on Neural Networks, 2007 [0027]
- "Policy Gradient Neural Rewards Regression", siehe: D. Schneegaß, S. Udluft, and Th. Martinetz. Improving Optimality of Neural Rewards Regression for Data-Efficient Batch Near-Optimal Policy Identification. In Proc. of the International Conf. on Artificial Neural Networks, 2007 [0027] "Policy Gradient Neural Rewards Regression", see: D. Schneegass, S. Udluft, and Th. Martinetz. Improving Optimality of Neural Rewards Regression for Data-Efficient Batch Near-Optimal Policy Identification. In Proc. of the International Conf. on Artificial Neural Networks, 2007 [0027]
Claims (15)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102011075337A DE102011075337A1 (en) | 2011-05-05 | 2011-05-05 | Method for controlling system, involves carrying out action to control system by obtaining control information from data of system, where another action or operation is determined according to data to control system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102011075337A DE102011075337A1 (en) | 2011-05-05 | 2011-05-05 | Method for controlling system, involves carrying out action to control system by obtaining control information from data of system, where another action or operation is determined according to data to control system |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102011075337A1 true DE102011075337A1 (en) | 2012-11-08 |
Family
ID=47019417
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102011075337A Ceased DE102011075337A1 (en) | 2011-05-05 | 2011-05-05 | Method for controlling system, involves carrying out action to control system by obtaining control information from data of system, where another action or operation is determined according to data to control system |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE102011075337A1 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102013110273A1 (en) * | 2013-09-18 | 2015-03-19 | Ambrosys GmbH | Method for optimizing the performance of a turbulent or chaotic system |
EP3828251A4 (en) * | 2018-07-25 | 2022-04-06 | Sekisui Chemical Co., Ltd. | Control device, operation control device, server, management server, computer program, learning model, control method and operation control method |
US20220325696A1 (en) * | 2019-09-16 | 2022-10-13 | Siemens Gamesa Renewable Energy A/S | Wind turbine control based on reinforcement learning |
DE102017000955B4 (en) | 2016-02-09 | 2022-11-17 | Fanuc Corporation | Production control system and integrated production control system |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000017811A2 (en) * | 1998-09-23 | 2000-03-30 | Siemens Aktiengesellschaft | Method and configuration for determining a sequence of actions for a system which comprises statuses, whereby a status transition ensues between two statuses as a result of an action |
DE10021929A1 (en) * | 2000-05-05 | 2001-11-15 | Siemens Ag | Computerized determination of control strategy for technical system involves using reinforcement learning to determine control strategy for each state and learn optimal actions |
DE102007001024A1 (en) * | 2007-01-02 | 2008-07-03 | Siemens Ag | Technical system i.e. gas turbine, controlling and/or regulating method, involves selecting learning and/or optimization procedure suitable for technical system, and regulating and/or controlling system by selected procedure |
WO2010099928A2 (en) * | 2009-03-02 | 2010-09-10 | Suzlon Energy Gmbh | Method for monitoring wind turbines |
-
2011
- 2011-05-05 DE DE102011075337A patent/DE102011075337A1/en not_active Ceased
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000017811A2 (en) * | 1998-09-23 | 2000-03-30 | Siemens Aktiengesellschaft | Method and configuration for determining a sequence of actions for a system which comprises statuses, whereby a status transition ensues between two statuses as a result of an action |
DE10021929A1 (en) * | 2000-05-05 | 2001-11-15 | Siemens Ag | Computerized determination of control strategy for technical system involves using reinforcement learning to determine control strategy for each state and learn optimal actions |
DE102007001024A1 (en) * | 2007-01-02 | 2008-07-03 | Siemens Ag | Technical system i.e. gas turbine, controlling and/or regulating method, involves selecting learning and/or optimization procedure suitable for technical system, and regulating and/or controlling system by selected procedure |
WO2010099928A2 (en) * | 2009-03-02 | 2010-09-10 | Suzlon Energy Gmbh | Method for monitoring wind turbines |
Non-Patent Citations (5)
Title |
---|
"Markov Decisions Process Extraktion Network" siehe z.B.: S. Duell, A. Hans, and S. Udluft: The Markov Decision Process Extraction Network. In Proc. of the European Symposium on Artificial Neural Networks, 2010 |
"Neural Fitted Q Iteration", siehe: M. Riedmiller: Neural Fitted Q Iteration - First Experiences with a Data Efficient Neural Reinforcement Learning Method. In Proc. of the European Conf. on Machine Learning, 2005 |
"Policy Gradient Neural Rewards Regression", siehe: D. Schneegabeta, S. Udluft, and Th. Martinetz. Improving Optimality of Neural Rewards Regression for Data-Efficient Batch Near-Optimal Policy Identification. In Proc. of the International Conf. on Artificial Neural Networks, 2007 |
"Recurrent Control Neural Network", siehe: A.M. Schaefer, S. Udluft, and H.-G. Zimmermann. A Recurrent Control Neural Network for Data Efficient Reinforcement Learning. In Proc. of the IEEE International Symposium on Approximate Dynamic Programming and Reinforcement Learning, 2007 |
A. M. Schäfer, D. Schneegabeta, V. Sterzing, and S. Udluft. A Neural Reinforcement Learning Approach to Gas Turbine Control. International Joint Conference on Neural Networks, 2007 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102013110273A1 (en) * | 2013-09-18 | 2015-03-19 | Ambrosys GmbH | Method for optimizing the performance of a turbulent or chaotic system |
DE102017000955B4 (en) | 2016-02-09 | 2022-11-17 | Fanuc Corporation | Production control system and integrated production control system |
EP3828251A4 (en) * | 2018-07-25 | 2022-04-06 | Sekisui Chemical Co., Ltd. | Control device, operation control device, server, management server, computer program, learning model, control method and operation control method |
US20220325696A1 (en) * | 2019-09-16 | 2022-10-13 | Siemens Gamesa Renewable Energy A/S | Wind turbine control based on reinforcement learning |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2697695B1 (en) | Method for the computer-supported generation of a data-driven model of a technical system, in particular of a gas turbine or wind turbine | |
EP3662418B1 (en) | Method and apparatus for machine learning in a computational unit | |
WO2014121863A1 (en) | Method and device for controlling an energy-generating system which can be operated with a renewable energy source | |
EP3132317A1 (en) | Method for computer-aided plant control optimisation using a simulation module | |
EP2880499B1 (en) | Method for controlling and/or regulating a technical system in a computer-assisted manner | |
EP3022611B1 (en) | Method for the computer-aided control and/or regulation of a technical system | |
WO2014187828A1 (en) | Methods for ascertaining a model of a starting variable of a technical system | |
EP3876061A1 (en) | Method for validation and selection on machine learning based models for monitoring the state of a machine | |
EP3097622B1 (en) | Wind farm control having improved target value jump behavior | |
DE102011002842A1 (en) | Simulation model for a wind turbine as well as production and use | |
DE112018001318T5 (en) | WIND POWER GENERATION SYSTEM | |
EP2943841B1 (en) | Method for the computerized control and/or regulation of a technical system | |
DE102011075337A1 (en) | Method for controlling system, involves carrying out action to control system by obtaining control information from data of system, where another action or operation is determined according to data to control system | |
DE102017216634A1 (en) | Method and training data generator for configuring a technical system and control device for controlling the technical system | |
DE102011079433A1 (en) | Method for controlling rotor blade of wind turbine, involves determining data of wind turbine, and model is determined based on data of wind turbine, and action sequence is determined based on model of wind turbine | |
EP3376026B1 (en) | Method for controlling the power output of a wind farm and corresponding wind farm | |
DE102017009838A1 (en) | Control system and method for operating multiple wind turbines | |
DE102016201745A1 (en) | Soft sensor for identification and control or control of a ventilation system | |
DE102011007434A1 (en) | Method for creating software-simulation module for simulating correlation between input and output variables and/or behavior of wind energy plant in energy supply network, involves forming model from transfer and combination functions | |
EP4004365A1 (en) | Method for controlling a wind farm, control module for a wind farm, and wind farm | |
EP3489773A1 (en) | Method for the computer-based control of a technical system, in particular an energy generation plant | |
DE102019131456A1 (en) | Method for determining a property of a machine, in particular a machine tool, without measuring the property | |
EP3557048A1 (en) | Wind turbine and method and device for operating a wind turbine | |
DE102013002662A1 (en) | Method for operating wind energy plant of wind farm, involves determining target operation target to limit mechanical load at one of wind energy plants using first degree of wear and second degree of wear of wind energy plants | |
WO2019158762A1 (en) | Method and devices for automatically determining and/or compensating for the influence of a wake turbulence on a wind turbine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R012 | Request for examination validly filed | ||
R002 | Refusal decision in examination/registration proceedings | ||
R003 | Refusal decision now final |
Effective date: 20121219 |