DE102007001026B4 - Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems - Google Patents

Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems Download PDF

Info

Publication number
DE102007001026B4
DE102007001026B4 DE102007001026A DE102007001026A DE102007001026B4 DE 102007001026 B4 DE102007001026 B4 DE 102007001026B4 DE 102007001026 A DE102007001026 A DE 102007001026A DE 102007001026 A DE102007001026 A DE 102007001026A DE 102007001026 B4 DE102007001026 B4 DE 102007001026B4
Authority
DE
Germany
Prior art keywords
states
state
technical system
time
state space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE102007001026A
Other languages
English (en)
Other versions
DE102007001026A1 (de
Inventor
Anton Maximilian SCHÄFER
Steffen Dr. Udluft
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE102007001026A priority Critical patent/DE102007001026B4/de
Priority to EP07857885A priority patent/EP2097793B1/de
Priority to PCT/EP2007/064264 priority patent/WO2008080863A1/de
Priority to AT07857885T priority patent/ATE514980T1/de
Priority to US12/521,920 priority patent/US8566264B2/en
Priority to JP2009544386A priority patent/JP5345551B2/ja
Publication of DE102007001026A1 publication Critical patent/DE102007001026A1/de
Application granted granted Critical
Publication of DE102007001026B4 publication Critical patent/DE102007001026B4/de
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/33Director till display
    • G05B2219/33025Recurrent artificial neural network
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/33Director till display
    • G05B2219/33036Error back propagation

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Processing Or Creating Images (AREA)
  • Machine Translation (AREA)

Abstract

Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems, bei dem:
a) das technische Systems für mehrere Zeitpunkte (t) jeweils durch einen Zustand (xt) mit einer Mehrzahl von Zustandsvariablen in einem ersten Zustandsraum mit einer ersten Dimension charakterisiert wird;
b) die Zustände (xt) des ersten Zustandsraums mit einem rekurrenten neuronalen Netz umfassend eine Eingangsschicht (I), eine rekurrente versteckte Schicht (H) und eine Ausgangsschicht (O) mit Hilfe von bekannten Zuständen als Trainingsdaten modelliert werden, wobei:
i) die Eingangsschicht (I) und die Ausgangsschicht (O) jeweils durch die Zustände (xt) in dem ersten Zustandsraum für die mehreren Zeitpunkte (t) gebildet werden;
ii) die rekurrente versteckte Schicht (H) durch versteckte Zustände (st) mit einer Mehrzahl von versteckten Zustandsvariablen in einem zweiten Zustandsraum mit einer zweiten Dimension gebildet wird, wobei die zweite Dimension niedriger als die erste Dimension ist;
c) auf den versteckten Zuständen (st) in dem zweiten Zustandsraum ein...

Description

  • Die Erfindung betrifft ein Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems sowie ein entsprechendes Computerprogrammprodukt.
  • Heutzutage weisen technische Systeme oftmals eine hohe Komplexität auf, d. h. sie werden durch Zustände mit einer Vielzahl von Zustandsvariablen beschrieben. Die Zustandsvariablen sind hierbei insbesondere messbare Zustandsgrößen des technischen Systems, wie z. B. physikalische Größen, wie Druck, Temperatur, Leistung und dgl. Bei der Steuerung von komplexen technischen Systemen werden oftmals rechnergestützte Verfahren eingesetzt, welche das dynamische zeitliche Verhalten des technischen Systems unter Berücksichtigung vorbestimmter Kriterien optimieren. Beispiele solcher Verfahren sind Lernverfahren, wie hinlänglich aus dem Stand der Technik bekannte bestärkende Lernverfahren (Reinforcement Learning, siehe Leslie Pack Kaelbling; Michael L. Littman; Andrew W. Moore, Reinforcement Learning: A Survey, Journal of Artificial Intelligence Research 4 (1996) pp. 237–285). Diese Verfahren optimieren das dynamische Verhalten eines technischen Systems durch Bestimmung von geeigneten, am technischen System durchzuführenden Aktionen, wobei diese Aktionen Veränderungen von bestimmten Stellgrößen am technischen System, wie z. B. Veränderung von Ventilstellungen, Erhöhung von Drucken und dgl., umfassen. Jede Aktion wird hierbei in geeigneter Weise durch Belohnung und Bestrafung, beispielsweise unter Einbeziehung einer Kostenfunktion, bewertet, wodurch ein optimales dynamisches Verhalten des technischen Systems erzielt werden kann.
  • Bei den oben beschriebenen Standardverfahren zur Steuerung bzw. Optimierung des dynamischen Verhaltens von technischen Systemen besteht das Problem, dass solche Verfahren nur im begrenzten Umfang für Zustande mit einer Vielzahl von Zu standsvariablen (d. h. in einem hochdimensionalen Zustandsraum) eingesetzt werden können.
  • Aus dem Stand der Technik sind sog. Verfahren zu "Feature-Selection" bekannt, mit der Zustandsräume reduziert werden können. Dabei wird jedoch in der Regel nur eine Auswahl der relevanten Zustandsvariablen und nicht eine Verringerung der Dimension des Zustandsraums auf der Basis aller Variablen durchgeführt. Zudem sind diese Verfahren statisch und führen keine explizite Betrachtung und Identifizierung des dynamischen Verhaltens des technischen Systems durch.
  • Aus den Dokumenten DE 10 2004 011 015 A1 , DE 10 2004 011 426 B3 , EP 1 190 383 B1 sowie US 5 444 819 A sind Verfahren zur rechnergestützten Steuerung bzw. Regelung eines technischen Systems unter Verwendung eines trainierbaren, neuronalen Netzes bekannt, wobei das Netz selbst eine Eingangsschicht, eine versteckte Schicht und eine Ausgangsschicht umfasst, wodurch verschiedene Zustandsräume gebildet werden.
  • In dem Dokument EP 1 145 190 B1 ist ein Verfahren zur Ermittlung der Dynamik eines technischen Systems beschrieben, bei dem ein rekurrentes neuronales Netz verwendet wird, welches eine Eingangsschicht mit hochdimensionalen Zuständen, eine versteckte Schicht mit inneren Systemzuständen sowie eine Ausgangsschicht mit prognostizierten Zuständen aufweist. Das Verfahren enthält eine Transformation von der hochdimensionalen Eingangsschicht in den Zustandsraum der versteckten Schicht, wobei die Dimension des Zustandsraums der versteckten Schicht im Vergleich zur Eingangsschicht reduziert ist. Die Druckschrift offenbart ferner ein Verfahren zum Trainieren eines solche rekurrenten neuronalen Netzes mit Hilfe von Trainingsdatensätzen unter Einbeziehung der Eingangsschicht, der versteckten Schicht und der Ausgangsschicht.
  • Aufgabe der Erfindung ist es, ein Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems zu schaffen, bei dem an sich bekannte Lern- und Optimie rungsverfahren nach einer geeigneten Reduzierung des Zustandsraums der Zustände eingesetzt werden können.
  • Diese Aufgabe wird durch die unabhängigen Patentansprüche gelöst. Weiterbildungen der Erfindung sind in den abhängigen Ansprüchen definiert.
  • Dem erfindungsgemäßen Verfahren wird eine Charakterisierung des technischen Systems für mehrere Zeitpunkte durch jeweilige Zustände mit einer Mehrzahl von Zustandsvariablen in einem ersten Zustandsraum zugrunde gelegt. Die Zustände im ersten Zustandsraum werden dabei mit einem rekurrenten neuronalen Netz umfassend eine Eingangsschicht, eine rekurrente versteckte Schicht und eine Ausgangsschicht mit Hilfe von bekannten Zuständen als Trainingsdaten modelliert, wobei:
    • i) die Eingangsschicht und die Ausgangsschicht jeweils durch die Zustände in dem ersten Zustandsraum für die mehreren Zeitpunkte gebildet werden;
    • ii) die rekurrente versteckte Schicht durch versteckte Zustände mit einer Mehrzahl von versteckten Zustandsvariablen in einem zweiten Zustandsraum mit einer zweiten Dimension gebildet wird, wobei die zweite Dimension niedriger als die erste Dimension ist.
  • Schließlich wird ein Lern- und/oder Optimierungsverfahren zur Steuerung und/oder Regelung des technischen Systems bei Ausführung von Aktionen am technischen System durchgeführt, wobei dieses Lern- bzw. Optimierungsverfahren nunmehr die versteckten Zustände im zweiten Zustandsraum verwendet.
  • Da die Dimension des zweiten Zustandsraums vermindert ist, können somit Lern- und/oder Optimierungsverfahren eingesetzt werden, welche in dem ursprünglichen ersten Zustandsraum aufgrund seiner hohen Dimensionen nicht einsetzbar sind. Die Erfindung schafft somit ein Verfahren, mit dem sehr flexibel an sich bekannte Lern- und/oder Optimierungsverfahren auch für hoch komplexe technische Systeme verwendet werden können. Das erfindungsgemäße Verfahren stellt hierbei eine effiziente Möglichkeit der Dimensionsreduzierung des Zustandsraums dar, wobei die hohe Qualität der Identifikation des technischen Systems mit Hilfe rekurrenter neuronaler Netze dazu genutzt wird, um die Entwicklung des Systems mit minimaler Dimension des Zustandsraums abzubilden bzw. zu modellieren. Im Gegensatz zu bereits existierenden Verfahren mit vergleichbarer Zielsetzung wird eine explizite Identifizierung und Modellierung der Dynamik durchgeführt. Insbesondere ermöglicht die Verwendung rekurrenter neuronaler Netze auch eine Modellierung nicht-linearer Dynamiken. Das Verfahren wurde von den Erfindern bereits erfolgreich in einem Verfahren zur Steuerung einer Gasturbine eingesetzt.
  • Das erfindungsgemäße Verfahren weist insbesondere den Vorteil auf, dass auch technische Systeme mit nicht-linearer Dynamik gesteuert bzw. geregelt werden können. Ferner kann in dem erfindungsgemäßen Verfahren ein rekurrentes neuronales Netz mit einer nicht-linearen Aktivierungsfunktion eingesetzt werden.
  • Wie bereits oben erwähnt, werden erfindungsgemäß bekannte Lern- und/oder Optimierungsverfahren in einem über ein rekurrentes neuronales Netz ermittelten Zustandsraum verminderter Dimension eingesetzt. Diese Lern- und/Optimierungsverfahren können beispielsweise bestärkende Lernverfahren sein, welche hinlänglich aus dem Stand der Technik bekannt sind und bereits im Vorangegangenen erwähnt wurden.
  • Um die Dimension des Zustandsraums weitestmöglich bei gleichzeitig ausreichender Vorhersagequalität zu minimieren, wird in einer Ausführungsform des erfindungsgemäßen Verfahrens die zweite Dimension des zweiten Zustandsraums schrittweise so lange herabgesetzt, wie die Abweichung zwischen mit dem rekurrenten neuronalen Netz bestimmten Zuständen und den bekannten Zuständen der Trainingsdaten kleiner als ein vorbestimmter Schwellenwert ist. Auf diese Weise wird ein minimaler Zustandsraum geschaffen, der eine dateneffiziente Anwendung von bekannten Lernverfahren ermöglicht.
  • Das erfindungsgemäße rekurrente neuronale Netz ist vorzugsweise derart ausgestaltet, dass jeder Zustand des technischen Systems zu einem jeweiligen Zeitpunkt in der Eingangsschicht über einen versteckten Zustand der versteckten Schicht zu dem jeweiligen Zeitpunkt mit einem Zustand des technischen Systems in der Ausgangsschicht zu einem dem jeweiligen Zeitpunkt nachfolgenden Zeitpunkt gekoppelt ist. Das rekurrente neuronale Netz stellt hierbei vorzugsweise ein Netz mit dynamisch konsistenter zeitlicher Entfaltung unter Berücksichtigung zukünftiger Zustände dar (im Englischen bezeichnet als "Network with Dynamically Consistent Overshooting"). Bei solchen Netzen werden die eigenen Vorhersagen des Netzwerks als Ersatz für unbekannte zukünftige Eingaben im Netzwerk verwendet.
  • Zur Modellierung der Zustände des ersten Zustandsraums mit dem rekurrenten neuronalen Netz kann insbesondere ein Backpropagation-Verfahren eingesetzt werden, insbesondere das Verfahren, welches beschrieben ist in D. E. Rumelhart, G. E. Hinton, and R. J. Williams, "Learning internal representations by error propagation", in Parallel Distributed Processing: Explorations in The Microstructure of Cognition, D. E. Rumelhart and J. L. M. et al., Eds. Cambridge: MIT Press, 1986, vol. 1, pp. 318–362.
  • In einer bevorzugten Ausführungsform wird das zur Minimierung des Zustandsraums verwendete rekurrente neuronale Netz durch folgende Gleichungen repräsentiert:
    Figure 00070001
    wobei der Wertebereich von τ eine vorbestimmte Anzahl m von Zeitschritten vor dem Zeitpunkt t und eine vorbestimmte Anzahl n von Zeitschritten nach dem Zeitpunkt t umfasst;
    wobei t ∈ {m, ...,T – n}, wobei T die Anzahl an Zeitpunkten, für welche Trainingsdaten vorliegen;
    wobei Xτ den durch das rekurrente neuronale Netz bestimmten Zustand des ersten Zustandsraums zum Zeitpunkt τ repräsentiert;
    wobei X d / τ den bekannten Zustand zum Zeitpunkt τ gemäß den Trainingsdaten repräsentiert;
    wobei Sτ den versteckten Zustand zum Zeitpunkt τ der versteckten Schicht des rekurrenten neuronalen Netzes repräsentiert;
    wobei A, B, C zu bestimmende Matrizen und θ ein zu bestimmender Bias sind.
  • Wie bereits oben erwähnt, kann die Erfindung für beliebige technische Systeme eingesetzt werden, welche durch entsprechende Zustände beschrieben werden. Ein Anwendungsfall ist beispielsweise eine Turbine, insbesondere eine Gasturbine.
  • Neben dem oben beschriebenen Verfahren betrifft die Erfindung ferner ein Computerprogrammprodukt mit einem auf einem ma schinenlesbaren Träger gespeicherten Programmcode zur Durchführung des erfindungsgemäßen Verfahrens, wenn das Programm auf einem Rechner abläuft.
  • Ausführungsbeispiele der Erfindung werden nachfolgend anhand der beigefügten Figur detailliert beschrieben.
  • Es zeigt:
  • 1 eine schematische Darstellung eines rekurrenten neuronalen Netzes, welches in einer Ausführungsform der Erfindung zur Reduzierung der Dimension des ersten Zustandsraums verwendet wird.
  • In der nachfolgend beschriebenen Ausführungsform der Erfindung wird eine Verminderung der Dimension eines ersten Zustandsraums mit Hilfe eines neuronalen Netzes erreicht. Der erste Zustandsraum ist hierbei charakterisiert durch eine Dimension, welche durch die Anzahl der Zustandsvariablen der Zustände xt des technischen Systems zu jeweiligen Zeitpunkten t charakterisiert ist. Der Zustand xt ist somit ein Zustandsvektor mit Einträgen von Zustandsvariablen eines technischen Systems, wobei Werte der Zustandsvariablen gemessen werden können. Ist das technische System beispielsweise eine Gasturbine, umfassen die Zustandsvariablen insbesondere Größen wie den Gasdruck, die Gastemperatur, Brennkammerbeschleunigungen und dgl. Die Dimension des ersten Zustandsraums ist dabei meistens hochdimensional und oftmals für bekannte Lernverfahren zu groß. Deshalb ist es Ziel der Erfindung, die Dimension des Zustandsraums zu minimieren, um bekannte Lernverfahren verwenden zu können. Dies wird in der hier beschriebenen Ausführungsform mit dem rekurrenten neuronalen Netz gemäß 1 erreicht.
  • Das Netz der 1 umfasst eine Eingangsschicht I, welche zu einem betrachteten Zeitpunkt t aus dem entsprechenden hochdimensionalen Zustand xt und vergangenen Zuständen xt-1, xt-3 usw. gebildet ist. Die Zustände der Eingangsschicht sind über eine Matrix B mit versteckten Zuständen einer versteckten Schicht H sowie eine Bias θ gekoppelt, wobei einem Zustand xt zu einem Zeitpunkt t ein entsprechender versteckter Zustand st zum gleichen Zeitpunkt in der versteckten Schicht H zugeordnet ist. Um eine Reduzierung des ersten Zustandsraums zu erreichen, ist die Dimension des Zustandsraums der versteckten Zustände st, der gemäß den Ansprüchen als zweiter Zustandsraum bezeichnet wird, geringer als die Dimension des ersten Zustandsraums. Die versteckte Schicht H ist hierbei eine rekurrente Schicht, bei der ein versteckter Zustand st zu einem Zeitpunkt t über eine Matrix A und dem Bias θ mit dem Zustand st+1 zum nachfolgenden Zeitpunkt gekoppelt ist. Die einzelnen versteckten Zustände st der Schicht H sind wiederum mit einer Ausgangsschicht O verbunden, welche – analog zur Eingangsschicht I – durch Zustände xt des technischen Systems repräsentiert wird. Hierbei ist ein versteckter Zustand st zu einem jeweiligen Zeitpunkt t mit dem Zustand xt+1 zum nächsten Zeitpunkt t + 1 über eine Matrix C gekoppelt.
  • Das in 1 gezeigte rekurrente neuronale Netz wird mit Trainingsdaten umfassend bekannte Zustände des technischen Systems trainiert, so dass mit dem Netz das dynamische zeitliche Verhalten des entsprechenden technischen Systems modelliert wird. Das rekurrente Netz gemäß 1 stellt dabei ein Netz mit dynamischer konsistenter zeitlicher Entfaltung unter Berücksichtigung zukünftiger Zustände dar, was im Englischen als "Network with Dynamically Consistent Overshooting" bezeichnet wird. Dies bedeutet, dass in dem Netz zu einem Zeitpunkt t nicht nur Zustände xt, xt-1, ..., usw. in der Vergangenheit, sondern auch zukünftige Zustände xt+1, xt+2, ..., usw. berücksichtigt werden, wobei die eigenen Vorhersagen des Netzes in der Ausgangsschicht, d. h. in 1 die Zustände xt+1, xt+2 nd xt+3 wiederum als Eingaben in dem Netz verwendet werden.
  • Dies ist in 1 durch gestrichelte Linien angedeutet, welche die Zustände der Ausgangsschicht O mit entsprechenden Zuständen der versteckten Schicht H koppelt. In dem rekurrenten neuronalen Netz gemäß 1 werden somit die Zustände xτ des Systems selbst vorhergesagt. Auf diese Weise kann die Dynamik des zugrunde liegenden technischen Systems modelliert werden. Mathematisch wird das Netz der 1 durch die folgenden Gleichungen repräsentiert:
    Figure 00100001
  • Die Gleichungen betreffen das rekurrente neuronale Netz zu einem Zeitpunkt t, wobei zu einem Zeitpunkt t ein Wertebereich von Zeitpunkten τ berücksichtigt wird, wobei der Wertebereich von τ eine vorbestimmte Anzahl m von Zeitschritten vor dem Zeitpunkt t und eine vorbestimmte Anzahl n von Zeitpunkten nach dem Zeitpunkt (dem sog. Overshooting Part) umfasst.
  • Es gilt hierbei t ∈ {m, ...,T – n}wobei T die Anzahl an Zeitpunkten repräsentiert, für welche Trainingsdaten, d. h. bekannte Zustände des technischen Systems, vorliegen.
  • Gemäß den obigen Gleichungen werden als Parameter des neuronalen Netzes die Matrizen A, B, C sowie der Bias θ bestimmt, wobei diese Parameter derart gewählt werden, dass der quadratische Fehler zwischen durch das Netz bestimmten Zuständen xτ. und den entsprechenden bekannten Zuständen X τ / d gemäß den Trainingsdaten minimal ist.
  • Nach der Modellierung des technischen Systems mit dem rekurrenten neuronalen Netz werden die hieraus erhaltenen Zustände st der versteckten Schicht dazu verwendet, um auf diese Zu stände ein entsprechendes Lern- und/oder Optimierungsverfahren zur Steuerung und/oder Regelung des technischen Systems bei Ausführung von Aktionen am technischen System anzuwenden. Da die Dimension der Zustände in der versteckten Schicht H geringer als die Dimension des ersten Zustandsraums ist, können hierbei auch Lernverfahren eingesetzt werden, welche im ursprünglichen ersten Zustandsraum aufgrund der zu großen Dimension nicht verwendbar sind. Das Verfahren der Erfindung ermöglicht somit eine effektive Reduzierung des Zustandsraums, um eine Vielzahl von bekannten Lern- oder Optimierungsverfahren zur Modellierung des dynamischen Verhaltens des technischen Systems einsetzen zu können. In einer bevorzugten Variante wird hierbei bei der Modellierung der Zustände des ersten Zustandsraums mit dem rekurrenten neuronalen Netz sukzessive die Dimension der versteckten Zustände solange vermindert, wie eine Abweichung der mit dem rekurrenten Netz bestimmten Zustände in der Ausgangsschicht zu den bekannten Zuständen gemäß den Trainingsdaten geringer als ein vorbestimmter Schwellenwert ist. Auf diese Weise kann die bestmögliche Verminderung der Dimension des Zustandsraums erreicht werden.
  • Als Lern- bzw. Optimierungsverfahren kann beispielsweise ein beliebiges aus dem Stand der Technik bekanntes Verfahren zum bestärkenden Lernen (sog. Reinforcement Learning) eingesetzt werden. Diese Lernverfahren ermöglichen das Lernen von in dem technischen System durchzuführenden Aktionen unter Berücksichtigung von Belohnung bzw. Bestrafung, um hierdurch das dynamische Verhalten des technischen Systems zu optimieren.

Claims (11)

  1. Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems, bei dem: a) das technische Systems für mehrere Zeitpunkte (t) jeweils durch einen Zustand (xt) mit einer Mehrzahl von Zustandsvariablen in einem ersten Zustandsraum mit einer ersten Dimension charakterisiert wird; b) die Zustände (xt) des ersten Zustandsraums mit einem rekurrenten neuronalen Netz umfassend eine Eingangsschicht (I), eine rekurrente versteckte Schicht (H) und eine Ausgangsschicht (O) mit Hilfe von bekannten Zuständen als Trainingsdaten modelliert werden, wobei: i) die Eingangsschicht (I) und die Ausgangsschicht (O) jeweils durch die Zustände (xt) in dem ersten Zustandsraum für die mehreren Zeitpunkte (t) gebildet werden; ii) die rekurrente versteckte Schicht (H) durch versteckte Zustände (st) mit einer Mehrzahl von versteckten Zustandsvariablen in einem zweiten Zustandsraum mit einer zweiten Dimension gebildet wird, wobei die zweite Dimension niedriger als die erste Dimension ist; c) auf den versteckten Zuständen (st) in dem zweiten Zustandsraum ein Lern- und/oder Optimierungsverfahren zur Steuerung und/oder Regelung des technischen Systems durch Ausführen von Aktionen am technischen System durchgeführt wird.
  2. Verfahren nach Anspruch 1, bei dem das technische System eine nicht-lineare Dynamik aufweist.
  3. Verfahren nach Anspruch 1 oder 2, bei dem in Schritt b) das rekurrente neuronale Netz eine nicht-lineare Aktivierungs funktion verwendet.
  4. Verfahren nach einem der vorhergehenden Ansprüche, bei dem das Lern- und/oder Optimierungsverfahren ein bestärkendes Lernverfahren ist.
  5. Verfahren nach einem der vorhergehenden Ansprüche, bei dem in Schritt b) die zweite Dimension des zweiten Zustandsraums schrittweise solange vermindert wird, wie die Abweichung zwischen den mit dem rekurrenten neuronalen Netz bestimmten Zuständen (xt) und den bekannten Zuständen (xt) der Trainingsdaten kleiner als ein vorbestimmter Schwellenwert ist.
  6. Verfahren nach einem der vorhergehende Ansprüche, bei dem ein Zustand (xt) des technischen Systems zu einem jeweiligen Zeitpunkt (t) in der Eingangsschicht (I) über einen verstecken Zustand (st) der verstecken Schicht (H) zu dem jeweiligen Zeitpunkt (t) mit einem Zustand (xt) des technischen Systems in der Ausgangsschicht (O) zu einem dem jeweiligen Zeitpunkt (t) nachfolgenden Zeitpunkt (t + 1) gekoppelt ist.
  7. Verfahren nach einem der vorhergehenden Ansprüche, bei dem das rekurrente neuronale Netz ein Netz mit dynamisch konsistenter zeitlicher Entfaltung unter Berücksichtigung zukünftiger Zustände (xt) ist.
  8. Verfahren nach einem der vorhergehenden Ansprüche bei dem zur Modellierung der Zustände (xt) des ersten Zustandsraums mit dem rekurrenten neuronalen Netz ein Backpropagation-Verfahren verwendet wird.
  9. Verfahren nach einem der vorhergehenden Ansprüche, bei dem das rekurrente neuronale Netz durch folgende Gleichungen repräsentiert wird:
    Figure 00130001
    Figure 00140001
    wobei der Wertebereich von τ eine vorbestimmte Anzahl m von Zeitschritten vor dem Zeitpunkt t und eine vorbestimmte Anzahl n von Zeitschritten nach dem Zeitpunkt t umfasst; wobei t ∈ {m, ...,T – n}, wobei T die Anzahl an Zeitpunkten, für welche Trainingsdaten vorliegen; wobei Xτ den durch das rekurrente neuronale Netz bestimmten Zustand des ersten Zustandsraums zum Zeitpunkt τ repräsentiert; wobei X d / τ den bekannten Zustand zum Zeitpunkt τ gemäß den Trainingsdaten repräsentiert; wobei Sτ den versteckten Zustand zum Zeitpunkt τ der versteckten Schicht des rekurrenten neuronalen Netzes repräsentiert; wobei A, B, C zu bestimmende Matrizen und θ ein zu bestimmender Bias sind.
  10. Verfahren nach einem der vorhergehenden Ansprüche, bei dem das technische System eine Turbine, insbesondere eine Gasturbine, ist.
  11. Computerprogrammprodukt mit einem auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Durchführung des Verfahrens nach einem der vorhergehenden Ansprüche, wenn das Programm auf einem Rechner abläuft.
DE102007001026A 2007-01-02 2007-01-02 Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems Expired - Fee Related DE102007001026B4 (de)

Priority Applications (6)

Application Number Priority Date Filing Date Title
DE102007001026A DE102007001026B4 (de) 2007-01-02 2007-01-02 Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems
EP07857885A EP2097793B1 (de) 2007-01-02 2007-12-19 Verfahren zur rechnergestützten steuerung und/oder regelung eines technischen systems
PCT/EP2007/064264 WO2008080863A1 (de) 2007-01-02 2007-12-19 Verfahren zur rechnergestützten steuerung und/oder regelung eines technischen systems
AT07857885T ATE514980T1 (de) 2007-01-02 2007-12-19 Verfahren zur rechnergestützten steuerung und/oder regelung eines technischen systems
US12/521,920 US8566264B2 (en) 2007-01-02 2007-12-19 Method for the computer-assisted control and/or regulation of a technical system
JP2009544386A JP5345551B2 (ja) 2007-01-02 2007-12-19 計算機支援による技術システムの開ループ制御および/または閉ループ制御のための方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102007001026A DE102007001026B4 (de) 2007-01-02 2007-01-02 Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems

Publications (2)

Publication Number Publication Date
DE102007001026A1 DE102007001026A1 (de) 2008-07-03
DE102007001026B4 true DE102007001026B4 (de) 2008-09-04

Family

ID=39156133

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102007001026A Expired - Fee Related DE102007001026B4 (de) 2007-01-02 2007-01-02 Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems

Country Status (6)

Country Link
US (1) US8566264B2 (de)
EP (1) EP2097793B1 (de)
JP (1) JP5345551B2 (de)
AT (1) ATE514980T1 (de)
DE (1) DE102007001026B4 (de)
WO (1) WO2008080863A1 (de)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011110404A1 (de) 2010-03-12 2011-09-15 Siemens Aktiengesellschaft Verfahren zur rechnergestützten steuerung und/oder regelung eines technischen systems
EP2608118A1 (de) 2011-12-21 2013-06-26 Siemens Aktiengesellschaft Verfahren für computerunterstützte Bestimmung der Verwendung von elektrischer Energie, die von einem Kraftwerk, insbesondere von einer erneuerbaren Energieerzeugungsanlage, erzeugt wird
US9043254B2 (en) 2010-04-12 2015-05-26 Siemens Aktiengesellschaft Method for computer-aided closed-loop and/or open-loop control of a technical system

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2246755A1 (de) * 2009-04-22 2010-11-03 Powitec Intelligent Technologies GmbH Regelkreis
EP2296062B1 (de) * 2009-09-09 2021-06-23 Siemens Aktiengesellschaft Verfahren zum rechnergestützten Lernen einer Steuerung und/oder Regelung eines technischen Systems
US8775341B1 (en) 2010-10-26 2014-07-08 Michael Lamport Commons Intelligent control with hierarchical stacked neural networks
US9015093B1 (en) 2010-10-26 2015-04-21 Michael Lamport Commons Intelligent control with hierarchical stacked neural networks
EP2649567B1 (de) 2010-12-10 2016-08-17 Siemens Aktiengesellschaft Verfahren zur rechnergestützten modellierung eines technischen systems
WO2012113635A1 (de) * 2011-02-24 2012-08-30 Siemens Aktiengesellschaft Verfahren zum rechnergestützten lernen eines rekurrenten neuronalen netzes zur modellierung eines dynamischen systems
WO2018019355A1 (de) * 2016-07-25 2018-02-01 Siemens Aktiengesellschaft Verfahren und vorrichtung zum rechnergestützten analysieren mindestens eines zweiten eingabevektors eines zielsystems
JP6612716B2 (ja) 2016-11-16 2019-11-27 株式会社東芝 パターン識別装置、パターン識別方法およびプログラム
US10803378B2 (en) 2017-03-15 2020-10-13 Samsung Electronics Co., Ltd System and method for designing efficient super resolution deep convolutional neural networks by cascade network training, cascade network trimming, and dilated convolutions
US11354577B2 (en) 2017-03-15 2022-06-07 Samsung Electronics Co., Ltd System and method for designing efficient super resolution deep convolutional neural networks by cascade network training, cascade network trimming, and dilated convolutions
WO2020034092A1 (zh) * 2018-08-14 2020-02-20 西门子股份公司 过程控制器及其方法和系统
CN110097175B (zh) * 2019-05-06 2020-04-17 广东石油化工学院 面向乙烯裂解炉管重管识别的嵌入式dcnn压缩方法
JP2021064222A (ja) * 2019-10-15 2021-04-22 富士通株式会社 方策改善方法、方策改善プログラム、および方策改善装置
DE102019128655B4 (de) 2019-10-23 2021-11-25 Technische Universität Ilmenau Verfahren zur Bereitstellung einer rechnergestützten Steuerung für ein technisches System
US11790489B2 (en) 2020-04-07 2023-10-17 Samsung Electronics Co., Ltd. Systems and method of training networks for real-world super resolution with unknown degradations

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5444819A (en) * 1992-06-08 1995-08-22 Mitsubishi Denki Kabushiki Kaisha Economic phenomenon predicting and analyzing system using neural network
EP1190383B1 (de) * 1999-05-18 2003-01-08 Siemens Aktiengesellschaft Verfahren zur rechnergestützten ermittlung einer zugehörigkeit einer vorgegebenen eingangsgrösse zu einem cluster
EP1145190B1 (de) * 1999-04-12 2003-06-25 Siemens Aktiengesellschaft Anordnung miteinander verbundener rechenelemente, verfahren zur rechnergestützten ermittlung einer dynamik, die einem dynamischen prozess zugrunde liegt und verfahren zum rechnergestützten trainieren einer anordnung miteinander verbundener rechenelemente
DE102004011426B3 (de) * 2004-03-09 2005-05-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung zum Erkennen einer in einem Sprachsignal enthaltenen Emotion und Verfahren zum Erkennen einer in einem Sprachsignal enthaltenen Emotion
DE102004011015A1 (de) * 2004-03-02 2005-09-15 Brose Fahrzeugteile Gmbh & Co. Kg, Coburg Verfahren zum Überwachen der Verstellbewegung eines von einer Antriebseinrichtung angetriebenen Bauteils

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108601A (ja) 1991-10-18 1993-04-30 Fujitsu Ltd ニユーラルネツトワーク学習装置
JPH08235145A (ja) 1995-02-24 1996-09-13 Toyota Motor Corp 応用問題に対して最適なニューラルネットワークの構造を決定する方法
US6134537A (en) * 1995-09-29 2000-10-17 Ai Ware, Inc. Visualization and self organization of multidimensional data through equalized orthogonal mapping
US5857321A (en) * 1996-06-11 1999-01-12 General Electric Company Controller with neural network for estimating gas turbine internal cycle parameters
US6493691B1 (en) * 1998-08-07 2002-12-10 Siemens Ag Assembly of interconnected computing elements, method for computer-assisted determination of a dynamics which is the base of a dynamic process, and method for computer-assisted training of an assembly of interconnected elements

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5444819A (en) * 1992-06-08 1995-08-22 Mitsubishi Denki Kabushiki Kaisha Economic phenomenon predicting and analyzing system using neural network
EP1145190B1 (de) * 1999-04-12 2003-06-25 Siemens Aktiengesellschaft Anordnung miteinander verbundener rechenelemente, verfahren zur rechnergestützten ermittlung einer dynamik, die einem dynamischen prozess zugrunde liegt und verfahren zum rechnergestützten trainieren einer anordnung miteinander verbundener rechenelemente
EP1190383B1 (de) * 1999-05-18 2003-01-08 Siemens Aktiengesellschaft Verfahren zur rechnergestützten ermittlung einer zugehörigkeit einer vorgegebenen eingangsgrösse zu einem cluster
DE102004011015A1 (de) * 2004-03-02 2005-09-15 Brose Fahrzeugteile Gmbh & Co. Kg, Coburg Verfahren zum Überwachen der Verstellbewegung eines von einer Antriebseinrichtung angetriebenen Bauteils
DE102004011426B3 (de) * 2004-03-09 2005-05-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung zum Erkennen einer in einem Sprachsignal enthaltenen Emotion und Verfahren zum Erkennen einer in einem Sprachsignal enthaltenen Emotion

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
D.E. Rumelhart, G.E. Hinton, and R.J. Williams: "Learning internal representations by error propagation", in Parallel Distributed Processing: Explorations in The Microstructure of Cognition, D.E. Rumelhart and J.L.M. et.al., Eds. Cambridge: MIT Press, 1986, Vol.1, pp. 318-362 *
Leslie Pack Kaelbling, Michael L. Littman, Andrew W. Moore, Reinforcement Learning: A Survey, Journal of Artificial Intelligence Research 4 (1996) pp. 237-285 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011110404A1 (de) 2010-03-12 2011-09-15 Siemens Aktiengesellschaft Verfahren zur rechnergestützten steuerung und/oder regelung eines technischen systems
DE102010011221A1 (de) 2010-03-12 2011-09-15 Siemens Aktiengesellschaft Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems
DE102010011221B4 (de) * 2010-03-12 2013-11-14 Siemens Aktiengesellschaft Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems
US9043254B2 (en) 2010-04-12 2015-05-26 Siemens Aktiengesellschaft Method for computer-aided closed-loop and/or open-loop control of a technical system
EP2608118A1 (de) 2011-12-21 2013-06-26 Siemens Aktiengesellschaft Verfahren für computerunterstützte Bestimmung der Verwendung von elektrischer Energie, die von einem Kraftwerk, insbesondere von einer erneuerbaren Energieerzeugungsanlage, erzeugt wird
WO2013092702A1 (en) 2011-12-21 2013-06-27 Siemens Aktiengesellschaft A method for computer-assisted determination of the usage of electrical energy produced by a power generation plant, particularly a renewable power generation plant
US10352973B2 (en) 2011-12-21 2019-07-16 Siemens Aktiengesellschaft Method of computer-assisted determination of the usage of electrical energy produced by a power generation plant, particularly a renewable power generation plant

Also Published As

Publication number Publication date
EP2097793A1 (de) 2009-09-09
JP5345551B2 (ja) 2013-11-20
EP2097793B1 (de) 2011-06-29
US8566264B2 (en) 2013-10-22
DE102007001026A1 (de) 2008-07-03
US20100049339A1 (en) 2010-02-25
JP2010515181A (ja) 2010-05-06
ATE514980T1 (de) 2011-07-15
WO2008080863A1 (de) 2008-07-10

Similar Documents

Publication Publication Date Title
DE102007001026B4 (de) Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems
EP2108139B1 (de) Verfahren zur rechnergestützten regelung und/oder steuerung eines technischen systems, insbesondere einer gasturbine
EP2106576B1 (de) Verfahren zur rechnergestützten steuerung und/oder regelung eines technischen systems
EP2112568B1 (de) Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems
DE102007017259B4 (de) Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems
DE102007042440B3 (de) Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems
DE102010011221B4 (de) Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems
EP3132317B1 (de) Verfahren zur rechnergestützten anlagensteuerungsoptimierung mittels einem simulationsmodul
EP2649567B1 (de) Verfahren zur rechnergestützten modellierung eines technischen systems
AT512251B1 (de) Verfahren zum Entwerfen eines nichtlinearen Reglers für nichtlineare Prozesse
EP2999998B1 (de) Methode zur ermittlung eines modells einer ausgangsgrösse eines technischen systems
EP2422246B1 (de) Regelsystem
EP1327959B1 (de) Neuronales Netz zur Modellierung eines physikalischen Systems sowie Verfahren zur Bildung eines solchen neuronalen Netzes
DE102011076969B4 (de) Verfahren zum rechnergestützten Lernen einer Regelung und/oder Steuerung eines technischen Systems
EP1183575A1 (de) Verfahren, anordnung und computerprogramm zum entwurf eines technischen systems
EP0827602A1 (de) Anordnung zur modellierung eines dynamischen prozesses
DE102022112606B3 (de) Computerimplementiertes Verfahren zur Kalibrierung eines technischen Systems
DE102020201181A1 (de) Verfahren und Vorrichtung zum Durchführen eines Vermessungsverfahrens zur datenbasierten Beschreibung eines Systemverhaltens eines technischen Systems
DE102004002142A1 (de) Verfahren und Computerprogramm zum Generieren eines Modells für das Verhalten einer Steuereinrichtung

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8364 No opposition during term of opposition
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee

Effective date: 20140801