EP3449433A1

EP3449433A1 - Modellbasierte ermittlung eines systemzustandes mittels eines dynamischen systems

Info

Publication number: EP3449433A1
Application number: EP17728082.3A
Authority: EP
Inventors: Kai Heesche; Stefanie VOGL; Hans-Georg Zimmermann
Original assignee: Siemens AG
Current assignee: Siemens AG
Priority date: 2016-06-02
Filing date: 2017-05-22
Publication date: 2019-03-06
Also published as: DE102016209721A1; KR20190015415A; WO2017207317A1; US20200320378A1

Abstract

Die Erfindung betrifft ein Verfahren zur modellbasierten Ermittlung eines Systemzustandes eines dynamischen Systems mittels eines Modells, wobei als Modell des dynamischen Systems ein rekurrentes neuronales Netz bereitgestellt wird, wobei dem Modell eine Zeitreihe aus potentiell erfassbaren Messwerten, umfassend erfassten und fehlenden Messwerten, als Eingangsgröße bereitgestellt wird, - wobei aus dem Modell mindestens ein zu einem Zeitpunkt zugehöriger Systemzustand generiert wird, aus welchem mindestens ein zu dem jeweiligen Zeitpunkt zugehöriger Zielwert ermittelbar ist; - wobei zeitlich aufeinanderfolgende Systemzustände durch einen jeweiligen Zustandsübergang ineinander überführt werden; - wobei eine Korrektur mindestens eines Systemzustandes auf Basis der Zeitreihe mithilfe des Zustandsüberganges vorgenommen wird; dadurch gekennzeichnet, dass die Korrektur unbeeinflusst von den fehlenden Messwerten der Zeitreihe vorgenommen wird. Die Korrektur wird dabei vorgenommen, falls ein Wert innerhalb des Observablenvektors auch tatsächlich gemessen wurde oder vorliegt. Liegt dagegen eine Lücke in der Zeitreihe vor, beispielsweise für einige oder mehrere Einträge eines oder mehrerer Observablenvektoren zu verschiedenen Zeitpunkten, so werden diese bei der Korrektur nicht berücksichtigt. Spärlich oder lückenhaft besetzte Zeitreihen können somit zur verbesserten Modellierung in rekurrenten neuronalen Netzen auf vorteilhafte Weise eingesetzt werden.

Description

Beschreibung

Modellbasierte Ermittlung eines Systemzustandes mittels eines dynamischen Systems

Physikalische Systeme mit zeitlicher Dynamik können mit ma^¬ thematischen Modellen beschrieben werden. Observablen können bei physikalischen Systemen beobachtet werden. Es kann sich um Vektoren handeln, die eine Vielzahl von einzelnen

Observablenwerten zur Beschreibung eines Systemzustandes aufweisen. Observablen können mittels eines Modells ferner für bestimmte Zeitpunkte aus Systemzuständen oder Systemzustands- vektoren modelliert werden und somit ein physikalisches Sys^¬ tem zu diesem Zeitpunkt beschreiben. Der Zeitpunkt kann dabei in der Zukunft liegen, so dass Observablen prognostiziert werden können. Zur Zeitreihenanalyse oder zur Prognose von beobachtbaren Zeitreihen werden mathematische Modelle genutzt, welche auf Grundlage von historischen Daten einem Sys^¬ tem zugrundeliegende funktionale, lineare oder nicht-lineare, Eingabe-Ausgabebeziehungen ableiten. Beispielsweise werden Regressionsmodelle oder sogenannte Autoregressive-Moving Average-Modelle oder kurz ARMA-Modelle, oder Autoregressive- integrated-Moving-Average- oder ARIMA-Modelle oder Seasonal ARIMA-, kurz SARIMA-Modelle oder neuronale Netze eingesetzt. Im Umfeld der Modellierung physikalischer Systeme oder physikalischer Prozesse stammen die Zeitreihen der Input- und Zielgrößen meist aus Sensormessungen. Bei Modellen, welche die zeitliche Dynamik des zugrundeliegenden Systems erfassen und abbilden, insbesondere rekurrenten neuronalen Netzen, werden die Daten als Zeitreihe verarbeitet. Das heißt, dass Vektoren von Größen, welche das System zu unterschiedlichen, aufeinanderfolgenden Zeitpunkten beschreiben, vollständig vorliegen müssen, damit die gesamte Zeitreihe verarbeitet werden kann. Das Entfernen einzelner fehlender Zeitstempel ist nicht möglich, ohne die Modellgüte negativ zu beeinflus^¬ sen. Insbesondere wird ein Systemzustand modelliert, der durch Lücken in der Zeitreihe verfälscht ist. Es ist bekannt, Lücken in den Zeitreihen mithilfe von vorgeschalteten Algorithmen künstlich aufzufüllen und die Daten danach zur Modellierung zu verwenden. In einem besonders einfachen Fall wird bei kurzen Lücken der letzte bekannte Mess- wert solange festgehalten, bis eine neue gültige Messung vor^¬ liegt. Liegen insgesamt nur sehr wenige Lücken in einer Zeit^¬ reihe vor, so können Trainingsmuster, die Lücken enthalten, aus dem Trainingsdatensatz entfernt werden, da dies nur einen kleinen Teil der Daten betrifft. Lücken werden mit Einträgen wie beispielsweise NaN aufgefüllt. Trainingsdaten, die diese NaN-Vermerke enthalten, werden nicht zum Training benutzt. Sind dies nur wenige, so wird die Trainingsmenge nicht signi^¬ fikant reduziert Ferner ist es bekannt, verschiedene Inter- oder Extrapolationsverfahren wie z. B. lineare oder nicht- lineare Interpolation, trigonometrische Interpolation oder auf Spline-Funktionen basierende Interpolationen vorzunehmen. Zusätzlich zu den beschriebenen Verfahren, die auf Ableitung analytischer Näherungsfunktionen beruhen, werden häufig auch statistische Methoden eingesetzt, bei denen die Verteilungs- funktionen der Messwerte zugrundegelegt werden.

Vor diesem Hintergrund ist es eine Aufgabe der vorliegenden Erfindung, ein Verfahren sowie ein Computerprogramm-Produkt mit Computerprogramm zur Ausführung des Verfahrens bereitzu- stellen, welche ein verbessertes Ermitteln eines Systemzu^¬ standes ermöglichen. Diese Aufgabe wird durch die angegebenen unabhängigen Ansprüche gelöst. Vorteilhafte Ausgestaltungen sind in den abhängigen Ansprüchen angegeben. Die Erfindung betrifft ein Verfahren zur modellbasierten Ermittlung eines Systemzustandes eines dynamischen Systems mit^¬ tels eines Modells, wobei als Modell des dynamischen Systems ein rekurrentes neuronales Netz bereitgestellt wird, wobei dem Modell eine Zeitreihe aus potentiell erfassbaren Messwer- ten, umfassend erfassten und fehlenden Messwerten, als Eingangsgröße bereitgestellt wird,

- wobei aus dem Modell mindestens ein zu einem Zeitpunkt zu^¬ gehöriger Systemzustand generiert wird, aus welchem mindes- tens ein zu dem jeweiligen Zeitpunkt zugehöriger Zielwert ermittelbar ist;

- wobei zeitlich aufeinanderfolgende Systemzustände durch ei^¬ nen jeweiligen Zustandsübergang ineinander überführt werden; - wobei eine Korrektur mindestens eines Systemzustandes auf Basis der Zeitreihe mithilfe des Zustandsüberganges vorgenom^¬ men wird;

dadurch gekennzeichnet, dass die Korrektur unbeeinflusst von den fehlenden Messwerten der Zeitreihe vorgenommen wird.

Zeitabhängige Systeme lassen sich besonders vorteilhaft durch rekurrente neuronale Netze beschreiben. Da die Eingangsgrößen für die Vorhersage zukünftiger Zeitschritte nicht zur Verfü^¬ gung stehen, werden in sogenannten Historically Consistent Neural Networks oder historisch konsistenten neuronalen Netzen die Eingangs- und Ausgangsgrößen durch sogenannte Obser- vable, d.h. beobachtbare Größen, ersetzt. Observable können für Zeitpunkte bis zur Gegenwart durch Messungen erfasst wer^¬ den und können für beliebige Zeitpunkte aus einem sogenannten Systemzustand oder State Vector als Zielgrößen abgeleitet werden. Ein Systemzustand beruht auf Observablen als be^¬ obachtbare Größen und zusätzlich verdeckten Zustandsgrößen oder sogenannten Hidden States. Die Modellierung lässt sich verfeinern, indem für Observable von Systemzuständen in der Vergangenheit die aufgrund des Ob- servablen-Anteils im Systemzustand erwarteten Zielwerte durch tatsächlich erfasste Observablen ersetzt werden. Es handelt sich dabei um ein Verfahren auf Basis eines sogenannten

Architectural Teacher Forcing oder kurz ATF für historisch konsistente neuronale Netze.

Das Anwenden eines weiterentwickelten ATFs im Sinne des Gegenstandes des unabhängigen Anspruchs bedeutet, dass beim Zu- Standsübergang von einem Zustandsvektor zu einem ersten Zeitpunkt t-1 zu einem Zustandsvektor eines darauffolgenden Zeitpunktes t eine Korrektur vorgenommen wird, welche berücksichtigt, dass ein zum Zeitpunkt t-1 modellierter Wert möglicher- weise durch eine zum Zeitpunkt t-1 vorgenommene Messung nicht bestätigt wird, sondern es eine Abweichung zwischen Prognose und realer Messung gibt. Diese Abweichung des tatsächlich beobachteten Wertes vom prognostizierten Zielwert oder model- Herten Zielwert wird zur Ermittlung des Zustandsvektors , der das System zum Zeitpunkt t beschreibt, berücksichtigt. Somit wird die Prognose oder Ableitung eines modellbasierten Zielwertes verbessert. Insbesondere wird die Vorhersage des zum Zeitpunkt t zugehörigen Zielgrößenvektors, der aus dem zuge- hörigen Zustandsvektor ableitbar ist, verbessert. Der Zielgrößenvektor umfasst in der Regel mehrere Zielwerte, die be^¬ obachtbare Größen darstellen.

Die Korrektur wird dabei vorgenommen, falls ein Wert inner- halb des Observablenvektors auch tatsächlich gemessen wurde oder vorliegt. Liegt dagegen eine Lücke in der Zeitreihe vor, beispielsweise für einige oder mehrere Einträge eines oder mehrerer Observablenvektoren zu verschiedenen Zeitpunkten, so werden diese bei der Korrektur nicht berücksichtigt. Vorteil- hafterweise wird die Korrektur nur in dem Fall vorgenommen, in dem ein Wert innerhalb des Observablenvektors auch tat^¬ sächlich gemessen wurde oder vorliegt. Insbesondere wird kein durch einen Algorithmus aufgrund der Zeitreihe festgesetzter Wert für die Korrektur verwendet, welcher nicht tatsächlich am System gemessen wurde. In Zeitschritten mit fehlenden

Messwerten bleibt der Zustandsvektor unverändert, d.h. die Zielwerte der Observablen für einen jeweiligen nachfolgenden Zeitschritt werden aus dem internen Zustand des Modells abge^¬ leitet. Eine Korrektur bleibt somit für Einträge oder Obser- vablen eines Systemzustandes aus oder wird nicht vorgenommen, wenn für die entsprechende Observable im vorausgegangenen Zu^¬ stand kein Messwert vorliegt. In diesem Fall erfolgt eine reine interne Ableitung eines modellierten Zielwertes aus dem Zustand des Modells ohne Berücksichtigung der historischen Messdaten. Die Korrektur wird somit durch fehlende Messwerte unverfälscht vorgenommen. Auf vorteilhafte Weise werden zugrundeliegende dynamische Prozesse nicht dadurch verfälscht, dass Inter- oder Extrapo^¬ lationsverfahren zur Ergänzung fehlender Werte in einer Zeitreihe angewandt werden. Insbesondere bei spärlich besetzten Messwertreihen, bei welchen ein hoher Anteil an Messwerten fehlt, verfälschen die Abschätzverfahren unter anderem die statistischen Eigenschaften der Zeitreihen, wie beispielsweise Mittelwert oder Varianz, was sich negativ auf die nachfol^¬ gende Modellbildung auswirkt. Somit ist die Güte von Vorher- sagen der abgeleiteten Modelle aufgrund der beschriebenen Erfindung erheblich verbessert. Das vorgeschlagene Verfahren zur Erweiterung eines Historically Consistent Neural Network- Modells ermöglicht es, auf die Vorverarbeitung von Messdaten komplett zu verzichten und Lücken in den Daten der Zeitreihe vom Modell selbst ergänzen zu lassen. So können auch spärlich besetzte Zeitreihen konsistent verarbeitet und damit eine ebenfalls konsistente Modellierung der gesamten zugrundelie^¬ genden Dynamik des Systems erreicht werden. Ferner ist kein Expertenwissen nötig, um manuell eine passende Interpolati- onsmethode zu wählen. Je nach fehlender Observablen müsste herkömmlicherweise ein passendes Modell gewählt werden, so^¬ dass eine Automatisierung des Korrekturverfahrens mit ver^¬ tretbarem Aufwand bislang nicht möglich war. Bei einer fehlerhaften oder unpassenden Abschätzung eines

Wertes zum Auffüllen einer Lücke in den Observablen, wie es herkömmlicherweise durchgeführt wird, setzt sich dieser Feh^¬ ler für Vorhersagen immer weiter fort. Durch das vorgeschlagene Ausblenden einzelner fehlender Werte innerhalb des

Observablenvektors ist ein derartiges Verfälschen mit der da^¬ mit einhergehenden Fortpflanzung eines Fehlers ausgeschlos^¬ sen .

Gemäß einer Ausgestaltung wird die Korrektur unbeeinflusst durch die fehlenden Messwerte der Zeitreihe vorgenommen, indem ein je Zeitpunkt der Zeitreihe vorliegender Observablen- vektor mit einem Vektor multipliziert wird und dieser Vektor derart aus O-Einträgen aufgebaut ist, dass die fehlenden Messwerte im Observablenvektor durch die O-Einträge nicht in die Korrektur des Systemzustandes eingehen. Es ist demnach ein Indexvektor vorgesehen, welcher durch O-Einträge beim Multiplizieren diejenigen Werte im Observablenvektor für die Korrektur ausklammert oder vernachlässigt, welche zum vorhe^¬ rigen Zeitschritt nicht gemessen wurden, d.h. für welche beispielsweise eine Messung eines Sensors keinen oder keinen gültigen oder keinen verarbeitbaren Messwert geliefert hat. Gemäß einer Ausgestaltung wird die Korrektur unbeeinflusst durch die fehlenden Messwerte der Zeitreihe vorgenommen, indem ein je Zeitpunkt der Zeitreihe vorliegender

Observablenvektor mit einem Vektor multipliziert wird, und dieser Vektor derart aus 1-Einträgen aufgebaut ist, dass die erfassten Messwerte im Observablenvektor durch die 1-Einträge in die Korrektur des Systemzustandes eingehen. Der Indexvektor ist insbesondere in der Lage, durch 1-Einträge einige oder alle diejenigen Werte im Observablenvektor für die Korrektur zu berücksichtigen, welche zum vorherigen Zeitschritt tatsächlich gemessen wurden, d.h. für welche beispielsweise eine Messung eines Sensors einen gültigen oder verarbeitbaren Messwert geliefert hat. Für die tatsächlich gemessenen Mess^¬ werte wird beispielsweise ein Architectural Teacher Forcing nach bekannten Methoden durchgeführt, sodass ein Zustandsvek- tor des Systemzustandes zu einem bestimmten Zeitpunkt durch den Observablenvektor der beobachteten Zeitreihe zum vorhergehenden Zeitpunkt korrigiert wird. Dabei ist es wesentlich, dass der 1-Eintrag kein O-Eintrag ist. Eine Ausweitung auf von einem 1-Eintrag abweichende Einträge ist denkbar, solange es sich nicht um O-Einträge handelt.

Gemäß einer Ausgestaltung werden die fehlenden Messwerte der Zeitreihe nicht durch einen Algorithmus ergänzt oder abge^¬ schätzt. Insbesondere liegen als Eingangsgrößen dem Obser- vablenvektor lediglich die Messwerte in unveränderter Form vor . Gemäß einer Ausgestaltung wird aus einem Systemzustand für einen zu einem fixierten Zeitpunkt zukünftigen Zeitpunkt ein zugehöriger zukünftiger modellbasierter Wert ermittelt. Somit kann das Verfahren insbesondere vorteilhaft für die Prognose von Observablen verwendet werden.

Gemäß einer Ausgestaltung gehen eine Vielzahl von Observab- lenvektoren der Zeitreihe zu vergangenen Zeitpunkten in die Korrektur eines zu einem auf einen jeweiligen vergangenen Zeitpunkt folgenden Zeitpunkt zugehörigen Zustandsvektors ein. Da jedes ATF je Zeitpunkt den jeweiligen folgenden Systemzustand optimiert, ist eine Prognose zukünftiger Werte be^¬ sonders vielversprechend, wenn möglichst viele historische Werte in das ATF eingehen. Für eine Vielzahl von zu vergange- nen Zeitpunkten zugehörigen Zustandsvektoren können die jeweiligen vorherigen Observablenvektoren eingehen.

Gemäß einer Weiterbildung wird die Korrektur in einer Anlernphase des dynamischen Systems oder in einer Betriebsphase vorgenommen. Somit kann das Verfahren auf vorteilhafte Weise sowohl zum Verbessern der Modellierung als auch zur Verbesserung einer Prognose verwendet werden. Die Modellierung von Observablen zu einer Vielzahl von Zeitpunkten in der Vergangenheit und der Abgleich mit zu den jeweiligen Zeitpunkten tatsächlich gemessenen Observablen kann einerseits vorteilhaft genutzt werden, um ein HCNN anzulernen. Ebenso kann in einer Betriebsphase das ATF für eine Vielzahl von Systemzu^¬ ständen vergangener Zeitpunkte durchgeführt werden, um die Vorhersage eines zukünftigen Observablenvektors zu optimie- ren.

Gemäß einer Ausgestaltung wird der Zustandsübergang durch Anwenden einer nicht-linearen Aktivierungsfunktion und einer linearen Funktion ausgeführt. Insbesondere kommen Funktionen wie der Tangens Hyperbolicus und lineare Algebra zum Einsatz. Die Zustandsvektoren, welche in die Funktionen des Zustands- übergangs eingehen, sind insbesondere bereits durch die Kor^¬ rektur bereinigt. Gemäß einer Ausgestaltung ist der Systemzustand als Zustands- vektor aus Observablen und verdeckten Zuständen ausgestaltet. Lediglich für die Observablen kann die Korrektur vorgenommen werden, die verdeckten Zustände beschreiben nichtbeobachtbare Größen und sind nicht durch Messungen

optimierbar .

Gemäß einer Ausgestaltung wird beim Zustandsübergang ein Differenzvektor auf die Observablen des Zustandsvektors zum zu^¬ gehörigen Zeitpunkt angewendet, wobei der Differenzvektor ei^¬ nen Unterschied zwischen den Observablen und bekannten Observablen eines zugehörigen Observablenvektors der Zeitreihe be^¬ schreibt. Es handelt sich dabei beispielsweise um ein gängi^¬ ges Architectural Teacher Forcing-Verfahren, bei welchem die modellierten Werte durch tatsächlich gemessene Werte aus historischen Zeitreihen ersetzt werden.

Gemäß einer Ausgestaltung wird ein aus einem Systemzustand erzeugter Wert, insbesondere ein prognostizierter zukünftiger Wert, zur Steuerung einer technischen Anlage an eine Steuerungseinheit der technischen Anlage übermittelt oder zur Op^¬ timierung des Modells für die Korrektur verwendet.

Die Erfindung betrifft ferner ein Computerprogrammprodukt mit einem Computerprogramm, das Mittel zur Durchführung des Verfahrens nach einem der vorhergehenden Ansprüche aufweist, wenn das Computerprogramm auf einer programmgesteuerten Einrichtung zur Ausführung gebracht wird. Ein Computerprogrammprodukt, wie z.B. ein Computerprogramm-Mittel, kann bei^¬ spielsweise als Speichermedium, wie z.B. Speicherkarte, USB- Stick, CD-ROM, DVD, oder auch in Form einer herunterladbaren Datei von einem Server in einem Netzwerk bereitgestellt oder geliefert werden. Dies kann zum Beispiel in einem drahtlosen Kommunikationsnetzwerk durch die Übertragung einer entsprechenden Datei mit dem Computerprogrammprodukt oder dem Compu^¬ terprogramm-Mittel erfolgen. Als programmgesteuerte Einrich^¬ tung kommt insbesondere eine Steuereinrichtung, wie zum Bei- spiel ein Mikroprozessor für eine Smartcard oder dergleichen in Frage .

Die Erfindung wird nachfolgend anhand von Ausführungsbeispie- len mithilfe der Figuren näher erläutert. Es zeigen:

Figur 1 eine schematische Darstellung eines bekannten

rekurrenten neuronalen Netzes zur Modellierung eines dynamischen Systems mit einem Architectural Teacher Forcing-Korrekturverfahren;

Figur 2 eine schematische Darstellung eines rekurrenten

neuronalen Netzes zur Modellierung eines dynamischen Systems mit Architectural Teacher Forcing ba- siertem Korrekturverfahren gemäß einem Ausführungsbeispiel der Erfindung.

In den Figuren sind funktionsgleiche Elemente mit denselben Bezugszeichen versehen, sofern nichts anderes angegeben ist.

Rekurrente neuronale Netze zur Modellierung eines zeitlichen Verhaltens eines dynamischen Systems umfassen in der Regel mehrere Schichten, welche eine Mehrzahl von Neuronen beinhalten und in geeigneter Weise basierend auf Trainingsdaten aus bekannten Zuständen des dynamischen Systems derart gelernt werden können, dass zukünftige Zustände des dynamischen Sys^¬ tems prädiziert werden können. In den nachfolgend beschriebe^¬ nen Figuren sind entsprechende Neuronencluster, welche Zu- standsvektoren oder Observablenvektoren oder Differenzvekto- ren modellieren, durch Kreise wiedergegeben.

Mit Hilfe von rekurrenten neuronalen Netzen werden beispiels weise im Umfeld erneuerbarer Energien Schwankungen in der Stromerzeugung, insbesondere bei Windkraftanlagen, abgeschätzt. Dafür werden Umwelteinflüsse modelliert und auf Grundlage eines auf Basis von Trainingsdaten angelernten Modells werden Observablen wie Temperatur, Windstärke, Wind- richtung, Druck, usw. genutzt und ermittelt, um daraus Rück^¬ schlüsse auf die Stromerzeugung ziehen zu können.

Ebenso können rekurrente neuronale Netze zur rechnergestütz- ten Vorhersage von Strompreisen oder Energiebedarf oder von Rohstoffpreisen genutzt werden.

In Figur 1 ist schematisch eine konventionelle Netzwerktopo- logie abgebildet, welche zur Modellierung eines dynamischen Systems dient. Es handelt sich um ein Historically Consistent Neuronal Network, bei welchem Zustandsvektoren s^, Sj-^, St__j_ , s_t, s_t+]_, s_t+2 , auch State Vectors genannt, zu Zeitpunkten t-3, t-

2, t-1, t, t+1 und t+2 verwendet werden, um zu den jeweiligen Zeitpunkten zugehörige Zielgrößenvektoren y^, Yt-2 ' Yt-1 ' Yt ' Yt+1 ' Yt+2 bestehend aus beobachtbaren Größen oder Observablen und versteckten Zustandsgrößen über eine Multiplikation mit einer Matrix B abzuleiten. Über die Matrix B werden die Zielgrößen Yt-3 ' Yt-2 ' Yt-1 ' Yt ' Yt+1 ^und Yt+2 jeweils aus den internen Zu^¬ standsvektoren SJ-.3 , Sj-,2 , ^st-l ' ^st' ^st+l ^unc^ ^st+2 durch eine li- near Transformation abgeleitet. Die Modellierung wird durch ein sogenanntes Architectural Teacher Forcing, kurz ATF, verfeinert, indem potentiell beobachtbare oder messbare

Observablenvektoren u^, u^, ^u' welche mehrere Obser^¬ vablen je Vektor umfassen können, beim Zustandsübergang von einem Zustandsvektor zum zeitlich darauf folgenden Zustands- vektor berücksichtigt werden. Die Werte der Observablen u^ gehen beispielsweise in die Ermittlung des Zustandsvektors S_j-,

2 aus dem Zustandsvektor ein. Dafür werden alle Einträge des Observablenvektors u_j-,3 verwendet. Existieren nicht für alle Einträge oder Zeilen des Observablenvektors Messwerte, so werden Werte geschätzt, damit eine vollständige Zeitreihe aus Observablenvektoren eingeht.

Für das ATF wird eine Output-Schicht auf einen festen Wert von 0 gesetzt, in der Figur durch den Kreis tar=0 oder target gleich 0 veranschaulicht. Die tatsächlich beobachteten Werte im Vektor werden negativ zur Ausgangsschicht hinzugefügt, veranschaulicht in Figur 1 durch -Id. Aus dem Zustandsvektor S_j-,3 werden zugleich über die Matrix [id 0] die potentiell be^¬ obachtbaren Observablen aus dem Zustandsvektor gefiltert.

Es handelt sich bei [id 0] um die Identitätsmatrix mit 0- Einträgen zum Entfernen der versteckten Observablen aus dem State Vector. Die beobachtbaren Zustände werden positiv zur Output-Schicht hinzugefügt. Somit kann der Differenzvektor zwischen den modellierten Observablen und den tatsächlich beobachteten Observablen gebildet werden. Dieser Differenzvektor geht negativ in den Zustandsübergang ein. Vom Zustands- vektor werden die Observableneinträge des Zustandsvektors

St_3 durch die tatsächlich beobachteten Observableneinträge korrigiert, da durch Anwenden der Matrix der Differenzvektor, mit entsprechenden O-Einträgen für die verdeckten Zustände, vom State Vector subtrahiert wird. Die versteckten Zustände bleiben durch die O-Einträge unverändert.

Es wird dann wie üblich eine nicht-lineare Aktivierungsfunktion angewendet, z.B. eine Tangens Hyperbolicus-Funktion, in Figur 1 veranschaulicht durch einen Kreis mit darin befindli- ehern tanh, sowie mit linearen Anteilen, veranschaulicht durch eine Gewichtsmatrix A, um im Modell zum darauffolgenden Zustandsvektor s^ zu gelangen.

Dieses Vorgehen wird analog für alle Zustandsvektoren wieder- holt, zu welchen Observablenvektoren aus der Historie vorliegen. Durch die derart bis zur Gegenwart hin verbesserte Qua^¬ lität der Zustandsvektoren und der damit verbundenen verbesserten Qualität der modellierten Observablenwerte verbessert sich insbesondere die Qualität prognostizierter

Observablenwerte, beispielsweise die Qualität der Vektoren Yt+1' Yt+2 ^unc^ der entsprechenden Observablenwerte.

Zur Erläuterung der Anlernphase des beispielhaft beschriebe^¬ nen rekurrenten neuronalen Netzes sei darauf verwiesen, dass als initialer Zustand ein Biasvektor S_Q vorgegeben wird, wel^¬ cher in einer Anlernphase des neuronalen Netzes zusammen mit der Gewichtsmatrizen A und B gelernt wird. Bei der Modellie- rung des dynamischen Verhaltens eines technischen Systems, welches durch eine Anzahl von Observablen und durch verdeckte Zustände beschrieben ist, werden beim Lernen des Netzes nicht alle Trainingsdaten auf einmal berücksichtigt, sondern das Lernen beruht auf einem Ausschnitt der Netzstruktur für eine Anzahl von aufeinander folgenden Zustandsvektoren, für welche bekannte Observablenvektoren aus Trainingsdaten vorliegen. Das Netz wird somit in Zeitfenstern gelernt, welche verschie^¬ dene Ausschnitte aus aufeinander folgenden

Observablenvektoren der Trainingsdaten repräsentieren. Für

Fälle, in welchen kein initialer Zustand existiert, wird bei^¬ spielsweise ein intialer verrauschter Zustand verwendet, wel^¬ cher nicht in der Anlernphase gelernt wird, sondern als Unsi^¬ cherheit akzeptiert wird.

In Figur 2 ist dargestellt, wie das Architectural Teacher Forcing aus Figur 1 modifiziert wird, um eine verbesserte Mo^¬ dellierung bei spärlich besetzten Zeitreihen zu erreichen. Wie beim bekannten Architectural Teacher Forcing wird ausge- hend von den Observableneinträgen des Zustandsvektors zu einem bestimmten Zeitpunkt t-3 und von dem zu diesem Zeitpunkt beobachteten tatsächlichen Observablenvektor ^-ⁿ Diffe^¬ renzvektor gebildet. Es ist überdies ein Indexvektor

vorgesehen, welcher 1-Einträge enthält, falls in dem entspre- chenden Eintrag des Observablenvektors u^ tatsächlich Mess^¬ werte vorhanden sind, und welcher O-Einträge enthält, falls dem entsprechenden Eintrag des Observablenvektors der Mess^¬ wert fehlt. Durch Multiplikation des Differenzvektors mit dem Indexvektor - in der Figur 2 veranschaulicht durch einen Kreis mit darin befindlichem x - werden nur diejenigen Observablen des darauffolgenden Systemzustandes s^2 korrigiert, für welche im Observablenvektor u^ tatsächliche Messwerte verfügbar sind. Der durch die Multiplikation mit dem Indexvektor Ct_3 gefilterte Differenzvektor weist nur noch Korrek- turen für die Einträge auf, zu welchen beobachtete Messwerte vorliegen. Durch Anwenden der Matrix auf den gefilterten Differenzvektor kann der Systemzustand im Hinblick auf die Observablen korrigiert werden. Es wird wiederum die Aktivierungsfunktion umfassend eine Tangens Hyperbolicus- Funktion sowie eine Multiplikation mit Matrix A angewendet, um zum Zustandsvektor s^ des darauffolgenden Zeitpunkts t-2 zu gelangen.

Zu jedem der Zeitpunkte, zu denen Messwerte tatsächlich er- fasst wurden, welche für das Korrekturverfahren verwendet werden können, wird die beschriebene Anpassung bei der Er- Stellung der Zustandsvektoren zur verbesserten Modellierung des Systems angewendet. Tatsächlich erfasste Messwerte zeich^¬ nen sich beispielsweise dadurch in der Erscheinung des

Observablenvektors aus, dass zu einem von einem Sensor gelie^¬ ferten Messwert zusätzlich ein Qualitätseigenschaftswert vor- liegt. Fehlende Einträge sind so beispielsweise anhand eines Eintrages „not available" o.ä. erkennbar. Im einfachsten Fall kann der Messwert auch nur einen ungültigen Wert (NaN, „Not a Number") enthalten. Der Indexvektor wird beispielsweise für jeden Zeitpunkt nach Erfassung der Messwerte automatisch an- gepasst, sodass die 0- und 1-Einträge passend vorliegen.

Auch für einen besonders kleinen Anteil an erfassten Messwerten an der Gesamtmenge der erfassbaren Messwerte je

Observablenvektor oder bei über den Zeitbereich der Messungen hinweg betrachteten besonders lückenhaftem Vorliegen von

Messwerten können die wenigen verfügbaren Messwerte auf vorteilhafte Weise zur Verbesserung der Modellierung berücksichtigt werden. Beispielsweise liegt nur zu den Zeitpunkten t-3 und t-1 ein Messwert für einen Temperaturverlauf vor. Außer- dem liegt zum Zeitpunkt t-3 lediglich der Messwert zum Tempe^¬ raturverlauf vor und die übrigen potentiell erfassbaren Mess^¬ werte, wie beispielsweise Druck oder Windstärke usw., liegen zu diesem Zeitpunkt nicht vor. Zu den übrigen Zeitpunkten t- 2, t-1 und t liegen beispielsweise die übrigen Messwerte wie Druck, Windstärke usw. vollständig vor. Es ist auf vorteil^¬ hafte Weise eine Interpolation von Tempertaturwerten für den dazwischenliegenden Zustand oder Messwert zum Zeitpunkt t-2 nicht nötig. Ebenso ist eine Interpolation der Druck- oder Windstärke-Messwerte zum Zeitpunkt t-3 nicht nötig und es kann dennoch der vorhandene Messwert der Temperatur zum Zeitpunkt t-3 auf vorteilhafte Weise eingesetzt werden. Spärlich oder lückenhaft besetzte Zeitreihen können somit zur verbes- serten Modellierung in rekurrenten neuronalen Netzen auf vorteilhafte Weise eingesetzt werden.

Obwohl die Erfindung im Detail durch die Ausführungsbeispiele näher illustriert und beschrieben wurde, so ist die Erfindung nicht durch die offenbarten Beispiele eingeschränkt und ande^¬ re Variationen können vom Fachmann hieraus abgeleitet werden, ohne den Schutzumfang der Erfindung zu verlassen.

Claims

Patentansprüche

1. Verfahren zur modellbasierten Ermittlung eines Systemzustandes eines dynamischen Systems mittels eines Modells, - wobei als Modell des dynamischen Systems ein rekurrentes neuronales Netz bereitgestellt wird,

- wobei dem Modell eine Zeitreihe aus potentiell erfassbaren Messwerten, umfassend erfasste und fehlende Messwerte, als Eingangsgröße bereitgestellt wird,

- wobei aus dem Modell mindestens ein zu einem Zeitpunkt zu^¬ gehöriger Systemzustand generiert wird, aus welchem mindes^¬ tens ein zu dem jeweiligen Zeitpunkt zugehöriger Zielwert ermittelbar ist;

- wobei zeitlich aufeinanderfolgende Systemzustände durch ei- nen jeweiligen Zustandsübergang ineinander überführt werden;

- wobei eine Korrektur mindestens eines Systemzustandes auf Basis der Zeitreihe mit Hilfe des Zustandsüberganges vorge^¬ nommen wird;

2. Verfahren nach Anspruch 1, wobei die Korrektur unbeein- flusst durch die fehlenden Messwerte der Zeitreihe vorgenom^¬ men wird, indem ein je Zeitpunkt der Zeitreihe vorliegender Observablenvektor mit einem Vektor multipliziert wird, und dieser Vektor derart aus O-Einträgen aufgebaut ist, dass die fehlenden Messwerte im Observablenvektor durch die O-Einträge nicht in die Korrektur des Systemzustandes eingehen.

3. Verfahren nach Anspruch 1 oder 2, wobei die Korrektur un- beeinflusst durch die fehlenden Messwerte der Zeitreihe vor^¬ genommen wird, indem ein je Zeitpunkt der Zeitreihe vorlie^¬ gender Observablenvektor mit einem Vektor multipliziert wird, und dieser Vektor derart aus 1-Einträgen aufgebaut ist, dass die erfassten Messwerte im Observablenvektor durch die 1- Einträge in die Korrektur des Systemzustandes eingehen.

4. Verfahren nach einem der vorstehenden Ansprüche, wobei die fehlenden Messwerte der Zeitreihe nicht durch einen Algorithmus ergänzt oder abgeschätzt werden.

5. Verfahren nach einem der vorstehenden Ansprüche, wobei aus einem Systemzustand für einen zu einem fixierten Zeitpunkt zukünftigen Zeitpunkt ein zugehöriger zukünftiger modellbasierter Zielwert ermittelt wird.

6. Verfahren nach einem der vorstehenden Ansprüche, wobei eine Vielzahl von Observablenvektoren der Zeitreihe zu vergangenen Zeitpunkten in die Korrektur eines zu einem auf einen jeweiligen vergangenen Zeitpunkt folgenden Zeitpunkt zugehörigen Zustandsvektors eingehen.

7. Verfahren nach einem der vorstehenden Ansprüche, wobei die Korrektur in einer Anlernphase des dynamischen Systems oder in einer Betriebsphase vorgenommen wird.

8. Verfahren nach einem der vorstehenden Ansprüche, wobei der Zustandsübergang durch Anwenden einer nicht-linearen Aktivierungsfunktion und einer linearen Funktion ausgeführt wird.

9. Verfahren nach einem der vorstehenden Ansprüche, wobei der Systemzustand als Zustandsvektor aus Observablen und verdeckten Zuständen ausgestaltet ist.

10. Verfahren nach Anspruch 9, wobei beim Zustandsübergang ein Differenzvektor auf die Observablen des Zustandsvektors zum zugehörigen Zeitpunkt angewendet wird, wobei der Diffe^¬ renzvektor einen Unterschied zwischen den Observablen und bekannten Observablen eines zugehörigen Observablenvektors der Zeitreihe beschreibt.

11. Verfahren nach einem der vorstehenden Ansprüche, wobei ein aus einem Systemzustand erzeugter Zielwert, insbesondere ein prognostizierter zukünftiger Zielwert, zur Steuerung einer technischen Anlage an eine Steuerungseinheit der techni- sehen Anlage übermittelt wird oder zur Optimierung des Mo^¬ dells für die Korrektur verwendet wird.

12. Verfahren nach einem der vorstehenden Ansprüche, wobei ein aus einem Systemzustand erzeugter Zielwert, insbesondere ein prognostizierter zukünftiger Zielwert, zur Entscheidungsunterstützung oder Risikoabschätzung, insbesondere im Rahmen einer Bedarfs- oder Preisprognose, verwendet wird.

13. Computerprogrammprodukt mit einem Computerprogramm, das Mittel zur Durchführung des Verfahrens nach einem der vorhergehenden Ansprüche aufweist, wenn das Computerprogramm auf einer programmgesteuerten Einrichtung zur Ausführung gebracht wird .