EP3449433A1 - Modellbasierte ermittlung eines systemzustandes mittels eines dynamischen systems - Google Patents

Modellbasierte ermittlung eines systemzustandes mittels eines dynamischen systems

Info

Publication number
EP3449433A1
EP3449433A1 EP17728082.3A EP17728082A EP3449433A1 EP 3449433 A1 EP3449433 A1 EP 3449433A1 EP 17728082 A EP17728082 A EP 17728082A EP 3449433 A1 EP3449433 A1 EP 3449433A1
Authority
EP
European Patent Office
Prior art keywords
vector
time
correction
time series
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP17728082.3A
Other languages
English (en)
French (fr)
Inventor
Kai Heesche
Stefanie VOGL
Hans-Georg Zimmermann
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of EP3449433A1 publication Critical patent/EP3449433A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks

Definitions

  • Physical systems with temporal dynamics can be described with ma ⁇ thematic models. Observables can be observed in physical systems. They can be vectors that are a multitude of individual ones
  • Observablen to describe a system state. Can observables for certain time points from system states or system state vector to be modeled by means of a model and therefore also describe a physical Sys tem ⁇ at this time. The time may be in the future, so that observables can be forecasted.
  • time series analysis or to predict observable time series mathematical models are used which are derived on the basis of historical data a Sys ⁇ tem underlying functional, linear or non-linear input-output relationships. For example, regression models or so-called Autoregressive Moving Average models or short ARMA models, or Autoregressive integrated Moving Average or ARIMA models or Seasonal ARIMA, short SARIMA models or neural networks are used.
  • the time series of the input and target variables usually come from sensor measurements.
  • the data is processed as a time series. That is, vectors of quantities describing the system at different, successive times must be complete in order for the entire time series to be processed. Removing single missing timestamp is not possible without the model performance negatively beeinflus ⁇ sen.
  • a system state is modeled that is corrupted by gaps in the time series. It is known to artificially fill in gaps in the time series using upstream algorithms and then to use the data for modeling. In a particularly simple case is held value with short gaps in the last known measurement until a new valid measurement exists ⁇ .
  • the invention relates to a method for the model-based determination of a system state of a dynamic system with ⁇ means of a model, in which a recurrent neural network is provided as a model of the dynamic system, wherein the model of a time series of potentially detectable measured values, comprising detected and missing measurement values, is provided as an input,
  • Time-dependent systems can be described particularly advantageously by recurrent neural networks. Since the inputs are not available for predicting future time steps for Availability checked ⁇ supply, the input and output variables are vAbLe by so-called observables, ie observable quantities replaced, in so-called Historically Consistent Neural Networks or historically consistent neural networks. Observable can to the present detected by measurements ⁇ map for points in time and can be derived as the target values for arbitrary points in time of a so-called system state or State Vector. A system state is based on observables as ⁇ be observable quantities and additionally hidden state variables or the so-called Hidden States. The modeling can be refined by replacing, for observables of system states in the past, the target values expected on the basis of the serviceable component in the system state by actually acquired observables. It is a procedure based on a so-called
  • the application of a further developed ATF within the meaning of the subject-matter of the independent claim means that when a status vector changes at a first time t-1 to a state vector of a subsequent time t a correction is made which takes account of the fact that a 1 modeled value possible is not confirmed by a measurement made at time t-1, but there is a deviation between prognosis and real measurement. This deviation of the actually observed value from the predicted target value or model-herten target value is considered to determine the state vector describing the system at time t.
  • the prognosis or derivation of a model-based target value is improved.
  • the prediction of the target variable vector associated with the time t which can be derived from the associated state vector, is improved.
  • the target vector comprises a plurality of target values that represent ⁇ be observable sizes.
  • the correction is made if a value within the observable vector has actually been measured or is present. On the other hand, if there is a gap in the time series, for example for some or more entries of one or more observable vectors at different times, these are not taken into account in the correction.
  • the correction is carried out only in the case in which a value within the Observablenvektors also did was measured ⁇ neuter or present. In particular, no value determined by an algorithm based on the time series is used for the correction which has not actually been measured on the system. In time steps with missing
  • Measured values of the state vector remains unchanged, that is, the target values of the observables for a respective subsequent time step suction ⁇ derived from the internal state of the model.
  • a correction thus remains for entries or observables vablen from a system state or is not made, if there is for the corresponding observable in the previous To ⁇ was not reading.
  • a purely internal derivation of a modeled target value from the state of the model takes place without consideration of the historical measurement data.
  • the correction is thus carried out unadulterated by missing measured values.
  • the underlying dynamic processes are not distorted by the fact that Internet or Extrapo ⁇ lationshabilit to complement missing values are applied in a time series.
  • the proposed method for extending a historically consistent neural network model makes it possible to completely dispense with the preprocessing of measurement data and to have gaps in the data of the time series supplemented by the model itself. So too sparse time series processed consistently and thus also consistent modeling of the entire zugrundelie ⁇ constricting dynamics of the system are achieved.
  • no expert knowledge is needed to manually select a suitable interpolation method.
  • a suitable model should be chosen conveniently so ⁇ that automation of the correction method with ver ⁇ reasonable expense was not possible. In case of a faulty or inappropriate estimation of a
  • the correction is carried out uninfluenced by the missing measured values of the time series by multiplying an observable vector present at each time of the time series by a vector and this vector is constructed from O entries such that the missing ones Measured values in the observable vector due to the O entries are not included in the correction of the system state.
  • An index vector is therefore provided which excludes by O entries when multiplying those values in Observablenvektor for the correction or neglected, which have not been measured to herein are subject ⁇ membered time step, ie for which, for example, a measurement of a sensor no or no valid user or not processible Has delivered the measured value.
  • the correction is performed unaffected by the missing measured values of the time series, by one present at each time of the time series
  • Observable vector is multiplied by a vector, and this vector is constructed from 1-entries, that the detected measured values in the observable vector through the 1-entries received in the correction of the system state.
  • the index vector is able to account for some or all of those values in the observable vector for correction by 1-entries which were actually measured at the previous time step, ie for which, for example, a measurement of a sensor has provided a valid or processable measurement.
  • an Architectural Teacher Forcing carried out by known methods, so that a foodsvek- tor of the system status at a particular time by the Observablenvektor of the observed time series at the preceding time is corrected. It is essential that the 1 entry is not an O entry. An extension to entries deviating from a 1 entry is conceivable, as long as they are not O entries.
  • the lack of measured values of the time series are not complemented by an algorithm or kill ⁇ estimates.
  • only the measured values in unmodified form are present as input variables to the variable vector.
  • an associated future model-based value is determined from a system state for a future point in time at a fixed point in time.
  • a plurality of observational vectors of the time series at past time points enter the correction of a state vector associated with a time following a respective past time. Since each ATF each time optimizes the following respective system state, a forecast of future values be ⁇ Sonder is promising, if as many historical values enter into the ATF. For a multiplicity of state vectors belonging to past times, the respective previous observable vectors can be received.
  • the correction is made in a learning phase of the dynamic system or in an operating phase.
  • the method can be advantageously used both to improve modeling and to improve a prognosis.
  • the modeling of observables at a large number of times in the past and the comparison with observables actually measured at the respective times can advantageously be used to train an HCNN.
  • the ATF can be performed for a variety of Systemzu ⁇ stands of past times in an operating phase, in order to optimize the prediction of a future Observablenvektors.
  • the state transition is performed by applying a non-linear activation function and a linear function.
  • features such as the hyperbolic tangent and linear algebra are used.
  • the state vectors which enter into the functions of the status transition are already adjusted in particular by Cor ⁇ rection.
  • the system state is configured as a state vector of observables and hidden states. Only for the observables, the correction can be made, the hidden states describe unobservable quantities and are not by measurements
  • a difference vector is applied to the observables of the state vector at the time corresponding to ⁇ at the state transition, wherein the difference vector ei ⁇ NEN difference between the observables and known observables an associated Observablenvektors the time series writes be ⁇ .
  • This is for example a gcardi ⁇ ges Architectural Teacher forcing method in which the modeled values are replaced with actual measured values from historical time series.
  • a generated from a system state value, in particular a predicted future value for controlling a technical installation to a control unit of the technical system is transmitted or Op ⁇ optimization of the model for the correction.
  • the invention further relates to a computer program product with a computer program having means for carrying out the method according to one of the preceding claims, when the computer program is executed on a program-controlled device.
  • a computer program product such as a computer program means may be playing as provided or ⁇ as a storage medium, such as memory card, USB stick, CD-ROM, DVD, or in the form of a downloadable file from a server on a network supplied. This can be done, for example, in a wireless communication network by transmitting a corresponding file with the computer program product or Compu ⁇ terprogramm agent.
  • program-controlled Einrich ⁇ tion is in particular a control device, such as for example a microprocessor for a smart card or the like in question.
  • Figure 1 is a schematic representation of a known
  • Figure 2 is a schematic representation of a recurrent
  • neural network for modeling a dynamic system with Architectural Teacher Forcing based correction method according to an embodiment of the invention.
  • Recurrent neural networks for modeling a temporal behavior of a dynamic system typically comprise several layers having a plurality can include neurons, and based on training data from known states of the dynamic system learned in a suitable manner such that future states of the dynamic Sys ⁇ tems can be predicted.
  • ⁇ NEN figures are corresponding clusters of neurons, which supply stand vectors or Observablenvektoren or Differenzvekto- model reindeer, represented by circles.
  • recurrent neural networks can be used for the computer-assisted prediction of electricity prices or energy requirements or of raw material prices.
  • FIG. 1 shows schematically a conventional network topology which is used to model a dynamic system. It is a Historically Consistent Neural Network, in which state vectors s ⁇ , Sj ⁇ , St_ j _, s t , s t +] _, s t + 2, also called state vectors, at times t-3, t
  • t-1, t, t + 1, and t + 2 are used to provide target variable vectors y, Yt-2 'Yt-1' Yt 'Yt + 1' Yt + 2 corresponding to respective times
  • a matrix B the target values Yt-3 'Yt-2' Yt-1 'Yt' Yt + 1 un d Yt + 2 respectively from the internal to ⁇ stand vectors SJ-.3, SJ, 2, s tl 's t ' s t + 1 unc ⁇ s t + 2 is derived by a linear transformation.
  • the modeling is refined by a so-called Architectural Teacher Forcing, ATF for short, by potentially observable or measurable
  • Observable vectors u ⁇ , u ⁇ , u ' which may comprise a plurality Obser ⁇ vablen per vector, are taken into account in the state transition from a state vector to temporally following state vector.
  • the values of the observables u.sub.i, for example, are used to determine the state vector S.sub.j.sup.- ,
  • the actually observed values in the vector are added negatively to the starting layer, illustrated in Figure 1 by -Id. From the state vector S j -, 3 are simultaneously filtered potentially be ⁇ observable observable from the state vector over the matrix [id 0].
  • [Id 0] is the identity matrix with 0 entries for removing the hidden observables from the state vector.
  • the observable states are added positively to the output layer.
  • the difference vector can be formed between the modeled observables and the actually observed observables. This difference vector enters the state transition negatively.
  • the state vector becomes the observable entries of the state vector
  • St_3 is corrected by the actually observed observable entries, since by applying the matrix the difference vector, with corresponding O-entries for the hidden states, is subtracted from the state vector.
  • the hidden states remain unchanged by the O entries.
  • a non-linear activation function is applied, e.g. a hyperbolic tangent function, illustrated in FIG. 1 by a circle with tanh therein, and with linear portions, illustrated by a weight matrix A, to arrive in the model at the subsequent state vector s.
  • Observable values such as the quality of the vectors Yt + 1 'Yt + 2 unc ⁇ the corresponding observable values.
  • a bias vector S Q is given as the initial state
  • wel ⁇ cher is learned in a learning phase of the neural network together with the weight matrices A and B.
  • the modeling tion of the dynamic behavior of a technical system which is described by a number of observables and by hidden states, not all training data are taken into account when learning the network, but the learning is based on a section of the network structure for a number of successive state vectors, for which known observable vectors from training data are available.
  • the network is thus learned in time windows, which different ⁇ sections of successive
  • FIG 2 is shown how the Architectural Teacher Forcing is modified from Figure 1 to achieve an improved Mo ⁇ model- ling at sparse time series.
  • the Architectural Teacher Forcing is excluded from the Observableneinträgen of the state vector at a certain time t-3 and by the observed at this time actual Observablenvektor ⁇ - n formed Diffe ⁇ ence vector. It is also an index vector
  • the described adaptation is applied in the generation of the state vectors for improved modeling of the system.
  • Observablenvektors that, a quality characteristic value is to one of a sensor GELIE ⁇ ferten measured value addition forth. Missing entries can be identified, for example, by means of an entry "not available” or, in the simplest case, the measured value can only contain an invalid value (NaN, "Not a Number”). For example, the index vector is automatically adjusted for each time after the measured values have been acquired, so that the 0 and 1 entries match.
  • Measurements can be taken into account the few available measured values in an advantageous manner for improving the modeling. For example, only at the times t-3 and t-1 is there a measured value for a temperature profile. The outside is located at the time t-3, only the measured value for the temperature ⁇ raturverlauf before and the other potentially detectable measured values ⁇ such as pressure or wind force, etc., are not available at this time. At the other times t-2, t-1 and t, for example, the other measured values such as pressure, wind force, etc. are completely available. It is not necessary an interpolation of Tempertatur tone for the intermediate state or measured value at time t-2 to advantageous ⁇ exemplary manner.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zur modellbasierten Ermittlung eines Systemzustandes eines dynamischen Systems mittels eines Modells, wobei als Modell des dynamischen Systems ein rekurrentes neuronales Netz bereitgestellt wird, wobei dem Modell eine Zeitreihe aus potentiell erfassbaren Messwerten, umfassend erfassten und fehlenden Messwerten, als Eingangsgröße bereitgestellt wird, - wobei aus dem Modell mindestens ein zu einem Zeitpunkt zugehöriger Systemzustand generiert wird, aus welchem mindestens ein zu dem jeweiligen Zeitpunkt zugehöriger Zielwert ermittelbar ist; - wobei zeitlich aufeinanderfolgende Systemzustände durch einen jeweiligen Zustandsübergang ineinander überführt werden; - wobei eine Korrektur mindestens eines Systemzustandes auf Basis der Zeitreihe mithilfe des Zustandsüberganges vorgenommen wird; dadurch gekennzeichnet, dass die Korrektur unbeeinflusst von den fehlenden Messwerten der Zeitreihe vorgenommen wird. Die Korrektur wird dabei vorgenommen, falls ein Wert innerhalb des Observablenvektors auch tatsächlich gemessen wurde oder vorliegt. Liegt dagegen eine Lücke in der Zeitreihe vor, beispielsweise für einige oder mehrere Einträge eines oder mehrerer Observablenvektoren zu verschiedenen Zeitpunkten, so werden diese bei der Korrektur nicht berücksichtigt. Spärlich oder lückenhaft besetzte Zeitreihen können somit zur verbesserten Modellierung in rekurrenten neuronalen Netzen auf vorteilhafte Weise eingesetzt werden.

Description

Beschreibung
Modellbasierte Ermittlung eines Systemzustandes mittels eines dynamischen Systems
Physikalische Systeme mit zeitlicher Dynamik können mit ma¬ thematischen Modellen beschrieben werden. Observablen können bei physikalischen Systemen beobachtet werden. Es kann sich um Vektoren handeln, die eine Vielzahl von einzelnen
Observablenwerten zur Beschreibung eines Systemzustandes aufweisen. Observablen können mittels eines Modells ferner für bestimmte Zeitpunkte aus Systemzuständen oder Systemzustands- vektoren modelliert werden und somit ein physikalisches Sys¬ tem zu diesem Zeitpunkt beschreiben. Der Zeitpunkt kann dabei in der Zukunft liegen, so dass Observablen prognostiziert werden können. Zur Zeitreihenanalyse oder zur Prognose von beobachtbaren Zeitreihen werden mathematische Modelle genutzt, welche auf Grundlage von historischen Daten einem Sys¬ tem zugrundeliegende funktionale, lineare oder nicht-lineare, Eingabe-Ausgabebeziehungen ableiten. Beispielsweise werden Regressionsmodelle oder sogenannte Autoregressive-Moving Average-Modelle oder kurz ARMA-Modelle, oder Autoregressive- integrated-Moving-Average- oder ARIMA-Modelle oder Seasonal ARIMA-, kurz SARIMA-Modelle oder neuronale Netze eingesetzt. Im Umfeld der Modellierung physikalischer Systeme oder physikalischer Prozesse stammen die Zeitreihen der Input- und Zielgrößen meist aus Sensormessungen. Bei Modellen, welche die zeitliche Dynamik des zugrundeliegenden Systems erfassen und abbilden, insbesondere rekurrenten neuronalen Netzen, werden die Daten als Zeitreihe verarbeitet. Das heißt, dass Vektoren von Größen, welche das System zu unterschiedlichen, aufeinanderfolgenden Zeitpunkten beschreiben, vollständig vorliegen müssen, damit die gesamte Zeitreihe verarbeitet werden kann. Das Entfernen einzelner fehlender Zeitstempel ist nicht möglich, ohne die Modellgüte negativ zu beeinflus¬ sen. Insbesondere wird ein Systemzustand modelliert, der durch Lücken in der Zeitreihe verfälscht ist. Es ist bekannt, Lücken in den Zeitreihen mithilfe von vorgeschalteten Algorithmen künstlich aufzufüllen und die Daten danach zur Modellierung zu verwenden. In einem besonders einfachen Fall wird bei kurzen Lücken der letzte bekannte Mess- wert solange festgehalten, bis eine neue gültige Messung vor¬ liegt. Liegen insgesamt nur sehr wenige Lücken in einer Zeit¬ reihe vor, so können Trainingsmuster, die Lücken enthalten, aus dem Trainingsdatensatz entfernt werden, da dies nur einen kleinen Teil der Daten betrifft. Lücken werden mit Einträgen wie beispielsweise NaN aufgefüllt. Trainingsdaten, die diese NaN-Vermerke enthalten, werden nicht zum Training benutzt. Sind dies nur wenige, so wird die Trainingsmenge nicht signi¬ fikant reduziert Ferner ist es bekannt, verschiedene Inter- oder Extrapolationsverfahren wie z. B. lineare oder nicht- lineare Interpolation, trigonometrische Interpolation oder auf Spline-Funktionen basierende Interpolationen vorzunehmen. Zusätzlich zu den beschriebenen Verfahren, die auf Ableitung analytischer Näherungsfunktionen beruhen, werden häufig auch statistische Methoden eingesetzt, bei denen die Verteilungs- funktionen der Messwerte zugrundegelegt werden.
Vor diesem Hintergrund ist es eine Aufgabe der vorliegenden Erfindung, ein Verfahren sowie ein Computerprogramm-Produkt mit Computerprogramm zur Ausführung des Verfahrens bereitzu- stellen, welche ein verbessertes Ermitteln eines Systemzu¬ standes ermöglichen. Diese Aufgabe wird durch die angegebenen unabhängigen Ansprüche gelöst. Vorteilhafte Ausgestaltungen sind in den abhängigen Ansprüchen angegeben. Die Erfindung betrifft ein Verfahren zur modellbasierten Ermittlung eines Systemzustandes eines dynamischen Systems mit¬ tels eines Modells, wobei als Modell des dynamischen Systems ein rekurrentes neuronales Netz bereitgestellt wird, wobei dem Modell eine Zeitreihe aus potentiell erfassbaren Messwer- ten, umfassend erfassten und fehlenden Messwerten, als Eingangsgröße bereitgestellt wird,
- wobei aus dem Modell mindestens ein zu einem Zeitpunkt zu¬ gehöriger Systemzustand generiert wird, aus welchem mindes- tens ein zu dem jeweiligen Zeitpunkt zugehöriger Zielwert ermittelbar ist;
- wobei zeitlich aufeinanderfolgende Systemzustände durch ei¬ nen jeweiligen Zustandsübergang ineinander überführt werden; - wobei eine Korrektur mindestens eines Systemzustandes auf Basis der Zeitreihe mithilfe des Zustandsüberganges vorgenom¬ men wird;
dadurch gekennzeichnet, dass die Korrektur unbeeinflusst von den fehlenden Messwerten der Zeitreihe vorgenommen wird.
Zeitabhängige Systeme lassen sich besonders vorteilhaft durch rekurrente neuronale Netze beschreiben. Da die Eingangsgrößen für die Vorhersage zukünftiger Zeitschritte nicht zur Verfü¬ gung stehen, werden in sogenannten Historically Consistent Neural Networks oder historisch konsistenten neuronalen Netzen die Eingangs- und Ausgangsgrößen durch sogenannte Obser- vable, d.h. beobachtbare Größen, ersetzt. Observable können für Zeitpunkte bis zur Gegenwart durch Messungen erfasst wer¬ den und können für beliebige Zeitpunkte aus einem sogenannten Systemzustand oder State Vector als Zielgrößen abgeleitet werden. Ein Systemzustand beruht auf Observablen als be¬ obachtbare Größen und zusätzlich verdeckten Zustandsgrößen oder sogenannten Hidden States. Die Modellierung lässt sich verfeinern, indem für Observable von Systemzuständen in der Vergangenheit die aufgrund des Ob- servablen-Anteils im Systemzustand erwarteten Zielwerte durch tatsächlich erfasste Observablen ersetzt werden. Es handelt sich dabei um ein Verfahren auf Basis eines sogenannten
Architectural Teacher Forcing oder kurz ATF für historisch konsistente neuronale Netze.
Das Anwenden eines weiterentwickelten ATFs im Sinne des Gegenstandes des unabhängigen Anspruchs bedeutet, dass beim Zu- Standsübergang von einem Zustandsvektor zu einem ersten Zeitpunkt t-1 zu einem Zustandsvektor eines darauffolgenden Zeitpunktes t eine Korrektur vorgenommen wird, welche berücksichtigt, dass ein zum Zeitpunkt t-1 modellierter Wert möglicher- weise durch eine zum Zeitpunkt t-1 vorgenommene Messung nicht bestätigt wird, sondern es eine Abweichung zwischen Prognose und realer Messung gibt. Diese Abweichung des tatsächlich beobachteten Wertes vom prognostizierten Zielwert oder model- Herten Zielwert wird zur Ermittlung des Zustandsvektors , der das System zum Zeitpunkt t beschreibt, berücksichtigt. Somit wird die Prognose oder Ableitung eines modellbasierten Zielwertes verbessert. Insbesondere wird die Vorhersage des zum Zeitpunkt t zugehörigen Zielgrößenvektors, der aus dem zuge- hörigen Zustandsvektor ableitbar ist, verbessert. Der Zielgrößenvektor umfasst in der Regel mehrere Zielwerte, die be¬ obachtbare Größen darstellen.
Die Korrektur wird dabei vorgenommen, falls ein Wert inner- halb des Observablenvektors auch tatsächlich gemessen wurde oder vorliegt. Liegt dagegen eine Lücke in der Zeitreihe vor, beispielsweise für einige oder mehrere Einträge eines oder mehrerer Observablenvektoren zu verschiedenen Zeitpunkten, so werden diese bei der Korrektur nicht berücksichtigt. Vorteil- hafterweise wird die Korrektur nur in dem Fall vorgenommen, in dem ein Wert innerhalb des Observablenvektors auch tat¬ sächlich gemessen wurde oder vorliegt. Insbesondere wird kein durch einen Algorithmus aufgrund der Zeitreihe festgesetzter Wert für die Korrektur verwendet, welcher nicht tatsächlich am System gemessen wurde. In Zeitschritten mit fehlenden
Messwerten bleibt der Zustandsvektor unverändert, d.h. die Zielwerte der Observablen für einen jeweiligen nachfolgenden Zeitschritt werden aus dem internen Zustand des Modells abge¬ leitet. Eine Korrektur bleibt somit für Einträge oder Obser- vablen eines Systemzustandes aus oder wird nicht vorgenommen, wenn für die entsprechende Observable im vorausgegangenen Zu¬ stand kein Messwert vorliegt. In diesem Fall erfolgt eine reine interne Ableitung eines modellierten Zielwertes aus dem Zustand des Modells ohne Berücksichtigung der historischen Messdaten. Die Korrektur wird somit durch fehlende Messwerte unverfälscht vorgenommen. Auf vorteilhafte Weise werden zugrundeliegende dynamische Prozesse nicht dadurch verfälscht, dass Inter- oder Extrapo¬ lationsverfahren zur Ergänzung fehlender Werte in einer Zeitreihe angewandt werden. Insbesondere bei spärlich besetzten Messwertreihen, bei welchen ein hoher Anteil an Messwerten fehlt, verfälschen die Abschätzverfahren unter anderem die statistischen Eigenschaften der Zeitreihen, wie beispielsweise Mittelwert oder Varianz, was sich negativ auf die nachfol¬ gende Modellbildung auswirkt. Somit ist die Güte von Vorher- sagen der abgeleiteten Modelle aufgrund der beschriebenen Erfindung erheblich verbessert. Das vorgeschlagene Verfahren zur Erweiterung eines Historically Consistent Neural Network- Modells ermöglicht es, auf die Vorverarbeitung von Messdaten komplett zu verzichten und Lücken in den Daten der Zeitreihe vom Modell selbst ergänzen zu lassen. So können auch spärlich besetzte Zeitreihen konsistent verarbeitet und damit eine ebenfalls konsistente Modellierung der gesamten zugrundelie¬ genden Dynamik des Systems erreicht werden. Ferner ist kein Expertenwissen nötig, um manuell eine passende Interpolati- onsmethode zu wählen. Je nach fehlender Observablen müsste herkömmlicherweise ein passendes Modell gewählt werden, so¬ dass eine Automatisierung des Korrekturverfahrens mit ver¬ tretbarem Aufwand bislang nicht möglich war. Bei einer fehlerhaften oder unpassenden Abschätzung eines
Wertes zum Auffüllen einer Lücke in den Observablen, wie es herkömmlicherweise durchgeführt wird, setzt sich dieser Feh¬ ler für Vorhersagen immer weiter fort. Durch das vorgeschlagene Ausblenden einzelner fehlender Werte innerhalb des
Observablenvektors ist ein derartiges Verfälschen mit der da¬ mit einhergehenden Fortpflanzung eines Fehlers ausgeschlos¬ sen .
Gemäß einer Ausgestaltung wird die Korrektur unbeeinflusst durch die fehlenden Messwerte der Zeitreihe vorgenommen, indem ein je Zeitpunkt der Zeitreihe vorliegender Observablen- vektor mit einem Vektor multipliziert wird und dieser Vektor derart aus O-Einträgen aufgebaut ist, dass die fehlenden Messwerte im Observablenvektor durch die O-Einträge nicht in die Korrektur des Systemzustandes eingehen. Es ist demnach ein Indexvektor vorgesehen, welcher durch O-Einträge beim Multiplizieren diejenigen Werte im Observablenvektor für die Korrektur ausklammert oder vernachlässigt, welche zum vorhe¬ rigen Zeitschritt nicht gemessen wurden, d.h. für welche beispielsweise eine Messung eines Sensors keinen oder keinen gültigen oder keinen verarbeitbaren Messwert geliefert hat. Gemäß einer Ausgestaltung wird die Korrektur unbeeinflusst durch die fehlenden Messwerte der Zeitreihe vorgenommen, indem ein je Zeitpunkt der Zeitreihe vorliegender
Observablenvektor mit einem Vektor multipliziert wird, und dieser Vektor derart aus 1-Einträgen aufgebaut ist, dass die erfassten Messwerte im Observablenvektor durch die 1-Einträge in die Korrektur des Systemzustandes eingehen. Der Indexvektor ist insbesondere in der Lage, durch 1-Einträge einige oder alle diejenigen Werte im Observablenvektor für die Korrektur zu berücksichtigen, welche zum vorherigen Zeitschritt tatsächlich gemessen wurden, d.h. für welche beispielsweise eine Messung eines Sensors einen gültigen oder verarbeitbaren Messwert geliefert hat. Für die tatsächlich gemessenen Mess¬ werte wird beispielsweise ein Architectural Teacher Forcing nach bekannten Methoden durchgeführt, sodass ein Zustandsvek- tor des Systemzustandes zu einem bestimmten Zeitpunkt durch den Observablenvektor der beobachteten Zeitreihe zum vorhergehenden Zeitpunkt korrigiert wird. Dabei ist es wesentlich, dass der 1-Eintrag kein O-Eintrag ist. Eine Ausweitung auf von einem 1-Eintrag abweichende Einträge ist denkbar, solange es sich nicht um O-Einträge handelt.
Gemäß einer Ausgestaltung werden die fehlenden Messwerte der Zeitreihe nicht durch einen Algorithmus ergänzt oder abge¬ schätzt. Insbesondere liegen als Eingangsgrößen dem Obser- vablenvektor lediglich die Messwerte in unveränderter Form vor . Gemäß einer Ausgestaltung wird aus einem Systemzustand für einen zu einem fixierten Zeitpunkt zukünftigen Zeitpunkt ein zugehöriger zukünftiger modellbasierter Wert ermittelt. Somit kann das Verfahren insbesondere vorteilhaft für die Prognose von Observablen verwendet werden.
Gemäß einer Ausgestaltung gehen eine Vielzahl von Observab- lenvektoren der Zeitreihe zu vergangenen Zeitpunkten in die Korrektur eines zu einem auf einen jeweiligen vergangenen Zeitpunkt folgenden Zeitpunkt zugehörigen Zustandsvektors ein. Da jedes ATF je Zeitpunkt den jeweiligen folgenden Systemzustand optimiert, ist eine Prognose zukünftiger Werte be¬ sonders vielversprechend, wenn möglichst viele historische Werte in das ATF eingehen. Für eine Vielzahl von zu vergange- nen Zeitpunkten zugehörigen Zustandsvektoren können die jeweiligen vorherigen Observablenvektoren eingehen.
Gemäß einer Weiterbildung wird die Korrektur in einer Anlernphase des dynamischen Systems oder in einer Betriebsphase vorgenommen. Somit kann das Verfahren auf vorteilhafte Weise sowohl zum Verbessern der Modellierung als auch zur Verbesserung einer Prognose verwendet werden. Die Modellierung von Observablen zu einer Vielzahl von Zeitpunkten in der Vergangenheit und der Abgleich mit zu den jeweiligen Zeitpunkten tatsächlich gemessenen Observablen kann einerseits vorteilhaft genutzt werden, um ein HCNN anzulernen. Ebenso kann in einer Betriebsphase das ATF für eine Vielzahl von Systemzu¬ ständen vergangener Zeitpunkte durchgeführt werden, um die Vorhersage eines zukünftigen Observablenvektors zu optimie- ren.
Gemäß einer Ausgestaltung wird der Zustandsübergang durch Anwenden einer nicht-linearen Aktivierungsfunktion und einer linearen Funktion ausgeführt. Insbesondere kommen Funktionen wie der Tangens Hyperbolicus und lineare Algebra zum Einsatz. Die Zustandsvektoren, welche in die Funktionen des Zustands- übergangs eingehen, sind insbesondere bereits durch die Kor¬ rektur bereinigt. Gemäß einer Ausgestaltung ist der Systemzustand als Zustands- vektor aus Observablen und verdeckten Zuständen ausgestaltet. Lediglich für die Observablen kann die Korrektur vorgenommen werden, die verdeckten Zustände beschreiben nichtbeobachtbare Größen und sind nicht durch Messungen
optimierbar .
Gemäß einer Ausgestaltung wird beim Zustandsübergang ein Differenzvektor auf die Observablen des Zustandsvektors zum zu¬ gehörigen Zeitpunkt angewendet, wobei der Differenzvektor ei¬ nen Unterschied zwischen den Observablen und bekannten Observablen eines zugehörigen Observablenvektors der Zeitreihe be¬ schreibt. Es handelt sich dabei beispielsweise um ein gängi¬ ges Architectural Teacher Forcing-Verfahren, bei welchem die modellierten Werte durch tatsächlich gemessene Werte aus historischen Zeitreihen ersetzt werden.
Gemäß einer Ausgestaltung wird ein aus einem Systemzustand erzeugter Wert, insbesondere ein prognostizierter zukünftiger Wert, zur Steuerung einer technischen Anlage an eine Steuerungseinheit der technischen Anlage übermittelt oder zur Op¬ timierung des Modells für die Korrektur verwendet.
Die Erfindung betrifft ferner ein Computerprogrammprodukt mit einem Computerprogramm, das Mittel zur Durchführung des Verfahrens nach einem der vorhergehenden Ansprüche aufweist, wenn das Computerprogramm auf einer programmgesteuerten Einrichtung zur Ausführung gebracht wird. Ein Computerprogrammprodukt, wie z.B. ein Computerprogramm-Mittel, kann bei¬ spielsweise als Speichermedium, wie z.B. Speicherkarte, USB- Stick, CD-ROM, DVD, oder auch in Form einer herunterladbaren Datei von einem Server in einem Netzwerk bereitgestellt oder geliefert werden. Dies kann zum Beispiel in einem drahtlosen Kommunikationsnetzwerk durch die Übertragung einer entsprechenden Datei mit dem Computerprogrammprodukt oder dem Compu¬ terprogramm-Mittel erfolgen. Als programmgesteuerte Einrich¬ tung kommt insbesondere eine Steuereinrichtung, wie zum Bei- spiel ein Mikroprozessor für eine Smartcard oder dergleichen in Frage .
Die Erfindung wird nachfolgend anhand von Ausführungsbeispie- len mithilfe der Figuren näher erläutert. Es zeigen:
Figur 1 eine schematische Darstellung eines bekannten
rekurrenten neuronalen Netzes zur Modellierung eines dynamischen Systems mit einem Architectural Teacher Forcing-Korrekturverfahren;
Figur 2 eine schematische Darstellung eines rekurrenten
neuronalen Netzes zur Modellierung eines dynamischen Systems mit Architectural Teacher Forcing ba- siertem Korrekturverfahren gemäß einem Ausführungsbeispiel der Erfindung.
In den Figuren sind funktionsgleiche Elemente mit denselben Bezugszeichen versehen, sofern nichts anderes angegeben ist.
Rekurrente neuronale Netze zur Modellierung eines zeitlichen Verhaltens eines dynamischen Systems umfassen in der Regel mehrere Schichten, welche eine Mehrzahl von Neuronen beinhalten und in geeigneter Weise basierend auf Trainingsdaten aus bekannten Zuständen des dynamischen Systems derart gelernt werden können, dass zukünftige Zustände des dynamischen Sys¬ tems prädiziert werden können. In den nachfolgend beschriebe¬ nen Figuren sind entsprechende Neuronencluster, welche Zu- standsvektoren oder Observablenvektoren oder Differenzvekto- ren modellieren, durch Kreise wiedergegeben.
Mit Hilfe von rekurrenten neuronalen Netzen werden beispiels weise im Umfeld erneuerbarer Energien Schwankungen in der Stromerzeugung, insbesondere bei Windkraftanlagen, abgeschätzt. Dafür werden Umwelteinflüsse modelliert und auf Grundlage eines auf Basis von Trainingsdaten angelernten Modells werden Observablen wie Temperatur, Windstärke, Wind- richtung, Druck, usw. genutzt und ermittelt, um daraus Rück¬ schlüsse auf die Stromerzeugung ziehen zu können.
Ebenso können rekurrente neuronale Netze zur rechnergestütz- ten Vorhersage von Strompreisen oder Energiebedarf oder von Rohstoffpreisen genutzt werden.
In Figur 1 ist schematisch eine konventionelle Netzwerktopo- logie abgebildet, welche zur Modellierung eines dynamischen Systems dient. Es handelt sich um ein Historically Consistent Neuronal Network, bei welchem Zustandsvektoren s^, Sj-^, St_j_ , st, st+]_, st+2 , auch State Vectors genannt, zu Zeitpunkten t-3, t-
2, t-1, t, t+1 und t+2 verwendet werden, um zu den jeweiligen Zeitpunkten zugehörige Zielgrößenvektoren y^, Yt-2 ' Yt-1 ' Yt ' Yt+1 ' Yt+2 bestehend aus beobachtbaren Größen oder Observablen und versteckten Zustandsgrößen über eine Multiplikation mit einer Matrix B abzuleiten. Über die Matrix B werden die Zielgrößen Yt-3 ' Yt-2 ' Yt-1 ' Yt ' Yt+1 und Yt+2 jeweils aus den internen Zu¬ standsvektoren SJ-.3 , Sj-,2 , st-l ' st' st+l unc^ st+2 durch eine li- near Transformation abgeleitet. Die Modellierung wird durch ein sogenanntes Architectural Teacher Forcing, kurz ATF, verfeinert, indem potentiell beobachtbare oder messbare
Observablenvektoren u^, u^, u' welche mehrere Obser¬ vablen je Vektor umfassen können, beim Zustandsübergang von einem Zustandsvektor zum zeitlich darauf folgenden Zustands- vektor berücksichtigt werden. Die Werte der Observablen u^ gehen beispielsweise in die Ermittlung des Zustandsvektors Sj-,
2 aus dem Zustandsvektor ein. Dafür werden alle Einträge des Observablenvektors uj-,3 verwendet. Existieren nicht für alle Einträge oder Zeilen des Observablenvektors Messwerte, so werden Werte geschätzt, damit eine vollständige Zeitreihe aus Observablenvektoren eingeht.
Für das ATF wird eine Output-Schicht auf einen festen Wert von 0 gesetzt, in der Figur durch den Kreis tar=0 oder target gleich 0 veranschaulicht. Die tatsächlich beobachteten Werte im Vektor werden negativ zur Ausgangsschicht hinzugefügt, veranschaulicht in Figur 1 durch -Id. Aus dem Zustandsvektor Sj-,3 werden zugleich über die Matrix [id 0] die potentiell be¬ obachtbaren Observablen aus dem Zustandsvektor gefiltert.
Es handelt sich bei [id 0] um die Identitätsmatrix mit 0- Einträgen zum Entfernen der versteckten Observablen aus dem State Vector. Die beobachtbaren Zustände werden positiv zur Output-Schicht hinzugefügt. Somit kann der Differenzvektor zwischen den modellierten Observablen und den tatsächlich beobachteten Observablen gebildet werden. Dieser Differenzvektor geht negativ in den Zustandsübergang ein. Vom Zustands- vektor werden die Observableneinträge des Zustandsvektors
St_3 durch die tatsächlich beobachteten Observableneinträge korrigiert, da durch Anwenden der Matrix der Differenzvektor, mit entsprechenden O-Einträgen für die verdeckten Zustände, vom State Vector subtrahiert wird. Die versteckten Zustände bleiben durch die O-Einträge unverändert.
Es wird dann wie üblich eine nicht-lineare Aktivierungsfunktion angewendet, z.B. eine Tangens Hyperbolicus-Funktion, in Figur 1 veranschaulicht durch einen Kreis mit darin befindli- ehern tanh, sowie mit linearen Anteilen, veranschaulicht durch eine Gewichtsmatrix A, um im Modell zum darauffolgenden Zustandsvektor s^ zu gelangen.
Dieses Vorgehen wird analog für alle Zustandsvektoren wieder- holt, zu welchen Observablenvektoren aus der Historie vorliegen. Durch die derart bis zur Gegenwart hin verbesserte Qua¬ lität der Zustandsvektoren und der damit verbundenen verbesserten Qualität der modellierten Observablenwerte verbessert sich insbesondere die Qualität prognostizierter
Observablenwerte, beispielsweise die Qualität der Vektoren Yt+1' Yt+2 unc^ der entsprechenden Observablenwerte.
Zur Erläuterung der Anlernphase des beispielhaft beschriebe¬ nen rekurrenten neuronalen Netzes sei darauf verwiesen, dass als initialer Zustand ein Biasvektor SQ vorgegeben wird, wel¬ cher in einer Anlernphase des neuronalen Netzes zusammen mit der Gewichtsmatrizen A und B gelernt wird. Bei der Modellie- rung des dynamischen Verhaltens eines technischen Systems, welches durch eine Anzahl von Observablen und durch verdeckte Zustände beschrieben ist, werden beim Lernen des Netzes nicht alle Trainingsdaten auf einmal berücksichtigt, sondern das Lernen beruht auf einem Ausschnitt der Netzstruktur für eine Anzahl von aufeinander folgenden Zustandsvektoren, für welche bekannte Observablenvektoren aus Trainingsdaten vorliegen. Das Netz wird somit in Zeitfenstern gelernt, welche verschie¬ dene Ausschnitte aus aufeinander folgenden
Observablenvektoren der Trainingsdaten repräsentieren. Für
Fälle, in welchen kein initialer Zustand existiert, wird bei¬ spielsweise ein intialer verrauschter Zustand verwendet, wel¬ cher nicht in der Anlernphase gelernt wird, sondern als Unsi¬ cherheit akzeptiert wird.
In Figur 2 ist dargestellt, wie das Architectural Teacher Forcing aus Figur 1 modifiziert wird, um eine verbesserte Mo¬ dellierung bei spärlich besetzten Zeitreihen zu erreichen. Wie beim bekannten Architectural Teacher Forcing wird ausge- hend von den Observableneinträgen des Zustandsvektors zu einem bestimmten Zeitpunkt t-3 und von dem zu diesem Zeitpunkt beobachteten tatsächlichen Observablenvektor ^-n Diffe¬ renzvektor gebildet. Es ist überdies ein Indexvektor
vorgesehen, welcher 1-Einträge enthält, falls in dem entspre- chenden Eintrag des Observablenvektors u^ tatsächlich Mess¬ werte vorhanden sind, und welcher O-Einträge enthält, falls dem entsprechenden Eintrag des Observablenvektors der Mess¬ wert fehlt. Durch Multiplikation des Differenzvektors mit dem Indexvektor - in der Figur 2 veranschaulicht durch einen Kreis mit darin befindlichem x - werden nur diejenigen Observablen des darauffolgenden Systemzustandes s^2 korrigiert, für welche im Observablenvektor u^ tatsächliche Messwerte verfügbar sind. Der durch die Multiplikation mit dem Indexvektor Ct_3 gefilterte Differenzvektor weist nur noch Korrek- turen für die Einträge auf, zu welchen beobachtete Messwerte vorliegen. Durch Anwenden der Matrix auf den gefilterten Differenzvektor kann der Systemzustand im Hinblick auf die Observablen korrigiert werden. Es wird wiederum die Aktivierungsfunktion umfassend eine Tangens Hyperbolicus- Funktion sowie eine Multiplikation mit Matrix A angewendet, um zum Zustandsvektor s^ des darauffolgenden Zeitpunkts t-2 zu gelangen.
Zu jedem der Zeitpunkte, zu denen Messwerte tatsächlich er- fasst wurden, welche für das Korrekturverfahren verwendet werden können, wird die beschriebene Anpassung bei der Er- Stellung der Zustandsvektoren zur verbesserten Modellierung des Systems angewendet. Tatsächlich erfasste Messwerte zeich¬ nen sich beispielsweise dadurch in der Erscheinung des
Observablenvektors aus, dass zu einem von einem Sensor gelie¬ ferten Messwert zusätzlich ein Qualitätseigenschaftswert vor- liegt. Fehlende Einträge sind so beispielsweise anhand eines Eintrages „not available" o.ä. erkennbar. Im einfachsten Fall kann der Messwert auch nur einen ungültigen Wert (NaN, „Not a Number") enthalten. Der Indexvektor wird beispielsweise für jeden Zeitpunkt nach Erfassung der Messwerte automatisch an- gepasst, sodass die 0- und 1-Einträge passend vorliegen.
Auch für einen besonders kleinen Anteil an erfassten Messwerten an der Gesamtmenge der erfassbaren Messwerte je
Observablenvektor oder bei über den Zeitbereich der Messungen hinweg betrachteten besonders lückenhaftem Vorliegen von
Messwerten können die wenigen verfügbaren Messwerte auf vorteilhafte Weise zur Verbesserung der Modellierung berücksichtigt werden. Beispielsweise liegt nur zu den Zeitpunkten t-3 und t-1 ein Messwert für einen Temperaturverlauf vor. Außer- dem liegt zum Zeitpunkt t-3 lediglich der Messwert zum Tempe¬ raturverlauf vor und die übrigen potentiell erfassbaren Mess¬ werte, wie beispielsweise Druck oder Windstärke usw., liegen zu diesem Zeitpunkt nicht vor. Zu den übrigen Zeitpunkten t- 2, t-1 und t liegen beispielsweise die übrigen Messwerte wie Druck, Windstärke usw. vollständig vor. Es ist auf vorteil¬ hafte Weise eine Interpolation von Tempertaturwerten für den dazwischenliegenden Zustand oder Messwert zum Zeitpunkt t-2 nicht nötig. Ebenso ist eine Interpolation der Druck- oder Windstärke-Messwerte zum Zeitpunkt t-3 nicht nötig und es kann dennoch der vorhandene Messwert der Temperatur zum Zeitpunkt t-3 auf vorteilhafte Weise eingesetzt werden. Spärlich oder lückenhaft besetzte Zeitreihen können somit zur verbes- serten Modellierung in rekurrenten neuronalen Netzen auf vorteilhafte Weise eingesetzt werden.
Obwohl die Erfindung im Detail durch die Ausführungsbeispiele näher illustriert und beschrieben wurde, so ist die Erfindung nicht durch die offenbarten Beispiele eingeschränkt und ande¬ re Variationen können vom Fachmann hieraus abgeleitet werden, ohne den Schutzumfang der Erfindung zu verlassen.

Claims

Patentansprüche
1. Verfahren zur modellbasierten Ermittlung eines Systemzustandes eines dynamischen Systems mittels eines Modells, - wobei als Modell des dynamischen Systems ein rekurrentes neuronales Netz bereitgestellt wird,
- wobei dem Modell eine Zeitreihe aus potentiell erfassbaren Messwerten, umfassend erfasste und fehlende Messwerte, als Eingangsgröße bereitgestellt wird,
- wobei aus dem Modell mindestens ein zu einem Zeitpunkt zu¬ gehöriger Systemzustand generiert wird, aus welchem mindes¬ tens ein zu dem jeweiligen Zeitpunkt zugehöriger Zielwert ermittelbar ist;
- wobei zeitlich aufeinanderfolgende Systemzustände durch ei- nen jeweiligen Zustandsübergang ineinander überführt werden;
- wobei eine Korrektur mindestens eines Systemzustandes auf Basis der Zeitreihe mit Hilfe des Zustandsüberganges vorge¬ nommen wird;
dadurch gekennzeichnet, dass die Korrektur unbeeinflusst von den fehlenden Messwerten der Zeitreihe vorgenommen wird.
2. Verfahren nach Anspruch 1, wobei die Korrektur unbeein- flusst durch die fehlenden Messwerte der Zeitreihe vorgenom¬ men wird, indem ein je Zeitpunkt der Zeitreihe vorliegender Observablenvektor mit einem Vektor multipliziert wird, und dieser Vektor derart aus O-Einträgen aufgebaut ist, dass die fehlenden Messwerte im Observablenvektor durch die O-Einträge nicht in die Korrektur des Systemzustandes eingehen.
3. Verfahren nach Anspruch 1 oder 2, wobei die Korrektur un- beeinflusst durch die fehlenden Messwerte der Zeitreihe vor¬ genommen wird, indem ein je Zeitpunkt der Zeitreihe vorlie¬ gender Observablenvektor mit einem Vektor multipliziert wird, und dieser Vektor derart aus 1-Einträgen aufgebaut ist, dass die erfassten Messwerte im Observablenvektor durch die 1- Einträge in die Korrektur des Systemzustandes eingehen.
4. Verfahren nach einem der vorstehenden Ansprüche, wobei die fehlenden Messwerte der Zeitreihe nicht durch einen Algorithmus ergänzt oder abgeschätzt werden.
5. Verfahren nach einem der vorstehenden Ansprüche, wobei aus einem Systemzustand für einen zu einem fixierten Zeitpunkt zukünftigen Zeitpunkt ein zugehöriger zukünftiger modellbasierter Zielwert ermittelt wird.
6. Verfahren nach einem der vorstehenden Ansprüche, wobei eine Vielzahl von Observablenvektoren der Zeitreihe zu vergangenen Zeitpunkten in die Korrektur eines zu einem auf einen jeweiligen vergangenen Zeitpunkt folgenden Zeitpunkt zugehörigen Zustandsvektors eingehen.
7. Verfahren nach einem der vorstehenden Ansprüche, wobei die Korrektur in einer Anlernphase des dynamischen Systems oder in einer Betriebsphase vorgenommen wird.
8. Verfahren nach einem der vorstehenden Ansprüche, wobei der Zustandsübergang durch Anwenden einer nicht-linearen Aktivierungsfunktion und einer linearen Funktion ausgeführt wird.
9. Verfahren nach einem der vorstehenden Ansprüche, wobei der Systemzustand als Zustandsvektor aus Observablen und verdeckten Zuständen ausgestaltet ist.
10. Verfahren nach Anspruch 9, wobei beim Zustandsübergang ein Differenzvektor auf die Observablen des Zustandsvektors zum zugehörigen Zeitpunkt angewendet wird, wobei der Diffe¬ renzvektor einen Unterschied zwischen den Observablen und bekannten Observablen eines zugehörigen Observablenvektors der Zeitreihe beschreibt.
11. Verfahren nach einem der vorstehenden Ansprüche, wobei ein aus einem Systemzustand erzeugter Zielwert, insbesondere ein prognostizierter zukünftiger Zielwert, zur Steuerung einer technischen Anlage an eine Steuerungseinheit der techni- sehen Anlage übermittelt wird oder zur Optimierung des Mo¬ dells für die Korrektur verwendet wird.
12. Verfahren nach einem der vorstehenden Ansprüche, wobei ein aus einem Systemzustand erzeugter Zielwert, insbesondere ein prognostizierter zukünftiger Zielwert, zur Entscheidungsunterstützung oder Risikoabschätzung, insbesondere im Rahmen einer Bedarfs- oder Preisprognose, verwendet wird.
13. Computerprogrammprodukt mit einem Computerprogramm, das Mittel zur Durchführung des Verfahrens nach einem der vorhergehenden Ansprüche aufweist, wenn das Computerprogramm auf einer programmgesteuerten Einrichtung zur Ausführung gebracht wird .
EP17728082.3A 2016-06-02 2017-05-22 Modellbasierte ermittlung eines systemzustandes mittels eines dynamischen systems Withdrawn EP3449433A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102016209721.0A DE102016209721A1 (de) 2016-06-02 2016-06-02 Modellbasierte Ermittlung eines Systemzustandes mittels eines dynamischen Systems
PCT/EP2017/062239 WO2017207317A1 (de) 2016-06-02 2017-05-22 Modellbasierte ermittlung eines systemzustandes mittels eines dynamischen systems

Publications (1)

Publication Number Publication Date
EP3449433A1 true EP3449433A1 (de) 2019-03-06

Family

ID=59014574

Family Applications (1)

Application Number Title Priority Date Filing Date
EP17728082.3A Withdrawn EP3449433A1 (de) 2016-06-02 2017-05-22 Modellbasierte ermittlung eines systemzustandes mittels eines dynamischen systems

Country Status (5)

Country Link
US (1) US20200320378A1 (de)
EP (1) EP3449433A1 (de)
KR (1) KR20190015415A (de)
DE (1) DE102016209721A1 (de)
WO (1) WO2017207317A1 (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111194451B (zh) * 2017-10-20 2024-02-27 渊慧科技有限公司 门控激活单元运算的并行执行
CN113255208B (zh) * 2021-04-21 2023-05-12 杭州新剑机器人技术股份有限公司 用于机器人的串联弹性执行器的神经网络模型预测控制方法

Also Published As

Publication number Publication date
DE102016209721A1 (de) 2017-12-07
KR20190015415A (ko) 2019-02-13
WO2017207317A1 (de) 2017-12-07
US20200320378A1 (en) 2020-10-08

Similar Documents

Publication Publication Date Title
EP2112568B1 (de) Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems
EP2724296A1 (de) Verfahren zur rechnergestützten modellierung eines technischen systems
EP3662418A1 (de) Verfahren und vorrichtung für maschinelles lernen in einer recheneinheit
AT511577A2 (de) Maschinell umgesetztes verfahren zum erhalten von daten aus einem nicht linearen dynamischen echtsystem während eines testlaufs
WO2011128313A1 (de) Verfahren zum rechnergestützten lernen eines rekurrenten neuronalen netzes zur modellierung eines dynamischen systems
WO2020216530A1 (de) Verfahren zum bestimmen von restnutzungszyklen, restnutzungszyklusbestimmungsschaltung, restnutzungszyklusbestimmungsvorrichtung
CN107423496A (zh) 一种新的降雨事件随机生成方法
WO2017207317A1 (de) Modellbasierte ermittlung eines systemzustandes mittels eines dynamischen systems
DE102016216945A1 (de) Verfahren und Vorrichtung zum Ausführen einer Funktion basierend auf einem Modellwert eines datenbasierten Funktionsmodells basierend auf einer Modellgültigkeitsangabe
EP3599583A1 (de) Bestimmung des verbrauchs an heiz- oder kühlenergie einer baulichen untereinheit
DE102020200051A1 (de) Verfahren zum Bestimmen von Restnutzungszyklen, Restnutzungszyklusbestimmungsschaltung, Restnutzungszyklusbestimmungsvorrichtung
CN101520644A (zh) 基于数据挖掘的分散控制系统特性函数在线拟合方法
WO2020229050A1 (de) Verfahren zur validierung von systemparametern eines energiesystems, verfahren zum betrieb eines energiesystems sowie energiemanagementsystem für ein energiesystem
DE102006020176A1 (de) Verfahren zur Bereitstellung einer Patternprognose
DE102018125909A1 (de) Verfahren zur Bestimmung zur Bestimmung einer Prozessgröße
DE102008014126B4 (de) Verfahren zum rechnergestützten Lernen eines rekurrenten neuronalen Netzes
DE102013206274A1 (de) Verfahren und Vorrichtung zum Anpassen eines nicht parametrischen Funktionsmodells
DE102011076969B4 (de) Verfahren zum rechnergestützten Lernen einer Regelung und/oder Steuerung eines technischen Systems
DE102018128315A1 (de) Verfahren, Vorrichtung, Computerprogramm und Computerprogrammprodukt zur Überprüfung eines ersten adaptiven Systemmodells
DE102019123447B4 (de) Verfahren zum Betrieb von Fahrzeugkomponenten
EP3959571A1 (de) Verfahren zum bestimmen von restnutzungszyklen, restnutzungszyklusbestimmungsschaltung, restnutzungszyklusbestimmungsvorrichtung
DE19527521C1 (de) Lernverfahren für ein neuronales Netz
EP2384830B1 (de) Verfahren zum Ermitteln von Parametern eines Modells für eine Walzanlage
EP4046149A1 (de) Verfahren zum bestimmen mindestens eines zu bestimmenden restzeitwerts für eine anlage
DE102020116022A1 (de) Verfahren zur zustandsbasierten Instandhaltung einer Zugangsvorrichtung

Legal Events

Date Code Title Description
STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: UNKNOWN

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE INTERNATIONAL PUBLICATION HAS BEEN MADE

PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: REQUEST FOR EXAMINATION WAS MADE

17P Request for examination filed

Effective date: 20181127

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

AX Request for extension of the european patent

Extension state: BA ME

DAV Request for validation of the european patent (deleted)
DAX Request for extension of the european patent (deleted)
STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20190625