DE102014207683A1 - Method and device for creating a data-based function model - Google Patents
Method and device for creating a data-based function model Download PDFInfo
- Publication number
- DE102014207683A1 DE102014207683A1 DE102014207683.8A DE102014207683A DE102014207683A1 DE 102014207683 A1 DE102014207683 A1 DE 102014207683A1 DE 102014207683 A DE102014207683 A DE 102014207683A DE 102014207683 A1 DE102014207683 A1 DE 102014207683A1
- Authority
- DE
- Germany
- Prior art keywords
- training data
- data
- model
- local
- subsets
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/24—Electrical control of supply of combustible mixture or its constituents characterised by the use of digital means
- F02D41/26—Electrical control of supply of combustible mixture or its constituents characterised by the use of digital means using computer, e.g. microprocessor
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/02—Circuit arrangements for generating control signals
- F02D41/14—Introducing closed-loop corrections
- F02D41/1401—Introducing closed-loop corrections characterised by the control or regulation method
- F02D41/1402—Adaptive control
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/02—Circuit arrangements for generating control signals
- F02D41/14—Introducing closed-loop corrections
- F02D41/1401—Introducing closed-loop corrections characterised by the control or regulation method
- F02D41/1405—Neural network control
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/24—Electrical control of supply of combustible mixture or its constituents characterised by the use of digital means
- F02D41/2406—Electrical control of supply of combustible mixture or its constituents characterised by the use of digital means using essentially read only memories
- F02D41/2425—Particular ways of programming the data
- F02D41/2429—Methods of calibrating or learning
- F02D41/2432—Methods of calibration
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/24—Electrical control of supply of combustible mixture or its constituents characterised by the use of digital means
- F02D41/2406—Electrical control of supply of combustible mixture or its constituents characterised by the use of digital means using essentially read only memories
- F02D41/2425—Particular ways of programming the data
- F02D41/2429—Methods of calibrating or learning
- F02D41/2477—Methods of calibrating or learning characterised by the method used for learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/17—Function evaluation by approximation methods, e.g. inter- or extrapolation, smoothing, least mean square method
- G06F17/175—Function evaluation by approximation methods, e.g. inter- or extrapolation, smoothing, least mean square method of multidimensional data
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/02—Circuit arrangements for generating control signals
- F02D41/14—Introducing closed-loop corrections
- F02D41/1401—Introducing closed-loop corrections characterised by the control or regulation method
- F02D2041/1413—Controller structures or design
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/02—Circuit arrangements for generating control signals
- F02D41/14—Introducing closed-loop corrections
- F02D41/1401—Introducing closed-loop corrections characterised by the control or regulation method
- F02D2041/1413—Controller structures or design
- F02D2041/1423—Identification of model or controller parameters
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/02—Circuit arrangements for generating control signals
- F02D41/14—Introducing closed-loop corrections
- F02D41/1401—Introducing closed-loop corrections characterised by the control or regulation method
- F02D2041/1433—Introducing closed-loop corrections characterised by the control or regulation method using a model or simulation of the system
Abstract
Die Erfindung betrifft ein Verfahren zum Erstellen eines datenbasierten Funktionsmodells, insbesondere eines Gauß-Prozess-Modells, mit folgenden Schritten: – Bereitstellen (S1) von Trainingsdaten; – Unterteilen (S2) der Trainingsdaten in Untermengen von Trainingsdaten; – Erstellen (S3) eines datenbasierten lokalen Teilmodells (51) basierend auf jeder der Untermenge der Trainingsdaten; und – Kombinieren (S5) der lokalen Teilmodelle (51), um das datenbasierte Funktionsmodell zu erhalten.The invention relates to a method for creating a data-based function model, in particular a Gaussian process model, with the following steps: providing (S1) training data; - dividing (S2) the training data into subsets of training data; - creating (S3) a data-based local sub-model (51) based on each of the subset of the training data; and - combining (S5) the local submodels (51) to obtain the data-based functional model.
Description
Technisches GebietTechnical area
Die vorliegende Erfindung betrifft Steuergeräte für Motorsysteme, insbesondere Steuergeräte mit einer separaten Recheneinheit zum Auswerten von datenbasierten Funktionsmodellen, wie beispielsweise Gauß-Prozess-Modellen. Die vorliegende Erfindung betrifft weiterhin Algorithmen zum Erstellen von datenbasierten Funktionsmodellen basierend auf Trainingsdaten.The present invention relates to control devices for engine systems, in particular control devices with a separate computing unit for evaluating data-based function models, such as Gaussian process models. The present invention further relates to algorithms for creating data-based function models based on training data.
Stand der TechnikState of the art
Bislang werden Funktionsmodelle in Steuergeräten, d. h. Strecken- und Systemmodelle, durch die Vorgabe von Kennfeldern, Kennlinien oder ein physikalisches System nachbildenden Funktionen implementiert. Diese werden von einem Benutzer durch Anpassen der Modellparameter an die Gegebenheiten des physikalischen Systems adaptiert.So far, functional models in ECUs, i. H. Track and system models, implemented by the specification of maps, characteristics or a physical system replicating functions. These are adapted by a user by adapting the model parameters to the conditions of the physical system.
Eine Alternative stellt die Verwendung von nicht parametrischen, datenbasierten Funktionsmodellen dar, mit denen die Funktionen physikalischer Systeme im Wesentlichen ohne die Vorgabe von Parametern nachgebildet werden können. Als datenbasiertes Funktionsmodell kann beispielsweise ein Gauß-Prozess-Modell verwendet werden, das im Wesentlichen durch Hyperparameter und Stützstellen definiert wird. Die datenbasierten Funktionsmodelle werden auf Grundlage von Trainingsdaten erstellt, die in einem Prüfsystem ermittelt werden können. Die Stützstellen für das Gauß-Prozess-Modell können den Trainingsdaten entsprechen bzw. aus diesen ausgewählt sein oder generiert werden.An alternative is the use of non-parametric, data-based function models, with which the functions of physical systems can be simulated essentially without the specification of parameters. As a data-based functional model, for example, a Gaussian process model can be used, which is essentially defined by hyperparameters and support points. The data-based functional models are created on the basis of training data that can be determined in a test system. The support points for the Gaussian process model can correspond to the training data or can be selected from it or generated.
Insbesondere lokale Effekte können unter Umständen von dem erstellten datenbasierten Funktionsmodell nicht angemessen abgebildet werden. Wurde bereits ein datenbasiertes Funktionsmodell auf Grundlage von Trainingsdaten eines anfänglichen Trainingsdatensatzes bestimmt, so ist es zudem schwierig, Trainingsdaten eines nachträglich ermittelten Trainingsdatensatzes in angemessener Weise in dem bereits erstellten datenbasierten Funktionsmodell zu berücksichtigen. Durch das bloße Vereinigen der Trainingsdatensätze mit oder ohne Variation der Hyperparameter des datenbasierten Modells können lokale Effekte jedoch nur dann angemessen berücksichtigt werden, wenn die Trainingsdaten des nachträglich hinzugefügten Trainingsdatensatzes eine ausreichende Anzahl an Messpunkten aufweisen. Weiterhin ist es erforderlich, dass die Messpunkte des nachträglich hinzugefügten Trainingsdatensatzes nicht im Widerspruch zu bereits vorhandenen Messpunkten des anfänglichen Trainingsdatensatzes stehen, d. h. eine relativ große Abweichung zu diesen aufweisen. Anderenfalls erhält man datenbasierte Funktionsmodelle mit hohem Messrauschen und folglich hohem Modellfehler für die Funktionswerte im Bereich des lokalen Effekts.In particular, local effects may not be adequately mapped by the created data-based function model. If a data-based functional model has already been determined on the basis of training data of an initial training data record, then it is difficult to appropriately include training data of a subsequently determined training data record in the already created data-based functional model. However, by simply merging the training data sets with or without varying the hyperparameters of the data-based model, local effects can only be adequately considered if the training data of the subsequently added training data set has a sufficient number of measurement points. Furthermore, it is necessary that the measurement points of the subsequently added training data set are not inconsistent with already existing measurement points of the initial training data set, ie. H. have a relatively large deviation from these. Otherwise, one obtains data-based function models with high measurement noise and consequently high model error for the function values in the area of the local effect.
Aus dem Stand der Technik sind Steuergeräte mit einem Mikrocontroller und einer separaten Modellberechnungseinheit zur Berechnung von datenbasierten Modellen in einem Steuergerät bekannt. So ist beispielsweise aus
Weiterhin ist aus
Offenbarung der ErfindungDisclosure of the invention
Erfindungsgemäß sind das Verfahren zum Erstellen eines datenbasierten Funktionsmodells basierend auf Trainingsdaten gemäß Anspruch 1 sowie die Vorrichtung, das Computerprogramm und das Steuergerät gemäß den nebengeordneten Ansprüchen vorgesehen.According to the invention, the method for creating a data-based functional model based on training data according to
Weitere Ausgestaltungen sind in den abhängigen Ansprüchen angegeben.Further embodiments are specified in the dependent claims.
Gemäß einem ersten Aspekt ist ein Verfahren zum Erstellen eines datenbasierten Funktionsmodells, insbesondere eines Gauß-Prozess-Modells, vorgesehen, das die folgenden Schritte umfasst:
- – Bereitstellen von Trainingsdaten;
- – Unterteilen der Trainingsdaten in Untermengen von Trainingsdaten;
- – Erstellen eines datenbasierten lokalen Teilmodells basierend auf jeder der Untermengen der Trainingsdaten; und
- – Kombinieren der lokalen Teilmodelle, um das datenbasierte Funktionsmodell zu erhalten.
- - providing training data;
- - dividing the training data into subsets of training data;
- - creating a data-based local sub-model based on each of the subsets of the training data; and
- Combining the local submodels to obtain the data-based function model.
Eine Idee des obigen Verfahrens zum Erstellen eines datenbasierten Funktionsmodells besteht darin, Trainingsdaten eines vorgegebenen Trainingsdatensatzes in mehrere Untermengen zu unterteilen und daraus datenbasierte lokale Teilmodelle zu generieren. Das zu erstellende datenbasierte Funktionsmodell wird dann als Kombination der gewichteten lokalen Teilmodellen gebildet. Das Erstellen der lokalen datenbasierten Teilmodellen erfolgt in gleicher Weise wie die an sich bekannte Erstellung von nicht parametrischen datenbasierten Modellen.One idea of the above method for creating a data-based function model is to subdivide training data of a given training data set into a plurality of sub-sets and to generate data-based local submodels therefrom. The data-based function model to be created is then formed as a combination of the weighted local submodels. The creation of the local data-based submodels takes place in the same way as the known creation of non-parametric data-based models.
Insbesondere beim Modellieren von dynamischem Verhalten ist das Erstellen des datenbasierten Funktionsmodells über lokale Teilmodelle vorteilhaft, da das Erstellen eines globalen datenbasierten Funktionsmodells basierend auf der gesamten Trainingsdatenmenge ungenau ist. Ein Grund hierfür liegt beispielsweise darin, dass man mit einem einzigen Datensatz (entweder stationär oder dynamisch) nicht die gesamte Dynamik des Systems abbilden kann.In particular, when modeling dynamic behavior, creating the data-based function model via local submodels is advantageous because creating a global data-based function model based on the total amount of training data is inaccurate. One reason for this, for example, is that one single record (either stationary or dynamic) can not map the overall dynamics of the system.
Üblicherweise weist ein Eingangsgrößenraum von dynamischen Systemen komplexere Hüllen auf und ist größer als Eingangsgrößenräume mit nur stationären Eingangsgrößen. Die Hüllen von dynamischen Eingangsgrößenräumen weisen zudem konkave Formen auf, was eine Schätzung der Hülle erschwert.Usually, an input size space of dynamic systems has more complex envelopes and is larger than input size spaces with only stationary input variables. The envelopes of dynamic input size spaces also have concave shapes, making it difficult to estimate the envelope.
Die Verwendung von lokalen Teilmodellen ermöglicht eine inkrementelle Adaptierung bzw. Erweiterung von datenbasierten Funktionsmodellen für dynamische Systeme durch Hinzufügen und gegebenenfalls Entfernen von datenbasierten Teilmodellen, die basierend auf dem dynamischen Eingangsgrößenraum des physikalischen Modells erstellt worden sind. Das obige Verfahren ermöglicht durch die Berücksichtigung des dynamikfüllenden Eingangsgrößenraums auch eine verbesserte Modellierung der lokalen Effekte, die durch das dynamische Verhalten des physikalischen Systems bewirkt werden.The use of local submodels allows incremental adaptation or expansion of data-based functional models for dynamic systems by adding and possibly removing data-based submodels that have been created based on the dynamic input space of the physical model. The above method also allows improved modeling of the local effects caused by the dynamic behavior of the physical system by taking into account the dynamics-filling input space.
Darüber hinaus kann, da die Rechenkomplexität bei herkömmlichen datenbasierten Funktionsmodellen n3 (n = Anzahl der Trainingsdatenpunkte) entspricht, die Komplexität durch Erstellen von Teilmodellen aus Teilmengen der dynamikfüllenden Trainingsdaten erheblich reduziert werden.In addition, because the computational complexity of traditional data-based function models is n 3 (n = number of training data points), complexity can be significantly reduced by building sub-models from subsets of the dynamics-filling training data.
Die Gewichtung der Teilmodelle kann mithilfe der prädiktiven Varianz erfolgen. Die prädiktive Varianz kann als Metrik dienen, welche den Abstand des Abfragepunktes von der Hülle des jeweiligen Teilmodells angibt. Das Abstandsmaß dient als Beschreibung der Unsicherheit des Teilmodells.The weighting of the submodels can be done using the predictive variance. The predictive variance can serve as a metric indicating the distance of the query point from the shell of the respective submodel. The distance measure serves as a description of the uncertainty of the submodel.
Die additive Zusammenführung von mehreren datenbasierten Teilmodellen hat den weiteren Vorteil, dass diese in einem Steuergerät mit einer zusätzlichen Modellberechnungseinheit in einfacher Weise gerechnet werden kann.The additive combination of several data-based submodels has the further advantage that they can be easily calculated in a control unit with an additional model calculation unit.
Durch das Vorsehen der Modellberechnungseinheit, die in selbstständiger Weise mehrere datenbasierte Teilmodelle nacheinander berechnet und die resultierenden Teilergebnisse aufaddiert, wird eine einfache Ermittlung eines Funktionswerts basierend auf dem obigen additiven Funktionsmodell ermöglicht. Indem vermieden wird, dass die Recheneinheit die Modellberechnungseinheit für die Berechnung jedes einzelnen Teilmodells vorbereiten muss, kann die Berechnung eines entsprechenden Funktionswerts deutlich beschleunigt werden.By providing the model calculation unit which independently calculates a plurality of data-based submodels one by one and adds up the resulting sub-results, a simple determination of a function value based on the above additive function model is enabled. By avoiding that the arithmetic unit must prepare the model calculation unit for the calculation of each individual submodel, the calculation of a corresponding function value can be significantly accelerated.
Weiterhin können die Trainingsdaten Trainingsdatenpunkte umfassen, wobei die Trainingsdaten Trainingsdatenpunkte umfassen, wobei jeder Trainingsdatenpunkt einen Wert mindestens einer Messgröße eines aktuellen Rechenzyklus, einen Wert mindestens einer Ausgangsgröße eines aktuellen Rechenzyklus, mindestens einen Wert einer der Messgrößen aus einem vorangehenden Rechenzyklus und/oder einen Wert der Ausgangsgröße aus einem vorangehenden Rechenzyklus als Eingangsgrößenwerte beinhaltet.Furthermore, the training data may comprise training data points, the training data comprising training data points, each training data point having a value of at least one measurement variable of a current calculation cycle, a value of at least one output variable of a current calculation cycle, at least one value of one of the measurement variables from a preceding calculation cycle and / or a value of Output variable from a previous calculation cycle includes as input values.
Gemäß einer Ausführungsform kann das Unterteilen der Trainingsdaten manuell oder automatisch, insbesondere mithilfe eines k-Means-Algorithmus oder eines Mean-Shift-Algorithmus durchgeführt werden.According to one embodiment, the subdivision of the training data may be performed manually or automatically, in particular using a k-means algorithm or a mean-shift algorithm.
Es kann vorgesehen sein, dass das Unterteilen der Trainingsdaten durchgeführt wird, indem Untermengen von Trainingsdatenpunkten gebildet werden, wobei die Trainingsdatenpunkte einer Untermenge so gewählt sind, dass sie eine euklidische Distanz zueinander aufweisen, die kleiner ist als ein vorgegebener Schwellenwert.It can be provided that the subdivision of the training data is performed by forming subsets of training data points, wherein the training data points of a subset so are selected to have an Euclidean distance from each other that is less than a predetermined threshold.
Insbesondere kann das Kombinieren der lokalen Teilmodelle durch Bilden eines gewichteten Durchschnitts der lokalen Teilmodelle durchgeführt werden.In particular, the combining of the local submodels may be performed by forming a weighted average of the local submodels.
Gemäß einer Ausführungsform können die lokalen Teilmodelle abhängig von einem Maß der Modellunsicherheit, insbesondere abhängig von einer prädiktiven Varianz, gewichtet werden.According to one embodiment, the local submodels may be weighted depending on a measure of the model uncertainty, in particular depending on a predictive variance.
Weiterhin können in dem erstellten datenbasierten Funktionsmodell neue Trainingsdatenpunkte berücksichtigt werden, indem diese einer der Untermengen der Trainingsdaten hinzugefügt werden.Furthermore, in the created data-based function model, new training data points can be taken into account by adding them to one of the subsets of the training data.
In dem erstellten datenbasierten Funktionsmodell kann ein neuer Trainingsdatenpunkt berücksichtigt werden, indem dieser einer der Untermengen der ursprünglichen Trainingsdaten hinzugefügt wird, das lokale Teilmodell aus der entsprechenden Untermenge der ursprünglichen Trainingsdaten erstellt wird und das entsprechende lokale Teilmodell anschließend mit den übrigen lokalen Teilmodellen kombiniert wird.In the created data-based function model, a new training data point may be taken into account by adding it to one of the subsets of the original training data, building the local sub-model from the corresponding subset of the original training data, and then combining the corresponding local sub-model with the remaining local sub-models.
Gemäß einem weiteren Aspekt ist ein Verfahren zum Bereitstellen eines datenbasierten Funktionsmodells vorgesehen, wobei Trainingsdatenpunkte aus einem oder mehreren Funktionsbereichen des datenbasierten Funktionsmodells ausgewählt werden und ein weiteres datenbasiertes Funktionsmodell basierend auf den ausgewählten Trainingsdatenpunkten entsprechend dem obigen Verfahren ermittelt wird, wobei das datenbasierte Funktionsmodell und das weitere datenbasierte Funktionsmodell kombiniert werden.According to a further aspect, a method for providing a data-based function model is provided, wherein training data points are selected from one or more functional areas of the data-based functional model and another data-based functional model is determined based on the selected training data points according to the above method, wherein the data-based functional model and the other data-based functional model can be combined.
Weiterhin können die Trainingsdatenpunkte aus den Trainingsdaten ausgewählt werden, wenn deren Varianz einen vorgegebenen Varianzschwellenwert übersteigt.Furthermore, the training data points may be selected from the training data if their variance exceeds a predetermined variance threshold.
Weiterhin können das datenbasierte Funktionsmodell und das weitere datenbasierte Funktionsmodell kombiniert werden, indem aus den Funktionsmodellen ein gewichteter Durchschnitt gebildet wird, wobei die Funktionsmodelle insbesondere basierend auf der prädiktiven Varianz gewichtet werden.Furthermore, the data-based function model and the further data-based function model can be combined by forming a weighted average from the function models, wherein the function models are weighted in particular on the basis of the predictive variance.
Gemäß einem weiteren Aspekt ist eine Vorrichtung, insbesondere eine Recheneinheit, zum Erstellen eines datenbasierten Funktionsmodells, insbesondere eines Gauß-Prozess-Modells, vorgesehen, wobei die Vorrichtung ausgebildet ist, um
- – Trainingsdaten bereitzustellen;
- – die Trainingsdaten in Untermengen von Trainingsdaten zu unterteilen;
- – ein datenbasiertes lokales Teilmodell basierend auf jeder der Untermengen der Trainingsdaten zu erstellen; und
- – die lokalen Teilmodelle zu kombinieren, um das datenbasierte Funktionsmodell zu erhalten.
- - provide training data;
- - subdivide the training data into subsets of training data;
- To create a data-based local sub-model based on each of the subsets of the training data; and
- - Combine the local submodels to obtain the data-based functional model.
Gemäß einem weiteren Aspekt ist ein Computerprogramm vorgesehen, welches dazu eingerichtet ist, alle Schritte des obigen Verfahrens zum Erstellen eines datenbasierten Funktionsmodells auszuführen.According to a further aspect, a computer program is provided, which is set up to execute all steps of the above method for creating a data-based function model.
Kurzbeschreibung der ZeichnungenBrief description of the drawings
Ausführungsformen werden nachfolgend anhand der beigefügten Zeichnungen näher erläutert. Es zeigen:Embodiments are explained below with reference to the accompanying drawings. Show it:
Beschreibung von AusführungsformenDescription of embodiments
Mögliche Messgrößen, die durch die Teststeuereinheit
Um das dynamische Verhalten des Verbrennungsmotors
Die durch die Kombination der Werte der Messgrößen u definierten Messpunkte X in einem Eingangsgrößenraum sollen möglichst sowohl raumfüllend als auch dynamikfüllend sein. Raumfüllend sind die so generierten Messpunkte X, wenn der Abstand jedes durch die Kombination der diskretisierten Signalwerte der Eingangssignale bestimmten Messpunkts X von mindestens einem weiteren der so bestimmten Messpunkte X kleiner als ein vorgegebener Abstandswert ist. Analog sind die so generierten Messpunkte X dynamikfüllend, wenn der Abstand jedes durch die Kombination der diskretisierten Signalwerte der Eingangssignale und deren zeitlichen Gradienten bestimmten Messpunkts X von mindestens einem weiteren der so bestimmten Messpunkte X kleiner als ein vorgegebener Dynamik-Abstandswert ist.The measuring points X defined by the combination of the values of the measured quantities u in an input variable space should as far as possible be both space-filling and dynamic-filling. The measuring points X thus generated are space-filling if the distance of each measuring point X determined by the combination of the discretized signal values of the input signals from at least one further of the measuring points X thus determined is smaller than a predetermined distance value. Analogously, the measuring points X generated in this way are dynamic filling when the distance of each measuring point X determined by the combination of the discretized signal values of the input signals and their temporal gradients from at least one further of the measuring points X thus determined is smaller than a predetermined dynamic distance value.
Die mit dem obigen Prüfstand
Die Verwendung von nicht parametrischen, datenbasierten Funktionsmodellen basiert auf einem Bayes-Regressionsverfahren. Die Grundlagen der Bayes-Regression sind beispielsweise in
Die abstrakten Hyperparameter werden durch ein Optimierungsverfahren bestimmt. Eine Möglichkeit für ein solches Optimierungsverfahren besteht in einer Optimierung einer Marginal Likelihood p(Y|H, X). Die Marginal Likelihood p(Y|H, X) beschreibt die Plausibilität der gemessenen y-Werte der Trainingsdaten, dargestellt als Vektor Y, gegeben die Modellparameter H und die x-Werte (Werte der Eingangsgrößen) der Trainingsdaten. Im Modelltraining wird p(Y|H, X) maximiert, indem geeignete Hyperparameter gesucht werden, die zu einem Verlauf der durch die Hyperparameter und die Trainingsdaten bestimmten Modellfunktion führen und die Trainingsdaten möglichst genau abbilden. Zur Vereinfachung der Berechnung wird der Logarithmus von p(Y|H, X) maximiert, da der Logarithmus die Stetigkeit der Plausibilitätsfunktion nicht verändert.The abstract hyperparameters are determined by an optimization method. One possibility for such an optimization method is an optimization of a marginal likelihood p (Y | H, X). The marginal likelihood p (Y | H, X) describes the plausibility of the measured y-values of the training data, represented as vector Y, given the model parameters H and the x-values (input values) of the training data. In model training, p (Y | H, X) is maximized by searching for suitable hyperparameters that result in a course of the model function determined by the hyperparameters and the training data and map the training data as accurately as possible. To simplify the calculation, the logarithm of p (Y | H, X) is maximized because the logarithm does not change the continuity of the plausibility function.
Die herkömmliche Modellierung von nicht parametrischen, datenbasierten Funktionsmodellen führt nicht immer zu ausreichend genauen Modellen. Ein Grund hierfür besteht darin, dass sich aus der großen Anzahl von dynamisch erfassten Messdaten 100.000 oder mehr Trainingsdatenpunkte ergeben, so dass die ursprünglichen Daten reduziert und/oder spärliche Gauß-Prozesse angewendet werden müssen. Somit können die resultierenden datenbasierten Funktionsmodelle hinsichtlich ihrer Genauigkeit aufgrund des Informationsverlusts ungenau sein.Conventional modeling of non-parametric, data-based function models does not always yield sufficiently accurate models. One reason for this is that the large number of dynamically acquired measurement data results in 100,000 or more training data points, so the original data must be reduced and / or sparse Gaussian processes applied. Thus, the resulting data-based functional models may be inaccurate in accuracy due to information loss.
Weiterhin ist es in der Regel nicht möglich, die Eingangsgrößen x zum Abbilden aller dynamischen Effekte des physikalischen Systems 2 zu variieren, so dass ein resultierendes datenbasiertes Funktionsmodell häufig nicht alle Effekte, die in dem physikalischen System 2 auftreten können, exakt abbilden kann. Herkömmliche Modellierungen für ein datenbasiertes Funktionsmodell, wie zum Beispiel das Gauß-Prozess-Modell, ergeben eine globale dynamische Repräsentation der Trainingsdaten, bei der lokale dynamische Effekte vernachlässigt werden können.Furthermore, it is generally not possible to vary the input quantities x for mapping all the dynamic effects of the
Weiterhin ist es bei herkömmlichen datenbasierten Funktionsmodellen schwierig, bereits erstellte Modelle bei Vorhandensein von neuen Trainingsdaten zu adaptieren. Bislang ist es notwendig, das gesamte datenbasierte Funktionsmodell erneut zu lernen, wenn zusätzliche Trainingsdaten hinzugefügt werden sollen. Dies ist jedoch besonders schwierig, wenn die Gesamtmenge von Trainingsdaten den Rechenaufwand zur Erstellung des datenbasierten Funktionsmodells erheblich vergrößert.Furthermore, with traditional data-based function models, it is difficult to adapt already created models in the presence of new training data. So far, it is necessary to re-learn the entire data-based function model if additional training data is to be added. However, this is particularly difficult if the total amount of training data significantly increases the computational effort to create the data-based functional model.
Zum Modellieren von dynamischen Prozessen kann eine Eingangsgrößenstruktur verwendet werden, die auch als ”Nonlinear Autoregression With Exogenous Inputs (NARX)” bekannt ist. Eine typische NARX-Struktur ist in
Ein Gauß-Prozess entspricht einer multivariaten Gauß-Funktion mit zufälligen variablen Punkten. Ein Gauß-Prozess wird vollständig durch die Mittelwertfunktion μ(x) und die Kovarianz k(X, X)-Funktion beschrieben.
Die Kovarianzfunktion kann mit einem positiv definiten Kern, zum Beispiel einem quadratischen Exponentialkern, beschrieben werden:
Die prädiktive Varianz kann als ein Maß für die Modellunsicherheit interpretiert werden. Je größer der Wert der Varianz ist, desto unsicherer ist das datenbasierte Funktionsmodell bezüglich der Vorhersage des Abfragepunkts. Diese Varianz kann für die Prädiktion in dem nachfolgend beschriebenen Verfahren zum Erstellen eines datenbasierten Funktionsmodells verwendet werden. Das beschriebene Verfahren basiert auf dem separaten Erstellen von lokalen Teilmodellen
In
In Schritt S1 wird für jeden Rechenzyklus ein Eingangsgrößenvektor x bereitgestellt, der die Messgrößenwerte der Messgrößen u der durch das Prüfsystem
In Schritt S2 werden die Trainingsdaten in Cluster unterteilt bzw. klassifiziert. Das Aufteilen der Trainingsdaten kann entweder manuell durch Expertenwissen oder mit herkömmlichen automatisierten Clustering-Verfahren durchgeführt werden, um Untermengen der Trainingsdaten zu erhalten. Die Aufteilung durch Expertenwissen kann manuell basierend auf physikalischen Erkenntnissen erfolgen. Zum Beispiel kann ein Experte bei Vorhandensein von verschiedenen Systemmodi die bestimmten Betriebsmodi anhand von Wertebereichen einer, mehrerer oder aller Eingangsgrößen x identifizieren und somit die bereitgestellten Trainingsdaten in geeignete Untermengen unterteilen. In vielen Anwendungsfällen kann der Experte die Trainingsdatenpunkte manuell selektieren und dadurch das zu erlernende Funktionsmodell verbessern.In step S2, the training data is divided into clusters. The splitting of the training data may be performed either manually by expert knowledge or by conventional automated clustering techniques to obtain subsets of the training data. The division by expert knowledge can be done manually based on physical findings. For example, in the presence of various system modes, an expert may identify the particular modes of operation based on ranges of values of one, more, or all inputs x, thus subdividing the provided training data into appropriate subsets. In many applications, the expert can manually select the training data points and thereby improve the functional model to be learned.
Liegt kein Expertenwissen vor, so können herkömmliche automatische Clustering- oder Klassifizierungsverfahren verwendet werden, wie zum Beispiel ein k-Means-Algorithmus, ein Mean-Shift-Algorithmus und dergleichen. Dabei müssen geeignete Metriken für die Klassifizierung der Trainingsdaten untersucht und ausgewählt werden.If no expert knowledge is available, conventional automatic clustering or classification methods can be used, such as a k-means algorithm, a mean-shift algorithm and the like. In doing so, suitable metrics for the classification of the training data must be examined and selected.
In Schritt S3 wird nun für jede der erhaltenen Untermengen von Trainingsdaten in oben beschriebener Weise ein lokales Teilmodell
In Schritt S4 werden für alle lokalen Teilmodelle
In Schritt S5 wird nun ein gewichteter Durchschnitt der lokalen Teilmodelle
Nach der Gewichtung der einzelnen Teilmodelle werden diese in Schritt S6 aufsummiert, um das datenbasierte Funktionsmodell zu erhalten. Bei einer Anzahl m von lokalen Teilmodellen
Hier wird die prädiktive Varianz covi(x*) zum Gewichten der entsprechenden mittleren Prädiktionswerte
Die grundlegende Struktur der gewichteten Prädiktion ist in
Die entsprechende Varianz der lokalen Teilmodelle
Mithilfe dieser Gleichungen kann die mittlere Prädiktion und Varianz der lokalen Teilmodelle
Durch das obige Verfahren kann die Genauigkeit von Berechnungen von Funktionswerten mithilfe von datenbasierten Funktionsmodellen deutlich verbessert werden. Dies liegt insbesondere daran, dass durch die Kombination der dynamischen Betrachtung der Messgrößen u und/oder der Ausgangsgröße y in Verbindung mit der Unterteilung des so entstehenden Eingangsgrößenraums die komplexe Hülle des Eingangsgrößenraums eines dynamischen Systems besser in dem resultierenden datenbasierten Funktionsmodell abgebildet werden kann als dies bei einer bloßen stationären Betrachtung der Fall wäre.The above method can significantly improve the accuracy of function value calculations using data-based function models. This is due in particular to the fact that the complex envelope of the input variable space of a dynamic system can be mapped better in the resulting data-based functional model than in the case of the combination of the dynamic consideration of the measured quantities u and / or the output variable y in conjunction with the subdivision of the resulting input variable space a mere stationary consideration would be the case.
Bezüglich des obigen Schritts der Klassifizierung können die Metriken für die Klassifizierung der Trainingsdaten auch verwendet werden, um nachträglich neue Trainingsdaten zu einem lokalen Teilmodell
Kommen nach dem Erstellen eines datenbasierten Funktionsmodells basierend auf ursprünglichen Trainingsdaten neue Trainingsdatenpunkte NTP hinzu, so können diese auch den bestehenden Untermengen der ursprünglichen Trainingsdaten hinzugefügt werden.
In
In Schritt S11 wird der betreffende neue Trainingsdatenpunkt NTP zu jeder der zuvor ermittelten Untermengen der ursprünglichen Trainingsdatenpunkte hinzugefügt und die jeweilige prädiktive Varianz ermittelt. Der neue Trainingsdatenpunkt NTP wird in Schritt S12 derjenigen Untermenge hinzugefügt, zu der die geringste Varianz ermittelt worden ist. Da die prädiktive Varianz Teil des Ansatzes der lokalen Teilmodelle
In dem Diagramm der
Um bei der Klassifizierung der Trainingsdaten ein Messrauschen zu berücksichtigen, das zu Abweichungen des Werts der Ausgangsgröße y an einer Position im Eingangsgrößenraum führt, kann das Aufteilen der Trainingsdaten in Untermengen mithilfe der euklidischen Distanz der Trainingsdatenpunkte im Eingangsgrößenraum vorgenommen werden. Das heißt, Trainingsdatenpunkte werden mithilfe ihrer euklidischen Distanz zueinander in Untermengen aufgeteilt, so dass die Unterschiede bezüglich ihrer Varianzen zueinander erfasst werden können.In order to take into account a measurement noise in the classification of the training data, which leads to deviations of the value of the output variable y at a position in the input size space, the division of the training data into subsets can be performed using the Euclidean distance of the training data points in the input size space. That is, training data points are subdivided into subsets using their Euclidean distance so that differences in their variances can be detected.
Das Aufteilen der Trainingsdaten unter Berücksichtigung der euklidischen Distanz kann dazu dienen, die Varianz im Eingangsgrößenraum zu optimieren. Die Aufteilung in Untermengen kann beispielsweise durch einen Schwellwertvergleich der euklidischen Distanz mit einem vorgegebenen Schwellenwert vorgenommen werden. Das heißt Trainingsdatenpunkte, deren euklidische Distanzen zueinander kleiner als der vorgegebene Schwellenwert sind, werden einer Untermenge der Trainingsdatenpunkte zugeordnet.The splitting of the training data taking into account the Euclidean distance can serve to optimize the variance in the input size space. The division into subsets can be carried out, for example, by a threshold value comparison of the Euclidean distance with a predetermined threshold value. That is, training data points whose Euclidean distances are smaller than the predetermined threshold are assigned to a subset of the training data points.
Eine weitere Variante bei der Klassifizierung besteht darin, dass nur diejenigen Untermengen der Trainingsdaten berücksichtigt werden, deren Varianzen jeweils unter einem vorgegebenen Varianzschwellenwert liegen. Für die so ausgewählten Untermengen werden lokale Funktionsmodelle
Entsprechend dem durch das Flussdiagramm der
In Schritt S22 wird für die Trainingsdatenpunkte, die in den entsprechenden Funktionsbereichen des datenbasierten Funktionsmodells liegen, wie in Verbindung mit dem Flussdiagramm der
Das Erstellen des Weiteren datenbasierten Funktionsmodells kann mit geringem Aufwand erfolgen, je nachdem bei welchem Wert der Varianzschwellenwert festgelegt wird. Insbesondere kann der Varianzschwellenwert so festgelegt werden, dass zwischen 10 und 50%, vorzugsweise zwischen 10 und 20% der Trainingsdatenpunkte der Erstellung des weiteren datenbasierten Funktionsmodells zugrunde gelegt werdenThe creation of the additional data-based function model can be done with little effort, depending on which value the variance threshold is set. In particular, the variance threshold can be set such that between 10 and 50%, preferably between 10 and 20%, of the training data points are used to create the further data-based function model
Durch Trainingsdatenpunkte, die auch in dem Eingangsgrößenraum des ursprünglichen datenbasierten Funktionsmodells liegen, erhält man eine Überlappung zwischen den beiden datenbasierten Funktionsmodellen bei dem ursprünglich bereitgestellten datenbasierten Funktionsmodell und dem lokalen Teilmodell
ZITATE ENTHALTEN IN DER BESCHREIBUNG QUOTES INCLUDE IN THE DESCRIPTION
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of the documents listed by the applicant has been generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA assumes no liability for any errors or omissions.
Zitierte PatentliteraturCited patent literature
- DE 102010028259 A1 [0005] DE 102010028259 A1 [0005]
Zitierte Nicht-PatentliteraturCited non-patent literature
- C. Plagemann, K. Kersting, W. Burgard, ”Nonstationary Gaussian Process Regression Using Point Estimates of Local Smoothness”, ICML Proceedings, Seiten 204–2116, 2006 [0006] C. Plagemann, K. Kersting, W. Burgard, "Nonstationary Gaussian Process Regression Using Point Estimates of Local Smoothness", ICML Proceedings, pages 204-2116, 2006 [0006]
- C. E. Rasmussen et al., „Gaussian Processes for Machine Learning”, MIT Press 2006 [0045] CE Rasmussen et al., Gaussian Processes for Machine Learning, MIT Press 2006 [0045]
Claims (15)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102014207683.8A DE102014207683A1 (en) | 2014-04-24 | 2014-04-24 | Method and device for creating a data-based function model |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102014207683.8A DE102014207683A1 (en) | 2014-04-24 | 2014-04-24 | Method and device for creating a data-based function model |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102014207683A1 true DE102014207683A1 (en) | 2015-10-29 |
Family
ID=54261665
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102014207683.8A Pending DE102014207683A1 (en) | 2014-04-24 | 2014-04-24 | Method and device for creating a data-based function model |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE102014207683A1 (en) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102018001727A1 (en) * | 2018-03-05 | 2019-09-05 | Mtu Friedrichshafen Gmbh | Method for model-based control and regulation of an internal combustion engine |
WO2020030481A1 (en) * | 2018-08-10 | 2020-02-13 | Mtu Friedrichshafen Gmbh | Method for the model-based control and regulation of an internal combustion engine |
CN113010501A (en) * | 2019-12-19 | 2021-06-22 | 北京国双科技有限公司 | Recovery ratio prediction model obtaining method, recovery ratio prediction method and product |
WO2021170761A1 (en) * | 2020-02-28 | 2021-09-02 | Mtu Friedrichshafen Gmbh | Method for the model-based open-loop and closed-loop control of an internal combustion engine |
DE102021202287A1 (en) | 2021-03-09 | 2022-09-15 | Robert Bosch Gesellschaft mit beschränkter Haftung | Method and device for operating a fuel injector using machine learning methods |
DE102021202289A1 (en) | 2021-03-09 | 2022-09-15 | Robert Bosch Gesellschaft mit beschränkter Haftung | Computer-implemented method and device for training a data-based time determination model for determining an opening or closing time of an injection valve using machine learning methods |
US11506165B2 (en) | 2020-11-11 | 2022-11-22 | Robert Bosch Gmbh | Method for ascertaining a variable characterizing a flow rate of a fuel injector |
US11620519B2 (en) * | 2019-12-11 | 2023-04-04 | Hyundai Motor Company | Big data-based driving information provision system and method thereof |
US11966843B2 (en) | 2022-06-13 | 2024-04-23 | Intel Corporation | Methods and apparatus for distributed training of a neural network |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102010028259A1 (en) | 2010-04-27 | 2011-10-27 | Robert Bosch Gmbh | A microcontroller having a computing unit and a logic circuit and method for performing calculations by a microcontroller for control or in-vehicle control |
-
2014
- 2014-04-24 DE DE102014207683.8A patent/DE102014207683A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102010028259A1 (en) | 2010-04-27 | 2011-10-27 | Robert Bosch Gmbh | A microcontroller having a computing unit and a logic circuit and method for performing calculations by a microcontroller for control or in-vehicle control |
Non-Patent Citations (2)
Title |
---|
C. E. Rasmussen et al., "Gaussian Processes for Machine Learning", MIT Press 2006 |
C. Plagemann, K. Kersting, W. Burgard, "Nonstationary Gaussian Process Regression Using Point Estimates of Local Smoothness", ICML Proceedings, Seiten 204-2116, 2006 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102018001727B4 (en) * | 2018-03-05 | 2021-02-11 | Mtu Friedrichshafen Gmbh | Method for model-based control and regulation of an internal combustion engine |
US11156183B2 (en) | 2018-03-05 | 2021-10-26 | Mtu Friedrichshafen Gmbh | Method for the model-based control and regulation of an internal combustion engine |
DE102018001727A1 (en) * | 2018-03-05 | 2019-09-05 | Mtu Friedrichshafen Gmbh | Method for model-based control and regulation of an internal combustion engine |
WO2020030481A1 (en) * | 2018-08-10 | 2020-02-13 | Mtu Friedrichshafen Gmbh | Method for the model-based control and regulation of an internal combustion engine |
US11620519B2 (en) * | 2019-12-11 | 2023-04-04 | Hyundai Motor Company | Big data-based driving information provision system and method thereof |
CN113010501A (en) * | 2019-12-19 | 2021-06-22 | 北京国双科技有限公司 | Recovery ratio prediction model obtaining method, recovery ratio prediction method and product |
WO2021170761A1 (en) * | 2020-02-28 | 2021-09-02 | Mtu Friedrichshafen Gmbh | Method for the model-based open-loop and closed-loop control of an internal combustion engine |
US11846243B2 (en) | 2020-02-28 | 2023-12-19 | Rolls-Royce Solutions GmbH | Method for the model-based open-loop and closed-loop control of an internal combustion engine |
US11506165B2 (en) | 2020-11-11 | 2022-11-22 | Robert Bosch Gmbh | Method for ascertaining a variable characterizing a flow rate of a fuel injector |
DE102021202287A1 (en) | 2021-03-09 | 2022-09-15 | Robert Bosch Gesellschaft mit beschränkter Haftung | Method and device for operating a fuel injector using machine learning methods |
DE102021202287B4 (en) | 2021-03-09 | 2023-03-23 | Robert Bosch Gesellschaft mit beschränkter Haftung | Method and device for operating a fuel injector using machine learning methods |
DE102021202289A1 (en) | 2021-03-09 | 2022-09-15 | Robert Bosch Gesellschaft mit beschränkter Haftung | Computer-implemented method and device for training a data-based time determination model for determining an opening or closing time of an injection valve using machine learning methods |
US11966843B2 (en) | 2022-06-13 | 2024-04-23 | Intel Corporation | Methods and apparatus for distributed training of a neural network |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE102014207683A1 (en) | Method and device for creating a data-based function model | |
AT513189B1 (en) | Method for determining a control-technical observer for the SoC | |
EP2106576B1 (en) | Method for the computer-assisted control and/or regulation of a technical system | |
DE102013220432A1 (en) | Model calculation unit for an integrated control module for the calculation of LOLIMOT | |
DE202018102632U1 (en) | Device for creating a model function for a physical system | |
EP3398092A1 (en) | Method for configuring a co-simulation for a total system | |
DE102013206264A1 (en) | Method and apparatus for performing a calculation of a data-based function model | |
DE102013224698A1 (en) | Method and device for determining a data-based function model | |
DE102013206292A1 (en) | Method and device for creating a data-based function model | |
DE102014225039A1 (en) | Method and apparatus for providing sparse Gaussian process models for calculation in an engine control unit | |
DE102017213510A1 (en) | Method and apparatus for generating a machine learning system, and virtual sensor device | |
DE102013206304A1 (en) | Method and apparatus for creating a non-parametric, data-based function model | |
DE102013227183A1 (en) | Method and apparatus for providing a sparse Gaussian process model for calculation in an engine control unit | |
EP2088486A1 (en) | Method for measuring a non-linear dynamic real system using design of experiment | |
DE102013206291A1 (en) | Method and apparatus for creating a non-parametric, data-based function model | |
DE102020212280A1 (en) | Method and device for training a state model based on artificial intelligence for determining a state variable of an electrical energy store | |
DE102015208513A1 (en) | Method and apparatus for calculating a data-based multi-output functional model | |
DE102013212889A1 (en) | Method and device for creating a control for a physical unit | |
DE102015221819A1 (en) | Method and device for adapting a data-based function model for calculation in a model calculation unit | |
DE102013206274A1 (en) | Method and apparatus for adapting a non-parametric function model | |
DE102013214967A1 (en) | Method and device for adapting a data-based function model | |
DE102014208379A1 (en) | Method and device for determining a function value of a data-based function model inverted relative to an input variable | |
DE102017204173A1 (en) | Method and device for determining a customized data-based function model for the calculation of a model value with a modified input variable vector | |
DE102015203771A1 (en) | Method and device for evaluating a data-based function model | |
DE102017118996B3 (en) | Method for determining influencing parameter combinations of a physical simulation model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R012 | Request for examination validly filed |