DE102013224698A1 - Verfahren und Vorrichtung zum Ermitteln eines datenbasierten Funktionsmodells - Google Patents

Verfahren und Vorrichtung zum Ermitteln eines datenbasierten Funktionsmodells Download PDF

Info

Publication number
DE102013224698A1
DE102013224698A1 DE102013224698.6A DE102013224698A DE102013224698A1 DE 102013224698 A1 DE102013224698 A1 DE 102013224698A1 DE 102013224698 A DE102013224698 A DE 102013224698A DE 102013224698 A1 DE102013224698 A1 DE 102013224698A1
Authority
DE
Germany
Prior art keywords
training data
output
data points
input
gaussian process
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102013224698.6A
Other languages
English (en)
Inventor
Ernst Kloppenburg
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Priority to DE102013224698.6A priority Critical patent/DE102013224698A1/de
Priority to US15/100,432 priority patent/US10402739B2/en
Priority to CN201480065972.7A priority patent/CN105765562B/zh
Priority to PCT/EP2014/071843 priority patent/WO2015082107A2/de
Priority to JP2016536213A priority patent/JP6283112B2/ja
Publication of DE102013224698A1 publication Critical patent/DE102013224698A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zum Erstellen eines Gauß-Prozess-Modells als ein datenbasiertes Funktionsmodell für eine zu modellierende Ausgangsgröße basierend auf Trainingsdaten in einem Eingangsdatenraum, umfassend die folgenden Schritte: – Bereitstellen (S1) von Trainingsdaten mit Trainingsdatenpunkten und den Trainingsdatenpunkten zugeordneten Ausgangswerten einer oder mehrerer Ausgangsgrößen; – Ermitteln (S2) einer von der Position der Trainingsdatenpunkte im Eingangsdatenraum abhängigen Punktedichte; – Ermitteln (S3) einer Längenskalenfunktion für jede Eingangsgröße der Trainingsdaten abhängig von der Punktedichte; und – Generieren (S4) eines Gauß-Prozess-Modells aus den Trainingsdaten und den Ausgangswerten der zu modellierende Ausgangsgröße basierend auf den ermittelten Längenskalenfunktionen.

Description

  • Technisches Gebiet
  • Die vorliegende Erfindung betrifft Verfahren zum Erstellen von datenbasierten Funktionsmodellen zur Modellierung von physikalischen Einheiten. Insbesondere betrifft die vorliegende Erfindung Maßnahmen zum Berücksichtigen von ungleichmäßig verteilten Trainingsdatenpunkten bei der Erstellung eines Gauß-Prozess-Modells als datenbasiertes Funktionsmodell.
  • Stand der Technik
  • Bei der Vermessung einer physikalischen Einheit, um Trainingsdaten zur Erstellung eines die physikalische Einheit beschreibenden Modells zu generieren, treten häufig in Teilbereichen des Eingangsdatenraums stärkere Variationen einer Ausgangsgröße auf als in anderen Bereichen. Daher werden in den Teilbereichen, in denen diese stärkeren Variationen der Ausgangsgröße auftreten, in der Regel mehr Messpunkte vorgesehen, d.h. dort liegt eine höhere Messpunktdichte vor. Die resultierenden Trainingsdaten weisen dadurch letztlich Häufungen von Trainingsdatenpunkten in den betreffenden Teilbereichen des Eingangsdatenraums auf.
  • Die Trainingsdaten können zur Erstellung eines datenbasierten Funktionsmodells, insbesondere eines Gauß-Prozess-Modells, verwendet werden. Während üblicherweise davon auszugehen ist, dass eine höhere Dichte von Trainingsdatenpunkten zu einer höheren Genauigkeit eines Modells, insbesondere eines datenbasierten Funktionsmodells, führt, so ist dies bei der Generierung eines Gauß-Prozess-Modells nicht automatisch der Fall. Zwar werden bei der Erstellung eines Gauß-Prozess-Modells nur wenige Modellierungsannahmen getroffen, jedoch besteht eine übliche Grundannahme darin, dass der Verlauf der Modellfunktion im gesamten Definitionsbereich gleich glatt ist. Mit anderen Worten, das Gauß-Prozess-Modell weist im gesamten Definitionsbereich örtlich konstante Längenskalen (Length Scales) auf. Dies kann dazu führen, dass eine lokale starke Variation als Messfehler interpretiert und somit durch Glättung aus dem modellierten Verlauf des Funktionsmodells entfernt wird.
  • In der Literatur sind Ansätze bekannt, um die Gauß-Prozess-Modelle mit ortsabhängigen Längenskalen zu erweitern. Damit kann für die Längenskalen eine beliebige lineare oder nichtlineare Funktion über den Eingangsdatenraum angegeben werden. Weiterhin können für die Längenskalen parametrisierte Funktionen vorgegeben und die Parameter dieser parametrierten Längenskalenfunktionen mit statistischen Methoden aus den Messtrainingsdaten geschätzt werden. Diese Ansätze sind jedoch sehr rechenaufwändig und bei höherdimensionalen Trainingsdaten nicht geeignet. Weiterhin erfordern parametrierte Längenskalenfunktionen eine höhere Anzahl von Trainingsdatenpunkten, da die Information über den Verlauf der Längenskalen aus den Trainingsdaten extrahiert werden muss. Die Komplexität der obigen Ansätze steigt mit der Anzahl der Dimensionen des Eingangsdatenraums erheblich an (insbesondere da Integrale numerisch gelöst werden müssen).
  • Offenbarung der Erfindung
  • Erfindungsgemäß sind ein Verfahren zum Erstellen eines Gauß-Prozess-Modells als ein datenbasiertes Funktionsmodell gemäß Anspruch 1 sowie eine Vorrichtung und ein Computerprogramm gemäß den nebengeordneten Ansprüchen vorgesehen.
  • Weitere Ausgestaltungen sind in den abhängigen Ansprüchen angegeben.
  • Gemäß einem ersten Aspekt ist ein Verfahren zum Erstellen eines Gauß-Prozess-Modells als ein datenbasiertes Funktionsmodell für eine zu modellierende Ausgangsgröße basierend auf Trainingsdaten in einem Eingangsdatenraum vorgesehen, das die folgenden Schritte umfasst:
    • – Bereitstellen von Trainingsdaten mit Trainingsdatenpunkten und den Trainingsdatenpunkten zugeordneten Ausgangswerten einer oder mehrerer Ausgangsgrößen;
    • – Ermitteln einer von der Position der Trainingsdatenpunkte im Eingangsdatenraum abhängigen Punktedichte;
    • – Ermitteln einer Längenskalenfunktion für jede Eingangsgröße der Trainingsdaten abhängig von der Punktedichte; und
    • – Generieren eines Gauß-Prozess-Modells aus den Trainingsdaten und den Ausgangswerten der zu modellierenden Ausgangsgröße basierend auf den ermittelten Längenskalenfunktionen.
  • Herkömmliche Gauß-Prozess-Modelle bilden ein Systemverhalten basierend auf Hyperparametern, nämlich der Varianz σf und den Längenskalen, die für jede Dimension des Eingangsdatenraums konstant sind, sowie mit einem Parametervektor ab, in dem die Hyperparameter und die Werte der Ausgangsgröße der Trainingsdaten berücksichtigt sind. Durch die konstanten Längenskalen werden insbesondere stärkere Variationen innerhalb eines Teilbereichs des Eingangsdatenraums nicht ausreichend berücksichtigt. Die Funktion der Längenskalen in Gaußprozessmodellen ist insbesondere in C. E. Rasmussen et al., „Gaussian Processes for Machine Learning", MIT Press, 2006, ISBN 026218253X, www.GaussianProcess.org/gpml ausführlich erläutert.
  • Eine Idee des obigen Verfahrens umgeht diese Probleme der hohen Komplexität der Berechnung zum Vorsehen variierender Längenskalen dadurch, dass die Dichte der Trainingsdatenpunkte in den Teilbereichen des Eingangsdatenraums als Information zur Spezifizierung der Längenskalen verwendet wird. Dadurch ergibt sich ein erweitertes Gauß-Prozess-Modell, das stärkere Variationen in Teilbereichen des Eingangsdatenraums berücksichtigen kann.
  • Weiterhin kann das Bereitstellen von Trainingsdaten umfassen, dass die Punktedichte von Trainingsdatenpunkten der Trainingsdaten in einem Teilbereich des Eingangsdatenraums erhöht wird, wenn die Variation der Werte der Ausgangsgröße überdurchschnittlich ist.
  • Insbesondere kann eine überdurchschnittliche Variation der Werte der Ausgangsgröße durch Vergleichen einer Varianz der Trainingsdatenpunkte in dem Teilbereich mit einer durchschnittlichen Varianz der Trainingsdatenpunkte im gesamten Eingangsdatenraum festgestellt werden.
  • Es kann vorgesehen sein, dass die Punktedichte als Funktion über den durch die Trainingsdatenpunkte gebildeten Eingangsdatenraum bereitgestellt wird.
  • Gemäß einer Ausführungsform kann die Punktedichte als eine Anzahl von Trainingsdatenpunkten in einem Teilbereich des Eingangsdatenraums angegeben werden.
  • Weiterhin kann zum Generieren des Gauß-Prozessmodells eine Kovarianzfunktion mit variablen Längenskalen der Längenskalenfunktionen verwendet werden, insbesondere in Form einer Gibbs-Kovarianzfunktion.
  • Es kann vorgesehen sein, dass die Längenskalenfunktionen proportional zu einem Kehrwert der D-ten Wurzel der von der Position der Trainingsdatenpunkte abhängigen Punktedichte ist, wobei D der Dimension des Eingangsdatenraums entspricht.
  • Gemäß einem weiteren Aspekt ist eine Vorrichtung zum Erstellen eines Gauß-Prozess-Modells als ein datenbasiertes Funktionsmodell für eine zu modellierende Ausgangsgröße basierend auf Trainingsdaten in einem Eingangsdatenraum vorgesehen, wobei die Vorrichtung ausgebildet ist, um:
    • – eine von der Position der Trainingsdatenpunkte im Eingangsdatenraum abhängige Punktedichte zu ermitteln, wobei die Trainingsdaten mit den Trainingsdatenpunkten und den Trainingsdatenpunkten zugeordneten Ausgangswerten einer oder mehrerer Ausgangsgrößen bereitgestellt werden;
    • – eine Längenskalenfunktion für jede Eingangsgröße der Trainingsdaten abhängig von der Punktedichte zu ermitteln; und
    • – ein Gauß-Prozess-Modell aus den Trainingsdaten und den Ausgangswerten der zu modellierenden Ausgangsgröße basierend auf den ermittelten Längenskalenfunktionen zu generieren.
  • Kurzbeschreibung der Zeichnungen
  • Ausführungsformen werden nachfolgend anhand der beigefügten Zeichnungen näher erläutert. Es zeigen:
  • 1 eine schematische Darstellung eines Testsystems zur Aufnahme von Mess- bzw. Trainingsdaten, um aus diesen ein datenbasiertes Funktionsmodell zum Modellieren der physikalischen Einheit zu erstellen;
  • 2 ein Flussdiagramm zur Veranschaulichung eines Verfahrens zum Erstellen eines Gauß-Prozess-Modells mit variablen Längenskalen; und
  • 3a und 3b Darstellungen von modellierten Kurven von Gauß-Prozess-Modellen, die mit und ohne Berücksichtigung einer lokalen Punktedichte der Trainingsdatenpunkte erste llt wurden, sowie eines Verlaufs der zugrundeliegenden lokalen Punktedichte.
  • Beschreibung von Ausführungsformen
  • 1 zeigt eine schematische Darstellung eines Test- bzw. Prüfsystems 1, das zur Vermessung einer physikalischen Einheit 2 ausgebildet ist. Eine physikalische Einheit 2 kann beispielsweise einem Verbrennungsmotor eines Kraftfahrzeugs oder Teilsystemen davon entsprechen. Eine Vermessungseinheit 3 steuert die physikalische Einheit 2 mit Ansteuergrößen E an, die zu bestimmten Betriebspunkten bzw. Betriebszuständen der physikalischen Einheit 2 führen. Weiterhin resultiert die Ansteuerung der physikalischen Einheit 2 in einer oder mehreren Ausgangsgrößen A, die ebenfalls gemessen werden können und deren entsprechende Messwerte an die Vermessungseinheit 3 kommuniziert werden.
  • Je nach Modellierungsziel können die Ansteuergrößen E und die Betriebsgrößen des sich daraus in der physikalischen Einheit 2 ergebenden Betriebszustands als Eingangsgrößen für die Trainingsdaten sowie eine oder mehrere weitere der Betriebsgrößen eine bzw. mehrere den Trainingsdaten zugeordnete Ausgangsgrößen A darstellen. Während einer Vermessung der physikalischen Einheit 2 durch die Vermessungseinheit 3 erfasste Werte der Eingangsgrößen bilden einen Trainingsdatenpunkt, dem ein entsprechender Wert der Ausgangsgrößen A bzw. ein Wert einer der Ausgangsgrößen A zugeordnet wird.
  • In der Regel werden zur vollständigen Vermessung der physikalischen Einheit 2 die Betriebszustände über einen großen Bereich von Betriebsgrößen variiert, um so eine möglichst raumfüllende Abdeckung des Eingangsdatenraums durch die Trainingsdatenpunkte zu erreichen. Beim Abfahren der Betriebszustände zur Erfassung der Trainingsdaten können Bereiche des Eingangsdatenraums durchfahren werden, bei denen lokal starke Variationen von Ausgangsgrößen A auftreten können. Diese lokal stärkeren Variationen können beispielsweise durch Vergleichen von lokal ermittelten Varianzen der Trainingsdatenpunkte mit einer durchschnittlichen Varianz aller Trainingsdatenpunkte im Eingangsdatenraum bestimmt werden. Um diese Variationen in den Trainingsdaten abzubilden, werden in den entsprechenden Teilbereichen häufig die Abstände zwischen den die Betriebszustände definierenden Betriebsgrößen bzw. den Eingangsgrößen verringert, so dass eine lokale Häufung von Trainingsdatenpunkten in den Bereichen starker lokaler Variationen der Ausgangsgrößen A auftreten kann.
  • Zur Erstellung von Modellen von physikalischen Einheiten 2 können datenbasierte Verfahren verwendet werden, um nicht parametrische, datenbasierte Funktionsmodelle zu erstellen. Insbesondere werden häufig Verfahren zum Erstellen von Gauß-Prozess-Modellen eingesetzt.
  • Die Verwendung von nicht parametrischen, datenbasierten Funktionsmodellen basiert auf einem Bayes-Regressionsverfahren. Die Grundlagen der Bayes-Regression sind beispielsweise in C. E. Rasmussen et al., "Gaussian Processes for Machine Learning", MIT Press 2006, beschrieben. Bei der Bayes-Regression handelt es sich um ein datenbasiertes Verfahren, das auf einem Modell basiert. Zur Erstellung des Modells sind Trainingsdatenpunkte der Trainingsdaten sowie zugehörige Ausgangswerte der einen oder den mehreren Ausgangsgrößen erforderlich. Die Erstellung des Modells erfolgt mithilfe von Stützstellendaten, die den Trainingsdaten ganz oder teilweise entsprechen oder aus diesen generiert werden. Weiterhin werden abstrakte Hyperparameter und ein Parametervektor bestimmt, die den Raum der Modellfunktionen parametrieren und effektiv den Einfluss der einzelnen Stützstellen auf die spätere Modellvorhersage gewichten.
  • Die abstrakten Hyperparameter werden durch ein Optimierungsverfahren bestimmt. Eine Möglichkeit für ein solches Optimierungsverfahren besteht in einer Optimierung einer Marginal Likelihood p(Y|H, X). Die Marginal Likelihood p(Y|H, X) beschreibt die Plausibilität der gemessenen y-Werte der Trainingsdaten, dargestellt als Vektor Y, gegeben die Modellparameter H und die x-Werte der Trainingsdaten. Im Modelltraining wird p(Y|H, X) maximiert, indem geeignete Hyperparameter gesucht werden, die zu einem Verlauf der durch die Hyperparameter und die Trainingsdaten bestimmten Modellfunktion führen und die Trainingsdaten möglichst genau abbilden. Zur Vereinfachung der Berechnung wird der Logarithmus von p(Y|H, X) maximiert, da der Logarithmus die Stetigkeit der Plausibilitätsfunktion nicht verändert.
  • Die Berechnung eines Gauß-Prozess-Modells erfolgt mit den Eingangswerten u ~d für einen Testpunkt u (Eingangsgrößenvektor), der zunächst üblicherweise entsprechend der folgenden Formel normiert wird:
    Figure DE102013224698A1_0002
  • Dabei entsprechen mx der Mittelwertfunktion bezüglich eines Mittelwerts der Eingangswerte der Stützstellendaten, sy der Varianz der Eingangswerte der Stützstellendaten und d dem Index für die einzelnen Dimensionen des Testpunkts u.
  • Als Ergebnis der Erstellung des nicht parametrischen, datenbasierten Funktionsmodells erhält man:
    Figure DE102013224698A1_0003
  • Der so ermittelte Modellwert v wird mithilfe einer Ausgangsnormierung normiert, und zwar gemäß der Formel: v ~ = vsy + my.
  • Dabei entsprechen v einem normierten Modellwert (Ausgangswert) an einem normierten Testpunkt u (Eingangsgrößenvektor der Dimension D), v ~ einem (nicht normierten) Modellwert (Ausgangswert) an einem (nicht normierten) Testpunkt (Eingangsgrößenvektor der Dimension D), xi einer Stützstelle der Stützstellendaten, N der Anzahl der Stützstellen der Stützstellendaten, D der Dimension des Eingangsdaten-/Trainingsdaten-/ Stützstellendatenraums, sowie ld und σf den Hyperparametern, d. h. den dimensionsabhängigen Längenskalen und einer Varianz, aus dem Modelltraining. Der Parametervektor Qy ist eine aus den Hyperparametern und den Trainingsdaten berechnete Größe. Weiterhin entsprechen my der Mittelwertfunktion bezüglich eines Mittelwerts der Ausgangswerte der Stützstellendaten und sy der Varianz der Ausgangswerte der Stützstellendaten.
  • Die Eingangs- und Ausgangsnormierung wird durchgeführt, da die Berechnung des Gauß-Prozess-Modells typischerweise in einem normierten Raum stattfindet.
  • Um das Problem des lokalen Auftretens stärkerer Variationen der Ausgangsgrößen zu berücksichtigen, werden zu den oben beschriebenen allgemeinen Formeln des Gauß-Prozess-Modells variierende Längenskalen vorgesehen. Die Längenskalen variieren abhängig von den Eingangsgrößen bzw. abhängig von dem Ort bzw. Bereich innerhalb des durch die Trainingsdaten aufgespannten Eingangsdatenraums. Bisher bekannte Verfahren, um das oben beschriebene Problem durch Längenskalen-Funktionsmodelle zu berücksichtigen, sind aufwändig, und es ist daher vorgesehen, die Längenskalen für jede Dimension der Eingangsgrößen abhängig von einer Dichte der Trainingsdatenpunkte innerhalb des Eingangsdatenraums anzupassen. Insbesondere wird das Gauß-Prozessmodell so modifiziert, dass als Kovarianzfunktion eine Kovarianzfunktion mit variablen Längenskalen verwendet wird, zum Beispiel in Form einer Gibbs-Kovarianzfunktion.
  • Zusätzlich zu dem Verfahren zum Erstellen des Gauß-Prozess-Modells wird ein Schätzverfahren verwendet, das für jeden Punkt X im Eingangsdatenraum die lokale Punktdichte schätzen kann. Die Punktdichte p(X) ist proportional zur Anzahl der Punkte pro Raumeinheit im d-dimensionalen Eingangsdatenraum in der Nähe von X. Als Schätzverfahren für die Punktdichte sind verschiedene Algorithmen denkbar. Beispielsweise ist allgemein ein Verfahren zur Kerndichteschätzung bekannt, wie beispielsweise aus der Druckschrift P. Mills, "Efficient Statistical Classification of Satellite Measurements", 2011, International Journal of Mode Sensing 32 (21). Als Längenskalenfunktion für jede Achsenrichtung, d. h. für jede Dimension des Eingangsdatenraums, wird nun eine Funktion der folgenden Form verwendet:
    Figure DE102013224698A1_0004
  • Das heißt, die Längenskalenfunktion ld(x) ist ein Produkt aus einem skalaren Faktor für jede Eingangsdimension und einem Term, der auf der Schätzung der lokalen Punktedichte p(X) basiert. Dieser Term ist die D-te Wurzel (D = Anzahl der Dimensionen des Eingangsdatenraums) des Kehrwerts der Punktedichte und die Skalenfaktoren ld werden bei der Hyperparameter-Optimierung aus den Trainingsdaten geschätzt, so dass lokal ein unterschiedliches Verhalten für verschiedene Achsenrichtungen, d. h. für die verschiedenen Dimensionen des Eingangsdatenraums, möglich ist, so wie es auch beim herkömmlichen Gauß-Prozess-Modell der Fall ist.
  • Mithilfe des Flussdiagramms der 2 wird das Verfahren zum Ermitteln eines Gauß-Prozess-Modells beschrieben, das lokal stärkere Variationen berücksichtigt. In Schritt S1 werden dazu Trainingsdaten und den Trainingsdatenpunkten entsprechende Ausgangswerte der einen oder mehreren Ausgangsgrößen bereitgestellt.
  • In Schritt S2 wird nun die Punktedichte der Trainingsdatenpunkte im Eingangsdatenraum wie oben beschrieben ermittelt und in Schritt S3 erfolgt die Ermittlung der Längenskalen für jede Dimension, d. h. für jede Eingangsgröße, abhängig von der Punktedichte, z. B. entsprechend obiger Formel.
  • Das Gauß-Prozess-Modell wird nun in Schritt S4 basierend auf den Trainingsdaten, den Ausgangswerten der einen oder den mehreren Ausgangsgrößen sowie basierend auf den gemäß Schritt S3 vorgegebenen Längenskalen ermittelt.
  • In den 3a und 3b ist beispielhaft für einen zweidimensionalen Messdatenraum ein datenbasiertes Funktionsmodell in Form eines Gauß-Prozess-Modells und in Form eines Gauß-Prozess-Modells mit Berücksichtigung einer Dichteschätzung graphisch dargestellt. Die Werte der Trainingsdaten P (Trainingsdatenpunkte) variieren im Bereich 0 < x < 0,5 besonders stark. Daher wurde dort auch die Punktedichte der Trainingsdatenpunkte P erhöht.
  • Der Verlauf der Punktedichte p(x) für die in 3a dargestellten Trainingsdaten ist in 3b dargestellt. In 3a sind mithilfe eines jeweiligen Gauß-Prozess-Modells erstellte Modellkurven dargestellt. Die erste Kurve K1 zeigt ein herkömmliches Gauß-Prozess-Modell mit konstanten Längenskalen. Die zweite Kurve K2 zeigt ein Gauß-Prozess-Modell, das die ortsabhängigen Längenskalen berücksichtigt. Man erkennt, dass die zweite Kurve K2 den Verlauf der Trainingsdatenpunkte exakter nachbilden kann.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Nicht-Patentliteratur
    • C. E. Rasmussen et al., „Gaussian Processes for Machine Learning“, MIT Press, 2006, ISBN 026218253X, www.GaussianProcess.org/gpml [0008]
    • C. E. Rasmussen et al., "Gaussian Processes for Machine Learning“, MIT Press 2006 [0025]
    • P. Mills, "Efficient Statistical Classification of Satellite Measurements", 2011, International Journal of Mode Sensing 32 (21) [0034]

Claims (11)

  1. Verfahren zum Erstellen eines Gauß-Prozess-Modells als ein datenbasiertes Funktionsmodell für eine zu modellierende Ausgangsgröße basierend auf Trainingsdaten in einem Eingangsdatenraum, umfassend die folgenden Schritte: – Bereitstellen (S1) von Trainingsdaten mit Trainingsdatenpunkten und den Trainingsdatenpunkten zugeordneten Ausgangswerten einer oder mehrerer Ausgangsgrößen; – Ermitteln (S2) einer von der Position der Trainingsdatenpunkte im Eingangsdatenraum abhängigen Punktedichte; – Ermitteln (S3) einer Längenskalenfunktion für jede Eingangsgröße der Trainingsdaten abhängig von der Punktedichte; und – Generieren (S4) eines Gauß-Prozess-Modells aus den Trainingsdaten und den Ausgangswerten der zu modellierende Ausgangsgröße basierend auf den ermittelten Längenskalenfunktionen.
  2. Verfahren nach Anspruch 1, wobei das Bereitstellen von Trainingsdaten umfasst, dass die Punktedichte von Trainingsdatenpunkten der Trainingsdaten in einem Teilbereich des Eingangsdatenraums erhöht wird, wenn die Variation der Werte der Ausgangsgröße überdurchschnittlich ist.
  3. Verfahren nach Anspruch 2, wobei eine überdurchschnittliche Variation der Werte der Ausgangsgröße durch Vergleichen einer Varianz der Trainingsdatenpunkte in dem Teilbereich mit einer durchschnittlichen Varianz der Trainingsdatenpunkte im gesamten Eingangsdatenraum festgestellt wird.
  4. Verfahren nach einem der Ansprüche 1 bis 3, wobei die Punktedichte als Funktion über den durch die Trainingsdatenpunkte gebildeten Eingangsdatenraum bereitgestellt wird.
  5. Verfahren nach Anspruch 4, wobei die Punktedichte als eine Anzahl von Trainingsdatenpunkten in einem Teilbereich des Eingangsdatenraums angegeben wird.
  6. Verfahren nach einem der Ansprüche 1 bis 5, wobei zum Generieren des Gauß-Prozessmodells eine Kovarianzfunktion mit variablen Längenskalen der Längenskalenfunktionen verwendet wird, insbesondere in Form einer Gibbs-Kovarianzfunktion.
  7. Verfahren nach einem der Ansprüche 1 bis 5, wobei die Längenskalenfunktionen proportional zu einem Kehrwert der D-ten Wurzel der von dem Ort der Trainingsdatenpunkte abhängigen Punktedichte ist, wobei D der Dimension des Eingangsdatenraums entspricht.
  8. Vorrichtung zum Erstellen eines Gauß-Prozess-Modells als ein datenbasiertes Funktionsmodell für eine zu modellierende Ausgangsgröße basierend auf Trainingsdaten in einem Eingangsdatenraum, wobei die Vorrichtung ausgebildet ist, um: – eine von der Position der Trainingsdatenpunkte im Eingangsdatenraum abhängige Punktedichte zu ermitteln, wobei die Trainingsdaten mit den Trainingsdatenpunkten und den Trainingsdatenpunkten zugeordneten Ausgangswerten einer oder mehrerer Ausgangsgrößen bereitgestellt werden; – Längenskalenfunktionen für jede Eingangsgröße der Trainingsdaten abhängig von der Punktedichte zu ermitteln; und – ein Gauß-Prozess-Modell aus den Trainingsdaten und den Ausgangswerten der zu modellierenden Ausgangsgröße basierend auf den ermittelten Längenskalenfunktionen zu generieren.
  9. Computerprogramm, welches dazu eingerichtet ist, alle Schritte eines Verfahrens nach einem der Ansprüche 1 bis 7 auszuführen.
  10. Elektronisches Speichermedium, auf welchem ein Computerprogramm nach Anspruch 9 gespeichert ist.
  11. Elektronisches Steuergerät, welches ein elektronisches Speichermedium nach Anspruch 10 aufweist.
DE102013224698.6A 2013-12-03 2013-12-03 Verfahren und Vorrichtung zum Ermitteln eines datenbasierten Funktionsmodells Pending DE102013224698A1 (de)

Priority Applications (5)

Application Number Priority Date Filing Date Title
DE102013224698.6A DE102013224698A1 (de) 2013-12-03 2013-12-03 Verfahren und Vorrichtung zum Ermitteln eines datenbasierten Funktionsmodells
US15/100,432 US10402739B2 (en) 2013-12-03 2014-10-13 Method and device for determining a data-based functional model
CN201480065972.7A CN105765562B (zh) 2013-12-03 2014-10-13 用于求取基于数据的函数模型的方法和设备
PCT/EP2014/071843 WO2015082107A2 (de) 2013-12-03 2014-10-13 Verfahren und vorrichtung zum ermitteln eines datenbasierten funktionsmodells
JP2016536213A JP6283112B2 (ja) 2013-12-03 2014-10-13 データに基づく関数モデルを定めるための方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102013224698.6A DE102013224698A1 (de) 2013-12-03 2013-12-03 Verfahren und Vorrichtung zum Ermitteln eines datenbasierten Funktionsmodells

Publications (1)

Publication Number Publication Date
DE102013224698A1 true DE102013224698A1 (de) 2015-06-03

Family

ID=51703161

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102013224698.6A Pending DE102013224698A1 (de) 2013-12-03 2013-12-03 Verfahren und Vorrichtung zum Ermitteln eines datenbasierten Funktionsmodells

Country Status (5)

Country Link
US (1) US10402739B2 (de)
JP (1) JP6283112B2 (de)
CN (1) CN105765562B (de)
DE (1) DE102013224698A1 (de)
WO (1) WO2015082107A2 (de)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102015225250A1 (de) * 2015-12-15 2017-06-22 Robert Bosch Gmbh Verfahren und Vorrichtung zum Bestimmen eines Gasmassenstroms in einem Verbrennungsmotor
DE102017215420A1 (de) * 2016-09-07 2018-03-08 Robert Bosch Gmbh Modellberechnungseinheit und Steuergerät zur Berechnung eines RBF-Modells
US11176487B2 (en) * 2017-09-28 2021-11-16 Oracle International Corporation Gradient-based auto-tuning for machine learning and deep learning models
DE102018001727B4 (de) * 2018-03-05 2021-02-11 Mtu Friedrichshafen Gmbh Verfahren zur modellbasierten Steuerung und Regelung einer Brennkraftmaschine
JP2019157652A (ja) * 2018-03-07 2019-09-19 トヨタ自動車株式会社 内燃機関の制御装置
JP7172616B2 (ja) * 2019-01-11 2022-11-16 日本電信電話株式会社 データ解析装置、方法、及びプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3746729B2 (ja) * 2002-04-17 2006-02-15 東京瓦斯株式会社 機器の劣化を検出する方法
JP4442211B2 (ja) * 2003-12-12 2010-03-31 セイコーエプソン株式会社 音響モデル作成方法
GB0718534D0 (en) * 2007-09-21 2007-10-31 Univ Manchester Method for indicating a characteristic of bone mineral density
US20090150126A1 (en) * 2007-12-10 2009-06-11 Yahoo! Inc. System and method for sparse gaussian process regression using predictive measures
CN101540047A (zh) * 2009-04-30 2009-09-23 西安电子科技大学 基于独立高斯混合模型的纹理图像分割方法
CN102034472A (zh) * 2009-09-28 2011-04-27 戴红霞 一种基于嵌入时延神经网络的高斯混合模型的说话人识别方法
JP5860237B2 (ja) * 2011-07-26 2016-02-16 アズビル株式会社 パラメータ決定方法および装置
CN103049930B (zh) * 2012-12-06 2016-07-06 南方医科大学 三维医学图像动态高斯体模型绘制方法
CN103354041B (zh) * 2013-06-25 2015-12-09 上海交通大学 一种民用飞机地形感知与告警系统模式四告警包线生成方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
C. E. Rasmussen et al., "Gaussian Processes for Machine Learning", MIT Press 2006
C. E. Rasmussen et al., "Gaussian Processes for Machine Learning", MIT Press, 2006, ISBN 026218253X, www.GaussianProcess.org/gpml
P. Mills, "Efficient Statistical Classification of Satellite Measurements", 2011, International Journal of Mode Sensing 32 (21)

Also Published As

Publication number Publication date
CN105765562B (zh) 2022-01-11
WO2015082107A3 (de) 2015-07-30
JP2017502390A (ja) 2017-01-19
JP6283112B2 (ja) 2018-02-21
CN105765562A (zh) 2016-07-13
WO2015082107A2 (de) 2015-06-11
US10402739B2 (en) 2019-09-03
US20160300152A1 (en) 2016-10-13

Similar Documents

Publication Publication Date Title
DE102013224698A1 (de) Verfahren und Vorrichtung zum Ermitteln eines datenbasierten Funktionsmodells
DE102016009106A1 (de) Mit Steuerung ausgerüstete Bearbeitungsvorrichtung mit Bearbeitungszeit- Messfunktion und Messfunktion auf der Maschine
AT513189B1 (de) Verfahren zur Ermittlung eines regelungstechnischen Beobachters für den SoC
EP2999998B1 (de) Methode zur ermittlung eines modells einer ausgangsgrösse eines technischen systems
EP2442248B1 (de) Kopplungsmethodik für nicht-iterative Co-Simulation
DE102011081346A1 (de) Verfahren zum Erstellen einer Funktion für ein Steuergerät
DE112023000011T5 (de) Ein primäres Frequenzmodulationssteuersystem der thermischen Stromerzeugungseinheit mit kleinen Störungen
DE102013213420A1 (de) Modellberechnungseinheit, Steuergerät und Verfahrenzum Berechnen eines datenbasierten Funktionsmodells
DE102016216945A1 (de) Verfahren und Vorrichtung zum Ausführen einer Funktion basierend auf einem Modellwert eines datenbasierten Funktionsmodells basierend auf einer Modellgültigkeitsangabe
DE102013220432A1 (de) Modellberechnungseinheit für einen integrierten Steuerbaustein zur Berechnung von LOLIMOT
DE102016011525A1 (de) Vorrichtung für maschinelles Lernen und Spulen-Produktionsvorrichtung
DE102013219236A1 (de) System und verfahren zum beurteilen eines computermodells in bezug auf empirische ergebnisse für dynamische systeme
DE202019006019U1 (de) Techniken zum Analysieren von Fahrzeugdesignabweichungen unter Verwendung von Deep Learning mit neuronalen Netzwerken
DE102014207683A1 (de) Verfahren und Vorrichtung zum Erstellen eines datenbasierten Funktionsmodells
DE102017209262A1 (de) Verfahren und Vorrichtung zur automatischen Gestenerkennung
DE102013206264A1 (de) Verfahren und Vorrichtung zur Durchführung einer Berechnung eines datenbasierten Funktionsmodells
DE102015225250A1 (de) Verfahren und Vorrichtung zum Bestimmen eines Gasmassenstroms in einem Verbrennungsmotor
DE102015216953A1 (de) Verfahren und Vorrichtung zum Vermessen einer zu testenden Einheit
DE102013206304A1 (de) Verfahren und Vorrichtung zum Erstellen eines nicht parametrischen, datenbasierten Funktionsmodells
DE102014225039A1 (de) Verfahren und Vorrichtung zum Bereitstellen von spärlichen Gauß-Prozess-Modellen zur Berechnung in einem Motorsteuergerät
DE102019210507A1 (de) Vorrichtung und computerimplementiertes Verfahren für die Verarbeitung digitaler Sensordaten und Trainingsverfahren dafür
DE102013206291A1 (de) Verfahren und Vorrichtung zum Erstellen eines nicht parametrischen, datenbasierten Funktionsmodells
DE102014117857A1 (de) Verfahren und System zur Kontrolle des Drucks eines Reifens
DE102015221819A1 (de) Verfahren und Vorrichtung zum Adaptieren eines datenbasierten Funktionsmodells zur Berechnung in einer Modellberechnungseinheit
DE102013212889A1 (de) Verfahren und Vorrichtung zum Erstellen einer Regelungfür eine physikalische Einheit

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication