-
Stand der Technik
-
Die Erfindung geht aus von einer Vorrichtung, einem System und computerimplementiertes Verfahren zum Betreiben eines technischen Systems.
-
Zum Betreiben von technischen Systemen können Gaußprozesse zur Regression eingesetzt werden. Maschinelle Lernverfahren, in denen ein Gaußprozess zur Regression erlernt wird, erfordern große Mengen Daten zum Lernen und benötigen viele Rechenressourcen, z.B. Rechenzeit oder Rechenleistung.
-
Offenbarung der Erfindung
-
Durch die folgende Offenbarung wird ein Bereich, aus dem eine Eingangsgröße eines Gaußprozesses entnommen wird, in Teilbereiche unterteilt und mit einer Informationsbasierten Auswahl von Eingangsgrößen aus dem Bereich verbunden. Durch den Einsatz einer über ihre Parameter differenzierbaren Kovarianz sind gradientenbasierte Verfahren zur Bestimmung der Parameter einsetzbar. Insgesamt wird durch eine damit erzielte Lernrate für die Regression mit dem Gaußprozess einerseits bei unveränderter Rechenleistung die Rechenzeit reduziert, die nötig ist, bis der Gaußprozess zum Betrieb des technischen Systems einsetzbar ist. Andererseits ist die Regression und das maschinelle Lernen bei unveränderter Rechenzeit mit geringerer Rechenleistung möglich. Dadurch werden weniger Daten gebraucht d.h. das technische System das abgebildet werden soll muss an weniger Punkten ausgewertet werden.
-
Ein computerimplementiertes Verfahren zum Betreiben eines technischen Systems sieht vor, dass eine erste Größe des technischen Systems mit einem Gaußprozess auf eine Vorhersage für eine zweite Größe des technischen Systems abgebildet wird, und das technische System abhängig von der Vorhersage oder abhängig von einem Wert der ersten Größe, für den ein Maß für den Informationsgewinn, das abhängig von der Vorhersage definiert ist, einen größeren Informationsgewinn indiziert, als für einen anderen Wert der ersten Größe, betrieben wird, wobei der Gaußprozess abhängig von einer Summe eines ersten Gaußprozesses, der mit einer ersten Gewichtsfunktion gewichtet ist, mit einem zweiten Gaußprozess bestimmt wird, wobei der erste Gaußprozess ausgebildet ist, die erste Größe auf eine erste Vorhersage für die zweite Größe abzubilden, und der zweite Gaußprozess ausgebildet ist, die erste Größe auf eine zweite Vorhersage für die zweite Größe abzubilden, wobei Teilbereiche eines Definitionsbereichs und/oder eines Wertebereichs des Gaußprozesses abhängig von einer nummerischen Repräsentation eines binären Baums mit Blättern und Knoten bestimmt werden, wobei dem ersten Gaußprozess ein erstes Blatt der Blätter zugeordnet ist, wobei den Knoten je ein Vektor zugeordnet ist, der einen der Teilbereiche repräsentiert, wobei den Knoten je ein erstes Gewicht zugeordnet ist, das von der ersten Größe und dem Vektor abhängt, der dem jeweiligen Knoten zugeordnet ist, wobei die erste Gewichtsfunktion, abhängig von den ersten Gewichten der Knoten bestimmt wird in deren ersten, insbesondere linken Teilbaum sich das erste Blatt befindet und/oder wobei den Knoten je ein zweites Gewicht zugeordnet ist, das von der ersten Größe und dem Vektor abhängig, der dem jeweiligen Knoten zugeordnet ist, wobei die erste Gewichtsfunktion, abhängig von den zweiten Gewichten der Knoten bestimmt wird in deren zweiten, insbesondere rechten Teilbaum sich das erste Blatt befindet. Diese Gewichtsfunktion kodiert eine Relevanz des ersten Gaußprozesses für die Teilbereiche. Dadurch wird der Betrieb des technischen Systems abhängig von der Vorhersage des Gaußprozesses insgesamt verbessert.
-
Vorzugsweise ist der zweite Gaußprozess mit einer zweiten Gewichtsfunktion gewichtet, wobei dem zweiten Gaußprozess ein vom ersten Blatt verschiedenes zweites Blatt der Blätter zugeordnet ist, wobei die zweite Gewichtsfunktion abhängig von den ersten Gewichten der Knoten bestimmt wird, in deren ersten, insbesondere linken Teilbaum sich das zweite der Blätter befindet und/oder wobei die zweite Gewichtsfunktion abhängig von den zweiten Gewichten der Knoten bestimmt wird, in deren zweiten, insbesondere rechten Teilbaum sich das zweite Blatt befindet. Dies Gewichtsfunktion kodiert eine Relevanz des zweiten Gaußprozesses für die Teilbereiche. Dadurch wird der Betrieb des technischen Systems abhängig von der Vorhersage des Gaußprozesses insgesamt weiter verbessert.
-
Vorzugsweise wird je Knoten das zweite Gewicht abhängig von dem diesem Knoten zugeordneten ersten Gewicht bestimmt. So werden die relevanteren Teilbereiche und die weniger relevanten Teilbereiche mit Gewichten gewichtet, die ein Verhältnis der Relevanz wiedergeben. Dadurch wird der Betrieb des technischen Systems abhängig von der Vorhersage des Gaußprozesses insgesamt weiter verbessert.
-
Durch die Gewichtsfunktion und die dadurch generierte Raumaufteilung für die erste Größe, werden Teile des Definitionsbereichs der ersten Größe identifiziert, die einen hohen Informationsgehalt haben. Aus den Teilen werden dann bevorzugt Daten entnommen.
-
Es kann vorgesehen sein, dass je Knoten einem Paar von erster Gewichtsfunktion und dem diesem Knoten zugeordneten ersten Gewicht ein erster Wert zugeordnet wird, wenn sich die erste Gewichtsfunktion im ersten, insbesondere linken Teilbaum des Knotens befindet und wobei die erste Gewichtsfunktion abhängig von einer Rechenoperation mit diesem ersten Gewicht und dem ersten Wert bestimmt wird und/oder je Knoten einem Paar von erster Gewichtsfunktion und dem diesem Knoten zugeordneten ersten Gewicht ein zweiter Wert zugeordnet wird, wenn sich die erste Gewichtsfunktion im zweiten, insbesondere rechten Teilbaum des Knotens befindet und wobei die erste Gewichtsfunktion abhängig von einer Rechenoperation mit diesem ersten Gewicht und dem zweiten Wert bestimmt wird.
-
Es kann vorgesehen sein, dass je Knoten einem Paar von erster Gewichtsfunktion und dem diesem Knoten zugeordneten zweiten Gewicht ein erster Wert zugeordnet wird, wenn sich die erste Gewichtsfunktion im zweiten, insbesondere rechten Teilbaum des Knotens befindet und wobei die erste Gewichtsfunktion abhängig von einer Rechenoperation mit diesem ersten Gewicht und dem ersten Wert bestimmt wird und/oder je Knoten einem Paar von erster Gewichtsfunktion und dem diesem Knoten zugeordneten zweiten Gewicht ein zweiter Wert zugeordnet wird, wenn sich die erste Gewichtsfunktion im ersten, insbesondere linken Teilbaum des befindet und wobei die erste Gewichtsfunktion abhängig von einer Rechenoperation mit diesem ersten Gewicht und dem zweiten Wert bestimmt wird.
-
Unabhängig davon, ob der Gaußprozess zentriert ist oder nicht, kann vorgesehen sein, dass zum Bestimmen der Summe ein erstes Produkt der ersten Gewichtsfunktion mit einer insbesondere stationären ersten Kovarianz des ersten Gaußprozesses bestimmt wird, ein zweites Produkt der zweiten Gewichtsfunktion mit einer insbesondere stationären zweiten Kovarianz des zweiten Gaußprozesses bestimmt wird und die Summe abhängig vom Ergebnis einer Addition des ersten Produkts mir dem zweiten Produkt bestimmt wird.
-
Es kann vorgesehen sein, dass der Gaußprozess durch Parameter definiert ist, die einen von der ersten Größe abhängigen Mittelwert und eine von der ersten Größe abhängige Kovarianz definieren, wobei ein erster Datensatz bereitgestellt wird, in welchem je einem Wert der ersten Größe ein Wert der zweiten Größe zugeordnet ist, wobei wenigstens einer der Parameter des Gaußprozesses abhängig von den Werten aus dem ersten Datensatz bestimmt wird. Dadurch wird der Gaußprozess in einem aktiven maschinellen Lernen bestimmt.
-
Vorzugsweise ist das Maß für den Informationsgewinnabhängig vom Gaußprozess, dem Parameter und dem ersten Datensatz definiert, wobei der Wert der ersten Größe bestimmt wird, für den das Maß größer ist, als das Maß für den anderen Wert der ersten Größe, wobei mit dem technischen System oder mit einem Modell des technischen Systems ein Wert der zweiten Größe bestimmt wird, wobei ein zweiter Datensatz bestimmt wird, in welchem der so bestimmten Wert der ersten Größe und der so bestimmten Wert der zweiten Größe einander zugeordnet sind und wobei wenigstens einer der Parameter des Gaußprozesses abhängig von den Werten aus dem zweiten Datensatz bestimmt wird. Dadurch wird der Gaußprozess an den Stellen gelernt, an denen noch wenig Information vorhanden ist. Das Lernen ist so sehr effizient.
-
In einer Ausführung ist das Maß für den Informationsgewinn abhängig von der ersten Gewichtsfunktion und der zweiten Gewichtsfunktion derart definiert, dass das Maß für den Informationsgewinn dort einen höheren Wert aufweist wo die Gewichtsfunktion desjenigen Gaussprozesses höher ist welcher den höheren individuellen Informationsgehalt besitzt. Insbesondere beeinflussen die oben beschriebenen Gewichtsfunktionen des ersten und zweiten Gaussprozesses das Informationsmaß insoweit dass das Informationsmaß dort einen höheren Wert aufweist wo die Gewichtsfunktion desjenigen Gaussprozesses höher ist welcher den höheren individuellen Informationsgehalt besitzt. Dadurch wird erreicht, dass die erste Größe verstärkt dort gewählt wird wo der Informationsgehalt bezüglich der zweiten Größe hoch ist. Das Lernen wird damit noch effizienter.
-
In einer Anwendung ist die erste Größe eine Sollgröße für einen Aktuator des technischen Systems oder es wird eine Sollgröße für einen Aktuator des technischen Systems abhängig von der ersten Größe bestimmt, wobei das technische System eine computergesteuerte Maschine insbesondere ein Roboter ist, vorzugsweise ein Fahrzeug, ein Hausgerät, ein elektrisch, pneumatisch, hydraulisch oder mit einem Verbrennungsmotor angetriebenes Werkzeug, eine Fertigungsmaschine, ein persönlichen Assistenzsystem oder eine Schließanlage.
-
Vorzugsweise identifiziert die Vorhersage für die zweite Größe Daten oder es werden Daten abhängig von der Vorhersage für die zweite Größe ausgewählt, wobei eine Nachricht vom technischen System an eine insbesondere entfernt vom technischen System angeordnete Einrichtung gesendet wird, die eine Identifikation der Daten umfasst oder die die Einrichtung instruiert, die Daten zu erfassen oder zu bestimmen und/oder die Daten zu übertragen. Dadurch wird eine Art oder eine Menge der Daten beeinflusst.
-
Es kann vorgesehen sein, dass die Einrichtung ein Prüfstand insbesondere für einen Motor ist, wobei die Daten eine Ausgangsgröße des Prüfstands umfassen und vom technischen System eine Anweisung für den Prüfstand an den Prüfstand gesendet wird, die den Prüfstand instruiert, die Ausgangsgröße des Prüfstands insbesondere mit einem Sensor zu erfassen.
-
Es kann vorgesehen sein, dass die Einrichtung eine Recheneinrichtung insbesondere zur rechnergestützten Simulation von Fluiddynamik ist, wobei die Daten eine Ausgangsgröße der Simulation umfassen und vom technischen System eine Anweisung für die Simulation an die Recheneinrichtung gesendet wird, die die Recheneinrichtung instruiert, die Ausgangsgröße der Simulation durch die Simulation insbesondere abhängig von einer in der Anweisung identifizierten oder angegebenen Eingangsgröße zu bestimmen.
-
Eine Vorrichtung zum Betreiben eines technischen Systems sieht vor, dass die Vorrichtung wenigstens einen Prozessor und wenigstens einen Speicher umfasst, die ausgebildet sind, zumindest einen Teil des Verfahrens auszuführen.
-
Es kann vorgesehen sein, dass ein System die Vorrichtung und einen Aktuator umfasst, der ausgebildet ist, das System abhängig von der Vorhersage zu betreiben.
-
Es kann vorgesehen sein, dass ein System die Vorrichtung und eine Schnittstelle umfasst, die ausgebildet ist, die Nachricht vom System an eine insbesondere entfernt vom System angeordnete Einrichtung zu senden.
-
Weitere vorteilhafte Ausführungen sind der folgenden Beschreibung und der Zeichnung entnehmbar. In der Zeichnung zeigt:
- 1 eine schematische Darstellung einer Vorrichtung zum Betreiben eines technischen Systems,
- 2 Schritte in einem Verfahren zum Betreiben des technischen Systems,
- 3 eine schematische Darstellung einer ersten Ausführung des technischen Systems,
- 4 Schritte in einem Verfahren zum Betreiben der ersten Ausführung,
- 5 eine schematische Darstellung einer zweiten Ausführung des technischen Systems,
- 6 Schritte in einem Verfahren zum Betreiben der zweiten Ausführung.
-
In 1 ist ein technisches System 102 dargestellt. Das technische System 102 umfasst eine Vorrichtung 104 zum Betreiben des technischen Systems 102 oder ist mit dieser wenigstens zeitweise zur Kommunikation verbunden.
-
Die Vorrichtung 104 umfasst wenigstens einen Prozessor 106 und wenigstens einen Speicher 108, die ausgebildet sind, zumindest einen Teil eines im Folgenden beschriebenen Verfahrens auszuführen.
-
Die Vorrichtung 104 ist ausgebildet, eine erste Größe x des technischen Systems 102 mit einem Gaußprozess f~GP(µ(x), k(x,x')) auf eine Vorhersage f (x) für eine zweite Größe y des technischen Systems 102 abzubilden und das technische System 102 abhängig von der Vorhersage f (x) zu betreiben.
-
Im wenigstens einen Speicher 108 sind beispielsweise computerlesbare Instruktionen gespeichert, bei deren Ausführung durch den wenigstens einen Prozessor das Verfahren abläuft. Im Beispiel ist der Gaußprozess f~GP[µ(x), k(x,x')) dort gespeichert. Im Beispiel sind eine Vielzahl weiterer Gaußprozesse fi dort gespeichert.
-
Der Gaußprozess f~GP(µ(x), k(x, x')) umfasst im Beispiel eine Mittelwertfunktion µ(x) und eine Kovarianz
mit einer von der ersten Größe x abhängigen Gewichtsfunktion
die verschiedene Teilbereiche eines Definitionsbereichs der Größe x unterschiedlich gewichtet, wobei x̃ = (1, x)
T∈ℝ
d+1 und wobei d eine Dimension des Definitionsbereichs ist.
-
Die Funktionen ϑ
L(j,i) und ϑ
R(j,i) kodieren im Beispiel welchem Teilbereich des Definitionsbereichs die Gewichtsfunktion λ
j(
x) ein erstes Gewicht
zuordnet und welchem Teilbereich die Gewichtsfunktion λ
j(x) ein zweites Gewicht
-
Im Beispiel weist das erste Gewicht
einen Wert auf, auf den eine von der ersten Größe x abhängige Sigmoidfunktion σ ein Produkt einer Transponierten
eines Vektors w
i, der einen der Teilbereiche repräsentiert, mit der erste Größe x abbildet.
-
Im Beispiel ist das zweite Gewicht
abhängig vom ersten Gewicht
definiert. Im Beispiel ist das zweite Gewicht
durch eine Differenz des ersten Gewichts
zu Eins definiert.
-
In 2 sind Schritte des Verfahrens zum Betreiben des technischen Systems 102 dargestellt.
-
Es kann vorgesehen sein, mit dem Verfahren den Gaußprozess f~GP[µ(x), k(x, y)) zu lernen, wobei seine Parameter γ oder ein Teil davon bestimmt wird. Im Beispiel wird das Verfahren für einen Gaußprozess
beschrieben, der als von der ersten Größe x abhängige, gewichtete Summe einer Vielzahl J von Gaußprozessen f
j(x) bestimmt wird.
-
Für die Parameter γ ist je eine a priori Wahrscheinlichkeitsverteilung vorgesehen. Im Beispiel werden die Parameter γ mit einer Methode zur probabilistischen Inferenz, z.B. einem Hybrid-Monte-Carlo Algorithmus bestimmt.
-
Das Verfahren wird im Folgenden für ein Einheitsquadrat X ⊂ [0,1]
d als Definitionsbereich mit einer Dimension d beschrieben. Das Verfahren ist für andere Definitionsbereiche anwendbar. Im Einheitsquadrat X ⊂ [0,1]
d werden Hyperebenen w
i = α
iw̃
i vorgesehen, wobei α
i∈ℝ und w̃
i∈ℝ
d+1 mit einer Normalverteilung N und einer Gammaverteilung Gamma wie folgt vorgegeben werden:
-
Dadurch ist abhängig von Parametern α, β eine a priori Wahrscheinlichkeitsverteilung
definiert, die schwache Annahmen über die Hyperebenen trifft und die Steigung der Sigmoidfunktion σ beeinflusst. Die Teilbereiche überlappen in diesem Beispiel.
-
Im Beispiel bildet die Gewichtsfunktion λ
j: X → [0,1] den Definitionsbereich auf Werte in einem Intervall zwischen 0 und 1 ab. Im Beispiel ist eine Summe der Gewichte Eins:
Die Gewichtsfunktionen λ
j,j = 1, ...,J geben je Gaußprozess f
j(x) an, wie dieser zum modellierten Gaußprozess f (x) beiträgt.
-
Im Beispiel wird die Kovarianz k(x, x') des modellierten Gaußprozesses f (x) als mit Summe der mit der jeweiligen Gewichtsfunktion λ
j(
x) gewichteten Kovarianzen k
j(x,x') dieser jeweiligen Gaußprozesse f
j(x) bestimmt:
-
Im Beispiel wird der Gewichtsfunktion λj(x) in einem Teilbereich ein Wert nahe Eins zugeordnet, wenn die mit dieser Gewichtsfunktion λj(x) gewichtete Kovarianz kj (x, x') die Kovarianz k(x, x') des modellierten Gaußprozesses f (x) in diesem Teilbereich beschreibt.
-
Es kann vorgesehen sein, dass im Verfahren Teilbereiche für den Definitionsbereich bestimmt werden.
-
Die Teilbereiche werden im Beispiel entlang eines binären Baums T bestimmt, der M: = J - 1 Knoten N
i und J Blätter aufweist. Jedem Knoten N
i, i = 1, ..., M ist im Beispiel einer der Vektoren w
i∈ℝ
d+1. Eine jeweilige Hyperebene H
i =
ist abhängig von der Größe x und einem jeweiligen Vektor w
i definiert und je einem der Knoten N
i zugeordnet. Im Beispiel repräsentiert jedes Blatt einen Gaußprozess f
j(x) aus der Vielzahl J der Gaußprozesse. Jeder der Knoten N
i unterteilt das Eingangsquadrat durch die diesem Knoten N
L zugeordnete Hyperebene H
i. Im Beispiel wird einem ersten, insbesondere linken Teilbaum des Knotens N
i das erste Gewicht
zugeordnet. Es kann vorgesehen sein, dass einem zweiten, insbesondere rechten Teilbaum des Knotens N
i das zweite Gewicht
zugeordnet wird. In diesem Beispiel ist der erste Teilbaum der linke Teilbaum des Knotens N
i und der zweite Teilbaum der rechte Teilbaum des Knotens N
i, Die Zuordnung kann auch andersherum definiert sein, d.h. der erste Teilbaum ist der rechte Teilbaum und der linke Teilbaum ist der zweite Teilbaum, wobei erstes und zweites Gewicht vertauscht sind.
-
Im Beispiel werden die jeweiligen Gewichtsfunktionen λ
j(x), j = 1, ...,J durch Multiplikation der Gewichte entlang eines jeweiligen Pfades von den Knoten N
i zum Blatt, das den jeweiligen Gaußprozess f
j(x) repräsentiert, bestimmt:
wobei ϑ
L(j,i), ϑ
R(j,i): {1, ... ,J} × {1, ... M} → {0,1} die Baumstruktur kodieren:
-
Im Beispiel wird eine Menge A
1, die durch den Definitionsbereich X definiert ist X=:A
1 beginnend bei einem Wurzelknoten N
1 des Baums in Untermengen A
i unterteilt, die je einen Teilbereich definieren. Beispielsweise wird eine erste Hyperebene H
1, die dem Wurzelknoten N
1 zugeordnet ist, in zwei Untermengen unterteilt:
In einer anderen Schicht, z.B. beim Knoten N
i, wird eine Untermenge A
i nochmals unterteilt in deren Untermengen
und
Durch die Sigmoidfunktion σ wird die Gewichtung weich. Die Unterteilung in Teilbereiche ist abhängig von einer Größe des Baums. Ein größerer Baum führt zu einer feineren Unterteilung in Teilbereiche als ein demgegenüber kleinerer Baum.
-
Im Beispiel ist als Kovarianz für die Vielzahl J der Gaußprozesse fj(x) je ein Radiale-Basisfunktion-Kern, RBF kernel, vorgesehen. Andere Kerne sind ebenfalls möglich. Die Gaußprozesse fj(x) haben jeweilige Parameter θj.
-
Je Parameter im jeweiligen Parameter θj ist im Beispiel eine Gammaverteilung vorgesehen. Die Parameter im jeweiligen Parameter in θj sind abhängig vom konkreten stationären Kernel. Für die Sigmoidfunktion σ ist eine Exponentialverteilung mit Parameter λ vorgesehen.
-
Die Parameter γ umfassen im Beispiel die Parameter y = {w̃i, ai, θj, σ|i = 1, ... , M, j = 1, ... , J}.
-
Der Hybrid-Monte-Carlo Algorithmus wird im Beispiel ausgeführt, durch den n Ziehungen aus a posteriori Wahrscheinlichkeitsverteilungen für diese Parameter γ vorliegen, wobei mit einem jeweiligen Datensatz D abhängig von jeweiligen ersten Größe x' eine Schätzung f* als marginale Verteilung
bestimmt wird.
-
Im Beispiel wird ausgehend von einem initialen Datensatz D
0 ein Orakel f → ℝ bei einem Datenpunkt x
t eine verrauschte Beobachtung y
t = f(x
t) + ε
t mit einem normalverteilten Rauschen ε
t∼N(0, σ
2) bestimmt. Die folgenden Datensätze D
t = D
t-1 u {x
t, y
t} werden im Beispiel sequentiell bestimmt. Im Beispiel werden die folgenden Datensätze D
t mit einer Aquisitionsfunktion abhängig vom Gaußprozess f den Parametern y und dem aktuellen Datensatz D
t-1bestimmt:
wobei der rechte Term
der Differenz unabhängig von x ist. Zur Auswertung der Aquisitionsfunktion wird eine Entropie E der marginalen Verteilung p approximiert, z.B. durch Gauß-Quadratur. Im Beispiel umfasst die Aquisistionfunktion ein Maß I(y;f,γ|D
t-1, x) für einen Informationsgewinn.
-
Ein Wert x
t der ersten Größe x wird im Beispiel wie folgt bestimmt:
-
Dazu wird beispielsweise eine Gittersuche, eine zufällige Suche oder eine gradientenbasierte Suche ausgeführt.
-
Sofern die Parameter γ der Kovarianz bereits bekannt sind oder mit einem maximum likelihood Verfahren bestimmt wurden, wird eine vereinfachte Aquisitionsfunktion verwendet:
wobei
eine vorhergesagte Varianz des modellierten Gaußprozesses f|D
t-1 mit den Parametern γ ist.
-
Das Verfahren sieht vor, dass der Gaußprozess f durch Parameter y definiert ist, die einen von der ersten Größe x abhängigen Mittelwert und eine von der ersten Größe x abhängige Kovarianz definieren.
-
Das Verfahren wird im Beispiel in Iterationen t zum aktiven Lernen der Parameter γ ausgeführt.
-
In einem Schritt 200 wird ein erster Datensatz bereitgestellt, in welchem je einem Wert xt der ersten Größe x ein Wert yt der zweiten Größe y zugeordnet ist.
-
In einer ersten Iteration t = 0 wird im Beispiel als erster Datensatz der initiale Datensatz D0 bereitgestellt. In weiteren Iterationen wird ausgehend von einem Datensatz Dt einer vorangegangenen Iteration ein zweiter Datensatz Dt+1 bestimmt, in welchem ein wie im Folgenden beschrieben bestimmter Wert xt+1 der ersten Größe x und wie im Folgenden beschrieben bestimmter Wert yt+1 der zweiten Größe y einander zugeordnet sind. Mit dem Datensatz D0 wird im Beispiel ein Datensatz D1 bestimmt.
-
In den Iterationen wird jeweils ein aktueller Datensatz Dt verwendet, d.h. in der ersten Iteration der erste Datensatz D0 und anschließend der jeweils folgende zweite Datensätze Dt+1
-
Anschließend wird ein Schritt 202 ausgeführt.
-
Der Schritt 202 wird für einen ersten Gaußprozess f1 und einen zweiten Gaußprozess f2 der Vielzahl I = 2 von Gaußprozessen fi, i = 1,2 beschrieben. Für weitere Gaußprozesse fi wird entsprechend vorgegangen.
-
Der erste Gaußprozess f1 ist ausgebildet, die erste Größe x auf eine erste Vorhersage f1(x) für die zweite Größe y abzubilden.
-
Der zweite Gaußprozess f2 ist ausgebildet, die erste Größe x auf eine zweite Vorhersage f2(x) für die zweite Größe y abzubilden.
-
Im Beispiel werden im Schritt 202 Teilbereiche eines Definitionsbereichs des modellierten Gaußprozesses f abhängig von einer nummerischen Repräsentation des binären Baums mit Blättern und Knoten Ni bestimmt.
-
Dem ersten Gaußprozess f1 ist ein erstes Blatt der Blätter zugeordnet.
-
Dem zweiten Gaußprozess f2 ist ein vom ersten Blatt verschiedenes zweites Blatt der Blätter zugeordnet.
-
Den Knoten Ni ist je ein Vektor wi zugeordnet, der einen der Teilbereiche repräsentiert.
-
Den Knoten N
i ist je ein erstes Gewicht
zugeordnet, das von der ersten Größe x und dem Vektor w
i abhängt, der dem jeweiligen Knoten N
i zugeordnet ist.
-
Den Knoten N
i ist je ein zweites Gewicht
zugeordnet, das von der ersten Größe x und dem Vektor w
i abhängt, der dem jeweiligen Knoten N
i zugeordnet ist.
-
Anschließend wird ein Schritt 204 ausgeführt.
-
Im Schritt 204 wird je Knoten N
i einem Paar von erster Gewichtsfunktion λ
1 und dem diesem Knoten N
i zugeordneten ersten Gewicht
ein erster Wert, im Beispiel Eins, zugeordnet, wenn sich die erste Gewichtsfunktion λ
1 im linken Teilbaum des Knotens N
i befindet.
-
Im Schritt 204 wird je Knoten N
i einem Paar von erster Gewichtsfunktion λ
1 und dem diesem Knoten N
i zugeordneten ersten Gewicht
ein zweiter Wert, im Beispiel Null, zugeordnet, wenn sich die erste Gewichtsfunktion λ
1 im rechten Teilbaum des Knotens N
i befindet.
-
Im Schritt 204 wird im Beispiel je Knoten N
i einem Paar von erster Gewichtsfunktion λ
1 und dem diesem Knoten N
i zugeordneten zweiten Gewicht
der zweite Wert, im Beispiel Null, zugeordnet, wenn sich die erste Gewichtsfunktion λ
1 im rechten Teilbaum des Knotens N
L befindet.
-
Im Schritt 204 wird im Beispiel je Knoten N
i einem Paar von erster Gewichtsfunktion λ
1 und dem diesem Knoten N
i zugeordneten zweiten Gewicht
der erste Wert, im Beispiel Eins, zugeordnet, wenn sich die erste Gewichtsfunktion λ
1 im rechten Teilbaum des Knotens N
i befindet.
-
Diese Zuordnung wird im Beispiel in den Funktionen ϑL(j, i), ϑR (j, i) kodiert.
-
Es kann vorgesehen sein, dass je Knoten N
i das zweite Gewicht
abhängig von dem diesem Knoten N
i zugeordneten ersten Gewicht
bestimmt wird.
-
Anschließend wird ein Schritt 206 ausgeführt.
-
Im Schritt 206 wird die erste Gewichtsfunktion λ
1, abhängig von den ersten Gewichten
der Knoten (N
i) bestimmt, in deren linken Teilbaum sich das erste Blatt befindet.
-
Im Schritt 206 wird die erste Gewichtsfunktion λ
1, abhängig von den zweiten Gewichten
der Knoten N
i bestimmt, in deren rechten Teilbaum sich das erste Blatt befindet.
-
Im Schritt 206 wird, die zweite Gewichtsfunktion λ
2 abhängig von den ersten Gewichten
der Knoten N
i bestimmt, in deren linken Teilbaum sich das zweite der Blätter befindet.
-
Im Schritt 206 wird, die zweite Gewichtsfunktion λ
2 abhängig von den zweiten Gewichten
der Knoten N
i bestimmt, in deren rechten Teilbaum sich das zweite Blatt befindet.
-
Die erste Gewichtsfunktion λ
1 wird z.B. abhängig von einer Rechenoperation mit den ersten Gewichten
bestimmt, denen der erste Wert zugeordnet ist.
-
Die erste Gewichtsfunktion λ
1 wird z.B. abhängig von einer Rechenoperation mit den ersten Gewichten
bestimmt, denen der zweite Wert zugeordnet ist.
-
Eine Zuordnung der Rechenoperation wird im Beispiel abhängig von den Werten der Funktionen ϑ
L(j,i), ϑ
R(j,i) bestimmt. Für die erste Gewichtsfunktion λ
1 und die zweite Gewichtsfunktion λ
2:
-
Es kann vorgesehen sein, dass für andere Gewichtsfunktionen λi entsprechend verfahren wird.
-
Anschließend wird ein Schritt 208 ausgeführt.
-
Im Schritt 208 wird der Gaußprozess f bestimmt.
-
Der Gaußprozess f wird beispielsweise abhängig von der Summe
des ersten Gaußprozesses f
1, der mit einer ersten Gewichtsfunktion λ
1 gewichtet ist, mit dem zweiten Gaußprozess f
2 bestimmt. Der zweite Gaußprozess f
2 ist im Beispiel mit der zweiten Gewichtsfunktion λ
2 gewichtet.
-
Zum Bestimmen der Summe kann vorgesehen sein, dass ein erstes Produkt der ersten Gewichtsfunktion λ1 mit einer insbesondere stationären ersten Kovarianz k1(x, y) des ersten Gaußprozesses f1 bestimmt wird.
-
Zum Bestimmen der Summe kann vorgesehen sein, dass ein zweites Produkt der zweiten Gewichtsfunktion λ1 mit einer insbesondere stationären zweiten Kovarianz k2(x, y) des zweiten Gaußprozesses f2 bestimmt wird.
-
Die Summe wird beispielsweise abhängig vom Ergebnis einer Addition des ersten Produkts mir dem zweiten Produkt bestimmt.
-
Allgemein wird der Gaußprozess f mit der Summe über die Vielzahl der Gaußprozess f
j bestimmt, für die jeweils eine Gewichtsfunktion λ
i wie für die erste Gewichtsfunktion λ
1 beschrieben bestimmt wird:
-
Anschließend wird ein Schritt 210 ausgeführt.
-
Im Schritt 210 wird die erste Größe x mit einem Gaußprozess f ~GP(µ(x), k(x,x') auf die Vorhersage f (x) für die zweite Größe y abgebildet.
-
Anschließend wird ein Schritt 212 ausgeführt.
-
Im Schritt 212 wird wenigstens einer der Parameter y des Gaußprozesses f abhängig von den Werten aus dem aktuellen Datensatz Dt bestimmt.
-
Beispielsweise wird der Hybrid-Monte-Carlo Algorithmus wie oben beschrieben eingesetzt. Es kann auch ein anderes Verfahren zur Bestimmung der Parameter γ vorgesehen sein, beispielsweise eine Optimierung einer Loss-Funktion insbesondere einer abhängig von den Parameterwerten der Parameter y definierten negativen marginalen Likelihood.
-
Anschließend wird ein Schritt 214 ausgeführt.
-
Im Schritt 214 wird mit dem Maß für den Informationsgewinn I, das abhängig von dem Gaußprozess f, dem Parameter γ und dem jeweils aktuellen Datensatz D
t der Iteration definiert ist, ein Wert x
t+1 der ersten Größe x bestimmt. Im Beispiel wird ein Wert x
t+1 bestimmt, für den das Maß / größer ist, als das Maß / für einen anderen Wert x'
t+1 der ersten Größe x. Zum Beispiel wird der Wert x
t+1 bestimmt, der zum größten Maß I führt:
-
Das Maß für den Informationsgewinn I für den Wert xt+1 der ersten Größe x ist abhängig von der Vorhersage f(xt+1) für diese erste Größe xt+1 definiert.
-
Anschließend wird ein Schritt 216 ausgeführt.
-
Im Schritt 216 wird das technische System 102 in einem Beispiel abhängig von der Vorhersage f(xt+1) betrieben. In einem anderen Beispiel wird das technische System 102 abhängig von dem Wert der ersten Größe xt+1 betrieben, für den das Maß für den Informationsgewinn / einen größeren Informationsgewinn indiziert, als für den anderen Wert x't+1 der ersten Größe x. Mit dem technischen System 102 wird im Beispiel ein Wert yt+1 der zweiten Größe y bestimmt. Im Beispiel wird der Wert yt+1 der zweiten Größe y gemessen.
-
Es kann vorgesehen sein, dass der Wert yt+1 der zweiten Größe y beim aktiven Lernen mit einem Modell des technischen Systems 102 bestimmt wird.
-
Anschließend wird der Schritt 202 ausgeführt.
-
Die Iterationen enden z.B. nach einer vorgegebenen Zeit oder nach einer vorgegebenen Anzahl von Iterationen.
-
In 3 ist eine erste Ausführung des Systems 102 schematisch dargestellt.
-
Das System 102 umfasst in der ersten Ausführung die Vorrichtung 104 und einen Aktuator 302, der ausgebildet ist, das System 102 abhängig von der ersten Größe x zu betreiben.
-
Ein Verfahren zum Betreiben eines technischen Systems 102 gemäß der ersten Ausführung ist in 4 dargestellt. Das technische System 102 ist eine computergesteuerte Maschine insbesondere ein Roboter, vorzugsweise ein Fahrzeug, ein Hausgerät, ein elektrisch, pneumatisch, hydraulisch oder mit einem Verbrennungsmotor angetriebenes Werkzeug, eine Fertigungsmaschine, ein persönliches Assistenzsystem oder eine Schließanlage.
-
In einem Schritt 402 wird durch aktives maschinelles Lernen der Gaußprozess f bestimmt. Im Beispiel werden die Schritt 202 bis 216 ausgeführt um den Gaußprozess f zu bestimmen. Im Beispiel wird abhängig von der ersten Größe x eine Sollgröße für den Aktuator 302 des technischen Systems 102 bestimmt. Die Sollgröße wird zur Ansteuerung des Aktuators 302 des technischen Systems 102 ausgegeben. Beispielsweise wird die Größe x bestimmt und ausgegeben, für das der Gaußprozess f eine Vorhersage f (x) trifft, die zu einem gewünschten Verhalten der zweiten Größe y führt.
-
Anschließend wird ein Schritt 404 ausgeführt.
-
Im Schritt 404 wird die zweite Größe y am technischen System 102 gemessen.
-
Die zweite Größe y umfasst zum Beispiel Daten eines Sensorsignals von einem Sensor, der am technischen System 102 vorgesehen ist und im Betrieb des technischen Systems 102 Information über einen Zustand des technischen Systems 102 erfasst.
-
Anschließend wird der Schritt 404 ausgeführt.
-
In 5 ist eine zweite Ausführung des Systems 102 schematisch dargestellt.
-
Das technische System 102 umfasst in der zweiten Ausführung die Vorrichtung 104 und eine Schnittstelle 502, die ausgebildet ist, die Nachricht vom technischen System 102 an eine insbesondere entfernt vom technischen System 102 angeordnete Einrichtung 504 zu senden.
-
Ein Verfahren zum Betreiben eines technischen Systems 102 gemäß der zweiten Ausführung ist in 6 dargestellt.
-
In einem Schritt 602 wird abhängig von einer ersten Größe x mit dem Gaußprozess f die Vorhersage f(x) für die zweite Größe y bestimmt.
-
Die erste Größe x ist im Beispiel an der entfernt angeordneten Einrichtung, z.B. auf dem Prüfstand, einstellbare Größe. Die zweite Größe y umfasst zum Beispiel Daten eines Sensorsignals von einem Sensor, der an der entfernt angeordneten Einrichtung 504 vorgesehen ist und im Betrieb dieser Einrichtung 504 Information über einen Zustand der Einrichtung 504 erfasst.
-
Die Einrichtung 504 ist zum Beispiel ein Prüfstand insbesondere für einen Motor. Die Daten umfassen in diesem Beispiel eine Ausgangsgröße des Prüfstands.
-
Beispielsweise werden in einem Schritt 604 abhängig von der Vorhersage f (x) für die zweite Größe y Daten identifiziert oder ausgewählt. Im Beispiel werden die Daten identifiziert, die von der entfernten Einrichtung 504 zu übertragen sind. Es kann vorgesehen sein, dass die Daten identifiziert werden, die von der Einrichtung 504 zu erfassen sind. Es kann vorgesehen sein, dass die Daten identifiziert werden, die von der Einrichtung 504 zu bestimmen sind.
-
In einem Schritt 606 wird eine Nachricht vom technischen System 102 an die insbesondere entfernt vom technischen System 102 angeordnete Einrichtung 504 gesendet.
-
Die Nachricht umfasst beispielsweise eine insbesondere alphanumerische Identifikation der Daten oder instruiert die Einrichtung 504, die Daten zu erfassen oder zu bestimmen und/oder die Daten zu übertragen.
-
Beispielsweise wird vom technischen System 102 eine Anweisung für den Prüfstand an den Prüfstand gesendet, die den Prüfstand instruiert, die Ausgangsgröße des Prüfstands insbesondere mit einem Sensor zu erfassen.
-
Die Einrichtung 504 wird wie instruiert betrieben. Im Beispiel wird die Ausgangsgröße des Prüfstands durch Betreiben des Prüfstands ermittelt.
-
In einem Schritt 608 wird die von der Einrichtung 504 gesendete Ausgangsgröße vom technischen System 102 empfangen.
-
Anschließend wird der Schritt 602 ausgeführt.
-
Die erste Größe x, z.B. die Ansteuergröße des Prüfstands wird von der Einrichtung 504 an das technische System 102 übertragen.
-
Die Einrichtung 504 kann auch eine Recheneinrichtung insbesondere zur rechnergestützten Simulation von Fluiddynamik sein. Die zweite Größe y ist in diesem Fall z.B. eine mit der Simulation ermittelte Ausgangsgröße der Simulation.
-
Im Schritt 604 werden in diesem Fall abhängig von der Vorhersage f(x) für die zweite Größe y Daten identifiziert oder ausgewählt, die von der Simulation als Ausgangsgröße bestimmt werden sollen.
-
Vom technischen System 102 wird in diesem Beispiel im Schritt 606 eine Anweisung für die Simulation an die Recheneinrichtung gesendet, die die Recheneinrichtung instruiert, die Ausgangsgröße der Simulation durch die Simulation zu bestimmen.
-
Es kann vorgesehen sein, dass in der Anweisung eine Eingangsgröße für die Simulation identifiziert oder angegeben ist. Es kann auch vorgesehen sein, die Eingangsgröße abhängig von der Vorhersage f (x) zu bestimmen.
-
Der Gaußprozess f zur Bestimmung der Vorhersage f (x) mit der die Daten identifiziert oder ausgewählt werden, wird beispielsweise vor dem Verfahrensschritt 602 wie in den Schritten 202 bis 216 beschrieben bestimmt.