DE102022112606B3 - Computerimplementiertes Verfahren zur Kalibrierung eines technischen Systems - Google Patents

Computerimplementiertes Verfahren zur Kalibrierung eines technischen Systems Download PDF

Info

Publication number
DE102022112606B3
DE102022112606B3 DE102022112606.4A DE102022112606A DE102022112606B3 DE 102022112606 B3 DE102022112606 B3 DE 102022112606B3 DE 102022112606 A DE102022112606 A DE 102022112606A DE 102022112606 B3 DE102022112606 B3 DE 102022112606B3
Authority
DE
Germany
Prior art keywords
sub
learning
meta
calibration
solution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE102022112606.4A
Other languages
English (en)
Inventor
Thomas Rudolf
Matteo Skull
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dr Ing HCF Porsche AG
Original Assignee
Dr Ing HCF Porsche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dr Ing HCF Porsche AG filed Critical Dr Ing HCF Porsche AG
Priority to DE102022112606.4A priority Critical patent/DE102022112606B3/de
Application granted granted Critical
Publication of DE102022112606B3 publication Critical patent/DE102022112606B3/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/092Reinforcement learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Feedback Control In General (AREA)

Abstract

Die Erfindung betrifft ein computerimplementiertes Verfahren zur Kalibrierung eines technischen Systems, umfassend die Schritte:S1): Bereitstellen eines maschinellen Meta-Lernverstärkungsagenten, der dazu ausgebildet ist, eine Lernfunktion des verstärkenden Lernens auszuführen,S2): Definieren eines übergeordneten Kalibrierungsproblems des technischen Systems mit einer Mehrzahl n ≥ 2 von Teilproblemen, Definieren möglicher Lösungsverfahren zur Lösung der Teilprobleme und Definieren von Metriken in Bezug auf den Erfolg, die Teilprobleme und das übergeordnete Kalibrierungsproblem zu lösen,S3): Beobachten einer initialen Kalibrierungsgenauigkeit des übergeordneten Kalibrierungsproblems mittels des maschinellen Meta-Lernverstärkungsagenten,S4): Ausführen einer Aktion des maschinellen Meta-Lernverstärkungsagenten, die zumindest das Auswählen eines der Teilprobleme und eines Lösungsverfahrens zur Lösung des Teilproblems umfasst,S5): Bearbeiten des Teilproblems mittels des im vorhergehenden Schritt ausgewählten Lösungsverfahrens, wobei aus einer fortgeschrittenen Metrik des Teilproblems eine Änderung der Metrik des übergeordneten Kalibrierungsproblems resultiert und der maschinelle Meta-Lernverstärkungsagent in Abhängigkeit von seinen neuen Zuständen und vom Fortschritt der Metrik des übergeordneten Kalibrierungsproblems eine Belohnung erhält,S6): Wiederholen der Schritte S3) bis S5) für jedes der Teilprobleme, bis das übergeordnete Kalibrierungsproblem gelöst ist.

Description

  • Die vorliegende Erfindung bezieht sich auf ein computerimplementiertes Verfahren zur Kalibrierung eines technischen Systems.
  • Unter einem computerimplementierten Verfahren wird im Rahmen der vorliegenden Erfindung insbesondere verstanden, dass das Verfahren durch einen Computer ausgeführt wird. Der Computer kann beispielsweise einen digitalen Datenspeicher und einen Prozessor umfassen. Im digitalen Datenspeicher können Instruktionen gespeichert sein, die bei ihrer Ausführung durch den Prozessor den Prozessor dazu veranlassen, das computerimplementierte Verfahren auszuführen.
  • Technische Systeme, wie zum Beispiel Steuerungseinrichtungen für Antriebsvorrichtungen, insbesondere Brennkraftmaschinen oder elektrische Maschinen, Einrichtungen zur Bereitstellung autonomer beziehungsweiser teilautonomer Fahrfunktionen eines Fahrzeugs oder auch industrielle Feedback-Regler müssen zunächst kalibriert werden, bevor sie in einem Produktivbetrieb eingesetzt werden können.
  • Aus dem Stand der Technik sind ganz unterschiedliche Verfahren zur Lösung von Kalibrierungsproblemen technischer Systeme bekannt. Weit verbreitete Verfahren sind zum Beispiel die Kalibrierung durch menschliches Expertenwissen, nichtlineare Optimierungsverfahren mit Nebenbedingungen für bekannte Modelle, Gaußsche Prozesse für datengesteuerte Ansätze sowie Approximationen durch neuronale Netzwerke. Die Lösungen von Kalibrierungsproblemen sind üblicherweise recht monotone, aber dennoch sehr anspruchsvolle, iterative Aufgaben für menschliche Experten.
  • Neuartige Kalibrierungsverfahren nutzen bereits Verfahren des so genannten verstärkenden Lernens (englisch: „Reinforcement Learning). Dabei wird ein maschineller Lernverstärkungsagent verwendet, der dazu ausgebildet ist, eine Lernfunktion des verstärkenden Lernens auszuführen. Verstärkendes Lernen basiert auf dem allgemeinen Grundprinzip, dass der Lernverstärkungsagent mit seiner Umwelt interagiert, indem er Aktionen ausführt, welche den Zustand der Umwelt beeinflussen. Der Lernverstärkungsagent beobachtet seine Umwelt und erhält Belohnungen in Abhängigkeit davon, wie sich seine Aktionen auf den Zustand der Umwelt auswirken. Wenn sich Aktionen des Lernverstärkungsagenten positiv auf den Zustand seiner Umwelt auswirken, erhält er eine positive Belohnung. Wenn sich Aktionen des Lernverstärkungsagenten negativ auf den Zustand seiner Umwelt auswirken, erhält er dementsprechend eine negative Belohnung. In Abhängigkeit von den erhaltenen Belohnungen richtet der Lernverstärkungsagent seine Entscheidungsstrategie - die so genannte „Policy“ - neu aus, um seine Belohnungen möglichst zu maximieren.
  • Es hat sich gezeigt, dass Ansätze des verstärkenden Lernens bei bestimmten Kalibrierungsaufgaben gut funktionieren, bei manchen jedoch eher weniger. Während sich maschinelle Lernverfahren bei ähnlichen, immer wiederkehrenden Problemen und in datenfreundlichen Umgebungen auszeichnen, können herkömmliche Verfahren in Nischenanwendungen immer noch gute Ergebnisse erzielen. Dieses ist vor allem dann der Fall, wenn zum Beispiel die Kalibrierungsziele nur sehr schwer zu quantifizieren sind, die verfügbaren Daten für neue technische Systeme oder für eine noch nicht etablierte Datenbasis noch sehr spärlich sind oder wenn es sich um speziell optimierte Prozesse für Nischenkalibrierungsprobleme handelt. Bislang existieren keine herkömmlichen Kalibrierungsverfahren, die alle auftretenden Kalibrierungsaufgaben lösen können.
  • Die bislang verwendeten maschinellen Lernverfahren verfügen nicht immer über das erforderliche Training für jedes Teilproblem der Kalibrierung. Überdies kann der Problemraum sehr groß sein und zum Beispiel eine Vielzahl zweidimensionaler oder dreidimensionaler Kalibrierungskarten umfassen, so dass die Verwendung so genannter „Teile-und-Herrsche“-Verfahren („Divide-and-Conquer“-Verfahren) erforderlich ist. Die derzeit verwendeten Lösungsverfahren weisen eine Unterteilung in eine feste Anzahl von Teilproblemen auf, da sie nicht mehr verarbeiten können. Es fehlt somit eine übergeordnete Strategie, die erkennen kann, welches Lösungsverfahren für die verschiedenen Teilprobleme am besten geeignet ist und daher angewendet werden sollte.
  • Die US 2022/0036179 A1 offenbart ein KI-basiertes Verfahren zur Online-Aufgabeninferenz für (aus Teilaufgaben) zusammengesetzte Aufgaben mit einer Kontextanpassung, wobei ein oder mehrere neuronale Netzwerke mittels Meta-Verstärkungslernen dahingehend trainiert werden, globale und lokale Kontexte einer Aufgabe zu erkennen und darauf basierend Aktionen zum Lösen der Aufgabe auszuwählen.
  • Die CN 113156900 A stellt ein Verfahren zur Steuerung der Deformation eines Werkstücks während der Werkstückbearbeitung bereit, welches das Prinzip der maschinellen Meta-Lernverstärkung nutzt.
  • Die DE 10 2020 120 367 A1 bezieht sich auf ein Verfahren zur Steuerung eines elektrifizierten Fahrzeugs auf einer Fahrtroute, wobei die Steuerung basierend auf einer Betriebsstrategie zur Erreichung eines Steuerziels erfolgt und die Kalibrierung der Betriebsstrategie mithilfe von Lernverstärkungs-Hauptagenten sowie ein oder mehreren Lernverstärkungs-Unteragenten erfolgt.
  • Die US 2022/0036179 A1 beschreibt ein Verfahren zum Erledigen einer Aufgabe, bei dem Lernverstärkungsagenten verwendet werden.
  • Die Erfindung macht es sich zur Aufgabe, ein computerimplementiertes Verfahren zur Kalibrierung eines technischen Systems zu schaffen, mittels dessen die Kalibrierung auch bei komplexen Kalibrierungsproblemen weiter verbessert werden kann.
  • Die Lösung dieser Aufgabe liefert ein computerimplementiertes Verfahren zur Kalibrierung eines technischen Systems mit den Merkmalen des Anspruchs 1. Die Unteransprüche betreffen vorteilhafte Weiterbildungen der Erfindung.
  • Ein erfindungsgemäßes Verfahren zur Kalibrierung eines technischen Systems umfasst die Schritte:
    • S1): Bereitstellen eines maschinellen Meta-Lernverstärkungsagenten, der dazu ausgebildet ist, eine Lernfunktion des verstärkenden Lernens auszuführen,
    • S2): Definieren eines übergeordneten Kalibrierungsproblems des technischen Systems mit einer Mehrzahl n ≥ 2 von Teilproblemen, Definieren möglicher Lösungsverfahren zur Lösung der Teilprobleme und Definieren von Metriken in Bezug auf den Erfolg, die Teilprobleme und das übergeordnete Kalibrierungsproblem zu lösen,
    • S3): Beobachten einer initialen Kalibrierungsgenauigkeit des übergeordneten Kalibrierungsproblems mittels des maschinellen Meta-Lernverstärkungsagenten, S4): Ausführen einer Aktion des maschinellen Meta-Lernverstärkungsagenten, die zumindest das Auswählen eines der Teilprobleme und eines Lösungsverfahrens zur Lösung des Teilproblems umfasst,
    • S5): Bearbeiten des Teilproblems mittels des im vorhergehenden Schritt ausgewählten Lösungsverfahrens, wobei aus einer fortgeschrittenen Metrik des Teilproblems eine Änderung der Metrik des übergeordneten Kalibrierungsproblems resultiert und der maschinelle Meta-Lernverstärkungsagent in Abhängigkeit von seinen neuen Zuständen und vom Fortschritt der Metrik des übergeordneten Kalibrierungsproblems eine Belohnung erhält,
    • S6): Wiederholen der Schritte S3) bis S5) für jedes der Teilprobleme, bis das übergeordnete Kalibrierungsproblem gelöst ist.
  • Das hier vorgestellte Verfahren stellt eine übergeordnete, automatisierte Überprüfungsstrategie zur Verfügung, welche mittels des Meta-Lernverstärkungsagenten selbständig das aktuelle Kalibrierungsproblem erkennt, und iterativ jeweils das am besten geeignete Lösungsverfahren für die Lösung der verschiedenen Teilprobleme der Kalibrierung des technischen Systems auswählt, bis das übergeordnete Kalibrierungsproblem gelöst ist.
  • In einer Ausführungsform wird vorgeschlagen, dass die Lösungsverfahren zur Lösung der Teilaufgaben mittels des maschinellen Meta-Lernverstärkungsagenten aus einer Gruppe von Lösungsverfahren ausgewählt werden, die lineare oder nichtlineare Lösungs- und Optimierungsverfahren mit möglichen Nebenbedingungen, statistische Verfahren, insbesondere Gaußsche Verfahren, überwachte maschinelle Lernverfahren und verstärkende Lernverfahren umfasst oder aus diesen besteht.
  • In einer Ausführungsform kann vorgesehen sein, dass das Ausführen der Aktion des maschinellen Meta-Lernverstärkungsagenten zumindest bei der ersten Ausführung des Verfahrensschritts S4) eine Auswahl der Anzahl der auszuführenden Iterationsschleifen des ausgewählten Lösungsverfahrens oder der zu erreichenden Metrik umfasst.
  • In einer Ausführungsform besteht die Möglichkeit, dass die Belohnungen des maschinellen Meta-Lernverstärkungsagenten auf Basis von Metriken des Fortschritts und des Erfolgs bei der Lösung des übergeordneten Kalibrierungsproblems bestimmt werden.
  • Es kann vorgesehen sein, dass der maschinelle Lernagent positive Belohnungen erhält, wenn die Abweichungen vom Kalibrierungsziel reduziert werden oder ein Teilproblem gelöst wird.
  • Ferner kann vorgesehen sein, dass der maschinelle Lernagent negative Belohnungen erhält, wenn ein für die Lösung eines der Teilprobleme gewähltes Lösungsverfahren kein Zwischenergebnis (Fehlschlag) oder einen Misserfolg aufgrund einer nicht ausreichenden Metrik liefert.
  • Der Meta-Lernverstärkungsagent wird in einer Ausführungsform anhand von Trainingsdatensätzen durch überwachtes Lernen auf eine Vielzahl von Kalibrierungsproblemen, Teilproblemen des technischen Systems und möglichen Daten-, Lösungsverfahrens- und Metrikkombinationen zu deren Lösung trainiert. Durch das Training lernt der Meta-Lernverstärkungsagent anhand von Mustern, welches Lösungsverfahren am besten zu welchem Teilproblem der Kalibrierung passt. Der auf diese Weise trainierte Meta-Lernverstärkungsagent beobachtet das übergeordnete Problem und wählt durch seine Aktionen die jeweils am besten passenden Kombination der oben genannten aus. Während des Trainings werden die Verfahrensschritte S2) bis S6) mittels der für diesen Zweck zur Verfügung gestellten Trainingsdatensätze durchgeführt.
  • In einer alternativen Ausführungsform kann auch vorgesehen sein, dass der Meta-Lernverstärkungsagent durch unüberwachtes Lernen auf eine Vielzahl von Kalibrierungsproblemen und Teilproblemen des technischen Systems und möglichen Daten-, Lösungsverfahrens- und Metrikkombinationen zu deren Lösung trainiert wird. Während des Trainings werden die Verfahrensschritte S2) bis S6) ausgeführt. Der Meta-Lernverstärkungsagent lernt also durch wiederholtes Ausführen der Verfahrensschritte S2) bis S6) für unterschiedliche Teilprobleme.
  • Vorzugsweise können Erfahrungsdaten des Meta-Lernverstärkungsagenten in einem Speichermittel abrufbar gespeichert werden. Dadurch wird erreicht, dass der Meta-Lernverstärkungsagent auf seine eigenen Erfahrungsdaten zugreifen kann. Das Speichermittel kann insbesondere eine Datenbank sein.
  • Somit wird ein Verfahren mit einem übergeordneten Meta-Lernverstärkungsagenten für die Lösung des übergeordneten Kalibrierungsproblems des technischen Systems zur Verfügung gestellt, wobei das Verfahren insbesondere Folgendes bietet:
    1. A) Ansätze zur automatischen Lösung übergeordneter, größerer Kalibrierungsprobleme, was bisher nicht möglich war,
    2. B) Training von Mustern, welches Lösungsverfahren am besten zu welchem Teilproblem der Kalibrierung passt,
    3. C) Anwendung der erlernten Muster der Problem-, Lösungsverfahrens-, Informations- und Metrikkombinationen zur Kalibrierung realer technischer Systeme, die zu einem zufriedenstellenden Systembetrieb führen,
    4. D) Übergang von einem Teilproblem zu einem anderen Teilproblem in intelligenten Mustern, bis die übergeordnete Kalibrierungsaufgabe gelöst ist, wobei
      • - der aktuelle Zustand im Kalibrierungsprozess mit verschiedenen zu lösenden Teilproblemen der Kalibrierung erfasst werden kann,
      • - eine Auswahl eines Teilproblems für die nächste Kalibrierung und des am besten geeigneten Lösungsverfahrens für die Lösung dieses Teilproblems erfolgen kann,
      • - (optional) eine Auswahl der für das gewählte Verfahren und das zu lösende Teilproblem zu erforderlichen Informationen/Daten und Metriken erfolgen kann, die auch vorbekannt und festgelegt sein können,
      • - eine Festlegung der Anzahl der Iterationen der Lösungsverfahren, der Zwischengenauigkeit der Kalibrierung, der zu erfüllenden Metriken sowie der zu verwendenden Informationen/Daten erfolgen kann,
      • - eine sequentielle Entscheidungsfindung des Meta-Lernverstärkungsagenten erfolgen kann, bis das übergeordnete Kalibrierungsproblem gelöst ist und
      • - Entscheidungen getroffen werden können, wann Teilprobleme als endgültig gelöst anzusehen sind und somit in ihrem aktuellen Zustand eingefroren werden können und wann die Lösungsverfahren für ein endgültiges Ergebnis zu beenden sind.
  • Weitere Merkmale und Vorteile der vorliegenden Erfindung werden deutlich anhand der nachfolgenden Beschreibung eines bevorzugten Ausführungsbeispiels unter Bezugnahme auf die beiliegende 1, die eine schematische Darstellung eines Verfahrensablaufs eines computerimplementierten Verfahrens zur Kalibrierung eines technischen Systems veranschaulicht.
  • Unter Bezugnahme auf 1 wird in einem ersten Schritt S1) zumindest ein maschineller Meta-Lernverstärkungsagent bereitgestellt, der zur Lösung eines übergeordneten Kalibrierungsproblems des technischen Systems verwendet wird und der insbesondere als künstliches neuronales Netzwerk ausgeführt sein kann. Der Meta-Lernverstärkungsagent ist dazu ausgebildet, eine Lernfunktion des verstärkenden Lernens auszuführen.
  • Vor dem Einsatz des Meta-Lernverstärkungsagenten im Produktivbetrieb kann dieser in geeigneter Weise zum Beispiel mithilfe geeigneter Trainingsdaten durch überwachtes Lernen trainiert werden. Alternativ ist auch ein unüberwachtes Lernen möglich. Um die Ergebnisse des Trainings im späteren Produktivbetrieb verwenden zu können, ist ein Speichermittel vorgesehen, auf den der Meta-Lernverstärkungsagent zugreifen kann und in dem die durch ein entsprechendes Training erhaltenen Erfahrungsdaten des Meta-Lernverstärkungsagenten abrufbar gespeichert sind. Während des Trainings werden - wie auch im späteren Produktivbetrieb - die nachfolgend erläuterten Verfahrensschritte S2) bis S6) ausgeführt. Das Speichermittel kann insbesondere eine Datenbank sein.
  • In einem zweiten Schritt S2) wird ein übergeordnetes Kalibrierungsproblems des technischen Systems mit einer Mehrzahl n ≥ 2 von Teilproblemen definiert. Das technische System verfügt über eine Mehrzahl zu kalibrierender Teilfunktionen, die zu kalibrieren sind und somit Teilprobleme des übergeordneten Kalibrierungsproblems bilden. Die Kalibrierung sämtlicher Teilfunktionen bildet das übergeordnete Kalibrierungsproblem. Für jede dieser Teilfunktionen existiert zum Beispiel eine Vielzahl von Kalibrierungskarten, die während des Kalibrierungsprozesses kalibriert werden müssen. Bei diesen Kalibrierungskarten kann es sich insbesondere um zweidimensionale oder dreidimensionale Matrizen handeln.
  • Ferner werden in diesem Verfahrensschritt S2) mögliche Lösungsverfahren, die zur Lösung der Teilprobleme geeignet sind, sowie Metriken in Bezug auf den Erfolg, die Teilprobleme und das übergeordnete Kalibrierungsproblem zu lösen, definiert. Dadurch wird insbesondere erreicht, dass der Meta-Lernverstärkungsagent sowie die von diesem auswählbaren Lösungsverfahren, die für die Lösung der Teilprobleme vorgesehen sind, den Unterschied zwischen der zu erreichenden Zielkalibrierung und der aktuellen Kalibrierung des technischen Systems kennen.
  • In einem Verfahrensschritt S3) wird eine initiale Kalibrierungsgenauigkeit des übergeordneten Kalibrierungsproblems mittels des maschinellen Meta-Lernverstärkungsagenten beobachtet. Genauer gesagt, beobachtet der maschinelle Meta-Lernverstärkungsagent die Metrik des übergeordneten Kalibrierungsproblems und die Metriken der Teilprobleme, die Funktionskomplexität des technischen Systems und dessen gegenwärtigen Zustand, den Teilproblemzustand in Bezug auf die Kalibrierungskarten sowie - sofern es sich nicht um die erste Iterationsschleife des Verfahrens handelt - die zuletzt verwendeten Lösungsverfahren.
  • In einem Verfahrensschritt S4) führt der maschinelle Meta-Lernverstärkungsagent eine Aktion aus, die zumindest das Auswählen eines der Teilprobleme und eines Lösungsverfahrens, das zur Lösung des Teilproblems geeignet ist, umfasst. Ferner kann der maschinelle Meta-Lernverstärkungsagent in diesem Verfahrensschritt die Anzahl der Iterationen für die Lösung des Teilproblems oder die zu erreichende Metrik auswählen. Dabei ist eine zusätzliche Flexibilität in Bezug auf die gewählte Metrik für das Teilproblem und die gewählten Daten für die Kalibrierung des Teilproblems möglich. Beispielsweise wählt der maschinelle Lernverstärkungsagent neben dem Teilproblem und dem Lösungsverfahren auch eine Anzahl von Teilparameterkalibrierungskarten. Vorzugsweise können die Lösungsverfahren zur Lösung der Teilprobleme mittels des maschinellen Meta-Lernverstärkungsagenten aus einer Gruppe von Lösungsverfahren ausgewählt werden, die lineare oder nichtlineare Lösungs- und Optimierungsverfahren mit möglichen Nebenbedingungen, statistische Verfahren, insbesondere Gaußsche Verfahren, überwachte maschinelle Lernverfahren und verstärkende Lernverfahren umfasst oder aus diesen besteht.
  • In einem Schritt S5) wird das Teilproblem mittels des im vorhergehenden Schritt ausgewählten Lösungsverfahrens bearbeitet, wobei aus einer fortgeschrittenen Metrik des Teilproblems eine Änderung der Metrik des übergeordneten Kalibrierungsproblems resultiert und der maschinelle Meta-Lernverstärkungsagent in Abhängigkeit von seinen neuen Zuständen und vom Fortschritt der Metrik des übergeordneten Kalibrierungsproblems eine Belohnung erhält. Der Fortschritt bei der Lösung des Teilproblems führt zu einer Rückmeldung an den maschinellen Lernverstärkungsagenten.
  • Die Metrik der fortgeschrittenen (also weiter vorangetriebenen) Lösung des Teilproblems führt zu einer Änderung der Metrik des übergeordneten Kalibrierungsproblems. Auf der Grundlage der neuen Zustände und des Fortschritts in der Metrik des übergeordneten Kalibrierungsproblems kann eine Belohnung für den maschinellen Lernverstärkungsagenten berechnet werden. Das Belohnungsfeedback stimuliert den maschinellen Lernverstärkungsagenten, besser zu werden. Das gewählte Lösungsverfahren bearbeitet das ausgewählte Teilproblem so lange, bis die im Verfahrensschritt S4) festgelegte maximale Anzahl von Iterationen oder das Ziel der Lösung des Teilproblems erreicht ist. Die Lösung des ausgewählten Teilproblems wird durch das Lösungsverfahren somit also entweder vorangetrieben oder das Teilproblem wird durch das gewählte Lösungsverfahren vollständig gelöst.
  • Mögliche Zustände des Meta-Lernverstärkungsagenten sind insbesondere:
    • - Metriken in Bezug auf den Zustand und den Fortschritt des übergeordneten Kalibrierungsproblems, wie zum Beispiel die Abweichung vom Ziel,
    • - Informationen über die zu kalibrierende Funktion des technischen Systems, d. h. alle beteiligten Kalibrierungskarten, Kurven, Variablen, Bezeichnungen,
    • - Metrik der Kalibrierungsergebnisse von Teilproblemen, verfügbare Daten zur Verwendung,
    • - ausgewählte Kombinationen von Teilproblemen, Lösungsverfahren, optional ausgewählter Metrik und ausgewählten Daten für die Teilproblem-Kalibrierung,
    • - der Arbeitspunkt des technischen Systems, der durch Systemzustände dargestellt wird, in denen Teilprobleme kalibriert werden müssen.
  • Mögliche Belohnungen des Meta-Lernverstärkungsagenten sind:
    • - Metriken des Fortschritts oder des Erfolgs in Bezug auf die Lösung des übergeordneten Kalibrierungsproblems,
    • - Fortschritte bei den zuvor ausgewählten Teilproblemen in Bezug auf ihre Erfolgsmetriken,
    • - positive Belohnungen, wenn Zielabweichungen reduziert oder Teilprobleme gelöst werden,
    • - negative Belohnungen, wenn ein für die Lösung eines der Teilprobleme gewähltes Lösungsverfahren kein Zwischenergebnis (Fehlschlag) oder einen Misserfolg aufgrund einer nicht ausreichenden Metrik liefert.
  • Die Verfahrensschritte S3) bis S5) werden iterativ für jedes der Teilprobleme der Kalibrierung durchgeführt, bis das übergeordnete Kalibrierungsproblem schließlich gelöst ist (Schritt S6)).
  • Das hier vorgestellte Verfahren löst das Problem der Kalibrierungsaufgaben technischer Systeme mit einer Komplexität, die sehr hoch ist und von den einzelnen Lösungsverfahren zur Lösung der Teilprobleme nicht auf einmal gelöst werden kann. Die Idee schlägt einen Ansatz mit einem maschinellen Meta-Lernverstärkungsagenten auf hoher Ebene vor, um die Komplexität des übergeordneten Kalibrierungsproblems selbsttätig zu erkennen und das übergeordnete Kalibrierungsproblem in mehrere Teilprobleme aufzuteilen, die einzeln, aber in einer gelernten Reihenfolge durch eine sequentielle Auswahl von Kombinationen aus Teilproblemen, Lösungsverfahren, relevanten Metriken und Daten kalibriert werden können.
  • Der vorgeschlagene Ansatz ist somit ein entscheidender Schritt zur vollständigen Automatisierung der Lösung sehr komplexer Kalibrierungsprobleme und kann rekursiv auf noch höhere Komplexitätsdimensionen erweitert werden.
  • Mögliche Anwendungsbereiche des hier beschriebenen Verfahrens sind insbesondere:
    • - Antriebsstränge und die Kalibrierung der Komponenten von Antriebssträngen,
    • - Systemdynamikregelung und Parameterkalibrierung,
    • - Parameterkalibrierung für Steuergeräte von Brennkraftmaschinen oder elektrischen Maschinen, Kalibrierung teilautonomer oder vollautonomer Fahrfunktionen,
    • - Anwendungen zur Fahrwerksregelung, Kalibrierung des Thermomanagements.

Claims (9)

  1. Computerimplementiertes Verfahren zur Kalibrierung eines technischen Systems, umfassend die Schritte: S1): Bereitstellen eines maschinellen Meta-Lernverstärkungsagenten, der dazu ausgebildet ist, eine Lernfunktion des verstärkenden Lernens auszuführen, S2): Definieren eines übergeordneten Kalibrierungsproblems des technischen Systems mit einer Mehrzahl n ≥ 2 von Teilproblemen, Definieren möglicher Lösungsverfahren zur Lösung der Teilprobleme und Definieren von Metriken in Bezug auf den Erfolg, die Teilprobleme und das übergeordnete Kalibrierungsproblem zu lösen, S3): Beobachten einer initialen Kalibrierungsgenauigkeit des übergeordneten Kalibrierungsproblems mittels des maschinellen Meta-Lernverstärkungsagenten, S4): Ausführen einer Aktion des maschinellen Meta-Lernverstärkungsagenten, die zumindest das Auswählen eines der Teilprobleme und eines Lösungsverfahrens zur Lösung des Teilproblems umfasst, S5): Bearbeiten des Teilproblems mittels des im vorhergehenden Schritt ausgewählten Lösungsverfahrens, wobei aus einer fortgeschrittenen Metrik des Teilproblems eine Änderung der Metrik des übergeordneten Kalibrierungsproblems resultiert und der maschinelle Meta-Lernverstärkungsagent in Abhängigkeit von seinen neuen Zuständen und vom Fortschritt der Metrik des übergeordneten Kalibrierungsproblems eine Belohnung erhält, S6): Wiederholen der Schritte S3) bis S5) für jedes der Teilprobleme, bis das übergeordnete Kalibrierungsproblem gelöst ist.
  2. Computerimplementiertes Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Lösungsverfahren zur Lösung der Teilprobleme mittels des maschinellen Meta-Lernverstärkungsagenten aus einer Gruppe von Lösungsverfahren ausgewählt werden, die lineare oder nichtlineare Lösungs- und Optimierungsverfahren mit möglichen Nebenbedingungen, statistische Verfahren, insbesondere Gaußsche Verfahren, überwachte maschinelle Lernverfahren und verstärkende Lernverfahren umfasst oder aus diesen besteht.
  3. Computerimplementiertes Verfahren nach einem der Ansprüche 1 oder 2, dadurch gekennzeichnet, dass das Ausführen der Aktion des maschinellen Meta-Lernverstärkungsagenten zumindest bei der ersten Ausführung des Verfahrensschritts S4) eine Auswahl der Anzahl der auszuführenden Iterationsschleifen des ausgewählten Lösungsverfahrens oder der zu erreichenden Metrik umfasst.
  4. Computerimplementiertes Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass die Belohnungen des maschinellen Meta-Lernverstärkungsagenten auf Basis von Metriken des Fortschritts und des Erfolgs bei der Lösung des übergeordneten Kalibrierungsproblems bestimmt werden.
  5. Computerimplementiertes Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass der maschinelle Lernagent positive Belohnungen erhält, wenn die Abweichungen vom Kalibrierungsziel reduziert werden oder ein Teilproblem gelöst wird.
  6. Computerimplementiertes Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass der maschinelle Lernagent negative Belohnungen erhält, wenn ein für die Lösung eines der Teilprobleme gewähltes Lösungsverfahren kein Zwischenergebnis oder einen Misserfolg aufgrund einer nicht ausreichenden Metrik liefert.
  7. Computerimplementiertes Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass der Meta-Lernverstärkungsagent anhand von Trainingsdatensätzen durch überwachtes Lernen auf eine Vielzahl von Kalibrierungsproblemen und Teilproblemen des technischen Systems und möglichen Daten-, Lösungsverfahrens- und Metrikkombinationen zu deren Lösung trainiert wird.
  8. Computerimplementiertes Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass der Meta-Lernverstärkungsagent durch unüberwachtes Lernen auf eine Vielzahl von Kalibrierungsproblemen und Teilproblemen des technischen Systems und möglichen Daten-, Lösungsverfahrens- und Metrikkombinationen zu deren Lösung trainiert wird.
  9. Computerimplementiertes Verfahren nach einem der Ansprüche 1 bis 8, dadurch gekennzeichnet, dass Erfahrungsdaten des Meta-Lernverstärkungsagenten in einem Speichermittel abrufbar gespeichert werden.
DE102022112606.4A 2022-05-19 2022-05-19 Computerimplementiertes Verfahren zur Kalibrierung eines technischen Systems Active DE102022112606B3 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102022112606.4A DE102022112606B3 (de) 2022-05-19 2022-05-19 Computerimplementiertes Verfahren zur Kalibrierung eines technischen Systems

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102022112606.4A DE102022112606B3 (de) 2022-05-19 2022-05-19 Computerimplementiertes Verfahren zur Kalibrierung eines technischen Systems

Publications (1)

Publication Number Publication Date
DE102022112606B3 true DE102022112606B3 (de) 2023-07-27

Family

ID=87068367

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102022112606.4A Active DE102022112606B3 (de) 2022-05-19 2022-05-19 Computerimplementiertes Verfahren zur Kalibrierung eines technischen Systems

Country Status (1)

Country Link
DE (1) DE102022112606B3 (de)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113156900A (zh) 2021-03-30 2021-07-23 南京航空航天大学 一种基于元强化学习的加工变形控制方法
DE102020120367A1 (de) 2020-08-03 2022-02-03 Dr. Ing. H.C. F. Porsche Aktiengesellschaft Verfahren und System zur Steuerung eines elektrifizierten Fahrzeugs
US20220036179A1 (en) 2020-07-31 2022-02-03 Nvidia Corporation Online task inference for compositional tasks with context adaptation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220036179A1 (en) 2020-07-31 2022-02-03 Nvidia Corporation Online task inference for compositional tasks with context adaptation
DE102020120367A1 (de) 2020-08-03 2022-02-03 Dr. Ing. H.C. F. Porsche Aktiengesellschaft Verfahren und System zur Steuerung eines elektrifizierten Fahrzeugs
CN113156900A (zh) 2021-03-30 2021-07-23 南京航空航天大学 一种基于元强化学习的加工变形控制方法

Similar Documents

Publication Publication Date Title
EP2185980B1 (de) Verfahren zur rechnergestützten steuerung und/oder regelung mit hilfe neuronaler netze
DE102007017259B4 (de) Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems
EP2112568B1 (de) Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems
EP2112569B1 (de) Verfahren zum rechnergestützten Lernen einer Steuerung und/oder Regelung eines technischen Systems
EP2999998B1 (de) Methode zur ermittlung eines modells einer ausgangsgrösse eines technischen systems
WO2019206775A1 (de) Verfahren und vorrichtung zum ermitteln einer netzkonfiguration eines neurona-len netzes
DE102007001026A1 (de) Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems
WO2020187591A1 (de) Verfahren und vorrichtung zum ansteuern eines roboters
DE102020211648B4 (de) Vorrichtung und Verfahren zum Steuern einer Robotervorrichtung
DE102022112606B3 (de) Computerimplementiertes Verfahren zur Kalibrierung eines technischen Systems
DE102020111204B4 (de) Verfahren zum Betreiben eines Steuergeräts für ein Kraftfahrzeug sowie entsprechendes Steuergerät
WO2021259980A1 (de) Training eines künstlichen neuronalen netzwerkes, künstliches neuronales netzwerk, verwendung, computerprogramm, speichermedium und vorrichtung
WO2020207786A1 (de) Verfahren, vorrichtung und computerprogramm zum betreiben eines tiefen neuronalen netzes
WO2020207789A1 (de) Verfahren und vorrichtung zum ansteuern einer technischen einrichtung
WO2016198046A1 (de) Verfahren für die auswahl eines simulationsmodells zur abbildung wenigstens eines funktionalen prozesses einer antriebsstrangkomponente aus einer optimierten modellmenge
DE202019103862U1 (de) Vorrichtung zum Erstellen einer Strategie für einen Roboter
DE102019210372A1 (de) Verfahren, Vorrichtung und Computerprogramm zum Erstellen einer Strategie für einen Roboter
DE202023100506U1 (de) Vorrichtung zum optimierten Trainieren eines bestärkenden Lernalgorithmus zur Erzeugung eines Steuerbefehls
EP3992733A1 (de) Maschinenbelegungsplanung für eine komplexe fertigungsanlage
DE102019132624A1 (de) Verfahren, Vorrichtung, Computerprogramm und computerlesbares Speichermedium zum Erstellen eines Motion Cueing Algorithmus
DE102019131613A1 (de) Verfahren zum Betreiben einer elektronischen Recheneinrichtung für einen Produktentwicklungsprozess mittels maschinellen Lernens, sowie elektronische Recheneinrichtung
DE102019204136A1 (de) Verfahren und Vorrichtung für Training und Herstellung eines künstlichen neuronalen Netzes
DE102011076969A1 (de) Verfahren zum rechnergestützten Lernen einer Regelung und/oder Steuerung eines technischen Systems
DE102022132036A1 (de) Computerimplementiertes Verfahren zur Konstruktion eines Bauteils
DE102022104313A1 (de) Verfahren, System und Computerprogrammprodukt zum autonomen Kalibrieren eines elektrischen Antriebsstrangs

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final