EP4338019A1

EP4338019A1 - Verfahren und konfigurationssystem zum konfigurieren einer maschinensteuerung

Info

Publication number: EP4338019A1
Application number: EP22747991.2A
Authority: EP
Inventors: Dieter Bogdoll; Markus Michael Geipel; Daniel Hein; Johannes Kehrer; Carlos Andres Palacios Valdes; Axel Reitinger; Ferdinand Strixner
Original assignee: Siemens AG
Current assignee: Siemens AG
Priority date: 2021-07-21
Filing date: 2022-07-07
Publication date: 2024-03-20
Also published as: WO2023001561A1; EP4123399A1; CN117693719A

Abstract

Zum Konfigurieren einer Maschinensteuerung (CTL) durch einen Aktionsausführungsbaum (BT) werden vorgegebene Aktionsmuster (AP) eingelesen. Weiterhin wird eine Vielzahl von Aktionsausführungsbäumen (BT) für eine zu steuernde Maschine (M) generiert. Für einen jeweils generierten Aktionsausführungsbaum (BT) wird eine Performanz (PV) für ein Steuern der Maschine (M) anhand des jeweiligen Aktionsausführungsbaums (BT) ermittelt. Weiterhin werden im jeweiligen Aktionsausführungsbaum (BT) die vorgegebenen Aktionsmuster (AP) gesucht. Ein im jeweiligen Aktionsausführungsbaum (BT) gefundenes Aktionsmuster (AP) wird dann zumindest teilweise durch einen Verweis (L) auf das vorgegebene Aktionsmuster (AP) ersetzt. Ferner wird eine Baumgröße (BG) des so modifizierten Aktionsausführungsbaum (BTM) ermittelt. Anhand der generierten Aktionsausführungsbäume (BT) wird dann mittels eines numerischen Optimierungsverfahrens ein hinsichtlich größerer Performanz und geringerer Baumgröße optimierter Aktionsausführungsbaum (BTO) ermittelt und zum Konfigurieren der Maschinensteuerung (CTL) ausgegeben.

Description

Beschreibung

Verfahren und KonfigurationsSystem zum Konfigurieren einer Maschinensteuerung

Komplexe Maschinen, wie z.B. Roboter, Motoren, Werkzeugma schinen, Turbinen, 3D-Drucker, Fertigungsanlagen oder Kraft fahrzeuge benötigen für einen produktiven Betrieb in der Re gel eine komplex konfigurierte Steuerung, um eine Performanz der gesteuerten Maschine gezielt zu optimieren. Die zu opti mierende Performanz kann z.B. eine Leistung, einen Ertrag, einen Ressourcenbedarf, einen Wirkungsgrad, eine Präzision, einen Schadstoffausstoß, eine Stabilität, einen Verschleiß und/oder andere Zielparameter der Maschine betreffen.

Maschinensteuerungen werden häufig während des Designs oder einer Inbetriebnahme der zu steuernden Maschine von Experten konfiguriert . Eine solche Konfiguration durch Experten ist jedoch oft verhältnismäßig zeitaufwändig. Zudem ist in vielen Fällen zusätzlicher Aufwand für eine Optimierung der Konfigu ration erforderlich.

Zur automatischen Konfiguration von Maschinensteuerungen wer den in zunehmendem Maße datengetriebene Verfahren des maschi nellen Lernens verwendet. Mittels derartiger Lernverfahren kann eine Maschinensteuerung darauf trainiert werden, aus ak tuellen BetriebsSignalen der Maschine die enigen Steueraktio nen abzuleiten, die spezifisch ein gewünschtes oder anderwei tig optimales Verhalten der Maschine bewirken. Zu diesen Zwe cken steht eine Vielzahl von bekannten maschinellen Lernver fahren, insbesondere Verfahren des bestärkenden Lernens zur Verfügung .

Eine durch datengetriebene Lernverfahren optimierte Konfigu ration ist jedoch in vielen Fällen hinsichtlich ihrer Wir kungsbeziehungen durch Experten kaum nachvollziehbar oder in terpretierbar. Dies erschwert häufig eine Validierung oder Weiterentwicklung derartiger Konfigurationen. Es ist Aufgabe der vorliegenden Erfindung, ein Verfahren und ein KonfigurationsSystem zum Konfigurieren einer Maschinen steuerung anzugeben, durch die sich besser interpretierbare Konfigurationen automatisch erstellen lassen.

Gelöst wird diese Aufgabe durch ein Verfahren mit den Merkma len des Patentanspruchs 1, durch ein KonfigurationsSystem mit den Merkmalen des Patentanspruchs 13, durch ein Computerpro grammprodukt mit den Merkmalen des Patentanspruchs 14 sowie durch ein Computerlesbares Speichermedium mit den Merkmalen des Patentanspruchs 15.

Zum Konfigurieren einer Maschinensteuerung durch einen eine Ausführung von Aktionen durch eine Maschine spezifizierenden Aktionsausführungsbaum werden vorgegebene Aktionsmuster ein gelesen . Weiterhin wird eine Vielzahl von Aktionsausführungs- bäumen für die Maschine generiert. Die Aktionsausführungsbäu me können dabei insbesondere sogenannte Behavior-Trees sein. Für einen jeweils generierten Aktionsausführungsbaum wird ei ne Performanz für ein Steuern der Maschine anhand des jewei- ligen Aktionsausführungsbaums ermittelt. Weiterhin werden im jeweiligen Aktionsausführungsbaum die vorgegebenen Aktions muster gesucht. Ein im jeweiligen Aktionsausführungsbaum ge fundenes Aktionsmuster wird dann zumindest teilweise durch einen Verweis auf das vorgegebene Aktionsmuster ersetzt. Fer ner wird eine Baumgröße des so modifizierten Aktionsausfüh- rungsbaum ermittelt. Anhand der generierten Aktionsausfüh rungsbäume wird dann mittels eines numerischen Optimierungs- verfahrens ein hinsichtlich größerer Performanz und geringe rer Baumgröße optimierter Aktionsausführungsbaum ermittelt und zum Konfigurieren der Maschinensteuerung ausgegeben.

Zum Ausführen des erfindungsgemäßen Verfahrens sind ein Kon figurationssystem, ein Computerprogrammprodukt sowie ein com puterlesbares, vorzugsweise nichtflüchtiges Speichermedium vorgesehen . Das erfindungsgemäße Verfahren sowie das erfindungsgemäße Konfigurationssysfern können beispielsweise mittels eines oder mehrerer Computer, Prozessoren, anwendungsspezifischer inte grierter Schaltungen (ASIC), digitaler Signalprozessoren (DSP) und/oder sogenannter „Field Programmable Gate Arrays"

(FPGA) ausgeführt bzw. implementiert werden.

Aufgrund der zumindest teilweisen Ersetzung von gefundenen Aktionsmustern durch Verweise kann ein Aktionsausführungsbaum in vielen Fällen verkleinert werden. Auf diese Weise kann ei ne Komplexität des Aktionsausführungsbaums in der Regel ver ringert werden. Insofern neben der Performanz auch die Baum größe von Aktionsausführungsbäumen als Optimierungskriterium verwendet wird, kann die Optimierung in Richtung von Aktions ausführungsbäumen getrieben werden, die vorgegebene Aktions muster aufweisen. Auf diese Weise kann ein Aktionsausfüh- rungsbaum bzw. eine Konfiguration ermittelt werden, die in der Regel sowohl performant ist als auch eine geringe Komple xität aufweist. Konfigurationen mit geringer Komplexität sind in der Regel besser durch Experten interpretierbar und damit leichter validierbar und/oder weiterentwickelbar.

Vorteilhafte Ausführungsformen und Weiterbildungen der Erfin dung sind in den abhängigen Ansprüchen angegeben.

Gemäß einer vorteilhaften Ausführungsform der Erfindung kann die Vielzahl von Aktionsausführungsbäumen zumindest teilweise anhand der Aktionsmuster generiert werden. Insbesondere kön nen dabei Aktionsausführungsbäume aus den Aktionsmustern zu mindest teilweise zusammengesetzt werden. Auf diese Weise können gezielt Aktionsausführungsbäume generiert werden, die bekannte und/oder leicht interpretierbare Aktionsmuster auf weisen.

Nach einer weiteren vorteilhaften Ausführungsform der Erfin dung kann ein vorgegebener initialer Aktionsausführungsbaum eingelesen werden. Die Vielzahl von Aktionsausführungsbäumen kann dann zumindest teilweise ausgehend vom initialen Akti- onsausführungsbaum generiert werden. Der initiale Aktionsaus führungsbaum kann insbesondere ein von einem Experten er stellter, getesteter und/oder validierter Aktionsausführungs baum sein. Auf diese Weise können Expertenvorgaben bei der Ermittlung eines optimierten Aktionsausführungsbaums berück sichtigt werden.

Darüber hinaus kann der initiale Aktionsausführungsbaum durch einen Interpreter ausgeführt werden, wobei eine Referenzab folge von durch den initialen Aktionsausführungsbaum spezifi zierten Maschinenaktionen ermittelt wird. Auch die generier ten Aktionsausführungsbäume können dann jeweils durch den In terpreter ausgeführt werden, wobei eine jeweilige Abfolge von durch den jeweiligen generierten Aktionsausführungsbaum spe zifizierten Maschinenaktionen ermittelt wird. Damit kann ein generierter Aktionsausführungsbaum, dessen jeweilige Abfolge nicht mit der Referenzabfolge übereinstimmt, verworfen wer den. Auf diese Weise kann die Optimierung auf Aktionsausfüh rungsbäume eingeschränkt werden, die die Referenzabfolge re produzieren . Wenn der initiale Aktionsausführungsbaum vor teilhafterweise so gewählt wird, dass die hierdurch spezifi zierten Maschinenaktionen oder eine vorgegebene Auswahl die ser Maschinenaktionen nur zulässige oder erforderliche Ziel- Maschinenaktionen umfassen, kann auf diese Weise sicherge stellt werden, dass die Optimierung auf Aktionsausführungs- bäume beschränkt bleibt, die vorgegebene Entwicklungsziele erfüllen .

Vorzugsweise kann eine vorgegebene SelektionsInformation ein gelesen werden, anhand der die enigen Maschinenaktionen se lektiert werden, deren jeweilige Abfolge, insbesondere Refe renzabfolge zu ermitteln ist. Auf diese Weise können insbe sondere aus den durch den initialen Aktionsausführungsbaum spezifizierten Maschinenaktionen, diejenigen Maschinenaktio nen ausgewählt werden, die zwingend auszuführen sind und auf die die Optimierung eingeschränkt werden soll. Nach einer vorteilhaften Ausführungsform der Erfindung kann das numerische Optimierungs erfahren ein genetisches Optimie- rungsverfahren sein, durch das auch die Vielzahl von Aktions ausführungsbäumen generiert wird. Das genetische Optimie- rungsverfahren kann dabei insbesondere durch den initialen Aktionsausführungsbaum initialisiert werden. Für das geneti sche Optimierungsverfahren kann eine Fitnessfunktion vorgese hen sein, die einer höheren Performanz und/oder einer gerin geren Baumgröße eine größere Fitness zuordnet als einer ge ringeren Performanz und/oder einer größeren Baumgröße. Auf diese Weise kann die Optimierung bevorzugt in Richtung per- formanter und/oder weniger komplexer Konfigurationen getrie ben werden. Zur Durchführung derartiger genetischer Optimie- rungsverfahren steht eine Vielzahl von effizienten Standard routinen zur Verfügung.

Nach einer vorteilhaften Ausführungsform der Erfindung kann für die Vielzahl von Aktionsausführungsbäumen eine Pareto- Front ermittelt werden, wobei eine Erhöhung der Performanz sowie eine Verringerung der Baumgröße als Pareto- Zielkriterien verwendet werden. Der optimierte Aktionsausfüh- rungsbaum kann dann anhand von Aktionsausführungsbäumen der Pareto-Front abgeleitet werden. Insbesondere kann der opti mierte Aktionsausführungsbaum aus Aktionsausführungsbäumen der Pareto-Front selektiert oder interpoliert werden. Während eine Selektion besonders einfach auszuführen ist, können bei einer Interpolation auch mehrere vorteilhafte Eigenschaften von Aktionsausführungsbäumen kombiniert werden. Insofern die Pareto-Front hinsichtlich der Performanz und der Baumgröße ermittelt wird, kann ein optimierter Aktionsausführungsbaum ermittelt werden, der in der Regel sowohl performant ist als auch eine geringe Baumgröße und damit eine geringe Komplexi tät aufweist. Als Pareto-Front sei in diesem Zusammenhang auch eine Menge von Aktionsausführungsbäumen verstanden, de ren Abstand zu einem mathematisch exakten Pareto-Optimum z.B. einen gegebenen Schwellenwert unterschreitet. Durch eine Be schränkung auf Aktionsausführungsbäume der Pareto-Front wird ein Raum möglicher Aktionsausführungsbäume in der Regel er- heblich eingeschränkt, wobei insbesondere nicht optimale Ak tionsausführungsbäume wegfallen. Die Ermittlung des optimier ten Aktionsausführungsbaums sowie ggf. weitergehende Optimie rungen können so erheblich vereinfacht werden.

Vorteilhafterweise können Aktionsausführungsbäume der Pareto- Front in das genetische Optimierungs erfahren eingespeist werden. Alternativ oder zusätzlich können nicht in der Pare- to-Front enthaltene Aktionsausführungs-bäume verworfen wer den. Auf diese Weise kann das genetische Optimierungsverfah ren mit vorteilhaften Aktionsausführungsbäumen angereichert werden. Alternativ kann das Optimierungsverfahren nach Er mittlung einer Pareto-Front abgebrochen werden.

Weiterhin können zum Ermitteln der Performanz eines jeweili gen Aktionsausführungsbaums ein Simulationsmodell der Maschi ne, ein datengetriebenes Modell der Maschine, die Maschine selbst und/oder eine dazu ähnliche Maschine anhand des jewei- ligen Aktionsausführungsbaums gesteuert und eine daraus re sultierende Performanz der Maschine ermittelt werden. Als Si mulationsmodell kann vorzugsweise ein Surrogat-Mode11 der Ma schine verwendet werden, das weniger Rechenressourcen als ei ne vollständige physikalische Simulation erfordert.

Darüber hinaus kann zum Ermitteln der Baumgröße eine Kanten anzahl, eine Knotenanzahl und/oder eine Baumtiefe des modifi zierten Aktionsausführungsbaums oder eine gewichtete Kombina tion der Kantenanzahl, der Knotenanzahl und/oder der Baumtie fe ermittelt werden. Die vorstehenden Kriterien erlauben eine besonders einfache Bewertung der Baumgröße bzw. der Komplexi tät eines jeweiligen Aktionsausführungsbaums.

Ein Ausführungsbeispiel der Erfindung wird nachfolgend anhand der Zeichnung näher erläutert. Dabei veranschaulichen jeweils in schematischer Darstellung:

Figur 1 eine Maschine mit einer Maschinensteuerung zum Steu ern der Maschine, Figur 2 einen Aktionsausführungsbaum,

Figur 3 ein erfindungsgemäßes KonfigurationsSystem beim Kon figurieren einer Maschinensteuerung und

Figur 4 ein Modifizieren eines Aktionsausführungsbaums.

Insofern in den Figuren die gleichen oder korrespondierende Bezugszeichen verwendet werden, bezeichnen diese Bezugszei chen die gleichen oder korrespondierenden Entitäten, die ins besondere wie im Zusammenhang mit der betreffenden Figur be schrieben, implementiert oder ausgestaltet sein können.

Figur 1 veranschaulicht in schematischer Darstellung eine Ma schine M, die mit einer Maschinensteuerung CTL zum Steuern der Maschine M gekoppelt ist. Die Maschine M kann insbesonde re ein Roboter, ein Motor, eine Werkzeugmaschine, eine Turbi ne, eine Fertigungsanlage, ein Kraftfahrzeug, ein 3-D- Drucker, ein Computer, ein mechanisches System, ein elektri sches System oder ein anderes Gerät oder eine andere Anlage sein. Die Maschine M verfügt über eine Sensorik S zum fort laufenden Messen und/oder Erfassen von BetriebsSignalen BS der Maschine M sowie ggf. von Daten aus einer Umgebung der Maschine M.

Die Maschinensteuerung CTL ist rechnergestützt konfigurierbar und kann als Teil der Maschine M oder ganz oder teilweise ex tern zur Maschine M implementiert sein. Die Maschinensteue- rung CTL soll mittels der Erfindung derart konfiguriert wer den, dass die Maschine M in optimierter Weise gesteuert wird. Unter einem Steuern sei dabei auch ein Regeln, sowie eine Ausgabe und Verwendung von steuerungsrelevanten, d. h. zur gezielten Beeinflussung der Maschine M beitragenden Daten oder Steuersignalen verstanden.

Im vorliegenden Ausführungsbeispiel soll die Maschinensteue- rung CTL mittels eines Verfahrens des maschinellen Lernens, insbesondere eines genetischen OptimierungsVerfahrens so kon figuriert werden, dass ein Betrieb der Maschine M abhängig von den erfassten Betriebssignalen BS optimiert wird. Unter dem Begriff Optimieren sei allgemein auch ein Annähern an ein Optimum verstanden. Dabei soll vorzugsweise eine Performanz der Maschine M erhöht werden.

Ein Steuerungsverhalten der Maschinensteuerung CTL wird durch ihre Konfiguration festgelegt. Die Konfiguration umfasst da bei insbesondere einen Aktionsausführungsbaum vorzugsweise in Form eines dem Fachmann bekannten Behavior-Trees, durch den von der Maschine M auszuführende Aktionen und insbesondere Abfolgen von Aktionen spezifiziert werden. Ein Aktionsausfüh- rungsbaum wird durch einen baumartig verlinkten gerichteten Graphen dargestellt, der vorzugsweise als baumartig verlinkte Datenstruktur implementiert ist. Zur Interpretation und Aus führung eines Aktionsausführungsbaums bzw. der hierdurch spe zifizierten Maschinenaktionen ist eine Vielzahl von effizien ten Steuerungsverfahren bekannt und verfügbar.

Figur 2 veranschaulicht einen prinzipiellen Aufbau eines sol chen Aktionsausführungsbaums BT, der beispielsweise als Beha- vior-Tree ausgestaltet sein kann. Der Aktionsausführungsbaum BT umfasst einen gerichteten, baumartig verzweigten Graphen mit mehreren Knoten A0, Al, A2, A3, A4, ..., die durch ge richtete Kanten verbunden sind. Bestimmte Knoten des Graphen repräsentieren dabei Maschinenaktionen, die abhängig von vor gegebenen Bedingungen durch die Maschine M auszuführen sind. Durch die gerichteten Kanten des Graphen können Beziehungen zwischen Bedingungen und bedingt auszuführenden Maschinenak tionen oder eine Abfolge von auszuführenden Maschinenaktionen spezifiziert werden. Ein durch eine Abfolge von auszuführen den Maschinenaktionen bestimmter Prozessfluss verzweigt sich dabei abhängig von den vorgegebenen Bedingungen entlang der Baumstruktur des Graphen. Ein als Behavior-Tree ausgestalte ter Aktionsausführungsbaum BT kann insbesondere sog. Fallback-Knottin, Sequence-Knoten, Control-flow-Knoten sowie Dekoratoren wie "always", "guard", "not", "retry", "time lim- it", "wait for" und/oder "while" umfassen.

Wie Figur 1 weiter veranschaulicht, wird zur optimierten Kon figuration der Maschinensteuerung CTL ein optimierter Akti onsausführungsbaum BTO, vorzugsweise in Form eines optimier ten Behavior-Trees zur Maschinensteuerung CTL übermittelt.

Ein hierdurch eingestelltes Steuerungsverhalten der Maschi nensteuerung CTL wird häufig auch als Policy bezeichnet. Der optimierte Aktionsausführungsbaum BTO wird durch ein erfin dungsgemäßes Verfahren ermittelt.

Durch die Sensorik S werden die fortlaufend erfassten Be triebssignale BS der Maschine M zur Maschinensteuerung CTL übermittelt . Die BetriebsSignale BS können dabei Angaben über Betriebszustände der Maschine M, über Positionen oder Bewe gungen von Komponenten, über Schaltzustände, über Steuerzu stände, über Steueraktionen, über physikalische, chemische oder elektrische Messgrößen und/oder über andere für den Be trieb der Maschine M relevante Parameter umfassen.

Abhängig von den übermittelten BetriebsSignalen BS werden durch die Maschinensteuerung CTL Steuersignale CS generiert, die von der Maschinensteuerung CTL zum optimierten Steuern der Maschine M zu dieser übermittelt werden. Die Steuersigna le CS werden dabei abhängig vom optimierten Aktionsausfüh rungsbaum BTO so generiert, dass eine durch den optimierten Aktionsausführungsbaum BTO spezifizierte Abfolge von Maschi nenaktionen ausgeführt wird.

Figur 3 zeigt in schematischer Darstellung ein erfindungsge mäßes KonfigurationsSystem KS beim Konfigurieren der Maschi nensteuerung CTL.

Die Maschinensteuerung CTL kann einen Teil des Konfigurati onssystems KS bilden oder ganz oder teilweise extern zum Kon figurationssystem KS angeordnet sein. Das KonfigurationsSys tem KS und/oder die Maschinensteuerung CTL weisen einen oder mehrere Prozessoren zur Durchführung des erfindungsgemäßen Verfahrens sowie einen oder mehrere Speicher zum Speichern von zu verarbeitenden Daten auf. Wie oben bereits erwähnt, soll die Maschinensteuerung CTL durch einen optimierten Akti onsaufführungsbaum BTO derart konfiguriert werden, dass die Maschine M in optimierter Weise gesteuert wird. Der optimier te Aktionsausführungsbaum BTO wird dabei durch das Konfigura tionssystem KS mittels eines genetischen OptimierungsVerfah rens ermittelt.

Als Ausgangspunkt für die Ermittlung des optimierten Aktions ausführungsbaums BTO werden durch das KonfigurationsSystem KS vorgegebene Aktionsmuster AP sowie ein initialer Aktionsaus- führungsbaum BTI vorzugsweise in Form eines Behavior-Trees eingelesen .

Die Aktionsmuster AP können dabei insbesondere Abfolgen von Maschinenaktionen und/oder Bedingungen zu deren Ausführung spezifizieren . Die Aktionsmuster AP werden bevorzugt durch Teilgraphen oder Teilbäume von Aktionsausführungsbäumen oder Behavior-Trees dargestellt. Vorteilhafterweise können als Ak tionsmuster AP idiomatische, gut interpretierbare, zuverläs sige, validierte und/oder zulässige Aktionsmuster vorgegeben werden, die sich zur Lösung von Steuerungs-Teilaufgaben be währt haben. Im vorliegenden Ausführungsbeispiel werden die Aktionsmuster AP aus einer Datenbank DB oder aus einer ander weitig verfügbaren Aktionsmusterbibliothek eingelesen.

Der initiale Aktionsausführungsbaum BTI wird vorzugsweise von einem Experten USR nach technischen Vorgaben, Anforderungen oder anderen technischen Nebenbedingungen für die Steuerung der Maschine M erstellt und in das KonfigurationsSystem KS eingespeist . Der initiale Aktionsausführungsbaum BTI spezifi ziert eine Ausführung zulässiger und/oder erforderlicher Ma schinenaktionen und bildet damit eine Referenz für die Steue rung der Maschine M bzw. für eine Zielkonfiguration der Ma schinensteuerung CTL. Auf diese Weise kodiert der initiale Aktionsausführungsbaum BTI gewissermaßen Expertenwissen über die Steuerung der Maschine M.

Weiterhin wird vom Experten USR eine SelektionsInformation SI in das KonfigurationsSystem KS eingespeist.

Zur Ermittlung eines optimierten Aktionsausführungsbaums BTO wird im vorliegenden Ausführungsbeispiel unter anderem ein genetisches Optimierungsverfahren verwendet. Dabei werden in einem Raum von möglichen Aktionsausführungsbäumen vorteilhaf te Aktionsausführungsbäume gesucht und weiter optimiert. Zu diesem Zweck generiert ein Generator GEN des Konfigurations- systems KS - zumindest teilweise zufallsbasiert - eine Viel zahl von Aktionsausführungsbäumen BT, die jeweils eine mögli che Ausführung von Maschinenaktionen durch die Maschine M spezifizieren.

In einer jeweiligen Iteration des genetischen Optimierungs- verfahrens wird für die generierten Aktionsausführungsbäume BT jeweils eine sogenannte Fitness der hierdurch spezifizier ten Maschinenaktionen bewertet. Aktionsausführungsbäume BT mit höherer Fitness werden mit höherer Wahrscheinlichkeit zur Generierung weiterer Aktionsausführungsbäume BT in einer nachfolgenden Iteration des genetischen OptimierungsVerfah rens verwendet. Aktionsausführungsbäume BT mit geringerer Fitness werden entsprechend mit höherer Wahrscheinlichkeit aussortiert und/oder durch neu generierte Aktionsausführungs- bäume ersetzt. Auf diese Weise werden durch den Generator GEN zunehmend Aktionsausführungsbäume BT mit höherer Fitness ge neriert . Im vorliegenden Ausführungsbeispiel wird zur Bestim mung einer jeweiligen Fitness eine Performanz für ein Steuern der Maschine M anhand des zu bewertenden Aktionsausführungs- baums BT, eine Baumgröße dieses Aktionsausführungsbaums BT und/oder eine gewichtete Kombination der Performanz und der Baumgröße ermittelt. Auf diese Weise wird die Generierung der Aktionsausführungsbäume in Richtung größerer Performanz und geringerer Baumgröße getrieben. Zur Durchführung einer sol chen genetischen Optimierung ist eine Vielzahl von Standard- verfahren verfügbar. Alternativ oder zusätzlich können auch andere Verfahren des maschinellen Lernens zur Optimierung verwendet werden.

Zur Generierung vorteilhafter und/oder zulässiger Aktionsaus- führungsbäume BT werden der initiale Aktionsausführungsbaum BTI sowie die Aktionsmuster AP in den Generator GEN einge speist. Die Aktionsausführungsbäume BT werden dann durch den Generator GEN ausgehend vom initialen Aktionsausführungsbaum BTI und unter zumindest teilweiser Verwendung der Aktionsmus ter AP generiert.

Die generierten Aktionsausführungsbäume BT werden vom Genera tor GEN zu einem Interpreter IP des KonfigurationsSystems KS übermittelt . In den Interpreter IP werden auch der initiale Aktionsausführungsbaum BTI sowie die SelektionsInformation SI eingespeist .

Der Interpreter IP dient zum Ausführen von Aktionsausfüh rungsbäumen, wobei jeweils eine Abfolge von durch den betref fenden Aktionsausführungsbaum spezifizierten Maschinenaktio nen ermittelt wird. Mittels der SelektionsInformation SI wer den dabei die enigen Maschinenaktionen selektiert, die gemäß den technischen Vorgaben zwingend auszuführen sind. Auf diese Weise wird für den initialen Aktionsausführungsbaum BTI durch den Interpreter IP eine Referenzabfolge RSQ von zwingend aus zuführenden Maschinenaktionen ermittelt. Weiterhin wird durch den Interpreter IP für jeden generierten Aktionsausführungs- baum BT eine hierdurch spezifizierte Abfolge SQ von Maschi nenaktionen ermittelt. Die Referenzabfolge RSQ, die Abfolgen SQ sowie die zugehörigen Aktionsausführungsbäume BT werden zu einem Filter F des KonfigurationsSystems KS übermittelt.

Das Filter F dient insbesondere zum Filtern der generierten Aktionsausführungsbäume BT. Zu diesem Zweck wird die für ei nen jeweiligen Aktionsausführungsbaum BT ermittelte Abfolge SQ mit der Referenzabfolge RSQ verglichen. Falls die Abfolge SQ nicht mit der Referenzabfolge RSQ übereinstimmt, werden diese Abfolge SQ sowie der betreffende Aktionsausführungsbaum BT verworfen und durch das Filter F nicht weitergeleitet. So fern dagegen die Abfolge SQ mit der Referenzabfolge RSQ über einstimmt, werden diese Abfolge SQ sowie der betreffende Ak tionsausführungsbaum BT durch das Filter F weitergeleitet.

Auf diese Weise kann sichergestellt werden, dass die Optimie rung auf Aktionsausführungsbäume BT beschränkt bleibt, die vorgegebene Entwicklungsziele erfüllen.

Die vom Filter F weitergeleiteten Aktionsausführungsbäume BT sowie die Aktionsmuster AP werden in ein Aktionsmustersuchmo- dul APS des KonfigurationsSystems KS eingespeist. Das Akti onsmustersuchmodul APS sucht die Aktionsmuster AP in jedem der eingespeisten Aktionsausführungsbäume BT. Falls in einem jeweiligen Aktionsausführungsbaum BT kein Aktionsmuster AP gefunden wird, wird dieser Aktionsausführungsbaum durch das Aktionsmustersuchmodul APS unverändert weitergeleitet. Falls dagegen in einem Aktionsausführungsbaum BT ein Aktionsmuster AP gefunden wird, wird dieser Aktionsausführungsbaum BT durch das Aktionsmustersuchmodul APS modifiziert.

Eine solche Modifikation eines Aktionsausführungsbaums BT wird durch Figur 4 beispielhaft veranschaulicht. Hierzu sei angenommen, dass ein die Knoten A2, A3 und A4 des Aktionsaus- führungsbaums BT umfassender Teilbaum einem vorgegeben Akti onsmuster API entspricht. Nachdem das Aktionsmuster API im Aktionsausführungsbaum BT gefunden wurde, wird dieser Teil baum bzw. das Aktionsmuster API im Aktionsausführungsbaum BT durch einen Verweis L auf das Aktionsmuster API ersetzt, wodurch ein modifizierter Aktionsausführungsbaum BT' gebildet wird. Insofern durch den Verweis L mehrere Knoten, hier A2,

A3 und A4, sowie Kanten des Aktionsausführungsbaums BT er setzt werden, wird eine Baumgröße des Aktionsausführungsbaums BT und damit dessen Komplexität verringert.

Aus Übersichtlichkeitsgründen werden modifizierte Aktionsaus- führungsbäume im Weiteren mit dem gleichen BezugsZeichen BT bezeichnet wie unveränderte Aktionsausführungsbäume. Wie Figur 3 weiter veranschaulicht, werden die unveränderten oder modifizierten Aktionsausführungsbäume BT vom Aktionsmus tersuchmodul APS zu einem Komplexitätsbewerter EVC des Konfi gurationssystems KS übermittelt.

Der Komplexitätsbewerter EVC dient dem Zweck, für einen je weiligen Aktionsausführungsbaum BT eine Baumgröße BG zu quan tifizieren. Zu diesem Zweck werden durch den Komplexitätsbe- werter EVC Knoten und/oder Kanten eines jeweiligen Aktions ausführungsbaums BT gezählt und/oder dessen Baumtiefe ermit telt und daraus eine Baumgröße BG abgeleitet. Vorzugsweise kann jeweils eine durch vorgegebene Gewichtsfaktoren gewich tete Summe der Knotenanzahl, Kantenanzahl und/oder Baumtiefe ermittelt und als Baumgröße BG ausgegeben werden. Die ermit telte Baumgröße BG wird vom Komplexitätsbewerter EVC zu einem Pareto-Optimierer PO des KonfigurationsSystems KS übermit telt.

Darüber hinaus werden die vom Filter F weitergeleiteten Akti onsausführungsbäume BT in einen Performanzbewerter EVP des KonfigurationsSystems KS sowie in den Pareto-Optimierer PO eingespeist. In den Performanzbewerter EVP werden weiterhin die vom Filter F weitergeleiteten Abfolgen SQ eingespeist.

Der Performanzbewerter EVP dient dem Zweck, für einen jewei ligen Aktionsausführungsbaum BT eine Performanz der mittels dieses Aktionsausführungsbaums BT gesteuerten Maschine M zu quantifizieren . Auf diese Weise wird gewissermaßen eine Steu- erperformanz einer durch diesen Aktionsausführungsbaum BT konfigurierten Maschinensteuerung CTL bewertet.

Die zu ermittelnde Performanz kann insbesondere eine Leis tung, einen Ertrag, eine Sollwerteinhaltung, eine Taktrate, eine Produktquälität, eine Geschwindigkeit, einen Zeitbedarf, eine Laufzeit, eine Präzision, eine Fehlerrate, einen Res sourcenverbrauch, einen Wirkungsgrad, eine Effizienz, einen Schadstoffausstoß, eine Stabilität, einen Verschleiß, eine Lebensdauer, ein physikalisches Verhalten, ein mechanisches Verhalten, ein chemisches Verhalten, ein elektrisches Verhal ten, eine einzuhaltende Nebenbedingung oder andere zu opti mierende Zielparameter der zu steuernden Maschine M betref fen.

Der Performanzbewerter EVP ermittelt für den jeweiligen Akti onsausführungsbaum BT und insbesondere für die zugehörige Ab folge SQ von Maschinenaktionen einen jeweiligen Performanz- wert PV, der die Performanz der die Abfolge SQ ausführenden Maschine M quantifiziert. Zu diesem Zweck verfügt der Perfor manzbewerter EVP über ein Simulationsmodell SIM der Maschine M . Mittels des Simulationsmodells SIM wird ein durch den je weiligen Aktionsausführungsbaum BT bzw. die jeweilige Abfolge SQ von Maschinenaktionen induziertes Verhalten der Maschine M für eine Vielzahl von Zeitschriften simuliert. Dabei wird ei ne kumulierte Belohnung oder ein kumulierter Ertrag des simu lierten Verhaltens gemessen. Vorzugsweise wird als Simulati onsmodell ein sogenanntes Surrogat-Modell, zum Beispiel ein datengetriebenes Modell der Maschine M verwendet, das in der Regel weniger Rechenressourcen als eine detaillierte physika lische Simulation erfordert. Eine auf diese Weise ermittelte kumulierte Belohnung kann als resultierender Performanzwert PV ausgegeben werden.

Der für den jeweiligen Aktionsausführungsbaum BT ermittelte Performanzwert PV wird vom Performanzbewerter EVP zum Pareto- Optimierer PO übermittelt.

Der Pareto-Optimierer PO dient zur Durchführung einer Pareto- Optimierung und insbesondere zur Ermittlung einer Pareto- Front PF für die durch den Komplexitätsbewerter EVC und den Performanzbewerter EVP bewerteten Aktionsausführungsbäume BT.

Eine Pareto-Optimierung ist eine multikriterielle Optimie rung, bei der mehrere unterschiedliche Zielkriterien, soge nannte Pareto-Zielkriterien, eigenständig berücksichtigt wer den. Als Resultat der Pareto-Optimierung wird eine sogenannte Pareto-Front PF ermittelt. Eine solche Pareto-Front wird häu fig auch als Pareto-Menge bezeichnet. Eine Pareto-Front, hier PF, sind diejenigen Lösungen eines multikriteriellen Optimie rungsproblems, bei denen ein Zielkriterium nicht verbessert werden kann, ohne ein anderes Zielkriterium zu verschlech tern. Eine Pareto-Front bildet also gewissermaßen eine Menge optimaler Kompromisse. Insbesondere lassen sich nicht in der Pareto-Front enthaltene Lösungen hinsichtlich mindestens ei nes Zielkriteriums noch verbessern. Infolgedessen fällt durch eine Einschränkung auf die Pareto-Front eine Vielzahl sicher nicht optimaler Lösungen weg. Insofern eine Pareto-Front in der Regel nur einen sehr kleinen Teil eines möglichen Lö sungsraums umfasst, reduziert sich durch Einschränkung auf eine Pareto-Front ein nachfolgender Selektions- oder weiterer Optimierungsaufwand beträchtlich.

Erfindungsgemäß wird durch den Pareto-Optimierer PO eine Pa reto-Front PF für die Menge der Aktionsausführungsbäume BT ermittelt, wobei eine Erhöhung der Performanz sowie eine Ver ringerung der Baumgröße als Pareto-Zielkriterien verwendet werden. Als Pareto-Front PF sei dabei auch eine Menge von Ak tionsausführungsbäumen verstanden, deren Abstand zu einem ma thematisch exakten Pareto-Optimum, zum Beispiel einen gegebe nen Schwellwert unterschreitet. Die Optimierung erfolgt in Richtung größerer Performanz und geringerer Baumgröße. Für derartige Pareto-Optimierungen steht eine Vielzahl von Stan- dardroutinen zur Verfügung.

Im vorliegenden Ausführungsbeispiel wird durch den Pareto- Optimierer PO abhängig von den übermittelten Baumgrößen BG und Performanzwerten PV der generierten Aktionsausführungs- bäume BT eine Pareto-Front PF innerhalb der generierten Akti onsausführungsbäume BT ermittelt. Aus der resultierenden Pa reto-Front PF wird dann ein optimierter Aktionsausführungs- baum BTO selektiert oder interpoliert. Ggf. können bei der Selektion oder Interpolation des optimierten Aktionsausfüh- rungsbaums BTO noch vorgegebene Selektionskriterien, insbe- sondere eines oder mehrere weitere Optimierungskriterien, an gewandt werden.

Durch eine Einschränkung einer Selektion, Interpolation bzw. einer nachfolgenden Optimierung auf die Pareto-Front PF wird ein Raum von zu verarbeitenden Aktionsausführungsbäumen in der Regel erheblich eingeschränkt, wobei insbesondere nicht optimale Aktionsausführungsbäume wegfallen. Die Selektion oder Interpolation des optimierten Aktionsausführungsbaums BTO oder auch weitere Optimierungen werden so erheblich ver einfacht.

Optional können Aktionsausführungsbäume BT(PF) der Pareto- Front PF in das genetische Optimierungsverfahren eingespeist werden, um so das genetische Optimierungsverfahren mit vor teilhaften Aktionsausführungsbäumen anzureichern. Eine ent sprechende Rückführung von Aktionsausführungsbäumen BT(PF) der Pareto-Front PF vom Pareto-Optimierer PO zum Generator GEN ist in Figur 3 durch einen punktierten Pfeil angedeutet.

Der optimierte Aktionsausführungsbaum BTO wird bestimmungsge mäß zum Konfigurieren der Maschinensteuerung CRL ausgegeben und/oder direkt zur Maschinensteuerung CTL übermittelt, um diese zum optimierten Steuern der Maschine M zu konfigurie ren. Die resultierende Konfiguration der Maschinensteuerung CTL führt in der Regel zu einem Steuerverhalten, das gleich zeitig sowohl eine hohe Performanz als auch eine geringe Kom plexität aufweist. Die letztgenannte Eigenschaft führt zu Konfigurationen, die meist erheblich besser durch Experten interpretierbar und damit leichter validierbar und/oder wei terentwickelbar sind.

Claims

Patentansprüche

1. Computerimplementiertes Verfahren zum Konfigurieren einer Maschinensteuerung (CTL) durch einen eine Ausführung von Ak tionen durch eine Maschine (M) spezifizierenden Aktionsaus- führungsbaum (BT) wobei a) vorgegebene Aktionsmuster (AP) eingelesen werden, b) eine Vielzahl von Aktionsausführungsbäumen (BT) für die Maschine (M) generiert wird, c) für einen jeweils generierten Aktionsausführungsbaum (BT)

- eine Performanz (PV) für ein Steuern der Maschine (M) an hand des jeweiligen Aktionsausführungsbaums (BT) ermittelt wird und

- die vorgegebenen Aktionsmuster (AP) im jeweiligen Aktions ausführungsbaum (BT) gesucht werden, ein im jeweiligen Akti onsausführungsbaum (BT) gefundenes Aktionsmuster (AP) zumin dest teilweise durch einen Verweis (L) auf das vorgegebene Aktionsmuster (AP) ersetzt wird und eine Baumgröße (BG) des so modifizierten Aktionsausführungsbaum (BTM) ermittelt wird, und d) anhand der generierten Aktionsausführungsbäume (BT) mit tels eines numerischen OptimierungsVerfahrens ein hinsicht lich größerer Performanz und geringerer Baumgröße optimierter Aktionsausführungsbaum (BTO) ermittelt und zum Konfigurieren der Maschinensteuerung (CTL) ausgegeben wird.

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Vielzahl von Aktionsausführungsbäumen (BT) zumindest teilweise anhand der Aktionsmuster (AP) generiert wird.

3. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass ein vorgegebener initialer Aktionsausführungsbaum (BTI) eingelesen wird, und dass die Vielzahl von Aktionsausführungsbäumen (BT) zumindest teilweise ausgehend vom initialen Aktionsausführungsbaum (BTI) generiert wird.

4. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass ein vorgegebener initialer Aktionsausführungsbaum (BTI) eingelesen wird, dass der initiale Aktionsausführungsbaum (BTI) durch einen Interpreter (IP) ausgeführt wird, wobei eine Referenzabfolge (RSQ) von durch den initialen Aktionsausführungsbaum (BTI) spezifizierten Maschinenaktionen ermittelt wird, dass die generierten Aktionsausführungsbäume (BT) jeweils durch den Interpreter (IP) ausgeführt werden, wobei eine je weilige Abfolge (SQ) von durch den jeweiligen generierten Ak tionsausführungsbaum (BT) spezifizierten Maschinenaktionen ermittelt wird, und dass ein generierter Aktionsausführungsbaum, dessen jeweilige Abfolge (SQ) nicht mit der Referenzabfolge (RSQ) überein stimmt, verworfen wird.

5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass eine vorgegebene SelektionsInformation (SI) eingelesen wird, und dass anhand der SelektionsInformation (SI) diejenigen Maschi nenaktionen selektiert werden, deren jeweilige Abfolge (RSQ, SQ) zu ermitteln ist.

6. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das numerische Optimierungsverfahren ein genetisches Op timierungsverfahren ist, und dass die Vielzahl von Aktionsausführungsbäumen (BT) durch das genetische Optimierungsverfahren generiert wird.

7. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass für die Vielzahl von Aktionsausführungsbäumen (BT) eine Pareto-Front (PF) ermittelt wird, wobei eine Erhöhung der Performanz sowie eine Verringerung der Baumgröße als Pareto- Zielkriterien verwendet werden, und dass der optimierte Aktionsausführungsbaum (BTO) anhand von Aktionsausführungsbäumen der Pareto-Front (PF) abgeleitet wird.

8. Verfahren nach Anspruch 6 und 7 dadurch gekennzeichnet, dass Aktionsausführungsbäume der Pareto-Front (PF) in das ge netische Optimierungs erfahren eingespeist werden und/oder dass nicht in der Pareto-Front (PF) enthaltene Aktionsausfüh rungsbäume verworfen werden.

9. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass zum Ermitteln der Performanz (PV) eines jeweiligen Akti onsausführungsbaums (BT) ein Simulationsmodell (SIM) der Ma schine (M), ein datengetriebenes Modell der Maschine (M), die Maschine (M) selbst und/oder eine dazu ähnliche Maschine an hand des jeweiligen Aktionsausführungsbaums (BT) gesteuert wird und eine daraus resultierende Performanz (PV) der Ma schine (M) ermittelt wird.

10. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass zum Ermitteln der Baumgröße (BG) eine Kantenanzahl, eine Knotenanzahl und/oder eine Baumtiefe des modifizierten Akti onsausführungsbaums (BTM) oder eine gewichtete Kombination der Kantenanzahl, der Knotenanzahl und/oder der Baumtiefe er mittelt wird.

11. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass ein jeweiliger Aktionsausführungsbaum (BT) ein Behavior- Tree ist.

12. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Maschine (M) ein Roboter, ein Motor, eine Werkzeug maschine, eine Turbine, eine Fertigungsanlage, ein Kraftfahr zeug, ein 3D-Drucker, ein mechanisches System, ein elektri- sches System oder ein anderes Gerät oder eine andere Anlage ist.

13. KonfigurationsSystem (KS) zum Konfigurieren einer Maschi- nensteuerung (CTL) für eine Maschine (M), eingerichtet zum

Ausführen eines Verfahrens nach einem der vorhergehenden An sprüche .

14. Computerprogrammprodukt eingerichtet zum Ausführen eines Verfahrens nach einem der Ansprüche 1 bis 12.

15. Computerlesbares Speichermedium mit einem Computerpro grammprodukt nach Anspruch 14.