WO2019121338A1

WO2019121338A1 - Verfahren zum betreiben eines roboters in einem multiagentensystem, roboter und multiagentensystem

Info

Publication number: WO2019121338A1
Application number: PCT/EP2018/084807
Authority: WO
Inventors: Mathias Buerger; Philipp Christian Schillinger
Original assignee: Robert Bosch Gmbh
Priority date: 2017-12-22
Filing date: 2018-12-13
Publication date: 2019-06-27
Also published as: JP6938791B2; CN111465475B; CN111465475A; DE102017223717B4; DE102017223717A1; KR102686219B1; JP2021506607A; US11179843B2; US20200276699A1; KR20200099572A

Abstract

Die Erfindung betrifft ein Verfahren zum Betreiben eines Multiagentensystems mit mehreren Robotern (1), wobei jeder der Roboter (1) folgendes Verfahren zyklisch bis zum Erreichen eines Zielsystemzustands ausführt: - ausgehend von einem momentanen Systemzustand (q1-q10), Ermitteln (S11) von möglichen Optionen, bei denen ein Fortschritt entlang eines Pfades von Systemzuständen in einem vorgegebenen deterministischen endlichen Automaten (DEA) erreicht wird, wobei die Optionen Aktionen definieren, durch die ein Übergang von einem aktuellen zu einem nachfolgenden Systemzustand (q1-q10) erreicht werden kann; - für jede der möglichen Optionen, Ermitteln (S12) eines Kostenwerts zur Durchführung einer durch die Option angegebenen Aktion; - Durchführen (S14, S15) einer Auktion, wobei die für jede Option ermittelten Kostenwerte von jedem der übrigen Roboter (1) berücksichtigt wird; und - Ausführen (S16) einer Aktion, die einer der Optionen entspricht, abhängig von allen zu der betreffenden Option ermittelten oder empfangenen Kostenwerten.

Description

Beschreibung

Titel

Verfahren zum Betreiben eines Roboters in einem Multiagentensvstem, Roboter und Multiagentensvstem

Technisches Gebiet

Die Erfindung betrifft Multiagentensysteme, und insbesondere Verfahren zum Steuern von Robotern eines Multiagentensystems durch Verteilung von Aufgaben mithilfe eines kooperativen Auktionsverfahrens.

Technischer Hintergrund

Das Koordinieren eines Teams von Robotern zur gemeinsamen Bewältigung einer Aufgabe ist insbesondere bei Unsicherheiten der Umgebungsgegebenenheiten sowie bei zeitlichen Abhängigkeiten in der Aufgabenspezifikation schwierig. Das Zerlegen der Aufgabenspezifikation in Teilaufgaben erfordert geeignete Mechanis- men, die Aufgabenspezifikation zu zerlegen, wobei insbesondere die Handlungs- anweisungen für die einzelnen Roboter aufgrund der Unsicherheiten der realen Umgebung nicht zufriedenstellend zugeordnet werden können.

Um zeitliche Abhängigkeiten zwischen einzelnen Handlungen von Robotern abzu- bilden, ist eine Beschreibungssprache, die sogenannte Linear Temporal Logic (LTL), bekannt, die eine Aufgabenspezifikation in Form einer LTL-Spezifikation ab- bildet. Aus der LTL-Spezifikation können Aktionspläne, d.h. eine Menge von Hand- lungsanweisungen für die einzelnen Roboter in an sich bekannterWeise abgeleitet werden. LTL für Roboteranwendungen ermöglichen es, zeitliche Randbedingungen in pro- babilistische Modelle zu integrieren, insbesondere mit Markov-Entscheidungspro- zessen (MDP: Markov Decision Processes). Markov-Entscheidungsprozesse er- möglichen es, Unsicherheiten einschließlich unbekannter Zeitdauern der Ausfüh- rung von Aktionen und stochastischen Ereignissen in der Umgebung abzubilden.

Um Handlungsanweisungen unter Unsicherheit für LTL-Aufgabenspezifikationen zu planen, sieht Lacerda, D. Parker, and N. Hawes,„Optimal and dynamic planning for Markov decision processes with co-safe LTL specifications“, Int. Conf. on Intel- ligent Robots and Systems, pages 151 1-1516. IEEE, 2014 eine Planung für einen einzelnen Roboter vor, der eine Automatenrepräsentation der Aufgabenspezifika- tion mit einem MDP kombiniert. Auf gleiche Weise sieht. C. D. Ding, S. L. Smith, C. Belta, and D. Rus. LTL control in uncertain environments with probabilistic sa- tisfaction guarantees, IFAC, 44(1 ):3515-3520, 201 1 vor, Handlungsanweisungen für einzelne Roboter zu planen, um einen Nutzen einer LTL- Aufgabenbeschreibung zu maximieren.

Um mehrere Roboter unabhängig von einem spezifischen Modell zu koordinieren, offenbart M. G. Lagoudakis et al.,„Auction-Based Multi-Robot Routing. In Robo- tics: Science and Systems“, pages 343-350, Rome, Italy, 2005 mehre Auktions- Strategien mit dem Fokus auf Effizienz. Koenig, C. et al.,“The power of sequential single-item auctions for agent coordination”, National Conference on Artificial In- telligence, volume 21 , page 1625. Menlo Park, CA; Cambridge, MA, London; AAAI Press; MIT Press; 1999, 2006 offenbart eine sequenzielle Auktion, um den Pla- nungsaufwand zu reduzieren, ohne das Optimierungsergebnis beliebig zu ver- schlechtern. M. Guo and D. V. Dimarogonas,“Multi-agent plan reconfiguration un- der local LTL specifications”, International Journal of Robotics Research, 34(2):218-235, 2015 offenbart, Robotern eines Mehrrobotersystems unabhängig voneinander lokale Teilaufgaben zuzuordnen und kommuniziert aktiv aufkom- mende Konflikte.

Effiziente Planungsalgorithmen für die Koordination von Robotern eines Multi- agentensystems in einer nicht-deterministischen Umgebung zur Lösung von Auf- gaben mit zeitlich abhängigen Spezifikationen sind derzeit nicht bekannt. Offenbarung der Erfindung

Erfindungsgemäß sind ein Verfahren zum Betreiben eines Roboters in einem Mul- tiagentensystem gemäß Anspruch 1 sowie ein Roboter und ein Multiagentensys- tem gemäß den nebengeordneten Ansprüchen vorgesehen.

Weitere Ausgestaltungen sind in den abhängigen Ansprüchen angegeben.

Gemäß einem ersten Aspekt ist ein Verfahren zum Betreiben eines Multiagenten- systems mit mehreren Robotern vorgesehen, wobei jeder der Roboter folgendes Verfahren zyklisch bis zum Erreichen eines Zielsystemzustands ausführt:

ausgehend von einem momentanen Systemzustand, Ermitteln von möglichen Optionen, bei denen ein Fortschritt entlang eines Pfades von Systemzustän- den in einem vorgegebenen deterministischen endlichen Automaten erreicht wird, wobei die Optionen Aktionen definieren, durch die ein Übergang von ei- nem aktuellen zu einem nachfolgenden Systemzustand erreicht werden kann; für jede der möglichen Optionen, Ermitteln eines Kostenwerts zur Durchfüh- rung einer durch die Option angegebenen Aktion;

Durchführen einer Auktion, wobei die für jede Option ermittelten Kostenwerte von jedem der übrigen Roboter berücksichtigt wird;

Ausführen einer Aktion, die einer der Optionen entspricht, abhängig von allen zu der betreffenden Option ermittelten oder empfangenen Kostenwerten.

Eine Idee des obigen Verfahrens zum Betreiben eines Multiagentensystems mit mehreren Robotern (Agenten) besteht darin, einen deterministischen endlichen Automaten bereitzustellen, der die von einem Multiagentensystem zu lösende Auf- gabenspezifikation definiert. Der deterministische endliche Automat weist mehrere Systemzustände auf, die einen oder mehrere Zustandspfade definieren, die zum Erreichen des Aufgabenziels durchlaufen werden müssen. In diesem deterministi- schen endlichen Automaten werden die Zustandsübergänge verschiedenen Ro- botern in einem Auktionsverfahren zugeordnet, wobei nur diejenigen Zustands- Übergänge (relevante Zustandsübergänge) als Optionen berücksichtigt werden, mit denen eine Änderung eines Fortschrittsniveaus in Richtung des Aufgabenziels erreicht wird. Diese Zustandsübergänge werden nachfolgend als Optionen be- zeichnet. Dazu werden vorab den Systemzuständen des deterministischen endli chen Automaten entsprechende Fortschrittsniveaus zugeordnet, die sich entlang der Pfade zu dem Zielzustand stetig erhöhen.

In dem Prozess des Zuordnens der Zustandsübergänge, die durch eine Erhöhung eines Fortschrittsniveaus gekennzeichnet sind, zu einzelnen Robotern können Teilaufgaben, die zu Zustandsänderungen führen, als Optionen den einzelnen Ro- botern zugeordnet werden. Ein solches Auktionsverfahren ermöglicht es, mithilfe einer geeigneten Kostenfunktion eine Teilaufgabe denjenigen Robotern zuzuord- nen, die die betreffende Teilaufgabe mit geringsten Kosten durchführen kann. Eine Kostenfunktion kann insbesondere den Zeitaufwand für die Durchführung der be- treffenden Teilaufgabe sowie die Wahrscheinlichkeit, dass mit der Durchführung der Teilaufgabe die für den Systemzustand definierende Bedingung erfüllt wird, berücksichtigen.

Wird durch die Teilaufgabe eine Systemzustandsbedingung für einen Systemzu- stand mit einem erhöhten Fortschrittsniveau erfüllt, so werden alle laufenden T eil aufgaben der Roboter unterbrochen und eine erneute Auktion durchgeführt, bei der nun neue Optionen an die Roboter verteilt werden. Die neuen Optionen ent- sprechen dabei den von dem nun erreichten Systemzustand ausgehenden rele- vanten Zustandsübergängen. Dieses Verfahren wird so lange durchgeführt, bis der Zielzustand erreicht ist. Auf diese Weise kann eine Verteilung von Teilaufgaben in einem Multiagentensystem in effizienter Weise durchgeführt werden, wobei insbe- sondere zeitliche Abhängigkeiten in besonders effizienter Weise berücksichtigt werden können.

Durch Vorgabe des deterministischen endlichen Automaten an alle Roboter kann jeder der Roboter in verteilter Weise seine Optionen hinsichtlich des übergeordne- ten Aufgabenziels ermitteln, wobei ein sehr viel weniger komplexes probabilisti- sches Planungsproblem gelöst werden muss. Durch das dezentralisierte Auktions- schema werden die verschiedenen Optionen zu verschiedenen Robotern zugeord- net, wobei es der vorgeschlagene Auktionsalgorithmus ermöglicht, dass die Robo- ter Teilaufgaben durchführen, die zeitlich von anderen Teilaufgaben abhängig sind. Bei jeder Erfüllung einer Teilaufgabe wird das Verfahren erneut durchgeführt, so dass das Wissen über Systemzustände in aktueller Weise berücksichtigt wer- den kann. Das obige Verfahren ermöglicht weiterhin eine geradlinige Implementierung, da insbesondere Robotern nicht vorab Teilaufgaben zugewiesen werden müssen. Insgesamt ermöglicht das dezentrale Verfahren der Koordination von mehreren Robotern in einer mit Unsicherheiten behafteten Systemumgebung die Umsetzung einer vorgegebenen Aufgabenspezifikation, zum Beispiel in Form einer Linear Temporal Logic (LTL), insbesondere einer Co-Safe LTL.

Das obige Verfahren ermöglicht in effizienter Weise, die Ergänzung eines Mehra- gentensystems zu koordinieren, insbesondere bei Unsicherheiten der Umge- bungsbedingungen. Dies gilt insbesondere für Spezifikationen, die zeitliche Logik enthalten, die von dem gesamten Team von Robotern bearbeitet werden sollen. Dazu werden den Robotern Teilaufgaben der Aufgabenspezifikation automatisch zugeordnet. Auch die Gegebenheiten der Systemumgebung können durch regel- mäßiges Aktualisieren der geplanten Handlungsanweisungen berücksichtigt wer- den, so dass sich die Roboter flexi bei an die Unsicherheiten anpassen können.

Weiterhin kann eine Aktion ausgeführt werden, die einer der Optionen entspricht, wenn für die entsprechende Option ein eigener Kostenwert ermittelt wird, der die geringsten Kosten aller für die entsprechende Option empfangenen Kostenwerte angibt.

Auch kann vorgesehen sein, dass keine Aktion ausgeführt wird, die einer der Op- tionen entspricht, wenn für keine der Optionen ein eigener Kostenwert ermittelt wird, der die geringsten Kosten aller für die entsprechende Option empfangenen Kostenwerte angibt.

Weiterhin kann eine Aktion für eine weitere Option entlang des Pfades in dem de- terministischen endlichen Automaten ausgeführt werden, wenn für keine der Opti- onen ein eigener Kostenwert ermittelt wird, der die geringsten Kosten aller für die entsprechende Option empfangenen Kostenwerte angibt, und wobei die weitere Option so gewählt ist, dass das Verfolgen einer der weiteren Option entsprechen- den Aktion nicht das Durchführen der Aktionen der in der Auktion verteilten Optio- nen verletzt. Es kann vorgesehen sein, dass der Kostenwert für eine Option abhängig von einer Zeitdauer für eine Ausführung der der Option zugeordneten Aktion und/oder von einer Wahrscheinlichkeit, dass bei der Ausführung der der Option zugeordneten Aktion eine Zustandsbedingung für ein Erreichen des Systemzustands, zu der die Option hinführt, ermittelt wird.

Insbesondere kann eine Wahrscheinlichkeit, dass bei der Ausführung einer einer Option zugeordneten Aktion eine Zustandsbedingung für ein Erreichen des Sys- temzustands erreicht wird, während der Ausführung der Aktion aktualisiert werden.

Gemäß einer Ausführungsform kann der Forstschritt entlang des Pfades von Sys- temzuständen des deterministischen endlichen Automaten erreicht werden, wenn keine Möglichkeit besteht, dass durch Erfüllen einer Bedingung von dem nachfol- genden Systemzustand einer der vorangehenden Systemzustände erreichbar ist, wobei insbesondere den Systemzuständen Fortschrittniveaus zugeordnet werden, die den Fortschritt entlang des Pfades von Systemzuständen des deterministi- schen endlichen Automaten angeben.

Es kann vorgesehen sein, dass, wenn eine Aktion beendet wird, der erreichte Sys- temzustand an die übrigen Roboter übermittelt wird.

Es kann vorgesehen sein, dass eine Ausführung einer Aktion unterbrochen oder beendet wird, wenn eine Information über das Erreichen eines nachfolgenden Sys- temzustands empfangen wird.

Weiterhin können die für jede Option ermittelten Kostenwerte durch explizite Kom- munikation von Kosten durch jeden der übrigen Roboter bereitgestellt werden.

Gemäß einem weiteren Aspekt ist ein Roboter zum Betreiben eines Multiagenten- systems vorgesehen, wobei der Roboter ausgebildet ist, um folgende Schritte zyk- lisch bis zum Erreichen eines Zielsystemzustands auszuführen:

Empfangen von die für jede Option ermittelten Kostenwerte von jedem der üb- rigen Roboter;

Durchführen einer Auktion unter Berücksichtigung der für jede Option ermittel- ten Kostenwerte; und

Gemäß einem weiteren Aspekt ist ein Multiagentensystem mit mehreren der obi- gen Robotern vorgesehen.

Kurzbeschreibung der Zeichnungen

Ausführungsformen werden nachfolgend anhand der beigefügten Zeichnungen näher erläutert. Es zeigen:

Figur 1 eine schematische Darstellung eines Roboters eines Mehra- gentensystems;

Figur 2 eine Darstellung eines deterministischen endlichen Automa- ten mit Fortschrittsniveauzuordnung;

Figur 3 ein Flussdiagramm zurVeranschaulichung der Zuordnung von

Fortschrittniveaus zu einzelnen Systemzuständen des deter- ministischen endlichen Automaten;

Figur 4 ein Flussdiagramm zur Veranschaulichung eines Verfahrens zum Betreiben des Multiagentensystems zur Lösung einer Aufgabenspezifikation an gegebenen Aufgaben;

Figur 5 ein Beispiel eines in einer Systemumgebung angeordneten

Multiagentensystems mit zwei beweglichen Robotern; und Figur 6 eine Darstellung eines deterministischen endlichen Automa- ten zur Lösung einer Aufgabe des Multiagentensystems der Figur 5.

Beschreibung von Ausführungsformen

Nachfolgend wird ein Verfahren beschrieben, mit dem in einem Multiagentensys- tem, bei dem Agenten als mit der Umgebung interagierende Roboter vorgesehen sind, beschrieben. Die Roboter 1 weisen eine Konfiguration auf, wie sie in Figur 1 schematisch dargestellt ist. Die Roboter 1 umfassen dazu jeweils eine Steuerein- heit 2, die zur Ausführung von Teilaufgaben ausgebildet ist. Zur Kommunikation mit anderen Robotern 1 weist jeder der Roboter 1 weiterhin eine Kommunikations- einrichtung 3 auf, um Informationen zu anderen Robotern 1 zu übertragen und von diesen zu empfangen.

Mithilfe einer Aktuatorik 4 kann der Roboter 1 mit der Systemumgebung interagie- ren. Die Aktuatorik 4 kann beispielsweise eine Fortbewegungsaktuatorik, Greifak- tuatorik und dergleichen umfassen, die entsprechend der dem Roboter 1 zugewie- senen Teilaufgabe in an sich bekannter Weise betrieben wird. Dadurch kann der Roboter 1 sich insbesondere fortbewegen, Objekte aufnehmen und absetzen und dergleichen.

Weiterhin können mithilfe einer Sensorik 5 Umgebungszustände erfasst werden. Die Sensorik 5 kann beispielsweise eine Kamera, andere zur Objektdetektion ver- wendbare Sensorik, wie beispielsweise Ultraschallsensorik, und dergleichen um- fassen. Mithilfe der Kamera können Positionen von Objekten, mit denen interagiert werden kann/soll, erkannt und identifiziert werden, und eine Fortbewegung inner- halb der Systemumgebung zu ermöglichen, wobei Objekte, die Hindernisse dar- stellen, umfahren werden.

Die Roboter 1 können des Weiteren mit einer Interaktionseinrichtung 6, wie z.B. einem Touch-Display oder eine Sprachein-/ausgabeeinrichtung, versehen sein, um mit Objekten oder Personen der Umgebung kommunikativ zu interagieren. Auf diese Weise können Personen Eingaben an den Robotern 1 vornehmen und In- formationen erhalten. Ausgangspunkt des nachfolgend beschriebenen Verfahrens ist eine Aufgabenspe- zifikation in Form einer Linear Temporal Logic (LTL), insbesondere einer co-safe Linear Temporal Logic (scLTL). Diese stellt eine Beschreibungssprache für eine Aufgabenspezifikation einer zu lösenden Aufgabe dar, die zeitliche Modalitäten aufweist. Jede scLTL-Aufgabenspezifikation kann in einen deterministischen end- lichen Automaten (DEA) übersetzt werden.

Ein solcher deterministischer endlicher Automat (DEA) ist beispielhaft in Figur 2 dargestellt. Diese zeigt Systemzustände (q 1 -q10), die einen Anfangszustand 1 1 (qO), mehrere Zwischenzustände 12 (q1 -q9) und einen oder mehrere Zielzustände 13 (q 10) enthalten. In dem Schaubild zur Darstellung des deterministischen endli chen Automatens zeigen Pfeile Zustandsübergänge von dem Anfangszustand 1 1 (q1 ) zu dem Zielzustand 13 (q10) entlang eines oder mehrerer Pfade. Ein System- zustand wird erreicht, wenn eine dem betreffenden Systemzustand zugeordnete Zustandsbedingung erfüllt ist. Die Systemzustände von dem Anfangszustand 1 1 zu dem Zielzustand 13 wird durch Fortschritte entlang des Pfades erreicht. Ein Fortschritt entlang eines der Pfade wird dann erreicht, wenn von einem Systemzu- stand zu einem darauffolgenden Systemzustand keine Möglichkeit eines Rückpfa- des besteht. Der Fortschritt entlang der Pfade wird durch Fortschrittniveaus, ins- besondere aufsteigende Fortschrittniveaus, angegeben.

Es werden zur Vorbereitung des Auktionsverfahren diese Fortschrittsniveaus be- ginnend mit dem Anfangszustand 1 1 zu dem Zielzustand 13 vergeben, entspre- chend einem in dem Flussidagramm der Figur 3 veranschaulichten Verfahren. Da- bei kann in Schritt S1 dem Anfangszustand 1 1 ein Fortschrittsniveau von 1 (oder einem anderen initialen Wert) zugewiesen werden.

In einem nachfolgenden Schritt S2 wird für alle von einem ausgewählten (anfäng- lich der Anfangszustand) aktuellen Systemzustand erreichbaren Systemzustände, von denen kein Pfad zu dem aktuellen oder einem sonstigen vorherigen System- zustand zurückführt, (d.h. relevanten Zustandsübergängen) ein um eins (oder sonstigen Betrag) erhöhtes Fortschrittsniveau zugewiesen. Die übrigen Systemzu- stände, die durch nicht-relevante Zustandsübergänge (d.h. Zustandsübergänge von Zuständen zu denen ein Pfad im DEA zurückführt) erreicht werden, werden dem betreffenden aktuellen Systemzustand identische Fortschrittniveaus zugeord- net. Dadurch wird jedem Systemzustand, von dem ein Pfad zu dem vorherigen Zustand zurückführt, das gleiche Fortschrittsniveau wie das Fortschrittsniveau des vorherigen Systemzustands zugeordnet.

In Schritt S3 wird abgefragt, ob alle Systemzustände betrachtet wurden. Ist dies der Fall (Alternative. Ja), wird das Verfahren beendet, andernfalls (Alternative: Nein) wird zu Schritt S2 zurückgesprungen und dabei ein nächster noch nicht be- handelter Systemzustand als aktuellen Systemzustand angenommen. Auf diese Weise kann jedem der Systemzustände aus dem deterministischen endlichen Au- tomaten ein Fortschrittsniveau (gekennzeichnet durch [x] mit x der Nummer des Fortschrittsniveaus) zugeordnet werden. Basierend auf dem so mit Fortschritten i- veaus versehenen deterministischen endlichen Automaten DEA kann nun ein Ver- fahren ausgeführt werden, durch das die entsprechende Aufgabenspezifikation durch mehrere Roboter bearbeitet wird.

Voraussetzung für das Verfahren zum Betreiben des Multiagentensystems ist, dass jeder Roboter 1 in der Lage ist, mit jedem der übrigen Roboter 1 zu kommu- nizieren, und dass jedem Roboter 1 der deterministische endliche Automat DEA bekannt gemacht ist. Das nachfolgende Verfahren beschreibt den Ablauf in einem der Roboter 1 , wobei das Verfahren grundsätzlich parallel in jedem der Roboter 1 ausgeführt wird.

Zunächst werden in Schritt S1 1 ausgehend von dem momentanen Zustand im de- terministischen endlichen Automaten, insbesondere beim ersten Durchlauf der An- fangszustand 1 1 , alle möglichen Optionen ermittelt, durch die eine Erhöhung des Fortschrittsniveaus erreicht werden kann. Die Optionen (dargestellt als Zustands- Übergänge zu einem Systemzustand mit einem höheren Fortschrittsniveau) stellen Möglichkeiten zum Erreichen eines nächsten möglichen Systemzustandes des DEA dar, der ein Zwischenzustand auf dem Weg zum Zielzustand 13 darstellt. Im vorliegenden Fall stellen ausgehend von dem Anfangszustand q1 die Systemzu- stände q2 und q3 die nächsten möglichen Systemzustände dar. Dies entspricht den Optionen q1 ->q2 und q1 ->q3. Nun werden in Schritt S12 von jedem der Roboter 1 für alle der in Schritt S1 ermit- telten möglichen Optionen Aktionskosten ermittelt. Die Aktionskosten können bei- spielsweise einer Zeitdauer zur Ausführung der jeweiligen Option für den betref- fenden Roboter 1 entsprechen oder diese umfassen. Weiterhin können die Akti onskosten bei einer Systemumgebung, die mit Unsicherheiten belegt ist, Wahr- scheinlichkeiten berücksichtigen. Die Wahrscheinlichkeiten geben jeweils eine Wahrscheinlichkeit an, mit der bei Ausführen der betreffenden Option durch den betreffenden Roboter 1 die Zustandsbedingung für den zu erreichenden System- zustand erfüllt. Es gilt: K= t ^* p (mit t der geschätzten Zeitdauer zum Ausführen der Option und p der Wahrscheinlichkeit der Erfüllung der Zustandsbedingung der be- treffenden Option).

In Schritt S13 werden die so ermittelten Kosten nun für jede der möglichen Optio- nen des betreffenden Roboters 1 an alle übrigen Roboter 1 kommuniziert. Somit liegen in allen Robotern 1 Informationen über die Kosten für jede der Optionen vor.

In Schritt S14 werden nun für jeden möglichen Systemzustand, der durch eine der selbst ermittelten oder von anderen Robotern 1 erhaltenen Optionen erreichbar ist, die minimalen Kosten ermittelt.

Anschließend wird in Schritt S15 in jedem der Roboter 1 überprüft, ob für einen durch eine Option erreichbaren Zwischenzustand die eigenen Kosten die minima- len Kosten darstellen. Ist dies der Fall (Alternative: Ja), so wird von dem betreffen- den Roboter 1 die betreffende Option (mit den geringsten Kosten) übernommen und in eine Handlungsanweisung zum Erreichen des durch die Option angegebe- nen Systemzustands umgesetzt. Anschließend wird das Verfahren mit Schritt S16 fortgesetzt.

In Schritt S16 wird entsprechend mit der Ausführung der Handlungsanweisung so- fort begonnen.

In Schritt S17 wird in jedem Roboter 1 überprüft, ob durch die eigene Aktion die Zustandsbedingung erfüllt wurde oder ob eine entsprechende Information über eine erfüllte Zustandsbedingung von einem weiteren der Roboter empfangen wurde. Ist dies nicht der Fall (Alternative. Nein, wird zu Schritt S17 zurückgesprun- gen, andernfalls (Alternative: Ja), wird zu Schritt S19 gesprungen. In Schritt S19 wird überprüft, ob der Zielsystemzustand erreicht worden ist. Ist dies der Fall (Alternative. Ja), wird das Verfahren beendet. Andernfalls wird zu Schritt S1 1 zurückgesprungen.

Wird in Schritt S15 für jede der Optionen festgestellt, dass keine der Optionen mit den minimalen Kosten ausgeführt werden kann (Alternative: Nein), wird das Ver- fahren mit Schritt S18 fortgesetzt.

Bei gleichen minimalen Kosten können u.U. mehrere Roboter 1 eine der Optionen gleichzeitig auswählen und die entsprechende Handlungsanweisung gleichzeitig durchführen. Durch den Zuordnungsprozess wird jedem Roboter 1 entweder eine Option, entsprechend der dieser eine Handlungsanweisung ausführen kann, zu- geordnet, oder er bleibt untätig.

In Schritt S18 können während der Auktion die Roboter 1 künftige Zustände an- nehmen, um Handlungsanweisungen zu planen, denen sie nachgehen können, um künftige Teile der Aufgabenstellung vorzu bereiten. Dies sollte erfolgen, indem sichergestellt wird, dass das Verfolgen dieser Handlungsanweisungen nicht das Durchführen der Teilaufgaben der momentanen Optionen verletzt. Somit werden zur Verteilung von Optionen an nicht zugeordnete Roboter 1 weitere Optionen be- rücksichtigt, die einen Systemzustand mit einem höheren Fortschrittsniveau als die aktuell ausgeführten Optionen haben und das Ergebnis der ausgeführten Option nicht als Vorbedingung enthalten.

Aufgrund der Unsicherheit der Umgebung ist es im Voraus nicht klar, wie sich die Ausführung der Teilaufgaben fortsetzen wird. Daher können die Roboter 1 ihre Handlungsanweisungen während der Ausführung auf zwei Arten aktualisieren:

1 . Wenn die Option eines Roboters 1 beendet wird, wird der aktuelle Zustand jedes weiteren Roboters 1 aktualisiert. Da dadurch der Zustand jedes Ro- boters 1 geändert wird, wird die zuvor ausgeführte Handlungsanweisung unterbrochen.

2. Wissen, das durch die Roboter 1 während der Ausführung gesammelt wird, wird berücksichtigt. Dadurch können die Ereigniswahrscheinlichkeiten, die angeben, dass ein bestimmtes Ereignis beobachtet werden kann, ange- passt werden. Diese aktualisierten Wahrscheinlichkeiten werden jedem der Roboter 1 kommuniziert und bei der Ermittlung der Kosten der einzelnen Optionen berücksichtigt.

In Figur 5 ist ein Beispiel für ein Multiagentensystem dargestellt, bei dem sich be- wegliche Roboter R1 , R2 in einem Bürogebäude befinden. Die Zielsetzung besteht darin, dass einer der Roboter 1 sich in einen Raum r hineinbewegt, was jedoch nur nach Erlaubnis von zwei Personen a, b möglich ist. Diese Erlaubnis kann beispiels- weise durch Eingeben eines Zugangscodes über einen Touch-Bildschirm einer In- teraktionseinrichtung 6 der einzelnen Roboter 1 durch eine Person gegeben wer- den. Für dieses Beispiel wird angenommen, dass die Personen an den Orten a2 und b1 gefunden werden können, was jedoch im Voraus nicht bekannt ist. Weiter- hin wird angenommen, dass die Zeitdauer zum Ausführen einer Navigationshand- lung proportional zu der zurückgelegten Wegstrecke ist. Die Zielsetzung, Zugang zu dem Raum r zu erhalten, während die Zugangsbeschränkungen berücksichtigt werden, kann durch folgende scLTL-Formel ausgedrückt werden. f =0 r L (-r 11 a_c) L (- r ll b_c)

wobei a_c, b_c angibt, dass die Zustimmung durch die betreffende Person a, b, ge- geben worden ist.

Der DEA, das durch f aufgebaut ist, ist in Figur 6 schematisch mit den Systemzu- ständen q1 -q5 dargestellt. Die scLTL-Mission wird an die Roboter 1 übertragen. Anfänglich wird der Roboter R1 die Option q1 -q2, die von dem Systemzustand q1 nach q2 führt, und der Roboter R2 die Option q2-q4, die von dem Systemzustand q2 nach q4 führt, abhängig von der angenommenen Fortschrittsniveauerhöhung zugeordnet. Folglich führt die von dem Roboter R1 ausgewählte Option den Ro- boter R1 nach bi und die von dem Roboter R2 ausgewählte Option den Roboter R2 nach a-i. Der Roboter R2 entscheidet, nach ai anstelle nach a₂ zu gehen, weil dieser Raum ai näher liegt, bei Annahme gleicher Wahrscheinlichkeiten (von je- weils 0,5), dass sich die betreffende Person in einem der beiden Räume a-i, a₂ befindet.

Die erste Neuplanung erfolgt, nachdem der Roboter R1 den Raum bi erreicht hat. Dort findet dieser die Person b vor, die eine Bestätigung b_c gibt und somit den Zwischenzustand q2 erreicht. Währenddessen ist der Roboter R2 bereits nahe an dem Raum a-i, so dass diesem die Option q2-q4 zugeordnet wird und die entspre- chende Aktion wird ausgeführt. Währenddessen wird dem Roboter R1 die Option q4-q5 zugeordnet, um die Mission zu beenden.

Wenn nun durch den Roboter R2 festgestellt wird, dass die Zugangserlaubnis a_c nicht in dem Raum ai erhalten werden kann, kann der Roboter R2 die Handlungs- anweisung der Option q2-q4 nicht wie erwartet beenden und aktualisiert die Ereig- niswahrscheinlichkeit, dass die Person sich im Raum ai befindet, auf 0, um anzu- geben, dass die Zugangsbestätigung a_c nicht in dem Raum ai erhalten werden kann. Dies führt zu einer Aktualisierung, durch die der Roboter R1 als derjenige Roboter 1 ausgewählt wird, der geringere Kosten für die Ausführung der Option q2-q4 hat, indem sich dieser nach a₂ bewegt, da dem Roboter R2 die Option q4- q5 zugeordnet ist. Da der Roboter R2 den Wegpunkt schneller erreicht, als der Roboter R1 die Option q2-q4 beenden kann, kann beobachtet werden, dass der Roboter R2 auf den Roboter R1 wartet. Nachdem der Roboter R1 q2-q4 beendet hat, behält der Roboter R2 die zugeordnete Option q4-q5 bei, die bereits fast be- endet ist, und beendet die Mission, indem der Raum r betreten wird.

Aufgrund des dezentralisierten Ansatzes der Auktionszuordnung kann das obige Verfahren auf Multiagentensysteme mit einer beliebigen Anzahl von Robotern 1 angewendet werden, wobei die Ausführungszeit der Mission durch Hinzufügen von weiteren Robotern 1 reduziert werden kann.

Claims

Ansprüche

1. Verfahren zum Betreiben eines Multiagentensystems mit mehreren Robotern (1 ), wobei jeder der Roboter (1 ) folgendes Verfahren zyklisch bis zum Erreichen eines Zielsystemzustands ausführt:

ausgehend von einem momentanen Systemzustand (q 1 -q 10), Ermitteln (S1 1 ) von möglichen Optionen, bei denen ein Fortschritt entlang eines Pfades von Systemzuständen in einem vorgegebenen deterministischen endlichen Automaten (DEA) erreicht wird, wobei die Optionen Aktionen definieren, durch die ein Übergang von einem aktuellen zu einem nach- folgenden Systemzustand (q1-q 10) erreicht werden kann; für jede der möglichen Optionen, Ermitteln (S12) eines Kostenwerts zur Durchführung einer durch die Option angegebenen Aktion;

Durchführen (S14, S15) einer Auktion, wobei die für jede Option ermittel- ten Kostenwerte von jedem der übrigen Roboter (1 ) berücksichtigt wird; und

Ausführen (S16) einer Aktion, die einer der Optionen entspricht, abhängig von allen zu der betreffenden Option ermittelten oder empfangenen Kos- tenwerten.

2. Verfahren nach Anspruch 1 , wobei eine Aktion ausgeführt wird, die einer der Optionen entspricht, wenn für die entsprechende Option ein eigener Kostenwert ermittelt wird, der die geringsten Kosten aller für die entsprechende Option emp- fangenen Kostenwerte angibt.

3. Verfahren nach Anspruch 1 oder 2, wobei keine Aktion ausgeführt wird, die ei- ner der Optionen entspricht, wenn für keine der Optionen ein eigener Kosten- wert ermittelt wird, der die geringsten Kosten aller für die entsprechende Option empfangenen Kostenwerte angibt.

4. Verfahren nach Anspruch 1 oder 2, wobei eine Aktion für eine weitere Option entlang des Pfades in dem deterministischen endlichen Automaten (DEA) aus- geführt wird, wenn für keine der Optionen ein eigener Kostenwert ermittelt wird, der die geringsten Kosten aller für die entsprechende Option empfangenen Kos- tenwerte angibt, und wobei die weitere Option so gewählt ist, dass das Verfol- gen einer der weiteren Option entsprechenden Aktion nicht das Durchführen der Aktionen der in der Auktion verteilten Optionen verletzt.

5. Verfahren nach einem der Ansprüche 1 bis 4, wobei der Kostenwert für eine Option abhängig von einer Zeitdauer für eine Ausführung der der Option zuge- ordneten Aktion und/oder von einer Wahrscheinlichkeit, dass bei der Ausfüh- rung der der Option zugeordneten Aktion eine Zustandsbedingung für ein Errei- chen des Systemzustands (q1 -q 10), zu der die Option hinführt, ermittelt wird.

6. Verfahren nach Anspruch 5, wobei eine Wahrscheinlichkeit, dass bei der Aus- führung einer einer Option zugeordneten Aktion eine Zustandsbedingung für ein Erreichen des Systemzustands (q 1 -q 10) erreicht wird, während der Ausführung der Aktion aktualisiert wird.

7. Verfahren nach einem der Ansprüche 1 bis 6, wobei der Forstschritt entlang des Pfades von Systemzuständen des deterministischen endlichen Automaten (DEA) erreicht wird, wenn keine Möglichkeit besteht, dass durch Erfüllen einer Bedingung von dem nachfolgenden Systemzustand (q1 -q 10) einer der voran- gehenden Systemzustände (q1 -q 10) erreichbar ist, wobei insbesondere den Systemzuständen Fortschrittniveaus zugeordnet werden, die den Fortschritt entlang des Pfades von Systemzuständen (q1-q10) des deterministischen end- lichen Automaten (DEA) angeben.

8. Verfahren nach einem der Ansprüche 1 bis 7, wobei, wenn eine Aktion beendet wird, wird der erreichte Systemzustand (q1-q10) an die übrigen Roboter (1 ) übermittelt wird.

9. Verfahren nach einem der Ansprüche 1 bis 8, wobei eine Ausführung einer Ak- tion unterbrochen oder beendet wird, wenn eine Information über das Erreichen eines nachfolgenden Systemzustands (q1 -q 10) empfangen wird.

10. Verfahren nach einem der Ansprüche 1 bis 9, wobei die für jede Option ermit- telten Kostenwerte durch explizite Kommunikation von Kosten durch jeden der übrigen Roboter (1 ) bereitgestellt werden.

1 1. Roboter (1 ) zum Betreiben eines Multiagentensystems, wobei der Roboter (1 ) ausgebildet ist, um folgende Schritte zyklisch bis zum Erreichen eines Zielsys- temzustands auszuführen:

ausgehend von einem momentanen Systemzustand (q 1 -q 10), Ermitteln von möglichen Optionen, bei denen ein Fortschritt entlang eines Pfades von Systemzuständen (q1 -q 10) in einem vorgegebenen deterministi- schen endlichen Automaten (DEA) erreicht wird, wobei die Optionen Ak- tionen definieren, durch die ein Übergang von einem aktuellen zu einem nachfolgenden Systemzustand (q 1 -q 10) erreicht werden kann;

für jede der möglichen Optionen, Ermitteln eines Kostenwerts zur Durch- führung einer durch die Option angegebenen Aktion;

Empfangen von die für jede Option ermittelten Kostenwerte von jedem der übrigen Roboter;

Durchführen einer Auktion unter Berücksichtigung der für jede Option er- mittelten Kostenwerte; und

Ausführen einer Aktion, die einer der Optionen entspricht, abhängig von allen zu der betreffenden Option ermittelten oder empfangenen Kosten- werten.

12. Multiagentensystem mit mehreren Robotern (1 ) nach Anspruch 11.

13. Computerprogramm mit Programmcodemitteln, das dazu eingerichtet ist, ein Verfahren nach einem der Ansprüche 1 bis 10 auszuführen, wenn das Compu- terprogramm auf einer Recheneinheit, insbesondere einem Roboter (1 ), ausge- führt wird.

14. Maschinenlesbares Speichermedium mit einem darauf gespeicherten Compu- terprogramm nach Anspruch 13.