DE112010000035B4 - Roboter und Regelungs- /Steuerungssystem - Google Patents

Roboter und Regelungs- /Steuerungssystem Download PDF

Info

Publication number
DE112010000035B4
DE112010000035B4 DE201011000035 DE112010000035T DE112010000035B4 DE 112010000035 B4 DE112010000035 B4 DE 112010000035B4 DE 201011000035 DE201011000035 DE 201011000035 DE 112010000035 T DE112010000035 T DE 112010000035T DE 112010000035 B4 DE112010000035 B4 DE 112010000035B4
Authority
DE
Germany
Prior art keywords
module
action
candidates
robot
mod2
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE201011000035
Other languages
English (en)
Other versions
DE112010000035T5 (de
Inventor
Masanori Takeda
Mitsuhide Kuroda
Shigeru Kanzaki
Takahide Yoshiike
Takumi Kamioka
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2009181070A external-priority patent/JP5306933B2/ja
Priority claimed from JP2009181071A external-priority patent/JP5306934B2/ja
Priority claimed from JP2010091801A external-priority patent/JP5450218B2/ja
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Publication of DE112010000035T5 publication Critical patent/DE112010000035T5/de
Application granted granted Critical
Publication of DE112010000035B4 publication Critical patent/DE112010000035B4/de
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B62LAND VEHICLES FOR TRAVELLING OTHERWISE THAN ON RAILS
    • B62DMOTOR VEHICLES; TRAILERS
    • B62D57/00Vehicles characterised by having other propulsion or other ground- engaging means than wheels or endless track, alone or in addition to wheels or endless track
    • B62D57/02Vehicles characterised by having other propulsion or other ground- engaging means than wheels or endless track, alone or in addition to wheels or endless track with ground-engaging propulsion means, e.g. walking members
    • B62D57/032Vehicles characterised by having other propulsion or other ground- engaging means than wheels or endless track, alone or in addition to wheels or endless track with ground-engaging propulsion means, e.g. walking members with alternately or sequentially lifted supporting base and legs; with alternately or sequentially lifted feet or skid
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1679Programme controls characterised by the tasks executed
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/40Robotics, robotics mapping to robotics vision
    • G05B2219/40496Hierarchical, learning, recognition level controls adaptation, servo level

Abstract

Regelungs-/Steuerungssystem umfassend eine Mehrzahl von entsprechend der Lage eines Frequenzbandes hierarchisch organisierten Modulen (mod1, mod2, mod3), wobei: jedes der Module (mod1, mod2, mod3) dazu eingerichtet ist, in Antwort auf einen aktuellen Zustand eines geregelten/gesteuerten Objekts (R), der eine Störung des geregelten/gesteuerten Objekts enthält, nach einer Mehrzahl von Handlungskandidaten (ai1, ai2, ai3) zu suchen, welche Kandidaten für eine zu einem Hauptziel und einem Teilziel passende Handlungsform des geregelten/gesteuerten Objekts (R) sind, und die Gesamteignung (f1, f2, f3) im Hinblick auf sowohl das Hauptziel als auch das Teilziel in einer derartigen Weise zu bewerten, dass der Beitrag einer Haupteignung zu einem Hauptziel, das hauptsächlich unter die Zuständigkeit des Moduls fällt, größer als der Beitrag einer Teileignung zu dem Teilziel eines sonstigen Moduls in Bezug zu jedem der Handlungskandidaten (ai1, ai2, ai3) ist; und das Regelungs-/Steuerungssystem (1) dazu eingerichtet ist, einen Betrieb des geregelten/gesteuerten Objekts (R) in einer Form zu regeln/steuern, welche ein durch ein hochrangiges Modul einer hohen Frequenz erhaltenes Bewertungsergebnis der Gesamteignung gegenüber einem durch ein niederrangiges Modul einer niedrigen Frequenz erhaltenes Bewertungsergebnis der Gesamteignung vorrangig berücksichtigt.

Description

  • Technisches Gebiet
  • Die vorliegende Erfindung betrifft ein Regelungs-/Steuerungssystem und einen Roboter, welcher eines der geregelten/gesteuerten Objekte des Regelungs-/Steuerungssystems ist.
  • Stand der Technik
  • Eine Technik zum Veranlassen eines Roboters anpassungsfähig auf eine schnelle Störung wie einen unerwarteten Kontakt mit einem Objekt zu handeln ist vorgeschlagen worden (Bezug zu JP 2004-167666 A ). Gemäß dieser Technik wird eine Anpassung in Bezug zu einem Prozentsatz einer Komponente eines Regelungs-/Steuerungsbefehlswertes eines integrierten Regelungs-/Steuerungssystems an einen Regelungs-/Steuerungsbefehlswert eines lokalen Hochgeschwindigkeitsregelungs-/steuerungssystems vorgenommen, dessen Betriebsdauer kürzer als die des integrierten Regelungs-/Steuerungssystems oder eine Verteilung zwischen ihnen ist. Der Prozentsatz des Regelungs-/Steuerungsbefehlswertes des lokalen Regelungs-/Steuerungssystems wird beispielsweise angepasst, um unmittelbar nach einem Eintreten einer schnellen Störung groß zu sein, um eine berücksichtigende Handlungsform des Roboters gegen die Störung zu erzielen.
  • Anschließend wird der Prozentsatz des Regelungs-/Steuerungsbefehlswertes des integrierten Regelungs-/Steuerungssystems angepasst, um allmählich mit zunehmender Zeitdauer nach dem Eintreten der Störung anzusteigen, um den Roboter dazu zu veranlassen, die Bewegungsform in dem störungsfreien Normalzustand wiederherzustellen. Dabei ist zu beachten, dass die Änderungskurve des Prozentsatzes der Komponente jedes Regelungs-/Steuerungsbefehlswertes im Laufe der Zeit verändert werden kann.
  • Die US 2008/0 249 662 A1 zeigt einen menschenähnlichen Roboter, der auf seinem Gehweg Kontakt mit mehreren Hindernissen verhindert, unter Benutzung einer Bewegungsregel, welche in Antwort auf die Breite des Zwischenraums zwischen dem Hindernis und der Grenze des verbleibenden begehbaren Bereichs verändert wird.
  • Die US 7,529,622 B2 zeigt einen menschenähnlichen Roboter, der den Kontakt mit einem Objekt vermeiden kann und dabei die Verhaltensänderung dieses Objekts berücksichtigt. Es wird bestimmt, ob es ein erstes räumliches Element gibt, das einer Kontaktbedingung genügt, dass nämlich eine Möglichkeit eines Kontakts mit einem räumlichen Bezugselement auf einer Diskriminanzebene vorhanden ist, die wenigstens Teil einer repräsentativen Trajektorie des Roboters ist. Wenn es ein erstes räumliches Element gibt, das die Kontaktbedingung erfüllt, wird ein zweites Aktionsplanelement mit Änderung der repräsentativen Trajektorie angenommen, und es wird bestimmt, ob es ein erstes räumliches Element gibt, das die Kontaktbedingung auf einer neuen Diskriminanzebene erfüllt, die mindestens ein Teil der geänderten repräsentativen Trajektorie enthält. Wenn es kein erstes Raumelement gibt, das die Kontaktbedingung auf der neuen Diskriminanzebene erfüllt, wird ein angenommenes neues zweites Aktionsplanelement gesetzt.
  • Die US 7,053,579 B2 zeigt eine Vorrichtung zur Betriebssteuerung eines Roboters, der mit einer Mehrzahl von Zustandsdetektoren zum Erkennen von abnormalen Zuständen ausgestattet ist, und Bewegungen zur Überwindung des abnormalen Zustands durchführen kann, wenn abnormale Zustände von mehreren solchen Detektoren gleichzeitig erkannt werden.
  • Die US 2005/0197739 A1 zeigt ein Robotersteuersystem, das die Situation zwischen einem ersten Bewegungsstandard, der nur den eigenen Status berücksichtigt, und einem zweiten Bewegungsstandard, der auch den Zustand eines Hindernisses berücksichtigt. Die Auswahl der Verhaltensweisen unterliegt Prioritäten.
  • Abriss der Erfindung
  • Die durch die Erfindung zu lösende Aufgabe
  • Die Handlungsform des Roboters dürfte jedoch, abhängig von der Art einer Störung, im Hinblick auf ein Ziel des Roboters nicht angemessen sein.
  • Es ist daher eine Aufgabe der vorliegenden Erfindung, ein Regelungs-/Steuerungssystem oder dergleichen bereitzustellen, das in der Lage ist, einem geregelten/gesteuerten Objekt zu ermöglichen, im Hinblick auf das Handlungsziel des geregelten/gesteuerten Objekts einer Störung einer beliebigen Art in einer angemessenen Form entgegenzuwirken.
  • Mittel zum Lösen der Aufgabe
  • Zum Lösen der vorhergehenden Aufgabe, stellt die vorliegende Erfindung ein Regelungs-/Steuerungssystem gemäß Anspruch 1 bereit.
  • Das Regelungs-/Steuerungssystem enthält eine Mehrzahl von entsprechend der Lage eines Frequenzbandes hierarchisch organisierten Modulen, wobei: jedes der Module dazu eingerichtet ist, in Antwort auf einen aktuellen Zustand eines geregelten/gesteuerten Objekts, der eine Störung des geregelten/gesteuerten Objekts enthält, nach einer Mehrzahl von Handlungskandidaten zu suchen, welche Kandidaten für eine zu einem Hauptziel und einem Teilziel passende Handlungsform des geregelten/gesteuerten Objekts sind, und die Gesamteignung im Hinblick auf sowohl ein Hauptziel als auch ein Teilziel in einer derartigen Weise zu bewerten, dass der Beitrag einer Haupteignung zu dem Hauptziel, das hauptsächlich unter die Zuständigkeit des Moduls fällt, größer als der Beitrag einer Teileignung zu dem Teilziel, das hauptsächlich unter die Zuständigkeit eines sonstigen Moduls fällt, in Bezug zu jedem der Handlungskandidaten ist; und das Regelungs-/Steuerungssystem dazu eingerichtet ist, einen Betrieb des geregelten/gesteuerten Objekts in einer Form zu regeln/steuern, welche ein durch ein hochrangiges Modul einer hohen Frequenz erhaltenes Bewertungsergebnis der Gesamteignung gegenüber einem durch ein niederrangiges Modul einer niedrigen Frequenz erhaltenes Bewertungsergebnis der Gesamteignung vorrangig berücksichtigt (Erste Erfindung).
  • Gemäß dem Regelungs-/Steuerungssystem der Erfindung, sucht jedes aus der Mehrzahl von Modulen nach Handlungskandidaten des geregelten/gesteuerten Objekts, wobei dem Hauptziel, das hauptsächlich unter die Zuständigkeit des Moduls fällt, unter Berücksichtigung der Teilziele, die hauptsächlich unter die Zuständigkeit anderer Module fällt, Priorität gewährt wird. Auf diese Weise ist es möglich, nach Handlungskandidaten des geregelten/gesteuerten Objekts mit lose zwischen verschiedenen Modulen geteilten Zielen zu suchen.
  • Darüber hinaus wird eine Gesamteignung in Bezug zu jedem der Handlungskandidaten im Hinblick auf sowohl das Hauptziel als auch das Teilziel in einer derartigen Weise bewertet, dass der Beitrag der Haupteignung im Hinblick auf das Hauptziel, das hauptsächlich unter die Zuständigkeit des Moduls fällt, größer als der Beitrag der Eignung im Hinblick auf das Teilziel, das hauptsächlich unter die Zuständigkeit eines sonstigen Moduls fällt, ist. Die Handlung des geregelten/gesteuerten Objekts wird dann in einer Form geregelt/gesteuert, welche ein von einem hochrangigen Modul einer hohen Frequenz erhaltenes Bewertungsergebnis der Gesamteignung gegenüber einem von einem niederrangigen Modul einer niedrigen Frequenz erhaltenen Bewertungsergebnis der Gesamteignung vorrangig berücksichtigt.
  • Im Falle einer Störung wird deshalb anfangs das hochrangige Ziel, das hauptsächlich unter die Zuständigkeit des hochrangigen Moduls mit schnellem Ansprechverhalten fällt, in der der Handlungsform des geregelten/gesteuerten Objekts berücksichtigt, um den Effekt der Störung schnell zu verringern. Darüber hinaus wird im Laufe der Zeit auch das niederrangige Ziel, das hauptsächlich unter die Zuständigkeit des niederrangigen Moduls mit langsamem Ansprechverhalten fällt, in der Handlungsform des geregelten/gesteuerten Objekts berücksichtigt, um die zu der Mehrzahl von Zielen passende Handlungsform des geregelten/gesteuerten Objekts wiederherzustellen. Das ermöglicht dem geregelten/gesteuerten Objekt sich in einer im Hinblick auf das Handlungsziel des geregelten/gesteuerten Objekts angemessenen Form auf eine Störung einer beliebigen Art zu verhalten.
  • In dem Regelungs-/Steuerungssystem der Erfindung kann ein intermediäres Modul mit Ausnahme eines Moduls eines höchsten Ranges der höchsten Frequenz und eines Moduls eines niedrigsten Ranges der niedrigsten Frequenz, dazu eingerichtet sein, die Gesamteignung in einer derartigen Weise zu bewerten, dass hochrangige Eignung im Hinblick auf ein hochrangiges Ziel einen größeren Beitrag hat als niederrangige Eignung im Hinblick auf ein niederrangiges Ziel in Bezug zu jedem der Handlungskandidaten, wobei das hochrangige Ziel, das hauptsächlich unter die Zuständigkeit des hochrangigen Moduls einer Frequenz fällt, die höher als das Modul ist, und das niederrangige Ziel, das hauptsächlich unter die Zuständigkeit des niederrangigen Moduls einer Frequenz fällt, die niedriger als das Modul ist, die Teilziele sind (Zweite bevorzugte Ausführung).
  • Gemäß dem Regelungs-/Steuerungssystem der zweiten bevorzugten Ausführung bewertet das intermediäre Modul die Gesamteignung für alle Ziele in Bezug zu jedem der selbst gesuchten Handlungskandidaten in einer derartigen Weise, dass der Beitrag in dem Rang der Haupteignung für das Hauptziel, das hauptsächlich unter die eigene Zuständigkeit fällt, der hochrangigen Eignung für das hochrangige Ziel und die niederrangige Eignung für das niederrangige Ziel zunimmt. Dadurch wird die Handlung des geregelten/gesteuerten Objekts in einer Form geregelt/gesteuert, welche das Ziel, das hauptsächlich unter die Zuständigkeit des intermediären Moduls fällt (intermediäres Ziel), gegenüber dem hochrangigen Ziel vorrangig berücksichtigt und das niederrangige Ziel wird gegenüber dem hochrangigen Ziel vorrangig berücksichtigt. Als Ergebnis davon ist es möglich, das geregelte/gesteuerte Objekt dazu zu veranlassen, im Hinblick auf das Handlungsziel des geregelten/gesteuerten Objekts einer Störung einer beliebigen Art in einer angemessenen Form entgegenzuwirken.
  • In dem Regelungs-/Steuerungssystem der zweiten bevorzugten Ausführung kann das hochrangige Modul und das intermediäre Modul jeweils dazu eingerichtet sein, die geschätzte niederrangige Eignung durch Abschätzen der niederrangigen Eignung in Bezug zu jedem der Handlungskandidaten zu bewerten und die Gesamteignung mit der geschätzten niederrangigen Eignung als die niederrangige Eignung zu bewerten (Dritte bevorzugte Ausführung).
  • Gemäß dem Regelungs-/Steuerungssystem der dritten bevorzugten Ausführung ist das Modul in der Lage, nach Handlungskandidaten in einer Form zu suchen, die nicht nur das Ziel, das hauptsächlich unter die Zuständigkeit eines Moduls fällt, das niedriger im Rang als das Modul ist, sondern auch das Ziel, das hauptsächlich unter die Zuständigkeit eines Moduls fällt, das noch niedriger im Rang als das niederrangige Modul ist, berücksichtigt. Mit anderen Worten, ist es möglich, nach den Handlungskandidaten des geregelten/gesteuerten Objekts in einer Form zu suchen, in der das hochrangige, zwei oder mehr niederrangige Module unterschiedlicher Ordnung aufweisende Modul die Ziele, die hauptsächlich unter die Zuständigkeit der jeweils beiden niederrangigen Module fallen, lose teilt. Als Ergebnis davon, ist es möglich, das geregelte/gesteuerte Objekt dazu zu veranlassen, in einer Form einer Störung einer beliebigen Art entgegenzuwirken, die das Ziel, das hauptsächlich unter die Zuständigkeit des hochrangigen Moduls fällt, vorrangig berücksichtigt, während sie die Ziele, die hauptsächlich unter die Zuständigkeiten der jeweiligen niederrangigen Module fallen, indirekt oder sekundär berücksichtigt.
  • In dem Regelungs-/Steuerungssystem der dritten bevorzugten Ausführung kann das hochrangige Modul und das intermediäre Modul jeweils dazu eingerichtet sein, unter niederrangigen Handlungskandidaten, die jeweils von dem intermediären Modul, dessen Frequenz niedriger als die des hochrangigen Moduls, oder dem intermediären Modul und dem niederrangigen Modul gesucht sind, einen niederrangigen Handlungskandidaten zu erhalten, dessen von dem niederrangigen Modul bewertete niederrangige Gesamteignung ein Maximum oder ein lokales Maximum, als eine niederrangige Handlungsrichtlinie von dem jeweiligen intermediären Modul und dem niederrangigen Modul, ist, und einen Näherungsgrad an die niederrangige Handlungsrichtlinie als die geschätzte niederrangige Eignung in Bezug zu jedem der vom niederrangigen Modul gesuchten Handlungskandidaten zu bewerten. (Vierte bevorzugte Ausführung).
  • Gemäß dem Regelungs-/Steuerungssystem der vierten bevorzugten Ausführung berücksichtigt die niederrangige, von dem niederrangigen Modul erhaltene Handlungsrichtlinie, welche die Bewertungskriterien für niederrangige, von dem Modul geschätzte Eignung sein sollen, die niederrangige Handlungsrichtlinie, welche das niederrangige Modul von einem weiteren niederrangigen Modul erhielt. Daher ist das Modul in der Lage, nach den Handlungskandidaten in einer Form zu suchen, die nicht nur das Ziel, das hauptsächlich unter die Zuständigkeit eines Moduls fällt, das niederrangiger als das Modul ist, sondern auch das Ziel, das hauptsächlich unter die Zuständigkeit eines Moduls fällt, das im Rang noch niedriger als das niederrangige Modul ist, berücksichtigt. Mit anderen Worten, ist es möglich, nach den Handlungskandidaten des geregelten/gesteuerten Objekts in einer Form zu suchen, in welcher das hochrangige, zwei oder mehr niederrangige Module unterschiedlichen Rangs aufweisende Modul die Ziele, die jeweils hauptsächlich unter die Zuständigkeiten der beiden niederrangigen Module fallen, lose teilt. Als Ergebnis davon ist es möglich, das geregelte/gesteuerte Objekt dazu zu veranlassen, einer Störung einer beliebigen Art in einer Form entgegenzuwirken, die das Ziel, das hauptsächlich unter die Zuständigkeit des hochrangigen Moduls fällt, vorrangig berücksichtigt, während sie die Ziele, die hauptsächlich unter die Zuständigkeit der jeweiligen niederrangigen Module fallen, indirekt oder sekundär berücksichtigt.
  • In dem Regelungs-/Steuerungssystem der vierten bevorzugten Ausführung können ein erstes bis N-tes Modul als die Mehrzahl von Modulen bereitgestellt sein, ein erstes Modul als das Modul eines höchsten Ranges kann dazu eingerichtet sein, eine erste Eignung e1 für ein erstes Ziel als das Hauptziel in Bezug zu jedem von ersten Handlungskandidaten als die von dem ersten Modul gesuchten Handlungskandidaten zu bewerten, eine zweite geschätzte Eignung e2^ durch Abschätzen der Eignung für ein zweites Ziel, das hauptsächlich unter die Zuständigkeit eines zweiten Moduls als ein niederrangiges Modul fällt, zu bewerten und anschließend eine erste Gesamteignung f1 gemäß einer Bewertungsgleichung f1 = e1(e2^ + 1) zu bewerten; ein fites Modul (i = 2 bis N – 1) als das intermediäre Modul kann dazu eingerichtet sein, eine i-te Eignung ei im Hinblick auf ein i-tes Ziel als das Hauptziel in Bezug zu jedem der fiten Handlungskandidaten als die von dem i-ten Modul gesuchten Handlungskandidaten zu bewerten, eine (i – 1)-te Eignung ei-1, im Hinblick auf das (i – 1)-te Ziel als das Ziel höchsten Ranges zu bewerten, eine (i + 1)-te geschätzte Eignung ei+1^ durch Abschätzen einer Eignung im Hinblick auf ein (i + 1)-tes Ziel als das niederrangige Ziel zu bewerten und anschließend die i-te Gesamteignung fi gemäß einer Bewertungsgleichung fi = ei(ei-1(ei+1^ + 1) + 1) zu bewerten; und ein N-tes Modul als das niederrangigste Modul kann dazu eingerichtet sein, eine N-te Eignung eN für ein N-tes Ziel als das Hauptziel in Bezug zu jedem von N-ten Handlungskandidaten als die von dem N-ten Modul gesuchten Handlungskandidaten zu bewerten, die (N – 1)-te Eignung eN-1 eines (N – 1)-ten Moduls als das hochrangige Modul zu bewerten und anschließend die i-te Gesamteignung fi gemäß einer Bewertungsgleichung fN = eN(eN-1 + 1) zu bewerten (Fünfte bevorzugte Ausführung).
  • Gemäß dem Regelungs-/Steuerungssystem der fünften bevorzugten Ausführung ist es möglich, nach den Handlungskandidaten des geregelten/gesteuerten Objekts in einer Form zu suchen, in welcher das hochrangige, zwei oder mehr niederrangige Module unterschiedlichen Ranges (ein um einen Rang niedrigeres Modul und ein um zwei Ränge niedrigeres Modul) aufweisende Modul die Ziele, die hauptsächlich unter die Zuständigkeiten der jeweiligen niederrangigen Module fallen, lose teilt. Als Ergebnis davon ist es möglich, das geregelte/gesteuerte Objekt dazu zu veranlassen, einer Störung einer beliebigen Art in einer Form entgegenzuwirken, die das Ziel, das hauptsächlich unter die Zuständigkeit des hochrangigen Moduls fällt, vorrangig berücksichtigt, während sie die Ziele, die hauptsächlich unter die Zuständigkeiten der jeweiligen niederrangigen Module fallen, indirekt oder sekundär berücksichtigt.
  • In dem Regelungs-/Steuerungssystem der fünften bevorzugten Ausführung kann das j-te Modul (j = 1, 2, ..., N) dazu eingerichtet sein, eine j-te Eignung ej für ein j-tes Ziel als das Hauptziel zu einem festen Wert in Bezug zu j-ten Handlungskandidaten, die in einer unter allen j-ten Handlungskandidaten, als die von dem j-ten Modul gesuchten Handlungskandidaten, vorgegebenen j-ten Gruppe von Handlungskandidaten umfasst sind, zu bewerten, während die j-te Eignung ej zu einem niedrigeren Wert als der feste Wert in Bezug zu den j-ten Handlungskandidaten, die nicht in der unter allen j-ten Handlungskandidaten vorgegebenen j-ten Gruppe von Handlungskandidaten umfasst sind, bewertet wird (Sechste bevorzugte Ausführung).
  • Gemäß dem Regelungs-/Steuerungssystem der sechsten bevorzugten Ausführung, wird die j-te Eignung ej in Bezug zu den j-ten Handlungskandidaten, die in der j-ten vorgegebenen Gruppe von Handlungskandidaten unter allen j-ten, von dem j-ten Modul gesuchten Handlungskandidaten umfasst sind, zu einem bestimmten Wert bewertet. Andererseits wird die j-te Eignung ej in Bezug zu den j-ten Handlungskandidaten, die nicht in der j-ten vorgegebenen Gruppe von Handlungskandidaten umfasst sind, zu einem niedrigeren Wert als dem festen Wert bewertet. Insbesondere wird in einer Menge von Handlungskandidaten (der j-te Lösungsraum), deren j-te Eignung ej einen ausreichend hohen Wert aufweist, unter den möglichen Mengen von Handlungskandidaten, eine Region gebildet, in welcher die j-te Eignung ej zu einem festen Wert bewertet wird (flache Region), und eine Region, in welcher die j-te Eignung ej niedriger als der feste Wert ist. Diese Konfiguration basiert auf einem Konzept, wonach die zu dem j-ten Ziel zu einem gewissen Grad passenden j-ten Handlungskandidaten als näherungsweise äquivalente j-te Eignung aufweisend betrachtet werden können.
  • Die Bildung der flachen Region weitet eine Region aus, in welcher es möglich ist, nach einer Lösung zu suchen, der Gesamteignung das Maximum oder das lokale Maximum in dem j-ten Lösungsraum ist. Wenn das hochrangige Modul daher dazu eingerichtet ist, einen niederrangigen Handlungskandidaten, dessen niederrangige Gesamteignung das Maximum oder das lokale Maximum ist, als eine niederrangige Handlungsrichtlinie von dem niederrangigen Modul zu erhalten und den Näherungsgrad an die niederrangige Handlungsrichtlinie als geschätzte niederrangige Eignung in Bezug zu jedem der von dem hochrangigen Modul gesuchten Handlungskandidaten zu bewerten (siehe vierte bevorzugte Ausführung), wird die Region, in welcher das hochrangige Modul nach der Lösung im Lösungsraum suchen kann, ausgeweitet.
  • Darüber hinaus ist es nicht nötig, die von der Höhe der j-ten Eignung ej abhängenden Überlegenheit und Unterlegenheit in Bezug zu der Mehrzahl der j-ten, in der flachen Region in dem j-ten Lösungsraum umfassten Handlungskandidaten zu berücksichtigen. Dies verhindert, dass eine Lösung, welche die j-te Eignung mehr als nötig erhöht, gesucht wird und verhindert daher übertriebene Optimierung der Betriebsregelung/-steuerung des geregelten/gesteuerten Objekts. Darüber hinaus muss das j-te Modul nur nach dem j-ten Handlungskandidaten suchen, dessen Gesamteignung das Maximum oder das lokale Maximum gemäß der Eignung im Hinblick auf die Teilziele, die hauptsächlich unter die Zuständigkeit anderer Module (eines oder beide der (j – 1)-ten Module und das (j + 1)-te Modul) fallen, ist. Mit anderen Worten ist es möglich das j-te Modul dazu zu veranlassen, sich auf die Suche nach einer Lösung zu konzentrieren, welche die Eignung im Hinblick auf die Teilziele statt auf das Hauptziel erhöht.
  • Entsprechend ist es möglich die j-te Gesamteignung fj zu bewerten oder zu berechnen, während versucht wird, die arithmetische Operationslast jedes Moduls zur Bewertung der j-ten Eignung ej zu reduzieren und folglich eine frühzeitigere Berechnung eines arithmetischen Operationsergebnisses zu ermöglichen. Dies ermöglicht dem geregelten/gesteuerten Objekt schnell auf eine Störung einer beliebigen Art in angemessener Weise im Hinblick auf das Handlungsziel des geregelten/gesteuerten Objekts zu reagieren oder handeln.
  • In dem Regelungs-/Steuerungssystem der sechsten bevorzugten Ausführung kann das j-te Modul dazu eingerichtet sein, die j-te Eignung ej zu dem festen Wert zu bewerten, mit den j-ten Handlungskandidaten, deren Abweichung von einem in einem für das j-te Ziel angemessenen Zustandsraum definierten Referenzpunkt, unter all den Handkandidaten als die in der vorgegebenen j-ten Gruppe von Handlungskandidaten umfassten j-ten Handlungskandidaten, gleich einem oder kleiner als ein j-ter Schwellwert ist, während die j-te Eignung ej gemäß einer fallenden Funktion, in welcher die Abweichung kontinuierlich oder fortschreitend ist auf der Grundlage der Abweichung in Bezug zu den j-ten Handlungskandidaten, die nicht in der unter all den j-ten Handlungskandidaten vorgegebenen j-ten Gruppe von Handlungskandidaten umfasst sind, bewertet wird (Siebte bevorzugte Ausführung).
  • Ähnlich dem Regelungs-/Steuerungssystem der sechsten Erfindung ist es gemäß dem Regelungs-/Steuerungssystem der siebten Erfindung möglich, die j-te Gesamteignung fj zu bewerten oder zu berechnen, während versucht wird, die arithmetische Operationslast zur Bewertung der j-ten Eignung ej zu reduzieren und folglich eine frühzeitigere Berechnung eines arithmetischen Operationsergebnisses zu ermöglichen. Dies ermöglicht dem geregelten/gesteuerten Objekt schnell auf eine Störung einer beliebigen Art in angemessener Form im Hinblick auf das Handlungsziel des geregelten/gesteuerten Objekts zu reagieren oder handeln.
  • In dem Regelungs-/Steuerungssystem der Erfindung kann jedes der Module dazu eingerichtet sein, nach Handlungskandidaten zu suchen, welche Handlungskandidaten für die zu dem Hauptziel und dem Teilziel passenden Handlungsform des geregelten/gesteuerten Objekts sind, während dem Hauptziel Priorität über das Teilziel gewährt wird (Achte bevorzugte Ausführung).
  • Gemäß dem Regelungs-/Steuerungssystem der achten bevorzugten Ausführung sucht jedes der Module nach Handlungskandidaten des geregelten/gesteuerten Objekts unter Berücksichtigung der Ziele anderer Module, während dem Hauptziel, das hauptsächlich unter die Zuständigkeit des Moduls fällt, Priorität gewährt wird. Auf diese Weise ist es möglich, nach Handlungskandidaten des geregelten/gesteuerten Objekts zu suchen, wobei die Ziele lose unter den unterschiedlichen Modulen geteilt sind. Anschließend werden die Handlungen des geregelten/gesteuerten Objekts in einer Form geregelt/gesteuert, welche das hochrangige Ziel, das hauptsächlich unter die Zuständigkeit des hochrangigen Moduls einer hohen Frequenz fällt, gegenüber dem niederrangigen Ziel, das hauptsächlich unter die Zuständigkeit des niederrangigen Moduls einer niedrigen Frequenz fällt, vorrangig berücksichtigt.
  • Daher wird im Falle einer Störung das hochrangige Ziel, das hauptsächlich unter die Zuständigkeit des hochrangigen Moduls mit schnellem Ansprechverhalten fällt, in der Handlungsform des geregelten/gesteuerten Objekts zuerst berücksichtigt, um den Effekt der Störung schnell zu verringern. Darüber hinaus werden niederrangige Ziele, die hauptsächlich unter die Zuständigkeit der niederrangigen Module mit langsamem Ansprechverhalten fallen, in den Handlungsformen des geregelten/gesteuerten Objekts verzögert berücksichtigt, um die zu allen aus der Mehrzahl von Zielen passenden Handlungsformen des geregelten/gesteuerten Objekts wiederherzustellen. Dies ermöglicht dem geregelten/gesteuerten Objekt im Hinblick auf die Handlungsziele des geregelten/gesteuerten Objekts einer Störung einer beliebigen Form in einer angemessenen Form entgegenzuwirken.
  • In dem Regelungs-/Steuerungssystem der achten bevorzugten Ausführung kann jedes der Module dazu eingerichtet sein, eine gegenwärtige Suche nach den Handlungskandidaten des geregelten/gesteuerten Objekts gemäß einer Suchstrategie durchzuführen, die auf einem vormaligen von dem Modul erhaltenen Suchergebnis und auf einem vormaligen von dem sonstigen Modul erhaltenen Suchergebnis der Handlungskandidaten des geregelten/gesteuerten Objekts basiert, während dem vormaligen Suchergebnis der Handlungskandidaten des geregelten/gesteuerten Objekts durch das Modul Priorität über das vormalige Suchergebnis der Handlungskandidaten des geregelten/gesteuerten Objekts durch das sonstige Modul gewährt wird (Neunte bevorzugte Ausführung).
  • Gemäß dem Regelungs-/Steuerungssystem der neunten bevorzugten Ausführung, wird die gegenwärtige Suche nach Handlungskandidaten von einem Modul auf der Grundlage des von dem einen Modul erhaltenen Ergebnisses der vorhergehenden Suche und des von einem sonstigen Modul erhaltenen Suchergebnisses nach den Handlungskandidaten durchgeführt. Das Ergebnis der vorhergehenden Suche des einen Moduls nach den Handlungskandidaten passt zusätzlich zu dem Ziel, das hauptsächlich unter die Zuständigkeit des einen Moduls fällt, zu dem Teilziel, das hauptsächlich unter die Zuständigkeit des sonstigen Moduls fällt. Daher ist es möglich, nach Handlungskandidaten des geregelten/gesteuerten Objekts zu suchen, wobei die Ziele lose unter unterschiedlichen Modulen geteilt sind.
  • In dem Regelungs-/Steuerungssystem der neunten Erfindung kann jedes der Module dazu eingerichtet sein, einen Teil der bei dem vorherigen Mal gesuchten Handlungskandidaten mit höherer Wahrscheinlichkeit auszuwählen, wenn die bei dem vorherigen Mal bewertete Gesamteignung höher ist und die gegenwärtige Suche nach den Handlungskandidaten in einem Außengebiet der ausgewählten Handlungskandidaten in dem durch die Handlungskandidaten definierten Zustandsraum durchzuführen (10. bevorzugte Ausführung).
  • Gemäß dem Regelungs-/Steuerungssystem der 10. bevorzugten Ausführung wird ein Teil der bei dem vorhergehenden Mal gesuchten Handlungskandidaten mit höherer Wahrscheinlichkeit ausgewählt, wenn die Gesamteignung für die Ziele, die hauptsächlich unter die Zuständigkeit des entsprechenden Moduls und jedes der anderen Module fällt, höher ist und die gegenwärtige Suche nach den Handlungskandidaten wird in einem Außenbereich der ausgewählten Handlungskandidaten durchgeführt. Daher ist es möglich, nach Handlungskandidaten, die besser zu dem Hauptziel und dem Teilziel passen, in einer Form zu suchen, die Mannigfaltigkeit aufweist, welche nicht übermäßig an das Suchergebnis des vorhergehenden Mals gebunden ist. Als Ergebnis davon, ermöglicht die Wiederholung der Suche nach den Handlungskandidaten dem geregelten/gesteuerten Objekt im Hinblick auf das Handlungsziel des geregelten/gesteuerten Objekts einer Störung einer beliebigen Art, wie oben beschrieben, in einer angemessenen Form entgegenzuwirken.
  • In dem Regelungs-/Steuerungssystem der 10. bevorzugten Ausführung kann jedes der Module dazu eingerichtet sein, die gegenwärtige Suche nach den Handlungskandidaten in einem engeren Außengebiet durchzuführen, wenn die bei dem vorhergehenden Mal bewertete Gesamteignung in Bezug zu den Handlungskandidaten, die aus den in dem vorhergehenden Mal in dem Zustandsraum gesuchten Handlungskandidaten ausgewählt sind, höher ist (11. bevorzugte Ausführung).
  • Gemäß dem Regelungs-/Steuerungssystem der 11. bevorzugten Ausführung hängt die Größe des Außenbereichs der bei dem vorhergehenden Mal ausgewählten Handlungskandidaten, die die Suchfläche der gegenwärtigen Suche nach den Handlungskandidaten in dem Zustandsraum ist, von der Höhe der Gesamteignung der bei dem vorhergehenden Mal ausgewählten Handlungskandidaten ab, basierend auf dem Ziel, das hauptsächlich unter die Zuständigkeit des entsprechenden Moduls und jedes von anderen Modulen fällt. Daher ist es möglich nach Handlungskandidaten, die besser zu dem Hauptziel und dem Teilziel passen, in einer Form zu suchen, die Konvergenz ohne Verlust, wie beispielsweise signifikantes Abweichen von dem Suchergebnis des vorhergehenden Mals auf der Grundlage des Suchergebnisses des vorhergehenden Mals, aufweist. Als Ergebnis davon ermöglicht die Wiederholung der Suche nach den Handlungskandidaten dem geregelten/gesteuerten Objekt im Hinblick auf das Handlungsziel des geregelten/gesteuerten Objekts einer Störung einer beliebigen Art, wie oben beschrieben, in einer angemessenen Form entgegenzuwirken.
  • In dem Regelungs-/Steuerungssystem der 10. bevorzugten Ausführung kann jedes der Module dazu eingerichtet sein, die gegenwärtige Suche nach den Handlungskandidaten zusätzlich zu dem Außenbereich der aus den bei dem vorhergehenden Mal gesuchten Handlungskandidaten ausgewählten Handlungskandidaten in einem Außenbereich von unregelmäßig ausgewählten Punkten in dem Zustandsraum durchzuführen (12. bevorzugte Ausführung).
  • Gemäß dem Regelungs-/Steuerungssystem der 12. bevorzugten Ausführung ist der Außenbereich von unregelmäßig ausgewählten Punkten in dem Zustandsraum ebenfalls ein Bereich, in welchem die gegenwärtige Suche nach den Handlungskandidaten durchgeführt wird. Daher ist es möglich, nach Handlungskandidaten, die besser zu dem Hauptziel und dem Teilziel passen, in einer Form zu suchen, die Mannigfaltigkeit aufweist, ohne übermäßig an das Suchergebnis des vorhergehenden Mals gebunden zu sein.
  • In dem Regelungs-/Steuerungssystem der 12. bevorzugten Ausführung kann jedes der Module dazu eingerichtet sein, nach den Handlungskandidaten des geregelten/gesteuerten Objekts mit einem hochrangigen Modul als das sonstige Modul zu suchen, falls es ein um einen Rang höheres Modul als das Modul gibt, und mit einem niederrangigen Modul als das sonstige Modul, falls es ein um einen Rang niedrigeres Modul als das Modul gibt (13. bevorzugte Ausführung).
  • Gemäß dem Regelungs-/Steuerungssystem der 13. bevorzugten Ausführung werden die Handlungskandidaten des geregelten/gesteuerten Objekts gesucht, wobei die Ziele lose unter einer Mehrzahl von Modulen, die sich in einem Rang voneinander unterscheiden, geteilt werden. Insbesondere sucht das hochrangigste Modul nach den Handlungskandidaten, die zu dem Ziel (Teilziel), das hauptsächlich unter die Zuständigkeit des um einen Rang niedrigeren Moduls als das hochrangigste Modul fällt, und dem Hauptziel, das hauptsächlich unter die Zuständigkeit des hochrangigsten Moduls fällt, passen. Ferner sucht das niederrangigste Modul nach den Handlungskandidaten, die zu dem Ziel (Teilziel), das hauptsächlich unter die Zuständigkeit des um einen Rang höheren Moduls als das niederrangigste Modul fällt, und dem Hauptziel, das hauptsächlich unter die Zuständigkeit des niederrangigsten Moduls fällt, passen. Darüber hinaus sucht ein intermediäres Modul, mit Ausnahme des hochrangigsten Moduls und des niederrangigsten Moduls nach Handlungskandidaten, die zu dem Ziel, das hauptsächlich unter die Zuständigkeit des um einen Rang höheren Moduls als das intermediäre Modul und des um einen Rang niedrigeren Moduls als das intermediäre Modul fällt, und dem Ziel, das hauptsächlich unter die Zuständigkeit des intermediären Moduls fällt, passen.
  • In dem Regelungs-/Steuerungssystem der achten Erfindung kann jedes der Module die Handlungskandidaten suchen, welche die Position oder die Position und Haltung einer sich bewegenden Vorrichtung als das geregelte/gesteuerte Objekt bestimmen und jedes der Module kann die Handlungskandidaten der sich bewegenden Vorrichtung für eine im Vergleich zu dem niederrangigen Modul einer niedrigen Frequenz kürzere Dauer suchen, wenn die Frequenz des hochrangigen Moduls höher ist (14. bevorzugte Ausführung).
  • Gemäß dem Regelungs-/Steuerungssystem der 14. bevorzugten Ausführung ist es möglich, jedes Modul dazu zu veranlassen, nach Handlungskandidaten, welche die Position oder die Position und Haltung (nachfolgend treffend als „Position und dergleichen” bezeichnet) einer sich bewegenden Vorrichtung als das geregelte/gesteuerte Objekt für eine angemessenen Zeitdauer gemäß einem angemessenen Ziel, das von dem Pegel des Frequenzbandes oder der Länge der Betriebsdauer abhängt, zu suchen. Dies ermöglicht der sich bewegenden Vorrichtung sich in einer derartigen Weise zu verhalten, dass die Position oder dergleichen angemessen im Hinblick auf das Handlungsziel der sich bewegenden Vorrichtung entgegen einer Störung einer beliebigen Form geregelt/gesteuert wird.
  • Das Regelungs-/Steuerungssystem der 14. bevorzugten Ausführung kann als die Mehrzahl von Modulen, ein erstes Modul, ein zweites Modul und ein drittes Modul umfassen, die dazu eingerichtet sind, die Positionstrajektorie oder die Positionstrajektorie und Haltungstrajektorie eines Roboters, als die sich bewegende Vorrichtung zu suchen, der als Handlungskandidaten einen Rumpf und eine Mehrzahl von sich von dem Rumpf erstreckenden Beinen aufweist. In dem Regelungs-/Steuerungssystem kann das erste Modul dazu eingerichtet sein, einen Gang über eine erste vorgegebene Anzahl von Schritten des Roboters zu suchen, um als ein erster Handlungskandidat den Roboter dazu zu veranlassen die Haltung zu stabilisieren; das zweite Modul kann dazu eingerichtet sein, als ein zweiter Handlungskandidat eine lokale Route zu suchen, welche einen Gang über eine zweite vorgegebene Anzahl von Schritten bestimmt, welche größer als die erste vorgegebene Anzahl von Schritten ist, um den Roboter dazu zu veranlassen einen Kontakt mit einem Objekt zu verhindern und das dritte Modul kann dazu eingerichtet sein, eine allgemeine Route zu suchen, um den Roboter dazu zu veranlassen, eine Zielposition als einen dritten Handlungskandidaten zu erreichen (15. bevorzugte Ausführung).
  • Gemäß dem Regelungs-/Steuerungssystem der 15. bevorzugten Ausführung ist es möglich, das erste, die höchste Frequenz aufweisende Modul dazu zu veranlassen, nach dem ersten Handlungskandidaten über eine kurze Dauer zu suchen, wenn sich die Störung ereignet, mit dem ersten Handlungsziel „den Roboter dazu zu veranlassen die Haltung zu stabilisieren” als das Hauptziel, während das Teilziel, das hauptsächlich unter die Zuständigkeit eines sonstigen Moduls fällt, berücksichtigt wird. Außerdem ist es möglich, das zweite, eine intermediäre Frequenz aufweisende Modul dazu zu veranlassen, nach dem zweiten Handlungskandidaten über eine im Vergleich zu dem ersten Handlungskandidaten lange Dauer mit dem zweiten Handlungsziel „den Roboter dazu zu veranlassen einen Kontakt mit einem Objekt zu verhindern” als das Hauptziel zu suchen, während das Teilziel, das hauptsächlich unter die Zuständigkeit eines sonstigen Moduls fällt, berücksichtig wird. Ferner ist es möglich, das dritte, die niedrigste Frequenz aufweisende Modul dazu zu veranlassen, nach dem dritten Handlungskandidaten über eine im Vergleich zu dem zweiten Handlungskandidaten lange Dauer mit dem dritten Handlungsziel „den Roboter dazu zu veranlassen, sich zu einer Zielposition zu bewegen” zu suchen, während das Teilziel, das hauptsächlich unter die Zuständigkeit eines sonstigen Moduls fällt, berücksichtigt wird.
  • Der Begriff „sonstiges Modul” aus Sicht des ersten Moduls kann einem oder beiden von dem zweiten Modul und dem dritten Modul entsprechen. In ähnlicher Weise kann der Begriff „sonstiges Modul” aus Sicht des zweiten Moduls einem oder beiden von dem ersten Modul und dem dritten Modul entsprechen. Ferner kann der Begriff „sonstiges Modul” aus Sicht des dritten Moduls einem oder beiden von dem ersten Modul und dem zweiten Modul entsprechen.
  • Außerdem werden die Handlungen des geregelten/gesteuerten Objekts in einer Form geregelt/gesteuert, welche ein von einem hochrangigen Modul einer hohen Frequenz erhaltenes Bewertungsergebnis der Gesamteignung gegenüber einem von einem niederrangigen Modul einer niedrigen Frequenz erhaltenen Bewertungsergebnis der Gesamteignung vorrangig berücksichtigt. Als Ergebnis davon ist es möglich, das geregelte/gesteuerte Objekt dazu zu veranlassen, im Hinblick auf das Handlungsziel des geregelten/gesteuerten Objekts einer Störung einer beliebigen Art in einer angemessenen Form entgegenzuwirken.
  • In dem Regelungs-/Steuerungssystem der Erfindung kann jedes der Module dazu eingerichtet sein, eine Mehrzahl von Zukunftszuständen des geregelten/gesteuerten Objekts gemäß jedem der von dem Modul gesuchten Handlungskandidaten vorherzusagen und die Gesamteignung auf der Grundlage jedes der Zukunftszustände in Bezug zu jedem der Handlungskandidaten zu bewerten (16. bevorzugte Ausführung).
  • Gemäß dem Regelungs-/Steuerungssystem der 16. bevorzugten Ausführung bewertet jedes Modul die Gesamteignung sowohl für das Hauptziel, das hauptsächlich unter die Zuständigkeit des Moduls fällt, als auch für das Teilziel, das hauptsächlich unter die Zuständigkeit eines sonstigen Moduls fällt, in Bezug zu jedem der Handlungskandidaten auf der Grundlage jedes gemäß jedem der Handlungskandidaten von dem Modul vorhergesagten Zukunftszustands. Anschließend werden die Handlungen des geregelten/gesteuerten Objekts in einer Form geregelt/gesteuert, welche ein von einem hochrangigen Modul einer hohen Frequenz erhaltenes Bewertungsergebnis der Gesamteignung gegenüber einem von einem niederrangigen Modul einer niedrigen Frequenz erhaltenes Bewertungsergebnis der Gesamteignung wie vorangehend beschrieben, vorrangig berücksichtigt. Als Ergebnis davon ist es möglich, das geregelte/gesteuerte Objekt dazu zu veranlassen, im Hinblick auf das Handlungsziel des geregelten/gesteuerten Objekts einer Störung einer beliebigen Art in einer angemessen Form entgegenzuwirken.
  • In dem Regelungs-/Steuerungssystem der 16. bevorzugten Ausführung kann das Modul, das ein hochrangiges Modul einer höheren Frequenz als das Modul aufweist, dazu eingerichtet sein, weitere Zukunftszustände des geregelten/gesteuerten Objekts vorherzusagen, die auf die von dem hochrangigen Modul vorhergesagten Zukunftszustände des geregelten/gesteuerten Objekts folgen, und der Betrieb des geregelten/gesteuerten Objekts kann in einer Form geregelt/gesteuert werden, welche das von dem hochrangigen Modul einer hohen Frequenz erhaltene Bewertungsergebnis der Gesamteignung gegenüber dem Bewertungsergebnis der von einem niederrangigen Modul einer niedrigen Frequenz erhaltenen Gesamteignung vorrangig berücksichtigt (17. bevorzugte Ausführung).
  • Gemäß dem Regelungs-/Steuerungssystem der 17. bevorzugten Ausführung wird der Betrieb des geregelten/gesteuerten Objekts in einer Form geregelt/gesteuert, welche ein von einem hochrangigen Modul einer hohen Frequenz erhaltenes Bewertungsergebnis der Gesamteignung gegenüber einem von einem niederrangigen Modul einer niedrigen Frequenz erhaltenen Bewertungsergebnis der Gesamteignung vorrangig berücksichtigt. Als Ergebnis davon werden die Handlungen des geregelten/gesteuerten Objekts in einer Form geregelt/gesteuert, welche das hochrangige Ziel, das hauptsächlich unter die Zuständigkeit des hochrangigen Moduls einer hohen Frequenz fällt, gegenüber dem niederrangigen Ziel, das hauptsächlich unter die Zuständigkeit des niederrangigen Moduls einer niedrigen Frequenz fällt, vorrangig berücksichtigt.
  • Daher wird im Falle einer Störung das hochrangige Ziel, das hauptsächlich unter die Zuständigkeit des hochrangigen Moduls mit schnellem Ansprechverhalten fällt, in der Handlungsform des geregelten/gesteuerten Objekts zuerst berücksichtigt, um den Effekt der Störung schnell zu verringern. Darüber hinaus werden niederrangige Ziele, die hauptsächlich unter die Zuständigkeit der niederrangigen Module mit langsamem Ansprechverhalten fallen, in den Handlungsformen des geregelten/gesteuerten Objekts mit zeitlicher Verzögerung berücksichtigt, um die zu allen der Mehrzahl von Zielen passenden Handlungsformen des geregelten/gesteuerten Objekts wiederherzustellen. Dies ermöglicht dem geregelten/gesteuerten Objekt, Hinblick auf die Handlungsziele des geregelten/gesteuerten Objekts einer Störung einer beliebigen Art in einer angemessenen Form entgegenzuwirken.
  • In dem Regelungs-/Steuerungssystem der 17. bevorzugten Ausführung kann jedes der Module dazu eingerichtet sein, die Handlungskandidaten der sich bewegenden Vorrichtung über eine im Vergleich zu dem niederrangigen Modul einer niedrigen Frequenz kürzere Dauer zu suchen, wenn die Frequenz des hochrangigen Moduls höher ist (18. bevorzugte Ausführung).
  • Gemäß dem Regelungs-/Steuerungssystem der 18. bevorzugten Ausführung ist es möglich, jedes Modul dazu zu veranlassen, für eine angemessene Dauer gemäß einem angemessenen Ziel in Abhängigkeit von der Lage des Frequenzbandes oder der Länge der Betriebsdauer nach Handlungskandidaten zu suchen. Anschließend werden die Handlungen des geregelten/gesteuerten Objekts in einer Form geregelt/gesteuert, welche das hochrangige Ziel, das hauptsächlich unter die Zuständigkeit des hochrangigen Moduls einer hohen Frequenz fällt, gegenüber dem Teilziel, das hauptsächlich unter die Zuständigkeit des niederrangigen Moduls einer niedrigen Frequenz fällt, wie vorangehend beschrieben, vorrangig berücksichtigt. Als Ergebnis davon ist es möglich das geregelte/gesteuerte Objekt dazu zu veranlassen, im Hinblick auf die Handlungsziele des geregelten/gesteuerten Objekts einer Störung einer beliebigen Art in einer angemessenen Form entgegenzuwirken.
  • In dem Regelungs-/Steuerungssystem der 18. bevorzugten Ausführung kann wenigstens ein Modul aus der Mehrzahl von Modulen dazu eingerichtet sein, den Zustand des geregelten/gesteuerten Objekts zu einem zukünftigen Zeitpunkt nach einem Ablauf einer kürzeren Dauer einer Handlungsform als die von einem Modul einer höchsten Frequenz gemäß dem aktuellen Zustand des geregelten/gesteuerten Objekts gesuchten Handlungskandidaten als einen nächsten Zukunftszustand vorherzusagen und jedes aus der Mehrzahl von Modulen kann dazu eingerichtet sein, den auf den nächsten Zukunftszustand folgenden Zukunftszustand des geregelten/gesteuerten Objekts gemäß den von dem Modul gesuchten Handlungskandidaten vorherzusagen (19. bevorzugte Ausführung).
  • Gemäß dem Regelungs-/Steuerungssystem der 19. bevorzugten Ausführung kann der Zukunftszustand des geregelten/gesteuerten Objekts gemäß dem Handlungskandidaten in angemessener Weise vorhergesagt werden, wobei der nächste Zukunftszustand gemäß dem aktuellen Zustand des geregelten/gesteuerten Objekts als der Ursprung bestimmt wird. Daher ist es im Falle einer Störung möglich, eine Situation zu verhindern, in der ein im Hinblick auf den aktuellen Zustand des geregelten/gesteuerten Objekts stark abweichender Zukunftszustand vorhergesagt wird, der gemäß der Anwesenheit oder Abwesenheit der Störung oder dessen Grad variiert.
  • Anschließend wird die Gesamteignung in Bezug zu jedem der Handlungskandidaten auf der Grundlage jedes der Zukunftszustände bewertet und die Handlungen des geregelten/gesteuerten Objekts werden auf der Grundlage des Bewertungsergebnisses geregelt/gesteuert. Dies ermöglicht dem geregelten/gesteuerten Objekt, im Hinblick auf die Handlungsziele des geregelten/gesteuerten Objekts einer Störung einer beliebigen Art in einer angemessenen Form entgegenzuwirken.
  • In dem Regelungs-/Steuerungssystem der 18. bevorzugten Ausführung kann jedes der Module dazu eingerichtet sein, die Handlungskandidaten, die die Position oder die Position und Haltung der sich bewegenden Vorrichtung als das geregelte/gesteuerte Objekt bestimmen, zu suchen und die Position oder die Position und Haltung der sich bewegenden Vorrichtung als den Zukunftszustand des geregelten/gesteuerten Objekts vorherzusagen (20. bevorzugte Ausführung).
  • Gemäß dem Regelungs-/Steuerungssystem der 20. bevorzugten Ausführung ist es möglich, jedes Modul dazu zu veranlassen, nach Handlungskandidaten zu suchen, welche die Position oder die Position und Haltung (nachfolgend treffend als „Position und dergleichen” bezeichnet) der sich bewegenden Vorrichtung als das geregelte/gesteuerte Objekt für eine angemessene Dauer gemäß einem angemessenen Ziel in Abhängigkeit der Lage des Frequenzbandes oder der Länge der Betriebsdauer zu bestimmen und anschließend die Position oder dergleichen der sich bewegenden Vorrichtung als einen Zukunftszustand vorherzusagen. Dies ermöglicht der sich bewegenden Vorrichtung, sich in einer derartigen Weise zu verhalten, dass die Position und dergleichen im Hinblick auf das Handlungsziel der sich bewegenden Vorrichtung entgegen einer Störung einer beliebigen Form angemessen geregelt/gesteuert werden.
  • Das Regelungs-/Steuerungssystem der 20. bevorzugten Ausführung kann als die Mehrzahl von Modulen, ein erstes Modul, ein zweites Modul und ein drittes Modul umfassen, die dazu eingerichtet sind, die Positionstrajektorie oder Positionstrajektorie und Haltungstrajektorie eines Roboters, als die sich bewegende Vorrichtung, der als die Handlungskandidaten einen Rumpf und eine Mehrzahl von sich von dem Rumpf erstreckenden Beinen aufweist, zu suchen. In dem Regelungs-/Steuerungssystem kann das erste Modul dazu eingerichtet sein, einen Gang über eine erste vorgegebene Anzahl von Schritten des Roboters zu suchen, um den Roboter dazu zu veranlassen, als einen ersten Handlungskandidaten die Haltung zu stabilisieren und die Position oder die Position und Haltung in der Zukunft des Roboters gemäß jedem der ersten Handlungskandidaten als eine Mehrzahl von ersten Zukunftszuständen vorherzusagen; das zweite Modul kann dazu eingerichtet sein, als eine lokale Route als einen zweiten Handlungskandidaten zu suchen, welche einen Gang über eine zweite vorgegebene Anzahl von Schritten bestimmt, welche größer als die erste vorgegebene Anzahl von Schritten ist, um den Roboter dazu zu veranlassen einen Kontakt mit einem Objekt zu verhindern und die Position oder die Position und Haltung in der Zukunft des Roboters gemäß jedem der zweiten Handlungskandidaten als eine Mehrzahl von zweiten Zukunftszuständen vorherzusagen und das dritte Modul kann dazu eingerichtet sein, eine allgemeine Route zu suchen, um den Roboter dazu zu veranlassen, eine Zielposition zu erreichen oder den Roboter dazu zu veranlassen, die Zielposition mit einer Zielhaltung als ein dritter Handlungskandidat zu erreichen und die Position oder die Position und Haltung in der Zukunft des Roboters gemäß jedem der dritten Handlungskandidaten als eine Mehrzahl von dritten Zukunftszuständen vorherzusagen (21. bevorzugte Ausführung).
  • Gemäß dem Regelungs-/Steuerungssystem der 21. bevorzugten Ausführung ist es möglich, das erste, die höchste Frequenz aufweisende Modul dazu zu veranlassen, nach dem ersten Handlungskandidaten über eine kurze Dauer zu suchen, wenn sich die Störung ereignet, mit dem ersten Handlungsziel „den Roboter dazu zu veranlassen die Haltung zu stabilisieren” als das Hauptziel, während es das Teilziel (Teilziel), das hauptsächlich unter die Zuständigkeit eines sonstigen Moduls fällt, berücksichtigt und den ersten Zukunftszustand vorherzusagen. Außerdem ist es möglich, das zweite, eine intermediäre Frequenz aufweisende Modul dazu zu veranlassen, nach dem zweiten Handlungskandidaten über eine im Vergleich zu dem ersten Handlungskandidaten lange Dauer mit dem zweiten Handlungsziel „den Roboter dazu zu veranlassen einen Kontakt mit einem Objekt zu verhindern” als das Hauptziel zu suchen, während es das Teilziel (Teilziel), das hauptsächlich unter die Zuständigkeit eines sonstigen Moduls fällt, berücksichtigt und den zweiten Zukunftszustand vorherzusagen. Ferner ist es möglich, das dritte, die niedrigste Frequenz aufweisende Modul dazu zu veranlassen, nach dem dritten Handlungskandidaten über eine im Vergleich zu dem zweiten Handlungskandidaten lange Dauer mit dem dritten Handlungsziel „den Roboter dazu zu veranlassen, sich zu einer Zielposition zu bewegen” als das Hauptziel zu suchen, während es das Teilziel (Teilziel), das hauptsächlich unter die Zuständigkeit eines sonstigen Moduls fällt, berücksichtigt und den dritten Zukunftszustand vorherzusagen.
  • Der Begriff „sonstiges Modul” aus Sicht des ersten Moduls kann einem oder beiden von dem zweiten Modul und dem dritten Modul entsprechen. In ähnlicher Weise kann der Begriff „sonstiges Modul” aus Sicht des zweiten Moduls einem oder beiden von dem ersten Modul und dem dritten Modul entsprechen. Ferner kann der Begriff „sonstiges Modul” aus Sicht des dritten Moduls einem oder beiden von dem ersten Modul und dem zweiten Modul entsprechen.
  • Darüber hinaus werden die Handlungen des Roboters als das geregelte/gesteuerte Objekt in einer Form geregelt/gesteuert, welche jedes Handlungsziel gemäß dem Bewertungsergebnis der Gesamteignung basierend auf dem von jedem Modul vorhergesagten Zukunftszustand berücksichtigt. Als Ergebnis davon ist es möglich, die Position oder dergleichen des Roboters in einer im Hinblick auf jedes Handlungsziel des Roboters entgegen einer Störung einer beliebigen Form zu regeln/steuern.
  • In dem Regelungs-/Steuerungssystem der 21. bevorzugten Ausführung kann wenigstens ein Modul aus dem ersten Modul, dem zweiten Modul und dem dritten Modul dazu eingerichtet sein, die Position oder die Position und Haltung des Roboters zu einem zukünftigen Zeitpunkt nach Ablauf eines Gangs über eine Bezugsanzahl von Schritten, die kleiner als die erste vorgegebene Anzahl von Schritten ist, als den nächsten Zukunftszustand gemäß dem aktuellen Zustand des Roboters vorherzusagen und das erste Modul kann dazu eingerichtet sein, die Position oder die Position und Haltung des Roboters zu dem zukünftigen Zeitpunkt nach Ablauf eines Gangs über die erste vorgegebene Anzahl von Schritten als den ersten Zukunftszustand mit dem nächsten Zukunftszustand als dem Ursprung vorherzusagen; das zweite Modul kann dazu eingerichtet sein, die Positionstrajektorie oder die Positionstrajektorie und Haltungstrajektorie des sich entlang der lokalen Route bewegenden Roboters als den zweiten Zukunftszustand mit dem nächsten Zukunftszustand als dem Ursprung vorherzusagen; und das dritte Modul kann dazu eingerichtet sein, die Positionstrajektorie oder die Positionstrajektorie und Haltungstrajektorie des sich entlang der allgemeinen Route bewegenden Roboters als den dritten Zukunftszustand mit dem nächsten Zukunftszustand als dem Ursprung vorherzusagen (22. bevorzugte Ausführung).
  • Gemäß dem Regelungs-/Steuerungssystem der 22. bevorzugten Ausführung kann der Zukunftszustand des geregelten/gesteuerten Objekts gemäß dem Handlungskandidaten in angemessener Weise vorhergesagt werden, wobei der nächste Zukunftszustand, gemäß dem aktuellen Zustand des Roboters, welcher das geregelte/gesteuerte Objekt ist, als der Ursprung bestimmt wird. Daher ist es im Falle einer Störung möglich, eine Situation zu verhindern, in der ein im Hinblick auf den aktuellen Zustand des geregelten/gesteuerten Objekts stark abweichender Zukunftszustand vorhergesagt wird, der gemäß der Anwesenheit oder Abwesenheit der Störung oder dessen Grad schwankt. Darüber hinaus werden die Handlungen des Roboters als das geregelte/gesteuerte Objekt in einer Form geregelt/gesteuert, welche die Handlungsziele gemäß dem von den entsprechenden Modulen vorhergesagten Bewertungsergebnis der Gesamteignung basierend auf den Zukunftszuständen berücksichtigt. Als Ergebnis davon kann die Position oder dergleichen des Roboters in einer angemessenen Weise im Hinblick auf das Handlungsziel des Roboters entgegen einer Störung einer beliebigen Form geregelt/gesteuert werden.
  • Zur Lösung des vorhergehend genannten Problems, stellt die vorliegende Erfindung einen Roboter, als die sich bewegende Vorrichtung bereit, der einen Rumpf und eine Mehrzahl von sich von dem Rumpf erstreckenden Beinen aufweist, welche sich durch die Bewegungen der Beine bewegt, wobei der Roboter das Regelungs-/Steuerungssystem der 15. Erfindung aufweist (23. bevorzugte Ausführung).
  • Gemäß dem Roboter der 23. bevorzugten Ausführung wird im Falle einer Störung das hochrangige Ziel, das hauptsächlich unter die Zuständigkeit des hochrangigen Moduls mit schnellem Ansprechverhalten fällt, in der Handlungsform des Roboters als das geregelte/gesteuerte Objekt zuerst berücksichtigt, um den Effekt der Störung schnell zu verringern. Darüber hinaus werden niederrangige Ziele, die hauptsächlich unter die Zuständigkeit der niederrangigen Module mit langsamem Ansprechzeiten fallen, in den Handlungsformen des Roboters als das geregelte/gesteuerte Objekt mit zeitlicher Verzögerung berücksichtigt, um die zu allen der Mehrzahl von Zielen passenden Handlungsformen des Roboters wiederherzustellen. Dies ermöglicht dem Roboter, im Hinblick auf die Handlungsziele des Roboters einer Störung einer beliebigen Art in einer angemessenen Form entgegenzuwirken.
  • Zur Lösung des vorhergehend genannten Problems, stellt die vorliegende Erfindung einen Roboter, als die sich bewegende Vorrichtung bereit, der einen Rumpf und eine Mehrzahl von sich von dem Rumpf erstreckenden Beinen aufweist, welche sich durch die Bewegungen der Beine bewegt, wobei der Roboter das Regelungs-/Steuerungssystem der 21. bevorzugten Ausführung aufweist (24. bevorzugte Ausführung).
  • Gemäß dem Roboter der 24. bevorzugten Ausführung wird im Falle einer Störung das hochrangige Ziel, das hauptsächlich unter die Zuständigkeit des hochrangigen Moduls mit schnellem Ansprechverhalten fällt, in der Handlungsform des Roboters als das geregelte/gesteuerte Objekt zuerst berücksichtigt, um den Effekt der Störung schnell zu verringern. Darüber hinaus werden niederrangige Ziele, die hauptsächlich unter die Zuständigkeit der niederrangigen Module mit langsamem Ansprechverhalten fallen, in den Handlungsformen des Roboters als das geregelte/gesteuerte Objekt mit zeitlicher Verzögerung berücksichtigt, um die zu allen der Mehrzahl von Zielen passenden Handlungsformen des Roboters wiederherzustellen. Dies ermöglicht dem Roboter, im Hinblick auf die Handlungsziele des Roboters einer Störung einer beliebigen Art in einer angemessenen Form entgegenzuwirken.
  • Kurze Beschreibung der Zeichnungen
  • 1 ist eine schematische Konfigurationsabbildung eines Roboters gemäß einer Ausführungsform der vorliegenden Erfindung;
  • 2 ist eine schematische Konfigurationsabbildung eines Regelungs-/Steuerungssystem des Roboters;
  • 3 ist eine erläuternde Abbildung des Signalaustausches zwischen parallelen Modulen;
  • 4 ist eine erläuternde Abbildung der gemeinsamen Verarbeitung der parallelen Module;
  • 5 ist eine erläuternde Abbildung eines Handlungssuchverfahrens, welches jeweilige Module verwendet;
  • 6 ist eine erläuternde Abbildung eines ersten Eignungsbewertungsverfahrens;
  • 7 ist eine erläuternde Abbildung eines zweiten Eignungsbewertungsverfahrens;
  • 8 ist eine erläuternde Abbildung eines dritten Eignungsbewertungsverfahrens;
  • 9 ist eine erläuternde Abbildung der Mannigfaltigkeit und Konvergenz eines Handlungssuchverfahrens;
  • 10 ist eine erläuternde Abbildung der Mannigfaltigkeit des Handlungssuchverfahrens;
  • 11 ist eine erläuternde Abbildung der Mannigfaltigkeit des Handlungssuchverfahrens;
  • 12 ist eine erläuternde Abbildung einer Beziehung zwischen dem Verhaltenszustand des Roboters und dem Verhaltenszustands eines invertierten Pendels;
  • 13 ist eine erläuternde Abbildung von experimentellen Ergebnissen mit dem invertierten Pendel;
  • 14 ist eine erläuternde Abbildung der Handlungen des Roboters.
  • Ausführungsform der Erfindung
  • Ein Regelungs-/Steuerungssystem gemäß der vorliegenden Erfindung und bevorzugte Ausführungsformen eines davon geregelten/gesteuerten Objekts werden nachfolgend unter Zuhilfenahme der beiliegenden Zeichnungen beschrieben.
  • (Konfiguration des Roboters)
  • Die Konfiguration eines Roboters als eine Ausführungsform der vorliegenden Erfindung wird zuerst beschrieben.
  • Der in 1 gezeigte Roboter R ist ein Fortbewegungsroboter mit Beinen und, ähnlich einem Menschen, weist er einen Rumpf B0, einen oberhalb des Rumpfes B0 angeordneten Kopf B1, einen linken und einen rechten Arm B2, die in dem oberen Abschnitt des Rumpfes B0 angeordnet sind, um sich von beiden Seiten des oberen Abschnitts zu erstrecken, an dem Ende des linken bzw. rechten Arms B2 angeordnete Hände H und ein sich von dem Unterteil des Rumpfes B0 abwärts erstreckendes linkes und rechtes Bein B4.
  • Der Rumpf B0 umfasst das Oberteil und das Unterteil, die vertikal so miteinander verbunden sind, um relativ zueinander um die Gierachse drehbar zu sein. Der Kopf B1 ist derart drehbar, um um die Gierachse relativ zu dem Rumpf B0 drehbar zu sein.
  • Der Arm B2 umfasst ein erstes Armglied B22 und ein zweites Armglied B24. Der Rumpf B0 ist mit dem ersten Armglied B22 über einen Schultergelenksmechanismus (ein erster Armgelenksmechanismus) B21 verbunden, das erste Armglied B22 ist mit dem zweiten Armglied B24 über einen Ellenbogengelenksmechanismus (ein zweiter Armgelenksmechanismus) B23 verbunden und das zweite Armglied B24 ist mit der Hand H über einen Handgelenksmechanismus (ein dritter Armgelenksmechanismus) B25 verbunden. Der Schultergelenksmechanismus B21 weist einen Rotationsfreiheitsgrad um die Roll-, Nick- und Gierachse auf, der Ellenbogengelenksmechanismus B23 weist einen Rotationsfreiheitsgrad um die Nickachse auf und der Handgelenksmechanismus B25 weist einen Rotationsfreiheitsgrad um die Roll-, Nick- und Gierachse auf.
  • Das Bein B4 umfasst ein erstes Beinglied B42, ein zweites Beinglied B44 und einen Fuß B5. Der Rumpf B0 ist mit dem ersten Beinglied B42 über einen Hüftgelenksmechanismus (ein erster Beingelenksmechanismus) B41 verbunden, das erste Beinglied B42 ist mit dem zweiten Beinglied B44 über einen Kniegelenksmechanismus (ein zweiter Beingelenksmechanismus) B43 verbunden und das zweite Beinglied B44 ist mit dem Fuß B5 über einen Fußgelenksmechanismus (ein dritter Beingelenksmechanismus) B45 verbunden.
  • Der Hüftgelenksmechanismus B41 weist einen Rotationsfreiheitsgrad um die Roll-, Nick- und Gierachse auf, der Kniegelenksmechanismus B43 weist einen Rotationsfreiheitsgrad um die Nickachse auf und der Fußgelenksmechanismus B45 weist einen Rotationsfreiheitsgrad um die Roll- und Nickachse auf. Der Hüftgelenksmechanismus B41, der Kniegelenksmechanismus B43 und der Fußgelenksmechanismus B45 stellen eine „Beingelenksmechanismusgruppe” dar. Zusätzlich können Translations- und Rotationsfreiheitsgrade jedes der in der Beingelenksmechanismusgruppe enthaltenen Gelenksmechanismen angemessen geändert werden. Darüber hinaus, können unter der Prämisse des Wegfalls eines beliebigen Gelenksmechanismus aus dem Hüftgelenksmechanismus B41, dem Kniegelenksmechanismus B43 und dem Fußgelenksmechanismus B45 die Kombination der verbleibenden zwei Gelenksmechanismen die Beingelenksmechanismusgruppe darstellen. Ferner kann, wenn das Bein B4 einen zweiten vom Kniegelenksmechanismus verschiedenen Beingelenksmechanismus aufweist, die Beingelenksmechanismusgruppe so gestaltet sein, dass sie den zweiten Beingelenksmechanismus umfasst. Der Fuß B5 ist an seinem Unterteil mit einem elastischen Material B52 versehen, um, wie in der Japanischen Offenlegungsschrift JP 2001-129774 offenbart, den Aufprall bei einer Landung zu absorbieren.
  • Der Roboter R ist mit einer Mehrzahl von internen Zustandssensoren S1 ausgerüstet, die bei der Messung der internen Zustände wie Position und Haltung des Roboters R in dem Weltkoordinatensystem verwendet werden. Die internen Zustandssensoren S1 sind ein Kodierer (nicht gezeigt), welcher ein einem Beugungswinkel (Gelenkswinkel) jedes Gelenksmechanismus des Roboters R entsprechendes Signal ausgibt, ein Neigungssensor, welcher ein der Haltung (gekennzeichnet durch einen Azimutwinkel und einen Höhenwinkel) des Rumpfes B0 entsprechendes Signal ausgibt, ein Drucksensor, welcher bestimmt, ob der Fuß B5 auf dem Boden landet oder den Boden verlässt und dergleichen. Der interne Zustandssensor S1 kann eine Abbildungsvorrichtung sein, zum Erkennen der Position des Roboters R in dem Weltkoordinatensystem durch Abbilden der Umgebung des Roboters R und Erkennen der Position eines Indikators, welcher auf das Weltkoordinatensystem auf der Grundlage der Abbildungskoordinaten eingestellt ist.
  • Beispielsweise kann als die Abbildungsvorrichtung zum Beispiel ein Paar aus einer linken und einer rechten Kopfkamera C1, welche auf dem Kopf B1 montiert sind, um einen sich im Vorwärtsbereich erstreckenden Abbildungsbereich zu erhalten, und in der Lage sind, Licht in unterschiedlichen Frequenzbändern zu detektieren, wie CCD-Kameras oder Infrarotkameras. Darüber hinaus ist es möglich, eine Taillenkamera (aktiver Sensor) S2 zu verwenden, welche an dem unteren Abschnitt auf der Vorderseite des Rumpfes B0 montiert ist und dazu verwendet wird, die Position, den Azimutwinkel und dergleichen dieses Objekts durch Detektieren von an dem Objekt reflektierten Licht eines an der unteren Seite des Roboters R vorwärts emittierten Laserstrahls im nahen Infrarotbereich zu messen.
  • Der Roboter R ist mit einem externen Zustandssensor S2 zum Messen des externen Zustands wie die Position des Objekts in dessen Umgebung ausgerüstet. Die vorhergehend beschriebene Abbildungsvorrichtung entspricht dem externen Zustandssensor S2.
  • Der Roboter R weist ein Regelungs-/Steuerungssystem 1 und eine Mehrzahl von Aktuatoren 2 auf, die bei der Bewegung jedes aus der Mehrzahl von Gelenksmechanismen verwendet werden. Die jeweiligen Operationen der Aktuatoren 2 werden entsprechend Regelungs-/Steuerungsbefehlen geregelt/gesteuert, welche von dem Regelungs-/Steuerungssystem 1 entsprechend dem internen Zustand und dem externen Zustand des Roboters R ausgegeben werden, um dadurch dem Roboter R zu ermöglichen sich in unterschiedlichen Formen angemessen zu verhalten.
  • (Konfiguration des Regelungs-/Steuerungssystems)
  • Das in 2 gezeigte Regelungs-/Steuerungssystem 1 umfasst ein Regelungs-/Steuerungsmodul mod0, ein erstes Modul (Stabilisierungsmodul) mod1, ein zweites Modul (Hindernisausweichmodul) mod2 und ein drittes Modul (Routengenerierungsmodul) mod3.
  • (Konfiguration des ersten Moduls)
  • Das erste Modul mod1 ist hauptsächlich dafür zuständig, den Roboter R dazu zu veranlassen, als Hauptziel dessen Haltung zu stabilisieren (erstes Handlungsziel). Das erste Modul mod1 ist dazu eingerichtet, die Generierung eines Ausgabesignals durch Durchführung einer arithmetischen Operation eines Eingabesignals für jede erste Betriebsdauer T1 zu wiederholen.
  • (Konfiguration des zweiten Moduls)
  • Das zweite Modul mod2 ist hauptsächlich dafür zuständig, den Roboter R dazu zu veranlassen, als das Hauptziel einen Kontakt mit einem Objekt zu vermeiden (zweites Handlungsziel). Das zweite Modul mod2 ist dazu eingerichtet, die Generierung eines Ausgabesignals durch Durchführung einer arithmetischen Operation eines Eingabesignals für jede zweite Betriebsdauer T2, welche länger als die erste Betriebsdauer T1 ist (zum Beispiel T2 = 2T1), zu wiederholen.
  • (Konfiguration des dritten Moduls)
  • Das dritte Modul mod3 ist hauptsächlich dafür zuständig, den Roboter R dazu zu veranlassen, als das Hauptziel sich zu einer Zielposition zu bewegen (drittes Handlungsziel). Das dritte Modul mod3 ist dazu eingerichtet, die Generierung eines Ausgabesignals durch Durchführung einer arithmetischen Operation eines Eingabesignals für jede dritte Betriebsdauer T3, welche länger als die zweite Betriebsdauer T2 ist (zum Beispiel T3 = 2T2), zu wiederholen.
  • (Funktionen des Roboters)
  • Die Funktionen des die vorangehenden Konfigurationen aufweisenden Roboters R werden nachfolgend beschrieben.
  • (Arithmetische Operationsprozedur des Regelungs-/Steuerungssystems)
  • Das Regelungs-/Steuerungssystem 1 regelt/steuert die Operationen des Aktuators 2 und die Handlungen des Roboters R gemäß der nachfolgend beschriebenen Prozedur.
  • Zuerst erkennt ein Regelungs-/Steuerungsmodul mod0 den aktuellen Zustand des Roboters R. Das Regelungs-/Steuerungsmodul mod0 erkennt insbesondere die internen Zustände wie die Position (die Landeposition, die ZMP-Position oder dergleichen) und die Haltung (die Haltung des Rumpfes B0) des Roboters R in dem Weltkoordinatensystem auf der Grundlage eines Ausgabesignals von dem internen Zustandssensor S1. Darüber hinaus erkennt das Regelungs-/Steuerungsmodul mod0 die externen Zustände wie die Größe und die, Position eines Objekts um den Roboter R in dem Weltkoordinatensystem auf der Grundlage eines Ausgabesignals von dem externen Zustandssensor S2. Zusätzlich kann das Regelungs-/Steuerungsmodul mod0 einen Teil oder alle externen Zustände durch Eingabe oder Übertragung von Daten von außerhalb des Roboters R zu dem Regelungs-/Steuerungssystem 1 erkennen, welche die externen Zustände wie die Größe und Position des Objekts darstellen.
  • Der „aktuelle Zustand” des Roboters R wird von dem Regelungs-/Steuerungsmodul mod0 in das erste Modul mod1 für jede erste Betriebsdauer T1 eingegeben (siehe Pfeil D1+ in 3). Darüber hinaus werden eine bei Durchführung einer zweiten Handlungssuchverarbeitung erhaltene „zweite Suchstrategie” und eine „zweite Handlungsrichtlinie” von dem zweiten Modul mod2 in das erste Modul mod1 für jede zweite Betriebsdauer T2 eingegeben (siehe Pfeil D2– in 3).
  • Gemäß den Eingabesignalen, führt das erste Modul mod1 eine „erste Handlungssuchverarbeitung” für jede erste Betriebsdauer T1 durch. Eine bei Durchführung der ersten Handlungssuchverarbeitung erhaltene „erste Handlungsrichtlinie” wird von dem ersten Modul mod1 in das Regelungs-/Steuerungsmodul mod0 für jede erste Betriebsdauer T1 eingegeben (siehe Pfeil D1– in 3).
  • Wenn es außerdem kein Eingabesignal von dem zweiten Modul mod2 zu Beginn des aktuellen Zyklus des ersten Moduls mod1 gibt, wird die erste Handlungssuchverarbeitung mit Hilfe des Eingabesignals von dem zweiten Modul mod2 zu Beginn eines letzten beendeten Zyklus des ersten Moduls mod1 durchgeführt.
  • Der aktuelle Zustand oder der letzte vorhergesagte Zustand des Roboters R in der nächsten Zukunft gemäß dem aktuellen Zustand werden von dem ersten Modul mod1 in das zweite Modul mod2 für jede Betriebsdauer T2 eingegeben (siehe Pfeil D2+ in 3). Darüber hinaus wird eine bei Durchführung einer ersten Handlungssuchverarbeitung erhaltene „erste Suchstrategie” (umfassend eine erste Handlungsreserve) von dem ersten Modul mod1 in das zweite Modul mod2 für jede zweite Betriebsdauer T2 eingegeben (siehe Pfeil D2+ in 3). Außerdem werden eine bei Durchführung einer dritten Handlungssuchverarbeitung erhaltene „dritte Suchstrategie” und eine „dritte Handlungsrichtlinie” von dem dritten Modul mod3 in das zweite Modul mod2 für jede dritte Betriebsdauer T3 eingegeben (siehe Pfeil D3– in 3).
  • Gemäß den Eingabesignalen führt das zweite Modul mod2 eine „zweite Handlungssuchverarbeitung” für jede zweite Betriebsdauer T2 durch. Eine dabei erhaltene „zweite Handlungsstrategie” und eine „zweite Handlungsrichtlinie” werden von dem zweiten Modul mod2 in das erste Modul mod1 für jede zweite Betriebsdauer T2 eingegeben (siehe Pfeil D2– in 3). Außerdem werden die „zweite Suchstrategie” und die „zweite Handlungsrichtlinie” ebenfalls von dem zweiten Modul mod2 in das dritte Modul mod3 für jede zweite Betriebsdauer T2 eingegeben (siehe Pfeil D2+ in 3).
  • Wenn es außerdem kein Eingabesignal von dem dritten Modul mod3 zu Beginn des aktuellen Zyklus des zweiten Moduls mod2 gibt, wird die zweite Handlungssuchverarbeitung mit Hilfe des Eingabesignals von dem dritten Modul mod3 zu Beginn eines letzten beendeten Zyklus des zweiten Moduls mod2 durchgeführt.
  • Der aktuelle Zustand oder der letzte vorhergesagte Zustand des Roboters R in der nächsten Zukunft gemäß dem aktuellen Zustand werden von dem zweiten Modul mod2 in das dritte Modul mod3 für jede dritte Betriebsdauer T3 eingegeben (siehe Pfeil D3+ in 3). Darüber hinaus wird eine bei Durchführung einer zweiten Handlungssuchverarbeitung erhaltene „zweite Suchstrategie” (umfassend eine zweite Handlungsreserve) von dem zweiten Modul mod2 in das dritte Modul mod3 für jede dritte Betriebsdauer T3 eingegeben (siehe Pfeil D3+ in 3).
  • Gemäß den Eingabesignalen führt das dritte Modul mod3 eine „dritte Handlungssuchverarbeitung” für jede dritte Betriebsdauer T3 durch. Eine dabei erhaltene „dritte Handlungsstrategie” und eine „dritte Handlungsrichtlinie” werden, wie vorangehend beschrieben, von dem dritten Modul mod3 in das zweite Modul mod2 für jede dritte Betriebsdauer T3 eingegeben (siehe Pfeil D3– in 3).
  • Gemäß dem Eingabesignal (siehe Pfeil D1– in 3) von dem ersten Modul mod1 für jede Betriebsdauer T1 generiert das Regelungs-/Steuerungsmodul mod0 sequentiell einen Regelungs-/Steuerungsbefehl. Ferner wird dieser Regelungs-/Steuerungsbefehl von dem Regelungs-/Steuerungsmodul mod0 zu den Aktuatoren 2 übertragen, wodurch die Aktuatoren 2 gemäß dem Regelungs-/Steuerungsbefehl angetrieben werden. Als Ergebnis davon handelt der Roboter R gemäß der letzten ersten Handlungsrichtlinie.
  • (Zusammenwirkende Verarbeitung paralleler Module)
  • Die Prozedur für von den Modulen durchgeführte parallele Verarbeitung unmittelbar nach Auftreten einer Störung wird nachfolgend beschrieben.
  • Ein Fall wird betrachtet, in dem der „aktuelle Zustand” des Roboters R, der durch die Störung beeinträchtigt wird, von dem Regelungs-/Steuerungsmodul mod0 in das erste Modul mod1 zum ersten Mal zum Zeitpunkt t = t0 eingegeben wird (siehe Pfeil D1+(t0) in 5).
  • Das erste Modul mod1 führt zuerst die „erste Handlungssuchverarbeitung” durch, wodurch das erste Modul mod1 die „erste Handlungsrichtlinie (= erste Handlungsreserve)” an das Regelungs-/Steuerungsmodul mod0 zum Zeitpunkt t = t1 ausgibt (siehe Pfeil D1+(t1) in 5). Der Betrieb des Aktuators 2 wird gemäß der Ausgabe geregelt/gesteuert, wobei dem Roboter R ermöglicht wird, sich passend zum ersten Handlungsziel (= den Roboter R zu veranlassen, die Haltung zu stabilisieren) zu verhalten, wobei der von der Störung beeinträchtigte aktuelle Zustand berücksichtigt wird.
  • Darüber hinaus wird die „erste Suchstrategie” zum Zeitpunkt t = t1 von dem ersten Modul mod1 an das zweite Modul mod2 ausgegeben (siehe Pfeil D2+(t1) in 5). Das zweite Modul mod2 führt ferner die „zweite Handlungssuchverarbeitung” durch, wobei die „zweite Suchstrategie (umfassend die zweite Handlungsrichtlinie)” von dem zweiten Modul mod2 an das erste Modul mod1 zum Zeitpunkt t = t0 + T1 + T2 ausgegeben wird (siehe Pfeil D2–(t0 + T1 + T2) in 5).
  • Das erste Modul mod1 führt dann die „erste Handlungssuchverarbeitung” durch, wobei die „erste Handlungsrichtlinie” von dem ersten Modul mod1 an das Regelungs-/Steuerungsmodul mod0 zum Zeitpunkt t = t2 (= t0 + T2 + 2T1) ausgegeben wird (siehe Pfeil D1+(t2) in 5). Der Betrieb des Aktuators 2 wird gemäß der Ausgabe geregelt/gesteuert, wobei dem Roboter R ermöglicht wird, sich passend zum ersten Handlungsziel und zum zweiten Handlungsziel (= den Roboter R zu veranlassen, Kontakt mit einem. Objekt zu vermeiden) zu verhalten, wobei der von der Störung beeinträchtigte aktuelle Zustand berücksichtigt wird.
  • Darüber hinaus wird die „zweite Suchstrategie” (umfassend die zweite Handlungsreserve) zum Zeitpunkt t = t0 + T1 + T2 von dem zweiten Modul mod2 an das dritte Modul mod3 ausgegeben (siehe Pfeil D3+(t0 + T1 + T2) in 5). Das dritte Modul mod3 führt ferner die „dritte Handlungssuchverarbeitung” durch, wodurch die „dritte Suchstrategie (umfassend die dritte Handlungsrichtlinie)” von dem dritten Modul mod3 an das zweite Modul mod2 zum Zeitpunkt t = t0 + T1 + T2 + T3 ausgegeben wird (siehe Pfeil D3–(t0 + T1 + T2 + T3) in 5).
  • Das zweite Modul mod2 führt überdies die „zweite Handlungssuchverarbeitung” durch, wodurch die „zweite Suchstrategie (umfassend die zweite Handlungsrichtlinie)” von dem zweiten Modul mod2 an das erste Modul mod1 zum Zeitpunkt t = t0 + T1 + 2T2 + T3 ausgegeben wird (siehe Pfeil D2–(t0 + T1 + 2T2 + T3) in 5).
  • Das erste Modul mod1 führt dann die „erste Handlungssuchverarbeitung” durch, wobei die „erste Handlungsrichtlinie” von dem ersten Modul mod1 an das Regelungs-/Steuerungsmodul mod0 zum Zeitpunkt t = t3 (t0 + 2T1 + 2T2 + T3) ausgegeben wird (siehe Pfeil D1+(t3) in 5). Der Betrieb der Aktuatoren 2 wird gemäß der Ausgabe geregelt/gesteuert, wobei dem Roboter R ermöglicht wird, sich passend zu dem ersten Handlungsziel, dem zweiten Handlungsziel und dem dritten Handlungsziel (= den Roboter R zu veranlassen, sich zu einer Zielposition zu bewegen) zu verhalten, wobei der von der Störung beeinträchtigte aktuelle Zustand berücksichtigt wird.
  • Die vorangehende zusammenwirkende Verarbeitung des ersten Moduls mod1, des zweiten Moduls mod2 und des dritten Moduls mod3, die parallel geschaltet sind, ermöglicht es, die Handlungen des Roboters R so zu regeln/steuern, um sie an das erste Handlungsziel, das zweite Handlungsziel und das dritte Handlungsziel anzupassen, wobei die Störung während einer Zeitdauer von ungefähr 2T1 + 2T2 + T3 seit Eintreten der Störung berücksichtigt wird. Beispielsweise, wenn T1 = T, T2 = 2T und T3 = 4T, ist es möglich den Roboter R so zu regeln/steuern, um sich passend zu allen aus der Mehrzahl der Ziele zu verhalten, wobei die Störung während der Zeitdauer von ungefähr 10T seit dem Eintreten der Störung berücksichtigt wird.
  • (Inhalte jeder Handlungssuchverarbeitung)
  • Die Details der von dem ersten Modul mod1 durchgeführten „ersten Handlungssuchverarbeitung”, der von dem zweiten Modul mod2 durchgeführten „zweiten Handlungssuchverarbeitung” und der von dem dritten Modul mod3 durchgeführten „dritten Handlungssuchverarbeitung” werden nachfolgend beschrieben.
  • (Prozedur für die erste Handlungssuchverarbeitung)
  • Der nächste Zukunftszustand des Roboters R wird zuerst gemäß einem Verhaltensvorhersagemodell vorhergesagt, welches das Verhalten des Roboters R auf der Grundlage des aktuellen Zustands darstellt (Schritt 100 in 5). Dies ermöglicht die Vorhersage zum Beispiel einer Landeposition, wenn der Roboter R einen Schritt vorwärts von der aktuellen Position macht.
  • Außerdem wird eine Mehrzahl von ersten Handlungskandidaten {ai1|i1 = 1, 2, ..., n1} des Roboters R gemäß der ersten Suchstrategie und der zweiten Suchstrategie gesucht (siehe Pfeil D2– in 3) (Schritt 110 in 5). Insbesondere werden die ersten Handlungskandidaten ai1 gemäß einer Generationsänderungsmethode einer evolutionären Suche basierend auf dem Bewertungsergebnis der ersten Gesamteignung f1 und dem Bewertungsergebnis der zweiten Gesamteignung f2 gesucht. Dieses Suchverfahren wird später beschrieben.
  • Dies veranlasst eine einen Gang über eine erste vorgegebene Anzahl von Schritten q1 (zum Beispiel q1 = 2) bestimmende Landeposition pos(ai1; k1) (k1 = 1 bis q1) als der erste Handlungskandidat ai1, zum Beispiel von einer vorhergesagten Landeposition, welche dem Roboter R einen Schritt voraus ist, gesucht zu werden. Der Ausdruck „Gang” bedeutet ein wiederholtes Muster einer, auf den Landezeitpunkt gerichtete Fortbewegung mittels Beinen.
  • Die Mehrzahl von ersten Zukunftszuständen {si1|i1 = 1, 2, ..., n1} des Roboters R wird überdies gemäß einem ersten Zustandsvorhersagemodells auf der Grundlage jedes aus der Mehrzahl von ersten Handlungskandidaten ai1 (Schritt 120 in 5) vorhergesagt. Dabei wird zum Beispiel ein Nullmomentspunkt (ZMP) des Roboters R zu dem Zeitpunkt, wenn der Roboter R sich um eine erste vorgegebene Anzahl von Schritten q1 gemäß den ersten Handlungskandidaten ai1 von der vorhergesagten ein Schritt vor dem Roboter R liegenden Landeposition des Roboters R bewegt, als der erste Zukunftszustand si1 vorhergesagt.
  • Die erste Gesamteignung f1(ai1) wird dann gemäß der folgenden Prozedur in Bezug zu jedem aus der Mehrzahl von ersten Handlungskandidaten ai1 bewertet (Schritt 130 in 5).
  • Zuerst wird eine die Eignung im Hinblick auf das erste Handlungsziel repräsentierende erste Eignung e1(ai1) auf der Grundlage des ersten Zukunftszustands si1 bewertet. Die erste Eignung e1(ai1) wird gemäß einer Bewertungsgleichung (111) berechnet, deren Variationscharakteristiken in 6(b) dargestellt sind, zum Beispiel auf der Grundlage eines Fehlers zmpbias(ai1) des Ziel-ZMP des in 6(a) gezeigten vorgesagten ZMP und einer Entfernung Lfoot zwischen dem Ziel-ZMP und einer Kante des Fußes B5 in Bezug zu einem Azimut in Richtung des vorhergesagten ZMP von dem Ziel-ZMP. Die Position des Ziel-ZMP entspricht einem in einem dem ersten Ziel angemessenen Zustandsraum definierten Referenzpunkt. Der Fehler zmpbias von dem Ziel-ZMP des vorhergesagten ZMP entspricht einer Abweichung von dem Referenzpunkt. Die zentrale Position der Landefläche (die beispielsweise eine rechtwinklige Form aufweist) des Fußes B5 ist beispielsweise als der ZMP definiert. e1(ai1) = 1 (wenn zmpbias(ai1) ≤ αLfoot (0 < α < 1)), exp(–((zmpbias(ai1) – αLfoot)/Lfoot)2) (wenn αLfoot < zmpbias(ai1)) (111)
  • Wie aus der Bewertungsgleichung (111) ersichtlich, wenn die Entfernung zwischen dem vorhergesagten ZMP und dem Ziel-ZMP des Roboters R gleich einem oder kleiner als ein erster Schwellwert αLfoot ist, mit anderen Worten, im Falle des ersten Handlungskandidaten ai1, von welchem mit einem bestimmten oder höheren Wahrscheinlichkeitsgrad vorhergesagt wird, die Haltung des Roboters R stabil werden zu lassen, wird die erste Eignung e1(ai1) zu einem festen Wert (= 1) bewertet. Andererseits, wenn der vorhergesagte ZMP des Roboters R weiter von dem Ziel-ZMP entfernt ist, so dass er den ersten Schwellwert αLfoot überschreitet, mit anderen Worten, wenn der erste Handlungskandidat ai1 eher die Haltung des Roboters R instabil werden lässt, wird die erste Eignung e1(ai1) niedriger bewertet.
  • Die erste Eignung kann außerdem gemäß einer Bewertungsgleichung (112), deren Variationscharakteristiken in 6(c) gezeigt sind berechnet werden. e1(ai1) = exp(–(zmpbias(ai1)/Lfoot)2) (112)
  • Wie aus der Bewertungsgleichung (112) ersichtlich, wenn der vorhergesagte ZMP des Roboters R näher am Ziel-ZMP ist, mit anderen Worten, wenn der erste Handlungskandidat ai1 die Haltung des Roboters R eher stabil werden lässt, wird die erste Eignung e1(ai1) höher bewertet.
  • Darüber hinaus wird ein geschätzter Wert (zweite geschätzte Eignung) e2^(ai1) einer zweiten Eignung e2(ai1) auf der Grundlage der zweiten von dem zweiten Modul mod2 erhaltenen Handlungsrichtlinie (siehe Pfeil D2– in 3) in Bezug zu jedem aus der Mehrzahl von ersten Handlungskandidaten ai1 bewertet. Die zweite geschätzte Eignung e2^(ai1) wird gemäß einer Bewertungsgleichung (120), zum Beispiel auf der Grundlage der Landeposition pos(ai1; k1) des Roboters R, einer Entfernung poserr(ai1; k1) von einer lokalen Route als die zweite Handlungsrichtlinie und einer Schrittlänge (maximale Schrittlänge) Lstep des Roboters R berechnet. e2^(ai1)= Πk1=1~q1exp(–poserr(ai1; k1)/Lstep) (120)
  • Wie aus der Bewertungsgleichung (120) ersichtlich, wenn die Landeposition pos(ai1; k1) des Roboters R näher an der lokalen Route ist, mit anderen Worten, wenn der erste Handlungskandidat ai1 den Roboter R voraussichtlich eher dazu veranlasst einen Kontakt mit einem Objekt zu verhindern, wird die zweite geschätzte Eignung e2^(ai1) höher bewertet.
  • Außerdem, wenn das zweite Handlungsziel lautet, „den Roboter R zu veranlassen, einen Kontakt mit einem Objekt zu vermeiden, während die relative Haltung des Roboters R zu dem Objekt in einer Zielrelativhaltung beibehalten wird”, kann die zweite geschätzte Eignung e2^(ai1) so definiert werden, dass sie höher bewertet wird, wenn die Abweichung (relative Haltungsabweichung) zwischen der relativen Haltung zur lokalen Route (zum Beispiel, durch den relativen Azimut des Rumpfes B0 zur lokalen Route) des Roboters R, die gemäß dem Gang als ein erster Handlungskandidat ai1 bestimmt wird, und der relativen Zielhaltung geringer ist (siehe Bewertungsgleichung (120)). Dieses zweite Handlungsziel ist hinsichtlich der Vermeidung eines durch eine unerwartete Bewegung eines Menschen verursachten Kontakts mit dem Roboter R signifikant, wodurch der Mensch als ein Objekt dazu veranlasst wird, die Haltung des Roboters R optisch wahrzunehmen und das Verhalten des Roboters R auf der Grundlage der Haltung vorherzusagen.
  • Die erste Gesamteignung f1(ai1) wird dann gemäß einer Bewertungsgleichung (141) oder (142) auf der Grundlage der ersten Eignung e1(ai1) und der zweiten geschätzten Eignung e2^(ai1) bewertet. f1(ai1) = e1(ai1)(e2 ^(ai1) + 1) (141) f1 = w1e1(w2e2^ + 1) (142)
  • Weiter oben sind „w2” und „w1(= (w2 + 1)–1)” Gewichtungsfaktoren.
  • Ein Bewertungsergebnis der ersten Gesamteignung f1(ai1) wird als eine „erste Suchstrategie” definiert, die Konvergenz und Mannigfaltigkeit zur Suche nach jedem der ersten Handlungskandidaten ai1 und zweiten Handlungskandidaten ai2 aufweist. Die erste Suchstrategie umfasst die erste „Handlungsreserve” als einen ersten Handlungskandidaten ai1, der die höchste Bewertung der Gesamteignung f1(ai1) aufweist. Die erste Handlungsreserve kann gleich der ersten Handlungsrichtlinie sein.
  • Wie aus den Bewertungsgleichungen (141) und (142) ersichtlich, ist der Beitrag der ersten Eignung e1(ai1) zur Gesamteignung f1(ai1) höher als der der zweiten geschätzten Eignung e2^(ai1). Zum Beispiel, wenn sich die erste Eignung e1(ai1) der Null nähert, nähert sich auch die erste Gesamteignung f1(ai1) der Null, unabhängig des Grades der zweiten geschätzten Eignung e2^(ai1). Andererseits, selbst wenn sich die zweite geschätzte Eignung e2^(ai1) der Null nähert, nähert sich die erste Gesamteignung f1(ai1) der ersten Eignung e1(ai1), statt der Null, wodurch der Grad der ersten Eignung e1(ai1) direkt in der ersten Gesamteignung f1(ai1) berücksichtigt wird.
  • In der vorangehenden Ausführung wird nicht die zweite Eignung e2(ai1) verwendet, sondern es wird die zweite geschätzte Eignung e2^(ai1), welche ein geschätzter Wert der zweiten Eignung e2(ai1) ist, verwendet, um die erste Suchstrategie zu definieren, wodurch nicht nur das zweite Handlungsziel des zweiten Moduls mod2 (das um einen Rang niedrigere Modul als das erste Modul mod1) berücksichtigt wird, sondern auch das dritte Handlungsziel des dritten Moduls mod3 (das um zwei Ränge niedrigere Modul als das erste Modul mod1).
  • Mit anderen Worten wird die Eignung jedes der ersten Handlungskandidaten ai1 für das zweite Handlungsziel in Bezug zu der lokalen Route, wie vorangehend beschrieben, als die zweite Handlungsrichtlinie bewertet (siehe Bewertungsgleichung (120)). Andererseits wird, wie oben beschrieben, die zweite Handlungsrichtlinie von dem zweiten Modul mod2 mit der dritten Handlungsrichtlinie, die in der zweiten Handlungsrichtlinie berücksichtigt wird, gesucht. Entsprechend wird die Eignung des ersten Handlungskandidaten ai1 für das dritte Handlungsziel indirekt durch die Berechnung der zweiten geschätzten Eignung e2^(ai1) bewertet. Die erste Gesamteignung f1(ai1) wird dann auf der Grundlage der zweiten geschätzten Eignung e2^(ai1) bewertet (siehe Bewertungsgleichung (141) und (142)), wodurch die erste Suchstrategie als das Bewertungsergebnis in der Lage ist, nicht nur das zweite Handlungsziel direkt, sondern auch das dritte Handlungsziel indirekt zu berücksichtigen.
  • (Prozedur für die zweite Handlungssuchverarbeitung)
  • Der nächste Zukunftszustand des Roboters R wird zuerst gemäß einem Verhaltensvorhersagemodell, welches das Verhalten des Roboters R auf der Grundlage des aktuellen Zustands darstellt, vorhergesagt (Schritt 200 in 5). Dies ermöglicht die Vorhersage von zum Beispiel der Landeposition, in der der Roboter R einen Schritt vorwärts von der aktuellen Position macht. Hierbei ist zu beachten, dass der von dem ersten Modul mod1 vorhergesagte nächste Zukunftszustand des Roboters R von dem ersten Modul mod1 an das zweite Modul mod2 ausgegeben werden kann (siehe Pfeil D2+ in 3).
  • Außerdem wird eine Mehrzahl von zweiten Handlungskandidaten {ai2|i2 = 1, 2, ..., n2} des Roboters R gemäß der ersten Suchstrategie, der zweiten Suchstrategie und der dritten Suchstrategie gesucht (siehe Schritt 210 in 5). Die zweiten Handlungskandidaten ai2 werden insbesondere gemäß einer Generationsänderungsmethode von Individuen basierend auf dem Bewertungsergebnis der ersten Gesamteignung f1, dem Bewertungsergebnis der zweiten Gesamteignung f2 und dem Bewertungsergebnis der dritten Gesamteignung f3 gesucht. Dieses Suchverfahren wird später beschrieben.
  • Dabei wird zum Beispiel, wie in 7(a) dargestellt, eine eine Landeposition pos(ai2; k2) (k2 = 1 bis q2) des Roboters R umfassende lokale Route, welche einen Gang über eine zweite vorgegebene Anzahl von Schritten q2 (zum Beispiel q2 = 3 < q1) bestimmt, als der zweite Handlungskandidat ai2 gesucht. Beispielsweise wird die ein Schritt vor dem Roboter R liegende Landeposition, die wie vorangehend beschrieben vorhergesagt wird, als der Startpunkt der lokalen Route angenommen. Mit der ein Schritt vor dem Roboter R liegenden Landeposition als dem Ursprung kann außerdem der Startpunkt der lokalen Route als eine vorhergesagte Landeposition des Roboters R nach Ausführung eins Gangs über die erste vorgegebene Anzahl von Schritte q1 als die erste Handlungsreserve angenommen werden (siehe Pfeil D2+ in 3). Der Begriff „lokale Route” bedeutet eine auf der Grundlage der Position oder dergleichen des Objekts als ein externer Zustand bestimmten Route, die dazu verwendet wird, den Roboter R an einem Kontakt mit einem Objekt zu hindern.
  • Außerdem wird die Mehrzahl von zweiten Zukunftszuständen {si2|i2 = 1, 2, ..., n2} des Roboters R gemäß einem zweiten Zukunftszustandsvorhersagemodell auf der Grundlage jedes aus der Mehrzahl von zweiten Handlungskandidaten ai2 vorhergesagt (Schritt 220 in 5). Dabei wird zum Beispiel die kürzeste Entfernung C(ai2) zwischen dem Roboter R und dem Objekt in dem Fall, in welchem sich der Roboter R entlang der lokalen Route bewegt als der zweite Handlungskandidat ai2 als der zweite Zukunftszustand si2 vorhergesagt (siehe 7(a)).
  • Die zweite Gesamteignung f2(ai2) wird dann gemäß dem folgenden Verfahren in Bezug zu jedem aus der Mehrzahl von zweiten Handlungskandidaten ai2 bewertet (Schritt 230 in 5).
  • Eine zweite die Eignung im Hinblick auf das zweite Handlungsziel darstellende Eignung e2(ai2) wird dann auf der Grundlage des zweiten Zukunftszustands si2 bewertet. Die zweite Eignung e2(ai2) wird gemäß einer Bewertungsgleichung (221) berechnet, deren Variationscharakteristiken in 7(b) dargestellt sind, zum Beispiel auf der Grundlage der kürzesten Entfernung C(ai2) zwischen der lokalen Route und dem Objekt, die in 7(a) dargestellt ist, und einer Objektgröße Robject. Die lokale unendlich oder sehr weit von der zentralen Position des Objekts entfernte lokale Route (Linienelement) entspricht einem in einem dem zweiten Ziel angemessenen Zustandsraum definierten Referenzpunkt. Der Kehrwert C–1 der kürzesten Entfernung zwischen der lokalen Route und der zentralen Position des Objekts entspricht der Abweichung von dem Referenzpunkt. Beispielsweise wird der Radius eines Kreises in einer Ebene, an den die Kontour des Objekts angenähert wird, als die Objektgröße Robject definiert. e2(ai2) = 1 (wenn C–1(ai2) ≤ βRobject –1(0 < β < 1)), exp(–(Robject(C–1(ai2) – βRobject –1))2) (wenn βRobject –1 < C–1(ai2)) (221)
  • Wie aus der Bewertungsgleichung (221) ersichtlich, wenn der Kehrwert C–1 der minimalen Entfernung zwischen der lokalen Route des Roboters R und dem Objekt gleich einem oder kleiner als ein zweiter Schwellwert βRobject –1 ist, mit anderen Worten, im Falle des zweiten Handlungskandidaten ai2, von welchem mit einem bestimmten oder höheren Wahrscheinlichkeitsgrad vorhergesagt wird, einen Kontakt des Roboters R mit einem Objekt verhindern zu lassen, wird die zweite Eignung e2(ai2) zu einem festen Wert (= 1) bewertet. Andererseits, wenn der Kehrwert der minimalen Entfernung zwischen der lokalen Route des Roboters R und dem Objekt größer ist, so dass sie den zweiten Schwellwert βRobject –1 überschreitet, mit anderen Worten, wenn der zweite Handlungskandidat ai2 den Roboter R eher mit dem Objekt in Kontakt treten lässt, wird die zweite Eignung e2(ai2) niedriger bewertet.
  • Die zweite Eignung e2(ai2) kann außerdem gemäß einer Bewertungsgleichung (222), deren Variationscharakteristiken in 7(c) gezeigt sind, berechnet werden. e2(ai2) = exp(–(Robject/C(ai2))2) (222)
  • Wie aus der Bewertungsgleichung (222) ersichtlich, wenn der Kehrwert C–1 der minimalen Entfernung zwischen der lokalen Route des Roboters R und dem Objekt kleiner ist, mit anderen Worten, wenn der zweite Handlungskandidat ai2 den Roboter R eher dazu veranlasst einen Kontakt mit dem Objekt zu vermeiden, wird die zweite Eignung e2(ai2) höher bewertet.
  • Außerdem, wenn das zweite Handlungsziel lautet „den Roboter R dazu zu veranlassen, einen Kontakt mit einem Objekt zu verhindern, während die relative Haltung des Roboters R zu dem Objekt bei einer relativen Zielhaltung beizubehalten ist”, kann die zweite Eignung e2(ai2) so definiert werden, dass sie höher bewertet wird, wenn die Abweichung (relative Haltungsabweichung) zwischen der relativen Haltung (zum Beispiel gekennzeichnet durch den relativen Azimut des Rumpfes B0 zur lokalen Route) des Roboters R zu der Haltung der lokalen Route als der zweite Handlungskandidat ai2 und der relativen Zielhaltung geringer ist (siehe Bewertungsgleichungen (221) und (222)).
  • Darüber hinaus wird ein geschätzter Wert (dritte geschätzte Eignung) e3^(ai2) einer dritten Eignung e3(ai2) auf der Grundlage der dritten von dem dritten Modul mod3 erhaltenen Handlungsrichtlinie (siehe Pfeil D3– in 3) in Bezug zu jedem aus der Mehrzahl von zweiten Handlungskandidaten ai2 bewertet. Die dritte geschätzte Eignung e3^(ai2) wird gemäß einer Bewertungsgleichung (230), zum Beispiel auf der Grundlage der Landeposition pos(ai2; k2) des Roboters R, einer Entfernung poserr(ai2; k2) von einer allgemeinen Route als die dritte Handlungsrichtlinie und einer Schrittlänge (maximale Schrittlänge) Lstep des Roboters R berechnet. e3^(ai2)= Πk2=2~q2exp(–poseerr(ai2; k2)/Lstep) (230)
  • Wie aus der Bewertungsgleichung (230) ersichtlich, wenn die Landeposition pos(ai2; k2) des Roboters R näher an der allgemeinen Route ist, mit anderen Worten, wenn der zweite Handlungskandidat ai2 den Roboter R voraussichtlich eher dazu veranlasst sich gemäß der allgemeinen Route zur Zielposition zu bewegen, wird die dritte geschätzte Eignung e3^(ai2) höher bewertet.
  • Außerdem, wenn das dritte Handlungsziel lautet, „den Roboter R zu veranlassen, eine Zielposition in einer Zielhaltung zu erreichen”, kann die dritte geschätzte Eignung e3^(ai3) so definiert werden, dass sie höher bewertet wird, wenn die Abweichung (Haltungsabweichung) zwischen der Haltung (zum Beispiel gekennzeichnet durch den Azimut des Rumpfes B0) des Roboters R, die gemäß der lokalen Route als der zweite Handlungskandidat ai2 bestimmt wird, und der Haltung der allgemeinen Route geringer ist (siehe Bewertungsgleichung (230)). Dieses dritte Handlungsziel ist hinsichtlich des Veranlassens des Roboters R entsprechend der Haltung im Schwierigkeitsgrad variierende Arbeiten zu verrichten, wie Halten eines Objekts, wenn oder nachdem der Roboter R die Zielposition erreicht.
  • Die zweite Gesamteignung f2(ai2) wird dann gemäß einer Bewertungsgleichung (241) oder (242) auf der Grundlage der ersten von dem ersten Modul mod1 bewerteten ersten Eignung e1(ai2), zusätzlich zur zweiten Eignung e2(ai2) und zur dritten geschätzten Eignung e3^(ai2) bewertet. f2(ai1) = e2(ai2)(e1(ai2)(e3^(ai2) + 1) + 1) (241) f2 = w2e2(w1e1(w3e3^ + 1) + 1) (242)
  • Weiter oben sind „w1”, „w3” und „w2(= {w1(w3 + 1) + 1}–1” Gewichtungsfaktoren.
  • Ein Bewertungsergebnis der zweiten Gesamteignung f2(ai2) wird als eine „zweite Suchstrategie” definiert, die Konvergenz und Mannigfaltigkeit zur Suche nach jedem der ersten Handlungskandidaten ai1, der zweiten Handlungskandidaten ai2 und dritten Handlungskandidaten ai3 aufweist. Die zweite Suchstrategie umfasst die „zweite Handlungsreserve” als einen zweiten Handlungskandidaten ai2, der die höchste Bewertung der zweiten Gesamteignung f2(ai2) aufweist. Die zweite Handlungsreserve kann gleich der zweiten Handlungsrichtlinie sein.
  • Wie aus den Bewertungsgleichungen (241) und (242) ersichtlich, ist der Beitrag der zweiten Eignung e2(ai2) zu der zweiten Gesamteignung f2(ai2) höher als jede aus der ersten Eignung e1(ai2) und der dritten geschätzten Eignung e3^(ai2). Zum Beispiel, wenn sich die zweite Eignung e2(ai2) der Null nähert, nähert sich auch die zweite Gesamteignung f2(ai2) der Null, unabhängig des Grades der ersten Eignung e1(ai2) und der dritten geschätzten Eignung e3^(ai2). Andererseits, selbst wenn sich die erste Eignung e1(ai2) und die dritte geschätzte Eignung e3^(ai2) der Null nähert, nähert sich die zweite Gesamteignung f2(ai2) der zweiten Eignung e2(ai2), statt der Null, wodurch der Grad der zweiten Eignung e2(ai2) direkt in der ersten Gesamteignung f2(ai2) berücksichtigt wird.
  • Darüber hinaus ist der Beitrag der ersten Eignung e1(ai2) zur zweiten Gesamteignung f2(ai2) höher als der der dritten geschätzten Eignung e3^(ai2). Zum Beispiel, wenn sich die erste Eignung e1(ai2) der Null nähert, nimmt die zweite Gesamteignung f2(ai2) unabhängig von dem Grad der dritten geschätzten Eignung e3^(ai2) ab. Andererseits, selbst wenn sich die dritte geschätzte Eignung e3^(ai3) der Null nähert, nähert sich die zweite Gesamteignung f2(ai2) dem Wert e2(ai2)·e1(ai1), wodurch der Grad der ersten Eignung e1(ai1) direkt in der dritten geschätzten Eignung e3^(ai2) berücksichtigt wird.
  • In der vorangehenden Ausführung wird nicht die dritte Eignung e3(ai2) verwendet, sondern es wird die dritte geschätzte Eignung e3^(ai2), welche ein geschätzter Wert der dritten Eignung e3(ai2) ist, verwendet, um die zweite Suchstrategie zu definieren, wodurch nicht nur das dritte Handlungsziel des dritten Moduls mod3 (das um einen Rang niedrigere Modul als das zweite Modul mod2) berücksichtigt wird, sondern auch ein viertes Handlungsziel (zum Beispiel ein Ziel, das den Roboter R dazu veranlasst, sich zu einer Zielposition zu bewegen und sich dann zu einer zweiten Zielposition zu bewegen) eines vierten Moduls mod4 (das um zwei Ränge niedrigere Modul als das zweite Modul mod2) (wenn das vierte Modul existiert, obwohl es in dieser Ausführungsform nicht existiert).
  • Mit anderen Worten wird die Eignung jedes der zweiten Handlungskandidaten ai2 für das dritte Handlungsziel in Bezug zu der allgemeinen Route, wie vorangehend beschrieben, als die dritte Handlungsrichtlinie bewertet (siehe Bewertungsgleichung (230)). Andererseits kann die dritte Handlungsrichtlinie von dem dritten Modul mod3 mit der vierten Handlungsrichtlinie, die in der dritten Handlungsrichtlinie berücksichtigt wird, gesucht werden. Entsprechend wird die Eignung des zweiten Handlungskandidaten ai2 für das vierte Handlungsziel indirekt durch die Berechnung der dritten geschätzten Eignung e3^(ai2) bewertet. Die zweite Gesamteignung f2(ai2) wird dann auf der Grundlage der dritten geschätzten Eignung e3^(ai2) bewertet (siehe Bewertungsgleichungen (241) und (242)), wodurch die zweite Suchstrategie als das Bewertungsergebnis in der Lage ist, nicht nur das dritte Handlungsziel direkt, sondern auch das vierte Handlungsziel indirekt zu berücksichtigen.
  • (Prozedur für die dritte Handlungssuchverarbeitung)
  • Der nächste Zukunftszustand des Roboters R wird zuerst gemäß einem Verhaltensvorhersagemodell, welches das Verhalten des Roboters R auf der Grundlage des aktuellen Zustands darstellt, vorhergesagt (Schritt 300 in 5). Dies ermöglicht die Vorhersage von zum Beispiel der Landeposition, in der der Roboter R einen Schritt vorwärts von der aktuellen Position macht. Hierbei ist zu beachten, dass der von dem ersten Modul mod1 oder dem zweiten Modul vorhergesagte nächste Zukunftszustand des Roboters R von dem zweiten Modul mod2 an das dritte Modul mod3 ausgegeben werden kann (siehe Pfeil D3+ in 3).
  • Außerdem wird eine Mehrzahl von dritten Handlungskandidaten {ai3|i3 = 1, 2, ..., n3} des Roboters R gemäß der zweiten Suchstrategie und der dritten Suchstrategie gesucht (siehe Schritt 310 in 5). Die dritten Handlungskandidaten ai3 werden insbesondere gemäß einer Generationsänderungsmethode von Individuen basierend auf dem Bewertungsergebnis der zweiten Gesamteignung f2 und dem Bewertungsergebnis der dritten Gesamteignung f3 gesucht. Dieses Verfahren wird später beschrieben.
  • Dabei wird zum Beispiel, wie in 8(a) dargestellt, eine allgemeine Route, welche einen Gang bestimmt, in welchem sich der Roboter R zur Zielposition bewegt, als der dritte Handlungskandidat ai3 gesucht. Beispielsweise wird die ein Schritt vor dem Roboter R liegende Landeposition, die wie vorangehend beschrieben vorhergesagt wird, als der Startpunkt der allgemeinen Route angenommen. Außerdem wird der Endpunkt der lokalen Route als die zweite Handlungsreserve (siehe Pfeil D3+ in 3) als der Startpunkt der allgemeinen Route angenommen. Die Zielposition des Roboters R kann von außerhalb des Roboters R in das Regelungs-/Steuerungssystem eingegeben oder übertragen werden und kann auf der Grundlage des Erkennungsergebnisses des externen Zustands von dem Regelungs-/Steuerungssystem 1 berechnet werden.
  • Außerdem wird die Mehrzahl von dritten Zukunftszuständen {si3|i3 = 1, 2, ..., n3} des Roboters R gemäß einem dritten Zukunftszustandsvorhersagemodell auf der Grundlage jedes aus der Mehrzahl von dritten Handlungskandidaten ai3 vorhergesagt (Schritt 320 in 5). Dabei wird zum Beispiel eine Bewegungsentfernung L(a3) in dem Fall, in welchem sich der Roboter R entlang der allgemeinen Route von der vorhergesagten, ein Schritt vor dem Roboter R liegenden Landeposition bewegt, als der dritte Zukunftszustand si3 vorhergesagt.
  • Die dritte Gesamteignung f3(ai3) wird dann gemäß der folgenden Prozedur in Bezug zu jedem aus der Mehrzahl von dritten Handlungskandidaten ai3 bewertet (Schritt 330 in 5).
  • Zuerst wird eine dritte, die Eignung im Hinblick auf das dritte Handlungsziel darstellende Eignung e3(ai3) auf der Grundlage des dritten Zukunftszustands si3 bewertet. Die dritte Eignung e3(ai3) wird gemäß einer Bewertungsgleichung (331) berechnet, deren Variationscharakteristiken in 8(b) dargestellt sind, zum Beispiel auf der Grundlage der vorhergesagten Bewegungsentfernung L(ai3) des Roboters R, die in 8(a) dargestellt ist, und einer linearen Entfernung Ldest zwischen dem Startpunkt der allgemeinen Route und der Zielposition. Die lineare Entfernung Ldest entspricht einem in einem dem dritten Ziel angemessenen Zustandsraum definierten Referenzpunkt. Die Abweichung zwischen der vorhergesagten Bewegungsentfernung L des Roboters R und der linearen Entfernung Ldest entspricht der Abweichung von dem Referenzpunkt. e3(ai3) = 1 (wenn Ldest ≤ L(ai3) ≤ yLdest(1 < γ)), γLdest/L(ai3) (wenn γLdest < L(ai3)) (331)
  • Wie aus der Bewertungsgleichung (331) ersichtlich, wenn die vorhergesagte Bewegungsentfernung L des Roboters R gleich einem oder kleiner als ein dritter Schwellwert yLdest ist, mit anderen Worten, im Falle des dritten Handlungskandidaten ai3, von welchem vorhergesagt wird, die Bewegungsentfernung zu einem gewissen Grad klein sein zu lassen, bevor der Roboter R die Zielposition erreicht, wird die dritte Eignung e3(ai3) zu einem festen Wert (= 1) bewertet. Andererseits, wenn die vorhergesagte Bewegungsentfernung L des Roboters R größer ist, so dass sie einen dritten Schwellwert yLdest überschreitet, mit anderen Worten, wenn der dritte Handlungskandidat ai3 die Bewegungsentfernung eher länger als eine bestimmte Entfernung werden lässt, bevor der Roboter R die Zielposition erreicht, wird die zweite Eignung e3(ai3) niedriger bewertet.
  • Außerdem kann die dritte Eignung e3(ai3) gemäß einer Bewertungsgleichung (332), deren Variationscharakteristiken in 8(c) dargestellt sind, berechnet werden. e3(ai3) = Ldest/L(ai3) (332)
  • Wie aus der Bewertungsgleichung (332) ersichtlich, wenn sich der Roboter R linear der Zielposition nähert, mit anderen Worten, wenn von dem dritten Handlungskandidaten ai3 vorhergesagt wird, die Bewegungsentfernung L kürzer werden zu lassen, bevor der Roboter R die Zielposition erreicht, wird die dritte Eignung e3(ai3) höher bewertet.
  • Außerdem, wenn das dritte Handlungsziel lautet „den Roboter R dazu zu veranlassen, die Zielposition in einer Zielhaltung zu erreichen”, kann die dritte Eignung e3(a3) so definiert werden, dass sie höher bewertet wird, wenn die Abweichung (Haltungsabweichung) zwischen der Haltung (zum Beispiel gekennzeichnet durch den Azimut des Rumpfes B0) des Roboters R in der Zielhaltung, welche gemäß der allgemeinen Route als der dritte Handlungskandidat ai3 bestimmt wird, und der Zielhaltung geringer ist (siehe Bewertungsgleichungen (331) und (332)).
  • Darüber hinaus wird die dritte Gesamteignung f3(a3) gemäß einer Bewertungsgleichung (341) oder (342) auf der Grundlage der zweiten von dem zweiten Modul mod2 bewerteten Eignung e2(ai3) zusätzlich zur dritten Eignung e3(ai3) bewertet. f3(ai3) = e3(ai3)(e2(ai3) + 1) (341) f3 = w3e3(w2e2 + 1) (342)
  • Weiter oben sind „w2” und „w3(= w2 + 1)–1” Gewichtungsfaktoren.
  • Ein Bewertungsergebnis der dritten Gesamteignung f3(ai3) wird als eine „dritte Suchstrategie” definiert, die Konvergenz und Mannigfaltigkeit zur Suche nach jedem der zweiten Handlungskandidaten ai2 und den dritten Handlungskandidaten ai3 aufweist.
  • Wie aus den Bewertungsgleichungen (341) und (342) ersichtlich, ist der Beitrag der dritten Eignung e3(ai3) zu der dritten Gesamteignung f3(ai3) höher als der der zweiten Eignung e2(ai3). Zum Beispiel, wenn sich die dritte Eignung e3(ai3) der Null nähert, nähert sich auch die dritte Gesamteignung f3(ai3) der Null, unabhängig des Grades der zweiten Eignung e2(ai3). Andererseits, selbst wenn sich die zweite Eignung e2(ai3) der Null nähert, nähert sich die dritte Gesamteignung f3(ai3) der dritten Eignung e3(ai3), statt der Null, wodurch der Grad der dritten Eignung e3(ai3) direkt in der dritten Gesamteignung f3(ai3) berücksichtigt wird.
  • (Verfahren zur Suche nach Handlungskandidaten gemäß einer Suchstrategie)
  • Ein Verfahren zur Suche nach Handlungskandidaten wird nachfolgend beschrieben. Als das Suchverfahren wird ein Verfahren, das „Konvergenz” und „Mannigfaltigkeit” aufweist, verwendet. Mit der Verwendung eines „Konvergenz” aufweisenden Verfahrens ist es möglich, nach einem Handlungskandidaten zu suchen, dessen aktuelle Bewertung höher ist als die vorangehende hohe Bewertung eines anderen Handlungskandidaten in einem Suchbereich in dessen Nachbarschaft (das bedeutet, ein Bereich in einem durch Handlungskandidaten definierten Raum). Mit der Verwendung eines „Mannigfaltigkeit” aufweisenden Verfahrens, ist es möglich nach einem Handlungskandidaten zu suchen, dessen aktuelle Bewertung in einem weiten Bereich höher ist, ohne zu sehr von der vorangehenden Bewertung beeinträchtigt zu sein.
  • Als das Konvergenz und Mannigfaltigkeit aufweisende Verfahren zur Suche nach einem Handlungskandidaten kann ein evolutionäres Suchverfahren verwendet werden.
  • Zuerst werden insbesondere Parent-Individuen, welche jeweils von einem Kreis eingeschlossen sind, aus einer Mehrzahl von in 9(a) dargestellten Parent-Individuen (welche Handlungskandidaten a entsprechen und durch das Zeichen „•” dargestellt sind) ausgewählt. Die Auswahlwahrscheinlichkeit ist höher, wenn die Eignung f(a) (welche gemäß der durch die durchgezogene Linie dargestellten Bewertungskurve bewertet ist) höher ist.
  • Wie in 9(b) dargestellt, wird dann das eine höhere Bewertung f(a) aufweisende Parent-Individuum so generiert, dass als Ergebnis der Addition von relativ niedrigem Rauschen zu dem Parent-Individuum (das Rauschen ist niedriger, wenn die Eignung f(a) höher ist) Child-Individuen (durch ein Zeichen „o” dargestellt) mit höherer Wahrscheinlichkeit in einem relativ schmalen Bereich um das Parent-Individuum verteilt werden. Andererseits, wird das niedrigere Eignung f(a) aufweisende Parent-Individuum so generiert, dass als Ergebnis der Addition von relativ hohem Rauschen zu dem Parent-Individuum (das Rauschen ist höher, wenn die Eignung f(a) niedriger ist) Child-Individuen mit höherer Wahrscheinlichkeit in einem relativ weiten Bereich um das Parent-Individuum verteilt werden. Außerdem werden Individuen, obwohl nicht gezeigt, unregelmäßig generiert. Das Besetzungsverhältnis der unregelmäßigen Individuen zu allen Individuen wird auf zum Beispiel ungefähr 0.3 gesetzt.
  • Mit der Verwendung der vorangehend beschriebenen Generationsänderungsmethode, konzentrieren sich Individuen auf eine eine höhere Eignung f(a) aufweisende Region, je mehr Generationen vergehen. Dabei ist es möglich adaptiv einen Handlungskandidaten a zu erhalten, der dem Ziel, das hauptsächlich unter die Zuständigkeit des Moduls fällt, höchst angepasst ist.
  • Darüber hinaus, um die Mannigfaltigkeit des Suchverfahrens zu beschreiben, werden zwei Module A und B betrachtet. Das Modul A ist dazu eingerichtet, die Eignung f(a) zu bewerten, die darstellt, wie der Handlungskandidat a zu dem Ziel passt, eine Suchstrategie gemäß dem Bewertungsergebnis zu setzen und die Suchstrategie an das Modul B auszugeben. Das Modul B ist dazu eingerichtet, die Suchstrategie von dem Modul A zu erhalten und nach einem Handlungskandidaten zu suchen, der eine hohe Eignung fB(a) aufweist, die darstellt, wie der Handlungskandidat a zu dem Ziel passt.
  • Zuerst wird ein Fall betrachtet, bei dem das Modul A, wie im oberen Teil von 10(a) gezeigt, „einen Handlungskandidaten a1”, dessen Eignung fA(a) den Maximalwert darstellt, als eine Suchstrategie setzt.
  • Wie im oberen Teil von 10(b) gezeigt, setzt das Modul A deshalb „den Außenbereich eines einzigen Handlungskandidaten a1”, dessen Eignung fA(a) den Maximalwert (oder den lokalen Maximalwert) darstellt, als eine Suchstrategie. Als Antwort darauf, wie zum Beispiel in dem unteren Teil von 10(b) gezeigt, sucht das Modul B nach einem die höchste Bewertung fB(a) aufweisenden Handlungskandidaten a2+ (≠ a2–) in einem Bereich als die Suchstrategie. Als Ergebnis der Erweiterung des Suchbereichs wie vorangehend beschrieben, ist es wahrscheinlicher, die optimale Lösung zu erhalten.
  • Außerdem wird ein Fall betrachtet, in dem, wie im oberen Teil von 11(a) gezeigt, das Modul A einen „Handlungskandidaten a1”, dessen Eignung fA(a) einen Maximalwert darstellt, als eine Suchstrategie setzt. In diesem Fall, wie zum Beispiel im unteren Teil von 11(a) gezeigt, sucht das Modul B nach einem Handlungskandidaten a2–, dessen Eignung fB(a) einen lokalen Maximalwert in einem einzigen Bereich um einen Handlungskandidaten a1 als die Suchstrategie darstellt. Diese Lösung ist jedoch wahrscheinlich nur eine lokale Lösung, die von der optimalen, die höchste Eignung fB(a) aufweisenden Lösung verschieden ist.
  • Wie im oberen Teil von 11(b) gezeigt, setzt das Modul A deshalb „eine Mehrzahl von Handlungskandidaten a1– und a1+”, deren Eignung fA(a) den lokalen Maximalwert darstellt, als eine Suchstrategie. Als Antwort darauf, wie zum Beispiel in dem unteren Teil von 11(b) gezeigt, sucht das Modul B nach einem die höchste Bewertung fB(a) aufweisenden Handlungskandidaten a2+ (≠ a2–) in jedem Außenbereich aus der Mehrzahl von Handlungskandidaten a1– und a1+ als Suchstrategien. Als Ergebnis der Erweiterung des Suchbereichs ist es wahrscheinlicher auf diese Weise die optimale Lösung zu erhalten.
  • (Ausführungsform)
  • Die Verhaltenszustände des Roboters R, welche durch den ZMP und durch die Lage des Schwerpunkts (dargestellt durch einen Doppelkreis) des jeweils im unteren Teil der 12(a) bis 12(c) dargestellten Roboters R dargestellt sind, können als ein Modell der Verhaltenszustände eines umgedrehten, jeweils im oberen Teil der 12(a) bis 12(c) dargestellten Pendels betrachtet werden, welche durch die Landeposition und die Lage des Schwerpunkts (dargestellt durch einen Doppelkreis) des umgedrehten jeweils im oberen Teil der 12(a) bis 12(c) dargestellten Pendels.
  • Ein Experiment wurde deshalb durchgeführt, bei dem das Pendel bewegt wurde, während es von oben aufgehängt wurde, wobei dessen oberes Ende frei verlagerbar war. Zuerst, wie in 13(a) dargestellt, wird das umgedrehte Pendel von der Startposition (Zeit t = 0) in Bewegung versetzt und danach wird eine Störung (eine erhaltene Kraft infolge eines Kontakts mit einem Objekt) auf das umgedrehte Pendel übertragen (Zeit t = t0). Das umgedrehte Pendel bewegt sich entlang einer neuen Route (t = t1), während es versucht, die Haltung als Antwort auf die Störung zu stabilisieren, bewegt sich weiter, während es einen Kontakt mit einem Objekt vermeidet (Zeit t = t2) und die Zielposition erreicht (Zeit t = t3).
  • Vorangehend, wie in 13(b) dargestellt, wurden Berechnungen durchgeführt, um nach diskreten Landepositionen als erste Handlungskandidaten zu suchen, wobei ein individueller Filter verwendet wurde. Die Individuen werden durch einzelne, eine wolkenförmige Masse darstellende Punkte dargestellt, welche oberhalb des mit Quadraten gekennzeichneten Bodens angeordnet ist, und die Höhe vom Boden die Größe der ersten Gesamteignung f1 darstellt. In diesem Fall stellen die von den entlang des Wolkenkamms angeordneten Punkte vertikal auf den Boden projizierten Punkte die Landepositionen als die erste Handlungsreserve oder die erste Handlungsrichtlinie dar.
  • Da die Verhaltenszustände des Roboters R, wie vorangehend beschrieben, gemäß den Verhaltenszuständen des umgedrehten Pendels modelliert sind, ist es möglich, die Handlungen des Roboters R unter Verwendung des Modells zu regeln/steuern. Dies ermöglicht es dem Roboter R, sich in der gleichen Weise wie das umgedrehte Pendel, wie in 14 dargestellt, zu verhalten. Insbesondere wird der Roboter R zuerst von der Startposition (Zeit t = 0) in Bewegung versetzt und dann wird eine Störung auf den Roboter R übertragen (Zeit t = t0). Der Roboter R bewegt sich entlang einer neuen Route (t = t1), während er versucht, die Haltung als Antwort auf die Störung zu stabilisieren, bewegt sich weiter, während er einen Kontakt mit einem Objekt vermeidet (Zeit t = t2) und die Zielposition erreicht (Zeit t = t3).
  • (Betrieb und Wirkung eines Roboters R der vorliegenden Erfindung und Regelungs-/Steuerungssystem hierfür)
  • Gemäß des die vorangehenden Funktionen implementierenden Roboters R, werden Handlungskandidaten des Roboters R, welcher ein geregeltes/gesteuertes Objekt ist, mit jedem aus der Mehrzahl von Modulen modi (i = 1, 2, 3...) gesucht, denen gestattet ist dem Hauptziel, das hauptsächlich unter die Zuständigkeit jedes Moduls fällt, Priorität zu gewähren, während Teilziele, die hauptsächlich unter die Zuständigkeit anderer Module fallen, berücksichtigt werden (siehe Schritte 110, 210 und 310 in 5). Auf diese Weise ist es möglich nach Handlungskandidaten des geregelten/gesteuerten Objekts zu suchen, wobei die Ziele lose unter den verschiedenen Modulen geteilt sind.
  • Außerdem wird eine Mehrzahl von Zukunftszuständen des geregelten/gesteuerten Objekts gemäß dem gesuchten Handlungskandidaten vorhergesagt, welche dem von einem hochrangigen Modul (wenigstens dem Regelungs-/Steuerungsmodul mod0) vorhergesagten Zukunftszustand folgen (siehe Schritte 120, 220 und 320 in 5).
  • Außerdem wird einem hochrangigen Ziel, das hauptsächlich unter die Zuständigkeit eines hochrangigen Moduls einer hohen Frequenz fällt, Priorität über ein niederrangiges Modul, das hauptsächlich unter die Zuständigkeit eines niederrangigen Moduls einer niedrigen Frequenz fällt, gewährt, um die Gesamteignung für das Hauptziel, das unter die Zuständigkeit des hochrangigen Moduls fällt, und die Teilziele auf der Grundlage der entsprechenden Zukunftszustände zu bewerten (siehe Schritte 130, 230 und 330 in 5). Dabei werden die Handlungen des Roboters R geregelt/gesteuert, wobei das Hauptziel, das hauptsächlich unter die Zuständigkeit des hochrangigen Moduls einer hohen Frequenz fällt, gegenüber dem niederrangigen Ziel, das hauptsächlich unter die Zuständigkeit des niederrangigen Moduls fällt, vorrangig berücksichtigt wird.
  • Im Falle einer Störung (siehe Zeit t = t0 in 4) wird deshalb anfangs das hochrangige Ziel, das hauptsächlich unter die Zuständigkeit des hochrangigen, kurze Ansprechzeiten aufweisenden Moduls fällt, in der Handlungsform des geregelten/gesteuerten Objekts berücksichtigt, um den Effekt der Störung schnell zu reduzieren (siehe Zeit t = t1 in 4). Darüber hinaus werden im Laufe der Zeit niederrangige Ziele, die hauptsächlich unter die Zuständigkeit der niederrangigen, lange Ansprechzeiten aufweisenden Module fallen, in den Handlungsformen des geregelten/gesteuerten Objekts berücksichtigt, um die zu der Mehrzahl von Zielen passenden Handlungsformen des geregelten/gesteuerten Objekts wiederherzustellen (siehe Zeit t = t2 und t = t3 in 4). Das ermöglicht dem Roboter R, im Hinblick auf die Handlungsziele des Roboters R einer Störung einer beliebigen Art in einer angemessenen Form entgegenzuwirken.
  • Insbesondere wird die j-te Eignung ej zu einem festen Wert „1” in Bezug zu dem j-ten Handlungskandidaten ajk, dessen Abweichung von dem gemäß dem j-ten Ziel in dem Zustandsraum definierten Referenzpunkt innerhalb des j-ten Schwellwerts ist, unter allen von dem j-ten Modul (j = 1, 2, 3 in der vorangehenden Ausführungsform) gesuchten j-ten Handlungskandidaten bewertet, mit anderen Worten, in Bezug zu dem j-ten Handlungskandidaten ajk, der in der j-ten vorgegebenen Gruppe von Handlungskandidaten umfasst ist (siehe Gleichungen (111), (221) und (331) und 6(b), 7(b) und 8(b)). Dieser konstante Wert ist nicht auf „1” beschränkt, sondern kann einen beliebigen Wert annehmen. Andererseits wird die j-te Eignung ej in Bezug zu dem j-ten Handlungskandidaten ajk, der nicht in der j-ten vorgegebenen Gruppe von Handlungskandidaten umfasst ist, zu einem Wert bewertet, der kleiner als der feste Wert ist. Insbesondere werden in einem von einer Mehrzahl von j-ten Handlungskandidaten definierten Raum (der j-te Lösungsraum) eine Region (flache Region), in der die j-te Eignung ej zu einem festen Wert bewertet wird, und eine Region, in der die j-te Eignung kleiner als der feste Wert ist, gebildet. Die Konfiguration basiert auf einem Konzept, dass der j-te, zu dem j-ten Ziel bis zu einem gewissen Grad passende Handlungskandidat ajk als ungefähr eine der j-ten Eignung äquivalente Eignung aufweisend betrachtet werden kann.
  • In Bezug zu einem ersten durch ZMPbias definierten, den ersten Handlungskandidaten bestimmenden Lösungsraum, wird der Bereich 0 ≤ ZMPbias ≤ αLfoot, wie in 6(b) dargestellt, als eine flache Region definiert, in welcher die erste Eignung e1 ein fester Wert „1” ist und der Bereich aLfoot < ZMPbias wird als eine Neigungsregion definiert, in welcher die erste Eignung e1 allmählich von dem festen Wert „1” sinkt.
  • In Bezug zu einem zweiten durch C–1 definierten, den zweiten Handlungskandidaten bestimmenden Lösungsraum, wird der Bereich 0 ≤ C–1 ≤ β(Robject)–1, wie in 7(b) dargestellt, als eine flache Region definiert, in welcher die zweite Eignung e2 ein fester Wert „1” ist und der Bereich β(Robject)–1 ≤ C–1 wird als eine Neigungsregion definiert, in welcher die zweite Eignung e2 allmählich von dem festen Wert „1” sinkt.
  • In Bezug zu einem dritten durch L definierten, den dritten Handlungskandidaten bestimmenden Lösungsraum, wird der Bereich Ldest ≤ L ≤ γLdest, wie in 8(b) dargestellt, als eine flache Region definiert, in welcher die dritte Eignung e3 ein fester Wert „1” ist und der Bereich Ldest ≤ L wird als eine Neigungsregion definiert, in welcher die dritte Eignung e3 allmählich von dem festen Wert „1” sinkt.
  • Die Bildung der flachen Region dehnt eine Region aus, in der es möglich ist, nach einer Lösung zu suchen, deren Gesamteignung das Maximum oder das lokale Maximum in dem j-ten Lösungsraum ist. Daher, wenn das hochrangige Modul dazu eingerichtet ist, einen niederrangigen Handlungskandidaten, dessen niederrangige Gesamteignung das Maximum oder das lokale Maximum ist, als eine niederrangige Handlungsrichtlinie von dem niederrangigen Modul zu empfangen und den Näherungsgrad an die niederrangige Handlungsrichtlinie als geschätzte niederrangige Eignung in Bezug zu jedem der von dem hochrangigen Modul gesuchten Handlungskandidaten zu bewerten, wird die Region, in welcher das hochrangige Modul nach den Lösungen in dem Lösungsraum suchen kann, ausgedehnt (siehe 10 und 11).
  • Darüber hinaus ist es in Bezug zu der Mehrzahl von j-ten Handlungskandidaten, die in der flachen Region in dem j-ten Lösungsraum umfasst sind, nicht nötig, die Überlegenheit und die Unterlegenheit in Abhängigkeit von dem Grad der j-ten Eignung ej zu berücksichtigen. Dies verhindert, dass eine Lösung gesucht wird, die die j-te Eignung mehr als nötig erhöht und verhindert daher übermäßige Optimierung der Betriebsregelung/-steuerung des geregelten/gesteuerten Objekts. Darüber hinaus muss das j-te Modul nur nach den j-ten Handlungskandidaten suchen, deren Gesamteignung das Maximum oder das lokale Maximum ist gemäß der Eignung im Hinblick auf die Teilziele, die hauptsächlich unter der Zuständigkeit anderer Module (ein oder beide der (j – 1)-ten Module und das (j + 1)-te Modul) fallen. Mit anderen Worten ist es möglich das j-te Modul dazu zu veranlassen, sich auf die Suche nach einer Lösung zu fokussieren, welche die Eignung im Hinblick auf die Teilziele statt dem Hauptziel erhöht.
  • Entsprechend ist es möglich, die j-te Gesamteignung zu bewerten oder zu berechnen, während versucht wird, die arithmetische Operationslast jedes Moduls modj zur Bewertung der j-ten Eignung ej zu reduzieren und folglich eine frühzeitige Berechnung eines arithmetischen Operationsergebnisses zu ermöglichen (siehe Gleichungen (141), (142), (241), (242), (341) und (342)). Dies ermöglicht dem Roboter R schnell auf eine Störung einer beliebigen Art in angemessener Weise im Hinblick auf das Handlungsziel des Roboters R als ein geregeltes/gesteuertes Objekt zu reagieren oder handeln.
  • (Andere Ausführungsform der vorliegenden Erfindung)
  • Das geregelte/gesteuerte Objekt kann mit Ausnahme eines Roboters R (siehe 1) eine Vorrichtung jeglicher Art sein, die einen Aktuator, so wie Fahrzeug aufweist.
  • Obwohl in der vorangehenden Ausführungsform drei Module bereitgestellt sind, können zwei Handlungssuchmodule oder vier oder mehr Handlungssuchmodule verwendet werden.
  • Wenn das Regelungs-/Steuerungssystem 1 nur das erste Modul mod1 und das zweite Modul mod2 umfasst, wird die zweite Gesamteignung f2(a2) gemäß einer Bewertungsgleichung (244) auf der Grundlage der zweiten Eignung e2(ai2) und der ersten Eignung e1(ai2) bewertet. f2(ai2) = e2(ai2)(e1(ai2) + 1) (244)
  • Wenn das Regelungs-/Steuerungssystem 1 ferner ein viertes Modul mod4 eines höheren Rangs (einer längeren Betriebsdauer) als das dritte Modul mod3 als ein Bestandteil des Regelungs-/Steuerungssystems 1 umfasst, wird die dritte Gesamteignung f3(ai3) gemäß einer Bewertungsgleichung (343) ähnlich der Bewertungsgleichung (241) für die zweite Gesamteignung f2(ai2) bewertet. f3(ai3) = e3(ai3)(e2(ai3)(e4^(ai3) + 1) + 1) (343)
  • In diesem Fall bewertet das vierte Modul mod4 die vierte Gesamteignung f4(ai4) gemäß einer Bewertungsgleichung ähnlich der Bewertungsgleichung (34) der dritten Gesamteignung f3(ai3).
  • Darüber hinaus, wenn das Regelungs-/Steuerungssystem 1 vier Handlungssuchmodule als dessen Komponenten umfasst, kann die zweite Gesamteignung f2(ai2) ferner gemäß einer Bewertungsgleichung (244) auf der Grundlage der zweiten Eignung f2(ai2), der ersten Eignung f1(ai2), der dritten geschätzten Eignung e3^(ai2) und ferner der vierten geschätzten Eignung e4^(ai2) bewertet werden. f2(ai2) = e2(ai2) x(e1(ai2)(e3^(ai2)(e4^(ai2) + 1) + 1) + 1) (244)
  • Wenn das Regelungs-/Steuerungssystem 1 fünf oder mehr Handlungssuchmodule als Komponenten umfasst, kann die Gesamteignung des intermediären Moduls basierend auf dem gleichen Konzept berechnet werden.

Claims (24)

  1. Regelungs-/Steuerungssystem umfassend eine Mehrzahl von entsprechend der Lage eines Frequenzbandes hierarchisch organisierten Modulen (mod1, mod2, mod3), wobei: jedes der Module (mod1, mod2, mod3) dazu eingerichtet ist, in Antwort auf einen aktuellen Zustand eines geregelten/gesteuerten Objekts (R), der eine Störung des geregelten/gesteuerten Objekts enthält, nach einer Mehrzahl von Handlungskandidaten (ai1, ai2, ai3) zu suchen, welche Kandidaten für eine zu einem Hauptziel und einem Teilziel passende Handlungsform des geregelten/gesteuerten Objekts (R) sind, und die Gesamteignung (f1, f2, f3) im Hinblick auf sowohl das Hauptziel als auch das Teilziel in einer derartigen Weise zu bewerten, dass der Beitrag einer Haupteignung zu einem Hauptziel, das hauptsächlich unter die Zuständigkeit des Moduls fällt, größer als der Beitrag einer Teileignung zu dem Teilziel eines sonstigen Moduls in Bezug zu jedem der Handlungskandidaten (ai1, ai2, ai3) ist; und das Regelungs-/Steuerungssystem (1) dazu eingerichtet ist, einen Betrieb des geregelten/gesteuerten Objekts (R) in einer Form zu regeln/steuern, welche ein durch ein hochrangiges Modul einer hohen Frequenz erhaltenes Bewertungsergebnis der Gesamteignung gegenüber einem durch ein niederrangiges Modul einer niedrigen Frequenz erhaltenes Bewertungsergebnis der Gesamteignung vorrangig berücksichtigt.
  2. Regelungs-/Steuerungssystem nach Anspruch 1, wobei ein intermediäres Modul (mod2) mit Ausnahme eines Moduls (mod1) eines höchsten Ranges der höchsten Frequenz und eines Moduls (mod3) eines niedrigsten Ranges der niedrigsten Frequenz, dazu eingerichtet ist, die Gesamteignung (f2) in einer derartigen Weise zu bewerten, dass hochrangige Eignung (f1) im Hinblick auf ein hochrangiges Ziel einen größeren Beitrag hat als niederrangige Eignung (f3) im Hinblick auf ein niederrangiges Ziel in Bezug zu jedem der Handlungskandidaten (ai2), wobei das hochrangige Ziel, das hauptsächlich unter die Zuständigkeit des hochrangigen Moduls (mod1) einer Frequenz fällt, die höher als das Modul (mod2) ist, und das niederrangige Ziel, das hauptsächlich unter die Zuständigkeit des niederrangigen Moduls (mod3) einer Frequenz fällt, die niedriger als das Modul (mod2) ist, die Teilziele sind.
  3. Regelungs-/Steuerungssystem nach Anspruch 2, wobei das hochrangige Modul (mod1) und das intermediäre Modul (mod2) jeweils dazu eingerichtet sind, die geschätzte niederrangige Eignung (e2^, e3^) durch Abschätzen der niederrangigen Eignung (e2, e3) in Bezug zu jedem der Handlungskandidaten (ai1, ai2) zu bewerten und die Gesamteignung (f2, f3) mit der geschätzten niederrangigen Eignung (e2^, e3^) als die niederrangige Eignung (e2, e3) zu bewerten.
  4. Regelungs-/Steuerungssystem nach Anspruch 3, wobei das hochrangige Modul (mod1) und das intermediäre Modul (mod2) jeweils dazu eingerichtet sind, unter niederrangigen Handlungskandidaten (a), die jeweils von dem intermediären Modul (mod2), dessen Frequenz niedriger als die des hochrangigen Moduls (mod1), oder dem intermediären Modul (mod2) und dem niederrangigen Modul (mod3) gesucht sind, einen niederrangigen Handlungskandidaten zu erhalten, dessen von dem niederrangigen Modul (mod3) bewertete niederrangige Gesamteignung (fA) ein Maximum (a1) oder ein lokales Maximum (a1–, a1+), als eine niederrangige Handlungsrichtlinie von dem jeweiligen intermediären Modul (mod2) und dem niederrangigen Modul (mod3), ist, und einen Näherungsgrad an die niederrangige Handlungsrichtlinie als die geschätzte niederrangige Eignung in Bezug zu jedem der vom niederrangigen Modul (mod3) gesuchten Handlungskandidaten (a) zu bewerten.
  5. Regelungs-/Steuerungssystem nach Anspruch 3, ferner umfassend ein erstes bis N-tes Modul als die Mehrzahl von Modulen, wobei: ein erstes Modul (mod1) als das Modul eines höchsten Ranges dazu eingerichtet ist, eine erste Eignung e1 (e1) für ein erstes Ziel als das Hauptziel in Bezug zu jedem von ersten Handlungskandidaten (ai1) als die von dem ersten Modul (mod1) gesuchten Handlungskandidaten (ai1) zu bewerten, eine zweite geschätzte Eignung e2^ (e2^) durch Abschätzen der Eignung für ein zweites Ziel eines zweiten Moduls (mod2) als ein niederrangiges Modul zu bewerten und anschließend eine erste Gesamteignung f1 (f1) gemäß einer Bewertungsgleichung f1 = e1(e2^ + 1) zu bewerten; ein i-tes Modul (mod2) (i = 2 bis N – 1) als das intermediäre Modul dazu eingerichtet ist, eine i-te Eignung ei (e2) im Hinblick auf ein i-tes Ziel als das N Hauptziel in Bezug zu jedem der i-ten Handlungskandidaten (ai2) als die von dem i-ten Modul (mod2) gesuchten Handlungskandidaten (ai2) zu bewerten, eine (i – 1)-te Eignung ei-1, (e2) im Hinblick auf das (i – 1)-te Ziel als das Ziel höchsten Ranges zu bewerten, eine (i + 1)-te geschätzte Eignung ei+1^(e3^) durch Abschätzen einer Eignung im Hinblick auf ein (i + 1)-tes Ziel als das niederrangige Ziel zu bewerten und anschließend die i-te Gesamteignung fi (f2) gemäß einer Bewertungsgleichung fi = ei(ei(e1-i^ + 1) + 1) zu bewerten; und ein N-tes Modul (mod3) als das niederrangigste Modul dazu eingerichtet ist, eine N-te Eignung eN (e3) für ein N-tes Ziel als das Hauptziel in Bezug zu jedem von N-ten Handlungskandidaten (ai3) als die von dem N-ten Modul (mod3) gesuchten Handlungskandidaten (ai3) zu bewerten, die (N – 1)-te Eignung eN-1 (e2) eines (N – 1)-ten Moduls (mod2) als das hochrangige Modul zu bewerten und anschließend die i-te Gesamteignung fi gemäß einer Bewertungsgleichung fN = eN(eN-1 + 1) zu bewerten.
  6. Regelungs-/Steuerungssystem nach Anspruch 5, wobei das j-te Modul (mod1, mod2, mod3) 0 = 1, 2, ..., N) dazu eingerichtet ist, eine j-te Eignung ej (e1, e2, e3) für ein j-tes Ziel als das Hauptziel zu einem festen Wert in Bezug zu j-ten Handlungskandidaten (ai1, ai2, ai3), die in einer unter allen j-ten Handlungskandidaten (ai1, ai2, ai3), als die von dem j-ten Modul (mod1, mod2, mod3) gesuchten Handlungskandidaten (ai1, ai2, ai3), vorgegebenen j-ten Gruppe von Handlungskandidaten umfasst sind, zu bewerten, während die j-te Eignung ej (e1, e2, e3) zu einem niedrigeren Wert als der feste Wert in Bezug zu den j-ten Handlungskandidaten, die nicht in der unter allen j-ten Handlungskandidaten (ai1, ai2, ai3) vorgegebenen j-ten Gruppe von Handlungskandidaten umfasst sind, bewertet wird.
  7. Regelungs-/Steuerungssystem nach Anspruch 6, wobei das j-te Modul (mod1, mod2, mod3) dazu eingerichtet ist, die j-te Eignung ej (e1, e2, e3) zu dem festen Wert zu bewerten, mit den j-ten Handlungskandidaten, deren Abweichung von einem in einem für das j-te Ziel angemessenen Zustandsraum definierten Referenzpunkt, unter all den Handlungskandidaten (ai1, ai2, ai3) als die in der vorgegebenen j-ten Gruppe von Handlungskandidaten umfassten j-ten Handlungskandidaten, gleich einem oder kleiner als ein j-ter Schwellwert (αLfoot, βRobject –1, yLdest) ist, während die j-te Eignung ej (e1, e2, e3) gemäß einer fallenden Funktion, in welcher die Abweichung kontinuierlich oder fortschreitend ist auf der Grundlage der Abweichung in Bezug zu den j-ten Handlungskandidaten, die nicht in der unter all den j-ten Handlungskandidaten (ai1, ai2, ai3) vorgegebenen j-ten Gruppe von Handlungskandidaten umfasst sind, bewertet wird.
  8. Regelungs-/Steuerungssystem nach Anspruch 1, wobei jedes der Module (mod1, mod2, mod3) dazu eingerichtet ist, nach Handlungskandidaten (ai1, ai2, ai3) zu suchen, welche Handlungskandidaten (ai1, ai2, ai3) für die zu dem Hauptziel und dem Teilziel passenden Handlungsform des geregelten/gesteuerten Objekts (R) sind, während dem Hauptziel Priorität über das Teilziel gewährt wird.
  9. Regelungs-/Steuerungssystem nach Anspruch 8, wobei jedes der Module (mod1, mod2, mod3) dazu eingerichtet ist, eine gegenwärtige Suche nach den Handlungskandidaten (ai1, ai2, ai3) des geregelten/gesteuerten Objekts (R) gemäß einer Suchstrategie durchzuführen, die auf einem vormaligen von dem Modul (mod1, mod2, mod3) erhaltenen Suchergebnis und auf einem vormaligen von dem sonstigen Modul erhaltenen Suchergebnis der Handlungskandidaten (ai1, ai2, ai3) des geregelten/gesteuerten Objekts (R) basiert, während dem vormaligen Suchergebnis der Handlungskandidaten (ai1, ai2, ai3) des geregelten/gesteuerten Objekts (R) durch das Modul Priorität über das vormalige Suchergebnis der Handlungskandidaten (ai1, ai2, ai3) des geregelten/gesteuerten Objekts (R) durch das sonstige Modul gewährt wird.
  10. Regelungs-/Steuerungssystem nach Anspruch 9, wobei jedes der Module dazu eingerichtet ist, einen Teil der bei dem vorherigen Mal gesuchten Handlungskandidaten (ai1, ai2, ai3) mit höherer Wahrscheinlichkeit auszuwählen, wenn die bei dem vorherigen Mal bewertete Gesamteignung (f1, f2, f3) höher ist und die gegenwärtige Suche nach den Handlungskandidaten (ai1, ai2, ai3) in einem Außengebiet der ausgewählten Handlungskandidaten (ai1, ai2, ai3) in dem durch die Handlungskandidaten (ai1, ai2, ai3) definierten Zustandsraum durchzuführen.
  11. Regelungs-/Steuerungssystem nach Anspruch 10, wobei jedes der Module (mod1, mod2, mod3) dazu eingerichtet ist, die gegenwärtige Suche nach den Handlungskandidaten (ai1, ai2, ai3) in einem engeren Außengebiet durchzuführen, wenn die bei dem vorhergehenden Mal bewertete Gesamteignung (f1, f2, f3) in Bezug zu den Handlungskandidaten (ai1, ai2, ai3), die aus den in dem vorhergehenden Mal in dem Zustandsraum gesuchten Handlungskandidaten (ai1, ai2, ai3) ausgewählt sind, höher ist.
  12. Regelungs-/Steuerungssystem nach Anspruch 10, wobei jedes der Module (mod1, mod2, mod3) dazu eingerichtet ist, die gegenwärtige Suche nach den Handlungskandidaten (ai1, ai2, ai3) zusätzlich zu dem Außenbereich der aus den bei dem vorhergehenden Mal gesuchten Handlungskandidaten (ai1, ai2, ai3) ausgewählten Handlungskandidaten (ai1, ai2, ai3) in einem Außenbereich von unregelmäßig ausgewählten Punkten in dem Zustandsraum durchzuführen.
  13. Regelungs-/Steuerungssystem nach Anspruch 12, wobei jedes der Module (mod1, mod2, mod3) dazu eingerichtet ist, nach den Handlungskandidaten (ai1, ai2, ai3) des geregelten/gesteuerten Objekts (R) mit einem hochrangigen Modul als das sonstige Modul zu suchen, falls es ein um einen Rang höheres Modul als das Modul gibt, und mit einem niederrangigen Modul als das sonstige Modul, falls es ein um einen Rang niedrigeres Modul als das Modul gibt.
  14. Regelungs-/Steuerungssystem nach Anspruch 8, wobei: jedes der Module (mod1, mod2, mod3) dazu eingerichtet ist, die Handlungskandidaten (ai1, ai2, ai3) zu suchen, welche die Position oder die Position und Haltung einer sich bewegenden Vorrichtung als das geregelte/gesteuerte Objekt (R) bestimmen; und jedes der Module (mod1, mod2) dazu eingerichtet ist, die Handlungskandidaten (ai1, ai2) der sich bewegenden Vorrichtung (R) für eine im Vergleich zu dem niederrangigen Modul (mod3) einer niedrigen Frequenz kürzere Dauer (T1, T2) zu suchen, wenn die Frequenz des hochrangigen Moduls (mod1, mod2) höher ist.
  15. Regelungs-/Steuerungssystem nach Anspruch 14, umfassend, als die Mehrzahl von Modulen, ein erstes Modul (mod1), ein zweites Modul (mod2) und ein drittes Modul (mod2), die dazu eingerichtet sind, die Positionstrajektorie oder die Positionstrajektorie und Haltungstrajektorie eines Roboters (R), als die sich bewegende Vorrichtung zu suchen, der als Handlungskandidaten (ai1, ai2, ai3) einen Rumpf (B0) und eine Mehrzahl von sich von dem Rumpf (B0) erstreckenden Beinen (B4) aufweist, wobei: das erste Modul (mod1) dazu eingerichtet ist, einen Gang über eine erste vorgegebene Anzahl (q1) von Schritten des Roboters (R) zu suchen, um als ein erster Handlungskandidat (ai1) den Roboter (R) dazu zu veranlassen die Haltung zu stabilisieren; das zweite Modul (mod2) dazu eingerichtet ist, als ein zweiter Handlungskandidat (ai2) eine lokale Route zu suchen, welche einen Gang über eine zweite vorgegebene Anzahl (q2) von Schritten bestimmt, welche größer als die erste vorgegebene Anzahl (q1) von Schritten ist, um den Roboter (R) dazu zu veranlassen einen Kontakt mit einem Objekt zu verhindern; und das dritte Modul (mod2) dazu eingerichtet ist, eine allgemeine Route zu suchen, um den Roboter (R) dazu zu veranlassen, eine Zielposition als einen dritten Handlungskandidaten (ai3) zu erreichen.
  16. Regelungs-/Steuerungssystem nach Anspruch 1, wobei jedes der Module (mod1, mod2, mod3) dazu eingerichtet ist, eine Mehrzahl von Zukunftszuständen (si1, si2, si3) des geregelten/gesteuerten Objekts gemäß jedem der von dem Modul (mod1, mod2, mod3) gesuchten Handlungskandidaten (ai1, ai2, ai3) vorherzusagen und die Gesamteignung (f1, f2, f3) auf der Grundlage jedes der Zukunftszustände (si1, si2, si3) in Bezug zu jedem der Handlungskandidaten (ai1, ai2, ai3) zu bewerten.
  17. Regelungs-/Steuerungssystem nach Anspruch 16, wobei: das Modul, das ein hochrangiges Modul einer höheren Frequenz als das Modul aufweist, dazu eingerichtet ist, weitere Zukunftszustände des geregelten/gesteuerten Objekts vorherzusagen, die auf die von dem hochrangigen Modul vorhergesagten Zukunftszustände des geregelten/gesteuerten Objekts (R) folgen; der Betrieb des geregelten/gesteuerten Objekts (R) dazu eingerichtet ist, in einer Form geregelt/gesteuert zu werden, welche das von dem hochrangigen Modul (mod1) einer hohen Frequenz erhaltene Bewertungsergebnis der Gesamteignung (f,) gegenüber dem Bewertungsergebnis der Gesamteignung (f2, f3) des niederrangigen Moduls (mod2, mod3) einer niedrigen Frequenz vorrangig berücksichtigt.
  18. Regelungs-/Steuerungssystem nach Anspruch 17, wobei jedes der Module (mod1, mod2) dazu eingerichtet ist, die Handlungskandidaten (ai1, ai2) der sich bewegenden Vorrichtung über eine im Vergleich zu dem niederrangigen Modul (mod3) einer niedrigen Frequenz kürzere Dauer (T1, T2) zu suchen, wenn die Frequenz des hochrangigen Moduls (mod1, mod2) höher ist.
  19. Regelungs-/Steuerungssystem nach Anspruch 18, wobei wenigstens ein Modul aus der Mehrzahl von Modulen dazu eingerichtet ist, den Zustand des geregelten/gesteuerten Objekts (R) zu einem zukünftigen Zeitpunkt nach einem Ablauf einer kürzeren Dauer einer Handlungsform als die von einem Modul (mod1) einer höchsten Frequenz gemäß dem aktuellen Zustand des geregelten/gesteuerten Objekts (R) gesuchten Handlungskandidaten (ai1) als einen nächsten Zukunftszustand vorherzusagen; und jedes aus der Mehrzahl von Modulen (mod1, mod2, mod3) dazu eingerichtet ist, den auf den nächsten Zukunftszustand folgenden Zukunftszustand des geregelten/gesteuerten Objekts gemäß den von dem Modul gesuchten Handlungskandidaten (ai1, ai2, ai3) vorherzusagen.
  20. Regelungs-/Steuerungssystem nach Anspruch 18, wobei jedes der Module (mod1, mod2, mod3) dazu eingerichtet ist, die Handlungskandidaten (ai1, ai2, ai3), die die Position oder die Position und Haltung der sich bewegenden Vorrichtung als das geregelte/gesteuerte Objekt (R) bestimmen, zu suchen und die Position oder die Position und Haltung der sich bewegenden Vorrichtung als den Zukunftszustand (si1, si2, si3) des geregelten/gesteuerten Objekts (R) vorherzusagen.
  21. Regelungs-/Steuerungssystem nach Anspruch 20, umfassend, als die Mehrzahl von Modulen, ein erstes Modul (mod1), ein zweites Modul (mod2) und ein drittes Modul (mod3), die dazu eingerichtet sind, die Positionstrajektorie und Haltungstrajektorie eines Roboters (R), als die sich bewegende Vorrichtung, der als die Handlungskandidaten einen Rumpf (B0) und eine Mehrzahl von sich von dem Rumpf (B0) erstreckenden Beinen (B4) aufweist, zu suchen, wobei: das erste Modul (mod1) dazu eingerichtet ist, einen Gang über eine erste vorgegebene Anzahl (q1) von Schritten des Roboters (R) zu suchen, um den Roboter (R) dazu zu veranlassen als einen ersten Handlungskandidaten (ai1) die Haltung zu stabilisieren und die Position oder die Position und Haltung in der Zukunft des Roboters (R) gemäß jedem der ersten Handlungskandidaten (ai1) als eine Mehrzahl von ersten Zukunftszuständen (si1) vorherzusagen; das zweite Modul (mod2) dazu eingerichtet ist, eine lokale Route als einen zweiten Handlungskandidaten (ai2) zu suchen, welche einen Gang über eine zweite vorgegebene Anzahl (q2) von Schritten bestimmt, welche größer als die erste vorgegebene Anzahl (q1) von Schritten ist, um den Roboter (R) dazu zu veranlassen einen Kontakt mit einem Objekt zu verhindern und die Position oder die Position und Haltung in der Zukunft des Roboters (R) gemäß jedem der zweiten Handlungskandidaten (ai2) als eine Mehrzahl von zweiten Zukunftszuständen (si2) vorherzusagen; und das dritte Modul (mod3) dazu eingerichtet ist, eine allgemeine Route zu suchen, um den Roboter (R) dazu zu veranlassen, eine Zielposition zu erreichen oder den Roboter (R) dazu zu veranlassen die Zielposition mit einer Zielhaltung als ein dritter Handlungskandidat (ai3) zu erreichen und die Position oder die Position und Haltung in der Zukunft des Roboters (R) gemäß jedem der dritten Handlungskandidaten (ai3) als eine Mehrzahl von dritten Zukunftszuständen (si3) vorherzusagen.
  22. Regelungs-/Steuerungssystem nach Anspruch 21, wobei: wenigstens ein Modul aus dem ersten Modul (mod1), dem zweiten Modul (mod2) und dem dritten Modul (mod3) dazu eingerichtet ist, die Position oder die Position und Haltung des Roboters (R) zu einem zukünftigen Zeitpunkt nach Ablauf eines Gangs über eine Bezugsanzahl von Schritten, die kleiner als die erste vorgegebene Anzahl von Schritten ist, als den nächsten Zukunftszustand gemäß dem aktuellen Zustand des Roboters (R) vorherzusagen; und das erste Modul (mod1) dazu eingerichtet ist, die Position oder die Position und Haltung des Roboters (R) zu dem zukünftigen Zeitpunkt nach Ablauf eines Gangs über die erste vorgegebenen Anzahl von Schritten als den ersten Zukunftszustand (si1) mit dem nächsten Zukunftszustand als dem Ursprung vorherzusagen; das zweite Modul (mod2) dazu eingerichtet ist, die Positionstrajektorie oder die Positionstrajektorie und Haltungstrajektorie des sich entlang der lokalen Route bewegenden Roboters (R) als den zweiten Zukunftszustand (si2) mit dem nächsten Zukunftszustand als dem Ursprung vorherzusagen; und das dritte Modul (mod3) dazu eingerichtet ist, die Positionstrajektorie oder die Positionstrajektorie und Haltungstrajektorie des sich entlang der allgemeinen Route bewegenden Roboters (R) als den dritten Zukunftszustand (si3) mit dem nächsten Zukunftszustand als dem Ursprung vorherzusagen.
  23. Roboter, als die sich bewegende Vorrichtung, der einen Rumpf (B0) und eine Mehrzahl von sich von dem Rumpf (B0) erstreckenden Beinen (B4) aufweist, welche sich durch die Bewegungen der Beine (B4) bewegt, wobei der Roboter (R) ein Regelungs-/Steuerungssystem nach Anspruch 15 aufweist.
  24. Roboter, als die sich bewegende Vorrichtung, der einen Rumpf (B0) und eine Mehrzahl von sich von dem Rumpf (B0) erstreckenden Beinen (B4) aufweist, welche sich durch die Bewegungen der Beine (B4) bewegt, wobei der Roboter (R) ein Regelungs-/Steuerungssystem (1) nach Anspruch 21 aufweist.
DE201011000035 2009-08-03 2010-05-25 Roboter und Regelungs- /Steuerungssystem Expired - Fee Related DE112010000035B4 (de)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
JP2009-181071 2009-08-03
JP2009-181070 2009-08-03
JP2009181072 2009-08-03
JP2009-181072 2009-08-03
JP2009181070A JP5306933B2 (ja) 2009-08-03 2009-08-03 ロボットおよび制御システム
JP2009181071A JP5306934B2 (ja) 2009-08-03 2009-08-03 ロボットおよび制御システム
JP2010091801A JP5450218B2 (ja) 2009-08-03 2010-04-12 ロボットおよび制御システム
JP2010-091801 2010-04-12
PCT/JP2010/058806 WO2011016280A1 (ja) 2009-08-03 2010-05-25 ロボットおよび制御システム

Publications (2)

Publication Number Publication Date
DE112010000035T5 DE112010000035T5 (de) 2012-07-26
DE112010000035B4 true DE112010000035B4 (de) 2015-04-30

Family

ID=44647859

Family Applications (1)

Application Number Title Priority Date Filing Date
DE201011000035 Expired - Fee Related DE112010000035B4 (de) 2009-08-03 2010-05-25 Roboter und Regelungs- /Steuerungssystem

Country Status (3)

Country Link
US (1) US8849452B2 (de)
DE (1) DE112010000035B4 (de)
WO (1) WO2011016280A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102015201832B4 (de) * 2014-02-04 2017-02-02 Honda Motor Co., Ltd. Roboter mit einer Steuer-/Regeleinheit zum Erzeugen einer Gangart

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112010000035B4 (de) * 2009-08-03 2015-04-30 Honda Motor Co., Ltd. Roboter und Regelungs- /Steuerungssystem
WO2015172131A1 (en) * 2014-05-09 2015-11-12 Carnegie Mellon University Systems and methods for modular units in electro-mechanical systems
US9283678B2 (en) * 2014-07-16 2016-03-15 Google Inc. Virtual safety cages for robotic devices
US9499219B1 (en) 2014-08-25 2016-11-22 Google Inc. Touch-down sensing for robotic devices
US9623560B1 (en) * 2014-11-26 2017-04-18 Daniel Theobald Methods of operating a mechanism and systems related therewith
JP6844124B2 (ja) * 2016-06-14 2021-03-17 富士ゼロックス株式会社 ロボット制御システム
WO2018073884A1 (ja) * 2016-10-18 2018-04-26 本田技研工業株式会社 車両制御装置
CN106527433B (zh) * 2016-10-31 2019-04-05 江苏理工学院 多机器人搜救系统
WO2018087546A1 (en) * 2016-11-08 2018-05-17 Dogtooth Technologies Limited A robotic fruit picking system
CN107336246B (zh) * 2017-06-15 2021-04-30 重庆柚瓣科技有限公司 养老机器人的拟人化系统
US10676022B2 (en) 2017-12-27 2020-06-09 X Development Llc Visually indicating vehicle caution regions
US11685045B1 (en) * 2019-09-09 2023-06-27 X Development Llc Asynchronous robotic control using most recently selected robotic action data

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001129774A (ja) * 1999-11-05 2001-05-15 Honda Motor Co Ltd 脚式歩行ロボットの足部構造
JP2004167666A (ja) * 2002-08-30 2004-06-17 Sony Corp ロボット装置及びその動作制御方法
US20050197739A1 (en) * 2004-01-16 2005-09-08 Kuniaki Noda Behavior controlling system and behavior controlling method for robot
US7053579B2 (en) * 2004-08-11 2006-05-30 Sony Corporation Device and method of controlling operation of robot apparatus
US20080249662A1 (en) * 2007-04-06 2008-10-09 Honda Motor Co., Ltd. Mobile apparatus, control device and control program
US7529622B2 (en) * 2006-12-20 2009-05-05 Honda Motor Co., Ltd. Mobile apparatus, and control method thereof, control program and supervisory system therefor

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6108597A (en) * 1996-03-06 2000-08-22 Gmd-Forschungszentrum Informationstechnik Gmbh Autonomous mobile robot system for sensor-based and map-based navigation in pipe networks
US6324529B1 (en) * 1996-09-27 2001-11-27 Yamaha Hatsudoki Kabushiki Kaisha Evolutionary controlling system
US6314412B1 (en) * 1997-09-29 2001-11-06 Yamaha Hatsudoki Kabushiki Kaisha Evolutionary control of machine based on user's preference inferred from user's operation
US6865437B1 (en) * 1998-12-31 2005-03-08 Asml Holdings N.V. Robot pre-positioning in a wafer processing system
KR20020067696A (ko) * 2000-10-11 2002-08-23 소니 가부시끼 가이샤 로봇 장치와 정보 표시 시스템 및 정보 표시 방법
US6826244B2 (en) * 2001-02-27 2004-11-30 Interdigital Technology Corporation Initial cell search algorithm for 3G FDD wireless communication systems
US6967455B2 (en) * 2001-03-09 2005-11-22 Japan Science And Technology Agency Robot audiovisual system
US6459957B1 (en) * 2001-04-17 2002-10-01 Fuji Xerox Co., Ltd. Programmable smart membranes and methods therefor
JP3558222B2 (ja) 2002-03-15 2004-08-25 ソニー株式会社 ロボットの行動制御システム及び行動制御方法、並びにロボット装置
US20040166905A1 (en) * 2003-02-07 2004-08-26 Hewlett-Packard Development Company, L.P. Radio frequency linked computer architecture
EP1484716A1 (de) * 2003-06-06 2004-12-08 Sony France S.A. Eine Architektur für selbstentwickelnde Einheiten
US20050054381A1 (en) * 2003-09-05 2005-03-10 Samsung Electronics Co., Ltd. Proactive user interface
US8990688B2 (en) * 2003-09-05 2015-03-24 Samsung Electronics Co., Ltd. Proactive user interface including evolving agent
US7668376B2 (en) * 2004-06-30 2010-02-23 National Instruments Corporation Shape feature extraction and classification
US20060229822A1 (en) * 2004-11-23 2006-10-12 Daniel Theobald System, method, and software for automated detection of predictive events
JP4847036B2 (ja) * 2005-03-30 2011-12-28 キヤノン株式会社 バスアクセスを調停する制御装置およびデータ処理装置の制御方法
JP2007125631A (ja) 2005-11-01 2007-05-24 Sony Corp ロボット装置及びその行動制御方法
US7668797B2 (en) * 2006-04-07 2010-02-23 Gary Kuvich Active semiotic system for image and video understanding by robots and unmanned vehicles, methods and apparatus
KR100791382B1 (ko) * 2006-06-01 2008-01-07 삼성전자주식회사 로봇의 이동 경로에 따라 소정 영역의 특성에 관한 정보를수집하고 분류하는 방법 및 상기 영역 특성에 따라제어되는 로봇, 상기 영역 특성을 이용한 ui 구성 방법및 장치
US7756911B2 (en) * 2006-06-09 2010-07-13 International Business Machines Corporation Method and system for executing a task and medium storing a program therefor
US7801644B2 (en) * 2006-07-05 2010-09-21 Battelle Energy Alliance, Llc Generic robot architecture
US7620477B2 (en) * 2006-07-05 2009-11-17 Battelle Energy Alliance, Llc Robotic intelligence kernel
US8554270B2 (en) * 2006-08-16 2013-10-08 Broadcom Corporation Systems and methods for enabling coexistence of multiple wireless components operating in the same frequency band
JP4819644B2 (ja) * 2006-10-12 2011-11-24 株式会社日立製作所 情報処理システム、情報処理方法、情報処理装置
US20080131255A1 (en) * 2006-11-30 2008-06-05 Transbotics Corporation Palletizing systems and methods
JP4682217B2 (ja) * 2007-03-07 2011-05-11 パナソニック株式会社 行動制御装置、方法、プログラム
US8588773B2 (en) * 2008-08-04 2013-11-19 Qualcomm Incorporated System and method for cell search and selection in a wireless communication system
JP4892021B2 (ja) * 2009-02-26 2012-03-07 株式会社東芝 信号帯域拡張装置
US8223693B2 (en) * 2009-06-23 2012-07-17 Mediatek Inc. PTA method and apparatus utilizing the same
DE112010000035B4 (de) * 2009-08-03 2015-04-30 Honda Motor Co., Ltd. Roboter und Regelungs- /Steuerungssystem
US8514802B2 (en) * 2011-05-04 2013-08-20 Nokia Corporation Method to evaluate fairness of resource allocations in shared bands

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001129774A (ja) * 1999-11-05 2001-05-15 Honda Motor Co Ltd 脚式歩行ロボットの足部構造
JP2004167666A (ja) * 2002-08-30 2004-06-17 Sony Corp ロボット装置及びその動作制御方法
US20050197739A1 (en) * 2004-01-16 2005-09-08 Kuniaki Noda Behavior controlling system and behavior controlling method for robot
US7053579B2 (en) * 2004-08-11 2006-05-30 Sony Corporation Device and method of controlling operation of robot apparatus
US7529622B2 (en) * 2006-12-20 2009-05-05 Honda Motor Co., Ltd. Mobile apparatus, and control method thereof, control program and supervisory system therefor
US20080249662A1 (en) * 2007-04-06 2008-10-09 Honda Motor Co., Ltd. Mobile apparatus, control device and control program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102015201832B4 (de) * 2014-02-04 2017-02-02 Honda Motor Co., Ltd. Roboter mit einer Steuer-/Regeleinheit zum Erzeugen einer Gangart

Also Published As

Publication number Publication date
US20110231017A1 (en) 2011-09-22
WO2011016280A1 (ja) 2011-02-10
US8849452B2 (en) 2014-09-30
DE112010000035T5 (de) 2012-07-26

Similar Documents

Publication Publication Date Title
DE112010000035B4 (de) Roboter und Regelungs- /Steuerungssystem
Min et al. Deep distributional reinforcement learning based high-level driving policy determination
DE102017129665B3 (de) Kollisionsfreie Bewegungsplanung bei geschlossener Kinematik
EP2563553B1 (de) Verfahren und steuermittel zum steuern eines roboters
DE102016002904B4 (de) Robotersystem
DE602005005306T2 (de) Steuerung der Bahn eines Greifers
DE112019003164T5 (de) Steuersystem eines Fahrzeugs und Steuerverfahren zum Steuern der Bewegung eines Fahrzeugs
DE112017000787T5 (de) Verfahren zum Steuern der Bewegung eines Fahrzeugs und Fahrzeugsteuersystem
DE112014006561T5 (de) Routenvorausberechunungseinrichtung
DE102018006248A1 (de) Steuervorrichtung und Lernvorrichtung
DE102015106227B3 (de) Steuern und/oder Regeln von Motoren eines Roboters
DE102018001571B4 (de) Laserverarbeitungsgerät und Vorrichtung zum maschinellen Lernen
DE102014200031A1 (de) Adaptives aktives Aufhängungssystem mit Straßenvorschau
DE112021001104T5 (de) Bewegungsplanungsverfahren mit kollisionsvermeidung für industrieroboter
DE112012006667B4 (de) Fahrzeug - Fahrt -Steuer-/Regeleinrichtung
EP3621845A1 (de) Verfahren und systeme zum energieaustausch zwischen fahrzeugen
DE102019112043B4 (de) Robotersystem
DE112017003961B4 (de) Steuerung für Parallelverbindungsmechanismus
DE102020120116B4 (de) Verfahren zur impedanzbasierten Multi-Tasking Tracking-Regelung, impedanzbasierter Multi-Tasking Tracking-Regler und kraft- und/oder drehmomentgeregelter Roboter
DE602004011611T2 (de) System und Methode zur automatischen Kollisionsvermeidung für Flugzeuge
DE102018215560A1 (de) Verfahren zum Koordinieren und Überwachen von Objekten
DE102017200580A1 (de) Verfahren zur Optimierung einer Manöverplanung für autonom fahrende Fahrzeuge
DE112019006409T5 (de) Pfadbestimmungsverfahren
DE102006014915A1 (de) Verfahren zum rechnergestützten Erstellen von Verarbeitungsvorschriften für die Steuerung von Kraftfahrzeuginsassen-Schutzsystemen
DE112019006440T5 (de) Pfad-Bestimmungsvorrichtung, Roboter und Pfad-Bestimmungsverfahren

Legal Events

Date Code Title Description
R163 Identified publications notified
R012 Request for examination validly filed
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: B25J0013000000

Ipc: B25J0009160000

Effective date: 20120802

R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee