DE102022107587A1

DE102022107587A1 - Verfahren zur Gangsteuerung eines Roboters, Regler, Computerprogramm und Robotersystem

Info

Publication number: DE102022107587A1
Application number: DE102022107587.7A
Authority: DE
Inventors: Robert Schuller; Christian Ott; George Mesesan; Johannes Englsberger; Jinoh Lee
Original assignee: Deutsches Zentrum fuer Luft und Raumfahrt eV
Current assignee: Deutsches Zentrum fuer Luft und Raumfahrt eV
Priority date: 2022-03-30
Filing date: 2022-03-30
Publication date: 2023-10-05

Abstract

Ein Verfahren zur Gangsteuerung eines Roboters, mit den Schritten: a) Bereitstellen einer geplanten Aufgabenraumtrajektorie X, b) Bereitstellen einer geplanten Trajektorie des Druckzentrums ap, c) Berechnen einer geplanten Trajektorie des Massenzentrums x anhand der geplanten Trajektorie des Druckzentrums ap, d) Empfangen einer gemessenen Trajektorie des Massezentrums xmdes Roboters und einer gemessenen Aufgabenraumtrajektorie Xmdes Roboters, und e) Berechnen von Steuerbefehlen T für den Roboter anhand der geplanten Aufgabenraumtrajektorie X, der gemessenen Trajektorie des Massezentrums xmdes Roboters, der gemessenen Aufgabenraumtrajektorie Xmdes Roboters, der geplanten Trajektorie des Massenzentrums x und einer gelernten Information über die Trajektorie des Schwerpunktsdrehimpulses. Ferner ein Regler, ein Computerprogramm und ein Robotersystem zur Ausführung dieses Verfahrens.

Description

Die Erfindung betrifft ein Verfahren zur Gangsteuerung eines Roboters, einen Regler, ein Computerprogramm und ein Robotersystem.
Die Fortbewegung von Robotersystemen mit Beinen, insbesondere humanoiden Robotern, ist ein komplexes Problem aufgrund der unteraktuierten und nichtlinearen Natur der entsprechenden Mehrkörperdynamik und der Beschränkungen der anwendbaren Kontaktkräfte. Zur Bewältigung der Komplexität wurden reduzierte Modelle eingeführt, die sich auf die Dynamik des Massenzentrums (Center of Mass, CoM) konzentrieren. Ein bekanntes Beispiel ist das Modell des linearen inversen Pendels (Linear Inverted Pendulum, LIP) Dokument [1]. Auf der Grundlage des LIP-Modells und dem Null-Moment-Punkt (Zero-Moment Point, ZMP) Dokument [2] wurden mehrere Verfahren zur Erzeugung von CoM-Trajektorien entwickelt, z. B. Dokumente [3], [4]. Die divergente Bewegungskomponente (Divergent Component of Motion, DCM) Dokumente [5], [6], auch sofortiger Capture Point Dokument [7] genannt, wurde mit dem Ziel eingeführt, die dreidimensionale Gangerzeugung zu vereinfachen, indem der Fokus auf den instabilen Teil der CoM-Dynamik gelegt wird. Basierend auf dem DCM-Konzept können geschlossene CoM-Trajektorien effizient mittels Matrix-Vektor Berechnung erzeugt werden Dokumente [8], [9].
Bei der Verwendung des DCM-Frameworks für die Gangerzeugung wird üblicherweise angenommen, dass die Änderungsrate des Schwerpunktdrehimpulses (CAM) Null beträgt Dokument [5]. Folglich wird der verbesserte Zentroidimpulsdrehpunkt (enhanced Centroidal Momentum Pivot, eCMP) so gewählt, dass mit der gewünschten Position des Druckmittelpunkts (CoP) übereinstimmt, wie in 1 dargestellt. Diese Annahme gilt jedoch nicht für die Mehrkörperdynamik eines humanoiden Roboters, bei dem ein wesentlicher CAM durch die Bewegungen von Schwungbein und Becken erzeugt wird. Wenn der induzierte CAM nicht richtig geregelt wird, führt er zu einer Ablenkung des tatsächlichen CoP von seiner gewünschten Position. Wenn sich der CoP dem Rand der Aufstützfläche nähert, kann es zu einer Kippung des Fußes kommen, die bewirkt, dass der Roboter hinfällt.
Die Einbeziehung des gesamten Mehrkörper-CAM in die Online-Gangerzeugung ist aufgrund seiner nichtlinearen und nichtholonomen Eigenschaften weiterhin ein anhaltendes Forschungsproblem. In Dokument [10] wird eine Impulstrajektorie optimiert, einschließlich des Impulses und des Drehimpulses. Dieses Verfahren ist jedoch sehr rechenaufwändig und wird offline durchgeführt. Andere Ansätze bieten Erweiterungen des LIP-Modells für eine bessere Näherung an den Mehrkörper-CAM, Dokumente [11]-[13]. In Dokument [14] wird der CAM durch ein vereinfachtes Drei-Massen-Modell approximiert und in das DCM-Planungsframework von Dokument [5] integriert. Allerdings können diese Näherungen noch immer nicht die gesamte Komplexität der Beiträge einzelner Körpersegmente zu dem Gesamt-CAM eines Humanoiden abdecken.
Andere Verfahren berücksichtigen nicht explizit die Rotationsdynamik während der Planung, sondern kompensieren nicht modellierte Effekte, die sich aus der Diskrepanz zwischen dem LIP und dem Mehrkörpermodell ergeben. In Dokument [15] wird ein Vorschausteuerungsverfahren in Kombination mit einem dynamischen Filter verwendet. Ein erwarteter ZMP-Fehler wird für einen bestimmten Vorschauhorizont aus der Mehrkörperdynamik berechnet und eine Vorschausteuerung der zweiten Stufe wird angewandt, um die Abweichung zu berücksichtigen. In Dokument [16] wird das Verfahren erweitert, um die CoM- und ZMP-Trajektorien online innerhalb einer kürzeren Reaktionszeit anzupassen. In Dokument [17] wird die Periodizität der Gehbewegungen ausgenutzt und ein modellfreier iterative lernender Regler (Iterative Learning Controller, ILC) in Kombination mit einer Vorschausteuerung angewandt, um ZMP-Führungsverhalten sicherzustellen. In jüngster Zeit stellte Dokument [18] einen DCM-basierten ILC-Ansatz vor, um die Robustheit der Gehbewegungen durch eine online angepassten Virtual-Repellent-Point-(VRP)-Trajektorie zu verbessern. Da die gewünschte VRP-Trajektorie mit der Null-CAM-Annahme geplant wurde, weicht das tatsächliche CoP immer noch von seiner gewünschten Position während des Gehens ab.
Die Verfahren der Dokumente [14]-[17] konzentrieren sich nur auf das ZMP-Tracking, was einer Reduzierung des horizontalen (xy-Richtung) Kontaktdrehmoments in der gewünschten ZMP-Position für Gehen auf ebenem Boden entspricht Dokument [19]. Ein weiterer stark einschränkender Faktor für robustes und dynamisches Gehen sind die Kontaktdrehmomenteinschränkungen um die z-Achse in Bezug auf das Kontaktkoordinatensystem. Große Drehmomente um die z-Achse können zu Rotationsschlupf führen was das Gehen destabilisieren kann. In Dokumente [20]-[22] wird dieses Problem durch die Aufhebung des CAM um die z-Achse angegangen. Diese Ansätze zielen jedoch nicht auf die Kompensation von CoP-Tracking-Fehlern ab, die durch die Null-CAM-Annahme während der Planung verursacht werden.
Die folgenden Dokumente bilden Stand der Technik zu der vorliegenden Erfindung:

[1] S. Kajita, F. Kanehiro, K. Kaneko, K. Yokoi, and H. Hirukawa, „The 3D linear inverted pendulum mode: a simple modeling for a biped walking pattern generation,“ in Proc. IEEE/RSJ Int. Conf. Intell. Robots Syst., vol. 1, 2001, pp. 239-246 vol. 1.
[2] M. Vukobratovi 'c and J. Stepanenko, „On the stability of anthropomorphic systems,“ Mathematical Biosciences, vol. 15, no. 1, pp. 1-37, 1972.
[3] K. Harada, S. Kajita, K. Kaneko, and H. Hirukawa, „An analytical method on real-time gait planning for a humanoid robot,“ in Proc. 4th IEEE-RAS Int. Conf. Humanoid Ro-bots, vol. 2, 2004, pp. 640-655 Vol. 2.
[4] R. Tedrake, S. Kuindersma, R. Deits, and K. Miura, „A closed-form solution for real-time zmp gait generation and feedback stabilization,“ in Proc. 15th IEEE-RAS Int. Conf. Humanoid Robots, 2015, pp. 936-940.
[5] J. Englsberger, C. Ott, and A. Albu-Schäffer, „Three-dimensional bipedal walking control based on divergent component of motion,“ IEEE Trans. Robotics, vol. 31, no. 2, pp. 355-368, 2015.
[6] T. Takenaka, T. Matsumoto, and T. Yoshiike, „Real time motion generation and control for biped robot -1st report: Walking gait pattern generation-,“ in Proc. IEEE/RSJ Int. Conf. Intell. Robots Syst., 2009, pp. 1084-1091.
[7] J. Pratt, T. Koolen, T. de Boer, J. Rebula, S. Cotton, J. Carff, M. Johnson, and P. Neuhaus, "Capturability-based analysis and control of legged locomotion, part 2: Application to M2V2, a lower-body humanoid,"The Int. Journal of Ro-botics Research, vol. 31, no. 10, pp. 1117-1133, 2012.
[8] J. Englsberger, G. Mesesan, and C. Ott, „Smooth trajec-tory generation and push-recovery based on divergent component of motion,“ in Proc. IEEE/RSJ Int. Conf. Intell. Robots Syst., Sep. 2017, pp. 4560-4567.
[9] G. Mesesan, J. Englsberger, C. Ott, and A. Albu-Schäffer, „Convex properties of center-of-mass trajectories for locomotion based on divergent component of motion,“ IEEE Robot. Autom. Lett., vol. 3, no. 4, pp. 3449-3456, 2018.
[10] A. Herzog, N. Rotella, S. Mason, F. Grimminger, S. Schaal, and L. Righetti, „Momentum control with hierar-chical inverse dynamics on a torque-controlled humanoid,“ Auton. Robots, vol. 40, no. 3, pp. 473-491, 2016.
[11] J. Pratt, J. Carff, S. Drakunov, and A. Goswami, „Cap-ture point: A step toward humanoid push recovery,“ in Proc. 6th IEEE-RAS Int. Conf. Humanoid Robots, Jan. 2006, pp. 200-207.
[12] S.-H. Lee and A. Goswami, „Reaction mass pendulum (rmp): An explicit model for centroidal angular momentum of humanoid robots,“ in Proc. IEEE Int. Conf. Robot. Autom., 2007, pp. 4667-4672.
[13] K. Guan, K. Yamamoto, and Y. Nakamura, „Virtual-mass-ellipsoid inverted pendulum model and its applica-tions to 3d bipedal locomotion on uneven terrains,“ in Proc. IEEE/RSJ Int. Conf. Intell. Robots Syst., 2019, pp. 1401-1406.
[14] T. Seyde, A. Shrivastava, J. Englsberger, S. Bertrand, J. Pratt, and R. J. Griffin, „Inclusion of angular momentum during planning for capture point based walking,“ in IEEE Int. Conf. on Robotics and Automation, 2018, pp. 1791-1798.
[15] S. Kajita, F. Kanehiro, K. Kaneko, K. Fujiwara, K. Harada, K. Yokoi, and H. Hirukawa, „Resolved momentum control: humanoid motion planning based on the linear and angular momentum,“ in Proc. IEEE/RSJ Int. Conf. Intell. Robots Syst., vol. 2, Nov. 2003, pp. 1644-1650.
[16] K. Nishiwaki and S. Kagami, „Online walking control system for humanoids with short cycle pattern generation,“ The International Journal of Robotics Research, vol. 28, no. 6, pp. 729-742, 2009.
[17] K. Hu, C. Ott, and D. Lee, „Learning and generaliza-tion of compensative zero-moment point trajectory for biped walking,“ IEEE Trans. on Robotics, vol. 32, no. 3, pp. 717-725, 2016.
[18] S. Wang, G. Mesesan, J. Englsberger, D. Lee, and C. Ott, „Online virtual repellent point adaptation for biped walking using iterative learning control,“ in Proc. 20th IEEE-RAS Int. Conf. Humanoid Robots, 2021, (in press).
[19] P. Sardain and G. Bessonnet, „Forces acting on a biped robot. center of pressure-zero moment point,“ IEEE Trans. on Systems, Man, and Cybernetics - Part A: Sys-tems and Humans, vol. 34, no. 5, pp. 630-637, 2004.
[20] A. Miyata, S. Miyahara, and D. N. Nenchev, „Walking with arm swinging and pelvis rotation generated with the relative angular acceleration,“ IEEE Robot. Autom. Lett., vol. 5, no. 1, pp. 151-158, 2020.
[21] M. Schwienbacher, T. Buschmann, S. Lohmeier, V. Favot, and H. Ulbrich, „Self-collision avoidance and angu-lar momentum compensation for a biped humanoid robot,“ in IEEE Int. Conf. on Robotics and Automation, 2011, pp. 581-586.
[22] B. Park, M. Kim, E. Sung, J. Kim, and J. Park, „Whole-body walking pattern using pelvis-rotation for long stride and arm swing for yaw angular momentum compen-sation,“ in Proc. 20th IEEE-RAS Int. Conf. Humanoid Robots, 2021, (in press).
[23] G. Mesesan, J. Englsberger, G. Garofalo, C. Ott, and A. Albu-Schäffer, „Dynamic walking on compliant and uneven terrain using DCM and passivity-based whole-body control,“ in Proc. 19th IEEE-RAS Int. Conf. Humanoid Robots, 2019, pp. 25-32.
[24] R. Schuller, G. Mesesan, J. Englsberger, J. Lee, and C. Ott, „Online centroidal angular momentum reference gener-ation and motion optimization for humanoid push recov-ery,“ IEEE Robot. Autom. Lett., vol. 6, no. 3, pp. 5689-5696, 2021.
[25] J. Englsberger, G. Mesesan, C. Ott, and A. Albu-Schäffer, „DCM-based gait generation for walking on mov-ing support surfaces,“ in Proc. 18th IEEE-RAS Int. Conf. Humanoid Robots, 2018, pp. 1-8.
[26] D. E. Orin, A. Goswami, and S.-H. Lee, „Centroidal dynamics of a humanoid robot,“ Auton. Robots, vol. 35, no. 2-3, pp. 161-176, Oct. 2013.
[27] M. A. Hopkins, D. W. Hong, and A. Leonessa, „Hu-manoid locomotion on uneven terrain using the time-varying divergent component of motion,“ in Proc. 14th IEEE-RAS Int. Conf. Humanoid Robots, 2014, pp. 266-272.
[28] E. Sachs, R.-S. Guo, S. Ha, and A. Hu, „On-line pro-cess optimization and control using the sequential design of experiments,“ in Digest of Technical Papers. 1990 Sympo-sium on VLSI Technology, 1990.
[29] J. Englsberger et al., „Overview of the torque-controlled humanoid robot TORO,“ in Proc. 14th IEEE-RAS Int. Conf. Humanoid Robots, 2014, pp. 916-923.

Aufgabe der Erfindung ist es, die Gangsteuerung eines Roboters zu optimieren, insbesondere effizienter und/oder genauer zu gestalten.
Die Lösung der Aufgaben erfolgt erfindungsgemäß durch ein Verfahren gemäß Anspruch 1, einen Regler gemäß Anspruch 6, ein Computerprogramm gemäß Anspruch 17, oder ein Robotersystem gemäß Anspruch 18.
Bei dem erfindungsgemäßen Verfahren zur Gangsteuerung eines Roboters handelt es sich insbesondere um ein Verfahren zur Steuerung eines Roboters mit mindestens zwei Beinen. Bevorzugt handelt es sich um ein Verfahren zur Gangsteuerung eines humanoiden Roboters. Das Verfahren weist die nachfolgenden Schritte auf.

- Schritt a): Bereitstellen einer geplanten Aufgabenraumtrajektorie X, insbesondere umfassend n Iterationen der Trajektorie.
- Schritt b): Bereitstellen einer geplanten Trajektorie des Druckzentrums a_p.
- Schritt c): Berechnen einer geplanten Trajektorie des Massenzentrums x anhand der geplanten Trajektorie des Druckzentrums a_p. Das Berechnen der geplanten Trajektorie des Massenzentrums x erfolgt insbesondere in der initialen Iteration i=0 nur anhand a_p. Bevorzugt erfolgt das Berechnen der geplanten Trajektorie des Massenzentrums x in den Iterationen nach der initialen Iteration (i>0) anhand der geplanten Trajektorie des Druckzentrums a_p und eines gelernten Schwerpunktsdrehimpulses a_τ.
-Schritt d): Empfangen einer gemessenen Trajektorie des Massezentrums x_m des Roboters, insbesondere für die (i-1)-te Iteration der Trajektorie, und Empfangen einer gemessenen Aufgabenraumtrajektorie Xm des Roboters, insbesondere für die i-te Iteration der Trajektorie. Es ist bevorzugt, dass das Empfangen von x_m und X_m gleichzeitig für dasselbe Zeitfenster, vorzugsweise unabhängig von der jeweiligen Iteration stattfindet. Das Empfangen von x_m und x_m findet insbesondere zur Laufzeit, vorzugsweise online, statt.
- Schritt e): Berechnen von Steuerbefehlen τ für den Roboter, insbesondere für die i-ten Iteration der Trajektorie, anhand der geplanten Aufgabenraumtrajektorie X, der gemessenen Trajektorie des Massezentrums x_m des Roboters, der gemessenen Aufgabenraumtrajektorie Xm des Roboters, der geplanten Trajektorie des Massenzentrums x und einer gelernten Information über die Trajektorie des Schwerpunktsdrehimpulses. Die i-te Iteration entspricht insbesondere der aktuellen Iteration der Trajektorie.

Es ist bevorzugt, dass das Verfahren den weiteren Schritt f) aufweist: Übertragen der Steuerbefehle τ, insbesondere für den i-ten Iteration der Trajektorie, an den Roboter. Insbesondere weist mindestens eine der Trajektorien X, a_p, x, x_m und/oder X_m eine Position und/oder eine Geschwindigkeit und/oder eine Beschleunigung auf. Bei den Steuerbefehlen für den Roboter handelt es sich insbesondere um Drehmomente, Positionen und/oder Kräfte. Es ist bevorzugt, dass die gelernte Information über die Trajektorie des Schwerpunktsdrehimpulses zur Laufzeit, auch als „online“ zu bezeichnen ermittelt wird, und/oder anhand einer Datenbank ermittelt wird. Die Datenbank weist insbesondere vorherig ermittelte Information über die Trajektorie des Schwerpunktsdrehimpulses auf. Vorzugsweise erfolgt die Ermittlung der gelernten Information über die Trajektorie des Schwerpunktsdrehimpulses anhand eines gelernten Schwerpunktsdrehimpuls a_T und/oder anhand einer gelernten Trajektorie des Schwerpunktsdrehimpulses l_c,p. Bei a_τ handelt es sich um die Polynomialkoeffizienten die l_c,p beschreiben. Bei l_c,p und a_τ handelt es sich insbesondere um dieselben Informationen und/oder dieselben Signale. Insbesondere ist durch die Erfindung vorteilhaft umgesetzt, dass die Schrittlänge und/oder die Gangeschwindigkeit eines Roboters erhöht werden kann.
In bevorzugter Ausführung des Verfahrens erfolgt ein Wiederholen der Verfahrensschritte c) bis f), insbesondere für n-1 Male, wobei n die Anzahl der Iterationen der Trajektorie ist.
In bevorzugter Ausführung des Verfahrens wird die geplante Trajektorie des Massenzentrums x anhand der geplanten Trajektorie des Druckzentrums a_p und eines gelernten Schwerpunktsdrehimpulses a_τ ermittelt.
In bevorzugter Ausführung des Verfahrens wird der gelernte Schwerpunktsdrehimpuls a_τ anhand der geplanten Aufgabenraumtrajektorie X, der geplanten Trajektorie des Massenzentrums x, und eines Rotationsteils einer Schwerpunktsdrehimpulsmatrix A̅ ermittelt.
In bevorzugter Ausführung des Verfahrens wird der Rotationsteil der Schwerpunktsdrehimpulsmatrix A̅ anhand der tatsächlichen Trajektorie des Massezentrums Xm und der tatsächlichen Aufgabenraumtrajektorie Xm ermittelt.
In bevorzugter Ausführung des Verfahrens wird die gelernte Trajektorie des Schwerpunktsdrehimpulses a_τ anhand der geplanten Aufgabenraumtrajektorie X , der geplanten Trajektorie des Massenzentrums x, und des Rotationsteils des
Schwerpunktsdrehimpulsmatrix A̅ ermittelt wird. Bei a_τ bzw. l_c,p handelt sich insbesondere um die gelernten Trajektorie und/oder final Verwendeten Trajektorie für die Schwerpunktsanpassung. Es ist bevorzugt, dass die gewünschte Trajektorie des Schwerpunktsdrehimpulses l_c,d anhand des Schwerpunktsdrehimpulses a_τ ermittelt wird. l_c,d wird vorzugsweise an den Roboter übermittelt.
In bevorzugter Ausführung des Verfahrens umfasst das Verfahren vor dem Schritt c) bei der ersten Verfahrensausführung, insbesondere der initialen Iteration i=0 von n Iterationen der Trajektorie, zusätzlich den Schritt i) des Berechnens von Steuerbefehlen τ für den Roboter anhand der geplanten Aufgabenraumtrajektorie X, und einer geplanten Trajektorie des Massenzentrums x. Vorzugsweise umfasst das Verfahren ferner nach dem Schritt i) und vor dem Schritt c) den Schritt ii) des Übertragens der Steuerbefehle T für den ersten Schritt der Trajektorie an den Roboter.
In bevorzugter Ausführung des Verfahrens erfolgt bei der ersten Verfahrensausführung, insbesondere der initialen Iteration i=0 von n Iterationen der Trajektorie, wird a_τ vorzugsweise gleich 0 gesetzt. Es ist somit bevorzugt, dass x lediglich anhand a_p berechnet wird.
In bevorzugter Ausführung des Verfahrens werden zur Ermittlung des gelernten Schwerpunktsdrehimpuls a_τ die gelernten Informationen über die Trajektorie des Schwerpunktsdrehimpulses durch ein Polynom n_l -ter Ordnung dargestellt.
In bevorzugter Ausführung des Verfahrens gilt zur Ermittlung des gelernten Schwerpunktdrehimpuls a_τ: ${\dot{l}}_{c, p} (t) = \sum_{i = 0}^{n_{τ}} (i + 1) a_{l, i + 1} t^{i} - \sum_{i = 0}^{n_{τ}} a_{τ, i} t^{i} .$
$l_{c, p} (t) = \sum_{i = 0}^{n_{τ}} a_{l, i} t^{i}$
$a_{l,4; n_{l}}^{T} = {({\bar{V}}_{1}^{T} {\bar{V}}_{1})}^{- 1} {\bar{V}}_{1}^{T} ({\bar{l}}_{c, l}^{T} - {\bar{V}}_{2}),$
$l_{c, l, i + 1} (t) = (1 - k_{l}) (l_{c, p, i} (t)) + k_{l} (l_{c, r, i} (t)); und$
$l_{c} = \bar{A} (\begin{matrix} \dot{x} \\ \dot{χ} \end{matrix}) .$
$a_{l,4; n_{l}}^{T}$
wird hierbei bevorzugt durch die Methode der kleinsten Quadrate ermittelt. $a_{l,4; n_{l}}^{T}$
wird bevorzugt mittels der Formeln aus dem Anhang A. und/oder B. berechnet. Vorzugsweise gilt: $V_{1} (t) = V_{11} (t) + V_{12} (t) + V_{13} (t)$
mit $\begin{array}{l} V_{11} (t) = [t^{n_{l}}, t^{[n_{l} - 1]}, \dots, t^{4}], \\ V_{12} (t) = [(n_{l} - 2) T_{φ}^{(n_{l} - 3)}, (n_{l} - 3) T_{φ}^{(n_{l} - 4)}, \dots,2 T_{φ}] t^{3}, \\ V_{13} (t) = [(n_{l} - 3) T_{φ}^{(n_{l} - 2)}, (n_{l} - 4) T_{φ}^{(n_{l} - 3)}, \dots, T_{φ}^{2}] t^{2}, \\ V_{2} (t) = (\frac{2 t^{3}}{T_{φ}^{3}} + \frac{3 t^{2}}{T_{φ}^{2}} + 1, \frac{t^{3}}{T_{φ}^{2}} + \frac{2 t^{3}}{T_{φ}} + t, - \frac{2 t^{3}}{T_{φ}^{3}} - \frac{3 t^{2}}{T_{φ}^{2}}, \frac{t^{3}}{T_{φ}^{2}} + \frac{t^{2}}{T_{φ}}) \\ {[l_{c, l} (0), {\dot{l}}_{c, l} (0), l_{c, l} (T_{φ}), {\dot{l}}_{c, l} (T_{φ})]}^{T}; und/oder \end{array}$
$\begin{array}{l} (\begin{matrix} a_{l,0} \\ a_{l,1} \\ a_{l,2} \\ a_{l,3} \end{matrix}) = [\begin{matrix} I & 0 & 0 & 0 \\ 0 & I & 0 & 0 \\ \frac{- 3}{T_{φ}^{2}} I & \frac{- 2}{T_{φ}} I & \frac{3}{T_{φ}^{2}} I & \frac{- 1}{T_{φ}} I \\ \frac{2}{T_{φ}^{3}} I & \frac{1}{T_{φ}^{2}} I & \frac{- 2}{T_{φ}^{3}} I & \frac{1}{T_{φ}^{2}} I \end{matrix}] (\begin{matrix} l_{c, l} (0) \\ {\dot{l}}_{c, l} (0) \\ l_{c, l} (T_{φ}) \\ {\dot{l}}_{c, l} (T_{φ}) \end{matrix}) \\ + {(0^{T} {,0}^{T}, Σ_{i = 4}^{n_{l}} (i - 3) T_{φ}^{i} a_{l, i}^{T}, Σ_{i = 4}^{n_{l}} (i - 2) T_{φ}^{i} a_{l, i}^{T})}^{T} . \end{array}$
Anderseits ist alternativ auch die Ermittlung mit einer anderen, entsprechenden Methode möglich. Es ist bevorzugt, dass der Referenzdrehimpulsl l_c,τ durch eine Aufzeichnung, insbesondere Abspeicherung der Werte, einer modellbasierten Berechnung anhand der geplanten Aufgabenraumtrajektorie X, der geplanten Trajektorie des Massenzentrums x und der Schwerpunktsdrehimpulsmatrix A̅ erfolgt. Bevorzugt kann a_l jeder Zeit mit den vorstehenden Gleichungen zu a_τ umgerechnet werden. a_l beschreibt insbesondere den Schwerpunktsdrehimpuls und a_τ seine zeitliche Ableitung. a_τ werden verwendet um x zu berechnen, während aus a_l dann l_c,p berechnet werden kann. l_c,p und a_l enthalten somit bevorzugt dieselben Informationen. a_τ beschriebt die zeitliche Ableitung davon kann vorzugsweise mit den vorstehenden Gleichungen berechnet werden.
Bevorzugt gilt: Der aufgezeichnete Schwerpunktsdrehimpuls l_c,t wird durch l_c,p polynomial approximiert. l_c,p ist eine Polynomialfunktion mit den Koeffizienten a_l. Um die Schwerpunktstrajektorie x zu berechnen wird insbesondere allerdings die Zeitableitung des Schwerpunktsdrehimpulses i_c,p benötigt. Diese Zeitableitung wird ebenfalls durch eine Polynomialfunktion beschrieben, deren Koeffizienten a_τ sind. Die Umrechnung kann zu jeder Zeit stattfinden und bedarf keiner weiteren Informationen: $l_{c, p} (t) = \sum_{i = 0}^{n_{τ}} (i + 1) a_{l, i + 1} t^{i} = \sum_{i = 0}^{n_{τ}} a_{τ, i} t^{i} .$
In bevorzugter Ausführung des Verfahrens erfolgt die Ermittlung des Rotationsteil der Schwerpunktsdrehimpulsmatrix A durch eine Berechnung aus der Roboterdynamik zur Laufzeit, insbesondere mittels einer Ganzkörpersteuerung. Vorzugsweise erfolgt die Ermittlung durch Kombination der Jacobi-Matrix und der Massenmatrix.
In bevorzugter Ausführung des Verfahrens gilt zur Ermittlung der gewünschten Trajektorie des Schwerpunktdrehimpulses l_c,d, dass i_c,d,z anhand der geplanten Trajektorie des Massenzentrums x und anhand der geplanten Trajektorie des Druckzentrums a_p bestimmt wird, und dass l_c,d|xy = l_c,p|xy ist. i_c,d,z entspricht hierbei der gelernten Trajektorie des Schwerpunktdrehimpulses in z-Richtung und l_c,d|xy der gelernten Trajektorie des Schwerpunktdrehimpulses in xy-Richtung (parallel zur Aufstützfläche). i_c,d wird durch die numerische Integration von l_c,d erhalten. l_c,d entspricht der gewünschten und/oder an den Roboter zu kommandierenden Trajektorie.
In bevorzugter Ausführung des Verfahrens erfolgt die Berechnung der Steuerbefehle T mittels einer Ganzkörpersteuerung.
In bevorzugter Ausführung des Verfahrens wird zur Berechnung der geplanten Trajektorie des Massenzentrums x das Divergent Component of Motion (DCM) - Framework genutzt.
In bevorzugter Ausführung des Verfahrens gilt zur Berechnung der geplanten Trajektorie des Massenzentrums x : $e (t) = \sum_{i = 0}^{n_{p}} a_{p, i} t^{i} + \frac{1}{m g} \sum_{i = 0}^{n_{τ}} a_{τ, i} t^{i},$
$\begin{array}{l} ν = e + {(0,0, Δ z)}^{T'}, \\ \dot{ξ} = \frac{1}{b} (ξ - ν) . \end{array}$
$ξ = x + b \dot{x}$
wobei in der initialen Iteration i=0 von n Iterationen der gelernten Schwerpunktdrehimpulses a_τ = 0 ist.
In bevorzugter Ausführung des Verfahrens wird die gemessene Trajektorie des Massezentrums x_m und/oder die gemessenen Aufgabenraumtrajektorie Xm durch mindestens einen Sensor des Roboters erfasst. Bei dem mindestens einen Sensor handelt es sich insbesondere um einen Hardwaresensor. Bevorzugt handelt es sich um einen Gelenkpositionssensor, ein Gyroskop oder ein Inertiale Messeinheit (IMU).
Bei dem erfindungsgemäßen Regler handelt es sich um einen Regler zur Gangsteuerung eines, insbesondere Beine aufweisenden Roboters, vorzugsweise eines humanoiden Roboters. Der Regler ist zur Ausführung des oben beschriebenen Verfahrens ausgeführt. Insbesondere umfasst der Regler Regelelemente, die zur Ausführung einer oder mehrere der Schritte des Verfahrens ausgeführt sind.
Bei dem erfindungsgemäßen Computerprogramm handelt es sich um ein Computerprogramm zur Gangsteuerung eines, insbesondere Beine aufweisenden Roboters, vorzugsweise eines humanoiden Roboters. Das Computerprogramm ist zur Ausführung des oben beschriebenen Verfahrens ausgeführt. Insbesondere umfasst das Computerprogramm Befehle, die bei der Ausführung des Programms durch einen Computer diesen veranlassen, das oben beschriebenen Verfahren auszuführen.
Das erfindungsgemäße Robotersystem weist einen insbesondere Beine aufweisenden Roboter, vorzugsweise einen humanoiden, Roboter auf. Das Robotersystem weist ferner einen mit dem Roboter verbundenen Regler auf, wobei der Regler wie der oben beschriebenen Regler ausgeführt ist. Der Regler ist vorzugsweise datenübertragend mit dem Roboter verbunden. Insbesondere ist der Regler kabelgebunden oder kabellos datenübertragend mit dem Roboter verbunden. Es ist bevorzugt, dass der Roboter den Regler aufweist, insbesondere einstückig, auch als integral zu bezeichnen, damit verbunden ist.
Insbesondere überwindet die vorliegende Erfindung mindestens einen der nachfolgenden Nachteile des Stands der Technik:

a) In Dokument [1] findet die Generierung der Gangtrajektorien nicht zur Laufzeit, sondern offline statt, da das Optimierungsproblem viel Rechenkapazität und dementsprechend hohe Rechenzeiten benötigt. Dies hat den entscheidenden Nachteil, dass nicht aktiv auf unvorhergesehene Ereignisse reagiert werden kann, sondern nur einer vorherbestimmten Trajektorie gefolgt werden kann.
b) Die vorgestellten Modelle der Mehrkörperdynamik der Dokumente [2]-[5] geben nur eine sehr schlechte Approximation der schwerpunktsbezogenen Rotationsdynamik (Drehimpuls). Die unzureichende Berücksichtigung des Drehimpulses auf Planungsebene kann immer noch dazu führen, dass substantielle Kontaktdrehmomente in den Aufstandsflächen induziert werden. Dies kann zu einer Verletzung der Kontaktbedingungen, welche einen rutsch- und kippfreien Kontakt zwischen den Füßen und dem Boden sicherstellen sollen, führen. Abhängig von der Güte der Approximation fallen die resultierenden Kontaktdrehmomente höher oder geringer aus. Die vorgestellten Modelle liefern allerdings nur ungenügende Ergebnisse.
c) In den Dokumenten [6]-[9] werden nur Kontaktdrehmomente parallel zur Kontaktfläche reduziert (CoP Folgeverhalten wird verbessert), vertikale Kontaktdrehmomente, welche zu einer Verdrehung des Fußes relativ zur Kontaktfläche führen können, werden nicht berücksichtigt.
d) In den Dokumenten [10]-[12] findet die Berücksichtigung des vertikalen Drehimpulses nicht auf Planungsebene statt, sondern wird instantan zur Laufzeit kompensiert. Nur Kontaktdrehmomente vertikal zur Kontaktfläche werden reduziert, horizontale Kontaktdrehmomente, welche zu einem Überrollen oder Rutschen des Fußes relativ zur Kontaktfläche führen können, werden nicht berücksichtigt.

Demgegenüber weist die vorliegende Erfindung insbesondere mindesten einen der folgenden Vorteile gegenüber dem Stand der Technik auf:

i. Die Erfindung generiert Schwerpunktstrajektorien auf Planungsebene unter Berücksichtigung des Drehimpulses induziert durch die Mehrkörperdynamik des Roboters zur Laufzeit. Dadurch können die horizontalen Kontaktdrehmomente in den Aufstützflächen reduziert und damit ein robusteres and energieeffizienteres Gangverhalten erzielt werden.
ii. Korrespondierend zu dem Drehimpulsverlauf, welcher auf Planungsebene verwendet wird, wird eine Drehimpulsreferenz zur Laufzeit geniert. Ein Ganzkörperregler stellt das Folgen der Drehimpulsreferenz sicher. Das Induzieren der Drehimpulsreferenz stellt sicher, dass sowohl die vertikalen als auch horizontalen Kontaktdrehmomente in den Aufstützflächen zu Null geregelt werden.
iii. Der Drehimpulsverlauf, welcher auf Planungsebene und zur Erzeugung der Drehimpulsreferenz verwendet wird, wird zur Laufzeit erlernt. Die Erfindung nutzt insbesondere den zyklischen Charakter des Gehens im Allgemeinen, um den Drehimpulsverlauf aufzuzeichnen und somit Informationen zu dem Drehimpulsverlauf für zukünftige Iterationen zur Verfügung zu stellen.
iv. Der erlernte Drehimpulsverlauf kann sowohl in Simulation als auch am echten Roboter trainiert werden. Auch die Daten früherer Durchgänge können verwendet werden, um eine Datenbank an Drehimpulsverläufen aufzubauen, welche zu einem späteren Zeitpunkt wieder abgerufen werden können.

Folglich werden die Nachteile des Stands der Technik, insbesondere die oben genannten Nachteile der Dokumente [1]-[12] durch die Erfindung vorzugsweise wie folgt überwunden:

1. Nachteil, bspw. von Dokument [1]: Die Generierung der Gangtrajektorien findet nicht zur Laufzeit statt, was bspw. zu einem sehr rechenintensives Optimierungsverfahren führt. Insbesondere wird dieser Nachteil durch die Erfindung wie folgt gelöst: Die Generierung der Gangtrajektorien unter Berücksichtigung des Drehimpulses, induziert durch die Mehrkörperdynamik des Roboters, findet zur Laufzeit in recheneffizienter Art und Weise statt. Es kann zur Laufzeit eine Anpassung der Trajektorien vorgenommen werden.
2. Nachteil, bspw. von Dokumenten [2]-[5]: Derartige Modelle der Mehrkörperdynamik geben nur eine sehr schlechte Approximation der schwerpunktsbezogenen Rotationsdynamik (Drehimpuls) wieder. Insbesondere wird dieser Nachteil durch die Erfindung wie folgt gelöst: Es wird die gesamte schwerpunktsbezogenen Rotationsdynamik (Drehimpuls) des Roboters erlernt, es findet keine Approximation des Mehrköpermodells statt.
3. Nachteil, bspw. von Dokumenten [2]-[12]: Es werden entweder nur horizontale oder vertikale Kontaktdrehmoment reduziert. Insbesondere wird dieser Nachteil durch die Erfindung wie folgt gelöst: Durch die Berücksichtigung des Drehimpulses auf Planungsebene und der zur Verfügungstellung einer Drehimpulsreferenz werden simultan horizontale und vertikale Kontaktdrehmomente mit einer einzigen Methode reduziert.

Nachfolgend wird die Erfindung anhand bevorzugter Ausführungsformen unter Bezugnahme auf die anliegenden Zeichnungen näher erläutert.
Es zeigen:

1 Darstellung einer Gangsteuerung eines humanoiden Roboters gemäß dem Stand der Technik,
2 Diagramm einer bevorzugte Ausführungsform des erfindungsgemäßen Verfahrens zur Gangsteuerung,
3 Darstellung einer bevorzugten Ausführungsform einer erfindungsgemäßen Gangsteuerung eines humanoiden Roboters,
4 Diagramme zur Darstellung einer resultierende Referenz-CAM,
5 Diagramme zur Darstellung eines Effekts einer gelernten CAM,
6 Diagramme zur Darstellung von resultierenden Kontaktdrehmomenten, und
7 Diagramme zur Darstellung einer Steuereingangsleistung.

1 ist eine Gangsteuerung eines humanoiden Roboters gemäß dem Stand der Technik zu entnehmen, wobei die Änderungsrate des Zentroiddrehimpulses (CAM) mit Null angenommen wird. Die folgenden Werte (vgl. Formel (8)) sind dargestellt: CoM (x), eCMP (e), CoP (p), Änderungsrate des CAM (i_c), externer Kraftvektor (F_ext), und Kontaktdrehmoment (T_grf).
I. Allgemeines
Die Erfindung stellt eine einheitliche Lösung vor, die gleichzeitig CoP-Tracking (deutsch: „gutes Folgeverhalten“) gewährleistet und das Kontaktdrehmoment um die z-Achse durch Berücksichtigung des Mehrkörper-CAM während der DCM-basierten Gangerzeugung reduziert. Ähnlich wie in Dokument [14], stellt die Erfindung den CAM als eine Polynomfunktion dar; anstatt eine vereinfachte Näherung zu verwenden, wird der CAM jedoch online gelernt, indem die zyklischen Gehbewegungen ausgenutzt wird, ähnlich wie ein dynamischer Filter, aber rechnerisch leichter, da keine zusätzliche Berechnung der Mehrkörperdynamik notwendig ist. Nach jeder Gehphase wird eine Polynomfunktion online an den gelernten CAM angepasst und die entsprechenden Polynomkoeffizienten werden in der nächsten Gehphase verwendet. Zusätzlich stellt die Erfindung ein Online-Aktualisierungsschema für die DCM-Trajektorie an, um Kontinuität zu gewährleisten. Ergänzend zur CoM-Referenz stellt die Erfindung eine gewünschte CAM-Trajektorie, die von der Ganzkörpersteuerung eingeregelt wird, die in Dokument [23] mit CAMbasierter Bewegungsoptimierung (Dokument [24]) eingeführt wird. Dies gewährleistet eine Reduzierung des Kontaktdrehmoments an der gewünschten CoP-Position um alle drei Achsen. 2 zeigt einen Überblick über eine bevorzugte Ausführungsform des erfindungsgemäßen Verfahrens zur Gangsteuerung. Aus Gründen der Übersichtlichkeit sind die zeitlichen Ableitungen der Systemzustände in 2 weggelassen. 2 gibt ebenfalls ein Diagramm über eine bevorzugte Ausführungsform des erfindungsgemäßen Reglers und/oder des erfindungsgemäßen Computerprogramms und/oder des erfindungsgemäßen Robotersystems wieder.
II. Grundlagen
In diesem Abschnitt werden die Grundlagen des DCM-Framework erläutert. Weitere Einzelheiten sind in Dokumente [5], [8], [9] beschrieben. Darüber hinaus werden Erkenntnisse aus Dokument [24] zum CAM in der humanoiden Fortbewegung und seiner Beziehung zum DCM-Framework beschrieben.
A. DCM-Framework
Die DCM ξ ∈ ℝ³ ist definiert als $ξ = x + b \dot{x}$
wobei die Position des Massenzentrums (CoM) x ∈ ℝ³ und die Geschwindigkeit ẋ ∈ ℝ³ ist. Die DCM-Zeitkonstante ist durch $b = \sqrt{\frac{Δ z}{g}},$
gegeben, wobei Δz die nominale CoM-Höhe über dem Boden und g die Gravitationskonstante ist. Die instabile Dynamik erster Ordnung der DCM ist gegeben durch $\dot{ξ} = \frac{1}{b} (ξ - ν),$
wobei v ∈ ℝ³ der VRP ist, der die Auswirkungen von externer Kraft und Schwerkraft codiert. Der VRP selbst befindet sich oberhalb des verbesserten Zentroidimpulsdrehpunkts (eCMP) e ∈ ℝ³ mit einem konstanten Höhenversatz, welcher der Gravitationskraft entspricht, d. h. v = e + (0, 0, Δz)^T. Der eCMP selbst codiert die externen Kräfte über $F_{e x t} = \frac{m}{b^{2}} (x - e)$
wobei m die Gesamtmasse des Roboters ist.
B. DCM-Referenztrajektorieerzeugung
In diesem Abschnitt werden die wichtigsten Ergebnisse aus [25] wieder aufgegriffen. Die Bewegung wird aufgeteilt in eine Sequenz von n_φ Übergangsphasen, für die Referenztrajektorien berechnet werden. Vorgestellt werden geschlossene DCM-Trajektorielösungen für jede Übergangsphase basierend auf einer beliebigen polynomischen eCMP-Referenztrajektorie, gegeben als $e (t) = \sum_{i = 0}^{n_{ν}} a_{ν, i} t^{i} .$
Hierbei ist n_v der Grad und a_v,i ∈ ℝ³ sind die Koeffizienten der Polynomfunktion, welche die eCMP-Trajektorie darstellt. Die lokale Zeit der Übergangsphase wird durch t ∈ [0, T_φ] dargestellt, wobei T_φ für die Phasendauer steht. Durch Gruppierung der Koeffizienten aus (4) und Berücksichtigung des konstanten vertikalen Versatzes zum eCMP kann die VRP-Referenztrajektorie als Polynom der folgenden Form ausgedrückt werden $ν (t) = P_{ν} t (t) .$
Die Zeit wird zu t(t) = (1, t, t², .... t^nv)^T vektorisiert und die polynomische Parametermatrix wird durch P_v ∈ ℝ^3×(nv+1) angegeben. Durch Einsetzen von (5) in (2) und Lösen der Differentialgleichung unter Verwendung der mathematischen Erkenntnisse aus [25] wird erhalten $ξ (t) = e^{\frac{i - T_{φ}}{b}} {\dot{ξ}}_{T} + P_{ν} C^{T} (b) (t (t) - e^{\frac{i - T_{φ}}{b}} t (T_{φ})),$
wobei 4T die gegebene End-DCM ist. Die Koeffizientenmatrix C(·) E ℝ^{(nv+1)×(nv+1)} ist lediglich eine Funktion des Parameters b. Die entsprechende CoM-Trajektorie ergibt sich durch Lösen von (1) nach Einsetzen von (6). Weitere Einzelheiten finden Sie in Dokument [25].
Indem die einzelnen Übergangsphasen miteinander verbunden werden, wird eine kontinuierliche Mehrschritt-Vorschau für die geschlossene CoM-Trajektorie erhalten. Um den Roboter am Ende der Trajektorie zum Stillstand zu bringen, wird die terminale DCM der letzten Übergangsphase so gewählt, dass sie mit der finalen VRP-Position übereinstimmt, vgl. Dokumente [8], [9], [25].
C. Mehrkörperdynamik und Schwerpunktsdrehimpulses
Der CAM l_c ∈ ℝ³ eines Systems hängt linear vom Aufgabenraumgeschwindigkeitsvektor ab $l_{c} = \bar{A} (\begin{matrix} \dot{x} \\ \dot{χ} \end{matrix}),$
wobei A̅ der Rotationsteil der Schwerpunktsdrehimpulsmatrix (CMM) ist (vgl. Dokument [26]), die in den Aufgabenraum transformiert wird. Die Raumgeschwindigkeiten werden neben der CoM-Geschwindigkeit durch ẋ ∈ ℝ^n-3 dargestellt, wobei n die Dimension des Aufgabenraums ist. Eine mögliche Auswahl für ẋ kann die Winkelgeschwindigkeit der Basis, die Fußgeschwindigkeiten im kartesischen Raum sowie die Gelenkgeschwindigkeiten des Oberkörpers umfassen. Die Änderungsrate des CAM entspricht dem Gesamtdrehmoment, das um das CoM wirkt, d. h. i_c = τ_c. Außerdem ist das Kontaktdrehmoment an der gewünschten CoP-Position p_d ∈ ℝ³ gegeben durch $τ_{g r f} = (x - p_{d}) \times F_{e x t} + i_{c},$
wobei der Versatz zwischen dem tatsächlichen und gewünschten CoP eine Funktion von τ_grf an der gewünschten CoP-Position ist $p - p_{d} = \frac{1}{m (g + \ddot{z})} (\begin{matrix} τ_{g r f, y} \\ - τ_{g r f, x} \\ 0 \end{matrix}),$
III. Problemstellung
Um sicherzustellen, dass die gewünschte und tatsächlich CoP-Position in (9) übereinstimmen, muss das Kontaktdrehmoment an der gewünschten CoP-Position Null sein. Wenn jedoch während der Planung ein CAM von Null angenommen wird und der eCMP so gewählt wird, dass er mit dem gewünschten CoP übereinstimmt, kann durch Einsetzen von (3) in (8) gezeigt werden, dass der erste Term auf der rechten Seite von (8) verschwindet. In diesem Fall muss die gesamte Änderungsrate von CAM i_c, die durch die Schwungbeinbewegung induziert wird, durch eine Ganzkörpersteuerung ausgeglichen werden, um ein Kontaktdrehmoment von Null zu gewährleisten. Dies führt zu umfangreichen und ineffizienten Oberkörperbewegungen. Ziel ist es dieses Problem zu umgehen, indem der externen Kraftvektor F_ext in (8) so gestalten wird, dass sich der erste und zweite Term auf der rechten Seite von (8) gegenseitig aufheben und CoP-Tracking ohne umfangreichen Steuerungseinsatz gewährleistet wird, wie in 3 dargestellt.
3 ist, in Anlehnung an die Darstellung aus 3, eine Gangsteuerung eines humanoiden Roboters gemäß einer bevorzugte Ausführungsform des erfindungsgemäßen Verfahrens zur Gangsteuerung zu entnehmen, wobei der Ansatz der zur Laufzeit gelernten Änderungsrate des Schwerpunktsdrehimpulses (CAM) angewandt ist. Die folgenden Werte (vgl. Formel (8)) sind dargestellt: CoM (x), eCMP (e), CoP (p), Änderungsrate des CAM (i_c), externer Kraftvektor (F_ext), und Kontaktdrehmoment (τ_grf).
Die Idee besteht darin, die Null-CAM-Annahme fallen zu lassen und die eCMP-Trajektorie, und damit den externen Kraftvektor (3), auf der Grundlage des tatsächlichen Mehrkörper-CAM zu planen. Wie in Dokument [27] berichtet, ist der eCMP durch die CoP-Position und einen Versatz in Abhängigkeit von dem horizontalen Drehmoment um das CoM gegeben $e = p + \frac{1}{m (g + \ddot{z})} (\begin{matrix} τ_{c, y} \\ - τ_{c, x} \\ 0 \end{matrix}),$
Hierbei steht z̈ für die vertikale CoM-Beschleunigung. Zur Bereitstellung expliziter Lösungen, muss die eCMP-Trajektorie als Polynomfunktion ausgedrückt werden, wie in (4) eingeführt. Inspiriert von dem Ansatz in Dokument [14], werden das gewünschte CoP und das Drehmoment um den CoM in (10) unter Verwendung von Polynomfunktionen neu geschrieben.
Daraus ergibt sich $e (t) = \sum_{i = 0}^{n_{p}} a_{p, i} t^{i} + \frac{1}{m g} \sum_{i = 0}^{n_{τ}} a_{τ, i} t^{i},$
wobei n_p, n_τ, a_p,i ∈ ℝ³ und a_τ,i ∈ ℝ³ die Grade und Koeffizienten des CoP- bzw. CoM-Drehmomentpolynoms sind. Die Herleitung der Koeffizienten in (11) wird im folgenden Abschnitt erläutert. Dabei ist zu beachten, dass im Folgenden Gehen auf ebenem Boden mit z̈ = 0 angenommen wird. Alternativ, wenn die vertikale CoM-Beschleunigung unbekannt ist, kann sie auch durch eine Polynomfunktion dargestellt und analog zur CAM online gelernt werden. Dieser Aspekt wird in Abschnitt IV-B weiter erörtert.
IV. POLYNOMISCHE VRP-REFERENZ
Die VRP-Referenz wird basierend auf einer Sequenz aus Schritten, die als Fußzentren gegeben sind, und einer gelernten CAM-Trajektorie erzeugt, die als Polynome ausgedrückt ist. Die resultierenden Polynomkoeffizienten a_p und a_τ werden in P_v gruppiert und in Abschnitt II-B verwendet, um eine CoM-Trajektorie zu erzeugen.
A. CoP-Koeffizienten
Die CoP-Referenz (vgl. 2) wird durch eine räumliche lineare Interpolation zwischen einer Sequenz aus gewünschten CoP-Positionen erzeugt, die so gestaltet sind, dass sie mit den Fußzentren der geplanten Schritte übereinstimmen $p (t) = (1 - ƒ (t)) p_{0} + ƒ (t) p_{T} .$
Der Startpunkt der aktuellen Übergangsphase ist gegeben durch p₀, während der Endpunkt PT als Startpunkt der folgenden Übergangsphase gewählt wird. Die zeitliche Interpolationsfunktion f(t) ist ein Polynom vom Grad n_p und dient dazu, die Kontinuität der CoP-Referenz bei Phasenübergängen zu gewährleisten. Zum Beispiel ergibt eine zeitliche lineare Interpolation (n_p = 1) in vektorisierter Form $p (t) = \underset{a_{p}}{\underset{︸}{[p_{0}, \frac{1}{T_{φ}} (p_{T} - p_{0})]}} (\begin{matrix} 1 \\ t \end{matrix}) .$
Eine zusätzliche Ferse-Zehe-Bewegung kann implementiert werden, indem weitere CoP-Wegpunkte hinzugefügt werden.
B. CAM-Koeffizienten
Ziel ist den CAM, der durch die Mehrkörperdynamik des Roboters induziert wird, insbesondere seine Änderungsrate, in die geschlossenen Lösungen des DCM-Framework einzubeziehen. Daher wird der CAM approximiert durch Polynomfunktionen, die auf einfache Art und Weise in (11) verwendet werden können, um eine VRP-Referenz zu erzeugen. In Dokument [14] wird ein Referenz-CAM mit einem vereinfachten Drei-Massen-Modell approximiert, das nur eine grobe Schätzung der tatsächlichen Dynamik liefert. In Gegensatz dazu wird eine online gelernte CAM-Trajektorie verwendet, um eine realistische Darstellung des CAM zu erhalten, der durch die Mehrkörperdynamik des Roboters induziert wird. Für jede Übergangsphase wird eine Polynomfunktion l_c,p(t) vom Grad n_l = n_τ + 1 online an eine gelernte CAM-Trajektorie l_c,l(t) angepasst, die sich durch die Online-Aufzeichnung des CAM früherer Gehsequenzen ergibt (siehe Abschnitt V-A).
Die Polynomfunktion zur Approximation des CAM hat folgende Form $l_{c, p} (t) = \sum_{i = 0}^{n_{l}} a_{l, i} t^{i}$
wobei a_l,i ∈ ℝ³ und die lokale Zeit t ∈ [0, T_φ]. ist. Die entsprechende Änderungsrate, d. h. das Drehmoment um das CoM ist gegeben durch ${\dot{l}}_{c, p} (t) = \sum_{i = 0}^{n_{τ}} (i + 1) a_{τ, i + 1} t^{i} = \sum_{i = 0}^{n_{τ}} a_{τ, i} t^{i} .$
Um die Polynomkoeffizienten a_l zu erhalten, wird eine Vandermonde-Matrix konstruiert und die Randbedingungen l_c,p(0).= l_c,l(0), i_c,p(0) = i_c,l(0), l_c,p(T_φ) = l_c,l(T_φ), i_c,p(T_φ) = i_c,l(T_φ) einbezogen, um Kontinuität zwischen Übergangsphasen sicherzustellen. Zu diesem Zweck ist ein Polynom vom Grad n_l > 4 erforderlich. Das gegebene l_c,l wird innerhalb jeder Übergangsphase in einzelne Datenpunkte mit einer lokalen Zeit diskretisiert, die durch t_k = kΔt mit 1 ≤ k ≤ [T_φ/Δt] und n_l - 4 ≤ k gegeben ist. Hierbei ist Δt das Zeitintervall zwischen einzelnen Datenpunkten und muss ein Mehrfaches der Abtastzeit Δt_s des Systems sein. Anschließend werden die Submatrizen V₁(·) ∈ ℝ^1×(nl-4) und V₂(·) ∈ ℝ^1×3 berechnet. Diese sind nur eine Funktion der lokalen Zeit jedes Datenpunktes, der Gesamtdauer der Übergangsphase und der Randbedingungen. Beide Matrizen können im Anhang A gefunden werden. Basierend auf dem gelernten CAM und den berechneten Submatrizen werden die folgende Beziehung für die n_l - 4 letzten Elemente der unbekannten Polynomkoeffizientenmatrix erhalten $\underset{{\bar{V}}_{1}}{\underset{︸}{[\begin{matrix} V_{1} (t_{k}) \\ V_{1} (t_{k - 1}) \\ ⋮ \\ V_{1} (t_{1}) \end{matrix}]}} \underset{a_{l,4; n_{l}}^{T}}{\underset{︸}{(\begin{matrix} a_{l, n_{l}}^{T} \\ a_{l, (n_{l} - 1)}^{T} \\ ⋮ \\ a_{l,4}^{T} \end{matrix})}} + \underset{{\bar{V}}_{2}}{\underset{︸}{[\begin{matrix} V_{2} (t_{k}) \\ V_{2} (t_{k - 1}) \\ ⋮ \\ V_{2} (t_{1}) \end{matrix}]}} = \underset{l_{c, l}^{T}}{\underset{︸}{(\begin{matrix} l_{c, l}^{T} (t_{k}) \\ l_{c, l}^{T} (t_{k - 1}) \\ ⋮ \\ l_{c, l}^{T} (t_{1}) \end{matrix})}} .$
Interesse besteht hierbei an der kleinsten quadratischen Lösung von (16), um eine gute Näherung von l_c,l über die gesamte Übergangsphase zu finden. Daher wird formuliert $a_{l,4; n_{l}}^{T} = {({\bar{V}}_{1}^{T} {\bar{V}}_{1})}^{- 1} {\bar{V}}_{1}^{T} ({\bar{l}}_{c, l}^{T} - {\bar{V}}_{2}),$
Um die Berechnungskosten zu reduzieren, kann die Matrix ${({\bar{V}}_{1}^{T} {\bar{V}}_{1})}^{- 1} {\bar{V}}_{1}^{T}$
für die gegebene Werte von Δt und T_φ offline vorberechnet werden. Die verbleibenden unbekannten Polynomkoeffizienten $a_{l,0; 3} = {[a_{l,3}^{T}, \dots, a_{l,0}^{T}]}^{T}$
werden basierend auf a_l,4:nl und den Randbedingungen berechnet, wie in Anhang B gezeigt.
Um P_v zu erhalten, werden die Koeffizienten a_p und a_l schließlich gruppiert und ein konstanter vertikaler Versatz Δz wird hinzugefügt. Dabei ist aus (10) zu beachten, dass nur das CoM-Drehmoment in der Ebene parallel zur Aufstützfläche (xy-Richtung) benötigt wird und daher nur die entsprechenden Koeffizienten berechnet werden. Die Koeffizienten für das CoM-Drehmoment in z-Richtung werden auf Null gesetzt.
Für das Gehen mit einer nicht konstanten CoM-Höhe kann die vertikale CoM-Beschleunigung gelernt und auf die gleiche Weise wie der CAM durch die Darstellung des Terms $\frac{1}{m (g + \ddot{z})}$
in (10) anhand einer zusätzlichen Polynomfunktion approximiert werden.
V. Online-Lernen der CAM- und DCM-Trajektorie-Aktualisierung
In diesem Abschnitt wird ein Verfahren zum Online-Lernen des Referenz-CAM l_c,r vorgestellt, das verwendet wird, um die Polynomkoeffizientenmatrix a_l zu erhalten (Abschnitt IV-B). Außerdem wird eine gewünschte CAM-Trajektorie l_c,d erzeugt, der von einer Ganzkörpersteuerung gefolgt wird, z. B. durch die passivitätsbasierte Ganzkörpersteuerung mit einer CAM-basierten Bewegungsoptimierung, wie in Dokumenten [23], [24] dargelegt.
A. Online-Lernen der Referenz-CAM-Trajektorie
Ziel ist eine CAM-Trajektorie l_c,l basierend auf online aufgezeichneten CAM-Werten zu lernen, die durch die modellbasierte Mehrkörperdynamik induziert werden. Der Ansatz ist vergleichbar mit einem klassischen dynamischen Filter (vgl. Dokumente [15], [16]); er erfordert jedoch keine zusätzliche Berechnung der Mehrkörperdynamik, um eine bestimmte Vorschau zu erhalten, und ist daher mit geringeren Rechenkosten verbunden.
Da das Gehen selbst ein iterativer Prozess ist, zeichnet unser vorgeschlagenes Verfahren die modellbasierte Referenz-CAM auf iterative Weise über aufeinanderfolgende Iterationen auf. Eine Iteration besteht aus vier Übergangsphasen, d. h. zwei einfachen und zwei doppelten Aufstützphasen. Das folgende iterative Schema wird eingeführt, um den gelernten CAM zu aktualisieren: $l_{c, l, i + 1} (t) = (1 - k_{l}) (l_{c, p, i} (t)) + k_{l} (l_{c, r, i} (t)) .$
Hierbei ist 0 ≤ k_l ≤ 1 ein Lernfaktor und l_c,p,i ist die Polynomfunktion zur Approximation des gelernten CAM l_c,l,i während der i-ten Iteration. Der Referenz-CAM l_c,r,i ergibt sich aus (7) unter Verwendung der CoM-Geschwindigkeit ẋ_i und der CMM A̅_i der aktuellen Iteration und dem Referenz-Aufgabenraumgeschwindigkeitsvektor, der vom Planner erhalten wird.
Am Ende jeder Übergangsphase innerhalb einer Iteration wird der polynomische Anpassungsalgorithmus aus Abschnitt IV-B auf l_c,l,i+1 angewandt, um l_c,p,i+1 f für die jeweilige Übergangsphase zu erhalten. Das Aktualisierungsverfahren ist inspiriert von einer Run-by-Run-Steuerung (vgl. Dokument [28]), welche Eingangsparameter zwischen Iterationen auf der Grundlage von Messungen aktualisiert, die während der laufenden Iteration durchgeführt werden. Dabei ist zu beachten, dass das Lernen des Referenz-CAM nur während der ersten Iteration nicht ausreichend ist, da das resultierende l_c,p,i während der Planung für die nächste Iteration verwendet wird. Dies beeinflusst die CoM-Trajektorie und damit auch die Roboterkonfiguration und Gelenkgeschwindigkeiten, da die Füße im kartesischen Raum definiert sind. Folglich unterscheidet sich der resultierende CAM der nächsten Iteration von der in der Planung verwendeten. Höhere Werte von k_l führen zu einer schnelleren Konvergenz, während niedrigere Werte zu einer robusteren Konvergenz führen.
Die gelernten Polynomkoeffizienten a_l sind immer einem bestimmten Satz von Gehparametern zugeordnet. Wie in Dokument [17], kann das gewonnene Wissen genutzt werden, um eine Datenbank von typischen Gehparametern aufzubauen, die auch in der Simulation vortrainiert werden kann.
B. Online-Aktualisierung der DCM-Trajektorie
In der ersten Iteration wird die Polynomkoeffizientenmatrix a_l für die CAM-Referenz mit Null initialisiert und die gesamte DCM-Referenztrajektorie wird berechnet. Dabei ist zu beachten, dass, wenn Werte für a_l bereits aus früheren Läufen vorliegen, können diese stattdessen verwendet werden, um die Konvergenz zu beschleunigen. Wenn aktualisierte Werte für a_l,φ,i+1 am Ende der Übergangsphase φ vorliegen, wird das DCM-Rückwärtsiterationsschema angewandt, beginnend von dem Ende der Übergangsphase φ + 4 unter Verwendung der neuen Polynomkoeffizienten der Iteration i + 1. Als terminale DCM-Einschränkung für die Rückwärtsiteration wird die terminale DCM am Ende der Phase φ+4 der ersten Iteration, d. h. ξ_T,φ+4,0, verwendet. Das während der aktuellen Iteration erlangte Wissen wird direkt in der nachfolgenden Iteration angewandt.
Um die Kontinuität der aktualisierten DCM-Referenz zu Beginn der Phase φ+1 zu gewährleisten, wird die finale DCM der Phase φ+1, d. h. ξ_T,φ+1, zwischen ihren Werten während der aktuellen und der nächsten Iteration linear interpoliert ${\dot{ξ}}_{T, φ + 1} (t) = (1 - \frac{t}{T_{φ + 1}}) {\dot{ξ}}_{T, φ + 1, i} + \frac{t}{T_{φ + 1}} {\dot{ξ}}_{T, φ + 1, i + 1} .$
C. Erzeugen einer gewünschten CAM-Trajektorie
In diesem Abschnitt wird eine gewünschte CAM-Trajektorie entworfen, die der Ganzkörpersteuerung befohlen wird, um das Kontaktdrehmoment-Tracking zu gewährleisten. Für die xy-Richtung (Ebene parallel zur Aufstützfläche) kann das CoP-Tracking erreicht werden, indem der gewünschte CAM gewählt wird, der gleich dem polynomischen approximierten CAM ist, der in der Planung verwendet wird, d. h. $l_{c, d | x y} = l_{c, p | x y' .}$
Aus (8) ergibt sich für das Kontaktdrehmoment um die z-Achse (in Bezug auf die Aufstützfläche) $τ_{g r f, z} = m (x_{x} - p_{d, x}) {\ddot{x}}_{y} - m (x_{y} - p_{d, y}) {\ddot{x}}_{x} + {\dot{l}}_{c, z} .$
Eine reine Aufhebung von i_c,z, wie sie in Dokumenten [20]-[22] vorgeschlagen ist, reicht hier nicht aus, da die aus dem Kreuzprodukt resultierenden Terme nicht verschwinden, da nicht geplant ist, dass der externe Kraftvektor die gewünschten CoP- und CoM-Position schneidet. Um die Kreuzproduktterme zu kompensieren und τ_grf,z = 0 sicherzustellen, wird die gewünschte Änderungsrate von CAM um die z-Achse wie folgt definiert ${\dot{l}}_{c, d, z} = - m (x_{x} - p_{d, x}) {\ddot{x}}_{y} + m (x_{y} - p_{d, y}) {\ddot{x}}_{x} + {\dot{l}}_{c, z}^{c o r} .$
Der entsprechende CAM ergibt sich durch numerische Integration. Um eine symmetrische Bewegung des Roboters sicherzustellen, z. B. nach dem Übergang zwischen verschiedenen Gehgeschwindigkeiten, wird ein Korrekturterm ${\dot{l}}_{c, z}^{c o r}$
angewandt. Dabei ist anzumerken, dass ${\dot{l}}_{c, z}^{\bar{c o r}}$
nur in doppelten Aufstützphasen aktiv ist, da der Roboter wesentlich mehr vertikale CAM erzeugen kann, wenn zwei Füße in Kontakt sind.
Um umfangreiche Bewegungen des Oberkörpers während den Übergangsphasen zu vermeiden, in denen die Polynomkoeffizientenmatrix a_l Null ist, z. B. während der Start- oder Endphase oder der ersten Iteration, wird der gewünschte CAM während dieses Zeitraums als Referenz-CAM gewählt, d. h. l_c,d = l_c,r.
VI. Experimentelle Evaluierung
Der oben dargestellte Algorithmus wurde durch Experimente mit dem drehmomentgesteuerten humanoiden Roboter TORO validiert (vgl. Dokument [29]). Der Roboter hat 27 Freiheitsgrade, eine Höhe von 1,74 m und ein Gesamtgewicht von 79,2 kg. TORO hat Kraft-Drehmoment Sensoren in seinen Füßen und eine Inertialmesseinheit (IMU) im Torso.
Vorgestellt werden zwei Szenarien zur Evaluierung der Leistung des Algorithmus.
Im ersten Szenario führt der Roboter ein gerades Gehen mit 12 Schritten (entsprechend 5 Iterationen) durch mit einer Schrittlänge von 15 cm, einer Einzelaufstützzeit T_SS = 0,7 s, einer Doppelaufstützzeit T_DS = 0,2 s und einer Stand-zu-Gehzeit T_SW = 0,5 s. Es wird angenommen, dass keine gelernten Polynomkoeffizienten aus früheren Läufen verfügbar sind, d. h. die Polynomkoeffizientenmatrix wird mit Null (a_l = 0) initialisiert.
In 4 sind der resultierende Referenz-CAM, der sich aus den Referenz-Aufgabenraumgeschwindigkeiten ergibt, der polynomische approximierte CAM, der während der Planung verwendet wird, und der gewünschte CAM, der dem Roboter befohlen wird, dargestellt. In der initialen Iteration, der Start- oder der Endphase wird die geplanten CAM definiert als Referenz-CAM l_c,d|xy = l_c,r|xy andernfalls gilt l_c,d|xy = l_c,p|xy.
In xy-Richtung ist zu sehen, dass l_c,p|xy während der Iteration 0 Null ist, aber in den folgenden Zyklen zu l_c,r|xy konvergiert. Für die Näherung von l_c,r|xy wird ein Polynom 9. Ordnung verwendet. Ein Zeitintervall von Δt = 50 ms wurde gewählt, während die Abtastfrequenz des Systems Δt_s = 1 ms ist. Der Lernfaktor wurde auf k_l = 1 festgelegt, das Konvergenzverhalten ist in 7 dargestellt.
Der Verlauf von l_c,r variiert leicht zwischen Iteration 0 und den folgenden Iterationen, da die aktualisierte CoM-Trajektorie die Roboterkonfiguration und damit den resultierenden CAM beeinflusst.
Der Effekt des gelernten CAM ist in 5 zu sehen. Beginnend mit Iteration 1 wird die VRP-Trajektorie basierend auf den gelernten Polynomkoeffizienten aktualisiert. Dem Aktualisierungsschema aus Abschnitt V-B folgend, werden kontinuierliche DCM- und CoM-Trajektorien bereitgestellt. 5 zeigt VRP (v), DCM (ξ) und CoM (x) Trajektorie.
Die resultierenden Kontaktdrehmomente an der gewünschten CoP-Position sind in 6 dargestellt. 6 zeigt die Kontaktdrehmomente an der gewünschten CoP Position des linken Fußes bei Einzelaufstützung für mehrere Iterationen bei lokaler Iterationszeit. Die Limits sind durch die entsprechend transparenten Linien dargestellt. Durch die aktualisierte VRP-Referenz und die entsprechende Ausgestaltung der gewünschten CAM-Trajektorie, konnten die Kontaktdrehmomente ab Iteration 1 im Vergleich zu Iteration 0 deutlich reduziert werden, was als Ausgangsbasis für das Gehen ohne unseren vorgestellten Ansatz angesehen werden kann. Unter der Annahme eines perfekten Trackings würden die Kontaktdrehmomente auf Null reduziert werden; allerdings verschlechtern Modellunsicherheiten sowie Tracking-Fehler das Ergebnis. Die Drehmomentgrenzen in xy-Richtung werden auf der Grundlage der CoP-Beschränkung berechnet. Da die Ganzkörpersteuerung eine Schraubenschlüsselformulierung verwendet, werden die Drehmomentgrenzen um die z-Achse durch obere und untere Werte approximiert. Weitere Details finden Sie in Dokument [23]. Die reduzierten Kontaktdrehmomente um alle drei Achsen führen zu einem robusteren Gehverhalten, was in dem ergänzenden Video zu sehen ist. Während Iteration 0 kippen und verdrehen sich die Füße des Roboters leicht, da das CoP in x- und y-Richtung den Rand der Aufstützfläche erreicht und die Drehmomentgrenzen um die z-Achse aktiviert sind. In den folgenden Iterationen werden keine Verletzungen der Kontaktbeschränkungen beobachtet, wodurch die erhöhte Kontaktrobustheit bestätigt wird.
Die Steuereingangsleistung, berechnet als das Produkt aus befohlenen Gelenkgeschwindigkeiten und Drehmomenten, ist in 7 dargestellt. Auf der linken Seite in 7 ist der durchschnittliche normalisierte Approximationsfehler zwischen l_c,l,i und l_c,p,i für eine gegebene Iteration mit k_l = 1 dargestellt. Auf der rechten Seite ist in 7 die Steuereingangsleistung für die gegebene Iteration gezeigt. Die horizontalen Linien geben die durchschnittliche Steuereingangsleistung über eine Iteration an. Die Einbeziehung des CAM während der Planung führt zu einem reduzierten durchschnittlichen Steuereingriff.
In einem zweiten Szenario wurde die Schrittlänge auf 22 cm erhöht, während die übrigen Gehparameter unverändert beibehalten wurden. Diese verbesserte Leistung konnte nur durch die Verwendung von Polynomkoeffizienten erreicht werden, die in der Simulation vortrainiert wurden. Wie ebenfalls in Dokument [18] berichtet, gelingt es TORO nicht, mit einer Schrittlänge von 15 cm mehr als drei Schritte ohne Online-Anpassung der Trajektorie zu gehen. Der vorliegende Ansatz ermöglicht flachfüßiges Gehen mit einer Schrittlänge von 22 cm, was eine Steigerung von mehr als 50 % bedeutet, während die gleichen Gehparameter und die gleiche Ganzkörpersteuerung verwendet werden wie in Dokument [23].
ANHANG
A. Vandermonde-Submatrizen
Die Submatrizen in (16) sind gegeben durch $V_{1} (t) = V_{11} (t) + V_{12} (t) + V_{13} (t)$
mit $\begin{array}{l} V_{11} (t) = [t^{n_{l}}, t^{[n_{l} - 1]}, \dots, t^{4}], \\ V_{12} (t) = - [(n_{l} - 2) T_{φ}^{(n_{l} - 3)}, (n_{l} - 3) T_{φ}^{(n_{l} - 4)}, \dots,2 T_{φ}] t^{3}, \\ V_{13} (t) = [(n_{l} - 3) T_{φ}^{(n_{l} - 2)}, (n_{l} - 4) T_{φ}^{(n_{l} - 3)}, \dots, T_{φ}^{2}] t^{2}, \\ V_{2} (t) = (\frac{2 t^{3}}{T_{φ}^{3}} + \frac{3 t^{2}}{T_{φ}^{2}} + 1, \frac{t^{3}}{T_{φ}^{2}} + \frac{2 t^{3}}{T_{φ}} + t, - \frac{2 t^{3}}{T_{φ}^{3}} - \frac{3 t^{2}}{T_{φ}^{2}}, \frac{t^{3}}{T_{φ}^{2}} + \frac{t^{2}}{T_{φ}}) \\ {[l_{c, l} (0), {\dot{l}}_{c, l} (0), l_{c, l} (T_{φ}), {\dot{l}}_{c, l} (T_{φ})]}^{T} . \end{array}$
B. Polynomkoeffizienten
Die verbleibenden Polynomkoeffizienten werden basierend auf a_l,4:nl aus (17) und den Randbedingungen für die entsprechende Übergangsphase berechnet $\begin{array}{l} (\begin{matrix} a_{l,0} \\ a_{l,1} \\ a_{l,2} \\ a_{l,3} \end{matrix}) = [\begin{matrix} I & 0 & 0 & 0 \\ 0 & I & 0 & 0 \\ \frac{- 3}{T_{φ}^{2}} I & \frac{- 2}{T_{φ}} I & \frac{3}{T_{φ}^{2}} I & \frac{- 1}{T_{φ}} I \\ \frac{2}{T_{φ}^{3}} I & \frac{1}{T_{φ}^{2}} I & \frac{- 2}{T_{φ}^{3}} I & \frac{1}{T_{φ}^{2}} I \end{matrix}] (\begin{matrix} l_{c, l} (0) \\ {\dot{l}}_{c, l} (0) \\ l_{c, l} (T_{φ}) \\ {\dot{l}}_{c, l} (T_{φ}) \end{matrix}) \\ + {(0^{T} {,0}^{T}, Σ_{i = 4}^{n_{l}} (i - 3) T_{φ}^{i} a_{l, i}^{T}, Σ_{i = 4}^{n_{l}} (i - 2) T_{φ}^{i} a_{l, i}^{T})}^{T} . \end{array}$

Claims

Verfahren zur Gangsteuerung eines, insbesondere humanoiden, Roboters, mit den Schritten: a) Bereitstellen einer geplanten Aufgabenraumtrajektorie X; b) Bereitstellen einer geplanten Trajektorie des Druckzentrums a_p; c) Berechnen einer geplanten Trajektorie des Massenzentrums x anhand der geplanten Trajektorie des Druckzentrums a_p; d) Empfangen einer gemessenen Trajektorie des Massezentrums x_m des Roboters und einer gemessenen Aufgabenraumtrajektorie Xm des Roboters; e) Berechnen von Steuerbefehlen τ für den Roboter anhand der geplanten Aufgabenraumtrajektorie X, der gemessenen Trajektorie des Massezentrums x_m des Roboters, der gemessenen Aufgabenraumtrajektorie X_m des Roboters, der geplanten Trajektorie des Massenzentrums x und einer gelernten Information über die Trajektorie des Schwerpunktsdrehimpulses; und f) insbesondere Übertragen der Steuerbefehle τ an den Roboter.
Verfahren nach Anspruch 1, gekennzeichnet durch ein Wiederholen der Verfahrensschritte c) bis f), insbesondere für n-1 Male, wobei n die Anzahl der Iterationen der Trajektorie ist.
Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die geplante Trajektorie des Massenzentrums x anhand der geplanten Trajektorie des Druckzentrums a_p und eines gelernten Schwerpunktsdrehimpulses a_τ ermittelt wird.
Verfahren nach einem der Ansprüche 1-3, dadurch gekennzeichnet, dass der gelernte Schwerpunktsdrehimpuls a_τ anhand der geplanten Aufgabenraumtrajektorie X, der geplanten Trajektorie des Massenzentrums x, und eines Rotationsteils einer Schwerpunktsdrehimpulsmatrix A̅ ermittelt wird.
Verfahren nach einem der Ansprüche 1-4, dadurch gekennzeichnet, dass der Rotationsteil der Schwerpunktsdrehimpulsmatrix A̅ anhand der tatsächlichen Trajektorie des Massezentrums x_m und der tatsächlichen Aufgabenraumtrajektorie Xm ermittelt wird.
Verfahren nach einem der Ansprüche 1-5, dadurch gekennzeichnet, dass die gelernte Trajektorie des Schwerpunktsdrehimpulses a_τ anhand der geplanten Aufgabenraumtrajektorie X, der geplanten Trajektorie des Massenzentrums x , und des Rotationsteils des Schwerpunktsdrehimpulsmatrix A̅ ermittelt wird.
Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass das Verfahren vor dem Schritt c) bei der ersten Verfahrensausführung, insbesondere der initialen Iteration i=0 von n Iterationen der Trajektorie, zusätzlich die Schritte umfasst: i) Berechnen von Steuerbefehlen τ für den Roboter anhand der geplanten Aufgabenraumtrajektorie X, und einer geplanten Trajektorie des Massenzentrums x, und ii) insbesondere Übertragen der Steuerbefehle τ für den ersten Schritt der Trajektorie an den Roboter,
Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass zur Ermittlung des gelernten Schwerpunktsdrehimpuls a_τ die gelernten Informationen über die Trajektorie des Schwerpunktsdrehimpulses durch ein Polynom n_l-ter Ordnung dargestellt werden.
Verfahren nach einem der Ansprüche 1 bis 8, dadurch gekennzeichnet, dass zur Ermittlung des gelernten Schwerpunktsdrehimpuls a_τ gilt: $l_{c, p} (t) = \sum_{i = 0}^{n_{τ}} (i + 1) a_{l, i + 1} t^{i} = \sum_{i = 0}^{n_{τ}} a_{τ, i} t^{i},$
$\begin{array}{l} l_{c, p} (t) = \sum_{i = 0}^{n_{l}} a_{l, i} t^{i} \\ a_{l,4; n_{l}}^{T} = {({\bar{V}}_{1}^{T} {\bar{V}}_{1})}^{- 1} {\bar{V}}_{1}^{T} ({\bar{l}}_{c, l}^{T} - {\bar{V}}_{2}) \\ l_{c, l, i + 1} (t) = (1 - k_{l}) (l_{c, p, i} (t)) + k_{l} (l_{c, r, i} (t)), und \\ l_{c} = \bar{A} (\begin{matrix} \dot{x} \\ \dot{χ} \end{matrix}) . \end{array}$
Verfahren nach einem der Ansprüche 1-9, dadurch gekennzeichnet, dass die Ermittlung des Rotationsteil der Schwerpunktsdrehimpulsmatrix A̅ durch eine Berechnung aus der Roboterdynamik zur Laufzeit, insbesondere mittels einer Ganzkörpersteuerung erfolgt.
Verfahren nach einem der Ansprüche 1-10, dadurch gekennzeichnet, dass zur Ermittlung der gelernten Trajektorie des Schwerpunktsdrehimpulses l_c,d gilt, dass i_c,d,z anhand der geplanten Trajektorie des Massenzentrums x und anhand der geplanten Trajektorie des Druckzentrums a_p bestimmt wird, und dass l_c,d|xy = l_c,plxy.
Verfahren nach einem der Ansprüche 1-11, dadurch gekennzeichnet, dass die Berechnung der Steuerbefehle τ mittels einer Ganzkörpersteuerung erfolgt.
Verfahren nach einem der Ansprüche 1-12, dadurch gekennzeichnet, dass zur Berechnung der geplanten Trajektorie des Massenzentrums x das Divergent Component of Motion (DCM) - Framework genutzt wird.
Verfahren nach einem der Ansprüche 1-13, dadurch gekennzeichnet, dass zur Berechnung der geplanten Trajektorie des Massenzentrums x gilt: $e (t) = \sum_{i = 0}^{n_{p}} a_{p, i} t^{i} + \frac{1}{m g} \sum_{i = 0}^{n_{τ}} a_{τ, i} t^{i},$
$\begin{array}{l} ν = e + {(0,0, Δ z)}^{T'}, \\ \dot{ξ} = \frac{1}{b} (\dot{ξ} - ν), \end{array}$
$\dot{ξ} = x + b \dot{x}$
wobei vorzugsweise in der initialen Iteration i=0 von n Iterationen der gelernten Schwerpunktsdrehimpulses a_τ = 0 ist.
Verfahren nach einem der Ansprüche 1-14, dadurch gekennzeichnet, dass die gemessene Trajektorie des Massezentrums x_m und/oder die gemessenen Aufgabenraumtrajektorie Xm durch mindestens einen Sensor des Roboters erfasst wird.
Regler zur Ausführung eines Verfahrens nach 1-15.
Computerprogramm umfassend Befehle, die bei der Ausführung des Programms durch einen Computer diesen veranlassen, das Verfahren nach einem der Ansprüche 1-15 auszuführen.
Robotersystem, mit einem, insbesondere humanoiden, Roboter, und einem mit dem Roboter verbundenen Regler nach Anspruch 16.