-
Die Erfindung betrifft ein Verfahren und eine Vorrichtung zum Steuern eines Fahrzeugs.
-
Aufgabe und Lösung
-
Aufgabe der vorliegenden Erfindung ist es, ein Verfahren und eine Vorrichtung bereitzustellen, die in eine Steuerung eines Fahrzeugs effizient ermöglicht.
-
Gelöst wird die Aufgabe durch ein Verfahren gemäß dem unabhängigen Anspruch und eine Vorrichtung gemäß dem Nebenanspruch. Weitere vorteilhafte Ausgestaltungen der Erfindung sind Gegenstand der Unteransprüche.
-
Das erfindungsgemäße Verfahren zum Steuern eines Fahrzeugs umfasst die Schritte, Vorgeben von Wegpunkten und einer Geschwindigkeitsbeschränkung zu einem Ziel, Ermittelt von Splines für kartesische Koordinaten und ein jeweils dazugehörender Geschwindigkeitsfaktor, sodass die Wegpunkte und/oder das Geschwindigkeitsprofil approximiert werden und dabei eine nötige Ableitung der Splines möglichst glatt sind, Berechnen einer Referenztrajektorie aus den Splines, deren Ableitungen und einer vorgegebenen Geschwindigkeit, und Steuern des Fahrzeugs anhand der Referenztrajektorie.
-
In vorteilhafter Weiser können die Splines ohne numerisches Differenzieren gewonnen werden, was die Steuerung des Fahrzeugs vereinfacht.
-
Bevorzugt können eine Fahrzeuggeschwindigkeit und eine Fahrzeuggierrate aus den Splines bestimmt werden.
-
Weiter bevorzugt kann die Steuerung des Fahrzeugs mittels einer modellprädiktiven Folgeregelung durch eine Anpassung der Fahrzeuggeschwindigkeit und der Fahrzeuggierrate an den zukünftigen Verlauf der kartesischen Koordinaten erfolgen. In vorteilhafter Weise kann die modellprädiktive Folgeregelung innerhalb des Prädiktionshorizontes einen Verlauf der Zustandsgrößen vorhersagen und dadurch die Folgeregel verbessern.
-
Die modellprädiktive Folgeregelung kann des Weiteren unabhängig vom tatsächlichen Fahrzeugmodell genutzt werden, weil sie keine Parameter der fahrzeugspezifischen Fahrdynamik enthält.
-
Eine Anpassung des Verfahrens oder der Vorrichtung auf verschiedene Fahrzeugtypen ist dadurch weniger aufwendig.
-
In einer bevorzugten Ausgestaltung kann die Anpassung der Fahrzeuggeschwindigkeit und der Fahrzeuggierrate ferner mittels einer modellfreien Fahrzeugregelung erfolgen.
-
In vorteilhafter Weise kann eine konstante Regelverstärkung im gesamten Geschwindikeitsbereich erfolgen.
-
In einer weiteren Ausgestaltung der Erfindung kann die modellfreie Fahrzeugregelung die Fahrzeuggeschwindigkeit und die Fahrzeuggierrate getrennt nach den kartesischen Koordinaten approximieren.
-
In vorteilhafter Weise müssen dadurch weniger Fahrzeugparameter für die Fahrzeuggeschwindigkeit und die Fahrzeuggierrate berücksichtigt werden.
-
Erfindungsgemäß ist eine Vorrichtung in einem Fahrzeug eingerichtet, ein Verfahren gemäß einer der genannten bevorzugten Ausgestaltungen auszuführen.
-
Figurenbeschreibung
-
Die Geleichungen 1-6 beschreiben eine ebene Fahrzeugbewegung und setzt sich zusammen aus drei Differenzialgleichungen für die Kinematik des Fahrzeugs und drei für die Fahrzeugdynamik, wobei letztere sich aus den Kräfte- und Momentengleichgewichten im bzw. um den Schwerpunkt ergeben,
-
Die Kräfte F
Wx und F
Wy sind Störgrößen durch Wind und Straßenneigung und sollen ausschließlich im Schwerpunkt angreifen. Sie können beschrieben werden als
-
Zustandsgrößen für die Kinematik sind die inertialen, kartesischen Positionen x und y des Schwerpunkts und der Gierwinkel ψ. Als dynamische Zustandsgrößen werden hier die Fahrzeuggeschwindigkeit v, der Schwimmwinkel β und die Gierrate ω gewählt. Die Stellgrößen zur Beeinflussung der Fahrzeugbewegung sind das Lenkmoment Ms und das Radmoment M
D als Antriebs- oder Bremsmoment. Die Stellgrößen sind begrenzt und u.a. durch das Fahrzeugkommunikationssystem mit einer Totzeit τ behaftet. Aktoren, wie z.B. eine elektrische Servolenkung EPS, ein Stabilitätsregelsystem ESC und ein Antriebsmotor, wandeln die Stellgrößen in den Lenkwinkel δ bzw. die Längskraft F
xr am Rad. Die Aktordynamik von Lenkung und Rad mit der Raddrehgeschwindigkeit ω
R sowie den Störgrößen Fahrerlenkmoment M
H, Radwiderstandsmoment M
W und Reifenrückstellmoment η
RF
yf ist gegeben durch
-
Kinematisches Fahrzeugmodell:
-
Zur Modularisierung der Bewegungssteuerung wird die Regelstrecke in zwei Teilsysteme zerlegt, die einseitig verkoppelt sind. Das Teilsystem Fahrzeugdynamik beeinflusst die Fahrzeugkinematik, erfährt jedoch selbst keine Rückkopplung aus dieser, d.h. die Fahrzeugdynamik ist in erster Näherung unabhängig von der Lage des Fahrzeugs. Die Fahrzeugkinematik hingegen verknüpft nur Zustandsgrößen und benötigt keine Parameter. Die dynamischen Zustandsgrößen werden als Eingangs- bzw. Stellgrößen des kinematischen Fahrzeugmodells interpretiert. Hierbei sind die Fahrzeuggeschwindigkeit und die Gierrate die beiden dynamischen Stellgrößen. Der Schwimmwinkel wird als Störgröße betrachtet und für die weiteren Betrachtungen als vernachlässigbar angesehen. Die gesamte Aktor- und Fahrzeugdynamik soll durch unterlagerte Regler eine verstärkungs- und verzögerungsfreie Übertragungsfunktion besitzen. Die Verzögerungsfreiheit für die „kinematischen Stellgrößen“ v und ω ist jedoch bei realen Fahrzeugen nicht möglich. Es wird deshalb vereinfachend von Übertragungsfunktion erster Ordnung mit den Zeitkonstanten T
v bzw. T
ω für die Stellgrößen ausgegangen. Das kinematische Fahrzeugmodell hat mit den neuen Stellgrößen u
Long und u
Yaw die Form
-
Trajektoriegenerierung:
-
Wegpunkte beschreiben die geometrische Fahrzeug-Referenzposition in einem inertialen kartesischen Koordinatensystem. Ziel der Folgeregelung ist es, die Referenzpositionen zu genau festgelegten Zeitpunkten zu erreichen. Deshalb ist zusätzlich zu den Positionen die Vorgabe eines Geschwindigkeitsprofils notwendig. Die diskreten, raumbezogenen Daten werden als Funktion der zu fahrenden Strecke, d.h. der Bogenlänge s, von einer übergeordneten Planung ermittelt. Diese Planung wird als gegeben vorausgesetzt und nicht weiter beschrieben.
-
Differenzielle Flachheit erlaubt, sämtliche Zustands- und Eingangsgrößen eines Systems in Abhängigkeit eines flachen Ausgangs und seiner Zeitableitungen darzustellen. In der Regel werden so viele flache Ausgangsgrößen benötigt, wie das System Eingangsgrößen besitzt. Die Flachheitseigenschaft vereinfacht die Erzeugung von Referenztrajektorien denen das System folgen kann, weil hierzu einfache algebraische Zusammenhänge programmiert werden können und keine Differenzialgleichungen numerisch gelöst werden müssen. Für das kinematische Fahrzeugmodell sind die Positionsgrößen flache Ausgangsgrößen, d.h. mit den beiden Referenzgrößen x
d und y
d sowie deren Ableitungen ergeben sich die übrigen Zustands-und Eingangsgrößen des kinematischen Modells als
-
Die Parametrierung des flachen Ausgangs soll mit sogenannten Splines erfolgen, weil die Ableitungen ohne numerisches Differenzieren leicht gewonnen werden können. Um definierte Referenztrajektorien für den gesamten Geschwindigkeitsbereich einschließlich Stillstand zu erhalten, wird die geometrische von der zeitlichen Pfadinformation separiert. Hierzu müssen die Referenztrajektorien mit der Bogenlänge umparametriert werden. Die Zeitinformation steckt jetzt in der zeitlichen Änderung der Bodenlänge, mit dem Geschwindigkeitsfaktor
Am Beispiel der x-Position soll das Vorgehen erläutert werden. Es ist
-
Die Splines für x
d(s), y
d(s) und λ(s) werden so gewählt, dass sie die vorgegebenen Wegpunkte bzw. das Geschwindigkeitsprofil approximieren und die Ableitungen möglichst glatt sind. Falls die Zeit explizit benötigt wird, kann diese als eine diskrete Zeit aus der Folge von Wegpunkten x
d,i, y
d,i mit zugehöriger Geschwindigkeit v
d,i wie folgt berechnet werden
-
Der diskrete Geschwindigkeitsfaktor λi ergibt sich mit den als äquidistant angenommenen Weginkrementen Δs zu
-
1 zeigt beispielhaft die Generierung einer Referenztrajektorie: a) Sollbahn zusammengesetzt aus Geraden und Kreisbogen mit R=200m, vorgegebene Wegpunkte im Abstand von 25m und Approximation durch kubischen B-Spline, b) Spline der Soll-y-Position als Funktion der Bogenlänge, c) Geschwindigkeitsfaktor zur Skalierung des Spline, d) Referenztrajektorie für die y-Position als Funktion der Zeit, e) Bogenlänge als Funktion der Zeit.
-
Modellprädiktive Folgeregelung:
-
Ausgangspunkt für die Trajektorien-Folgeregelung ist das kinematische Fahrzeugmodell (
10-
14), das mit dem expliziten Eulerverfahren für die Abtastzeit T
s diskretisiert und anschließend entlang der Referenztrajektorie linearisiert wird.
Das Ergebnis ist ein diskretes lineares zeitvariantes Systemmodell, das die Abweichungen Δx = x - x
d zur Solltrajektorie beschreibt mit dem zugehörigen Eingangsvektor Δu = u - u
d, d.h.
-
Die Modellprädiktive Regelung optimiert online in jedem Abtastschritt den Stellgrößenverlauf für einen endlichen Prädiktionshorizont N und nutzt das Systemmodell zur Bestimmung des zukünftigen Zustandsgrößenverlaufs. Die Optimierung wird als quadratisches Programm formuliert für das sehr effiziente Lösungsalgorithmen zur Verfügung stehen [11]. Die „Stapelform“ des Systemmodells für den Prädiktionshorizont N lautet mit der vereinfachten Schreibweise Δx(k|k) =Δx
0, A(k|k) =A
0, A(k+1|k) = A
1, ..., B(k|k)=B
0, B(k+1|k) = B
1, ...,
-
Zur Lösung des Optimierungsproblems wird die folgende quadratische Kostenfunktion verwendet
mit der positiv semidefiniten Bewertungsmatrix Q für die Zustände und der positiv definiten Bewertungsmatrix R für die Stellgrößen. Der Endzustand des Horizonts kann separat mit der positiv semidefiniten Bewertungsmatrix P gewichtet werden. Die Kostenfunktion kann in die Standardbeschreibung für die quadratische Programmierung umgeformt werden, d.h.
mit
-
Hierbei bringen nicht von den Stellgrößen abhängige Glieder keinen Beitrag in der Optimierung und werden daher vernachlässigt. Beschränkungen in den absoluten Stellgrößen werden als Nebenbedigungen formuliert
Zusätzlich können Zwangsbedigungen an beliebige Ausgangsgrößen
in der Form
mit
berücksichtigt werden.
-
Modellfreie Fahrzeugregelung:
-
Die nichtlineare Fahrzeugdynamik wird für die Längs- und Querbewegung getrennt lokal approximiert durch jeweils einfache lokal gültige Modelle entsprechender Ordnung n, mit
-
Der Systemeingang wird als affin betrachtet und alle Kopplungs- und Störeinflüsse durch den unbekannten Term f repräsentiert. Einziger Parameter des Modells ist der als konstant angesehene Faktor b vor dem Systemeingang.
-
Zur Schätzung von f wird angenommen, dass die unbekannte Systemdynamik in einem sehr kleinen Zeitfenster, z.B. zwischen zwei Abtastzeitpunkten, konstant ist. Ein Umstellen der Systemgleichung (
46) liefert eine Approximation auf der Basis der Stell- und Messgröße,
-
Für die Approximation von f wird eine Schätzung der (n)-ten Ableitung von y benötigt. Der Aufbau des Ableitungsschätzers für i.a. lineare, zeitvariante Systeme wird im Folgenden für n=2 erläutert. Aus dem homogenen System
mit
kann der Zustand x(t1) im Interval [t
0, t
1] rekonstruiert werden, wenn die Rekonstruierbarkeits-Gramsche Matrix
vollen Rang aufweist. Eine Schätzung x
est(t
1) des Zustands x(t
1) ist dann gegeben durch
-
Die Fundamentalmatrix Φ zum System (
51) ist
Wählt man ein Zeitfenster T > 0 fester Breite und ersetzt to = t - T und t
1 = t, dann folgt daraus die Gramsche Matrix
-
Die Schätzung ergibt sich damit als
-
Setzt man jetzt τ= t - σ und dτ= -dσ in (
56) ein, so erhält man schließlich die Schätzung der Ableitungen durch Integration aus dem gemessenen Signal y im Zeitfenster T mit
-
Für die Diskretisierung von Gl. (57) wird das Zeitfenster T = N
sT
s gesetzt, d.h. als ganzzahliges Vielfaches N
s der Abtastzeit T
s. Es ergibt sich
-
Mit der Simpson-Regel
für die Schrittweite h = (b-a)/(N-1) = T
s lässt sich das Integral (
58) numerisch lösen. Mit dem Zeitfenster T=0,1s und einer Abtastzeit T
s=0,01s ergibt sich N
s=10, d.h. es werden in jedem Abtastschritt neben dem aktuellen Messwert von y noch
10 vergangene Werte zur Schätzung der Ableitungen benötigt. Die Übertragungsfunktion für die zweite Ableitung in (
58) stellt einen FIR (Finite Impulse Response) Filter der Ordnung N
s=10 dar, mit
-
Die Stellgröße u sollte zeitverschoben mit Ns/2 oder ebenfalls mit einem FIR-Filter der Ordnung Ns=10 gefiltert in der Gl. (47) berücksichtigt werden.
-
Die modellfreie Regelung besteht aus einer Vorsteuerung mit der Ableitung des Referenzsignals y
d, der Aufschaltung der Schätzung der unbekannten Systemdynamik fest und einem PID-Regler für die Regelabweichung e = y
d - y, d.h.
-
Zur Abschätzung der Ordnungen n, der unbekannten Systemdynamik f und des Eingangsfaktors b der Regelstrecken wird von linearen Reifenkräften ausgegangen, d.h.
mit den Reifensteifigkeiten C
x, C
f und C
r, dem Längsschlupf s
x und den Schräglaufwinkeln α
f bzw. α
r
unter Berücksichtigung der stationären Anfangsgeschwindigkeit v
s . Für die Längsdynamik ergibt sich aus (
4) und (
9) unter Vernachlässigung von Mw das Modell zweiter Ordnung
mit
-
Es wird ein Regler der Form (
61) mit n = 2 zur Regelung der Längsgeschwindigkeit verwendet. Da die Strecke (
64) für die Regelgröße v einen Integrator enthält, genügt ein PD-Regler für die Regelabweichung. Die Querdynamik wird aufgeteilt in die Aktordynamik zweiter Ordnung aus (
8)
und die Gierdynamik erster Ordnung aus (
6)
-
Es werden zwei Regler der Form (61) kaskadiert, wobei der äußere für n = 1 die Gierrate mit einem PI-Regler regelt und einen Lenkwinkel-Sollwert für den inneren Lenkwinkelregler liefert. Dieser ist für n = 2 ausgelegt und enthält einen PID-Regler.
-
2 zeigt die Gesamtregelstruktur als kaskadiertes Regelsystem. Die äußere Kaskade regelt die Position und Orientierung des Fahrzeugs mit Hilfe der modellprädiktiven Regelung (Model Predictive Control, MPC) und die innere Kaskade die Längs- und Querdynamik mit Hilfe der modellfreien Regelung (Model Free Control, MFC).
-
Für die Bewertung der Qualität der Folgeregelung kann als Fehlermaß die Abweichung des fahrzeugfesten Koordinatensystems von einem mitbewegten, natürlichen Koordinatensystem, dem sog. Serret-Frenet System, herangezogen werden. Die Achsen des Serret-Frenet Koordinatensystems sind entlang der Tangente und der Normalen des vorgegebenen Pfades ausgerichtet. Hierbei wird der Winkel vom Inertialsystem zur Tangente als Kurswinkel Φ
d = ψ
d + β
d aufgefasst, weil der Schwimmwinkel des Fahrzeugs bei Kurvenfahrten nicht vernachlässigt werden darf. Da das kinematische Referenzmodell (
10-
14) keinen Soll-Schwimmwinkel berücksichtigt, wird für die Fehlerauswertung der Soll-Gierwinkel mit dem Ist-Schwimmwinkel korrigiert. Die Gln. (
68-
70) beschreiben die Fehler et und e
n in Tangenten- bzw. Normalenrichtung, im Folgenden als Längs- bzw. Querfehler bezeichnet, und e
ψ ist der Gierwinkelfehler.
Sprungförmige Referenzgrößen regen die modellfreie Regelung zu Schwingungen an, siehe
3.
-
3 zeigt eine schlechte Regelqualität bei sprungförmigen Vorsteuergrößen im MPC für die Bahn aus 1. Die Diagramme in 3 zeigen im Einzelnen: a) Gierraten-Referenzgrößen aus flacheitsbasierter Trajektoriengenerierung für den Zustand ωd (glatt) und die Stellgröße uYaw,d (sprungförmig). b) Gierraten-Stellgröße bei Verwendung von alternativen Vorsteuergrößen im MPC. c) Lenkwinkel-Stellgröße des Gierraten-MFC bei Verwendung von alternativen Vorsteuergrößen im MPC. d) Zugehörige Querfehler. e) Zugehörige Gierwinkelfehler
-
Durch Verwendung von Splines höherer Ordnung könnte die Regelung verbessert werden. Hier wird ein anderer Weg verfolgt, in dem zur Vorsteuerung der Gierrate in der modellprädiktiven Regelung statt der sprungförmigen Größe uYaw,d aus (21) die Gierrate ωd aus (17) verwendet wird. Diese entsteht aus einem Filter erster Ordnung für die Stellgröße uYaw,d . Die Regelfehler werden dann jedoch entsprechend größer.
-
Totzeiten kann die modellfreie Regelung relativ gut verkraften. Die Lenkwinkelregelung alleine kann bis zu τ
s=0,1s stabil ausgelegt werden. In der Kaskade mit der Gierratenregelung stellte sich jedoch schon für τ
s=0,03s die Abstimmung als schwierig heraus. Eine Verbesserung konnte durch eine Abschwächung der Aufschaltung von f
est in der Gierratenregelung mit einem Faktor K
f = 0,9 erreicht werden. Der Gierratenregler hat damit die gegenüber (
61) modifizierte allgemeine Form
Steht der Schwimmwinkel als Mess- oder Schätzgröße im Fahrzeug zur Verfügung, dann sollte man ihn im Abweichungsvektor Δx der modellprädiktiven Regelung berücksichtigen durch Aufschaltung auf die Gierwinkelabweichung in der Form
Störgrößen in der Fahrdynamik bilden sich sehr gut in der geschätzten Systemdynamik f
est der modellfreien Regelung ab und werden entsprechend gut kompensiert. Parameteränderungen spiegeln sich ebenfalls in f
est wider und werden stationär gut kompensiert. In den transienten Bereichen kann ein Ansteigen der Regelfehler (
68-
70) im Vergleich zum Nominalfall nicht verhindert werden. Hier könnten auf Seiten der modellprädiktiven Regelung weitere Maßnahmen getroffen werden, z.B. durch eine Störgrößenschätzung und -aufschaltung.