DE102017211485A1

DE102017211485A1 - Verfahren und Vorrichtung zum Steuern eines Fahrzeugs

Info

Publication number: DE102017211485A1
Application number: DE102017211485.1A
Authority: DE
Inventors: Thomas Raste; Peter Lauer; Fabian Hausberg; Thomas Berthold
Original assignee: Continental Teves AG and Co OHG
Current assignee: Continental Autonomous Mobility Germany GmbH
Priority date: 2017-07-05
Filing date: 2017-07-05
Publication date: 2019-01-10

Abstract

Verfahren zum Steuern eines Fahrzeugs mit den Schritten:
- Vorgeben von Wegpunkten und einer Geschwindigkeitsbeschränkung zu einem Ziel;
- Ermittelt von Splines für kartesische Koordinaten und ein jeweils dazugehörender Geschwindigkeitsfaktor, sodass die Wegpunkte und/oder das Geschwindigkeitsprofil approximiert werden und dabei eine nötige Ableitung der Splines möglichst glatt sind;
- Berechnen einer Referenztrajektorie aus den Splines, deren Ableitungen und einer vorgegebenen Geschwindigkeit; und
- Steuern des Fahrzeugs anhand der Referenztrajektorie.

Description

Die Erfindung betrifft ein Verfahren und eine Vorrichtung zum Steuern eines Fahrzeugs.
Aufgabe und Lösung
Aufgabe der vorliegenden Erfindung ist es, ein Verfahren und eine Vorrichtung bereitzustellen, die in eine Steuerung eines Fahrzeugs effizient ermöglicht.
Gelöst wird die Aufgabe durch ein Verfahren gemäß dem unabhängigen Anspruch und eine Vorrichtung gemäß dem Nebenanspruch. Weitere vorteilhafte Ausgestaltungen der Erfindung sind Gegenstand der Unteransprüche.
Das erfindungsgemäße Verfahren zum Steuern eines Fahrzeugs umfasst die Schritte, Vorgeben von Wegpunkten und einer Geschwindigkeitsbeschränkung zu einem Ziel, Ermittelt von Splines für kartesische Koordinaten und ein jeweils dazugehörender Geschwindigkeitsfaktor, sodass die Wegpunkte und/oder das Geschwindigkeitsprofil approximiert werden und dabei eine nötige Ableitung der Splines möglichst glatt sind, Berechnen einer Referenztrajektorie aus den Splines, deren Ableitungen und einer vorgegebenen Geschwindigkeit, und Steuern des Fahrzeugs anhand der Referenztrajektorie.
In vorteilhafter Weiser können die Splines ohne numerisches Differenzieren gewonnen werden, was die Steuerung des Fahrzeugs vereinfacht.
Bevorzugt können eine Fahrzeuggeschwindigkeit und eine Fahrzeuggierrate aus den Splines bestimmt werden.
Weiter bevorzugt kann die Steuerung des Fahrzeugs mittels einer modellprädiktiven Folgeregelung durch eine Anpassung der Fahrzeuggeschwindigkeit und der Fahrzeuggierrate an den zukünftigen Verlauf der kartesischen Koordinaten erfolgen. In vorteilhafter Weise kann die modellprädiktive Folgeregelung innerhalb des Prädiktionshorizontes einen Verlauf der Zustandsgrößen vorhersagen und dadurch die Folgeregel verbessern.
Die modellprädiktive Folgeregelung kann des Weiteren unabhängig vom tatsächlichen Fahrzeugmodell genutzt werden, weil sie keine Parameter der fahrzeugspezifischen Fahrdynamik enthält.
Eine Anpassung des Verfahrens oder der Vorrichtung auf verschiedene Fahrzeugtypen ist dadurch weniger aufwendig.
In einer bevorzugten Ausgestaltung kann die Anpassung der Fahrzeuggeschwindigkeit und der Fahrzeuggierrate ferner mittels einer modellfreien Fahrzeugregelung erfolgen.
In vorteilhafter Weise kann eine konstante Regelverstärkung im gesamten Geschwindikeitsbereich erfolgen.
In einer weiteren Ausgestaltung der Erfindung kann die modellfreie Fahrzeugregelung die Fahrzeuggeschwindigkeit und die Fahrzeuggierrate getrennt nach den kartesischen Koordinaten approximieren.
In vorteilhafter Weise müssen dadurch weniger Fahrzeugparameter für die Fahrzeuggeschwindigkeit und die Fahrzeuggierrate berücksichtigt werden.
Erfindungsgemäß ist eine Vorrichtung in einem Fahrzeug eingerichtet, ein Verfahren gemäß einer der genannten bevorzugten Ausgestaltungen auszuführen.
Figurenbeschreibung
Die Geleichungen 1-6 beschreiben eine ebene Fahrzeugbewegung und setzt sich zusammen aus drei Differenzialgleichungen für die Kinematik des Fahrzeugs und drei für die Fahrzeugdynamik, wobei letztere sich aus den Kräfte- und Momentengleichgewichten im bzw. um den Schwerpunkt ergeben, $\dot{x} = v cos (ψ + β)$
$\dot{y} = v sin (ψ + β)$
$\dot{ψ} = ω$
$\dot{v} = \frac{1}{m} (- F_{y f} sin (δ - β) + (F_{y r} - F_{W y}) sin β + (F_{x r} - F_{W x}) cos β)$
$\dot{β} = - ω + \frac{1}{m v} (F_{y f} cos (δ - β) + (F_{y r} - F_{W y}) cos β - (F_{x r} + F_{W x}) sin β)$
$\dot{ω} = \frac{1}{j_{z}} (F_{y f} l_{f} cos δ - F_{y r} l_{r})$
Die Kräfte F_Wx und F_Wy sind Störgrößen durch Wind und Straßenneigung und sollen ausschließlich im Schwerpunkt angreifen. Sie können beschrieben werden als $\begin{matrix} F_{W x} = k_{x} v^{2} + m g sin α_{x}, & F_{W y} = F_{S e i t e n w i n d} + m g sin α_{y} \end{matrix}$
Zustandsgrößen für die Kinematik sind die inertialen, kartesischen Positionen x und y des Schwerpunkts und der Gierwinkel ψ. Als dynamische Zustandsgrößen werden hier die Fahrzeuggeschwindigkeit v, der Schwimmwinkel β und die Gierrate ω gewählt. Die Stellgrößen zur Beeinflussung der Fahrzeugbewegung sind das Lenkmoment Ms und das Radmoment M_D als Antriebs- oder Bremsmoment. Die Stellgrößen sind begrenzt und u.a. durch das Fahrzeugkommunikationssystem mit einer Totzeit τ behaftet. Aktoren, wie z.B. eine elektrische Servolenkung EPS, ein Stabilitätsregelsystem ESC und ein Antriebsmotor, wandeln die Stellgrößen in den Lenkwinkel δ bzw. die Längskraft F_xr am Rad. Die Aktordynamik von Lenkung und Rad mit der Raddrehgeschwindigkeit ω_R sowie den Störgrößen Fahrerlenkmoment M_H, Radwiderstandsmoment M_W und Reifenrückstellmoment η_RF_yf ist gegeben durch $\ddot{δ} = - \frac{c_{S}}{J_{S}} \dot{δ} + \frac{1}{J_{S}} (i_{S} M_{H} - n_{R} F_{y f}) + \frac{i_{S} i_{M}}{J_{S}} s a t (M_{S} (t - τ_{S}))$
${\dot{ω}}_{R} = \frac{1}{J_{D}} (- F_{x r} r_{R} + M_{W}) + \frac{1}{J_{D}} s a t (M_{D} (t - τ_{D}))$
Kinematisches Fahrzeugmodell:
Zur Modularisierung der Bewegungssteuerung wird die Regelstrecke in zwei Teilsysteme zerlegt, die einseitig verkoppelt sind. Das Teilsystem Fahrzeugdynamik beeinflusst die Fahrzeugkinematik, erfährt jedoch selbst keine Rückkopplung aus dieser, d.h. die Fahrzeugdynamik ist in erster Näherung unabhängig von der Lage des Fahrzeugs. Die Fahrzeugkinematik hingegen verknüpft nur Zustandsgrößen und benötigt keine Parameter. Die dynamischen Zustandsgrößen werden als Eingangs- bzw. Stellgrößen des kinematischen Fahrzeugmodells interpretiert. Hierbei sind die Fahrzeuggeschwindigkeit und die Gierrate die beiden dynamischen Stellgrößen. Der Schwimmwinkel wird als Störgröße betrachtet und für die weiteren Betrachtungen als vernachlässigbar angesehen. Die gesamte Aktor- und Fahrzeugdynamik soll durch unterlagerte Regler eine verstärkungs- und verzögerungsfreie Übertragungsfunktion besitzen. Die Verzögerungsfreiheit für die „kinematischen Stellgrößen“ v und ω ist jedoch bei realen Fahrzeugen nicht möglich. Es wird deshalb vereinfachend von Übertragungsfunktion erster Ordnung mit den Zeitkonstanten T_v bzw. T_ω für die Stellgrößen ausgegangen. Das kinematische Fahrzeugmodell hat mit den neuen Stellgrößen u_Long und u_Yaw die Form $\dot{x} = v cos ψ$
$\dot{y} = v sin ψ$
$\dot{ψ} = ω$
$\dot{v} = - \frac{1}{T_{v}} v + \frac{1}{T_{v}} u_{L o n g}$
$\dot{ω} = - \frac{1}{T_{ω}} ω + \frac{1}{T_{ω}} u_{Y a w}$
Trajektoriegenerierung:
Wegpunkte beschreiben die geometrische Fahrzeug-Referenzposition in einem inertialen kartesischen Koordinatensystem. Ziel der Folgeregelung ist es, die Referenzpositionen zu genau festgelegten Zeitpunkten zu erreichen. Deshalb ist zusätzlich zu den Positionen die Vorgabe eines Geschwindigkeitsprofils notwendig. Die diskreten, raumbezogenen Daten werden als Funktion der zu fahrenden Strecke, d.h. der Bogenlänge s, von einer übergeordneten Planung ermittelt. Diese Planung wird als gegeben vorausgesetzt und nicht weiter beschrieben.
Differenzielle Flachheit erlaubt, sämtliche Zustands- und Eingangsgrößen eines Systems in Abhängigkeit eines flachen Ausgangs und seiner Zeitableitungen darzustellen. In der Regel werden so viele flache Ausgangsgrößen benötigt, wie das System Eingangsgrößen besitzt. Die Flachheitseigenschaft vereinfacht die Erzeugung von Referenztrajektorien denen das System folgen kann, weil hierzu einfache algebraische Zusammenhänge programmiert werden können und keine Differenzialgleichungen numerisch gelöst werden müssen. Für das kinematische Fahrzeugmodell sind die Positionsgrößen flache Ausgangsgrößen, d.h. mit den beiden Referenzgrößen x_d und y_d sowie deren Ableitungen ergeben sich die übrigen Zustands-und Eingangsgrößen des kinematischen Modells als $ψ_{d} = a r c t a n (\frac{{\dot{y}}_{d}}{{\dot{x}}_{d}})$
$v_{d} = \sqrt{{\dot{x}}_{d}^{2} + {\dot{y}}_{d}^{2}}$
$ω_{d} = \frac{{\dot{x}}_{d} {\ddot{y}}_{d} - {\ddot{x}}_{d} {\dot{y}}_{d}}{{\dot{x}}_{d}^{2} + {\dot{y}}_{d}^{2}}$
${\dot{v}}_{d} = \frac{{\dot{x}}_{d} {\ddot{x}}_{d} + {\dot{y}}_{d} {\ddot{y}}_{d}}{\sqrt{{\dot{x}}_{d}^{2} + {\dot{y}}_{d}^{2}}}$
${\dot{ω}}_{d} = \frac{({\dot{x}}_{d} {\overset{⃛}{y}}_{d} - {\overset{⃛}{x}}_{d} {\dot{y}}_{d}) v_{d} - 2 ({\dot{x}}_{d} {\ddot{y}}_{d} - {\ddot{x}}_{d} {\dot{y}}_{d}) {\dot{v}}_{d}}{v_{d}^{3}}$
$u_{L o n g, d} = v_{d} + T_{v} {\dot{v}}_{d}$
$u_{Y a w, d} = ω_{d} + T_{ω} {\dot{ω}}_{d}$
Die Parametrierung des flachen Ausgangs soll mit sogenannten Splines erfolgen, weil die Ableitungen ohne numerisches Differenzieren leicht gewonnen werden können. Um definierte Referenztrajektorien für den gesamten Geschwindigkeitsbereich einschließlich Stillstand zu erhalten, wird die geometrische von der zeitlichen Pfadinformation separiert. Hierzu müssen die Referenztrajektorien mit der Bogenlänge umparametriert werden. Die Zeitinformation steckt jetzt in der zeitlichen Änderung der Bodenlänge, mit dem Geschwindigkeitsfaktor $λ (s) = \frac{d s}{d t}$
Am Beispiel der x-Position soll das Vorgehen erläutert werden. Es ist $x_{d} (t) = x_{d} (s (t))$
${\dot{x}}_{d} (t) = \frac{d x_{d} (s) d s}{d s d t} = x_{d}^{'} (s) λ (s)$
${\ddot{x}}_{d} (t) = \frac{d {\dot{x}}_{d} (s) d s}{d s d t} = [x_{d}^{"} (s) λ (s) + x_{d}^{'} (s) λ' (s)] λ (s)$
${\overset{⃛}{x}}_{d} (t) = \frac{d {\ddot{x}}_{d} (s) d s}{d s d t} = [x_{d}^{"'} (s) λ^{2} (s) + 3 x_{d}^{"} (s) λ' (s) λ (s) + x_{d}^{'} (s) (λ " (s) λ (s) + λ'^{2} (s))] λ (s)$
Die Splines für x_d(s), y_d(s) und λ(s) werden so gewählt, dass sie die vorgegebenen Wegpunkte bzw. das Geschwindigkeitsprofil approximieren und die Ableitungen möglichst glatt sind. Falls die Zeit explizit benötigt wird, kann diese als eine diskrete Zeit aus der Folge von Wegpunkten x_d,i, y_d,i mit zugehöriger Geschwindigkeit v_d,i wie folgt berechnet werden $\begin{matrix} t_{i} = t_{i - 1} + Δ t_{i - 1}, & (t_{1} = t_{0} = 0) \end{matrix}$
$Δ t_{i - 1} = 2 \frac{\sqrt{{(x_{d, i} - x_{d, i - 1})}^{2} + {(y_{d, i} - y_{d, i - 1})}^{2}}}{v_{d, i} + v_{d, i - 1}}$
Der diskrete Geschwindigkeitsfaktor λi ergibt sich mit den als äquidistant angenommenen Weginkrementen Δs zu $λ_{i} = \frac{Δ s}{Δ t_{i - 1}}$
1 zeigt beispielhaft die Generierung einer Referenztrajektorie: a) Sollbahn zusammengesetzt aus Geraden und Kreisbogen mit R=200m, vorgegebene Wegpunkte im Abstand von 25m und Approximation durch kubischen B-Spline, b) Spline der Soll-y-Position als Funktion der Bogenlänge, c) Geschwindigkeitsfaktor zur Skalierung des Spline, d) Referenztrajektorie für die y-Position als Funktion der Zeit, e) Bogenlänge als Funktion der Zeit.
Modellprädiktive Folgeregelung:
Ausgangspunkt für die Trajektorien-Folgeregelung ist das kinematische Fahrzeugmodell (10-14), das mit dem expliziten Eulerverfahren für die Abtastzeit T_s diskretisiert und anschließend entlang der Referenztrajektorie linearisiert wird. ${\begin{matrix} x_{d} = {[\begin{array}{l} x_{d} & y_{d} & ψ_{d} & v_{d} & ω_{d} \end{array}]}^{T}, & u_{d} = [\begin{matrix} u_{L o n g, d} & u_{Y a w, d} \end{matrix}] \end{matrix}}^{T}$
Das Ergebnis ist ein diskretes lineares zeitvariantes Systemmodell, das die Abweichungen Δx = x - x_d zur Solltrajektorie beschreibt mit dem zugehörigen Eingangsvektor Δu = u - u_d, d.h. $Δ x (k + 1) = A (k) Δ x (k) + B (k) Δ u (k)$
$A (k) = [\begin{matrix} 1 & 0 & - T_{s} v_{d} (k) sin (ψ_{d} (k)) & T_{s} cos (ψ_{d} (k)) & 0 \\ 0 & 1 & T_{s} v_{d} (k) cos (ψ_{d} (k)) & T_{s} sin (ψ_{d} (k)) & 0 \\ 0 & 0 & 1 & 0 & T_{s} \\ 0 & 0 & 0 & 1 - \frac{T_{s}}{T_{v}} & 0 \\ 0 & 0 & 0 & 0 & 1 - \frac{T_{s}}{T_{ω}} \end{matrix}], B (k) = [\begin{matrix} 0 & 0 \\ 0 & 0 \\ 0 & 0 \\ \frac{T_{s}}{T_{v}} & 0 \\ 0 & \frac{T_{s}}{T_{ω}} \end{matrix}]$
Die Modellprädiktive Regelung optimiert online in jedem Abtastschritt den Stellgrößenverlauf für einen endlichen Prädiktionshorizont N und nutzt das Systemmodell zur Bestimmung des zukünftigen Zustandsgrößenverlaufs. Die Optimierung wird als quadratisches Programm formuliert für das sehr effiziente Lösungsalgorithmen zur Verfügung stehen [11]. Die „Stapelform“ des Systemmodells für den Prädiktionshorizont N lautet mit der vereinfachten Schreibweise Δx(k|k) =Δx₀, A(k|k) =A₀, A(k+1|k) = A₁, ..., B(k|k)=B₀, B(k+1|k) = B₁, ..., $Δ \bar{x} (k + 1) = \bar{A} (k) Δ x_{0} + \bar{B} (k) Δ \bar{u} (k)$
$Δ \bar{x} (k + 1) = [\begin{matrix} Δ x (k + 1 | k) \\ Δ x (k + 2 | k) \\ ⋮ \\ Δ x (k + N | k) \end{matrix}], Δ \bar{u} (k) = [\begin{matrix} Δ u (k | k) \\ Δ u (k + 1 | k) \\ ⋮ \\ Δ u (k + N - 1 | k) \end{matrix}],$
$\begin{array}{l} \bar{A} (k) = [\begin{matrix} A_{0} \\ \prod_{j = 0}^{1} A_{1 - j} \\ ⋮ \\ \prod_{j = 0}^{N - 2} A_{N - 2 - j} \\ \prod_{j = 0}^{N - 1} A_{N - 1 - j} \end{matrix}], \bar{B} (k) = \\ [\begin{matrix} B_{0} & 0 & \dots & 0 \\ A_{1} B_{0} & B_{1} & \dots & 0 \\ ⋮ & ⋮ & ⋱ & ⋮ \\ (\prod_{j = 1}^{N - 2} A_{N - 1 - j}) B_{0} & (\prod_{j = 1}^{N - 3} A_{N - 1 - j}) B_{1} & \dots & 0 \\ (\prod_{j = 1}^{N - 1} A_{N - j}) B_{0} & (\prod_{j = 1}^{N - 2} A_{N - j}) B_{1} & \dots & B_{N - 1} \end{matrix}] \end{array}$
Zur Lösung des Optimierungsproblems wird die folgende quadratische Kostenfunktion verwendet $J (k) = \sum_{i = 1}^{n - 1} (Δ x^{T} (k + 1 | k) Q Δ x (k + 1 | k) + Δ u^{T} (k + i | k) R Δ u (k + i - 1 | k) + Δ x^{T} (k + N | k) P Δ x (k + N | k))$
mit der positiv semidefiniten Bewertungsmatrix Q für die Zustände und der positiv definiten Bewertungsmatrix R für die Stellgrößen. Der Endzustand des Horizonts kann separat mit der positiv semidefiniten Bewertungsmatrix P gewichtet werden. Die Kostenfunktion kann in die Standardbeschreibung für die quadratische Programmierung umgeformt werden, d.h. $\bar{J} (k) = \frac{1}{2} Δ {\bar{u}}^{T} (k) H (k) Δ \bar{u} (k) + Δ {\bar{u}}^{T} (k) g (k)$
mit $H (k) = 2 ({\bar{B}}^{T} (k) \bar{Q} \bar{B} (k) + \bar{R})$
$g (k) = 2 {\bar{B}}^{T} (k) \bar{Q} \bar{A} (k) Δ x_{0}$
$\begin{matrix} \bar{Q} = d i a g (Q, \dots, Q, P), & \bar{R} = d i a g (R, \dots, R) \end{matrix}$
Hierbei bringen nicht von den Stellgrößen abhängige Glieder keinen Beitrag in der Optimierung und werden daher vernachlässigt. Beschränkungen in den absoluten Stellgrößen werden als Nebenbedigungen formuliert ${\bar{u}}_{m i n} (k) - {\bar{u}}_{d} (k) \leq Δ \bar{u} (k) \leq {\bar{u}}_{m a x} (k) - {\bar{u}}_{d} (k)$
Zusätzlich können Zwangsbedigungen an beliebige Ausgangsgrößen $\bar{y} (k) = \bar{C} (k) Δ \bar{x} (k + 1) + \bar{D} (k) Δ \bar{u} (k) + \bar{h} ({\bar{x}}_{d} (k), {\bar{u}}_{d} (k))$
in der Form $A_{C} (k) Δ \bar{u} (k) \leq b_{c} (k)$
mit $A_{c} (k) = [\begin{matrix} (\bar{C} (k) \bar{B} (k) + \bar{D} (k)) \\ - (\bar{C} (k) \bar{B} (k) + \bar{D} (k)) \end{matrix}]$
$b_{c} (k) [\begin{matrix} {\bar{y}}_{m a x} (k) - \bar{C} (k) \bar{A} (k) Δ x_{0} - \bar{h} (k) \\ - {\bar{y}}_{m i n} (k) + \bar{C} (k) \bar{A} (k) Δ x_{0} + \bar{h} (k) \end{matrix}]$
berücksichtigt werden.
Modellfreie Fahrzeugregelung:
Die nichtlineare Fahrzeugdynamik wird für die Längs- und Querbewegung getrennt lokal approximiert durch jeweils einfache lokal gültige Modelle entsprechender Ordnung n, mit $y^{(n)} = f + b u$
Der Systemeingang wird als affin betrachtet und alle Kopplungs- und Störeinflüsse durch den unbekannten Term f repräsentiert. Einziger Parameter des Modells ist der als konstant angesehene Faktor b vor dem Systemeingang.
Zur Schätzung von f wird angenommen, dass die unbekannte Systemdynamik in einem sehr kleinen Zeitfenster, z.B. zwischen zwei Abtastzeitpunkten, konstant ist. Ein Umstellen der Systemgleichung (46) liefert eine Approximation auf der Basis der Stell- und Messgröße, $f \approx f_{e s t} = y_{e s t}^{(n)} - b u$
Für die Approximation von f wird eine Schätzung der (n)-ten Ableitung von y benötigt. Der Aufbau des Ableitungsschätzers für i.a. lineare, zeitvariante Systeme wird im Folgenden für n=2 erläutert. Aus dem homogenen System $\dot{x} (t) = A (t) x (t)$
$y (t) = C (t) x (t)$
mit $x (t) = {[\begin{matrix} y (t) & \dot{y} (t) & \ddot{y} (t) \end{matrix}]}^{T}$
$A (t) = A [\begin{matrix} 0 & 1 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \end{matrix}], C (t) = C = [\begin{matrix} 1 & 0 & 0 \end{matrix}]$
kann der Zustand x(t1) im Interval [t₀, t₁] rekonstruiert werden, wenn die Rekonstruierbarkeits-Gramsche Matrix $W_{r} (t_{0}, t_{1}) = \int_{t_{0}}^{t_{1}} Φ^{T} (τ, t_{1}) C^{T} (τ) C (τ) Φ (τ, t_{1}) d τ$
vollen Rang aufweist. Eine Schätzung x_est(t₁) des Zustands x(t₁) ist dann gegeben durch $x_{e s t} (t_{1}) = W_{r}^{- 1} (t_{0}, t_{1}) \int_{t_{0}}^{t_{1}} Φ^{T} (τ, t_{1}) C^{T} (τ) y (τ) d τ$
Die Fundamentalmatrix Φ zum System (51) ist $Φ (τ, t_{1}) = e^{A (τ - t_{1})} = [\begin{matrix} 1 & τ - t_{1} & \frac{{(τ - t_{1})}^{2}}{2} \\ 0 & 1 & τ - t_{1} \\ 0 & 0 & 1 \end{matrix}]$
Wählt man ein Zeitfenster T > 0 fester Breite und ersetzt to = t - T und t₁ = t, dann folgt daraus die Gramsche Matrix $W_{r} (t - T, t) = [\begin{matrix} T & - \frac{T^{2}}{2} & - \frac{T^{3}}{6} \\ - \frac{T^{2}}{2} & - \frac{T^{3}}{3} & - \frac{T^{4}}{8} \\ - \frac{T^{3}}{6} & - \frac{T^{4}}{8} & - \frac{T^{5}}{20} \end{matrix}]$
Die Schätzung ergibt sich damit als $x_{e s t} (t) = [\begin{matrix} \frac{9}{T} & \frac{36}{T^{2}} & \frac{60}{T^{3}} \\ \frac{36}{T^{2}} & \frac{192}{T^{3}} & \frac{360}{T^{4}} \\ \frac{60}{T^{3}} & \frac{360}{T^{4}} & \frac{720}{T^{5}} \end{matrix}] \int_{t - T}^{t} [\begin{matrix} 1 \\ τ - t \\ \frac{{(τ - t)}^{2}}{2} \end{matrix}] y (τ) d τ$
Setzt man jetzt τ= t - σ und dτ= -dσ in (56) ein, so erhält man schließlich die Schätzung der Ableitungen durch Integration aus dem gemessenen Signal y im Zeitfenster T mit $x_{e s t} (t) = [\begin{matrix} y_{e s t} (t) \\ {\dot{y}}_{e s t} (t) \\ {\ddot{y}}_{e s t} (t) \end{matrix}] = \int_{0}^{T} [\begin{matrix} \frac{9}{T} - σ \frac{36}{T^{2}} + \frac{σ^{2}}{2} \frac{60}{T^{3}} \\ \frac{36}{T^{2}} - σ \frac{192}{T^{3}} + \frac{σ^{2}}{2} \frac{360}{2 T^{4}} \\ \frac{60}{T^{3}} - σ \frac{360}{T^{4}} + \frac{σ^{2}}{2} \frac{720}{2 T^{4}} \end{matrix}] y (t - σ) d σ$
Für die Diskretisierung von Gl. (57) wird das Zeitfenster T = N_sT_s gesetzt, d.h. als ganzzahliges Vielfaches N_s der Abtastzeit T_s. Es ergibt sich $x_{e s t} (k) = [\begin{matrix} y_{e s t} (k) \\ {\dot{y}}_{e s t} (k) \\ {\ddot{y}}_{e s t} (k) \end{matrix}] = \sum_{i = 0}^{N_{s}} [\begin{matrix} \frac{9}{N_{s} T_{s}} - (i T_{s}) \frac{36}{{(N_{s} T_{s})}^{2}} + \frac{{(i T_{s})}^{2}}{2} \frac{60}{{(N_{s} T_{s})}^{3}} \\ \frac{36}{{(N_{s} T_{s})}^{2}} - (i T_{s}) \frac{192}{{(N_{s} T_{s})}^{3}} + \frac{{(i T_{s})}^{2}}{2} \frac{360}{{(N_{s} T_{s})}^{4}} \\ \frac{60}{{(N_{s} T_{s})}^{3}} - (i T_{s}) \frac{360}{{(N_{s} T_{s})}^{4}} + \frac{{(i T_{s})}^{2}}{2} \frac{720}{{(N_{s} T_{s})}^{5}} \end{matrix}] y (k - i) w_{i}$
Mit der Simpson-Regel $\int_{a}^{b} f (x) d x ≅ \sum_{i = 1}^{N} f (x_{i}) w_{i} = \frac{h}{3} f_{1} + \frac{4 h}{3} f_{2} + \frac{2 h}{3} f_{3} +, \dots, + \frac{2 h}{3} f_{N - 2} + \frac{4 h}{3} f_{N - 1} + \frac{h}{3} f_{N}$
für die Schrittweite h = (b-a)/(N-1) = T_s lässt sich das Integral (58) numerisch lösen. Mit dem Zeitfenster T=0,1s und einer Abtastzeit T_s=0,01s ergibt sich N_s=10, d.h. es werden in jedem Abtastschritt neben dem aktuellen Messwert von y noch 10 vergangene Werte zur Schätzung der Ableitungen benötigt. Die Übertragungsfunktion für die zweite Ableitung in (58) stellt einen FIR (Finite Impulse Response) Filter der Ordnung N_s=10 dar, mit $\begin{array}{l} H (z) = \frac{{\ddot{y}}_{e s t} (z)}{y (z)} = 200 + 368 z^{- 1} + 16 z^{- 2} - 208 z^{- 3} - 176 z^{- 4} - 400 z^{- 5} \\ - 176 z^{- 6} - 208 z^{- 7} + 16 z^{- 8} + 368 z^{- 9} + 200 z^{- 10} \end{array}$
Die Stellgröße u sollte zeitverschoben mit N_s/2 oder ebenfalls mit einem FIR-Filter der Ordnung N_s=10 gefiltert in der Gl. (47) berücksichtigt werden.
Die modellfreie Regelung besteht aus einer Vorsteuerung mit der Ableitung des Referenzsignals y_d, der Aufschaltung der Schätzung der unbekannten Systemdynamik fest und einem PID-Regler für die Regelabweichung e = y_d - y, d.h. $u = \frac{1}{b} (y_{d}^{(n)} - f_{e s t} + K_{P} e + K_{I} \int e + K_{D} \dot{e})$
Zur Abschätzung der Ordnungen n, der unbekannten Systemdynamik f und des Eingangsfaktors b der Regelstrecken wird von linearen Reifenkräften ausgegangen, d.h. $\begin{matrix} F_{x r} \approx C_{x} s_{x}, & F_{y f} \approx C_{f} α_{f}, & F_{y r} \approx C_{r} α_{r} \end{matrix}$
mit den Reifensteifigkeiten C_x, C_f und C_r, dem Längsschlupf s_x und den Schräglaufwinkeln α_f bzw. α_r $\begin{matrix} s_{x} = \frac{r_{R}}{v_{s}} ω_{R} - \frac{1}{v_{s}} v, & α_{f} = δ - β - \frac{l_{f}}{v_{s}} ω, & α_{r} = - β + \frac{l_{r}}{v_{s}} ω \end{matrix}$
unter Berücksichtigung der stationären Anfangsgeschwindigkeit v_s . Für die Längsdynamik ergibt sich aus (4) und (9) unter Vernachlässigung von Mw das Modell zweiter Ordnung $\ddot{v} = \underset{f_{v}}{\underset{︸}{- \frac{c_{x} (J_{D} + m r_{R}^{2})}{J_{D} m v_{s}} \dot{v} - \frac{c_{x} r_{R}^{2}}{J_{D} m v_{s}} F_{W x} - \frac{1}{m} {\dot{F}}_{W x}}} + \frac{c_{x} r_{R}}{\underset{b_{v}}{\underset{︸}{J_{D} m v_{s}}}} M_{D}$
mit ${\dot{F}}_{W x} = 2 k_{x} v \dot{v} + m g cos α_{x} {\dot{α}}_{x}$
Es wird ein Regler der Form (61) mit n = 2 zur Regelung der Längsgeschwindigkeit verwendet. Da die Strecke (64) für die Regelgröße v einen Integrator enthält, genügt ein PD-Regler für die Regelabweichung. Die Querdynamik wird aufgeteilt in die Aktordynamik zweiter Ordnung aus (8) $\ddot{δ} = \underset{f_{δ}}{\underset{︸}{- \frac{c_{S}}{J_{S}} \dot{δ} + \frac{1}{J_{S}} (i_{S} M_{H} - n_{R} C_{f} (δ - β - \frac{l_{f}}{v_{s}} ω))}} + \frac{i_{S} i_{M}}{\underset{b δ}{\underset{︸}{J_{S}}}} M_{S}$
und die Gierdynamik erster Ordnung aus (6) $\dot{ω} = \underset{f_{ω}}{\underset{︸}{- \frac{l_{f}^{2} C_{f} + l_{f}^{2} C_{r}}{J_{Z} v_{S}} ω - \frac{l_{f} C_{f} - l_{r} C_{r}}{J_{Z}} β}} + \frac{l_{f} C_{f}}{\underset{b_{ω}}{\underset{︸}{J_{Z}}}} δ$
Es werden zwei Regler der Form (61) kaskadiert, wobei der äußere für n = 1 die Gierrate mit einem PI-Regler regelt und einen Lenkwinkel-Sollwert für den inneren Lenkwinkelregler liefert. Dieser ist für n = 2 ausgelegt und enthält einen PID-Regler.
2 zeigt die Gesamtregelstruktur als kaskadiertes Regelsystem. Die äußere Kaskade regelt die Position und Orientierung des Fahrzeugs mit Hilfe der modellprädiktiven Regelung (Model Predictive Control, MPC) und die innere Kaskade die Längs- und Querdynamik mit Hilfe der modellfreien Regelung (Model Free Control, MFC).
Für die Bewertung der Qualität der Folgeregelung kann als Fehlermaß die Abweichung des fahrzeugfesten Koordinatensystems von einem mitbewegten, natürlichen Koordinatensystem, dem sog. Serret-Frenet System, herangezogen werden. Die Achsen des Serret-Frenet Koordinatensystems sind entlang der Tangente und der Normalen des vorgegebenen Pfades ausgerichtet. Hierbei wird der Winkel vom Inertialsystem zur Tangente als Kurswinkel Φ_d = ψ_d + β_d aufgefasst, weil der Schwimmwinkel des Fahrzeugs bei Kurvenfahrten nicht vernachlässigt werden darf. Da das kinematische Referenzmodell (10-14) keinen Soll-Schwimmwinkel berücksichtigt, wird für die Fehlerauswertung der Soll-Gierwinkel mit dem Ist-Schwimmwinkel korrigiert. Die Gln. (68-70) beschreiben die Fehler et und e_n in Tangenten- bzw. Normalenrichtung, im Folgenden als Längs- bzw. Querfehler bezeichnet, und e_ψ ist der Gierwinkelfehler. $e_{t} = (x - x_{d}) cos (ψ_{d} - β) + (y - y_{d}) sin (ψ_{d} - β)$
$e_{n} = - (x - x_{d}) sin (ψ_{d} - β) + (y - y_{d}) cos (ψ_{d} - β)$
$e_{ψ} = ψ - ψ_{d} + β$
Sprungförmige Referenzgrößen regen die modellfreie Regelung zu Schwingungen an, siehe 3.
3 zeigt eine schlechte Regelqualität bei sprungförmigen Vorsteuergrößen im MPC für die Bahn aus 1. Die Diagramme in 3 zeigen im Einzelnen: a) Gierraten-Referenzgrößen aus flacheitsbasierter Trajektoriengenerierung für den Zustand ω_d (glatt) und die Stellgröße u_Yaw,d (sprungförmig). b) Gierraten-Stellgröße bei Verwendung von alternativen Vorsteuergrößen im MPC. c) Lenkwinkel-Stellgröße des Gierraten-MFC bei Verwendung von alternativen Vorsteuergrößen im MPC. d) Zugehörige Querfehler. e) Zugehörige Gierwinkelfehler
Durch Verwendung von Splines höherer Ordnung könnte die Regelung verbessert werden. Hier wird ein anderer Weg verfolgt, in dem zur Vorsteuerung der Gierrate in der modellprädiktiven Regelung statt der sprungförmigen Größe u_Yaw,d aus (21) die Gierrate ω_d aus (17) verwendet wird. Diese entsteht aus einem Filter erster Ordnung für die Stellgröße u_Yaw,d . Die Regelfehler werden dann jedoch entsprechend größer.
Totzeiten kann die modellfreie Regelung relativ gut verkraften. Die Lenkwinkelregelung alleine kann bis zu τ_s=0,1s stabil ausgelegt werden. In der Kaskade mit der Gierratenregelung stellte sich jedoch schon für τ_s=0,03s die Abstimmung als schwierig heraus. Eine Verbesserung konnte durch eine Abschwächung der Aufschaltung von f_est in der Gierratenregelung mit einem Faktor K_f = 0,9 erreicht werden. Der Gierratenregler hat damit die gegenüber (61) modifizierte allgemeine Form $u = \frac{1}{b} (y_{d}^{(n)} - K_{f} f_{e s t} + K_{P} e + K_{I} \int e + K_{D} \dot{e})$
Steht der Schwimmwinkel als Mess- oder Schätzgröße im Fahrzeug zur Verfügung, dann sollte man ihn im Abweichungsvektor Δx der modellprädiktiven Regelung berücksichtigen durch Aufschaltung auf die Gierwinkelabweichung in der Form $Δ ψ = ψ - ψ_{d} + β$
Störgrößen in der Fahrdynamik bilden sich sehr gut in der geschätzten Systemdynamik f_est der modellfreien Regelung ab und werden entsprechend gut kompensiert. Parameteränderungen spiegeln sich ebenfalls in f_est wider und werden stationär gut kompensiert. In den transienten Bereichen kann ein Ansteigen der Regelfehler (68-70) im Vergleich zum Nominalfall nicht verhindert werden. Hier könnten auf Seiten der modellprädiktiven Regelung weitere Maßnahmen getroffen werden, z.B. durch eine Störgrößenschätzung und -aufschaltung.

Claims

Verfahren zum Steuern eines Fahrzeugs mit den Schritten: - Vorgeben von Wegpunkten und einer Geschwindigkeitsbeschränkung zu einem Ziel; - Ermittelt von Splines für kartesische Koordinaten und ein jeweils dazugehörender Geschwindigkeitsfaktor, sodass die Wegpunkte und/oder das Geschwindigkeitsprofil approximiert werden und dabei eine nötige Ableitung der Splines möglichst glatt sind; - Berechnen einer Referenztrajektorie aus den Splines, deren Ableitungen und einer vorgegebenen Geschwindigkeit; und - Steuern des Fahrzeugs anhand der Referenztrajektorie.
Verfahren gemäß Anspruch 1, wobei eine Fahrzeuggeschwindigkeit und eine Fahrzeuggierrate aus den Splines bestimmt werden.
Verfahren gemäß Anspruch 2, wobei die Steuerung des Fahrzeugs mittels einer modellprädiktiven Folgeregelung durch eine Anpassung der Fahrzeuggeschwindigkeit und der Fahrzeuggierrate an den zukünftigen Verlauf der kartesischen Koordinaten erfolgt.
Verfahren gemäß Anspruch 2 oder 3, wobei die Anpassung der Fahrzeuggeschwindigkeit und der Fahrzeuggierrate ferner mittels einer modellfreien Fahrzeugregelung erfolgt.
Verfahren gemäß Anspruch 4, wobei die modellfreie Fahrzeugregelung die Fahrzeuggeschwindigkeit und die Fahrzeuggierrate getrennt nach den kartesischen Koordinaten approximiert.
Vorrichtung in einem Fahrzeug, die eingerichtet ist ein Verfahren gemäß einer der vorherigen Ansprüche durchzuführen.