-
Die Erfindung betrifft ein Verfahren zur Regelung einer Längsposition eines Fahrzeugs nach den Merkmalen des Oberbegriffs des Anspruchs 1.
-
Aus dem Stand der Technik sind ein Verfahren und eine Vorrichtung zur Regelung einer Längsposition eines Fahrzeugs, insbesondere eines autonom fahrenden Fahrzeugs, bekannt. Mittels eines Längspositionsreglers wird aus einer längsdynamischen Vorsteuersollgröße und aus längsdynamischen Regelfehlergrößen ein Längsbeschleunigungsstellsignal für eine auf eine Antriebseinrichtung und Bremseinrichtung des Fahrzeugs wirkende unterlagerte Beschleunigungsregeleinheit erzeugt. Ein aktueller, einem aktuellen Zeitpunkt entsprechender Regelreferenzpunkt und mindestens ein vorausliegender, einem vorgebbaren Vorausschauzeitpunkt entsprechender Regelreferenzpunkt werden als regelrelevante Zeitpunkte bestimmt. Für jeden der Regelreferenzpunkte werden aktuelle bzw. prädizierte Ist-Soll-Abweichungen einer Längsposition, einer Fahrgeschwindigkeit und Beschleunigung ermittelt und der Bildung der längsdynamischen Regelfehlergrößen zugrunde gelegt. Für jeden der Regelreferenzpunkte werden Sollwerte einer Beschleunigung bestimmt und der Bildung der längsdynamischen Vorsteuersollgröße zugrunde gelegt.
-
Der Erfindung liegt die Aufgabe zu Grunde, ein gegenüber dem Stand der Technik verbessertes Verfahren zur Regelung einer Längsposition eines Fahrzeugs anzugeben.
-
Die Aufgabe wird erfindungsgemäß gelöst durch ein Verfahren zur Regelung einer Längsposition eines Fahrzeugs mit den Merkmalen des Anspruchs 1.
-
Vorteilhafte Ausgestaltungen der Erfindung sind Gegenstand der Unteransprüche.
-
In einem Verfahren zur, insbesondere modellprädiktiven, Regelung einer Längsposition eines Fahrzeugs, insbesondere eines automatisiert oder autonom fahrenden Fahrzeugs, unter Berücksichtigung eines erwarteten zukünftigen Fahrverhaltens des Fahrzeugs, insbesondere eines Beschleunigungsverhaltens, wird das Verfahren erfindungsgemäß zeitgetaktet durchgeführt, d. h. es wird insbesondere das erwartete zukünftige Fahrverhalten des Fahrzeugs zeitgetaktet ermittelt. Dabei wird für jeden Zeitschritt das erwartete zukünftige Fahrverhalten des Fahrzeugs ermittelt, indem ein Fahrzustand des Fahrzeugs, insbesondere eine Beschleunigung des Fahrzeugs, für eine vorgegebene Anzahl von vorausliegenden Zeitschritten prädiziert wird, wobei für jeden der vorausliegenden Zeitschritte ein eigenes Modell, vorzugsweise ein eigenes neuronales Netz, zur Prädiktion verwendet wird.
-
Mit den Modellen, insbesondere den neuronalen Netzen, werden vorteilhafterweise die Beschleunigungen zu verschiedenen Zeitpunkten und/oder für die verschiedenen vorausliegenden Zeitschritte prädiziert, insbesondere zu den die verschiedenen vorausliegenden Zeitschritte anfangsseitig und/oder endseitig begrenzenden Zeitpunkten.
-
Vorteilhafterweise werden durch zweifache Integration der Beschleunigungen daraus prädizierte Längspositionen ermittelt, die dann der Regelung der Längsposition zugrunde gelegt werden. Durch diese Integration wird ein Modellfehler zweifach aufintegriert und damit verstärkt, weshalb eine Fehlerfortpflanzung für die Prädiktion der Beschleunigungen zusätzlich verstärkt wird bzw. werden würde.
-
Das Verfahren wird erfindungsgemäß zur Regelung der Längsposition des Fahrzeugs verwendet, in einer vorteilhaften Ausgestaltung kann es aber auch zur Regelung der Längsposition und Querposition des Fahrzeugs verwendet werden. Es wird dann somit zusätzlich auch die Querposition des Fahrzeugs geregelt. Es handelt sich dann somit um ein Verfahren zur Regelung der Längsposition und Querposition des Fahrzeugs.
-
Das erfindungsgemäße Verfahren ermöglicht somit eine besonders vorteilhafte modellprädiktive Regelung (MPC) des Fahrzeugs, insbesondere zur Trajektorienregelung, insbesondere beim autonomen Fahren. Bisherige derartige Ansätze basierten auf einem Modell, dass rekurrent angewendet wird, wodurch üblicherweise ein Prädiktionsfehler propagiert wird. Dadurch wird ein Prädiktionsergebnis und damit im Rahmen der modellprädiktiven Regelung zwingend auch eine Regelgüte verschlechtert. Dies wird durch das erfindungsgemäße Verfahren vermieden, indem nicht ein Modell rekurrent angewendet wird, sondern erfindungsgemäß für jeden der vorausliegenden Zeitschritte ein eigenes Modell, vorzugsweise ein eigenes neuronales Netz, zur Prädiktion verwendet wird.
-
Das erfindungsgemäße Verfahren ermöglicht somit eine Trajektorienregelung in der Fahrzeuglängsregelung, d. h. zur Regelung der Längsposition des Fahrzeugs, auf Basis der modellprädiktiven Regelung, die für jeden Regelzeitpunkt mehrere Schritte (Prädiktionshorizont), d. h. mehrere Zeitschritte, voraussimuliert (prädiziert), wobei für jeden Prädiktionsschritt innerhalb des Prädiktionshorizonts, d. h. für jeden vorausliegenden Zeitschritt innerhalb des Prädiktionshorizonts, ein eigenes Modell, beispielsweise in Form eines neuronalen Netzes, verwendet wird. Damit wird eine Fehlerfortpflanzung, d. h. ein Fortpflanzungsfehler, bei Prädiktionen des Fahrzeugverhaltens vermindert, insbesondere minimiert oder eliminiert, und es ist möglich, schnelle, insbesondere nichtlineare, Modelle, beispielsweise neuronale Netze, die üblicherweise einen starken Fortpflanzungsfehler aufweisen, für die Modellierung einzusetzen, was wiederum vorteilhaft für die Echtzeitanwendung im Fahrzeug ist. Das erfindungsgemäße Verfahren eignet sich somit insbesondere für die Verwendung von Prädiktionsmodellen, die einen starken Fortpflanzungsfehler aufweisen.
-
Ausführungsbeispiele der Erfindung werden im Folgenden anhand von Zeichnungen näher erläutert.
-
Dabei zeigen:
- 1 schematisch eine Prädiktion eines zukünftigen Fahrverhaltens eines Fahrzeugs von Zeitschritt zu Zeitschritt, und
- 2 schematisch eine Regelung einer Längsposition des Fahrzeugs mit einer Prädiktion des zukünftigen Fahrverhaltens des Fahrzeugs, wobei für jeden der vorausliegenden Zeitschritte ein eigenes Modell zur Prädiktion verwendet wird.
-
Einander entsprechende Teile sind in allen Figuren mit den gleichen Bezugszeichen versehen.
-
Die 1 zeigt eine Prädiktion P eines zukünftigen Fahrverhaltens eines Fahrzeugs AF, wobei diese Prädiktion P basierend auf Daten von Zeitschritt k für die Zeitschritte k+1 bis k+N durchgeführt wird. Eine solche Prädiktion P wird insbesondere für eine Trajektorienregelung TR des Fahrzeugs AF verwendet, welche ein wichtiger Bestandteil eines automatisiert oder autonom fahrenden Fahrzeugs AF ist.
-
Basierend auf einer Umgebungserfassung wird entschieden, was die nächsten Schritte für das Fahrzeug AF sind. Das Ergebnis dieser Entscheidung ist eine Trajektorie T, beispielsweise eine Position auf einer Straße über die Zeit, als Bewegungsreferenz in einer bekannten Umgebung. Die Trajektorienregelung TR sorgt dafür, dass der Trajektorie T so genau wie möglich gefolgt wird.
-
Ein geschlossener Regelkreis mit dem Fahrzeug AF ist ein komplexes System mit vielen Systemlimitierungen. Als Trajektorienschnittstelle wird insbesondere eine Beschleunigung verwendet.
-
Ein in der Forschung weit verbreiteter Ansatz zur Trajektorienregelung TR ist eine modellprädiktive Regelung (MPC). Diese modellprädiktive Regelung basiert auf Optimierungsstrategien und ist stark abhängig von einer Genauigkeit eines zur Prädiktion P des Fahrzeugverhaltens genutzten Modells. Ein genaues Modell ist komplex, meist nichtlinear und rechenintensiv, sodass häufig vereinfachte lineare Modelle genutzt werden, insbesondere um eine Echtzeitfähigkeit zu erhalten.
-
Bei der modellprädiktiven Regelung wird ein Kostenfunktional minimiert. Dieses Kostenfunktional enthält u.a. eine zukünftige Abweichung eines Fahrzeugverhaltens von einer zukünftigen Referenz, hier der Trajektorie T. Damit kann eine zeitlich vorausliegende Information, zum Beispiel über eine starke Bremsung in der Trajektorie T, genutzt werden. Das Kostenfunktional kann auch eine Abweichung von einer in der Trajektorie T implizit enthaltenen Beschleunigungsreferenz sowie Beschleunigungsinkremente berücksichtigen. Hier kommt der Vorteil der im Folgenden anhand 2 beschriebenen Beschleunigungsprädiktion durch mehrere Modelle im Rahmen der Längspositionsregelung zusätzlich zum Tragen.
-
Für die modellprädiktive Regelung ist es notwendig, das Fahrzeugverhalten über N diskrete Zeitschritte k+1 bis k+N zu prädizieren. Eine Optimierung O erfolgt online und muss damit schnell sein. Bisher erfolgt die Prädiktion P, wie oben bereits erwähnt und in 1 gezeigt, von Zeitschritt k bis k+N-1 zu Zeitschritt k bis k+N, d. h. die Prädiktion P von Zeitschritt k+2 hängt von der Prädiktion P in Zeitschritt k+1 ab usw.
-
Neuronale Netze eignen sich aufgrund der schnellen Berechnung und der hohen Genauigkeit für die Prädiktion P. Werden diese neuronalen Netze als Modell NN für die Prädiktion P des Fahrzeugverhaltens genutzt, ist der erste Schritt sehr genau, alle weiteren prädizieren aufgrund eines Fortpflanzungsfehlers jedoch ungenau. Der Fortpflanzungsfehler ist auch bei anderen Modellarten ein Problem. Durch das Optimierungsproblem können Geschwindigkeitsbeschränkungen, Komfortlimits, Aktuatorlimits etc. explizit
berücksichtigt werden, wodurch sich ein geschlossenes Konzept ergibt.
-
2 zeigt eine Regelung einer Längsposition des Fahrzeugs AF mit einer im Vergleich zu 1 wesentlich verbesserten Prädiktion P des zukünftigen Fahrverhaltens des Fahrzeugs AF, denn hier wird für jeden der vorausliegenden Zeitschritte k+1 bis k+N ein eigenes Modell NN1 bis NNn zur Prädiktion P verwendet.
-
Im Folgenden wird ein der Darstellung gemäß 2 entsprechendes Verfahren zur modellprädiktiven Regelung einer Längsposition des Fahrzeugs AF, insbesondere eines automatisiert oder autonom fahrenden Fahrzeugs AF, unter Berücksichtigung des erwarteten zukünftigen Fahrverhalten des Fahrzeugs AF, insbesondere eines Beschleunigungsverhaltens, näher beschrieben. Dieses Verfahren wird zeitgetaktet durchgeführt, d. h. es wird insbesondere das erwartete zukünftige Fahrverhalten des Fahrzeugs AF zeitgetaktet ermittelt. Dabei wird für jeden Zeitschritt k+1 bis k+N das erwartete zukünftige Fahrverhalten des Fahrzeugs AF ermittelt, indem ein Fahrzustand des Fahrzeugs AF, insbesondere eine Beschleunigung des Fahrzeugs AF, für eine vorgegebene Anzahl von vorausliegenden Zeitschritten k+1 bis k+N prädiziert wird, wobei für jeden der vorausliegenden Zeitschritte k+1 bis k+N ein eigenes Modell NN1 bis NNn, vorzugsweise ein eigenes neuronales Netz, zur Prädiktion P verwendet wird.
-
Das Verfahren ermöglicht somit eine Trajektorienregelung TR in der Fahrzeuglängsregelung, d. h. zur Regelung der Längsposition des Fahrzeugs AF, auf Basis der modellprädiktiven Regelung, die für jeden Regelzeitpunkt mehrere Schritte (Prädiktionshorizont), d. h. mehrere Zeitschritte k bis k+N, voraussimuliert (prädiziert), wobei für jeden vollen Prädiktionshorizont, d. h. für jeden vorausliegenden Zeitschritt k+1 bis k+N, ein eigenes Modell NN1 bis NNn, beispielsweise in Form eines neuronalen Netzes, verwendet wird. Damit wird eine Fehlerfortpflanzung, d. h. ein Fortpflanzungsfehler, bei Prädiktionen P des Fahrzeugverhaltens vermindert, insbesondere minimiert oder eliminiert, und es ist möglich, schnelle, insbesondere nichtlineare, Modelle NN1 bis NNn, beispielsweise neuronale Netze, die üblicherweise einen starken Fortpflanzungsfehler aufweisen, für die Modellierung einzusetzen, was wiederum vorteilhaft für die Echtzeitanwendung im Fahrzeug AF ist. Das Verfahren eignet sich somit insbesondere für die Verwendung von Prädiktionsmodellen, die einen starken Fortpflanzungsfehler aufweisen.
-
Das hier beschriebene vorteilhafte Verfahren basiert somit auf mehreren genauen Modellen NN1 bis NNn. Durch mehrere Modelle NN1 bis NNn wird die Fehlerfortpflanzung verringert und die Prädiktionsgenauigkeit erhöht. Im hier dargestellten und beschriebenen Beispiel sind die Modelle NN1 bis NNn in Form von neuronalen Netzen ausgebildet, die inhärente und nichtlineare Systemdynamiken abbilden können. Der einfache Aufbau der neuronalen Netze ermöglicht eine schnelle Auswertung dieser neuronalen Netze zur Laufzeit, wodurch die Anwendung in Echtzeit begünstigt wird. Alternativ zu neuronalen Netzen können auch andere Modelle NN1 bis NNn verwendet werden.
-
In 2 ist ein Aufbau der Regelung dargestellt. Mittels einer Trajektorienplanung TP wird die Trajektorie T geplant, welche anschließend der Optimierung O in der Trajektorienregelung TR unterzogen wird. Die mittels der Prädiktion P mit den Modellen NN1 bis NNn, insbesondere neuronalen Multimodellen, insbesondere neuronalen Netzen, ermittelten Prädiktionsergebnisse werden in der Optimierung 0 verwendet, um ein optimales Steuersignal actrl an das automatisiert oder autonom fahrende Fahrzeug AF zu kommandieren.
-
In der in 2 gezeigten Regelung ist zudem eine Zustandsrückführung ZR vom automatisiert oder autonom fahrenden Fahrzeug AF zurück zur Prädiktion P als Basis für die Prädiktionen P vorgesehen.
-
Die Prädiktion P des Fahrzeugverhaltens ist im unteren Teil der 2 dargestellt. Jedes Modell NN1 bis NNn ist dabei ein individuelles Modell, insbesondere ein individuelles neuronales Netz, das speziell für den jeweiligen Zeitschritt k+1 bis k+N trainiert wurde.
-
Damit wird die Abhängigkeit des Prädiktionsergebnisses von der vorherigen Prädiktion P eliminiert.
-
Eine Erfassung von Daten für ein Offline-Training erfolgt im automatisiert oder autonom fahrenden Fahrzeug AF durch Aufzeichnung im Fahrzeug AF, zum Beispiel auf einer Teststrecke oder auf einem Prüfstand. Somit werden neben Schaltphänomenen auch unbekannte Systemdynamiken wie Black-Box-Regler von Zulieferern in der Prädiktion P berücksichtigt, wodurch die Prädiktionsgenauigkeit erhöht wird und somit das Regelergebnis verbessert wird.
-
Die Modelle NN1 bis NNn, insbesondere die neuronalen Netze, werden beispielsweise verwendet, um ein Fahrzeugbeschleunigungsverhalten zu prädizieren, da eine direkte Prädiktion P der Längsposition nur schwer möglich ist. Für die Positionsregelung wird diese Prädiktion P zweifach integriert, wodurch der Fortpflanzungsfehler zusätzlich verstärkt wird. Gerade aufgrund des integrierenden Verhaltens des automatisiert oder autonom fahrenden Fahrzeugs AF von der Fahrzeugbeschleunigung zur Fahrzeugposition ist eine hohe Prädiktionsgenauigkeit des Beschleunigungsverhaltens extrem wichtig, da ein eventueller Fehler hier ebenfalls integriert werden würde und so die Streckenprädiktion verschlechtern würde.
-
Mit dem beschriebenen Verfahren werden nichtlineare Effekte, zum Beispiel bei Langsamfahrt, berücksichtigt, eine hohe Positionstreue kann eingehalten werden und die nichtlineare Optimierung O kann in Echtzeit erfolgen, sodass eine Anwendung im Fahrzeug AF möglich ist.
-
Wie oben bereits erwähnt, werden mit den neuronalen Netzen vorteilhafterweise die Beschleunigungen zu verschiedenen Zeitpunkten und/oder für die verschiedenen vorausliegenden Zeitschritte k+1 bis k+N prädiziert, insbesondere zu den die verschiedenen vorausliegenden Zeitschritte k+1 bis k+N anfangsseitig und/oder endseitig begrenzenden Zeitpunkten.
-
Vorteilhafterweise werden durch zweifache Integration der Beschleunigungen daraus prädizierte Längspositionen ermittelt, die dann der Regelung der Längsposition zugrunde gelegt werden.
-
Das Verfahren wird insbesondere zur Regelung der Längsposition des Fahrzeugs AF verwendet, in einer vorteilhaften Ausgestaltung kann es aber auch zur Regelung der Längsposition und Querposition des Fahrzeugs AF verwendet werden. Es wird dann somit zusätzlich auch die Querposition des Fahrzeugs AF geregelt. Es handelt sich dann somit um ein Verfahren zur Regelung der Längsposition und Querposition des Fahrzeugs AF.
-
Bezugszeichenliste
-
- actrl
- Steuersignal
- AF
- Fahrzeug
- k bis k+N
- Zeitschritt
- NN, NN1 bis NNn
- Modell
- O
- Optimierung
- P
- Prädiktion
- T
- Trajektorie
- TP
- Trajektorienplanung
- TR
- Trajektorienregelung
- ZR
- Zustandsrückführung