DE102021201011A1

DE102021201011A1 - Unsupervised optimization of odometry models

Info

Publication number: DE102021201011A1
Application number: DE102021201011.3A
Authority: DE
Inventors: Steffen Biel; Christian Heupel
Original assignee: ZF Friedrichshafen AG
Current assignee: ZF Friedrichshafen AG
Priority date: 2021-02-04
Filing date: 2021-02-04
Publication date: 2022-08-04

Abstract

Die Erfindung betrifft ein Verfahren zum Berechnen einer Pose eines Fahrzeugs; wobei die Pose oder Änderung der Pose des Fahrzeugs mittels eines oder mehrere Sensoren gemessen wird; wobei die Pose oder Änderung der Pose des Fahrzeugs mittels eines mechanischen Modells des Fahrzeugs berechnet wird; und wobei eine Abweichung der berechneten Pose von der gemessenen Pose ermittelt wird. Das Modell wird durch unüberwachtes bestärkendes Lernen, mit der Abweichung als Belohnung, optimiert.The invention relates to a method for calculating a pose of a vehicle; wherein the pose or change in pose of the vehicle is measured by one or more sensors; wherein the pose or change in pose of the vehicle is calculated using a mechanical model of the vehicle; and wherein a deviation of the calculated pose from the measured pose is determined. The model is optimized through unsupervised reinforcement learning, with deviation as a reward.

Description

Die Erfindung betrifft ein Verfahren nach dem Oberbegriff von Anspruch 1, ein Computerprogramm nach Anspruch 4 und eine Rechenvorrichtung nach Anspruch 5.The invention relates to a method according to the preamble of claim 1, a computer program according to claim 4 and a computing device according to claim 5.

Für die optimale Lokalisierung und Navigation von autonomen Fahrzeugen ist eine hohe Genauigkeit der Vorhersage einer Eigenbewegung eines Fahrzeuges (Vehicle Motion Estimation, VME) notwendig. Die VME wird oft durch Fusion der Daten verschiedener Sensoren, z.B. mit Hilfe von Kalman Filtern, realisiert. Die Daten werden mit Hilfe von Expertenmodellen verarbeitet.For the optimal localization and navigation of autonomous vehicles, a high accuracy of the prediction of a vehicle's own movement (Vehicle Motion Estimation, VME) is necessary. The VME is often realized by fusing the data from different sensors, e.g. with the help of Kalman filters. The data is processed using expert models.

Für die Lokalisierung und Navigation existiert eine große Zahl von Algorithmen oder Verfahren (z.B. SLAM). Die Berechnung der aktuellen Position des Fahrzeuges in einem definierten Raum ist abhängig von der Güte der Sensierung der Umgebung. Dabei kann die Qualität der von einem Sensor gemessenen Targets häufig nur schwer abgeschätzt werden. In der Regel ist unklar, welcher Sensor bei welchen Umgebungsbedingungen benutzt werden soll, also welchem Sensor man vertrauen kann.A large number of algorithms or methods (e.g. SLAM) exist for localization and navigation. The calculation of the current position of the vehicle in a defined space depends on the quality of the environment sensing. The quality of the targets measured by a sensor can often only be estimated with difficulty. It is usually unclear which sensor should be used under which environmental conditions, i.e. which sensor can be trusted.

Zur Bewertung der Sensorgüte im aktuellen Zeitraum werden heute statische Werte angenommen und in einer sog. Kovarianzmatrix definiert. Um die Daten verschiedener Sensoren zu fusionieren, ist eine genaue Kenntnis der Kovarianzen, d.h. der gegenseitigen Abhängigkeiten zwischen den eingesetzten Sensoren und Algorithmen notwendig. Diese sind aber in der Regel unbekannt oder nur sehr ungenau zu bestimmen.To evaluate the sensor quality in the current period, static values are assumed and defined in a so-called covariance matrix. In order to merge the data from different sensors, precise knowledge of the covariances, i.e. the mutual dependencies between the sensors and algorithms used, is necessary. However, these are usually unknown or can only be determined very imprecisely.

Wenn Sich ein Fahrzeug häufig in einem ähnlichen Zustandsraum bewegt wird bislang eine gewonnene Kenntnis über die Umgebung nicht dauerhaft festgehalten. Ähnliche Situationen und Zustände müssen infolgedessen bei jeder Fahrt neu bewertet werden.If a vehicle frequently moves in a similar state space, knowledge gained about the environment has not been permanently recorded so far. As a result, similar situations and conditions have to be reassessed every time you drive.

Aus dem Stand der Technik ist der Einsatz von neuronalen Netzen zum Lösen der Vorwärtskinematik eines 3-DOF Aktuators bekannt. Ein entsprechender Ansatz wird beschrieben in „Kinematic analysis of a novel 3-DOF actuation redundant parallel manipulator using artificial intelligence approach“ (Zhang D., Lei J.; Robotics and Computer-Integrated Manufacturing, 27(1), 2001, 157-163).The use of neural networks to solve the forward kinematics of a 3-DOF actuator is known from the prior art. A corresponding approach is described in "Kinematic analysis of a novel 3-DOF actuation redundant parallel manipulator using artificial intelligence approach" (Zhang D., Lei J.; Robotics and Computer-Integrated Manufacturing, 27(1), 2001, 157-163 ).

In „Design optimization of a spatial six degree-of-freedom parallel manipulator based on artificial intelligence approaches“ (Gao Z., Zhang D., Ge Y; Robotics and Computer-Integrated Manufacturing, 26(2), 2010, 180-189) wird der Einsatz künstlicher Intelligenz beschrieben, um die Steifigkeit und Flexibilität eines 6-DOF Roboterarms und darüber die Kinematik zu beschreiben. Damit wird das Design des Aktuators optimiert.In "Design optimization of a spatial six degree-of-freedom parallel manipulator based on artificial intelligence approaches" (Gao Z., Zhang D., Ge Y; Robotics and Computer-Integrated Manufacturing, 26(2), 2010, 180-189 ) the use of artificial intelligence is described to describe the rigidity and flexibility of a 6-DOF robot arm and the kinematics. This optimizes the design of the actuator.

Eine systematische Methode zur manuellen Korrektur und Optimierung der Odometrie mobiler Roboter ist aus „Correction of systematic odometry errors in mobile robots“ (Borenstein, J., Feng, L.; in Proceedings 1995 IEEEIRSJ International Conference on Intelligent Robots and Systems. Human Robot Interaction and Cooperative Robots, Vol. 3, 569-574, IEEE, 1995) bekannt.A systematic method for manual correction and optimization of odometry of mobile robots is from "Correction of systematic odometry errors in mobile robots" (Borenstein, J., Feng, L.; in Proceedings 1995 IEEEIRSJ International Conference on Intelligent Robots and Systems. Human Robot Interaction and Cooperative Robots, Vol. 3, 569-574, IEEE, 1995).

Die Druckschrift DE 10 2018 002 029 A1 bezieht sich auf die Ermittlung einer Voraussage für eine Pose eines Fahrzeugs. In der Vergangenheit liegende Messdaten werden dabei aufgezeichnet und mittels eines neuronalen Netzes gelernt. Aus den gelernten Messdaten ermittelt das neuronale Netz eine zukünftige Pose des Fahrzeugs.The pamphlet DE 10 2018 002 029 A1 refers to determining a prediction for a pose of a vehicle. Measurement data from the past are recorded and learned using a neural network. The neural network uses the learned measurement data to determine a future pose for the vehicle.

Der Erfindung liegt die Aufgabe zugrunde, die Genauigkeit der Bestimmung einer Pose eines Fahrzeugs auf Basis eines mechanischen Modells zu verbessern. Diese Aufgabe wird gelöst durch ein Verfahren nach Anspruch 1, ein Computerprogramm nach Anspruch 4 und eine Rechenvorrichtung nach Anspruch 5. Bevorzugte Weiterbildungen sind in den Unteransprüchen enthalten und ergeben sich aus nachfolgender Beschreibung.The object of the invention is to improve the accuracy of determining a pose of a vehicle on the basis of a mechanical model. This object is achieved by a method according to claim 1, a computer program according to claim 4 and a computing device according to claim 5. Preferred developments are contained in the dependent claims and result from the following description.

Das erfindungsgemäße Verfahren dient zum Berechnen einer Pose eines Fahrzeugs. Unter der Pose werden eine Position und Orientierung des Fahrzeugs verstanden. The method according to the invention serves to calculate a pose of a vehicle. The pose is understood to mean a position and orientation of the vehicle.

Die Pose oder eine Änderung der Pose wird zunächst mittels eines oder mehrerer Sensoren gemessen. Als Sensoren werden beispielsweise die NSS-, Lidar- und/oder Radarsensoren verwendet. Die Sensoren bzw. deren Messungen bilden ein Referenzsystem.The pose or a change in pose is first measured by one or more sensors. NSS, lidar and/or radar sensors are used as sensors, for example. The sensors and their measurements form a reference system.

In Ergänzung zu der gemessenen Pose wird die Pose oder Änderung der Pose mittels eines mechanischen Modells des Fahrzeugs berechnet. Das mechanische Modell ist ein Modell, das eine oder mehrere mechanische Eigenschaften des Fahrzeugs beschreibt. Zu den mechanischen Eigenschaften gehören die kinematischen Eigenschaften des Fahrzeugs, welche Bewegungen des Fahrzeugs ohne Einfluss von Kräften betreffen, und die dynamischen Eigenschaften des Fahrzeugs, welche den Einfluss von Kräften widerspiegeln, die auf das Fahrzeug oder innerhalb des Fahrzeugs wirken. Insbesondere kann das mechanische Modell als kinematisches Modell, das nur die Kinematik des Fahrzeugs berücksichtigt, ausgestaltet sein.In addition to the measured pose, the pose or change in pose is calculated using a mechanical model of the vehicle. The mechanical model is a model that describes one or more mechanical properties of the vehicle. The mechanical properties include the kinematic properties of the vehicle, which relate to movements of the vehicle without the influence of forces, and the dynamic properties of the vehicle, which reflect the influence of forces acting on or within the vehicle. In particular, the mechanical model can be designed as a kinematic model that only takes into account the kinematics of the vehicle.

Erfindungsgemäß wird das Modell durch unüberwachtes bestärkendes Lernen optimiert. Als Belohnung dient dabei eine zuvor ermittelte Abweichung der berechneten Pose von der gemessenen Pose.According to the invention, the model is optimized by unsupervised reinforcement learning. A previously determined deviation of the calculated pose from the measured pose serves as a reward.

Das Modell wird bei einem Ausfall des Referenzsystems herangezogen, um die Pose des Fahrzeugs zu ermitteln. Die Erfindung ermöglicht es, sehr gut auf neue Gegebenheiten der Umgebung zu reagieren und zeitliche Verläufe mit einzubeziehen. Komplexe Odometriemodelle können auf diese Weise einfacher erstellt werden und bilden durch das erfindungsgemäße Lernverfahren die Realität exakter ab. Durch die Erfindung kann ein Odometriemodell dynamisch an Veränderungen des Beladungszustands des Fahrzeugs und eine beispielsweise daraus resultierende Verschiebung des Schwerpunkts angepasst werden.In the event of a failure of the reference system, the model is used to determine the pose of the vehicle. The invention makes it possible to react very well to new circumstances in the environment and to include time profiles. Complex odometry models can be created more easily in this way and depict reality more precisely thanks to the learning method according to the invention. With the invention, an odometry model can be dynamically adapted to changes in the loading condition of the vehicle and a resulting shift in the center of gravity, for example.

Das mechanische Modell des Fahrzeugs kann als Blackbox- oder als Greybox-Modell ausgeführt sein. Wird ein Greybox-Modell verwendet, lernt die künstliche Intelligenz eine optimale Konfiguration des Modells und eine dynamische Variation der Parameter. Zugrunde liegt ein deterministisches Verhalten. Das Modell selbst ist in diesem Fall bekannt und unterliegt keinem Lernprozess.The mechanical model of the vehicle can be designed as a black box or gray box model. If a gray box model is used, the artificial intelligence learns an optimal configuration of the model and a dynamic variation of the parameters. It is based on a deterministic behavior. In this case, the model itself is known and is not subject to any learning process.

Bei einem Blackbox-Modell lernt die künstliche Intelligenz das mechanische Modell vollständig selbst. Hierzu werden randomisierte Initialgewichte oder vorjustierte Gewichte verwendet, um ein bekanntes Modell grob abzuschätzen und zu einer schnelleren Konvergenz zu führen. Das erlernte Modell ist in diesem Fall unbekannt. Restriktionen in Form eines vorgegebenen Modells lassen sich durch ein Blackbox-Modell vermeiden.In a black box model, the artificial intelligence learns the mechanical model entirely by itself. For this purpose, randomized initial weights or pre-adjusted weights are used to roughly estimate a known model and lead to faster convergence. The learned model is unknown in this case. Restrictions in the form of a given model can be avoided by using a black box model.

Mittels der Erfindung lässt sich ein mechanisches Modell für eine Fahrzeugflotte beispielsweise trainieren, indem das Modell zunächst unter eingeschränkter Parameterzahl einem vorbereitenden Training unterzogen wird, bis eine definierte Genauigkeit erreicht ist. Im Rahmen des vorbereitenden Trainings wird vorzugsweise ein erstes neuronales Netz trainiert. Anschließend kommt ein zweites neuronales Netz zum Einsatz. Das erste neuronale Netzwerk lässt sich auf allen Fahrzeugen der Flotte einsetzen. Über eine Cloud werden die Gewichte optimiert, sofern ein Referenzsystem verfügbar ist. Die vorgenommenen Gewichtsänderungen sind jetzt allerdings sehr klein. Mittels eines weiteren, fahrzeugspezifischen neuronalen Netzes wird unter Einbeziehung weiterer Parameter die Ausgabe des ersten neuronalen Netzes justiert, um es fahrzeugspezifischen Eigenschaften anzupassen, beispielsweise unterschiedliche Einsatzorte, variierende Ausstattungen oder abweichendes Fahrzeuggewicht.Using the invention, a mechanical model for a vehicle fleet can be trained, for example, by first subjecting the model to preparatory training with a limited number of parameters until a defined accuracy is achieved. A first neural network is preferably trained as part of the preparatory training. A second neural network is then used. The first neural network can be used on all vehicles in the fleet. The weights are optimized via a cloud if a reference system is available. However, the weight changes made are now very small. The output of the first neural network is adjusted by means of a further, vehicle-specific neural network, taking into account further parameters, in order to adapt it to vehicle-specific properties, for example different locations, varying equipment or different vehicle weight.

In einer bevorzugten Weiterbildung wird das Verfahren iterativ ausgeführt. Mit fortschreitender Iteration passt sich das Modell immer genau an die Gegebenheiten des Fahrzeugs an. Ein Ausfall des Referenzsystems lässt sich dadurch immer besser und über längerer Zeit ausgleichen.In a preferred development, the method is carried out iteratively. As iteration progresses, the model always adapts precisely to the vehicle's conditions. A failure of the reference system can thus be compensated better and over a longer period of time.

In einer darüber hinaus bevorzugten Weiterbildung wird mindestens ein Wert einer physikalischen Größe des Fahrzeugs gemessen und als Eingabeparameter des mechanischen Modells verwendet. Als physikalische Größen kommen etwa Odometriedaten des Fahrzeugs infrage.In another preferred development, at least one value of a physical variable of the vehicle is measured and used as an input parameter for the mechanical model. Possible physical parameters include odometry data from the vehicle.

Das erfindungsgemäße Computerprogramm ist ausgebildet, eine Rechenvorrichtung zur Ausführung des erfindungsgemäßen Verfahrens oder einer bevorzugten Weiterbildung zu veranlassen.The computer program according to the invention is designed to cause a computing device to carry out the method according to the invention or a preferred development.

Eine erfindungsgemäße Rechenvorrichtung ist ausgebildet, das erfindungsgemäße Verfahren oder eine bevorzugte Weiterbildung auszuführen. Eine Rechenvorrichtung ist etwa dann erfindungsgemäß, wenn sie ein erfindungsgemäßes Computerprogramm enthält.A computing device according to the invention is designed to carry out the method according to the invention or a preferred development. A computing device is in accordance with the invention, for example, if it contains a computer program in accordance with the invention.

Durch die Optimierung des Modells mittels unüberwachtem bestärkendem Lernen kann eine Bewertung der Detektionswahrscheinlichkeiten der einzelnen Sensoren im aktuellen Zeitraum berechnet werden. In einer bevorzugten Weiterbildung wird entsprechend eine Detektionswahrscheinlichkeit mindestens eines Sensors berechnet. Die Gütebewertung der relativen Lokalisierung erfolgt in Echtzeit und wird in einer digitalen Karte einer Position zugeordnet und gespeichert. Dadurch ist es möglich zu erkennen, ob die Sensoren plausible Werte liefern. Zur aktuellen Position wird die Gütebewertung der Lokalisierung in einer Lokalisierungsgütekarte gespeichert. So entsteht im Laufe der Zeit eine Datenstruktur, aus der die Sensorgüte in Abhängigkeit des Fahrzeugzustands ausgelesen werden kann.By optimizing the model using unsupervised reinforcement learning, an assessment of the detection probabilities of the individual sensors in the current period can be calculated. In a preferred development, a detection probability of at least one sensor is calculated accordingly. The quality assessment of the relative localization takes place in real time and is assigned to a position and stored on a digital map. This makes it possible to detect whether the sensors deliver plausible values. The quality assessment of the localization is stored in a localization quality map for the current position. Over time, a data structure is created from which the sensor quality can be read out depending on the vehicle condition.

In einem bevorzugten Ausführungsbeispiel der Erfindung wird die Änderung einer Position eines Fahrzeugs in Abhängigkeit von Raddrehzahlen und definierten Einflussparametern durch ein Verfahren der künstlichen Intelligenz vorhergesagt. Während des Trainings erfolgt eine Korrektur der Lokalisierung durch ein Referenzsystem, beispielsweise GPS. Dabei wird auch die die Qualität des Referenzsystems berücksichtigt.In a preferred exemplary embodiment of the invention, the change in a position of a vehicle as a function of wheel speeds and defined influencing parameters is predicted using an artificial intelligence method. During the training, the localization is corrected by a reference system, for example GPS. The quality of the reference system is also taken into account.

Wenn die Qualität des Referenzsystems hinreichend ist, wird das Verfahren ausgehend von einem initialen Startzustand s₀ mit bekannter Position $p_{0}^{s} = p_{0}$

und initialem Score wie folgt trainiert:

- Durch Einbeziehung von Stochastiken werden die „erlernten“ Gewichtungen beeinflusst. Daraus ergibt sich ein evolutionäres Verhalten. Mit jeder Epoche werden mehrere Modelle parallel trainiert. Als Ausgangselement für die nächste Epoche werden dabei jeweils die besten Kandidaten selektiert.
- In jedem Schritt t wird mittels künstlicher Intelligenz eine Positionsänderung $Δ p_{t + 1}^{t}$
in Abhängigkeit von s_t vorhergesagt. $p_{t + 1}^{s} = p_{t}^{s} + Δ p_{t + 1}^{t} (s_{t})$
Mittels einer Feedback-Funktion wird eine Belohnung $r_{t} (p_{t + 1}^{s}, p_{t + 1})$
generiert. Dabei erfolgt jeweils eine Backpropagation zur Justierung der Gewichtungen der Verbindungen der „Neuronen“ der künstlichen Intelligenz.
- Die jeweilige Epoche wird beendet, sobald eine maximale Abweichung von $d i s t (p_{t + 1}^{s}, p_{t + 1})$
überschritten wird. Hiernach ist die maximal fahrbare Distanz bekannt, die im Schnitt zuverlässig gefahren werden kann (Qualitätsbeschreibung).
- Durch Summation ergibt sich eine Gesamtbelohnung $r = \sum_{t = 0}^{t_{m a x}} r_{t} .$
Die besten Kandidaten werden ausgewählt.
- Als Feedback wird z.B. folgender Wert einer Glockenkurve verwendet: $\frac{1}{# P a r a m e t e r : : G e n a u i g k e i t} \cdot exp (- # P a r a m e t e r : : G e n a u i g k e i t^{2} \cdot d i s t {(p_{t + 1}^{s}, p_{t + 1})}^{2})$

If the quality of the reference system is sufficient, the method starts from an initial start state s ₀ with a known position

p_{0}^{s} = p_{0}

and initial score trained as follows:

- The "learned" weightings are influenced by the inclusion of stochastics. This results in an evolutionary behavior. With each epoch, multiple models are trained in parallel. The best candidates are selected as the starting point for the next epoch.
- In each step t, a position change is made using artificial intelligence $Δ p_{t + 1}^{t}$
predicted as a function of s _t . $p_{t + 1}^{s} = p_{t}^{s} + Δ p_{t + 1}^{t} (s_{t})$
A reward is provided by means of a feedback function ${right}_{t} (p_{t + 1}^{s}, p_{t + 1})$
generated. In each case, a back propagation takes place to adjust the weighting of the connections of the "neurons" of the artificial intelligence.
- The respective epoch ends as soon as a maximum deviation of $i.e i s t (p_{t + 1}^{s}, p_{t + 1})$
is exceeded. The maximum distance that can be driven reliably on average is then known (quality description).
- Summation results in a total reward $right = \sum_{t = 0}^{t_{m a x}} {right}_{t} .$
The best candidates are selected.
- The following value of a bell curve is used as feedback: $\frac{1}{# P a right a m e t e right : : G e n a and i G k e i t} \cdot ex (- # P a right a m e t e right : : G e n a and i G k e i t^{2} \cdot i.e i s t {(p_{t + 1}^{s}, p_{t + 1})}^{2})$

ZITATE ENTHALTEN IN DER BESCHREIBUNGQUOTES INCLUDED IN DESCRIPTION

Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of documents cited by the applicant was generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA assumes no liability for any errors or omissions.

Zitierte PatentliteraturPatent Literature Cited

DE 102018002029 A1 [0009]

Claims

Method for calculating a pose of a vehicle; wherein the pose or change in pose of the vehicle is measured by one or more sensors; wherein the pose or change in pose of the vehicle is calculated using a mechanical model of the vehicle; and wherein a deviation of the calculated pose from the measured pose is determined; characterized in that the model is optimized by unsupervised reinforcement learning, with deviation as a reward.

procedure after claim 1 ; characterized in that the method is carried out iteratively.

Method according to one of the preceding claims; characterized in that at least one value of a physical quantity of the vehicle is measured and used as an input parameter of the mechanical model.

Method according to one of the preceding claims; characterized in that at least one value of a physical quantity of the vehicle environment is measured and sent as an input parameter of the mechanical model.

Method according to one of the preceding claims; characterized in that a detection probability of at least one sensor is calculated.

Computer program designed to cause a computing device to execute a method according to one of the preceding claims.

Computing device which is designed to carry out a method according to one of the preceding method claims.