DE102021201011A1 - Unsupervised optimization of odometry models - Google Patents

Unsupervised optimization of odometry models Download PDF

Info

Publication number
DE102021201011A1
DE102021201011A1 DE102021201011.3A DE102021201011A DE102021201011A1 DE 102021201011 A1 DE102021201011 A1 DE 102021201011A1 DE 102021201011 A DE102021201011 A DE 102021201011A DE 102021201011 A1 DE102021201011 A1 DE 102021201011A1
Authority
DE
Germany
Prior art keywords
vehicle
pose
model
measured
calculated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102021201011.3A
Other languages
German (de)
Inventor
Steffen Biel
Christian Heupel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZF Friedrichshafen AG
Original Assignee
ZF Friedrichshafen AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZF Friedrichshafen AG filed Critical ZF Friedrichshafen AG
Priority to DE102021201011.3A priority Critical patent/DE102021201011A1/en
Publication of DE102021201011A1 publication Critical patent/DE102021201011A1/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/28Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network with correlation of data from several navigational instruments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computational Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Algebra (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Automation & Control Theory (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zum Berechnen einer Pose eines Fahrzeugs; wobei die Pose oder Änderung der Pose des Fahrzeugs mittels eines oder mehrere Sensoren gemessen wird; wobei die Pose oder Änderung der Pose des Fahrzeugs mittels eines mechanischen Modells des Fahrzeugs berechnet wird; und wobei eine Abweichung der berechneten Pose von der gemessenen Pose ermittelt wird. Das Modell wird durch unüberwachtes bestärkendes Lernen, mit der Abweichung als Belohnung, optimiert.The invention relates to a method for calculating a pose of a vehicle; wherein the pose or change in pose of the vehicle is measured by one or more sensors; wherein the pose or change in pose of the vehicle is calculated using a mechanical model of the vehicle; and wherein a deviation of the calculated pose from the measured pose is determined. The model is optimized through unsupervised reinforcement learning, with deviation as a reward.

Description

Die Erfindung betrifft ein Verfahren nach dem Oberbegriff von Anspruch 1, ein Computerprogramm nach Anspruch 4 und eine Rechenvorrichtung nach Anspruch 5.The invention relates to a method according to the preamble of claim 1, a computer program according to claim 4 and a computing device according to claim 5.

Für die optimale Lokalisierung und Navigation von autonomen Fahrzeugen ist eine hohe Genauigkeit der Vorhersage einer Eigenbewegung eines Fahrzeuges (Vehicle Motion Estimation, VME) notwendig. Die VME wird oft durch Fusion der Daten verschiedener Sensoren, z.B. mit Hilfe von Kalman Filtern, realisiert. Die Daten werden mit Hilfe von Expertenmodellen verarbeitet.For the optimal localization and navigation of autonomous vehicles, a high accuracy of the prediction of a vehicle's own movement (Vehicle Motion Estimation, VME) is necessary. The VME is often realized by fusing the data from different sensors, e.g. with the help of Kalman filters. The data is processed using expert models.

Für die Lokalisierung und Navigation existiert eine große Zahl von Algorithmen oder Verfahren (z.B. SLAM). Die Berechnung der aktuellen Position des Fahrzeuges in einem definierten Raum ist abhängig von der Güte der Sensierung der Umgebung. Dabei kann die Qualität der von einem Sensor gemessenen Targets häufig nur schwer abgeschätzt werden. In der Regel ist unklar, welcher Sensor bei welchen Umgebungsbedingungen benutzt werden soll, also welchem Sensor man vertrauen kann.A large number of algorithms or methods (e.g. SLAM) exist for localization and navigation. The calculation of the current position of the vehicle in a defined space depends on the quality of the environment sensing. The quality of the targets measured by a sensor can often only be estimated with difficulty. It is usually unclear which sensor should be used under which environmental conditions, i.e. which sensor can be trusted.

Zur Bewertung der Sensorgüte im aktuellen Zeitraum werden heute statische Werte angenommen und in einer sog. Kovarianzmatrix definiert. Um die Daten verschiedener Sensoren zu fusionieren, ist eine genaue Kenntnis der Kovarianzen, d.h. der gegenseitigen Abhängigkeiten zwischen den eingesetzten Sensoren und Algorithmen notwendig. Diese sind aber in der Regel unbekannt oder nur sehr ungenau zu bestimmen.To evaluate the sensor quality in the current period, static values are assumed and defined in a so-called covariance matrix. In order to merge the data from different sensors, precise knowledge of the covariances, i.e. the mutual dependencies between the sensors and algorithms used, is necessary. However, these are usually unknown or can only be determined very imprecisely.

Wenn Sich ein Fahrzeug häufig in einem ähnlichen Zustandsraum bewegt wird bislang eine gewonnene Kenntnis über die Umgebung nicht dauerhaft festgehalten. Ähnliche Situationen und Zustände müssen infolgedessen bei jeder Fahrt neu bewertet werden.If a vehicle frequently moves in a similar state space, knowledge gained about the environment has not been permanently recorded so far. As a result, similar situations and conditions have to be reassessed every time you drive.

Aus dem Stand der Technik ist der Einsatz von neuronalen Netzen zum Lösen der Vorwärtskinematik eines 3-DOF Aktuators bekannt. Ein entsprechender Ansatz wird beschrieben in „Kinematic analysis of a novel 3-DOF actuation redundant parallel manipulator using artificial intelligence approach“ (Zhang D., Lei J.; Robotics and Computer-Integrated Manufacturing, 27(1), 2001, 157-163).The use of neural networks to solve the forward kinematics of a 3-DOF actuator is known from the prior art. A corresponding approach is described in "Kinematic analysis of a novel 3-DOF actuation redundant parallel manipulator using artificial intelligence approach" (Zhang D., Lei J.; Robotics and Computer-Integrated Manufacturing, 27(1), 2001, 157-163 ).

In „Design optimization of a spatial six degree-of-freedom parallel manipulator based on artificial intelligence approaches“ (Gao Z., Zhang D., Ge Y; Robotics and Computer-Integrated Manufacturing, 26(2), 2010, 180-189) wird der Einsatz künstlicher Intelligenz beschrieben, um die Steifigkeit und Flexibilität eines 6-DOF Roboterarms und darüber die Kinematik zu beschreiben. Damit wird das Design des Aktuators optimiert.In "Design optimization of a spatial six degree-of-freedom parallel manipulator based on artificial intelligence approaches" (Gao Z., Zhang D., Ge Y; Robotics and Computer-Integrated Manufacturing, 26(2), 2010, 180-189 ) the use of artificial intelligence is described to describe the rigidity and flexibility of a 6-DOF robot arm and the kinematics. This optimizes the design of the actuator.

Eine systematische Methode zur manuellen Korrektur und Optimierung der Odometrie mobiler Roboter ist aus „Correction of systematic odometry errors in mobile robots“ (Borenstein, J., Feng, L.; in Proceedings 1995 IEEEIRSJ International Conference on Intelligent Robots and Systems. Human Robot Interaction and Cooperative Robots, Vol. 3, 569-574, IEEE, 1995) bekannt.A systematic method for manual correction and optimization of odometry of mobile robots is from "Correction of systematic odometry errors in mobile robots" (Borenstein, J., Feng, L.; in Proceedings 1995 IEEEIRSJ International Conference on Intelligent Robots and Systems. Human Robot Interaction and Cooperative Robots, Vol. 3, 569-574, IEEE, 1995).

Die Druckschrift DE 10 2018 002 029 A1 bezieht sich auf die Ermittlung einer Voraussage für eine Pose eines Fahrzeugs. In der Vergangenheit liegende Messdaten werden dabei aufgezeichnet und mittels eines neuronalen Netzes gelernt. Aus den gelernten Messdaten ermittelt das neuronale Netz eine zukünftige Pose des Fahrzeugs.The pamphlet DE 10 2018 002 029 A1 refers to determining a prediction for a pose of a vehicle. Measurement data from the past are recorded and learned using a neural network. The neural network uses the learned measurement data to determine a future pose for the vehicle.

Der Erfindung liegt die Aufgabe zugrunde, die Genauigkeit der Bestimmung einer Pose eines Fahrzeugs auf Basis eines mechanischen Modells zu verbessern. Diese Aufgabe wird gelöst durch ein Verfahren nach Anspruch 1, ein Computerprogramm nach Anspruch 4 und eine Rechenvorrichtung nach Anspruch 5. Bevorzugte Weiterbildungen sind in den Unteransprüchen enthalten und ergeben sich aus nachfolgender Beschreibung.The object of the invention is to improve the accuracy of determining a pose of a vehicle on the basis of a mechanical model. This object is achieved by a method according to claim 1, a computer program according to claim 4 and a computing device according to claim 5. Preferred developments are contained in the dependent claims and result from the following description.

Das erfindungsgemäße Verfahren dient zum Berechnen einer Pose eines Fahrzeugs. Unter der Pose werden eine Position und Orientierung des Fahrzeugs verstanden. The method according to the invention serves to calculate a pose of a vehicle. The pose is understood to mean a position and orientation of the vehicle.

Die Pose oder eine Änderung der Pose wird zunächst mittels eines oder mehrerer Sensoren gemessen. Als Sensoren werden beispielsweise die NSS-, Lidar- und/oder Radarsensoren verwendet. Die Sensoren bzw. deren Messungen bilden ein Referenzsystem.The pose or a change in pose is first measured by one or more sensors. NSS, lidar and/or radar sensors are used as sensors, for example. The sensors and their measurements form a reference system.

In Ergänzung zu der gemessenen Pose wird die Pose oder Änderung der Pose mittels eines mechanischen Modells des Fahrzeugs berechnet. Das mechanische Modell ist ein Modell, das eine oder mehrere mechanische Eigenschaften des Fahrzeugs beschreibt. Zu den mechanischen Eigenschaften gehören die kinematischen Eigenschaften des Fahrzeugs, welche Bewegungen des Fahrzeugs ohne Einfluss von Kräften betreffen, und die dynamischen Eigenschaften des Fahrzeugs, welche den Einfluss von Kräften widerspiegeln, die auf das Fahrzeug oder innerhalb des Fahrzeugs wirken. Insbesondere kann das mechanische Modell als kinematisches Modell, das nur die Kinematik des Fahrzeugs berücksichtigt, ausgestaltet sein.In addition to the measured pose, the pose or change in pose is calculated using a mechanical model of the vehicle. The mechanical model is a model that describes one or more mechanical properties of the vehicle. The mechanical properties include the kinematic properties of the vehicle, which relate to movements of the vehicle without the influence of forces, and the dynamic properties of the vehicle, which reflect the influence of forces acting on or within the vehicle. In particular, the mechanical model can be designed as a kinematic model that only takes into account the kinematics of the vehicle.

Erfindungsgemäß wird das Modell durch unüberwachtes bestärkendes Lernen optimiert. Als Belohnung dient dabei eine zuvor ermittelte Abweichung der berechneten Pose von der gemessenen Pose.According to the invention, the model is optimized by unsupervised reinforcement learning. A previously determined deviation of the calculated pose from the measured pose serves as a reward.

Das Modell wird bei einem Ausfall des Referenzsystems herangezogen, um die Pose des Fahrzeugs zu ermitteln. Die Erfindung ermöglicht es, sehr gut auf neue Gegebenheiten der Umgebung zu reagieren und zeitliche Verläufe mit einzubeziehen. Komplexe Odometriemodelle können auf diese Weise einfacher erstellt werden und bilden durch das erfindungsgemäße Lernverfahren die Realität exakter ab. Durch die Erfindung kann ein Odometriemodell dynamisch an Veränderungen des Beladungszustands des Fahrzeugs und eine beispielsweise daraus resultierende Verschiebung des Schwerpunkts angepasst werden.In the event of a failure of the reference system, the model is used to determine the pose of the vehicle. The invention makes it possible to react very well to new circumstances in the environment and to include time profiles. Complex odometry models can be created more easily in this way and depict reality more precisely thanks to the learning method according to the invention. With the invention, an odometry model can be dynamically adapted to changes in the loading condition of the vehicle and a resulting shift in the center of gravity, for example.

Das mechanische Modell des Fahrzeugs kann als Blackbox- oder als Greybox-Modell ausgeführt sein. Wird ein Greybox-Modell verwendet, lernt die künstliche Intelligenz eine optimale Konfiguration des Modells und eine dynamische Variation der Parameter. Zugrunde liegt ein deterministisches Verhalten. Das Modell selbst ist in diesem Fall bekannt und unterliegt keinem Lernprozess.The mechanical model of the vehicle can be designed as a black box or gray box model. If a gray box model is used, the artificial intelligence learns an optimal configuration of the model and a dynamic variation of the parameters. It is based on a deterministic behavior. In this case, the model itself is known and is not subject to any learning process.

Bei einem Blackbox-Modell lernt die künstliche Intelligenz das mechanische Modell vollständig selbst. Hierzu werden randomisierte Initialgewichte oder vorjustierte Gewichte verwendet, um ein bekanntes Modell grob abzuschätzen und zu einer schnelleren Konvergenz zu führen. Das erlernte Modell ist in diesem Fall unbekannt. Restriktionen in Form eines vorgegebenen Modells lassen sich durch ein Blackbox-Modell vermeiden.In a black box model, the artificial intelligence learns the mechanical model entirely by itself. For this purpose, randomized initial weights or pre-adjusted weights are used to roughly estimate a known model and lead to faster convergence. The learned model is unknown in this case. Restrictions in the form of a given model can be avoided by using a black box model.

Mittels der Erfindung lässt sich ein mechanisches Modell für eine Fahrzeugflotte beispielsweise trainieren, indem das Modell zunächst unter eingeschränkter Parameterzahl einem vorbereitenden Training unterzogen wird, bis eine definierte Genauigkeit erreicht ist. Im Rahmen des vorbereitenden Trainings wird vorzugsweise ein erstes neuronales Netz trainiert. Anschließend kommt ein zweites neuronales Netz zum Einsatz. Das erste neuronale Netzwerk lässt sich auf allen Fahrzeugen der Flotte einsetzen. Über eine Cloud werden die Gewichte optimiert, sofern ein Referenzsystem verfügbar ist. Die vorgenommenen Gewichtsänderungen sind jetzt allerdings sehr klein. Mittels eines weiteren, fahrzeugspezifischen neuronalen Netzes wird unter Einbeziehung weiterer Parameter die Ausgabe des ersten neuronalen Netzes justiert, um es fahrzeugspezifischen Eigenschaften anzupassen, beispielsweise unterschiedliche Einsatzorte, variierende Ausstattungen oder abweichendes Fahrzeuggewicht.Using the invention, a mechanical model for a vehicle fleet can be trained, for example, by first subjecting the model to preparatory training with a limited number of parameters until a defined accuracy is achieved. A first neural network is preferably trained as part of the preparatory training. A second neural network is then used. The first neural network can be used on all vehicles in the fleet. The weights are optimized via a cloud if a reference system is available. However, the weight changes made are now very small. The output of the first neural network is adjusted by means of a further, vehicle-specific neural network, taking into account further parameters, in order to adapt it to vehicle-specific properties, for example different locations, varying equipment or different vehicle weight.

In einer bevorzugten Weiterbildung wird das Verfahren iterativ ausgeführt. Mit fortschreitender Iteration passt sich das Modell immer genau an die Gegebenheiten des Fahrzeugs an. Ein Ausfall des Referenzsystems lässt sich dadurch immer besser und über längerer Zeit ausgleichen.In a preferred development, the method is carried out iteratively. As iteration progresses, the model always adapts precisely to the vehicle's conditions. A failure of the reference system can thus be compensated better and over a longer period of time.

In einer darüber hinaus bevorzugten Weiterbildung wird mindestens ein Wert einer physikalischen Größe des Fahrzeugs gemessen und als Eingabeparameter des mechanischen Modells verwendet. Als physikalische Größen kommen etwa Odometriedaten des Fahrzeugs infrage.In another preferred development, at least one value of a physical variable of the vehicle is measured and used as an input parameter for the mechanical model. Possible physical parameters include odometry data from the vehicle.

Das erfindungsgemäße Computerprogramm ist ausgebildet, eine Rechenvorrichtung zur Ausführung des erfindungsgemäßen Verfahrens oder einer bevorzugten Weiterbildung zu veranlassen.The computer program according to the invention is designed to cause a computing device to carry out the method according to the invention or a preferred development.

Eine erfindungsgemäße Rechenvorrichtung ist ausgebildet, das erfindungsgemäße Verfahren oder eine bevorzugte Weiterbildung auszuführen. Eine Rechenvorrichtung ist etwa dann erfindungsgemäß, wenn sie ein erfindungsgemäßes Computerprogramm enthält.A computing device according to the invention is designed to carry out the method according to the invention or a preferred development. A computing device is in accordance with the invention, for example, if it contains a computer program in accordance with the invention.

Durch die Optimierung des Modells mittels unüberwachtem bestärkendem Lernen kann eine Bewertung der Detektionswahrscheinlichkeiten der einzelnen Sensoren im aktuellen Zeitraum berechnet werden. In einer bevorzugten Weiterbildung wird entsprechend eine Detektionswahrscheinlichkeit mindestens eines Sensors berechnet. Die Gütebewertung der relativen Lokalisierung erfolgt in Echtzeit und wird in einer digitalen Karte einer Position zugeordnet und gespeichert. Dadurch ist es möglich zu erkennen, ob die Sensoren plausible Werte liefern. Zur aktuellen Position wird die Gütebewertung der Lokalisierung in einer Lokalisierungsgütekarte gespeichert. So entsteht im Laufe der Zeit eine Datenstruktur, aus der die Sensorgüte in Abhängigkeit des Fahrzeugzustands ausgelesen werden kann.By optimizing the model using unsupervised reinforcement learning, an assessment of the detection probabilities of the individual sensors in the current period can be calculated. In a preferred development, a detection probability of at least one sensor is calculated accordingly. The quality assessment of the relative localization takes place in real time and is assigned to a position and stored on a digital map. This makes it possible to detect whether the sensors deliver plausible values. The quality assessment of the localization is stored in a localization quality map for the current position. Over time, a data structure is created from which the sensor quality can be read out depending on the vehicle condition.

In einem bevorzugten Ausführungsbeispiel der Erfindung wird die Änderung einer Position eines Fahrzeugs in Abhängigkeit von Raddrehzahlen und definierten Einflussparametern durch ein Verfahren der künstlichen Intelligenz vorhergesagt. Während des Trainings erfolgt eine Korrektur der Lokalisierung durch ein Referenzsystem, beispielsweise GPS. Dabei wird auch die die Qualität des Referenzsystems berücksichtigt.In a preferred exemplary embodiment of the invention, the change in a position of a vehicle as a function of wheel speeds and defined influencing parameters is predicted using an artificial intelligence method. During the training, the localization is corrected by a reference system, for example GPS. The quality of the reference system is also taken into account.

Wenn die Qualität des Referenzsystems hinreichend ist, wird das Verfahren ausgehend von einem initialen Startzustand s0 mit bekannter Position p 0 s = p 0

Figure DE102021201011A1_0001
und initialem Score wie folgt trainiert:

  • - Durch Einbeziehung von Stochastiken werden die „erlernten“ Gewichtungen beeinflusst. Daraus ergibt sich ein evolutionäres Verhalten. Mit jeder Epoche werden mehrere Modelle parallel trainiert. Als Ausgangselement für die nächste Epoche werden dabei jeweils die besten Kandidaten selektiert.
  • - In jedem Schritt t wird mittels künstlicher Intelligenz eine Positionsänderung Δ p t + 1 t
    Figure DE102021201011A1_0002
    in Abhängigkeit von st vorhergesagt. p t + 1 s = p t s + Δ p t + 1 t ( s t )
    Figure DE102021201011A1_0003
    Mittels einer Feedback-Funktion wird eine Belohnung r t ( p t + 1 s , p t + 1 )
    Figure DE102021201011A1_0004
    generiert. Dabei erfolgt jeweils eine Backpropagation zur Justierung der Gewichtungen der Verbindungen der „Neuronen“ der künstlichen Intelligenz.
  • - Die jeweilige Epoche wird beendet, sobald eine maximale Abweichung von d i s t ( p t + 1 s , p t + 1 )
    Figure DE102021201011A1_0005
    überschritten wird. Hiernach ist die maximal fahrbare Distanz bekannt, die im Schnitt zuverlässig gefahren werden kann (Qualitätsbeschreibung).
  • - Durch Summation ergibt sich eine Gesamtbelohnung r = t = 0 t m a x r t .
    Figure DE102021201011A1_0006
    Die besten Kandidaten werden ausgewählt.
  • - Als Feedback wird z.B. folgender Wert einer Glockenkurve verwendet: 1 # P a r a m e t e r : : G e n a u i g k e i t exp ( # P a r a m e t e r : : G e n a u i g k e i t 2 d i s t ( p t + 1 s , p t + 1 ) 2 )
    Figure DE102021201011A1_0007
If the quality of the reference system is sufficient, the method starts from an initial start state s 0 with a known position p 0 s = p 0
Figure DE102021201011A1_0001
and initial score trained as follows:
  • - The "learned" weightings are influenced by the inclusion of stochastics. This results in an evolutionary behavior. With each epoch, multiple models are trained in parallel. The best candidates are selected as the starting point for the next epoch.
  • - In each step t, a position change is made using artificial intelligence Δ p t + 1 t
    Figure DE102021201011A1_0002
    predicted as a function of s t . p t + 1 s = p t s + Δ p t + 1 t ( s t )
    Figure DE102021201011A1_0003
    A reward is provided by means of a feedback function right t ( p t + 1 s , p t + 1 )
    Figure DE102021201011A1_0004
    generated. In each case, a back propagation takes place to adjust the weighting of the connections of the "neurons" of the artificial intelligence.
  • - The respective epoch ends as soon as a maximum deviation of i.e i s t ( p t + 1 s , p t + 1 )
    Figure DE102021201011A1_0005
    is exceeded. The maximum distance that can be driven reliably on average is then known (quality description).
  • - Summation results in a total reward right = t = 0 t m a x right t .
    Figure DE102021201011A1_0006
    The best candidates are selected.
  • - The following value of a bell curve is used as feedback: 1 # P a right a m e t e right : : G e n a and i G k e i t ex ( # P a right a m e t e right : : G e n a and i G k e i t 2 i.e i s t ( p t + 1 s , p t + 1 ) 2 )
    Figure DE102021201011A1_0007

ZITATE ENTHALTEN IN DER BESCHREIBUNGQUOTES INCLUDED IN DESCRIPTION

Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of documents cited by the applicant was generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA assumes no liability for any errors or omissions.

Zitierte PatentliteraturPatent Literature Cited

  • DE 102018002029 A1 [0009]DE 102018002029 A1 [0009]

Claims (7)

Verfahren zum Berechnen einer Pose eines Fahrzeugs; wobei die Pose oder Änderung der Pose des Fahrzeugs mittels eines oder mehrere Sensoren gemessen wird; wobei die Pose oder Änderung der Pose des Fahrzeugs mittels eines mechanischen Modells des Fahrzeugs berechnet wird; und wobei eine Abweichung der berechneten Pose von der gemessenen Pose ermittelt wird; dadurch gekennzeichnet, dass das Modell durch unüberwachtes bestärkendes Lernen, mit der Abweichung als Belohnung, optimiert wird.Method for calculating a pose of a vehicle; wherein the pose or change in pose of the vehicle is measured by one or more sensors; wherein the pose or change in pose of the vehicle is calculated using a mechanical model of the vehicle; and wherein a deviation of the calculated pose from the measured pose is determined; characterized in that the model is optimized by unsupervised reinforcement learning, with deviation as a reward. Verfahren nach Anspruch 1; dadurch gekennzeichnet, dass das Verfahren iterativ ausgeführt wird.procedure after claim 1 ; characterized in that the method is carried out iteratively. Verfahren nach einem der vorhergehenden Ansprüche; dadurch gekennzeichnet, dass mindestens ein Wert einer physikalischen Größe des Fahrzeugs gemessen und als Eingabeparameter des mechanischen Modells verwendet wird.Method according to one of the preceding claims; characterized in that at least one value of a physical quantity of the vehicle is measured and used as an input parameter of the mechanical model. Verfahren nach einem der vorhergehenden Ansprüche; dadurch gekennzeichnet, dass mindestens ein Wert einer physikalischen Größe der Fahrzeugumgebung gemessen und als Eingabeparameter des mechanischen Modells versendet wird.Method according to one of the preceding claims; characterized in that at least one value of a physical quantity of the vehicle environment is measured and sent as an input parameter of the mechanical model. Verfahren nach einem der vorhergehenden Ansprüche; dadurch gekennzeichnet, dass eine Detektionswahrscheinlichkeit mindestens eines Sensors berechnet wird.Method according to one of the preceding claims; characterized in that a detection probability of at least one sensor is calculated. Computerprogramm, das ausgebildet ist, eine Rechenvorrichtung zur Ausführung eines Verfahrens nach einem der vorhergehenden Ansprüche zu veranlassen.Computer program designed to cause a computing device to execute a method according to one of the preceding claims. Rechenvorrichtung, die ausgebildet ist, ein Verfahren nach einem der vorhergehenden Verfahrensansprüche auszuführen.Computing device which is designed to carry out a method according to one of the preceding method claims.
DE102021201011.3A 2021-02-04 2021-02-04 Unsupervised optimization of odometry models Pending DE102021201011A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102021201011.3A DE102021201011A1 (en) 2021-02-04 2021-02-04 Unsupervised optimization of odometry models

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102021201011.3A DE102021201011A1 (en) 2021-02-04 2021-02-04 Unsupervised optimization of odometry models

Publications (1)

Publication Number Publication Date
DE102021201011A1 true DE102021201011A1 (en) 2022-08-04

Family

ID=82403101

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102021201011.3A Pending DE102021201011A1 (en) 2021-02-04 2021-02-04 Unsupervised optimization of odometry models

Country Status (1)

Country Link
DE (1) DE102021201011A1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102018002029A1 (en) 2018-03-14 2018-09-20 Daimler Ag Method for determining a prediction for a pose of a vehicle for driver assistance systems
US20190101917A1 (en) 2017-10-04 2019-04-04 Hengshuai Yao Method of selection of an action for an object using a neural network
US20200377121A1 (en) 2019-05-30 2020-12-03 Robert Bosch Gmbh Redundancy information for object interface for highly and fully automated driving

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190101917A1 (en) 2017-10-04 2019-04-04 Hengshuai Yao Method of selection of an action for an object using a neural network
DE102018002029A1 (en) 2018-03-14 2018-09-20 Daimler Ag Method for determining a prediction for a pose of a vehicle for driver assistance systems
US20200377121A1 (en) 2019-05-30 2020-12-03 Robert Bosch Gmbh Redundancy information for object interface for highly and fully automated driving

Similar Documents

Publication Publication Date Title
DE112018006161B4 (en) System and method for controlling a vehicle
DE102019001948A1 (en) Control and machine learning device
DE102016009655A1 (en) Method for operating a vehicle
DE102019209736A1 (en) Procedure for evaluating possible trajectories
WO2019072674A1 (en) Method and device for creating an inverse sensor model and method for detecting obstacles
DE102020200911B3 (en) Method for recognizing objects in the surroundings of a vehicle
EP3775783A1 (en) Method for calibrating a position sensor in a vehicle, computer program, storage means, control device and calibration route
EP3746850B1 (en) Method for ascertaining a time characteristic of a measured variable, prediction system, actuator control system, method for training the actuator control system, training system, computer program and machine-readable storage medium
DE102022108656A1 (en) NEURAL QUANTILE NETWORK
EP2947035A1 (en) Method for determining the load on a working machine and working machine, in particular a crane
DE102021204797A1 (en) Apparatus and method for learning a guideline for off-road vehicles for construction sites
DE102017103385A1 (en) Method for evaluating structure-borne noise on a machine and apparatus for carrying out such a method
DE102021004426A1 (en) Method for training an autonomous driving function
DE102021201011A1 (en) Unsupervised optimization of odometry models
DE102019209463A1 (en) Method for determining the trust value of an object of a class
EP3741518A1 (en) Method and device for automatically influencing an actuator
WO2023131715A1 (en) Estimating a motion state of a vehicle from camera data by means of machine learning
EP3467722A1 (en) Configuration of a motor vehicle driver assisting device using a neural network in ongoing operation
DE102021111114A1 (en) Lane uncertainty modeling and tracking in a vehicle
DE102020203836A1 (en) Method for determining a value of a controller variable
DE102019214008A1 (en) Method and device for localizing a mobile agent in an environment with dynamic objects
DE102018214828B4 (en) Method, device and computer program for predicting a location of a plurality of objects
DE102022212638B3 (en) Device and method for controlling a robot
DE102017123388A1 (en) Position determination by means of ultrasound using an artificial neural network
DE102021200569A1 (en) Apparatus and method for training a Gaussian process state space model

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication