DE102022209634A1

DE102022209634A1 - Verfahren zum Betreiben eines lernenden Systems, Computerprogrammprodukt sowie Fahrzeug

Info

Publication number: DE102022209634A1
Application number: DE102022209634.7A
Authority: DE
Inventors: Daniel Münning; Laura Jasmin Witt
Original assignee: Volkswagen AG
Current assignee: Volkswagen AG
Priority date: 2022-09-14
Filing date: 2022-09-14
Publication date: 2024-03-14

Abstract

Die Erfindung betrifft ein Verfahren (100) zum Betreiben eines lernenden Systems (10) für zumindest eine Fahrzeugfunktion eines Fahrzeuges (1), umfassend: Bestimmen (102) von Vorgabedaten (210) zum Ausführen der Fahrzeugfunktion zumindest teilweise durch ein lernfähiges Kontrollmodul (11) des Systems (10). Ferner betrifft die Erfindung ein Computerprogrammprodukt, sowie ein Fahrzeug (1).

Description

Die Erfindung betrifft ein Verfahren zum Betreiben eines lernenden Systems, ein Computerprogrammprodukt sowie ein Fahrzeug.
Aus dem Stand der Technik sind querführende Fahrerassistenzsysteme bekannt, die auf einem klassischen PID-Regler basieren, der ein Fahrzeug auf Basis von erkannten Fahrspuren in der Fahrspurmitte hält, in dem z. B. eine Sollkrümmung an die Lenkung des Fahrzeuges ausgegeben wird. Dabei wird der Regler i. d. R. werkseitig konfiguriert, so dass situative Einflüsse, z. B. durch eine veränderte Reibung der Lenkung, nicht berücksichtigt werden.
Weiterhin ist es bekannt, für Fahrassistenzsysteme Lernverfahren für neuronale Netze, beispielsweise in Form von Reinforcement Learning, anzuwenden. Beim Reinforcement Learning lernt das Netz durch Interaktionen mit seiner Umwelt, bei denen die einzelnen Aktionen des Netzes bewertet werden. Die Bewertung kann dazu z. B. anhand eines Fahrzeugverhaltens des Fahrzeuges erfolgen. Problematisch hierbei ist es beispielsweise für eine Implementierung in ein Fahrassistenzsystem, die Reaktion des Fahrers einzubeziehen. Verfälscht der Fahrer durch Eingriffe die ausgeführte Aktion im Fahrzeug, kann häufig nicht festgestellt werden, ob die prädizierte Aktion des Netzes oder der Fahrereingriff zu dem Fahrzeugverhalten geführt hat.
Aus der DE 10 2020 106 262 A1 ist es bekannt, von einem autonomen Fahrmodus in einen manuellen Fahrmodus für eine Fahrfunktion umzuschalten. In dem manuellen Fahrmodus werden trotz der Steuerung des Fahrzeuges durch den Nutzer autonom ermittelte Steuerwerte erzeugt und mit Nutzer-Steuerwerten verglichen. Dabei ist eine Automatisierung der Fahrfunktion bei gleichzeitigem Lernen jedoch nicht vorgesehen, wodurch der Nutzer in hohem Maße in den Lernprozess eingebunden wird.
Es ist eine Aufgabe der vorliegenden Erfindung, voranstehende, aus dem Stand der Technik bekannte Nachteile zumindest teilweise zu beheben. Insbesondere ist es eine Aufgabe der vorliegenden Erfindung beim Betreiben eines lernenden Systems zum Ausführen einer Fahrfunktion einen Lernvorgang unter Beibehaltung einer zumindest teilweisen Automatisierung der Fahrfunktion bei möglichst hohem Nutzerkomfort zu ermöglichen.
Die voranstehende Aufgabe wird gelöst durch ein Verfahren mit den Merkmalen des Anspruchs 1, ein Computerprogrammprodukt mit den Merkmalen des Anspruchs 9, sowie ein Fahrzeug mit den Merkmalen des Anspruchs 10. Weitere Merkmale und Details der Erfindung ergeben sich aus den jeweiligen Unteransprüchen, der Beschreibung und den Zeichnungen. Dabei gelten Merkmale und Details, die im Zusammenhang mit dem erfindungsgemäßen Verfahren beschrieben sind, selbstverständlich auch im Zusammenhang mit dem erfindungsgemäßen Computerprogrammprodukt und/oder dem erfindungsgemäßen Fahrzeug und jeweils umgekehrt, so dass bezüglich der Offenbarung zu den einzelnen Erfindungsaspekten stets wechselseitig Bezug genommen wird bzw. werden kann.
Gemäß einem ersten Aspekt der Erfindung ist ein Verfahren zum Betreiben eines lernenden Systems für zumindest eine Fahrzeugfunktion eines Fahrzeuges vorgesehen. Das Verfahren umfasst, insbesondere in Form von Verfahrensschritten:

- Bestimmen von Vorgabedaten zum Ausführen der Fahrzeugfunktion zumindest teilweise durch ein lernfähiges Kontrollmodul des Systems,
- Ansteuern eines Fahrzeugsystems zum Ausführen der Fahrzeugfunktion in Abhängigkeit von den Vorgabedaten, insbesondere durch die Kontrolleinheit,
- Erkennen einer Fahrerreaktion auf das Ansteuern des Fahrzeugsystems, insbesondere durch die Kontrolleinheit,
- Durchführen eines Lernvorgangs zum Aktualisieren des Kontrollmoduls in Abhängigkeit von der Fahrerreaktion, insbesondere durch die Kontrolleinheit.

Bei dem Fahrzeug kann es sich insbesondere um eine Kraftfahrzeug und/oder ein Luftfahrzeug handeln. Vorzugsweise ist das Fahrzeug zum zumindest teilweisen, autonomen Fahren, insbesondere mit einem Automatisierungsgrad Level zwei oder Level drei, ausgebildet. Dazu kann das Kontrollmodul zum zumindest teilweise autonomen Ansteuern des Fahrzeugsystems ausgebildet sein. Unter dem lernenden System kann insbesondere ein System mit einer künstlichen Intelligenz, wie z. B. mit einem künstlichen neuronalen Netzwerk, verstanden werden. Bei dem Fahrzeugsystem kann es sich z. B. um ein Lenksystem, insbesondere in Form eines Steer-by-Wire-Systems, und/oder um ein Bremssystem, insbesondere in Form eines Brake-by-Wire-Systems, handeln. Es ist denkbar, dass das lernende System in das Fahrzeugsystem integriert ist. Somit kann es sich bei der Fahrzeugfunktion insbesondere um eine Lenkfunktion und/oder eine Bremsfunktion des Fahrzeuges handeln.
Zum Bestimmen der Vorgabedaten kann zunächst ein Erfassen von Umgebungsdaten und/oder von Streckendaten erfolgen. Anhand der Umgebungs- und/oder Streckendaten können die Vorgabedaten durch das Kontrollmodul, insbesondere automatisch und/oder autonom, bestimmt werden. Die Vorgabedaten können beispielsweise eine Soll-Fahrzeugreaktion und/oder eine Soll-Position des Fahrzeugsystems umfassen. Insbesondere können die Vorgabedaten Regelungsdaten, insbesondere in Form von Soll-Parametern, zum Regeln des Fahrzeugsystems und/oder der Fahrzeugfunktion umfassen. Beispielsweise können die Vorgabedaten Soll-Daten für eine Krümmung einer Kurvenfahrt, eine Position des Fahrzeuges in einer Fahrspur, eine Geschwindigkeit des Fahrzeuges und/oder dergleichen, umfassen. Das Kontrollmodul kann als Regler für das Fahrzeugsystem und/oder die Fahrzeugfunktion dienen. Dabei können die Vorgabedaten vollständig vom Kontrollmodul berechnet werden. Es ist jedoch ebenso denkbar, dass das Kontrollmodul mit einem zusätzlichen Regelungsmodul zum Regeln des Fahrzeugsystems verbunden ist, um die Vorgabedaten zu erzeugen und/oder beim Ansteuern des Fahrzeugsystems umzusetzen.
Zum Erkennen der Fahrerreaktion kann insbesondere ein Verhalten des Fahrers des Fahrzeuges überwacht werden. Insbesondere können zum Erkennen der Fahrerreaktion Bewegungen und/oder Bedienhandlungen des Fahrers überwacht werden. Beispielsweise kann das Verhalten des Fahrers durch eine Innenraumsensorik des Fahrzeuges und/oder eine Bedienvorrichtung des Fahrzeuges erfasst werden.
Bei dem Lernvorgang kann in Abhängigkeit von der Fahrerreaktion ein Bestrafungs- und/oder Belohnungsvorgang in Hinblick auf das Ansteuern des Fahrzeugsystem ausgeführt werden. Insbesondere erfolgt der Lernvorgang somit ferner in Abhängigkeit von dem Ansteuern des Fahrzeugsystems.
Es ist im Rahmen der Erfindung erkannt worden, dass es vorteilhaft ist, die Fahrerreaktion auf das Ansteuern des Fahrzeugsystems zu erfassen und zum Durchführen des Lernvorgangs zu verarbeiten, um den Lernvorgang auch in einer Kombination aus einem automatisierten Ansteuern und einer manuellen Eingriffsmöglichkeit des Fahrers ausführen zu können. Dadurch können z. B. die von den durch das Kontrollmodul, insbesondere automatisiert, bestimmten Vorgabedaten und eine darauffolgende Fahrerreaktion vorteilhaft für den Lernvorgang genutzt werden. Folglich kann das Fahrzeug in einem zumindest teilweise automatisierten Fahrmodus betrieben werden und das lernende System gleichzeitig verbessert werden. Durch die Berücksichtigung der Fahrerreaktion kann die Fahrerreaktion bei dem Lernvorgang zu dem Ansteuern des Fahrzeugsystems insbesondere differenziert verarbeitet werden. Dies kann beispielsweise ermöglichen, dass der Lernvorgang als bestärkendes Lernen, d. h. insbesondere ein reinforced learning, ausgeführt wird. Insbesondere kann das lernende System somit fahrerspezifisch und/oder fahrzeugspezifisch angelernt und/oder verbessert werden. Beispielsweise kann das System dadurch an eine Fahrweise des Fahrers und/oder einen Verschleiß von Fahrzeugkomponenten des Fahrzeuges und ein dadurch geändertes Fahrverhalten des Fahrzeuges angepasst werden.
Weiterhin kann bei einem erfindungsgemäßen Verfahren vorteilhafterweise vorgesehen sein, dass ein Bewerten der Fahrerreaktion in Hinblick auf eine Korrekturabsicht des Fahrers zur Korrektur des Ansteuerns des Fahrzeugsystems ausgeführt wird, wobei zum Aktualisieren des Kontrollmoduls bei dem Lernvorgang ein Bestrafungsvorgang ausgeführt wird, wenn die Korrekturabsicht erkannt wird. Zum Erkennen der Korrekturabsicht kann die Fahrerreaktion klassifiziert werden. Beim Bewerten der Fahrerreaktion kann die Korrekturabsicht, d. h. insbesondere eine Absicht des Fahrers, das Ansteuern des Fahrzeugsystems zu ändern, überprüft werden. Wenn die Fahrerreaktion einen Lenkeingriff des Fahrers umfasst, kann z. B. beim Bewerten der Fahrerreaktion zwischen der Korrekturabsicht und einem regulären Mitlenken des Fahrers unterschieden werden. Beim Bestrafungsvorgang kann ein Bestrafungsterm zur Änderung von Parametern des Kontrollmoduls festgelegt werden. Wenn der Fahrer beispielsweise stark in die Fahrzeugfunktion eingreift, um dem Ansteuern des Fahrzeugsystems entgegenzuwirken, kann eine negative Bewertung für den Bestrafungsvorgang ausgegeben werden. Wenn der Fahrer nicht oder nur geringfügig in die Fahrzeugfunktion eingreift, um dem Ansteuern des Fahrzeugsystems entgegenzuwirken, kann eine positive Bewertung für den Belohnungsvorgang ausgegeben werden.
Es ist ferner bei einem erfindungsgemäßen Verfahren denkbar, dass zum Bewerten der Fahrerreaktion Umgebungsdaten zum Erfassen einer Fahrzeugumgebung des Fahrzeuges und/oder Streckendaten einer aktuellen Fahrstrecke des Fahrzeuges erfasst und ausgewertet werden. Die Umgebungsdaten können insbesondere durch eine Sensorik, insbesondere in Form einer vorausschauenden Sensorik, des Fahrzeuges aufgezeichnet werden. Beispielsweise können die Umgebungsdaten Bild- und/oder Radardaten, Ultraschalldaten und/oder Schwarmdaten der Fahrzeugumgebung umfassen. Ferner können die Umgebungsdaten Wetter- und/oder Verkehrsdaten umfassen. Die Streckendaten können Navigationsdaten und/oder Beschaffenheitsdaten einer Fahrstrecke des Fahrzeuges umfassen. Durch die Berücksichtigung der Umgebungsdaten kann die Korrekturabsicht mit einer hohen Genauigkeit erkannt werden. Beispielsweise kann eine Fahrsituation des Fahrzeuges anhand der Umgebungsdaten klassifiziert werden, um die Bewertung der Fahrerreaktion anhand der Fahrsituation auszuführen.
Weiterhin kann bei einem erfindungsgemäßen Verfahren vorteilhafterweise vorgesehen sein, dass die Bediendaten, die Umgebungsdaten und/oder die Streckendaten als Historiendaten über eine vorbestimmte Fahrstrecke und/oder eine vorbestimmte Zeitspanne und/oder über eine vorbestimmte Anzahl an Fahrsituationen, insbesondere in Form von Fahrmanövern, aufgezeichnet werden, insbesondere wobei aktuelle Bediendaten zum Bewerten der Fahrerreaktion mit den Historiendaten verglichen werden. Die Historiendaten können somit insbesondere gespeicherte Bediendaten, Fahrzeugdaten und/oder Umgebungsdaten aus der Vergangenheit umfassen. Dabei kann durch den Vergleich eine Abweichung der Fahrerreaktion von den Historiendaten erkannt werden, um die Korrekturabsicht zu erkennen. Insbesondere kann bei dem Vergleich der aktuellen Bediendaten mit den Historiendaten eine Fahrsituation berücksichtigt werden. Dazu kann anhand der Umgebungsdaten und/oder der Streckendaten die Fahrsituation erkannt und mit den jeweils historischen Bediendaten verglichen werden, um frühere Fahrerreaktionen in einer gleichen oder ähnlichen Fahrsituation aus den Historiendaten zu extrahieren. Die extrahierte Fahrerreaktion kann dann mit der aktuellen Fahrerreaktion verglichen werden. Wenn beispielsweise festgestellt wird, dass die Fahrerreaktion, insbesondere unter Berücksichtigung eines vorbestimmten Toleranzbereiches, von der extrahierten Fahrerreaktion abweicht, kann auf die Korrekturabsicht geschlossen werden. Somit kann die Genauigkeit beim Erkennen der Korrekturabsicht durch die Historiendaten verbessert werden.
Im Rahmen der Erfindung ist es weiterhin denkbar, dass das Verfahren umfasst, insbesondere in Form zumindest eines Verfahrensschrittes:

- Bestimmen einer Modifikation der Vorgabedaten für eine Änderung der Vorgabedaten, insbesondere durch die Kontrolleinheit,

Weiterhin kann bei einem erfindungsgemäßen Verfahren vorteilhafterweise vorgesehen sein, dass zum Erkennen der Fahrerreaktion Bediendaten zum Erfassen einer Fahrerinteraktion mit einer Bedienvorrichtung des Fahrzeugsystems ausgewertet werden, wobei anhand der Bediendaten eine Interaktionsstärke des Fahrers bestimmt wird und das Bewerten der Fahrerreaktion in Abhängigkeit von der Interaktionsstärke erfolgt. Bei dem Lernvorgang kann vorgesehen sein, dass eine Bestrafung des Kontrollmoduls zu der Interaktionsstärke korreliert. Weiterhin kann vorgesehen sein, dass die Modifikation beim Bestimmen der Modifikation zu der Interaktionsstärke korreliert. Die Bedienvorrichtung kann beispielsweise ein Lenkmittel und/oder ein Pedal zur Bedienung des Fahrzeugsystems für einen manuellen Eingriff in die Ausführung der Fahrzeugfunktion durch den Fahrer umfassen. Die Fahrerinteraktion kann beispielsweise ein durch den Fahrer aufgebrachtes Lenkmoment am Lenkmittel, einen Griff an einem Lenkmittel, eine Lenkbewegung, eine Pedalbetätigung und/oder eine elektronische Bedienung des Fahrzeuges umfassen. Die Interaktionsstärke kann dabei insbesondere eine Intensität, Geschwindigkeit und/oder Stärke der Fahrerinteraktion umfassen. Die Korrekturabsicht kann anhand der Interaktionsstärke bestimmt werden. Beispielsweise kann ein starker Eingriff des Fahrers in die Ansteuerung des Fahrzeugsystems auf die Korrekturabsicht schließen lassen. Die Korrelation der Bestrafung des Kontrollmoduls und/oder Modifikation und der Interaktionsstärke kann dadurch realisiert werden, dass die Bestrafung des Kontrollmoduls und/oder die Modifikation umso größer ist, je höher oder je niedriger die Interaktionsstärke ist. Insbesondere kann das Rauschen, insbesondere eine Stärke des Rauschens, in Abhängigkeit von der Interaktionsstärke zum Bestimmen der Modifikation und/oder die Bestrafung beim Lernvorgang, z. B. proportional zur Interaktionsstärke, verstärkt oder verringert werden. Zusätzlich oder alternativ ist es denkbar, dass die Fahrerreaktion durch eine Fahrerbeobachtung, z. B. mittels einer Innenraumkamera des Fahrzeuges, erkannt wird.
Im Rahmen der Erfindung ist es weiterhin denkbar, dass die Bedienvorrichtung ein Lenkmittel zum Lenken des Fahrzeuges umfasst, an welchem die Bediendaten zum Bestimmen der Interaktionsstärke kapazitiv und/oder anhand eines Lenkmomentes am Lenkmittel erfasst werden. Zur kapazitiven Erfassung kann das Lenkmittel einen kapazitiven Sensor umfassen. Bei dem Lenkmittel kann es sich beispielsweise um ein Lenkrad oder ein anderes Steuerelement zum Bedienen einer Lenkeinheit des Fahrzeuges handeln. Durch die kapazitive Erfassung kann vorteilhafterweise eine Griffstärke und/oder eine Grifffläche des Fahrers am Lenkmittel erkannt werden. Die Griffstärke kann beispielsweise einen Druck am Lenkmittel umfassen. Die Grifffläche kann z. B. eine Auflagefläche zumindest einer Hand des Fahrers umfassen. Anhand der Griffstärke und/oder der Grifffläche kann auf eine momentane Aufmerksamkeit und/oder ein momentanes Sicherheitsgefühl des Fahrers geschlossen werden. Beispielsweise kann durch eine hohe Griffstärke und/oder eine große Grifffläche auf eine hohe Aufmerksamkeit und/oder ein hohes Sicherheitsbedürfnis in der Fahrsituation geschlossen werden.
Es ist ferner bei einem erfindungsgemäßen Verfahren denkbar, dass das Kontrollmodul ein künstliches, neuronales Netz umfasst, insbesondere bei dem die Umgebungsdaten und/oder die Streckendaten Eingangsdaten und die Vorgabedaten Ausgangsdaten für das Netz bilden, vorzugsweise wobei die Vorgabedaten, die Modifikation und/oder die Fahrerreaktion bei dem Lernvorgang, insbesondere unter Berücksichtigung der Korrekturabsicht, Lerndaten zum Weitertrainieren des Netzes bilden. Das künstliche, neuronale Netz kann mit dem Kontrollmodul in das Fahrzeug und/oder einen externen Server integriert sein. Der Lernvorgang kann insbesondere ein bestärkendes Lernen, d. h. insbesondere ein reinforced learning, des Netzes umfassen. Es kann vorgesehen sein, dass das Bestimmen der Modifikation, das Bewerten der Fahrerreaktion und/oder das Durchführen des Lernvorgangs durch einen Algorithmus und/oder ebenfalls durch ein künstliches, neuronales Netz ausgeführt werden.
Gemäß einem weiteren Aspekt der Erfindung ist ein Computerprogrammprodukt vorgesehen. Das Computerprogrammprodukt umfasst Befehle, die bei einer Ausführung durch eine Kontrolleinheit die Kontrolleinheit veranlassen, ein erfindungsgemäßes Verfahren auszuführen.
Somit bringt ein erfindungsgemäßer Computerprogrammprodukt die gleichen Vorteile mit sich, wie sie bereits ausführlich mit Bezug auf ein erfindungsgemäßen Verfahren beschrieben worden sind. Bei dem Verfahren kann es sich insbesondere um ein computerimplementiertes Verfahren handeln. Das Computerprogrammprodukt kann als computerlesbarer Anweisungscode implementiert sein. Ferner kann das Computerprogrammprodukt auf einem computerlesbaren Speichermedium wie einer Datendisk, einem Wechsellaufwerk, einem flüchtigen oder nichtflüchtigen Speicher, oder einem eingebauten Speicher/Prozessor abgespeichert sein. Ferner kann das Computerprogrammprodukt in einem Netzwerk wie beispielsweise dem Internet bereitstellbar oder bereitgestellt sein, von dem es bei Bedarf von einem Nutzer heruntergeladen oder online ausgeführt werden kann. Das Computerprogrammprodukt kann sowohl mittels einer Software, als auch mittels einer oder mehrerer spezieller elektronischer Schaltungen, d.h. in Hardware oder in beliebig hybrider Form, d.h. mittels Software-Komponenten und Hardware-Komponenten, realisiert sein.
Gemäß einem weiteren Aspekt der Erfindung ist ein Fahrzeug vorgesehen. Das Fahrzeug weist ein lernendes System zum Ausführen einer Fahrzeugfunktion auf. Ferner weist das Fahrzeug eine Kontrolleinheit zum Ausführen eines erfindungsgemäßen Verfahrens auf. Die Kontrolleinheit umfasst ein Kontrollmodul zum zumindest teilweisen Bestimmen von Vorgabedaten zum Ausführen der Fahrzeugfunktion.
Somit bringt ein erfindungsgemäßes Fahrzeug die gleichen Vorteile mit sich, wie sie bereits ausführlich mit Bezug auf ein erfindungsgemäßes Verfahren und/oder ein erfindungsgemäßes Computerprogrammprodukt beschrieben worden sind. Zum Erfassen von der Fahrerreaktion und/oder von Umgebungsdaten kann die Kontrolleinheit ferner ein Erfassungsmodul aufweisen. Die Kontrolleinheit kann einen Prozessor und/oder einen Mikroprozessor umfassen. Ferner kann die Kontrolleinheit zumindest teilweise oder vollständig in ein zentrales Steuergerät des Fahrzeuges integriert sein. Es ist jedoch ebenfalls denkbar, dass die Kontrolleinheit zumindest teilweise oder vollständig in ein oder mehrere dezentrale Steuergeräte integriert ist. Das Erfassungsmodul und/oder das Kontrollmodul können vorzugsweise in eine Kameravorrichtung zum Erfassen von Bilddaten einer Fahrzeugumgebung des Fahrzeuges integriert sein. Die Module der Kontrolleinheit, d.h. insbesondere das Kontrollmodul und/oder das Erfassungsmodul, können separat zueinander ausgeführt sein oder zumindest teilweise miteinander verbunden sein. Es kann beispielsweise vorgesehen sein, dass die Module durch Speicherbereiche, elektronische Schaltungen und/oder, insbesondere programmierte, elektronische Bauelemente der Kontrolleinheit gebildet sind. Weiterhin kann die Kontrolleinheit zum Ausführen des Computerprogrammproduktes ausgebildet sein.
Weitere Vorteile, Merkmale und Einzelheiten der Erfindung ergeben sich aus der nachfolgenden Beschreibung, in der unter Bezugnahme auf die Zeichnungen Ausführungsbeispiele der Erfindung im Einzelnen beschrieben sind. Dabei können die in den Ansprüchen und in der Beschreibung erwähnten Merkmale jeweils einzeln für sich oder in beliebiger Kombination erfindungswesentlich sein. Es zeigen schematisch:

1 ein erfindungsgemäßes Verfahren zum Betreiben eines lernenden Systems,
2 ein Fahrzeug mit dem System, und
3 ein Bewerten einer Fahrerreaktion für einen Lernvorgang des Systems.

In der nachfolgenden Beschreibung zu einigen Ausführungsbeispielen der Erfindung werden für die gleichen technischen Merkmale auch in unterschiedlichen Ausführungsbeispielen die identischen Bezugszeichen verwendet.
1 zeigt ein erfindungsgemäßes Verfahren 100 zum Betreiben eines lernenden Systems 10 für zumindest eine Fahrzeugfunktion eines Fahrzeuges 1. Das Fahrzeug 1 ist in 2 dargestellt und weist das lernende System 10 und eine Kontrolleinheit 13 zum Ausführen des Verfahrens 100 auf. Beispielsweise kann ein Computerprogrammprodukt vorgesehen sein, das Befehle umfasst, die bei einer Ausführung durch die Kontrolleinheit 13 die Kontrolleinheit 13 veranlassen, das Verfahren 100 auszuführen. Weiterhin umfasst das Fahrzeug 1 ein Fahrzeugsystem 20, in welches das System 10 integriert sein kann. Im vorliegenden Ausführungsbeispiel ist das Fahrzeugsystem 20 als Lenksystem zum Ausführen einer Lenkfunktion ausgebildet. Es ist jedoch ebenso denkbar, dass es sich bei dem Fahrzeugsystem 20 beispielsweise um ein Bremssystem oder ein anderes Fahrzeugsystem 20 handelt.
Die Kontrolleinheit 13 weist ein lernfähiges Kontrollmodul 11 auf, durch welches bei dem Verfahren 100 ein Bestimmen 102 von Vorgabedaten 210 zum Ausführen der Fahrzeugfunktion zumindest teilweise oder vollständig durchgeführt wird. Dazu kann das Kontrollmodul 11 ein künstliches, neuronales Netz aufweisen, bei dem die Vorgabedaten 210 Ausgangsdaten des Netzes bilden. Die Vorgabedaten 210 können beispielsweise einen Verlauf eines Soll-Parameters zum Ansteuern 104 der Fahrzeugfunktion über eine Zeit umfassen.
Vorzugsweise erfolgt bei dem Verfahren 100 zunächst ein Erfassen 101 von Umgebungsdaten 201 zum Erfassen einer Fahrzeugumgebung 1.1 des Fahrzeuges 1 und/oder Streckendaten 204 einer aktuellen Fahrstrecke des Fahrzeuges 1, insbesondere durch ein Erfassungsmodul 12 der Kontrolleinheit 13. Dadurch kann beispielsweise eine Fahrspur des Fahrzeuges 1 erkannt werden. Das Bestimmen 102 der Vorgabedaten 210 zum Ausführen der Fahrzeugfunktion erfolgt insbesondere anhand der Umgebungsdaten 201 und/oder der Streckendaten 204. Anhand der Vorgabedaten 210 wird ferner ein, insbesondere automatisches und/oder autonomes, Ansteuern 104 des Fahrzeugsystems 20 zum Ausführen der Fahrzeugfunktion ausgeführt. Die Umgebungsdaten 201 und/oder die Streckendaten 204 bilden dabei insbesondere Eingangsdaten für das Netz und die Vorgabedaten 210 Ausgangsdaten.
Um für das lernende System 10 einen schnellen Lernerfolg zu erzielen, kann vorgesehen sein, dass vor dem Ansteuern 104 des Fahrzeugsystems 20 ein Bestimmen 103 einer Modifikation 211 der Vorgabedaten 210 für eine Änderung der Vorgabedaten 210 ausgeführt wird und das Ansteuern 104 des Fahrzeugsystems 20 in Abhängigkeit von der Modifikation 211 erfolgt. Dadurch kann die Kontrolleinheit 13 um die Vorgabedaten 210 umliegende Werte und/oder Bereiche erkunden, um den Lernerfolg zu erzielen.
Weiterhin umfasst das Verfahren 100, wie in 1 und mit weiteren Details in 3 dargestellt, ein Erkennen 105 einer Fahrerreaktion 200 auf das Ansteuern 104 des Fahrzeugsystems 20. Zum Erkennen 105 der Fahrerreaktion 200 können insbesondere Bediendaten 202 zum Erfassen einer Fahrerinteraktion mit einer Bedienvorrichtung 21 des Fahrzeugsystems 20 ausgewertet werden. Die Bedienvorrichtung 21 umfasst ein Lenkmittel 21.1 des Lenksystems, vorzugsweise zum Betätigen einer Lenkeinheit 22 und/oder in Form eines Lenkrades, zum Lenken des Fahrzeuges 1, an welchem die Bediendaten 202 zum Bestimmen einer Interaktionsstärke 202.1 vorzugsweise kapazitiv erfasst werden. Es ist jedoch ebenso denkbar, dass die Bediendaten 202 anhand eines Lenkmomentes am Lenkmittel 21.1 erfasst werden. Beispielsweise kann die Lenkeinheit 22 durch das Lenkmittel 21.1 zum Lenken des Fahrzeuges 1 gesteuert werden. Dabei kann anhand der Bediendaten 202 der Interaktionsstärke 202.1 des Fahrers bestimmt und die Modifikation 211 beim Bestimmen 103 der Modifikation 211 zu der Interaktionsstärke 202.1 korreliert werden. Durch die kapazitive Erfassung können die Bediendaten 202 vorteilhafterweise zum Erkennen der Interaktionsstärke 202.1 in Form einer Griffstärke und/oder einer Grifffläche des Fahrers am Lenkmittel 21.1 erkannt und ausgewertet werden. Alternativ ist es insbesondere denkbar, dass die Fahrerreaktion 200 durch eine Fahrerbeobachtung, z. B. mittels einer Innenraumkamera des Fahrzeuges 1, erkannt wird. Dadurch kann beispielsweise eine Änderung einer Aufmerksamkeit und/oder eine Nervosität des Fahrers erfasst und beim Bewerten der Fahrerreaktion berücksichtigt werden.
Daraufhin erfolgt vorzugsweise ein Bewerten 106 der Fahrerreaktion 200 in Hinblick auf eine Korrekturabsicht 202.2 des Fahrers zur Korrektur des Ansteuerns 104 des Fahrzeugsystems 20. Ferner können die Vorgabedaten 210, eine anhand der Vorgabedaten 210 und/oder der Modifikation 211 ermittelte Soll-Fahrzeugreaktion 220, die Umgebungsdaten 201 und/oder die Streckendaten 204 zum Bewerten 106 der Fahrerreaktion 200 ausgewertet werden. Die Korrekturabsicht 202.2 kann beispielsweise dadurch erkannt werden, dass die Bediendaten 202, die Umgebungsdaten 201 und/oder die Streckendaten 204 als Historiendaten 203 über eine vorbestimmte Fahrstrecke und/oder eine vorbestimmte Zeitspanne und/oder über eine vorbestimmte Anzahl an Fahrsituationen aufgezeichnet und zum Bewerten 106 der Fahrerreaktion 200 aktuelle Bediendaten 202 mit den Historiendaten 203 verglichen werden. Dadurch kann beispielsweise erkannt werden, ob der Fahrer in der aktuellen Fahrsituation stärker mitlenkt, als in der vorbestimmten Zeitspanne, entlang der vorbestimmten Fahrstrecke und/oder bei den vorbestimmten Fahrsituationen. Bei einer, z. B. hohen, Abweichung, insbesondere von einem Normalverhalten des Fahrers, kann die Fahrerreaktion 200 als Korrekturabsicht 202.2 klassifiziert werden.
Anschließend erfolgt ein Durchführen eines Lernvorgangs 107 zum Aktualisieren des Kontrollmoduls 11 in Abhängigkeit von der Fahrerreaktion 200. Dabei kann zum Aktualisieren des Kontrollmoduls 11 ein Bestrafungsvorgang 107.1 ausgeführt werden, wenn die Korrekturabsicht 202.2 erkannt wird. Die Vorgabedaten 210, die Modifikation 211 und die Fahrerreaktion 200 können unter Berücksichtigung der Korrekturabsicht 202.2 bei dem Lernvorgang 107 Lerndaten zum Weitertrainieren des Netzes bilden. Weiterhin ist es denkbar, dass Parameter des Kontrollmoduls 11, insbesondere in Abhängigkeit von dem Lernvorgang 107, an einen Server 2 gesendet werden, um ein Abbild des Netzes außerhalb des Fahrzeuges 1 bereitzustellen und/oder ein Lernen über mehrere Fahrzeuge 1 zu ermöglichen.
Die voranstehende Erläuterung der Ausführungsformen beschreibt die vorliegende Erfindung ausschließlich im Rahmen von Beispielen. Selbstverständlich können einzelne Merkmale der Ausführungsformen, sofern technisch sinnvoll, frei miteinander kombiniert werden, ohne den Rahmen der vorliegenden Erfindung zu verlassen.
Bezugszeichenliste

1: Fahrzeug
1.1: Fahrzeugumgebung
2: Server
10: System
11: Kontrollmodul
12: Erfassungsmodul
13: Kontrolleinheit
20: Fahrzeugsystem
21: Bedienvorrichtung
21.1: Lenkmittel
22: Lenkeinheit
100: Verfahren
101: Erfassen von 201, 204
102: Bestimmen von 210
103: Bestimmen von 211
104: Ansteuern von 20
105: Erkennen von 200
106: Bewerten von 200
107: Lernvorgang
107.1: Bestrafungsvorgang
200: Fahrerreaktion
201: Umgebungsdaten
202: Bediendaten
202.1: Interaktionsstärke
202.2: Korrekturabsicht
203: Historiendaten
204: Streckendaten
210: Vorgabedaten
211: Modifikation
220: Soll-Fahrzeugreaktion

ZITATE ENTHALTEN IN DER BESCHREIBUNG
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
Zitierte Patentliteratur

DE 102020106262 A1 [0004]

Claims

Verfahren (100) zum Betreiben eines lernenden Systems (10) für zumindest eine Fahrzeugfunktion eines Fahrzeuges (1), umfassend: - Bestimmen (102) von Vorgabedaten (210) zum Ausführen der Fahrzeugfunktion zumindest teilweise durch ein lernfähiges Kontrollmodul (11) des Systems (10), - Ansteuern (104) eines Fahrzeugsystems (20) zum Ausführen der Fahrzeugfunktion in Abhängigkeit von den Vorgabedaten (210), - Erkennen (105) einer Fahrerreaktion (200) auf das Ansteuern (104) des Fahrzeugsystems (20), - Durchführen eines Lernvorgangs (107) zum Aktualisieren des Kontrollmoduls (11) in Abhängigkeit von der Fahrerreaktion (200).
Verfahren (100) nach Anspruch 1, dadurch gekennzeichnet, dass ein Bewerten (106) der Fahrerreaktion (200) in Hinblick auf eine Korrekturabsicht (202.2) des Fahrers zur Korrektur des Ansteuerns (104) des Fahrzeugsystems (20) ausgeführt wird, wobei zum Aktualisieren des Kontrollmoduls (11) bei dem Lernvorgang (107) ein Bestrafungsvorgang (107.1) ausgeführt wird, wenn die Korrekturabsicht (202.2) erkannt wird.
Verfahren (100) nach Anspruch 2, dadurch gekennzeichnet, dass zum Bewerten der Fahrerreaktion (200) Umgebungsdaten (201) zum Erfassen einer Fahrzeugumgebung (1.1) des Fahrzeuges (1) und/oder Streckendaten (204) einer aktuellen Fahrstrecke des Fahrzeuges (1) erfasst und ausgewertet werden.
Verfahren (100) nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Verfahren (100) umfasst: - Bestimmen (103) einer Modifikation (211) der Vorgabedaten (210) für eine Änderung der Vorgabedaten (210), wobei das Ansteuern (104) des Fahrzeugsystems (20) in Abhängigkeit von der Modifikation (211) erfolgt.
Verfahren (100) nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass zum Erkennen der Fahrerreaktion (200) Bediendaten (202) zum Erfassen einer Fahrerinteraktion mit einer Bedienvorrichtung (21) des Fahrzeugsystems (20) ausgewertet werden, wobei anhand der Bediendaten (202) eine Interaktionsstärke (202.1) des Fahrers bestimmt wird und das Bewerten (106) der Fahrerreaktion (200) in Abhängigkeit von der Interaktionsstärke (202.1) erfolgt.
Verfahren (100) nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Bedienvorrichtung (21) ein Lenkmittel (21.1) zum Lenken des Fahrzeuges (1) umfasst, an welchem die Bediendaten (202) zum Bestimmen der Interaktionsstärke (202.1) kapazitiv und/oder anhand eines Lenkmomentes am Lenkmittel (21.1) erfasst werden.
Verfahren (100) nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Bediendaten (202), die Umgebungsdaten (201) und/oder die Streckendaten (204) als Historiendaten (203) über eine vorbestimmte Fahrstrecke und/oder eine vorbestimmte Zeitspanne und/oder über eine vorbestimmte Anzahl an Fahrsituationen aufgezeichnet werden, wobei aktuelle Bediendaten (202) zum Bewerten (106) der Fahrerreaktion (200) mit den Historiendaten (203) verglichen werden.
Verfahren (100) nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Kontrollmodul (11) ein künstliches, neuronales Netz umfasst, bei dem die Umgebungsdaten (201) und/oder die Streckendaten (204) Eingangsdaten und die Vorgabedaten (210) Ausgangsdaten für das Netz bilden, wobei die Vorgabedaten (210), die Modifikation (211) und/oder die Fahrerreaktion (200) bei dem Lernvorgang (107) Lerndaten zum Weitertrainieren des Netzes bilden.
Computerprogrammprodukt, umfassend Befehle, die bei einer Ausführung durch eine Kontrolleinheit (13) die Kontrolleinheit (13) veranlassen, ein Verfahren (100) nach einem der vorhergehenden Ansprüche auszuführen.
Fahrzeug (1) aufweisend ein lernendes System (10) zum Ausführen einer Fahrzeugfunktion und eine Kontrolleinheit (13) zum Ausführen eines Verfahrens (100) nach einem der Ansprüche 1 bis 8 mit einem Kontrollmodul (11) zum zumindest teilweisen Bestimmen (102) von Vorgabedaten (210) zum Ausführen der Fahrzeugfunktion.