-
Die vorliegende Erfindung betrifft ein Verfahren zum Erzeugen zusätzlicher Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus, wobei zusätzliche Trainingsdaten einfach dadurch erzeugt werden, dass bekannte Trainingsdaten basierend auf einer Graphenstruktur geringfügig umgewandelt werden.
-
Maschinenlernalgorithmen erstellen ein Modell basierend auf Beispieldaten bzw. Trainingsdaten, um Vorhersagen oder Entscheidungen zu treffen, ohne explizit dafür programmiert zu sein.
-
Maschinenlernalgorithmen kommen in einer Vielzahl von Anwendungen zum Einsatz, zum Beispiel beim autonomen Fahren und in Fahrassistenzanwendungen. Beim autonomen Fahren und bei Fahrassistenzanwendungen besteht eine Hauptaufgabe darin vorherzusagen, wie wahrscheinlich jede mögliche Fahraufgabe, zum Beispiel das Halten der Spur oder ein Spurwechsel, zu einem bestimmten Zeitpunkt ist. Für ein bestimmtes Fahrzeug erfordert eine solche Vorhersageaufgabe ein probabilistisches Inferenzsystem, das eine Reihe von gemessenen Merkmalen wie etwa die Geschwindigkeit, die relative Position in Bezug auf die Fahrspuren und möglicherweise auch die Fahraufgabe des Fahrzeugs zu früheren Zeitpunkten als Eingabe verwendet. Das System löst dann ein Klassifizierungsproblem und gibt die Wahrscheinlichkeit für jede Fahraufgabe zum aktuellen Zeitpunkt aus. Schließlich kann die Klassifizierungsausgabe als Eingabe für Funktionen des autonomen Fahrens oder Funktionen von Fahrassistenzanwendungen, zum Beispiel eines adaptiven Tempomats, verwendet werden, um den Fahrkomfort zu verbessern und Sicherheitsprobleme zu vermeiden.
-
Normalerweise ist eine große Menge an Trainingsdaten erforderlich, um diese Maschinenlernalgorithmen zu trainieren. Ferner sollte ein solcher Maschinenlernalgorithmus beim autonomen Fahren und bei Fahranwendungen in der Lage sein, mögliche Fahraufgaben sehr genau vorherzusagen, um Sicherheitsprobleme zu vermeiden. Es ist jedoch sehr schwer, alle möglichen Situationen während des Trainings zu erfassen, wobei viel Speicherplatz für die Speicherung von Trainingsdaten, die alle möglichen Situationen repräsentieren, und viele Rechenressourcen für das Trainieren des Maschinenlernalgorithmus basierend auf Trainingsdaten, die alle möglichen Situationen repräsentieren, erforderlich wären. Es besteht daher ein Bedarf an einem verbesserten Verfahren zum Bereitstellen von Trainingsdaten bzw. zusätzlichen Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus.
-
Das Dokument
US 2021/073660 A1 offenbart ein Verfahren zum Trainieren eines Maschinenlernalgorithmus unter Verwendung der Datenanreicherung der Trainingsdaten, wobei auf Trainingsdaten zugegriffen wird, die Dateninstanzen und Klassenetiketten beinhalten, wobei die Klassenetiketten Klassen aus einer Menge von Klassen darstellen und wobei der Maschinenlernalgorithmus unter Verwendung der Trainingsdaten trainiert wird, wobei das Trainieren beinhaltet: Anreichern der Trainingsdaten, indem eine Variable aus einem pseudozufälligen oder deterministischen Prozess erhalten wird, Ableiten einer neuen Dateninstanz der Trainingsdaten, indem die Dateninstanz in Abhängigkeit von der Variablen modifiziert wird, um die neue Dateninstanz zu erhalten, Bestimmen eines Vorhersagezieletiketts für die neue Dateninstanz unter Verwendung einer bedingt invertierbaren Funktion, die als Eingabe ein Klassenetikett der Dateninstanz und die Variable hat, und Verwenden der neuen Dateninstanz und des Vorhersagezieletiketts beim Trainieren des Maschinenlernmodells.
-
Es ist eine Aufgabe der vorliegenden Erfindung, ein verbessertes Verfahren zum Bereitstellen von Trainingsdaten bzw. zusätzlichen Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus bereitzustellen.
-
Diese Aufgabe wird durch das Verfahren zum Erzeugen zusätzlicher Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus gemäß Anspruch 1 gelöst.
-
Diese Aufgabe wird ferner durch das System zum Erzeugen zusätzlicher Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus gemäß Anspruch 11 gelöst.
-
Gemäß einer Ausführungsform der Erfindung wird diese Aufgabe durch ein Verfahren zum Erzeugen zusätzlicher Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus gelöst, wobei Trainingsdaten zum Trainieren des Maschinenlernalgorithmus bereitgestellt werden, wobei die Trainingsdaten gekennzeichnete Sensordaten von wenigstens einem Sensor enthalten, wobei die Trainingsdaten in eine Graphenstruktur umgewandelt werden, wobei die Knoten in der Graphenstruktur Objekte darstellen, die in den entsprechenden Sensordaten repräsentiert sind, und wobei ein Startknoten der Graphenstruktur die Position des wenigstens einen Sensors in Bezug auf die in den entsprechenden Sensordaten repräsentierten Objekte darstellt und wobei zusätzliche Trainingsdaten zum Trainieren des Maschinenlernmodells erzeugt werden, indem die Graphenstruktur modifiziert wird.
-
Ein Sensor ist hier eine Vorrichtung, ein Modul, eine Maschine oder ein Subsystem, die/das Ereignisse oder Veränderungen in ihrer/seiner Umgebung erkennt und die Informationen an andere elektronische Vorrichtungen, häufig an einen Computerprozessor, sendet. Ferner handelt es sich bei gekennzeichneten Sensordaten um Daten, die von einem Sensor erfasst wurden und denen ein oder mehrere aussagekräftige und informative Etiketten hinzugefügt wurden, um Kontext bereitzustellen, so dass ein Maschinenlernalgorithmus daraus lernen kann.
-
Ferner besteht eine Graphenstruktur aus einer endlichen Menge von Knoten bzw. Scheitelpunkten oder Punkten, zusammen mit einer Menge von Paaren dieser Knoten. Ein Startknoten ist ferner ein Knoten, basierend auf bzw. ausgehend von dem die Graphenstruktur aufgebaut ist.
-
Dass Objekte in den Sensordaten repräsentiert sind bedeutet ferner, dass die Objekte in den entsprechenden Sensordaten erkannt werden können.
-
So können sinnvolle Szenarien, die in den Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus enthalten sein sollten, zum Beispiel sinnvolle Szenarien, die in den Trainingsdaten enthalten sein sollten, um Sicherheitsprobleme zu vermeiden, basierend auf bekannten Trainingsdaten mit Hilfe von Datenanreicherungstechniken erzeugt werden, d.h. Techniken, die verwendet werden, um die Datenmenge zu vergrößern, indem leicht modifizierte Kopien bereits vorhandener Daten hinzugefügt werden. Daher kann ein kleinerer Satz von Trainingsdaten verwendet und der erforderliche Speicherplatz eingespart werden, wobei die erforderlichen zusätzlichen Trainingsdaten erzeugt werden können, indem bekannte Trainingsdaten geringfügig modifiziert werden.
-
Ferner können durch die Verwendung einer Graphenstruktur zum Erzeugen der zusätzlichen Trainingsdaten basierend auf einfachen Operationen die Trainingsdaten quantifiziert und vereinfacht bzw. die zusätzlichen Trainingsdaten erzeugt werden, ohne dass ressourcenintensive Anpassungen erforderlich wären.
-
Daher wird ein verbessertes Verfahren zum Bereitstellen von Trainingsdaten bzw. zusätzlichen Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus bereitgestellt.
-
Der Schritt des Bereitstellens von Trainingsdaten zum Trainieren des Maschinenlernalgorithmus von wenigstens einem Sensor kann umfassen, Sensordaten durch den wenigstens einen Sensor zu erfassen und die erfassten Sensordaten basierend auf Merkmalen bzw. Eigenschaften der in den erfassten Sensordaten repräsentierten Objekte zu kennzeichnen, um die Trainingsdaten zum Trainieren des Maschinenlernalgorithmus zu erzeugen.
-
Dass die erfassten Sensordaten gekennzeichnet sind bedeutet, dass den Sensordaten ein oder mehrere aussagekräftige und informative Etiketten hinzugefügt wurden, um Kontext bereitzustellen, so dass der Maschinenlernalgorithmus daraus lernen kann.
-
So kann das Verfahren zum Erzeugen zusätzlicher Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus auch andere Merkmale berücksichtigen als die Datenverarbeitungsausrüstung, auf der das Verfahren ausgeführt wird, bzw. wird die Erzeugung der zusätzlichen Trainingsdaten anhand von anderen Merkmalen bestimmt als der Datenverarbeitungsausrüstung, auf der das Verfahren ausgeführt wird.
-
In einer Ausführungsform umfasst der Schritt des Erzeugens zusätzlicher Trainingsdaten zum Trainieren des Maschinenlernalgorithmus durch Modifizieren der Graphenstruktur, wenigstens einen Knoten der Graphenstruktur zu verwerfen.
-
Dass wenigstens ein Knoten aus der Graphenstruktur verworfen wird bedeutet, dass wenigstens ein Knoten vollständig aus der Graphenstruktur entfernt wird, wobei der wenigstens eine Knoten vorzugsweise ein Objektknoten bzw. ein Knoten, der ein Objekt repräsentiert, und nicht der Startknoten ist.
-
Indem wenigstens ein Knoten aus der Graphenstruktur verworfen wird, können auf einfache Weise Szenarien geschaffen werden, die das Fehlen von Informationen bzw. Informationen über Objekte, zum Beispiel nicht erkannte Fahrzeuge, simulieren. Dabei können sinnvolle Szenarien, die in den Trainingsdaten enthalten sein sollten, um zum Beispiel Sicherheitsprobleme zu vermeiden, basierend auf bekannten Trainingsdaten erzeugt und in das Training des Maschinenlernalgorithmus einbezogen werden.
-
Der Schritt des Erzeugens zusätzlicher Trainingsdaten zum Trainieren des Maschinenlernalgorithmus durch Modifizieren der Graphenstruktur kann ferner umfassen, eine Störung in wenigstens einen Knoten der Graphenstruktur einzufügen.
-
Dass eine Störung in wenigstens einen Knoten der Graphenstruktur eingefügt wird bedeutet, dass wenigstens ein Merkmal wenigstens eines Objekts, zum Beispiel die Position des wenigstens einen Objekts, und damit auch die Position des Knotens, der das wenigstens eine Objekt repräsentiert, geringfügig verändert wird, wobei der wenigstens eine Knoten vorzugsweise ein Objektknoten und nicht der Startknoten ist.
-
Indem eine Störung in wenigstens einen Knoten der Graphenstruktur eingefügt wird, lassen sich auf einfache Weise Szenarien erstellen, die Situationen simulieren, in denen Rauschen in den erfassten Sensordaten enthalten ist, was zu einer Unsicherheit beim Erzeugen von Ausgaben basierend auf den erfassten Sensordaten durch den Maschinenlernalgorithmus führt. Dabei können sinnvolle Szenarien, die in den Trainingsdaten enthalten sein sollten, um z.B. Sicherheitsprobleme zu vermeiden, basierend auf bekannten Trainingsdaten erzeugt und in das Training des Maschinenlernalgorithmus einbezogen werden.
-
Der Schritt des Erzeugens zusätzlicher Trainingsdaten zum Trainieren des Maschinenlernalgorithmus durch Modifizieren der Graphenstruktur kann auch umfassen, wenigstens einen Teil der Graphenstruktur zu spiegeln.
-
Dass wenigstens ein Teil der Graphenstrukturmittel gespiegelt wird bedeutet, dass die Position von wenigstens zwei Objekten in einer Dimension und damit auch die Position der Knoten, die diese Objekte in einer Dimension repräsentieren, vertauscht bzw. gespiegelt wird, wobei diese Knoten vorzugsweise Objektknoten sind und nicht den Startknoten einschließen. Wenn der Maschinenlernalgorithmus zum Beispiel für die Erkennung von Fahraufgaben trainiert wird, können die Fahrspuren einer Straße und damit auch die Positionen der Fahrzeuge, die jeweils auf diesen Fahrspuren fahren, vertauscht bzw. gespiegelt werden.
-
Indem wenigstens ein Teil der Graphenstruktur gespiegelt wird können auf einfache Weise Szenarien geschaffen werden, die ein datenähnliches, aber gespiegeltes Verhalten simulieren, was zu einer Unsicherheit beim Erzeugen von Ausgaben basierend auf den erfassten Sensordaten durch den Maschinenlernalgorithmus führt. Dabei können sinnvolle Szenarien, die in den Trainingsdaten enthalten sein sollten, um zum Beispiel Sicherheitsprobleme zu vermeiden, basierend auf bekannten Trainingsdaten erzeugt und in das Training des Maschinenlernalgorithmus einbezogen werden.
-
Der Schritt des Erzeugens zusätzlicher Trainingsdaten zum Trainieren des Maschinenlernalgorithmus durch Modifizieren der Graphenstruktur kann auch umfassen, wenigstens ein Merkmal wenigstens eines Objekts, das in den entsprechenden erfassten Sensordaten repräsentiert ist, zu maskieren.
-
Dass wenigstens eine Merkmal wenigstens eines in den entsprechenden erfassten Sensordaten repräsentieren Objekts maskiert wird bedeutet, dass wenigstens ein Merkmal wenigstens eines in den entsprechenden erfassten Sensordaten repräsentierten Objekts auf Null gesetzt bzw. ausgelöscht wird.
-
Indem wenigstens ein Merkmal wenigstens eines in den entsprechenden erfassten Sensordaten repräsentierten Objekts maskiert wird, können auf einfache Weise Szenarien geschaffen werden, die Situationen simulieren, in denen einige Informationen in den erfassten Daten nicht verfügbar bzw. nicht vorhanden sind bzw. zum Zeitpunkt der Erfassung der Daten nicht verfügbar waren. Dabei können sinnvolle Szenarien, die in den Trainingsdaten enthalten sein sollten, um zum Beispiel Sicherheitsprobleme zu vermeiden, basierend auf bekannten Trainingsdaten erzeugt und in das Training des Maschinenlernalgorithmus einbezogen werden.
-
Der Schritt des Erzeugens zusätzlicher Trainingsdaten zum Trainieren des Maschinenlernalgorithmus durch Modifizieren der Graphenstruktur kann auch umfassen, wenigstens einen Knoten in der Graphenstruktur zu duplizieren.
-
Dass wenigstens ein Knoten in der Graphenstruktur dupliziert wird bedeutet, dass der wenigstens eine Knoten in der Graphenstruktur zweimal vorkommt, wobei der wenigstens eine Knoten vorzugsweise ein Objektknoten und nicht der Startknoten ist.
-
Indem der wenigstes eine Knoten in der Graphenstruktur dupliziert wird, lassen sich auf einfache Weise Szenarien erstellen, die Situationen simulieren, in denen das System davon ausgeht, dass es zwei Objekte gibt, obwohl nur ein Objekt vorhanden ist. Dabei können sinnvolle Szenarien, die in den Trainingsdaten enthalten sein sollten, um zum Beispiel Sicherheitsprobleme zu vermeiden, basierend auf bekannten Trainingsdaten erzeugt und in das Training des Maschinenlernalgorithmus einbezogen werden.
-
Weiterhin kann der Schritt des Erzeugens zusätzlicher Trainingsdaten zum Trainieren des Maschinenlernalgorithmus durch Modifizieren der Graphenstruktur auch umfassen, den Startknoten der Graphenstruktur zu verschieben.
-
Dass der Startknoten der Graphenstruktur verschoben wird bedeutet, dass ein Abstand zwischen dem Startknoten und den anderen Knoten der Graphenstruktur entsprechend angepasst wird.
-
Indem der Startknoten verschoben wird, können auf einfache Weise Szenarien geschaffen werden, die Situationen simulieren, in denen das Ego-Objekt bzw. das Objekt, auf dem der wenigstens eine Sensor angeordnet ist, einen Einfluss auf andere Objekte hat. Dabei können sinnvolle Szenarien, die in den Trainingsdaten enthalten sein sollten, um zum Beispiel Sicherheitsprobleme zu vermeiden, basierend auf bekannten Trainingsdaten erzeugt und in das Training des Maschinenlernalgorithmus einbezogen werden.
-
Gemäß einer weiteren Ausführungsform der Erfindung wird ein Verfahren zum Trainieren eines Maschinenlernalgorithmus bereitgestellt, wobei das Verfahren umfasst: Bereitstellen von Trainingsdaten zum Trainieren des Maschinenlernalgorithmus, Erzeugen zusätzlicher Trainingsdaten zum Trainieren des Maschinenlernalgorithmus durch ein Verfahren zum Erzeugen zusätzlicher Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus wie oben beschrieben und Trainieren des Maschinenlernalgorithmus basierend auf den Trainingsdaten und den zusätzlichen Trainingsdaten.
-
So wird ein Verfahren zum Trainieren eines Maschinenlernalgorithmus basierend auf zusätzlichen Trainingsdaten, die durch ein verbessertes Verfahren zum Bereitstellen zusätzlicher Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus erzeugt werden, bereitgestellt. Dabei können sinnvolle Szenarien, die in den Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus enthalten sein sollten, zum Beispiel sinnvolle Szenarien, die in den Trainingsdaten enthalten sein sollten, um Sicherheitsprobleme zu vermeiden, basierend auf bekannten Trainingsdaten mit Hilfe von Datenanreicherungstechniken erzeugt werden, d.h. Techniken, die verwendet werden, um die Datenmenge zu vergrößern, indem leicht modifizierte Kopien bereits vorhandener Daten hinzugefügt werden. Daher kann ein kleinerer Satz von Trainingsdaten verwendet und der erforderliche Speicherplatz eingespart werden, wobei die erforderlichen zusätzlichen Trainingsdaten erzeugt werden können, indem bekannte Trainingsdaten geringfügig modifiziert werden. Ferner können durch die Verwendung einer Graphenstruktur zum Erzeugen der zusätzlichen Trainingsdaten basierend auf einfachen Operationen die Trainingsdaten quantifiziert und vereinfacht bzw. die zusätzlichen Trainingsdaten erzeugt werden, ohne dass ressourcenintensive Anpassungen erforderlich wären.
-
Gemäß noch einer weiteren Ausführungsform der Erfindung wird ein Verfahren zum Steuern einer steuerbaren Funktion eines Fahrzeugs basierend auf einem Maschinenlernalgorithmus bereitgestellt, wobei das Verfahren umfasst, einen Maschinenlernalgorithmus zum Steuern der steuerbaren Funktion bereitzustellen, wobei der Maschinenlernalgorithmus durch ein Verfahren zum Trainieren eines Maschinenlernalgorithmus wie oben beschrieben trainiert wird, und die steuerbare Funktion basierend auf dem trainierten Maschinenlernalgorithmus zu steuern.
-
Eine steuerbare Funktion eines Fahrzeugs ist hier eine Funktion eines Fahrzeugs, deren Ausgabe gesteuert werden kann oder die so gesteuert werden kann, dass ein Zustand eines Teils oder Systems in endlicher Zeit von einem beliebigen Zustand in einen anderen Zustand übergehen kann, oder die eine Steuerbarkeit im Verhaltenssystem des Fahrzeugs ermöglicht.
-
So wird ein Verfahren zum Steuern einer steuerbaren Funktion eines Fahrzeugs basierend auf einem Maschinenlernalgorithmus, der basierend auf zusätzlichen Trainingsdaten trainiert wird, die durch ein verbessertes Verfahren zum Bereitstellen zusätzlicher Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus erzeugt werden, bereitgestellt. Dabei können sinnvolle Szenarien, die in den Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus enthalten sein sollten, zum Beispiel sinnvolle Szenarien, die in den Trainingsdaten enthalten sein sollten, um Sicherheitsprobleme zu vermeiden, basierend auf bekannten Trainingsdaten mit Hilfe von Datenanreicherungstechniken erzeugt werden, d.h. Techniken, die verwendet werden, um die Datenmenge zu vergrößern, indem leicht modifizierte Kopien bereits vorhandener Daten hinzugefügt werden. Daher kann ein kleinerer Satz von Trainingsdaten verwendet und der erforderliche Speicherplatz eingespart werden, wobei die erforderlichen zusätzlichen Trainingsdaten erzeugt werden können, indem bekannte Trainingsdaten geringfügig modifiziert werden. Ferner können durch die Verwendung einer Graphenstruktur zum Erzeugen der zusätzlichen Trainingsdaten basierend auf einfachen Operationen die Trainingsdaten quantifiziert und vereinfacht bzw. die zusätzlichen Trainingsdaten erzeugt werden, ohne dass ressourcenintensive Anpassungen erforderlich wären. Ferner kann durch Steuern einer steuerbaren Funktion eines Fahrzeugs basierend auf einem entsprechend trainierten Maschinenlernalgorithmus der Fahrkomfort beim Fahren des Fahrzeugs erhöht werden.
-
Dabei kann die steuerbare Funktion zum Beispiel ein adaptiver Tempomat eines autonom fahrenden Fahrzeugs sein.
-
Gemäß noch einer weiteren Ausführungsform der Erfindung wird ein System zum Erzeugen zusätzlicher Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus bereitgestellt, wobei das System dafür ausgelegt, ein Verfahren zum Erzeugen zusätzlicher Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus wie oben beschrieben auszuführen.
-
Daher wird ein verbessertes System zum Bereitstellen von zusätzlichen Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus bereitgestellt. Dabei können sinnvolle Szenarien, die in den Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus enthalten sein sollten, zum Beispiel sinnvolle Szenarien, die in den Trainingsdaten enthalten sein sollten, um Sicherheitsprobleme zu vermeiden, basierend auf bekannten Trainingsdaten mit Hilfe von Datenanreicherungstechniken erzeugt werden, d.h. Techniken, die verwendet werden, um die Datenmenge zu vergrößern, indem leicht modifizierte Kopien bereits vorhandener Daten hinzugefügt werden. Daher kann ein kleinerer Satz von Trainingsdaten verwendet und der erforderliche Speicherplatz eingespart werden, wobei die erforderlichen zusätzlichen Trainingsdaten erzeugt werden können, indem bekannte Trainingsdaten geringfügig modifiziert werden. Ferner können durch die Verwendung einer Graphenstruktur zum Erzeugen der zusätzlichen Trainingsdaten basierend auf einfachen Operationen die Trainingsdaten quantifiziert und vereinfacht bzw. die zusätzlichen Trainingsdaten erzeugt werden, ohne dass ressourcenintensive Anpassungen erforderlich wären. Ferner kann durch Steuern einer steuerbaren Funktion eines Fahrzeugs basierend auf einem entsprechend trainierten Maschinenlernalgorithmus der Fahrkomfort beim Fahren des Fahrzeugs erhöht werden.
-
Gemäß noch einer weiteren Ausführungsform der Erfindung wird ein System zum Trainieren eines Maschinenlernalgorithmus bereitgestellt, wobei das System umfasst: eine Bereitstellungseinheit, wobei die Bereitstellungseinheit dafür ausgelegt ist, Trainingsdaten zum Trainieren des Maschinenlernalgorithmus bereitzustellen, ein System zum Trainieren zusätzlicher Trainingsdaten zum Trainieren des Maschinenlernalgorithmus wie oben beschrieben, wobei das System zum Trainieren zusätzlicher Trainingsdaten dafür ausgelegt ist, zusätzliche Trainingsdaten zum Trainieren des Maschinenlernalgorithmus basierend auf den Trainingsdaten zu erzeugen, und eine Trainingseinheit, wobei die Trainingseinheit dafür ausgelegt ist, den Maschinenlernalgorithmus basierend auf den Trainingsdaten und den zusätzlichen Trainingsdaten zu trainieren.
-
So wird ein System zum Trainieren eines Maschinenlernalgorithmus basierend auf zusätzlichen Trainingsdaten, die durch ein verbessertes System zum Bereitstellen zusätzlicher Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus erzeugt werden, bereitgestellt. Dabei können sinnvolle Szenarien, die in den Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus enthalten sein sollten, zum Beispiel sinnvolle Szenarien, die in den Trainingsdaten enthalten sein sollten, um Sicherheitsprobleme zu vermeiden, basierend auf bekannten Trainingsdaten mit Hilfe von Datenanreicherungstechniken erzeugt werden, d.h. Techniken, die verwendet werden, um die Datenmenge zu vergrößern, indem leicht modifizierte Kopien bereits vorhandener Daten hinzugefügt werden. Daher kann ein kleinerer Satz von Trainingsdaten verwendet und der erforderliche Speicherplatz eingespart werden, wobei die erforderlichen zusätzlichen Trainingsdaten erzeugt werden können, indem bekannte Trainingsdaten geringfügig modifiziert werden. Ferner können durch die Verwendung einer Graphenstruktur zum Erzeugen der zusätzlichen Trainingsdaten basierend auf einfachen Operationen die Trainingsdaten quantifiziert und vereinfacht bzw. die zusätzlichen Trainingsdaten erzeugt werden, ohne dass ressourcenintensive Anpassungen erforderlich wären.
-
Gemäß noch einer weiteren Ausführungsform der Erfindung wird eine Steuereinheit zum Steuern einer steuerbaren Funktion eines Fahrzeugs basierend auf einem Maschinenlernalgorithmus bereitgestellt, wobei die Steuereinheit umfasst: eine Bereitstellungseinheit, wobei die Bereitstellungseinheit dafür ausgelegt ist, einen Maschinenlernalgorithmus zum Steuern der steuerbaren Funktion bereitzustellen, wobei der Maschinenlernalgorithmus durch ein System zum Trainieren eines Maschinenlernalgorithmus wie oben beschrieben trainiert wird, und eine Steuereinheit, wobei die Steuereinheit dafür ausgelegt ist, die steuerbare Funktion basierend auf dem trainierten Maschinenlernalgorithmus zu steuern.
-
So wird eine Steuereinheit zum Steuern einer steuerbaren Funktion eines Fahrzeugs basierend auf einem Maschinenlernalgorithmus, der basierend auf zusätzlichen Trainingsdaten trainiert wird, die durch ein verbessertes System zum Bereitstellen zusätzlicher Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus erzeugt werden, bereitgestellt. Dabei können sinnvolle Szenarien, die in den Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus enthalten sein sollten, zum Beispiel sinnvolle Szenarien, die in den Trainingsdaten enthalten sein sollten, um Sicherheitsprobleme zu vermeiden, basierend auf bekannten Trainingsdaten mit Hilfe von Datenanreicherungstechniken erzeugt werden, d.h. Techniken, die verwendet werden, um die Datenmenge zu vergrößern, indem leicht modifizierte Kopien bereits vorhandener Daten hinzugefügt werden. Daher kann ein kleinerer Satz von Trainingsdaten verwendet und der erforderliche Speicherplatz eingespart werden, wobei die erforderlichen zusätzlichen Trainingsdaten erzeugt werden können, indem bekannte Trainingsdaten geringfügig modifiziert werden. Ferner können durch die Verwendung einer Graphenstruktur zum Erzeugen der zusätzlichen Trainingsdaten basierend auf einfachen Operationen die Trainingsdaten quantifiziert und vereinfacht bzw. die zusätzlichen Trainingsdaten erzeugt werden, ohne dass ressourcenintensive Anpassungen erforderlich wären. Ferner kann durch Steuern einer steuerbaren Funktion eines Fahrzeugs basierend auf einem entsprechend trainierten Maschinenlernalgorithmus der Fahrkomfort beim Fahren des Fahrzeugs erhöht werden.
-
Dabei kann die steuerbare Funktion auch hier zum Beispiel ein adaptiver Tempomat eines autonom fahrenden Fahrzeugs sein.
-
Gemäß einer weiteren Ausführungsform der Erfindung wird ein Computerprogramm bereitgestellt, das Anweisungen umfasst, die, wenn das Programm von einem Computer ausgeführt wird, den Computer veranlassen, ein Verfahren zum Erzeugen zusätzlicher Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus wie oben beschrieben auszuführen.
-
Gemäß noch einer weiteren Ausführungsform der Erfindung wird ein computerlesbares Medium bereitgestellt, auf dem ein Computerprogramm wie oben beschrieben gespeichert ist.
-
Dabei haben das Computerprogramm bzw. das computerlesbare Medium den Vorteil, dass sie dafür ausgelegt sind, ein verbessertes Verfahren zum Bereitstellen zusätzlicher Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus auszuführen. Dabei können sinnvolle Szenarien, die in den Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus enthalten sein sollten, zum Beispiel sinnvolle Szenarien, die in den Trainingsdaten enthalten sein sollten, um Sicherheitsprobleme zu vermeiden, basierend auf bekannten Trainingsdaten mit Hilfe von Datenanreicherungstechniken erzeugt werden, d.h. Techniken, die verwendet werden, um die Datenmenge zu vergrößern, indem leicht modifizierte Kopien bereits vorhandener Daten hinzugefügt werden. Daher kann ein kleinerer Satz von Trainingsdaten verwendet und der erforderliche Speicherplatz eingespart werden, wobei die erforderlichen zusätzlichen Trainingsdaten erzeugt werden können, indem bekannte Trainingsdaten geringfügig modifiziert werden. Ferner können durch die Verwendung einer Graphenstruktur zum Erzeugen der zusätzlichen Trainingsdaten basierend auf einfachen Operationen die Trainingsdaten quantifiziert und vereinfacht bzw. die zusätzlichen Trainingsdaten erzeugt werden, ohne dass ressourcenintensive Anpassungen erforderlich wären. Ferner kann durch Steuern einer steuerbaren Funktion eines Fahrzeugs basierend auf einem entsprechend trainierten Maschinenlernalgorithmus der Fahrkomfort beim Fahren des Fahrzeugs erhöht werden.
-
Die Erfindung wird nun ausführlicher unter Bezugnahme auf die beigefügten Zeichnungen beschrieben.
- 1 veranschaulicht ein Verfahren zum Erzeugen zusätzlicher Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus gemäß Ausführungsformen der vorliegenden Erfindung;
- 2a-d veranschaulichen Ausführungsformen des Schritts des Erzeugens zusätzlicher Trainingsdaten zum Trainieren des Maschinenlernmodells, indem die Graphenstruktur modifiziert wird;
- 3 veranschaulicht ein System zum Erzeugen zusätzlicher Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus.
-
1 veranschaulicht ein Verfahren zum Erzeugen zusätzlicher Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus 1 gemäß Ausführungsformen der vorliegenden Erfindung.
-
Maschinenlernalgorithmen, zum Beispiel neuronale Netze, die anhand von großen Datenmengen trainiert werden, haben sich bei vielen Aufgaben als überlegen erwiesen. Zu diesen Aufgaben gehört auch die Erkennung von Fahraufgaben. Zu diesem Zweck muss man einen mühsamen Prozess der Datenerfassung und -kommentierung durchführen. Eine Technik, die dies mildert, ist die Datenanreicherung, die zur Anreicherung des Trainingsdatensatzes verwendet wird, indem Datenabtastungen so umgewandelt werden, dass die umgewandelten Abtastungen gültige Abtastungen imitieren, die im ursprünglichen Datensatz nicht vorhanden waren.
-
1 veranschaulicht ein Verfahren 1, wobei Trainingsdaten zum Trainieren des Maschinenlernalgorithmus in einem ersten Schritt 2 bereitgestellt werden, wobei die Trainingsdaten gekennzeichnete Sensordaten von wenigstens einem Sensor enthalten, wobei die Trainingsdaten in einem Schritt 3 in eine Graphenstruktur umgewandelt werden, wobei die Knoten in der Graphenstruktur Objekte darstellen, die in den entsprechenden Sensordaten repräsentiert sind, und wobei ein Startknoten der Graphenstruktur die Position des wenigstens einen Sensors in Bezug auf die in den entsprechenden Sensordaten repräsentierten Objekte darstellt und wobei zusätzliche Trainingsdaten zum Trainieren des Maschinenlernmodells in einem Schritt 4 erzeugt werden, indem die Graphenstruktur modifiziert wird.
-
Dabei können sinnvolle Szenarien, die in den Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus enthalten sein sollten, zum Beispiel sinnvolle Szenarien, die in den Trainingsdaten enthalten sein sollten, um Sicherheitsprobleme zu vermeiden, basierend auf bekannten Trainingsdaten mit Hilfe von Datenanreicherungstechniken erzeugt werden, d.h. Techniken, die verwendet werden, um die Datenmenge zu vergrößern, indem leicht modifizierte Kopien bereits vorhandener Daten hinzugefügt werden. Daher kann ein kleinerer Satz von Trainingsdaten verwendet und der erforderliche Speicherplatz eingespart werden, wobei die erforderlichen zusätzlichen Trainingsdaten erzeugt werden können, indem bekannte Trainingsdaten geringfügig modifiziert werden.
-
Ferner können durch die Verwendung einer Graphenstruktur zum Erzeugen der zusätzlichen Trainingsdaten basierend auf einfachen Operationen die Trainingsdaten quantifiziert und vereinfacht bzw. die zusätzlichen Trainingsdaten erzeugt werden, ohne dass ressourcenintensive Anpassungen erforderlich wären.
-
Daher wird ein verbessertes Verfahren 1 zum Bereitstellen von Trainingsdaten bzw. zusätzlichen Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus bereitgestellt.
-
1 veranschaulicht insbesondere ein Verfahren 1, das den Trainingsdatensatz anreichert und neue Szenen abdeckt sowie die Generalisierung verbessert und die Verzerrung des Maschinenlernalgorithmus reduziert.
-
Der Maschinenlernalgorithmus kann zum Beispiel ein neuronales Netz sein, zum Beispiel ein neuronales Netz, das für die Erkennung von Fahraufgaben basierend auf entsprechenden gekennzeichneten Daten trainiert wurde, wobei das Trainieren des neuronalen Netzes umfassen kann, die Gewichte des neuronalen Netzes zu optimieren.
-
Wie in 1 dargestellt, umfasst der Schritt 2 des Bereitstellens von Trainingsdaten zum Trainieren des Maschinenlernalgorithmus von wenigstens einem Sensor einen Schritt 5 des Erfassens von Sensordaten durch den wenigstens einen Sensor und einen Schritt 6 des Kennzeichnens der erfassten Sensordaten basierend auf Merkmalen der in den erfassten Sensordaten repräsentierten Objekte, um die Trainingsdaten zum Trainieren des Maschinenlernalgorithmus zu erzeugen.
-
Dabei kann der wenigstens eine Sensor an einem Fahrzeug angebracht sein, und die entsprechenden Daten können bei Testfahrten mit dem Fahrzeug erfasst werden. Insbesondere können reale Daten von einem echten Fahrzeug aufgezeichnet und anschließend kommentiert bzw. gekennzeichnet werden.
-
Ferner kann der wenigstens eine Sensor dafür ausgelegt sein, Daten über eine bestimmte Zeitspanne aufzuzeichnen, wobei der wenigstens eine Sensor zum Beispiel ein Videosensor sein kann und wobei das Verfahren einen zusätzlichen Schritt des Abtastens von geschnittenen Sequenzen aus den aufgezeichneten Daten umfassen kann, wobei die geschnittenen Sequenzen dann jeweils angereichert werden. Die geschnittenen Sequenzen können zum Beispiel jeweils eine Dauer von 5s haben, wobei der wenigstens eine Sensor Daten über 1h aufgezeichnet hat.
-
Gemäß den Ausführungsformen von 1 können eine oder mehrere der vordefinierten Anreicherungstechniken verwendet werden, um die Daten anzureichern.
-
Dabei umfasst der Satz von vordefinierten Anreicherungstechniken, wenigstens einen Knoten der Graphenstruktur zu verwerfen.
-
Ferner umfasst der Satz von vordefinierten Anreicherungstechniken, eine Störung in wenigstens einen Knoten der Graphenstruktur einzufügen.
-
Der Satz von vordefinierten Anreicherungstechniken umfasst auch, die Graphenstruktur zu spiegeln.
-
Darüber hinaus umfasst der Satz vordefinierter Anreicherungstechniken, wenigstens ein Merkmal wenigstens eines in den entsprechenden erfassten Sensordaten repräsentierten Objekts zu maskieren.
-
Gemäß den Ausführungsformen von 1 umfasst der Satz von vordefinierten Anreicherungstechniken, wenigstens einen Knoten in der Graphenstruktur zu duplizieren.
-
Ferner umfasst der Satz von vordefinierten Anreicherungstechniken, den Startknoten der Graphenstruktur zu verschieben.
-
Das Verfahren 1 stellt einen Satz von Datenanreicherungen bereit, die Datenabtastungen erzeugen, die in dem ursprünglich erfassten Datensatz nicht vorhanden waren, wobei die Datenanreicherungen dann direkt verwendet werden können, um einen Maschinenlernalgorithmus zu trainieren, zum Beispiel einen Maschinenlernalgorithmus, der für die Erkennung von Fahraufgaben trainiert wird.
-
Dabei kann während des Betriebs eines entsprechenden Fahrzeugs die Ausgabe des Maschinenlernalgorithmus, der für die Erkennung von Fahraufgaben trainiert ist, dann zum Beispiel als Eingabe zum Steuern einer steuerbaren Funktion des Fahrzeugs, zum Beispiel eines adaptiven Tempomats, verwendet werden.
-
2a-d veranschaulichen Ausführungsformen des Schritts des Erzeugens zusätzlicher Trainingsdaten zum Trainieren des Maschinenlernmodells, indem die Graphenstruktur modifiziert wird.
-
2a zeigt insbesondere eine Graphenstruktur 10, die basierend auf Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus erzeugt wurde, wobei die Trainingsdaten gekennzeichnete Sensordaten von wenigstens einem Sensor enthalten.
-
Dabei stellen die Knoten 11 der Graphenstruktur jeweils Objekte dar, die in den entsprechenden Sensordaten repräsentiert sind. Ferner stellt ein Startknoten 12 der Graphenstruktur die Position des wenigstens einen Sensors in Bezug auf die in den entsprechenden Sensordaten repräsentierten Objekte dar.
-
In der in 2a gezeigten Ausführungsform ist jeder Knoten 11 der Graphenstruktur 10 jeweils mit jedem anderen Knoten 11 der Graphenstruktur und dem Startknoten durch eine Linie verbunden.
-
Die Trainingsdaten können zum Beispiel bei Testfahrten mit einem Fahrzeug erfasst werden, wobei die Graphenstruktur eine Szene auf einer Straße darstellt, die während der Testfahrten erfasst wurde.
-
2b veranschaulicht das Modifizieren der Graphenstruktur, indem wenigstens ein Knotens der Graphenstruktur verworfen wird.
-
2b zeigt insbesondere eine modifizierte Graphenstruktur 20, die basierend auf der in 2a gezeigten Graphenstruktur erzeugt wurde, indem ein Knoten und die entsprechenden Linien aus der Graphenstruktur entfernt wurden.
-
2c veranschaulicht das Modifizieren der Graphenstruktur , indem eine Störung in wenigstens einen Knoten der Graphenstruktur eingefügt wird.
-
2b zeigt insbesondere eine modifizierte Graphenstruktur 30, die basierend auf der in 2a gezeigten Graphenstruktur erzeugt wurde, indem die Position eines Knotens 31 in der Graphenstruktur verändert wurde.
-
2d veranschaulicht das Modifizieren der Graphenstruktur, indem ein Teil der Graphenstruktur gespiegelt wird bzw. wenigstens zwei Knoten 41 der Graphenstruktur vertauscht werden.
-
2b zeigt insbesondere eine modifizierte Graphenstruktur 40, die basierend auf der in 2a gezeigten Graphenstruktur erzeugt wurde, indem die Positionen von zwei Knoten 41 in einer Dimension vertauscht wurden.
-
3 veranschaulicht ein System zum Erzeugen zusätzlicher Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus 50 gemäß Ausführungsformen der vorliegenden Erfindung.
-
Wie in 2 gezeigt, umfasst das System 50 eine Bereitstellungseinheit 51, die dafür ausgelegt ist, Trainingsdaten zum Trainieren des Maschinenlernalgorithmus bereitzustellen, wobei die Trainingsdaten gekennzeichnete Sensordaten von wenigstens einem Sensor enthalten, eine Umwandlungseinheit 52, die dafür ausgelegt ist, die Trainingsdaten in eine Graphenstruktur umzuwandeln, wobei die Knoten in der Graphenstruktur Objekte darstellen, die in den entsprechenden Sensordaten repräsentiert sind, und wobei ein Startknoten der Graphenstruktur die Position des wenigstens einen Sensors in Bezug auf die in den entsprechenden Sensordaten repräsentierten Objekte darstellt, und eine Erzeugungseinheit 53, die dafür ausgelegt ist, zusätzliche Trainingsdaten zum Trainieren des Maschinenlernmodells zu erzeugen, indem die Graphenstruktur modifiziert wird.
-
Dabei kann die Bereitstellungseinheit zum Beispiel ein Empfänger sein, um entsprechende Sensordaten zu empfangen. Die Umwandlungseinheit und die Erzeugungseinheit können zum Beispiel durch Code realisiert werden, der in einem Speicher gespeichert und von einem Prozessor ausführbar ist.
-
Gemäß den in 2 gezeigten Ausführungsformen umfasst das System ferner wenigstens einen Sensor 54 zum Erfassen von Sensordaten, wobei die Bereitstellungseinheit eine Kennzeichnungseinheit 55 umfasst, die dafür ausgelegt ist, die erfassten Sensordaten basierend auf Merkmalen von in den erfassten Sensordaten repräsentierten Objekten zu kennzeichnen, um die Trainingsdaten zum Trainieren des Maschinenlernalgorithmus zu erzeugen.
-
Dabei kann der wenigstens eine Sensor zum Beispiel ein Videosensor sein, der an einem Fahrzeug angebracht ist
-
Das gezeigte System 10 umfasst ferner einen Datenspeicher 56, in dem Code zum Durchführen vordefinierter Anreicherungstechniken gespeichert ist, wobei die vordefinierten Anreicherungstechniken von der Erzeugungseinheit 53 verwendet werden, um die zusätzlichen Trainingsdaten zu erzeugen.
-
Gemäß den Ausführungsformen von 2 umfasst der Satz der vordefinierten Anreicherungstechniken wiederum: Verwerfen des wenigstens einen Knotens der Graphenstruktur, Einfügen einer Störung in wenigstens einen Knotens der Graphenstruktur, Spiegeln wenigstens eines Teils der Graphenstruktur, Maskieren wenigstens eines Merkmals wenigstens eines in den entsprechenden erfassten Sensordaten repräsentierten Objekts, Duplizieren des wenigstens einen Knotens der Graphenstruktur und Verschieben des Startknotens der Graphenstruktur.
-
Ferner ist das gezeigte System 10 dafür ausgelegt, ein Verfahren zum Erzeugen zusätzlicher Trainingsdaten zum Trainieren eines Maschinenlernalgorithmus wie oben beschrieben auszuführen.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-