DE102021211054A1 - Verfahren und Vorrichtungen zum Aufbauen eines Trainingsdatensatzes - Google Patents

Verfahren und Vorrichtungen zum Aufbauen eines Trainingsdatensatzes Download PDF

Info

Publication number
DE102021211054A1
DE102021211054A1 DE102021211054.1A DE102021211054A DE102021211054A1 DE 102021211054 A1 DE102021211054 A1 DE 102021211054A1 DE 102021211054 A DE102021211054 A DE 102021211054A DE 102021211054 A1 DE102021211054 A1 DE 102021211054A1
Authority
DE
Germany
Prior art keywords
data
vehicle
data set
server
training data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102021211054.1A
Other languages
English (en)
Inventor
Ionut-Valentin Gheorghe
Christian Hellert
Antje Elisabeth Loyal
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Continental Automotive Technologies GmbH
Original Assignee
Continental Automotive Technologies GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Continental Automotive Technologies GmbH filed Critical Continental Automotive Technologies GmbH
Priority to DE102021211054.1A priority Critical patent/DE102021211054A1/de
Priority to US17/937,628 priority patent/US20230109494A1/en
Publication of DE102021211054A1 publication Critical patent/DE102021211054A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23211Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with adaptive number of clusters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Traffic Control Systems (AREA)

Abstract

Die vorliegende Erfindung bezieht sich auf ein Verfahren zum Aufbau eines Trainingsdatensatzes auf einem Server (201), umfassend:- Analysieren (401, 402; 500, 501; 600, 601, 602) von Meta-Informationen des Trainingsdatensatzes auf einen Bedarf zur Erweiterung des Trainingsdatensatzes, und- basierend auf dem Bedarf, Senden (403, 503, 605) einer Datenerfassungsaufgabe an eine Datenerfassungsvorrichtung (200), insbesondere ein Fahrzeug.

Description

  • Die vorliegende Erfindung betrifft Verfahren und Vorrichtungen zum Aufbauen eines balancierten Trainingsdatensatzes. Die Erfindung betrifft auch computerlesbare Speichermedien.
  • Es ist bekannt, dass für moderne Algorithmen des maschinellen Lernens ausreichend große Trainingsdatensätze von zentraler Bedeutung sind. Insbesondere in dem Kontext des autonomen Fahrens sind riesige Mengen an Trainingsdaten erforderlich, damit autonome Fahrzeuge auch für ungewöhnliche schwierige Situationen trainiert und getestet werden können.
  • Im Stand der Technik sind verschiedene Verfahren bekannt, um mit einer Flotte von mit Sensoren ausgestatteten Fahrzeugen Sensordaten zu erfassen und zentral zu speichern.
  • Es hat sich aber herausgestellt, dass die so erhaltenen Trainingsdatensätze noch nicht ausreichend sind, um einen Algorithmus zum autonomen Fahren zuverlässig zu trainieren. Zudem sind die dabei auftretenden gewaltigen Datenmengen, die übertragen und gespeichert werden müssen, schwierig zu handhaben.
  • Es ist eine Aufgabe der vorliegenden Erfindung, verbesserte Verfahren und Vorrichtungen zum Aufbauen eines Trainingsdatensatzes bereitzustellen. Diese Aufgabe wird durch die Gegenstände der unabhängigen Patentansprüche gelöst. Ausführungsformen und Weiterbildungen sind den abhängigen Patentansprüchen, der Beschreibung und den Figuren zu entnehmen.
  • Ein erster Aspekt der vorliegenden Erfindung betrifft ein Verfahren zum Aufbau eines Trainingsdatensatzes auf einem Server, umfassend:
    • - Analysieren von Meta-Informationen des Trainingsdatensatzes auf einen Bedarf zur Erweiterung des Trainingsdatensatzes, und
    • - basierend auf dem Bedarf, Senden einer Datenerfassungsaufgabe an eine Datenerfassungsvorrichtung, insbesondere ein Fahrzeug.
  • Der Erfindung liegt die Erkenntnis zugrunde, dass es nicht nur darum geht, möglichst viele Datenpunkte in dem Trainingsdatensatz zu haben, sondern dass diese auch verschiedene Szenarien abdecken müssen, um für das Training eines Algorithmus sinnvoll zu sein.
  • Es versteht sich, dass hierbei und im Folgenden Datenpunkt sich nicht zwangsläufig auf Daten zu einem Zeitpunkt bezieht muss (z.B. ein Messwert zu einem bestimmten Zeitpunkt), sondern auch eine Menge von Informationen umfassen kann, die zu einer Vielzahl von Zeitpunkten aufgenommen wurden. Zum Beispiel könnte ein Datenpunkt ein Video umfassen, das in einem bestimmten Zeitraum von der Umgebungen des Fahrzeugs aufgenommen wurde. Ein Datenpunkt kann auch als Beispiel oder Probe bezeichnet werden.
  • Der Begriff Trainingsdatensatz bezieht sich hierbei allgemein auf einen Datensatz, der dazu geeignet ist, zum Training und/oder Testen eines Verfahrens des maschinellen Lernens verwendet zu werden.
  • Nach Senden der Datenerfassungsaufgabe an die Datenerfassungsvorrichtung können die erfassten Daten erhalten und zum Trainingsdatensatz hinzugefügt werden.
  • Dadurch, dass das Verfahren des ersten Aspekts zuerst einen Bedarf zur Erweiterung des Trainingsdatensatzes bestimmt, kann die Erweiterung des Trainingsdatensatzes gezielt erfolgen. Somit wird es vermieden, dass der Trainingsdatensatz durch überflüssige Datenpunkte (z.B. Datenpunkte in einem Gebiet, in dem schon sehr viele Datenpunkte vorliegen) aufgeblasen wird und somit enormen Speicherplatz und Ressourcen benötigt, ohne zu einem besseren Training beizutragen.
  • Vorzugsweise ist vorgesehen, dass das Verfahren weiterhin einen initialen Schritt umfasst, eine Meta-Information eines neuen Datenpunkts von der Datenerfassungsvorrichtung zu erhalten,
    und wobei die Datenerfassungsaufgabe eine Anweisung an die Datenerfassungsvorrichtung umfasst, Sensordaten des neuen Datenpunkts an den Server zu senden.
  • Insbesondere können die Sensor-Daten unter Verwendung von LIDAR, RGBD, Stereokameras oder einer Fusion dieser Sensoren erzeugt werden.
  • Vorzugsweise ist vorgesehen, dass das Analysieren auf einen Bedarf zur Erweiterung des Trainingsdatensatzes umfasst, eine Entfernung der Meta-Information des neuen Datenpunkts zu Meta-Informationen von Datenpunkten des Trainingsdatensatzes zu bestimmen, und der Bedarf zur Erweiterung des Trainingsdatensatzes in Abhängigkeit von der Entfernung bestimmt wird.
  • Insbesondere kann vorgesehen sein, dass nur dann ein Bedarf zur Erweiterung gesehen wird, wenn die Meta-Information des neuen Datenpunkts einen größeren als einen bestimmten vorgegebenen Abstand zu Meta-Informationen von vorhandenen Datenpunkten hat.
  • Vorzugsweise ist vorgesehen, dass die Datenerfassungsvorrichtung ein Fahrzeug einer Fahrzeugflotte ist und der Datenpunkt Sensordaten von einem Innen- und/oder Außenraum des Fahrzeugs umfasst.
  • Vorzugsweise ist vorgesehen, dass die Meta-Informationen Vektor-Repräsentationen von Sensordaten beinhalten.
  • Die Vektor-Representation kann insbesondere eine semantische Repräsentation darstellen. Somit können z.B. bestimmte Richtungen im Vektorraum zu bestimmten semantischen Konzepten korrespondieren.
  • Dies hat den Vorteil, dass aus den Meta-Informationen in Vektor-Repräsentation neue Datenstrategien erzeugt werden können (z.B. durch Cluster-Analyse) und diese dann semantisch ausgewertet werden können, dass die Datensammelstrategie zielgerichtet ausgeführt und parametrisiert werden kann. In manchen Ausführungsformen könnten zudem direkt für einen menschlichen Fahrer verständliche Anweisungen abgeleitet werden.
  • Vorzugsweise kann weiterhin vorgesehen sein, dass das Analysieren des Trainingsdatensatzes umfasst, eine Cluster-Analyse auf dem Trainingsdatensatz durchzuführen, um eine Vielzahl von Clustern des Trainingsdatensatzes zu bestimmen.
  • Vorzugsweise kann weiterhin vorgesehen sein, dass das Verfahren weiterhin umfasst, eine Ausgleichsstrategie für die Vielzahl von Clustern zu bestimmten, wobei das Bestimmen der Ausgleichsstrategie vorzugsweise umfasst, Cluster zu bestimmen, die eine zu geringe Anzahl von Datenpunkten umfassen.
  • Somit kann das Verfahren zu einem Ausgleich der Cluster-Größen beitragen und insgesamt einen ausgeglichenen Trainingsdatensatz aufbauen, insbesondere einen Bias vermeiden.
  • Vorzugsweise kann weiterhin vorgesehen sein, dass ein Cluster eine zu geringe Anzahl von Datenpunkten umfasst, wenn die Anzahl der Datenpunkte dieses Clusters geringer als ein vorbestimmter Anteil der durchschnittlichen Anzahl der Datenpunkte der Vielzahl der Cluster ist.
  • Ein weiterer Aspekt der vorliegenden Erfindung bezieht sich auf einen Server, der dazu ausgebildet ist, ein wie oben beschriebenes Verfahren auszuführen.
  • Es versteht sich, dass es sich dabei nicht um einen einzelnen physikalischen Server handeln muss, sondern die Umsetzung des Verfahrens auch in der Cloud erfolgen kann, d. h. verteilt auf eine Vielzahl von Servern, möglicherweise räumlich voneinander getrennt.
  • Ein weiterer Aspekt der Erfindung bezieht sich auf ein Verfahren zum Aufbau eines Trainingsdatensatzes mit einer Datenerfassungsvorrichtung, wobei das Verfahren durch die Datenerfassungsvorrichtung ausgeführt wird und umfasst:
    • - Erfassen von Sensordaten,
    • - Bestimmen einer Meta-Information zu den Sensordaten,
    • - Senden der Meta-Information an einen Server,
    • - Empfangen einer Übertragungsanweisung, und
    • - Senden der Sensordaten an den Server basierend auf der Übertragungsanweisung.
  • Vorzugsweise ist vorgesehen, dass das Bestimmen der Meta-Information umfasst, die Sensordaten in einen hochdimensionalen Vektorraum, insbesondere einen mindestens 10-dimensionalen Vektorraum, abzubilden.
  • Ein weiterer Aspekt der Erfindung bezieht sich auf eine Datenerfassungsvorrichtung, insbesondere ein Fahrzeug einer Fahrzeugflotte, zur Verwendung mit einem wie oben beschriebenen Server, wobei die Datenerfassungsvorrichtung dazu ausgebildet ist, eines der oben beschriebenen Verfahren auszuführen.
  • Vorzugsweise ist vorgesehen, dass weiterhin die Datenerfassungsvorrichtung eine Ausgabevorrichtung zum Ausgeben einer Anweisung an einen Fahrer des Fahrzeugs umfasst, wobei die Ausgabevorrichtung insbesondere ein Audio-Ausgabegerät zum Ausgeben einer Sprachausgabe, ein Display und/oder eine Vorrichtung zum Darstellen eines Ziels auf einer Karte und/oder eine Vorrichtung zum Darstellen einer Navigationsrichtung beinhaltet.
  • Somit ist es möglich, Anweisungen an einen menschlichen Fahrer auszugeben, damit das Fahrzeug so dirigieren kann, dass gezielt wichtige Datenpunkte gesammelt werden. Zum Beispiel könnte ein der Server zu dem Ergebnis gekommen sein, dass eine bestimmte Fahrsituationen, zum Beispiel eine bestimmte unübersichtliche Kreuzung im Trainingsdatensatz nur an sonnigen Tagen zur Tageszeit mit Datenpunkten versorgt ist. In diesem Fall könnte es sinnvoll sein, auch zur Nachtzeit Datenpunkte von dieser Kreuzung zu sammeln.
  • In anderen Ausführungsformen kann vorgesehen sein, dass ein automatisiertes Fahrzeug die Datenerfassung durchführt. Hierzu kann insbesondere vorgesehen sein, dass die Datenerfassungsvorrichtung weiterhin eine Anweisungsausgabevorrichtung umfasst, die Anweisungen an eine autonome Steuervorrichtung des Fahrzeugs ausgibt.
  • Zum Beispiel können hierzu ungenutzte Fahrzeuge verwendet werden oder bei „Robo Taxis“ anderen Routen gewählt werden oder bei Rückfahrten ohne Passagiere automatisch die Routen angepasst werden. Hierzu kann vorgesehen sein, dass das Fahrzeug auf eine annotierte Karte zugreifen kann. Sofern zum Beispiel Trainingspunkte in einem Fahrszenario mit einer Einbahnstraße fehlen, könnte aus der annotierten Karte erkannt werden, wo sich derartige Einbahnstraßen finden, auf denen benötigte weitere Datenpunkte gesammelt werden können.
  • Ein weiterer Aspekt der Erfindung bezieht sich auf ein computerlesbares Speichermedium, das Programmcode speichert, wobei der Programmcode Befehle umfasst, die, wenn sie von einer Verarbeitungseinheit ausgeführt werden, eines der obengenannten Verfahren ausführen.
  • Die beiliegenden Zeichnungen sollen ein weiteres Verständnis der Ausführungsformen der Erfindung vermitteln. Die beiliegenden Zeichnungen veranschaulichen dabei Ausführungsformen und dienen im Zusammenhang mit der Beschreibung der Erklärung von Konzepten der Erfindung. Andere Ausführungsformen und viele der genannten Vorteile ergeben sich im Hinblick auf die Zeichnungen. Die dargestellten Elemente der Zeichnungen sind nicht notwendigerweise maßstabsgetreu zueinander gezeigt.
  • Es zeigen:
    • 1 eine schematische Darstellung einer Fahrzeug-System-Architektur;
    • 2 eine beispielhafte schematische Darstellung eines Systems aus einem Server, der mit mehreren Fahrzeugen und einem Datenspeicher verbunden ist;
    • 3 ein Flussdiagramm eines auf einer Datenerfassungsvorrichtung ausgeführten Verfahrens zum Aufbau eine Trainingsdatensatzes;
    • 4 ein Flussdiagramm eines auf einem Server ausgeführten Verfahrens zum Aufbau eine Trainingsdatensatzes;
    • 5 eine beispielhafte Veranschaulichung von Metainformationen in Form von Wort-Vektoren;
    • 6 eine beispielhafte Veranschaulichung von Metainformationen von Datenpunkten in einem Datensatz in Form von Wort-Vektoren;
    • 7 ein Flussdiagramm eines auf einem Server ausgeführten Verfahrens zum Aufbau eine Trainingsdatensatzes; und
    • 8 ein Flussdiagramm eines auf einem Server ausgeführten Verfahrens zum Aufbau eine Trainingsdatensatzes.
  • 1 zeigt eine beispielhafte Fahrzeug-System-Architektur. Sie umfasst eine Vielzahl von externen Sensoren 100, z. B. Kamera, LIDAR oder RADAR, die die äußere Umgebung des Fahrzeugs wahrnehmen. Darüber hinaus können ein oder mehrere Innenraumsensoren 101 vorhanden sein, die die Kabine eines Fahrzeugs wahrnehmen. Abgesehen von den spezifischen Sensoren kann auch das Fahrzeugnetzwerk 102, z. B. CAN-Bus, verwendet werden, um zusätzliche Informationen, z. B. Lenkwinkel, zu sammeln. Die Sensoren 100 und 101 und das Fahrzeugnetzwerk 102 sind mit einem Prozessor 103 verbunden, der die in 3 dargestellte Routine ausführt. Darüber hinaus ist der Prozessor mit einem Kommunikationsmodul 104 verbunden, um mit einem Server 201 zu kommunizieren, der in 2 dargestellt ist. Wie dort dargestellt, ist der Server 201 z. B. durch eine drahtlose Verbindung mit einer Vielzahl von Fahrzeugen, die ferner als Fahrzeugflotte bezeichnet werden, und mit einem Datenspeicher 202 verbunden.
  • In einer Datenerfassung im Stand der Technik können sich verschiedene Probleme ergeben:
    • - Die bekannten Ansätze erfordern eine enorme Menge an Daten, um alle gesammelten Datenpunkte aus einer Fahrzeugflotte zu sammeln
    • - Es wird keine Metadatenkompositionalität genutzt und typischerweise genutzt Unsicherheitsmaße sind nur ein sehr grober Indikator für die Anforderungen an die Trainingsdaten
    • - Es kann eine große Menge redundanter/ repetitiver Daten in unsicheren Regionen des Merkmalsraums aufgrund unzureichender Filtertechniken geben. Dies führt zu Problemen bei der Datenerfassung und -speicherung (und kann daher zu einem Ungleichgewicht der Stichproben führen)
    • - In der Folge können die mit solchen Daten trainierten maschinellen Lernmodelle suboptimal und einen starken Bias aufweisen
    • - Die Kompositionalität von Metadaten, z. B. auf der Grundlage von automatisch generierten textuellen Bildbeschreibungen (image captioning"), wird noch nicht für die Datenerfassung und -auswertung genutzt. Schwellenwerte für die Auffälligkeit von Metadaten können verwendet werden, um in regelmäßigen Abständen die Wartung von maschinellen Lernmodellen und -komponenten auszulösen (z. B. Orchestrierung von Datenerfassungsaufträgen, Planung von Annotationsaufträgen, Neutraining für Szenarien, in denen die Daten nicht mehr verteilt werden)
    • - Es sind nur vorkonfigurierte Datenfiltertechniken verfügbar (mit Ausnahme von Techniken, die auf Unsicherheitsmaßen basieren)
  • Ein oder mehrere dieser Probleme können z.B. mit den folgenden bevorzugten Ausführungsformen gelöst werden.
  • Zunächst wird beschrieben, wie die Datenerfassung von den Fahrzeugen in Interaktion mit dem Server realisiert wird. Wie erwähnt, zeigt 3 das Verfahren, das auf dem Prozessor 103 ausgeführt wird, um Sensordaten zu sammeln:
    • Die Routine beginnt mit dem synchronen Erfassen von Sensordaten von den AD-Sensoren (externe Sensoren) 300 und den Innenraumsensoren 301. Darüber hinaus werden auch Daten aus dem Fahrzeugnetzwerk erfasst (Schritt 301). Die externen Sensoren liefern Sensorrohdaten, z. B. Bilder oder Punktwolken, von Kameras, LIDARs oder RADARs. Die internen Sensoren liefern semantische Beschreibungen der Kabine, z. B. Gesichtsausdrücke des Fahrers, Insassenaktivitäten oder Fahrerbereitschaftszustand. Das Fahrzeugnetzwerk kann verwendet werden, um Informationen über den Lenkwinkel, die Geschwindigkeit oder die Beschleunigung zu erhalten.
  • Im nächsten Schritt werden die Daten des Schritte 300 und 301 im Schritt 302 verarbeitet. Dadurch werden die Sensorrohdaten von den externen Sensoren verarbeitet, um Metainformationen (z. B. durch image captioning) zu erhalten, die die Repräsentation des Datenpunkts im semantischen (Wort-) Vektorraum ermöglichen. Dadurch kann ein Datenpunkt Daten von einem einzelnen Zeitstempel oder einer Sequenz von Datenpunkten sein. Eine kurze Erklärung von semantischen (Wort-) Vektorräumen wird später gegeben. Abgesehen von den Metainformationen von den externen Sensordaten können auch die Informationen von dem Innenraumsensor und von dem Fahrzeugnetzwerk zu dem Datenpunkt hinzugefügt werden. Ein Datenpunkt kann dabei insbesondere Sensorrohdaten und die entsprechenden Metainformationen umfassen.
  • Im Schritt 303 werden die Metainformationen von Datenpunkten an den Server übertragen. Dadurch kann ein einzelner Datenpunkt oder eine Charge von Datenpunkten übertragen werden.
  • Der Schritt 304 wartet auf eine Rückmeldung vom Server über die übertragenen Metainformationen. Der Server entscheidet, ob die Rohdaten an den Server gesendet und in den Datenspeicher aufgenommen werden sollen oder verworfen werden sollen, z. B. da ähnliche Daten bereits im Datenspeicher verfügbar sind. Siehe auch den nächsten Absatz.
  • Der nächste Schritt 305 nimmt die Antwort vom Server entgegen und nimmt Aktionen in Abhängigkeit von der Antwort vor. Wenn der Datenpunkt behalten werden soll, werden in 306 die Sensordaten an den Server gesendet. Andernfalls werden sie verworfen. Wie erwähnt, testet der Server basierend auf den Metainformationen, ob ein Datenpunkt in den Datenspeicher (bzw. einen im Datenspeicher gespeicherten Trainingsdatensatz) aufgenommen werden soll. 4 zeigt das Verfahren, das auf dem Server ausgeführt wird, um die Metainformationen eines Datenpunkts zu bewerten:
    • Die Routine beginnt mit dem Empfangen von Metainformationen eines Datenpunkts von einem Client (Fahrzeug) (Schritt 400).
  • Danach wird in Schritt 401 eine Ähnlichkeit zwischen den Metainformationen der empfangenen Datenpunkte und den Datenpunkten, die sich bereits im Datenspeicher befinden, berechnet und in einem Vergleich im Schritt 202 ausgewertet.
  • Wenn die Entfernung größer als ein definierter Schwellenwert ist (Überprüfung im Schritt 202), sendet der Server im Schritt 403 einen Befehl zur Freigabe der Übertragung an das entsprechende Fahrzeug. Der Datenpunkt wird dann vom dem Fahrzeug empfangen und in den Datenspeicher aufgenommen.
  • Andernfalls sendet der Server im Schritt 404 einen Befehl zum Abbrechen der Übertragung an das entsprechende Fahrzeug und der Datenpunkt wird verworfen.
  • Der folgende Absatz gibt einige Intuition bezüglich der Repräsentation der Metainformationen und der Berechnung der Ähnlichkeit. 5 zeigt drei Diagramme. In (a) gibt es einen beispielhaften zweidimensionalen Vektorraum mit 4-Wort-Vektoren, die als die Metainformationen der Datenpunkte behandelt werden können. Wenn der Vektorraum gut durch z. B. image captioning definiert ist, ermöglicht er Vektorvorgänge, wie die gezeigte Zusammensetzung in (b). Im Beispiel ist es möglich, das Konzept „König“ durch Subtrahieren von „Mann“ und Hinzufügen von „Frau“ in das Konzept „Königin“ umzuwandeln. Diese Eigenschaft ist hilfreich, um Metainformationen über ungesehene Datenpunkte im Vektorraum zu approximieren, die verwendet werden können, um Datensammelstrategien zu formulieren. In den folgenden Absätzen wird beschrieben, wie die Sammelstrategien abgeleitet werden.
  • Um die Ähnlichkeit zwischen zwei Vektoren (von Metainformationen) zu berechnen, kann in einem Vektorraum die Kosinus-Ähnlichkeit verwendet werden, wie in (c) gezeigt. Dies kann im Schritt 401 angewendet werden.
  • Basierend auf dem eingeführten Vektorraum zeigt 6 eine beispielhafte Vektorraumrepräsentation für den Datenspeicher. Es gibt 3 Cluster 701 mit Datenpunkten 703. Das Zentrum eines Clusters wird hervorgehoben. Die Absicht hinter einem Cluster ist, dass jedes Cluster Datenpunkte aufweist, die inhaltlich zusammengehören. Dies drückt sich z.B. dadurch aus, dass die Metainformationen von Datenpunkten eines Clusters sehr ähnlich sind. Basierend auf diesem Beispiel können weiße Flecken („white spots“, in denen sich also keine Datenpunkte finden) durch Vektorvorgänge und die Kosinus-Ähnlichkeit abgeleitet werden. Diese weißen Flecken können verwendet werden, um Datensammelaufgaben für die Fahrzeugflotte zu formulieren. Ein Beispiel wäre, dass der weiße Fleck durch Hinzufügen des Konzepts „Nacht“ zu einem vorhandenen Cluster erreicht werden kann. Dies kann dann verwendet werden, um automatisierte Fahrzeuge anzuweisen, Datenpunkte während der Nacht spezifisch aufzuzeichnen.
  • Es kann auch vorgesehen sein, dass bestimmte Richtungen im Vektorraum als besonders relevant markiert sind. Zum Beispiel können diese Richtungen zu semantischen Konzepten wie Tag/Nacht, hell/dunkel, viel/wenig Verkehr, usw. korrespondieren. Hier könnte bekannt sein, dass es besonders wichtig ist, dass Trainingspunkte für verschiedene Wert dieser Richtungen vorliegen.
  • In anderen Ausführungsformen kann vorgesehen sein, dass Datenpunkte basierend auf bestimmten Meta-Informationen gewichtet werden. Zum Beispiel könnte ein Datenpunkt höher gewichtet sein, wenn er von einem Fahrzeug stammt, dessen Fahrer bei Aufnahme des Datenpunkts wachsam war und/oder generell als zuverlässiger Fahrer bekannt war. Diese Gewichtung kann bei der Bestimmung eines Bedarfs für einen Ausbau des Trainingsdatensatzes berücksichtigt werden. Zum Beispiel könnte es wichtiger sein, für einen bestimmten Bereich des Vektorraums weitere Datenpunkte zu sammeln, wenn in diesem Bereich nur Datenpunkte von übermüdeten oder unzuverlässigen Fahrern vorliegen und es somit nicht klar ist, ob die Datenpunkte ein sinnvolles Fahrerverhalten widerspiegeln. Zum Beispiel kann, wenn der Bedarf einer Erweiterung des Trainingsdatensatzes bestimmt wird, die Gewichtung der Datenpunkte im Trainingsdatensatz so berücksichtigt werden, dass der nötige Abstand zu einem vorhanden Datenpunkt, damit keine Datenerfassungsaufgabe erstellt wird, proportional zur Gewichtung dieses vorhandenen Datenpunkts ist.
  • Verschiedene Faktoren können bei der Gewichtung des Datenpunkts berücksichtig werden. Insbesondere kann die Gewichtung von Metainformationen zu Sensordaten aus dem Innenraum des Fahrzeugs abhängig sein. Zum Beispiel können die Metainformationen einen Gesichtsausdruck des Fahrers, eine Emotionalität des Fahrers, eine Unruhe im Fahrzeug (abgeleitet zum Beispiel aus einer Lautstärke im Innenraum im Vergleich zu einer Lautstärke im Außenraum), eine Müdigkeit des Fahrers, und/oder weitere Faktoren beinhalten.
  • Folgende zwei Routinen laufen auf dem Server und befassen sich mit der Neuverteilung und Weißfleckerkennung („White Spot Detektierung“) des Datenspeichers. Zuerst wird die Weißfleckerkennung beschrieben, wie sie in 7 dargestellt ist:
    • Die Weißfleckanalyse (500) verwendet den Datenspeicher 202, um weiße Flecken zu extrahieren, wie sie im vorherigen Absatz beschrieben ist.
    • Danach werden die weißen Flecken zu einer Sammlung zusammengefasst, in der ähnliche weiße Flecken zusammengehören (Schritt 501).
    • Als nächstes werden in Schritt 502 Datensammelaufgaben durch Extrahieren der semantischen Merkmale (Metainformationen) aus den weißen Flecken erzeugt.
  • Das Neuverteilen des Datenspeichers (der den Trainingsdatensatz beinhaltet) geht wie folgt (siehe auch 8):
    • Das Neuverteilen beginnt mit dem Durchführen einer Clusteranalyse 600, die durch Clusterverfahren (z. B. Mean Shift) unter Verwendung des Datenspeichers 202 realisiert werden kann.
    • Danach wird in Schritt 601 eine Ausgleichsstrategie für jeden relevanten Cluster definiert.
    • Basierend auf der Kapazität des Datenspeichers wird die Anzahl der Datenpunkte pro Cluster und die Entfernung des Clusters zu den anderen Clustern definiert. Es ist zu beachten, dass für einige Cluster möglicherweise kein Ausgleich durchgeführt werden muss, da sie bereits ausbalanciert sind.
  • Anschließend wird für jeden Cluster überprüft, ob die Ausgleichsstrategie das Entfernen von Proben beinhaltet (Schritt 602). Wenn ja, werden Probenaus dem Cluster entfernt, z.B. basierend auf der Gewichtung (Schritt 603).
  • Andernfalls wird eine Datensammelaufgabe definiert, um dem Cluster mehr Datenpunkte hinzuzufügen (Schritt 604).
  • Wie oben bereits angedeutet, kann in anderen Ausführungsbeispielen vorgesehen sein, dass in vielen Fällen der Cluster einfach unverändert gelassen wird, also weder neue Datenpunkte hinzugefügt noch vorhandene Datenpunkte entfernt werden.
  • Durch die Weißfleckerkennung und Neuverteilung kann der Datenspeicher einerseits mit erforderlichen Datenpunkten erweitert und durch Neuverteilung kompakt gehalten werden. Dies stellt sicher, dass der Datenspeicher nur wertvolle Datenpunkte enthält und die Speicherbeschränkungen nicht überschreitet.
  • Die vorliegende Erfindung ist auch auf andere Bereiche anwendbar.
  • Die Datensammlung, die Annotation (d. h. die Bezeichnung), das Probenmining und die Algorithmusvalidierung (z. B. Kameratechnologie) sind ein integraler Bestandteil jeder Machine-Learning-Pipeline. Dies erweitert den Umfang dieser Erfindung, um auf eine Vielzahl von Problemen der Szenenwahrnehmung anwendbar zu sein, einschließlich, aber nicht beschränkt auf
    • - Smart-Home-Überwachungsanwendungen
    • - Hochpräzisions-Sportüberwachung
    • - Überwachung der Fahrzeugkabine
    • - Überwachung von Verkehr und Aktivität in intelligenten Städten
    • - Überwachung der Qualität in intelligenten Fabriken (z. B. Industrie 4.0)
    • - andere Anwendungen des Internets der Dinge (IOT) einschließlich Drohnen und intelligenten Sensoren, und
    • - hochpräzise Landwirtschaft und viele Robotik-Anwendungen
  • Die Erzeugung von zeitlichen Metadaten (d. h. Beschriftungen) könnte verwendet werden, um eine Sequenz von Ereignissen zu beschreiben, während sie sich über die Zeit entfalten. Solche Ereignisse würden einem volumetrischen Raum entsprechen (d. h. Ermöglichen, dass eine Vielzahl von Videoeinzelbildern gleichzeitig codiert werden).
  • Anstatt einzelner Beschriftungen können Metadaten eines Absatzes verwendet werden, um komplexe Szenarien und Aufzeichnungen zu erstellen. In diesem Fall wird das Mining für Aufzeichnungen zu mehr dem Dokumentabruf ähnlich.
  • Das hierin beschriebene Verfahren könnte auch auf RADAR oder Punktwolken erweitert werden.
  • Vorteile von manchen bevorzugten Ausführungsform können umfassen:
    • - Verringerung des erforderlichen Umfangs der Datenbank, die aufgezeichnete Daten aus der Fahrzeugflotte beinhaltet
    • - Erhöhung der Varianz der gesammelten Daten, um die Robustheit von ML-Modellen für automatisierte Fahrfunktionen zu erhöhen
    • - Erleichterung automatisierter Mechanismen für das (Neu-)Training von ML-Modellen für automatisierte Fahrfunktionen (z. B. Fußgängererkennung)
    • - Generierung spezifischer Datenerfassungsaufgaben für vollautomatisierte Fahrzeuge durch Analyse der Datenbank (um Verzerrungen zu verringern und eine bessere Abdeckung zu ermöglichen)
    • - geringere Kosten, die mit dem Speichern verbunden sind, da nur aufgezeichnete Datenpunkte in den Datenspeicher aufgenommen werden, wenn sie sich nicht mit vorhandenen Datenpunkten überlappen bzw. nicht zu ähnlich sind zu den vorhandenen Datenpunkten
    • - Geringer Kosten, die mit der Manipulation verbunden sind, da der Datenspeicher aufgrund des Neuausgleichs und der Verwendung von Vektorraumvorgängen so klein wie möglich gehalten wird
    • - Gezielte Definition von Datensammelaufgaben für eine Fahrzeug-Flotte zum Sammeln von Datenpunkten, die die Vielfalt des Datenspeichers erhöhen wird
  • Bezugszeichenliste
  • 100
    Sensor
    101
    Innenraum-Sensor
    102
    Fahrzeug-Netzwerk
    103
    Prozessor
    104
    Kommunikationsmodul
    200
    Fahrzeug 1...N
    201
    Server
    202
    Datenspeicher
    300
    Erfassen von AD-Sensordaten von einer Vielzahl von Sensoren
    301
    Erfassen weiterer Sensordaten des Fahrzeugs, z. B. Lenkwinkel oder Gesichtsausdruck des Fahrers
    302
    Hinzufügen von (semantischen) Metainformationen (z. B. Bildunterschriften oder von anderen Fahrzeugsensoren) zu Sensordatenpunkten
    303
    Übermitteln von Metadaten an den Server
    304
    Erhalten der Übertragungsentscheidung vom Server
    305
    Überprüfen auf Übertragen
    306
    Übertragen von Sensor-Daten an den Server
    400
    Empfangen von Meta-Informationen von einem Client
    401
    Berechnen der Ähnlichkeit (Abstand) zu gesammelten Datenpunkten
    402
    Überprüfen, ob Entfernung > Grenzwert
    403
    Senden des Befehls zur Übertragungsfreigabe an den Client
    404
    Senden des Befehls zum Abbruch der Übertragung an den Client
    500
    Weiße Flecken-Analyse
    501
    Zusammenfassen identifizierter weißer Flecken zu einer Sammlung
    502
    Erstellen einer Datensammelaufgabe aus der Erfassung von weißen Flecken
    503
    Verteilen der Datensammelaufgaben an die Fahrzeug-Flotte
    600
    Cluster-Analyse
    601
    Festlegen einer Ausgleichsstrategie für jedes Cluster
    602
    Entfernen von Datenpunkten?
    603
    Entfernen von Datenpunkten, um die Cluster auszubalancieren
    604
    Definieren einer Datensammelaufgabe, um Datenpunkte zum Cluster hinzuzufügen
    605
    Übermitteln der Datensammelaufgabe an die Fahrzeugflotte
    700
    Weißer Fleck
    701
    Cluster
    702
    Neue Datensammelaufgabe

Claims (15)

  1. Verfahren zum Aufbau eines Trainingsdatensatzes auf einem Server (201), umfassend: - Analysieren (401, 402; 500, 501; 600, 601, 602) von Meta-Informationen des Trainingsdatensatzes auf einen Bedarf zur Erweiterung des Trainingsdatensatzes, und - basierend auf dem Bedarf, Senden (403, 503, 605) einer Datenerfassungsaufgabe an eine Datenerfassungsvorrichtung (200), insbesondere ein Fahrzeug.
  2. Verfahren nach Anspruch 1, wobei das Verfahren weiterhin einen initialen Schritt umfasst, eine Meta-Information eines neuen Datenpunkts von der Datenerfassungsvorrichtung (200) zu erhalten, und wobei die Datenerfassungsaufgabe eine Anweisung an die Datenerfassungsvorrichtung (200) umfasst, Sensordaten des neuen Datenpunkts an den Server (201) zu senden.
  3. Verfahren nach Anspruch 2, wobei das Analysieren auf einen Bedarf zur Erweiterung des Trainingsdatensatzes umfasst, eine Entfernung der Meta-Information des neuen Datenpunkts zu Meta-Informationen von Datenpunkten des Trainingsdatensatzes zu bestimmen, und der Bedarf zur Erweiterung des Trainingsdatensatzes in Abhängigkeit von der Entfernung bestimmt wird.
  4. Verfahren nach einem der vorherigen Ansprüche, wobei die Datenerfassungsvorrichtung (200) ein Fahrzeug einer Fahrzeugflotte ist und wobei der Datenpunkt Sensordaten von einem Innen- und/oder Außenraum des Fahrzeugs umfasst.
  5. Verfahren nach einem der vorherigen Ansprüche, wobei die Meta-Informationen Vektor-Repräsentationen von Sensordaten beinhalten, wobei vorzugsweise Richtungen in dem Vektorraum der Vektor-Repräsentationen zu semantischen Konzepten korrespondieren.
  6. Verfahren nach einem der vorherigen Ansprüche, wobei das Analysieren des Trainingsdatensatzes umfasst, eine Cluster-Analyse auf dem Trainingsdatensatz durchzuführen, um eine Vielzahl von Clustern des Trainingsdatensatzes zu bestimmen.
  7. Verfahren nach einem der Ansprüche 6, wobei das Verfahren weiterhin umfasst, eine Ausgleichsstrategie für die Vielzahl von Clustern zu bestimmten, wobei das Bestimmen der Ausgleichsstrategie vorzugsweise umfasst, Cluster (701) zu bestimmen, die eine zu geringe Anzahl von Datenpunkten umfassen.
  8. Verfahren nach Anspruch 7, wobei bestimmt wird, dass ein Cluster (701) eine zu geringe Anzahl von Datenpunkten umfasst, wenn die Anzahl der Datenpunkte dieses Clusters (701) geringer ist als ein vorbestimmter Anteil der durchschnittlichen Anzahl der Datenpunkte der Vielzahl der Cluster (701) ist.
  9. Server (201), dazu ausgebildet, ein Verfahren nach einem der vorherigen Ansprüche auszuführen.
  10. Verfahren zum Aufbau eines Trainingsdatensatzes mit einer Datenerfassungsvorrichtung (200), wobei das Verfahren durch die Datenerfassungsvorrichtung (200) ausgeführt wird und umfasst: - Erfassen (300) von Sensordaten, - Bestimmen (302) einer Meta-Information zu den Sensordaten, - Senden (303) der Meta-Information an einen Server (201), - Empfangen (304) einer Übertragungsanweisung, und - Senden (306) der Sensordaten an den Server (201) basierend auf der Übertragungsanweisung.
  11. Verfahren nach Anspruch 10, wobei das Bestimmen der Meta-Information umfasst, die Sensordaten in einen hochdimensionalen Vektorraum, insbesondere einen mindestens 10-dimensionalen Vektorraum, abzubilden.
  12. Datenerfassungsvorrichtung (200), insbesondere Fahrzeug einer Fahrzeugflotte, zur Verwendung mit einem Server (201) nach Anspruch 9, wobei die Datenerfassungsvorrichtung (200) dazu ausgebildet ist, das Verfahren nach einem der Ansprüche 10 und 11 auszuführen.
  13. Datenerfassungsvorrichtung (200), nach Anspruch 12, weiterhin umfassend ein Ausgabevorrichtung zum Ausgeben einer Anweisung an einen Fahrer des Fahrzeugs, wobei die Ausgabevorrichtung insbesondere ein Audio-Ausgabegerät zum Ausgeben einer Sprachausgabe, ein Display und/oder eine Vorrichtung zum Darstellen eines Ziels auf einer Karte und/oder eine Vorrichtung zum Darstellen einer Navigationsrichtung beinhaltet.
  14. Datenerfassungsvorrichtung (200) nach Anspruch 12, weiterhin umfassend eine Anweisungsausgabevorrichtung, die Anweisungen an eine autonome Steuervorrichtung des Fahrzeugs ausgibt.
  15. Computerlesbares Speichermedium, das Programmcode speichert, wobei der Programmcode Befehle umfasst, die, wenn sie von einer Verarbeitungseinheit ausgeführt werden, das Verfahren nach einem der Ansprüche 1 bis 8 oder 10 und 11 ausführen.
DE102021211054.1A 2021-10-01 2021-10-01 Verfahren und Vorrichtungen zum Aufbauen eines Trainingsdatensatzes Pending DE102021211054A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE102021211054.1A DE102021211054A1 (de) 2021-10-01 2021-10-01 Verfahren und Vorrichtungen zum Aufbauen eines Trainingsdatensatzes
US17/937,628 US20230109494A1 (en) 2021-10-01 2022-10-03 Methods and devices for building a training dataset

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102021211054.1A DE102021211054A1 (de) 2021-10-01 2021-10-01 Verfahren und Vorrichtungen zum Aufbauen eines Trainingsdatensatzes

Publications (1)

Publication Number Publication Date
DE102021211054A1 true DE102021211054A1 (de) 2023-04-06

Family

ID=85571054

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102021211054.1A Pending DE102021211054A1 (de) 2021-10-01 2021-10-01 Verfahren und Vorrichtungen zum Aufbauen eines Trainingsdatensatzes

Country Status (2)

Country Link
US (1) US20230109494A1 (de)
DE (1) DE102021211054A1 (de)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9704054B1 (en) 2015-09-30 2017-07-11 Amazon Technologies, Inc. Cluster-trained machine learning for image processing
US20210019343A1 (en) 2019-07-15 2021-01-21 International Business Machines Corporation Generating Metadata for Image-Based Querying
DE102020200503A1 (de) 2019-12-23 2021-06-24 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren zum Generieren von gelabelten Daten, insbesondere für das Training eines neuronalen Netzes, mittels Verbesserung initialer Label

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9704054B1 (en) 2015-09-30 2017-07-11 Amazon Technologies, Inc. Cluster-trained machine learning for image processing
US20210019343A1 (en) 2019-07-15 2021-01-21 International Business Machines Corporation Generating Metadata for Image-Based Querying
DE102020200503A1 (de) 2019-12-23 2021-06-24 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren zum Generieren von gelabelten Daten, insbesondere für das Training eines neuronalen Netzes, mittels Verbesserung initialer Label

Also Published As

Publication number Publication date
US20230109494A1 (en) 2023-04-06

Similar Documents

Publication Publication Date Title
DE112019001310T5 (de) Systeme und verfahren zum reduzieren der menge an datenspeicher beim maschinellen lernen
DE112017004302T5 (de) Fahrerunterstützungssystem zum Bestimmen einer Position eines Fahrzeugs
DE102016003969B4 (de) Verfahren zum Erfassen von Umgebungsdaten mittels mehrerer Kraftfahrzeuge
WO2014118178A1 (de) Erstellen eines umfeldmodells für ein fahrzeug
DE102018116036A1 (de) Training eines tiefen konvolutionellen neuronalen Netzwerks für individuelle Routen
DE112015002837T5 (de) Fusion von Daten aus heterogenen Quellen
DE102018111935A1 (de) Bildverarbeitungssystem, Bildverarbeitungsverfahren, Informationsverarbeitungsvorrichtung und Aufzeichnungsmedium
DE102017219282A1 (de) Verfahren und Vorrichtung zum automatischen Erzeugen eines künstlichen neuronalen Netzes
DE112019005949T5 (de) Informationsverarbeitungsvorrichtung, informationsverarbeitungssystem und informationsverarbeitungsverfahren
DE102014113817A1 (de) Vorrichtung und Verfahren zur Erkennung eines Objekts in Einem Bild
EP2813999B1 (de) Augmented-Reality-System und Verfahren zum Erzeugen und Anzeigen von Augmented-Reality-Objektdarstellungen für ein Fahrzeug
DE102017204347A1 (de) Verfahren und System zum Bestimmen einer kinematischen Eigenschaft eines Objekts, Verfahren zum Steuern eines Assistenzsystems eines Kraftfahrzeugs und Kraftfahrzeug
DE102016124888A1 (de) Verfahren zum Unterstützen eines Fahrers eines Kraftfahrzeugs beim Einparken unter Verwendung einer Fahrerassistenzvorrichtung, entsprechendes Computerprogrammprodukt und Fahrerassistenzvorrichtung
DE102021211054A1 (de) Verfahren und Vorrichtungen zum Aufbauen eines Trainingsdatensatzes
DE102020200876B4 (de) Verfahren zum Verarbeiten von Sensordaten einer Sensorik eines Fahrzeugs
DE102021201539A1 (de) Erzeugung von Trainingsdaten für einen Algorithmus des maschinellen Lernens
DE102020200875A1 (de) Verfahren zum Bereitstellen von Sensordaten durch eine Sensorik eines Fahrzeugs
DE102019005825A1 (de) Verfahren zum Erzeugen von Trainingsdaten für eine kraftfahrzeugexterne elektronische Recheneinrichtung, sowie Fahrerassistenzsystem
DE112022003908T5 (de) Informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren, servervorrichtung, fahrzeugvorrichtung und informationsverarbeitungsprogramm
DE102021125001A1 (de) Statistische Systemvalidierung von Fahrunterstützungssystemen
DE102022201161A1 (de) Objektklassifizierung mit einem einstufigen metabasierten Objektdetektor unter Verwendung von Klassenprototypen
DE102020132028A1 (de) Bestimmung einer optimierten Struktur für Neuronale Netze, insbesondere für Verwendung in einem Embedded System
WO2022043203A1 (de) Training eines generators zur erzeugung realistischer bilder mit einem semantisch segmentierenden diskriminator
DE102022207448A1 (de) Verfahren und Vorrichtung zum Bereitstellen einer verbesserten Realwelt-Verkehrssituation-Datenbasis für das Training und das Bereitstellen von datenbasierten Funktionen eines autonomen Fahrmodells für ein Fahrzeug
DE102023125401A1 (de) System und verfahren zur beschleunigung der verteilten rückmeldung bei der entwicklung von klassifikatoren für maschinelles lernen

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R081 Change of applicant/patentee

Owner name: CONTINENTAL AUTOMOTIVE TECHNOLOGIES GMBH, DE

Free format text: FORMER OWNER: CONTINENTAL AUTOMOTIVE GMBH, 30165 HANNOVER, DE

R016 Response to examination communication
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06Q0050300000

Ipc: G06Q0050400000

R081 Change of applicant/patentee

Owner name: CONTINENTAL AUTOMOTIVE TECHNOLOGIES GMBH, DE

Free format text: FORMER OWNER: CONTINENTAL AUTOMOTIVE TECHNOLOGIES GMBH, 30165 HANNOVER, DE