DE202021103699U1 - Vorrichtung zum Trainieren eines neuronalen Netz-Ensembles - Google Patents

Vorrichtung zum Trainieren eines neuronalen Netz-Ensembles Download PDF

Info

Publication number
DE202021103699U1
DE202021103699U1 DE202021103699.0U DE202021103699U DE202021103699U1 DE 202021103699 U1 DE202021103699 U1 DE 202021103699U1 DE 202021103699 U DE202021103699 U DE 202021103699U DE 202021103699 U1 DE202021103699 U1 DE 202021103699U1
Authority
DE
Germany
Prior art keywords
neural network
artificial neural
training
image data
network ensemble
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE202021103699.0U
Other languages
English (en)
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Albert Ludwigs Universitaet Freiburg Koerpers De
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Albert Ludwigs Universitaet Freiburg
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH, Albert Ludwigs Universitaet Freiburg filed Critical Robert Bosch GmbH
Priority to DE202021103699.0U priority Critical patent/DE202021103699U1/de
Publication of DE202021103699U1 publication Critical patent/DE202021103699U1/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

Vorrichtung zum Trainieren eines neuronalen Netz-Ensembles, wobei das neuronale Netz-Ensemble eine Vielzahl von künstlichen neuronalen Netzen aufweist, wobei die Vorrichtung ein maschinenlesbares Speichermedium umfasst, auf dem Befehle gespeichert sind, die beim Ausführen durch einen Computer bewirkten, dass der Computer ein Verfahren (10) mit folgenden Schritte ausführt:
- für jedes der Vielzahl von künstlichen neuronalen Netzen, separates Ermitteln einer optimalen Architektur von zumindest einem Teil des entsprechenden künstlichen Neuronalen Netzes aufweist (11); und
- jeweiliges Trainieren der einzelnen künstlichen neuronalen Netze basierend auf Trainingsdaten und der entsprechenden optimalen Architektur (12).

Description

  • Die Erfindung betrifft eine Vorrichtung zum Trainieren eines neuronalen Netz-Ensembles, mit welchem ein neuronales Netz-Ensemble mit einer verbesserten Kalibrierung bereitgestellt werden kann, und wobei Computerressourcen während des Trainierens des neuronalen Netz-Ensembles eingespart werden können.
  • Algorithmen zum maschinellen Lernen basieren darauf, dass Verfahren der Statistik verwendet werden, um eine Datenverarbeitungsanlage derart zu trainieren, dass diese eine bestimmte Aufgabe ausführen kann, ohne dass diese ursprünglich explizit hierzu programmiert wurde. Das Ziel des maschinellen Lernens besteht dabei darin, Algorithmen zu konstruieren, die aus Daten lernen und Vorhersagen treffen können. Diese Algorithmen erstellen mathematische Modelle, mit denen beispielsweise Daten klassifiziert werden können.
  • Ein Beispiel für derartige Algorithmen des maschinellen Lernens sind künstliche neuronale Netze. Derartige künstliche neuronale Netze orientieren sich an biologischen Neuronen und erlauben es, ein unbekanntes Systemverhalten aus vorhandenen Trainingsdaten anzulernen und anschließend das angelernte Systemverhalten auch auf unbekannte Eingangsgrößen anzuwenden. Dabei besteht das neuronale Netz aus Schichten mit idealisierten Neuronen, welche gemäß einer Topologie des Netzes in unterschiedlicher Weise miteinander verbunden sind. Die erste Schicht, welche auch als Eingangsschicht bezeichnet wird, erfasst und überträgt dabei die Eingangswerte, wobei die Anzahl der Neuronen in der Eingangsschicht der Anzahl an Eingangssignalen, welche verarbeitet werden sollen, entspricht. Die letzte Schicht wird auch als Ausgangsschicht bezeichnet und weist genauso viele Neuronen auf, wie Ausgabewerte bereitgestellt werden sollen. Zwischen der Eingangsschicht und der Ausgangsschicht befindet sich zudem wenigstens eine Zwischenschicht, welche oftmals auch als verborgene Schicht bezeichnet wird, wobei die Anzahl der Zwischenschichten und die Anzahl der Neuronen in diesen Schichten abhängig von der konkreten Aufgabe, welche durch das neuronale Netz gelöst werden soll, ist.
  • Bei derartigen künstlichen neuronalen Netzen handelt es sich um Unsicherheiten aufweisende Vorhersagemodelle. Um die Genauigkeit derartiger künstlicher neuronaler Netze zu erhöhen, können dabei neuronale Netz-Ensembles verwendet werden, das heißt einzelne neuronale Netze miteinander kombiniert werden. Derartige neuronale Netz-Ensembles haben den Vorteil, dass mögliche Fehler in dem Algorithmus durch den kombinierten Ansatz herauskorrigiert werden können. Dabei weisen alle künstlichen neuronalen Netze innerhalb eines derartigen neuronalen Netz-Ensembles für gewöhnlich dieselbe Architektur auf.
  • Aus der Druckschrift DE 60 223 007 T2 ist ein Verfahren zum automatischen Extrahieren von Charakteristika aus Bildern bekannt, wobei ein neuronales System trainiert wird, um bei einem Satz von vordefinierten Bildern eine niedrige Klassifizierungsfehlerrate zu erreichen, wobei das neuronale System aus einem Ensemble von neuronalen Netzen, die mehrschichtige Netze aufweisen, besteht, wobei das Trainieren in einem verschiedenartigen neuronalen Netz-Ensemble mit sich unterscheidenden versteckten Knoten der mehrschichtigen Netze resultiert, die versteckten Knoten aus allen versteckten Schichten der trainierten mehrschichtigen Netze extrahiert werden, um Charakteristika der Bilder darzustellen, und ein statistischer Klassifizierer auf diesen Satz von extrahierten Charakteristika angewendet wird, um die Bilder korrekt zu klassifizieren.
  • Der Erfindung liegt die Aufgabe zugrunde, ein verbessertes Verfahren zum Trainieren eines neuronalen Netz-Ensembles vorzusehen.
  • Die Aufgabe wird mit einem Verfahren gemäß den Merkmalen des Patentanspruchs 1 gelöst.
  • Die Aufgabe wird darüber hinaus durch ein Steuergerät mit den Merkmalen des Patentanspruchs 6 gelöst.
  • Ferner wird die Aufgabe mit einem Computerprogramm gemäß Patentanspruchs 11 und einem computerlesbaren Datenträger gemäß Patentanspruch 12 gelöst.
  • Vorteilhafte Ausführungsformen und Weiterbildungen ergeben sich aus den Unteransprüchen sowie aus der Beschreibung unter Bezugnahme auf die Figuren.
  • Offenbarung der Erfindung
  • Gemäß einer Ausführungsform der Erfindung wird diese Aufgabe gelöst durch ein Verfahren zum Trainieren eines neuronalen Netz-Ensembles, wobei das neuronale Netz-Ensemble eine Vielzahl von künstlichen neuronalen Netzen aufweist, und wobei das Verfahren für jedes der Vielzahl von künstlichen neuronalen Netzen ein separates Ermitteln einer optimalen Architektur von zumindest einem Teil des entsprechenden künstlichen Neuronalen Netzes und ein jeweiliges Trainieren der einzelnen künstlichen neuronalen Netze basierend auf Trainingsdaten und der entsprechenden optimalen Architektur aufweist.
  • Künstliche neuronale Netze orientieren sich an biologischen Neuronen und erlauben es, ein unbekanntes Systemverhalten aus vorhandenen Trainingsdaten anzulernen und anschließend das angelernte Systemverhalten auch auf unbekannte Eingangsgrößen anzuwenden. Dabei besteht das neuronale Netz aus Schichten mit idealisierten Neuronen, welche gemäß einer Topologie des Netzes in unterschiedlicher Weise miteinander verbunden sind. Die erste Schicht, welche auch als Eingangsschicht bezeichnet wird, erfasst und überträgt dabei die Eingangswerte, wobei die Anzahl der Neuronen in der Eingangsschicht der Anzahl an Eingangssignalen, welche verarbeitet werden sollen, entspricht. Die letzte Schicht wird auch als Ausgangsschicht bezeichnet und weist genauso viele Neuronen auf, wie Ausgabewerte bereitgestellt werden sollen. Zwischen der Eingangsschicht und der Ausgangsschicht befindet sich zudem wenigstens eine Zwischenschicht, welche oftmals auch als verborgene Schicht bezeichnet wird, wobei die Anzahl der Zwischenschichten und die Anzahl der Neuronen in diesen Schichten abhängig von der konkreten Aufgabe, welche durch das neuronale Netz gelöst werden soll, ist.
  • Durch separates Entwickeln einer optimalen Architektur für jedes der künstlichen neuronalen Netze, beziehungsweise eines optimalen Erscheinungsbildes des entsprechenden künstlichen neuronalen Netzes beziehungsweise der Anzahl der Schichten in dem Netz sowie die Bestimmung der Anzahl und/oder des Typs der Neuronen, kann somit die Performanz der einzelnen künstlichen neuronalen Netze verbessert werden und somit auch die Performanz des gesamten neuronalen Netz-Ensembles, was sich insbesondere bei der Steuerung von sicherheitsgerichteten Systemen, beispielsweise steuerbaren Systemen eines autonom fahrenden Kraftfahrzeuges basierend auf dem neuronalen Netz-Ensemble als vorteilhaft erweist. Insgesamt wird somit ein verbessertes Verfahren zum Trainieren eines neuronalen Netz-Ensembles angegeben, mit welchem ein neuronales Netz-Ensemble mit einer verbesserten Kalibrierung trainiert werden kann.
  • In einer Ausführungsform weist das separate Ermitteln einer optimalen Architektur für den zumindest einen Teil des entsprechenden künstlichen neuronalen Netzes für jedes der Vielzahl von künstlichen neuronalen Netzen dabei jeweils ein Anwenden eines Neural Architecture Search Prozesses auf. Die Entwicklung der Architektur eines künstlichen neuronalen Netzes ist für gewöhnlich ein sehr aufwendiger Prozess, insbesondere im Hinblick auf den Ressourcenverbrauch, beispielsweise Speicher- und Rechenkapazitäten. Um die Entwicklung der Architektur zu optimieren, wurde dabei die Neural Architektur Search (NAS) entwickelt, welche automatisiert optimale Architekturen für spezifische Problemstellungen entwickelt.
  • Der NAS-Algorithmus stellt dabei zunächst aus verschiedenen Bausteinen und Konfigurationen eine Architektur für das künstliche neuronale Netz zusammen, welche anschließend mit einem Satz Trainingsdaten, beispielsweise Sensordaten, trainiert wird, und wobei erhaltene Ergebnisse anschließend im Hinblick auf die Performanz evaluiert werden. Basierend auf dieser Bewertung kann anschließend eine neue, im Hinblick auf die Performanz voraussichtlich optimalere Architektur ermittelt werden, welche anschließend wiederum basierend auf den Trainingsdaten trainiert wird, und wobei die erhaltenen Ergebnisse anschließend wiederum im Hinblick auf die Performanz evaluiert werden. Diese Schritte können dabei so oft wiederholt werden, bis keine Verbesserung mehr durch Veränderungen der Architektur erzielbar ist. Ein derartiges Verfahren hat somit den Vorteil, dass Computerressourcen eingespart werden können und das Verfahren auch auf Steuergeräten mit vergleichsweise geringen Ressourcen, beispielsweise Speicher- oder Rechenkapazitäten, ausgeführt werden kann.
  • Auch kann, für jedes der Vielzahl von künstlichen neuronalen Netzen, der wenigstens eine Teil des entsprechenden künstlichen neuronalen Netzes jeweils aus Wiederholungen einer jeweiligen beziehungsweise entsprechenden Subkomponente zusammengesetzt werden, wobei das separate Ermitteln einer optimalen Architektur für den zumindest einen Teil des entsprechenden künstlichen neuronalen Netzes für jedes der Vielzahl von künstlichen neuronalen Netzen jeweils ein Ermitteln einer optimalen Architektur für die jeweilige Subkomponente aufweist.
  • Unter einer sich wiederholenden Subkomponente wird hierbei eine Komponente beziehungsweise Zelle des entsprechenden künstlichen neuronalen Netzes verstanden, welche sich mehrmals wiederholt und welche insbesondere immer wieder verwendet werden kann. Die Subkomponente kann dabei beispielsweise mehrmals übereinander gestapelt werden um ein ganzes neuronales Netz zu ergeben.
  • Dabei ist es einfacher, einzelne Komponenten beziehungsweise Zellen eines künstlichen neuronalen Netzes zu optimieren, als das komplette künstliche neuronale Netz. Zudem kann dies wiederum mit einem vergleichsweise geringen Ressourcenverbrauch erfolgen.
  • Dabei können die einzelnen Subkomponenten jeweils eine Vielzahl von Knoten und gerichteten Kanten aufweisen, wobei jede Kante jeweils zwei Knoten miteinander verbindet, und wobei jede Kante eine Transferfunktion zwischen den entsprechenden Knoten symbolisiert, und wobei das Ermitteln einer optimalen Architektur für die jeweilige Subkomponente für jeden der Vielzahl von Klassifizieren ein Bestimmen einer optimalen Transferfunktion zwischen je zwei Knoten der Subkomponente aufweist.
  • Unter Verwendung eines Graphen können die Neuronen innerhalb eines künstlichen neuronalen Netzes als Knoten dargestellt werden und die Verbindungen zwischen den einzelnen Neuronen als Kanten. Die Kanten repräsentieren dabei weiter Transferfunktionen zwischen den einzelnen Knoten, das heißt Funktionen basierend auf welchen entsprechende Daten zwischen den einzelnen Knoten umgewandelt werden. Unter optimaler Transferfunktion wird dabei die Transferfunktion aus der Menge von allen möglichen Transferfunktionen, welche am effektivsten für die Architektur beziehungsweise das Ensemble ist, beziehungsweise mit welcher die beste Performanz erzielt werden kann.
  • Basierend auf entsprechenden optimalen Transferfunktionen kann dann jeweils auf einfache Art und Weise ein relativ einfacher Aufbau der Subkomponenten und damit auch der einzelnen künstlichen neuronalen Netze beziehungsweise des neuronalen Netz-Ensembles realisiert werden, bei gleichzeitig geringem Ressourcenverbrauch, beispielsweise von Speicher- und Rechenkapazitäten.
  • Die Trainingsdaten können ferner Sensordaten aufweisen, so dass auch Gegebenheiten außerhalb einer die entsprechenden Trainingsprozesse ausführenden Datenverarbeitungsanlage berücksichtigt werden. Bei den Sensoren kann es sich dabei insbesondere um in ein autonom fahrendes Kraftfahrzeug integrierte Sensoren handeln und/oder um an einem autonom fahrenden Kraftfahrzeug angebrachte Sensoren.
  • Mit einer weiteren Ausführungsform der Erfindung wird ferner auch ein Verfahren zum Klassifizieren von Bilddaten angegeben, wobei Bilddaten unter Verwendung eines neuronalen Netz-Ensembles klassifiziert werden, und wobei das neuronale Netz-Ensemble unter Verwendung eines obenstehend beschriebenen Verfahrens trainiert wurde.
  • Insbesondere kann das Verfahren dabei verwendet werden, um Bilddaten, insbesondere digitale Bilddaten auf der Grundlage von Low-level-Merkmalen, beispielsweise Kanten oder Pixelattributen, zu klassifizieren. Dabei kann weiter ein Bildverarbeitungsalgorithmus verwendet werden, um ein Klassifizierungsergebnis, welches sich auf entsprechende Low-Ievel Merkmale konzentriert, zu analysieren.
  • Insgesamt wird somit ein Verfahren zum Klassifizieren von Bilddaten angegeben, welches auf einem verbesserten Verfahren zum Trainieren eines neuronalen Netz-Ensembles basiert. Durch separates Entwickeln einer optimalen Architektur für jedes der künstlichen neuronalen Netze, beziehungsweise eines optimalen Erscheinungsbildes des entsprechenden künstlichen neuronalen Netzes beziehungsweise der Anzahl der Schichten in dem Netz sowie die Bestimmung der Anzahl und/oder des Typs der Neuronen, kann dabei die Performanz der einzelnen künstlichen neuronalen Netze verbessert werden und somit auch die Performanz des gesamten neuronalen Netz-Ensembles.
  • Mit einer weiteren Ausführungsform der Erfindung wird weiter auch ein Steuergerät zum Trainieren eines neuronalen Netz-Ensembles angegeben, welches ausgebildet ist, ein obenstehend beschriebenes Verfahren zum Trainieren eines neuronalen Netz-Ensembles auszuführen.
  • Ein derartiges Steuergerät hat den Vorteil, dass dieses ausgebildet ist, ein verbessertes Verfahren zum Trainieren eines neuronalen Netz-Ensembles auszuführen und insbesondere ein Verfahren, bei welchem durch separates Entwickeln einer optimalen Architektur für jedes der künstlichen neuronalen Netze, beziehungsweise eines optimalen Erscheinungsbildes des entsprechenden künstlichen neuronalen Netzes beziehungsweise der Anzahl der Schichten in dem Netz sowie die Bestimmung der Anzahl und/oder des Typs der Neuronen, die Performanz der einzelnen künstlichen neuronalen Netze verbessert werden kann und somit auch die Performanz des gesamten neuronalen Netz-Ensembles, was sich insbesondere bei der Steuerung von sicherheitsgerichteten Systemen, beispielsweise steuerbaren Systemen eines autonom fahrenden Kraftfahrzeuges basierend auf dem neuronalen Netz-Ensemble als vorteilhaft erweist.
  • Mit einer weiteren Ausführungsform der Erfindung wird auch ein Steuergerät zum Klassifizieren von Bilddaten angegeben, wobei das Steuergerät eine Empfangseinheit, welche ausgebildet ist, ein durch ein obenstehend beschriebenes Steuergerät zum Trainieren eines neuronalen Netz-Ensembles bereitgestelltes trainiertes neuronales Netz-Ensemble zu empfangen, und eine Steuereinheit, welche ausgebildet ist, Bilddaten basierend auf dem neuronalen Netz-Ensemble zu klassifizieren, aufweist.
  • Insbesondere kann das Steuergerät dabei wiederum verwendet werden, um Bilddaten, insbesondere digitale Bilddaten auf der Grundlage von Low-Ievel-Merkmalen, beispielsweise Kanten oder Pixelattributen, zu klassifizieren. Dabei kann weiter ein Bildverarbeitungsalgorithmus verwendet werden, um ein Klassifizierungsergebnis, welches sich auf entsprechende Low-Ievel Merkmale konzentriert, zu analysieren.
  • Insgesamt wird somit ein Steuergerät zum Klassifizieren von Bilddaten angegeben, welches auf einem verbesserten Verfahren zum Trainieren eines neuronalen Netz-Ensembles basiert. Durch separates Entwickeln einer optimalen Architektur für jedes der künstlichen neuronalen Netze, beziehungsweise eines optimalen Erscheinungsbildes des entsprechenden künstlichen neuronalen Netzes beziehungsweise der Anzahl der Schichten in dem Netz sowie die Bestimmung der Anzahl der Neuronen, kann dabei die Performanz der einzelnen künstlichen neuronalen Netze verbessert werden und somit auch die Performanz des gesamten neuronalen Netz-Ensembles.
  • Mit einer weiteren Ausführungsform der Erfindung wird auch ein System zum Klassifizieren von Bilddaten angegeben, wobei das System ein obenstehend beschriebenes Steuergerät zum Trainieren eines neuronalen Netz-Ensembles und ein obenstehend beschriebenes Steuergerät zum Klassifizieren von Bilddaten aufweist, wobei das Steuergerät zum Klassifizieren von Bilddaten ausgebildet ist, Bilddaten basierend auf einem durch das Steuergerät zum Trainieren eines neuronalen Netz-Ensembles trainierten neuronalen Netz-Ensemble zu klassifizieren.
  • Insgesamt wird somit ein System zum Klassifizieren von Bilddaten angegeben, welches auf einem verbesserten Verfahren zum Trainieren eines neuronalen Netz-Ensembles basiert. Durch separates Entwickeln einer optimalen Architektur für jedes der künstlichen neuronalen Netze, beziehungsweise eines optimalen Erscheinungsbildes des entsprechenden künstlichen neuronalen Netzes beziehungsweise der Anzahl der Schichten in dem Netz sowie die Bestimmung der Anzahl der Neuronen, kann dabei die Performanz der einzelnen künstlichen neuronalen Netze verbessert werden und somit auch die Performanz des gesamten neuronalen Netz-Ensembles.
  • Mit einer weiteren Ausführungsform der Erfindung wird weiter auch Kraftfahrzeug angegeben, wobei das Kraftfahrzeug ein obenstehend beschriebenes System zum Klassifizieren von Bilddaten aufweist.
  • Somit wird ein Kraftfahrzeug angegeben, welches ein System zum Klassifizieren von Bilddaten aufweist, welches auf einem verbesserten Verfahren zum Trainieren eines neuronalen Netz-Ensembles basiert. Durch separates Entwickeln einer optimalen Architektur für jedes der künstlichen neuronalen Netze, beziehungsweise eines optimalen Erscheinungsbildes des entsprechenden künstlichen neuronalen Netzes beziehungsweise der Anzahl der Schichten in dem Netz sowie die Bestimmung der Anzahl und/oder des Typs der Neuronen, kann dabei die Performanz der einzelnen künstlichen neuronalen Netze verbessert werden und somit auch die Performanz des gesamten neuronalen Netz-Ensembles.
  • Bei dem Kraftfahrzeug kann es sich dabei insbesondere um ein autonom fahrendes Kraftfahrzeug handeln, wobei beispielsweise Helligkeitsbeziehungsweise Farbinformationen über Fahrzeugleuchten von sich in einer Umgebung des autonom fahrenden Kraftfahrzeuges befindlichen weiteren Kraftfahrzeugen erfasst werden, die erfassten Informationen unter Verwendung eines basierend auf während zurückliegender Fahrten mit dem autonom fahrenden Kraftfahrzeug gesammelten Helligkeits- beziehungsweise Farbinformationen über Fahrzeugleuchten von weiteren Kraftfahrzeugen trainierten neuronalen Netz-Ensembles ausgewertet werden und basierend auf der Auswertung entsprechende Aktionen, beispielsweise sicherheitsgerichtete Aktionen initiiert werden können.
  • Mit einer weiteren Ausführungsform der Erfindung wird zudem auch Computerprogramm mit Programmcode, um ein obenstehend beschriebenes Verfahren zum Trainieren eines neuronalen Netz-Ensembles auszuführen, wenn das Computerprogramm auf einem Computer ausgeführt wird, angegeben.
  • Mit einer weiteren Ausführungsform der Erfindung wird ferner auch ein computerlesbarer Datenträger Programmcode eines Computerprogramms, um ein obenstehend beschriebenes Verfahren zum Trainieren eines neuronalen Netz-Ensembles auszuführen, wenn das Computerprogramm auf einem Computer ausgeführt wird, angegeben.
  • Ein derartiges Computerprogramm beziehungsweise ein derartiger computerlesbarer Datenträger haben den Vorteil, dass mit diesen jeweils ein verbessertes Verfahren zum Trainieren eines neuronalen Netz-Ensembles ausgeführt werden kann und insbesondere ein Verfahren, bei welchem durch separates Entwickeln einer optimalen Architektur für jedes der künstlichen neuronalen Netze, beziehungsweise eines optimalen Erscheinungsbildes des entsprechenden künstlichen neuronalen Netzes beziehungsweise der Anzahl der Schichten in dem Netz sowie die Bestimmung der Anzahl der Neuronen, die Performanz der einzelnen künstlichen neuronalen Netze verbessert werden kann und somit auch die Performanz des gesamten neuronalen Netz-Ensembles, was sich insbesondere bei der Steuerung von sicherheitsgerichteten Systemen, beispielsweise steuerbaren Systemen eines autonom fahrenden Kraftfahrzeuges basierend auf dem neuronalen Netz-Ensemble als vorteilhaft erweist.
  • Zusammenfassend ist festzustellen, dass mit der vorliegenden Erfindung ein verbessertes Verfahren zum Trainieren eines neuronalen Netz-Ensembles angegeben wird. Die beschriebenen Ausgestaltungen und Weiterbildungen lassen sich beliebig miteinander kombinieren.
  • Weitere mögliche Ausgestaltungen, Weiterbildungen und Implementierungen der Erfindung umfassen auch nicht explizit genannte Kombinationen von zuvor oder im Folgenden bezüglich der Ausführungsbeispiele beschriebenen Merkmale der Erfindung.
  • Kurze Beschreibung der Zeichnungen
  • Die beiliegenden Zeichnungen sollen ein weiteres Verständnis der Ausführungsformen der Erfindung vermitteln. Sie veranschaulichen Ausführungsformen und dienen im Zusammenhang mit der Beschreibung der Erklärung von Prinzipien und Konzepten der Erfindung.
  • Andere Ausführungsformen und viele der genannten Vorteile ergeben sich im Hinblick auf die Zeichnungen. Die dargestellten Elemente der Zeichnungen sind nicht notwendigerweise maßstabsgetreu zueinander gezeigt.
  • Es zeigen:
    • 1 ein Beispiel eines neuronalen Netz-Ensembles;
    • 2 ein Flussdiagramm eines Verfahrens zum Trainieren eines neuronalen Netz-Ensembles gemäß Ausführungsformen der Erfindung;
    • 3 ein Blockschaltbild eines Systems zum Klassifizieren von Bilddaten gemäß Ausführungsformen der Erfindung.
  • In den Figuren der Zeichnungen bezeichnen gleiche Bezugszeichen gleiche oder funktionsgleiche Elemente, Bauteile oder Komponenten, soweit nichts Gegenteiliges angegeben ist.
  • 1 zeigt ein Beispiel eines neuronalen Netz-Ensembles 1. Um die Genauigkeit von künstlichen neuronalen Netzen zu erhöhen, können neuronale Netz-Ensembles verwendet werden, das heißt einzelne neuronale Netze miteinander kombiniert werden.
  • In dem gezeigten Beispiel sind dabei drei Klassifizierer 2 zusammengefasst, wobei jeder der Klassifizierer 2 ein mehrschichtiges künstliches neuronales Netz 3 aufweist.
  • Gemäß dem Beispiel der 1 weisen die einzelnen künstlichen neuronalen Netze 3 dabei jeweils einen ersten Teil 4, welcher für alle künstlichen neuronalen Netze gleich ist und einen an den ersten Teil 4 anschließenden zweiten Teil 5 auf, welche für alle künstlichen neuronalen Netze 3 unterschiedlich sein kann. Der erste Teil kann dabei beispielsweise jeweils zwei Drittel des gesamten künstlichen neuronalen Netzes 3 ausmachen.
  • Dabei werden die Ergebnisse der Klassifizierung durch die einzelnen Klassifizierer, welche entsprechende Wahrscheinlichkeiten aufweisen können, weiter zusammengefasst, um einen Durchschnitt aus diesen Ergebnissen zu bilden. Durch diese Durchschnittsbildung sollen die Ergebnisse der Klassifizierung sowie der Performanz der einzelnen künstlichen neuronalen Netze verbessert werden und können mögliche Fehler in dem Algorithmus des maschinellen Lernens durch den kombinierten Ansatz beziehungsweise die Kombination einzelner Klassifizierer herausgefiltert werden.
  • Dabei weisen alle künstlichen neuronalen Netze 3 und insbesondere auch die zweiten Teile 5 der einzelnen künstlichen neuronalen Netze 3 für gewöhnlich jeweils dieselbe Architektur auf.
  • 2 zeigt ein Flussdiagramm eines Verfahrens 10 zum Trainieren eines neuronalen Netz-Ensembles gemäß Ausführungsformen der Erfindung.
  • Insbesondere zeigt 2 ein Flussdiagramm eines Verfahrens 10 zum Trainieren eines neuronalen Netz-Ensembles, wobei das neuronale Netz-Ensemble eine Vielzahl von künstlichen neuronalen Netzen aufweist.
  • Wie 2 zeigt, weist das Verfahren 10 dabei einen Schritt 11 eines separaten Ermittelns einer optimalen Architektur von zumindest einem Teil des entsprechenden künstlichen neuronalen Netzes für jedes der Vielzahl von künstlichen neuronalen Netzen auf, wobei die einzelnen künstlichen neuronalen Netze anschließend in einem Schritt 12 basierend auf der ermittelten jeweiligen optimalen Architektur und Trainingsdaten trainiert werden.
  • Durch separates Entwickeln einer optimalen Architektur für jedes der künstlichen neuronalen Netze, beziehungsweise eines optimalen Erscheinungsbildes des entsprechenden künstlichen neuronalen Netzes beziehungsweise der Anzahl der Schichten in dem Netz sowie die Bestimmung der Anzahl und/oder des Typs der Neuronen, kann dabei die Performanz der einzelnen künstlichen neuronalen Netze verbessert werden und somit auch die Performanz des gesamten neuronalen Netz-Ensembles, was sich insbesondere bei der Steuerung von sicherheitsgerichteten Systemen, beispielsweise steuerbaren Systemen eines autonom fahrenden Kraftfahrzeuges basierend auf dem neuronalen Netz-Ensemble als vorteilhaft erweist. Insgesamt wird somit ein verbessertes Verfahren 10 zum Trainieren eines neuronalen Netz-Ensembles angegeben.
  • Gemäß den Ausführungsformen der 2 weist der Schritt 11 des separaten Ermittelns einer optimalen Architektur für den zumindest einen Teil des entsprechenden künstlichen neuronalen Netzes für jedes der Vielzahl von künstlichen neuronalen Netzen jeweils ein Anwenden eines Neural Architecture Search Prozesses auf. Hierdurch können Ressourcen bei der Ermittlung der einzelnen optimalen Architekturen, beispielsweise Speicher- und Rechenkapazität, eingespart werden, so dass das Verfahren auch auf Steuergeräten mit vergleichsweise geringen Speicher- und Rechenkapazitäten ausgeführt werden kann.
  • Beispielsweise kann dabei ein Forward Architecture Search Prozess, oder ein Differentiable Search Prozess wie PC-Darts oder Dirichlet NAS angewendet werden.
  • Insbesondere wird dabei, gemäß den Ausführungsformen der 2, für jedes der Vielzahl von künstlichen neuronalen Netzen der wenigstens eine Teil des entsprechenden künstlichen neuronalen Netzes jeweils aus Wiederholungen einer jeweiligen beziehungsweise entsprechenden Subkomponente zusammengesetzt, wobei das separate Ermitteln einer optimalen Architektur für den zumindest einen Teil des entsprechenden künstlichen neuronalen Netzes für jedes der Vielzahl von künstlichen neuronalen Netzen jeweils ein Ermitteln einer optimalen Architektur für die jeweilige Subkomponente aufweist.
  • Dabei können anfangs mehrere, auf jeweils unterschiedlichen Transferfunktionen basierenden Verbindungen zwischen je zwei Knoten vorgesehen sein, wobei alle Transferfunktionen zunächst alle die gleiche Auswahlwahrscheinlichkeit aufweisen. Während des Trainierens beziehungsweise des Optimierens der Subkomponente kristallisiert sich dann heraus, welche dieser Transferfunktionen mit einer größeren Wahrscheinlichkeit als andere Transferfunktionen zwischen den beiden Knoten angewendet werden, wobei schlussendlich die Transferfunktion, welche die höchste Auswahlwahrscheinlichkeit aufweist, ausgewählt wird und in der optimierten Subkomponente die einzige Verbindung zwischen den beiden Knoten darstellt.
  • Basierend auf entsprechenden optimalen Transferfunktionen kann dann jeweils auf einfache Art und Weise ein relativ einfacher Aufbau der Subkomponenten und damit auch der einzelnen künstlichen neuronalen Netze beziehungsweise des neuronalen Netz-Ensembles realisiert werden, bei gleichzeitig geringem Ressourcenverbrauch, beispielsweise von Speicher- und Rechenkapazitäten.
  • Bei den Trainingsdaten handelt es sich dabei ferner wiederum um Sensordaten.
  • 3 zeigt ein Blockschaltbild eines Systems 20 zum Klassifizieren von Bilddaten gemäß Ausführungsformen der Erfindung.
  • Wie 3 zeigt, weist das System 20 dabei ein Steuergerät 21 zum Trainieren eines neuronalen Netz-Ensembles und ein Steuergerät 22 zum Klassifizieren von Bilddaten auf, wobei das Steuergerät 22 zum Klassifizieren von Bilddaten ausgebildet ist, Bilddaten basierend auf einem durch das Steuergerät 21 zum Trainieren eines neuronalen Netz-Ensembles trainierten neuronalen Netz-Ensembles zu klassifizieren. Das trainierte neuronale Netz-Ensemble kann dabei drahtgebunden oder drahtlos an das Steuergerät 22 zum Klassifizieren von Bilddaten übermittelt werden.
  • Gemäß den Ausführungsformen der 3 weist das Steuergerät 21 zum Trainieren eines neuronalen Netz-Ensembles dabei eine Ermittlungseinheit 23, welche ausgebildet ist, für jedes künstliche Netz einer Vielzahl von künstlichen neuronalen Netzen in dem neuronalen Netz-Ensemble separat eine optimale Architektur von zumindest einem Teil des entsprechenden künstlichen Neuronalen Netzes zu ermitteln und eine Trainingseinheit 24, welche ausgebildet ist, die einzelnen künstlichen neuronalen Netze innerhalb des neuronalen Netz-Ensembles basierend auf Trainingsdaten, beispielsweise Sensordaten, und der entsprechenden ermittelten Architektur zu trainieren.
  • Die Ermittlungseinheit und die Trainingseinheit können ferner jeweils beispielsweise basierend auf in einem Speicher hinterlegten und durch einen Prozessor ausführbaren Code realisiert werden.
  • Das Steuergerät 22 zum Klassifizieren von Bilddaten weist zudem eine Empfangseinheit 25 zum Empfangen eines durch das Steuergerät 21 zum Trainieren eines neuronalen Netz-Ensembles trainierten künstlichen neuronalen Netzes auf, sowie eine Steuereinheit 26, welche ausgebildet ist, Bilddaten basierend auf dem empfangenen neuronalen Netz-Ensemble zu klassifizieren, auf.
  • Bei der Empfangseinheit kann es sich dabei beispielsweise um einen Receiver, welcher ausgebildet ist, entsprechende Informationen zu empfangen, handeln. Die Steuereinheit kann dabei wiederum beispielsweise basierend auf in einem Speicher hinterlegten und durch einen Prozessor ausführbaren Code realisiert werden.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • DE 60223007 T2 [0005]

Claims (10)

  1. Vorrichtung zum Trainieren eines neuronalen Netz-Ensembles, wobei das neuronale Netz-Ensemble eine Vielzahl von künstlichen neuronalen Netzen aufweist, wobei die Vorrichtung ein maschinenlesbares Speichermedium umfasst, auf dem Befehle gespeichert sind, die beim Ausführen durch einen Computer bewirkten, dass der Computer ein Verfahren (10) mit folgenden Schritte ausführt: - für jedes der Vielzahl von künstlichen neuronalen Netzen, separates Ermitteln einer optimalen Architektur von zumindest einem Teil des entsprechenden künstlichen Neuronalen Netzes aufweist (11); und - jeweiliges Trainieren der einzelnen künstlichen neuronalen Netze basierend auf Trainingsdaten und der entsprechenden optimalen Architektur (12).
  2. Vorrichtung nach Anspruch 1, wobei die gespeicherten Befehle derart ausgebildet sind, dass das Verfahren, das der Computer ausführt, wenn diese Befehle auf dem Computer ausgeführt werden, derart abläuft, dass der Schritt des separaten Ermittelns einer optimalen Architektur für den zumindest einen Teil des entsprechenden künstlichen neuronalen Netzes für jedes der Vielzahl von künstlichen neuronalen Netzen (11) jeweils ein Anwenden eines Neural Architecture Search Prozesses aufweist.
  3. Vorrichtung nach Anspruch 1 oder 2, wobei die gespeicherten Befehle derart ausgebildet sind, dass das Verfahren, das der Computer ausführt, wenn diese Befehle auf dem Computer ausgeführt werden, derart abläuft, dass für jedes der Vielzahl von künstlichen neuronalen Netzen der wenigstens eine Teil des entsprechenden künstlichen neuronalen Netzes jeweils aus Wiederholungen einer jeweiligen Subkomponente zusammengesetzt wird, und wobei der Schritt des separaten Ermittelns einer optimalen Architektur für den zumindest einen Teil des entsprechenden künstlichen neuronalen Netzes für jedes der Vielzahl von künstlichen neuronalen Netzen (11) jeweils ein Ermitteln einer optimalen Architektur für die jeweilige Subkomponente aufweist.
  4. Vorrichtung nach Anspruch 3, wobei die gespeicherten Befehle derart ausgebildet sind, dass das Verfahren, das der Computer ausführt, wenn diese Befehle auf dem Computer ausgeführt werden, derart abläuft, dass die jeweiligen Subkomponenten jeweils eine Vielzahl von Knoten und Kanten aufweisen, wobei jede Kante jeweils zwei Knoten miteinander verbindet, und wobei jede Kante eine Transferfunktion zwischen den entsprechenden Knoten symbolisiert, und wobei das Ermitteln einer optimalen Architektur für die jeweilige Subkomponente ein Bestimmen einer optimalen Transferfunktion zwischen je zwei Knoten der Subkomponente aufweist.
  5. Vorrichtung nach einem der Ansprüche 1 bis 4, wobei die Trainingsdaten Sensordaten aufweisen.
  6. Vorrichtung zur Klassifizierung von Bilddaten, wobei die Bilddaten unter Verwendung eines neuronalen Netz-Ensembles klassifiziert werden, und wobei das neuronale Netz-Ensemble unter Verwendung der Vorrichtung nach einem der Ansprüche 1 bis 5 trainiert wurde.
  7. Steuergerät zum Trainieren eines neuronalen Netz-Ensembles, wobei das neuronale Netz-Ensemble eine Vielzahl von künstlichen neuronalen Netzen aufweist, und wobei das Steuergerät (21) die Vorrichtung nach einem der Ansprüche 1 bis 5 aufweist.
  8. Steuergerät zum Klassifizieren von Bilddaten, wobei das Steuergerät (22) eine Empfangseinheit (25), welche ausgebildet ist, ein durch ein Steuergerät (21) zum Trainieren eines neuronalen Netz-Ensembles nach Anspruch 7 bereitgestelltes trainiertes neuronales Netz-Ensemble zu empfangen, und eine Steuereinheit (26), welche ausgebildet ist, Bilddaten basierend auf dem neuronalen Netz-Ensemble zu klassifizieren, aufweist.
  9. System zum Klassifizieren von Bilddaten, wobei das System (20) ein Steuergerät (21) zum Trainieren eines neuronalen Netz-Ensembles nach Anspruch 7 und ein Steuergerät (22) zum Klassifizieren von Bilddaten nach Anspruch 8 aufweist, wobei das Steuergerät (22) zum Klassifizieren von Bilddaten ausgebildet ist, Bilddaten basierend auf einem durch das Steuergerät (21) zum Trainieren eines neuronalen Netz-Ensembles trainierten neuronalen Netz-Ensembles zu klassifizieren.
  10. Kraftfahrzeug, wobei das Kraftfahrzeug ein System zum Klassifizieren von Bilddaten nach Anspruch 9 aufweist.
DE202021103699.0U 2021-07-09 2021-07-09 Vorrichtung zum Trainieren eines neuronalen Netz-Ensembles Active DE202021103699U1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE202021103699.0U DE202021103699U1 (de) 2021-07-09 2021-07-09 Vorrichtung zum Trainieren eines neuronalen Netz-Ensembles

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE202021103699.0U DE202021103699U1 (de) 2021-07-09 2021-07-09 Vorrichtung zum Trainieren eines neuronalen Netz-Ensembles

Publications (1)

Publication Number Publication Date
DE202021103699U1 true DE202021103699U1 (de) 2021-07-26

Family

ID=77271476

Family Applications (1)

Application Number Title Priority Date Filing Date
DE202021103699.0U Active DE202021103699U1 (de) 2021-07-09 2021-07-09 Vorrichtung zum Trainieren eines neuronalen Netz-Ensembles

Country Status (1)

Country Link
DE (1) DE202021103699U1 (de)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60223007T2 (de) 2002-07-05 2008-07-31 Honda Research Institute Europe Gmbh Benutzung von Gruppendiversität zur automatischen Bestimmung von Merkmalen

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60223007T2 (de) 2002-07-05 2008-07-31 Honda Research Institute Europe Gmbh Benutzung von Gruppendiversität zur automatischen Bestimmung von Merkmalen

Similar Documents

Publication Publication Date Title
EP3785177B1 (de) Verfahren und vorrichtung zum ermitteln einer netzkonfiguration eines neuronalen netzes
DE102014223220A1 (de) Lernvorrichtung, Lernprogramm und Lernverfahren
WO2019001649A1 (de) Wissenstransfer zwischen verschiedenen deep-learning architekturen
DE102010038567A1 (de) Bilderkennungsvorrichtung mit mehreren Klassifizierern
EP1180258A1 (de) Mustererkennung mittels prüfung zusätzlicher merkmale nach teilverarbeitung
DE102018113621A1 (de) Verfahren zum Trainieren eines konvolutionellen neuronalen Netzwerks zum Verarbeiten von Bilddaten zur Anwendung in einem Fahrunterstützungssystem
EP3748454B1 (de) Verfahren und vorrichtung zum automatischen ausführen einer steuerfunktion eines fahrzeugs
DE102019129029A1 (de) System und verfahren zur objektdetektion
DE202021103699U1 (de) Vorrichtung zum Trainieren eines neuronalen Netz-Ensembles
DE102018220608A1 (de) Maschinelles Lernsystem, sowie ein Verfahren, ein Computerprogramm und eine Vorrichtung zum Erstellen des maschinellen Lernsystems
DE102021207274A1 (de) Verfahren zum Trainieren eines neuronalen Netz-Ensembles
DE102015205720A1 (de) System zum Analysieren nichtklassifizierter Kraftfahrzeugfehlerdaten
DE102019127622B4 (de) Abwehrgenerator, Verfahren zur Verhinderung eines Angriffs auf eine KI-Einheit und computerlesbares-Speichermedium
DE102021201833A1 (de) Vorrichtung zur Verarbeitung von mindestens einem Eingangsdatensatz unter Verwendung eines neuronalen Netzes sowie Verfahren
DE102020208765A1 (de) Bildklassifikator mit variablen rezeptiven Feldern in Faltungsschichten
DE202021103700U1 (de) Vorrichtung zum Erzeugen eines künstlichen neuronalen Netzes
EP3973466A1 (de) Verfahren zum funktionsspezifischen robustifizieren eines neuronalen netzes
DE102021109169A1 (de) Verfahren zum Trainieren eines neuronalen Netzes
DE102021207275A1 (de) Verfahren zum Erzeugen eines künstlichen neuronalen Netzes
DE4404775C1 (de) Verfahren zum Betrieb eines hybriden neuronalen Netzwerks zur automatischen Objekterkennung
DE202021101979U1 (de) Vorrichtung zum Trainieren eines neuronalen Netzes
DE202022103792U1 (de) Vorrichtung zum Bestimmen einer optimalen Architektur eines künstlichen neuronalen Netzes
DE102021115879A1 (de) Verfahren zum Bereitstellen eines komprimierten neuronalen Netzes
DE202022102072U1 (de) Vorrichtung zum Trainieren eines Algorithmus des maschinellen Lernens unter Berücksichtigung von wenigstens einer Ungleichheitsbedingung
DE102022212902A1 (de) Verfahren zum Trainieren eines künstlichen neuronalen Netzes

Legal Events

Date Code Title Description
R081 Change of applicant/patentee

Owner name: ROBERT BOSCH GESELLSCHAFT MIT BESCHRAENKTER HA, DE

Free format text: FORMER OWNER: ROBERT BOSCH GESELLSCHAFT MIT BESCHRAENKTER HAFTUNG, 70469 STUTTGART, DE

Owner name: ALBERT-LUDWIGS-UNIVERSITAET FREIBURG, KOERPERS, DE

Free format text: FORMER OWNER: ROBERT BOSCH GESELLSCHAFT MIT BESCHRAENKTER HAFTUNG, 70469 STUTTGART, DE

R082 Change of representative

Representative=s name: PATENTANWAELTE JOACHIM BEE, PETER MOELDNER, DE

R207 Utility model specification