WO2022194679A1

WO2022194679A1 - Semantische bildsegmentierung eines bilddatenstroms

Info

Publication number: WO2022194679A1
Application number: PCT/EP2022/056249
Authority: WO
Inventors: Volker Patricio Schomerus
Original assignee: Volkswagen Aktiengesellschaft
Priority date: 2021-03-18
Filing date: 2022-03-10
Publication date: 2022-09-22

Abstract

Gemäß einem Verfahren zur semantischen Bildsegmentierung werden aufeinanderfolgende Bilder (5a, 5b) erhalten, die zugehörigen Aufnahmezeiträumen entsprechen. Auf jedes der Bilder (5a, 5b) wird ein erster Teil eines Algorithmus zur semantischen Bildsegmentierung angewendet, um für eine jeweilige erste Wahrscheinlichkeitsverteilung (1) betreffend eine erste Objektklasse einer Vielzahl vorgegebener Objektklassen zu erzeugen. Für jedes der Bilder (5a, 5b) wird auch ein optischer Fluss (8) bestimmt. Eines der Bilder (5a) wird als nicht fehlerhaft identifiziert und ein auf das nicht fehlerhafte Bild (5a) folgendes der Bilder (5b) wird als fehlerhaft identifiziert. Eine geschätzte erste Wahrscheinlichkeitsverteilung (11) für das fehlerhafte Bild (5b) wird erzeugt, indem wenigstens ein Teil der ersten Wahrscheinlichkeitsverteilung für das nicht fehlerhafte Bild (5a) abhängig von dem optischen Fluss (8) für das nicht fehlerhafte Bild (5b) verschoben wird. Abhängig von der geschätzten ersten Wahrscheinlichkeitsverteilung (11) wird ein semantisch segmentiertes Bild (12) für den Aufnahmezeitraum des fehlerhaften Bildes (5b) erzeugt.

Description

Beschreibung

Semantische Bildsegmentierung eines Bilddatenstroms

Die vorliegende Erfindung betrifft ein computerimplementiertes Verfahren zur semantischen Bildsegmentierung, wobei eine Vielzahl aufeinanderfolgender Bilder erhalten wird, wobei jedes der Bilder einem zugehörigen Aufnahmezeitintervall entspricht. Eine Vielzahl vorgegebener Objektklassen enthält eine erste Objektklasse sowie eine zweite Objektklasse. Auf jedes der Bilder wird ein erster Teil eines Algorithmus zur semantischen Bildsegmentierung angewendet, um für jedes der Bilder eine zugehörige erste Wahrscheinlichkeitsverteilung betreffend die erste Objektklasse zu erzeugen. Die Erfindung betrifft ferner ein Verfahren zur wenigstens teilweise automatischen Steuerung eines Fahrzeugs, ein elektronisches Fahrzeugsteuerungssystem, ein Kraftfahrzeug sowie Computerprogrammprodukte.

Im Dokument US 2020/0090322 A1 wird beschrieben, wie ein neuronales Netzwerk zur Erkennung von Sensorblindheit trainiert werden kann. Unter Verwendung von Sensordaten kann das neuronale Netzwerk die Positionen von blinden oder beeinträchtigten Bildbereichen berechnen und charakterisieren. Darüber hinaus kann das neuronale Netzwerk Vorhersagen dahingehend treffen, ob die Sensordaten zum Ausführen von teilautonomen oder autonomen Fahrfunktionen geeignet sind. Sensordaten, die nicht entsprechend geeignet sind, können herausgefiltert werden.

Es ist eine Aufgabe der vorliegenden Erfindung, ein verbessertes Konzept zur semantischen Bildsegmentierung eines Bilddatenstroms anzugeben, durch das die Zuverlässigkeit des Ergebnisses der semantischen Segmentierung auch bei Vorliegen fehlerhafter Bilder verbessert wird.

Diese Aufgabe wird gelöst durch den jeweiligen Gegenstand der unabhängigen Ansprüche. Vorteilhafte Weiterbildungen und bevorzugte Ausführungsformen sind Gegenstand der abhängigen Ansprüche.

Das verbesserte Konzept beruht auf der Idee, für ein fehlerhaftes Bild eine Wahrscheinlichkeitsverteilung für eine Objektklasse zu schätzen, indem eine entsprechende Wahrscheinlichkeitsverteilung für ein früheres Bild abhängig von einem optischen Fluss verschoben wird. So wird verhindert, dass eine Unterbrechung oder Lücken im Bilddatenstrom entstehen.

Gemäß dem verbesserten Konzept wird ein computerimplementiertes Verfahren zur semantischen Bildsegmentierung angegeben. Dabei wird eine Vielzahl aufeinanderfolgender Bilder erhalten, insbesondere durch eine Recheneinrichtung, beispielsweise von einem Umfeldsensorsystem, wobei jedes der Bilder einem zugehörigen Aufnahmezeitintervall, auch als Frame bezeichnet, entspricht. Auf jedes der Bilder wird ein erster Teil eines Algorithmus zur semantischen Bildsegmentierung angewendet, um für jedes der Bilder der Vielzahl aufeinanderfolgender Bilder eine zugehörige erste Wahrscheinlichkeitsverteilung betreffend eine erste Objektklasse zu erzeugen, wobei eine Vielzahl vorgegebener Objektklassen die erste Objektklasse sowie eine zweite Objektklasse beinhaltet. Für jedes der Bilder der Vielzahl aufeinanderfolgender Bilder wird ein optischer Fluss bestimmt. Eines der Bilder der Vielzahl aufeinanderfolgender Bilder wird als nicht fehlerhaft identifiziert und eines der Bilder der Vielzahl aufeinanderfolgender Bilder wird als fehlerhaft identifiziert, wobei das fehlerhafte Bild dem nicht fehlerhaften Bild folgt, insbesondere unmittelbar folgt. Es wird eine geschätzte erste Wahrscheinlichkeitsverteilung für das fehlerhafte Bild erzeugt, indem wenigstens ein Teil der ersten Wahrscheinlichkeitsverteilung für das nicht fehlerhafte Bild abhängig von dem optischen Fluss für das nicht fehlerhafte Bild verschoben wird. Abhängig von der geschätzten ersten Wahrscheinlichkeitsverteilung wird ein semantisch segmentiertes Bild für den Aufnahmezeitraum des fehlerhaften Bildes erzeugt.

Die Vielzahl aufeinanderfolgender Bilder kann als Bilddatenstrom, Videodatenstrom oder Videostream bezeichnet werden, oder einem Teil eines solchen Datenstroms entsprechen. Jedes der Bilder entspricht einer zweidimensionalen Anordnung von Bildpunkten oder Pixeln und kann daher beispielsweise einem Kamerabild entsprechen. Die Bilder können aber auch anhand eines anderen Umfeldsensorsystems, beispielsweise eines Flash-Lidarsystems oder dergleichen, erzeugt und an die Recheneinrichtung übermittelt werden. Bei der Vielzahl aufeinanderfolgender Bilder handelt es sich also beispielsweise um einen Bilddatenstrom, der von einer Kamera oder einem sonstigen Umfeldsensorsystem erhalten wird, das beispielsweise an einem Fahrzeug montiert ist.

Sämtliche Schritte des computerimplementierten Verfahrens können mittels einer Recheneinrichtung ausgeführt werden, insbesondere einer Recheneinrichtung des Fahrzeugs, sofern nicht etwas anderes ausdrücklich erwähnt ist. Die Recheneinrichtung kann dabei eine oder mehrere Recheneinheiten, CPUs, elektronische Steuergeräte, auch als ECUs bezeichnet, Mikrocontroller und so weiter beinhalten. Die Recheneinrichtung kann beispielsweise Teil eines elektronischen Fahrzeugsteuerungssystems für das Fahrzeug sein.

Die Recheneinrichtung kann beispielsweise eine Speichereinheit, beispielsweise einen Pufferspeicher, beinhalten, um die Vielzahl aufeinanderfolgender Bilder zu speichern oder zwischenzuspeichern. Beispielsweise kann die Recheneinrichtung dazu eingerichtet sein, stets eine bestimmte Anzahl aufeinanderfolgender Bilder zu speichern. Wird ein weiteres Bild erhalten, so kann das älteste gespeicherte Bild beispielsweise gelöscht werden und so weiter.

Die Vielzahl aufeinanderfolgender Bilder beziehungsweise der Bilddatenstrom kann beispielsweise während des Betriebs eines Fahrzeugs, welches das elektronische Fahrzeugsteuerungssystem sowie das Umfeldsensorsystem beinhaltet, erzeugt und von der Recheneinrichtung erhalten werden. Das computerimplementierte Verfahren kann dementsprechend während des Betriebs und insbesondere während der Fahrt des Fahrzeugs durchgeführt werden.

Der erste Teil des Algorithmus kann beispielsweise Teil eines bekannten Algorithmus zur semantischen Bildsegmentierung sein. Es sei darauf hingewiesen, dass die Anwendung des ersten Teils des Algorithmus als Ergebnis kein semantisch segmentiertes Bild liefert sondern lediglich entsprechende Zwischenergebnisse, insbesondere in Form der ersten Wahrscheinlichkeitsverteilungen. Hierzu kann beispielsweise ein künstliches neuronales Netzwerk, insbesondere ein faltendes künstliches neuronales Netzwerk, CNN, eingesetzt werden, um insbesondere die erste Wahrscheinlichkeitsverteilung für die einzelnen Bilder zu erzeugen.

Insbesondere besitzt jedes Bild der Vielzahl aufeinanderfolgender Bilder eine Anzahl von Bildpunkten, die durch eine entsprechende zweidimensionale Pixelposition sowie entsprechende Pixelwerte charakterisiert sind. Die Pixelwerte können beispielsweise Werte für einen oder mehrere Farbkanäle und so weiter enthalten.

Anhand des ersten Teils des Algorithmus wird dementsprechend für jeden Bildpunkt des jeweiligen Bildes eine Wahrscheinlichkeit berechnet, beispielsweise zwischen 0 und 1 beziehungsweise zwischen 0 % und 100 %, dass dieser Bildpunkt zu einem Objekt gehört, welches der ersten Objektklasse angehört. Als Ergebnis kann also jedem Bildpunkt und damit jeder zweidimensionalen Pixelposition eine entsprechende Wahrscheinlichkeit für die erste Objektklasse zugeordnet werden. Die Gesamtheit der Wahrscheinlichkeiten für ein bestimmtes Bild und für die Wahrscheinlichkeit der ersten Objektklasse entspricht dann der ersten Wahrscheinlichkeitsverteilung. In analoger Weise kann beispielsweise auch für jedes Bild eine zugehörige zweite Wahrscheinlichkeitsverteilung betreffend die zweite Objektklasse erzeugt werden. Neben der ersten und der zweiten Objektklasse kann die Vielzahl vorgegebener Objektklassen eine oder mehrere weitere Objektklassen beinhalten. Auch für diese weiteren Objektklassen kann analog vorgegangen werden und eine entsprechende weitere Wahrscheinlichkeitsverteilung für jedes der Bilder erzeugt werden.

Der optische Fluss für eines der Bilder entspricht einem zweidimensionalen Vektorfeld, also einem zweidimensionalen Vektor für jeden der Bildpunkte des entsprechenden Bildes. Der optische Fluss stellt dabei die Geschwindigkeit des entsprechenden Bildpunktes im Verlauf der Vielzahl aufeinanderfolgender Bilder dar. Insbesondere gibt jeder der zweidimensionalen Vektoren eine Richtung und einen Betrag einer Geschwindigkeit des entsprechenden Bildpunkts an, wobei das jeweils in Rede stehende Bild und das jeweils vorhergehende, insbesondere unmittelbar vorhergehende, Bild der Vielzahl von Bildern zur Berechnung des optischen Flusses benutzt wird. Es existieren verschiedene Verfahren, um aus zwei aufeinanderfolgenden Bildern den entsprechenden optischen Fluss zu berechnen. Dazu kann insbesondere ebenfalls ein künstliches neuronales Netzwerk oder auch ein konventioneller Bildverarbeitungsalgorithmus verwendet werden. Auch für den entsprechenden Verfahrensschritt des computerimplementierten Verfahrens nach dem verbesserten Konzept kann eine bekannte Methode zum Berechnen des optischen Flusses verwendet werden. Der Vollständigkeit halber sei darauf hingewiesen, dass für ein initiales Bild, also ein Bild, dem kein weiteres Bild vorangeht, kein optischer Fluss bestimmt wird oder Referenzwerte für die einzelnen Geschwindigkeitsvektoren, beispielsweise Nullvektoren, verwendet werden können. Im Folgenden wird davon ausgegangen, dass der Vielzahl aufeinanderfolgender Bilder ein weiteres Bild unmittelbar vorangeht, das ebenfalls von der Recheneinrichtung erhalten wird. Demzufolge kann für jedes der Bilder der Vielzahl aufeinanderfolgender Bilder der optische Fluss bestimmt werden.

Es kann beispielsweise für jedes der Bilder der Vielzahl aufeinanderfolgender Bilder bestimmt werden, ob es fehlerhaft oder nicht fehlerhaft ist. Dazu kann beispielsweise die erste Wahrscheinlichkeitsverteilung zugrundegelegt werden und/oder die zweite Wahrscheinlichkeitsverteilung und/oder die jeweiligen weiteren Wahrscheinlichkeitsverteilungen für das entsprechende Bild. Insbesondere kann abhängig von der ersten Wahrscheinlichkeitsverteilung und gegebenenfalls der zweiten und/oder den weiteren Wahrscheinlichkeitsverteilungen wenigstens ein Unsicherheitsmaß für jedes der Bilder berechnet und mit wenigstens einem Grenzwert verglichen werden. Beispielsweise kann das entsprechende Bild als fehlerhaft identifiziert werden, wenn wenigstens eines der Unsicherheitsmaße größer ist als der entsprechende Grenzwert.

Zum Verschieben wenigstens des Teils der ersten Wahrscheinlichkeitsverteilung abhängig von dem optischen Fluss kann beispielsweise für jeden der Bildpunkte des nicht fehlerhaften Bildes ein zweidimensionaler Verschiebungsvektor basierend auf dem optischen Fluss bestimmt werden. Hierzu kann beispielsweise eine Dauer der Aufnahmezeiträume, also beispielsweise eine inverse Framerate des Bilddatenstroms, berücksichtigt werden. Der Verschiebungsvektor ergibt sich dann beispielsweise aus dem Produkt der Dauer des Aufnahmezeitraums mit einem entsprechenden Verschiebungsvektor, der basierend auf dem optischen Fluss bestimmt wird.

Zum Verschieben eines Punktes der Wahrscheinlichkeitsverteilung wird dann entsprechend dessen zweidimensionale Pixelposition um den entsprechenden Verschiebungsvektor verschoben. Der Wahrscheinlichkeitswert wird dann der so erhaltenen neuen Pixelposition zugeordnet.

Insbesondere kann jeder Punkt der ersten Wahrscheinlichkeitsverteilung dementsprechend verschoben werden oder nur eine Untermenge der Punkte der ersten Wahrscheinlichkeitsverteilung. Letzteres kann insbesondere vorteilhaft sein, wenn nicht nur festgestellt werden kann, dass das Bild fehlerhaft ist, sondern auch, welche Bildpunkte des fehlerhaften Bildes die Fehlerhaftigkeit des Bildes ausmachen. In diesem Fall können beispielsweise nur die entsprechenden fehlerhaften Bereiche der ersten Wahrscheinlichkeitsverteilung verschoben werden und die übrigen beibehalten werden.

Das semantisch segmentierte Bild für den Aufnahmezeitraum des fehlerhaften Bildes kann als Ergebnis oder Teilergebnis des computerimplementierten Verfahrens betrachtet werden. Insbesondere kann dieses semantisch segmentierte Bild mittels eines elektronischen Fahrzeugsteuerungssystems für ein Fahrzeug zum automatischen oder teilweise automatischen Steuern des Fahrzeugs berücksichtigt oder verwendet werden. Darüber hinaus kann basierend auf der ersten Wahrscheinlichkeitsverteilung für das nicht fehlerhafte Bild ebenfalls ein semantisch segmentiertes Bild für den Aufnahmezeitraum des nicht fehlerhaften Bildes erzeugt werden. Auch dieses kann Teil des Ergebnisses des computerimplementierten Verfahrens sein.

Bei selbstfahrenden oder teilweise automatisch gesteuerten Fahrzeugen können Algorithmen zum maschinellen Sehen eingesetzt werden, wie beispielsweise Objekterkennungsalgorithmen oder Verfahren zur semantischen Bildsegmentierung, um eine umfassende Darstellung und Interpretation der Umgebung des Fahrzeugs als Grundlage für die automatische oder teilweise automatische Steuerung zu schaffen. Insbesondere kann eine Recheneinrichtung des Fahrzeugs die Ergebnisse der Algorithmen zum maschinellen Sehen auswerten, um entsprechende Steuerungsbefehle zur Steuerung des Fahrzeugs zu erzeugen.

Algorithmen zur semantischen Bildsegmentierung sind an sich bekannt. Dabei werden die einzelnen Bildpunkte von Bildern eines Umfeldsensorsystems des Fahrzeugs, beispielsweise einer Kamera, eines Lidarsystems, insbesondere eines Flash-Lidarsystems, und so weiter, entsprechend vorgegebener Objektklassen klassifiziert. Beispielsweise kann jedem Bildpunkt eine entsprechende Wahrscheinlichkeit zugeordnet werden, dass dieser Bildpunkt einem Objekt der entsprechenden Objektklasse entspricht. Auf diese Weise kann für die verschiedenen Objektklassen eine jeweilige Wahrscheinlichkeitsverteilung für jedes Bild erzeugt werden. Auf Grundlage der Wahrscheinlichkeitsverteilungen kann die Recheneinrichtung dann jedem der Bildpunkte beispielsweise die wahrscheinlichste Objektklasse zuordnen, sodass ein segmentiertes Bild entsteht, bei dem jeder Bildpunkt einer entsprechenden Objektklasse zugeordnet ist.

Durch ein Verfahren nach dem verbesserten Konzept können Problemen vermieden werden, wenn das Umfeldsensorsystem ein fehlerhaftes Bild liefert. Beispielsweise kann eine teilweise Verdeckung eines Bildsensors, etwa durch einen Scheibenwischer des Fahrzeugs oder dergleichen, zu einem solchen fehlerhaften Bild führen. Ebenso können Störungen der Kommunikationsverbindung zwischen Umfeldsensorsystem und Recheneinrichtung oder sonstige Einflüsse oder Fehler zu fehlerhaften Bildern führen. Dies kann die Zuverlässigkeit beziehungsweise die Qualität der semantischen Segmentierung reduzieren. Beispielsweise kann es dazu kommen, dass für einzelne Bildbereiche oder das gesamte fehlerhafte Bild keine zuverlässige beziehungsweise keine eindeutige Klassifizierung der einzelnen Bildpunkte möglich ist. Zudem können verdeckte oder nicht auf dem fehlerhaften Bild dargestellte Objekte in der Umgebung des Fahrzeugs nicht entsprechend segmentiert werden. Dies kann zu einer geringeren Zuverlässigkeit der vollautomatischen oder teilautomatischen Steuerung des Fahrzeugs führen und dementsprechend zu Unterbrechungen der automatischen Steuerungen oder zu einem erhöhten Unfallrisiko. Diese Nachteile werden durch das Verfahren nach dem verbesserten Konzept vermieden.

Ferner können durch das Verfahren nach dem verbesserten Konzept Lücken im entsprechenden Datenstrom durch die Filterung unzuverlässiger Sensordaten vermieden werden. Dadurch wird die zur autonomen oder teilautonomen Steuerung des Fahrzeugs zur Verfügung stehende gesamte Information vergrößert.

Durch das computerimplementierte Verfahren nach dem verbesserten Konzept kann daher für jedes der Vielzahl aufeinanderfolgender Bilder beziehungsweise für jeden der entsprechenden Aufnahmezeiträume ein semantisch segmentiertes Bild erzeugt werden, unabhängig davon, ob das Bild fehlerhaft ist oder nicht fehlerhaft, sofern wenigstens ein nicht fehlerhaftes Bild vorhanden ist. Sollten beispielsweise mehrere fehlerhafte Bilder aufeinanderfolgen, so kann das letzte nicht fehlerhafte Bild zum Schätzen entsprechender erster Wahrscheinlichkeitsverteilungen wie beschrieben zugrunde gelegt werden. Durch das verbesserte Konzept kann daher für einen eingehenden Bilddatenstrom oder Videodatenstrom ein entsprechender kontinuierlicher Stream von semantisch segmentierten Bildern ohne Unterbrechungen aufgrund von fehlerhaften Eingangsbildern erzeugt werden. Dadurch kann eine zuverlässige automatische oder teilautomatische Steuerung eines Fahrzeugs basierend auf dem entsprechenden Strom semantisch segmentierter Bilder durchgeführt werden.

Im Allgemeinen ist nicht notwendigerweise das gesamte fehlerhafte Bild von dem die Fehlerhaftigkeit verursachenden Grund betroffen, insbesondere bei einer Verdeckung oder Teilverdeckung des Sensors. In diesem Fall kann das semantisch segmentierte Bild für den Aufnahmezeitraum des fehlerhaften Bildes beispielsweise sowohl abhängig von der geschätzten ersten Wahrscheinlichkeitsverteilung als auch von der ersten Wahrscheinlichkeitsverteilung für das fehlerhafte Bild, welche also direkt als Ergebnis des ersten Teils des Algorithmus zur semantischen Bildsegmentierung erhalten wird, erzeugt werden. Die beiden Wahrscheinlichkeitsverteilungen für den Aufnahmezeitraum des fehlerhaften Bildes können überlagert werden, beispielsweise gewichtet, um das semantisch segmentierte Bild zu erzeugen. So kann eine noch zuverlässigere semantische Segmentierung für den Aufnahmezeitraum des fehlerhaften Bildes bereitgestellt werden.

Gemäß zumindest einer Ausführungsform des computerimplementierten Verfahrens werden abhängig von der geschätzten ersten Wahrscheinlichkeitsverteilung Eingangsdaten für einen zweiten Teil des Algorithmus zur semantischen Bildsegmentierung erzeugt. Der zweite Teil des Algorithmus zur semantischen Bildsegmentierung wird auf die Eingangsdaten angewendet, um das semantisch segmentierte Bild für den Aufnahmezeitraum des fehlerhaften Bildes zu erzeugen. Der erste und der zweite Teil des Algorithmus sind dabei nicht notwendigerweise voneinander abhängig. Während der erste Teil im Wesentlichen dazu dient, für jedes der Bilder die Wahrscheinlichkeitsverteilungen zu erzeugen, dient der zweite Teil des Algorithmus im Wesentlichen dazu, aus den Wahrscheinlichkeitsverteilungen und im Falle des fehlerhaften Bildes aus der geschätzten ersten Wahrscheinlichkeitsverteilung das entsprechende semantisch segmentierte Bild zu erzeugen. Dazu kann beispielsweise für jeden Bildpunkt die maximale Wahrscheinlichkeit aller Objektklassen der vorgegebenen Vielzahl von Objektklassen bestimmt werden. Hierzu können für das nicht fehlerhafte Bild die erste Wahrscheinlichkeitsverteilung, gegebenenfalls die zweite Wahrscheinlichkeitsverteilung und gegebenenfalls die weiteren Wahrscheinlichkeitsverteilungen, für das nicht fehlerhafte Bild zugrunde gelegt werden. Für das fehlerhafte Bild kann die geschätzte erste Wahrscheinlichkeitsverteilung, optional in Kombination mit der ersten Wahrscheinlichkeitsverteilung für das fehlerhafte Bild, zugrunde gelegt werden sowie gegebenenfalls die entsprechenden Wahrscheinlichkeitsverteilungen beziehungsweise geschätzten Wahrscheinlichkeitsverteilungen für die zweite Objektklasse und gegebenenfalls die weiteren Objektklassen.

Gemäß zumindest einer Ausführungsform beinhalten die Eingangsdaten für den zweiten Teil des Algorithmus zur semantischen Bildsegmentierung eine Überlagerung der geschätzten ersten Wahrscheinlichkeitsverteilung für das fehlerhafte Bild mit der ersten Wahrscheinlichkeitsverteilung für das fehlerhafte Bild.

Die Überlagerung kann beispielsweise anhand einer gewichteten Summe der entsprechenden Wahrscheinlichkeitswerte für die einzelnen Bildpunkte bestimmt werden. Beispielsweise kann der zweite Teil des Algorithmus zur semantischen Bildsegmentierung also die wahrscheinlichste Klasse für einen entsprechenden Bildpunkt des semantisch segmentierten Bildes anhand der folgenden Vorschrift bestimmen:

S(x,y) = ARGMAXii_{e Kj}tcd * P’i(x,y) + (1 - ai) * Pi(x,y)].

Dabei läuft i über alle Elemente der Vielzahl K vorgegebener Objektklassen, (x,y) bezeichnet die zweidimensionale Pixelposition des entsprechenden Bildpunkts und S(x,y) diejenige Objektklasse, die anhand des zweiten Teils des Algorithmus dem Bildpunkt des semantisch segmentierten Bildes zugeordnet wird. P,(x,y) entspricht der Wahrscheinlichkeit für die Objektklasse i basierend auf der entsprechenden Wahrscheinlichkeitsverteilung für die Objektklasse i für den Aufnahmezeitraum des fehlerhaften Bildes und P’i(x,y) entspricht der Wahrscheinlichkeit für die Objektklasse i basierend auf der geschätzten Wahrscheinlichkeitsverteilung für den Aufnahmezeitraum des fehlerhaften Bildes a, ist ein Gewichtungsparameter für die Objektklasse i, der als 0 und kleiner oder gleich 1 ist. a, kann beispielsweise auch konstant für alle Objektklassen i sein. Je größer a, ist, desto kleiner ist der Beitrag der i-ten Wahrscheinlichkeitsverteilung und desto größer ist der Beitrag der geschätzten i-ten Wahrscheinlichkeitsverteilung. Ist a, gleich 1, so wird zur Bestimmung des semantisch segmentierten Bildes nur die geschätzte i-te Wahrscheinlichkeitsverteilung berücksichtigt.

Gemäß zumindest einer Ausführungsform wird basierend auf dem optischen Fluss des nicht fehlerhaften Bildes ein geschätzter optischer Fluss für das fehlerhafte Bild bestimmt. Die geschätzte erste Wahrscheinlichkeitsverteilung für das fehlerhafte Bild wird erzeugt, indem wenigstens der Teil der ersten Wahrscheinlichkeitsverteilung für das nicht fehlerhafte Bild gemäß dem geschätzten optischen Fluss für das fehlerhafte Bild verschoben wird.

Da in die Berechnung des optischen Flusses für das fehlerhafte Bild die Pixelwerte des fehlerhaften Bildes selbst eingehen, ist im Allgemeinen auch der so bestimmte optische Fluss für das fehlerhafte Bild fehlerhaft. Dementsprechend kann der optische Fluss des nicht fehlerhaften Bildes extrapoliert werden, um den optischen Fluss für das fehlerhafte Bild zu schätzen. So kann die Zuverlässigkeit des semantisch segmentierten Bildes für den Aufnahmezeitraum des fehlerhaften Bildes weiter erhöht werden.

Gemäß zumindest einer Ausführungsform wird für jedes der Bilder durch Anwendung des ersten Teils des Algorithmus zur semantischen Bildsegmentierung eine zweite Wahrscheinlichkeitsverteilung betreffend die zweite Objektklasse erzeugt.

Gemäß zumindest einer Ausführungsform wird eine geschätzte zweite Wahrscheinlichkeitsverteilung für das fehlerhafte Bild erzeugt, indem wenigstens ein Teil der zweiten Wahrscheinlichkeitsverteilung für das nicht fehlerhafte Bild abhängig von dem optischen Fluss für das nicht fehlerhafte Bild verschoben wird. Das semantisch segmentierte Bild für den Aufnahmezeitraum des fehlerhaften Bildes wird abhängig von der geschätzten zweiten Wahrscheinlichkeitsverteilung erzeugt.

Dies kann insbesondere gemäß dem oben erläuterten Zusammenhang für S(x,y) erfolgen. Für die gegebenenfalls vorgesehenen weiteren Objektklassen der Vielzahl vorgegebener Objektklassen kann analog wie für die erste und die zweite Objektklasse vorgegangen werden. Gemäß zumindest einer Ausführungsform wird für jedes der Bilder ein erstes Unsicherheitsmaß für die jeweilige erste Wahrscheinlichkeitsverteilung bestimmt und ein zweites Unsicherheitsmaß für die jeweilige zweite Wahrscheinlichkeitsverteilung. Das nicht fehlerhafte Bild wird abhängig von dem entsprechenden ersten Unsicherheitsmaß und dem entsprechenden zweiten Unsicherheitsmaß des nicht fehlerhaften Bildes als nicht fehlerhaft identifiziert. Das fehlerhafte Bild wird abhängig von dem entsprechenden ersten Unsicherheitsmaß und dem entsprechenden zweiten Unsicherheitsmaß des fehlerhaften Bildes als fehlerhaft identifiziert.

Insbesondere kann auch für die weiteren Objektklassen ein entsprechendes Unsicherheitsmaß für die jeweilige Wahrscheinlichkeitsverteilung bestimmt werden und zur Identifizierung des fehlerhaften Bildes als fehlerhaft und des nicht fehlerhaften Bildes als nicht fehlerhaft herangezogen werden.

Beispielsweise kann für die erste Wahrscheinlichkeitsverteilung und die zweite Wahrscheinlichkeitsverteilung und gegebenenfalls für die weiteren

Wahrscheinlichkeitsverteilungen jeweils eine Unsicherheitsverteilung bestimmt werden. Die jeweilige Unsicherheitsverteilung gibt dabei für jeden der Bildpunkte einen Unsicherheitswert oder Konfidenzwert an, wobei der Unsicherheitswert zum Ausdruck bringt, mit welcher Unsicherheit die entsprechende Wahrscheinlichkeit für diesen Bildpunkt gemäß der entsprechenden Wahrscheinlichkeitsverteilung behaftet ist beziehungsweise der Konfidenzwert eine entsprechende Konfidenz beschreibt.

Eine Unsicherheitsverteilung für eine Objektklasse hängt dabei insbesondere von der Wahrscheinlichkeitsverteilung für diese Objektklasse ab, kann aber in verschiedenen Ausführungsformen auch von allen anderen Wahrscheinlichkeitsverteilungen für die übrigen Objektklassen abhängen. Insbesondere kann die Unsicherheit für einen Bildpunkt für eine bestimmte Objektklasse umso höher sein, je höher die Wahrscheinlichkeit für diese Objektklasse ist und je geringer die Wahrscheinlichkeit für übrige Objektklassen ist.

Auf diese Weise kann die Identifizierung des fehlerhaften Bildes als fehlerhaft und des nicht fehlerhaften Bildes als nicht fehlerhaft mit erhöhter Zuverlässigkeit erfolgen.

Gemäß zumindest einer Ausführungsform wird für jedes der Bilder durch Anwendung des ersten Teils des Algorithmus zur semantischen Bildsegmentierung eine dritte Wahrscheinlichkeitsverteilung betreffend eine dritte Objektklasse der Vielzahl vorgegebener Objektklassen erzeugt, wobei die dritte Objektklasse ein Störobjekt betrifft. Für jedes der Bilder der Vielzahl aufeinanderfolgender Bilder wird abhängig von der jeweiligen dritten Wahrscheinlichkeitsverteilung das Vorhandensein des Störobjekts in dem jeweiligen Bild geprüft, um das nicht fehlerhafte Bild als nicht fehlerhaft zu identifizieren und das fehlerhafte Bild als fehlerhaft zu identifizieren.

Das Störobjekt kann beispielsweise einem Scheibenwischer des Fahrzeugs selbst, in diesem Zusammenhang auch als Ego-Fahrzeug bezeichnet, einer Verschmutzung auf einer Windschutzscheibe des Ego-Fahrzeugs und so weiter entsprechen. Gegebenenfalls kann die dritte Objektklasse auch mehrere verschiedene Störobjekte betreffen.

Wird das Störobjekt in dem jeweiligen Bild identifiziert, so kann mit erhöhter Wahrscheinlichkeit davon ausgegangen werden, dass das entsprechende Bild fehlerhaft ist. Wird das Störobjekt nicht in dem Bild identifiziert, so spricht dies dafür, dass das entsprechende Bild nicht fehlerhaft ist.

Gemäß zumindest einer Ausführungsform beinhaltet der erste Teil des Algorithmus ein künstliches neuronales Netzwerk, insbesondere ein trainiertes künstliches neuronales Netzwerk.

Das neuronale Netzwerk kann beispielsweise einem faltenden neuronalen Netzwerk, CNN, entsprechen. Neuronale Netzwerke und insbesondere CNNs haben sich als besonders gut geeignet und leistungsfähig zur semantischen Bildsegmentierung, insbesondere von Kamerabildern, erwiesen. Die Architektur des neuronalen Netzwerks kann dabei einer bekannten Architektur entsprechen. Auch das Trainieren des neuronalen Netzwerks kann in einer bekannten Weise, beispielsweise basierend auf einem überwachten Training, erfolgen. Das Training und die Architektur des neuronalen Netzwerks sind für das verbesserte Konzept nicht von grundsätzlicher Bedeutung. Insbesondere kann das computerimplementierte Verfahren nach dem verbesserten Konzept beliebige neuronale Netzwerke einsetzen, die dazu in der Lage sind, Wahrscheinlichkeitsverteilungen wie beschrieben zu erzeugen.

Gemäß zumindest einer Ausführungsform wird ein unmittelbar auf das fehlerhafte Bild folgendes weiteres Bild der Vielzahl aufeinanderfolgender Bilder als fehlerhaft identifiziert. Eine geschätzte erste Wahrscheinlichkeitsverteilung für das weitere fehlerhafte Bild wird erzeugt, indem wenigstens ein weiterer Teil der ersten Wahrscheinlichkeitsverteilung, der gleich oder verschieden zu dem Teil der ersten Wahrscheinlichkeitsverteilung sein kann, für das nicht fehlerhafte Bild abhängig von dem optischen Fluss für das nicht fehlerhafte Bild verschoben wird. Abhängig von der geschätzten ersten Wahrscheinlichkeitsverteilung für das weitere fehlerhafte Bild wird ein weiteres semantisch segmentiertes Bild für den Aufnahmezeitraum des weiteren fehlerhaften Bildes erzeugt.

Für das weitere fehlerhafte Bild und das weitere semantisch segmentierte Bild gelten die Ausführungen bezüglich des fehlerhaften Bildes und des semantisch segmentierten Bildes analog. Dabei wird für die Schätzung der ersten Wahrscheinlichkeitsverteilung für das weitere fehlerhafte Bild jedoch nicht das unmittelbar vorangehende Bild der Vielzahl von aufeinanderfolgenden Bildern verwendet, da es sich dabei gerade um das fehlerhafte Bild handelt. Stattdessen wird das letzte verfügbare nicht fehlerhafte Bild zugrundegelegt.

Gemäß dem verbesserten Konzept wird auch ein Verfahren zur wenigstens teilweise automatischen Steuerung eines Fahrzeugs angegeben, wobei mittels eines Umfeldsensorsystems des Fahrzeugs eine Vielzahl aufeinanderfolgender Bilder erzeugt wird, wobei jedes der Bilder einem zugehörigen Aufnahmezeitraum entspricht, und die Bilder an eine Recheneinrichtung des Fahrzeugs übermittelt werden. Mittels der Recheneinrichtung wird ein computerimplementiertes Verfahren zur semantischen Bildsegmentierung gemäß dem verbesserten Konzept durchgeführt. Mittels der Recheneinrichtung werden Steuersignale zur wenigstens teilweise automatischen Steuerung des Fahrzeugs abhängig von dem semantisch segmentierten Bild für den Aufnahmezeitraum des fehlerhaften Bilds erzeugt.

Die Recheneinrichtung und/oder das Umfeldsensorsystem können dabei Teil eines elektronischen Fahrzeugsteuerungssystems des Fahrzeugs sein.

Unter einem elektronischen Fahrzeugsteuerungssystem kann hier und im Folgenden ein elektronisches System verstanden werden, das dazu eingerichtet ist, das Fahrzeug vollautomatisch oder vollautonom zu führen oder zu steuern, insbesondere ohne dass ein Eingriff in eine Steuerung durch einen Fahrer erforderlich ist. Das Fahrzeug beziehungsweise das elektronische Fahrzeugsteuerungssystem führt dabei alle erforderlichen Funktionen, wie gegebenenfalls erforderliche Lenk-, Brems- und/oder Beschleunigungsmanöver, die Beobachtung und Erfassung des Straßenverkehrs sowie die damit verbundenen erforderlichen Reaktionen selbsttätig und vollautomatisch durch. Insbesondere kann das elektronische Fahrzeugsteuerungssystem zur Implementierung eines vollautomatischen oder vollautonomen Fahrmodus des Kraftfahrzeugs nach Stufe 5 der Klassifizierung gemäß SAE J3016 dienen. Unter einem elektronischen Fahrzeugsteuerungssystem kann auch ein Fahrerassistenzsystem (englisch: "advanced driver assistance System", ADAS) verstanden werden, welches den Fahrer bei einer teilweise automatisierten oder teilautonomen Fahrt des Kraftfahrzeugs unterstützt. Insbesondere kann das elektronische Fahrzeugsteuerungssystem zur Implementierung eines teilweise automatisierten oder teilautonomen Fahrmodus des Kraftfahrzeugs nach einer der Stufen 1 bis 4 gemäß der SAE J3016-Klassifizierung dienen. Hier und im Folgenden bezieht sich „SAE J3016“ auf die entsprechende Norm in der Version vom Juni 2018.

Die Bilder der Vielzahl aufeinanderfolgender Bilder stellen insbesondere eine durch ein Sichtfeld des Umfeldsensorsystems festgelegte Umgebung des Fahrzeugs dar. Das Umfeldsensorsystem beinhaltet beispielsweise eine Kamera zum Erzeugen der Bilder als entsprechende Kamerabilder beziehungsweise als Bilddatenstrom.

Gemäß dem verbesserten Konzept wird auch ein elektronisches Fahrzeugsteuerungssystem zur wenigstens teilweise automatischen Steuerung des Fahrzeugs angegeben. Das elektronische Fahrzeugsteuerungssystem weist ein Umfeldsensorsystem für das Fahrzeug auf, das dazu eingerichtet ist, eine Vielzahl aufeinanderfolgender Bilder zu erzeugen, wobei jedes der Bilder einem zugehörigen Aufnahmezeitraum entspricht. Das elektronische Fahrzeugsteuerungssystem weist eine Recheneinrichtung auf, die dazu eingerichtet ist, auf jedes der Bilder einen ersten Teil eines Algorithmus zur semantischen Bildsegmentierung anzuwenden, um für jedes der Bilder eine zugehörige erste Wahrscheinlichkeitsverteilung betreffend eine erste Objektklasse zu erzeugen, wobei eine Vielzahl vorgegebener Objektklassen die erste Objektklasse sowie wenigstens eine zweite Objektklasse beinhaltet. Die Recheneinrichtung ist dazu eingerichtet, für jedes der Bilder einen optischen Fluss zu bestimmen, eines der Bilder als nicht fehlerhaft zu identifizieren und ein auf das nicht fehlerhafte Bild folgendes der Bilder als fehlerhaft zu identifizieren. Die Recheneinrichtung ist dazu eingerichtet, eine geschätzte erste Wahrscheinlichkeitsverteilung für das fehlerhafte Bild zu erzeugen und dazu wenigstens einen Teil der ersten Wahrscheinlichkeitsverteilung für das nicht fehlerhafte Bild abhängig von dem optischen Fluss des nicht fehlerhaften Bildes zu verschieben. Die Recheneinrichtung ist dazu eingerichtet, abhängig von der geschätzten ersten Wahrscheinlichkeitsverteilung ein semantisch segmentiertes Bild für den Aufnahmezeitraum des fehlerhaften Bildes zu erzeugen.

Gemäß zumindest einer Ausführungsform des elektronischen Fahrzeugsteuerungssystems ist die Recheneinrichtung dazu eingerichtet, Steuersignale zur wenigstens teilweise automatischen Steuerung des Fahrzeugs abhängig von dem semantisch segmentierten Bild für den Aufnahmezeitraum des fehlerhaften Bildes zu erzeugen.

Die Steuersignale können beispielsweise an einen oder mehrere Aktuatoren des Fahrzeugs oder des Fahrzeugsteuerungssystems übermittelt werden, die die wenigstens teilweise automatische Steuerung des Fahrzeugs umsetzen können, insbesondere abhängig von den jeweils erhaltenen Steuersignalen.

Weitere Ausführungsformen des elektronischen Fahrzeugsteuerungssystems nach dem verbesserten Konzept folgen direkt aus den verschiedenen Ausführungsformen des computerimplementierten Verfahrens zur semantischen Bildsegmentierung nach dem verbesserten Konzept sowie aus dem Verfahren zur wenigstens teilweise automatischen Steuerung eines Fahrzeugs nach dem verbesserten Konzept und jeweils umgekehrt. Insbesondere kann ein elektronisches Fahrzeugsteuerungssystem nach dem verbesserten Konzept dazu eingerichtet sein, ein computerimplementiertes Verfahren zur semantischen Bildsegmentierung oder ein Verfahren zur wenigstens teilweise automatischen Steuerung eines Fahrzeugs nach dem verbesserten Konzept auszuführen oder das Fahrzeugsteuerungssystem führt ein solches Verfahren aus.

Gemäß dem verbesserten Konzept wird auch ein Kraftfahrzeug, insbesondere ein teilweise oder vollständig automatisch steuerbares Kraftfahrzeug, mit einem elektronischen Fahrzeugsteuerungssystem nach dem verbesserten Konzept angegeben.

Gemäß dem verbesserten Konzept wird ein erstes Computerprogramm mit ersten Befehlen angegeben. Wenn die ersten Befehle durch ein Computersystem ausgeführt werden, insbesondere durch eine Recheneinrichtung eines elektronischen Fahrzeugsteuerungssystems nach dem verbesserten Konzept, veranlassen die ersten Befehle das Computersystem dazu, ein computerimplementiertes Verfahren zur semantischen Bildsegmentierung gemäß dem verbesserten Konzept durchzuführen.

Gemäß dem verbesserten Konzept wird ein zweites Computerprogramm mit zweiten Befehlen angegeben. Wenn die zweiten Befehle durch ein elektronisches Fahrzeugsteuerungssystem nach dem verbesserten Konzept ausgeführt werden, insbesondere durch die Recheneinrichtung des elektronischen Fahrzeugsteuerungssystems, veranlassen die zweite Befehle das elektronische Fahrzeugsteuerungssystem dazu, ein Verfahren zur wenigstens teilweise automatischen Steuerung eines Fahrzeugs nach dem verbesserten Konzept durchzuführen.

Gemäß dem verbesserten Konzept wird auch ein computerlesbares Speichermedium angegeben, das ein erstes Computerprogramm und/oder ein zweites Computerprogramm nach dem verbesserten Konzept speichert.

Das erste und das zweite Computerprogramm sowie das computerlesbare Speichermedium können als jeweilige Computerprogrammprodukte mit den ersten beziehungsweise den zweiten Befehlen verstanden werden.

Die Erfindung umfasst auch die Kombinationen der Merkmale der beschriebenen Ausführungsformen.

Im Folgenden werden Ausführungsbeispiele der Erfindung beschrieben. Hierzu zeigt:

Fig. 1 eine schematische Darstellung eines Kraftfahrzeugs mit einer beispielhaften Ausführungsform eines elektronischen Fahrzeugsteuerungssystems nach dem verbesserten Konzept; und

Fig. 2 eine schematische Darstellung von Verfahrensschritten einer beispielhaften

Ausführungsform eines computerimplementierten Verfahrens zur semantischen Bildsegmentierung nach dem verbesserten Konzept.

Bei den im Folgenden erläuterten Ausführungsbeispielen handelt es sich um bevorzugte Ausführungsbeispiele der Erfindung. Bei den Ausführungsbeispielen stellen die beschriebenen Komponenten jeweils einzelne, unabhängig voneinander zu betrachtende Merkmale der Erfindung dar, welche die Erfindung jeweils auch unabhängig voneinander weiterbilden und damit auch einzeln oder in einer anderen als der gezeigten Kombination als Bestandteil der Erfindung anzusehen sind. Des Weiteren sind die beschriebenen Ausführungsbeispiele auch durch weitere der bereits beschriebenen Merkmale der Erfindung ergänzbar.

In Fig. 1 sind schematisch ein Kraftfahrzeug 1 sowie eine beispielhafte Ausführungsform eines elektronischen Fahrzeugsteuerungssystems 2 des Kraftfahrzeugs 1 nach dem verbesserten Konzept dargestellt. Das Fahrzeugsteuerungssystem 2 weist ein Umfeldsensorsystem 3, insbesondere eine Kamera, beispielsweise eine Frontkamera, für das Kraftfahrzeug 1 auf sowie eine Recheneinrichtung 4, die mit dem Umfeldsensorsystem 3 verbunden ist. Die Recheneinrichtung 4 ist dazu eingerichtet, Steuersignale für Aktuatoren (nicht dargestellt) des Fahrzeugs 1 zu erzeugen, um das Kraftfahrzeug 1 vollautomatisch oder vollautonom zu führen oder zu steuern und/oder eine oder mehrere Fahrerassistenzfunktionen zur teilweise automatischen oder teilautonomen Steuerung des Kraftfahrzeugs 1 auszuführen. Angesteuert durch die Recheneinrichtung 4 kann das Kraftfahrzeug 1 erforderliche Funktionen, wie beispielsweise Lenk-, Brems-, Beschleunigungsmanöver und so weiter selbsttätig und automatisch durchführen oder den Fahrer bei einer teilweise automatisierten Fahrt entsprechend unterstützen. Die Recheneinrichtung 4 kann dazu Sensordaten verschiedener Sensoren des Fahrzeugsteuerungssystems 2 beziehungsweise des Kraftfahrzeugs 1 berücksichtigen, unter anderem auch Bilddaten, die mittels des Umfeldsensorsystems 3 erzeugt werden können.

Insbesondere kann das Umfeldsensorsystem 3 einen Bilddatenstrom erzeugen, auch als Videostream bezeichnet, der eine Vielzahl aufeinanderfolgender Bilder beinhaltet, wobei jedes der Bilder einem entsprechenden Frame oder Aufnahmezeitraum entspricht. Das Umfeldsensorsystem 3 kann den Videodatenstrom beziehungsweise die Bilder des Videodatenstroms an die Recheneinrichtung 4 übermitteln, wo sie wenigstens vorübergehend gespeichert werden können. Die Recheneinrichtung 4 ist insbesondere dazu eingerichtet, ein computerimplementiertes Verfahren zur semantischen Bildsegmentierung nach dem verbesserten Konzept durchzuführen.

Fig. 2 zeigt schematisch verschiedene Verfahrensschritte gemäß einer beispielhaften Ausführungsform eines computerimplementierten Verfahrens zur semantischen Bildsegmentierung nach dem verbesserten Konzept, wie es beispielsweise von der Recheneinrichtung 4 des elektronischen Fahrzeugsteuerungssystems 2 aus Fig. 1 durchgeführt werden kann.

Im Schritt S1 erhält die Recheneinrichtung 4 von dem Umfeldsensorsystem 3 den Bilddatenstrom mit einer Vielzahl aufeinanderfolgender Bilder, von denen im Beispiel der Fig. 2 nur zwei aufeinanderfolgende Bilder 5a, 5b schematisch dargestellt sind. Im Beispiel der Fig. 2 ist das erste Bild 5a beispielsweise nicht fehlerhaft und das zweite Bild 5b, welches unmittelbar auf das erste Bild 5a folgt, ist fehlerhaft. Beispielsweise kann in dem zweiten Bild 5b ein Scheibenwischer des Kraftfahrzeugs 1 abgebildet sein, der einen dahinterliegenden Bereich der Umgebung des Fahrzeugs 1 für das Umfeldsensorsystem 3, welches im vorliegenden Fall als Kamera ausgestaltet ist, verdeckt.

In Schritt S2 wendet die Recheneinrichtung 4 einen ersten Teil eines Algorithmus zur semantischen Bildsegmentierung, beispielsweise ein faltendes neuronales Netzwerk, CNN, 6 auf jedes der Bilder 5a, 5b an. Als Ergebnis des ersten Teils des Algorithmus wird für jedes der Bilder 5a, 5b eine zugehörige Wahrscheinlichkeitsverteilung für jeweils eine Vielzahl von vordefinierten Objektklassen erzeugt. Die Objektklassen können beispielsweise unterschiedliche Verkehrsteilnehmer wie andere Kraftfahrzeuge, Zweiräder, Fußgänger und so weiter spezifizieren oder Teile der Straße, Gebäude, Infrastruktureinrichtungen und so weiter. In Fig. 2 ist beispielhaft eine erste Wahrscheinlichkeitsverteilung 7 für das zweite Bild 5b gezeigt, welches eine erste Objektklasse betrifft.

Die erste Wahrscheinlichkeitsverteilung 7 gibt daher für jeden Bildpunkt des zweiten Bildes 5b an, wie hoch die Wahrscheinlichkeit dafür ist, dass der entsprechende Bildpunkt zu einem Objekt der ersten Objektklasse gehört. Die Wahrscheinlichkeit kann zwischen 0 und 1 liegen oder anderes normiert sein und ist in Fig. 2 durch Graustufen schematisch dargestellt. Ebenso wird eine entsprechende erste Wahrscheinlichkeitsverteilung für das erste Bild 5a als Ausgabe des CNN 6 erzeugt sowie jeweilige Wahrscheinlichkeitsverteilungen für die Bilder 5a, 5b für alle weiteren Objektklassen.

In Schritt S3 wird für jedes der Bilder des Bilddatenstroms, insbesondere für die Bilder 5a, 5b, ein optischer Fluss bestimmt. Der optische Fluss 8 für das erste Bild 5a ist in Fig. 2 schematisch durch fünf zweidimensionale Vektoren dargestellt. Tatsächlich weist der optische Fluss 8 für jeden Bildpunkt des ersten Bildes 5a einen zweidimensionalen Vektor auf, dessen Länge dem Betrag der Geschwindigkeit des entsprechenden Bildpunkts bezüglich eines unmittelbar vorangehenden Bildes (nicht dargestellt) des Bilddatenstroms angibt und die Richtung des zweidimensionalen Vektors die entsprechende Richtung der Geschwindigkeit. In analoger Weise wird für jedes weitere Bild inklusive dem zweiten Bild 5b des Bilddatenstroms in Schritt S3 ein entsprechender optischer Fluss bestimmt.

In Schritt S4 überprüft die Recheneinrichtung 4 für jedes der Bilder des Videodatenstroms, ob es fehlerhaft ist oder nicht. Insbesondere identifiziert die Recheneinrichtung 4 in Schritt S4 das erste Kamerabild 5a als nicht fehlerhaft und das zweite Kamerabild 5b als fehlerhaft. Dazu kann die Recheneinrichtung 4 die Wahrscheinlichkeitsverteilungen für das jeweils zu überprüfende Bild für alle Objektklassen berücksichtigen, um eine Unsicherheitsverteilung 9 für das entsprechende Bild zu berechnen. Die Unsicherheitsverteilung 9 kann dabei für jede Objektklasse berechnet werden. Im einfachsten Fall kann die Unsicherheitsverteilung 9 für eine Objektklasse alleine basierend auf der entsprechenden Wahrscheinlichkeitsverteilung für diese Objektklasse bestimmt werden. Je höher die Wahrscheinlichkeit des entsprechenden Bildpunkts für die entsprechende Objektklasse, desto geringer ist beispielsweise die Unsicherheit. Vorzugsweise werden jedoch für die Bestimmung der Unsicherheitsverteilung 9 für eine der Objektklassen auch die Wahrscheinlichkeitsverteilungen desselben Bildes für die übrigen Objektklassen berücksichtigt. Insbesondere kann die Unsicherheit umso kleiner sein, je größer die Wahrscheinlichkeit für die betrachtete Objektklasse ist und je kleiner die jeweiligen Wahrscheinlichkeiten für die übrigen Objektklassen sind.

Sodann kann die Recheneinrichtung 4 beispielsweise für jede der Unsicherheitsverteilungen 9 ein Unsicherheitsmaß bestimmen, beispielsweise durch Mittelwertbildung aller Unsicherheitswerte der entsprechenden Unsicherheitsverteilung 9. Die Recheneinrichtung 4 kann das entsprechende Unsicherheitsmaß für jedes der Bilder und für jede der Objektklassen mit einem entsprechenden Grenzwert vergleichen und das zu prüfende Bild abhängig von einem Ergebnis des Vergleichs beziehungsweise der Vergleiche als fehlerhaft oder nicht fehlerhaft identifizieren. Beispielsweise kann die Recheneinrichtung 4 das Bild als fehlerhaft identifizieren, wenn eines der Unsicherheitsmaße für die verschiedenen Objektklassen den entsprechenden Grenzwert überschreitet und das entsprechende Bild anderenfalls als nicht fehlerhaft identifizieren.

Wie erwähnt, wird im Folgenden davon ausgegangen, dass das erste Bild 5a als nicht fehlerhaft identifiziert wird und das zweite Bild 5b als fehlerhaft. Die Recheneinrichtung 4 kann dann in Schritt S5 einen geschätzten optischen Fluss für das fehlerhafte Bild 5b bestimmen. Dazu kann die Recheneinrichtung 4 von dem optischen Fluss 8 des nicht fehlerhaften Bildes 5a ausgehen und diesen entsprechend der Framedauer, also der Aufnahmezeitdauer eines Frames beziehungsweise des Kehrwerts der Framerate, extrapolieren, um so einen geschätzten optischen Fluss 10 für das fehlerhafte Bild 5b zu ermitteln. Nun kann die Recheneinrichtung 4 in Schritt S6 eine geschätzte erste Wahrscheinlichkeitsverteilung 11 für das fehlerhafte Bild 5b erzeugen, indem sie die erste Wahrscheinlichkeitsverteilung für das nicht fehlerhafte Bild 5a gemäß dem geschätzten optischen Fluss 10 verschiebt. Diese Schritte können für alle weiteren Wahrscheinlichkeitsverteilungen für die unterschiedlichen Objektklassen ebenfalls durchgeführt werden. Mit anderen Worten werden sämtliche Wahrscheinlichkeitsverteilungen für alle Objektklassen des ersten nicht fehlerhaften Bildes 5a entsprechend dem geschätzten optischen Fluss 10 verschoben, um entsprechende geschätzte Wahrscheinlichkeitsverteilungen für das fehlerhafte Bild 5b zu erhalten.

In Schritt S7 kann die Recheneinrichtung 4 dann die geschätzten

Wahrscheinlichkeitsverteilungen für das fehlerhafte Bild 5b verwenden, um ein semantisch segmentiertes Bild 12 für das fehlerhafte Bild 5b zu erzeugen. Hierzu kann die Recheneinrichtung beispielsweise für jeden Bildpunkt eine ARGMAX Funktion berechnen, die die jeweilige Objektklasse für den jeweiligen Bildpunkt mit der höchsten Wahrscheinlichkeit zurückgibt. Die Recheneinrichtung 4 kann dabei die ARGMAX Funktion beispielsweise auf die geschätzten Wahrscheinlichkeitsverteilungen alleine anwenden, ohne die Wahrscheinlichkeitsverteilungen für das fehlerhafte Bild 5b, die direkt aus dem CNN 6 erhalten werden, zu berücksichtigen, da diese fehlerhaft sind. Vorzugsweise wird jedoch eine Überlagerung der fehlerhaften Wahrscheinlichkeitsverteilung aus dem Ergebnis des CNN 6 mit der entsprechenden geschätzten Wahrscheinlichkeitsverteilung für das fehlerhafte Bild 5b zugrunde gelegt. Beispielsweise können die jeweilige Wahrscheinlichkeitsverteilung und die zugehörige geschätzte Wahrscheinlichkeitsverteilung gewichtet summiert werden, wie gemäß dem obenstehenden Ausdruck für S(x,y) dargelegt.

Solche Ausführungsformen sind besonders vorteilhaft, weil damit diejenigen Teile des fehlerhaften Bildes 5b exakt berücksichtigt werden können, die nicht von der Ursache für die Fehlerhaftigkeit, also von der Verdeckung oder der Verschmutzung oder dergleichen, beeinflusst sind. Diejenigen Teile, für die das fehlerhafte Bild 5b keine adäquate Wahrscheinlichkeitsverteilung liefert, beispielsweise weil die entsprechenden Bildbereiche verdeckt sind, werden durch die geschätzte Wahrscheinlichkeitsverteilung berücksichtigt. So kann die verfügbare Information maximal ausgenutzt werden, um ein möglichst zuverlässiges Ergebnis zu erhalten.

Zum Vergleich ist in Fig. 2 auch ein hypothetisches semantisch segmentiertes Bild 12‘ für das fehlerhafte Bild 5b dargestellt, bei dem das computerimplementierte Verfahren nach dem verbesserten Konzept nicht eingesetzt wurde, bei dem also allein die fehlerhafte Wahrscheinlichkeitsverteilung aus dem CNN 6 verwendet wurde. Wie gut zu erkennen ist, spiegelt sich der Fehler aus dem fehlerhaften Bild 5b direkt im semantisch segmentierten Bild 12‘ wider. Die Recheneinrichtung 4 kann nun im Rahmen eines Verfahrens zum automatischen oder teilweise automatischen Steuern des Kraftfahrzeugs 1 das semantisch segmentierte Bild 12 für das fehlerhafte Bild 5b berücksichtigen.

Die Bildsegmentierung nach dem verbesserten Konzept kann insbesondere abwechselnd mit der konventionellen semantischen Segmentierung nicht fehlerhafter Bilder eingesetzt werden. So kann während eines live übertragenen Bilddatenstroms wiederholt zwischen der semantischen Segmentierung in konventioneller Weise und der semantischen Segmentierung gemäß dem verbesserten Konzept hin- und hergewechselt werden, wenn die entsprechende Überprüfung der Kamerabilder fehlerhafte Bilder beziehungsweise nicht fehlerhafte Bilder identifiziert.

Die Schätzung der Wahrscheinlichkeitsverteilungen und die Extrapolation des optischen Flusses kann dabei nicht nur von einem nicht fehlerhaften Bild auf das darauffolgende fehlerhafte Bild genutzt werden, sondern auch für auf das fehlerhafte Bild folgende weitere fehlerhafte Bilder. Im Allgemeinen kann für die semantische Segmentierung eines fehlerhaften Bildes stets der optische Fluss des letzten nicht fehlerhaften Bildes entsprechend extrapoliert werden und die entsprechende Wahrscheinlichkeitsverteilung des letzten nicht fehlerhaften Bildes dementsprechend verschoben werden.

Bezugszeichenliste

Kraftfahrzeug elektronisches Fahrzeugsteuerungssystem

Umfeldsensorsystem

Recheneinrichtung a, 5b Bilder neuronales Netzwerk Wahrscheinlichkeitsverteilung optischer Fluss Unsicherheitsverteilung 0 extrapolierter optischer Fluss 1 geschätzte Wahrscheinlichkeitsverteilung2 12 semantisch segmentierte Bilder 1 bis S7 Verfahrensschritte

Claims

Patentansprüche

1. Computerimplementiertes Verfahren zur semantischen Bildsegmentierung, wobei eine Vielzahl aufeinanderfolgender Bilder (5a, 5b) erhalten wird, wobei jedes der Bilder (5a, 5b) einem zugehörigen Aufnahmezeitraum entspricht; und auf jedes der Bilder (5a, 5b) ein erster Teil eines Algorithmus zur semantischen Bildsegmentierung angewendet wird, um für jedes der Bilder (5a, 5b) eine zugehörige erste Wahrscheinlichkeitsverteilung (7) betreffend eine erste Objektklasse zu erzeugen, wobei eine Vielzahl vorgegebener Objektklassen die erste Objektklasse sowie eine zweite Objektklasse beinhaltet; dadurch gekennzeichnet, dass für jedes der Bilder (5a, 5b) ein optischer Fluss (8) bestimmt wird; eines der Bilder (5a) als nicht fehlerhaft identifiziert wird und ein auf das nicht fehlerhafte

Bild (5a) folgendes der Bilder (5b) als fehlerhaft identifiziert wird; eine geschätzte erste Wahrscheinlichkeitsverteilung (11) für das fehlerhafte Bild (5b) erzeugt wird, indem wenigstens ein Teil der ersten Wahrscheinlichkeitsverteilung für das nicht fehlerhafte Bild (5a) abhängig von dem optischen Fluss (8) für das nicht fehlerhafte

Bild (5a) verschoben wird; und abhängig von der geschätzten ersten Wahrscheinlichkeitsverteilung (11) ein semantisch segmentiertes Bild (12) für den Aufnahmezeitraum des fehlerhaften Bildes (5b) erzeugt wird.

2. Computerimplementiertes Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass abhängig von der geschätzten ersten Wahrscheinlichkeitsverteilung (11) Eingangsdaten für einen zweiten Teil des Algorithmus zur semantischen Bildsegmentierung erzeugt werden; und der zweite Teil des Algorithmus zur semantischen Bildsegmentierung auf die Eingangsdaten angewendet wird, um das semantisch segmentierte Bild (12) für den Aufnahmezeitraum des fehlerhaften Bildes (5b) zu erzeugen.

3. Computerimplementiertes Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Eingangsdaten für den zweiten Teil des Algorithmus zur semantischen Bildsegmentierung eine Überlagerung der geschätzten ersten Wahrscheinlichkeitsverteilung (11) mit der ersten Wahrscheinlichkeitsverteilung (7) für das fehlerhafte Bild (5b) beinhalten.

4. Computerimplementiertes Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass basierend auf dem optischen Fluss (8) des nicht fehlerhaften Bildes (5a) ein geschätzter optischer Fluss (10) für das fehlerhafte Bild (5b) bestimmt wird; und die geschätzte erste Wahrscheinlichkeitsverteilung (11) für das fehlerhafte Bild (5b) erzeugt wird, indem wenigstens der Teil der ersten Wahrscheinlichkeitsverteilung für das nicht fehlerhafte Bild (5a) gemäß dem geschätzten optischen Fluss (10) für das fehlerhafte Bild (5b) verschoben wird.

5. Computerimplementiertes Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass für jedes der Bilder (5a, 5b) durch Anwendung des ersten Teils des Algorithmus zur semantischen Bildsegmentierung eine zweite Wahrscheinlichkeitsverteilung betreffend die zweite Objektklasse erzeugt wird; eine geschätzte zweite Wahrscheinlichkeitsverteilung für das fehlerhafte Bild (5b) erzeugt wird, indem wenigstens ein Teil der zweiten Wahrscheinlichkeitsverteilung für das nicht fehlerhafte Bild (5a) abhängig von dem optischen Fluss (8) für das nicht fehlerhafte Bild (5a) verschoben wird; und das semantisch segmentierte Bild (12) für den Aufnahmezeitraum des fehlerhaften Bildes (5b) abhängig von der geschätzten zweiten Wahrscheinlichkeitsverteilung erzeugt wird.

6. Computerimplementiertes Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass für jedes der Bilder (5a, 5b) ein erstes Unsicherheitsmaß für die jeweilige erste Wahrscheinlichkeitsverteilung (7) bestimmt wird und für jedes der Bilder (5a, 5b) ein zweites Unsicherheitsmaß für die jeweilige zweite Wahrscheinlichkeitsverteilung bestimmt wird; das nicht fehlerhafte Bild (5a) abhängig von dem entsprechenden ersten Unsicherheitsmaß und dem entsprechenden zweiten Unsicherheitsmaß als nicht fehlerhaft identifiziert wird; und das fehlerhafte Bild (5b) abhängig von dem entsprechenden ersten Unsicherheitsmaß und dem entsprechenden zweiten Unsicherheitsmaß als fehlerhaft identifiziert wird.

7. Computerimplementiertes Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass für jedes der Bilder (5a, 5b) durch Anwendung des ersten Teils des Algorithmus zur semantischen Bildsegmentierung eine dritte Wahrscheinlichkeitsverteilung betreffend eine dritte Objektklasse der Vielzahl vorgegebener Objektklassen erzeugt wird, wobei die dritte Objektklasse ein Störobjekt betrifft; für jedes der Bilder (5a, 5b) abhängig von der jeweiligen dritten

Wahrscheinlichkeitsverteilung das Vorhandensein des Störobjekts in dem jeweiligen Bild geprüft wird, um das nicht fehlerhafte Bild (5a) als nicht fehlerhaft zu identifizieren und das fehlerhafte Bild (5b) als fehlerhaft zu identifizieren.

8. Computerimplementiertes Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass der erste Teil des Algorithmus zur semantischen Bildsegmentierung ein künstliches neuronales Netzwerk (6) beinhaltet.

9. Computerimplementiertes Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass ein unmittelbar auf das fehlerhafte Bild (5b) folgendes weiteres Bild als fehlerhaft identifiziert wird; eine geschätzte erste Wahrscheinlichkeitsverteilung für das weitere fehlerhafte Bild erzeugt wird, indem wenigstens ein weiterer Teil der ersten Wahrscheinlichkeitsverteilung für das nicht fehlerhafte Bild (5a) abhängig von dem optischen Fluss (8) für das nicht fehlerhafte Bild (5a) verschoben wird; und abhängig von der geschätzten ersten Wahrscheinlichkeitsverteilung für das weitere fehlerhafte Bild ein weiteres semantisch segmentiertes Bild für den Aufnahmezeitraum des weiteren fehlerhaften Bildes erzeugt wird.

10. Verfahren zur wenigstens teilweise automatischen Steuerung eines Fahrzeugs (1), wobei mittels eines Umfeldsensorsystems (3) des Fahrzeugs (1) eine Vielzahl aufeinanderfolgender Bilder (5a, 5b) erzeugt wird und die Bilder (5a, 5b) an eine Recheneinrichtung (4) des Fahrzeugs übermittelt werden und wobei jedes der Bilder (5a, 5b) einem zugehörigen Aufnahmezeitraum entspricht, dadurch gekennzeichnet, dass mittels der Recheneinrichtung (4) ein computerimplementiertes Verfahren nach einem der Ansprüche 1 bis 9 durchgeführt wird; und mittels der Recheneinrichtung (4) Steuersignale zur wenigstens teilweise automatischen Steuerung des Fahrzeugs (1) abhängig von dem semantisch segmentierten Bild (12) für den Aufnahmezeitraum des fehlerhaften Bildes (5b) erzeugt werden.

11. Elektronisches Fahrzeugsteuerungssystem (2) zur wenigstens teilweise automatischen Steuerung eines Fahrzeugs (1), aufweisend ein Umfeldsensorsystem (3) für das Fahrzeug (1), das dazu eingerichtet ist, eine Vielzahl aufeinanderfolgender Bilder (5a, 5b) zu erzeugen, wobei jedes der Bilder (5a, 5b) einem zugehörigen Aufnahmezeitraum entspricht; und eine Recheneinrichtung (4), die dazu eingerichtet ist, auf jedes der Bilder (5a, 5b) einen ersten Teil eines Algorithmus zur semantischen Bildsegmentierung anzuwenden, um für jedes der Bilder (5a, 5b) eine zugehörige erste Wahrscheinlichkeitsverteilung (7) betreffend eine erste Objektklasse zu erzeugen, wobei eine Vielzahl vorgegebener Objektklassen die erste Objektklasse sowie wenigstens eine zweite Objektklasse beinhaltet; dadurch gekennzeichnet, das die Recheneinrichtung (4) dazu eingerichtet ist, für jedes der Bilder (5a, 5b) einen optischen Fluss (8) zu bestimmen; eines der Bilder (5a, 5b) als nicht fehlerhaft zu identifizieren und ein auf das nicht fehlerhafte Bild folgendes der Bilder (5a, 5b) als fehlerhaft zu identifizieren; eine geschätzte erste Wahrscheinlichkeitsverteilung (11) für das fehlerhafte Bild (5b) zu erzeugen und dazu wenigstens ein Teil der ersten Wahrscheinlichkeitsverteilung für das nicht fehlerhafte Bild (5a) abhängig von dem optischen Fluss (8) des nicht fehlerhaften

Bildes (5a) zu verschieben; und abhängig von der geschätzten ersten Wahrscheinlichkeitsverteilung (11) ein semantisch segmentiertes Bild (12) für den Aufnahmezeitraum des fehlerhaften Bildes (5b) zu erzeugen.

12. Elektronisches Fahrzeugsteuerungssystem (2) nach Anspruch 11, dadurch gekennzeichnet, dass die Recheneinrichtung (4) dazu eingerichtet ist, Steuersignale zur wenigstens teilweise automatischen Steuerung des Fahrzeugs (1) abhängig von dem semantisch segmentierten Bild (12) für den Aufnahmezeitraum des fehlerhaften Bildes (5b) zu erzeugen.

13. Kraftfahrzeug (1) mit einem elektronischen Fahrzeugsteuerungssystem (2) nach einem der Ansprüche 11 oder 12.

14. Computerprogrammprodukt mit Befehlen, welche, wenn sie durch ein Computersystem ausgeführt werden, das Computersystem dazu veranlassen, ein computerimplementiertes Verfahren nach einem der Ansprüche 1 bis 9 durchzuführen.

15. Computerprogrammprodukt mit Befehlen, welche, wenn sie durch ein elektronisches Fahrzeugsteuerungssystem (2) nach einem der Ansprüche 11 oder 12 ausgeführt werden, das elektronische Fahrzeugsteuerungssystem (2) dazu veranlassen, ein Verfahren nach Anspruch 10 durchzuführen.