DE102018222294A1 - Verfahren, Computerprogramm, maschinenlesbares Speichermedium sowie Vorrichtung zur Datenvorhersage - Google Patents

Verfahren, Computerprogramm, maschinenlesbares Speichermedium sowie Vorrichtung zur Datenvorhersage Download PDF

Info

Publication number
DE102018222294A1
DE102018222294A1 DE102018222294.0A DE102018222294A DE102018222294A1 DE 102018222294 A1 DE102018222294 A1 DE 102018222294A1 DE 102018222294 A DE102018222294 A DE 102018222294A DE 102018222294 A1 DE102018222294 A1 DE 102018222294A1
Authority
DE
Germany
Prior art keywords
data
encoder
machine learning
plausibility
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102018222294.0A
Other languages
English (en)
Inventor
Oliver Willers
Sebastian Sudholt
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Priority to DE102018222294.0A priority Critical patent/DE102018222294A1/de
Priority to PCT/EP2019/084172 priority patent/WO2020126597A1/de
Publication of DE102018222294A1 publication Critical patent/DE102018222294A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

Verfahren zur Datenvorhersage basierend auf einem Eingabedatum (Y) mittels eines Verfahrens des maschinellen Lernens (ML-Function), wobei parallel zu der Datenvorhersage das Eingangsdatum (Y) mittels eines Variational Autoencoders (VAE) auf ein Encoderdatum (Z) abgebildet wird, wobei ein Distanzkriterium in Abhängigkeit von dem Encoderdatum (Z) und einer erwarteten Verteilung (Z') ermittelt wird, wobei das Distanzkriterium ein Plausibilitätsmaß Datenvorhersage repräsentiert.

Description

  • Die vorliegende Erfindung betrifft ein Verfahren, ein Computerprogramm, ein maschinenlesbares Speichermedium sowie eine Vorrichtung zur Datenvorhersage mittels eines Verfahrens des maschinellen Lernens (eng.: ML function).
  • Stand der Technik
  • Der Einsatz von Verfahren des maschinellen Lernens ermöglicht eine Reihe von neuen und spannenden Anwendungen. Ein bekanntes Einsatzgebiet für Verfahren des maschinellen Lernens ist das Feld des Automatisierten Fahrens. Mit dem Übergang vom zumindest teilweise manuellen Fahrens (sog. Level 1, 2 Fahren) zum teilweise automatisierten Fahren (sog. Level 3, 4 und 5) entstehen grundsätzliche Probleme für die Systemsicherheit. Insbesondere der Einsatz von Verfahren des maschinellen Lernens für bzw. in sicherheitsrelevanten Funktionen erzeugt vollständig neue Probleme hinsichtlich der Systemsicherheit.
  • Aus D. Amodei, C. Olah, J. Steinhardt, P. F. Christiano, J. Schulman, and D. Mane, „Concrete problems in AI safety,“ CoRR, vol. abs/1606.06565, 2016. [Online]. sind „Unfälle“ als Probleme des maschinellen Lernens bekannt. Demnach sind Unfälle unerwünschtes oder schädigendes Verhalten, das auf ein mangelhaftes Design von Systemen der künstlichen Intelligenz mit Bezug zur realen Welt zurückzuführen ist. Das Paper kategorisiert die auftretenden Probleme in fünf Klassen, Verhinderung von Seiteffekten (engl.: avoiding side effects), Vermeidung von Reward Hacking (eng.: avoiding reward hacking), skalierbare Überwachung (eng.: scalable supervision), sicheres Erforschen (eng.: safe exploration) und Verteilungsverschiebung (eng.: distributional shift).
  • Aus S. Burton, L. Gauerhof, and C. Heinzemann, „Making the case for safety of machine learning in highly automated driving," in Computer Safety, Reliability, and Security, S. Tonetta, E. Schoitsch, and F. Bitsch, Eds. Cham: Springer International Publishing, 2017, pp. 5-16. sind Herausforderungen bekannt, die auftreten, wenn Verfahren des maschinellen Lernens im Bereich des zumindest teilweise automatisierten Fahrens angewendet werden. Das Paper legt einen besonderen Fokus auf funktionelle Unzulänglichkeiten bei der Erkennungsfunktion basierend auf faltenden künstlichen neuronalen Netzen (eng.: Convolutional Neural Networks). Ferner stellt das Paper Möglichkeiten zur Abwehr der sich daraus ergebenden Risiken vor.
  • Aus G. E. Hinton and R. R. Salakhutdinov, „Reducing the dimensionality of data with neural networks," Science, vol. 313, no. 5786, pp. 504-507, 2006. [Online]. ist bekannt, dass höher-dimensionale Daten in nieder-dimensionale Codes konvertiert werden können, indem ein mehrschichtiges künstliches neuronales Netz mit einer kleinen zentralen Schicht darauf trainiert wird, einen höherdimensionalen Eingabevektor zu rekonstruieren. Der Gradientenabstieg (eng.: gradient descent) kann für die Feinabstimmung der Gewichte in einem künstlichen neuronalen Netz, das auch „Autoencoder“ genannt wird, angewendet werden.
  • Aus C. Doersch, „Tutorial on Variational Autoencoders," ArXiv e-prints, Jun. 2016. ist bekannt, sogenannte Autoencoder zum unüberwachten Lernen von künstlichen neuronalen Netzen einzusetzen. Insbesondere wenn komplizierte Verteilungen der Eingabe- bzw. Trainingsdaten vorliegen. Zeigt der Einsatz von Autoencoder beim unüberwachten Lernen besondere Stärken.
  • Ein grundsätzliches Problem beim Einsatz von Verfahren des maschinellen Lernens für sicherheitsrelevante Funktionen ist, dass eine Datenvorhersage nur dann verlässlich ist, wenn die Eingangsdaten eine adäquate Qualität aufweisen und die gleiche bzw. ähnliche Verteilung aufweisen, wie der Datensatz, der zum Training des Verfahrens des maschinellen Lernens eingesetzt wurde.
  • Insbesondere für den Einsatz in offenen Szenarien (eng.: open context scenarios), wie bspw. bei dem zumindest teilweise automatisierten Fahren, birgt dies große Herausforderungen. Daher sind Plausibilitätsprüfungen der Eingangsdaten, die mittels des Verfahrens des maschinellen Lernens verarbeitet wurden, erforderlich.
  • Im Kontext des Automatisierten Fahrens, beschränken sich die aktuellen Plausibilitätsprüfungen auf den Vergleich der Ausgabedaten mehrerer Sensoren oder auf die Analyse der Eingangsdaten ausgehend von Expertenwissen (bspw. auf die Erkennung von schwierigen Umfeldbedingungen wie Nebel oder reduzierte Datenqualität durch Bewegungsunschärfe).
  • Offenbarung der Erfindung
  • Vor diesem Hintergrund schafft die vorliegende Erfindung ein Verfahren zur Datenvorhersage basierend auf einem Eingabedatum Y mittels eines Verfahrens des maschinellen Lernens (eng.: ML function). Sowie ein entsprechendes Computerprogramm, ein entsprechendes maschinenlesbares Speichermedium sowie eine entsprechende Vorrichtung.
  • Vorteile der Erfindung
  • Ein Aspekt der vorliegenden Erfindung ist ein Verfahren zur Datenvorhersage basierend auf einem Eingabedatum mittels eines Verfahrens des maschinellen Lernens (eng.: ML function).
  • Die Erfindung basiert auf der Erkenntnis, dass parallel zu der Datenvorhersage das Eingangsdatum mittels eines Variational Autoencoders auf ein Encoderdatum abzubilden. In Abhängigkeit von dem Encoderdatum und einer erwarteten Verteilung wird ein Distanzkriterium ermittelt. Das ermittelte Distanzkriterium repräsentiert ein Plausibilitätsmaß für die Datenvorhersage mittels des Verfahrens des maschinellen Lernens (eng.: ML function).
  • Unter einem Verfahren zur Datenvorhersagen ist vorliegend ein Verfahren aus dem Bereich der künstlichen Intelligenz zu verstehen.
  • Unter einem Verfahren des maschinellen Lernens ist vorliegend ein Verfahren zur künstlichen Generierung von Wissen aus Erfahrung zu verstehen. Diese Verfahren basieren auf der Erkenntnis, dass aus Beispielen (d.h. aus bekannten Daten) erlernte Muster verallgemeinerbar sind und dadurch in unbekannten neuen Daten die erlernten Muster erkannt werden können. Dadurch entsteht künstliches Wissen aus den unbekannten neuen Daten.
  • Unter einem Datum, insbesondere unter einem Eingangsdatum oder Encoderdatum ist vorliegend eine multidimensionale Datenrepräsentation zu verstehen. Im Bereich der Bildverarbeitung mittels eines Verfahrens aus dem Bereich der künstlichen Intelligenz kann dies bspw. die Repräsentation eines Bilds als Tensor nach Farbkanälen bspw. RGB und ggf. weiteren Kanälen. Das Encoderdatum kann dabei auch eindimensional sein und bspw. eine Menge von Klassen repräsentieren, denen das Eingangsdatum zugeordnet wird.
  • Unter einem Variational Autoencoder ist vorliegend ein Modell des maschinellen Lernens zu verstehen. Ein Variational Autoencoder ist eine Ausprägung des allgemeineren Modells eines Autoencoders. Ein Autoencoder weist einen Encoder- und einen Decoder-Teil auf. Der Encoder-Teil qΘ (zlx) bildet Eingabedaten x eines ersten Merkmalsraums (eng.: feature space) auf einen kleineren Merkmalsraum (eng.: smaller feature space) z ab. Der kleinere Merkmalsraum z wird latenter Raum (eng.: latent space) genannt. Dazu kann bspw. ein künstliches neuronales Netz eingesetzt werden. Für diese Aufgabe muss der Encoder-Teil trainiert werden, um Parameter Θ zu ermitteln, die erforderlich sind, um die Eingabedaten beim Abbilden auf den kleiner dimensionalen latenten Raum z effizient zu komprimieren. Im Decoder-Teil pΦ(x|z) werden die komprimierten Eingabedaten aus dem kleiner dimensionalen latenten Raum z in den Merkmalsraum mit der ursprünglichen Dimensionsgröße mittels den ebenfalls erlernten Parametern Φ rekonstruiert.
  • Zum Training eines Autoencoders wird die nachstehende Verlustfunktion minimiert: L o s s ( Θ , Φ ) = i = 1 N E z q Θ ( z , x i ) [ log p Φ ( x i | z ) ]
    Figure DE102018222294A1_0001
  • Dabei ist N die Anzahl der für das Training verwendeten Datenpunkte. Die Verlustfunktion ist die erwartete negative logarithmische Plausibilitätsfunktion (eng.: expected negative log-likelihood function) des i-ten Datenpunkts. Der Term fördert den Decoder-Teil die Eingangsdaten korrekt zu rekonstruieren.
  • Im Unterschied zu einem Autoencoder sagt ein Variational Autoencoder die Parameter der Verteilung des latenten Merkmalraums z voraus. Typischerweise ist das der Erwartungswert und die Varianz der Normalverteilung. Zusätzlich wird das Trainingsverfahren eines Variational Autoencoders durch die Minimierung der Kullback-Leibler-Divergenz zwischen der vorhergesagten Verteilung (repräsentiert durch Mittelwert und Varianz) und einer vorgegebenen Verteilung, typischerweise der Standard Normalverteilung, regularisiert. Diese Regularisierung zwingt die Einbettungen (eng.: embedings) auf einer verbundenen Mannigfaltigkeit ohne „Löcher“ zu liegen. Nach dem Training kann die erlernte Mannigfaltigkeit des latenten Merkmalsraum gesampelt werden, um neue Ausgabedaten zu generieren.
  • Zum Training eines Autoencoders wird die nachstehende Verlustfunktion minimiert: L o s s ( Θ , Φ ) = i = 1 N E z q Θ ( z , x i ) [ log p Φ ( x i | z ) ] + K L ( q Θ ( z | x i ) p ( z ) )
    Figure DE102018222294A1_0002
  • Dabei ist N die Anzahl der für das Training verwendeten Datenpunkte. KL(·) ist die Kullback-Leibler-Divergenz. p(·) ist die vorgegebene Verteilung, typischerweise die Standard Normalverteilung. Der erste Term ist die erwartete negative logarithmische Plausibilitätsfunktion (eng.: expected negative log-likelihood function) des i-ten Datenpunkts. Der Term fördert den Decoder die Eingangsdaten korrekt zu rekonstruieren. Der zweite Term berechnet die Kullback-Leibler-Divergenz zwischen der Verteilung des Encoders und der vorgegebenen Verteilung.
  • Unter einem künstlichen neuronalen Netz ist vorliegend ein Netz aus künstlichen Neuronen zur Informationsverarbeitung zu verstehen. Künstliche neuronale Netze durchleben im Wesentlichen drei Phasen. In einer initialen Phase wird eine Basistopologie, meist abhängig von der Aufgabenstellung, vorgegeben. Danach folgt eine Trainingsphase, in der die Basistopologie zur effizienten Lösung der Aufgabenstellung mittels Trainingsdaten angelernt wird. Innerhalb der Trainingsphase kann auch die Topologie des Netzes angepasst werden. Trainingsdaten zeichnen sich dadurch aus, dass typischerweise zu den Eingabedaten die gewünschten Ausgabedaten vorliegen. Schließlich folgt eine Anwendungsphase, in der das angelernte Netz auf Eingabedaten angesetzt wird, zu denen es keine gewünschten Ausgabedaten gibt. Die Ausgabedaten des angelernten Netzes stellen dann gemäß der Aufgabenstellung gesuchten Ausgabedaten dar.
  • Durch den Einsatz von künstlichen neuronalen Netzen lassen sich höher dimensionale Daten effizient in nieder dimensionale Räume abbilden und so auf einfach und schnelle Art und Weise komprimieren.
  • Unter einem Plausibilitätsmaß ist vorliegend ein Maß zu verstehen, das die Abweichung zwischen den Eingabedaten und den Trainingsdaten repräsentiert. Über dieses Maß kann festgestellt werden, ob die Eingabedaten eine zu den Trainingsdaten passende Verteilung aufweisen.
  • Das Verfahren gemäß der vorliegenden Erfindung weist den Vorteil auf, dass integral über das ermittelte Plausibilitätsmaß entschieden wird, ob das durch das Verfahren des maschinellen Lernens zu verarbeitende Eingangsdatum der gleichen Verteilung zugeordnet werden kann, wie die ursprünglich eingesetzten Trainingsdaten.
  • Nach einer Ausführungsform des Verfahrens gemäß der vorliegenden Erfindung wird das Distanzkriterium mittels einer logarithmischen Plausibilitätsfunktion (eng.: log-likelihood function) des Encoderdatums ermittelt.
  • Diese Ausführungsform basiert auf der Erkenntnis, dass der Variational Autoencoder darauf trainiert wird eine komprimierte Repräsentation der multidimensionalen Eingabedaten zu finden. Demnach stellen die Variablen des latenten Merkmalsraums die gewünschte Verteilung dar. Dies führt dazu, dass die Komprimierung von neuen unbekannten Eingabedaten zu Ergebnissen innerhalb der gewünschten Verteilung führen muss, wenn die Eingabedaten der gleichen bzw. einer ähnlichen Verteilung entstammen, wie die Trainingsdaten, mit denen der Variational Autoencoder trainiert wurde. Im Umkehrschluss zeigen Ergebnisse der Komprimierung, die außerhalb der gewünschten Verteilung laden, dass die Eingabedaten einer Verteilung entstammen, die nicht der Verteilung der Trainingsdaten gleicht oder dieser zumindest ähnlich ist. Dies kann ein Anzeichen für eine Verteilungsverschiebung der Eingabedaten sein und wirkt sich auf das Plausibilitätsmaß für die Datenvorhersage des parallel ablaufenden Verfahrens des maschinellen Lernens aus.
  • Ausgehend von dieser Erkenntnis kann auf eine Rekonstruktion der komprimierten Eingabedaten verzichtet werden.
  • Nach einer Ausführungsform des Verfahrens gemäß der vorliegenden Erfindung wird zur Bestimmung der Plausibilität das ermittelte Distanzkriterium bzw. die Abbildung mittels der logarithmischen Plausibilitätsfunktion (eng.: log-likelihood function) mit einem vorgegebenen Schwellenwert verglichen. Denkbar ist es ebenso anstelle eines vorgegebenen Schwellenwerts eine kontinuierliche Funktion als Plausibilitätsmaß vorzugeben.
  • Das Distanzkriterium dist kann bestimmt werden z.B. durch die Kullback-Leibler-Divergenz (KL-Divergenz) zwischen der Verteilung im latenten Merkmalsraum (eng.: latent space) und der angenommen Verteilung gegeben durch KL(qΘ(z|xi)||p(z)). Da der Encoder so trainiert wurde, dass die KL-Divergenz für die Trainingsdaten möglichst klein ist, wird diese für neue Daten ansteigen, sofern diese aus einer anderen Verteilung als die Trainingsdaten stammen. In diesem Fall kann die Konfidenz z.B. berechnet werden durch Konfidenz e-dist(z'|z)t, wobei der Parameter t basierend auf den Trainingsdaten so bestimmt wird, dass auf den Trainingsdaten Werte nahe 1 berechnet werden). Wenn die Distanz dist zwischen neuen Daten und Trainingsdaten steigt, vergrößert sich der Wert dist(z'|z) und damit sinkt die geschätzte Konfidenz der Ausgabe des Netzes.
  • Alternativ kann z.B. auch die logarithmische Plausibilitätsfunktion (eng.: log-likelihood function) l benutzt werden. Im Falle einer Normalverteilung mit Mittelwert µ und Varianz σ2: l ( μ , σ 2 , z ' i , , z ' n ) = n 2 ln ( 2 π ) n 2 ln ( σ 2 ) 1 2 σ 2 i = 1 n ( z ' i μ ) 2 ,
    Figure DE102018222294A1_0003
    wobei hier n die Anzahl der Dimensionen des latenten Merkmalsraumes ist. Für die Berechnung eines kontinuierlichen Konfidenzwertes muss hier dann ebenfalls basierend auf den Ergebnissen für die Trainingsdaten eine Skalierung vorgenommen werden. Anstatt für µ und σ2 die Werte der erwarteten Verteilung zu benutzen, können auch die hier durchschnittlich berechneten Werte auf den Trainingsdaten benutzt werden, falls diese noch stark von den Werten der erwarteten Verteilung abweichen. Die Formel ist dann entsprechend anzupassen.
  • Diese Ausführungsform führt ein einfaches und leicht einstellbares Kriterium für das Plausibilitätsmaß ein. So kann abhängig von der Anwendung des Verfahrens des maschinellen Lernens der Schwellenwert für das Plausibilitätsmaß angepasst werden.
  • Nach einer Ausführungsform des Verfahrens gemäß der vorliegenden Erfindung sind das Verfahren des maschinellen Lernens und der Variational Autoencoder auf der gleichen bzw. auf einer ähnlichen Verteilung der Eingabedaten trainiert.
  • Nach einer Ausführungsform des Verfahrens gemäß der vorliegenden Erfindung, ist das Verfahren des maschinellen Lernens ein Verfahren zur Objektklassifizierung bzw. Objekterkennung.
  • Das Verfahren kann aus dem Bereich des zumindest teilweise automatisierten Fahrens sein.
  • Die vorliegende Erfindung eignet sich in besonderem Maße zu der Verwendung in einem Steuerungssystem für ein Aktorsystem. Unter einem Aktorsystem kann vorliegend ein Aktor in seiner Umgebung verstanden werden.
  • Ein Steuerungssystem nimmt typischerweise über mindestens einen Sensor den Zustand des Aktorsystems, d.h. des Aktors und dessen Umgebung auf und ermittelt entsprechende Ansteuersignale für den Aktor, um das übergeordnete Steuerungsziel zu erreichen.
  • Zur Ermittlung der entsprechenden Ansteuerungssignale können Sensorsignale des mindestens einen Sensors oder davon abgeleitete Signale, d.h. nachbearbeitete, insbesondere ausgewählte Sensorsignale, einem Verfahren zur Datenvorhersage gemäß der vorliegenden Erfindung zugeführt werden.
  • Über das Verfahren des maschinellen Lernens des Verfahrens der vorliegenden Erfindung wird (künstliches) Wissen generiert, das zur Steuerung des Aktorsystems, d.h. das zur Ermittlung entsprechender Ansteuersignale, herangezogen werden kann.
  • Gemäß der vorliegenden Erfindung wird für dieses Wissen ein Plausibilitätsmaß erzeugt. Dieses Plausibilitätsmaß kann herangezogen werden, um die Vertrauenswürdigkeit des erzeugten Wissens zu kennzeichnen und entsprechend dem ermittelten Plausibilitätsmaß das Wissen bei der Ermittlung entsprechender Ansteuersignale zu berücksichtigen. Bspw. das Wissen mit einer anpassten Gewichtung zu berücksichtigen oder, je nach Ausgestaltung, das Wissen als unplausibel zu verwerfen und dementsprechend nicht zu berücksichtigen.
  • Das Steuerungssystem kann insbesondere zur Steuerung eines zumindest teilweise automatisiert gesteuerten Roboters eingesetzt werden. Ein solcher zumindest teilweise automatisiert gesteuerte Roboter kann dabei ein zumindest teilweise automatisiert gesteuertes Fahrzeug, insbesondere Kraftfahrzeug, sein.
  • In einer solchen Ausgestaltung kann es sich bei dem mindestens einen Sensor um einen Umfeldsensor aus dem Automobilbereich, wie bspw. einem Video-, Radar-, Ultraschall-, Lidar-, Positionssensor (bspw. GNSS-Sensor) udgl., handeln. Ferner kann es sich bei dem mindestens einen Sensor um einen Zustandssensor aus dem Automobilbereich, wie bspw. einem Beschleunigungs-, Drehraten-, Druck-, Kraft-, Rotations-, Temperatur-, chemischen Sensor (bspw. Lambda-Sonde) udgl. handeln.
  • In einer solchen Ausgestaltung kann es sich bei dem Aktor um ein System zur Längs- (Brems-, Antriebssystem) oder Querbeschleunigung (Lenkungssystem) sowie um ein Sicherheitssystem, wie bspw. einem Airbagsystem oder einem System zum Schutz von Verkehrsteilnehmern (bspw. Fußgänger) oder ein Komfortsystem, wie bspw. der Entertainmentanlage, der Klimaanlage, der Fenstersteuerung, der Sitzsteuerung, des Beleuchtungssystems udgl., des Fahrzeugs handeln.
  • Ein weiterer Aspekt der vorliegenden Erfindung ist ein Computerprogramm, das eingerichtet ist, alle Schritte einer Ausführungsform des Verfahrens gemäß der vorliegenden Erfindung auszuführen.
  • Ein weiterer Aspekt der vorliegenden Erfindung ist ein maschinenlesbares Speichermedium, auf dem das Computerprogramm gemäß der vorliegenden Erfindung gespeichert ist.
  • Zeichnungen
  • Ein weiterer Aspekt der vorliegenden Erfindung ist eine Vorrichtung, die eingerichtet ist, alle Schritte einer Ausführungsform des Verfahrens gemäß der vorliegenden Erfindung auszuführen. Dazu weist die Vorrichtung entsprechende Mittel auf, um die jeweiligen Schritte des Verfahrens auszuführen. Bei diesen Mitteln kann es sich um entsprechend gestaltete bzw. eingerichtete Schnittstellen zur Ein- und Ausgabe, Recheneinheiten (Prozessoren, Mikroprozessoren, ASIC udgl.) und Speichereinheiten (RAM, ROM etc.) handeln.
  • Figurenliste
  • Weitere Merkmale und Vorteile der Aspekte der vorliegenden Erfindung werden nachfolgend anhand von Ausführungsformen mit Bezug auf die Figuren erläutert.
  • Es zeigen:
    • 1 eine schematische Darstellung eines Autoencoders;
    • 2 eine schematische Darstellung einer Datenvorhersage gemäß der vorliegenden Erfindung;
    • 3 ein Ablaufdiagramm einer Ausführungsform eines Verfahrens gemäß der vorliegenden Erfindung.
  • 1 zeigt eine schematische Darstellung eines Variational Autoencoders 1. Ein Variational Autoencoder 1 weist einen Encoder-Teil 11 und einen Decoder-Teil 12 auf. Der Encoder-Teil 11 qΘ (zlx) bildet Eingabedaten x eines ersten Merkmalsraums (feature space) auf einen kleineren Merkmalsraum (smaller feature space) z ab. Der kleinere Merkmalsraum z wird latenter Raum (latent space) genannt. Dazu kann bspw. ein künstliches neuronales Netz eingesetzt werden. Für diese Aufgabe muss der Encoder-Teil 11 trainiert werden, um die Parameter Θ zu ermitteln, die erforderlich sind, um die Eingabedaten x beim Abbilden auf den kleiner dimensionalen latenten Raum z effizient und entsprechend einer vorgegebenen Verteilung p zu komprimieren. Im Decoder-Teil 12 pΦ(x|z) werden die komprimierten Eingabedaten aus dem kleiner dimensionalen latenten Raum z in den Merkmalsraum mit der ursprünglichen Dimensionsgröße mittels den erlernten Parametern Φ rekonstruiert.
  • Zum Training eines Variational Autoencoders 1 wird die nachstehende Verlustfunktion minimiert: L o s s ( Θ , Φ ) = i = 1 N E z q Θ ( z , x i ) [ log p Φ ( x i | z ) + K L ( q Θ ( z | x i ) p ( z ) ) ]
    Figure DE102018222294A1_0004
  • Dabei ist N die Anzahl der für das Training verwendeten Datenpunkte. KL(·) ist die Kullback-Leibler-Divergenz. p(·) ist die vorgegebene Verteilung, typischerweise die Standard Normalverteilung. Der erste Term ist die erwartete negative logarithmische Plausibilitätsfunktion (eng.: expected negative log-likelihood function) des i-ten Datenpunkts. Der Term fördert den Decoder die Eingangsdaten korrekt zu rekonstruieren. Der zweite Term berechnet die Kullback-Leibler-Divergenz zwischen der Verteilung des Encoders und der vorgegebenen Verteilung.
  • 2 zeigt eine schematische Darstellung einer Datenvorhersage gemäß der vorliegenden Erfindung. In der Darstellung werden Eingabedaten y sowohl einer Funktion des maschinellen Lernens 2 als auch einem Variational Autoencoder 10 gemäß der vorliegenden Erfindung zugeführt. Während die Funktion des maschinellen Lernens 2 die Eingabedaten gemäß ihrem Modell verarbeitet und eine entsprechende Datenvorhersage erfolgt. Werden die Eingabedaten y mittels des Variational Autoencoders 10 im Encoder-Teil 11 des Variational Autoencoders 10 auf den latenten Merkmalsraum z' abgebildet. Ferner liegt der Erfindung die gelernte Verteilung des Encoder-Teils 11 in Form einer Datenquelle 24 vor. Die Datenquelle 24 kann bspw. eine Datenbank oder ein geeigneter Datenspeicher sein. In Abhängigkeit von den abgebildeten Daten z' und der gelernten Verteilung z wird ein Distanzkriterium 22 ermittelt. Auf Basis des ermittelten Distanzkriteriums 22 wird ein Plausibilitätsmaß 23 für die Datenvorhersage des Verfahrens des maschinellen Lernens 2 bestimmt bzw. eine Plausibilitätsprüfung der Datenvorhersage durchgeführt.
  • In der dargestellten Ausführungsform ist der Variational Autoencoder 10 parallel zu der Funktion des maschinellen Lernens 2 dargestellt. Es ist ebenso denkbar, dass der Variational Autoencoder 10 ganz oder teilweise in die Funktion des maschinellen Lernens 2 intergiert ist. Das bedeutet, dass ein Teil der Funktion des maschinellen Lernens 2 (bspw. ein Merkmalsextraktor) verwendet wird, um die Merkmale für den Variational Autoencoder 10 zu extrahieren.
  • 3 zeigt ein Ablaufdiagramm einer Ausführungsform eines Verfahrens gemäß der vorliegenden Erfindung. Das Verfahren beginnt im Schritt 301. In Schritt 302 erfolgt eine Datenvorhersage für Eingabedaten y mittels einer Funktion des maschinellen Lernens 2. Parallel zu der Datenvorhersage erfolgt die der Eingabedaten y auf den latenten Merkmalsraum z' des Variational Autoencoders 10 gemäß der vorliegenden Erfindung. In Schritt 304 wird ein Distanzkriterium 23 in Bezug auf die komprimierten Eingabedaten z' und die gelernte Verteilung z des Encoder-Teils 11 des Variational Autoencoders 10 gemäß der vorliegenden Erfindung ermittelt. Dieses Distanzkriterium 22 repräsentiert ein Plausibilitätsmaß 23 für die Datenvorhersage basierend auf den Eingabedaten y mittels der Funktion des maschinellen Lernens 2. In Schritt 305 kann die Ausgabe der vorhergesagten Daten zusammen bzw. in Abhängigkeit des Plausibilitätsmaßes 23 bzw. abhängig von dem Ergebnis einer Plausibilitätsprüfung basierend auf dem ermittelten Distanzkriterium 22 erfolgen.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Nicht-Patentliteratur
    • S. Burton, L. Gauerhof, and C. Heinzemann, „Making the case for safety of machine learning in highly automated driving,“ in Computer Safety, Reliability, and Security, S. Tonetta, E. Schoitsch, and F. Bitsch, Eds. Cham: Springer International Publishing, 2017, pp. 5-16 [0004]
    • G. E. Hinton and R. R. Salakhutdinov, „Reducing the dimensionality of data with neural networks,“ Science, vol. 313, no. 5786, pp. 504-507, 2006 [0005]
    • C. Doersch, „Tutorial on Variational Autoencoders,“ ArXiv e-prints, Jun. 2016 [0006]

Claims (8)

  1. Verfahren (300) zur Datenvorhersage basierend auf einem Eingabedatum (y) mittels eines Verfahrens des maschinellen Lernens (2), dadurch gekennzeichnet, dass parallel zu der Datenvorhersage (301) das Eingangsdatum (y) mittels eines Variational Autoencoders (10) auf ein Encoderdatum (z') abgebildet (302) wird, wobei ein Distanzkriterium (23) in Abhängigkeit von dem Encoderdatum (z') und einer erwarteten Verteilung (z) ermittelt (303) wird, wobei das Distanzkriterium (22) ein Plausibilitätsmaß (23) für die Datenvorhersage repräsentiert.
  2. Verfahren (300) nach Anspruch 1, wobei das Distanzkriterium (22) mittels einer Plausibilitätsfunktion, insbesondere einer logarithmischen Plausibilitätsfunktion, des Encoderdatums (z') ermittelt wird.
  3. Verfahren (300) nach Anspruch 1 oder 2, wobei zur Bestimmung der Plausibilität das ermittelte Distanzkriterium (22) und/oder das Ergebnis der Ermittlung mittels der logarithmischen Plausibilitätsfunktion mit einem vorgegebenen Schwellenwert verglichen wird.
  4. Verfahren (300) nach Anspruch einem der vorhergehenden Ansprüche, wobei das Verfahren des maschinellen Lernens (2) und der Variational Autoencoder (10) auf der gleichen und/oder einer ähnlichen Verteilung der Eingabedaten trainiert sind.
  5. Verfahren (300) nach einem der vorhergehenden Ansprüche, wobei das Verfahren des maschinellen Lernens (2) ein Verfahren zur Objektklassifikation und/oder Objekterkennung, insbesondere aus dem Bereich des zumindest teilweise automatisierten Fahrens, ist.
  6. Computerprogramm, das eingerichtet ist, alle Schritte eines Verfahrens (300) gemäß einem der vorhergehenden Ansprüche auszuführen.
  7. Maschinenlesbares Speichermedium, auf das Computerprogramm nach Anspruch 6 gespeichert ist.
  8. Vorrichtung, die eingerichtet ist, alle Schritte eines Verfahrens (300) gemäß einem der Ansprüche 1 bis 5 auszuführen.
DE102018222294.0A 2018-12-19 2018-12-19 Verfahren, Computerprogramm, maschinenlesbares Speichermedium sowie Vorrichtung zur Datenvorhersage Pending DE102018222294A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE102018222294.0A DE102018222294A1 (de) 2018-12-19 2018-12-19 Verfahren, Computerprogramm, maschinenlesbares Speichermedium sowie Vorrichtung zur Datenvorhersage
PCT/EP2019/084172 WO2020126597A1 (de) 2018-12-19 2019-12-09 Verfahren, computerprogramm, maschinenlesbares speichermedium sowie vorrichtung zur datenvorhersage

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102018222294.0A DE102018222294A1 (de) 2018-12-19 2018-12-19 Verfahren, Computerprogramm, maschinenlesbares Speichermedium sowie Vorrichtung zur Datenvorhersage

Publications (1)

Publication Number Publication Date
DE102018222294A1 true DE102018222294A1 (de) 2020-06-25

Family

ID=68841113

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102018222294.0A Pending DE102018222294A1 (de) 2018-12-19 2018-12-19 Verfahren, Computerprogramm, maschinenlesbares Speichermedium sowie Vorrichtung zur Datenvorhersage

Country Status (2)

Country Link
DE (1) DE102018222294A1 (de)
WO (1) WO2020126597A1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102020203819A1 (de) 2020-03-24 2021-09-30 Volkswagen Aktiengesellschaft Verfahren zum Betreiben eines zumindest teilautomatisiert fahrenden Fahrzeugs und Fahrzeug
US11615558B2 (en) 2020-02-18 2023-03-28 Dspace Gmbh Computer-implemented method and system for generating a virtual vehicle environment

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112801273A (zh) * 2021-01-29 2021-05-14 江苏大学 一种基于变分自编码器和强化学习的自动驾驶控制器及训练方法
CN112883656B (zh) * 2021-04-14 2022-11-01 北京理工大学 一种基于正常运行数据的动力舱失效风险评价方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE202017102235U1 (de) * 2017-04-13 2017-05-12 Robert Bosch Gmbh Trainingssystem
DE202017102238U1 (de) * 2017-04-13 2017-05-12 Robert Bosch Gmbh Aktorsteuerungssystem

Non-Patent Citations (11)

* Cited by examiner, † Cited by third party
Title
AMODEI, Dario [u.a.]: Concrete problems in AI safety. 25-07-2016. 29 S. URL: https://arxiv.org/pdf/1606.06565.pdf [abgerufen am 2019-03-20]. - arXiv:1606.06565 *
BURTON, Simon ; GAUERHOF, Lydia ; HEINZEMANN, Christian: Making the case for safety of machine learning in highly automated driving. In: Computer safety, reliability, and security : SAFECOMP 2017 workshops, ASSURE, DECSoS, SASSUR, TELERISE, and TIPS, Trento, Italy, September 12, 2017, proceedings. Cham : Springer , 2017 (Lecture notes in computer science ; 10489). S. 5-16. - ISBN 978-3-319-66283-1. DOI: 10.1007/978-3-319-66284-8 *
C. Doersch, „Tutorial on Variational Autoencoders," ArXiv e-prints, Jun. 2016
DOERSCH, Carl: Tutorial on variational autoencoders. 19-06-2016. arXiv:1606.05908v1. S. 1-22. URL: https://arxiv.org/pdf/1606.05908v1.pdf [abgerufen am 2019-04-04] *
G. E. Hinton and R. R. Salakhutdinov, „Reducing the dimensionality of data with neural networks," Science, vol. 313, no. 5786, pp. 504-507, 2006
HINTON, G. E. ; SALAKHUTDINOV, R. R.: Reducing the dimensionality of data with neural networks. In: Science, Bd. 313, 2006, H. 5786, S. 504-507. - ISSN 0036-8075 (p); 1095-9203 (e). DOI: 10.1126/science.1127647. URL: https://www.cs.toronto.edu/~hinton/science.pdf [abgerufen am 2018-06-05] *
KINGMA, Diederik P.; WELLING, Max: Auto-encoding variational bayes. 2014. URL: https://arxiv.org/abs/1312.6114 *
KOENIG, Alexander [et al.]: Bridging the gap between open loop tests and statistical validation for highly automated driving. In: SAE International journal of transportation safety, Vol. 5, 2017, No. 1, S. 81-87. - ISSN 2327-5626 *
POMERLEAU, Dean A.: Input reconstruction reliability estimation. In: Advances in neural information processing systems 5. San Mateo, Calif.: Conference on Neural Information Processing Systems, Natural and Synthetic, 1993. S. 279-286. - ISBN 1-55860-274-7 *
S. Burton, L. Gauerhof, and C. Heinzemann, „Making the case for safety of machine learning in highly automated driving," in Computer Safety, Reliability, and Security, S. Tonetta, E. Schoitsch, and F. Bitsch, Eds. Cham: Springer International Publishing, 2017, pp. 5-16
ZHANG, Mengshi [et al.]: DeepRoad: GAN-based metamorphic testing and input validation framework for autonomous driving systems. In: Proceedings of the 33rd ACM/IEEE International Conference on Automated Software Engineering, September 03 – 07, 2018. S. 132-142. - ISBN 978-1-4503-5937-5 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11615558B2 (en) 2020-02-18 2023-03-28 Dspace Gmbh Computer-implemented method and system for generating a virtual vehicle environment
DE102020203819A1 (de) 2020-03-24 2021-09-30 Volkswagen Aktiengesellschaft Verfahren zum Betreiben eines zumindest teilautomatisiert fahrenden Fahrzeugs und Fahrzeug

Also Published As

Publication number Publication date
WO2020126597A1 (de) 2020-06-25

Similar Documents

Publication Publication Date Title
DE102018222294A1 (de) Verfahren, Computerprogramm, maschinenlesbares Speichermedium sowie Vorrichtung zur Datenvorhersage
DE102017107264A1 (de) Sichtbasierte regenerkennung unter verwendung des tiefen lernens
DE102016121768A9 (de) Verfahren und vorrichtung zur unterscheidung von fahrern basierend auf dem fahrverhalten
DE102017205093A1 (de) Verfahren und System zur Vorhersage von Sensorsignalen eines Fahrzeugs
DE102018208763A1 (de) Verfahren, Vorrichtung und Computerprogramm zum Betreiben eines maschinellen Lernsystems
EP3393875B1 (de) Verfahren zum verbesserten erkennen von objekten durch ein fahrerassistenzsystem
EP2054274A1 (de) Verfahren und vorrichtung zur ansteuerung von personenschutzmitteln
DE102010038567A1 (de) Bilderkennungsvorrichtung mit mehreren Klassifizierern
WO2018202552A1 (de) Verfahren und vorrichtung zum klassifizieren von objekten im umfeld eines kraftfahrzeuges
DE112020003343T5 (de) System und verfahren mit einem robusten tiefen generativen modell
DE102019209463A1 (de) Verfahren zur Bestimmung eines Vertrauenswertes eines Objektes einer Klasse
DE102021207613A1 (de) Verfahren zur Qualitätssicherung eines Systems
DE102017128082A1 (de) Meta-Architektur-Design für ein CNN-Netzwerk
DE102020105783A1 (de) Verfahren zur Erzeugung eines reduzierten neuronalen Netzes
EP3857455A1 (de) Maschinelles lernsystem, sowie ein verfahren, ein computerprogramm und eine vorrichtung zum erstellen des maschinellen lernsystems
DE102018222264A1 (de) Verfahren, Computerprogramm, maschinenlesbares Speichermedium sowie Vorrichtung zur Datenvorhersage
DE102019213459A1 (de) Verfahren zum Komprimieren eines Neuronalen Netzes
WO2006134011A1 (de) Verfahren zur rechnergestützten verarbeitung von digitalen daten
DE102019114049A1 (de) Verfahren zur Validierung eines Fahrerassistenzsystems mithilfe von weiteren generierten Testeingangsdatensätzen
DE102018203137A1 (de) Verfahren, Vorrichtung und Computerprogramm zum Betreiben eines zumindest teilautonomen Fahrzeugs
DE102022209787A1 (de) Verfahren zum Trainieren eines Generative Adversarial Network
DE102019119443A1 (de) Objektverfolgung
DE102020208878A1 (de) Verfahren zur Kurvenerkennung
DE102022213064A1 (de) Erkennung unbekannter Objekte durch neuronale Netze für Fahrzeuge
DE102022206603A1 (de) Verfahren zur Handdetektion, Computerprogramm, und Vorrichtung

Legal Events

Date Code Title Description
R163 Identified publications notified