-
Die Erfindung betrifft ein Verfahren, ein System und ein Computerprogrammprodukt zur Analyse von Zeitreihendatensätzen einer Entität.
-
Eine Entität wie ein Fahrzeug oder ein Industriebetrieb weisen eine Vielzahl von Sensoren auf, die fortlaufend Daten aufnehmen, um dynamische Vorgänge abzubilden. Bei den dynamischen Vorgängen kann es sich um einen Beschleunigungsvorgang bei einem Fahrzeug oder die Unterbrechung der Zuführung einer Rohstoffkomponente in einem Produktionsprozess handeln. Es entstehen somit in Abhängigkeit von der Zeit Datensätze, die hinsichtlich ihres zeitlichen Verlaufs verschiedene Muster und Strukturen aufweisen. Bestimmte Strukturen oder Muster können jedoch Indikatoren für kritische Ereignisse und Änderungen in der Umgebung oder im Prozessablauf darstellen. Während die Datensituation zu einem bestimmten Zeitpunkt relativ einfach analysiert werden kann, ist dies allerdings für eine bestimmte Struktur oder ein bestimmtes Muster in einem Zeitreihendatensatz schwieriger, da die Suchabfrage häufig nicht eindeutig genug formuliert werden kann. Um einen sicheren Betrieb einer Entität zu gewährleisten, ist es jedoch sinnvoll, Indikatoren, die insbesondere auf kritische Ereignisse hinweisen können, frühzeitig zu erkennen.
-
Für die Analyse von Zeitreihendatensätze werden Algorithmen eingesetzt. Allerdings handelt es sich hierbei eher um klassische Verfahren wie Differential- und Integralrechnung, die aber weniger geeignet sind, bestimmte Muster in einem Zeitreihendatensatz zu finden. Da zudem häufig nicht bekannt ist, nach welchen Mustern in einem Zeitreihendatensatz wie einem Graphen gesucht werden soll, ist bereits die Formulierung einer Suchanfrage mit Schwierigkeiten verbunden. Daher ist auch häufig eine Echtzeitanalyse nicht möglich, die jedoch erforderlich ist, wenn zeitgleich auf Änderungen der Datenstruktur reagiert werden soll.
-
Die
US 2016/0371376 A1 offenbart ein iteratives Suchverfahren nach logischen Mustern für Phänomene in Zeitreihen aus fahrzeugbezogenen Sensordaten. Die logischen Muster werden durch die Verwendung von Symbolen klassifiziert.
-
Die
US 2018/0300333 A1 offenbart ein Verfahren zur Auswahl und Einstufung von Teilmengen von Merkmalen. Eine Basisroutine wird auf einen Satz von Merkmalen ausgeführt, um einen anfänglichen Lösungssatz zu erzeugen. Mittels iterativer Verfahrensschritte werden weitere Lösungssätze erzeugt, die miteinander kombiniert werden.
-
Die
WO 2015/009310 A1 offenbart ein Verfahren zur Erkennung von Änderungen in Modellen, die zur Analyse von Zeitreihendaten verwendet werden.
-
Die der Erfindung zu Grunde liegende Aufgabe besteht nun darin, ein Verfahren, ein System und ein Computerprogrammprodukt zur Analyse von Zeitreihendatensätzen einer Entität zu schaffen, das sich durch eine hohe Zuverlässigkeit, Sicherheit und Genauigkeit auszeichnet und sich einfach implementieren lässt.
-
Gemäß der vorliegenden Erfindung werden ein Verfahren, ein System und ein Computerprogrammprodukt vorgeschlagen, durch die eine treffsichere Suchanfrage zur Analyse von in einer zeitlichen Reihenfolge erfassten Daten einer Entität in Echtzeit ermöglicht wird, so dass gezielt nach bestimmten Strukturen und Mustern in einem Zeitreihendatensatz gesucht werden kann, um daraus Rückschlüsse auf die den Daten zugrundeliegenden Prozesse ziehen zu können.
-
Diese Aufgabe wird hinsichtlich eines Verfahrens durch die Merkmale des Patentanspruchs 1, hinsichtlich eines Systems durch die Merkmale des Patentanspruchs 12, und hinsichtlich eines Computerprogrammprodukts durch die Merkmale des Patentanspruchs 15 erfindungsgemäß gelöst. Die weiteren Ansprüche betreffen bevorzugte Ausgestaltungen der Erfindung.
-
Gemäß einem ersten Aspekt stellt die Erfindung ein Verfahren zur Analyse von Zeitreihendatensätzen einer Entität mittels eines Datenanalysemoduls bereit. Das Verfahren umfasst die folgenden Verfahrensschritte: Generieren zumindest eines ersten Zeitreihendatensatzes aus mittels zumindest eines Sensors in einer zeitlichen Reihenfolge ermittelten Daten und/oder aus in Datenbanken in einer zeitlichen Reihenfolge gespeicherten historischen Daten, wobei der Zeitreihendatensatz zumindest einen Teilaspekt der Entität wie beispielsweise Prozessschritte abbildet; Bestimmen zumindest einer ersten Datensequenz in einem ersten Zeitintervall Δt1 in dem Zeitreihendatensatz, wobei die erste Datensequenz eine bestimmte Struktur oder ein bestimmtes Muster aufweist; Zuordnen der ersten Datensequenz zu einem Suchabfragesatz; Vergleichen der Struktur oder des Musters der ersten Datensequenz mit zumindest einer Struktur oder einem Muster einer zweiten Datensequenz in einem zweiten Zeitintervall Δt2 in dem Zeitreihendatensatz; Berechnen eines Ähnlichkeitsindexes zwischen der ersten Datensequenz und der zweiten Datensequenz; Zuordnen der zweiten Datensequenz zu dem Suchabfragesatz, wenn ein definierter Schwellenwert oder ein Kennwert des Ähnlichkeitsindexes erreicht wurde; Anwenden des Suchabfragesatzes auf zumindest einen zweiten Zeitreihendatensatz, der aus mittels zumindest eines Sensors in einer zeitlichen Reihenfolge ermittelten Daten und/oder aus in Datenbanken in einer zeitlichen Reihenfolge gespeicherten historischen Daten in einer zeitlichen Reihenfolge generiert wird, zur Bestimmung von Datensequenzen, die Ähnlichkeiten mit der Struktur oder dem Muster der in dem Suchabfragesatz enthaltenen Datensequenzen aufweisen.
-
In einer Weiterentwicklung ist vorgesehen, dass der Suchabfragesatz zumindest eine dritte Datensequenz enthält, die eine durch einen Ähnlichkeitsindex bestimmte Ähnlichkeit mit der Struktur oder dem Muster der ersten Datensequenz aufweist.
-
In einer vorteilhaften Ausführungsform ist vorgesehen, dass zusätzlich zu dem Suchabfragesatz definierte Suchparameter für die Analyse des ersten und/oder zumindest zweiten Zeitreihendatensatzes verwendet werden.
-
Insbesondere wird der Suchabfragesatz in einer Datenbank gespeichert, wobei die Datenbank insbesondere als Cloud-Computing-Infrastruktur ausgebildet ist.
-
Vorteilhafterweise werden Analyse- und Suchergebnisse auf einem Ausgabemodul ausgegeben.
-
In einer weiteren Ausführungsform ist vorgesehen, dass das Datenanalysemodul Algorithmen der künstlichen Intelligenz und des Maschinenlernens, insbesondere Deep Learning, verwendet.
-
Insbesondere sind die Algorithmen als neuronale Netze, rekurrente neuronale Netze, gefaltete neuronale Netze, und/oder Transformer mit Encodern und Decodern und/oder Lernverstärkungs-Agenten (LV) (Reinforcement Learning Agent) ausgebildet.
-
In einer weiteren Ausführungsform sind die Sensoren als Uhren, Zähler, Drucksensoren, Piezosensoren, Drehzahlsensoren, kapazitive Sensoren, induktive Sensoren, Temperatursensoren, Beschleunigungssensoren, Geschwindigkeitssensoren, bildaufnehmende Kameras im sichtbaren Bereich, UV-Kameras im ultravioletten Bereich, IR-Kameras im infraroten Bereich, LIDAR (Light detection and ranging) Systeme mit optischer Abstands- und Geschwindigkeitsmessung, stereoskopische optische Kamerasysteme, Ultraschallsysteme, Radarsysteme ausgebildet.
-
In einer Weiterbildung ist vorgesehen, dass zumindest ein Suchparameter eine Dimension oder ein Material oder eine Materialzusammensetzung oder eine Formgebung oder einen Kennwert oder einen Sicherheitsfaktor oder einen Identifikationscode oder einen Ort oder einen Zeitpunkt oder einen thermischen Widerstand oder einen elektrischen Widerstand oder eine Spannung oder eine Leitfähigkeit oder eine Festigkeit oder ein Bruchverhalten oder eine Farbe oder eine Dichte oder eine plastische Verformung oder einen Spannungs-, Druck-, Biegungswiderstand oder eine Werkstoffeigenschaft oder eine Oberflächeneigenschaft oder eine Wärmebehandlung oder eine physiologische Eigenschaft wie Blutdruck oder Herzfrequenz darstellt.
-
Vorteilhaftweise steht das Datenanalysemodul mit zumindest einem Sensor und/oder zumindest einer Datenbank und/oder einer Cloud-Computing-Infrastruktur mittels einer Kommunikationsverbindung in Verbindung, und die Kommunikationsverbindung ist als Mobilfunkverbindung und/oder Nahfeldkommunikationsverbindung wie Bluetooth®, Ethernet, NFC (near field communication) oder Wi-Fi® ausgebildet.
-
In einer weiteren Ausführungsform ist/sind das Datenanalysemodul und/oder die Sensoren mit Funkmodulen des 5G-Standards ausgestattet.
-
Gemäß einem zweiten Aspekt stellt die Erfindung ein System zur Analyse von Zeitreihendatensätzen einer Entität bereit. Das System umfasst ein Datenanalysemodul und zumindest einen Sensor. Das Datenanalysemodul ist ausgebildet, zumindest einen ersten Zeitreihendatensatz aus mittels zumindest eines Sensors in einer zeitlichen Reihenfolge ermittelten Daten und/oder aus in Datenbanken in einer zeitlichen Reihenfolge gespeicherten historischen Daten zu generieren, wobei der Zeitreihendatensatz zumindest einen Teilaspekt der Entität wie beispielsweise Prozessschritte abbildet; zumindest eine erste Datensequenz in einem ersten Zeitintervall Δt1 in dem Zeitreihendatensatz zu bestimmen, wobei die Datensequenz eine bestimmte Struktur oder ein bestimmtes Muster aufweist; die erste Datensequenz einem Suchabfragesatz zuzuordnen; die Struktur oder das Muster der ersten Datensequenz mit einer Struktur oder einem Muster zumindest einer zweiten Datensequenz in einem zweiten Zeitintervall Δt2 in dem Zeitreihendatensatz zu vergleichen; einen Ähnlichkeitsindex zwischen der Struktur oder dem Muster der ersten Datensequenz und der Struktur oder dem Muster der zweiten Datensequenz zu berechnen; die zweite Datensequenz dem Suchabfragesatz zuzuordnen, wenn ein definierter Schwellenwert oder ein Kennwert des Ähnlichkeitsindexes erreicht wurde; und den Suchabfragesatz auf zumindest einen zweiten Zeitreihendatensatz, der aus mittels zumindest eines Sensors in einer zeitlichen Reihenfolge ermittelten Daten und/oder aus in Datenbanken in einer zeitlichen Reihenfolge gespeicherten historischen Daten in einer zeitlichen Reihenfolge generiert wird, anzuwenden zur Bestimmung von Datensequenzen, die Ähnlichkeiten mit der Struktur oder dem Muster der in dem Suchabfragesatz enthaltenen Datensequenzen aufweisen.
-
In einer vorteilhaften Ausführungsform enthält der Suchabfragesatz zumindest eine dritte Datensequenz, die eine durch einen Ähnlichkeitsindex bestimmte Ähnlichkeit mit der Struktur oder dem Muster der ersten Datensequenz aufweist, und zusätzlich zu dem Suchabfragesatz werden definierte Suchparameter für die Analyse des ersten und/oder zumindest zweiten Zeitreihendatensatzes verwendet.
-
In einer weiteren Ausführungsform verwendet das Datenanalysemodul Algorithmen der künstlichen Intelligenz und des Maschinenlernens, insbesondere Deep Learning, die insbesondere als neuronale Netze, rekurrente neuronale Netze, gefaltete neuronale Netze, und/oder Transformer mit Encodern und Decodern und/oder Lernverstärkungs-Agenten (LV) (Reinforcement Learning Agent) ausgebildet sind.
-
Gemäß einem dritten Aspekt stellt die Erfindung ein Computerprogrammprodukt bereit, das einen ausführbaren Programmcode umfasst, der so konfiguriert ist, dass er bei seiner Ausführung das Verfahren gemäß dem ersten Aspekt ausführt.
-
Nachfolgend wird die Erfindung anhand von in der Zeichnung dargestellten Ausführungsbeispielen näher erläutert.
-
Dabei zeigt:
- 1 eine schematische Darstellung eines ersten Ausführungsbeispiels des erfindungsgemäßen Systems;
- 2 eine schematische Darstellung von Zeitreihendatensätzen;
- 3 eine schematische Darstellung der Auswahl einer Datensequenz aus einem Zeitreihendatensatz;
- 4 eine schematische Darstellung einer Suchabfrage mit der ausgewählten Datensequenz an einen Zeitreihendatensatz;
- 5 eine schematische Darstellung der Erstellung eines Suchabfragesatzes;
- 6 eine schematische Darstellung der Anwendung eines Suchabfragesatzes auf einen Zeitreihendatensatz;
- 7 ein Flussdiagramm zur Erläuterung der einzelnen Verfahrensschritte des erfindungsgemäßen Verfahrens;
- 8 ein Blockdiagramm eines Computerprogrammprodukt gemäß einer Ausführungsform des dritten Aspekts der Erfindung.
-
Zusätzliche Kennzeichen, Aspekte und Vorteile der Erfindung oder ihrer Ausführungsbeispiele werden durch die ausführliche Beschreibung in Verbindung mit den Ansprüchen ersichtlich.
-
1 zeigt ein erstes Ausführungsbeispiel eines Systems zur Analyse von Zeitreihendatensätzen einer Entität 10. Bei der Entität 10 kann es sich um ein Fahrzeug wie beispielsweise ein Kraftfahrzeug, ein autonom fahrendes Fahrzeug, ein landwirtschaftliches Fahrzeug wie einen Mähdrescher, einen Roboter in der Produktion oder in Service- und Pflegeeinrichtungen, oder um ein Wasserfahrzeug oder um ein Flugobjekt wie eine Drohne handeln. Es kann sich bei der Entität 10 aber auch um eine Bauteilkomponente wie eine mechanische Komponente wie ein Lager, eine elektrische und/oder elektronische und/oder mechatronische und/oder hydraulische und/oder chemische und/oder biologische Komponenten handeln. Zudem kann es sich bei der Entität 10 auch um eine Produktionsanlage zur Herstellung eines Produktes handeln, wie beispielsweise um eine Produktionsanlage zur Herstellung eines Kraftfahrzeugs. Bei der Produktionsanlage kann es sich auch um einen miteinander vernetzten Verbund von Produktionsanlagen handeln, der ein gemeinsames Produkt oder eine Vielfalt von verschiedenen Produkten entwickelt und herstellt. Insbesondere kann es sich bei der Entität 10 um wissenschaftliche Analyseinstrumente wie Spektrometer, Seismographen, etc. oder um medizinische Geräte zur Diagnose und Unterstützung von Körperfunktionen handeln.
-
Es kann sich bei der Entität 10 aber auch um Modellrechnungen für wissenschaftliche Studien, Klimamodelle, ökonomische Modelle wie den Aktienhandel, Entwicklungsprojekte wie eine Medikamentenentwicklung oder eine Produkteinwicklung, Verwaltungsaufgaben, Routenplanung, Softwareentwicklungen beispielsweis für autonomes Fahren, etc. handeln. Neben unbelebten Objekten kann es sich bei der Entität 10 auch um belebte Subjekte wie Personen oder Tiere handeln.
-
Die Entität 10 ist mit Sensoren 110 verbunden, die Daten der Entität 10 in einer zeitlichen Reihenfolge erfassen. Die Sensoren 110 können als Uhren, Zähler, Drucksensoren, Piezosensoren, Drehzahlsensoren, Beschleunigungssensoren, Geschwindigkeitssensoren, kapazitive Sensoren, induktive Sensoren, Temperatursensoren, bildaufnehmende Kameras im sichtbaren Bereich, UV-Kameras im ultravioletten Bereich, IR-Kameras im infraroten Bereich, LIDAR (Light detection and ranging) Systeme mit optischer Abstands- und Geschwindigkeitsmessung, stereoskopische optische Kamerasysteme, Ultraschallsysteme, und/oder Radarsysteme ausgebildet sind.
-
Bei den von den Sensoren 110 ermitteln Daten kann es sich um Bilder und/oder Daten über physikalische, chemische, biometrische und/oder physiologische Prozesse und Zustände handeln.
-
Handelt es sich bei der Entität 10 um ein Fahrzeug, so kann dieses beispielsweise Sensoren 110 einer Kamera- und Sensoreinrichtung aufweisen, die die Umgebung und Objekte in der Umgebung des Fahrzeugs aufnimmt und Sensor- und Bilddaten erzeugt. Insbesondere werden Bild- und Sensordaten von einer vorausliegenden Fahrspur erfasst, aber auch der Seitenbereich und der rückwärtige Bereich des Fahrzeugs sind wichtig, um beispielsweise auf mehrspurigen Straßen Überholmanöver von anderen Verkehrsteilnehmern überwachen zu können. In der Umgebung des Fahrzeugs können sich weitere bewegliche Objekte wie Fahrzeuge, Fußgänger, Fahrradfahrer, Motorradfahrer, etc. aufhalten oder unbewegliche Objekte wie Häuser, Straßenschilder, Zäune, Bäume etc. befinden.
-
Die Daten der Sensoren 110 werden an ein Datenanalysemodul 120 übermittelt zur weiteren Datenverarbeitung. Das Datenanalysemodul 120 weist einen Prozessor 122 und/oder ein Speichermodul 124 auf. Des Weiteren ist das Datenanalysemodul 120 mit zumindest einer Datenbank 140 verbunden.
-
Die von den Sensoren 110 aufgenommenen Daten werden mittels Kommunikationsverbindungen wie beispielsweise ein CAN-Bus-System (Controller Area Network) an das Datenanalysemodul 120 weitergeleitet. Es können aber auch drahtlose Verbindungen vorgesehen sein. Eine drahtlose Kommunikationsverbindung ist insbesondere als Mobilfunkverbindung und/oder einer Nahfeldkommunikationsverbindung wie Bluetooth®, Ethernet, NFC (near field communication) oder Wi-Fi® ausgebildet.
-
Das Datenanalysemodul 120 erstellt aus den Daten Zeitreihendatensätze 30, 32, 34, die jeweils die Daten eines oder mehrere Parameter wie eine Frequenz, eine Geschwindigkeit, etc. in der zeitlichen Reihenfolge ihrer Entstehung darstellen. Die Daten werden somit gegen die Zeit aufgetragen. Bei den Daten kann es sich um einzelne Messwerte zu einem bestimmten Zeitpunkt handeln, beispielsweise die Geschwindigkeit v1 zu einem Zeitpunkt t1. Es können aber auch zu einem Zeitpunkt t1 mehrere Datenwerte ermittelt werden, so dass sich ein komplexerer Zeitreihendatensatz ergibt. Die Daten selbst können die Messdaten selbst darstellen, oder es sind bereits durch Extraktions- und/oder Klassifizierungsverfahren bearbeitete Daten.
-
In der Datenbank 140 können Suchparameter zur Analyse der aufgenommenen Daten oder weitere historische Daten und Bilder und/oder Kenngrößen gespeichert sein. Des Weiteren können Zielgrößen und Zielwerte in der Datenbank 140 abgelegt sein, die einen Sicherheitsstandard definieren. Auch können kartographische und topographische Daten gespeichert sein. Des Weiteren kann eine Benutzerschnittstelle 170 zur Eingabe von weiteren Daten vorgesehen sein. Insbesondere ist die Benutzerschnittstelle 170 als Display mit einem Touchscreen ausgebildet. Insbesondere weist die Benutzerschnittstelle 170 ein Ausgabemodul 175 zur Anzeige der von dem Datenanalysemodul 120 erstellten Suchergebnisse auf.
-
Das Datenanalysemodul 120 kann in der Entität 10 integriert sein oder als cloudbasierte Lösung ausgebildet sein. Insbesondere kann das Datenanalysemodul 120 über eine Kommunikationsverbindung mit einer Cloud-Computing-Infrastruktur 150 oder einer anderen Recheneinheit verbunden sein. Die Datenbank 140 kann auch in der Cloud-Computing-Infrastruktur 150 integriert sein.
-
Unter einem „Prozessor“ kann im Zusammenhang mit der Erfindung beispielsweise eine Maschine oder eine elektronische Schaltung verstanden werden. Bei einem Prozessor kann es sich insbesondere um einen Hauptprozessor (engl. Central Processing Unit, CPU), einen Mikroprozessor oder einen Mikrocontroller, beispielsweise eine anwendungsspezifische integrierte Schaltung oder einen digitalen Signalprozessor, möglicherweise in Kombination mit einer Speichereinheit zum Speichern von Programmbefehlen, etc. handeln. Auch kann unter einem Prozessor ein virtualisierter Prozessor, eine virtuelle Maschine oder eine Soft-CPU verstanden werden. Es kann sich beispielsweise auch um einen programmierbaren Prozessor handeln, der mit Konfigurationsschritten zur Ausführung des genannten erfindungsgemäßen Verfahrens ausgerüstet wird oder mit Konfigurationsschritten derart konfiguriert ist, dass der programmierbare Prozessor die erfindungsgemäßen Merkmale des Verfahrens, der Komponente, der Module, oder anderer Aspekte und/oder Teilaspekte der Erfindung realisiert. Insbesondere kann der Prozessor 122 hochparallele Recheneinheiten und leistungsfähige Grafikmodule enthalten. Der Prozessor 122 kann zudem vorteilhaftweise eine Kl-Hardwarebeschleunigung wie ein Coral Dev Board verwenden, um eine Bearbeitung in Echtzeit zu ermöglichen. Es handelt sich hierbei um einen Mikrocomputer mit einer Tensorverarbeitungseinheit (engl.: tensor processing unit (TPU)), wodurch eine vortrainierte Softwareapplikation bis zu 70 Bilder pro Sekunde auswerten kann.
-
Unter einer „Speichereinheit“ oder „Speichermodul“ und dergleichen kann im Zusammenhang mit der Erfindung beispielsweise ein flüchtiger Speicher in Form eines Arbeitsspeichers (engl. Random-Access Memory, RAM) oder ein dauerhafter Speicher wie eine Festplatte oder ein Datenträger oder z. B. ein wechselbares Speichermodul verstanden werden. Es kann sich bei dem Speichermodul aber auch um eine cloudbasierte Speicherlösung handeln.
-
Unter einem „Modul“ kann im Zusammenhang mit der Erfindung beispielsweise ein Prozessor und/oder eine Speichereinheit zum Speichern von Programmbefehlen verstanden werden. Beispielsweise ist der Prozessor speziell dazu eingerichtet, die Programmbefehle derart auszuführen, damit der Prozessor und/oder die Steuereinheit Funktionen ausführt, um das erfindungsgemäße Verfahren oder einen Schritt des erfindungsgemäßen Verfahrens zu implementieren oder realisieren.
-
Unter „Daten“ sind im Zusammenhang mit der Erfindung sowohl Rohdaten als auch bereits aufbereitete Daten aus den Messergebnissen der Sensoren 110 und/oder in der Datenbank 140 und/ oder der Cloud-Computing-Infrastruktur 150 gespeicherte Daten zu verstehen.
-
Unter „Datenbank“ ist sowohl ein Speicheralgorithmus als auch die Hardware in Form einer Speichereinheit zu verstehen. Insbesondere ist die Datenbank als Cloud-Computing-Infrastruktur 150 ausgebildet.
-
Die Kommunikationsverbindung zwischen dem Datenanalysemodul 120 und der Datenbank 140 bzw. der Cloud-Computing-Infrastruktur 150 ist insbesondere als Mobilfunkverbindung und/oder als Nahfeldkommunikationsverbindung wie Bluetooth®, Ethernet, NFC (near field communication) oder Wi-Fi® ausgebildet.
-
Insbesondere verfügen das Datenanalysemodul 120 und/oder die Sensoren 110 über Mobilfunkmodule des 5G-Standards. 5G ist der Mobilfunkstandard der fünften Generation und zeichnet sich im Vergleich zum 4G-Mobilfunkstandard durch höhere Datenraten bis zu 10 Gbit/sec, der Nutzung höherer Frequenzbereiche wie beispielsweise 2100, 2600 oder 3600 Megahertz, eine erhöhte Frequenzkapazität und damit einen erhöhten Datendurchsatz und eine Echtzeitdatenübertragung aus, da bis zu eine Million Geräte pro Quadratkilometer gleichzeitig ansprechbar sind. Die Latenzzeiten betragen wenige Millisekunden bis unter 1 ms, so dass Echtzeitübertragungen von Daten und von Berechnungsergebnissen möglich sind. Die von den Sensoren 110 aufgenommenen Daten können in Echtzeit an die Cloud-Computing-Infrastruktur 150 gesendet werden, wo die Analyse der Daten durchgeführt wird. Die Analyse- und Suchergebnisse können an das Datenanalysemodul 120 oder ein anderes Steuerungsmodul in der Entität 10 zurückgesandt werden.
-
Diese Geschwindigkeit bei der Datenübermittlung ist erforderlich, wenn cloudbasierte Lösungen für die Verarbeitung der Daten verwendet werden sollen. Cloudbasierte Lösungen bieten den Vorteil von hohen und damit schnellen Rechenleistungen. Um die Verbindung zu der Cloud-Computing-Infrastruktur 150 mittels einer Mobilfunkverbindung zu schützen, sind insbesondere kryptographische Verschlüsselungsverfahren vorgesehen. Kryptographische Verschlüsselungsverfahren können aber auch für die Verbindung zwischen den Sensoren110 und dem Datenanalysemodul 120 vorgesehen sein.
-
Das Datenanalysemodul 120 kann bezüglich der Hardwareausprägung eine separate Einheit und ist insbesondere in der Entität 10 angeordnet, aber sie kann für die Funktionsausübung auch auf andere Hardware- und Softwarekomponenten in der Entität 10 oder in der Cloud-Computing-Infrastruktur 150 zurückgreifen.
-
Das Datenanalysemodul 120 umfasst Algorithmen der künstlichen Intelligenz und der maschinellen Bildanalyse, um die Daten zu bearbeiten. Vorteilhaftweise verwendet das Datenanalysemodul 120 Algorithmen aus dem Bereich des Maschinenlernens, vorzugsweise Deep Learning mit beispielsweise neuronalen Netzen, rekurrenten neuronalen Netzen, gefalteten neuronalen Netzen, und/oder Transformer mit Encodern und Decodern und/oder Lernverstärkungs-Agenten (LV) (Reinforcement Learning Agent).
-
Ein neuronales Netzwerk besteht aus Neuronen, die in mehreren Schichten angeordnet und unterschiedlich miteinander verbunden sind. Ein Neuron ist in der Lage, an seinem Eingang Informationen von außerhalb oder von einem anderen Neuron entgegenzunehmen, die Information in einer bestimmten Art zu bewerten und sie in veränderter Form am Neuronen-Ausgang an ein weiteres Neuron weiterzuleiten oder als Endergebnis auszugeben. Hidden-Neuronen sind zwischen den Input-Neuronen und Output-Neuronen angeordnet. Je nach Netzwerktyp können mehrere Schichten von Hidden-Neuronen vorhanden sein. Sie sorgen für die Weiterleitung und Verarbeitung der Informationen. Output-Neuronen liefern schließlich ein Ergebnis und geben dieses an die Außenwelt aus. Durch die Anordnung und die Verknüpfung der Neuronen entstehen verschiedene Typen von neuronalen Netzwerken wie Feedforward-Netzwerke, Rekurrente Netzwerke oder Convolutional Neural Networks. Die Netzwerke lassen sich durch unbeaufsichtigtes oder überwachtes Lernen trainieren
-
Das Convolutional Neural Network ist eine besondere Form eines künstlichen neuronalen Netzwerks. Es besitzt mehrere Faltungsschichten und ist für maschinelles Lernen und Anwendungen mit Künstlicher Intelligenz (KI) im Bereich der Mustererkennung sehr gut geeignet. Die Funktionsweise eines Convolutional Neural Networks ist zu einem gewissen Teil biologischen Vorgängen nachempfunden und der Aufbau ist vergleichbar der Sehrinde des Gehirns. Das Training eines Convolutional Neural Networks findet gewöhnlich überwacht statt. Herkömmliche neuronale Netzwerke bestehen aus voll- oder teilvermaschten Neuronen in mehreren Ebenen. Diese Strukturen stoßen jedoch bei der Verarbeitung von Bildern an ihre Grenzen, da eine der Pixelanzahl entsprechende Zahl an Eingängen vorhanden sein müsste. Das Convolutional Neural Network setzt sich aus verschiedenen Schichten zusammen und ist vom Grundprinzip ein zum Teil lokal vermaschtes neuronales Feedforward-Netzwerk. Die einzelnen Schichten des CNN sind die Convolutional-Schicht, die Pooling-Schicht und die vollständig vermaschte Schicht. Die Convolutional-Schicht ist die eigentliche Faltungsebene und in der Lage, in den Eingabedaten einzelne Merkmale zu erkennen und zu extrahieren. Bei der Muster- und Bilderkennung können dies Merkmale wie Linien, Kanten oder bestimmte Formen sein. Die Verarbeitung der Eingabedaten erfolgt in Form von Tensoren wie einer Matrix oder Vektoren. Die Pooling-Schicht, auch Subsampling-Schicht genannt, verdichtet und reduziert die Auflösung der erkannten Merkmale durch passende Filterfunktionen. Durch das reduzierte Datenaufkommen erhöht sich die Berechnungsgeschwindigkeit.
-
Das Convolutional Neural Network (CNN) bietet daher gegenüber herkömmlichen nicht gefalteten neuronalen Netzen zahlreiche Vorteile. Es eignet sich für maschinelles Lernen und Anwendungen der Künstlichen Intelligenz mit großen Mengen an Eingabedaten wie in der Muster- und Bilderkennung. Das Netzwerk arbeitet zuverlässig und ist gegenüber Verzerrungen oder anderen optischen Veränderungen unempfindlich. Das CNN kann unter verschiedenen Lichtverhältnissen und in unterschiedlichen Perspektiven aufgenommene Bilder verarbeiten. Es erkennt dennoch die typischen Merkmale eines Bildes. Da das CNN in mehrere lokale, teilvermaschte Schichten aufgeteilt ist, hat es einen wesentlich geringeren Speicherplatzbedarf als vollvermaschte neuronale Netze. Die Faltungsschichten reduzieren die Speicheranforderungen drastisch. Ebenfalls stark verkürzt ist die Trainingszeit des Convolutional Neural Networks. Mit dem Einsatz moderner Grafikprozessoren lassen sich CNNs sehr effizient trainieren.
-
Ein Lernverstärkungs-Agent (LV) (Reinforcement Learning Agent) wählt einen bestimmten Zustand si ∈ S aus einer Menge verfügbarer Zustände für zumindest eine Aktion ai ∈ A aus einer Menge verfügbarer Aktionen aus. Für die ausgewählte Aktion ai erhält der Agent eine Belohnung, die positiv, neutral oder negativ sein kann. Die Zustände si ∈ S erhält der Agent von einem Zustandsmodul, das Daten von verschiedenen Sensoren und Datenquellen verarbeitet und diesen verarbeiteten Daten Zustände si ∈ S zuordnet, auf die der LV-Agent zugreifen kann.
-
2 zeigt das zwei beispielhafte Zeitreihendatensätze 20, 21. Die Daten der Zeitreihendatensätze 20, 21 können von verschiedenen Sensoren 110 stammen, so dass unterschiedliche Parameter einer Entität 10 gleichzeitig gemessen werden. Es kann sich aber auch um die Daten von zwei Entitäten 10, wie einem ersten und einem zweiten Fahrzeu, handeln, die gleichzeitig gemessen und verglichen werden können. Die Zeitreihendatensätze 20, 21 weisen eine sich über die Zeit ändernde Struktur auf, die aus absteigenden und aufsteigenden Flanken besteht.
-
In der 3 wird eine erste Datensequenz 30 in einem ersten Zeitintervall Δt1 bestimmt. Es kann sich hierbei um eine besonders auffällige Struktur oder ein markantes Muster im Vergleich zu dem übrigen Datenverlauf handeln. Die Datensequenz 30 kann anhand vorab definierter Kriterien mittels eines Algorithmus ausgewählt werden, oder es ist eine manuelle Auswahl, beispielsweise über die Benutzerschnittstelle 170 vorgesehen.
-
Wie in den 4 und 5 dargestellt, wird die ausgewählte Datensequenz 30 nun einem Suchabfragesatz 40 zugeordnet. Dieser Suchabfragesatz 40 bestehend aus der ausgewählten Datensequenz 30 wird nun auf den Zeitreihendatensatz 30 angewendet. Insbesondere ist vorgesehen, den Zeitreihendatensatz 30 in Zeitintervalle Δt einzuteilen, wobei insbesondere die Länge eines Zeitintervalls Δt der Länge des ersten Zeitintervalls Δt1 entspricht. Es ist jedoch im Rahmen der Erfindung auch möglich, dass die Länge eines Zeitintervalls Δt von der Länge des ersten Zeitintervalls Δt1 abweicht. Der Zeitreihendatensatz 30 wird somit in eine Vielzahl von Zeitintervallen Δt unterteilt, die jeweils eine Datensequenz beinhalten. Die Struktur oder das Muster der ersten Datensequenz 30 wird nun mit der Struktur oder dem Muster einer zweiten Datensequenz 32 verglichen. Die Ähnlichkeit zwischen der Struktur oder dem Muster der ersten Datensequenz 30 und der Struktur oder dem Muster der zweiten Datensequenz 32 wird durch einen Ähnlichkeitsindex bewertet. Falls der Ähnlichkeitsindex einen vordefinierten Schwellenwert überschreitet, wird die zweite Datensequenz 32 ebenfalls in den Suchabfragesatz 40 aufgenommen.
-
Nun kann eine dritte Datensequenz 34 mit der ersten Datensequenz 30 verglichen werden. Falls wiederum der Ähnlichkeitsindex einen vordefinierten Schwellenwert überschreitet, wird auch die dritte Datensequenz 32 in den Suchabfragesatz 40 aufgenommen. Falls jedoch ein durch den Ähnlichkeitsindex definierter Schwellenwert oder Kennwert unterschritten wird, erfolgt keine Aufnahme der dritten Datensequenz 34 in den Suchabfragesatz 40. Auf diese Weise kann iterativ ein Suchabfragesatz 40 konstruiert werden bestehend aus einer Vielzahl von Datensequenzen 30, 32, 34, die gleich oder ähnlich zu einer initialen Datensequenz 30 sind.
-
Des Weiteren können Suchparameter in den Suchabfragesatz 40 aufgenommen werden. Bei einem Suchparameter kann es sich um eine Dimension oder ein Material oder eine Materialzusammensetzung oder eine Formgebung oder einen Kennwert oder einen Sicherheitsfaktor oder einen Identifikationscode oder einen Ort oder einen Zeitpunkt oder einen thermischen Widerstand oder einen elektrischen Widerstand oder eine Spannung oder eine Leitfähigkeit oder eine Festigkeit oder ein Bruchverhalten oder eine Farbe oder eine Dichte oder eine plastische Verformung oder einen Spannungs-, Druck-, Biegungswiderstand oder eine Werkstoffeigenschaft oder eine Oberflächeneigenschaft oder eine Wärmebehandlung oder eine physiologische Eigenschaft wie Blutdruck oder Herzfrequenz handeln.
-
Dieser Suchanfragesatz 40 kann in der Datenbank 140 und/oder der Cloud-Computing-Infrastruktur 150 oder einer anderen Speichereinheit gespeichert und für zukünftige Suchaufträge abgerufen werden.
-
Ein derartiger Suchauftrag ist in der 7 dargestellt. Ein zweiter Zeitdatenreihensatz 50 wird wiederum in Zeitintervalle Δt eingeteilt, denen jeweils Datensequenzen entsprechen. Die verschiedenen Datensequenzen des Zeitreihendatensatzes 50 werden nun mit den in dem Suchanfragesatz 40 gespeicherten Datensequenzen 30, 32, 34 verglichen. Es wird wiederum ein Ähnlichkeitsindex erstellt, der bei einem hohen Wert, d.h. einer hohen Ähnlichkeit einer Datensequenz mit einer der Datensequenzen 30, 32, 34 des Suchanfragesatzes als Indikator auf ein kritisches Ereignis hinweisen kann. Die Suchanfrage ist erfolgreich verlaufen, wenn ein solches Ereignis ermittelt werden konnte. Das Suchergebnis kann entweder von dem Ausgabemodul 175 weiterverarbeitet und beispielsweise auf der Benutzerschnittstelle 170 ausgegeben werden. Dabei kann es sich auch um Handlungsempfehlungen oder Warnhinweise handeln. So kann beispielsweise ein Warnton oder ein optischer Hinweis in Abhängigkeit von dem Ähnlichkeitsindex über die Benutzerschnittstelle 170 ausgegeben werden, um auf eine kritische Situation aufmerksam zu machen, die eine erhöhte Aufmerksamkeit beansprucht.
-
Da die Berechnung des Ähnlichkeitsindex in Echtzeit erfolgen muss, um eine zeitnahe Steuerung einer durch die Zeitreihendatensatz wiedergegebenen Funktion oder eines Prozesses wie eine automatische Fahrfunktion bei einem Fahrzeug zu ermöglichen, ist für die Vielzahl von Rechenoperationen in dem Datenanalysemodul 120 die Rechengeschwindigkeit entscheidend. Um eine Durchführung der Rechenoperationen in Echtzeit zu ermöglichen, ist daher die Verwendung der Cloud-Computing-Infrastruktur 150 vorteilhaft, da hierdurch eine schnelle Berechnung gewährleistet werden kann. Für die Kommunikation des Datenanalysemoduls 120 mit der Cloud-Computing-Infrastruktur 150 ist wiederum eine 5G-Mobilfunkverbindung vorteilhaft, da auf diese Weise eine Datenübermittlung in Echtzeit erfolgen kann.
-
In einer Weiterentwicklung kann auch vorgesehen sein, dass zumindest ein Teil der Sensoren 110 ebenfalls ihre aufgenommenen Daten an die Cloud-Computing-Infrastruktur 150 senden, so dass die Cloud-Computing-Infrastruktur 150 aus diesen Daten der Sensoren 110 die Zeitreihendatensätze 30, 50 erstellen, den Suchabfragesatz 40 entwickeln und die Suchabfrage mit dem Suchabfragesatz 40 durchführen kann.
-
In 7 sind die Verfahrensschritte zur Analyse von Zeitreihendatensätzen einer Entität 10 mittels eines Datenanalysemoduls 120 dargestellt.
-
In einem Schritt S10 wird zumindest ein erster Zeitreihendatensatzes 20 aus mittels zumindest eines Sensors 110 in einer zeitlichen Reihenfolge ermittelten Daten und/oder aus in Datenbanken 140 in einer zeitlichen Reihenfolge gespeicherten historischen Daten generiert, wobei der Zeitreihendatensatz 20 zumindest einen Teilaspekt der Entität 10 wie beispielsweise Prozessschritte abbildet.
-
In einem Schritt S20 wird zumindest eine erste Datensequenz 30 in einem ersten Zeitintervall Δt1 in dem Zeitreihendatensatz 20 bestimmt, wobei die Datensequenz 30 eine bestimmte Struktur oder ein bestimmtes Muster aufweist.
-
In einem Schritt S30 wird die erste Datensequenz 30 einem Suchabfragesatz 40 zugeordnet.
-
In einem Schritt S40 wird die Struktur oder das Muster der ersten Datensequenz 30 mit zumindest einer Struktur oder einem Muster einer zweiten Datensequenz 32 in einem zweiten Zeitintervall Δt2 in dem Zeitreihendatensatz 20 verglichen.
-
In einem Schritt S50 wird ein Ähnlichkeitsindex zwischen der Struktur oder dem Muster der ersten Datensequenz 30 und der Struktur oder dem Muster der zweiten Datensequenz 32 berechnet.
-
In einem Schritt S60 wird die zweite Datensequenz 32 dem Suchabfragesatz 40 zugeordnet, wenn ein definierter Schwellenwert oder ein Kennwert des Ähnlichkeitsindexes erreicht wurde.
-
In einem Schritt S70 wird der Suchabfragesatzes 40 auf zumindest einen zweiten Zeitreihendatensatzes 50, der aus mittels zumindest eines Sensors 110 in einer zeitlichen Reihenfolge ermittelten Daten und/oder aus in Datenbanken 140 in einer zeitlichen Reihenfolge gespeicherten historischen Daten in einer zeitlichen Reihenfolge generiert wird, angewendet zur Bestimmung von Datensequenzen, die Ähnlichkeiten mit der Struktur oder dem Muster der in dem Suchabfragesatz 40 enthaltenen Datensequenzen 30, 32 aufweisen.
-
8 stellt schematisch ein Computerprogrammprodukt 400 dar, das einen ausführbaren Programmcode 450 umfasst, der konfiguriert ist, um das Verfahren gemäß dem ersten Aspekt der vorliegenden Erfindung auszuführen, wenn es ausgeführt wird.
-
Mit dem Verfahren und dem System 100 gemäß der vorliegenden Erfindung kann somit zuverlässig und in Echtzeit ein Zeitreihendatensatz 30, 50 bezüglich signifikanter Strukturen oder Muster durch die iterative Erstellung eines Suchabfragesatzes 40 analysiert werden. Da bestimmte Strukturen oder Muster in einem Zeitreihendatensatz Hinweise auf kritische Ereignisse geben können, kann somit durch ein schnelles Auffinden dieser Strukturen oder Muster in einem Zeitreihendatensatz ein kritisches Ereignis präzise vorhergesagt werden und damit auf ein kritisches Ereignis schnell reagiert werden. So können beispielsweise Steuerungsparameter von Funktionen und Prozessen einer Entität 10 engmaschiger eingestellt werden, so dass insgesamt die Funktions- und Prozesssicherheit erhöht werden kann.
-
Bezugszeichenliste
-
- 10
- Entität
- 20
- erster Zeitreihendatensatz
- 21
- Zeitreihendatensatz
- 30
- erste Datensequenz
- 32
- zweite Datensequenz
- 40
- Suchabfragesatz
- 50
- zweiter Zeitreihensatz
- 100
- System
- 120
- Datenanalysemodul
- 122
- Prozessor
- 124
- Speichermodul
- 140
- Datenbank
- 150
- Cloud-Computing-Infrastruktur
- 170
- Benutzerschnittstelle
- 175
- Ausgabemodul
- 400
- Computerprogrammprodukt
- 450
- Programmcode
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- US 2016/0371376 A1 [0004]
- US 2018/0300333 A1 [0005]
- WO 2015/009310 A1 [0006]