DE202022103462U1 - A system for streaming and storing heterogeneous sensor data streams using a microservices architecture model - Google Patents

A system for streaming and storing heterogeneous sensor data streams using a microservices architecture model Download PDF

Info

Publication number
DE202022103462U1
DE202022103462U1 DE202022103462.1U DE202022103462U DE202022103462U1 DE 202022103462 U1 DE202022103462 U1 DE 202022103462U1 DE 202022103462 U DE202022103462 U DE 202022103462U DE 202022103462 U1 DE202022103462 U1 DE 202022103462U1
Authority
DE
Germany
Prior art keywords
data
analysis
streaming
processing unit
heterogeneous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE202022103462.1U
Other languages
German (de)
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to DE202022103462.1U priority Critical patent/DE202022103462U1/en
Publication of DE202022103462U1 publication Critical patent/DE202022103462U1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

Ein System zum Streaming und Speichern der heterogenen gestreamten Sensordaten unter Verwendung eines Microservices-Architekturmodells, wobei das System Folgendes umfasst:
eine Datenerfassungs-Verarbeitungseinheit zum Erfassen der heterogenen Daten von verschiedenen Arten von Sensoren, wobei die erfassten Daten roh und unstrukturiert sind;
eine Datenbereinigungsverarbeitungseinheit zum Eliminieren der redundanten Daten und zum Filtern der erforderlichen Daten aus den aus heterogenen Sensordaten gesammelten Rohdaten;
eine Datenexplorations-Verarbeitungseinheit zur Durchführung der Analyse der heterogenen Sensordaten der unstrukturierten Daten und damit zur Identifizierung der Datenmuster;
eine Feature-Engineering-Verarbeitungseinheit zum Umwandeln der Rohdaten in Merkmale, wobei diese Daten als die sauberen Daten für die Durchführung von Analysen betrachtet werden und die Daten aufbewahrt und dann in der Cloud gespeichert werden, und wobei die Merkmale das zugrunde liegende Problem im Vorhersagemodell darstellen;
eine Verarbeitungseinheit für die prädiktive Modellierung zum Auffinden interessanter Muster in den gesammelten Daten durch Durchführung einer Vorhersageanalyse; und
eine Datenvisualisierungseinheit, die dem Benutzer die Analyseergebnisse unter Verwendung verschiedener visueller Elemente, wie z. B. Diagramme und Tabellen, anzeigt.

Figure DE202022103462U1_0000
A system for streaming and storing the heterogeneous streamed sensor data using a microservices architecture model, the system comprising:
a data acquisition processing unit for acquiring the heterogeneous data from different types of sensors, the acquired data being raw and unstructured;
a data cleaning processing unit for eliminating the redundant data and for filtering the required data from the raw data collected from heterogeneous sensor data;
a data exploration processing unit for performing the analysis of the heterogeneous sensor data of the unstructured data and thereby identifying the data patterns;
a feature engineering processing unit for converting the raw data into features, where this data is considered the clean data for performing analysis and the data is kept and then stored in the cloud, and where the features represent the underlying problem in the predictive model ;
a predictive modeling processing unit for finding interesting patterns in the collected data by performing predictive analysis; and
a data visualization unit that presents the analysis results to the user using various visual elements, such as B. diagrams and tables.
Figure DE202022103462U1_0000

Description

BEREICH DER ERFINDUNGFIELD OF THE INVENTION

Die vorliegende Offenlegung bezieht sich auf einen Ansatz zur Verbesserung der Streaming-Analytik. Insbesondere bezieht sich die vorliegende Offenlegung auf ein System für das Streaming und die Speicherung der heterogenen gestreamten Sensordaten unter Verwendung eines Microservices-Architekturmodells.The present disclosure relates to an approach to improve streaming analytics. In particular, the present disclosure relates to a system for streaming and storing the heterogeneous streamed sensor data using a microservices architecture model.

HINTERGRUND DER ERFINDUNGBACKGROUND OF THE INVENTION

Die drastische Verbesserung der Technologie führte zu einem plötzlichen Anstieg der Datenmenge, die durch diese Technologien erzeugt wird. Das Volumen der zu verwaltenden und zu speichernden Daten steigt von Tag zu Tag in enormer Menge. Aufgrund dieser riesigen Datenmenge spielt die Datenanalyse eine wichtige Rolle bei der Analyse der Daten, sei es bei Covid-19 oder bei Wahlen.The drastic improvement in technology led to a sudden increase in the amount of data generated by these technologies. The volume of data to be managed and stored is increasing enormously from day to day. Because of this massive amount of data, data analysis plays an important role in analyzing the data, be it Covid-19 or elections.

Eine große Menge heterogener Informationen (Informationen aus verschiedenen Quellen) wird regelmäßig generiert, so dass es notwendig wird, diese Informationen zu verarbeiten und zu analysieren, was aufgrund der riesigen Menge solcher Informationen zu einer mühsamen Aufgabe geworden ist. Daten aus verschiedenen Quellen liefern bessere und aussagekräftigere Erkenntnisse als Daten aus einer einzigen Quelle.A large amount of heterogeneous information (information from different sources) is regularly generated, so it becomes necessary to process and analyze this information, which has become a tedious task due to the huge amount of such information. Data from multiple sources provides better and more meaningful insights than data from a single source.

Die heterogenen, gestreamten Sensordaten aus verschiedenen Quellen wie z. B. Sensoren werden kontinuierlich generiert, und diese generierten Daten müssen sofort analysiert werden, um wertvolle Erkenntnisse zu gewinnen und interessante Muster in den Daten zu finden. Aufgrund der Erzeugung enormer Datenmengen, die gespeichert werden müssen, ist es notwendig geworden, nur die wichtigen Daten zu speichern, was aufgrund der Vielfalt und Geschwindigkeit der Daten eine Herausforderung darstellt. Wenn die Daten ohne Vorverarbeitung direkt in der Cloud gespeichert werden, entstehen dem Endnutzer zusätzliche Kosten für die unerwünschten und redundanten Informationen, was zu einem Engpass bei der Datenanalyse führt. Daher besteht ein Bedarf an einem solchen System, das die unerwünschten und redundanten Daten aus den heterogenen gestreamten Daten entfernen kann, um die wichtigen Daten auf dem Cloud-Server zu speichern und die Datenanalyse durchzuführen.The heterogeneous, streamed sensor data from various sources such as e.g. B. Sensors are generated continuously, and this generated data must be analyzed immediately to gain valuable insights and find interesting patterns in the data. Due to the generation of enormous amounts of data that need to be stored, it has become necessary to store only the important data, which is challenging due to the variety and speed of the data. If the data is stored directly in the cloud without any pre-processing, the end-user incurs additional costs for the unwanted and redundant information, resulting in a data analysis bottleneck. Therefore, there is a need for such a system that can remove the unwanted and redundant data from the heterogeneous streamed data to store the important data on the cloud server and perform the data analysis.

In Anbetracht der vorangegangenen Diskussion wird deutlich, dass ein System für das Streaming und die Speicherung heterogener Sensordaten unter Verwendung eines Microservices-Architekturmodells benötigt wird.In view of the previous discussion, it becomes clear that a system for streaming and storing heterogeneous sensor data using a microservices architectural model is needed.

ZUSAMMENFASSUNG DER ERFINDUNGSUMMARY OF THE INVENTION

Die vorliegende Offenlegung bezieht sich auf ein System für das Streaming und die Speicherung der heterogenen gestreamten Sensordaten unter Verwendung eines Microservices-Architekturmodells. Das vorgeschlagene System bietet einen Speichermechanismus für heterogene gestreamte Sensordaten, wobei die sauberen und vorverarbeiteten Daten in dem Cloud-Server zur Durchführung der Datenanalyse gespeichert werden, wobei die gespeicherten Daten die erforderlichen Merkmalsvektoren für die Streaming-Analyse aufweisen. Das vorgeschlagene System ist in der Lage, das Muster zu bestimmen, die Ergebnisse zu untersuchen und die Beziehung zwischen den Daten, die aus mehreren Quellen stammen, gleichzeitig zu identifizieren. Das vorgeschlagene System verwendet ein ereignisgesteuertes Microservices-Architekturmodell, das architektonische Merkmale wie hohen Durchsatz, Skalierbarkeit, Verfügbarkeit, Zuverlässigkeit, Modularität, Wartbarkeit und Agilität aufweist. Die Microservices-Architektur besteht aus verschiedenen Komponenten, nämlich der Datensammlungskomponente, der Datenbereinigungskomponente, der Datenexplorationskomponente, der Feature-Engineering-Komponente, der Predictive Modelling-Komponente und der Datenvisualisierungskomponente. Die experimentellen Komponenten der Microservices-Architektur sind: Ereignisbasiertes Streaming auf Flink (Flink Runtime) für das Streaming der Daten aus mehreren Quellen, Microservices für die Durchführung von Operationen auf den gesammelten Daten, dynamische Integration, bei der Apache Kafka als Nachrichtenwarteschlangensystem für die Erzeugung und Veröffentlichung der Daten verwendet wird, Analytik durch Algorithmen des maschinellen Lernens und ein effizientes Dashboard für die Berichterstattung über die analysierten Informationen. Der vorgeschlagene Ansatz hilft bei der fliegenden Verarbeitung von Echtzeitdaten, und nur die Daten, die für die Analyse bereit sind, werden für die zukünftige Verwendung gespeichert. Daher reduziert der vorgeschlagene Ansatz die Kosten, die mit dem Streaming und der Speicherung von Sensordaten verbunden sind, da in dem vorgeschlagenen Ansatz eine Microservices-basierte ereignisgesteuerte Architektur mit Flink für das Streaming verwendet wird, die bei der Erreichung von Skalierbarkeit und Modularität helfen kann.The present disclosure relates to a system for streaming and storing the heterogeneous streamed sensor data using a microservices architecture model. The proposed system provides a storage mechanism for heterogeneous streamed sensor data, where the clean and pre-processed data is stored in the cloud server to perform the data analysis, where the stored data has the required feature vectors for the streaming analysis. The proposed system is able to determine the pattern, examine the results and identify the relationship between the data coming from multiple sources at the same time. The proposed system uses an event-driven microservices architecture model that has architectural features such as high throughput, scalability, availability, reliability, modularity, maintainability, and agility. Microservices architecture consists of different components namely data collection component, data cleansing component, data exploration component, feature engineering component, predictive modeling component and data visualization component. The experimental components of the microservices architecture are: event-based streaming on Flink (Flink Runtime) for streaming the data from multiple sources, microservices for performing operations on the collected data, dynamic integration using Apache Kafka as a message queuing system for generation and Data publication is used, analytics through machine learning algorithms and an efficient dashboard for reporting on the analyzed information. The proposed approach helps to process real-time data on the fly, and only the data that is ready for analysis is stored for future use. Therefore, the proposed approach reduces the costs associated with streaming and storing sensor data, as the proposed approach uses a microservices-based event-driven architecture with Flink for streaming, which can help in achieving scalability and modularity.

Die vorliegende Offenlegung zielt darauf ab, ein System für das Streaming und die Speicherung der heterogenen gestreamten Sensordaten unter Verwendung eines Microservices-Architekturmodells bereitzustellen. Das System umfasst: eine Datenerfassungs-Verarbeitungseinheit zum Sammeln der heterogenen Daten von verschiedenen Sensortypen, wobei die gesammelten Daten roh und unstrukturiert sind; eine Datenbereinigungs-Verarbeitungseinheit zum Eliminieren der redundanten Daten und zum Filtern der benötigten Daten aus den rohen Daten, die von den heterogenen Sensordaten gesammelt wurden; eine Datenexplorations-Verarbeitungseinheit zum Durchführen der Analyse der heterogenen Sensordaten der unstrukturierten Daten und dadurch zum Identifizieren der Datenmuster; eine Feature-Engineering-Verarbeitungseinheit zum Umwandeln der Rohdaten in Merkmale, wobei diese Daten als die sauberen Daten für die Durchführung von Analysen betrachtet werden und die Daten aufbewahrt und dann in der Cloud gespeichert werden, und wobei die Merkmale das zugrundeliegende Problem in dem Vorhersagemodell darstellen; eine Verarbeitungseinheit für die Vorhersagemodellierung zum Auffinden der interessanten Muster in den gesammelten Daten durch die Durchführung der Vorhersageanalyse; und eine Verarbeitungseinheit für die Datenvisualisierung zum Berichten der Analyseergebnisse an den Benutzer unter Verwendung verschiedener visueller Elemente wie Grafiken und Diagramme.The present disclosure aims to provide a system for streaming and storing the heterogeneous streamed sensor data using a microservices architecture model. The system includes: a data acquisition processing unit for collecting the heterogeneous data from different sensor types, the collected data being raw and unstructured; a data cleaning processing unit to eliminate the redundant data and to filter the required data from the raw data collected from the heterogeneous sensor data; a data exploration processing unit for performing the analysis of the heterogeneous sensor data of the unstructured data and thereby identifying the data patterns; a feature engineering processing unit for converting the raw data into features, where this data is considered the clean data for performing analysis and the data is preserved and then stored in the cloud, and where the features represent the underlying problem in the predictive model ; a predictive modeling processing unit for finding the interesting patterns in the collected data by performing the predictive analysis; and a data visualization processing unit for reporting the analysis results to the user using various visual elements such as graphs and charts.

Ein Ziel der vorliegenden Offenlegung ist es, ein System für das Streaming und die Speicherung der heterogenen gestreamten Sensordaten unter Verwendung eines Microservices-Architekturmodells bereitzustellen.A goal of the present disclosure is to provide a system for streaming and storing the heterogeneous streamed sensor data using a microservices architecture model.

Ein weiteres Ziel der vorliegenden Offenlegung ist die Reinigung und Vorverarbeitung der gesammelten Rohdaten und die anschließende Speicherung der vorverarbeiteten Daten in der Cloud.Another goal of the present disclosure is to clean and pre-process the collected raw data and then store the pre-processed data in the cloud.

Ein weiteres Ziel der vorliegenden Offenlegung ist die Verwendung einer Microservicesbasierten ereignisgesteuerten Architektur mit Flink für Streaming.Another goal of the present disclosure is to use a microservices-based event-driven architecture with Flink for streaming.

Ein weiteres Ziel der vorliegenden Offenlegung ist es, Skalierbarkeit und Modularität in der Streaming-Analyse zu erreichen.Another goal of the present disclosure is to achieve scalability and modularity in streaming analysis.

Zur weiteren Verdeutlichung der Vorteile und Merkmale der vorliegenden Offenbarung wird eine genauere Beschreibung der Erfindung durch Bezugnahme auf bestimmte Ausführungsformen gegeben, die in den beigefügten Figuren dargestellt sind. Es wird davon ausgegangen, dass diese Figuren nur typische Ausführungsformen der Erfindung darstellen und daher nicht als Einschränkung des Umfangs der Erfindung zu betrachten sind. Die Erfindung wird mit zusätzlicher Spezifität und Detail mit den beigefügten Figuren beschrieben und erläutert werden.In order to further clarify the advantages and features of the present disclosure, a more detailed description of the invention is provided by reference to specific embodiments that are illustrated in the accompanying figures. It is understood that these figures represent only typical embodiments of the invention and therefore should not be considered as limiting the scope of the invention. The invention will be described and illustrated with additional specificity and detail with the accompanying figures.

Figurenlistecharacter list

Diese und andere Merkmale, Aspekte und Vorteile der vorliegenden Offenbarung werden besser verstanden, wenn die folgende detaillierte Beschreibung unter Bezugnahme auf die beigefügten Figuren gelesen wird, in denen gleiche Zeichen gleiche Teile in den Figuren darstellen, wobei:

  • 1 ein Blockdiagramm eines Systems für das Streaming und die Speicherung von heterogenen gestreamten Sensordaten unter Verwendung eines Microservices-Architekturmodells in Übereinstimmung mit einer Ausführungsform der vorliegenden Offenbarung zeigt;
  • 2 eine Streaming-Architektur des Flink-Programms in Übereinstimmung mit einer Ausführungsform der vorliegenden Offenbarung zeigt; und
  • 3 den Versuchsaufbau gemäß einer Ausführungsform der vorliegenden Offenbarung veranschaulicht.
These and other features, aspects, and advantages of the present disclosure will be better understood when the following detailed description is read with reference to the accompanying figures, in which like characters represent like parts throughout the figures, wherein:
  • 1 10 shows a block diagram of a system for streaming and storing heterogeneous streamed sensor data using a microservices architecture model, in accordance with an embodiment of the present disclosure;
  • 2 Figure 12 shows a streaming architecture of the Flink program in accordance with an embodiment of the present disclosure; and
  • 3 illustrates the experimental setup according to an embodiment of the present disclosure.

Der Fachmann wird verstehen, dass die Elemente in den Figuren der Einfachheit halber dargestellt sind und nicht unbedingt maßstabsgetreu gezeichnet wurden. Die Flussdiagramme veranschaulichen beispielsweise das Verfahren anhand der wichtigsten Schritte, um das Verständnis der Aspekte der vorliegenden Offenbarung zu verbessern. Darüber hinaus kann es sein, dass eine oder mehrere Komponenten der Vorrichtung in den Figuren durch herkömmliche Symbole dargestellt sind, und dass die Figuren nur die spezifischen Details zeigen, die für das Verständnis der Ausführungsformen der vorliegenden Offenbarung relevant sind, um die Figuren nicht mit Details zu überfrachten, die für Fachleute, die mit der vorliegenden Beschreibung vertraut sind, leicht erkennbar sind.Those skilled in the art will understand that the elements in the figures are presented for simplicity and are not necessarily drawn to scale. For example, the flow charts illustrate the method of key steps to enhance understanding of aspects of the present disclosure. In addition, one or more components of the device may be represented in the figures by conventional symbols, and the figures only show the specific details relevant to understanding the embodiments of the present disclosure, not to encircle the figures with details to overload, which are easily recognizable to those skilled in the art familiar with the present description.

DETAILLIERTE BESCHREIBUNGDETAILED DESCRIPTION

Um das Verständnis der Erfindung zu fördern, wird nun auf die in den Figuren dargestellte Ausführungsform Bezug genommen und diese mit bestimmten Worten beschrieben. Es versteht sich jedoch von selbst, dass damit keine Einschränkung des Umfangs der Erfindung beabsichtigt ist, wobei solche Änderungen und weitere Modifikationen des dargestellten Systems und solche weiteren Anwendungen der darin dargestellten Grundsätze der Erfindung in Betracht gezogen werden, wie sie einem Fachmann auf dem Gebiet der Erfindung normalerweise einfallen würden.For the purposes of promoting an understanding of the invention, reference will now be made to the embodiment illustrated in the figures and specific language will be used to describe the same. It should be understood, however, that no limitation on the scope of the invention is intended, and such changes and further modifications to the illustrated system and such further applications of the principles of the invention set forth therein are contemplated as would occur to those skilled in the art invention would normally come to mind.

Der Fachmann wird verstehen, dass die vorstehende allgemeine Beschreibung und die folgende detaillierte Beschreibung beispielhaft und erläuternd für die Erfindung sind und nicht als einschränkend angesehen werden.Those skilled in the art will understand that the foregoing general description and the following detailed description are exemplary and explanatory of the invention and are not to be taken as limiting.

Wenn in dieser Beschreibung von „einem Aspekt“, „einem anderen Aspekt“ oder ähnlichem die Rede ist, bedeutet dies, dass ein bestimmtes Merkmal, eine bestimmte Struktur oder eine bestimmte Eigenschaft, die im Zusammenhang mit der Ausführungsform beschrieben wird, in mindestens einer Ausführungsform der vorliegenden Offenbarung enthalten ist. Daher können sich die Ausdrücke „in einer Ausführungsform“, „in einer anderen Ausführungsform“ und ähnliche Ausdrücke in dieser Beschreibung alle auf dieselbe Ausführungsform beziehen, müssen es aber nicht.When this specification refers to "an aspect", "another aspect" or the like, it means that a particular feature, structure or particular characteristic described in connection with the embodiment is included in at least one embodiment of the present disclosure. Therefore, the phrases "in one embodiment,""in another embodiment," and similar phrases throughout this specification may or may not all refer to the same embodiment.

Die Ausdrücke „umfasst“, „enthaltend“ oder andere Variationen davon sollen eine nicht ausschließliche Einbeziehung abdecken, so dass ein Verfahren oder eine Methode, die eine Liste von Schritten umfasst, nicht nur diese Schritte einschließt, sondern auch andere Schritte enthalten kann, die nicht ausdrücklich aufgeführt sind oder zu einem solchen Verfahren oder einer solchen Methode gehören. Ebenso schließen eine oder mehrere Vorrichtungen oder Teilsysteme oder Elemente oder Strukturen oder Komponenten, die mit „umfasst... a“ eingeleitet werden, nicht ohne weitere Einschränkungen die Existenz anderer Vorrichtungen oder anderer Teilsysteme oder anderer Elemente oder anderer Strukturen oder anderer Komponenten oder zusätzlicher Vorrichtungen oder zusätzlicher Teilsysteme oder zusätzlicher Elemente oder zusätzlicher Strukturen oder zusätzlicher Komponenten aus.The terms "comprises," "including," or other variations thereof are intended to cover non-exclusive inclusion, such that a method or method that includes a list of steps includes not only those steps, but may also include other steps that are not expressly stated or pertaining to any such process or method. Likewise, any device or subsystem or element or structure or component preceded by "comprises...a" does not, without further limitation, exclude the existence of other devices or other subsystem or other element or other structure or other component or additional device or additional subsystems or additional elements or additional structures or additional components.

Sofern nicht anders definiert, haben alle hierin verwendeten technischen und wissenschaftlichen Begriffe die gleiche Bedeutung, wie sie von einem Fachmann auf dem Gebiet, zu dem diese Erfindung gehört, allgemein verstanden wird. Das System, die Methoden und die Beispiele, die hier angegeben werden, dienen nur der Veranschaulichung und sind nicht als Einschränkung gedacht.Unless otherwise defined, all technical and scientific terms used herein have the same meaning as commonly understood by one skilled in the art to which this invention pertains. The system, methods, and examples provided herein are for purposes of illustration only and are not intended to be limiting.

Ausführungsformen der vorliegenden Offenbarung werden im Folgenden unter Bezugnahme auf die beigefügten Figuren im Detail beschrieben.Embodiments of the present disclosure are described in detail below with reference to the attached figures.

Die in dieser Spezifikation beschriebenen Funktionseinheiten werden als Geräte bezeichnet. Ein Gerät kann in programmierbaren Hardware-Geräten wie Prozessoren, digitalen Signalprozessoren, zentralen Verarbeitungseinheiten, feldprogrammierbaren Gate-Arrays, programmierbaren Logik-Arrays, programmierbaren Logik-Geräten, Cloud-Verarbeitungssystemen oder Ähnlichem implementiert sein. Die Geräte können auch in Software für die Ausführung durch verschiedene Arten von Prozessoren implementiert werden. Ein identifiziertes Gerät kann einen ausführbaren Code enthalten und kann beispielsweise einen oder mehrere physische oder logische Blöcke von Computeranweisungen umfassen, die beispielsweise als Objekt, Prozedur, Funktion oder anderes Konstrukt organisiert sein können. Die ausführbare Datei eines identifizierten Geräts muss jedoch nicht physisch an einem Ort liegen, sondern kann aus verschiedenen, an unterschiedlichen Orten gespeicherten Anweisungen bestehen, die, wenn sie logisch zusammengefügt werden, das Gerät bilden und den angegebenen Zweck des Geräts erfüllen.The functional units described in this specification are referred to as devices. A device may be implemented in programmable hardware devices such as processors, digital signal processors, central processing units, field programmable gate arrays, programmable logic arrays, programmable logic devices, cloud processing systems, or the like. The devices can also be implemented in software for execution by various types of processors. An identified device may include executable code and may include, for example, one or more physical or logical blocks of computer instructions, which may be organized as an object, procedure, function, or other construct, for example. However, the executable file of an identified device does not have to reside physically in one location, but may consist of various instructions stored in different locations which, when logically assembled, form the device and fulfill the stated purpose of the device.

Der ausführbare Code eines Geräts oder Moduls kann ein einzelner Befehl oder eine Vielzahl von Befehlen sein und kann sogar über mehrere verschiedene Codesegmente, verschiedene Anwendungen und mehrere Speichergeräte verteilt sein. In ähnlicher Weise können Betriebsdaten innerhalb des Geräts identifiziert und dargestellt werden, wobei sie in jeder geeigneten Form vorliegen und in jeder geeigneten Art von Datenstruktur organisiert sein können. Die Betriebsdaten können als ein einziger Datensatz gesammelt werden oder über verschiedene Orte, einschließlich verschiedener Speichergeräte, verteilt sein und können zumindest teilweise als elektronische Signale in einem System oder Netzwerk vorliegen.The executable code of a device or module can be a single instruction or a multitude of instructions, and can even be distributed across several different code segments, different applications, and multiple storage devices. Similarly, operational data may be identified and represented within the device and may be in any suitable form and organized in any suitable type of data structure. The operational data may be collected as a single set of data or distributed across various locations, including various storage devices, and may exist, at least in part, as electronic signals in a system or network.

Wenn in dieser Beschreibung von „einer ausgewählten Ausführungsform“, „einer Ausführungsform“ oder „einer Ausführungsform“ die Rede ist, bedeutet dies, dass ein bestimmtes Merkmal, eine bestimmte Struktur oder eine bestimmte Eigenschaft, die im Zusammenhang mit der Ausführungsform beschrieben wird, in mindestens einer Ausführungsform des offengelegten Gegenstands enthalten ist. Daher beziehen sich die Ausdrücke „eine ausgewählte Ausführungsform“, „in einer Ausführungsform“ oder „in einer Ausführungsform“ an verschiedenen Stellen in dieser Beschreibung nicht unbedingt auf dieselbe Ausführungsform.When this specification refers to "a selected embodiment," "an embodiment," or "an embodiment," it means that a particular feature, structure, or characteristic described in connection with the embodiment is at least one embodiment of the disclosed subject matter. As such, the phrases "a selected embodiment," "in one embodiment," or "in one embodiment" throughout this specification are not necessarily all referring to the same embodiment.

Darüber hinaus können die beschriebenen Merkmale, Strukturen oder Eigenschaften in jeder geeigneten Weise in einer oder mehreren Ausführungsformen kombiniert werden. In der folgenden Beschreibung werden zahlreiche spezifische Details angegeben, um ein umfassendes Verständnis der Ausführungsformen des offengelegten Gegenstands zu ermöglichen. Der Fachmann wird jedoch erkennen, dass der offengelegte Gegenstand auch ohne eines oder mehrere der spezifischen Details oder mit anderen Methoden, Komponenten, Materialien usw. ausgeführt werden kann. In anderen Fällen werden bekannte Strukturen, Materialien oder Vorgänge nicht im Detail gezeigt oder beschrieben, um zu vermeiden, dass Aspekte des offengelegten Gegenstandes verdeckt werden.Furthermore, the features, structures, or characteristics described may be combined in any suitable manner in one or more embodiments. In the following description, numerous specific details are provided in order to provide a thorough understanding of the embodiments of the disclosed subject matter. However, one skilled in the art will recognize that the disclosed subject matter may be practiced without one or more of the specific details, or using other methods, components, materials, etc. In other instances, well-known structures, materials, or operations are not shown or described in detail to avoid obscuring aspects of the disclosed subject matter.

Gemäß den beispielhaften Ausführungsformen können die offengelegten Computerprogramme oder -module auf viele beispielhafte Arten ausgeführt werden, beispielsweise als Anwendung, die im Speicher eines Geräts resident ist, oder als gehostete Anwendung, die auf einem Server ausgeführt wird und mit der Geräteanwendung oder dem Browser über eine Reihe von Standardprotokollen wie TCP/IP, HTTP, XML, SOAP, REST, JSON und anderen ausreichenden Protokollen kommuniziert. Die offengelegten Computer programme können in beispielhaften Programmiersprachen geschrieben werden, die vom Speicher auf dem Gerät oder von einem gehosteten Server ausgeführt werden, wie BASIC, COBOL, C, C++, Java, Pascal oder Skriptsprachen wie JavaScript, Python, Ruby, PHP, Perl oder andere ausreichende Programmiersprachen.According to the example embodiments, the disclosed computer programs or modules may be executed in many example ways, such as as an application residing in a device's memory or as a hosted application running on a server and with the device application or browser communicates via a number of standard protocols such as TCP/IP, HTTP, XML, SOAP, REST, JSON and other sufficient protocols. The disclosed computer programs may be written in example programming languages executed from memory on the device or from a hosted server, such as BASIC, COBOL, C, C++, Java, Pascal, or scripting languages such as JavaScript, Python, Ruby, PHP, Perl or other sufficient programming languages.

Einige der offengelegten Ausführungsformen umfassen oder beinhalten die Datenübertragung über ein Netzwerk, z. B. die Übermittlung verschiedener Eingaben oder Dateien über das Netzwerk. Das Netzwerk kann beispielsweise das Internet, Wide Area Networks (WANs), Local Area Networks (LANs), analoge oder digitale drahtgebundene und drahtlose Telefonnetzwerke (z. B. PSTN, Integrated Services Digital Network (ISDN), ein zellulares Netzwerk und Digital Subscriber Line (xDSL)), Radio, Fernsehen, Kabel, Satellit und/oder andere Übertragungs- oder Tunnelmechanismen zur Übertragung von Daten umfassen. Das Netz kann mehrere Netze oder Teilnetze umfassen, von denen jedes z. B. einen drahtgebundenen oder drahtlosen Datenpfad enthalten kann. Das Netz kann ein leitungsvermitteltes Sprachnetz, ein paketvermitteltes Datennetz oder ein beliebiges anderes Netz für die Übertragung elektronischer Kommunikation umfassen. Das Netzwerk kann beispielsweise Netzwerke umfassen, die auf dem Internet-Protokoll (IP) oder dem asynchronen Übertragungsmodus (ATM) basieren, und es kann Sprache unterstützen, indem es z. B. VoIP, Voice-over-ATM oder andere vergleichbare Protokolle für die Sprachdatenkommunikation verwendet. In einer Implementierung umfasst das Netzwerk ein zellulares Telefonnetz, das so konfiguriert ist, dass es den Austausch von Text- oder SMS-Nachrichten ermöglicht.Some of the disclosed embodiments include or involve data transmission over a network, e.g. B. the transmission of various inputs or files over the network. The network can be, for example, the Internet, wide area networks (WANs), local area networks (LANs), analog or digital wired and wireless telephone networks (e.g. PSTN, Integrated Services Digital Network (ISDN), a cellular network and digital subscriber line (xDSL)), radio, television, cable, satellite and/or other transmission or tunneling mechanisms for the transmission of data. The network may comprise several networks or sub-networks, each of which e.g. B. may include a wired or wireless data path. The network may comprise a circuit switched voice network, a packet switched data network or any other network for the transmission of electronic communications. The network may for example comprise Internet Protocol (IP) or Asynchronous Transfer Mode (ATM) based networks and may support voice e.g. B. VoIP, Voice-over-ATM or other comparable protocols for voice data communication. In one implementation, the network includes a cellular telephone network configured to allow the exchange of text or SMS messages.

Beispiele für ein Netzwerk sind unter anderem ein Personal Area Network (PAN), ein Storage Area Network (SAN), ein Home Area Network (HAN), ein Campus Area Network (CAN), ein Local Area Network (LAN), ein Wide Area Network (WAN), ein Metropolitan Area Network (MAN), ein Virtual Private Network (VPN), ein Enterprise Private Network (EPN), das Internet, ein Global Area Network (GAN) und so weiter.Examples of a network include a personal area network (PAN), a storage area network (SAN), a home area network (HAN), a campus area network (CAN), a local area network (LAN), a wide area Network (WAN), a Metropolitan Area Network (MAN), a Virtual Private Network (VPN), an Enterprise Private Network (EPN), the Internet, a Global Area Network (GAN), and so on.

1 zeigt ein Blockdiagramm eines Systems für das Streaming und die Speicherung heterogener gestreamter Sensordaten unter Verwendung eines Microservices-Architekturmodells in Übereinstimmung mit einer Ausführungsform der vorliegenden Offenbarung. Das System (100) umfasst eine Datenerfassungs-Verarbeitungseinheit 102 zum Erfassen der heterogenen Daten von verschiedenen Sensortypen, wobei die erfassten Daten roh und unstrukturiert sind. 1 10 shows a block diagram of a system for streaming and storing heterogeneous streamed sensor data using a microservices architecture model, in accordance with an embodiment of the present disclosure. The system (100) comprises a data acquisition processing unit 102 for acquiring the heterogeneous data from different sensor types, where the acquired data is raw and unstructured.

In einer Ausführungsform wird eine Datenbereinigungseinheit 104 verwendet, um die redundanten Daten zu eliminieren und die erforderlichen Daten aus den aus heterogenen Sensordaten gesammelten Rohdaten zu filtern.In one embodiment, a data cleaning unit 104 is used to eliminate the redundant data and filter the required data from the raw data collected from heterogeneous sensor data.

In einer Ausführungsform wird eine Datenexplorationsverarbeitungseinheit 106 verwendet, um die Analysen der heterogenen Sensordaten der unstrukturierten Daten durchzuführen und dabei die Datenmuster zu identifizieren.In one embodiment, a data exploration processing unit 106 is used to perform the analyzes of the heterogeneous sensor data of the unstructured data, thereby identifying the data patterns.

In einer Ausführungsform wird eine Feature-Engineering-Verarbeitungseinheit 108 verwendet, um die Rohdaten in Merkmale umzuwandeln, wobei diese Daten als die sauberen Daten für die Durchführung von Analysen betrachtet werden und die Daten aufbewahrt und dann in der Cloud gespeichert werden, und wobei die Merkmale das zugrunde liegende Problem im Vorhersagemodell darstellen.In one embodiment, a feature engineering processing unit 108 is used to convert the raw data into features, which data is considered the clean data for performing analysis, and the data is preserved and then stored in the cloud, and the features represent the underlying problem in the prediction model.

In einer Ausführungsform wird eine Verarbeitungseinheit 110 für die Vorhersagemodellierung verwendet, um die interessanten Muster in den gesammelten Daten durch die Durchführung einer Vorhersageanalyse zu finden.In one embodiment, a predictive modeling processing unit 110 is used to find the interesting patterns in the collected data by performing predictive analysis.

In einer Ausführungsform wird eine Datenvisualisierungseinheit 112 verwendet, um dem Benutzer die Analyseergebnisse mit Hilfe verschiedener visueller Elemente wie Grafiken und Diagrammen zu präsentieren.In one embodiment, a data visualization unit 112 is used to present the analysis results to the user using various visual elements such as graphs and charts.

In einer Ausführungsform verwendet das System eine auf Microservices basierende, selbstgesteuerte Architektur mit Flink für Streaming, wodurch das vorgeschlagene System Skalierbarkeit und Modularität erreichen kann, wobei einige andere architektonische Merkmale hoher Durchsatz, Skalierbarkeit, Verfügbarkeit, Zuverlässigkeit und Agilität sowie Wartungsfreundlichkeit sind.In one embodiment, the system uses a microservices-based self-directed architecture with Flink for streaming, which allows the proposed system to achieve scalability and modularity, with some other architectural features being high throughput, scalability, availability, reliability and agility, and maintainability.

In einer Ausführungsform wird ein Prüfstand für einen Versuchsaufbau erstellt bei dem die Umgebungsdaten wie Temperatur- und Luftfeuchtigkeitswerte stündlich durch mehrere Geräte gestreamt werden, um die Redundanz der Daten zu demonstrieren.In one embodiment, a test bench for an experimental setup is created in which the environmental data such as temperature and humidity values are streamed hourly through multiple devices in order to demonstrate the redundancy of the data.

In einer Ausführungsform sind die experimentellen Komponenten der Architektur Flink zum Streaming der Daten von mehreren Sensoren, Microservices zum Sammeln, Analysieren und Berichten, dynamische Integration, bei der Apache Kafka als Nachrichtenwarteschlangensystem zum Erzeugen von Daten und zum anschließenden Veröffentlichen der relevanten Themen verwendet wird, Analytik zum Durchführen der Datenanalyse unter Verwendung von Algorithmen der Komponente für maschinelles Lernen in Python und Dashboard zum effizienten Berichten der Informationen nach der Durchführung der Analyse, wobei das Dashboard Diagramme und Grafiken zur Darstellung der Ergebnisse der prädiktiven Analyse zeigt.In one embodiment, the experimental components of the architecture are Flink for streaming the data from multiple sensors, microservices for collecting, analyzing and reporting, dynamic integration using Apache Kafka as a message queuing system for generating data and then publishing the relevant topics, Analy tik to perform the data analysis using machine learning component algorithms in Python and dashboard to efficiently report the information after performing the analysis, with the dashboard showing charts and graphs to present the results of the predictive analysis.

In einer Ausführungsform werden die Daten mit Hilfe von Sensoren wie MQ135, DHT11, MQ131, DHT22 gesammelt, wobei die Daten mit Hilfe von Arduino- und Raspberry-Pi-Mikrocontrollern gesammelt werden, die Daten in der Plattform mit Hilfe der Think-Speak-Plattform veröffentlicht werden, die Streaming-Plattform mit Hilfe der MQTT-Flink-Brücke integriert wird, Die Daten werden in der Plattform mit Hilfe der Think Speak-Plattform veröffentlicht, die Streaming-Plattform wird mit Hilfe der MQTT Flink Bridge integriert, wobei der Flink-Streaming-Konsument die Daten empfängt und sie dann mit Hilfe der Kafka-Integrationsschicht im MongoDB-Datenbankprogramm veröffentlicht.In one embodiment, the data is collected using sensors such as MQ135, DHT11, MQ131, DHT22, the data is collected using Arduino and Raspberry Pi microcontrollers, the data is collected in the platform using the Think-Speak platform are published, the streaming platform is integrated using the MQTT Flink bridge, the data is published in the platform using the Think Speak platform, the streaming platform is integrated using the MQTT Flink bridge, the Flink Streaming consumer receives the data and then publishes it to the MongoDB database program using the Kafka integration layer.

In einer Ausführungsform werden auch Luftqualitätsdaten von verschiedenen Sensorgeräten gestreamt, indem mehrere Parameter verwendet werden, und diese Daten werden in Bezug auf den Zeitstempelwert kombiniert, und Wetterdaten werden ebenfalls kombiniert, um einen einzigen Datenstrom für jeden Zeitstempel zu erzeugen.In one embodiment, air quality data is also streamed from different sensor devices using multiple parameters and this data is combined with respect to the timestamp value and weather data is also combined to produce a single data stream for each timestamp.

In einer Ausführungsform wird ein auf Python basierendes Programm für die Datenexploration verwendet, bei der die Daten bereinigt und vorverarbeitet werden, wobei unerwünschte und falsche Daten entfernt werden, fehlende Daten durch geeignete Werte ersetzt werden und nur die erforderlichen Merkmale für die Analyse extrahiert werden, woraufhin diese korrigierten und bereinigten Daten zur Analyse in die Cloud hochgeladen werden, so dass durch diesen Prozess der Aggregation und Vorverarbeitung von Daten nur die erforderlichen Daten erhalten bleiben, was zu einer Verringerung des für die Speicherung der Daten erforderlichen Speichers führt.In one embodiment, a Python-based program is used for data exploration, where the data is cleaned and pre-processed, removing unwanted and incorrect data, replacing missing data with appropriate values, and extracting only the required features for analysis, after which this corrected and sanitized data is uploaded to the cloud for analysis, so this process of aggregating and pre-processing data only preserves the necessary data, resulting in a reduction in the storage required to store the data.

In einer Ausführungsform können die Datenerfassungs-Verarbeitungseinheit (102), die Datenbereinigungs-Verarbeitungseinheit (104), die Datenexplorations-Verarbeitungseinheit (106), die Feature-Engineering-Verarbeitungseinheit (108), die prädiktive Modellierungs-Verarbeitungseinheit (110) und die Datenvisualisierungs-Verarbeitungseinheit (112) in programmierbaren Hardware-Geräten wie Prozessoren, digitalen Signalprozessoren, zentralen Verarbeitungseinheiten, feldprogrammierbaren Gate-Arrays, programmierbaren Logik-Arrays, programmierbaren Logik-Geräten, Cloud-Verarbeitungssystemen oder ähnlichem implementiert sein.In one embodiment, the data collection processing unit (102), the data cleaning processing unit (104), the data exploration processing unit (106), the feature engineering processing unit (108), the predictive modeling processing unit (110), and the data visualization processing unit Processing unit (112) be implemented in programmable hardware devices such as processors, digital signal processors, central processing units, field programmable gate arrays, programmable logic arrays, programmable logic devices, cloud processing systems or the like.

Im Folgenden werden die einzelnen experimentellen Komponenten der vorgeschlagenen Architektur erläutert.

  1. 1. Flink-Streaming: Es handelt sich um ein ereignisbasiertes Streaming, bei dem Apache Flink für das Streaming von Daten aus mehreren Quellen verwendet wird.
  2. 2. Microservices: Diese Aufgabe dient dem Sammeln, Analysieren und Berichten der Daten. Microservices sind modular mit der Interaktion mit den Komponenten wie Codefunktion, Daten und anderen Ressourcen.
  3. 3. Dynamische Integration: Apache Kafka wird als Nachrichten-Warteschlangensystem für die Produktion von Daten und deren Veröffentlichung in den entsprechenden Topics verwendet, wobei Flink Kafka Consumer für das Abonnieren und Konsumieren eines Topics für die lose Kopplung der Lösung und die Bereitstellung einer Integrationsschicht für die Integration mit verteilten Systemen von Drittanbietern verwendet wird.
  4. 4. Analytik: Ein Algorithmus der Komponente für maschinelles Lernen wird zur Durchführung der Analyse der gespeicherten Daten verwendet, wobei der Algorithmus durch eine Python-Komponente implementiert wird. Bei den Sensordaten handelt es sich um Zeitreighendaten Zur Untersuchung der Muster wie z. B. langfristiger Trend, saisonale Auswirkungen und Korrelation zwischen dem Merkmalsvektor und dem unabhängigen Vektor, wird eine Deep-Learning-Technik zur Durchführung der Prognoseanalyse verwendet.
  5. 5. Dashboard: Das Dashboard wird für die Berichterstattung über die Endergebnisse der Datenanalyse verwendet, wobei für die Berichterstattung visuelle Darstellungen verwendet werden, bei denen Grafiken und Diagramme für die Berichterstattung über die Ergebnisse der prädiktiven Analyse verwendet wurden.
The individual experimental components of the proposed architecture are explained below.
  1. 1. Flink Streaming: It is an event-based streaming that uses Apache Flink to stream data from multiple sources.
  2. 2. Microservices: This task is used to collect, analyze and report the data. Microservices are modular with the interaction with the components like code function, data and other resources.
  3. 3. Dynamic Integration: Apache Kafka is used as a message queuing system for producing data and publishing it in the appropriate topics, while Flink Kafka Consumer for subscribing and consuming a topic for loosely coupling the solution and providing an integration layer for the Integration with third-party distributed systems is used.
  4. 4. Analytics: An algorithm of the machine learning component is used to perform the analysis of the stored data, the algorithm being implemented by a Python component. The sensor data is time-series data. To examine the patterns such as e.g. B. long-term trend, seasonal effects and correlation between the feature vector and the independent vector, a deep learning technique is used to perform the forecast analysis.
  5. 5. Dashboard: The dashboard is used for reporting the final results of data analysis using visual representations for reporting where graphs and charts were used for reporting the results of predictive analysis.

2 zeigt eine Streaming-Architektur des Flink-Programms in Übereinstimmung mit einer Ausführungsform der vorliegenden Offenbarung. Eine Flink-Laufzeitumgebung hat zwei Arten von Prozessen, nämlich einen Job-Manager und einen oder mehrere Task-Manager, wobei der Job-Manager als Koordinator des Flink-Systems betrachtet wird, während der Task-Manager als Worker betrachtet wird, der Teile von parallelen Programmen ausführt. In dieser Architektur wird jede Aufgabe als ein Thread betrachtet. 2 10 shows a streaming architecture of the Flink program, in accordance with an embodiment of the present disclosure. A Flink runtime environment has two types of processes, namely a job manager and one or more task managers, where the job manager is considered to be the coordinator of the Flink system, while the task manager is considered to be a worker that runs parts of runs parallel programs. In this architecture, each task is considered a thread.

3 veranschaulicht den Versuchsaufbau gemäß einer Ausführungsform der vorliegenden Offenbarung. Der Versuchsaufbau, wie in der Abbildung gezeigt, besteht aus verschiedenen Schichten. Die erste Schicht ist die Datensammelschicht, in der die Sensordaten gesammelt werden, wobei Sammelagenten die heterogenen Daten sammeln, die von verschiedenen Sensoren der zu messenden Multiparameter erzeugt werden, wobei der Kollektor ein einziger Punkt für die Sammlung der Sensordaten ist und das interne Softwaremuster für die Implementierung auf einem Singleton-Designmuster basieren könnte. Die nächste Schicht ist der Streaming-Data-Prozessor, in dem die Rohdaten gespeichert werden, die untersucht werden müssen, und in dem das Feature-Engineering durchgeführt wird, bevor eine prädiktive Analyse durchgeführt wird. Die Integrationsschicht führt die Integration und Schnittstellenbildung mit externen Systemen und Software von Drittanbietern durch, um verschiedene Funktionalitäten zu erreichen. Die nächste Schicht ist die Datenanalyse, bei der die Daten mithilfe eines Algorithmus für maschinelles Lernen analysiert werden. Sobald die Analyse durchgeführt wurde, wird die Berichterstattung über die Daten in der Datenvisualisierungsschicht eingeleitet, wobei die Berichterstattung mithilfe von Diagrammen und Tabellen erfolgt. 3 illustrates the experimental setup according to an embodiment of the present disclosure. The experimental setup, as shown in the figure, consists of different layers. The first layer is the data collection layer where the sensor data is collected, with collection agents collecting the heterogeneous data generated by different sensors of the multi-parameters to be measured, the collector being a single point for the collection of the sensor data and the internal software pattern for the Implementation could be based on a singleton design pattern. The next layer is the streaming data processor, which stores the raw data that needs to be examined and does the feature engineering before performing predictive analysis. The integration layer performs integration and interfacing with external systems and third-party software to achieve various functionalities. The next layer is data analysis, where the data is analyzed using a machine learning algorithm. Once the analysis has been performed, reporting on the data is initiated in the data visualization layer, reporting is done using charts and tables.

Für die experimentelle Analyse des vorgeschlagenen Systems wurde ein Prüfstand eingerichtet, bei dem stündlich Umgebungsdaten gestreamt werden. Die Temperatur- und Luftfeuchtigkeitswerte werden über mehrere Geräte gestreamt, um die Redundanz der Daten zu demonstrieren. Apache Kafka wird als Nachrichten-Warteschlangensystem für die Erzeugung von Daten und die Veröffentlichung relevanter Themen verwendet. Apache Kafka verfügt über mehrere Themen und mehrere Partitionen zur Erleichterung der parallelen Verarbeitung. Die auf Flink basierende Consumer-Task wird verwendet, um das Topic mit der Nachricht zu konsumieren und die Daten zu gruppieren, wobei die Daten entsprechend dem Zeitstempel mit dem Schlüsselwert aggregiert werden, um die Redundanz zu entfernen. Die Telemetriedaten zur Luftqualität werden auch von verschiedenen Sensorgeräten mit mehreren Parametern gestreamt. Diese Daten werden in Bezug auf den Zeitstempelwert kombiniert. Die Wetterdaten werden ebenfalls kombiniert, um einen einzigen Datenstrom für jeden Zeitstempel zu erstellen. Die Aufgabe, die für die Datenexploration verantwortlich ist, analysiert die Aufgabe, bei der es sich um ein auf Python basierendes Programm handelt, das zum Entfernen unerwünschter und falscher Daten, zum Ersetzen fehlender Werte und zum Extrahieren der für die Analyse erforderlichen Merkmale verwendet wird, und dann werden diese extrahierten Daten zur Durchführung von Analysen in die Cloud hochgeladen. Durch die Aggregation und Vorverarbeitung werden also nur die erforderlichen Daten beibehalten. Daher wird mit dem vorgeschlagenen Ansatz die Menge an Speicherplatz, die für die Speicherung unerwünschter und unklarer Daten erforderlich ist, erheblich reduziert und auch die Kosten, die durch das Richtungsstreaming entstehen, verringert. Sobald die Analysen durchgeführt wurden, besteht die nächste Aufgabe darin, einen Bericht zu erstellen, der von einem Thread aufgerufen wird, und eine visuelle Darstellung der analysierten Daten zu erzeugen, die auf dem Dashboard angezeigt wird.A test bench was set up for the experimental analysis of the proposed system, where environmental data is streamed every hour. Temperature and humidity readings are streamed across multiple devices to demonstrate data redundancy. Apache Kafka is used as a message queuing system for generating data and publishing relevant topics. Apache Kafka has multiple themes and multiple partitions to facilitate parallel processing. The Flink-based consumer task is used to consume the topic containing the message and group the data, aggregating the data according to the timestamp with the key value to remove redundancy. The air quality telemetry data is also streamed from various sensor devices with multiple parameters. This data is combined in terms of the timestamp value. The weather data is also combined to create a single data stream for each timestamp. The task responsible for data exploration analyzes task which is a Python based program used to remove unwanted and incorrect data, replace missing values and extract features needed for analysis, and then this extracted data is uploaded to the cloud to perform analysis. So, aggregation and pre-processing keeps only the necessary data. Therefore, with the proposed approach, the amount of disk space required to store unwanted and unclear data is significantly reduced and the costs incurred by directional streaming are also reduced. Once the analyzes have been performed, the next task is to create a report that will be called from a thread and produce a visual representation of the analyzed data to be displayed on the dashboard.

Der für die Entwicklung des Versuchsaufbaus geschaffene Prüfstand besteht aus den Sensoren MQ135, DHT11, MQ131 und DHT22, die die Umgebungsdaten erfassen, wobei die Daten mithilfe von Arduino- und Raspberry Pi-Mikrocontrollern gesammelt werden. Die Daten werden auf der Plattform mit Hilfe der Think Speak IoT-Plattform veröffentlicht, die das MQTT-Protokoll für die Veröffentlichung verwendet. Die Integration der Streaming-Plattform erfolgt über die MQTT-Flink-Brücke, wobei der Flink-Streaming-Konsument die Daten empfängt und sie über die Kafka-Integrationsschicht in der MongoDB (Datenbank) veröffentlicht. Sobald die Vorverarbeitung abgeschlossen ist und die Vorhersageanalyse durchgeführt wurde. Die erzielten Ergebnisse werden auf dem Dashboard mit Hilfe von visuellen Elementen wie Diagrammen und Grafiken dargestellt. Die Beispieldaten werden an einem einzigen Tag für eine Stadt gesammelt und vor der Analyse zu einem einzigen Datenstrom zusammengefasst.The test bench created for the development of the experimental setup consists of the MQ135, DHT11, MQ131 and DHT22 sensors that collect the environmental data, with the data being collected using Arduino and Raspberry Pi microcontrollers. The data is published on the platform using the Think Speak IoT platform, which uses the MQTT protocol for publication. The integration of the streaming platform is done via the MQTT Flink bridge, where the Flink streaming consumer receives the data and publishes it to the MongoDB (database) via the Kafka integration layer. Once the pre-processing is complete and the predictive analysis has been performed. The results obtained are presented on the dashboard with the help of visual elements such as charts and graphs. Sample data is collected in a single day for a city and combined into a single data stream prior to analysis.

In einer Ausführungsform verarbeitet der vorgeschlagene Ansatz für die Speicherung der heterogenen Sensordaten die Daten in Echtzeit, und nur die Daten, die für die Analyse bereit sind, werden in der Datenbank für künftige Referenzen gespeichert. Der vorgeschlagene Ansatz reduziert die Kosten, die mit dem Streaming und der Speicherung der Sensordaten verbunden sind. Der vorgeschlagene Ansatz hilft auch bei der Erreichung von Skalierbarkeit und Modularität, da in dem vorgeschlagenen Ansatz eine auf Microservices basierende, selbstgesteuerte Architektur zusammen mit Flink für das Streaming verwendet wird, wobei Microservices die vertikale Skalierung der Komponente und die containerisierte Architektur die Modularität ermöglichen und zusammen mit all dem ist die Cloud-Umgebung horizontal skalierbar. Die prädiktive Analyse wird angewendet, um interessante Muster, Trends und Erkenntnisse zu finden. Der vorgeschlagene Ansatz liefert einen Datenstrom, der für maschinelles Lernen verwendet werden kann, indem die Daten im Datenspeicher in der Cloud gespeichert werden. Die Echtzeitdaten werden in der MongDB gespeichert, wo sie als historische Daten für die zukünftige Nutzung verwendet werden. Die gespeicherten Daten können für die Erstellung eines Vorhersagemodells verwendet werden, das eine Deep-Learning-Technik verwendet, um aufschlussreichere Ergebnisse zu erzielen. Darüber hinaus können die gespeicherten Daten auch zur Untersuchung der Beziehung zwischen dem Merkmalsvektor und der Zielvariablen verwendet werden, die in den Diagrammen und Grafiken auf einem analytischen Dashboard dargestellt wird. Der vorgeschlagene Ansatz versucht, die Lücke zwischen der akademischen Forschung und dem praktischen Ansatz zu schließen, indem er eine containerisierte, lose gekoppelte architektonische Lösung bereitstellt, die eine praktische Umsetzung in der Industrie ermöglicht.In one embodiment, the proposed approach for storing the heterogeneous sensor data processes the data in real-time and only the data that is ready for analysis is stored in the database for future reference. The proposed approach reduces the costs associated with streaming and storing the sensor data. The proposed approach also helps in achieving scalability and modularity as in the proposed approach a microservices based self-directed architecture is used together with Flink for streaming, with microservices component vertical scaling and containerized architecture enabling modularity and together with all this, the cloud environment is horizontally scalable. Predictive analytics is applied to find interesting patterns, trends, and insights. The proposed approach delivers a data stream that can be used for machine learning by storing the data in data storage in the cloud. The real-time data is stored in the MongDB where it is used as historical data for future use. The stored data can be used to build a predictive model that uses a deep learning technique to produce more insightful results. In addition, the stored data can also be used for Examination of the relationship between the feature vector and the target variable represented in the charts and graphs on an analytical dashboard. The proposed approach attempts to bridge the gap between academic research and the practical approach by providing a containerized, loosely coupled architectural solution that enables practical implementation in industry.

Die Figuren und die vorangehende Beschreibung geben Beispiele für Ausführungsformen. Der Fachmann wird verstehen, dass eines oder mehrere der beschriebenen Elemente durchaus zu einem einzigen Funktionselement kombiniert werden können. Alternativ dazu können bestimmte Elemente in mehrere Funktionselemente aufgeteilt werden. Elemente aus einer Ausführungsform können einer anderen Ausführungsform hinzugefügt werden. So kann beispielsweise die Reihenfolge der hier beschriebenen Prozesse geändert werden und ist nicht auf die hier beschriebene Weise beschränkt. Darüber hinaus müssen die Aktionen eines Flussdiagramms nicht in der gezeigten Reihenfolge ausgeführt werden; auch müssen nicht unbedingt alle Aktionen durchgeführt werden. Auch können diejenigen Handlungen, die nicht von anderen Handlungen abhängig sind, parallel zu den anderen Handlungen ausgeführt werden. Der Umfang der Ausführungsformen ist durch diese spezifischen Beispiele keineswegs begrenzt. Zahlreiche Variationen sind möglich, unabhängig davon, ob sie in der Beschreibung explizit aufgeführt sind oder nicht, wie z. B. Unterschiede in der Struktur, den Abmessungen und der Verwendung von Materialien. Der Umfang der Ausführungsformen ist mindestens so groß wie in den folgenden Ansprüchen angegeben.The figures and the preceding description give examples of embodiments. Those skilled in the art will understand that one or more of the elements described may well be combined into a single functional element. Alternatively, certain elements can be broken down into multiple functional elements. Elements from one embodiment may be added to another embodiment. For example, the order of the processes described herein may be changed and is not limited to the manner described herein. Additionally, the actions of a flowchart need not be performed in the order shown; Also, not all actions have to be carried out. Also, those actions that are not dependent on other actions can be performed in parallel with the other actions. The scope of the embodiments is in no way limited by these specific examples. Numerous variations are possible, regardless of whether they are explicitly mentioned in the description or not, e.g. B. Differences in structure, dimensions and use of materials. The scope of the embodiments is at least as broad as indicated in the following claims.

Vorteile, andere Vorzüge und Problemlösungen wurden oben im Hinblick auf bestimmte Ausführungsformen beschrieben. Die Vorteile, Vorzüge, Problemlösungen und Komponenten, die dazu führen können, dass ein Vorteil, ein Nutzen oder eine Lösung auftritt oder ausgeprägter wird, sind jedoch nicht als kritisches, erforderliches oder wesentliches Merkmal oder Komponente eines oder aller Ansprüche zu verstehen.Advantages, other benefits, and solutions to problems have been described above with respect to particular embodiments. However, the benefits, advantages, problem solutions, and components that can cause an advantage, benefit, or solution to occur or become more pronounced are not to be construed as a critical, required, or essential feature or component of any or all claims.

BezugszeichenlisteReference List

100100
Ein System für das Streaming und die Speicherung heterogener Sensordatenströme unter Verwendung einer Microservices-Architektur.A system for streaming and storing heterogeneous sensor data streams using a microservices architecture.
102102
Verarbeitungseinheit für die Datenerfassung.Processing unit for data acquisition.
104104
Verarbeitungseinheit für die Datenbereinigung.Processing unit for data cleaning.
106106
Verarbeitungseinheit für die DatenexplorationProcessing unit for data exploration
108108
Verarbeitungseinheit für Merkmalstechnik.Processing unit for feature engineering.
110110
Verarbeitungseinheit für prädiktive Modellierung.Predictive modeling processing unit.
112112
Verarbeitungseinheit für die Datenvisualisierung.Processing unit for data visualization.
204204
Aufgabenverwaltungtask management
206206
SammelnCollect
208208
AnalysierenAnalyze
210210
Speicher- und E/A-ManagerStorage and I/O manager
212212
Netzwerk-Managernetwork manager
214214
Akteur-Systemactor system
216216
Datenstromdata stream
218218
Berichtreport
220220
Auftragsverwaltungorder management
222222
Datenflussdiagrammdata flow diagram
224 226224 226
Planer Prüfnunkt-KoordinatorPlanner test point coordinator
228228
Flink-ProgrammFlink program
230230
Programmcodeprogram code
232232
Optimierer/Graph BuilderOptimizer/Graph Builder
234234
Klientclient
236236
Aufgabenstatus Heartbeat-StatistikTask Status Heartbeat Statistics
238238
Deploy/Stop Aufgaben abbrechenDeploy/Stop cancel tasks
240240
Checkpoint auslösenTrigger checkpoint
242242
Status-Aktualisierungstatus update
244244
Statistik & ErgebnisseStatistics & Results
246246
Auftrag abschickensend order
248248
Auftrag abbrechen/aktualisierenCancel/Update Order
302302
Datenerfassungsschichtdata acquisition layer
304304
Sensordatensensor data
306306
Raspberry Pi (Datensammler)Raspberry Pi (data collector)
308308
Daten-Streaming-Schichtdata streaming layer
310310
Cloud-Gatewaycloud gateway
312312
Prozessor für Streaming-DatenProcessor for streaming data
314314
Datenlagerdata warehouse
316316
Integrationsschichtintegration layer
318318
Kafka-VerlegerKafka publisher
320320
Kafka-AbonnentKafka Subscriber
322322
Datenanalyse-SchichtData Analysis Layer
324324
Modellemodels
326326
Algorithmus für maschinelles LernenMachine Learning Algorithm
328328
Datenvisualisierungdata visualization
330330
Datendarstellung (Diagramme und Grafiken)Data presentation (charts and graphs)
332332
Prädiktive AnalysePredictive Analysis
334334
ErgebnisseResults

Claims (7)

Ein System zum Streaming und Speichern der heterogenen gestreamten Sensordaten unter Verwendung eines Microservices-Architekturmodells, wobei das System Folgendes umfasst: eine Datenerfassungs-Verarbeitungseinheit zum Erfassen der heterogenen Daten von verschiedenen Arten von Sensoren, wobei die erfassten Daten roh und unstrukturiert sind; eine Datenbereinigungsverarbeitungseinheit zum Eliminieren der redundanten Daten und zum Filtern der erforderlichen Daten aus den aus heterogenen Sensordaten gesammelten Rohdaten; eine Datenexplorations-Verarbeitungseinheit zur Durchführung der Analyse der heterogenen Sensordaten der unstrukturierten Daten und damit zur Identifizierung der Datenmuster; eine Feature-Engineering-Verarbeitungseinheit zum Umwandeln der Rohdaten in Merkmale, wobei diese Daten als die sauberen Daten für die Durchführung von Analysen betrachtet werden und die Daten aufbewahrt und dann in der Cloud gespeichert werden, und wobei die Merkmale das zugrunde liegende Problem im Vorhersagemodell darstellen; eine Verarbeitungseinheit für die prädiktive Modellierung zum Auffinden interessanter Muster in den gesammelten Daten durch Durchführung einer Vorhersageanalyse; und eine Datenvisualisierungseinheit, die dem Benutzer die Analyseergebnisse unter Verwendung verschiedener visueller Elemente, wie z. B. Diagramme und Tabellen, anzeigt.A system for streaming and storing the heterogeneous streamed sensor data using a microservices architecture model, the system comprising: a data acquisition processing unit for acquiring the heterogeneous data from different types of sensors, the acquired data being raw and unstructured; a data cleaning processing unit for eliminating the redundant data and for filtering the required data from the raw data collected from heterogeneous sensor data; a data exploration processing unit for performing the analysis of the heterogeneous sensor data of the unstructured data and thereby identifying the data patterns; a feature engineering processing unit to transform the raw data into features, where this data is considered the clean data to perform analysis and the data is kept and then stored in the cloud, and where the features represent the underlying problem in the predictive model ; a predictive modeling processing unit for finding patterns of interest in the collected data by performing predictive analysis; and a data visualization unit that presents the analysis results to the user using various visual elements, such as B. diagrams and tables. Das System nach Anspruch 1, wobei das System eine auf Microservices basierende, selbstgesteuerte Architektur mit Flink für Streaming verwendet, wodurch das vorgeschlagene System Skalierbarkeit und Modularität erreichen kann, wobei einige andere architektonische Merkmale hoher Durchsatz, Skalierbarkeit, Verfügbarkeit, Zuverlässigkeit und Agilität sowie Wartbarkeit sind.The system after claim 1 , where the system uses a microservices-based self-directed architecture with Flink for streaming, which allows the proposed system to achieve scalability and modularity, with some other architectural features being high throughput, scalability, availability, reliability and agility, and maintainability. System nach Anspruch 1, bei dem ein Prüfstand für einen Versuchsaufbau geschaffen wird, bei dem die Umgebungsdaten wie Temperatur- und Feuchtigkeitswerte stündlich über mehrere Geräte gestreamt werden, um die redundanten Daten zu demonstrieren.system after claim 1 , in which a test bench is created for an experimental setup where the environmental data such as temperature and humidity values are streamed hourly via multiple devices to demonstrate the redundant data. Das System nach Anspruch 3, wobei experimentelle Komponenten der Architektur Flink zum Streaming der Daten von mehreren Sensoren, Microservices zum Sammeln, Analysieren und Berichten, dynamische Integration, bei der Apache Kafka als Nachrichten- Warteschlangensystem zum Erzeugen von Daten und zum anschließenden Veröffentlichen der relevanten Themen verwendet wird, Analytik zum Durchführen einer Datenanalyse unter Verwendung eines Algorithmus der Komponente für maschinelles Lernen in Python und ein Dashboard zum effizienten Berichten der Informationen nach dem Durchführen der Analyse sind, wobei das Dashboard Diagramme und Grafiken zum Darstellen der Ergebnisse der prädiktiven Analyse zeigt.The system after claim 3 , using experimental components of the Flink architecture for streaming the data from multiple sensors, Microservices for collecting, analyzing and reporting, Dynamic integration using Apache Kafka as a message queuing system for generating data and then publishing the relevant topics, Analytics for Performing data analysis using a machine learning component algorithm in Python and a dashboard for efficiently reporting the information after performing the analysis, the dashboard showing charts and graphs for representing the results of the predictive analysis. Das System nach Anspruch 3, wobei die Daten unter Verwendung von Sensoren wie MQ135, DHT11, MQ131, DHT22 gesammelt werden, wobei die Daten unter Verwendung von Arduino- und Raspberry-Pi-Mikrocontrollern gesammelt werden, die Daten in der Plattform unter Verwendung der Think-Speak-Plattform veröffentlicht werden, die Streaming-Plattform unter Verwendung der MQTT-Flink-Bridge integriert wird, Die Daten werden in der Plattform mit Hilfe der Think Speak-Plattform veröffentlicht, die Streaming-Plattform wird mit Hilfe der MQTT Flink Bridge integriert, wobei der Flink-Streaming-Konsument die Daten empfängt und sie dann mit Hilfe der Kafka-Integrationsschicht in das MongoDB-Datenbankprogramm veröffentlicht.The system after claim 3 , where the data is collected using sensors such as MQ135, DHT11, MQ131, DHT22, where the data is collected using Arduino and Raspberry Pi microcontrollers, which publishes data in the platform using the Think-Speak platform the streaming platform will be integrated using the MQTT Flink bridge, the data will be published in the platform using the Think Speak platform, the streaming platform will be integrated using the MQTT Flink bridge, the Flink streaming -Consumer receives the data and then publishes it to the MongoDB database program using the Kafka integration layer. System nach Anspruch 3, bei dem die Luftqualitätsdaten-Telemetrie auch von verschiedenen Sensorvorrichtungen unter Verwendung mehrerer Parameter gestreamt wird und diese Daten in Bezug auf den Zeitstempelwert kombiniert werden, und bei dem auch Wetterdaten kombiniert werden, um einen einzigen Datenstrom für jeden Zeitstempel zu erzeugen.system after claim 3 , where air quality data telemetry is also streamed from different sensor devices using multiple parameters and this data is combined with respect to the timestamp value, and also where weather data is combined to produce a single data stream for each timestamp. System nach Anspruch 1, bei dem ein auf Python basierendes Programm für die Datenexploration verwendet wird, bei dem die Daten gereinigt und vorverarbeitet werden, wobei unerwünschte und falsche Daten entfernt werden, fehlende Daten durch geeignete Werte ersetzt werden und nur erforderliche Merkmale für die Analyse extrahiert werden, woraufhin diese korrigierten und gereinigten Daten zur Analyse in die Cloud hochgeladen werden, wodurch durch diesen Prozess der Aggregation und Vorverarbeitung von Daten nur erforderliche Daten beibehalten werden, was zu einer Verringerung des für die Speicherung der Daten erforderlichen Speichers führt.system after claim 1 , which uses a Python-based program for data exploration, where the data is cleaned and pre-processed, removing unwanted and incorrect data, replacing missing data with appropriate values, and extracting only required features for analysis, after which these corrected and cleaned data is uploaded to the cloud for analysis, thus retaining only required data through this process of aggregating and pre-processing data, resulting in a reducing the memory required to store the data.
DE202022103462.1U 2022-06-22 2022-06-22 A system for streaming and storing heterogeneous sensor data streams using a microservices architecture model Active DE202022103462U1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE202022103462.1U DE202022103462U1 (en) 2022-06-22 2022-06-22 A system for streaming and storing heterogeneous sensor data streams using a microservices architecture model

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE202022103462.1U DE202022103462U1 (en) 2022-06-22 2022-06-22 A system for streaming and storing heterogeneous sensor data streams using a microservices architecture model

Publications (1)

Publication Number Publication Date
DE202022103462U1 true DE202022103462U1 (en) 2022-06-30

Family

ID=82493613

Family Applications (1)

Application Number Title Priority Date Filing Date
DE202022103462.1U Active DE202022103462U1 (en) 2022-06-22 2022-06-22 A system for streaming and storing heterogeneous sensor data streams using a microservices architecture model

Country Status (1)

Country Link
DE (1) DE202022103462U1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117061549A (en) * 2023-08-04 2023-11-14 江苏城乡建设职业学院 Intelligent security system based on cloud platform
CN117852774A (en) * 2024-03-05 2024-04-09 贵州交通建设集团有限公司 Mountain area canyon bridge long-term performance data acquisition method and system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117061549A (en) * 2023-08-04 2023-11-14 江苏城乡建设职业学院 Intelligent security system based on cloud platform
CN117852774A (en) * 2024-03-05 2024-04-09 贵州交通建设集团有限公司 Mountain area canyon bridge long-term performance data acquisition method and system
CN117852774B (en) * 2024-03-05 2024-05-14 贵州交通建设集团有限公司 Mountain area canyon bridge long-term performance data acquisition method and system

Similar Documents

Publication Publication Date Title
DE202022103462U1 (en) A system for streaming and storing heterogeneous sensor data streams using a microservices architecture model
EP1223709B1 (en) Method and apparatus for computer aided monitoring of a telecommunications network
DE112013003277B4 (en) Detect real-time anomalies in multiple time series data with automated thresholding
DE112020004623T5 (en) ML-BASED EVENT HANDLING
DE112017005957B4 (en) Information processing system and information processing method
DE102022201746A1 (en) MANAGE DATA CENTERS WITH MACHINE LEARNING
DE112007003612T5 (en) Alarm analysis system and method for alarm statistics from a process control system
DE60219821T2 (en) METHOD AND DEVICE FOR RECONSTRUCTING TIME TRIATS RELATED TO AN ACTIVITY
DE112016005266T5 (en) Fast pattern detection for log analysis
DE112021000370T5 (en) DATA MONITORING BASED ON MACHINE LEARNING
DE102011055657A1 (en) Method, system and computer program product for simulating a production automation system with service-oriented architecture
EP2414903A1 (en) Device and method for creating a process model
DE102022213606A1 (en) Method and device for anomaly detection of a doctor blade of a papermaking machine and computing device
DE112021001767T5 (en) STREAMLINE COMPUTING OPTIMIZATIONS FOR WORKLOADS WITH MACHINE LEARNING
DE112020004688T5 (en) DEBUGGING AND PROFILING MACHINE LEARNING MODEL TRAINING
WO2020126168A1 (en) Method for the cooperation of a plurality of devices of a local network
DE202022105121U1 (en) A real-time pomegranate disease management system for pomegranate disease detection, prediction and classification
DE202023105416U1 (en) An intelligent system for predicting solar radiation
DE202023101028U1 (en) A system for monitoring environmental changes from pollution and forecasting planting needs
DE10319887B4 (en) A method of aligning a database displayed on a client computing device with a source database stored on a server computing device
DE202022100596U1 (en) A system for real-time prediction of actions and identities of people in videos
DE102020132263A1 (en) Procedure for automatically determining a cause of an error
WO2023209029A1 (en) Computer-implemented method and system for the operation of a technical device using a model based on federated learning
DE102020005055A1 (en) Adaptation of data transmission from a control device to a cloud system using machine learning
DE202024102422U1 (en) Quantum machine learning and artificial intelligence-based system for improved image recognition

Legal Events

Date Code Title Description
R207 Utility model specification
R082 Change of representative

Representative=s name: LIPPERT STACHOW PATENTANWAELTE RECHTSANWAELTE , DE