WO2023275012A1 - Computer-implemented method for the efficient generation of a large volume of configuration data - Google Patents

Computer-implemented method for the efficient generation of a large volume of configuration data Download PDF

Info

Publication number
WO2023275012A1
WO2023275012A1 PCT/EP2022/067667 EP2022067667W WO2023275012A1 WO 2023275012 A1 WO2023275012 A1 WO 2023275012A1 EP 2022067667 W EP2022067667 W EP 2022067667W WO 2023275012 A1 WO2023275012 A1 WO 2023275012A1
Authority
WO
WIPO (PCT)
Prior art keywords
configuration data
data
relation
serialization
computer
Prior art date
Application number
PCT/EP2022/067667
Other languages
German (de)
French (fr)
Inventor
Christoph Schneider
Original Assignee
Christoph Schneider
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Christoph Schneider filed Critical Christoph Schneider
Priority to EP22741467.9A priority Critical patent/EP4363975A1/en
Publication of WO2023275012A1 publication Critical patent/WO2023275012A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/544Buffers; Shared memory; Pipes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems

Definitions

  • the present invention relates to a method for processing large amounts of data, so-called big data, using different computing architectures and arithmetic. Distributed and heterogeneous data sources can be used here.
  • the invention is also aimed at a correspondingly set up system arrangement.
  • a computer program product is proposed with control commands that implement the proposed method or operate the proposed device and arrangement.
  • EP 3764618 A1 shows a method for the efficient optimization of memory allocations, which makes it possible for resources present in a computer network to be used efficiently and for this the required bandwidth can be optimized.
  • the data it is possible according to the invention for the data to be anonymized during the outsourcing or implicitly encrypted by segmentation.
  • Proposed methods are very computationally intensive, which is a problem especially with extensive data sets.
  • processors typically have several computing cores, this often results in complex computing processes and there are also processor architectures which cannot process certain types of matrices efficiently enough for some application scenarios with the instruction sets provided.
  • the problem arises in particular if extensive matrices are provided which are also stored distributed in a network. This requires a large number of Buffer storage in order to be able to process the matrices efficiently in certain application scenarios.
  • certain computer architectures are not optimized for matrices.
  • instruction sets are fixed, ie hard-coded, and consequently it is not possible with such processors to generate dynamic calculation steps in such a way that they can be used depending on the configuration data.
  • a computer-implemented method for efficiently generating extensive configuration data based on heterogeneous data sources comprising reading out a stored matrix with configuration data and serializing the configuration data read out according to a first serialization metric; reading out at least one further stored matrix with configuration data and serializing the configuration data read out according to a second serialization metric; calculating a relation between the serialized configuration data; and creating new configuration data depending on the calculated relation.
  • a method for efficiently generating extensive configuration data is thus proposed, with the configuration data generally being stored according to any data type. There is therefore no general compatibility and it may be necessary to introduce further processing steps for this purpose.
  • data types are either converted or a relation between the serialized configuration data is calculated in such a way that only certain configuration data are related.
  • specific configuration data means that pairs of configuration data are compared which are of the same or a compatible data type. If there are more than two matrices, a comparison is not made in pairs, but configuration data from a number of matrices may also be related.
  • the stored matrices can each be converted into a vector, with the vector storing the configuration data of the matrix in serialized form. Will If two vectors or at least two vectors are now compared or related to one another, the entry within the vector can be compared with a further entry of a further vector, the corresponding index being taken into account in each case. If, for example, the configuration data is written in a first column and the configuration data of another matrix is written in a second column, the data can also be compared line by line. If there is no match in the second line to the entry in the first line, no relation is calculated. How the vectors or columns are to be calculated is stored in the serialization metric.
  • the serialization metric can determine for each matrix how to serialize it. For example, a matrix can be read out line by line and thus the individual entries can be written into a vector. Thus it is generally possible to transform the matrix from a two-dimensional table into a one-dimensional column.
  • the present invention also accounts for multi-dimensional arrays and the serialization metric for this specifies how these data entries are written into a vector. In general, it is also possible to convert a matrix into not only one vector, but to create several vectors. If necessary, these can also have redundant data records.
  • the matrices are typically read out over a network together with the stored configuration data.
  • the matrices are kept on a server, for example.
  • these are also typically heterogeneous data sources, with heterogeneous essentially referring to the data types and the underlying hardware. It is thus possible for the data sources to be provided according to different operating systems.
  • the processing steps can also be distributed in the network in such a way that first the data is read out on a first processing unit and then the configuration data is transmitted to a second processing unit, where it is then serialized, ie stored in series. In addition, however, it is advantageous that the serialization takes place on the computing unit on which the matrix is saved. It is also possible to send a serial data stream over the network.
  • serial data transmission it is advantageous to carry out a serial data transmission, since this can often be carried out more easily than the transmission of a matrix.
  • All network components typically support serial data streams and corresponding protocols provide appropriate security mechanisms.
  • a checksum can thus be calculated via the serial data stream and the serial data stream corresponds to the actual real-world data transmission in that an analog signal is typically transmitted, which is then digitized using threshold values which relate to an amplitude in the analog signal.
  • any number of matrices can be compared or related to one another. However, this requires at least two matrices. In this respect, a first matrix and at least one further matrix are proposed.
  • Calculating a relation between the serialized configuration data involves comparing according to predetermined method steps. In general, it is possible to compare the configuration data in such a way that, for example, it is output which configuration data has the largest amount. This configuration data can then be output. New configuration data is thus created by copying configuration data that has already been read out and serialized. This can also be done using a reference to the stored configuration data. In general, it is possible according to the invention to consider the larger value from two vectors, for example, as new configuration data. However, the first vector can also be compared to the second vector or to the at least second vector, and then the vector that satisfies a specific relation can be output.
  • the configuration data is in the form of alphanumeric data
  • other rules can be created that indicate how a relation is to be created.
  • terms can be linked using a taxonomy and the relation then describes a relation of the configuration data within the underlying data structure.
  • the relation can describe a prioritization of many terms and then the relation can be created or calculated in such a way that configuration data with the highest priority is output and a vector with new configuration data is thus created, which has precisely this configuration data with the highest priority.
  • the relation between two configuration data can be given by calculating a difference between the two data in the event that they are numeric.
  • the relation is, for example, the amount of a difference.
  • New configuration data can then be created in such a way that the difference itself forms the configuration data or that the configuration data are created as a function of the differences within a relation vector.
  • the matrices are each stored on different storage devices and transmitted using network technology. This has the advantage that there is a high level of failsafety when the matrices are provided, since they can be distributed over a network and, if necessary, stored redundantly.
  • the proposed method is independent of the fact that the large and extensive data sets can be stored on a device. The proposed method scales due to the distribution in the network.
  • the matrices have data records of different data types and a relation is always calculated between data records of the same data types. This has the advantage that heterogeneous data types can generally be used, with the proposed method checking whether a relation can be generated at all. Consequently, only those data sets or configuration data that are compatible with one another are used. If a vector is created that describes the relations, corresponding entries of incompatible configuration data can remain empty.
  • a conversion of data types is performed.
  • This has the advantage that further relations can be calculated even if the data type is not the same.
  • it is possible to save a numeric value as text or to save numeric values as data types with a different number of bits.
  • a floating point number can be stored as 32 bits or 64 bits.
  • it is ensured that as many relations as possible can be calculated, and in this context it is particularly advantageous for the data types to be converted for this purpose in such a way that they match as far as possible.
  • the configuration data is serialized into configuration vectors. This has the advantage that existing implementations can be reused and, in particular, storing within a vector is particularly efficient.
  • a serialization metric is provided for each matrix, which provides an indication of how data sets of the matrix are transformed. This has the advantage that for each matrix it is fixed at all times how it is read out and, for example, in which order the configuration data is written in series.
  • all serialization metrics provided produce comparable vectors. This has the advantage that as many relations as possible can be calculated. So can the vectors be made comparable in that, given a different dimension or number of entries in two vectors, the same length is created in such a way that the shorter vector is filled with filler data.
  • all serialized configuration data, all relations and/or all new configuration data are stored in the same database. This has the advantage that there is no delay over a network for the calculation-intensive processes, but rather this data is held locally and a shared buffer memory can be used.
  • the relation is generated iteratively for a respective selection of configuration data.
  • This has the advantage that the respective vectors or configuration data written in series are checked and, if a relation can be generated, a value from the configuration data from the first matrix and the second matrix is compared in pairs. If there are several matrices, the configuration data are compared according to the indexing. For example, in the case of three vectors, the first entry is compared with the other first entries. The second entry is compared with the further second entries of the other vectors. Figuratively speaking, a table can be compared line by line.
  • a data memory for providing calculation steps for calculating relations.
  • the calculation steps describe how a relation is to be generated. A distinction must be made between calculation steps that relate to numeric values or to alphanumeric values. In the case of numerical values, the calculation steps can describe an arithmetic, with alphanumeric configuration data being able to be prioritized. However, other calculation steps are also possible.
  • the creation of new configuration data includes applying the relation to configuration data, adopting existing configuration data and/or reading out further configuration data. This has the advantage that the new configuration data can either be selected from the existing configuration data or can be calculated from this configuration data. For example, a relation can provide information about which configuration data is to be used in the future.
  • the configuration data are used to control a terminal device. This has the advantage that the results of the proposed method can be fed back into a terminal and thus operating parameters of the terminal can be influenced by the configuration data.
  • the object is also achieved by a system arrangement for efficiently generating extensive configuration data based on heterogeneous data sources, having a first interface unit set up for reading out a stored matrix with configuration data and a serialization unit set up for serializing the configuration data read out according to a first serialization metric; at least one second interface unit set up to read out at least one further stored matrix with configuration data and a further serialization unit set up to serialize the configuration data read out according to a second serialization metric; a computing unit set up to calculate a relation between the serialized configuration data; and an output unit set up to create new configuration data depending on the calculated relation.
  • the object is also achieved by a computer program product with control commands that implement the proposed method or operate the proposed device.
  • the method can be used to operate the proposed devices and units.
  • the proposed devices and facilities are suitable for carrying out the method according to the invention.
  • the device implements structural features which are suitable for carrying out the corresponding method.
  • the structural features can also be designed as method steps.
  • the proposed method also provides steps for implementing the function of the structural features.
  • physical components can also be provided virtually or virtualized.
  • FIG. 1 shows a schematic block diagram of the system arrangement for efficiently generating extensive configuration data based on heterogeneous data sources according to an aspect of the present invention
  • FIG. 2 a serialization of the matrices into vectors to generate a further vector according to an aspect of the present invention
  • FIG. 3 a representation of the generated columns with serialized data records
  • Figure 4 a schematic flowchart of the computer-implemented
  • FIG. 1 shows a block diagram of the proposed system arrangement.
  • the processing of the first matrix is shown at the top of FIG. This is provided by the first device and has been drawn in here as a database DBO.
  • the provided matrix is then serialized via the component connected on the right.
  • the matrix is read out line by line, for example, and then converted into a vector, for example.
  • This also follows for at least a second matrix as shown below.
  • This second matrix is also provided by a database DB1 and transmitted to the component connected on the right, where all of the configuration data is serialized.
  • FIG. 1 at the bottom, it is shown that any number of matrices can be provided and serialized.
  • the configuration data written in series is then transmitted to a common component, which calculates a relation.
  • This component is also connected to a database, as is shown here, since the database holds corresponding calculation steps. Based on the output of this device, a new set of configuration data is created, which is done in the rightmost component.
  • FIG. 2 schematically shows the data used.
  • the raw data which are currently stored as matrices, are shown on the left-hand side. As can be seen in the middle, these matrices are serialized and written into a vector. A relation is now created and this relation is in turn stored in a vector. This is drawn on the right. Typically, the vector on the right contains as many entries as the longest vector in the middle. However, it is also possible that only those relations that could also be calculated are entered in the vector on the right-hand side.
  • FIG. 3 shows a vector V0 which was generated from a first matrix and which is now plotted as a column.
  • a column V1 is drawn in next to it, which has the configuration data of the further matrix.
  • the third column V2 indicates a relation between the configuration data.
  • a fourth column V3, which has the new configuration data is also possible.
  • a column is provided for each vector generated.
  • FIG. 4 shows a computer-implemented method for efficiently generating extensive configuration data based on heterogeneous data sources, comprising reading out 100 a stored matrix with configuration data and serializing 101 the configuration data read out according to a first serialization metric; reading out 102 at least one further stored matrix with configuration data and serializing 103 the configuration data read out according to a second serialization metric; calculating 104 a relation between the serialized configuration data; and creating 105 new configuration data depending on the calculated relation.
  • a data memory or a computer-readable medium with a computer program product having control commands that implement the proposed method or operate the proposed system arrangement.

Abstract

The invention relates to a method for processing large volumes of data, so-called big data, by means of different computing architectures and arithmetics. In said process, distributed and heterogeneous data sources can be used. The invention is also directed to a correspondingly set-up system arrangement. Also disclosed is a computer program product with control commands which implement the disclosed method and operate the disclosed device and arrangement.

Description

Computerimplementiertes Verfahren zum effizienten Erzeugen von umfangreichen Konfigurationsdaten Computer-implemented method for efficiently generating extensive configuration data
Die vorliegende Erfindung betrifft ein Verfahren zum Verarbeiten von großen Datenmengen, sogenanntem big data, mittels unterschiedlicher Rechenarchitekturen und Arithmetiken. Hierbei können verteilte und heterogene Datenquellen zum Einsatz kommen. Die Erfindung ist ferner gerichtet auf eine entsprechend eingerichtete Systemanordnung. Ferner wird ein Computerprogrammprodukt mit Steuerbefehlen vorgeschlagen, welche das vorgeschlagene Verfahren implementieren beziehungsweise die vorgeschlagene Vorrichtung und Anordnung betreiben. The present invention relates to a method for processing large amounts of data, so-called big data, using different computing architectures and arithmetic. Distributed and heterogeneous data sources can be used here. The invention is also aimed at a correspondingly set up system arrangement. Furthermore, a computer program product is proposed with control commands that implement the proposed method or operate the proposed device and arrangement.
EP 3764618 A1 zeigt ein Verfahren zur effizienten Optimierung von Speicherbelegungen, welches es ermöglicht, dass in einem Computernetzwerk vorhandene Ressourcen effizient genutzt werden können und hierbei die benötigte Bandbreite optimiert werden kann. Darüber hinaus ist es erfindungsgemäß ermöglicht, dass die Daten während des Auslagerns anonymisiert bzw. durch ein Segmentieren implizit verschlüsselt werden. EP 3764618 A1 shows a method for the efficient optimization of memory allocations, which makes it possible for resources present in a computer network to be used efficiently and for this the required bandwidth can be optimized. In addition, it is possible according to the invention for the data to be anonymized during the outsourcing or implicitly encrypted by segmentation.
Aus dem Stand der Technik sind unterschiedliche Verarbeitungstechniken bekannt, die es ermöglichen in umfangreichen Datensätzen, so genanntem big data, Strukturen zu erkennen und entsprechend die Daten zu verarbeiten. Eine Herausforderung hierbei sind unterschiedliche Datentypen in den Rohdaten und somit entstehen Probleme die Daten untereinander kompatibel zu gestalten bzw. zu verarbeiten. Various processing techniques are known from the prior art, which make it possible to recognize structures in extensive data sets, so-called big data, and to process the data accordingly. One challenge here is the different data types in the raw data, and this creates problems in making the data compatible with one another or processing it.
Vorgeschlagene Verfahren sind hierbei sehr rechenintensiv, was gerade bei umfangreichen Datensätzen ein Problem darstellt. Zwar weisen Prozessoren typischerweise mehrere Rechenkerne auf, hierbei entstehen jedoch oftmals aufwändige Rechenvorgänge und zudem gibt es Prozessorarchitekturen, welche bestimmte Arten von Matrizen nicht mit bereitgestellten Befehlssätzen für manche Anwendungsszenarien effizient genug abarbeiten können. Das Problem besteht insbesondere dann, falls umfangreiche Matrizen bereitgestellt werden, die zudem verteilt in einem Netzwerk abgelegt sind. Hierzu benötigt es eine Vielzahl von Pufferspeichern um in bestimmten Anwendungsszenarien die Matrizen effizient bearbeiten zu können. Zusammenfassend lässt sich also folgern, dass bestimmte Rechnerarchitekturen nicht für Matrizen optimiert sind. Proposed methods are very computationally intensive, which is a problem especially with extensive data sets. Although processors typically have several computing cores, this often results in complex computing processes and there are also processor architectures which cannot process certain types of matrices efficiently enough for some application scenarios with the instruction sets provided. The problem arises in particular if extensive matrices are provided which are also stored distributed in a network. This requires a large number of Buffer storage in order to be able to process the matrices efficiently in certain application scenarios. In summary, it can be concluded that certain computer architectures are not optimized for matrices.
Darüber hinaus sind in manchen Prozessortypen Befehlssätze festgeschrieben, also hart kodiert, und folglich ist es bei solchen Prozessoren nicht möglich dynamische Rechenschritte derart zu erzeugen, dass diese in Abhängigkeit der Konfigurationsdaten Anwendung finden können. Jedoch ist es wiederum nicht möglich optimierte Rechenschritte bereitzustellen, sondern vielmehr muss ein bestehender Befehlssatz verwendet werden, auch wenn dieser für bestimmte Eingangsdaten nicht optimiert ist. In addition, in some types of processors, instruction sets are fixed, ie hard-coded, and consequently it is not possible with such processors to generate dynamic calculation steps in such a way that they can be used depending on the configuration data. However, it is again not possible to provide optimized calculation steps, rather an existing command set must be used, even if it is not optimized for specific input data.
Ganz allgemein besteht zudem das Problem, dass bei umfangreichen Datensätzen, so genanntem big data, eine Bearbeitung oftmals fehlerintensiv ist und zu dem große Hardwarekapazitäten benötigt. Fehler können daher resultieren, dass eine bestimmte Gleitkommaarithmetik Fehler hervorruft oder aber, dass Datentypen miteinander nicht kompatibel sind. So ist es möglich, dass beispielsweise Nachkommastellen in einem ersten Datentyp mit weniger Bits berechnet werden als in einem zweiten Datentyp. Somit kommt es hierbei unweigerlich zu einem Fehler, der gegebenenfalls weitere Fehlberechnungen mit sich führt. In general, there is also the problem that in the case of extensive data sets, so-called big data, processing is often error-prone and, in addition, requires large hardware capacities. Errors can result from certain floating point arithmetic causing errors or from data types being incompatible with one another. It is thus possible, for example, for decimal places to be calculated using fewer bits in a first data type than in a second data type. This inevitably leads to an error, which may lead to further incorrect calculations.
Somit ist es eine Aufgabe der vorgeschlagenen Erfindung ein verbessertes Verfahren bereitzustellen, welches zum effizienten Erzeugen von umfangreichen Konfigurationsdaten geeignet ist und hierbei die genannten Probleme adressiert. Ferner ist es eine Aufgabe der vorliegenden Erfindung eine entsprechende Systemanordnung vorzuschlagen, welche gemäß dem Verfahren implementiert bzw. betrieben werden kann. Ferner soll ein Com puterprogramm produkt bereitgestellt werden, welches Steuerbefehle vorhält, welche das Verfahren implementieren beziehungsweise die vorgeschlagene Vorrichtung betreiben. It is therefore an object of the proposed invention to provide an improved method which is suitable for efficiently generating extensive configuration data and in doing so addresses the problems mentioned. Furthermore, it is an object of the present invention to propose a corresponding system arrangement which can be implemented or operated according to the method. Furthermore, a computer program product is to be provided which contains control commands which implement the method or operate the proposed device.
Die Aufgabe wird gelöst durch ein Verfahren mit den Merkmalen gemäß Patentanspruch 1 . Weitere vorteilhafte Ausgestaltungen sind in den Unteransprüchen angegeben. Demgemäß wird ein computerimplementiertes Verfahren zum effizienten Erzeugen von umfangreichen Konfigurationsdaten basierend auf heterogenen Datenquellen vorgeschlagen, aufweisend ein Auslesen einer abgespeicherten Matrix mit Konfigurationsdaten und Serialisieren der ausgelesenen Konfigurationsdaten gemäß einer ersten Serialisierungsmetrik; ein Auslesen mindestens einerweiteren abgespeicherten Matrix mit Konfigurationsdaten und Serialisieren der ausgelesenen Konfigurationsdaten gemäß einer zweiten Serialisierungsmetrik; ein Berechnen einer Relation zwischen den serialisierten Konfigurationsdaten; und ein Erstellen neuer Konfigurationsdaten in Abhängigkeit der berechneten Relation. The object is solved by a method with the features according to patent claim 1 . Further advantageous configurations are specified in the dependent claims. Accordingly, a computer-implemented method for efficiently generating extensive configuration data based on heterogeneous data sources is proposed, comprising reading out a stored matrix with configuration data and serializing the configuration data read out according to a first serialization metric; reading out at least one further stored matrix with configuration data and serializing the configuration data read out according to a second serialization metric; calculating a relation between the serialized configuration data; and creating new configuration data depending on the calculated relation.
Erfindungsgemäß wird somit ein Verfahren zum effizienten Erzeugen von umfangreichen Konfigurationsdaten vorgeschlagen, wobei die Konfigurationsdaten generell gemäß irgendeinem Datentyp abgespeichert sind. Somit ist nicht generell eine Kompatibilität gegeben und somit kann es notwendig sein, hierzu weitere Verarbeitungsschritte einzuführen. So ist es gemäß der vorliegenden Erfindung vorgesehen, dass Datentypen entweder konvertiert werden oder aber das Berechnen einer Relation zwischen den serialisierten Konfigurationsdaten erfolgt derart, dass nur bestimmte Konfigurationsdaten in Relation gesetzt werden. Bestimmte Konfigurationsdaten heißt hierbei, dass paarweise Konfigurationsdaten verglichen werden, welche von einem gleichen oder einem kompatiblen Datentyp sind. Liegen mehr als zwei Matrizen vor, so wird eben nicht paarweise verglichen, sondern es werden gegebenenfalls auch Konfigurationsdaten von mehreren Matrizen in Relation gesetzt. According to the invention, a method for efficiently generating extensive configuration data is thus proposed, with the configuration data generally being stored according to any data type. There is therefore no general compatibility and it may be necessary to introduce further processing steps for this purpose. According to the present invention, it is provided that data types are either converted or a relation between the serialized configuration data is calculated in such a way that only certain configuration data are related. In this context, specific configuration data means that pairs of configuration data are compared which are of the same or a compatible data type. If there are more than two matrices, a comparison is not made in pairs, but configuration data from a number of matrices may also be related.
Hierbei ist es generell auch möglich, eine Relation nicht zwischen allen Konfigurationsdaten zu erzeugen, sondern erst zu überprüfen, ob eine Relation dadurch erzeugt werden kann, dass kompatible Datentypen vorliegen. Trifft der Algorithmus beispielsweise auf Konfigurationsdaten aus einer ersten Matrix, welche keine Entsprechung in den Konfigurationsdaten aus der zweiten Matrix haben, so wird eben keine Relation erzeugt. Somit erfolgt ein Auswählen der Konfigurationsdaten zum Erzeugen einer Relation. It is generally also possible here not to create a relation between all configuration data, but first to check whether a relation can be created because compatible data types are present. For example, if the algorithm encounters configuration data from a first matrix that has no correspondence in the configuration data from the second matrix, then no relation is generated. Thus, the configuration data is selected for generating a relation.
Die abgespeicherten Matrizen können in jeweils einen Vektor übergeführt werden, wobei der Vektor serialisiert die Konfigurationsdaten der Matrix abspeichert. Werden nunmehr zwei Vektoren bzw. mindestens zwei Vektoren miteinander verglichen bzw. in Relation gesetzt, so kann jeweils der Eintrag innerhalb des Vektors mit einem weiteren Eintrag eines weiteren Vektors verglichen werden, wobei jeweils der entsprechende Index berücksichtigt wird. Werden die Konfigurationsdaten beispielsweise in einer ersten Spalte angeschrieben und die Konfigurationsdaten einerweiteren Matrix in einer zweiten Spalte angeschrieben, so können die Daten auch zeilenweise verglichen werden. Gibt es in der zweiten Zeile keine Entsprechung zu dem Eintrag aus der ersten Zeile, so wird keine Relation berechnet. Wie die Vektoren bzw. Spalten zu berechnen sind, ist in der Serialisierungsmetrik hinterlegt. The stored matrices can each be converted into a vector, with the vector storing the configuration data of the matrix in serialized form. Will If two vectors or at least two vectors are now compared or related to one another, the entry within the vector can be compared with a further entry of a further vector, the corresponding index being taken into account in each case. If, for example, the configuration data is written in a first column and the configuration data of another matrix is written in a second column, the data can also be compared line by line. If there is no match in the second line to the entry in the first line, no relation is calculated. How the vectors or columns are to be calculated is stored in the serialization metric.
Die Serialisierungsmetrik kann für jede Matrize bestimmen, wie diese zu serialisieren ist. Eine Matrix kann beispielsweise zeilenweise ausgelesen werden und somit die einzelnen Einträge in einen Vektor geschrieben werden. Somit ist es generell möglich, die Matrix von einer zweidimensionalen Tabelle in eine eindimensionale Spalte zu überführen. The serialization metric can determine for each matrix how to serialize it. For example, a matrix can be read out line by line and thus the individual entries can be written into a vector. Thus it is generally possible to transform the matrix from a two-dimensional table into a one-dimensional column.
Die vorliegende Erfindung berücksichtigt auch mehrdimensionale Matrizen und die Serialisierungsmetrik gibt hierzu an, wie diese Dateneinträge in einen Vektor geschrieben werden. Generell ist es auch möglich eine Matrix in nicht nur einen Vektor zu überführen, sondern eben mehrere Vektoren zu erzeugen. Diese können gegebenenfalls auch redundante Datensätze aufweisen. The present invention also accounts for multi-dimensional arrays and the serialization metric for this specifies how these data entries are written into a vector. In general, it is also possible to convert a matrix into not only one vector, but to create several vectors. If necessary, these can also have redundant data records.
Die Matrizen werden mitsamt der abgespeicherten Konfigurationsdaten typischerweise über ein Netzwerk ausgelesen. Hierzu werden die Matrizen beispielsweise auf einem Server vorgehalten. Insofern handelt es sich ebenfalls typischerweise um heterogene Datenquellen, wobei sich heterogen im Wesentlichen auf die Datentypen und die zugrunde liegende Hardware bezieht. So ist es möglich, dass die Datenquellen gemäß unterschiedlicher Betriebssysteme bereitgestellt werden. Die Verarbeitungsschritte können zudem im Netzwerk derart verteilt werden, dass zuerst ein Auslesen auf einer ersten Recheneinheit erfolgt und dann ein Übermitteln der Konfigurationsdaten auf eine zweite Recheneinheit erfolgt, wo diese dann serialisiert, d.h. in Serie abgespeichert, werden. Darüber hinaus ist es jedoch vorteilhaft, dass die Serialisierung auf der Recheneinheit erfolgt, auf der die Matrix abgespeichert ist. Ferner ist es möglich einen seriellen Datenstrom über das Netzwerk zu versenden. The matrices are typically read out over a network together with the stored configuration data. For this purpose, the matrices are kept on a server, for example. In this respect, these are also typically heterogeneous data sources, with heterogeneous essentially referring to the data types and the underlying hardware. It is thus possible for the data sources to be provided according to different operating systems. The processing steps can also be distributed in the network in such a way that first the data is read out on a first processing unit and then the configuration data is transmitted to a second processing unit, where it is then serialized, ie stored in series. In addition, however, it is advantageous that the serialization takes place on the computing unit on which the matrix is saved. It is also possible to send a serial data stream over the network.
In bestimmten Anwendungsszenarien ist es vorteilhaft eine serielle Datenübertragung durchzuführen, da dies oftmals gegenüber der Übermittlung einer Matrix einfacher durchgeführt werden kann. So unterstützen typischerweise alle Netzwerkkomponenten serielle Datenströme und entsprechende Protokolle sehen entsprechende Sicherungsmechanismen vor. So kann über den seriellen Datenstrom eine Prüfsumme berechnet werden und der serielle Datenstrom entspricht der tatsächlichen realweltlichen Datenübertragung insofern, als dass typischerweise ein analoges Signal übertragen wird, welches dann anhand von Schwellwerten, welche sich auf eine Amplitude in dem analogen Signal beziehen, digitalisiert werden. In certain application scenarios, it is advantageous to carry out a serial data transmission, since this can often be carried out more easily than the transmission of a matrix. All network components typically support serial data streams and corresponding protocols provide appropriate security mechanisms. A checksum can thus be calculated via the serial data stream and the serial data stream corresponds to the actual real-world data transmission in that an analog signal is typically transmitted, which is then digitized using threshold values which relate to an amplitude in the analog signal.
Generell können gemäß dem vorgeschlagenen Verfahren beliebig viele Matrizen miteinander verglichen bzw. in Relation gesetzt werden. Hierzu bedarf es aber mindestens zweier Matrizen. Insofern werden eine erste Matrix und mindestens eine weitere Matrix vorgeschlagen. In general, according to the proposed method, any number of matrices can be compared or related to one another. However, this requires at least two matrices. In this respect, a first matrix and at least one further matrix are proposed.
Bei einem Berechnen einer Relation zwischen den serialisierten Konfigurationsdaten handelt es sich um ein Vergleichen gemäß vorbestimmten Verfahrensschritten. Generell ist es möglich die Konfigurationsdaten derart zu vergleichen, dass beispielsweise ausgegeben wird, welche Konfigurationsdaten dem Betrag nach am größten sind. Diese Konfigurationsdaten können sodann ausgegeben werden. Somit erfolgt ein Erstellen neuer Konfigurationsdaten dadurch, dass bereits ausgelesene und serialisierte Konfigurationsdaten kopiert werden. Dies kann auch mittels einer Referenz auf die abgespeicherten Konfigurationsdaten erfolgen. Generell ist es erfindungsgemäß möglich aus beispielsweise zwei Vektoren jeweils den größeren Wert als neue Konfigurationsdaten anzusehen. Es kann jedoch auch der erste Vektor mit dem zweiten Vektor bzw. dem mindestens zweiten Vektor verglichen werden und sodann kann der Vektor ausgegeben werden, der eine bestimmte Relation erfüllt. Zusammenfassend lässt sich also folgern, dass in dem Fall, bei dem die Konfigurationsdaten numerisch sind anhand einer „größer“ Relation festgestellt werden kann welche neue Konfigurationsdaten erzeugt werden sollen. Hierzu können Daten aus beiden Vektoren vermischt werden und jeweils beispielsweise der größere Wert in einen neuen Vektor geschrieben werden. Es ist aber auch möglich, dass beispielsweise gezählt wird, welche Konfigurationsdaten am größten sind und es wird derjenige Vektor als neuer Vektor erstellt, der die meisten größeren Einträge aufweist. Calculating a relation between the serialized configuration data involves comparing according to predetermined method steps. In general, it is possible to compare the configuration data in such a way that, for example, it is output which configuration data has the largest amount. This configuration data can then be output. New configuration data is thus created by copying configuration data that has already been read out and serialized. This can also be done using a reference to the stored configuration data. In general, it is possible according to the invention to consider the larger value from two vectors, for example, as new configuration data. However, the first vector can also be compared to the second vector or to the at least second vector, and then the vector that satisfies a specific relation can be output. In summary, it can be concluded that in the case where the configuration data are numerical, it can be determined which new configuration data are to be generated using a “greater than” relation. For this data from both vectors can be mixed and, for example, the larger value can be written into a new vector. However, it is also possible, for example, to count which configuration data is the largest and that vector which has the most larger entries is created as the new vector.
Liegen die Konfigurationsdaten als alphanumerische Daten vor, so können dementsprechend andere Regeln erstellt werden, die angeben, wie eine Relation zu erstellen ist. So können beispielsweise anhand einer Taxonomie Begrifflichkeiten in Verbindung gesetzt werden und die Relation beschreibt sodann eine Relation der Konfigurationsdaten innerhalb der zugrunde liegenden Datenstruktur. So kann die Relation beispielsweise eine Priorisierung vieler Begriffe beschreiben und sodann kann die Relation derart erstellt werden bzw. berechnet werden, dass höchst priorisierte Konfigurationsdaten ausgegeben werden und somit wird ein Vektor mit neuen Konfigurationsdaten erstellt, der eben diese höchst priorisierte Konfigurationsdaten aufweist. Correspondingly, if the configuration data is in the form of alphanumeric data, other rules can be created that indicate how a relation is to be created. For example, terms can be linked using a taxonomy and the relation then describes a relation of the configuration data within the underlying data structure. For example, the relation can describe a prioritization of many terms and then the relation can be created or calculated in such a way that configuration data with the highest priority is output and a vector with new configuration data is thus created, which has precisely this configuration data with the highest priority.
In einem weiteren Beispiel ist es möglich, dass die Relation zwischen zwei Konfigurationsdaten dadurch gegeben wird, dass eine Differenz zwischen den beiden Daten berechnet wird, für den Fall dass diese numerisch sind. Die Relation ist also beispielsweise der Betrag einer Differenz. Neue Konfigurationsdaten können dann derart erstellt werden, dass die Differenz an sich die Konfigurationsdaten bildet oder aber, dass in Abhängigkeit der Differenzen innerhalb eines Relationsvektors die Konfigurationsdaten erstellt werden. In another example, it is possible for the relation between two configuration data to be given by calculating a difference between the two data in the event that they are numeric. The relation is, for example, the amount of a difference. New configuration data can then be created in such a way that the difference itself forms the configuration data or that the configuration data are created as a function of the differences within a relation vector.
Gemäß einem Aspekt der vorliegenden Erfindung werden die Matrizen jeweils auf unterschiedlichen Speichervorrichtungen abgespeichert und netzwerktechnisch übermittelt. Dies hat den Vorteil, dass bei der Bereitstellung der Matrizen eine hohe Ausfallsicherheit herrscht, da diese über ein Netzwerk verteilt werden können und gegebenenfalls redundant abgespeichert werden können. Zudem ist das vorgeschlagene Verfahren unabhängig davon, dass die großen und umfangreichen Datensätze auf einer Vorrichtung abspeicherbar sind. Aufgrund der Verteilung im Netzwerk skaliert das vorgeschlagene Verfahren. Gemäß einem weiteren Aspekt der vorliegenden Erfindung weisen die Matrizen Datensätze unterschiedlicher Datentypen auf und ein Berechnen einer Relation erfolgt stets zwischen Datensätzen gleicher Datentypen. Dies hat den Vorteil, dass heterogene Datentypen generell verwendet werden können, wobei das vorgeschlagene Verfahren überprüft, ob eine Relation überhaupt erzeugt werden kann. Folglich werden lediglich diejenigen Datensätze bzw. Konfigurationsdaten verwendet, welche miteinander kompatibel sind. Wird ein Vektor erzeugt, der die Relationen beschreibt, so können entsprechende Einträge von nicht kompatiblen Konfigurationsdaten leer bleiben. According to one aspect of the present invention, the matrices are each stored on different storage devices and transmitted using network technology. This has the advantage that there is a high level of failsafety when the matrices are provided, since they can be distributed over a network and, if necessary, stored redundantly. In addition, the proposed method is independent of the fact that the large and extensive data sets can be stored on a device. The proposed method scales due to the distribution in the network. According to a further aspect of the present invention, the matrices have data records of different data types and a relation is always calculated between data records of the same data types. This has the advantage that heterogeneous data types can generally be used, with the proposed method checking whether a relation can be generated at all. Consequently, only those data sets or configuration data that are compatible with one another are used. If a vector is created that describes the relations, corresponding entries of incompatible configuration data can remain empty.
Gemäß einem weiteren Aspekt der vorliegenden Erfindung wird ein Konvertieren von Datentypen durchgeführt. Dies hat den Vorteil, dass weitere Relationen berechnet werden können, auch wenn jeweils nicht der gleiche Datentyp vorliegt. So ist es beispielsweise möglich, einen numerischen Wert auch als Text abzuspeichern bzw. auch numerische Werte als Datentypen mit unterschiedlicher Bitanzahl abzuspeichern. So kann beispielsweise Gleitkommazahl als 32 Bit oder 64 Bit abgespeichert werden. Gemäß diesem Aspekt wird sichergestellt, dass möglichst viele Relationen berechnet werden können und in diesem Kontext ist es besonders vorteilhaft, dass die Datentypen hierzu derart konvertiert werden, dass diese nach Möglichkeit übereinstimmen. According to a further aspect of the present invention, a conversion of data types is performed. This has the advantage that further relations can be calculated even if the data type is not the same. For example, it is possible to save a numeric value as text or to save numeric values as data types with a different number of bits. For example, a floating point number can be stored as 32 bits or 64 bits. According to this aspect, it is ensured that as many relations as possible can be calculated, and in this context it is particularly advantageous for the data types to be converted for this purpose in such a way that they match as far as possible.
Gemäß einem weiteren Aspekt der vorliegenden Erfindung werden die Konfigurationsdaten in Konfigurationsvektoren serialisiert. Dies hat den Vorteil, dass bestehende Implementierungen wieder verwendet werden können und insbesondere ist das Abspeichern innerhalb eines Vektors besonders effizient. According to another aspect of the present invention, the configuration data is serialized into configuration vectors. This has the advantage that existing implementations can be reused and, in particular, storing within a vector is particularly efficient.
Gemäß einem weiteren Aspekt der vorliegenden Erfindung wird je Matrix eine Serialisierungsmetrik bereitgestellt, welche einen Hinweis darauf bereitstellt, wie Datensätze der Matrix transformiert werden. Dies hat den Vorteil, dass für jede Matrix zu jedem Zeitpunkt fest steht, wie diese ausgelesen wird und beispielsweise in welcher Reihenfolge die Konfigurationsdaten in Serie geschrieben werden. According to a further aspect of the present invention, a serialization metric is provided for each matrix, which provides an indication of how data sets of the matrix are transformed. This has the advantage that for each matrix it is fixed at all times how it is read out and, for example, in which order the configuration data is written in series.
Gemäß einem weiteren Aspekt der vorliegenden Erfindung erzeugen alle bereitgestellten Serialisierungsmetriken vergleichbare Vektoren. Dies hat den Vorteil, dass möglichst viele Relationen berechnet werden können. So können die Vektoren dadurch vergleichbar gemacht werden, dass bei einer unterschiedlichen Dimension bzw. Anzahl von Einträgen in zwei Vektoren derart eine gleiche Länge geschaffen wird, dass der kürzere Vektor mit Fülldaten aufgefüllt wird. In accordance with another aspect of the present invention, all serialization metrics provided produce comparable vectors. This has the advantage that as many relations as possible can be calculated. So can the vectors be made comparable in that, given a different dimension or number of entries in two vectors, the same length is created in such a way that the shorter vector is filled with filler data.
Gemäß einem weiteren Aspekt der vorliegenden Erfindung werden alle serialisierten Konfigurationsdaten, alle Relationen und oder alle neuen Konfigurationsdaten in der gleichen Datenbank abgespeichert. Dies hat den Vorteil, dass bei den rechenintensiven Vorgängen keine Verzögerung über ein Netzwerk erfolgt, sondern vielmehr werden diese Daten lokal vorgehalten und es kann ein gemeinsamer Pufferspeicher verwendet werden. According to a further aspect of the present invention, all serialized configuration data, all relations and/or all new configuration data are stored in the same database. This has the advantage that there is no delay over a network for the calculation-intensive processes, but rather this data is held locally and a shared buffer memory can be used.
Gemäß einem weiteren Aspekt der vorliegenden Erfindung wird die Relation iterativ für jeweils eine Auswahl an Konfigurationsdaten erzeugt. Dies hat den Vorteil, dass die jeweiligen Vektoren bzw. in Serie geschriebenen Konfigurationsdaten durchgeprüft werden und für den Fall, dass sich eine Relation erzeugen lässt, wird paarweise ein Wert aus den Konfigurationsdaten aus der ersten Matrix und der zweiten Matrix verglichen. Liegen mehrere Matrizen vor, so werden die Konfigurationsdaten entsprechend der Indizierung verglichen. Beispielsweise wird bei drei Vektoren der erste Eintrag mit den weiteren ersten Einträgen verglichen. Der zweite Eintrag wird mit den weiteren zweiten Einträgen der anderen Vektoren verglichen. Bildlich gesprochen kann also bei einer Tabelle ein zeilenweises Vergleichen erfolgen. According to a further aspect of the present invention, the relation is generated iteratively for a respective selection of configuration data. This has the advantage that the respective vectors or configuration data written in series are checked and, if a relation can be generated, a value from the configuration data from the first matrix and the second matrix is compared in pairs. If there are several matrices, the configuration data are compared according to the indexing. For example, in the case of three vectors, the first entry is compared with the other first entries. The second entry is compared with the further second entries of the other vectors. Figuratively speaking, a table can be compared line by line.
Gemäß einem weiteren Aspekt der vorliegenden Erfindung wird ein Datenspeicher zur Bereitstellung von Rechenschritten zur Berechnung von Relationen bereitgestellt. Dies hat den Vorteil, dass die Relationen in diesem Datenspeicher vorbestimmt werden können und jederzeit angepasst werden können. Die Rechenschritte beschreiben, wie eine Relation erzeugt werden soll. Hierbei sind Berechnungsschritte zu unterscheiden, welche sich auf numerische Werte beziehen oder aber auf alphanumerische Werte. Bei numerischen Werten können die Rechenschritte eine Arithmetik beschreiben, wobei bei alphanumerischen Konfigurationsdaten eine Priorisierung erfolgen kann. Es sind jedoch auch andere Rechenschritte möglich. Gemäß einem weiteren Aspekt der vorliegenden Erfindung umfasst das Erstellen neuer Konfigurationsdaten ein Anwenden der Relation auf Konfigurationsdaten, ein Übernehmen von bestehenden Konfigurationsdaten und/oder ein Auslesen weiterer Konfigurationsdaten. Dies hat den Vorteil, dass die neuen Konfigurationsdaten entweder aus den bestehenden Konfigurationsdaten ausgewählt werden können oder aber aus diesen Konfigurationsdaten berechnet werden können. So kann beispielsweise eine Relation darüber Aufschluss geben, welche Konfigurationsdaten im Weiteren zu verwenden sind. According to a further aspect of the present invention, a data memory is provided for providing calculation steps for calculating relations. This has the advantage that the relations in this data store can be predetermined and adjusted at any time. The calculation steps describe how a relation is to be generated. A distinction must be made between calculation steps that relate to numeric values or to alphanumeric values. In the case of numerical values, the calculation steps can describe an arithmetic, with alphanumeric configuration data being able to be prioritized. However, other calculation steps are also possible. According to a further aspect of the present invention, the creation of new configuration data includes applying the relation to configuration data, adopting existing configuration data and/or reading out further configuration data. This has the advantage that the new configuration data can either be selected from the existing configuration data or can be calculated from this configuration data. For example, a relation can provide information about which configuration data is to be used in the future.
Gemäß einem weiteren Aspekt der vorliegenden Erfindung werden die Konfigurationsdaten zum Ansteuern eines Endgeräts verwendet. Dies hat den Vorteil, dass die Ergebnisse des vorgeschlagenen Verfahrens in ein Endgerät rückgekoppelt werden können und somit können Betriebsparameter des Endgeräts durch die Konfigurationsdaten beeinflusst werden. According to a further aspect of the present invention, the configuration data are used to control a terminal device. This has the advantage that the results of the proposed method can be fed back into a terminal and thus operating parameters of the terminal can be influenced by the configuration data.
Die Aufgabe wird auch gelöst durch eine Systemanordnung zum effizienten Erzeugen von umfangreichen Konfigurationsdaten basierend auf heterogenen Datenquellen, aufweisend eine erste Schnittstelleneinheit eingerichtet zum Auslesen einer abgespeicherten Matrix mit Konfigurationsdaten und eine Serialisierungseinheit eingerichtet zum Serialisieren der ausgelesenen Konfigurationsdaten gemäß einer ersten Serialisierungsmetrik; mindestens eine zweite Schnittstelleneinheit eingerichtet zum Auslesen mindestens einerweiteren abgespeicherten Matrix mit Konfigurationsdaten und eine weitere Serialisierungseinheit eingerichtet zum Serialisieren der ausgelesenen Konfigurationsdaten gemäß einer zweiten Serialisierungsmetrik; einer Recheneinheit eingerichtet zum Berechnen einer Relation zwischen den serialisierten Konfigurationsdaten; und eine Ausgabeeinheit eingerichtet zum Erstellen neuer Konfigurationsdaten in Abhängigkeit der berechneten Relation. The object is also achieved by a system arrangement for efficiently generating extensive configuration data based on heterogeneous data sources, having a first interface unit set up for reading out a stored matrix with configuration data and a serialization unit set up for serializing the configuration data read out according to a first serialization metric; at least one second interface unit set up to read out at least one further stored matrix with configuration data and a further serialization unit set up to serialize the configuration data read out according to a second serialization metric; a computing unit set up to calculate a relation between the serialized configuration data; and an output unit set up to create new configuration data depending on the calculated relation.
Die Aufgabe wird auch gelöst durch ein Computerprogrammprodukt mit Steuerbefehlen, welche das vorgeschlagene Verfahren implementieren beziehungsweise die vorgeschlagene Vorrichtung betreiben. Erfindungsgemäß ist es besonders vorteilhaft, dass das Verfahren zum Betreiben der vorgeschlagenen Vorrichtungen und Einheiten verwendet werden kann. Ferner eignen sich die vorgeschlagenen Vorrichtungen und Einrichtungen zur Ausführung des erfindungsgemäßen Verfahrens. Somit implementiert jeweils die Vorrichtung strukturelle Merkmale, welche geeignet sind, das entsprechende Verfahren auszuführen. Die strukturellen Merkmale können jedoch auch als Verfahrensschritte ausgestaltet werden. Auch hält das vorgeschlagene Verfahren Schritte zu Umsetzung der Funktion der strukturellen Merkmale bereit. Darüber hinaus können physische Komponenten gleicherweise auch virtuell bzw. virtualisiert bereitgestellt werden. The object is also achieved by a computer program product with control commands that implement the proposed method or operate the proposed device. According to the invention, it is particularly advantageous that the method can be used to operate the proposed devices and units. Furthermore, the proposed devices and facilities are suitable for carrying out the method according to the invention. Thus, in each case the device implements structural features which are suitable for carrying out the corresponding method. However, the structural features can also be designed as method steps. The proposed method also provides steps for implementing the function of the structural features. In addition, physical components can also be provided virtually or virtualized.
Weitere Vorteile, Merkmale und Einzelheiten der Erfindung ergeben sich aus der nachfolgenden Beschreibung, in der unter Bezugnahme auf die Zeichnungen Aspekte der Erfindung im Einzelnen beschrieben sind. Dabei können die in den Ansprüchen und in der Beschreibung erwähnten Merkmale jeweils einzeln für sich oder in beliebiger Kombination erfindungswesentlich sein. Ebenso können die vorstehend genannten und die hier weiter ausgeführten Merkmale je für sich oder zu mehreren in beliebigen Kombinationen Verwendung finden. Funktionsähnliche oder identische Bauteile oder Komponenten sind teilweise mit gleichen Bezugszeichen versehen. Die in der Beschreibung der Ausführungsbeispiele verwendeten Begriffe „links“, „rechts“, „oben“ und „unten“ beziehen sich auf die Zeichnungen in einer Ausrichtung mit normal lesbarer Figurenbezeichnung bzw. normal lesbaren Bezugszeichen. Die gezeigten und beschriebenen Ausführungsformen sind nicht als abschließend zu verstehen, sondern haben beispielhaften Charakter zur Erläuterung der Erfindung. Die detaillierte Beschreibung dient der Information des Fachmanns, daher werden bei der Beschreibung bekannte Schaltungen, Strukturen und Verfahren nicht im Detail gezeigt oder erläutert, um das Verständnis der vorliegenden Beschreibung nicht zu erschweren. In den Figuren zeigen: Further advantages, features and details of the invention result from the following description, in which aspects of the invention are described in detail with reference to the drawings. The features mentioned in the claims and in the description can each be essential to the invention individually or in any combination. Likewise, the features mentioned above and those further explained here can each be used individually or together in any combination. Parts or components that are functionally similar or identical are sometimes provided with the same reference symbols. The terms “left”, “right”, “above” and “below” used in the description of the exemplary embodiments refer to the drawings in an orientation with a normally legible figure designation or normally legible reference symbols. The embodiments shown and described are not to be understood as final, but have an exemplary character to explain the invention. The detailed description is provided for the convenience of those skilled in the art, and therefore well-known circuits, structures, and methods are not shown or discussed in detail in the description so as not to obscure the understanding of the present description. In the figures show:
Figur 1 : ein schematisches Blockschaltbild der Systemanordnung zum effizienten Erzeugen von umfangreichen Konfigurationsdaten basierend auf heterogenen Datenquellen gemäß einem Aspekt der vorliegenden Erfindung; Figur 2: ein Serialisieren der Matrizen in Vektoren zur Erzeugung eines weiteren Vektors gemäß einem Aspekt der vorliegenden Erfindung; FIG. 1 shows a schematic block diagram of the system arrangement for efficiently generating extensive configuration data based on heterogeneous data sources according to an aspect of the present invention; FIG. 2: a serialization of the matrices into vectors to generate a further vector according to an aspect of the present invention;
Figur 3: eine Darstellung der erzeugten Spalten mit serialisierten Datensätzen; und FIG. 3: a representation of the generated columns with serialized data records; and
Figur 4: ein schematisches Ablaufdiagramm des computerimplementiertenFigure 4: a schematic flowchart of the computer-implemented
Verfahrens zum effizienten Erzeugen von umfangreichen Konfigurationsdaten basierend auf heterogenen Datenquellen. Procedure for efficiently generating extensive configuration data based on heterogeneous data sources.
Figur 1 zeigt ein Blockschaltbild der vorgeschlagenen Systemanordnung. Oben in der Figur 1 ist die Verarbeitung der ersten Matrix gezeigt. Diese wird durch die erste Vorrichtung bereitgestellt und wurde vorliegend als eine Datenbank DBO eingezeichnet. Daraufhin wird die bereitgestellte Matrix über die rechts angeschlossene Komponente serialisiert. In dieser Komponente wird die Matrix beispielsweise zeilenweise ausgelesen und sodann beispielsweise in einen Vektor überführt. Dies folgt ebenso für mindestens eine zweite Matrix, wie dies darunter gezeigt ist. Auch diese zweite Matrix wird durch eine Datenbank DB1 bereitgestellt und an die rechts angeschlossene Komponente übermittelt und dort wird die Gesamtheit der Konfigurationsdaten serialisiert. In der vorliegenden Figur 1 ganz unten ist eingezeichnet, dass beliebig viele Matrizen bereitgestellt und serialisiert werden können. FIG. 1 shows a block diagram of the proposed system arrangement. The processing of the first matrix is shown at the top of FIG. This is provided by the first device and has been drawn in here as a database DBO. The provided matrix is then serialized via the component connected on the right. In this component, the matrix is read out line by line, for example, and then converted into a vector, for example. This also follows for at least a second matrix as shown below. This second matrix is also provided by a database DB1 and transmitted to the component connected on the right, where all of the configuration data is serialized. In the present FIG. 1, at the bottom, it is shown that any number of matrices can be provided and serialized.
Die in Serie geschriebenen Konfigurationsdaten werden sodann an eine gemeinsame Komponente übermittelt, die eine Relation berechnet. Auch diese Komponente ist an eine Datenbank angeschlossen, wie vorliegend gezeigt ist, da die Datenbank entsprechende Rechenschritte vorhält. Aufgrund der Ausgabe dieser Vorrichtung wird ein neuer Satz Konfigurationsdaten erstellt, was in der Komponente ganz rechts erfolgt. The configuration data written in series is then transmitted to a common component, which calculates a relation. This component is also connected to a database, as is shown here, since the database holds corresponding calculation steps. Based on the output of this device, a new set of configuration data is created, which is done in the rightmost component.
Vorliegend wird ein computerimplementiertes Verfahren vorgeschlagen, wobei es dem auch nicht entgegensteht wenn einzelne Schritte manuell ausgeführt werden. Die Konfigurationsdaten können auch angeben, wie beispielsweise ein Ausgabegerät wie ein Drucker oder ein Display angesprochen wird. Figur 2 zeigt schematisch die verwendeten Daten. Auf der linken Seite sind jeweils die Rohdaten eingezeichnet, welche vorliegend als Matrizen abgespeichert sind. Wie in der Mitte zu sehen ist, werden diese Matrizen serialisiert, und in einen Vektor geschrieben. Nunmehr wird eine Relation erzeugt und diese Relation wird wiederum in einem Vektor abgespeichert. Dies ist auf der rechten Seite eingezeichnet. Typischerweise enthält der Vektor auf der rechten Seite so viele Einträge wie der längste Vektor in der Mitte. Es ist jedoch auch möglich, dass in dem Vektor auf der rechten Seite nur diejenigen Relationen eingetragen werden, die auch berechnet werden konnten. Ist auch nach einer Konvertierung der jeweilige Datentyp nicht kompatibel zu einem zu vergleichenden Datentyp, so kann keine Relation erzeugt werden und es wird an entsprechender Stelle in dem rechten Vektor entweder ein Fehlercode eingetragen oder aber es wird für diese nicht mögliche Relation einfach der Datensatz ausgelassen. Somit kann auch der Vektor auf der rechten Seite kürzer sein als die Vektoren in der Mitte. In the present case, a computer-implemented method is proposed, although this does not prevent individual steps from being carried out manually. The configuration data can also indicate how, for example, an output device such as a printer or a display is addressed. FIG. 2 schematically shows the data used. The raw data, which are currently stored as matrices, are shown on the left-hand side. As can be seen in the middle, these matrices are serialized and written into a vector. A relation is now created and this relation is in turn stored in a vector. This is drawn on the right. Typically, the vector on the right contains as many entries as the longest vector in the middle. However, it is also possible that only those relations that could also be calculated are entered in the vector on the right-hand side. If, after a conversion, the respective data type is not compatible with a data type to be compared, no relation can be created and either an error code is entered at the appropriate point in the right vector or the data record is simply omitted for this impossible relation. This means that the vector on the right-hand side can also be shorter than the vectors in the middle.
Figur 3 zeigt auf der linken Seite einen Vektor V0, welcher aus einer ersten Matrix erzeugt wurde, welcher nunmehr als eine Spalte angetragen ist. Daneben ist eine Spalte V1 eingezeichnet, die die Konfigurationsdaten der weiteren Matrix aufweist. Die dritte Spalte V2 zeigt eine Relation zwischen den Konfigurationsdaten an. Generell ist es auch möglich eine vierte Spalte V3 vorzusehen, die die neuen Konfigurationsdaten aufweist. Folglich wird für jeden erzeugten Vektor in dem vorliegenden Beispiel eine Spalte vorgesehen. On the left-hand side, FIG. 3 shows a vector V0 which was generated from a first matrix and which is now plotted as a column. A column V1 is drawn in next to it, which has the configuration data of the further matrix. The third column V2 indicates a relation between the configuration data. In general, it is also possible to provide a fourth column V3, which has the new configuration data. Thus, in the present example, a column is provided for each vector generated.
Figur 4 zeigt ein Computerimplementiertes Verfahren zum effizienten Erzeugen von umfangreichen Konfigurationsdaten basierend auf heterogenen Datenquellen, aufweisend ein Auslesen 100 einer abgespeicherten Matrix mit Konfigurationsdaten und Serialisieren 101 der ausgelesenen Konfigurationsdaten gemäß einer ersten Serialisierungsmetrik; ein Auslesen 102 mindestens einerweiteren abgespeicherten Matrix mit Konfigurationsdaten und Serialisieren 103 der ausgelesenen Konfigurationsdaten gemäß einer zweiten Serialisierungsmetrik; ein Berechnen 104 einer Relation zwischen den serialisierten Konfigurationsdaten; und ein Erstellen 105 neuer Konfigurationsdaten in Abhängigkeit der berechneten Relation. Vorliegend nicht gezeigt ist ein Datenspeicher oder ein computerlesbares Medium mit einem Computerprogrammprodukt aufweisend Steuerbefehle, welche das vorgeschlagene Verfahren implementieren bzw. die vorgeschlagene Systemanordnung betreiben. FIG. 4 shows a computer-implemented method for efficiently generating extensive configuration data based on heterogeneous data sources, comprising reading out 100 a stored matrix with configuration data and serializing 101 the configuration data read out according to a first serialization metric; reading out 102 at least one further stored matrix with configuration data and serializing 103 the configuration data read out according to a second serialization metric; calculating 104 a relation between the serialized configuration data; and creating 105 new configuration data depending on the calculated relation. Not shown here is a data memory or a computer-readable medium with a computer program product having control commands that implement the proposed method or operate the proposed system arrangement.

Claims

Patentansprüche patent claims
1. Computerimplementiertes Verfahren zum effizienten Erzeugen von umfangreichen Konfigurationsdaten basierend auf heterogenen Datenquellen, aufweisend: 1. A computer-implemented method for efficiently generating large-scale configuration data based on heterogeneous data sources, comprising:
- ein Auslesen (100) einer abgespeicherten zweidimensionalen Matrix mit Konfigurationsdaten und Serialisieren (101) der ausgelesenen Konfigurationsdaten gemäß einer ersten Serialisierungsmetrik; - Reading out (100) a stored two-dimensional matrix with configuration data and serializing (101) the read out configuration data according to a first serialization metric;
- ein Auslesen (102) mindestens einerweiteren abgespeicherten zweidimensionalen Matrix mit Konfigurationsdaten und Serialisieren (103) der ausgelesenen Konfigurationsdaten gemäß einer zweiten Serialisierungsmetrik; - reading out (102) at least one further stored two-dimensional matrix with configuration data and serializing (103) the configuration data read out according to a second serialization metric;
- ein Berechnen (104) einer Relation zwischen den serialisierten Konfigurationsdaten; und - calculating (104) a relation between the serialized configuration data; and
- ein Erstellen (105) neuer Konfigurationsdaten in Abhängigkeit der berechneten Relation, was ein Auslesen weiterer Konfigurationsdaten umfasst. - creating (105) new configuration data as a function of the calculated relation, which includes reading out further configuration data.
2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass die Matrizen jeweils auf unterschiedlichen Speichervorrichtungen abgespeichert sind und netzwerktechnisch übermittelt werden. 2. The method according to claim 1, characterized in that the matrices are each stored on different storage devices and are transmitted via network technology.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die Matrizen Konfigurationsdaten unterschiedlicher Datentypen aufweisen und ein Berechnen (104) einer Relation stets zwischen Konfigurationsdaten gleicher Datentypen erfolgt. 3. The method according to claim 1 or 2, characterized in that the matrices have configuration data of different data types and a calculation (104) of a relation always takes place between configuration data of the same data types.
4. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass ein Konvertieren von Datentypen durchgeführt wird. 4. The method according to any one of the preceding claims, characterized in that a conversion of data types is carried out.
5. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Konfigurationsdaten in Konfigurationsvektoren serialisiert werden. 5. The method according to any one of the preceding claims, characterized in that the configuration data are serialized in configuration vectors.
6. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass je Matrix eine Serialisierungsmetrik bereitgestellt wird, welche einen Hinweis darauf bereitstellt, wie Datensätze der Matrix ausgelesen und in welcher Reihenfolge die Konfigurationsdaten in Serie geschrieben werden. 6. The method according to any one of the preceding claims, characterized in that a serialization metric is provided for each matrix, which provides an indication of how data records of the matrix are read out and in which order the configuration data are written in series.
7. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass alle bereitgestellten Serialisierungsmetriken vergleichbare Vektoren gleicher Länge erzeugen, derart, dass der kürzere Vektor mit Fülldaten aufgefüllt wird. 7. The method according to any one of the preceding claims, characterized in that all serialization metrics provided generate comparable vectors of the same length, such that the shorter vector is filled with padding data.
8. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass alle serialisierten Konfigurationsdaten, alle Relationen und/ oder alle neuen Konfigurationsdaten in der gleichen Datenbank abgespeichert werden. 8. Method according to one of the preceding claims, characterized in that all serialized configuration data, all relations and/or all new configuration data are stored in the same database.
9. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Relation iterativ für jeweils eine Auswahl an Konfigurationsdaten erzeugt wird. 9. The method according to any one of the preceding claims, characterized in that the relation is generated iteratively for a selection of configuration data.
10. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass ein Datenspeicher mit Rechenschritten zur Berechnung von Relationen bereitgestellt wird. 10. The method according to any one of the preceding claims, characterized in that a data memory with computing steps for calculating relations is provided.
11. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Erstellen (105) neuer Konfigurationsdaten ein Anwenden der Relation auf Konfigurationsdaten und / oder ein Übernehmen von bestehenden Konfigurationsdaten umfasst. 11. The method according to any one of the preceding claims, characterized in that the creation (105) of new configuration data includes applying the relation to configuration data and/or adopting existing configuration data.
12. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Konfigurationsdaten zum Ansteuern eines Endgeräts verwendet werden. 12. The method according to any one of the preceding claims, characterized in that the configuration data are used to control a terminal device.
13. Systemanordnung zum effizienten Erzeugen von umfangreichen Konfigurationsdaten basierend auf heterogenen Datenquellen, aufweisend: - eine erste Schnittstelleneinheit eingerichtet zum Auslesen (100) einer abgespeicherten zweidimensionalen Matrix mit Konfigurationsdaten und eine Serialisierungseinheit eingerichtet zum Serialisieren (101) der ausgelesenen Konfigurationsdaten gemäß einer ersten Serialisierungsmetrik; 13. System arrangement for the efficient generation of extensive configuration data based on heterogeneous data sources, comprising: - a first interface unit set up for reading (100) a stored two-dimensional matrix with configuration data and a Serialization unit set up for serializing (101) the read out configuration data according to a first serialization metric;
- mindestens eine zweite Schnittstelleneinheit eingerichtet zum Auslesen (102) mindestens einerweiteren abgespeicherten zweidimensionalen Matrix mit Konfigurationsdaten und eine weitere Serialisierungseinheit eingerichtet zum Serialisieren (103) der ausgelesenen Konfigurationsdaten gemäß einer zweiten Serialisierungsmetrik; - at least one second interface unit set up for reading (102) at least one further stored two-dimensional matrix with configuration data and a further serialization unit set up for serializing (103) the configuration data read out according to a second serialization metric;
- einer Recheneinheit eingerichtet zum Berechnen (104) einer Relation zwischen den serialisierten Konfigurationsdaten; und - A computing unit set up to calculate (104) a relation between the serialized configuration data; and
- eine Ausgabeeinheit eingerichtet zum Erstellen (105) neuer Konfigurationsdaten in Abhängigkeit der berechneten Relation, was ein Auslesen weiterer Konfigurationsdaten umfasst - An output unit set up for creating (105) new configuration data depending on the calculated relation, which includes reading out further configuration data
14. Computerprogrammprodukt, umfassend Befehle, die bei der Ausführung des Programms durch einen Computer diesen veranlassen, die Schritte des Verfahrens nach einem der Ansprüche 1 bis 12 auszuführen. 14. A computer program product comprising instructions which, when the program is executed by a computer, cause the latter to carry out the steps of the method according to any one of claims 1 to 12.
15. Computerlesbares Speichermedium, umfassend Befehle, die bei der Ausführung durch einen Computer diesen veranlassen, die Schritte des Verfahrens nach einem der Ansprüche 1 bis 12 auszuführen. A computer-readable storage medium comprising instructions which, when executed by a computer, cause the computer to perform the steps of the method of any one of claims 1 to 12.
PCT/EP2022/067667 2021-07-02 2022-06-28 Computer-implemented method for the efficient generation of a large volume of configuration data WO2023275012A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EP22741467.9A EP4363975A1 (en) 2021-07-02 2022-06-28 Computer-implemented method for the efficient generation of a large volume of configuration data

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP21020342.8 2021-07-02
EP21020342.8A EP4113303A1 (en) 2021-07-02 2021-07-02 Computer-implemented method for efficiently generating extensive configuration data

Publications (1)

Publication Number Publication Date
WO2023275012A1 true WO2023275012A1 (en) 2023-01-05

Family

ID=76764789

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2022/067667 WO2023275012A1 (en) 2021-07-02 2022-06-28 Computer-implemented method for the efficient generation of a large volume of configuration data

Country Status (2)

Country Link
EP (2) EP4113303A1 (en)
WO (1) WO2023275012A1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8566279B1 (en) * 2010-11-02 2013-10-22 Sprint Communications Company L.P. Enhanced data collection techniques
US20190095494A1 (en) * 2017-09-25 2019-03-28 Splunk Inc. Multi-partitioning determination for combination operations
EP3764618A1 (en) 2019-07-09 2021-01-13 Christoph Schneider Method for efficient optimisation of storage occupancy

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8566279B1 (en) * 2010-11-02 2013-10-22 Sprint Communications Company L.P. Enhanced data collection techniques
US20190095494A1 (en) * 2017-09-25 2019-03-28 Splunk Inc. Multi-partitioning determination for combination operations
EP3764618A1 (en) 2019-07-09 2021-01-13 Christoph Schneider Method for efficient optimisation of storage occupancy

Also Published As

Publication number Publication date
EP4363975A1 (en) 2024-05-08
EP4113303A1 (en) 2023-01-04

Similar Documents

Publication Publication Date Title
DE102007062986B4 (en) Method and device for client-server communication according to the standard protocol OPC UA
DE112016007220T5 (en) Ladder program processing support device and ladder program processing method
DE2132565C3 (en) Converter
DE19814422A1 (en) Process for obtaining solution to a constraint problem
DE112012006178T5 (en) parameter setting
EP3076633A1 (en) Method for configuring a web service gateway and web service gateway
DE102011107646A1 (en) Method and system for the dynamic distribution of program functions in distributed control systems
EP4363975A1 (en) Computer-implemented method for the efficient generation of a large volume of configuration data
DE102013202376A1 (en) Systems and methods for generating high quality formal software executable requirements
EP3499324A1 (en) Method of modular verification of a configuration of a device
EP2601594A1 (en) Method and apparatus for automatically processing data in a cell format
DE102009053753A1 (en) Method for determining cause of error at car, involves selecting procedure for determining cause of error by diagnosis device, and providing output by diagnosis device according to selected procedure
DE102021130117A1 (en) DIAGNOSTIC PATTERN GENERATION PROCEDURES AND COMPUTERS
DE102020202723A1 (en) Automatic code generation method and computer readable storage medium storing an automatic code generation program
DE102017007022A1 (en) Programmable control device
DE102018105847A1 (en) Data recovery and data regeneration using parity code
WO2012069271A1 (en) Checking method for the integrity of a source text
DE102019131639B4 (en) System for providing an explanation data set for an AI module
EP3575976A1 (en) Method for determining a physical connection topology of a real-time-capable test device gene set up for control apparatus development
EP1173799B1 (en) Method and device for developing a technical system
EP4092541A1 (en) Protection and verification of data elements in a distributed computer network
EP2267562A1 (en) Method and device for testing files in XML format to be exchanged between components
DE2135607C2 (en) Circuit arrangement for incrementing or decrementing
DE102021120596A1 (en) Method for transferring at least one parameter value of a first simulation model to a second simulation model during a simulation
DE102004023634B4 (en) Method for checking the completeness and consistency of an information library

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22741467

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2022741467

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2022741467

Country of ref document: EP

Effective date: 20240202