WO2022167345A1 - Ermittlung einer bewertung eines datensatzes - Google Patents

Ermittlung einer bewertung eines datensatzes Download PDF

Info

Publication number
WO2022167345A1
WO2022167345A1 PCT/EP2022/052121 EP2022052121W WO2022167345A1 WO 2022167345 A1 WO2022167345 A1 WO 2022167345A1 EP 2022052121 W EP2022052121 W EP 2022052121W WO 2022167345 A1 WO2022167345 A1 WO 2022167345A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
determined
bew
info
source
Prior art date
Application number
PCT/EP2022/052121
Other languages
English (en)
French (fr)
Inventor
Marco Kiehle
Markus Rascher
Original Assignee
Siemens Aktiengesellschaft
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Aktiengesellschaft filed Critical Siemens Aktiengesellschaft
Priority to CN202280013301.0A priority Critical patent/CN116848829A/zh
Priority to EP22705728.8A priority patent/EP4260533A1/de
Priority to US18/263,996 priority patent/US20240121234A1/en
Publication of WO2022167345A1 publication Critical patent/WO2022167345A1/de

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0823Network architectures or network communication protocols for network security for authentication of entities using certificates
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/02Capturing of monitoring data
    • H04L43/028Capturing of monitoring data by filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/60Context-dependent security
    • H04W12/63Location-dependent; Proximity-dependent

Definitions

  • the invention relates to determining an evaluation of a data set of a data packet, in particular based on one or more characteristics of the data set.
  • this invention describes a technical solution in the form of a computer-implemented method, with the aid of which the evaluation BEW of data can be determined in a reproducible manner. Accordingly, the method is used to determine such an evaluation BEW of a data set DS of a data package made available to a client by a data source. ketes D.
  • the evaluation BEW of the data record DS is determined with the aid of corresponding information from the past that is already available.
  • At least one of the characteristics CHAR1 to be determined in the first method step VI is a data pattern DSMUS.
  • data patterns can Error codes or certain temporal behavior within certain time windows.
  • the data packet D includes the data record DS to be evaluated and at least one output parameter DA of the data source.
  • At least one of the characteristics CHAR2 to be determined in the first method step VI is based on a context DSKXT of the data record DS, the context DSKXT being determined in a step V1_SEL_KXT of a selection method step V1_SEL of the first method step VI based on the at least one output parameter of the data source.
  • the assessment BEW of the data record DS is hereby carried out in the second method step V2 based on the identified data pattern DSMUS and on the determined context DSKXT and can, for example. can also be determined as that evaluation BEW, which can be determined by an appropriately trained artificial neuronal Network is output when playing the context DSKXT and the data pattern DSMUS.
  • At least one of the characteristics CHAR2 to be determined in the first method step can represent a suitable information source INFO_KXT for determining the evaluation BEW, which is set up to Assign data pattern DMUS_m an evaluation BEW, wherein the appropriate information source INFO_KXT is determined in a step V1_SEL_INFO of a selection process step V1_SEL of the first process step VI based on the at least one output parameter of the data source.
  • the evaluation BEW of the data record DS then takes place in the second method step V2 based on the previously identified data pattern DSMUS and on the determined suitable information source INFO_KXT and is thereby determined as the one evaluation BEW that is assigned to the identified data pattern DSMUS by the suitable information source INFO_KXT becomes . It is fundamentally conceivable that several sources of information are selected, so that more than one source of information is included when determining the evaluation.
  • step V1_SEL of the first method step VI the context DSKXT of the data record DS is first determined in step V1_SEL_KXT using the at least one output parameter DA of the data source. Then, in step V1_SEL_INFO, the at least one suitable information source INFO_KXT is determined as a function of the determined context DSKXT.
  • the appropriate information source INFO_KXT can in step V1_SEL_INFO based on the at least one output parameter and possibly. based on the previously determined context DSKXT either from a predetermined group GINFO of information sources INFO_q are selected, with a j e any information source INFO_q the group GINFO one or several of the previously known data patterns DMUS_m each assigns a predetermined assessment BEW, or can be determined using an artificial neural network KNN25, which is set up and trained to output a suitable information source INFO_KXT based on a context DSKXT or output parameter DA supplied to the network KNN25.
  • Various sources of information INFO_q can, for example. be different files, which in a corresponding data storage on a server o. uh . filed or are stored, or such different files, which are stored on different data storage devices.
  • the various data storage devices can be made available by different operators.
  • One of the output parameters DA can, for example. be an identity ID10 of the data source, the identity ID10 of the data source being determined by first checking whether the data source is trustworthy, in particular based on an identity check using a digital certificate, eg. X . 509 . If the data source is trustworthy, i. H . in the event that the check has shown that the data source is trustworthy, the identity ID10 of the data source is based on central, e.g. in a cloud environment, information stored and/or based on information transmitted by the data source.
  • one of the output parameters DA can be a spatial origin LOCI O of the data set, ie, for example. a location of the data source, the origin LOCI O of the data set being determined based on centrally stored information and/or based on information transmitted by the data source, in particular geotagging information.
  • DA a predetermined use of the data set or a specific ter specified context DSKXT be the data set, so that the determination of the context in step V1_SEL_KXT is reduced to reading out the specified context and thus greater security or Reliability of the assessment determination is given.
  • the data set DS is analyzed by the client in the pattern identification method step V1_MUS of the method itself with regard to the presence of a data pattern DSMUS from a large number of previously known data patterns in order to identify one of the known data patterns in the data set DS provided adorn .
  • the context DSKXT of the data record DS is also determined using one or more output parameters DA of the data source.
  • At least one suitable information source INFO_KXT is selected from a predetermined group of information sources, with each information source of the group assigning a respective predetermined assessment BEW to one or more of the previously known data patterns.
  • the actual evaluation BEW of the data record DS is finally determined based on the identified data pattern DSMUS from the selected information source INFO_KXT as that evaluation BEW which is assigned there to the identified data pattern DSMUS.
  • a corresponding system for determining an evaluation BEW of a data set of a data packet provided by a data source to a client of the system has a data analyzer which is set up to carry out the method described, comprising the first VI and the second method step.
  • the data analyzer can have an artificial neural network that is set up and pre-trained in order to determine the assessment BEW of the data set based on the determined data pattern DSMUS and on the determined context DSKXT.
  • the evaluation BEW determined with the system using the method can, for example Provide information about the extent to which the data record DS in the data packet D can be trusted and whether it is reliable, so that consequently reliable decisions can be made.
  • the evaluation BEW of the data record DS can be of different nature depending on the context DSKXT or include different aspects.
  • the assessment BEW of the data set DS can be determined, for example. be understood as a benchmark for the relevance of the value for a specific intended use of the assessed data set DS, for example. for training artificial neural networks by using the evaluation BEW for weighting the data DS for training the network, or for determining the status of an industrial plant and also in completely different fields such as e.g. for calculating prices, costs or taxes when transferring the evaluated data set.
  • the evaluation BEW of the data record DS could be determined by how representative the data record DS is for the later application of the ANN.
  • the ANN is intended for specific applications, e.g. to identify specific objects in an image.
  • a valuable data set DS could include labeled images which show at least some objects that are of interest for the application.
  • the BEW score is lower than for the data set DS with the former images.
  • a record DS can thus be weighted differently depending on the evaluation BEW determined when training the ANN.
  • the evaluation BEW is used to determine the condition of an industrial plant
  • the data set DS is analyzed and, depending on the result of the analysis, i. H . depending on the determined evaluation of the data set DS, the condition of the system is concluded, e.g. "normal” or "faulty” .
  • An industrial plant can, for example, can also be a single machine that works as a component of an IoT architecture.
  • this value BEW can be, for example. serve to set a price for the transmission of the data set DS from a first to a second user, d. H . to determine a type of purchase price, or any tax burden associated with the transfer, etc.
  • FIG. 1 shows an architecture of a data source and a client between which a data packet is transmitted
  • FIG. 2 shows a schematic representation of the method for determining the evaluation BEW.
  • Data source 10 and client 20 can be located at different locations SI, S2, for example in different countries, so that the data transfer may also take place across national borders G.
  • Data source 10 and client 20 can, for example, each be in the form of a data center, a cloud service or the like.
  • the data source 10 can, for example. Technician, another user or a control system or the like, which remotely uses or evaluates the respective provided data packet D, e.g. to monitor, control, maintain the loT device 10 or to the provided data of the data packet D to further process for any purpose. It is also possible, for example, to carry out remote services or predictive maintenance based on information from the data D, with the named user being selected and trained according to the intended use of the data packets D.
  • the provided data packets D are received by the client 20 at the location S2. According to the invention, the client 20 is set up to determine an evaluation BEW of a respective data packet D. E.g.
  • the data packets D are to be processed in one of the other services mentioned above as an example, symbolized in FIG from the client 20 received data packets D or. eg . copies thereof to a data analyzer 23 which carries out the determination of the BEW score.
  • the data broker 21 can, for example. be integrated into a reverse proxy.
  • the function 22 and also the data broker 21 can be dispensed with and the data packets D go directly to the data analyzer after receipt by the client 20 23 .
  • the method executed by the data analyzer 23 for determining the evaluation BEW requires, as explained below and shown in FIG. 2, in addition to the data set DS contained in the data packet D, the output parameter(s) DA also provided there. Furthermore, information from a sample database 24 and from an information database 25 is required, with the sample database 24 and/or the information database 25 being integrated into the data analyzer 23 or organized separately, for example centrally in a cloud.
  • a group GCHAR of characteristics CHAR1, . . . , CHARn with n>1 that are typical for the data packet is determined.
  • the group GCHAR accordingly includes at least one such characteristic CHAR1.
  • the group GCHAR comprises two characteristics CHARI , CHAR2 .
  • the first characteristic CHAR1 is a pattern DSMUS recognizable in the data record DS.
  • the pattern DSMUS can be e.g. be an error code or other recognizable data behavior, e.g. certain temporal behavior within a respective time window. So if e.g. If data is transmitted with a specific pattern or in a specific order within a specific time window, this can be the case, for example. be representative for a specific service case and the data set DS must be evaluated accordingly.
  • the previously known data patterns DMUS_m of the plurality GDMUS are stored in the pattern database 24 already mentioned.
  • the pattern database 24 is designed as a pre-trained artificial neural network KNN24.
  • the use of an artificial neural network KNN24 allows the data pattern DSMUS to be determined even for previously unknown data patterns in the data record DS.
  • the network KNN24 can be trained in advance in the usual way, for example. based on artificial or real data sets DS, for which the patterns DSMUS occurring therein are already known. For the training, the data sets DS are labeled with their respective known patterns DSMUS and the network KNN24 is trained with these labeled data sets in a manner known per se.
  • the first method step VI supplies the first characteristic CHAR1 in its pattern identification method step V1_MUS both in the first and in the second variant, which characteristic represents a data pattern DSMUS in the data record DS.
  • the first method step VI ideally also supplies a second characteristic CHAR2, which is determined in a selection method step V1_SEL of the first method step VI.
  • a context DSKXT of the data record DS is first determined in the selection method step V1_SEL in a step V1_SEL_KXT, with this context DSKXT being determined using the at least one output parameter DA of the data packet D.
  • the context DSKXT can e.g. be a use of the data set DS that is targeted by the client 20 or specified by the data source 10 and/or, for example. the background to the generation of the data satzes DS describe . If e.g.
  • the data source 10 is a nuclear power plant and the data set DS represents current operating parameters of the power plant
  • the context DSKXT could be the operational safety of the power plant and the assessment BEW is a measure of the reliability of the transmitted data DS.
  • the context DSKXT would be this application and the evaluation would be a financial value of the data record DS.
  • the one or more output parameters DA of the data packet D can, for example. metadata regarding the generation and / or regarding. an intended use or evaluation of the data set DS at the client 20 and accordingly written by the data source 10 before transmission to the client 20 in the data packet D.
  • E.g. can one of the several output parameters DA for determining the context DSKXT represent an identity ID10 of the data source 10, the identity ID10 being determined in step V1_SEL_KXT by first checking whether the data source 10 is trustworthy, for example. by means of an identity check using a digital certificate, e.g. X . 509 . With trustworthy data source 10, i. H .
  • the identity ID10 of the data source 10 is based on e.g. centrally in a cloud o . uh . stored information and / or based on information transmitted from the data source 10 determined.
  • one of the several output parameters DA for determining the context DSKXT be a spatial origin LOC10 of the data set 10, ie, for example. the location S 1 of the data source 10, the origin of the data set DS in step V1_SEL_KXT in turn based on centrally stored information and / or based on information transmitted by the data source 10, for example. Geo-tagging information can be determined. If you know the identity ID10 and/or the origin LOCI O, for example. The context DSKXT corresponding to this situation LOCI 0 , ID10 is read out from a corresponding allocation table which in each case assigns a context to various combinations of ID 10 and/or LOCI 0 .
  • output parameters DA be a specific use of the data record DS specified by the data source 10 . It is also conceivable that the output parameter or parameters DA already include the context DSKXT to be used itself.
  • step V1_SEL_KXT Based on the so in step V1_SEL_KXT depending on identity ID10 and / or location LOCI O of the data source 10 and / or possibly.
  • a respective information source INFO_q of the group GINFO assigns a predetermined evaluation BEW to at least one, but typically to a large number of the previously known data patterns DMUS_m. It is quite conceivable that different information sources INFO_ql, INFO_q2 the same data pattern, for example.
  • DMUS_1 assign different ratings BEW1, BEW1, which consequently means that different ratings BEW1, BEW2 could be determined for the same data pattern DMUS_1, depending on the context.
  • Various sources of information INFO_q can, for example. be different files, which are stored in a corresponding data store on a server or . uh . filed or are stored, or such different files, which are stored on different data storage devices.
  • the various data storage devices can be made available by different operators.
  • the previously known sources of information are stored INFO_q in the aforementioned information database 25, with the information database 25 in this first variant being associated with one of the information sources INFO_q for each conceivable context, for example in the form of a table, e.g. a so called "Look-up table" LUT. Accordingly, the information database 25 supplies the data analyzer 23 with the playback of the determined context DSKXT a specific information source INFO_KXT suitable for determining the assessment BEW with 1 ⁇ KXT ⁇ Q from the multitude of information sources INFO_q In the first variant, the information database 25 is based on past experience, ie based on previous assignments of suitable information sources to specific contexts, for example.
  • the information database 25 is designed as a pre-trained artificial neural network KNN25.
  • the use of the artificial neural network KNN25 instead of the table LUT allows a suitable information source INFO_KXT to be determined even for previously unknown contexts DSKXT.
  • the network KNN25 can also be trained in advance in the usual way, for example. based on artificial or real contexts, for which it is known which information source is most suitable, in order to finally obtain the BEW evaluation average .
  • the contexts are labeled with a suitable information source and the network KNN25 is trained with these labeled contexts in a manner known per se.
  • the pattern identification process step V1_MUS for determining CHAR1 and the selection process step V1_SEL for determining CHAR2 can be carried out simultaneously in the first process step VI or in any order one after the other. Only the steps V1_SEL_KXT and V1_SEL_INFO of the selection process step V1_SEL must be executed one after the other, since the step V1_SEL_INFO requires the result of the step V1_SEL_KXT.
  • a predetermined evaluation BEW is assigned to each data pattern DMUS_m in each respective information source INFO_q, as already described above, for example in the form of a corresponding table.
  • the use of an artificial neural network KNN is also conceivable here, which based on data pattern DSMUS and information source INFO_KXT or, al- alternatively, based on the data pattern DSMUS and context DSKXT passed to it, the assessment BEW is determined.
  • the method for determining the evaluation BEW of the data record DS therefore assumes that the evaluation BEW depends on the context DSKXT and on the pattern DSMUS of the data record DS of the data packet D.
  • the data analyzer 23 can be configured as an artificial neural network KNN23, so that some or even all of the individual steps VI, V1_MUS, V1JSEL, V1_SEL_KXT, V1_SEL_INFO and/or V2 described above are no longer executed separately as individual steps, but in one common calculation performed by the ANN23 .
  • step V1_MUS it is advantageous to carry it out with the help of the network KNN24, as already described, since it cannot be ruled out that the pattern DSMUS in the data record DS is not always clearly recognizable. In such cases, the use of an artificial neural network can be helpful.
  • KNN23 requires the data record DS and the output parameters DA as input data in order to determine the assessment BEW.
  • the training of a correspondingly designed artificial neural network which carries out the respective targeted steps or partial steps, can take place as already described above for ANN24 and ANN25 and is based in principle on the approaches known per se for training artificial neural networks.
  • Technical use cases for the method presented here for determining the assessment BEW of a data set DS or for further use of the evaluation BEW itself have already been mentioned above.
  • a further use opens up in that the BEW evaluation actually has a financial value of the data set or of the data packet D represents. This application is particularly advantageous when the data packet D is transmitted across the indicated national border G, so that taxation based on the value of the data becomes necessary.
  • This method enables an automated and therefore reproducible and ef fi cient valuation in such scenarios.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

Die Erfindung betrifft die Ermittlung einer Bewertung BEW eines Datensatzes DS eines Datenpakets D. Dabei wird zur Bewertungsermittlung zunächst ein Datenmuster DSMUS im Datensatz DS identifiziert. In einem weiteren, hiervon unabhängigen Schritt wird ein Kontext DSKXT ermittelt, der bspw. die Hintergründe der Erzeugung des Datensatzes DS oder eine anvisierte Nutzung des Datensatzes DS beschreibt. Die zu ermittelnde Bewertung BEW hängt schließlich sowohl vom Datenmuster DSMUS als auch vom Kontext DSKXT ab.

Description

Beschreibung
Ermittlung einer Bewertung eines Datensatzes
Die Erfindung betri f ft die Ermittlung einer Bewertung eines Datensatzes eines Datenpakets , insbesondere basierend auf einer oder mehreren Charakteristiken des Datensatzes .
Mit zunehmender Konnektivität von Geräten, bspw . im Umfeld des „Internet-of-Things" ( loT ) , findet eine Daten- und/oder Werteverschiebung innerhalb von Unternehmen statt . Daten und Verbindungen werden über physikalische Grenzen sowie teils über Ländergrenzen hinweg gesendet bzw . aufgebaut , so dass auf den Daten basierende Aktivitäten und Leistungen gänzlich automatisiert und dabei auch lokal an anderen Orten erbracht werden können . Obwohl die Auswertung oder sonstige Weiterverwendung der trans ferierten Daten nicht selten vorgegebenen und/oder an sich bereits bewährten Prozessen folgt , werden derartige datenbasierte Aktionen nach wie vor häufig aufwändig von Hand und teilweise in nicht gleichbleibender Art und Weise ausgeführt . Dies führt zu wenig ef fi zienter sowie kaum reproduzierbarer und damit wenig verlässlicher Prozessaus führung .
Es ist daher eine Aufgabe der vorliegenden Erfindung, ein Verfahren sowie ein entsprechendes System vorzuschlagen, mit dem eine Bewertung eines von einer Datenquelle zur Verfügung gestellten Datensatzes automatisiert ermittelt werden kann, so dass schließlich basierend auf der so ermittelten Bewertung weiter gehende Maßnahmen in die Wege geleitet werden können .
Hierzu beschreibt diese Erfindung eine technische Lösung in Form eines computerimplementiertes Verfahrens , mit dessen Hil fe die Bewertung BEW von Daten reproduzierbar ermittelt werden kann . Das Verfahren dient dementsprechend zur Ermittlung einer solchen Bewertung BEW eines einem Client von einer Datenquelle bereit gestellten Datensatzes DS eines Datenpa- ketes D . Dabei wird das Datenpaket D in einem ersten Verfahrensschritt VI durch den Client dahingehend analysiert , dass eine zumindest eine Charakteristik umfassende Gruppe GCHAR von für den Datensatz DS typischen Charakteristiken CHAR_i mit i=l , ..., n und mit n>l bestimmt wird . In einem zweiten Verfahrensschritt V2 wird basierend auf der zumindest einen bestimmten Charakteristik die Bewertung BEW des Datensatzes DS mit Hil fe von entsprechenden, bereits vorliegenden Informationen aus der Vergangenheit ermittelt .
Zumindest eine der im ersten Verfahrensschritt VI zu ermittelnde Charakteristiken CHAR1 ist ein Datenmuster DSMUS . Der Datensatz DS wird im ersten Verfahrensschritt VI durch den Client , d . h . bspw . durch eine entsprechende auf einem Clientrechner implementierte Software , in einem Musteridenti fikationsverfahrensschritt V1_MUS des ersten Verfahrensschritts VI hinsichtlich des Vorliegens eines bestimmten Datenmusters DMUS_m aus einer Viel zahl von vorbekannten Datenmustern GDMUS mit dem Ziel analysiert , eines der vorbekannten Datenmuster DMUS_m im bereitgestellten Datensatz DS zu identi fi zieren, demnach resultierend im identi fi zierten Datenmuster DSMUS=DMUS_m . Datenmuster können bspw . Fehlercodes oder bestimmte zeitliche Verhalten innerhalb bestimmter Zeitfenster sein .
Das Datenpaket D umfasst den zu bewertenden Datensatz DS sowie zumindest einen Ausgangsparameter DA der Datenquelle . Zumindest eine der im ersten Verfahrensschritt VI zu ermittelnden Charakteristiken CHAR2 basiert auf einem Kontext DSKXT des Datensatzes DS , wobei der Kontext DSKXT in einem Schritt V1_SEL_KXT eines Selektionsverfahrensschritts V1_SEL des ersten Verfahrensschritts VI basierend auf dem zumindest einen Ausgangsparameter der Datenquelle ermittelt wird . Die Bewertung BEW des Datensatzes DS erfolgt hiermit im zweiten Verfahrensschritt V2 basierend auf dem identi fi zierten Datenmuster DSMUS und auf dem ermittelten Kontext DSKXT und kann dabei bspw . auch als diej enige Bewertung BEW ermittelt werden, die durch ein entsprechend trainiertes künstliches neuronales Netzwerk bei Zuspielung des Kontextes DSKXT und des Datenmusters DSMUS ausgegeben wird .
Für den Fall , dass das Datenpaket D den zu bewertenden Datensatz DS sowie zumindest einen Ausgangsparameter DA der Datenquelle umfasst , kann zumindest eine der im ersten Verfahrensschritt zu ermittelnden Charakteristiken CHAR2 eine geeignete Informationsquelle INFO_KXT zur Ermittlung der Bewertung BEW repräsentieren, welche eingerichtet ist , um einem Datenmuster DMUS_m eine Bewertung BEW zuzuordnen, wobei die geeignete Informationsquelle INFO_KXT in einem Schritt V1_SEL_INFO eines Selektionsverfahrensschritts V1_SEL des ersten Verfahrensschritts VI basierend auf dem zumindest einen Ausgangsparameter der Datenquelle ermittelt wird . Die Bewertung BEW des Datensatzes DS erfolgt dann im zweiten Verfahrensschritt V2 basierend auf dem zuvor identi fi zierten Datenmuster DSMUS und auf der ermittelten geeigneten Informationsquelle INFO_KXT und wird dabei als diej enige Bewertung BEW ermittelt , die durch die geeignete Informationsquelle INFO_KXT dem identi fizierten Datenmuster DSMUS zugeordnet wird . Dabei ist es grundsätzlich denkbar, dass mehrere Informationsquellen selektiert werden, so dass bei der Bewertungsermittlung mehr als eine Informationsquelle eingeht .
Im Selektionsverfahrensschritt V1_SEL des ersten Verfahrensschritts VI wird dabei zunächst im Schritt V1_SEL_KXT der Kontext DSKXT des Datensatzes DS anhand des zumindest einen Ausgangsparameters DA der Datenquelle ermittelt . Anschließend wird im Schritt V1_SEL_INFO in Abhängigkeit vom ermittelten Kontext DSKXT die zumindest eine geeignete Informationsquelle INFO_KXT ermittelt .
Die geeignete Informationsquelle INFO_KXT kann im Schritt V1_SEL_INFO basierend auf dem zumindest einen Ausgangsparameter und dabei ggf . basierend auf dem zuvor ermittelten Kontext DSKXT entweder aus einer vorgegebenen Gruppe GINFO von Informationsquellen INFO_q selektiert werden, wobei eine j eweilige Informationsquelle INFO_q der Gruppe GINFO einem oder mehreren der vorbekannten Datenmuster DMUS_m j eweils eine vorbestimmte Bewertung BEW zuordnet , oder aber anhand eines künstlichen neuronalen Netzwerks KNN25 ermittelt werden, welches eingerichtet und trainiert ist , um basierend auf einem dem Netzwerk KNN25 zugeführten Kontext DSKXT oder Ausgangsparameter DA eine geeignete Informationsquelle INFO_KXT aus zugeben .
Verschiedene Informationsquellen INFO_q können bspw . unterschiedliche Dateien sein, welche in einem entsprechenden Datenspeicher auf einem Server o . ä . abgelegt bzw . gespeichert sind, oder aber derartige unterschiedliche Dateien, welche auf verschiedenen Datenspeichern abgelegt sind . Die verschiedenen Datenspeicher können dabei von unterschiedlichen Betreibern zur Verfügung gestellt sein .
Einer der Ausgangsparameter DA kann bspw . eine Identität ID10 der Datenquelle sein, wobei die Identität ID10 der Datenquelle bestimmt wird, indem zunächst geprüft wird, ob die Datenquelle vertrauenswürdig ist , insbesondere anhand einer Iden- titätsprüfung mithil fe eines digitalen Zerti fikats , bspw . X . 509 . Bei vertrauenswürdiger Datenquelle , d . h . für den Fall , dass die Prüfung ergeben hat , dass die Datenquelle vertrauenswürdig ist , wird die Identität ID10 der Datenquelle basierend auf zentral , bspw . in einer Cloudumgebung, gespeicherten Informationen und/oder basierend auf von der Datenquelle übermittelten Informationen festgelegt .
Alternativ oder zusätzlich kann einer der Ausgangsparameter DA eine räumliche Herkunft LOCI O des Datensatzes sein, also bspw . ein Standort der Datenquelle , wobei die Herkunft LOCI O des Datensatzes basierend auf zentral gespeicherten Informationen und/oder basierend auf von der Datenquelle übermittelten Informationen, insbesondere Geotagging- Informationen, bestimmt wird .
Alternativ oder zusätzlich kann einer der Ausgangsparameter
DA eine vorgegebene Nutzung des Datensatzes oder ein konkre- ter vorgegebener Kontext DSKXT das Datensatzes sein, so dass sich die Ermittlung des Kontextes im Schritt V1_SEL_KXT auf ein Herauslesen des vorgegebenen Kontextes reduziert und damit eine höhere Sicherheit bzw . Verlässlichkeit der Bewertungsermittlung gegeben ist .
Mit anderen Worten handelt es sich also um ein computer implementiertes Verfahren zur Ermittlung einer Bewertung eines einem Client von einer Datenquelle nebst zumindest eines Ausgangsparameters DA der Datenquelle bereit gestellten Datensatzes DS . In einer möglichen Ausbildung wird im ersten Verfahrensschritt VI der Datensatz DS durch den Client im Musteridenti fikationsverfahrensschritt V1_MUS des Verfahrens selbst zunächst hinsichtlich des Vorliegens eines Datenmusters DSMUS aus einer Viel zahl von vorbekannten Datenmustern analysiert , um eines der vorbekannten Datenmuster im bereitgestellten Datensatz DS zu identi fi zieren . Im Selektionsverfahrensschritt V1_SEL wird außerdem anhand eines oder mehrerer Ausgangsparameter DA der Datenquelle der Kontext DSKXT des Datensatzes DS ermittelt . In Abhängigkeit vom ermittelten Kontext DSKXT wird zumindest eine geeignete Informationsquelle INFO_KXT aus einer vorgegebenen Gruppe von Informationsquellen selektiert , wobei eine j eweilige Informationsquelle der Gruppe einem oder mehreren der vorbekannten Datenmuster j eweils eine vorbestimmten Bewertung BEW zuordnet . Die eigentliche Bewertung BEW des Datensatzes DS wird schließlich basierend auf dem identi fi zierten Datenmuster DSMUS aus der selektierten Informationsquelle INFO_KXT als diej enige Bewertung BEW ermittelt , die dort dem identi fi zierten Datenmuster DSMUS zugeordnet ist .
Ein entsprechendes System zur Ermittlung einer Bewertung BEW eines einem Client des Systems von einer Datenquelle bereit gestellten Datensatzes eines Datenpaketes weist einen Datenanalysator auf , welcher eingerichtet ist , um das beschriebene Verfahren umfassend den ersten VI und den zweiten Verfahrensschritt aus zuführen . Der Datenanalysator kann ein künstliches neuronales Netzwerk aufweisen, welches eingerichtet und vortrainiert ist , um basierend auf dem ermittelten Datenmuster DSMUS und auf dem ermittelten Kontext DSKXT die Bewertung BEW des Datensatzes zu ermitteln .
Die mit dem System unter Verwendung des Verfahrens ermittelte Bewertung BEW kann bspw . Aufschluss darüber geben, inwieweit dem Datensatz DS im Datenpaket D vertraut werden kann und ob dieser verlässlich ist , so dass konsequenterweise verlässliche Entscheidungen getrof fen werden können .
Die Bewertung BEW des Datensatzes DS kann j e nach Kontext DSKXT unterschiedlicher Natur sein bzw . verschiedene Aspekte umfassen . Letztlich kann die ermittelte Bewertung BEW des Datensatzes DS bspw . als Maßstab für die Relevanz des Wertes bei einer bestimmten anvisierten Nutzung des bewerteten Datensatzes DS verstanden werden, bspw . zum Trainieren von künstlichen neuronalen Netzen, indem die Bewertung BEW zur Wichtung der Daten DS zum Trainieren des Netzwerkes eingesetzt wird, oder aber zur Bestimmung des Zustandes einer Industrieanlage sowie auch in gänzlich anderen Feldern wie bspw . für die Berechnung von Preisen, Kosten oder Steuern bei Trans fer des bewerteten Datensatzes .
Wiederum im Fall der Anwendung zum Trainieren eines KNN könnte die Bewertung BEW des Datensatzes DS dadurch bestimmt sein, wie repräsentativ der Datensatz DS für die spätere Anwendung des KNN ist . Das KNN ist für bestimmte Anwendungen vorgesehen, bspw . zur Erkennung bestimmter Gegenstände in einem Bild . Ein wertvoller Datensatz DS könnte in dem Fall ge- labelte Bilder umfassen, welche zumindest einige Gegenstände zeigen, die für die Anwendung von Interesse sind . Wenn die Bilder j edoch nur Gegenstände umfassen, die nicht von Interesse sind, so ist dies zum Trainieren des KNN nicht gänzlich wertlos , j edoch ist die Bewertung BEW geringer als beim Datensatz DS mit den erstgenannten Bildern . Ein Datensatz DS kann somit j e nach ermittelter Bewertung BEW beim Trainieren des KNN unterschiedlich gewichtet werden .
Im Fall der Anwendung der Bewertung BEW zur Bestimmung des Zustandes einer Industrieanlage wird der Datensatz DS analysiert und j e nach Ergebnis der Analyse , d . h . j e nach ermittelter Bewertung des Datensatzes DS , wird auf den Zustand der Anlage geschlossen, bspw . „normal" oder „fehlerhaft" . Eine Industrieanlage kann hier bspw . auch schon eine einzelne Maschine sein, die als Komponente einer IoT-Architektur arbeitet .
In einer weiter gehenden Anwendung kann bspw . ein Unternehmen eine Steuerbemessungsgrundlage von digital erbrachten Aktivitäten und Leistungen bilden und somit ein vorhandenes Steuerrisiko minimieren . In diesem Anwendungs fall der Bewertung BEW des Datensatzes DS als finanzieller Wert kann dieser Wert BEW bspw . dazu dienen, einen Preis zur Übertragung des Datensatzes DS von einem ersten an einen zweiten Nutzer festzusetzen, d . h . eine Art Kaufpreis , oder eventuell mit der Übertragung verbundene Steuerlasten zu bestimmen etc .
Im Folgenden werden die Erfindung und beispielhafte Aus führungs formen anhand von Zeichnungen näher erläutert . Dort werden ggf . gleiche Komponenten in verschiedenen Figuren durch gleiche Bezugs zeichen gekennzeichnet . Es ist daher möglich, dass sich bei der Beschreibung einer zweiten Figur zu einem bestimmten Bezugs zeichen, welches bereits im Zusammenhang mit einer anderen, ersten Figur erläutert wurde , keine näheren Erläuterungen finden . In einem solchen Fall kann bei der Ausführungs form der zweiten Figur davon ausgegangen werden, dass die dort mit diesem Bezugs zeichen gekennzeichnete Komponente auch ohne nähere Erläuterung im Zusammenhang mit der zweiten Figur die gleichen Eigenschaften und Funktionalitäten aufweist , wie im Zusammenhang mit der ersten Figur erläutert . Des Weiteren werden der Übersichtlichkeit wegen teilweise nicht sämtliche Bezugs zeichen in sämtlichen Figuren darge- stellt, sondern nur diejenigen, auf die in der Beschreibung der jeweiligen Figur Bezug genommen wird.
Es zeigen:
FIG 1 eine Architektur einer Datenquelle und eines Clients, zwischen denen ein Datenpaket übermittelt wird, FIG 2 eine schematische Darstellung des Verfahrens zur Ermittlung der Bewertung BEW.
Die FIG 1 zeigt exemplarisch und vereinfacht eine Situation, in der von einer Datenquelle 10 ein Datenpaket D={DA, DS } umfassend einen Datensatz DS sowie einen oder mehrere Ausgangsparameter DA an einen Client 20 übermittelt wird. Datenquelle 10 und Client 20 können sich dabei an verschiedenen Standorten SI, S2 befinden, bspw. in verschiedenen Ländern, so dass der Datentransfer möglicherweise auch über Ländergrenzen G hinweg erfolgt. Datenquelle 10 und Client 20 können bspw. jeweils als Datencenter, als Cloud-Dienst o.ä. ausgebildet sein.
Die Datenquelle 10 kann bspw. ein loT-Gerät 11 sowie weitere Quellgeräte 12 aufweisen, die jeweils Datenpakete D vom Standort S1 and den Client 20 am Standort S2 schicken, wo ein Nutzer (nicht separat dargestellt) , bspw. ein Operator, ein Service-Techniker, ein sonstiger Nutzer oder aber ein Kontrollsystem o.ä., das jeweilige bereitgestellte Datenpaket D aus der Ferne nutzt oder auswertet, bspw. um das loT-Gerät 10 zu überwachen, zu steuern, zu warten oder um die bereit gestellten Daten des Datenpakets D zu einem beliebigen Zweck weiter zu verarbeiten. Auch ist es bspw. möglich, basierend auf Informationen aus den Daten D Fernservice-Leistungen („remote services") oder prädiktive Instandhaltung („predictive maintenance") durchzuführen, wobei der genannte Nutzer entsprechend der anvisierten Nutzung der Datenpakete D gewählt und ausgebildet ist. Die bereitgestellten Datenpakete D werden am Standort S2 vom Client 20 empfangen . Der Client 20 ist erfindungsgemäß eingerichtet , um eine Bewertung BEW eines j eweiligen Datenpaketes D zu ermitteln . Bspw . für den Fall , dass die Datenpakete D in einem der vorstehend exemplarisch genannten weiteren Services verarbeitet werden sollen, in FIG 1 symbolisiert durch die optionale und daher mit gestrichelter Linie symbolisierte Funktion 22 , kann der Client 20 einen dementsprechend ebenfalls optionalen Datenbroker 21 aufweisen, der die vom Client 20 empfangenen Datenpakete D bzw . bspw . Kopien davon an einen Datenanalysator 23 umleitet , der die Ermittlung der Bewertung BEW aus führt . Der Datenbroker 21 kann bspw . in einen Reverse Proxy integriert sein . Für den Fall , dass neben der Ermittlung der Bewertung BEW der Datenpakete D keine weitere Verwendung der Datenpakete D vorgesehen ist , kann auf die Funktion 22 sowie auch auf den Datenbroker 21 verzichtet werden und die Datenpakete D gelangen nach Empfang durch den Client 20 direkt zum Datenanalysator 23 .
Das vom Datenanalysator 23 ausgeführte Verfahren zur Ermittlung der Bewertung BEW benötigt wie im Folgenden erläutert und in FIG 2 dargestellt neben dem im Datenpaket D enthaltenen Datensatz DS auch den oder die dort ebenfalls vorgesehenen Ausgangsparameter DA. Des Weiteren werden Informationen aus einer Muster-Datenbasis 24 sowie aus einer Informations- Datenbasis 25 benötigt , wobei die Muster-Datenbasis 24 und/oder die Informations-Datenbasis 25 in den Datenanalysator 23 integriert oder auch separat organisiert sein können, bspw . zentral in einer Cloud .
In einem ersten vom Datenanalysator 23 ausgeführten Verfahrensschritt VI wird das Datenpaket D zunächst dahingehend analysiert , dass eine Gruppe GCHAR von für das Datenpaket typischen Charakteristiken CHAR1 , ..., CHARn mit n>l bestimmt wird . Die Gruppe GCHAR umfasst demnach zumindest eine solche Charakteristik CHAR1 . Im Folgenden wird davon ausgegangen, dass die Gruppe GCHAR zwei Charakteristiken CHARI , CHAR2 umfasst .
Die erste Charakteristik CHAR1 ist hierbei ein im Datensatz DS erkennbares Muster DSMUS . Bei dem Muster DSMUS kann es sich bspw . um einen Fehlercode handeln oder aber um sonstige erkennbare Datenverhalten, bspw . bestimmte zeitliche Verhalten innerhalb eines j eweiligen Zeitfensters . Wenn also bspw . innerhalb eines bestimmten Zeitfensters Daten mit einem bestimmten Muster oder in bestimmter Reihenfolge übertragen werden, dann kann dies bspw . für einen bestimmten Servicefall repräsentativ sein und der Datensatz DS ist entsprechend zu bewerten .
In einer ersten, einfachen regelbasierten Variante zur Bestimmung bzw . Erkennung des Musters DSMUS wird der Datensatz DS des Datenpakets D in einem Musteridenti fikationsverfahrensschritt V1_MUS des ersten Verfahrensschritts VI hinsichtlich des Vorliegens eines bestimmten Datenmusters DMUS_m aus einer Viel zahl von vorbekannten Datenmustern GDMUS= { DMUS_1 , DMUS_2 , ..., DMUS_M } mit M>1 mit dem Ziel analysiert , eines der vorbekannten Datenmuster DMUS_m mit l<m<M aus GDMUS im be- reitgestellten Datensatz DS zu identi fi zieren, d . h . es wird festgestellt DSMUS=DMUS_m . In der ersten Variante sind die vorbekannten Datenmuster DMUS_m der Viel zahl GDMUS in der bereits erwähnten Muster-Datenbasis 24 gespeichert . Der zu analysierende Datensatz DS wird mit den vorbekannten Mustern aus GDMUS verglichen . Dasj enige Muster DMUS_m aus der Viel zahl der vorbekannten Muster GDMUS , welches dem Datensatz DS am ähnlichsten ist , wird als das zutref fende Muster DSMUS und damit als die erste Charakteristik CHARl=DSMUS=DMUS_m festgelegt .
In einer zweiten, flexibleren Variante zur Bestimmung bzw . Erkennung des Musters DSMUS im hier ebenfalls ausgeführten Musteridenti fikationsverfahrensschritt V1_MUS ist die Muster- Datenbasis 24 als vortrainiertes künstliches neuronales Netzwerk KNN24 ausgestaltet . Das Netzwerk KNN24 ist derart einge- richtet , dass es in einem ihm zugespielten zu analysierenden Datensatz DS ein Datenmuster DSMUS=DSMUSknn erkennt und dieses Muster DSMUS dem Datenanalysator 23 zur Verfügung stellt , so dass am Ende in der zweiten Variante CHARl=DSMUS=DSMUSknn gilt . Die Verwendung eines künstlichen neuronalen Netzwerkes KNN24 erlaubt die Ermittlung des Datenmusters DSMUS auch für bislang nicht bekannte Datenmuster im Datensatz DS .
Das Netzwerk KNN24 kann im Vorfeld in üblicher Weise trainiert sein, bspw . anhand von künstlichen oder realen Datensätzen DS , für die die darin vorkommenden Muster DSMUS bereits bekannt sind . Die Datensätze DS werden für das Training mit ihren j eweils bekannten Mustern DSMUS gelabelt und das Netzwerk KNN24 wird mit diesen gelabelten Datensätzen in an sich bekannter Weise trainiert .
Dies zusammenfassend liefert der erste Verfahrensschritt VI in seinem Musteridenti fikationsverfahrensschritt V1_MUS sowohl in der ersten als auch in der zweiten Variante die ersten Charakteristik CHAR1 , welche ein Datenmuster DSMUS im Datensatz DS repräsentiert .
Wie erwähnt liefert der erste Verfahrensschritt VI neben der ersten Charakteristik CHAR1 idealerweise auch eine zweite Charakteristik CHAR2 , welche in einem Selektionsverfahrensschritt V1_SEL des ersten Verfahrensschritts VI bestimmt wird . Die zweite Charakteristik CHAR2 ist hierbei eine vom Datenanalysator 23 zur Ermittlung der Bewertung BEW heranzuziehende Informationsquelle INFO, d . h . CHAR2=INFO .
Um diese Informationsquelle INFO zu identi fi zieren, wird im Selektionsverfahrensschritt V1_SEL zunächst in einem Schritt V1_SEL_KXT ein Kontext DSKXT des Datensatzes DS bestimmt , wobei dieser Kontext DSKXT anhand des zumindest einen Ausgangsparameters DA des Datenpakets D ermittelt wird . Der Kontext DSKXT kann bspw . eine vom Client 20 anvisierte oder eine von der Datenquelle 10 vorgegebene Nutzung des Datensatzes DS sein und/oder bspw . die Hintergründe der Erzeugung des Daten- satzes DS beschreiben . Wenn bspw . die Datenquelle 10 ein Kernkraftwerk ist und der Datensatz DS aktuelle Betriebsparameter des Kraftwerks repräsentiert , könnte der Kontext DSKXT die Betriebssicherheit des Kraftwerks sein und die Bewertung BEW ist ein Maß für die Verlässlichkeit der übertragenen Daten DS . Im eingangs erwähnten Anwendungs fall der Steuerermittlung würde der Kontext DSKXT eben diese Anwendung sein und die Bewertung wäre ein finanzieller Wert des Datensatzes DS .
Der oder die Ausgangsparameter DA des Datenpakets D können bspw . Metadaten bzgl . der Erzeugung und/oder bzgl . einer vorgesehenen Nutzung oder Auswertung des Datensatzes DS beim Client 20 sein und dementsprechend durch die Datenquelle 10 vor Übermittlung an den Client 20 in das Datenpaket D geschrieben werden . Bspw . kann einer der ggf . mehreren Ausgangsparameter DA zur Ermittlung des Kontextes DSKXT eine Identität ID10 der Datenquelle 10 repräsentieren, wobei die Identität ID10 im Schritt V1_SEL_KXT bestimmt wird, indem zunächst geprüft wird, ob die Datenquelle 10 vertrauenswürdig ist , bspw . mittels einer Identitätsprüfung anhand eines digitalen Zerti fikats , bspw . X . 509 . Bei vertrauenswürdiger Datenquelle 10 , d . h . für den Fall , dass die Prüfung ergeben hat , dass die Datenquelle 10 vertrauenswürdig ist , wird die Identität ID10 der Datenquelle 10 basierend auf bspw . zentral in einer Cloud o . ä . gespeicherten Informationen und/oder basierend auf von der Datenquelle 10 übermittelten Informationen ermittelt .
Zusätzlich oder alternativ kann einer der ggf . mehreren Ausgangsparameter DA zur Ermittlung des Kontextes DSKXT eine räumliche Herkunft LOC10 des Datensatzes 10 sein, also bspw . der Standort S 1 der Datenquelle 10 , wobei die Herkunft des Datensatzes DS im Schritt V1_SEL_KXT wiederum basierend auf zentral gespeicherten Informationen und/oder basierend auf von der Datenquelle 10 übermittelten Informationen, bspw . Ge- otagging- Informationen, bestimmt werden kann . Bei Kenntnis der Identität ID10 und/oder der Herkunft LOCI O kann bspw . aus einer entsprechenden Zuordnungstabelle , die verschiedenen Kombinationen aus ID10 und/oder LOCI O j eweils einen Kontext zuordnet , der dieser Situation LOCI O , ID10 entsprechende Kontext DSKXT herausgelesen werden .
Des Weiteren kann ebenfalls zusätzlich oder alternativ einer der ggf . mehreren Ausgangsparameter DA eine von der Datenquelle 10 konkret vorgegebene Nutzung des Datensatzes DS sein . Ebenfalls ist es denkbar, dass der oder die Ausgangsparameter DA bereits den heranzuziehenden Kontext DSKXT selbst umfassen .
Basierend auf dem so im Schritt V1_SEL_KXT in Abhängigkeit von Identität ID10 und/oder Standort LOCI O der Datenquelle 10 und/oder ggf . weiteren in den Ausgangsparametern DA enthaltenen Informationen ermittelten Kontext DSKXT des Datensatzes DS wird in einem daran anschließenden Schritt V1_SEL_INFO des Selektionsverfahrensschritts V1_SEL die zur Ermittlung der Bewertung BEW geeignete Informationsquelle INFO=INFO_KXT selektiert .
In einer ersten, einfachen regelbasierten Variante zur Auswahl der Informationsquelle INFO_KXT basierend auf dem Kontext DSKXT wird die geeignete Informationsquelle INFO_KXT aus einer vorhandenen Gruppe GINFO= { INFO_1 , INFO_2 , ..., INFO_Q } von Informationsquellen INFO_q mit l<q<Q und Q>1 selektiert . Eine j eweilige Informationsquelle INFO_q der Gruppe GINFO ordnet zumindest einem, typischerweise aber einer Viel zahl der vorbekannten Datenmuster DMUS_m j eweils eine vorbestimmte Bewertung BEW zu . Dabei ist es durchaus denkbar, dass verschiedene Informationsquellen INFO_ql , INFO_q2 demselben Datenmuster, bspw . DMUS_1 , verschiedene Bewertungen BEW1 , BEW1 zuordnen, was in der Konsequenz bedeutet , dass für das selbe Datenmuster DMUS_1 j e nach Kontext unterschiedliche Bewertungen BEW1 , BEW2 ermittelt werden könnten . Verschiedene Informationsquellen INFO_q können bspw . unterschiedliche Dateien sein, welche in einem entsprechenden Datenspeicher auf einem Server o . ä . abgelegt bzw . gespeichert sind, oder aber derartige unterschiedliche Dateien, welche auf verschiedenen Datenspeichern abgelegt sind . Die verschiedenen Datenspeicher können dabei von unterschiedlichen Betreibern zur Verfügung gestellt sein .
Die vorbekannten Informationsquellen sind INFO_q in der bereits erwähnten Informations-Datenbasis 25 gespeichert , wobei die Informations-Datenbasis 25 in dieser ersten Variante j edem denkbaren Kontext eine der Informationsquellen INFO_q zuordnet , bspw . in Form einer Tabelle , bspw . ein sog . „look-up- table" LUT . Demnach liefert die Informations-Datenbasis 25 dem Datenanalysator 23 bei Zuspielung des ermittelten Kontextes DSKXT eine bestimmte zur Ermittlung der Bewertung BEW geeignete Informationsquelle INFO_KXT mit 1<KXT<Q aus der Vielzahl von Informationsquellen INFO_q . In dieser ersten Variante ist die Informations-Datenbasis 25 basierend auf Erfahrungen aus der Vergangenheit aufgebaut , d . h . bspw . basierend auf früheren Zuordnungen von geeigneten Informationsquellen zu bestimmten Kontexten .
In einer zweiten, flexibleren Variante zur Auswahl der Informationsquelle INFO_KXT basierend auf dem Kontext DSKXT im Schritt V1_SEL_INFO ist die Informations-Datenbasis 25 als vortrainiertes künstliches neuronales Netzwerk KNN25 ausgestaltet . Das Netzwerk KNN25 ist derart eingerichtet , dass es für einen ihm zugespielten Kontext DSKXT eine geeignete Informationsquelle INFO_KXT ermittelt und diese dem Datenanalysator 23 zur Verfügung stellt , so dass am Ende gilt CHAR2=INFO_KXT . Die Verwendung des künstlichen neuronalen Netzwerkes KNN25 anstelle der Tabelle LUT erlaubt die Ermittlung einer geeigneten Informationsquelle INFO_KXT auch für bislang nicht bekannte Kontexte DSKXT .
Auch das Netzwerk KNN25 kann im Vorfeld in üblicher Weise trainiert sein, bspw . anhand von künstlichen oder realen Kontexten, für die bekannt ist , welche Informationsquelle am besten geeignet ist , um schließlich die Bewertung BEW zu er- mitteln . Die Kontexte werden für das Training mit einer geeigneten Informationsquelle gelabelt und das Netzwerk KNN25 wird mit diesen gelabelten Kontexten in an sich bekannter Weise trainiert .
Zusammenfassend liefert also der erste Verfahrensschritt VI eine erste Charakteristik CHAR1=DSMUS sowie eine zweite Charakteristik CHAR2=INFO_KXT . Der Musteridenti fikationsverfahrensschritt V1_MUS zur Bestimmung von CHAR1 und der Selektionsverfahrensschritt V1_SEL zur Bestimmung von CHAR2 können im ersten Verfahrensschritt VI gleichzeitig oder aber in beliebiger Reihenfolge nacheinander ausgeführt werden . Lediglich die Schritte V1_SEL_KXT und V1_SEL_INFO des Selektionsverfahrensschritts V1_SEL müssen zwingend nacheinander ausgeführt werden, da der Schritt V1_SEL_INFO das Resultat des Schrittes V1_SEL_KXT benötigt .
In einem sich an den ersten Verfahrensschritt VI anschließenden zweiten vom Datenanalysator 23 ausgeführten Verfahrensschritt V2 wird basierend auf den Charakteristiken CHAR1=DSMUS und CHAR2=INFO_KXT die endgültige Bewertung BEW des Datensatzes DS mit Hil fe von in der selektierten Informationsquelle INFO_KXT bereits vorliegenden Informationen aus der Vergangenheit ermittelt . Konkret wird in der selektierten Informationsquelle INFO_KXT die dem Muster DSMUS zugeordnete Bewertung BEW identi fi ziert und dem zu bewertenden Datensatz DS als Bewertung zugeordnet .
Auch an dieser Stelle sind zwei Varianten zum Ermitteln der Bewertung BEW denkbar . In einer ersten, einfachen Variante ist in einer j eweiligen Informationsquelle INFO_q wie oben bereits beschrieben einem j eden Datenmuster DMUS_m j eweils eine vorbestimmte Bewertung BEW zugeordnet , bspw . in Form einer entsprechenden Tabelle . In einer zweiten, flexibleren Variante ist auch hier der Einsatz eines künstlichen neuronalen Netzwerks KNN denkbar, welches basierend auf ihm zugespielten Datenmuster DSMUS und Informationsquelle INFO_KXT oder, al- ternativ hierzu, basierend auf ihm zugespielten Datenmuster DSMUS und Kontext DSKXT die Bewertung BEW ermittelt .
Das Verfahren zur Ermittlung der Bewertung BEW des Datensatzes DS geht also davon aus , dass die Bewertung BEW vom Kontext DSKXT sowie vom Muster DSMUS des Datensatzes DS des Datenpakets D abhängt .
Der Datenanalysator 23 kann in einer flexibleren Ausgestaltung als künstliches neuronales Netzwerk KNN23 ausgestaltet sein, so dass einige oder sogar alle der oben beschriebenen Einzelschritte VI , V1_MUS , V1JSEL, V1_SEL_KXT , V1_SEL_INFO und/oder V2 nicht mehr separat als Einzelschritte ausgeführt werden, sondern in einer gemeinsamen vom KNN23 ausgeführten Berechnung abgebildet sind . Insbesondere für den Schritt V1_MUS ist es vorteilhaft , ihn wie bereits beschrieben mit Hil fe des Netzwerks KNN24 aus zuführen, da nicht aus zuschließen ist , dass das Muster DSMUS im Datensatz DS nicht immer ohne weiteres klar erkennbar ist . In solchen Fällen kann eine Nutzung eines künstlichen neuronalen Netzwerkes hil freich sein . Auch für den Selektionsverfahrensschritt V1_SEL umfassend die Teilschritte V1_SEL_KXT und V1_SEL_INFO kann die Nutzung eines künstlichen neuronalen Netzwerkes vorteilhaft sein, welches allein basierend auf dem oder den Ausgangsparametern DA die geeignete Informationsquelle INFO_KXT bestimmt , ohne den Zwischenschritt zur Ermittlung des Kontextes DSKXT separat aus führen zu müssen . In der umfassendsten Ausgestaltung, in der KNN23 VI und V2 inklusive der j eweiligen Teilschritte V1_MUS und V1_SEL vollständig abbildet , benötigt KNN23 als Eingangsdaten den Datensatz DS sowie die Ausgangsparameter DA, um die Bewertung BEW zu ermitteln . Das Trainieren eines entsprechend ausgebildeten künstlichen neuronalen Netzwerkes , welches die j eweils anvisierten Schritte oder Teilschritte aus führt , kann wie oben bereits für KNN24 und KNN25 beschrieben erfolgen und orientiert sich grundsätzlich an den an sich bekannten Ansätzen zum Trainieren von künstlichen neuronalen Netzen . Technische Anwendungs fälle für das hier vorgestellte Verfahren zur Ermittlung der Bewertung BEW eines Datensatzes DS bzw . für die weitere Verwendung der Bewertung BEW selbst wurden oben bereits genannt . Eine weiter gehende Verwendung er- öf fnet sich darin, dass die Bewertung BEW tatsächlich einen finanziellen Wert des Datensatzes bzw . des Datenpakets D darstellt . Diese Anwendung ist insbesondere dann von Vorteil , wenn das Datenpaket D über die angedeutete Ländergrenze G hinweg übermittelt wird, so dass eine Versteuerung basierend auf dem Wert der Daten notwendig wird . Das vorgeschlagene
Verfahren ermöglicht eine automatisierte und damit zum Einen reproduzierbare und zum Anderen ef fi ziente Wertermittlung in derartigen S zenarien .

Claims

Patentansprüche
1 . Computerimplementiertes Verfahren zur Ermittlung einer Bewertung BEW eines einem Client ( 20 ) von einer Datenquelle
( 10 ) bereit gestellten Datensatzes DS eines Datenpaketes D, wobei
- das Datenpaket D in einem ersten Verfahrensschritt VI durch den Client ( 20 ) dahingehend analysiert wird, dass eine zumindest eine Charakteristik CHAR_i umfassende Gruppe GCHAR von für das Datenpaket DS typischen Charakteristiken CHAR_i mit i=l , ..., n und mit n>l bestimmt wird,
- in einem zweiten Verfahrensschritt V2 basierend auf der zumindest einen bestimmten Charakteristik CHARI , CHAR2 die Bewertung BEW des Datensatzes DS mit Hil fe von bereits vorliegenden Informationen ermittelt wird .
2 . Verfahren nach Anspruch 1 , dadurch gekennzeichnet , dass zumindest eine der im ersten Verfahrensschritt VI zu ermittelnde Charakteristiken CHAR1 ein Datenmuster DSMUS ist , wobei der Datensatz DS im ersten Verfahrensschritt VI durch den Client ( 20 ) in einem Musteridenti fikationsverfahrensschritt V1_MUS des ersten Verfahrensschritts VI hinsichtlich des Vorliegens eines bestimmten Datenmusters DMUS_m aus einer Vielzahl von vorbekannten Datenmustern GDMUS mit dem Ziel analysiert wird, eines der vorbekannten Datenmuster DMUS_m im Datensatz DS zu identi fi zieren .
3 . Verfahren nach Anspruch 2 , dadurch gekennzeichnet , dass das Datenpaket D den zu bewertenden Datensatz DS sowie zumindest einen Ausgangsparameter DA der Datenquelle ( 10 ) umfasst , wobei
- zumindest eine der im ersten Verfahrensschritt VI zu ermittelnden Charakteristiken CHAR2 auf einem Kontext DSKXT des Datensatzes DS basiert , wobei der Kontext DSKXT in einem Schritt V1_SEL_KXT eines Selektionsverfahrensschritts V1_SEL des ersten Verfahrensschritts VI basierend auf dem zumindest einen Ausgangsparameter DA der Datenquelle ( 10 ) ermittelt wird, und - die Bewertung BEW des Datensatzes DS im zweiten Verfahrensschritt V2 basierend auf dem identi fi zierten Datenmuster DSMUS und auf dem ermittelten Kontext DSKXT erfolgt .
4 . Verfahren nach Anspruch 2 , dadurch gekennzeichnet , dass das Datenpaket D den zu bewertenden Datensatz DS sowie zumindest einen Ausgangsparameter DA der Datenquelle ( 10 ) umfasst , wobei
- zumindest eine der im ersten Verfahrensschritt VI zu ermittelnden Charakteristiken CHAR2 eine geeignete Informationsquelle INFO_KXT zur Ermittlung der Bewertung BEW repräsentiert , welche eingerichtet ist , um einem Datenmuster DMUS_m eine Bewertung BEW zuzuordnen, wobei die geeignete Informationsquelle INFO_KXT in einem Schritt V1_SEL_INFO eines Selektionsverfahrensschritts V1_SEL des ersten Verfahrensschritts VI basierend auf dem zumindest einen Ausgangsparameter DA der Datenquelle ( 10 ) ermittelt wird,
- die Bewertung BEW des Datensatzes DS im zweiten Verfahrensschritt V2 basierend auf dem identi fi zierten Datenmuster DSMUS und auf der ermittelten geeigneten Informationsquelle INFO_KXT erfolgt .
5. Verfahren nach Anspruch 3 und Anspruch 4 , dadurch gekennzeichnet , dass im Selektionsverfahrensschritt V1_SEL des ersten Verfahrensschritts VI
- zunächst im Schritt V1_SEL_KXT der Kontext DSKXT des Datensatzes DS anhand des zumindest einen Ausgangsparameters DA der Datenquelle ( 10 ) ermittelt wird und
- anschließend im Schritt V1_SEL_INFO in Abhängigkeit vom ermittelten Kontext DSKXT die zumindest eine geeignete Informationsquelle INFO_KXT ermittelt wird .
6. Verfahren nach einem der Ansprüche 4 bis 5 , dadurch gekennzeichnet , dass die geeignete Informationsquelle INFO_KXT im Schritt V1_SEL_INFO basierend auf dem zumindest einen Ausgangsparameter DA
- aus einer vorgegebenen Gruppe GINFO von Informationsquellen INFO_q selektiert wird, wobei eine j eweilige Informations- quelle INFO_q der Gruppe GINFO einem oder mehreren der vorbekannten Datenmuster DMUS_m jeweils eine vorbestimmte Bewertung BEW zuordnet, oder
- anhand eines künstlichen neuronalen Netzwerks KNN25 ermittelt wird, welches eingerichtet und trainiert ist, um basierend auf einem dem Netzwerk KNN25 zugeführten Kontext DSKXT oder Ausgangsparameter DA eine geeignete Informationsquelle INFO_KXT auszugeben.
7. Verfahren nach einem der Ansprüche 3 bis 6, dadurch gekennzeichnet, dass einer der Ausgangsparameter DA eine Identität ID10 der Datenquelle (10) ist, wobei die Identität ID10 der Datenquelle (10) bestimmt wird, indem
- zunächst geprüft wird, ob die Datenquelle (10) vertrauenswürdig ist, insbesondere anhand einer Identitätsprüfung mittels eines digitalen Zertifikats,
- bei vertrauenswürdiger Datenquelle (10) die Identität der Datenquelle (10) basierend auf zentral gespeicherten Informationen und/oder basierend auf von der Datenquelle (10) übermittelten Informationen ermittelt wird.
8. Verfahren nach einem der Ansprüche 3 bis 7, dadurch gekennzeichnet, dass einer der Ausgangsparameter DA eine räumliche Herkunft LOC10 des Datensatzes DS ist, wobei die Herkunft LOC10 des Datensatzes DS basierend auf zentral gespeicherten Informationen und/oder basierend auf von der Datenquelle (10) übermittelten Informationen, insbesondere Geotag- ging-Informationen, bestimmt wird.
9. Verfahren nach einem der Ansprüche 3 bis 8, dadurch gekennzeichnet, dass einer der Ausgangsparameter DA eine vorgegebene Nutzung des Datensatzes DS oder ein konkreter vorgegebener Kontext DSKXT das Datensatzes DS ist.
10. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die ermittelte Bewertung BEW einen finanziellen Wert des Datenpakets DS darstellt. 21
11. System zur Ermittlung einer Bewertung BEW eines einem Client (20) des Systems bereit gestellten Datensatzes DS eines Datenpaketes D, aufweisend einen Datenanalysator (23) , welcher eingerichtet ist, um das Verfahren gemäß einem der Ansprüche 1 bis 10 umfassend den ersten VI und den zweiten Verfahrensschritt auszuführen.
12. System nach Anspruch 11, dadurch gekennzeichnet, dass der Datenanalysator (23) eingerichtet ist, um das Verfahren gemäß den Ansprüchen 2 und 3 auszuführen, wobei der Datenanalysator
(23) ein künstliches neuronales Netzwerk aufweist, welches eingerichtet ist, um basierend auf dem ermittelten Datenmus- ter DSMUS und auf dem ermittelten Kontext DSKXT die Bewertung BEW des Datensatzes DS zu ermitteln.
PCT/EP2022/052121 2021-02-03 2022-01-28 Ermittlung einer bewertung eines datensatzes WO2022167345A1 (de)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202280013301.0A CN116848829A (zh) 2021-02-03 2022-01-28 确定数据集的评价
EP22705728.8A EP4260533A1 (de) 2021-02-03 2022-01-28 Ermittlung einer bewertung eines datensatzes
US18/263,996 US20240121234A1 (en) 2021-02-03 2022-01-28 Ascertaining an Evaluation of a Data Set

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102021200995.6 2021-02-03
DE102021200995.6A DE102021200995A1 (de) 2021-02-03 2021-02-03 Ermittlung einer Bewertung eines Datensatzes

Publications (1)

Publication Number Publication Date
WO2022167345A1 true WO2022167345A1 (de) 2022-08-11

Family

ID=80447114

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2022/052121 WO2022167345A1 (de) 2021-02-03 2022-01-28 Ermittlung einer bewertung eines datensatzes

Country Status (5)

Country Link
US (1) US20240121234A1 (de)
EP (1) EP4260533A1 (de)
CN (1) CN116848829A (de)
DE (1) DE102021200995A1 (de)
WO (1) WO2022167345A1 (de)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102016217191A1 (de) * 2016-09-09 2018-03-15 Audi Ag Verfahren zum Auswählen und Bewerten von einer Vielzahl von Datensätzen aus zumindest einer Datenquelle
WO2019006505A1 (en) * 2017-07-04 2019-01-10 GeoInt-SafeNet Pty Ltd SYSTEM AND METHOD FOR AUTOMATICALLY GENERATING SPECIFIC GEOGRAPHIC DATA
US20190129762A1 (en) * 2017-10-27 2019-05-02 International Business Machines Corporation Cognitive learning workflow execution
DE102019203205A1 (de) * 2019-03-08 2020-09-10 Audi Ag Verfahren zum Auswerten von Fahrzeugdaten sowie Fahrzeugdatenauswertesystem zum Durchführen eines derartigen Verfahrens

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160314185A1 (en) 2015-04-27 2016-10-27 Microsoft Technology Licensing, Llc Identifying events from aggregated device sensed physical data
US10706533B2 (en) 2016-05-13 2020-07-07 National Jewish Health Systems and methods for automatic detection and quantification of pathology using dynamic feature classification

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102016217191A1 (de) * 2016-09-09 2018-03-15 Audi Ag Verfahren zum Auswählen und Bewerten von einer Vielzahl von Datensätzen aus zumindest einer Datenquelle
WO2019006505A1 (en) * 2017-07-04 2019-01-10 GeoInt-SafeNet Pty Ltd SYSTEM AND METHOD FOR AUTOMATICALLY GENERATING SPECIFIC GEOGRAPHIC DATA
US20190129762A1 (en) * 2017-10-27 2019-05-02 International Business Machines Corporation Cognitive learning workflow execution
DE102019203205A1 (de) * 2019-03-08 2020-09-10 Audi Ag Verfahren zum Auswerten von Fahrzeugdaten sowie Fahrzeugdatenauswertesystem zum Durchführen eines derartigen Verfahrens

Also Published As

Publication number Publication date
US20240121234A1 (en) 2024-04-11
EP4260533A1 (de) 2023-10-18
CN116848829A (zh) 2023-10-03
DE102021200995A1 (de) 2022-08-04

Similar Documents

Publication Publication Date Title
WO2020148046A1 (de) Verfahren zur automatisierten erstellung eines an eine vorgegebene person gerichteten phishing-dokuments
DE10342594B4 (de) Verfahren und System zum Erfassen von Daten aus mehreren maschinell lesbaren Dokumenten
DE102016204506A1 (de) Fortdruckinspektion mit lokaler Optimierung
DE102019211672A1 (de) Trainingsverfahren für ein künstliches neuronales Netzwerk
DE69029004T2 (de) Unterschriftenprüfungsverfahren
DE10253174A9 (de) Vorrichtung zur Entwicklung und/oder Konfiguration eines Automatisierungssystems
DE102012223587A1 (de) Verfahren zum Testen einer Applikation
CH717006A2 (de) Verfahren zur Benutzeridentifikation.
WO2022167345A1 (de) Ermittlung einer bewertung eines datensatzes
DE202022104461U1 (de) Syntaxgeleitetes Erkennungssystem für mathematische Termini
EP3119035B1 (de) Verfahren zum überprüfen von netzwerkeinrichtungen und netzwerk
DE102020203514A1 (de) Verfahren zur Erzeugung von Trainingsdaten, Fahrzeug und Trainingssystem
DE102021201833A1 (de) Vorrichtung zur Verarbeitung von mindestens einem Eingangsdatensatz unter Verwendung eines neuronalen Netzes sowie Verfahren
DE69928320T2 (de) Verfahren und Vorrichtung zur Erkennung eines Musters auf einem präsentierten Gegenstand
WO2020164765A1 (de) Verfahren und system zur automatischen bewertung von errichterunternehmen für feuerlöschanlagen
WO2015052286A1 (de) Verfahren für eine elektronische auditierung
DE19721129C2 (de) Verfahren und Anordnung zur Datenübertragung zwischen Computern
DE4495111C2 (de) Verfahren zur Bestimmung einer Menge von charakteristischen Merkmalen im Rahmen einer Objekterkennung
DE102014016676A1 (de) Verfahren zur rechnergestützten Auswahl von Bewerbern aus einer Vielzahl von Bewerbern für ein vorgegebenes Anforderungsprofil
DE10110208A1 (de) Verfahren zum Spezifizieren, Ausführen und Analysieren von Verfahrensabläufen beim Erkennen
DE19635351C2 (de) Verfahren zur Formatkonvertierung
DE102021126065A1 (de) Verfahren und System zur Erzeugung und Anwendung eines Modells beim Konvertieren von Daten
DE102020215292A1 (de) Verfahren zum Hinterlegen von Programmdaten in einer Datenbank
DE102022213779A1 (de) Verfahren zum Erzeugen eines Bewertungswerts für eine Qualitätsprüfung für ein Bauteil mittels einer elektronischen Recheneinrichtung, Computerprogrammprodukt, computerlesbares Speichermedium sowie elektronische Recheneinrichtung
DE102022117160A1 (de) Computerimplementiertes Verfahren zum Konfigurieren eines virtuellen Testsystems und Trainingsverfahren

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22705728

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022705728

Country of ref document: EP

Effective date: 20230714

WWE Wipo information: entry into national phase

Ref document number: 18263996

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 202280013301.0

Country of ref document: CN

NENP Non-entry into the national phase

Ref country code: DE