WO2022167345A1

WO2022167345A1 - Ermittlung einer bewertung eines datensatzes

Info

Publication number: WO2022167345A1
Application number: PCT/EP2022/052121
Authority: WO
Inventors: Marco Kiehle; Markus Rascher
Original assignee: Siemens Aktiengesellschaft
Priority date: 2021-02-03
Filing date: 2022-01-28
Publication date: 2022-08-11
Also published as: US20240121234A1; EP4260533A1; CN116848829A; DE102021200995A1

Abstract

Die Erfindung betrifft die Ermittlung einer Bewertung BEW eines Datensatzes DS eines Datenpakets D. Dabei wird zur Bewertungsermittlung zunächst ein Datenmuster DSMUS im Datensatz DS identifiziert. In einem weiteren, hiervon unabhängigen Schritt wird ein Kontext DSKXT ermittelt, der bspw. die Hintergründe der Erzeugung des Datensatzes DS oder eine anvisierte Nutzung des Datensatzes DS beschreibt. Die zu ermittelnde Bewertung BEW hängt schließlich sowohl vom Datenmuster DSMUS als auch vom Kontext DSKXT ab.

Description

Beschreibung

Ermittlung einer Bewertung eines Datensatzes

Die Erfindung betri f ft die Ermittlung einer Bewertung eines Datensatzes eines Datenpakets , insbesondere basierend auf einer oder mehreren Charakteristiken des Datensatzes .

Mit zunehmender Konnektivität von Geräten, bspw . im Umfeld des „Internet-of-Things" ( loT ) , findet eine Daten- und/oder Werteverschiebung innerhalb von Unternehmen statt . Daten und Verbindungen werden über physikalische Grenzen sowie teils über Ländergrenzen hinweg gesendet bzw . aufgebaut , so dass auf den Daten basierende Aktivitäten und Leistungen gänzlich automatisiert und dabei auch lokal an anderen Orten erbracht werden können . Obwohl die Auswertung oder sonstige Weiterverwendung der trans ferierten Daten nicht selten vorgegebenen und/oder an sich bereits bewährten Prozessen folgt , werden derartige datenbasierte Aktionen nach wie vor häufig aufwändig von Hand und teilweise in nicht gleichbleibender Art und Weise ausgeführt . Dies führt zu wenig ef fi zienter sowie kaum reproduzierbarer und damit wenig verlässlicher Prozessaus führung .

Es ist daher eine Aufgabe der vorliegenden Erfindung, ein Verfahren sowie ein entsprechendes System vorzuschlagen, mit dem eine Bewertung eines von einer Datenquelle zur Verfügung gestellten Datensatzes automatisiert ermittelt werden kann, so dass schließlich basierend auf der so ermittelten Bewertung weiter gehende Maßnahmen in die Wege geleitet werden können .

Hierzu beschreibt diese Erfindung eine technische Lösung in Form eines computerimplementiertes Verfahrens , mit dessen Hil fe die Bewertung BEW von Daten reproduzierbar ermittelt werden kann . Das Verfahren dient dementsprechend zur Ermittlung einer solchen Bewertung BEW eines einem Client von einer Datenquelle bereit gestellten Datensatzes DS eines Datenpa- ketes D . Dabei wird das Datenpaket D in einem ersten Verfahrensschritt VI durch den Client dahingehend analysiert , dass eine zumindest eine Charakteristik umfassende Gruppe GCHAR von für den Datensatz DS typischen Charakteristiken CHAR_i mit i=l , ..., n und mit n>l bestimmt wird . In einem zweiten Verfahrensschritt V2 wird basierend auf der zumindest einen bestimmten Charakteristik die Bewertung BEW des Datensatzes DS mit Hil fe von entsprechenden, bereits vorliegenden Informationen aus der Vergangenheit ermittelt .

Zumindest eine der im ersten Verfahrensschritt VI zu ermittelnde Charakteristiken CHAR1 ist ein Datenmuster DSMUS . Der Datensatz DS wird im ersten Verfahrensschritt VI durch den Client , d . h . bspw . durch eine entsprechende auf einem Clientrechner implementierte Software , in einem Musteridenti fikationsverfahrensschritt V1_MUS des ersten Verfahrensschritts VI hinsichtlich des Vorliegens eines bestimmten Datenmusters DMUS_m aus einer Viel zahl von vorbekannten Datenmustern GDMUS mit dem Ziel analysiert , eines der vorbekannten Datenmuster DMUS_m im bereitgestellten Datensatz DS zu identi fi zieren, demnach resultierend im identi fi zierten Datenmuster DSMUS=DMUS_m . Datenmuster können bspw . Fehlercodes oder bestimmte zeitliche Verhalten innerhalb bestimmter Zeitfenster sein .

Das Datenpaket D umfasst den zu bewertenden Datensatz DS sowie zumindest einen Ausgangsparameter DA der Datenquelle . Zumindest eine der im ersten Verfahrensschritt VI zu ermittelnden Charakteristiken CHAR2 basiert auf einem Kontext DSKXT des Datensatzes DS , wobei der Kontext DSKXT in einem Schritt V1_SEL_KXT eines Selektionsverfahrensschritts V1_SEL des ersten Verfahrensschritts VI basierend auf dem zumindest einen Ausgangsparameter der Datenquelle ermittelt wird . Die Bewertung BEW des Datensatzes DS erfolgt hiermit im zweiten Verfahrensschritt V2 basierend auf dem identi fi zierten Datenmuster DSMUS und auf dem ermittelten Kontext DSKXT und kann dabei bspw . auch als diej enige Bewertung BEW ermittelt werden, die durch ein entsprechend trainiertes künstliches neuronales Netzwerk bei Zuspielung des Kontextes DSKXT und des Datenmusters DSMUS ausgegeben wird .

Für den Fall , dass das Datenpaket D den zu bewertenden Datensatz DS sowie zumindest einen Ausgangsparameter DA der Datenquelle umfasst , kann zumindest eine der im ersten Verfahrensschritt zu ermittelnden Charakteristiken CHAR2 eine geeignete Informationsquelle INFO_KXT zur Ermittlung der Bewertung BEW repräsentieren, welche eingerichtet ist , um einem Datenmuster DMUS_m eine Bewertung BEW zuzuordnen, wobei die geeignete Informationsquelle INFO_KXT in einem Schritt V1_SEL_INFO eines Selektionsverfahrensschritts V1_SEL des ersten Verfahrensschritts VI basierend auf dem zumindest einen Ausgangsparameter der Datenquelle ermittelt wird . Die Bewertung BEW des Datensatzes DS erfolgt dann im zweiten Verfahrensschritt V2 basierend auf dem zuvor identi fi zierten Datenmuster DSMUS und auf der ermittelten geeigneten Informationsquelle INFO_KXT und wird dabei als diej enige Bewertung BEW ermittelt , die durch die geeignete Informationsquelle INFO_KXT dem identi fizierten Datenmuster DSMUS zugeordnet wird . Dabei ist es grundsätzlich denkbar, dass mehrere Informationsquellen selektiert werden, so dass bei der Bewertungsermittlung mehr als eine Informationsquelle eingeht .

Im Selektionsverfahrensschritt V1_SEL des ersten Verfahrensschritts VI wird dabei zunächst im Schritt V1_SEL_KXT der Kontext DSKXT des Datensatzes DS anhand des zumindest einen Ausgangsparameters DA der Datenquelle ermittelt . Anschließend wird im Schritt V1_SEL_INFO in Abhängigkeit vom ermittelten Kontext DSKXT die zumindest eine geeignete Informationsquelle INFO_KXT ermittelt .

Die geeignete Informationsquelle INFO_KXT kann im Schritt V1_SEL_INFO basierend auf dem zumindest einen Ausgangsparameter und dabei ggf . basierend auf dem zuvor ermittelten Kontext DSKXT entweder aus einer vorgegebenen Gruppe GINFO von Informationsquellen INFO_q selektiert werden, wobei eine j eweilige Informationsquelle INFO_q der Gruppe GINFO einem oder mehreren der vorbekannten Datenmuster DMUS_m j eweils eine vorbestimmte Bewertung BEW zuordnet , oder aber anhand eines künstlichen neuronalen Netzwerks KNN25 ermittelt werden, welches eingerichtet und trainiert ist , um basierend auf einem dem Netzwerk KNN25 zugeführten Kontext DSKXT oder Ausgangsparameter DA eine geeignete Informationsquelle INFO_KXT aus zugeben .

Verschiedene Informationsquellen INFO_q können bspw . unterschiedliche Dateien sein, welche in einem entsprechenden Datenspeicher auf einem Server o . ä . abgelegt bzw . gespeichert sind, oder aber derartige unterschiedliche Dateien, welche auf verschiedenen Datenspeichern abgelegt sind . Die verschiedenen Datenspeicher können dabei von unterschiedlichen Betreibern zur Verfügung gestellt sein .

Einer der Ausgangsparameter DA kann bspw . eine Identität ID10 der Datenquelle sein, wobei die Identität ID10 der Datenquelle bestimmt wird, indem zunächst geprüft wird, ob die Datenquelle vertrauenswürdig ist , insbesondere anhand einer Iden- titätsprüfung mithil fe eines digitalen Zerti fikats , bspw . X . 509 . Bei vertrauenswürdiger Datenquelle , d . h . für den Fall , dass die Prüfung ergeben hat , dass die Datenquelle vertrauenswürdig ist , wird die Identität ID10 der Datenquelle basierend auf zentral , bspw . in einer Cloudumgebung, gespeicherten Informationen und/oder basierend auf von der Datenquelle übermittelten Informationen festgelegt .

Alternativ oder zusätzlich kann einer der Ausgangsparameter DA eine räumliche Herkunft LOCI O des Datensatzes sein, also bspw . ein Standort der Datenquelle , wobei die Herkunft LOCI O des Datensatzes basierend auf zentral gespeicherten Informationen und/oder basierend auf von der Datenquelle übermittelten Informationen, insbesondere Geotagging- Informationen, bestimmt wird .

Alternativ oder zusätzlich kann einer der Ausgangsparameter

DA eine vorgegebene Nutzung des Datensatzes oder ein konkre- ter vorgegebener Kontext DSKXT das Datensatzes sein, so dass sich die Ermittlung des Kontextes im Schritt V1_SEL_KXT auf ein Herauslesen des vorgegebenen Kontextes reduziert und damit eine höhere Sicherheit bzw . Verlässlichkeit der Bewertungsermittlung gegeben ist .

Mit anderen Worten handelt es sich also um ein computer implementiertes Verfahren zur Ermittlung einer Bewertung eines einem Client von einer Datenquelle nebst zumindest eines Ausgangsparameters DA der Datenquelle bereit gestellten Datensatzes DS . In einer möglichen Ausbildung wird im ersten Verfahrensschritt VI der Datensatz DS durch den Client im Musteridenti fikationsverfahrensschritt V1_MUS des Verfahrens selbst zunächst hinsichtlich des Vorliegens eines Datenmusters DSMUS aus einer Viel zahl von vorbekannten Datenmustern analysiert , um eines der vorbekannten Datenmuster im bereitgestellten Datensatz DS zu identi fi zieren . Im Selektionsverfahrensschritt V1_SEL wird außerdem anhand eines oder mehrerer Ausgangsparameter DA der Datenquelle der Kontext DSKXT des Datensatzes DS ermittelt . In Abhängigkeit vom ermittelten Kontext DSKXT wird zumindest eine geeignete Informationsquelle INFO_KXT aus einer vorgegebenen Gruppe von Informationsquellen selektiert , wobei eine j eweilige Informationsquelle der Gruppe einem oder mehreren der vorbekannten Datenmuster j eweils eine vorbestimmten Bewertung BEW zuordnet . Die eigentliche Bewertung BEW des Datensatzes DS wird schließlich basierend auf dem identi fi zierten Datenmuster DSMUS aus der selektierten Informationsquelle INFO_KXT als diej enige Bewertung BEW ermittelt , die dort dem identi fi zierten Datenmuster DSMUS zugeordnet ist .

Ein entsprechendes System zur Ermittlung einer Bewertung BEW eines einem Client des Systems von einer Datenquelle bereit gestellten Datensatzes eines Datenpaketes weist einen Datenanalysator auf , welcher eingerichtet ist , um das beschriebene Verfahren umfassend den ersten VI und den zweiten Verfahrensschritt aus zuführen . Der Datenanalysator kann ein künstliches neuronales Netzwerk aufweisen, welches eingerichtet und vortrainiert ist , um basierend auf dem ermittelten Datenmuster DSMUS und auf dem ermittelten Kontext DSKXT die Bewertung BEW des Datensatzes zu ermitteln .

Die mit dem System unter Verwendung des Verfahrens ermittelte Bewertung BEW kann bspw . Aufschluss darüber geben, inwieweit dem Datensatz DS im Datenpaket D vertraut werden kann und ob dieser verlässlich ist , so dass konsequenterweise verlässliche Entscheidungen getrof fen werden können .

Die Bewertung BEW des Datensatzes DS kann j e nach Kontext DSKXT unterschiedlicher Natur sein bzw . verschiedene Aspekte umfassen . Letztlich kann die ermittelte Bewertung BEW des Datensatzes DS bspw . als Maßstab für die Relevanz des Wertes bei einer bestimmten anvisierten Nutzung des bewerteten Datensatzes DS verstanden werden, bspw . zum Trainieren von künstlichen neuronalen Netzen, indem die Bewertung BEW zur Wichtung der Daten DS zum Trainieren des Netzwerkes eingesetzt wird, oder aber zur Bestimmung des Zustandes einer Industrieanlage sowie auch in gänzlich anderen Feldern wie bspw . für die Berechnung von Preisen, Kosten oder Steuern bei Trans fer des bewerteten Datensatzes .

Wiederum im Fall der Anwendung zum Trainieren eines KNN könnte die Bewertung BEW des Datensatzes DS dadurch bestimmt sein, wie repräsentativ der Datensatz DS für die spätere Anwendung des KNN ist . Das KNN ist für bestimmte Anwendungen vorgesehen, bspw . zur Erkennung bestimmter Gegenstände in einem Bild . Ein wertvoller Datensatz DS könnte in dem Fall ge- labelte Bilder umfassen, welche zumindest einige Gegenstände zeigen, die für die Anwendung von Interesse sind . Wenn die Bilder j edoch nur Gegenstände umfassen, die nicht von Interesse sind, so ist dies zum Trainieren des KNN nicht gänzlich wertlos , j edoch ist die Bewertung BEW geringer als beim Datensatz DS mit den erstgenannten Bildern . Ein Datensatz DS kann somit j e nach ermittelter Bewertung BEW beim Trainieren des KNN unterschiedlich gewichtet werden .

Im Fall der Anwendung der Bewertung BEW zur Bestimmung des Zustandes einer Industrieanlage wird der Datensatz DS analysiert und j e nach Ergebnis der Analyse , d . h . j e nach ermittelter Bewertung des Datensatzes DS , wird auf den Zustand der Anlage geschlossen, bspw . „normal" oder „fehlerhaft" . Eine Industrieanlage kann hier bspw . auch schon eine einzelne Maschine sein, die als Komponente einer IoT-Architektur arbeitet .

In einer weiter gehenden Anwendung kann bspw . ein Unternehmen eine Steuerbemessungsgrundlage von digital erbrachten Aktivitäten und Leistungen bilden und somit ein vorhandenes Steuerrisiko minimieren . In diesem Anwendungs fall der Bewertung BEW des Datensatzes DS als finanzieller Wert kann dieser Wert BEW bspw . dazu dienen, einen Preis zur Übertragung des Datensatzes DS von einem ersten an einen zweiten Nutzer festzusetzen, d . h . eine Art Kaufpreis , oder eventuell mit der Übertragung verbundene Steuerlasten zu bestimmen etc .

Im Folgenden werden die Erfindung und beispielhafte Aus führungs formen anhand von Zeichnungen näher erläutert . Dort werden ggf . gleiche Komponenten in verschiedenen Figuren durch gleiche Bezugs zeichen gekennzeichnet . Es ist daher möglich, dass sich bei der Beschreibung einer zweiten Figur zu einem bestimmten Bezugs zeichen, welches bereits im Zusammenhang mit einer anderen, ersten Figur erläutert wurde , keine näheren Erläuterungen finden . In einem solchen Fall kann bei der Ausführungs form der zweiten Figur davon ausgegangen werden, dass die dort mit diesem Bezugs zeichen gekennzeichnete Komponente auch ohne nähere Erläuterung im Zusammenhang mit der zweiten Figur die gleichen Eigenschaften und Funktionalitäten aufweist , wie im Zusammenhang mit der ersten Figur erläutert . Des Weiteren werden der Übersichtlichkeit wegen teilweise nicht sämtliche Bezugs zeichen in sämtlichen Figuren darge- stellt, sondern nur diejenigen, auf die in der Beschreibung der jeweiligen Figur Bezug genommen wird.

Es zeigen:

FIG 1 eine Architektur einer Datenquelle und eines Clients, zwischen denen ein Datenpaket übermittelt wird, FIG 2 eine schematische Darstellung des Verfahrens zur Ermittlung der Bewertung BEW.

Die FIG 1 zeigt exemplarisch und vereinfacht eine Situation, in der von einer Datenquelle 10 ein Datenpaket D={DA, DS } umfassend einen Datensatz DS sowie einen oder mehrere Ausgangsparameter DA an einen Client 20 übermittelt wird. Datenquelle 10 und Client 20 können sich dabei an verschiedenen Standorten SI, S2 befinden, bspw. in verschiedenen Ländern, so dass der Datentransfer möglicherweise auch über Ländergrenzen G hinweg erfolgt. Datenquelle 10 und Client 20 können bspw. jeweils als Datencenter, als Cloud-Dienst o.ä. ausgebildet sein.

Die Datenquelle 10 kann bspw. ein loT-Gerät 11 sowie weitere Quellgeräte 12 aufweisen, die jeweils Datenpakete D vom Standort S1 and den Client 20 am Standort S2 schicken, wo ein Nutzer (nicht separat dargestellt) , bspw. ein Operator, ein Service-Techniker, ein sonstiger Nutzer oder aber ein Kontrollsystem o.ä., das jeweilige bereitgestellte Datenpaket D aus der Ferne nutzt oder auswertet, bspw. um das loT-Gerät 10 zu überwachen, zu steuern, zu warten oder um die bereit gestellten Daten des Datenpakets D zu einem beliebigen Zweck weiter zu verarbeiten. Auch ist es bspw. möglich, basierend auf Informationen aus den Daten D Fernservice-Leistungen („remote services") oder prädiktive Instandhaltung („predictive maintenance") durchzuführen, wobei der genannte Nutzer entsprechend der anvisierten Nutzung der Datenpakete D gewählt und ausgebildet ist. Die bereitgestellten Datenpakete D werden am Standort S2 vom Client 20 empfangen . Der Client 20 ist erfindungsgemäß eingerichtet , um eine Bewertung BEW eines j eweiligen Datenpaketes D zu ermitteln . Bspw . für den Fall , dass die Datenpakete D in einem der vorstehend exemplarisch genannten weiteren Services verarbeitet werden sollen, in FIG 1 symbolisiert durch die optionale und daher mit gestrichelter Linie symbolisierte Funktion 22 , kann der Client 20 einen dementsprechend ebenfalls optionalen Datenbroker 21 aufweisen, der die vom Client 20 empfangenen Datenpakete D bzw . bspw . Kopien davon an einen Datenanalysator 23 umleitet , der die Ermittlung der Bewertung BEW aus führt . Der Datenbroker 21 kann bspw . in einen Reverse Proxy integriert sein . Für den Fall , dass neben der Ermittlung der Bewertung BEW der Datenpakete D keine weitere Verwendung der Datenpakete D vorgesehen ist , kann auf die Funktion 22 sowie auch auf den Datenbroker 21 verzichtet werden und die Datenpakete D gelangen nach Empfang durch den Client 20 direkt zum Datenanalysator 23 .

Das vom Datenanalysator 23 ausgeführte Verfahren zur Ermittlung der Bewertung BEW benötigt wie im Folgenden erläutert und in FIG 2 dargestellt neben dem im Datenpaket D enthaltenen Datensatz DS auch den oder die dort ebenfalls vorgesehenen Ausgangsparameter DA. Des Weiteren werden Informationen aus einer Muster-Datenbasis 24 sowie aus einer Informations- Datenbasis 25 benötigt , wobei die Muster-Datenbasis 24 und/oder die Informations-Datenbasis 25 in den Datenanalysator 23 integriert oder auch separat organisiert sein können, bspw . zentral in einer Cloud .

In einem ersten vom Datenanalysator 23 ausgeführten Verfahrensschritt VI wird das Datenpaket D zunächst dahingehend analysiert , dass eine Gruppe GCHAR von für das Datenpaket typischen Charakteristiken CHAR1 , ..., CHARn mit n>l bestimmt wird . Die Gruppe GCHAR umfasst demnach zumindest eine solche Charakteristik CHAR1 . Im Folgenden wird davon ausgegangen, dass die Gruppe GCHAR zwei Charakteristiken CHARI , CHAR2 umfasst .

Die erste Charakteristik CHAR1 ist hierbei ein im Datensatz DS erkennbares Muster DSMUS . Bei dem Muster DSMUS kann es sich bspw . um einen Fehlercode handeln oder aber um sonstige erkennbare Datenverhalten, bspw . bestimmte zeitliche Verhalten innerhalb eines j eweiligen Zeitfensters . Wenn also bspw . innerhalb eines bestimmten Zeitfensters Daten mit einem bestimmten Muster oder in bestimmter Reihenfolge übertragen werden, dann kann dies bspw . für einen bestimmten Servicefall repräsentativ sein und der Datensatz DS ist entsprechend zu bewerten .

In einer ersten, einfachen regelbasierten Variante zur Bestimmung bzw . Erkennung des Musters DSMUS wird der Datensatz DS des Datenpakets D in einem Musteridenti fikationsverfahrensschritt V1_MUS des ersten Verfahrensschritts VI hinsichtlich des Vorliegens eines bestimmten Datenmusters DMUS_m aus einer Viel zahl von vorbekannten Datenmustern GDMUS= { DMUS_1 , DMUS_2 , ..., DMUS_M } mit M>1 mit dem Ziel analysiert , eines der vorbekannten Datenmuster DMUS_m mit l<m<M aus GDMUS im be- reitgestellten Datensatz DS zu identi fi zieren, d . h . es wird festgestellt DSMUS=DMUS_m . In der ersten Variante sind die vorbekannten Datenmuster DMUS_m der Viel zahl GDMUS in der bereits erwähnten Muster-Datenbasis 24 gespeichert . Der zu analysierende Datensatz DS wird mit den vorbekannten Mustern aus GDMUS verglichen . Dasj enige Muster DMUS_m aus der Viel zahl der vorbekannten Muster GDMUS , welches dem Datensatz DS am ähnlichsten ist , wird als das zutref fende Muster DSMUS und damit als die erste Charakteristik CHARl=DSMUS=DMUS_m festgelegt .

In einer zweiten, flexibleren Variante zur Bestimmung bzw . Erkennung des Musters DSMUS im hier ebenfalls ausgeführten Musteridenti fikationsverfahrensschritt V1_MUS ist die Muster- Datenbasis 24 als vortrainiertes künstliches neuronales Netzwerk KNN24 ausgestaltet . Das Netzwerk KNN24 ist derart einge- richtet , dass es in einem ihm zugespielten zu analysierenden Datensatz DS ein Datenmuster DSMUS=DSMUSknn erkennt und dieses Muster DSMUS dem Datenanalysator 23 zur Verfügung stellt , so dass am Ende in der zweiten Variante CHARl=DSMUS=DSMUSknn gilt . Die Verwendung eines künstlichen neuronalen Netzwerkes KNN24 erlaubt die Ermittlung des Datenmusters DSMUS auch für bislang nicht bekannte Datenmuster im Datensatz DS .

Das Netzwerk KNN24 kann im Vorfeld in üblicher Weise trainiert sein, bspw . anhand von künstlichen oder realen Datensätzen DS , für die die darin vorkommenden Muster DSMUS bereits bekannt sind . Die Datensätze DS werden für das Training mit ihren j eweils bekannten Mustern DSMUS gelabelt und das Netzwerk KNN24 wird mit diesen gelabelten Datensätzen in an sich bekannter Weise trainiert .

Dies zusammenfassend liefert der erste Verfahrensschritt VI in seinem Musteridenti fikationsverfahrensschritt V1_MUS sowohl in der ersten als auch in der zweiten Variante die ersten Charakteristik CHAR1 , welche ein Datenmuster DSMUS im Datensatz DS repräsentiert .

Wie erwähnt liefert der erste Verfahrensschritt VI neben der ersten Charakteristik CHAR1 idealerweise auch eine zweite Charakteristik CHAR2 , welche in einem Selektionsverfahrensschritt V1_SEL des ersten Verfahrensschritts VI bestimmt wird . Die zweite Charakteristik CHAR2 ist hierbei eine vom Datenanalysator 23 zur Ermittlung der Bewertung BEW heranzuziehende Informationsquelle INFO, d . h . CHAR2=INFO .

Um diese Informationsquelle INFO zu identi fi zieren, wird im Selektionsverfahrensschritt V1_SEL zunächst in einem Schritt V1_SEL_KXT ein Kontext DSKXT des Datensatzes DS bestimmt , wobei dieser Kontext DSKXT anhand des zumindest einen Ausgangsparameters DA des Datenpakets D ermittelt wird . Der Kontext DSKXT kann bspw . eine vom Client 20 anvisierte oder eine von der Datenquelle 10 vorgegebene Nutzung des Datensatzes DS sein und/oder bspw . die Hintergründe der Erzeugung des Daten- satzes DS beschreiben . Wenn bspw . die Datenquelle 10 ein Kernkraftwerk ist und der Datensatz DS aktuelle Betriebsparameter des Kraftwerks repräsentiert , könnte der Kontext DSKXT die Betriebssicherheit des Kraftwerks sein und die Bewertung BEW ist ein Maß für die Verlässlichkeit der übertragenen Daten DS . Im eingangs erwähnten Anwendungs fall der Steuerermittlung würde der Kontext DSKXT eben diese Anwendung sein und die Bewertung wäre ein finanzieller Wert des Datensatzes DS .

Der oder die Ausgangsparameter DA des Datenpakets D können bspw . Metadaten bzgl . der Erzeugung und/oder bzgl . einer vorgesehenen Nutzung oder Auswertung des Datensatzes DS beim Client 20 sein und dementsprechend durch die Datenquelle 10 vor Übermittlung an den Client 20 in das Datenpaket D geschrieben werden . Bspw . kann einer der ggf . mehreren Ausgangsparameter DA zur Ermittlung des Kontextes DSKXT eine Identität ID10 der Datenquelle 10 repräsentieren, wobei die Identität ID10 im Schritt V1_SEL_KXT bestimmt wird, indem zunächst geprüft wird, ob die Datenquelle 10 vertrauenswürdig ist , bspw . mittels einer Identitätsprüfung anhand eines digitalen Zerti fikats , bspw . X . 509 . Bei vertrauenswürdiger Datenquelle 10 , d . h . für den Fall , dass die Prüfung ergeben hat , dass die Datenquelle 10 vertrauenswürdig ist , wird die Identität ID10 der Datenquelle 10 basierend auf bspw . zentral in einer Cloud o . ä . gespeicherten Informationen und/oder basierend auf von der Datenquelle 10 übermittelten Informationen ermittelt .

Zusätzlich oder alternativ kann einer der ggf . mehreren Ausgangsparameter DA zur Ermittlung des Kontextes DSKXT eine räumliche Herkunft LOC10 des Datensatzes 10 sein, also bspw . der Standort S 1 der Datenquelle 10 , wobei die Herkunft des Datensatzes DS im Schritt V1_SEL_KXT wiederum basierend auf zentral gespeicherten Informationen und/oder basierend auf von der Datenquelle 10 übermittelten Informationen, bspw . Ge- otagging- Informationen, bestimmt werden kann . Bei Kenntnis der Identität ID10 und/oder der Herkunft LOCI O kann bspw . aus einer entsprechenden Zuordnungstabelle , die verschiedenen Kombinationen aus ID10 und/oder LOCI O j eweils einen Kontext zuordnet , der dieser Situation LOCI O , ID10 entsprechende Kontext DSKXT herausgelesen werden .

Des Weiteren kann ebenfalls zusätzlich oder alternativ einer der ggf . mehreren Ausgangsparameter DA eine von der Datenquelle 10 konkret vorgegebene Nutzung des Datensatzes DS sein . Ebenfalls ist es denkbar, dass der oder die Ausgangsparameter DA bereits den heranzuziehenden Kontext DSKXT selbst umfassen .

Basierend auf dem so im Schritt V1_SEL_KXT in Abhängigkeit von Identität ID10 und/oder Standort LOCI O der Datenquelle 10 und/oder ggf . weiteren in den Ausgangsparametern DA enthaltenen Informationen ermittelten Kontext DSKXT des Datensatzes DS wird in einem daran anschließenden Schritt V1_SEL_INFO des Selektionsverfahrensschritts V1_SEL die zur Ermittlung der Bewertung BEW geeignete Informationsquelle INFO=INFO_KXT selektiert .

In einer ersten, einfachen regelbasierten Variante zur Auswahl der Informationsquelle INFO_KXT basierend auf dem Kontext DSKXT wird die geeignete Informationsquelle INFO_KXT aus einer vorhandenen Gruppe GINFO= { INFO_1 , INFO_2 , ..., INFO_Q } von Informationsquellen INFO_q mit l<q<Q und Q>1 selektiert . Eine j eweilige Informationsquelle INFO_q der Gruppe GINFO ordnet zumindest einem, typischerweise aber einer Viel zahl der vorbekannten Datenmuster DMUS_m j eweils eine vorbestimmte Bewertung BEW zu . Dabei ist es durchaus denkbar, dass verschiedene Informationsquellen INFO_ql , INFO_q2 demselben Datenmuster, bspw . DMUS_1 , verschiedene Bewertungen BEW1 , BEW1 zuordnen, was in der Konsequenz bedeutet , dass für das selbe Datenmuster DMUS_1 j e nach Kontext unterschiedliche Bewertungen BEW1 , BEW2 ermittelt werden könnten . Verschiedene Informationsquellen INFO_q können bspw . unterschiedliche Dateien sein, welche in einem entsprechenden Datenspeicher auf einem Server o . ä . abgelegt bzw . gespeichert sind, oder aber derartige unterschiedliche Dateien, welche auf verschiedenen Datenspeichern abgelegt sind . Die verschiedenen Datenspeicher können dabei von unterschiedlichen Betreibern zur Verfügung gestellt sein .

Die vorbekannten Informationsquellen sind INFO_q in der bereits erwähnten Informations-Datenbasis 25 gespeichert , wobei die Informations-Datenbasis 25 in dieser ersten Variante j edem denkbaren Kontext eine der Informationsquellen INFO_q zuordnet , bspw . in Form einer Tabelle , bspw . ein sog . „look-up- table" LUT . Demnach liefert die Informations-Datenbasis 25 dem Datenanalysator 23 bei Zuspielung des ermittelten Kontextes DSKXT eine bestimmte zur Ermittlung der Bewertung BEW geeignete Informationsquelle INFO_KXT mit 1<KXT<Q aus der Vielzahl von Informationsquellen INFO_q . In dieser ersten Variante ist die Informations-Datenbasis 25 basierend auf Erfahrungen aus der Vergangenheit aufgebaut , d . h . bspw . basierend auf früheren Zuordnungen von geeigneten Informationsquellen zu bestimmten Kontexten .

In einer zweiten, flexibleren Variante zur Auswahl der Informationsquelle INFO_KXT basierend auf dem Kontext DSKXT im Schritt V1_SEL_INFO ist die Informations-Datenbasis 25 als vortrainiertes künstliches neuronales Netzwerk KNN25 ausgestaltet . Das Netzwerk KNN25 ist derart eingerichtet , dass es für einen ihm zugespielten Kontext DSKXT eine geeignete Informationsquelle INFO_KXT ermittelt und diese dem Datenanalysator 23 zur Verfügung stellt , so dass am Ende gilt CHAR2=INFO_KXT . Die Verwendung des künstlichen neuronalen Netzwerkes KNN25 anstelle der Tabelle LUT erlaubt die Ermittlung einer geeigneten Informationsquelle INFO_KXT auch für bislang nicht bekannte Kontexte DSKXT .

Auch das Netzwerk KNN25 kann im Vorfeld in üblicher Weise trainiert sein, bspw . anhand von künstlichen oder realen Kontexten, für die bekannt ist , welche Informationsquelle am besten geeignet ist , um schließlich die Bewertung BEW zu er- mitteln . Die Kontexte werden für das Training mit einer geeigneten Informationsquelle gelabelt und das Netzwerk KNN25 wird mit diesen gelabelten Kontexten in an sich bekannter Weise trainiert .

Zusammenfassend liefert also der erste Verfahrensschritt VI eine erste Charakteristik CHAR1=DSMUS sowie eine zweite Charakteristik CHAR2=INFO_KXT . Der Musteridenti fikationsverfahrensschritt V1_MUS zur Bestimmung von CHAR1 und der Selektionsverfahrensschritt V1_SEL zur Bestimmung von CHAR2 können im ersten Verfahrensschritt VI gleichzeitig oder aber in beliebiger Reihenfolge nacheinander ausgeführt werden . Lediglich die Schritte V1_SEL_KXT und V1_SEL_INFO des Selektionsverfahrensschritts V1_SEL müssen zwingend nacheinander ausgeführt werden, da der Schritt V1_SEL_INFO das Resultat des Schrittes V1_SEL_KXT benötigt .

In einem sich an den ersten Verfahrensschritt VI anschließenden zweiten vom Datenanalysator 23 ausgeführten Verfahrensschritt V2 wird basierend auf den Charakteristiken CHAR1=DSMUS und CHAR2=INFO_KXT die endgültige Bewertung BEW des Datensatzes DS mit Hil fe von in der selektierten Informationsquelle INFO_KXT bereits vorliegenden Informationen aus der Vergangenheit ermittelt . Konkret wird in der selektierten Informationsquelle INFO_KXT die dem Muster DSMUS zugeordnete Bewertung BEW identi fi ziert und dem zu bewertenden Datensatz DS als Bewertung zugeordnet .

Auch an dieser Stelle sind zwei Varianten zum Ermitteln der Bewertung BEW denkbar . In einer ersten, einfachen Variante ist in einer j eweiligen Informationsquelle INFO_q wie oben bereits beschrieben einem j eden Datenmuster DMUS_m j eweils eine vorbestimmte Bewertung BEW zugeordnet , bspw . in Form einer entsprechenden Tabelle . In einer zweiten, flexibleren Variante ist auch hier der Einsatz eines künstlichen neuronalen Netzwerks KNN denkbar, welches basierend auf ihm zugespielten Datenmuster DSMUS und Informationsquelle INFO_KXT oder, al- ternativ hierzu, basierend auf ihm zugespielten Datenmuster DSMUS und Kontext DSKXT die Bewertung BEW ermittelt .

Das Verfahren zur Ermittlung der Bewertung BEW des Datensatzes DS geht also davon aus , dass die Bewertung BEW vom Kontext DSKXT sowie vom Muster DSMUS des Datensatzes DS des Datenpakets D abhängt .

Der Datenanalysator 23 kann in einer flexibleren Ausgestaltung als künstliches neuronales Netzwerk KNN23 ausgestaltet sein, so dass einige oder sogar alle der oben beschriebenen Einzelschritte VI , V1_MUS , V1JSEL, V1_SEL_KXT , V1_SEL_INFO und/oder V2 nicht mehr separat als Einzelschritte ausgeführt werden, sondern in einer gemeinsamen vom KNN23 ausgeführten Berechnung abgebildet sind . Insbesondere für den Schritt V1_MUS ist es vorteilhaft , ihn wie bereits beschrieben mit Hil fe des Netzwerks KNN24 aus zuführen, da nicht aus zuschließen ist , dass das Muster DSMUS im Datensatz DS nicht immer ohne weiteres klar erkennbar ist . In solchen Fällen kann eine Nutzung eines künstlichen neuronalen Netzwerkes hil freich sein . Auch für den Selektionsverfahrensschritt V1_SEL umfassend die Teilschritte V1_SEL_KXT und V1_SEL_INFO kann die Nutzung eines künstlichen neuronalen Netzwerkes vorteilhaft sein, welches allein basierend auf dem oder den Ausgangsparametern DA die geeignete Informationsquelle INFO_KXT bestimmt , ohne den Zwischenschritt zur Ermittlung des Kontextes DSKXT separat aus führen zu müssen . In der umfassendsten Ausgestaltung, in der KNN23 VI und V2 inklusive der j eweiligen Teilschritte V1_MUS und V1_SEL vollständig abbildet , benötigt KNN23 als Eingangsdaten den Datensatz DS sowie die Ausgangsparameter DA, um die Bewertung BEW zu ermitteln . Das Trainieren eines entsprechend ausgebildeten künstlichen neuronalen Netzwerkes , welches die j eweils anvisierten Schritte oder Teilschritte aus führt , kann wie oben bereits für KNN24 und KNN25 beschrieben erfolgen und orientiert sich grundsätzlich an den an sich bekannten Ansätzen zum Trainieren von künstlichen neuronalen Netzen . Technische Anwendungs fälle für das hier vorgestellte Verfahren zur Ermittlung der Bewertung BEW eines Datensatzes DS bzw . für die weitere Verwendung der Bewertung BEW selbst wurden oben bereits genannt . Eine weiter gehende Verwendung er- öf fnet sich darin, dass die Bewertung BEW tatsächlich einen finanziellen Wert des Datensatzes bzw . des Datenpakets D darstellt . Diese Anwendung ist insbesondere dann von Vorteil , wenn das Datenpaket D über die angedeutete Ländergrenze G hinweg übermittelt wird, so dass eine Versteuerung basierend auf dem Wert der Daten notwendig wird . Das vorgeschlagene

Verfahren ermöglicht eine automatisierte und damit zum Einen reproduzierbare und zum Anderen ef fi ziente Wertermittlung in derartigen S zenarien .

Claims

Patentansprüche

1 . Computerimplementiertes Verfahren zur Ermittlung einer Bewertung BEW eines einem Client ( 20 ) von einer Datenquelle

( 10 ) bereit gestellten Datensatzes DS eines Datenpaketes D, wobei

- das Datenpaket D in einem ersten Verfahrensschritt VI durch den Client ( 20 ) dahingehend analysiert wird, dass eine zumindest eine Charakteristik CHAR_i umfassende Gruppe GCHAR von für das Datenpaket DS typischen Charakteristiken CHAR_i mit i=l , ..., n und mit n>l bestimmt wird,

- in einem zweiten Verfahrensschritt V2 basierend auf der zumindest einen bestimmten Charakteristik CHARI , CHAR2 die Bewertung BEW des Datensatzes DS mit Hil fe von bereits vorliegenden Informationen ermittelt wird .

2 . Verfahren nach Anspruch 1 , dadurch gekennzeichnet , dass zumindest eine der im ersten Verfahrensschritt VI zu ermittelnde Charakteristiken CHAR1 ein Datenmuster DSMUS ist , wobei der Datensatz DS im ersten Verfahrensschritt VI durch den Client ( 20 ) in einem Musteridenti fikationsverfahrensschritt V1_MUS des ersten Verfahrensschritts VI hinsichtlich des Vorliegens eines bestimmten Datenmusters DMUS_m aus einer Vielzahl von vorbekannten Datenmustern GDMUS mit dem Ziel analysiert wird, eines der vorbekannten Datenmuster DMUS_m im Datensatz DS zu identi fi zieren .

3 . Verfahren nach Anspruch 2 , dadurch gekennzeichnet , dass das Datenpaket D den zu bewertenden Datensatz DS sowie zumindest einen Ausgangsparameter DA der Datenquelle ( 10 ) umfasst , wobei

- zumindest eine der im ersten Verfahrensschritt VI zu ermittelnden Charakteristiken CHAR2 auf einem Kontext DSKXT des Datensatzes DS basiert , wobei der Kontext DSKXT in einem Schritt V1_SEL_KXT eines Selektionsverfahrensschritts V1_SEL des ersten Verfahrensschritts VI basierend auf dem zumindest einen Ausgangsparameter DA der Datenquelle ( 10 ) ermittelt wird, und - die Bewertung BEW des Datensatzes DS im zweiten Verfahrensschritt V2 basierend auf dem identi fi zierten Datenmuster DSMUS und auf dem ermittelten Kontext DSKXT erfolgt .

4 . Verfahren nach Anspruch 2 , dadurch gekennzeichnet , dass das Datenpaket D den zu bewertenden Datensatz DS sowie zumindest einen Ausgangsparameter DA der Datenquelle ( 10 ) umfasst , wobei

- zumindest eine der im ersten Verfahrensschritt VI zu ermittelnden Charakteristiken CHAR2 eine geeignete Informationsquelle INFO_KXT zur Ermittlung der Bewertung BEW repräsentiert , welche eingerichtet ist , um einem Datenmuster DMUS_m eine Bewertung BEW zuzuordnen, wobei die geeignete Informationsquelle INFO_KXT in einem Schritt V1_SEL_INFO eines Selektionsverfahrensschritts V1_SEL des ersten Verfahrensschritts VI basierend auf dem zumindest einen Ausgangsparameter DA der Datenquelle ( 10 ) ermittelt wird,

- die Bewertung BEW des Datensatzes DS im zweiten Verfahrensschritt V2 basierend auf dem identi fi zierten Datenmuster DSMUS und auf der ermittelten geeigneten Informationsquelle INFO_KXT erfolgt .

5. Verfahren nach Anspruch 3 und Anspruch 4 , dadurch gekennzeichnet , dass im Selektionsverfahrensschritt V1_SEL des ersten Verfahrensschritts VI

- zunächst im Schritt V1_SEL_KXT der Kontext DSKXT des Datensatzes DS anhand des zumindest einen Ausgangsparameters DA der Datenquelle ( 10 ) ermittelt wird und

- anschließend im Schritt V1_SEL_INFO in Abhängigkeit vom ermittelten Kontext DSKXT die zumindest eine geeignete Informationsquelle INFO_KXT ermittelt wird .

6. Verfahren nach einem der Ansprüche 4 bis 5 , dadurch gekennzeichnet , dass die geeignete Informationsquelle INFO_KXT im Schritt V1_SEL_INFO basierend auf dem zumindest einen Ausgangsparameter DA

- aus einer vorgegebenen Gruppe GINFO von Informationsquellen INFO_q selektiert wird, wobei eine j eweilige Informations- quelle INFO_q der Gruppe GINFO einem oder mehreren der vorbekannten Datenmuster DMUS_m jeweils eine vorbestimmte Bewertung BEW zuordnet, oder

- anhand eines künstlichen neuronalen Netzwerks KNN25 ermittelt wird, welches eingerichtet und trainiert ist, um basierend auf einem dem Netzwerk KNN25 zugeführten Kontext DSKXT oder Ausgangsparameter DA eine geeignete Informationsquelle INFO_KXT auszugeben.

7. Verfahren nach einem der Ansprüche 3 bis 6, dadurch gekennzeichnet, dass einer der Ausgangsparameter DA eine Identität ID10 der Datenquelle (10) ist, wobei die Identität ID10 der Datenquelle (10) bestimmt wird, indem

- zunächst geprüft wird, ob die Datenquelle (10) vertrauenswürdig ist, insbesondere anhand einer Identitätsprüfung mittels eines digitalen Zertifikats,

- bei vertrauenswürdiger Datenquelle (10) die Identität der Datenquelle (10) basierend auf zentral gespeicherten Informationen und/oder basierend auf von der Datenquelle (10) übermittelten Informationen ermittelt wird.

8. Verfahren nach einem der Ansprüche 3 bis 7, dadurch gekennzeichnet, dass einer der Ausgangsparameter DA eine räumliche Herkunft LOC10 des Datensatzes DS ist, wobei die Herkunft LOC10 des Datensatzes DS basierend auf zentral gespeicherten Informationen und/oder basierend auf von der Datenquelle (10) übermittelten Informationen, insbesondere Geotag- ging-Informationen, bestimmt wird.

9. Verfahren nach einem der Ansprüche 3 bis 8, dadurch gekennzeichnet, dass einer der Ausgangsparameter DA eine vorgegebene Nutzung des Datensatzes DS oder ein konkreter vorgegebener Kontext DSKXT das Datensatzes DS ist.

10. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die ermittelte Bewertung BEW einen finanziellen Wert des Datenpakets DS darstellt. 21

11. System zur Ermittlung einer Bewertung BEW eines einem Client (20) des Systems bereit gestellten Datensatzes DS eines Datenpaketes D, aufweisend einen Datenanalysator (23) , welcher eingerichtet ist, um das Verfahren gemäß einem der Ansprüche 1 bis 10 umfassend den ersten VI und den zweiten Verfahrensschritt auszuführen.

12. System nach Anspruch 11, dadurch gekennzeichnet, dass der Datenanalysator (23) eingerichtet ist, um das Verfahren gemäß den Ansprüchen 2 und 3 auszuführen, wobei der Datenanalysator

(23) ein künstliches neuronales Netzwerk aufweist, welches eingerichtet ist, um basierend auf dem ermittelten Datenmus- ter DSMUS und auf dem ermittelten Kontext DSKXT die Bewertung BEW des Datensatzes DS zu ermitteln.