DE102014211140A1 - Computersystem und Verfahren zum Analysieren von Daten - Google Patents

Computersystem und Verfahren zum Analysieren von Daten Download PDF

Info

Publication number
DE102014211140A1
DE102014211140A1 DE102014211140.4A DE102014211140A DE102014211140A1 DE 102014211140 A1 DE102014211140 A1 DE 102014211140A1 DE 102014211140 A DE102014211140 A DE 102014211140A DE 102014211140 A1 DE102014211140 A1 DE 102014211140A1
Authority
DE
Germany
Prior art keywords
data
local
central
computer network
data mining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE102014211140.4A
Other languages
English (en)
Inventor
Thomas Blum
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens Healthcare GmbH
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE102014211140.4A priority Critical patent/DE102014211140A1/de
Priority to CN201510316253.4A priority patent/CN105279366B/zh
Priority to KR1020150082483A priority patent/KR20150143341A/ko
Priority to US14/736,728 priority patent/US20150363472A1/en
Publication of DE102014211140A1 publication Critical patent/DE102014211140A1/de
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Abstract

Die vorliegende Erfindung betrifft ein Computersystem (100) zum Analysieren von Daten, mit einem lokalen Computernetz (101-1) zum Speichern von Rohdaten, das eine lokale Data-Mining-Einheit (103-1) zum Erzeugen von lokalen Analysedaten mittels einer statistischen Analyse auf Basis der Rohdaten umfasst; und einem zentralen Computernetz (101-2) zum Empfangen der lokalen Analysedaten aus dem lokalen Computernetz (101-1), das eine zentrale Data-Mining-Einheit (103-2) zum Erzeugen von zentralen Analysedaten mittels einer statistischen Analyse auf Basis der lokalen Analysedaten umfasst.

Description

  • Die vorliegende Erfindung betrifft ein Computersystem zum Analysieren von Daten und ein Verfahren zum Analysieren von Daten.
  • Die statistische Analyse von Daten, auch Data-Mining genannt, gewinnt in den letzten Jahren in allen Bereichen der Informationstechnologie immer mehr an Bedeutung. Im medizinischen Umfeld ist es dabei oftmals das Ziel, die vorhandenen Daten zu analysieren, um daraus einen Mehrwert für einen Patienten zu erzeugen, wie beispielsweise eine verbesserte und schnelle Diagnose. Zudem können mittels der statischen Analyse wertvolle Informationen für einen verantwortlichen Arzt oder eine Krankenhausorganisation gewonnen werden, wie beispielsweise optimierte Untersuchungsverfahren. Ein Hersteller der medizinischen Geräte kann diese Informationen verwenden, um einen vorausschauenden Geräteservice anzubieten.
  • Ein Problem bei der statistischen Analyse ist die Verfügbarkeit der Daten. Gerade im medizinischen Bereich sind patientenbezogene Daten sensitiv und bedingen einen besonderen Schutz gegen Missbrauch. Auch nicht-patientenbezogene Daten, wie beispielsweise System-Verwendungsdaten oder Untersuchungszeiten, weisen eine hohe Sensibilität auf, so dass diese ebenfalls geschützt werden sollten. Sobald diese Daten ein internes, lokales Computernetz verlassen, unterliegen diese Daten einer eingeschränkten Kontrolle, so dass eine erforderliche Datensicherheit oft nicht gewährleistet werden kann.
  • Daher haben viele Organisationen entschieden, die sensitiven Daten ausschließlich innerhalb ihrer eigenen lokalen Computernetzes zu speichern und zu analysieren. Diese Ablehnung der Verteilung der Rohdaten, wie beispielsweise Patientenbilder, Diagnosen oder System-Verwendungsdaten, weiterzugeben, führt zu Einschränkungen bei der statistischen Datenanalyse oder verhindert eine statistische Datenanalyse vollständig.
  • Dem Problem der mangelnden Datensicherheit und der mangelnden Bereitschaft der Anwender, Rohdaten bereitzustellen, wird gegenwärtig mit Hilfe von Verträgen, Datenverschlüsselungen und Datenanonymisierungen begegnet. Trotz dieser Maßnahmen wird ein Verteilen, ein externes Speichern und ein Analysieren dieser Rohdaten von vielen Organisationen nach wie vor abgelehnt.
  • Ein weiteres Problem einer ausschließlich zentralen Analyse der Daten ist, dass diese technisch aufwändig ist und große Datenmengen an eine zentrale Instanz übermittelt werden. Die zentrale Instanz muss zudem hohe Bandbreiten und Verarbeitungsressourcen bereitstellen, um die Daten überhaupt verarbeiten zu können.
  • Es ist die der Erfindung zugrundeliegende Aufgabe, ein Computersystem und Verfahren zum Analysieren von Daten anzugeben, bei dem eine Datenmenge verringert wird, die zwischen einem lokalen Computernetz und einem zentralen Computernetz übertragen wird.
  • Diese Aufgabe wird durch Gegenstände mit den Merkmalen nach den unabhängigen Ansprüchen gelöst. Vorteilhafte Ausführungsformen der Erfindung sind Gegenstand der Figuren, der Beschreibung und der abhängigen Ansprüche.
  • Gemäß einem ersten Aspekt der Erfindung wird die Aufgabe durch ein Computersystem zum Analysieren von Daten gelöst, mit einem lokalen Computernetz zum Speichern von Rohdaten, das eine lokale Data-Mining-Einheit zum Erzeugen von lokalen Analysedaten mittels einer statistischen Analyse auf Basis der Rohdaten umfasst; und einem zentralen Computernetz zum Empfangen der lokalen Analysedaten aus dem lokalen Computernetz, das eine zentrale Data-Mining-Einheit zum Erzeugen von zentralen Analysedaten mittels einer statistischen Analyse auf Basis der lokalen Analysedaten umfasst. Dadurch wird beispielsweise der technische Effekt erreicht, dass die Data-Mining-Analyse in einen lokalen Anteil und einen zentralen Anteil aufgeteilt wird. Durch die lokale statistische Analyse verringert sich die Datenmenge der lokalen Analysedaten gegenüber der Datenmenge der Rohdaten. Die lokalen Analysedaten können schneller an das zentrale Computernetz übertragen werden als die Rohdaten. Dadurch werden die Übertragungsressourcen effizienter verwendet. Zudem kann durch ein Aufteilen der statistischen Analyse die Datensicherheit verbessert werden. Insbesondere können die Rohdaten lokal mit geringem technischem Aufwand analysiert werden und verlassen das interne lokale Computernetz nicht. Das zentrale Computernetz kann die lokalen Analysedaten wiederum mit geringem technischen Aufwand weiterverarbeiten.
  • In einer vorteilhaften Ausführungsform des Computersystems umfasst das lokale Computernetz einen Datenspeicher zum Speichern der lokalen Analysedaten. Dadurch wird beispielsweise der technische Vorteil erreicht, dass die lokalen Analysedaten gesammelt und zwischengespeichert werden können, bevor diese an das zentralen Computernetz übertragen werden.
  • In einer weiteren vorteilhaften Ausführungsform des Computersystems umfasst das zentrale Computernetz einen Datenspeicher zum Speichern der zentralen Analysedaten. Dadurch wird beispielsweise der technische Vorteil erreicht, dass die zentralen Analysedaten gespeichert werden und weiter ausgewertet werden können.
  • In einer weiteren vorteilhaften Ausführungsform des Computersystems umfasst die lokale Data-Mining-Einheit zumindest einen ersetzbaren Data-Mining-Agenten zum Durchführen der statistischen Analyse. Dadurch wird beispielsweise der technische Vorteil erreicht, dass der Data-Mining-Agent aktualisiert und an neue Fragestellungen angepasst werden kann. Durch lassen sich die Rohdaten in einer flexiblen Weise auswerten.
  • In einer weiteren vorteilhaften Ausführungsform des Computersystems ist der Data-Mining-Agent durch das zentrale Computernetz ersetzbar. Dadurch wird beispielsweise der technische Vorteil erreicht, dass die lokalen Analysedaten je nach Fragestellung beim zentralen Data-Mining gewonnen werden können.
  • In einer weiteren vorteilhaften Ausführungsform des Computersystems umfasst das zentrale Computernetz einen Agentenspeicher, in dem mehrere Data-Mining-Agenten gespeichert sind. Dadurch wird beispielsweise der technische Vorteil erreicht, dass eine Mehrzahl von Data-Mining Agenten bereitgehalten wird, die je nach Anforderung an die lokale Data-Mining Einheit übertragen werden können.
  • In einer weiteren vorteilhaften Ausführungsform des Computersystems umfasst die lokale Data-Mining-Einheit zumindest einen konfigurierbaren Data-Mining-Agenten zum Durchführen der statistischen Analyse. Dadurch wird beispielsweise der technische Vorteil erreicht, dass der Data-Mining-Agent an unterschiedliche Aufgaben anpassbar ist, ohne vollständig neu übermittelt zu werden. Dadurch kann ein Übertragungsvolumen gesenkt werden.
  • In einer weiteren vorteilhaften Ausführungsform des Computersystems ist der Data-Mining-Agent durch das zentrale Computernetz konfigurierbar. Dadurch wird beispielsweise der technische Vorteil erreicht, dass die Data-Mining-Agenten auf technisch einfache Weise von der zentralen Data-mining-Einheit gesteuert und angepasst werden können.
  • In einer weiteren vorteilhaften Ausführungsform des Computersystems ist das zentrale Computernetz ausgebildet, die zentralen Analysedaten an das lokale Computernetz zu übermitteln. Dadurch wird beispielsweise der technische Vorteil erreicht, dass die zentralen Analysedaten durch das lokale Computersystem weiter ausgewertet werden können.
  • In einer weiteren vorteilhaften Ausführungsform des Computersystems ist das lokale Computernetz ausgebildet, die lokalen Analysedaten in Abhängigkeit der übermittelten zentralen Analysedaten zu erzeugen. Dadurch wird der technische Vorteil erreicht, dass das lokale Data-Mining in Abhängigkeit von den zentralen Analysedaten verändert und / oder optimiert werden kann.
  • Gemäß einem zweiten Aspekt der Erfindung wird die Aufgabe durch ein Verfahren zum Analysieren von Daten gelöst, mit den Schritten eines Speicherns der Rohdaten in einem lokalen Computernetz; eines Erzeugens von lokalen Analysedaten mittels einer statistischen Analyse auf Basis der Rohdaten durch eine lokale Data-Mining-Einheit in dem lokalen Computernetz; eines Übermittelns der lokalen Analysedaten an ein zentrales Computernetz; und eines Erzeugens von zentralen Analysedaten mittels einer statistischen Analyse auf Basis der lokalen Analysedaten durch eine zentrale Data-Mining-Einheit in dem zentralen Computernetz. Dadurch werden die gleichen technischen Vorteile wie durch das Computersystem nach dem ersten Aspekt erreicht.
  • In einer vorteilhaften Ausführungsform des Verfahrens umfasst das Verfahren den Schritt eines Ersetzens eines Data-Mining-Agenten der lokalen Data-Mining-Einheit durch das zentrale Computernetz. Dadurch wird beispielsweise ebenfalls der technische Vorteil erreicht, dass der Data-Mining-Agent aktualisiert und an neue Fragestellungen angepasst werden kann. Durch lassen sich die Rohdaten in einer flexiblen Weise auswerten.
  • In einer weiteren vorteilhaften Ausführungsform des Verfahrens umfasst das Verfahren den Schritt eines Konfigurierens eines Data-Mining-Agenten der lokalen Data-Mining-Einheit durch das zentrale Computernetz. Dadurch wird beispielsweise ebenfalls der technische Vorteil erreicht, dass die Data-Mining-Agenten auf technisch einfache Weise von der zentralen Data-mining-Einheit gesteuert und angepasst werden können.
  • In einer weiteren vorteilhaften Ausführungsform des Verfahrens umfasst das Verfahren den Schritt eines Übermittelns der zentralen Analysedaten an das lokale Computernetz. Dadurch wird beispielsweise ebenfalls der technische Vorteil erreicht, dass die zentralen Analysedaten durch das lokale Computersystem weiter ausgewertet werden können.
  • In einer weiteren vorteilhaften Ausführungsform des Verfahrens umfasst das Verfahren den Schritt eines Erzeugens der lokalen Analysedaten in Abhängigkeit der übermittelten zentralen Analysedaten. Dadurch wird beispielsweise ebenfalls der technische Vorteil erreicht, dass das lokale Data-Minings in Abhängigkeit der zentralen Analysedaten verändert und optimiert werden kann.
  • Vorstehend wurde die Lösung der Aufgabe vornehmlich in Bezug auf das beanspruchte System beschrieben. Hierbei erwähnte Merkmale, Vorteile oder alternative Ausführungsformen sind ebenso auch auf die anderen beschriebenen oder beanspruchten Gegenstände zu übertragen und umgekehrt. Mit anderen Worten kann z.B. auch der Verfahrensanspruch oder eine Computerprogramm, das zur Ausführung des Verfahrens bestimmt ist, mit den Merkmalen, die in Zusammenhang mit dem System beschrieben oder beansprucht sind, weitergebildet sein und umgekehrt. Die entsprechenden funktionalen Merkmale des Verfahrens werden dabei durch entsprechende gegenständliche Module, insbesondere durch Hardware-Module, ausgebildet.
  • Die vorstehend beschriebenen, erfindungsgemäßen Ausführungsformen des Verfahrens können auch als Computerprogrammprodukt mit einem Computerprogramm ausgebildet sein, wobei der Computer zur Durchführung des oben beschriebenen, erfindungsgemäßen Verfahrens veranlasst wird, wenn das Computerprogramm auf dem Computer bzw. auf einem Prozessor des Computers ausgeführt wird.
  • Eine alternative Aufgabenlösung besteht auch in einem Computerprogramm mit Computer-Programmcode zur Durchführung aller Verfahrensschritte des beanspruchten oder oben beschriebenen Verfahrens, wenn das Computerprogramm auf dem Computer ausgeführt wird. Dabei kann das Computerprogramm auch auf einem maschinenlesbaren Speichermedium gespeichert sein.
  • Eine alternative Aufgabenlösung sieht ein Speichermedium vor, das zur Speicherung des vorstehend beschriebenen, computerimplementierten Verfahrens bestimmt ist und von einem Computer lesbar ist.
  • Es liegt im Rahmen der Erfindung, dass nicht alle Schritte des Verfahrens zwangsläufig auf ein und derselben Computerbasierten Instanz ausgeführt werden müssen, sondern sie können auch auf unterschiedlichen Geräten oder Instanzen (z.B. auf lokalen und/oder zentralen Einheiten) ausgeführt werden. Auch ist es möglich, dass einzelne Abschnitte des vorstehend beschriebenen Verfahrens in einer verkaufsfähigen Einheit und die restlichen Komponenten in einer anderen verkaufsfähigen Einheit – sozusagen als verteiltes System – ausgeführt werden können. Auch kann die Abfolge der Verfahrensschritte gegebenenfalls variiert werden. In der bevorzugten Ausführung der Erfindung ist es jedoch vorgesehen, dass zunächst eine lokale Analyse und anschließend (dies kann auch zu einem späteren Zeitpunkt erfolgen) eine zentrale Analyse durchgeführt wird.
  • In der folgenden detaillierten Figurenbeschreibung werden nicht einschränkend zu verstehende Ausführungsbeispiele mit deren Merkmalen und weiteren Vorteilen anhand der Zeichnung besprochen. In dieser zeigen:
  • 1 eine schematische Ansicht eines Computersystems; und
  • 2 ein Blockdiagramm eines Verfahrens.
  • 1 zeigt eine schematische Ansicht eines Computersystems 100 zum Analysieren von Daten innerhalb eines medizinischen Umfelds. Das Computersystem 100 umfasst mehrere lokale Computernetze 101-1 in Krankenhäusern zum lokalen Speichern von Rohdaten und ein zentrales Computernetz 101-2, mit dem die lokalen Computernetze 101-1 verbunden sind. Die Computernetze 101-1 und 101-2 sind durch einen Zusammenschluss verschiedener technischer, primär selbstständiger Computer gebildet. Der Zusammenschluss der Computer in den Computernetzen 101-1 und 101-2 kann über verschiedene Netzwerktechnologien erreicht werden, beispielsweise kabelgebunden über eine Ethernet- oder LAN-Verbindung oder kabellos über eine WLAN-Verbindung der einzelnen Computer. Die Computer innerhalb der Computernetze 101-1 und 101-2 können in unterschiedlicher Topologie miteinander vernetzt sein, um einen gemeinsamen Datenaustausch zu gewährleisten, wie beispielsweise in einer Ring-Topologie, Stern-Topologie, Baum-Topologie oder in einer vermaschten Topologie.
  • Vorzugsweise handelt es sich bei den Rohdaten um medizinische Daten oder Gesundheitsdaten. Die Rohdaten umfassen sicherheitskritische Datensätze oder sogenannte PHI-Daten (geschützte oder zu schützende personenbezogene Gesundheitsdaten, Protected Health Information). Die Rohdaten werden lokal über Computerterminals 115 oder medizinischen Geräten in das lokale Computernetz 101-1 eingegeben und umfassen beispielsweise Patientendatensätze, Patientenbilder, Diagnosen oder Systemverwendungsdaten. Die Rohdaten werden in einem internen Datenspeicher 105-1 („Internal Data Store“) des lokalen Computernetzes 101-1 gespeichert. Das lokale Computernetz 101-1 ist über eine Firewall 113 abgesichert. Die Firewall 113 bildet ein Sicherungssystem, das lokale Computernetz 101-1 vor unerwünschten Netzwerkzugriffen schützt.
  • Das lokale Computernetz 101-1 umfasst eine lokale Data-Mining-Einheit 103-1 zum Erzeugen von lokalen Analysedaten mittels einer statistischen Analyse auf Basis der gespeicherten Rohdaten. Die Data-Mining-Einheit 103-1 wendet systematisch statistische Methoden auf die Rohdaten aus dem internen Datenspeicher 105-1 mit dem Ziel an, neue Muster zu erkennen. Die gewonnenen lokalen Analysedaten werden in einem Datenspeicher 107-1 des lokalen Computernetzes 101-1 („Local Data Mining Store“) gesammelt und zwischengespeichert. Das Data-Mining beruht somit darauf, die Rohdaten zu sammeln, zu speichern und mit Hilfe von statistischen Analysealgorithmen (Data-Mining-Algorithmen) zu analysieren.
  • Anschließend können die so gewonnenen lokalen Analysedaten an ein zentrales Computernetz 101-2 übermittelt werden. Zu diesem Zweck umfasst das zentrale Computernetz 101-2 einen Datenspeicher 105-2 zum Zwischenspeichern der übermittelten lokalen Analysedaten („Intermediate Results“). Im Allgemeinen kann das lokale Computernetz 101-1 auch mehrere Data-Mining-Einheiten 103-1 umfassen, beispielsweise um ein mehrstufiges Data-Mining innerhalb des lokalen Computernetzes 101-1 durchzuführen.
  • Das zentrale Computernetz 101-2 umfasst eine weitere, zentrale Data-Mining-Einheit 103-2 ("Data-Mining Core") zum Erzeugen von zentralen Analysedaten mittels einer statistischen Analyse auf Basis der übermittelten lokalen Analysedaten (dies kann auch als erstes Ergebnis bzw. Zwischenergebnis bezeichnet werden). Das zentrale Computernetz 101-2 ist beispielsweise durch eine Datencloud oder ein Rechenzentrum gebildet. Zum Speichern der gewonnenen zentralen Analysedaten umfasst das zentrale Computernetz 101-2 ebenfalls einen Datenspeicher 107-2 („Data Mining Results“).
  • Durch ein Aufteilen der Data-Mining-Analyse in einen lokalen Anteil im lokalen Computernetz 101-1 und einen zentralen Anteil im zentralen Computernetz 101-2 kann die Datensicherheit verbessert werden. Die Rohdaten können mit geringem technischen Aufwand analysiert werden und verlassen das interne lokale Computernetz 101-1 nicht.
  • Die lokale Data-Mining-Einheit 103-1 analysiert die Rohdaten mit Hilfe von konfigurierbaren Data-Mining-Agenten 109-1...n ("Data-Mining Agents"), die die lokalen Analysedaten ("Intermediate Data-Mining Results", erstes Ergebnis oder Zwischenergebnis) erzeugen. Eine Konfiguration der Data-Mining-Agenten 109-1...n kann beispielsweise durch eine Übermittlung von Analyseparametern an die Data-Mining-Agenten 109-1...n erreicht werden. Die Data-Mining-Agenten 109-1...n werden durch Computerprogramme gebildet, die zur automatischen spezifizierten, eigenständigen und/oder eigendynamischen (autonomen) Ausführung fähig und ausgebildet sind.
  • Die gewonnenen, lokalen Analysedaten oder -Ergebnisse werden in einem Datenspeicher 107-1 ("Local Data-Mining Store") des lokalen Computernetzes 101-1 gespeichert. Ist von einem Benutzer nur ein lokales Data-Mining innerhalb des lokalen Computernetzes 101-1 gewünscht, wie beispielsweise einem Klinikverbund, können diese Ergebnisse lediglich direkt innerhalb des lokalen Computernetzes 101-1 verwendet werden.
  • Hat ein Benutzer hingegen Interesse, von einem zentralen Data-Mining zu profitieren, können die Ergebnisse des lokalen Data-Mining („Intermediate Data-Mining Results") dem zentralen Computernetz 101-2 („Data-Mining-Core“) zur Verfügung gestellt werden.
  • Der Vorteil bei diesem Vorgehen ist, dass der jeweilige Benutzer eine Kontrolle über seine Daten behält, die dem zentralen Computernetz 101-2 mit der zentralen Data-Mining-Einheit 103-2 zur Verfügung gestellt werden. Dies wird über die Data-Mining-Agenten 109-1...n abgesichert, die Rohdaten sammeln und auswerten und die nur lokalen Analysedaten (und somit nur verarbeitete Rohdaten) exportieren. Es werden daher keine Rohdaten, wie beispielsweise Patientenbilder, Diagnosen oder Systemverwendungsdaten, exportiert, sondern ausschließlich die zuvor lokal ermittelten Ergebnisse einer statistischen Analyse ("Local Data-Mining") auf Basis der Rohdaten.
  • Ein weiterer Vorteil ist, dass lokale Systemressourcen zum lokalen Data-Mining ("Local Data-Mining") verwendet werden können, so dass reduzierte Systemanforderungen an das zentrale Data-Mining ("Data-Mining Core") gestellt werden können.
  • Zwischen dem lokalen Computernetz 101-1 und dem zentralen Computernetz 101-2 werden reduzierte Datenmengen übertragen.
  • Das Computersystem 100 kann auch außerhalb des medizinischen Bereichs in jedem IT-Umfeld verwendet werden, in dem sensitive Daten erstellt werden und in denen Auswertungen dieser Daten einen Mehrwert erzeugen, wie beispielsweise in der Automobilindustrie, in Fertigungsanlagen oder Handelsunternehmen.
  • Das Erzeugen von lokalen Analysedaten ("Local Data-Mining") ist nicht auf eine einzelne Auswerteeinheit innerhalb eines geschlossenen IT-Umfelds im lokalen Computernetz 101-1 beschränkt, sondern es ist auch denkbar, dass jedes Untersystem, das innerhalb eines solchen geschlossenen, lokalen Computernetzes 101-1 Rohdaten erzeugt, diese lokal direkt über die Verwendung von Data-Mining-Agenten 109-1...n statistisch auswertet und dem Datenspeicher 107-1 („Local Data-Mining Store") zur Verfügung stellt. Dadurch wird ein mehrstufiges lokales Data-Mining mit mehreren Data-Mining-Einheiten 103-1 realisiert (mehrstufiges "Local Data-Mining"). Dies führt zu einer weiteren Reduzierung der notwendigen Systemressourcen zum Data-Mining innerhalb des geschlossen IT-Umfelds innerhalb des lokalen Computernetzes 101-1 und ermöglicht eine dezentrale, feingranulare Entscheidung, welche Daten zum Data-Mining verwendet werden.
  • Zentrale Analysedaten, die beim zentralen Data-Mining ("Data-Mining Core") unter Verwendung weltweiter Daten erstellt werden, können an das lokale Data-Mining ("Local Data-Mining") rückübermittelt und zur Optimierung des lokalen Data-Minings verwendet werden.
  • Im Allgemeinen unterliegt das Data-Mining der Data-Mining-Agenten 109-1...n einem ständigen Wandel und einer Erweiterung. Mit jeder neuen Fragestellung, die beispielsweise durch Benutzeranforderungen bestimmt wird, können weitere Auswertungen der Rohdaten erforderlich werden. Mithilfe von konfigurierbaren oder ersetzbaren Data-Mining-Agenten 109-1...n kann das lokale Data-Mining oder das zentrale Data-Mining dynamisch angepasst werden. Da lokale Rohdaten ausschließlich über die Data-Mining-Agenten 109-1...n analysiert und exportiert werden, ist eine einfache und lückenlose Kontrolle der Datenverteilung und der Datensicherheit gewährleistet. Die Data-Mining-Agenten 109-1...n in den lokalen Computernetzen können daher von dem zentralen Computernetz 101-2 konfiguriert oder ersetzt werden. Zu diesem Zweck umfasst das zentrale Computernetz 101-2 einen Agentenspeicher 111 („Data Mining Agent Store“), in dem mehrere Data-Mining-Agenten 109-1...n gespeichert sind. Ein Ersetzen eines Data-Mining-Agenten 109-1...n erfolgt durch eine Übermittlung eines neuen Data-Mining-Agenten 109-1...n aus dem Agentenspeicher 111 an das lokale Computernetz 101-1 und ein Deaktivieren oder Löschen des alten Data-Mining-Agenten 109-1...n in dem lokalen Computernetz 101-1.
  • Die zentrale Data-Mining-Einheit 103-2 kann durch ähnliche Mechanismen wie die lokalen Data-Mining-Einheiten 103-1 konfiguriert oder erweitert werden. Beispielsweise können die Data-Mining-Agenten auch in der zentralen Data-Mining-Einheit 103-2 zur Konfiguration oder Erweiterung der Data-Mining-Funktionalität innerhalb des zentralen Computernetzes 101-2 verwendet werden. Weiterhin ist auch denkbar, dadurch eine dynamische Verlagerung der Data-Mining-Aktivitäten von dem lokalen Computernetz 101-1 zu dem zentralen Computernetz 101-2 zu erreichen.
  • 2 zeigt ein Blockdiagramm eines Verfahrens zum Analysieren von Daten. Das Verfahren umfasst die Schritte eines Speicherns der Rohdaten in einem lokalen Computernetz 101-1, eines Erzeugens von lokalen Analysedaten mittels einer statistischen Analyse auf Basis der Rohdaten durch eine lokale Data-Mining-Einheit 103-1 in dem lokalen Computernetz 101-1, eines Übermittelns der lokalen Analysedaten an ein zentrales Computernetz 101-2 und eines Erzeugens von zentralen Analysedaten mittels einer statistischen Analyse auf Basis der lokalen Analysedaten durch eine zentrale Data-Mining-Einheit 103-1 in dem zentralen Computernetz 101-2.
  • Das Data-Mining ist somit in einen lokalen („Local Data-Mining") und einen zentralen („Data-Mining Core") Anteil aufgeteilt. Dadurch werden verteilte, anteilige oder auch mehrstufige Data-Mining-Ergebnisse (Lokal/Zentral) ermöglicht. Ein Benutzer behält die Kontrolle über die Daten, die aus dem abgesicherten IT-Umfeld des lokalen Computernetzes 101-1 exportiert und zum zentralen Data-Mining im zentralen Computernetz 101-2 verwendet werden.
  • Durch die Verwendung von lokalen Ressourcen zum Data-Mining, wird eine hohe Sicherheit und Transparenz der exportierten lokalen Analysedaten erreicht. Dies führt zu einer Steigerung des Vertrauens des Benutzers und zu höherer Akzeptanz bei der Anwendung. Des Weiteren werden die über das Netzwerk zu transferierenden Datenmengen durch lokales Data-Mining reduziert. Daneben können die Ressourcen zum zentralen Data-Mining („Data-Mining Core") verringert werden.
  • Da keine sensitiven Patienten- oder Systemverwendungsdaten im zentralen Computernetz 101-2 ungefiltert gespeichert werden, kann der Aufwand für die Datensicherheit beim zentralen Data-Mining verringert werden. Insgesamt ermöglicht dies eine schnellere Verfügbarkeit von Data-Mining-Ergebnissen, da die lokalen Ergebnisse des lokalen Data-Mining direkt verwendet werden können. Durch Verwendung weltweiter Data-Mining-Ergebnisse ist ein lokales Data-Mining möglich, ohne eigene benutzerspezifische Daten aus dem geschützten IT-Umfeld des lokalen Computernetzes 101-1 exportieren zu müssen.
  • Alle in Verbindung mit einzelnen Ausführungsformen der Erfindung erläuterten und gezeigten Merkmale können in unterschiedlicher Kombination in dem erfindungsgemäßen Gegenstand vorgesehen sein, um gleichzeitig deren vorteilhafte Wirkungen zu realisieren. Der Schutzbereich der vorliegenden Erfindung ist durch die Ansprüche gegeben und wird durch die in der Beschreibung erläuterten oder den Figuren gezeigten Merkmale nicht beschränkt.
  • Abschließend sei darauf hingewiesen, dass die Beschreibung der Erfindung und die Ausführungsbeispiele grundsätzlich nicht einschränkend in Hinblick auf eine bestimmte physikalische Realisierung der Erfindung zu verstehen sind. Für einen Fachmann ist es insbesondere offensichtlich, dass die Erfindung teilweise oder vollständig in Soft- und/oder Hardware und/oder auf mehrere physikalische Produkte – dabei insbesondere auch Computerprogrammprodukte – verteilt realisiert werden kann.

Claims (15)

  1. Computersystem (100) zum Analysieren von Daten, mit: – einem lokalen Computernetz (101-1) zum Speichern von Rohdaten, das eine lokale Data-Mining-Einheit (103-1) zum Erzeugen von lokalen Analysedaten mittels einer statistischen Analyse auf Basis der Rohdaten umfasst; und – einem zentralen Computernetz (101-2) zum Empfangen der lokalen Analysedaten aus dem lokalen Computernetz (101-1), das eine zentrale Data-Mining-Einheit (103-2) zum Erzeugen von zentralen Analysedaten mittels einer statistischen Analyse auf Basis der lokalen Analysedaten umfasst.
  2. Computersystem (100) nach Anspruch 1, wobei das lokale Computernetz (101-1) einen Datenspeicher (107-1) zum Speichern der lokalen Analysedaten umfasst.
  3. Computersystem (100) nach einem der vorangehenden Ansprüche, wobei das zentrale Computernetz einen Datenspeicher (107-3) zum Speichern der zentralen Analysedaten umfasst.
  4. Computersystem (100) nach einem der vorangehenden Ansprüche, wobei die lokale Data-Mining-Einheit (103-1) zumindest einen ersetzbaren Data-Mining-Agenten (109-1...n) zum Durchführen der statistischen Analyse umfasst.
  5. Computersystem (100) nach Anspruch 4, wobei der Data-Mining-Agent (109-1...n) durch das zentrale Computernetz (101-2) ersetzbar ist.
  6. Computersystem (100) nach Anspruch 4 oder 5, wobei das zentrale Computernetz (101-2) einen Agentenspeicher (111) umfasst, in dem mehrere Data-Mining-Agenten (109-1...n) gespeichert sind.
  7. Computersystem (100) nach einem der vorangehenden Ansprüche, wobei die lokale Data-Mining-Einheit (103-1) zumindest einen konfigurierbaren Data-Mining-Agenten (109-1...n) zum Durchführen der statistischen Analyse umfasst.
  8. Computersystem (100) nach Anspruch 7, wobei der Data-Mining-Agent (109-1...n) durch das zentrale Computernetz (101-2) konfigurierbar ist.
  9. Computersystem (100) nach einem der vorangehenden Ansprüche, wobei das zentrale Computernetz (101-2) ausgebildet ist, die zentralen Analysedaten an das lokale Computernetz (101-1) zu übermitteln.
  10. Computersystem (100) nach Anspruch 9, wobei das lokale Computernetz (101-1) ausgebildet ist, die lokalen Analysedaten in Abhängigkeit von den übermittelten zentralen Analysedaten zu erzeugen.
  11. Verfahren zum Analysieren von Daten, mit den Schritten: – Speichern (S101) von Rohdaten in einem lokalen Computernetz (101-1); – Erzeugen (S102) von lokalen Analysedaten mittels einer statistischen Analyse auf Basis der Rohdaten durch eine lokale Data-Mining-Einheit (103-1) in dem lokalen Computernetz (101-1); – Übermitteln (S103) der lokalen Analysedaten an ein zentrales Computernetz (101-2); und – Erzeugen (S104) von zentralen Analysedaten mittels einer statistischen Analyse auf Basis der lokalen Analysedaten durch eine zentrale Data-Mining-Einheit (103-1) in dem zentralen Computernetz (101-2).
  12. Verfahren nach Anspruch 11, wobei das Verfahren den Schritt eines Ersetzens eines Data-Mining-Agenten (109-1...n) der lokalen Data-Mining-Einheit (103-1) durch das zentrale Computernetz (101-2) umfasst.
  13. Verfahren nach Anspruch 11 oder 12, wobei das Verfahren den Schritt eines Konfigurierens eines Data-Mining-Agenten (109-1...n) der lokalen Data-Mining-Einheit (103-1) durch das zentrale Computernetz (101-2) umfasst.
  14. Verfahren nach einem der Ansprüche 11 bis 13, wobei das Verfahren den Schritt eines Übermittelns der zentralen Analysedaten an das lokale Computernetz (101-1) umfasst.
  15. Verfahren nach Anspruch 14, wobei das Verfahren den Schritt eines Erzeugens der lokalen Analysedaten in Abhängigkeit der übermittelten zentralen Analysedaten umfasst.
DE102014211140.4A 2014-06-11 2014-06-11 Computersystem und Verfahren zum Analysieren von Daten Ceased DE102014211140A1 (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
DE102014211140.4A DE102014211140A1 (de) 2014-06-11 2014-06-11 Computersystem und Verfahren zum Analysieren von Daten
CN201510316253.4A CN105279366B (zh) 2014-06-11 2015-06-10 用于分析数据的计算机系统和方法
KR1020150082483A KR20150143341A (ko) 2014-06-11 2015-06-11 데이터를 분석하기 위한 컴퓨터 시스템 및 방법
US14/736,728 US20150363472A1 (en) 2014-06-11 2015-06-11 Computer system and method for analyzing data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102014211140.4A DE102014211140A1 (de) 2014-06-11 2014-06-11 Computersystem und Verfahren zum Analysieren von Daten

Publications (1)

Publication Number Publication Date
DE102014211140A1 true DE102014211140A1 (de) 2015-12-17

Family

ID=54706570

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102014211140.4A Ceased DE102014211140A1 (de) 2014-06-11 2014-06-11 Computersystem und Verfahren zum Analysieren von Daten

Country Status (4)

Country Link
US (1) US20150363472A1 (de)
KR (1) KR20150143341A (de)
CN (1) CN105279366B (de)
DE (1) DE102014211140A1 (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101995419B1 (ko) * 2016-11-08 2019-07-02 한국전자통신연구원 데이터 분석 시스템 및 그 방법
WO2020103154A1 (en) * 2018-11-23 2020-05-28 Siemens Aktiengesellschaft Method, apparatus and system for data analysis

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6496814B1 (en) * 2000-07-19 2002-12-17 International Business Machines Corporation Method and system for integrating spatial analysis, and scheduling to efficiently schedule and monitor infrastructure maintenance
US20020138492A1 (en) * 2001-03-07 2002-09-26 David Kil Data mining application with improved data mining algorithm selection
US7092941B1 (en) * 2002-05-23 2006-08-15 Oracle International Corporation Clustering module for data mining
US7024417B1 (en) * 2002-11-14 2006-04-04 Hyperion Solutions Corporation Data mining framework using a signature associated with an algorithm
US20050114277A1 (en) * 2003-11-21 2005-05-26 International Business Machines Corporation Method, system and program product for evaluating a data mining algorithm
US20110112860A1 (en) * 2004-07-28 2011-05-12 Informedix, Inc. Medical treatment monitoring system and method
US7627620B2 (en) * 2004-12-16 2009-12-01 Oracle International Corporation Data-centric automatic data mining
US7512626B2 (en) * 2005-07-05 2009-03-31 International Business Machines Corporation System and method for selecting a data mining modeling algorithm for data mining applications
US7930197B2 (en) * 2006-09-28 2011-04-19 Microsoft Corporation Personal data mining
US8990378B2 (en) * 2007-07-05 2015-03-24 Interwise Ltd. System and method for collection and analysis of server log files
US7912812B2 (en) * 2008-01-07 2011-03-22 International Business Machines Corporation Smart data caching using data mining
KR20100008545A (ko) * 2008-07-16 2010-01-26 한국건설기술연구원 통합형 온라인 유지관리시스템 및 그 방법
US9419801B2 (en) * 2009-05-12 2016-08-16 Infrascale Inc. System and method for transmitting needed portions of a data file between networked computers
CN102360377B (zh) * 2011-10-12 2014-01-29 中国测绘科学研究院 一种空间聚类挖掘pse系统及其构建方法
WO2013086610A1 (en) * 2011-12-12 2013-06-20 University Of Ontario Institute Of Technology System, method and computer program for multi-dimensional temporal and relative data mining framework, analysis & sub-grouping
US9639615B1 (en) * 2012-06-28 2017-05-02 Open Text Corporation Systems and methods for health information messages archiving
CN105144663A (zh) * 2013-03-15 2015-12-09 德纳有限公司 使用多级网络的用于数据收集与分析的系统和方法
US10521439B2 (en) * 2014-04-04 2019-12-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method, apparatus, and computer program for data mining

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GANGA DEVI, S. V. S.: A Survey on Distributed Data Mining and its Trends. In: IMPACT: International Journal of Research in Engineering & Technology, Vol. 2, März 2014, Issue 3, S. 107 - 120. - ISSN: 2347-4599 *

Also Published As

Publication number Publication date
US20150363472A1 (en) 2015-12-17
CN105279366B (zh) 2019-06-07
CN105279366A (zh) 2016-01-27
KR20150143341A (ko) 2015-12-23

Similar Documents

Publication Publication Date Title
DE102015004127A1 (de) Verfahren und System zum Vergleichen von verschienenen Versionen einer cloud-basierten Anwendung in einer Produktionsumgebung unter Verwendung von getrennten Back-End-Systemen
DE69830046T2 (de) Vorrichtung und verfahren zur überwachung und auswertung von anwendungsprotokollen für datenübertragungssysteme in netzen
DE102015003363A1 (de) Verfahren und system zum testen cloud-basierter anwendungen in einer produktionsumgebung unter verwendung hergestellter benutzer-daten
DE102015004128A1 (de) Verfahren und System zum Testen cloud-basierter Anwendungen und Dienste in einer Produktionsumgebung unter Verwendung von getrennten Back-End-Systemen
DE102006004618A1 (de) Arbeitsablauf-basiertes Management von medizinischen Bilddaten
DE102015113739A1 (de) Verfahren zum Verbinden einer Eingabe/Ausgabe-Schnittstelle eines für das Testen eines Steuergeräts eingerichteten Testgeräts
DE112014001359T5 (de) Prädiktives System zum Bereitstellen von Unternehmensanwendungen
EP3149710B1 (de) Fahrzeugdiagnosevorrichtung und datenübertragungsvorrichtung
DE10304277A1 (de) Verfahren zur Steuerung einer Vermittlungseinrichtung
DE102014211140A1 (de) Computersystem und Verfahren zum Analysieren von Daten
DE102017108677A1 (de) Betriebsmittelsystem
DE102019132485A1 (de) Verwaltung von Zugriffsbeschränkungen innerhalb eines System-on-Chip
EP3629247A1 (de) Verfahren zum anpassen eines verbindungsgewichts und verbindungsgewichtsanpassungseinheit
EP1561172B1 (de) Vorrichtung zur bereitstellung eines zugriffs auf daten
EP2224340A1 (de) Verfahren und Managementsystem zum Konfigurieren eines dynamischen Informationssystems sowie Computerprogrammprodukt
WO2015078494A1 (de) Technischer informationsbroker für kraftwerke
EP3575976A1 (de) Verfahren zum bestimmen einer physikalischen verbindungstopologie eines für die steuergerätentwicklung eingerichteten, echtzeitfähigen testgeräts
DE102020107141B4 (de) Simulieren einer Steuergerätekommunikation zwischen einem zu testenden Steuergerät und mindestens einem weiteren Steuergerät
EP2246761A1 (de) Schnittstelle und Verfahren zum sicheren Ändern von Parametern einer fehlersicheren industriellen Automatisierungskomponente
EP3531427A1 (de) Verfahren und gerätesystem zum management der funktionsausübung von medizintechnischen geräten
Reil et al. Auswirkungen von Smart Services auf Mitarbeitende
EP3002652B1 (de) Verfahren zur Zustandsüberwachung innerhalb eines industriellen Automatisierungssystems und Steuerungsprogramm
DE102017126457A1 (de) Vorrichtung zur Unterstützung eines Benutzers an einem Arbeitsplatz, Verfahren und Computerprogrammprodukt
EP1459253A2 (de) Selektive lösungsermittlung für ein mehrparametrisches system
DE102005009528B4 (de) Filtern von geheimhaltungsbedürftigen Daten bei einer Monitorspiegelung

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R081 Change of applicant/patentee

Owner name: SIEMENS HEALTHCARE GMBH, DE

Free format text: FORMER OWNER: SIEMENS AKTIENGESELLSCHAFT, 80333 MUENCHEN, DE

R002 Refusal decision in examination/registration proceedings
R003 Refusal decision now final