DE112018005424T5 - Automatisches Verbinden von externen Daten mit einem Geschäftsanalyseprozess - Google Patents

Automatisches Verbinden von externen Daten mit einem Geschäftsanalyseprozess Download PDF

Info

Publication number
DE112018005424T5
DE112018005424T5 DE112018005424.1T DE112018005424T DE112018005424T5 DE 112018005424 T5 DE112018005424 T5 DE 112018005424T5 DE 112018005424 T DE112018005424 T DE 112018005424T DE 112018005424 T5 DE112018005424 T5 DE 112018005424T5
Authority
DE
Germany
Prior art keywords
control unit
data
event
query
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE112018005424.1T
Other languages
English (en)
Inventor
Lin Luo
Changying Sun
Mohammed Mostafa
Graham Wills
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE112018005424T5 publication Critical patent/DE112018005424T5/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • G06F16/24547Optimisations to support specific applications; Extensibility of optimisers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24575Query processing with adaptation to user needs using context

Abstract

Ein Big-Data-Analysesystem enthält eine Ereignisüberwachungs-Steuereinheit, die aus einem Datenfluss einer anfänglichen digitalen Abfrage ein auf einen Benutzer ausgerichtetes Ereignis erkennt. Eine Ereignisumwandlungs-Steuereinheit ermittelt mindestens ein kontextuelles Element, das dem mindestens einen auf einen Benutzer ausgerichteten Ereignis zugehörig ist, und wandelt das mindestens eine kontextuelle Element automatisch in ein Suchkriterium um. Eine Steuereinheit für ein Erstellungsprogramm für externe Datenabfragen führt automatisch eine externe Suchabfrage auf der Grundlage der Suchkriterien aus. Eine Datenverschmelzungs-Steuereinheit verschmilzt automatisch das mindestens eine kontextuelle Element, das aus dem mindestens einen auf einen Benutzer ausgerichteten Ereignis erzeugt wird, mit externen Suchergebnissen, die aus der externen Suchabfrage und dem Datenfluss einer anfänglichen Abfrage erzeugt werden, um eine Datei mit verschmolzenen Daten zu erzeugen.

Description

  • HINTERGRUND
  • Die vorliegende Offenbarung betrifft im Allgemeinen Datenbanksysteme und im Besonderen Big-Data-Analyse-Verarbeitungssysteme.
  • Fortschritte bei Big-Data-Analyse und Big-Data-Tool-Technologien haben es Unternehmen und Betrieben ermöglicht, externe Daten wie zum Beispiel Wetterdaten, raumbezogene Daten und Daten aus sozialen Medien zu nutzen, um einen umfassenderen Überblick über ihr Geschäft, ihr Marketing und ihre Kundenbindung zu erhalten. Zum Beispiel können Unternehmen soziale Medien nutzen, um Kunden zu identifizieren und zu belohnen, Einblicke in die Kundenstimmung zu gewinnen und Kundenbedürfnisse vorherzusagen. Infolgedessen wird ein Erhalten von externen Daten zu einem immer wichtigeren Bestandteil jedes Geschäftsanalyseprozesses.
  • Mit der Weiterentwicklung von Big-Data-Analyse-Tools stellen viele Geschäftsanalyse- (BA-, business analysis) Produkte einen Benutzerzugang zu externen Daten bereit. Zu diesen Big-Data-Tools gehören zum Beispiel Data-Mining, Vorhersageanalysen und/oder Tools für maschinelles Lernen, die auf Sätze von großen Datenmengen (sets of big data) angewendet werden können, die häufig unstrukturierte und halbstrukturierte Daten enthalten. Allerdings geht ein Einbinden von externen Daten in die Geschäftsanalyse immer noch mit mehreren manuellen Arbeitsschritten einher, um externe Daten korrekt abzufragen und die abgefragten Ergebnisse mit individuellen Daten eines Unternehmens oder eines Benutzers zu korrelieren.
  • KURZDARSTELLUNG
  • Gemäß einer nicht einschränkenden Ausführungsform der vorliegenden Erfindung enthält ein Big-Data-Analysesystem eine Ereignisüberwachungs-Steuereinheit, die aus einem Datenfluss einer anfänglichen Abfrage ein auf einen Benutzer ausgerichtetes Ereignis erkennt. Eine Ereignisumwandlungs-Steuereinheit ermittelt mindestens ein kontextuelles Element, das dem mindestens einen auf einen Benutzer ausgerichteten Ereignis zugehörig ist, und wandelt das mindestens eine kontextuelle Element automatisch in ein Suchkriterium um. Eine Steuereinheit für ein Erstellungsprogramm für externe Datenabfragen führt automatisch eine externe Suchabfrage auf der Grundlage der Suchkriterien aus. Eine Datenverschmelzungs-Steuereinheit verschmilzt automatisch das mindestens eine kontextuelle Element, das aus dem mindestens einen auf einen Benutzer ausgerichteten Ereignis erzeugt wird, mit externen Suchergebnissen, die aus der externen Suchabfrage und dem Datenfluss einer anfänglichen Abfrage erzeugt werden, um die Datei mit verschmolzenen Daten zu erzeugen.
  • Gemäß einer anderen nicht einschränkenden Ausführungsform der Erfindung wird ein Verfahren bereitgestellt, um automatisch eine Datei mit verschmolzenen Daten auf der Grundlage eines durch ein Big-Data-Analysesystem erhaltenen Datenflusses einer anfänglichen Abfrage zu erzeugen. Das Verfahren weist ein Erkennen, mittels einer elektronischen Ereignisüberwachungs-Steuereinheit, mindestens eines auf einen Benutzer ausgerichteten Ereignisses aus dem Abfrage-Datenfluss und ein Ermitteln, mittels einer elektronischen Ereignisumwandlungs-Steuereinheit, mindestens eines kontextuellen Elements auf, das dem mindestens einen auf einen Benutzer ausgerichteten Ereignis zugehörig ist. Das Verfahren weist darüber hinaus ein automatisches Umwandeln, mittels der Ereignisumwandlungs-Steuereinheit, des mindestens einen kontextuellen Elements in ein Suchkriterium und ein automatisches Ausführen, mittels einer Steuereinheit für ein Erstellungsprogramm für externe Datenabfragen, einer externen Suchabfrage auf der Grundlage der Suchkriterien auf. Das Verfahren weist darüber hinaus ein automatisches Verschmelzen, mittels einer elektronischen Datenverschmelzungs-Steuereinheit, des mindestens einen kontextuellen Elements, das aus dem mindestens einen auf einen Benutzer ausgerichteten Ereignis erzeugt wird, mit externen Suchergebnissen auf, die aus der externen Suchabfrage und dem Datenfluss einer anfänglichen Abfrage erzeugt werden, um die Datei mit verschmolzenen Daten zu erzeugen.
  • Gemäß noch einer anderen nicht einschränkenden Ausführungsform wird ein Computerprogrammprodukt bereitgestellt, um automatisch eine Datei mit verschmolzenen Daten auf der Grundlage eines durch ein Big-Data-Analysesystem erhaltenen Datenflusses einer anfänglichen Abfrage zu erzeugen. Das Computerprogrammprodukt umfasst ein durch einen Computer lesbares Speichermedium, auf dem Programmanweisungen gespeichert sind, die durch mindestens eine elektronische Hardware-Steuereinheit ausführbar sind. Die Programmanweisungen weisen erste Programmanweisungen auf, die durch eine elektronische Ereignisüberwachungs-Steuereinheit ausführbar sind, um die Ereignisüberwachungs-Steuereinheit zu veranlassen, mindestens ein auf einen Benutzer ausgerichtetes Ereignis aus dem Abfrage-Datenfluss zu erkennen. Die Anweisung weist darüber hinaus zweite Programmanweisungen auf, die durch eine Ereignisumwandlungs-Steuereinheit, die mit der Ereignisüberwachungs-Steuereinheit Signale austauscht, ausführbar sind, um die Umwandlungssteuereinheit zu veranlassen, mindestens ein kontextuelles Element zu ermitteln, das dem mindestens einen auf einen Benutzer ausgerichteten Ereignis zugehörig ist, und das mindestens eine kontextuelle Element automatisch in ein Suchkriterium umzuwandeln. Die Computeranweisung weist darüber hinaus dritte Programmanweisungen auf, die durch eine elektronische Steuereinheit für ein Erstellungsprogramm für externe Datenabfragen ausführbar sind, um die Steuereinheit für ein Erstellungsprogramm für externe Datenabfragen zu veranlassen, automatisch eine externe Suchabfrage auf der Grundlage der Suchkriterien auszuführen. Die Computerprogrammanweisung weist darüber hinaus vierte Programmanweisungen auf, die durch eine elektronische Datenverschmelzungs-Steuereinheit ausführbar sind, um die Datenverschmelzungs-Steuereinheit zu veranlassen, das mindestens eine kontextuelle Element, das aus dem mindestens einen auf einen Benutzer ausgerichteten Ereignis erzeugt wird, mit externen Suchergebnissen automatisch zu verschmelzen, die aus der externen Suchabfrage und dem Datenfluss einer anfänglichen Abfrage erzeugt werden, um die Datei mit verschmolzenen Daten zu erzeugen.
  • Zusätzliche Eigenschaften werden durch die Techniken der vorliegenden Erfindung verwirklicht. Andere Ausführungsformen werden hierin ausführlich beschrieben und sind als Teil der beanspruchten Erfindung anzusehen. Ein besseres Verständnis der Erfindung mit den Eigenschaften ergibt sich aus der Beschreibung und den Zeichnungen.
  • Figurenliste
    • 1 zeigt eine Cloud-Computing-Umgebung gemäß Ausführungsformen der Erfindung;
    • 2 zeigt Abstraktionsmodellschichten gemäß Ausführungsformen der Erfindung;
    • 3 zeigt eine Datenübertragungsvorrichtung gemäß Ausführungsformen der vorliegenden Erfindung;
    • 4 ist ein Blockschaubild eines Big-Data-Analysesystems gemäß einer nicht einschränkenden Ausführungsform;
    • 5 veranschaulicht eine ontologische Hierarchie gemäß einer nicht einschränkenden Ausführungsform;
    • 6 ist ein Ablaufplan, der ein Verfahren zum automatischen Erzeugen einer Datei mit verschmolzenen Daten veranschaulicht, die Echtzeit-Abfragedaten mit externen Suchergebnissen gemäß einer nicht einschränkenden Ausführungsform zusammenfügt; und
    • 7 ist ein Ablaufplan, der ein Verfahren zum Erzeugen einer ontologischen Hierarchie gemäß einer nicht einschränkenden Ausführungsform veranschaulicht.
  • AUSFÜHRLICHE BESCHREIBUNG
  • Der Kürze halber können herkömmliche Techniken, die sich auf ein Verarbeiten und Analysieren von Datenbanken beziehen, hier im Detail beschrieben sein oder auch nicht. Außerdem können die verschiedenen hierin beschriebenen Arbeitsschritte und Prozessschritte in eine umfassendere Vorgangsweise oder einen umfassenderen Prozess mit zusätzlichen, hierin nicht im Detail beschriebenen Schritten oder Funktionen aufgenommen werden. Zum Beispiel sind einige datenanalytische Arbeitsschritte wie zum Beispiel Bilderkennung allgemein bekannt, und somit werden der Kürze halber viele herkömmliche Schritte hierin lediglich kurz erwähnt oder vollständig weggelassen, ohne die allgemein bekannten Prozessdetails bereitzustellen.
  • Wenden wir uns nun einem Überblick über Technologien zu, die spezifischer für Aspekte von verschiedenen nicht einschränkenden Ausführungsformen der Erfindung relevant sind, so beginnt der Datenanalyseprozess üblicherweise mit einer Datenerfassung, die darauf abzielt, Informationen zu identifizieren, die auf eine bestimmte Analyseanwendung ausgerichtet sind. Daten aus verschiedenen Quellsystemen können mittels Datenintegrationsroutinen kombiniert, in ein gemeinsames Format umgewandelt und in ein Analysesystem wie zum Beispiel ein verteiltes Datenspeichersystem (z.B. einen Hadoop-Cluster, eine NoSQL-Datenbank oder ein Data Warehouse) geladen werden. In anderen Fällen kann der Sammelprozess ein Extrahieren einer relevanten Datenuntermenge aus einem Rohdatenstrom, der in ein verteiltes Datenspeichernetzwerk fließt, und ein anschließendes Verschieben von extrahierten Daten auf eine separate Partition in dem System umfassen, so dass sie analysiert werden können, ohne den Gesamtdatensatz zu beeinträchtigen.
  • Sobald die Ziel-Daten isoliert sind, werden analytische Modelle manuell erzeugt und mit den gesammelten Daten abgeglichen. Ein Ausführen der analytischen Modelle kann mit einem Sortieren großer Datensätze zum Identifizieren von Trends, Mustern und Beziehungen, einer Vorhersageanalyse (die versucht, das Kundenverhalten vorherzusagen), Ausfällen von Ausstattungsgegenständen und Prozessen maschinellen Lernens (z.B. Techniken der künstlichen Intelligenz, die automatisierte Algorithmen zum Durchlaufen von Datensätzen verwenden) einhergehen. Die Ergebnisse können dann Geschäftsführern und anderen Endbenutzern mitgeteilt werden, um ihnen eine Entscheidungshilfe bereitzustellen. Die Modelle, die diese Datenanalysen durchführen, erfordern jedoch üblicherweise beträchtliche menschliche Bearbeitungsvorgänge, eine manuelle Dateneingabe und kontinuierliche Datenprüfungen, die über lange Zeiträume durchgeführt werden.
  • Wenden wir uns nun einem Überblick über verschiedene Aspekte der Erfindung zu, so gehen eine oder mehrere nicht einschränkende Ausführungsformen die vorstehend beschriebenen Mängel des Stands der Technik an, indem sie ein Big-Data-Analysesystem bereitstellen, das Elemente identifiziert, die für einen Benutzer interessanten Ereignissen zugehörig sind und sich aus Echtzeit-Datenereignissen ergeben (z.B. plötzliche Trends, Ausreißer, Muster, Beziehungen usw.). Das Big-Data-Analysesystem wandelt die identifizierten Elemente, die dem Ereignis als Kontext zugehörig sind, in Suchkriterien um. Die identifizierten Elemente, die dem Ereignis zugehörig sind, können in Komponenten von Ontologien eingestuft werden, zu denen Instanzen, Klassen gehören, wobei sie aber nicht auf diese beschränkt sind. Ontologien können darüber hinaus neue Informationen über identifizierte Elemente ableiten, zu denen Attribute, Beziehungen und Synonyme gehören, wobei sie aber nicht auf diese beschränkt sind. Der vorstehende Prozess bringt eine umfassende Beschreibung der identifizierten Elemente hervor. Die erzeugten Gesamtinformationen können darüber hinaus in einer Hierarchie von Informationseigenschaften wie zum Beispiel Themen, Kontext und Gegenstände zum Erstellen von Suchkriterien organisiert werden. Zeitraum und Ort können auch als Suchkriterien hinzugefügt werden, wenn Datum, Zeit und/oder geografischer Ort aus dem Abfrage-Datenfluss abgeleitet werden. Eine Suchabfrage mit diesen Kriterien wird durch externe Datenanbieter ausgeführt, wodurch auf der Grundlage der Suchkriterien relevante, verarbeitete Ergebnisse bereitgestellt werden. Diese Ergebnisse werden automatisch mit dem ursprünglichen Datensatz zusammengefügt, so dass ein Benutzer eine tiefere Analyse anormaler Ereignisse in der Abfrage durchführen kann, um diese von externen Datendimensionen aus besser zu verstehen.
  • Das Big-Data-Analysesystem gemäß einer oder mehreren nicht einschränkenden Ausführungsformen der Erfindung ist auch in der Lage, Benutzerdaten automatisch mit relevanten externen Daten anzureichern, die dem Benutzer möglicherweise nicht bekannt sind. Auf diese Weise können die durch das Big-Data-Analysesystem ausgegebenen Daten die Analyse des Benutzers ohne jegliche manuelle Prozesse durch den Benutzer um zusätzliche Einblicke und Datenkorrelationen erweitern, während es gleichzeitig zu einer drastischen Einsparung von Zeit und Aufwand in deren Analyseprozess kommt.
  • Unter Bezugnahme auf 1 ist eine veranschaulichende Cloud-Computing-Umgebung 50 abgebildet. Wie gezeigt ist, weist die Cloud-Computing-Umgebung 50 einen oder mehrere Cloud-Computing-Knoten 10 auf, mit denen von Cloud-Nutzern verwendete lokale Datenverarbeitungseinheiten wie zum Beispiel ein elektronischer Assistent (PDA, personal digital assistant) oder ein Mobiltelefon 54A, ein Desktop-Computer 54B, ein Laptop-Computer 54C und/oder ein Automobil-Computer-System 54N Daten austauschen können. Die Knoten 10 können miteinander Daten austauschen. Sie können physisch oder virtuell in ein oder mehrere Netzwerke wie private, Benutzergemeinschafts-, öffentliche oder hybride Clouds gruppiert werden (nicht gezeigt), wie vorstehend beschrieben wurde, oder in eine Kombination daraus. Dies ermöglicht es der Cloud-Computing-Umgebung 50, Infrastruktur, Plattformen und/oder Software als Dienst anzubieten, für die ein Cloud-Nutzer keine Ressourcen auf einer lokalen Datenverarbeitungseinheit vorhalten muss. Es sei darauf hingewiesen, dass die Arten von in 1 gezeigten Datenverarbeitungseinheiten 54A bis N lediglich veranschaulichend sein sollen und dass die Datenverarbeitungsknoten 10 und die Cloud-Computing-Umgebung 50 über eine beliebige Art Netzwerk und/oder über eine beliebige Art von über ein Netzwerk aufrufbarer Verbindung (z.B. unter Verwendung eines Web-Browsers) mit einer beliebigen Art von computergestützter Einheit Daten austauschen können.
  • Unter Bezugnahme auf 2 wird ein Satz von funktionalen Abstraktionsschichten gezeigt, die durch die Cloud-Computing-Umgebung 50 (1) bereitgestellt werden. Es sollte von vornherein klar sein, dass die in 2 gezeigten Komponenten, Schichten und Funktionen lediglich veranschaulichend sein sollen und Ausführungsformen der Erfindung nicht darauf beschränkt sind. Wie abgebildet ist, werden die folgenden Schichten und entsprechenden Funktionen bereitgestellt:
  • Eine Hardware- und Software-Schicht 60 umfasst Hardware- und Software-Komponenten. Zu Beispielen für Hardware-Komponenten gehören: Mainframe-Computer 61; auf der RISC- (Reduced Instruction Set Computer) Architektur beruhende Server 62; Server 63; Blade-Server 64; Speichereinheiten 65; und Netzwerke sowie Netzwerkkomponenten 66. In einigen Ausführungsformen umfassen Software-Komponenten eine Netzwerk-Anwendungsserver-Software 67 und eine Datenbank-Software 68.
  • Eine Virtualisierungsschicht 70 stellt eine Abstraktionsschicht bereit, aus der die folgenden Beispiele für virtuelle Einheiten bereitgestellt werden können: virtuelle Server 71, virtueller Speicher 72, virtuelle Netzwerke 73, darunter virtuelle private Netzwerke, virtuelle Anwendungen und Betriebssysteme 74; und virtuelle Clients 75.
  • In einem Beispiel kann eine Verwaltungsschicht 80 die nachfolgend beschriebenen Funktionen bereitstellen. Eine Ressourcen-Bereitstellung 81 stellt eine dynamische Beschaffung von Datenverarbeitungsressourcen sowie anderen Ressourcen bereit, die zum Durchführen von Aufgaben innerhalb der Cloud-Computing-Umgebung verwendet werden. Ein Messen und eine Preisfindung 82 stellen eine Kostenverfolgung beim Verwenden von Ressourcen innerhalb der Cloud-Computing-Umgebung sowie die Abrechnung oder Rechnungsstellung für einen Verbrauch dieser Ressourcen bereit. In einem Beispiel können diese Ressourcen Anwendungs-Software-Lizenzen aufweisen. Eine Sicherheit stellt eine Identitätsüberprüfung für Cloud-Nutzer und Aufgaben sowie Schutz für Daten und andere Ressourcen bereit. Ein Benutzerportal 83 stellt Nutzern und Systemadministratoren einen Zugang zu der Cloud-Computing-Umgebung bereit. Eine Verwaltung des Dienstumfangs 84 stellt eine Zuordnung und Verwaltung von Cloud-Computing-Ressourcen bereit, so dass die benötigten Dienstziele erreicht werden. Ein Planen und Erfüllen von Vereinbarungen zum Dienstumfang (SLA, Service Level Agreement) 85 stellt eine Anordnung vorab und eine Beschaffung von Cloud-Computing-Ressourcen, für die eine zukünftige Anforderung vorausgesehen wird, gemäß einer SLA bereit.
  • Eine Arbeitslastschicht 90 stellt Beispiele für eine Funktionalität bereit, für welche die Cloud-Computing-Umgebung verwendet werden kann. Zu Beispielen für Arbeitslasten und Funktionen, die von dieser Schicht bereitgestellt werden können, gehören: Abbildung und Navigation 91; Software-Entwicklung und Lebenszyklusverwaltung 92; Bereitstellung von Ausbildung in virtuellen Klassenzimmern 93; Datenanalytikverarbeitung 94; Transaktionsverarbeitung 95; und Eingabedatenanalyse 96.
  • Unter Bezugnahme auf 3 ist ein Datenverarbeitungssystem 100, das in der Lage ist, eine Big-Data-Analyse durchzuführen, die Elemente identifiziert, die für einen Benutzer interessanten Ereignissen zugehörig sind und sich aus Echtzeitdatenereignissen ergeben, gemäß einer oder mehreren Ausführungsformen der Erfindung veranschaulicht. Das Datenverarbeitungssystem 100 kann einen Computer umfassen, wie zum Beispiel einen Server, einen Laptop-Computer, einen Tablet-Computer, ein Telefon und dergleichen.
  • Das Datenverarbeitungssystem 100 umfasst neben anderen Komponenten einen Prozessor 105, einen mit einer Speichersteuereinheit 115 verbundenen Speicher 110 und eine oder mehrere Eingabeeinheiten 145 und/oder Ausgabeeinheiten 140 wie zum Beispiel Peripherie- oder Steuereinheiten, die über eine lokale E/A-Steuereinheit 135 für den Datenaustausch miteinander verbunden sind. Diese Einheiten 140 und 145 können zum Beispiel Batteriesensoren, Positionssensoren (Höhenmesser 40, Beschleunigungsmesser 42, GPS 44), Leuchtanzeigen/Kennzeichnungsleuchten und dergleichen umfassen. Eingabeeinheiten wie zum Beispiel eine herkömmliche Tastatur 150 und Maus 155 können mit der E/A-Steuereinheit 135 verbunden sein. Bei der E/A-Steuereinheit 135 kann es sich zum Beispiel um einen oder mehrere Busse oder andere drahtgebundene oder drahtlose Verbindungen handeln, die nach dem Stand der Technik bekannt sind. Die E/A-Steuereinheit 135 kann zusätzliche Elemente aufweisen, die der Einfachheit halber weggelassen sind, wie zum Beispiel Steuereinheiten, Puffer (Cachespeicher), Treiber, Repeater und Empfänger zum Ermöglichen der Datenübertragung.
  • Zu den E/A-Einheiten 140, 145 können darüber hinaus Einheiten gehören, die sowohl Eingaben als auch Ausgaben übertragen, zum Beispiel Platten- und Bandspeicher, eine Netzwerkschnittstellenkarte (NIC) oder ein Modulator/Demodulator (zum Zugreifen auf andere Dateien, Einheiten, Systeme oder ein Netzwerk), ein Hochfrequenz- (HF-) oder anderer Transceiver, eine Telefonschnittstelle, eine Brücke, ein Router und dergleichen.
  • Bei dem Prozessor 105 handelt es sich um eine Hardware-Einheit zum Ausführen von Hardware-Anweisungen oder Software, insbesondere der in dem Speicher 110 gespeicherten. Bei dem Prozessor 105 kann es sich um einen kundenspezifischen oder im Handel erhältlichen Prozessor, eine zentrale Verarbeitungseinheit (CPU), einen Hilfsprozessor unter mehreren dem Datenverarbeitungssystem 100 zugehörigen Prozessoren, einen auf Halbleitern beruhenden Mikroprozessor (in Form eines Mikrochips oder Chipsatzes), einen Makroprozessor oder eine andere Einheit zum Ausführen von Anweisungen handeln. Der Prozessor 105 enthält einen Cachespeicher 170, der einen Anweisungs-Cachespeicher zum Beschleunigen des Abrufens von ausführbaren Anweisungen, einen Daten-Cachespeicher zum Beschleunigen des Abrufens und Speicherns von Daten und einen zum Beschleunigen einer Umsetzung virtueller in physische Adressen sowohl für ausführbare Anweisungen als auch für Daten verwendeten Adressumsetzpuffer (TLB, translation lookaside buffer) enthalten kann, aber nicht darauf beschränkt ist. Der Cachespeicher 170 kann als eine Hierarchie von weiteren Cache-Ebenen (L1, L9 und so weiter) organisiert sein.
  • Der Speicher 110 kann eines oder Kombinationen aus flüchtigen Speicherelementen (zum Beispiel Direktzugriffsspeicher, RAM wie zum Beispiel DRAM, SRAM, SDRAM) und nichtflüchtigen Speicherelementen (zum Beispiel ROM, einen löschbaren programmierbaren Nur-Lese-Speicher (EPROM), einen elektronisch löschbaren programmierbaren Nur-Lese-Speicher (EEPROM), einen programmierbaren Nur-Lese-Speicher (PROM), Band, einen Kompaktspeicherplatte-Nur-Lese-Speicher (CD-ROM), eine Platte, eine Diskette, eine Endlosbandkassette, eine Kassette oder dergleichen) beinhalten. Außerdem kann der Speicher 110 elektronische, magnetische, optische oder andere Typen von Speichermedien umfassen. Man beachte, dass der Speicher 110 eine verteilte Architektur aufweisen kann, bei der sich verschiedene Komponenten entfernt voneinander befinden, der Prozessor 105 aber darauf zugreifen kann.
  • Die Anweisungen in dem Speicher 110 können ein oder mehrere separate Programme beinhalten, die jeweils eine geordnete Auflistung von ausführbaren Anweisungen zum Umsetzen von logischen Funktionen aufweisen. In dem Beispiel aus 3 enthalten die Anweisungen in dem Speicher 110 ein geeignetes Betriebssystem (O/S) 111. Das O/S 111 kann im Wesentlichen das Ausführen anderer Computerprogramme steuern und stellt eine Zeitplanung, eine Eingabe/Ausgabe-Steuerung, eine Datei- und Datenverwaltung, eine Speicherverwaltung und eine Datenübertragungssteuerung sowie verwandte Dienste bereit.
  • Zusätzliche Daten, darunter zum Beispiel Anweisungen für den Prozessor 105 oder andere abrufbare Informationen, können in dem Speicher gespeichert sein, bei dem es sich um eine Speichereinheit 120 wie zum Beispiel ein Festplattenlaufwerk oder ein Solid-State-Laufwerk handeln kann. Die in dem Speicher 110 oder in dem Speicher 120 gespeicherten Anweisungen können solche enthalten, die den Prozessor in die Lage versetzen, einen oder mehrere Aspekte der hierin beschriebenen Systeme und Verfahren auszuführen.
  • Das Datenverarbeitungssystem 100 kann darüber hinaus eine mit einer Benutzerschnittstelle oder Anzeige 130 verbundene Anzeigesteuereinheit 125 umfassen. In einigen Ausführungsformen kann es sich bei der Anzeige 130 um einen LCD-Bildschirm handeln. In anderen Ausführungsformen kann die Anzeige 130 eine Mehrzahl von LED-Statusanzeigen enthalten. In einigen Ausführungsformen kann das Datenverarbeitungssystem 100 darüber hinaus eine Netzwerkschnittstelle 160 zum Verbinden mit einem Netzwerk 165 umfassen. Bei dem Netzwerk 165 kann es sich um ein auf IP beruhendes Netzwerk für einen Datenaustausch zwischen dem Datenverarbeitungssystem 100 und einem externen Server, Client-Computer und dergleichen über eine Breitbandverbindung handeln. In einer Ausführungsform kann es sich bei dem Netzwerk 165 um ein Satellitennetzwerk handeln. Das Netzwerk 165 übermittelt und empfängt Daten zwischen dem Datenverarbeitungssystem 100 und externen Systemen. In einigen Ausführungsformen kann es sich bei dem Netzwerk 165 um ein verwaltetes IP-Netzwerk handeln, das von einem Dienstleister verwaltet wird. Das Netzwerk 165 kann drahtlos umgesetzt sein, zum Beispiel unter Verwendung von Drahtlosprotokollen und - technologien wie zum Beispiel WiFi, WiMax, Satellit oder beliebige andere. Bei dem Netzwerk 165 kann es sich auch um ein paketvermitteltes Netzwerk handeln, wie zum Beispiel ein lokales Netzwerk, ein Weitverkehrsnetz, ein Großstadtnetz (metropolitan area network), das Internet oder einen anderen gleichartigen Typ von Netzwerkumgebung. Bei dem Netzwerk 165 kann es sich um ein festes Drahtlosnetzwerk, ein drahtloses lokales Netzwerk (LAN), ein drahtloses Weitverkehrsnetz (WAN), ein persönliches Netzwerk (PAN), ein virtuelles Privatnetz (VPN), ein Intranet oder ein anderes geeignetes Netzwerksystem handeln und es kann eine Ausrüstung zum Empfangen und Übermitteln von Signalen enthalten.
  • Wenden wir uns 4 zu, in der ein Big-Data-Analysesystem 400 gemäß einer nicht einschränkenden Ausführungsform veranschaulicht ist. Das Big-Data-Analysesystem 400 ist so konfiguriert, dass es Elemente von für einen Benutzer interessanten Ereignissen oder von dem Benutzer festgelegten, auf einen Benutzer ausgerichteten Ereignissen identifiziert, die sich aus Echtzeit-Datenereignissen ergeben (z.B. plötzliche Trends, Ausreißer, Muster, Beziehungen usw.). In mindestens einer Ausführungsform wandelt das Big-Data-Analysesystem 400 die identifizierten Elemente, die dem Zielereignis zugehörig sind, als kontextuelle Informationen um, die wiederum zum automatischen Ermitteln von Suchkriterien verwendet werden, die zum Erzeugen einer Suchabfrage verwendet werden. Zum Beispiel kann das Big-Data-Analysesystem 400 Informationen über die identifizierten Elemente unter Verwendung von Ontologien ermitteln. Die identifizierten Elemente, die dem Ereignis zugehörig sind, können in Komponenten von Ontologien eingestuft werden, zu denen Instanzen, Klassen gehören, wobei sie aber nicht auf diese beschränkt sind. Ontologien können darüber hinaus neue Informationen über identifizierte Elemente ableiten, zu denen Attribute, Beziehungen und Synonyme gehören, wobei sie aber nicht auf diese beschränkt sind. Der vorstehende Prozess bringt eine umfassende Beschreibung der identifizierten Elemente hervor. Die erzeugten Gesamtinformationen können darüber hinaus in einer Hierarchie von Informationseigenschaften wie zum Beispiel Themen, Kontext und Gegenstände zum Erstellen von Suchkriterien organisiert werden. Dementsprechend kann das Big-Data-Analysesystem 400 die Suchabfrage an die externe Datensteuereinheit 414 ausgeben, die dann relevante verarbeitete Ergebnisse bereitstellen kann.
  • Das Big-Data-Analysesystem 400 ist auch in der Lage, die ursprünglichen Benutzerdaten automatisch mit relevanten externen Daten zu „verschmelzen“ bzw. „zusammenzufügen“. Die relevanten externen Daten sind dem Benutzer möglicherweise nicht bekannt. Auf diese Weise können die sich ergebenden verschmolzenen Daten die dem Benutzer bereitgestellten Analyseergebnisse bereichern. Die Datei mit verschmolzenen Daten wird dann verarbeitet, um eine Statusübersicht (dashboard) zu erzeugen, die eine visuelle Darstellung der ursprünglichen Benutzerdaten zusammen mit den relevanten Analyseergebnissen der externen Daten, die aus der Suchabfrage erhalten werden, bereitstellt. Auf diese Weise können die durch das Big-Data-Analysesystem ausgegebenen Daten die Analyse des Benutzers ohne jegliche manuelle Prozesse durch den Benutzer um zusätzliche Einblicke und Datenkorrelationen erweitern, während es gleichzeitig zu einer drastischen Einsparung von Zeit und Aufwand in deren Analyseprozess kommt.
  • Gemäß einer nicht einschränkenden Ausführungsform umfasst das Big-Data-Analysesystem 400 eine Abfragedaten-Steuereinheit 402, eine Ereignisüberwachungs-Steuereinheit 404, die mit einer Ziel-Ereignis-Speichersteuereinheit 406 Signale austauscht, eine Ereignisumwandlungs-Steuereinheit 408, die mit einer Ontologie-Steuereinheit 410 Signale austauscht, eine Steuereinheit 412 für ein Erstellungsprogramm für externe Datenabfragen, die mit einem externen Datensystem, das die externe Datensteuereinheit 414 einsetzt, Signale austauscht, eine Datenverschmelzungs-Steuereinheit 416 und eine Visualisierungswiedergabe-Steuereinheit 418. Die Abfragedaten-Steuereinheit 402, die Ereignisüberwachungs-Steuereinheit 404, die Ziel-Ereignis-Speichersteuereinheit 406, die Ereignisumwandlungs-Steuereinheit 408, die Ontologie-Steuereinheit 410, die Steuereinheit 412 für ein Erstellungsprogramm für externe Datenabfragen, die externe Datensteuereinheit 414, die Datenverschmelzungs-Steuereinheit 416 und/oder die Visualisierungswiedergabe-Steuereinheit 418 können als elektronische Hardware-Steuereinheit aufgebaut sein, die einen Speicher und einen Prozessor enthält, der so konfiguriert ist, dass er Algorithmen und durch einen Computer lesbare Programmanweisungen, die in dem Speicher gespeichert sind, ausführt.
  • Die Abfragedaten-Steuereinheit 402 ist so konfiguriert, dass ein Datenfluss einer anfänglichen Abfrage als Reaktion auf eine durch einen Benutzer oder eine Anwendung eingegebene Abfrageanforderung abgerufen wird. Die Abfrageanforderung könnte durch Erstellen einer Visualisierung in einer Statusübersicht, durch Ausgeben eines Berichts, durch Ausarbeiten einer Analyse oder durch eine Suche ausgelöst werden. In einem nicht einschränkenden Beispiel ist der Abfragedatenanbieter 402 so konfiguriert, dass er Daten auf der Grundlage von verschiedenen Kundenaktionen abruft. Zu den Aktionen gehören, ohne darauf beschränkt zu sein, ein Erstellen eines Vergleichsdiagramms bezüglich des finanziellen Abschneidens für eine Produktgruppe; ein Ausgeben einer Statusübersicht zeigt eine Analyse von Produktverkäufen aus verschiedenen Blickwinkeln, zum Beispiel im Zeitverlauf und über geografische Standorte hinweg; ein Ausgeben eines zusammenfassenden Berichts über die Dienstnutzung usw.
  • Die Ereignisüberwachungs-Steuereinheit 404 tauscht mit der Abfragedaten-Steuereinheit 402 Signale aus, um den Abfrage-Datenfluss zu empfangen. Der Abfrage-Datenfluss kann zum Beispiel Daten enthalten, die erstellten Vergleichen des finanziellen Abschneidens für eine Produktgruppe entsprechen, Statusübersichtsdaten, die mit einer Analyse von Produktverkäufen aus verschiedenen Blickwinkeln korrelieren (z.B. Produktverkäufe im Zeitverlauf und über geografische Standorte hinweg), und zusammenfassende Berichte über die Dienstnutzung usw. Die Ereignisüberwachungs-Steuereinheit 404 tauscht auch mit der Ziel-Ereignis-Speichereinheit 406 Signale aus. Die Ereignis-Speichereinheit 406 enthält eine oder mehrere Registrierdatenbanken, in denen ein oder mehrere durch den Benutzer eingegebene, benutzerdefinierte Ziel-Ereignisse gespeichert sind. Auf diese Weise überwacht die Ereignisüberwachungs-Steuereinheit 404 den Abfrage-Datenfluss (z.B. Produkteindruck, Produktbewertungen durch Kunden, Verlaufsdaten für Klickraten (CTR, click-through rate) für Daten/Webseiten-Klicks, Warenkorbplatzierung und endgültige Kaufinformationen) und identifiziert oder erkennt ein oder mehrere Ziel-Ereignisse daraus, die mit einem entsprechenden benutzerdefinierten Ziel-Ereignis übereinstimmen. Zu den benutzerdefinierten Ziel-Ereignissen können Kundenkauftrends, Datenmuster, Produkt/Kunde-Kaufbeziehungen, plötzlich auftretende Trends und Datenbeziehungseigenschaften gehören, ohne darauf beschränkt zu sein.
  • Die Ereignisumwandlungs-Steuereinheit 408 tauscht mit der Ereignisüberwachungs-Steuereinheit 404 und der Ontologie-Steuereinheit 410 Signale aus, um ein oder mehrere kontextuelle Elemente zu erzeugen, die einem erkannten Ziel-Ereignis zugehörig sind. Die Ereignisumwandlungs-Steuereinheit 408 ist auch dazu konfiguriert, ein kontextuelles Element automatisch in Suchkriterien umzuwandeln. Die Ereignisumwandlungs-Steuereinheit 408 erzeugt automatisch die Suchkriterien auf der Grundlage des kontextuellen Elements. In mindestens einem nicht einschränkenden Beispiel wird das kontextuelle Element gemäß einer durch die Ontologie-Steuereinheit 410 erzeugten ontologischen Hierarchie ermittelt.
  • In mindestens einer Ausführungsform tauscht die Ontologie-Steuereinheit 410 mit der Ereignisumwandlungs-Steuereinheit 408 Signale aus. Die Ontologie-Steuereinheit 410 ist in der Lage, eine ontologische Hierarchie auf der Grundlage der Ziel-Ereignisse zu erzeugen, die durch die Ereignisumwandlungs-Steuereinheit 408 bereitgestellt werden. Die ontologische Hierarchie enthält Informationen, die Eigenschaften wie zum Beispiel Instanzen, Klassen, Attribute und Beziehungen auf der Grundlage der identifizierten Ereigniselemente in dem Abfrage-Datenfluss beschreiben. Die ontologischen Hierarchie-Informationen können darüber hinaus kontextuelle Informationseigenschaften wie zum Beispiel Themen, Kontext und Gegenstände der identifizierten Ereigniselemente in dem Abfrage-Datenfluss ableiten. Die Informationseigenschaften enthalten darüber hinaus zum Beispiel Zeitrauminformationen und Standortinformationen, die durch Analysieren des Abfrage-Datenflusses ermittelt werden können.
  • Unter Bezugnahme auf 5 ermittelt die Ontologie-Steuereinheit 410 zum Beispiel eine oder mehrere ontologische Instanzen 500 auf der Grundlage eines oder mehrerer durch die Ereignisumwandlungs-Steuereinheit 408 ermittelter kontextueller Elemente. In mindestens einer nicht einschränkenden Ausführungsform ermittelt die Ontologie-Steuereinheit 410 ein Informationsthema auf der Grundlage der ontologischen Instanz und erweitert das Informationsthema, um unter Verwendung lexikalischer Klassifizierungsregeln der ontologischen Instanz eine Liste von Synonymen zu erhalten, die dem Thema zugehörig sind.
  • Die Ontologie-Steuereinheit 410 kann auch weitere detaillierte Informationen über die ontologische Instanz erhalten. Zum Beispiel kann die Ontologie-Steuereinheit 410 eine Klasse 502 der ontologischen Instanz identifizieren und dann eine oder mehrere Eigenschaften 504 der Klasse 502 ermitteln.
  • In mindestens einer Ausführungsform ermittelt die Ontologie-Steuereinheit 410 einen Informationskontext auf der Grundlage der ermittelten Klasse 502 und erweitert den Informationskontext, um unter Verwendung lexikalischer Klassifizierungsregeln der Klasse 502 eine Liste von Synonymen zu erhalten, die dem Kontext zugehörig sind. Die ermittelte Klasse 502 kann einer verwandten Klasse 506 zugehörig sein, die durch die Ontologie-Steuereinheit 410 ermittelt wird. Auf diese Weise kann die Ontologie-Steuereinheit 410 unter Verwendung lexikalischer Klassifizierungsregeln der verwandten Klassen eine erweiterte Liste 508 von Synonymen für den ermittelten Kontext erzeugen. Die Ontologie-Steuereinheit 410 kann auch ein oder mehrere Attribute auf der Grundlage einer oder mehrerer ausgewählter Eigenschaften ermitteln, die der Klasse entsprechen, und eine zweite erweiterte Liste erzeugen, die ein oder mehrere Eigenschaftssynonyme für jedes ermittelte Attribut der ausgewählten Eigenschaft enthält. Zum Beispiel kann eine erweiterte Liste von Synonymen für jedes ermittelte Attribut unter Verwendung lexikalischer Klassifizierungsregeln erzeugt werden, die den entsprechenden Eigenschaften zugehörig sind.
  • Unter erneuter Bezugnahme auf 4 tauscht die Steuereinheit 412 für ein Erstellungsprogramm für externe Datenabfragen mit dem externen Datensystem 414 Signale aus. Die Steuereinheit 412 für ein Erstellungsprogramm für externe Datenabfragen und das externe Datensystem 414 können zusammenarbeiten, um automatisch eine externe Suchabfrage auf der Grundlage der Suchkriterien auszuführen. Zum Beispiel kann die Steuereinheit 412 für ein Erstellungsprogramm für externe Datenabfragen externe datenspezifische Abfragen auf der Grundlage des einen oder der mehreren kontextuellen Elemente erzeugen, die dem erkannten Ziel-Ereignis zugehörig sind. Das externe Datensystem 414 empfängt die externe Suchabfrage von der Steuereinheit 412 für ein Erstellungsprogramm für externe Datenabfragen, führt die Abfrage durch und erzeugt die externen Suchergebnisse.
  • Die Datenverschmelzungs-Steuereinheit 416 tauscht mit dem externen Datensystem 414 Signale aus, um die externen Suchergebnisse zu empfangen. In mindestens einer Ausführungsform verschmilzt die Datenverschmelzungs-Steuereinheit 416 automatisch die kontextuellen Elemente, die aus dem mindestens einen auf einen Benutzer ausgerichteten Ereignis (UTE, user targeted event) erzeugt werden, mit externen Suchergebnissen, die aus der externen Suchabfrage und dem Datenfluss einer anfänglichen Abfrage erzeugt werden, bzw. setzt diese zusammen, um die Datei mit verschmolzenen Daten zu erzeugen. Die Datei mit verschmolzenen Daten kann an die Visualisierungswiedergabe-Steuereinheit 418 ausgegeben werden, die eine Anzeige oder eine grafische Benutzerschnittstelle (GUI) 420 erzeugt, die visuelle Ergebnisse der Datei mit verschmolzenen Daten anzeigt, d.h. die aus den Ziel-Ereignissen des Benutzers identifizierten kontextuellen Elemente und die unter Verwendung der externen Suchabfrage erzeugten externen Suchergebnisse werden automatisch mit den ursprünglichen Abfragedaten verschmolzen.
  • Wenden wir uns nun 6 zu, in der ein Verfahren zum automatischen Erzeugen einer Datei mit verschmolzenen Daten auf der Grundlage eines abgefragten, durch ein Big-Data-Analysesystem erhaltenen Datenflusses gemäß einer nicht einschränkenden Ausführungsform veranschaulicht ist. Das Verfahren beginnt bei Arbeitsschritt 600, und bei Arbeitsschritt 602 werden Daten abrufende Abfragen einer Abfragedaten-Steuereinheit zugestellt (siehe 4). Die Daten abrufenden Abfragen können zum Beispiel Produkteindrücke, Kundenrezensionen, Verlaufsdaten für Klickraten (CTR) für Daten/Webseiten-Klicks, Warenkorbplatzierung und endgültige Kaufinformationen umfassen. Bei Arbeitsschritt 604 empfängt ein Ereignisüberwachungsdienst die EchtzeitDaten einer anfänglichen Abfrage und ermittelt ein oder mehrere auf einen Benutzer ausgerichtete Ereignisse. Bei Arbeitsschritt 606 überwacht der Ereignisüberwachungsdienst die Echtzeit-Abfragedaten und ermittelt bei Arbeitsschritt 608, ob in den Echtzeit-Abfragedaten ein auf einen Benutzer ausgerichtetes Ereignis (UTE) enthalten ist. Wenn keine auf einen Benutzer ausgerichteten Ereignisse identifiziert werden, kehrt das Verfahren zu Arbeitsschritt 606 zurück, um das Überwachen der Echtzeit-Abfragedaten fortzusetzen.
  • Wenn jedoch ein auf einen Benutzer ausgerichtetes Ereignis erkannt wird, wandelt das Verfahren bei Arbeitsschritt 610 das auf einen Benutzer ausgerichtete Ereignis in ein domänenspezifisches Suchkriterium um. Bei Arbeitsschritt 612 werden automatisch externe Suchkriterien auf der Grundlage des identifizierten, auf einen Benutzer ausgerichteten Ereignisses erzeugt. Bei Arbeitsschritt 614 wird eine Suchabfrage auf der Grundlage der externen Suchkriterien ausgeführt, und als Reaktion auf die Suchabfrage werden externe Daten erhalten. Bei Arbeitsschritt 616 werden automatisch Korrelationen zwischen den externen Suchergebnissen und den identifizierten, auf einen Benutzer ausgerichteten Ereignissen ermittelt. In mindestens einer Ausführungsform enthalten die externen Suchergebnisse Informationen, die dem Benutzer zuvor unbekannt waren. Bei Arbeitsschritt 618 werden die verwandten externen Ergebnisse automatisch mit den auf einen Benutzer ausgerichteten Ereignissen und/oder den Echtzeitdaten einer anfänglichen Abfrage verschmolzen, die den auf einen Benutzer ausgerichteten Ereignissen zugehörig sind. Auf diese Weise können die externen Datenergebnisse mit den auf einen Benutzer ausgerichteten Ereignissen zusammengefügt werden, um dem Benutzer einen Einblick dahingehend bereitzustellen, welches Echtzeit-Ereignis das erkannte, auf einen Benutzer ausgerichtete Ereignis ausgelöst hat. Zum Beispiel kann ein Benutzer durch Zusammenfügen der zuvor unbekannten externen Datenergebnisse mit dem auf einen Benutzer ausgerichteten Ereignis zusammen mit den Echtzeitdaten einer anfänglichen Abfrage ermitteln, welches in Echtzeit auftretende Ereignis zu einem auf einen Benutzer ausgerichteten Verkaufstrend geführt hat. Bei Arbeitsschritt 620 kann eine Statusübersicht, welche die verschmolzenen oder „zusammengefügten“ Daten enthält, erzeugt und zum Beispiel auf einer GUI angezeigt werden, und das Verfahren endet bei Arbeitsschritt 622. Dementsprechend werden dem Benutzer visuelle Ergebnisse der Datei mit verschmolzenen Daten angezeigt, d.h. die aus den Ziel-Ereignissen des Benutzers identifizierten kontextuellen Elemente und die unter Verwendung der externen Suchabfrage erzeugten externen Suchergebnisse werden mit den Daten einer anfänglichen Abfrage „zusammengefügt“. Dementsprechend können die durch das Big-Data-Analysesystem ausgegebenen Daten die Analyse des Benutzers ohne jegliche manuelle Prozesse durch den Benutzer um zusätzliche Einblicke und Datenkorrelationen erweitern, während es gleichzeitig zu einer drastischen Einsparung von Zeit und Aufwand in deren Analyseprozess kommt.
  • Wenden wir uns 7 zu, in der ein Verfahren zum Erzeugen einer ontologischen Hierarchie, die zum automatischen Erzeugen von domänenspezifischen Suchkriterien verwendet wird, die zum Durchführen einer externen Suchabfrage verwendet werden, gemäß einer nicht einschränkenden Ausführungsform veranschaulicht wird. Das Verfahren beginnt bei Arbeitsschritt 700 und erkennt bei Arbeitsschritt 702 ein oder mehrere auf einen Benutzer ausgerichtete Ereignisse (UTEs) aus Daten einer anfänglichen Abfrage (d.h. aus einem Datenfluss einer anfänglichen Abfrage), die in Echtzeit erhalten werden. Bei Arbeitsschritt 704 wird jedes Element, das einem erkannten, auf einen Benutzer ausgerichteten Ereignis zugehörig ist, in eine ontologische Instanz eingestuft. In mindestens einer Ausführungsform erhält die Ontologie-Steuereinheit (siehe 4) ein Element, das dem erkannten, auf einen Benutzer ausgerichteten Ereignis zugehörig ist, und ermittelt die ontologische Instanz auf der Grundlage des Elements.
  • Bei Arbeitsschritt 706 werden ontologische Instanzen auf entsprechende Themenklassifizierungen abgebildet, wobei auf der Grundlage jeder ontologischen Instanz (z.B. durch die Ontologie-Steuereinheit) ein Thema zugewiesen wird. In mindestens einer Ausführungsform wird das Thema gemäß Synonymen der Instanz erweitert. Die Themensynonyme können unter Verwendung von lexikalischen Klassifizierungsregeln der entsprechenden Instanz erzeugt werden. Bei Arbeitsschritt 708 wird jedes Thema um einen Kontext, d.h. eine Klasse, entsprechend der Klassenzugehörigkeit der ontologischen Instanz erweitert. In mindestens einer Ausführungsform wird das Thema gemäß Synonymen des Themas erweitert. Die Themensynonyme können unter Verwendung von lexikalischen Klassifizierungsregeln der entsprechenden Instanz erzeugt werden.
  • Bei Arbeitsschritt 710 werden der Klasse zugehörige Eigenschaften identifiziert. In mindestens einer Ausführungsform verwendet die Ontologie-Steuereinheit eine identifizierte Instanz, um eine entsprechende Klasse zu ermitteln, und ermittelt dann die Eigenschaften auf der Grundlage der ermittelten Klasse. Bei Arbeitsschritt 712 werden inhaltliche Informationen der Themen identifiziert und Synonyme für jedes Zugeschriebene des identifizierten Themas erzeugt. Bei Arbeitsschritt 714 werden die Attribute der Eigenschaften ermittelt, die Eigenschaften werden durch Erzeugen einer Liste von Synonymen, die den identifizierten Attributen der Eigenschaften zugehörig sind, erweitert, und das Verfahren endet bei Arbeitsschritt 716. Auf diese Weise kann die von der Ontologie-Steuereinheit erzeugte Ontologie-Hierarchie der Ereignisumwandlungs-Steuereinheit 408 zugestellt werden, die ihrerseits automatisch externe Suchkriterien zur Verwendung zum Ausführen einer externen Suchabfrage erzeugt. Die externe Abfrage kann dem Benutzer bisher unbekannte externe Datenergebnisse bereitstellen, die dann mit den anfänglichen Echtzeit-Abfragedaten oder auf einen Benutzer ausgerichteten Ereignissen verschmolzen oder „zusammengefügt“ werden, um den Analyseprozess des Benutzers zu verbessern.
  • Wie hierin beschrieben, stellen verschiedene nicht einschränkende Ausführungsformen ein Big-Data-Analysesystem bereit, das Elemente identifiziert, die auf einen Benutzer ausgerichtete Ereignisse umfassen, die sich aus Echtzeit-Datenereignissen ergeben (z. B. plötzliche Trends, Ausreißer, Muster, Beziehungen usw.). Das Big-Data-Analysesystem wandelt die identifizierten Elemente, die dem erkannten, auf einen Benutzer ausgerichteten Ereignis als Kontext zugehörig sind, in Suchkriterien um. Eine Suchabfrage mit diesen Kriterien kann durch die externe Datensteuereinheit ausgeführt werden, wodurch relevante, verarbeitete, dem Benutzer unbekannte Ergebnisse auf der Grundlage der Suchkriterien bereitgestellt werden. Diese Ergebnisse werden automatisch mit dem ursprünglichen Datensatz „zusammengefügt“, so dass ein Benutzer eine tiefere Analyse anormaler Ereignisse in der Visualisierung durchführen kann, um diese von externen Datendimensionen aus besser zu verstehen. Das Big-Data-Analysesystem ist auch in der Lage, Benutzerdaten automatisch mit relevanten externen Daten anzureichern, die dem Benutzer möglicherweise nicht bekannt sind. Auf diese Weise können die durch das Big-Data-Analysesystem ausgegebenen Daten die Analyse des Benutzers ohne jegliche manuelle Prozesse durch den Benutzer um zusätzliche Einblicke und Datenkorrelationen erweitern, während es gleichzeitig zu einer drastischen Einsparung von Zeit und Aufwand in deren Analyseprozess kommt.
  • Verschiedene Ausführungsformen der Erfindung werden hierin unter Bezugnahme auf die zugehörigen Zeichnungen beschrieben. Alternative Ausführungsformen können ausgeklügelt werden, ohne von dem Schutzumfang dieser Erfindung abzuweichen. Obwohl in der folgenden Beschreibung und in den Zeichnungen verschiedene Verbindungen und Positionsbeziehungen (z.B. über, unter, neben usw.) zwischen den Elementen dargelegt sind, werden Fachleute erkennen, dass viele der hierin beschriebenen Positionsbeziehungen ausrichtungsunabhängig sind, wenn die beschriebene Funktionalität beibehalten wird, obwohl die Ausrichtung geändert wird. Diese Verbindungen und/oder Positionsbeziehungen können, sofern nicht anders angegeben, direkt oder indirekt sein, und die vorliegende Erfindung soll diesbezüglich nicht einschränkend sein. Dementsprechend kann sich ein Verbinden von Entitäten miteinander entweder auf eine direkte oder eine indirekte Verbindung beziehen, und eine Positionsbeziehung zwischen Entitäten kann eine direkte oder indirekte Positionsbeziehung sein. Als Beispiel für eine indirekte Positionsbeziehung umfassen Verweise in der vorliegenden Beschreibung auf ein Bilden einer Schicht „A“ über einer Schicht „B“ Situationen, in denen eine oder mehrere Zwischenschichten (z.B. eine Schicht „C“) zwischen Schicht „A“ und Schicht „B“ liegen, solange die relevanten Eigenschaften und Funktionalitäten von Schicht „A“ und Schicht „B“ durch die Zwischenschicht(en) nicht wesentlich verändert werden.
  • Die folgenden Definitionen und Abkürzungen sind für die Auslegung der Ansprüche und der Beschreibung zu verwenden. Die hierin verwendeten Begriffe „weist auf“, „aufweisend“, „beinhaltet“, „beinhaltend“, „verfügt über“, „verfügend über“, „enthält“ oder „enthaltend“ oder jede andere Abwandlung davon, sollen eine nicht ausschließliche Einbeziehung abdecken. Zum Beispiel ist eine Zusammensetzung, eine Mischung, ein Prozess, ein Verfahren, ein Gegenstand oder eine Vorrichtung, die eine Liste von Elementen aufweist, nicht notwendigerweise auf nur diese Elemente beschränkt, sondern kann auch andere Elemente enthalten, die nicht ausdrücklich aufgeführt sind oder in einer/einem derartigen Zusammensetzung, Mischung, Prozess, Verfahren, Gegenstand oder Vorrichtung von Natur aus enthalten sind.
  • Zusätzlich wird der Begriff „beispielhaft“ hierin als „als Beispiel, Einzelfall oder Veranschaulichung“ bedeutend verwendet. Jede Ausführungsform bzw. Ausgestaltung, die hierin als „beispielhaft“ beschrieben wird, ist nicht unbedingt als bevorzugt oder vorteilhaft gegenüber anderen Ausführungsformen bzw. Ausgestaltungen auszulegen. Die Begriffe „mindestens ein(e)“ und „ein(e) oder mehrere“ werden so verstanden, dass sie jede beliebige ganzzahlige Zahl größer oder gleich eins einschließen, d.h. eins, zwei, drei, vier usw. Der Begriff „eine Mehrzahl“ wird so verstanden, dass er jede beliebige ganzzahlige Zahl größer oder gleich zwei einschließt, d.h. zwei, drei, vier, fünf usw. Der Begriff „Verbindung“ kann eine „indirekte Verbindung“ und eine „direkte Verbindung“ beinhalten.
  • Verweise in der Beschreibung auf „eine einzelne Ausführungsform“, „eine Ausführungsform“, „ein Ausführungsbeispiel“ usw. geben an, dass die beschriebene Ausführungsform eine bestimmte Funktion, Struktur oder Eigenschaft enthalten kann, wobei aber nicht jede Ausführungsform die bestimmte Funktion, Struktur oder Eigenschaft enthalten muss. Außerdem beziehen sich solche Ausdrücke nicht unbedingt auf dieselbe Ausführungsform. Wenn eine bestimmte Funktion, Struktur oder Eigenschaft in Verbindung mit einer Ausführungsform beschrieben wird, wird darüber hinaus geltend gemacht, dass es im Rahmen der Kenntnisse eines Fachmanns liegt, diese Funktion, Struktur oder Eigenschaft in Verbindung mit anderen Ausführungsformen durchzuführen, unabhängig davon, ob dies ausdrücklich beschrieben wird oder nicht.
  • Zum Zweck der nachstehenden Beschreibung sollen sich Begriffe wie „obere“, „untere“, „rechts“, „links“, „vertikal“, „horizontal“, „oben“, „unten“ und Abwandlungen davon auf die beschriebenen Strukturen und Verfahren beziehen, wie in den Zeichnungsfiguren ausgerichtet. Die Begriffe „darüberliegend“, „über“, „auf“, „positioniert auf“ oder „positioniert über“ bedeuten, dass ein erstes Element, wie zum Beispiel eine erste Struktur, auf einem zweiten Element, wie zum Beispiel einer zweiten Struktur, vorhanden ist, wobei zwischen dem ersten Element und dem zweiten Element dazwischenliegende Elemente, wie zum Beispiel eine Schnittstellenstruktur, vorhanden sein können. Der Begriff „elektrische Übertragung“ bedeutet jedes beliebige Mittel zum Übertragen eines elektrischen Signals von einem ersten Knoten zu einem zweiten Knoten, darunter drahtgebundene Verbindungen und/oder drahtlose Verbindungen, aber nicht darauf beschränkt.
  • Die Begriffe „ungefähr“, „im Wesentlichen“, „annähernd“ und Abwandlungen davon sollen den Grad des Fehlers einschließen, der einer Messung des bestimmten Betrags auf der Grundlage der zum Zeitpunkt der Einreichung der Anmeldung verfügbaren Ausrüstung zugehörig ist. Zum Beispiel kann „ungefähr“ einen Bereich von ± 8 % oder 5 % oder 2 % eines bestimmten Wertes umfassen.
  • Der Kürze halber können Techniken, die sich auf ein Speichern und Verarbeiten von Datenbanken beziehen, hier im Detail beschrieben sein oder auch nicht. Zum Beispiel können spezifische Bilderkennungsalgorithmen und/oder Lernalgorithmen durch das raumbezogene Datenbanksystem umgesetzt werden, um verschiedene Datenabfragen und - analysen durchzuführen. Obwohl spezifische Arbeitsschritte analytischer Algorithmen, die beim Umsetzen einer oder mehrerer Ausführungsformen der vorliegenden Erfindung verwendet werden, individuell bekannt sein können, ist die beschriebene Kombination von Arbeitsschritten und/oder sich daraus ergebenden Strukturen der vorliegenden Erfindung einzigartig. Folglich kann die einzigartige Kombination der Arbeitsschritte, die in Zusammenhang mit einer raumbezogenen Datenanalyse gemäß der vorliegenden Erfindung beschrieben sind, eine Vielfalt von individuell bekannten Datenverarbeitungs- und Analyse-Arbeitsschritten umsetzen, von denen einige in den unmittelbar folgenden Abschnitten beschrieben sind, und dennoch ein einzigartiges und neuartiges System darstellen.
  • Bei der vorliegenden Erfindung kann es sich um ein System, ein Verfahren und/oder ein Computerprogrammprodukt auf jeder möglichen Integrationsstufe technischer Einzelheiten handeln. Das Computerprogrammprodukt kann (ein) durch einen Computer lesbare(s) Speichermedium (oder -medien) umfassen, auf dem/denen durch einen Computer lesbare Programmanweisungen gespeichert ist/sind, um einen Prozessor dazu zu veranlassen, Aspekte der vorliegenden Erfindung auszuführen.
  • Bei dem durch einen Computer lesbaren Speichermedium kann es sich um eine physische Einheit handeln, die Anweisungen zur Verwendung durch ein System zur Ausführung von Anweisungen behalten und speichern kann. Bei dem durch einen Computer lesbaren Speichermedium kann es sich zum Beispiel um eine elektronische Speichereinheit, eine magnetische Speichereinheit, eine optische Speichereinheit, eine elektromagnetische Speichereinheit, eine Halbleiterspeichereinheit oder jede geeignete Kombination daraus handeln, ohne auf diese beschränkt zu sein. Zu einer nicht erschöpfenden Liste spezifischerer Beispiele des durch einen Computer lesbaren Speichermediums gehören die Folgenden: eine tragbare Computerdiskette, eine Festplatte, ein Direktzugriffsspeicher (RAM), ein Nur-Lese-Speicher (ROM), ein löschbarer programmierbarer Nur-Lese-Speicher (EPROM bzw. Flash-Speicher), ein statischer Direktzugriffsspeicher (SRAM), ein tragbarer Kompaktspeicherplatte-Nur-Lese-Speicher (CD-ROM), eine DVD (digital versatile disc), ein Speicher-Stick, eine Diskette, eine mechanisch kodierte Einheit wie zum Beispiel Lochkarten oder erhabene Strukturen in einer Rille, auf denen Anweisungen gespeichert sind, und jede geeignete Kombination daraus. Ein durch einen Computer lesbares Speichermedium soll in der Verwendung hierin nicht als flüchtige Signale an sich aufgefasst werden, wie zum Beispiel Funkwellen oder andere sich frei ausbreitende elektromagnetische Wellen, elektromagnetische Wellen, die sich durch einen Wellenleiter oder ein anderes Übertragungsmedium ausbreiten (z.B. durch ein Glasfaserkabel geleitete Lichtimpulse) oder durch einen Draht übertragene elektrische Signale.
  • Hierin beschriebene, durch einen Computer lesbare Programmanweisungen können von einem durch einen Computer lesbaren Speichermedium auf jeweilige Datenverarbeitungs-/Verarbeitungseinheiten oder über ein Netzwerk wie zum Beispiel das Internet, ein lokales Netzwerk, ein Weitverkehrsnetz und/oder ein drahtloses Netzwerk auf einen externen Computer oder eine externe Speichereinheit heruntergeladen werden. Das Netzwerk kann Kupferübertragungskabel, Lichtwellenübertragungsleiter, drahtlose Übertragung, Leitwegrechner, Firewalls, Vermittlungseinheiten, Gateway-Computer und/oder Edge-Server aufweisen. Eine Netzwerkadapterkarte oder Netzwerkschnittstelle in jeder Datenverarbeitungs-/Verarbeitungseinheit empfängt durch einen Computer lesbare Programmanweisungen aus dem Netzwerk und leitet die durch einen Computer lesbaren Programmanweisungen zur Speicherung in einem durch einen Computer lesbaren Speichermedium innerhalb der entsprechenden Datenverarbeitungs-/Verarbeitungseinheit weiter.
  • Bei durch einen Computer lesbaren Programmanweisungen zum Ausführen von Arbeitsschritten der vorliegenden Erfindung kann es sich um Assembler-Anweisungen, ISA-Anweisungen (Instruction-Set-Architecture), Maschinenanweisungen, maschinenabhängige Anweisungen, Mikrocode, Firmware-Anweisungen, zustandssetzende Daten, Konfigurationsdaten für integrierte Schaltungen oder entweder Quellcode oder Objektcode handeln, die in einer beliebigen Kombination aus einer oder mehreren Programmiersprachen geschrieben werden, darunter objektorientierte Programmiersprachen wie Smalltalk, C++ o.ä. sowie herkömmliche prozedurale Programmiersprachen wie die Programmiersprache „C“ oder ähnliche Programmiersprachen. Die durch einen Computer lesbaren Programmanweisungen können vollständig auf dem Computer des Benutzers, teilweise auf dem Computer des Benutzers, als eigenständiges Software-Paket, teilweise auf dem Computer des Benutzers und teilweise auf einem fernen Computer oder vollständig auf dem fernen Computer oder Server ausgeführt werden. In letzterem Fall kann der entfernt angeordnete Computer mit dem Computer des Benutzers durch eine beliebige Art Netzwerk verbunden sein, darunter ein lokales Netzwerk (LAN) oder ein Weitverkehrsnetz (WAN), oder die Verbindung kann mit einem externen Computer hergestellt werden (zum Beispiel über das Internet unter Verwendung eines Internet-Dienstanbieters). In einigen Ausführungsformen können elektronische Schaltungen, darunter zum Beispiel programmierbare Logikschaltungen, im Feld programmierbare Gatter-Anordnungen (FPGA, field programmable gate arrays) oder programmierbare Logikanordnungen (PLA, programmable logic arrays) die durch einen Computer lesbaren Programmanweisungen ausführen, indem sie Zustandsinformationen der durch einen Computer lesbaren Programmanweisungen nutzen, um die elektronischen Schaltungen zu personalisieren, um Aspekte der vorliegenden Erfindung durchzuführen.
  • Aspekte der vorliegenden Erfindung sind hierin unter Bezugnahme auf Ablaufpläne und/oder Blockschaltbilder bzw. Schaubilder von Verfahren, Vorrichtungen (Systemen) und Computerprogrammprodukten gemäß Ausführungsformen der Erfindung beschrieben. Es wird darauf hingewiesen, dass jeder Block der Ablaufpläne und/oder der Blockschaltbilder bzw. Schaubilder sowie Kombinationen von Blöcken in den Ablaufplänen und/oder den Blockschaltbildern bzw. Schaubildern mittels durch einen Computer lesbarer Programmanweisungen ausgeführt werden können.
  • Diese durch einen Computer lesbaren Programmanweisungen können einem Prozessor eines Universalcomputers, eines Spezialcomputers oder einer anderen programmierbaren Datenverarbeitungsvorrichtung bereitgestellt werden, um eine Maschine zu erzeugen, so dass die über den Prozessor des Computers bzw. der anderen programmierbaren Datenverarbeitungsvorrichtung ausgeführten Anweisungen ein Mittel zur Umsetzung der in dem Block bzw. den Blöcken der Ablaufpläne und/oder der Blockschaltbilder bzw. Schaubilder festgelegten Funktionen/Schritte erzeugen. Diese durch einen Computer lesbaren Programmanweisungen können auch auf einem durch einen Computer lesbaren Speichermedium gespeichert sein, das einen Computer, eine programmierbare Datenverarbeitungsvorrichtung und/oder andere Einheiten so steuern kann, dass sie auf eine bestimmte Art funktionieren, so dass das durch einen Computer lesbare Speichermedium, auf dem Anweisungen gespeichert sind, ein Herstellungsprodukt aufweist, darunter Anweisungen, welche Aspekte der/des in dem Block bzw. den Blöcken des Ablaufplans und/oder der Blockschaltbilder bzw. Schaubilder angegebenen Funktion/Schritts umsetzen.
  • Die durch einen Computer lesbaren Programmanweisungen können auch auf einen Computer, eine andere programmierbare Datenverarbeitungsvorrichtung oder eine andere Einheit geladen werden, um das Ausführen einer Reihe von Prozessschritten auf dem Computer bzw. der anderen programmierbaren Vorrichtung oder anderen Einheit zu verursachen, um einen auf einem Computer ausgeführten Prozess zu erzeugen, so dass die auf dem Computer, einer anderen programmierbaren Vorrichtung oder einer anderen Einheit ausgeführten Anweisungen die in dem Block bzw. den Blöcken der Ablaufpläne und/oder der Blockschaltbilder bzw. Schaubilder festgelegten Funktionen/Schritte umsetzen.
  • Die Ablaufpläne und die Blockschaltbilder bzw. Schaubilder in den Figuren veranschaulichen die Architektur, die Funktionalität und den Betrieb möglicher Ausführungen von Systemen, Verfahren und Computerprogrammprodukten gemäß verschiedenen Ausführungsformen der vorliegenden Erfindung. In diesem Zusammenhang kann jeder Block in den Ablaufplänen oder Blockschaltbildern bzw. Schaubildern ein Modul, ein Segment oder einen Teil von Anweisungen darstellen, die eine oder mehrere ausführbare Anweisungen zur Ausführung der bestimmten logischen Funktion(en) aufweisen. In einigen alternativen Ausführungen können die in dem Block angegebenen Funktionen in einer anderen Reihenfolge als in den Figuren gezeigt stattfinden. Zwei nacheinander gezeigte Blöcke können zum Beispiel in Wirklichkeit im Wesentlichen gleichzeitig ausgeführt werden, oder die Blöcke können manchmal je nach entsprechender Funktionalität in umgekehrter Reihenfolge ausgeführt werden. Es ist ferner anzumerken, dass jeder Block der Blockschaltbilder bzw. Schaubilder und/oder der Ablaufpläne sowie Kombinationen aus Blöcken in den Blockschaltbildern bzw. Schaubildern und/oder den Ablaufplänen durch spezielle auf Hardware beruhende Systeme umgesetzt werden können, welche die festgelegten Funktionen oder Schritte durchführen, oder Kombinationen aus Spezial-Hardware und Computeranweisungen ausführen.
  • Die Beschreibungen der verschiedenen Ausführungsformen der vorliegenden Erfindung wurden zum Zwecke der Veranschaulichung aufgeführt, sollen jedoch nicht gesamthaft stehen für bzw. begrenzt sein auf die beschriebenen Ausführungsformen. Für Fachleute werden viele Abänderungen und Abwandlungen ersichtlich sein, ohne von dem Umfang und dem Sinngehalt der beschriebenen Ausführungsformen abzuweichen. Die hierin verwendete Terminologie wurde gewählt, um die Grundgedanken der Ausführungsformen, die praktische Anwendung oder technische Verbesserung gegenüber auf dem Markt vorgefundenen Technologien bestmöglich zu erläutern oder um es anderen Fachleuten zu ermöglichen, die hierin beschriebenen Ausführungsformen zu verstehen.

Claims (25)

  1. Big-Data-Analysesystem, aufweisend: eine Ereignisüberwachungs-Steuereinheit, die zum Erkennen mindestens eines auf einen Benutzer ausgerichteten Ereignisses aus einem Datenfluss einer anfänglichen Abfrage konfiguriert ist; eine Ereignisumwandlungs-Steuereinheit, die mit der Ereignisüberwachungs-Steuereinheit Signale austauscht und konfiguriert ist zum Ermitteln mindestens eines kontextuellen Elements, das dem mindestens einen auf einen Benutzer ausgerichteten Ereignis zugehörig ist, und zum automatischen Umwandeln des mindestens einen kontextuellen Elements in ein Suchkriterium; eine Steuereinheit für ein Erstellungsprogramm für externe Datenabfragen, die konfiguriert ist zum automatischen Ausführen einer externe Suchabfrage auf der Grundlage der Suchkriterien; und eine Datenverschmelzungs-Steuereinheit, die konfiguriert ist zum automatischen Verschmelzen des mindestens einen kontextuellen Elements, das aus dem mindestens einen auf einen Benutzer ausgerichteten Ereignis erzeugt wird, mit externen Suchergebnissen, die aus der externen Suchabfrage und dem Datenfluss einer anfänglichen Abfrage erzeugt werden, um eine Datei mit verschmolzenen Daten zu erzeugen.
  2. Big-Data-Analysesystem nach Anspruch 1, wobei die Ereignisumwandlungs-Steuereinheit das mindestens eine kontextuelle Element als Reaktion auf ein Erzeugen einer ontologischen Hierarchie auf der Grundlage des mindestens einen kontextuellen Elements automatisch umwandelt.
  3. Big-Data-Analysesystem nach Anspruch 2, wobei die ontologische Hierarchie Informationseigenschaften umfasst, die aus einer Gruppe ausgewählt werden, die Themen, Kontext und Gegenstände aufweist.
  4. Big-Data-Analysesystem nach Anspruch 3, wobei die Informationseigenschaften darüber hinaus Instanzen, Klassen, Attribute und Beziehungen auf der Grundlage des Abfrage-Datenflusses umfassen.
  5. Big-Data-Analysesystem nach Anspruch 4, wobei die Informationseigenschaften darüber hinaus Zeitrauminformationen und Standortinformationen auf der Grundlage des Abfrage-Datenflusses umfassen.
  6. Big-Data-Analysesystem nach Anspruch 5, darüber hinaus aufweisend: eine Abfragedaten-Steuereinheit, die mit der Ereignisüberwachungs-Steuereinheit Signale austauscht, wobei die Abfragedaten-Steuereinheit zum Abrufen des Abfrage-Datenflusses als Reaktion auf eine durch einen Benutzer eingegebene Datenanforderung konfiguriert ist; eine Ziel-Ereignis-Speichereinheit, die mit der Ereignisüberwachungs-Steuereinheit Signale austauscht, um mindestens ein durch den Benutzer eingegebenes, benutzerdefiniertes Ziel-Ereignis zu speichern; eine Ontologie-Steuereinheit, die mit der Ereignisumwandlungs-Steuereinheit Signale austauscht, wobei die Ontologie-Steuereinheit konfiguriert ist zum Ermitteln mindestens einer ontologischen Instanz auf der Grundlage des mindestens einen kontextuellen Elements; ein externes Datensystem, das mit der Steuereinheit für ein Erstellungsprogramm für externe Datenabfragen Signale austauscht, um die externen Suchergebnisse auf der Grundlage der externen Suchabfrage zu erzeugen und die externen Suchergebnisse der Datenverschmelzungs-Steuereinheit zuzustellen; und eine Visualisierungswiedergabe-Steuereinheit, die mit der Datenverschmelzungs-Steuereinheit Signale austauscht, wobei die Visualisierungswiedergabe-Steuereinheit konfiguriert ist zum Erzeugen einer grafischen Benutzerschnittstelle (GUI), die visuelle Ergebnisse der Datei mit verschmolzenen Daten anzeigt.
  7. Big-Data-Analysesystem nach Anspruch 6, wobei die Ontologie-Steuereinheit mindestens ein Informationsthema auf der Grundlage der mindestens einen ontologischen Instanz ermittelt und eine erweiterte Themenliste erzeugt, die mindestens ein Instanzen-Synonym enthält.
  8. Big-Data-Analysesystem nach Anspruch 7, wobei die Ontologie-Steuereinheit eine Klasse der mindestens einen ontologischen Instanz ermittelt und mindestens eine Eigenschaft der Klasse ermittelt.
  9. Big-Data-Analysesystem nach Anspruch 8, wobei die Ontologie-Steuereinheit auf der Grundlage einer Klasse, die der ontologischen Instanz entspricht, einen jedem Thema entsprechenden Kontext ermittelt, und auf der Grundlage des ermittelten Kontexts eine erweiterte Kontextliste erzeugt, die mindestens ein Klassen-Synonym enthält.
  10. Big-Data-Analysesystem nach Anspruch 9, wobei die Ontologie-Steuereinheit mindestens ein Attribut der mindestens einen Eigenschaft ermittelt und eine zweite erweiterte Liste erzeugt, die mindestens ein Eigenschaften-Synonym für jedes ermittelte Attribut der mindestens einen Eigenschaft erzeugt.
  11. Verfahren zum automatischen Erzeugen einer Datei mit verschmolzenen Daten auf der Grundlage eines durch ein Big-Data-Analysesystem erhaltenen Datenflusses einer anfänglichen Abfrage, das Verfahren aufweisend: Erkennen, mittels einer elektronischen Ereignisüberwachungs-Steuereinheit, mindestens eines auf einen Benutzer ausgerichteten Ereignisses aus dem Abfrage-Datenfluss; Ermitteln, mittels einer elektronischen Ereignisumwandlungs-Steuereinheit, mindestens eines kontextuellen Elements, das dem mindestens einen auf einen Benutzer ausgerichteten Ereignis zugehörig ist; automatisches Umwandeln, mittels der Ereignisumwandlungs-Steuereinheit, des mindestens einen kontextuellen Elements in ein Suchkriterium; automatisches Ausführen, mittels einer elektronischen Steuereinheit für ein Erstellungsprogramm für externe Datenabfragen, einer externen Suchabfrage auf der Grundlage der Suchkriterien; und automatisches Verschmelzen, mittels einer elektronischen Datenverschmelzungs-Steuereinheit, des mindestens einen kontextuellen Elements, das aus dem mindestens einen auf einen Benutzer ausgerichteten Ereignis erzeugt wird, mit externen Suchergebnissen, die aus der externen Suchabfrage und dem Datenfluss einer anfänglichen Abfrage erzeugt werden, um die Datei mit verschmolzenen Daten zu erzeugen.
  12. Verfahren nach Anspruch 11, darüber hinaus aufweisend ein automatisches Umwandeln, mittels der Ereignisumwandlungs-Steuereinheit, des mindestens einen kontextuellen Elements als Reaktion auf ein Erzeugen einer ontologischen Hierarchie auf der Grundlage des mindestens einen kontextuellen Elements.
  13. Verfahren nach Anspruch 12, wobei das Erzeugen einer ontologischen Hierarchie darüber hinaus ein Erzeugen einer Informationseigenschaft aufweist, die aus einer Gruppe ausgewählt wird, die Themen, Kontext und Gegenstände aufweist.
  14. Verfahren nach Anspruch 13, wobei das Erzeugen der Informationseigenschaften darüber hinaus ein Erzeugen von erweiterten Informationen aufweist, die aus einer Gruppe ausgewählt werden, die Instanzen, Klassen, Attribute, Beziehungen, Zeitraum und Ort umfasst.
  15. Verfahren nach Anspruch 14, darüber hinaus aufweisend: Abrufen, mittels einer elektronischen Abfragedaten-Steuereinheit, des Abfragedatenflusses als Reaktion auf eine durch einen Benutzer eingegebene Datenanforderung; Speichern, mittels einer Ziel-Ereignis-Speichereinheit, mindestens eines durch den Benutzer eingegebenen, benutzerdefinierten Ziel-Ereignisses; Ermitteln, mittels einer elektronischen Ontologie-Steuereinheit, mindestens einer ontologischen Instanz auf der Grundlage des mindestens einen kontextuellen Elements; Erzeugen, mittels eines elektronischen externen Datensystems, der externen Suchergebnisse auf der Grundlage der externen Suchabfrage und Zustellen der externen Suchergebnisse an die Datenverschmelzungs-Steuereinheit; und Erzeugen, mittels einer elektronischen Visualisierungswiedergabe-Steuereinheit, einer Statusübersicht, die das mindestens eine kontextuelle Element mit den externen Suchergebnissen korreliert; und Erzeugen einer grafischen Benutzerschnittstelle (GUI), die eine Statusübersicht anzeigt.
  16. Verfahren nach Anspruch 15, darüber hinaus aufweisend ein Ermitteln, mittels der Ontologie-Steuereinheit, mindestens eines Informationsthemas auf der Grundlage der mindestens einen ontologischen Instanz.
  17. Verfahren nach Anspruch 16, darüber hinaus aufweisend ein Ermitteln, mittels der Ontologie-Steuereinheit, einer Klasse der mindestens einen ontologischen Instanz und mindestens einer Eigenschaft der Klasse.
  18. Computerprogrammprodukt zum automatischen Erzeugen einer Datei mit verschmolzenen Daten auf der Grundlage eines durch ein Big-Data-Analysesystem erhaltenen Datenflusses einer anfänglichen Abfrage, das Computerprogrammprodukt aufweisend: ein durch einen Computer lesbares Speichermedium, auf dem Programmanweisungen gespeichert sind, die durch mindestens eine elektronische Hardware-Steuereinheit ausführbar sind, wobei die Programmanweisungen Folgendes umfassen: erste Programmanweisungen, die durch eine elektronische Ereignisüberwachungs-Steuereinheit ausführbar sind, um die Ereignisüberwachungs-Steuereinheit zu veranlassen, mindestens ein auf einen Benutzer ausgerichtetes Ereignis aus dem Abfrage-Datenfluss zu erkennen; zweite Programmanweisungen, die durch eine Ereignisumwandlungs-Steuereinheit, die mit der Ereignisüberwachungs-Steuereinheit Signale austauscht, ausführbar sind, um die Umwandlungssteuereinheit zu veranlassen, mindestens ein kontextuelles Element zu ermitteln, das dem mindestens einen auf einen Benutzer ausgerichteten Ereignis zugehörig ist, und das mindestens eine kontextuelle Element automatisch in ein Suchkriterium umzuwandeln; dritte Programmanweisungen, die durch eine elektronische Steuereinheit für ein Erstellungsprogramm für externe Datenabfragen ausführbar sind, um die Steuereinheit für ein Erstellungsprogramm für externe Datenabfragen zu veranlassen, automatisch eine externe Suchabfrage auf der Grundlage der Suchkriterien auszuführen; und vierte Programmanweisungen, die durch eine elektronische Datenverschmelzungs-Steuereinheit ausführbar sind, um die Datenverschmelzungs-Steuereinheit zu veranlassen, das mindestens eine kontextuelle Element, das aus dem mindestens einen auf einen Benutzer ausgerichteten Ereignis erzeugt wird, mit externen Suchergebnissen automatisch zu verschmelzen, die aus der externen Suchabfrage und dem Datenfluss einer anfänglichen Abfrage erzeugt werden, um eine Datei mit verschmolzenen Daten zu erzeugen.
  19. Computerprogrammprodukt nach Anspruch 18, wobei die Ereignisumwandlungs-Steuereinheit das mindestens eine kontextuelle Element als Reaktion auf ein Erzeugen einer ontologischen Hierarchie auf der Grundlage des mindestens einen kontextuellen Elements automatisch umwandelt.
  20. Computerprogrammprodukt nach Anspruch 19, wobei die ontologische Hierarchie Informationseigenschaften umfasst, die aus einer Gruppe ausgewählt werden, die Themen, Kontext und Gegenstände aufweist.
  21. Computerprogrammprodukt nach Anspruch 20, wobei die Informationseigenschaften darüber hinaus Instanzen, Klassen, Attribute, Beziehungen, Zeitrauminformationen und Standortinformationen umfassen.
  22. Datenanalysesystem, aufweisend: eine Ereignisüberwachungs-Steuereinheit, die zum Erkennen mindestens eines auf einen Benutzer ausgerichteten Ereignisses aus einem Datenfluss einer anfänglichen Abfrage konfiguriert ist; eine Ereignisumwandlungs-Steuereinheit, die mit der Ereignisüberwachungs-Steuereinheit Signale austauscht und konfiguriert ist zum automatischen Umwandeln mindestens eines kontextuellen Elements, das einem erkannten, auf einen Benutzer ausgerichteten Ereignis zugehörig ist, in ein Suchkriterium; eine Datenverschmelzungs-Steuereinheit, die konfiguriert ist zum automatischen Verschmelzen des mindestens einen kontextuellen Elements, das aus dem mindestens einen auf einen Benutzer ausgerichteten Ereignis erzeugt wird, mit externen Suchergebnissen, die aus einer externen Suchabfrage und dem Datenfluss einer anfänglichen Abfrage erzeugt werden, um eine Datei mit verschmolzenen Daten zu erzeugen; und eine grafische Benutzerschnittstelle (GUI), die zum Anzeigen von visuellen Ergebnissen der Datei mit verschmolzenen Daten konfiguriert ist.
  23. Datenanalysesystem nach Anspruch 22, wobei die Ereignisumwandlungs-Steuereinheit das mindestens eine kontextuelle Element als Reaktion auf ein Erzeugen einer ontologischen Hierarchie auf der Grundlage des mindestens einen kontextuellen Elements automatisch umwandelt.
  24. Verfahren zum automatischen Erzeugen einer Datei mit verschmolzenen Daten auf der Grundlage eines Datenflusses einer anfänglichen Abfrage, das Verfahren aufweisend: Erkennen mindestens eines auf einen Benutzer ausgerichteten Ereignisses aus dem Abfrage-Datenfluss; automatisches Umwandeln des mindestens einen kontextuellen Elements, das einem erkannten, auf einen Benutzer ausgerichteten Ereignis zugehörig ist, in ein Suchkriterium; automatisches Verschmelzen des mindestens einen kontextuellen Elements, das aus dem mindestens einen auf einen Benutzer ausgerichteten Ereignis erzeugt wird, mit externen Suchergebnissen, die aus einer externen Suchabfrage und dem Datenfluss einer anfänglichen Abfrage erzeugt werden, um eine Datei mit verschmolzenen Daten zu erzeugen; und Anzeigen, mittels einer grafischen Benutzerschnittstelle (GUI), von visuellen Ergebnissen der Datei mit verschmolzenen Daten.
  25. Verfahren nach Anspruch 24, wobei das Umwandeln des mindestens einen kontextuellen Elements Folgendes aufweist: Ermitteln einer ontologischen Hierarchie auf der Grundlage des mindestens einen kontextuellen Elements; und automatisches Erzeugen der Suchkriterien auf der Grundlage der ontologischen Hierarchie.
DE112018005424.1T 2017-11-17 2018-11-08 Automatisches Verbinden von externen Daten mit einem Geschäftsanalyseprozess Pending DE112018005424T5 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/816,528 US10956420B2 (en) 2017-11-17 2017-11-17 Automatically connecting external data to business analytics process
US15/816,528 2017-11-17
PCT/IB2018/058763 WO2019097362A1 (en) 2017-11-17 2018-11-08 Automatically connecting external data to business analytics process

Publications (1)

Publication Number Publication Date
DE112018005424T5 true DE112018005424T5 (de) 2020-07-30

Family

ID=66532365

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112018005424.1T Pending DE112018005424T5 (de) 2017-11-17 2018-11-08 Automatisches Verbinden von externen Daten mit einem Geschäftsanalyseprozess

Country Status (6)

Country Link
US (2) US10956420B2 (de)
JP (1) JP7228319B2 (de)
CN (1) CN111295652B (de)
DE (1) DE112018005424T5 (de)
GB (1) GB2581917A (de)
WO (1) WO2019097362A1 (de)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110674371A (zh) * 2019-09-24 2020-01-10 Oppo广东移动通信有限公司 公交信息查询方法、装置、电子设备以及存储介质
CN113377809A (zh) * 2021-06-23 2021-09-10 北京百度网讯科技有限公司 数据处理方法及装置,计算设备和介质
CN116582462B (zh) * 2023-07-14 2023-09-22 浪潮通信信息系统有限公司 融合业务监控方法及装置

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005004300A (ja) * 2003-06-10 2005-01-06 Fujitsu Ltd 情報検索支援装置
JP4650927B2 (ja) * 2004-08-13 2011-03-16 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP2006215798A (ja) * 2005-02-03 2006-08-17 Nec Corp 業務分析・経営支援管理装置、業務分析・経営支援管理方法、及び業務分析・経営支援管理プログラム
US20060212265A1 (en) * 2005-03-17 2006-09-21 International Business Machines Corporation Method and system for assessing quality of search engines
US7668825B2 (en) * 2005-08-26 2010-02-23 Convera Corporation Search system and method
US20070088695A1 (en) * 2005-10-14 2007-04-19 Uptodate Inc. Method and apparatus for identifying documents relevant to a search query in a medical information resource
JP5272615B2 (ja) * 2008-09-26 2013-08-28 沖電気工業株式会社 検索装置、検索システム及び検索方法
US8983989B2 (en) * 2010-02-05 2015-03-17 Microsoft Technology Licensing, Llc Contextual queries
WO2011160140A1 (en) * 2010-06-18 2011-12-22 Susan Bennett System and method of semantic based searching
US9031958B2 (en) * 2011-04-18 2015-05-12 International Business Machines Corporation File searching on mobile devices
US8903813B2 (en) * 2012-07-02 2014-12-02 International Business Machines Corporation Context-based electronic document search using a synthetic event
US9460200B2 (en) * 2012-07-02 2016-10-04 International Business Machines Corporation Activity recommendation based on a context-based electronic files search
JP2014127019A (ja) * 2012-12-26 2014-07-07 Nec Corp 質問生成装置、情報処理装置、質問生成方法、情報処理方法、および、コンピュータ・プログラム
US20140201103A1 (en) * 2013-01-14 2014-07-17 National Cheng Kung University System for research and development information assisting in investment, and a method, a computer program, and a readable and recordable media for computer thereof
US9361653B2 (en) 2013-01-16 2016-06-07 Sap Se Social recommendations for business process platform
US9542488B2 (en) * 2013-08-02 2017-01-10 Google Inc. Associating audio tracks with video content
US9747778B2 (en) * 2013-12-17 2017-08-29 Samsung Electronics Co. Ltd. Context-aware compliance monitoring
CN103646111B (zh) 2013-12-25 2017-02-15 普元信息技术股份有限公司 大数据环境下实现实时数据关联的系统及方法
KR20160071678A (ko) * 2014-12-12 2016-06-22 한국과학기술정보연구원 사업 아이템 발굴 장치 및 방법
US10078843B2 (en) 2015-01-05 2018-09-18 Saama Technologies, Inc. Systems and methods for analyzing consumer sentiment with social perspective insight
CN105989150B (zh) 2015-03-02 2019-11-26 中国移动通信集团四川有限公司 一种基于大数据环境的数据查询方法及装置
US9269112B1 (en) 2015-03-12 2016-02-23 WeLink, Inc. Integrating location-based social media data with enterprise business intelligence applications
CN106202540A (zh) 2016-07-26 2016-12-07 浪潮通用软件有限公司 一种大型应用系统的数据库可横向扩展方法
CN106528725A (zh) 2016-10-28 2017-03-22 湖北工业大学 一种基于上下文感知的智慧城市云计算分析方法
CN106940724B (zh) 2017-03-20 2020-06-23 天津大学 一种面向大数据的多范型融合分析处理方法

Also Published As

Publication number Publication date
JP2021503652A (ja) 2021-02-12
JP7228319B2 (ja) 2023-02-24
CN111295652A (zh) 2020-06-16
US11188536B2 (en) 2021-11-30
US20190155931A1 (en) 2019-05-23
CN111295652B (zh) 2024-02-27
GB202007416D0 (en) 2020-07-01
US20190266160A1 (en) 2019-08-29
WO2019097362A1 (en) 2019-05-23
US10956420B2 (en) 2021-03-23
GB2581917A (en) 2020-09-02

Similar Documents

Publication Publication Date Title
DE112016003355B4 (de) Sicherer Einsatz einer Anwendung über Einsatzorte hinweg
Schreck et al. Visual analysis of social media data
DE112017007510T5 (de) Blockchain für offene wissenschaftliche forschung
DE112020003820T5 (de) Erkennung von Anomalien und Abweichungen unter Verwendung eines domänenindizierten Einschränkungs-Repository
DE112020002228T5 (de) Kognitive video- und audio-suchaggregation
Ford et al. Beauty, belief, and trust: toward a model of psychological processes in public acceptance of forest management
DE112016001902T5 (de) Schätzen von Rechenressourcen für die Ausführung von Data-Mining-Diensten
DE102017207686A1 (de) Einblicke in die belegschaftsstrategie
DE102012220390A1 (de) Verwenden des geografischen Ortes zum Ermitteln von Element- und Gebietsdaten zum Bereitstellen an eine Datenverarbeitungseinheit
DE112018005087T5 (de) Verbesserung von suchabfragen durch kontextanalyse
DE112018002266T5 (de) Kognitives Datenfiltern für Speicherumgebungen
DE112018005424T5 (de) Automatisches Verbinden von externen Daten mit einem Geschäftsanalyseprozess
DE112019001433T5 (de) Datenanonymisierung
DE102018010163A1 (de) Automatisches Generieren sinnvoller Nutzersegmente
DE112021004380T5 (de) Maschinelles merkmalslernen zur produktformulierung
IT201900005326A1 (it) Sistema e metodo automatizzato di estrazione e presentazione di informazioni quantitative tramite analisi predittiva di dati
EP3226186A1 (de) Kapazitätsanalyse- und -planungswerkzeug, insbesondere für eine informationstechnologie(-infrastruktur)
DE202014010918U1 (de) Das Clustering von Werbeanzeigen mit organischen Karteninhalten
DE112018005891T5 (de) Bibliotheks-Screening auf Krebswahrscheinlichkeit
DE112021001743T5 (de) Vektoreinbettungsmodelle für relationale tabellen mit null- oder äquivalenten werten
US10567850B2 (en) Hierarchical video concept tagging and indexing system for learning content orchestration
Razzaq Malik et al. Multiagent semantical annotation enhancement model for iot-based energy-aware data
DE112020000545T5 (de) Deep-forest-modell-entwicklung und -training
DE112019001822T5 (de) Änderung und darstellung von audio- und video-multimedia
DE102021127398A1 (de) Beziehungserkennung und -quantifizierung

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R084 Declaration of willingness to licence