DE102014103279A1 - Pivot-Facets für Text-Mining und Suche - Google Patents

Pivot-Facets für Text-Mining und Suche Download PDF

Info

Publication number
DE102014103279A1
DE102014103279A1 DE102014103279.9A DE102014103279A DE102014103279A1 DE 102014103279 A1 DE102014103279 A1 DE 102014103279A1 DE 102014103279 A DE102014103279 A DE 102014103279A DE 102014103279 A1 DE102014103279 A1 DE 102014103279A1
Authority
DE
Germany
Prior art keywords
pivot
query
facet
computer
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102014103279.9A
Other languages
English (en)
Inventor
Todd Leyba
Barton Emanuel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE102014103279A1 publication Critical patent/DE102014103279A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • G06F16/3326Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
    • G06F16/3328Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages using graphical result space presentation or visualisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Abstract

Bereitgestellt werden Techniken zum Bereitstellen und Verwenden von Pivot-Facets für Text-Mining und Suche. Ein Metadatenfeld wird einer Pivot-Facet zugeordnet. Als Reaktion auf ein Ausführen einer ersten Abfrage werden mindestens ein erstes Dokument und die Pivot-Facet angezeigt. Als Reaktion auf ein Auswählen der Pivot-Facet wird eine zweite Abfrage erzeugt, die einen Wert des Metadatenfeldes enthält, und die zweite Abfrage wird ausgeführt, um mindestens ein zweites Dokument ausfindig zu machen, das den Wert des Metadatenfeldes enthält.

Description

  • GEBIET
  • Ausführungsformen der Erfindung betreffen Pivot-Facets für Text-Mining und Suche.
  • HINTERGRUND
  • Such- und Textanalysesysteme arbeiten üblicherweise an „abgeflachten” Daten und Informationen, in denen verknüpfte Daten auf Dokumentenebene vereint werden. Ein Suchsystem empfängt üblicherweise eine Abfrage und führt die Abfrage aus, um Suchergebnisse, wie beispielsweise Dokumente, zu identifizieren. Die Suchergebnisse lösen sich auf Dokumentenebene auf und Facets (Dimensionen) können zum Navigieren oder für eine Suchverfeinerung (drill-down) verwendet werden, um engere Ergebnisse aus momentan verfügbaren Suchergebnissen auszuwählen, die durch die Abfrage und andere Auswahlkriterien tatsächlich eingeschränkt sind.
  • Ein Textanalysesystem analysiert üblicherweise Text in Dokumenten, um Informationen für eine Analyse zu erzeugen (z. B. mit einer lexikalischen Analyse zum Studieren von Worthäufigkeitsverteilungen, Mustererkennung, Kennzeichnen/Anmerken, Identifizierung, Informationsextraktion usw.). Eine Textanalyse kann auch als Data Mining bezeichnet werden und ein Durchführen einer Verknüpfungs- und Zuordnungsanalyse sowie einer Suchverfeinerung einschließen.
  • Gelegentlich werden auch relationale Daten in eine Such- oder Text-Mining-Sammlung einbezogen, die Beziehungen zwischen Informationen können jedoch abgeflacht werden (verloren gehen), um einem einfachen Dokumentenmodell zu entsprechen. Wenn ein Benutzer solche in den abgeflachten Dokumenten einer Suchmaschine gespeicherten Beziehungsinformationen verwenden möchte und eine Suchverfeinerung in verknüpfte Informationen durchführen möchte, kann sich ein Benutzer die Metadaten eines Dokuments in den Suchergebnissen ansehen, ein Feld auswählen, das einen Schlüssel in die „relationalen” Daten besitzt, die aktuelle Abfrage und die aktuellen Suchkriterien löschen und unter Verwendung des Schlüssels eine neue Abfrage ausgeben, um die zugehörigen Daten in den Suchergebnissen anzuzeigen oder zu einzelnen Dokumenten mit zugehörigen Daten navigieren.
  • KURZDARSTELLUNG
  • Bereitgestellt wird ein Verfahren zum Bereitstellen und Verwenden von Pivot-Facets für Text-Mining und Suche. Ein Metadatenfeld wird unter Verwendung eines Prozessors eines Computers einer Pivot-Facet zugeordnet. Als Reaktion auf ein Ausführen einer ersten Abfrage werden mindestens ein erstes Dokument und die Pivot-Facet unter Verwendung des Prozessors des Computers angezeigt. Als Reaktion auf ein Auswählen der Pivot-Facet wird unter Verwendung des Prozessors des Computers eine zweite Abfrage erzeugt, die einen Wert des Metadatenfeldes enthält, und die zweite Abfrage wird unter Verwendung des Prozessors des Computers ausgeführt, um mindestens ein zweites Dokument ausfindig zu machen, dass den Wert des Metadatenfeldes enthält.
  • Bereitgestellt wird ein Computerprogrammprodukt zum Bereitstellen und Verwenden von Pivot-Facets für Text-Mining und Suche. Das Computerprogrammprodukt weist ein computerlesbares Speichermedium mit darauf ausgebildetem Programmcode auf, wobei der Programmcode durch mindestens einen Prozessor ausführbar ist um: durch den mindestens einen Prozessor ein Metadatenfeld einer Pivot-Facet zuzuordnen; als Reaktion auf ein Ausführen einer ersten Abfrage durch den mindestens einen Prozessor mindestens ein erstes Dokument und die Pivot-Facet anzuzeigen; und als Reaktion auf ein Auswählen der Pivot-Facet durch den mindestens einen Prozessor eine zweite Abfrage zu erzeugen, die einen Wert des Metadatenfeldes enthält, und durch den mindestens einen Prozessor die zweite Abfrage auszuführen, um mindestens ein zweites Dokument ausfindig zu machen, das den Wert des Metadatenfeldes enthält.
  • Bereitgestellt wird ein Computersystem zum Bereitstellen und Verwenden von Pivot-Facets für Text-Mining und Suche. Das Computersystem weist einen oder mehrere Prozessoren, einen oder mehrere computerlesbare Speicher und eine oder mehrere computerlesbare, gegenständliche Datenspeichereinheiten sowie Programmanweisungen auf, die in mindestens einer der computerlesbaren, gegenständlichen Datenspeichereinheiten zum Ausführen durch mindestens einen des einen oder der mehreren Prozessoren über mindestens einen des einen oder der mehreren Speicher gespeichert sind, um: ein Metadatenfeld einer Pivot-Facet zuzuordnen; als Reaktion auf ein Ausführen einer ersten Abfrage mindestens ein erstes Dokument und die Pivot-Facet anzuzeigen; und als Reaktion auf ein Auswählen der Pivot-Facet eine zweite Abfrage zu erzeugen, die einen Wert des Metadatenfeldes enthält, und die zweite Abfrage auszuführen, um mindestens ein zweites Dokument ausfindig zu machen, das den Wert des Metadatenfeldes enthält.
  • KURZBESCHREIBUNG DER MEHREREN ZEICHNUNGSANSICHTEN
  • Es wird nun Bezug auf die Zeichnungen genommen, in denen gleiche Bezugszeichen durchgängig für sich entsprechende Teile stehen:
  • 1 veranschaulicht eine Datenverarbeitungsumgebung gemäß bestimmten Ausführungsformen.
  • 2 veranschaulicht Details einer Textsuchmaschine gemäß bestimmten Ausführungsformen.
  • 3 veranschaulicht gemäß bestimmten Ausführungsformen in einem Ablaufschaubild Operation, die zum Erzeugen von Pivot-Facets durchgeführt werden.
  • 4 veranschaulicht gemäß bestimmten Ausführungsformen in einem Ablaufschaubild Operation, die zum Verwenden von Pivot-Facets durchgeführt werden.
  • 5 veranschaulicht hierarchische Dokumente gemäß bestimmten Ausführungsformen.
  • 6 veranschaulicht gemäß bestimmter Ausführungsformen Suchergebnisse mit Pivot-Facets für hierarchische Dokumente.
  • 7 veranschaulicht zusammengesetzte Dokumente gemäß bestimmten Ausführungsformen.
  • 8 veranschaulicht doppelte Sammlungen gemäß bestimmten Ausführungsformen.
  • 9 veranschaulicht einen Beispielindex gemäß bestimmten Ausführungsformen.
  • 10 veranschaulicht gemäß bestimmten Ausführungsformen Informationen, die zum Importieren einer Arztbesuchstabelle in eine Dokumentinstanz verwendet werden.
  • 11 veranschaulicht gemäß bestimmten Ausführungsformen ein Erstellen von Dokumentinstanzen.
  • 12 veranschaulicht gemäß bestimmten Ausführungsformen zwei unterschiedliche Datensatztypen.
  • 13 veranschaulicht gemäß bestimmten Ausführungsformen Suchergebnisse mit Pivot-Facets.
  • 14 veranschaulicht einen Cloud-Computing-Knoten gemäß bestimmten Ausführungsformen.
  • 15 veranschaulicht eine Cloud-Computing-Umgebung gemäß bestimmten Ausführungsformen.
  • 16 veranschaulicht Abstraktionsmodellebenen gemäß bestimmten Ausführungsformen.
  • DETAILLIERTE BESCHREIBUNG
  • Die Beschreibungen der verschiedenen Ausführungsformen der vorliegenden Erfindung wurden zum Zwecke der Veranschaulichung vorgelegt, sind jedoch nicht als erschöpfend oder auf die offenbarten Ausführungsformen beschränkt aufzufassen. Viele Änderungen und Variationen sind für den Fachmann naheliegend, ohne vom Umfang und Geist der beschriebenen Ausführungsformen abzuweichen. Die hierin verwendete Terminologie wurde gewählt, um die Grundgedanken der Ausführungsformen, die praktische Anwendung oder technischen Verbesserungen gegenüber auf dem Markt anzutreffenden Technologien am besten zu erklären oder um anderen Fachleuten ein Verständnis der hierein offenbarten Ausführungsformen zu ermöglichen.
  • 1 veranschaulicht eine Datenverarbeitungsumgebung gemäß bestimmten Ausführungsformen. Eine Datenverarbeitungseinheit 100 enthält eine Textsuchmaschine (text search engine) 110, ein Pivot-Facet-Evaluationsmodul 140 und eine Textanalysemaschine (text analytics engine) 130. Die Datenverarbeitungseinheit 100 ist mit einer Datenspeicherung 150 verbunden. Die Datenspeicherung 150 enthält Dokumente 160, Pivot-Facets 162, eine Datenbank 170 und einen oder mehrere Indices 180.
  • In bestimmten Ausführungsformen sorgen die Textsuchmaschine 110 und das Pivot-Facet-Evaluationsmodul 162 für effiziente Suchfähigkeiten durch Textdokumente. Zusätzlich zum in den Dokumenten enthaltenen Rohtext beherbergt die Textsuchmaschine 110 auch die Aufnahme von und das Durchsuchen von Dokumenten zugeordneten Metadaten(feldern) (z. B. Autor, Erstellungsdatum, Titel usw.). Das Pivot-Facet-Evaluationsmodul 162 stellt zugehörige Dokumente bereit, wenn eine Pivot-Facet ausgewählt wird.
  • 2 veranschaulicht Details der Textsuchmaschine 110 gemäß bestimmten Ausführungsformen. Die Textsuchmaschine 110 führt eine Dokument-Crawlersuche (document crawling) 120, eine Dokumentverarbeitung 122, ein Indexieren 124 und eine Laufzeitverarbeitung 126 durch. Die Dokument-Crawlersuche 120 beinhaltet eine Crawlersuche in einer oder mehreren Datenquellen nach Inhalt und Metadaten, während Unterstützung für native Zugangskontrolllisten (Access Control List (ACL)) bereitgestellt wird. Die Dokumentverarbeitung 122 beinhaltet ein Extrahieren von Text aus den durch die Dokument-Crawlersuche 120 identifizierten Dokumenten, ein Identifizieren der Sprache der Dokumente und ein Anwenden eines Textanalyse-Arrays (z. B. unter Verwendung der Textanalysemaschine 130), um vielfältige Merkmale im Text zu identifizieren und extrahieren. Das Indexieren 124 empfängt die verarbeiteten Dokumente und erzeugt den einen oder die mehreren Indices 180 für die verarbeiteten Dokumente. Die Laufzeitverarbeitung 126 beinhaltet Unterstützung für eine erweiterte Suche und Facets.
  • Eine Facet kann als eine Dimension, ein Attribut oder Metadaten beschrieben werden, zu denen eine Suche erfolgen kann, um die Suchergebnisse zu begrenzen (z. B. ein oder mehrere Dokumente). Eine Pivot-Facet kann als eine Dimension, ein Attribut oder Metadatenfeld beschrieben werden, das einen Schlüsselwert enthält, der ein spezielles Dokument mit anderen Dokumenten im Corpus verknüpft, die denselben Schlüsselwert enthalten. In bestimmten Ausführungsformen stellt die Verwendung von Pivot-Facets für ein spezielles Suchergebnis anklickbare Verknüpfungen zu zugehörigen Dokumenten bereit.
  • Die Pivot-Facet kann ausgewählt werden und als Reaktion auf das Auswählen löscht das Pivot-Facet-Evaluationsmodul 140 die aktuelle Abfrage und die aktuellen Auswahlkriterien und übermittelt eine neue, den zum Auswählen zugehöriger Dokumente benötigten Schlüssel enthaltende Abfrage (an die Textsuchmaschine 110) zurück. Die Textsuchmaschine 110 führt die neue Abfrage aus und zeigt die zugehörigen Dokumente in den Suchergebnissen an. In bestimmten Ausführungsformen kann das Pivot-Facet-Evaluationsmodul 140 die aktuelle Abfrage löschen und den Suchkriterien zusätzliche Kriterien hinzufügen.
  • 3 veranschaulicht gemäß bestimmten Ausführungsformen in einem Ablaufschaubild Operationen, die zum Erzeugen von Pivot-Facets durchgeführt werden. Die Steuerung beginnt in Block 300 mit einem Identifizieren bestimmter Metadatenfelder als Schlüsselfelder, um Schlüssel-Metadatenfelder zu bilden. Es können eindeutige Kennzeichnungen für die Schlüssel-Metadatenfelder verwendet werden, um Sätze von Dokumenten zu identifizieren. In bestimmten Ausführungsformen wird ein Ermitteln, bei welchen Metadaten es sich um ein „Schlüssel”-Feld handelt (und die möglicherweise einer Pivot-Facet zugeordnet sind), entweder durch die per Crawlersuche durchsuchte Quellablage angezeigt oder, falls nicht verfügbar, durch den Administrator der Textsuchmaschine 110 angegeben. Wenn zum Beispiel eine Beziehung über- und untergeordneter Elemente mit mehreren möglichen untergeordneten Elemente für jedes übergeordnete Element zu modellieren ist, kann das übergeordnete Dokument ein Metadatenfeld namens „untergeordnet” (children) enthalten und die untergeordneten Dokumente können ein Metadatenfeld namens „übergeordnet” (parent) enthalten. Die untergeordneten Dokumente besitzen eindeutige Kennzeichnungen im „übergeordnet”-Feld, die eine Auflösung zum „untergeordnet”-Feld des übergeordneten Elements aufweisen. In bestimmten Ausführungsformen gleicht dies nativen Schlüsseln/fremden Schlüsseln (foreign keys) in relationalen Datenbanken.
  • In Block 302 ordnet das Pivot-Facet-Evaluationsmodul 140 die Schlüssel-Metadatenfelder Pivot-Facets zu.
  • Somit erfasst das Pivot-Facet-Evaluationsmodul 140 Beziehungen zwischen Dokumenten als Metadatenfelder mit Kennzeichnungen, um Sätze zugehöriger Dokumente zu identifizieren.
  • 4 veranschaulicht gemäß bestimmten Ausführungsformen in einem Ablaufschaubild Operationen, die zum Verwenden von Pivot-Facets durchgeführt werden. Die Steuerung beginnt damit, dass die Textsuchmaschine 110 eine erste Abfrage empfängt. In Block 402 führt die Textsuchmaschine 110 die erste Abfrage (gegen einen ersten Corpus von Dokumenten, wie beispielsweise eine Sammlung) aus, um erste Sucherergebnisse (von Dokumenten) mit zu den ersten Suchergebnissen hinzugefügten Anzeigern zum Anzeigen von Pivot-Facets bereitzustellen. In bestimmten Ausführungsformen werden die Suchergebnisse bereitgestellt, indem die Suchergebnisse auf einem Computerbildschirm angezeigt werden. In anderen Ausführungsformen werden die Suchergebnisse in einem Bericht bereitgestellt. In bestimmten Ausführungsformen kann der Anzeiger hinzugefügt werden, indem Metadatenfelder, die Pivot-Facets zugeordnet sind, in einem anderen Format angezeigt werden als Metadatenfelder, die keinen Pivot-Facets zugeordnet sind. Reguläre Facets enthalten Werte, die keine Schlüssel sind und damit nicht verwendet werden können, um eine Verknüpfung mit anderen Dokumenten im Corpus herzustellen. Zum Beispiel können die Metadatenfelder, die Pivot-Facets zugeordnet sind, fett oder in einer anderen Farbe oder Schriftart angezeigt werden. In bestimmten Ausführungsformen können die Anzeiger als „Zugehörige Dokumente zeigen”(„Show Related Docs”)-Verknüpfung festgelegt sein.
  • In Block 404 erzeugt das Pivot-Facet-Evaluationsmodul 140 als Reaktion auf ein Auswählen einer Pivot-Facet eine zweite Abfrage, die einen Wert des Metadatenfeldes enthält, bei dem es sich um das Schlüsselfeld handelt. In bestimmten Ausführungsformen kann das Pivot-Facet-Evaluationsmodul 140 Ausdrücke in der Abfrage durch andere Ausdrücke oder Felder durch andere Felder ersetzen. In Block 406 empfängt die Textsuchmaschine 110 die zweite Abfrage (derselben oder einer anderen Sammlung von Dokumenten) und führt sie aus, um zweite Suchergebnisse (von Dokumenten, die den Wert des Metadatenfeldes enthalten) mit zu den zweiten Suchergebnissen hinzugefügten Anzeigern zum Anzeigen von Pivot-Facets bereitzustellen.
  • Wenn zum Beispiel eine „untergeordnet”-Pivot-Facet ausgewählt wird, erzeugt das Pivot-Facet-Evaluationsmodul 140 eine Abfrage, jedes Dokument auszugeben, in dem der Wert eines „übergeordnet”-Feldes in den aktuellen Suchergebnissen in einem „untergeordnet”-Feld enthalten ist. Wenn als weiteres Beispiel eine „übergeordnet”-Pivot-Facet ausgewählt wird, erzeugt das Pivot-Facet-Evaluationsmodul 140 eine Abfrage, jedes Dokument auszugeben, in dem der Wert eines „untergeordnet”-Feldes in den aktuellen Suchergebnissen in einem „übergeordnet”-Feld enthalten ist.
  • Somit führt in bestimmten Ausführungsformen ein Benutzer Suchen durch und gelangt unter Verwendung herkömmlicher Such- und Navigationsverfahren, einschließlich einer facettierten Suche (faceted search), zu Suchergebnissen. Darüber hinaus werden Pivot-Facets Schlüssel-Metadatenfeldern zugeordnet und in den Suchergebnissen gezeigt. Wenn zum Beispiel Dokumente in den Suchergebnissen ein „untergeordnet”-Feld enthalten würden, wird die entsprechende „untergeordnet”-Pivot-Facet angezeigt, und wenn der Benutzer auf die untergeordnet Pivot-Facet klickt, löscht das Pivot-Facet-Evaluationsmodul 140 die aktuellen Suchkriterien (so dass der gesamte Corpus durchsucht wird) und erzeugt eine neue Abfrage, um Dokumente zu finden, bei denen das übergeordnet-Feld einen der im untergeordnet-Feld des Satzes von Dokumenten aus den aktuellen Suchergebnissen enthaltenen Wert enthält. Die Textsuchmaschine 110 führt die neue Abfrage aus und stellt dem Benutzer neue Suchergebnissen bereit.
  • 5 veranschaulicht hierarchische Dokumente 500 gemäß bestimmten Ausführungsformen. In diesem Beispiel enthalten die hierarchischen Dokumente Dokumente für unterschiedliche Themen (Tiere, Säugetiere, Hunde, Katzen). Jedes Dokument besitzt ein Metadatenfeld für „übergeordnet”, das auf das übergeordnete Dokument zeigt.
  • 6 veranschaulicht gemäß bestimmten Ausführungsformen Suchergebnisse 600 mit Pivot-Facets für hierarchische Dokumente. In bestimmten Ausführungsformen handelt es sich bei der Pivot-Facet um einen Schlüsselwert, der in anderen Dokumenten sein kann. Somit kann die Pivot-Facet verwendet werden, um hierarchische Beziehungen zu erkennen. Zum Beispiel können die Hunde- und Katzendokumente ein Metadatenfeld namens „Tierart” enthalten, dessen Wert auf „Säugetier” gesetzt werden kann. Wenn dieses Metadatenfeld als ein Schlüsselfeld identifiziert und anschließend einer Pivot-Facet zugeordnet wird, gibt die Textsuchmaschine 110 im Falle, dass „Säugetier” ausgewählt ist, eine Suche nach anderen Dokumenten aus, deren Schlüsselfelder den Wert „Säugetier” enthalten. Es ist zu beachten, dass die Suche die aktuelle Hunde- und Katzenklasse von Dokumenten („rectypes”, Datensatztypen) ausschließt, so dass die Textsuchmaschine 110 das aktuelle Katzen- oder Hundedokument nicht erneut ausgibt. Durch Klicken auf die Pivot-Facet „Tierart” gelangt der Benutzer damit zum übergeordneten Dokument zurück, dessen Wert „Säugetier” lautet.
  • Wenn somit ein Benutzer das Säugetier-Dokument wünscht, anstatt nach anderen Dokumenten zu suchen, in denen das übergeordnet-Metadatenfeld den Wert „Säugetiere” enthält, würde ein Auswählen der Pivot-Facet eine Suche nach anderen Dokumenten auslösen, in denen das Themenfeld den Wert „Säugetiere” enthält. Das bedeutet, das Pivot-Facet-Evaluationsmodul 140 ändert die Abfrage, indem nach Thema anstatt übergeordnetem Element gesucht wird.
  • In bestimmten Ausführungsformen kann die Suche während einer Neuformulierung der Abfrage für eine Pivot-Facet auf eine separate Sammlung von Dokumenten gerichtet werden (im Gegensatz zur selben Sammlung, der die Suchergebnisse momentan angehören). Sammlungen können als logische Gruppierungen von Dokumenten beschrieben werden, wie sie durch die Textsuchmaschine 110 beschrieben sind. Bei Sammlungen kann es sich um einen physischen Index handeln.
  • 7 veranschaulicht zusammengesetzte Dokumente 700 gemäß bestimmten Ausführungsformen. In diesem Beispiel besitzt jedes Dokument mehrere Abschnitte oder Absätze. Ausführungsformen können eine Sammlung der größeren Dokumente aufbauen.
  • 8 veranschaulicht doppelte Sammlungen 800 gemäß bestimmten Ausführungsformen. Die doppelten Sammlungen 800 enthalten: Sammlung 1, bei der es sich um das ursprüngliche Dokument handelt, und Sammlung 2, bei der es sich um dieselbe Sammlung handelt, die auf Abschnittebene indexiert ist. Das heißt, jedes Dokument in Sammlung 2 ist ein Abschnitt aus einem der Dokumente in Sammlung 1. In Sammlung 1 gibt es ein Metadatenfeld namens „Abschnitte”, und die Werte enthalten die Dokumentkennzeichnung („doc id”) und Abschnittsnummern für die Abschnitte jedes Dokuments. Das Pivot-Facet-Evaluationsmodul 140 erzeugt eine Pivot-Facet aus diesem Abschnitt-Metadatenfeld, welche die Sammlung 2 durchsucht, um die Abschnitte für das Dokument abzurufen, und ändert die Anzeige der Suchergebnisse so, dass Sammlung 2 anstelle von Sammlung 1 gezeigt wird.
  • In bestimmten Ausführungsformen sind Pivot-Facets zusätzliche Aktionen zugeordnet. Wenn zum Beispiel Suchergebnisse von einer ersten Dokumentensammlung empfangen werden, wählt ein Benutzer eine Pivot-Facet für die Suchergebnisse aus und wechselt zu einer zweiten Dokumentensammlung, so dass das Pivot-Facet-Evaluationsmodul 140 eine neue Abfrage auf der Grundlage der Pivot-Facet erzeugt, und die neue Abfrage gegen die zweite Dokumentensammlung ausführt.
  • Als weiteres Beispiel kann ein Benutzer eine Pivot-Facet auswählen und zu einem anderen Kontext wechseln, so dass das Pivot-Facet-Evaluationsmodul 140 eine neue Abfrage auf der Grundlage der Pivot-Facet erzeugt, und die neue Abfrage im neuen Kontext ausführt. Ein Kontext kann als eine virtuelle Sammlung von Dokumenten beschrieben werden (z. B. eine Sammlung von Abschnitten innerhalb einer Sammlung von Dokumenten oder als ein spezielles Feld oder ein spezieller Satz von Feldern, die einem Teilsatz von Dokumenten in einer Sammlung gemeinsam sind).
  • Als ein weiteres Beispiel kann ein Benutzer eine Pivot-Facet auswählen und ein neues (z. B. ein anderes, vorhandenes) Feld auswählen. Für dieses Beispiel erzeugt das Pivot-Facet-Evaluationsmodul 140 eine neue Abfrage durch Ersetzen des aktuellen gesuchten Feldes durch das neue Feld.
  • Pivot-Facets werden verwendet, um eine Neuformulierung der Abfrage auszulösen sowie um andere Aktionen auszuführen, die es ermöglichen, dem Endbenutzer mehr Informationen zu vermitteln (wie beispielsweise zugehörige Dokumente), ohne dass der Benutzer zusätzliche Bearbeitung durchführen muss.
  • In diesem Beispiel enthält eine Sammlung hierarchische Dokumente, wobei jedes hierarchische Dokument ein Metadatenfeld namens „übergeordnet” und ein Metadatenfeld namens „untergeordnet” besitzt. Das Pivot-Facet-Evaluationsmodul 140 ist in der Lage eine Pivot-Facet zu konfigurieren, um in der Dokumenthierarchie nach oben oder unten zu navigieren, indem die Abfrage so verändert wird, dass nach den „doc ids” im übergeordnet-Feld oder nach ausgewählten Dokument-docids in den untergeordnet-Feldern von Dokumenten gesucht wird.
  • In bestimmten Ausführungsformen wird durch das Auswählen einer Pivot-Facet dynamisch (1) eine ursprüngliche Abfrage für ein Ausführen in derselben Dokumentensammlung geändert, (2) dieselbe Abfrage in einer anderen Dokumentensammlung oder einem andern Kontext ausgeführt, (3) eine neue Abfrage in derselbe Dokumentensammlung ausgeführt oder (4) die neue Abfrage in einer anderen Dokumentensammlung oder einem anderen Kontext ausgeführt. Somit ist die Pivot-Facet „programmierbar”, wobei eine neue Abfrage automatisch aus Metadaten oder Inhalt erzeugt wird.
  • 9 bis 13 stellen gemäß bestimmten Ausführungsformen ein Beispiel eines relationalen Ansatzes mit Sammlungsdokumenten für ein Szenario aus dem Gesundheitsbereich bereit.
  • Bei einem relationalen Ansatz werden mehrere Datensatztypen (record types („rectypes”)) in der Dokumentensammlung erzeugt, welche die relationalen Tabellen wiedergeben und die Entitäten/Beziehungen durch identifizierte Schlüsselfelder beibehalten. Jede relationale Tabelle in der relationalen Datenbank 170 steht für einen Datensatztyp in der Dokumentensammlung. In jeder relationalen Tabelle kann eine Crawlersuche durch eine andere Crawler-Instanz durchgeführt werden. Jedes Dokument, an dem eine Crawlersuche durchgeführt wurde, stellt eine Dokumentinstanz (oder Zeile) eines Datensatztyps dar. Für die relationale Datenbank spezifische Felder werden Indexfeldern zugeordnet (die Beispiele für Metadatenfelder darstellen). Zudem sind für relevante Tabellenspalten im relationalen Datenbankverwaltungssystem (Relational Database Management System (RDBMS)) eines Benutzers entsprechende Indexfelder definiert.
  • In bestimmten Ausführungsformen beim relationalen Ansatz zeigt die Textsuchmaschine 110 Suchergebnisse mit einer „Zugehörige Dokumente zeigen”-Verknüpfung und mit Beziehungen von Facet-Werten an.
  • 9 veranschaulicht einen Beispielindex 900 gemäß bestimmten Ausführungsformen. In 9 definiert der Index 900 Sammlungsindexfelder für relationale Spalten im RDBMS des Benutzers. Zudem wird ein neues Indexfeldattribut hinzugefügt, das angibt, ob es sich bei dem Indexfeld um ein „Schlüsselfeld” handelt oder nicht. Darüber hinaus wird ein Indexfeld namens „rectype” (record type, Datensatztyp) erzeugt. In bestimmten Ausführungsformen wird das Indexfeld „rectype” standardmäßig automatisch erstellt.
  • Als weiteres Beispiel für einen Index für ein Szenario aus dem Gesundheitsbereich können die folgenden Indexfelder erzeugt werden: Patient ID (Patienten-ID)(Schlüssel), Patient Name (Name des Patienten), Patient Age (Alter des Patienten), Patient Gender (Geschlecht des Patienten), Doctor ID (Arzt-ID) (Schlüssel) Doctor Name (Name des Arztes), Doctor Profession (Beruf des Arztes), Doctor Visit Date (Datum des Arztbesuches)(Schlüssel), Doctor Notes (Anmerkungen des Arztes), Radiology ID (Radiologie-ID)(Schlüssel), Radiology Date (Radiologiedatum)(Schlüssel), Radiology Report (Radiologiebericht) usw.
  • 10 veranschaulicht gemäß bestimmten Ausführungsformen Informationen, die zum Importieren einer Arztbesuchstabelle in eine Dokumentinstanz verwendet werden. Das „rectype”-Indexfeld 1010 kann durch den Crawler so voreingestellt werden, dass dieser Datensatztyp (dieses Dokument) identifiziert wird.
  • 11 veranschaulicht gemäß bestimmten Ausführungsformen ein Erstellen von Dokumentinstanzen. In 11 werden Felder einer Dokumentinstanz 1100 ausgefüllt, indem eine Crawlersuche in der Patiententabelle durchgeführt wird, und Felder einer Dokumentinstanz 1110 werden ausgefüllt, indem eine Crawlersuche in einer Radiologiebesuchstabelle durchgeführt wird.
  • 12 veranschaulicht gemäß bestimmten Ausführungsformen zwei unterschiedliche Datensatztypen 1200, 1210. Die Textsuchmaschine 110 kann unterschiedliche Formatierungen für unterschiedliche Datensatztypen in den Suchergebnissen bereitstellen.
  • Da Datensatztypen und deren identifizierte Schlüsselfelder verfügbar sind, kann das Pivot-Facet-Evaluationsmodul 140 zusätzliche Abfragen ausgeben, um verknüpfte Dokumente abzurufen. Darüber hinaus können weitere Nicht-Schlüsselfelder (z. B. DoctorVisitDate) verwendet werden, um die Suchergebnisse weiter zu filtern.
  • Für eine gegebene Datensatztypinstanz (z. B. aus einem Satz von Suchergebnissen) kann das Pivot-Facet-Evaluationsmodul 140 eine Suche nach zugehörigen Dokumenten durch Suchen nach enthaltenen Schlüsselwerten ausgeben, die in anderen Datensatztypen erscheinen. Im Folgenden sind Beispiele von Suchanforderungen und eine mögliche Suchabfrage dargestellt:
    • • Zeige alle Arztbesuche (doctor visits) für Patient P1 Query (rectype: doctorVisits patientid: P1)
    • • Zeige alle Patienten für Arzt 2 Query (rectype: patient doctorid: D2)
    • • Zeige bei einem gegebenem doctorVisit-Datensatz für Patient P1 und Arzt D2 jeweils die Datensatzdetails Query ((patientid: P1 rectype: patient) OR (doctorid: D2 rectype: doctor)) – rectype: doctorVisits
  • In manchen Fällen können mehrere Abfragen ausgegeben werden:
    • • Zeige alle Radiologiebesuche, die von Arzt D1 verschrieben wurden Query 1 (rectype: doctorVisits doctorid: D1) Für jede eindeutige patientid in jedem Arztbesuchsdatensatz wird Abfrage 2 ausgegeben Query 2 (rectype: radiologVisits (patientid: P1 or patientid: P2 or patientid: P3 ...))
  • Dann kann die Textsuchmaschine 110 die Suchergebnisse der mehreren Abfragen anzeigen.
  • 13 veranschaulicht gemäß bestimmter Ausführungsformen Suchergebnisse 1300 mit Pivot-Facets. Die Textsuchmaschine 110 zeigt den „Zugehörige Dokumente zeigen”-Anzeiger und als Reaktion auf diesen durch einen Benutzer ausgewählten Anzeigerbeginn erzeugt die Textsuchmaschine 110 eine neue Abfrage, führt die neue Abfrage aus und zeigt zugehörige Dokumente an. Wenn es sich bei einem Feld zudem um eine Facet handelt, stellt die Textsuchmaschine 110 ein Markierkästchen bereit, das eine weitere Suchverfeinerung zu dem speziellen, der momentanen Suchabfrage hinzugefügten Feld/Facet-Wert ermöglicht. In 13 kann nun der Arztbesuchsdatensatz, der den zu analysierenden Text enthält, so erweitert werden, dass die Details über den zugehörigen Patienten und die beteiligten Ärzte gezeigt werden. Der Arztbesuchsdatensatz enthält zwei Schlüsselfelder, die verwendet werden können, um die Abfrage auszubilden ((patientid: P2 OR doctorid: D3) – rectype: DoctorVisit). Dies wird durch Hinzufügen eines neuen Attributs zu den Indexfeldern ermöglicht, um die Schlüsselfelder zu identifizieren.
  • Die Textsuchmaschine 110:
    • • fügt somit ein „rectype”-Indexfeld hinzu, das durch jeden Crawler bestückt wird und zum Unterscheiden von Suchergebnissen verwendet wird
    • • fügt somit den Indexfeldern ein „Schlüsselfeld”-Attribut hinzu, um anzuzeigen, welche Indexfelder als Schlüssel für ein Suchen verwendet werden können
    • • erweitert somit optional Kontextansichten so, dass ein Hinzufügen eines Datensatztyps zu einer Kontextansicht enthalten ist, um einzuschränken, welche anderen Felder einzufügen sind, um den Umfang einer Dokumentensammlung zu begrenzen
    • • fügt somit Suchergebnissen eine „Zugehörige Dokumente zeigen”-Verknüpfung hinzu und gibt für die gewählten Suchergebnisse eine Suche nach allen Auftretensfällen eines beliebigen vorliegenden Schlüsselfeldes im Suchergebnis aus und schließt einen aktuellen Datensatztyp aus
    • • stellt somit eine neue Ansicht bereit, die Verknüpfungen zwischen Dokumenten vorteilhaft nutzt, kann ein Suchkästchen bereitstellen, mit dem der Benutzer relationale Arten von Suchen (z. B. Vereinigungsmengen und Schnittmengen) ausdrücken kann, und abhängig von der Komplexität des Suchausdrucks können mehrere Suchen ausgegeben werden
  • Cloud Computing
  • Obwohl diese Offenbarung eine detaillierte Beschreibung zu Cloud Computing enthält, versteht es sich im Voraus, dass eine Realisierung der hierin angeführten Lehren nicht auf eine Cloud-Computing-Umgebung beschränkt ist. Stattdessen sind Ausführungsformen der vorliegenden Erfindung in der Lage, in Verbindung mit einem beliebigen anderen Typ von Datenverarbeitungsumgebung realisiert zu werden, der jetzt bekannt ist oder später entwickelt wird.
  • Cloud-Computing ist ein Modell der Dienstbereitstellung zum Ermöglichen von einfachem bedarfsgesteuertem (on demand) Netzwerkzugriff auf einen gemeinsamen Bestand konfigurierbarer Datenverarbeitungsressourcen (z. B. Netzwerke, Netzwerkbandbreite, Server, Verarbeitung, Arbeitsspeicher, Datenspeicher, Anwendungen, virtuelle Maschinen und Dienste), die rasch und mit minimalem Verwaltungsaufwand oder Interaktion mit einem Anbieter des Dienstes provisioniert und freigegeben werden können. Dieses Cloud-Modell kann mindestens fünf Charakteristika, mindestens drei Dienstmodelle und mindestens vier Bereitstellungsmodelle einschließen.
  • Die Charakteristika sind die folgenden:
    Bedarfsgesteuerte Selbstbedienung: Ein Cloud-Abnehmer kann einseitig Computerkapazität wie beispielsweise Serverzeit und Netzwerkspeicher nach Bedarf automatisch provisionieren, ohne dass menschliche Interaktion mit dem Anbieter des Dienstes erforderlich ist.
  • Breiter Netzwerkzugang: Kapazitäten sind über ein Netzwerk verfügbar und durch Standardmechanismen zugänglich, welche die Verwendung durch heterogene schlanke (thin) oder umfangreiche (thick) Client-Plattformen (z. B. Mobiltelefone, Laptops und PDAs) fördern.
  • Ressourcengruppierung: Die Computerressourcen des Anbieters werden gruppiert, um mehrere Abnehmer unter Verwendung eines mandantenfähigen Modells (multi-tenant model) mit unterschiedlichen, bedarfsabhängig dynamisch zugewiesenen und neu zugewiesenen physischen und virtuellen Ressourcen bedienen zu können. Es ist insofern in gewissem Sinne eine Ortsunabhängigkeit vorhanden, als der Abnehmer allgemein keine Kontrolle und kein Wissen über den exakten Standort der bereitgestellten Ressourcen besitzt, jedoch in der Lage sein kann, Standorte auf einer höheren Abstraktionsebene zu spezifizieren (z. B. Bezirk, Staat oder Rechenzentrum).
  • Schnelle Elastizität: Kapazitäten können zur schnellen Aufwärtsskalierung (scale out), in manchen Fällen automatisch, rasch und elastisch provisioniert und zur schnellen Abwärtsskalierung (scale in) rasch freigegeben werden. Für den Abnehmer erscheinen die zur Provisionierung verfügbaren Ressourcen oft unbegrenzt und können zu jeder Zeit in jeder Menge erworben werden.
  • Gemessene Dienstleistung: Cloud-Systeme steuern und optimieren die Ressourcennutzung automatisch, indem auf einer gewissen Abstraktionsebene Messfähigkeiten eingesetzt werden, die der Art des Dienstes entsprechen (z. B. Speicher, Verarbeitung, Bandbreite und aktive Benutzerkonten). Die Ressourcennutzung kann überwacht, gesteuert und berichtet werden und so Transparenz für sowohl den Anbieter als auch den Abnehmer der genutzten Dienste bieten.
  • Die Dienstmodelle sind die folgenden:
    Software as a Service (SaaS): Die dem Abnehmer bereitgestellten Kapazitäten dienen der Nutzung der Anwendungen des Anbieters, die in einer Cloud-Infrastruktur ausgeführt werden. Die Anwendungen sind von vielfältigen Client-Einheiten aus über eine schlanke Client-Schnittstelle wie einen Web-Browser zugänglich (z. B. internetgestützte E-Mails). Der Abnehmer verwaltet oder steuert nicht die zugrundeliegende Cloud-Infrastruktur einschließlich Netzwerk, Server, Betriebssysteme, Speicher oder auch einzelne Anwendungskapazitäten mit der möglichen Ausnahme begrenzter benutzerspezifischer Einstellungen der Anwendungskonfiguration.
  • Platform as a Service (PaaS): Die dem Abnehmer bereitgestellten Kapazitäten dienen dem Bereitstellen benutzererstellter oder erworbener Anwendungen in der Cloud, die mittels vom Anbieter unterstützter Programmiersprachen oder Werkzeuge erstellt wurden. Der Abnehmer verwaltet oder steuert nicht die zugrundeliegende Cloud-Infrastruktur einschließlich Netzwerke, Server, Betriebssysteme oder Speicher, hat jedoch die Kontrolle über die bereitgestellten Anwendungen und möglicherweise Konfigurationen der die Anwendung beherbergenden Umgebung.
  • Infrastructure as a Service (IaaS): Die dem Abnehmer bereitgestellten Kapazitäten dienen dem Provisionieren von Verarbeitung, Speicher, Netzwerken und anderen grundlegenden Computerressourcen, wobei der Abnehmer in der Lage ist, beliebige Software einzusetzen und auszuführen, was Betriebssysteme und Anwendungen einschließen kann. Der Abnehmer verwaltet oder steuert nicht die zugrundeliegende Cloud-Infrastruktur, hat jedoch die Kontrolle über Betriebssysteme, Speicher, bereitgestellte Anwendungen und möglicherweise begrenzte Kontrolle über ausgewählte Netzwerkkomponenten (z. B. Host-Firewalls).
  • Die Bereitstellungsmodelle sind die folgenden:
    Private Cloud: Die Cloud-Infrastruktur wird allein für eine Organisation betrieben. Sie kann durch die Organisation oder Dritte verwaltet werden und vor Ort oder außerhalb angeordnet sein.
  • Gemeinschafts-Cloud (community cloud): Die Cloud-Infrastruktur wird durch mehrere Organisationen gemeinsam genutzt und unterstützt eine bestimmte Gemeinschaft, die gemeinsame Interessen hat (z. B. Überlegungen zu Mission, Sicherheitsanforderungen, Richtlinien und Einhaltung von Bestimmungen (compliance)). Sie kann durch die Organisationen oder Dritte verwaltet werden und vor Ort oder außerhalb angeordnet sein.
  • Öffentliche Cloud (public cloud): Die Cloud-Infrastruktur wird der allgemeinen Öffentlichkeit oder einer großen Branchengruppe zugänglich gemacht und befindet sich im Besitz einer Organisation, die Cloud-Dienste verkauft.
  • Hybrid-Cloud: Die Cloud-Infrastruktur setzt sich aus zwei oder mehr Clouds (privat, Gemeinschaft, oder öffentlich) zusammen, die separate Entitäten bleiben, jedoch durch standardisierte oder proprietäre Technologie verbunden sind, welche die Übertragbarkeit von Daten und Anwendungen ermöglicht (z. B. Cloud-Erweiterung (cloud bursting) für den Lastausgleich zwischen Clouds).
  • Eine Cloud-Computing-Umgebung ist dienstorientiert mit einem Schwerpunkt auf Zustandslosigkeit, geringe Verbindung, Modularität und semantische Kompatibilität. Das Herz von Cloud-Computing bildet eine Infrastruktur, die ein Netzwerk miteinander verbundener Knoten aufweist.
  • Unter Bezugnahme auf 14 wird nun eine schematische Darstellung eines Beispiels eines Cloud-Computing-Knotens gezeigt. Der Cloud-Computing-Knoten 1410, stellt nur ein Beispiel eines geeigneten Cloud-Computing-Knotens dar und soll nicht auf irgendeine Einschränkung im Hinblick auf den Umfang der Verwendung oder Funktionalität von Ausführungsformen der hierin beschriebenen Erfindung hindeuten. Unabhängig davon ist der Cloud-Computing-Knoten 1410 in der Lage, realisiert zu werden und/oder jede der hierin vorstehend dargelegten Funktionalitäten durchzuführen.
  • Im Cloud-Computing-Knoten 1410 befindet sich ein Computersystem/Server 1412, das/der mit zahlreichen anderen universellen oder zweckbestimmten Datenverarbeitungssystem-Umgebungen oder Konfigurationen betrieben werden kann. Zu Beispielen allgemein bekannter Datenverarbeitungssysteme, Umgebungen und/oder Konfigurationen, die für die Verwendung mit dem Computersystem/Server 1412 geeignet sein können, zählen, ohne auf diese beschränkt zu sein, Personal-Computer-Systeme, Server-Computersysteme, schlanke Clients, umfangreiche Clients, handgeführte (handheld) oder Laptop-Einheiten, Mehrfachprozessorsysteme, mikroprozessorgestützte Systeme, Decoder (set top boxes), programmierbare Unterhaltungselektronik, Netzwerk-PCs, Minicomputersysteme, Großrechnersysteme und verteilte Cloud-Computing-Umgebungen, die jedes beliebige der oben genannten Systeme oder der vorgenannten Einheiten oder Ähnliches beinhalten.
  • Das Computersystem/der Server 1412 kann im allgemeinen Kontext von durch Computersysteme ausführbaren Anweisungen beschrieben werden, wie beispielsweise Programmmodule, die durch ein Computersystem ausgeführt werden. Im Allgemeinen können Programmmodule Routinen, Programme, Objekte, Komponenten, Logik, Datenstrukturen und so weiter enthalten, die bestimmte Aufgaben durchführen oder bestimmte abstrakte Datentypen ausbilden. Das Computersystem/der Server 1412 kann in verteilten Cloud-Computing-Umgebungen ausgebildet sein, bei denen Aufgaben durch entfernt angeordnete Verarbeitungseinheiten durchgeführt werden, die über ein Datenübertragungsnetzwerk verbunden sind. In einer verteilten Cloud-Computing-Umgebung können sich Programmmodule sowohl in lokalen als auch entfernt angeordneten Computersystem-Datenspeichermedien einschließlich Arbeitsspeichereinheiten befinden.
  • Wie in 14 gezeigt, ist das Computersystem/der Server 1412 im Cloud-Computing-Knoten 1410 in Form einer universellen Computereinheit gezeigt. Zu den Komponenten des Computersystems/des Servers 1412 können, ohne auf diese beschränkt zu sein, ein oder mehrere Prozessoren oder eine oder mehrere Verarbeitungseinheiten 1416, ein Systemspeicher 1428 und ein Bus 1418 gehören, der vielfältige Systemkomponenten einschließlich des Systemspeichers 1428 mit einem Prozessor oder einer Verarbeitungseinheit 1416 verbindet.
  • Der Bus 1418 steht für eine oder mehrere beliebige Arten von Busstrukturen, wozu ein Speicherbus oder eine Speichersteuereinheit, ein Peripherieeinheiten-Bus, ein beschleunigter Grafikanschluss und ein Prozessor- oder lokaler Bus unter Verwendung jeder beliebigen einer Vielfalt von Busarchitekturen zählen kann. Als Beispiel und ohne Einschränkung können zu solchen Architekturen der ISA-Bus (Industry Standard Architecture (ISA) bus), der MCA-Bus (Micro Channel Architecture (MCA) bus), der erweiterte ISA-Bus (Enhanced ISA (EISA) bus), der lokale VESA-Bus (Video Electronics Standards Association (VESA) local bus) und der PCI-Bus (Peripheral Component Interconnects (PCI) bus) gehören.
  • Das Computersystem/der Server 1412 enthält üblicherweise eine Vielfalt von durch Computersysteme lesbaren Medien. Bei solchen Medien kann es sich um jedes beliebige verfügbare Medium, auf welches durch das Computersystem/den Server 1412 zugegriffen werden kann, sowie um sowohl flüchtige als auch nichtflüchtige, Wechsel- oder Nicht-Wechsel-Medien handeln.
  • Zum Systemspeicher 1428 können durch Computersysteme lesbare Medien in der Form von flüchtigem Speicher wie beispielsweise ein Speicher mit wahlfreiem Zugriff (random access memory (RAM)) 1430 und/oder ein Cachespeicher 1432 zählen. Zum Computersystem/Server 1412 können weiterhin weitere Wechsel-/Nicht-Wechsel-, flüchtige/nichtflüchtige Computersystem-Speichermedien gehören. Lediglich als Beispiel kann ein Datenspeichersystem 1434 für das Lesen von und Schreiben auf ein nichtflüchtiges magnetisches Nicht-Wechsel-Medium bereitgestellt werden (nicht gezeigt und üblicherweise als „Festplattenlaufwerk” bezeichnet). Obwohl nicht abgebildet, kann auch ein magnetisches Plattenlaufwerk zum Lesen von und Schreiben auf eine nichtflüchtige magnetische Wechselplatte (z. B. eine „Floppy Disk”) oder ein optisches Plattenlaufwerk zum Lesen von oder Schreiben auf eine nichtflüchtige optische Wechselplatte wie beispielsweise eine CD-ROM, DVD-ROM oder ein anderes optisches Medium bereitgestellt werden. In solchen Beispielen kann jedes Element durch eine oder mehrere Datenträgerschnittstellen mit dem Bus 1418 verbunden sein. Wie nachfolgend weiterhin gezeigt und beschrieben wird, kann der Speicher 1428 mindestens ein Programmprodukt enthalten, das einen Satz (z. B. mindestens eines) von Programmmodulen enthält, die eingerichtet sind, die Funktionen von Ausführungsformen der Erfindung auszuführen.
  • Ein Programm/Dienstprogramm (utility) 1440 mit einem Satz (mindestens einem) von Programmmodulen 1442 kann im Speicher 1428 in beispielhafter Weise und ohne Einschränkung auch als Betriebssystem, ein oder mehrere Anwendungsprogramme, andere Programmmodule und Programmdaten gespeichert sein. Jedes von einem Betriebssystem, einem oder mehreren Anwendungsprogrammen, anderen Programmmodulen und Programmdaten oder eine Kombination aus ihnen kann eine Realisierung einer Netzwerkumgebung enthalten. Die Programmmodule 1442 führen allgemein die Funktionen und/oder Verfahrensweisen von Ausführungen der hierin beschriebenen Erfindung aus.
  • Das Computersystem/der Server 1412 kann auch mit einer oder mehreren externen Einheiten 1414 Daten austauschen, wie beispielsweise eine Tastatur, eine Zeigeeinheit, eine Anzeige 1424 usw.; eine oder mehrere Einheiten, mit denen ein Benutzer mit dem Computersystem/dem Server 1412 interagieren kann; und/oder beliebige Einheiten (z. B. Netzwerkkarte, Modem usw.), durch die das Computersystem/der Server 1412 mit einer oder mehreren anderen Datenverarbeitungseinheiten Daten austauschen kann. Ein derartiger Datenaustausch kann über Eingabe/Ausgabe(E/A)-Schnittstellen 1422 erfolgen. Des Weiteren kann das Computersystem/der Server 1412 mit einem oder mehreren Netzwerken wie beispielsweise einem lokalen Netzwerk (local area network (LAN)), einem allgemeinen Weitverkehrsnetzwerk (wide area network (WAN)) und/oder einem öffentlichen Netzwerk (z. B. dem Internet) über einen Netzwerkadapter 1420 Daten austauschen. Wie dargestellt; tauscht der Netzwerkadapter 1420 mit den anderen Komponenten des Computersystems/Servers 1412 über den Bus 1418 Daten aus. Es ist festzuhalten, dass auch andere Hardware- und/oder Software-Komponenten in Verbindung mit dem Computersystem/Server 1412 verwendet werden können, auch wenn sie nicht gezeigt sind. Zu Beispielen gehören, ohne auf diese beschränkt zu sein: Mikrocode, Einheitentreiber, redundante Verarbeitungseinheiten, externe Plattenlaufwerkarrays, RAID-Systeme, Bandlaufwerke und Datenarchivierungs-Speichersysteme usw.
  • Unter Bezugnahme auf 15 wird nun eine veranschaulichende Cloud-Computing-Umgebung 1550 dargestellt. Wie gezeigt, weist die Cloud-Computing-Umgebung 1550 einen oder mehrere Cloud-Computing-Knoten 1410 auf, mit denen lokale, durch Cloud-Abnehmer verwendete Datenverarbeitungseinheiten wie zum Beispiel ein persönlicher digitaler Assistent (personal digital assistant (PDA)) oder ein Mobiltelefon 1554A, ein Desktop-Computer 1554B, ein Laptop-Computer 1554C und/oder ein Automobil-Computersystem 1554N Daten austauschen können. Die Knoten 1410 können miteinander Daten austauschen. Sie können (nicht gezeigt) physisch oder virtuell in einem oder mehreren Netzwerken, wie beispielsweise privaten, Gemeinschafts-, öffentlichen oder Hybrid-Clouds, wie hierin vorstehend beschrieben, oder einer Kombination daraus gruppiert sein. Dadurch kann die Cloud-Computing-Umgebung 1550 Infrastruktur, Plattformen und/oder Software als Dienste anbieten, für die ein Cloud-Abnehmer keine Ressourcen auf einer lokalen Computereinheit bereithalten muss. Es versteht sich, dass die Typen der in 15 gezeigten Computereinheiten 1554A bis N nur veranschaulichend gedacht sind, und dass die Computerumgebung 1410 und die Cloud-Computing-Umgebung 1550 mit jeder beliebigen Art von computergesteuerter Einheit über jede beliebige Art von Netzwerk und/oder netzwerk-adressierbarer Verbindung (z. B. unter Verwendung eines Web-Browsers) Daten austauschen kann.
  • Unter Bezugnahme auf 16 wird ein Satz funktionaler Abstraktionsschichten dargestellt, die durch die Cloud-Computing-Umgebung 1550 (15) bereitgestellt werden. Es ist im Vorfeld zu beachten, dass die in 16 gezeigten Komponenten, Schichten und Funktionen lediglich veranschaulichend gedacht sind und Ausführungsformen der vorliegenden Erfindung nicht darauf beschränkt sind. Wie abgebildet, werden die folgenden Schichten und entsprechenden Funktionen bereitgestellt:
    Eine Hardware- und Software-Schicht 1660 beinhaltet Hardware- und Software-Komponenten. Zu Beispielen für Hardware-Komponenten zählen Großrechner, in einem Beispiel IBM® zSeries®-Systeme; auf RISC-Architektur (Reduced Instruction Set Computer – Computer mit verringertem Anweisungssatz) beruhende Server, in einem Beispiel IBM pSeries®-Systeme; IBM xSeries®-Systeme; IBM BladeCenter®-Systeme; Speichereinheiten; Netzwerke und Netzwerkkomponenten. Zu Beispielen für Software-Komponenten zählen Netzwerkanwendungsserver-Software, in einem Beispiel die Anwendungsserversoftware IBM WebSphere®; und Datenbanksoftware, in einem Beispiel die Datenbanksoftware IBM DB2®. (IBM, zSeries, pSeries, xSeries, BladeCenter, WebSphere und DB2 sind in vielen Rechtsprechungsgebieten weltweit registrierte Marken der International Business Machines Corporation.)
  • Eine Virtualisierungsschicht 1662 stellt eine Abstraktionsschicht bereit, von der die folgenden Beispiele für virtuelle Entitäten bereitgestellt werden können: virtuelle Server; virtuelle Speicher; virtuelle Netzwerke einschließlich virtueller privater Netzwerke; virtuelle Anwendungen und Betriebssysteme; und virtuelle Clients.
  • In einem Beispiel kann eine Verwaltungsschicht 1664 die nachstehend beschriebenen Funktionen bereitstellen. Eine Ressourcenprovisionierung stellt eine dynamische Beschaffung von Datenverarbeitungsressourcen und anderen Ressourcen bereit, die verwendet werden, um Aufgaben innerhalb der Cloud-Computing-Umgebung durchzuführen. Eine Messung und Preisbildung stellt eine Kostenverfolgung, wenn Ressourcen innerhalb der Cloud-Computing-Umgebung verwendet werden, sowie die Abrechnung oder Rechnungserstellung für die Inanspruchnahme dieser Ressourcen bereit. In einem Beispiel können diese Ressourcen Lizenzen für Anwendungssoftware umfassen. Eine Sicherheit stellt eine Identitätsüberprüfung für Cloud-Abnehmer und Aufgaben sowie Schutz für Daten und andere Ressourcen bereit. Ein Benutzerportal stellt Zugang zur Cloud-Computing-Umgebung für Abnehmer und Systemadministratoren bereit. Eine Dienstgüteverwaltung (service level management) stellt eine Zuweisung und Verwaltung von Cloud-Computing-Ressourcen bereit, so dass erforderliche Dienstgüten erreicht werden. Eine Dienstgütevereinbarungs-Planung und -Einhaltung (Service Level Agreement (SLA) planning and fulfillment) stellt gemäß einer Dienstgütevereinbarung (SLA) eine Voranordnung für und eine Beschaffung von Cloud-Computing-Ressourcen bereit, für die ein zukünftiger Bedarf zu erwarten ist.
  • Eine Arbeitslastenschicht 1666 stellt Beispiele für Funktionalität bereit, für die die Cloud-Computing-Umgebung verwendet werden kann. Zu Beispielen von Arbeitslasten und Funktionen, die von dieser Schicht bereitgestellt werden können, zählen: Zuordnung und Navigation; Softwareentwicklung und Lebensdauer-Verwaltung (lifecycle management); Bereitstellung von Ausbildung in einem virtuellen Klassenzimmer; Datenanalyseverarbeitung; Transaktionsverarbeitung und Pivot-Facet-Verarbeitung.
  • Somit wird in bestimmten Ausführungsformen eine Software oder ein Programm, die oder das Pivot-Facet-Verarbeitung gemäß hierin beschriebenen Ausführungsformen realisiert, als ein Dienst in einer Cloud-Umgebung bereitgestellt.
  • In bestimmten Ausführungsformen besitzt die Datenverarbeitungseinheit 100 die Architektur des Datenverarbeitungsknotens 1410. In bestimmten Ausführungsformen ist die Datenverarbeitungseinheit 100 ein Teil einer Cloud-Umgebung. In bestimmten alternativen Ausführungsformen ist die Datenverarbeitungseinheit 100 nicht Teil einer Cloud-Umgebung.
  • Zusätzliche Details von Ausführungsformen
  • Wie für den Fachmann ersichtlich ist, können Aspekte der vorliegenden Erfindung als ein System, Verfahren, oder Computerprogrammprodukt ausgebildet werden. Dementsprechend können Aspekte der vorliegenden Erfindung in Form einer vollständigen Hardware-Ausführungsform, einer vollständigen Software-Ausführungsform (darunter Firmware, residente Software, Mikrocode usw.) oder in einer Ausführungsform ausgebildet werden, die Software- und Hardware-Aspekte kombiniert, was hierin sämtlich allgemein als „Schaltung”, „Modul” oder „System” bezeichnet sein kann. Weiterhin können Aspekte der vorliegenden Erfindung in Form eines Computerprogrammprodukts ausgebildet werden, das in einem oder mehreren computerlesbaren Medien mit darauf enthaltenem computerlesbarem Programmcode enthalten sein kann.
  • Jede beliebige Kombination aus einem oder mehreren computerlesbaren Medien kann verwendet werden. Bei dem computerlesbaren Medium kann es sich um ein computerlesbares Signalmedium oder ein computerlesbares Speichermedium handeln. Bei einem computerlesbaren Speichermedium kann es sich zum Beispiel, ohne auf diese beschränkt zu sein, um ein System, eine Vorrichtung oder eine Einheit elektronischer, magnetischer, optischer, elektromagnetischer, Infrarot oder Halbleiter verwendender Art sowie jede beliebige geeignete Kombination des Vorgenannten handeln. Zu spezielleren Beispielen für das computerlesbare Speichermedium kann Folgendes gehören (nicht abschließende Liste): eine elektrische Verbindung mit einer oder mehreren Leitungen, eine transportable Computerdiskette, eine Festplatte, ein Speicher mit wahlfreiem Zugriff (random access memory (RAM)), ein Nur-Lese-Speicher (read-only memory (ROM), ein löschbarer programmierbarer Nur-Lese-Speicher (erasable programmable read-only memory (EPROM) oder Flash-Speicher), ein Lichtwellenleiter, ein transportabler Compact-Disk-Nur-Lese-Speicher (compact disc read-only memory (CD-ROM)), eine optische Speichereinheit, eine magnetische Speichereinheit oder eine beliebige geeignete Kombination des Vorgenannten. Im Kontext dieses Dokuments kann es sich bei einem computerlesbaren Speichermedium um jedes gegenständliche Medium handeln, das ein Programm zur Verwendung durch oder in Verbindung mit einem System, einer Vorrichtung oder einer Einheit zum Ausführen von Anweisungen beinhalten oder speichern kann.
  • Zu einem computerlesbaren Signalmedium kann ein verbreitetes Datensignal mit darin zum Beispiel in einem Basisband oder als Teil einer Trägerwelle ausgebildetem computerlesbarem Programmcode zählen. Solch ein verbreitetes Signal kann in jeder beliebigen einer Vielfalt von Formen ausgebildet werden, einschließlich, ohne auf diese beschränkt zu sein, elektromagnetische, optische oder jede geeignete Kombination davon. Bei einem computerlesbaren Signalmedium kann es sich um jedes computerlesbare Medium handeln, das kein computerlesbares Speichermedium ist und das ein Programm zur Verwendung durch oder in Verbindung mit einem System, einer Vorrichtung oder einer Einheit zur Ausführung von Anweisungen übertragen, verbreiten oder transportieren kann.
  • Der in einem computerlesbaren Medium enthaltene Programmcode kann mittels eines beliebigen geeigneten Mediums übertragen werden, einschließlich, ohne auf diese beschränkt zu sein, kabellose, kabelgebundene, Lichtwellenleiterkabel, Hochfrequenz (HF) usw. oder eine beliebige geeignete Kombination des Vorgenannten.
  • Computerprogrammcode zum Ausführen von Operationen für Aspekte der vorliegenden Erfindung kann in jeder Kombination einer oder mehrerer Programmiersprachen geschrieben sein, darunter eine objektorientierte Programmiersprache wie Java, Smalltalk, C++ oder Ähnliches und herkömmliche prozedurale Programmiersprachen wie die Programmiersprache „C” oder ähnliche Programmiersprachen. Der Programmcode kann vollständig auf dem Computer des Benutzers, teilweise auf dem Computer des Benutzers, als eigenständiges Softwarepaket, teilweise auf dem Computer des Benutzers und teilweise auf einem entfernt angeordneten Computer oder vollständig auf dem entfernt angeordneten Computer oder Server ausgeführt werden. In letzterem Szenario kann der entfernt angeordnete Computer mit dem Computer des Benutzers über jede beliebige Art von Netzwerk, darunter ein lokales Netzwerk (local area network (LAN)) oder ein Weitverkehrsnetzwerk (wide area network (WAN)) verbunden sein, oder es kann eine Verbindung zu einem externen Computer (zum Beispiel mittels eines Internetdienstanbieters über das Internet) hergestellt werden.
  • Aspekte der vorliegenden Erfindung werden nachfolgend unter Bezugnahme auf Abbildungen von Ablaufschaubild (d. h. Ablaufschaubildern und/oder Blockschaubilder von Verfahren, Vorrichtungen (Systemen) und Computerprogrammprodukten gemäß Ausführungsformen der Erfindung beschrieben. Es versteht sich, dass jeder Block der Abbildungen von Ablaufplänen und/oder der Blockschaubilder sowie Kombinationen von Blöcken in den Abbildungen von Ablaufplänen und/oder den Blockschaubildern durch Computerprogrammanweisungen realisiert werden kann. Diese Computerprogrammanweisungen können einem Prozessor eines universellen Computers, eines zweckbestimmten Computers oder einer anderen programmierbaren Datenverarbeitungsvorrichtung bereitgestellt werden, um eine Maschine so zu erzeugen, dass die Anweisungen, die über den Prozessor des Computers oder der anderen programmierbaren Datenverarbeitungsvorrichtung ausgeführt werden, ein Mittel zum Realisieren der im Block oder in den Blöcken des Ablaufplans und/oder Blockschaubildes angegebenen Funktionen/Handlungen erzeugen.
  • Diese Computerprogrammanweisungen können auch in einem computerlesbaren Medium gespeichert sein, das einen Computer, eine andere programmierbare Datenverarbeitungsvorrichtung oder andere Einheiten anleiten kann, auf eine bestimmte Weise zu funktionieren, so dass die in dem computerlesbaren Medium gespeicherten Anweisungen einen Herstellungsartikel einschließlich Anweisungen erzeugen, welche die im Block oder in den Blöcken des Ablaufplans und/oder des Blockschaubildes angegebene Funktion/Handlung ausführen.
  • Die Computerprogrammanweisungen können auch auf einen Computer, eine andere programmierbare Datenverarbeitungsvorrichtung oder andere Einheiten geladen werden, um eine Reihe von auf dem Computer, der anderen programmierbaren Vorrichtung oder den anderen Einheiten auszuführenden Operationsschritten hervorzurufen, um einen auf dem Computer realisierten Prozess so zu erzeugen, dass die auf dem Computer oder der anderen programmierbaren Vorrichtung ausgeführten Anweisungen Prozesse zum Realisieren der im Block oder in den Blöcken des Ablaufplans und/oder Blockschaubildes angegebenen Funktionen/Handlungen bereitstellen.
  • Die Ablaufpläne und die Blockschaubilder in den Figuren veranschaulichen die Architektur, Funktionalität und die Arbeitsweise möglicher Realisierungen von Systemen, Verfahren und Computerprogrammprodukten gemäß verschiedenen Ausführungsformen der vorliegenden Erfindung. In dieser Hinsicht kann jeder Block in den Ablaufplänen oder den Blockschaltbildern für ein Modul, ein Segment oder einen Codeabschnitt stehen, der eine oder mehrere ausführbare Anweisungen zum Realisieren der angegebenen logischen Funktion oder Funktionen umfasst. Es soll zudem angemerkt werden, dass bei einigen alternativen Realisierungen die im Block angegebenen Funktionen in anderer Reihenfolge als der in den Figuren angegebenen auftreten können. Zum Beispiel können zwei aufeinander folgend abgebildete Blöcke tatsächlich im Wesentlichen gleichzeitig ausgeführt werden, oder die Blöcke können manchmal abhängig von der betreffenden Funktionalität in umgekehrter Reihenfolge ausgeführt werden. Es wird ebenfalls angemerkt, dass jeder Block der Blockschaubilder und/oder Abbildung von Ablaufplänen und Kombinationen von Blöcken in den Blockschaubildern und/oder der Abbildung von Ablaufplänen durch zweckbestimmte hardwaregestützte Systeme oder Kombinationen von zweckbestimmter Hardware und Computeranweisungen realisiert werden kann, welche die angegebenen Funktionen oder Handlungen durchführen.
  • Darüber hinaus zeigen die veranschaulichten Operationen der Ablaufpläne und Blockschaubilder bestimmte Ereignisse in einer bestimmten Reihenfolge auftretend. In alternativen Ausführungsformen können bestimmte Operationen in einer anderen Reihenfolge durchgeführt, modifiziert oder entfernt werden. Darüber hinaus können Operationen zur vorstehend beschriebenen Logik hinzugefügt werden und nach wie mit den beschriebenen Ausführungsformen konform sein. Weiterhin können hierin beschriebene Operationen sequenziell auftreten oder bestimmte Operationen können parallel verarbeitet werden. Darüber hinaus können Operationen durch eine einzige Verarbeitungseinheit oder durch verteilte Verarbeitungseinheiten durchgeführt werden.
  • Der Code, der die beschriebenen Operationen realisiert, kann weiterhin in Hardware-Logik oder Schaltungen (z. B. einem Chip mit integrierter Schaltung, einem programmierbaren Gatter-Array (Programmable Gate Array (PGA)), einer anwendungsspezifischen Integrierten Schaltung (Application Specific Integrated Circuit (ASIC)) usw. ausgebildet werden. Die Hardware-Logik kann mit einem Prozessor verbunden sein, um Operationen durchzuführen.
  • Einheiten, die miteinander kommunizieren oder in Datenaustausch stehen, müssen nicht kontinuierlich miteinander kommunizieren oder in Datenaustausch stehen, sofern nicht ausdrücklich anders angegeben. Darüber hinaus können Einheiten, die miteinander kommunizieren oder in Datenaustausch stehen, dies direkt oder indirekt über ein oder mehrere Zwischenelemente tun.
  • Eine Beschreibung einer Ausführungsform mit mehreren miteinander kommunizierenden oder in Datenaustausch stehenden Komponenten impliziert nicht, dass all diese Komponenten benötigt werden. Es wird im Gegenteil eine Vielfalt optionaler Komponenten beschrieben, um die breite Vielfalt möglicher Ausführungsformen der vorliegenden Erfindung zu veranschaulichen.
  • Obwohl Prozessschritte, Verfahrensschritte, Algorithmen oder Ähnliches in sequenzieller Reihenfolge beschrieben sein können, können solche Prozesse, Verfahren und Algorithmen so eingerichtet sein, dass sie an alternativen Reihenfolgen funktionieren. In anderen Worten: Jede möglicherweise beschriebene Abfolge oder Reihenfolge von Schritten muss nicht notwendigerweise auf ein Erfordernis hindeuten, dass diese Schritte in dieser Reihenfolge durchzuführen sind. Die Schritte hierin beschriebener Prozesse können in jeder praktikablen Reihenfolge durchgeführt werden. Weiterhin können einige Schritte gleichzeitig ausgeführt werden.
  • Wenn hierin eine einzige Einheit oder ein einziger Artikel beschrieben ist, ist es offensichtlich, dass mehr als eine Einheit/ein Artikel (zusammenwirkend oder nicht) anstelle einer einzigen Einheit/eines einzigen Artikels verwendet werden können. Gleichermaßen ist bei Beschreibungen von mehr als einer Einheit oder mehr als einem Artikel (zusammenwirkend oder nicht) hierin ersichtlich, dass eine einzige Einheit/ein einziger Artikel anstelle der mehr als einen Einheit oder des mehr als einen Artikels oder eine andere Anzahl von Einheiten/Artikeln anstelle der gezeigten Anzahl von Einheiten oder Programmen verwendet werden kann. Die Funktionalität und/oder die Merkmale einer Einheit können alternativ durch eine oder mehrere andere Einheiten ausgebildet werden, die nicht explizit als solche Funktionalität/Merkmale aufweisend beschrieben sind. Somit müssen andere Ausführungsformen der vorliegenden Erfindung nicht die Einheit selbst beinhalten.
  • Die hierin verwendete Terminologie dient lediglich dem Zwecke des Beschreibens besonderer Ausführungsformen und ist nicht als die Erfindung einschränkend aufzufassen. Die hierin verwendeten Singularformen „ein”, „eine” und „der”, „die”, „das” sowie deren Deklinationen sollen ebenso die Pluralformen einschließen, es sei denn dies ist im Kontext deutlich anderweitig angegeben. Es versteht sich weiterhin, dass die Begriffe „aufweist” und/oder „aufweisend” in diesem Dokument das Vorhandensein von angegebenen Merkmalen, ganzen Zahlen, Schritten, Vorgängen, Elementen und/oder Komponenten angeben, jedoch nicht das Vorhandensein oder Hinzufügen eines oder mehrerer Merkmale, ganzer Zahlen, Schritte, Vorgänge, Elemente, Komponenten und/oder Gruppen davon ausschließen.
  • Die Begriffe „eine Ausführungsform”, „Ausführungsform”, „Ausführungsformen”, „die Ausführungsform”, „die Ausführungsformen”, „eine oder mehrere Ausführungsformen”, „manche/einige Ausführungsformen” und „eine einzelne/einzige Ausführungsform” bedeuten „eine einzige oder mehrere (jedoch nicht alle) Ausführungsformen der vorliegenden Erfindungen)”, sofern nicht ausdrücklich anders angegeben.
  • Die Begriffe „einschließen”, „enthalten”, „beinhalten”, „zählen zu”, „gehören zu”, „darunter”, „aufweisen” „besitzen” und Variationen davon bedeuten „einschließlich, jedoch nicht beschränkt auf”, sofern nicht ausdrücklich anders angegeben.
  • Die aufgeführte Auflistung von Elementen impliziert nicht, dass sich ein oder alle Elemente gegenseitig ausschließen, sofern nicht ausdrücklich anders angegeben.
  • Die entsprechenden Strukturen, Materialien, Handlungen und Entsprechungen aller Mittel oder Schritte sowie Funktionselemente in den nachfolgenden Ansprüchen sollen alle Strukturen, Materialien oder Handlungen zum Durchführen der Funktion in Kombination mit anderen beanspruchten Elementen, wie sie im Einzelnen beansprucht sind, einschließen. Die Beschreibung der Ausführungsformen der vorliegenden Erfindung wurde zum Zwecke der Veranschaulichung und Beschreibung vorgelegt, ist jedoch nicht als erschöpfend oder auf die Erfindung in der offenbarten Form beschränkt aufzufassen. Viele Änderungen und Variationen sind für den Fachmann naheliegend, ohne vom Umfang und Geist der Erfindung abzuweichen. Die Ausführungsformen wurden gewählt, um die Funktionsweisen der Erfindung und die praktische Anwendung am besten zu beschreiben und anderen Fachleuten das Verständnis der Erfindung für vielfältige Ausführungsformen mit vielfältigen Änderungen wie sie für den speziellen betrachteten Gebrauch geeignet sind zu ermöglichen.
  • Die vorangehende Beschreibung von Ausführungsformen der Erfindung wurde zum Zwecke der Veranschaulichung und Beschreibung vorgestellt. Sie ist nicht als erschöpfend oder die Ausführungsform auf die präzise offenbarte Form einschränkend aufzufassen. Viele Änderungen und Variationen sind im Lichte der vorstehenden Lehre möglich. Der Umfang der Ausführungsform ist nicht als durch diese detaillierte Beschreibung, sondern vielmehr die hierin angehängten Ansprüche begrenzt aufzufassen. Die vorstehende Spezifikation, die vorstehenden Beispiele und die vorstehenden Angaben stellen eine vollständige Beschreibung der Herstellung und Verwendung der Zusammensetzung der Ausführungsformen bereit. Da viele Ausführungsformen geschaffen werden können, ohne vom Geist und Umfang der Erfindung abzuweichen, wohnen die Ausführungsformen den hierin nachstehend angehängten Ansprüchen inne.

Claims (9)

  1. Verfahren, aufweisend: Zuordnen eines Metadatenfeldes zu einer Pivot-Facet unter Verwendung eines Prozessors eines Computers; als Reaktion auf ein Ausführen einer ersten Abfrage Anzeigen mindestens eines ersten Dokuments und der Pivot-Facet unter Verwendung des Prozessors des Computers; als Reaktion auf das Auswählen der Pivot-Facet Erzeugen einer zweiten Abfrage, die einen Wert des Metadatenfeldes enthält, unter Verwendung des Prozessors des Computers; und Ausführen der zweiten Abfrage unter Verwendung des Prozessors des Computers, um mindestens ein zweites Dokument ausfindig zu machen, dass den Wert des Metadatenfeldes enthält.
  2. Verfahren nach Anspruch 1, wobei es sich bei dem Metadatenfeld um ein in einem oder mehreren Dokumenten gefundenes Schlüsselfeld handelt.
  3. Verfahren nach Anspruch 1, weiterhin aufweisend: Empfangen einer Auswahl einer neuen Dokumentensammlung; und Ausführen der zweiten Abfrage in der neuen Dokumentensammlung.
  4. Verfahren nach Anspruch 1, weiterhin aufweisend: Empfangen einer Auswahl eines neuen Kontextes; und Ausführen der zweiten Abfrage in dem neuen Kontext.
  5. Verfahren nach Anspruch 1, weiterhin aufweisend: Empfangen einer Auswahl eines neuen Metadatenfeldes; und Erzeugen einer dritten Abfrage, die einen Wert des neuen Metadatenfeldes enthält; und Ausführen der dritten Abfrage.
  6. Verfahren nach Anspruch 1, weiterhin aufweisend: Zuordnen eines zweiten Metadatenfeldes zu einer zweiten Pivot-Facet;
  7. Verfahren nach Anspruch 1, wobei eine Software-as-a-Service (SaaS) bereitgestellt wird, um das Verfahren auszuführen.
  8. Computerprogrammprodukt, wobei das Computerprogrammprodukt ein computerlesbares Speichermedium mit darauf ausgebildetem Programmcode aufweist, wobei der Programmcode durch mindestens einen Prozessor ausführbar ist, um: durch den mindestens einen Prozessor ein Metadatenfeld einer Pivot-Facet zuzuordnen; als Reaktion auf ein Ausführen einer ersten Abfrage durch den mindestens einen Prozessor mindestens ein erstes Dokument und die Pivot-Facet anzuzeigen; und als Reaktion auf das Auswählen der Pivot-Facet durch den mindestens einen Prozessor eine zweite Abfrage zu erzeugen, die einen Wert des Metadatenfeldes enthält; und die zweite Abfrage unter Verwendung des mindestens einen Prozessors des Computers auszuführen, um mindestens ein zweites Dokument ausfindig zu machen, dass den Wert des Metadatenfeldes enthält.
  9. Computersystem, aufweisend: einen oder mehrere Prozessoren, einen oder mehrere computerlesbare Speicher und eine oder mehrere computerlesbare, gegenständliche Datenspeichereinheiten; und Programmanweisungen, die auf mindestens einer der einen oder mehreren computerlesbaren, gegenständlichen Datenspeichereinheiten zum Ausführen durch mindestens einen des einen oder der mehreren Prozessoren über mindestens einen des einen oder der mehreren Speicher gespeichert sind, um: ein Metadatenfeld einer Pivot-Facet zuzuordnen; als Reaktion auf ein Ausführen einer ersten Abfrage mindestens ein erstes Dokument und die Pivot-Facet anzuzeigen; und als Reaktion auf das Auswählen der Pivot-Facet eine zweite Abfrage zu erzeugen, die einen Wert des neuen Metadatenfeldes enthält; und die zweite Abfrage auszuführen, um mindestens ein zweites Dokument ausfindig zu machen, dass den Wert des Metadatenfeldes enthält.
DE102014103279.9A 2013-03-15 2014-03-12 Pivot-Facets für Text-Mining und Suche Pending DE102014103279A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/837,247 US9146994B2 (en) 2013-03-15 2013-03-15 Pivot facets for text mining and search
US13/837,247 2013-03-15

Publications (1)

Publication Number Publication Date
DE102014103279A1 true DE102014103279A1 (de) 2014-09-18

Family

ID=51419116

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102014103279.9A Pending DE102014103279A1 (de) 2013-03-15 2014-03-12 Pivot-Facets für Text-Mining und Suche

Country Status (3)

Country Link
US (2) US9146994B2 (de)
CN (1) CN104050223B (de)
DE (1) DE102014103279A1 (de)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9360982B2 (en) * 2012-05-01 2016-06-07 International Business Machines Corporation Generating visualizations of facet values for facets defined over a collection of objects
US10318804B2 (en) * 2014-06-30 2019-06-11 First American Financial Corporation System and method for data extraction and searching
US10606855B2 (en) * 2014-07-10 2020-03-31 Oracle International Corporation Embedding analytics within transaction search
US10585892B2 (en) 2014-07-10 2020-03-10 Oracle International Corporation Hierarchical dimension analysis in multi-dimensional pivot grids
US10331899B2 (en) 2015-10-24 2019-06-25 Oracle International Corporation Display of dynamic contextual pivot grid analytics
US10509855B2 (en) * 2016-03-02 2019-12-17 International Business Machines Corporation Dynamic facet tree generation
KR101758219B1 (ko) * 2017-01-24 2017-07-14 김훈 수치정보 검색이 가능한 수치정보 관리장치
US10838994B2 (en) 2017-08-31 2020-11-17 International Business Machines Corporation Document ranking by progressively increasing faceted query
US10375556B2 (en) 2017-12-21 2019-08-06 International Business Machines Corporation Emergency call service backup using device user plane communications
US10956470B2 (en) * 2018-06-26 2021-03-23 International Business Machines Corporation Facet-based query refinement based on multiple query interpretations
US11176158B2 (en) * 2019-07-31 2021-11-16 International Business Machines Corporation Intelligent use of extraction techniques
US11361030B2 (en) * 2019-11-27 2022-06-14 International Business Machines Corporation Positive/negative facet identification in similar documents to search context
US11816158B2 (en) * 2020-11-18 2023-11-14 Micro Focus Llc Metadata tagging of document within search engine
CN112818111B (zh) * 2021-01-28 2023-07-25 北京百度网讯科技有限公司 文档推荐方法、装置、电子设备和介质
US11803577B1 (en) * 2021-08-13 2023-10-31 Amazon Technologies, Inc. Parent/child document indexing
US11841909B2 (en) 2022-02-11 2023-12-12 International Business Machines Corporation Text analytics views for web site sources

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5751949A (en) * 1995-05-23 1998-05-12 Mci Corporation Data security system and method
US7412453B2 (en) * 2002-12-30 2008-08-12 International Business Machines Corporation Document analysis and retrieval
US7774383B2 (en) 2005-05-24 2010-08-10 International Business Machines Corporation Displaying facet tree elements and logging facet element item counts to a sequence document
US7581189B2 (en) 2005-09-09 2009-08-25 Microsoft Corporation Dynamically generating a database report during a report building process
US7921099B2 (en) * 2006-05-10 2011-04-05 Inquira, Inc. Guided navigation system
US8229730B2 (en) * 2007-08-31 2012-07-24 Microsoft Corporation Indexing role hierarchies for words in a search index
US8078628B2 (en) 2008-03-12 2011-12-13 International Business Machines Corporation Streaming faceted search
CN101876981B (zh) 2009-04-29 2015-09-23 阿里巴巴集团控股有限公司 一种构建知识库的方法及装置
US9275031B2 (en) 2009-10-09 2016-03-01 Microsoft Technology Licensing, Llc Data analysis expressions
US9298816B2 (en) * 2011-07-22 2016-03-29 Open Text S.A. Methods, systems, and computer-readable media for semantically enriching content and for semantic navigation
US20130124957A1 (en) 2011-11-11 2013-05-16 Microsoft Corporation Structured modeling of data in a spreadsheet
WO2014081727A1 (en) * 2012-11-20 2014-05-30 Denninghoff Karl L Search and navigation to specific document content

Also Published As

Publication number Publication date
US9146994B2 (en) 2015-09-29
US10180984B2 (en) 2019-01-15
CN104050223A (zh) 2014-09-17
US20150012529A1 (en) 2015-01-08
US20140280284A1 (en) 2014-09-18
CN104050223B (zh) 2017-10-31

Similar Documents

Publication Publication Date Title
DE102014103279A1 (de) Pivot-Facets für Text-Mining und Suche
US10872162B2 (en) Role-based security policy for an object-oriented database system
DE112020003820T5 (de) Erkennung von Anomalien und Abweichungen unter Verwendung eines domänenindizierten Einschränkungs-Repository
DE112019002235T5 (de) Einbinden eines wörterbuch-bearbeitungssystems in ein text mining
DE202016005239U1 (de) Graph-basierte Abfragen
DE112016003626T5 (de) Natürlichsprachliche Schnittstelle zu Datenbanken
DE102013216273A1 (de) Umwandlung von Datenbanktabellenformaten auf der Grundlage von Benutzerdatenzugriffsmustern in einer vernetzten Datenverarbeitungsumgebung
DE112019000321T5 (de) Transaktionsoperationen in verteilten Multi-Master-Datenverwaltungssystemen
DE112013001308T5 (de) Verwalten von mandantenspezifischen Datensätzen in einer mandantenfähigen Umgebung
DE102016105526A1 (de) Schnelles mehrschichtiges Indexieren mit Unterstützung für dynamische Aktualisierung
DE202015009777U1 (de) Transparente Entdeckung eines semistrukturierten Datenschemas
DE112020002228T5 (de) Kognitive video- und audio-suchaggregation
DE112018005616T5 (de) Blockweise extraktion von dokumentmetadaten
DE202014010938U1 (de) Omega-Namen: Namenserzeugung und -ableitung
DE112017005588T5 (de) Speichern und abrufen von eingeschränkten datensätzen in und aus einem cloud-netzwerk mit nichteingeschränkten datensätzen
US20150074101A1 (en) Smart search refinement
DE112019001433T5 (de) Datenanonymisierung
DE112018002955T5 (de) Kognitive datei- und objektverwaltung für verteilte speicherumgebungen
US20150058363A1 (en) Cloud-based enterprise content management system
DE112016000776T5 (de) Effiziente Durchführung von Einfüge- und Punktabfrage-Operationen in einem Spaltenspeicher
DE112016004967T5 (de) Automatisiertes Auffinden von Informationen
DE112021003031T5 (de) Archivieren von nur-beschleuniger-datenbanktabellen
DE112022000878T5 (de) Datensatzmultiplexer für datenverarbeitungssystem
DE112021000621T5 (de) Primärschlüssel mit mehreren werten für eine mehrzahl von eindeutigen kennungen von entitäten
Masood-Al-Farooq SQL Server 2014 Development Essentials

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06F0017300000

Ipc: G06F0016000000

R016 Response to examination communication
R084 Declaration of willingness to licence