DE202016008357U1 - Entdeckung einer verbundenen entität - Google Patents

Entdeckung einer verbundenen entität Download PDF

Info

Publication number
DE202016008357U1
DE202016008357U1 DE202016008357.1U DE202016008357U DE202016008357U1 DE 202016008357 U1 DE202016008357 U1 DE 202016008357U1 DE 202016008357 U DE202016008357 U DE 202016008357U DE 202016008357 U1 DE202016008357 U1 DE 202016008357U1
Authority
DE
Germany
Prior art keywords
entity
property
nodes
entities
labels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE202016008357.1U
Other languages
English (en)
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of DE202016008357U1 publication Critical patent/DE202016008357U1/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/109Time management, e.g. calendars, reminders, meetings or time accounting
    • G06Q10/1093Calendar-based scheduling for persons or groups
    • G06Q10/1095Meeting or appointment

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Computersystem, umfassend: einen Speicher; und mindestens einen Prozessor, der kommunikativ an den Speicher gekoppelt ist und der so konfiguriert ist, dass er: einen Graphen zur Speicherung im Speicher erstellt, die eine Mehrzahl von Knoten einschließt, wobei die Mehrzahl der Knoten eine Mehrzahl von Entitätsknoten einschließt, die eine Mehrzahl von Entitäten darstellen, und eine Mehrzahl von Eigenschaftsknoten, die eine Mehrzahl von Eigenschaften darstellen, und wobei jeder der Mehrzahl der Entitätsknoten in dem Graphen mit einem oder mehreren der Mehrzahl der Eigenschaftsknoten verbunden ist; und Etikettenverbreitung ausführt, um eine Mehrzahl von Etiketten in dem Graphen zu verbreiten, um eine Verteilung der Etiketten mit jedem der Mehrzahl von Knoten zu verbinden.

Description

  • HINTERGRUND
  • Computergeräte können von einem bestimmten Benutzer häufig Hinweise auf Entitäten empfangen, an denen der Benutzer interessiert ist. Z. B. kann ein Benutzer ein Computergerät verwenden, um Suchen nach Entitäten, wie Orten, Veranstaltungen, Leuten, Geschäften, Restaurants und dergleichen durchzuführen. Der Benutzer kann auch Hinweise bereitstellen, dass der Benutzer an einer Veranstaltung teilgenommen oder in einem Restaurant gegessen hat, z. B. durch Anmeldung bei einer Veranstaltung mit einer Soziale-Medien-Anwendung oder durch Setzen eines Hinweises auf die Veranstaltung im Kalender des Benutzers. Unter Schutz gestellt werden und Gegenstand des Gebrauchsmusters sind, entsprechend den Vorschriften des Gebrauchsmustergesetzes, lediglich Vorrichtungen wie in den beigefügten Schutzansprüchen definiert, jedoch keine Verfahren. Soweit nachfolgend in der Beschreibung gegebenenfalls auf Verfahren Bezug genommen wird, dienen diese Bezugnahmen lediglich der beispielhaften Erläuterung der in den beigefügten Schutzansprüchen unter Schutz gestellten Vorrichtung oder Vorrichtungen.
  • KURZDARSTELLUNG
  • In einem Beispiel richtet sich die Offenbarung auf ein Verfahren. Das Verfahren kann das Erstellen, durch ein Computergerät, eines Graphen einschließen, der eine Mehrzahl von Knoten einschließt, wobei die Mehrzahl der Knoten eine Mehrzahl von Knoten einschließt, die eine Mehrzahl von Entitäten darstellen, und eine Mehrzahl von Eigenschaftsknoten, die eine Mehrzahl von Eigenschaften darstellen, und wobei jede der Mehrzahl der Entitätsknoten in des Graphen mit einem oder mehreren der Mehrzahl der Eigenschaftsknoten verbunden ist. Das Verfahren kann weiterhin das Ausführen, durch das Computergerät, der Etikettenverteilung einschließen, um eine Mehrzahl von Etiketten in dem Graphen zu verbreiten, um eine Verbreitung der Etiketten mit jeder der Mehrzahl von Knoten zu verbinden. Das Computergerät ist so konfiguriert, dass es: einen Hinweises auf mindestens eines, eine Eigenschaft von Interesse oder eine Entität von Interesse empfängt, und einen Hinweis für mindestens eine der Eigenschaften oder Entitäten von Interesse, auf eine oder mehrere verbundene Entitäten ausgibt, die mit der Eigenschaft oder der Entität verbunden sind, wobei die Ausgabe des Hinweises auf die eine oder mehrere verbundene Entitäten teilweise auf der entsprechenden Verteilung von Etiketten basiert, die mit einem der Mehrzahl der Eigenschaftsknoten verbunden sind, der die Eigenschaft von Interesse darstellt, oder mit einem der Mehrzahl des Entitätsknoten, der die Entität von Interesse darstellt.
  • In einem anderen Beispiel richtet sich die Offenbarung auf ein Computersystem, das einen Speicher und mindestens einen Prozessor einschließt. Der mindestens eine Prozessor ist kommunikativ an den Speicher gekoppelt und kann so konfiguriert werden, dass er: Einen Graphen erstellt, der in einem Speicher gespeichert wird und die eine Mehrzahl von Knoten einschließt, wobei die Mehrzahl der Knoten eine Mehrzahl von Knoten einschließt, die eine Mehrzahl von Entitäten darstellen, und eine Mehrzahl von Eigenschaftsknoten, die eine Mehrzahl von Eigenschaften darstellen, und wobei jede der Mehrzahl der Entitätsknoten in dem Graphen mit einem oder mehreren der Mehrzahl der Eigenschaftsknoten verbunden ist; und eine Etikettenverbreitung ausführt, um eine Mehrzahl von Etiketten in dem Graphen zu verbreiten, um eine Verteilung der Etiketten mit jeder der Mehrzahl von Knoten zu verbinden.
  • In einem anderen Beispiel richtet sich die Offenbarung auf ein Verfahren. Das Verfahren kann das Empfangen, durch ein Computergerät, eines Hinweises auf mindestens eine, eine Eigenschaft von Interesse oder eine Entität von Interesse, einschließen. Das Verfahren kann weiterhin die Bestimmung, durch das Computergerät, einer oder mehrerer verbundener Entitäten, die mit der Eigenschaft von Interesse oder der Entität von Interesse verbunden sind, zumindest teilweise auf der Grundlage einer entsprechende Verteilung der Etiketten, die mit einer der Mehrzahl von Eigenschaftsknoten in dem Graphen verbunden sind, der die Eigenschaft von Interesse darstellt, oder mit einer der Mehrzahl von Eigenschaftsknoten in dem Graphen verbunden sind, der die Entität von Interesse darstellt, wobei der Graph eine Mehrzahl von Knoten einschließt, wobei die Mehrzahl von Knoten eine Mehrzahl von Entitätsknoten einschließt, die eine Mehrzahl von Entitäten darstellen, und eine Mehrzahl von Eigenschaftsknoten einschließt, die eine Mehrzahl von Eigenschaften darstellen, und wobei jede der Mehrzahl der Entitätsknoten in dem Graphen mit einem oder mehreren der Mehrzahl von Eigenschaftsknoten verbunden ist, und wobei eine Mehrzahl der Etiketten durch die Etikettenverbreitung in dem Graphen verbreitet werden, um eine Verteilung der Etiketten mit jedem der Mehrzahl von Knoten zu verbinden. Das Verfahren kann weiterhin die Ausgabe, durch das Computergerät, und für mindestens eine der Eigenschaften oder Entitäten von Interesse, eines Hinweises auf eine oder mehrere Entitäten, die mit der Eigenschaft oder der Entität von Interesse verbunden sind, wobei die Ausgabe des Hinweises auf die eine oder mehrere verbundene Entitäten teilweise auf der entsprechenden Verteilung von Etiketten basieren, die mit einem der Mehrzahl der Eigenschaftsknoten verbunden sind, der die Eigenschaft von Interesse darstellt, oder mit einem der Mehrzahl des Entitätsknoten, der die Entität von Interesse darstellt.
  • In einem anderen Beispiel richtet sich die Offenbarung auf ein Computersystem, das einen Speicher und mindestens einen Prozessor einschließt. Der mindestens eine Prozessor ist kommunikativ an den Speicher gekoppelt und kann so konfiguriert werden, dass er: Einen Hinweis auf mindestens eine, eine Eigenschaft von Interesse oder eine Entität von Interesse empfängt; eine oder mehrere Entitäten bestimmt, die mit der Eigenschaft von Interesse oder der Entität von Interesse verbunden sind, zumindest teilweise auf der Grundlage einer entsprechenden Verteilung von Etiketten, die mit einem einer Mehrzahl von Eigenschaftsknoten in einem Graphen verbunden sind, die eine Eigenschaft von Interesse darstellen, oder mit einem einer Mehrzahl von Entitätsknoten, die eine Entität von Interesse darstellen, wobei ein Graph eine Mehrzahl von Knoten enthält, wobei die Mehrzahl von Knoten eine Mehrzahl von Entitätsknoten enthält, die eine Mehrzahl von Entitäten darstellen, und eine Mehrzahl von Eigenschaftsknoten, die eine Mehrzahl von Eigenschaften darstellen, und wobei jede der Mehrzahl der Entitätsknoten in dem Graphen mit einem oder mehreren der Mehrzahl von Eigenschaftsknoten verbunden ist, und wobei eine Mehrzahl von Etiketten über die Etikettenverbreitung in dem Graphen verbreitet werden, um eine Verteilung der Etiketten mit jedem der Mehrzahl von Knoten zu verbinden; und einen Hinweis für mindestens eine, die Eigenschaft von Interesse oder die Entität von Interesse, auf eine oder mehrere verbundene Entitäten ausgibt, die mit der Eigenschaft von Interesse oder der Entität von Interesse verbunden sind, wobei die Ausgabe des Hinweises auf eine oder mehrere verbundene Entitäten zumindest teilweise auf der entsprechenden Verteilung der Etiketten basiert, die mit einem der Mehrzahl von Eigenschaftsknoten verbunden ist, der die Eigenschaft von Interesse darstellt, oder mit einem der Mehrzahl von Entitätsknoten, der die Entität von Interesse darstellt.
  • Die Details des einen oder der mehreren Beispiele sind in den zugehörigen Zeichnungen und der Beschreibung nachfolgend beschrieben. Weitere Eigenschaften, Gegenstände und Vorteile der Offenbarung werden anhand der Beschreibung und der Zeichnungen und anhand der Ansprüche ersichtlich.
  • KURZBESCHREIBUNG DER ZEICHNUNGEN
  • 1 ist ein konzeptuelles Diagramm, das ein Beispielsystem darstellt, das so konfiguriert ist, dass es gemäß einem oder mehreren Aspekten der vorliegenden Offenbarung verbundene Entitäten bestimmt.
  • 2 ist ein Blockdiagramm, das ein Beispielsystem darstellt, das so konfiguriert ist, dass es gemäß einem oder mehreren Aspekten der vorliegenden Offenbarung das Ausmaß der Verbundenheit eines Satzes Entitäten bestimmt.
  • 3A3C sind Blockdiagramme, die jeweils ein Beispiel für einen zweiteiligen Eigenschaft-Entität-Graphen veranschaulichen, die ein Beispiel-Rankingmodul konstruieren kann, um eine beispielhafte Expandertechnik entsprechend Aspekten der vorliegenden Offenbarung auszuführen.
  • 4 ist ein Flussdiagramm, das ein Beispielverfahren für die Bestimmung von verbundenen Entitäten gemäß einem oder mehreren Aspekten der vorliegenden Offenbarung veranschaulicht.
  • 5 ist ein Flussdiagramm, das ein Beispielverfahren für die Bestimmung von verbundenen Entitäten gemäß einem oder mehreren Aspekten der vorliegenden Offenbarung veranschaulicht.
  • DETAILLIERTE BESCHREIBUNG
  • Im Allgemeinen kann diese Offenbarung ein Computersystem dazu befähigen, für eine Entität eine oder mehrere verbundene Entitäten zu bestimmen. Das Computersystem kann, für eine Entität von Interesse, eine oder mehrere Entitäten bestimmen, die semantisch mit der Entität von Interesse zusammenhängen, und kann die eine oder mehrere Entitäten zumindest teilweise auf der Grundlage ihrer Verbundenheit mit der Entität von Interesse bewerten. Wenn also das Computersystem bestimmt, dass ein Benutzer an einer Entität interessiert ist, kann das Computersystem bestimmen, dass der Benutzer potenziell auch an der einen oder den mehreren Entitäten interessiert ist, die semantisch mit der Entität zusammenhängen, an der der Benutzer interessiert ist. Auf diese Weise kann das Computersystem dem Benutzer vorgeschlagene Entitäten bereitstellen, an denen der Benutzer interessiert sein kann.
  • Die Verbundenheit von zwei Entitäten kann im Verhältnis zu der Wahrscheinlichkeit stehen, dass ein zufälliger Benutzer, der an einer ersten Entität interessiert ist, auch an der zweiten Entität interessiert ist. Das Computersystem kann die Verbundenheit einer Entität zu jeder einer Mehrzahl von Entitäten bestimmen und eine Rangliste der Mehrzahl der Entitäten erstellen, die zumindest teilweise auf dem Ausmaß basiert, in dem die Entität mit jeder der Mehrzahl der Entitäten verbunden ist.
  • 1 ist ein konzeptuelles Diagramm, das ein System 10 als Beispielsystem darstellt, das so konfiguriert werden kann, dass es gemäß einem oder mehreren Aspekten der vorliegenden Offenbarung verbundene Entitäten bestimmt. System 100 schließt Informationsserversystem („ISS”) 14 ein, das sich in Kommunikation mit dem Computergerät 2 über Netzwerk 12 befindet. Das Computergerät 2 kann mit ISS 14 über Netzwerk 12 kommunizieren, um ISS 14 mit Informationen zu versehen, die auf eine von Computergerät 2 empfangene Anfrage hinweisen oder auf eine Entität, an der ein Benutzer des Computergerätes 2 interessiert ist. ISS 14 kann eine Rangliste mit einer oder mehreren Entitäten erstellen, die mir der Anfrage oder der Entität verbunden sind, und kann die Rangliste einer oder mehrerer Entitäten des Computergerätes 2 mitteilen. Computergerät 2 kann, über Benutzeroberflächengerät 4, die Rangliste mit der einen oder mehreren Entitäten zur Anzeige für den Benutzer des Computergerätes 2 ausgeben.
  • Das Netzwerk 12 repräsentiert jegliches öffentliche oder private Kommunikationsnetz, zum Beispiel Mobilfunk-, WiFi- und/oder andere Arten Netze für die Übertragung von Daten zwischen Computersystemen, Servern und Computergeräten. Das Netzwerk 12 kann einen oder mehrere Netzwerkknoten, Netzschalter, Netzwerkrouter oder jegliche anderen Netzwerkgeräte einschließen, die operativ aneinander gekoppelt sind und so den Austausch von Informationen zwischen ISS 14 und Computergerät 2 bereitstellen. Computergerät 2 und ISS 14 können Daten über das Netzwerk 12 unter Verwendung aller geeigneten verdrahteten oder drahtlosen Kommunikationstechniken übertragen und empfangen. In einigen Beispielen kann Netzwerk 12 das Internet 20 sein.
  • ISS 14 und Computergerät 2 können jeweils operativ an das Netzwerk 12 gekoppelt sein und entsprechende Netzwerkverbindungen verwenden. Die Verbindungen, die Computergerät 2 und ISS 14 mit dem Netzwerk 12 verbinden, können Ethernet oder andere Arten Netzwerkverbindungen sein, und solche Verbindungen können drahtlose und/oder verdrahtete Verbindungen sein.
  • Das Computergerät 2 stellt ein einzelnes mobiles oder nicht-mobiles Computergerät dar. Beispiele für Computergerät 2 schließen ein Mobiltelefon, einen Tablet-Computer, einen Laptop-Computer, ein Desktop-Computer, einen Server, einen Mainframe, eine Set-Top-Box, einen Fernseher, ein tragbares Gerät (z. B. eine computerisierte Uhr, eine computerisierte Brille, computerisierte Handschuhe), ein Hauptautomationsgerät oder -system (z. B. ein intelligentes Thermostat oder einen Heimassistenten), eine Personal Digital Assistant (PDA), tragbare Spielsysteme, Medienplayer, E-buch-Leser, mobile Fernsehplattformen, Autonavigation- und -unterhaltungssysteme oder jegliche anderen Arten mobile, nicht-mobile, tragbare und nicht-tragbare Computergeräte ein, die so konfiguriert sind, dass sie Informationen über ein Netzwerk wie Netzwerk 12 empfangen.
  • Das Computergerät 2 schließt ein Benutzeroberflächengerät (UID) 4 und das Benutzeroberflächenmodul Modul (UIM) 6 ein. UI-Modul 6 kann die beschriebenen Tätigkeiten unter Verwendung von Software, Hardware, Firmware oder einer Mischung der Hardware, der Software und der Firmware ausführen, die sich in Computergerät 2 befinden oder von ihm ausgeführt werden. In einigen Beispielen kann das Computergerät 2 UI-Modul 6 mit einem oder mehreren Prozessoren oder einem oder mehreren Geräten ausführen. In einigen Beispielen kann Computergerät 2 UI-Modul 6 als eine oder mehrere virtuelle Maschinen ausführen, die auf der zugrundeliegenden Hardware ausgeführt werden. In einigen Beispielen kann UI-Modul 6 als eine oder mehrere Services eines Betriebssystems oder einer Computerplattform ausgeführt werden. In einigen Beispielen kann UI-Modul 6 als ein oder mehrere ausführbare Programme auf einer Anwendungsschicht einer Computerplattform ausgeführt werden.
  • Das Benutzeroberflächengerät 4 des Computergerätes 2 kann als Eingabe- und/oder Ausgabegerät für das Computergerät 2 dienen. Das Benutzeroberflächengerät 4 kann mit verschiedenen Technologien implementiert werden. Zum Beispiel kann das Benutzeroberflächengerät 4 als Eingabegerät mit einer oder mehreren anwesenheitssensiblen Eingabekomponenten, wie resistive Touchscreens, Surface-Acoustic-Wave-Touchscreens, kapazitive Touchscreens, projektiv-kapazitive Touchscreens, druckempfindliche Bildschirme, Acoustic-Pulse-Recognition-Touchscreens oder einer anderen anwesenheitssensible Anzeigentechnologie funktionieren. Außerdem kann das Benutzeroberflächengerät 4 Mikrofontechnologien, Infrarotsensortechniken oder andere Eingabegerättechnologien für den Empfang von Benutzereingaben einschließen.
  • Das Benutzeroberflächengerät 4 kann als Ausgabegerät (z. B. eine Anzeige) mit einem oder mehreren Anzeigekomponenten funktionieren, wie Flüssigkristallanzeigen (LCD), Punktmatrixanzeigen, LED-Anzeigen, organische LED-Anzeigen, E-Ink-Display oder ähnlichen Monochrom- oder Farbenanzeigen, die in der Lage sind, einem Benutzer des Computergerätes 2 sichtbare Informationen auszugeben. Zusätzlich kann das Benutzeroberflächengerät 4 Lautsprechertechnologien, haptische Feedbacktechnologien oder andere Ausgabegerättechnologien für die Verwendung zur Ausgabe für einen Benutzer einschließen.
  • Das Benutzeroberflächengerät 4 kann eine anwesenheitssensible Anzeige einschließen, die haptische Eingaben von einem Benutzer des Computergeräts 2 empfangen kann. Das Benutzeroberflächengerät 4 kann Hinweise auf haptische Eingaben empfangen, indem es eine oder mehrere Gesten von einem Benutzer ermittelt (z. B. berührt der Benutzer das Benutzeroberflächengerät 4 oder zeigt auf eine oder mehrere Positionen mit einem Finger oder einem Eingabestift). Das Benutzeroberflächengerät 4 kann einem Benutzer Ausgaben zum Beispiel auf einer anwesenheitssensiblen Anzeige darstellen. Das Benutzeroberflächengerät 4 kann die Ausgabe als graphische Benutzeroberfläche (z. B. Benutzeroberfläche 8) darstellen, die mit von dem Computergerät 2 bereitgestellter Funktionalität verbunden sein kann. Zum Beispiel kann das Benutzeroberflächengerät 4 verschiedene Benutzeroberflächen darstellen (z. B. Benutzeroberfläche 8), die mit einem Satz Entitäten verbunden sind, an denen der Benutzer des Computergerätes 2 ein Interesse haben kann, wie von UI-Modul 120 oder anderen Eigenschaften von Computerplattformen, Betriebssystemen, Anwendungen und/oder Services bereitgestellt, die von Computergerät 2 (z. B. elektronischen Nachrichtenanwendungen, Internetbrowseranwendungen, mobile oder Desktop-Betriebssysteme usw.) ausgeführt werden oder von dem Gerät aus zugänglich sind.
  • UI-Modul 6 kann Benutzerinteraktionen mit Benutzeroberflächengerät 4 und anderen Komponenten des Computergerätes 2 verwalten, einschließlich Interaktionen mit ISS 14, um einen Hinweis auf eine oder mehrere Entitäten auf dem Benutzeroberflächengerät 4 bereitzustellen. UI-Modul 6 kann das Benutzeroberflächengerät 4 veranlassen, eine grafische Benutzeroberfläche, z. B. Benutzeroberfläche 8 (oder andere Beispielbenutzeroberflächen) zur Anzeige auszugeben, wenn ein Benutzer von Computergerät 2 Ausgaben auf dem Benutzeroberflächengerät 4 betrachtet und/oder Eingaben bereitstellt. UI-Modul 6 und Benutzeroberflächengerät 4 können eine oder mehrere Hinweise auf Eingaben von einem Benutzer empfangen, während der Benutzer mit der Benutzeroberfläche interagiert. UI-Modul 6 und Benutzeroberflächengerät 4 können Eingaben, die auf Benutzeroberflächengerät 4 erkannt wurden, interpretieren und können Informationen über die Eingaben, die auf Benutzeroberflächengerät 4 erkannt wurden, an eine oder mehrere verbundene Plattformen, Betriebssysteme, Anwendungen und/oder Dienste weiterleiten, die auf Computergerät 2 ausgeführt werden, z. B. um Computergerät 2 zu veranlassen, Funktionen durchzuführen.
  • UI-Modul 6 kann Informationen und Anweisungen von einer oder mehreren verbundenen Plattformen, von Betriebssystemen, von Anwendungen und/oder von Services empfangen, die auf dem Computergerät 2 und/oder auf einem oder mehreren entfernten Computersystemen, wie ISS 14, ausgeführt werden. Zusätzlich kann UI-Modul 6 als ein Zwischenelement zwischen der einen oder den mehreren verbundenen Plattformen, Betriebssystemen, Anwendungen und/oder Diensten agieren, die auf Computergerät 2 und unterschiedlichen Ausgabevorrichtungen von Computergerät 2 ausgeführt werden (z. B. Lautsprecher, LED-Anzeigen, Audio- oder elektrostatische haptische Ausgabevorrichtungen usw.), um eine Ausgabe (z. B. eine Grafik, einen Lichtblitz, einen Ton, eine haptische Reaktion usw.) bei Computergerät 2 zu produzieren.
  • UI-Modul 6 kann einen Hinweis auf eine Entität empfangen, an der der Benutzer von Computergerät 2 ein Interesse hat. Eine Entität kann, in einigen Beispielen, eine Veranstaltung, ein Ort, eine Person, ein Geschäft, ein Film, ein Restaurant und dergleichen sein. Z. B. kann der Benutzer von Computergerät 2 eine Webbrowseranwendung verwenden, die auf Computergerät 2 läuft, um eine Webseite für eine bestimmte Veranstaltung (z. B. eine Webseite für eine Kletterreise) oder um ein Soziale-Medien-Posting für die bestimmte Veranstaltung mit „gefällt mir” zu markieren, was einen Hinweis für UI-Modul 6 darstellen kann, dass der Benutzer an der bestimmten Veranstaltung interessiert ist.
  • UI-Modul 6 kann einen Hinweis auf die Entität von Interesse an ISS 14 über das Netzwerk 12 schicken. Z. B. kann UI-Modul 6 die Internetadresse (z. B. uniform resource locator) der Webseite für die Entität senden. Als Antwort kann UI-Modul 6 über Netzwerk 12 Hinweise auf eine oder mehrere Entitäten empfangen, die am engsten mit der Entität von Interesse von ISS 14 verbunden sind. Z. B. kann UI-Modul 6 die Internetadressen der einen oder der mehreren Entitäten empfangen. UI-Modul 6 kann von ISS 14 auch einen Hinweis auf das Ausmaß der Verbundenheit der einen oder mehreren Entitäten mit der Entität von Interesse empfangen, wie ein Ranking dazu, wie verbunden jede der einen oder mehreren Entitäten mit der Entität von Interesse sind, oder eine nummerischen Quantifizierung (z. B. von 0 bis 1.0) des Ausmaßes der Verbundenheit jeder der einen oder mehreren Entitäten mit der Entität von Interesse.
  • Das Benutzeroberflächengerät 4 kann Benutzeroberfläche 8, wie eine graphische Benutzeroberfläche ausgeben, die Hinweise auf die eine oder die mehreren Entitäten einschließt, die mit der Entität von Interesse verbunden sind. Wie in 1 gezeigt, wenn die Entität von Interesse eine Wanderreise ist, kann Benutzeroberfläche 8 Hinweise auf eine Kletterveranstaltung, eine Rucksackreiseveranstaltung und eine Höhlenkletterveranstaltung als die Entitäten einschließen, die mit der Wanderreise verbunden sind. Das Benutzeroberflächengerät 4 kann die verbundenen Entitäten in der Reihenfolge der Verbundenheit zu der Entität von Interesse in dem nicht einschränkenden Beispiel von 1 darstellen, so dass die Kletterveranstaltung die am engsten verbundene Entität, die Rucksackreiseveranstaltung die am nächst engsten verbundene Entität und die Höhlenkletterveranstaltung die am drittengsten verbundene Entität sein kann. Auf diese Weise kann das Benutzeroberflächengerät 4 eine Rankingliste der Entitäten darstellen, an denen der Benutzer von Computergerät 2 interessiert sein kann, und zwar auf der Grundlage des Interesses des Benutzers an der bestimmten Wanderreise.
  • Im Beispiel von 1 schließt ISS 14 Entitätsmodul 16 und Rankingmodul 18 ein. Gemeinsam können die Module 16 und 18 möglicherweise verbundene Entitäten sein, die für Computergerät 2 und andere an Netzwerk 12 angeschlossene Computergeräte zugänglich sein können, um eine oder mehrere Entitäten bereitzustellen, die mit der Entität von Interesse verbunden sein können. Die Module 16 und 18 können hierin beschriebene Vorgänge unter Verwendung von Software, Hardware und Firmware oder jeder Kombination von Software, Hardware und Firmware ausführen, die sich in ISS 14 befindet und/oder darauf ausgeführt wird. ISS 14 kann die Module 16 und 18 mit einem oder mehreren Prozessoren, einem oder mehreren Geräte, virtuellen Maschinen, die auf zugrundeliegender Hardware ausgeführt werden, und/oder als ein oder mehrere Services einer Betriebssystem- oder Computerplattform ausführen, um nur einige nichtbeschränkende Beispiele zu nennen. In einigen Beispielen können die Module 16 und 18 als ein oder mehrere ausführbare Programme auf einer Anwendungsschicht einer Computerplattform von ISS 14 ausgeführt werden.
  • Entitätsmodul 16 kann vom Internet 20 mit Entitäten verbundene Internetressourcen abrufen und/oder empfangen, und kann von den verbundenen Internetressourcen einen Satz Eigenschaften abrufen, die mit jeder der Entitäten verbunden sind. Entitätsmodul 16 kann das Internet 20 nach Internetressourcen wie Webseiten, Soziale-Medien-Postings und dergleichen durchsuchen, die auf Internetservern 22 gespeichert werden (z. B. Webservern) oder kann ansonsten einen Satz Internetressourcen empfangen und kann Eigenschaften von solchen Internetressourcen abrufen. Z. B. kann eine Internetressource, die mit einer Wanderreise verbunden ist, eine Website oder ein Soziale-Medien-Posting sein, die/das die Wanderreise beschreibt.
  • In einem Beispiel kann Entitätsmodul 16 von einer oder mehreren Webseiten für eine Entität eine oder mehrere mit der Entität verbundene Eigenschaften extrahieren. Die Eigenschaften, die mit einer Entität verbunden sind, können Kontextinformationen sein, die die verbundene Entität beschreiben. Eigenschaften können Text, wie Wörter, Sätze und dergleichen einschließen, die auf den Webseiten für die Entität enthalten sind. In einigen Beispielen können Eigenschaften auch Bilder, Videos und andere Medien einschließen. Entitätsmodul 16 kann von einer Webseite für eine Entität Eigenschaften wie eine Entitätsbeschreibung, den umgebenden Text auf den Webseiten, mit den Webseiten, auf denen die Entität auftritt, verbundene Anfragen, Textanker, die auf die Webseiten für die Entität hinweisen, eine taxonomische Kategorisierung der Webseiten für die Entität und dergleichen extrahieren.
  • Entitätsmodul 16 kann die von den Internetressourcen extrahierten Eigenschaften sowie Hinweise von Verbindungen zwischen Entitäten und den Eigenschaften auf computerlesbaren Speichergeräten, wie Platten, nicht-flüchtigen Speichern und dergleichen im Informationsserversystem 14 speichern. Z. B. kann Entitätsmodul 16 solche Eigenschaften und Hinweise auf die Verbindungen zwischen Entitäten und den Eigenschaften als ein oder mehrere Dokumente, Datenbankeintragungen oder anderen Strukturdaten speichern, einschließlich unter anderem im CSV-Format, Eintragungen in relationale Datenbänke, Extensible-Markup-Language-(XML)Daten, Javascript-Object-Notation-(JSON)Daten und dergleichen.
  • Entitätsmodul 16 kann auch eine Eigenschaftsvorbereitung an dem mit jeder Entität verbundenen Satz Eigenschaften vornehmen, der von der mit der jeweiligen Entität verbundenen Internetressource extrahiert wurde. Z. B. kann Entitätsmodul 16 die Entfernung von Stoppwörtern durchführen, um die allgemeinsten Wörter in einer Sprache zu entfernen (z. B. a, the, is, at, which, an und dergleichen für die englische Sprache). Entitätsmodul 16 kann eine Neugewichtung der Eigenschaft durchführen, um die mit der Entität verbundenen Eigenschaften zu gewichten, zumindest teilweise auf der Grundlage der Häufigkeit, mit der die Eigenschaft in der mit der Entität verbundenen Internetressource erscheint. Z. B. kann Entitätsmodul 16 Eigenschaften eine höhere Gewichtung zuweisen, die häufiger in der mit der Entität verbundenen Internetressource erscheinen. Entitätsmodul 16 kann solche Gewichtungen von Eigenschaften für Entitäten auf computerlesbare Speichergeräte in ISS 14 als ein oder mehrere Dokumente, Datenbankeintragungen oder andere Strukturdaten speichern, einschließlich unter anderem CSV-Daten, Eintragungen in relationale Datenbanken, XML-Daten, JSON-Daten und dergleichen.
  • Rankingmodul 18 kann einen Hinweis auf eine Entität von Interesse von Computergerät 2 empfangen, ein Ranking einer oder mehrerer Entitäten bestimmen, die mit der Entität von Interesse verbunden sind, zumindest teilweise auf der Grundlage des Ausmaßes der Verbundenheit von jeder der einen oder der mehreren Entitäten mit der Entität von Interesse, und kann Computergerät 2 einen Hinweis auf die eine oder mehrere Entitäten kommunizieren. Zu diesem Zweck kann Rankingmodul 18 ein Maß für die Ähnlichkeit zwischen der Entität von Interesse und jeder einer Mehrzahl anderer Entitäten bestimmen, bei denen das Ähnlichkeitsmaß dem Ausmaß der Verbundenheit entsprechen kann, und kann bestimmen, welche der Mehrzahl anderer Entitäten mit der Entität von Interesse am engsten verbunden sind, zumindest teilweise auf der Grundlage des Maßes der Ähnlichkeit.
  • In einem Beispiel kann Rankingmodul 18 zumindest teilweise auf der Grundlage des Messens der Ähnlichkeit zwischen Eigenschaften von zwei Entitäten und dem Kombinieren des Maßes der Ähnlichkeit zwischen jeder Eigenschaftsart der zwei Entitäten ein Ähnlichkeitsmaß zwischen zwei Entitäten bestimmen. Um ein Ähnlichkeitsmaß zwischen einer Entität von Interesse und einer Zielentität zu bestimmen, kann Rankingmodul 18, für Eigenschaften jeder mit der Entität von Interesse verbundenen Eigenschaftsart, das Ähnlichkeitsmaß zwischen den Eigenschaften der Eigenschaftsart der Entität von Interesse und den Eigenschaften der Eigenschafsart einer Zielentität bestimmen, und kann das Ähnlichkeitsmaß für jede der Eigenschaftsarten der Entität kombinieren, um ein Ähnlichkeitsmaß zwischen der Entität von Interesse und der Zielentität zu bestimmen.
  • In einem anderen Beispiel kann Rankingmodul 18 ein Ähnlichkeitsmaß zwischen zwei Entitäten (z. B. einer Entität von Interesse und einer Zielentität) zumindest teilweise auf der Grundlage der Tatsache bestimmen, ob die zwei Entitäten Verbindungen zu anderen ähnlichen Entitäten teilen. Das heißt, dass Rankingmodul 18 bestimmen kann, dass zwei Entitäten verbunden sind, weil einige ihrer verbundenen Eigenschaften semantisch verwandt sind, selbst wenn die beiden Entitäten nicht die gleichen Eigenschaften teilen.
  • Zu diesem Zweck und gemäß Aspekten der vorliegenden Offenbarung kann Rankingmodul 18, in verschiedenen nicht-begrenzenden Beispielen, einen zweiteilige Graphen erstellen, in dem Rankingmodul 18 Informationen durch die Graphen verbreiten kann, um semantische Nachrichten weiterzuleiten. Spezifisch kann der zweiteilige Graph eine Mehrzahl von Entitätsknoten einschließen, die mit einer Mehrzahl von Entitäten verbunden sind, die an eine Mehrzahl von mit einer Mehrzahl von Eigenschaften verbundenen Eigenschaftsknoten angeschlossen sind, wobei jede der Mehrzahl der Entitätsknoten an eine oder mehrere der Mehrzahl der Eigenschaftsknoten angeschlossen ist. So kann in dem zweiteiligen Graphen ein Entitätsknoten, der mit einer Entität verbunden ist, an einen oder mehrere Eigenschaftsknoten angeschlossen sein, die mit der einen oder den mehreren Eigenschaften der Entität verbunden sind.
  • Rankingmodul 18 kann für eine Entität von Interesse eine oder mehrere verbundene Entitäten bestimmten, und zwar zumindest teilweise basierend auf Verbindungen in dem zweiteiligen Graphen zwischen einem oder mehreren Entitätsknoten, die mit der einen oder den mehreren verwandten Entitäten verbunden sind, mit einem Entitätsknoten verbunden sind, der mit einer Entität von Interesse verbunden ist. Spezifisch kann Rankingmodul 18 unüberwachtes Maschinenlernen ausführen, einschließlich des Ausführens der Etikettenverbreitung über mehrfache Iterationen, um eine Etikettenverteilung mit jedem der Mehrzahl von Knoten des zweiteiligen Graphen zu verbinden, wie nachstehend in Bezug auf 3A3C ausführlicher besprochen. Rankingmodul 18 kann eine solche Etikettenverbreitung als eine optimale Lösung ausführen, die eine Zielfunktion für die Erstellung einer Etikettenverteilung, die mit jedem Knoten des zweiteiligen Graphen verbunden ist, zu minimieren, wobei jede Etikettenverteilung einen Hinweis auf ein Ranking der einen oder der mehreren Entitäten einschließt, die mit einer Entität oder einer Eigenschaft zusammenhängen, die durch einen verbundenen Entitäts- oder Eigenschaftsknoten dargestellt werden. Auf diese Art kann Rankingmodul 18 für eine bestimmte Entität von Interesse ein Ranking einer oder mehrerer Entitäten bestimmen, die mit der Entität von Interesse zusammenhängen.
  • Zwar werden sie im Rahmen von zweiteiligen Graphen beschrieben, aber Aspekte der vorliegenden Offenbarung können auch als Tabellen, Datenbanken oder andere zugrundeliegende Datenstrukturen implementiert werden. Knoten und Kanten eines zweiteiligen Graphen können folglich auch als Teile einer Datenstruktur, Eintragungen in Tabellen, Datenbanken, Funktionen, Umwandlungen oder Daten implementiert werden, die auf oder zwischen Eintragungen in Tabellen, Datenbanken oder anderen zugrundeliegenden Datenstrukturen angewendet werden. Die Datenstrukturen, Tabellen, Datenbanken, Funktionen, Daten und so weiter können folglich eine oder mehrere zweiteilige Graphen darstellen, wie hier offenbart.
  • Rankingmodul 18 kann die vorstehenden Techniken ausführen, um ein Ähnlichkeitsmaß (z. B. eine Ähnlichkeitspunktzahl) zwischen der Entität von Interesse und einer Mehrzahl von anderen Entitäten zu bestimmen, und kann auf der Grundlage des bestimmten Ähnlichkeitsmaßes ein Ranking der Verbundenheit der Mehrzahl von Entitäten mit der Entität von Interesse bestimmen. Rankingmodul 18 kann über Netzwerk 12 einen Hinweis an Computergerät 2 auf eine Ranking-Liste einer oder mehrerer der am engsten mit der Entität von Interesse verbundenen Entitäten senden. Z. B. kann Rankingmodul 18 an Computergerät 2 eine Webseite schicken, die Links zu den Webseiten einschließt, die mit der Ranking-Liste mit einer oder mehreren der am engsten verbundenen Entitäten verbunden sind. Dementsprechend kann ein Webbrowser, der auf Computergerät 2 läuft, die empfangene Webseite so wiedergeben, dass Benutzeroberflächengerät 4 die Benutzeroberfläche 8 darstellen kann, die Links zu den Webseiten einschließt, die mit der Ranking-Liste der einen oder mehreren der am engsten verbundenen Entitäten verbunden sind.
  • Gemäß Aspekten der vorliegenden Offenbarung kann ISS 14 einen Graphen erzeugen, die eine Mehrzahl von Knoten einschließt, wobei die Mehrzahl der Knoten eine Mehrzahl von Knoten einschließt, die eine Mehrzahl von Entitäten darstellen, und eine Mehrzahl von Eigenschaftsknoten, die eine Mehrzahl von Eigenschaften darstellen, und wobei jeder der Mehrzahl der Entitätsknoten in dem Graphen an einen oder mehrere der Mehrzahl der Eigenschaftsknoten angeschlossen ist. ISS 14 kann die Etikettenverbreitung ausführen, um eine Mehrzahl von Etiketten in dem Graphen zu verbreiten, um eine Verteilung der Etiketten mit jedem der Mehrzahl von Knoten zu verbinden. ISS 14 kann einen Hinweis auf mindestens eine Eigenschaft von Interesse oder eine Entität von Interesse empfangen. ISS 14 kann für mindestens eine der Eigenschaften oder der Entitäten von Interesse, einen Hinweis auf eine oder mehrere verbundene Entitäten ausgeben, die mit der Eigenschaft oder der Entität verbunden sind, wobei die Ausgabe des Hinweises auf die eine oder mehrere verbundene Entitäten teilweise auf der entsprechenden Verteilung von Etiketten basiert, die mit einem der Mehrzahl der Eigenschaftsknoten verbunden sind, der die Eigenschaft von Interesse darstellt, oder mit einem der Mehrzahl des Entitätsknoten, der die Entität von Interesse darstellt. Diese und andere Aspekte der vorliegenden Offenbarung werden nachstehend ausführlicher besprochen.
  • 2 ist ein Blockdiagramm, das ein ISS 14 als Beispielcomputersystem darstellt, das so konfiguriert ist, dass es gemäß einem oder mehreren Aspekten der vorliegenden Offenbarung das Ausmaß der Verbundenheit eines Satzes Entitäten bestimmt. 2 veranschaulicht ein bestimmtes Beispiel eines ISS 14, und viele andere Beispiele von ISS 14 können in anderen Instanzen verwendet werden und eine Untergruppe der Komponenten einschließen, die im Beispiel-ISS 14 enthalten sind oder in zusätzlichen Komponenten enthalten sein können, die nicht in 2 gezeigt werden.
  • ISS 14 stellt Computergerät 2 eine Leitung bereit, durch die ein Computergerät, wie Computergerät 2, auf einen verbundenen Entitätsservice für den automatischen Empfang von Informationen zugreifen kann, die einen Hinweis auf eine oder mehrere verbundene Entitäten für eine Entität von Interesse oder eine Eigenschaft von Interesse bieten. Wie in dem Beispiel von 2 gezeigt, schließt ISS 14 einen oder mehrere Prozessoren 44, eine oder mehrere Kommunikationseinheiten 46 und ein oder mehrere Speichergeräte 48 ein. Speichergeräte 48 von ISS 14 schließen das Entitätsmodul 16 und das Rankingmodul 18 ein.
  • Speichergeräte 48 von ISS 14 schließen weiterhin den Eigenschaft-Entität-Datenspeicher 52A, den Graphdatenspeicher 52B, den Ranking-Datenspeicher 52C und den Internetressourcen-Datenspeicher 52D (gemeinsam „Datenspeicher 52”) ein. Die Kommunikationskanäle 50 können mit jeder der Komponenten 44, 46 und 48 zwecks Kommunikation zwischen den Komponenten (physisch, kommunikativ und/oder operativ) verbunden sein. In einigen Beispielen können Kommunikationskanäle 50 einen Systembus, eine Netzwerkverbindung, eine prozessübergreifende Kommunikationsdatenstruktur oder jedes andere Verfahren zur Kommunikation von Daten beinhalten.
  • Eine oder mehrere Kommunikationseinheiten 46 von ISS 14 können mit externen Computergeräten wie Computergerät 2 von 1 durch Übertragung und/oder Empfangen von Netzsignalen auf einem oder mehreren Netzwerken kommunizieren, wie Netzwerk 12 oder Internet 20 von 1. Z. B. kann ISS 14 die Kommunikationseinheit 46 benutzen, um Funksignale über Netzwerk 12 zu übertragen und/oder zu empfangen, um Informationen mit Computergerät 2 auszutauschen. Beispiele von Kommunikationseinheit 46 können eine Netzwerkschnittstellenkarte (z. B. eine Ethernetkarte), einen optischen Sender-Empfänger, einen Funkfrequenz-Sender-Empfänger, einen GPS-Empfänger oder jede andere Art von Gerät beinhalten, das Informationen senden und/oder empfangen kann. Andere Beispiele von Kommunikationseinheiten 46 können Kurzwellenradios, Mobilfunkdatenradios, drahtlose Ethernet-Netzwerkradios sowie Universal Serial Bus(USB)-Controller beinhalten.
  • Speichergeräte 48 können Informationen für die Verarbeitung während des Betriebs von ISS 14 speichern (z. B. kann ISS 14 Daten speichern, auf die von den Modulen 16 und 18 während der Ausführung im ISS 14 zugegriffen wird). In einigen Beispielen ist Speichergerät 48 ein temporärer Speicher, was bedeutet, dass der Hauptzweck von Speichergerät 48 nicht die Langzeitspeicherung ist. Speichergeräte 48 auf ISS 14 können zur Kurzzeitspeicherung von Informationen als flüchtiger Speicher konfiguriert sein und behalten deshalb gespeicherte Inhalte nicht, wenn sie ausgeschaltet werden. Beispiele von flüchtigen Speichern beinhalten Arbeitsspeicher (RAM), dynamische Arbeitsspeicher (DRAM), statische Arbeitsspeicher (SRAM) und andere Formen von flüchtigen Speichern, die auf dem Gebiet bekannt sind.
  • Die Speichergeräte 48 beinhalten in einigen Beispielen auch ein oder mehrere computerlesbare Speichermedien. Die Speichergeräte 48 können größere Mengen von Informationen als flüchtige Speicher speichern. Die Speichergeräte 48 können weiterhin zur Langzeitspeicherung von Informationen als nicht flüchtiger Speicherplatz und zum Halten von Informationen nach Stromeinschalt-/Ausschaltzyklen konfiguriert sein. Beispiele von nicht flüchtigen Speichern beinhalten magnetische Festplatten, optische Festplatten, Disketten, Flashspeicher oder Formen von elektrisch programmierbaren Speichern (EPROM) oder von elektrisch überschreibbaren und programmierbaren (EEPROM) Speichern. Die Speichergeräte 48 können Programmanweisungen und/oder mit den Modulen 16 und 18 verbundene Daten speichern.
  • Einer oder mehrere Prozessoren 44 können Funktionalität implementieren und/oder Anweisungen im ISS 14 ausführen. Z. B. können die Prozessoren 44 im ISS 14 Anweisungen empfangen und ausführen, die von den Speichergeräten 48 gespeichert werden, die die Funktionalitäten der Module 16 und 18 ausführen. Diese Anweisungen können, wenn sie durch die Prozessoren 44 ausgeführt werden, das ISS 14 dazu veranlassen, Informationen in den Speichergeräten 48 während des Ablaufs des Programms zu speichern. Die Prozessoren 44 können Anweisungen der Module 16 und 18 ausführen. um eine Mehrzahl von Eigenschaften zu extrahieren, die mit einer Mehrzahl von Entitäten von einer Mehrzahl von Internetquellen verbunden sind, und ein Ausmaß an Verbundenheit zwischen jedem der Entitäten bestimmen, um ein Ranking der einen oder mehreren verbundenen Entitäten für eine bestimmte Entität von Interesse oder Eigenschaft von Interesse auszugeben. Das heißt, dass die Module 16 und 18 durch die Prozessoren 44 betrieben werden können, um verschiedene Tätigkeiten oder Funktionen von ISS 14 auszuführen, die hier beschrieben werden.
  • Die Informationen, die in den Datenspeichern 52 gespeichert werden, können als strukturierte Daten gespeichert werden, die durchsuchbar und/oder kategorisiert sind. Z. B. können ein oder mehrere Module 16 und 18 Daten im Datenspeicher 52 speichern. Ein oder mehrere Module 16 und 18 können eine Eingabe mit der Anforderung von Informationen von einem oder mehreren der Datenspeicher 52 bereitstellen und als Reaktion auf die Eingabe in den Datenspeichern 52 gespeicherte Informationen erhalten. ISS 14 kann Zugang zu den in den Datenspeichern 52 gespeicherten Informationen als einen cloud-basierten Datenzugangsservice zu den Geräten bereitstellen, die an Netzwerk 12 oder Internet 20 angeschlossen werden, wie Computergerät 2. Wenn die Datenspeicher 52 mit einzelnen Benutzern verbundene Informationen enthalten oder wenn die Informationen für zahlreiche Benutzer generalisiert werden, können alle persönlich identifizierbaren Informationen wie Name, Adresse, Telefonnummer, und/oder kann die Emailadresse, die die Informationen mit einzelnen Personen verbinden, entfernt werden, bevor sie in ISS 14 gespeichert werden. ISS 14 kann ferner die Informationen verschlüsseln, die in Datenspeichern 52 gespeichert werden, um den Zugang zu allen dort gespeicherten Informationen zu verhindern. Außerdem kann ISS 14 die Informationen nur speichern, die mit Benutzern von Computergeräten verbunden sind, wenn diese Benutzer einer solchen Informationserfassung bestätigend zustimmen. ISS 14 kann ferner Gelegenheiten für Benutzer bereitstellen, die Zustimmung zurückzunehmen, und in diesem Fall kann ISS 14 aufhören, die Informationen zu erfassen oder ansonsten zu behalten, die mit diesem bestimmten Benutzer verbunden sind.
  • Das Entitätsmodul 16 kann Internetressourcen abrufen, empfangen oder ansonsten erhalten, wie Internetserver 22 über das Internet 20 sowie mit den Internetressourcen verbundene Informationen, und kann die Internetressource, sowie die mit den Internetressourcen verbundenen Informationen im Internetressourcen-Datenspeicher 52D speichern.
  • Die Internetressourcen, die durch Entitätsmodul 16 beschafft werden, können, in einigen Beispielen, Dokumente (z. B. Webseiten) sein, die beim Durchsuchen des Internets 20 nach Dokumenten erhalten werden. In einigen Beispielen kann das Entitätsmodul 16 die Internetressourcen eventuell nicht im Internetressourcen-Datenspeicher 52D speichern. Stattdessen können die Internetressourcen anderswo gespeichert werden, wie auf einem oder mehreren entfernten Computergeräten (nicht angezeigt), mit dem das Entitätsmodul 16 über Internet 20 kommunizieren kann.
  • Ressourceninformationen, die mit den Internetressourcen verbunden sind, können Kontextinformationen über Internetressourcen enthalten, die nicht im Hauptteil der Internetressourcen selbst enthalten sind. Z. B. können die Ressourceninformationen, die mit einer bestimmten Internetressource verbunden sind, Anfragen einschließen, die an eine Internet-Suchmaschine ausgegeben werden und die zu einem Besuch der Internetressource über einen Link zu der Internetressource führen, die in den Suchergebnissen eingeschlossen ist. In einem anderen Beispiel können die mit einer bestimmten Internetressource verbundenen Ressourceninformationen einen Textanker eines Links zu der Internetressource von einer anderen Internetressource einschließen. In einem anderen Beispiel können die mit einer bestimmten Internetressource verbundenen Ressourceninformationen eine taxonomische Kategorisierung der Internetressource einschließen.
  • Die Internetressourcen, die durch das Entitätsmodul 16 erhalten werden, können mit einer Mehrzahl der Entitäten so verbunden sein, dass jede Entität mit einer oder mehreren Internetressourcen verbunden sein kann. Eine Entität kann, in einigen Beispielen, ein Ereignis, ein Ort, eine Person, ein Geschäft, ein Film, ein Restaurant und dergleichen sein. Eine Entität kann weiterhin mit einer oder mehreren, einer Beschreibung, einem Standort und einer Zeit, verbunden sein. Die Beschreibung einer Entität kann in einigen Beispielen der Titel einer Veranstaltung, der Name eines Geschäfts und dergleichen sein. Der Standort kann ein geographischer Standort wie der Standort der Veranstaltung, der Standort eines Geschäfts und dergleichen sein. Die Zeit kann in einigen Beispielen die Zeit sein, zu der eine Veranstaltung stattfindet.
  • Eine Internetressource, die mit einer bestimmten Entität verbunden ist, kann die bestimmte Entität beschreiben. Wenn z. B. die bestimmte Entität eine Veranstaltung ist, kann eine Internetressource, die mit der bestimmten Entität verbunden ist, eine Webseite für die Veranstaltung, ein Soziale-Medien-Posting über die Veranstaltung, eine Webseite für den Schauplatz, an dem die Veranstaltung abgehalten werden soll, und dergleichen sein.
  • Das Entitätsmodul 16 kann zumindest von den von Entitätsmodul 16 beschafften Internetressourcen eine Mehrzahl von Entitäten extrahieren, und kann für jede Entität der Mehrzahl von Entitäten, die eine oder mehrere Internetressourcen bestimmen, die mit der bestimmten Entität verbunden sind. Das Entitätsmodul 16 kann für jede der Mehrzahl der Entitäten eine oder mehrere mit der Entität verbundene Eigenschaften extrahieren, von mindestens einer oder mehreren Internetressourcen, die mit den bestimmten Entität verbunden sind, und Ressourceninformationen, die mit der einen oder den mehreren Internetressourcen verbunden sind. Die eine oder die mehreren Eigenschaften, die mit der Entität verbunden sind, können Kontextinformationen enthalten, die die verbundene Entität beschreiben. In einigen Beispielen können Eigenschaften Textinformationen wie Wörter, Redewendungen, Sätze und dergleichen einschließen. Z. B. kann das Entitätsmodul 16 von einer Webseite, die mit einem Musikkonzert verbunden ist, Wörter und Redewendungen wie „Beethoven”, „Symphonie”, „Konzert”, „Orchester”, „Dirigent”, „Pianist”, „Konzertmeister”, „Geigenspieler” und dergleichen als Eigenschaften extrahieren, die beschreiben oder ansonsten mit dem Musikkonzert verbunden sind.
  • Die von Entitätsmodul 16 extrahierten Eigenschaften können in eine oder mehrere Eigenschaftskategorien kategorisiert werden, die den Arten der Informationen entsprechen, die die verbundene Entität beschreiben. Der Satz Eigenschaftskategorien kann eine oder mehrere, einen Titel, eine Umgebung, eine Anfrage, einen Anker und eine Taxonomie, einschließen. Eine oder mehrere Eigenschaften, die von einem Titel oder von einer Überschrift der einen oder mehreren Internetressourcen extrahiert werden (z. B. eine oder mehrere Webseiten), die mit der Entität verbunden sind, können als zu einer Eigenschaft gehörende Titelkategorie kategorisiert werden und können einen oder zwei Sätze enthalten, die die Entität beschreiben. Eine oder mehrere Eigenschaften, die von dem eine oder mehrere Internetressourcen umgebenden Text extrahiert werden, wie der Körper der einen oder mehreren Webseiten für die mit der Entität verbundene Eigenschaft, können als zu einer Umgebungseigenschaftskategorie gehörend kategorisiert werden.
  • Die Anfrageneigenschaftskategorie kann eine oder mehrere Eigenschaften einschließen, die von den an eine Internetsuchmaschine ausgegebenen Anfragen extrahiert werden, die zu einem Besuch auf der einen oder den mehreren mit der Entität verbundenen Internetressourcen führen, über Links zu der einen oder den mehreren Internetressourcen, die in den Suchergebnissen eingeschlossen sind. Z. B. kann das Entitätsmodul 16 eine Anfrage nach „klassischen Musikkonzerten” kategorisieren, die zu einem Besuch auf einer Webseite für ein Musikkonzert als Eigenschaften „klassisch”, „Musik” und „Konzerte” führen, die in die Anfrageneigenschaftskategorie gehören.
  • Die Ankereigenschaftskategorie kann eine oder mehrere Eigenschaften einschließen, die vom Ankertext Links zu der einen oder den mehreren Internetressourcen extrahieren, die mit der Entität von einer anderen Internetressource verbunden ist. Daher kann in einem Beispiel, wenn eine Webseite einen Anker „klassisches Konzert” enthält, der mit der Webseite für eine Entität verlinkt ist, die ein Musikkonzert ist, das Entitätsmodul 16 den Ankertext „klassisches Konzert” als die Eigenschaften „klassisch” und „Konzert” kategorisieren, die in die Ankereigenschaftskategorie für die mit dem Musikkonzert verbundene Entität gehören.
  • Die Taxonomieeigenschaftskategorie kann eine oder mehrere Eigenschaften einschließen, die von einer taxonomischen Kategorisierung der einen oder der mehreren mit der Entität verbundenen Internetressourcen extrahiert werden. Das Entitätsmodul 16 kann eine taxonomische Kategorisierung der Internetressourcen durchführen, um jede der einen oder der mehreren mit der Entität verbundenen Internetressourcen zu als mit einer oder mehreren Kategorien verbunden zu etikettieren, von den übergeordneten Kategorien wie Sport und Kunst bis zu untergeordneten Kategorien wie Golf und Rockmusik.
  • Das Entitätsmodul 16 kann für jede Entität einen Eigenschaftswert für jede mit einer bestimmten Entität verbundene Eigenschaft verbinden. Der mit einer Eigenschaft verbundene Eigenschaftswert, der mit einer Entität verbunden ist, kann der Anzahl Male entsprechen, die die gleiche Eigenschaft von der einen oder den mehreren Internetressourcen extrahiert wird, die mit der Entität verbunden ist, und von den Ressourceninformationen, die mit der einen oder den mehreren Internetressourcen verbunden sind. Z. B. kann die Eigenschaft „Konzert” für eine Entität, die eine Musikveranstaltung ist, viele Male erscheinen, wie in dem Titel der einen oder der mehreren Internetressourcen und im Hauptteil der Internetressourcen. Das Entitätsmodul 16 kann dieselben Veranstaltungen, die viele Male von der einen oder den mehreren mit der Entität verbundenen Internetressourcen extrahiert wurden, und die Ressourceninformationen, die mit der einen oder den mehreren Internetressourcen verbunden sind, beseitigen, und zwar durch Verbindung eines einzigen Beispiels der Ressource mit der Entität und durch Zuweisung eines Eigenschaftswertes an diese Entität, der der Anzahl Male entspricht, die die gleiche Eigenschaft von der einen oder den mehreren mit der Entität verbundenen Internetressourcen und von den Ressourceninformationen, die mit der einen oder den mehreren Internetressourcen verbunden sind, extrahiert wird.
  • Als Resultat des Extrahierens der mit Eigenschaften von den Internetressourcen und von mit den Internetressourcen verbundenen Ressourceninformationen kann das Entitätsmodul 16 eine oder mehrere Eigenschaften mit jeder einer Mehrzahl von Entitäten verbinden, wobei die eine oder die mehreren Eigenschaften Textinformationen sein können, die die entsprechende Entität beschreibt oder ansonsten Kontextinformationen für sie bereitstellt. Durch die Kategorisierung der Eigenschaften in Eigenschaftskategorien kann jede Entität mit einer oder mehreren der Eigenschaftskategorien verbunden sein und kann, für jede verbundene Kategorie. mit einer oder mehreren Eigenschaften in dieser Eigenschaftskategorie verbunden sein. In einigen Beispielen kann eine Entität mit Eigenschaften in jeder der fünf Eigenschaftskategorien verbunden sein, die vorstehend beschrieben werden. In anderen Beispielen kann eine Entität mit Eigenschaften in weniger als allen der fünf Eigenschaftskategorien verbunden sein, die vorstehend beschrieben werden. In zusätzlichen Beispielen kann eine Entität mit Eigenschaften in einer oder mehreren zusätzlichen Eigenschaftskategorien zu den vorstehend beschriebenen Eigenschaftskategorien verbunden sein.
  • Entitätsmodul 16 kann für jede Entität eine Eigenschaftsbearbeitung ausführen, um die Entitäten und die von den Internetressourcen extrahierten Eigenschaften zu bearbeiten. Z. B. können die Eigenschaften Textinformationen einschließen, so dass Entitätsmodul 16 ein Stemming (z. B. durch Anwendung eines Porter-Stemmers) der Eigenschaften durchführen kann und die zurückgeführten Eigenschaften in unigrame und bigrame Eigenschaften umwandeln kann.
  • Das Entitätsmodul 16 kann auch eine Beseitigung von Entitäten ausführen, wie die Beseitigung von Entitäten, die dieselben Namen oder Titel haben, und kann eine Zusammenführung von Eigenschaften ausführen, um mit doppelten Ereignissen verbundene Eigenschaften zusammenzuführen. Wie vorstehend besprochen, kann jede Eigenschaft, die mit den doppelten Veranstaltungen verbunden ist, einen verbundenen Eigenschaftswert haben, der der Häufigkeit entsprechen kann, mit der jene Veranstaltungen in den jeweiligen Eigenschaftskategorien erscheinen. Wenn z. B. das Wort „Jazz” eine Eigenschaft ist, die zahlreiche Male in der Umgebungseigenschaftskategorie für eine bestimmte Veranstaltung erscheint, kann der Eigenschaftswert für die Eigenschaft „Jazz” der Anzahl Male entsprechen, die das Wort „Jazz” im umgebenden Text erscheint, der in der einen oder den mehreren mit der Entität verbundenen Internetressourcen eingeschlossen ist. Um Eigenschaften von doppelten Veranstaltungen zusammenzuführen, kann Entitätsmodul 16 den Eigenschaftswert einer zusammenzuführenden Eigenschaft als die Summe der Eigenschaftswerte derselben Eigenschaften beider Entitäten bestimmen, wenn jene Eigenschaften unter die Titel-, Umgebung-, Anfragen- und Ankereigenschaftskategorien fallen. Das Entitätsmodul 16 kann den Eigenschaftswert einer zusammenzuführenden Eigenschaft als das Maximum der Eigenschaftswerte derselben Eigenschaften von beiden Entitäten für Entitäten bestimmen, die unter die Taxonomieeigenschaftskategorie fallen.
  • Das Entitätsmodul 16 kann auch eine Stoppwörterbeseitigung und eine Neugewichtung der Eigenschaften ausführen, um „Eigenschaftsrauschen” bei dem Informationsabrufen als Teil einer Eigenschaftsbearbeitung zu reduzieren. Die Stoppwörterbeseitigung kann sowohl eine globale als auch eine lokale Stoppwörterbeseitigung einschließen. Um eine globale Stoppwörterbeseitigung durchzuführen, kann das Entitätsmodul 16 die Eigenschaftshäufigkeit von jeder der extrahierten Eigenschaften bestimmen, bei der es sich um die Anzahl Entitäten handeln kann, die mit der bestimmten Eigenschaft verbunden sind. Das Entitätsmodul 16 kann bestimmen, dass Eigenschaften, die eine verhältnismäßig hohe Eigenschaftshäufigkeit haben (z. B. Eigenschaften, die mit mehr als einer Schwellenanzahl von Entitäten, Eigenschaften in den oberen zehn Prozent der verbundenen Eigenschaftshäufigkeiten verbunden sind und dergleichen), globale Stoppwörter sein können, und kann jene Eigenschaften von den Entitäten entfernen oder diese Eigenschaften ansonsten von den Entitäten trennen.
  • Das Entitätsmodul 16 kann auch eine lokale Stoppwörterbeseitigung ausführen, um lokale Stoppwörter zu beseitigen. Lokale Stoppwörter können häufige Eigenschaften für Entitäten einer bestimmten Region sein, die bleiben, nachdem eine globale Stoppwörterbeseitigung durchgeführt wurde. Wie vorstehend besprochen, kann jede Entität einen verbundenen geographischen Standort oder eine geographische Region haben. Wenn man sich z. B. auf Entitäten eines spezifischen Standortes konzentriert, wie New York, können viele Entitäten aus New York den Ausdruck „New York” enthalten, die möglicherweise nicht während der Stoppwörterbeseitigung entfernt werden kann. Das Entitätsmodul 16 kann für einen spezifizierten geographischen Standort (z. B. New York) eine lokale Stoppwörterbeseitigung durchführen, um Wörter oder Ausdrücke zu entfernen, die häufig als Eigenschaften für Entitäten in diesem bestimmten geographischen Standort erscheinen können. Daher kann das Entitätsmodul 16 eine lokale Stoppwörterbeseitigung für den verbundenen geographischen Standort einer Entität durchführen, indem es die Eigenschaftshäufigkeit innerhalb einer spezifischen Gegend bestimmt, die mit dem geographischen Standort verbunden ist, und die Stoppwörter entfernt, die mit dem geographischen Standort verbunden sind.
  • Das Entitätsmodul 16 kann weiterhin für jede Entität eine Eigenschaftsneugewichtung von einer oder mehreren Eigenschaften durchführen, die mit der Entität verbunden sind, indem eine Eigenschaftsgewichtung für jede mit der Entität verbundene Eigenschaft bestimmt wird, und zwar zumindest teilweise auf der Grundlage der Eigenschaftshäufigkeit jeder Eigenschaft der betreffenden Entität. Mit anderen Worten kann das Entitätsmodul 16 eine mit einer bestimmten Entität verbundene bestimmte Eigenschaft neu gewichten, und zwar zumindest teilweise auf der Grundlage des Eigenschaftswertes der bestimmten Eigenschaft, soweit er die bestimmte Entität betrifft. Wenn eine Eigenschaft mit zahlreichen Entitäten verbunden ist, kann das Entitätsmodul 16 eine eigene Eigenschaftsgewichtung für jedes Eigenschafts-Entitäts-Paar bestimmen, so dass solch eine Eigenschaft mit zahlreichen Eigenschaftsgewichtungen verbunden sein kann, eine für jede Entität, mit der sie verbunden ist.
  • Die Ausführung einer Eigenschaftsneugewichtung kann für jede Entität eine Verkleinerung häufiger Eigenschaften einschließen, die einen hohen Eigenschaftswert für die Entität haben, und eine Vergrößerung von Eigenschaften, die einen niedrigen Eigenschaftswert für die Entität haben, aufgrund der möglicherweise schiefen Verteilung der Eigenschaftshäufigkeit selbst noch nach der Ausführung der Stoppwörterbeseitigung. Für die Häufigkeit jeder Eigenschaft einer Entität kann Entitätsmodul 16 das log-normalisierte TF-IDF-Maß (Vorkommenshäufigkeit – inverse Dokumenthäufigkeit) durch eine logarithmische Skalierung der Häufigkeit und Multiplikation der logarithmisch skalierten Häufigkeit mit ihrer inversen Dokumenthäufigkeit anwenden, um eine Gewichtung für die bestimmte Eigenschaft j in Entität i folgendermaßen zu bestimmen:,
    Figure DE202016008357U1_0002
    wobei die Gewichtung die Eigenschaftsgewichtung der Eigenschaft j sein kann, die mit Entität i verbunden ist, tfij kann die Häufigkeit der Eigenschaft j in der Entität i sein, wie der Eigenschaftswert der Eigenschaft für die Entität, N kann die Erfassungsgröße (d. h. die Gesamtanzahl Entitäten) sein, und dfj kann die Anzahl Entitäten sein, in denen die Eigenschaft j erscheint. Auf diese Weise kann Entitätsmodul 16 für jede Entität eine Gewichtung für jede Eigenschaft bestimmen, die mit einer bestimmten Entität verbunden ist.
  • Das Entitätsmodul 16 kann Hinweise auf eine Verbindung zwischen Entität, Eigenschaften und Eigenschaftskategorien für jede Entität speichern, die aus den Internetressourcen in den Eigenschafts-Entitäts-Datenspeicher 52A extrahiert wurde, sowie die Eigenschaftsgewichtungen für jede mit den Entitäten verbundene Eigenschaft. Z. B. kann das Entitätsmodul 16 für jede Entität als strukturierte Daten zumindest die eine oder die mehreren Eigenschaften speichern, die mit den strukturierten Daten verbunden sind, die Eigenschaftsgewichtung von jeder der einen oder der mehreren Eigenschaften und die eine oder die mehreren Eigenschaftskategorien, unter die die eine oder die mehreren Eigenschaften fallen. Das Entitätsmodul 16 kann weiterhin alle zusätzlichen mit den Entitäten verbundenen Informationen im Eigenschaft-Entitäts-Datenspeicher 52A speichern, wie den mit jeder der Entitäten verbundenen geographischen Standort oder jegliche anderen geeigneten Informationen.
  • Das Rankingmodul 18 kann für eine bestimmte Entität ein Ranking von einer oder mehreren mit der bestimmten Entität verbundenen Entitäten bestimmen. Das Ranking einer oder mehrerer mit der bestimmten Entität verbundenen Entitäten kann ein Hinweis auf die eine oder die mehreren Entitäten sein, die das höchste Ausmaß an Verbundenheit mit der bestimmten Entität aus einem Satz Entitäten haben, die im Eigenschaft-Entität-Datenspeicher 52A gespeichert werden. Wenn jede Entität in einem Satz Entitäten jeweils eine verbundene Ähnlichkeitspunktzahl hat, die auf ein Ausmaß an Verbundenheit zwischen der jeweiligen Entität und der bestimmten Entität hinweist, können die eine oder die mehreren Entitäten, die mit der bestimmten Entität verbunden sind, die eine oder die mehreren Entitäten sein, die die höchsten Ähnlichkeitspunktzahlen aus dem Satz der Entitäten in Bezug auf die bestimmte Entität haben. Mit anderen Worten können bei einem zufälligen Benutzer, der ein Interesse an einer bestimmten Entität hat, die eine oder die mehreren Entitäten, die mit der bestimmten Entität verbunden sind, die eine oder die mehreren Entitäten sein, an denen der gleiche zufällige Benutzer aus einem Satz Entitäten, die im Eigenschaft-Entität-Datenspeicher 52A gespeichert werden, am interessiertesten wäre.
  • In einigen Beispielen kann das Rankingmodul 18 ein Ausmaß an Verbundenheit (z. B. eine Ähnlichkeitspunktzahl) zwischen jeder der Entitäten bestimmen, die im Eigenschaft-Entität-Datenspeicher 52A gespeichert werden. So kann in diesem Beispiel das Rankingmodul 18 für jede Entität, die im Eigenschaft-Entität-Datenspeicher 52A gespeichert wird, ein Ausmaß an Verbundenheit zwischen der bestimmten Entität und jeder im Eigenschaft-Entität-Datenspeicher 52A gespeicherten Entität bestimmen.
  • In anderen Beispielen kann Rankingmodul 18, weil ein Benutzer, der an einer bestimmten Entität interessiert ist, auch nur an anderen Entitäten interessiert sein kann, die in dem gleichen geographischen Gebiet liegen, anstatt das Ausmaß an Verbundenheit zwischen jeder der Entitäten zu bestimmen, die im Eigenschaft-Entität-Datenspeicher 52A gespeichert werden, die Verbundenheit nur zwischen den Entitäten bestimmen, die im Eigenschaft-Entität-Datenspeicher 52A gespeichert werden und die in derselben geographischen Region oder demselben Standort liegen. Rankingmodul 18 kann bestimmen, ob Entitäten in derselben geographischen Region liegen, zumindest teilweise auf der Grundlage des mit den Entitäten verbundenen geographischen Standortes. Auf diese Weise kann das Rankingmodul 18 in diesem Beispiel ein Ausmaß an Verbundenheit (z. B. eine Ähnlichkeitspunktzahl) zwischen jeder einer Untergruppe (z. B. weniger als alle) der Entitäten bestimmen, die im Eigenschaft-Entität-Datenspeicher 52A gespeichert werden
  • In einem Beispiel kann Rankingmodul 18 eine Kombiniertechnik ausführen, um ein Ranking einer oder mehrerer Entitäten zu bestimmen, die mit jeder eines Satzes Entitäten verbunden sind. Rankingmodul 18 kann die Kombiniertechnik ausführen, um ein Ausmaß an Verbundenheit zwischen jeder Entität eines Satzes Entitäten zu bestimmen, die im Eigenschaft-Entität-Datenspeicher 52A gespeichert werden. Z. B. kann Rankingmodul 18 ein Ausmaß an Verbundenheit zwischen jeder Entität eines Satzes Entitäten bestimmen, die mit derselben geographischen Region oder dem geographischen Standort verbunden sind, die im Eigenschaft-Entität-Datenspeicher 52A gespeichert werden. Für eine bestimmte Entität, die als eine Quellenentität bezeichnet werden kann, kann das Rankingmodul 18 das Ausmaß an Verbundenheit zwischen der Quellenentität und einer anderen Entität bestimmen, die als eine Zielentität bezeichnet werden kann, indem das Ausmaß der Ähnlichkeit der Eigenschaften des gleichen Satzes von Eigenschaftskategorien zwischen der Quellenentität und der Zielentität bestimmt wird
  • Angenommen, dass eine Liste der k Eigenschaftskategorien, die mit der Quellenentität und der Zielentität verbunden sind, F j / S ein Satz Eigenschaften sein kann, die zu Eigenschaftskategorie j für die Quellenentität S gehören, und F j / T ein Satz Eigenschaften sein kann, die aus der Eigenschaftskategorie j für Zielentität T extrahiert werden. Für eine bestimmte Eigenschaftskategorie j, kann Rankingmodul 18 eine Ähnlichkeitspunktzahl zwischen der Quellenentität S und der Zielentität T als sc(F j / S, F j / T) , bestimmen, wobei sc() eine Ähnlichkeitspunktzahlfunktion ist und wobei die Ähnlichkeitspunktzahl dem Ausmaß der Ähnlichkeit zwischen der Quellenentität und der Zielentität für diese Eigenschaftskategorie entspricht.
  • Spezifischer gesagt, um die Ähnlichkeitspunktzahl zwischen der Quellenentität S und der Zielentität T für eine bestimmte Eigenschaftskategorie zu bestimmen, kann Rankingmodul 18 jede Entität als eine Verteilung von Eigenschaften behandeln. Zu diesem Zweck kann Rankingmodul 18 die Jeffreys-Kullback-Leibler-Divergenz verwenden, die eine symmetrische Version der Kullback-Leibler-Divergenz sein kann, um ein Maß des Unterschiedes zwischen der Verteilung von Eigenschaften der Quellen- und der Zielentitäten festzustellen. Bei einem gegebenen Satz Eigenschaften F j / S und F j / T kann Rankingmodul 18 die Ähnlichkeit zwischen der Quellenentität S und der Zielentität T für Eigenschaftskategorie j als sc(F j / S, F j / T) = exp[– 1 / 2(D(F j / S(||F j / T) + D(F j / T||F j / S)] definieren, wobei D(•||•) die Kullback-Leibler-Divergenz ist. Auf diese Weise kann das Rankingmodul 18 die Kombiniertechnik ausführen, um eine Ähnlichkeitspunktzahl für jede Eigenschaftskategorie zwischen einer Quellenentität und einer Zielentität zu bestimmen.
  • Das Rankingmodul 18 kann eine Kombiniertechnik ausführen, um eine Ähnlichkeitspunktzahl zwischen der Quellenentität S und der Zielentität T für jede der k Eigenschaftskategorien als sc(F 1 / S, F 1 / T), ... sc(F k / S, F k / T) festzustellen Auf der Grundlage der Ähnlichkeitspunktzahl für jede Eigenschaftskategorie zwischen der Quellenentität und der Zielentität kann das Rankingmodul 18 eine Gesamt-Ähnlichkeitspunktzahl zwischen der Quellenveranstaltung und der Zielveranstaltung als eine Anhäufung der Ähnlichkeitspunktzahlen für jede Eigenschaftskategorie zwischen einer Quellenentität und einer Zielentität bestimmen. Spezifisch kann das Rankingmodul 18 auf der Grundlage der Ähnlichkeitspunktzahl für jede der Eigenschaftskategorien, eine Gesamt-Ähnlichkeitspunktzahl zwischen der Quellentität S und der Zielentität T als sc(S, T) = ϕ(sc(F 1 / S, F 1 / T), ... sc(F k / S, F k / T)) , bestimmen, wobei ϕ eine Anhäufungsfunktion sein kann.
  • Die Ähnlichkeitspunktzahl für die Quellentität S und die Zielentität T bei Eigenschaftskategorie j kann als rj bezeichnet werden. Das Rankingmodul 18 kann die Ähnlichkeitspunktzahlen für jede der Eigenschaftskategorien der Quellenentität S und der Zielentität T zu einer einzelnen Ranking-Liste durch eine gegenseitige Rangfusion kombinieren. Angenommen, dass die Zielentität T mit einer Ähnlichkeitspunktzahl von r j / S,T in Bezug auf die Quellenentität S verbunden ist, kann die Gesamt-Ähnlichkeitspunktzahl zwischen der Quellenentität S und der Zielentität T von sc(S, T) als
    Figure DE202016008357U1_0003
    ausgedrückt werden, wobei j jede der Eigenschaftskategorien sein kann und wobei K eine große zuvor festgelegte Konstante sein kann, die die Auswirkung der hohen Rankings durch Ausreißer-Rankings verringert. In einem Beispiel kann K 60 sein.
  • Folglich kann Rankingmodul 18 durch Ausführung der Kombiniertechnik ein Ausmaß an Verbundenheit zwischen zwei Entitäten bestimmen, das zumindest teilweise auf einer Anhäufung der Ähnlichkeit zwischen den Eigenschaften der zwei Entitäten basiert. Wie vorstehend besprochen, kann Rankingmodul 18 ein Ausmaß an Verbundenheit zwischen jeder eines Satzes Entitäten aus den Entitäten bestimmen, die im Eigenschaft-Entität-Datenspeicher 52A gespeichert werden, und kann im Ranking-Datenspeicher 52C einen Hinweis auf das Ausmaß an Verbundenheit zwischen jeder eines Satzes Entitäten speichern, das durch Rankingmodul 18 bestimmt wird. Z. B. kann Ranking-Datenspeicher 52C Hinweise auf Paare Entitäten zusammen mit einem Hinweis auf das verbundene Ausmaß an Verbundenheit, wie eine Ähnlichkeitspunktzahl, in Ranking-Datenspeicher 52C speichern.
  • In anderen Beispielen kann das Rankingmodul 18 für jede eines Satzes Entitäten auf der Grundlage eines Ausmaßes an Verbundenheit jeder eines Satzes Entitäten aus den Entitäten, die im Eigenschaft-Entität-Datenspeicher 52A gespeichert sind, ein Ranking der einen oder der mehreren Entitäten bestimmen, die mit der bestimmten Entität verbunden sind, wie ein Ranking einer oder mehrerer Entitäten mit dem höchsten Ausmaß an Verbundenheit mit der bestimmten Entität aus dem Satz Entitäten, und kann solche Hinweise auf das Ranking der einen oder der mehreren Entitäten, die mit jeder Entität im Satz Entitäten verbunden sind, im Ranking-Datenspeicher 52C speichern.
  • Auf diese Weise kann ISS 14 einen Hinweis auf eine Entität empfangen, z. B. von Computergerät 2, kann anhand der Daten, die im Ranking-Datenspeicher 52C gespeichert sind, ein Ranking einer oder mehrerer mit der bestimmten Entität verbundenen Entitäten bestimmen, die mit dem bestimmten Wesen zusammenhängen, und einen Hinweis auf das Ranking der einer oder der mehreren Entitäten, die mit der bestimmten Entität verbunden sind, an Computergerät 2 übermitteln. In einem Beispiel kann der Hinweis auf eine Entität, den ISS 14 von dem Computergerät 2 empfängt, einen mit der Entität verbundenen Namen anzeigen, wie „Miles Davis” oder „Beethovens 5 Symphonie.” Das Rankingmodul 18 kann den mit der Entität verbundenen Namen verwenden, um den Ranking-Datenspeicher 52C zu erschließen, um die mit dem Namen verbundene Entität zu finden, und kann im Ranking-Datenspeicher 52C eine Position bestimmen, an der das Ranking der Hinweise auf die eine oder die mehreren mit der Entität verbundenen Entitäten gespeichert wird. Das Rankingmodul 18 kann den Hinweis auf das Ranking einer oder mehrerer mit der bestimmten Entität verbundenen Entitäten abrufen. ISS 14 kann den abgerufenen Hinweis auf das Ranking einer oder mehrerer mit der bestimmten Entität verbundenen Entitäten in jegliches geeignete strukturierte Datenformat für die Übertragung des Hinweises auf das Ranking einer oder mehrerer Entitäten, wie JSON oder XML formatieren, und kann den Hinweis auf eine oder mehrere Entitäten an Computergerät 2 ausgeben z. B. über Netzwerk 12 oder Internet 20.
  • In anderen Beispielen kann ISS 14, anstatt das Ranking einer oder mehrerer mit der bestimmten Entität verbundenen Entität aus dem Ranking-Datenspeicher 52C abzurufen, als Reaktion auf das Empfangen eines Hinweises auf eine Entität, z. B. von Computergerät 2, ein Ranking einer oder mehrerer mit der bestimmten Entität verbundenen Entitäten unter Verwendung der hier beschriebenen Kombiniertechnik spontan bestimmen und einen Hinweis auf das Ranking einer oder mehrerer Entitäten an Computergerät 2 ausgeben, z. B. über Netzwerk 12 oder Internet 20 mit den hier beschriebenen Techniken.
  • In einem anderen Beispiel kann ISS 14 einen Hinweis auf eine Anfrage z. B. von Computergerät 2 empfangen. Eine Anfrage kann aus Textdaten, wie einem Wort, einem Ausdruck und dergleichen bestehen, die das Computergerät 2 als Eingabe empfangen kann. Z. B. kann eine Anfrage eine Suchfrage nach einer oder mehreren mit der Anfrage verbundenen Entitäten sein. Als Reaktion auf das Empfangen des Hinweises auf die Anfrage kann Computergerät 2 über das Rankingmodul 18 ein Ranking einer oder mehrerer mit der Anfrage verbundenen Entitäten bestimmen und kann an Computergerät 2 einen Hinweis auf das Ranking einer oder mehrerer mit der Anfrage verbundenen Entitäten ausgeben.
  • Spezifisch kann das Rankingmodul 18 als Reaktion auf das Empfangen eines Hinweises auf eine Anfrage wie „Marathon” durch Computergerät 2, zumindest teilweise auf der Grundlage der Ausführung der hier beschriebenen Kombiniertechnik ein Ranking einer oder mehrerer mit der Suchanfrage verbundenen Entitäten bestimmen. Rankingmodul 18 kann einen Satz mit einer oder mehreren Entitäten bestimmen, die jeweils einen Entitätsnamen oder Titel haben, der der ausgegebenen Anfrage als Startwertsatz S entspricht. Das Rankingmodul 18 kann diese Startwertentitäten benutzen, um eine oder mehrere mit jeder Entität in dem Startwertsatz S verbundene Entitäten zu bestimmen, einschließlich der Startwertentität, als einen Satz Kandidatenentitäten Cs. Das Rankingmodul 18 kann die Kandidatenentitäten in dem Satz Kandidatenentitäten Cs nach ihren jeweiligen Ähnlichkeitspunktzahlen einordnen. Wenn eine Entität in dem Satz Kandidatenentitäten zahlreiche Male von verschiedenen Startwertentitäten abgerufen wird, weil das Rankingmodul 18 bestimmt, dass die Entität mit einer der Entitäten in dem Startwertsatz S verbunden ist, kann das Rankingmodul 18 seine Ähnlichkeitspunktzahlen addieren, um eine einzige Ähnlichkeitspunktzahl für diese Entität zu erhalten. Formeller ausgedrückt, kann die Ähnlichkeit der Zielentität T mit Anfrage Q so definiert werden, dass
    Figure DE202016008357U1_0004
    ist, wobei sc(S, T) durch Rankingmodul 18 gemäß der hier offenbarten Kombiniertechnik errechnet werden kann. Das Rankingmodul 18 kann anhand der mit den Entitäten in Kandidatenentitäten Cs verbundenen Ähnlichkeitspunktzahlen ein Ranking einer oder mehrerer mit der Anfrage verbundenen Entitäten bestimmen und kann einen Hinweis auf das Ranking einer oder mehrerer Entitäten an Computergerät 2 ausgeben, z. B. über das Netzwerk 12 oder Internet 20, unter Verwendung der hier beschriebenen Techniken.
  • In einem anderen Beispiel kann Rankingmodul 18 eine Expandertechnik ausführen, um ein Ranking einer oder mehrerer Entitäten zu bestimmen, die mit jeder eines Satzes Entitäten verbunden sind. Das Rankingmodul 18 kann die Expandertechnik ausführen, um ein Ausmaß an Verbundenheit zwischen jeder Entität eines Satzes Entitäten zu bestimmen, die im Eigenschaft-Entität-Datenspeicher 52A gespeichert werden. Spezifisch kann Rankingmodul 18 die Expandertechnik ausführen, um ein Ausmaß an Verbundenheit zwischen einem vorgegebenen Paar Entitäten zumindest teilweise auf der Grundlage der Bestimmung der semantischen Verbundenheit zwischen den Eigenschaften der beiden Entitäten bestimmen. Zum Beispiel kann Rankingmodul 18 bestimmen, dass zwei Entitäten einer Drittentität sehr ähnlich sind, selbst wenn die beiden Entitäten anhand der Ausführung der vorstehend beschriebenen Kombiniertechnik ein relativ geringes Ausmaß an Ähnlichkeit haben.
  • Zu diesem Zweck kann das Rankingmodul 18 einen zweiteilige Eigenschaft-Entität-Graphen (ausführlicher in Bezug auf 3A3C besprochen) erstellen, in dem Eigenschaften und Entitäten als Knoten dargestellt werden. Spezifisch kann der Graphen eine Mehrzahl von Knoten beinhalten, einschließlich Eigenschaftsknoten, die eine Mehrzahl an Eigenschaften, Entitätsknoten, die eine Mehrzahl an Entitäten darstellen. Jeder der Entitätsknoten in dem Graphen kann mit einem oder mehreren der Eigenschaftsknoten über eine oder mehrere Kanten, die jeweils eine Kantengewichtung haben, verbunden sein, wobei ein Entitätsknoten mit einem Eigenschaftsknoten verbunden sein kann, wenn die von dem Entitätsknoten dargestellte Entität mit der von dem Eigenschaftsknoten dargestellten Eigenschaft verbunden ist.
  • Das Rankingmodul 18 kann einen Hinweis auf den zweiteilige Eigenschaft-Entität-Graphen, die von dem Rankingmodul 18 erstellt wird, als Daten im Graphdatenspeicher 52B speichern, der eine oder mehrere Datenstrukturen, wie Datenfelder, Datenbankaufzeichnungen, Register und dergleichen einschließen kann. Zum Beispiel kann das Rankingmodul 18 Daten, die einen Hinweis auf die Mehrzahl der Eigenschaftsknoten, die Mehrzahl der Entitätsknoten, die eine oder die mehreren Kanten, die jeden der Entitätsknoten mit einem oder mehreren Eigenschaftsknoten verbinden, die Kantengewichtungen der einen oder mehreren Kanten und dergleichen im Graphdatenspeicher 52B speichern. In einem Beispiel kann das Rankingmodul 18 für jeden Entitätsknoten des zweiteiligen Eigenschaft-Entität-Graphen Daten im Graphdatenspeicher 52B speichern, die auf die von dem Entitätsknoten dargestellte Entität hinweisen, und Daten, die auf die eine oder mehrere Eigenschaften hinweisen, die mit dem Entitätsknoten verbunden ist, und/oder die Werte der Kantengewichtungen der einen oder mehreren Kanten, die den Entitätsknoten mit jedem des einen oder der mehreren Eigenschaftsknoten verbinden. Auf ähnliche Weise kann das Rankingmodul 18 für jeden Eigenschaftsknoten des zweiteiligen Eigenschaft-Entität-Graphen im Graphdatenspeicher 52B Daten speichern, die auf die von dem Eigenschaftsknoten dargestellte Eigenschaft hinweisen.
  • In dieser gesamten Offenbarung können die Begriffe zweiteiliger Eigenschaft-Entität-Graph oder Graph ein Synonym für die in dem Graphdatenspeicher 52B gespeicherten Daten sein, die auf den zweiteilige Eigenschaft-Entität-Graphen hinweisen. Mit anderen Worten beschreibt diese Offenbarung zwar Tätigkeiten, die von den Modulen 16 und 18 in dem zweiteiligen Eigenschaft-Entität-Graphen ausgeführt werden, aber es sollte verstanden werden, dass die Module 16 und 18 tatsächlich mit Daten arbeiten, die im Graphdatenspeicher 52B gespeichert sind und die auf den zweiteiligen Eigenschaft-Entität-Graphen hinweisen, wie die Eigenschaftsknoten, Entitätsknoten, Kanten, Kantengewichtungen, Verbindungen zwischen jedem der Entitätsknoten mit einem oder mehreren Eigenschaftsknoten über Kanten und dergleichen, die den zweiteilige Eigenschaft-Entität-Graphen ausmachen.
  • Jede Kante, die einen Entitätsknoten mit einem Eigenschaftsknoten verbindet, kann eine Kantengewichtung haben, die der Eigenschaftsgewichtung für die durch den Eigenschaftsknoten dargestellte Eigenschaft entspricht, in Bezug auf die Entität, die durch den Entitätsknoten dargestellt wird, wie vorstehend in Bezug auf die Neugewichtung der Eigenschaften besprochen. In einigen Beispielen können Entitätsknoten in dem Graphen nicht mit anderen Entitätsknoten verbunden sein, und Eigenschaftsknoten können nicht mit anderen Eigenschaftsknoten verbunden sein. Wenn eine Eigenschaft für eine Entität in zahlreichen Eigenschaftskategorien erscheint, kann das Rankingmodul 18 diese Eigenschaften zu einer einzigen Eigenschaft zusammenfügen, die durch einen einzigen Eigenschaftsknoten dargestellt wird, der mit dem Entitätsknoten verbunden ist, welche die Entität darstellt. Zum Beispiel kann das Rankingmodul 18 die Eigenschaft „Film”, die sowohl in der Anfragen-Eigenschaftskategorie als auch in der Titel-Eigenschaftskategorie für eine bestimmte Entität kategorisiert wird, zu einer einzigen Eigenschaft zusammenfügen, die durch einen einzigen Eigenschaftsknoten dargestellt wird, und kann die Eigenschaftsgewichtungen der Eigenschaft in den beiden Eigenschaften zu einer einzigen Kantengewichtung für die Kante summieren, die den Entitätsknoten mit dem Eigenschaftsknoten verbindet, wodurch die Eigenschaftsdimension verringert und Probleme mit der Eigenschaftsseltenheit gemildert werden.
  • Konzeptuell gesprochen, kann Rankingmodul 18 die Verbundenheit eines Paares Entitäten, wie zwischen der Quellentität S und der Zielentität T als
    Figure DE202016008357U1_0005
    feststellen, wobei
    Figure DE202016008357U1_0006
    die Nachbarschaft der Entitätsknoten ist, die mit den Entitäten S und T innerhalb des Graphen verbunden sind, und wobei
    Figure DE202016008357U1_0007
    die gesamte Graphstruktur modellieren kann, um verbundene Entitätspaare zu finden, die über zahlreiche Sprünge in dem Graphen (z. B. nicht nur in der direkten Nachbarschaft) verbunden sind.
  • Mit anderen Worten können zwei Entitätsknoten in einer direkten Nachbarschaft zueinander in dem Graphen liegen, weil sie beide an den gleichen Eigenschaftsknoten anschließen. Jedoch kann das Rankingmodul 18 dennoch bestimmen, dass zwei Entitäten verbunden sind, selbst wenn ihre jeweiligen Entitätsknoten nicht in unmittelbarer Nachbarschaft zueinander liegen, und zwar basierend auf der Ähnlichkeit zwischen den Eigenschaften der Quellen- und der Zielentität zusammen mit den Eigenschaften einer anderen Entität, die durch einen Entitätsknoten dargestellt wird, der in der Nachbarschaft der Entitätsknoten liegt, welche die Quellen- und Zielentitäten darstellen. So kann Rankingmodul 18 für eine bestimmte Quellenentität bestimmen, dass sie mit einer Zielentität verbunden ist, selbst wenn die Entitätsknoten, die die Quellenentität und die Zielentität darstellen, nicht mit dem gleichen Eigenschaftsknoten verbunden sind, solange die Entitätsknoten, die die Quellenentität und die Zielentität darstellen, mit einer anderen Entität zusammenhängen, die durch einen Entitätsknoten dargestellt wird, der in der Nachbarschaft der Entitätsknoten liegt, welche die Quellen- und Zielentitäten darstellen.
  • Nach der Erstellung des zweiteiligen Eigenschaft-Entität-Graphen kann das Rankingmodul 18 eine Etikettenverbreitung ausführen, um Etiketten in dem zweiteiligen Eigenschaft-Entität-Graphen zu verbreiten, um eine Verteilung der Etiketten mit jeder der Mehrzahl Knoten zu verbinden, damit jeder Knoten in dem Graphen mit einer Verteilung der Etiketten verbunden werden kann. So können jeder Eigenschaftsknoten und jeder Entitätsknoten in dem Graphen mit einer Verteilung der Etiketten infolge der Verbreitung der Etiketten verbunden werden. Wie vorstehend besprochen, kann das Ausführen der Etikettenverbreitung in dem zweiteiligen Eigenschaft-Entität-Graphen einschließen, dass das Rankingmodul 18, das auf dem Graphdatenspeicher 52B läuft, Daten speichert, die auf den zweiteilige Eigenschaft-Entität-Graphen hinweisen, um die Etikettenverbreitung auszuführen.
  • Jedes der Etiketten, die das Rankingmodul 18 in den Graphen verbreitet, kann auf eine der Entitäten hinweisen, die als Knoten in dem Graphen dargestellt werden, so dass eine Verteilung der Etiketten, die mit einem Knoten in dem Graphen verbunden sind, eine Verteilung einer oder mehrerer Entitäten sein kann, die mit der durch den bestimmten Knoten dargestellten Entität oder Eigenschaft verbunden sind. Außerdem kann die Verteilung der Etiketten, die mit einem Knoten in dem Graphen verbunden sind, auf das Ausmaß der Verbundenheit jeder der einen oder mehreren Entitäten in der Verteilung der einen oder mehreren Entitäten auf die Entität oder Eigenschaft hinweisen, die von dem bestimmten Knoten dargestellt wird, so dass die Verteilung der Etiketten, die mit dem Knoten in dem Graphen verbunden sind, ein Hinweis auf ein Ranking der Verbundenheit der einen oder mehreren Entitäten sein kann, die mit der Entität oder Eigenschaft verbunden sind, die von dem bestimmten Entitätsknoten oder Eigenschaftsknoten dargestellt wird.
  • Um die Etikettenverbreitung in dem zweiteiligen Eigenschaft-Entität-Graphen einzuleiten, kann Rankingmodul 18 eine Etikette mit jedem Entitätsknoten verbinden, indem es jeden der Mehrzahl der Entitätsknoten mit einem einer Mehrzahl an Etiketten versieht. Solche Etiketten, die ursprünglich mit den Entitätsknoten verbunden sind, können als Startwertetiketten bezeichnet werden. Das mit einem bestimmten Entitätsknoten verbundene Etikett kann die von dem Entitätsknoten dargestellte Entität identifizieren, so dass jedes der von Rankingmodul 18 vergebenen Etiketten einen entsprechenden der Entitätsknoten identifizieren kann. Jedes Etikett kann ein Identitätsetikett sein, so dass eine Entität ein relevantes Etikett für sich selbst sein kann. So kann ein Entitätsknoten, der Entität A darstellt, mit einem Etikett von „Entität A” verbunden sein, was der Titel der verbundenen Entität sein kann.
  • Das Rankingmodul 18 kann eine Etikettenverbreitung ausführen, um die mit den Entitätsknoten in dem Graphen verbundenen Etiketten so zu verbreiten, dass jeder Entitätsknoten mit einer Verteilung von einem oder mehreren Etiketten verbunden werden kann. Um eine Etikettenverbreitung auszuführen, kann das Rankingmodul 18 die Verteilung der Etiketten bestimmen, die mit jedem Knoten dem Graphen als optimale Lösung verbunden sind, die eine Zielfunktion minimiert.
  • In Anbetracht des zweiteiligen Eigenschaft-Entität-Graphen kann die Zielfunktion Folgendes für alle Knoten in dem Graphen gleichzeitig minimieren: Den quadrierten Verlust zwischen einer echten und einer ausgelösten Etikettenverteilung, einen Regularisationsterm, der nebeneinander liegende Eigenschaftsknoten bestraft, die eine unterschiedliche Etikettenverteilung von diesem Entitätsknoten haben, und einen Regularisationsterm, der die ausgelöste Etikettenverteilung in Richtung der vorherigen Verteilung glättet, bei der es sich normalerweise um eine gleichmäßige Verteilung in der Praxis handelt.
  • Spezifischer gesagt, kann das Rankingmodul 18 für jeden Entitätsknoten i mit seinen Eigenschaftsnachbarn,
    Figure DE202016008357U1_0008
    wobei die Eigenschaftsnachbarn eines Entitätsknoten die Eigenschaftsknoten sein können, die über Kanten direkt mit dem Entitätsknoten verbunden sind, die Verteilung der mit dem Entitätsknoten verbundenen Etiketten als die optimale Lösung für die Minimierung der Zielfunktion bestimmen
    Figure DE202016008357U1_0009
    wobei Y ^i die erlernte Etikettenverteilung für Entitätsknoten i ist, Yi die echte Etikettenverteilung, μnp die zuvor festgelegte Strafe für benachbarte Knoten mit abweichenden Etikettenverteilungen, Y ^j die erlernte Etikettenverteilung für Eigenschaftsnachbar j, Wij ist die Gewichtung der Eigenschaft j in Entität i, μpp die Strafe für die Etikettenverteilung ist, die von der vorherigen gleichmäßigen Verteilung U abweicht. In einigen Beispielen kann μnp 0,5 sein und μpp. kann 0,001 sein.
  • Folglich kann in diesem Beispiel ||Y ^i – Yi||2 der quadrierte Verlust zwischen einer echten Verteilung der Etiketten sein, die mit dem Entitätsknoten verbunden sind, und einer erlernten Verteilung der Etiketten, die mit dem Entitätsknoten verbunden sind, wobei Yi die echte Verteilung der Etiketten ist, die mit dem Entitätsknoten i verbunden sind, und Y ^i die erlernte Verteilung der Etiketten für Entitätsknoten i ist. Die echte Verteilung der mit dem Entitätsknoten i verbundenen Etiketten kann das Etikett sein, das Rankingmodul 18 als Startwert für Entitätsknoten i setzt, während die erlernte Verteilung der Etiketten die Verteilung der Etiketten sein kann, die mit Entitätsknoten i infolge der Ausführung der Etikettenverbreitung in dem Graphen durch Rankingmodul 18 ist.
  • Weiterhin kann μnp ein erster Regularisationsterm sein, der benachbarte Eigenschaftsknoten bestraft, die mit einer unterschiedlichen Verteilung der Etiketten von der mit dem Entitätsknoten verbundenen Verteilung der Etiketten verbunden sind, wobei
    Figure DE202016008357U1_0010
    die Differenz bei der Verteilung von mit benachbarten Eigenschaftsknoten verbundenen Etiketten von der mit dem Entitätsknoten i verbundenen Etikettenverteilung darstellt, wobei Y ^j die Verteilung der Etiketten ist, die mit einem Eigenschaftsknoten j verbunden ist, der mit einem Entitätsknoten i über eine Kante mit einer Kantengewichtung von Wij verbunden ist, und zwar in Folge der Durchführung der Etikettenverbreitung über den Graphen durch Rankingmodul 18. Zusätzlich kann μpp ein zweiter Regularisationsterm sein, der die erlernte Verteilung der Etiketten, die die mit dem Entitätsknoten verbundene Etikettenverteilung in Richtung einer vorherigen Verteilung der Etiketten glättet, indem sie μpp mit ||Y ^i – U||2 multipliziert.
  • Das Rankingmodul 18 kann die mit einem Eigenschaftsknoten verbundene Etikettenverteilung als die optimale Lösung für die Minimierung der Zielfunktion von
    Figure DE202016008357U1_0011
    für jeden Eigenschaftsknoten j mit seinen Entitätsnachbarn bestimmen,
    Figure DE202016008357U1_0012
    die über Kanten direkt mit dem Eigenschaftsknoten j verbunden sind. Die Zielfunktion für einen Eigenschaftsknoten ist der Zielfunktion für einen Entitätsknoten ähnlich, außer dass es keine erste Bedingung gibt, da Rankingmodul 18 keine Startwertetiketten für Eigenschaftsknoten bereitstellt. Daher kann μnp ein erster Regularisationsterm sein, der benachbarte Entitätsknoten bestraft, die mit unterschiedlichen Verteilungen der Etiketten von der mit dem Eigenschaftsknoten verbundenen Etikettenverteilung verbunden sind, wobei
    Figure DE202016008357U1_0013
    den Unterschied zwischen der mit den benachbarten Entitätsknoten verbundenen Etikettenverteilung und der mit Eigenschaftsknoten j verbundenen Etikettenverteilung darstellen kann. Zusätzlich kann μpp ein zweiter Regularisationsterm sein, der die erlernte Verteilung der Etiketten, die die mit dem Eigenschaftsknoten verbundene Etikettenverteilung in Richtung einer vorherigen Verteilung der Etiketten glättet, indem sie μpp mit ||Y ^i – U||2 multipliziert.
  • Das Rankingmodul 18 kann durch die Ausführung der Etikettenverbreitung die Verteilung der Etiketten für die Entitätsknoten und die Eigenschaftsknoten dem Graphen als eine optimale Lösung bestimmen, die die Zielfunktionen für den gesamten Graphen minimieren. Daher kann zwar das Rankingmodul 18 möglicherweise nicht die Zielfunktionen für jeden einzelnen Entitätsknoten oder Eigenschaftsknoten minimieren, aber das Rankingmodul 18 kann die gesamten Zielfunktionen für die Eigenschaftsknoten und die Entitätsknoten minimieren, die den Graphen bilden.
  • Das Rankingmodul 18 kann ein unbeaufsichtigtes Maschinenlernen durchführen, um die hier beschriebene Etikettenverbreitung durchzuführen. Spezifisch gesagt, bei einem zweiteiligen Eigenschaft-Entität-Graphen, bei der eine Mehrzahl Entitätsknoten an eine Mehrzahl Eigenschaftsknoten über Kanten verbunden sind, die verbundene Kantengewichtungen haben, wobei die Mehrzahl der Entitätsknoten mit einer Mehrzahl Etiketten als Startwert besetzt werden, kann das Rankingmodul 18 die Etikettenverbreitung über zahlreiche Iterationen (z. B. 5 Iterationen) ohne zusätzliche Eingabe ausführen, um eine Etikettenverteilung für jeden Knoten des Graphen zu bestimmen, um die Zielfunktionen zu minimieren, wie vorstehend beschrieben.
  • Durch Ausführung der Etikettenverbreitung kann das Rankingmodul 18 eine Verteilung der Etiketten mit jedem Knoten in einem Graphen verbinden. Jede der mit einem Knoten verbundenen Verteilung der Etiketten kann eine Anzeige des Ranking einer oder mehrerer Entitäten einschließen, die mit einer Entität oder einer Eigenschaft zusammenhängen, die von dem verbundenen Entitäts- oder Eigenschaftsknoten dargestellt werden. Weil jedes Etikett in dem Graphen eine bestimmte Entität identifizieren kann, die durch einen Entitätsknoten dargestellt wird, kann eine mit einem Knoten verbundene Verteilung der Etiketten, die Entitätsnamen einer oder mehrerer Entitäten anzeigen, die mit einer bestimmten von dem Knoten dargestellten Eigenschaft oder Entität zusammenhängen. Weiterhin kann die Verteilung der mit einem Knoten verbundenen Etiketten auch ein Ausmaß von Verbundenheit der Entitäten mit einer bestimmten von dem Knoten dargestellten Eigenschaft oder Entität anzeigen. Auf diese Weise kann die Verteilung der Etiketten ein Ranking einer oder mehrerer Entitäten anzeigen, die mit einer Entität oder einer Eigenschaft zusammenhängen, die von dem verbundenen Entitäts- oder Eigenschaftsknoten dargestellt werden. Das Rankingmodul 18 kann eine Anzeige über jede Entität und jede Eigenschaft speichern, die in dem Graphen im Ranking-Datenspeicher 52C dargestellt werden, einschließlich einer Anzeige des Rankings (durch das Ausmaß an Verbundenheit) einer oder mehrerer Entitäten, die mit der Entität oder der Eigenschaft zusammenhängen.
  • Folglich kann ISS 14 eingehende Daten empfangen, die auf eine Entität oder eine Eigenschaft von z. B. Computergerät 2 über das Netzwerk 12 oder Internet 20 hinweisen, von den Daten, die im Ranking-Datenspeicher 52C gespeichert werden, einen Hinweis auf ein Ranking einer oder mehrerer Entitäten bestimmen, die mit der Entität oder der Eigenschaft zusammenhängen, und an Computergerät 2 ausgehende Daten übertragen, die einen Hinweis auf das Ranking einer oder mehrerer Entitäten einschließt, die mit der bestimmten Entität oder Eigenschaft zusammenhängen. In einem Beispiel kann der Hinweis auf eine Entität, den ISS 14 von dem Computergerät 2 empfängt, einen Namen angeben, der mit der Entität verbunden ist, wie „Miles Davis” oder „Beethovens 5-Symphonie.” Das Rankingmodul 18 kann den Namen verwenden, der mit der Entität verbunden ist, um in Ranking-Datenspeicher 52C zu indizieren, um die mit diesem Namen verbundene Entität zu finden, und kann eine Position innerhalb des Ranking-Datenspeichers 52C bestimmen, an der der Hinweis auf das Ranking der einer oder mehreren Entitäten, die mit der bestimmten Entität zusammenhängen, gespeichert wird. Das Rankingmodul 18 kann den Hinweis auf das Ranking einer oder mehrerer Entitäten abrufen, die mit der bestimmten Entität zusammenhängen. ISS 14 kann den abgerufenen Hinweis aus das Ranking einer oder mehrerer Entitäten, die mit der bestimmten Entität verbunden sind, in jedem beliebigen strukturierten Datenformat für das Übertragen des Hinweises auf das Ranking einer oder mehrerer Entitäten formatieren, wie JSON oder XML, und kann den Hinweis auf die eine oder mehrere Entitäten an das Computergerät 2 ausgeben, wie über das Netzwerk 12 oder Internet 20.
  • In einem anderen Beispiel kann ISS 14 eingehende Daten empfangen, die z. B. auf eine Anfrage von dem Computergerät 2 hinweisen. Bei einer Anfrage kann es sich um Textdaten, wie ein Wort, eine Redewendung und dergleichen handeln, die das Computergerät 2 als Eingabe empfangen kann. Z. B. kann eine Anfrage eine Suchredewendung für eine oder mehrere Entitäten sein, die mit der Anfrage zusammenhängen. Als Reaktion auf das Empfangen des Hinweises auf die Anfrage kann das Computergerät 2, über Rankingmodul 18, ein Ranking einer oder mehrerer Entitäten bestimmen, die mit der Anfrage zusammenhängen, und kann an das Computergerät 2 einen Hinweis auf das Ranking einer oder mehrerer Entitäten ausgeben, die mit der Anfrage zusammenhängen.
  • Bei einem Hinweis auf eine Anfrage, wie „Marathon”, kann das Rankingmodul 18 ein Ranking einer oder mehrerer mit der Anfrage verbundener Entitäten bestimmen. Das Rankingmodul 18 kann die Anfrage als Eigenschaft behandeln, z. B. Zuordnung des Textes der Anfrage zum Text einer Eigenschaft, und bestimmt so, dass
    Figure DE202016008357U1_0014
    Figure DE202016008357U1_0015
    wobei FQ der Satz aller Eigenschaften sein kann, die Anfrage Q zuzuordnen sind. Spezifisch, weil jede Eigenschaft mit einer Verteilung der Etiketten verbunden ist, die auf ein Ranking einer oder mehrerer mit der Eigenschaft verbundenen Entitäten hinweisen, kann das Rankingmodul 18 die bestimmte Eigenschaft, der die Anfrage zuzuordnen ist, im Ranking-Datenspeicher 52C indizieren, um die bestimmte Eigenschaft zu finden, und kann eine Position in dem Ranking-Datenspeicher 52C bestimmen, an der der Hinweis auf das Ranking der einen oder mehreren Entitäten, die mit der bestimmten Eigenschaft zusammenhängen, gespeichert wird. Das Rankingmodul 18 kann den Hinweis auf das Ranking einer oder mehrerer Entitäten abrufen, die mit der bestimmten Eigenschaft zusammenhängen. ISS 14 kann den abgerufenen Hinweis auf das Ranking einer oder mehrerer Entitäten, die mit der bestimmten Eigenschaft verbunden sind, in jedem beliebigen strukturierten Datenformat für das Übertragen des Hinweises auf das Ranking einer oder mehrerer Entitäten formatieren, wie JSON oder XML, und kann den Hinweis auf die eine oder mehrere Entitäten an das Computergerät 2 ausgeben, wie über das Netzwerk 12 oder Internet 20.
  • 3A3C sind Blockdiagramme, die jeweils ein Beispiel für einen zweiteiligen Eigenschaft-Entität-Graphen veranschaulichen, die das Rankingmodul 18 konstruieren kann, um die Expandertechnik entsprechend Aspekten der vorliegenden Offenbarung auszuführen. Wie in 3A gezeigt, kann Rankingmodul 18 einen zweiteiligen Eigenschaft-Entität-Graphen 80 erstellen, die die Entitätsknoten 84A und 84B einschließt, die mit den Eigenschaftsknoten 84D84F über die Kanten 86A86F verbunden sind. Das Rankingmodul 18 kann die Entitätsknoten 82A und 84B jeweils mit den Etiketten 88A und 88B als Startwert belegen. Jede der Kanten 86A86F kann eine verbundene Kantengewichtung haben (nicht gezeigt).
  • Das Rankingmodul 18 kann ein Maschinenlernen mit Graph 90 durch Ausnutzung der Idee der Etikettenverbreitung ausführen, bei der es sich um eine graph-basierte Lerntechnik handelt, die die mit jedem etikettierten Startwertknoten verbundenen Informationen verwendet und diese Etiketten in dem Graphen auf eine prinzipientreue und iterative Weise verbreitet. Die Etikettenverbreitung kann zwei Eingabequellen verwenden: Graph 80 und die Startwertetiketten 88A und 88B. Das Rankingmodul 18 kann die Startwertetiketten 88A und 88B auf der Grundlage der bereitgestellten Graphstruktur in Graph 80 verbreiten, um eine Verteilung der Startwertetiketten mit jedem der Knoten 84A84F in Graph 80 als optimale Lösung zu verbinden, die eine Zielfunktion minimiert.
  • Um eine Verbreitung der Startwertetiketten mit jedem der Knoten 84A84F in dem Graphen 80 als optimale Lösung zu verbinden, die eine Zielfunktion minimiert, kann das Rankingmodul 18 eine Etikettenverteilung über mehrere Iterationen ausführen. 3B zeigt eine erste Iteration der Etikettenverbreitung über Graph 80. Wie in 3B gezeigt, kann das Rankingmodul 18, nach einer ersten Iteration der Etikettenverbreitung, die Verteilung der Etiketten 82A82F jeweils mit den Knoten 84A84F verbinden. Das Rankingmodul 88 kann die Etiketten 88A und 88B auch so in Graph 80 verteilen, dass die Verteilung der Etiketten 82A82F Hinweise auf eines oder beide Etiketten 88A und 88B einschließen kann. Jede Verteilung der Etiketten kann einen Hinweis auf eine oder mehrere verbundene Entitäten sowie einen Hinweis auf das Ausmaß an Verbundenheit zwischen der Entität oder der Eigenschaft enthalten, die durch den Knoten und von jeder der einen oder mehreren verbundenen Entitäten dargestellt werden. Z. B. schließt die Verteilung der Etiketten 82D, die mit Eigenschaftsknoten 84D verbunden sind, Hinweise auf die Entitäten SciFi-Filme ein und schließt einen Hinweis auf die Verbundenheit zwischen diesen Entitäten und der mit Eigenschaftsknoten 84D verbundenen Eigenschaft auf einer Skala von 0 bis 1.0 ein, wobei eine höhere Punktzahl ein höheres Ausmaß an Ähnlichkeit anzeigt.
  • Das Rankingmodul 18 kann weiterhin die Ausführung der Etikettenverbreitung in Graph 80 iterieren. 3C zeigt eine weitere Iteration der Etikettenverbreitung über Graph 80. Wie in 3C gezeigt, kann das Rankingmodul 18 nach einer weiteren Iteration der Verbreitung die Verteilung der Etiketten weiter abwandeln, die mit einem oder mehreren der Knoten 84A84F verbunden sind, um eine optimierte Lösung zu bestimmen, die eine Zielfunktion in Graph 80 minimiert. Z. B. schließt die Verteilung der Knoten 82C jetzt Hinweise auf die Entitäten SciFi-Filme ein und schließt einen Hinweis auf die Verbundenheit zwischen diesen Entitäten und der mit Eigenschaftsknoten 84D verbundenen Eigenschaft auf einer Skala von 0 bis 1.0 ein, wobei eine höhere Punktzahl ein höheres Ausmaß an Ähnlichkeit anzeigt.
  • 4 ist ein Flussdiagramm, das einen Beispielprozess für die Bestimmung von verbundenen Entitäten gemäß einem oder mehreren Aspekten der vorliegenden Offenbarung veranschaulicht. In einigen Beispielen kann der Prozess durch eines oder mehrere ISS 14, Entitätsmodul 16 und von Rankingmodul 18 durchgeführt werden, die in 1 und 2 gezeigt werden. In einigen Beispielen kann der Prozess mit den zusätzlichen Modulen oder Komponenten durchgeführt werden, die in 12 gezeigt werden. Nur zu Zwecken der Veranschaulichung wird der Prozess in einem Beispiel ISS 14 durchgeführt, wie in 2 gezeigt. Wie in 4 gezeigt, kann der Prozess das Erstellen, durch das Rankingmodul 18, einen Graphen einschließen, wie Graph 80, die eine Mehrzahl von Knoten einschließt, wobei die Mehrzahl der Knoten eine Mehrzahl von Knoten einschließt, die eine Mehrzahl von Entitäten darstellen, und eine Mehrzahl von Eigenschaftsknoten, die eine Mehrzahl von Eigenschaften darstellen, und wobei jede der Mehrzahl der Entitätsknoten in dem Graphen mit einem oder mehreren der Mehrzahl der Eigenschaftsknoten (102). Der Prozess kann weiterhin, durch Rankingmodul 18, die Ausführung einer Etikettenverbreitung einschließen, um eine Mehrzahl von Etiketten in dem Graphen zu verbreiten, um eine Verteilung der Etiketten mit jedem der Mehrzahl von Knoten (104) zu verbinden. In einigen Beispielen kann ISS 14 so konfiguriert sein, dass es einen Hinweis auf mindestens eine Eigenschaft von Interesse oder eine Entität von Interesse empfängt. In einigen Beispielen kann ISS 14 so konfiguriert sein, dass es einen Hinweis auf eine oder mehrere verbundene Entitäten ausgibt, die mit der Eigenschaft von Interesses oder der Entität von Interesse zusammenhängen.
  • In einigen Beispielen kann der Prozess weiterhin die Belegung als Startwert, durch das Rankingmodul 18, jedes der Mehrzahl der Entitätsknoten mit einem jeweiligen der Mehrzahl von Etiketten einschließen, wobei jede der Etiketten eine entsprechende der Mehrzahl von Entitätsknoten identifiziert. In einigen Beispielen kann die Ausführung der Etikettenverbreitung durch das Rankingmodul 18 weiterhin die Verbreitung der Etiketten einschließen, um die Etikettenverteilung zu bestimmen, die mit jedem der Mehrzahl der Knoten als optimale Lösung verbunden sind, die eine Zielfunktion minimiert.
  • In einigen Beispielen wird die Zielfunktion für einen Entitätsknoten der Mehrzahl der Eigenschaftsknoten minimiert, wobei die Zielfunktion umfasst: einen quadrierten Verlust zwischen einer echten Verteilung der mit dem Entitätsknoten verbundenen Etiketten und einer erlernten Verteilung der mit dem Entitätsknoten verbundenen Etiketten; einen ersten Regularisationsterm, der benachbarte Eigenschaftsknoten bestraft, die mit unterschiedlichen Verteilungen der Etiketten von der mit dem Entitätsknoten verbundenen Etikettenverteilung verbunden sind; und einen zweiten Regularisationsterm, der die erlernte Verteilung der mit dem Entitätsknoten verbundenen Etiketten in Richtung einer vorherigen Verteilung der Etiketten glättet.
  • In einigen Beispielen wird die Zielfunktion für einen Eigenschaftsknoten der Mehrzahl der Eigenschaftsknoten minimiert, wobei die Zielfunktion umfasst: einen ersten Regularisationsterm, der benachbarte Entitätsknoten bestraft, die mit unterschiedlichen Verteilungen der Etiketten von der mit dem Eigenschaftsknoten verbundenen Etikettenverteilung verbunden sind; und einen zweiten Regularisationsterm, der die erlernte Verteilung der Etiketten in Richtung der mit dem Eigenschaftsknoten verbundenen vorherigen Verteilung der Etiketten glättet.
  • In einigen Beispielen schließt jede der mit einem Knoten verbundenen Verteilung der Etiketten einen Hinweis auf das Ranking einer oder mehrerer Entitäten ein, die mit einer Entität oder einer Eigenschaft zusammenhängen, die von dem verbundenen Entitäts- oder Eigenschaftsknoten dargestellt werden. In einigen Beispielen enthält der Hinweis auf das Ranking der einen oder mehreren Entitäten, die mit der durch den verbundenen Knoten dargestellten Entität oder Eigenschaft zusammenhängen, einen Hinweis auf ein Ausmaß an Verbundenheit mit der durch den verbundenen Entitäts- oder Eigenschaftsknoten dargestellte Entität oder Eigenschaft.
  • In einigen Beispielen schließt der Prozess weiterhin die Verbindung, durch das Rankingmodul 18, über eine oder mehrere Kanten des Graphen, jeden der Mehrzahl der Entitätsknoten in dem Graphen, die eine entsprechende Entität darstellen, mit einer oder mehrerer der Mehrzahl der Eigenschaftsknoten in dem Graphen ein, die eine oder mehrere der mit der entsprechenden Entität verbundenen Eigenschaften darstellen. In einigen Beispielen kann der Prozess weiterhin das Verbinden, durch das Rankingmodul 18, einer oder mehrerer Gewichtungen mit der einen oder mehreren Kanten einschließen.
  • In einigen Beispielen kann der Prozess weiterhin das Extrahieren, durch Entitätsmodul 16, einer Mehrzahl der Internetressourcen, die mit der Mehrzahl der Entitäten verbunden sind, einschließen, wobei die Mehrzahl der Eigenschaften mit der Mehrzahl der Entitäten verbunden sind. In einigen Beispielen ist die Mehrzahl der Entitäten mit einem gleichen geographischen Gebiet verbunden.
  • 5 ist ein Flussdiagramm, das einen Beispielprozess für die Bestimmung von verbundenen Entitäten gemäß einem oder mehreren Aspekten der vorliegenden Offenbarung veranschaulicht. In einigen Beispielen kann der Prozess durch eines oder mehrere ISS 14, Entitätsmodul 16 und von Rankingmodul 18 durchgeführt werden, die in 1 und 2 gezeigt werden. In einigen Beispielen kann der Prozess mit den zusätzlichen Modulen oder Komponenten durchgeführt werden, die in 12 gezeigt werden. Nur zu Zwecken der Veranschaulichung wird der Prozess in einem Beispiel ISS 14 durchgeführt, wie in 2 gezeigt. Wie in 5 gezeigt, kann der Prozess das Empfangen, durch die Kommunikationseinheiten 46 von ISS 14, eines Hinweises auf mindestens eine, eine Eigenschaft von Interesse oder eine Entität von Interesse (202), einschließen. Der Prozess kann weiterhin die Bestimmung, durch einen oder mehrere Prozessoren 44 von ISS 14, einer oder mehrerer verbundener Entitäten, die mit der Eigenschaft von Interesse oder der Entität von Interesse verbunden sind, einschließen, zumindest teilweise auf der Grundlage einer entsprechenden Verteilung der Etiketten, die mit einer der Mehrzahl von Eigenschaftsknoten in dem Graphen verbunden sind, der die Eigenschaft von Interesse darstellt, oder mit einer der Mehrzahl von Eigenschaftsknoten in dem Graphen verbunden sind, der die Entität von Interesse darstellt, wobei der Graph eine Mehrzahl von Knoten einschließt, wobei die Mehrzahl von Knoten eine Mehrzahl von Entitätsknoten einschließt, die eine Mehrzahl von Entitäten darstellen, und eine Mehrzahl von Eigenschaftsknoten einschließt, die eine Mehrzahl von Eigenschaften darstellen, und wobei jeder der Mehrzahl der Entitätsknoten in dem Graphen mit einem oder mehreren der Mehrzahl von Eigenschaftsknoten verbunden ist, und wobei eine Mehrzahl der Etiketten durch die Etikettenverbreitung in dem Graphen verbreitet werden, um eine Verteilung der Etiketten mit jedem der Mehrzahl von Knoten (204) zu verbinden. Der Prozess kann weiterhin die Ausgabe, durch die Kommunikationseinheiten 46 von ISS 14 und für mindestens eine der Eigenschaften oder der Entitäten von Interesse, einen Hinweis auf eine oder mehrere verbundene Entitäten einschließen, die mit der Eigenschaft oder der Entität verbunden sind, wobei die Ausgabe des Hinweises auf die eine oder mehrere verbundene Entitäten teilweise auf der entsprechenden Verteilung von Etiketten basieren, die mit einem der Mehrzahl der Eigenschaftsknoten verbunden sind, der die Eigenschaft von Interesse darstellt, oder mit einem der Mehrzahl des Entitätsknoten, der die Entität von Interesse darstellt (206).
  • In einigen Beispielen schließt das Empfangen des Hinweises auf mindestens die Eigenschaft von Interesse oder die Entität von Interesse weiterhin das Empfangen ein, durch ISS 14 über ein Netzwerk 12 und von einem entfernten C Computergerät 2, eingehender Daten, die auf mindestens die Eigenschaft von Interesse oder die Entität von Interesse hinweisen, und Ausgabe, durch ISS 14 und für mindestens die Eigenschaft von Interesse oder die Entität von Interesse, des Hinweises auf die eine oder mehrere verbundene Entitäten, die mit der Eigenschaft von Interesse oder der Entität von Interesse zusammenhängen, weiterhin das Senden enthält, durch ISS 14 über das Netzwerk 12 an das entfernte Computergerät 2, ausgegebener Daten, die den Hinweis auf die eine oder mehrere verbundene Entitäten einschließt, die mit der Eigenschaft von Interesse oder der Entität von Interesse zusammenhängen.
  • In einem oder mehreren Beispielen können die beschriebenen Funktionen in Hardware, Software, Firmware oder in jeder möglichen Kombination davon implementiert werden. Wenn sie in Software implementiert werden, können die Funktionen als eine oder mehrere Anweisungen oder Code auf einem computerlesbares Medium gespeichert oder übertragen und durch eine hardware-basierte Verarbeitungseinheit ausgeführt werden. Das computerlesbare Medium kann computerlesbare Speichermedien einschließen, die einem greifbaren Medium, wie Datenspeichermedien oder Kommunikationsmedien einschließlich aller Medien entsprechen, die die Übertragung eines Computerprogramms von einem an einen anderen Ort, z. B. gemäß eines Kommunikationsprotokolls, ermöglichen. Auf diese Weise kann das computerlesbare Medium im Allgemeinen greifbaren computerlesbaren Speichermedien (1) entsprechen, die nicht-flüchtig sind, oder (2) einem Kommunikationsmedium wie einem Signal oder einer Trägerschwingung entsprechen. Datenspeichermedien können alle verfügbaren Medien sein, auf die durch einen oder mehrere Computer oder einen oder mehrere Prozessoren zugegriffen werden kann, um Anweisungen, Code- und/oder Datenstrukturen für die Implementierung der Techniken abzurufen, die in dieser Offenbarung beschrieben werden. Ein Computerprogrammprodukt kann ein computerlesbares Medium einschließen.
  • Als Beispiel und nicht als Beschränkung könnten solche computerlesbare Speichermedien RAM, ROM, EEPROM, CD-ROM oder andere optische Plattenspeicher, magnetische Plattenspeicher oder andere magnetische Speichergeräte, Flash-Speicher oder jegliches andere Speichermedium umfassen, das verwendet werden kann, um gewünschten Programmcode in Form von Anweisungen oder Datenstrukturen zu speichern und auf das durch einen Computer zugegriffen werden kann. Auch wird jegliche Verbindung ordnungsgemäß als computerlesbares Medium bezeichnet. Wenn z. B. Anweisungen von einer Webseite, einem Server oder einer anderen entfernten Quelle mit einem Koaxialkabel, Glasfaserkabel, einem verdrillten Doppelkabel, einem digitalen Teilnehmeranschluss (DSL) oder drahtlose Technologien wie Infrarot, Funk und Mikrowelle übertragen werden, dann sind das Koaxialkabel, Glasfaserkabel, das verdrillte Doppelkabel, DSL oder drahtlose Technologien wie Infrarot, Funk und Mikrowelle in der Definition des Mediums eingeschlossen. Es sollte verstanden jedoch werden, dass computerlesbare Speichermedien und Datenspeichermedien keine Anschlüsse, Trägerschwingungen, Signale oder andere flüchtige Medien einschließen, sondern vielmehr auf die nicht-vorübergehenden, greifbaren Speichermedien verwiesen werden. Disks/Disketten, wie dies hier verwendet wird, schließen CDs, Laserplatten, optische Platten, DVDs, Disketten und Blu-Ray-Disks ein, bei denen die Platten normalerweise Daten magnetisch reproduzieren, wobei andere Platten Daten optisch mit Laser reproduzieren. Kombinationen der vorstehend genannten gehören ebenfalls zum Umfang der computerlesbaren Medien.
  • Anweisungen können durch einen oder mehrere Prozessoren, wie einen oder mehrere digitale Signalprozessoren (DSPs), universtelle Mikroprozessoren, anwendungsorientierte integrierte Schaltungen (ASICs), feldprogrammierbare Gate-Arrays (FPGAs) oder beliebige andere gleichwertige integrierte oder diskrete Logikschaltungen beinhalten. Dementsprechend kann der Begriff „Prozessor”, wie hier verwendet, sich auf jegliche auf der vorstehenden Struktur oder jegliche andere Struktur, die für Implementierung der hier beschriebenen Techniken verwendbar ist, beziehen. Außerdem kann in einigen Aspekten die hier beschriebene Funktionalität in speziellen Hardware- und/oder Software-Modulen bereitgestellt werden. Auch könnten die Techniken vollständig in einem oder mehreren Schaltkreisen oder in Logikelementen implementiert werden.
  • Die Techniken dieser Offenbarung können in einer breiten Mehrzahl an Geräten oder Apparaten, einschließlich einem Mobiltelefon, einer integrierten Schaltung (IS) oder einem Satz IS (z. B. einem Chipsatz) implementiert werden. Verschiedene Komponenten, Module oder Einheiten werden in dieser Offenbarung beschrieben, um Funktionsaspekte der Geräte hervorzuheben, die so konfiguriert werden, um die offenbarten Techniken auszuführen, aber sie erfordern nicht notwendigerweise eine Realisierung durch unterschiedliche Hardware-Einheiten. Vielmehr, wie vorstehend beschrieben, können verschiedene Einheiten in einer Hardware-Einheit kombiniert werden oder von einer Sammlung interoperativer Hardware-Einheiten bereitgestellt werden, einschließlich einem oder mehreren Prozessoren, wie vorstehend beschrieben, in Verbindung mit geeigneter Software und/oder Firmware.
  • Es wurden verschiedene Ausführungsformen beschrieben. Diese und weitere Ausführungsformen liegen innerhalb des Schutzumfangs der folgenden Patentansprüche.

Claims (13)

  1. Computersystem, umfassend: einen Speicher; und mindestens einen Prozessor, der kommunikativ an den Speicher gekoppelt ist und der so konfiguriert ist, dass er: einen Graphen zur Speicherung im Speicher erstellt, die eine Mehrzahl von Knoten einschließt, wobei die Mehrzahl der Knoten eine Mehrzahl von Entitätsknoten einschließt, die eine Mehrzahl von Entitäten darstellen, und eine Mehrzahl von Eigenschaftsknoten, die eine Mehrzahl von Eigenschaften darstellen, und wobei jeder der Mehrzahl der Entitätsknoten in dem Graphen mit einem oder mehreren der Mehrzahl der Eigenschaftsknoten verbunden ist; und Etikettenverbreitung ausführt, um eine Mehrzahl von Etiketten in dem Graphen zu verbreiten, um eine Verteilung der Etiketten mit jedem der Mehrzahl von Knoten zu verbinden.
  2. Computersystem nach Anspruch 1, wobei in der mindestens eine Prozessor weiterhin so konfiguriert ist, dass er: jeden der Mehrzahl der Entitätsknoten mit einem jeweiligen Etikett der Mehrzahl von Etiketten besiedelt, wobei jedes der Etiketten einen entsprechenden der Mehrzahl von Entitätsknoten identifiziert.
  3. Computersystem nach Anspruch 2, wobei der mindestens eine Prozessor weiterhin so konfiguriert ist, dass er: durch das Computergerät die Etikettenverbreitung ausführt, um die Verteilung von Etiketten zu bestimmen, die mit jedem der Mehrzahl von Knoten als optimale Lösung verbunden ist, die eine Zielfunktion minimiert.
  4. Computersystem nach Anspruch 3, wobei die Zielfunktion für einen Entitätsknoten der Mehrzahl der Eigenschaftsknoten minimiert wird, und wobei die Zielfunktion umfasst: einen quadrierten Verlust zwischen einer echten mit dem Entitätsknoten verbundenen Verteilung der Etiketten und einer erlernten mit dem Entitätsknoten verbundenen Verteilung der Etiketten; einen ersten Regularisationsterm, der benachbarte Entitätsknoten bestraft, die mit Verteilungen der Etiketten, die von der mit dem Eigenschaftsknoten verbundenen Etikettenverteilung verschieden sind, verbunden sind; und einen zweiten Regularisationsterm, der die erlernte Verteilung der Etiketten, die mit dem Entitätsknoten verbunden sind, in Richtung einer vorherigen Verteilung der Etiketten glättet.
  5. Computersystem nach Anspruch 3, wobei die Zielfunktion für einen Eigenschaftsknoten der Mehrzahl der Eigenschaftsknoten minimiert wird, und wobei die Zielfunktion umfasst: einen ersten Regularisationsterm, die benachbarte Entitätsknoten bestraft, die mit Verteilungen der Etiketten, die von der mit dem Eigenschaftsknoten verbundenen Etikettenverteilung verschieden sind, verbunden sind; und einen zweiten Regularisationsterm, die die erlernte Verteilung der Etiketten, die mit dem Eigenschaftsknoten verbunden sind, in Richtung einer vorherigen Verteilung der Etiketten glättet.
  6. Computersystem nach jedwedem der Ansprüche 1–5, wobei jede Verteilung der Etiketten einen Hinweis auf das Ranking einer oder mehrerer Entitäten einschließt, die mit einer Entität oder einer Eigenschaft zusammenhängen, die mit einer Entität oder einer Eigenschaft verbunden sind, die von einem Entitäts- oder Eigenschaftsknoten dargestellt werden.
  7. Computersystem nach Anspruch 6, wobei der Hinweis auf das Ranking der einen oder mehreren Entitäten, die mit der durch den verbundenen Knoten dargestellten Entität oder Eigenschaft zusammenhängen, einen Hinweis auf ein Ausmaß an Verbundenheit jeder der einen oder mehreren Entitäten mit der durch den verbundenen Entitäts- oder Eigenschaftsknoten dargestellten Entität oder Eigenschaft umfasst.
  8. Computersystem nach Anspruch 1–7, wobei der mindestens eine Prozessor weiterhin so konfiguriert ist, dass er: über eine oder mehrere Kanten des Graphen, jeden der Mehrzahl der Entitätsknoten in dem Graphen, die eine entsprechende Entität darstellen, mit einem oder mehreren der Mehrzahl der Eigenschaftsknoten in dem Graphen verbindet, die eine oder mehrere der mit der entsprechenden Entität verbundenen Eigenschaften darstellen.
  9. Computersystem nach Anspruch 8, wobei der mindestens eine Prozessor weiterhin so konfiguriert ist, dass er: eine oder mehrere Gewichtungen mit der einen oder mehreren Kanten verbindet.
  10. Computersystem nach jedwedem der Ansprüche 1–9, wobei der mindestens eine Prozessor weiterhin so konfiguriert ist, dass er: aus einer Mehrzahl von Internetressourcen, die mit der Mehrzahl der Entitäten verbunden sind, die Mehrzahl von Eigenschaften, die mit der Mehrzahl der Entitäten verbunden ist, extrahiert.
  11. Computersystem nach jedwedem der Ansprüche 1–10, wobei die Mehrzahl der Entitäten mit einem selben geographischen Gebiet verbunden ist.
  12. Computersystem, umfassend: einen Speicher; und mindestens einen Prozessor, der kommunikativ an den Speicher gekoppelt ist und der so konfiguriert ist, dass er: einen Hinweis auf mindestens eine Eigenschaft von Interesse oder eine Entität von Interesse empfängt; eine oder mehrere verbundene Entitäten bestimmt, die mit der Eigenschaft von Interesse oder der Entität von Interesse verbunden sind, zumindest teilweise auf der Grundlage einer entsprechenden Verteilung der Etiketten, die mit einem der Mehrzahl von Eigenschaftsknoten in dem Graphen verbunden ist, der die Eigenschaft von Interesse darstellt, oder mit einem der Mehrzahl von Entitätsknoten, der die Entität von Interesse darstellt, wobei der Graph eine Mehrzahl von Knoten einschließt, wobei die Mehrzahl von Knoten eine Mehrzahl von Entitätsknoten einschließt, die eine Mehrzahl von Entitäten darstellen, und eine Mehrzahl von Eigenschaftsknoten einschließt, die eine Mehrzahl von Eigenschaften darstellen, und wobei jeder der Mehrzahl der Entitätsknoten in dem Graphen mit einem oder mehreren der Mehrzahl von Eigenschaftsknoten verbunden ist, und wobei eine Mehrzahl der Etiketten durch die Etikettenverbreitung in dem Graphen verbreitet werden, um eine Verteilung der Etiketten mit jedem der Mehrzahl von Knoten zu verbinden; und für mindestens eine der Eigenschaften oder der Entitäten von Interesse, einen Hinweis auf eine oder mehrere verbundene Entitäten ausgibt, die mit der Eigenschaft oder der Entität von Interesse verbunden sind, wobei die Ausgabe des Hinweises auf die eine oder mehrere verbundene Entitäten zumindest teilweise auf der entsprechenden Verteilung von Etiketten basiert, die mit einem der Mehrzahl der Eigenschaftsknoten verbunden sind, der die Eigenschaft von Interesse darstellt, oder mit einem der Mehrzahl des Entitätsknoten, der die Entität von Interesse darstellt.
  13. Computersystem nach Anspruch 12, wobei der mindestens eine Prozessor weiterhin so konfiguriert ist, dass er: über ein Netz und von einem entfernten Computergerät eingehende Daten empfängt, die auf die mindestens eine Eigenschaft von Interesse oder Entität von Interesse hinweisen; und über das Netz an das entfernte Computergerät ausgehende Daten sendet, die den Hinweis auf die eine oder mehrere verbundene Entitäten einschließen, die mit der Eigenschaft von Interesse oder der Entität von Interesse zusammenhängen.
DE202016008357.1U 2016-04-11 2016-12-28 Entdeckung einer verbundenen entität Active DE202016008357U1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/095,517 US20170293696A1 (en) 2016-04-11 2016-04-11 Related entity discovery
US15/095,517 2016-04-11

Publications (1)

Publication Number Publication Date
DE202016008357U1 true DE202016008357U1 (de) 2017-09-15

Family

ID=57838548

Family Applications (2)

Application Number Title Priority Date Filing Date
DE202016008357.1U Active DE202016008357U1 (de) 2016-04-11 2016-12-28 Entdeckung einer verbundenen entität
DE102016125767.2A Withdrawn DE102016125767A1 (de) 2016-04-11 2016-12-28 Entdeckung einer verbundenen Entität

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE102016125767.2A Withdrawn DE102016125767A1 (de) 2016-04-11 2016-12-28 Entdeckung einer verbundenen Entität

Country Status (8)

Country Link
US (1) US20170293696A1 (de)
EP (1) EP3430533A1 (de)
JP (1) JP2019514149A (de)
KR (1) KR20180126577A (de)
CN (1) CN107291792B (de)
DE (2) DE202016008357U1 (de)
GB (1) GB2549362A (de)
WO (1) WO2017180212A1 (de)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9171338B2 (en) 2009-09-30 2015-10-27 Evan V Chrapko Determining connectivity within a community
US10178131B2 (en) * 2017-01-23 2019-01-08 Cisco Technology, Inc. Entity identification for enclave segmentation in a network
US10180969B2 (en) * 2017-03-22 2019-01-15 Www.Trustscience.Com Inc. Entity resolution and identity management in big, noisy, and/or unstructured data
US20190019126A1 (en) * 2017-07-14 2019-01-17 International Business Machines Corporation Smart meeting scheduler
US10747206B2 (en) * 2017-10-05 2020-08-18 Honeywell International Inc. Intelligent data access for industrial internet of things devices using latent semantic indexing
US11244743B2 (en) * 2018-01-05 2022-02-08 International Business Machines Corporation Adaptive weighting of similarity metrics for predictive analytics of a cognitive system
US10810234B2 (en) * 2018-04-24 2020-10-20 International Business Machines Coproration Searching for and determining relationships among entities
JP2021015425A (ja) * 2019-07-11 2021-02-12 富士通株式会社 学習方法、学習プログラム及び学習装置
CN110502568B (zh) * 2019-08-08 2020-11-10 上海数禾信息科技有限公司 用于数据挖掘的实体关系计算方法以及装置、存储介质
CN111858709A (zh) * 2020-07-14 2020-10-30 中国建设银行股份有限公司 关联关系挖掘方法及装置
CN112015913A (zh) * 2020-08-28 2020-12-01 支付宝(杭州)信息技术有限公司 用于训练处罚实体分类模型的方法及装置
WO2024020054A1 (en) * 2022-07-19 2024-01-25 Radcliffe Justin Garrett Personal information management system having graph-based management and storage architecture

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5084796B2 (ja) * 2009-07-24 2012-11-28 ヤフー株式会社 関連性判定装置、関連性判定方法およびプログラム
US20110106807A1 (en) * 2009-10-30 2011-05-05 Janya, Inc Systems and methods for information integration through context-based entity disambiguation
JP5250009B2 (ja) * 2010-09-30 2013-07-31 ヤフー株式会社 サジェスチョンクエリ抽出装置及び方法、並びにプログラム
US8478209B2 (en) * 2011-05-05 2013-07-02 GM Global Technology Operations LLC Method and apparatus for multimedia content promotion in vehicular wireless networks
US8832091B1 (en) * 2012-10-08 2014-09-09 Amazon Technologies, Inc. Graph-based semantic analysis of items
US8856234B2 (en) * 2013-02-28 2014-10-07 Workiva Llc System and method for performing distributed asynchronous calculations in a networked environment

Also Published As

Publication number Publication date
WO2017180212A1 (en) 2017-10-19
DE102016125767A1 (de) 2017-10-12
GB201622163D0 (en) 2017-02-08
CN107291792A (zh) 2017-10-24
KR20180126577A (ko) 2018-11-27
JP2019514149A (ja) 2019-05-30
GB2549362A (en) 2017-10-18
EP3430533A1 (de) 2019-01-23
US20170293696A1 (en) 2017-10-12
CN107291792B (zh) 2020-11-27

Similar Documents

Publication Publication Date Title
DE202016008357U1 (de) Entdeckung einer verbundenen entität
Watts et al. Measuring the news and its impact on democracy
Gupta et al. A study of big data evolution and research challenges
Ruths et al. Social media for large studies of behavior
US11068547B2 (en) Dynamic search set creation in a search engine
US9582486B2 (en) Apparatus and method for classifying and analyzing documents including text
CN110457439B (zh) 一站式智能写作辅助方法、装置和系统
CN109063138B (zh) 用于在区块链即服务平台搜索数据的方法、设备及存储介质
US20190286676A1 (en) Contextual content collection, filtering, enrichment, curation and distribution
CN110232126B (zh) 热点挖掘方法及服务器和计算机可读存储介质
US20160162583A1 (en) Apparatus and method for searching information using graphical user interface
JP2016522927A (ja) 可変検索クエリ・バーティカル・アクセス
DE202014010883U1 (de) Systeme für das Assoziieren von Microposts mit geografischen Standorten
US20210158129A1 (en) Method and system for generating synthetic data using a regression model while preserving statistical properties of underlying data
US9727545B1 (en) Selecting textual representations for entity attribute values
DE202014010918U1 (de) Das Clustering von Werbeanzeigen mit organischen Karteninhalten
US10685027B2 (en) Search system
US9946762B2 (en) Building a domain knowledge and term identity using crowd sourcing
US9692804B2 (en) Method of and system for determining creation time of a web resource
Anh Web Scraping: A Big Data Building Tool And Its Status In The Fintech Sector In Viet Nam
Wang et al. Patterns of onwards migration within the urban hierarchy of China: Who moves up and who moves down?
Nasajpour et al. Evaluation of the quality of the college library websites in Iranian medical Universities based on the Stover model
Huang et al. Web content adaptation for mobile device: A fuzzy-based approach
CN111222918A (zh) 关键词挖掘方法、装置、电子设备及存储介质
CN112189195A (zh) 用于识别、使用和管理在线和网络内容中的受信任源的应用编程接口

Legal Events

Date Code Title Description
R207 Utility model specification
R081 Change of applicant/patentee

Owner name: GOOGLE LLC (N.D.GES.D. STAATES DELAWARE), MOUN, US

Free format text: FORMER OWNER: GOOGLE INC., MOUNTAIN VIEW, CALIF., US

R082 Change of representative

Representative=s name: BETTEN & RESCH PATENT- UND RECHTSANWAELTE PART, DE

R150 Utility model maintained after payment of first maintenance fee after three years
R151 Utility model maintained after payment of second maintenance fee after six years