DE102017122363A1 - Einstufen von Suchergebnisdokumenten - Google Patents

Einstufen von Suchergebnisdokumenten Download PDF

Info

Publication number
DE102017122363A1
DE102017122363A1 DE102017122363.0A DE102017122363A DE102017122363A1 DE 102017122363 A1 DE102017122363 A1 DE 102017122363A1 DE 102017122363 A DE102017122363 A DE 102017122363A DE 102017122363 A1 DE102017122363 A1 DE 102017122363A1
Authority
DE
Germany
Prior art keywords
request
document
documents
features
response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102017122363.0A
Other languages
English (en)
Inventor
Mike Bendersky
Marc Alexander Najork
Donald Metzler
Xuanhui Wang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of DE102017122363A1 publication Critical patent/DE102017122363A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor

Abstract

Es werden Verfahren und Vorrichtungen bereitgestellt, die sich auf ein Verwenden von einem oder mehreren Dokumentmerkmalen eines Dokuments in Antwort auf eine Anfrage und optional einem oder mehreren Merkmalen der Anfrage beziehen, um eine Präsentationscharakteristik zum Präsentieren eines Suchergebnisses, das dem Dokument entspricht, zu bestimmen. In einigen Implementierungen können Maße, die dem einen oder den mehreren Dokumentmerkmalen und/oder dem einen oder den mehreren Anfragemerkmalen zugeordnet sind, verwendet werden, um die Präsentationscharakteristik zu bestimmen. Die Maße können auf vergangenen Interaktionen von entsprechenden Anwendern mit anderen Dokumenten basieren, die eines oder mehrere der Dokumentmerkmale mit dem gegebenen Dokument gemeinsam haben, wobei mehrere der anderen Dokumente jeweils verschieden von dem Dokument (und optional jeweils verschieden voneinander) sind. In einigen Implementierungen enthalten das Dokument und/oder die anderen Dokumente zugriffsbeschränkte Dokumente oder sind auf diese beschränkt. Neben der Aufrechterhaltung der Sicherheit während des Suchprozesses bieten Ausführungsformen deutliche Reduktionen des Netzverkehrs für ein Netz als Ganzes, wenn sie auf viele Anwender einer Suchmaschine skaliert werden.

Description

  • Hintergrund
  • Suchmaschinen liefern Informationen über verschiedene Dokumente wie etwa Webseiten, Bilder, Textdokumente, Multimediainhalt und/oder elektronische Kommunikation. Zum Beispiel identifiziert eine Suchmaschine als Antwort auf ein Empfangen einer Suchanfrage ein oder mehrere Dokumente in Antwort auf die Anfrage. Die Suchmaschine stuft die Dokumente basierend auf der Relevanz der Dokumente für die Anfrage und/oder basierend auf anderen Einstufungssignalen ein und liefert entsprechende Suchergebnisse als Antwort auf die Suchanfrage. Die Suchergebnisse können Aspekte von und/oder Links zu den Dokumenten enthalten und können basierend auf den Einstufungen geliefert werden.
  • Zusammenfassung
  • Diese Patentschrift ist auf technische Merkmale gerichtet, die sich auf ein Verwenden von einem oder mehreren Dokumentmerkmalen eines bestimmten Dokuments in Antwort auf eine Anfrage und optional von einem oder mehreren Anfragemerkmalen der Anfrage, um eine Präsentationscharakteristik für ein Präsentieren eines Suchergebnisses, das dem gegebenen Dokument entspricht, zu bestimmen - und ein Bereitstellen des Suchergebnisses zur Präsentation mit der Präsentationscharakteristik als Antwort auf die Anfrage beziehen. In einigen Implementierungen kann das gegebene Dokument in Antwort auf die Anfrage ein zugriffbeschränktes Dokument sein, wie z. B. ein zugriffsbeschränktes Dokument, auf das nur ein Anwender, der die Anfrage abgeschickt hat, und optional andere von diesem Anwender bestimmte Anwender zugreifen können.
  • In einigen Implementierungen können Maße, die dem einen oder den mehreren Dokumentmerkmalen und/oder dem einen oder den mehreren Anfragemerkmalen zugeordnet sind, verwendet werden, um die Präsentationscharakteristik zu bestimmen. Die Maße können auf vergangenen Interaktionen von entsprechenden Anwendern mit anderen Dokumenten basieren, die eines oder mehrere der Dokumentmerkmale mit dem gegebenen Dokument gemeinsam haben, wobei mehrere der anderen Dokumente jeweils verschieden von dem gegebenen Dokument (und optional jeweils verschieden voneinander) sind. Das Verwenden derartiger Maße ermöglicht es, die vergangenen Interaktionen mit anderen Dokumenten beim Bestimmen einer interaktionsbasierten Relevanz des gegebenen Dokuments auszunutzen, und zwar optional ohne Bezugnahme auf irgendwelche anfragebasierten vergangenen Interaktionen, die speziell auf das gegebene Dokument gerichtet sind. In einigen Implementierungen enthalten die anderen Dokumente Dokumente, die selbst zugriffsbeschränkt sind, oder sind auf diese beschränkt. Auf diese Weise kann die Sicherheit während des Suchvorgangs aufrechterhalten werden.
  • Die Präsentationscharakteristik kann zum Beispiel eine Präsentationsreihenfolge oder eine andere Anzeigeprominenz sein. In verschiedenen Ausführungsformen bietet das Bereitstellen der Suchergebnisse zur Präsentation mit der Präsentationscharakteristik die Suchergebnisse in einer Weise, die für den Anwender verglichen mit dem Bereitstellen der Suchergebnisse ohne die Präsentationscharakteristik nützlicher ist. Die Verbesserung ist eher objektiv als subjektiv, da das am höchsten eingestufte oder prominenteste Suchergebnis im Durchschnitt wahrscheinlich ein relevanteres Ergebnis ist. Dies bedeutet, dass Anwender wahrscheinlich weniger Zeit damit verbringen werden, auf andere weniger relevante Suchergebnisse zuzugreifen oder diese zu untersuchen, um festzustellen, ob diese anderen Suchergebnisse tatsächlich von Interesse sind oder nicht. Folglich ist die Anzahl von Anwendereingaben/Auswahlen, die in Bezug auf die Suchergebnisse empfangen werden, im Durchschnitt reduziert. Diese Verringerung der Anwendereingaben/Auswahlen bietet, obwohl sie nicht zwingend in jedem Fall erzielt wird, wenn Suchergebnisse mit einer entsprechenden Präsentationscharakteristik präsentiert werden, eine deutliche Reduzierung des Netzverkehrs für das Netz als Ganzes, wenn sie auf viele Anwender einer Suchmaschine skaliert wird. Zusätzlich kann die Verringerung von weiteren Eingaben/Auswahlen im Durchschnitt die Verwendung von Rechenbetriebsmitteln innerhalb jeder Anwendervorrichtung reduzieren. Derartige Rechenbetriebsmittel können eine Verarbeitungsleistung, die sich aus der Handhabung von Anwendereingaben und der Kommunikation mit dem Netz ergibt, und auch die aus der Einschaltzeit des Bildschirms resultierende Leistungsaufnahme umfassen. Eine Verkürzung der Einschaltzeit des Bildschirms kann daraus resultieren, dass der Anwender seine Suche nach bestimmten Informationen wahrscheinlicher unmittelbar nach dem Empfangen der mit der Präsentationscharakteristik präsentierten Suchergebnisse beenden kann, ohne auf Suchergebnisse, die eigentlich für ihn unnütz sind, zuzugreifen und diese zu untersuchen. Die Bildschirmnutzung kann insbesondere bei mobilen Vorrichtungen einen beträchtlichen Anteil der Leistungsaufnahme von Anwendervorrichtungen ausmachen und daher kann die Verkürzung der Einschaltzeit des Bildschirms besonders vorteilhaft sein.
  • In einigen Implementierungen wird beim Bestimmen einer Präsentationscharakteristik eines Suchergebnisses, das einem gegebenen Dokument in Antwort auf eine Anfrage entspricht, ein anfrageabhängiges Maß für das gegebene Dokument erzeugt und verwendet, um die Präsentationscharakteristik zu bestimmen. In einigen dieser Implementierungen wird das anfrageabhängige Maß verwendet, um eine Punktzahl für das gegebene Dokument zu bestimmen, und diese Punktzahl wird verwendet, um das gegebene Dokument relativ zu anderen Antwortdokumenten für die Anfrage einzustufen (z. B. basierend auf ihren entsprechenden Punktzahlen, die auch auf entsprechenden anfrageabhängigen Maßen basieren können). Zum Beispiel kann das anfrageabhängige Maß verwendet werden, um eine anfängliche Punktzahl für das gegebene Dokument (z. B. eine Punktzahl, die auf einem Übereinstimmungsgrad zwischen der Anfrage und dem gegebenen Dokument basiert) zu modifizieren, und die modifizierte Punktzahl kann verwendet werden, um das gegebene Dokument relativ zu anderen Antwortdokumenten für die Anfrage einzustufen. Die Einstufung kann zum Beispiel verwendet werden, um zu bestimmen, welche Antwortdokumente anfänglich verwendet werden, um entsprechende Suchergebnisse zur Präsentation in Antwort auf die Anfrage bereitzustellen, und/oder um eine Präsentationsreihenfolge (oder eine andere Anzeigeprominenz) für die Suchergebnisse zu bestimmen.
  • In einigen Implementierungen wird das anfrageabhängige Maß für ein gegebenes Dokument in Antwort auf eine Anfrage auf der Basis von Maßen vergangener Interaktionen zwischen Anfragemerkmalen der Anfrage und Dokumentmerkmalen des gegebenen Dokuments bestimmt. Jedes der Maße kann auf einer Menge der vergangenen Interaktionen von entsprechenden Anwendern mit anderen Dokumenten, die eines oder mehrere der Dokumentmerkmale aufweisen, basieren, wenn die anderen Dokumente als Antwort auf entsprechende Anfragen mit einem oder mehreren der Anfragemerkmale präsentiert wurden. Verschiedene vergangene Interaktionen können verwendet werden, um die Maße zu bestimmen, wie z. B. Auswahlen von Suchergebnissen, die den anderen Dokumenten entsprechen, als Antwort auf die entsprechenden Anfragen (z. B. ein Angeklickt-zu-betrachtet-Bruchteil), Dokumentzugriffszahlen, eine Cursorverfolgung und/oder Berührungsgesten. In einigen Implementierungen können die anderen Dokumente selbst mehrere zugriffsbeschränkte Dokumente wie z. B. nicht zugängliche Dokumente, die jeweils für einen entsprechenden der anderen Anwender persönlich sind und auf die der Anwender nicht zugreifen kann, enthalten oder auf diese beschränkt sein.
  • In einigen Implementierungen wird ein anfrageunabhängiges Maß für das gegebene Dokument erzeugt und zusätzlich oder alternativ dazu verwendet, die Präsentationscharakteristik zu bestimmen. In einigen dieser Implementierungen basiert das anfrageunabhängige Maß auf Maßen vergangener Interaktionen durch entsprechende Anwender mit anderen Dokumenten, die ein oder mehrere der Dokumentmerkmale des gegebenen Dokuments aufweisen, wenn die anderen Dokumente als Antwort auf entsprechende Anfragen, die keines der Anfragemerkmale enthalten, präsentiert wurden. Dementsprechend kann das anfrageunabhängige Maß eine Angabe der allgemeinen Beliebtheit von Dokumenten mit dem einen oder den mehreren Dokumentmerkmalen liefern, während das anfrageabhängige Maß eine der Beliebtheit von Dokumenten mit dem einen oder den mehreren Dokumentmerkmalen als Antwort auf Anfragen, die die Anfragemerkmale aufweisen, liefert.
  • In einigen Implementierungen ist ein Verfahren bereitgestellt, das ein Empfangen einer Anfrage umfasst, die von einem Anwender über eine Anwenderschnittstellen-Eingabevorrichtung einer Rechenvorrichtung des Anwenders eingegeben wird. Das Verfahren umfasst ferner ein Identifizieren von Antwortdokumenten in Antwort auf die Anfrage einschließlich einer an eine E-Mail-Adresse des Anwenders gesendeten E-Mail. Das Verfahren umfasst ferner ein Identifizieren eines oder mehrerer Dokumentmerkmale für die E-Mail. Die Dokumentmerkmale umfassen mindestens ein E-Mail-Merkmal, das auf mindestens einem der folgenden Elemente basiert: Absenderinhalt, der auf seiner Anwesenheit in einem Absenderfeld der E-Mail basiert, und Betreff-Inhalt, der auf seiner Anwesenheit in einem Betrefffeld der E-Mail basiert. Das Verfahren umfasst ferner ein Identifizieren eines oder mehrerer Anfragemerkmale für die Anfrage und ein Erzeugen eines anfrageabhängigen Maßes für die E-Mail auf der Basis von Maßen vergangener Interaktionen zwischen den Anfragemerkmalen und den Dokumentmerkmalen, wobei jedes mehrerer Maße auf einer Menge der vergangenen Interaktionen durch entsprechende Anwender mit anderen Dokumenten, die eines oder mehrere der Dokumentmerkmale aufweisen, basiert, wenn die anderen Dokumente als Antwort auf entsprechende Anfragen mit einem oder mehreren der Anfragemerkmale präsentiert wurden. Das Verfahren umfasst ferner: Verwenden des anfrageabhängigen Maßes für die E-Mail, um eine Präsentationscharakteristik zum Präsentieren eines E-Mail-Suchergebnisses, das der E-Mail entspricht, zu bestimmen; und Bereitstellen des E-Mail-Suchergebnisses zur Präsentation mit der Präsentationscharakteristik als Antwort auf die Anfrage.
  • Dieses Verfahren und andere Implementierungen der hierin offenbarten Technologie können jeweils optional eines oder mehrere der folgenden Merkmale umfassen.
  • In einigen Implementierungen basiert das mindestens eine E-Mail-Merkmal sowohl auf dem Absenderinhalt in dem Absenderfeld als auch auf dem Betreffinhalt in dem Betrefffeld. In einigen dieser Implementierungen ist das mindestens eine E-Mail-Merkmal ein gemeinsames Auftreten des Betreffinhalts in dem Absenderfeld und des Betreffinhalts in dem Betrefffeld. Der Absenderinhalt kann einen Domain-Namen einer Absender-E-Mail-Adresse der E-Mail enthalten und/oder der Betreffinhalt kann eine Schablone enthalten, die einen oder mehrere Begriffe und einen oder mehrere Platzhalter enthält.
  • In einigen Implementierungen basiert das mindestens eine E-Mail-Merkmal auf dem Betreffinhalt in dem Betrefffeld und der Betreffinhalt enthält eine Schablone, die einen oder mehrere Begriffe und einen oder mehrere Platzhalter enthält.
  • In einigen Implementierungen schließen die anderen Dokumente, auf denen die Maße basieren, die E-Mail aus.
  • In einigen Implementierungen umfasst das Verfahren ferner: Erzeugen eines anfrageunabhängigen Maßes für die E-Mail auf der Basis von zusätzlichen Maßen von zusätzlichen vergangenen Interaktionen mit den Dokumentmerkmalen als Antwort auf zusätzliche Anfragen, die keines der Anfragemerkmale aufweisen; und ferner Verwenden der anfrageunabhängigen Maße für die E-Mail, um die Präsentationscharakteristik zum Präsentieren des E-Mail-Suchergebnisses, das der E-Mail entspricht, zu bestimmen.
  • In einigen Implementierungen umfasst das Verwenden des anfrageabhängigen Maßes für die E-Mail, um die Präsentationscharakteristik zu bestimmen, Folgendes: Bestimmen einer Punktzahl für die E-Mail basierend auf dem anfrageabhängigen Maß; Bestimmen zusätzlicher Punktzahlen für andere der Antwortdokumente; Einstufen der E-Mail relativ zu den anderen der Antwortdokumente basierend auf der Punktzahl und den zusätzlichen Punktzahlen; und Bestimmen der Präsentationscharakteristik basierend auf der Einstufung.
  • In einigen Implementierungen enthalten die Dokumentmerkmale ferner eine Kategorie der E-Mail. In einigen dieser Implementierungen umfasst das Verfahren ferner ein Verwenden eines maschinellen Lernmodells zum Bestimmen der Kategorie der E-Mail.
  • In einigen Implementierungen umfassen die vergangenen Interaktionen mit anderen Dokumenten, die eines oder mehrere der Dokumentmerkmale aufweisen, Auswahlen der anderen Dokumente.
  • In einigen Implementierungen ist ein Verfahren bereitgestellt, das ein Empfangen einer von einem Anwender eingegebenen Anfrage über eine Anwenderschnittstellen-Eingabevorrichtung einer Rechenvorrichtung des Anwenders und ein Identifizieren von Antwortdokumenten in Antwort auf die Anfrage umfasst. Die Antwortdokumente umfassen zugriffsbeschränkte Dokumente des Anwenders. Auf die zugriffsbeschränkten Dokumente kann nur durch den Anwender und eine beliebige beschränkte Gruppe von anderen Anwendern, die von dem Anwender festgelegt werden, zugegriffen werden. Das Verfahren umfasst ferner ein Identifizieren eines oder mehrerer Anfragemerkmale für die Anfrage, und für jedes von mehreren der zugriffsbeschränkten Dokumente: Identifizieren eines oder mehrerer Dokumentmerkmale für das zugriffsbeschränkte Dokument; und Erzeugen eines anfrageabhängigen Maßes für das zugriffsbeschränkte Dokument auf der Basis von Maßen vergangener Interaktionen zwischen den Anfragemerkmalen und den Dokumentmerkmalen, wobei jedes der Maße auf einer Menge der vergangenen Interaktionen durch entsprechende Anwender mit anderen Dokumenten, die eines oder mehrere der Dokumentmerkmale aufweisen, basiert, wenn die anderen Dokumente als Antwort auf entsprechende Anfragen, die eines oder mehrere der Anfragemerkmale aufweisen, präsentiert wurden, und wobei die anderen Dokumente optional mehrere nicht zugängliche Dokumente umfassen können, auf die der Anwender nicht zugreifen kann. Das Verfahren umfasst ferner ein Verwenden der anfrageabhängigen Maße für die zugriffsbeschränkten Dokumente, um eine Präsentationsreihenfolge für die Antwortdokumente zu bestimmen, und ein bereitstellen eines oder mehrerer der Antwortdokumente zur Präsentation basierend auf der Präsentationsreihenfolge als Antwort auf die Anfrage.
  • Dieses Verfahren und andere Implementierungen der hierin offenbarten Technologie können jeweils optional eines oder mehrere der folgenden Merkmale umfassen.
  • In einigen Implementierungen umfassen die Dokumentmerkmale für das zugriffsbeschränkte Dokument eine Schablone, die in einem bestimmten Feld des zugriffsbeschränkten Dokuments enthalten ist.
  • In einigen Implementierungen schließen die anderen Dokumente eines oder mehrere der zugriffsbeschränkten Dokumente aus.
  • In einigen Implementierungen bestehen die anderen Dokumente, auf denen ein bestimmtes Maß der Maße basiert, aus nicht zugänglichen Dokumenten, auf die der Anwender nicht zugreifen kann.
  • In einigen Implementierungen umfasst das Verfahren ferner: für jedes der zugriffsbeschränkten Dokumente, Erzeugen eines anfrageunabhängigen Maßes für das zugriffsbeschränkte Dokument basierend auf zusätzlichen Maßen zusätzlicher vergangener Interaktionen mit den Dokumentmerkmalen als Antwort auf zusätzliche Anfragen, die keines der Anfragemerkmale aufweisen; und ferner Verwenden der anfrageunabhängigen Maße für die zugriffsbeschränkten Dokumente, um die Präsentationsreihenfolge für die Antwortdokumente zu bestimmen.
  • In einigen Implementierungen ist ein Verfahren bereitgestellt, das ein Empfangen einer von einem Anwender eingegebenen Anfrage über eine Anwenderschnittstellen-Eingabevorrichtung einer Rechenvorrichtung des Anwenders, ein Identifizieren von Antwortdokumenten in Antwort auf die Anfrage und ein Identifizieren einer oder mehrerer Anfragemerkmale für die Anfrage umfasst. Das Verfahren umfasst ferner für jedes mehrerer der Dokumente: Identifizieren eines oder mehrerer Dokumentmerkmale für das Dokument und Erzeugen eines anfrageabhängigen Maßes für das Dokument auf der Basis von Maßen vergangener Interaktionen zwischen den Anfragemerkmalen und den Dokumentmerkmalen, wobei jedes der Maße auf einer Menge der vergangenen Interaktionen von entsprechenden Anwendern mit anderen Dokumenten, die eines oder mehrere der Dokumentmerkmale aufweisen, basiert, wenn die anderen Dokumente als Antwort auf entsprechende Anfragen, die eines oder mehrere der Anfragemerkmale aufweisen, präsentiert wurden, und wobei die anderen Dokumente mehrere Dokumente enthalten, die zusätzlich zu dem Dokument vorhanden sind. Das Verfahren umfasst ferner ein Verwenden der anfrageabhängigen Maße für die Dokumente, um eine Präsentationsreihenfolge für die Antwortdokumente zu bestimmen, und ein Bestimmen eines oder mehrerer der Antwortdokumente zur Präsentation basierend auf der Präsentationsreihenfolge als Antwort auf die Anfrage.
  • In einigen Implementierungen ist ein Verfahren bereitgestellt, das umfasst: Auswählen mehrerer Dokumentmerkmale und Auswählen mehrerer Anfragemerkmale. Das Auswählen jedes der Dokumentmerkmale umfasst ein Auswählen des Dokumentmerkmals basierend auf seinem Auftreten in zugriffsbeschränkten Dokumenten von mindestens einer Schwellenmenge von Anwendern. Das Auswählen jedes der Anfragemerkmale umfasst ein Auswählen des Anfragemerkmals basierend auf seinem Auftreten in zugriffsbeschränkten Anfragen von mindestens einer Schwellenanzahl von Anwendern. Die zugriffsbeschränkten Anfragen sind diejenigen, für die mindestens eines der zugriffsbeschränkten Dokumente als Antwort bereitgestellt wurde. Das Verfahren umfasst ferner für jedes mehrerer Tupel Anfragemerkmal, Dokumentmerkmal, die jeweils mindestens eines der Anfragemerkmale und mindestens eines der Dokumentmerkmale enthalten: Erzeugen eines Vergangenheitsinteraktionsmaßes zwischen den Anfragemerkmalen und den Dokumentmerkmalen des Tupels Anfragemerkmal, Dokumentmerkmal. Das Erzeugen des Vergangenheitsinteraktionsmaßes basiert auf einer Menge vergangener Interaktionen mit entsprechenden Dokumenten der zugriffsbeschränkten Dokumente, wenn die entsprechenden Dokumente als Antwort auf entsprechende Anfragen der zugriffsbeschränkten Anfragen präsentiert wurden, wobei die entsprechenden Dokumente die Dokumentmerkmale des Tupels Anfragemerkmal, Dokumentmerkmal aufweisen und wobei die entsprechenden Anfragen das Anfragemerkmal des Tupels Anfragemerkmal, Dokumentmerkmal aufweisen. Das Verfahren umfasst ferner ein Speichern jedes der Vergangenheitsinteraktionsmaße in Verbindung mit einem entsprechenden Tupel Anfragemerkmal, Dokumentmerkmal in einem oder mehreren computerlesbaren Medien.
  • Dieses Verfahren und andere Implementierungen der hierin offenbarten Technologie können jeweils optional eines oder mehrere der folgenden Merkmale umfassen.
  • In einigen Implementierungen umfasst das Verfahren ferner: Identifizieren eines neuen Dokuments in Antwort auf eine neue Anfrage eines bestimmten Anwenders, das eine neue Anfragegruppe der Dokumentmerkmale umfasst; und Erzeugen eines Maßes für das neue Dokument basierend auf einer Gruppe der Vergangenheitsinteraktionsmaße. Die Gruppe der Vergangenheitsinteraktionsmaße kann auf der Basis der Vergangenheitsinteraktionsmaße der Gruppe ausgewählt werden, die in Verbindung mit den Tupeln Anfragemerkmal, Dokumentmerkmal gespeichert wird, die jeweils mindestens eines der Dokumentmerkmale der neuen Anfragegruppe enthalten. Das Verfahren umfasst ferner ein Bereitstellen des neuen Dokuments als Antwort auf die neue Anfrage basierend auf dem Maß. In einigen dieser Implementierungen wird die Gruppe der Vergangenheitsinteraktionsmaße ferner basierend auf den Vergangenheitsinteraktionsmaßen der Gruppe ausgewählt, die in Verbindung mit den Tupeln Anfragemerkmal, Dokumentmerkmal gespeichert werden, die jeweils mindestens ein Anfragemerkmal der neuen Anfrage enthalten. In einigen Implementierungen wird das neue Dokument aus den zugriffsbeschränkten Dokumenten ausgeschlossen, die beim Erzeugen der Vergangenheitsinteraktionsmaße verwendet wurden.
  • In einigen Implementierungen ist ein Verfahren bereitgestellt, das ein Auswählen mehrerer Dokumentmerkmale und ein Auswählen mehrerer Anfragemerkmale umfasst. Das Verfahren umfasst ferner für jedes mehrerer Tupel Anfragemerkmal, Dokumentmerkmal, die jeweils mindestens eines der Anfragemerkmale und mindestens eines der Dokumentmerkmale enthalten: Erzeugen eines Vergangenheitsinteraktionsmaßes zwischen den Anfragemerkmalen und den Dokumentmerkmalen des Tupels Anfragemerkmal, Dokumentmerkmal, wobei: das Erzeugen des Vergangenheitsinteraktionsmaßes auf einer Menge vergangener Interaktionen mit entsprechenden Dokumenten basiert, wenn die entsprechenden Dokumente als Antwort auf entsprechende Anfragen präsentiert wurden; die entsprechenden Dokumente die Dokumentmerkmale des Tupels Anfragemerkmal, Dokumentmerkmal aufweisen; und die entsprechenden Anfragen das Anfragemerkmal des Tupels Anfragemerkmal, Dokumentmerkmal aufweisen. Das Verfahren umfasst ferner ein Speichern jedem der Vergangenheitsinteraktionsmaße in Verbindung mit einem entsprechenden Tupel Anfragemerkmal, Dokumentmerkmal in einem oder mehreren computerlesbaren Medien.
  • Andere Implementierungen können ein oder mehrere nicht transitorische computerlesbare Speichermedien enthalten, die Befehle speichern, die von einem oder mehreren Prozessoren ausführbar sind, um ein Verfahren wie etwa eines oder mehrere der hierin beschriebenen Verfahren auszuführen. Wieder eine andere Implementierung kann ein System umfassen, das einen Speicher und einen oder mehrere Prozessoren, die betreibbar sind, um Befehle auszuführen, die in dem Speicher gespeichert sind, um ein Verfahren wie eines oder mehrere der hierin beschriebenen Verfahren durchzuführen, enthält.
  • Es sollte beachtet werden, dass alle Kombinationen der vorangehenden Konzepte und zusätzlicher Konzepte, die hierin ausführlicher beschrieben sind, als Teil des hierin offenbarten Gegenstands betrachtet werden. Zum Beispiel werden alle Kombinationen von beanspruchten Gegenständen, die am Ende dieser Offenbarung auftauchen, als Teil des hier offenbarten Gegenstands betrachtet.
  • Figurenliste
    • 1 ist ein Blockdiagramm einer beispielhaften Umgebung, in der einige hier offenbarte Implementierungen implementiert werden können.
    • 2A zeigt eine Darstellung eines Teils eines Anfrage-Dokument-Modells gemäß verschiedenen Implementierungen.
    • 2B zeigt eine Darstellung eines Teils eines Anfrage-Merkmal-Modells gemäß verschiedenen Implementierungen.
    • 2C zeigt eine Darstellung eines Teils eines Dokument-Merkmal-Modells gemäß verschiedenen Implementierungen.
    • 2D zeigt eine Darstellung eines Teils eines Anfragemerkmal-Dokumentmerkmal-Modells gemäß verschiedenen Implementierungen.
    • 3 zeigt ein Beispiel von mehreren zugriffsbeschränkten Dokumenten mehrerer Anwender.
    • 4 ist ein Ablaufdiagramm, das ein beispielhaftes Verfahren zum Erzeugen von Vergangenheitsinteraktionsmaßen für jedes von mehreren Tupeln Anfragemerkmal, Dokumentmerkmal zeigt.
    • 5 ist ein Ablaufdiagramm, das ein beispielhaftes Verfahren zum Verwenden anfrageabhängiger und/oder anfrageunabhängiger Maße von Dokumenten in Antwort auf eine Anfrage, um die Dokumente einzustufen, und zum Bereitstellen der entsprechenden Suchergebnisse basierend auf der Einstufung.
    • 6 veranschaulicht eine beispielhafte Clientrechenvorrichtung mit einem Anzeigebildschirm, der zugriffsbeschränkte Suchergebnisse mit Präsentationscharakteristiken anzeigt, die gemäß hierin offenbarten Implementierungen bestimmt werden.
    • 7 zeigt eine beispielhafte Architektur einer Rechenvorrichtung.
  • Genaue Beschreibung
  • Einige hierin offenbarte Implementierungen können auf einen Zugriff auf zugriffsbeschränkte Dokumente anwendbar sein. Wie hierin verwendet ist ein „zugriffsbeschränktes Dokument“ einem öffentlich zugänglichen Dokument (z. B. frei zugänglich für die Öffentlichkeit über das World Wide Web) gegenübergestellt und ist ein elektronisches Dokument, auf das von einer beschränkten Gruppe von Anwendern zugegriffen werden kann. In einigen Implementierungen kann der Zugriff auf ein zugriffsbeschränktes Dokument basierend auf den Anmeldeinformationen der beschränkten Gruppe von Anwendern, basierend darauf, dass das zugriffsbeschränkte Dokument über ein privates Netz zugänglich ist, auf das nur die beschränkte Gruppe von Anwendern zugreifen kann, und/oder basierend auf anderen Techniken auf die beschränkte Gruppe von Anwendern beschränkt werden. Wie hierin verwendet, ist ein „zugriffsbeschränktes Dokument eines Anwenders“ ein zugriffsbeschränktes Dokument, auf das nur der Anwender und optional eine beschränkte Gruppe von einem oder mehreren anderen Anwendern zugreifen kann, die von dem Anwender festgelegt werden oder anderweitig gesteuert werden kann. Beispielsweise kann ein zugriffsbeschränktes Dokument eines Anwenders in Abhängigkeit von Folgendem nur für den Anwender zugänglich sein: ob es lokal auf einer von dem Anwender gesteuerten Rechenvorrichtung gespeichert ist, ob auf es über eine oder mehrere Computeranwendungen mittels geeigneter Anmeldeberechtigungsnachweise des Anwenders zugegriffen werden kann, usw. Zum Beispiel können E-Mails des Anwenders zugriffsbeschränkte Dokumente des Anwenders sein, auf die nur der Anwender mittels geeigneter Anmeldeberechtigungsnachweise des Anwenders zugreifen kann. Zum Beispiel können heterogene Dokumente eines Anwenders, die in einem Cloud-basierten Speichersystem gespeichert sind, zugriffsbeschränkte Dokumente des Anwenders sein, auf die nur der Anwender über geeignete Anmeldeberechtigungsnachweise des Anwenders zugreifen kann. Optional kann auf eine oder mehrere der heterogenen Dokumente auch eine beschränkte Gruppe anderer Anwender zugreifen, und zwar basierend auf einer expliziten Autorisierung durch den Anwender über eine oder mehrere Computeranwendungen. Zum Beispiel können verschiedene Dokumente, die lokal auf einem Mobiltelefon, Tablet, Desktop und/oder anderen Computervorrichtungen eines Anwenders gespeichert sind, zugriffsbeschränkte Dokumente des Anwenders sein, weil sie lokal auf der einen oder den mehreren Rechenvorrichtungen des Anwenders gespeichert sind.
  • Anwenderinteraktionsdaten (z. B. eine Klickrate) sind verwendet worden, um bestimmte öffentlich zugängliche Suchergebnisdokumente für bestimmte Anfragen einzustufen. Zum Beispiel können Anwenderinteraktionsdaten angeben, dass für eine bestimmte Suchanfrage ein bestimmtes öffentlich zugängliches Suchergebnisdokument in Antwort auf die bestimmte Suchanfrage eine Klickrate für diese bestimmte Suchanfrage aufweist, die weit über die anderer öffentlich zugängliche Suchergebnisdokumente in Antwort auf die bestimmte Suchanfrage hinausgeht. Basierend auf einer solchen Angabe kann ein Suchergebnis, das dem bestimmten öffentlich zugänglichen Suchergebnisdokument entspricht, für die bestimmte Suchanfrage prominenter eingestuft werden (z. B. zur prominenteren Präsentation vorgesehen werden) als Suchergebnisse für die anderen öffentlich zugänglichen Antwort-Suchergebnisdokumente.
  • Jedoch können verschiedene Techniken, die sich auf die Verwendung von Anwenderinteraktionsdaten beziehen, um öffentlich zugängliche Suchergebnisse für bestimmte Anfragen zu bewerten, möglicherweise nicht auf verschiedene Dokumente anwendbar sein und/oder nicht das gewünschte Leistungsvermögen bereitstellen. Zum Beispiel können verschiedene Techniken nicht auf verschiedene zugriffsbeschränkte Dokumente (z. B. auf zugriffsbeschränkte Dokumente eines Anwenders, der eine Anfrage übermittelt) und/oder auf verschiedene öffentlich zugängliche Dokumente (z. B. öffentlich zugängliche Dokumente, die keine und/oder relativ wenige Interaktionen als Antwort auf Anfragen aufweisen) angewendet werden.
  • Als ein Beispiel sei angenommen, dass ein Anwender eine Suchanfrage zum Durchsuchen der persönlichen E-Mail des Anwenders übermittelt und dass mehrere Antwort-E-Mails (d. h. zugriffsbeschränkte Dokumente des Anwenders) als Antwort auf die Suchanfrage identifiziert werden (z. B. enthalten die E-Mails einen oder mehrere Begriffe, die mit einem oder mehreren Begriffen der Suchanfrage übereinstimmen). Es kann der Fall sein, dass eine oder mehrere (z. B. alle) der Antwort-E-Mails niemals als Antwort auf vorherige Suchen anderer Anwender und/oder des Anwenders präsentiert worden sind und/oder niemals damit interagiert worden ist. Beispielsweise kann eine bestimmte E-Mail eine E-Mail sein, die nur an den Anwender gesendet wurde und mit der der Anwender zuvor noch nie als Antwort auf eine vorherige Suchanfrage interagiert hat. Dementsprechend gibt es möglicherweise keine Anwenderinteraktionsdaten, die der bestimmten E-Mail zugeordnet sind, wodurch verschiedene Techniken, die sich auf die Verwendung von Anwenderinteraktionsdaten zum Einstufen öffentlich zugänglicher Suchergebnisse beziehen, für die Einstufung der bestimmten E-Mail unwirksam werden.
  • Als weiteres Beispiel sei angenommen, dass ein Anwender eine Suchanfrage zum Durchsuchen eines Korpus von zugriffsbeschränkten Dokumenten, die für eine beschränkte Gruppe von Anwendern zugänglich sind, durchführt und dass mehrere Antwortdokumente als Antwort auf die Suchanfrage identifiziert werden. Es kann der Fall sein, dass ein oder mehrere (z. B. alle) der Antwortdokumente niemals als Antwort auf vorherige Einreichungen der Suchanfrage präsentiert worden sind und/oder niemals damit interagiert worden ist und/oder als Antwort auf vorherige Einreichungen der Suchanfrage nur in vernachlässigbar Quantität präsentiert worden sind und/oder damit nur in vernachlässigbar Quantität interagiert worden ist. Dementsprechend sind möglicherweise nicht genügend Anwenderinteraktionsdaten als Antwort auf die Suchanfrage, die solchen Dokumenten zugeordnet sind, vorhanden, wodurch verschiedene Techniken, die sich auf die Verwendung von Anwenderinteraktionsdaten zum Einstufen von öffentlich zugänglichen Suchergebnissen beziehen, für die Einstufung solcher Dokumente unwirksam werden.
  • Als nochmals weiteres Beispiel sei angenommen, dass ein Anwender eine Suchanfrage zum Durchsuchen eines Korpus von öffentlich zugänglichen Dokumenten übermittelt und dass mehrere Antwortdokumente als Antwort auf die Suchanfrage identifiziert werden. Es kann der Fall sein, dass ein oder mehrere (z. B. alle) der Antwortdokumente niemals als Antwort auf vorherige Einreichungen der Suchanfrage präsentiert worden sind und/oder niemals damit interagiert worden ist und/oder als Antwort auf vorherige Einreichungen der Suchanfrage nur in vernachlässigbar Quantität präsentiert worden sind und/oder damit nur in vernachlässigbar Quantität interagiert worden ist. Dementsprechend sind möglicherweise nicht genügend Anwenderinteraktionsdaten als Antwort auf die Suchanfrage, die solchen Dokumenten zugeordnet sind, vorhanden, wodurch verschiedene Techniken, die sich auf die Verwendung von Anwenderinteraktionsdaten zum Einstufen von öffentlich zugänglichen Suchergebnissen beziehen, für die Einstufung solcher Dokumente unwirksam werden.
  • Diese Beschreibung stellt verschiedene technische Merkmale vor, die sich auf ein Verwenden von einem oder mehreren Dokumentmerkmalen eines Dokuments in Antwort auf eine Anfrage und optional ein oder mehrere Anfragemerkmale der Anfrage, um eine Präsentationscharakteristik zum Präsentieren eines Suchergebnisses zu bestimmen, das dem Dokument entspricht - und, als Antwort auf die Anfrage, ein Bereitstellen des Suchergebnisses zur Präsentation mit der Präsentationscharakteristik beziehen. Dem einen oder den mehreren Dokumentmerkmalen und/oder dem einen oder den mehreren Anfragemerkmalen zugeordnete Maße können dazu verwendet werden, um das Präsentationsmerkmal zu bestimmen. Die Maße können auf vergangenen Interaktionen von entsprechenden Anwendern mit anderen Dokumenten, die eines oder mehrere der Dokumentmerkmale mit dem Dokument gemeinsam haben, basieren, wobei mehrere der anderen Dokumente jeweils von dem Dokument verschieden sind (und optional jeweils voneinander verschieden sind). Das Verwenden derartiger Maße ermöglicht es, die vergangenen Interaktionen mit anderen Dokumenten beim Bestimmen einer interaktionsbasierten Relevanz des zugriffsbeschränkten Dokuments auszunutzen, und zwar optional ohne Bezugnahme auf irgendwelche vergangenen Interaktionen, die speziell auf das zugriffsbeschränkte Dokument gerichtet sind. In einigen Implementierungen enthalten die anderen Dokumente Dokumente, die selbst zugriffsbeschränkt sind, oder sind auf diese beschränkt.
  • In einigen Implementierungen wird beim Bestimmen einer Präsentationscharakteristik eines Suchergebnisses, das einem Dokument in Antwort auf eine Anfrage entspricht, ein anfrageabhängiges Maß für das zugriffsbeschränkte Dokument erzeugt und verwendet, um die Präsentationscharakteristik zu bestimmen. In einigen dieser Implementierungen basiert das anfrageabhängige Maß auf Vergangenheitsinteraktionsmaßen zwischen Anfragemerkmalen der Anfrage und Dokumentmerkmalen des Dokuments. Jedes der Maße kann auf einer Menge der vergangenen Interaktionen von entsprechenden Anwendern mit anderen Dokumenten, die eines oder mehrere der Dokumentmerkmale aufweisen, basieren, wenn die anderen Dokumente als Antwort auf entsprechende Anfragen mit einem oder mehreren der Anfragemerkmale präsentiert wurden.
  • Als Beispiel sei angenommen, dass ein Anwender eine E-Mail-Suchschnittstelle verwendet, um eine Anfrage einer „Buchbestellnummer“ abzuschicken. Ein Korpus der E-Mails des Anwenders, bei denen es sich jeweils um zugriffsbeschränkte Dokumente des Anwenders handelt, kann durchsucht werden und es können mehrere Antwort-E-Mails als Antwort auf die Anfrage identifiziert werden. Eine bestimmte Antwort-E-Mail kann von „store@exampleurl.com“ stammen, kann als Betreff der „Bestätigung der Bestellung 1A2B3C“ enthalten und kann einen Textkörper mit Inhalt enthalten, der ein bestimmtes von dem Anwender erworbenes Buch zusammen mit Details zum Kauf. (z. B. Kaufdatum, Lieferadresse, Lieferdatum, Kosten) identifiziert. Mit der bestimmten Antwort-E-Mail wurde möglicherweise nie von anderen Anwendern als Antwort auf Anfragen der anderen Anwender interagiert (d. h., da sie für den Anwender persönlich ist und für die anderen Anwender nicht zugänglich ist) - und mit ihr wurde möglicherweise selbst von dem Anwender niemals als Antwort auf eine Anfrage des Anwenders interagiert. Die hierin beschriebenen Techniken können jedoch trotzdem verwendet werden, um ein anfrageabhängiges Maß für die bestimmte E-Mail auf der Basis von Vergangenheitsinteraktionsmaßen zwischen Anfragemerkmalen der Anfrage „Buchbestellnummer“ und Dokumentmerkmalen der bestimmten E-Mail zu bestimmen.
  • Zum Beispiel kann ein erstes Vergangenheitsinteraktionsmaß basierend auf einer Menge von Interaktionen von mehreren Anwendern mit anderen E-Mails bestimmt werden, die „store@exampleurl.com“ in einem Absenderfeld und „Bestätigung der Bestellung [#]“ (wobei [#] ein Platzhalter ist, der eine alphabetische und/oder numerische Zeichenfolge angibt) in einem Betrefffeld aufweisen, wenn diese anderen E-Mails als Antwort auf entsprechende Anfragen mit N-Gramm „Buchbestellung“ präsentiert wurden. Zum Beispiel kann ein zweites Interaktionsmaß auf der Basis einer Interaktionsmenge von mehreren Anwendern mit anderen E-Mails bestimmt werden, die „store@exampleurl.com“ in einem Absenderfeld und „Bestätigung der Bestellung [#]“ in einem Betrefffeld enthalten, wenn diese anderen E-Mails als Antwort auf entsprechende Anfragen mit N-Grammen von „Bestellnummer“ präsentiert wurden. Das anfrageabhängige Maß kann basierend auf dem ersten Maß, dem zweiten Maß und optional anderen ähnlich bestimmten Maßen erzeugt werden. Zum Beispiel kann das anfrageabhängige Maß eine Summe, ein Durchschnitt, ein Median oder eine andere statistische Kombination der Maße sein.
  • Das anfrageabhängige Maß kann verwendet werden, um eine Präsentationscharakteristik für die bestimmte Antwort-E-Mail zu bestimmen. Zum Beispiel kann das anfrageabhängige Maß verwendet werden, um eine anfängliche Punktzahl für die bestimmte Antwort-E-Mail (z. B. eine Punktzahl, die auf einem Übereinstimmungsgrad zwischen der Anfrage und der bestimmten E-Mail basiert) zu modifizieren, und die Punktzahl kann verwendet werden, um die bestimmte E-Mail relativ zu anderen Antwort-E-Mails einzustufen (z. B. basierend auf optional modifizierten anfänglichen Punktzahlen für diese E-Mails). Die Einstufung kann beispielsweise verwendet werden, um zu bestimmen, welche Antwort-E-Mails anfänglich beim Bereitstellen entsprechender Suchergebnisse zur Präsentation als Antwort auf die Anfrage verwendet werden, um eine Präsentationsreihenfolge (oder eine andere Anzeigeprominenz) für die Suchergebnisse zu bestimmen und/oder zusätzliche oder alternative Präsentationscharakteristiken für Suchergebnisse zu bestimmen.
  • In einigen Implementierungen wird ein anfragenunabhängiges Maß für das Dokument erzeugt und zusätzlich oder alternativ dazu verwendet, um die Präsentationscharakteristik zu bestimmen. In einigen dieser Implementierungen basiert das anfragenunabhängige Maß auf Maßen vergangener Interaktionen durch entsprechende Anwender mit anderen Dokumenten, die eines oder mehrere der Dokumentmerkmale des Dokuments aufweisen, wenn die anderen Dokumente als Antwort auf entsprechende Anfragen präsentiert wurden, wobei diese Anfragen diejenigen Anfragen umfassen, die keines der Anfragemerkmale enthalten, oder auf diese beschränkt sind. Dementsprechend kann das anfrageunabhängige Maß eine Angabe der allgemeinen Beliebtheit von Dokumenten mit dem einen oder den mehreren Dokumentmerkmalen liefern, während das anfrageabhängige Maß eine Angabe der Beliebtheit von Dokumenten mit dem einen oder den mehreren Dokumentmerkmalen als Antwort auf Anfragen mit den Anfragemerkmalen liefert.
  • In einigen Implementierungen können ein anfrageabhängiges Maß und/oder ein anfrageunabhängiges Maß eines Dokuments basierend auf einem Anfragemerkmal-Dokumentmerkmal-Modell erzeugt werden. Das Anfragemerkmal-Dokumentmerkmal-Modell kann auf der Basis eines Anfrage-Dokument-Modells, eines Dokument-Merkmal-Modells und/oder eines Anfrage-Merkmal-Modells erzeugt werden.
  • Das Anfrage-Dokument-Modell kann beispielsweise ein bipartiter Graph sein, der die Interaktionen zwischen Anfragen und Dokumenten modelliert, wie durch eine oder mehrere gespeicherte Aufzeichnungen vergangener Anfragen und entsprechender Interaktionen angegeben sind. Beispielsweise können die Knoten des Anfrage-Dokument-Graphen Anfragen und Dokumente angeben. Die Kanten können zwischen Anfrage- und Dokumentknoten liegen und können beispielsweise jeweils repräsentieren, ob das entsprechende Dokument für die entsprechende Anfrage beobachtet wurde (z. B. ein entsprechendes Suchergebnis als Antwort auf die entsprechende Anfrage präsentiert wurde) und/oder ob mit dem Dokument für die entsprechende Anfrage interagiert wurde (z. B. Auswahl eines entsprechenden Suchergebnisses).
  • Das Dokument-Merkmal-Modell kann zum Beispiel ein bipartiter Graph sein, der die Beziehung zwischen Dokumenten und ihren Dokumentmerkmalen modelliert. Verschiedene Merkmale wie z. B. Kategoriemerkmale, Strukturmerkmale und/oder N-Gramm-Merkmale können verwendet werden. Zum Beispiel können Kategoriemerkmale eines Dokuments eine oder mehrere Kategorien angeben, zu denen das Dokument gehört, und können beispielsweise darauf basieren, dass Merkmale des Dokuments auf einen Klassifizierer oder ein anderes maschinelles Lernmodell angewendet werden und die Kategoriemerkmale basierend auf der über das maschinelle Lernmodell erzeugten Ausgabe bestimmt werden. Als ein Beispiel für Kategorien können E-Mails zu Finanzen, Reisen, Bestellbestätigungen und/oder anderen Kategorien gehören. Strukturmerkmale können Schablonen und/oder andere Inhalte von bestimmten strukturellen Feldern von Dokumenten angeben. Zum Beispiel können strukturelle Merkmale für E-Mails oder andere elektronische Kommunikation umfassen: Absenderinhalt, der in einem Absenderfeld der elektronischen Kommunikation enthalten ist (z. B. ein Domänenname der E-Mail-Adresse des Absenders, eine Beziehung des Absenders zu dem Anwender), Betreffinhalt, der in einem Betrefffeld der elektronischen Kommunikation enthalten ist (z. B. eine bestimmte Schablone, der das Betrefffeld entspricht, z. B. „Bestätigung der Bestellung [#]“), und/oder ein gemeinsames Auftreten von bestimmtem Absenderinhalt und bestimmtem Betreffinhalt (d. h., der Absenderinhalt und der Betreffinhalt treten beide in ihren jeweiligen Feldern auf). Zum Beispiel können strukturelle Merkmale eines zugriffsbeschränkten Dokuments ein Dateitypmerkmal enthalten, das beispielsweise auf einer Dateiendung des zugriffsbeschränkten Dokuments basiert. Andere strukturelle Merkmale können Inhalt wie z. B. Schablonen und/oder N-Gramme, die in einem oder mehreren bestimmten zusätzlichen und/oder alternativen Feldern eines Dokuments wie z. B. in einem Titelfeld eines Dokuments, in einem Titel-, Orts- und/oder Notizfeld eines Kalendereintragsdokuments etc. auftauchen, umfassen.
  • Das Anfrage-Merkmal-Modell kann beispielsweise ein bipartiter Graph sein, der die Beziehung zwischen Anfragen und ihren Anfragemerkmalen modelliert. Die Anfragemerkmale einer Anfrage können z. B. ein oder mehrere in der Anfrage auftretende N-Gramme (z. B. das längste N-Gramm, das in der Anfrage auftritt), eine oder mehrere Entitäten, auf die in der Anfrage verwiesen wird (z. B. eine bestimmte Person, ein bestimmter Ort und/oder ein bestimmter Gegenstand), ein oder mehrere Entitätstypen, auf die in der Anfrage verwiesen wird (z. B. eine Stadt, ein Name der Person, ein Ort, ein Restaurant), grammatikalische Merkmale der Anfrage usw. umfassen.
  • Das Anfragemerkmal-Dokumentmerkmal-Modell kann beispielsweise ein bipartiter Graph sein, der unter Verwendung des Anfrage-Dokument-Graphen, des Dokument-Merkmal-Graphen und des Anfrage-Merkmal-Graphen erzeugt wird. Anfragemerkmal-Dokumentmerkmal-Modell modelliert die Interaktionen zwischen Dokumentmerkmalen und Anfragemerkmalen. Mit anderen Worten werden Interaktionen zwischen Dokument- und Anfragemerkmalen anstelle von Interaktionen direkt zwischen Anfragen und Dokumenten modelliert. In einigen Implementierungen wird es basierend auf einer Transformation des Anfrage-Dokument-Modells in den „Dokumentmerkmal“- und „Anfragemerkmal“ -Raum erzeugt, die gemeinsam durch das Dokument-Merkmal-Modell und das Anfrage-Merkmal-Modell modelliert werden.
  • In vielen Implementierungen können nur Merkmale (Anfragemerkmale oder Dokumentmerkmale), die mindestens mit einer Schwellenhäufigkeit (in Anfragen oder Dokumenten) und/oder für mindestens eine Schwellenanzahl von Anwendern vorhanden sind, beim Erzeugen der Anfrage-Merkmal-, Dokument-Merkmal- und/oder der Anfragemerkmal-Dokumentmerkmal-Graphen verwendet werden. In einigen dieser Implementierungen kann dies sicherstellen, dass Merkmale keine sensiblen Informationen enthalten, indem gewährleistet wird, dass diese Merkmale mit mindestens einer Schwellenhäufigkeit und/oder für mindestens eine Schwellenanzahl von Anwendern auftreten.
  • Das Anfragemerkmal-Dokumentmerkmal-Modell kann verwendet werden, um für ein gegebenes Dokument ein anfrageunabhängiges Maß und/oder eine anfrageabhängiges Maß für das gegebene Dokument zu bestimmen. Um beispielsweise ein anfragenabhängiges Maß für eine gegebene Anfrage zu bestimmen, die ein oder mehrere gegebene Anfragemerkmale aufweist, können Kanten zwischen den gegebenen Anfragemerkmalen und Dokumentmerkmalen des gegebenen Dokuments bestimmt werden. Jede der Kanten liefert ein Maß für vergangene Interaktionen zwischen einem entsprechenden Anfragemerkmal und einem entsprechenden Dokumentmerkmal. Die Maße können kombiniert werden (z. B. summiert und/oder eine andere statistische Kombination), um das anfrageabhängige Maß zu bestimmen. Um beispielsweise eine anfrageunabhängige Maß für das gegebene Dokument zu bestimmen, können auch Kanten zwischen allen Anfragemerkmalen und Dokumentmerkmalen des Dokuments bestimmt werden. Die Maße können kombiniert werden (z. B. summiert und / oder eine andere statistische Kombination), um das anfrageunabhängige Maß zu bestimmen.
  • Unter Bezugnahme auf 1 ist eine beispielhafte Umgebung dargestellt, in der die hierin offenbarten Techniken implementiert werden können. Die beispielhafte Umgebung enthält eine Clientvorrichtung 106, ein Suchsystem 110, ein Vergangenheitsinteraktionsmaß-System 120 und ein Dokumentmaß-System 130. Die beispielhafte Umgebung enthält ferner ein oder mehrere persönliche Korpora 158 eines Anwenders der Clientvorrichtung 106. Das eine oder die mehreren persönlichen Korpora 158 können jeweils auf einem oder mehreren entsprechenden nicht transitorischen computerlesbaren Medien gespeichert sein, die sich auf der Clientvorrichtung 106 und/oder entfernt von der Clientvorrichtung 106 (z. B. auf einem oder mehreren entfernten Servern) befinden können. Das eine oder die mehreren persönlichen Korpora 158 können jeweils ein oder mehrere zugriffsbeschränkte Dokumente des Anwenders speichern, wie beispielsweise elektronische Kommunikation des Anwenders (z. B. E-Mails, SMS-Nachrichten, Chatnachrichten, Nachrichten aus sozialen Netzwerken), Mediendateien (z. B. Audiodateien, Bilddateien, Videodateien), Textverarbeitungsdokumente, Kalendereinträge, Kontakteinträge usw.
  • Die beispielhafte Umgebung enthält ferner ein Anfrage-Dokument-Modell 150, das auf einem oder mehreren nicht transitorischen computerlesbaren Medien gespeichert sein kann. Das Anfrage-Dokument-Modell 150 kann beispielsweise ein bipartiter Graph sein, der die Interaktionen zwischen Anfragen und Dokumenten (einschließlich von oder beschränkt auf zugriffsbeschränkte(n) Dokumente(n)) modelliert, wie es durch eine oder mehrere gespeicherte Aufzeichnungen vergangener Anfragen und entsprechender Interaktionen angegeben ist. Zum Beispiel kann das Anfrage-Dokument-Modell 150 auf der Basis von Aufzeichnungen vergangener Anfragen und entsprechender Interaktionen erzeugt werden, die durch das Suchsystem 110 und/oder andere Suchsysteme auf der Basis von Interaktionen mit dem Suchsystem durch mehrere Anwender über mehrere entsprechende Clientvorrichtungen bereitgestellt werden. Die beispielhafte Umgebung enthält ferner ein oder mehrere zusätzliche Modelle 160, die durch das Vergangenheitsinteraktionsmaß-System 120 erzeugt werden und von dem Dokumentmaß-System 130 verwendet werden können. Zum Beispiel können das eine oder die mehreren zusätzlichen Modelle 160 mindestens ein Anfragemerkmal-Dokumentmerkmal-Modell umfassen.
  • Ein Anwender der Clientvorrichtung 106 kann Anfragen an das Suchsystem 110 über eine oder mehrere Anwenderschnittstellen-Eingabevorrichtungen der Clientvorrichtung 106 übermitteln. Beispielsweise kann der Anwender die Anfrage unter Verwendung eines Mikrofons der Clientvorrichtung 106 einsprechen, die Anfrage unter Verwendung einer Hardware-Tastatur und/oder virtuellen Tastatur der Clientvorrichtung 106 eintippen, usw. Als Antwort auf eine Anfrage von der Clientvorrichtung 106 durchsucht das Suchsystem 110 das eine oder die mehreren persönlichen Korpora 158, um zugriffsbeschränkte Dokumente des Anwenders in Antwort auf die Suchanfrage zu identifizieren (falls vorhanden), wobei beispielsweise herkömmliche und/oder andere Informationsabruftechniken verwendet werden. In einigen Implementierungen können das eine oder die mehreren persönlichen Korpora 158 einen Index enthalten, der Dokumente davon basierend auf einem oder mehreren Merkmalen indiziert, und das Suchsystem 110 identifiziert Antwortdokumente unter Verwendung des Index. In einigen Implementierungen durchsucht das Suchsystem 110 zusätzlich oder alternativ ein oder mehrere Korpora, die ein oder mehrere zugriffsbeschränkte Dokumente, die keine zugriffsbeschränkten Dokumente des Anwenders und/oder öffentlich zugängliche Dokumente sind, enthalten oder auf diese beschränkt sind.
  • Das Suchsystem 110 enthält eine Einstufungs-Engine 112, die Punktzahlen für die Dokumente berechnet, die als Antwort auf eine Suchanfrage identifiziert werden, beispielsweise unter Verwendung eines oder mehrerer Einstufungssignale. Jedes Einstufungssignal liefert Informationen über das Dokument selbst und/oder die Beziehung zwischen dem Dokument und der Suchanfrage.
  • In vielen Implementierungen enthalten die Einstufungssignale, basierend auf denen die Einstufungs-Engine 112 Punktzahlen für ein gegebenes Dokument berechnet, ein anfrageabhängiges Maß und/oder ein anfrageunabhängiges Maß, die durch das Dokumentmaß-System 130 gemäß hier beschriebenen Implementierungen erzeugt wird. In einigen Implementierungen kann die Einstufungs-Engine 112 zusätzliche Einstufungssignale wie z. B. Einstufungssignale, die einen Übereinstimmungsgrad zwischen dem gegebenen Dokument und der Suchanfrage angeben, verwenden. Zum Beispiel können die Einstufungssignale für ein Dokument darauf, ob jeder von einem oder mehreren Anfragebegriffen in dem Dokument auftaucht, wo jeder von einem oder mehreren Anfragebegriffen in dem Dokument auftaucht, der Begriffshäufigkeit von jedem von einem oder mehreren der Anfragebegriffen, die in dem Dokument auftauchen, und/oder der Dokumenthäufigkeit jedes von einem oder mehreren der Anfragebegriffe, die in dem Dokument auftauchen, basieren.
  • Die Einstufungs-Engine 112 stuft dann die Antwortdokumente unter Verwendung der Punktzahlen ein. Das Suchsystem 110 verwendet die Antwortdokumente, die von der Einstufungs-Engine 112 eingestuft werden, um Suchergebnisse zu erzeugen, die als Antwort auf die Anfrage bereitgestellt werden. Die Suchergebnisse enthalten Suchergebnisse, die den Dokumenten in Antwort auf die Suchanfrage entsprechen. Zum Beispiel kann jedes von einem oder mehreren Suchergebnissen einen Titel eines jeweiligen der Dokumente, einen Link zu einem jeweiligen der Dokumente und/oder eine Zusammenfassung des Inhalts von einem jeweiligen der Dokumente enthalten. Zum Beispiel kann die Zusammenfassung des Inhalts ein bestimmtes „Schnipsel“ oder einen Abschnitt des Dokuments in Antwort auf die Suchanfrage enthalten. Außerdem kann das Suchergebnis beispielsweise für ein Suchergebnis, das einem Bilddokument zugeordnet ist, eine verkleinerte Anzeige des Bilddokuments, einen dem Bilddokument zugeordneten Titel und/oder einen Link zu dem Bilddokument enthalten. Außerdem kann das Suchergebnis beispielsweise für ein Suchergebnis, das einem Videodokument zugeordnet ist, ein Bild aus dem Video, ein Segment des Videos, einen Titel des Videos und/oder einen Link zu dem Video enthalten. Andere Beispiele für Suchergebnisse enthalten eine Zusammenfassung von Informationen in Antwort auf die Suchanfrage. Die Zusammenfassung kann aus einem oder mehreren Dokumenten in Antwort auf die Suchanfrage und/oder aus anderen Quellen erzeugt werden.
  • Die Suchergebnisse werden in einer Form bereitgestellt, die es ermöglicht, dass sie dem Anwender über eine oder mehrere Anwenderschnittstellen-Ausgabevorrichtungen der Clientvorrichtung 106 (z. B. eine Anzeige und/oder einen Lautsprecher) präsentiert werden. Zum Beispiel können die Suchergebnisse von der Clientvorrichtung 106 in einem oder mehreren Popup-Fenstem oder anderen Schnittstellen, die in einer auf der Clientvorrichtung 106 ausgeführten Anwendung gerendert werden, und/oder als ein oder mehrere Suchergebnisse, die an einen Anwender über Audio geliefert werden, präsentiert werden. 6 stellt ein Beispiel der Clientvorrichtung 106 dar, die Suchergebnisse anzeigt, und ist hierin in weiteren Einzelheiten beschrieben. Die Suchergebnisse können dem Anwender mit einer oder mehreren Präsentationscharakteristiken präsentiert werden, die auf der Einstufung der entsprechenden Suchergebnisdokumente basieren. Zum Beispiel kann das am prominentesten angezeigte Suchergebnis das am höchsten eingestufte Suchergebnis sein, das am zweitprominentesten angezeigte Suchergebnis das zweithöchste Suchergebnis sein und so weiter. Zum Beispiel kann nur eine Teilmenge aller Suchergebnisse anfänglich präsentiert werden und diese Teilmenge kann basierend auf der Einstufung ausgewählt werden.
  • Die Clientvorrichtung 106 kann beispielsweise eine Desktop-Rechenvorrichtung, eine Laptop-Rechenvorrichtung, eine Tablet-Rechenvorrichtung, eine Mobiltelefon-Rechenvorrichtung, eine Rechenvorrichtung eines Fahrzeugs des Anwenders (z. B. ein fahrzeuginternes Kommunikationssystem, ein fahrzeuginternes Unterhaltungssystem, ein fahrzeuginternes Navigationssystem) oder eine am Körper tragbare Vorrichtung des Anwenders, die eine Rechenvorrichtung enthält (z. B. eine Uhr des Anwenders mit einer Rechenvorrichtung, eine Brille des Anwenders mit einer Rechenvorrichtung) sein. Zusätzliche und/oder alternative Clientvorrichtungen können bereitgestellt werden. Die Clientvorrichtung 106 umfasst typischerweise eine oder mehrere Anwendungen, um die Übermittlung von Suchanfragen und das Senden und Empfangen von Daten über ein Netz zu erleichtern.
  • Obwohl sie in 1 getrennt dargestellt sind, kann das Suchsystem 110 in einigen Implementierungen ganz oder teilweise durch die Clientvorrichtung 106 implementiert sein. Zum Beispiel können das eine oder die mehreren persönlichen Korpora158 Dokumente enthalten, die lokal auf der Clientvorrichtung 106 gespeichert sind, und das Suchsystem 110 kann solche lokal gespeicherten Dokumente durchsuchen. In einigen Implementierungen kann das Suchsystem 110 ganz oder teilweise durch eine oder mehrere entfernte Rechenvorrichtungen implementiert sein und die Clientvorrichtung 106 kann mit dem Suchsystem 110 über ein Netz wie ein lokales Netz (LAN) oder ein Weitbereichsnetz (WAN) (z. B. das Internet) kommunizieren. Obwohl 1 das Suchsystem 110 so darstellt, dass es nur mit der Clientvorrichtung 106 und nur dem einen oder den mehreren persönlichen Korpora 158 verbunden ist, die zugriffsbeschränkte Dokumente eines Anwenders der Clientvorrichtung 106 enthalten, kann das Suchsystem 110 in einigen Implementierungen mit mehreren Clientvorrichtungen verbunden sein und/oder auf mehrere Korpora, z. B. ein oder mehrere persönliche Korpora mehrerer Anwender und/oder nicht-persönliche Korpora, zugreifen. Zum Beispiel kann das Suchsystem 110 ein E-Mail-Suchsystem eines E-Mail-Dienstes sein und kann ein persönliches E-Mail-Korpus eines ersten Anwenders als Antwort auf Anfragen des ersten Anwenders durchsuchen, ein persönliches E-Mail-Korpus eines zweiten Anwenders als Antwort auf Anfragen des zweiten Anwenders durchsuchen, usw.
  • Obwohl nur ein einziges Suchsystem 110 in 1 dargestellt ist, können mehrere Suchsysteme 110 bereitgestellt sein und jedes kann anfrageabhängige und/oder anfrageunabhängige Maße verwenden, die von dem Dokumentmaß-System 130 (oder einer separaten Instanz davon) bereitgestellt werden. Auch wenn das Suchsystem 110 so dargestellt ist, dass es nur mit dem einen oder den mehreren persönlichen Korpora 158 kommuniziert, kann das Suchsystem 110 in einigen Implementierungen zusätzlich oder alternativ ein oder mehrere nicht-persönliche Korpora wie z. B. ein oder mehrere öffentliche Korpora und/oder oder ein oder mehrere nicht-persönliche Korpora, die zugriffsbeschränkte Dokumente durchsuchen. Zum Beispiel kann das Suchsystem 110 zusätzlich ein oder mehrere öffentliche Korpora durchsuchen und Suchresultate liefern, die sowohl öffentlichen Inhalt als auch zugriffsbeschränkten Inhalt enthalten. Auch wenn das Dokumentmaß-System 130 in 1 als getrennt von dem Suchsystem 110 dargestellt ist, können in einigen Implementierungen ein oder mehrere Aspekte von beiden in einem einzigen System kombiniert werden. Zum Beispiel können in einigen Implementierungen ein oder mehrere Aspekte des Dokumentmaß-Systems 130 durch die Einstufungs-Engine 112 des Suchsystems 110 implementiert werden.
  • In einigen Implementierungen kann das Dokumentmaß-System 130 eine Dokumentmerkmal-Engine 132, eine Anfragemerkmal-Engine 134, eine Engine für anfrageabhängige Maße 136 und/oder eine Engine für anfrageunabhängige Maße 138 enthalten. In einigen Implementierungen können alle Engines 132, 134, 136 und/oder 138 oder Aspekte davon weggelassen, kombiniert und/oder in einer Komponente, die von dem Dokumentmaß-System 130 getrennt ist, implementiert sein.
  • Das Dokumentmaß-System 130 empfängt von dem Suchsystem 110 eine Angabe einer Anfrage, die an das Suchsystem 110 übermittelt worden ist, und/oder eine Angabe eines oder mehrerer Dokumenten, die von dem Suchsystem 110 in Antwort auf die Anfrage identifiziert worden sind, wie z. B. zugriffsbeschränkte Dokumente aus dem einen oder den mehreren persönlichen Korpora 158.
  • Die Dokumentmerkmal-Engine 132 identifiziert für jedes der Dokumente ein oder mehrere Dokumentmerkmale für das Dokument. Verschiedene Dokumentmerkmale wie z. B. Kategoriemerkmale, strukturelle Merkmale und/oder N-Gramm-Merkmale, die hierin beschrieben sind, können identifiziert werden. Zum Beispiel können für ein Bilddokument in Antwort auf eine Anfrage Dokumentmerkmale N-Gramme oder andere Angaben enthalten, die ein(e) oder mehrere bestimmte Objekte und/oder Klassen von Objekten angeben, die in dem Bilddokument vorhanden sind (z. B. basierend auf automatisierten Bildanalysen und/oder von Menschen angebrachten Tags). In einigen Implementierungen können die gesamte Dokumentmerkmal-Engine 132 oder Aspekte davon durch das Suchsystem 110 implementiert sein.
  • Die Anfragemerkmal-Engine 134 identifiziert für die Anfrage ein oder mehrere Anfragemerkmale für die Anfrage. Verschiedene Anfragemerkmale wie etwa ein oder mehrere N-Gramme, die in der Anfrage auftauchen, eine oder mehrere Entitäten, auf die in der Anfrage Bezug genommen wird, eine oder mehrere Entitätstypen, auf die in der Anfrage Bezug genommen wird, grammatikalische Merkmale usw. können identifiziert werden. In einigen Implementierungen können die gesamte Anfragemerkmal-Engine 134 oder Aspekte davon durch das Suchsystem 110 implementiert sein.
  • Die Engine für anfrageabhängige Maße136 erzeugt ein anfrageabhängiges Maß für jedes der Dokumente. Beim Bestimmen eines anfragenabhängigen Maßes für ein Dokument bestimmt die Engine für anfrageabhängige Maße136 Vergangenheitsinteraktionsmaße, die in dem Modell 160 den Anfragemerkmalen und Dokumentmerkmalen zugewiesen sind, die von den Engines 132 und 134 bestimmt werden. Seien beispielsweise Anfragemerkmale QF1 und QF2 für eine Anfrage (wobei QF ein Anfragemerkmal bezeichnet) und Dokumentmerkmale DF1, DF2 und DF3 für ein zugriffsbeschränktes Dokument in Antwort auf die Anfrage (wobei DF ein Dokumentmerkmal bezeichnet) angenommen. Die Engine für anfrageabhängige Maße 136 kann ein Vergangenheitsinteraktionsmaß jeweils für QF1 und DF1, QF1 und DF2, QF1 und DF3, QF2 und DF1, QF2 und DF2 und QF2 und DF3 bestimmen. Die Engine für anfrageabhängige Maße 136 kann dann das anfrageabhängige Maß für das zugriffsbeschränkte Dokument basierend auf einer Kombination der sechs separaten Vergangenheitsinteraktionsmaße erzeugen.
  • Jedes der Vergangenheitsinteraktionsmaße, die von der Engine für anfrageabhängige Maße 136 verwendet werden, kann auf einer Menge der vergangenen Interaktionen von entsprechenden Anwendern mit anderen Dokumenten, die eines oder mehrere der Dokumentmerkmale aufweisen, basieren, wenn die anderen Dokumente in Antwort auf entsprechende Anfragen mit einem oder mehreren der Anfragemerkmale präsentiert wurden. Die anderen Dokumente selbst können mehrere zugriffsbeschränkte Dokumente wie z. B. nicht zugängliche Dokumente, die jeweils für einen entsprechenden der anderen Anwender persönlich sind und auf die der Anwender nicht zugreifen kann, enthalten oder auf diese beschränkt sein. Eine zusätzliche Beschreibung der Erzeugung von Vergangenheitsinteraktionsmaßen ist hierin bereitgestellt.
  • Die Engine für anfrageunabhängige Maße 138 erzeugt für jedes der Dokumente ein anfrageunabhängiges Maß. Beim Bestimmen eines anfrageunabhängigen Maßes für ein Dokument bestimmt die Engine für anfrageunabhängige Maße 138 Vergangenheitsinteraktionsmaße, die in dem Modell 160 einer Gruppe von Anfragemerkmalen und den von der Engine 134 bestimmten Dokumentmerkmalen zugewiesen sind. Die Gruppe von Anfragemerkmalen enthält Anfragemerkmale, die zusätzlich zu jenen sind, die durch die Anfragemerkmal-Engine 134 bestimmt werden, oder ist auf diese beschränkt. Dementsprechend ist die Gruppe von Anfragemerkmalen unabhängig von der Anfrage, auf die das Dokument eine Antwort ist, und zwar in dem Sinne, dass Anfragemerkmale zusätzlich zu den Anfragemerkmalen der Anfrage enthalten sind. Als Beispiel seien die Dokumentmerkmale DF1, DF2 und DF3 für ein zugriffsbeschränktes Dokument (wobei DF ein Dokumentmerkmal bezeichnet) angenommen. Die Engine für anfrageunabhängige Maße 138 kann bestimmen: alle Vergangenheitsinteraktionsmaße zwischen der Gruppe von Anfragemerkmalen und DF1, alle Vergangenheitsinteraktionsmaße zwischen der Gruppe von Anfragemerkmalen und DF2 und alle Vergangenheitsinteraktionsmaße zwischen der Gruppe von Anfragemerkmalen und DF3. Angenommen, die Gruppe der Anfragemerkmale enthält Anfragemerkmale QF1-QF1000. Für DF1 können Vergangenheitsinteraktionsmaße für QF1 und DF1, QF2 und DF1, QF3 und DF1, ... und QF1000 und DF1 bestimmt werden. Die Engine für anfrageunabhängige Maße 136 kann dann das anfrageabhängige Maß basierend auf einer Kombination der Vergangenheitsinteraktionsmaße erzeugen.
  • Das Dokumentmaß-System 130 liefert das anfrageabhängige Maß und/oder das anfrageunabhängige Maß für jedes der Dokumente an das Suchsystem 110. Die Einstufungs-Engine 112 kann die anfrageabhängigen Maße und/oder die anfragenunabhängigen Maßnahmen bei der Einstufung der Dokumente verwenden und kann die Einstufung verwenden, um eine Präsentationsreihenfolge und /oder eine andere Präsentationscharakteristiken für Suchergebnisse für die Dokumente zu bestimmen. In einigen Implementierungen verwendet die Einstufungs-Engine 112 das anfrageabhängige Maß und/oder das anfrageunabhängige Maß, um eine Punktzahl für das Dokument zu bestimmen, und verwendet die Punktzahl zum Einstufen des Dokuments. Zum Beispiel kann die Einstufungs-Engine 112 eine Basispunktzahl für das Dokument (z. B. eine Basispunktzahl, die auf anderen Einstufungssignalen basiert) angesichts des anfrageabhängigen Maßes und/oder des anfrageunabhängigen Maßes anpassen, um eine modifizierte Punktzahl zu erzeugen.
  • Als ein Beispiel sei eine Basispunktzahl von scb für ein Dokument für eine Anfrage angenommen. Diese Basispunktzahl kann beispielsweise auf einem Schlüsselwortvergleich und/oder einem oder mehreren anderen Einstufungssignalen basieren. Die Einstufungs-Engine 112 kann eine endgültige Punktzahl scƒ basierend auf ƒ(scb, Md, Mq,d) bestimmen, wobei Md das anfrageabhängige Maß für das Dokument darstellt und wobei Mq,d das anfragenunabhängige Maß für das Dokument darstellt. ƒ(·) kann wahlweise eine manuell abgestimmte Punktzahl oder eine maschinell gelernte Einstufungsfunktion sein. In einigen Implementierungen hält die Basispunktzahl112 die Basispunktzahl (scb) fest und trainiert eine Anpassung δ(Md,Mq,d) über die Basispunktzahl (scb). Die Bewertungsfunktion ƒ(·) wird somit zu: ƒ(scb,Md,Mq,d) = scb + δ(Md, Mq,d). Diese adaptive Formulierung kann vorteilhaft für Umgebungen sein, in denen die Basispunktzahl bereits hoch optimiert und optional getrennt von dem anfrageunabhängigen und/oder anfrageabhängigen Maß ist.
  • In einigen Implementierungen kann das Vergangenheitsinteraktionsmaß-System 120 eine Anfrage-Dokument-Modell-Engine 122, eine Dokument-Merkmal-Modell-Engine 124, eine Anfrage-Merkmal-Modell-Engine 126 und/oder eine Anfragemerkmal-Dokumentmerkmal-Modell-Engine 128 enthalten. In einigen Implementierungen können alle der Engines 122, 124, 126 und/oder 128 oder Aspekte davon weggelassen, kombiniert und/oder in einer Komponente, die von dem Vergangenheitsinteraktionsmaß-System 120 getrennt ist, implementiert werden.
  • Die Anfrage-Dokument-Modell-Engine 122 erzeugt das Anfrage-Dokument-Modell 150. In einigen Implementierungen können die gesamte Anfrage-Dokument-Modell-Engine 122 oder Aspekte davon durch das Suchsystem 110 implementiert sein. Das Anfrage-Dokument-Modell 150 kann beispielsweise ein bipartiter Graph sein, der die Interaktionen zwischen Anfragen und Dokumenten modelliert, wie es durch eine oder mehrere gespeicherte Aufzeichnungen früherer Anfragen und entsprechender Interaktionen angegeben ist. Beispielsweise können die Knoten des Anfrage-Dokument-Graphen Anfragen und Dokumente angeben. Die Kanten können zwischen Anfrage- und Dokumentknoten liegen und können beispielsweise jeweils darstellen, ob das entsprechende Dokument für die entsprechende Anfrage beobachtet wurde (z. B. ein entsprechendes Suchergebnis als Antwort auf die entsprechende Anfrage präsentiert wurde) und/oder ob mit dem Dokument für die entsprechende Anfrage interagiert wurde (z. B. Auswahl eines entsprechenden Suchergebnisses). In einigen Implementierungen kann jede der Kanten eine binäre Darstellung enthalten, ob eine Interaktion aufgetreten ist. In einigen Implementierungen können die Kanten basierend auf einem Typ der Interaktion gewichtet sein. Zum Beispiel kann eine Auswahl eines Suchergebnisses gefolgt von einem Zugriff auf das zugrundeliegende Dokument für mindestens eine Schwellenzeitdauer stärker gewichtet werden als eine Auswahl gefolgt von einem Zugriff auf das zugrundeliegende Dokument, der nicht für die Schwellenwertzeitdauer stattfindet, und dies wiederum stärker gewichtet werden als ein „Kreisen“ über dem Suchergebnis ohne eine daraus resultierende Auswahl.
  • In einigen Implementierungen kann das Anfrage-Dokument-Modell 150 durch ein Tripel
    Figure DE102017122363A1_0001
    dargestellt werden, wobei
    Figure DE102017122363A1_0002
    der Satz von Anfrageknoten ist, die entsprechende Anfragen darstellen,
    Figure DE102017122363A1_0003
    der Satz von Dokumentknoten ist, die entsprechende Dokumente darstellen, und der Kantensatz
    Figure DE102017122363A1_0004
    die Kanten darstellt, die die Anfrageknoten und Dokumentknoten verbinden. Die Kanten in der Kantenmenge
    Figure DE102017122363A1_0004
    können durch Tupel der Form e(q,d) = < γo(q,d), γc(q,d) > parametrisiert werden, wobei q einen durch die Kante verbundenen Anfrageknoten darstellt, d einen durch die Kante verbundenen Dokumentknoten darstellt und Parametrisierungsfunktionen γo(a,b) und γc(a,b) angeben, dass die Entitäten a und b in derselben Suchsitzung beobachtet oder angeklickt wurden.
  • In dieser Beschreibung wird der Begriff „Graph“ allgemein verwendet, um sich auf eine beliebige Abbildung mehrerer zugeordneter Informationselemente zu beziehen. Ein Graph oder ein Abschnitt eines Graphen muss nicht in einer einzelnen Speichervorrichtung vorhanden sein und kann Zeiger oder andere Angaben von Informationselementen enthalten, die auf anderen Speichervorrichtungen vorhanden sein können. Zum Beispiel kann ein Graph mehrere Knoten enthalten, die einander zugeordnet sind, wobei jeder Knoten eine Kennung einer Entität oder eines anderen Informationselements enthält, das in einer anderen Datenstruktur und/oder einem anderen Speichermedium vorhanden sein kann.
  • Die Dokument-Merkmal-Modell-Engine 124 erzeugt ein Dokument-Merkmal-Modell, das optional in dem einen oder den mehreren Modellen 160 enthalten sein kann. Die Dokument-Merkmal-Modell-Engine 124 kann die Dokumentmerkmale basierend auf Dokumenten erzeugen, die in dem Anfrage-Dokument-Modell enthalten sind. Zum Beispiel kann die Engine 124 für jedes der Dokumente des Anfrage-Dokument-Modells 150 ein oder mehrere Dokumentmerkmale identifizieren und eine Beziehung zwischen dem Dokument und seinen Dokumentmerkmalen definieren. Das Dokument-Merkmal-Modell kann beispielsweise ein bipartiter Graph sein, der die Beziehung zwischen Dokumenten und ihren Dokumentmerkmalen modelliert. Zum Beispiel kann ein erster Knoten in dem Modell ein Dokumentmerkmal darstellen und dieser Knoten kann durch entsprechende Kanten mit jedem mehrerer Dokumentknoten verbunden sein, die jeweils ein entsprechendes Dokument darstellen, das das Dokumentmerkmal enthält. Die Kanten können jeweils angeben, ob ein entsprechendes Merkmal in einem entsprechenden Dokument vorhanden ist, und optional ein Gewicht des entsprechenden Merkmals für das entsprechende Dokument angeben (z. B. kann das Gewicht für ein Kategoriemerkmal angeben, wie stark das Dokument der Kategorie zugeordnet ist). Verschiedene Merkmale wie z. B. Kategoriemerkmale, Strukturmerkmale und/oder N-Gramm-Merkmale können verwendet werden.
  • In einigen Implementierungen kann das Dokument-Merkmal-Modell durch ein Tripel
    Figure DE102017122363A1_0005
    dargestellt werden, wobei
    Figure DE102017122363A1_0003
    der Satz von Dokumentknoten ist, die entsprechende Dokumente darstellen, wobei AD der Satz von Dokumentmerkmalsknoten ist, die den Satz von Dokumentmerkmalen darstellen, und der Kantensatz
    Figure DE102017122363A1_0006
    die Kanten darstellt, die die Dokumentknoten und die Dokumentmerkmalsknoten verbinden. Die Kanten in dem Kantensatz
    Figure DE102017122363A1_0006
    können durch e ( d , a i j d )
    Figure DE102017122363A1_0007
    parametrisiert werden, wobei e ( d , a i j d )
    Figure DE102017122363A1_0008
    angibt, ob ein entsprechendes Merkmal in einem entsprechenden Dokument vorhanden ist, und gegebenenfalls eine Gewichtung des entsprechenden Merkmals für das entsprechende Dokument angibt.
  • Die Anfrage-Merkmal-Modell-Engine 126 erzeugt ein Anfrage-Merkmal-Modell, das optional in dem einen oder den mehreren Modellen 160 enthalten sein kann. Die Anfrage-Merkmal-Modell-Engine126 kann die Merkmale für Anfragen erzeugen, die in dem Anfrage-Dokument-Modell 150 enthalten sind. Zum Beispiel kann die Engine 126 für jede der Anfragen des Anfrage-Dokument-Modells 150 ein oder mehrere Anfragemerkmale identifizieren und eine Beziehung zwischen der Anfrage und ihren Anfragemerkmalen definieren. Das Anfrage-Merkmal-Modell kann z. B. ein bipartiter Graph sein, der die Beziehung zwischen Anfragen und ihren Anfragemerkmalen modelliert. Zum Beispiel kann ein erster Knoten in dem Modell ein Anfragemerkmal darstellen und dieser Knoten kann durch entsprechende Kanten mit jedem von mehreren Anfrageknoten verbunden sein, die jeweils eine entsprechende Anfrage darstellen, die das Anfragemerkmal enthält. Die Kanten können jeweils angeben, ob ein entsprechendes Merkmal in einer entsprechenden Anfrage vorhanden ist, und gegebenenfalls eine Gewichtung des entsprechenden Merkmals für die entsprechende Anfrage angeben. Verschiedene Merkmale wie etwa ein oder mehrere n-Gramme, die in der Anfrage auftauchen, eine oder mehrere Entitäten, auf die sich in der Anfrage bezogen wird, ein oder mehrere Entitätstypen, auf die sich in der Anfrage bezogen wird, grammatikalische Merkmale der Anfrage usw. können verwendet werden.
  • Das Anfrage-Merkmal-Modell kann durch ein Tripel
    Figure DE102017122363A1_0009
    dargestellt werden, wobei
    Figure DE102017122363A1_0002
    der Satz von Anfrageknoten ist, die entsprechende Anfragen darstellen, wobei
    Figure DE102017122363A1_0010
    der Satz von Anfragemerkmalsknoten ist, die den Satz von Anfragemerkmalen darstellen, und der Kantensatz
    Figure DE102017122363A1_0011
    die Kanten darstellt, die die Anfrageknoten und die Anfragemerkmalsknoten verbinden. Die Kanten in dem Kantensatz
    Figure DE102017122363A1_0011
    können durch e ( q , a k l q )
    Figure DE102017122363A1_0012
    parametrisiert werden, wobei e ( q , a k l q )
    Figure DE102017122363A1_0013
    angibt, ob ein entsprechendes Anfragemerkmal in einer entsprechenden Anfrage vorhanden ist, und gegebenenfalls eine Gewichtung des entsprechenden Merkmals für die entsprechende Anfrage angibt.
  • Das Anfragemerkmal-Dokumentmerkmal-Modell-Engine128 erzeugt ein Anfragemerkmal-Dokumentmerkmal-Modell, das optional in dem einen oder den mehreren Modell 160 enthalten sein kann. Das Anfragemerkmal-Dokumentmerkmal-Modell kann z. B. ein bipartiter Graph sein, der unter Verwendung des Anfrage-Dokument-Graphen, des Dokument-Merkmal-Graphen und das Anfrage-Merkmal-Graph erzeugt wird. Das Anfragemerkmal-Dokumentmerkmal-Modell modelliert die Interaktionen zwischen Dokumentmerkmalen und Anfragemerkmalen. Mit anderen Worten modelliert es Interaktionen zwischen Dokument- und Anfragemerkmalen anstelle von Interaktionen direkt zwischen Anfragen und Dokumenten. In einigen Implementierungen wird es basierend auf einer Transformation des Anfrage-Dokument-Modells in den „Dokumentmerkmal“- und „Anfragemerkmal“-Raum erzeugt, der gemeinsam durch das Dokument-Merkmal-Modell und das Anfrage-Merkmal-Modell modelliert wird.
  • Das Anfragemerkmal-Dokumentmerkmal-Modell kann durch ein Tripel
    Figure DE102017122363A1_0014
    dargestellt werden, wobei
    Figure DE102017122363A1_0010
    der Satz von Anfragemerkmalsknoten ist, die den Satz von Anfragemerkmalen darstellen, AD der Satz von Dokumentmerkmalsknoten ist, die den Satz von Dokumentmerkmalen darstellen, und der Kantensatz
    Figure DE102017122363A1_0015
    die Kanten darstellt, die die Anfragemerkmalsknoten und die Dokumentmerkmalsknoten verbinden. Die Kanten in dem Kantensatz
    Figure DE102017122363A1_0015
    weisen jeweils eine Gewichtung oder ein anderes Maß, das auf der Menge vergangener Interaktionen zwischen dem Anfragemerkmal des entsprechenden Anfragemerkmalknotens und dem Dokumentmerkmal der entsprechenden Dokumentmerkmalsknoten basiert. Die Kanten in dem Kantensatz E ^ A können wie folgt parametrisiert werden: e ( a k l q , a i j d ) = q : e ( q , a k l q ) = 1 d : e ( d , a i j d ) = 1 e ( q , d ) = < γ 0 ( a k l q , a i j d ) , γ c ( a k l q , a i j d ) > ,
    Figure DE102017122363A1_0016
    wobei die Kantenfunktionen e(·) jeweils wie oben beschrieben definiert sind. Wie durch Betrachten der Parametrisierung der Kanten, die oben dargelegt ist, zu verstehen ist, modelliert die Parametrisierung ein Anfrage-Dokument-Attribut von beobachteten und mitgeklickten Zuordnungen über eine Summierung über alle Anfragen und Dokumente, die ihren jeweiligen Attributen zugeordnet werden können.
  • In vielen Implementierungen können nur Merkmale (Anfragemerkmale oder Dokumentmerkmale), die mindestens mit einer Schwellenhäufigkeit (in Anfragen oder Dokumenten) und/oder für mindestens eine Schwellenanzahl von Anwendern vorhanden sind, beim Erzeugen der Anfrage-Merkmal-, Dokument-Merkmal- und/oder der Anfragemerkmal-Dokumentmerkmal-Modelle verwendet werden. In einigen dieser Implementierungen kann dies sicherstellen, dass Merkmalsknoten keine sensiblen Informationen enthalten, indem gewährleistet wird, dass Merkmale dieser Merkmalsknoten mit mindestens einer Schwellenhäufigkeit und/oder für mindestens eine Schwellenanzahl von Anwendern auftreten. In einigen dieser Implementierungen kann dies erreicht werden, indem aus dem Dokument-Merkmal-Graphen alle Dokumentmerkmalsknoten entfernt werden, die nicht mindestens eine Schwellenanzahl von Kanten haben, die das Vorhandensein in entsprechenden Dokumenten angeben; und/oder indem aus dem Anfrage-Merkmal-Modell alle Anfragemerkmalsknoten entfernt werden, die nicht mindestens eine Schwellenanzahl von Kanten haben, die die Anwesenheit in entsprechenden Anfragen angeben. Zusätzlich oder alternativ können Anfragemerkmalsknoten und/oder Dokumentmerkmalsknoten unter Verwendung ähnlicher Techniken aus dem Anfragemerkmal-Dokumentmerkmal-Modell entfernt werden.
  • Das Anfragemerkmal-Dokumentmerkmal-Modell kann verwendet werden, um für ein gegebenes Dokument ein anfrageunabhängiges Maß und/oder anfrageabhängiges Maß für das gegebene Dokument zu bestimmen. Um beispielsweise ein anfrageabhängiges Maß für eine gegebene Anfrage zu bestimmen, die ein oder mehrere gegebene Anfragemerkmale aufweist, können Kanten zwischen dem einen oder den mehreren gegebenen Anfrage-Merkmalen und Dokumentmerkmalen des Dokuments bestimmt werden. Jede der Kanten liefert ein Maß für vergangene Interaktionen zwischen einem entsprechenden Anfragemerkmal und einem entsprechenden Dokumentmerkmal. Die Maße können kombiniert werden (z. B. summiert werden und/oder eine andere statistische Kombination), um das anfrageabhängige Maß zu bestimmen. Um zudem ein anfragenunabhängiges Maß für das gegebene Dokument zu bestimmen, können beispielsweise Kanten zwischen einer Gruppe von Anfragemerkmalen (die die Anfragemerkmale, die nicht in den gegebenen Anfragemerkmalen enthalten sind, umfasst oder auf diese beschränkt ist) und Dokumentmerkmalen des Dokuments bestimmt werden. Die Maße können kombiniert werden (z. B. summiert werden und/oder eine andere statistische Kombination), um das anfrageunabhängige Maß zu bestimmen.
  • Eine zusätzliche Beschreibung von verschiedenen Modellen, die in verschiedenen Implementierungen verwendet werden können, ist unter Bezugnahme auf 2A - 2D und 3 bereitgestellt.
  • 2A zeigt eine Darstellung eines Abschnitts des Anfrage-Dokument-Modells 158 gemäß verschiedenen Implementierungen. Der Abschnitt enthält einen Anfrageknoten 152A, der durch eine Kante 151A mit einem Dokumentknoten 153A verbunden ist. Der Abschnitt enthält auch einen separaten Anfrageknoten 152B, der durch eine Kante 151B mit einem anderen Dokumentknoten 153B verbunden ist.
  • Der Anfrageknoten 152A stellt eine bestimmte Anfrage dar und der Dokumentknoten 153A stellt ein bestimmtes Dokument dar. Für die Zwecke eines Arbeitsbeispiels wird angenommen, dass der Anfrageknoten 152A eine Anfrage „Buchbestellnummer“ darstellt und der Dokumentknoten 153A die E-Mail 353A von 3 darstellt. Die Kante 151A stellt dar, dass mit einem Suchergebnis für das Dokument, das dem Dokumentknoten 153A entspricht, durch einen Anwender als Antwort auf die Anfrage, die dem Anfrageknoten 152A entspricht, interagiert wurde.
  • Der Anfrageknoten 152B stellt eine bestimmte Anfrage dar, die sich von der durch den Anfrageknoten 152A dargestellten bestimmten Anfrage unterscheidet, und der Dokumentknoten 153A stellt ein bestimmtes Dokument dar, das sich von dem durch den Dokumentknoten 153A dargestellten unterscheidet. Für die Zwecke des Arbeitsbeispiels wird angenommen, dass der Anfrageknoten 152B eine Anfrage „Buchbestellung“ darstellt und der Dokumentknoten 153B die E-Mail 353B von 3 darstellt. Die Kante 151B stellt dar, dass mit einem Suchergebnis für das Dokument, das dem Dokumentknoten 153B entspricht, durch einen Anwender als Antwort auf die Anfrage, die dem Anfrageknoten 152B entspricht, interagiert wurde.
  • Es versteht sich, dass das Anfrage-Dokument-Modell 158 eine große Anzahl von zusätzlichen Anfrageknoten, Dokumentknoten und Kanten enthalten wird. Beispielsweise werden zusätzliche Kanten vorgesehen sein, die zusätzliche Anfrageknoten und zusätzliche Dokumentknoten verbinden. Es ist zum Beispiel auch möglich, dass zusätzliche Kanten mit einem oder mehreren der Knoten 152A, 152B, 153A und 153B verbunden sein können. Zum Beispiel kann das Dokument, das durch den Dokumentknoten 153A dargestellt ist, als Antwort auf mehrere unterschiedliche Anfragen ausgewählt worden sein. Zum Beispiel kann zudem die Anfrage, die durch den Anfrageknoten 152A dargestellt wird, von mehreren Anwendern ausgegeben worden sein und verwendet worden sein, um mehrere unterschiedliche Dokumente wie z. B. mehrere zugriffsbeschränkte Dokumente dieser Anwender auszuwählen.
  • 2B zeigt eine Darstellung eines Abschnitts eines Anfrage-Merkmal-Modells 160A des einen oder der mehreren Modelle 160 gemäß verschiedenen Implementierungen. Der Anfrageknoten 152A ist durch entsprechende Kanten 161A-C mit den Anfragemerkmalsknoten 162A-C verbunden, was angibt, dass die durch den Anfrageknoten 152A dargestellte Anfrage die Anfragemerkmale aufweist, die durch die Anfragemerkmalsknoten 162A-C dargestellt sind. Der Anfrageknoten 152B ist durch entsprechende Kanten 161A und 161C mit den Anfragemerkmalsknoten 162A und 162C verbunden, aber nicht mit dem Anfragemerkmalsknoten 162B verbunden. Das Fehlen einer Kante zwischen dem Anfrageknoten 152B und dem Anfragemerkmalsknoten 162B gibt an, dass die Anfrage, die durch den Anfrageknoten 152B dargestellt ist, nicht das Anfragemerkmal aufweist, das durch den Anfragemerkmalsknoten 162B dargestellt ist. In einigen Implementierungen kann noch eine Kante definiert sein, aber angeben, dass das Merkmal nicht vorhanden ist (z. B. kann diese Kante eine „nicht anwesende“ Kante sein, wohingegen die Kanten 161C und 161D „anwesende“ Kanten sein können).
  • Unter weiterer Bezugnahme auf das Arbeitsbeispiel kann der Anfragemerkmalsknoten 162A ein Anfragemerkmal eines N-Gramms „Buchbestellung“ sein, der Anfragemerkmalsknoten 162B kann ein Anfragemerkmal eines N-Gramms „Buchbestellungsnummer“ sein und der Anfragemerkmalsknoten 162C kann ein Anfragemerkmal eines N-Gramms „Bestellung“ sein.
  • Es versteht sich, dass das Anfrage-Merkmal-Modell eine große Anzahl zusätzlicher Anfrageknoten, Anfragemerkmalsknoten und Kanten enthalten wird. Zum Beispiel können zusätzliche Anfragemerkmalsknoten mit jedem der Anfrageknoten 152A und 152B verbunden sein. Zum Beispiel kann zudem jeder der Anfragemerkmalsknoten 162A-C mit mehreren zusätzlichen Anfrageknoten verbunden sein. Außerdem werden beispielsweise zusätzliche Anfrageknoten und zusätzliche Anfragemerkmalsknoten mit entsprechenden Kanten versehen.
  • 2C zeigt eine Darstellung eines Abschnitts eines Dokument-Merkmal-Modells 160B des einen oder der mehreren Modelle 160 gemäß verschiedenen Implementierungen. Der Dokumentknoten 153A ist mit den Dokumentmerkmalsknoten 164A und 164B durch entsprechende Kanten 163A und 163B verbunden, was angibt, dass das durch den Dokumentknoten 153A dargestellte Dokument die durch die Dokumentmerkmalsknoten 164A und 164B dargestellten Dokumentmerkmale aufweist. Der Dokumentknoten 153B ist mit den Dokumentmerkmalsknoten 164A und 164C durch entsprechende Kanten 163C und 163D verbunden, was angibt, dass das durch den Dokumentknoten 153B dargestellte Dokument die durch die Dokumentmerkmalsknoten 164A und 164C dargestellten Dokumentmerkmale aufweist. Das Fehlen einer Kante zwischen dem Dokumentknoten 153A und dem Dokumentmerkmalsknoten 164C gibt an, dass das durch den Dokumentknoten 153A dargestellte Dokument nicht das durch den Dokumentmerkmalsknoten 164C dargestellte Dokumentmerkmal aufweist. Ebenso gibt das Fehlen einer Kante zwischen dem Dokumentknoten 153B und dem Dokumentmerkmalsknoten 164B an, dass das durch den Dokumentknoten 153B dargestellte Dokument nicht das durch den Dokumentmerkmalsknoten 164B dargestellte Dokumentmerkmal aufweist. In einigen Implementierungen können statt einem Fehlen von Kanten noch Kanten definiert sein, jedoch angeben, dass das entsprechende Dokumentmerkmal nicht vorhanden ist.
  • Unter weiterer Bezugnahme auf das Arbeitsbeispiel kann der Dokumentmerkmalsknoten 164A ein strukturelles Dokumentmerkmal sein, wie beispielsweise eines, das einen bestimmten Inhalt in einem Von-Feld und/oder einem Absenderfeld angibt, das in den E-Mails 353A und 353B vorhanden ist. Zum Beispiel kann der Dokumentmerkmalsknoten 164A das gleichzeitige Auftreten des Domainnamens „@exampleurl.com“ in einem Absenderfeld und der Schablone „Kaufbestätigung - [#]“ in einem Betrefffeld angeben, wobei [#] ein Platzhalter ist, der eine alphabetische und/oder numerische Zeichenkette angibt. Als ein weiteres Beispiel kann der Dokumentmerkmalsknoten 164A (oder ein zusätzlicher Dokumentmerkmalsknoten) stattdessen ein gemeinsames Auftreten von bestimmten Inhalten sowohl in einem Absenderfeld als auch einem Betrefffeld angeben (z. B. ein gemeinsames Auftreten von „store@exampleurl.com“ in einem Absenderfeld und „Kaufbestätigung“ in einem Betrefffeld), oder dass bestimmter Inhalt nur in einem der Felder Absenderfeld und Betrefffeld enthalten ist. Der Dokumentmerkmalsknoten 164A kann ein N-Gramm aus dem Textkörper der E-Mail 353A angeben, wie beispielsweise den erdachten Buchtitel „Bald Potter“. Der Dokumentmerkmalknoten 164C kann ein N-Gramm aus dem Textkörper der E-Mail 353A angeben, wie beispielsweise den erdachten Buchtitel „Fear and Dislike in Los Angeles“.
  • Es versteht sich, dass das Dokument-Merkmal-Modell eine große Anzahl von zusätzlichen Dokumentknoten, Dokumentmerkmalsknoten und Kanten enthalten wird. Zum Beispiel können zusätzliche Dokumentmerkmalsknoten mit jedem der Dokumentknoten 153A und 153B verbunden sein. Zum Beispiel kann zudem jeder der Dokumentmerkmalsknoten 164A -C mit mehreren zusätzlichen Dokumentknoten verbunden sein. Außerdem werden beispielsweise zusätzliche Dokumentknoten und Dokumentmerkmalsknoten mit entsprechenden Kanten versehen sein.
  • 2D zeigt eine Darstellung eines Abschnitts eines Anfragemerkmal-Dokumentmerkmal-Modells 160C des einen oder der mehreren Modelle 160 gemäß verschiedenen Implementierungen. Die Anfragemerkmalsknoten 162A-C sind jeweils mit entsprechenden der Dokumentmerkmalsknoten 164A-C durch entsprechende Kanten verbunden. Die Kanten von 2D sind der Einfachheit halber nicht beschriftet. Jede der Kanten von 2D definiert ein entsprechendes Vergangenheitsinteraktionsmaß zwischen einem entsprechenden Anfragemerkmalsknoten und einem Dokumentmerkmalsknoten und kann basierend auf den Modellen erzeugt werden, die teilweise in den 2A-2C dargestellt sind.
  • Es ist zu beachten, dass beim Erzeugen der Vergangenheitsinteraktionsmaße, die durch die Kanten von 2D definiert sind, die beiden Anfrage-zu-Dokument-Interaktionen, die in 2A dargestellt sind, einen positiven Einfluss auf die Vergangenheitsinteraktionsmaße aller Kanten außer der Kante zwischen dem Anfragemerkmalsknoten 162B und dem Dokumentmerkmalsknoten 164C haben werden. Dies ist so, weil wie durch die Modelle von 2A - 2C angegeben die Interaktionen, die in 2A dargestellt sind, keine Interaktion zwischen dem Anfragemerkmalsknoten 162B und dem Dokumentmerkmalsknoten 164C angeben. Mit anderen Worten, da der Dokumentmerkmalsknoten 164C dem Dokumentknoten 153B zugeordnet ist, aber nicht dem Dokumentknoten 153A - und der Anfragemerkmalsknoten 162B dem Anfrageknoten 152A zugeordnet ist, aber nicht dem Anfrageknoten 152B - sind die Interaktionen von 2A keinen Interaktionen zwischen dem Anfragemerkmalsknoten 162B und dem Dokumentmerkmalsknoten 164C zugeordnet. Wie bei den anderen Modellen versteht es sich, dass das Anfragemerkmal-Dokumentmerkmal-Modell eine große Anzahl zusätzlicher Anfragemerkmalsknoten, Dokumentmerkmalsknoten und Kanten enthalten wird.
  • 4 ist ein Ablaufdiagramm, das ein beispielhaftes Verfahren 400 zum Erzeugen von Vergangenheitsinteraktionsmaßen für jeden von mehreren Tupeln Anfragemerkmal, Dokumentmerkmal darstellt. Der Einfachheit halber werden die Operationen des Ablaufdiagramms unter Bezugnahme auf ein System beschrieben, das die Operationen durchführt. Dieses System kann verschiedene Komponenten von verschiedenen Computersystemen enthalten wie etwa eine oder mehrere Komponenten des Vergangenheitsinteraktionsmaß-Systems 120. Obwohl Operationen des Verfahrens 400 in einer bestimmten Reihenfolge gezeigt sind, soll dies nicht einschränkend sein. Eine oder mehrere Operationen können umgeordnet, weggelassen oder hinzugefügt werden.
  • In Block 452 wählt das System mehrere Dokumentmerkmale aus. Zum Beispiel kann das System die Dokumentmerkmale basierend darauf auswählen, dass die Dokumentmerkmale in zugriffsbeschränkten Dokumenten von mindestens einer Schwellenanzahl von Anwendern auftreten und/oder in mindestens einer Schwellenanzahl von Dokumenten auftreten. In einigen Implementierungen wählt das System die Dokumentmerkmale basierend auf jenen Merkmalen aus, die Merkmale für Dokumente sind, die in einem Anfrage-Dokument-Modell enthalten sind, wie es hierin beschrieben ist. In einigen Implementierungen erzeugt das System beim Auswählen der Dokumentmerkmale ein Dokument-Merkmale-Modell, wie es hierin beschrieben ist.
  • In Block 454 wählt das System mehrere Anfragemerkmale aus. Zum Beispiel kann das System die Anfragemerkmale auf der Basis davon auswählen, dass die Anfragemerkmale in Anfragen für zugriffsbeschränkte Dokumente von mindestens einer Schwellenanzahl von Anwendern und/oder in mindestens einer Schwellenmenge solcher Anfragen auftreten. In einigen Implementierungen wählt das System die Anfragemerkmale basierend auf jenen Merkmalen aus, die Merkmale für Anfragen sind, die in einem Anfrage-Dokument-Modell enthalten sind, wie es hierin beschrieben ist. In einigen Implementierungen erzeugt das System beim Auswählen der Anfragemerkmale ein Anfrage-Merkmale-Modell, wie es hierin beschrieben ist.
  • In Block 456 wählt das System ein Tupel Anfragemerkmal, Dokumentmerkmal aus. Zum Beispiel kann das Tupel Anfragemerkmal, Dokumentmerkmal ein einzelnes Anfragemerkmal und ein einzelnes Dokumentmerkmal sein. In einigen Implementierungen kann ein einzelnes Anfragemerkmal und/oder ein einzelnes Dokumentmerkmal selbst eine Kombination von Merkmalen sein. Zum Beispiel kann das einzelne Dokumentmerkmal das gleichzeitige Auftreten von einem bestimmten ersten Inhalt in einem ersten bestimmten Feld eines Dokuments; und einem bestimmten zweiten Inhalt in einem zweiten bestimmten Feld des Dokuments sein.
  • In Block 458 erzeugt das System ein Vergangenheitsinteraktionsmaß für das Tupel auf der Basis einer Menge vergangener Interaktionen mit Dokumenten, die ein oder mehrere Dokumentmerkmale des Tupels aufweisen, als Antwort auf Anfragen mit einem oder mehreren Anfragemerkmalen des Tupels. In einigen Implementierungen kann das System das Vergangenheitsinteraktionsmaß basierend auf einer Transformation eines Anfrage-Dokument-Modells in einen „Dokumentmerkmale“- und „Anfragemerkmale“-Raum erzeugen, der gemeinsam durch das Dokument-Merkmal-Modell und das Anfrage-Merkmal-Modell modelliert wird, wie sie hier beschrieben sind.
  • In Block 460 speichert das System das Vergangenheitsinteraktionsmaß in Verbindung mit dem Tupel. Zum Beispiel kann das System das Vergangenheitsinteraktionsmaß als einen Wert für eine Kante speichern, die einen Anfragemerkmalsknoten, der das eine oder die mehreren Anfragemerkmale des Tupels darstellt, und einen Dokumentmerkmalsknoten, der das eine oder die mehreren Dokumentmerkmale des Tupels darstellt, verbindet. In einigen Implementierungen kann das Vergangenheitsinteraktionsmaß in einem Anfragemerkmal-Dokumentmerkmal-Modell gespeichert werden, wie es hierin beschrieben ist.
  • In Block 462 bestimmt das System, ob verbleibende Tupel zu verarbeiten sind. Wenn dies der Fall ist, geht das System zurück zu Block 456, um ein weiteres Tupel Anfragemerkmal, Dokumentmerkmal auszuwählen und führt eine weitere Iteration der Blöcke 458, 460 und 462 durch. Das System kann eine große Anzahl von Iterationen der Blöcke 456, 458, 460 und 462 durchführen, um eine große Anzahl von Vergangenheitsinteraktionsmaßen für eine große Anzahl von Tupeln zu erzeugen. Solche Iterationen können sequentiell und/oder parallel durchgeführt werden.
  • Wenn das System in Block 460 bestimmt, dass keine verbleibenden Tupel zu verarbeiten sind, endet der Prozess in Block 464. Die Vergangenheitsinteraktionsmaße, die basierend auf dem Verfahren 400 erzeugt werden, können beispielsweise in dem nachstehend beschriebenen Verfahren 500 und/oder durch das Dokumentmaß-System 130 wie hierin beschrieben verwendet werden,.
  • 5 ist ein Ablaufdiagramm, das ein beispielhaftes Verfahren 500 zum Verwenden anfrageabhängiger und/oder anfrageunabhängiger Maße von Dokumenten in Antwort auf eine Anfrage, um die Dokumente einzustufen, und zum Bereitstellen entsprechender Suchergebnisse basierend auf der Einstufung darstellt. Der Einfachheit halber werden die Operationen des Ablaufdiagramms unter Bezugnahme auf ein System beschrieben, das die Operationen durchführt. Dieses System kann verschiedene Komponenten von verschiedenen Computersystemen enthalten, wie zum Beispiel eine oder mehrere Komponenten des Dokumentmaß-Systems 130. Obwohl Operationen des Verfahrens 500 in einer bestimmten Reihenfolge gezeigt sind, soll dies nicht einschränkend sein. Eine oder mehrere Operationen können umgeordnet, weggelassen oder hinzugefügt werden.
  • In Block 552 empfängt das System eine Anfrage.
  • In Block 554 identifiziert das System Antwortdokumente in Antwort auf die Anfrage. Die Antwortdokumente können optional zugriffsbeschränkte Dokumente enthalten oder darauf beschränkt sein.
  • In Block 556 identifiziert das System ein oder mehrere Anfragemerkmale für die Anfrage von Block 552 und identifiziert ein oder mehrere Dokumentmerkmale für ein Dokument der Antwortdokumente von Block 554.
  • In Block 558 erzeugt das System ein anfrageabhängiges Maß für das Dokument auf der Basis von Vergangenheitsinteraktionsmaßen zwischen den Anfragemerkmalen und den Dokumentmerkmalen.
  • In Block 560 erzeugt das System ein anfrageunabhängiges Maß für das Dokument auf der Basis von Vergangenheitsinteraktionsmaßen in Antwort auf Anfragen, die keine der Anfragemerkmale der Anfrage, die in Block 552 empfangen wurde, aufweisen. In einigen Implementierungen kann das System nur einen der Blöcke 558 und 560 durchführen.
  • In Block 562 bestimmt das System, ob es verbleibende zu verarbeitende Dokumente gibt. Wenn dies der Fall ist, geht das System zu Block 564 über und identifiziert Dokumentmerkmale für eines der verbleibenden Dokumente. Das System führt dann eine weitere Iteration der Blöcke 558 und 560 unter Verwendung dieser Dokumentmerkmale durch. Das System kann mehrere Iterationen der Blöcke 564, 558 und 560 ausführen, jedes Mal für ein anderes Antwortdokument. Das System kann alle Antwortdokumente oder eine Teilmenge der Antwortdokumente (z. B. nur die Top-X-Dokumente gemäß Punktzahl für diese Dokumente, die basierend auf anderen Einstufungssignalen erzeugt werden) verarbeiten. Mehrere Iterationen können sequentiell und/oder parallel durchgeführt werden.
  • Wenn das System in Block 562 bestimmt, dass keine verbleibenden zugriffsbeschränkten Dokumente zu verarbeiten sind, geht das System zu Block 566 über.
  • In Block 566 verwendet das System die anfrageabhängigen Maße, die in mehreren Iterationen von Block 558 erzeugt werden, und/oder die anfrageunabhängigen Maße, die in mehreren Iterationen von Block 560 erzeugt werden, um die in Block 554 identifizierten Antwortdokumente einzustufen. Zum Beispiel kann das System eine Basispunktzahl für jedes der Antwortdokumente (z. B. eine Basispunktzahl, die auf einem oder mehreren anderen Einstufungssignalen basiert) angesichts des anfrageabhängigen Maßes und/oder des anfrageunabhängigen Maßes anpassen, um eine geänderte Punktzahl zu erzeugen.
  • In Block 568 liefert das System Suchergebnisse für eines oder mehrere der Antwortdokumente basierend auf der Einstufung von Block 566. Das Liefern der Suchergebnisse basierend auf der Einstufung von Block 566 kann das Liefern der Suchergebnisse mit einer Präsentationscharakteristiken, die auf der Einstufung basiert, beispielsweise einer Präsentationsreihenfolge, umfassen.
  • 6 stellt ein Beispiel der Clientvorrichtung 106 und eines Anzeigebildschirms 140 der Rechenvorrichtung 106 dar. Der Anzeigebildschirm 140 enthält Systemschnittstellenelemente 181, 182, 183, mit denen der Anwender interagieren kann, um die Clientvorrichtung 106 dazu zu veranlassen, eine oder mehrere Aktionen durchzuführen. Der Anzeigebildschirm 140 enthält auch ein Suchschnittstellenelement 184, in dem der Anwender eine Anfrage „Buchbestellnummer“ beispielsweise unter Verwendung einer virtuellen Tastatur oder einer Anwenderschnittstelleneingabe, die über ein Mikrofon bereitgestellt wird, eingegeben hat. Die Suchergebnisse 185A, 185B und 185C werden als Antwort auf die Anfrage bereitgestellt.
  • In 6 wird das Suchergebnis 185A zuerst auf der Basis von hierin beschriebenen Techniken präsentiert, die sich auf das Erzeugen und Verwenden eines anfrageabhängigen Maßes für das Dokument, das dem Suchergebnis 185A entspricht, beziehen. Das Suchergebnis 185A entspricht der E-Mail 353C von 3. In einigen Implementierungen kann das anfrageabhängige Maß für das Suchergebnis 185A zumindest teilweise basierend auf einem Vergangenheitsinteraktionsmaß bestimmt werden, das zwischen einem Anfragemerkmal für die Anfrage „Buchbestellnummer“ und einem Dokumentmerkmal, das auf Inhalt in dem Betrefffeld und/oder dem Absenderfeld der E-Mail 353C basiert, vorliegt. In einigen Implementierungen können die Vergangenheitsinteraktionsmaße, auf deren Basis das anfrageabhängige Maß für das Suchergebnis 185A bestimmt wird, Vergangenheitsinteraktionsmaße sein, die unabhängig von der E-Mail 353C bestimmt werden. In einigen dieser Implementierungen können die Vergangenheitsinteraktionsmaß auf der Basis verschiedener E-Mails und/oder anderer Dokumente wie etwa der E-Mails 353A und 353B (3) bestimmt werden, die für andere Anwender persönliche, zugriffsbeschränkte Dokumente sind und für den Anwender, der die Anfrage in 6 eingibt, nicht zugänglich sind.
  • Es ist zu beachten, dass in dem Beispiel von 6 das Suchergebnis 185A nicht zuerst präsentiert worden wäre, ohne das anfrageabhängige Maß zu verwenden. Beispielsweise hätte die Verwendung von Einstufungssignalen, die nur die Schlüsselwortübereinstimmung berücksichtigen, bewirken können, dass das Suchergebnis 185A und das Suchergebnis 185C prominenter präsentiert werden als das Suchergebnis 185A, da diese Suchergebnisse Begriffe der Anfrage in dem Betrefffeld ihrer entsprechenden E-Mails enthalten. Zum Beispiel ist das Suchergebnis 185B für eine E-Mail, die sowohl „Buch“ als auch „Bestellung“ in ihrem Betreff aufweist, und das Suchergebnis 185C für eine andere E-Mail, die „Bestellung“ in ihrem Betreff hat. Im Gegensatz dazu hat das Dokument 353C (das entsprechende Dokument für das Suchergebnis 185A) keinen der Begriffe der Anfrage in seinem Betrefffeld. Es enthält vielmehr nur einen der Begriffe („Bestellung“) in einem Textkörper der E-Mail (siehe 3). Dementsprechend können die hierin beschriebenen technischen Merkmale verwendet werden, um das Suchergebnis 185A prominenter zu präsentieren, als es ohne die technischen Merkmale der Fall wäre, und/oder es anfänglich zu präsentieren, wohingegen es ohne die technischen Merkmale nicht anfänglich präsentiert worden wäre. Dies kann dazu führen, dass wahrscheinlicher das relevante Suchergebnis 185A von dem Anwender als Antwort auf die Anfrage wahrgenommen und/oder ausgewählt wird, was zu verschiedenen technischen Vorteilen führen kann. Zum Beispiel kann dies verschiedene Rechenbetriebsmittel reduzieren, die andernfalls eingesetzt worden wären, wenn das Suchergebnis nicht prominenter präsentiert worden wäre, beispielsweise Betriebsmittel, die als Ergebnis der folgenden Vorgänge eingesetzt werden: der Anwender navigiert durch mehrere Suchergebnisse, um das Suchergebnis 185A zu lokalisieren, der Anwender übermittelt eine neue Suche als Ergebnis davon, dass das Suchergebnis 185A anfangs nicht bemerkt und/oder präsentiert wurde, usw.
  • Obwohl 6 und andere Beispiele in Bezug auf E-Mail-Dokumente beschrieben sind, sind viele hierin beschriebene Implementierungen zusätzlich oder alternativ auf andere Dokumente anwendbar, wie z. B., aber nicht beschränkt auf, andere hierin explizit beschriebene Dokumente (z. B. Mediendokumente (z. B. Bilddokumente, Audiodokumente, Videodokumente), Kalendereintragsdokumente, Kontakteintragsdokumente, andere elektronische Kommunikation (z. B. Beiträge in sozialen Netzwerken, Chatnachrichten).
  • In Situationen, in denen die hier beschriebenen Systeme persönliche Informationen über Anwender sammeln oder persönliche Informationen verwenden können, kann den Anwendern die Möglichkeit gegeben werden, zu steuern, ob Programme oder Merkmale Anwenderinformationen (z. B. Informationen über die sozialen Netzwerke eines Anwenders, soziale Aktionen oder Aktivitäten, den Beruf, Präferenzen eines Anwenders oder den aktuellen geografischen Standort eines Anwenders) sammeln, oder zu steuern, ob und/oder wie Inhalte von dem Inhaltsserver empfangen werden, die für den Anwender relevanter sind. Außerdem können bestimmte Daten auf eine oder mehrere Arten behandelt werden, bevor sie gespeichert oder verwendet werden, so dass personenbezogene Informationen entfernt werden. Beispielsweise kann die Identität eines Anwenders so behandelt werden, dass keine personenbezogenen Informationen über den Anwender ermittelt werden können, oder der geografische Standort eines Anwenders kann verallgemeinert werden, wenn geografische Standortinformationen (z. B. auf der Ebene von Stadt, Postleitzahl oder Bundesland) erhalten werden, so dass ein spezieller geographischer Ort eines Anwenders nicht bestimmt werden kann. Somit kann der Anwender steuern, wie Informationen über den Anwender gesammelt und/oder verwendet werden.
  • 7 ist ein Blockdiagramm einer beispielhaften Rechenvorrichtung 710, die optional verwendet werden kann, um einen oder mehrere Aspekte von hierin beschriebenen Techniken durchzuführen. In einigen Implementierungen können eine oder mehrere der Komponenten von 1 eine oder mehrere Komponenten der beispielhaften Rechenvorrichtung 710 enthalten.
  • Die Rechenvorrichtung 710 enthält typischerweise mindestens einen Prozessor 714, der mit einer Anzahl von Peripherievorrichtungen über das Bus-Untersystem 712 kommuniziert. Diese Peripherievorrichtungen können ein Ablagespeicher-Untersystem 724, das beispielsweise ein Speicher-Untersystem 725 und ein Dateispeicher-Untersystem 726 enthält, Anwenderschnittstellen-Ausgabevorrichtungen 720, Anwenderschnittstellen-Eingabevorrichtungen 722 und ein Netzschnittstellen-Untersystem 716 umfassen. Die Eingabe- und Ausgabevorrichtungen ermöglichen Anwenderinteraktion mit der Rechenvorrichtung 710. Das Netzschnittstellen-Untersystem 716 bietet eine Schnittstelle zu externen Netzen und ist mit entsprechenden Schnittstellenvorrichtungen in anderen Rechenvorrichtungen gekoppelt.
  • Die Anwenderschnittstellen-Eingabevorrichtungen 722 können eine Tastatur, Zeigevorrichtungen wie etwa eine Maus, einen Trackball, ein Berührungsfeld oder ein Grafiktablett, einen Scanner, einen in die Anzeige integrierten Berührungsbildschirm, Audioeingabevorrichtungen wie Spracherkennungssysteme, Mikrofone und/oder andere Arten von Eingabevorrichtungen umfassen. Im Allgemeinen soll die Verwendung des Begriffs „Eingabevorrichtung“ alle möglichen Vorrichtungstypen und Möglichkeiten, Informationen in die Rechenvorrichtung 710 oder in ein Kommunikationsnetz einzugeben, umfassen.
  • Die Anwenderschnittstellen-Ausgabevorrichtungen 720 können ein Anzeige-Untersystem, einen Drucker, ein Faxgerät oder nicht-visuelle Anzeigen wie Audioausgabevorrichtungen umfassen. Das Anzeige-Untersystem kann eine Kathodenstrahlröhre (CRT), eine Flachbildschirmvorrichtung wie etwa eine Flüssigkristallanzeige (LCD), eine Projektionsvorrichtung oder irgendeinen anderen Mechanismus zum Erzeugen eines sichtbaren Bildes umfassen. Das Anzeige-Untersystem kann auch eine nichtvisuelle Anzeige liefern, beispielsweise über Audioausgabevorrichtungen. Im Allgemeinen soll die Verwendung des Begriffs „Ausgabevorrichtung“ alle möglichen Typen von Vorrichtungen und Möglichkeiten zum Ausgeben von Informationen aus der Rechenvorrichtung 710 an den Anwender oder an eine andere Maschine oder eine andere Rechenvorrichtung umfassen.
  • Das Ablagespeicher-Untersystem 724 speichert Programmier- und Datenkonstrukte, die die Funktionalität einiger oder aller der hierin beschriebenen Module bereitstellen. Zum Beispiel kann das Ablagespeicher-Untersystem 724 die Logik enthalten, um ausgewählte Aspekte der Verfahren von 4 und/oder 5 auszuführen.
  • Diese Softwaremodule werden im Allgemeinen von dem Prozessor 724 alleine oder in Kombination mit anderen Prozessoren ausgeführt. Das Speicher-Untersystem 725, das in dem Ablagespeicher-Untersystem 724 verwendet wird, kann eine Anzahl von Speichern einschließlich eines Haupt-Direktzugriffsspeichers (Haupt-RAM) 730 zum Speichern von Befehlen und Daten während einer Programmausführung und eines Nur-Lesespeichers (ROM) 732, in dem feste Befehle gespeichert sind, umfassen. Das Dateispeicher-Untersystem 726 kann dauerhaften Speicher für Programm- und Datendateien bereitstellen und kann ein Festplattenlaufwerk, ein Diskettenlaufwerk zusammen mit zugeordneten Wechselmedien, ein CD-ROM-Laufwerk, ein optisches Laufwerk oder Wechselmedienkassetten umfassen. Die Module, die die Funktionalität bestimmter Implementierungen implementieren, können durch das Dateispeicher-Untersystem 726 in dem Ablagespeicher-Untersystem 724 oder in anderen Maschinen, auf die durch den/die Prozessor(en) 714 zugegriffen werden kann, gespeichert werden.
  • Das Bus-Untersystem 712 bietet einen Mechanismus, um es den verschiedenen Komponenten und Untersystemen der Rechenvorrichtung 710 zu ermöglichen, wie beabsichtigt miteinander zu kommunizieren. Obwohl das Busuntersystem 712 schematisch als ein einzelner Bus gezeigt ist, können alternative Implementierungen des Bus-Untersystems mehrere Busse verwenden.
  • Die Rechenvorrichtung 710 kann von verschiedenen Typen sein, einen Arbeitsplatzrechner, einen Server, einen Computercluster, einen Blade-Server, eine Serverfarm oder ein anderes Datenverarbeitungssystem oder eine andere Rechenvorrichtung umfassen. Aufgrund der sich ständig ändernden Natur von Computern und Netzen ist die Beschreibung der in 7 dargestellten Rechenvorrichtung 710 nur als ein spezielles Beispiel zum Zwecke der Veranschaulichung einiger Implementierungen gedacht. Es sind viele andere Konfigurationen der Rechenvorrichtung 710 möglich, die mehr oder weniger Komponenten als die in 7 dargestellte Rechenvorrichtung aufweisen.
  • Gemäß Implementierungen in dieser Offenbarung sind Verfahren und Vorrichtungen bereitgestellt, die sich auf die Verwendung von einem oder mehreren Dokumentmerkmalen eines Dokuments in Antwort auf eine Anfrage und optional einem oder mehreren Merkmalen der Anfrage beziehen, um eine Präsentationscharakteristik zum Präsentieren eines Suchergebnisses, das dem Dokument entspricht, zu bestimmen. In einigen Implementierungen können Maße, die dem einen oder den mehreren Dokumentmerkmalen und/oder dem einen oder den mehreren Anfragemerkmalen zugeordnet sind, verwendet werden, um die Präsentationscharakteristik zu bestimmen. Die Maße können auf vergangenen Interaktionen von entsprechenden Anwendern mit anderen Dokumenten basieren, die eines oder mehrere der Dokumentmerkmale mit dem gegebenen Dokument gemeinsam haben, wobei mehrere der anderen Dokumente jeweils verschieden von dem gegebenen Dokument (und optional jeweils verschieden voneinander) sind. In einigen Implementierungen enthalten das Dokument und/oder die anderen Dokumente zugriffsbeschränkte Dokumente oder sind auf diese beschränkt. Neben der Aufrechterhaltung der Sicherheit während des Suchprozesses bieten Ausführungsformen deutliche Reduktionen des Netzverkehrs für ein Netz als Ganzes, wenn sie auf viele Anwender einer Suchmaschine skaliert werden.
  • Obwohl hierin mehrere Implementierungen beschrieben und dargestellt worden sind, kann eine Vielzahl von anderen Mitteln und/oder Strukturen zum Durchführen der Funktion und/oder Erzielen der Ergebnisse und/oder eines oder mehrerer der hierin beschriebenen Vorteile verwendet werden und jede solche Variation und/oder Abwandlung wird als unter den Umfang der hierin beschriebenen Implementierungen fallend betrachtet. Allgemeiner ausgedrückt sollen alle hierin beschriebenen Parameter, Abmessungen, Materialien und Konfigurationen beispielhaft sein und die tatsächlichen Parameter, Abmessungen, Materialien und/oder Konfigurationen hängen von der spezifischen Anwendung oder den spezifischen Anwendungen ab, für die die Lehren verwendet werden. Fachleute werden in der Lage sein, lediglich unter Verwendung von Routineexperimenten viele Äquivalente zu den hier beschriebenen spezifischen Implementierungen erkennen oder zu ermitteln. Es versteht sich daher, dass die vorstehenden Implementierungen nur beispielhaft dargestellt sind und dass Implementierungen innerhalb des Umfangs der beigefügten Ansprüche und Äquivalente dazu anders als speziell beschrieben und beansprucht ausgeführt werden können. Implementierungen der vorliegenden Offenbarung sind auf jedes einzelne der Merkmale, Systeme, Artikel, Materialien, Ausrüstungen und/oder Verfahren gerichtet, das hierin beschrieben ist. Darüber hinaus fällt jede Kombination von zwei oder mehr solcher Merkmale, Systeme, Artikel, Materialien, Ausrüstungen und/oder Verfahren, wenn solche Merkmale, Systeme, Artikel, Materialien, Ausrüstungen und/oder Verfahren nicht miteinander unvereinbar sind, unter den Umfang der vorliegenden Offenbarung.

Claims (19)

  1. Verfahren, das von einem oder mehreren Prozessoren implementiert wird und umfasst: Empfangen einer Anfrage, wobei die Anfrage von einem Anwender über eine Anwenderschnittstellen-Eingabevorrichtung einer Rechenvorrichtung des Anwenders eingegeben wird; Identifizieren von Antwortdokumenten in Antwort auf die Anfrage, wobei die Antwortdokumente eine E-Mail umfassen, die an eine E-Mail-Adresse des Anwenders gesendet wird; Identifizieren eines oder mehrerer Dokumentmerkmale für die E-Mail, wobei die Dokumentmerkmale mindestens ein E-Mail-Merkmal umfassen, das auf mindestens einem der folgenden Inhalte basiert: Absenderinhalt, der auf seinem Vorhandensein in einem Absenderfeld der E-Mail basiert, und Betreffinhalt, der auf seiner Anwesenheit in einem Betrefffeld der E-Mail basiert; Identifizieren eines oder mehrerer Anfragemerkmale für die Anfrage; Erzeugen eines anfrageabhängigen Maßes für die E-Mail auf der Basis von Maßen vergangener Interaktionen zwischen den Anfragemerkmalen und den Dokumentmerkmalen, wobei jedes der mehreren Maße auf einer Menge der vergangenen Interaktionen durch entsprechende Anwender mit anderen Dokumenten, die ein oder mehrere der Dokumentmerkmale aufweisen, basiert, wenn die anderen Dokumente als Antwort auf entsprechende Anfragen, die ein oder mehrere der Anfragemerkmale aufweisen, präsentiert wurden; Verwenden des anfrageabhängigen Maßes für die E-Mail, um eine Präsentationscharakteristik zum Präsentieren eines E-Mail-Suchergebnisses, das der E-Mail entspricht, zu bestimmen; und Bereitstellen des E-Mail-Suchergebnisses zur Präsentation mit der Präsentationscharakteristik als Antwort auf die Anfrage, wobei die Präsentation über eine Anwenderschnittstellen-Ausgabevorrichtung der Rechenvorrichtung erfolgt.
  2. Verfahren nach Anspruch 1, wobei das mindestens eine E-Mail-Merkmal sowohl auf dem Absenderinhalt in dem Absenderfeld als auch auf dem Betreffinhalt in dem Betrefffeld basiert.
  3. Verfahren nach Anspruch 2, wobei das mindestens eine E-Mail-Merkmal ein gemeinsames Auftreten des Absenderinhalts in dem Absenderfeld und des Betreffinhalts in dem Betrefffeld ist.
  4. Verfahren nach Anspruch 3, wobei der Absenderinhalt einen Domain-Namen einer Absender-E-Mail-Adresse der E-Mail enthält.
  5. Verfahren nach Anspruch 4, wobei der Betreffinhalt eine Schablone enthält, die einen oder mehrere Begriffe und einen oder mehrere Platzhalter enthält.
  6. Verfahren nach einem der vorhergehenden Ansprüche, wobei das mindestens eine E-Mail-Merkmal auf dem Betreffinhalt in dem Betrefffeld basiert und wobei der Betreffinhalt eine Schablone enthält, die einen oder mehrere Begriffe und einen oder mehrere Platzhalter enthält.
  7. Verfahren nach einem der vorhergehenden Ansprüche, wobei die anderen Dokumente, auf denen die Maße basieren, die E-Mail ausschließen.
  8. Verfahren nach einem der vorhergehenden Ansprüche, das ferner umfasst: Erzeugen eines anfrageunabhängigen Maßes für die E-Mail basierend auf zusätzlichen Maßen von zusätzlichen vergangenen Interaktionen mit den Dokumentmerkmalen als Antwort auf zusätzliche Anfragen, die keines der Anfragemerkmale aufweisen; und ferner Verwenden des anfrageunabhängigen Maßes für die E-Mail, um die Präsentationscharakteristik zum Präsentieren des E-Mail-Suchergebnisses, das der E-Mail entspricht, zu bestimmen.
  9. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Verwenden des anfrageabhängigen Maßes für die E-Mail zum Bestimmen der Präsentationscharakteristik umfasst: Bestimmen einer Punktzahl für die E-Mail basierend auf dem anfrageabhängigen Maß; Bestimmen zusätzlicher Punktzahlen für andere der Antwortdokumente; Einstufen der E-Mail relativ zu den anderen der Antwortdokumenten basierend auf der Punktzahl und den zusätzlichen Punktzahlen; und Bestimmen der Präsentationscharakteristik basierend auf der Einstufung.
  10. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Dokumentmerkmale ferner eine Kategorie der E-Mail umfassen und das Verfahren ferner Folgendes umfasst: Verwenden eines maschinellen Lernmodells zum Bestimmen der Kategorie der E-Mail.
  11. Verfahren nach einem der vorhergehenden Ansprüche, wobei die vergangenen Interaktionen mit anderen Dokumenten, die eines oder mehrere der Dokumentmerkmale aufweisen, Auswahlen der anderen Dokumente umfassen.
  12. Verfahren, das von einem oder mehreren Prozessoren implementiert wird und umfasst: Empfangen einer Anfrage, wobei die Anfrage von einem Anwender über eine Anwenderschnittstellen-Eingabevorrichtung einer Rechenvorrichtung des Anwenders eingegeben wird; Identifizieren von Antwortdokumenten in Antwort auf die Anfrage, wobei die Antwortdokumente zugriffsbeschränkte Dokumente des Anwenders umfassen, wobei die zugriffsbeschränkten Dokumente nur für den Anwender und eine beliebige beschränkte Gruppe von anderen von dem Anwender festgelegten Anwendern zugänglich sind; Identifizieren eines oder mehrerer Anfragemerkmale für die Anfrage; für jedes mehrerer der zugriffsbeschränkten Dokumente: Identifizieren eines oder mehrerer Dokumentmerkmale für das zugriffsbeschränkte Dokument; und Erzeugen eines anfrageabhängigen Maßes für das zugriffsbeschränkte Dokument basierend auf Maßen vergangener Interaktionen zwischen den Anfragemerkmalen und den Dokumentmerkmalen, wobei jedes der Maße auf einer Menge der vergangenen Interaktionen von entsprechenden Anwendern mit anderen Dokumenten, die eines oder mehrere der Dokumentmerkmale aufweisen, basiert, wenn die anderen Dokumente als Antwort auf entsprechende Anfragen, die eines oder mehrere der Anfragemerkmale aufweisen, präsentiert wurden, und wobei die anderen Dokumente mehrere nicht zugängliche Dokumenten enthalten, auf die der Anwender nicht zugreifen kann; Verwenden der anfrageabhängigen Maße für die zugriffsbeschränkten Dokumente, um eine Präsentationsreihenfolge für die Antwortdokumente zu bestimmen; und Bereitstellen eines oder mehrerer der Antwortdokumente als Antwort auf die Anfrage zur Präsentation basierend auf der Präsentationsreihenfolge, wobei die Präsentation über eine Anwenderschnittstellen-Ausgabevorrichtung der Rechenvorrichtung erfolgt.
  13. Verfahren nach Anspruch 12, wobei die Dokumentmerkmale für das zugriffsbeschränkte Dokument eine Schablone umfassen, die in einem bestimmten Feld des zugriffsbeschränkten Dokuments enthalten ist.
  14. Verfahren nach Anspruch 12 oder Anspruch 13, wobei die anderen Dokumente eines oder mehrere der zugriffsbeschränkten Dokumente ausschließen.
  15. Verfahren nach einem der Ansprüche 12 bis 14, wobei die anderen Dokumente, auf denen ein gegebenes Maß der Maße basiert, aus nicht zugänglichen Dokumenten bestehen, auf die der Anwender nicht zugreifen kann.
  16. Verfahren nach einem der Ansprüche 12 bis 15, das ferner umfasst: für jedes der mehreren der zugriffsbeschränkten Dokumente: Erzeugen eines anfrageunabhängigen Maßes für das zugriffsbeschränkte Dokument auf der Basis von zusätzlichen Maßen von zusätzlichen vergangenen Interaktionen mit den Dokumentmerkmalen als Antwort auf zusätzliche Anfragen, die keines der Anfragemerkmale aufweisen; und ferner Verwenden der anfrageunabhängigen Maße für die zugriffsbeschränkten Dokumente, um die Präsentationsreihenfolge für die Antwortdokumente zu bestimmen.
  17. Verfahren, das von einem oder mehreren Prozessoren implementiert wird und umfasst: Empfangen einer Anfrage, wobei die Anfrage von einem Anwender über eine Anwenderschnittstellen-Eingabevorrichtung einer Rechenvorrichtung des Anwenders eingegeben wird; Identifizieren von Antwortdokumenten in Antwort auf die Anfrage; Identifizieren eines oder mehrerer Anfragemerkmale für die Anfrage; für jedes mehrerer der Dokumente: Identifizieren eines oder mehrerer Dokumentmerkmale für das Dokument; Erzeugen eines anfrageabhängigen Maßes für das Dokument basierend auf Maßen vergangener Interaktionen zwischen den Anfragemerkmalen und den Dokumentmerkmalen, wobei jedes der Maße auf einer Menge der vergangenen Interaktionen von entsprechenden Anwendern mit anderen Dokumenten, die eines oder mehrere der Dokumentmerkmale aufweisen, basiert, wenn die anderen Dokumente als Antwort auf entsprechende Anfragen, die eines oder mehrere der Anfragemerkmale aufweisen, präsentiert wurden, und wobei die anderen Dokumente mehrere Dokumente umfassen, die zusätzlich zu dem Dokument vorhanden sind; Verwenden der anfrageabhängigen Maße für die Dokumente, um eine Präsentationsreihenfolge für die Antwortdokumente zu bestimmen; und Bereitstellen eines oder mehrerer der Antwortdokumente als Antwort auf die Anfrage zur Präsentation basierend auf der Präsentationsreihenfolge, wobei die Präsentation über eine Anwenderschnittstellen-Ausgabevorrichtung der Rechenvorrichtung erfolgt.
  18. Verfahren nach Anspruch 17, wobei die Dokumentmerkmale für das Dokument eine Schablone umfassen, die in einem bestimmten Feld des Dokuments enthalten ist.
  19. Verfahren nach Anspruch 17 oder 18, das ferner umfasst: für jedes der mehreren der Dokumente: Erzeugen eines anfrageunabhängigen Maßes für das Dokument auf der Basis zusätzlicher Maße von zusätzlichen vergangenen Interaktionen mit den Dokumentmerkmalen als Antwort auf zusätzliche Anfragen, die keines der Anfragemerkmale aufweisen; und ferner Verwenden der anfrageunabhängigen Maße für die Dokumente, um die Präsentationsreihenfolge für die Antwortdokumente zu bestimmen.
DE102017122363.0A 2016-10-24 2017-09-26 Einstufen von Suchergebnisdokumenten Pending DE102017122363A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/332,839 2016-10-24
US15/332,839 US10394832B2 (en) 2016-10-24 2016-10-24 Ranking search results documents

Publications (1)

Publication Number Publication Date
DE102017122363A1 true DE102017122363A1 (de) 2018-04-26

Family

ID=60002102

Family Applications (2)

Application Number Title Priority Date Filing Date
DE102017122363.0A Pending DE102017122363A1 (de) 2016-10-24 2017-09-26 Einstufen von Suchergebnisdokumenten
DE202017105863.8U Active DE202017105863U1 (de) 2016-10-24 2017-09-26 Einstufen von Suchergebnisdokumenten

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE202017105863.8U Active DE202017105863U1 (de) 2016-10-24 2017-09-26 Einstufen von Suchergebnisdokumenten

Country Status (5)

Country Link
US (2) US10394832B2 (de)
CN (1) CN107977398B (de)
DE (2) DE102017122363A1 (de)
GB (1) GB2556676A (de)
WO (1) WO2018080673A1 (de)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10713310B2 (en) 2017-11-15 2020-07-14 SAP SE Walldorf Internet of things search and discovery using graph engine
US10726072B2 (en) 2017-11-15 2020-07-28 Sap Se Internet of things search and discovery graph engine construction
CN109308347A (zh) * 2018-08-22 2019-02-05 深圳点猫科技有限公司 一种教育平台的排行榜数据的高亮显示方法及电子设备
RU2019128026A (ru) 2019-09-05 2021-03-05 Общество С Ограниченной Ответственностью «Яндекс» Способ и система для ранжирования множества цифровых документов
US11301464B2 (en) * 2020-01-14 2022-04-12 Videoamp, Inc. Electronic multi-tenant data management system
US11853299B2 (en) 2021-12-01 2023-12-26 Videoamp, Inc. Symmetric data clean room

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2004240244A1 (en) 1995-10-31 2005-01-27 Frederick S. M. Herz System for Customized Electronic Identification of Desirable Objects
CN1826596A (zh) * 2002-09-24 2006-08-30 Google公司 用于提供相关广告服务的方法和装置
US7698270B2 (en) * 2004-12-29 2010-04-13 Baynote, Inc. Method and apparatus for identifying, extracting, capturing, and leveraging expertise and knowledge
WO2007124430A2 (en) 2006-04-20 2007-11-01 Collarity, Inc. Search techniques using association graphs
US7693836B2 (en) * 2005-12-27 2010-04-06 Baynote, Inc. Method and apparatus for determining peer groups based upon observed usage patterns
JP5057885B2 (ja) * 2007-08-16 2012-10-24 株式会社東芝 メール処理装置、方法及びプログラム並びにメール検索装置
CN101630315B (zh) * 2008-07-16 2011-09-14 清华大学 一种快速检索方法及系统
US8762385B2 (en) * 2011-01-28 2014-06-24 Oracle International Corporation Methods and systems for implementing email recipient templates
CN104734943B (zh) * 2015-03-17 2018-11-20 深圳市连用科技有限公司 一种电子邮件的处理方法及系统
US20170093771A1 (en) * 2015-09-30 2017-03-30 Bank Of America Corporation Electronic mail cluster analysis by internet header information

Also Published As

Publication number Publication date
WO2018080673A1 (en) 2018-05-03
GB2556676A (en) 2018-06-06
US20190377741A1 (en) 2019-12-12
CN107977398B (zh) 2021-12-10
GB201715602D0 (en) 2017-11-08
US10394832B2 (en) 2019-08-27
DE202017105863U1 (de) 2017-12-08
CN107977398A (zh) 2018-05-01
US20180113866A1 (en) 2018-04-26
US10970293B2 (en) 2021-04-06

Similar Documents

Publication Publication Date Title
DE102017122363A1 (de) Einstufen von Suchergebnisdokumenten
DE202016008163U1 (de) Vorrichtung für das Ermitteln des nicht-textlichen Antwortinhalts zur Einbeziehung in eine Antwort auf eine elektronische Kommunikation
DE202016008241U1 (de) Bereitstellen von Vorschlägen für die Interaktion mit einem automatisierten Assistenten in einem Multi-User Nachrichtenaustausch-Thread
DE112016002395T5 (de) Zugriffskontrolle für Datenressourcen
US8543591B2 (en) Method and system for generating and sharing dataset segmentation schemes
DE112016005374T5 (de) Identifizieren von Abfragemustern und zugeordneten aggregierten Statistikdaten unter Suchabfragen
DE202016008173U1 (de) Einbindung von auswählbaren Anwendungsverknüpfungen in Nachrichtenaustausch-Threads
DE69933187T2 (de) Dokumentensuchverfahren und Dienst
DE202017105142U1 (de) Verwenden einer Anwendereingabe, um Suchergebnisse, die für die Darstellung für den Anwender bereitgestellt werden, anzupassen
DE202017105851U1 (de) Bestimmen semantisch diverser Antworten zur Lieferung als Vorschläge zur Aufnahme in elektronischen Kommunikationen
DE202012013462U1 (de) Datenverarbeitung in einem Mapreduce-Framework
DE202016008217U1 (de) Automatisch augmentierende Nachrichenaustauschthreads besierend auf der Nachrichtenklassifizierung
DE102015009912A1 (de) Adaptives Modifizieren von Inhalten, die in elektronischen Formularen präsentiert werden
DE202014011539U1 (de) System zum verteilten Verarbeiten in einer Nachrichtenübermittlungsplattform
DE202016107375U1 (de) Festlegung von Antwortinhalt für eine Antwort auf eine elektronische Kommunikation
DE202017105844U1 (de) Bereitstellen einer Eingabeaufforderung in einer automatisierten Dialogsitzung basierend auf ausgewähltem Inhalt von vorherigen automatisierten Dialogsitzungen
DE212017000237U1 (de) Suche und Abruf von strukturierten Informationskarten
DE102013222384A1 (de) Sicherheits-Screening auf Kontextgrundlage für Zugriff auf Daten
DE102013210891A1 (de) Dynamisches Substituieren von Übersetzungen
DE202014011541U1 (de) System zum Herstellen einer Vertrauensverknüpfung
DE112018005076T5 (de) Erstellen einer rangfolge von dokumenten auf grundlage ihres semantischen reichtums
DE112018006345T5 (de) Abrufen von unterstützenden belegen für komplexe antworten
DE102014112983A1 (de) Aktive Wissenslenkung beruhend auf Dokumententiefenanalyse
DE202014010951U1 (de) Entfernungsabhängige Herabstufung von Suchrankings
DE202017104019U1 (de) System zum Steuern eines Computers zum Initiieren der Ausführung einer computerbasierten Aktion

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06F0017300000

Ipc: G06F0016000000

R082 Change of representative

Representative=s name: VENNER SHIPLEY GERMANY LLP, DE

Representative=s name: VENNER SHIPLEY LLP, DE

R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06F0016000000

Ipc: G06F0016930000