New! View global litigation for patent families

DE602004003361T2 - System und verfahren zur erzeugung von verfeinerungskategorien für eine gruppe von suchergebnissen - Google Patents

System und verfahren zur erzeugung von verfeinerungskategorien für eine gruppe von suchergebnissen

Info

Publication number
DE602004003361T2
DE602004003361T2 DE200460003361 DE602004003361T DE602004003361T2 DE 602004003361 T2 DE602004003361 T2 DE 602004003361T2 DE 200460003361 DE200460003361 DE 200460003361 DE 602004003361 T DE602004003361 T DE 602004003361T DE 602004003361 T2 DE602004003361 T2 DE 602004003361T2
Authority
DE
Grant status
Grant
Patent type
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE200460003361
Other languages
English (en)
Other versions
DE602004003361D1 (de )
Inventor
Stephen Redding GATES
Alexander Mount Kisco HOLT
Michael Ridgewood MORAN
Pat Westfield VELDERMAN
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Grant date

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRICAL DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/30Information retrieval; Database structures therefor ; File system structures therefor
    • G06F17/30861Retrieval from the Internet, e.g. browsers
    • G06F17/30864Retrieval from the Internet, e.g. browsers by querying, e.g. search engines or meta-search engines, crawling techniques, push systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Description

  • HINTERGRUND DER ERFINDUNG
  • 1. Technisches Gebiet
  • [0001]
    Die vorliegende Erfindung betrifft allgemein das Kategorisieren von Suchergebnissen und insbesondere ein System und ein Verfahren zur Erzeugung von Verfeinerungskategorien für eine Gruppe von Suchergebnissen.
  • 2. Zugrunde liegende Technik
  • [0002]
    Mit dem explosionsartigen Wachstum verteilter Netze wie des Internets und des World Wide Webs ist die Möglichkeit einer effektiven Suche nach elektronischen Informationen immer wichtiger geworden. Die meisten webbasierten Suchmaschinen wie zum Beispiel GOOGLE® ermöglichen einem Benutzer für die Suche nach relevanten Dokumenten die Eingabe einer Abfrage, die aus Schlüsselwörtern besteht. Leider liefert eine typische Suche mit Schlüsselwörtern als Ergebnis oft eine Gruppe mit zig- oder hunderttausenden von „Treffern", d. h. Links zu Webseiten, welche die Schlüsselwörter enthalten. Obwohl die meisten Suchmaschinen versuchen, die relevantesten Dokumente an vorderer Stelle anzuzeigen, ist nicht garantiert, dass der von der Suchmaschine verwendete Algorithmus die für den Benutzer relevantesten Ergebnisse findet.
  • [0003]
    Ein Ansatz zur Lösung dieses Problems wird in der US-Patentschrift 6,363,377 beschrieben. In diesem Dokument wird ein mit einer Suchmaschine für ein Informationsmanagementsystem zu verwendendes Tool beschrieben, das Verfahren zur Verfeinerung, Filterung und Verwaltung von Suchabfragen und Suchergebnissen beinhaltet. Das Tool nutzt einen dynamischen Filter, der einen dynamischen Satz von Datensatz-Token verwendet, um die Ergebnisse einer beliebigen Suchabfrage einzuschränken und so Datensätze selektiv einzuschließen oder auszuschließen, die dem Satz von Datensatz-Token entsprechen. Das Tool beinhaltet auch einen Ergebnisorganizer, der den Benutzer beim Verstehen und Veranschaulichen einer großen Anzahl passender, als Reaktion auf eine Suchabfrage zurückgegebener Dokumente unterstützt, indem er bei der Suche gefundene ähnliche Objekte gruppiert.
  • [0004]
    Ein anderer Ansatz zur Lösung des Problems besteht darin, einen Mechanismus zu schaffen, der dem Benutzer eine weitere Einengung der erhaltenen Ergebnisse erlaubt. Zum Beispiel werden in der US-Patentschrift 5,924,090 mit dem Titel „Method and Apparatus for Searching a Database of Records", am 13. Juli 1999 erteilt an Krellenstein, Suchergebnisse nach verschiedenen Metadatenattributen in einen überschaubaren Satz (z. B. acht bis zehn) hierarchischer Kategorien gegliedert. Der Benutzer kann dann die Suchergebnisse durch Auswählen einer Kategorie filtern. Die Methodik der oben genannten Patentschrift zur Erzeugung von Kategorien für den Endbenutzer weist leider bestimmte Einschränkungen auf. Insbesondere werden die Kategorien mittels eines gewichteten Auswertungsalgorithmus ausgewählt, der oft bewirkt, dass eine Kindkategorie (oder Enkelkategorie) neben ihrer Elternkategorie angezeigt wird. Zum Beispiel kann bei einer Suche nach dem Begriff „disk drive" (Plattenlaufwerk) die Elternkategorie „Hardware" zusammen mit der Kindkategorie „Personal Computer" und der Enkelkategorie „PC Peripherals" (PC-Peripherieeinheiten) angezeigt werden. Ein derartiges Ergebnis hilft dem Benutzer möglicherweise nicht bei der Einengung der Suchergebnisse, da er immer noch mehrere Kategorien durchsuchen muss, um die besten Ergebnisse zu finden.
  • [0005]
    Demzufolge besteht ein Bedarf an einem System und einem Verfahren zur wirksameren Erzeugung von Verfeinerungskategorien als Reaktion auf Abfragen, die an eine Suchmaschine gerichtet werden.
  • ÜBERBLICK ÜBER DIE ERFINDUNG
  • [0006]
    Die vorliegende Erfindung löst die oben erwähnten sowie weitere Probleme, indem sie ein System und ein Verfahren zur Erzeugung von „Verfeinerungs"-Kategorien für eine Gruppe von Suchergebnissen in einer Ergebnisgruppe bereitstellt. Gemäß einem ersten Aspekt stellt die Erfindung ein Verfahren zur Erzeugung eines Satzes von Verfeinerungskategorien als Reaktion auf eine Suchabfrage bereit, wobei das Verfahren Folgendes umfasst: Erzeugen einer Gruppe von Suchergebnissen als Reaktion auf eine Abfrage; Ermitteln einer Hierarchie von Kategorien, nach der diese Gruppe von Suchergebnissen kategorisiert ist; Zuweisen einer Rangstufe zu jeder ermittelten Kategorie, basierend auf einer Anzahl von Suchergebnissen, die in jede ermittelte Kategorie kategorisiert sind; Auswählen eines anfänglichen Satzes von Verfeinerungskategorien aus den ermittelten Kategorien, basierend auf der Rangordnung; Entfernen aller Kategorien aus dem anfänglichen Satz von Verfeinerungskategorien, für die es in dem anfänglichen Satz von Verfeinerungskategorien einen hierarchischen Vorgänger gibt; und Anzeigen eines resultierenden Satzes von Verfeinerungskategorien auf einer Oberfläche, um einem Endbenutzer zu ermöglichen, aus dem resultierenden Satz von Verfeinerungskategorien eine Kategorie auszuwählen und so die Gruppe der Suchergebnisse auf diejenigen Suchergebnisse einzuengen, die zu der ausgewählten Kategorie gehören.
  • [0007]
    Gemäß einem zweiten Aspekt schafft die Erfindung ein System zum Bereitstellen eines Satzes von Verfeinerungskategorien für eine Gruppe von Suchergebnissen, die als Reaktion auf eine Suchabfrage erzeugt wurden, wobei das System Folgendes umfasst: ein Kategorieermittlungssystem, das jedes Suchergebnis analysiert und eine Hierarchie von Kategorien ermittelt, nach welcher die Gruppe von Suchergebnissen kategorisiert ist, um so die Liste der ermittelten Kategorien zu liefern; ein Rangordnungssystem, das jeder Kategorie in der Liste der ermittelten Kategorien eine Rangstufe zuweist; und ein Auswahlsystem, das aus der Liste der ermittelten Kategorien eine vorgegebene Anzahl von Kategorien mit der höchsten Rangstufe auswählt, um einen anfänglichen Satz von Verfeinerungskategorien zu erzeugen, wobei das Auswahlsystem alle Kategorien aus dem anfänglichen Satz von Verfeinerungskategorien entfernt, für die es in dem anfänglichen Satz von Verfeinerungskategorien einen hierarchischen Vorgänger gibt; und eine Oberfläche, die einem Endbenutzer ermöglicht, aus dem Satz von Verfeinerungskategorien eine Kategorie auszuwählen, um eine Gruppe von Suchergebnissen auf diejenigen Suchergebnisse weiter einzuengen, die zu der ausgewählten Kategorie gehören.
  • KURZBESCHREIBUNG DER ZEICHNUNGEN
  • [0008]
    Diese sowie weitere Merkmale dieser Erfindung werden aus der folgenden detaillierten Beschreibung der verschiedenen Aspekte der Erfindung in Verbindung mit den beiliegenden Zeichnungen leichter verständlich, wobei:
  • [0009]
    1 ein Suchverfeinerungssystem gemäß der vorliegenden Erfindung zeigt;
  • [0010]
    2 einen beispielhaften Screenshot einer Gruppe von Suchergebnissen und eines Satzes von Verfeinerungskategorien gemäß der vorliegenden Erfindung zeigt.
  • DETAILLIERTE BESCHREIBUNG DER ERFINDUNG
  • [0011]
    1 stellt ein Suchverfeinerungssystem 10 dar, das eine Suchabfrage 30 annimmt und eine Suchausgabe 32 liefert, welche aus einer Ergebnisgruppe 34 (d. h. einer Liste von gefundenen Dokumenten) und einem Satz von Verfeinerungskategorien 36 besteht. Wenn der Benutzer den Umfang der Suche einengen muss, kann dem Suchverfeinerungssystem 10 eine Verfeinerungskategorieauswahl 38 angeboten werden, um die ursprüngliche Abfrage 30 zu verfeinern.
  • [0012]
    2 zeigt einen beispielhaften Screenshot einer Oberfläche 40, der diese Merkmale darstellt. Die Oberfläche 40 zeigt, dass die eingegebene Abfrage „disk drives" 46 eine Liste von Suchergebnissen 42 zum Thema Plattenlaufwerke und einen Satz von Verfeinerungskategorien in einem Dialogfeld mit Dropdown-Liste 44 liefert. Die Suchmaschine 12 findet für diese spezielle Abfrage 113.453 Dokumente. Der Endbenutzer kann eine der Verfeinerungskategorien, z. B. „Notebooks", auswählen, um die Abfrage weiter einzuengen und dadurch die Anzahl der gefundenen Dokumente zu verringern. Wenn ein Endbenutzer eine Verfeinerungskategorie auswählt, bewirkt das Verfeinerungsanalysesystem 24 (1), dass die ursprüngliche Ergebnisgruppe 34 gefiltert wird, damit diese nur noch Dokumente beinhaltet, die zu der ausgewählten Kategorie (z. B. „Notebooks") gehören. Mechanismen zum Ausführen einer solchen Filteroperation sind in der Technik bekannt und werden deshalb nicht weiter erörtert.
  • [0013]
    Die vorliegende Erfindung löst wie oben erwähnt das Problem der Bereitstellung effektiver Verfeinerungskategorien 36, die für den Endbenutzer von höchstem Wert sind. Das Suchverfeinerungssystem 10 von 1 zeigt eine beispielhafte Ausführungsart zum Erzielen solcher Ergebnisse, wenn die Abfrage 30 in die Suchmaschine 12 eingegeben wird. Die Suchmaschine 12 kann ein beliebiges Datensuchsystem umfassen, das in der Lage ist, anhand einiger eingegebener Kriterien Ergebnisse 14 zu ermitteln. Die Suchmaschine 12 kann lokal in ein Suchverfeinerungssystem 10 integriert sein oder als eine Remote-Anwendung wie beispielsweise GOOGLE genutzt werden, auf die über das Web zugegriffen werden kann. Die Ergebnisse 14 können üblicherweise eine Liste von Dokumenten und deren Standort oder deren Adresse in einem Netzwerk umfassen. Die Ergebnisse 14 können elektronische Informationen in beliebiger Form umfassen, einschließlich Webseiten oder andere Markup-Language-Dokumente, Datenbankeinträge, Dateien, Dokumente oder jede andere Art elektronisch gespeicherter Datensätze usw.
  • [0014]
    Jedes der Ergebnisse 14 kann einige zusätzliche Informationen enthalten, z. B. Metadaten zur weiteren Beschreibung des Ergebnisses. Zum Beispiel können die Metadaten zur Beschreibung der Thematik, der geografischen Zuordnung, des Industriezweigs usw. eines gefundenen Dokuments genutzt werden. Darüber hinaus können die Metadaten nach hierarchischen Taxonomien gegliedert werden, zum Beispiel:
    Weltall/Milchstraße/Sonnensystem/Erde/Nordamerika/Vereinigte Staaten/New York/NYC.
  • [0015]
    Bei der in 1 dargestellten beispielhaften Ausführungsart prüft das Kategorieermittlungssystem 16 die in jedem Ergebnis 14 enthaltenen Metadaten und ermittelt für jedes der Ergebnisse 14 eine oder mehrere entsprechende hierarchische Kategorien oder weist diese dem Ergebnis zu. Im obigen Beispiel würde die ermittelte Kategorie NYC lauten, da diese als der detaillierteste Knoten der Hierarchie angegeben ist. Hierzu ist zu bemerken, dass der Anzahl und/oder der Größe der Hierarchien, die in den Metadaten dargestellt werden können, keine Grenzen gesetzt sind. Zum Beispiel können manche Hierarchien nur einen einzigen, andere hingegen viele hunderte oder tausende Knoten aufweisen. Außerdem können manche Knoten mehreren Hierarchien angehören.
  • [0016]
    Eine alternative Ausführungsart, bei der zum Beispiel keine Metadaten bereitgestellt werden, könnte durch Verwendung anderer Mittel als der Metadaten für jedes Ergebnis hierarchische Kategorien ermitteln. Zum Beispiel könnte das Kategorieermittlungssystem 16 Kategorien ausgehend von einer Analyse anderer Daten in einem Dokument, z. B. der Schlagwörter oder der Häufigkeit von Schlüsselwörtern, zuordnen. Eine beispielhafte Implementierung eines automatisierten Kategorisierungssystems wird in der US-Patentschrift 6,360,227 mit dem Titel „System and Method for Generating Taxonomies With Applications to Content-Based Recommendations", am 19. März 2002 an Aggrawal et al. erteilt, dargelegt, die durch die Bezugnahme Bestandteil dieses Patents ist. Jedem Ergebnis 14 wird ungeachtet der Art der Ermittlung der Kategorien mindestens eine entsprechende hierarchische Kategorie zugeordnet.
  • [0017]
    Nachdem alle Ergebnisse 14 verarbeitet worden sind, gibt das Kategorieermittlungssystem 16 eine Liste ermittelter Kategorien 17 aus (d. h. aller ermittelter Kategorien für alle Ergebnisse 14). Die Anzahl der möglichen Kategorien in der Kategorieliste 17 ist praktisch unbegrenzt und kann zum Beispiel von einer bis zu vielen Tausend Kategorien reichen. Da die Liste derart umfangreich sein kann, muss sie normalerweise auf eine überschaubare Anzahl gekürzt werden, die dem Benutzer vernünftig angezeigt werden kann. Das Auswahlsystem 18 stellt diese Funktion zur Verfügung, indem es die Liste der ermittelten Kategorien 17 analysiert und einen geeigneten Satz von Verfeinerungskategorien 36 auswählt. Zu diesem Zweck beinhaltet das Auswahlsystem 18 ein Rangordnungssystem 20 und ein Kategorieprüfsystem 22, mit deren Hilfe aus der Liste der Kategorien 17 die passendsten Verfeinerungskategorien ermittelt werden können.
  • [0018]
    Das Rangordnungssystem 20 weist jeder Kategorie in der Kategorieliste 17 eine Rangstufe zu. Bei einer Ausführungsart werden die Rangstufen den Kategorien basierend auf der Häufigkeit zugewiesen, d. h. wie oft das Kategorieermittlungssystem 16 ermittelt hat, dass eine Kategorie zu den Suchergebnissen 14 gehört. Mit anderen Worten, das Rangordnungssystem 20 prüft jede Kategorie und bestimmt, wie viele Suchergebnisse 14 zu jeder Kategorie gehören. Dann wird jeder Kategorie, bei der höchsten Rangstufe beginnend und bei der niedrigsten Rangstufe endend, eine Rangstufe zugewiesen (d. h. „nach Rangstufen geordnet"). Es können auch andere Rangordnungen verwendet werden, wie zum Beispiel entsprechend dem Grad der Übereinstimmung mit einem benutzerspezifischen Interessenprofil oder der Position innerhalb einer vorgegebenen Themenontologie.
  • [0019]
    Als hypothetisches Beispiel wird angenommen, die Suchmaschine 12 hat 100.000 Suchergebnisse geliefert und das Kategorieermittlungssystem 16 hat für die 100.000 Ergebnisse eine Liste mit 200 Kategorien ermittelt. Da das Anzeigen der 200 Kategorien für den Endbenutzer zur Einengung der Suche ein unpraktisches Mittel wäre, muss aus den 200 Kategorien eine begrenzte Anzahl anzuzeigender Kategorien ausgewählt werden. Angenommen, die Rangstufen wurden den 200 Kategorien wie folgt zugewiesen, wobei die Kategorie „NYC" die höchste Rangstufe bekommt, da sie für 25,000 der 100,000 Suchergebnisse ermittelt wurde:
  • Figure 00090001
  • [0020]
    Aus dieser Rangordnung würde das Auswahlsystem 18 einen anfänglichen Satz von N Kategorien mit der höchsten Rangstufe auswählen, wobei N eine beliebige Zahl von Verfeinerungskategorien ist, die sich zum Anzeigen eignet. Wenn N zum Beispiel gleich 6 ist, würde somit der anfängliche Satz von Kategorien die Begriffe NYC, New York, Unterhaltung, Architektur, Banken und Museen einschließen. Bei einer einfachen Ausführungsart könnten diese Ergebnisse als resultierender Satz von Verfeinerungskategorien 36 angezeigt werden. Die vorliegende Erfindung stellt jedoch ein Kategorieprüfsystem 22 zur weiteren Verbesserung der Ergebnisse durch Prüfung der hierarchischen Beziehungen zwischen den Kategorien bereit.
  • [0021]
    Das Kategorieprüfsystem 22 entfernt insbesondere, sobald der anfängliche Satz von Kategorien ermittelt worden ist, alle Kategorien aus dem anfänglichen Satz, die im anfänglichen Satz eine hierarchische Eltern- oder Vorgängerkategorie haben. Das heißt, die Hierarchie jeder Kategorie wird „schrittweise von unten nach oben durchgeprüft", um zu ermitteln, ob es im anfänglichen Satz von Kategorien eine umfassendere Kategorie gibt. Um dies zu erreichen, wird die Vorgängerhierarchie für jede ermittelte Kategorie zur Verfügung gestellt, zum Beispiel durch Speicherung der Vorgängerhierarchie innerhalb des Dokumentes zusammen mit der Kategorie selbst, oder durch Speicherung der Hierarchieinformation an anderer Stelle innerhalb des Suchverfeinerungssystems 10. Zum Beispiel wurde oben erwähnt, dass der Begriff NYC innerhalb der Metadatenhierarchie Weltall/Milchstraße/Sonnensystem/Erde/Nordamerika/Vereinigte Staaten/New York/NYC dargestellt wurde. Da es für NYC im anfänglichen Satz eine Elternkategorie New York gibt, würde NYC dementsprechend aus dem anfänglichen Satz entfernt werden. Dasselbe gilt für die Annahme, dass die Kategorie „Museen" in der Hierarchie Unterhaltung/Kunst & Kultur/Museen steht, sodass die Kategorie Museen ebenfalls entfernt würde, da es für sie im anfänglichen Satz den Vorgänger (d. h. die Großelternkategorie) Unterhaltung gibt.
  • [0022]
    Es sollte klar sein, dass zum Entfernen von Kategorien ebenso jede andere Art Ausscheidungskriterium herangezogen werden könnte. Zum Beispiel kann das Ausscheidungskriterium auf anderen hierarchischen Beziehungen zwischen Knoten einer Taxonomie im anfänglichen Satz von Verfeinerungskategorien beruhen. Alternativ kann das Ausscheidungskriterium auf einem Interessenprofil des Benutzers beruhen.
  • [0023]
    Nachdem alle Kategorien mit hierarchischen Vorgängern entfernt worden sind, kann für jede aus der Kategorieliste 17 entfernte Kategorie eine Kategorie mit der nächsthöchsten Rangstufe in die anfängliche Liste eingefügt werden. Da im oben angeführten Beispiel zwei Kategorien entfernt wurden, würden die beiden Kategorien mit der nächsthöchsten Rangstufe hinzugefügt werden, in diesem Falle Reisen und Import/Export. Der neu gebildete Satz von Verfeinerungskategorien kann erneut auf hierarchische Vorgänger überprüft werden, und der Prozess des Entfernens und Hinzufügens von Kategorien kann so lange wiederholt werden, bis es für die Kategorien im anfänglichen Satz keine hierarchischen Vorgänger mehr gibt.
  • [0024]
    Wenn keine weiteren Ersetzungen mehr erforderlich sind, kann zum Schluss eine Zusatzkategorie, z. B. „Sonstige", an die Liste angehängt werden, um den resultierenden Satz von Verfeinerungskategorien 36 zu erstellen. Die Kategorie „Sonstige" ermöglicht den Zugriff auf alle anderen im Satz von Verfeinerungskategorien 36 nicht aufgeführten Kategorien.
  • [0025]
    Im Folgenden wird ein exemplarischer Algorithmus zur Implementierung der vorliegenden Erfindung vorgestellt, der einen Algorithmus zum Auswählen von Kategorien beinhaltet, wenn der Benutzer die Zusatzkategorie „Sonstige" ausgewählt hat.
  • I. Anfängliche Auswahl von Kategorien nach der Häufigkeit
    • 1. Entscheiden, wie viele Kategorien angezeigt werden sollen – im Folgenden als Anzahl d bezeichnet.
    • 2. Sortieren der Kategorieliste nach der Häufigkeit in absteigender Reihenfolge.
    • 3. Fortsetzen mit Schritt 8, wenn die Anzahl Kategorien kleiner als oder gleich d ist.
    • 4. Auswählen der obersten d – 1 Kategorien.
    • 5. Entfernen aller Kindkategorien (Enkelkategorien usw.) aus der Auswahl.
    • 6. Fortsetzen mit Schritt 7, wenn die aktuelle Auswahl d – 1 Kategorien enthält. Andernfalls Kategorien aus der sortierten Liste hinzufügen und mit Schritt 5 fortsetzen.
    • 7. Anhängen einer Kategorie „Sonstige".
    • 8. Anzeigen der Auswahl.
  • II. Ermitteln der Kategorien in der Kategorie „Sonstige"
    • 1. Wenn die Kategorie „Sonstige" ausgewählt wird, wird mit derselben Abfrage eine erneute Suche durchgeführt, von der jedoch die vorherige Liste der Kategorien und ihrer Kindkategorien (Enkelkategorien usw.) ausgeschlossen ist.
    • 2. Entfernen aller Kindkategorien (Enkelkategorien, usw.) aus der aktuellen Liste der Kategorien.
    • 3. Fortsetzen mit Schritt 6, wenn die Anzahl der Kategorien kleiner als d ist.
    • 4. Auswählen der ersten Kategorie, Hinzufügen von deren Elternkategorie, wenn diese nicht den Stammknoten darstellt, und Entfernen der Kindkategorie aus der aktuellen Liste, andernfalls:
    • 5. Entfernen aller Kindkategorien aus der gesamten Liste, Fortsetzen mit Schritt 3.
    • 6. Anzeigen der Auswahl.
  • [0026]
    Offensichtlich können zahlreiche Varianten des obigen Algorithmus verwendet werden, die innerhalb des Geltungsbereichs der Erfindung liegen.
  • [0027]
    Es versteht sich, dass die hier beschriebenen Systeme, Funktionen, Mechanismen, Verfahren und Module in Form von Hardware, Software oder einer Kombination aus Hardware und Software implementiert sein können. Diese können durch eine beliebige Art von Computersystem oder eine andere Vorrichtung implementiert werden, die dafür ausgelegt ist, die hierin beschriebenen Verfahren auszuführen. Eine typische Kombination aus Hardware und Software kann ein Universalcomputersystem mit einem Computerprogramm sein, das, wenn es geladen und ausgeführt wird, das Computersystem so steuert, dass dieses die im vorliegenden Dokument beschriebenen Verfahren ausführt. Alternativ kann ein Spezialrechner verwendet werden, der eine spezialisierte Hardware zum Ausführen einer oder mehrerer der Funktionsaufgaben der Erfindung enthält. Die vorliegende Erfindung kann auch in ein Computerprogrammprodukt eingebettet sein, das alle Merkmale umfasst, die das Implementieren der im vorliegenden Dokument beschriebenen Verfahren und Funktionen ermöglichen, und – wenn es in ein Computersystem geladen wird – in der Lage ist, diese Verfahren und Funktionen auszuführen. Unter einem Computerprogramm, Softwareprogramm, Programm, Programmprodukt oder einer Software ist im vorliegenden Zusammenhang ein beliebiger Ausdruck in einer beliebigen Sprache, einem beliebigen Code oder einer beliebigen Notation eines Satzes von Anweisungen zu verstehen, die dafür vorgesehen sind, ein System mit einer Informationsverarbeitungsfunktionalität zu veranlassen, eine bestimmte Funktion entweder direkt oder nach einem oder beiden der folgenden Schritte auszuführen: (a) Umwandeln in eine andere Sprache, einen anderen Code oder eine andere Notation; und/oder (b) Wiedergabe in einer anderen materiellen Form.
  • [0028]
    Die obige Beschreibung der bevorzugten Ausführungsarten der Erfindung dient der Veranschaulichung und Beschreibung. Die obigen Ausführungsarten sind nicht als erschöpfend anzusehen und sollen nicht die Erfindung auf genau die dargelegte Form beschränken, sodass angesichts der obigen Darlegungen offensichtlich viele Modifikationen und Varianten möglich sind. Solche dem Fachmann geläufigen Modifikationen und Varianten sind im Geltungsbereich der vorliegenden Erfindung enthalten, der durch die beiliegenden Ansprüche definiert wird.

Claims (17)

  1. Verfahren zum Erzeugen eines Satzes von Kategorien als Reaktion auf eine Suchabfrage, wobei das Verfahren Folgendes umfasst: Erzeugen (14) einer Gruppe von Suchergebnissen als Reaktion auf eine Abfrage; Ermitteln (16) einer Hierarchie von Kategorien, nach der diese Gruppe von Suchergebnissen kategorisiert ist; und wobei das Verfahren Folgendes umfasst: Zuweisen (20) einer Rangstufe zu jeder ermittelten Kategorie, basierend auf einer Anzahl von Suchergebnissen, die in jede ermittelte Kategorie kategorisiert sind; Auswählen (18) eines anfänglichen Satzes von Verfeinerungskategorien aus den ermittelten Kategorien, basierend auf der Rangordnung; Entfernen aller Kategorien aus dem anfänglichen Satz von Verfeinerungskategorien, für die es in dem anfänglichen Satz von Verfeinerungskategorien einen hierarchischen Vorgänger gibt; und Anzeigen (32) eines resultierenden Satzes von Verfeinerungskategorien auf einer Oberfläche (38), um einem Endbenutzer zu ermöglichen, aus dem resultierenden Satz von Verfeinerungskategorien eine Kategorie auszuwählen und so die Gruppe der Suchergebnisse auf diejenigen Suchergebnisse einzuengen, die zu der ausgewählten Kategorie gehören.
  2. Verfahren nach Anspruch 1, bei dem der Ermittlungsschritt den Schritt der Prüfung von Metadaten in jedem Suchergebnis beinhaltet, um für jedes der Suchergebnisse mindestens eine Kategorie zu ermitteln.
  3. Verfahren nach Anspruch 1, bei dem der anfängliche Satz von Verfeinerungskategorien kleiner als die Gesamtzahl der im Ermittlungsschritt ermittelten Kategorien ist.
  4. Verfahren nach Anspruch 1, bei dem der anfängliche Satz von Verfeinerungskategorien eine vorgegebene Anzahl der am häufigsten ermittelten Kategorien umfasst.
  5. Verfahren nach Anspruch 1, bei dem nach dem Entfernungsschritt für jede während des Entfernungsschrittes entfernte Kategorie dem resultierenden Satz von Verfeinerungskategorien eine neue Kategorie hinzugefügt wird, die sich nicht in dem anfänglichen Satz von Verfeinerungskategorien befand.
  6. Verfahren nach Anspruch 5, bei dem die neue Kategorie eine Kategorie mit der nächsthöchsten Rangstufe ist.
  7. Verfahren nach Anspruch 1, bei dem der Entfernungsschritt für den resultierenden Satz von Verfeinerungskategorien so lange wiederholt wird, bis sich in dem resultierenden Satz von Verfeinerungskategorien keine Kategorien mehr befinden, für die es hierarchische Vorgänger gibt.
  8. Verfahren nach Anspruch 1, bei dem der resultierende Satz von Verfeinerungskategorien eine Zusatzkategorie beinhaltet, die den Zugriff auf ermittelte Kategorien ermöglicht, die sich nicht in dem resultierenden Satz von Verfeinerungskategorien befinden.
  9. Verfahren nach Anspruch 1, bei dem die Ermittlungsschritte den Schritt der Verwendung eines automatisierten Kategorisierungssystems zum Ermitteln der Kategorie beinhalten, zu welcher das Dokument gehört.
  10. System (10) zum Bereitstellen eines Satzes von Verfeinerungskategorien für eine Gruppe von Suchergebnissen, die als Reaktion auf eine Suchabfrage erzeugt wurden, wobei das System Folgendes umfasst: ein Kategorieermittlungssystem (16), das jedes Suchergebnis analysiert und eine Hierarchie von Kategorien ermittelt, nach welcher die Gruppe von Suchergebnissen kategorisiert ist, um so die Liste der ermittelten Kategorien (17) zu liefern; und wobei das System Folgendes umfasst: ein Rangordnungssystem (20), das jeder Kategorie in der Liste der ermittelten Kategorien eine Rangstufe zuweist; und ein Auswahlsystem (18), das aus der Liste der ermittelten Kategorien eine vorgegebene Anzahl von Kategorien mit der höchsten Rangstufe auswählt, um einen anfänglichen Satz von Verfeinerungskategorien zu erzeugen, wobei das Auswahlsystem alle Kategorien aus dem anfänglichen Satz von Verfeinerungskategorien entfernt, für die es in dem anfänglichen Satz von Verfeinerungskategorien einen hierarchischen Vorgänger gibt; und eine Oberfläche (38), die einem Endbenutzer ermöglicht, aus dem Satz von Verfeinerungskategorien eine Kategorie auszuwählen, um die Gruppe von Suchergebnissen auf diejenigen Suchergebnisse weiter einzuengen, die zu der ausgewählten Kategorie gehören.
  11. System nach Anspruch 10, bei dem das Kategorieermittlungssystem Metadaten von jedem Suchergebnis analysiert, um für das Suchergebnis die mindestens eine Kategorie zu ermitteln.
  12. System nach Anspruch 10, bei dem die vom Auswahlsystem verwendete vorgegebene Anzahl der Kategorien mit der höchsten Rangstufe kleiner als die Gesamtzahl der ermittelten Kategorien ist.
  13. System nach Anspruch 10, bei dem das Auswahlsystem für jede durch das Auswahlsystem entfernte Kategorie dem Satz von Verfeinerungskategorien eine Kategorie mit der nächsthöchsten Rangstufe hinzufügt.
  14. System nach Anspruch 10, bei dem der Satz von Verfeinerungskategorien ferner eine Zusatzkategorie beinhaltet, die den Zugriff auf ermittelte Kategorien ermöglicht, die nicht in dem Satz von Verfeinerungskategorien enthalten sind.
  15. System nach Anspruch 10, bei dem das Rangordnungssystem für alle Suchergebnisse jeder Kategorie eine Rangstufe zuweist, die darauf basiert, wie oft die Kategorie durch das Kategorieermittlungssystem ermittelt wurde.
  16. Datenverarbeitungsprogramm zum Ausführen in einem Datenverarbeitungssystem, wobei das Datenverarbeitungsprogramm Softwarecodeabschnitte zum Ausführen eines Verfahrens nach einem der vorhergehenden Ansprüche 1 bis 9 umfasst, wenn das Programm auf dem Computer ausgeführt wird.
  17. Computerprogrammprodukt, das auf einem vom Computer verwendbaren Medium gespeichert ist, wobei das Computerprogrammprodukt computerlesbare Programmmittel umfasst, um einen Computer zum Ausführen eines Verfahrens nach einem der vorhergehenden Ansprüche 1 bis 9 zu veranlassen, wenn das Programm auf dem Computer ausgeführt wird.
DE200460003361 2003-04-29 2004-04-01 System und verfahren zur erzeugung von verfeinerungskategorien für eine gruppe von suchergebnissen Active DE602004003361T2 (de)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US10426166 US7523095B2 (en) 2003-04-29 2003-04-29 System and method for generating refinement categories for a set of search results
US426166 2003-04-29
PCT/EP2004/050409 WO2004097671A3 (en) 2003-04-29 2004-04-01 A system and method for generating refinement categories for a set of search results

Publications (2)

Publication Number Publication Date
DE602004003361D1 DE602004003361D1 (de) 2007-01-04
DE602004003361T2 true DE602004003361T2 (de) 2007-10-04

Family

ID=33309808

Family Applications (1)

Application Number Title Priority Date Filing Date
DE200460003361 Active DE602004003361T2 (de) 2003-04-29 2004-04-01 System und verfahren zur erzeugung von verfeinerungskategorien für eine gruppe von suchergebnissen

Country Status (5)

Country Link
US (2) US7523095B2 (de)
EP (1) EP1618496B1 (de)
CN (1) CN100405366C (de)
DE (1) DE602004003361T2 (de)
WO (1) WO2004097671A3 (de)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7409382B2 (en) * 2000-12-08 2008-08-05 Fujitsu Limited Information processing system, terminal device, method and medium
US7206780B2 (en) * 2003-06-27 2007-04-17 Sbc Knowledge Ventures, L.P. Relevance value for each category of a particular search result in the ranked list is estimated based on its rank and actual relevance values
US20050131781A1 (en) * 2003-12-10 2005-06-16 Ford Motor Company System and method for auditing
US7716158B2 (en) * 2004-01-09 2010-05-11 Microsoft Corporation System and method for context sensitive searching
US7822992B2 (en) * 2004-04-07 2010-10-26 Microsoft Corporation In-place content substitution via code-invoking link
US7890744B2 (en) * 2004-04-07 2011-02-15 Microsoft Corporation Activating content based on state
JP2005354134A (ja) * 2004-06-08 2005-12-22 Sony Corp 画像管理方法および装置、記録媒体、並びにプログラム
US8078977B2 (en) * 2004-06-29 2011-12-13 Blake Bookstaff Method and system for intelligent processing of electronic information
GB0423879D0 (en) * 2004-10-28 2004-12-01 Koninkl Philips Electronics Nv Data processing system and method
JP4756953B2 (ja) * 2005-08-26 2011-08-24 アクセラテクノロジ株式会社 情報検索装置および情報検索方法
US20070067268A1 (en) * 2005-09-22 2007-03-22 Microsoft Corporation Navigation of structured data
US20070078842A1 (en) * 2005-09-30 2007-04-05 Zola Scot G System and method for responding to a user reference query
US7979411B2 (en) * 2006-05-22 2011-07-12 Microsoft Corporation Relating people finding results by social distance
US8224713B2 (en) * 2006-07-28 2012-07-17 Visible World, Inc. Systems and methods for enhanced information visualization
US7974976B2 (en) * 2006-11-09 2011-07-05 Yahoo! Inc. Deriving user intent from a user query
US8108390B2 (en) * 2006-12-21 2012-01-31 Yahoo! Inc. System for targeting data to sites referenced on a page
US7587672B2 (en) * 2006-12-27 2009-09-08 Sap Ag File content preview tool
US20080162433A1 (en) * 2006-12-29 2008-07-03 Jason Wolf Browsable search system
US20080270228A1 (en) * 2007-04-24 2008-10-30 Yahoo! Inc. System for displaying advertisements associated with search results
US9396261B2 (en) * 2007-04-25 2016-07-19 Yahoo! Inc. System for serving data that matches content related to a search results page
KR100930455B1 (ko) * 2007-09-06 2009-12-08 엔에이치엔(주) 쿼리별 검색 컬렉션 생성 방법 및 시스템
US20090138435A1 (en) * 2007-11-26 2009-05-28 Leslie Mannion Techniques for searching and presenting search results
US8364693B2 (en) * 2008-06-13 2013-01-29 News Distribution Network, Inc. Searching, sorting, and displaying video clips and sound files by relevance
US8538943B1 (en) 2008-07-24 2013-09-17 Google Inc. Providing images of named resources in response to a search query
US20100121842A1 (en) * 2008-11-13 2010-05-13 Dennis Klinkott Method, apparatus and computer program product for presenting categorized search results
US8631080B2 (en) * 2009-03-12 2014-01-14 Microsoft Corporation Email characterization
US20100257171A1 (en) * 2009-04-03 2010-10-07 Yahoo! Inc. Techniques for categorizing search queries
CN101887437B (zh) 2009-05-12 2016-03-30 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统
CN102222072A (zh) * 2010-04-19 2011-10-19 腾讯科技(深圳)有限公司 一种信息分类的方法和装置
US8874581B2 (en) * 2010-07-29 2014-10-28 Microsoft Corporation Employing topic models for semantic class mining
US8930390B2 (en) * 2010-10-08 2015-01-06 Yahoo! Inc. Mouse gesture assisted search
US8996495B2 (en) * 2011-02-15 2015-03-31 Ebay Inc. Method and system for ranking search results based on category demand normalized using impressions
CN102708102B (zh) * 2011-03-28 2016-08-31 联想(北京)有限公司 检索信息呈现方法及应用该方法的电子设备
US9117074B2 (en) 2011-05-18 2015-08-25 Microsoft Technology Licensing, Llc Detecting a compromised online user account
US9087324B2 (en) 2011-07-12 2015-07-21 Microsoft Technology Licensing, Llc Message categorization
US9065826B2 (en) 2011-08-08 2015-06-23 Microsoft Technology Licensing, Llc Identifying application reputation based on resource accesses
US9043350B2 (en) * 2011-09-22 2015-05-26 Microsoft Technology Licensing, Llc Providing topic based search guidance
US8762368B1 (en) * 2012-04-30 2014-06-24 Google Inc. Context-based filtering of search results
CN104021125A (zh) * 2013-02-28 2014-09-03 阿里巴巴集团控股有限公司 一种搜索引擎排序的方法、系统以及一种搜索引擎
US20150074101A1 (en) * 2013-09-10 2015-03-12 Microsoft Corporation Smart search refinement
US9773097B2 (en) * 2014-08-06 2017-09-26 Yokogawa Electric Corporation System and method of optimizing blending ratios for producing product
CN104615672A (zh) * 2015-01-16 2015-05-13 中国农业大学 一种农业科技成果检索、展示方法及客户端和服务器

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5201047A (en) * 1989-12-21 1993-04-06 International Business Machines Corporation Attribute-based classification and retrieval system
US5706497A (en) * 1994-08-15 1998-01-06 Nec Research Institute, Inc. Document retrieval using fuzzy-logic inference
JP2960340B2 (ja) * 1995-10-20 1999-10-06 富士ゼロックス株式会社 データ検索方法及び装置
CA2257537C (en) * 1996-06-11 2005-01-25 Yeong Kuang Oon Iterative problem solving technique
US6025843A (en) * 1996-09-06 2000-02-15 Peter Sklar Clustering user interface
US6272507B1 (en) * 1997-04-09 2001-08-07 Xerox Corporation System for ranking search results from a collection of documents using spreading activation techniques
US5924090A (en) * 1997-05-01 1999-07-13 Northern Light Technology Llc Method and apparatus for searching a database of records
US5987457A (en) * 1997-11-25 1999-11-16 Acceleration Software International Corporation Query refinement method for searching documents
US6014662A (en) * 1997-11-26 2000-01-11 International Business Machines Corporation Configurable briefing presentations of search results on a graphical interface
US6297824B1 (en) * 1997-11-26 2001-10-02 Xerox Corporation Interactive interface for viewing retrieval results
US6223145B1 (en) * 1997-11-26 2001-04-24 Zerox Corporation Interactive interface for specifying searches
US6028605A (en) * 1998-02-03 2000-02-22 Documentum, Inc. Multi-dimensional analysis of objects by manipulating discovered semantic properties
JPH11306187A (ja) 1998-04-20 1999-11-05 Nippon Telegr & Teleph Corp <Ntt> カテゴリ付文書の検索結果の提示処理方法およびその装置
US5969283A (en) * 1998-06-17 1999-10-19 Looney Productions, Llc Music organizer and entertainment center
US6226630B1 (en) * 1998-07-22 2001-05-01 Compaq Computer Corporation Method and apparatus for filtering incoming information using a search engine and stored queries defining user folders
US6363377B1 (en) 1998-07-30 2002-03-26 Sarnoff Corporation Search data processor
US6385602B1 (en) * 1998-11-03 2002-05-07 E-Centives, Inc. Presentation of search results using dynamic categorization
US6366910B1 (en) * 1998-12-07 2002-04-02 Amazon.Com, Inc. Method and system for generation of hierarchical search results
US6631496B1 (en) * 1999-03-22 2003-10-07 Nec Corporation System for personalizing, organizing and managing web information
US6175830B1 (en) 1999-05-20 2001-01-16 Evresearch, Ltd. Information management, retrieval and display system and associated method
US6324534B1 (en) * 1999-09-10 2001-11-27 Requisite Technology, Inc. Sequential subset catalog search engine
US6434548B1 (en) * 1999-12-07 2002-08-13 International Business Machines Corporation Distributed metadata searching system and method
US6868525B1 (en) * 2000-02-01 2005-03-15 Alberti Anemometer Llc Computer graphic display visualization system and method
US20020038299A1 (en) 2000-03-20 2002-03-28 Uri Zernik Interface for presenting information
WO2001075728A1 (en) 2000-03-30 2001-10-11 I411, Inc. Methods and systems for enabling efficient retrieval of data from data collections
WO2002013064A3 (en) 2000-08-08 2004-05-21 America Online Inc Searching systems and processes

Also Published As

Publication number Publication date Type
EP1618496A2 (de) 2006-01-25 application
US8037061B2 (en) 2011-10-11 grant
CN1781100A (zh) 2006-05-31 application
WO2004097671A2 (en) 2004-11-11 application
EP1618496B1 (de) 2006-11-22 grant
WO2004097671A3 (en) 2005-03-24 application
DE602004003361D1 (de) 2007-01-04 grant
CN100405366C (zh) 2008-07-23 grant
US20040220902A1 (en) 2004-11-04 application
US20090125491A1 (en) 2009-05-14 application
US7523095B2 (en) 2009-04-21 grant

Similar Documents

Publication Publication Date Title
Perkowitz et al. Adaptive web sites
Story et al. The RightPages image-based electronic library for alerting and browsing
US5924090A (en) Method and apparatus for searching a database of records
US6532469B1 (en) Determining trends using text mining
US20030172061A1 (en) Method and system for creating improved search queries
US20070033221A1 (en) System and method for implementing a knowledge management system
US20050004910A1 (en) Information retrieval
US20050004949A1 (en) Information processing
US6078924A (en) Method and apparatus for performing data collection, interpretation and analysis, in an information platform
US20010039490A1 (en) System and method of analyzing and comparing entity documents
US7502780B2 (en) Information storage and retrieval
US6336112B2 (en) Method for interactively creating an information database including preferred information elements, such as, preferred-authority, world wide web pages
US20060155662A1 (en) Sentence classification device and method
US20060095852A1 (en) Information storage and retrieval
US20040220902A1 (en) System and method for generating refinement categories for a set of search results
Kang et al. NetLens: iterative exploration of content-actor network data
Moed et al. International scientific co-operation and awareness within the European Community: Problems and perspectives
DE102014215621A1 (de) Vorlagensystem zum Generieren von benutzerangepassten Dokumenten
DE19962192A1 (de) Verfahren und System zur Inhaltskonvertierung von elektronischen Daten für drahtlose Vorrichtungen
Qiu Markov models of search state patterns in a hypertext information retrieval system
Turetken et al. Development of a fisheye-based information search processing aid (FISPA) for managing information overload in the web environment
WO2000054185A1 (en) Method and apparatus for building a user-defined technical thesaurus using on-line databases
Poo et al. A hybrid approach for user profiling
DE102010049891A1 (de) Ersatz von maschinell vorgegebenen Stichworten von Webseiten durch manuelle Eingaben
US8108398B2 (en) Auto-summary generator and filter

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8320 Willingness to grant licenses declared (paragraph 23)