DE19651788A1 - Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken - Google Patents

Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken

Info

Publication number
DE19651788A1
DE19651788A1 DE19651788A DE19651788A DE19651788A1 DE 19651788 A1 DE19651788 A1 DE 19651788A1 DE 19651788 A DE19651788 A DE 19651788A DE 19651788 A DE19651788 A DE 19651788A DE 19651788 A1 DE19651788 A1 DE 19651788A1
Authority
DE
Germany
Prior art keywords
search
data records
determined
slave
rel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19651788A
Other languages
English (en)
Other versions
DE19651788C2 (de
Inventor
Wilfried Prof Dr Ing Krug
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to DE19651788A priority Critical patent/DE19651788C2/de
Publication of DE19651788A1 publication Critical patent/DE19651788A1/de
Application granted granted Critical
Publication of DE19651788C2 publication Critical patent/DE19651788C2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

Die Erfindung betrifft ein Verfahren zur Datenermittlung und -aufbereitung in Infor­ mationsnetzwerken, insbesondere in regionalen und globalen Datennetzen, wie dem INTERNET.
Für die selektive Suche von Daten stehen dem Benutzer regionaler oder globaler Rechnerverbundsysteme sogenannte Suchmaschinen zur Verfügung. Dabei handelt es sich um leistungsfähige Netzwerkcomputer, auf denen Rechercheprogramme verarbeitet werden. Der Ablauf einer konventionellen Recherche geht dabei wie folgt vonstatten:
Der Benutzer gibt ein relevantes Suchwort (Deskriptor) über die Eingabeeinrichtungen (Tastatur, Maus, Spracherkennungssystem) seines Computers ein, nachdem er den Zugang zu einer beliebigen Suchmaschine innerhalb des Informationsnetzes hergestellt hat. Nachdem die Rechercheanfrage als Informationsblock an die Suchmaschine übertragen wurde, führt diese eine routinemäßige Abfrage aller mit ihr in Verbindung stehender Informationsspeicher (Server) durch. Nach Beendigung der Abfrage kann der Benutzer alle ermittelten Datensätze, in denen das relevante Suchwort (Deskriptor) gefunden wurde, in den Arbeits- oder Massespeicher seines Computers laden (kopieren).
Nachteil dieser Lösung ist, daß bei diesem Verfahren verhältnismäßig große Datenmen­ gen ermittelt und übertragen werden, die sich bei anschließender Prüfung als nicht relevant herausstellen. Ebenso kann nicht verhindert werden, daß auf verschiedenen Servern identische Datensätze ermittelt und an den Benutzer übertragen werden. Auch hier stellt sich erst im Ergebnis einer manuellen Sichtung der ermittelten Informationen heraus, daß ein relativ hoher Anteil der ermittelten Informationen redundant erfaßt worden ist.
Neben der unerwünschten Informationsflut, die eine Auswertung brauchbarer Informa­ tionen erschwert, entstehen bei diesem Verfahren auch vermeidbare Mehrkosten durch den längeren Aufenthalt im (gebührenpflichtigen) Netz bzw. beim Zugriff auf kosten­ pflichtige Datenbanken.
Aufgabe der Erfindung ist es, die Nachteile des bekannten Standes der Technik zu eliminieren und ein Verfahren zu entwickeln, daß dem Informationssuchenden eine überschaubare Anzahl relevanter Datensätze selektiv bereitstellt.
Erfindungsgemäß wird die Aufgabe durch die Merkmale des kennzeichnenden Teils des Hauptanspruches gelöst. Eine alternative Lösung der Aufgabe wird im Nebenanspruch 2 vorgeschlagen. Vorzugsweise Weiterbildungen sind in den Unteransprüchen dargelegt.
Der Informationssuchende gibt - wie bisher - ein relevantes Recherchesuchwort (Deskriptor D) über die Eingabeeinrichtung seines Computers ein. Anschließend wird die Verbindung mit einer Suchmaschine hergestellt, auf der ein adaptives Recherche­ programm abgearbeitet wird. Das Verfahren zur Informationsermittlung und -auf­ bereitung weist folgende Teilschritte auf:
Nachdem die Suchmaschine SM die Korrektheit und Zulässigkeit des Suchbegriffes (Deskriptor) überprüft hat (Rechtschreibprüfung, grammatikalische Prüfung, ggf. Hinweis an den Nutzer auf synonyme Bezeichnungen → Thesaurus) werden alle, mit der Suchmaschine SM in Verbindung stehenden Server S1. . .Sn nach diesem Deskriptor abgefragt. Von allen, auf den unterschiedlichen Servern ermittelten Datensätzen DS werden Bruchstücke (Blöcke) mit Angabe der Fundstelle in den Arbeitsspeicher AS der Suchmaschine SM geladen. Dort wird überprüft, ob redundante Datensätze DSred, gekennzeichnet durch identische Strings (Wort- und/oder Zeichenfolgen), z. B. im Titel einer wissenschaftlichen Publikation, einer Patentschrift, etc. vorhanden sind. Diese redundanten Datensätze DSred werden nachfolgend gelöscht.
Parallel dazu wird die Häufung der auf den einzelnen Servern S1. . .Sn ermittelten Datensätze DS verglichen und die Gesamtzahl nges der ermittelten, relevanten Datensät­ ze DSrel (nach Eliminierung redundanter Datensätze) berechnet.
Ist die Anzahl der ermittelten Datensätze nDSrel kleiner als ein wählbares, vom Benutzer oder vom Rechercheprogramm vorgebbares Maximum nDSmax (z. B. 20 Datensätze), so wird die Recherche abgebrochen und die ermittelten Datensätze werden auf den Arbeits- oder Massespeicher des Computers des Benutzers übertragen.
Ist demgegenüber die ermittelte Anzahl relevanter Datensätze nDSrel größer als dieser Grenzwert, so wird ein weiterer Recherchesuchlauf durchgeführt.
Dazu wird durch den Nutzer ein weiteres relevantes Suchwort vorgegeben. Es besteht aber auch die Möglichkeit, dem Benutzer durch das adaptive Rechercheprogramm alternative Vorschläge für weitere Deskriptoren zu unterbreiten, mit denen eine Ein­ schränkung und Präzisierung der Recherchestrategie ermöglicht wird. So können bei der Suche nach einem technisch determinierten Schlagwort, z. B. "Kraftfahrzeug", als ergänzende Deskriptoren Suchwörter vorgegeben werden, durch die die Zweckbindung des Kraftfahrzeuges näher bestimmt wird (zum Beispiel Personenkraftwagen, Nutz­ kraftwagen, etc.).
Nachfolgend wird der zweite Deskriptor mit dem Deskriptor des ersten Suchlaufes additiv verbunden und der zweite Recherchendurchlauf gestartet. Dabei wird gegenüber dem ersten Recherchendurchlauf die Reihenfolge, in der die Server S1 bis Sn abgefragt werden, nach einem Prioritätsprinzip ausgewählt. Die Prioritätsbestimmung berücksich­ tigt die Häufung ermittelter, relevanter Datensätze DSrel, die auf den einzelnen Servern im Ergebnis des ersten Recherchendurchlaufes ermittelt wurden. Beim nachfolgenden, zweiten Recherchendurchlauf wird zunächst der Server Si angefahren, auf dem die meisten relevanten Datensätze (bereinigt von redundanten Datensätzen) gespeichert sind. Mit absteigender Häufung (und abnehmender Trefferwahrscheinlichkeit) werden zunächst die weiteren Server abgefragt, auf denen im ersten Recherchendurchlauf relevante Datensätze ermittelt wurden.
Nachfolgend werden Bruchstücke (Blöcke) aller ermittelten, relevanten Datensätze in den Arbeitsspeicher der Suchmaschine übertragen und die Dateninhalte auf Identität (oder Ähnlichkeit) überprüft.
Redundante Datensätze werden wiederum entfernt, um die Datenmenge zu begrenzen. Neben der Identitätsprüfung kann eine Ähnlichkeitsprüfung der ermittelten Datensätze vorgenommen werden. Dabei werden Datensätze, zum Beispiel Titel von Publikationen, als ähnlich angesehen, wenn der Verfasser und das Publikationsjahr gleich sind. Ist der Autor gleich, das Erscheinungsjahr der Publikationen jedoch verschieden, so wählt das Programm den prioritätsjüngeren Datensatz aus.
Nachfolgend wird die Gesamtzahl der ermittelten, relevanten (das heißt von identischen oder ähnlichen Informationen) bereinigten Datensätze und deren Häufigkeitsverteilung auf den einzelnen angefahrenen Servern dargestellt. Ist die Gesamtzahl der ermittelten, relevanten Datensätze kleiner als ein vorgegebener Maximalwert, so wird die Recherche abgebrochen und die, auf den einzelnen Servern ermittelten, relevanten Datensätze werden auf den Arbeits- oder Massespeicher des Computers des Benutzers übertragen.
Ist die Anzahl der ermittelten Datensätze nur geringfügig größer als der vorgegebene Maximalwert, so wird der Benutzer gefragt, ob er die Anzahl der Recherchenergebnisse durch einen weiteren Recherchesuchlauf mit einem gesonderten Deskriptor einschrän­ ken will oder ob er die Recherche abbrechen möchte.
Ist die Anzahl der ermittelten, relevanten Datensätze demgegenüber wesentlich größer als der gewählte Maximalwert, so wird dem Benutzer durch das adaptive Recherchepro­ gramm ein weiterer Deskriptor vorgeschlagen. Ebenso besteht die Möglichkeit, daß der Benutzer einen Deskriptor seiner Wahl dem nächsten Recherchesuchlauf zugrundelegt. So könnte bei der vorgehend genannten Recherche eine weitere Spezifikation des Recherchenzieles darin bestehen, daß die additiv verbundene Deskriptorenkette "Kraftfahrzeug" und "Nutzkraftfahrzeug" ergänzt wird mit dem Suchwort "Bau" oder "Straßenbau".
Die Auswahl der vom Recherchenprogramm vorgeschlagenen Deskriptoren kann sich - entsprechend dem Ziel der Recherche - an umgangs- oder fachsprachlichen Aspekten orientieren. So kann eine technisch orientierte Recherche, insbesondere eine Recherche nach relevanten Schutzrechten, unter Verwendung international üblicher Klassifika­ tionseinteilungen (z. B. internationale Patentklassifikation IPC) vorgenommen werden.
In der vorstehend beschriebenen Weise werden iterativ bis zu n-Recherchensuchläufe durchgeführt, bis die gewünschte, maximale Anzahl relevanter Datensätze nDSmax erreicht bzw. unterschritten wird. Wird im letzten Recherchendurchlauf eine Anzahl relevanter Datensätze ermittelt, die sehr klein im Vergleich zur vorgegebenen, maximal zulässigen Anzahl der Datensätze ist, so erhält der Benutzer den Hinweis, daß durch diesen letzten Recherchesuchlauf das Recherchenergebnis zu stark eingegrenzt worden ist.
Dem Benutzer wird die Möglichkeit geboten, zu den Ergebnissen des davorliegenden Recherchensuchlaufes zurückzukehren und die Recherche an dieser Stelle abzubrechen oder mit einem neuen, geänderten Deskriptor einen weiteren Recherchedurchlauf zu starten.
Eine weitere, vorteilhafte Möglichkeit zur Erhöhung der Trefferwahrscheinlichkeit einer Recherche besteht darin, daß eine Korrelation zwischen dem Datenvolumen eines Datensatzes und der Häufigkeit des Auftretens des jeweils gesuchten Deskriptors innerhalb dieses Datensatzes (Fundstelle) vorgenommen wird.
Beträgt beispielsweise das Datenvolumen eines ermittelten Datensatzes 10,0 Kilobyte (ca. 5 Seiten DIN A4) und wurde innerhalb dieses Datensatzes ein gesuchter Deskriptor (z. B. das Suchwort "Nutzkraftfahrzeug") nur einmal ermittelt, so ist die Wahrschein­ lichkeit hoch, daß in dem ermittelten Datensatz lediglich peripher über "Nutzkraft­ fährzeuge" berichtet wird.
Die Informationsdichte ID als Quotient aus Anzahl der ermittelten (identischen) Deskriptoren innerhalb eines Datensatzes und dem Datenvolumen (Informationsumfang, Anzahl der Seiten, etc.) dieses Datensatzes ist ein Indikator für die Wahrscheinlichkeit Prel, einen relevanten Datensatz DSrel zu ermitteln.
Durch das Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken wird somit eine Optimierung von Informationsrecherchen (selektive Sachrecherchen, Überblicksrecherchen, etc.) erreicht.
Eine alternative Möglichkeit zur Ermittlung einer akzeptablen Anzahl relevanter Daten­ sätze DSrel bei einer Informationsrecherche geht von der Nutzung mehrerer, vorher­ gehend beschriebener "kreativer" Suchmaschinen aus.
Der Informationssuchende gibt über eine Eingabeeinrichtung seines Computers ein ihn interessierendes Recherchesuchwort (Wort, String, Zeichenkette, etc.) ein.
Der Computer stellt über die vorhandenen Kommunikationswege die Verbindung mit einer Suchmaschine SMMaster innerhalb des Netzwerkes her. Diese Suchmaschine stellt Ihrerseits Verbindungen mit n weiteren Suchmaschinen SMSlave.1 . . .. SMSlave.n innerhalb der Netzstruktur her. Dabei wird die Recherchenanfrage an alle angewählten Such­ maschinen weitergeleitet. Jede dieser n Suchmaschinen steht Ihrerseits mit einer Anzahl von Servern (S1.1, S1.2, . . . Si.n-2, Si.n-1 Si.n) in Verbindung.
Im Ergebnis dieses ersten dezentralen Recherchensuchlaufes ermitteln alle n, im Slave- Modus arbeitenden, kreativen Suchmaschinen SMSlave.1 . . .. SMSlave.n eine Anzahl von Datensätzen, in denen der gewünschte Suchbegriff enthalten ist. Jede der Suchmaschi­ nen SMSlave.i registriert nach Abschluß dieses ersten Recherchensuchlaufes, auf welchem der angewählten Server Sj sie welche Anzahl von Datensätzen ermittelt hat. Diese Ergebnisse werden auf einem Speicher SP der jeweiligen, im Slave-Modus arbeitenden Suchmaschine SMSlave.i abgelegt.
In einem zweiten Verfahrensschritt erfolgt ein Vergleich der von den einzelnen Slave- Suchmaschinen SMSlave.i . . .. SMSlave.n ermittelten Datensätze untereinander. Dabei werden wiederum redundante Datensätze ermittelt und ausgeschieden.
Nachfolgend wird die Häufigkeit der auf den einzelnen Slave-Suchmaschinen SMSlave.1 . . . . SMSlave.n ermittelten, relevanten Datensätze DSrel verglichen und die Gesamtzahl nges.rel der ermittelten, relevanten Datensätze DSrel berechnet.
Ist die Anzahl der ermittelten Datensätze nges.rel größer als ein vorgegebener oder vorgebbarer Grenzwert, so wird ein zweiter Recherchensuchlauf mit einem ergänzenden Deskriptor durchgeführt.
Die Reihenfolge, in der beim zweiten Recherchendurchlauf die Slave-Suchmaschinen SMSlave.b . . .. SMSlave.h von der Master-Suchmaschine SMMaster angefahren werden, richtet sich nach der Häufung der, beim ersten Recherchensuchlauf über die einzelnen Slave-Suchmaschinen SMSlave.1 . . .. SMSlave.i ermittelten, relevanten Datensätze DSrel. Wegen der höheren Trefferwahrscheinlichkeit wird so zunächst die Slave-Suchmaschine SMSlave.h angefahren, auf der beim ersten Recherchensuchlauf die meisten relevanten Datensätze DSrel gefunden wurden. Wurde durch mehrere Slave-Suchmaschinen eine gleiche Anzahl nDSrel relevanter Datensätze ermittelt, so wird als weiteres Auswahl­ kriterium die Informationsdichte ID ausgewählt und danach die Reihenfolge der anzufahrenden Slave-Suchmaschinen bestimmt.
Wird bei diesem zweiten Recherchensuchlauf bereits nach der Abfrage der g-ten Slave- Suchmaschine SMSlave.g (wobei g<i) eine Anzahl relevanter Datensätze DSrel ermittelt, die oberhalb des vorgegebenen Grenzwertes liegt, so wird die Recherche abgebrochen. Gleichzeitig wird vermerkt, welche Slave-Suchmaschinen an diesem Recherchensuch­ lauf nicht beteiligt waren.
Durch diese iterative Abfrage wird die Wahrscheinlichkeit, relevante Datensätze bei minimiertem Suchaufwand zu ermitteln, signifikant verbessert. Ein weiterer Vorteil der Einbindung einer Anzahl von n Slave-Suchmaschinen in eine Recherche besteht darin, daß die Ergebnisse einzelner Rechercheläufe temporär oder dauerhaft auf einem "Inhaltsspeicher" der beteiligten Master- oder Slave-Suchmaschine abgelegt werden können. Dieser "Inhaltsspeicher" hat vorzugsweise die Struktur einer Datenbank. Dabei wird in der Datenbank die jeweilige Recherchenanfrage (Suchwort, Deskriptor, Zeichnung, Formel, etc.) und die Anzahl der zum Rechenchenzeitpunkt temporär über diese Suchmaschine(n) in den angeschlossenen n Servern S1 . . . Sn ermittelten, relevanten Datensätze eingetragen.
Damit besteht die Möglichkeit, bei einer späteren Recherche nach einem identischen oder begrifflich ähnlichen Suchwort (Deskriptor) qualifiziert auf die Server zuzugreifen, auf denen mit höherer Wahrscheinlichkeit relevante Datensätze abgelegt sind. Wird bei einer derartigen, zeitlich versetzen Recherche (z. B. bei einer nochmaligen Suche eines anderen Nutzers nach dem Deskriptor "Kraftfahrzeug") festgestellt, daß sich die Häufigkeitsverteilung der ermittelten, relevanten Datensätze auf den angewähl­ ten Servern geändert hat, so wird diese Drifterscheinung ebenfalls in der Datenbank "Inhaltsangabe" der jeweiligen Master- und/oder Slave-Suchmaschine gespeichert. Damit wird sichergestellt, daß bei jedem weiteren, nachfolgenden Recherchensuchlauf nach einem identischen oder inhaltsähnlichen Suchwort (Deskriptor) primär die Quellen (Server) angewählt werden, die die höchste Trefferwahrscheinlichkeit für die Ermittlung relevanter Datensätze DSrel aufweisen.
Damit stellt die Datenbank "Inhaltsangabe" ein selbstlernendes System dar. So wird bei einer neuen Recherche zunächst überprüft, ob das vorgegebene Suchwort bereits identisch in der Datenbank "Inhaltsangabe" enthalten ist. Ist das nicht der Fall, so wird überprüft, ob bereits Recherchen nach ähnlichen, inhaltsgleichen Begriffen durchgeführt worden sind. Ist das der Fall, d. h. wurde beispielsweise über diese Master- oder Slave-Suchmaschine bereits eine Recherche nach dem Begriff "Kraftfahrzeug" (anstelle des ursprünglich gewählten Suchbegriffes "Nutzkraftfahrzeug") vorgenommen, so wird die Suche nach dem neuen Deskriptor "Nutzkraftfahrzeug" wegen der höheren Trefferwahrscheinlichkeit zunächst über die Slave-Suchmaschinen in den Servern durchgeführt, in denen beim letzten Recherchensuchlauf die größte Anzahl relevanter Datensätze (gegebenenfalls unter Berücksichtigung der Informationsdichte dieser Datensätze) ermittelt wurde.
Die Bewertung der Trefferwahrscheinlichkeit der in Konkurrenz arbeitenden Slave- Suchmaschinen wird dabei durch die Master-Suchmaschine vorgenommen.
Um den Zeitaufwand einer Informationsrecherche weiter zu minimieren, besteht die vorteilhafte Möglichkeit, die Recherchefrage parallel an mehrere Master-Suchmaschinen zu leiten, die im Netzwerk autonom arbeiten oder miteinander verbunden sind. Da die Master-Suchmaschinen ihrerseits jeweils mit einer Anzahl i . . . k unterschiedlicher Server kommunizieren, werden Rechercheergebnisse ermittelt, die mit hoher Wahr­ scheinlichkeit repräsentativ für die untersuchte Grundgesamtheit von Informationsquel­ len (Servern) sind.
In einer vorteilhaften Ausgestaltung des Verfahrens zur Datenermittlung und -aufberei­ tung in Informationsnetzwerken werden die intelligenten, kreativen Suchmaschinen SMMaster über Kommunikationswege untereinander als neuronales Netz verbunden. Bei jeder Recherche werden dabei die gewonnenen Ergebnisse über die Häufigkeit ermittel­ ter relevanter Datensätze, deren Informationsgehalt (Informationsdichte ID) und somit die Trefferwahrscheinlichkeit auf den angefahrenen Servern protokolliert und auf ausgewählten oder auf allen, im Netz befindlichen Suchmaschinen SMMaster abgelegt. Durch diesen informationellen Selbstlernprozeß der Suchmaschinen SMMaster wird die Qualität und Ausbeute der Recherchen systematisch verbessert und der zeitliche und finanzielle Recherchenaufwand signifikant gesenkt.
Die Erfindung wird nachfolgend an einem Ausführungsbeispiel näher beschrieben.
Ein Nutzer des INTERNET in Belgien möchte sich eine Übersicht über alle Restaurants der Hansestadt Hamburg verschaffen.
Der Informationssuchende gibt über die Tastatur seines Computers als Suchstring "Restaurant Hamburg", ein. Die Obergrenze der maximal zu ermittelnden relevanten Datensätze DSrel.max wurde vom Informationssuchenden aus Kostengründen auf 1.000 begrenzt.
Nachfolgend wird die Verbindung des Computers mit einer Suchmaschine SMMaster innerhalb des Netzwerkes hergestellt. Diese Suchmaschine SMMaster korrespondiert ständig mit 10 Suchmaschinen SMSlave.1 . . . SMSlave.10. Die Suchmaschine SMMaster wählt zufällig eine Slave-Suchmaschine aus. Die im vorliegenden Fall ausgewählte Suchma­ schine SMSLave.6 korrespondiert mit 26.414 Servern weltweit.
Die Suchmaschine SMSLave.6 sucht nunmehr in allen, mit ihr verbunden Servern nach den kummulativ auftretenden Informationen "Restaurant" und "Hamburg". Als Ergebnis wird auf dem Display des Informationssuchenden die Gesamtzahl der ermittelten Datensätze nges aufgezeigt. Die ermittelte Anzahl von 10.012 Datensätzen umfaßt alle nachgewiesenen Gaststätten in Belgien, den Niederlanden und Luxemburg mit der besonderen Etablissementbezeichnung "Hamburg".
Da dieses Recherchenergebnis nicht den Vorstellungen des Informationssuchenden ent­ spricht, wird die Recherche an dieser Stelle nicht abgebrochen, sondern die Such­ maschine SMMaster wählt aus den 10, mit ihr verbundenen Suchmaschinen SMSlave.1 . . . SMSlave.10 nach dem Zufallsprinzip weitere Suchmaschinen aus, an die die Recherchen­ frage weitergeleitet wird. Anschließend werden die Recherchenergebnisse übermittelt. So wurden unter Inanspruchnahme der Suchmaschine SMSlave.2 insgesamt 2.444 Daten­ sätze gefunden, in denen die Begriffe "Restaurant" und "Hamburg" in den USA, Kanada und Deutschland gefunden wurden.
Die Suchmaschine SMSlave.1 ermittelte 1.436 Datensätze, in denen sich ein Hinweis auf die Suchbegriffe "Restaurant" und "Hamburg" innerhalb der Europäischen Union und in Japan findet.
Die Suchmaschine SMSlave.4 liefert als Ergebnis 795 Datensätze, in denen Restaurants mit der Geschäftsbezeichnung "Hamburg" innerhalb der Bundesrepublik Deutschland ermittelt wurden.
Die Suchmaschine SMSlave.9 findet bei der analogen Recherche in den, mit ihr verbun­ denen Servern insgesamt 1.214 Datensätze von Restaurants in Deutschland und Däne­ mark.
Die Suchmaschine SMSlave.10 ermittelt insgesamt 7.117 Restaurants in Frankreich, Deutschland und den Niederlanden mit der besonderen Geschäftsbezeichnung "Hamburg".
Die Suchmaschine SMSlave.5 findet 402 Datensätze von gleichnamigen Restaurants in der Bundesrepublik.
Die Suchmaschine SMSlave.3 ermittelt 7.212 Gaststätten in den USA, Kanada, Mexiko, Großbritannien, Frankreich, Italien und Deutschland.
Die Suchmaschine SMSlave.7 ermittelt 222 Datensätze, die auf Restaurants mit der besonderen Geschäftsbezeichnung "Hamburg" in den Vereinigten Staaten hinweisen.
Die Suchmaschine SMSlave.6 findet 9.781 Datensätze mit Hinweisen auf gleichnamige Restaurants in den USA, Australien und Neuseeland.
Die Suchmaschine SMSlave.8 ermittelt 2.006 Datensätze mit den Deskriptoren "Restaurant" und "Hamburg" mit Sitz in Großbritannien, den USA, Japan und Süd­ korea.
Anschließend läuft eine automatische Kreuz- und Autokorrelationsanalyse der sich im Arbeitsspeicher AS der Suchmaschine SMMaster befindlichen Daten ab. Dabei werden die Datensätze ermittelt, die redundant von zwei oder mehreren Suchmaschinen ermittelt wurden.
Nach Eliminierung der redundanten Datensätze werden die ermittelten, relevanten Datensätze aufgezeigt. Im vorliegenden Fall werden nur die Datensätze angesprochen, in denen die Deskriptorenkette "Restaurant, Hamburg" in Verbindung mit "Bundes­ republik Deutschland" als Resourcenquelle aufgefunden wurden. Relevante Datensätze wurden somit nur über die Suchmaschinen SMSlave.1, SMSlave.2, SMSlave.4, SMSlave.5, SMSlave.9 und SMSlave.10 ermittelt.
Unter Berücksichtigung der Häufung H(DSrel) relevanter Datensätze DSrel ergibt sich die Rangfolge aus dem Gesamtspektrum der Datensätze DS wie folgt:
n5.rel = 402
n4.rel = 795
n9.rel = 1.214
n1.rel = 1.436
n2.rel = 2.444
n10.rel = 7.117
n3.rel = 7.212
Aufgrund der vorliegenden Obergrenze der maximal zu ermittelnden, relevanten Datensätze von nrelmax = 1.000 werden nur die Ergebnisse der Suchmaschinen SMSlave.5 und SMSlave.4 weiterverarbeitet.
Daneben erfolgt eine interne Bewertung aller Suchmaschinen, deren Bewertungs­ ergebnisse in der Lernmatrix (Datenbank) der Suchmaschine SMMaster abgespeichert wird. In der Reihenfolge von "beste" bis "schlechteste" Suchmaschine ergibt sich folgende Reihenfolge:
Die Reihenfolge wird als Wertigkeit durch eine Punktbewertung berücksichtigt. Obwohl die Suchmaschinen SMSlave.6 . . . SMSlave.8 keine relevanten Datensätze ermittelt haben, werden diese Suchmaschinen nicht mit der Bewertungskennziffer "0" bewertet, da von diesen Suchmaschinen Datenbestände erfaßt wurden, die für eine ergänzende Recherche noch relevant sein könnten. So ist beispielsweise in dem Suchfundus "Europäische Union" Deutschland mittelbar enthalten.
Nachfolgend werden die, von den Suchmaschinen SMSlave.4 und SMSlave.5 ermittelten relevanten Datensätze angezeigt.
Ist der Informationssuchende mit den Ergebnissen der Recherche zufrieden, kann ein Abbruch der Recherche erfolgen.
Soll die Recherche weiter spezifiziert werden, erfolgt eine weiterer Recherchesuchlauf. Dabei wird mittels der angeschlossenen Master-Suchmaschine SMMaster und der mit ihr verbundenen Slave-Suchmaschinen nach der Deskriptorenkette ["Stadt" und "Hamburg" und ("Restaurant" oder "Gaststätte")] gesucht.
Prinzipiell könnte die Recherche auf die Suchmaschinen DSSlave.4 und DSSlave.5 be­ schränkt werden, die im vorigen Recherchelauf die besten Ergebnisse erbracht haben.
Ist der Informationssuchende jedoch an einer hohen Repräsentanz der ermittelten relevanten Datensätze interessiert, so werden von der Suchmaschine SMMaster wiederum alle 10 mit ihr korrespondierenden Suchmaschinen SMSlave.1 bis SMSlave.10 abgefragt. Dabei werden wegen der hohen, zu erwartenden Trefferwahrscheinlichkeit zunächst die Suchmaschine SMSlave.5, dann die Suchmaschine SMSlave.4, usw. angefahren.
Nach diesem zweiten Recherchenlauf werden alle ermittelten Ergebnisse aufgezeigt:
Durch die Suchmaschine SMSlave.5 wurden 120 Restaurants in der Stadt Hamburg ermittelt. Die Datensuche über die Suchmaschine SMSlave.4 ergab 140 Nachweise von Restaurants in der Stadt Hamburg. Die Recherche über die Suchmaschine SMSlave.2 erbrachte 400 Datensätze von Restaurants in den USA und Deutschland mit dem Namen "Stadt Hamburg".
Im Ergebnis einer erneuten Auto- und Kreuzkorrelationsanalyse wurde festgestellt, daß alle Datensätze, die über die Suchmaschine SMSlave.5 ermittelt wurden, sich in identi­ scher Form im Bestand der Datensätze der Suchmaschine SMSlave.4 befinden. Alle übrigen Datensätze sind nicht redundant. Somit bleiben 140 relevante Datensätze übrig, die dem Informationssuchenden angezeigt und in den Arbeits- bzw. Hauptspeicher seines Rechners kopiert werden, da das Abbruchkriterium nrel < nrelmax erfüllt ist. Die Trefferwahrscheinlichkeit, die von den einzelnen Suchmaschinen SMSlave.1 bis SMSlave.10 bei dieser speziellen Recherche erzielt wurde, wird in der Lernmatrix (Datenbank) der Suchmaschine SMMaster abgelegt.
Damit besteht die Möglichkeit, daß bei einer identischen oder ähnlichen Recherche eines anderen Informationssuchenden die Master-Suchmaschine SMMaster zunächst die Suchmaschinen SMSlave.i bis SMSlave.m auswählt, die aufgrund der bisherigen Recher­ cheerfahrungen die höchste Trefferquote relevanter Datensätze erwarten lassen. Kommt es dabei aufgrund der sich ständig ändernden Datenmengen und -inhalte zu einer Verschiebung der Prioritätsliste (Rangfolge der zu erwartenden Trefferwahrscheinlich­ keit), so werden auch diese Änderungen in der Lernmatrix der kreativen Suchmaschine SMMaster registriert, so daß eine ständige Aktualisierung erfolgt.
Ebenso werden in der Lernmatrix synonyme Deskriptoren gespeichert, die im Falle einer ergebnislosen Recherche eine Suche nach inhaltsgleichen Deskriptoren ermög­ licht. Nach der "Anlernphase", in der der Aufbau der Lernmatrizen auf den Mastersuch­ maschinen SMMaster erfolgt, erhält der Informationssuchende bei der Kontaktaufnahme mit der intelligenten Suchmaschine SMMaster zu Beginn seiner Sitzung eine Übersicht der recherchierbaren Fachgebiete, da jede Suchmaschine SMMaster regelmäßig nicht mit allen Servern weltweit in Verbindung stehen wird. Nachdem der Informationssuchende sich für ein, ihn interessierendes Fachgebiet entschieden und die Suche nach einem ersten Deskriptor gestartet hat, läuft das Verfahren zur selektiven Informationsgewin­ nung in der vorstehend beschriebenen Weise.
Durch das selbstlemende System wird der zeitliche und finanzielle Aufwand für eine selektive Informationsrecherche signifikant verringert.
Bezugszeichenliste
AS Arbeitsspeicher
D Deskriptor
Dunzul
unzulässiger Deskriptor
Dsyn
synonymer Deskriptor
DS Datensatz
DSähnl
Datensatz mit ähnlichem Deskriptor
DSred
redundanter Datensatz
DSrel
relevanter Datensatz
H(D) Häufigkeit des Deskriptors D
H(DS) Häufung des Datensatzes DS
ID
Informationsdichte
nDSrel
Anzahl relevanter Datensätze
nDSmax
maximale Anzahl relevanter Datensätze
nges.rel
Summe relevanter Datensätze
Prel
Wahrscheinlichkeit
S Server
SM Suchmaschine
SMMaster
Master-Suchmaschine
SMSlave
Slave-Suchmaschine
SP Speicher
VDSrel
Volumen eines relevanten Datensatzes

Claims (7)

1. Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken, insbesondere in regionalen und globalen Datennetzen, wobei ein relevantes Recherche­ suchwort (Deskriptor D) über die Eingabeeinrichtung eines Computers eingegeben und über Informationsübertragungseinrichtungen die Verbindung mit einer Suchmaschine SM hergestellt wird,
wobei der Computer und/oder die Suchmaschine SM die Korrektheit und Zulässigkeit des Deskriptor D überprüft und bei unzulässigen Deskriptoren Dunzul synonyme Deskriptoren Dsyn ermittelt und dem Nutzer vorschlägt,
daß nachfolgend alle, mit der Suchmaschine SM in Verbindung stehenden Server S1 . . . Sn nach diesem Deskriptor abgefragt und von allen, auf den Servern S1 . . . Sn ermittelten Datensätzen DS bruchstückartige Blöcke mit Angabe der Fundstelle in den Arbeits­ speicher AS der Suchmaschine SM geladen werden,
daß nachfolgend redundante Datensätze DSred eliminiert werden,
daß die Häufung H(DSi) der auf den einzelnen Servern S1 . . . Sn ermittelten Datensätze DSi verglichen und die Gesamtzahl nges.rel der ermittelten, relevanten Datensätze DSrel nach Eliminierung redundanter Datensätze DSred bestimmt wird,
wobei die Recherche abgebrochen wird und die ermittelten Datensätze auf den Arbeits- oder Massespeicher des Computers des Benutzers übertragen werden, falls die Anzahl der ermittelten Datensätze nDSrel kleiner als ein wählbares, vom Benutzer oder vom Rechercheprogramm vorgebbares Maximum nDSmax ist oder
daß ein weiterer Recherchesuchlauf durchgeführt wird, falls die ermittelte Anzahl relevanter Datensätze nDSrel größer als dieser Grenzwert ist,
wobei durch den Nutzer oder das Rechercheprogramm ein weiteres relevantes Suchwort vorgegeben und der zweite Recherchendurchlauf gestartet wird,
wobei die Server S1 bis Sn von der Suchmaschine in der Reihenfolge der Häufung H(DSrel) der Anzahl der ermittelten, relevanten Datensätze DSrel abgefragt werden,
daß nachfolgend bruchstückartige Blöcke mit Angabe der Fundstelle in den Arbeitsspei­ cher AS der Suchmaschine SM geladen werden,
daß nachfolgend redundante Datensätze DSred gelöscht werden,
und die Recherche abgebrochen wird und die ermittelten Datensätze auf den Arbeits- oder Massespeicher des Computers des Benutzers übertragen werden, falls die Anzahl der ermittelten Datensätze nDSrel kleiner als ein wählbares, vom Benutzer oder vom Rechercheprogramm vorgebbares Maximum nDSmax ist oder
daß ein weiterer Recherchesuchlauf durchgeführt wird, bis die Forderung nDSrel < = nDSmax erfüllt ist.
2. Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken, insbesondere in regionalen und globalen Datennetzen, wobei ein relevantes Recherche­ suchwort (Deskriptor D) über die Eingabeeinrichtung eines Computers eingegeben und über Informationsübertragungseinrichtungen die Verbindung mit einer Suchmaschine SMMaster hergestellt wird,
die ihrerseits Verbindungen mit n weiteren Suchmaschinen SMSlave.1 . . .. SMSlave.n innerhalb des Netzes herstellt, wobei jede dieser n Suchmaschinen mit einer Anzahl von Servern (S1.1, S1.2, S1.k . . . Si.n-2, Si,n.1, Si.n) in Verbindung steht,
daß nachfolgend alle, mit der Suchmaschine SM in Verbindung stehenden Server (S1.1, S 1.2, S1.k . . . Si.n-2, Si.n.1, S.n) nach dem Deskriptor D abgefragt und von allen, auf den Servern ermittelten Datensätzen DS bruchstückartige Blöcke mit Angabe der Fundstelle in den Arbeitsspeicher AS der Suchmaschinen SMSlave.1 . . .. SMSlave.n geladen werden,
daß nachfolgend redundante Datensätze DSred eliminiert werden,
daß auf jeder Suchmaschine SMSlave.1 gespeichert wird, auf welchem der angewählten Server Sj welche Anzahl von Datensätzen ermittelt wurde,
daß nachfolgend ein Vergleich der Anzahl oder der Häufung der von den einzelnen Slave-Suchmaschinen SMSlave.1 . . .. SMSlave.n ermittelten Datensätze vorgenommen wird,
wobei redundante Datensätze ermittelt und ausgeschieden werden,
daß die Anzahl nges.rel der ermittelten, relevanten Datensätze DSrel ermittelt wird,
wobei die Recherche abgebrochen wird und die ermittelten Datensätze auf den Arbeits- oder Massespeicher des Computers des Benutzers übertragen werden, falls die Anzahl der ermittelten Datensätze nDSrel kleiner als ein wählbares, vom Benutzer oder vom Rechercheprogramm vorgebbares Maximum nDSmax ist oder
daß ein weiterer Recherchesuchlauf durchgeführt wird, falls die ermittelte Anzahl relevanter Datensätze nDSrel größer als dieser Grenzwert ist,
wobei durch den Nutzer oder das Rechercheprogramm ein weiteres relevantes Suchwort vorgegeben und der zweite Recherchendurchlauf gestartet wird,
wobei die Server S1 bis Sn von der Suchmaschine in der Reihenfolge der Häufung H(DSrel) der Anzahl der ermittelten, relevanten Datensätze Dsrel abgefragt werden,
daß nachfolgend bruchstückartige Blöcke mit Angabe der Fundstelle in den Arbeitsspei­ cher AS der Suchmaschine SM geladen werden,
daß nachfolgend redundante Datensätze DSred gelöscht werden,
und die Recherche abgebrochen wird und die ermittelten Datensätze auf den Arbeits- oder Massespeicher des Computers des Benutzers übertragen werden, falls die Anzahl der ermittelten Datensätze nDSrel kleiner als ein wählbares, vom Benutzer oder vom Rechercheprogramm vorgebbares Maximum nDSmax ist oder
daß ein weiterer Recherchesuchlauf durchgeführt wird, bis die Forderung nDSrel < = nDSmax erfüllt ist.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet,
daß eine Korrelation zwischen dem Datenvolumen VDSrel eines relevanten Datensatzes DSrel und der Häufigkeit H(Di) des Auftretens des jeweils gesuchten Deskriptors Dj innerhalb dieses Datensatzes vorgenommen und daraus die Informationsdichte des relevanten Datensatzes DSrel bestimmt wird,
und daß nur von den Datensätzen DSrel.1 . . . DSrel.n bruchstückartige Blöcke mit Angabe der Fundstelle in den Arbeitsspeicher AS der Suchmaschine SM geladen werden, die eine vorgegebene minimale Informationsdichte ID aufweisen.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß nach der Übertragung bruchstückartiger Blöcke aller, auf den Servern S1 . . . Sn ermittelten Datensätzen DS in den Arbeitsspeicher AS der Suchmaschine SM ähnliche Datensätze DSähnl eliminiert werden.
5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß die Ergebnisse der Recherchenabfragen auf einem Inhaltsspeicher der beteiligten Master- und/oder Slave-Suchmaschine abgelegt werden.
6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß die Suchmaschinen SMMaster über Kommunikationswege untereinander zu einem neuronalen Netz verbunden werden.
7. Verfahren nach einem der Ansprüche 2 bis 6, dadurch gekennzeichnet, daß die Recherchefrage parallel an mehrere Master-Suchmaschinen übertragen wird, die im Informationsnetzwerk autonom arbeiten oder miteinander verbunden sind.
DE19651788A 1996-12-12 1996-12-12 Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken Expired - Fee Related DE19651788C2 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19651788A DE19651788C2 (de) 1996-12-12 1996-12-12 Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19651788A DE19651788C2 (de) 1996-12-12 1996-12-12 Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken

Publications (2)

Publication Number Publication Date
DE19651788A1 true DE19651788A1 (de) 1998-06-25
DE19651788C2 DE19651788C2 (de) 2001-01-04

Family

ID=7814536

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19651788A Expired - Fee Related DE19651788C2 (de) 1996-12-12 1996-12-12 Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken

Country Status (1)

Country Link
DE (1) DE19651788C2 (de)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19842320A1 (de) * 1998-09-16 2000-03-23 Ibm Verfahren und Einrichtung zur inhaltsbezogenen Suche von elektronischen Dokumenten
WO2000041099A1 (en) * 1998-12-30 2000-07-13 Microsoft Corporation Method for analyzing network data
DE19909017A1 (de) * 1999-03-02 2000-09-14 Manfred Buettner Verfahren zum Vermitteln von persönlichen oder geschäftlichen Kontakten
WO2000060446A2 (de) * 1999-04-01 2000-10-12 OCé PRINTING SYSTEMS GMBH Vorrichtung und verfahren zum verarbeiten und drucken von informationen
DE19939625A1 (de) * 1999-08-20 2001-02-22 Nokia Mobile Phones Ltd Verfahren zum Abrufen von Informationen aus einem Informationsnetzwerk
DE10029644A1 (de) * 2000-06-16 2002-01-17 Deutsche Telekom Ag Verfahren zur Relevanzbewertung bei der Indexierung von Hypertext-Dokumenten mittels Suchmaschine
NL1016379C2 (nl) * 2000-07-25 2002-01-28 Alphonsus Albertus Schirris Werkwijze en zoekmachine voor het doorzoeken van ten minste ÚÚn gegevensbestand.
EP1299798A1 (de) * 2000-02-22 2003-04-09 Harvey Lunenfeld Client-server-multitasking
US6636600B1 (en) 1999-05-05 2003-10-21 Siemens Aktiengesellschaft Method for finding a contact or for setting up a connection to the contact
EP1837782A1 (de) * 2006-03-24 2007-09-26 Canon Kabushiki Kaisha Vorrichtung zum Suchen von Dokumenten, Dokumentverwaltungssystem, System und Verfahren zum Suchen von Dokumenten

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0747845A1 (de) * 1995-06-07 1996-12-11 International Business Machines Corporation Rechnernetzwerk für WWW-Anbieter-Datenzugriff auf das Internet

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0747845A1 (de) * 1995-06-07 1996-12-11 International Business Machines Corporation Rechnernetzwerk für WWW-Anbieter-Datenzugriff auf das Internet

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
IBM Technical Disclosure Bulletin, Vol. 38, No. 01, January 1995, S. 607/608 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19842320A1 (de) * 1998-09-16 2000-03-23 Ibm Verfahren und Einrichtung zur inhaltsbezogenen Suche von elektronischen Dokumenten
US6463455B1 (en) 1998-12-30 2002-10-08 Microsoft Corporation Method and apparatus for retrieving and analyzing data stored at network sites
WO2000041099A1 (en) * 1998-12-30 2000-07-13 Microsoft Corporation Method for analyzing network data
DE19909017A1 (de) * 1999-03-02 2000-09-14 Manfred Buettner Verfahren zum Vermitteln von persönlichen oder geschäftlichen Kontakten
WO2000060446A2 (de) * 1999-04-01 2000-10-12 OCé PRINTING SYSTEMS GMBH Vorrichtung und verfahren zum verarbeiten und drucken von informationen
US7259880B1 (en) 1999-04-01 2007-08-21 Oce Printing Systems Gmbh Device and method for processing and printing information
WO2000060446A3 (de) * 1999-04-01 2001-10-04 Oce Printing Systems Gmbh Vorrichtung und verfahren zum verarbeiten und drucken von informationen
US6636600B1 (en) 1999-05-05 2003-10-21 Siemens Aktiengesellschaft Method for finding a contact or for setting up a connection to the contact
DE19939625A1 (de) * 1999-08-20 2001-02-22 Nokia Mobile Phones Ltd Verfahren zum Abrufen von Informationen aus einem Informationsnetzwerk
EP1079354A3 (de) * 1999-08-20 2002-11-27 Nokia Corporation Verfahren zum Abrufen von Informationen aus einem Informationsnetzwerk
EP1079354A2 (de) * 1999-08-20 2001-02-28 Nokia Mobile Phones Ltd. Verfahren zum Abrufen von Informationen aus einem Informationsnetzwerk
EP1299798A1 (de) * 2000-02-22 2003-04-09 Harvey Lunenfeld Client-server-multitasking
EP1299798A4 (de) * 2000-02-22 2004-09-01 Harvey Lunenfeld Client-server-multitasking
DE10029644A1 (de) * 2000-06-16 2002-01-17 Deutsche Telekom Ag Verfahren zur Relevanzbewertung bei der Indexierung von Hypertext-Dokumenten mittels Suchmaschine
DE10029644B4 (de) * 2000-06-16 2008-02-07 Deutsche Telekom Ag Verfahren zur Relevanzbewertung bei der Indexierung von Hypertext-Dokumenten mittels Suchmaschine
NL1016379C2 (nl) * 2000-07-25 2002-01-28 Alphonsus Albertus Schirris Werkwijze en zoekmachine voor het doorzoeken van ten minste ÚÚn gegevensbestand.
EP1837782A1 (de) * 2006-03-24 2007-09-26 Canon Kabushiki Kaisha Vorrichtung zum Suchen von Dokumenten, Dokumentverwaltungssystem, System und Verfahren zum Suchen von Dokumenten

Also Published As

Publication number Publication date
DE19651788C2 (de) 2001-01-04

Similar Documents

Publication Publication Date Title
DE69811066T2 (de) Datenzusammenfassungsgerät.
DE69718798T2 (de) Echtzeitsuchmotor mit strukturierten zusammenfassungen
DE69227948T2 (de) Verfahren und Gerät um ein dynamisches Lexikon in ein Textinformationsauffindungssystem zu integrieren
DE69424902T2 (de) Gerät und Verfahren zur anpassungsfähigen nicht-buchstäblichen Textsuche
DE69804495T2 (de) Informationsmanagement und wiedergewinnung von schlüsselbegriffen
EP1783633B1 (de) Suchmaschine für eine ortsbezogene Suche
DE102007037646B4 (de) Computerspeichersystem und Verfahren zum Indizieren, Durchsuchen und zur Datenwiedergewinnung von Datenbanken
DE60118973T2 (de) Verfahren zum abfragen einer struktur komprimierter daten
DE69522426T2 (de) Wort-Wiederauffindungsapparat für ein Wörterbuch
DE19651788C2 (de) Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken
DE112010002620T5 (de) Ontologie-nutzung zum ordnen von datensätzen nachrelevanz
DE10034694B4 (de) Verfahren zum Vergleichen von Suchprofilen sowie dessen Verwendung
EP1620810B1 (de) Verfahren und anordnung zur einrichtung und aktualisierung einer benutzeroberfl che zum zugriff auf informationsseiten in ein em datennetz
DE10028624A1 (de) Verfahren und Vorrichtung zur Dokumentenbeschaffung
WO2011044865A1 (de) Verfahren zum bestimmen einer ähnlichkeit von objekten
EP1325412B1 (de) Verfahren zum zugriff auf eine speichereinheit, in der vermerkfolgen gespeichert sind, zugehörige speichereinheit und zugehöriges programm
DE10261839A1 (de) Verfahren und Einrichtung zur Durchführung einer elektronischen Recherche
EP1094405A2 (de) Verfahren zum Erzeugen einer dynamischen Auswahlmaske für den Abruf von Daten aus einer Datenbank
DE19933621C2 (de) Netzserver zum Bereitstellen einer Informationsseite und Verfahren zum Bereitstellen einer Webseite
EP0945705A2 (de) Erkennungssystem
DE102005027575A1 (de) Verfahren zur Auswahl von Datensätzen
EP0833263A2 (de) Datenbank, Verfahren zum Ableiten einer Datenbank und Verfahren zur Abfrage einer Datenbank
DE102006043158A1 (de) Verfahren zum Ermitteln von Elementen eines einer Suchanfrage zugeordneten Suchergebnisses in einer Reihenfolge und Suchmaschine
EP0563077B1 (de) Verfahren zum maschinellen ermitteln von in zwei datenfolgen enthaltenen gleichen datenelementen
DE10160920B4 (de) Verfahren und Vorrichtung zur Erzeugung eines Extrakts von Dokumenten

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
D2 Grant after examination
8364 No opposition during term of opposition
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee