DE19651788C2 - Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken - Google Patents

Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken

Info

Publication number
DE19651788C2
DE19651788C2 DE19651788A DE19651788A DE19651788C2 DE 19651788 C2 DE19651788 C2 DE 19651788C2 DE 19651788 A DE19651788 A DE 19651788A DE 19651788 A DE19651788 A DE 19651788A DE 19651788 C2 DE19651788 C2 DE 19651788C2
Authority
DE
Germany
Prior art keywords
search
slave
determined
data records
rel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE19651788A
Other languages
English (en)
Other versions
DE19651788A1 (de
Inventor
Wilfried Krug
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to DE19651788A priority Critical patent/DE19651788C2/de
Publication of DE19651788A1 publication Critical patent/DE19651788A1/de
Application granted granted Critical
Publication of DE19651788C2 publication Critical patent/DE19651788C2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Das Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken, insbesondere in regionalen und globalen Datennetzen, wie dem INTERNET, ermöglicht eine zielgenaue, zeitsparende Recherche nach beliebigen Informationen. DOLLAR A Durch die Verwendung intelligenter, kreativer Suchmaschinen wird die Wahrscheinlichkeit für die Ermittlung relevanter Datensätze signifikant erhöht. Die Übertragung redundanter, identischer oder ähnlicher Datensätze wird vermieden. DOLLAR A Durch die Lernfähigkeit der kreativen Suchmaschinen wird die Recherchengenauigkeit permanent erhöht und der Aufwand minimiert. Ebenso besteht die Möglichkeit, durch die Verwendung mehrerer, in Konkurrenz oder in Kooperation arbeitender Master-Suchmaschinen die Trefferwahrscheinlichkeit der Recherche zu erhöhen oder den zeitlichen Recherchenaufwand zu senken.

Description

Die Erfindung betrifft ein Verfahren zur Datenermittlung und -aufbereitung in Infor­ mationsnetzwerken, insbesondere in regionalen und globalen Datennetzen, wie dem INTERNET, mit dem eine selektive Ermittlung einer definierten Anzahl relevanter Informationen ermöglicht und der Informationssuchende vollständig aus dem Recherchenprozess eliminiert wird.
Für die selektive Suche von Daten stehen dem Benutzer regionaler oder globaler Rechnerverbundsysteme sogenannte Suchmaschinen zur Verfügung. Dabei handelt es sich um leistungsfähige Netzwerkcomputer, auf denen Rechercheprogramme verarbeitet werden. Der Ablauf einer konventionellen Recherche geht dabei wie folgt vonstatten: Der Benutzer gibt ein relevantes Suchwort (Deskriptor) über die Eingabeeinrichtungen (Tastatur, Maus, Spracherkennungssystem) seines Computers ein, nachdem er den Zugang zu einer beliebigen Suchmaschine innerhalb des Informationsnetzes hergestellt hat. Nachdem die Rechercheanfrage als Informationsblock an die Suchmaschine übertragen wurde, führt diese eine routinemäßige Abfrage aller mit ihr in Verbindung stehender Informationsspeicher (Server) durch. Nach Beendigung der Abfrage kann der Benutzer alle ermittelten Datensätze, in denen das relevante Suchwort (Deskriptor) gefunden wurde, in den Arbeits- oder Massespeicher seines Computers laden (kopieren).
Aus IBM Technical Disclosure Bulletin, Vol. 38, No. 01, January 1995, S. 607/608 und aus der EP 0 747 845 A1 sind Computerarchitekturen auf der Grundlage von Master- Server und Client-Server-Systemen bekannt, die eine zeitlich und räumlich getrennte Abarbeitung von Rechercheprozeduren ermöglichen. Die verwendeten Strukturen und Recherchealgorithmen erlauben indes keine selbsttätige Präzisierung der Recherchen­ abfrage und keine Rückschlüsse über die Qualität und Aktualität der ermittelten Daten. Nachteil an diesen Lösung ist auch, dass bei diesen Verfahren verhältnismäßig große Datenmengen ermittelt und übertragen werden, die sich bei anschließender Prüfung als nicht relevant herausstellen. Ebenso kann nicht verhindert werden, dass auf verschiedenen Servern identische Datensätze ermittelt und an den Benutzer übertragen werden. Auch hier stellt sich erst im Ergebnis einer manuellen Sichtung der ermittelten Informationen heraus, dass ein relativ hoher Anteil der ermittelten Informationen redundant erfasst worden ist.
Neben der unerwünschten Informationsflut, die eine Auswertung brauchbarer Informationen erschwert, entstehen bei diesem Verfahren auch vermeidbare Mehrkosten durch den längeren Aufenthalt im (gebührenpflichtigen) Netz bzw. beim Zugriff auf kostenpflichtige Datenbanken.
Aufgabe der Erfindung ist es, die genannten Nachteile des bekannten Standes der Technik zu eliminieren und ein Verfahren zu entwickeln, das den zeitlichen und finanziellen Aufwand für die Durchführung einer rechnergestützten Recherche und die Aufbereitung der ermittelten Ergebnisse minimiert und gleichzeitig die Relevanz der ermittelten technischen, naturwissenschaftlichen, betriebswirtschaftlichen oder sonstigen Infor­ mationen erhöht, den Informationssuchenden vollständig aus dem Recherchenprozess eliminiert und ihm eine überschaubare Anzahl relevanter Datensätze selektiv bereitstellt.
Erfindungsgemäß wird die Aufgabe durch die Merkmale des Hauptanspruches gelöst. Eine alternative Lösung der Aufgabe wird im Nebenanspruch 2 beschrieben. Vorzugsweise Weiterbildungen sind in den Unteransprüchen dargelegt.
Der Informationssuchende gibt - wie bisher - ein relevantes Recherchesuchwort (Deskriptor D) über die Eingabeeinrichtung seines Computers ein. Anschließend wird die Verbindung mit einer Suchmaschine hergestellt, auf der ein adaptives Rechercheprogramm abgearbeitet wird. Das Verfahren zur Informationsermittlung und - aufbereitung weist folgende Teilschritte auf:
Nachdem die Suchmaschine SM die Korrektheit und Zulässigkeit des Suchbegriffes (Deskriptor) überprüft hat (Rechtschreibprüfung, grammatikalische Prüfung, ggf. Hinweis an den Nutzer auf synonyme Bezeichnungen → Thesaurus) werden alle, mit der Suchmaschine SM in Verbindung stehenden Server S1 . . . Sn nach diesem Deskriptor abgefragt. Von allen, auf den unterschiedlichen Servern ermittelten Datensätzen DS werden Bruchstücke (Blöcke) mit Angabe der Fundstelle in den Arbeitsspeicher AS der Suchmaschine SM geladen. Dort wird überprüft, ob redundante Datensätze DSred, charakterisiert durch identische Strings (Wort- und/oder Zeichenfolgen), z. B. im Titel einer wissenschaftlichen Publikation, einer Patentschrift, etc. vorhanden sind. Diese redundanten Datensätze DSred werden nachfolgend gelöscht.
Parallel dazu wird die Häufung der auf den einzelnen Servern S1 . . . Sn ermittelten Datensätze DS verglichen und die Gesamtzahl nges der ermittelten, relevanten Datensätze DSrel (nach Eliminierung redundanter Datensätze) berechnet.
Ist die Anzahl der ermittelten Datensätze nDSrel kleiner als ein wählbares, vom Benutzer oder vom Rechercheprogramm vorgebbares Maximum nDSmax (z. B. 20 Datensätze), so wird die Recherche abgebrochen und die ermittelten Datensätze werden auf den Arbeits- oder Massespeicher des Computers des Benutzers übertragen.
Ist demgegenüber die ermittelte Anzahl relevanter Datensätze nDSrel größer als dieser Grenzwert, so wird ein weiterer Recherchesuchlauf durchgeführt.
Dazu wird durch den Nutzer ein weiteres relevantes Suchwort vorgegeben. Es besteht aber auch die Möglichkeit, dem Benutzer durch das adaptive Rechercheprogramm alternative Vorschläge für weitere Deskriptoren zu unterbreiten, mit denen eine Ein­ schränkung und Präzisierung der Recherchestrategie ermöglicht wird. So können bei der Suche nach einem technisch determinierten Schlagwort, z. B. "Kraftfahrzeug", als ergänzende Deskriptoren Suchwörter vorgegeben werden, durch die die Zweckbindung des Kraftfahrzeuges näher bestimmt wird (zum Beispiel Personenkraftwagen, Nutz­ kraftwagen, etc.).
Nachfolgend wird der zweite Deskriptor mit dem Deskriptor des ersten Suchlaufes additiv verbunden und der zweite Recherchendurchlauf gestartet. Dabei wird gegenüber dem ersten Recherchendurchlauf die Reihenfolge, in der die Server S1 bis Sn abgefragt werden, nach einem Prioritätsprinzip ausgewählt. Die Prioritätsbestimmung berücksich­ tigt die Häufung ermittelter, relevanter Datensätze DSrel, die auf den einzelnen Servern im Ergebnis des ersten Recherchendurchlaufes ermittelt wurden. Beim nachfolgenden, zweiten Recherchendurchlauf wird zunächst der Server Si angefahren, auf dem die meisten relevanten Datensätze (bereinigt von redundanten Datensätzen) gespeichert sind. Mit absteigender Häufung (und abnehmender Trefferwahrscheinlichkeit) werden zunächst die weiteren Server abgefragt, auf denen im ersten Recherchendurchlauf relevante Datensätze ermittelt wurden.
Nachfolgend werden Bruchstücke (Blöcke) aller ermittelten, relevanten Datensätze in den Arbeitsspeicher der Suchmaschine übertragen und die Dateninhalte auf Identität (oder Ähnlichkeit) überprüft.
Redundante Datensätze werden wiederum entfernt, um die Datenmenge zu begrenzen. Neben der Identitätsprüfung kann eine Ähnlichkeitsprüfung der ermittelten Datensätze vorgenommen werden. Dabei werden Datensätze, zum Beispiel Titel von Publikationen, als ähnlich angesehen, wenn der Verfasser und das Publikationsjahr gleich sind. Ist der Autor gleich, das Erscheinungsjahr der Publikationen jedoch verschieden, so wählt das Programm den prioritätsjüngeren Datensatz aus.
Nachfolgend wird die Gesamtzahl der ermittelten, relevanten (das heißt von identischen oder ähnlichen Informationen) bereinigten Datensätze und deren Häufigkeitsverteilung auf den einzelnen angefahrenen Servern dargestellt. Ist die Gesamtzahl der ermittelten, relevanten Datensätze kleiner als ein vorgegebener Maximalwert, so wird die Recherche abgebrochen und die, auf den einzelnen Servern ermittelten, relevanten Datensätze werden auf den Arbeits- oder Massespeicher des Computers des Benutzers übertragen.
Ist die Anzahl der ermittelten Datensätze nur geringfügig größer als der vorgegebene Maximalwert, so wird der Benutzer gefragt, ob er die Anzahl der Recherchenergebnisse durch einen weiteren Recherchesuchlauf mit einem gesonderten Deskriptor einschrän­ ken will oder ob er die Recherche abbrechen möchte.
Ist die Anzahl der ermittelten, relevanten Datensätze demgegenüber wesentlich größer als der gewählte Maximalwert, so wird dem Benutzer durch das adaptive Recherchepro­ gramm ein weiterer Deskriptor vorgeschlagen. Ebenso besteht die Möglichkeit, daß der Benutzer einen Deskriptor seiner Wahl dem nächsten Recherchesuchlauf zugrundelegt. So könnte bei der vorgehend genannten Recherche eine weitere Spezifikation des Recherchenzieles darin bestehen, daß die additiv verbundene Deskriptorenkette "Kraftfahrzeug" und "Nutzkraftfahrzeug" ergänzt wird mit dem Suchwort "Bau" oder "Straßenbau".
Die Auswahl der vom Recherchenprogramm vorgeschlagenen Deskriptoren kann sich - entsprechend dem Ziel der Recherche - an umgangs- oder fachsprachlichen Aspekten orientieren. So kann eine technisch orientierte Recherche, insbesondere eine Recherche nach relevanten Schutzrechten, unter Verwendung international üblicher Klassifika­ tionseinteilungen (z. B. internationale Patentklassifikation IPC) vorgenommen werden.
In der vorstehend beschriebenen Weise werden iterativ bis zu n-Recherchensuchläufe durchgeführt, bis die gewünschte, maximale Anzahl relevanter Datensätze nDSmax erreicht bzw. unterschritten wird. Wird im letzten Recherchendurchlauf eine Anzahl relevanter Datensätze ermittelt, die sehr klein im Vergleich zur vorgegebenen, maximal zulässigen Anzahl der Datensätze ist, so erhält der Benutzer den Hinweis, daß durch diesen letzten Recherchesuchlauf das Recherchenergebnis zu stark eingegrenzt worden ist.
Dem Benutzer wird die Möglichkeit geboten, zu den Ergebnissen des davorliegenden Recherchensuchlaufes zurückzukehren und die Recherche an dieser Stelle abzubrechen oder mit einem neuen, geänderten Deskriptor einen weiteren Recherchedurchlauf zu starten.
Eine weitere, vorteilhafte Möglichkeit zur Erhöhung der Trefferwahrscheinlichkeit einer Recherche besteht darin, daß eine Korrelation zwischen dem Datenvolumen eines Datensatzes und der Häufigkeit des Auftretens des jeweils gesuchten Deskriptors innerhalb dieses Datensatzes (Fundstelle) vorgenommen wird.
Beträgt beispielsweise das Datenvolumen eines ermittelten Datensatzes 10,0 Kilobyte (ca. 5 Seiten DIN A4) und wurde innerhalb dieses Datensatzes ein gesuchter Deskriptor (z. B. das Suchwort "Nutzkraftfahrzeug") nur einmal ermittelt, so ist die Wahrschein­ lichkeit hoch, daß in dem ermittelten Datensatz lediglich peripher über "Nutzkraft­ fahrzeuge" berichtet wird.
Die Informationsdichte ID als Quotient aus Anzahl der ermittelten (identischen) Deskriptoren innerhalb eines Datensatzes und dem Datenvolumen (Informationsumfang, Anzahl der Seiten, etc.) dieses Datensatzes ist ein Indikator für die Wahrscheinlichkeit Prel, einen relevanten Datensatz DSrel zu ermitteln.
Durch das Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken wird somit eine Optimierung von Informationsrecherchen (selektive Sachrecherchen, Überblicksrecherchen, etc.) erreicht.
Eine alternative Möglichkeit zur Ermittlung einer akzeptablen Anzahl relevanter Daten­ sätze DSrel bei einer Informationsrecherche geht von der Nutzung mehrerer, vorher­ gehend beschriebener "kreativer" Suchmaschinen aus.
Der Informationssuchende gibt über eine Eingabeeinrichtung seines Computers ein ihn interessierendes Recherchesuchwort (Wort, String, Zeichenkette, etc.) ein.
Der Computer stellt über die vorhandenen Kommunikationswege die Verbindung mit einer Suchmaschine SMMaster innerhalb des Netzwerkes her. Diese Suchmaschine stellt Ihrerseits Verbindungen mit n weiteren Suchmaschinen SMSlave.1 . . . . SMSlave.n innerhalb der Netzstruktur her. Dabei wird die Recherchenanfrage an alle angewählten Such­ maschinen weitergeleitet. Jede dieser n Suchmaschinen steht Ihrerseits mit einer Anzahl von Servern (S1.1, S1.2, S1.k . . . Si.n-2, Si.n-1, Si.n) in Verbindung.
Im Ergebnis dieses ersten dezentralen Recherchensuchlaufes ermitteln alle n, im Slave- Modus arbeitenden, kreativen Suchmaschinen SMSlave.1 . . . . SMSlave.n eine Anzahl von Datensätzen, in denen der gewünschte Suchbegriff enthalten ist. Jede der Suchmaschi­ nen SMSlave.i registriert nach Abschluß dieses ersten Recherchensuchlaufes, auf welchem der angewählten Server Sj sie welche Anzahl von Datensätzen ermittelt hat. Diese Ergebnisse werden auf einem Speicher SP der jeweiligen, im Slave-Modus arbeitenden Suchmaschine SMSlave.i abgelegt.
In einem zweiten Verfahrensschritt erfolgt ein Vergleich der von den einzelnen Slave- Suchmaschinen SMSlave.1 . . . . SMSlave.n ermittelten Datensätze untereinander. Dabei werden wiederum redundante Datensätze ermittelt und ausgeschieden.
Nachfolgend wird die Häufigkeit der auf den einzelnen Slave-Suchmaschinen SMSlave.1 . . . . SMSlave.n ermittelten, relevanten Datensätze DSrel verglichen und die Gesamtzahl nges.rel der ermittelten, relevanten Datensätze DSrel berechnet.
Ist die Anzahl der ermittelten Datensätze nges.rel größer als ein vorgegebener oder vorgebbarer Grenzwert, so wird ein zweiter Recherchensuchlauf mit einem ergänzenden Deskriptor durchgeführt.
Die Reihenfolge, in der beim zweiten Recherchendurchlauf die Slave-Suchmaschinen SMSlave.b . . . . SMSlave.h von der Master-Suchmaschine SMMaster angefahren werden, richtet sich nach der Häufung der, beim ersten Recherchensuchlauf über die einzelnen Slave-Suchmaschinen SMSlave.1 . . . . SMSlave.i ermittelten, relevanten Datensätze DSrel. Wegen der höheren Trefferwahrscheinlichkeit wird so zunächst die Slave-Suchmaschine SMSlave.h angefahren, auf der beim ersten Recherchensuchlauf die meisten relevanten Datensätze DSrel gefunden wurden. Wurde durch mehrere Slave-Suchmaschinen eine gleiche Anzahl nDSrel relevanter Datensätze ermittelt, so wird als weiteres Auswahl­ kriterium die Informationsdichte ID ausgewählt und danach die Reihenfolge der anzufahrenden Slave-Suchmaschinen bestimmt.
Wird bei diesem zweiten Recherchensuchlauf bereits nach der Abfrage der g-ten Slave- Suchmaschine SMSlave.g (wobei g < i) eine Anzahl relevanter Datensätze DSrel ermittelt, die oberhalb des vorgegebenen Grenzwertes liegt, so wird die Recherche abgebrochen. Gleichzeitig wird vermerkt, welche Slave-Suchmaschinen an diesem Recherchensuch­ lauf nicht beteiligt waren.
Durch diese iterative Abfrage wird die Wahrscheinlichkeit, relevante Datensätze bei minimiertem Suchaufwand zu ermitteln, signifikant verbessert.
Ein weiterer Vorteil der Einbindung einer Anzahl von n Slave-Suchmaschinen in eine Recherche besteht darin, daß die Ergebnisse einzelner Rechercheläufe temporär oder dauerhaft auf einem "Inhaltsspeicher" der beteiligten Master- oder Slave-Suchmaschine abgelegt werden können. Dieser "Inhaltsspeicher" hat vorzugsweise die Struktur einer Datenbank. Dabei wird in der Datenbank die jeweilige Recherchenanfrage (Suchwort, Deskriptor, Zeichnung, Formel, etc.) und die Anzahl der zum Rechenchenzeitpunkt temporär über diese Suchmaschine(n) in den angeschlossenen n Servern S1 . . . Sn ermittelten, relevanten Datensätze eingetragen.
Damit besteht die Möglichkeit, bei einer späteren Recherche nach einem identischen oder begrifflich ähnlichen Suchwort (Deskriptor) qualifiziert auf die Server zuzugreifen, auf denen mit höherer Wahrscheinlichkeit relevante Datensätze abgelegt sind.
Wird bei einer derartigen, zeitlich versetzen Recherche (z. B. bei einer nochmaligen Suche eines anderen Nutzers nach dem Deskriptor "Kraftfahrzeug") festgestellt, daß sich die Häufigkeitsverteilung der ermittelten, relevanten Datensätze auf den angewähl­ ten Servern geändert hat, so wird diese Drifterscheinung ebenfalls in der Datenbank "Inhaltsangabe" der jeweiligen Master- und/oder Slave-Suchmaschine gespeichert.
Damit wird sichergestellt, daß bei jedem weiteren, nachfolgenden Recherchensuchlauf nach einem identischen oder inhaltsähnlichen Suchwort (Deskriptor) primär die Quellen (Server) angewählt werden, die die höchste Trefferwahrscheinlichkeit für die Ermittlung relevanter Datensätze DSrel aufweisen.
Damit stellt die Datenbank "Inhaltsangabe" ein selbstlernendes System dar.
So wird bei einer neuen Recherche zunächst überprüft, ob das vorgegebene Suchwort bereits identisch in der Datenbank "Inhaltsangabe" enthalten ist. Ist das nicht der Fall, so wird überprüft, ob bereits Recherchen nach ähnlichen, inhaltsgleichen Begriffen durchgeführt worden sind. Ist das der Fall, d. h. wurde beispielsweise über diese Master- oder Slave-Suchmaschine bereits eine Recherche nach dem Begriff "Kraftfahrzeug" (anstelle des ursprünglich gewählten Suchbegriffes "Nutzkraftfahrzeug") vorgenommen, so wird die Suche nach dem neuen Deskriptor "Nutzkraftfahrzeug" wegen der höheren Trefferwahrscheinlichkeit zunächst über die Slave-Suchmaschinen in den Servern durchgeführt, in denen beim letzten Recherchensuchlauf die größte Anzahl relevanter Datensätze (gegebenenfalls unter Berücksichtigung der Informationsdichte dieser Datensätze) ermittelt wurde.
Die Bewertung der Trefferwahrscheinlichkeit der in Konkurrenz arbeitenden Slave- Suchmaschinen wird dabei durch die Master-Suchmaschine vorgenommen.
Um den Zeitaufwand einer Informationsrecherche weiter zu minimieren, besteht die vorteilhafte Möglichkeit, die Recherchefrage parallel an mehrere Master-Suchmaschinen zu leiten, die im Netzwerk autonom arbeiten oder miteinander verbunden sind. Da die Master-Suchmaschinen ihrerseits jeweils mit einer Anzahl i . . . k unterschiedlicher Server kommunizieren, werden Rechercheergebnisse ermittelt, die mit hoher Wahr­ scheinlichkeit repräsentativ für die untersuchte Grundgesamtheit von Informationsquel­ len (Servern) sind.
In einer vorteilhaften Ausgestaltung des Verfahrens zur Datenermittlung und -aufberei­ tung in Informationsnetzwerken werden die intelligenten, kreativen Suchmaschinen SMMaster über Kommunikationswege untereinander als neuronales Netz verbunden. Bei jeder Recherche werden dabei die gewonnenen Ergebnisse über die Häufigkeit ermittel­ ter relevanter Datensätze, deren Informationsgehalt (Informationsdichte ID) und somit die Trefferwahrscheinlichkeit auf den angefahrenen Servern protokolliert und auf ausgewählten oder auf allen, im Netz befindlichen Suchmaschinen SMMaster abgelegt. Durch diesen informationellen Selbstlernprozeß der Suchmaschinen SMMaster wird die Qualität und Ausbeute der Recherchen systematisch verbessert und der zeitliche und finanzielle Recherchenaufwand signifikant gesenkt.
Die Erfindung wird nachfolgend an einem Ausführungsbeispiel näher beschrieben.
Ein Nutzer des INTERNET in Belgien möchte sich eine Übersicht über alle Restaurants der Hansestadt Hamburg verschaffen.
Der Informationssuchende gibt über die Tastatur seines Computers als Suchstring "Restaurant Hamburg" ein. Die Obergrenze der maximal zu ermittelnden relevanten Datensätze DSrel.max wurde vom Informationssuchenden aus Kostengründen auf 1.000 begrenzt.
Nachfolgend wird die Verbindung des Computers mit einer Suchmaschine SMMaster innerhalb des Netzwerkes hergestellt. Diese Suchmaschine SMMaster korrespondiert ständig mit 10 Suchmaschinen SMSlave.1 . . . SMSlave.10. Die Suchmaschine SMMaster wählt zufällig eine Slave-Suchmaschine aus. Die im vorliegenden Fall ausgewählte Suchma­ schine SMSlave.6 korrespondiert mit 26.414 Servern weltweit.
Die Suchmaschine SMSlave.6 sucht nunmehr in allen, mit ihr verbundenen Servern nach den kummulativ auftretenden Informationen "Restaurant" und "Hamburg".
Als Ergebnis wird auf dem Display des Informationssuchenden die Gesamtzahl der ermittelten Datensätze nges aufgezeigt. Die ermittelte Anzahl von 10.012 Datensätzen umfaßt alle nachgewiesenen Gaststätten in Belgien, den Niederlanden und Luxemburg mit der besonderen Etablissementbezeichnung "Hamburg".
Da dieses Recherchenergebnis nicht den Vorstellungen des Informationssuchenden ent­ spricht, wird die Recherche an dieser Stelle nicht abgebrochen, sondern die Such­ maschine SMMaster wählt aus den 10, mit ihr verbundenen Suchmaschinen SMSlave.1 . . . SMSlave.10 nach dem Zufallsprinzip weitere Suchmaschinen aus, an die die Recherchen­ frage weitergeleitet wird. Anschließend werden die Recherchenergebnisse übermittelt. So wurden unter Inanspruchnahme der Suchmaschine SMSlave.2 insgesamt 2.444 Daten­ sätze gefunden, in denen die Begriffe "Restaurant" und "Hamburg" in den USA, Kanada und Deutschland gefunden wurden.
Die Suchmaschine SMSlave.1 ermittelte 1.436 Datensätze, in denen sich ein Hinweis auf die Suchbegriffe "Restaurant" und "Hamburg" innerhalb der Europäischen Union und in Japan findet.
Die Suchmaschine SMSlave.4 liefert als Ergebnis 795 Datensätze, in denen Restaurants mit der Geschäftsbezeichnung "Hamburg" innerhalb der Bundesrepublik Deutschland ermittelt wurden.
Die Suchmaschine SMSlave.9 findet bei der analogen Recherche in den, mit ihr verbun­ denen Servern insgesamt 1.214 Datensätze von Restaurants in Deutschland und Däne­ mark.
Die Suchmaschine SMSlave.10 ermittelt insgesamt 7.117 Restaurants in Frankreich, Deutschland und den Niederlanden mit der besonderen Geschäftsbezeichnung "Hamburg".
Die Suchmaschine SMSlave.5 findet 402 Datensätze von gleichnamigen Restaurants in der Bundesrepublik.
Die Suchmaschine SMSlave.3 ermittelt 7.212 Gaststätten in den USA, Kanada, Mexiko, Großbritannien, Frankreich, Italien und Deutschland.
Die Suchmaschine SMSlave.7 ermittelt 222 Datensätze, die auf Restaurants mit der besonderen Geschäftsbezeichnung "Hamburg" in den Vereinigten Staaten hinweisen.
Die Suchmaschine SMSlave.6 findet 9.781 Datensätze mit Hinweisen auf gleichnamige Restaurants in den USA, Australien und Neuseeland.
Die Suchmaschine SMSlave.8 ermittelt 2.006 Datensätze mit den Deskriptoren "Restaurant" und "Hamburg" mit Sitz in Großbritannien, den USA, Japan und Süd­ korea.
Anschließend läuft eine automatische Kreuz- und Autokorrelationsanalyse der sich im Arbeitsspeicher AS der Suchmaschine SMMaster befindlichen Daten ab. Dabei werden die Datensätze ermittelt, die redundant von zwei oder mehreren Suchmaschinen ermittelt wurden.
Nach Eliminierung der redundanten Datensätze werden die ermittelten, relevanten Datensätze aufgezeigt. Im vorliegenden Fall werden nur die Datensätze angesprochen, in denen die Deskriptorenkette "Restaurant, Hamburg" in Verbindung mit "Bundes­ republik Deutschland" als Resourcenquelle aufgefunden wurden. Relevante Datensätze wurden somit nur über die Suchmaschinen SMSlave.1, SMSlave.2, SMSlave.4, SMSlave.5, SMSlave.9 und SMSlave.10 ermittelt.
Unter Berücksichtigung der Häufung H(DSrel) relevanter Datensätze DSrel ergibt sich die Rangfolge aus dem Gesamtspektrum der Datensätze DS wie folgt:
n5.rel = 402
n4.rel = 795
n9.rel = 1.214
n1.rel = 1.436
n2.rel = 2.444
n10.rel = 7.117
n3.rel = 7.212
Aufgrund der vorliegenden Obergrenze der maximal zu ermittelnden, relevanten Datensätze von nrelmax = 1.000 werden nur die Ergebnisse der Suchmaschinen SMSlave.5 und SMSlave.4 weiterverarbeitet.
Daneben erfolgt eine interne Bewertung aller Suchmaschinen, deren Bewertungs­ ergebnisse in der Lernmatrix (Datenbank) der Suchmaschine SMMaster abgespeichert wird. In der Reihenfolge von "beste" bis "schlechteste" Suchmaschine ergibt sich folgende Reihenfolge:
Die Reihenfolge wird als Wertigkeit durch eine Punktbewertung berücksichtigt. Obwohl die Suchmaschinen SMSlave.6 . . . SMSlave.8 keine relevanten Datensätze ermittelt haben, werden diese Suchmaschinen nicht mit der Bewertungskennziffer "0" bewertet, da von diesen Suchmaschinen Datenbestände erfaßt wurden, die für eine ergänzende Recherche noch relevant sein könnten. So ist beispielsweise in dem Suchfundus "Europäische Union" Deutschland mittelbar enthalten.
Nachfolgend werden die, von den Suchmaschinen SMSlave.4 und SMSlave.5 ermittelten relevanten Datensätze angezeigt.
Ist der Informationssuchende mit den Ergebnissen der Recherche zufrieden, kann ein Abbruch der Recherche erfolgen.
Soll die Recherche weiter spezifiziert werden, erfolgt ein weiterer Recherchesuchlauf. Dabei wird mittels der angeschlossenen Master-Suchmaschine SMMaster und der mit ihr verbundenen Slave-Suchmaschinen nach der Deskriptorenkette ["Stadt" und "Hamburg" und ("Restaurant" oder "Gaststätte")] gesucht.
Prinzipiell könnte die Recherche auf die Suchmaschinen DMSlave.4 und DMSlave.5 be­ schränkt werden, die im vorigen Recherchelauf die besten Ergebnisse erbracht haben.
Ist der Informationssuchende jedoch an einer hohen Repräsentanz der ermittelten relevanten Datensätze interessiert, so werden von der Suchmaschine SMMaster wiederum alle 10 mit ihr korrespondierenden Suchmaschinen SMSlave.1 bis SMSlave.10 abgefragt. Dabei werden wegen der hohen, zu erwartenden Trefferwahrscheinlichkeit zunächst die Suchmaschine SMSlave.5, dann die Suchmaschine SMSlave.4, usw. angefahren.
Nach diesem zweiten Recherchenlauf werden alle ermittelten Ergebnisse aufgezeigt:
Durch die Suchmaschine SMSlave.5 wurden 120 Restaurants in der Stadt Hamburg ermittelt. Die Datensuche über die Suchmaschine SMSlave.4 ergab 140 Nachweise von Restaurants in der Stadt Hamburg. Die Recherche über die Suchmaschine SMSlave.2 erbrachte 400 Datensätze von Restaurants in den USA und Deutschland mit dem Namen "Stadt Hamburg".
Im Ergebnis einer erneuten Auto- und Kreuzkorrelationsanalyse wurde festgestellt, daß alle Datensätze, die über die Suchmaschine SMSlave.5 ermittelt wurden, sich in identi­ scher Form im Bestand der Datensätze der Suchmaschine SMSlave.4 befinden. Alle übrigen Datensätze sind nicht redundant. Somit bleiben 140 relevante Datensätze übrig, die dem Informationssuchenden angezeigt und in den Arbeits- bzw. Hauptspeicher seines Rechners kopiert werden, da das Abbruchkriterium nrel < nrelmax erfüllt ist. Die Trefferwahrscheinlichkeit, die von den einzelnen Suchmaschinen SMSlave.1 bis SMSlave.10 bei dieser speziellen Recherche erzielt wurde, wird in der Lernmatrix (Datenbank) der Suchmaschine SMMaster abgelegt.
Damit besteht die Möglichkeit, daß bei einer identischen oder ähnlichen Recherche eines anderen Informationssuchenden die Master-Suchmaschine SMMaster zunächst die Suchmaschinen SMSlave.i bis SMSlave.m auswählt, die aufgrund der bisherigen Recher­ cheerfahrungen die höchste Trefferquote relevanter Datensätze erwarten lassen. Kommt es dabei aufgrund der sich ständig ändernden Datenmengen und -inhalte zu einer Verschiebung der Prioritätsliste (Rangfolge der zu erwartenden Trefferwahrscheinlich­ keit), so werden auch diese Änderungen in der Lernmatrix der kreativen Suchmaschine SMMaster registriert, so daß eine ständige Aktualisierung erfolgt.
Ebenso werden in der Lernmatrix synonyme Deskriptoren gespeichert, die im Falle einer ergebnislosen Recherche eine Suche nach inhaltsgleichen Deskriptoren ermög­ licht. Nach der "Anlernphase", in der der Aufbau der Lernmatrizen auf den Mastersuch­ maschinen SMMaster erfolgt, erhält der Informationssuchende bei der Kontaktaufnahme mit der intelligenten Suchmaschine SMMaster zu Beginn seiner Sitzung eine Übersicht der recherchierbaren Fachgebiete, da jede Suchmaschine SMMaster regelmäßig nicht mit allen Servern weltweit in Verbindung stehen wird. Nachdem der Informationssuchende sich für ein, ihn interessierendes Fachgebiet entschieden und die Suche nach einem ersten Deskriptor gestartet hat, läuft das Verfahren zur selektiven Informationsgewin­ nung in der vorstehend beschriebenen Weise.
Durch das selbstlernende System wird der zeitliche und finanzielle Aufwand für eine selektive Informationsrecherche signifikant verringert.
Übersicht verwendeter Bezugszeichen
AS Arbeitsspeicher
D Deskriptor
Dunzul
unzulässiger Deskriptor
Dsyn
synonymer Deskriptor
DS Datensatz
DSähnl
Datensatz mit ähnlichem Deskriptor
DSred
redundanter Datensatz
DSrel
relevanter Datensatz
H(D) Häufigkeit des Deskriptors D
H(DS) Häufung des Datensatzes DS
ID
Informationsdichte
nDSrel
Anzahl relevanter Datensätze
nDSmax
maximale Anzahl relevanter Datensätze
nges.rel
Summe relevanter Datensätze
Prel
Wahrscheinlichkeit
S Server
SM Suchmaschine
SMMaster
Master-Suchmaschine
SMSlave
Slave-Suchmaschine
SP Speicher
VDSrel
Volumen eines relevanten Datensatzes

Claims (7)

1. Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken, insbesondere in regionalen und globalen Datennetzen, wobei ein relevantes Recherchesuchwort (Deskriptor D) über die Eingabeeinrichtung eines Computers eingegeben und über Informationsübertra­ gungseinrichtungen die Verbindung mit einer Suchmaschine SM hergestellt wird,
wobei der Computer und/oder die Suchmaschine SM die Korrektheit und Zulässigkeit des Deskriptor D überprüft und bei unzulässigen Deskriptoren Dunzul synonyme Deskriptoren Dsyn ermittelt,
dass nachfolgend alle, mit der Suchmaschine SM in Verbindung stehenden Server S1 . . . Sn nach diesem Deskriptor abgefragt und von allen, auf den Servern S1 . . . Sn ermittelten Daten­ sätzen DS bruchstückartige Blöcke mit Angabe der Fundstelle in den Arbeitsspeicher AS der Suchmaschine SM geladen werden,
dass nachfolgend redundante Datensätze DSred eliminiert werden,
dass die Häufung H(DSi) der auf den einzelnen Servern S1 . . . Sn ermittelten Datensätze DSi verglichen und die Gesamtzahl nges.rel der ermittelten, relevanten Datensätze DSrel nach Eliminierung redundanter Datensätze DSred bestimmt wird,
wobei die Recherche abgebrochen wird und die ermittelten Datensätze auf den Arbeits- oder Massespeicher des Computers übertragen werden, falls die Anzahl der ermittelten Datensätze nDSrel kleiner als ein vorgebbares Maximum nDSmax ist
oder dass automatisch ein weiterer Recherchesuchlauf durchgeführt wird, falls die ermittelte Anzahl relevanter Datensätze nDSrel größer als dieses Maximum nDSmax ist,
wobei durch das Rechercheprogramm ein weiteres relevantes Suchwort vorgegeben und der zweite Recherchendurchlauf gestartet wird,
wobei die Server S1 bis Sn von der Suchmaschine in der Reihenfolge der Häufung H(DSrel) der Anzahl der ermittelten, relevanten Datensätze DSrel abgefragt werden,
dass nachfolgend bruchstückartige Blöcke mit Angabe der Fundstelle in den Arbeits­ speicher AS der Suchmaschine SM geladen werden,
dass nachfolgend redundante Datensätze DSred gelöscht werden,
und dass die Recherche abgebrochen wird und die ermittelten Datensätze auf den Arbeits- oder Massespeicher des Computers übertragen werden, falls die Anzahl der ermittelten Datensätze nDSrel kleiner als das vorgebbare Maximum nDSmax ist oder
daß ein weiterer Recherchesuchlauf durchgeführt wird, bis die Forderung nDSrel ≦ nDSmax erfüllt ist.
2. Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken, insbesondere in regionalen und globalen Datennetzen, wobei ein relevantes Recherchesuchwort (Deskriptor D) über die Eingabeeinrichtung eines Computers eingegeben und über Informationsübertra­ gungseinrichtungen die Verbindung mit einer Master-Suchmaschine SMMaster hergestellt wird, die ihrerseits Verbindungen mit n weiteren Slave-Suchmaschinen SMSlave.1 . . . . SMSlave.n innerhalb des Netzes herstellt, wobei jede dieser n Slave-Suchmaschinen mit einer Anzahl von Servern (S1.1, S1.2, S1.k . . . Si.n-2, Si.n-1, Si.n) in Verbindung steht,
dass nachfolgend alle, mit den Slave-Suchmaschinen SMSlave.1 . . . SMSlave.n in Verbindung stehenden Server (S1.1, S1.2, S1.k . . . Si.n-2, Si.n-1, Si.n) nach dem Deskriptor D abgefragt und von allen, auf den Servern ermittelten Datensätzen DS bruchstückartige Blöcke mit Angabe der Fundstelle in die jeweiligen Arbeitsspeicher AS der Slave-Suchmaschinen SMSlave.1 . . . . SMSlave.n geladen werden,
dass nachfolgend redundante Datensätze DSred eliminiert werden,
dass auf jeder Slave-Suchmaschine SMSlave.i gespeichert wird, auf welchem der angewählten Server Sj welche Anzahl von Datensätzen ermittelt wurde,
dass nachfolgend ein Vergleich der Anzahl oder der Häufung der von den einzelnen Slave- Suchmaschinen SMSlave.1 . . . . SMSlave.n ermittelten Datensätze vorgenommen wird, wobei redundante Datensätze ermittelt und ausgeschieden werden,
dass die Anzahl nges.rel der ermittelten, relevanten Datensätze DSrel ermittelt wird,
wobei die Recherche abgebrochen wird und die ermittelten Datensätze auf den Arbeits- oder Massespeicher des Computers übertragen werden, falls die Anzahl der ermittelten Datensätze nDSrel kleiner als ein vorgebbares Maximum nDSmax ist
oder dass automatisch
ein weiterer Recherchesuchlauf durchgeführt wird, falls die ermittelte Anzahl relevanter Datensätze nDSrel größer als dieses Maximum nDSmax ist,
wobei durch das Rechercheprogramm ein weiteres relevantes Suchwort vorgegeben und der zweite Recherchendurchlauf gestartet wird, wobei die Slave-Suchmaschinen SMSlave.1 . . . SMSlave.n mit den jeweiligen Servern S1.1, S1.2, . . . S1.n von der Master-Suchmaschine SMMaster in der Reihenfolge der Häufung H(DSrel) der Anzahl der ermittelten, relevanten Datensätze DSrel abgefragt werden,
dass nachfolgend bruchstückartige Blöcke mit Angabe der Fundstelle in die jeweiligen Arbeitsspeicher AS der Salve-Suchmaschinen SMSlave.1 . . . SMSlave.n geladen werden,
dass nachfolgend redundante Datensätze DSred gelöscht werden,
und dass die Recherche abgebrochen wird und die ermittelten Datensätze auf den Arbeits- oder Massespeicher des Computers übertragen werden, falls die Anzahl der ermittelten Datensätze nDSrel kleiner als das vorgebbare Maximum nDSmax ist oder
dass ein weiterer Recherchesuchlauf durchgeführt wird, bis die Forderung nDSrel ≦ nDSmax erfüllt ist.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet,
dass eine Korrelation zwischen dem Datenvolumen VDSrel eines relevanten Datensatzes DSrel und der Häufigkeit H(Di) des Auftretens des jeweils gesuchten Deskriptors Di innerhalb dieses Datensatzes vorgenommen und daraus die Informationsdichte des relevanten Datensatzes DSrel bestimmt wird,
und daß nur von den Datensätzen DSrel.1 . . . DSrel.n bruchstückartige Blöcke mit Angabe der Fundstelle in den bzw. die Arbeitsspeicher AS der Suchmaschine SM bzw. der Slave- Suchmaschinen SMSlave.1 . . . . SMSlave.n geladen werden, die eine vorgegebene minimale Informa­ tionsdichte ID aufweisen.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass nach der Übertragung bruchstückartiger Blöcke aller, auf den Servern S1 . . . Sn bzw. S1.1 . . . Si.n ermittelten Datensätzen DS in den bzw. die Arbeitsspeicher AS der Suchmaschine SM bzw. der Slave-Suchmaschinen SMSlave.1 . . . . SMSlave.n ähnliche Datensätze DSähnl eliminiert werden.
5. Verfahren nach einem der Ansprüche 2 bis 4, dadurch gekennzeichnet, dass die Ergebnisse der Recherchenabfragen auf einem Inhaltsspeicher der beteiligten Master- und/oder Slave-Suchmaschine abgelegt werden.
6. Verfahren nach einem der Ansprüche 2 bis 5, dadurch gekennzeichnet, dass mehrere Master-Suchmaschinen SMMaster über Kommunikationswege untereinander zu einem neuronalen Netz verbunden werden.
7. Verfahren nach Anspruch 2 oder 6, dadurch gekennzeichnet, dass die Recherchenabfrage parallel an mehrere Master-Suchmaschinen SMMaster übertragen wird, die im Informationsnetzwerk autonom arbeiten oder miteinander verbunden sind.
DE19651788A 1996-12-12 1996-12-12 Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken Expired - Fee Related DE19651788C2 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19651788A DE19651788C2 (de) 1996-12-12 1996-12-12 Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19651788A DE19651788C2 (de) 1996-12-12 1996-12-12 Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken

Publications (2)

Publication Number Publication Date
DE19651788A1 DE19651788A1 (de) 1998-06-25
DE19651788C2 true DE19651788C2 (de) 2001-01-04

Family

ID=7814536

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19651788A Expired - Fee Related DE19651788C2 (de) 1996-12-12 1996-12-12 Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken

Country Status (1)

Country Link
DE (1) DE19651788C2 (de)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19842320A1 (de) * 1998-09-16 2000-03-23 Ibm Verfahren und Einrichtung zur inhaltsbezogenen Suche von elektronischen Dokumenten
US6463455B1 (en) * 1998-12-30 2002-10-08 Microsoft Corporation Method and apparatus for retrieving and analyzing data stored at network sites
DE19909017A1 (de) * 1999-03-02 2000-09-14 Manfred Buettner Verfahren zum Vermitteln von persönlichen oder geschäftlichen Kontakten
US7259880B1 (en) 1999-04-01 2007-08-21 Oce Printing Systems Gmbh Device and method for processing and printing information
DE50013918D1 (de) 1999-05-05 2007-02-15 Siemens Ag Verfahren zum Auffinden einer Kontaktperson oder zum Verbindungsaufbau zu dieser Kontaktperson
DE19939625A1 (de) * 1999-08-20 2001-02-22 Nokia Mobile Phones Ltd Verfahren zum Abrufen von Informationen aus einem Informationsnetzwerk
US6789073B1 (en) * 2000-02-22 2004-09-07 Harvey Lunenfeld Client-server multitasking
DE10029644B4 (de) * 2000-06-16 2008-02-07 Deutsche Telekom Ag Verfahren zur Relevanzbewertung bei der Indexierung von Hypertext-Dokumenten mittels Suchmaschine
NL1016379C2 (nl) * 2000-07-25 2002-01-28 Alphonsus Albertus Schirris Werkwijze en zoekmachine voor het doorzoeken van ten minste ÚÚn gegevensbestand.
JP5057546B2 (ja) * 2006-03-24 2012-10-24 キヤノン株式会社 文書検索装置および文書検索方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0747845A1 (de) * 1995-06-07 1996-12-11 International Business Machines Corporation Rechnernetzwerk für WWW-Anbieter-Datenzugriff auf das Internet

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0747845A1 (de) * 1995-06-07 1996-12-11 International Business Machines Corporation Rechnernetzwerk für WWW-Anbieter-Datenzugriff auf das Internet

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
IBM Technical Disclosure Bulletin, Vol. 38, No. 01, January 1995, S. 607/608 *

Also Published As

Publication number Publication date
DE19651788A1 (de) 1998-06-25

Similar Documents

Publication Publication Date Title
DE69833238T2 (de) System zur Schlüsselwortgewinnung und Textwiederauffingungssystem zu seiner Verwendung
DE69933187T2 (de) Dokumentensuchverfahren und Dienst
DE2459006C2 (de) Einrichtung zum Bilden einer absoluten Adresse in einer Datenverarbeitunsanlage
DE60121231T2 (de) Datenverarbeitungsverfahren
DE69834386T2 (de) Textverarbeitungsverfahren und rückholsystem und verfahren
DE69433165T2 (de) Assoziatives textsuch- und wiederauffindungssystem
DE69533193T2 (de) Paralleles verarbeitungssystem zum durchlaufen einer datenbank
EP1783633B1 (de) Suchmaschine für eine ortsbezogene Suche
DE102007037646B4 (de) Computerspeichersystem und Verfahren zum Indizieren, Durchsuchen und zur Datenwiedergewinnung von Datenbanken
DE19651788C2 (de) Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken
DE112010002620T5 (de) Ontologie-nutzung zum ordnen von datensätzen nachrelevanz
DE10028624B4 (de) Verfahren und Vorrichtung zur Dokumentenbeschaffung
EP1620810B1 (de) Verfahren und anordnung zur einrichtung und aktualisierung einer benutzeroberfl che zum zugriff auf informationsseiten in ein em datennetz
WO2011044865A1 (de) Verfahren zum bestimmen einer ähnlichkeit von objekten
WO1999011023A2 (de) Verfahren zum ermitteln der technischen adresse eines kommunikationspartners und telekommunikationsgerät
EP1325412B1 (de) Verfahren zum zugriff auf eine speichereinheit, in der vermerkfolgen gespeichert sind, zugehörige speichereinheit und zugehöriges programm
EP1094405A2 (de) Verfahren zum Erzeugen einer dynamischen Auswahlmaske für den Abruf von Daten aus einer Datenbank
DE19933621C2 (de) Netzserver zum Bereitstellen einer Informationsseite und Verfahren zum Bereitstellen einer Webseite
EP0945705A2 (de) Erkennungssystem
DE10261839A1 (de) Verfahren und Einrichtung zur Durchführung einer elektronischen Recherche
EP0833263A2 (de) Datenbank, Verfahren zum Ableiten einer Datenbank und Verfahren zur Abfrage einer Datenbank
DE102018104438A1 (de) Computerimplementiertes Verfahren zum Beschaffen von Informationen
DE10318333A1 (de) Datenverarbeitungssystem
DE10160920B4 (de) Verfahren und Vorrichtung zur Erzeugung eines Extrakts von Dokumenten
EP0563077B1 (de) Verfahren zum maschinellen ermitteln von in zwei datenfolgen enthaltenen gleichen datenelementen

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
D2 Grant after examination
8364 No opposition during term of opposition
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee