DE19651788A1 - Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken - Google Patents
Verfahren zur Datenermittlung und -aufbereitung in InformationsnetzwerkenInfo
- Publication number
- DE19651788A1 DE19651788A1 DE19651788A DE19651788A DE19651788A1 DE 19651788 A1 DE19651788 A1 DE 19651788A1 DE 19651788 A DE19651788 A DE 19651788A DE 19651788 A DE19651788 A DE 19651788A DE 19651788 A1 DE19651788 A1 DE 19651788A1
- Authority
- DE
- Germany
- Prior art keywords
- search
- data records
- determined
- slave
- rel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
Die Erfindung betrifft ein Verfahren zur Datenermittlung und -aufbereitung in Infor
mationsnetzwerken, insbesondere in regionalen und globalen Datennetzen, wie dem
INTERNET.
Für die selektive Suche von Daten stehen dem Benutzer regionaler oder globaler
Rechnerverbundsysteme sogenannte Suchmaschinen zur Verfügung. Dabei handelt es
sich um leistungsfähige Netzwerkcomputer, auf denen Rechercheprogramme verarbeitet
werden. Der Ablauf einer konventionellen Recherche geht dabei wie folgt vonstatten:
Der Benutzer gibt ein relevantes Suchwort (Deskriptor) über die Eingabeeinrichtungen
(Tastatur, Maus, Spracherkennungssystem) seines Computers ein, nachdem er den
Zugang zu einer beliebigen Suchmaschine innerhalb des Informationsnetzes hergestellt
hat. Nachdem die Rechercheanfrage als Informationsblock an die Suchmaschine
übertragen wurde, führt diese eine routinemäßige Abfrage aller mit ihr in Verbindung
stehender Informationsspeicher (Server) durch. Nach Beendigung der Abfrage kann der
Benutzer alle ermittelten Datensätze, in denen das relevante Suchwort (Deskriptor)
gefunden wurde, in den Arbeits- oder Massespeicher seines Computers laden
(kopieren).
Nachteil dieser Lösung ist, daß bei diesem Verfahren verhältnismäßig große Datenmen
gen ermittelt und übertragen werden, die sich bei anschließender Prüfung als nicht
relevant herausstellen. Ebenso kann nicht verhindert werden, daß auf verschiedenen
Servern identische Datensätze ermittelt und an den Benutzer übertragen werden. Auch
hier stellt sich erst im Ergebnis einer manuellen Sichtung der ermittelten Informationen
heraus, daß ein relativ hoher Anteil der ermittelten Informationen redundant erfaßt
worden ist.
Neben der unerwünschten Informationsflut, die eine Auswertung brauchbarer Informa
tionen erschwert, entstehen bei diesem Verfahren auch vermeidbare Mehrkosten durch
den längeren Aufenthalt im (gebührenpflichtigen) Netz bzw. beim Zugriff auf kosten
pflichtige Datenbanken.
Aufgabe der Erfindung ist es, die Nachteile des bekannten Standes der Technik zu
eliminieren und ein Verfahren zu entwickeln, daß dem Informationssuchenden eine
überschaubare Anzahl relevanter Datensätze selektiv bereitstellt.
Erfindungsgemäß wird die Aufgabe durch die Merkmale des kennzeichnenden Teils des
Hauptanspruches gelöst. Eine alternative Lösung der Aufgabe wird im Nebenanspruch 2
vorgeschlagen. Vorzugsweise Weiterbildungen sind in den Unteransprüchen dargelegt.
Der Informationssuchende gibt - wie bisher - ein relevantes Recherchesuchwort
(Deskriptor D) über die Eingabeeinrichtung seines Computers ein. Anschließend wird
die Verbindung mit einer Suchmaschine hergestellt, auf der ein adaptives Recherche
programm abgearbeitet wird. Das Verfahren zur Informationsermittlung und -auf
bereitung weist folgende Teilschritte auf:
Nachdem die Suchmaschine SM die Korrektheit und Zulässigkeit des Suchbegriffes (Deskriptor) überprüft hat (Rechtschreibprüfung, grammatikalische Prüfung, ggf. Hinweis an den Nutzer auf synonyme Bezeichnungen → Thesaurus) werden alle, mit der Suchmaschine SM in Verbindung stehenden Server S1. . .Sn nach diesem Deskriptor abgefragt. Von allen, auf den unterschiedlichen Servern ermittelten Datensätzen DS werden Bruchstücke (Blöcke) mit Angabe der Fundstelle in den Arbeitsspeicher AS der Suchmaschine SM geladen. Dort wird überprüft, ob redundante Datensätze DSred, gekennzeichnet durch identische Strings (Wort- und/oder Zeichenfolgen), z. B. im Titel einer wissenschaftlichen Publikation, einer Patentschrift, etc. vorhanden sind. Diese redundanten Datensätze DSred werden nachfolgend gelöscht.
Nachdem die Suchmaschine SM die Korrektheit und Zulässigkeit des Suchbegriffes (Deskriptor) überprüft hat (Rechtschreibprüfung, grammatikalische Prüfung, ggf. Hinweis an den Nutzer auf synonyme Bezeichnungen → Thesaurus) werden alle, mit der Suchmaschine SM in Verbindung stehenden Server S1. . .Sn nach diesem Deskriptor abgefragt. Von allen, auf den unterschiedlichen Servern ermittelten Datensätzen DS werden Bruchstücke (Blöcke) mit Angabe der Fundstelle in den Arbeitsspeicher AS der Suchmaschine SM geladen. Dort wird überprüft, ob redundante Datensätze DSred, gekennzeichnet durch identische Strings (Wort- und/oder Zeichenfolgen), z. B. im Titel einer wissenschaftlichen Publikation, einer Patentschrift, etc. vorhanden sind. Diese redundanten Datensätze DSred werden nachfolgend gelöscht.
Parallel dazu wird die Häufung der auf den einzelnen Servern S1. . .Sn ermittelten
Datensätze DS verglichen und die Gesamtzahl nges der ermittelten, relevanten Datensät
ze DSrel (nach Eliminierung redundanter Datensätze) berechnet.
Ist die Anzahl der ermittelten Datensätze nDSrel kleiner als ein wählbares, vom Benutzer
oder vom Rechercheprogramm vorgebbares Maximum nDSmax (z. B. 20 Datensätze), so
wird die Recherche abgebrochen und die ermittelten Datensätze werden auf den Arbeits-
oder Massespeicher des Computers des Benutzers übertragen.
Ist demgegenüber die ermittelte Anzahl relevanter Datensätze nDSrel größer als dieser
Grenzwert, so wird ein weiterer Recherchesuchlauf durchgeführt.
Dazu wird durch den Nutzer ein weiteres relevantes Suchwort vorgegeben. Es besteht
aber auch die Möglichkeit, dem Benutzer durch das adaptive Rechercheprogramm
alternative Vorschläge für weitere Deskriptoren zu unterbreiten, mit denen eine Ein
schränkung und Präzisierung der Recherchestrategie ermöglicht wird. So können bei der
Suche nach einem technisch determinierten Schlagwort, z. B. "Kraftfahrzeug", als
ergänzende Deskriptoren Suchwörter vorgegeben werden, durch die die Zweckbindung
des Kraftfahrzeuges näher bestimmt wird (zum Beispiel Personenkraftwagen, Nutz
kraftwagen, etc.).
Nachfolgend wird der zweite Deskriptor mit dem Deskriptor des ersten Suchlaufes
additiv verbunden und der zweite Recherchendurchlauf gestartet. Dabei wird gegenüber
dem ersten Recherchendurchlauf die Reihenfolge, in der die Server S1 bis Sn abgefragt
werden, nach einem Prioritätsprinzip ausgewählt. Die Prioritätsbestimmung berücksich
tigt die Häufung ermittelter, relevanter Datensätze DSrel, die auf den einzelnen Servern
im Ergebnis des ersten Recherchendurchlaufes ermittelt wurden. Beim nachfolgenden,
zweiten Recherchendurchlauf wird zunächst der Server Si angefahren, auf dem die
meisten relevanten Datensätze (bereinigt von redundanten Datensätzen) gespeichert
sind. Mit absteigender Häufung (und abnehmender Trefferwahrscheinlichkeit) werden
zunächst die weiteren Server abgefragt, auf denen im ersten Recherchendurchlauf
relevante Datensätze ermittelt wurden.
Nachfolgend werden Bruchstücke (Blöcke) aller ermittelten, relevanten Datensätze in
den Arbeitsspeicher der Suchmaschine übertragen und die Dateninhalte auf Identität
(oder Ähnlichkeit) überprüft.
Redundante Datensätze werden wiederum entfernt, um die Datenmenge zu begrenzen.
Neben der Identitätsprüfung kann eine Ähnlichkeitsprüfung der ermittelten Datensätze
vorgenommen werden. Dabei werden Datensätze, zum Beispiel Titel von Publikationen,
als ähnlich angesehen, wenn der Verfasser und das Publikationsjahr gleich sind. Ist der
Autor gleich, das Erscheinungsjahr der Publikationen jedoch verschieden, so wählt das
Programm den prioritätsjüngeren Datensatz aus.
Nachfolgend wird die Gesamtzahl der ermittelten, relevanten (das heißt von identischen
oder ähnlichen Informationen) bereinigten Datensätze und deren Häufigkeitsverteilung
auf den einzelnen angefahrenen Servern dargestellt. Ist die Gesamtzahl der ermittelten,
relevanten Datensätze kleiner als ein vorgegebener Maximalwert, so wird die Recherche
abgebrochen und die, auf den einzelnen Servern ermittelten, relevanten Datensätze
werden auf den Arbeits- oder Massespeicher des Computers des Benutzers übertragen.
Ist die Anzahl der ermittelten Datensätze nur geringfügig größer als der vorgegebene
Maximalwert, so wird der Benutzer gefragt, ob er die Anzahl der Recherchenergebnisse
durch einen weiteren Recherchesuchlauf mit einem gesonderten Deskriptor einschrän
ken will oder ob er die Recherche abbrechen möchte.
Ist die Anzahl der ermittelten, relevanten Datensätze demgegenüber wesentlich größer
als der gewählte Maximalwert, so wird dem Benutzer durch das adaptive Recherchepro
gramm ein weiterer Deskriptor vorgeschlagen. Ebenso besteht die Möglichkeit, daß der
Benutzer einen Deskriptor seiner Wahl dem nächsten Recherchesuchlauf zugrundelegt.
So könnte bei der vorgehend genannten Recherche eine weitere Spezifikation des
Recherchenzieles darin bestehen, daß die additiv verbundene Deskriptorenkette
"Kraftfahrzeug" und "Nutzkraftfahrzeug" ergänzt wird mit dem Suchwort "Bau" oder
"Straßenbau".
Die Auswahl der vom Recherchenprogramm vorgeschlagenen Deskriptoren kann sich -
entsprechend dem Ziel der Recherche - an umgangs- oder fachsprachlichen Aspekten
orientieren. So kann eine technisch orientierte Recherche, insbesondere eine Recherche
nach relevanten Schutzrechten, unter Verwendung international üblicher Klassifika
tionseinteilungen (z. B. internationale Patentklassifikation IPC) vorgenommen werden.
In der vorstehend beschriebenen Weise werden iterativ bis zu n-Recherchensuchläufe
durchgeführt, bis die gewünschte, maximale Anzahl relevanter Datensätze nDSmax
erreicht bzw. unterschritten wird. Wird im letzten Recherchendurchlauf eine Anzahl
relevanter Datensätze ermittelt, die sehr klein im Vergleich zur vorgegebenen, maximal
zulässigen Anzahl der Datensätze ist, so erhält der Benutzer den Hinweis, daß durch
diesen letzten Recherchesuchlauf das Recherchenergebnis zu stark eingegrenzt worden
ist.
Dem Benutzer wird die Möglichkeit geboten, zu den Ergebnissen des davorliegenden
Recherchensuchlaufes zurückzukehren und die Recherche an dieser Stelle abzubrechen
oder mit einem neuen, geänderten Deskriptor einen weiteren Recherchedurchlauf zu
starten.
Eine weitere, vorteilhafte Möglichkeit zur Erhöhung der Trefferwahrscheinlichkeit einer
Recherche besteht darin, daß eine Korrelation zwischen dem Datenvolumen eines
Datensatzes und der Häufigkeit des Auftretens des jeweils gesuchten Deskriptors
innerhalb dieses Datensatzes (Fundstelle) vorgenommen wird.
Beträgt beispielsweise das Datenvolumen eines ermittelten Datensatzes 10,0 Kilobyte
(ca. 5 Seiten DIN A4) und wurde innerhalb dieses Datensatzes ein gesuchter Deskriptor
(z. B. das Suchwort "Nutzkraftfahrzeug") nur einmal ermittelt, so ist die Wahrschein
lichkeit hoch, daß in dem ermittelten Datensatz lediglich peripher über "Nutzkraft
fährzeuge" berichtet wird.
Die Informationsdichte ID als Quotient aus Anzahl der ermittelten (identischen)
Deskriptoren innerhalb eines Datensatzes und dem Datenvolumen (Informationsumfang,
Anzahl der Seiten, etc.) dieses Datensatzes ist ein Indikator für die Wahrscheinlichkeit
Prel, einen relevanten Datensatz DSrel zu ermitteln.
Durch das Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken
wird somit eine Optimierung von Informationsrecherchen (selektive Sachrecherchen,
Überblicksrecherchen, etc.) erreicht.
Eine alternative Möglichkeit zur Ermittlung einer akzeptablen Anzahl relevanter Daten
sätze DSrel bei einer Informationsrecherche geht von der Nutzung mehrerer, vorher
gehend beschriebener "kreativer" Suchmaschinen aus.
Der Informationssuchende gibt über eine Eingabeeinrichtung seines Computers ein ihn
interessierendes Recherchesuchwort (Wort, String, Zeichenkette, etc.) ein.
Der Computer stellt über die vorhandenen Kommunikationswege die Verbindung mit
einer Suchmaschine SMMaster innerhalb des Netzwerkes her. Diese Suchmaschine stellt
Ihrerseits Verbindungen mit n weiteren Suchmaschinen SMSlave.1 . . .. SMSlave.n innerhalb
der Netzstruktur her. Dabei wird die Recherchenanfrage an alle angewählten Such
maschinen weitergeleitet. Jede dieser n Suchmaschinen steht Ihrerseits mit einer Anzahl
von Servern (S1.1, S1.2, . . . Si.n-2, Si.n-1 Si.n) in Verbindung.
Im Ergebnis dieses ersten dezentralen Recherchensuchlaufes ermitteln alle n, im Slave-
Modus arbeitenden, kreativen Suchmaschinen SMSlave.1 . . .. SMSlave.n eine Anzahl von
Datensätzen, in denen der gewünschte Suchbegriff enthalten ist. Jede der Suchmaschi
nen SMSlave.i registriert nach Abschluß dieses ersten Recherchensuchlaufes, auf welchem
der angewählten Server Sj sie welche Anzahl von Datensätzen ermittelt hat. Diese
Ergebnisse werden auf einem Speicher SP der jeweiligen, im Slave-Modus arbeitenden
Suchmaschine SMSlave.i abgelegt.
In einem zweiten Verfahrensschritt erfolgt ein Vergleich der von den einzelnen Slave-
Suchmaschinen SMSlave.i . . .. SMSlave.n ermittelten Datensätze untereinander. Dabei
werden wiederum redundante Datensätze ermittelt und ausgeschieden.
Nachfolgend wird die Häufigkeit der auf den einzelnen Slave-Suchmaschinen SMSlave.1
. . . . SMSlave.n ermittelten, relevanten Datensätze DSrel verglichen und die Gesamtzahl
nges.rel der ermittelten, relevanten Datensätze DSrel berechnet.
Ist die Anzahl der ermittelten Datensätze nges.rel größer als ein vorgegebener oder
vorgebbarer Grenzwert, so wird ein zweiter Recherchensuchlauf mit einem ergänzenden
Deskriptor durchgeführt.
Die Reihenfolge, in der beim zweiten Recherchendurchlauf die Slave-Suchmaschinen
SMSlave.b . . .. SMSlave.h von der Master-Suchmaschine SMMaster angefahren werden,
richtet sich nach der Häufung der, beim ersten Recherchensuchlauf über die einzelnen
Slave-Suchmaschinen SMSlave.1 . . .. SMSlave.i ermittelten, relevanten Datensätze DSrel.
Wegen der höheren Trefferwahrscheinlichkeit wird so zunächst die Slave-Suchmaschine
SMSlave.h angefahren, auf der beim ersten Recherchensuchlauf die meisten relevanten
Datensätze DSrel gefunden wurden. Wurde durch mehrere Slave-Suchmaschinen eine
gleiche Anzahl nDSrel relevanter Datensätze ermittelt, so wird als weiteres Auswahl
kriterium die Informationsdichte ID ausgewählt und danach die Reihenfolge der
anzufahrenden Slave-Suchmaschinen bestimmt.
Wird bei diesem zweiten Recherchensuchlauf bereits nach der Abfrage der g-ten Slave-
Suchmaschine SMSlave.g (wobei g<i) eine Anzahl relevanter Datensätze DSrel ermittelt,
die oberhalb des vorgegebenen Grenzwertes liegt, so wird die Recherche abgebrochen.
Gleichzeitig wird vermerkt, welche Slave-Suchmaschinen an diesem Recherchensuch
lauf nicht beteiligt waren.
Durch diese iterative Abfrage wird die Wahrscheinlichkeit, relevante Datensätze bei
minimiertem Suchaufwand zu ermitteln, signifikant verbessert.
Ein weiterer Vorteil der Einbindung einer Anzahl von n Slave-Suchmaschinen in eine
Recherche besteht darin, daß die Ergebnisse einzelner Rechercheläufe temporär oder
dauerhaft auf einem "Inhaltsspeicher" der beteiligten Master- oder Slave-Suchmaschine
abgelegt werden können. Dieser "Inhaltsspeicher" hat vorzugsweise die Struktur einer
Datenbank. Dabei wird in der Datenbank die jeweilige Recherchenanfrage (Suchwort,
Deskriptor, Zeichnung, Formel, etc.) und die Anzahl der zum Rechenchenzeitpunkt
temporär über diese Suchmaschine(n) in den angeschlossenen n Servern S1 . . . Sn
ermittelten, relevanten Datensätze eingetragen.
Damit besteht die Möglichkeit, bei einer späteren Recherche nach einem identischen
oder begrifflich ähnlichen Suchwort (Deskriptor) qualifiziert auf die Server zuzugreifen,
auf denen mit höherer Wahrscheinlichkeit relevante Datensätze abgelegt sind.
Wird bei einer derartigen, zeitlich versetzen Recherche (z. B. bei einer nochmaligen
Suche eines anderen Nutzers nach dem Deskriptor "Kraftfahrzeug") festgestellt, daß
sich die Häufigkeitsverteilung der ermittelten, relevanten Datensätze auf den angewähl
ten Servern geändert hat, so wird diese Drifterscheinung ebenfalls in der Datenbank
"Inhaltsangabe" der jeweiligen Master- und/oder Slave-Suchmaschine gespeichert.
Damit wird sichergestellt, daß bei jedem weiteren, nachfolgenden Recherchensuchlauf
nach einem identischen oder inhaltsähnlichen Suchwort (Deskriptor) primär die Quellen
(Server) angewählt werden, die die höchste Trefferwahrscheinlichkeit für die Ermittlung
relevanter Datensätze DSrel aufweisen.
Damit stellt die Datenbank "Inhaltsangabe" ein selbstlernendes System dar.
So wird bei einer neuen Recherche zunächst überprüft, ob das vorgegebene Suchwort
bereits identisch in der Datenbank "Inhaltsangabe" enthalten ist. Ist das nicht der Fall,
so wird überprüft, ob bereits Recherchen nach ähnlichen, inhaltsgleichen Begriffen
durchgeführt worden sind. Ist das der Fall, d. h. wurde beispielsweise über diese Master-
oder Slave-Suchmaschine bereits eine Recherche nach dem Begriff "Kraftfahrzeug"
(anstelle des ursprünglich gewählten Suchbegriffes "Nutzkraftfahrzeug") vorgenommen,
so wird die Suche nach dem neuen Deskriptor "Nutzkraftfahrzeug" wegen der höheren
Trefferwahrscheinlichkeit zunächst über die Slave-Suchmaschinen in den Servern
durchgeführt, in denen beim letzten Recherchensuchlauf die größte Anzahl relevanter
Datensätze (gegebenenfalls unter Berücksichtigung der Informationsdichte dieser
Datensätze) ermittelt wurde.
Die Bewertung der Trefferwahrscheinlichkeit der in Konkurrenz arbeitenden Slave-
Suchmaschinen wird dabei durch die Master-Suchmaschine vorgenommen.
Um den Zeitaufwand einer Informationsrecherche weiter zu minimieren, besteht die
vorteilhafte Möglichkeit, die Recherchefrage parallel an mehrere Master-Suchmaschinen
zu leiten, die im Netzwerk autonom arbeiten oder miteinander verbunden sind. Da die
Master-Suchmaschinen ihrerseits jeweils mit einer Anzahl i . . . k unterschiedlicher
Server kommunizieren, werden Rechercheergebnisse ermittelt, die mit hoher Wahr
scheinlichkeit repräsentativ für die untersuchte Grundgesamtheit von Informationsquel
len (Servern) sind.
In einer vorteilhaften Ausgestaltung des Verfahrens zur Datenermittlung und -aufberei
tung in Informationsnetzwerken werden die intelligenten, kreativen Suchmaschinen
SMMaster über Kommunikationswege untereinander als neuronales Netz verbunden. Bei
jeder Recherche werden dabei die gewonnenen Ergebnisse über die Häufigkeit ermittel
ter relevanter Datensätze, deren Informationsgehalt (Informationsdichte ID) und somit
die Trefferwahrscheinlichkeit auf den angefahrenen Servern protokolliert und auf
ausgewählten oder auf allen, im Netz befindlichen Suchmaschinen SMMaster abgelegt.
Durch diesen informationellen Selbstlernprozeß der Suchmaschinen SMMaster wird die
Qualität und Ausbeute der Recherchen systematisch verbessert und der zeitliche und
finanzielle Recherchenaufwand signifikant gesenkt.
Die Erfindung wird nachfolgend an einem Ausführungsbeispiel näher beschrieben.
Ein Nutzer des INTERNET in Belgien möchte sich eine Übersicht über alle Restaurants
der Hansestadt Hamburg verschaffen.
Der Informationssuchende gibt über die Tastatur seines Computers als Suchstring
"Restaurant Hamburg", ein. Die Obergrenze der maximal zu ermittelnden relevanten
Datensätze DSrel.max wurde vom Informationssuchenden aus Kostengründen auf 1.000
begrenzt.
Nachfolgend wird die Verbindung des Computers mit einer Suchmaschine SMMaster
innerhalb des Netzwerkes hergestellt. Diese Suchmaschine SMMaster korrespondiert
ständig mit 10 Suchmaschinen SMSlave.1 . . . SMSlave.10. Die Suchmaschine SMMaster wählt
zufällig eine Slave-Suchmaschine aus. Die im vorliegenden Fall ausgewählte Suchma
schine SMSLave.6 korrespondiert mit 26.414 Servern weltweit.
Die Suchmaschine SMSLave.6 sucht nunmehr in allen, mit ihr verbunden Servern nach
den kummulativ auftretenden Informationen "Restaurant" und "Hamburg".
Als Ergebnis wird auf dem Display des Informationssuchenden die Gesamtzahl der
ermittelten Datensätze nges aufgezeigt. Die ermittelte Anzahl von 10.012 Datensätzen
umfaßt alle nachgewiesenen Gaststätten in Belgien, den Niederlanden und Luxemburg
mit der besonderen Etablissementbezeichnung "Hamburg".
Da dieses Recherchenergebnis nicht den Vorstellungen des Informationssuchenden ent
spricht, wird die Recherche an dieser Stelle nicht abgebrochen, sondern die Such
maschine SMMaster wählt aus den 10, mit ihr verbundenen Suchmaschinen SMSlave.1 . . .
SMSlave.10 nach dem Zufallsprinzip weitere Suchmaschinen aus, an die die Recherchen
frage weitergeleitet wird. Anschließend werden die Recherchenergebnisse übermittelt.
So wurden unter Inanspruchnahme der Suchmaschine SMSlave.2 insgesamt 2.444 Daten
sätze gefunden, in denen die Begriffe "Restaurant" und "Hamburg" in den USA,
Kanada und Deutschland gefunden wurden.
Die Suchmaschine SMSlave.1 ermittelte 1.436 Datensätze, in denen sich ein Hinweis auf
die Suchbegriffe "Restaurant" und "Hamburg" innerhalb der Europäischen Union und in
Japan findet.
Die Suchmaschine SMSlave.4 liefert als Ergebnis 795 Datensätze, in denen Restaurants
mit der Geschäftsbezeichnung "Hamburg" innerhalb der Bundesrepublik Deutschland
ermittelt wurden.
Die Suchmaschine SMSlave.9 findet bei der analogen Recherche in den, mit ihr verbun
denen Servern insgesamt 1.214 Datensätze von Restaurants in Deutschland und Däne
mark.
Die Suchmaschine SMSlave.10 ermittelt insgesamt 7.117 Restaurants in Frankreich,
Deutschland und den Niederlanden mit der besonderen Geschäftsbezeichnung
"Hamburg".
Die Suchmaschine SMSlave.5 findet 402 Datensätze von gleichnamigen Restaurants in
der Bundesrepublik.
Die Suchmaschine SMSlave.3 ermittelt 7.212 Gaststätten in den USA, Kanada, Mexiko,
Großbritannien, Frankreich, Italien und Deutschland.
Die Suchmaschine SMSlave.7 ermittelt 222 Datensätze, die auf Restaurants mit der
besonderen Geschäftsbezeichnung "Hamburg" in den Vereinigten Staaten hinweisen.
Die Suchmaschine SMSlave.6 findet 9.781 Datensätze mit Hinweisen auf gleichnamige
Restaurants in den USA, Australien und Neuseeland.
Die Suchmaschine SMSlave.8 ermittelt 2.006 Datensätze mit den Deskriptoren
"Restaurant" und "Hamburg" mit Sitz in Großbritannien, den USA, Japan und Süd
korea.
Anschließend läuft eine automatische Kreuz- und Autokorrelationsanalyse der sich im
Arbeitsspeicher AS der Suchmaschine SMMaster befindlichen Daten ab. Dabei werden
die Datensätze ermittelt, die redundant von zwei oder mehreren Suchmaschinen
ermittelt wurden.
Nach Eliminierung der redundanten Datensätze werden die ermittelten, relevanten
Datensätze aufgezeigt. Im vorliegenden Fall werden nur die Datensätze angesprochen,
in denen die Deskriptorenkette "Restaurant, Hamburg" in Verbindung mit "Bundes
republik Deutschland" als Resourcenquelle aufgefunden wurden. Relevante Datensätze
wurden somit nur über die Suchmaschinen SMSlave.1, SMSlave.2, SMSlave.4, SMSlave.5,
SMSlave.9 und SMSlave.10 ermittelt.
Unter Berücksichtigung der Häufung H(DSrel) relevanter Datensätze DSrel ergibt sich
die Rangfolge aus dem Gesamtspektrum der Datensätze DS wie folgt:
n5.rel = 402
n4.rel = 795
n9.rel = 1.214
n1.rel = 1.436
n2.rel = 2.444
n10.rel = 7.117
n3.rel = 7.212
n4.rel = 795
n9.rel = 1.214
n1.rel = 1.436
n2.rel = 2.444
n10.rel = 7.117
n3.rel = 7.212
Aufgrund der vorliegenden Obergrenze der maximal zu ermittelnden, relevanten
Datensätze von nrelmax = 1.000 werden nur die Ergebnisse der Suchmaschinen SMSlave.5
und SMSlave.4 weiterverarbeitet.
Daneben erfolgt eine interne Bewertung aller Suchmaschinen, deren Bewertungs
ergebnisse in der Lernmatrix (Datenbank) der Suchmaschine SMMaster abgespeichert
wird. In der Reihenfolge von "beste" bis "schlechteste" Suchmaschine ergibt sich
folgende Reihenfolge:
Die Reihenfolge wird als Wertigkeit durch eine Punktbewertung berücksichtigt. Obwohl
die Suchmaschinen SMSlave.6 . . . SMSlave.8 keine relevanten Datensätze ermittelt haben,
werden diese Suchmaschinen nicht mit der Bewertungskennziffer "0" bewertet, da von
diesen Suchmaschinen Datenbestände erfaßt wurden, die für eine ergänzende Recherche
noch relevant sein könnten. So ist beispielsweise in dem Suchfundus "Europäische
Union" Deutschland mittelbar enthalten.
Nachfolgend werden die, von den Suchmaschinen SMSlave.4 und SMSlave.5 ermittelten
relevanten Datensätze angezeigt.
Ist der Informationssuchende mit den Ergebnissen der Recherche zufrieden, kann ein
Abbruch der Recherche erfolgen.
Soll die Recherche weiter spezifiziert werden, erfolgt eine weiterer Recherchesuchlauf.
Dabei wird mittels der angeschlossenen Master-Suchmaschine SMMaster und der mit ihr
verbundenen Slave-Suchmaschinen nach der Deskriptorenkette ["Stadt" und "Hamburg"
und ("Restaurant" oder "Gaststätte")] gesucht.
Prinzipiell könnte die Recherche auf die Suchmaschinen DSSlave.4 und DSSlave.5 be
schränkt werden, die im vorigen Recherchelauf die besten Ergebnisse erbracht haben.
Ist der Informationssuchende jedoch an einer hohen Repräsentanz der ermittelten
relevanten Datensätze interessiert, so werden von der Suchmaschine SMMaster wiederum
alle 10 mit ihr korrespondierenden Suchmaschinen SMSlave.1 bis SMSlave.10 abgefragt.
Dabei werden wegen der hohen, zu erwartenden Trefferwahrscheinlichkeit zunächst die
Suchmaschine SMSlave.5, dann die Suchmaschine SMSlave.4, usw. angefahren.
Nach diesem zweiten Recherchenlauf werden alle ermittelten Ergebnisse aufgezeigt:
Durch die Suchmaschine SMSlave.5 wurden 120 Restaurants in der Stadt Hamburg ermittelt. Die Datensuche über die Suchmaschine SMSlave.4 ergab 140 Nachweise von Restaurants in der Stadt Hamburg. Die Recherche über die Suchmaschine SMSlave.2 erbrachte 400 Datensätze von Restaurants in den USA und Deutschland mit dem Namen "Stadt Hamburg".
Durch die Suchmaschine SMSlave.5 wurden 120 Restaurants in der Stadt Hamburg ermittelt. Die Datensuche über die Suchmaschine SMSlave.4 ergab 140 Nachweise von Restaurants in der Stadt Hamburg. Die Recherche über die Suchmaschine SMSlave.2 erbrachte 400 Datensätze von Restaurants in den USA und Deutschland mit dem Namen "Stadt Hamburg".
Im Ergebnis einer erneuten Auto- und Kreuzkorrelationsanalyse wurde festgestellt, daß
alle Datensätze, die über die Suchmaschine SMSlave.5 ermittelt wurden, sich in identi
scher Form im Bestand der Datensätze der Suchmaschine SMSlave.4 befinden. Alle
übrigen Datensätze sind nicht redundant. Somit bleiben 140 relevante Datensätze übrig,
die dem Informationssuchenden angezeigt und in den Arbeits- bzw. Hauptspeicher
seines Rechners kopiert werden, da das Abbruchkriterium nrel < nrelmax erfüllt ist. Die
Trefferwahrscheinlichkeit, die von den einzelnen Suchmaschinen SMSlave.1 bis SMSlave.10
bei dieser speziellen Recherche erzielt wurde, wird in der Lernmatrix (Datenbank) der
Suchmaschine SMMaster abgelegt.
Damit besteht die Möglichkeit, daß bei einer identischen oder ähnlichen Recherche
eines anderen Informationssuchenden die Master-Suchmaschine SMMaster zunächst die
Suchmaschinen SMSlave.i bis SMSlave.m auswählt, die aufgrund der bisherigen Recher
cheerfahrungen die höchste Trefferquote relevanter Datensätze erwarten lassen. Kommt
es dabei aufgrund der sich ständig ändernden Datenmengen und -inhalte zu einer
Verschiebung der Prioritätsliste (Rangfolge der zu erwartenden Trefferwahrscheinlich
keit), so werden auch diese Änderungen in der Lernmatrix der kreativen Suchmaschine
SMMaster registriert, so daß eine ständige Aktualisierung erfolgt.
Ebenso werden in der Lernmatrix synonyme Deskriptoren gespeichert, die im Falle
einer ergebnislosen Recherche eine Suche nach inhaltsgleichen Deskriptoren ermög
licht. Nach der "Anlernphase", in der der Aufbau der Lernmatrizen auf den Mastersuch
maschinen SMMaster erfolgt, erhält der Informationssuchende bei der Kontaktaufnahme
mit der intelligenten Suchmaschine SMMaster zu Beginn seiner Sitzung eine Übersicht
der recherchierbaren Fachgebiete, da jede Suchmaschine SMMaster regelmäßig nicht mit
allen Servern weltweit in Verbindung stehen wird. Nachdem der Informationssuchende
sich für ein, ihn interessierendes Fachgebiet entschieden und die Suche nach einem
ersten Deskriptor gestartet hat, läuft das Verfahren zur selektiven Informationsgewin
nung in der vorstehend beschriebenen Weise.
Durch das selbstlemende System wird der zeitliche und finanzielle Aufwand für eine
selektive Informationsrecherche signifikant verringert.
AS Arbeitsspeicher
D Deskriptor
Dunzul
D Deskriptor
Dunzul
unzulässiger Deskriptor
Dsyn
Dsyn
synonymer Deskriptor
DS Datensatz
DSähnl
DS Datensatz
DSähnl
Datensatz mit ähnlichem Deskriptor
DSred
DSred
redundanter Datensatz
DSrel
DSrel
relevanter Datensatz
H(D) Häufigkeit des Deskriptors D
H(DS) Häufung des Datensatzes DS
ID
H(D) Häufigkeit des Deskriptors D
H(DS) Häufung des Datensatzes DS
ID
Informationsdichte
nDSrel
nDSrel
Anzahl relevanter Datensätze
nDSmax
nDSmax
maximale Anzahl relevanter Datensätze
nges.rel
nges.rel
Summe relevanter Datensätze
Prel
Prel
Wahrscheinlichkeit
S Server
SM Suchmaschine
SMMaster
S Server
SM Suchmaschine
SMMaster
Master-Suchmaschine
SMSlave
SMSlave
Slave-Suchmaschine
SP Speicher
VDSrel
SP Speicher
VDSrel
Volumen eines relevanten Datensatzes
Claims (7)
1. Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken,
insbesondere in regionalen und globalen Datennetzen, wobei ein relevantes Recherche
suchwort (Deskriptor D) über die Eingabeeinrichtung eines Computers eingegeben und
über Informationsübertragungseinrichtungen die Verbindung mit einer Suchmaschine
SM hergestellt wird,
wobei der Computer und/oder die Suchmaschine SM die Korrektheit und Zulässigkeit des Deskriptor D überprüft und bei unzulässigen Deskriptoren Dunzul synonyme Deskriptoren Dsyn ermittelt und dem Nutzer vorschlägt,
daß nachfolgend alle, mit der Suchmaschine SM in Verbindung stehenden Server S1 . . . Sn nach diesem Deskriptor abgefragt und von allen, auf den Servern S1 . . . Sn ermittelten Datensätzen DS bruchstückartige Blöcke mit Angabe der Fundstelle in den Arbeits speicher AS der Suchmaschine SM geladen werden,
daß nachfolgend redundante Datensätze DSred eliminiert werden,
daß die Häufung H(DSi) der auf den einzelnen Servern S1 . . . Sn ermittelten Datensätze DSi verglichen und die Gesamtzahl nges.rel der ermittelten, relevanten Datensätze DSrel nach Eliminierung redundanter Datensätze DSred bestimmt wird,
wobei die Recherche abgebrochen wird und die ermittelten Datensätze auf den Arbeits- oder Massespeicher des Computers des Benutzers übertragen werden, falls die Anzahl der ermittelten Datensätze nDSrel kleiner als ein wählbares, vom Benutzer oder vom Rechercheprogramm vorgebbares Maximum nDSmax ist oder
daß ein weiterer Recherchesuchlauf durchgeführt wird, falls die ermittelte Anzahl relevanter Datensätze nDSrel größer als dieser Grenzwert ist,
wobei durch den Nutzer oder das Rechercheprogramm ein weiteres relevantes Suchwort vorgegeben und der zweite Recherchendurchlauf gestartet wird,
wobei die Server S1 bis Sn von der Suchmaschine in der Reihenfolge der Häufung H(DSrel) der Anzahl der ermittelten, relevanten Datensätze DSrel abgefragt werden,
daß nachfolgend bruchstückartige Blöcke mit Angabe der Fundstelle in den Arbeitsspei cher AS der Suchmaschine SM geladen werden,
daß nachfolgend redundante Datensätze DSred gelöscht werden,
und die Recherche abgebrochen wird und die ermittelten Datensätze auf den Arbeits- oder Massespeicher des Computers des Benutzers übertragen werden, falls die Anzahl der ermittelten Datensätze nDSrel kleiner als ein wählbares, vom Benutzer oder vom Rechercheprogramm vorgebbares Maximum nDSmax ist oder
daß ein weiterer Recherchesuchlauf durchgeführt wird, bis die Forderung nDSrel < = nDSmax erfüllt ist.
wobei der Computer und/oder die Suchmaschine SM die Korrektheit und Zulässigkeit des Deskriptor D überprüft und bei unzulässigen Deskriptoren Dunzul synonyme Deskriptoren Dsyn ermittelt und dem Nutzer vorschlägt,
daß nachfolgend alle, mit der Suchmaschine SM in Verbindung stehenden Server S1 . . . Sn nach diesem Deskriptor abgefragt und von allen, auf den Servern S1 . . . Sn ermittelten Datensätzen DS bruchstückartige Blöcke mit Angabe der Fundstelle in den Arbeits speicher AS der Suchmaschine SM geladen werden,
daß nachfolgend redundante Datensätze DSred eliminiert werden,
daß die Häufung H(DSi) der auf den einzelnen Servern S1 . . . Sn ermittelten Datensätze DSi verglichen und die Gesamtzahl nges.rel der ermittelten, relevanten Datensätze DSrel nach Eliminierung redundanter Datensätze DSred bestimmt wird,
wobei die Recherche abgebrochen wird und die ermittelten Datensätze auf den Arbeits- oder Massespeicher des Computers des Benutzers übertragen werden, falls die Anzahl der ermittelten Datensätze nDSrel kleiner als ein wählbares, vom Benutzer oder vom Rechercheprogramm vorgebbares Maximum nDSmax ist oder
daß ein weiterer Recherchesuchlauf durchgeführt wird, falls die ermittelte Anzahl relevanter Datensätze nDSrel größer als dieser Grenzwert ist,
wobei durch den Nutzer oder das Rechercheprogramm ein weiteres relevantes Suchwort vorgegeben und der zweite Recherchendurchlauf gestartet wird,
wobei die Server S1 bis Sn von der Suchmaschine in der Reihenfolge der Häufung H(DSrel) der Anzahl der ermittelten, relevanten Datensätze DSrel abgefragt werden,
daß nachfolgend bruchstückartige Blöcke mit Angabe der Fundstelle in den Arbeitsspei cher AS der Suchmaschine SM geladen werden,
daß nachfolgend redundante Datensätze DSred gelöscht werden,
und die Recherche abgebrochen wird und die ermittelten Datensätze auf den Arbeits- oder Massespeicher des Computers des Benutzers übertragen werden, falls die Anzahl der ermittelten Datensätze nDSrel kleiner als ein wählbares, vom Benutzer oder vom Rechercheprogramm vorgebbares Maximum nDSmax ist oder
daß ein weiterer Recherchesuchlauf durchgeführt wird, bis die Forderung nDSrel < = nDSmax erfüllt ist.
2. Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken,
insbesondere in regionalen und globalen Datennetzen, wobei ein relevantes Recherche
suchwort (Deskriptor D) über die Eingabeeinrichtung eines Computers eingegeben und
über Informationsübertragungseinrichtungen die Verbindung mit einer Suchmaschine
SMMaster hergestellt wird,
die ihrerseits Verbindungen mit n weiteren Suchmaschinen SMSlave.1 . . .. SMSlave.n innerhalb des Netzes herstellt, wobei jede dieser n Suchmaschinen mit einer Anzahl von Servern (S1.1, S1.2, S1.k . . . Si.n-2, Si,n.1, Si.n) in Verbindung steht,
daß nachfolgend alle, mit der Suchmaschine SM in Verbindung stehenden Server (S1.1, S 1.2, S1.k . . . Si.n-2, Si.n.1, S.n) nach dem Deskriptor D abgefragt und von allen, auf den Servern ermittelten Datensätzen DS bruchstückartige Blöcke mit Angabe der Fundstelle in den Arbeitsspeicher AS der Suchmaschinen SMSlave.1 . . .. SMSlave.n geladen werden,
daß nachfolgend redundante Datensätze DSred eliminiert werden,
daß auf jeder Suchmaschine SMSlave.1 gespeichert wird, auf welchem der angewählten Server Sj welche Anzahl von Datensätzen ermittelt wurde,
daß nachfolgend ein Vergleich der Anzahl oder der Häufung der von den einzelnen Slave-Suchmaschinen SMSlave.1 . . .. SMSlave.n ermittelten Datensätze vorgenommen wird,
wobei redundante Datensätze ermittelt und ausgeschieden werden,
daß die Anzahl nges.rel der ermittelten, relevanten Datensätze DSrel ermittelt wird,
wobei die Recherche abgebrochen wird und die ermittelten Datensätze auf den Arbeits- oder Massespeicher des Computers des Benutzers übertragen werden, falls die Anzahl der ermittelten Datensätze nDSrel kleiner als ein wählbares, vom Benutzer oder vom Rechercheprogramm vorgebbares Maximum nDSmax ist oder
daß ein weiterer Recherchesuchlauf durchgeführt wird, falls die ermittelte Anzahl relevanter Datensätze nDSrel größer als dieser Grenzwert ist,
wobei durch den Nutzer oder das Rechercheprogramm ein weiteres relevantes Suchwort vorgegeben und der zweite Recherchendurchlauf gestartet wird,
wobei die Server S1 bis Sn von der Suchmaschine in der Reihenfolge der Häufung H(DSrel) der Anzahl der ermittelten, relevanten Datensätze Dsrel abgefragt werden,
daß nachfolgend bruchstückartige Blöcke mit Angabe der Fundstelle in den Arbeitsspei cher AS der Suchmaschine SM geladen werden,
daß nachfolgend redundante Datensätze DSred gelöscht werden,
und die Recherche abgebrochen wird und die ermittelten Datensätze auf den Arbeits- oder Massespeicher des Computers des Benutzers übertragen werden, falls die Anzahl der ermittelten Datensätze nDSrel kleiner als ein wählbares, vom Benutzer oder vom Rechercheprogramm vorgebbares Maximum nDSmax ist oder
daß ein weiterer Recherchesuchlauf durchgeführt wird, bis die Forderung nDSrel < = nDSmax erfüllt ist.
die ihrerseits Verbindungen mit n weiteren Suchmaschinen SMSlave.1 . . .. SMSlave.n innerhalb des Netzes herstellt, wobei jede dieser n Suchmaschinen mit einer Anzahl von Servern (S1.1, S1.2, S1.k . . . Si.n-2, Si,n.1, Si.n) in Verbindung steht,
daß nachfolgend alle, mit der Suchmaschine SM in Verbindung stehenden Server (S1.1, S 1.2, S1.k . . . Si.n-2, Si.n.1, S.n) nach dem Deskriptor D abgefragt und von allen, auf den Servern ermittelten Datensätzen DS bruchstückartige Blöcke mit Angabe der Fundstelle in den Arbeitsspeicher AS der Suchmaschinen SMSlave.1 . . .. SMSlave.n geladen werden,
daß nachfolgend redundante Datensätze DSred eliminiert werden,
daß auf jeder Suchmaschine SMSlave.1 gespeichert wird, auf welchem der angewählten Server Sj welche Anzahl von Datensätzen ermittelt wurde,
daß nachfolgend ein Vergleich der Anzahl oder der Häufung der von den einzelnen Slave-Suchmaschinen SMSlave.1 . . .. SMSlave.n ermittelten Datensätze vorgenommen wird,
wobei redundante Datensätze ermittelt und ausgeschieden werden,
daß die Anzahl nges.rel der ermittelten, relevanten Datensätze DSrel ermittelt wird,
wobei die Recherche abgebrochen wird und die ermittelten Datensätze auf den Arbeits- oder Massespeicher des Computers des Benutzers übertragen werden, falls die Anzahl der ermittelten Datensätze nDSrel kleiner als ein wählbares, vom Benutzer oder vom Rechercheprogramm vorgebbares Maximum nDSmax ist oder
daß ein weiterer Recherchesuchlauf durchgeführt wird, falls die ermittelte Anzahl relevanter Datensätze nDSrel größer als dieser Grenzwert ist,
wobei durch den Nutzer oder das Rechercheprogramm ein weiteres relevantes Suchwort vorgegeben und der zweite Recherchendurchlauf gestartet wird,
wobei die Server S1 bis Sn von der Suchmaschine in der Reihenfolge der Häufung H(DSrel) der Anzahl der ermittelten, relevanten Datensätze Dsrel abgefragt werden,
daß nachfolgend bruchstückartige Blöcke mit Angabe der Fundstelle in den Arbeitsspei cher AS der Suchmaschine SM geladen werden,
daß nachfolgend redundante Datensätze DSred gelöscht werden,
und die Recherche abgebrochen wird und die ermittelten Datensätze auf den Arbeits- oder Massespeicher des Computers des Benutzers übertragen werden, falls die Anzahl der ermittelten Datensätze nDSrel kleiner als ein wählbares, vom Benutzer oder vom Rechercheprogramm vorgebbares Maximum nDSmax ist oder
daß ein weiterer Recherchesuchlauf durchgeführt wird, bis die Forderung nDSrel < = nDSmax erfüllt ist.
3. Verfahren nach Anspruch 1 oder 2,
dadurch gekennzeichnet,
daß eine Korrelation zwischen dem Datenvolumen VDSrel eines relevanten Datensatzes DSrel und der Häufigkeit H(Di) des Auftretens des jeweils gesuchten Deskriptors Dj innerhalb dieses Datensatzes vorgenommen und daraus die Informationsdichte des relevanten Datensatzes DSrel bestimmt wird,
und daß nur von den Datensätzen DSrel.1 . . . DSrel.n bruchstückartige Blöcke mit Angabe der Fundstelle in den Arbeitsspeicher AS der Suchmaschine SM geladen werden, die eine vorgegebene minimale Informationsdichte ID aufweisen.
daß eine Korrelation zwischen dem Datenvolumen VDSrel eines relevanten Datensatzes DSrel und der Häufigkeit H(Di) des Auftretens des jeweils gesuchten Deskriptors Dj innerhalb dieses Datensatzes vorgenommen und daraus die Informationsdichte des relevanten Datensatzes DSrel bestimmt wird,
und daß nur von den Datensätzen DSrel.1 . . . DSrel.n bruchstückartige Blöcke mit Angabe der Fundstelle in den Arbeitsspeicher AS der Suchmaschine SM geladen werden, die eine vorgegebene minimale Informationsdichte ID aufweisen.
4. Verfahren nach einem der Ansprüche 1 bis 3,
dadurch gekennzeichnet,
daß nach der Übertragung bruchstückartiger Blöcke aller, auf den Servern S1 . . . Sn
ermittelten Datensätzen DS in den Arbeitsspeicher AS der Suchmaschine SM ähnliche
Datensätze DSähnl eliminiert werden.
5. Verfahren nach einem der Ansprüche 1 bis 4,
dadurch gekennzeichnet,
daß die Ergebnisse der Recherchenabfragen auf einem Inhaltsspeicher der beteiligten
Master- und/oder Slave-Suchmaschine abgelegt werden.
6. Verfahren nach einem der Ansprüche 1 bis 5,
dadurch gekennzeichnet,
daß die Suchmaschinen SMMaster über Kommunikationswege untereinander
zu einem neuronalen Netz verbunden werden.
7. Verfahren nach einem der Ansprüche 2 bis 6,
dadurch gekennzeichnet,
daß die Recherchefrage parallel an mehrere Master-Suchmaschinen übertragen wird,
die im Informationsnetzwerk autonom arbeiten oder miteinander verbunden sind.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19651788A DE19651788C2 (de) | 1996-12-12 | 1996-12-12 | Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19651788A DE19651788C2 (de) | 1996-12-12 | 1996-12-12 | Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken |
Publications (2)
Publication Number | Publication Date |
---|---|
DE19651788A1 true DE19651788A1 (de) | 1998-06-25 |
DE19651788C2 DE19651788C2 (de) | 2001-01-04 |
Family
ID=7814536
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19651788A Expired - Fee Related DE19651788C2 (de) | 1996-12-12 | 1996-12-12 | Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE19651788C2 (de) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19842320A1 (de) * | 1998-09-16 | 2000-03-23 | Ibm | Verfahren und Einrichtung zur inhaltsbezogenen Suche von elektronischen Dokumenten |
WO2000041099A1 (en) * | 1998-12-30 | 2000-07-13 | Microsoft Corporation | Method for analyzing network data |
DE19909017A1 (de) * | 1999-03-02 | 2000-09-14 | Manfred Buettner | Verfahren zum Vermitteln von persönlichen oder geschäftlichen Kontakten |
WO2000060446A2 (de) * | 1999-04-01 | 2000-10-12 | OCé PRINTING SYSTEMS GMBH | Vorrichtung und verfahren zum verarbeiten und drucken von informationen |
DE19939625A1 (de) * | 1999-08-20 | 2001-02-22 | Nokia Mobile Phones Ltd | Verfahren zum Abrufen von Informationen aus einem Informationsnetzwerk |
DE10029644A1 (de) * | 2000-06-16 | 2002-01-17 | Deutsche Telekom Ag | Verfahren zur Relevanzbewertung bei der Indexierung von Hypertext-Dokumenten mittels Suchmaschine |
NL1016379C2 (nl) * | 2000-07-25 | 2002-01-28 | Alphonsus Albertus Schirris | Werkwijze en zoekmachine voor het doorzoeken van ten minste ÚÚn gegevensbestand. |
EP1299798A1 (de) * | 2000-02-22 | 2003-04-09 | Harvey Lunenfeld | Client-server-multitasking |
US6636600B1 (en) | 1999-05-05 | 2003-10-21 | Siemens Aktiengesellschaft | Method for finding a contact or for setting up a connection to the contact |
EP1837782A1 (de) * | 2006-03-24 | 2007-09-26 | Canon Kabushiki Kaisha | Vorrichtung zum Suchen von Dokumenten, Dokumentverwaltungssystem, System und Verfahren zum Suchen von Dokumenten |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0747845A1 (de) * | 1995-06-07 | 1996-12-11 | International Business Machines Corporation | Rechnernetzwerk für WWW-Anbieter-Datenzugriff auf das Internet |
-
1996
- 1996-12-12 DE DE19651788A patent/DE19651788C2/de not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0747845A1 (de) * | 1995-06-07 | 1996-12-11 | International Business Machines Corporation | Rechnernetzwerk für WWW-Anbieter-Datenzugriff auf das Internet |
Non-Patent Citations (1)
Title |
---|
IBM Technical Disclosure Bulletin, Vol. 38, No. 01, January 1995, S. 607/608 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19842320A1 (de) * | 1998-09-16 | 2000-03-23 | Ibm | Verfahren und Einrichtung zur inhaltsbezogenen Suche von elektronischen Dokumenten |
US6463455B1 (en) | 1998-12-30 | 2002-10-08 | Microsoft Corporation | Method and apparatus for retrieving and analyzing data stored at network sites |
WO2000041099A1 (en) * | 1998-12-30 | 2000-07-13 | Microsoft Corporation | Method for analyzing network data |
DE19909017A1 (de) * | 1999-03-02 | 2000-09-14 | Manfred Buettner | Verfahren zum Vermitteln von persönlichen oder geschäftlichen Kontakten |
WO2000060446A2 (de) * | 1999-04-01 | 2000-10-12 | OCé PRINTING SYSTEMS GMBH | Vorrichtung und verfahren zum verarbeiten und drucken von informationen |
US7259880B1 (en) | 1999-04-01 | 2007-08-21 | Oce Printing Systems Gmbh | Device and method for processing and printing information |
WO2000060446A3 (de) * | 1999-04-01 | 2001-10-04 | Oce Printing Systems Gmbh | Vorrichtung und verfahren zum verarbeiten und drucken von informationen |
US6636600B1 (en) | 1999-05-05 | 2003-10-21 | Siemens Aktiengesellschaft | Method for finding a contact or for setting up a connection to the contact |
DE19939625A1 (de) * | 1999-08-20 | 2001-02-22 | Nokia Mobile Phones Ltd | Verfahren zum Abrufen von Informationen aus einem Informationsnetzwerk |
EP1079354A3 (de) * | 1999-08-20 | 2002-11-27 | Nokia Corporation | Verfahren zum Abrufen von Informationen aus einem Informationsnetzwerk |
EP1079354A2 (de) * | 1999-08-20 | 2001-02-28 | Nokia Mobile Phones Ltd. | Verfahren zum Abrufen von Informationen aus einem Informationsnetzwerk |
EP1299798A1 (de) * | 2000-02-22 | 2003-04-09 | Harvey Lunenfeld | Client-server-multitasking |
EP1299798A4 (de) * | 2000-02-22 | 2004-09-01 | Harvey Lunenfeld | Client-server-multitasking |
DE10029644A1 (de) * | 2000-06-16 | 2002-01-17 | Deutsche Telekom Ag | Verfahren zur Relevanzbewertung bei der Indexierung von Hypertext-Dokumenten mittels Suchmaschine |
DE10029644B4 (de) * | 2000-06-16 | 2008-02-07 | Deutsche Telekom Ag | Verfahren zur Relevanzbewertung bei der Indexierung von Hypertext-Dokumenten mittels Suchmaschine |
NL1016379C2 (nl) * | 2000-07-25 | 2002-01-28 | Alphonsus Albertus Schirris | Werkwijze en zoekmachine voor het doorzoeken van ten minste ÚÚn gegevensbestand. |
EP1837782A1 (de) * | 2006-03-24 | 2007-09-26 | Canon Kabushiki Kaisha | Vorrichtung zum Suchen von Dokumenten, Dokumentverwaltungssystem, System und Verfahren zum Suchen von Dokumenten |
Also Published As
Publication number | Publication date |
---|---|
DE19651788C2 (de) | 2001-01-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69811066T2 (de) | Datenzusammenfassungsgerät. | |
DE69718798T2 (de) | Echtzeitsuchmotor mit strukturierten zusammenfassungen | |
DE69227948T2 (de) | Verfahren und Gerät um ein dynamisches Lexikon in ein Textinformationsauffindungssystem zu integrieren | |
DE69424902T2 (de) | Gerät und Verfahren zur anpassungsfähigen nicht-buchstäblichen Textsuche | |
DE69804495T2 (de) | Informationsmanagement und wiedergewinnung von schlüsselbegriffen | |
EP1783633B1 (de) | Suchmaschine für eine ortsbezogene Suche | |
DE102007037646B4 (de) | Computerspeichersystem und Verfahren zum Indizieren, Durchsuchen und zur Datenwiedergewinnung von Datenbanken | |
DE60118973T2 (de) | Verfahren zum abfragen einer struktur komprimierter daten | |
DE69522426T2 (de) | Wort-Wiederauffindungsapparat für ein Wörterbuch | |
DE19651788C2 (de) | Verfahren zur Datenermittlung und -aufbereitung in Informationsnetzwerken | |
DE112010002620T5 (de) | Ontologie-nutzung zum ordnen von datensätzen nachrelevanz | |
DE10034694B4 (de) | Verfahren zum Vergleichen von Suchprofilen sowie dessen Verwendung | |
EP1620810B1 (de) | Verfahren und anordnung zur einrichtung und aktualisierung einer benutzeroberfl che zum zugriff auf informationsseiten in ein em datennetz | |
DE10028624A1 (de) | Verfahren und Vorrichtung zur Dokumentenbeschaffung | |
WO2011044865A1 (de) | Verfahren zum bestimmen einer ähnlichkeit von objekten | |
EP1325412B1 (de) | Verfahren zum zugriff auf eine speichereinheit, in der vermerkfolgen gespeichert sind, zugehörige speichereinheit und zugehöriges programm | |
DE10261839A1 (de) | Verfahren und Einrichtung zur Durchführung einer elektronischen Recherche | |
EP1094405A2 (de) | Verfahren zum Erzeugen einer dynamischen Auswahlmaske für den Abruf von Daten aus einer Datenbank | |
DE19933621C2 (de) | Netzserver zum Bereitstellen einer Informationsseite und Verfahren zum Bereitstellen einer Webseite | |
EP0945705A2 (de) | Erkennungssystem | |
DE102005027575A1 (de) | Verfahren zur Auswahl von Datensätzen | |
EP0833263A2 (de) | Datenbank, Verfahren zum Ableiten einer Datenbank und Verfahren zur Abfrage einer Datenbank | |
DE102006043158A1 (de) | Verfahren zum Ermitteln von Elementen eines einer Suchanfrage zugeordneten Suchergebnisses in einer Reihenfolge und Suchmaschine | |
EP0563077B1 (de) | Verfahren zum maschinellen ermitteln von in zwei datenfolgen enthaltenen gleichen datenelementen | |
DE10160920B4 (de) | Verfahren und Vorrichtung zur Erzeugung eines Extrakts von Dokumenten |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee |