DE10303067A1 - Erzeugen einer Liste von Adressen in einer Indexseite - Google Patents

Erzeugen einer Liste von Adressen in einer Indexseite

Info

Publication number
DE10303067A1
DE10303067A1 DE10303067A DE10303067A DE10303067A1 DE 10303067 A1 DE10303067 A1 DE 10303067A1 DE 10303067 A DE10303067 A DE 10303067A DE 10303067 A DE10303067 A DE 10303067A DE 10303067 A1 DE10303067 A1 DE 10303067A1
Authority
DE
Germany
Prior art keywords
list
addresses
browser
server
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE10303067A
Other languages
English (en)
Inventor
S Brandon Keller
Gregory D Rogers
George H Robbert
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Co filed Critical Hewlett Packard Co
Publication of DE10303067A1 publication Critical patent/DE10303067A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs

Abstract

Wenn ein Bediener eine Teiladresse in einen Browser eingibt, zeigt der Browser zumindest eine vollständige Adresse an, wobei die angezeigte Adresse eine Adresse sein kann, die zuvor nicht in den Browser eingegeben wurde oder auf die zuvor nicht durch den Browser zugegriffen wurde.

Description

  • Diese Erfindung bezieht sich allgemein auf Computernetze bzw. -netzwerke.
  • Das Internet ist eine Sammlung miteinander verbundener Computer und das World Wide Web (WWW oder Web) ist eine Sammlung logisch verbundener elektronischer Dokumente, die über das Internet verfügbar sind. Jedes Dokument weist eine eindeutige Adresse auf, die als URL-Adresse (URL = Uniform Resource Locator) bezeichnet wird, die einen Namen eines Servers umfaßt. Wenn eine URL in einen Webbrowser eingegeben wird, sendet die Browsersoftware die URL über das Internet, wo derselbe zu dem genannten Server (oder einem Proxy-Server) geleitet wird, wobei der genannte Server (oder Proxy-Server) das Dokument zurück an den Browser sendet, wo dasselbe durch den Computer angezeigt wird, auf dem der Browser läuft. Es kann mehrere Zwischenserver, -router und -schalter geben, die beim Lokalisieren des genannten Servers und Wiedergewinnen des Dokumentes beinhaltet sind.
  • URLs können relativ lang sein, z. B. in der Größenordnung von mehreren hundert Zeichen, und können mehrere abstrakte Zeichenkombinationen umfassen. Als ein Ergebnis kann es für einen menschlichen Bediener unter Umständen schwierig sein, sich alle URLs, die für den Bediener von Interesse sind, zu merken. Browser können eine gewisse Unterstützung liefern. Browser können z. B. Adressen, die zuvor in den Browser eingegeben wurden, zwischenspeichern. Wenn ein Bediener mit dem Eintippen einer URL beginnt, kann der Browser dem Bediener eine vorherige Adresse anzeigen, die diese Teiladresse umfaßt. Der Bediener kann dann eine Taste drücken, was bewirkt, daß der Browser dies angezeigte vorherige Adresse auswählt, wodurch automatisch die Adresse für den Bediener vervollständigt wird. Wenn es mehr als eine Adresse gibt, die die Teiladresse umfaßt, kann der Browser eine Liste vorheriger Adressen anzeigen und der Bediener kann eine Adresse aus der Liste auswählen.
  • Es besteht ein andauernder Bedarf nach einem verbesserten unterstützten Eingeben von Adressen.
  • Es ist die Aufgabe der vorliegenden Erfindung, ein Verfahren oder ein computerlesbares Medium zu schaffen, die die Eingabe von Internetadressen in einen Computer benutzerfreundlicher machen.
  • Diese Aufgabe wird durch ein Verfahren gemäß Anspruch 1 oder ein computerlesbares Medium gemäß Anspruch 2 gelöst.
  • Bei einem exemplarischen Ausführungsbeispiel zeigt der Browser, wenn ein Bediener eine Teiladresse in einen Browser eintippt oder anderweitig eingibt, zumindest eine vollständige Adresse an, wobei die angezeigte Adresse eine Adresse sein kann, die zuvor nicht in den Browser eingegeben wurde oder auf die zuvor nicht durch den Browser zugegriffen wurde.
  • Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Zeichnungen näher erläutert. Es zeigen:
  • Fig. 1 ein Blockdiagramm eines exemplarischen Systems, in dem die Erfindung implementiert sein kann;
  • Fig. 2 ein Flußdiagramm, das ein exemplarisches Ausführungsbeispiel eines Browsers mit einer unterstützten Vervollständigung von Adressen darstellt;
  • Fig. 3 ein Flußdiagramm, das ein erstes beispielhaftes Ausführungsbeispiel zum Erzeugen einer Liste von Adressen zur Verwendung durch einen Browser für eine unterstützte Vervollständigung von Adressen darstellt;
  • Fig. 4 ein Flußdiagramm, das ein zweites exemplarisches Ausführungsbeispiel zum Erzeugen einer Liste von Adressen zur Verwendung durch einen Browser für eine unterstützte Fertigstellung von Adressen darstellt;
  • Fig. 5 ein Flußdiagramm, das ein drittes exemplarisches Ausführungsbeispiel zum Erzeugen einer Liste von Adressen zur Verwendung durch einen Browser zur unterstützten Fertigstellung von Adressen darstellt;
  • Fig. 6 ein Flußdiagramm, das ein viertes exemplarisches Ausführungsbeispiel zum Erzeugen einer Liste von Adressen zur Verwendung durch einen Browser zur unterstützten Fertigstellung von Adressen darstellt;
  • Fig. 7 ein Flußdiagramm, das ein fünftes exemplarisches Ausführungsbeispiel zum Erzeugen einer Liste von Adressen zur Verwendung durch einen Browser zur unterstützten Fertigstellung von Adressen darstellt; und
  • Fig. 8 ein Flußdiagramm, das ein exemplarisches Ausführungsbeispiel eines Verfahrens für einen Browser in einer Umgebung darstellt, in der alle exemplarischen Ausführungsbeispiele zum Erzeugen einer Liste von Adressen implementiert wurden.
  • Fig. 1 stellt eine Sammlung von miteinander verbundenen Computern dar, die über das Internet verteilt sein können, oder die als ein lokales Netz konfiguriert sein können oder beides. Die Verbindungen können verdrahtet oder drahtlos sein. Eine Clientenbrowseranwendung 100 kann mit Servern (102-112) kommunizieren.
  • Für das World Wide Web sind Dokumente in einem klartextplattformunabhängigen Format geschrieben, das HyperText Markup Language (HTML) genannt wird. HTML-Dokumente umfassen Elemente, wobei Elemente Text, Bilder, Ton, interaktive Steuerungen, Formatierungsinstruktionen und URLs für andere Dokumente umfassen können. Eine WEB-Seite ist ein HTML- Dokument. Eine WEB-Site ist eine Sammlung von Dokumenten, einschließlich eines Dokumentes, das eine Indexseite (auch als eine Homepage bekannt) genannt wird, die wiederum zu anderen Dokumenten verbindet. Jeder Webserver kann eine verzweigte Hierarchie von HTML-Dokumenten aufweisen, beginnend mit Links bzw. Verknüpfungen von der Indexseite. In Fig. 1 z. B. ist der Server 102 dargestellt, um eine Indexseite 114 aufzuweisen, die wiederum eine Adresse für ein zweites Dokument 116 umfaßt, das wiederum eine Adresse für ein drittes Dokument 118 umfaßt. Die Server 104 und 108 sind ebenfalls dargestellt, um eine Hierarchie von Dokumenten aufzuweisen.
  • Es ist in Webumgebungen üblich, einen Server, genannt Proxy-Server, zwischen einer Clientenanwendung, wie z. B. einem Webbrowser, und einem Webserver bereitzustellen, der ein Dokument aufweist, das durch den Webbrowser gelesen werden soll. Ein Proxy-Server kann unter anderem ein angefordertes Dokument zwischenspeichern. Wenn ein zweiter Client dann ein zuvor angefordertes Dokument anfordert, liefert der Proxy-Server dieses Dokument, was üblicherweise die Leistung verbessert. Ein Proxy-Server kann es auch Browsern innerhalb einer Firewall ermöglichen, auf das Web zuzugreifen, während ein externer Zugriff auf Systeme innerhalb der Firewall verweigert wird. In Fig. 1 können Dokumentanforderungen von dem Clienten 100 durch einen Proxy-Server 106 geführt werden und dann, falls nötig, zu den Servern 108, 110 und 112.
  • In der folgenden Besprechung umfaßt ein Bezug auf einen Browser eine Software, die zur Arbeit in Verbindung mit einem Browser angepaßt ist. Dies bedeutet, daß Veränderungen an einem Browser als Veränderungen an der Browsersoftware selbst implementiert sein können oder als ein Einschub bzw. Plug-In implementiert sein können, der mit dem Browser arbeitet. Ein Einschub kann z. B. ein zusätzliches Fenster zur Eingabe einer Adresse liefern, wobei ein Einschub verschiedene Anzeigen in Verbindung mit einem Eingeben einer Adresse liefern kann.
  • Es gibt mehrere beispielhafte Aspekte bei der Erfindung, die unabhängig oder in verschiedenen Kombinationen implementiert sein können. Bei einem ersten exemplarischen Aspekt zeigt die Clientenbrowsersoftware, wenn ein Bediener unter Verwendung einer Clientenbrowsersoftware eine Teiladresse eingibt, eine Liste vollständiger Adressen zur möglichen Verwendung durch den Bediener an. Im Gegensatz zu früheren Systemen kann ein Clientenbrowser gemäß einem exemplarischen Aspekt der Erfindung vollständige Adressen anzeigen, die noch nie zuvor durch einen Bediener der Clientensoftware angefordert oder eingegeben wurden. Dies bedeutet, daß keine vorherige Anforderung durch einen Bediener erforderlich ist. Bei anderen exemplarischen Aspekten der Erfindung werden mehrere exemplarische Alternativen dafür bereitgestellt, wie eine Liste vollständiger Adressen erzeugt werden kann.
  • Fig. 2 stellt einen exemplarischen Aspekt der Erfindung dar. Bei Schritt 200 empfängt ein Browser einen Teil einer Adresse. Die Adresse kann den Namen eines Servers umfassen oder nicht.
  • Bei Schritt 202 kann der Browser eine Liste vollständiger Adressen erzeugen oder der Browser kann eine Liste vollständiger Adressen empfangen. Die Liste kann durch den Browser in einem Speicher gespeichert worden sein, als eine frühere Adreßeingabe verarbeitet wurde. Die Liste kann auch durch den Browser ansprechend auf eine anstehende Adreßeingabe erzeugt werden. Die Liste kann durch einen Server oder durch ein Dokument bereitgestellt werden. Allgemein kann die Liste Adressen umfassen, die nicht zuvor durch einen Bediener des Browsers eingegeben wurden.
  • Bei Schritt 204 zeigt der Browser die Liste vollständiger Adressen (oder einen Teilsatz der Liste, wie im folgenden detailliert erläutert wird) an. Der Bediener kann dann eine der vollständigen Adressen auswählen oder mit einem Eingeben zusätzlicher Zeichen der Teiladresse fortfahren.
  • Fig. 3 stellt ein erstes exemplarisches Ausführungsbeispiel eines Verfahrens zum Erzeugen einer Liste von Adressen zur Verwendung durch einen Browser zur Unterstützung einer Eingabe von Adressen dar. Bei dem Beispiel aus Fig. 3 erzeugt der Browser die Liste. Das Verfahren aus Fig. 3 nimmt an, daß ein Browser eine Teiladresse empfangen hat, die zumindest den Namen eines Servers umfaßt. Bei Schritt 300 liest der Browser zumindest die Indexseite von dem genannten Server und extrahiert eine Liste von URLs, die in dem Dokument enthalten sind. HTML-Elemente werden durch Kennungen identifiziert (bezeichnet durch eine links spitz zulaufende Klammer (<), einen Kennungsnamen und eine nach rechts spitz zulaufende Klammer (>)). Eine bestimmte Kennung ist <a>, was für Anker steht. Ein Anker ist ein Link zu einem anderen Dokument. Links können URLs umfassen. Der folgende Satz von Zeichen in einem HTML-Dokument bezeichnet z. B. eine URL:
    <a HREF = "http:/ / www.servername.com">
  • Eine Browsersoftware umfaßt häufig eine Software zum Erkennen von URLs. Wenn z. B. Text angezeigt wird, stellen Browser häufig URLs als unterstrichen und in einer unterschiedlichen Farbe dar. Zusätzlich umfassen viele Texteditoren eine Software zum Erkennen von URLs.
  • Bei Schritt 302 bildet der Browser eine Liste von Adressen aus den Adressen, die von der Indexseite des genannten Servers extrahiert werden.
  • Bei Schritt 304 kann der Browser wahlweise tiefer in die Hierarchie von Dokumenten auf dem genannten Server hinein lesen. Dies bedeutet, daß der Browser die Dokumente lesen kann, auf die durch die Adressen auf der Indexseite verwiesen wird, und URLs aus jedem dieser Dokumente extrahieren kann. Als ein Ergebnis kann der Browser eine verzweigte Hierarchie von Adressen aufbauen.
  • Für eine exemplarische Anwendung des Verfahrens aus Fig. 3 kann ein Bediener für das System in Fig. 1 den Namen des Servers 102 in den Browser 100 eintippen. Der Browser 100 kann dann alle URLs aus dem Dokument 114 extrahieren, die in dem Dokument 114 enthalten sind, einschließlich einer URL für das Dokument 116. Der Browser kann dann das Dokument 116 lesen und eine URL für das Dokument 118 extrahieren. Der Browser kann dann eine hierarchische Liste vollständiger Adressen aufbauen, die auf dem Server 102 gefunden werden. Der Browser kann dem Bediener zumindest einen Teil der Liste anzeigen. Der Browser kann außerdem die Liste zur späteren Verwendung speichern.
  • Der Browser kann auch nur Adressen, die die Teiladressen umfassen, anzeigen. Die angezeigte Liste kann auf die Indexseite beschränkt sein oder kann auf eine Hierarchie erweitert sein. Der Bediener kann eine vollständige Adresse aus der angezeigten Liste auswählen. Der Bediener kann durch die angezeigte Liste navigieren und tiefer in die Hierarchie hinein erkunden. Wenn zusätzliche Zeichen durch den Bediener hinzugefügt werden, kann der Browser auch nur die Adressen anzeigen, die die zusätzlichen Zeichen umfassen. An jedem Punkt kann der Bediener eine vollständige Adresse aus einer angezeigten Liste auswählen oder der Bediener kann fortfahren, zusätzliche Teile der Adresse hinzuzufügen, um die Größe der angezeigten Liste zu reduzieren. Nach einem Eintippen von "servername/abc" z. B. kann der Browser eine Hierarchie vorlegen, die 100 vollständige Adressen enthält, die "servername/abc" umfassen, wobei der Bediener dann durch die Hierarchie navigieren oder einfach zusätzliche Zeichen hinzufügen kann, um die Größe der vorgelegten Hierarchie zu reduzieren.
  • Bei dem exemplarischen Verfahren aus Fig. 3 sind die einzigen Dokumente, die zu der Liste hinzugefügt werden, diejenigen, die in einer Hierarchie von Dokumenten enthalten sind, die mit Dokumenten-URLs (linkmäßig) verknüpft sind, die in der Indexseite eines genannten Servers enthalten sind. Allgemein kann ein Computer einige HTML-Dokumente aufweisen, die mit einer Indexseite verbunden sind, und kann andere HTML-Dokumente aufweisen, die nicht mit einer Indexseite verbunden sind, oder kann andere HTML-Dokumente mit eingeschränktem Zugriff aufweisen. In einer gesteuerten Umgebung mit einem gesteuerten Zugriff kann es akzeptabel sein, wenn ein Bediener einen umfassenderen Zugriff auf HTML-Dokumente hat.
  • In Fig. 1 können der Client 100 und die Server 102 und 104 auf einem lokalen Netz sein. Zumindest einer der Server 102 und 104 kann eine Webdateiortskarte umfassen, die eine Liste von Verzeichnissen ist, die durch den Servernamen indexiert werden, die jedes Webserverdateisystem auf dem lokalen Netz identifiziert. Servernamen können automatisch entdeckt werden, Namen von Webservern jedoch und insbesondere der Ort von Webdateisystemen können unter Umständen durch einen Ortsverwalter beibehalten werden müssen. Ein Server mit einem Zugriff auf die Webdateiortskarte (was bedeutet, daß der Server, der eine Adreßliste erzeugt, nicht notwendigerweise der gleiche Server ist, der die Webdateiortskarte aufweist) kann dann Verzeichnisse und Unterverzeichnisse in den Dateisystemen, die durch die Webserverortskarte identifiziert sind, nach HTML-Dokumenten durchsuchen und eine hierarchische Liste von Adressen für diese Dokumente erzeugen. Gegenwärtig können HTML-Dokumente durch eines von drei Dateinamensuffixen identifiziert werden: .htm, .html und .shtml. Alternativ kann der Browser die Webdateiortskarte lesen und der Browser kann eine Dokumentenliste für lokale Server erzeugen. Es wird angemerkt, daß die resultierende Dokumentenadreßliste Dokumente umfassen kann, die durch ein Starten mit einer Indexseite nicht entdeckbar sind. Einige Dokumente z. B. können noch in dem Prozeß einer Entwicklung sein, wobei auf dieselben in anderen Dokumenten noch nicht verwiesen wird. Es wird angemerkt, daß der Server (oder Browser), der die Dokumentenadreßliste erzeugt, die Liste periodisch oder wiederholt auffrischen kann, Adressen hinzufügen, verifizieren, daß alle Adressen in der Liste gültig sind, und Adressen löschen, die nicht mehr gültig sind. Der Clientenbrowser muß den Namen zumindest eines Servers, der die Webdateiortskarte aufweist, oder den Namen zumindest eines Servers kennen, der die Dokumentenadreßliste erzeugt und speichert. Dann kann der Client, wenn eine Teiladresse in den Clienten eingegeben wird, der den Namen eines lokalen Servers umfaßt, wenn der Client die Dokumentenadreßliste für die genannten lokalen Server nicht aufweist, zu einem Server auf dem lokalen Netz gehen (der ein unterschiedlicher Server als der Server sein kann, der durch die eingegebene Teiladresse identifiziert ist) und die gesamte Dokumentenadreßliste wiedergewinnen oder zumindest Adressen, die die eingegebene Teiladresse umfassen. Adressen in der Liste, die die eingegebene Teiladresse umfassen, können angezeigt werden. Der Client kann außerdem die Liste zur späteren Verwendung speichern. Der Bediener kann durch die angezeigte Liste navigieren oder kann zusätzliche Zeichen eingeben, um die Größe der angezeigten Liste zu reduzieren.
  • Fig. 4 stellt ein Beispiel eines Verfahrens für einen Server zum Erzeugen einer Adreßliste zur Verwendung bei einem Unterstützen einer Eingabe von Adressen dar. Bei Schritt 400 liest ein Server, auf dem die Listenaufbausoftware läuft, eine Webdateiortskarte von einem Server (der der gleiche Server oder ein unterschiedlicher Server sein kann). Bei Schritt 402 liest der Server, auf dem die Listenaufbausoftware läuft, HTML-Dokumentadressen von Verzeichnissen und Unterverzeichnissen, die durch die Webdateiortskarte identifiziert sind, und baut eine Liste von Dokumentenadressen auf.
  • Fig. 5 stellt ein alternatives exemplarisches Verfahren dar, bei dem ein Proxy-Server (z. B. 106, Fig. 1) verwendet wird, um eine Liste von Dokumentenadressen zu erzeugen. Bei Schritt 500 liest ein Proxy-Server seine zwischengespeicherten Dokumente. Für jedes Dokument liest derselbe die URLs, die in dem Dokument enthalten sind. Wahlweise kann er die Dokumente lesen, auf die durch diese URL verwiesen wird, und Adressen von diesen Dokumenten lesen usw. Als ein Ergebnis sammelt der Proxy-Server bei Schritt 502 eine hierarchische Liste von Adressen basierend auf vorherigen Adressen, die an den Proxy-Server gesendet wurden. Wenn der Proxy-Server eine Adreßhierarchie noch nicht zwischengespeichert hat, kann der Proxy-Server die Indexseite des genannten Servers lesen und die Adressen, wie diese in Echtzeit gelesen werden, liefern. Der Proxy-Server kann periodisch oder wiederholt die Liste auffrischen und URLs hinzufügen, verifizieren, daß alle URLs in der Liste gültig sind, und URLs löschen, die nicht mehr gültig sind.
  • Ein alternatives exemplarisches Verfahren zum Erzeugen einer Liste von Dokumentenadressen besteht darin, einen Server zu programmieren, im Web zu graben und eine Liste von Dokumentenadressen zu erzeugen. Die Liste kann wahlweise als ein Dienst gegen Gebühr oder als ein Dienst angeboten werden, der durch Werbung subventioniert wird. Ein Adreßlistenserver (z. B. 112, Fig. 1) kann in dem Web nach Dokumentenadressen graben. Es gibt z. B. Suchmaschinen (manchmal auch Web-Kriecher genannt), die das Netz durchsuchen und eine durchsuchbare Datenbank liefern. Beispiele umfassen Google, Overture, NBCi, Lycos, LookSmart und AskJeeves. Zusätzlich bieten Browser durchsuchbare Datenbanken an. Ein beispielhaftes Taal bzw. Werkzeug, das verwendet werden kann, um automatisch Hierarchien von Dokumenten zu sammeln, ist der "wget"-Befehl von Linux, der verwendet werden kann, um mehrere Ebenen von Dokumenten zum Indexieren und Durchsuchen zu kopieren. Ein Beispiel dafür, wie ein Adreßlistenserver in dem Web graben kann, besteht darin, nach jedem angeforderten Servernamen zu suchen. Dies bedeutet, daß, wenn ein Bediener eine Teiladresse, die einen Servernamen beinhaltet, sendet, der in dem Web grabende Server den Servernamen in seinem Speicher zur zukünftigen Verwendung speichern und den genannten Server nach Dokumentenadressen durchsuchen kann. Eine zweite Weise, auf die ein Adreßlistenserver in dem Web graben kann, besteht darin, sequentielle oder zufällige Internetprotokoll-(IP-)Adressen zu erzeugen, und zu beobachten, ob es einen Webserver an einer spezifischen Portnummer gibt. Webserver sind üblicherweise bei Port 80. Wenn ein Webserver bei Port 80 einer sequentiellen oder zufälligen IP-Adresse anspricht, kann die IP-Adresse zur zukünftigen Verwendung gespeichert werden und der Webserver kann nach Dokumentenadressen durchsucht werden. Eine dritte Weise, auf die ein Adreßlistenserver Listen von Adressen erhalten kann, besteht darin, Adreßlisten von anderen zu kaufen, oder das Recht zu verkaufen, andere Adreßlisten auf den Adreßserver bringen zu lassen.
  • Im Gegensatz zu einem Verfahren in einem Lokalnetzserver, wie in Fig. 4, das nach allen HTML-Dokumentenadressen in Verzeichnissen und Unterverzeichnissen sucht, und einem Verfahren in einem Proxy-Server, wie in Fig. 5, das nach URLs sucht, auf die in zwischengespeicherten Dokumenten verwiesen wird, kann ein Adreßlistenserver aktiv das gesamte Web durchsuchen, um gültige URLs zu entdecken und URLs zu extrahieren oder Listen von anderen zu erhalten. Im Gegensatz zu den existierenden Suchmaschinen muß ein Adreßlistenserver nur eine Datenbank mit Adressen (und nicht den Inhalt dieser Adressen) aufbauen. Es wird jedoch angemerkt, daß ein Adreßlistenserver in Verbindung mit einer allgemeineren Suchmaschine sein kann. Es wird zusätzlich angemerkt, daß ein Proxy-Server üblicherweise die tatsächlich angeforderten Dokumente liefert, wohingegen ein Adreßlistenserver auch nur eine Liste von Adressen liefern kann.
  • Als ein Beispiel der Verwendung eines Adreßlistenservers kann ein Browserbediener ein Dialogfeld mit einem Eingabebereich für eine Adresse anfordern, das ausdrücklich anzeigt, daß die Teiladresse an einen Adreßlistenserver gesendet wird. Der Bediener kann eine Teiladresse eingeben und dann eine Taste drücken oder auf eine Funktion klicken, die bewirkt, daß der Browser die Teiladresse an den Adreßlistenserver sendet. Der Listenserver kann dann mit einer Liste von Adressen antworten, die die Teiladressen umfassen. Wie bei jeder Antwort auf eine Websuchanforderung kann die Anzahl übereinstimmender URLs groß sein und es kann unter Umständen Arten und Weisen geben müssen, um die übereinstimmenden URLs zu organisieren oder priorisieren. Mögliche Verfahren zum Priorisieren der übereinstimmenden URLs umfassen ein Ordnen derselben in der Reihenfolge der am häufigsten verwendeten oder der am aktuellsten verwendeten.
  • Fig. 6 stellt ein exemplarisches Verfahren zum Aufbauen einer Adreßliste unter Verwendung eines Adreßlistenservers dar. Bei Schritt 600 durchsucht der Adreßlistenserver das Netz nach HTML-Dokumentenadressen oder erhält Listen von anderen. Bei Schritt 602 baut der Adreßlistenserver eine Liste der entdeckten oder erhaltenen Adressen auf.
  • Ein alternatives exemplarisches Verfahren zum Erzeugen einer Liste von Dokumentenadressen besteht darin, ausdrücklich eine Liste von Adressen in eine Indexseite oder ein anderes HTML-Dokument einzuschließen. Für viele kommerzielle Websites z. B. ist es im Interesse des Eigentümers der Website, eine Navigation zu den letztendlichen Dokumenten von Interesse zu erleichtern und zu rationalisieren. Ein eindeutiger Identifizierer kann zur Verwendung innerhalb eines Kommentarbereichs spezifiziert sein, der durch eine HTML-Kommentarkennung bezeichnet ist, wobei der eindeutige Identifizierer wiederum eine Dokumentenadreßliste bezeichnen kann. Wenn die Adreßliste Teil eines Kommentars gemacht wird, wird vermieden, daß die Liste angezeigt wird, es sei denn, die rohe HTML-Datei wird als ein Quellentext angezeigt. Die Liste kann ein optionaler Teil des Entwurfs einer Webseite sein. Wenn eine Teiladresse eingegeben wird, die den Namen eines Servers umfaßt, kann der Browser zu dem Server gehen, anstelle nach URLs zu suchen, wie in Fig. 3, kann der Browser nach dem eindeutigen Identifizierer suchen, der eine Dokumentenadreßliste bezeichnet, und kann den Inhalt der Liste lesen.
  • Fig. 7 stellt ein exemplarisches Verfahren zum Aufbauen einer Adreßliste innerhalb eines HTML-Dokuments dar. Bei Schritt 700 schließt ein Webseitenentwerfer einen eindeutigen Identifizierer ein, der eine Liste von Dokumentenadressen bezeichnet. Bei Schritt 702 schließt der Webseitenentwerfer die Liste von Adressen in das HTML-Dokument ein. Jede der obigen exemplarischen Alternativen zum Erzeugen einer Liste kann unabhängig implementiert sein oder dieselben können in jeder Kombination implementiert werden. Fig. 8 stellt ein globales Verfahren für einen Browser in einer Umgebung dar, in der alle exemplarischen Alternativen zum Erzeugen einer Liste implementiert wurden. Bei Schritt 800 wurde eine Teiladresse eingegeben, die den Namen eines Servers umfassen kann oder nicht. Der Browser kann eine frühere Dokumentenadreßliste erzeugt oder empfangen haben, die er in einem Speicher gespeichert hat. Es wird angemerkt, daß der Browser mehrere Listen zusammenführen kann und dieselben in einem Speicher speichern kann. Wenn der Browser eine gespeicherte Liste aufweist, gewinnt der Browser bei Schritt 802 seine gespeicherte Liste wieder. Selbst wenn es eine gespeicherte Liste gibt, kann der Browser alle Adressen in dieser Liste anzeigen, die die Teiladresse umfassen, und dann mit weiteren Verfahren fortfahren, um noch mehr Adressen zu erhalten oder die Liste in dem Speicher aufzufrischen.
  • Bei Schritt 806 wird, wenn der Browser ausdrücklich eine Unterstützung von einem Adreßlistenserver anfordert, bei Schritt 808 die Teiladresse an einen Adreßlistenserver gesendet und der Adreßlistenserver antwortet mit einer Liste von Adressen.
  • Bei Schritt 810 prüft der Browser, um zu sehen, ob die Teiladresse einen vollständig qualifizierten Lokalservernamen umfaßt. Eine URL weist den folgenden Aufbau auf: Schema: / / Host.Domäne/Pfad/Dateiname. Für ein Dokument auf einem Webserver ist das Schema "http" (HyperText Transfer Protocol). Beispiele von Domänen sind .com, .org, .net, .edu und .gov. Allgemein muß, damit ein Client einen Hostserver irgendwo in dem Internet findet, der Hostname registriert sein. hp.com z. B. ist ein registrierter Domänennamen für die Hewlett-Packard Company. Lokalnetzserveradressen können unter Umständen nicht registriert sein. ab.ce.ef.hp.com z. B. kann den Namen eines lokalen, nicht registrierten Servers darstellen, der hinter einer Firewall für hp.com zugänglich ist, jedoch außerhalb der Hewlett-Packard Company ohne eine Erlaubnis nicht zugänglich ist. Folglich fordert, wenn bei Schritt 810 die Teiladresse einen vollständig qualifizierten Servernamen der Form "http:/ / www.xx.xx.Host.Domäne" umfaßt, wobei es zusätzliche Zeichen nach der Domäne geben kann oder nicht, der Browser bei Schritt 812 eine Adreßliste von dem Server xx.xx.Host.Domäne an. Alternativ kann der Browser auf die Webdateiortskarte zugreifen und eine Adreßliste aus den Dateiorten erzeugen, die für den Server xx.xx.Host.Domäne gegeben sind.
  • Wenn bei Schritt 810 die Teiladresse kein Lokalservername ist, kann der Browser bei Schritt 814 die Teiladresse über das Internet senden. Wenn die Teiladresse zu einem Proxy- Server geht, kann der Proxy-Server bei Schritt 816 eine Adreßliste zurückgeben. Wenn die Teiladresse die vollständige Adresse für eine Indexseite ist, kann der Proxy-Server auch eine Indexseite zurückgeben. Wenn bei Schritt 818 die Teiladresse nicht die vollständige Adresse für eine Indexseite ist, muß der Browser bei Schritt 820 auf zusätzliche Zeichen warten, bevor er nach Adreßinformationen auf einer Indexseite suchen kann.
  • Bei Schritt 822 durchsucht der Browser eine Indexseite, um zu sehen, ob die Indexseite eine Adreßliste umfaßt. Wenn die Indexseite eine Adreßliste umfaßt, erhält der Browser bei Schritt 824 die Adreßliste von der Indexseite. Wenn es keine Adreßliste auf der Indexseite gibt, baut der Browser bei Schritt 826 eine Adreßliste aus der Indexseite auf.
  • An jedem Punkt in dem Verfahren, das in Fig. 8 dargestellt ist, kann, wenn der Browser bereits mehrere vollständige Adressen anzeigt, der Browser entscheiden, das Verfahren zu verlassen. Wenn z. B. eine Adreßliste in Schritt 804 von dem Speicher erhalten wird, kann der Browser an diesem Punkt austreten. Ähnlich kann, wenn eine Adreßliste bei Schritt 808 von einem Listenserver empfangen wird, der Browser an diesem Punkt austreten usw. Insbesondere kann, wenn der Browser bereits mehrere vollständige Adressen anzeigt, der Browser bei Schritt 820 wählen, das Verfahren zu verlassen und nicht auf mehr Zeichen zu warten.
  • Es wird angemerkt, daß bei jedem der obigen exemplarischen Ausführungsbeispiele und Variationen der Browser eine Liste oder Hierarchie mit vollständigen Adressen vorlegt, die für den Bediener verfügbar sind, obwohl der Browser unter Umständen niemals zuvor auf den Server zugegriffen hat. Der Browser kann mehrere Listen zusammenführen und die zusammengeführte Liste speichern. Der Bediener kann eine vollständige Adresse aus der angezeigten Liste auswählen. Der Bediener kann durch die angezeigte Liste navigieren und tiefer in die Hierarchie hinein erkunden. Wenn zusätzliche Zeichen durch den Bediener hinzugefügt werden, kann der Browser auch nur die Adressen anzeigen, die die zusätzlichen Zeichen umfassen. An jedem Punkt kann der Bediener eine vollständige Adresse aus einer angezeigten Liste auswählen oder der Bediener kann fortfahren, zusätzliche Teile der Adresse hinzuzufügen, um die Größe der angezeigten Liste zu reduzieren.

Claims (2)

1. Verfahren zum Erzeugen einer Liste von Adressen, mit folgenden Schritten:
Einschließen (700) einer Hypertext-Markierungssprache- Kennung, die einen Kommentarabschnitt bezeichnet, in eine Indexseite für einen Webserver;
Einschließen eines Identifizierers, der eine Liste von Dokumentenadressen bezeichnet, in den Kommentarabschnitt; und
Einschließen (702) zumindest einer Dokumentenadresse in die Liste von Adressen.
2. Computerlesbares Medium, das ein Dokument in der Hypertext-Markierungssprache enthält, wobei das Dokument folgende Merkmale aufweist:
eine Hypertext-Markierungssprache-Kennung, die einen Kommentarabschnitt bezeichnet;
einen Identifizierer, der eine Liste von Dokumentenadressen bezeichnet, in dem Kommentarabschnitt; und
zumindest eine Dokumentenadresse in der Liste von Adressen.
DE10303067A 2002-01-31 2003-01-27 Erzeugen einer Liste von Adressen in einer Indexseite Withdrawn DE10303067A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/061,926 US20040201631A1 (en) 2002-01-31 2002-01-31 Generating a list of addresses in an index page

Publications (1)

Publication Number Publication Date
DE10303067A1 true DE10303067A1 (de) 2003-08-14

Family

ID=27610218

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10303067A Withdrawn DE10303067A1 (de) 2002-01-31 2003-01-27 Erzeugen einer Liste von Adressen in einer Indexseite

Country Status (2)

Country Link
US (1) US20040201631A1 (de)
DE (1) DE10303067A1 (de)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050278537A1 (en) * 2004-06-10 2005-12-15 Dustin Kirkland Logging off a user from a website
DE102005060601A1 (de) * 2005-12-17 2007-06-21 Dr. Johannes Heidenhain Gmbh Verfahren zur Inbetriebnahme einer numerischen Steuerung für Werkzeug- oder Produktionsmaschinen
TW201020802A (en) * 2008-11-28 2010-06-01 Ibm System, device, method and computer-readable medium for providing network service information
GB2566765B (en) 2017-03-23 2022-09-14 Pismo Labs Technology Ltd Method and system for restricting transmission of data traffic for devices with networking capabilities
GB2565612B (en) * 2017-03-23 2022-04-06 Pismo Labs Technology Ltd Method and System for Updating a Whitelist at a Network Node

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5572643A (en) * 1995-10-19 1996-11-05 Judson; David H. Web browser with dynamic display of information objects during linking
US6009441A (en) * 1996-09-03 1999-12-28 Microsoft Corporation Selective response to a comment line in a computer file
US6092091A (en) * 1996-09-13 2000-07-18 Kabushiki Kaisha Toshiba Device and method for filtering information, device and method for monitoring updated document information and information storage medium used in same devices
US6029171A (en) * 1997-02-10 2000-02-22 Actioneer, Inc. Method and apparatus for group action processing between users of a collaboration system
US5953526A (en) * 1997-11-10 1999-09-14 Internatinal Business Machines Corp. Object oriented programming system with displayable natural language documentation through dual translation of program source code
US6393462B1 (en) * 1997-11-13 2002-05-21 International Business Machines Corporation Method and apparatus for automatic downloading of URLs and internet addresses
US6185598B1 (en) * 1998-02-10 2001-02-06 Digital Island, Inc. Optimized network resource location
US6393479B1 (en) * 1999-06-04 2002-05-21 Webside Story, Inc. Internet website traffic flow analysis
US6525747B1 (en) * 1999-08-02 2003-02-25 Amazon.Com, Inc. Method and system for conducting a discussion relating to an item
JP3703080B2 (ja) * 2000-07-27 2005-10-05 インターナショナル・ビジネス・マシーンズ・コーポレーション ウェブコンテンツを簡略化するための方法、システムおよび媒体
US20020198962A1 (en) * 2001-06-21 2002-12-26 Horn Frederic A. Method, system, and computer program product for distributing a stored URL and web document set
US6820075B2 (en) * 2001-08-13 2004-11-16 Xerox Corporation Document-centric system with auto-completion
US8112529B2 (en) * 2001-08-20 2012-02-07 Masterobjects, Inc. System and method for asynchronous client server session communication

Also Published As

Publication number Publication date
US20040201631A1 (en) 2004-10-14

Similar Documents

Publication Publication Date Title
DE19718834B4 (de) Navigation in Hypermedien unter Verwendung weicher Hyperlinks
DE60016772T2 (de) Verfahren und system für die publikation und revision von hierarchisch organisierten sätzen von statischen intranet- und internet-seiten
DE69831904T2 (de) Dynamische Erstellung von Internetseiten
DE69931256T2 (de) Verfahren und system zum zurückholen einer elektronischen akte
DE69725258T2 (de) System und Verfahren zur Wiederauffindung von Dokumenten in mehreren Sprachen
DE69637125T2 (de) Optimaler zugriff auf elektronische dokumente
DE69729926T2 (de) Netzwerkbrowser
EP1311989B1 (de) Verfahren zur automatischen recherche
DE69723432T2 (de) Informationsauffindungssystem mit einer cachedatenbank
DE19715696A1 (de) Verfahren und Apparat zum Suchen nach und zum Wiederfinden von Dokumenten, indem ein Faxgerät verwendet wird
DE69636869T2 (de) Server mit automatischer Menüladefunktion
DE60003278T2 (de) Hierarchische Auflösung von Adressen in einem Datennetzwerk
DE10135445A1 (de) Integriertes Verfahren für das Schaffen einer aktualisierbaren Netzabfrage
DE102007037646B4 (de) Computerspeichersystem und Verfahren zum Indizieren, Durchsuchen und zur Datenwiedergewinnung von Datenbanken
DE102013017085A1 (de) System für eine tiefe Verknüpfung und Suchmaschinenunterstützung für Webseiten, in die eine Drittanwendung und Komponenten integriert sind
DE10122197A1 (de) Verfahren und System zum Zugreifen auf Information auf einem Netzwerk unter Verwendung von Nachrichten-Verknüpfungsfunktionen mit Schatten-Rückruffunktionen
DE10052313A1 (de) Verfahren und Vorrichtung zur Beschränkung des freien Verweisens (Hyperlinking) auf Webseiten der ursprünglichen Inhaltserzeuger (Content producers) durch Internet-Inhaltsverteiler (Content distributors)
DE60002442T2 (de) Addressieren im internet
DE10303070A1 (de) Erzeugen einer Liste von Adressen in einem Server
DE10118898A1 (de) Vorrichtung und Verfahren zur Verarbeitung von Lesezeichenereignissen für eine Webseite
DE60315563T2 (de) Datenausgabesystem
EP1620810B1 (de) Verfahren und anordnung zur einrichtung und aktualisierung einer benutzeroberfl che zum zugriff auf informationsseiten in ein em datennetz
DE202013012665U1 (de) Methode zur Implementierung von strukturierten und unstrukturierten Daten in XML-Dokumenten
DE60037681T2 (de) Verfahren zum automatischen und gesicherten suchen von daten mit hilfe eines datenübertragungsnetzwerks
DE19813884A1 (de) System und Verfahren zur Ermittlung und Darstellung von verbindungsbezogenen Leistungsdaten in Netzwerken

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8125 Change of the main classification

Ipc: G06F 1722

8127 New person/name/address of the applicant

Owner name: HEWLETT-PACKARD DEVELOPMENT CO., L.P., HOUSTON, TE

8130 Withdrawal