DE69937249T2 - System und verfahren zur analyse eines webserver-logbuchs - Google Patents

System und verfahren zur analyse eines webserver-logbuchs Download PDF

Info

Publication number
DE69937249T2
DE69937249T2 DE69937249T DE69937249T DE69937249T2 DE 69937249 T2 DE69937249 T2 DE 69937249T2 DE 69937249 T DE69937249 T DE 69937249T DE 69937249 T DE69937249 T DE 69937249T DE 69937249 T2 DE69937249 T2 DE 69937249T2
Authority
DE
Germany
Prior art keywords
data
hits
hit
server
log file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69937249T
Other languages
English (en)
Other versions
DE69937249D1 (de
Inventor
William Glen Portland BOYD
Elijahu Portland SHAPIRA
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Webtrends Inc
Original Assignee
Webtrends Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Webtrends Inc filed Critical Webtrends Inc
Publication of DE69937249D1 publication Critical patent/DE69937249D1/de
Application granted granted Critical
Publication of DE69937249T2 publication Critical patent/DE69937249T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/10015Access to distributed or replicated servers, e.g. using brokers

Description

  • HINTERGRUND DER ERFINDUNG
  • Diese Erfindung bezieht sich allgemein auf eine Webserver-Verkehrsdatenanalyse und insbesondere auf ein System und ein Verfahren zur Analyse von Webserver-Protokolldateien.
  • Das weltumspannende Datennetz (nachstehend "Web") wird schnell zu einem der wichtigsten heutzutage verwendeten Veröffentlichungsmedien. Der Grund hierfür ist einfach: Webserver, die über das Internet miteinander verbunden sind, bieten Zugang zu einem potenziell weltweiten Publikum, und dies mit einer minimalen Investition in Zeit und Betriebsmittel beim Erstellen einer Website. Der Webserver gestattet die Erfassung und Entsendung eines weiten Bereichs von Medien in einer Vielfalt von Formaten, einschließlich Audio- und Videobotschaften sowie herkömmlichen Text und Grafiken. Und die Leichtigkeit der Erstellung einer Website schafft einen Zugang zu diesem weltweiten Publikum für wirklich alle Arten von Benutzern, von Vereinigungen über Gründerunterstützungsgesellschaften bis hin zu Organisationen und Einzelpersonen.
  • Im Gegensatz zu anderen Medienarten ist eine Website interaktiv und der Webserver kann passiv Zugriffsinformationen über jeden Benutzer sammeln, indem er die Verkehrsdatenpakete beobachtet und protokolliert, die zwischen dem Webserver und dem Benutzer ausgetauscht werden. Wichtige Angaben über die Benutzer können direkt oder durch Schlussfolgerung bestimmt werden, indem man die Verkehrsdaten und den Kontext des "Treffers" analysiert. Außerdem können aus über einen bestimmten Zeitraum gesammelten Verkehrsdaten statistische Informationen gewonnen werden, wie etwa die Anzahl von Benutzern, die die Seite täglich benutzen, aus welchen Ländern, Staaten oder Städten sich die Benutzer einklinken, und den aktivsten Tag oder die aktivste Stunde der Woche. Solche statistischen Informationen sind nützlich bei der zielgerichteten Erstellung von Marketing- oder Betriebsplanungsstrategien, um auf die sich ergebenden Bedürfnisse des Publikums besser abstellen zu können. Jeder Treffer wird auch mit Datum und Zeit des Zugriffs codiert. Weil von den interessierenden statistischen Informationen nahezu alle mit Zeitspannen in Bezug stehen, ist die genaue Bestimmung des Zeitpunkts jedes Treffers entscheidend.
  • Um den Einsatz dieser statistischen Informationen zu optimieren, muss die Webserver-Verkehrsanalyse zeitgenau erfolgen. Es ist für einen Webserver jedoch nicht ungewöhnlich, Tausende von Benutzern täglich zu bewältigen. Die sich ergebenden Zugriffsinformationen, die vom Webserver aufgezeichnet werden, belaufen sich auf Megabytes von Verkehrsdaten. Einige Webserver erzeugen tägliche Verkehrsdaten in Gigabyte-Größe. Die Analyse der Verkehrsdaten für nur einen einzigen Tag, um Trends auszumachen oder Statistiken zu erzeugen, ist von der Rechnerleistung her gesehen aufwendig und zeitraubend. Außerdem nimmt die Verarbeitungszeit, die zur Analyse der Verkehrsdaten für mehrere Tage, Wochen oder Monate benötigt wird, mit einer Ausweitung des interessierenden Zeitrahmens linear zu.
  • Das Problem der Durchführung einer effizienten und zeitgenauen Verkehrsanalyse ist nicht auf Webserver beschränkt. Vielmehr ist eine Verkehrsdatenanalyse immer dann möglich, wenn Verkehrsdaten beobachtet und in gleichförmiger Art und Weise aufgezeichnet werden können, wie z. B. in einer verteilten Datenbank, einem Client-Server-System oder in einer anderen Umgebung mit Fernzugriff.
  • Ein Verfahren und eine Vorrichtung zur Leistungsüberwachung unter Verwendung von synchronisierten Netzwerkanalysatoren sind im US-Patent Nr. 5,600,632 beschrieben, das am 4. Feb. 1997 auf den Namen von Schulman erteilt wurde. Gemäß dieser Druckschrift werden eine Vielzahl von Netzwerkanalysatoren vornehmlich zu einem Netzwerkleistungs-Analysewerkzeug zusammengefasst, um komplexe und weit verzweigte Netzwerke zu analysieren, wobei jeder der Analysatoren mit den anderen synchronisiert ist, um eine Konsistenz bei den das Netzwerk durchlaufenden Paketen bereitzustellen.
  • Einige Webserver sind so beschäftigt, d. h. bewältigen so viel Verkehr, dass sie mehrere Server benötigen, um den gesamten Verkehr abwickeln zu können. Bei anderen Benutzern kann es wiederum so sein, dass sie wegen des großen Umfangs der Website mehrere Server verwenden müssen. Websites von entscheidender Bedeutung, d. h. solche, die nicht wegen eines Problems mit einem Server ausfallen dürfen, werden möglicherweise auch auf mehreren Servern erstellt. Solche mehreren Ser ver werden manchmal als Server-Farm bezeichnet. Server-Farmen bieten einen mit einer hohen Bandbreite ausgestatteten, zuverlässigen Zugriff auf Websites.
  • Es gibt mehrere Technologien, die in einer Server-Farm verwendet werden können, wobei aber die wichtigsten die Farm in Servergruppen unterteilen. Die Website ist auf jedem Server in der Gruppe noch einmal gespiegelt vorhanden. Eine spezielle Hardware empfängt den gesamten zur Website laufenden Verkehr und verteilt jeden Treffer auf einen der Server. Einige Systeme bieten einen genauen Ausgleich der Arbeitsbelastung dahingehend, dass alle Treffer aufeinanderfolgend auf die einzelnen Server im Rotationsverfahren verteilt werden. Andere wiederum teilen jeden Treffer von einem neuen Ausgangsort einem Server zu, und ein weiterer Zugriff auf die Website von diesem Ausgangsort wird dem zugeteilten Server zugewiesen. Dies erfolgt unter Festsetzung einer vorbestimmten Zeitspanne, zum Beispiel 30 Minuten, während der alle nachfolgenden Zugriffe vom selben Ausgangsort so angesehen werden, dass sie Teil ein und derselben Sitzung sind, die an diesem Ausgangsort stattfindet. Wie nachstehend weiter ausgeführt werden wird, gestattet der letztgenannte Lösungsansatz eine gewisse Protokolldatei-Analyse, was unter Verwendung des Auslastungsausgleichsverfahrens nicht möglich ist.
  • Obwohl sie einen Auslastungsausgleich und Redundanz bieten, stellen sich bei Server-Farmen Probleme bei der Analyse der von den Servern generierten Protokolldateien. Systeme aus dem Stand der Technik zur Analyse von Webserver-Protokolldateien können viele Protokolldateien bewältigen, aber diese Dateien werden aufeinanderfolgend generiert, d. h. die Datenpakete in jeder Protokolldatei liegen in chronologischer Reihenfolge vor und die Protokolldateien selbst entsprechen Zeitspannen, die Datenpakete aus innerhalb dieser Zeitspannen enthalten. Anders ausgedrückt werden auch die Protokolldateien aufeinanderfolgend generiert. Protokolldateien auf Servern in einer Server-Farm werden jedoch gleichzeitig generiert. Jede Protokolldatei überdeckt oder überlappt dieselbe Zeitspanne. In Server-Farmen, die die Treffer unter den Servern nach dem Rotationsprinzip verteilen, erzeugen Protokolldatei-Analyseprogramme keine nutzbaren Informationen. Es sind Lösungen möglich, die sich auf massiven Aufwand stützen, wie etwa das Sortieren aller Protokolldateien und das Erzeugen einer neuen, einzigen Datei, oder das Ko pieren aller Treffer von jeder Protokolldatei in eine große Datenbank, die die Daten sortieren und analysieren kann. Diese Lösungen haben schwere Nachteile: Sie bedeuten einen hohen Rechneraufwand, benötigen die Erzeugung von großen neuen Dateien, und funktionieren nur, wenn die Protokolldateien fertiggestellt sind, d. h. nicht während der Übertragung, wenn in der Protokolldatei noch Datenverkehr besteht.
  • Server-Farmen, die Treffer von einem neuen Ausgangsort einem einzelnen Benutzer zuweisen, können Protokolldatei-Analyseprogramme aus dem Stand der Technik auf jedem Server laufen lassen und die Ergebnisse aufsummieren. Dies ist jedoch nicht hundertprozentig genau und deshalb von Nachteil, weil es die Erzeugung von separaten Protokollen bedingt, auf die dann zugegriffen oder die weiterbearbeitet werden müssen, um Informationen zu erlangen, die sich auf die gesamte Server-Farm beziehen.
  • Infolgedessen besteht ein Bedarf an einem System und einem Verfahren zur Analyse von Webserver-Protokolldateien, die gleichzeitig generiert werden, wie etwa diejenigen, die von einer Server-Farm generiert werden.
  • Es besteht ein weiterer Bedarf an solch einem System und Verfahren, mit dem sich die Protokolldateien im Wesentlichen in Echtzeit analysieren lassen.
  • Es besteht ein weiterer Bedarf an einem solchen System, das die Protokolldateien analysieren kann, ohne neue, große Dateien zu erzeugen und ohne die Notwendigkeit nach beträchtlicher, zusätzlicher Rechnerleistung.
  • Es besteht auch Bedarf an einem solchen System, das Protokolldateien analysieren kann, seien sie nun gleichzeitig oder zeitlich aufeinanderfolgend generiert.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Die vorliegende Erfindung umfasst ein Verfahren zum Analysieren von Protokolldateien, die eine Vielzahl von Datenpaketen enthalten, in einer Abfolge, die umfasst: (a) Auswählen des ersten Datenpakets in jeder Protokolldatei; (b) Vergleichen der ausgewählten Datenpakete; (c) Weiterreichen des ältesten der ausgewählten Datenpakete an einen Protokolldatei-Analysator; (d) Auswählen des nächsten Datenpakets in der Protokolldatei, in der das weitergereichte Datenpaket ausgewählt wurde; und (e) Wiederholen der Schritte (b) bis (d), bis alle Datenpakete in den Protokolldateien weitergereicht sind.
  • Die vorgenannten sowie weitere Merkmale und Vorteile der Erfindung ergeben sich deutlich aus der folgenden ausführlichen Beschreibung einer bevorzugten Ausführungsform der Erfindung, die mit Bezug auf die begleitenden Zeichnungen erfolgt.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • 1 ist ein Funktionsblockschaubild eines Systems aus dem Stand der Technik zum Analysieren von Verkehrsdaten in einer Umgebung mit verteilten Computern gemäß der vorliegenden Erfindung.
  • 2 ist ein Flussdiagramm eines Verfahrens aus dem Stand der Technik zum Analysieren von Verkehrsdaten in einer Umgebung mit verteilten Computern gemäß der vorliegenden Erfindung unter Verwendung des Systems von 1.
  • 3A zeigt ein Format aus dem Stand der Technik, das beim Speichern eines "Treffers" von Verkehrsdaten verwendet wird, die vom Server von 1 empfangen werden.
  • 3B zeigt beispielhaft einen "Treffer" aus formatierten Verkehrsdaten, die vom Server von 1 empfangen werden.
  • 4 ist eine schematische Abbildung einer Server-Farm, die mehrere Server wie diejenigen umfasst, die in 1 gezeigt und beschrieben sind.
  • 5 ist eine schematische Abbildung, in der der Betrieb der Server-Farm von 4 dargestellt ist.
  • 6 ist eine schematische Abbildung, in welcher die vorliegende Erfindung dargestellt ist, die in der Server-Farm von 4 verwendet wird.
  • 7 ist eine 6 ähnliche schematische Abbildung, die aber die vorliegende Erfindung darstellt, wie sie an zeitlich aufeinanderfolgenden Protokolldateien arbeitet.
  • 8 ist ein Flussdiagramm eines Programms zur Umsetzung der vorliegenden Erfindung.
  • AUSFÜHRLICHE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORM
  • 1 ist ein Funktionsblockschaubild eines Systems aus dem Stand der Technik zum Analysieren von Verkehrsdaten in einer Umgebung 9 mit verteilten Computern. Es ist ausführlicher in "WebTrends Installation and User Guide", Version 2.2, Oktober 1996, und im US-Patent mit der Anmeldenr. 08/801,707 beschrieben, deren Offenbarungen hiermit durch Bezugnahme mit aufgenommen sind. WebTrends ist eine Marke von Webtrends Corporation, Portland, Oregon.
  • Ein Server 10 bietet fernab befindlichen Benutzern Websites und damit zusammenhängende Dienste. Die fernab befindlichen Benutzer können auf den Server 10 zum Beispiel von einem fernab befindlichen Computersystem 12 aus zugreifen, das mit dem Server 10 über eine Netzverbindung 13 wie etwa das Internet oder ein Intranet, eine Einwahlverbindung 14 (Punkt-zu-Punkt-Verbindung) oder eine direkte (zweckgebundene) Verbindung 17 verbunden ist. Andere Arten von Verbindungen mit Fernzugriff sind auch möglich.
  • Jeder von einem fernab befindlichen Benutzer erfolgende Zugriff auf den Server 10 ergibt einen "Treffer" aus Verkehrsrohdaten 11. Nachstehend sind mit Bezug auf 3A und 3B das beim Abspeichern jedes Verkehrsdatentreffers 11 verwendete Format bzw. ein Beispiel für einen Verkehrsdatentreffer 11 beschrieben. Der Server 10 speichert jeden Verkehrsdatentreffer 11 vorzugsweise in einer Protokolldatei 15, obwohl auch eine Datenbank 16 oder eine andere Speicherstruktur verwendet werden kann.
  • Zum Analysieren der Verkehrsdaten untersucht der Server 10 jeden Verkehrsdatentreffer 11 und speichert die aus den Verkehrsdaten erhaltenen Zugriffsinformationen als Analyseergebnisse 18A–C ab. Fünf Pools der Verkehrsdaten 11 (fernab befindliches System 12, Einwahlverbindung 14, Protokolldatei 15, Datenbank 16 und direkte Verbindung 17) sind gezeigt. Auch andere Pools oder Ausgangsorte sind möglich. Die Verkehrsdatentreffer 11 können von irgendeinem einzelnen Pool oder von einer Kombination dieser Pools stammen. Während der Server 10 Verkehrsdatentreffer 11 kontinuierlich empfängt, werden für jede einzelne Protokollierungszeitspanne, die Zeitschlitz genannt wird, separate Gruppen von Analyseergebnissen 18A–C gespeichert. Die Analyseergebnisse 18A–C wer den verwendet, um Übersichten bzw. Zusammenstellungen 19A–C der Zugriffsinformationen zu erzeugen.
  • In der beschriebenen Ausführungsform ist der Server 10 typischerweise ein von Intel stammendes, auf Pentiumtechnologie beruhendes Computersystem, das mit einem Prozessor, einem Speicher, einer Eingangs-/Ausgangsschnittstelle, einer Netzschnittstelle, einer sekundären Speichervorrichtung und einer Benutzerschnittstelle vorzugsweise in Form einer Tastatur und eines Monitors ausgestattet. Der Server 10 arbeitet typischerweise unter der Steuerung der Betriebssysteme Microsoft Windows NT oder Unix und betreibt entweder eine von Microsoft stammende Internet-Informationsserversoftware oder eine von NetScape stammende Datenübertragungs-Serversoftware. Pentium, Microsoft, Windows, Windows NT, Unix, Netscape und Netscape Communications Server sind Marken ihrer jeweiligen Inhaber. Es sind jedoch auch andere Konfigurationen in Bezug auf den Server 10 möglich, die sich bezüglich der Hardware unterscheiden, wie etwa DOS-kompatible Plattformen, Apple Macintosh, Sun-Arbeitsplatzrechner und auch andere Plattformen, die sich hinsichtlich ihrer verschiedenen Betriebssysteme unterscheiden, wie etwa MS-DOS, Unix und andere, oder sich auch in der Web-Software unterscheiden. Apple, Macintosh, Sun und MS-DOS sind Marken ihrer jeweiligen Inhaber.
  • 2 zeigt ein Flussdiagramm eines Verfahrens 20 zum Analysieren von Verkehrsdaten in einer Umgebung mit verteilten Computern gemäß der vorliegenden Erfindung unter Verwendung des Systems von 1. Sein Zweck besteht darin, kontinuierlich Zugriffsinformationen aus Verkehrsdatentreffern 11 zu sammeln und zusammenzufassen, während gleichzeitig auf Verlangen hin Ad-hoc-Analysen ermöglicht sind. Das Verfahren 20 besteht aus zwei Programmen. Zugriffsinformationen werden aus Verkehrsdatentreffern 11 gesammelt und vom Server 10 zu Analyseergebnissen 18A–C (Block 21) zusammengefasst. Die Zugriffsinformationen werden separat analysiert, um die Übersichten 19A–C zu erzeugen, die Trends, Statistiken und weitere Informationen angeben (Block 22). Das Sammeln und Zusammenfassen der Zugriffsinformationen (Block 21) wird vom Server 10 kontinuierlich ausgeführt, während die Analyse der Zugriffsinformationen (Block 22) auf einer Ad-hoc-Basis ausgeführt wird, und zwar entweder vom Server 10 oder einem separaten Arbeitsplatzrechner (nicht gezeigt).
  • Das Verfahren 20 ist vorzugsweise in Form eines Computerprogramms realisiert, das vom Server 10 ausgeführt wird und in einem Speichermedium enthalten ist, welches eine computerlesbare Programmsprache umfasst. In der beschriebenen Ausführungsform ist das Verfahren 20 in der Programmiersprache C geschrieben, obwohl andere Programmiersprachen gleichermaßen geeignet sind. Es arbeitet in einer Microsoft-Windows-Umgebung und kann allgemein gebräuchliche Protokolldateiformate, kombinierte Protokolldateiformate und benutzerspezifische Protokolldateiformate von Webservern nach Industriestandard analysieren, wie etwa diejenigen, die von NetScape, NCSA, O'Reilly WebSite, Quarterdeck, C-Builder, Microsoft, Oracle, EMWAC und anderen Windows 3.x, Windows NT 95, Unix und Macintosh-Webservern lizenziert sind. Die Ahalyseergebnisse 18A–C können in einer benutzerspezifischen oder standardmäßigen Datenbank 16 (in 1 gezeigt) gespeichert werden, wie z. B. SQL, BTRIEVE, ORACLE, INFORMIX und andere. Das Verfahren 20 nutzt die Analyseergebnisse 18A–C der Verkehrsdatentreffer 11, wie sie in der Protokolldatei 15 oder Datenbank 16 gesammelt sind, zur Erstellung von Aktivitätsübersichten, geografischen Übersichten, demografischen Übersichten sowie anderen Übersichten 19A–C, wie sie z. B. nachstehend in der Tabelle 1 aufgeführt sind. Andere Übersichten 19A–C sind auch möglich. Tabelle 1
    Benutzerprofil nach Regionen Tabelle mit allgemeinen Angaben
    Am häufigsten aufgerufene Seiten Am wenigsten aufgerufene Seiten
    Beliebteste Startseiten Beliebteste Abbruchseiten
    Einzelzugriffsseiten Am meisten benutzte Pfade durch
    die Seite
    Werbeeinblendungen Anklickvorgänge Werbeeinblendun
    gen
    Werbeeinblendungen und -klicks Am häufigsten heruntergeladene
    Dateien
    Aktivste Organisationen Aktivste Länder
    Aktivitätsübersicht nach Wochentag Aktivitätsübersicht nach Tag
    Aktivitätsübersicht nach Stunde des Aktivitätsübersichtsgrad nach Stun
    Tages den des Tages
    Webserverstatistiken und -analysen Clientseitige Fehler
    Am häufigsten heruntergeladene Serverseitige Fehler
    Dateitypen und -größen
    Aktivität nach Organisationsart Verzeichnisse mit dem häufigsten
    Zugriff
    Websites mit den häufigsten Ver- URLs mit den häufigsten Verweisen
    weisen
    Am häufigsten verwendete Browser Netscape-Browser
    Microsoft-Explorer-Browser Besuchende Suchmaschinen
    Beliebteste Plattformen
  • Darüber hinaus können die Analyseergebnisse 18A–C dazu verwendet werden, automatisch Berichte und Übersichten zu erstellen, die statistische Informationen und Grafiken beinhalten, die beispielsweise die Benutzeraktivität aufgeteilt nach Markt, den Grad des Interesses an spezifischen Webseiten oder Webdiensten, welche Produkte am beliebtesten sind, ob ein Besucher eine lokale, nationale oder internationale Herkunft hat, und ähnliche Informationen zeigen. In der beschriebenen Ausführungsform können die Übersichten 19A–C als Protokollierungen in einer Vielzahl von Formaten erzeugt werden. Diese Formate umfassen HTML-Dateien, die mit dem Großteil gebräuchlicher Webbrowser kompatibel sind, benutzerspezifische Dateiformate zur Verwendung in Verbindung mit Textverarbeitung, Tabellenkalkulationsprogrammen, Datenbank- und anderen Programmen wie etwa Microsoft Word, Microsoft Excel, ASCII-Dateien und verschiedene andere Formate. Word und Excel sind Marken von Microsoft Corporation, Redmond, Washington.
  • 3A zeigt ein Format, das beim Abspeichern eines "Treffers" von Verkehrsrohdaten 11 verwendet wird, die vom Server von 1 empfangen werden. Ein ursprünglicher Verkehrsdatentreffer 11 liegt nicht in dem in 3A gezeigten Format vor. Vielmehr ist der Inhalt jedes Felds im Format bestimmt durch die Datenpakete, die zwischen dem Server 10 und dem Ausgangsort des Verkehrsdatentreffers 11 ausgetauscht werden, und die aus den Datenpaketen herausgezogenen Informationen werden in einem Datensatz unter Verwendung des Formats von 3A gespeichert, bevor sie in der Protokolldatei 15 (in 1 gezeigt) abgespeichert oder verarbeitet werden.
  • Jeder Verkehrsdatentreffer 11 ist eine formatierte Aneinanderreihung aus ASCII-Daten. Das Format beruht auf dem standardmäßigen Protokolldateiformat, das von der National Computer Security Association (NCSA) entwickelt wurde, einem Standardprotokollformat, das von den meisten Webservern verwendet wird. Das Format besteht aus sieben Feldern wie folgt:
    Feldbezeichnung Beschreibung
    Benutzeradresse (30): Internetprotokolladresse (IP-Adresse)
    oder Domain-Name des Benutzers,
    der auf die Seite zugreift.
    RFC931 (31): Nicht benutztes, üblicherweise leer
    gelassenes Feld, aber von vielen
    Webservern verstärkt dazu verwen
    det, um den Host-Domain-Namen für
    an mehreren Orten sitzende Proto
    kolldateien abzuspeichern.
    Benutzerauthentifizierung (32): Tauscht ggf. den Benutzernamen aus
    für einen Zugriff auf die Website.
    Datum/Zeit (33): Datum und Zeit des Zugriffs und
    Zeitabstand gegenüber GMT (mittlere
    Greenwich-Zeit).
    Abruf (34): Entweder HOLE-Befehl (ein Seitenab
    ruf) oder ein ENTSENDE-Befehl (For
    mularvorlage).
    Rücklaufcode (35): Rücklaufstatus der Anfrage, der ge
    nau angibt, ob die Übertragung er
    folgreich war.
    Übertragungsgröße (36): Anzahl von Bytes, die für den Datei
    abruf übermittelt wurden, d. h. Datei
    größe.
  • Zusätzlich können drei optionale Felder wie folgt verwendet werden:
    Feldbezeichnung Beschreibung
    Verweisseite (37): URL, die zum Erhalt der Website-
    Information verwendet wurde, um
    den "Treffer" auszuführen.
    Agent (38): Browserversion, einschließlich Fabri
    kat, Modell oder Versionsnummer und
    Betriebssystem
    Cookie (39): Eindeutige Kennzeichnung, die tole
    rierend verwendet wird, um einen
    bestimmten Benutzer zu kenn
    zeichnen.
  • Andere Formate für die Verkehrsdatentreffer 11 sind auch möglich, einschließlich benutzerspezifische Formate, die zusätzliche Felder enthalten, wie zum Beispiel die Zeit der Übertragung, die Art des Servicevorgangs sowie andere. Außerdem treten immer wieder Modifikationen und Zusätze zu den Formaten der noch unverarbeiteten Verkehrsdatentreffer 11 auf, und die von der vorliegenden Erfindung geforderten Er weiterungen, um mit solchen Variationen der Formate umzugehen, sind dem Fachmann bekannt.
  • 3B zeigt beispielhaft einen "Treffer" aus Verkehrsrohdaten, die vom Server von 1 empfangen wurden. Das Feld Benutzeradresse 30 lautet "tarpon.gulf.net", was anzeigt, dass der Benutzer aus einer Domain mit der Bezeichnung "gulf.net" stammt, die auf einem Rechner mit dem Namen "tarpon" sitzt. Die Felder RFC931 31 und Benutzerauthentifizierung 32 sind "-", was Leereinträge anzeigt. Das Feld Datum/Zeit 33 lautet "12/Jan/1996:20:38:17 + 0000", das einen Zugriff am 12. Januar 1996 um 8:38 Uhr und 17 Sekunden nach mittlerer Greenwich-Zeit anzeigt. Das Feld Anfrage 34 lautet "GET/general.htm HTTP/1.0", was angibt, dass der Benutzer die Seite "general.htm" angefordert hat. Die Felder Rücklaufcode 35 und Übertragungsgröße 36 lauten auf 200 bzw. 3599, was eine erfolgreiche Übertragung von 3599 Bytes anzeigt.
  • Mit Bezug auf 4 ist bei 40 allgemein eine Server-Farm angegeben, die gemäß der vorliegenden Erfindung aufgebaut ist. Darin enthalten sind zwei Servergruppen 42, 44, von denen eine die Server 46, 48, 50 und die andere die Server 50, 52, 54 enthält. Jeder der Server in den Gruppen 42, 44 ist im Wesentlichen identisch zum Server 10 von 1. In der vorliegenden Ausführungsform beinhaltet die Servergruppe 42 eine erste Website, die auf jedem der darin befindlichen Server gespiegelt vorhanden ist, mit einer einzigen bezeichneten Internetprotokolladresse (IP-Adresse). Die Server in der Gruppe 44 beinhalten eine zweite Website, die auf jedem der darin befindlichen Server gespiegelt vorhanden ist, mit einer zweiten genau bezeichneten IP-Adresse.
  • Jeder der Server in den Gruppen 42, 44 ist über ein Kabel wie z. B. das Kabel 58 mit einer Umlenkeinrichtung 60 verbunden. Die Umlenkeinrichtung wiederum erhält einen Eingang von einem Netzwerkanschluss 62, bei dem es sich in der vorliegenden Ausführungsform um eine Internetverbindung handelt. Die Umlenkeinrichtung 60 ist eine Hardwarevorrichtung aus dem Stand der Technik, die einen Pool aus Verkehrsdatentreffern erhält – im vorliegenden Fall über die Verbindung 62 – und sie auf die Server in den Gruppen 42, 44 verteilt.
  • In der vorliegenden technischen Realisierung verteilt die Umlenkeinrichtung 60 Verkehrsdatentreffer innerhalb jeder der Gruppen 42, 44. Mit anderen Worten werden die Verkehrsdatentreffer, die als Ergebnis des Zugriffs auf die Website erzeugt wurden, die in der Gruppe 42 bereitgehalten wird, unter den Servern 46, 48, 50 verteilt. In entsprechender Weise werden Verkehrsdatentreffer, die durch Zugriff auf die Website in der Gruppe 44 erzeugt wurden, unter den Servern 52, 54, 56 verteilt. Ein Gerät, das sich für die Funktion als Umlenkeinrichtung eignet, wird von Cisco Systems hergestellt und unter dem Namen LocalDirector vertrieben. Fachleuten wird klar sein, dass auch andere bekannte Hardwareeinrichtungen die Funktion der Umlenkeinrichtung 60 ausführen können.
  • Nun sind mit Bezug auf 5 Protokolldateien 46A, 48B, 50C jeweils auf dem Server gespeichert, der der Bezugszahl entspricht, die zur Angabe der Protokolldatei verwendet wird. Diese Protokolldateien werden in der vorstehend in Verbindung mit dem Server von 1 beschriebenen Art und Weise erzeugt und abgespeichert. In 5 sind die Treffer der Reihe nach durchnummeriert, und zwar Treffer Nummer 1 bis Treffer Nummer 13 in der chronologischen Reihenfolge, in der jeder Verkehrsdatentreffer generiert wurde. In der Abbildung von 5 kommen zu jeder der Protokolldateien 46A, 48B, 50C immer noch Daten hinzu. Das heißt, dass zum Beispiel in der Protokolldatei 46A Treffer Nummer 1 der zuerst abgespeicherte Datentreffer ist, und Treffer Nummer 5 ist der als Nächstes abgespeicherte Datentreffer, wobei die Treffer Nummer 6 und 12 nachfolgend in Folge abgespeichert werden. Weil die Protokolldatei 46A noch nicht voll ist und geöffnet bleibt, können nach dem Treffer Nummer 12 zusätzliche Treffer in Folge abgespeichert werden. Dasselbe gilt für die Protokolldateien 48B, 50C.
  • Mit Bezug auf 6 ist hier eine Sortiereinrichtung 64 mit eingeschlossen, die die Treffer in jeder der Protokolldateien in Folge überprüft und sie – in der chronologischen Reihenfolge, in der jeder Treffer generiert wurde – an einen Protokolldatei-Analysator 56 weiterleitet. Der Protokolldatei-Analysator arbeitet allgemein, wie in Verbindung mit dem in 1 gezeigten Server beschrieben wurde. Danach werden Ergebnisse der Analyse zu den Analyseergebnissen 18A–C weitergereicht, wie dies auch in Verbindung mit 1 beschrieben ist.
  • Die Betriebsweise der Sortiereinrichtung 64 lässt sich am besten mit Bezug auf die folgende Tabelle 2 und auf das in 8 abgebildete Flussdiagramm verstehen. Tabelle 2
    Vergleichen Weiterreichungen
    1 2 4 1
    5 2 4 2
    5 3 4 3
    5 8 4 4
    5 8 7 5
    6 8 7 6
    12 8 7 7
    12 8 9 8
    12 10 9 9
    12 10 11 10
        - -
        - -
        - -
  • Zuerst wird im Block 68 von 8 der erste in jeder Protokolldatei 46A, 486, 50C empfangene Eintrag ausgewählt. Diese Auswahl ist in Tabelle 2, Zeile 1 abgebildet, in der die Treffer 1, 2 und 4 in der Spalte "Vergleichen" auftauchen. In Block 70 vergleicht die Sortiereinrichtung 64 jeden der Treffer 1, 2 und 4 und leitet den ältesten (zeitlich gesehen) Eintrag, nämlich den Treffer 1 weiter (Block 72). Das Programm bestimmt in Block 74 als Nächstes, ob alle Einträge in allen Protokolldateien ausgewählt, verglichen und weitergereicht wurden. Wenn dem so ist, endet das Programm in Block 76. Ist dies nicht der Fall, wählt in Block 78 das Programm den nächsten Eintrag in der Protokolldatei, die den Eintrag enthält, der in Block 72 weitergereicht wurde. In dem gerade betrachteten Beispiel ist der nächste Eintrag der Treffer Nummer 5 in der Protokolldatei 46A. Als Nächstes werden – mit Bezug auf Zeile 2 von Tabelle 2 – in Block 70 die Treffer 5, 2 und 4 verglichen, und der Treffer 2 wird weitergeleitet, da er der älteste (zeitlich gesehen) der drei verglichenen Einträge ist.
  • Weil das Programm jede der Protokolldateien in einer FIFO-Reihenfolge bearbeitet, kann es ablaufen, während gleichzeitig die Dateien offen sind und immer wieder zusätzliche Treffer in Folge erhalten.
  • Im Beispiel von 7 werden durch die Sortiereinrichtung 64 Protokolldateien 80, 82, 84 bearbeitet. Es wäre festzuhalten, dass diese Protokolldateien Treffer enthalten, die in sequenzieller chronologischer Rei henfolge sind. Darüber hinaus werden die Protokolldateien jeweils in chronologischer Reihenfolge generiert. Folglich stellt die Protokolldatei 80 eine genau bezeichnete Zeitspanne dar, die sich zwischen dem Zeitpunkt befindet, der dem Treffer 1 zugeordnet ist, und dem Zeitpunkt von Treffer 4; die Protokolldatei 82 liegt zwischen den Zeitpunkten der Treffer 5 und 8; und die Protokolldatei 84 zwischen den Treffern 9 und 12. Mit erneutem Bezug auf 8 und auf Tabelle 3, die die sequenziellen Vergleiche abbildet, die an den Protokolldateieinträgen in 7 vorgenommen werden, werden die Treffer 1, 5 und 9 in Block 68 ausgewählt und in Block 70 verglichen. Treffer 1, der älteste Eintrag, wird in Block 72 weitergereicht, und der nächste eingehende Eintrag, Treffer Nummer 2, wird in Block 78 ausgewählt. Diese Reihenfolge setzt sich solange fort, bis alle Treffer 1 bis 12 weitergereicht sind, wobei zuerst die Treffer 1 bis 4 in Folge von der Protokolldatei 80 weitergereicht werden, die Treffer 5 bis 8 als Nächstes in Folge von der Protokolldatei 82 weitergereicht werden, und schließlich die Treffer 9 bis 12 in Folge von der Protokolldatei 84. Tabelle 3
    Vergleichen Weiterreichungen
    1, 5 9 1
    2, 5 9 2
    3, 5 9 3
    4 5 9 4
    - 5 9 5
    - 6 9 6
    - 7 9 7
    - 8 9 8
    - - 9 9
    - - 10 10
  • Die vorliegende Erfindung sortiert daher Verkehrsdatentreffer in gleichzeitig generierten und auch aufeinanderfolgend generierten Protokolldateien. Dies ist vorteilhaft, weil die Notwendigkeit in Bezug auf separate Programme umgangen ist, oder in Bezug auf die Konfigurierung eines Programms je nach dem, ob die Protokolldateien aufeinanderfolgend oder gleichzeitig erstellt werden. Darüber hinaus ist die vorliegende Erfindung dazu in der Lage, Protokolldateien zu sortieren, während sie weiterhin neue Verkehrsdatentreffer empfangen und abspeichern. Diese Analyse während der Verbindung versorgt Benutzer mit statistischen Daten und Berichten auf nahezu Echtzeitbasis.

Claims (10)

  1. Verfahren zum Analysieren von Verkehrsdaten, die von einer Vielzahl von Webservern (10) generiert werden, welche über ein Netzwerk (13) mit einer Vielzahl von Computereinheiten (12) verbunden sind, umfassend: (a) Generieren einer Vielzahl von Verkehrsdatentreffern (11) für jeden durch einen sich fernab befindlichen Benutzer erfolgenden Zugriff auf einen der Webserver (10), wobei jeder der Treffer (11) einem Datenpaket entspricht, welches zwischen einem der Webserver (10) und einer der Computereinheiten (12) ausgetauscht wird; (b) die Verkehrsdatentreffer (11) mit ihren jeweiligen Servern (10) in Verbindung zu bringen; dadurch gekennzeichnet, dass das Verfahren darüber hinaus umfasst: (c) Auslesen eines ersten Datentreffers (11) aus jedem Server (10); (d) Vergleichen des ersten, aus einem Server (10) ausgelesenen Datentreffers (11) mit dem ersten, aus einem anderen Server aus der Vielzahl von Webservern (10) ausgelesenen Datentreffer (11); (e) Weiterreichen des ältesten Datentreffers (11); (f) Auslesen des nächsten Datentreffers (11) aus dem Server (10), aus dem der weitergereichte Datentreffer (11) ausgelesen wurde; (g) Wiederholen der Schritte (d) bis (e), bis alle Datentreffer (11) ausgelesen sind; und (h) Analysieren der weitergereichten Datentreffer (11).
  2. Verfahren nach Anspruch 1, wobei Schritt (b) und (c) im Wesentlichen gleichzeitig ausgeführt werden.
  3. Verfahren nach Anspruch 1, wobei Schritt (b) vor Schritt (c) ausgeführt wird.
  4. Verfahren nach Anspruch 1, wobei die Webserver (10) zueinander spiegelbildlich sind.
  5. Verfahren nach Anspruch 1, wobei die Verkehrsdatentreffer (11) in chronologischer Reihenfolge generiert werden und wobei verschiedene Protokolldateien (15) Datentreffer enthalten, die Verkehrsdatentreffern (11) entsprechen, welche in derselben Zeitspanne generiert wurden.
  6. Verfahren zum Analysieren von Protokolldatei (15), die in Folge eine Vielzahl von Datentreffern (11) enthalten, von denen jeder einem Verkehrsdatentreffer (11) entspricht, der von einem Webserver (10) generiert wird, wobei für jeden durch einen sich fernab befindlichen Benutzer erfolgenden Zugriff auf den Webserver (10) ein Verkehrsdatentreffer (11) generiert wird, wobei das Verfahren umfasst: (a) Auswählen eines ersten Datentreffers (11) in jeder Protokolldatei (15); (b) Vergleichen des aus einer Protokolldatei (15) ausgewählten ersten Datentreffers (11) mit dem aus einer anderen Protokolldatei (15) ausgewählten ersten Datentreffer (11); gekennzeichnet durch die folgenden Schritte: (c) Weiterreichen des ältesten der ausgewählten Datentreffer (11) an einen Protokolldatei-Analysator (66); (d) Auswählen des nächsten Datentreffers (11) in der Protokolldatei (15), in der der weitergereichte Datentreffer (11) ausgewählt wurde; und (e) Wiederholen der Schritte (b) bis (d), bis alle Datentreffer (11) in den Protokolldateien (15) weitergereicht sind.
  7. Verfahren nach Anspruch 6, wobei die Datentreffer (11) jeweils einem eindeutigen Zeitpunkt zugeordnet werden und der letzte Eintrag in einer Protokolldatei (15) einem Zeitpunkt zugeordnet wird, der nach dem ersten Eintrag in einer anderen Protokolldatei (15) erfolgt.
  8. Verfahren nach Anspruch 6, wobei die Protokolldateien (15) jeweils einer eindeutigen Zeitspanne zugeordnet werden und der Zeit punkt für jeden Datentreffer (11) innerhalb der Zeitspanne für seine Protokolldatei (15) liegt.
  9. Verfahren nach Anspruch 6, wobei eine der Protokolldateien (15) vom Webserver (10) generiert wird und eine andere der Protokolldateien (15) von einem weiteren Webserver generiert wird.
  10. System zum Analysieren von Webserver-Protokolldateien (15), Folgendes umfassend: einen Pool (12, 14, 15, 16, 17) von Verkehrsdatentreffern (11), die von einem Webserver (10) für jeden durch einen sich fernab befindlichen Benutzer erfolgenden Zugriff auf die Webserver (10) erzeugt werden; wobei jedem der Datentreffer (11) ein eindeutiger Zeitpunkt zugeordnet wird; eine Protokolldatei (15), die die Datentreffer (11) in Folge enthält; gekennzeichnet durch: eine Sortiereinrichtung (64) zum Sortieren der Datentreffer (11) aus einer Vielzahl der Protokolldateien (15) in chronologischer Reihenfolge; und einen Analysator (66) zum Analysieren der sortierten Datentreffer (11).
DE69937249T 1998-08-11 1999-08-11 System und verfahren zur analyse eines webserver-logbuchs Expired - Lifetime DE69937249T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/132,287 US6317787B1 (en) 1998-08-11 1998-08-11 System and method for analyzing web-server log files
US132287 1998-08-11
PCT/US1999/018282 WO2000010093A1 (en) 1998-08-11 1999-08-11 System and method for analyzing web-server log files

Publications (2)

Publication Number Publication Date
DE69937249D1 DE69937249D1 (de) 2007-11-15
DE69937249T2 true DE69937249T2 (de) 2008-07-03

Family

ID=22453317

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69937249T Expired - Lifetime DE69937249T2 (de) 1998-08-11 1999-08-11 System und verfahren zur analyse eines webserver-logbuchs

Country Status (9)

Country Link
US (1) US6317787B1 (de)
EP (1) EP1131725B1 (de)
AT (1) ATE374970T1 (de)
AU (2) AU769816B2 (de)
CA (1) CA2340109C (de)
DE (1) DE69937249T2 (de)
DK (1) DK1131725T3 (de)
ES (1) ES2296403T3 (de)
WO (1) WO2000010093A1 (de)

Families Citing this family (121)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5781449A (en) * 1995-08-10 1998-07-14 Advanced System Technologies, Inc. Response time measurement apparatus and method
US6108637A (en) 1996-09-03 2000-08-22 Nielsen Media Research, Inc. Content display monitor
US6112238A (en) * 1997-02-14 2000-08-29 Webtrends Corporation System and method for analyzing remote traffic data in a distributed computing environment
US6925442B1 (en) * 1999-01-29 2005-08-02 Elijahu Shapira Method and apparatus for evaluating vistors to a web server
US6574627B1 (en) * 1999-02-24 2003-06-03 Francesco Bergadano Method and apparatus for the verification of server access logs and statistics
US6529952B1 (en) * 1999-04-02 2003-03-04 Nielsen Media Research, Inc. Method and system for the collection of cookies and other information from a panel
US6789115B1 (en) * 1999-07-09 2004-09-07 Merrill Lynch & Company System for collecting, analyzing, and reporting high volume multi-web server usage
AUPQ206399A0 (en) 1999-08-06 1999-08-26 Imr Worldwide Pty Ltd. Network user measurement system and method
US6760763B2 (en) 1999-08-27 2004-07-06 International Business Machines Corporation Server site restructuring
US7610289B2 (en) 2000-10-04 2009-10-27 Google Inc. System and method for monitoring and analyzing internet traffic
US6792458B1 (en) * 1999-10-04 2004-09-14 Urchin Software Corporation System and method for monitoring and analyzing internet traffic
US7035926B1 (en) * 1999-11-30 2006-04-25 International Business Machines Corporation Real-time monitoring of web activities
US7523190B1 (en) * 1999-12-23 2009-04-21 Bickerstaff Cynthia L Real-time performance assessment of large area network user experience
JP5072160B2 (ja) 2000-01-12 2012-11-14 ネットレイティングス・インコーポレーティッド ワールドワイドウェブのディジタルコンテントの普及を見積もるシステム及び方法
US6477483B1 (en) 2000-01-17 2002-11-05 Mercury Interactive Corporation Service for load testing a transactional server over the internet
US6771289B1 (en) * 2000-03-02 2004-08-03 Microsoft Corporation Cluster-based visualization of user traffic on an internet site
US6728932B1 (en) * 2000-03-22 2004-04-27 Hewlett-Packard Development Company, L.P. Document clustering method and system
JP4403335B2 (ja) * 2000-04-17 2010-01-27 ソニー株式会社 ビデオ処理機器の保守支援システム
US7020709B1 (en) 2000-06-30 2006-03-28 Intel Corporation System and method for fault tolerant stream splitting
US7318107B1 (en) 2000-06-30 2008-01-08 Intel Corporation System and method for automatic stream fail-over
US6785666B1 (en) * 2000-07-11 2004-08-31 Revenue Science, Inc. Method and system for parsing navigation information
CA2432344C (en) * 2000-08-21 2010-10-26 Netiq Corporation Data tracking using ip address filtering over a wide area network
US20040236673A1 (en) * 2000-10-17 2004-11-25 Eder Jeff Scott Collaborative risk transfer system
US6904461B1 (en) * 2000-10-19 2005-06-07 Unitel Technologies, Inc. Method for making time-sensitive determinations of traffic intensity for a visitable site
US6850944B1 (en) * 2000-11-20 2005-02-01 The University Of Alabama System, method, and computer program product for managing access to and navigation through large-scale information spaces
CA2327211A1 (en) * 2000-12-01 2002-06-01 Nortel Networks Limited Management of log archival and reporting for data network security systems
AU2002220126A1 (en) 2000-12-05 2002-06-18 Clickfox, Llc Graphical user interface and evaluation tool for customizing web sites
AU2002230735A1 (en) * 2000-12-11 2002-06-24 Phlair, Inc. System and method for detecting and reporting online activity using real-time content-based network monitoring
US6654699B2 (en) * 2000-12-29 2003-11-25 Microsoft Corporation Computer network testing system and method using client playback of edited network information
US6564170B2 (en) * 2000-12-29 2003-05-13 Hewlett-Packard Development Company, L.P. Customizable user interfaces
US20020143925A1 (en) * 2000-12-29 2002-10-03 Ncr Corporation Identifying web-log data representing a single user session
US6651141B2 (en) 2000-12-29 2003-11-18 Intel Corporation System and method for populating cache servers with popular media contents
US7003565B2 (en) * 2001-04-03 2006-02-21 International Business Machines Corporation Clickstream data collection technique
WO2002084470A1 (en) * 2001-04-12 2002-10-24 Smartmoney Method and system for incorporating a value in a document
US6968341B2 (en) * 2001-05-25 2005-11-22 International Business Machines Corporation System and method for post-analyzing, and sequentially visualizing plurality of predefined metrics in a stored dynamic data values associated identifiers within determined time range
US20020188868A1 (en) * 2001-06-12 2002-12-12 Budka Kenneth C. Method for protecting use of resources in a network
US6763321B2 (en) * 2001-06-22 2004-07-13 Sun Microsystems, Inc. Method and apparatus to facilitate measurement of quality-of-service performance of a network server
US20030018584A1 (en) * 2001-07-23 2003-01-23 Cohen Jeremy Stein System and method for analyzing transaction data
US7278161B2 (en) 2001-10-01 2007-10-02 International Business Machines Corporation Protecting a data processing system from attack by a vandal who uses a vulnerability scanner
US20030105958A1 (en) * 2001-12-05 2003-06-05 International Business Machines Corporation Command script instrumentation for logging command execution and the protection of sensitive information
US20080027841A1 (en) * 2002-01-16 2008-01-31 Jeff Scott Eder System for integrating enterprise performance management
GB2385953A (en) * 2002-01-25 2003-09-03 Robert Andrew Hurst A web page reporting tool for reporting activity on a web page
US9167036B2 (en) 2002-02-14 2015-10-20 Level 3 Communications, Llc Managed object replication and delivery
US8280873B1 (en) * 2002-04-17 2012-10-02 Teradata Us, Inc. System for capturing a business context of a user's interaction with a website and method for the same
US7590724B1 (en) * 2002-04-29 2009-09-15 Williams Robert D Auto instrumentation system
US7970640B2 (en) * 2002-06-12 2011-06-28 Asset Trust, Inc. Purchasing optimization system
US6931357B2 (en) * 2002-07-18 2005-08-16 Computer Network Technology Corp. Computer network monitoring with test data analysis
US8271778B1 (en) 2002-07-24 2012-09-18 The Nielsen Company (Us), Llc System and method for monitoring secure data on a network
US7254784B2 (en) * 2002-09-11 2007-08-07 Peter H. Chang User-driven menu generation system with multiple submenus
US8381091B2 (en) * 2002-09-16 2013-02-19 International Business Machines Corporation Real-time method, system and program product for collecting web form data
US7853684B2 (en) * 2002-10-15 2010-12-14 Sas Institute Inc. System and method for processing web activity data
JP4098610B2 (ja) 2002-12-10 2008-06-11 株式会社日立製作所 アクセス中継装置
US7401057B2 (en) * 2002-12-10 2008-07-15 Asset Trust, Inc. Entity centric computer system
US7792827B2 (en) * 2002-12-31 2010-09-07 International Business Machines Corporation Temporal link analysis of linked entities
US7603373B2 (en) * 2003-03-04 2009-10-13 Omniture, Inc. Assigning value to elements contributing to business success
US7991732B2 (en) * 2005-06-03 2011-08-02 Adobe Systems Incorporated Incrementally adding segmentation criteria to a data set
US9081863B2 (en) * 2005-06-03 2015-07-14 Adobe Systems Incorporated One-click segmentation definition
US7320007B1 (en) 2003-12-12 2008-01-15 Peter Hon-You Chang Dynamic generation of target files from template files and tracking of the processing of target files
US8346803B2 (en) * 2003-12-12 2013-01-01 Knapp Investment Company Limited Dynamic generation of target files from template files and tracking of the processing of target files
US8782654B2 (en) 2004-03-13 2014-07-15 Adaptive Computing Enterprises, Inc. Co-allocating a reservation spanning different compute resources types
US7792954B2 (en) * 2004-04-02 2010-09-07 Webtrends, Inc. Systems and methods for tracking web activity
US20070266388A1 (en) 2004-06-18 2007-11-15 Cluster Resources, Inc. System and method for providing advanced reservations in a compute environment
US8176490B1 (en) 2004-08-20 2012-05-08 Adaptive Computing Enterprises, Inc. System and method of interfacing a workload manager and scheduler with an identity manager
US8583472B2 (en) * 2004-09-10 2013-11-12 Fmr Llc Measuring customer service levels
US7624176B2 (en) * 2004-10-14 2009-11-24 International Business Machines Corporation Method and system for programmatically generating synthetic transactions to monitor performance and availability of a web application
CA2586763C (en) 2004-11-08 2013-12-17 Cluster Resources, Inc. System and method of providing system jobs within a compute environment
US8863143B2 (en) 2006-03-16 2014-10-14 Adaptive Computing Enterprises, Inc. System and method for managing a hybrid compute environment
EP1866767B1 (de) 2005-03-16 2018-04-18 III Holdings 12, LLC Automatische übergabe von arbeitspensum an ein bedarfsdeckungszentrum
US9231886B2 (en) 2005-03-16 2016-01-05 Adaptive Computing Enterprises, Inc. Simple integration of an on-demand compute environment
US9015324B2 (en) 2005-03-16 2015-04-21 Adaptive Computing Enterprises, Inc. System and method of brokering cloud computing resources
US8713025B2 (en) 2005-03-31 2014-04-29 Square Halt Solutions, Limited Liability Company Complete context search system
US8782120B2 (en) 2005-04-07 2014-07-15 Adaptive Computing Enterprises, Inc. Elastic management of compute resources between a web server and an on-demand compute environment
EP3203374B1 (de) 2005-04-07 2021-11-24 III Holdings 12, LLC Zugang auf anfrage zu computerressourcen
US7941394B2 (en) 2005-06-03 2011-05-10 Adobe Systems Incorporated User interface providing summary information or a status pane in a web analytics tool
US9122715B2 (en) 2006-06-29 2015-09-01 International Business Machines Corporation Detecting changes in end-user transaction performance and availability caused by changes in transaction server configuration
US8869066B2 (en) 2006-07-06 2014-10-21 Addthis, Llc Generic content collection systems
US8056092B2 (en) 2006-09-29 2011-11-08 Clearspring Technologies, Inc. Method and apparatus for widget-container hosting and generation
US9009728B2 (en) 2007-03-06 2015-04-14 Addthis, Inc. Method and apparatus for widget and widget-container distribution control based on content rules
US20080222232A1 (en) * 2007-03-06 2008-09-11 Allen Stewart O Method and Apparatus for Widget and Widget-Container Platform Adaptation and Distribution
US8266274B2 (en) 2007-03-06 2012-09-11 Clearspring Technologies, Inc. Method and apparatus for data processing
US8166157B2 (en) * 2007-03-23 2012-04-24 Fmr Llc Enterprise application performance monitors
JP2008293299A (ja) * 2007-05-24 2008-12-04 Fuji Xerox Co Ltd 情報処理装置及び制御プログラム
US8990378B2 (en) * 2007-07-05 2015-03-24 Interwise Ltd. System and method for collection and analysis of server log files
US8041773B2 (en) 2007-09-24 2011-10-18 The Research Foundation Of State University Of New York Automatic clustering for self-organizing grids
US8209378B2 (en) 2007-10-04 2012-06-26 Clearspring Technologies, Inc. Methods and apparatus for widget sharing between content aggregation points
US7752308B2 (en) * 2007-10-30 2010-07-06 Hutchinson Kevin P System for measuring web traffic
US20090112976A1 (en) * 2007-10-29 2009-04-30 Hutchinson Kevin P Method for measuring web traffic
US20100281389A1 (en) * 2007-10-29 2010-11-04 Hutchinson Kevin P System for measuring web traffic
US7822850B1 (en) * 2008-01-11 2010-10-26 Cisco Technology, Inc. Analyzing log files
JP4521038B2 (ja) * 2008-02-07 2010-08-11 富士通株式会社 ストレージ装置、中継装置および動作状態制御方法
US9762692B2 (en) 2008-04-04 2017-09-12 Level 3 Communications, Llc Handling long-tail content in a content delivery network (CDN)
EP2274684A4 (de) 2008-04-04 2012-12-05 Level 3 Communications Llc Umgang mit long-tail-inhalt in einem inhaltsablieferungsnetzwerk (cdn)
US10924573B2 (en) 2008-04-04 2021-02-16 Level 3 Communications, Llc Handling long-tail content in a content delivery network (CDN)
US20090286550A1 (en) * 2008-05-15 2009-11-19 Brane Wolrd Ltd. Tempo Spatial Data Extraction From Network Connected Devices
US8935382B2 (en) * 2009-03-16 2015-01-13 Microsoft Corporation Flexible logging, such as for a web server
US9305105B2 (en) * 2009-05-26 2016-04-05 Google Inc. System and method for aggregating analytics data
US20100306363A1 (en) * 2009-05-26 2010-12-02 Erwien Saputra Determining completion of a web server download session at a database server
US8549019B2 (en) * 2009-05-26 2013-10-01 Google Inc. Dynamically generating aggregate tables
US8386498B2 (en) * 2009-08-05 2013-02-26 Loglogic, Inc. Message descriptions
US8751544B2 (en) * 2009-09-02 2014-06-10 Google Inc. Method and system for pivoting a multidimensional dataset
US8543591B2 (en) * 2009-09-02 2013-09-24 Google Inc. Method and system for generating and sharing dataset segmentation schemes
US20110119100A1 (en) * 2009-10-20 2011-05-19 Jan Matthias Ruhl Method and System for Displaying Anomalies in Time Series Data
US8583584B2 (en) 2009-10-20 2013-11-12 Google Inc. Method and system for using web analytics data for detecting anomalies
US10877695B2 (en) 2009-10-30 2020-12-29 Iii Holdings 2, Llc Memcached server functionality in a cluster of data processing nodes
US11720290B2 (en) 2009-10-30 2023-08-08 Iii Holdings 2, Llc Memcached server functionality in a cluster of data processing nodes
US20110209067A1 (en) * 2010-02-19 2011-08-25 Bogess Keandre System and Method for Website User Valuation
US20110225287A1 (en) * 2010-03-12 2011-09-15 Webtrends Inc. Method and system for distributed processing of web traffic analytics data
US20110225288A1 (en) * 2010-03-12 2011-09-15 Webtrends Inc. Method and system for efficient storage and retrieval of analytics data
US8549201B2 (en) 2010-06-30 2013-10-01 Intel Corporation Interrupt blocker
US8352444B1 (en) 2011-07-11 2013-01-08 Peter Hon-You Chang User-driven menu generation system with dynamic generation of target files with placeholders for persistent change or temporary security change over cloud computing virtual storage from template files
US8819224B2 (en) * 2011-07-28 2014-08-26 Bank Of America Corporation Health and welfare monitoring of network server operations
US9183200B1 (en) * 2012-08-02 2015-11-10 Symantec Corporation Scale up deduplication engine via efficient partitioning
US8793236B2 (en) 2012-11-01 2014-07-29 Adobe Systems Incorporated Method and apparatus using historical influence for success attribution in network site activity
CN110191416B (zh) * 2013-03-15 2022-04-15 美国结构数据有限公司 用于分析目标实体的移动的装置、系统和方法
US9185435B2 (en) 2013-06-25 2015-11-10 The Nielsen Company (Us), Llc Methods and apparatus to characterize households with media meter data
US9277265B2 (en) 2014-02-11 2016-03-01 The Nielsen Company (Us), Llc Methods and apparatus to calculate video-on-demand and dynamically inserted advertisement viewing probability
US10219039B2 (en) 2015-03-09 2019-02-26 The Nielsen Company (Us), Llc Methods and apparatus to assign viewers to media meter data
US9848224B2 (en) 2015-08-27 2017-12-19 The Nielsen Company(Us), Llc Methods and apparatus to estimate demographics of a household
US10140200B2 (en) * 2015-10-15 2018-11-27 King.Dom Ltd. Data analysis
US10791355B2 (en) 2016-12-20 2020-09-29 The Nielsen Company (Us), Llc Methods and apparatus to determine probabilistic media viewing metrics
US11275716B2 (en) 2020-05-26 2022-03-15 International Business Machines Corporation Cognitive disparate log association

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0822403A (ja) 1994-07-11 1996-01-23 Fujitsu Ltd 計算機システムの監視装置
US5706436A (en) * 1995-02-01 1998-01-06 Cabletron Systems, Inc. Apparatus and method for evaluation network traffic performance
US5729742A (en) * 1995-02-27 1998-03-17 International Business Machines Corporation System and method for enabling multiple computer systems to share a single sequential log
US5600632A (en) * 1995-03-22 1997-02-04 Bell Atlantic Network Services, Inc. Methods and apparatus for performance monitoring using synchronized network analyzers
US5675510A (en) 1995-06-07 1997-10-07 Pc Meter L.P. Computer use meter and analyzer
US5892917A (en) * 1995-09-27 1999-04-06 Microsoft Corporation System for log record and log expansion with inserted log records representing object request for specified object corresponding to cached object copies
US5898837A (en) * 1996-02-23 1999-04-27 Bay Networks, Inc. Method and apparatus for monitoring a dedicated communications medium in a switched data network
US5787253A (en) * 1996-05-28 1998-07-28 The Ag Group Apparatus and method of analyzing internet activity
US5727129A (en) 1996-06-04 1998-03-10 International Business Machines Corporation Network system for profiling and actively facilitating user activities
US5774660A (en) * 1996-08-05 1998-06-30 Resonate, Inc. World-wide-web server with delayed resource-binding for resource-based load balancing on a distributed resource multi-node network
WO1998011702A1 (en) * 1996-09-10 1998-03-19 Accrue Software, Inc. Apparatus and methods for capturing, analyzing and viewing live network information
US5870559A (en) * 1996-10-15 1999-02-09 Mercury Interactive Software system and associated methods for facilitating the analysis and management of web sites
US5796942A (en) * 1996-11-21 1998-08-18 Computer Associates International, Inc. Method and apparatus for automated network-wide surveillance and security breach intervention
US5913041A (en) * 1996-12-09 1999-06-15 Hewlett-Packard Company System for determining data transfer rates in accordance with log information relates to history of data transfer activities that independently stored in content servers
US5732218A (en) 1997-01-02 1998-03-24 Lucent Technologies Inc. Management-data-gathering system for gathering on clients and servers data regarding interactions between the servers, the clients, and users of the clients during real use of a network of clients and servers
US5968125A (en) * 1997-01-21 1999-10-19 Net. Roi Process for optimizing the effectiveness of a hypertext element
US6112238A (en) * 1997-02-14 2000-08-29 Webtrends Corporation System and method for analyzing remote traffic data in a distributed computing environment
US6023744A (en) * 1997-03-07 2000-02-08 Microsoft Corporation Method and mechanism for freeing disk space in a file system
US5796952A (en) * 1997-03-21 1998-08-18 Dot Com Development, Inc. Method and apparatus for tracking client interaction with a network resource and creating client profiles and resource database
US5878223A (en) 1997-05-07 1999-03-02 International Business Machines Corporation System and method for predictive caching of information pages
US6055572A (en) * 1998-01-20 2000-04-25 Netscape Communications Corporation System and method for creating pathfiles for use to predict patterns of web surfaces
US6098079A (en) * 1998-04-02 2000-08-01 Mitsubishi Electric Information Technology Center America, Inc. (Ita) File version reconciliation using hash codes
US6175838B1 (en) * 1998-04-29 2001-01-16 Ncr Corporation Method and apparatus for forming page map to present internet data meaningful to management and business operation

Also Published As

Publication number Publication date
AU2004201868A1 (en) 2004-05-27
AU769816B2 (en) 2004-02-05
DE69937249D1 (de) 2007-11-15
DK1131725T3 (da) 2008-02-04
EP1131725A1 (de) 2001-09-12
ATE374970T1 (de) 2007-10-15
AU5556899A (en) 2000-03-06
ES2296403T3 (es) 2008-04-16
WO2000010093A1 (en) 2000-02-24
AU2004201868B2 (en) 2007-04-05
EP1131725A4 (de) 2005-06-15
CA2340109A1 (en) 2000-02-24
EP1131725B1 (de) 2007-10-03
US6317787B1 (en) 2001-11-13
CA2340109C (en) 2003-04-22

Similar Documents

Publication Publication Date Title
DE69937249T2 (de) System und verfahren zur analyse eines webserver-logbuchs
DE69838751T2 (de) System und verfahren zur analyse von entfernten verkehrsdaten in einer verteilten rechnerumgebung
DE60114999T2 (de) Überwachung von und interaktion mit netzwerkdiensten
EP1097428B1 (de) System und verfahren zum prüfen von netzwerk-anwendungen
DE69923435T2 (de) System und verfahren zur optimierung der leistungskontrolle von komplexen informationstechnologiesystemen
DE69712678T3 (de) Verfahren zur Echtzeitüberwachung eines Rechnersystems zu seiner Verwaltung und Hilfe zu seiner Wartung während seiner Betriebsbereitschaft
DE69909839T3 (de) Optimierte Lokalisierung von Netzwerkbetriebsmittel
DE69911681T2 (de) Verfahren zum Verfolgen von Konfigurationsänderungen in Netzwerken von Rechnersystemen durch historische Überwachung des Konfigurationsstatus der Vorrichtungen im Netzwerk
DE10051024B4 (de) Verfahren zum intermediären Cachen in einem Client-Server-Softwaresystem, Computerprogrammprodukte und Computersystem zur Durchführung eines solchen Verfahrens
DE10051021B4 (de) System, Verfahren und Computerprogramm zur Bereitstellung interaktiver Web-Inhalte in statisch verknüpften Dateien
DE102006037291A1 (de) Verfahren und Systeme für den Zugriff auf Prozesssteuerungsprotokollinformationen in Verbindung mit Prozesssteuerungssystemen
DE10135136A1 (de) Sichere Datenberichtausbildung und -zustellung
DE102013201973A1 (de) Verteilte Anwendung mit Vorwegnahme von Server-Antworten
DE10132038A1 (de) Automatisierungssystem und Verfahren zur Anlagenvisualisierung
DE102006027664B4 (de) Kommunikationssystem zum Verarbeiten von Daten
DE10393809B4 (de) Computer-implementiertes Verfahren zum Verarbeiten von Information, die zwischen einem Client und einem Server ausgetauscht wird
DE10208959B4 (de) Verfahren und Vorrichtung zur Erfassung und Auswertung von in einem Rechnernetzwerk abgelegten Informationen
DE10134093C2 (de) Verfahren und Anordnung zum Entfernen von Verbindungen aus einem Netzwerk mit Knoten und Verbindungen
WO2004021188A2 (de) Verfahren zum testen von browser-adaptierenden server-applikationen
DE10145176C2 (de) Verfahren zur Klickpfad-Rekonstruktion sowie Verfahren zur Bestimmung eines Gangunterschieds
DE10313420A1 (de) Recherchensystem und Verfahren zur Ermittlung von Informationen aus einer Datenbank, insbesondere aus dem World-Wide-Web
EP1170676A1 (de) Darstellung einer Informationsstruktur von Dokumenten des Word Wide Web
DE10142024A1 (de) Kompressionsverfahren
DE10319427A1 (de) Verfahren zur Erstellung von für Datensätze aus einer Datenbank, insbesondere aus dem World-Wide-Web, charakteristischen Kurzdatensätzen, Verfahren zur Ermittlung von für eine vorgebbare Suchanfrage relevanten Datensätzen aus einer Datenbank und Suchsystem zur Durchführung des Verfahrens
AT500417A2 (de) Verfahren und rechnereinrichtung zum bewerten von zugriffen auf eine webseite

Legal Events

Date Code Title Description
8364 No opposition during term of opposition