DE69937249T2 - System und verfahren zur analyse eines webserver-logbuchs - Google Patents
System und verfahren zur analyse eines webserver-logbuchs Download PDFInfo
- Publication number
- DE69937249T2 DE69937249T2 DE69937249T DE69937249T DE69937249T2 DE 69937249 T2 DE69937249 T2 DE 69937249T2 DE 69937249 T DE69937249 T DE 69937249T DE 69937249 T DE69937249 T DE 69937249T DE 69937249 T2 DE69937249 T2 DE 69937249T2
- Authority
- DE
- Germany
- Prior art keywords
- data
- hits
- hit
- server
- log file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3476—Data logging
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/10015—Access to distributed or replicated servers, e.g. using brokers
Description
- HINTERGRUND DER ERFINDUNG
- Diese Erfindung bezieht sich allgemein auf eine Webserver-Verkehrsdatenanalyse und insbesondere auf ein System und ein Verfahren zur Analyse von Webserver-Protokolldateien.
- Das weltumspannende Datennetz (nachstehend "Web") wird schnell zu einem der wichtigsten heutzutage verwendeten Veröffentlichungsmedien. Der Grund hierfür ist einfach: Webserver, die über das Internet miteinander verbunden sind, bieten Zugang zu einem potenziell weltweiten Publikum, und dies mit einer minimalen Investition in Zeit und Betriebsmittel beim Erstellen einer Website. Der Webserver gestattet die Erfassung und Entsendung eines weiten Bereichs von Medien in einer Vielfalt von Formaten, einschließlich Audio- und Videobotschaften sowie herkömmlichen Text und Grafiken. Und die Leichtigkeit der Erstellung einer Website schafft einen Zugang zu diesem weltweiten Publikum für wirklich alle Arten von Benutzern, von Vereinigungen über Gründerunterstützungsgesellschaften bis hin zu Organisationen und Einzelpersonen.
- Im Gegensatz zu anderen Medienarten ist eine Website interaktiv und der Webserver kann passiv Zugriffsinformationen über jeden Benutzer sammeln, indem er die Verkehrsdatenpakete beobachtet und protokolliert, die zwischen dem Webserver und dem Benutzer ausgetauscht werden. Wichtige Angaben über die Benutzer können direkt oder durch Schlussfolgerung bestimmt werden, indem man die Verkehrsdaten und den Kontext des "Treffers" analysiert. Außerdem können aus über einen bestimmten Zeitraum gesammelten Verkehrsdaten statistische Informationen gewonnen werden, wie etwa die Anzahl von Benutzern, die die Seite täglich benutzen, aus welchen Ländern, Staaten oder Städten sich die Benutzer einklinken, und den aktivsten Tag oder die aktivste Stunde der Woche. Solche statistischen Informationen sind nützlich bei der zielgerichteten Erstellung von Marketing- oder Betriebsplanungsstrategien, um auf die sich ergebenden Bedürfnisse des Publikums besser abstellen zu können. Jeder Treffer wird auch mit Datum und Zeit des Zugriffs codiert. Weil von den interessierenden statistischen Informationen nahezu alle mit Zeitspannen in Bezug stehen, ist die genaue Bestimmung des Zeitpunkts jedes Treffers entscheidend.
- Um den Einsatz dieser statistischen Informationen zu optimieren, muss die Webserver-Verkehrsanalyse zeitgenau erfolgen. Es ist für einen Webserver jedoch nicht ungewöhnlich, Tausende von Benutzern täglich zu bewältigen. Die sich ergebenden Zugriffsinformationen, die vom Webserver aufgezeichnet werden, belaufen sich auf Megabytes von Verkehrsdaten. Einige Webserver erzeugen tägliche Verkehrsdaten in Gigabyte-Größe. Die Analyse der Verkehrsdaten für nur einen einzigen Tag, um Trends auszumachen oder Statistiken zu erzeugen, ist von der Rechnerleistung her gesehen aufwendig und zeitraubend. Außerdem nimmt die Verarbeitungszeit, die zur Analyse der Verkehrsdaten für mehrere Tage, Wochen oder Monate benötigt wird, mit einer Ausweitung des interessierenden Zeitrahmens linear zu.
- Das Problem der Durchführung einer effizienten und zeitgenauen Verkehrsanalyse ist nicht auf Webserver beschränkt. Vielmehr ist eine Verkehrsdatenanalyse immer dann möglich, wenn Verkehrsdaten beobachtet und in gleichförmiger Art und Weise aufgezeichnet werden können, wie z. B. in einer verteilten Datenbank, einem Client-Server-System oder in einer anderen Umgebung mit Fernzugriff.
- Ein Verfahren und eine Vorrichtung zur Leistungsüberwachung unter Verwendung von synchronisierten Netzwerkanalysatoren sind im
US-Patent Nr. 5,600,632 beschrieben, das am 4. Feb. 1997 auf den Namen von Schulman erteilt wurde. Gemäß dieser Druckschrift werden eine Vielzahl von Netzwerkanalysatoren vornehmlich zu einem Netzwerkleistungs-Analysewerkzeug zusammengefasst, um komplexe und weit verzweigte Netzwerke zu analysieren, wobei jeder der Analysatoren mit den anderen synchronisiert ist, um eine Konsistenz bei den das Netzwerk durchlaufenden Paketen bereitzustellen. - Einige Webserver sind so beschäftigt, d. h. bewältigen so viel Verkehr, dass sie mehrere Server benötigen, um den gesamten Verkehr abwickeln zu können. Bei anderen Benutzern kann es wiederum so sein, dass sie wegen des großen Umfangs der Website mehrere Server verwenden müssen. Websites von entscheidender Bedeutung, d. h. solche, die nicht wegen eines Problems mit einem Server ausfallen dürfen, werden möglicherweise auch auf mehreren Servern erstellt. Solche mehreren Ser ver werden manchmal als Server-Farm bezeichnet. Server-Farmen bieten einen mit einer hohen Bandbreite ausgestatteten, zuverlässigen Zugriff auf Websites.
- Es gibt mehrere Technologien, die in einer Server-Farm verwendet werden können, wobei aber die wichtigsten die Farm in Servergruppen unterteilen. Die Website ist auf jedem Server in der Gruppe noch einmal gespiegelt vorhanden. Eine spezielle Hardware empfängt den gesamten zur Website laufenden Verkehr und verteilt jeden Treffer auf einen der Server. Einige Systeme bieten einen genauen Ausgleich der Arbeitsbelastung dahingehend, dass alle Treffer aufeinanderfolgend auf die einzelnen Server im Rotationsverfahren verteilt werden. Andere wiederum teilen jeden Treffer von einem neuen Ausgangsort einem Server zu, und ein weiterer Zugriff auf die Website von diesem Ausgangsort wird dem zugeteilten Server zugewiesen. Dies erfolgt unter Festsetzung einer vorbestimmten Zeitspanne, zum Beispiel 30 Minuten, während der alle nachfolgenden Zugriffe vom selben Ausgangsort so angesehen werden, dass sie Teil ein und derselben Sitzung sind, die an diesem Ausgangsort stattfindet. Wie nachstehend weiter ausgeführt werden wird, gestattet der letztgenannte Lösungsansatz eine gewisse Protokolldatei-Analyse, was unter Verwendung des Auslastungsausgleichsverfahrens nicht möglich ist.
- Obwohl sie einen Auslastungsausgleich und Redundanz bieten, stellen sich bei Server-Farmen Probleme bei der Analyse der von den Servern generierten Protokolldateien. Systeme aus dem Stand der Technik zur Analyse von Webserver-Protokolldateien können viele Protokolldateien bewältigen, aber diese Dateien werden aufeinanderfolgend generiert, d. h. die Datenpakete in jeder Protokolldatei liegen in chronologischer Reihenfolge vor und die Protokolldateien selbst entsprechen Zeitspannen, die Datenpakete aus innerhalb dieser Zeitspannen enthalten. Anders ausgedrückt werden auch die Protokolldateien aufeinanderfolgend generiert. Protokolldateien auf Servern in einer Server-Farm werden jedoch gleichzeitig generiert. Jede Protokolldatei überdeckt oder überlappt dieselbe Zeitspanne. In Server-Farmen, die die Treffer unter den Servern nach dem Rotationsprinzip verteilen, erzeugen Protokolldatei-Analyseprogramme keine nutzbaren Informationen. Es sind Lösungen möglich, die sich auf massiven Aufwand stützen, wie etwa das Sortieren aller Protokolldateien und das Erzeugen einer neuen, einzigen Datei, oder das Ko pieren aller Treffer von jeder Protokolldatei in eine große Datenbank, die die Daten sortieren und analysieren kann. Diese Lösungen haben schwere Nachteile: Sie bedeuten einen hohen Rechneraufwand, benötigen die Erzeugung von großen neuen Dateien, und funktionieren nur, wenn die Protokolldateien fertiggestellt sind, d. h. nicht während der Übertragung, wenn in der Protokolldatei noch Datenverkehr besteht.
- Server-Farmen, die Treffer von einem neuen Ausgangsort einem einzelnen Benutzer zuweisen, können Protokolldatei-Analyseprogramme aus dem Stand der Technik auf jedem Server laufen lassen und die Ergebnisse aufsummieren. Dies ist jedoch nicht hundertprozentig genau und deshalb von Nachteil, weil es die Erzeugung von separaten Protokollen bedingt, auf die dann zugegriffen oder die weiterbearbeitet werden müssen, um Informationen zu erlangen, die sich auf die gesamte Server-Farm beziehen.
- Infolgedessen besteht ein Bedarf an einem System und einem Verfahren zur Analyse von Webserver-Protokolldateien, die gleichzeitig generiert werden, wie etwa diejenigen, die von einer Server-Farm generiert werden.
- Es besteht ein weiterer Bedarf an solch einem System und Verfahren, mit dem sich die Protokolldateien im Wesentlichen in Echtzeit analysieren lassen.
- Es besteht ein weiterer Bedarf an einem solchen System, das die Protokolldateien analysieren kann, ohne neue, große Dateien zu erzeugen und ohne die Notwendigkeit nach beträchtlicher, zusätzlicher Rechnerleistung.
- Es besteht auch Bedarf an einem solchen System, das Protokolldateien analysieren kann, seien sie nun gleichzeitig oder zeitlich aufeinanderfolgend generiert.
- ZUSAMMENFASSUNG DER ERFINDUNG
- Die vorliegende Erfindung umfasst ein Verfahren zum Analysieren von Protokolldateien, die eine Vielzahl von Datenpaketen enthalten, in einer Abfolge, die umfasst: (a) Auswählen des ersten Datenpakets in jeder Protokolldatei; (b) Vergleichen der ausgewählten Datenpakete; (c) Weiterreichen des ältesten der ausgewählten Datenpakete an einen Protokolldatei-Analysator; (d) Auswählen des nächsten Datenpakets in der Protokolldatei, in der das weitergereichte Datenpaket ausgewählt wurde; und (e) Wiederholen der Schritte (b) bis (d), bis alle Datenpakete in den Protokolldateien weitergereicht sind.
- Die vorgenannten sowie weitere Merkmale und Vorteile der Erfindung ergeben sich deutlich aus der folgenden ausführlichen Beschreibung einer bevorzugten Ausführungsform der Erfindung, die mit Bezug auf die begleitenden Zeichnungen erfolgt.
- KURZE BESCHREIBUNG DER ZEICHNUNGEN
-
1 ist ein Funktionsblockschaubild eines Systems aus dem Stand der Technik zum Analysieren von Verkehrsdaten in einer Umgebung mit verteilten Computern gemäß der vorliegenden Erfindung. -
2 ist ein Flussdiagramm eines Verfahrens aus dem Stand der Technik zum Analysieren von Verkehrsdaten in einer Umgebung mit verteilten Computern gemäß der vorliegenden Erfindung unter Verwendung des Systems von1 . -
3A zeigt ein Format aus dem Stand der Technik, das beim Speichern eines "Treffers" von Verkehrsdaten verwendet wird, die vom Server von1 empfangen werden. -
3B zeigt beispielhaft einen "Treffer" aus formatierten Verkehrsdaten, die vom Server von1 empfangen werden. -
4 ist eine schematische Abbildung einer Server-Farm, die mehrere Server wie diejenigen umfasst, die in1 gezeigt und beschrieben sind. -
5 ist eine schematische Abbildung, in der der Betrieb der Server-Farm von4 dargestellt ist. -
6 ist eine schematische Abbildung, in welcher die vorliegende Erfindung dargestellt ist, die in der Server-Farm von4 verwendet wird. -
7 ist eine6 ähnliche schematische Abbildung, die aber die vorliegende Erfindung darstellt, wie sie an zeitlich aufeinanderfolgenden Protokolldateien arbeitet. -
8 ist ein Flussdiagramm eines Programms zur Umsetzung der vorliegenden Erfindung. - AUSFÜHRLICHE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORM
-
1 ist ein Funktionsblockschaubild eines Systems aus dem Stand der Technik zum Analysieren von Verkehrsdaten in einer Umgebung9 mit verteilten Computern. Es ist ausführlicher in "WebTrends Installation and User Guide", Version 2.2, Oktober 1996, und imUS-Patent mit der Anmeldenr. 08/801,707 - Ein Server
10 bietet fernab befindlichen Benutzern Websites und damit zusammenhängende Dienste. Die fernab befindlichen Benutzer können auf den Server10 zum Beispiel von einem fernab befindlichen Computersystem12 aus zugreifen, das mit dem Server10 über eine Netzverbindung13 wie etwa das Internet oder ein Intranet, eine Einwahlverbindung14 (Punkt-zu-Punkt-Verbindung) oder eine direkte (zweckgebundene) Verbindung17 verbunden ist. Andere Arten von Verbindungen mit Fernzugriff sind auch möglich. - Jeder von einem fernab befindlichen Benutzer erfolgende Zugriff auf den Server
10 ergibt einen "Treffer" aus Verkehrsrohdaten11 . Nachstehend sind mit Bezug auf3A und3B das beim Abspeichern jedes Verkehrsdatentreffers11 verwendete Format bzw. ein Beispiel für einen Verkehrsdatentreffer11 beschrieben. Der Server10 speichert jeden Verkehrsdatentreffer11 vorzugsweise in einer Protokolldatei15 , obwohl auch eine Datenbank16 oder eine andere Speicherstruktur verwendet werden kann. - Zum Analysieren der Verkehrsdaten untersucht der Server
10 jeden Verkehrsdatentreffer11 und speichert die aus den Verkehrsdaten erhaltenen Zugriffsinformationen als Analyseergebnisse18A –C ab. Fünf Pools der Verkehrsdaten11 (fernab befindliches System12 , Einwahlverbindung14 , Protokolldatei15 , Datenbank16 und direkte Verbindung17 ) sind gezeigt. Auch andere Pools oder Ausgangsorte sind möglich. Die Verkehrsdatentreffer11 können von irgendeinem einzelnen Pool oder von einer Kombination dieser Pools stammen. Während der Server10 Verkehrsdatentreffer11 kontinuierlich empfängt, werden für jede einzelne Protokollierungszeitspanne, die Zeitschlitz genannt wird, separate Gruppen von Analyseergebnissen18A –C gespeichert. Die Analyseergebnisse18A –C wer den verwendet, um Übersichten bzw. Zusammenstellungen19A –C der Zugriffsinformationen zu erzeugen. - In der beschriebenen Ausführungsform ist der Server
10 typischerweise ein von Intel stammendes, auf Pentiumtechnologie beruhendes Computersystem, das mit einem Prozessor, einem Speicher, einer Eingangs-/Ausgangsschnittstelle, einer Netzschnittstelle, einer sekundären Speichervorrichtung und einer Benutzerschnittstelle vorzugsweise in Form einer Tastatur und eines Monitors ausgestattet. Der Server10 arbeitet typischerweise unter der Steuerung der Betriebssysteme Microsoft Windows NT oder Unix und betreibt entweder eine von Microsoft stammende Internet-Informationsserversoftware oder eine von NetScape stammende Datenübertragungs-Serversoftware. Pentium, Microsoft, Windows, Windows NT, Unix, Netscape und Netscape Communications Server sind Marken ihrer jeweiligen Inhaber. Es sind jedoch auch andere Konfigurationen in Bezug auf den Server10 möglich, die sich bezüglich der Hardware unterscheiden, wie etwa DOS-kompatible Plattformen, Apple Macintosh, Sun-Arbeitsplatzrechner und auch andere Plattformen, die sich hinsichtlich ihrer verschiedenen Betriebssysteme unterscheiden, wie etwa MS-DOS, Unix und andere, oder sich auch in der Web-Software unterscheiden. Apple, Macintosh, Sun und MS-DOS sind Marken ihrer jeweiligen Inhaber. -
2 zeigt ein Flussdiagramm eines Verfahrens20 zum Analysieren von Verkehrsdaten in einer Umgebung mit verteilten Computern gemäß der vorliegenden Erfindung unter Verwendung des Systems von1 . Sein Zweck besteht darin, kontinuierlich Zugriffsinformationen aus Verkehrsdatentreffern11 zu sammeln und zusammenzufassen, während gleichzeitig auf Verlangen hin Ad-hoc-Analysen ermöglicht sind. Das Verfahren20 besteht aus zwei Programmen. Zugriffsinformationen werden aus Verkehrsdatentreffern11 gesammelt und vom Server10 zu Analyseergebnissen18A –C (Block21 ) zusammengefasst. Die Zugriffsinformationen werden separat analysiert, um die Übersichten19A –C zu erzeugen, die Trends, Statistiken und weitere Informationen angeben (Block22 ). Das Sammeln und Zusammenfassen der Zugriffsinformationen (Block21 ) wird vom Server10 kontinuierlich ausgeführt, während die Analyse der Zugriffsinformationen (Block22 ) auf einer Ad-hoc-Basis ausgeführt wird, und zwar entweder vom Server10 oder einem separaten Arbeitsplatzrechner (nicht gezeigt). - Das Verfahren
20 ist vorzugsweise in Form eines Computerprogramms realisiert, das vom Server10 ausgeführt wird und in einem Speichermedium enthalten ist, welches eine computerlesbare Programmsprache umfasst. In der beschriebenen Ausführungsform ist das Verfahren20 in der Programmiersprache C geschrieben, obwohl andere Programmiersprachen gleichermaßen geeignet sind. Es arbeitet in einer Microsoft-Windows-Umgebung und kann allgemein gebräuchliche Protokolldateiformate, kombinierte Protokolldateiformate und benutzerspezifische Protokolldateiformate von Webservern nach Industriestandard analysieren, wie etwa diejenigen, die von NetScape, NCSA, O'Reilly WebSite, Quarterdeck, C-Builder, Microsoft, Oracle, EMWAC und anderen Windows 3.x, Windows NT 95, Unix und Macintosh-Webservern lizenziert sind. Die Ahalyseergebnisse18A –C können in einer benutzerspezifischen oder standardmäßigen Datenbank16 (in1 gezeigt) gespeichert werden, wie z. B. SQL, BTRIEVE, ORACLE, INFORMIX und andere. Das Verfahren20 nutzt die Analyseergebnisse18A –C der Verkehrsdatentreffer11 , wie sie in der Protokolldatei15 oder Datenbank16 gesammelt sind, zur Erstellung von Aktivitätsübersichten, geografischen Übersichten, demografischen Übersichten sowie anderen Übersichten19A –C, wie sie z. B. nachstehend in der Tabelle 1 aufgeführt sind. Andere Übersichten19A –C sind auch möglich. Tabelle 1Benutzerprofil nach Regionen Tabelle mit allgemeinen Angaben Am häufigsten aufgerufene Seiten Am wenigsten aufgerufene Seiten Beliebteste Startseiten Beliebteste Abbruchseiten Einzelzugriffsseiten Am meisten benutzte Pfade durch die Seite Werbeeinblendungen Anklickvorgänge Werbeeinblendun gen Werbeeinblendungen und -klicks Am häufigsten heruntergeladene Dateien Aktivste Organisationen Aktivste Länder Aktivitätsübersicht nach Wochentag Aktivitätsübersicht nach Tag Aktivitätsübersicht nach Stunde des Aktivitätsübersichtsgrad nach Stun Tages den des Tages Webserverstatistiken und -analysen Clientseitige Fehler Am häufigsten heruntergeladene Serverseitige Fehler Dateitypen und -größen Aktivität nach Organisationsart Verzeichnisse mit dem häufigsten Zugriff Websites mit den häufigsten Ver- URLs mit den häufigsten Verweisen weisen Am häufigsten verwendete Browser Netscape-Browser Microsoft-Explorer-Browser Besuchende Suchmaschinen Beliebteste Plattformen - Darüber hinaus können die Analyseergebnisse
18A –C dazu verwendet werden, automatisch Berichte und Übersichten zu erstellen, die statistische Informationen und Grafiken beinhalten, die beispielsweise die Benutzeraktivität aufgeteilt nach Markt, den Grad des Interesses an spezifischen Webseiten oder Webdiensten, welche Produkte am beliebtesten sind, ob ein Besucher eine lokale, nationale oder internationale Herkunft hat, und ähnliche Informationen zeigen. In der beschriebenen Ausführungsform können die Übersichten19A –C als Protokollierungen in einer Vielzahl von Formaten erzeugt werden. Diese Formate umfassen HTML-Dateien, die mit dem Großteil gebräuchlicher Webbrowser kompatibel sind, benutzerspezifische Dateiformate zur Verwendung in Verbindung mit Textverarbeitung, Tabellenkalkulationsprogrammen, Datenbank- und anderen Programmen wie etwa Microsoft Word, Microsoft Excel, ASCII-Dateien und verschiedene andere Formate. Word und Excel sind Marken von Microsoft Corporation, Redmond, Washington. -
3A zeigt ein Format, das beim Abspeichern eines "Treffers" von Verkehrsrohdaten11 verwendet wird, die vom Server von1 empfangen werden. Ein ursprünglicher Verkehrsdatentreffer11 liegt nicht in dem in3A gezeigten Format vor. Vielmehr ist der Inhalt jedes Felds im Format bestimmt durch die Datenpakete, die zwischen dem Server10 und dem Ausgangsort des Verkehrsdatentreffers11 ausgetauscht werden, und die aus den Datenpaketen herausgezogenen Informationen werden in einem Datensatz unter Verwendung des Formats von3A gespeichert, bevor sie in der Protokolldatei15 (in1 gezeigt) abgespeichert oder verarbeitet werden. - Jeder Verkehrsdatentreffer
11 ist eine formatierte Aneinanderreihung aus ASCII-Daten. Das Format beruht auf dem standardmäßigen Protokolldateiformat, das von der National Computer Security Association (NCSA) entwickelt wurde, einem Standardprotokollformat, das von den meisten Webservern verwendet wird. Das Format besteht aus sieben Feldern wie folgt:Feldbezeichnung Beschreibung Benutzeradresse ( 30 ):Internetprotokolladresse (IP-Adresse) oder Domain-Name des Benutzers, der auf die Seite zugreift. RFC931 ( 31 ):Nicht benutztes, üblicherweise leer gelassenes Feld, aber von vielen Webservern verstärkt dazu verwen det, um den Host-Domain-Namen für an mehreren Orten sitzende Proto kolldateien abzuspeichern. Benutzerauthentifizierung ( 32 ):Tauscht ggf. den Benutzernamen aus für einen Zugriff auf die Website. Datum/Zeit ( 33 ):Datum und Zeit des Zugriffs und Zeitabstand gegenüber GMT (mittlere Greenwich-Zeit). Abruf ( 34 ):Entweder HOLE-Befehl (ein Seitenab ruf) oder ein ENTSENDE-Befehl (For mularvorlage). Rücklaufcode ( 35 ):Rücklaufstatus der Anfrage, der ge nau angibt, ob die Übertragung er folgreich war. Übertragungsgröße ( 36 ):Anzahl von Bytes, die für den Datei abruf übermittelt wurden, d. h. Datei größe. - Zusätzlich können drei optionale Felder wie folgt verwendet werden:
Feldbezeichnung Beschreibung Verweisseite ( 37 ):URL, die zum Erhalt der Website- Information verwendet wurde, um den "Treffer" auszuführen. Agent ( 38 ):Browserversion, einschließlich Fabri kat, Modell oder Versionsnummer und Betriebssystem Cookie ( 39 ):Eindeutige Kennzeichnung, die tole rierend verwendet wird, um einen bestimmten Benutzer zu kenn zeichnen. - Andere Formate für die Verkehrsdatentreffer
11 sind auch möglich, einschließlich benutzerspezifische Formate, die zusätzliche Felder enthalten, wie zum Beispiel die Zeit der Übertragung, die Art des Servicevorgangs sowie andere. Außerdem treten immer wieder Modifikationen und Zusätze zu den Formaten der noch unverarbeiteten Verkehrsdatentreffer11 auf, und die von der vorliegenden Erfindung geforderten Er weiterungen, um mit solchen Variationen der Formate umzugehen, sind dem Fachmann bekannt. -
3B zeigt beispielhaft einen "Treffer" aus Verkehrsrohdaten, die vom Server von1 empfangen wurden. Das Feld Benutzeradresse30 lautet "tarpon.gulf.net", was anzeigt, dass der Benutzer aus einer Domain mit der Bezeichnung "gulf.net" stammt, die auf einem Rechner mit dem Namen "tarpon" sitzt. Die Felder RFC93131 und Benutzerauthentifizierung32 sind "-", was Leereinträge anzeigt. Das Feld Datum/Zeit33 lautet "12/Jan/1996:20:38:17 + 0000", das einen Zugriff am 12. Januar 1996 um 8:38 Uhr und 17 Sekunden nach mittlerer Greenwich-Zeit anzeigt. Das Feld Anfrage34 lautet "GET/general.htm HTTP/1.0", was angibt, dass der Benutzer die Seite "general.htm" angefordert hat. Die Felder Rücklaufcode35 und Übertragungsgröße36 lauten auf 200 bzw. 3599, was eine erfolgreiche Übertragung von 3599 Bytes anzeigt. - Mit Bezug auf
4 ist bei40 allgemein eine Server-Farm angegeben, die gemäß der vorliegenden Erfindung aufgebaut ist. Darin enthalten sind zwei Servergruppen42 ,44 , von denen eine die Server46 ,48 ,50 und die andere die Server50 ,52 ,54 enthält. Jeder der Server in den Gruppen42 ,44 ist im Wesentlichen identisch zum Server10 von1 . In der vorliegenden Ausführungsform beinhaltet die Servergruppe42 eine erste Website, die auf jedem der darin befindlichen Server gespiegelt vorhanden ist, mit einer einzigen bezeichneten Internetprotokolladresse (IP-Adresse). Die Server in der Gruppe44 beinhalten eine zweite Website, die auf jedem der darin befindlichen Server gespiegelt vorhanden ist, mit einer zweiten genau bezeichneten IP-Adresse. - Jeder der Server in den Gruppen
42 ,44 ist über ein Kabel wie z. B. das Kabel58 mit einer Umlenkeinrichtung60 verbunden. Die Umlenkeinrichtung wiederum erhält einen Eingang von einem Netzwerkanschluss62 , bei dem es sich in der vorliegenden Ausführungsform um eine Internetverbindung handelt. Die Umlenkeinrichtung60 ist eine Hardwarevorrichtung aus dem Stand der Technik, die einen Pool aus Verkehrsdatentreffern erhält – im vorliegenden Fall über die Verbindung62 – und sie auf die Server in den Gruppen42 ,44 verteilt. - In der vorliegenden technischen Realisierung verteilt die Umlenkeinrichtung
60 Verkehrsdatentreffer innerhalb jeder der Gruppen42 ,44 . Mit anderen Worten werden die Verkehrsdatentreffer, die als Ergebnis des Zugriffs auf die Website erzeugt wurden, die in der Gruppe42 bereitgehalten wird, unter den Servern46 ,48 ,50 verteilt. In entsprechender Weise werden Verkehrsdatentreffer, die durch Zugriff auf die Website in der Gruppe44 erzeugt wurden, unter den Servern52 ,54 ,56 verteilt. Ein Gerät, das sich für die Funktion als Umlenkeinrichtung eignet, wird von Cisco Systems hergestellt und unter dem Namen LocalDirector vertrieben. Fachleuten wird klar sein, dass auch andere bekannte Hardwareeinrichtungen die Funktion der Umlenkeinrichtung60 ausführen können. - Nun sind mit Bezug auf
5 Protokolldateien46A ,48B ,50C jeweils auf dem Server gespeichert, der der Bezugszahl entspricht, die zur Angabe der Protokolldatei verwendet wird. Diese Protokolldateien werden in der vorstehend in Verbindung mit dem Server von1 beschriebenen Art und Weise erzeugt und abgespeichert. In5 sind die Treffer der Reihe nach durchnummeriert, und zwar Treffer Nummer 1 bis Treffer Nummer 13 in der chronologischen Reihenfolge, in der jeder Verkehrsdatentreffer generiert wurde. In der Abbildung von5 kommen zu jeder der Protokolldateien46A ,48B ,50C immer noch Daten hinzu. Das heißt, dass zum Beispiel in der Protokolldatei46A Treffer Nummer 1 der zuerst abgespeicherte Datentreffer ist, und Treffer Nummer 5 ist der als Nächstes abgespeicherte Datentreffer, wobei die Treffer Nummer 6 und 12 nachfolgend in Folge abgespeichert werden. Weil die Protokolldatei46A noch nicht voll ist und geöffnet bleibt, können nach dem Treffer Nummer 12 zusätzliche Treffer in Folge abgespeichert werden. Dasselbe gilt für die Protokolldateien48B ,50C . - Mit Bezug auf
6 ist hier eine Sortiereinrichtung64 mit eingeschlossen, die die Treffer in jeder der Protokolldateien in Folge überprüft und sie – in der chronologischen Reihenfolge, in der jeder Treffer generiert wurde – an einen Protokolldatei-Analysator56 weiterleitet. Der Protokolldatei-Analysator arbeitet allgemein, wie in Verbindung mit dem in1 gezeigten Server beschrieben wurde. Danach werden Ergebnisse der Analyse zu den Analyseergebnissen18A –C weitergereicht, wie dies auch in Verbindung mit1 beschrieben ist. - Die Betriebsweise der Sortiereinrichtung
64 lässt sich am besten mit Bezug auf die folgende Tabelle 2 und auf das in8 abgebildete Flussdiagramm verstehen. Tabelle 2Vergleichen Weiterreichungen 1 2 4 1 5 2 4 2 5 3 4 3 5 8 4 4 5 8 7 5 6 8 7 6 12 8 7 7 12 8 9 8 12 10 9 9 12 10 11 10 - - - - - - - Zuerst wird im Block
68 von8 der erste in jeder Protokolldatei46A ,486 ,50C empfangene Eintrag ausgewählt. Diese Auswahl ist in Tabelle 2, Zeile 1 abgebildet, in der die Treffer 1, 2 und 4 in der Spalte "Vergleichen" auftauchen. In Block70 vergleicht die Sortiereinrichtung64 jeden der Treffer 1, 2 und 4 und leitet den ältesten (zeitlich gesehen) Eintrag, nämlich den Treffer 1 weiter (Block72 ). Das Programm bestimmt in Block74 als Nächstes, ob alle Einträge in allen Protokolldateien ausgewählt, verglichen und weitergereicht wurden. Wenn dem so ist, endet das Programm in Block76 . Ist dies nicht der Fall, wählt in Block78 das Programm den nächsten Eintrag in der Protokolldatei, die den Eintrag enthält, der in Block72 weitergereicht wurde. In dem gerade betrachteten Beispiel ist der nächste Eintrag der Treffer Nummer 5 in der Protokolldatei46A . Als Nächstes werden – mit Bezug auf Zeile 2 von Tabelle 2 – in Block70 die Treffer 5, 2 und 4 verglichen, und der Treffer 2 wird weitergeleitet, da er der älteste (zeitlich gesehen) der drei verglichenen Einträge ist. - Weil das Programm jede der Protokolldateien in einer FIFO-Reihenfolge bearbeitet, kann es ablaufen, während gleichzeitig die Dateien offen sind und immer wieder zusätzliche Treffer in Folge erhalten.
- Im Beispiel von
7 werden durch die Sortiereinrichtung64 Protokolldateien80 ,82 ,84 bearbeitet. Es wäre festzuhalten, dass diese Protokolldateien Treffer enthalten, die in sequenzieller chronologischer Rei henfolge sind. Darüber hinaus werden die Protokolldateien jeweils in chronologischer Reihenfolge generiert. Folglich stellt die Protokolldatei80 eine genau bezeichnete Zeitspanne dar, die sich zwischen dem Zeitpunkt befindet, der dem Treffer 1 zugeordnet ist, und dem Zeitpunkt von Treffer 4; die Protokolldatei82 liegt zwischen den Zeitpunkten der Treffer 5 und 8; und die Protokolldatei84 zwischen den Treffern 9 und 12. Mit erneutem Bezug auf8 und auf Tabelle 3, die die sequenziellen Vergleiche abbildet, die an den Protokolldateieinträgen in7 vorgenommen werden, werden die Treffer 1, 5 und 9 in Block68 ausgewählt und in Block70 verglichen. Treffer 1, der älteste Eintrag, wird in Block72 weitergereicht, und der nächste eingehende Eintrag, Treffer Nummer 2, wird in Block78 ausgewählt. Diese Reihenfolge setzt sich solange fort, bis alle Treffer 1 bis 12 weitergereicht sind, wobei zuerst die Treffer 1 bis 4 in Folge von der Protokolldatei80 weitergereicht werden, die Treffer 5 bis 8 als Nächstes in Folge von der Protokolldatei82 weitergereicht werden, und schließlich die Treffer 9 bis 12 in Folge von der Protokolldatei84 . Tabelle 3Vergleichen Weiterreichungen 1, 5 9 1 2, 5 9 2 3, 5 9 3 4 5 9 4 - 5 9 5 - 6 9 6 - 7 9 7 - 8 9 8 - - 9 9 - - 10 10 - Die vorliegende Erfindung sortiert daher Verkehrsdatentreffer in gleichzeitig generierten und auch aufeinanderfolgend generierten Protokolldateien. Dies ist vorteilhaft, weil die Notwendigkeit in Bezug auf separate Programme umgangen ist, oder in Bezug auf die Konfigurierung eines Programms je nach dem, ob die Protokolldateien aufeinanderfolgend oder gleichzeitig erstellt werden. Darüber hinaus ist die vorliegende Erfindung dazu in der Lage, Protokolldateien zu sortieren, während sie weiterhin neue Verkehrsdatentreffer empfangen und abspeichern. Diese Analyse während der Verbindung versorgt Benutzer mit statistischen Daten und Berichten auf nahezu Echtzeitbasis.
Claims (10)
- Verfahren zum Analysieren von Verkehrsdaten, die von einer Vielzahl von Webservern (
10 ) generiert werden, welche über ein Netzwerk (13 ) mit einer Vielzahl von Computereinheiten (12 ) verbunden sind, umfassend: (a) Generieren einer Vielzahl von Verkehrsdatentreffern (11 ) für jeden durch einen sich fernab befindlichen Benutzer erfolgenden Zugriff auf einen der Webserver (10 ), wobei jeder der Treffer (11 ) einem Datenpaket entspricht, welches zwischen einem der Webserver (10 ) und einer der Computereinheiten (12 ) ausgetauscht wird; (b) die Verkehrsdatentreffer (11 ) mit ihren jeweiligen Servern (10 ) in Verbindung zu bringen; dadurch gekennzeichnet, dass das Verfahren darüber hinaus umfasst: (c) Auslesen eines ersten Datentreffers (11 ) aus jedem Server (10 ); (d) Vergleichen des ersten, aus einem Server (10 ) ausgelesenen Datentreffers (11 ) mit dem ersten, aus einem anderen Server aus der Vielzahl von Webservern (10 ) ausgelesenen Datentreffer (11 ); (e) Weiterreichen des ältesten Datentreffers (11 ); (f) Auslesen des nächsten Datentreffers (11 ) aus dem Server (10 ), aus dem der weitergereichte Datentreffer (11 ) ausgelesen wurde; (g) Wiederholen der Schritte (d) bis (e), bis alle Datentreffer (11 ) ausgelesen sind; und (h) Analysieren der weitergereichten Datentreffer (11 ). - Verfahren nach Anspruch 1, wobei Schritt (b) und (c) im Wesentlichen gleichzeitig ausgeführt werden.
- Verfahren nach Anspruch 1, wobei Schritt (b) vor Schritt (c) ausgeführt wird.
- Verfahren nach Anspruch 1, wobei die Webserver (
10 ) zueinander spiegelbildlich sind. - Verfahren nach Anspruch 1, wobei die Verkehrsdatentreffer (
11 ) in chronologischer Reihenfolge generiert werden und wobei verschiedene Protokolldateien (15 ) Datentreffer enthalten, die Verkehrsdatentreffern (11 ) entsprechen, welche in derselben Zeitspanne generiert wurden. - Verfahren zum Analysieren von Protokolldatei (
15 ), die in Folge eine Vielzahl von Datentreffern (11 ) enthalten, von denen jeder einem Verkehrsdatentreffer (11 ) entspricht, der von einem Webserver (10 ) generiert wird, wobei für jeden durch einen sich fernab befindlichen Benutzer erfolgenden Zugriff auf den Webserver (10 ) ein Verkehrsdatentreffer (11 ) generiert wird, wobei das Verfahren umfasst: (a) Auswählen eines ersten Datentreffers (11 ) in jeder Protokolldatei (15 ); (b) Vergleichen des aus einer Protokolldatei (15 ) ausgewählten ersten Datentreffers (11 ) mit dem aus einer anderen Protokolldatei (15 ) ausgewählten ersten Datentreffer (11 ); gekennzeichnet durch die folgenden Schritte: (c) Weiterreichen des ältesten der ausgewählten Datentreffer (11 ) an einen Protokolldatei-Analysator (66 ); (d) Auswählen des nächsten Datentreffers (11 ) in der Protokolldatei (15 ), in der der weitergereichte Datentreffer (11 ) ausgewählt wurde; und (e) Wiederholen der Schritte (b) bis (d), bis alle Datentreffer (11 ) in den Protokolldateien (15 ) weitergereicht sind. - Verfahren nach Anspruch 6, wobei die Datentreffer (
11 ) jeweils einem eindeutigen Zeitpunkt zugeordnet werden und der letzte Eintrag in einer Protokolldatei (15 ) einem Zeitpunkt zugeordnet wird, der nach dem ersten Eintrag in einer anderen Protokolldatei (15 ) erfolgt. - Verfahren nach Anspruch 6, wobei die Protokolldateien (
15 ) jeweils einer eindeutigen Zeitspanne zugeordnet werden und der Zeit punkt für jeden Datentreffer (11 ) innerhalb der Zeitspanne für seine Protokolldatei (15 ) liegt. - Verfahren nach Anspruch 6, wobei eine der Protokolldateien (
15 ) vom Webserver (10 ) generiert wird und eine andere der Protokolldateien (15 ) von einem weiteren Webserver generiert wird. - System zum Analysieren von Webserver-Protokolldateien (
15 ), Folgendes umfassend: einen Pool (12 ,14 ,15 ,16 ,17 ) von Verkehrsdatentreffern (11 ), die von einem Webserver (10 ) für jeden durch einen sich fernab befindlichen Benutzer erfolgenden Zugriff auf die Webserver (10 ) erzeugt werden; wobei jedem der Datentreffer (11 ) ein eindeutiger Zeitpunkt zugeordnet wird; eine Protokolldatei (15 ), die die Datentreffer (11 ) in Folge enthält; gekennzeichnet durch: eine Sortiereinrichtung (64 ) zum Sortieren der Datentreffer (11 ) aus einer Vielzahl der Protokolldateien (15 ) in chronologischer Reihenfolge; und einen Analysator (66 ) zum Analysieren der sortierten Datentreffer (11 ).
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/132,287 US6317787B1 (en) | 1998-08-11 | 1998-08-11 | System and method for analyzing web-server log files |
US132287 | 1998-08-11 | ||
PCT/US1999/018282 WO2000010093A1 (en) | 1998-08-11 | 1999-08-11 | System and method for analyzing web-server log files |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69937249D1 DE69937249D1 (de) | 2007-11-15 |
DE69937249T2 true DE69937249T2 (de) | 2008-07-03 |
Family
ID=22453317
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69937249T Expired - Lifetime DE69937249T2 (de) | 1998-08-11 | 1999-08-11 | System und verfahren zur analyse eines webserver-logbuchs |
Country Status (9)
Country | Link |
---|---|
US (1) | US6317787B1 (de) |
EP (1) | EP1131725B1 (de) |
AT (1) | ATE374970T1 (de) |
AU (2) | AU769816B2 (de) |
CA (1) | CA2340109C (de) |
DE (1) | DE69937249T2 (de) |
DK (1) | DK1131725T3 (de) |
ES (1) | ES2296403T3 (de) |
WO (1) | WO2000010093A1 (de) |
Families Citing this family (121)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5781449A (en) * | 1995-08-10 | 1998-07-14 | Advanced System Technologies, Inc. | Response time measurement apparatus and method |
US6108637A (en) | 1996-09-03 | 2000-08-22 | Nielsen Media Research, Inc. | Content display monitor |
US6112238A (en) * | 1997-02-14 | 2000-08-29 | Webtrends Corporation | System and method for analyzing remote traffic data in a distributed computing environment |
US6925442B1 (en) * | 1999-01-29 | 2005-08-02 | Elijahu Shapira | Method and apparatus for evaluating vistors to a web server |
US6574627B1 (en) * | 1999-02-24 | 2003-06-03 | Francesco Bergadano | Method and apparatus for the verification of server access logs and statistics |
US6529952B1 (en) * | 1999-04-02 | 2003-03-04 | Nielsen Media Research, Inc. | Method and system for the collection of cookies and other information from a panel |
US6789115B1 (en) * | 1999-07-09 | 2004-09-07 | Merrill Lynch & Company | System for collecting, analyzing, and reporting high volume multi-web server usage |
AUPQ206399A0 (en) | 1999-08-06 | 1999-08-26 | Imr Worldwide Pty Ltd. | Network user measurement system and method |
US6760763B2 (en) | 1999-08-27 | 2004-07-06 | International Business Machines Corporation | Server site restructuring |
US7610289B2 (en) | 2000-10-04 | 2009-10-27 | Google Inc. | System and method for monitoring and analyzing internet traffic |
US6792458B1 (en) * | 1999-10-04 | 2004-09-14 | Urchin Software Corporation | System and method for monitoring and analyzing internet traffic |
US7035926B1 (en) * | 1999-11-30 | 2006-04-25 | International Business Machines Corporation | Real-time monitoring of web activities |
US7523190B1 (en) * | 1999-12-23 | 2009-04-21 | Bickerstaff Cynthia L | Real-time performance assessment of large area network user experience |
JP5072160B2 (ja) | 2000-01-12 | 2012-11-14 | ネットレイティングス・インコーポレーティッド | ワールドワイドウェブのディジタルコンテントの普及を見積もるシステム及び方法 |
US6477483B1 (en) | 2000-01-17 | 2002-11-05 | Mercury Interactive Corporation | Service for load testing a transactional server over the internet |
US6771289B1 (en) * | 2000-03-02 | 2004-08-03 | Microsoft Corporation | Cluster-based visualization of user traffic on an internet site |
US6728932B1 (en) * | 2000-03-22 | 2004-04-27 | Hewlett-Packard Development Company, L.P. | Document clustering method and system |
JP4403335B2 (ja) * | 2000-04-17 | 2010-01-27 | ソニー株式会社 | ビデオ処理機器の保守支援システム |
US7020709B1 (en) | 2000-06-30 | 2006-03-28 | Intel Corporation | System and method for fault tolerant stream splitting |
US7318107B1 (en) | 2000-06-30 | 2008-01-08 | Intel Corporation | System and method for automatic stream fail-over |
US6785666B1 (en) * | 2000-07-11 | 2004-08-31 | Revenue Science, Inc. | Method and system for parsing navigation information |
CA2432344C (en) * | 2000-08-21 | 2010-10-26 | Netiq Corporation | Data tracking using ip address filtering over a wide area network |
US20040236673A1 (en) * | 2000-10-17 | 2004-11-25 | Eder Jeff Scott | Collaborative risk transfer system |
US6904461B1 (en) * | 2000-10-19 | 2005-06-07 | Unitel Technologies, Inc. | Method for making time-sensitive determinations of traffic intensity for a visitable site |
US6850944B1 (en) * | 2000-11-20 | 2005-02-01 | The University Of Alabama | System, method, and computer program product for managing access to and navigation through large-scale information spaces |
CA2327211A1 (en) * | 2000-12-01 | 2002-06-01 | Nortel Networks Limited | Management of log archival and reporting for data network security systems |
AU2002220126A1 (en) | 2000-12-05 | 2002-06-18 | Clickfox, Llc | Graphical user interface and evaluation tool for customizing web sites |
AU2002230735A1 (en) * | 2000-12-11 | 2002-06-24 | Phlair, Inc. | System and method for detecting and reporting online activity using real-time content-based network monitoring |
US6654699B2 (en) * | 2000-12-29 | 2003-11-25 | Microsoft Corporation | Computer network testing system and method using client playback of edited network information |
US6564170B2 (en) * | 2000-12-29 | 2003-05-13 | Hewlett-Packard Development Company, L.P. | Customizable user interfaces |
US20020143925A1 (en) * | 2000-12-29 | 2002-10-03 | Ncr Corporation | Identifying web-log data representing a single user session |
US6651141B2 (en) | 2000-12-29 | 2003-11-18 | Intel Corporation | System and method for populating cache servers with popular media contents |
US7003565B2 (en) * | 2001-04-03 | 2006-02-21 | International Business Machines Corporation | Clickstream data collection technique |
WO2002084470A1 (en) * | 2001-04-12 | 2002-10-24 | Smartmoney | Method and system for incorporating a value in a document |
US6968341B2 (en) * | 2001-05-25 | 2005-11-22 | International Business Machines Corporation | System and method for post-analyzing, and sequentially visualizing plurality of predefined metrics in a stored dynamic data values associated identifiers within determined time range |
US20020188868A1 (en) * | 2001-06-12 | 2002-12-12 | Budka Kenneth C. | Method for protecting use of resources in a network |
US6763321B2 (en) * | 2001-06-22 | 2004-07-13 | Sun Microsystems, Inc. | Method and apparatus to facilitate measurement of quality-of-service performance of a network server |
US20030018584A1 (en) * | 2001-07-23 | 2003-01-23 | Cohen Jeremy Stein | System and method for analyzing transaction data |
US7278161B2 (en) | 2001-10-01 | 2007-10-02 | International Business Machines Corporation | Protecting a data processing system from attack by a vandal who uses a vulnerability scanner |
US20030105958A1 (en) * | 2001-12-05 | 2003-06-05 | International Business Machines Corporation | Command script instrumentation for logging command execution and the protection of sensitive information |
US20080027841A1 (en) * | 2002-01-16 | 2008-01-31 | Jeff Scott Eder | System for integrating enterprise performance management |
GB2385953A (en) * | 2002-01-25 | 2003-09-03 | Robert Andrew Hurst | A web page reporting tool for reporting activity on a web page |
US9167036B2 (en) | 2002-02-14 | 2015-10-20 | Level 3 Communications, Llc | Managed object replication and delivery |
US8280873B1 (en) * | 2002-04-17 | 2012-10-02 | Teradata Us, Inc. | System for capturing a business context of a user's interaction with a website and method for the same |
US7590724B1 (en) * | 2002-04-29 | 2009-09-15 | Williams Robert D | Auto instrumentation system |
US7970640B2 (en) * | 2002-06-12 | 2011-06-28 | Asset Trust, Inc. | Purchasing optimization system |
US6931357B2 (en) * | 2002-07-18 | 2005-08-16 | Computer Network Technology Corp. | Computer network monitoring with test data analysis |
US8271778B1 (en) | 2002-07-24 | 2012-09-18 | The Nielsen Company (Us), Llc | System and method for monitoring secure data on a network |
US7254784B2 (en) * | 2002-09-11 | 2007-08-07 | Peter H. Chang | User-driven menu generation system with multiple submenus |
US8381091B2 (en) * | 2002-09-16 | 2013-02-19 | International Business Machines Corporation | Real-time method, system and program product for collecting web form data |
US7853684B2 (en) * | 2002-10-15 | 2010-12-14 | Sas Institute Inc. | System and method for processing web activity data |
JP4098610B2 (ja) | 2002-12-10 | 2008-06-11 | 株式会社日立製作所 | アクセス中継装置 |
US7401057B2 (en) * | 2002-12-10 | 2008-07-15 | Asset Trust, Inc. | Entity centric computer system |
US7792827B2 (en) * | 2002-12-31 | 2010-09-07 | International Business Machines Corporation | Temporal link analysis of linked entities |
US7603373B2 (en) * | 2003-03-04 | 2009-10-13 | Omniture, Inc. | Assigning value to elements contributing to business success |
US7991732B2 (en) * | 2005-06-03 | 2011-08-02 | Adobe Systems Incorporated | Incrementally adding segmentation criteria to a data set |
US9081863B2 (en) * | 2005-06-03 | 2015-07-14 | Adobe Systems Incorporated | One-click segmentation definition |
US7320007B1 (en) | 2003-12-12 | 2008-01-15 | Peter Hon-You Chang | Dynamic generation of target files from template files and tracking of the processing of target files |
US8346803B2 (en) * | 2003-12-12 | 2013-01-01 | Knapp Investment Company Limited | Dynamic generation of target files from template files and tracking of the processing of target files |
US8782654B2 (en) | 2004-03-13 | 2014-07-15 | Adaptive Computing Enterprises, Inc. | Co-allocating a reservation spanning different compute resources types |
US7792954B2 (en) * | 2004-04-02 | 2010-09-07 | Webtrends, Inc. | Systems and methods for tracking web activity |
US20070266388A1 (en) | 2004-06-18 | 2007-11-15 | Cluster Resources, Inc. | System and method for providing advanced reservations in a compute environment |
US8176490B1 (en) | 2004-08-20 | 2012-05-08 | Adaptive Computing Enterprises, Inc. | System and method of interfacing a workload manager and scheduler with an identity manager |
US8583472B2 (en) * | 2004-09-10 | 2013-11-12 | Fmr Llc | Measuring customer service levels |
US7624176B2 (en) * | 2004-10-14 | 2009-11-24 | International Business Machines Corporation | Method and system for programmatically generating synthetic transactions to monitor performance and availability of a web application |
CA2586763C (en) | 2004-11-08 | 2013-12-17 | Cluster Resources, Inc. | System and method of providing system jobs within a compute environment |
US8863143B2 (en) | 2006-03-16 | 2014-10-14 | Adaptive Computing Enterprises, Inc. | System and method for managing a hybrid compute environment |
EP1866767B1 (de) | 2005-03-16 | 2018-04-18 | III Holdings 12, LLC | Automatische übergabe von arbeitspensum an ein bedarfsdeckungszentrum |
US9231886B2 (en) | 2005-03-16 | 2016-01-05 | Adaptive Computing Enterprises, Inc. | Simple integration of an on-demand compute environment |
US9015324B2 (en) | 2005-03-16 | 2015-04-21 | Adaptive Computing Enterprises, Inc. | System and method of brokering cloud computing resources |
US8713025B2 (en) | 2005-03-31 | 2014-04-29 | Square Halt Solutions, Limited Liability Company | Complete context search system |
US8782120B2 (en) | 2005-04-07 | 2014-07-15 | Adaptive Computing Enterprises, Inc. | Elastic management of compute resources between a web server and an on-demand compute environment |
EP3203374B1 (de) | 2005-04-07 | 2021-11-24 | III Holdings 12, LLC | Zugang auf anfrage zu computerressourcen |
US7941394B2 (en) | 2005-06-03 | 2011-05-10 | Adobe Systems Incorporated | User interface providing summary information or a status pane in a web analytics tool |
US9122715B2 (en) | 2006-06-29 | 2015-09-01 | International Business Machines Corporation | Detecting changes in end-user transaction performance and availability caused by changes in transaction server configuration |
US8869066B2 (en) | 2006-07-06 | 2014-10-21 | Addthis, Llc | Generic content collection systems |
US8056092B2 (en) | 2006-09-29 | 2011-11-08 | Clearspring Technologies, Inc. | Method and apparatus for widget-container hosting and generation |
US9009728B2 (en) | 2007-03-06 | 2015-04-14 | Addthis, Inc. | Method and apparatus for widget and widget-container distribution control based on content rules |
US20080222232A1 (en) * | 2007-03-06 | 2008-09-11 | Allen Stewart O | Method and Apparatus for Widget and Widget-Container Platform Adaptation and Distribution |
US8266274B2 (en) | 2007-03-06 | 2012-09-11 | Clearspring Technologies, Inc. | Method and apparatus for data processing |
US8166157B2 (en) * | 2007-03-23 | 2012-04-24 | Fmr Llc | Enterprise application performance monitors |
JP2008293299A (ja) * | 2007-05-24 | 2008-12-04 | Fuji Xerox Co Ltd | 情報処理装置及び制御プログラム |
US8990378B2 (en) * | 2007-07-05 | 2015-03-24 | Interwise Ltd. | System and method for collection and analysis of server log files |
US8041773B2 (en) | 2007-09-24 | 2011-10-18 | The Research Foundation Of State University Of New York | Automatic clustering for self-organizing grids |
US8209378B2 (en) | 2007-10-04 | 2012-06-26 | Clearspring Technologies, Inc. | Methods and apparatus for widget sharing between content aggregation points |
US7752308B2 (en) * | 2007-10-30 | 2010-07-06 | Hutchinson Kevin P | System for measuring web traffic |
US20090112976A1 (en) * | 2007-10-29 | 2009-04-30 | Hutchinson Kevin P | Method for measuring web traffic |
US20100281389A1 (en) * | 2007-10-29 | 2010-11-04 | Hutchinson Kevin P | System for measuring web traffic |
US7822850B1 (en) * | 2008-01-11 | 2010-10-26 | Cisco Technology, Inc. | Analyzing log files |
JP4521038B2 (ja) * | 2008-02-07 | 2010-08-11 | 富士通株式会社 | ストレージ装置、中継装置および動作状態制御方法 |
US9762692B2 (en) | 2008-04-04 | 2017-09-12 | Level 3 Communications, Llc | Handling long-tail content in a content delivery network (CDN) |
EP2274684A4 (de) | 2008-04-04 | 2012-12-05 | Level 3 Communications Llc | Umgang mit long-tail-inhalt in einem inhaltsablieferungsnetzwerk (cdn) |
US10924573B2 (en) | 2008-04-04 | 2021-02-16 | Level 3 Communications, Llc | Handling long-tail content in a content delivery network (CDN) |
US20090286550A1 (en) * | 2008-05-15 | 2009-11-19 | Brane Wolrd Ltd. | Tempo Spatial Data Extraction From Network Connected Devices |
US8935382B2 (en) * | 2009-03-16 | 2015-01-13 | Microsoft Corporation | Flexible logging, such as for a web server |
US9305105B2 (en) * | 2009-05-26 | 2016-04-05 | Google Inc. | System and method for aggregating analytics data |
US20100306363A1 (en) * | 2009-05-26 | 2010-12-02 | Erwien Saputra | Determining completion of a web server download session at a database server |
US8549019B2 (en) * | 2009-05-26 | 2013-10-01 | Google Inc. | Dynamically generating aggregate tables |
US8386498B2 (en) * | 2009-08-05 | 2013-02-26 | Loglogic, Inc. | Message descriptions |
US8751544B2 (en) * | 2009-09-02 | 2014-06-10 | Google Inc. | Method and system for pivoting a multidimensional dataset |
US8543591B2 (en) * | 2009-09-02 | 2013-09-24 | Google Inc. | Method and system for generating and sharing dataset segmentation schemes |
US20110119100A1 (en) * | 2009-10-20 | 2011-05-19 | Jan Matthias Ruhl | Method and System for Displaying Anomalies in Time Series Data |
US8583584B2 (en) | 2009-10-20 | 2013-11-12 | Google Inc. | Method and system for using web analytics data for detecting anomalies |
US10877695B2 (en) | 2009-10-30 | 2020-12-29 | Iii Holdings 2, Llc | Memcached server functionality in a cluster of data processing nodes |
US11720290B2 (en) | 2009-10-30 | 2023-08-08 | Iii Holdings 2, Llc | Memcached server functionality in a cluster of data processing nodes |
US20110209067A1 (en) * | 2010-02-19 | 2011-08-25 | Bogess Keandre | System and Method for Website User Valuation |
US20110225287A1 (en) * | 2010-03-12 | 2011-09-15 | Webtrends Inc. | Method and system for distributed processing of web traffic analytics data |
US20110225288A1 (en) * | 2010-03-12 | 2011-09-15 | Webtrends Inc. | Method and system for efficient storage and retrieval of analytics data |
US8549201B2 (en) | 2010-06-30 | 2013-10-01 | Intel Corporation | Interrupt blocker |
US8352444B1 (en) | 2011-07-11 | 2013-01-08 | Peter Hon-You Chang | User-driven menu generation system with dynamic generation of target files with placeholders for persistent change or temporary security change over cloud computing virtual storage from template files |
US8819224B2 (en) * | 2011-07-28 | 2014-08-26 | Bank Of America Corporation | Health and welfare monitoring of network server operations |
US9183200B1 (en) * | 2012-08-02 | 2015-11-10 | Symantec Corporation | Scale up deduplication engine via efficient partitioning |
US8793236B2 (en) | 2012-11-01 | 2014-07-29 | Adobe Systems Incorporated | Method and apparatus using historical influence for success attribution in network site activity |
CN110191416B (zh) * | 2013-03-15 | 2022-04-15 | 美国结构数据有限公司 | 用于分析目标实体的移动的装置、系统和方法 |
US9185435B2 (en) | 2013-06-25 | 2015-11-10 | The Nielsen Company (Us), Llc | Methods and apparatus to characterize households with media meter data |
US9277265B2 (en) | 2014-02-11 | 2016-03-01 | The Nielsen Company (Us), Llc | Methods and apparatus to calculate video-on-demand and dynamically inserted advertisement viewing probability |
US10219039B2 (en) | 2015-03-09 | 2019-02-26 | The Nielsen Company (Us), Llc | Methods and apparatus to assign viewers to media meter data |
US9848224B2 (en) | 2015-08-27 | 2017-12-19 | The Nielsen Company(Us), Llc | Methods and apparatus to estimate demographics of a household |
US10140200B2 (en) * | 2015-10-15 | 2018-11-27 | King.Dom Ltd. | Data analysis |
US10791355B2 (en) | 2016-12-20 | 2020-09-29 | The Nielsen Company (Us), Llc | Methods and apparatus to determine probabilistic media viewing metrics |
US11275716B2 (en) | 2020-05-26 | 2022-03-15 | International Business Machines Corporation | Cognitive disparate log association |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0822403A (ja) | 1994-07-11 | 1996-01-23 | Fujitsu Ltd | 計算機システムの監視装置 |
US5706436A (en) * | 1995-02-01 | 1998-01-06 | Cabletron Systems, Inc. | Apparatus and method for evaluation network traffic performance |
US5729742A (en) * | 1995-02-27 | 1998-03-17 | International Business Machines Corporation | System and method for enabling multiple computer systems to share a single sequential log |
US5600632A (en) * | 1995-03-22 | 1997-02-04 | Bell Atlantic Network Services, Inc. | Methods and apparatus for performance monitoring using synchronized network analyzers |
US5675510A (en) | 1995-06-07 | 1997-10-07 | Pc Meter L.P. | Computer use meter and analyzer |
US5892917A (en) * | 1995-09-27 | 1999-04-06 | Microsoft Corporation | System for log record and log expansion with inserted log records representing object request for specified object corresponding to cached object copies |
US5898837A (en) * | 1996-02-23 | 1999-04-27 | Bay Networks, Inc. | Method and apparatus for monitoring a dedicated communications medium in a switched data network |
US5787253A (en) * | 1996-05-28 | 1998-07-28 | The Ag Group | Apparatus and method of analyzing internet activity |
US5727129A (en) | 1996-06-04 | 1998-03-10 | International Business Machines Corporation | Network system for profiling and actively facilitating user activities |
US5774660A (en) * | 1996-08-05 | 1998-06-30 | Resonate, Inc. | World-wide-web server with delayed resource-binding for resource-based load balancing on a distributed resource multi-node network |
WO1998011702A1 (en) * | 1996-09-10 | 1998-03-19 | Accrue Software, Inc. | Apparatus and methods for capturing, analyzing and viewing live network information |
US5870559A (en) * | 1996-10-15 | 1999-02-09 | Mercury Interactive | Software system and associated methods for facilitating the analysis and management of web sites |
US5796942A (en) * | 1996-11-21 | 1998-08-18 | Computer Associates International, Inc. | Method and apparatus for automated network-wide surveillance and security breach intervention |
US5913041A (en) * | 1996-12-09 | 1999-06-15 | Hewlett-Packard Company | System for determining data transfer rates in accordance with log information relates to history of data transfer activities that independently stored in content servers |
US5732218A (en) | 1997-01-02 | 1998-03-24 | Lucent Technologies Inc. | Management-data-gathering system for gathering on clients and servers data regarding interactions between the servers, the clients, and users of the clients during real use of a network of clients and servers |
US5968125A (en) * | 1997-01-21 | 1999-10-19 | Net. Roi | Process for optimizing the effectiveness of a hypertext element |
US6112238A (en) * | 1997-02-14 | 2000-08-29 | Webtrends Corporation | System and method for analyzing remote traffic data in a distributed computing environment |
US6023744A (en) * | 1997-03-07 | 2000-02-08 | Microsoft Corporation | Method and mechanism for freeing disk space in a file system |
US5796952A (en) * | 1997-03-21 | 1998-08-18 | Dot Com Development, Inc. | Method and apparatus for tracking client interaction with a network resource and creating client profiles and resource database |
US5878223A (en) | 1997-05-07 | 1999-03-02 | International Business Machines Corporation | System and method for predictive caching of information pages |
US6055572A (en) * | 1998-01-20 | 2000-04-25 | Netscape Communications Corporation | System and method for creating pathfiles for use to predict patterns of web surfaces |
US6098079A (en) * | 1998-04-02 | 2000-08-01 | Mitsubishi Electric Information Technology Center America, Inc. (Ita) | File version reconciliation using hash codes |
US6175838B1 (en) * | 1998-04-29 | 2001-01-16 | Ncr Corporation | Method and apparatus for forming page map to present internet data meaningful to management and business operation |
-
1998
- 1998-08-11 US US09/132,287 patent/US6317787B1/en not_active Expired - Lifetime
-
1999
- 1999-08-11 DE DE69937249T patent/DE69937249T2/de not_active Expired - Lifetime
- 1999-08-11 CA CA002340109A patent/CA2340109C/en not_active Expired - Fee Related
- 1999-08-11 EP EP99942121A patent/EP1131725B1/de not_active Expired - Lifetime
- 1999-08-11 WO PCT/US1999/018282 patent/WO2000010093A1/en active IP Right Grant
- 1999-08-11 DK DK99942121T patent/DK1131725T3/da active
- 1999-08-11 AU AU55568/99A patent/AU769816B2/en not_active Ceased
- 1999-08-11 AT AT99942121T patent/ATE374970T1/de not_active IP Right Cessation
- 1999-08-11 ES ES99942121T patent/ES2296403T3/es not_active Expired - Lifetime
-
2004
- 2004-05-05 AU AU2004201868A patent/AU2004201868B2/en not_active Ceased
Also Published As
Publication number | Publication date |
---|---|
AU2004201868A1 (en) | 2004-05-27 |
AU769816B2 (en) | 2004-02-05 |
DE69937249D1 (de) | 2007-11-15 |
DK1131725T3 (da) | 2008-02-04 |
EP1131725A1 (de) | 2001-09-12 |
ATE374970T1 (de) | 2007-10-15 |
AU5556899A (en) | 2000-03-06 |
ES2296403T3 (es) | 2008-04-16 |
WO2000010093A1 (en) | 2000-02-24 |
AU2004201868B2 (en) | 2007-04-05 |
EP1131725A4 (de) | 2005-06-15 |
CA2340109A1 (en) | 2000-02-24 |
EP1131725B1 (de) | 2007-10-03 |
US6317787B1 (en) | 2001-11-13 |
CA2340109C (en) | 2003-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69937249T2 (de) | System und verfahren zur analyse eines webserver-logbuchs | |
DE69838751T2 (de) | System und verfahren zur analyse von entfernten verkehrsdaten in einer verteilten rechnerumgebung | |
DE60114999T2 (de) | Überwachung von und interaktion mit netzwerkdiensten | |
EP1097428B1 (de) | System und verfahren zum prüfen von netzwerk-anwendungen | |
DE69923435T2 (de) | System und verfahren zur optimierung der leistungskontrolle von komplexen informationstechnologiesystemen | |
DE69712678T3 (de) | Verfahren zur Echtzeitüberwachung eines Rechnersystems zu seiner Verwaltung und Hilfe zu seiner Wartung während seiner Betriebsbereitschaft | |
DE69909839T3 (de) | Optimierte Lokalisierung von Netzwerkbetriebsmittel | |
DE69911681T2 (de) | Verfahren zum Verfolgen von Konfigurationsänderungen in Netzwerken von Rechnersystemen durch historische Überwachung des Konfigurationsstatus der Vorrichtungen im Netzwerk | |
DE10051024B4 (de) | Verfahren zum intermediären Cachen in einem Client-Server-Softwaresystem, Computerprogrammprodukte und Computersystem zur Durchführung eines solchen Verfahrens | |
DE10051021B4 (de) | System, Verfahren und Computerprogramm zur Bereitstellung interaktiver Web-Inhalte in statisch verknüpften Dateien | |
DE102006037291A1 (de) | Verfahren und Systeme für den Zugriff auf Prozesssteuerungsprotokollinformationen in Verbindung mit Prozesssteuerungssystemen | |
DE10135136A1 (de) | Sichere Datenberichtausbildung und -zustellung | |
DE102013201973A1 (de) | Verteilte Anwendung mit Vorwegnahme von Server-Antworten | |
DE10132038A1 (de) | Automatisierungssystem und Verfahren zur Anlagenvisualisierung | |
DE102006027664B4 (de) | Kommunikationssystem zum Verarbeiten von Daten | |
DE10393809B4 (de) | Computer-implementiertes Verfahren zum Verarbeiten von Information, die zwischen einem Client und einem Server ausgetauscht wird | |
DE10208959B4 (de) | Verfahren und Vorrichtung zur Erfassung und Auswertung von in einem Rechnernetzwerk abgelegten Informationen | |
DE10134093C2 (de) | Verfahren und Anordnung zum Entfernen von Verbindungen aus einem Netzwerk mit Knoten und Verbindungen | |
WO2004021188A2 (de) | Verfahren zum testen von browser-adaptierenden server-applikationen | |
DE10145176C2 (de) | Verfahren zur Klickpfad-Rekonstruktion sowie Verfahren zur Bestimmung eines Gangunterschieds | |
DE10313420A1 (de) | Recherchensystem und Verfahren zur Ermittlung von Informationen aus einer Datenbank, insbesondere aus dem World-Wide-Web | |
EP1170676A1 (de) | Darstellung einer Informationsstruktur von Dokumenten des Word Wide Web | |
DE10142024A1 (de) | Kompressionsverfahren | |
DE10319427A1 (de) | Verfahren zur Erstellung von für Datensätze aus einer Datenbank, insbesondere aus dem World-Wide-Web, charakteristischen Kurzdatensätzen, Verfahren zur Ermittlung von für eine vorgebbare Suchanfrage relevanten Datensätzen aus einer Datenbank und Suchsystem zur Durchführung des Verfahrens | |
AT500417A2 (de) | Verfahren und rechnereinrichtung zum bewerten von zugriffen auf eine webseite |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition |