DE102007002533A1 - Netzwerk - Google Patents

Netzwerk Download PDF

Info

Publication number
DE102007002533A1
DE102007002533A1 DE200710002533 DE102007002533A DE102007002533A1 DE 102007002533 A1 DE102007002533 A1 DE 102007002533A1 DE 200710002533 DE200710002533 DE 200710002533 DE 102007002533 A DE102007002533 A DE 102007002533A DE 102007002533 A1 DE102007002533 A1 DE 102007002533A1
Authority
DE
Germany
Prior art keywords
log file
session
sessions
network according
individual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE200710002533
Other languages
English (en)
Inventor
Bernd Ebert
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MINDLAB GmbH
Original Assignee
MINDLAB GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MINDLAB GmbH filed Critical MINDLAB GmbH
Priority to DE200710002533 priority Critical patent/DE102007002533A1/de
Publication of DE102007002533A1 publication Critical patent/DE102007002533A1/de
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer And Data Communications (AREA)

Abstract

Die Erfindung betrifft ein Netzwerk (1), welches eine Anzahl von Kundenrechnern (2) und auf Serverrechnern installierten Servern umfasst. Auf eine von einem Kundenrechner (2) an einen Server gerichtete Anfrage (3) ist von diesem eine Antwort (5) an den Kundenrechner (2) ausgebbar. Die Inhalte einer Folge von Anfragen (3) und Antworten (5) sind in einem Logfile abgespeichert, die einzelnen Anfragen (3) und Antworten (5) sind jeweils mit einem Zeitstempel und einer Session-ID abgespeichert. Das Logfile enthält die Inhalte der Anfragen (3) und Antworten (5) kennzeichnende Kriterien. In einer Analyseeinheit (11) erfolgt eine Sortierung des Logfiles nach durch die Session-ID gekennzeichneten Sessions, worauf durch Bildung von Mengenbedingungen für Kriterien einzelner Sessions Areas bildende Zahlenfolgen zur Bildung von Kenngrößen für das Benutzerverhalten des Benutzers der jeweiligen Kundenrechner (2) generiert werden.

Description

  • Die Erfindung betrifft ein Netzwerk gemäß dem Oberbegriff des Anspruchs 1.
  • Ein derartiges Rechnernetzwerk kann insbesondere vom Internet gebildet sein. Weiterhin kann das Netzwerk von einem Intranet, das heißt einem internen Netzwerk gebildet sein, das beispielsweise in größeren Firmen oder Behörden zum Einsatz kommen kann.
  • In derartigen Netzwerken kann ein Benutzer über einen Kundenrechner durch Eingabe einer Folge von Anfragen Informationen abrufen. Weiterhin kann der Benutzer auf diesem Weg auch elektronische Bestellvorgänge tätigen, das heißt durch eine Folge von Anfragen informiert sich der Benutzer über das Kaufangebot eines Kaufhauses oder dergleichen und entscheidet sich derart für den Kauf bestimmter Produkte.
  • Dabei ist es generell wünschenswert, das Benutzerverhalten bei der Durchführung von Anfragen im Netzwerk zu analysieren. Für das genannte Beispiel eines Kaufhauses ist eine Analyse des Benutzerverhaltens deshalb von hohem Interesse, da hieraus wertvolle Informationen über das Kaufverhalten der Benutzer gewonnen werden können. Weiterhin können durch eine Analyse des Benutzerverhaltens beispielsweise Informationen darüber gewonnen werden, ob das Spektrum der Waren, das ein Kaufhaus anbietet, den Bedarf der Kunden erfüllt oder nicht.
  • Problematisch bei derartigen Analysen ist generell, dass durch die große Anzahl einzelner Anfragen im Netzwerk einerseits, und durch die Verzweigung des Netzwerks andererseits, wie es beispielsweise beim Internet der Fall ist, eine enorme Menge an auszuwertenden Daten anfällt. Die Ableitung von geeigneten Kenngrößen, die das Benutzerverhalten in geeigneter Weise analysieren, ist daher äußerst schwierig und zeitaufwendig.
  • Der Erfindung liegt die Aufgabe zugrunde für ein Netzwerk der eingangs genannten Art Mittel bereit zu stellen, mittels derer eine exakte Analyse des Benutzerverhaltens von Benutzern dieses Netzwerks ermöglicht wird.
  • Zur Lösung dieser Aufgabe sind die Merkmale des Anspruchs 1 vorgesehen. Vorteilhafte Ausführungsformen und zweckmäßige Weiterbildungen der Erfindung sind in den Unteransprüchen beschrieben.
  • Das erfindungsgemäße Netzwerk umfasst eine Anzahl von Kundenrechnern und auf Serverrechnern installierten Servern. Auf eine von einem Kundenrechner an einen Server gerichtete Anfrage ist von diesem eine Antwort an den Kundenrechner ausgebbar. Die Inhalte einer Folge von Anfragen und Antworten sind in einem Logfile abgespeichert, die einzelnen Anfragen und Antworten sind jeweils mit einem Zeitstempel und einer Session-ID abgespeichert. Der Logfile enthält die Inhalte der Anfragen und Antworten kennzeichnende Kriterien. In einer Analyseeinheit erfolgt eine Sortierung des Logfiles nach durch die Session-ID gekennzeichneten Sessions erfolgt, worauf durch Bildung von Mengenbedingungen für Kriterien einzelner Sessions Areas bildende Zahlenfolgen zur Bildung von Kenngrößen für das Benutzerverhalten des Benutzers der jeweiligen Kundenrechner generiert werden.
  • Anhand der erfindungsgemäßen Auswertung der im Logfile enthaltenen Informationen kann das Benutzerverhalten von Benutzern des Netzwerks exakt analysiert werden. Dabei wird der Logfile in einer geeigneten Einheit abgespeichert, so dass die Auswertung zeitlich entkoppelt vom zeitlichen Ablauf der Anfragen und Antworten erfolgen kann.
  • Ein wesentlicher Vorteil der Erfindung besteht darin, dass durch die strukturierte Auswertung auch große Datenmengen in Logfiles einfach und schnell ausgewertet werden können, wobei durch diese Auswertung Kenngrößen abgeleitet werden, die das Benutzerverhalten genau analysieren.
  • Ein wesentlicher Aspekt bei der erfindungsgemäßen Analyse des Benutzerverhaltens besteht darin, dass die im Logfile enthaltenen Informationen zunächst nach Session sortiert werden. Die so vorsortierten Daten ermöglichen einen erheblich vereinfachten Zugang zur Ableitung von relevanten Kenngrößen für das Benutzerverhalten von Benutzern.
  • Die Sortierung der Informationen des Logfiles erfolgt in der Analyseeinheit anhand der Session-ID, die für die einzelnen Anfragen und Antworten im Logfile hinterlegt sind.
  • Für den Fall, dass das Netzwerk vom Internet gebildet ist und entsprechend die Server von Webservern gebildet sind, vergeben die einzelnen Webserver die Session-ID, die Folgen von Anfragen von einem Benutzer kennzeichnen.
  • Der Begriff Session-ID ist für die vorliegende Erfindung hierauf nicht beschränkt. Vielmehr ist mit dem Begriff Session-ID jede Art einer vorzugsweise eindeutigen Kennzeichnung von Folgen von Aktionen einer vorgegebenen Quelle als allgemeiner Definition einer Session umfasst.
  • Ein wesentliches Element der Erfindung für die Ableitung von dem Benutzerverhalten von Benutzern des Netzwerks charakterisierenden Kenngrößen besteht darin, dass der Logfile derart ausgebildet ist, dass dieser die Inhalte von Anfragen und Antworten kennzeichnende Kriterien enthält.
  • Bei derartigen Kriterien handelt es sich allgemein um Kategorien, welche vorgegebenen Informationen im Logfile zugeordnet werden können.
  • Der Begriff des Kriteriums wird im Folgenden beispielhaft für den Fall erläutert, dass als Bestandteil des Netzwerks im Datenbestand eines Kaufhauses bestimmte Waren recherchiert und auf elektronischem Weg bestellt werden können.
  • Interessiert sich beispielsweise ein Benutzer für den Preis eines gestreiften Anzugs und richtet er über seinen Kundenrechner eine entsprechende Anfrage an den entsprechenden Server, worauf der Benutzer die gewünschte Preisinformation enthält, so wird die entsprechende Anfrage in den Logfile übernommen.
  • Je nach Struktur der jeweiligen Anfragen und Antworten kann neben dem Suchbegriff „gestreifter Anzug" als Oberbegriff „Herrenmode" als Zusatzinformation im Logfile stehen. In der Analyseeinheit kann dieser Oberbegriff „Herrenmode" als Kriterium übernommen werden.
  • Alternativ können in den Analyseeinheiten auch derartige Kriterien selbsttätig berechnet oder ermittelt werden und dann nachträglich in den Logfile eingetragen werden.
  • Generell wird der Logfile von der Analyseeinheit so aufbereitet, dass dieser eine geeignete Anzahl von Kriterien enthält, mittels derer die Informationen im Logfile strukturiert werden.
  • Die Kenngrößen für das Benutzerverhalten von Benutzern werden erfindungsgemäß durch Bildung von Areas gewonnen. Derartige Areas bilden Zahlenfolgen, die durch Bildung von Mengenbedingungen für Kriterien einzelner Sessions gewonnen werden. Im einfachsten Fall ist eine Area von den Anzahlen von Sessions gebildet, die ein oder mehrere Kriterien erfüllt. Derartige Areas bilden kompakte Kenngrößen, die bereits für sich allein eine präzise Einordnung von unterschiedlichen Benutzern erlauben.
  • In einer bevorzugten Weiterbildung kann eine solche Area auch die Zeitdauer einer jeweiligen Session enthalten. Dies erfolgt durch die Auswertung von den im Logfile enthaltenen Zeitstempeln der einzelnen Anfragen und Antworten. Durch die Auswertung derartiger Zeitinformationen werden noch detailliertere Bewertungen des Benutzerverhaltens möglich, beispielsweise derart, welche der Anfragen am häufigsten und am längsten von den Benutzern durchgeführt werden.
  • Da der Logfile sehr große Datenmengen enthält, wird dieser gemäß einer besonders vorteilhaften Ausführungsform dadurch noch weiter strukturiert, dass aus diesem unterschiedliche Populationen abgeleitet werden. Dabei wird aus dem Logfile eine Population dadurch gebildet, dass bei der Population wenigstens ein Kriterium erfüllt sein muss. Durch Heranziehen mehrer unterschiedlicher Kriterien können mehrere Populationen gebildet werden, die unabhängig voneinander und parallel ausgewertet werden können, indem für diese geeignete Areas gebildet werden.
  • Dadurch ist eine schnelle und strukturierte Auswertung der Informationen im Logfile möglich.
  • Zusätzlich zur Bildung von Areas, die eine mehr abstrakte Kennzeichnung des Benutzerverhaltens liefern, können gemäß einer vorteilhaften Ausführungsform der Erfindung auf der Basis der Area-Auswertung auch Listen generiert werden, die konkrete Werte, das heißt Inhalte der einzelnen Anfragen und Abfragen enthalten, wobei diese durch die Area-Auswertung bestimmten Sessions zugeordnet sind.
  • Ein wesentlicher Vorteil der Erfindung besteht darin, dass die vorgenannten Auswertungen auch zeitabhängig vorgenommen werden können, so dass dadurch das Benutzerverhalten zeitabhängig analysiert werden kann.
  • Die Erfindung wird im Nachstehenden anhand der Zeichnungen erläutert. Es zeigen:
  • 1: Ausführungsbeispiel des erfindungsgemäßen Netzwerks.
  • 2: Erstes Beispiel eines Logfiles.
  • 3: Strukturierung des Logfiles gemäß 1 nach Sessions.
  • 4: Zeitablauf der Sessions des Logfiles gemäß 1.
  • 5: Zeitabhängige Area-Auswertung für die Sessions gemäß 4.
  • 6: Zeitdiagramm für die Auswertung gemäß 5.
  • 7: Zweites Beispiel eines Logfiles.
  • 8: Bildung einer ersten Population mit anschließender Area-Auswertung für den Logfile gemäß 7.
  • 9: Bildung einer zweiten Population mit anschließender Area-Auswertung für den Logfile gemäß 7.
  • 10: Vektordiagramm für die Area-Auswertungen gemäß den 8 und 9.
  • 11: Bildung einer Liste auf der Basis der Area-Auswertung gemäß 8.
  • 1 zeigt schematisch ein Ausführungsbeispiel des erfindungsgemäßen Netzwerks 1. Das vorliegende Beispiel bezieht sich auf das Internet als Netzwerk 1, wobei über Kundenrechner 2 Benutzer Zugang zum Netzwerk 1 erhalten. Der Übersichtlichkeit halber ist in 1 nur ein Kundenrechner 2 darge stellt. In 1 sind dabei die Softwarekomponenten des Kundenrechners 2, das heißt des sogenannten Clients, dargestellt, mittels derer der Benutzer Zugang zum Internet erlangt. Der Kundenrechner 2 kann von einem Personal-Computer gebildet sein. Als Softwarekomponente des Kundenrechners 2 ist insbesondere ein Web-Browser vorgesehen, mittels dessen in bekannter Weise ein Zugang zum Internet hergestellt werden kann. Der Benutzer erhält Zugang zu einer Webseite, die in 1 mit W bezeichnet ist.
  • Über die Webseite können unterschiedliche Informationen erhalten werden. Hierzu werden vom Benutzer durchzuführenden Anfragen 3 auf einen Http-Server, im Folgenden Webserver 4 genannt, geführt. Generell können Anfragen 3 auch auf mehrere Webserver 4 geführt werden. Weiterhin können auch Netzwerke 1 mit anderen Servern eingesetzt werden. Zur Generierung einer Antwort 5 auf eine Anfrage 3 wird diese vom Webserver 4 einem Applikations-Server 6 zugeführt, der die Anfrage 3 bearbeitet. Im vorliegenden Fall besteht die Abarbeitung von Anfragen 3 in der Suche nach bestimmten Informationen in einer dem Applikation-Server 6 zugeordneten Datenbank 7.
  • Der Webserver 4 und der Applikations-Server 6 sind jeweils auf nicht gesondert dargestellten Serverrechnern installiert. Die Datenbank 7 ist typischerweise auf einer von den Serverrechnern unterschiedlichen Rechnereinheit installiert.
  • Um eine vom Benutzer über die Kundenrechner 2 durchgeführte Folge von Anfragen 3 eindeutig zuordnen und analysieren zu können, ist dem Webserver 4 ein Benutzungsvorgangserfassungssystem 8 zugeordnet. Das Benutzungsvorgangserfassungssystem 8 bildet wie der zugeordnete Webserver 4, ein Softwaremodul und ist mit diesem auf demselben Serverrechner installiert.
  • Das Benutzungsvorgangserfassungssystem 8 weist eine Schnittstelle 8a auf, über welche die einzelnen Anfragen 3 und Antworten 5 in einen Logger 9 eingelesen werden. Dort wird aus diesem Anfragen 3 und Antworten 5 ein Logfile generiert, der in einer Speichereinheit 10, wie zum Beispiel einer Festplatte gespeichert wird.
  • Von dort wird der Logfile in eine Analyseeinheit 11 eingegeben. Generell können die Logfiles von mehreren derartigen Systemen mit Kundenrechner 2 und daran gekoppelten Server in die Analyseeinheit 11 eingegeben werden. Hierzu weist die Analyseeinheit 11 wie in 1 dargestellt eine Eingangsstruktur 12 auf, über welche parallel mehrere derartige Logfiles eingelesen werden können.
  • In der Analyseeinheit 11 erfolgt eine Auswertung der Logfiles zur Ermittlung des Benutzerverhaltens von Benutzern. Da die Logfiles von Speichereinheiten 10 in die Analyseeinheiten 11 eingelesen werden, erfolgt die Auswertung in der Analyseeinheit 11 zeitlich entkoppelt von den Anfragen 3 der Kundenrechner 2.
  • In der Analyseeinheit 11 ist ein Logfilemerger 13 integriert, der die einzelnen eingelesenen Logfiles zu einem gesamten Logfile zusammenfasst, wobei bei dieser Zusammenfassung die korrekte zeitliche Reihenfolge der einzelnen Anfragen 3 beziehungsweise Antworten 5 erhalten wird.
  • In einem nachgeordneten Logfilefilter 14 erfolgt ein semantisches Aufbereiten des Gesamt-Logfiles, wobei im Logfilefilter 14 Kriterien definiert werden können. Diese können bereits im Logfile enthalten sein oder im Logfilefilter 14 berechnet oder definiert werden und dann in den Logfile eingefügt werden.
  • Derartige Kriterien können beispielsweise von Oberbegriffen von spezifischen Daten, die im Logfile enthalten sind, gebildet sein.
  • Hat beispielsweise ein Benutzer eine Anfrage zur Recherche nach gestreiften Anzügen an eine Datenbank eines Kaufhauses gerichtet, so ist ein geeigneter Oberbegriff, das heißt ein Kriterium für den Begriff „gestreifter Anzug" der Oberbegriff „Herrenmode". Dies kann bei Abarbeitung der Anfrage 3 durch den Server dieser Oberbegriff bereits im Logfile enthalten sein. Alternativ kann das Kriterium „Herrenmode" auch im Logfilefilter 14 generiert werden.
  • Dem Logfilefilter 14 ist ein Logfilesplitter 15 nachgeordnet, in welchen aus dem Logfile Populationen dadurch gebildet werden, dass als Bedingung wenigstens ein Kriterium in der Session erfüllt sein muss. Diese Populationen bilden somit Untermengen des Logfiles. Weiterhin wird auch eine Population All generiert, die dem ursprünglichen Logfile entspricht.
  • Diese Populationen werden dann in einzelnen Bewertungseinheiten 16 zur Generierung von Kenngrößen des Benutzerverhaltens ausgewertet. Diese Kenngrößen werden dann als Ergebnisdateien aus der Analyseeinheit 11 ausgegeben und beispielsweise in einem externen Auswertesystem 17 graphisch aufbereitet.
  • 2 zeigt ein erstes Beispiel eines Logfiles. Generell weist ein solcher Logfile große Datenmengen auf. Der Übersichtlichkeit halber umfasst der Logfile gemäß 1 nur sieben Aktionen, das heißt sieben Anfragen 3 des Kundenrechners 2 auf welche jeweils eine Antwort 5 generiert wurde. Die einzelnen Aktionen sind im Logfile durch Zeitstempel T1 ... T7 gekennzeichnet, wobei jeder Zeitstempel durch den Zeitpunkt der Antwort 5 auf die jeweilige Anfrage 3 einer Aktion definiert ist. Der Logfile ist nach aufsteigenden Zeitpunkten (Zeitstempeln) geordnet. Weiterhin sind für die einzelnen Aktionen die Session-ID S1, ... S4 im Logfile enthalten. Diese Session-ID werden vom Applikations-Server vergeben und kennzeichnen die jeweilige Session in der die jeweilige Anfrage bearbeitet wurde. Ebenso können die Session-ID vom Benutzungsvorgangserfassungssystem 8 vergeben werden. Schließlich sind im Logfile unterschiedliche Kriterien crit1 ... crit7 enthalten, wobei im vorliegenden Fall jeder Aktion ein solches Kriterium zugeordnet ist. Schließlich sind in 2 als Hilfsgrößen sogenannte Clicks C1 ... C3 aufgeführt. Diese sind nicht Bestandteil des Logfiles sondern kennzeichnen die einzelnen Aktivierungen unterschiedlicher Sessions. So kennzeichnet bei der ersten Aktion mit dem Zeitstempel T1 der Click C1, dass die Session S1 zum ersten Mal gestartet wurde. Entsprechend kennzeichnet der Click C2 in der Aktion mit dem Zeitstempel T5, dass dort die Session S1 zum zweiten Mal gestartet wurde. Ebenso kennzeichnen die Clicks C1, C2 beziehungsweise C3 in den Aktionen mit den Zeitstempeln T2, T3 beziehungsweise T4, dass die Session S2 zum ersten, zweiten beziehungsweise dritten Mal gestartet wurde.
  • 3 zeigt einen ersten Schritt der Auswertung des Logfiles gemäß 2, der mit einer Bewertungseinheit 16 der Analyseeinheit 11 durchgeführt wird. Im vorliegenden Fall erfolgt die Auswertung anhand der Population All, das heißt dem vollständigen Logfile.
  • Wie aus 3 ersichtlich, werden die einzelnen Aktionen des Logfiles nach Sessions sortiert. Für diese einzelnen Sessions können Subprozesse 1 ... 4 gebildet werden, die dann wie in 3 dargestellt parallel ausgewertet werden können. Die zu den einzelnen Sessions gehörenden Aktionen sind jeweils nach aufsteigenden Zeitstempeln geordnet.
  • Dabei kann diese Auswertung bevorzugt zeitaufgelöst erfolgen. Dies ist im Zeitdiagramm von 4 veranschaulicht, welches die Start- und Endzeitpunkte der Sessions S1 ... S4 der Logfiles zeigt. Die Auswertung des Logfiles erfolgt dabei in diskreten Zeitintervallen I, II, III, deren Dauer beispielsweise jeweils eine Stunde beträgt.
  • Die entsprechende Auswertung für die einzelnen Zeitintervalle I, II, III ist in 5 veranschaulicht. Die in der Analyseeinheit 11 vorgenommene Auswertung erfolgt derart, dass für die einzelnen Sessions, deren Aufteilung in 3 beschrieben ist und deren Zeitverlauf in 4 dargestellt ist, sogenannte Areas gebildet werden. Die Bildung einer Area für die Sessions erfolgt derart, dass für wenigstens ein Kriterium der Sessions eine Mengenbedingung gebildet wird.
  • Für das Ausführungsbeispiel gemäß den 2 bis 4 kann eine derartige Area beispielsweise derart gebildet werden, dass als Mengenbedingung geprüft wird, welche Sessions das Kriterium crit1 erfüllen. Als Ergebnis wird die Zahl 2 erhalten, da diese Bedingung für die Aktion bei T1 (Sessions S1) und die Aktion bei T4 erfüllt ist. Die Zählung der zugehörigen Clicks ergibt ebenfalls die Zahl 2. Weiterhin wird die Zeitdauer dieser ermittelten Sessions als weitere Kennzahl, der sogenannten Viewtime ermittelt. Die Zeitdauer für die Sessions S1 beträgt T5 – T1, da sie zum Zeitpunkt T1 startet und zum Zeitpunkt T5 die Session S1 von neuem gestartet wird. Die Session S2 wird zum Zeitpunkt T4 gestartet. Jedoch gibt es hier keine Nachfolgeaktion im Logfile, mit welcher S2 nochmals gestartet wird. Daher wird hier als Durchschnittszeit der Wert Avg (Average) gesetzt. Dies führt in der Summe zur Viewtime T5 – T1 + Avg. Diese bildet mit dem Zahlenpaar 2, 2 für die Sessions und Clicks die die Bedingung crit1 ist erfüllt eine Area. Generell können auch größere Anzahlen verschiedener Eigenschaften zur Bildung von Areas herangezogen werden.
  • 5 zeigt die entsprechende zeitaufgelöste Area-Auswertung für den Zeitverlauf der Sessions in 4. Dabei erfolgt die Auswertung derart, dass für die einzelnen Zeitintervalle I, II, III immer die Sessions ausgewertet werden, die im entsprechenden Zeitintervall I, II oder III enden. Im Beispiel gemäß 4 endet im Zeitintervall I keine Session, so dass dort überhaupt keine Auswertung stattfindet.
  • Dagegen endet im Zeitintervall II die Session S2, so dass, wie in 5 dargestellt, gemäß dem Subprozess 2 in 3 hier die Session S2 ausgewertet wird.
  • Als Normierungsgröße wird zunächst die Area „All" gebildet, das heißt es werden alle Sessions S2 betrachtet, unabhängig von der Erfüllung eines Kriteriums. Wie in 3 dargestellt, wird die Session S2 mit den Clicks C1, C2, C3 der Aktionen zu den Zeitpunkten T2, T3, T4 dreimal aktiviert, das heißt die Anzahl der Clicks für die Area All beträgt 3. Die Viewtime hierfür beträgt (T3 – T2) + (T4 – T3) + Avg, da die erste Aktivierung der Session S2 zum Zeitpunkt T2 durch den Click C2 bei T3 beendet wird, die zweite Aktivierung von S2 bei T3 mit dem Click C3 bei T4 beendet wird und nach der Aktivierung der Session S2 bei T4 kein Nachfolger mehr existiert, so dass hier die Durchschnittszeit Avg angesetzt wird. Die Area All wird schließlich komplettiert durch die Zahl der Session im Zeitintervall II. Diese ist eins, da dort nur die Session S2 endet.
  • Als weitere Area im Zeitintervall II wird die Area „crit1 erfüllt" gebildet. Da das Kriterium der Area „crit1 erfüllt" nur für die Aktion bei T4 erfüllt ist, ist die Anzahl der Clicks in diesem Fall 1. Da die Aktion bei T4 keinen Nachfolger hat, nimmt die Viewtime den Wert Avg an. Die Anzahl der Sessions beträgt wieder 1.
  • Im Zeitintervall III des Diagramms gemäß 4 enden drei Sessions, nämlich S1, S3 und S4.
  • Die entsprechende Area-Auswertung für das Zeitintervall III zeigt wieder 5. Hierbei wird wieder die Area „All" gebildet, da alle Sessions S1, S3, S4 ohne die einschränkende Bedingung, ob ein Kriterium erfüllt ist, berücksichtigt werden. Da im Zeitintervall III drei Sessions (S1, S3, S4) enden, beträgt die Anzahl der Sessions 3. Da für die Session S1 zwei Clicks (bei den Aktionen zu den Zeitpunkten T1, T5) und für die Sessions S3, S4 jeweils nur ein Click existieren, beträgt die Anzahl der Clicks 4. Die Zeitdauer für die Sessions S1 beträgt T5 – T1 + Avg. Die Zeitdauer für die Session S3, ebenso wie die Zeitdauer für S4, beträgt Avg, so dass sich als gesamte Viewtime der Wert (T5 – T1) + 3; Avg ergibt.
  • Weiterhin wird auch für das Zeitintervall III die Area „crit1 ist erfüllt" gebildet. Da crit1 nur bei der Session S1 in der Aktion zum Zeitpunkt T1 erfüllt ist, ist für diese Area die Zahl der Sessions 1 und die Zahl der Clicks 1. Da diese Session S1 zum Zeitpunkt T1 durch den neuen Start der Session S1 bei T5 beendet wird, beträgt die Viewtime (T5 – T1).
  • Diese zeitaufgelöste Area-Auswertung kann beispielsweise in der Graphik gemäß 6 visualisiert werden. Dieses Zeitdiagramm zeigt den zeitlichen Verlauf der Anzahl der Sessions für die Area All (durchgezogene Linie) und die Area „crit1 ist erfüllt" (gestrichelte Linie) zu den Zeiten I, II, III gemäß dem Zeitraster von 4. Mit derartigen Diagrammen kann beispielsweise genau analysiert werden, wie sich der Anteil bestimmter Kriterien im Verhältnis zur Gesamtzahl der getätigten Anfragen 3 verhält.
  • 7 zeigt ein weiteres Beispiel eines Logfiles. Der dort dargestellte Logfile stellt eine Erweiterung des Logfiles der 2 und 3 dahingehend dar, dass neben den dort angeführten Kriterien crit1 ... crit7 in einer UND-Verknüpfung jeweils ein weiteres Kriterium a oder b in jeder Aktion definiert ist. Dabei sind den Kriterien a, b zudem konkrete Inhalte, das heißt Werte zugeordnet. Dem Kriterium a sind die Werte radio, auto oder dvd zugeordnet. Dem Kriterium b ist als Wert eine ja- oder nein-Aussage zugeordnet. Der Logfile gemäß 7 ist analog zur Auswertung gemäß 3 bereits nach Sessions sortiert.
  • Aus dem Logfile gemäß 7 werden, wie in den 8 und 9 dargestellt, verschiedene Populationen gebildet. 8 zeigt die Bildung der Population „All", das heißt dieser Population ist vom Logfile gemäß 7 selbst gebildet.
  • 9 zeigt eine Population, die als Untermenge des Logfiles gemäß 7 gewonnen wird, in dem als Bedingung „Kriterium a ist vorhanden" gestellt wird. Diese Bedingung für die Sessions S1, S2, S3 erfüllt, so dass diese die Population „enthält a" bilden.
  • Für die beiden Populationen erfolgt eine Area-Auswertung, die der Auswertung gemäß 5 entspricht. Dabei ist in den Ergebnis-Tabellen der 8, 9 die Auswertung der Viewtime nicht gesondert dargestellt. Vielmehr sind in den Tabellen der 8, 9 nur bei der Area-Auswertung ermittelten Anzahlen der Sessions und Clicks dargestellt, die im vorliegenden Fall eine nicht zeitauf gelöste Auswertung enthalten. Weiterhin ist in den Tabellen die auf die Anzahl der Session für die Area All normierte Anzahl der Sessions aufgetragen.
  • Da die Population All (8) vier Sessions S1, S2, S3, S4 enthält, ist die Anzahl der Sessions für die Area All 4. Da diese Anzahl die Normierungskonstante bildet, ist die normierte Zahl der Sessions für die Area All eins. Die Anzahl der Sessions für die Area, die durch die Bedingung „Kriterium 1 ist erfüllt" definiert ist, ist 2, da diese Bedingung für die Sessions S1, S2 erfüllt ist. Die normierte Anzahl der Sessions beträgt 0,5. Entsprechend wird für die Area, die durch die Bedingung „a ist erfüllt" definiert ist, als Anzahl der Sessions 3 erhalten, da diese Bedingung für die Sessions S1, S2, S3 erfüllt ist. Die normierte Anzahl der Sessions beträgt 0,75. Schließlich wird für die durch die Bedingung „b ist erfüllt" definierte Area die Anzahl von drei Sessions erhalten, da diese Bedingung für die Sessions S1, S2, S4 erfüllt ist.
  • Für die Area „All" in der Population „All" gemäß 8 werden insgesamt 7 Clicks bei T1, T2, T3, T4, T5, T6, T7 registriert. Die Area „crit1 ist erfüllt" enthält 2 Clicks (bei T1, T4), die Area „a ist erfüllt" enthält 4 Clicks (bei T1, T2, T4, T6), die Area „b ist erfüllt" enthält 3 Clicks (bei T5, T3, T7).
  • Die Area-Auswertung für die Population „enthält a" gemäß 9 erfolgt analog zur Auswertung gemäß 8. Da in der Population gemäß 9 nunmehr die Session S4 nicht mehr enthalten ist, werden für die Area All nur noch 3 Sessions und 6 Clicks erhalten. Entsprechend werden für die weiteren Areas die in der Tabelle von 9 dargestellten Werte erhalten.
  • Die normierten Anzahlen der Sessions, die in den Area-Auswertungen der Tabellen von 8, 9 erhalten wurden, können wie in 10 dargestellt in einem Vektordiagramm dargestellt werden. Die Koordinatenachsen sind von den normierten Werten der Areas crit1, a, b gebildet. In dieses Koordinationssystem werden die normierten Anzahlen der Sessions für die Population All (durchgezogene Linie) und die Population „enthält a" (gestrichelte Linie) ein getragen. Dadurch wird ein schneller optischer Vergleich unterschiedlicher Populationen ermöglicht.
  • 11 zeigt eine Liste, die für die Area „a ist da" der Population „All" aus dem Logfile gemäß 7 gewonnen wurde. Diese Liste enthält die Anzahlen der Sessions und Clicks, für welche jeweils für das Kriterium a die konkreten Inhalte „radio", „auto" oder „dvd" realisiert sind.
  • 1
    Netzwerk
    2
    Kundenrechner
    3
    Anfrage
    4
    Webserver
    5
    Antwort
    6
    Applikations-Server
    7
    Datenbank
    8
    Benutzungsvorgangserfassungssystem
    9
    Logger
    10
    Speichereinheit
    11
    Analyseeinheit
    12
    Eingangsstruktur
    13
    Logfilemerger
    14
    Logfilefilter
    15
    Logfilesplitter
    16
    Bewertungseinheit
    17
    Auswertesystem

Claims (10)

  1. Netzwerk umfassend eine Anzahl von Kundenrechnern und auf Serverrechnern installierten Servern, wobei auf eine von einem Kundenrechner an einen Server gerichtete Anfrage von diesem eine Antwort an den Kundenrechner ausgebbar ist, wobei die Inhalte einer Folge von Anfragen und Antworten in einem Logfile abgespeichert sind, wobei die einzelnen Anfragen und Antworten jeweils mit einem Zeitstempel und einer Session-ID abgespeichert sind, dadurch gekennzeichnet, dass der Logfile die Inhalte der Anfragen (3) und Antworten (5) kennzeichnende Kriterien enthält, dass in einer Analyseeinheit (11) eine Sortierung des Logfiles nach durch die Session-ID gekennzeichneten Session erfolgt und darauf durch Bildung von Mengenbedingungen für Kriterien einzelner Sessions Areas bildende Zahlenfolgen zur Bildung von Kenngrößen für das Benutzerverhalten des Benutzers der jeweiligen Kundenrechner generiert werden.
  2. Netzwerk nach Anspruch 1, dadurch gekennzeichnet, dass zur Bildung einer Area die Anzahl der Sessions ermittelt wird, für welche wenigstens ein Kriterium erfüllt ist.
  3. Netzwerk nach einem der Ansprüche 1 oder 2, dadurch gekennzeichnet, dass eine Area als weitere Zahlengröße die Zeitdauer wenigstens einer Session enthält.
  4. Netzwerk nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass in der Analyseeinheit (11) die Zeitabhängigkeit von Areas ermittelt wird.
  5. Netzwerk nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass in der Analyseeinheit (11) durch Bildung von Bedingungen, ob eine vorgegebene Anzahl von Kriterien erfüllt, als Populationen Untermengen des Logfiles gebildet werden.
  6. Netzwerk nach Anspruch 5, dadurch gekennzeichnet, dass eine Population vom Logfile selbst gebildet sein kann.
  7. Netzwerk nach einem der Ansprüche 5 oder 6, dadurch gekennzeichnet, dass aus den einzelnen Populationen Areas gebildet werden.
  8. Netzwerk nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass in der Analyseeinheit (11) für einzelne Areas Listen gebildet werden, welche einzelnen Kriterien zugeordnete Inhalte von Anfragen (3) oder Antworten (5) enthalten.
  9. Netzwerk nach einem der Ansprüche 1 bis 8, dadurch gekennzeichnet, dass in der Analyseeinheit (11) aus den Inhalten von Anfragen (3) und Antworten (5) Kriterien abgeleitet und in den Logfile eingefügt werden.
  10. Netzwerk nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, dass die in der Analyseeinheit (11) durchgeführte Auswertung zeitlich entkoppelt vom zeitlichen Ablauf der Anfragen (3) und Antworten (5) erfolgt.
DE200710002533 2007-01-17 2007-01-17 Netzwerk Ceased DE102007002533A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE200710002533 DE102007002533A1 (de) 2007-01-17 2007-01-17 Netzwerk

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE200710002533 DE102007002533A1 (de) 2007-01-17 2007-01-17 Netzwerk

Publications (1)

Publication Number Publication Date
DE102007002533A1 true DE102007002533A1 (de) 2008-08-14

Family

ID=39597350

Family Applications (1)

Application Number Title Priority Date Filing Date
DE200710002533 Ceased DE102007002533A1 (de) 2007-01-17 2007-01-17 Netzwerk

Country Status (1)

Country Link
DE (1) DE102007002533A1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012036557A1 (en) * 2010-09-13 2012-03-22 Online Userfacts As System and method for traffic analysis
CN108228613A (zh) * 2016-12-14 2018-06-29 北京国双科技有限公司 数据的读取方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012036557A1 (en) * 2010-09-13 2012-03-22 Online Userfacts As System and method for traffic analysis
US8886800B2 (en) 2010-09-13 2014-11-11 Online Userfacts As System and method for traffic analysis
CN108228613A (zh) * 2016-12-14 2018-06-29 北京国双科技有限公司 数据的读取方法及装置

Similar Documents

Publication Publication Date Title
WO2000003323A2 (de) System und verfahren zum prüfen von netzwerk-anwendungen
EP1783633B1 (de) Suchmaschine für eine ortsbezogene Suche
DE112018005452T5 (de) Schlüsselbasiertes loggen für die verarbeitung strukturierter datenelemente mit ausführbarer logik
WO2000023923A1 (de) Verfahren zur datenbankgestützten selektion von produkten für electronic-commerce-anwendungen im internet
EP1755049B1 (de) Verfahren zur Übermittlung von Informationen von einem Informationsserver an einen Client
DE60037681T2 (de) Verfahren zum automatischen und gesicherten suchen von daten mit hilfe eines datenübertragungsnetzwerks
WO2005091184A1 (de) Informationssystem
DE102007002533A1 (de) Netzwerk
EP1484696B1 (de) Verfahren zum Optimieren eines auf eine Netzwerkseite verweisenden Verweises
EP3139274B1 (de) Verfahren zum ermitteln einer netto-durchlaufzeit zwischen prozessschritten einer prozessinstanz
DE19963123B4 (de) Analytisches Informationssystem
EP3139273B1 (de) Verfahren zum ermitteln von parallelen prozesspfaden in prozessdaten
DE10393809B4 (de) Computer-implementiertes Verfahren zum Verarbeiten von Information, die zwischen einem Client und einem Server ausgetauscht wird
EP1755048A1 (de) Verfahren zur Übermittlung von Informationen von einem Informationsserver an einen Client
DE102007002534A1 (de) Netzwerk
EP1983450A2 (de) Verfahren und Vorrichtung zur Ermittlung und Bereitstellung von Information zu einem Bild
DE10108564A1 (de) Verfahren zur Suche nach in einem verteilten System aktuell oder früher gespeicherten Daten oder Daten enthaltenden Ressourcen unter Berücksichtigung des Zeitpunkts ihrer Verfügbarkeit
EP1629401A2 (de) Verfahren und anordnung sowie computerprogramm mit programmcode-mitteln und computerprogramm-produkt zur analyse von gem ss e iner datenbankstruktur strukturierten nutzdaten
EP3076343A1 (de) Verfahren zur zuordnung sprachlicher eingaben
EP2077523B1 (de) Verfahren zur Ermittlung von relevanten Informationen
DE102006051826B3 (de) Netzwerk
EP3686740A2 (de) Verfahren zum erstellen von prozessprotokollen
DE10123773A1 (de) Verfahren zur Suche nach Inhalten eines Rechnernetzwerks
Rogge et al. Political trust in Europe: the combined effect of quality of democracy and corruption
von Websites Torsten J. Gerpott

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
R011 All appeals rejected, refused or otherwise settled
R003 Refusal decision now final

Effective date: 20130520