Logdateianalyse
Bei der Logfile-Analyse wird das Logfile eines Zeitraumes nach bestimmten Kriterien untersucht.
Je nach Art und Umfang der Aufzeichnung des Logfiles kann man daraus verschiedene Schlüsse ziehen.
Analyse bei Webserver-Logfiles
Die interpretierten Statistiken ermöglichen es, den Aufbau und die Struktur der Internetseite zu optimieren. Sie sind Grundlage für Usability-Analysen oder liefern Aussagen über den Erfolg einer Marketingaktion. Ein Beispiel für eine Logfile-Analyse bietet die Wikipedia Serverstatistik.
Einige mögliche Fragestellungen
- Wie lauten IP-Adresse und Hostname des Nutzers?
- Welchen Browser hat er genutzt?
- Auf welcher Seite stand der Link, mit dem der Nutzer auf die Seite gekommen ist?
- Welche Suchmaschine bzw. Suchwörter hat er genutzt?
- Wie lange blieb er auf der Webseite?
- Wie viele Seiten ruft er dabei auf?
- Auf welcher Seite hat er die Webseite verlassen?
- Welche Ergänzungsmodule hat er installiert?
- Welches Betriebssystem nutzt er?
Probleme bei der Analyse
Das Hauptproblem der Logfile-Analyse bei Webserver-Logfiles, ist die Tatsache, dass HTTP ein zustandsloses Protokoll ist. Das heißt, jede Anfrage eines Clients nach einer Webseite (oder jeder einzelnen darin vorkommenden Grafik usw.), ist für den Webserver eine eigenständige Aktion. Klickt sich der Benutzer duch eine Website, hat der Webserver keinerlei Kenntnis, dass der Benutzer gerade schon eine Seite abgerufen hat.
Um trotzdem ein zustandsbehaftetes HTTP zu ermöglichen, werden bei dynamisch erzeugten Webseiten üblicherweise beim ersten Aufruf des Benutzers eine so genannte Session-ID vergeben, die der Client dann bei den folgenden Anfragen immer mitsendet. Dies kann über einen Cookie oder einen an jeden URI zusätzlich angehängten Parameter erfolgen, wobei ein Cookie jedoch nicht im Logfile sichtbar ist und eine gesonderte Programmierung für die Logfile-Analyse benötigt.
Eine andere im HTTP-Protokoll vorhandene Möglichkeit einen Benutzer zu identifizieren, ist die Verwendung der IP-Adresse. Diese kann jedoch für viele unterschiedliche Benutzer dieselbe sein, wenn diese einen Proxyserver, Network Address Translation oder Ähnliches verwenden. Sie sind daher nur mit größter Vorsicht zu verwenden, da eine IP-Adresse nicht mit einem Benutzer gleichzusetzen ist.
Programme zur Logfile-Analyse einer Website
- Open Source
- Analog http://www.analog.cx/
- Webalizer http://www.webalizer.org/
- LogReport http://logreport.org/
- Kommerzielle Programme
- WebTrends http://www.netiq.com/webtrends
- NetTracker http://www.sane.com/
- Funnel Web http://www.quest.com/funnel_web/analyzer/