[ Druckansicht der Seite: https://www.e-teaching.org/didaktik/qualitaet/logfile/index_html ]

Logo

Logfile-Analyse

Logfile-Analysen sind Zugriffstatistiken, die Auskunft über die Nutzung eines Internet-Angebotes geben. Grundlage von Logfile-Analysen sind die Log-Dateien des Web-Servers, in denen alle Zugriffe protokolliert werden.

logfile icon

Jedes Log-Datei-Format enthält im wesentlichen dieselben Informationen. Sie sind lediglich in einer unterschiedlichen Reihenfolge gemäß einer der üblichen Standards angeordnet. Die vier wichtigsten Standards sind die Formate NCSA, W3SVC, Microsoft IIS3.0 und O'Reilly. Die meisten anderen Standards sind Variationen dieser Formate.

Eine Log-Datei beinhaltet meistens die folgenden Informationen:

  • IP oder DNS -Adresse des zugreifenden Computers,
  • Benutzername (bei passwortgeschützten Accounts),
  • Zeitpunkt des Zugriffs,
  • Kommando, das an den Server gestellt wird - meistens wird mit dem Befehl (GET) eine Datei angefordert,
  • Dateiname und Pfadangabe,
  • das benutzte Übertragungsprotokoll, z.B. HTTP 1.0,
  • die Antwort des Servers, z.B. 200 (Übertragung erfolgreich), 404 (Datei nicht gefunden), 503 (Server überlastet),
logfile icon funktion

Auswertung

Log-File Statistiken sollten sorgfältig geprüft und vorsichtig interpretiert werden (vgl. Heindl, 2003). Die Hauptprobleme bei der Auswertung sind zum einen die Unterscheidung einzelner Nutzer und zum anderen unvollständige Daten auf Grund von Caching.

Es kann vorkommen, dass mehrere Nutzer unter der gleichen IP-Adresse auf das Angebot zugreifen und in den Log-Dateien als einzelner Nutzer gewertet werden. Gleichzeitig kann auch ein einzelner Nutzer auf Grund von dynamischer IP-Vergabe mehrfach gezählt werden. Das Cachen von Webseiten durch Browser oder Proxy-Server kann die Zugriffszahlen nach unten verfälschen.

Wenn man diese Einschränkungen bei der Auswertung berücksichtigt, können Logfile-Daten Kennzahlen für die Nutzung eines Internetangebotes liefern. Im folgenden Sind einige gängige Dimensionen zur Auswertung von Logfiles aufgeführt:

  • Jede Zeile im der Logdatei des Web-Servers erzeugt einen so genannten Hit. Hits erfassen damit alle Dateien, die vom Server zum Client übertragen werden. Wenn in eine HTML-Seite beispielsweise Bilder eingebunden sind, erzeugen diese zusätzliche Hits. Sogar nicht gefundene Dateien werden als Hits gezählt. Für die Einschätzung des tatsächlichen Erfolgs einer Web-Seite sind Hits somit nicht geeignet. Sie können anhand der Hits jedoch zum Beispiel herauszufinden, wie sich der Gesamtverkehr (Traffic) auf der Website über bestimmte Zeiträume hinweg entwickelt.
  • Pageviews (Page-Impressions, Seiten-Anfragen) messen die Anzahl von Aufrufen einzelner Webseiten eines Online-Angebotes. Sie können daran sehen, welche Bereiche die Nutzer besonders interessieren.
  • Sessions  (Visits, Besuche, Sitzungen) geben Auskunft über die Zugriffe auf das gesamte Webangebot. Per Konvention gilt eine Session als beendet, wenn 30 Minuten lang kein neuer Zugriff erfolgt. Die durchschnittliche Dauer einer Session können ebenso wie die pro Session erfolgten Seitenaufrufe Hinweise auf die Intensität der Nutzung geben.
  • Die Zahl der Visitors (Besucher) zeigt, wie viele einzelne Besucher in einem definierten Zeitraum auf das Internetangebot zugegriffen haben. Aus der Anzahl der Mehrfach-Besucher und über die Sessions pro Besucher können Schlussfolgerungen gezogen werden, ob das Internetangebot für eine regelmäßige Nutzung attraktiv ist.
  • Klickpfade zeigen den Weg einzelner Nutzer durch das Webangebot. Sie können Aufschluss darüber geben, wie die Nutzer mit der Navigation und Verlinkung innerhalb des Hypertextes umgehen. Seiten, auf denen besonders viele Nutzer das Internetangebot verlassen, können unter Umständen einer Überarbeitung bedürfen.

Technik

Es stehen diverse Produkte mit unterschiedlichem Funktionsumfang zur Verfügung, mit denen sich Log-Files auswerten lassen. Das Portal e-teaching.org verwendet zur Logfile-Auswertung das Produkt Sawmill.

Links im Artikel

IP: https://www.e-teaching.org/didaktik/qualitaet/logfile/resolveuid/92eb26b0023c4400b58d8604e3e060e1

DNS: https://www.e-teaching.org/didaktik/qualitaet/logfile/resolveuid/eed644f0a473442c8ea4a2b293ead220

Accounts: https://www.e-teaching.org/didaktik/qualitaet/logfile/resolveuid/7c4d9aca41144f9fb66410d1bfdfd776

Server: https://www.e-teaching.org/didaktik/qualitaet/logfile/resolveuid/008d68fdeb3b41bdbef4ea24f688a427

Byte: https://www.e-teaching.org/didaktik/qualitaet/logfile/resolveuid/d1782b1028404506af87695e3b77ed91

URL: https://www.e-teaching.org/didaktik/qualitaet/logfile/resolveuid/ec56c0afb6c143ec87d7c8a8615da466

Browser: https://www.e-teaching.org/didaktik/qualitaet/logfile/resolveuid/512118487f2e4504a07842bb086f919d

Betriebssystem: https://www.e-teaching.org/didaktik/qualitaet/logfile/resolveuid/b4b2c02f6f6b47ec8a8fa8284204393a

Heindl, 2003: https://www.e-teaching.org/didaktik/qualitaet/logfile/resolveuid/680d0f44b1cc44868ca2deee4e117edf

Cachen: https://www.e-teaching.org/didaktik/qualitaet/logfile/resolveuid/8a2e2eece65840ce9175a0437ca2e1ee

Proxy-Server: https://www.e-teaching.org/didaktik/qualitaet/logfile/resolveuid/0e88ef18190a462fbdeadd650fbc5cb8

Client: https://www.e-teaching.org/didaktik/qualitaet/logfile/resolveuid/63c86f92143d44de87babc4e78f54bf1

HTML: https://www.e-teaching.org/didaktik/qualitaet/logfile/resolveuid/481b9192685846ba8a436f14d2223334

Sessions: https://www.e-teaching.org/didaktik/qualitaet/logfile/resolveuid/874e546c74ce451b97436fbbf4726cc2

Sawmill: http://www.haage-partner.de/sawmill/

Zitation

e-teaching.org (2016). Logfile-Analyse. Zuletzt geändert am 27.01.2016. Leibniz-Institut für Wissensmedien: https://www.e-teaching.org/didaktik/qualitaet/logfile/index_html. Zugriff am 29.03.2023