| Was sind Logfiles? |
|
|
|
| Geschrieben von: Michael Lieder |
| Donnerstag, den 20. August 2009 um 22:58 Uhr |
|
Die Logfiles sind Grundlage einer Statistik; sie enthalten die Informationen, die in der Statistik graphisch veranschaulicht werden. Bei Bedarf stellen wir Ihnen auch gerne Rowlogs zur Verfügung. Logfiles sind somit automatisch erstellte Dateien, die jede Aktion eines Web-Servers protokollieren. Die Logfile-Analyse, so heißt es oft, ist essenziell bei der Analyse des Besucherverhaltens. Dagegen lässt sich nichts sagen: schließlich sind die Logfiles objektive Protokolle, die festhalten, was von den Surfern an Ihren Server geschickt wurde. Was dagegen oft verschwiegen wird: so unverzichtbar Logfiles auch sind, mit den Ergebnissen von Logfile-Analysen und daraus folgenden Interpretationen sollte man zunächst einmal vorsichtig umgehen. Denn: die in Logfiles gespeicherten Daten sind selbst nicht immer korrekt bzw. vollständig, und auch den Programmen können Fehler bei der Datenanalyse unterlaufen. Nicht zuletzt ist da auch noch der Faktor Mensch, der aus den Ergebnissen Schlüsse ziehen muss. Fehler/Ungenauigkeiten in Logfiles selbst Man kann davon ausgehen, dass all das, was direkt vom Server ins Logfile geschrieben wird, auch korrekt ist: Datum und Zeit eines Abrufs, abgerufenes Objekt, übertragene Datenmenge etc. Kritisch wird es dagegen bei den Bereichen, die vom Browser geschickt werden: der User-Agent-Bereich und der Referrer. User-Agent User-Agent-Angaben zum Beispiel lassen sich leicht fälschen. Sie denken, das tut keiner? Irrtum: Alternative Browser z.B. geben sich schon mal gerne als Internet Explorer aus, um Probleme zu vermeiden. Gleiches gilt für automatisierte Saug-Programme, die alle Unterseiten Ihrer Homepage auf einmal herunterladen. Und wenn dann ungünstige Bedingungen zusammentreffen, können daraus ziemlich ärgerliche Konsequenzen entstehen. Stellen Sie sich beispielsweise das Szenario vor, dass Ihre Site sehr häufig komplett heruntergeladen wird und dass sich die meisten dieser Saug-Programme als Netscape 4.x ausgeben. Ihre Logfile-Analyse wird Sie dann zum Schluss führen, dass sehr viele Ihrer Besucher alte Browser verwenden, und Sie werden als Reaktion darauf mehr - unnötige? - Zeit auf die Optimierung Ihrer Seitendarstellung verwenden. Referrer Noch schöner wird's beim Referrer, der ja die zuletzt besuchte Seite angibt. Theoretisch lässt sich so ermitteln, welche Sites freundlicherweise einen Link auf die eigene Seite gesetzt haben. Auch die Effizienz von Linktausch-Programmen lässt sich so abschätzen. Jedoch: die Übertragung des Referrers kann von spezieller Software abgeblockt werden. Manche Anwender machen davon regen Gebrauch. Auch die Verwendung seltsamer Navigationsmethoden (z.B. bestimmte Java-Menüs) kann dazu führen, dass der Referrer nicht übermittelt wird. Und die Moral von der Geschicht': der Referrer sagt uns zwar, wer uns linkt, wer uns nicht linkt, das sagt er aber nicht. Caching Caching macht alles nur noch schlimmer: dadurch kann es passieren, dass Surfer zwar Ihre Seite sehen, aber trotzdem keine Spuren in Ihren Logfiles hinterlassen. Zumindest sind die Effekte hier nicht so negativ: schlimmstenfalls glauben Sie, Sie hätten weniger Besucher als das wirklich der Fall ist. Und das ist doch immerhin besser als umgekehrt... Analyse-Meister Auch perfekte Logfiles würden noch längst nicht zur perfekten Analyse führen, denn dazu müssten die dafür verantwortlichen Programme erst einmal perfekt arbeiten. Da sind zum einen natürlich die kaum vermeidbaren Bugs, die Programm-Fehler. Sie können jederzeit und unerwartet auftreten und zu völlig falschen Resultaten führen. Bei Software, die schon länger verfügbar ist, sind solch gravierende Fehler aber kaum zu erwarten. Klammern wir sie daher aus unseren Überlegungen aus. Interessant ist dann beispielsweise, wie Ihr Analyseprogramm einen "Visit" definiert. Oft wird davon ausgegangen, dass ein Visit alle Seitenabrufe von einer IP-Adresse innerhalb von 30 Minuten umfasst. Damit ist schon klar, dass die Zahl der Visits etwas ganz anderes ist als die der tatsächlichen unterschiedlichen Benutzer. Und was ist, wenn diese Visit-Definition auf Sie überhaupt nicht zutrifft? Ein anderer Bereich ist die Erkennung von Browsern und Suchmaschinen-Spidern. Manche Programme (z.B. WebSuxess 4) definieren jeden Browser, den sie nicht kennen, als "Unbekannt". Nur woher soll der Anwender wissen, dass sein Programm den IE 6 nicht kennt? Regelmäßige Updates sind also Pflicht. Ähnliches gilt für Suchmaschinen-Spider: richtig wäre, die von Spidern verursachten Seitenabrufe zumindest irgendwo von den Gesamt-Seitenabrufen abzuziehen. Kann Ihr Programm das bzw. tut es das? Je nachdem verändert das den Kontext, in dem die Analyse-Ergebnisse interpretiert werden müssen, massiv. Der Faktor Mensch Und zum Schluss bleibt noch der Mensch, der immer auch falschen Schlüsse ziehen kann. Seien Sie sich der Fehlbarkeit Ihrer Logfile-Analyse immer bewusst, und versuchen Sie, dort gewonnene Erkenntnisse mit Umfragen zu bekräftigen. Auf der Basis solch doppelter Bestätigung lohnen sich tiefgreifende Veränderungen und Umstellungen schon viel eher.
|
| Zuletzt aktualisiert am Freitag, den 21. August 2009 um 16:41 Uhr |



