The Webalizer is a fast, free web server log file analysis program. It produces highly detailed, easily configurable usage reports in HTML format, for viewing with a standard web browser.

It was written to solve several problems that I had with currently available analysis packages. A vast majority of them were written in Perl or some other scripting language, and took forever to run. Some were not free. Some even produced wrong results, or results that were not in a format I found very useful.

http://www.mrunix.net/webalizer/

Hits: [Anfragen] Ein Hit ist eine Anfrage an den Webserver, wobei es keine Rolle spielt, welcher Datei-Typ, ob Text, Grafik usw., angefordert wird. Unerheblich ist auch, ob die Anfrage berechtigt oder erfolgreich war. Wird z.B. eine HTML-Seite angefordert, auf der 5 Grafiken zu sehen sind erzeugt das also 6 Hits. Der Aussagewert ist also nicht sehr groß.

Files: [Dateien] Auf erfolgreiche Anfragen hin sendet der Webserver Dateien aus, welche als “Files” gezählt werden. Die Verwandschaft zwischen “Hits” und “Files” kann man als “eingehende Anfragen/Hits” und “ausgehende Antworten/Files” ansehen. Die Anzahl der Files ist vom Aufbau der Webseiten abhängig.

Pages: Hier werden nur HTML-Seiten oder von Skripten generierte HTML-Seiten gezählt. Der Server erkennt Dateien mit den Endungen .htm, .html, .cgi als “Pages”. Oftmals werden “pages” oder “pageviews” als die echten Zugriffszahlen genannt. Um aber eine differenzierte Statistik zu erhalten sind natürlich mehr Daten als “nur” die HTML-Seiten nötig.
Im Unterschied zu Files/Dateien ist eine Seite/Page etwas, was HTML enthält – also: kein Bild, kein CSS usw. Wichtig: Es kommt darauf an, welche Extensions in der Webalizer Konfiguration angegeben sind. Wenn du etwa aspx-Seiten hast, aspx aber nicht als Seite definiert ist werden die Seiten nicht als “Seiten” gezählt, sondern nur als “Dateien”. Zu merken ist das daran, dass in der Sektion Entry/Exit-Pages diese Seiten nicht vorkommen. Dann stimmen die Statistiken nicht, es werden bei Pages und Visits zu niedrige Werte angezeigt. Nur Pages triggern Visits! Interessant ist das Verhältnis Pages/Visits, es sollte zwischen 2/1und 5/1 liegen, je mehr umso besser. 1/1 heißt, dass Leute zufällig über die Site stolpern und sie sofort wieder verlassen. Mit 10 Pages pro Visit ist ein ziemlich gutes Ergebnis. Bei Seiten mit Frames ist zu berücksichtigen, dass sowohl das Frameset als auch jeder einzelne Frame eine Seite ist.

KBytes: Die Menge der Daten, die vom Webserver ausgeliefert wurden. Diese Angaben sind sehr ungenau und als Zahl weitgehend uninteressant. Interessanter ist der zeitliche Verlauf, etwa in Bezug zu Pages.

Sites: Jede Anfrage an einen Webserver kommt von einer sogenannten Site, die entweder nur als IP-Adresse zu erkennen oder auch über einen Hostnamen identifizierbar ist. Die “Sites-Auswertung” zählt die Summe aller Anfragen verschiedener Hosts zusammen, die auf dem Webserver zugegriffen haben, wobei natürlich jeder Besuch nur ein einziges Mal gewertet wird. Das hat nicht unmittelbar mit den Visits zu tun, das Verhältnis zu den Visits gibt aber Aufschluss über das Innen- und vor allem Außenleben der Website.

Visits: “Visits” sind normalerweise das Interessante an einer Webserver-Statistik. Sie stellen einzelne Besucher dar. Die in einem eingestellten Zeitraum von 30 Minuten als “Visit” gewertet werden. Besucher, die durch die Seiten surfen, die Site verlassen und nach 30 Minuten zurückkehren, werden wieder als neuer Besuch (”Visit”) gewertet.

Host: Mit “Host” ist der Rechner bzw. die IP-Adresse gemeint, von der der Request kommt.

Referrers: “Referrers” sind Webseiten, von denen ein Link zu Ihrer Homepage führt und auch benutzt wurde. Steht hier z.B. http://search.yahoo.com/search steht, kommt der Betrachter von der Suchmaschine “Yahoo” auf Ihre Homepage. Das problematische an “Referrers” ist, daß auch interne, das heißt Links innerhalb Ihrer Site gezählt werden.

Top Entry und Exit Pages: Die “Top Entry und Exit Pages” geben einen Überblick, welche Seite Ihrer Homepage die Betrachter als erste und welche Seite zuletzt betrachtet wurde. Wenn Ihre URL direkt eingegeben wurde, wird dies als ‘/’ dargestellt.

Search String Analysis: Dieser Teil von Webalizer durchsucht die “ungekürzten Referrers” auf die bekannten Suchmaschienen (Yahoo, Altavista, etc.) nach Angaben, die der Betrachter gemacht hat. Sie erhalten hier Informationen darüber, unter welchen Suchbegriffen nach der Website gesucht wurde.

User Agents: Unter dieser Rubrik sind Rückschlüße über die von den Betrachtern der Website benutzten Browser und Betriebssysteme zu gewinnen.

Hits by Response Code: Hier wird die Summe sämtlicher Anfragen (Hits) aufgeschlüsselt und die Antwort des Servers angegeben. Eine unberechtigte Anfrage z.B. auf einen passwortgeschützten Bereich erhält den Response Code 401 (”Unauthorized”). Wird eine Seite nicht gefunden, z.B. weil der URL falsch geschrieben wurde, wird als Code 404 (”Not Found”) ausgegeben.

Please rate this