Ihr Browser versucht gerade eine Seite aus dem sogenannten Internet auszudrucken. Das Internet ist ein weltweites Netzwerk von Computern, das den Menschen ganz neue Moglichkeiten der Kommunikation bietet.

Da Politiker im Regelfall von neuen Dingen nichts verstehen, halten wir es fur notwendig, sie davor zu schutzen. Dies ist im beidseitigen Interesse, da unnotige Angstzustande bei Ihnen verhindert werden, ebenso wie es uns vor profilierungs- und machtsuchtigen Politikern schutzt.

Sollten Sie der Meinung sein, dass Sie diese Internetseite dennoch sehen sollten, so konnen Sie jederzeit durch normalen Gebrauch eines Internetbrowsers darauf zugreifen. Dazu sind aber minimale Computerkenntnisse erforderlich. Sollten Sie diese nicht haben, vergessen Sie einfach dieses Internet und lassen uns in Ruhe.

Die Umgehung dieser Ausdrucksperre ist nach §95a UrhG verboten.

Mehr Informationen unter www.politiker-stopp.de.

access_log (2): Firefox >> Internet Explorer

Ich schaue mich also um, was für Logs und Statistiken mein Webspaceprovider eigentlich bereithält. Etwas Sachdienliches war letztendlich nicht zu finden, aber dafür komme ich an dieser Info über die 15 häufigsten User Agents der Besucher meiner Website im Oktober 2009 vorbei: Link zum Pastebin (da es für das Blog zu breit ist).

Und, fällt etwas auf? Nichts? Da kommt der Internet Explorer gar nicht vor! Als erstes hat mich interessiert, seit wann das so ist. Die Statistik wird nur für etwa ein halbes Jahr gespeichert. Im Juni war der IE noch auf Platz 11 vertreten. Im Juli rutschte er auf Platz 13, im August auf Platz 14, im September ist er verschwunden. Im November taucht er nochmal auf Platz 15 auf, jetzt aber in der Version 8 statt vorher in der Version 6. Im Dezember ist auch der wieder weg aus den Top 15.

Auch interessant die zunehmende Verbreitung von Chrome. Im Juni ist er noch gar nicht in der Liste, im Juli auf Platz 11, im August auf 8, im September auf 10 (Chrome 2) und 14 (Chrome 3), im Oktober wieder auf 8, November 9 und 13 (zwei Varianten von Version 3), im Dezember auf 7 und 11.

Aber natürlich ist diese “Top 15″-Liste alles andere als aussagekräftig. Wo ein Browser landet, hängt sehr stark davon ab, wie stark er nach Versionen fragmentiert ist. So sinkt etwa Chrome in der Statistik, als ein Teil der Nutzer auf Version 3 upgegradet hat und ein Teil noch bei Version 2 ist. Auch der Browser auf Platz 1 der Liste erreicht nicht mal 4%. Hat Firefox nun wirklich am Internet Explorer vorbei gezogen? Vermutlich. Aber hat er den IE auch in Grund und Boden gestampft, wie man durch die Top-15-Auswertung meinen könnte? Schwer zu sagen.

Also heißt es doch selbst Hand anlegen und die access_log-Dateien auswerten, statt sich auf die hübschen bunten Statistiken des Providers zu verlassen. So sieht ein einzelner access_log-Eintrag aus:
200.70.150.125 - - [26/Oct/2009:01:42:33 +0100] “GET /favicon.ico HTTP/1.1″ 404 183 “-” “Mozilla/5.0 (Windows; U; Windows NT 6.0; pt-BR; rv:1.9.1.3) Gecko/20090824 Firefox/3.5.3″ (Die IP-Adresse habe ich verändert, um die Privatsphäre meiner Websitebesucher zu schützen.) Sie bedeutet: remote_host ident authuser [date-time zone] “Request Line” Status-Code bytes “referer” “User Agent”. (Eigentlich schreibt sich referrer mit einem r mehr, aber in Beschreibungen des Formats ist stets von referer die Rede, teilweise mit einem “sic!” versehen. Warum, weiß ich nicht, ich vermute einen historischen, in der access_log-Format-Spezifikation enthaltenen Schreibfehler.)

Mein erster Impuls war, die etwa 29000-zeilige Datei (für einen Tag im Oktober) nach Strings (Wörtern, Zeichenketten) wie Firefox, MSIE, Opera, Chrome, Safari und Konqueror zu durchgreppen. Was mir daran nicht gefällt, ist, dass es für jeden “Hit” einen Eintrag gibt, d.h. für den Download jeder Datei. Jeder Nutzer wird unterschiedlich häufig gezählt, jenachdem, wie viele Seiten er auf der Website besucht hat, und wie viele Grafiken u.Ä. in diese Seiten eingebunden waren. Es könnte sich natürlich am Ende ungefähr ausgleichen, aber vielleicht eben auch nicht.

Außerdem sieht man beim einfachen Greppen und Zählen nicht so leicht, ob und was man doppelt oder gar nicht gezählt hat. So enthält z.B. nicht nur Safari in seinem Useragent-String den Begriff Safari, Chrome tut dies auch. Ältere Opera-Versionen (bis 8) geben sich zusätzlich als MSIE aus. Man erhält auch nicht leicht eine Liste der noch nicht gezählten Einträge, so dass es schwierig wäre zu bemerken, dass man auch Iceweasel, Shiretoko und Minefield noch zu Firefox hinzuzählen muss oder dass man nicht an Seamonkey und K-Meleon gedacht hat.

Es muss somit ein richtiges Programm her. Also schnell Google angeworfen. Diese Seite empfiehlt wwwstat (die Website spricht von wwwstats, aber sowohl der Befehl als auch das deb-Paket heißen wwwstat ohne s). Flugs installiert, es war natürlich auch in den Ubuntu-Repositories (Paketquellen) enthalten. Leider stellte sich dann heraus, dass es die neumodischen Ergänzungen des Referers und Useragentstrings nicht auswerten kann.

Nun könnte ich natürlich wwwstat erweitern. Theoretisch. Wenn ich Perl könnte. Sicherlich drängt sich Perl geradezu auf für Aufgaben wie diese. Aber ich bleibe dann doch bei meiner Lieblingssprache Java. Also schnell weiter gegoogelt. Ein Programm, das einerseits nach IP-Adressen gruppiert und andererseits nach Browsern zusammenrechnet, ohne sich durch verschiedene Versionen, Spracheinstellungen (im obigen Beispiel brasilianisches Portugiesisch) oder Extensions ablenken zu lassen, tat sich nicht auf. Dafür erstmal dieser interessante und unterhaltsame Artikel, der auch eine Hall of Shame für Browserweichen ins Nirvana aufführt.

Kurz darauf stieß ich auf dieses Javaprogramm zum Parsen von access_log-Dateien \o/ . Erstmal musste ich es sauber machen - Quellcode, der nicht den Java Code Conventions entsprechen und Variablennamen groß schreiben, verursachen immer so ein nervöses Zucken in meinem linken Augenlid. Nachdem ich also die Variablennamen verkleinert hatte, konnte es losgehen. Loopen, statt nur die erste Zeile auslesen. Checken, ob die IP schon mal vorkam und nur mit diesem Schleifendurchgang weitermachen, wenn es ihr erstes Vorkommen ist. (Natürlich könnten auch zwei Leute die gleiche IP haben, entweder weil sie über den gleichen Internetzugang online sind oder weil der zweite die IP des ersten bekommen hat, nachdem dieser offline gegangen ist oder von seinem Provider nach 24 Stunden getrennt wurde, aber bei dieser Auswertung von nur einem Tag und nur 30000 Hits ist das hinreichend unwahrscheinlich und insignifikant.) Dann den Useragent-String nach “msie”, “firefox” und co durchsuchen. (Größtenteils) nur mit if und nicht fortgesetzten else if, um leichter zu bemerken, wenn ein Useragent-String auf mehrere Kriterien passt. Dann noch schnell eine Analyse der verwendeten Betriebssysteme, damit niemand sagen kann, meine Website würde vorwiegend von Linuxusern genutzt, die ja schlechterdings keinen Internet Explorer benutzen könnten. (Man kann ihn zwar mit IEs4Linux relativ leicht auf wine zum Laufen bekommen, aber für mehr als Testzwecke wird ihn natürlich keiner freiwillig benutzen.)

Hier ist der Code des Javaprogramms zum Auswerten der access_log-Datei, wieder in einem Pastebin aufgrund der Länge und Formatierung. Der Mnenhy-Zähler am Ende zählt Aufrufe von mir selbst, denn diese nicht sehr stark verbreitete Firefox-Extension hängt an den Useragent-String “Mnenhy” an. Der Code ist nicht sonderlich sehenswert, “quick and dirty”, aber ich wollte ihn euch nicht vorenthalten.

Und nun endlich das Ergebnis. Wie erwähnt für einen einzelnen Tag (genauer gesagt den 27.10.2009). Die Angaben in Klammern sind das Ergebnis, wenn man die “continue”-Anweisung auskommentiert, also jeder Hit (access_log-Eintrag) gezählt wird, nicht nur einer pro IP.
total: 5563 (28964)
firefox: 2763 (14925)
msie: 1296 (7232)
opera: 1077 (4749)
chrome: 201 (1138)
safari: 79 (367)
konqueror: 2 (24)
k_meleon: 4 (13)
seamonkey: 2 (10)
bot: 123 (354)
other: 17 (168)

windows: 5240 (27585)
linux: 65 (353)
apple: 113 (500)
other OS: 22 (172)

mnenhy: 1 (17)
Mehrfachzählungen: 1 (16), durch MSIECrawler, der bei MSIE und bei Bot gezählt wird.

Wie man sieht, ist Firefox tatsächlich sehr weit vorn, etwa doppelt so verbreitet wie der Internet Explorer. Hätte man ihm vor einigen Jahren gar nicht zugetraut, sich gegen dieses Monopol durchsetzen zu können. Aber der Internet Explorer ist noch auf dem zweiten Platz, knapp vor Opera und weit vor Chrome und den weiteren Browsern. Opera und Chrome kommen also tatsächlich nur durch die geringere Fragmentierung nach Versionen auf die Topplätze (Opera sogar mehrfach auf Platz 1 meiner privaten User-Agent-Statistik).

Natürlich bleibt die Frage, wie aussagekräftig meine Zahlen sind. Einerseits habe ich nur einen Tag ausgewertet, weil es mir zu mühlselig war, die vielen einzelnen access_log-Dateien herunterzuladen und auszuwerten oder sie aneinander zu hängen, andererseits gibt es keinen Grund zu der Annahme, dass andere Tage signifikant anders aussehen würden. Dann ist natürlich unklar, wie typisch meine Websitebesucher für das Internet insgesamt sind. Wie man sieht, spricht meine Website nicht etwa speziell Linuxnutzer an. Die hauptsächlichen Themen meiner Website sind einerseits Java (Grundlagen) und andererseits das Browsergame Travian. Es könnte also sein, dass meine Website verstärkt jüngere Besucher anzieht, Schüler und Studenten, bei beiden Themen. Vielleicht benutzt diese Gruppe häufiger den Firefox als ältere. Andererseits sind auch meine Eltern inzwischen bei Firefox angekommen, und das sogar ohne mein Zutun. Hinzu kommt, dass die meisten Besucher meine Website entweder in ihrer Freizeit von zuhause aus oder von der Schule oder Uni aus aufrufen würden. In Firmen würd häufig noch verstärkt auf den Internet Explorer gesetzt, teilweise ist die Installation von alternativen Browsern wie Firefox und Opera nicht erlaubt. So oder so bin ich aber hinreichend überzeugt, dass Firefox Internet Explorer um Längen überholt hat.

Monika.

Tags »

Autor: Monika
Datum: Montag, 4. Januar 2010 2:30
Trackback: Trackback-URL Themengebiet: Allgemein

Feed zum Beitrag: RSS 2.0 Diesen Artikel kommentieren

Ein Kommentar

  1. 1

    [...] “Studie” hatte ja einen Firefoxanteil von etwa 50% bei meinen Websitebesuchern [...]

Kommentar abgeben