Mythos Web-Statistik
180.000 Page Impressions im Mai – und was davon übrigbleibt.
»Ich stehe Statistiken etwas skeptisch gegenüber. Denn laut Statistik haben ein Millionär und ein armer Kerl jeder eine halbe Million.«
Franklin Delano Roosevelt
Die Zeiten, in denen ich täglich neugierige Blicke in meine Web-Statistiken und Echtzeit-Tracking geworfen habe, sind lange vorbei. Nun wollte es aber der Job, dass wir Auszüge eines Server-Logfiles (mit monatlich neunstelligen Page-Impressions) durch unseren Loganalyzer jagen mussten. Aus Jux legte ich heute vormittag ein Vergleichsprofil an und importierte die Usability-Inside-Apache-Logfiles des vergangenen Monats.
Wow, so viele Besucher in meinem kleinen »Special-Interest«-Blog? Über 180.000 Page Impressions im letzten Monat? Und das, wo hier über drei Monate lang (im März, April und Mai) kein einziger Beitrag erschien? Das kann doch nicht stimmen. Okay, denke ich mir, Enterprise-Lizenzen sind so unglaublich teuer, da soll man dann auch das Gefühl haben, dass es sich gelohnt hat...
Klicken wir uns doch mal in die Zusammenfassung hinein: Im Tagesschnitt 6.000 Seitenaufrufe von 1.300 Besuchern.
Die RSS-User machen mit 4.300 Tages-Aufrufen den Großteil aus: Nur ein relativ geringer Prozentsatz gelangt über meinen Feed auch auf das Blog, da ich meine Beiträge komplett veröffentliche. Zigtausend Pageviews verzeichnet mein RSS-Feed. Wieviele davon von echten Besuchern getätigt wurden, erfahre ich nicht. Auch nicht, wieviele davon von schlecht konfigurierten Newsreadern kommen, die nicht nur die Header auf Modified abfragen, sondern gleich den kompletten Feed. Und ihn somit immer wieder neu laden, auch wenn sich gar nichts geändert hat (und meine Veröffentlichungsfrequenz liegt ja nicht mal mehr bei einmal wöchentlich im Schnitt...). Ich weiß also nicht einmal, wie oft mein Feed gelesen worden ist: Ein User, der ihn einmal in seinem Newsreader gelesen hat, kann ihn dennoch mehrfach heruntergeladen haben; von einem über mehrere Dutzend bis hin zu tausendfachen Downloads ist hier alles drin – pro Nutzer!
Darin verbergen sich zudem eine Unmenge automatisierter Abrufe, über die noch unzählige Spambots, Kommentarspammer und andere unersättliche Webabfallprodukte kommen. Suchmaschinen-Robots wie Yahoo Slurp und Googlebot machen auch noch jeweils knapp 600 Abrufe pro Tag. Sie produzieren genau wie »echte« Besucher Hits und Visits und hinterlassen ihre Spuren in den Logfiles. Nur sind die durch die Robots verursachten Besuche wertlos, wenn es darum geht, das Interesse des verehrten Publikums am Angebot zu messen.
Alleine mit diesen Zahlen bin ich bei durchschnittlich 5.500 verzeichneten »Page Impressions« täglich und sammle damit schon stolze 165.000 monatliche Aufrufe, ohne auch nur einen einzigen echten Besucher verzeichnet zu haben. (Okay, ganz wertlos ist das nicht, schließlich sind da einige RSS-Leser dabei. Und die Suchmaschinen bringen mir neue Besucher. Ich frage mich allerdings, was ich mit diesem gefräßigen Yahoo-Bot anfange, der 600 Mal am Tag auf dem Server aufschlägt, mir aber keine 50 Besucher im Monat bringt.)
Bleiben ca. 500 Seitenaufrufe pro Tag übrig, die echt sein könnten. Wenn wir davon noch meine eigenen Besuche abziehen und die Dunkelziffer an Bots, die mit den normalen, üblichen User-Agents ausgezeichnet sind, reduziert sich die Zahl auf vielleicht 350 echte Aufrufe am Tag. Und so gelange ich auf amüsante 10.500 Seitenaufrufe im Monat Mai 2005 statt 180.000 angegebenen – ein Verhältnis von knapp 1:17. Zehntausend echte Page Views plus eine im Dunkeln bleibende Anzahl von RSS-Nutzern, die meinen Feed im Volltext lesen und sich gar nicht bis hier ins Blog hinein weiterklicken. Nun gut, von Ende Februar bis Anfang Juni veröffentlichte ich keinen einzigen Beitrag, aber vorher war auch nicht viel mehr los hier, schätze ich.
Selbst meine Besucher kann ich nicht eingrenzen: Einige kommen monatlich über Google, aber der Rest? Sind es mehrere Nutzer hinter einer einzigen (Firmen-)IP-Adresse? Ist das ein einzelner Nutzer unter dynamisch wechselnden IPs? Wenn beispielsweise ein T-Online-User täglich einmal mein Blog aufruft, taucht er in der Statistik als 30 User auf. Bei 2.000 monatlichen T-Online-Usern, die dreimal die Woche hier reinschauen, ergäbe das in der Statistik 24.000 Besucher.
Fazit a): Automatisch generierte Server-Logfiles geben kaum verlässliche Auskunft über Schwachstellen, Probleme oder gar das Verhalten von Besuchern, auch weil sich in ihnen Unmengen an Daten von niedriger Relevanz ansammeln. Wenn man Klickpfade, Verweildauer und ähnliche relevante Events analysieren möchte, sind die typischen Logfile-Analyzer also nur bedingt geeignet. Web-Mining-Tools, die Logfiles in Echtzeit filtern und auswerten, können weiterhelfen (übrigens zeigen sie mir dann tatsächlich durchschnittlich 500 Aufrufe pro Tag von etwas über 250 Besuchern an). Aber auch hier bleiben Dunkelziffern; unterm Strich stehen eine Menge Interpretation und Voodoo. »Traue keiner Statistik, die du nicht selbst gefälscht hast.«
Fazit b): 180.000 Page Impressions, auch wenn sie von echten Besuchern kommen, klingen vergleichsweise und vor allem aus wirtschaftlicher Sicht lächerlich (zum Vergleich: 1 ganzer Monat Usability Inside entspricht nicht einmal einer Stunde Traffic auf eingangs erwähntem Portal). Außerdem trifft man immer irgendwo auf jemanden, der es besser weiß, besser rechnen kann oder bessere Zahlen vorzuweisen hat. Deshalb lösche ich jetzt mein Blogprofil im Logfile-Analyzer wieder, denke an meine fünf überhaupt gar nicht lächerlichen Leser, die ich persönlich kenne und stelle fest: Ob es mehr sind oder nicht, wen interessiert das schon? Ihr fünf seid mir ohnehin viel wichtiger als irgendwelche abstrakten Zahlen in einer Datenbank. Und sowas wie Google-Ads oder ähnliches werdet ihr hier sowieso nie finden.
Trackbacks
Trackback-URI für diesen Eintrag:
http://www.web-blog.net/pingserver.php?p=tb&id=198
Trackbacks:
Statistik Statistik Statistik ...
Also die wirklichen Unique Visitors die dieses Blog kennt sind Kommentatoren und openBC-Subscriber, die über die Schaltfläche links unten kamen. Aber auch da weiß ich nicht, ob ich die als Leser begrüßen darf oder nicht. Ach ja einen Unique Visitor ken...
A2O — Business pur (20.06.2005 | 22:28)
Pingbacks
Rommel’s Blog » Blog Archive » Zahlen und Statistiken
...kann dazu auch nur von ganzen Herzen den Web-Blog zitieren, mir geht es nämlich genauso: “Ich denke an meine fünf überhaupt gar nicht lächerlichen Leser, die ich persönlich kenne und stelle fest: ...
(25.07.2006 | 18:20)
slidetone.blog» Blog Archive
» WP_ShortStat ist auch kinky reloaded
...
Du liest gerade
...
(17.08.2006 | 18:03)
Kommentare
Wir kennen uns nicht persönlich, aber ich kann zu den echten Lesern gezählt werden (wenn auch meist hinter dem Bloglines feed). ...
Und da waren es schon 6 <vbg>.
Grüsse aus Singapore.
:-) stw
Das ist die korrekte Einstellung, Marcus! Gerade und vor allem bei Blogs, mit dem Rattenschwanz an Automaten und Referrerspammern, der täglich vorbei kommt und Traffic erzeugt, egal ob man bloggt oder nicht, sind diese Loganalyse-Zahlen reiner Humbug.
Man muß schon sehr naiv sein, wenn man die Zahlen aus dem Webalizer oder AWStats tatsächlich für echte Besucher hält und sich am 1. des Monats bei ihnen bedankt. ;-)
*handheb* die tonlein-Nummer mit Mach-o bin ich.
dee (kein bot)
*zudeekeinbotguckundauchhandheb* aber nicht allein! ;)
Ich habe bei praegnanz.de auch aufgehört, irgendwelche absoluten Zahlen zu zählen. Ich habe mein BBClone installiert ("was eh nur Sissis benutzen, richtige Männer werten ihre Logfiles aus", gell Ralle), und gucke mir nur noch die *Trends* an. Das heißt, ich vergleiche, ob und wann es aufwärts und abwärts geht, und obb es bei der Veröffentlichung eines bestimmten Artikels stark nach oben geht. Wieviele Besucher oder Zugriffe es in absoluten Zahlen sind, kann und wmag ich nicht schätzen. Hier merke ich auch, dass der Besucherstrom eine zähe und hartnäckige Masse ist. Da kann man locker mal eine Zeitlang pausieren, und die Zugriffe werden nicht weniger.
Insgesamt halte ich aber inzwischen Counter-Lösungen wie BBClone oder chCounter für sinniger, weil sie bereits viele der bei Dir beschrieben, nutzlosen Besucher, von vorne herein ausfiltern und nur den Zählen, der auf meine PHP-Seiten guckt, wo ich den Counter-Code installiert habe.
hm .. 7.
auch wenn du mich nur per mail kennst. ;)
ganz unabhängig vom thema: find ich aber sehr gut, dass du nach einer pause von 3 monaten endlich mal wieder ein paar einträge postest. :)
cu, w0lf.
...dass du nach einer pause von 3 monaten endlich mal wieder ein paar einträge postestKeine Angst – alles nur Übersprungshandlungen ;)
Insgesamt halte ich aber inzwischen Counter-Lösungen wie BBClone oder chCounter für sinniger, weil sie bereits viele der bei Dir beschrieben, nutzlosen Besucher, von vorne herein ausfiltern und nur den Zählen, der auf meine PHP-Seiten gucktYep; letzten Endes kommt es eben darauf an, wozu man welches Tool mit welchen Erwartungen und vor allem welchen Filtern einsetzt. Nicht wenige setzen sich mit der Konfiguration ihrer Analyzer kaum auseinander, lernen die Filter nicht kennen oder »übergehen« sie einfach (schließlich sehen die Zahlen dann nicht mehr so schick aus :D ) ...
Wen interessieren schon Page Impressions? ;-)
Was mich interessiert, ist die Frage, woher Besucher kommen und welche Keywords sie verwenden. Und dafür kann man so ein Programm doch brauchen, oder nicht?
(RSS-Leserin)
Birgit, völlig richtig; mir ging es aber darum aufzuzeigen, wozu man solche Tools nicht oder nur bedingt gebrauchen kann. Und um einen Seitenhieb loszuwerden ;)
Hallo Marcus,
es ist spannend und unterhaltsam, die Weisheit über logfile Auswertungen mal so schön aufgesetzt zu lesen. Es wird aber wohl immer schwierig bleiben, diese den Marketing-Experten in der Firma zu vermitteln.
Thomas,
der kein regelmäßiger Besucher ist, deine Seite aber schon kennt und über einen Link in einem RSS-Feed eines Weblogs wieder zu dir gefunden hat (Martin Röll)
Halte ich für einen wichtigen Beitrag. Die Frage ist nur, wie genau man zu verlässlichen Daten kommt - und ob diese Verfahren etwa für Blogger bezahlbar sind. Vielleicht bleibt wirklich nur das Fischen im Trüben...
till schrieb:
Ein ganz anstaendige Auswertung liefert mir awstats. Das setze ich auch bei meinen Kunden ein und alle sind zufrieden. awstats versucht auch zwischen "echten" und "unechten" (= Bots) Besuchern zu filtern.Nun ja, wenn man mit AWStats zufrieden ist... Meinen Kunden ist das viel zu unflexibel. Obwohl meine Kunden sehr wohl mit PIs argumentieren. Aber den Seitenhieb hast du übersehen ;)
Uebrigens. Die wenigstens Leute argumentieren mit irgendwelchen PIs (Pageimpressions), da PIs eben nur Seitenaufrufe sind. Im Idealfall von x unterschiedlichen Besuchern, oder eben auch nur von einem.
Es geht letzten Endes immer um die unterschiedlichen Besucher auf Deine Website und wo sie herkamen. Die Anzahl derer wird meist mit Hilfe irgendwelcher Algorithmen aus den Logdateien Deines Webservers extrahiert. Wieso es sich dabei angeblich um keine brauchbaren Daten handelt ist mir allerdings schleierhaft.
Offenbar hast du den ganzen Beitrag nicht wirklich gelesen. Ich schreibe nir-gend-wo, dass Webserver-Logdaten keine brauchbaren Daten enthalten (diesen Gedanken halte ich sogar für dermaßen absurd, dass ich mich schon fast persönlich angegriffen fühle). Ich betone lediglich, dass für bestimmte Anwendungsfälle bzw. -Ziele die typischen Log-Analyzer nur sehr bedingt geeignet sind (und schreibe, welche und weshalb).
Stellt sich noch die Frage, welchen Analyzer hast Du ueberhaupt benutzt? Du jonglierst zwar wunderbar mit Zahlen aber laesst den Urheber weg. Oder war es "home-grown"? :)Auch die Frage (welchen Zweck hat sie eigentlich?), welchen Analyzer ich benutzt habe, ist völlig unerheblich, solange die Daten korrekt erhoben werden. Da ich aber die Frage nicht unbeantwortet lassen möchte: Sawmill Enterprise 7, meines Wissens der einzige Cross-Platform-Analyzer, der im Gegensatz zu statisch-reportbasierenden Tools (wie AWStats o.ä.) »on the fly« dynamische Live-Reports generiert (Zooming, Filter etc.; mehr Infos).
sawmill ist nett zum analysieren, kann man sehr schoen mit filtern. ein tool das auch ganz nett echtzeitig filtern kann, obwohl in der einfachen form windosig, ist clicktracks.
ich habe fuer einen kunden die software loesung von urchin im einsatz, die ist dank cookie-logging sehr menschennah, das heisst, alles was ohne javascript und cookie rumsurft wird auch nicht mit eingerechnet. das gibt wirklich gute werte was echte besucher angeht.
aber obwohl ich mir schon eine ganze menge web-analyzer angesehen habe, die eierlegende wollmilchsau war nicht darunter. irgendwo haben diese soften waren immer besondere staerken und schwaechen.
ciao, gerald
AWStats sind was feines, genauso wie Webalizer. Außerdem sollte es kein Problem darstellen ein eigenes Tool zu schreiben, welches Robots, erkennbar am UserAgent, rausschmeißen...
hey-hou,
noch ein echtes <beinahe> feedback ...
also, ich meine noch ein "echter" leser, bin noch ein "newbie to usability stuff" und habe viele feine und hochinteressante lese-stunden auf dieser seite verbracht ...
für die logfiles: link vom drweb hat mich hierher geführt ...
mfg aus wien
:) bit
Hallo zusammen,
ich kenne awstats mit geoip und sawmill sowie urchin - richtige männer arbeiten mit logfiles... jaja - wenn das nur so einfach wäre ... jetzt habe ich endlich den logfiles eine trackingID gegeben und mit der session ID verknüpft und will die nun mit SPSS oder SAS analysieren - hat von Euch jemand Erfahrung damit ?
mfg
Harry
wollte mich auch mal als stiller leser outen ;) die geringe frequenz sorgt wenigstens für einen ordentlichen überblick *g*
die geringe frequenz sorgt wenigstens für einen ordentlichen überblick *g*Hehe ;) Hier wird es (aus verschiedenen, hauptsächlich beruflichen Gründen) auch in naher Zukunft so schnell nichts Neues zu lesen geben. Ich halte bloß nichts davon, Websites einfach so vom Netz zu nehmen oder ein »Kommt doch später wieder« vorne drauf zu pappen.
Danke, schöner Artikel, hat mich etwas zum nachdenken gebracht, da ich über Google und den Suchworten "awstats geoip" hier her kam, kannst Du mich gerne als echten Besucher zählen ;)
© M. Völkel 2003-2008, some rights reserved | PGP-Key | Impressum
XHTML 1.0 Strict, Valid CSS.

