Sebbis Blog

Schlagwort: Statistik

  • Wunschkonzert: Besucherstatistiken

    new_analytics.jpg

    Was muss ein Statistikdienst können, damit er für dich interessant ist? Was vermisst du bei den Diensten, die du bereits nutzt?

    In letzter Zeit habe ich verschiedene Statistiktools getestet, aber irgendwie hat mich keines so recht zufrieden gestellt. Google Analytics ist ziemlich umfangreich und durch einige Hacks auch begrenzt erweiterbar, Blogscout ist überhaupt kein Statistiktool, sondern nur Schwanzvergleich 2.0 und auch sonst sieht es eher mau aus. Da war mal was mit Measure Map, aber die sind nie aus ihrer Beta raus und kürzlich habe ich das wiederauferstandene Reinvigorate entdeckt. Was die letzten beiden können und nicht können weiß ich leider nicht, aber wird wohl auch nicht das blaue vom Himmel sein, weil man so gut wie nichts hört.

    Dann gibt es noch Mint, Awstats, Slimstats & Co, die man bei sich selbst laufen lassen kann und 100000 andere Programme, die mehr oder weniger das gleiche können, aber nicht auf bzw. für Blogs ausgelegt sind. Spezielle Bloganalysetools, die über die Standardspielereien hinausgehen, fehlen irgendwie … MyBlogLog geht zwar in die Richtung, die ich mir so vorstelle, aber kostet Geld und wenn die kostenpflichtige Version genau so schrottig ist, wie die freie … nunja :-)

    Vor einem Jahr (man merkt das immer, wenn die Domains wieder mal verlängert werden müssen) hatte ich bereits eine Idee für einen etwas anderen Statistikdienst, aber mangels Zeit und größtenteils auch Lust mich an die schwerer zu lösenden Probleme zu machen lag die Idee erstmal auf Eis. Jetzt habe ich wieder Lust und auch einen Einfall wie es einfacher zu machen ist … also los … beantwortet mir die obigen Fragen und ich werde sehen was sich machen lässt.

    Ich habe diesen Beitrag geschrieben, weil ich auf Robert Basics Blog gelesen habe, dass ihm bei Analytics die Vergleichsmöglichkeit der sonst umfangreichen Statistiken mit anderen Blogs fehlt. Vielleicht geht es ja noch anderen Bloggern so wie mir und sie können von Zahlen über ihre Besucher nie genug kriegen :twisted:

    Grüße,
    ein Statistikfreak

  • Wie alt ist meine Leserschaft?

    Diese Frage hatte ich Anfang bis Mitte März gestellt und ihr habt geantwortet.
    umfrage_geburtsjahr.png

    Von den 177 Besuchern, die abgestimmt haben, sind 37% zwischen 18 und 25 Jahren alt, 21% zwischen 26 und 35 Jahren, 17% unter 18 und sogar ganze drei Leute unter 13. Die restlichen 45 Stimmen verteilen sich auf die höheren Altersklassen.

    Wie zu erwarten war sind die Twens auf meinem Blog besonders stark vertreten. Bloggen und Blogs lesen ist also doch eine Sache der 18- bis 35-jährigen. Die Generation, die mit dem Internet aufgewachsen ist und noch die Anfänge erlebt hat. Danach kommt Generation MySpace, die keine Ahnung haben, dass sie einfach nur das sind was früher Geocities-Benutzer waren. Mal sehen was die noch mit dem Internet anstellen, denn immerhin haben die ihre gesamte Lebenszeit Zugang zu Computern gehabt …

    Jetzt laber ich schon wieder nur rum :-). Wie auch immer, mir ist dieses mal keine bessere neue Umfrage eingefallen als nach eurem Geschlecht zu fragen. Bis jetzt ist das Ergebnis doch recht ausgewogen (was erstaunlich ist) und so frage ich beim nächsten mal wohl einfach, ob ihr Single seid ;-). Dann müsste sich mit den Daten eine Wahrscheinlichkeit für weiblich, 18-25 Jahre alt, Single berechnen lassen und damit wüsste ich endlich wie viele der täglichen Besucher in mein Opferschema (ich hätte beim Alter doch andere Zeiträume erfragen sollen) passen würden ;-)

  • PS3, die Molekül-Falter-Konsole

    Die PS3 kann in ihrer Freizeit Moleküle für das Projekt Folding@Home falten und kommt dabei auf beeindruckende Leistungswerte …

    ps3_folding.png

    Bei einer Anzahl von nur 12% der aktiven Teilnehmer sorgen sie für 57% der Gesamtrechenleistung. Die PS3 scheint also wirklich ein kleiner Supercomputer zu sein ;-)

    via Engadget

  • Facebook Statistiken

    Wahrscheinlich wird Facebook demnächst MySpace einholen. Auf Flickr gibt es jedenfalls ein paar Statistiken zu bewundern und Zahlen lügen nicht oder so ;-)

    • 1 Milliarde Fotos (120 TB)
    • 1 Millionen gleichzeitig (innnerhalb von 15 Minuten) eingeloggte Benutzer
    • 1 Milliarde Seitenaufrufe am Tag (angeblich 1% des gesamten Internetverkehrs)
    • 500000 neue Benutzer pro Woche bei einem wöchentlichen Wachstum von 2,9%
    • 18 Millionen Benutzer und die Hälfte davon loggt sich täglich ein

    Das ist schwer beeindruckend …

    Wie auch immer, die Zukunft gehört dezentralisierten „sozialen Netzwerken“. Irgendwie muss es doch zu machen sein, dass alle großen Netzwerke ihre Daten austauschbar machen. Wie das ohne Datenschutzprobleme funktionieren soll ist eine andere Frage, aber was bringt es einem in 5 verschiedenen Netzwerken sein zu müssen um alle Kontakte abdecken zu können? Vielleicht wird das ja mal endlich was mit FOAF.

  • Stammleser auf diesem Blog

    Die Umfrage der letzten Tage drehte sich um die Frage seit wann ihr mein Blog schon mitlest. Die zahlen holen einen dann doch schnell wieder auf den Boden der Tatsachen zurück. Zwar habe ich die Umfrage nicht besonders beworben, aber es ist anzunehmen, dass nun wirklich jeder Stammleser abgestimmt hat.

    Zählt man alle dazu, die nicht erst seit ein paar Tagen dabei sind, bleiben 32 Leser übrig. 12 davon sind schon seit den Anfangstagen dabei und 20 habe ich auf dem Weg zum heutigen Tag aufgelesen. Schön. Man sieht eben mal wieder, dass Zugriffsstatistiken keine genauen Aussagen über so etwas erlauben. Feedburner sagt mir zwar ich hätte 230 Leser des Feeds und mein Webserver sagt es würden um die 1000-2000 Leute jeden Tag vorbeischauen, aber letzteres ist zumindest alles nur Laufpublikum.

    Ich schreibe mein Blog im Wesentlichen also für 30-40 regelmäßige Leser. Danke, dass ihr mir über alle die Monate und Jahre treu geblieben seid. Das Bloggen und vor allem das Verfolgen der Kommentare macht mir immer noch einen Riesenspaß und ein Ende ist nicht in Sicht *knuddel*

    P.S.: Die neue Umfrage dreht sich um das Alter meines Publikums. Seid ihr werberelevant oder nicht? ;-) Wie immer ist die aktuelle Umfrage unten in der rechten Spalte bzw. direkt bei den Umfragen zu finden.

  • Neue seltsame Topliste bei Blogscout

    Der Statistikdienst, der eigentlich keiner ist (es geht dort eigentlich nur um die täglichen Toplisten, der Rest ist Nebensache), hat eine neue Topliste. Zunächst war das nur auf der Spielwiese von Blogscout zu sehen und und recht mysteriös und jetzt ist es die Standardtopliste auf der Startseite und immer noch recht mysteriös, weil nicht erklärt wird wie die Rangreihenfolge zustande kommen.

    Von daher zeigt die Liste zwar nun gefühlt einen besseren Überblick über die aktive Blogosphäre, aber ist trotzdem vollkommen nutzlos. Morgen veröffentliche ich meine eigene Top100 der Blogosphäre und verrate auch niemandem wie sie zustande gekommen ist ;-)

    Was man anhand der heutigen Liste erkennen kann ist aber z.B., dass der Anteil der Besucher, die über eine Suchmaschine auf ein Blog stoßen eine große Rolle spielt. Je kleiner dieser Anteil, desto weiter oben landet man. Natürlich spielen noch andere Faktoren eine Rolle, aber nur so ist es zu erklären, dass Blogs mit wenigen Besuchern, so weit oben stehen. Das Blog auf Platz 22 hatte gestern nur 53 Besucher, Blog 67 und 72 hatten unter 10 Besucher, Blog 81 hatte 63 Besucher und ich lande mit 2706 Besuchern auf Platz 186, vermutlich weil eben 90% der Besucher von Suchmaschinen kommen. Was auch immer an diesen kleinen Blogs für einen höheren Rang sorgt, selbst ganz ohne Suchmaschinenbesucher wäre mein Blog besser besucht und von daher wohl auch bekannter. Was soll’s … die alte Liste mit der echten Verteilung gibt es zum Glück immer noch, wenn auch leider nicht mehr und auch die Liste ohne Suchmaschinenbesucher gibt es noch.

    Schade, Blogscout hat mit dieser Entscheidung ein wenig an Wert verloren. Da der normale Ranglistenplatz so gut wie nichts mehr aussagt (für mich ist das Hokuspokus) ist es jetzt auch nicht mehr so interessant ihn zu verfolgen. Sabbere ich eben über meinen selbstgemachten Statistiken ;-)

  • Nochmal Datenschutz

    In diesem komischen Gesetz ist nun auch geregelt wie mit Daten umzugehen ist. Wahrscheinlich war das schon vorher geregelt, aber erst jetzt fällt mir das so richtig auf.

    Ich zitiere einfach mal heise.de:

    Gesammelte persönliche Informationen dürfen nur für Abrechnungszwecke zusammengeführt werden. Zu Werbezwecken können Nutzungsprofile bei Verwendung von Pseudonymen erstellt werden, wenn der Nutzer dem nicht widerspricht.

    Das bedeutet doch eigentlich, dass alle Statistikdienste ein Problem haben, weil hier wohl personenbezogen Daten erfasst und zusammengeführt werden. Heise schreibt in dem Artikel auch noch, dass die IP personenbezogen sei. Ich hoffe jemand geht mal vor Gericht und widerlegt das. Dann würden alle hier bei mir erfassten Daten schon mal überhaupt nicht mehr personenbezogen sein und gut ist’s …

    Weiter geht’s: in Paragraph 13 des Gesetzes steht etwas davon, dass man dem Nutzer diese Datenschutzerklärung vorhalten müsse und er das protokolliert bestätigen muss. Ha! Wie stellen die sich das bei Blogs, Foren und Gästebüchern ohne Registrierung vor? Wie schon gesagt, wenn IPs keine personenbezogenen Daten wären (was sie imho nicht sind), dann wäre das ja überhaupt kein Problem. Allein in den Kommentaren kann man etwas personenbezogenes (die Mailadresse) angeben und darüber kläre ich gerne beim schreiben eines Kommentares auf. Aber das Mitloggen von Besuchen kann man so doch wirklich nicht regeln *seufz*

  • Ein klein wenig Statistik

    Für alle, die es interessiert, ein paar kleine Zahlenkolonnen für das Jahr 2006:

    • 504 Artikel habe ich geschrieben. Weniger als 2005 (542) und 2004 (521).
    • 3837 Kommentare (929 von mir) gibt es. Weit mehr als 2005 (2940/818) und 2004 (1389/366)
    • Die Kommentare sind nicht nur zahlreicher, sondern auch länger geworden. Durchschnittlich 225 Zeichen im Jahr 2006, 222 in 2005 und nur 169 in 2004. Die Anzahl der Wörter ist 2006 und 2005 gleich mit 34 Wörtern im Schnitt pro Kommentar und 2004 waren es nur 26 Wörtern.
    • Insgesamt stieg der geschriebene Lesestoff auf 498884 Zeichen in 2006 an. Davor waren es 465434 (2005) bzw. 455008 (2004) Zeichen. Das sind im Schnitt 990 (2006), 859 (2005) bzw. 873 (2004) Zeichen pro Artikel. In Wörtern macht das durchschnittlich 121, 111 und 112 pro Artikel.

    Der Trend geht hin zu längeren Artikeln, die öfters kommentiert werden. 2007 wird also genug Lesestoff bringen um euch zu beschäftigen ;-). Mindestens 167 Wörter und 10 Kommentare pro Tag …

    2006 in Zugriffszahlen, die vielleicht wirklich niemanden interessieren:

    • 523795 Besucher verursachten 2282981 Seitenaufrufe und sorgten für 153,95 GB Traffic.
    • Zwischen 14 und 18 Uhr erreichen die Besucherzahlen täglich ihr Maximum
    • Der überwiegende Teil der Zugriffe kommt aus Deutschland, dann den USA und auf den Plätzen 3 und 4 kommen jeweils Österreich und die Schweiz weit vor Italien, der Nummer 5.
    • Der Yahoobot führt mit 377742 Zugriffen vor dem Googlebot (250754 Zugriffe), dem Google Adsense Bot (70685) und dem MSNbot (56774). Andere Bots sind nicht erwähnenswert.
    • Die durchschnittliche Besuchsdauer liegt bei 182 Sekunden
    • Windows führt mit 93,3% die Betriebssystemliste an. Sonys Playstations Portable ist das meistgenutzte Nicht-PC Betriebssystem ;-). Bei Windows führt XP mit 82% aller Zugriffe gefolgt von Windows 2000 (7%) und Windows 98 (2,3%) und Me (0,9%). Bei Linux führt Ubuntu (0,4%) vor Suse und Debian (jeweils 0,2%). Beim Mac führt OS X (2,6%) klar vor dem normalen Mac OS (0,1%)
    • Bei den Browsern führt nach wie vor der MS Internet Explorer mit 56,8% vor Firefox mit 33,8%, gefolgt von Opera (3,6%), Safari (1,6%) und Mozilla (1,6%). Die Unterversionen erspare ich mir hier mal, denn beim IE dürfte es klar sein, dass sich Version 7.0 noch nicht weit verbreitet hat und vom Firefox gab es 2006 ziemlich viele Unterversionen

    Genug Zahlen für Heute ;-)

  • IE 7.0 vs. FF 2.0 (Teil 2)

    Im Oktober kamen die neuesten Versionen der beiden am weitesten verbreiteten Browser heraus. Der Internet Explorer (IE) gibt es seit dem in der Version 7 und Firefox (FF) in der Version 2. Ich habe deren Verbreitung einige Tage später an Hand meines eigenen Logs „gemessen“ und jetzt ist es Zeit das zum zweiten Mal zu tun, denn scheinbar gibt es den neuen Internet Explorer nun auch über das Windows Update.

    Damals habe ich folgende Zahlen festhalten können:

    • Nutzer des FF 2.0: 5%
    • … innerhalb der FF-Nutzergruppe: 21%
    • Nutzer des IE 7.0: 1%
    • … innerhalb der IE-Nutzergruppe: 5%

    Diese Zahlen haben sich seither leicht verändert (Grundlage ist die letzte Woche):

    • Nutzer des FF 2.0: 15%
    • … innerhalb der FF-Nutzergruppe: 47%
    • Nutzer des IE 7.0: 6%
    • … innerhalb der IE-Nutzergruppe: 16%

    Die Zahlen kommen aus Slimstats und sind bei meinem Blog keine richtig guten Zahlen, da gelegentlich auch Maschinen mitgezählt werden und in letzter Zeit viele Britney „Fans“ zu Besuch waren, die – wer hätte es gedacht? – überdurchschnittlich den Internet Explorer bevorzugen. Aber sie sind untereinander recht gut vergleichbar und man sieht sofort, dass sich der IE 7.0 nicht sehr gut verbreitet hat, während sich der FF 2.0, trotz der Tatsache, dass die automatische Updatefunktion der Version 1.5.0.8 ihn noch nicht als Update anzeigt, sehr gut verbreiten konnte. Mal sehen wie sich diese Werte in den nächsten Wochen verändern …

  • Feedburner zählt falsch

    Ich habe es schon mal vermutet, aber jetzt bin ich mir absolut sicher. Feedburners Statistiken sind Bullshit! Diese Zahlen können überhaupt nicht stimmen …

    feedburnercounts.jpgIn den letzten zwei Tagen kamen sehr viele Besucher wegen Britney auf meine Seite und gleichzeitig erhöhte sich die Zahl der Feedabonnenten dramatisch. 433 Leser des normalen Feeds und 354 Leser des Kommentarfeeds soll ich haben. Vor ein paar Tagen war die Zahl noch bei ca. 140. Ein Grund zur Freude? Wahrscheinlich nicht :-(

    Schauen wir uns exemplarisch mal die Aufteilung der Leser für den Artikelfeed an:
    feedburner_subscribers.png

    Was fällt auf? Fast alle Abonnenten benutzen die Firefox Live Bookmarks. Da die URL nur eine Weiterleitung auf Feedburner ist, sehe ich auch in meinem Apache Log wer sich den Feed anschaut. Der größte Brocken sind Besucher mit unterschiedlichen IP-Adressen (also keine mehrfachen Aufrufe von der gleichen IP, die auf ein Abonnement schließen lassen würden). Schaut man sich deren Besuche genauer an, sieht man, dass der Feed im gleichen Augenblick wie die eigentlich besuchte Seite (irgendein Artikel) aufgerufen wird. D.h. Firefox scheint den Feed automatisch zu besuchen. Feedburner zählt das aber als normalen Leser meines Feeds und somit absolut falsch. So lassen sich auch die teilweise astronomisch hohen Zahlen von Lesern anderer Blogs erklären. Zum größten Teil alles falsch gezählte Firefox Browser …

    Das Problem scheint bei Feedburner bekannt zu sein und wurde im Oktober als korrigiert bezeichnet. Scheint nicht so zu sein :-(

    P.S.: Warum tauchen in der Grafik oben eigentlich keine Leser bei Bloglines auf? Feedburner scheint auch das (und wer weiß was noch) gelegentlich zu verschlucken …

    Nachtrag:
    Es ist die Google Toolbar in Firefox, die für die Aufrufe des Feeds sorgen ohne dass ihn jemand abonniert hätte. Deren Aufrufe sind leider nicht von normalen Aufrufen über „Livebookmarks“ zu unterscheiden und ich bin gespannt wie Feedburner das lösen wird.