Was für Daten werden momentan erfasst?

Aus aktuellem Anlass habe ich mal kurz überlegt was bei einem Besuch auf meinem Blog eigentlich alles an Daten erfasst werden.

  • Logdateien des Webservers:
    IP-Adresse, Datum/Uhrzeit, besuchte URL, HTTP-Code (Fehler, etc), Größe des Downloads, davor besuchte URL, Browser und Betriebssystem
  • Externe Statistiken (Blogscout, Getclicky, eigenes Skript):
    IP-Adresse, Datum/Uhrzeit, besuchte URL, davor besuchte URL, Browser und Betriebssystem, Klicks auf externe Links, Auflösung, Farbtiefe, war der Besucher schon mal da (per Cookie), Javascript aktiviert oder nicht

Das sind also Dinge die zu meiner Auswertung des Besucherstroms gehören. Die Zusatzinformationen der externen Tools werden mit Javascript ausgelesen, d.h. wenn das deaktiviert ist, enthalten die Statistiken nicht mehr Information als die Auswertung der Apachelogs. Die meisten haben es allerdings aktiviert und es bietet auch den unschlagbaren Vorteil alle Nicht-Menschen herauszufiltern, weil diese generell keine Skripte laden und ausführen. Insofern machen genauere Zahlen diese Auswertungen attraktiver.

  • Google Adsense / Textlinkads:
    Die Anzeigen von Google stammen von einem anderen Server und enthalten sicher auch eine Datenerfassung, da zumindest Klicks erfasst werden müssen um die Bezahlung zu regeln. Kann Google keine Anzeigen darstellen werden stattdessen Banner von Textlinkads eingeblendet.
  • Feedburner:
    Die Zahl der Abonnenten der verschiedenen Feeds.
  • Youtube-Videos & Co:
    Bilder oder Videos, die ich in Artikeln verwendet habe, aber nicht auf meinen Server kopiert habe.
  • Gravatare:
    In den Kommentaren erscheinen Bilder (Gravatare), die zu den jeweiligen Mailadressen gehören.

Hier wird also etwas von einem fremden Webserver nachgeladen. Dadurch werdet ihr auch in dessen Logdateien erfasst. An die Zahl der Abonnenten könnte man auch anders kommen, für Gravatare könnte man auch einen lokalen Cache verwenden und Bilder und Videos könnte man auf seinen eigenen Webserver kopieren, aber so wie es jetzt ist war und ist es eben bequemer.

  • Feedburner (again):
    Meine Feeds werden über Feedburner geleitet um überhaupt an die Anzahl der Abonnenten und Statistiken über selbige zu kommen. Hier wird man als Leser des Feeds also zusätzlich erfasst.
  • Externe Links:
    Beim Verlassen meiner Seite wird in der Regel die URL dieser Seite an diese externe Seite übergeben, d.h. sie wissen woher man kommt.
  • Cookies:
    Wordpress verwendet Cookies um die Daten im Kommentarformular für den nächsten Besuch zu speichern. Diese Daten werden auf euren Computern abgelegt, aber bei jedem Seitenaufruf abgefragt. Desweiteren verwendet die Umfrage in der Seitenleiste Cookies und möglicherweise (sehr wahrscheinlich) auch die externen Statistiktools.
  • Kommentare:
    Alle eingegebenen Daten werden in einer Datenbank gespeichert, so dass sie (bis auf die Mailadresse) später einem Besucher wieder angezeigt werden können.
  • Kontaktformular:
    Dort eingegebene Daten werden nicht gespeichert, sondern per Email an mich gesendet. In der Regel lösche ich diese Mails nicht sofort ;-)

Habe ich irgendwas vergessen? Ich denke dieses ganze externe Zeugs muss man wohl nicht angeben, da ich das auch nicht in den, im vorigen Artikel verlinkten, Erklärungen finden konnte (hier hat es einer gemacht). Bleibt also eigentlich nur das Log des Webservers, die Cookies und die Kommentarfunktion. Der Rest gehört eigentlich in die Datenschutzerklärung der externen Dienstanbieter, da streng genommen die es sind, die die Daten erfassen ;-)