Kategorien
Dies und das Statistik

Was Google über deinen (meinen) Feed weiß

Mittlerweile sollte Google mit seinen Diensten ein recht umfassendes Bild der Blogosphäre und natürlich auch vom restlichen Internet haben. Mit ihrer Suchmaschine haben sie schon eine Art Ranking und mit Analytics haben sie zusätzlich nicht nur Informationen wie oft Webseiten bzw. Blogs in Suchergebnissen angeklickt werden, sondern auch noch sehr sehr viele komplette Besucherstatistiken. Dort wo Analytics nicht installiert ist, ist vielleicht Adsense installiert und so kommen sie trotzdem an die Trafficdaten. Dazu kommt mit Google Reader ein mittlerweile führender Online RSS Reader mit dem sie die Lesegewohnheiten der dort abonnierten Feeds analysieren könnten. Vor kurzem haben sie dann auch noch Feedburner gekauft und haben somit zusätzlich noch mehr oder weniger genaue Informationen über unzählige Feeds, die über diesen Dienst verteilt werden.

Und was machen sie damit? Bisher noch nicht viel oder beeinflussen all diese Daten tatsächlich bereits die Suchergebnisse? Vielleicht in ihrer Blogsuche?

Jedenfalls wollte ich eigentlich darüber schreiben was Google von unseren Feeds weiß. Ich habe an drei Stellen entsprechende Zahlen gefunden …

Kategorien
Geeky Meckerecke Nur mal so

StudiVZ braucht dringend ein Update

Es ist ja kein Geheimnis, dass StudiVZ praktisch eine exakte Kopie des erfolgreichen Facebook ist. Mittlerweile ist Facebook aber ziemlich davongezogen und StudiVZ sieht nur noch aus wie Facebook, kann aber nicht mehr schritthalten mit den Innovationen aus Amerika. Haben sie anfangs noch das Verlinken der Personen auf Bildern (genial!) und vor kurzem die twitterähnlichen Statusmeldungen kopiert, fehlen jetzt einige Dinge wie z.B. „Feeds“ über die Tätigkeiten von Freunden und so weiß man nie was die so im Netzwerk treiben.

Dann die Möglichkeit „Anwendungen“ für Facebook zu schreiben. Toll! Und jetzt kann man sogar auf einige unkritische Dinge von außen per RSS zugreifen, die „Posted Items“ von Freunden und ihre Statusaktualisierungen. Und was macht StudiVZ? Trotz Überfinanzierung keine Neuerungen und noch nicht mal irgendwas nachgemachtes :-(

So toll ich diese Soziales-Netzwerk-ich-geb-alles-über-mich-preis-Sache z.Z. auch liebe, StudiVZ ist nicht MySpace. Letzteres ist in meinem Augen einfach nur grottenschlecht und das liegt unter anderem daran, dass es dort null Veränderung gibt. Die müssen doch mindestens eine Millionen Hinweise pro Tag bekommen wie schlecht ihre Suchfunktion ist, aber machen nichts … macht was, StudiVZ! Feeds von Freunden!! Ich will sehen, wenn jemand einer neuen Gruppe beitritt oder ein Foto kommentiert oder was am Profil verändert hat. Pronto! ;-)

Kategorien
In eigener Sache

Feeds und die robots.txt

Meine Suchfunktion rechts oben basiert ja nun seit ein paar Tagen auf Google und funktioniert so weit ganz gut. Gestern habe ich allerdings nach ein paar Sachen gesucht und mir wurden ständig die Kommentarfeeds verschiedener Artikel als Ergebnisse angezeigt („Comments on: blablabla“). Nicht gut, aber wie verhindert man so etwas?

Relativ einfach geht das mit der robots.txt. Denn entgegen der Spezifikation versteht zumindest der Googlebot auch Wildcards und so kann man recht elegant ungewolltes ausschließen. Meine robots.txt enthält denn auch folgende Einträge:


User-agent: *
Disallow: /wp-
Disallow: /blogger
Disallow: */trackback$
Disallow: */trackback/$
Allow: /wp-content/uploads
User-agent: Googlebot
Disallow: */feed$
Disallow: */feed/$

Das sorgt erstmal dafür, dass alle wp-Verzeichnisse ignoriert werden, aber die hochgeladenen Bilder trotzdem in der Bildersuche erscheinen. Dann wird die Blogger-Seite ausgeschlossen, weil ich nicht mit den Inhalten fremder Blogs gefunden werden will und schlussendlich werden alle Urls, die auf „trackback“ enden ignoriert. Und dann – speziell für den Googlebot – kommt der Hinweis, dass die Feeds ebenfalls ignoriert werden sollen. Testen kann man das verhalten des Googlebots übrigens hervorragend mit den Google Webmaster Tools.

Frank Helmschrott beschreibt in seinem Blog noch eine andere Möglichkeit und zwar über ein Plugin, das im Feed einen bestimmten Wert setzt, der scheinbar auch die Indizierung durch Suchmaschinen verhindert.

Übrigens halten sich Dienste wie Blogfox, Feedster und Blogpulse an die Regeln in der robots.txt. Schreibt man die Feedregeln also in den Abschnitt für alle Bots wird man also wahrscheinlich nichts mehr von solchen Diensten haben. Technorati scheint sich aber nicht daran zu halten … eigentlich eine Frechheit. Wie es mit dem oben genannten Plugin aussieht? Keine Ahnung … ich finde die robots.txt Variante eleganter und hoffe, dass die Suchergebnisse bald auch tatsächlich nur Artikel und nicht irgendwelche Feeds hervorbringen :-)

Kategorien
Erlangen Misc Nur mal so

BloggER

Am Freitag trifft sich Erlangens BloggER-Szene zum Karpfenessen (mehr bei Lisa Neun). Leider bin ich an dem Termin verhindert, aber ich wünsche euch trotzdem guten Appetit und viel Spaß beim darauf folgenden selbstreferenziellen Geblogge und Geflickre ;-)

Weitere News:

P.S.: Ja ich weiß, mittlerweile sind wir Erlanger Blogger schon ein riesiger Haufen geworden. Demnächst veröffentliche ich mal meine Liste und lasse sie von euch komplettieren. Für’s nächste Treffen mieten wir dann die Heinrich Lades Halle ;-)

Kategorien
Geeky Meckerecke

Ich mag es nicht

… wenn Blogs ihren Feed verstecken. Man hält Ausschau nach dem bekannten RSS-Icon oder „XML“ auf orangenem Hintergrund oder auch nur nach den Buchstaben „RSS“ und findet nichts. Nur das Icon in der Adresszeile weist darauf hin, dass es einen Feed gibt. Die einzige Möglichkeit an die Adresse zu kommen ist also den Quelltext der Webseite zu durchsuchen … sehr mühsam!

Liebes Webvolk! Wenn ihr schon Feeds von euren Inhalten anbietet, dann macht sie doch auch bitte abonnierbar und zwar nicht nur mit dem browsereigenen Feedreader. Danke schön.

Kategorien
Erlangen In eigener Sache

Blogs aus Erlangen reloaded (BloggER)

BloggER
Die Unterseite „BloggER“ (BloggER aus Erlangen) ist wieder zurück. Ich verwende dafür jetzt das Plugin BDP RSS Aggregator, das perfekt funktioniert, allerdings eine weniger übersichtliche Ausgabe hat als meine mit Magpie zusammengebastelte Frickelversion.

Aber es funktioniert und ist im Plugin sehr einfach einzustellen. Falls noch jemand ein Blog aus Erlangen und Umgebung kennt dessen Feed nicht vorkommt und das überhaupt einen Feed hat (Plasma?), bitte melden. Ich nehme es gerne auf :-)