Skip to content

Pandalyse – Google Panda Analyse

Jeder SEO und jede Agentur hat auf den Tag der Einführung von Googles Panda in Europa und vorallen in Deutschland gewartet. Im Laufe der letzten Woche ist es passiert – das Google Panda Update wurde ausgerollt und es hat einige Seiten getroffen von denen es erwartet wurde und einige Überraschungen parat gehabt.
In diesem Artikel möchte ich ein paar Vermutungen und Analysen zum Google Panda Update zum Besten geben.

Ich möchte an dieser Stelle auch betonen, dass ich einen Anspruch weder die Vollständigkeit noch die Korrektheit der Vermutungen erhebe. Vielmehr soll der Artikel etwas über den Tellerrand hinausblicken und zum Nachdenken und Diskutieren anregen.

Was ist Panda

In meinen Augen ist Panda etwas komplett anderes als zum Beispiel ein Caffeine Rollout im Jahre 2010. Damals ging es in erster Linie darum den Algorithmus in Richtung Aktualität und zeitnaher Indizierung zu verschieben. Bei dem Panda Update handelt es sich eher um ein Scoring – ähnlich dem PangRank.
Für diese Vermutung gibt es eine Reihe Indizien :

  • Es gibt kaum Ähnlichkeiten bei den betroffenen Seiten
  • Es betrifft Seiten als allen Bereichen
  • Es exisiteren keine eindeutigen Signale

Welche Signale exisiteren

Im Online Stammtisch von Eisy wurden am Dienstag viele Interessante Punkte besprochen, die gegebenfalls als Signale gewertet werden könnten.
Neben den schon von Eisy aufgeführten Faktoren wie ein unnatürliches Keyword Linkbuilding, der Verweildauer der Besucher auf einer Seite, einem großen Ad/Content Verhältnis und einer hohen Absprungsrate, zählt in meinen Augen vorallen erweiterte Textanalyse.

Die Textanalyse

Vorallen die Absprungsrate und die Besuchszeit der Besucher auf einer Seite halte ich für unwahrscheinlich. Zum einen weil diese Werte für eine Suchmachine praktisch nicht zu messen sind und zum anderen weil Google von sich selbst sagt, dass sie den Suchenden schnellstmöglichst zu seiner Antwort führen wollen. Was ist also besser, als ein Besucher der etwas sucht, auf das erste Ergebnis klickt, dann seine Information findet und die Suche beendet.
Für die Textanalyse spricht zum Beispiel die sehr viel spätere Einführung von Panda in Nicht-Englischsprachigen-Ländern. Auch die Tatsache, dass in den letzten Monaten in den TOP 10 fast immer Contentaggregatoren zu finden waren, die nur irgendwelchen Content zusammengespeist haben und keinen Mehrwert geboten haben werden Google ein großes Dorn im Auge sein.
Man wird leider erst mit dem zweiten oder dritten Update genauer definieren können wie und welche Textanalysen durchgeführt wurden, aber man kann aktuell schon mutmaßen.

Zu den wahrscheinlichsten Analysen gehören wohl :

  • Semantische Analyse einer Seite
  • Ermittlung des Themas und Kategorisierung einer Seite
  • Ermittlung der Lesbarkeit und Textqualität
  • Stemming von Wörtern
  • Synonym- und Wortnormalisierung
  • Ähnlichkeitsanalyse innerhalb einer Seite
  • Verschachtlungstiefe der Seite- Verhältnis von Content zu Ads oder anderen Nicht-Content

Wenn man sich die oben genannten Punkte ansieht und in den Googlelabs nach entsprechenden Techniken umsieht, dann werden einen der Google Ngram Viewer und Google Scribe ins Auge springen. Diese Tools zeigen sehr Eindrucksvoll welche Informationen Google durch die Indizierung von Wörtern und Webseiten bereits gesammelt hat und das man diese Daten für einen entsprechende Berechnung nutzen kann.

Die Gewinner und Verlierer

In den Blogs von Sistrix und Searchmetrics werden Eindrucksvoll einige Gewinner und Verlierer aufgelistet. Diese Daten sind jedoch immer relativ und abhängig vom Keywordset zu beobachten – Diese Daten bilden keinerlei Korrelation zum Traffic ab! Unter Umständen sind dort auch Seiten reingefallen, die sich gerade in einem Relaunch oder Redesign finden.

Unabhängig davon geben die Daten natürlich einen Groben Überblick über mögliche Pandaopfer.
Besonders auffälig sind in meinen Augen die vielen Seiten, die intern viele Seiten zu einem ähnlichen Thema haben (Praktisch alle Frageportale) oder irgendwelche Portalseiten die viel Content auf der Seite haben, aber diese in extrem viele Fragment zerlegt sind (Typische Kategorieseiten mit vielen Verlinkungen Beispiel 1 oder
Beispiel 2). Solche Beispiel findet man auf fast jeder der „bestraften Seiten“.
Neben diesem Aspekt wurde im Onlinestammtisch darauf verwiesen, dass eigentlich keine Seiten betroffen sind, die Bilder oder Videos in ihrem Content beinhalten. Wenn man sich jedoch Seiten wie Helpster.de oder Alatest.de ansieht halte ich diese Aussage für nicht griffig.

Fazit

Den Text habe ich größtenteils ohne Vorbereitung geschrieben, damit ich selbst meine Gedanken während des Schreibens noch ausbauen kann. Wenn ich mir die Punkte nochmal durchlesen glaube ich behaupten zu können, dass es sich beim Panda Update wirklich um einen Punktwert handelt. Um genau zu sein wohl um einen Score der die Textqualität definiert. Wenn man sich die bisherigen Updates in den USA anschaut scheint dies meine These noch zu verstärken – denn in den gefolgten Updates hat es oftmals Seiten getroffen, die Links von vorherigen Opfern erhalten haben. Es scheint so als würde der PandaScore den Linkjuice beeinflußt und damit Links von Schlechttext-Seiten herabgestuft werden. Als logisches Resultat würde sich die Verlinkung und daraus resultierend die Platzierung in den Serps verschlechtern.
Wie bei jedem Score scheint es auch einen Schwellwert zu geben der erst Überschritten werden muss um bestraft zu werden. Man darf auf das nächste Update gespannt sein um neue Erkenntnisse sammeln zu können.

Interessante Artikel

Kommentare

2 Kommentare

  1. PandaTrainee August 18, 2011

    Ein sehr interessanter Artikel ─ danke dafür!
    Den Vergleich zwischen dem Panda und dem Caffeine Rollout finde ich sehr spannend. Da habe ich vorher noch nicht drüber nachgedacht.
    Ich denke, dass der Panda noch einige Nachjustierung nach sich ziehen wird und bin gespannt, was uns in diesem Zuge noch erwartet.
    Beste Grüße, der Panda-Trainee

  2. Matze August 21, 2011

    Hy,ich glaube zu wissen, dass die meisten oben genannten Punkte bereits vor Panda gemacht wurden. Ich denke es geht mehr um z.B. brachenspezifische Abrungraten, visuelle Analyse der Einbindung der Ads, Auswertungen von Klickverhalten, Größe der Seite und wie oft neue Texte mit welcher Qualität erscheinen, …

Kommentiere den Artikel

Required

Required

Optional