Google ist für alle Webmaster in Deutschland mit über 90% Marktanteil die wichtigste Suchmaschine überhaupt. Leider oder zum Glück lässt sie sich kaum manipulieren, sodass man auf dem Webmarkt nur eine Chance hat, wenn man nach den Spielpregeln von Google spielt.

Indizierung
Wie der Google-Bot (Crawler) vorgeht, kann man nicht genau sagen, was man nur mit Sicherheit weiß ist, dass er Bilder und Videos sowie Audios (noch) nicht erkennen kann. Worum es dem kleinen Surfsklaven von Google geht ist Text. Je mehr desto besser.

Keywords
Der Googlebot geht wahrscheinlich Texte durch und indiziert sie indem er sie von allem unnützen Zeug wie Smilies, zu vielen Absätzen und Füllwörtern trennt. Die Wörter die am häufigsten sind, sind für den Bot sinngebend: Kommen in einem Text besonders oft die Wörter Haarverlängerung und Dresden vor, wird es in dem Text wohl um Haarverlängeringen in Dresden gehen.

Manipulation zwecklos
Kommen die o.g. Wörter zu oft in einem Text vor, riecht das für den Webstaubsauger nach Manipulation und der Text wird abgewertet. Oft taucht die Seite dann erst auf der 30. Seite bei Google auf, sodass sie eigentlich absolut irrelevant ist. Wer zusätzlich Keywords in den Footer eines Artikels übernimmt, wird auch nicht glücklich, denn das erkennt Google sofort und bestraft Betreiber der Webseiten ebenfalls mit Sanktionen.

Double Content
Ein weiteres rotes Tuch ist für die Monopolisten-Suchmaschine der doppelte Content (=doppelter Inhalt). Wird beispielsweise ein Wikipedia-Artikel kopiert und auf dem eignene Blog veröffentlicht, so erkennt Google dies und wertet alle Seiten, die den Inhalt wiedergeben ab. Ausgenommen ist hier natürlich die Urheberseite. Google kann jedoch auch nicht erkennen von wem der Artikel stammt, sodass die erste Stelle der Veröffentlichung als Urheber gewertet wird. Double Content ist ohnehin nicht nur unrelevant bei Google, sondern auch noch strafrechtlich verfolgbar. Hier liegt eine Urheberrechtsverletzung vor!

Hidden Content
Auch sogenannter Hidden Content, also Wörter, die zwar im Quelltext einer Seite, aber nicht auf der Seite selbst auftauchen lässt Google links liegen. Und Sachen auf die der Bot überhaupt keinen Zugriff hat, werden selbstverständlich auch nicht indiziert. Nun könnte man auf die Idee kommen, die Homepage oder das Script so zu impfen, dass es allen registrierten Nutzern UND dem Google-Bot seine Informationen preis gibt. Der User-Agent lässt sich aber einfach per Plugin umstellen, sodass dann auch User für den Bot wahrgenommen und den Inhalt zu sehen bekommen.

Linkjuice
Für die Relevanz einer Seite ist jedoch nicht nur wichtig, dass ihr Inhalt den Richtilinien entspricht und das Indizierungsverfahren möglicht gut abdeckt, sondern auch, wie die Verlinkungen von anderen Seiten zu den Beiträgen aussehen. Hier spielt auch der PageRank eine Rolle. Grundsätzlich gilt: Je mehr Verlinkungen es von außen auf Beiträge einer Webseite gibt, desto besser steht die Seite dar. Allerdings ist hier auch die Seriösität der Webseiten von denen die Verlinkung kommt, zu beachten. Ist diese nicht gegeben, kann ein Link von dieser sogar abwertend wirken.

Einem Projekt helfen
Möchte man jetzt einer Webseite helfen, sollte man darauf achten, das man Beiträge möglichst nach SEO-Richtlinien schreibt, keine Keywords versteckt, alle Informationen für jeden Zugänglich sind (was ja kein Problem ist, da jeder Text Copyright-geschützt ist und wenn er doch kopiert wird, als Double Content gewertet wird und somit wertlos ist). Je mehr Text, desto besser und je mehr relevante Keywords, desto besser. Den eigenen Artikel/Beitrag kann man dann je nach Relevanz bei Social-Bookmarking-Diensten, Artikelverzeichnissen und Twitter bekannt machen.

Alles in allem ist Google hart, aber fair und mit den richtigen Handgriffen lassen sich Webseiten, Communities und Foren ganz einfach pushen.

Share and Enjoy:
  • del.icio.us
  • Facebook
  • Google Bookmarks
  • Blogplay
  • MisterWong.DE
  • Tumblr
  • Twitter
  • Webnews.de
  • Yigg