Duplicate Content
Unter Duplicate Content (DC) verstehen Suchmaschinen textuellen Inhalt, der sich in mehreren Textdokumenten im Internet befinden. Man unterscheidet hier zwischen domain-internen Duplikaten und domain-übergreifenden Duplikaten.
Die Folgen
Wird viel Content Ihrer Domain als Duplicate Content identifiziert, so müssen Sie von einer harten Abstrafung rechnen. Suchmaschinen-Rankings von 100 und höher sind nicht selten. Manche harte Fälle werden sogar gänzlich aus dem Index genommen.
Wie kommt es zu Duplicate Content?
Duplicate Content entsteht indem Kopien vom Original-Textex angefertigt werden. Man unterscheidet hierbei insbesondere selbst gemachte Kopien und solche, die von anderen Personen ohne Auftrag gefertigt wurden.
Im einfachsten Fall hat der Webmaster selbst den Inhalt aus Bequemlichkeit kopiert. Insbesondere Landing-Pages neigen dazu, Texte der Startseite beinahe unverändert aufzugreifen. Eine weitere Möglichkeit ist, dass Ihre Internetseite absichtlich unter mehreren Domains verfügbar gehalten wird. In beiden Fällen ist eine Abstrafung von Seiten der Suchmaschinenbetreiber sehr wahrscheinlich.
Weitaus schwieriger ist der Fall gelagert, wenn man nicht selbst an der Anfertigung der Kopie beteiligt war und die Kopie auf anderen Domains vorgehalten wird. Hierfür gibt es eine ganze Reihe von Möglichkeiten.
- Ein Spammer hat Ihren Inhalt geklaut und versucht sich damit einen Vorteil im Ranking bei einer Suchmaschine zu erschleichen.
- Der Betreiber einer Linkliste oder eines Verzeichnisses ist "freundlicherweise" in Vorleistung getreten, war aber zu faul, eigene Texte anzufertigen.
- Sie haben Ihren Partnern selbst die Genehmigung zur Verwendung Ihrer Texte erteilt. Diese verwenden die Texte auf ihren eigenen Internetseiten ohne auf Sie zu verlinken.
- Sie betreiben einen RSS-Kanal mit Inhalten Ihrer Internetseite, andere Webmaster integrieren diese in ihre eigenen Seiten ohne einen Backlink.
Duplicate Content entdecken
Am einfachsten lässt sich Duplicate Content entdecken, in dem Sie einige Passagen Ihrer Texte in eine Suchmaschine eingeben. Achten Sie darauf, auch ausgeblendete Ergebnisse anzuzeigen. Google bietet dazu am Ende der Suchmaschine eine Option. Diese wird aber nur angezeigt, wenn Google auch Seiten aus der Anzeige ausgelassen hat.
Was ist das (technische) Problem?
Für Suchmaschinenbetreiber ist oft nicht nachvollziehbar, welcher Content tatsächlich zuerst da war. Das Original oder die Fälschung. In der Regel gewinnt die Seite, die als erstes mit dem Inhalt indiziert wird. Ändert man dann aber seine Seitenstruktur, so kann die neue Struktur häufig von Suchmaschinen fälschlicherweise als Duplicate Content erkannt werden.
Was kann man dagegen tun?
Hat man doppelten Inhalt auf der eigenen Seite, so bleiben einem zwei Möglichkeiten. Entweder lässt man eine der Seiten den 301-HTTP-Status-Code senden und damit den Besucher auf die jeweils andere Seite umleiten oder man setzt das link-rel-canonical Attribut um Google mitzuteilen, dass dies eine bewusste Kopie des Inhaltes ist und die Seite nicht gewertet werden soll.
Betreiben Sie zwei Domains mit gleichem Inhalt und wollen nicht eine der beiden Seiten per 301-HTTP-Status entwerten, so bleibt Ihnen noch die Möglichkeit, bei Google die bevorzugte Domain einzustellen. Steht Google dann beim nächsten Mal vor der Entscheidung, welche Domain ein Original und welche die Fälschung ist, so wird sich Google für die korrekte Domain entscheiden.
Für Druckansichten oder ähnliche legitime Kopien des Inhalts können Sie ihre robots.txt derart konfigurieren, dass Google die Druckansichten o.Ä. gänzlich ignoriert. Alternativ lassen sich auch im HTML-Dokument direkt ein nofollow und noindex definieren.
Bei fremdkopierten Inhalten sieht die Situation bereits schwerer aus:
- Zunächst sollte Kontakt mit dem Seiteninhaber aufgenommen werden mit der Bitte, den doppelten Inhalt zu entfernen oder durch einen eigenen Text zu ersetzen.
- Reagiert der Seiteninhaber nicht auf Ihr Anschreiben so sollten Sie seinen Hoster über die Abuse-Adresse kontaktieren. Diese lautet in der Regel abuse@host-provider.de
- Reagiert der Seiteninhaber nicht auf Ihr Anschreiben und sein Hoster nicht auf Ihre Abuse Notice und ist der Inhalt offensichtlich in böser Absicht kopiert worden, so sollten Sie Anzeige bei der Polizei erstatten.
- Handelt es sich um per RSS eingebundenen Inhalt, so sollte der Nutzer der Inhalte einen Link auf die entsprechende Seite ihrer Website setzen. Dadurch weiss Google, wer der Originalschreiber ist.
