So findet und vermeidet Ihr Duplicate Content

Das Wort Content mit Scrabble-Steinen gelegt. Unique Content is king. Duplicate Content vermeiden.
Unique Content is king. Duplicate Content vermeiden.

Wer sich mit Suchmaschinenoptimierung beschäftigt, stößt auf das Thema "Duplicate Content". Jeder, der sich mit Inhalten im Web beschäftigt, weiß inzwischen, dass doppelte Inhalte schlecht sind. Wir erklären, wieso das überhaupt so ist, und was Ihr dagegen tun könnt.

Das Thema Duplicate Content erinnert ein bisschen an das Wetter. Alle sprechen davon, aber nicht jeder kennt sich auch tatsächlich damit aus. So gibt es jede Menge Halbwissen rund um die doppelten Inhalte. Einigkeit herrscht dann nur darin, dass sie schlecht für das Ranking bei einer Suchmaschine sind. Wir haben uns das Thema für Euch einmal genauer angesehen.

Was ist Duplicate Content eigentlich?

Unter "Duplicate Content" (DC) werden gleiche oder doch sehr ähnliche Seiteninhalte verstanden, die unter verschiedenen URLs erreichbar sind. Das Phänomen gibt es in unterschiedlicher Ausprägung:

  • Externer Duplicate Content: Die gleichen Inhalte sind auf unterschiedlichen Domains zu finden. Das kann selbst verschuldet sein, etwa in Folge eines Domain-Umzugs. Oder aber jemand nutzt Euren Content auf seinen eigenen Seiten. Mit anderen Worten, hat die Inhalte also geklaut.
  • Interner Duplicate Content: In diesem Fall kann der Inhalt über mehrere Varianten auf der gleichen Domain aufgerufen werden. Beispielsweise ist die Webseite mit und ohne "www" erreichbar.

 

Wieso sind doppelte Inhalte schlecht für das Suchmaschinen-Ranking?

Es ist das erklärte Ziel von Google, den Nutzern die besten Suchergebnisse zu präsentieren, d.h. wer bei Google nach etwas sucht, soll die Seiten finden, die perfekt auf die Anfrage passen. Wenn die gleichen Inhalte unter zwei oder gar mehr Adressen zu finden sind, widerspricht das natürlich diesem Ansatz.

Doppelte Inhalte sind aus Sicht von Google auch eine Verschwendung von Ressourcen und Speicherplatz.  Eine Suchmaschine nimmt den doppelten Inhalt zunächst einmal in den Index auf. Dann wird der Content mit allen bereits vorhandenen Inhalten verglichen. Kommt es hier zu Übereinstimmungen, wird der doppelte Inhalt herausgefiltert. Unter Umständen wird der doppelte Inhalt auch als Versuch der Manipulation gesehen, was dann dafür sorgt, dass das gesamte Angebot aus dem Index fliegt.

Mit anderen Worten: Doppelte Inhalte können dafür sorgen, dass Eure Seite bei Google gar nicht mehr aufgeführt wird oder deutlich schlechter in den Ergebnissen angezeigt wird, als sie es eigentlich verdient hätte.

Außerdem kann es passieren, dass ein anderes Angebot als Urheber der Inhalte gesehen wird und mit Eurem Content im Index steht, während Euer Inhalt gar nicht aufgeführt wird. Das passiert dann, wenn Google anhand weiterer Faktoren (externe und interne Links) zu dem Schluss kommt, dass es sich bei der anderen Seite um den eigentlichen Urheber handelt. Deshalb ist es definitiv besser, doppelte Inhalte zu vermeiden!

Gründe für doppelte Inhalte

In nur wenigen Fällen ist Content-Diebstahl die Ursache für doppelte Inhalte. In der Regel ist das Problem eher hausgemacht und oft genug auch unabsichtlich entstanden. Mögliche Ursachen können sein:

  • Die Startseite ist mit und ohne www erreichbar.
  • Die Seite ist per http und https erreichbar.
  • Die Domain ist umgezogen (z.B. von abc.de nach abc.info). Die alten Seiten sind noch im Index enthalten, die neue liefert aber identische Inhalte.
  • Falsche Kategorien oder Nummerierungen: Blogs und Shops bieten automatische Zusammenstellungen von Kategorien und Seitennummerierungen. Hier kann es passieren, dass ein Teil der Seite gleich bleibt, sich aber die Adressen ändern, also doppelte Inhalte entstehen.
  • Produktbeschreibungen gleichen sich. Taucht für die verschiedenen Varianten eines Produkts stets die gleiche oder sehr ähnliche Beschreibung auf, ist Duplicate Content zu befürchten.

 

Duplicate Content erkennen

Leider gibt es kein Patentrezept, um Duplicate Content zu erkennen. Es gibt aber einige Services, die helfen:

  • Google: Mit der Suchmaschine selbst könnt Ihr Euch einen ersten Überblick verschaffen. Gebt direkt in der Suchmaske einmal "site:euredomain.de" ein. Google meldet jetzt zurück, wie viele Dokumente es von dieser Adresse im Index hat. Liegt der Wert deutlich über den geschätzten Artikeln, dann existiert wahrscheinlich ein Duplicate Content Problem.
  • Schneller geht es mit der "Search Console", die Teil der kostenlos nutzbaren Webmaster-Tools von Google ist. Hier erfolgt ebenfalls eine Rückmeldung über die Zahl der indexierten Seiten.
  • Siteliner hat sich auf die Identifizierung von doppelten Inhalten spezialisiert. Der Service untersucht die eingetragene URL und liefert eine detailreiche Analyse. Allerdings ist in der kostenfreien Version die Nutzung auf 250 Seiten beschränkt.
Eine Analyse der eigenen Seite sollte regelmäßig erfolgen.
Screenshot eines Scans auf siteliner.com.
  • Copyscape möchte insbesondere den Content-Diebstahl erschweren. Einfach die URL der Startseite eingeben und der Service durchsucht das Web nach Duplikaten. Das funktioniert am besten mit längeren Beiträgen und Artikeln. Für Shopseiten ist das weniger gut geeignet. 
Dem Content-Klau auf der Spur.
Screenshot einer Eingabe auf copyscape.com.

So vermeidet Ihr Duplicate Content

Welche Maßnahmen gegen den doppelten Inhalt genutzt werden können, hängt in erster Linie von der Ursache ab. Wurden Texte einfach von jemand anderem entwendet, hilft nur der direkte Kontakt mit dem anderen Sitebetreiber. Handelt es sich dagegen um technische Ursachen, ist die Lösung nicht so schwer.

Eine wichtige Rolle in diesem Zusammenhang spielt die Datei ".htaccess", die versteckt im Wurzelverzeichnis der Domain liegt. Darin können dem Webserver Anweisungen gegeben werden, die beispielsweise automatisch weiterleiten. Die Datei selbst ist eine einfache Textdatei, die mit jedem beliebigen Editor bearbeitet werden kann. Wenn zum Beispiel alle Anfragen an die Domain, die nicht "www" enthalten, weitergeleitet werden sollen, führt dieser Codeblock ans Ziel: 

RewriteEngine on RewriteCond %{HTTP_HOST} !^www.domain.de
$RewriteRule ^(.*)$ https://www.domain.de/$1 [L,R=301]

Der Server meldet den Code 301 zurück. Diese Information ist für Suchmaschinen wichtig, denn damit wird erklärt, dass der Content, der ohne "www" aufgerufen werden kann, auf die neue Adresse umgezogen ist. Schon ist dies aus Sicht der Suchmaschine kein doppelter Inhalt mehr.

Ist die Domain umgezogen, wird im Stammverzeichnis in der Datei nur ein Eintrag benötigt:

RedirectPermanent / http://www.neuedomain.de

Druckversionen von Dokumenten unterscheiden sich technisch vom eigentlichen Inhalt. Dieser ist aber nahezu identisch mit der Seite, die in der Suchmaschine hoffentlich möglichst weit oben platziert ist. Deswegen solltet Ihr Google mitteilen, welche Variante als Ursprung bzw. bevorzugte Version anzusehen ist. Dies lässt sich mit dem Setzen einer sogenannten "Canonical URL" erreichen. Mit diesem Zusatz im Dokument wird der Suchmaschine signalisiert, welche URL die bevorzugte ist. Der Code dazu erscheint direkt im jeweiligen HTML-Dokument. Glücklicherweise muss niemand alle Dokumente manuell bearbeiten. Dies erledigen für alle gängigen Redaktions- und Shopsysteme Plug-ins, wie für Wordpress beispielsweise Yoast.

Im Dokument selbst, erscheint dann ein Eintrag wie <link rel="canonical" href="https://example.com/unterseite.html">.

Dank Plug-in werden Canonicals mit einem einfachen Klick gesetzt.
Screenshot der Canonical-Eingabe unter Wordpress.

Texte beim Profi bestellen, Unique Content bekommen

Die beste Versicherung gegen Duplicate Content bleiben originelle Inhalte. Statt schnell Produktbeschreibungen, Landingpages oder Kategorietexte zu kopieren, ist es deutlich besser, sich für seine Inhalte Zeit zu nehmen und individuelle Texte zu schreiben.

Wem dafür die Zeit oder die Kreativität fehlt, wendet sich an eine professionelle Textagentur, wie zum Beispiel – Überraschung – Contify. Hier werden Texte nach Deinen individuellen Vorgaben erstellt: Informativ, gut recherchiert und ansprechend geschrieben. So hat der User beim Lesen Spaß und auch die Suchmaschine weiß, dass auf Deiner Seite echter Mehrwert geboten wird.

Eventueller zufällig auftretender Duplicate Content – auch das soll es geben – wird vor Auslieferung der Texte durch einen Plagiatscheck ausgeschlossen. So kannst Du sicher sein, dass Du Unique Content für Deine Seite bekommst. Die einzige Gefahr besteht darin, dass der Content so gut ist, dass ihn Deine Konkurrenten klauen. Das Problem mit Google-Penalties haben dann aber andere.

Bildnachweise:
duplicate-content-01.jpg: Screenshot von siteliner.com
duplicate-content-02.jpg: Screenshot von copyscape.com
duplicate-content-03.jpg: Screenshot von wordpress.com

Michael Christl, Senior Key Account Manager
Michael Christl hat Politikwissenschaften, Kriminologie und Soziologie in Würzburg studiert. Schon früh entwickelte er ein Gespür für Sprache. Nach seinem Abschluss als Magister arbeitete er zunächst als freischaffender Texter. Seit 2014 gehört Michael als Senior Key Account Manager fest zum Contify-Team. Dabei ist er sowohl für Projekte in deutscher als auch in französischer Sprache zuständig.
© 2019 Contify - die Textagentur