Duplicate Content (deutsch: „doppelter Inhalt“) bedeutet, dass ein bestimmter Webseiten-Inhalt mehrfach im Internet vorhanden ist. Dies kann zu großen Nachteilen für alle Beteiligten, sowohl für den Urheber als auch den „Dieb“ führen und endet meistens in einer schlechten (oder gar keinen) Position in den Google Suchergebnissen.
Solcher Duplicate Content kann aber auch innerhalb einer WordPress Website vorkommen. Dadurch kann es zu großen Nachteilen kommen, glücklicherweise kannst du mit Hilfe von Plugins deine Website so konfigurieren, dass dir bei Google durch diesen Duplicate Content keine Nachteile entstehen.
Bedeutung von Duplicate Content
Um das Duplicate-Content Problem zu verstehen, ist es nützlich, zu wissen, wie Google arbeitet. Die Suchmaschine liest die Inhalte vieler, vieler Webseiten durch kleine, automatische Programme ein und speichert sie in einer riesigen Datenbank.
Bei jeder Suchanfrage wird geprüft, welche Websites Inhalte aufweisen, die am besten zu den eingegebenen Suchbegriffen passen. Das Ziel der Suchmaschinen ist, eine Liste hochwertiger und einzigartiger Webseiten anzuzeigen, welche die Suchanfrage des Nutzers beantworten. Die Inhalte werden daher nach verschiedenen Kriterien bewertet und die „besten“ Seiten vorne aufgelistet.
Als Duplicate Content werden Inhalte eingestuft, die in der Suchmaschinen-Datenbank mehrfach vorkommen. Dies ist dann der Fall, wenn ein gleicher oder sehr ähnlicher Text über verschiedene Webseiten abrufbar ist.
Wie bereits oben beschrieben, geht es hierbei insbesondere darum, dass Duplicate Content auch innerhalb einer Website entstehen kann, nicht nur durch Content-Klau.
Duplicate Content führt zu zwei Problemen.
Erstens weiß die Suchmaschine nicht genau, welche Seite sie nun für die Suchanfrage anzeigen soll. Beide enthalten schließlich den gleichen Inhalt und doppelte Ergebnisse bringen einem Suchenden keinen Mehrwert. Die Suchmaschine entscheidet sich dann mal für die eine, mal für die andere Seite.
Zweitens kann Google bei sehr vielen Dopplungen vermuten, dass es sich um Spam oder Plagiate handelt. In diesem Fall droht eine schlechtere Bewertung durch die Suchmaschine: Die betroffene Seite erscheint weiter hinten in den Suchergebnissen (oder wird komplett aus den Suchergebnissen entfernt) und wird kaum bis gar nicht mehr von potenziellen Lesern gefunden. Dieser Fall tritt allerdings nur beim Klau von Inhalten auf, also von Content, der auf mehreren verschiedenen Websites liegt.
Wie Duplicate Content WordPress Blogs schaden kann
Auch ohne böse Absicht können bei WordPress-Websites viele solcher Dopplungen automatisch entstehen. Denn wenn du einen Beitrag erstellst, wird der Text von WordPress an mehreren Stellen ausgegeben.
Jeder Beitrag erscheint natürlich als eigene Unterseite deines Blogs.
Zudem wird der Text auch auf der Blog Übersichtsseite angezeigt – der Seite also, für die du festgelegt hast, dass die Beiträge alle in umgekehrt chronologischer Reihenfolge erscheinen soll. Je nach Theme und Einstellung wird dort der gesamte Beitrag oder nur ein Textanriss angezeigt.
Mindestens der Anfang jedes Beitrags wird auch angezeigt, wenn Leser Kategorien oder Schlagwörter (Tags) anklicken. Dann erscheint eine Liste aller Artikel, welche diese Kategorie oder dieses Schlagwort verwenden. Auch auf Archivseiten, die alle Beiträge eines Monats oder eines Autors anzeigen, erscheinen sie, wodurch das Problem des Duplicate Content besteht.
Google kann und wird diese mehrfach vorhandenen Texte als Duplicate Content einstufen. Wird eine Suchanfrage getätigt, kommt es vor, dass dann nicht die passende Unterseite, sondern die Blog Übersichtsseite oder gar eine Kategorien- oder Archivseite in den Suchergebnissen angezeigt wird.
Auch das Übernehmen von Textpassagen anderer Seiten kann zu Duplicate Content führen. Wenn du also etwas aus einem fremden Artikel zitieren möchtest, halte das Zitat möglichst kurz oder formuliere es am besten in deine eigenen Worte um.
Duplicate Content mit dem Yoast SEO Plugin vermeiden
Glücklicherweise kannst du zur Vermeidung von Duplicate Content WordPress so konfigurieren, dass möglichst die von gewünschte Seite von Google angezeigt wird.
Dabei ist das Plugin „Yoast SEO“ nützlich. Es kann kostenlos heruntergeladen und im Backend unter „SEO“ aufgerufen werden.
Dank dem „noindex“ Befehl, können gewisse Seiten für den Suchmaschinen-Index gesperrt werden. Sie werden also nicht mit aufgenommen in die Bibliothek der Websites und somit auch bei Suchanfragen nicht angezeigt.
Mit Yoast SEO kannst du die spezifischen Archiv-Seiten (Autorseite, Datumsseite etc.) auf noindex stellen. Dadurch wird der Duplicate Content verhindert, und der auf das Keyword optimierte Blogartikel oder die Seite in den Suchergebnissen angezeigt.
Die entsprechenden Einstellungen findest du unter dem Menüeintrag „Titel & Metas“ und dem Reiter „Archive“.
Wenn du mit diesen Einstellungen nichts anfangen kannst, schaue dir meinen folgenden Artikel dazu an, hier erkläre ich dir genau, wie du Yoast SEO richtig konfigurierst!
Danke, ich habe diese Einstellungen direkt gesetzt.
Mal sehen, ob meine Rankings jetzt explodieren.
Hey David,
na explodieren nicht gerade, aber du verhinderst auf jeden Fall zukünftige Abstrafungen 😉
Grüße
Jonas
Lieber Jonas,
ich lese immer gerne, was Du schreibst. Jetzt habe ich eine Frage: Unter welchen Yoast-Punkten finde ich denn die Autor-Archiv- und Datum-Archiv-Einstellungen?
Liebe Grüße, Miriam
Hey Miriam,
Unter „SEO“ -> „Titel & Metas“ -> „Archive“ 🙂
Viel Erfolg!
Jonas
Ich bezweifel, dass Google Übersichtsseiten als doppelten Content ansieht und in irgendeiner Weise bestraft. Sie können mittlerweile relative zuordnen, was da auf der Seite passiert.
John Müller von Google hat zu diesem Thema im April diesen Jahres folgendes gesagt, was sie unter Duplicate Content verstehen:
„Eher Inhalte, die einfach von anderen Seiten zusammengeklaut werden. Also alles, was gescraped oder gespinnt ist und damit Spam darstellt. Aber Dinge, die es aus Usabilitygründen mehrfach gibt, sind ok.“
Hey Dominik,
ja da hast du Recht 🙂
Grüße
Jonas
Liebe Jonas!
Die Information ist wirklich interssant! Besonders für Blogger-Anfänger! Danke! Ich werde das unbedinnt berücksichtigen!
LG! Patrick
Moin Patrick,
klasse, dann viel Erfolg dabei! 🙂
Grüße
Jonas
Vielen Dank für die wertvolle Information! Viele denken, dass je mehr Information sie auf ihrer Webseite platzieren (also je größer eigenes Content wird), desto mehr Chancen auf die Top-Positionen in Google-Ranking sie später haben werden. Gleichzeitig, vergisst man, dass das Content einzigartig sein soll und das man kein Duplicate Content veröffentlichen darf. Dies hat schlechte Folgen für SEO.
Moin Moin,
vollkommen richtig, Qualität geht definitiv über Quantität! Trotzdem ist eine umfangreiche Behandlung von Themen natürlich wichtig.
Grüße
Jonas
naja, das stimmt, Qualität ist hier viel wichtiger..
Hallo,
ich möchte gerne die Kommentarseiten wie aus dem Google-Index entfernen (Duplicate Content). Wie bekomme ich diese /content-page-2 etc) da raus? Ich nutze All-in-One-SEO, finde dort aber nichts? Die Funktion „Noindex für paginierte Seiten/Beiträge“ löst das Problem leider nicht.
Weißt Du vielleicht eine Lösung?
Lieben Gruß.
Sebastian
Moin,
was meinst du mit „Kommentarseiten“?
Das kommt drauf an, wodurch diese /content-page-2 generiert wird. Wenn das die zweite Seite deines Blogs ist, solltest du die nicht auf noindex setzen.
Grüße
Jonas
Danke für deinen Artikel. War sehr hilfreich!
Moin,
ich hab mit DC durch eine Umstellung von HTTP auf HTTPs zu kämpfen. Laut Google Search Tools „wählt“ Google eine andere kanonische URL als die, die vom Nutzer vorgegeben wurde.
Hast du dazu zufällig ein paar Gedanken / Idee oder gar Blog-Artikel parat?
Gruß
Ron
Moin Ron,
wird weiterhin die alte HTTP Variante als kanonische URL gewählt? Manchmal kann es etwas dauern, bis Google das nach der Umstellung auf HTTPS erkennt.
Viele Grüße
Jonas