Canonical Tag – so vermeiden Sie Ranking-Verluste wegen doppelter Inhalte

Jedes Content-Piece darf nur unter einer einzigen URL erreichbar sein, sonst entsteht das Problem namens Duplicate Content. Soll ein ähnlicher oder gleicher Inhalt auch auf einer anderen Seite erscheinen, z. B. auf der eines Partners, so muss die zweite URL auf die ursprüngliche URL verweisen.

Gibt es keinen solchen Verweis, wird mindestens eine der beiden Seiten von Google abgestraft und vom Index genommen. Um das zu vermeiden, können Sie die sogenannten kanonischen URLs anwenden. Kanonische URLs oder Canonical Tags sind Angaben im Quellcode einer Website.

Warum sollten Webseitenbetreiber kanonische URLs verwenden?

Nicht nur wegen der Gefahr des Duplicate Contents sollten Webseitenbetreiber manuell auswählen, welche Seite auf eine andere verweisen soll. Es gibt zahlreiche weitere Gründe:

  • Vermeidung der Keyword-Kannibalisierung
    Sind zwei Seiten innerhalb einer Domain auf das gleiche Keyword optimiert, kannibalisieren sie sich. Der Suchmaschinen-Algorithmus entscheidet dann eigenständig, welche der beiden Seiten die relevantere für eine Suchanfrage ist.

  • Differenzierung mehrerer URLs für eine Seite
    Bestehen für eine Seite mehrere URLs, muss eine Entscheidung darüber getroffen werden, welche URL in den Suchergebnissen angezeigt werden soll.
    Möglicherweise bevorzugen Sie als Seitenbetreiber den Aufruf einer bestimmten URL www.beispiel.de/produkt/farbe/produktinfarbe.html vor einer anderen  www.beispiel.de/produkt/beispielprodukt.

    Weiterhin ist es möglich, dass die Startseite über verschiedene URLs erreichbar ist: z. B. www.beispiel.de / www.beispiel.com / www.beispiel.com/home.

  • Zusammenfassung der Linksignale für ähnliche oder doppelte Seiten
    Für Suchmaschinen ist es hilfreich, wenn Sie die verfügbaren Informationen zu einzelnen URLs zu einer bevorzugten URL konsolidieren.
    Links von anderen Websites zu beispiel.de/produkt/beispielprodukt werden zu www.beispiel.de/produkt/farbe/produktinfarbe.html zusammengefasst.
    Es ist möglich, dass Ihr Server so konfiguriert ist, dass HTTP- und HTTPS-Varianten mit und ohne “WWW” für die gleichen Inhalte erreichbar sind.

  • Leichtere Erfassung der Messwerte für ein Produkt oder gezieltes Thema
    Wird ein Canonical Tag festgelegt, vereinfacht dies konsolidierte Messwerte für einen bestimmten Inhalt zu generieren.

  • Verwaltung syndizierter Inhalte
    Sollen Inhalte zur Veröffentlichung unter anderen Domains syndiziert werden, der Canonical Tag auf die bevorzugte URL ausgerichtet werden.

  • Einsparung der Crawling-Zeit auf doppelten Seiten
    Wenn Sie mit Ihrer Seite das bestmögliche Google-Ergebnis herausholen wollen, sollte der Googlebot angewiesen werden, die jeweils neueste Version der Seite auf der Website crawlt. Woher wissen Seitenbetreiber, welche URL die kanonische ist?

Mit dem URL-Prüftool in der Google Search Console können Sie überprüfen, welche Seite Google als kanonisch ansieht. Beachten Sie, dass Google möglicherweise aus verschiedenen Gründen (z. B. aufgrund der Leistung oder des Inhalts einer Seite) eine andere Seite als kanonisch auswählt, als Sie festgelegt haben. Begründet kann dies durch falsch markierte Sprachvarianten oder falsch konfigurierte Server sein.

In diesem Google Webmasters Video erklärt John Mueller, wie Google zwischen Seiten mit gleichem Inhalt auswählt:

<iframe allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen="" frameborder="0" height="315" src="https://www.youtube.com/embed/8j_hxBw5B4E" width="560"></iframe>

Mögliche Varianten des Canonical Tag

Bei allen Varianten empfiehlt Google die Angabe absoluter URLs, also der gesamten Internetadresse.

<linkrel=&ldquo;canonical&ldquo;href=&ldquo;http://www.beispiel.de/beispielseite.htm">

Variante 1: Integration im Head-Element des Quellcodes

Das Link-Element mit dem Attribut “canonical” wird im Head-Element des Quellcodes platziert und ergänzt die Meta-Angaben eines Dokuments. Das Element verweist auf die Standardseite, wird aber nur dort verwendet, wo Seiten identische Inhalte aufweisen, aber nicht als ursprüngliche Quelle behandelt werden sollen. Ein Beispiel dafür würde so aussehen:

www.beispiel.de/beispielseite.htm

www.beispiel.de/beispielseite/

Die erste URL bildet in diesem Fall die Standardressource, die zweite eine Session um benutzerbezogene Daten speichern zu können, wie z. B. hinterlegte Artikel in einem Warenkorb.

Der Canonical Tag wird in das Head-Element der zweiten Seite integriert, die anschließend einen Verweis auf die ursprüngliche Seite enthält. Suchmaschinen wie Google behandeln dann die ursprüngliche Seite bevorzugt und stufen den Inhalt nicht als Duplicate Content ein.

Diese Version ermöglicht das Zuordnen einer unendlichen Anzahl doppelter Seiten, kann aber auch zu einer Vergrößerung des Seitenumfangs führen.

Variante 2: Anpassung des HTTP-Headers

Besteht die Standardressource aus einer PDF-Datei oder einem anderen Dateityp, der von Google unterstützt wird, muss der Canonical Tag hier in den Header der Seite integriert werden. Hier unterscheidet sich jedoch die Syntax und die Einbindung erfordert Kenntnis über das Hypertext Transfer Protokoll (HTTP).

Link: <http://www.beispiel.de/beispielseite.pdf>; rel="canonical"

Diese Angabe ist sozusagen als Anweisung für die Antwort des HTTP-Protokolls zu verstehen. Wenn eine Client-Anfrage kommt, wird vom Server die Antwort ausgegeben, dass es sich bei dieser Seite um die kanonische URL handelt.

Würden diese beiden Versionen einer URL vorliegen, müsste der Canonical Tag in den Header hinterlegt werden, weil die Standardressource als PDF-Datei vorliegt.

www.beispiel.de/beispielseite.htm

www.beispiel.de/beispielseite.pdf

Diese Version hat die Vorteile, dass sich die Seite nicht vergrößert und die Zuordnung einer unendlichen Anzahl doppelter Seiten ermöglicht. Allerdings kann die Zuordnung auf größeren Websites, auf denen sich URLs häufig ändern, mit dieser Variante erschwert werden.

Variante 3: 301-Weiterleitung

Um dem Googlebot zu signalisieren, dass die umgeleitete URL nun als Original anzusehen ist, können 301-Weiterleitungen verwendet werden. Diese Möglichkeit sollte allerdings nur in Betracht gezogen werden, wenn das ursprüngliche Original außer Betrieb genommen wird.
Der 301-Statuscode besagt, dass eine Seite dauerhaft an einen neuen Speicherort verschoben wurde.

Variante 4: AMP-Variante

Ist eine der gegebenen Seiten eine AMP-Seite, können Sie sich bei der Angabe der kanonischen Seite an den AMP-Richtlinien orientieren.

Grundsätzlich können Canonical Tags auf jeder Unterseite eingebaut werden, damit jede Seite auf sich selbst zeigt. So können unerwartete Fehler und falsche Verlinkungen korrigiert oder verhindert werden.

Der Tag verweist auf das Dokument und gibt Suchmaschinen den Hinweis darauf, dass dieses Dokument als Standard für die Indexierung dienen soll.

Diese Fehler sollten Sie bei der Einstellung von Canonical Tags vermeiden

Wird der Canonical Tag falsch eingesetzt, kann es passieren, dass Seiten von Google ignoriert werden. Ein Canonical Tag ist nur dann sinnvoll, wenn die Seiten tatsächlich identische oder allenfalls nahezu identische Inhalte aufweisen.

  • Canonical Tags bei paginierten Seiten durch “rel-next” und “rel-prev”
    Bei paginierten Seiten durch “rel-next” und “rel-prev” sind Canonical Tags nicht sinnvoll, da die Inhalte nicht gleich sind.
     
  • Canonical Tags bei 404-Seiten
    Webseiten, die mit Canonical Tags versehen werden, sollten unbedingt erreichbar sein.
     
  • Kombination mit “noindex”, “disallow” und “nofollow”
    Seiten, die bereits mit Canonical Tags versehen werden, sollten auf keinen Fall zusätzlich mit den Attributen “noindex”, “disallow” und “nofollow” versehen werden.
     
  • Mehrfachverwendung des Canonical Tags in Meta-Tags
    Canonical Tags dürfen nicht in den Body-Bereich eines Dokuments eingefügt werden oder mehrfach in Meta-Tags verwendet werden.
     
  • Link im Canonical Tag unvollständig angeben
    Wird eine relative Pfadangabe als kanonisches Linkziel angegeben, kann es sein, dass Google die Angabe falsch interpretiert und das Canonical Tag seine Wirkung verliert. Deshalb sollte der Link im Canonical Tag immer vollständig angegeben werden.
     
  • Missachtung der Syntax
    Da die Syntax nicht beachtet wird, sollten immer alle Zeichen in der Angabe berücksichtigt werden. Dies gilt auch für das Protokoll: Google bevorzugt sichere HTTPS-Seiten als kanonische URLs. Deshalb sollte die HTTP-Seite immer auf die HTTPS-Seite verweisen.
     
  • Verweis auf die Startseite der Domain
    Verweist ein Canonical Tag auf die Startseite einer Domain, würde er anzeigen, dass es Duplikate einer Seite gibt. Damit wäre der Tag falsch gesetzt.

Werden Canonical Tags fehlerhaft verwendet, entstehen Canonical-Ketten oder gegenseitige Verweise. Achten Sie darauf, dass Canonical Links nicht auf andere Canonicals verweisen.

Auch in der Google Search Console können Webmaster festlegen, wie Google die Parameter einer Website behandeln soll. Doch achten Sie darauf, dass Google nicht die von Ihnen festgelegte Seite als kanonische URL verwenden muss, sondern sie möglicherweise wie oben erwähnt aufgrund ihrer Leistung anders einstufen.