XOVI Glossar

Was ist der Canonical Tag?

Beim Canonical Tag handelt es sich um ein rel Attribut, dass im HTML Quellcode einer Seite als verankert wird. Dieses Tag verweist auf eine kanonische URL, auf der sich identischer Inhalt befindet. Letztendlich dient der Canonical Tag der Suchmaschine als Verweis auf Duplicate Content. Die Suchmaschine indexiert dann nur die Seite mit der kanonischen URL.

Duplicate Content wird von der Suchmaschine negativ bewertet. Google geht davon aus, dass jeder Inhalt an genau einer Stelle im Internet auffindbar sein muss, damit der User einen Nutzen von diesem Inhalt hat. Der gleiche Inhalt an anderer Stelle ist bei dieser Sichtweise überflüssig. Daher wird Duplicate Content negativ bewertet. Wäre das nicht so, stände auf den ersten Seiten der Suchergebnisse möglicherweise mehrfach der gleiche Inhalt.

Warum ist das Canonical Tag wichtig?

Es gibt eine Vielzahl von Anwendungen, bei denen sich Duplicate Content nicht gänzlich vermeiden lässt. Um trotzdem keine negative Bewertung zu bekommen, wird mit dem Canonical Tag auf den originalen Inhalt verwiesen, sodass die Suchmaschine nur diesen indexiert.

Das Canonical Tag wird zum Beispiel eingesetzt, wenn eine Website über unterschiedliche URLs erreichbar ist, was bei Startseiten häufig der Fall ist. (z. B. mit …/index oder ohne). Ganz ähnlich ist es bei Webseiten, die unterschiedliche Möglichkeiten der Groß- und Kleinschreibung der URL vorsehen (Case Sensitivity) oder bei Seiten, bei denen am Ende der URL ein Trailing Slash stehen kann oder auch nicht. Auch seitens des Servers gibt es Konfigurationen die ein Canonical Tag erfordern. Das ist zum Beispiel der Fall, wenn Filter oder Session-IDs zu Variationen der URL führen, allerdings ohne den Inhalt zu ändern. Duplicate Content kann auch entstehen, wenn es eine zusätzliche Druck-Version einer Seite gibt oder das Protokoll bei Bedarf von HTTP auf HTTPS umgestellt wird.

Es ist grundsätzlich empfehlenswert, das Canonical Tag auf Unterseiten zu integrieren, sodass diese auf sich selbst zeigen. So wird gleichzeitig fehlerhaften Links vorgebeugt.

Die Varianten

Kanonische URLs können auf zwei unterschiedliche Arten angegeben werden, wobei Google stets die Angabe der gesamten (absoluten) URL empfiehlt. Der Code für das Canonical Tag wird als zusätzliches Meta-Tag im Header-Bereich einer Seite untergebracht – allerdings nur auf den Seiten, die den gleichen Inhalt wie eine andere Originalquelle verwenden. Zwei Seiten mit identischem Inhalt könnten zum Beispiel die folgenden URLs haben:

http://www.mustershopberlin.de/unterseite.htm http://www.mustershopberlin.de/unterseite/?session_id123.htm

Der Originaltext liegt in der ersten Quelle, die zweite URL zeigt aber den gleichen Inhalt an. Ein Fragezeichen in einer URL ist immer Merkmal zusätzlicher Infos, die der Shop durch die URL erhält. So steht die ID zum Beispiel für eine bestimmte Quelle, von der der Nutzer kommt (Affiliate-Links). In Shops werden auch oft Session-IDs vergeben, um speichern zu können, was bereits in den Warenkorb gelegt wurde. Im obigen Fall wird dann unter der zweiten URL folgender Code in den Header eingefügt:

Wenn die Originalquelle eine PDF-Datei oder ein anderer Dokumententyp ist, der dennoch durch Google ausgelesen werden kann, so muss auch hier etwas in den Header eingefügt werden, damit Google die Quelle als zu indexierende Originalquelle erkennt. Der Code ist ein anderer, er funktioniert auch anders. Wird die URL aufgerufen – durch einen Client oder einen Roboter – sendet der Server die Information, dass es sich dabei um eine kanonische URL und somit um die Originalquelle handelt. Unter Umständen sind dafür sogar spezielle Einstellungen in der Serverkonfiguration notwendig. Der Code sieht dann folgendermaßen aus:

Link: <http://www.mustershopberlin.de/unterseite.pdf>; rel=“canonical“

Die Relevanz des Canonical Tags für die Suchmaschinenoptimierung

Webseitenbetreiber tun gut daran, mithilfe des Canonical Tags Duplicate Content zu vermeiden. Es ist eine Möglichkeit die Linkpopularität zu optimieren, da Duplicate Content unter einer URL gebündelt wird und somit nicht mehr negativ bewertet wird. Das Canonical Tag ist damit unabdingbar für die Suchmaschinenoptimierung.

Dennoch werden bei der Verwendung des Canonical Tags häufig Fehler gemacht, deren Vermeidung an dieser Stelle noch kurz erklärt sei: Nummerierte Seiten, deren Merkmale rel=“next“ und rel=“previous“ sind, sollten in der Regel keinen Canonical Tag enthalten, da sie nicht identisch sind. Die Seite der Standardquelle muss unbedingt erreichbar sein, damit die Suchmaschine die Seite tatsächlich indexieren kann. Wer mit dem Canonical Tag auf eine Quelle verweist, sollte dieses Tag nicht mit einem „nofollow„- oder „noindex“ Befehl kombinieren. Das Canonical Tag darf nur einmal verwendet verwendet werden und sollte nicht im Body-Bereich des Dokumentes enthalten sein.