WordPress les tags et le duplicate content

Tags et duplicate content wordpressVous avez un site WordPress et vous retrouvez vos articles indexés par google sous forme mondomaine.com/tag/mon-mot-clé ? Nous allons tenter d’expliquer cela. WordPress est le gestionnaire de contenu le plus populaire au monde. Sa simplicité d’installation et de gestion éditoriale des contenus est remarquable. Cependant, son architecture peut parfois dérouter et conduire à des surprises lors de l’indexation des pages par les moteurs de recherche. L’utilisation des tags et des catégories peut générer une forme de duplication de contenu, ou au moins d’URL dont on ne sait si elle est pénalisante. Ce qui est sur, c’est qu’elle est redondante et inutile.

Tags WordPress:

Vous avez mis en place un « nuage de mots-clés » quelque par sur votre blog ou votre site. Jusque là tout va bien, et les mots clés se retrouvent dans un widget qui met en valeur les thèmes abordés. La ou cela se complique, c’est que chaque mot clé est lié à une page d’article qui regroupe le ou les articles dans lesquels vos mots sont mis en exergue. Cela nous donne une url du type « http://www.webeditorial.info/tag/article/ », le mot clé étant « article ».  La page va se nommer « archive du mot clé « article ». Le problème est que en fonction du nombre de mots clés et du nombre d’article, vous allez vite vous retrouver avec une multitude d’url pointant vers des pages elles mêmes multiples.

Que fait google de tout ça ?

Là réponse est dans la question: googlebot par défaut va parcourir consciencieusement tout le site et remplir son index de pages semblables. On est déjà dans la duplication de contenu. Pire, comme la page des articles est souvent plus riche, elle risque de sortir devant l’article lui même dans le classement Google.

Les solutions au problème:

ampoule_ideeLa première est en mode bourrin: pas de tag, pas de catégorie et donc pas de problème.

Autre possibilité, choisir d’utiliser un plugin SEO tel que Yoast pour définir ce que vous allez laisser indexer par les moteurs. Attention quand même, c’est parfois délicat.

Enfin, vous pouvez ajouter les lignes qui vont bien dans votre fichier robots.txt, pour dire aux googlebot et autres de ne pas indexer plus que de raison. Cela donne:

Disallow: /category/
Disallow: /tag/

A vous de tester !