Notre veille

Article

Google : Le contenu dupliqué pénalise-t-il vraiment ?

Article

L'actualité dans le petit monde de la visibilité naturelle est en ébullition. Récemment, sur son blog Webmaster Central Blog, Google a communiqué des informations selon lesquelles le contenu dupliqué ne pénaliserait pas les sites en usant.

Google tord ainsi le cou à cette rumeur qui dure depuis quelques années, mais qu'en est-il vraiment ? Il faut être capable de lire entre les lignes.

Qu'est-ce que le contenu dupliqué ? Le contenu dupliqué est la répétition de pavés de contenus similaires ou identiques sur un même domaine ou sur des domaines distincts.

Comment Google est-il en mesure de le détecter ? Il est important de savoir comment fonctionne un moteur de recherche pour identifier du contenu dupliqué. Schéma du filtre permettant de déterminer du contenu dupliqué - par Elliance

  1. Découvrir : Quand un contenu est trouvé, il est comparé pour déterminer s'il est unique ou non.
  2. Écarter : Toutes les pages provenant d'IP blacklistées ou de sites "Made for Adsense" sont écartées
  3. Disséquer : Chaque page est analysée sous plusieurs critères afin de déterminer son poids
  4. Déterminer : Dernière étape, la page reconnue comme contenu original est sélectionnée

Si le contenu dupliqué est autorisé sous le même domaine, Google sélectionnera lui-même l'url la plus pertinente selon ses algorithmes.  Le site ne sera pas rétrogradé dans les classements mais l'url affichée ne sera peut-être pas la plus pertinente aux yeux du webmaster si le moteur indexe par exemple une URL non-réécrite ou une version imprimable.

Il existe des techniques permettant d'indexer uniquement le contenu désiré.

  • Via le fichier robots.txt ou la page dupliquée, interdire l'indexation
  • Rediriger la page par une redirection permanente (redirection 301) vers le contenu désiré

Néanmoins, retenez qu'il est préférable d'apprendre à manipuler correctement son outil de publication afin que chaque contenu soit unique.

Outre l'aspect pur du contenu, il s'agit d'être cohérent au niveau technique.

  • La configuration de l'entrée de votre nom de domaine est primordiale. Si votre site est accessible avec et sans les "www", vous provoquerez du contenu dupliqué.
  • La même logique est respectée pour les pages accessibles par les protocoles http et https.
  • Il est également important de ne pas créer de liens internes différents vers une même page. Les liens http://www.monsite.com/categorie, http://www.monsite.com/categorie/ et http://www.monsite.com/categorie/default.html pointent sur la même page et provoqueraient à l'occasion 3 contenus dupliqués.

Vous ne serez pas pénalisé pour ses lacunes techniques, mais qu'en est-il de la popularité interne de vos pages ? A avoir trop d'url différentes, la popularité établie sera diluée.

Les problématiques pour un même domaine sont déjà abondantes, mais qu'en est-il des sites utilisant du contenu de sites tiers ?

Le but d'un moteur de recherche est de présenter aux utilisateurs des résultats pertinents. Si les contenus présentés sont identiques, ceux-ci remplissent moins bien leur mission.

Si Google découvre que vous utilisez un contenu copié sur un autre site, celui-ci découvrira certainement, par son système complexe de filtres, que vous n'êtes pas l'auteur original et il ne vous fera pas paraître dans ses résultats.

Néanmoins, si quelqu'un utilise le contenu de votre site et arrive à passer outre les filtres de duplication, il est possible que celui-ci rende votre contenu original invisible. Il est donc important de ne pas dupliquer de contenu sur votre site, mais également que personne ne copie vos contenus originaux.

Si vous êtes victime d'une duplication, Google vous permet de déposer une plainte DMCA (Digital Millennium Copyright Act) qui est, au demeurant, assez laborieuse.

Si Google juge un contenu dupliqué de nature à tromper / manipuler ses résultats, celui-ci se réserve le droit de le déclasser. Dans ce cas, vous pourrez demander une reconsidération de votre site une fois la manœuvre corrigée, mais là aussi, la procédure risque d'être longue et votre chute sans précédent.

En conclusion, nous pouvons dire que le contenu dupliqué n'est pas pénalisant, mais que son utilisation ne vous aidera pas à forcément améliorer votre visibilité.

Sources:

Chargement