Notre veille

Article

La duplication de contenu par l'exemple

Article IT

Il est toujours difficile de savoir comment Google réagit quand il détecte une duplication de contenus. Un exemple très récent et très concret permet de rappeler les règles de base permettant d'éviter la duplication de contenus. Chronologie des faits : Grégory a écrit "Sur l’influence et les classements de blogs" le 4 mars, le lendemain ce post est repris sur Culture Buzz. Les deux pages vont coexister pendant 5 jours, en deuxième et troisième résultat sur le terme Sur l’influence et les classements de blogs. Mais depuis ce matin la page originale à disparue : Ce genre de duplication pourtant simple ne devrait pas poser de problème à Google :
  • Le post de de Grégory sur son blog est plus ancien que celui sur Culture Buzz, les dates affichées dans les posts ainsi que les dates de mises en cache par Google le prouvent,
  • Le post de Culture Buzz cite sa source d'une manière explicite,
  • Le nombre de commentaires est plus important sur le blog de Grégory que sur Culture Buzz (32 contre 1 !)
Il est encore un peu tôt pour conclure si cette situation est définitive, nous suivons ce cas avec intérêt, Google se rétablissant souvent de lui même. Comment se prémunir de la duplication de contenus ? La plupart des duplications se font au sein d'un même site dans ce cas un contenu est accessible avec au moins 2 URL différentes, par exemple :
  • http://www.monsite.com/index.php?article=1 et http://www.monsite.com/index.php?article=1&categorie=12
  • http://www.monsite.com/index.php?article=1 et http://www.monsite.fr/index.php?article=1 ou http://monsite.com/index.php?article=1
  • ...
Ces cas sont assez faciles à traiter, la correction des liens conduisant aux versions dupliquées ou la mise en place de redirections résoud le problème. Les cas de vol de contenu sont moins courants mais ont les mêmes effets, il reste alors le Spam Report quand aucune autre action n'est possible.
Chargement