Personne ne l’aurait cru si ce n’était pas le webmaster trends analyst de chez Google lui-même qui a lancé l’information. Gary Illyes a effectivement affirmé que 60% du web serait dupliqué. Explications.
Une information incroyable
Au cours de la dernière conférence américaine State of Search qui s’est déroulée à Dallas, le Webmaster Trends Analyst de chez Google à savoir Gary Illyes en a profité pour faire une intervention. A cette occasion, le spécialiste a partagé quelques informations capitales au sujet du moteur de recherches. Il a par exemple fait part au public du nombre d’URL connu par Google qui s’élevait à pas moins de 120 000 milliards. En 2013 pourtant, le numéro 1 des moteurs de recherche a déclaré que son index ne comptait que 30 000 milliards d’URL. En l’espace de deux ans donc, l’indexation a été multipliée par quatre.
Une autre information capitale a également été révélée. Sur l’ensemble des URL référencées par Google, 60% sont concernés par un contenu dupliqué. Là-encore, les chiffres ont doublé en deux ans puisqu’en 2013, ce pourcentage tournait autour de 30%.
Comment éviter le duplicate content ?
Il existe tellement de moyens permettant d’éviter le duplicate content. La première chose à faire est de définir soigneusement les métas descriptions ainsi que les balises title pour les différentes pages. N’oubliez pas de définir une URL pour chaque contenu et de mentionner l’URL canonique pour que Google puisse connaître l’adresse du contenu source. En outre, au sujet du fichier robots.txt, celui-ci est priorisé par les robots de Google lorsqu’ils vont sur un site. Il permet de signaler au moteur de recherche de ne pas indexer une page. Il ne faut en aucun cas oublier de renseigner ce fichier.
Autre élément à savoir : bien que le duplicate content soit interdit, il existe certains contenus qui –une fois dupliqués – provoquent des dégâts vraiment incommensurables. A éviter donc les filtres et catégories, les versions de pages identiques, les fiches produits, les contenus provenant d’autres sites ou encore les versions imprimables.