Comment éviter le contenu dupliqué et mince en E-commerce en [2023]

Contenu Dupliqué et Mince en E-commerce
13Oct, 2023

Contenu Dupliqué et Mince en E-commerce : comment l'éviter

Pour les experts SEO E-commerce, les problèmes liés aux contenus dupliqués, ainsi qu'aux contenus de qualités médiocres ou insuffisantes, peuvent entraîner un désastre dans le classement des moteurs de recherche. À mesure que Google, Bing et d'autres moteurs de recherche deviennent plus sophistiqués, ils récompensent les sites web qui ne présentent qu'un contenu unique et de qualité à leurs bots pour le crawl et l'indexation.

Dans ce guide de ressources, nous examinons une grande variété de scénarios de duplication de contenu que l'on trouve couramment sur les sites  E- commerces. Voir stratégie de contenu pour TPE et PME.

Qu'est-ce qu'un contenu dupliqué ?

C'est un contenu qui est copié d'une page à une autre. On peut avoir un contenu dupliqué interne (sur son site) ou de contenu dupliqué externe (un contenu sur autre site).

Google a commencé à prendre très au sérieux le contenu en double , spinning et mince (le 24 février 2011,) lorsqu'il a lancé sa première mise à jour de l'algorithme Panda. Selon ses directives de contenu, Google définit le contenu dupliqué comme.

Contenu Dupliqué et Mince en E-commerce

 

Fondamentalement, le contenu dupliqué est la même copie de site web que l'on trouve sur plusieurs pages n'importe où sur l'internet. Par exemple, si vous avez un contenu sur un URL de votre site qui peut être trouvé mot pour mot ailleurs sur autre  site, alors vous êtes confronté à un problème de contenu dupliqué.

Cependant, le contenu en doublon n'est pas directement une pénalité de classement, mais il peut nuire au classement général de votre site web si Google ne sait pas quelle page classer. Les moteurs de recherche auront du mal à déterminer quelle page du web est la plus pertinente pour l'utilisateur.

Ce qui devrait nous inquiéter, c'est d'avoir un grand nombre de pages  sur nos sites  qui sont pour la plupart des contenus dupliqués ou des pages de produits avec des descriptions de produits si courtes que le contenu peut être considéré comme mince, et donc, sans valeur (ni pour Google ni pour les clients).

Notre travail en tant qu'éditeurs de sites web et gestionnaires de contenu consiste à nous assurer que nous fournissons les informations les plus solides possibles à nos lecteurs. Lorsque nous adoptons cette approche, nous sommes récompensés par Google, car cela répond à ses directives de qualité.

Mais, tous les contenus dupliqués ne sont pas créés en terme de contenu marketing. Il existe un certain nombre de situations techniques qui peuvent entraîner des problèmes de contenu en doublon pouvant conduire à ce que Google pénalise votre site.

Nous nous pencherons sur un grand nombre de ces situations dans ce chapitre afin que vous soyez parfaitement préparé à éviter la duplication de contenu sur l'ensemble de votre site.

La duplication technique interne du contenu.

Les contenus dupliqués peuvent exister en interne sur un site E-commerce de plusieurs façons, tant pour des raisons techniques que rédactionnelles. Nous nous pencherons sur les cas les plus courants où les contenus dupliqués internes peuvent avoir des conséquences néfastes.

Les cas suivants de contenus dupliqués sont généralement dus à des raisons techniques liées au système de gestion de contenu (CMS)  par exemple sur shopify, prestashop,magento, ou woocommerce… ect,  et à d'autres aspects liés au codage des sites en question.

URL non-canoniques

Les URL canoniques, aident les moteurs de recherche à comprendre qu'il n'y a qu'une seule version de l'URL de la page qui doit être indexée, quelles que soient les autres versions d'URL rendues dans le navigateur, vers lesquelles des liens sont établis à partir de sites web externes.

Les URLs canoniques sont extrêmement importants dans le cas des URLs de suivi, où le code de suivi (c'est-à-dire le suivi des affiliés, le suivi des sources des réseaux sociaux, etc.) est ajouté à la fin d'une URL sur le site (c'est-à-dire – ?a_aid=, ?utm_source, etc.).

Elles sont également très utiles pour affiner l'indexation des URLs des pages de catégories sur les sites E-commerce dans les cas où des paramètres de tri, de fonctionnalité et de filtrage sont ajoutés à la fin des URLs des catégories de base pour produire un ordre différent des produits sur une page de catégorie (c'est-à-dire – ?dir=asc, ?prix=10-, etc.).

En veillant à ce que l'URL canonique (dans le code source) soit identique  à l'URL de la catégorie de base, on évite que les moteurs de recherche n'indexent ces URLs en double.

Contenu Dupliqué et Mince en E-commerce

Il pourrait également être utile d'interdire l'exploration des paramètres URLs couramment utilisés via le fichier /robots.txt, afin de maximiser le crawl budget. Exemple :

Contenu Dupliqué et Mince en E-commerce

 

 

 

 

ID de la session

De nombreux sites E-commerce utilisent des ID de session dans les URLs (c'est-à-dire – ?sid=) pour suivre le comportement des utilisateurs. Le problème pour les moteurs de recherche est que cela crée une duplication de l'URL principale de la page à laquelle l'ID de session est appliqué.

Une approche courante pour résoudre ce problème consiste à utiliser des cookies pour suivre les sessions des utilisateurs, au lieu d'ajouter le code d'identification de la session aux URLs. Cependant, si les ID de session sont ajoutés aux URLs, il est facile de remédier à ce problème en canonisant les URLs d'ID de session dans l'URL principale de la page.

Une solution de secours pourrait consister à ne pas indexer les URLs avec ID de session, mais cela limite le potentiel d'équité des liens au niveau de la page dans le cas où quelqu'un renvoie à l'URL d'une page qui comprend l'ID de session. Il pourrait également être utile d'interdire l'exploration des URLs d'ID de session via le fichier /robots.txt tant que le système CMS ne produit pas d'ID de session pour les bots (ce qui pourrait causer des problèmes importants au niveau du crawl ).

Contenu Dupliqué et Mince en E-commerce

 

 

 

Les Pages du panier d'achat

Lorsque les utilisateurs ajoutent des produits à leur panier sur votre site E-commerce et qu'ils consultent leur panier, la plupart des systèmes de gestion de contenu mettent en œuvre des structures d'URL spécifiques à l'expérience du panier d'achat.

Ces URLs peuvent contenir les mots “panier”, ou un autre mot comme” identifiant unique”. Il est important de réaliser que ce ne sont pas les types de pages que les moteurs de recherche souhaitent indexer, donc les identifier et les définir ensuite sur “noindex,nofollow” via une balise meta-robots ou X-robots (et également interdire leur crawl via le fichier /robots.txt) aidera à empêcher les moteurs de recherche d'indexer ce contenu de faible qualité.

Résultats de recherche interne

Les pages de résultats de recherche interne sont produites lorsqu'une personne effectue une recherche en utilisant la fonction de recherche interne d'un site E-commerce. Elles n'ont pas de contenu unique, mais seulement des extraits de contenu provenant d'autres pages de votre boutique.

De nombreux systèmes de gestion de contenu ne définissent pas par défaut les pages de résultats de recherche interne sur “noindex, follow”, de sorte qu'un développeur devra appliquer cette règle pour résoudre ce problème. Il est également recommandé d'interdire aux bots de crawler les pages de résultats de recherche interne dans le fichier/robots.txt une fois que toutes les pages de résultats de recherche interne ont été supprimées de l'index ou avant qu'une des pages ne soit indexée.

C'est une solution facile, mais importante, car elle peut entraîner des pénalités de classement selon l'algorithme Panda de Google s'il y a trop de résultats de recherche interne dans l'index de Google.

Dupliquer les chemins d'accès aux URLs

La manière dont les systèmes CMS gèrent les structures des URLs où les produits sont placés dans plusieurs catégories de taxonomie peut devenir délicate. Par exemple, si un produit est placé à la fois dans la catégorie A et la catégorie B, et si des répertoires de catégories sont utilisés dans la structure de l' URL des pages de produits, le CMS pourrait alors créer deux URLs différents pour le même produit.

Contenu Dupliqué et Mince en E-commerce

 

Comme on peut l'imaginer, cela peut entraîner des problèmes dévastateurs de doublon de contenu pour les pages de produits, qui sont généralement les pages ayant le taux de conversion le plus élevé sur une boutique en ligne.

Les approches courantes pour résoudre ce problème sont les suivantes :

-Utiliser les URLs des pages de produits au niveau de la racine (malheureusement, cela supprime les avantages de la structure de l'URL riche en mots-clés et au niveau des catégories et limite également la traçabilité sur votre Google Analytic 4).

 

Contenu Dupliqué et Mince en E-commerce

 

-Utiliser les répertoires/produit/ URL pour tous les produits (ce qui offre au moins une traçabilité groupée de tous les produits sur GA4).

 

Contenu Dupliqué et Mince en E-commerce

 

-Utilisez des URLs de produits basés sur des structures d'URL de catégories, mais veillez à ce que chaque URL de page de produit ait une seule URL canonique désignée).

Contenu Dupliqué et Mince en E-commerce

 

Dans certains cas, cette situation peut également se produire avec des URLs de sous-catégories où les produits affichés peuvent être exactement les mêmes, ou proches. Par exemple, une sous-catégorie “matelas” peut être placée à la fois sous /literie/ matelas/ et /nouveautés/ matelas/ sur une boutique d'ameublement, et comporter essentiellement les mêmes produits.

Mis à part les avis de taxonomie, la même approche peut être appliquée dans ces situations que pour les pages de produits. En outre, l'existence de solides descriptions d'introduction au sommet des pages de catégories contribuerait à garantir que chaque page de sous-catégorie similaire a un contenu unique.

Pages d'avis sur les produits

De nombreux systèmes CMS sont dotés d'une fonctionnalité de révision intégrée. Souvent, des “pages d'évaluation” séparées sont créées pour héberger toutes les évaluations de certains produits en particuliers, sinon toutes les évaluations sont placées sur les pages de produits elles-mêmes.

Cela peut créer un doublon de contenu entre les pages de produits elles-mêmes et les pages d'avis de produits correspondantes. Ces “pages d'avis” doivent être soit “canalisées” vers la page principale du produit, soit définies sur “noindex,follow” via des méta-robots ou des balises X-robots. La méthode de canonisation est préférable, juste au cas où un lien vers une “page d'évaluation” apparaîtrait sur un site web externe, qui transmettrait le lien à la page de produit.

Il est également essentiel de s'assurer que le contenu de l'évaluation n'est pas dupliqué sur des sites externes lorsque l'on fait appel à des fournisseurs d'évaluation de produits tiers.

URL WWW vs. non-WWW et URL en majuscules vs. en minuscules

Tout comme votre facteur considère que le 56 Avenue et le 56 Rue sont des adresses de domicile différentes, les moteurs de recherche considèrent que http://www.domaine.com et http://domaine.com sont des adresses web différentes. Il est donc essentiel de choisir une version des URLs pour chaque page du site E-commerce. Une redirection 301 pour la version non préférée vers la version préférée est la solution recommandée pour éviter ces doublons d'URL techniquement créés, selon Google.

Les URLs en majuscules et en minuscules doivent être traitées de la même manière. Si les deux sont rendues séparément, les moteurs de recherche peuvent alors les considérer comme différentes. Il est important de choisir un format et de rediriger une version vers l'autre.

 

Contenu Dupliqué et Mince en E-commerce

Les barres obliques sur les URLs

Comme pour les URLs www et non www, les moteurs de recherche considèrent comme différentes les URLs avec et sans barre oblique. Par exemple, des URLs doubles sont créées lorsque des URLs telles que /page/ et /page/index.html, ou /page et /page.html, rendent le même contenu. (voir le tweet de john muller)

Cela est particulièrement problématique lorsque /page et /page/ présentent le même contenu puisque, techniquement parlant, ces deux pages ne se trouvent même pas dans le même répertoire. Les approches courantes pour résoudre ce problème consiste soit à canaliser les deux vers une seule version, soit à rediriger une version vers l'autre.

URL HTTPS : Chemin relatif ou absolu

Les URLs HTTPS (sécurisées) sont généralement créées après qu'un utilisateur se soit connecté à une boutique en ligne. La plupart du temps, les moteurs de recherche n'ont aucun moyen de trouver ces URLs. Cependant, il existe des cas où cela est possible, comme lorsqu'un administrateur connecte ensuite  met à jour le contenu et les liens de navigation.

Dans ce cas, il est fréquent que l'administrateur ne se rende pas compte que les URLs intégrées incluent le HTTPS au lieu du HTTP dans les URLs. Lorsque des URLs à chemin relatif (à l'exclusion de la partie “http://www.domaine.com”) sont également utilisées sur le site (soit dans le contenu, soit dans les liens de navigation), il est trop facile pour les moteurs de recherche d'explorer rapidement des centaines, voire des milliers d'URL HTTPS, qui sont techniquement des doublons des versions HTTP.

Les solutions les plus courantes pour remédier à ce problème consiste à utiliser des URLs avec un chemin d'accès absolu (y compris la partie “http://www.domaine.com”) tout en veillant à ce que les URLs canoniques utilisent toujours la version HTTP. L'utilisation de redirections 301 dans ces cas pourrait facilement casser la fonctionnalité de connexion de l'utilisateur, car les URLs HTTPS ne pourraient pas être rendus.

Duplication de contenu rédactionnel interne

Les cas suivants de duplication de contenu ne sont pas techniques, mais se produisent parce que le contenu des différentes pages est soit similaire, soit dupliqué. Ces problèmes sont généralement résolus par la rédaction d'une copie unique pour chaque page.

Descriptions de produits similaires

Il est facile de prendre des raccourcis avec les descriptions de produits sur les boutiques en lignes, en particulier avec des produits similaires. Cependant, il faut savoir que Google juge le contenu des sites E-commerce de la même manière que les sites à contenu ordinaire.

Cela devrait suffire à faire comprendre à un  Head SEO  ou un Growth-Hacker  que les descriptions de pages de produits doivent être uniques, convaincantes et robustes, en particulier pour les sites E-commerce de niveau intermédiaire qui cherchent à augmenter leur production de contenu parce qu'ils n'ont pas suffisamment d'autorité de domaine pour concurrencer des concurrents plus importants.

Le partage de courts paragraphes, de spécifications et d'autres contenus entre les pages de produits augmentent la probabilité que les moteurs de recherche diminuent leur perception de la qualité du contenu d'une page de produit et, par conséquent, sa position dans le classement.

Pages de catégories

Les pages de catégories des sites E-commerce comprennent généralement un titre et une grille de produits. Cela signifie qu'il n'y a pas de contenu unique sur ces pages. La meilleure pratique en matière de pages de catégories consiste à ajouter des descriptions uniques en haut des pages de catégories (et non pas en bas, où le contenu est moins important pour les moteurs de recherche) qui décrivent les types de produits qui figurent dans la catégorie.

Il n'y a pas de nombre magique de mots ou de caractères à utiliser, mais plus le contenu de la page de catégorie est solide, plus la page aura de chances de maximiser le trafic à partir des résultats de recherche organique (en raison du trafic de mots-clés à longue traîne).

Un repère de 100-300 mots est courant. Il est important de comprendre les résolutions d'écran de vos visiteurs et de s'assurer que la grille des produits n'est pas poussée sous le dossier de leur navigateur. Cela pourrait limiter la possibilité pour les utilisateurs de découvrir la grille de produits lorsqu'ils visitent la page de catégorie.

Conseil : les descriptions d'introduction sur les pages de catégories offrent une excellente occasion de créer des liens profonds vers des pages de sous-catégorie connexes, vers le contenu d'articles connexes qui peuvent exister sur le site, et vers des produits populaires qui méritent une attention et une équité de liens.

Duplication du contenu de la page d'accueil

Tout Head SEO  doit savoir que les pages d'accueil sont généralement celles qui ont le plus de liens entrants, et qu'elles sont donc très bien classées dans les moteurs de recherche.

Ce que beaucoup de SEO oublient, c'est qu'une page d'accueil doit être traitée comme n'importe quelle autre page d'un site E- commerce, du point de vue du contenu. Il faut toujours veiller à ce qu'un contenu unique remplisse la majorité du corps de la page d'accueil, car une page d'accueil constituée simplement de flous de produits dupliqués n'offre que peu de valeur contextuelle pour que les moteurs de recherche classent la page d'accueil aussi haut que possible pour les mots-clés cibles dans les moteurs de recherche.

Conseil : les directeurs marketing utilisent aussi couramment le contenu descriptif de la page d'accueil dans les annuaires et autres listes d'entreprises sur des sites web externes. Veillez plutôt à fournir un contenu unique à ces sites externes. Si cela a déjà été fait dans une large mesure, la réécriture du contenu descriptif de la page d'accueil est le moyen le plus simple de régler le problème préexistant.

Duplication du contenu Off Site

Le contenu en doublon qui existe entre une boutique en ligne et d'autres sites E-commerce (et potentiellement même des sites de contenu) est devenue un véritable point sensible ces dernières années. En même temps Google ne communique plus sur ces mises à jour pour Panda…

Comme Google s'oriente clairement vers un classement des sites web davantage basé sur les mesures des liens entrants (comme l'autorité de domaine), les sites web ayant moins d'équité en matière de liens entrants ont beaucoup de mal à être bien classés dans les moteurs de recherche lorsqu'il existe des doublons externes.

Maintenant, voyons en détail certains cas les plus courants de contenus dupliqués externes (off site) qui empêchent les boutiques en ligne de se classer aussi bien qu'ils le pourraient dans la SERP.

Descriptions des produits des fabricants

Lorsque les boutiques en lignes copient les descriptions de produits, fournies par le fabricant, et les placent sur leurs propres pages de produits, ils sont immédiatement désavantagés.

Dans l'analyse algorithmique des moteurs de recherche, ces sites n'offrent pas de valeur unique aux utilisateurs, qui choisissent donc de classer plus haut les sites des grandes marques (qui ont des profils de liens entrants plus robustes et de meilleure qualité), qui peuvent également utiliser les mêmes descriptions de produits. La seule façon de remédier à ce problème est de se lancer dans la vaste tâche de réécriture des descriptions de produits existantes, tout en veillant à ce que les nouveaux produits soient lancés avec des descriptions tout à fait uniques.

D'après mes expériences de SEO e-commerce, j’ai pu constater que les boutiques en lignes de niveau inférieur augmentent le trafic de recherche organique de 50 à 100 % en réécrivant simplement les descriptions de produits pour la moitié des pages de produits du site – sans effort manuel de création de liens. Avec une petite analyse de log on peut voir la preuve mathématique de cet effort d'optimisation en référencement naturel.

Pour les sites de commerces dont les produits sont très sensibles aux facteurs  temps, c'est-à-dire qu'ils entrent et sortent du stock à mesure que de nouveaux modèles sont lancés, une meilleure approche peut consister à s'assurer simplement que les nouvelles pages de produits ne sont lancées qu'avec des descriptions totalement uniques.

Il existe d'autres moyens de remplir les pages de produits avec un contenu unique :

  • des photos multiples (de préférence des photos uniques, si possible)
  • Des descriptions améliorées qui offrent un aperçu plus détaillé des avantages des produits
  • Vidéos de démonstration de produits (les utilisateurs adorent les vidéos.)
  • balisage du schéma (pour améliorer les listes du SERP)
  • Commentaires des utilisateurs

Duplication de contenu en Staging, site en Prod ou site en Sandbox

À maintes reprises, les équipes de développement oublient,  et n'accordent que peu d'attention ou ne réalisent tout simplement pas que les sites de test peuvent être découverts même  indexés par les moteurs de recherche, créant souvent des copies exactes d'un site E-commerce.  Heureusement, ces situations peuvent être facilement corrigées par différentes approches :

  • Ajout d'une balise “noindex,nofollow” pour les méta-robots ou les X-robots sur chaque page du site de test.
  • Bloquer les bots des moteurs de recherche en les empêchant de crawler les sites grâce à une balise “Disallow : /” dans le fichier /robots.txt du site de test  ou en prod.
  • Protection par  un mot de passe du site test, pour empêcher les moteurs de recherche de l'explorer.
  • Configurer ces sites de test séparément dans le GSC et utiliser l'outil “Supprimer les URLs” dans la Search Console de Google, ou l'outil “Bloquer les URLs” dans les Outils pour les webmasters Bing, pour sortir rapidement l'ensemble du site de test de l'index de Google et Bing.

 

Duplication de contenu en Staging, site en Prod ou site en Sandbox

 

Lorsque les moteurs de recherche ont déjà indexé un site web, test, l'utilisation d'une combinaison de ces approches peut donner les meilleurs résultats. Une approche consiste à ajouter la balise “noindex,nofollow” des méta-robots ou X-robots, à retirer l'ensemble du site des index des moteurs de recherche via les outils pour l'équipe SEO, puis à ajouter un “Disallow” : /” dans le fichier /robots.txt une fois que le contenu a été retiré de l'index.

Flux de produits tiers (Amazon et Google)

Pour de bonnes raisons, les sites E-commerce voient l'intérêt d'étendre leurs produits à des sites d'achat tiers afin d'accroître leur potentiel de vente. Ce que le Growth-Hacker de boutique en ligne ne réalise pas, c'est que cela crée des doublons dans ces domaines externes.

Souvent, les propres produits du site sont sur des sites tiers finissant par dépasser ses propres pages de produits lorsque les produits sont introduits sur des sites tiers avec des profils de liens entrants qui ont plus d'autorité.

Prenons le cas d'un fabricant de produits qui, a sa propre boutique en ligne (pour vendre ses propres produits directement aux consommateurs), envoie ses produits sur la plate-forme d' Amazon (FBA) pour augmenter ses ventes. Ce scénario est très plausible pour des raisons de revenus. Je rencontre des dizaines chaque jour…:)

Du point de vue du référencement naturel, de sérieux problèmes viennent d'être créés, car Amazon est l'un des sites web les plus influents au monde. En plus de ça,  les pages de produits sur Amazon sont presque assurées de dépasser les pages de produits sur le site web du fabricant. Certains peuvent considérer qu'il s'agit de faire des chiffres en plus pour la boite tant mieux. Mais à long terme,  il est clair que cela va mettre en péril le travail du chef de projet seo interne, ou le contrat d'une agence de référencement, lorsque le trafic de recherche organique (et les revenus qui en découlent) chutera pour le site e-commerce. Que faire ? Eh oui, il y a des solutions…

La solution à ce problème est exactement celle que vous attendez : veiller à ce que les descriptions de produits fournies aux sites tiers soient différentes de celles qui figurent sur votre site vitrine. Il est recommandé de donner la description du fabricant aux flux d'achats tiers comme Google, et d'écrire une description plus solide et unique pour votre propre boutique en ligne.

Donnez toujours à votre propre site web l'avantage en matière de contenu. Lorsqu'un site E-commerce vend ses propres produits, le directeur SEO et le responsable marketing doivent décider s'il faut réécrire la description du flux d'achat tiers ou la description du site. Quelle que soit la décision prise, il suffit de s'assurer que la description la plus fiable et la plus solide existe sur le site.

Programmes d'affiliation

La citation de Google au début de cet article, qui porte sur les programmes d'affiliation, mérite d'être répétée :

Les pages avec des liens d'affiliation de produits sur lesquelles les descriptions et les critiques de produits sont copiées directement du commerçant d'origine sans aucun contenu original ni valeur ajoutée”.

Si votre boutique en ligne propose un programme d'affiliation, assurez-vous de ne pas distribuer les descriptions de produits de votre propre site à vos affiliés. Il est conseillé de fournir aux affiliés les mêmes informations sur les produits que celles qui sont données à d'autres vendeurs tiers qui vendent ou font la promotion de vos produits.

Pour un potentiel de classement maximum dans les moteurs de recherche, assurez-vous qu'aucun affilié ou vendeur tiers n'utilise les mêmes descriptions que vous. Envisagez d'ajouter cette clause à vos conditions lorsque vous travaillez avec des affiliés et d'autres vendeurs, afin de vous assurer que vous bénéficiez d'une couverture juridique.

Si des affiliés ou des vendeurs enfreignent ces conditions, vous avez le droit contractuel de leur demander de supprimer le contenu dupliqué et d'utiliser à la place le fil de description de produit que vous avez désigné.

Syndication de contenu

Certains sites auront également des blogs afin de fournir un contenu plus commercialisable sur leur site, et certains d'entre eux syndiqueront même ce contenu vers d'autres sites (là encore, pour étendre leur portée commerciale).

Bien que cela puisse sembler être une bonne idée au début, il est essentiel de réaliser que sans une très bonne stratégie  SEO appropriée, cela peut également créer des doublons externes. Si le partenaire de syndication est un site web faisant davantage autorité (selon son profil de liens entrants), il est possible que le contenu du site web du partenaire de syndication soit plus important (dans les moteurs de recherche) que le contenu original du site E-commerce.

Il existe plusieurs solutions pour éviter que le contenu syndiqué ne dépasse votre propre contenu :

  • Assurez-vous  que le partenaire de syndication canonise le contenu à l'URL de la boutique en ligne d'où il provient. C'est la meilleure solution, car tous les liens entrants vers le contenu du site web du partenaire de syndication seront appliqués au contenu du site. (conseil, conseil : création de liens !).
  • Assurez-vous que le partenaire de syndication applique une balise “noindex,follow” des méta-robots ou X-robots au contenu syndiqué de son site.
  • Ne participez pas à la syndication de contenu et concentrez-vous sur d'autres canaux de croissance du trafic et de développement de la marque.

Scraping de contenu

Souvent, des sites de scraping de très mauvaise qualité (aka la bouillie en Black hat) de contenu peuvent voler le contenu des boutiques afin de générer du trafic et de stimuler les ventes par le biais de publicités. En outre, les concurrents réels des sites E-commerce peuvent voler du contenu (même des descriptions de fabricants réécrites), ce qui peut constituer une menace pour la visibilité et le classement de la boutique réputé dans les moteurs de recherche. Bien que les moteurs de recherche aient beaucoup amélioré leur capacité à identifier ces sites de spam et à les filtrer de leurs résultats de recherche, ils peuvent encore poser un problème. Et à mon avis pendant longtemps…

La meilleure façon de traiter ce problème est de déposer une plainte DMCA auprès de Google, ou une plainte pour violation de la propriété intellectuelle auprès de Bing, afin d'alerter ces deux moteurs de recherche sur le problème, et finalement de faire retirer ces sites des résultats de recherche. Mais, c'est très rare d'obtenir gain de cause…ect.

Attention : le contenu doit être le vôtre. Si vous utilisez des descriptions de produits de fabricants, vous pouvez avoir des difficultés à convaincre les moteurs de recherche que le site de spinning viole réellement votre droit d'auteur. Cela pourrait être un peu plus facile si le site de spinning  affiche votre page web entier sur leur site, avec un marquage clair de votre site web.

Petites annonces et sites d'enchères

De nombreuses boutiques en ligne connaissent des problèmes de duplication de contenu lorsque d'autres personnes ou détaillants copient leurs descriptions de produits sur eBay, leboncoin,  et d'autres sites de vente aux enchères/classifications. La lutte contre ce problème est un combat difficile qui risque de créer plus d'efforts qu'il n'en vaut la peine. Heureusement, les pages de ces sites expirent relativement, vite (en quelques mois) et Google est probablement très sensible à cette situation.

Ce qui est sous votre contrôle, ce sont vos propres listes de produits sur les sites de petites annonces et d'enchères. Soyez attentif à toute duplication de contenu et utilisez votre flux de produits pour ces sites chaque fois que cela est possible.

Mon meilleur conseil ici est de limiter le problème en contrôlant ce qui est en votre pouvoir de contrôler. En veillant à ce que les pages de produits de votre propre site (et les mises à jour de ces pages) soient explorées et indexées rapidement et régulièrement, vous contribuerez à ce que Google considère votre contenu comme la source originale.

Qu'est-ce qu'un contenu  mince en d’E-commerce ?

C'est un  contenu  textuel court sur une page de votre site et qui n'apporte pas de valeur ajoutée unique au site web ou à l'utilisateur. Il offre des expériences utilisateur terribles et peut pénaliser votre boutique si le problème dépasse le seuil inconnu de ce que Google juge acceptable en terme de contenu de qualité.

Voici quelques exemples de scénarios dans lesquels un contenu mince ou “thin content” (en anglais)  pourrait se produire.

Descriptions des produits minces/vide

Pour les gros sites e-commerce, il peut être facile de prendre des raccourcis sur les descriptions de produits. Toutefois, cette approche peut limiter considérablement le trafic de recherche organique et le potentiel de conversions.

Les moteurs de recherche s'efforcent de classer le meilleur contenu pour leurs utilisateurs, et ces derniers souhaitent (généralement) des explications claires sur les produits pour les aider dans leurs décisions d'achat. Lorsque les pages de produits ne comportent qu'une ou deux phrases, cela n'aide personne.

La solution consiste à faire en sorte que les descriptions de produits soient aussi complètes et détaillées que possible. Même si vous pensez qu'il n'est pas possible d'écrire plus (ou beaucoup) sur un produit.

Conseil : Une façon d'étoffer les descriptions de produits consiste à noter 5 à 10 questions qu'un client pourrait poser sur le produit, à noter les réponses, puis à les intégrer dans la description du produit.

Pages test ou orphelines

Presque tous les sites web ont des pages périphériques qui ont été publiées comme pages tests, oubliés et maintenant des pages orphelines sur le site. Devinez qui les trouvent encore ? C'est vrai, les moteurs de recherche.

Parfois, ces pages peuvent être des copies d'autres pages, parfois elles peuvent avoir un contenu partiellement écrit, et parfois elles peuvent simplement être vides. Assurez-vous que tout le contenu publié et indexable de votre site web est solide et apporte une valeur ajoutée à un utilisateur qui pourrait le consulter.

Pages de catégories minces

Pendant la phase de développement de la taxonomie, l'équipe de contenu marketing peut parfois se laisser emporter par la création de catégories. Si une catégorie ne concerne que quelques produits, ou potentiellement aucun à l'avenir, alors ne la créez pas.

En pensant à l'utilisateur, une catégorie ne contenant que 1 à 3 produits n'offre généralement pas la meilleure expérience de navigation. Penser en termes de moteur de recherche – qui pense en termes d'utilisateur – un trop grand nombre de ces pages de catégories minces (associées à d'autres formes de contenu dupliqué et mince) peut conduire un site à être pénalisé. L'essentiel est de s'assurer que les pages de catégories sont solides, avec à la fois des descriptions d'introduction uniques et des listes de produits suffisantes.

Le contenu des pages de catégories peut également être mince lorsque l'on navigue dans les catégories à facettes jusqu'à ce qu'une page soit atteinte sans produits. Ces pages sont appelées “stub pages” et peuvent réduire l'analyse qualitative d'une boutique en ligne par les moteurs de recherche lorsqu'il y en a trop.

Une solution utile pour résoudre ce problème consiste à appliquer une balise conditionnelle “noindex,follow” aux méta-robots ou X-robots de ces pages lorsque le verbiage courant (c'est-à-dire “Aucun produit n'existe”) est utilisé sur la page par le CMS.

Qu'est-ce qu'un contenu  mince en d’E-commerce ? C

Outils pour trouver et diagnostiquer les contenus en double

La découverte de contenus dupliqués peut être l'une des tâches les plus difficiles et les plus longues lors d'un audit technique d'un site E-commerce (Selon la taille du site !). Cette section présente quelques conseils rapides sur la manière d'accélérer le processus de détection des contenus dupliqués et peu volumineux afin de “savoir quoi réparer”.

Google Search Console

De nombreux problèmes de duplication de contenu peuvent être découverts grâce à la Search console de Google, dont la mise en place est gratuite sur votre site web. Bing n'offre pas le même niveau d'outils d'investigation pour  de l'analyse des contenus dupliqués, c'est pourquoi cette section se concentrera uniquement sur la Google Search Console.

Voici quelques-unes des façons d'utiliser la Search console de Google pour identifier les contenus dupliqués et les contenus légers :

  • Améliorations HTML – Dans cette section, Google indiquera les URL spécifiques qui ont des balises de titre et des méta descriptions dupliquées. Recherchez des modèles, tels que “Balises de titre dupliquées” et “Méta descriptions dupliquées”, causées par des pages de catégorie avec des paramètres d'URL, des pages orphelines avec des “Balises de titre manquantes”, etc.
  • État de l'index – Dans cette section, Google affiche un graphique de l'historique du trafic du nombre de pages de votre site dans son index. Si le graphique présente des pics de trafic à un moment donné et qu'il n'y a pas eu d'augmentation correspondante de la création de contenu, cela peut indiquer que des URLs en double ou de mauvaise qualité ont été introduites en masse dans l'index de Google.
  • Paramètres des URLs – Dans cette section, Google vous dira s'il éprouve des difficultés à crawlé et à indexer votre site. Cette section n'est rien de moins que fantastique pour identifier les paramètres d'URL (en particulier pour les pages de catégories) qui pourraient conduire à des doublons d'URL créés techniquement. Utilisez les opérateurs de Google (nous y reviendrons bientôt.) pour déterminer si votre site E-commerce a des URLs dont l'index contient ces paramètres et s'il s'agit ou non d'un contenu dupliqué/peu volumineux.
  • Erreurs d'exploration – Dans cette section, si les erreurs 404 de votre site ont atteint un pic, cela pourrait indiquer que de nombreuses pages de mauvaises qualités ont été indexées en raison de la production de pages d'erreur 404 incorrectes (sans codes d'état d'en-tête 404). Il arrive souvent que ces pages aient toutes un message d'erreur comme seul contenu, et parfois qu'elles aient des URLs différentes, ce qui peut entraîner une duplication technique du contenu.

Opérateurs de recherche (site :, inurl :, etc.)

L'utilisation d'opérateurs de recherche dans Google est l'un des moyens les plus efficaces d'identifier les contenus dupliqués et légers, en particulier après que des problèmes potentiels ont été identifiés à partir des outils SEO ou même des plugins SEO. Les opérateurs suivants sont particulièrement utiles :

site : – Cette commande affichera la plupart des URLs de votre site indexées par Google, mais pas nécessairement toutes. C'est un moyen rapide d'évaluer si Google a indexé un nombre extrêmement excessif d'URL pour votre site par rapport au nombre d'URL inclus dans votre sitemap.

  • Exemple – site:www.domaine.com

inurl : – Cette commande est idéal à utiliser en même temps  avec le site : commande permettant de découvrir si les URLs avec des paramètres particuliers sont indexées par Google. Comme mentionnés précédemment, les paramètres d'URL potentiellement nuisibles (s'ils créent du contenu en double et sont indexés par Google) peuvent être identifiés dans la section Paramètres d'URL de la Google Search Console. Utilisez cette commande pour découvrir si Google les a indexés.

  • Exemple – site:www.domaine.com inurl:?prix=

Cette commande  peut également être utilisé de manière “négative” pour identifier si des URLs non-www sont indexées par Google (en supposant que la version www des URL est préférée).

  • Exemple – site:domaine.com -inurl:www

intitle : – Cette commande  affichera les URLs indexées par Google qui ont des mots spécifiques dans la balise meta title. Cela peut être particulièrement utile pour identifier les doublons d'une page quelconque, comme une page de produit qui peut également avoir une “page de revue” indexée par Google.

  • Exemple – site:www.domaine.com intitle:meilleure agance seo de France

Outils de plagiat, de recherche et de duplication de contenu

Il existe un certain nombre d'outils  très utiles pour aider en outre à identifier les contenus en double et de mauvaise qualité que les moteurs de recherche pourraient facilement indexer. Voici quelques-uns des outils les plus populaires à utiliser à ces fins :

Copyscape – Screaming Frog – Siteliner –

Conclusion

En travaillant à l'identification de ces problèmes spécifiques sur votre site web, vous développerez une mine de connaissances qui pourront être utilisées et réutilisées à l'avenir pour continuer à nettoyer ces problèmes, et à les prévenir à l'avenir. Il n'y a qu'une seule façon d'y parvenir : commencer !

Pour aller plus loin : Comment réduire le taux de rebond de votre site e-commerce  en [2023] ?

Besoin d'aide pour débloquer le trafic SEO sur votre site ? Prendre contact avec nous dès maintenant.

Référencement Local pour les entreprises ayant plusieurs sites

About The Author
M. Claude MAGNE Consultant Référencement Local

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.