Guide complet : Comprendre, éviter et corriger le contenu dupliqué
On parle de contenu dupliqué lorsqu'une page web ou un élément de contenu présente le même libellé (ou un libellé très similaire) qu'une autre page de votre site web. C'est mauvais pour votre référencement, car Google ne sera pas en mesure de comprendre quelle version de ce contenu est la version originale ou la plus pertinente pour un utilisateur qui effectue une recherche. (Voir Stratégie de Contenu SEO pour TPE et PME).
Le contenu dupliqué a également un impact négatif sur la marque de votre entreprise et sur la perception qu'a votre public de vos connaissances et de celles de vos employés. Si votre site web contient du contenu dupliqué, vous devez vous efforcer d'y remédier immédiatement.
On va aborder les points suivants : qu'est un contenu dupliqué, comment le trouver et ce qu'il faut faire pour y remédier.
Qu'est-ce que le contenu dupliqué ?
On parle de contenu dupliqué lorsque les mêmes groupes de phrases ou de paragraphes – ou un élément de contenu complètement dupliqué – se trouvent sur deux ou plusieurs URL différentes de votre site web. Si quelqu'un navigue sur votre site et voit un contenu sur une page, puis visite votre site plus tard pour trouver un contenu similaire associé à une autre URL, il s'agit d'un contenu dupliqué.
Pourquoi le contenu dupliqué est-il un problème ?
Je vais utiliser un exemple qui, j'en suis sûr, nous est familier à tous. Supposons que vous veniez de terminer un livre et que vous souhaitiez en lire un autre. Vous envoyez un email rapide à dix amis pour leur demander des suggestions et vous attendez avec impatience leurs réponses.
Dans cet exemple, le meilleur résultat possible est d'obtenir 12 titres de livres différents que vous pourrez examiner et décider lequel lire. Le pire résultat possible serait de recevoir exactement le même titre de livre de la part de vos dix amis et de décider, après l'avoir lu, qu'il ne vous convient pas, ce qui vous obligerait à le redemander. En d'autres termes, tu dois obtenir une variété d'options différentes afin de maximiser les chances de trouver un livre qui réponde à tes critères.
Cette approche est similaire à celle adoptée par Google pour sa page de résultats de recherche. Google sait que s'il propose à ses internautes dix pages web quasiment identiques, il compromet gravement ses chances de fournir à l'internaute les informations correspondant à ses critères. À quel point serait-il frustrant de cliquer sur les dix pages web figurant dans les résultats de la recherche pour ne trouver que les mêmes informations ?
Pour lutter contre ce problème, l'algorithme de Google empêche les pages dupliquées d'apparaître pour les mêmes phrases de recherche. En d'autres termes, si votre page est presque identique à une autre page web en ligne (sur votre site ou sur un autre site web), une seule de ces pages sera classée dans Google.
Le contenu dupliqué peut nuit gravement à votre référencement
Google désapprouve ouvertement le contenu dupliqué ; c'est quelque chose que tous les référenceurs connaissent, et souvent après quelques mois d'activité dans le domaine du référencement. Il y a quelques années, les black hat SEO publiaient des tonnes de pages sur le web sur un seul site, dans l'espoir d'obtenir plus de trafic grâce au volume de contenu.
Aujourd'hui, Google et les autres algorithmes des moteurs de recherche sont bien trop intelligents pour cela. Vous ne pouvez pas publier le même contenu plusieurs fois en espérant tromper les moteurs de recherche ou les utilisateurs en leur faisant croire que votre site web fait autorité et est plus original qu'il ne l'est en réalité.
Google oriente désormais les utilisateurs vers les résultats les plus pertinents pour leurs requêtes, c'est-à-dire leur intent de recherche . Pour ce faire, il s'appuie sur des centaines de facteurs de classement qui déterminent le succès de chaque contenu.
Google prend en compte :
- la date de publication
- la longueur et le contenu de l'URL
- l'exhaustivité de la page sur le plan thématique
- l'autorité du domaine
- la sélection des mots-clés
- la densité et l'emplacement des mots clés.
Ce ne sont pas les seuls facteurs utilisés par Google pour déterminer le classement d'une page, mais ce sont les plus importants. Plus votre contenu est original et fait autorité dans le cadre de ces paramètres, moins il est susceptible de souffrir de la perception de contenu dupliqué.
Le contenu dupliqué est source de confusion tant pour les utilisateurs que pour les robots d'indexation.
Comment savoir si votre site a du contenu dupliqué ?
Le moyen le plus simple de déterminer si votre site contient du contenu dupliqué est de le parcourir page par page et de s'assurer qu'il n'y a pas de texte identique. Si vous voyez quelques phrases ou séries de mots ici et là qui sont exactement les mêmes, ne vous inquiétez pas. Vous pouvez également prendre des extraits de texte et les rechercher dans Google entre guillemets pour voir s'il y a d'autres correspondances.
Google est suffisamment intelligent pour savoir que quelques mots alignés sur plusieurs pages ne constituent pas une véritable duplication. Si vous constatez que des phrases ou des paragraphes entiers se répètent, c'est un signe évident. (Si vous constatez d'autres problèmes que la duplication de contenu, il est judicieux de procéder à un audit complet du contenu SEO).
Copyscape est l'outil que nous préférons pour vérifier la présence de contenu dupliqué. Copyscape est payant mais abordable et sa recherche par “groupes” vous permet de voir rapidement si votre site web contient du contenu dupliqué. Il vous suffit de créer un compte, d'acheter des crédits, puis de soumettre vos URL à l'outil d'analyse par groupes. Copyscape vous présentera une liste de sites web et d'URL qui contiennent du contenu dupliqué, le cas échéant.
Prenez note de ces sites afin de pouvoir déterminer la raison pour laquelle un contenu dupliqué a été créé. Parfois, il s'agit d'un simple accident ; d'autres fois, c'est la preuve que quelqu'un dans votre entreprise a essayé de faire des économies – et parfois, vous découvrirez qu'un autre site web a copié votre contenu.
Une fois que vous avez identifié les cas de contenu dupliqué, vous pouvez y remédier immédiatement. Si votre site web ne contient pas de contenu dupliqué, réjouissez-vous ! Cela signifie que vous et tous les membres de votre entreprise comprenez la valeur des meilleures pratiques de marketing de contenu.
Les causes du contenu dupliqué
Si vous avez trouvé du contenu dupliqué, il est utile de comprendre comment il est apparu afin de pouvoir l'éviter à l'avenir.
Voici les causes les plus courantes du contenu dupliqué :
- Votre contenu n'est pas original.
Avant de créer un seul mot de contenu sur votre site web, vous devez vous assurer que vous et votre équipe disposez du temps et de l'espace nécessaires pour réaliser un travail original. La plupart des gens sont éthiques et savent que tout contenu doit être original. En règle générale, les seules causes de travail en double sont les personnes qui se sentent obligées de mener à bien de nombreux projets en peu de temps. Donnez à votre équipe suffisamment de marge de manœuvre pour qu'elle puisse accomplir son travail, et vous ne verrez probablement jamais de contenu dupliqué.
- Votre contenu n'est pas bien structuré.
Souvent, même d'excellents rédacteurs web peuvent passer à côté d'éléments cruciaux pour le référencement, comme le fait de s'assurer que les sous-titres sont utilisés correctement (et qu'ils sont originaux, tout comme votre contenu doit l'être). Si vous utilisez les mêmes titres sur toutes vos pages, il s'agit d'une forme de contenu dupliqué. Google verra un contenu et des mots clés uniques mais des en-têtes similaires et, par conséquent, il dévalorisera un contenu par ailleurs précieux qui pourrait vous apporter un nouveau trafic.
- Votre contenu n'a jamais été optimisé.
Bien que le contenu dupliqué et les optimisations SEO dupliquées ne soient pas identiques, ils se chevauchent souvent. Par exemple, si vous utilisez les mêmes textes d'ancrage pour tous vos liens internes, Google finira par le remarquer. Par conséquent, votre contenu ne sera pas aussi performant qu'il pourrait l'être. Mettez un point d'honneur à exploiter tous les facteurs de classement SEO à votre disposition.
Comment corriger le contenu dupliqué ?
À ce stade, je sais que vous espérez que je vais vous donner une solution unique, rapide et facile à mettre en œuvre. Malheureusement, ce n'est pas si simple et la bonne solution dépend de votre situation.
Voici quelques solutions possibles pour vous aider à faire le meilleur choix :
1.Réviser le contenu. Si vous souhaitez conserver les pages de votre site web, mais que leur contenu n'est pas suffisamment original ou utile, vous devez le réviser pour qu'il le soit davantage.
2. Redirections 301 pour combiner des pages au contenu similaire. Une redirection 301 renvoie automatiquement les internautes d'une page dupliquée à l'autre. En procédant à une redirection 301, vous éliminez effectivement le contenu dupliqué puisqu'il n'y a plus qu'une seule page accessible en ligne. Cela peut être une bonne solution si vous avez plusieurs doublons ou des pages trop similaires qui devraient être combinées en une seule page.
3. Les balises Rel=canonical permettent d'indiquer à Google quelle est la page “principale” parmi les pages similaires, sans redirection. Vous pouvez utiliser la balise rel=canonical sur vos pages dupliquées. Cette balise indique aux moteurs de recherche quelle URL de vos pages dupliquées est la page principale qui doit être incluse dans les résultats de recherche. Le code à ajouter est <link rel=”canonical” href=”http://www.monsite.com/-url-que-tu-veux-classer-dans-Google.html” />.
4. L'option “No Index” permet de cacher les pages dupliquées à Google. Vous pouvez ajouter <meta name=”robots” content=”noindex” /> à l'une des pages dupliquées pour indiquer à tous les moteurs de recherche que vous ne souhaitez pas que la page soit incluse dans leurs résultats de recherche. Dans ce cas, vous ne redirigez pas le trafic, vous supprimez simplement l'une des pages des résultats de recherche.
Comme vous pouvez le constater, certaines de ces options sont assez techniques. Nous vous recommandons donc de consulter votre développeur web pour déterminer celle qui convient le mieux à votre site web.
Comment éviter le contenu dupliqué à l'avenir ?
Le contenu dupliqué doit être supprimé manuellement de votre site, mais il est préférable d'utiliser un outil comme Copyscape pour le repérer s'il se reproduit. Vous pourrez ainsi le supprimer rapidement et éviter d'être pénalisé.
La meilleure façon d'éviter le contenu dupliqué à l'avenir est de fixer des normes pour la publication de nouveaux contenus sur votre site web. Insistez pour que tout le contenu de votre site soit original.
Un autre défi connexe : la cannibalisation des mots clés
Même si votre contenu n'est pas dupliqué mot pour mot, il se peut que vous ayez plusieurs pages avec des sujets très similaires. Cela peut également compliquer la tâche de Google pour déterminer quelle page de votre site web doit être classée dans Google. Ce problème est connu sous le nom de cannibalisation des mots clés.
Par exemple, si vous avez plusieurs articles de blog sur des sujets similaires, vous devriez procéder à un audit du contenu de votre blog pour déterminer quels articles vous pourriez combiner.
Pour conclure
Le contenu dupliqué est l'un des plus grands défis pour les SEO, les spécialistes du marketing numérique et les propriétaires de petites entreprises. Copyscape.com est notre outil préféré pour détecter les contenus dupliqués. Si vous avez du contenu dupliqué sur votre site, vous devez prendre des mesures et le supprimer dès que possible.
Pour aller plus loin : Stratégie de contenu SEO : Comment Booster votre SEO avec l’URL Canonique
Besoin d'aide pour débloquer le trafic SEO sur votre site ? Prendre contact avec nous dès maintenant.