Nous abordons le dernier volet de notre dossier traitant du contenu dupliqué. Après avoir mesuré la capacité de nuisance de la copie pour la qualité d’un site, puis les risques encourus par les parties prenantes, quelles sont les solutions pour éviter les doublons ?
Agir s’avère en effet essentiel pour le confort des internautes, pour la crédibilité et la notoriété du site copié et pour l’optimisation de son référencement naturel.
Produire un contenu original devrait aider au référencement d’un site. Pourtant, la copie met à mal ce vœu pieux
Deux cas se présentent :
° Soit le contenu est dupliqué en interne (situation intrasite). Deux pages d’un site ont un même contenu ou deux liens URL différents permettent d’accéder à la même page.
° Soit le contenu est dupliqué en externe (ou intersites). Il s’agit d’un même contenu sur un ou plusieurs sites différents. Que cela soit avec l’accord du site en question ou sans.
Pour faire face à la duplication de contenu, trois actions : prévenir, sur-veiller, réagir.
ACTION 1- PRÉVENIR, ou comment éviter la duplication de contenu.
Anticiper la duplication malencontreuse de contenus et poser les conditions d’une éventuelle reprise de ces contenus.
1a-Etre proactif sur son propre site.
Quelques conseils pour rendre ses propres contenus uniques.
♦ Prévoir dans les mentions légales, ou les CGU de son site, un paragraphe relatif aux droits d’auteur. Nul n’est sensé ignorer la loi, mais un rappel des fondamentaux peut s’avérer nécessaire. Il est possible d’avancer des conditions d’emprunt de contenu (voir plus loin sous »Action 3 -Réagir).
♦ Si des pages du site sont similaires, ne pas se limiter à uniquement changer les mots. Autant synthétiser les pages en une seule ou développer le contenu de certaines d’entre elles.
♦ Dans le cas où le contenu d’un autre site serait repris : appliquer les règles que l’on aimerait que les autres appliquent. C’est-à-dire : se limiter à peu de contenu repris, citer la source et prévoir un lien en « dofollow ».
♦ Multiplier les liens internes renforcera la qualité de l’article d’origine, rendant moins pertinent l’article contrefait. Les moteurs de recherche apprécieront.
♦ S’il y a reprise de ses flux RSS, n’y laisser que des extraits des articles.
♦ Deux balises <title> ou deux <meta-description> similaires sont considérées comme du contenu dupliqué. Donc : optimiser ces balises par le choix d’un vocabulaire descriptif des contenus concernés.
♦ Donner une URL unique pour chaque contenu spécifique. En particulier, dans le cas de fiches produits :
• Sur un site e-commerce, un même produit peut être rattaché à plusieurs catégories. Il génère alors autant d’URL pour ce même produit. Afin de prévenir ce risque, préférer placer tous les produits dès le départ à la racine du site.
• La rédaction d’un nouveau texte est à privilégier à la description produit remise par un fournisseur.
♦ Paramétrer le fichier robots.txt : ainsi, une seule des URL donnant accès au contenu est indexée (‘’index’’). Les autres URL seront désignées comme n’étant pas à indexer (‘’noindex’’). Le contenu restera sur le site, mais son accès pour le robot.txt sera bloqué.
♦ Au cas où un contenu serait accessible par plusieurs URL, ne pas bloquer les robots d’exploration (robots.txt) et les laisser parcourir toutes les URL du site. Leur indiquer celles au contenu dupliqué par l’une de ces méthodes :
• Prévoir une redirection permanente 301 de l’une des URL (rendue officielle) vers l’autre qui indique aux internautes et aux robots le déplacement du contenu. Si plusieurs pages sont liées à une même page et sont bien référencées, la redirection 301 évitera de les placer en concurrence,
• Sinon, indiquer aux moteurs de recherche l’adresse du contenu source par la balise link rel= <<canonical>> sur la page dupliquée. Cette balise contiendra l’URL de la page d’origine.
♦ Via la Google Search Console :
• supprimer directement l’URL dupliquée de l’index,
• indiquer son domaine favori à Google (préférer par exemple http://www.nomsite.com à http://nomsite.com).
1b-Accepter la duplication de contenu, mais sous conditions.
Pourquoi accepter la duplication ? D’abord pour s’assurer de la paternité des écrits. Ensuite, pour se prémunir d’une disqualification par les moteurs de recherche.
Pour ce faire :
♦ Prévoir le cas dans ses CGU et les afficher sur son site.
♦ Se baser sur le Code de la propriété intellectuelle (art. L122-5) qui n’autorise que la ‘’reprise’’ d’extraits des contenus (60 premiers mots, ou 300 premiers caractères par exemple).
♦ Préciser que la source doit être indiquée clairement. Et ce, avec un lien vers la page de contenu original (et non pas vers la home page). Ce lien ne doit pas être en nofollow.
♦ Stipuler que la page (site/blog) reprenant le contenu doit utiliser des balises <title>et <meta description> différentes de celles de la page d’origine.
♦ Préciser éventuellement l’étendue de la duplication selon telle ou telle rubrique du site.
En cas d’article ‘’invité’’ : si on souhaite publier, sur son propre site/blog, un article que l’on a rédigé pour un autre site/blog que le sien, il est préférable de ne pas le reprendre comme tel. Préférer une présentation nouvelle ou un résumé avec un texte original insérant le lien vers l’article ‘’invité’’.
ACTION 2- SUR-VEILLER, ou comment détecter les contenus dupliqués.
Prévoir le contenu dupliqué n’empêche pas de mener une veille et de pister les copies.
- Une requête dans la barre de recherche sur une phrase complète du contenu source peut révéler des réponses similaires sur d’autres sites.
- Il peut s’avérer efficace de poser des alertes sur certains mots clés sur un moteur de recherche.
- Il existe également des outils de détection de contenus dupliqués. Entre autres : Webrankinfo , Copyscape, OutilsRéférencement, Positeo, Web SEO Analytics.
ACTION 3- RÉAGIR, ou que faire si son contenu est dupliqué.
Pour rappel : le droit d’auteur s’applique aux textes, images, illustrations, infographies, logos, vidéos, sons, etc.
Le mieux est de procéder par étapes, lorsque la duplication de contenu est avérée. On dira que le copieur a droit au bénéfice du doute et qu’il doit donc être ménagé…
3a- Avant de désapprouver et de réprimer : on échange avec le copieur.
∴ Objectif : désactiver un conflit potentiel.
∴ Principe : le plagiaire peut être de ‘’bonne foi’’. Le bénéfice du doute lui est donc accordé. C’est comme ça.
∴ Comment :
1-Au préalable, faire des copies d’écran (incluant l’URL) en vidant les pages caches du navigateur de son ordinateur, et se les adresser par mail.
2-Trouver un contact du site/blog, soit dans les rubriques ‘’Contact’’ ou ‘’Mentions légales’’ (déjà à cette étape, si l’éditeur d’un site n’est pas identifié ou identifiable : il enfreint la loi !), soit en consultant le Whois (en passant, relever également le nom de l’hébergeur du site).
3-Informer le copieur par écrit : un mail (ou un courrier recommandé), à défaut un commentaire sur l’article du site incriminé. Lui demander explicitement le retrait des éléments copiés, basé sur la législation en cours relative à la propriété intellectuelle.
4-Penser qu’il est envisageable de facturer le copieur. Ainsi, prévoir le cas dans les mentions légales ou les CGU du site permet de sensibiliser le copieur au coût quotidien de la diffusion du contenu dupliqué (Voir un exemple de mentions légales prévoyant cette disposition de facturation).
5-Et bien sûr, conserver toutes les traces des échanges avec le site.
∴ Conséquences :
- Soit le site répond favorablement. Il retire le contenu dupliqué ou le modifie (en citant la source et en ne retenant qu’un court extrait du texte source), ou il en créé un nouveau, unique.
- Soit le site ne répond pas favorablement : il demeure muet ou répond être dans son bon droit.
3b- Si le site ne répond pas favorablement : on agit plus fermement.
∴ Objectif : faire respecter ses droits d’auteurs.
∴ Principe : le copieur est un plagiaire. Il n’est pas de ‘’bonne foi’’. Par conséquent, l’auteur réel peut agir par des moyens officiels protégeant ses droits.
∴ Comment :
1-Selon la gravité, un huissier de justice spécialisé dans les « constats internet » peut authentifier la copie. Un constat fiable devra indiquer l’adresse IP de l’ordinateur de l’huissier et présenter la dernière version de la page web, donc, une capture d’écran vidée des pages caches.
2-Responsable de la légalité de ce qu’il diffuse, tout hébergeur doit, lors de la signature du contrat d’hébergement, informer ses clients (éditeurs de site) de l’interdiction d’enfreindre le droit d’auteur. Il s’agira de lui adresser un courrier recommandé exprimant l’impossible identification de l’éditeur du site copieur. Cette notification avancera le motif d’utilisation illicite de contenus et demandera le retrait du site en infraction avec le droit. Les preuves et l’URL du site incriminé y seront joints. L’hébergeur peut également prévoir un formulaire à cet effet.
3-Si le copieur diffuse des annonces publicitaires Adsense sur son site, Google prévoit que :
– ‘’Les annonces Google ne peuvent pas être diffusées sur des sites Web dont le contenu est protégé par la loi sur les droits d’auteur, sauf s’ils disposent des droits légaux requis pour diffuser ce contenu ou diriger du trafic vers celui-ci.‘’
Ainsi que :
– ‘’Lorsqu’un site affiche un autre site appartenant à un tiers au sein d’un cadre ou d’une fenêtre, il s’agit d’encadrement du contenu. Il est formellement interdit de diffuser des annonces Google sur ce type de page.’’
4-Déposer une plainte DMCA (Digital Millennium Copyright Act) auprès des moteurs de recherche pour atteinte présumée aux droits d’auteur. Google prévoit un formulaire à cet effet. Il suffit de suivre la procédure prévue dans « Demande légale de suppression« , pour demander que la page litigieuse soit supprimée des résultats de recherche.
5-Contacter un avocat : les points attaquables relèvent du non-respect des droits d’auteur.
∴ Conséquences :
- Le procès-verbal de l’huissier peut encourager le plagiaire à stopper la diffusion du contenu dupliqué. A défaut, ce constat servira pour les autres cas vus ci-dessous.
- L’hébergeur peut menacer l’éditeur plagiaire de la fermeture de son site, s’il ne retire pas les contenus incriminés.
- Adsense : Google peut désactiver les annonces et le compte.
- A compter de la notification DMCA, Google peut décider de supprimer ou de désactiver l’accès au contenu faisant l’objet d’une activité portant atteinte aux droits d’auteur.
- Le préjudice peut être purement intellectuel. L’avocat a également la latitude de poursuivre sur la concurrence déloyale, le parasitisme, voire la perte de chiffre d’affaires, les conséquences sur la réputation, etc. Il pourra agir à l’amiable ou enclencher une action en justice contre l’éditeur.