Le plagiat est une réalité rarement abordée dans le secteur de l'édition numérique. Une simple recherche en ligne permet de trouver de nombreux travaux universitaires sur le coût caché du plagiat…
Ressources en ligne populaires sur les technologies publiques
Analyse des outils pubtech et adtech
Stratégies précieuses en matière de technologies publiques
Par Vahe Arabian
Fondateur de SODP
Avertissement : Nos évaluations sont basées sur les recherches, analyses et/ou tests pratiques indépendants de nos rédacteurs. Politique éditoriale
Le plagiat est une réalité rarement abordée dans le secteur de l'édition numérique. Une simple recherche en ligne suffit à révéler de nombreux débats universitaires sur le coût caché du plagiat dans l'enseignement supérieur, tant pour les établissements d'enseignement que pour l'économie en général. Pour les éditeurs numériques, cependant, le plagiat est souvent présenté comme une protection contre le vol de contenu. Il existe d'ailleurs plusieurs logiciels permettant de vérifier le plagiat d'articles individuels. Leur principal défaut ? Ils n'offrent ni aux détenteurs de droits d'auteur les moyens de s'assurer que leur contenu n'a pas été volé, ni une procédure simplifiée pour signaler toute violation de propriété intellectuelle. C'est précisément pour remédier à ces problèmes que PlagiaShield a été créé. Outre ses fonctions classiques d'analyseur de documents, ce logiciel promet non seulement d'aider les éditeurs à détecter les contenus volés, mais aussi de simplifier la procédure de retrait. L'offre est alléchante, mais tient-elle ses promesses ? Et si oui, s'intègre-t-il facilement au flux de travail d'un éditeur ? Voyons cela.
Qu'est-ce que PlagiaShield ?
PlagiaShield est un outil en ligne de détection de plagiat, accessible via navigateur, qui analyse automatiquement Internet à la recherche de contenu volé. Il a été conçu pour aider les marques, les agences et les éditeurs à débusquer les cas de plagiat et à protéger leur positionnement dans les pages de résultats des moteurs de recherche (SERP). Son principal atout réside dans sa capacité à surveiller en continu Internet après l'analyse d'un domaine, afin de détecter les cas de plagiat et de contenu dupliqué, et à envoyer des notifications par e-mail à chaque découverte. La distinction entre plagiat et contenu dupliqué peut sembler superflue, mais elle est en réalité cruciale. PlagiaShield fournit un niveau de détail précis sur les infractions, permettant aux utilisateurs de vérifier si l'intégralité de leur site ou une seule page a été plagiée. Il va même jusqu'à indiquer si des phrases entières ont été copiées d'un article et affiche même un pourcentage de correspondance. Il est facile de repérer les petites modifications apportées à une phrase (un mot ici, un signe de ponctuation là), ce qui permet de contourner les logiciels anti-plagiat classiques. Cela signifie que l'outil se rapproche du Graal de la détection du plagiat sémantique. Ce niveau de détail offre des avantages immédiats. Grâce à un modèle de pourcentage de contenu dupliqué, les utilisateurs peuvent identifier instantanément leurs principaux risques, ce qui leur fournit un point de départ pour le processus de vérification. Cela aide également les éditeurs à déterminer si un site plagie activement leur contenu ou s'il a simplement omis de fournir des citations correctes. Ainsi, au lieu de soumettre une demande de retrait, les éditeurs peuvent demander un lien retour approprié.
Risques SEO liés au contenu dupliqué
Comme indiqué précédemment, l'objectif déclaré de PlagiaShield est d'aider les éditeurs à préserver leur visibilité dans les SERP (pages de résultats des moteurs de recherche). En effet, face au contenu dupliqué, les moteurs de recherche peuvent avoir du mal à déterminer quel contenu indexer et lequel afficher. Même s'ils indexent toutes les versions, ils n'en choisiront qu'une seule pour répondre à une requête, afin d'offrir la meilleure expérience de recherche possible. Ce n'est pas un hasard si les experts en SEO recommandent l'utilisation de PlagiaShield balises canoniques lors du processus de syndication de contenuSélectionner une seule page dilue la visibilité des autres pages dans les résultats de recherche, ce qui pose un problème majeur si l'algorithme ne repère pas le contenu original. Google a d'ailleurs reconnu que ses systèmes privilégient les pages les mieux classées, même s'il identifie le créateur original du contenu Il pourrait encore choisir un site mieux classéMais Google a également déclaré qu'il accordait une grande importance au contenu original, et l'entreprise a déployé une mise à jour majeure de son algorithme SERP en août 2022, baptisée… Mise à jour du contenu utileCette initiative, décrite comme « s’inscrivant dans un effort plus vaste visant à garantir que les internautes voient davantage de contenus originaux et utiles, écrits par des personnes et pour des personnes, dans les résultats de recherche », est désormais une réalité. Les éditeurs numériques investissent non seulement dans des contenus originaux de haute qualité, mais aussi de plus en plus dans leur optimisation, et le plagiat représente une menace bien réelle pour ces investissements. Ceci nous ramène à PlagiaShield, qui a mené sa propre étude sur l’ampleur du plagiat de contenus auprès des principaux éditeurs de presse en 2022, et a constaté que… 62 % des articles scannés n'étaient plus uniques.
Prix et fonctionnalités de PlagiaShield
PlagiaShield propose une version gratuite incluant une analyse mensuelle de 100 pages web maximum sur un seul domaine, ainsi que 10 analyses anti-plagiat gratuites de 2 000 mots maximum par mois. Cette formule est idéale pour les éditeurs existants ou pour les nouveaux éditeurs souhaitant s'assurer que leur contenu n'est pas dupliqué par des sites web à forte autorité. Les trois formules payantes de l'entreprise offrent des fonctionnalités bien plus étendues. La formule Pro, à partir de 29 $ par mois, s'adresse aux marques et aux agences de contenu et propose des analyses mensuelles de 1 000 pages maximum sur cinq domaines. Il est possible d'ajouter 1 000 pages supplémentaires pour 20 $ par mois. Ce forfait inclut également l'accès à une assistance par chat et aux services de l'entreprise Extension Chrome DMCA FillerCe service accélère le processus de soumission des demandes de retrait DMCA à Google via la Search Console. L'offre Publisher, à partir de 499 $ par mois, représente le niveau de prix supérieur. Destiné aux grands médias, il propose des analyses hebdomadaires pour un maximum de 50 domaines et 25 000 pages, en plus des avantages de l'offre Pro. Il est possible d'ajouter 10 000 pages supplémentaires par mois pour 99 $. Ce niveau inclut également la gestion d'équipe et l'accès à l'API. PlagiaShield propose aussi une offre Enterprise avec des fonctionnalités personnalisées, un support technique et des options de protection étendues. Par exemple, cette offre conviendra aux éditeurs fonctionnant par abonnement, car PlagiaShield peut s'intégrer directement à leur site et protéger les contenus payants.
Premiers pas avec le tableau de bord de PlagiaShield
Le tableau de bord de PlagiaShield est minimaliste et ne comporte que trois sections principales : Domaines, Documents et Votre compte. La première permet de surveiller le plagiat des sites web, la deuxième d'analyser les documents individuels et la troisième de gérer la facturation, les paramètres d'abonnement et l'équipe. Examinons chacune d'elles plus en détail.
Domaines
Une fois son compte créé, l'éditeur est invité à ajouter un domaine. Chaque abonnement payant permet d'ajouter plusieurs domaines.
Il est toutefois important de noter que chaque compte utilise un pool commun de pages web surveillées. Concrètement, cela signifie que les utilisateurs ayant opté pour la formule Pro de base peuvent surveiller jusqu'à 1 000 pages réparties sur cinq domaines.
Bien que les utilisateurs puissent limiter le nombre de pages surveillées pour chaque domaine ajouté, la limite minimale est de 1 000 pages. Concrètement, pour surveiller les cinq domaines inclus dans l'abonnement Pro, il faut donc payer 80 $ supplémentaires par mois pour ces 4 000 pages additionnelles. À propos de ce quota, il est important de noter que PlagiaShield ne surveille que les pages contenant plus de 500 caractères. De plus, la plateforme offre la possibilité d'exclure les sections du site non pertinentes, comme les pages de catégories et d'auteurs. Ces deux options permettent de respecter le quota de pages. Si chaque utilisateur est libre de choisir de payer 109 $ par mois pour surveiller cinq domaines, le prix ne nous semble pas être un frein. Nous souhaiterions plutôt une plus grande transparence quant aux conditions requises pour tirer pleinement parti de chaque niveau d'abonnement. Une fois la sélection des domaines terminée, les éditeurs peuvent facilement visualiser leurs sites web dans l'onglet « Liste des domaines » situé à droite.
Cliquer sur l'image du domaine à droite du menu affiche un aperçu détaillé des violations potentielles du droit d'auteur.
C’est sur cette page que les utilisateurs peuvent commencer à vérifier si leur contenu a été dupliqué ailleurs sur le web. PlagiaShield propose des filtres de vérification micro et macro : « Pages vérifiées » et « Domaines vérifiés », permettant aux utilisateurs d’identifier les infractions potentielles. Examinons d’abord de plus près le fonctionnement du filtre micro.
Pages de révision
Cette option permet aux utilisateurs d'examiner en détail les pages spécifiques que PlagiaShield a détectées comme étant dupliquées. Ils peuvent filtrer les résultats en sélectionnant le nombre de pages similaires ou le pourcentage de contenu commun. Le premier filtre est utile pour identifier rapidement si le logiciel a signalé la duplication de textes génériques open source, tels que les déclarations de confidentialité ou les FAQ destinées aux membres. Idéalement, les utilisateurs devraient toutefois avoir déjà effectué ce filtrage lors de leur inscription. S'ils oublient cette étape, ils peuvent indiquer à PlagiaShield d'ignorer la page, mais devront attendre la fin de leur période d'abonnement pour que leur quota de pages soit réinitialisé.
Le deuxième filtre est celui qui rend les choses intéressantes. En filtrant selon la quantité de données partagées entre votre page et les pages soupçonnées de vol d'adresse IP, vous pouvez identifier les pages qui ont été copiées. Comme vous pouvez le voir ci-dessous, SODP L'annuaire des principales maisons d'édition de Los Angeles partage 92 % de son contenu avec une autre page.
Cliquer sur la page en question ouvre une boîte de dialogue présentant une analyse plus détaillée de l'infraction. Comme on peut le constater ci-dessous, les deux pages présentent 156 similitudes de phrases, ce qui va bien au-delà d'une simple similarité de contenu.
La page incriminée a récupéré l'intégralité de SODP Le contenu est plagié, allant même jusqu'à inclure « State of Digital Publishing » dans l'URL et le titre de la page. La section « Sources » présente une analyse plus détaillée du contenu plagié, permettant aux utilisateurs de voir d'un coup d'œil les phrases copiées directement (surlignées en rouge), celles qui sont similaires (en jaune) et celles qui ne correspondent à aucune autre (en gris).
Nous n'avons aucune intention de dénigrer un autre site web, c'est pourquoi nous avons flouté son URL. Nous allons plutôt parler de l'outil de demande de retrait de contenu de PlagiaShield, qui permet de résoudre ce genre de problèmes. C'est là, cependant, que nous constatons un petit défaut d'ergonomie. Curieusement, la demande de retrait ne peut pas être lancée depuis la section « Pages à examiner », obligeant les utilisateurs à se rendre dans la section « Domaines à examiner ». Il nous semblait plus pratique de pouvoir traiter ces problèmes depuis n'importe quel filtre, et nous ne comprenons pas pourquoi ce n'est pas le cas. Quoi qu'il en soit, examinons la section « Domaines à examiner ».
Domaines d'examen
Une fois sur cette plateforme, les utilisateurs peuvent commencer à utiliser les outils nécessaires pour signaler les infractions.
Par exemple, en cliquant sur un domaine, les utilisateurs peuvent déterminer si le contenu a été dupliqué ou non, identifier les pages où apparaît le contenu litigieux, consulter les coordonnées potentielles des propriétaires du site ainsi qu'un modèle d'e-mail, et obtenir un guide sur la procédure en cas de violation du DMCA.
PlagiaShield recommande de tenter de contacter les sites incriminés avant d'opter pour la voie plus sérieuse du dépôt d'une plainte DMCA via la Google Search Console (GSCL'entreprise affirme que, d'après son expérience, contacter directement le site permet d'obtenir le résultat escompté dans environ 70 % des cas. Voici un exemple de modèle d'e-mail que PlagiaShield a rédigé pour ses utilisateurs.
S'il n'existe aucune information de contact disponible, comme c'était le cas pour nous, les utilisateurs doivent directement soumettre une demande de retrait DMCA à Google. PlagiaShield a développé un système permettant d'accélérer la procédure et l'envoi de ces demandes Formulaires DMCA de Google, via une extension Chrome. Lorsque nous avons commencé à utiliser l'outil, cette étape s'est avérée extrêmement difficile à suivre, car PlagiaShield n'avait pas mis à jour son guide utilisateur. Heureusement, ce problème a été résolu au cours de notre test et il existe désormais un guide d'utilisation détailléCe qui a considérablement simplifié le processus. Il suffit aux utilisateurs de télécharger une feuille de calcul (au format .json) et de l'importer dans l'extension, qui se chargera du reste. L'extension remplira les formulaires DMCA et les soumettra progressivement afin d'éviter que Google ne soupçonne une intervention automatisée. Nous vous recommandons de consulter le guide complet dans la FAQ de l'extension lors de votre première utilisation.
Documents
PlagiaShield propose également un détecteur de plagiat pour les documents, qui fonctionne de manière similaire à de nombreux autres outils de ce type.
Cependant, il propose certaines options de filtrage qui permettent aux utilisateurs de limiter la recherche aux pages de leurs propres domaines ou aux pages de sites web externes.
Nous avons testé l'outil sur une première ébauche d'un article que nous avions commandé à un rédacteur et avons obtenu le résultat escompté : un article totalement original.
Cependant, nous avons également testé les cinq premières phrases d'un Reportage de CNN sur l'état du Service national de santé britannique (NHS)L'article, publié seulement sept heures auparavant, a été retrouvé en quelques secondes grâce à l'outil.
Ce qui nous a surpris, ce n'est pas tant que l'outil ait correctement identifié l'infraction, mais plutôt la richesse des informations obtenues. Non seulement il a repéré la copie de CNN, mais il a également révélé que plus de 20 autres sites avaient publié exactement le même article.
Cet outil est pratique pour les éditeurs de presse qui souhaitent vérifier rapidement le flot quotidien d'articles soumis. Cependant, sa limite de 2 000 mots représente un véritable casse-tête pour les médias publiant des articles de fond, des enquêtes, des analyses, des articles de recherche ou même des tribunes libres, car le découpage de ces articles s'avérera fastidieux. Autre particularité : l'accès à l'outil est lié au quota de pages du compte. Les utilisateurs ayant atteint leur limite de surveillance ne peuvent donc pas l'utiliser. On peut s'interroger sur les raisons de cette conception, d'autant plus que les utilisateurs peuvent facilement contourner ce problème en créant un compte gratuit.
Aide et soutien
PlagiaShield ne propose que peu de guides d'utilisation et d'explications sur la meilleure façon d'utiliser l'outil. Un bouton d'aide, situé en haut à droite de chaque page de domaine, offre un bref aperçu de chaque section. L'entreprise affirme privilégier un accompagnement par e-mail basé sur le comportement de l'utilisateur et lui envoyer des messages pour l'aider à progresser. En pratique, nous aurions toutefois apprécié une approche plus stratégique et proactive pour nous permettre d'être rapidement opérationnels. L'absence de documentation n'est pas pour autant un défaut rédhibitoire, d'autant plus que l'équipe d'assistance s'est montrée très efficace pour nous guider face aux problèmes rencontrés. Mais si l'objectif est d'aider les éditeurs à identifier et à traiter rapidement le plagiat, toute ressource facilitant la prise en main serait la bienvenue. Cela dit, après quelques heures d'utilisation, nous avons acquis une grande confiance dans l'utilisation de la plateforme.
Avis sur PlagiaShield
Malgré les inévitables problèmes de prise en main liés à l'utilisation de tout nouveau logiciel, nous avons été particulièrement impressionnés par la suite d'outils développée par PlagiaShield. Il s'agit d'une solution complète pour la détection du plagiat, adaptée aussi bien aux applications commerciales qu'académiques.
Ce que nous aimons chez PlagiaShield
Surveillance multi-domaines
Analyses détaillées des cas de plagiat présumés
Protection du contenu payant
Automatisation DMCA
Inclusion d'un vérificateur de documents
Interface minimaliste
Concentration extrême sur le plagiat
Équipe d'assistance réactive
Points à améliorer
Une meilleure visibilité sur les quotas de surveillance des pages
Expérience utilisateur améliorée lors du traitement des demandes de retrait
Guides de productivité plus détaillés
Nous pensons que PlagiaShield a trouvé la solution idéale avec sa suite d'outils. Certes, nous avons rencontré quelques problèmes lors de notre prise en main de la plateforme, mais plus nous l'utilisions et la voyions en action, plus nous étions impressionnés par la portée de cet outil de détection de plagiat en ligne. L'entreprise est fière d'avoir développé son outil avec la contribution de la communauté SEO, et à juste titre. Qu'un outil parvienne à traiter un problème aussi grave que le vol de contenu de manière aussi exhaustive est un véritable exploit. Bien que PlagiaShield puisse encore améliorer son expérience utilisateur, cela ne doit en aucun cas occulter tout ce que l'équipe a réussi à intégrer à la plateforme.