在数字出版行业,抄袭是一个鲜少被提及的现实。只需在网上快速搜索一下,就能找到大量关于高等教育中抄袭隐性成本的学术讨论,这些成本不仅影响学术机构,也影响整个经济。然而,对于数字出版商而言,抄袭问题通常被视为防止作者将其他出版商的作品冒充为自己的作品。的确,市面上有一些程序可以检测单篇文章是否存在抄袭。但这些程序的不足之处在于,它们无法为内容所有者提供以下两点:a) 确保其内容未被盗用的手段;b) 简化处理已发现的知识产权侵权行为的流程。PlagiaShield 的诞生正是为了解决这些问题。除了传统的文档扫描功能外,该软件还承诺不仅可以帮助出版商发现任何被盗用的内容,还能简化下架流程。它提供的功能很多,但它真的能兑现这些承诺吗?如果能,它又能多轻松地融入出版商的工作流程呢?让我们一探究竟。.
PlagiaShield是什么?
PlagiaShield 是一款基于浏览器的在线抄袭检测工具,可自动扫描互联网,查找被盗用的内容。它的设计初衷是帮助品牌、代理商和出版商根除抄袭行为,并保护其在搜索引擎结果页面 (SERP) 中的排名。该软件的独特卖点在于,扫描完一个域名后,它会持续监控互联网,查找抄袭和重复内容,并通过电子邮件通知用户任何发现。区分抄袭和重复内容或许看似过于学术化,但实际上至关重要。PlagiaShield 提供非常详细的侵权信息,使用户能够查看其整个网站或单个页面是否被抓取。事实上,它甚至可以显示特定文章中的单个句子是否被抄袭,并提供这些句子的匹配百分比。用户可以轻松发现句子中是否对某些部分进行了修改——例如,修改一个单词或一些标点符号——从而绕过传统的抄袭检测工具。这意味着该工具距离实现语义抄袭检测的终极目标又近了一步。这种精细程度带来了一些立竿见影的优势。通过使用重复内容百分比模型,用户可以立即看到风险最大的部分,从而为审核流程提供一个起点。它还有助于出版商了解网站是在主动抄袭其内容,还是仅仅未能提供正确的引用。这意味着出版商无需提交下架请求,而是可以请求对方提供合适的反向链接。.
重复内容的SEO风险
如上所述,PlagiaShield 的目标是帮助发布商避免在搜索引擎结果页面 (SERP) 中失去曝光度。这是因为,对于重复内容,搜索引擎很难确定应该索引哪些内容,应该包含哪些内容。即使搜索引擎索引了所有版本,为了提供最佳搜索体验,它们最终也只会选择其中一个版本来响应搜索查询。这就是为什么 SEO 专业人士建议使用 PlagiaShield 的原因。
内容联合发布过程中的规范标签只选择一页会降低其他页面在搜索结果中的可见度——如果算法没有选中原始内容,这将是一个大问题。谷歌甚至承认,其系统会偏袒排名高的页面,即便它能识别出内容的原创作者。
它仍然有可能选择排名更高的网站。但谷歌也曾表示重视原创内容,并于2022年8月推出了一项核心搜索结果页面(SERP)算法更新,该更新被称为“新版SERP”。
实用内容更新它将此举描述为“一项更广泛的努力的一部分,旨在确保人们在搜索结果中看到更多由人撰写、为人服务的原创实用内容”。数字出版商不仅在投资高质量原创内容,而且越来越多地投资于内容优化,而抄袭对这些投资构成了非常现实的威胁。这让我们再次想到了PlagiaShield,该公司曾就2022年主要新闻出版商的内容被盗用情况进行过一项研究,结果发现……
扫描的文章中有 62% 已不再是独一无二的。.
PlagiaShield 定价和功能

PlagiaShield 提供免费版本,每月可对单个域名上的最多 100 个网页进行一次免费扫描,以及每月 10 次最多 2000 字的免费查重扫描。此版本既可作为现有出版商的演示,也可帮助新出版商确保其内容未被高权重网站抄袭。不过,该公司提供的三个付费版本功能更加强大。专业版起价为每月 29 美元,面向品牌和内容机构,每月可对五个域名上的最多 1000 个网页进行扫描。用户可以选择每月额外支付 20 美元增加 1000 个网页的扫描量。此外,用户还可以获得在线聊天支持以及该公司提供的服务。
DMCA Filler Chrome 扩展程序这加快了填写 DMCA 删除请求的流程,这些请求随后会通过 Search Console 提交给 Google。发布商套餐的价格更高,起价为每月 499 美元。不过,该套餐面向大型新闻媒体,除了专业版的所有功能外,还提供每周最多 50 个域名和 25,000 个页面的扫描服务。每月额外扫描 10,000 个页面只需 99 美元。此外,该套餐还提供团队管理和 API 访问权限。PlagiaShield 还提供企业版套餐,其中包含定制功能、支持和数十亿种选项。例如,该套餐适合采用订阅模式的发布商,因为 PlagiaShield 可以直接与其网站集成,并保护付费内容。.
PlagiaShield 控制面板入门指南
PlagiaShield 的控制面板设计极简,仅包含三个主要部分:域名、文档和账户。域名部分用于监控网站抄袭情况,文档部分用于分析单个文档是否存在抄袭,账户部分则包含计费和套餐设置以及团队管理功能。让我们逐一了解一下。.
域名
发布商注册账户后,即可受邀添加域名。每种付费订阅方案都允许添加多个域名。.

但是,需要注意的是,每个账户共享的都是来自一个公共监控网页池。这意味着什么呢?也就是说,选择基础版专业套餐的用户可以监控五个域名下共享的共计 1000 个网页。.

虽然用户可以限制每个添加域名的监控页面数量,但最低页面限制为 1,000 页。这意味着,如果要监控 Pro 套餐提供的全部五个域名,用户需要额外支付每月 80 美元,以获得额外的 4,000 页监控额度。值得注意的是,PlagiaShield 仅监控包含超过 500 个字符的页面。此外,该平台还允许用户排除网站上不值得监控的部分,例如分类页面和作者页面。这两个功能都有助于控制页面监控额度。虽然是否愿意每月支付 109 美元来监控五个域名由用户自行决定,但我们认为价格并非主要问题。我们更希望看到的是,每个订阅级别如何才能发挥最大效用,以及需要满足哪些条件,从而提高透明度。域名选择完成后,发布商可以在右侧的“列出域名”选项卡下轻松查看他们的网站。.

点击菜单右侧的域名图片,即可查看潜在版权侵权的详细概述。.

用户可以通过此页面开始判断自己的内容是否在网络上其他地方被复制。PlagiaShield 提供微观和宏观两种审核过滤器——分别是“审核页面”和“审核域名”——供用户识别潜在的侵权行为。我们先来详细了解一下微观过滤器的工作原理。.
评论页面
此选项允许用户深入查看 PlagiaShield 检测到的重复页面。用户可以按相似页面的数量或找到的共同内容的百分比来筛选结果。第一个筛选条件有助于快速识别软件是否标记了开源的、模板化的内容,例如隐私声明或会员常见问题解答。理想情况下,用户应该在注册过程中就已经过滤掉了这些内容。如果用户错过了这一步,他们可以设置 PlagiaShield 忽略该页面,但必须等到套餐到期才能重置页面配额。.

第二个筛选条件让事情变得有趣起来。通过根据你的页面与疑似IP盗窃页面之间共享的数据量进行筛选,你可以看到哪些页面已被抓取。如下所示:
SODP的 洛杉矶知名出版公司名录与另一个网页共享 92% 的内容。.

点击相关页面会弹出一个对话框,其中包含更详细的侵权分析。如下所示,两个页面之间有 156 个句子匹配,远远超出了内容相似度的范畴。.

有问题的页面抓取了所有内容
SODP的 内容甚至包括URL和页面标题中都出现了“数字出版现状”字样。查看来源部分可以更详细地了解抄袭内容,用户可以一目了然地看出哪些句子是直接复制的(红色高亮显示),哪些句子相似(黄色),哪些句子完全不匹配(灰色)。.

我们无意在此抨击其他网站,因此已将其网址模糊处理。我们将要讨论的是 PlagiaShield 的下架请求工具,它可以帮助解决此类问题。然而,该软件在用户体验方面存在一个小小的缺陷。奇怪的是,用户无法直接从“审核页面”部分发起下架请求,而必须导航至“审核域名”部分。我们认为,如果能够直接从任何筛选器中处理此类问题,将会更加方便用户,但我们实在不明白为什么实际情况并非如此。总之,让我们来看看“审核域名”部分。.
评论领域
到达此处后,用户即可开始使用所需的工具来处理侵权行为。.

例如,点击某个域名,用户可以对内容是否被复制、侵权材料出现的页面、网站所有者的潜在联系信息以及电子邮件模板,以及 DMCA 侵权流程指南进行分类。.

PlagiaShield建议在采取更严厉的措施,即通过Google Search Console提交DMCA投诉之前,先尝试联系侵权网站(
GSC该公司声称,根据其经验,直接联系网站大约有 70% 的概率能达到预期效果。以下是 PlagiaShield 为其用户准备的电子邮件模板示例。.

如果没有任何联系方式(就像我们遇到的情况一样),用户应该直接向谷歌提交 DMCA 删除请求。PlagiaShield 开发了一套系统来加快 DMCA 删除请求的完成和提交速度。
谷歌的DMCA表格我们使用 Chrome 扩展程序来完成这一步骤。刚开始使用该工具时,由于 PlagiaShield 的用户指南尚未更新,这一步骤的操作极其困难。好在评测过程中这个问题得到了解决,现在已经有了……
详细用户指南这大大简化了流程。用户只需下载一个 .json 格式的电子表格,然后将其上传到扩展程序,扩展程序就会自动完成大部分工作。它会填写 DMCA 通知,然后逐步提交,以避免引起 Google 的怀疑,认为此过程是由机器人代为处理的。我们建议您在首次使用时,将扩展程序常见问题解答部分的完整指南放在手边。.
文件
PlagiaShield 还提供文档抄袭检测器,其工作原理与其他许多此类工具类似。.

不过,它确实提供了一些筛选选项,允许用户将搜索范围限制在自己域名内的页面,或者限制在外部网站的页面。.

我们用这个工具测试了我们委托作家撰写的故事初稿,得到了预期的结果,那就是这是一篇完全原创的文章。.

然而,我们也测试了a的前五个句子。
CNN关于英国国家医疗服务体系(NHS)现状的报道该文章仅在七小时前发布。该工具在几秒钟内就找到了原文。.

令我们感到惊讶的并非该工具正确识别出了侵权行为,而是它提供的信息量之大。该工具不仅识别出了CNN的侵权内容,还显示了其他20多家也发布了完全相同报道的网站。.

对于希望快速检查每日海量投稿的新闻出版商来说,这是一个很有用的工具。然而,其2000字的字数限制意味着,任何发布篇幅较长的专题报道、调查、分析和研究论文,甚至是评论文章的媒体都会发现,将这些文章拆分成多个部分相当麻烦。另一个奇怪之处在于,该工具的访问权限与账户的页面配额挂钩,因此达到页面监控限额的用户将无法使用该工具。我们不太明白PlagiaShield为何要这样设计该工具,因为用户可以随时注册一个免费账户来规避这个问题。.
帮助与支持
PlagiaShield 的支持指南和最佳使用方法说明并不完善。每个领域屏幕的右上角都有一个指导按钮,可以简要概述各个部分的功能。该公司表示,他们倾向于通过基于用户行为的电子邮件来指导用户,并根据用户的操作(无论是否执行操作)发送邮件,帮助用户进行下一步操作。然而,在实际使用中,我们更希望看到一些更具策略性和前瞻性的指导,以便我们能够尽快提高工作效率。我们并非认为缺少文档是一个重大缺陷,尤其是在支持团队为我们解决遇到的问题提供了如此有效的帮助之后。但如果目标是帮助出版商快速识别和处理抄袭问题,那么任何能够帮助我们更快克服初始学习曲线的方法都将是受欢迎的。尽管如此,在几个小时的使用之后,我们对如何利用这个平台已经充满信心。.
PlagiaShield 评测
尽管任何新软件在使用过程中都难免会遇到一些小问题,但我们仍然对PlagiaShield开发的这套工具印象深刻。它在查重方面堪称一套完整的解决方案,兼具商业和学术应用价值。.
我们喜欢 PlagiaShield 的原因
- 多域监控
- 对疑似抄袭行为的详细分析
- 付费内容保护
- DMCA自动化
- 包含文件检查器
- 极简界面
- 重点打击抄袭
- 响应迅速的支持团队
哪里有改进的空间
- 更清晰地了解页面监控配额
- 处理下架请求时,用户体验更加流畅
- 更详细的效率提升指南
我们认为PlagiaShield凭借其工具套件已经成功解决了这个问题。诚然,我们在实际操作该平台时遇到了一些问题,但随着我们投入更多时间并开始观察它的实际运行情况,我们对其在线抄袭检测工具的强大功能有了惊人的认识。该公司引以为豪的是,该工具的开发得到了SEO社区的贡献,这的确值得骄傲。对于一款能够如此全面地解决内容盗窃这一严重问题的工具来说,这绝非易事。虽然PlagiaShield在用户体验方面还有一些改进空间,但这绝不应掩盖团队在该平台上所取得的成就。.