现在位置:网站首页 > SEO优化 > 文章内容

有效防止文章被复制采集的方法技巧

   2018年3月11日   来源:马海祥博客

最近在和几个博友闲聊,在谈到为什么最近博客都不更新文章了的时候,博主们就开始吐槽说自己辛辛苦苦原创的文章,被人家直接复制粘贴过去,发到各大论坛来做外链,很是气愤呀!

确实,现在一些推广人员为了做外链,提高自己网站权重,就喜欢复制别人网站的原创文章,不加作者连接,只加上自己需要做的连接,到各大论坛发布,这严重损害了原创作者的心。的很多文章也被这样复制过,最让人生气的就是被人复制粘贴过去的文章排名还比你的原创文章排名还好,流量也被截取了。

有效防止文章被复制采集的方法技巧-

当网站中大量的内容被别人采集,特别是被一些权重较高的站采集转载后,是非常损伤网站元气的。你辛辛苦苦的原创,在这时候也只能成一个牺牲的肥羊了。

我非常反感那些采集别人文章的人,特别是采集后一个链接都不留,甚至还把你内容中留的版权内链去掉的人,非常的鄙视!

虽然最近百度算法有进一步的升级,但是对于源网站的排名情况也没有进一步的提升,所以为了最大化的避免站长们的原创文章复制导致的损失,在此跟大家分享以下几种防止文章被复制采集的方法:

一、增加版权信息

对于用户体验最好的,就是可以允许复制,但是我们可以在复制的内容上面加入版权信息,这种方法很多网站都开始使用了。

具体方法是:找到系统后台-模块-默认模块管理-文章页模板中加入下面的代码,可以试试,在IE内核的浏览器中可以可以实现复制网页正文内容时自动添加版权信息的功能!

JavaScript代码:

<script language="javascript" type="text/javascript">
  <!--
  document.body.oncopy = function () {
  setTimeout( function () {
  var text = clipboardData.getData("text");
  if (text) {
  texttext = text + "\r\n(这里是你的文章版权信息,去掉括号):"+location.href;
  clipboardData.setData("text", text);
  }
  }, 100 )
  }
  -->
  </script>

二、使文章页面无法复制代码

找到系统后台默认模块管理中的footer.htm,或者文章页模板的底部代码模块,将以下代码加到页面文件的最后的一个<\div>后边,保存即可。

<script language="javascript">document.oncontextmenu=new Function("event.returnValue=false");document.onselectstart=new Function("event.returnValue=false");</script>

另外,禁用复制功能也是很多人使用的防拷贝防采集的方法,这类防采集的文章,你只能通过“查看源文件”里使用他的文章内容了。不过,已经有很多破解方法了,正所谓上有政策下有对策,但他起到给拷贝者制造麻烦的作用,而且并不是所有人都学会了“破解方法”的,因此,我还是推荐你使用防拷贝策略的。

三、使用防采集代码

其实正常的采集工具,一般都需要内容开始代码和结束代码具有唯一性。所以我们可以在文章页面开始的<div class=”title”>中加入一段id=”{dede:field.id/}”,从而让文章自动获取一个文章ID,如下图所示:

有效防止文章被复制采集的方法技巧-

这样每篇文章的ID都是不一样的,所以采集工具采集的时候,每次只能采集一篇文章,进而可以有效防止低级采集工具的采集,但是高级采集工具可能防不住了!

四、设置DEDE自带防采集字符串

DEDE是自带防采集字符串功能的,通过设置防采集字符串,可以让别人采集文章后出现散乱的字符串,这样很影响阅读,从而让采集的网站不得不放弃采集。

经过防采集混杂字符串管理停止设置需,能够增减躲藏被采集后会显现出来的内容,普通能够参加些版权声明或者您网站的相关信息,设置办法只需求在“#start#”和“#end#”之间参加内容即可,每条内容前加“#,”,一条内容为一行,里面的内容会随机插入到生成后的html里面,可依据下图停止设置。

有效防止文章被复制采集的方法技巧-

当然,这并不是万无一失的,所为道高一尺魔高一丈,如果防采集字符串比较少,稍微设置下采集规则便可以替换掉那些无意义的字符串;如果字符串比较多,这对文章的关键词密度会起到稀释作用。

另外,少数人建议直接用网站关键字、网站链接作为字符串,据说这样可以增加网站外链,别人采集得越多外链会越多。马海祥对这样的做法持保留态度,毕竟设置防采集字符串和SEO作弊很相似,弄得不好被搜索引擎K掉那就亏大了。所以,目前很多网站都没有设置这种功能,不知道是不是因为这样的原因。

五、封采集者的IP

为了防止采集,绝大多数方法是“双刃剑”,采取封IP的办法防止采集,令企图采集者无功而返,实践证明本方法绝对不影响搜索收录。

具体代码如下:

<%
Dim IP,IPString,VisitIP
'要禁止的IP地址
IPString="|45.125.14.95|183.56.168.84|127.0.0.1|120.55.38.50|47.90.121.181|"
'获取IP地址
IP = Request.ServerVariables("HTTP_X_FORWARDED_FOR")
If IP = "" Then
IP = Request.ServerVariables("REMOTE_ADDR")
End If
VisitIP="|"&IP&"|"
If instr(1,IPString,VisitIP)>0 Then
response.write "你的IP被禁止"
response.end
End If
%>

使用方法:

将上述代码放到<head>区,如果不知道什么是<head>区,你就放到</head>上面即可!

IPString="|45.125.14.95|183.56.168.84|127.0.0.1|120.55.38.50|47.90.121.181|"是采集你网站内容的垃圾站服务器IP,你可以自己替换,不知道对方服务器IP的可以点开始------运行-----输入ping www.*****.com(采集网站的网址)获得其IP。

另外,127.0.0.1是防止从本地采集,你可以在本地试试,因为现在许多新网站都是从本地采集,所以这个127.0.0.1一定要封它,现在许多网站程序有封IP功能,就不需要上述代码了,直接封其服务器IP就行了!

六、防止文章被采集的一些简易方法

除了以上几个方法,我还整理了以下几个随手就可以实现的方法,我觉得还是有一定的作用的,现在分享给大家:

1、加水印

当你的文章中带有图片时候,记得给文章中的图片加上水印,这样就留下了你的版权,对方要采集你的文章后,不可能一张一张去PS的,这样也算是变相地帮助我们宣传网站。

2、穿插信息

写文章的时候,尽量随机的去穿插一些你网站名字,链接,作者之类的信息,只要能够读的通顺就尽力多加一点。对方要采集你的文章的话,他也要花大量的时间去处理,久而久之,便不会愿意采集我们的文章了。同时对于马虎大意的采集者来说,就留下了你的信息。

3、留内链

适当的在你的内容中加一些内链,不过也不要加太多,3个以内吧(具体可查看《网站内链结构该怎么进行布局》的相关介绍)。

4、临时留错

这个方法很巧妙,如果发现某个站盯上你了,每天定时采集你的文章内容时。你可以在发表文章的时候,故意写错一些东西,或者加上一些不好的词汇,代码类的可以错几行代码,看到他采集过去后,自己再赶紧改过来,这样可以让他的用户体验度降低。不过,要提示您,这种方法并不提倡,万一你的用户恰好也在这个时候看到你的文章了,也会对你有影响,所以这种情况只适合刚起步,访问较小的网站。

这个方法的具体做法是在文章各个段落的任何位置里,添加一些无用的字符,然后把这些字符的颜色设置为白色,并把这些字符的大小设置为0。

代码如下:

<font style="font-size:0px;color:#FFF">/ ^! |7 c; i1 T" x1 Q$ X1 \) G) C</font>

这个方法,可以使软件不能轻松采集到他的文章内容。

其实,很多人不是用无用字符,而是用他网站的网址,这样,你拷贝他的文章直接发布时就带上他的网址了,给他网站增加了外链。

因此,遇到此类防采集的网站,采集者需要手动删除这些多余的字符。

不过,这样防采集的同时,文章也多了很多无用的字符,并不利于文章SEO优化。

5、网址提交

先将写好的文章的网址提交给百度,过两天再将文章放出来,此时,百度可能已经收录你的文章了。就算对方再来采集了,也没有那么大的影响了(具体可查看《采集的文章内容该如何快速收录和排名》的相关介绍)。

6、重要内容设定会员访问限制

如果你的网站中确实有比较重要的内容要有所保留,固定的资源才能够吸引固定的用户,这样可以通过设置会员访问限制,让注册会员或者高级会员才能够访问这部分内容。

当然,这同样会把搜索引擎拒之门外,不过为保持网站的吸引力,适当的稀有资源还是有必要保留的。如果网站没有让用户留下来的资源,那么用户很容易出走的。

当然,防采集的方法还有很多,大家可以去各大网站上学习、模仿。马海祥觉得,如果是准备通过原创内容来提高权重的新站,防采集还是有必要的;如果网站已经发展得比较大,防采集是没多大必要的,毕竟搜索引擎已经认可这里是文章首发地。

最后再提醒大家一点,因为每个网站根据使用时间和布局的不同,部分系统模板代码可能都会存在一点区别,所以建议在修改之前要保存一份源代码,以避免不小心的误操作导致整个网站的损失。

点评:

其实,无论多么高明的技术和方法都不能百分百防止原创文章被他人抄袭,只能说起到一定的作用,那就是增加对方的工作量而已。最有效的方法还是大家都遵守规则,要么自己原创,要么就直接转载文章并保留文章出处,要么就进行大规模的伪原创。对于目前网络的这个氛围,感觉要很多年以后,这种抄袭的行为才有可能减少,想根治真的很难。


标签: 文章网站方法字符串 打印本页 || 关闭窗口