有什么好方法防止自己网页的内容被采集

(编辑:jimmy 日期: 2024/12/24 浏览:2)

防采集第一种方法:在文章的头尾加上随机广告

网站采集者在采集时,通常都是指定头尾特征从哪到哪过滤.我们这里讲的第一种方法:文章头尾加随机广告,当然随机广告是不固定的。
比如你的文章内容是"校内网涂鸦代码",则随机广告的加入方法:
<div id="xxx">随机广告1欢迎访问校内网涂鸦代码站随机广告2</div>
注:随机广告1和随机广告2每篇文章只要随机显示一个就可以了.

防采集第二种方法:在文章正文页面插入重复特征头尾代码的注释。文章列表加随机不同的链接标签,比如<a href="",<a class="dds" href=''

当然,这个可以用正则去掉,但足于对付通用的CMS采集系统了。。
<!--<div id="xxx_文章ID">-->
其它标题或内容...
<!--<div id="xxx_文章ID">--> <div id="xxx_文章ID">
随机广告1欢迎访问4399com小游戏站随机广告2
<--</div>--></div><--</div>-->

防采集第三种方法:加在文章列表的随便链接样式。
即:正文头尾或列表头尾添加<!--重复特征代码-->
原理是让采集的人无法抓到列表链接规律,无法批量进行采集.

请看:
<a href="xxx.html">标题一</a>
<a alt="xxx" href="xxx.html">标题二</a>
<a href='xxx.html'>标题三</a>
<a href=xxx.html>标题四</a>

  如果你把三种方法全部加上,我想一定能让想采集的人头疼半天而放弃的..
  如果你还问,如何防止别人复制采集呢?要做到这一点容易,把你的网站的网线拔了,自己给自己看就好了.

一句话新闻

一文看懂荣耀MagicBook Pro 16
荣耀猎人回归!七大亮点看懂不只是轻薄本,更是游戏本的MagicBook Pro 16.
人们对于笔记本电脑有一个固有印象:要么轻薄但性能一般,要么性能强劲但笨重臃肿。然而,今年荣耀新推出的MagicBook Pro 16刷新了人们的认知——发布会上,荣耀宣布猎人游戏本正式回归,称其继承了荣耀 HUNTER 基因,并自信地为其打出“轻薄本,更是游戏本”的口号。
众所周知,寻求轻薄本的用户普遍更看重便携性、外观造型、静谧性和打字办公等用机体验,而寻求游戏本的用户则普遍更看重硬件配置、性能释放等硬核指标。把两个看似难以相干的产品融合到一起,我们不禁对它产生了强烈的好奇:作为代表荣耀猎人游戏本的跨界新物种,它究竟做了哪些平衡以兼顾不同人群的各类需求呢?