- 注册时间
- 2009-12-25
- 最后登录
- 2021-7-10
- 在线时间
- 3302 小时
- 阅读权限
- 200
- 积分
- 10
- 帖子
- 13416
- 精华
- 1
- UID
- 2036
  
|
1、随机模版; m/ j9 y4 l# ^+ J8 @/ x% @
方法:你多复制N多模版,在body标记附近稍微修改一下。只要你的模版够多,人家就失去耐性,放过你了。
3 x3 Q, }1 I' V) x. B缺点:就是要复制N多模版,麻烦
0 X; n3 i4 l, i: U& Q9 z- y: O2、防采集字符混淆
3 _7 p6 o: m4 h7 g9 f' [2 v9 ?/ [( M方法:在body表示是插入大量混淆字符别人采集也一并把混淆字符采集过去了。9 Z" K$ S' L! t9 \7 Q% l# x4 Y, n* p
缺点:有可能对SEO造成影响,对于图片站来说,假如别人不在乎你的混淆字符的话,人家照样采集,别人下载你的图片给你带来过大的流量。
t: x7 Z3 N4 P& ]3、还有一个好的解决办法' G& E" G% T' i3 B1 T
方法:在body标记附近的<div class="abc">修改成<div class="abc {dede:field.id/}"> W }' `) t8 X# {2 X# r
注意是空格+{dede:field.id/},这样div的class还是没有变,但产生了<div class="abc 文档ID">
" C7 Z. Q \$ v1 d" k* r或者在html标记里插入id={dede:field.id/},比如<div id={dede:field.id/}> <body id={dede:field.id/}>注意如果当前的html标记有存在的ID最好不要再插入了。
7 V" @+ b5 L9 M& V5 b- D让采集者写规则的时候没办法找到相同的,他就没办法写了,如果他连<div class="abc 文档ID">也采集进去的话,你就在<div class="abc 文档ID">前面的有class的地方照样这样做。, N% }4 X+ u. A: j' H& h- M5 |$ f
当然,别人可以使用过滤规则来去掉,但是假如我在所有的class里插入文档ID,或者插入id=文档ID这样的。那他就采集整个页面然后再过滤吧。8 ~4 x. A) W0 n& O0 Y
缺点:如果插入{dede:field.id/}不够多的话别人可以用过滤规则过滤掉。 |
|