航空论坛_航空翻译_民航英语翻译_飞行翻译

标题: DEDECMS防采集的三个办法 [打印本页]

作者: 航空    时间: 2010-5-23 10:08:34     标题: DEDECMS防采集的三个办法

1、随机模版8 v) R) j1 q, |- Z( u
方法:你多复制N多模版,在body标记附近稍微修改一下。只要你的模版够多,人家就失去耐性,放过你了。2 l1 V* A1 m8 O: k( `3 N8 }/ m
缺点:就是要复制N多模版,麻烦/ J, ], j% ^& ^3 C% ?/ d0 g1 b
2、防采集字符混淆) @4 o7 |# y5 Q5 g' Y
方法:在body表示是插入大量混淆字符别人采集也一并把混淆字符采集过去了。) [1 U9 [) C+ u; G$ M8 D
缺点:有可能对SEO造成影响,对于图片站来说,假如别人不在乎你的混淆字符的话,人家照样采集,别人下载你的图片给你带来过大的流量。
7 V  |3 L$ V9 @$ I( g  n3、还有一个好的解决办法
( K. N' X' H! R4 F* ?/ d/ H方法:在body标记附近的<div class="abc">修改成<div class="abc {dede:field.id/}">
5 _- H4 l4 I  g! _! R  w; B注意是空格+{dede:field.id/},这样div的class还是没有变,但产生了<div class="abc 文档ID">
, ^' z3 \5 B& t& W或者在html标记里插入id={dede:field.id/},比如<div id={dede:field.id/}> <body id={dede:field.id/}>注意如果当前的html标记有存在的ID最好不要再插入了。
( M3 u- f" v9 ]" \( @' f5 P让采集者写规则的时候没办法找到相同的,他就没办法写了,如果他连<div class="abc 文档ID">也采集进去的话,你就在<div class="abc 文档ID">前面的有class的地方照样这样做。
/ a" B9 v- X2 j, e当然,别人可以使用过滤规则来去掉,但是假如我在所有的class里插入文档ID,或者插入id=文档ID这样的。那他就采集整个页面然后再过滤吧。" F+ g0 ^" N" X, U$ m) a  Q
缺点:如果插入{dede:field.id/}不够多的话别人可以用过滤规则过滤掉。




欢迎光临 航空论坛_航空翻译_民航英语翻译_飞行翻译 (http://bbs.aero.cn/) Powered by Discuz! X2