1、220.181.108.*ip 段的
(提权蜘蛛)
2、123.125.71.*ip 段的百度蜘蛛(劣质
)
3、123.125.68.*ip 段的百度蜘蛛(考察蜘蛛)
4、117.28.255.*ip 段的百度蜘蛛(假冒蜘蛛)
5、。。。。。。
第三、 检测页面状态正常与否
通过网址日志我们可以直接的服务器响应代码看出我们的页面哪些有问题,
哪些正常的。一般情况下返回的状态码是
200 的话说明正常,出现
说明页面出现问题。
第四、
从网站日志,我们可以直接的看出蜘蛛来我们站点的爬行次数,爬行次数
越多说明蜘蛛对我们的站点越友好。
通过上图我们可以直接的看出蜘蛛对我们站点的爬行次数了,但是这里面
的爬行次数里面也存在冒牌的蜘蛛,所以我们还需要通过客户
ip 进行确认哪些