1、网站刚上线,看搜索引擎蜘蛛的抓取情况
如果网站提交给搜索引擎2天后,发现日志里蜘蛛不少,并都返回200,则说明已经可以正常收录。只是Google展示的时间比较快,而百度则需要20天左右(经验平均值)展示出来。
2、网站收录异常,对比日志中蜘蛛的行为情况
收录正常增加时和现在异常时的日志,进行对比分析。如果没有异常,则应该是搜索引擎展示数据库出问题所致。如果蜘蛛爬取量明显减少,观察是否外链突然减少很多。如果日志依然,则认为是搜索引擎的展示问题。
3、解决网站被封问题时,观察日志情况
网站被封时,往往日志里有百度蜘蛛,但很少,而且往往只访问robots.txt文件和首页经过这里的建议修改后,再提交给百度,之后的2天观察日志情况。如果蜘蛛明显增加,而且返回200居多,则收录的希望很大,时间问题。
4、及时发现网站安全问题,采取对措施
有两点需要注意:一,日志里收录了,但不一定展示出来,银杏视频APP下载网站入口可以看到百度蜘蛛和google机器人访问很频繁,但不一定他们都展示出来。只要它们频繁访问和正常抓取,一切就会很正常。二,市场上有专门分析蜘蛛爬取的工具我以后会在SEO工具栏目下介绍 ,不用银杏视频APP下载网站入口去读懂文档里的代码
在日志里,发现比较多的HTTP状态码是,200(正常)、304(没变化)、404(错误链接):304代表,自从上次抓取后,该内容没有更新。一般情况下,网站的图片经常会返回该值;404代表,访问的这个链接是错误链接。这个错误链接,一方面来自原本存在后来删除了网页,另一方面可能来自本来就不存在,但其他人外链了这么个死链接。