wordpress免插件纯代码获取蜘蛛来访日志统计

转载   龙笑天下  2015-12-14 14:29:42  559 人阅读  16 条评论

投放广告联系   诚邀合作伙伴   赞助我们   本站公告   轻松一刻

网站seo方面博大精深,小天对这方面了解的也不是很多,所以有点班门弄斧的意思。这里只希望把最近遇到的一个关于seo的问题分享给大家,希望对大家有所帮助。要做好seo,为了优化好网站,分析了解蜘蛛的爬行动向,清楚地了解蜘蛛爬行规律也是很重要的。

今天要实现的这个功能就是把蜘蛛的爬行记录列出来,生成一个日志,以方便站长们分析统计蜘蛛动向。当然对于这个功能有一款相应的WordPress插件,比如:wp-log-robots。但是我的原则是能不用插件就不用插件,所以在此给大家分享的是无插件代码版的获取蜘蛛抓取日志。

首先,找到wordpress主题文件目录下的functions.php文件,用代码编辑软件打开,在最后一个 ?>之前添加以下代码:

  1. /**
  2.  * WordpPress非插件纯代码获取蜘蛛来访日志
  3.  * http://www.ilxtx.com/how-to-get-spiders-logs.html
  4.  */
  5. function get_naps_bot(){
  6.     $useragent = strtolower($_SERVER['HTTP_USER_AGENT']);
  7.     if (strpos($useragent, 'googlebot') !== false){ return 'Googlebot'; }
  8.     if (strpos($useragent, 'msnbot') !== false){ return 'MSNbot'; }
  9.     if (strpos($useragent, 'slurp') !== false){ return 'Yahoobot'; }
  10.     if (strpos($useragent, 'baiduspider') !== false){ return 'Baiduspider'; }
  11.     if (strpos($useragent, 'sohu-search') !== false){ return 'Sohubot'; }
  12.     if (strpos($useragent, 'lycos') !== false){ return 'Lycos'; }
  13.     if (strpos($useragent, 'robozilla') !== false){ return 'Robozilla'; }
  14.     return false;
  15.     }
  16. function nowtime(){
  17.     date_default_timezone_set('Asia/Shanghai');
  18.     $date=date("Y-m-d.G:i:s"); return $date;
  19.     }
  20.     $searchbot = get_naps_bot();
  21. if ($searchbot) {
  22.     $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']);
  23.     $url=$_SERVER['HTTP_REFERER'];
  24.     $file="robotslogs.txt";
  25.     $time=nowtime();
  26.     $data=fopen($file,"a");
  27.     $PR="$_SERVER[REQUEST_URI]";
  28.     fwrite($data,"Time:$time robot:$searchbot URL:$tlc_thispage\n page:$PR\r\n");
  29.     fclose($data);
  30.     }

接着,再在网站的根目录新建一个robotslogs.txt的文本文件用来存放日志,权限设置为777,然后访问该文件(http://你的网站域名/robotslogs.txt)就可以看到蜘蛛的爬行记录了。再把这个地址存为浏览器书签就能很方便的随时查看了!效果图如下:

wordpress免插件纯代码获取蜘蛛来访日志统计

如果文章对你有帮助,请赞赏支持boke112导航发展!

历史上的今天:

文章标签: ,  
原文地址:http://www.ilxtx.com/how-to-get-spiders-logs.html
温馨提示:文章内容仅代表作者个人观点,不代表boke112导航赞同其观点和对其真实性负责!
版权声明:本文为转载文章,来源于 龙笑天下 ,版权归原作者所有,欢迎分享本文,转载请保留出处!
WordPress虚拟主机和VPS服务器推荐

 发表评论


  1. 斯托克笔记
    斯托克笔记 【小白】 @回复

    不会代码,只装插件。我的蜘蛛记录都被Google给占领了,当然,百度、360、搜狗、必应和雅虎都会来,但多数都是Google的蜘蛛。博客开了一个多月,上面所说的搜索网站已经全部收录了,百度今天也终于放内页了,努力还是有回报的。

  2. 成航先森
    成航先森 【举人】 @回复

    这个可以有,只是我很少看蜘蛛日志。。。

  3. 我要网赚
    我要网赚 【状元】 @回复

    我不懂,好好学

  4. 三月福利吧
    三月福利吧 【状元】 @回复

    这个方法很方便,感谢分享!

  5. 新成
    新成 【举人】 @回复

    学习了!

  6. 星岩博客
    星岩博客 【举人】 @回复

    厉害,拜读了,不过表示还没看懂。

    • boke112导航
      boke112导航【村长】2015-12-15 08:51  回复

      @星岩博客[呲牙] 其实很多技术不用看懂,懂得用就行了,原理就不用研究的

  7. 美女图库
    美女图库 【尚书】 @回复

    确实很好的插件

    • boke112导航
      boke112导航【村长】2015-12-15 08:51  回复

      @美女图库[流汗] 这个文章说的是免插件纯代码实现

  8. 微西风博客
    微西风博客 【状元】 @回复

    我日,刚发的垃圾文章,30秒都不到,好搜就收录了,马上就来了7个IP,看来我要拒绝百度从好搜下手了

    • boke112导航
      boke112导航【村长】2015-12-14 17:08  回复

      @微西风博客我这边也是好搜收录比较快,百度非常慢,如果不是好搜市场占有率太低,早就放弃百度转投好搜了

      • 微西风博客
        微西风博客 【状元】2015-12-14 17:10  回复

        @boke112导航是的,刚随便写一篇秒收录,不到一分钟就来十几个IP,百度我三个月前的网站标题都没更新,太垃圾了,动不动就降权,被K

  9. 明月登楼
    明月登楼 【王爷】 @回复

    不错,好文章,一定要收藏的!

    • boke112导航
      boke112导航【村长】2015-12-15 08:50  回复

      @明月登楼[呲牙] 其实折腾一下这个,能够了解自己站点蜘蛛的爬行情况也是不错的