• ----:)欢迎访问源码网(:----
    • 首页
    • 博客
    • 学院
    • 下载
    • 论坛
    • 影视
    • 发布源码
    • RSS
    • ITPig
    • 笑话网
    • 百家姓
    • 繁體中文

源码网 - 中国第一源码门户
选择镜像:网通镜像 - 电信主站
  • 首 页
  • 新闻动态
  • 网站运营
  • 网页制作
  • WEB开发
  • 编程开发
  • 图像媒体
  • 操作系统
  • 数据库
  • 服务器
热门搜索 优化 SEO 故事 cms IIS7 MySQL 个人 AdSense 主题推广 | 文章搜索: 高级搜索
会员登录/控制面版您的位置: 学院首页 >> 网站运营 >> 搜索引擎 >> 详细内容
 

推荐文章

  • 谷歌关于网站重复内容的10个建议
 
 

热点文章

  • 谈如何提高百度排名,让百度认可你的站
  • 世界各大搜索引擎的蜘蛛名称列表
  • 从一分钟的蜘蛛抓取看搜索引擎
  • 百度热门关键字手法大揭密
  • 百度热门关键字进首页的玩转手法大揭密
  • Google靠什么赚钱?
  • 如何用Google搜索本地硬盘
  • 分享网站快速收录的一些经验
  • 搜索引擎优化工具-网站优化工具
  • Google Adsense广告应避免18个错误
  • 搜索引擎的正确使用方法
  • 被百度降权后,网站该怎么办?
 
 

相关文章

  • 三联生活周刊:搜索引擎需要信息民主
  • 搜索引擎知识:网页的查重技术
  • 维基百科即将升级搜索引擎 抢夺Google市场
  • 雅虎推出新版手机网络搜索引擎oneSearch2.0
  • 搜索引擎如何给的网站打分的
  • 用C#开发蜘蛛程序
  • 搜索引擎垄断式推广,及对付搜索引擎的软件
  • 让搜索引擎来负责版权的登记
  • 2008搜索引擎行业三大看点
  • 搜索引擎类网站流量的分析报告
  • 搜索引擎排名秘笈及优化原理
  • Google 百度搜索引擎习惯的分析
 
 

百度搜索

 
 

从一分钟的蜘蛛抓取看搜索引擎

  • 阅览次数:
  • 文章来源: 落伍者
  • 原文作者: 2shoushichang
  • 整理日期: 2007-03-10
  • 发表评论
  • 字体大小:
  • 小
  • 中
  • 大

2007-03-05 23:59:59 218.104.*.* GET /type/l-haikou-98.html - 80 - 202.160.179.90 Mozilla/5.0+(compatible;+Yahoo!+Slurp+China;+http://misc.yahoo.com.cn/help.html) 200 0 0
2007-03-06 00:00:06 218.104.*.* GET /lend/721.html - 80 - 202.160.178.131 Mozilla/5.0+(compatible;+Yahoo!+Slurp+China;+http://misc.yahoo.com.cn/help.html) 200 0 0
2007-03-06 00:00:09 218.104.*.* GET /lend/10172.html - 80 - 60.12.227.58 Mozilla/5.0+(compatible;+YodaoBot/1.0;+http://www.yodao.com/help/webmaster/spider/;+) 200 0 0
2007-03-06 00:00:16 218.104.*.* GET /lend/6921.html - 80 - 60.12.227.58 Mozilla/5.0+(compatible;+YodaoBot/1.0;+http://www.yodao.com/help/webmaster/spider/;+) 200 0 0
2007-03-06 00:00:17 218.104.*.* HEAD /lend/27870.html - 80 - 202.108.22.142 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
2007-03-06 00:00:17 218.104.*.* GET /smalltype/s-xiamen-4-22.html - 80 - 202.160.178.190 Mozilla/5.0+(compatible;+Yahoo!+Slurp+China;+http://misc.yahoo.com.cn/help.html) 200 0 0
2007-03-06 00:00:19 218.104.*.* GET /lend/9956.html - 80 - 202.160.178.92 Mozilla/5.0+(compatible;+Yahoo!+Slurp+China;+http://misc.yahoo.com.cn/help.html) 200 0 0
2007-03-06 00:00:20 218.104.*.* HEAD /type/s-nanjing-146.html - 80 - 202.108.22.142 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
2007-03-06 00:00:25 218.104.*.* GET /lend/30849.html - 80 - 66.249.72.101 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) 200 0 0
2007-03-06 00:00:26 218.104.*.* GET /lend/9794.html - 80 - 202.160.179.132 Mozilla/5.0+(compatible;+Yahoo!+Slurp+China;+http://misc.yahoo.com.cn/help.html) 200 0 0
2007-03-06 00:00:30 218.104.*.* GET /lend/9184.html - 80 - 202.160.178.91 Mozilla/5.0+(compatible;+Yahoo!+Slurp+China;+http://misc.yahoo.com.cn/help.html) 200 0 0
2007-03-06 00:00:31 218.104.*.* GET /sale/28890.html - 80 - 60.12.227.58 Mozilla/5.0+(compatible;+YodaoBot/1.0;+http://www.yodao.com/help/webmaster/spider/;+) 200 0 0
2007-03-06 00:00:32 218.104.*.* HEAD /sale/6169.html - 80 - 202.108.22.142 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
2007-03-06 00:00:34 218.104.*.* GET /smalltype/l-nanjing-1-27.html - 80 - 202.160.179.121 Mozilla/5.0+(compatible;+Yahoo!+Slurp+China;+http://misc.yahoo.com.cn/help.html) 200 0 0
2007-03-06 00:00:34 218.104.*.* HEAD /sale/4886.html - 80 - 202.108.22.142 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
2007-03-06 00:00:35 218.104.*.* GET /lend/9986.html - 80 - 202.160.178.230 Mozilla/5.0+(compatible;+Yahoo!+Slurp+China;+http://misc.yahoo.com.cn/help.html) 200 0 0
2007-03-06 00:00:37 218.104.*.* HEAD /lend/1418.html - 80 - 202.108.22.142 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
2007-03-06 00:00:40 218.104.*.* HEAD /sale/1331.html - 80 - 202.108.22.142 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
2007-03-06 00:00:43 218.104.*.* HEAD /lend/347.html - 80 - 202.108.22.142 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
2007-03-06 00:00:43 218.104.*.* GET /smalltype/l-guangzhou-2-9.html - 80 - 202.160.178.150 Mozilla/5.0+(compatible;+Yahoo!+Slurp+China;+http://misc.yahoo.com.cn/help.html) 200 0 0
2007-03-06 00:00:44 218.104.*.* GET /lend/2076.html - 80 - 202.160.180.65 Mozilla/5.0+(compatible;+Yahoo!+Slurp+China;+http://misc.yahoo.com.cn/help.html) 200 0 0
2007-03-06 00:00:45 218.104.*.* HEAD /lend/516.html - 80 - 202.108.22.142 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
2007-03-06 00:00:47 218.104.*.* HEAD /lend/8841.html - 80 - 202.108.22.142 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
2007-03-06 00:00:49 218.104.*.* HEAD /lend/12985.html - 80 - 202.108.22.142 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
2007-03-06 00:00:52 218.104.*.* GET /sale/12149.html - 80 - 60.12.227.58 Mozilla/5.0+(compatible;+YodaoBot/1.0;+http://www.yodao.com/help/webmaster/spider/;+) 200 0 0
2007-03-06 00:00:53 218.104.*.* HEAD /sale/31397.html - 80 - 202.108.22.142 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
2007-03-06 00:00:55 218.104.*.* HEAD /lend/32143.html - 80 - 202.108.22.142 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0
这是早上零点1分钟内的蜘蛛来访记录,从里面我们可以看出一下几个问题:
1.百度仍是国内最大的蜘蛛来源,也是国内抓取页面最多的搜索引擎.(12次)
2.google抓取页面的频率相对比较低(1次,在零点这一小时内最多的一分钟(0点9分)抓了6次)
3.yahoo抓取页面也很多,基本和百度持平(10次)
4.出现了一个相对较新的蜘蛛YodaoBot(以前把它当作yahoo了),抓取频率也较高
5.没有出现iask和TencentTraveler,他们抓取频率相对较低(在零点开始的前2个小时,iask只抓取了十几次,TencentTraveler抓取了一百多次),这也和他们的市场份额相符
6.所有蜘蛛都抓取js页面,不过yahoo好像喜欢js文件,基本见一个抓一个,百度相对抓的少一些.
7.百度和yahoo对参数类型的页面也是照抓不误,google好像不是很感冒.
(数据按照早上零点到5点35分1万零18次的抓取数据分析)

上一篇:比AcdSee功能还强大的图片处理、编辑软件,推荐下载!
下一篇:ASP上传漏洞防范
  • 网友评论:
  • 查看所有评论
  • 我要发表评论
您的网名:
留言主题:
你要发表的内容:

 

关于本站 | 广告联系 | 版权声明 | 网站地图 | 发布软件 | 帮助中心 | 源码论坛

Copyright © 2005-2007 CodePub.Com  程序支持:木翼  滇ICP备05005971号