• ----:)欢迎访问源码网(:----
    • 首页
    • 博客
    • 学院
    • 下载
    • 论坛
    • 影视
    • 发布源码
    • RSS
    • ITPig
    • 笑话网
    • 百家姓
    • 繁體中文

源码网 - 中国第一源码门户
选择镜像:网通镜像 - 电信主站
  • 首 页
  • 新闻动态
  • 网站运营
  • 网页制作
  • WEB开发
  • 编程开发
  • 图像媒体
  • 操作系统
  • 数据库
  • 服务器
热门搜索 优化 SEO 故事 cms IIS7 MySQL 个人 AdSense 主题推广 | 文章搜索: 高级搜索
会员登录/控制面版您的位置: 学院首页 >> 网站运营 >> 搜索引擎 >> 详细内容
 

推荐文章

  • 2008年版最新免费搜索引擎登录口大全
  • 谷歌关于网站重复内容的10个建议
 
 

热点文章

  • 谈如何提高百度排名,让百度认可你的站
  • 世界各大搜索引擎的蜘蛛名称列表
  • 从一分钟的蜘蛛抓取看搜索引擎
  • 百度热门关键字手法大揭密
  • 搜索引擎优化工具-网站优化工具
  • 百度热门关键字进首页的玩转手法大揭密
  • Google靠什么赚钱?
  • 如何用Google搜索本地硬盘
  • 分享网站快速收录的一些经验
  • 2008年版最新免费搜索引擎登录口大全
  • 被百度降权后,网站该怎么办?
  • Google Adsense广告应避免18个错误
 
 

相关文章

  • comScore公布亚洲搜索排行:百度排名第三
  • CNNIC称中国视频用户达1.6亿 排名数据很敏感
  • 教新手如何分析竞争对手网站的排名
  • 三步谈SEO:掌握六点,一个月进搜索引擎排名前十
  • 2008财富500强出炉 微软排名44 Google排名150
  • 全球网络成熟度完全排行榜:中国排名57位,上升2位
  • 利用seo破坏竞争对手的排名
  • 网站擅自搞排名引来的一身官司
  • Ranking - 影响排名的六大因素
  • 有关网站短期与长期无法访问,百度收录和排名的两个案..
  • 网站重建如何保护已有排名
  • Google的算法震惊网络 众多知名网站排名落后
 
 

百度搜索

 
 

排名下降后的分词研究

  • 阅览次数:
  • 文章来源: CP整理
  • 原文作者:
  • 整理日期: 2008-05-12
  • 发表评论
  • 字体大小:
  • 小
  • 中
  • 大

  我的一个电影站前一段时间改版之后发现流量掉的厉害,查看几个词,发现百度的分词功能把网页分成了XXXX全集+观看,实际上网页里 XXXX全集只出现了一次,自然密度比较小,排名下降。为什么出现这种情况,看来我对百度的分词要进行进一步的学习。看了相关书籍,再分析了百度里的排名,得到了如下内容,整理出来供大家参考,西红柿臭鸡蛋尽管仍过来吧。

一百度会把一些高频词忽略掉,如下载,视频,观看,这些词在百度里的索引量已经达到了最高1亿个,他们的权重有时候会忽略不计。

二百度的词库非常大,他会随时更新一些新词语,他一般采用混合分词的方式进行分词,所以分词方案非常多。而GG的词库相对较小,智能化比较低,很多时候是把词语拆成一个个字或者相连的词。所以分词方案比较单一

如功夫之王在线观看在GOOGLE里被分成功夫+王+在线+观看,在这里之被当作停止词而忽略掉拉。

而在百度里则有以下9种方案,可以看到一些高频词有可能被忽略掉,如在线,观看。其实这种情况在GOOGLE里也存在,只是因为GOOGLE里只显示前80几页,后面的结果看不到。

1功夫之王+在线观看

2功夫之王+在线+观看

3功夫之王在线+观看

4功夫之王在线+在线观看

5功夫之王在线

6功夫之王+在线

7功夫之王观看

8功夫之王+观看

9功夫之王

这里由引申出一个问题,既然搜索”功夫之王在线观看“和”功夫之王“都是把”功夫之王‘当成必须要有的内容,

是不是说搜索”功夫之王“和搜索”功夫之王在线观看“,所参与排名的网页是一样的呢,我门查看以下发现“功夫之王在线观看”是732W,而功夫之王是 1600W,看来不一样。实际显示都是76页,是不是巧合呢,再试一下黄石的孩子,发现也是76页,原来百度只显示76页的内容。到底这两个关键词参与排名的网页是否一样,不能确定,但我猜测“功夫之王在线观看”结果比”功夫之王“小很多的原因百度会把”功夫之王“再切分,把那些非电影的资源也放进去。到底如何留给高手来解答吧。GOOGLE的表现呢,搜索功夫之王到64页出现为了”提供最相关的结果,我们省略了与已显示的 615 个类似的条目“

可以看出百度和GOOGLE都有类似的设置,就是只显示搜索的部分结果,为什么要这样,1这样的话速度比较快,2根据统计往后的数据人们一般不会查看。

既然“功夫之王在线观看“在百度里有多达9种分词方案

可以肯定的是这9种方案相对之间也是有权重高低的,根据百度的原则,我认为越匹配权重越高,匹配词语越靠前权重越高。高频词可以忽略。因此1-9就是权重逐步降低的大致顺序。那如何根据这样的分词原则如何做才能最大程度的排名靠前呢。

1尽量在标题上全字匹配

2尽量在顺序上匹配

3 网页可能按照这9种方案的任意一种分词,我们要控制百度让他按照1或者2来分词,为什么在全字匹配的情况下尽量选择这两个分词方法来安排网页关键词布局呢,因为如果按照第3或者第4个方案,把”功夫之王在线“当成一个词语,它会忽略这个网页中”功夫之王“的存在,那很显然”功夫之王在线“这个词在网页出现的几率是比较小的,除非你是百度视频和新浪这些可以随意堆砌。否则很难有好的排名。

4如何让百度按照我们设想的来进行分词,就牵扯到网页关键词布局问题,不要把”功夫之王在线“放在网页的任何一个地方就可以拉。

写的有点乱,不过我研究了一上午,只出来这些东西,准备好西红柿臭鸡蛋的可以开仍啦。

上一篇:PHP使用zlib扩展实现页面GZIP压缩输出
下一篇:构建支持Master/Slave读写分离的数据库操作类
  • 网友评论:
  • 查看所有评论
  • 我要发表评论
您的网名:
留言主题:
你要发表的内容:

 

关于本站 | 广告联系 | 版权声明 | 网站地图 | 发布软件 | 帮助中心 | 源码论坛

Copyright © 2005-2007 CodePub.Com  程序支持:木翼  滇ICP备05005971号