• ----:)欢迎访问源码网(:----
    • 首页
    • 博客
    • 学院
    • 下载
    • 论坛
    • 影视
    • 发布源码
    • RSS
    • ITPig
    • 笑话网
    • 百家姓
    • 繁體中文

源码网 - 中国第一源码门户
选择镜像:网通镜像 - 电信主站
  • 首 页
  • 新闻动态
  • 网站运营
  • 网页制作
  • WEB开发
  • 编程开发
  • 图像媒体
  • 操作系统
  • 数据库
  • 服务器
热门搜索 优化 SEO 故事 cms IIS7 MySQL 个人 AdSense 主题推广 | 文章搜索: 高级搜索
会员登录/控制面版您的位置: 学院首页 >> 新闻动态 >> 互 联 网 >> 详细内容
 

推荐文章

  • 域名Business.com插标待售 估价3至4亿美元
  • 2007年中国行业网站百强名单
  • Internet 的50年口述历史
 
 

热点文章

  • 我们在一起:地震爱国赈灾Banner
  • 微软总部相中15岁网络奇才(图)
  • 百度李彦宏:五年后大家将很难看到Google
  • 关于安徽高考网关闭的通告
  • 谷歌收购265网址导航站
  • 大学生个人网站200万元被收购
  • cn域名每年1元——便宜
  • Google恶搞baidu之所感
  • 谷歌悄悄推出网址站:"网站导航"
  • 张朝阳:百度的技术人员搜狗看不上
  • 网易计划下月开始推广有道 与谷歌合作8月中止
  • 10月10日大限将至SP预演集体瘦身出逃
 
 

相关文章

  • Google发布Beta版Android SDK
  • Google发布AdSense for Feeds
  • PHP获取Google PR值源码
  • Google 与 Microsoft 的最佳面试题
  • Google收购一上线仅四个月的视频编辑网站
  • Google 和 Yahoo 披露部分合作细节
  • 快算24的算法
  • 谷歌软件精选(Google Pack)正式上线
  • Hitwise 最新数据显示 Google 已经主宰搜索市场
  • Google 发布开源加密方案 - KeyCzar
  • Google和雅虎推出“广告退出”机制
  • Google面临内部增长困境
 
 

百度搜索

 
 

VisualRank:Google图片搜索的PageRank算法

  • 阅览次数:
  • 文章来源: 速客
  • 原文作者:
  • 整理日期: 2008-04-28
  • 发表评论
  • 字体大小:
  • 小
  • 中
  • 大


众所周知,Google搜索引擎之所以能被世界认可,是因为它独特的PageRank算法能返回更准确的搜索结果。据Google官方介绍:


"PageRank技术:通过对由超过50,000万个变量和20亿个词汇组成的方程进行计算,PageRank能够对网页的重要性做出客观的评价。PageRank并不计算直接链接的数量,而是将从网页A指向网页B的链接解释为由网页A对网页B所投的一票。这样,PageRank会根据网页B所收到的投票数量来评估该页的重要性。


此外,PageRank还会评估每个投票网页的重要性,因为某些网页的投票被认为具有较高的价值,这样,它所链接的网页就能获得较高的价值。重要网页获得的PageRank(网页排名)较高,从而显示在搜索结果的顶部。Google技术使用网上反馈的综合信息来确定某个网页的重要性。搜索结果没有人工干预或操纵,这也是为什么Google会成为一个广受用户信赖、不受付费排名影响且公正客观的信息来源。"

可见PageRank是Google搜索引擎的根基所在。但PageRank一般只用在网页的搜索上,如果说到图片搜索,那它就显得无能为力了。原因很简单,因为图片和文字完全不同,Google可以用机器算法去读懂(尽管不是百分百)网页上的文字,但却不能读懂图片。现在的搜索引擎包括Google在内都是依靠分析图片的注释文字或周边的文字内容来猜测图片的内容,自然就无法做到和网页搜索那样的准确。去年7月Google的一项专利里描述了一种使爬虫能读懂图片及视频里的文本内容的方法,那将有可能使Google从根本上解决图片搜索问题,但同时那也显得有点太遥远了,并且带点科幻色彩。

据纽约时报的报道,在上周于北京举行的国际万维网会议上,Google的两名科学家Yushi Jing及Shumeet Baluja介绍了Google的一种新型算法,名为VisualRank。从名字便可知,VisualRank是一种综合了图像识别软件方法及衡量及对相似图像进行排序技术的算法,它可以说是图片搜索版本的PageRank。据Google介绍,VisualRank算法会首先应用于Google搜索引擎已完成分类的图片子集上,因为分析及比较图片需要耗费巨大的计算资源成本,一下子应用到所有图片上,那将是不切实际的事。

尽管我们不清楚Google已经对多少图片进行了分类,但Google指它集中精力研究了用户在Google产品搜索上所完成的2000个最常见的产品搜索查询,比如和热门电子产品iPod、Xbox等相关的查询,然后再将其排名系统及标准图片搜索结果里的前十个图片进行归类。负责图片搜索项目的Google团队有150位成员,他们创造了一种图片相关度的评分系统。Google声称基于这种技术,图片检索所返回的不相关图片能减少83%。

VisualRank听起来很强大,但Riya却并不认同。如果你还记得,Riya是一家专注于可视化搜索的公司,由于其图像识别技术强大,在05年就已经多次传出Google要买下它的消息。但后来Riya官方坚持不卖,于06年推出了Like.com,专注于可视化购物搜索业务。Riya的CEO认为Google的目标不切实际,因为他认为图片搜索是没有大规模解决方案的,应专注于小范围。同时,他也认为Google在图片搜索技术方面的研究动作过慢了。

尽管过了十年,但我们可以看到Google的图片搜索的确没有质的改进,它仍然只是利用老技术,依靠分析文字来猜测图片内容。因此你可以常常看到在进行Google搜索时,出现的图片结果有时是毫不相关的;即使是在Google News的新闻里,有时候新闻所配的图片也和新闻内容毫不相关。这些都是技术及算法的局限。不过相比上述Google遥远的专利,VisualRank还是挺值得期待的。不过Google刚开始只会把它应用于产品搜索上,然后再经过长时间的改进才有可能大范围应用。这样一来要看到有质的改进的Google图片搜索引擎,那恐怕也不会是短期内会发生的事了。

上一篇:PHP使用zlib扩展实现页面GZIP压缩输出
下一篇:构建支持Master/Slave读写分离的数据库操作类
  • 网友评论:
  • 查看所有评论
  • 我要发表评论
您的网名:
留言主题:
你要发表的内容:

 

关于本站 | 广告联系 | 版权声明 | 网站地图 | 发布软件 | 帮助中心 | 源码论坛

Copyright © 2005-2007 CodePub.Com  程序支持:木翼  滇ICP备05005971号