微软上周推出了一种名为BrowseRank的搜索引擎理论,和Google根据链接数量来评估网页重要程度的PageRank算法不同,这种算法理论将人的行为因素引入了评估体系。
微软研究人员在SIGIR大会上发布论文报告称:“一个网页访问的用户数越多,并且在页面上停留的时间越长,这个网页的重要性就越高。”该论文的作者包括微软亚洲研究院的Bin Gao、Tie-Yan Liu、Hang Li,南开大学的Ying Zhang,中国科学院的Zhiming Ma以及北京大学的Shuyuan He。
搜索对' 互联网的重要性不言而喻,首先,搜索引擎相当于一个具有高度影响力的中间人,它可以让用户找到自己想要找的网页。此外,搜索关键字对Google这样依赖搜索页面广告生存的企业非常重要。
不过在搜索引擎市场,微软落后于排名第一的Google以及第二的雅虎。微软正在努力赶超前两家公司,比如,微软曾试图收购雅虎,投资数十亿美元进行搜索研究,收购Powerset等。
不过Google方面称,PageRank只是Google考虑网页重要性的一个方面。Google发表声明说:“在我们评估一个网站排名的200多个因素中,PageRank只是其中一个因素。搜索是Google的核心,我们一直在对它进行改进。”
微软研究员说,PageRank具有一系列的缺点。首先,人们能够大量链接某个网页欺骗PageRank系统,另外,PageRank并不考虑用户停留在某个网站上的时间。
微软研究员们说,使用匿名的网站服务器与网页浏览器插件可以更好的监测用户的使用行为,他们说:“试验结果显示,BrowseRank在评估网页重要性,过滤作弊网页,提高搜索精确性方面能够取得比现有手段更好的效果,其中包括PageRank。”
该论文表示,研究人员按照合法渠道搜集了大量用户人群的数据信息。
目前,BrowseRank只是一个理论算法系统,距离实用还有很长的路要走。不过对微软来说,对这样一个研究团队提供资助远比收购一家公司来得划算。
Google在最近一个季度的收入报告中说:“如果微软或雅虎可以提供更好的网页搜索结果以及更精确的搜索广告,或者改善其广告产品与平台,我们在用户访问量或者规模方面将极大的衰退。”
雅虎改进搜索的努力主要有三:BOSS(搭建你自己的搜索服务),它能够让其它网站使用雅虎的搜索结果和相关搜索广告;SearchMonkey,它可以让网站管理者在搜索结果页面中插入一个迷你网页;Glue Pages,主要提供自助式的内容与相关搜索服务。
Google也在花大力气进行搜索技术开发,最大的研发团队在从事搜索技术研究,第二季度,Google升级搜索算法100多次。Google搜索质量部门的负责人Udi Manber说:“我的部门拥有上千台机器,其存储量以petabytes计。”