谷歌网页排名算法的奥秘与数学原理
网页排名的重要性与发展背景
在网络世界中,就如同在体育课上没人想最后一个被选入队伍一样,也没人希望自己的网页在搜索结果列表中排在末尾。因此,很多人希望自己的网页能像高中时渴望成为“最受欢迎”的人那样,在搜索中获得好的排名。
早期,传统的内容评分方式因网络规模的不断扩大和垃圾信息的干扰而逐渐力不从心。到了1998年,网页的流行度评分应运而生,它与传统内容评分相结合,为搜索引擎提供了更准确的搜索结果。流行度评分,也被称为重要性评分,它利用了网页超链接结构所构成的巨大图中的信息。基于网页超链接结构的模型被称为链接分析模型,自1998年以来,这些模型对网络搜索引擎的使用产生了巨大影响,如今的搜索工具能让用户在数秒内回答出十年前难以解答的问题。
1998年:链接分析模型的关键一年
1998年对于链接分析模型来说是忙碌的一年。在硅谷的IBM Almaden,年轻的科学家Jon Kleinberg(如今是康奈尔大学教授)正在进行一个名为HITS(Hypertext Induced Topic Search)的网络搜索引擎项目。他的算法利用网页的超链接结构来改善搜索结果,这在当时是一个创新的想法,因为大多数搜索引擎仅使用文本内容来返回相关文档。1998年1月,他在加利福尼亚州旧金山举行的第九届年度ACM - SIAM离散算法研讨会上展示了这项始于前一年的工作。
与此同时,在附近的斯坦福大学,两名计算机科学博士生Sergey Brin和Larry Page正在熬夜进行一个名为PageRank的类似项目。他们从1995年就开始合作开发网络搜索引擎,到1998年,他们将宿舍作为初创公司的办公室,这个公司后来发展成为了科技巨头