智能与分布计算实验室

一种基于主题相关度的网页排序算法

出版社:
  • 出版社:
  • 页数::221-224
  • 出版年:2001
摘要内容:

针对现有基于链接结构的 PageRank 算法的不足 ,提出了基于网页主题相关度的改进 PageRank 算法.通过分析网页内容 ,提取出网页中的链接及其对应的锚文本 ,建立网页链接库 ,利用向量空间模型(VSM)计算链接锚文本和网页内容的相关度 ,在此基础上实现离线计算改进后的 PageRank 算法.理论分析和仿真实验表明 ,改进的PageRank 算法使用户能方便地找到所需网页 ,提高了网页查询效率.

关键词:
  • 网页排序;主题相关度;链接分析;向量空间模型