智能与分布计算实验室

基于特征相关学习的网页信息提取方法

出版社:
  • 出版社:
  • 页数::1-4
  • 出版年:2007
摘要内容:

为了给出网页信息提取方法的数学形式化的理论分析 ,首先用一维空间域的信息函数来表示网页信息 ,并通过分析网页过滤过程 ,推导出网页信息过滤定理.然后通过分析网页的相似性 ,推导并提出一种基于相关过滤的网页特征信息的提取理论.在这个理论基础上 ,融合基于标识规则和基于内容规则的两种方法 ,提出一种基于特征相关学习的网页信息提取方法.导出的特征提取理论和实验结果表明这种方法具有较好的准确率.

关键词:
  • 信息提取; 特征学习;过滤;网页信息