智能与分布计算实验室

一种基于语义匹配的 Web 信息提取方法研究

出版社:
  • 出版社:
  • 页数::141-143
  • 出版年:2006
摘要内容:

为了较好地解决信息过量难以消化、 汉语词的歧义划分、 Web 信息形式不一致并且难以辨识的问题, 文章提出了一种基于语义匹配的 Web 信息提取方法。该方法融合了网页分类、 汉语分词、 语义信息匹配方法, 并给出了一种义素相似度, 进而提出了一种基于语义的信息匹配方法来识别和提取网页信息项。基于这种 Web 信息提取方法的网上药品信息监管系统 Web-MIND能够提取出网上药品广告的信息项, 并具有较高的准确率。

关键词:
  • 信息提取;语义; 匹配