基于PageRank的科技文推荐系统

更新时间:2024-03-16 作者:用户投稿原创标记本站原创 点赞:18071 浏览:81182

【摘 要】科技论文的数量正在呈爆炸式增长,高效的论文推荐系统将为科技工作者节约大量搜寻相关论文的时间,并为之提供观点新颖的高质量论文.协同过滤系统与内容过滤系统等算法已经广泛应用在电子商务和社交网络等领域,并取得了良好的效果;而基于网络结构的PageRank排名算法在web信息检索领域也被广泛采用.为了研究将以上算法的应用拓展到科技论文推荐系统,本文选取了CiteSeer数据集中的1万篇科技论文作为实验数据集,将PageRank算法与协同过滤系统和内容过滤系统等算法有效结合,研究基于PageRank的科技论文推荐系统.实验结果表明通过与PageRank合并后推荐系统可有效提高科技论文推荐系统的命中率,排名以及有效命中率.


【关 键 词】PageRank;论文推荐系统;引证网络;网络挖掘

随着信息科技的迅猛发展以及全球科技工作者数量的增加,科技论文的数量出现了爆炸式增长.在未来10年中,将有超过500万篇科技论文会发表在各类刊物上[1].

传统的科技论文检索系统呈献的是“千人一面”的分类体系,检索结果也是仅仅按照关键字的相关度进行排序.为了克服传统论文检索系统的弊端,个性化论文推荐系统的研究迫在眉睫.

本文选取了CiteSeer数据集[4]上的1万篇论文进行实验,分别采用了协同过滤系统和内容过滤系统等经典推荐算法,以及将PageRank排名算法[2]与之相结合的推荐算法进行推荐实验,结果表明,基于PageRank的推荐系统能够推荐引证网络中具有高PageRank值的论文,并且能有效提高推荐的命中率,排名以及有效命中率.

1.相关工作