基于协同过滤的考研资料推荐系统的设计与开发文献综述
2022-07-25 21:31:38
附页 文献综述
随着互联网的快速发展,网络上的信息量也呈现出井喷式的增长,在这种情况下,用户需要在海量的信息中寻找所需要的信息就显得尤为复杂,浏览大量无关的信息过程无疑会使淹没在信息过载问题中的用户不断流失,为了解决这些问题,个性化推荐系统应运而生。伴随着这几年考研人数的快速增长,考研资料的繁多,考研资料的推荐系统的设计开发应当得到重视,本文将对于学习资料推荐系统的相关研究和推荐算法的发展进行介绍。
1相关概念介绍
互联网的出现和普及给用户带来了大量的信息,满足了用户在信息时代对信息的需求,但随着网络的迅速发展而带来的网上信息量的大幅增长,使得用户在面对大量信息时无法从中获得对自己真正有用的那部分信息,对信息的使用效率反而降低了,这就是所谓的信息超载(information overload)问题。目前,针对信息超载问题的解决办法之一是以搜索引擎为代表信息检索系统,但使用搜索引擎的用户在使用同一个关键字搜索信息时,得到的结果是相同的[1]。解决信息超载问题另外一个非常有潜力的办法是个性化推荐系统,它是根据用户的信息需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户的个性化信息推荐系统。推荐系统的定义有不少,但被广泛接受的推荐系统的概念和定义是Resnick和Varian在1997年给出的:“它是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程” [2]。
2学习资料推荐系统的相关研究
随着互联网的快速发展,通过互联网学习的机会也越来越多,涌现了很多图书商城,其中当当网的书籍推荐系统是在国内非常有名的,还有一些网上数字图书馆,其中Kingbase-DL数字图书馆个性化系统是由中国人民大学金仓信息技术有限公司开发的,该系统依据用户兴趣建模,完成图书学习资料的推荐,Anand和Kumari设计了一款使用结合基于分类的用户的协同过滤和关联规则的组合推荐的图书馆系统,向在校大学生推荐图书[3]。Tewari A S和Barman A G则结合现代最重要的信息来源之一,社交网络,提出了一种图书推荐系统,该系统从目标用户的可信任朋友的协作中生成推荐,并使用关联规则挖掘来捕获网络中用户的当前阅读趋势[4]。然而,与学习资料或者学习资源推荐的相关文献却少之又少。Chan NN 等人提出了一种结合了三种推荐技术的方法:基于内容的过滤,单词语义相似性和页面排名来进行资源推荐,基于内容的过滤应用于过滤与用户配置文件类似的语法学习资源,应用单词语义相似度来巩固基于内容的过滤和单词语义,页面排名被用来根据其与他人的关系来识别每个资源的重要性[5]。章伟等人[6]通过传统的协同过滤算法建立了个性化学习资源推荐系统,但并没有改善协同过滤技术带来的稀疏性和冷启动影响带来的推荐质量问题。王永固等人[7]通过在传统的协同过滤基础上加入了对用户行为的追踪,即通过对于用户的学习行为进行评分加权来引入隐性评分机制。李娜等人[8]运用了组合推荐方法,将基于内容的推荐算法和基于协同过滤的算法进行结合,通过基于内容的推荐算法来有效地解决“新用户”的“冷启动”问题,而协同过滤算法也可以避免了对于已经学习过的内容的重复推荐。李保强[9]综合运用知识本体表达、机器学习和数据挖掘等技术,建构学习者、学习资源和知识本体三者之间的关联矩阵,通过协同过滤技术来为用户匹配更精确的非结构化的学习资源。刘志勇[10]提出一种基于语义网的学习资源推荐系统,先根据用户评价和浏览行为得到用户感兴趣的学习资源集合与核心概念集合,再计算不同于用户的以上两集合之间的相似度,综合该两个集合的相似度值来决定用户间的相似度,再进行推荐,此方法也在一定程度上有效的改善了推荐效果。
3个性化推荐算法介绍
为了产生精确的推荐,保证推荐系统的实时性要求,研究者提出了各种不同的推荐算法,如协同过滤推荐系统、基于项目的协同过滤推荐、上下文感知推荐系统、Bayesian 网络技术、聚类技术、关联规则技术、基于图的技术以及矩阵分解技术等。
传统的协同过滤推荐通过用户的最近邻居产生最终的推荐,基于项目的协同过滤推荐首先计算项目之间的相关性,然后通过用户对相关项目的评分预测用户对未评分项目的评分。虽然协同过滤是应用最为广泛的方法,但方法中的稀疏数据和冷启动用户往往是提供高质量建议的障碍。为了解决这些问题,邓爱林等人[11]提出一种基于项目评分预测的推荐方法。Yildirim H和Krishnamoorthy MS提出一种面向项目的算法Random Walk Recommender,它根据项目之间的相似性和模型的有限长度随机游动来推断项目之间的转换概率,以计算预测,该方法能够在稀疏数据情况下增强相似矩阵[12]。孙光福等人[13]提出了一种基于时序消费行为的最近邻建模方法,通过构建基于时间序列的消费网络,获取用户(产品)的相互影响关系,可以准确识别对当前用户(产品)影响最大的邻居集合。吕苗等人[14]提出一种基于情境化用户偏好的协同过滤推荐模型,首先在模型中采用信息熵理论分析不同情境对用户偏好产生影响的重要程度,并结合用户-商品评分和用户对商品属性的偏好来搜索近邻用户,在此基础上,将情境重要度的权重引入到协同过滤推荐的生成过程中进而产生推荐结果,提高了近邻搜索的质量。针对协同过滤中的冷启动问题,于洪等人[15]结合项目属性和用户评价时间信息提出CUTATime个性化推荐算法,利用项目属性和用户评价时间信息弥补了新项目开始加入时不存在评分和标签信息的缺陷,有效地解决了新项目冷启动问题。
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。