您好,欢迎来到筏尚旅游网。
搜索
您的当前位置:首页基于用户的协同过滤推荐算法研究及应用

基于用户的协同过滤推荐算法研究及应用

来源:筏尚旅游网
the Application of Computer Technology·计算机技术应用 基于用户的协同过滤推荐算法研究及应用 文/楚扬杰李珊 随着互联网技术飞速发展, 信息过载问题日益严重,对个性 化推荐系统的研究已成必然趋势。 为了提高传统协同过滤算法的准 确性,本文提出基于人口统计与 惩罚函数的协同过滤算法,先引 入惩罚函数缓解传统推荐算法的 数据稀疏性问题,再引入人口统 计信息来进一步减少数据稀疏性 问题对预测结果带来的影响,从 而提高预测的准确性。实验验证 表明,提出的改进算法能有效提 ∑l = 0) 1+— —————————一 (\ v=l { ≠0), / ’ y a{ ≠Ovap≠o1 k=l 公式【1) 当用户共同评分项目数量极少时,如果 继续用传统的相似度计算方法计算用户间相似0.7 度,这样用少量的数据样本替代整体样本统计 :=;;,, ::::H 特性,那么会造成计算的相似度无法反应出用 l。 户间的真实相似性。将惩罚函数引入传统相似 度的计算中,对共同评分项目极少情况下的相 似度计算进行平滑,从而降低过度估计带来的 影响。 一~ 一 ” : ,4 襄。m 。—————一.~. 一 嚣 … 。 高协同过滤算法预测的准确率。 一 蜜黢敬教 【关键词】推荐系统协同过滤算法人口统计 惩罚函数 4改进的基于用户的协同过滤算法 本文改进的基于用户的协同过滤算法, 图1:实验结果 6结束语 本文在传统的基于用户的协同过滤算法 上,使用惩罚函数来缓解共同评价过少情况 在平滑共同评价的协同过滤算法基础上,进一 步考虑人口统计相似度,来减少用户知识背景 1引言 下,用少量的样本数据代替整个数据的统计特 度计算公式(1)。先使用传统的协同过滤算 性使相似度的计算值与实际值出现较大偏差的 经过近二十年的研究,个性化推荐系统 法找到基于用户的pearson相似度,在此基础 问题,从而改进传统的协同过滤算法。在此基 己经建立了一套比较完备的理论依据和框架, 上利用惩罚函数计算出改进的pearson相似度; 础上,进一步分析改算法存在的缺点,提出同 然后进一步比较平滑共同评价的相似度与人口 统计相似度,从而提高预测的准确性。 时使用基于人口统计的协同过滤算法。使用级 差异对推荐结果带来的影响,得到融合的相似 在各领域的实际应用中也取得了一定的成功, 并且个性化推荐系统也已成为未来互联网发展 联式的基于人口统计与平滑共同评价的协同过 在得到目标用户i的相似集u(i)后,计算 中极其重要的组成部分。但是,伴随着互联网 滤算法,找到新的融合相似度。这样在为目标 应用发展的多样化,各种新的应用形式层出不 用户i对项目11的预测评分P 。这样得到的 用户预测时,既考虑了用户评价过少而引起的 穷,互联网用户和信息的规模急剧增加,推荐 预测评分既考虑了用户的共同评价问题,又融 过度估算的情况,又为用户找到了背景知识相 系统的发展将面临新的挑战,传统推荐系统中 合了用户的人口统计信息。 似的用户的喜好,有效提高了预测的准确度。 没有考虑和重视的问题也正影响这推荐系统的 进一步发展和应用。目前,个性化推荐系统面 临的问题主要是稀疏性问题。本文旨在针对现 有协同过滤推荐算法由于数据稀疏性造成的准 5实验结果与分析 为了验证改进的协同过滤算法的有效性, 实验在Moivelens数据集上进行,验证了本文 提出的改进的推荐算法的预测结果。 使用明尼苏达大学GroupLens研究小组提供 参考文献 确度低的现象,对传统的协同过滤推荐系统的 的Moivelens数据集对该算法进行实证分析, [1】Yi—Fan W U,Wang H R.Co1 1aborat ive 推荐算法进行改进。 采用平均绝对误差(MAE)来衡量推荐结果 fiit e ring aI g0rithm U sing U ser 2基于人口统计的协同过滤算法 的好坏。平均绝对误差通过计算预测的用户评 分与实际的用户评分之间的偏差度量预测准确 b a c k g r o un d i11f 0 r m at i 0n[J】. Joulrna1 0f Computer ApP1i cati 0  基于人口统计的协同过滤推荐算法相对 性,MAE越小,推荐质量越高。于其他协同过滤算法来讲更容易实现。基于人 性特征来计算用户相似度,不依赖用户.项目 评分矩阵。因此,基于人口统计的协同过滤推 ns,2009,28(28):2972-2974. 实验在整个数据集中随机抽取80%的数 实验的测试集。在实验的训练集上分别通过基 于用户的协同过滤推荐算法和基于人口统计与 【2】Re sni ck P,Vsri an HR.Recommonder sY st em s[J】.Communi Cation s of the ACM,1 997,40(3):56-58. 口统计的协同过滤推荐算法利用用户的人口属 据作为实验的训练集,剩下的20%数据作为 荐算法可以避免冷启动问题和数据稀疏性问 平滑头同评价的协同过滤算法计算 得到针对 作者简介 题。虽然基于人口统计的协同过滤推荐算法可 每个用户的电影预测评分。在实验测试集中算 楚扬杰(1 969-),男,现为武汉理工大学副教授、 以解决传统协同过滤推荐算法的两大难题,但 计选取100个用户,进行算法的准确性测试, 硕士生导师。研究方向为复杂网络理论与供应 是如何准确的获得用户的人口统计信息是该算 使用平均绝对误差MAE来评价,实验结果见 链管理、系统控制及优化。 法的一大难题。大量的实验数据表明,单独使 图1。 李珊(1990一),女,现为武汉理工大学硕士 实验结果表明,比起传统的基于用户的协 研究生在读。主要研究方向为推荐算法。 的协同过滤推荐算法来讲,推荐效果并没有明 同过滤算法,改进的协同过滤算法的平均绝对 用基于人口统计的协同过滤推荐算法,较传统 显的改普。 3基于惩罚函数的相似度平滑算法 误差MAE明显降低。说明改进的协同过滤算 作者单位 法明显好于传统的基于用户的协同过滤算法。 武汉理工大学湖北省武汉市430000 Electronic Technology&Software Engineering电子技术与软件工程·177 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- efsc.cn 版权所有 赣ICP备2024042792号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务