类亚马逊的图书推荐系统(源码)

随着互联网经济与信息技术的快速发展,人们从信息匮乏的时代转身步入信息过载的时代。面对爆炸式的图书信息的增长,人们无法快速准确的找到所需要的优质图书,电商网站也无法高效、准确的掌握客户需求,就这样推荐系统诞生了。本文是实现基于物品的协同过滤图书推荐系统,帮助人们快速找到自己需要的图书。本文首先对亚马逊网站的推荐系统算法进行阐述,并且分析对比另外几种推荐算法,重点阐述了基于物品的协同过滤算法的优缺点,通过设计一个图书销售网站实现算法。本系统功能模块具体划分为用户实现的功能模块、管理员实现的功能模块和系统的图书推荐模块,图书推荐模块采用mahout来计算出与用户相似度较高的图书信息推荐给用。最后采用eclipse开发平台和MySQL数据库实现系统。关键词 电子商务,推荐系统,ItemCF,Mahout最开始的传统搜索算法只是通过用户搜索的关键字,利用用户输入的关键字的进行匹配,从而的到可以向用户推荐的可以认为是准确的相关商品内容,但是往往有时,对于自己的真实需求,有时用户也不能十分确定自己想要购买什么,因此如果仅仅通过用户搜索的关键字,根据关键字匹配出关联规则较高的商品,可能不符合用户的需求。这对如今这些有这庞大的商品数量的电子商务网站而言,这种需求的不确定性可能导致降低用户的使用体验,这对这些网站的影响是致命[2-6]。如果电商系统能拥有个性化的推荐功能,在用户的搜索结果中加入一些用户可能真正感兴趣的商品信息,这样就会对推送给用户搜索结果进行适当的修正,就可以提高用户的使用好感度和增加线上浏览量,从而提高电商网站的收入。
目 录
1 引言 1
1.1 课题产生的背景及意义 1
1.2 推荐系统研究现状 1
2 相关理论技术及工具 2
2.1 推荐系统算法及比较 2
2.2 实现使用的环境工具及技术 4
3 系统设计 5
3.1 系统概述 5
3.2 数据库设计 6
3.3 详细设计 9
4 系统实现 10
4.1 系统概述 10
4.2 数据库和Java Web的连接 11
4.3 登录模块 12
4.4 图书管理模块 *好棒文|www.hbsrm.com +Q: ¥351916072¥ 
13
4.5 图书列表界面 15
4.6 购买模块 17
4.7 图书评分模块 18
4.8 图书推荐模块 19
5 系统测试 21
5.1 测试目的 21
5.2 测试内容 21
5.3 测试结果 22
5.4 测试结果分析 23
结 论 24
致 谢 25
参 考 文 献 26
1 引言
1.1 课题产生的背景及意义
近年来,随着图书数量的快速增加,人们无法快速准确的找到相关的优质书籍。虽然可以从多个方面获取资讯,如朋友的意见,但用户获取的准确性还值得怀疑,因此个性化推荐系统的雏形就此诞生。随着互联网经济的快速发展,大量电子商务网站使用大数据和人工智能方面的技术,如推荐系统。推荐系统可以通过分析用户的历史数据来推荐相关书籍,推荐系统的优点是显而易见的,众所周知亚马逊使用推荐算法为他们增加了近35%的收益[1]。
最开始的传统搜索算法只是通过用户搜索的关键字,利用用户输入的关键字的进行匹配,从而的到可以向用户推荐的可以认为是准确的相关商品内容,但是往往有时,对于自己的真实需求,有时用户也不能十分确定自己想要购买什么,因此如果仅仅通过用户搜索的关键字,根据关键字匹配出关联规则较高的商品,可能不符合用户的需求。这对如今这些有这庞大的商品数量的电子商务网站而言,这种需求的不确定性可能导致降低用户的使用体验,这对这些网站的影响是致命[26]。如果电商系统能拥有个性化的推荐功能,在用户的搜索结果中加入一些用户可能真正感兴趣的商品信息,这样就会对推送给用户搜索结果进行适当的修正,就可以提高用户的使用好感度和增加线上浏览量,从而提高电商网站的收入。
随着图书数量的增长,寻找相关优质书籍已经成为人们的一个问题。而图书推荐系统作为推荐系统应用的一种,是研究推荐算法应用的很好的一种方式。本文拟使用现如今各类开源技术,用来解决传统电子商务网站的一些问题,如分布式数据处理等。通过这样的方式,构建一个全新的电子商务网站,为用户推荐优质的商品信息,提高用户商品选择的多样性和优质性,增加电子商务网站的线上流量,为电子商务网站营造更多的收益。这样的推荐系统的应用愈加显得重要,这就构成了研究本课题的必要性。
1.2 推荐系统研究现状
推荐算法首先在电子商务网站取得一定的成功,得到较好的社会反响,后来被各个行业所追捧。协同过滤通过收集用户显式的购物记录或隐式的浏览记录来计算用户购买商品之间的相似程度,试图从中找出与目标用户具有相似或相同爱好的用户集,这里简称为邻居用户集,最后用于邻居用户的用户评价信息作为选取目标用户推荐项目或内容的参考依据[6]。但如今的推荐网站系统框架设计愈加庞大,加载过多的功能,太多不同的商品类目及海量增长的用户数量,传统的协同过滤算法的处理性不能满足如今这种需求。
自从个性化推荐功能在上世纪90年代被提出后,国外大量的研究团队开始了这课题的研究,其中不乏很多国外有名的大学,还有一些众所周知的使用推荐系统的应用,比如MovieLens、Yahoo、Netflix,这些应用都有使用协同过滤算法[7,8]。
国内推荐系统研究起步比较晚,和国外最新技术有近十年的差距。但近年国内燃起了推荐算法研究的热潮,以电子商务领域为首的许多公司投入大量物力和人力。随着这种火热的氛围,国内在推荐系统领域的研究也逐渐深入,应用也趋于成熟。纵观国内的电子商务网站,天猫、京东、当当网和豆瓣网等都有自己的个性化推荐系统。其中有单独采用的协同过滤算法的应用,如豆瓣网,此外同样采用改推荐算法的还有亚马逊的图书推荐系统。同样也有用混合基于关联规则和基于内容的协同过滤的这两种体检算法混合型算法搭建推荐系统的,如京东网和当当网。
2 相关理论技术及工具
推荐系统的定义是:“理解用户需求和爱好的基础上,它试图帮助用户决定选择何种商品或内容作为购买目标,模拟现实生活中销售人员协助用户完成购物过程” [9]。根据推荐系统算法的差异可把推荐系统分为如下几种类:基于内容的推荐系统、协同过滤推荐系统以及混合推荐系统等,其中协同过滤推荐系统是现阶段各大公司广泛应用的推荐系统算法。
2.1 推荐系统算法及比较
推荐算法可以分为两类:基于内容的推荐算法(ContentBased Recommendation)和基于内容的推荐算法(ContentBased Recommendation),此外还有很对分类的方式[9] 。基于内容的推荐算法是最早被使用的推荐方法,它根据用户过去喜欢的产品,为用户推荐和他过去喜欢的产品相似的产品,不需要太复杂的分析方法,推荐质量较高,但内容提取算法复杂,处理复杂结构对象难度比较大[1012]。例如亚马逊的图书推荐系统可以为用户推荐之前喜欢的人工智能相关的书籍。CF是目前最常见的推荐方法,很多大学和科研机构对其深入研究,需要的算法比较简单,个性化程度较高,并且可以处理复杂对象的特点,只需要对用户的特征以及购物评价记录进行分析,根据用户的特征分析其购买兴趣及个性化商品需求[13]。CF推荐算法又分为基于用户的协同过滤算法(User CollaborationFilter)和基于物品的协同过滤算法(Item CollaborationFilter),分别简称为userCF和itemCF。亚马逊使用的图书推荐算法就是itemCF,但又在其上进行扩展,这就是所谓的物品到物品的协同过滤算法(ItemtoItem Collaborative Filtering)。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/jsjkxyjs/1134.html

好棒文