验证旅游网站中的推荐系统算法【字数:14371】
摘 要全球互联网及其附属技术的快速发展已经成为最近一段时间来的热门话题,互联网及其附属技术已经极大地改变了各行各业的产业结构。但是,不断进步的电子信息技术,带来了一个不容忽视且日益严重的问题,那就是“信息过载”。随着时间的推进,“信息过载”已经越来越成为人们无法逃避的问题,这种问题已经开始严重影响人们的判断力,这对于信息的发送方和接受方都是一样的,这个问题已经发展到了不容忽视的程度,尤其是对于接受方而言,社会各界,尤其是计算机/互联网行业,都在寻求一种能够便捷地获取有用信息的途径。综上所述,能够按照用户个人喜好调整的信息推荐算法成为了信息技术领域的一个研究热点。本文阐述的系统是由JSP构建前端,数据库使用MySQL,使用的开发语言为java的可以针对用户个性进行提供旅游产品推荐服务的网站及其管理系统,本系统可以向用户推荐旅游景点信息,具有精准、高效的特性,同时也允许用户做出自由选择。系统主要包括前台(任何注册用户皆可访问)和后台(只有权限为管理员的用户才可访问)两部分,前台主要包括旅游网站首页模块、旅游网站登录/注册模块、旅游酒店模块、旅游景点模块、旅游线路推荐模块等功能模块;后台主要包括旅游线路的增/删/改功能、旅游城市的增/删/改功能、旅游酒店的增/删/改、旅游景点的增/删/改、旅游系统的增/删/改等。在完成系统所有部分的模块后,就对各个部分进行了多种测试,其结果均处于预期范围内,系统能够正常工作且符合预期。
Keywords: Tourism products; recommendation; collaborative filtering; Mahout; Java 目录
1 绪论 1
1.1 选题背景 1
1.2 课题研究意义 1
1.3 推荐系统研究综述 2
1.4 初步设计方法与实施方案 3
2 相关技术概述 4
2.1 基于协同过滤的推荐系统概述 4
2.2 开发环境简介 8
2.3 数据库简介 8
3 系统分析 10
3.1 系统可行性分析 10
3.1.1 经济可行性 10
3.1.2 技术可行性 10
3.1.3 运行可行性 10
*好棒文|www.hbsrm.com +Q: ^351916072*
/> 3.2 系统功能需求概述 10
3.3 主要业务流程分析 11
3.4 系统运行环境需求 13
4 系统设计 14
4.1 系统设计主要功能 14
4.2 数据库设计 14
4.2.1 ER图 15
4.2.2 数据表 16
4.2.3 数据库链接配置 18
5 详细设计与实现 19
5.1 基于协同过滤的旅游产品推荐 19
5.3 旅游景点的增/删/改功能 26
5.4 旅游线路的增/删/改功能 26
5.5 前台用户界面实现 27
6 系统测试 34
6.1 功能测试 34
6.2 可用性测试 34
6.3 性能测试 36
6.4 测试结果分析 36
本系统对社会人文的影响 37
结 论 38
参考文献 39
致 谢 41
1 绪论
1.1 选题背景
经年来网络上各类可供用户获取的资源在总量上已经发生了爆炸式的大规模增长,传统的信息检索技术已经显得有些落伍了,它们越来越无法高效、精准地完成任务了。自从90年代互联网新兴以来,网络上的各类信息正在以指数的级别不断增长,属于大数据的时代已经悄然来临。新的检索技术,需要在短时间内对巨量的数据进行处理,清除去其中无用的部分,然后把可能符合用户口味的信息推送出去。因此,近年来业界开始关注能够进行个性化定制的推荐服务,它首先搜集用于分析的数据,这些数据主要包括用户个人数据和用户在网络上的各种行动记录,收集到足够多的信息后便开始分析这些信息,推荐系统可以发现信息间的及其隐蔽、难以发现的规律,将其用于构建用户的兴趣模型,然后将符合模型的信息推荐给用户。
本网站通过其内含的推荐系统,可以收集用户在登陆旅游网站时留下的行动痕迹,得知用户对于旅游景点和其他相关信息的倾向性,将用户可能喜欢的信息推送给用户。
1.2 课题研究意义
近段时间以来互联网技术已经有了长足的进步,与其配套的网络应用也越发地广泛,这些因素使得互联网内部的信息总量有了爆炸式的增长,这种增长已经极大地改变了网络世界。如今,网络上已经出现了许多的静态网页,它们由超文本语言编写而成,同时还有许多动态网页使用了多种动态技术和数据库技术,人类大量的智力成果和智慧结晶都被凝聚在它们身上,这样的结果就是,网络上已经有大量的高价值信息可供访问者取用。然而,网上的信息并没有经过详细的分门别类,大部分网络信息都是杂乱无章的,无法直接使用,因此,许多学者开始研究:应该如何在庞大纷繁的数据海洋中发现隐藏的、有实用意义的信息,只有这样,互联网上的信息才能为人类社会的各方面的正常运转提供积极的作用。
数据挖掘的作用是:以全自动的方式,使用特定的算法来分析用户产生的各类信息和记录,根据分析结果得出具有归纳性的推导,然后从中总结出隐藏的规律,通过使用这些规律来估计用户的行为,促使企业对自身经营策略做出正确的调整。但因此说数据挖掘是以前没有过的新兴事物,这是不准确的。就像其他大多数互联网相关的技术,它的产生与发展,是有逻辑可循的,是有着其自身的必然性的。
近年来社会上各大公司都在快速扩展其数据库的规模,现有的数据库工具已经越来越过时了,现有的基础功能已经无法满足日益严苛的要求了,用户最关注的是那些可以从信息海洋中过滤出具有可用性的数据的工具,而数据挖掘的兴起则完全迎合了市场上的各方面需求,因此数据挖掘也成为互联网领域的热门话题和研究重点。
1.3 推荐系统研究综述
推荐系统是一种用来过滤所需信息的一种应用。它可以将用户可能喜欢的项目(可以是各类网络资讯)识别并收集起来,然后将其推送给用户。
近年来,电子商务的种类、规模都有了爆炸性的增长,这伴随着商品/服务的快速增加,用户很难再像以往那样通过手动查找来获取需要的资源,经常出现用户面对大量资源无法进行高效筛选的情况,为了解决这一问题,推荐系统应运而生,它根据用户的行动记录,总结出用户的个人兴趣,然后将用户可能感兴趣的项目推送给用户。推荐系统还可以引导用户发现自己的新的兴趣点,由于推荐系统可以进行个性化的推送服务,它还能和用户建立亲密的关系,让用户在实际使用时变得越来越依赖推荐。
推荐系统可分为三个模块:用户(被系统针对)建模、推荐对象(即被推送的产品/服务)建模、推荐算法。推荐系统检测用户模型里的用户个人记录和推荐对象模型里的项目的特质是否相符合,然后使用推荐算法筛选推荐对象,找到用户可能喜欢的东西并推荐给用户(注意:推荐系统不等于推荐算法)。下图为推荐系统的模型:
/
推荐系统有两种获取信息的方式:主动与被动。
主动获取信息的途径,有两种非常典型:搜索、导航。
Keywords: Tourism products; recommendation; collaborative filtering; Mahout; Java 目录
1 绪论 1
1.1 选题背景 1
1.2 课题研究意义 1
1.3 推荐系统研究综述 2
1.4 初步设计方法与实施方案 3
2 相关技术概述 4
2.1 基于协同过滤的推荐系统概述 4
2.2 开发环境简介 8
2.3 数据库简介 8
3 系统分析 10
3.1 系统可行性分析 10
3.1.1 经济可行性 10
3.1.2 技术可行性 10
3.1.3 运行可行性 10
*好棒文|www.hbsrm.com +Q: ^351916072*
/> 3.2 系统功能需求概述 10
3.3 主要业务流程分析 11
3.4 系统运行环境需求 13
4 系统设计 14
4.1 系统设计主要功能 14
4.2 数据库设计 14
4.2.1 ER图 15
4.2.2 数据表 16
4.2.3 数据库链接配置 18
5 详细设计与实现 19
5.1 基于协同过滤的旅游产品推荐 19
5.3 旅游景点的增/删/改功能 26
5.4 旅游线路的增/删/改功能 26
5.5 前台用户界面实现 27
6 系统测试 34
6.1 功能测试 34
6.2 可用性测试 34
6.3 性能测试 36
6.4 测试结果分析 36
本系统对社会人文的影响 37
结 论 38
参考文献 39
致 谢 41
1 绪论
1.1 选题背景
经年来网络上各类可供用户获取的资源在总量上已经发生了爆炸式的大规模增长,传统的信息检索技术已经显得有些落伍了,它们越来越无法高效、精准地完成任务了。自从90年代互联网新兴以来,网络上的各类信息正在以指数的级别不断增长,属于大数据的时代已经悄然来临。新的检索技术,需要在短时间内对巨量的数据进行处理,清除去其中无用的部分,然后把可能符合用户口味的信息推送出去。因此,近年来业界开始关注能够进行个性化定制的推荐服务,它首先搜集用于分析的数据,这些数据主要包括用户个人数据和用户在网络上的各种行动记录,收集到足够多的信息后便开始分析这些信息,推荐系统可以发现信息间的及其隐蔽、难以发现的规律,将其用于构建用户的兴趣模型,然后将符合模型的信息推荐给用户。
本网站通过其内含的推荐系统,可以收集用户在登陆旅游网站时留下的行动痕迹,得知用户对于旅游景点和其他相关信息的倾向性,将用户可能喜欢的信息推送给用户。
1.2 课题研究意义
近段时间以来互联网技术已经有了长足的进步,与其配套的网络应用也越发地广泛,这些因素使得互联网内部的信息总量有了爆炸式的增长,这种增长已经极大地改变了网络世界。如今,网络上已经出现了许多的静态网页,它们由超文本语言编写而成,同时还有许多动态网页使用了多种动态技术和数据库技术,人类大量的智力成果和智慧结晶都被凝聚在它们身上,这样的结果就是,网络上已经有大量的高价值信息可供访问者取用。然而,网上的信息并没有经过详细的分门别类,大部分网络信息都是杂乱无章的,无法直接使用,因此,许多学者开始研究:应该如何在庞大纷繁的数据海洋中发现隐藏的、有实用意义的信息,只有这样,互联网上的信息才能为人类社会的各方面的正常运转提供积极的作用。
数据挖掘的作用是:以全自动的方式,使用特定的算法来分析用户产生的各类信息和记录,根据分析结果得出具有归纳性的推导,然后从中总结出隐藏的规律,通过使用这些规律来估计用户的行为,促使企业对自身经营策略做出正确的调整。但因此说数据挖掘是以前没有过的新兴事物,这是不准确的。就像其他大多数互联网相关的技术,它的产生与发展,是有逻辑可循的,是有着其自身的必然性的。
近年来社会上各大公司都在快速扩展其数据库的规模,现有的数据库工具已经越来越过时了,现有的基础功能已经无法满足日益严苛的要求了,用户最关注的是那些可以从信息海洋中过滤出具有可用性的数据的工具,而数据挖掘的兴起则完全迎合了市场上的各方面需求,因此数据挖掘也成为互联网领域的热门话题和研究重点。
1.3 推荐系统研究综述
推荐系统是一种用来过滤所需信息的一种应用。它可以将用户可能喜欢的项目(可以是各类网络资讯)识别并收集起来,然后将其推送给用户。
近年来,电子商务的种类、规模都有了爆炸性的增长,这伴随着商品/服务的快速增加,用户很难再像以往那样通过手动查找来获取需要的资源,经常出现用户面对大量资源无法进行高效筛选的情况,为了解决这一问题,推荐系统应运而生,它根据用户的行动记录,总结出用户的个人兴趣,然后将用户可能感兴趣的项目推送给用户。推荐系统还可以引导用户发现自己的新的兴趣点,由于推荐系统可以进行个性化的推送服务,它还能和用户建立亲密的关系,让用户在实际使用时变得越来越依赖推荐。
推荐系统可分为三个模块:用户(被系统针对)建模、推荐对象(即被推送的产品/服务)建模、推荐算法。推荐系统检测用户模型里的用户个人记录和推荐对象模型里的项目的特质是否相符合,然后使用推荐算法筛选推荐对象,找到用户可能喜欢的东西并推荐给用户(注意:推荐系统不等于推荐算法)。下图为推荐系统的模型:
/
推荐系统有两种获取信息的方式:主动与被动。
主动获取信息的途径,有两种非常典型:搜索、导航。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/jsjkxyjs/530.html