向量相似度的求职推荐研究与应用(附件)
摘 要随着互联网技术的快速发展和大数据时代的到来,数据的重要性日益凸显,越发受到重视,如何在海量数据中获取自己所需的有用数据已经成为部分用户的需求。在大型招聘网站中,求职者如何在海量的招聘信息中使用有效的方法获取求职者所需信息成为一大难点,个性化推荐成为解决这一问题的有效方式。基于向量相似度的求职推荐研究与应用主要功能可以完成用户简历与招聘信息间的相似度之间的计算,通过计算结果进行职位推荐。基本的流程通过Scrapy框架爬取数据,利用数据挖掘技术对爬取招聘信息数据进行处理,通过余弦相似度算法对处理好的数据进行相似度计算并推荐结果,将数据结果用Echarts可视化工具进行展示。实现本设计功能在windows10的系统环境下,采用的开发工具为Pycharm,采用的编程语言为Python,可视化展示通过Echarts工具可视化。本设计可以实现对求职者的个性化职位推荐,从海量的求职数据中根据用户简历内容给求职者推荐适合求职者的职位,节约用户时间,对用户决策具有积极地意义。
目录
第一章 绪论 1
1.1 课题背景 1
1.2国内外研究现状 1
1.2.1 国内研究现状 1
1.2.2 国外研究现状 2
1.3 研究目的和意义 2
1.3.1研究目的 2
1.3.2研究意义 2
1.4 全文组织结构 2
第二章 python数据挖掘技术概述 4
2.1 python数据挖掘简介 4
2.2 数据预处理基本介绍 4
2.3 数据预处理内容及方法 5
第三章 网络爬虫介绍 6
3.1网络爬虫 6
3.2网络爬虫分类 6
3.3反爬虫概述 6
3.3.1反爬虫策略 7
3.4 scrapy爬虫框架 7
3.4.1 scrapy框架概述 7
3.4.2 scrapy框架原理 8
3.5 scrapy框架的使用步骤 8
3.5.1 scrapy框架的安装 8 < *好棒文|www.hbsrm.com +Q: ¥351916072$
br /> 3.5.2 scrapy项目创建 9
3.5.3 创建爬虫及爬虫运行 9
第四章 相似度分析及其基本算法 11
4.1 基于向量相似度算法概述 11
4.2 基于向量相似度的数据挖掘算法 11
第五章 数据可视化 14
5.1可视化概述 14
5.2 可视化工具简介 14
第六章 基于向量相似度的求职推荐实现 16
6.1 源数据的获取 16
6.2 获取数据的预处理 18
6.3 招聘信息数据分析 22
6.4 推荐结果 23
6.5 实现求职推荐结果的可视化 26
第七章 总结与展望 27
7.1总结 27
7.2 展望 27
参考文献 28
致谢 29
第一章 前言
课题背景
当今时代,互联网技术和信息技术的飞速发展和普及应用,人们生活日益丰富,随着新生行业的不断发展,传统行业不断的改造创新,产生大量的信息数据,数据呈爆发式增长,充斥着生活中的方方面面。海量信息的出现,给大部分用户带来了巨大困扰,大部分信息很难被用户整合利用,用户很难从复杂的数据中获取有用信息。所以不能获得有效信息将影响用户的生活、工作、人际交往等方面。因此,互联网技术的发展给人们带来了的很多的好处和优势,同时,从繁杂的数据获取有效数据对于用户来说同样也是挑战。例如,招聘方式的改变,网络发布招聘信息、投递简历的方式越来越受到大众欢迎。然而,利用招聘网站招聘人才,招聘网站上存在庞大的数据信息,当用户想拥有一个符合自己的期望职位时,就会花费大量时间在招聘网站上浏览职位信息,筛选出符合自己的一个或几个职位。目前的现有在线求职系统中,信息量过大很大程度上降低了求职者求职的求职效率。为了解决这一问题,推荐系统应运而生。部分学者针对目前的在线求职系统中的推荐功能提出了一些算法和模型,主要尝试通过相似度计算实现职位与求职者的匹配,以及通过用户交互历史来学习个人偏好,以提供个性化的推荐服务[1]。由于推荐技术的不断发展,它可以解决用户在海量信息中如何获取有效信息问题,并且已经被广泛地应用到各个领域。
1.2国内外研究现状
1.2.1 国内研究现状
现有推荐方法包括智能检索、简历匹配、用户相似性和定时推送等[2]。目前的个性化推荐技术有很多,采用向量相似度的推荐算法基础上,通过计算用户上传简历信息与招聘信息间文本的相似度大小,就可根据用户简历推荐职位[3]。对于不能充分捕捉句子的语义结构特征信息来计算现有的句子相似度的问题,采用字向量和LSTM (longshort term memory,长短期记忆)网络的句子相度计算方法就可以很好地解决这个问题。这种算法的优势在于提高句子间相似度准确性[4]。同时,Jaccard算法的研究和改进,提出计算句子相似度采用词向量的方式,这个算法明显提高了相似度计算的准确性[5]。如果想实现向长文本的文本分类算法,则需要采用基于概念向量空间的文本相似度计算方法[6]。根据句子集中的词语和差异词语相似度来分析计算句子相似度[7]。因此,关于招聘网站上的求职推荐,包含了求职岗位的具体信息,也有词语信息,也可采用基于向量相似度的算法根据求职者的简历信息为求职者推荐相应工作职位,提高求职者求职效率。
1.2.2 国外研究现状
推荐的系统能够满足用户多方面的需求。推荐系统在电子商务平台中扮演销售人员的角色,向用户推荐产品,帮助用户找到合适产品,协同过滤技术在推荐系统应用相当成熟[8]。同时,在国外,还将推荐用于学习方面,比如说。学习同伴推荐(LPR)是克服学习者信息负荷的有效解决方案之一[9]。不仅如此,推荐系统还被用于各大领域,发挥着不可估量的作用。判断两个文本的语义相似度可以通过计算两文本中概念向量的语义相似度来体现[10]。可以用于推荐职位、美食推荐,利用所获取的文字信息,计算文本之间的相似度给用户推荐相应职位或美食。
目录
第一章 绪论 1
1.1 课题背景 1
1.2国内外研究现状 1
1.2.1 国内研究现状 1
1.2.2 国外研究现状 2
1.3 研究目的和意义 2
1.3.1研究目的 2
1.3.2研究意义 2
1.4 全文组织结构 2
第二章 python数据挖掘技术概述 4
2.1 python数据挖掘简介 4
2.2 数据预处理基本介绍 4
2.3 数据预处理内容及方法 5
第三章 网络爬虫介绍 6
3.1网络爬虫 6
3.2网络爬虫分类 6
3.3反爬虫概述 6
3.3.1反爬虫策略 7
3.4 scrapy爬虫框架 7
3.4.1 scrapy框架概述 7
3.4.2 scrapy框架原理 8
3.5 scrapy框架的使用步骤 8
3.5.1 scrapy框架的安装 8 < *好棒文|www.hbsrm.com +Q: ¥351916072$
br /> 3.5.2 scrapy项目创建 9
3.5.3 创建爬虫及爬虫运行 9
第四章 相似度分析及其基本算法 11
4.1 基于向量相似度算法概述 11
4.2 基于向量相似度的数据挖掘算法 11
第五章 数据可视化 14
5.1可视化概述 14
5.2 可视化工具简介 14
第六章 基于向量相似度的求职推荐实现 16
6.1 源数据的获取 16
6.2 获取数据的预处理 18
6.3 招聘信息数据分析 22
6.4 推荐结果 23
6.5 实现求职推荐结果的可视化 26
第七章 总结与展望 27
7.1总结 27
7.2 展望 27
参考文献 28
致谢 29
第一章 前言
课题背景
当今时代,互联网技术和信息技术的飞速发展和普及应用,人们生活日益丰富,随着新生行业的不断发展,传统行业不断的改造创新,产生大量的信息数据,数据呈爆发式增长,充斥着生活中的方方面面。海量信息的出现,给大部分用户带来了巨大困扰,大部分信息很难被用户整合利用,用户很难从复杂的数据中获取有用信息。所以不能获得有效信息将影响用户的生活、工作、人际交往等方面。因此,互联网技术的发展给人们带来了的很多的好处和优势,同时,从繁杂的数据获取有效数据对于用户来说同样也是挑战。例如,招聘方式的改变,网络发布招聘信息、投递简历的方式越来越受到大众欢迎。然而,利用招聘网站招聘人才,招聘网站上存在庞大的数据信息,当用户想拥有一个符合自己的期望职位时,就会花费大量时间在招聘网站上浏览职位信息,筛选出符合自己的一个或几个职位。目前的现有在线求职系统中,信息量过大很大程度上降低了求职者求职的求职效率。为了解决这一问题,推荐系统应运而生。部分学者针对目前的在线求职系统中的推荐功能提出了一些算法和模型,主要尝试通过相似度计算实现职位与求职者的匹配,以及通过用户交互历史来学习个人偏好,以提供个性化的推荐服务[1]。由于推荐技术的不断发展,它可以解决用户在海量信息中如何获取有效信息问题,并且已经被广泛地应用到各个领域。
1.2国内外研究现状
1.2.1 国内研究现状
现有推荐方法包括智能检索、简历匹配、用户相似性和定时推送等[2]。目前的个性化推荐技术有很多,采用向量相似度的推荐算法基础上,通过计算用户上传简历信息与招聘信息间文本的相似度大小,就可根据用户简历推荐职位[3]。对于不能充分捕捉句子的语义结构特征信息来计算现有的句子相似度的问题,采用字向量和LSTM (longshort term memory,长短期记忆)网络的句子相度计算方法就可以很好地解决这个问题。这种算法的优势在于提高句子间相似度准确性[4]。同时,Jaccard算法的研究和改进,提出计算句子相似度采用词向量的方式,这个算法明显提高了相似度计算的准确性[5]。如果想实现向长文本的文本分类算法,则需要采用基于概念向量空间的文本相似度计算方法[6]。根据句子集中的词语和差异词语相似度来分析计算句子相似度[7]。因此,关于招聘网站上的求职推荐,包含了求职岗位的具体信息,也有词语信息,也可采用基于向量相似度的算法根据求职者的简历信息为求职者推荐相应工作职位,提高求职者求职效率。
1.2.2 国外研究现状
推荐的系统能够满足用户多方面的需求。推荐系统在电子商务平台中扮演销售人员的角色,向用户推荐产品,帮助用户找到合适产品,协同过滤技术在推荐系统应用相当成熟[8]。同时,在国外,还将推荐用于学习方面,比如说。学习同伴推荐(LPR)是克服学习者信息负荷的有效解决方案之一[9]。不仅如此,推荐系统还被用于各大领域,发挥着不可估量的作用。判断两个文本的语义相似度可以通过计算两文本中概念向量的语义相似度来体现[10]。可以用于推荐职位、美食推荐,利用所获取的文字信息,计算文本之间的相似度给用户推荐相应职位或美食。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/xxaq/270.html