知识图谱的组合推荐算法研究(附件)

为了推荐一种高效的基于项目的专家组合集,本文提出了一种改进了的专家组合推荐算法。适用于普遍的专家组合推荐问题。这种改进的推荐算法主要是基于已经构建好的领域知识图谱,结合了相似思想和关联挖掘。对通过对37136条历史专家审查数据进行处理,首先使用FP-Growth得到概率逻辑数据制定知识图谱,再通过相似度算法排除差异项,提取与推荐内容相近项,然后提取专家并根据规则进行组合,根据关系知识设计了一种通过频繁项和置信度来评估组合的优异的方法。改进的推荐算法在保证了推荐的新鲜度的同时进一步提高了预测的准确度,在21个专家内选6个情况下,通过测试集的测试最终准确提高到70%。关键词 知识图谱,组合推荐,相似度,关联挖掘,评估
目 录
1 引言 1
1.1 课题背景 1
1.2 国内外研究综述 1
1.3 课题来源 3
2 需求分析 3
2.1 可行性分析 3
2.2 系统功能与业务分析 3
2.3 性能分析 4
3 关键问题的研究与解决 4
3.1 数据分析 5
3.2 关键技术 7
4 算法总体设计 9
4.1 专家关联挖掘 10
4.2 项目相似度计算 11
4.3 专家组合算法 13
4.4 专家组合评估算法 15
5 系统建模 19
5.1 过程层次建模 19
5.2 业务过程建模 19
5.3 类建模 20
5.4 活动建模 22
5.5 交互建模 23
6 系统设计 23
6.1 设计概述 23
6.2 总体架构 24
6.3 界面设计 25
6.4 数据库设计 26
6.5 接口设计 28
6.6 算法模块设计 32
7 算法部署与结果测试 33
7.1 算法部署 33
7.2 算法结果 33
7.3 实验分析 35
结 论 36
致 谢 37
 *好棒文|www.hbsrm.com +Q: ^351916072# 
考 文 献 38
附录A 用户操作手册 40
附录B 大学期间公开的发明专利 43
附录C 大学期间发表的论文 44
附录E 大学参与的项目 46
附录F 查重报告 47
引言
课题背景
研究者们热衷于设计个性化的推荐算法,并将针对某一领域的推荐算法应用于特定应用平台上,不断优化算法使得推荐模型能够满足应用系统和用户的需求。针对不同的应用平台,例如,电子商务,电影视频网站,音乐广播电台和社交媒体等,研究者们已经提出了一些经典的算法案例,例如众所周知的基于用户的协同过滤算法,在时间效率上偏差但效果优异的基于图的推荐算法,在电子商务平台有广泛应用的基于物品的推荐算法[1]。
在面对推荐系统中需要推荐一个组合问题的时候,研究者们会选择基于一些群体聚类、相似度、分类分析等,或者通过用户评分矩阵,语义分析等技术融入群组推荐系统中[2]。
如何发掘群组与项目关联性、群组个体之间的潜在关系,从而为群组推荐提供了价值性的关系知识,优化群组推荐算法为相关系统提供高效的知识服务和个性化[3]的工作分配方案。
国内外研究综述
人的大脑依赖于所学的知识进行思考,逻辑推理。与知识图谱相比,深度学习更多的是强调所学的技术和算法,其表现形式是对大数据的学习能力,在图像、语音等方向做感知,识别,判断的能力。而知识图谱是更集中于数据与知识的区别,能过提供更强大的推理能力,而推理可能是根据我们事先定义好的规则,可能基于我们数据当中的规范,且不一定要求是基于大数据,也可以是基于小数据去做各种各样的推理,体现形式更类似于有学识的AI,在强调聪明AI之外更注重于对知识的积累能帮助做思考、语言理解和推理[4]。在推荐中,知识图谱也有所应用,特别实在在数据稀疏,不平衡,或在缺乏解释的过程当中去做各种各样的解释和证明。
国外研究综述
自1945年Vannevar Bush在Atlantic中提出人的记忆是偏重关联的,启发了万维网之父Sir Tim BernersLee于1989年发表了文章Information Management:Apropsal,其观点主要是在开放的互联网环境中以“链接”为中心的系统更易生长和扩展,这一观点在之后被普遍接受并发展为当下的万维网。而随后语义网的出现体现了从链接文本到链接数据,进一步体现了事物数据之间的关联,而Web中有多种类型的事务且事物之间有多种类型的连接,这就孕育着现在的知识图谱[5],其前身就是语义网,知识图谱于2012年由Google首次提出并应用于其语义搜索,这使得连接的对象不再是文档而是对象,使得更加结构化更加组织完美,各种各样的知识图谱形态,有连接人的,人与其对应作品的或其工作单位,参与项目。Google知识图谱的出现使得搜索结果中体现实体语义关联,如检索某公司,从各种各样有关该公司结构化摘要信息中访问到其创建地址,母公司,产品,CEO等实体情况,这使得导航到的不仅仅是一个网页而是一个对象,且导航得到的目标对象与起始对象有非常明确的语义关系[6]。

图1.1 知识图谱发展图
Semantic Networks的推出是一种小数据时代知识表示的方法,主要用来做自然语言理解词与各种概念之间的依赖关系的系统建模,而“本体论”这一哲学概念被引入到AI领域用于刻画大众工人知识,Semantic Web的出现即超文本链接到语义链接[7],2006年Tim进一步突出我们不应该自顶向下的构建本身的知识,可以利用更多来源于兴起的社交网络上的数据和知识众包的力量来自底向上的构建知识库,并将很多知识开放出来而建立开放的数据之间的连接,2012年在各种各样的开放知识库相继成熟和推出之后他们的应用形成了井喷,Google看到这样的机遇之后将其搜索引擎进行了优化[8],包括各种体验的优化和一些排序算法的升级。其中涉及两个主要问题知识用什么来表示和知识库即如何形成一个知识数据库又高于一般的数据库,形成更好的推理和智能的数据库,即Knowledge Base[9]。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/wlw/449.html

好棒文