高校成绩预测和班级学习氛围的研究

为了节省学校教师时间,更好的服务于学生和教师,提高教学质量与效率,通过预测算法和聚类算法开发高校学生成绩预测和班级学习氛围评估系统。以高校学生管理部门为服务对象,满足高校对学生进行学籍预警的应用需求,主要为了进一步提高的教学质量,提供高校管理人员了解学生学习及班级情况的服务。通过对现有的数据的整合、抽取、分析和总结,得出学生成绩情况及班级学习氛围的评测。基于Lasso回归预测算法和Pearson correlation-based similarity算法,对高校学生成绩进行预测。利用K-means聚类算法对高校班级学习氛围进行评估。在校人数为18894,班级数目为486;具体实验结果高校学生成绩预测的预测结果在班级成绩排名上下三名以内的学生人数占总人数的95.54%。关键词 成绩预测,Lasso回归,K均值聚类,Pearson correlation-based similarity,班级氛围
目 录
1 引言 1
1.1 课题背景 1
1.2 国内外研究综述 1
1.2.1 国外研究综述 1
1.2.2 国内研究综述 2
1.3 课题来源 3
2 关键问题的研究与解决 3
2.1 数据分析 3
2.1.1 数据格式和类型分析 3
2.1.2 高校学生成绩数据预测分析 4
2.1.3 班级学习氛围评估聚类数据分析 4
2.1.4 数据预测效果和班级聚类分析评估 4
2.2 关键技术 5
2.2.1 Lasso回归 5
2.2.2 Pearson correlationbased similarity算法 6
2.2.3 PCA降维算法 7
2.2.4 Kmeans聚类 7
3 系统总体设计 8
3.1 高校学生成绩预测 8
3.1.1 Lasso回归算法 8
3.1.2 Pearson correlationbased similarity算法 11
3.2 高校班级学习氛围评估算法 14
3.2.1 Kmeans算法 14
 *好棒文|www.hbsrm.com +Q: ^351916072^ 
/> 4 数据结构设计 17
4.1 数据来源预处理 17
4.1.1 原始数据来源与形式 17
4.1.2 待处理数据结构 18
4.2 高校学生成绩预测数据集 19
4.2.1 Lasso回归预测数据集 19
4.2.2 pearson correlationbased similarity算法数据集 20
4.3 高校班级学习氛围评估数据集 20
4.3.1 高校班级学习氛围评估预处理数据集 20
4.3.2 Kmeans算法数据集 20
4.4 系统结果数据集 21
4.4.1 高校学生成绩预测结果数据集 21
4.4.2 Kmeans分类结果数据集 22
5 系统模块设计 22 5.1 高校学生成绩预测模块设计 23
5.1.1 Lasso回归预测算法模块设计 23
5.1.2 pearson correlationbased similarity算法模块设计 24
5.1.3 Lasso和pearson correlationbased similarity合并模块设计 24
5.2 班级学习氛围评估模块 24
5.2.1 Kmeans聚类模块设计 24
5.2.2 Kmeans聚类结果分析 25
6 系统部署与结果测试 27
6.1 系统部署 27
6.2 系统结果 27
6.2.1 Lasso预测算法和Pearson correlationbased similarity算法结果测试 27
6.2.2 Kmeans算法结果测试 29
6.3 系统Web服务部署 30
结 论 33
致 谢 34
参 考 文 献 35
附录A 用户操作手册 37
附录B 大学期间公开的发明专利 43
附录C 大学期间完成的软件著作权 45
附录D 大学期间发表的论文 46
附录E 大学参与的项目 51
附录F 查重报告 52
引言
课题背景
信息的爆炸式增长,迎来了网络大数据的到来,使得数据挖掘技术逐步成为重要的研究领域,为教育领域提供了革命的动力[1]。如何通过数据挖掘技术从现有数据中预测出有价值信息,成为重要的研究内容[2]。数据挖掘中的数据预测技术,目前已经被许多公司所重视,谷歌、亚马逊、腾讯、淘宝等公司通过数据预测技术获得了可观的经济效益[3]。
学生主要是以学习为主,学生和教师最关心的就是学生的成绩。因此,学生的成绩和学生教师息息相关。本课题通过抽取、分析、总结在校生当前在相关应用系统中的数据,主要解决两个问题,其中一个是学生成绩的预测[4],另一个是班级学习氛围的研究。为了解决这两个问题,设计本课题。
现有针对高等院校学生的成绩预测并没有实现,只有对学生行为习惯的分析和研究,班级学习氛围的评估仅仅是通过老师的手动统计而得出的。
国内外研究综述
高校学生成绩预测和班级学习氛围评估系统是数据挖掘领域的应用[5]。数据挖掘就是指从收集而来的数据中根据预定的算法挖掘出有价值信息的过程,数据挖掘的实际工作是对大规模数据进行自动或半自动的分析,以提取过去未知的有价值的潜在信息[6]。全球数据挖掘技术的研究最繁荣的国家是美国,因此一直也来占着数据挖掘技术研究的领导地位。数据挖掘技术发展到目前,已经有越来越多公司加其中。到目前为止各个公司和研究机构已经研制了许多的技术成熟、实用性较高的数据挖掘技术软件[7]。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/wljs/348.html

好棒文