竞赛信息大数据存储解决方案研究与设计

多年来现代体育运动蓬勃发展,而从中产生的各类竞赛信息也作为珍贵资料被保留下来,然而,如此多的数据分属不同的运动会,并且,不同的项目之间,其存储没有统一性,若想对这些数据进行查询、统计、分析等操作都不易实现。并且随着更多赛会的举办,数据量将爆炸式增长,如何有效地存储这些大数据,使之真正起到应有的作用,是本论文主要研究的问题。在本论文中,首先对项目进行需求调研,确定本存储方案设计所要达到的目标,即能够统一存储至今以来所有的全运会竞赛信息数据,并能通过简单地操作进行查询和统计。其次,对现有的大数据存储方案进行分析,结合本论文中存储方案设计的原则与要求,选择合适的存储方案,即数据仓库解决方案。根据选择的方案,提出具体的解决思路:针对全运会的赛事信息进行分析,对该运动会的所有项目,找到所需要的信息,并根据不同项目之间的相似性进行分类,按照关系数据库的设计方法,设计统一的存储模型,满足该类所有项目的存储。并借助eclipse和SQL Server 2008作为开发工具,实现该数据库的物理设计。最后通过历史数据的导入测试验证了设计模型的合理性,并通过简单地数据统计验证设计模型的可用性。论文主要根据所选择的设计原则对竞赛项目进行了详细的分析、分类,并按照各类的特征进行具体的模型设计,通过验证,所设计的模型能够满足目前所有的竞赛信息的存储,并能够通过数据库操作进行高效的查询和统计分析。
目 录
第1章 绪论 1
1.1 课题背景及意义 1
1.2 课题研究内容 2
1.3 主要技术简介 2
1.3.1 数据库设计技术 2
1.3.2 JDBC技术 3
1.4 开发工具简述 4
1.4.1 Eclipse简述 4
1.4.2 SQL Server 2008简述 4
第2章 竞赛信息大数据存储需求分析 7
2.1 业务需求 7
2.2 功能需求 7
2.3 数据需求 8
第3章 竞赛信息大数据存储解决方案设计 11
3.1 设计原则 11
3.2 方案对比与选择 11
3.3 设计思想 12
3.4 竞赛项目分类 13<
 *好棒文|www.hbsrm.com +Q: ^3^5`1^9`1^6^0`7^2# 
br /> 3.5 存储结构设计 15
3.5.1 计时类 15
3.5.2 打分类 17
3.5.3 距离重量类 19
3.5.4 积分类 21
3.5.5 对抗类 23
3.5.6 全能统计 26
第4章 竞赛信息大数据存储模型设计与实现 29
4.1 数据库的概念设计 29
4.2 数据库平台选择 33
4.3 数据表逻辑结构设计 34
4.3.1 业务无关型数据表 34
4.3.2 业务相关型数据表 36
第5章 竞赛信息大数据存储模型应用与分析 45
5.1 原始数据报表整理 45
5.2 数据整理 46
5.3 应用验证 46
5.3.1 存储验证 46
5.3.2 查询验证 47
5.3.3 统计验证 48
5.3.4 数据挖掘应用 50
5.4 结果分析 54
第6章 总结与展望 55
6.1 总结 55
6.2 展望 56
致谢 57
参考文献 59
科技文献翻译 60
1. 英文原文 60
2. 中文译文 69
第1章 绪论
1.1 课题背景及意义
多年来现代体育运动蓬勃发展,国内外各类体育赛事鳞次栉比。伴随着现代体育“更快”、“更高”、“更强”的要求,竞赛信息系统作为体育竞赛的重要技术支撑,在各项赛事中起着不可替代的作用,越来越多的信息被数据化,而从中产生的各类竞赛信息也作为珍贵资料被保留下来,随着时间的推移,对这些海量积累的数据的有效管理和应用提出了更高的要求,然而,由于这些数据分别属于不同的赛会,并且随着更多赛会的举办,数据量将爆炸式增长,如何有效地存储这些大数据,使之真正起到应有的作用,是体育信息行业面临的新问题。
本课题是在这样的背景下产生的,要求针对体育竞赛大数据应用的需求,研究其存储结构与方式,提出解决方案。
现有的运动会管理系统对于赛事成绩的管理还处于非常零散的状况,以全国运动会为例,历届赛会共设置31个大项,350个小项,每一个项目又分为不同的阶段,根据比赛规则的不同,所有项目的成绩结构甚至于同一项目的不同阶段,都有所不同。例如,在自行车大项中,就包含了9个子项,而在这九个子项中,除了个人全能中的计分赛外,均是以时间的长短来进行排名,然而计分赛却是按规则得分。而在射箭项目中,排名赛是积分类型,可是到了淘汰赛,其比赛规则却更趋近于对抗类。因此,想要将所有的信息统一管理,必须对所有的项目进行分析,找到有用的信息,按照其结构进行分类,针对每一类的数据,可以采用相同的方法进行操作。
在当前信息爆炸式的增长与数据处理技术不断变革的今天,数据的存储空间已不再紧张,以前看似无关紧要的数据能发挥意想不到的作用。当把数据进行规范的处理后,就能很好地进行分析运用。谷歌的流感监测系统就是大数据的典型运用。
大数据在体育信息体统中的运用也已不再陌生,美国目前大约已有20支NBA球队,使用由IBM公司开发的数据挖掘应用软件Advanced Scout系统来优化他们的战术组合。教练通过对球员及赛场采集的大量信息,通过数据分析来临场决定替换球员。教练员可以在家里或在工作途中运用此工具对储存在NBA中心服务器上的数据进行挖掘。在系统中,每场比赛的时间都按得分、抢断、助攻、失误等等指标被统计分析,且时间标记让教练员方便借助回放和定位NBA比赛的录影片段来帮助理解统计结果的含义。通过挖掘数据背后的含义,来制定每场比赛的排兵布阵,以及战术打法。
而在这一切的背后,都必须有合理的存储结构为其服务才能达到最好的分析结果,因此,对运动会的数据进行分类重新设计存储结构是十分必要的。
1.2 课题研究内容
体育竞赛信息大数据存储解决方案设计主要研究内容为分析比较现有的大数据存储解决方案,并结合现有的条件选择合适的方案,提出竞赛信息大数据存储的具体思路:目前,数据挖掘的主要方法为从传统的关系数据库中提取数据,为了达到理想的分析效果,需要海量的数据进行分析,因此,需要数据库能有支持非常大的数据吞吐量,然而目前的竞赛信息数据存储非常零散,若想依据现有的数据库进行数据分析,有很大的困难,因为不仅涉及多表查询,同时数据类型也不统一,因此,本课题主要按照关系数据库的设计方法,针对数据仓库的应用需求,首先将竞赛项目按照其结构特点进行分类,按照各类别中的相似性进行每类项目数据的模型设计,最后在选择的数据库实现平台上实现整个数据库的物理设计,然后带入历史数据进行模型的验证。
1.3 主要技术简介
1.3.1 数据库设计技术
数据库设计技术是指根据用户的需求研制数据库结构的过程,具体的说,是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,是指能有效地存储数据,满足用于的信息要求和处理要求。
目前,数据库设计方法主要可分为四类:直观设计法,规范设计法。
直观设计法也叫手工试凑法,是最早使用的数据库设计方法,这种方法依赖于设计者的经验和技巧,缺乏科学理论和工程原则的支持,设计的质量很难保证,长仓是数据库运行一段时间后又发现各种问题,这样再重新进行修改,增加了系统维护的代价。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/dzkxyjs/1772.html

好棒文