大数据环境下健康医学数据的模型构建研究
摘 要早期,大部分医疗相关数据是以纸张化的形式存在,而非电子数据化存储。但随着强大的数据存储,计算平台,及移动互联网的发展,现在的趋势是医疗数据的大量爆发及快速的电子数字化。同时,数据的来源也纷繁复杂,可能来自不同的地区,不同的医疗机构,不同的软件。不可否认,一旦理顺了多格式,多源头,呈爆炸性成长的大数据,医疗大数据将在提高医疗质量,强化患者安全,降低风险,降低医疗成本等方面发挥无与伦比的巨大作用。随着“大数据”技术的成熟和应用的普及,目前亟待解决在线分析处理以及数据模型构建等技术问题。本课题可以通过数据处理软件来建立数学模型,对数据库中的数据进行批量分析,以期最终为应用健康医学数据的发展提供一定的借鉴途径。该研究将以健康医学领域应用数据为案例进行分析,以MySQL技术为支持,主要应用MySQL数据库的存储功能来存储应用数据;以R语言为核心,主要应用R语言进行处理分析相关数据、建模等研究工作;以PHP为输出环境开发工具,主要应用PHP技术建立本地服务器将数据分析结果以网页形式显示在本地可读网站上。在对健康医学数据进行分类操作时主要使用了较为成熟的LDA(线性判别式分析法),希望以此达到理想的处理效果。本系统结合R语言的相关特性,选用有关软件拓展包。在使用软件拓展包的情况下进行编程可有效地提高程序可读性与程序的执行效率,这样使得本系统具有了数据处理速率较快的优良特性,具有一定的实用性。本文将有助于提高医学数据的分析与处理的合理性、高效性。
目 录
摘 要 I
ABSTRACT II
第一章 绪论 1
1.1 课题的研究 1
1.1.1 课题的提出 1
1.1.2 课题的实施性 1
1.1.3 课题的价值及发展前景 2
第二章 系统相关软件介绍 3
2.1 Rstudio 3
2.2 XAMPP 3
2.2.1 PHP 4
2.2.2 MySQL 4
2.2.3 phpMyAdmin 4
第三章 系统设计 6
3.1 系统架构介绍 6
3.2 数据导入数据库 6
3.2.1 数据表格含义 6
3.2.2 数据导入
*好棒文|www.hbsrm.com +Q: ^3^5`1^9`1^6^0`7^2#
7
3.3 R语言数据分析建模编程 9
3.3.1数据分析部分 9
3.3.2 数据建模部分 11
3.4 phpMyAdmin本地服务器设计编程 12
3.4.1读取文本 12
3.4.2 读取图片 14
3.4.3 读取MySQL数据库 15
第四章 系统问题总结及解决 20
4.1 数据库问题总结及解决 20
4.2 R语言问题总结及解决 21
4.3 PHP问题总结及解决 22
第五章 结论及展望 24
5.1 结论 24
5.2 展望 24
致 谢 25
参考文献 26
附 录 28
第一章 绪论
1.1 课题的研究
1.1.1 课题的提出
随着“大数据”技术的成熟和应用的普及,健康医学数据正呈指数级增长,目前亟待解决在线分析处理,以及数据模型构建等技术问题。医学健康数据的建模成为了医疗卫生信息化发展的基础,一个完整的、共享的数据模型基础更加有助于更好地表达、处理和储存各类医学健康数据,实现医学信息交换与分享,加快医学信息交汇和融合,形成各类智能化、专业化的治疗决策支持,满足临床、科研和公共卫生等各个方面的各种综合信息的需求,以期最终提升医疗卫生服务质量[1]。近年以来,随着医学卫生信息化工作地不断深入快速发展,医学健康数据建模问题逐渐成为国际医学的热点研究对象。
人体和生命的高度复杂性使得相关的医学健康数据极度繁复。首先,数据种类繁多、形态各异,有数值、文档、符号等形式,信息之间的关系繁杂且不明朗;其次,不同国家、地区间的医疗体制、相关政策和法规等方面不尽相同,医学健康数据来源呈现出地域性的差异;其次,医学专业知识更新非常迅速,随着医学知识的更新不断变化,医学健康数据会呈现出形态更加多样、数据关系更加繁杂的特性。这些特性给医学健康数据模型的构建带来了新的挑战。
1.1.2 课题的实施性
为使数据分析部分可以快速地在后台运行,本课题选用较MATLAB更加轻量级的R软件。R拥有一套完整的数据处理、计算和制图软件系统,是简便而强大的编程语言。其在数组运算工具方面功能强大,在向量、矩阵运算方面功能更为尤甚;完整连贯的统计分析工具;同时又拥有匹敌MATLAB的优秀的统计制图功能;以及与C等初级编程语言相似的支持数据的输入和输出、可实现分支、循环,用户自定义函数等功能。利用R语言提供的函数及经典算法,本课题可以轻易实现对数据分析处理。
为使分析结果的输出环境更加简洁明了、可视化强,本课题使用PHP开发建立本地服务器并创建网页,将R生成的结果显示在网页上。为了将能在网页上直接查看课题数据,还需要MySQL数据库技术的支持。同时通过本课题不难发现PHP与MySQL的强强联合已成为数据处理的经典组合,加之R语言凭借优异的性能进入更多人的视线,三者的组合正成为中规模数据分析处理的新兴力量。
1.1.3 课题的价值及发展前景
在我国, 庞大的患者数量使中国成为世界上拥有潜在规模最大的医学数据资源的国家,如何有效地存储并分析利用数据的问题就显得更为突出。 而大数据的应用可产生很高的卫生经济价值。 医疗大数据具体可应用在临床诊断、医药研发和防止医疗诈骗等方面;对庞大的病例数据进行分析,本课题可以精准地分析患者的体征、疗效数据,可避免过度治疗;而通过进一步比较各种治疗措施治疗后相关指标的变化,医生可更好地确定临床最有效、效益最好的治疗方法。 随着人们健康意识的不断提高,新技术和新药物的不断涌现,21世纪也是医疗支出不断攀升的时代。 目前在整个医疗管理和医学界,都在经历着一场又一场的变革, 以适应人民群众日益增长的健康需求及国家对卫生经济学成本效益的要求。因此课题的研究是必须的。
总的来说,大数据在医学中的应用主要有以下几个方面:(1)发现新知识、新规律:在临床工作和科学研究中,本课题可获取大量实验样品、组织切片和基因芯片的数据,对这些前所未有的大量数据进行分析挖掘,可能有机会发现与疾病相关的新靶点或新分子标记物;(2)制定个性化治疗方案:整合不同来源的数据信息包括来自临床治疗、 基因组测序和组织形态的大数据并进行分析,可为每例患者量身定制治疗方案,为个性化医学带来新的动力;(3)推动循证医学的二次发展:传统而言,临床医生往往根据其具体背景和经验作出诊断和治疗,采用大数据进行统计分析,作出更为精确的临床诊断和发现切实可行的治疗方案,也是循证医学的体现。
第二章 系统相关软件介绍
2.1 Rstudio
本系统使用一款R的优秀的开源免费IDE软件——Rsudio来进行数据处理,较之R软件,Rstudio为用户提供了友好的交互界面,这款软件可以完美兼容Windows、Mac以及Linux操作系统[2,3]。同时它还包括支持直接执行代码的控制台,自动检测函数的编辑器,以及用于绘图,调试,查看历史和工作区的管理工具。但Rstudio对本课题分析处理数据更加有益的帮助是扩展包,考虑到用户正在做一些在科学,教育和行业内最具创新性和重要性的工作,所以扩展包一直由相关领域的优秀专家进行开发优化,以跟上社会科技发展需求。在本次毕业设计系统中,我们主要的数理分析都是通过使用拓展包实现的。拓展包中的函数数目众多,功能各异且十分强大,加之拓展包数量越来越多,这些都使得R可以实现从最简单的数学统计到很专业的生物学、医学数据分析等一系列功能。R语言强大的绘图功能包更是包罗万象,从最经典的条形图、饼图,再到数理分析中常见的箱形图、QQ图,再到方兴未艾的heatmap图,R让我们能够更加直观地掌握数据中蕴含的信息,足见R的优秀之处。另外Rstudio中的Shiny是一个美观且强大的用于R交互式报表和可视化的Web框架构建扩展包,不管有或没有Web开发技能,编程者都能轻松使用Shiny。
目 录
摘 要 I
ABSTRACT II
第一章 绪论 1
1.1 课题的研究 1
1.1.1 课题的提出 1
1.1.2 课题的实施性 1
1.1.3 课题的价值及发展前景 2
第二章 系统相关软件介绍 3
2.1 Rstudio 3
2.2 XAMPP 3
2.2.1 PHP 4
2.2.2 MySQL 4
2.2.3 phpMyAdmin 4
第三章 系统设计 6
3.1 系统架构介绍 6
3.2 数据导入数据库 6
3.2.1 数据表格含义 6
3.2.2 数据导入
*好棒文|www.hbsrm.com +Q: ^3^5`1^9`1^6^0`7^2#
7
3.3 R语言数据分析建模编程 9
3.3.1数据分析部分 9
3.3.2 数据建模部分 11
3.4 phpMyAdmin本地服务器设计编程 12
3.4.1读取文本 12
3.4.2 读取图片 14
3.4.3 读取MySQL数据库 15
第四章 系统问题总结及解决 20
4.1 数据库问题总结及解决 20
4.2 R语言问题总结及解决 21
4.3 PHP问题总结及解决 22
第五章 结论及展望 24
5.1 结论 24
5.2 展望 24
致 谢 25
参考文献 26
附 录 28
第一章 绪论
1.1 课题的研究
1.1.1 课题的提出
随着“大数据”技术的成熟和应用的普及,健康医学数据正呈指数级增长,目前亟待解决在线分析处理,以及数据模型构建等技术问题。医学健康数据的建模成为了医疗卫生信息化发展的基础,一个完整的、共享的数据模型基础更加有助于更好地表达、处理和储存各类医学健康数据,实现医学信息交换与分享,加快医学信息交汇和融合,形成各类智能化、专业化的治疗决策支持,满足临床、科研和公共卫生等各个方面的各种综合信息的需求,以期最终提升医疗卫生服务质量[1]。近年以来,随着医学卫生信息化工作地不断深入快速发展,医学健康数据建模问题逐渐成为国际医学的热点研究对象。
人体和生命的高度复杂性使得相关的医学健康数据极度繁复。首先,数据种类繁多、形态各异,有数值、文档、符号等形式,信息之间的关系繁杂且不明朗;其次,不同国家、地区间的医疗体制、相关政策和法规等方面不尽相同,医学健康数据来源呈现出地域性的差异;其次,医学专业知识更新非常迅速,随着医学知识的更新不断变化,医学健康数据会呈现出形态更加多样、数据关系更加繁杂的特性。这些特性给医学健康数据模型的构建带来了新的挑战。
1.1.2 课题的实施性
为使数据分析部分可以快速地在后台运行,本课题选用较MATLAB更加轻量级的R软件。R拥有一套完整的数据处理、计算和制图软件系统,是简便而强大的编程语言。其在数组运算工具方面功能强大,在向量、矩阵运算方面功能更为尤甚;完整连贯的统计分析工具;同时又拥有匹敌MATLAB的优秀的统计制图功能;以及与C等初级编程语言相似的支持数据的输入和输出、可实现分支、循环,用户自定义函数等功能。利用R语言提供的函数及经典算法,本课题可以轻易实现对数据分析处理。
为使分析结果的输出环境更加简洁明了、可视化强,本课题使用PHP开发建立本地服务器并创建网页,将R生成的结果显示在网页上。为了将能在网页上直接查看课题数据,还需要MySQL数据库技术的支持。同时通过本课题不难发现PHP与MySQL的强强联合已成为数据处理的经典组合,加之R语言凭借优异的性能进入更多人的视线,三者的组合正成为中规模数据分析处理的新兴力量。
1.1.3 课题的价值及发展前景
在我国, 庞大的患者数量使中国成为世界上拥有潜在规模最大的医学数据资源的国家,如何有效地存储并分析利用数据的问题就显得更为突出。 而大数据的应用可产生很高的卫生经济价值。 医疗大数据具体可应用在临床诊断、医药研发和防止医疗诈骗等方面;对庞大的病例数据进行分析,本课题可以精准地分析患者的体征、疗效数据,可避免过度治疗;而通过进一步比较各种治疗措施治疗后相关指标的变化,医生可更好地确定临床最有效、效益最好的治疗方法。 随着人们健康意识的不断提高,新技术和新药物的不断涌现,21世纪也是医疗支出不断攀升的时代。 目前在整个医疗管理和医学界,都在经历着一场又一场的变革, 以适应人民群众日益增长的健康需求及国家对卫生经济学成本效益的要求。因此课题的研究是必须的。
总的来说,大数据在医学中的应用主要有以下几个方面:(1)发现新知识、新规律:在临床工作和科学研究中,本课题可获取大量实验样品、组织切片和基因芯片的数据,对这些前所未有的大量数据进行分析挖掘,可能有机会发现与疾病相关的新靶点或新分子标记物;(2)制定个性化治疗方案:整合不同来源的数据信息包括来自临床治疗、 基因组测序和组织形态的大数据并进行分析,可为每例患者量身定制治疗方案,为个性化医学带来新的动力;(3)推动循证医学的二次发展:传统而言,临床医生往往根据其具体背景和经验作出诊断和治疗,采用大数据进行统计分析,作出更为精确的临床诊断和发现切实可行的治疗方案,也是循证医学的体现。
第二章 系统相关软件介绍
2.1 Rstudio
本系统使用一款R的优秀的开源免费IDE软件——Rsudio来进行数据处理,较之R软件,Rstudio为用户提供了友好的交互界面,这款软件可以完美兼容Windows、Mac以及Linux操作系统[2,3]。同时它还包括支持直接执行代码的控制台,自动检测函数的编辑器,以及用于绘图,调试,查看历史和工作区的管理工具。但Rstudio对本课题分析处理数据更加有益的帮助是扩展包,考虑到用户正在做一些在科学,教育和行业内最具创新性和重要性的工作,所以扩展包一直由相关领域的优秀专家进行开发优化,以跟上社会科技发展需求。在本次毕业设计系统中,我们主要的数理分析都是通过使用拓展包实现的。拓展包中的函数数目众多,功能各异且十分强大,加之拓展包数量越来越多,这些都使得R可以实现从最简单的数学统计到很专业的生物学、医学数据分析等一系列功能。R语言强大的绘图功能包更是包罗万象,从最经典的条形图、饼图,再到数理分析中常见的箱形图、QQ图,再到方兴未艾的heatmap图,R让我们能够更加直观地掌握数据中蕴含的信息,足见R的优秀之处。另外Rstudio中的Shiny是一个美观且强大的用于R交互式报表和可视化的Web框架构建扩展包,不管有或没有Web开发技能,编程者都能轻松使用Shiny。
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/dzxx/txgc/1147.html