大数据治理背景下的元模型设计与实现(源码)【字数:8890】

摘 要近几年,企业收集和使用的数据成倍增长,企业注重企业的数字化、信息化发展,企业内部系统之间没有得到信息共享,容易形成了信息孤岛;如今,国内外掀起了一股大数据治理的热潮,企业在数据治理的过程中元数据管理遇到瓶颈;信息化发现带来的需求不断变化,传统软件设计无法满足日益变化的需求。 针对上述情况,本文提出了一种在大数据治理背景下的元模型设计与实现方案。通过元模型管理将业务模型转化为不同的主题模型、指标模型、维度模型,业务彻底转化为底层的技术元数据和业务元数据。本文对数据立方体、指标体系、维度、业务等进行了一套元模型方案的构建,从以往的业务驱动变成数据驱动,旨在业务无关性。通过数据仓库的建立来整合企业各系统的资源,实现信息共享,帮助企业管理部门做到科学决策;通过元数据维护和管理环节,为未来的大数据治理提供了便利。方案设计的目的在于丰富元数据的管理来突破数据治理过程中元数据的生成的瓶颈,在技术层面上保证业务的灵活性减少二次开发带来的人力物力的浪费,最终帮助企业管理层根据企业生产运行数据做出科学决策。
目 录
第一章 绪论 1
1.1研究背景 1
1.2研究目的和意义 1
1.3研究原则 1
1.3.1通用性原则 1
1.3.2适应性原则 1
1.3.3高效性原则 2
1.3.4可实施性原则 2
1.4论文组织结构 2
第二章 基于元模型的数据交换平台组织结构设计 4
2.1平台组织架构 4
2.2平台业务功能与业务流程 4
第三章 基于元模型的数据交换平台整体设计 6
3.1平台设计理念 6
3.2平台功能框架 7
3.3平台各子系统/功能模块描述 8
3.3.1数据分析展示 9
3.3.2数据仓库过程设计 9
3.3.3数据仓库过程实现 10
第四章 元数据管理 11
4.1元数据管理现状 11
4.2元数据管理步骤 11
4.3元数据管理重要性 12
4.4元数据管理未来趋势 12
结束语 13
 *好棒文|www.hbsrm.com +Q: ¥351916072$ 
致 谢 14
参考文献 15
绪论
1.1研究背景
在传统行业,普遍存在信息化程度低,信息机构不够健全,没有统一的企业化信息管理平台。加之企业内各信息管理系统错综复杂,没有统一的规划和设计,使得各系统之间的信息无法共享,容易形成信息孤岛。
如今,国内外众多公司掀起了数据治理的浪潮,面对我们身边每时每刻迅速增长的庞大数据,因为其数量大、速度快、种类多和准确性的特征,如何更好地利用大数据创造出有意义的价值,一直是我们探索的重要话题。而在这之前,就需要用科学正确的方法策略对大数据进行治理。
随着企业信息化、扁平化管理的推进,企业的日常管理离不开数据的支持,与日俱增的需求,传统软件设计方式不能够满足当今日益变化的需求。作为软件的使用者也无法及时描述出需求,这就导致了软件版本的不断更替,大量人力物力浪费在上面。因此设计出可以满足主题内需求变化的软件势在必行。
1.2研究目的和意义
大数据治理背景下的元模型设计与实现为管理者全面、及时的了解和分析企业运营、生产信息提供丰富的手段,为领导决策指挥的科学性、高效性、准确性提供强大的技术支持。
采用元模型设计的优势在于:一、将分析需求逐步转化为数据仓库底层业务元数据,不仅可以使得分析需求能够加以维护,而且作为元数据管理的一个模块可以提供大数据治理方面的支持。二、使用元模型所有的业务对象、数据对象都可以加以维护,可以做到业务变化的灵活性,降低二次开发的成本。
在技术层面加快数据治理的实施,从而提高数据的质量(准确性和完整性),保证数据的安全性(保密性、完整性及可用性),实现数据资源在各组织机构部门的共享;推进信息资源的整合、对接和共享,从而提升企业单位信息化水平,充分发挥信息化作用。
1.3研究原则
1.3.1通用性原则
基于元模型的数据交换平台在设计上需要考虑平台的通用性。设计时考虑作为基础应用平台,它的设计应该始终体现业务无关性原则。这样设计的优势在于,随着业务的变化,数据的组织形式的变化都不会影响当前设计的结构,减少二次开发的工作量;应用设计自身具备开放性。
1.3.2适应性原则
基于元模型的数据交换平台在设计上需要考虑平台的适应能力。这种适应能力主要体现在两个方面的变化:
一是应用环境的变化。随着企业信息化建设快速推进,企业各专业系统都会得到改造升级。这理所当然会带来数据组织形式的变化以及数据部署方式的变化。
二是应用需求的变化。随着企业管理扁平化、精细化程度的不断提高,对数据的要求也不断变化,这体现在对指标信息的不断扩大,所以要满足指标的不断变化。同时数据颗粒度的细化工作以及数据的钻取深度都会慢慢的提上日程。
1.3.3高效性原则
基于元模型的数据交换平台在工作的时间内需要进行大量的数据处理工作。从应用实际出发,我们要确保数据采集、处理的过程是高效的。其高效性主要体现在以下两个方面:
1、从专业系统获取数据的高效性。从各个专业系统采集数据,通过ETL处理数据的时候,应该注意两点:一是不能影响原系统的正常运行,二是数据抽取转化为对应数据集市的过程应该是高效的。
2、是设计自身数据处理、分析展示的高效性。作为数据仓库的平台,在建立数据立方体、数据挖掘、处理业务逻辑、前端的展示的过程应该是高效的。所以数据多维立方体的模型设计也至关重要。
1.3.4可实施性原则
基于元模型的数据交换平台的实施是一个非常复杂的系统工程,实施过程必然很复杂。
数据仓库的理论发展至今已经趋于成熟,但实施的过程必然会遇到很多困难,业界相关技术和产品也层出不穷,所以选择什么样的产品和技术能够保证整个设计的支撑很关键,与此同时设计数据仓库建设的工程方法和方法论有待进一步的发展和总结。
基于元模型的数据交换平台的建设不是一蹴而就的,是个漫长的过程。总体来讲可以分为两个阶段,第一阶段是基础平台的建设,第二是应用平台的建设。在建设的过程中需要协调好与各子系统之间的工作,当然应该考虑好需求未来的变化与发展,在数据分析展示的阶段应该考虑如何更加方便快捷的处理数据。用户能够更加直观的全方面了解企业生产运行状况。
平台设计过程中需要充分考虑上述问题,从技术上降低工作难度,从方法上提高效率、降低风险、保证系统的可实施性。

版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/rjgc/406.html

好棒文