网络运维监控系统的设计与实现(附件)【字数:9845】
摘 要该论文主要介绍了基于大型企业的网络运维监控系统的设计以及实现。分析了目前主要的网络监控的优缺点并提出了基于zabbix的网络监控系统的需求背景。通过分析zabbix传统监控系统的不足之处和对其工作模式的分析,由zabbbix的可编程接口,实现了对原有功能的延展,设计了各个子模块。包括用户管理模块、基于zabbix的自动化操作模块,完善了监控系统的,实现了监控系统的实用性。其中列出了主要安装部署代码,流程图。完成了整体框架和软硬件环境和整体工作流程的构建和分析。介绍了监控模板、监控项的设计与添加,并在原有的基础上进行优化,使之能匹配大系企业千台设备服务器,监测设备的运行状况。该论文提出的大型企业监控设计解决方案更加侧重于高并发以及数据的安全,由于程度很难判定,所以对于如何处理好获取数据时的高并发性来说还是一个未知的难题。本文提供了报警自动化的简单解决方案,但对于更加复杂的操作和故障信息还是要依赖与人工手动操作。要真正实现自动化的智能机器操作,有待我们深入发掘和挑战。
Key words: Monitoring system; ZABBIX; automated operation and maintenance目 录
摘 要 II
ABSTRACT III
目 录 I
第一章 绪论 3
1.1课题研究的背景和意义 3
1.2网络监控系统的发展现状 3
1.3 ZABBIX介绍 4
1.3.1 ZABBIX常用术语介绍 6
第二章 系统设计 8
2.1企业需求分析 8
2.2 环境需求分析 8
2.3设计思路 9
2.4系统工作流程和模块设计 9
第三章 设计实现 11
3.1用户管理模块 11
3.1.1 Ldap目录系统 11
3.1.2 基于Ldap协议的用户认证 12
3.2 基于ZABBIX 的操作自动化模块 13
3.3 数据收集模块 14
3.4 数据存储模块 15
第四章 环境搭建 17
4.1 ZABBIX的架构体系 *好棒文|www.hbsrm.com +Q: ¥351916072$
17
4.2 前期准备 17
4.3安装ZABBIX和配置数据库 18
第五章 测试和分析 20
5.1测试方法 20
5.1.1登陆测试 20
5.1.2 测试创建主机 20
5.1.3 测试创建监控项 21
5.1.4 测试创建触发器 22
5.1.5 创建邮件报警测试 22
5.2 测试结果分析 22
5.3 报警处理流程简介 23
第六章 展望和总结 25
6.1 展望 25
6.1.1CMDB介绍 25
6.2总结 26
致 谢 27
参考文献 28
第一章 绪论
1.1课题研究的背景和意义
在一家中大型企业的IT环境中,存在各种设备,其设备组成成分也十分复杂:线上服务器,线下服务器,测试环境服务器,堡垒机,交换机等等。任何运维部门的本职工作就是要保障这些纷繁复杂的设备以及这些设备构成的线上系统和业务正常运转。要让系统和业务稳定运行,需要配备以专门的人员进行设计架构,维护和调优。对于沪江这样一个基数庞大的公司来说,必须要雨中不同的运维监控系统,让服务器和人之间形成一个庞大的整体,相互协调合作,这样才能更好的完善对不同条件不同场景下的下的运维要求即监控体系。
为了及时掌握基础环境和业务系统的可用性,保证线上服务的正常运行,则需要获取每个组件及设备的运行状态,如:cpu使用率、进出口流量监控、端口和存储空闲、系统的平均负载量、服务器的运行情况、端口的状态变化、网站的访问状态码、服务节点的异常等信息,这一切都离不开网络监控系统的协助。
1.2网络监控系统的发展现状
网络监控系统最开始是常用的命令行方式,结合简单的网络检测工具对系统进行检测和排查,但是这就需要用户去了解不同厂商之间的的不同产品的不同网络设备之间不同的配制信息,还要求用户熟悉各种网络的技术知识和各种复杂的概念,大大增加了运营成本也浪费了很多时间。中期发展出了比较直观的图形界面,让使用者无须过多了解设备的配置方法就能对多台设备进行管理,但这还远远不够成熟。到了现在,网络运维监控系统逐步完善,接下来介绍几个比较完善的常用的监控系统:
Nagios,它是一款开元的企业级监控系统,距今已经有二十年的历史了。它能监控包括超文本传输协议、邮件代理协议,网络新闻传输协议等各种基本的服务类型。能监控到的基本系统参数包括网络状况性能、cpu等。用户可以通过插件的安装和脚本编译来实现应用监控,并且可以针对多个对象部署有层次的监控架构。它的缺点也很明显:对各种监控到的数据指标的处理不完善;只能看到当前的告警却看不到历史数据,如果漏看的话就不能找回,造成报警故障难以回查,而且搭建安装复杂,这对没有一定基础的人用户来说不是一个很好的选择。
图111Nagios监控页面
Ganglia,设计的初衷是用来监控千为单位的网络节点,它已被移植到各种操作系统和集群中,它是一个可以扩展的、跨平台的、高效率的计算系统下的分布式监控软件。缺点是没有内置的消息通知系统,报警结构机制不够完善,发生故障时不能快速响应。 图112Ganglia监控页面
1.3 zabbix介绍
除了以上两款监控软件,还有我们本次设计要用到的Zabbix,是目前国内使用最多的监控软件。它提供分布式系统监控,基于web页面的企业级开源运维平台,特别适合初学者,因其上手简单,搭建方便。而没有牺牲它强大的功能,灵活的配置管理页面,并且可以生成美观的监控图像让用户更直观的了解信息,另外自动发现的功能能大大减少工作负荷,可以适用于大型企业的绝大多数需求。
它支持多种协议,工作原理是将采集到的数据存放到数据库进行分析整理,达到触发器设置告警条件就报警。其灵活的延展性和强大的功能是其他监控系统所不能比的。
根据公司的实际需求,本次我们讨论设计的就是zabbix监控系统。为了使读者更好的理解接下来我们详细介绍一下它的组件和工作原理:
Key words: Monitoring system; ZABBIX; automated operation and maintenance目 录
摘 要 II
ABSTRACT III
目 录 I
第一章 绪论 3
1.1课题研究的背景和意义 3
1.2网络监控系统的发展现状 3
1.3 ZABBIX介绍 4
1.3.1 ZABBIX常用术语介绍 6
第二章 系统设计 8
2.1企业需求分析 8
2.2 环境需求分析 8
2.3设计思路 9
2.4系统工作流程和模块设计 9
第三章 设计实现 11
3.1用户管理模块 11
3.1.1 Ldap目录系统 11
3.1.2 基于Ldap协议的用户认证 12
3.2 基于ZABBIX 的操作自动化模块 13
3.3 数据收集模块 14
3.4 数据存储模块 15
第四章 环境搭建 17
4.1 ZABBIX的架构体系 *好棒文|www.hbsrm.com +Q: ¥351916072$
17
4.2 前期准备 17
4.3安装ZABBIX和配置数据库 18
第五章 测试和分析 20
5.1测试方法 20
5.1.1登陆测试 20
5.1.2 测试创建主机 20
5.1.3 测试创建监控项 21
5.1.4 测试创建触发器 22
5.1.5 创建邮件报警测试 22
5.2 测试结果分析 22
5.3 报警处理流程简介 23
第六章 展望和总结 25
6.1 展望 25
6.1.1CMDB介绍 25
6.2总结 26
致 谢 27
参考文献 28
第一章 绪论
1.1课题研究的背景和意义
在一家中大型企业的IT环境中,存在各种设备,其设备组成成分也十分复杂:线上服务器,线下服务器,测试环境服务器,堡垒机,交换机等等。任何运维部门的本职工作就是要保障这些纷繁复杂的设备以及这些设备构成的线上系统和业务正常运转。要让系统和业务稳定运行,需要配备以专门的人员进行设计架构,维护和调优。对于沪江这样一个基数庞大的公司来说,必须要雨中不同的运维监控系统,让服务器和人之间形成一个庞大的整体,相互协调合作,这样才能更好的完善对不同条件不同场景下的下的运维要求即监控体系。
为了及时掌握基础环境和业务系统的可用性,保证线上服务的正常运行,则需要获取每个组件及设备的运行状态,如:cpu使用率、进出口流量监控、端口和存储空闲、系统的平均负载量、服务器的运行情况、端口的状态变化、网站的访问状态码、服务节点的异常等信息,这一切都离不开网络监控系统的协助。
1.2网络监控系统的发展现状
网络监控系统最开始是常用的命令行方式,结合简单的网络检测工具对系统进行检测和排查,但是这就需要用户去了解不同厂商之间的的不同产品的不同网络设备之间不同的配制信息,还要求用户熟悉各种网络的技术知识和各种复杂的概念,大大增加了运营成本也浪费了很多时间。中期发展出了比较直观的图形界面,让使用者无须过多了解设备的配置方法就能对多台设备进行管理,但这还远远不够成熟。到了现在,网络运维监控系统逐步完善,接下来介绍几个比较完善的常用的监控系统:
Nagios,它是一款开元的企业级监控系统,距今已经有二十年的历史了。它能监控包括超文本传输协议、邮件代理协议,网络新闻传输协议等各种基本的服务类型。能监控到的基本系统参数包括网络状况性能、cpu等。用户可以通过插件的安装和脚本编译来实现应用监控,并且可以针对多个对象部署有层次的监控架构。它的缺点也很明显:对各种监控到的数据指标的处理不完善;只能看到当前的告警却看不到历史数据,如果漏看的话就不能找回,造成报警故障难以回查,而且搭建安装复杂,这对没有一定基础的人用户来说不是一个很好的选择。
图111Nagios监控页面
Ganglia,设计的初衷是用来监控千为单位的网络节点,它已被移植到各种操作系统和集群中,它是一个可以扩展的、跨平台的、高效率的计算系统下的分布式监控软件。缺点是没有内置的消息通知系统,报警结构机制不够完善,发生故障时不能快速响应。 图112Ganglia监控页面
1.3 zabbix介绍
除了以上两款监控软件,还有我们本次设计要用到的Zabbix,是目前国内使用最多的监控软件。它提供分布式系统监控,基于web页面的企业级开源运维平台,特别适合初学者,因其上手简单,搭建方便。而没有牺牲它强大的功能,灵活的配置管理页面,并且可以生成美观的监控图像让用户更直观的了解信息,另外自动发现的功能能大大减少工作负荷,可以适用于大型企业的绝大多数需求。
它支持多种协议,工作原理是将采集到的数据存放到数据库进行分析整理,达到触发器设置告警条件就报警。其灵活的延展性和强大的功能是其他监控系统所不能比的。
根据公司的实际需求,本次我们讨论设计的就是zabbix监控系统。为了使读者更好的理解接下来我们详细介绍一下它的组件和工作原理:
版权保护: 本文由 hbsrm.com编辑,转载请保留链接: www.hbsrm.com/jsj/wljs/3.html