海鼎,助您成就梦想!

海鼎运维助手:多平台运维管理的利器

2014年11月20日

评论数(0)
 

摘要:随着鼠标、水泥加移动网络的全渠道零售时代到来,企业在信息化建设、平台搭建等方面加大投入。无论是顾客多触点接入平台、还是全渠道零售管理平台、业务服务支撑平台,想要稳定、高效地运行,都需要良好的工具、方法去建立快速响应,并能适应企业业务环境及业务发展的运维模式。本文介绍的海鼎运维助手基于Zabbix研发而成,可以监控各平台中不同服务器、网络设备,甚至进程、业务接口的健康状态;提供详细的报表、图表绘制展示;并且提供灵活、有效的预警机制。

关键词:运维管理,监控,预警,信息化建设,海鼎运维助手

 

引言

 

  随着鼠标、水泥加移动网络的全渠道零售时代到来,企业在信息化建设、平台搭建等方面加大投入。

  而无论是顾客多触点接入平台、还是全渠道零售管理平台、业务服务支撑平台,想要稳定、高效地运行,都需要良好的工具、方法去建立快速响应,并能适应企业业务环境及业务发展的运维模式。

  本文介绍的工具——海鼎运维助手基于企业级开源解决方案Zabbix研发而成,可以监控各平台中不同服务器、网络设备,甚至进程、业务接口的健康状态;提供详细的报表、图表绘制展示;并且提供灵活、有效的预警机制。

 

一、应用场景

  
  (一)故障提前预警,自动处理

  企业信息部管理员,管理企业应用中上百台服务器。服务器很多,也比较分散。所以平时发生各类故障的频率就比较高。

  经常会出现某台机器内存不足,某台机器磁盘空间不足,某台机器网络断掉等等小问题,解决起来很简单,但是往往都是在使用者发现情况之后,催着管理员来解决。

  这样一来,管理员整天就奔波于不同服务器之间解决问题,还给其他各个部门使用者留下了不好的印象:故障频现,影响正常使用。比如早上等待发布制品,却发现编译服务器由于空间不足而编译失败,制品无法发布,一个团队只好等着重新编译。或者就是服务器网络中断等等,造成很大的损失。

  管理员希望有一种工具,可以有一个平台来管理这些服务器,在某个服务器内存即将满载,某个服务器网络中断,某个服务器磁盘空间即将用尽的时候,通知管理员去进行相关处理。这样一来,管理员可以根据自己的安排来维护不同服务器,处理的过程,使用者也不会感觉到,给使用者的印象,就是一个高效、稳定的环境。

  海鼎运维助手,可以针对这种场景,给所有的服务器增加触发器:可用内存不足10%,可用磁盘空间不足2G,网络是否联通。

当某台服务器可用内存不足10%,就会邮件通知管理员,或者执行管理员预先设定的执行脚本,来清理释放内存。

某台服务器磁盘空间不足,无法进行制品编译。就会在磁盘空间达到临界值时通知管理员,清理磁盘。

  之后,企业应用的服务器集群,在问题出现之前,管理员就能得到预警,维护好机器。减少了服务器故障的频率。各个部门使用者,也不会因为服务器故障,而影响到工作。

 
  (二)应用服务情况汇总展示

  硬件的问题,得到了有效的监控、预警之后,服务器中各个应用、软件的运行是否正常,ISS、Oracle等是否运行正常,也是需要实时的监控,出现问题前及时的预警。

  信息部维护多台数据库服务器。某日用户纷纷反映:数据库卡顿、查询等待时间过长。管理员去排查时发现,数据库卡顿的现象时有时无,而且多个数据库均有此现象。

   于是,管理员耗费了半天时间,排查各个数据库服务器,挨个检查Oracle参数等,最后终于发现是有些数据库SGA设置过小,造成数据库命中率偏低。

  通过调整这几个数据库的SGA、PGA解决了这个问题,但是剩下的一批数据库,也需要挨个排查,几十上百个服务器,耗费大量人力,才排查完。

  管理员希望,可以将希望看到的数据,集中展示在某个地方,不需要挨个去查看。

   部署了海鼎运维助手,可以统一监控所有的数据库,将数据展示在网页中。管理员不需要整天查看,按照设定好的触发器,某项指标有问题,就会通知管理员到具体的服务器解决问题。

  之后再出现Oracle相关的问题,管理员可以不用挨个查看数据库,只需要查看集中展示的图标,或者查看是否有异常通知就可以。大大提高了工作效率,降低了管理大批服务器的成本。

 
  (三)分割化管理

  某企业服务器上百台,按照不同项目交给不同的人员维护。三四个维护人员都需要每天2小时左右的时间去维护,想要做到统一化管理更是难上加难。

  引入海鼎运维助手之后,通过用户组、模板化的配置,就可以将不同的服务器分组,套用模板中的配置,将监控的数据展示给不同人,出现问题时,直接邮件、短信等通知到相关人员来处理。

  之后,分管不同服务器的人员,不需要去登陆不同的服务器,就可以实时的在网页中看到服务器的性能指标、应用、数据库服务的运行情况。不需要每天耗费大量的时间去查看每台服务器。

  所有服务器,也可以统一化汇总起来,将除了应用以外的管理,由一个人统一管理。

 

二、功能介绍

 

       海鼎运维助手是基于企业级、开源的、分布式的监控解决方案Zabbix二次开发而成的适用于零售企业的运维工具,可以基于Web进行系统监控、网络监控等。安装部署简单,支持多个平台,硬件配置需求低。

下面给大家介绍一下海鼎运维助手:

 

(一)简单高效的配置

  海鼎运维助手通过‘主机群组’、‘主机’、‘应用集’、‘项目’等分组,可以清晰的给已有的主机划分不同的群组。每个主机中通过‘应用集’来划分不同的监控类型。

       例如:

信息部Zabbix监控,可以新建主机群组:HDNet

主机群组HDNet新增主机:OracleDBHDNet、OracleDBHDNetTest、ISS7Server

主机ISS7Server新增应用集:CPU监控、内存监控等

图1 监控分组

 

  (二)功能强大的数据收集

       海鼎运维助手可以设置不同的监控项,实时的收集数据、并且记录于数据库中,同时也可以实时的绘图进行展示,如图:

 CPU、内存、硬盘等系统资源情况

进程资源占用

可用性检测、性能检测

自定义检测、自定义间隔收集数据

 数据库监控(需插件扩展)

图2 实时数据图表展示


  (三)灵活多变的问题阈值

       海鼎运维助手监控项收集到的数据,存储于数据库中,可以设置不同的阈值,即为‘触发器’。触发器可以按照问题阈值来设置不同的级别:资讯、严重、警告等。

       如:

              对主机:ISS7Server,监控项:可用内存 新增触发器‘20%可用内存预警’

              即可在ISS7server可用内存不足20%时触发此触发器,进行下一步动作。

 

  (四)及时多样的预警设置

  设定不同的监控项,对监控项设置不同的触发器。海鼎运维助手就可以分析实时收集的相关数据。如果满足条件,就可以执行以下动作:

SMS短信通知

Email邮件通知

执行某自动化命令(如执行某脚本清理内存、清理磁盘空间)

 

  (五)可扩展的图形展示

   除了对收集到的监控数据实时绘图外,海鼎运维助手同时提供了网络拓扑图、自定义面板、首页Dashboard自定义展示报告等。

图3 拓扑图

图4 多目标集中展示


  (六)简单配置,可套用模板

  海鼎运维助手配置简单易懂,且可以套用模板。

  Server通过安装在需监控设备上的Agent(SNMP、IPMI等),即可收集被监控设备中相关数据。

  已监控的机器,通过使用各种模板,无需再配置即可实现监控。可自动发现网络设备,自动注册agent,自动发现文件系统、网卡设备、SNMP等。

 

  (七)层次分明的权限系统

       海鼎运维助手使用了方便管理的用户、用户组权限设置方式。可以针对不同用户、用户组成员分配不同主机、不同项目、不同应用集、不同触发器等权限。甚至可以控制某监控图表的查看权限。

       可以限制允许维护的列表,方便分割化管理。


总结

 

  工欲善其事,必先利其器。利用海鼎运维助手,可以监控各平台中不同服务器、网络设备,甚至进程、业务接口的健康状态;提供详细的报表、图表绘制展示;并且提供灵活、有效的预警机制。加上分割化的管理,责权分明的管理机制。在信息化建设高速发展的今天,通过合理的使用工具,大幅度提高了服务器运维管理的效率,使企业在内部运维管理事项日渐增多的今天,依旧能保持灵活高效、快速响应。

 

文/王寅

文章为作者独立观点,不代表联商专栏立场。

联商专栏原创文章由作者授权发表,转载须经作者同意,并同时注明来源:联商专栏+海鼎。