电信 教育 政务 机械 汽车 船舶 交通 石化 烟草 服装 电力 金融 外贸 冶金 电子

蓝科数据中心监控平台

2008-4-2 发布方:jinm 网友评论 0 条 点击进入论坛
通过本系统监控系统的运行情况和健康状况,并对异常情况给予警报,具体如下:
1. 主机的运行状况,包括磁盘和文件系统的使用状况、登录用户、进程和线程、网络使用状况和CPU使用情况;
2. 数据库运行状况,包括空间、内存和SQL执行情况等;
3.Jaguar服务器运行状况;
4.各种应用服务器的运行状况。
5. 对指标达到报警值可按设定的报警方式报警,包括声、光、电等现场报警和电话、邮件、MSN、QQ或手机短信等手段。
6. 触发定义好的脚本,完成事先可预定的操作动作
7. 同时保存指标的历史数据,可显示历史趋势图,方便找到峰值时刻并供参考。

产品架构

系统由监控代理、监控服务器、web服务器、浏览器组成。监控代理在数据库服务器、应用服务器、银电服务器上运行,定时查看服务器的状况,检查到异常情况时按用户的要求启动相应的动作并主动向监控服务器汇报,由监控服务器推到浏览器。用户也可以提交页面到web服务器,由web服务器将用户请求转交到监控服务器,监控服务器发请求给相应的监控代理完成用户的请求。
图表 9 数据中心监控系统框图



图表 10 数据中心监控系统架构图

产品特点

采用颜色指标(红色代表故障、黄色代表非健康状态、绿色代表正常)来显示服务器和应用程序健康状况,可直接使用由Microsoft Visio绘制的图形,使显示更直观和专业。
1. 提供开放接口可以与其它网管软件接口,例如OpenView等。
2. 基于web的监控平台界面使系统管理员可以在异地远程监控用电营销数据中心,从而可不受地点限制对系统报警或故障做出及时反应。

产品功能

用电营销数据中心监控的主要目标是通过实时监控数据中心各类服务器的健康状况,在系统处于非健康状态下自动启动或提醒系统管理员采取相应补救措施,以改善用电营销系统的持续可用性。系统监控的服务器类型主要有数据库服务器、应用服务器、备份服务器、银电联网服务器以及其他各种接口服务器。监控内容主要是操作系统级别和应用程序级别的各种健康状况指标,操作系统级别监控内容包括服务器内存占用率、CPU占用率、磁盘空间占用率,应用程序级别监控内容包括数据库表空间使用率、数据库死锁、应用服务器组件超期未释放情况、应用服务器数据库连接数目等。
1.服务器(操作系统)监测
操作系统检测就是通过对各个服务器操作系统内部状态的监控,以确保营销系统中数据库服务器、应用服务器和其它服务器的健康状态。通过采集服务器的CPU、内存、硬盘、网卡等硬件的关键运行参数,以及软件和应用程序的进程、服务、端口等运行状况,对系统日志进行分类扫描查询。通过数据采集和分析,系统能够及时对影响企业服务器运行性能的故障事件发送报警,并采取相应的故障处理措施,保证服务器的正常安全运行。与服务器相关的监测器有30多种,其中主要包括采集服务器CPU、内存、磁盘空间、服务、进程、网卡、错误日志、Windows事件日志、UNIX LOG文件、文件和目录等数据的监测器。
l主机运行管理
主机的CPU、内存、磁盘的使用情况对主机的性能影响很大,如果出现问题,将直接影响到主机的正常运行,进而对服务器上正在运行的重要的应用系统带来不可预料的后果。因此,监测企业主机的CPU、内存、磁盘资源使用情况是主机管理的首要任务。
l 服务、进程管理
企业的主机上运行着各种非常重要的应用系统,例如大型的数据库系统、Mail系统、Web Server或特殊业务的应用系统等。应用系统的进程和服务是否运行正常是判断其是否正常的关键,如果这些关键的进程和服务停止,则企业的应用系统肯定无法正常工作。所以监测主机上的进程和服务是企业主机管理的另一个重点。
监测模块能够监测Windows平台和UNIX平台上运行的进程、服务的运行状况,例如指定进程的运行实例总数,对于Windows平台,不但能监测指定进程的实例总数,还能监测线程总数及内存总占用量。通过对进程和服务的运行状况的监测,系统可对重要的应用系统的正常运行提供有力的保障。
l日志管理
服务器上的应用系统或重要进程运行时会产生大量的日志文件,这些日志文件对于网络管理人员检查程序运行状态、查找程序出错原因很有帮助。服务器监测模块提供了相应的监测功能对这些日志进行监测。系统不仅可以监测Windows平台和UNIX平台的日志变化情况,而且对监测结果支持匹配查询、设置过滤条件等方式进行更深层次的分析,通过应用服务器日志监测功能,可帮助管理员更准确的掌握重要进程或应用系统的运行状况,以保证关键业务的正常运行。
lJaguar服务器和各种应用服务器的运行状况进行监测,实时显示运行参数,显示参数曲线。
2 .数据库监测
数据库监测模块可以全面智能的监测企业与数据库应用相关的各种服务。对数据库从应用可用性、系统资源占用和数据库性能指标三个方面提供全面的监测管理策略,确保数据库的运行正常。
数据库性能监测模块能够连续监控企业数据库的关键参数。例如:数据库系统设计的文件存储空间、系统资源的使用率、配置情况、数据库当前的各种锁资源情况、监控数据库进程的状态、进程所占内存空间、可用性等。系统可以在服务中断时捕获问题信息,并且自动发送到告警控制台,使系统管理员能够及时采取措施,避免灾难性的事故。
对数据库系统性能指标的监测和目的包括:
l数据库监听进程
保证数据库的监听进程运行正常
l数据库连接数
数据库的连接数过大会占用大量的主机和数据库资源,可能有不正常的连接
l数据库响应时间
是反映数据库性能的简单指标,如果响应时间过长说明数据库繁忙或性能下降,需要进一步检查数据库的运行状况
l表空间使用情况
显示表空间的占用情况,防止表空间写满引起的数据库故障。监控表空间的碎片情况,当碎片过多时报警提醒整理表空间。
l数据库进程
监视数据库进程的数量和CPU的占用量。对于CPU占用很高的进程,记录运行的SQL,用来定位性能差的SQL语句。
l日志空间情况
监视日志空间的使用情况,防止写满而造成的数据库故障。
l数据库死锁
监控数据库锁的情况,对过多的锁或有超出设定时间未释放资源的锁进行报警提示。
l备份执行情况
显示备份计划的执行情况,防止备份中止。
l访问数据库的IP地址列表
防止未授权的IP访问数据库,如果有列表外的IP访问数据库将及时告警。
3.故障与告警管理
故障管理系统是对监测系统报告的故障进行管理,帮助系统和网管人员采集、统计和分析来自网络各方面的报警和故障信息,准确预警、定位和解决系统中存在的故障。
故障诊断与管理功能可以根据用户设定的条件,当故障发生时发送警报至相关人员,让管理者及时了解系统发生的故障及其原因,并通过系统设置,自动恢复系统的正常状况。
l丰富的告警发送方式
提供电话、手机短信、语音、声音、警示灯、即时信息(MSN,QQ)、邮件、脚本等多种方式及时发出警报,通知网管人员发现、定位和处理故障,使系统管理变被动为主动,有效预防故障发生,也可在故障发生时快速进行定位,及时清除故障。
l报警控制项
报警的粒度是报警控制项。报警控制项是多种基本指标的的组合。丰富的报警设置允许自定义报警的条件、升级、相关性以及报警分组,帮助管理人员快速查找报警发生的原因。
对数值信息的数据,在报警项中,管理人员可设置几个级别的阈值,当数据超过阈值时产生不同级别的报警信息。系统支持对事件的过滤和关联,一方面去掉无关事件和重复事件,另一方面完成同一个故障发生和结束事件的匹配工作,以便确定故障源。
l告警呈现
当确定网络发生故障时,可在现场用声光电等方式报警,同时也能用电话,手机短信或电子邮件的方式通知网络管理人员。具体采取何种报警方式可以由用户自己配置,网络管理人员配置的信息包括确定是否采用声音报警和(或)其他特殊报警方式,选择报警声音文件,确定手机短信和Email发送的次数和间隔时间。
告警历史查询设置是对历史告警数据的查询,查询条件包括告警级别、告警类型、告警状态(是否确认)、告警发生设备等。
告警确认表示该告警已经被确认并在处理,告警确认功能会在数据库中记录下确认人的信息,以便以后查询。只有确认过后的告警才可清除,清除后的告警将不会在告警列表中显示。
4.数据中心监控实时客户端
为便于集中和统一的控制营销系统的各个服务器和相关功能,即时得到系统的运行信息,数据中心监控系统提供一个实时客户端,客户端提供了一个控制和配置营销系统各种服务的控制环境。客户端运行在管理员的日常工作计算机上,随系统自动启动。平时最小化在系统托盘中。有系统故障时能弹出报警信息。管理员也可通过这个客户端完成数据中心监控的设置和查询。
提供的功能包括:
l应用服务器服务的常用参数配置、停止与重启
l数据库服务器的参数配置、停止与启动
l银电服务服务的参数配置、停止与启动
电力营销批处理任务调度系统的参数配置、停止与启动

详细请登录公司网站查询:www.bluetech.com.cn
已有 0 位对此文章感兴趣的网友发布了看法    
我来评两句 登录邮箱: 密码:
  匿名发表
相关案例
解决方案速查(共有 14131 个方案)
基础软件
安全保密
管理软件
办公软件
软件开发
系统网络
图形多媒体
辅助设计
行业专用
教育教学
电子政务
其他软件
接入
通信
网络
存储
IT服务
电子杂志订阅
点击电子杂志名称查看样刊
输入E-mail地址即可订阅
E-mail
重点推荐