电信 教育 政务 机械 汽车 船舶 交通 石化 烟草 服装 电力 金融 外贸 冶金 电子

NEC 双机热备/双机容错解决方案-IPTV项目高可用集群解决方案

2007-3-7 发布方:日电卓越 网友评论 0 条 点击进入论坛

IPTV运营特点

  IPTV(交互式网络电视),是利用IP网络,向用户提供视音频的节目。用户可以利用计算机或者电视机+机顶盒的方式享受供应商提供的各种服务。
  IPTV的出现,不但改变了以前视频运营的模式(由电视台独家提供视频内容转变到媒体大众化),而且还给多媒体的播出带来了一些新的变化,如时间平移、地点平移等等,人们可以随时随地的欣赏着自己喜欢的视音频节目。这种优点必将能促进IPTV的发展,IPTV的发展也将给人们带来更多更新的内容,使人们得到更多的享受。
  目前,国内以广电、网通为代表的运营商都在积极尝试开展以流媒体技术为核心的宽带运营服务。一批具有强大技术实力并且对流媒体技术有深入研究的企业纷纷投入巨资推出各具特色的IPTV解决方案。力争抓住这难得的历史机遇赢得巨大的商业利益。回顾一下这几年来宽带视频业务的发展历程,不难看到以流媒体为技术手段的宽带视频业务从一定程度上起到了繁荣网络应用市场,今后将会起到更为重要的作用。
  IPTV解决方案提供商依托先进的流媒体技术向千家万户提供一种前所未有的全新的大众媒体服务。因为受众的对象涉及每一个人,系统稍有闪失将会造成严重的社会影响和政治影响,对IPTV运营商来讲将会造成巨大经济损失和信誉损失,后果极为严重。这种形势下,系统的高可靠性、高可用性和高扩展性成为运营商重点考虑要素。

 NEC高可用解决方案

 应用背景

 IPTV在中国具有极大的商业价值,各运营商蓄势待发在做爆发前的准备工作。许多关键性的应用系统被部署到了Windows和Linux平台上,如企业数据库Oracle、MySQL,Apache, TomCat等等。这些关键应用对企业的运营和发展起着至关重要的作用,一旦发生宕机故障或应用停机,将给企业带来巨大的经济损失。在一些行业,当业务系统发生宕机故障时,每小时所损失的费用可达到数千万元。可见,对那些需要保障信息安全,和提供不间断的各种服务的企业来说,系统的容错性和不间断性显得尤为重要。如何保障企业的各种关键应用持续运营,达到企业永续经营的良性循环,已成为当今企业和IT领域急需解决的关键问题。因此,必须采取适当的措施来确保计算机系统的容错性和不间断性,以维护系统的高可用性和高安全性,提高企业形象,争取更多的客户,保证对客户的承诺,减少人工操作错误、达到系统可用性和可靠性为99.999%。

 高可用集群解决方案简介

 什么是高可用集群系统:
  集群技术是将多台服务器联在一起,组成一个透明的系统,这些服务器之间互相共享资源,如IP、数据或应用软件等。对最终用户来说,可把这个集群系统当作一个虚拟的服务器来使用。当集群中的某台服务器由于软件或硬件原因发生故障时,集群系统可以把IP、应用软件等资源切换到其他健康的服务器上,即另外的服务器可立即取代该故障机的职责,继续为用户提供服务,使整个系统能连续不间断的对外提供服务,从而为企业24x365的关键业务提供了可靠的保障。

 导入高可用集群系统的效果:
  通过集群技术的运用,可以为用户带来如下好处:
   高可靠性
  保证集群系统上的关键数据和业务的运行连续性及可被访问。
   高可用性(Availability)
  缩短系统故障的平均修复时间,减低系统故障带来的恶劣影响和经济损失。
   高扩展性(Scalability)
  集群系统可根据业务需求灵活增加服务器节点,从而提高了集群的处理性能。
   减低客户端/服务器架构的系统维护成本;
   避免单点故障。

  NEC ExpressCluster产品概要

  磁盘结构
  ExpressCluster for Linux Ver3.1既可以使用本地磁盘来构筑纯软件的镜像型集群系统,也可以使用专门的共享磁盘装置来构筑大规模的共享磁盘型集群系统,充分满足了客户的不同需求。

 共享磁盘系统:
  集群各服务器之间共享磁盘阵列设备。当活动服务器发生故障时,待机服务器将使用共享磁盘上的数据来继承业务。通过使用共享磁盘,覆盖数据量可达到TB级。
 镜像磁盘系统:
  通过专用高速网络(私网)对集群服务器上的数据磁盘进行镜像化。当活动服务器发生故障时,待机服务器使用镜像盘上的数据来继承业务。适合于数据容量为数十到数百GB的系统。

  故障监视
  集群系统对服务器上发生的各种故障进行监视,发生故障时将业务转移到其他服务器上(失效切换)。NEC ExpressCluster可监视以下故障:

服务器关机/切断电源 AP或服务停止失效切资源(如Public LAN)查出异常
ExpressCluster服务器模块本身的异常等。

失效切换资源
在ExpressCluster中,包含在失效切换组中的资源主要有以下几种:
 镜像磁盘/切换分区
应用程序为保存继承数据所用的磁盘分区。
 IP地址(即浮动IP)
通过使用浮动IP地址与业务进行连接,使客户端无须注意失效切换引起的业务执行位置(服务器)的变化。
 应用程序(脚本)通过脚本启动业务应用程序。

运行形态
  ExpressCluster for Linux Ver2.1为用户提供了单方向、多方向都3种不同的待机方式,如下所示:  
 单方向待机(Active/Passive)
  一端服务器为当前运行服务器,用来运行业务,而其他服务器为待机服务器,不运行业务。这是一种最简单的使用形态,可以构筑高可用性系统,保证失效切换后不会出现性能下降。

 同一AP的双方向待机(Active/Active)
运行跨多个服务器的业务应用程序,相互进行待机。

 不同AP的双方向Standby(Active/Active)
在不同服务器上运行类型不同的业务应用程序,相互进行待机。

 ExpressCluster关键技术特点 
  ExpressCluster以下几方面的关键技术,为用户的关键业务系统提供强大的高可用性、高可靠性和灵活的扩展性。
 支持多平台
  ExpressCluster支持目前国内几乎所有主流的Windows和Linux操作系统平台,如Windows   NT/20002003,RedHat,Turbolinux,MIRACLELINUX,Novell SUSE LINUX,RedFlag等。

 支持IA-64和EM64T等64位架构的服务器和操作系统平台

 自动监测
  ExpressCluster可自动检测和恢复服务器和应用程序的故障,不仅可以监视服务器故障,还可以监视IP地址、磁盘设备、用户应用程序等等各种资源的故障。当检测出故障时,ExpressCluster能根据事先制定的切换策略,自动把应用程序和其他故障资源以失效切换组为单位切换到其他的服务器上,并继续正常地对外提供服务。

 多种心跳监测方式
  提供网卡(公网/私网)、COM(RS-232C)、磁盘心跳这3种心跳方式,更加提高了集群系统的可靠性。

 ExpressCluster不仅可以监控硬件故障,还可以监控软件和操作系统故障。

 支持多达4种的集群工作模式,客户可根据系统需求,任意配置单活(Active/Standby)、双活  (Active/Active)、N+1备份以及N备份这4种集群工作方式,极大满足客户的业务配置要求。

 支持多种存储技术(SCSI,RAID,IDE,Fibre Channel,SAN等)。

 在镜像解决方案中,提供ExpressCluster FastSync Option模块(即差分备份模块),可直接对2台服务器的镜像盘中的差分数据进行恢复,而不必通过全盘Copy来做恢复,大幅缩短了镜像恢复所需的时间,提高了镜像恢复的性能。

 简单易用的图形用户接口,轻松管理集群系统;

 除了GUI管理工具外,还提供了基于Web浏览器的状态监视服务,用户在任何一台机器上访问集群的虚拟IP地址即可监视集群的运行状况;

 通过编辑Group中的脚本,即可轻松实现应用程序的切换;

 提供操作简便的Script Wizard,让用户轻松配置脚本;

 除了对应用程序和服务的常规级别的监视外(所谓常规监视即进程死活级别的监视),

 ExpressCluster还提供了一系列监视选项产品,如Database Agent,Internet Server Agent, LAN Agent, File Server Agent等,这些监视选项产品可对ExpressCluster上运行的数据库等应用程序和服务的僵死状态(Stall)进行监视,从而为用户的关键业务系统提供了更深层次的保护。

 IPTV高可用集群应用案例

 IPTV系统结构示意图 

IPTV高可用环境 

全省十多个地市全部应用NEC高可用性解决方案100套ExpressCluster加固应用系统? RedHat Linux AS 3.0
保护MySQL数据库+IPTV运营系统
基于Linux系统的镜像型+共享型集群系统
提高系统高可用性,降低系统运营风险
系统可用性和可靠性达到为99.99%

   SingleServerSafe单服务器高可用容错软件

 产品概要

  在复杂化、高功能化的现代IT社会,服务器宕机所产生的影响和损失是无法估量的,由此产生的对服务器系统的高可靠性和高可用性的要求也越来越高。由于初期投资等原因,企业一般只对重要的单服务器进行高可用设置,对于高可用性的需求也从原来的以主干系统(多机集群系统)为中心,正在向单一的部门服务器、店铺服务器(单机系统)方面扩展。因此,单机系统的高可用性也日益重要起来。
  ExpressCluster SingleServerSafe(以下简称SSS)依据市场的需求,将ExpressCluster的故障诊断、故障恢复技术应用在在单机系统中,能够很方便地实现单机系统的高可用性。

 功能特性

  SSS对单机系统进行软硬件的监控,当发生故障时,通过进行系统的恢复处理,来实现高可用性。
  监视功能
  硬件监控(NIC监控,磁盘监控)
  软件监控(OS监控,服务/进程监控,用户应用程序监控)
  恢复功能
  服务器的重新启动,软件的重新启动

  软件监控
  按照固定间隔时间对应用程序,服务等进行检查,监测出异常后,实施重启处理。
在规定的重试次数内不能解决问题时,实施服务器重新启动处理

  OS监控
  按照固定间隔时间检查OS的状态,即使在一般的应用程序(DB,监控SW等)不能运转的状态下,系统发生异常时,也能实施服务器重新启动处理

  磁盘监控
  按照固定间隔时间对内置磁盘进行I/O访问,发生异常时实施服务器重新启动处理

  NIC监控
  监视出通信异常后,实施NIC的切换或服务器重新启动处理

  与ExpressCluster选件结合进行监控
  通过使用ExpressCluster的选项产品(DB监控,IIS监控,文件系统监控,NIC监控)进行联合监控,发现异常时,实施业务组的重新启动处理

  支持Windows和Linux平台

已有 0 位对此文章感兴趣的网友发布了看法    
我来评两句 登录邮箱: 密码:
  匿名发表
相关案例
解决方案速查(共有 14347 个方案)
基础软件
安全保密
管理软件
办公软件
软件开发
系统网络
图形多媒体
辅助设计
行业专用
教育教学
电子政务
其他软件
接入
通信
网络
存储
IT服务
电子杂志订阅
点击电子杂志名称查看样刊
输入E-mail地址即可订阅
E-mail
赞助商链接