IBM SYSTEM X与EXPRESSCLUSTER X3.0联合测试报告

[摘要]IBM System x3850 X5服务器作为IBM System x系列服务器的旗舰产品,在最大限度降低成本的前提下,通过提供更灵活的部署流程、更好的扩展性、更高的容量和带宽,为用户带来最高的性能体验。
一、背景

    IBM System x3850 X5服务器作为IBM System x系列服务器的旗舰产品,在最大限度降低成本的前提下,通过提供更灵活的部署流程、更好的扩展性、更高的容量和带宽,为用户带来最高的性能体验。

    NEC EXPRESSCLUSTER高可用集群软件作为高可用集群领域的领军产品,多年来致力于集群系统的研究,通过灵活的集群架构、全面的系统监视,迅速的故障切换、稳定的数据镜像,为用户提供最高可靠性、最高稳定性的高可用集群解决方案。

    本次测试将验证NEC EXPRESSCLUSTER高可用集群软件在IBM System x3850 X5服务器上的运行状况。通过全面的测试证明,集合了NEC EXPRESSCLUSTER和IBM System x3850 X5的高可用集群架构,可以为用户业务系统提供最高性能、最高可靠性的基础平台。 
 
 
 
二、环境构成
  • 硬件环境
设备名
型号
数量
服务器
IBM SYSTEM X3850 X5
2台
本地硬盘
-
280G
网卡
Broadcom BCM5709C NetXtreme II GigE
2块/每台服务器
存储设备
-
-
其他
-
-
  • 软件环境
操作系统
Windows 2008 R2 企业版
业务软件
DB2 EXPRESS V9.7
HA软件
EXPRESSCLUSTER X3.0 for Windows
 
 
 
 
 
三、测试报告
   
    1.正常动作确认
   
    WebManager页面确认
项目
确认内容
WebManager连接
经确认,WebManager页面可以正常连接。
 
    服务器监视
项目
确认内容
服务器
WebManager页面确认服务器正常运行。
 
    心跳、网络分区解决方案确认
项目
确认内容
LAN心跳资源
WebManager页面确认LAN心跳资源正常运行。
Ping网络分区解决方案
WebManager页面确认Ping网络分区解决方案资源正常运行
 
    业务组、组资源确认
项目
确认内容
业务组
WebManager页面确认业务组正常运行。
镜像磁盘资源
WebManager页面确认镜像磁盘资源正常运行。
浮动IP资源
WebManager页面确认浮动IP资源正常运行。
服务资源
WebManager页面确认服务资源正常运行。
 
    监视器确认
项目
确认内容
镜像磁盘监视资源
WebManager页面确认镜像磁盘监视资源正常运行,且没有监视到错误信息。
镜像连接监视资源
WebManager页面确认镜像连接监视资源正常运行,且没有监视到错误信息。
IP监视资源
WebManager页面确认IP监视资源正常运行,且没有监视到错误信息。
NIC Link Up/Down资源
WebManager页面确认NIC Link Up/Down资源正常运行,且没有监视到错误信息。
服务监视资源
WebManager页面确认服务监视资源正常运行,且没有监视到错误信息。
DB2监视资源
WebManager页面确认DB2监视资源正常运行,且没有监视到错误信息。
 
 
   
    2.异常动作确认
项目
操作
确认内容
主服务器掉电
确认业务组工作在test01后,拔掉test01的电源
test01被关闭,从WebManager页面确认,业务组切换到test02上正常工作。
私网断线
确认业务组工作在test01后,拔掉test01的私网网线
WebManager页面确认,业务组不切换,心跳资源报警,镜像连接监视资源报警
公网断线
确认业务组工作在test01后,拔掉test01的公网网线
WebManager页面确认,ip监视资源和miiw监视资源报警,业务组切换到test02上正常工作。
服务资源
确认业务组工作在test01后,在test01的服务管理页面关闭SNMP Trap服务。
WebManager页面确认,snmp服务监视资源监视到故障并报警,业务组切换到test02上正常工作。
 
 
   
    3.切换动作确认
序号
操作
确认内容
1
启动主备服务器【test01、test02】
WebManager页面确认test01和test02都处于【已启动】状态。业务组工作在test01上。
2
手动切换业务组到test02
业务组在test02上正常启动。
3
手动切换业务组到test01
业务组在test01上正常启动。
4
从服务器的【开始】菜单关闭test01
test01被关闭,业务组切换到test02上,并能够正常启动。
5
WebManager页面关闭test02
业务组停止,test02被关闭。
6
启动test01和test02
WebManager页面确认test01和test02都处于【已启动】状态。业务组工作在test02上。
7
手动切换业务组到test01
业务组在test01上正常启动。
8
从服务器的【开始】菜单关闭test01
test01被关闭,业务组切换到test02上,并能够正常启动。
9
从服务器的【开始】菜单关闭test02
业务组停止,test02被关闭。
10
启动test01和test02
WebManager页面确认test01和test02都处于【已启动】状态。业务组工作在test02上。
11
手动切换业务组到test01
业务组在test01上正常启动。
12
WebManager页面关闭所有集群服务器
业务组停止,test01、test02被关闭。
13
启动test02【不启动test01,等待5分钟后】
WebManager页面确认,业务组正常启动,工作在test02上。
14
启动test01
WebManager页面确认test01处于【已启动】状态。
15
从服务器的【开始】菜单关闭test02
test02被关闭,业务组切换到test01上,并能够正常启动。
16
启动test02
WebManager页面确认test02处于【已启动】状态。
17
WebManager页面关闭所有集群服务器
业务组停止,test01、test02被关闭。
18
启动test01【不启动test02,等待5分钟后】
WebManager页面确认,业务组正常启动,工作在test01上。
19
启动test02
WebManager页面确认test02处于【已启动】状态。
20
从【开始】菜单关闭test01
test01被关闭,业务组切换到test02上,并能够正常启动。
21
启动test01
WebManager页面确认test02处于【已启动】状态。
22
WebManager页面关闭所有集群服务器
业务组停止,test01、test02被关闭。
23
启动test01和test02
WebManager页面确认test01和test02都处于【已启动】状态。业务组工作在test01上。
 
 
   
    4.数据库动作确认
项目
操作
确认内容
启动业务组
WebManager页面手动启动业务组。
WebManager页面确认,业务组正常启动,工作在test01上。
数据库连接
test01服务器上,通过客户端连接DB2数据库。
DB2数据库可以正常连接。
数据库操作
DB2数据库上创建一个新表。
DB2数据库上可以正常执行创建表操作。
停止业务组
WebManager页面手动停止业务组。
业务组被停止。DB2数据库无法访问。
移动业务组
WebManager页面将业务组从test01移动到test02。
业务组切换到test02上,正常启动。从客户端访问DB2,数据库可以正常访问,业务数据与test01一致。
DB进程异常
确认业务组工作在test01上后,在test01的任务管理器中停止DB2进程。
DB2监视资源监视到数据库错误,将业务组切换到test02上,正常启动。从客户端访问DB2,数据库可以正常访问,业务数据与test01一致。
DB访问异常
确认业务组工作在test01上后,在test01服务器上,通过DB2客户端,删除【DB2WATCH】表。(DB2WATCH是DB2监视资源的监视用表,删除该表会触发数据库的访问错误。)
DB2监视资源监视到数据库错误,将业务组切换到test02上,正常启动。从客户端访问DB2,数据库可以正常访问,业务数据与test01一致。

 
四、性能测试
 
    1.日常CPU、内存占用情况

 
    2.失效切换过程中的CPU、内存占用情况
    测试内容包括对当前的业务系统进行十次失效切换,记录每次切换过程中CPU的峰值状况,并截图记录CPU和内存的波动状况。
    a)失效切换的过程中,CPU占用峰值统计列表:

 
NO.1
NO.2
NO.3
NO.4
NO.5
CPU
占用峰值
6%
6%
7%
6%
6%
 
NO.6
NO.7
NO.8
NO.9
NO.10
CPU
占用峰值
6%
6%
5%
6%
6%
    b)失效切换的过程中,CPU和内存的占用状况截图:

 
    3.失效切换时间
    测试内容包括对当前的业务系统进行十次失效切换,记录每次切换所花费的时间。(系统业务包括浮动IP、镜像磁盘、DB2数据库、SNMP服务)

 
NO.1
NO.2
NO.3
NO.4
NO.5
耗时
21
23
22
25
24
 
NO.6
NO.7
NO.8
NO.9
NO.10
耗时
25
22
25
24
23
(单位:秒)
 
    4.全盘同步时间
    测试内容包括对镜像磁盘分区进行十次全盘拷贝,记录每次拷贝所花费的时间。(镜像磁盘分区大小为200GB,数据容量为800M。)

 
NO.1
NO.2
NO.3
NO.4
NO.5
耗时
165
163
151
160
152
 
NO.6
NO.7
NO.8
NO.9
NO.10
耗时
160
150
160
160
160
(单位:秒)
 
 
五、结论
    经过在IBM SYSTEM X3850服务器上结合DB2数据库对EXPRESSCLUSTER进行的测试。可以得到如下结论:
  • 通过配置高可用集群,可以在主服务器出现硬件、OS、应用程序故障时,有效地监视到故障信息,并将业务切换到健康的备用服务器上。从而提高业务系统的稳定性,保证业务系统7*24小时持续稳定地运行。
  • 通过EXPRESSCLUSTER的镜像技术,可以在不使用共享存储的前提下,利用服务器本地磁盘间的数据镜像来构建高可用集群。从而大幅节省构建高可用集群的硬件成本。另外,EXPRESSCLUSTER的数据镜像技术可以为重要的业务数据提供物理冗余备份,保证即使在单机磁盘出现故障时,也不会造成数据的丢失,从而确保核心业务数据的安全性。
  • 通过EXPRESSCLUSTER的数据库监视选件,可以在死活级别监视的基础上实现对数据库响应结果的监视,提供更将精确的监视功能。确保在数据库出现任何访问故障时,集群都可以及时监控故障,实施有效的故障切换。
  • EXPRESSCLUSTER消耗系统资源极少,日常情况下CPU占用几乎为零,内存占用大概在55M左右。在进行业务系统失效切换过程中,CPU最多会有大概6%左右的消耗。
  • EXPRESSCLUSTER可以迅速切换业务系统。在由浮动IP、镜像分区、DB2服务和SNMP服务组成的测试环境中,可以在23秒左右完成系统业务切换。
  • EXPRESSCLUSTER可以完成迅速的全盘镜像同步。在200G的镜像分区和800M的数据构成的测试环境中,可以在160秒左右完成全盘镜像同步动作。
  • IBM SYSTEM X3850服务器结合EXPRESSCLUSTER的高可用集群解决方案可以提供更快的失效切换速度,更短的停机时间,更小的性能影响,更高的系统可用性体验。

六、附录
 
 
 
    IBM eX5系列产品介绍
 
 
 
    高端工作负载给服务器带来日益增长和变化的挑战。除了需要系统提供更大容量的内存外,还要求实现少投入、多工作,并且设法简化部署与运营流程。一直以来,提高系统可用性及增强系统管理的全面性在客户应用中都显得至关重要,尤其近几年这些需求变得更为迫切。
 
 
 
 
    形形色色的挑战也给技术创新创造了机会。IBM® eX5便是此类创新的结晶。这个系列的全新高端服务器采用第五代IBM X架构®技术,将x86十几年的创新里程推向巅峰,令整个业界始料未及。采用最新一代X架构的eX5,再次引领企业朝着虚拟化应用、平台管理和提高能源效率进行转型。
 
 
 
 
    1.今天的挑战,明天的机会
    eX5将第五代IBM X架构与下一代Intel® Xeon® 处理器结合在一起,提供高端的企业级服务器产品,主要应用于工作负载需求持续变化的环境。灵活的配置和模块化组件式设计,允许您选择多种实施方案,将价格低廉的简单配置作为起点,然后一路升级到企业级配置。此外,这个系列产品还使用不同的外观和尺寸提供不同配置,因此,能够支持大多数的企业应用、服务器整合及虚拟化环境的应用。
 
 
 
 
    eX5系统服务器均利用业界标准的组件及IBM创新成果,以便帮助您最大限度地提高内存容量、降低成本、简化部署流程。这些服务器系统提供的以下功能,将为您构建更加智能的动态基础架构奠定坚实基础:
  • 通过独特的扩展功能来提供最大内存
  • 快速的集成数据访问
  • 节点分区功能提供极高的灵活性
  • 提供面向目标工作负载的优化配置
    2.最大限度地增加内存容量
    由于业务和技术条件总在快速变化,因此,IBM将eX5设计成轻松适应不断变化的工作负载需求。eX5最多支持8个插槽、64个内核的处理能力、并且通过MAX5提供无与伦比的eX5内存扩展功能。由于能够最大限度地提高机柜式和刀片式服务器的内存容量,因此,您可以支持更多内存。
 
 
 
 
    3.最大限度地降低成本
    eX5可以帮助您充分利用现有资源 - 包括空间、存储容量和学科成本等- 从而提高经营效力。您可以在每个服务器上整合更多设备,并且每分钟处理更多交易,无需占用大量的内存带宽来支持高密度系统。由于该系统在小巧的外观中提高了系统利用率,因此,您可以降低前期的购置成本和软件成本,并且减少能耗。通过预配置的IBM eXFlash技术,您可以大幅度降低数据库存储和能源成本。
 
 
 
 
    4.简化部署流程
    eX5采用低成本、高能效的设计,提供预配置的工作负载优化式机型来加快部署和创收速度。所有的刀片服务器及2路服务器和4路服务器都采用相同的单一架构,从而帮助缩短检测时间并且简化配置和错误处理流程。当您的环境发生变化时,您可以在同一个可扩展的平台上独立扩展处理器、内存、网络和存储I/O,以便简化设备升级的部署流程并且降低设备升级成本。
 
 
 
 
    此外,节点分区和自动故障切换功能可以提高灵活性并且延长运行时间,从而帮助您简化运营工作。
 
 
 
 
    IBM OnForever系统设计为您的关键任务工作负载提供高级可靠性,而智能的主动系统管理功能则能够进一步简化运营工作。IBM Systems Director提供基于Web的GUI和易用工具,能够同时简化物理和虚拟资源的管理工作。IBM Systems Director Active Energy Manager能够帮助您监控、评估和管理功耗,从而降低功耗及成本。
 
 
 
 
    IBM System x3850 X5
 
 
 
    System x旗舰产品,提供领先的扩展性和性能。通用的4路服务器、4U机架化式、可高度扩展的企业级服务器,为计算密集型和内存密集型工作负载提供最大的利用率、可靠性和性能。
 
 
 
 
    1.最大限度地提高内存容量
  • 支持64个处理器线程和1TB内存容量,数据库和虚拟化性能分别是2插槽 x86 (Intel Xeon 5500系列)系统的3.3倍和3.6倍
  • 采用MAX5内存扩展技术,可以多支持50%的虚拟机和提供领先的数据库性能
    2.最大限度地降低成本
  • 通过更多的内存插槽,使用成本相对低廉内存即可配置出需要的容量和性能
  • eXFlash支持高达48万内部 IOPS(每秒种输入输出操作),运行的本地数据库性能是采用传统硬盘的40倍,而成本远低于磁盘系统
    3.简化部署流程
  • 灵活节点分区和节点自动故障切换技术,用于最大限度地提高灵活性并且延长应用的正常运行时间
  • 预定义的数据库和虚拟化工作负载引擎,用于实现快速部署与创收。

    随着IT技术的不断发展,各行各业对IT业务系统的要求也在日益提高。未来的IT业务系统除了需要满足用户的使用需求之外,如何能够在节省成本的前提下提供更加优秀的用户体验,将成为IT技术发展的核心问题之一。




免责声明:

本站系本网编辑转载,会尽可能注明出处,但不排除无法注明来源的情况,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系, 来信: liujun@soft6.com 我们将在收到邮件后第一时间删除内容!

[声明]本站文章版权归原作者所有,内容为作者个人观点,不代表本网站的观点和对其真实性负责,本站拥有对此声明的最终解释权。