NEC双机软件解决方案
实现关键业务系统的高可用性和高可靠性
--NEC EXPRESSCLUSTER在河南IPTV项目中的成功应用
项目背景
2003年6月,党中央开始启动全国农村干部现代远程教育试点工作。农村干部现代远程教育,即利用广播电视、互联网等现代传媒手段,在同一时间内对不同空间的广大农村干部进行点播式、交互式和现场直播式教育。
河南省委组织部为了响应中央号召,与河南网通和当地IPTV解决方案提供商共同启动基于宽带网的农村干部现代远程教育试点工作。经反复论证决定采用了宽带IPTV解决方案。该方案不仅要求具备流媒体内容管理及处理技术,还要求系统具有强大的可扩展性、安全性和高可用性。
需求分析
由上面的介绍可以看出,对于需要保障障不间断服务的IPTV业务来说,系统的可用性和可靠性显得尤为重要。针对用户提出的对该IPTV系统在可靠性和容错能力上的如下要求:
支持RedHat Linux AS/ES 3.0,4.0
保护MySQL数据库和Apache业务系统;
故障自动切换,业务和数据自动接管;
双机集群采用Active/Active的双活工作方式;
双机采用纯软件方式的镜像集群方式。
我公司提出了基于EXPRESSCLUSTER集群中间件的镜像型HA集群解决方案,来实现系统中关键设备的双机容错,从而达到系统的高度可靠性和容错能力。
方案设计和实现
HA系统结构示意图:
根据客户的需求,我们将2台服务器作如下配置:
配置一套2节点的镜像型集群,客户数据存储于本地镜像盘上。根据客户的业务需要,配置成Active/Passive的工作方式,一台服务器(Server1)作为MySQL的主运行机,另外一台服务器(Server2)作为Apache的主运行机,同时,这两台服务器也作为对方服务器的备机,从而达到了互为备份的容错效果。
HA系统的工作原理:
EXPRESSCLUSTER将用户数据存储于本地镜像磁盘上,在Active/Active的工作模式下,2台服务器(Server1和Server2)都作为活动主机。当Server1发生故障时(包括各种软硬件故障),Server2通过心跳路径侦测到Server1的故障并自动接管所有Server1上的资源(如浮动IP地址、数据库服务、计算机名及镜像磁盘上的数据),并继续在Server2上运行数据库服务。对于客户端来说这种接管过程是不可见的,用户感觉不到这种故障切换,可以继续使用备份服务器提供的服务。待Server1修复后,可选择通过手工或自动方式将所有已切换到Server2的资源切换回到Server1。同理,当Server2发生故障时,Server1也会按照上述工作原理进行自动接管。
评价
经过用户严格测试,EC产品终凭借的开发技术和的性能指标战胜了竞争对手,赢得了用户的青睐。目前,该HA架构已经成功部署到河南全省18个地市及河北等其他省市的IPTV系统中,得提高了IPTV系统的可靠性,成为政务工程和村村通工程的强有力保障
查看全部介绍