HACMP 是 High Availability Cluster Multi-Processing 的缩写,是 IBM 公司在 Power系列 AIX 操作系统上的高可靠集群软件,配置冗余,消除单点故障,保证整个系统连续可用性和安全可靠性。HACMP是利用网络来侦测主机及网卡的状况,搭配AIX所提供的硬盘镜像等功能,在主机、网卡、硬盘控制卡、硬盘或网络发生故障时,自动切换到另一套备用元件上重新工作;若是主机故障还切换至备份机上继续应用系统的运行。
作为双机系统的两台服务器同时运行 HACMP 软件,备份方式有三种 :
• 一台服务器运行应用,另外一台服务器做为备份;
• 两台服务器除正常运行本机的应用外,同时又作为对方的备份主机;
• 两台服务器同时运行相同的应用,需要数据库的支持。
两台主机系统在整个运行过程中,通过 “心跳线”相互监测对方的运行情况 (包括系统的软硬件运行、网络通讯和应用运行情况等); 一旦发现对方主机的运行不正常 (出故障)时,故障机上的应用就会立即停止运行,本机(故障机的备份机)就会立即在自己的机器上启动故障机上的应用,把故障机的应用及其资源(包括用到的IP地址和磁盘空间等)接管过来,使故障机上的应用在本机继续运行;应用和资源的接管过程由 HACMP 软件自动完成,无需人工干预;当两台主机正常工作时,也可以根据需要将其中一台机上的应用人为切换到另一台机 (备份机)上运行。
HACMP冗余拓扑图:
特点
• 增强了监控网络间群集的系统管理功能
• 并行访问资源使应用程序的执行和扩展性更好
• 配置灵活,覆盖所有power systems产品
• 扩展的群集管理工具适合安装、配置和管理您的高可用环境
• 增强的扩展性可达32个节点,所有power systems产品都拥有HACMP增强扩展性(ES)
• HACMP/ES提供对可能的硬件和软件故障的监控和报告
• HACMP/ES用和可以选择缺省的或用户定义的高可用性事件和资源监控器
• 高可用性减少了由已知事件和意外事件引起的运行中断
• 在群集运行期间可以对群集器进行动态重新配置和升级
优势
• 为各个行业(包括零售网点、在线银行、电话营销、诉讼处理或其他面向事务的应用)的关键应用建立高效低成本的群集环境;
• 创建更复杂的并行访问群集,其中切换重启动延迟最短,可以激活多达8个系统,运行相同的应用程序并共享相同的物理资源;
• 在不中断工作流和情况下对系统进行升级和维护;
• 为分布式网络建立定制的能处理群集的应用程序并用群集管理器监控网络活动;
• 向HACMP群集系统中的共享磁盘和处理器资源的其他RS/6000平台发布应用;
• 结合AIX的逻辑卷管理器(LVM)磁盘镜像技术提高磁盘可靠性;
• 使用AIX的本地和远程管理工具检测并修复系统硬件错误。
IBM服务器高可用性方案价值:
通过 IBM高可用性解决方案,从多方面提高客户IT基础架构的整体可用性,使客户获得:
• 提高系统可用性,增加业务的可持续性;
• 实现应用层面的透明接管与恢复;
• 简化数据恢复与应用恢复的流程;
• 关键业务应用程序免受故障影响;
• 提高业务服务水平,提升客户满意度。