随着信息化水平的高速发展,国内大部分银行都在2000年初完成了信息系统大集中,银行业务运营高度依赖信息系统,任何信息系统故障都有可能影响到银行的正常运转,从而造成重大的经济损失和不良社会影响,影响银行的长期可持续发展。同时为了加强企业的风险管理水平,提高银行自身的核心竞争力,并遵循监管机构越来越明确和严格的监管要求,各银行纷纷建立起自身的灾难备份体系,建立了初步的灾难备份系统(DR),拥有数据级或应用级灾难备份能力。部分有条件的大型银行建设了“两地三中心”灾备布局,并制定了相应的应急响应流程和DRP预案,并持续的进行演练,能有效应对各种突发事件场景,确保了业务的持续。
由于技术的发展限制,国内银行业早期都选择了当时最为成熟的技术,即基于存储同步/异步复制的灾备技术。但是随着十多年技术的快速发展,传统的存储级灾备技术的缺陷和弊端日益明显:
1. 灾备端资源闲置的主备模式
存储同步/异步复制过程中,灾备端存储处于复制状态,不能装卸使用,灾备端资源都处于冷备闲置状态,不能承担业务负载。
2. 切换流程繁多且风险高,RTO过长
需要切换时,涉及步骤和流程较多,如需要断开存储复制关系、在数据库服务器上装载存储、启动数据库、启动应用等,根据实际使用经验,切换过程非常顺利时还需半小时,如果任何环节出现异常,则切换可能持续数小时,甚至切换失败。
3. 应对突发事件场景受限
根据存储级灾备的技术原理,将生产端的存储快照复制到远端存储,故容易将错误的数据也原样复制,不能应对常见的逻辑错误。
4. 成本高
采用存储级灾备技术,需要生产端和灾备端部署同厂商同型号的存储,支付昂贵的复制license费用,并部署高带宽网络,导致整体建设成本过高难以持续。
5. 运维复杂
因灾备端平时处于冷备状态,生产系统频繁的改造、发布变更,不易同步发布到灾备端,导致生产端和灾备端的基准难以维持一致,增加切换时的风险;同时增加了灾备系统管理维护的工作量和工作难度。
随着行业竞争的加剧,银行对灾备系统提出了新的挑战,要求:
1. 避免传统的灾备资源闲置浪费的灾备模式,实现灾备资源的充分复用;
2. 构建数据中心之间的双活,实现数据中心高可用;
3. 实施部署便利,管理工作量低,维护便利;
4. 能有效应对各种故障场景,快速监测和响应,自动切换;
5. 实现业务数据本地备份和异地备份,解决数据逻辑错误。
为了切实应对用户面临的挑战,华为提供了虚拟化网关双活解决方案。虚拟化网关双活解决方案,提供包括网络、虚拟化存储网关、存储、SAN网络设备等一整套基础架构,基于生产中心和同城数据中心进行跨站点部署,数据中心之间经过南北环多条裸光纤实现冗余,两个数据中心同时对外提供业务访问能力,实现应用级的A-A双活方案架构,所有服务器资源均可对外提供业务。任意单点故障可保持核心数据库和虚拟机业务不中断。即使单数据中心完全宕机的情况下,核心数据库业务也可以实现业务零中断,故障数据中心的虚拟机可自动异地恢复,其架构示意图如下:
相对于其它厂商的灾备解决方案,华为的虚拟化网关双活解决方案消除了传统灾备的弊端,满足了业务日益增长的持续运作的需求,其主要亮点是:
1. 灾备资源用于承担生产负载,避免了灾备资源的闲置和浪费;
2. 端到端完全双活的架构,减轻运维难度和工作量,简化了各种突发事件场景下的切换流程,也大幅降低切换时间(RTO可达秒级);
3. 实施无风险,保持生产环境不变,避免影响业务运营;
4. 支持异构存储设备,避免在灾备端部署与生产环境同等规格的昂贵的存储设备和存储复制license费用,降低成本。
同时,为了便于灾备系统的运维管理,华为部署了自主研发的容灾管理平台,以对容灾系统进行实时的健康状态监测(实时显示每一个系统当前的健康状态,是否具备切换条件,实时的RTO&RPO指标);当突发事件发生后,可以实现自动化的一键式切换,以最大化减少业务停机时间;在平时的容灾系统运维管理工作中,电子化的平台亦能够极大减轻管理工作量及维护压力,实现故障修复及升级改造业务不停机。
通过部署华为的金融容灾双活解决方案,用户可以建立完善的容灾体系,包括容灾技术架构,需求分析,技术验证,项目实施,后续管理维护等;同时,建立了电子化、自动化的容灾管理平台,可实现实时的容灾健康状态监测和灾难一键式自动切换,简化日常管理维护工作量和压力。华为自2012年推出金融容灾双活解决方案以来,迅速得到了市场的认可,其卓越的性能和成熟可靠性得到了充分的验证,能够有效应对各种突发事件场景,确保任何事件场景下的业务持续,在国内大型银行、保险公司进行了大量部署,为金融用户的关键业务保驾护航。