首页 > 行业案例 > IT运维大数据

IT运维大数据

2016-12-09 16:14  

基本信息

面向行业
应用领域

一、国家政策导向与客户需求
十三五”期间,国务院关于积极推进“互联网+”行动的指导意见中提出:要构建银行业互联网金融生态,积极推进核心应用体系改造升级,助推银行业务转型升级。为此银监会在《中国银行业信息科技十三五指导意见》中要求:“持续推进生产运维监控精细化、自动化、智能化建设,强化系统风险和故障的早预警、早定位和早处置。实现应用层面交易全流程、全节点监控全覆盖,结合应用系统交易特性及相关数据的分析对比,提升交易过程监控的智能化水平。强化容量管理,做好相关资源的动态规划,预防非计划性、突发性的容量瓶颈问题发生。强化运维、开发、安全、风险管理的信息共享和一体化协作,提升多方联动能力。加强运维大数据分析,利用运维大数据加强业务风险防控,探索利用运维大数据推动业务流程优化并支持业务创新。”

2016年,某全国性股份制商业银行为了应对银行业务的创新发展,银行信息化的深入和对客户体验的重视。响应银监会指导意见,重点保障大规模IT系统安全、稳定运行。为此,银行数据中心提出了智能化运维的目标,建立高效、智能的IT运维体系。目标简要概括为四个方面,“面向服务、灵敏感知、随需应变、智能处理”。

二、IT运维管理大数据需求


 


    该行所规划的IT运维管理大数据项目涵盖了应用分析、业务洞察、异常处理、趋势告警、智能评估、基线管理、安全审计七大主题。


 


基线管理
在规划中,该行先针对各应用系统日志与相关联的监控系统指标等历史数据借助大数据平台进行分析,为业务系统基线设定提供更可靠的数据依据,改变原有拍脑袋划硬杠杠的模式,使得数据中心生产管理更科学化、数据化。


 


趋势分析
以往的数据中心管理中都是系统指标超过基线才开始打报告申请系统的扩容等工作,这样的模式难以发现系统时点性隐患。而在强调客户满意度的今天,后台准备不足,无法快速响应客户需求,就可能导致满意度下降,甚至流失客户。基于IT运维大数据平台将结合实时指标数据与基线进行比较,及时发现时点性业务响应瓶颈。借助日志与监控指标分析快速问题定位,防范风险于细节之中。


 


系统画像
智能评估
目前,数据中心需要维护的大大小小有300多个,而随着银行互联网+的不断深入,创新业务不断推陈出新,所需要维护的业务系统将越来越多。而数据中心的人员就这些,其中专人重点保障的系统有20多个,其他系统就只能如同打田鼠一般出现问题再解决,这大大降低了客户的服务体验。大数据平台的价值就在于全方位、可视化地展现系统的健康度、临界状态,提供有所侧重的措施建议,使得数据中心有限的人力更有效、更有针对性的解决关键的问题。


 


应用分析
应用分析是结合智能评估对交易状态和健康程度进行综合深入分析,发现其中的缺陷、性能下降、交易成功率偏低等问题。


 


异常处理
当前银行系统从过去基于应用的架构转向面向服务的松耦合架构,业务功能以服务形式发布,通过参数化配置实现更高阶的产品或服务,这使得系统内部和相互间的逻辑关系比以往更为复杂。二是分布式系统架构逐步替代集中式的架构。不仅服务交付和业务连续性要求越来越高,而且更注重高性能和易扩展性。三是IT基础资源层层整合。随着虚拟化、云计算技术的发展和应用,网络、存储和计算等资源的边界日趋融合,软件定义程度不断提升,在降低成本并带来灵活性的同时,也带来管理复杂度提升和共享资源间相互影响等困扰。一个故障往往涉及业务系统、中间件、数据库、数据总线、网络、关联系统等,海量的日志使得运维人员需要投入大量时间排查定位。大数据平台将智能的对故障交易日志进行关联分析,使问题变得一目了然。同时结合知识库关联辅助,帮助运维人员快速解决问题。


 


业务洞察
进入移动互联网时代,客户消费模式的转变。使得银行需要时时刻刻面对如春运、双十一等“秒杀”类交易洪流,像双十一、618这些互联网电商促销日以及春运前后抢票这样的时点对于IT运维的都会产生巨大的冲击。为了应当各种交易高峰的冲击,大数据平台对客户的交易行为和交易状态进行分析,结合核心、卡系统、网银等重要系统业务处理模式进行分析。基于大数据平台对交易处理进行关联,通过用户数量、交易量的历史变化趋势和规律,与业务系统的其他性能指标(比如服务器的cpu利用率、内存利用率、磁盘利用率以及网络带宽)变化趋势,以及业务系统日志、数据库指标、中间件日志等进行综合对比分析,找出其中的业务处理瓶颈与增长规律和趋势。与云平台配合,多数据中心接入,线路加以流量自动分发,从容应对“秒杀”洪峰。

安全审计
安全审计是基于大数据将运维人员的访问过程进行细粒度的全过程操作记录及控制、全方位的操作审计,实现运维过程的“事前预防、事中控制、事后审计”。

三、解决方案


 


该行在IT运维大数据平台设计思路上采用分层和松耦合设计思想,通过基础应用平台功能,在后台完成数据加工、程序处理、整体接口调度等功能,在前台实现指标波动分析、趋势分析预测、业务关联性分析、临界状态监测等应用功能,并具备快速部署能力。

四、价值体现
透过IT运维大数据平台, 数据中心在过去建设的IT运维系统与管理制度的基础上, 从过去的事中与事后管理, 迈入事前管理的时代, 更积极主动的保护银行的业务生命线。
下一步,数据中心正在着手通过大数据平台研究一些运维指标的相关性。通过分析某几个行为可能会导致另外一个变量的变化,以预测可能的故障。这种预测是不带假设条件的,尽可能多的把各个维度的指标采集后归类处理,基于已知或者未知场景的推导进行分析, 通过预警平台的自学习与自动建立模型来进行处理。

 

赞 0个人觉得赞
logo

高伟达软件股份有限公司

规模:

网站: http://www.git.com.cn/

高伟达软件股份有限公司是深圳证券交易所上市公司(股票代码:300465),是中国领先的金融信息化软件产品和综合服务提供商。高伟达软件股份有限公司总部位于北京,下...

粉丝0

关联信息

关于我们 | 全生命周期管理 | 服务的客户 | 版权说明 | 联系我们

公司名称:北京金誉在线伙伴文化传播有限公司    备案号:京ICP备 15026202号-1

意见
反馈
返回
顶部