遭遇航班延误等不正常现象时,旅客大闹机场甚至航班的事件屡见不鲜。这让诸多航空公司感觉非常头疼,希望能够找到彻底解决的办法。
汇聚了航班信息和旅客信息的大数据系统,或许可以帮上这个忙。
当然,航空大数据能做的绝不仅仅是这些。东方航空在IBM的支持下,通过采用流数据处理技术,同时实现了营销方式和客户服务的升级。
航空公司向服务转型
作为中国的三大航空公司之一,东方航空的机队规模排名全球第九,旅客运输量排名第七。但对于以“世界一流”为发展愿景的东方航空来说,仅有规模还不足够。为此,东方航空提出了“精准、精致、精细、精彩”的服务理念,要实现从卖座位到卖服务的转型,从规范化服务到个性化服务的转型。
业务战略已经足够清晰,IT部门的挑战随之而来。东方航空高级项目经理刘建国说,过去IT只是个单纯的工具,现在则要成为业务的载体。要想为旅客提供个性化服务,就首先要通过数据来了解旅客。
在国内,中国航信是所有民航数据的拥有者,会随时通过XML报文的方式把大量的数据传输给航空公司。过去,这些半结构化数据并没有得到很好的利用;如今,它们成为了宝贵的数据资产。而这些数据只有得到实时处理,才能发挥其价值。
那么,如何对它们进行处理和分析呢?最终,东方航空采用IBM的InfoSphere Streams的流数据处理技术构建了一个实时数据平台,从而为下一步的营销决策和旅客服务奠定了基础。
数据是有时间价值的
众所周知,大数据具有4V特征:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。IBM在此基础上更增加了Veracity(可信性),因为如果失去数据可信度,分析结果的价值也就跟着失去了。对于东方航空来说,这些大数据特征同样适用,而实时特征最为突出。
所谓流数据处理,简单地说就是,来一条数据,处理一条数据。东方航空从中国航信获得的,是旅客的购票订座、值机离港等实时数据。其中,离港数据为每秒1200条,订座数据为每秒9000条。这样,每天的数据量可以达到1800多万条。当然,这个数据量并不是很大,但其是报文形式的,算是非结构化数据,需要进行解析。
最最重要的是,这些数据是实时产生的,必须要得到实时处理,才能及时为营销和服务提供决策依据。刘建国对此解释说,数据是有时间价值的,实时数据更有价值。这正是东方航空引入IBM流处理处理平台的原因所在。
为业务决策提供依据
刘建国说,流数据处理平台,在东方航空的大数据系统中处于非常重要的地位。从中国航信获取的数据,通过InfoSphere Streams的处理,变成了结构化数据,随时发送给业务部门,为业务部门的营销方式、定价策略、客户服务等提供数据参考。
文章开头提到的航班不正常引起的群体事件,大多是因为旅客没有及早得到消息,最后会迁怒于现场的客服人员,使后者面临着巨大的压力。有了这个大数据系统,当航班信息发生异动时,东方航空就可以在第一时间把相关信息传递给旅客,让旅客提前做好准备,从而大幅度降低不满意度。同样,这些信息也可以及时传递给航空公司的运行保障部门,提早准备预案。
在营销方面,获得了实时的客票销售数据后,东方航空就可以知道销售了多少座位,还剩多少座位,从而动态地调整定价策略。与此同时,东方航空还能够及时获得VIP旅客的出行信息,由地面服务人员为他们提供个性化的服务。
要实现上述功能,就需要大数据系统能够对东方航空从中国航信获得的每秒上万条数据进行即时处理,同时要与东方航空自己的会员信息和航位信息进行比对。
全程参与这个项目的IBM大中华区大数据平台高级技术顾问吴敏达说,传统上,这样的数据是要先入库、再分析,需要至少几个小时的时间,这显然无法满足东方航空的需求。引入IBM的InfoSphere Streams之后,数据的解析、拆包、分析、分发等都实现了实时处理,响应速度变成了毫秒级。
InfoSphere Streams对非结构化数据的有力支持、可扩展的架构、强大的实时动态分析能力、与现有业务的无缝连接,成为其赢得东方航空信赖的主要原因。
刘建国说,InfoSphere Streams作为成熟的商用软件,蕴含了丰富的经验积累,背后还有IBM的支持保障,可靠性高,这是开源软件所无法比拟的优势。