打开翼海云峰的网站,一下子就被其Slogan吸引住了——“翼海云峰大数据,为数据创造价值”。
通常的大数据公司,口号都是“让数据创造价值”。“为”与“让”的一字之差,能够反映出对大数据的不同理解。
大数据应用架构自下而上分为三层:数据存储层、数据治理层和商业应用层。“让数据创造价值”,表明大多数的大数据公司更为看重顶层的应用,急于帮客户变现;而翼海云峰则将能力聚焦于中间的数据治理层,致力于提升数据自身的价值,所以强调“为数据创造价值”。
翼海云峰CTO陈磊
提升数据的价值
与很多创业公司一样,翼海云峰的创始团队也是技术出身,两位创始人都来自浙江大学。目前,翼海云峰已经拥有超过90名员工,其中90%是研发人员,并且已经实现了盈利。
2014年翼海云峰成立之时,国内大数据市场已经非常火热了,市场上号称能做大数据的公司很多,就像现在很多公司号称是人工智能公司一样。
翼海云峰CTO陈磊说,当时看到国内市场上的大数据公司主要是做上层展示的,而做下层数据存储和治理的却非常少。相反在国外,80%的大数据企业是做数据存储和治理的。
这显然跟国内企业急于看到大数据的成果有关。然而欲速则不达。陈磊认为,数据的质量和效率,决定着数据的价值。如果数据本身不准,由此产生的分析结果就可想而知了。
翼海云峰看到了市场中的问题,也就找到了机会——为客户提供专业的数据治理服务。
数据治理是在数据生命周期内对数据进行的主动、持续管理行为,其目的是提升数据质量,从而提升数据分析、数据发现和挖掘的质量,增加数据使用价值并随时间推移提供数据的可复用性。
陈磊介绍说,翼海云峰的数据治理服务,可以主要从两个方面来提升数据的价值。
一是提升数据质量。尤其是在复杂数据环境下完成数据整合与数据准备工作,通过对大量数据源进行有效的整合,及时、全面、准确地输出目标数据集合。
二是缩短数据准备时间。众所周知,数据的价值是随着时间而下降的,治理过的数据可以快速应用,快速产生分析结果,大大提升了效率。
融合机器学习技术
与大数据相比,人工智能似乎成为新一轮的市场热点。市场上的大数据公司,很多都摇身变成了人工智能公司。当然,这也并无道理,毕竟人工智能的很多应用,都是基于海量数据分析上的。
翼海云峰也在研发与人工智能相关的技术,不过它们并不是把自己变成人工智能公司,而是把人工智能技术用于数据治理工作中,从而更快、更好地提升数据价值。
市场上宣称能做数据治理的公司有不少,但大都是采用手工方式进行数据处理,要一行一行地写代码。这种方法效率很低,效果也不好。翼海云峰将机器学习和深度学习技术引入了数据治理解决方案中,与专家的人工输入相结合,不仅提高了效率,也节省了大量的人工。
其具体方法是,各种来源的数据在经过数据属性映射、数据去重与合并以及数据归类处理后,进入到数据准备分析的阶段。数据治理的过程采用机器学习并辅之以数据专家对数据处理过程的优化调整,实现大规模、多数据来源、复杂数据应用场景的自动化处理。
与传统手工方式相比,以机器学习与专家输入相结合的数据治理解决方案优势明显。其不仅大幅度提高了数据治理效率,降低了数据治理成本,而且能够加速数据治理过程,为后续的数据分析和业务洞察提供了有力的支撑。
目前,机器学习技术已经成为翼海云峰区别于竞争对手的差异化优势,赢得了诸多行业客户和业界公司的信赖,建立了紧密的合作关系。
提供场景化服务
翼海云峰是一家聚焦在数据治理层的大数据公司,数据治理是其核心竞争力。这一能力本身并不具有行业属性,但我们也看到,近来翼海云峰推出了不少行业的应用案例。
陈磊说,这也可以算作是翼海云峰针对国内市场现状所做出的战略调整。在保持核心能力不变的前提下,翼海云峰将数据治理看成是从数据源头到数据应用变现的全过程,即包括数据采集、数据清洗与整合、数据深度相关性分析与数据商业求解的全过程。也就是说,翼海云峰将自己的服务向上下两端延伸,从而为客户提供端到端的解决方案,最终帮助客户实现数据的商业价值。
尽管国内企业对于大数据变现的需求很强烈,但实际应用情况并不理想,还远没有真正实现数据驱动业务。为此,翼海云峰正在帮助行业用户找到适合的应用场景,通过行业化、场景化的大数据应用方案来创造商业价值。
在某移动运营商的基站维护场景中,翼海云峰通过大数据分析,将用户投诉与基站运营状态建立起联系,提升基站维护的效率。
在某新能源企业的电池分析场景中,翼海云峰将电动汽车的运行状况进行大数据分析,找到电池故障的原因,从而降低故障发生概率。
类似的故障预判,还出现在某船舶企业的动力系统分析应用中。翼海云峰从这些故障预判应用中找到共性,形成了场景化的解决方案,并进一步推广到更多的应用场景中去。
场景化服务的推出,使得翼海云峰与客户之间的距离更近了,对行业应用有了更准确的把握。不过,陈磊表示,数据治理方法仍然是翼海云峰的核心竞争力,希望能将这一能力与行业SI/ISV分享,通过构建大数据生态系统,共同为更多的行业客户提供大数据分析服务。
我们可以将数据治理方案视为翼海云峰起步阶段的一级火箭,场景化的行业应用正在成为其成长阶段的二级火箭,而生态建设则将成为其未来快速发展的三级火箭。