首页 > 市场研究 > 理清大数据应用方案的误区,雅拓信息助推银行与时俱进

理清大数据应用方案的误区,雅拓信息助推银行与时俱进

2017-11-21 16:13  

基本信息

面向行业
应用领域
大数据、人工智能掀起的热浪,正席卷着各行各业,一贯“保守”的金融银行业也未能“幸免”。
不仅是四大行和商业银行,就连地方市场上众多的城商行、农商行,也都或多或少地采用了新思路、新技术,分享着这股新浪潮所带来的巨大价值。
毕竟是全新的业务,在开展过程中要经常性地答疑解惑,消除认识上的误区,解决技术上的难题。
杭州雅拓信息技术有限公司CTO王有兵,时常扮演这一角色。
雅拓信息目前的主体业务,是面向城商行及农商行客户,提供定制化大数据解决方案。
王有兵介绍的两个案例,具有一定的普遍性,在其服务的客户中,不时地提及。
误区一:大数据模型的通用性
很多银行客户会有这样的疑问:各大银行都有自己的模型,收集的又是全国范围内的数据,我们作为地方级别的银行直接拿过来用就可以了,为什么我们还要自己再做重复的模型呢?
对此问题,王有兵的回答是——数据噪声不同,信息熵的判断有缺失。
以信用卡精准营销模型为例:A行所在区域,以小商品经济为主体,故信用卡主体也大部分为个体户或小业主;而B行所在区域以CBD为主体,信用卡主体多数是白领。
这两个行的数据跟全国数据一起进行统一的模型学习,将存在很大的“噪声”,其结果是——模型在全国大范围客户下的精确率也许还行,但是当单独应用到A行或B行的时候,模型就未必可行。
不仅如此,如果A行的体量是B行体量的3~5倍,那么B行的数据特征在模型中的体现十分有限,可以断言该模型在B行不可用。不仅仅是全国范围,就算是全省范围内,各家银行的体量差异也很大,越是小体量的银行应用整体模型的效果就越差,甚至是基本不可用。
通常来说,大数据应用方案落地必备三要素:计算力、数据、算法。王有兵表示,这其中的算法,落实到银行业务中就是建模,其实是应用方案中的关键。“不同的业务,就有不同的算法即模型。哪怕业务之间的差异性很小,算法都会有截然的不同,个性化极其突出。”
所以,每个银行建立自己区域特点的模型,这是一件十分必要的事情。
误区二:大数据模型的准确性
王有兵还谈到另外一个认识上的“误区”。有些客户不理解,所谓的大数据,不是应该数据越多模型就越准确吗?
对此问题,王有兵给予了解释。
很多情况下,数据越多其模型反而效果并不好。所谓的“大数据“仅仅是数据量大吗?是,但又不仅仅是。“大数据”最重要的一点,是数据的全面性。当然,我们不能要求将客户的所有数据都结构化入库,但尽量要做到数据的“全面化”,这很有必要。
而一些现成的模型,为了匹配全国客户,选用的的仅仅是通用类型的核心系统中的数据,而非大量客户特征。在数据全面化不达标的情况下去做模型,虽然学习样本数量很大,但并不能避免上文案例中的A行、B行互为噪声的情况,由此得到的模型也基本不可用。
所谓的数据越多模型效果越好这一说法是有前提的,即保证数据全面性达标的情况下,拥有越多的样本则将提升模型的精度。
王有兵指出,其实每家银行的总行中每个客户的数据,相比每个客户经理对客户的了解,还是显得有些欠缺。所以常常会发生这样的情况——客户经理根据模型还没有自己的判断来得准确。
其中的根本原因,是客户经理手中掌握着大量关于客户的非结构化数据没有入库,不能让模型进行定量分析。王有兵认为,在未来的几年内,各银行将客户信息全面化管理是一项迫切要做的事情,将客户经理掌握的非结构化数据进行结构化处理、入库管理。
“可以说,哪家银行的客户信息越全面,其建模就越准确,同时结合机器学习和深度学习,这家银行的未来发展就越光明。而不做客户信息全面化管理的银行,终会落伍。
大数据、人工智能的浪潮,将会广泛且深入地改变各行各业。王有兵介绍,雅拓信息贯彻“与成长中的银行一同成长”的理念,有多年数据挖掘、数据治理的成功经验和大量成功案例,帮助各地银行建立起大数据分析、建模系统,以及相应的机器学习体系,提供一整套“交钥匙工程”式的解决方案。
他最后表示,“拥有自己特色的模型以及学习机制,这样的银行才能与时俱进。”
赞 0个人觉得赞
logo

杭州雅拓信息技术有限公司

规模:50-200人

网站: http://www.hzyatop.com/

杭州雅拓信息技术有限公司秉承“与成长中的银行一起成长”的服务理念,致力于向国内中小商业银行、证券及农信系统提供优质的金融数据领域解决方案...

粉丝0

关联信息

关于我们 | 全生命周期管理 | 服务的客户 | 版权说明 | 联系我们

公司名称:北京金誉在线伙伴文化传播有限公司    备案号:京ICP备 15026202号-1

意见
反馈
返回
顶部