1.案例背景:
大数据技术的产生背景是人们的生活和工作都在不可避免的互联网化,这种生态上的转移产生出大量的行为记录数据,这导致基于数据的认知途径成为可能,传统的经验分享形成认知辅助需要漫长周期进行积累呈现,基于互联网强大的生态性和实时性,我们拥有更多途径和更快捷的方式去记录,归纳和分析我们希望了解的事物,这一切都基于产生的数据。
某种意义上说,我们的政府也在互联网化,体现在行政场所、交流渠道、信息来源、处理方式和思维模式。互联网的本质是连接和分享,这需要强大的保障力,包括数据安全性,真实性,公正性的保障,政府部门的强大公信力和数据合法持有的正规性,使得自身立足于大数据时代非常重要的核心位置,大数据时代离不开政府部门的积极参与和有效管理。
图1:税务信息化历程
税务行业在历经单机查询,省级集中征管系统,数据仓库等信息化发展历程后,如今迎来更进一步的数据融合、数据智能阶段。数据成为最重要的信息资产,需要有效发现,收集,管理,分析。从数据的视角看,税务部门的考验对象是税源,即合法纳税人的信息真实性。在传统税源管理工作中,受限于纳税人申报信息的有限性和滞后性,税务工作者无法准确把握纳税人的全面情况。得益于日趋成熟的互联网技术,一方面互联网的很多公开权威信息能够形成信息的互通互联相互比对,另一方面基于互联网迅猛发展应运而生的大数据技术服务,能够提供包括风险建模,预测分析,关联分析等高级数据应用管理工具。使用大数据技术进行税源专业化管理,有利于建立以税源为中心、比传统业务模型更加强大和全面的综合信息视图,并以此为依托进一步搭建包括税源关联分析,分类画像,风险预测在内的一系列数据应用,进行精细化的税源管理。
2.案例介绍:
明略综合涉税信息平台定位为面向税务部门的数据服务产品。产品充分利用明略底层大数据平台相关技术,数据挖掘建模技术及明略税务行业研究专家对税源管理专业化,风险控制精细化,决策分析智能化的理解,搭建以分析预测为核心的数据应用平台,以帮助税务部门征管工作更有效、更全面、更精细化的展开。明略综合涉税信息平台定位为面向税务部门的数据服务产品。产品充分利用明略底层大数据平台相关技术,数据挖掘建模技术及明略税务行业研究专家对税源管理专业化,风险控制精细化,决策分析智能化的理解,搭建以分析预测为核心的数据应用平台,以帮助税务部门征管工作更有效、更全面、更精细化的展开。
图2:税情可视化分析
传统的数据仓库从数据模型建设到数据生成和展现需要经历冗长易错的过程,并对业务人员透明。在数据已经成为资产的背景下,业务人员对数据的理解和操作变得非常必要。可视化工具套件能够促进业务人员自主进行数据管理工作,让每一个业务人员成为具有数据思维的人。
通过建设大数据平台将数据集中治理后,最直接的应用是进行统计分析或者数据仓库的BI应用。明略综合涉税平台独创性的将数据可视化和敏捷BI结合,通过特有的可视化交互方式快捷生成数据分析展现报表,让数据直接面向业务人员,简化处理流程,把数据自主权交还到业务人员。
图3:税源分类画像
对税源的管理通常会依据一户式视图等方式进行纵深管理,以税源为中心进行主题构建分析。新一代技术架构中,大量外部信息的引入,导致税源的探查层次可以从多角度进行丰富。按照不同类型的信息对税源进行分类画像,继而按照类别区分,将提供一种全新的横向观察视角。例如按照涉税信息,将纳税户划分为综合纳税能力从强到弱的几个级别,或者按照纳税风险划分为高风险纳税户和低风险纳税户。
图4:风险预警预测
传统风控模型,基于一系列风险点构建预警条件,但是风险点之间权重难以自动微调,导致风控模型僵化缺乏时效性。动态的风控模型需要引入反馈修正的实时调整和模型参数的调优,简单来说,基于大数据技术的风险控制,能够更加实时,更加精确的进行风险模型微调,最大化的发挥数据的威力。
更进一步的,在大数据技术平台结合回归和时间序列等经典算法后,能够对数据指标进行预测探查。例如能够通过纳税户的历史记录跟踪和风险数据指标输入,进行行业,企业类型,地区,产业等多角度的回归分析,得出走逃税的风险概率,进行提前预警。
3.案例价值:
明略综合涉税信息平台能够对政府“信息管税”带来的影响:
1、成本更加可控,更丰富的数据视角,更敏捷的分析构建
大数据的技术核心在于可扩展性,对用户来说可扩展性意味着以成本可控的方式逐步进行信息化建设,相对于传统的单机数据仓库构建,基于大数据平台能够以更低成本获得数十倍的数据处理能力提升,堪称技术架构上的飞跃。
传统的一户式视图能够对单户纳税户的所有涉税电子档案信息形成查询,但是数据的类型丰富程度和数据之间关联度都还比较缺乏。综合涉税信息平台不仅以税源为中心组织数据,还能够大量引入外部各种关系型和非关系型数据,在更大的尺度上进行模型构建,充分建立数据关联,通过撬动大数据的杠杆轻松切换观察视角,敏捷构建业务场景和报表,从数据资产到分析展示不再经历传统冗长的数仓过程。
2、获得洞察
发挥数据的价值,挖掘数据背后的相关性,才能为业务决策带来最大效益的帮助。明略综合涉税信息平台能够通过分类,聚类,回归等多项算法,发现数据相关性,清晰洞察业务关联信息,更精确的预测走逃税风险。得益于大数据技术带来的性能飞跃,这些在传统架构中复杂耗时的数据训练和建模运行周期从数月能够缩短到数天甚至数小时。在数据时代,掌握数据运用的方法论将成为每一个数据拥有者的首要任务。
3、为进一步数据服务打下基础
所有的大数据项目都不仅是提供一个产品或者完成一个项目,而是让客户获得针对大规模数据的持续服务能力。财税部门既掌握着第一手的纳税人经营状况和财税报告等信息,也拥有个税,车船,土地增值税等经济活动信息,这些信息勾勒出一个行政区域的经济脉络,将有可能成为政策分析,经济状况评估,银行借贷,企业和个人信用评估等经济活动的重要参考凭证。数据的集中治理、一致性的数据口径和大数据平台提供的强大处理能力是一个基础,后续数据和数据之间的相互协同和互补将在更大层面影响和帮助不同的经济活动参与者。