1.2.4 实践应用障碍多
大数据行业发展至今,虽然给众多行业带来了从内至外的改变,但在实践运用上,理论技术和商业实践之间依然存在巨大的鸿沟。在实践应用方面,主要有以下几个难点,如图1-7所示。
图1-7 大数据在实践应用上的难点
1.缺少专业数据分析人才
职业社交平台领英发布的《2016年中国互联网最热职位人才报告》显示,中国互联网职业中数据分析人才最为稀缺,其供给指数仅为0.05,属于高度稀缺类别。
根据上海CPDA授权中心市场运营总监Sherry的分析,在数据化已经成为趋势的市场中,数据分析将成为未来所有互联网员工最基本的职业技能,针对大数据分析的人才需求必会越来越大。没有足够的人才,大数据行业也就不能得到充分发展。
2.现有数据模型相对陈旧
在大数据行业中,有许多成熟的数据模型得到了实际的应用,但这些模型由于是很久以前发布的,在技术上有许多不再适用的地方。
例如有些金融机构所用FICO评分模型是20世纪80年代提出的,是一种基于逻辑回归算法构建的评分体系。因为逻辑回归算法只适用于处理线性数据,因此在面对实际场景中的非线性数据时,FICO评分模型不够准确。
在互联网技术日益成熟的今天,大数据模型如果仍旧沿用陈旧的体系必然会在实践应用中受到阻碍,这也是大数据在实现应用落地时遇到的难点之一。
3.数据建模对场景细分不够
由于大数据行业技术手段存在瓶颈,在大数据建模上只能模拟出一些较大的分类情况,如果运用在实际应用中,就会出现模型功能不够细化的问题。
曾有一家汽车制造商决定通过开展一个情感分析项目,将得到的结果运用在指导销售模式上。情感分析调查项目进行了6个月,前后总共花费了1,000万美元。项目结束之后,公司对调查结果进行了分析并分享给了经销商。然而在实践中,数据分析得出的营销模式却被证明是错误的。
项目失败的原因在于数据团队对经销商所面临的具体场景不够了解,对数据进行建模时场景设定得不够细致,从而导致实践应用中数据模型毫无价值。
北京宸信征信有限公司董事长张为斌在接受采访时表示,数据建模时“不仅仅需要引入自然科学建模,还需要引入基于社会科学的、人文历史的思考,把这些维度引入算法中”。有些数据公司没有考虑实际应用场景,直接套用国外的大数据模型,往往会出现功能无法满足具体场景的情况,这对现有的大数据应用提出了非常大的挑战。