你只知道大数据很厉害,可知道“小数据”也很关键

个人专栏
2019-07-31 08:47:06

进入2012年,大数据(big data)一词越来越多地被提及。“大数据”指的是这样一种现象:互联网公司在日常运营中生成、累积的用户网络行为数据。这些数据的规模是如此庞大,以至于不能用G或T来衡量。大数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。正如《纽约时报》2012年2月的一篇专栏中所称:大数据时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉。 

时至今日,各行各业都在谈论并发展大数据,探索怎样利用大数据来为自身业务服务,深入挖掘潜在的商业价值,其中最重要的应用就是用户研究。用户研究的重要性就不用我说了,用户研究是以用户中心设计流程中的第一步,它帮助企业定义产品的目标用户群,是一种理解用户,将他们的目标、需求与品牌商业宗旨相匹配的理想方法。

大数据时代后,用户的一切日常行为似乎都是“数据化”的,用大数据进行用户研究(最典型的做法是“用户画像”)无疑是最好的办法。在建材家居行业,大数据的应用也已经十分普遍。

大数据的无所不能

大数据在用户研究中很厉害。我们可以举一些使用大数据技术且比较有代表性的产品。

比如内容推荐,最具代表性的是今日头条,它正是运用了大数据技术来找到你喜欢的内容并且推荐给你;

比如物品推荐,淘宝、京东等电商网站会根据你的浏览行为进行分析,根据你的兴趣推荐给你相应的物品;

比如广告计算,百度、谷歌、腾讯,会根据广告主的价格和广告的效果计算广告的排序,以在流量中达到最好的变现效果;

比如信用评估,支付宝的芝麻信用加入人际关系、学历、车等等元素来评估你的信用值,给信用值高的人提供更好的服务;

……

千人千面、个性化推荐、用户行为偏好、用户生命周期跟踪、购物预测、精准广告,暂且不提大数据在其他领域的应用,仅仅就用户的研究而言,大数据可谓所向披靡,只要用户在平台上有足够多的动作,就会产生足够多的数据,这些数据碎片通过各种拼凑组合,就能描绘出用户各个维度的画像,从而能够支持到更多的应用。大数据在了解客户上的作用,可以用一句粗俗但生动的话来总结,就是“你一撅屁股我就知道你要拉什么屎”!当你对某个人或物接触多了,知道了对方足够多的信息,就能更了解这个事物并预测到它下一步动作。大数据处理技术正是这么个收集,处理,分析、识别、预测的过程。

大数据的无能为力

大数据富有价值,但大数据也有缺陷,并不是解决一切问题的灵丹妙药。大数据擅长的是理性分析,而人类的决策过程中往往掺杂着直觉与感性,所以当涉及到用户深层的感知与动机时,大数据便显得捉襟见肘。无论是基于大数据统计,还是基于机器学习算法,也只是用户的行为结果,似乎无法解释用户的心理决策过程。

大数据的应对方法是通过贴标签将用户进行标识,但仅有行为标签还远远不够,如何提取出感性标签是一直困扰着大数据的难题。大数据的缺陷在于:

1、技术设备可以采集到大量以前无法收集到的数据,但这些数据中通常包含着大量的噪声——不同来源的数据记录并没有统一规范,由于采集方式的影响,不是所有的数据都准确。数据必须经过“清洗”,实现准确、可用。

2、数据本身并不会告诉企业应该如何决策,它需要在深入理解企业发展方向的基础上,采用合适的分析方式分析并解读相关含义。

3、企业内部存在数据孤岛,业务部门有数据积累,但没有打通,更谈不上挖掘利用。

4、基础设施的搭建和人才缺乏。在线上线下应用场景逐步融合的现在,企业需要投入大量资金进行基础设施的搭建,人才缺乏也是一个很大的限制因素。

综上,大数据在本质上仍然是量化研究,采集的主体数据仍是人们线上、线下的行为。它不能直接回答行为背后的驱动因素,也不能解释人们的态度、决策过程、作用体验等。大数据并不是叙述性的方式,在分析时不可避免地会损失很多细节。大数据可以抓出很多事实,但即很难捕捉诸如温暖、喜悦、期待,而这些,恰恰是“以用户为中心”的最重要的情感信息。

大数据+小数据=更好地了解和服务用户

小数据(small data),或称个体资料,并不是指数据量小,而是围绕个人为中心全方位的数据。人产生的数据,包括生活习惯、社交、财务、行为等,被收集和利用进行分析,并对外形成一个富有个人色彩的数据系统。小数据的特点在于以单个人为对象,重点在于深度。 

大数据通常指的是大量结构化数据与非结构化数据的集合体,小数据通常指的是结构化数据,针对的目标用户也比较明确。从应用的角度来说,大数据和小数据具有以下几个主要的区别:

1、大数据重预测,小数据重决定。大数据的分析方式是自下而上的知识发现和预测过程,通过在一堆杂乱无章的数据中找到其背后的规律,所以大数据是从不确定性中找确定性。小数据分析通常会采用统计学方法,分析方式是自上而下。

2、大数据重感知,小数据重精准。大数据可以做整体上的感知,影响的范围更广,小数据通常更关注数据的真实性和代表性,更聚焦。大数据往往包含了众多真假难辨的数据,而小数据通常对于数据来源有严格的甄别,所以小数据更精准。

3、大数据重相关,小数据重因果。大数据通常更注重是什么而不纠结于为什么,通过相关性来给出问题的解决方案。小数据是结果导向,更注重现象背后的内在机理,更关注于为什么。

4、大数据重群体,小数据重个体。大数据的应用通常更注重群体性行为的分析结果,比如网络消费的大数据分析等,小数据往往更注重于个体的行为分析结果,个性化是小数据的重要特点。

小数据的获得,通常通过传统的调研方式,通过访谈、观察等方式获得,其在用户深层特性和动机的研究上仍有着一技之长,能很好地对大数据的结果进行补充解释。

 FGD(Focus Group Discuss 小组焦点座谈会)是常见的“小数据”收集方式。

如果说大数据关注的是总体和大致规律,那么小数据关注的则是个体和细腻的事实。小数据可以深入讨论所发生行为的前因后果、态度的形成过程、某个场景下所包含的细节因素。这些可以帮助我们在一堆杂志的原始材料中更高效地找出关键的、敏感的指标,为后续的数据建模和分析指明方向,提供依据。小数据可以帮助企业走近自己的用户,面对面了解他们的生活方式,近距离观察他们在真实场景中对产品的使用,更重要的是可以走进他们的内心,体会他们的喜悦与忧伤、期待与担心。

大数据不能取代对人的理解,越是在产品或服务设计的早期,越是倾向于使用小数据。要达成对事物的更深入理解,就需要把大数据思维和小数据细节相结合。

(作者:张涛)

选整木上整木网,更多更快更精准