1.2 数据分析话题同样存在“量变引起质变”的问题

数据分析就是从数据中找到关键信息,指导业务决策。当数据和场景相对简单时,数据分析这一过程就会变得容易;当数据和场景相对复杂时,数据分析这一过程就会变得困难。

举例来说,如果能够拿到一个班级的学生数据,就会很容易统计出这个班级中学生的平均身高、男女比例等,而多个班级里的这种抽样数据就能代表某个地区的平均状况。这个分析过程甚至不需要用到太复杂的电子化工具,仅用Excel就能做到。

若要通过班里每个学生每次考试各科目的分数给出其成绩上升或下降的原因,这会成为一个难题。哪怕分析人员学了很多电子化工具(Excel、SQL及Python等),且谈起工具的使用技巧时头头是道,面对这样的问题,也还是不会分析。

都是数据分析问题,为什么场景变得复杂,就无从下手了呢?

第一个问题,是简单的统计就能解决的问题;第二个问题,只看学生每次获得的分数是不够的,涉及的因素可能有学习方法的适用性、学习时长、基础能力等级、老师讲解的透彻度等,而这些因素均对数据采集提出了很高的要求。

问题和场景变得复杂了,解决的难度也会增加很多,甚至根本不是一个难度级别的。这就是“量变引起质变”,好比把鱼装进冰箱VS把大象装进冰箱,如图1-2所示。

“先把冰箱门打开,再把鱼或大象装进去,最后把冰箱门带上。”这好像是三步就能搞定的事情,当然装鱼可以这样操作,但是装大象就要考虑很多。把大象装进冰箱要考虑的诸多因素如图1-3所示。

图1-2 把鱼装进冰箱VS把大象装进冰箱

图1-3 把大象装进冰箱要考虑的诸多因素

在传统企业中,计算报表数据这一工作由会计承担即可,但为什么现在很多大企业都需要数据分析师,其中一个重要原因就是现在的数据量过于庞大。物联网可以收集机器运行过程中的数据,智能手机的普及让企业可以获得越来越多的数据,如何充分挖掘这些数据背后隐藏的价值,成了企业关注的焦点,企业也需要新的手段来实现业务价值。