助用力工中业国数
制据造的业价转值型升级
咨询/培训
技术支撑/人才支撑
综合保障/协作平台
<
数据分析三元论:势、道、术
1、势
有个成语叫“大势所趋”,顺应趋势、迎合潮流的事情做起来总是事半功倍的。
在做数据分析之前,我们要问一问:在这个时代、行业、公司做数据分析是大势所趋吗?
要回答这个问题,首先要搞清楚哪些因素构成了数据分析的“势”。我列举如下几个:
行业:我以为只有那些能够产生大量数据、且市场需求和业务模式变化较快、竞争较为充分的行业更适合做数据分析。大量数据是基础和原材料;市场需求和竞争压力是内在的驱动力。比如To C的电商行业,数据量已经到了一定量级,而人的需求往往是变化较快的,且这个行业没有形成事实上的垄断。虽然阿里、京东的电商平台已经占据了很大的市场份额,但是他们之间仍然存在竞争,而且垂直电商也还有生存空间。再比如电信和金融行业,也能满足以上几个条件。但是有些行业,看起来业务规模大,但实际上不适合去做数据分析。比如家装、餐饮,这两个行业虽然古老,但除了某些巨头之外,信息化做的相对较差,数据采集都是问题,更谈不上做数据分析了。再比如能源行业,也能够产生大量的数据,但是因为市场需求相对稳定,且基本形成了国家垄断,没有做数据分析的内在需求。
公司的数据环境:数据环境包括信息化水平、数据文化、老板对数据的重视程度等。这几个因素是很好理解的。信息化水平决定了数据的量和质量,消除数据不一致、清洗脏数据要花多少时间和精力,做过的人都知道。。。数据文化包括数据相关的流程、规章、制度,公司内部对数据认知和利用的程度等。最后,我向来认为数据是一把手工程,由于数据从采集到价值产出,都是涉及多个部门的利益,没有老板的支持,做好数据是天方夜谭。
2、道
所谓“道”,主要指分析体系和框架、目的和价值。
而这些主要受公司的业务模式和业务需求的影响。说白了,业务模式越简单、越清晰,数据分析越容易出成果。因为简单的业务模式能显著减少数据分析师学习业务的成本。分析体系和框架也会简单明了,在分析时需要考虑的影响因素就越少。而价值链短业务模式更容易让分析主题直接与业务收益挂钩,更容易让数据分析成果变现。而分析需求越稳定,就可以给分析师更多的时间深入研究下去,不断迭代,最终产出更大的价值。分析需求越清晰,花在需求讨论中的时间就越少,最终分析成果被转化的可能性就越大。
3、术
所谓“术”,是指数据分析的方法和过程,其中分析思维和分析技术对分析结果的影响。
正如我在开篇所述,数据分析所涉及技术体系非常庞大,而且学习资料也很多,不在本专栏范围之内。我重点想说说我经验中的一些分析技巧(包括思维和方法):
分析主题的定性与定量:设计分析主题中的重要一步,是要确定分析的目的是定性或是定量。如果是定性,通常只要考虑有关或无关,正面影响或负面影响。定量分析是很受业务方欢迎的,分析也更加复杂和困难,通常要通过机器学习模型解决。
发现分析主题的两个切入点:指标监控与业务问题。在《如何设定分析目标》一节讲过,数据部门更适合从指标监控中发现问题,业务部门更适合从业务中发现问题。但对于一个成熟的数据部门,把指标监控和业务监控深度结合,对于发现分析主题更有利。
数学建模:我对数学建模技术了解并不深。但是如果能把业务问题转化为一个数学模型,对于确定分析思路会很有帮助。
指标创新:指标其实是数据分析师分析业务问题的武器。因为无论你用什么分析方法,总要用到一些数据,而这些数据的计算方法、范围会很大程度上影响分析结果。且不说任何一个建模过程中的特征选择都非常重要,即使只是对业务的简单监控,一个好的指标往往能准确无误地反映出问题。对于互联网,PV、UV、时长、留存、点击率、退出率这些是大家很常用的。用来监控整体业务是没有问题的,但是对于某个小的业务板块就不太够了。比如,作为内容平台,我想衡量一次曝光的用户体验如何,应该用什么指标?有人会建议用点击率,但是点击率会受到标题党的影响,此时高的点击率并不代表好的用户体验。比较好的选择是把点击率、阅读时长、阅读进度等合成一个指标。
整体与个体:大处着眼,小处着手。无论是数据还是业务,都不是孤立存在的,系统性思维对于分析师非常重要。所以在看到一个小问题的时候,要知道它绝对不会影响这一小块业务;而看到大的目标出现问题的时候,要能意识到可能是一些小的业务环节出了岔子。在动手层面,对于数据分析来说,微观分析更容易获取实验数据,也更容易找到因果关系。所以要不断地对问题分解和细化。
分析维度的引入:在低维空间上解决不了,在高维空间上就不是个事(想到三体了吗)。比如SVM,低维空间上无法做到线性可分的数据样本,在高维空间上就可以。所以如果你在某个分析问题中费了牛劲也找不到答案,也许正是因为你忽略了某个重要的因素。当然也不是维度越多越好,因为维度越多,解释起来就越困难,不要忘了,结果是给人看的。
大胆假设,小心求证:试想求解一个方程式,我把某个解代入方程验证是否正确,要比我从空间中求解容易得多。同理,由于在现实世界中可能影响业务的因素太多,选择其中最有可能的因素去验证无疑是一条捷径。这个假设怎么去做?首先要对业务有足够的敏感度。
>
电话:010-82525360
传真:010-82525315
邮箱:Service@invenit-tek.com