<

数据分析三元论:势、道、术
来源: | 作者:Tony | 发布时间: 2023-02-12 | 1839 次浏览 | 分享到:


分析主题的定性与定量:设计分析主题中的重要一步,是要确定分析的目的是定性或是定量。如果是定性,通常只要考虑有关或无关,正面影响或负面影响。定量分析是很受业务方欢迎的,分析也更加复杂和困难,通常要通过机器学习模型解决。
发现分析主题的两个切入点:指标监控与业务问题。在《如何设定分析目标》一节讲过,数据部门更适合从指标监控中发现问题,业务部门更适合从业务中发现问题。但对于一个成熟的数据部门,把指标监控和业务监控深度结合,对于发现分析主题更有利。
数学建模:我对数学建模技术了解并不深。但是如果能把业务问题转化为一个数学模型,对于确定分析思路会很有帮助。
指标创新:指标其实是数据分析师分析业务问题的武器。因为无论你用什么分析方法,总要用到一些数据,而这些数据的计算方法、范围会很大程度上影响分析结果。且不说任何一个建模过程中的特征选择都非常重要,即使只是对业务的简单监控,一个好的指标往往能准确无误地反映出问题。对于互联网,PV、UV、时长、留存、点击率、退出率这些是大家很常用的。用来监控整体业务是没有问题的,但是对于某个小的业务板块就不太够了。比如,作为内容平台,我想衡量一次曝光的用户体验如何,应该用什么指标?有人会建议用点击率,但是点击率会受到标题党的影响,此时高的点击率并不代表好的用户体验。比较好的选择是把点击率、阅读时长、阅读进度等合成一个指标。
整体与个体:大处着眼,小处着手。无论是数据还是业务,都不是孤立存在的,系统性思维对于分析师非常重要。所以在看到一个小问题的时候,要知道它绝对不会影响这一小块业务;而看到大的目标出现问题的时候,要能意识到可能是一些小的业务环节出了岔子。在动手层面,对于数据分析来说,微观分析更容易获取实验数据,也更容易找到因果关系。所以要不断地对问题分解和细化。
分析维度的引入:在低维空间上解决不了,在高维空间上就不是个事(想到三体了吗)。比如SVM,低维空间上无法做到线性可分的数据样本,在高维空间上就可以。所以如果你在某个分析问题中费了牛劲也找不到答案,也许正是因为你忽略了某个重要的因素。当然也不是维度越多越好,因为维度越多,解释起来就越困难,不要忘了,结果是给人看的。
大胆假设,小心求证:试想求解一个方程式,我把某个解代入方程验证是否正确,要比我从空间中求解容易得多。同理,由于在现实世界中可能影响业务的因素太多,选择其中最有可能的因素去验证无疑是一条捷径。这个假设怎么去做?首先要对业务有足够的敏感度。

活 动 与 新 闻
您所在的位置:

​​>

<- 首 页
新闻中心