博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
数据分析的一些误区
阅读量:4361 次
发布时间:2019-06-07

本文共 1344 字,大约阅读时间需要 4 分钟。

1.忽略沉默的数据

    二战时英国空军为了降低飞机的损失,决定给飞机的机身进行装甲加固。由于当时条件所限,只能用装甲加固飞机上的少数部位。他们对执行完轰炸任务返航的飞机进行仔细的观察、分析、统计。发现大多数的弹孔,都集中在飞机的机翼上;只有少数弹孔位于驾驶舱。从数据上说, 加固机翼的性价比最高. 但实际情况缺恰恰相反, 驾驶舱才是最应加固的地方, 因为驾驶舱被击中的飞机几乎都没飞回来.

   "发声"的数据是最好获取的, 但如果没把这些沉默的数据考虑进来, 那么这种数据分析是不靠谱的。
       在某些场合下,被你忽略的沉默信息,恰恰是关键信息。很多人会忽视这类关键的沉默信息,反而重视一些显眼,但不关键的信息。
  在上述这个例子里,很多人想当然地(先验地)认为返航的轰炸机就是全部的样本。当他们开始思索答案的时候,就已经把那些中弹坠毁的飞机忽略掉了。所以,最终得出了相反的结论。

2.把沉默用户当作支持和反对的中间态

     两家网站A和B,都经营类似的业务,都有稳定的用户群。它们都进行了类似的网站界面改版。改版之后,网站A没有得到用户的赞扬,反而遭到很多用户的臭骂;而网站B既没有用户夸它,也没有用户骂它。如果从数据来看, 应该是网站B的改版相对更成功, 因为没有用户表达不满。但事实并非如此。网站A虽然遭到很多用户痛骂,但说明还有很多用户在乎它;对于网站B,用户对它已经不关心它了.
    网站A指的是Facebook,网站B是微软旗下的Live Space。

比如在管理方面,如果员工经常对公司的缺点提出批评,至少说明员工还比较在乎公司,希望公司能够改进。比如在婚姻方面,如果夫妻俩经常吵架,说明情况还不是算糟糕。如果双方连吵架都懒得吵,只剩下冷漠以对,那问题才真是严重了。

对于这类误区的总结,重点就是一句话:爱的反面不是恨,是漠然。很多时候,沉默/漠然/冷漠,是比“恨”更糟糕的反应。千万不要忽视了这种反应。

3.把数据作为决策的唯一标准

    通常认为数据分析指导工作是一种高性价比的做法, 不容易犯错, 对于代表资方的管理层来说, 比起依赖于人的决策, 依赖于数据的决策似乎更稳健. 这种决策在从0.5向0.8的产品改进上, 可能是有效的. 因为一个已有的产品, 数据就摆在那. 100个用户50个访问超时, 解决了这个问题, 就提升了50%的效果.
但对于从0到0.1的新产品上, 由于数据很难获取, 需要花大力气在获取模拟数据上. 往往是用一周时间去想明白一个做两个小时的产品该不该做的问题. 而且模拟的结果还和最终实际相差很远.
    A/B test或是原型系统, 先做出来, 再去验证, 在一些场合下比先拿数据要有效的多.

4.认为数据是绝对客观的

      数据本身是带有主观性的, 完全客观的数据是没有的. 数据的获取方法, 数据的解读方法, 数据的统计方法, 都是人的决策. 一份数据拿出两个相反的结论来也不是没有可能. 即使主观上没有偏向性, 也受限于方法和视野.
     决策上最终起作用的还是人不是数据. 虽然人有那么多的不确定性, 还可能出现争论, 扯皮, 不敢承担责任.

转载于:https://www.cnblogs.com/vlnk/archive/2012/11/14/2770000.html

你可能感兴趣的文章
CSS3选择器:nth-child和:nth-of-type之间的差异
查看>>
单循环链表的表示和实现
查看>>
python数据类型:字符串
查看>>
为什么你应该先成为全栈工程师
查看>>
清除浮动
查看>>
在HTML中使用JavaScript需要注意的问题
查看>>
OSError: libcudart.so.7.5: cannot open shared object file: No such file or directory
查看>>
LFS中各程序包的作用
查看>>
妙味课堂作业20160113(优化版)
查看>>
bzoj4653 [Noi2016]区间
查看>>
cogs896 圈奶牛(凸包)
查看>>
C#中对话框的使用(比较全)
查看>>
5月11日 python学习总结 子查询、pymysql模块增删改查、防止sql注入问题
查看>>
sqlserver查找使用了某个字段的所有存储过程
查看>>
TCP/IP协议族(三) 数字签名与HTTPS详解
查看>>
bitset里面一些函数的用法
查看>>
《我曾》火了:人这辈子,最怕突然听懂这首歌
查看>>
使用gdb进行debug
查看>>
C#基础知识总结(四)
查看>>
oracle 分页
查看>>