Oddbean new post about | logout
 看到有人对张雪峰高价咨询表示愤慨,对老百姓不懂得搜集公开数据表示怒其不争,对我国公开数据太少表示遗憾,我觉得倒也不必如此。或许可以拆解成如下几个可以证伪的观点进行理解和分析:

1. 所有决策过程都需要信息,需要搜集和分析数据,然后构建算法模型通过运算求解最优解。

2. 传统社会的问题是数据不足,所以公开数据很有意义。

3. 无论是私人还是政府,数据搜集和整理也需要花费成本,数据本身也可以成为商品。

4. 但是众所周知世界上有三种谎言,蹩脚的谎言、谎言和统计数据。

5. “只要你严刑拷打,数据什么都能招。”现代社会人们可以通过操纵数据引导人们做出最有利于他们的决策。

6. 数据足够多的条件下,甚至大数据条件下,数据多并不意味着可以得到总体的完整反映。

7. 数据和信息越多,基于数据的决策对构建模型的能力要求越高,构建准确的模型需要对相关问题有全面深入的理解。

8. 对于绝大多数人来说,构建准确的模型太难了,也需要付出巨大的时间和精力成本, 所以往往就采用直觉法、启发式方法、匡算法等简化框架,甚至干脆不去想了。这就是经济学所说的理性疏忽理论。

9. 所以数据越多,提供决策服务就越具有商业价值,如人工智能里的推荐算法。花钱给张雪峰推荐答案,或许也就是花钱买个安心,告诉子女为你这个决策我已经尽力了,要是投资失败可不能怪我。 
 库数据的价值非常非常高的。。