Post

趣学贝叶斯统计:橡皮鸭、乐高和星球大战中的统计学

趣学贝叶斯统计:橡皮鸭、乐高和星球大战中的统计学

趣学贝叶斯统计:橡皮鸭、乐高和星球大战中的统计学

作者:未知作者 笔记数:27 条

2.3 通过信念的比值来计算概率

我们并没有具体的概率,但你通过给出打赌的胜算率(odds)表达了你对自己的假设有多大信心。胜算率是一种表示信念的常用方式,指的是猜错时你愿意付出的与猜对时能够获得的比值。胜算率通常用“[插图]比[插图]”来表示,也可以把它看成一个简单的比值:[插图]。胜算率和概率之间有着直接的关系。

第7章 贝叶斯定理和乐高积木

贝叶斯定理是统计学的基础,因为它能够通过给定信念下观察结果的概率判断给定观察结果下信念的强度

我们就用数据更新了自己对世界的信念。

8.2 调查犯罪现场

先验概率非常重要,因为它允许我们使用背景信息对似然进行调整。

8.4 比较非归一化的后验概率

“后验概率,即给定数据下假设的概率,与[插图]的先验概率和在假设[插图]下数据概率的乘积成正比”。

12.3 解决引火线问题

正态分布的威力在于,我们可以对均值的各种可能性进行概率推理,这让我们了解了均值的现实意义

12.5 “N西格玛”事件

事实上,如果你观察到的数据与均值相差5个标准差,那么这很可能说明你建立的正态分布并没有准确地模拟相应的数据。

14.2 在更大的背景下考虑先验

在贝叶斯术语中,我们观察到的数据是似然,而外部背景信息则是先验概率。

随着收集的数据越来越多,可以看到,有先验的后验分布开始向没有先验的后验分布转变。先验仍然制约着我们的认知,它给了一个更保守的真实转化率估计。然而,随着为似然添加更多的数据,它开始对后验信念产

生更大的影响。换句话说,额外观察到的数据正在做它应该做的事情:慢慢地改变我们的信念,使之与它表明的一致。就让我们多等一晚,看看收集到更多的数据后情况会怎样。

[插图]图14-6 随着数据的增多,有先验和无先验的估计值趋于一致

我们在这里看到了贝叶斯统计学最重要的一点:随着收集的数据越来越多,先验信念可能会被新的数据慢慢地削弱。当几乎没有数据时,似然提出了一些无论从直觉还是从个人经验来看都很荒谬的比例(例如80%的点击率)。在数据很少的情况下,先验信念压制了所掌握的任何数据。

但随着不断收集到与先验信念不一致的数据,后验信念就会慢慢偏向收集的数据所告诉我们的内容,偏离最初的先验信念

也是相对的,和最初数据比不那么强的先验

最好从一个比较弱的先验信念开始

14.3 作为量化经验方法的先验

Beta(20,80)

随着获得的信息越来越多,由先验信念造成的差异会逐渐减小。

14.4 什么都不知道时,是否有合理的先验可供使用

这里的问题还是在于先验数据与实际数据之间的相对值大小

最好的先验是有数据支持的,当完全没有任何数据时,从来就没有什么真正的“公平”先验

17.2 用贝叶斯因子理解“神秘预言家”

所以,如果从一开始你就不相信某个假设,那就需要有大量的数据来说服你。

18.1 有超能力的朋友掷骰子

在这种情况下,再多的数据也改变不了我们更相信[插图]而不是[插图],因为两者都能很好地解释所观察到的情况,而且我们已经认定[插图]是比[插图]更有可能的解释

18.2 与亲戚和阴谋论者争论

如果再多的数据都改变不了任何事情,那么怎么改变别人或者自己的信念呢?

这是因为你的假设和朋友的假设都能很好地解释数据。

尽管数据强烈地支持朋友的假设,但由于你拒绝改变自己的观点,因此现在你更加坚信自己是对的。当我们完全不允许自己的思想被改变时,更多的数据只会进一步地让我们相信自己是正确的。

在贝叶斯推理中,信念至少是可以被证伪的,这一点至关重要

在贝叶斯推理中,不可证伪的危险不在于它们不能被证明是错误的,而在于它们甚至会被那些看起来相矛盾的数据所强化

因此,下次与亲戚就政治或阴谋论辩论时,你应该先问他们:“什么数据会改变你的想法?”如果他们没有答案,你最好不要试图用更多的数据佐证自己的观点,因为这样做只会让他们更加坚定自己的信念。

This post is licensed under CC BY 4.0 by the author.