Page 40 - 信息的脉络
P. 40
·信息的脉络·
p(A |已知 B)=p(B |已知 A)×p(A)/p(B)
计算一下等式右边的是三个概率:
P(B |已知 A) 在叙述中已经给出,及 75%,因为在 1 号罐子汇总有 75% 的石
子是白色的。
P(A) 在叙述中同样也已经给出,即 50%,因为罐子的选择是随机的,机会
是 50%。
P(B) 确定起来有一点复杂,因为有两种不同的方式可以获得白色石子。由于
两种假设是互不相容的,因此必须将在假设 A 中获得 B 的概率以及在非假设 A
中获得 B 的概率进行相加。前者的概率为 30/40=75%,后者的概率为 20/40,即
50%。因此 P(B)的概率为 50%×75%+50%×50%=62.5%。
现在最初的问题找到了一个答案,白色石子来自 1 号罐子的概率为:
P(A |已知 B)=(75%×50%)/62.5%=60%
换句话说,在看到石子的颜色之前,在 1 号罐子中取出某种颜色的石子的概
率为 50%,一旦知道石子是白色的,概率会上升到 60%。计算不仅证实了我们的
直觉,而且还会给我们的直觉一个确切的价值。
频率学派和贝叶斯学派两大极端派别的争论焦点涉及“什么是概率?概率从
何而来?”等本质问题。我们来看“正面朝上的概率是 0.5”这个表述。对于频率
学派,这意味着“在反复掷硬币的过程中,平均有一半的结果将是正面朝上”。
而对于贝叶斯学派来说,同样的说法意味着“我不知道掷硬币的结果是正面还是
背面朝上,所以我没有理由期待一种结果多于另一种结果”。频率学派的表述是
关于重复的独立实验,而贝叶斯学派的表述是关于不确定性的,也就是关于我们
所不知道的事物的。在历史上,贝叶斯统计长期受到排斥,受到当时主流的数学
家们的拒绝。然而,随着科学的进步,贝叶斯统计在实际应用上取得的成功慢慢
改变了人们的观点。贝叶斯统计慢慢地受到人们的重视,人们认为它的思路更为
符合科学研究的过程以及人脑的思维模式。目前贝叶斯概率已经成为一个热门研
究课题。在机器学习以及量子力学的诠释等领域都有广泛应用。
贝叶斯定理是通过新得到的证据不断地更新你的信念,一旦你的信念被更新,
你能根据更新的知识作出可信的判断,所以贝叶斯学派的思考方法更为自然,更
符合人们大脑的思维方式。但贝叶斯主义很少做出绝对性的判断,总会保留一定
的不确定性,这种情况在实际生活中比较常见。香农的信息概念与贝叶斯学派的
解释非常吻合。直观概念是,信息对抗无知。接收信息才能不断更新我们所建立
的世界模型。
频率学派重视“客观”情况,贝叶斯学派更重视“主观”因素。主观、客观
• 24 •