全文共2598字,预计学习时长8分钟

图源:unsplash
生活中,我们常常需要在变化了的或者不确定的情况下做出决策,这时,贝叶斯定理就是你的最佳助手。它本应用于日常生活为人们创造价值,但却局限在了教科书和机器学习应用程序领域。到了该解放它的时候了!
也许你知道贝叶斯定理的含义,但是却从不知道该如何使用它,在看到“红酒可降低患痴呆症风险”这样的标题时无法立刻想到这与贝叶斯定理有关。那么,本文将帮你熟练掌握它。
首先,笔者将回顾贝叶斯定理,探讨为什么笔者认为它很难记住,并用敏感性和特异性来表述。接下来,笔者将探讨几种运用贝叶斯公式对新闻中经常出现的挑衅性言论做出适当反应的方法。最后,笔者会列出一些平常使用贝叶斯定理的注意事项并对文章内容加以总结。
在正式开始之前,笔者将定义所有出现的术语:
1. 贝叶斯定理告诉人们在给定新条件的情况下如何修改某些结果的概率估计。在日常生活中,当有更多证据显示时,该定理有助于更新人们的看法或确定某一结果(比如癌症)在某种情况下(比如抽烟)是否更有可能显著出现。
2. 人们需要三种信息来正确更新自己对某一结果的看法:结果的基础比率、证据的敏感性和特异性。新闻往往只能提供敏感性。
3. 在没有这三种信息的情况下,请试着自己填补信息的空白,并警惕那些有着极高/极低基础比率或证据的边际概率很高的情况。
贝叶斯定理的敏感性和特异性
贝叶斯定理告诉人们在给定新证据的情况下如何计算某一结果的后验概率。后验概率表示为P(A|B)的条件概率。
当该公式由一堆字母表示时,很容易把它们混淆,忘记谁是分子谁是分母。因此,笔者喜欢用结果和条件来表示。
从数学上讲,确实没有理由将一个事件称为“结果”,而将另一个事件称为“条件”。但在现实生活中,有些事情是人们想要了解却又无法直接测量的——比如,得癌症的可能性。这是一种结果,而医学诊断结果之类的证据是用于估计此类结果概率的条件。
P(outcome)指的是人们感兴趣事物的先验概率或基础比率。它与人们看法更新的概率成正比是有道理的,否则,人们一遇到新证据就会改变他们之前的看法。
P(condition)称为条件的边际概率,将其视为一个实体可能有点奇怪。这是在结果为真或不真的情况下,观察人们拥有的条件或证据的总概率。
接下来是另外两个术语:敏感性和特异性。比如说,有70%的医学生弹钢琴。这意味着以弹钢琴作为医学生身份的证据的敏感性为70%。
不过可以肯定的是,是否是一名钢琴演奏者并不能有力地证明某人是否是医学生,特异性低是其中的一个原因。也就是说,很多不是医学生的人也会弹钢琴。
为了使某个条件能对结果的概率产生极大的影响,其必须具有高度的敏感性和高度的特异性。此外,为了得出后验概率的估计值,除了证据的敏感性和特异性之外,人们还必须对结果的基础比率有所了解。
图源:unsplash
下面是对贝叶斯公式的改写,这与上述直觉一致:
笔者发现新闻报道通常不会提供全部必要细节来帮助人们得出完全基于数据的看法。贝叶斯定理告诉人们调整看法的程度往往是违反直觉的,特别是在处理罕见事件的时候。“90%感染新冠肺炎的人穿有鞋带”无疑是合理的,笔者将告诉你如何避免对这样的陈述反应过度。
需要注意的情况
同样,计算结果的后验概率需要三种信息:结果的基础比率、条件的敏感性、条件的特异性。如果敏感性或特异性没有什么特殊情况(~0.5),那么就说明后验概率和基础比率相差不大。
在这种情况下,如果人们当前的行为是由自己的思想来引导,那么就有可能不需要调整自己的认知来对新数据做出解释。但是,如果新闻只提供一种或两种信息,那该怎么办呢?可采取如下选择:
· 承认自己无法有意义地合并新数据,然后把这件事抛诸脑后。
· 判断缺失的信息。
在某些情况下,确实无法判断出丢失的信息,但是过度依赖这种选择是很危险的。新闻中经常会提供敏感性因素,而查找基础比率和边际概率(也就是特异性)也不是一件难事。只要估计值表现出低基础比率、高边际概率或高基础比率,笔者就会警惕。
低基础比率
“90%的天才儿童的母亲说她们在怀孕期间食用了贝类。”
图源:unsplash
这句话中,人们感兴趣的结果(有一个智力超群的孩子)是很少见的。这意味着除非要测试的条件在敏感性和特异性方面极为苛刻(如果未在科学期刊中直接报道,可能就不会如此),否则后验概率也可能很低。
高边际概率
“几乎所有寻求抑郁症心理咨询服务的美国大学生都拥有智能手机。”
和拥有带鞋带的鞋一样,目前拥有智能手机也十分普遍,但抑郁症心理咨询服务不是这样。换句话说,拥有智能手机的边际概率很高。这可能是一个警告信号,表明该条件的特异性很低。
换句话说,可以假设几乎所有未寻求抑郁症心理咨询服务的大学生也都拥有智能手机,这意味着拥有智能手机并不是学生寻求咨询服务的有力证明。
高基础比率
“95%的坐过飞机的人都没活过100岁。”
先别急着退机票,请考虑这样一个事实:活不到100岁的现象相当普遍。在100岁之前死亡的可能性很可能低于基础比率。无论如何,后验概率的差异可能都不足以保证生活方式的改变。
注意事项和总结
本文希望为各位提供的看待贝叶斯定理的另一种角度,能让其更直观、更容易应用于日常生活当中。但功能越强大,责任也越大,所以请留意以下注意事项:
· 不要因为新闻没有明确提供使用贝叶斯规则所需的所有要素就对其持全盘拒绝的态度。如果用它去过滤自己不喜欢的新闻,很可能导致有动机的怀疑主义的风险。
· 即使确定了某些新信息并不能完全改变自己的看法进而改变自己的行为,那也并不意味着这些信息丝毫没有改变自己的看法。如果越来越多的证据指向同一件事,那么最终整体的看法也将发生改变。忘掉所有的证据而回归到先前的证据不会起作用,你会认为原来的证据不够充分。
· 虽然笔者在上述示例中直接给出了敏感性,但新闻标题往往会直接显示结果(比如“智能手机会增加患抑郁症的几率”),而随后只会在主体部分中给出证据的敏感性。这样的标题党太多了。
图源:unsplash
记住以上这几点,也许你能以一种更为慎重、更具数据思维的方式来面对各类信息。不过即使这样,传闻类证据仍是毫无价值的。
留言点赞关注
我们一起分享AI学习与发展的干货
如转载,请后台留言,遵守转载规范


还没有评论,来说两句吧...