这个世界的为什么

  • 如果我们要了解如何采取成功的行动,就必须弄清这个世界的原因。我们认为这本书很有趣,不仅可能帮助您理解数据分析隐藏的弊端,并且,您可以从中获得社会学分析方面的提升,您可以将它应用在很多地方,比如分析新闻故事 

“相关性不是因果关系”。

虽然这句话是正确的,也是重要的,但这一警告已经变成了人们熟悉的陈词滥调。所谓的虚假相关性的例子现在已经屡见不鲜。正如一个例子所讽刺的那样,一个太平洋岛国部落认为 “跳蚤侵袭对人的健康有益”,因为他们观察到健康的人有跳蚤,而生病的人没有。这种关联是真实而有力的,但跳蚤当然不会 *导致*健康:它们只是 *表明* 健康。跳蚤会放弃发烧的人的身体,而去寻找更健康的宿主。人们不应该为了抵御疾病而寻找和鼓励跳蚤。

问题在于另一个观察:因果关系的证据似乎完全在于相关性。但如果不是看到相关性,我们就不会有因果关系的线索。比如说,我们发现吸烟会导致肺癌的唯一原因,就是观察到了这种特殊情况下的相关性。

于是,一个难题出现了:如果因果关系不能归结为相关性,那么相关性又怎么能作为因果关系的证据呢?

计算机科学家 Judea Pearl 和科普作家 Dana Mackenzie 合著的《The Book of Why》,着手给这个古老的问题一个新的答案,至少从启蒙运动以来,这个问题一直在以某种形式存在,科学家和哲学家们都提出过这个问题。2011年,Pearl 因 “通过发展概率论和因果推演,对人工智能做出了根本性的贡献” 而获得了计算机科学的最高荣誉  — — 图灵奖,而这本书则着手为普通读者解释这一切意味着什么,更新了他近二十年前出版的关于同一主题的技术性较强的书《因果关系》。 在这本书在科学和社会学两个方面,都有智慧和警世的意义。

Pearl 也有一个巨人之斧,特别是在研究人类认知  — — 我们的思维 — — 以及围绕当代人工智能的炒作时。他写道:“这种以数据为中心的历史,大部分至今仍在困扰着我们” 。

自从《连线》杂志宣布 “理论的终结” 以来,已经过去了十一年了,因为 “数据洪流让科学方法过时了” 。Pearl 在这股潮流中奋力游走。

“我们生活在一个假定大数据是解决我们所有问题的时代”,他说,“但我希望用这本书来说服你,数据只是深刻的哑巴”。 数据可能会帮助我们预测会发生什么 — — 事实上,计算机可以驾驶汽车,并在非常复杂的战略游戏中击败人类,从国际象棋和围棋到“危险边缘”!但即使是今天最复杂的机器学习技术也无法让数据告诉我们 *为什么*。对于 Pearl 来说,缺失的成分是一个 “现实模型” ,而这个模型的关键就取决于原因。他针对一众爱好者争辩说,现代机器与人类的头脑完全不同。

为了明确利害关系,请考虑以下情况。假设汽车的颜色和它们卷入事故的年度比率之间存在着强大的、统计学上显著的、长期的相关性。具体来说,假设红色的汽车,尤其是红色的汽车,年复一年的事故发生率比任何其他颜色的汽车都要高。当您去买一辆新车时,为了保证路上的安全,您是否应该避开红色?

稍加思考就会发现,有许多不同的因果机制可以作为观察到的相关性的基础,而且每种机制都会产生不同的建议。一方面,可能是人类的视觉系统不像其他颜色那样擅长判断红色物体的距离和速度。在这种情况下,红色汽车可能会发生更多的事故,因为其他司机往往会误判接近红色汽车的速度和距离,所以更经常与红色汽车相撞。

而另一方面,这种关联性可能与颜色本身的危险完全无关。例如,它可能是一个共同原因的副产品。选择红色汽车的人可能比一般的司机更倾向于冒险和追求刺激,所以卷入的事故也就相应地更多。不过话又说回来,这种关联性可能和驾驶能力完全没有关系。买红车的人可能只是比其他人更喜欢开车,每年花在路上的时间更多。在这种情况下,人们会预期涉及红色汽车的事故会更多,即使这些司机平均比其他司机更加小心谨慎。

所有这些假设都可以解释观察到的汽车颜色与事故发生率之间的相关性。而且人们还可以很容易地想到其他假设。更糟糕的是,观察到的相关性可能是所有这些因素共同作用的产物。但只有第一个假设产生了这样的建议,即:人们应该避免购买红色汽车,以提高避免事故的机会。在其他情况下,红色本身没有起到任何因果作用,而只是其他因素的一个指标。

这个例子说明了因果推理的基本问题。我们如何才能在如此众多的替代解释中找到解决问题的因果真相?

在某些情况下,最好的建议是寻找更多的相关性,不同变量之间的相关性。

例如,为了检验事故发生率较高是否是因为在路上的时间较长,我们应该控制时间这个变量。如果相关性的真正原因在于不同司机喜欢开车的程度,而不是汽车的颜色本身,那么当查看汽车颜色与每英里驾驶的事故或每小时驾驶的事故、而不是每年的事故之间的关联时,相关性应该消失。这种思路表明,从相关性中推导出因果关系的诀窍只是梳理出一个足够大的数据集来寻找其他关联性。根据这种操作主义的思维方式,所有的答案都在数据中,以某种方式存在。人们只需弄清楚如何适当地平移这些数据,以揭示隐藏的因果亮点 。

Pearl 在20世纪70年代开始了他在人工智能方面的研究工作,他接受的教育向他传授了这种思维方式。在整个二十世纪,对于科学界的大部分人来说,因果关系的概念本身就被认为是可疑的,除非而且直到它能被翻译成纯统计学的语言。

悬而未决的问题是如何进行翻译。但 Pearl 一步步痛苦地发现,这种标准的方法是行不通的。因果关系确实不能归结为相关性,即使在大型数据集中,Pearl 也看到了这一点在这个问题上投入更多的计算资源,就像 Pearl 在他的早期工作中所做的那样(在 “贝叶斯网”上,它将托马斯·贝叶斯的基本规则用于根据新的证据更新概率,应用于大量相互关联的数据集),将永远不会产生一个解决方案。简而言之,如果不从输入因果假说开始,你永远都不会得到因果信息。

这本书就是关于 Pearl 如何认识到这一点的故事。在其之后,他开发出了简单但强大的技术,使用他所谓的 “因果图” 来回答关于因果关系的问题,尤其是确定什么时候这种问题根本无法从数据中得到答案。

对于任何有足够兴趣的读者来说,这本书应该都是可以理解的,可以在一些公式上停顿一下,消化它们的概念意义(尽管即使是有概率论背景的人也需要付出一些努力)。好消息是,Pearl 的主要创新 — — 因果假说的使用 — — 与其说是用充满代数的统计学,不如说是用视觉直观的图片来表达的知识。“有向图” 说明了可能的因果结构,用箭头从假设的原因指向结果。只需关注这些图和通过这些图的各种路径,就能理解这本书的大量论点。

考虑这些图的两个基本构件。如果两个箭头从一个节点出发,那么就有了一个 “共因分叉” ,它可以在本身并不存在因果关系的属性之间产生统计学上的相关性(比如鲁莽驾驶者喜欢红色假说中的汽车颜色和事故率)。在这种情况下,A可能同时导致B和C,但B和C并不是因果关系。

另一方面,如果两个不同的箭头进入了同一个节点,那么就有了一个 “对撞因子” ,这就引起了一系列完全不同的方法论问题。在这种情况下,A和B可能共同导致C,但A和B不是因果关系。

这两种结构的区别对因果推理有重要的影响。例如,虽然控制共同原因可以消除误导性的相关性,但控制对撞因子却可以创造这些相关性。如 Pearl 所示,给定某个因果模型,一般的分析方法是找出连接节点的 “后门” (共同原因)和 “前门” (对撞因子)路径,并在每种情况下采取适当的谨慎措施。

下面是一些简单的例子。我们知道一辆车是红色的和它在某一年发生事故之间存在正相关关系;但我们不知道汽车变成红色是否会让它更危险。所以我们首先要想出各种因果假设,并用有向图来表示:用箭头连接的节点。

在一个假设上,红色是事故的原因,所以我们从 “红车” 这个节点画一个箭头到 “事故” 这个节点。故事结束。

在另一个假设上,某种性格特征是导致买红车和多开车的原因,多开车是导致更多事故的原因(每年)。因果图中,从 “个性” 节点到 “红车” 节点和 “多开车” 节点都有箭头(所以 “个性” 是一个共因叉),从 “多开车” 到 “事故” 还有一个箭头。个性特征只是间接导致事故。

在这张图中,从 “红车” 到 “事故” 还有一条连接的路径,可以解释这种相关性,但这是一条后门路径:它通过一个共因(“个性” )。我们可以通过控制 “个性” (这可能是一个未知的特质)或控制 “更多的驾驶”(可测量)来检验这个假设。如果控制了其中任何一个因素,相关性仍然存在,那么我们就知道这个因果结构是错误的。

如何决定首先要检验哪些因果模型呢

在 Pearl 看来,它们是由理论家根据背景资料、似是而非的猜想、甚至是盲目的猜测提供的,而不是从数据中得出的。因果图的方法使我们可以通过呼吁数据来检验假设,既可以自己检验,也可以互相检验,它并没有告诉我们要检验哪些假设。(“我们只有在提出因果模型之后才收集数据”,Pearl 坚持说,“在我们说出我们希望回答的科学疑问之后 ……这与传统的统计学方法形成了鲜明的对比……传统的统计学方法甚至没有因果模型”)。

有时,数据可能会驳倒一个理论。有时我们发现,我们手头的数据都不能在一对相互竞争的因果假说之间做出决定,但我们可以通过获得的新数据来解决这个问题。而有时还会发现,根本没有任何数据可以起到区分假说的作用。

虽然这种利用假设的因果结构从统计数据中挑出因果结论的方法非常简单 — — 而且 Pearl 和 Mackenzie 给读者举了一些例子,可以像解决逻辑难题一样解决  — — 但 Pearl 的这些方法的路线是艰难而迂回的。主要的问题很简单:正如他们所叙述的那样,整个统计学领域已经完全放弃了对因果关系的明确谈论,所以 Pearl 的方法需要逆着该领域的 “常识” 之流而行。(应该指出,一些统计学家对这一领域的历史特征提出了质疑)。他与主流的分歧始于20世纪80年代末和90年代初,他以合理的自豪感叙述了他的知识和与制度的斗争。

这是一个古老而熟悉的故事。对世界的描述,无论是科学的还是 “常识的” ,都假设了各种事物 — — 实体、规律和结构 — — 这些都是无法立即观察到的。但是,评价这种理论所依据的数据必须是可观察的:毕竟,这就是它们之所以成为数据的原因 — — 它们是经验给我们的东西。

因此,在我们所相信的东西(理论)和我们必须相信它的理由(数据)之间就会出现一个差距。这个差距  — — 哲学家们称之为 “证据对理论的确定不足” — — 意味着所有的理论都是错误的:数据不能使理论正确。一些特别敏感的人发现这种认识论上的差距是不能容忍的;因此,许多科学经常性地开展运动,完全清除 “理论” 假设,并以某种方式将科学框定为只关于可观察数据结构的陈述。

这种回到数据的方法已经尝试过很多次  — — 想想心理学中的行为主义和物理学中的实证主义 — — 但都同样失败了。在统计学中,根据 Pearl 的说法,它所采取的形式是放弃所有关于因果关系的谈论;因为,正如启蒙哲学家大卫·休谟在17世纪指出的那样,事件之间的因果关系本身并不是可以立即观察到的。正如休谟所言,我们可以观察到事件的结合 — — 比如说,一种事件始终如一地跟在另一种事件之后  — — 但不能观察到因果联系。Pearl 说:“你只是徒劳地在统计学教科书的索引中搜索关于 ‘原因’ 的条目。学生不被允许说X是Y的原因  — — 只允许说X和Y是 ‘相关’ 或 ‘关联’ ”。

但我们普遍关心的是世界上有效的干预措施,而哪些干预措施会有效,取决于因果结构。如果一辆车的红颜色是其发生事故的原因之一,那么买一辆不同颜色的车将更安全。如果仅仅是由于购买者的心理等共同原因造成的相关性,那么不妨选择自己喜欢的颜色。避开红色的车并不会神奇地让你成为一个更好的司机。不足为奇的是,试图通过满足于讨论相关性来压制对因果关系的谈论,使得统计分析领域陷入了一片混乱。

公平地说,该领域并没有完全压制这种谈话。它只是大部分被归入了 “实验” (相对于 “观察性研究” )这一更专业的领域,这是一个高于和超越普通统计分析的主题  — — 它本身并不能导致关于原因的结论。

事实上,有一种被普遍认可的情况,观察到的相关性被接受为因果关系的证明:随机对照试验(RCT)。假设我们把一大批买车的人随机分成两组,实验组和对照组。然后强迫实验组开红车,禁止对照组开红车。由于这两组是随机形成的,所以绝大多数情况下(如果这两组的人数足够多的话),它们在已知和未知的所有方面都会有统计学上的相似性。例如,每组中约有相同比例的人将是鲁莽驾驶者。如果实验组的事故数量超过了控制组的事故数量,在统计学上具有显著性,我们就有了 “金本位” 的证据,证明颜色本身会导致事故。

嗯,即使在这里也有一些注意事项。真正的金本位是一个双盲实验,在这个实验中,无论是被试者还是实验者都不知道谁在哪一组。在汽车颜色的情况下,我们将从字面意义上不得不蒙住司机的眼睛,这当然会大大增加事故率。但可以先搁置这个问题。

RCT的关键在于,通过将成员分配到两组,而不是让他们自我选择,实验人员相对于控制了其他解释。正如 Pearl 所说的那样,在这样的随机设计中,人们会 “抹去” 实验变量值的开源箭头,在这种情况下是 “红车” 或 “非红车” 。当然,并不是说把一个受试者安排到两组中的某一组,从字面上看是完全随机的:例如,它可能是由一个骰子的投掷或随机数发生器的输出值决定的。也就是说,决定这个位置的特定的原因组合不会有任何其他合理的显著效果。

Pearl 的方法通过他所说的 “做算子” 来认识这种情况。“做x” 表示使x成为情况的干预,而不是仅仅观察到x是情况。如果您只是睁开眼睛看着从我身边流过的车流,您就可以记录下谁开的是红车,谁不是。但是 “做红车” 就需要您自己(或其他随机化的设备)让一个人开红车成为个案。这恰恰是一个单纯的观察性研究(观察但不干预)和RCT的区别。(书中有足够的技术细节来介绍这一原理)。

Pearl 并不反对RCT的证据价值。但它们成本高、难度大,有时还不道德。比如吸烟导致人类癌症的最好证据来自于一个实验,即 把一大群婴儿随机分为两组,强迫其中一组每天吸两包烟,阻止另一组吸烟。但这样的实验显然在道德上是不允许的。

Pearl 的主要贡献之一是发展了 “Do calculus” 。他和他的学生及合作者所证明的是,如果一开始就有一个准确的情境因果结构的图形模型  — — 箭头显示哪些变量可能是其他变量的原因  — — 那么在某些情况下,人们就可以把 “Do” 的说法简化为仅仅是观察性的说法。也就是说,适当的被动观察数据可以提供与RCT相同的证据;当然,前提是初始的因果模型是准确的。RCT的优势在于它提供了其因果关系的证据,而不需要任何初始的因果假说。Do calculus 的优势在于,它可以在不需要干预的情况下,提供同样有力的因果假说检验。

这本书的最后一部分进入了更多的哲学领域。Pearl 将从单纯观察相关性到检验Do主张的过渡描述为从因果关系阶梯的第一层上升到第二层。区别在于,仅仅注意到数据中的相关性和得出关于因果结构的结论之间的区别。但是  — — 现在情况变得相当曲折  — — Pearl 坚持认为,还有一个更高的目的地:第三阶段,涉及到对反事实的推理。

反事实是指如果世界在某种程度上不是现在这样,会发生什么的说法。例如,可以考虑这样的说法:“如果奥斯瓦尔德没有向肯尼迪开枪,其他人就会开枪” 。这句话理所当然地认为奥斯瓦尔德确实射杀了肯尼迪,并提出了如果他不这样做,事情会如何发展的说法。我们可能没有理由认为这个反事实是真实的,但很容易想象出会是这样的情况。例如,如果有第二个刺客藏在草丘里,他的任务是在奥斯瓦尔德失败的情况下充当后备。

在某种意义上,反事实是关于虚构的世界或未实现的可能性,因为它们的前因后果是与事实相反的:它们是关于可能发生但没有发生的事。所以从表面上看,它们似乎超出了正常科学探究的范围和范畴。毕竟,没有一个望远镜足够强大,可以揭示可能发生的事。事实上,人们很容易陷入反事实完全超出科学范围的观点。正如物理学家艾雪·佩雷斯曾经说过的那样,未进行的实验是没有结果的。那么,在 Pearl 的书中,他们在做什么呢?

答案是,Pearl 似乎认为它们充满了哲学意义:在他的讲述中,对反事实的考虑比对因果说法的考虑在认知上要高一等。他认为,许多非人类动物都可以进行因果性思考,但也许只有人类和一些少数非常高级的其他动物才能进行反事实的考虑。登上第三阶梯,就像吃了知识之树的果实一样,使人类与其他动物王国区别开来。他在书的最后几章专门讨论了反事实以及我们可以相信它们的理由。

但是,这种把因果关系和反事实推理割裂开的做法是一个错误。反事实与因果说紧密地纠缠在一起,不可能只考虑因果而不考虑反事实。这个事实常常被哲学家们忽视或忽略,所以看到 Pearl 落入同样的陷阱也就不足为奇了。

想象一下,你正抱着一盏珍贵易碎的蒂芙尼灯战在坚硬的石头地板上。一只苍蝇在你的头顶附近嗡嗡地飞来飞去,让你很烦躁,你希望嗡嗡声停止。你应该怎么做呢?好吧,你可以腾出手来以便拍苍蝇。但作为一个因果推理者,你可以预见到这样做的结果是什么:你可能会杀死苍蝇,但灯会掉到地上摔碎。所以你最终还是没有放下灯。但既然接受了灯掉落和灯碎裂之间的因果关系,假设你事实上没有摔了那盏灯,那么你就会任性地致力于反事实 “如果我不顾及灯,它就会碎掉” 。所以,你不可能在没处理好第三阶段的情况下也能到达第二阶段。

由于没有领会到因果说和反事实说之间的这些联系,使得这本书后面的章节比前面的章节更加模糊。Pearl 在坚实的基础上讨论因果关系,却试图让他的梯子有更多的阶梯。这种同样的不精确性和对哲学文献的不熟悉也弥漫在他在书的最后对自由意志的讨论中。

这本书这些方面提出了哲学在 Pearl 的事业中、以及更广泛的科学中的作用的有趣问题。哲学家读这本书会发现有很多值得欣慰的地方。Pearl 曾阅读并欣赏过哲学上关于因果关系和反事实的诸多著名讨论。书中引用了大卫·休谟和大卫·刘易斯、汉斯·赖申巴赫等哲学家的观点。与科学家们通常对哲学表现出的不屑相比,Pearl 的态度是一盏希望的灯塔。

但这本书也是一个警示性的故事。标准的统计学训练曾裁定 Pearl 完全避免因果关系的谈论,而仅仅是相关性。他不得不逆流而上,既要恢复1920年代 Sewall Wright 关于 “线性路径分析” 的工作,又要推动这些观点的发展。

这本书对因果分析的现状进行了精彩的概述。它有力地论证了发展关于世界的有充分支持的因果假说既重要又困难。困难,是因为无论数据集有多大,因果结论都不会仅仅从观察到的统计规律中流露出来。相反,我们必须利用我们所有的线索和想象力创造出可信的因果模型,然后分析这些模型,看看它们是否以及如何能够被数据检验。仅仅计算更多的数字并不是通往因果洞察力的王道。

但为什么要关心原因呢?其中一个原因是纯粹的科学好奇心:我们想了解这个世界,其中一部分是需要弄清楚它隐藏的因果结构。但同样重要的是,我们并不仅仅是世界的被动观察者:我们也是代理人。我们想知道如何有效地干预世界,以防止灾难并促进福祉。仅有良好的意愿是不够的,还需要深入了解自然界的资源和力量是如何相互联系的。因此,归根结底,如果我们要了解如何采取成功的行动,就必须弄清这个世界的原因。⚪️

在这里下载这本书https://www.patreon.com/posts/zhe-ge-shi-jie-48239418

The Why of the World

发表评论

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据