Benjamin T. Vincent 的文章

辛普森悖论

辛普森悖论描述了一种情况,即在群体内部,两个变量之间可能存在负相关关系,但是当来自多个群体的数据组合在一起时,这种关系可能会消失甚至反转符号。下面的 gif 动图(来自辛普森悖论的 维基百科 页面)非常出色地演示了这一点。

阅读更多 ...


贝叶斯 copula 估计:描述相关的联合分布

当我们处理多个变量(例如 \(a\)\(b\))时,我们通常想要参数化地描述联合分布 \(P(a, b)\)。如果我们幸运的话,那么这个联合分布可能会在某种程度上“简单”。例如,可能是 \(a\)\(b\) 在统计上是独立的,在这种情况下,我们可以将联合分布分解为 \(P(a, b) = P(a) P(b)\),因此我们只需要为 \(P(a)\)\(P(b)\) 找到适当的参数化描述。即使这不合适,也可能是 \(P(a, b)\) 可以通过简单的多元分布很好地描述,例如多元正态分布。

阅读更多 ...


干预分布和使用 do-运算符的图变异

PyMC 是开源贝叶斯统计生态系统的关键组成部分。它每天帮助解决各行各业和学术研究领域的实际问题。它之所以获得如此高的实用性,是因为它在解决贝叶斯统计推断问题时具有可访问性、强大功能和实用性。

阅读更多 ...


中断时间序列分析

本笔记本重点介绍如何进行简单的贝叶斯 中断时间序列分析。这在 准实验设置 中非常有用,在这些设置中,干预措施应用于所有处理单元。

阅读更多 ...


差异中的差异

本笔记本简要概述了因果推断的差异中的差异方法,并展示了如何在贝叶斯框架下使用 PyMC 进行此类分析的工作示例。虽然笔记本提供了该方法的高级概述,但我建议查阅两本关于因果推断的优秀教科书。《The Effect》[Huntington-Klein, 2021] 和 《Causal Inference: The Mixtape》 [Cunningham, 2021] 都有专门讨论差异中的差异的章节。

阅读更多 ...


使用截断或删失数据的贝叶斯回归

本笔记本提供了一个示例,说明如何在结果变量被删失或截断时进行线性回归。

阅读更多 ...


反事实推断:计算由 COVID-19 导致的超额死亡人数

因果推理和反事实思维是非常有趣但复杂的主题!然而,我们可以通过相对简单的例子来理解这些想法。本笔记本重点介绍使用 PyMC 进行贝叶斯因果推理的概念和实际实施。

阅读更多 ...


回归不连续性设计分析

准实验 涉及实验干预和定量测量。但是,准实验涉及将单元(例如,细胞、人、公司、学校、州)随机分配到测试组或对照组。在做出因果声明时,这种无法进行随机分配的情况会带来问题,因为它使得更难论证对照组和测试组之间的任何差异是由于干预措施造成的,而不是由于混淆因素造成的。

阅读更多 ...


贝叶斯调节分析

本笔记本涵盖贝叶斯 调节分析。当我们认为一个预测变量(调节变量)可能会影响另一个预测变量和结果之间的线性关系时,这是合适的。在这里,我们看一个例子,我们研究训练时间和肌肉质量之间的关系,其中年龄(调节变量)可能会影响这种关系。

阅读更多 ...


二项回归

本笔记本涵盖了 二项回归 背后的逻辑,它是广义线性建模的一个特定实例。该示例保持非常简单,只有一个预测变量。

阅读更多 ...


贝叶斯中介分析

本笔记本涵盖了贝叶斯 中介分析。当我们想要探索预测变量和结果变量之间可能的中介途径时,这非常有用。

阅读更多 ...


从笨拙的分箱数据中估计分布参数

假设我们对推断人口的属性感兴趣。这可以是年龄、收入、体重指数或各种不同的可能衡量标准中的任何一种。在完成这项任务时,我们经常会遇到我们有多个数据集的情况,每个数据集都可以告知我们对整个人口的看法。

阅读更多 ...