标记为回归的文章
辛普森悖论
- 2024 年 9 月 24 日
辛普森悖论 描述了一种情况,即在组内两个变量之间可能存在负相关关系,但是当来自多个组的数据组合在一起时,这种关系可能会消失甚至反转符号。下面的 gif 动画(来自辛普森悖论 维基百科 页面)非常出色地演示了这一点。
心理测量学中的验证性因子分析和结构方程模型
- 2024 年 9 月 24 日
“显然,相关性和依赖性的概念比概率判断的数值更基本……用于表示概率信息的语言应该允许定性、直接和明确地表达关于依赖关系的主张” - Pearl 在智能系统中的概率推理 Pearl [1985]
使用 BART 对异方差性建模
- 2023 年 1 月 24 日
在本笔记本中,我们将展示如何使用 BART 对异方差性进行建模,如 pymc-bart
的论文第 4.1 节中所述 [Quiroga et al., 2022]。 我们使用 R 包 datarium
提供的 marketing
数据集 [Kassambara, 2019]。 我们的想法是将营销渠道对销售额的贡献建模为预算的函数。
倍差法
- 2022 年 9 月 24 日
本笔记本简要概述了因果推断的倍差法,并展示了如何在贝叶斯框架下使用 PyMC 进行此类分析的工作示例。虽然笔记本提供了该方法的高级概述,但我建议查阅两本关于因果推断的优秀教科书。《The Effect》 [Huntington-Klein, 2021] 和《Causal Inference: The Mixtape》 [Cunningham, 2021] 都有专门章节介绍倍差法。
反事实推断:计算由 COVID-19 引起的超额死亡人数
- 2022 年 7 月 24 日
因果推理和反事实思维是非常有趣但复杂的主题!尽管如此,我们可以通过相对简单的例子来了解这些想法。本笔记本侧重于使用 PyMC 进行贝叶斯因果推理的概念和实际实现。
样条
- 2022 年 6 月 4 日
通常,我们想要拟合的模型不是 \(x\) 和 \(y\) 之间完美的直线。相反,模型的参数预计会随 \(x\) 而变化。 有多种方法可以处理这种情况,其中一种是拟合样条。 样条拟合实际上是多个单独曲线(分段多项式)的总和,每条曲线拟合到 \(x\) 的不同部分,并在它们的边界处(通常称为节点)连接在一起。
回归不连续性设计分析
- 2022 年 4 月 24 日
准实验 涉及实验干预和定量测量。 但是,准实验不 涉及将单元(例如,细胞、人、公司、学校、州)随机分配到测试组或对照组。 这种无法进行随机分配的情况在提出因果主张时会带来问题,因为它使得更难论证对照组和测试组之间的任何差异是由于干预造成的,而不是由于混淆因素造成的。
带有块更新的 Lasso 回归
- 2022 年 2 月 10 日
有时,一起更新一组参数非常有用。 例如,高度相关的变量通常很适合一起更新。 在 PyMC 中,块更新很简单。 这将使用 pymc.sample
的参数 step
来演示。
贝叶斯加性回归树:简介
- 2021 年 12 月 21 日
贝叶斯加性回归树 (BART) 是一种非参数回归方法。 如果我们有一些协变量 \(X\) 并且我们想要使用它们来建模 \(Y\),则 BART 模型(省略先验)可以表示为