标记为回归的文章

辛普森悖论

辛普森悖论 描述了一种情况,即在组内两个变量之间可能存在负相关关系,但是当来自多个组的数据组合在一起时,这种关系可能会消失甚至反转符号。下面的 gif 动画(来自辛普森悖论 维基百科 页面)非常出色地演示了这一点。

阅读更多 ...


心理测量学中的验证性因子分析和结构方程模型

“显然,相关性和依赖性的概念比概率判断的数值更基本……用于表示概率信息的语言应该允许定性、直接和明确地表达关于依赖关系的主张” - Pearl 在智能系统中的概率推理 Pearl [1985]

阅读更多 ...


分类回归

在此示例中,我们将对具有两个以上类别的结果进行建模。

阅读更多 ...


多元高斯随机游走

本笔记本展示了如何使用多元拟合相关时间序列 高斯随机游走 (GRW)。 特别是,我们执行时间序列数据对依赖于 GRW 的模型的贝叶斯回归

阅读更多 ...


滚动回归

配对交易是算法交易中一项著名的技术,它将两只股票进行对赌。

阅读更多 ...


使用 BART 的分位数回归

通常在进行回归时,我们对某个分布的条件均值进行建模。常见的情况是连续无界响应的正态分布、计数数据的泊松分布等。

阅读更多 ...


使用 BART 对异方差性建模

在本笔记本中,我们将展示如何使用 BART 对异方差性进行建模,如 pymc-bart 的论文第 4.1 节中所述 [Quiroga et al., 2022]。 我们使用 R 包 datarium 提供的 marketing 数据集 [Kassambara, 2019]。 我们的想法是将营销渠道对销售额的贡献建模为预算的函数。

阅读更多 ...


GLM:稳健线性回归

重复的隐式目标名称:“glm: robust linear regression”。

阅读更多 ...


GLM:泊松回归

这是一个使用虚拟数据预测计数的泊松回归的最小可重现示例。

阅读更多 ...


倍差法

本笔记本简要概述了因果推断的倍差法,并展示了如何在贝叶斯框架下使用 PyMC 进行此类分析的工作示例。虽然笔记本提供了该方法的高级概述,但我建议查阅两本关于因果推断的优秀教科书。《The Effect[Huntington-Klein, 2021] 和《Causal Inference: The Mixtape[Cunningham, 2021] 都有专门章节介绍倍差法。

阅读更多 ...


具有截尾或删失数据的贝叶斯回归

该笔记本提供了一个示例,说明当您的结果变量被删失或截断时,如何进行线性回归。

阅读更多 ...


反事实推断:计算由 COVID-19 引起的超额死亡人数

因果推理和反事实思维是非常有趣但复杂的主题!尽管如此,我们可以通过相对简单的例子来了解这些想法。本笔记本侧重于使用 PyMC 进行贝叶斯因果推理的概念和实际实现。

阅读更多 ...


样条

通常,我们想要拟合的模型不是 \(x\)\(y\) 之间完美的直线。相反,模型的参数预计会随 \(x\) 而变化。 有多种方法可以处理这种情况,其中一种是拟合样条。 样条拟合实际上是多个单独曲线(分段多项式)的总和,每条曲线拟合到 \(x\) 的不同部分,并在它们的边界处(通常称为节点)连接在一起。

阅读更多 ...


回归不连续性设计分析

准实验 涉及实验干预和定量测量。 但是,准实验 涉及将单元(例如,细胞、人、公司、学校、州)随机分配到测试组或对照组。 这种无法进行随机分配的情况在提出因果主张时会带来问题,因为它使得更难论证对照组和测试组之间的任何差异是由于干预造成的,而不是由于混淆因素造成的。

阅读更多 ...


贝叶斯中介分析

本笔记本涵盖了贝叶斯 中介分析。 当我们想要探索预测变量和结果变量之间可能的中介路径时,这非常有用。

阅读更多 ...


带有块更新的 Lasso 回归

有时,一起更新一组参数非常有用。 例如,高度相关的变量通常很适合一起更新。 在 PyMC 中,块更新很简单。 这将使用 pymc.sample 的参数 step 来演示。

阅读更多 ...


贝叶斯加性回归树:简介

贝叶斯加性回归树 (BART) 是一种非参数回归方法。 如果我们有一些协变量 \(X\) 并且我们想要使用它们来建模 \(Y\),则 BART 模型(省略先验)可以表示为

阅读更多 ...


GLM:使用自定义似然进行异常值分类的稳健回归

使用 PyMC 进行稳健回归和异常值检测,使用 Hogg 2010 信号与噪声方法。

阅读更多 ...