高级文章

贝叶斯非参数因果推断

很少有主张比因果关系的主张更强,也很少有主张比因果关系更具争议性。一个幼稚的世界模型——充满了脆弱的联系和不合逻辑的推论——是阴谋论和愚蠢的特征。另一方面,对因果关系的精细和详细的了解,其特点是清晰的期望、合理的联系和令人信服的反事实,将引导您顺利穿过喧嚣、蓬勃发展的世界混乱。

阅读更多 ...


离散选择和随机效用模型

此笔记本使用非 PyMC 依赖库,因此需要专门安装才能运行此笔记本。打开下面的下拉菜单以获取更多指导。

阅读更多 ...


变化的纵向模型

变化的研究涉及同时分析个体变化轨迹,并抽象研究对象集合,以提取关于所研究变化性质的更广泛的见解。因此,很容易因为专注于树木而看不到森林。在本例中,我们将演示使用分层贝叶斯模型研究个体群体内部变化的细微之处——从个体内部视角转向个体之间/交叉个体视角。

阅读更多 ...


贝叶斯缺失数据插补

重复的隐式目标名称:“bayesian missing data imputation”。

阅读更多 ...


使用 ModelBuilder 类部署 PyMC 模型

许多用户在将他们的 PyMC 模型部署到生产环境时面临困难,因为部署/保存/加载用户创建的模型没有很好的标准化。其中一个原因是没有像 scikit-learn 或 TensorFlow 那样在 PyMC 中直接保存或加载模型的方法。新的 ModelBuilder 类旨在通过提供受 scikit-learn 启发的 API 来包装您的 PyMC 模型,从而改进此工作流程。

阅读更多 ...


Pathfinder 变分推断

Pathfinder [Zhang et al., 2021] 是一种变分推断算法,可从贝叶斯模型的后验分布中生成样本。它比广泛使用的 ADVI 算法更具优势。在大型问题上,它的扩展性应该优于大多数 MCMC 算法,包括动态 HMC(即 NUTS),但代价是对后验分布的估计更偏差。有关该算法的详细信息,请参阅 arxiv 预印本

阅读更多 ...


经验近似概述

对于大多数模型,我们使用抽样 MCMC 算法,如 Metropolis 或 NUTS。在 PyMC 中,我们习惯于存储 MCMC 样本的轨迹,然后使用它们进行分析。PyMC 中的变分推断子模块也有类似的概念:经验。这种类型的近似存储 SVGD 采样器的粒子。独立的 SVGD 粒子和 MCMC 样本之间没有区别。经验充当 MCMC 采样输出和成熟的 VI 工具(如 apply_replacementssample_node)之间的桥梁。有关接口描述,请参阅 variational_api_quickstart。在这里,我们将只关注 Emprical,并概述经验近似的特定事项。

阅读更多 ...


使用 PyMC 将强化学习模型拟合到行为数据

强化学习模型通常用于行为研究中,以模拟动物和人类如何学习,在他们做出重复选择并随后获得某种形式的反馈(例如奖励或惩罚)的情况下。

阅读更多 ...


使用 numpy 核的高斯过程

简单高斯过程拟合示例,改编自 Stan 的 example-models 仓库

阅读更多 ...


如何在 PyMC 中包装 JAX 函数以供使用

此笔记本使用非 PyMC 依赖库,因此需要专门安装才能运行此笔记本。打开下面的下拉菜单以获取更多指导。

阅读更多 ...


因子分析

因子分析是一种广泛使用的概率模型,用于识别多元数据中编码在潜在变量中的低秩结构。它与主成分分析非常相关,仅在于对这些潜在变量假设的先验分布不同。它也是线性高斯模型的一个很好的例子,因为它可以完全描述为底层高斯变量的线性变换。要了解因子分析与其他模型的高级关系,您可以查看 此图,该图最初由 Ghahramani 和 Roweis 发布。

阅读更多 ...


多项式狄利克雷混合

本示例笔记本演示了如何使用多项式狄利克雷混合(也称为 狄利克雷-多项式 或 DM)来建模分类计数数据。像这样的模型在包括自然语言处理、生态学、生物信息学等在内的各个领域都很重要。

阅读更多 ...


使用“黑盒”似然函数

有一个 相关示例 讨论了如何使用在 JAX 中实现的似然函数

阅读更多 ...


用于密度估计的狄利克雷过程混合

狄利克雷过程 是分布空间上的一种灵活的概率分布。最一般而言,集合 \(P\) 上的概率分布 \(\Omega\) 是一个 [测度](https://en.wikipedia.org/wiki/Measure_(mathematics%29),它为整个空间分配测度 1 (\(P(\Omega) = 1\))。狄利克雷过程 \(P \sim \textrm{DP}(\alpha, P_0)\) 是一种测度,它具有以下属性:对于每个有限的 不相交 分区 \(S_1, \ldots, S_n\) of \(\Omega\),

阅读更多 ...


使用自定义步长方法从局部共轭后验分布中抽样

马尔可夫链蒙特卡洛 (MCMC) 抽样方法是现代贝叶斯推断的基础。PyMC 利用哈密顿蒙特卡洛 (HMC),这是一种强大的抽样算法,可以有效地探索高维后验分布。与更简单的 MCMC 方法不同,HMC 利用对数后验密度的梯度来提出智能建议,使其能够有效地对具有数百或数千个参数的复杂后验分布进行抽样。HMC 的一个关键优势是其通用性——它适用于任意先验分布和似然函数,而无需共轭对或闭式解。这至关重要,因为大多数真实世界的模型都涉及先验和似然,它们的乘积无法进行分析积分以获得后验分布。HMC 的梯度引导建议使其效率大大高于早期依赖于随机游走或简单建议分布的 MCMC 方法。

阅读更多 ...


使用欧拉-丸山方案推断 SDE 的参数

此笔记本来源于为艾克斯-马赛大学系统神经科学研究所理论神经科学小组准备的演示文稿。

阅读更多 ...