认识我们的 2022 年 PyMC Google 编程之夏学生#
Kunal Ghosh#
项目名称
快速精确高斯过程
导师
个人简介
我是芬兰赫尔辛基阿尔托大学计算机科学与应用物理学专业的四年级博士生。我的研究涉及开发新颖的机器学习解决方案,以应对计算材料科学领域的挑战。我广泛地对生成模型、材料科学和深度学习感兴趣。我也热爱教学,并在阿尔托大学协助讲授贝叶斯数据分析和深度学习课程。
联系方式
Twitter: @kunalghosh
LinkedIn: kunalgh
GitHub: @kunalghosh
在Kunal 的 GSOC 博客了解更多。
是什么激励您申请 PyMC 的 GSoC?
在赫尔辛基一个寒冷而黑暗的冬日夜晚,我正和一些博士生同学聊天,讨论我未来的生活计划。我不确定自己究竟想做什么,但为我的研究项目编写了一些大型软件后,我意识到编写高质量代码的重要性。我知道 Osvaldo Martin(PyMC 的核心开发者之一)正在研究 PyMC,在我们的一次小组会议后(Osvaldo 当时在我的博士生导师 Aki 那里做博士后),我询问是否有可能在 PyMC 工作,因为这对我来说是一个学习良好软件工程实践并为开源做贡献的好机会(我以前是 KDE 的狂热用户)。事情就这样一件接一件地发生了,我申请了 PyMC 的 GSoC,现在我在这里 :)
您为什么选择这个特定的项目主题?
我一直在寻找我有一些先前经验和背景的潜在项目。由于我之前有一些使用高斯过程的经验,并且之前也从头开始实现过它们,所以快速精确高斯过程是一个自然的选择!相当熟悉,但仍有一些学习空间。
您是如何参与开源软件的?
我开始得很早,最初在 2000 年代初高中时是一名 Linux 用户。在我的本科期间,我在我们大学成立了一个自由软件用户组,并组织了关于自由软件在科学工作中应用的研讨会。随后,我参加了 KDE 的 KDE 季和 OwnCloud 项目的 GSoC。但一直以来,我都对自由和开源软件怀有深深的热爱和欣赏。
您期望或希望从您的 GSoC 经验中获得什么?
我将在 PyMC 中实现快速精确高斯过程,并使代码准备好提交到主线,希望在 GSoC 结束前完成。但更重要的是,学习良好的软件工程实践,并希望继续成为 PyMC 的长期贡献者。
您的职业目标是什么?您认为 GSoC 项目如何帮助您实现这些目标?
我热爱教学和研究问题。我想做一份兼职博士后,并在行业内担任研究员,为行业内具有挑战性的问题原型化新的解决方案。如果有任何公司正在阅读本文并想和我聊聊,请随时与我联系 ;)。除此之外,我参加 GSoC 纯粹是为了学习更好的软件工程实践,我确信无论我最终做什么,这都会很有用 :)
Purna Chandra Mansingh#
项目名称
增加对批量多元分布的支持
导师
个人简介
我是海德拉巴中央大学计算机应用硕士专业的应届毕业生。过去一年,我一直在数据科学和机器学习领域工作。我喜欢处理复杂的问题,并且是一名技术指导员。在空闲时间,我喜欢将我学到的知识贡献给开源项目。
联系方式
Twitter: @purna_mansingh
LinkedIn: purna135
GitHub: @purna135
在Purna 的 GSOC 博客了解更多。
是什么激励您申请 PyMC 的 GSoC?
GSoC 是一个我不仅可以应用现有技能,还可以学习新技能的地方。学习不仅仅局限于技术知识。GSoC 向我介绍了一种协同开发代码的新范例。此外,GSoC 还是一个让我能够提升和磨练当前技能的平台,这激励我申请 GSoC。
您为什么选择这个特定的项目主题?
我对机器学习非常感兴趣,并且不久前发现了 PyMC;实际上,在我了解 GSoC 之前,我就已经开始贡献了。后来我发现了 GSoC,并意识到这个项目非常适合我的技能。
您是如何参与开源软件的?
由于我没有时间积极贡献,我首先从修复我通常遇到的库和工具中的小错误开始。我开始向 PyMC、Scikit-learn、Python、Pandas 以及我在学习机器学习时一直使用的其他库发送小的拉取请求。我了解了 PyMC 组织中的 GSoC 项目职位空缺并申请了它。
您期望或希望从您的 GSoC 经验中获得什么?
我希望在 GSoC 的 12 周内与一些了不起的人互动并分享想法。最后,我希望结交一些来自世界各地的优秀朋友,我可以和他们谈论有趣的项目,获得关于我的代码的反馈,以及几乎任何其他事情。我希望遇到友善、博学和聪明的人,他们都聚集在一个地方,团结一致,朝着共同的目标努力。
您的职业目标是什么?您认为 GSoC 项目如何帮助您实现这些目标?
我想从事软件开发方面的职业,GSoC 经验将帮助我获得设计和实施大型且高度优化的软件所需的技能。
Larry Dong#
项目名称
通过 AePPL 增强实现的 PyMC Dirichlet 过程子模块
导师
个人简介
我是加拿大多伦多市多伦多大学 Dalla Lana 公共卫生学院生物统计学专业的二年级博士生。我的学术兴趣围绕动态治疗方案和贝叶斯方法展开。我在疫情期间开始了我的博士学位,这使我能够沉浸在开源中,尤其是在 PyMC 社区中。我的第一个 GSoC 项目包括为 PyMC 实现一个 Dirichlet 过程子模块,我再次参加 GSoC 是为了继续这个项目并学习更多关于 Aesara 和 AePPL 的知识。
联系方式
Twitter: @larryshamalama
LinkedIn: larry-dong
GitHub: @larryshamalama
在Larry 的 GSOC 博客了解更多
是什么激励您申请 PyMC 的 GSoC?
我最初在 2020 年 3 月浏览 Twitter 时发现了与 PyMC 一起进行 GSoC 的可能性。那是我博士项目第一年的第二个远程学期,这让我感到疲惫不堪;我知道我需要从在线学习中换换环境。在攻读博士学位之前,为开源做贡献的想法并没有出现在我的脑海中,但这是一个非常吸引人的想法。我知道这是一个很好的学习机会,尤其是在编程和为已建立的代码库做贡献以及与社区成员互动方面。我写了一篇更深入的博文,关于我远程开始博士学位并通过 GSoC 发现开源的经历:https://larrydong.com/posts/2022-06-18-value-oss/。
您为什么选择这个特定的项目主题?
在 2020 年夏天,我参加了一个关于 Dirichlet 过程的在线暑期学校,但我几乎什么都没听懂。然而,它们似乎很有趣,我不知何故被这种方法所吸引。因此,我决定抓住机会,一头扎进去在 PyMC 中为 Dirichlet 过程实现一个功能。
您是如何参与开源软件的?
和所有人一样,我从小处着手,通过修复错别字和更新琐碎的东西开始。即使只是创建拉取请求有时也花了我很多次尝试。正是在 GSoC 期间,我才真正开始更多地参与开源。
您期望或希望从您的 GSoC 经验中获得什么?
就项目而言,我希望在 PyMC 实验版中提供 Dirichlet 过程子模块,并为 Aesara 和 AePPL 打下坚实的基础,以便成为更长期的贡献者。然而,我可能更重要的目标是继续培养友好和包容的社区,这个社区在我经历艰难时期时首先欢迎了我。
您的职业目标是什么?您认为 GSoC 项目如何帮助您实现这些目标?
我确切的职业目标仍然有待确定,但 GSoC 向我表明,在现实世界中,我的统计学和编程技能的研究生教育将非常有价值。我希望在毕业后(祈祷)找到一份能利用这些技能的工作,但坦率地说,我不知道我正在为哪个确切的职业做准备。我想,贡献开源的一个内在美妙之处在于,当我在从事并享受我的 GSoC 项目时,我或许可以发现未来的职业前景!
Danh Phan#
项目名称
PyMC 中的多输出高斯过程
导师
个人简介
大家好,我叫 Danh Phan,是澳大利亚莫纳什大学的博士候选人。我的研究重点是机器学习(贝叶斯方法、选择模型、基于树的模型和深度神经网络)在智能交通系统中的应用。 我在不同的机器学习算法方面有四年以上的工作经验,并在机器学习领域发表了几篇论文。此外,我曾在 Monash Data Fluency 担任讲师,在那里我为莫纳什大学的研究生和教职员工讲授关于 Python、Git 和高性能计算的动手研讨会。我也在使用 PyMC 中的贝叶斯方法近两年了。
联系方式
在Danh Phan 的博客了解更多。
是什么激励您申请 PyMC 的 GSoC?
我第一次使用贝叶斯方法(贝叶斯网络、GLM)的经验是从 PyMC 代码示例和资源中学习。有用的学习资料和优秀的社区支持对我在进行贝叶斯分析的旅程中帮助很大。在 PyMC 开发团队的大力支持下,我最近向 PyMC 和 Aesara GitHub 代码库贡献了几个拉取请求 (PR)。此外,我想长期参与这个社区,以便一路学习和贡献。
您为什么选择这个特定的项目主题?
我对应用高斯过程分析具有时间和空间特征的真实世界数据集很感兴趣。在我目前的研究课题中,我一直在研究多输出高斯过程 (MOGP),以生成人们的出行活动时间。因此,我很乐意通过在 PyMC 的 GP 模块中添加 MOGP 功能来为 PyMC 库做出贡献。
您是如何参与开源软件的?
我的一位老朋友告诉我,为开源做贡献是个好主意,这样我就可以一路贡献和学习。由于我在工作中使用了 PyMC 一段时间,并发现它真的很有价值,所以我决定为 PyMC 项目做贡献。我在 PyMC GitHub 上的第一个拉取请求是创建一个辅助
pm.draw()
函数,用于为给定变量进行抽样。 PR 花了一段时间才合并,但我学到了有用的东西,比如编写文档字符串和测试用例。您期望或希望从您的 GSoC 经验中获得什么?
我的项目旨在在 PyMC 中添加对多输出高斯过程 (GP) 的支持。多输出 GP 的优势在于它们能够同时学习和推断来自输入的具有相同不确定性来源的多个输出。该模型为不同领域的各种应用提供了一种实用的方法。因此,多输出 GP 功能将显着扩展 PyMC GP 模块的功能,并使 PyMC 社区受益。
我计划将核心区域化的线性模型和 Hadamard 回归模型整合到 PyMC GP 模块中。这个项目是一个极好的机会来磨练我的编码技能,包括设计用户 API、编写类、文档字符串和测试以及笔记本示例。此外,我希望结交更多好朋友,并从我的导师和其他 PyMC 开发人员那里学到更多。他们非常支持我,我很幸运能参与这个项目。
您的职业目标是什么?您认为 GSoC 项目如何帮助您实现这些目标?
我想成为一名有效的数据科学家,能够开发数据驱动的产品来解决现实世界的问题,并帮助企业做出高效的、基于科学的决策。我认为贝叶斯方法是解决各种问题的直观而实用的方法,特别是那些需要考虑不确定性的问题。当然,我们也需要其他机器学习方法,这将取决于具体的用例。
GSoC 项目将使我能够学习更多关于贝叶斯统计学的知识,特别是关于非参数模型。这些知识对于开发不同领域的各种应用非常有价值。此外,我可以提高我的沟通技巧以及在多元化和国际化团队中工作的能力。
Shashank Kirtania#
项目名称
为 PyMC 模型部署创建基类
导师

个人简介 我是塔帕尔工程与技术学院计算机工程专业的应届毕业生。我已经在数据科学领域工作了几年。我曾参与过几个计算机视觉领域的项目,并有机会在今年早些时候与一个从事贝叶斯建模的团队合作。我喜欢探索数据科学领域,并将我学到的东西应用到各种项目中。
联系方式
LinkedIn: Shashank Kirtania
GitHub: @5hv5hvnk
是什么激励您申请 PyMC 的 GSoC?
最初,在我一年级的时候,我听说了开源社区,我不明白它是如何运作的,但随着时间的推移,开源的想法吸引了我。在最初的时候,为大型代码库做贡献对我来说是一项非常艰巨的任务,我相信 GSoC 提供了正确的协作环境来为这类组织做出贡献。
您为什么选择这个特定的项目主题?
使用部署管道是一个重要的项目,之前,有机会与一个使用 PyMC 进行贝叶斯建模的团队合作,我知道了为什么我们需要这个项目。我觉得这将是我从事贝叶斯模型部署并更好地理解模型本身的绝佳机会。
您是如何参与开源软件的?
我第一次接触开源软件是在我大学一年级的时候。当我第一次听说 Hacktoberfest 时,遗憾的是我没有足够的技能来有效地为任何项目做出贡献。随着时间的推移,随着我的技能提高,我有机会修复 PyMC 本身中较小的初学者友好的问题。在今年晚些时候,我获得了这个机会来从事我的第一个开源项目。
您期望或希望从您的 GSoC 经验中获得什么?
我期望完成我的项目,并获得更多使用 PyMC 部署贝叶斯模型的经验。我一直在努力学习更多关于贝叶斯建模的知识,并且我正在尝试理解相同的真实世界用例。希望在 GSoC 经验结束时,我将能够为与此相关的项目做出更多贡献。
您的职业目标是什么?您认为 GSoC 项目如何帮助您实现这些目标?
未来,我计划在数据科学和机器学习领域发展职业;在这个项目中使用 PyMC 工作正在帮助我提高技能,并为我无法在没有 GSoC 提供的协作环境的情况下参与的开源项目做出贡献。
Yann McLatchie#
项目名称
PyMC 的投影预测模型选择。
导师
个人简介
我目前是芬兰阿尔托大学机器学习、数据科学和人工智能专业的硕士生。我的主要兴趣在于贝叶斯统计学领域,以及最近的模型选择的贝叶斯方法。在学习之余,我在阿尔托大学的 概率机器学习研究小组 在 Aki Vehtari 的指导下工作。
联系方式
LinkedIn: yannmclatchie
GitHub: @yannmclatchie
是什么激励您申请 PyMC 的 GSoC?
Osvaldo Martin(我的导师之一和 PyMC 核心开发人员)去年在阿尔托大学与我在同一个研究小组做博士后,我们之前讨论过需要在 Python 中实现投影预测模型选择,因为它在 R 中取得了成功,并且有强大的理论支持。因此,我们提出了将其纳入 GSoC 项目的想法,瞧,成功了!
您为什么选择这个特定的项目主题?
在过去的六个月里,我一直作为研究助理研究投影预测模型选择。将我的理论理解具体化为一个 Python 包的机会有望加深我对该主题的实践理解。我也发现其基本理论非常有趣,并欣然接受将其带给更广泛社区的机会。
您是如何参与开源软件的?
我第一次涉足开源软件是尝试构建一个用于随机模拟的小型 Python 包。这最初令人生畏,但我发现学习和开发过程非常有益。因此,我跟进向 Bambi 等软件包提交了小的拉取请求,并最终发现自己对深入研究开源开发产生了兴趣。
您期望或希望从您的 GSoC 经验中获得什么?
首先,我希望制作 Kulprit,一个将投影预测模型选择带给 Bambi 的 Python 包,并在此过程中也将该方法带给更广泛的受众。我确信,从头到尾完成一个软件包的开发过程不仅会教会我更多关于 Python 编程的知识,还会教会我关于核心理论的文档和交流,以及作为开源开发团队的一员进行工作。
您的职业目标是什么?您认为 GSoC 项目如何帮助您实现这些目标?
我喜欢研究研究问题并在代码中实现复杂的想法,并希望在研究生涯中继续这样做。GSoC 项目为我提供了将重要的研究问题转化为软件并将其传达给从业人员的机会。
Conor Hassan#
项目名称
潜变量高斯模型的有效推断
导师
个人简介
我是 QUT 的博士研究员,在 Kerrie Mengersen 的指导下。我的研究重点是潜在高斯模型和差分隐私生成模型的联邦学习(由于隐私限制而进行分布式估计)。
联系方式
LinkedIn: Conor Hassan
GitHub: @conorhassan
Twitter: @hassanconor
是什么激励您申请 PyMC 的 GSoC?
我一直想为一个概率编程环境做贡献!我选择 PyMC 主要有四个原因:社区很热情;社区很活跃;Python;而且我认为 V4 中所做的更改非常令人印象深刻,并且是社区奉献精神的标志。
您为什么选择这个特定的项目主题?
作为我研究的一部分,我致力于开发新的推理方法(用于潜在高斯模型)。由于我们的研究方向,我们专注于包括变分推理和类似 INLA 的思想在内的技术。我一直很好奇如何在像 PyMC 这样的工具中改进这些模型的方法,然后 Dan Simpson 的博客 就出现了。去看看吧!
您是如何参与开源软件的?
这是我第一次为开源做贡献。是时候回馈一点了!
您期望或希望从您的 GSoC 经验中获得什么?
我希望贡献后端支持,以提高在 PyMC 中拟合潜在高斯模型的效率。这些是 INLA 拟合速度如此之快的模型类别!但是 INLA 软件包在后台做了许多与特定推理方法无关的智能事情。这些方法是我们将尝试添加到 PyMC 中的方法。就我个人而言,我希望从中获得的是在这个社区中的一席之地,以及希望能够超越 GSoC 并有望在未来继续为 PyMC 做出贡献的关系!
您的职业目标是什么?您认为 GSoC 项目如何帮助您实现这些目标?
我目前热爱我的研究,并希望继续从事研究,开发新的贝叶斯和机器学习推理方法,或者考虑将此类技术应用于复杂问题。无论如何,像 PyMC 这样的开源库将在我未来想从事的工作中发挥重要作用!
Nicoleta Spînu#
项目名称
机械毒理学中时间序列基因表达数据的建模与预测
导师
个人简介
一位受过药剂师培训,拥有计算毒理学博士学位,对人工智能和个性化医疗感兴趣的人。
联系方式
LinkedIn: Nicoleta Spînu
GitHub: @nicospinu
Twitter: @nicospinu
是什么激励您申请 PyMC 的 GSoC?
主要有三个原因:时间序列的主题、导师和支持性的开发者社区,以及个人贡献扩大 PyMC 的使用和适用领域的机会。
您为什么选择这个特定的项目主题?
时间序列的主题在药物发现领域(例如,临床前研究和临床试验)中相当被忽视。因此,动机是更多地了解时间序列分析和状态空间模型(包括卡尔曼滤波器),以及实现如何工作,并展示如何使用 PyMC 来建模时间数据。
您是如何参与开源软件的?
我的第一次提交是在我读博期间,我希望它不会是唯一的一次!:) GSoC 似乎是我参与开源软件并掌握它实际是什么以及希望继续作为 PyMC 贡献者的完美方式。
您期望或希望从您的 GSoC 经验中获得什么?
从实现到测试,提高和学习软件工程技能,结识其他对时间序列主题感兴趣的科学家和开发人员,理想情况下,使用 PyMC 解决至少一个化学安全评估问题。
您的职业目标是什么?您认为 GSoC 项目如何帮助您实现这些目标?
通过 PyMC 的 GSoC 将有助于在概率编程和建模方面奠定坚实的基础。这些技能还将使我能够开发最终将使患者受益的模型,这是我的愿望。