人工智能如何帮助自然科学

背景

人工智能 (AI) 正日益成为其他科学和技术领域研究人员的工具,促进跨学科合作。加州斯坦福大学编制了一个跟踪人工智能相关数据的索引,该大学在其 2021 年报告中发现,从 2019 年到 2020 年,人工智能期刊出版物的数量增长了 34.5%;从 2018 年到 2019 年的 19.6% 上升(见go.nature.com/3mdt2yq)。2019 年,人工智能出版物占全球所有同行评审科学出版物的 3.8%,高于 2011 年的 1.3%。

五位人工智能研究人员描述了这些合作的成果,超越了期刊出版物,并讨论了他们如何帮助打破学科之间的障碍。

FABIO COZMAN:管理期望

巴西圣保罗大学人工智能中心 (C4AI) 主任。

在我领导人工智能中心 (C4AI) 的巴西圣保罗大学,我们的主要目标是开展对社会和行业有直接影响的机器智能研究。我们有五个核心计划。一个目标是极大地改进巴西语言葡萄牙语的自然语言处理和翻译,以便通过计算机语音工具更好地翻译、转录和理解葡萄牙语使用者所说的话。另一个,蓝色亚马逊大脑,研究气候变化、生物多样性和矿产资源对巴西大西洋海岸线和居住在那里的人们的影响。该中心于 2020 年 10 月开业,每年从技术公司 IBM 获得 200 万巴西雷亚尔(38 万美元)的资金,200 万雷亚尔来自圣保罗研究基金会,400 万雷亚尔来自圣保罗大学。州政府提供进一步的财政支持。

该中心广泛合作,但合作者通常对计算机科学可以实现的目标有不同的期望。这些期望可以通过与合作者明确人工智能可以做什么和不能做什么来解决。关于研究成果的分歧经常出现:例如,自然科学界的人们通常认为期刊论文是传播研究的最佳方式,而根据我的经验,人工智能研究人员更看重会议。

另一个挑战是一些研究人员只想要一个程序员。这样的研究人员需要更愿意分享他们的知识和问题,而不是仅仅采用“来帮我编程”的方法。协作需要成为旨在解决和回答问题的伙伴关系。

人工智能发展得如此之快,以至于计算机科学和工程领域的人们觉得他们必须伸出援手来解决现实世界的问题:仅仅做我们自己的事情对我们来说不再那么有益了。我们正在追随一个趋势:所有主要的人工智能实验室和中心现在都在参与现实生活中的应用问题。对于希望与人工智能专家合作的研究人员,我的建议是首先管理您的期望:您是否希望让“擅长计算机”的人帮助您进行一些数据分析,或者您是否真的需要提出更深层次的问题,哪个 AI 可以帮你回答?

一点背景知识和实践经验对合作者很有用。

PHIALA SHANAHAN:公平地运作

剑桥麻省理工学院理论物理学家。

我与该公司的 AI 研究部门 Google DeepMind 有持续的合作。该协会始于几年前在以色列举行的一次会议。我和我的学生展示了我们在剑桥麻省理工学院 (MIT) 开始的一些项目,这些项目采用了伦敦 DeepMind 的高级研究科学家 Danilo Jimenez Rezende 提出的一些想法;Rezende 的工作包括复杂数据的建模,例如医学图像、视频、3D 场景几何和复杂的物理系统。他完成了一些我们已经应用于基础物理问题的关键机器学习研究。

我们进行了交谈,并由此产生了更长期的合作。它现在涉及 DeepMind 的几个人,我的几个博士后和一个博士生。在过去的几年里,我们已经写了四五篇论文,并且确实做了一些创新的事情,使用机器学习模型来加速已建立的物理计算。最终,目标是使我们能够进行现有算法和资源在计算上不可能进行的研究。

使我们的合作成功的东西是平等感。我的团队正在像 DeepMind 团队一样努力推动 AI 方面。DeepMind 小组的人也非常了解他们的物理学。双方都可以做科学的两个部分,所以这是一次非常均匀和动态的合作,非常有趣。

我参与了效率较低的合作,他们的态度是“一组应该担心物理部分,一组应该担心计算机科学部分”,我们在中间相遇。所发生的情况是,这两个群体最终都变得孤立并与语言障碍作斗争。我发现这样的合作不是互动的。

实际上,与 DeepMind 的这种更紧密、更平衡的关系意味着我们每周与参与该项目的每个人开一次会。我们在协作平台 Slack 上也有一个联合频道,我们在此期间聊天,并且我在一周内与我自己小组中正在从事该项目的人开会更频繁。
[[作者: 吴雄伟]](https://wuxiongwei.com)

SIMON OLSSON:找到要解决的问题

瑞典哥德堡查尔姆斯理工大学应用人工智能助理教授。

在我去年 10 月开始的实验室中,我们开发了机器学习方法来解决自然科学中的计算问题。例如,目前,我们正在与英国-瑞典公司阿斯利康合作开发药物设计方法,该公司在我所在大学附近的哥德堡设有研究中心。我们还在研究如何将实验数据整合到蛋白质结构和动力学的机器学习模型中。

我们使用来自自然科学的已发表论文和数据来训练算法,而不是让它们自己解决问题。例如,如果你想弄清楚一种蛋白质是如何折叠的,或者一种药物是如何与它相互作用的,那么使用一个计算模型来考虑关于该蛋白质的文献,以及控制它的物理和化学定律。行为,可能会有所帮助。

如果你有计算机科学背景并且想在学习自然科学的同时进入人工智能,试着找出你感兴趣的领域并找到你想解决的问题。例如,我最初是通过研究分子动力学和分子设计而被这个领域所吸引,其中分子及其相互作用是在计算机中模拟的,通常用于药物发现的目的。人工智能有可能使以前无法解决的问题在这些领域中得到解决,这些领域对计算的要求非常高。

如果您不是来自计算机科学背景,那么学习编程并掌握机器学习理论的基础知识是很重要的。一个起点是learnpython.org,它提供了关于 Python 编程语言的交互式教程。美国在线课程平台 Coursera 和 YouTube 上也有关于机器学习的在线课程。或者你可以在你的大学参加机器学习或数据科学课程。

学习使用 AI 编程的基础知识还意味着发展应用统计知识和研究机器学习算法的工作原理,以及它们处理数据和从经验中“学习”的一些方式。掌握这些概念是重要的第一步。

我认为认识到机器学习和人工智能的有用性实际上归结为问自己:“这些方法如何帮助我们改进,从根本上推动科学向前发展?”

我建议对人工智能感兴趣的人开始学习编程,只需尝试自动化他们在工作生活中经常做的事情:无论是发送模板电子邮件还是将数据输入电子表格。如果重复这是一项无聊的任务,那么自动化它的动力将很快到来。之后,逐渐用越来越复杂的任务挑战自己。

ROMAN LIPSKI:我的机器学习缪斯

柏林艺术家,将人工智能融入他的作品。

2016 年 4 月,我开始在柏林美术学院教授难民课程,在那里我遇到了数据科学家 Florian Dohmann。我们开始合作,尝试使用人工智能探索艺术。我看过 Google 的数据科学家使用 AI 制作的图片。它们是由重复元素制成的恐怖故事图像,以具有 1,000 只眼睛或 1,000 英尺的动物为特色。

起初我有点天真:我想也许我们会立即拍出有史以来最好的照片。我知道有巨大的潜力,但我不知道如何使用人工智能。弗洛里安和我开始使用由德国蒂宾根大学的科学家创建的开源算法,该算法旨在使用机器学习识别形状和颜色。为了忠于我的艺术原则,我们决定只在我自己的工作上训练算法。我们拍摄了我在职业生涯中创作的每一幅画,创建了一个小数据集来教授算法,然后要求它创作一件原创作品。

结果又是惨不忍睹。它看起来就像我从谷歌工程师那里看到的画——重复的形状和颜色,没有添加任何新东西。从艺术上讲,它们比其他任何东西都更具噱头。

我们决定创建一个新的数据集,使用一个重复的主题——灵感来自安迪沃霍尔的坎贝尔汤罐——我在自己的画作中使用过。主题是我在 2016 年 3 月访问过的洛杉矶一条非常简单的街道景观。我用不同的颜色和纹理多次绘制了相同的场景。

我们将这组图像数字化,我意识到我制作的艺术不是为了向人类观众展示,而是为了让机器“看到”和处理:这是我和机器之间对话的开始。

这一次,当我们要求算法创新并制作新图片时,结果令人惊叹。不是每张照片都好,但我们得到了成千上万的不同艺术风格的伟大成果,具有真正的艺术品质和我自己无法达到的形式。

在遇见弗洛里安的前一年,我遇到了彻底的艺术危机。我觉得我已经用完了我自己世界里可以用油漆讲述的故事。我现在又开始画画了,但不是简单地打印 AI 算法生成的东西,而是使用它的输出作为灵感来创作我自己的原创作品。我现在鼓励其他人将该算法用作名为 Unfinished 的社区艺术项目的一部分,帮助他们使用 AI 工具体验我的创作过程并创作自己的画作。

我的建议是不要被人工智能设备吓倒,而只是开始使用它们:就像任何工具一样,它们有其优点和缺点。但对我来说,人工智能改变了我的职业生涯。
[[作者: 吴雄伟]](https://wuxiongwei.com)

SIDDHARTH MISHRA-SHARMA:寻找伟大的导师

剑桥麻省理工学院粒子物理学博士后研究员。

作为本科生,我在英国剑桥大学做过一些实验高能物理学和天体物理学的实习。其中包括在瑞士日内瓦附近的欧洲粒子物理实验室欧洲核子研究中心的几个夏天。在新泽西州普林斯顿大学攻读粒子物理学博士学位期间,我还涉足了机器学习,并在我目前在麻省理工学院的职位上回到了机器学习领域。人工智能工具往往是物理学的一个很好的补充。我们经常使用来自粒子对撞机或望远镜的庞大数据集,这些数据集可以产生 PB 级的数据。

例如,假设你有一个庞大的数据集,可以通过我们的银河跟踪恒星的运动。暗物质可以对恒星的运动产生有趣的影响,将它们稍微拉向一侧或另一侧,或者扭曲来自它们的光。因为效果很微妙,很难单独分析超过 1000 亿颗恒星。最终,它变成了一个大数据问题:机器学习方法可以帮助我们识别模式,并且可以扩展以处理庞大的数据集。

而且由于有如此多类型的天文数据集可用——从单个星系的图像到银河系的地图——没有一种机器学习方法可以有效地用于寻找暗物质的影响。当机器学习开始用于天体物理学时,方法被大规模调整,在新的环境中使用已建立的算法。例如,如果机器学习方法擅长区分猫和狗的图像,它将适用于区分不同星系的图像。

但是今天,物理学家和其他自然科学从业者的需求可以为机器学习方法的发展提供信息。我不再直接处理直接来自对撞机或望远镜的海量数据集。相反,我日常工作的一部分涉及查看哪种方法对给定的问题或观察效果很好,如果不存在这种方法,则尝试创建它。在这样的工作中,物理和机器学习之间的信息流是双向的,两个学科正在相互通知。我很高兴能参与其中。

我鼓励其他人联系潜在的导师并说:“这是一个有趣的问题——我认为你的方法非常适合它。” 通常,合作另一方的人对修改他们的方法以满足您的需求或提供建议感到兴奋。他们通常只是太高兴地考虑你的问题。

原文链接

你可能感兴趣的