AI,又有颠覆性发现! 红杉爱科学

2024-01-22
这些“颠覆式”的科研成果为科学界带来的不止是新的材料、新的研究方向,更重要的是,它让科学家们看到了“解放”的可能——从密集的、重复的实验中解放。

编者按:本文来自微信公众号 红杉汇(ID:Sequoiacap),创业邦经授权转载。

对于科学家们而言,利用AI工具对加速科研进程大有裨益。最近,AI发现了首批新抗生素。这种全新的抗生素类别将用于对抗耐药性金黄色葡萄球菌(MRSA),其相关研究论文已经登上《自然》。

另外,在2023年11月底上线的两篇《自然》论文报告称,AI工具不仅发现了220万个新晶体,其中381,000个最稳定的晶体有望成为实验合成的候选材料,为超导体、超级计算机供电等一系列未来技术的革新和发展助力;而且在AI实验室中,这些新材料最终在17天内全自动合成了41种新无机化合物。

这些“颠覆式”的科研成果为科学界带来的不止是新的材料、新的研究方向,更重要的是,它让科学家们看到了“解放”的可能——从密集的、重复的实验中解放。当然,AI介入的科研仍需要人类来完成最核心的推理与思考。未来,独立思考能力或许比“会做实验”更为重要。


首批新抗生素

图片

最近,MIT的科学家们利用AI发现了一种全新的抗生素类别,用于对抗耐药性金黄色葡萄球菌(MRSA)。这也是过去60年首次发现的一类新抗生素。

MRSA细菌已经困扰了人类多年。感染者轻则皮肤感染,重则感染肺部和血液,甚至危及生命。根据欧洲疾病预防控制中心(ECDC)的数据,欧盟每年有近150,000例MRSA感染,而每年死于抗菌素耐药性感染的有近35,000人。

在这项研究中,研究人员运用深度学习模型,通过分析化学结构,找到了一组化合物,显示出对耐药细菌的潜在杀菌效果。这些化合物在实验室培养皿中和小鼠感染模型中都表现出良好的杀菌作用,尤其是对MRSA的效果显著。而令人振奋的是,这些化合物对人类细胞的毒性极低,因此成为理想的药物候选。

该研究团队负责人表示:“我们的见解在于,我们能够看到模型是如何学习的,从而做出预测,即某些分子可能是良好的抗生素。我们的工作提供了一个从化学结构角度来看是时效、资源高效且在机制上有深刻见解的框架,这是迄今为止我们尚未拥有的。”

这一研究的独特之处在于,研究人员还成功解读了深度学习模型用于进行抗生素效力预测的信息类型。这一认识有助于科学家设计更为有效的药物,进一步拓展了抗生素研究的领域。

该团队近年来一直在使用深度学习寻找新的抗生素。通过该技术,他们已经为多种细菌提供了潜在的药物,其中包括鲍曼氏不动杆菌等医院中常见的耐药细菌。

然而,在这一研究中,深度学习模型有一个缺陷——其“黑匣子”性质无法准确了解模型是基于哪些特征进行预测。为解决这一问题,研究人员训练了额外的深度学习模型,以评估这些化合物对人体细胞的毒性。结合这些信息和抗微生物活性的预测,研究人员最终确定了一组既有望杀灭微生物又对人体影响最小的化合物。

在一篇采访中,团队负责人提到:“传统上,科学家大约需要花费12年的时间,才能发现一种新的抗生素;然后,再到发现任何临床候选药物,还需要3-6年的时间;最后,你还需要将它们过渡到I期、II期和III期临床试验。而现在,有了AI,便能够加速这一进程。挖掘模型背后的‘黑匣子’、让它变得可解释,这一点很重要,这是将AI转化为工程学科的关键一步。”

220万个新材料

图片

无论是开发新的清洁能源,还是发展出更好的信息处理方法,想要在这些现代技术应用上取得突破,都离不开创造出具有新颖功能的无机晶体材料,并且这些晶体必须是稳定的,不会分解成相似的能量较低的成分。

然而,每一个新的、稳定的晶体的创造,背后都经历了耗时持久的艰苦实验。现在,在一项新发表于《自然》杂志的研究中,谷歌人工智能实验室 DeepMind 开发的深度学习工具“材料探索图形网络”(Graph Networks for Materials Exploration, GNoME)发现了220万个新晶体,其中381,000个最稳定的晶体有望成为实验合成的候选材料。

GNoME是一个最先进的图神经网络(GNN)模型,它的输入数据采用的是图的形式,这些图就好像是原子之间的连接,因此特别适用于发现新的晶体材料——通过预测新材料的稳定性,极大地提高发现新材料的速度和效率。

最初,研究人员使用由“材料计划”(Materials Project)开发了十多年的数据来对GNoME进行训练。“材料计划”是一个于2011年建立的开放获取数据库,它计算已知的和预测的材料的性质。在训练过程中,研究人员会用GNoME来生成新的候选晶体,并预测它们的稳定性。

为了评估GNoMe在渐进训练周期中的预测能力,研究人员使用被称为密度泛函理论(DFT)的计算技术反复检查其性能,并使用一种被称为“主动学习”的训练过程,不断改进算法,然后将得到的高质量训练数据反馈到模型训练中。这极大地提高了GNoMe的性能,将材料稳定性预测的发现率从50%左右提高到了80%。

图片

在ICSD数据库中,通过实验确定了大约有20,000个在计算上稳定的晶体。来自材料计划、开放量子材料数据库和WBM数据库的计算方法将这一数字提高到48,000个。GNoME将人类已知的稳定晶体的数量增加到42.1万种。(图/DeepMind)

最终,GNoME生产了220万个晶体结构,其中38万个稳定的晶体结构已经被添加到“材料计划”中。

过去,科学家都是通过对已有的晶体进行调整,或在实验中进行新的元素组合尝试来寻找新的晶体结构。这是一个昂贵的、需要反复试验的过程。在过去的十年中,科学家们开始尝试使用计算方法来发现新的晶体材料。不过,虽然这些由人工智能主导的方法帮助科学家发现了28,000种新晶体,但这些方法在准确预测出可以在实验室合成的材料方面受到了限制。

不过,在由GNoME发现的38万多个最稳定的晶体结构中,世界各地的科学家已经在实验中创造出了736个,这表明GNoMe以前所未有的规模和准确性预测了稳定的晶体结构。

图片

DeepMind的研究人员在搜索了科学文献后,发现736个新的稳定晶体结构已经由世界各地的科学家团队独立实现,图中列出的是六个例子。(图/DeepMind)

GNoME为材料科学的贡献具有巨大的价值。例如GNoME发现了528种潜在的锂离子导体,这一数量是之前研究的25倍,有望在提高可充电电池的性能方面发挥巨大作用。

更重要的是,GNoME不仅能预测结构,还能在硬件设备完善的情况下“亲自做实验”,让新材料的发现速度成百上千倍地增长。

2023年2月,一个名为A-Lab的自动化实验室在伯克利启用,旨在快速寻找和跟踪用于电池和储能等领域的新材料。在这里,AI指导的机器人是实验台前的主力。当人类学者或AI确定了目标材料,一系列机器人就会在A-Lab中执行合成该材料的步骤。这个实验室的系统被设计为一个“闭环”,这意味着它能够在没有人为干预的情况下自动决策,昼夜不停地运行。

A-Lab为验证GNoME的实际生产力提供了绝佳的平台。在伯克利实验室的超级计算机上,研究人员根据现存科学文献训练GNoME,随后结合主动学习,可针对拟定化合物创造最多 5个初始合成配方。随后它会指挥机器臂执行实验,合成粉末形态的化合物。如果一个配方产量低于50%,A-Lab 会调整配方继续实验,在成功达到目标或穷尽所有可能配方后结束。

经过17天的连续工作,A-Lab进行了355次实验,合成了58个拟定化合物中的41个,成功率达到了71%,平均每天产出的新化合物数量在2个以上。不过,当前的GNoME依然在预测与实际合成结果之间存在一定差距,A-Lab也只能合成粉末形式的无机材料。研究者们希望,未来可以利用更多的实验数据进一步提高GNoME算法的准则性和可靠性,同时扩展 A-Lab的微观结构和器件性能等硬件设备,令其最终成为一个真正的“完全自主型”新材料发现与合成实验室。

或许材料研发的新范式已经出现,将人类的双手从实验台前解放出来。“AI 科研助手+操作机器人+智能实验环境+可信多方协作”的高效迭代将令材料研发速度提升成百上千倍,还能防止年轻人的科研兴趣不被枯燥重复的实验所消磨,让他们能将更多精力投入到对科学问题的思考中。

本文(含图片)为合作媒体授权创业邦转载,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。