秒杀AlphaFold!Science:用AI一秒设计自然界全新蛋白质

6c6fac5a1357b79d9c3b3b8b0c22737c.png

论文地址:https://www.science.org/doi/10.1126/science.add2187

也许你会问:创造出自然界中没有的蛋白质,对我们有什么意义/p>

意义可太大了。通过这些蛋白质,也许我们会开发出更多疫苗,加快治疗癌症的研究,研发出碳捕获工具,和全新的可持续生物材料。

dc0810cec96c4fa9090f0821f72dc020.png

在这两篇新论文中,华盛顿大学医学院的生物学家表示,机器学习可用于比以前更准确、更快速地创建蛋白质分子。

David Baker是华盛顿大学医学院生物化学教授、2021年生命科学突破奖获得者。

据他介绍:「蛋白质是整个生物学的基础,但是要知道,现在我们在每种植物、动物和微生物中发现的所有蛋白质,都还不到所有可能的蛋白质的百分之一。有了这些新的软件工具,研究人员也许就能够找到长期的解决方案,去攻克医学、能源和技术上的难题。」

在自然界中,蛋白质被称为「生命的基石」,因为它们在所有生物的结构中都是必不可少的。在一个细胞生长、分裂、修复的每一个过程中,几乎都有蛋白质的参与。

可以说,蛋白质基本解决了生命的所有问题,生物学中的一切都发生在蛋白质上。

Baker介绍说:「为了解决生物体在进化过程中面临的问题,它们在进化中不断演变。人类今天在面临着新的问题,比如新冠病毒。如果我们能设计出一种新的蛋白质,让它像在进化过程中演变出的蛋白质一样,解决种种问题,那它的力量将是非常强大的。」

88343626a06689bcdfd558e2bf51dde5.png

使用ProteinMPNN设计的蛋白质的细节

要知道,按照一般的传统,研究人员设计蛋白质时,是通过调整自然界中已知的蛋白质。但是ProteinMPNN的出现,可以让研究人员从头设计所有可能的蛋白质,这就打开了一个新世界。

ProteinMPNN帮助研究人员解决了逆向的问题——如果他们心中已经有了一个确切的蛋白质结构,它就能帮助他们找到能折叠成这个形状的氨基酸序列。ProteinMPNN使用的的是一个在很多折叠成三维结构的氨基酸序列中训练出来的神经网络。

cf2467ab43a1ea11a374677eccf5999c.png

论文地址:https://www.science.org/doi/10.1126/science.abn2100

第一种被称为「幻想」(hallucination),类似于DALL-E或其他基于简单提示产生输出的生成AI工具。

通过「幻想」,用户可以在所有可能的蛋白质序列中进行随机搜索,并倾向于具有特定功能的序列。它使探索所有可能的蛋白质结构空间成为可能,这要归功于机器学习对庞大数据集的处理能力。

Baker对此解释道:「自然界中的蛋白质,只是采样很小的一部分,因此,如果你把搜索限制在自然界已经存在的那些序列上,你就不会有任何收获。」

f74b69c178dd052a63aa7047c0461706.png

ProteinMPNN架构

ProteinMPNN不仅速度快,它的结果还优于以前的工具,并且不需要专家定制就可以运行。

「 如果你有大量数据,神经网络是很容易训练的,但是对于蛋白质,我们并没有那么多例子。我们必须深入其中,确定这些分子中哪些特征是最重要的。你需要反复试错。」蛋白质设计研究所的博后研究员Justas Dauparas说。

96b17b7408e1b9842f9c919e92fbd849.png

「我们发现,使用ProteinMPNN制造的蛋白质更有可能按预期折叠,我们可以使用这些方法制造非常复杂的蛋白质组装体。」蛋白质设计研究所的博后研究员Basile Wicky说。

意义重大

利用这些新方法,研究人员创造出了一种在自然界中没有见过的全新蛋白质,比如一个巨大的纳米环。

Baker的团队正在试验,看这些环状结构是否可以用作定制纳米机械的部件。在电子显微镜下,这些环的直径大约比罂粟种子小十亿倍。或许在未来,这些纳米机器可以被用来疏通动脉。

使用机器学习来设计蛋白质,会让整个过程更快、更容易,并且让研究人员在更大的范围内创造出全新的蛋白质结构。这些软件比以前最好的工具还要快上200多倍,并且只需要最小的用户输入,这将大大降低蛋白质设计的门槛。

ffa53c5d82655602ba9b1bf4b6f6dd44.png

ProteinMPNN的计算评估

现在,ProteinMPNN可以在GitHub上免费使用了,研究人员可以用它创作出无限的新设计。

最后,Baker说:「现在,最有挑战性的地方在于……你要设计什么

作者介绍

David Baker博士是华盛顿大学基因组科学、生物工程、化学工程、计算机科学和物理学的副教授。他的研究小组专注于大分子结构和功能的设计。

同时,Baker博士还在担任蛋白质设计研究所的主任、Howard Hughes医学研究所研究员。他也是美国国家科学院和美国艺术与科学学院的成员。

6c8b6abed04e077baba0428015217dea.png

参考资料:

https://www.technologyreview.com/2022/09/15/1059550/an-ai-that-can-design-new-proteins-could-help-unlock-new-cures-and-materials/

https://newsroom.uw.edu/news/beyond-alphafold-ai-excels-creating-new-proteins

https://www.science.org/doi/10.1126/science.add2187

outside_default.png

点个在看 paper不断!

文章知识点与官方知识档案匹配,可进一步学习相关知识算法技能树首页概览34253 人正在系统学习中

来源:视学算法

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年8月13日
下一篇 2022年8月13日

相关推荐