妙啊！用扩散模型生成蛋白质结构，结果不输天然蛋白质｜来自斯坦福&微软

2 years ago

source link: https://www.qbitai.com/2022/10/38337.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

妙啊！用扩散模型生成蛋白质结构，结果不输天然蛋白质｜来自斯坦福&微软

丰色 2022-10-05 12:10:09 来源：量子位

网友：未来5年用文本提示生成新抗体/新酶也不是梦吧

丰色发自凹非寺

量子位 | 公众号 QbitAI

没想到，图像生成领域的大明星——

扩散模型，这么快就被用来做蛋白质结构生成了！

99a2ec55ef7d43f28b4728c65192aa29~tplv-tt-shrink:640:0.image

而且结果在复杂度和结构上都和天然蛋白质有的一拼。

030833da20bc4816acac74de7310edd9~tplv-tt-shrink:640:0.image

消息一出，不少人都称赞这个组合简直非常妙。

eab888697a854aa9b7ed92eb5397a241~tplv-tt-shrink:640:0.image

还有人表示：我早就猜到了，生成模型能做的真的不仅是图像和视频。

55dfb611ee8342969193118b7f629ffd~tplv-tt-shrink:640:0.image

所以，AlphaFold这是可能有新的挑战者了？

3b77aa81edd84f889911613d33c16346~tplv-tt-shrink:640:0.image

具体是怎么回事？

来看看斯坦福大学和微软的这项最新研究成果到底怎么说。

228895b6d53a4a1e8ab076e0fa775dbe~tplv-tt-shrink:640:0.image

扩散模型vs蛋白质结构生成

说起研究的初衷，作者表示：

尽管蛋白质结构预测已经取得了非常好的成绩，但要从神经网络中直接生成多结构多样又新颖的蛋白质结构仍然很困难。

他们想到用基于扩散的生成模型来挑战这一任务，并通过镜像蛋白质自然折叠过程来设计蛋白质主链结构。

具体来说，就是将蛋白质主链结构看成一系列连续的角度，这些角度会捕捉组成氨基酸残基的相对方向。

进而通过从随机、未折叠状态到稳定折叠结构的去噪就可以生成新结构。

作者表示，这一设计不仅可以反映蛋白质如何在生物学上扭曲成能量上有利的结构（how proteins biologically twist into energetically favorable conformations），这种表示的固有位移和旋转不变性也可以极大地减轻模型对复杂等变网络的需要。

524af5adabe04408a4557f4991879a7a~tplv-tt-shrink:640:0.image

在实现上，作者仅用一个简单的transformer作为backbone就训练出了一个去噪扩散概率模型。

最终证明它可以无条件地生成高度真实的蛋白质结构，其复杂性和结构模式类似于天然蛋白质的结构模式。

如下图Ramachandran plot（拉氏图，专门用于检测蛋白质构象是否合理）所示，左右分别为测试集和生成的蛋白质主干的（φ，ψ）二面角。

可以看到，三个主要结构元素、以及一些不太常见的角度组合都在他们用扩散模型生成的主干中得到了呈现。

3b323793311e47a6ae383405ed36a086~tplv-tt-shrink:640:0.image

目前，基于以上成果，作者已公开发布了首个用于蛋白质结构扩散的开源代码库和训练模型，详情可戳文末链接。

不过，作为一个初步探索，他们也指明这项成果还存在几个局限性，比如：

1、与通常有几百个残基的天然蛋白质相比，模型生成的结构仍然相对较短（最多128个残基）；

2、由于没有处理多链复合物或配体相互作用，模型无法捕获蛋白质的动态性质，只能生成静态结构；

3、将蛋白质表述为一系列角度的框架设计会造成一些累积误差，最终显著改变生成的整体结构。

最后一个问题则可以对未来工作提供思路，比如试着用几何信息架构中使用的方法来解决相关问题。

最后，除了再次刷新我们对扩散模型的认知，一位毕业于ETH的研究人员看完这项成果后还大胆预测道：

未来5年内，可能渐渐没有人会对全新的蛋白质序列或折叠感到兴奋了。

因为潜在的新酶和治疗性抗体将通过文本提示生成。

0b8c4e9d9d1e43a8bb6a5ccaba57130a~tplv-tt-shrink:640:0.image

对于这项成果，你有什么想说的？

论文地址：
https://arxiv.org/abs/2209.15611

代码：
https://github.com/microsoft/foldingdiff

Recommend

新浪科技 tech.sina.com.cn 5 years ago
Cache

“AWSL”成B站2019年度弹幕 "妙啊"入选十大弹幕热词

新浪科技讯12月4日午间消息，哔哩哔哩（以下简称“B站”）发布2019年年度弹幕——“AWSL”，这也是B站第三年进行年度弹幕盘点。此外，“泪目”、“名场面”、“妙啊”、“逮虾户”、“欢迎回家”等弹幕也入选今年十大弹幕热词。B站透露，随着用

www.cnblogs.com 2 years ago
Cache

妙啊！动画还可以这样控制？

今天，有在群里看到这样一个问题：有一个动画，一开始静止处于第一帧，只在用户 hover 的时候运行动画，在运行一次后停止，并且停留在最后一帧，使用 CSS 可以完成么？像是这样：

www.ifanr.com 2 years ago
Cache

妙啊！Aqara 才是最懂我的智能家居

家不能是千篇一律的沉闷，置身其中的智能家居更不应该只有一种答案。如今的智能家居已经足够「精智」，但往往忽略个性化表达。但智能家居品牌 Aqara 想把个性做到极致，于是，首创了一块「能变换主题和布局的全面屏开关」。

www.51cto.com 2 years ago
Cache

最近大火的Diffusion Model，首篇扩散生成模型综述！

最近大火的Diffusion Model，首篇扩散生成模型综述！作者：杨灵 2022-09-13 15:40:56 本文首次对现有的扩散生成模型（diffusion model）进行了全面的总结分析。

www.51cto.com 2 years ago
Cache

斯坦福/谷歌大脑：两次蒸馏，引导扩散模型采样提速256倍！

斯坦福/谷歌大脑：两次蒸馏，引导扩散模型采样提速256倍！作者：新智元 2022-10-20 15:38:02 斯坦福、谷歌大脑新作：无需分类器，两步蒸馏，将扩散模型采样速度提升256倍。

www.51cto.com 2 years ago
Cache

CoRL 2022优秀论文；语言模型生成自然界没有的蛋白质

CoRL 2022优秀论文；语言模型生成自然界没有的蛋白质作者：机器之心 2022-12-25 13:36:47 本周论文包括 FAIR 公布的最新研究，发现 ESM2 语言模型通过学习深层语法，就能生成天然蛋白质以外的新蛋白质，并可以编...

www.51cto.com 2 years ago
Cache

无限的可能性 NVIDIA生成式AI模型加速合成蛋白质

无限的可能性 NVIDIA生成式AI模型加速合成蛋白质作者：李祥敬 2023-01-13 21:13:31 人工智能近日，初创企业Evozyne使用NVIDIA提供的预训练A...

www.51cto.com 2 years ago
Cache

开挖扩散模型小动作，生成图像几乎原版复制训练数据，隐私要暴露了

开挖扩散模型小动作，生成图像几乎原版复制训练数据，隐私要暴露了作者：机器之心 2023-02-13 10:26:27 该研究表明，扩散模型能从其训练数据中记忆图像，并在生成图像中复现。

www.51cto.com 2 years ago
Cache

初探AI拼图模型预测蛋白质复合物结构

初探AI拼图模型预测蛋白质复合物结构作者：机器之心 2023-03-03 14:00:00 基于 HMR 的分子对接模型比当前深度学习 SOTA有更高的准确性，并且较传统分子对接方法提速 100 倍以上。相关论文已被收录于 ICLR 2023。

www.51cto.com 2 years ago
Cache

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS

图像生成终结扩散模型，OpenAI「一致性模型」加冕！GAN的速度一步生图，高达18FPS 作者：新智元 2023-04-13 15:55:00 OpenAI重磅研究「一致性模型」项目开源，不仅一步瞬时生图，还能图像编辑，连最能打的扩散模型...

妙啊！用扩散模型生成蛋白质结构，结果不输天然蛋白质｜来自斯坦福&微软

妙啊！用扩散模型生成蛋白质结构，结果不输天然蛋白质｜来自斯坦福&微软

扩散模型vs蛋白质结构生成

Recommend

About Joyk