下棋后哭柯洁的DeepMind,这次要让生物地震?
原创 世超 差评
最近,世超再次被发现 AI 新闻被刷屏了,最初开发出来的。 AlphaGo ,谷歌DeepMind下棋哭柯洁。 企业,在 Nature 上面公布了最新一代 AlphaFold 3 模型。
AlphaFold ,这个名字听起来有点像折叠手机型号,是他家专门预测蛋白质结构的新名字。 AI 。
可以预测生物体内绝大多数的分子结构。这意味着从那以后,生物医学研究真的开始了。 · 从第三个角度来看,任何生物分子的作用机制都会从黑盒中打开,变成透视。
许多媒体和网民开始欢呼, 21 这个世纪,真正成为生物的世纪。。
了解这次新发布的内容 AlphaFold 3 我们首先要知道有多牛, DeepMind 和它的 AlphaFold ,曾经给分子生物圈带来了多大的震撼。
在九年义务教育中,我们都学会了生物中最常见的物质是蛋白质。要了解生物分子的底层原理,我们必须知道每种蛋白质是什么样子的。
这么说吧,现在 AlphaFold 在此之前,大家对蛋白质结构的预测主要有两种方法,
一是用 X 光照蛋白质晶体,即先拍片子再分析片子,再了解其长什么样。第二,磁共振 ( NMR ) 光谱,拍摄大致的形状轮廓,然后推断其结构。
这些传统方法不仅慢,而且适用范围小,需要不断的试错和费用。每次拍一部电影,都要花几万块钱,抵得上一辆小米。 su7 。
这就是为什么生物学家对蛋白质的研究需要很多经验。。。只有有经验的老师傅,蛋白质神仙,才能更快地猜出蛋白质的精确形状,少拍电影。
所以人们想知道,这种需要经验总结的工作是否可以依赖。 AI 解决呢?DeepMind 来做这件事吧,为了克服传统的拍摄问题,第一代 AlphaFold 在选择技术路线时,摊牌:
不拍片子!
由于蛋白质由氨基酸组成,初代蛋白质 AlphaFold 使用这些蛋白质中每一对氨基酸之间的距离,链接视角,将这些蛋白质中每一对氨基酸的距离,汇总成一张图片, AI 用神经网络消化它们,然后让它们消化。 AI 做出自己的预测。
而 2018 年第一代 AlphaFold 一经发布,就技惊四人,力压一群实验室老师傅,获得第一名。 13 预测蛋白结构的比赛 ( CASP ) 冠军。
AI ,很神奇吧。
不过,初代 AlphaFold 有一个问题,它更依赖于局部数据的特性来训练,它不能提取远元素之间的关系。就像一个只会写短文却学不会写经典小说的作家。
问题是,很多蛋白质分子都有长期的依赖性,这使得第一代 AlphaFold 实力有些捉襟见肘。
好在 2020 年发布的 22222Alpha.0 ,用上后来在 ChatGPT 上大火的 Transformer 模型。
Transformer 模型注意机制,则完美地解决了远距离氨基酸的问题,进步有多大?
2018 年度蛋白结构预测比赛 1.0 这个版本的准确度没有达到 60 分,可是 2020 年比赛里 2.0 这个版本得到了惊人的 92.4 分,它所能产生的范围已经包含了人类已知的蛋白质。 98% ,更为重要的是它完全开源。
可以说, 2.0 该版本已基本解决了单链蛋白质的预测问题, 2021 年,基于 2.0 改版的 AlphaFold-Multimer 发布,还支持多链,在准确性上也取得了突破,预测蛋白质间功效的准确性超过 70% 。
因此,如今许多企业也使用了它们,甚至帮助了国外一些新冠肺炎疫苗的研发。
但在 DeepMind 看起来,蛋白质结构预测的胜利,还远远没有完成。 AI 因为生物体内的复杂分子结构不仅包括蛋白质,还包括核酸、小分子配体等,
就像你花了十年时间学习如何解锁钥匙一样。结果你一开始发现大家都用指纹锁密码锁,用传统钥匙的人太少了!
所以这次 AlphaFold 3 ,它们更新了一个更好的全面模型,不仅可以预测蛋白质 DNA RNA 等待各种小分子,也可以揭示他们之间的相互作用。
那么,这是怎么做到的呢?回答是,他们已经使用了。 Diffusion 。
是的,是著名的扩散模式,在这里 AI 画火的时候,相信大家都听说过。其原理是不断地对原始图像进行编码,然后让原始图像进行编码。 AI 学着预测这些马赛克的形成过程,然后反过来实现从马赛克到图像的形成。
不过,如同 AI 画画生成不好的手指, Sora 椅子视频会穿模一样, Diffusion 加持下的 AlphaFold 3 还可以预测错误,尤其是在一些看起来相似难以区分的结构上,比如你在高中有机化学中学到的手性分子。
所以在这些容易出错的地方, DeepMind 使用了一种叫做交叉蒸馏的操作,说到底就是让有的有。 Transform 模型 2 先预测版本,然后将预测数据添加到版本中。 AlphaFold 3 在训练中,也就是相当于让步。 2 代表老师,带着 3 代表别人做,这样可以减少预测失误。
效果有多好?直接看官方图吧?
AlphaFold 3 对 7BBV - 酶 ( 它存在于一种土壤真菌体内 ) 酶蛋白是一种预测( 蓝色 )、离子( 黄色圆球 )和单糖( 黄色 )与真实构造( 灰色 )几乎重叠
AlphaFold 3 对于感冒病毒刺突蛋白( 蓝色 )与抗体( 绿松石色 )和单糖( 黄色 )相互作用时的结构预测,与真实结构精确匹配( 灰色的)
AlphaFold 3 预测蛋白质复合物,其中蛋白质( 蓝色 )与 DNA ( 粉色 )结合实验测定的预测模型和真实分子结构。( 灰色 )几乎完美的匹配
精度除了生成质量相当哇塞外,还遥遥领先于原子级。蛋白质和核酸配体的模拟比其他产品更好,抗原抗体的模拟也更好。
而操作 33AlphaFold 那就更容易了。使用 ChatGPT ,我们还是要想办法提出一个好问题,写完提示词,但是在 AlphaFold 3 ,您只需输入一些分子目录,它就可以计算出它们是如何组合在一起的。
想象一下生物大分子模型,它原本需要花费大量的时间、精力和金钱才能看到。现在只需要在网站上输入参数,然后点击,十分钟后就可以产生高清晰度和精度的生物大分子模型。
甚至细胞系统内部的生化过程、现象、 DNA 如何发挥作用,如何进行药物和激素反应,也都可以在很短的时间内被整理出来。
这些遥遥领先的数据和大家的热情似乎都在说:这次发布不再是跳跃性的提升,而是革命性的突破,整个传统的生物医学研究方法似乎都在改变。
但是世超认为,乐观是好的,但是科学这个东西除了乐观之外,还需要中肯和严谨。
各行各业的媒体和网民都在 “ 爆裂 ” “ 颠覆 ” “ 改变命运 ” 当时圈子里有很多对的大佬,也发表了一些对的。 AlphaFold 3 的评价。
比如颜宁教授的团队发现, 3.0 这个版本在一次糖蛋白预测中翻了个底朝天,表现甚至不如上一代。
还有很多科学家吐槽 3.0 相比 2.0 还没有开源,使用次数也有限。
甚至,也有人质疑 DeepMind 的老板 Hassabis ,他自己也创立了一个家庭 “ 专注于人工智能药品企业 ” ,号称要 “ 利用人工智能对药物进行重新定义 ” ,但从 2021 今天,他们还没有推出任何药物。
当然,这有点尴尬。毕竟在药物研发过程中,蛋白质结构问题只是其中的一小部分,并不能对药物研发的进度产生决定性的影响。。。
总而言之,世超感觉 AlphaFold 三代商品确实令人欣慰,但在漫长的生命科学实践中,它仍然有许多问题需要突破。但归根结底,进步总是好事。我希望 DeepMind 可以再好一点,做快一点。
发文:纳西 编辑:江江 & 面线 封面:焕妍
图片,资料来源:
nature:Accurate structure prediction of biomolecular interactions with AlphaFold 3
Google:AlphaFold 3 predicts the structure and interactions of all of life’s molecules
Google:Build AI responsibly to benefit humanity
Google:AlphaFold Server
exxact: AlphaFold Update Drastically Improves Accuracy in Docking, Nucleic Acids, & PTMS
微博 :@个人主页nyouyou
知乎:谷歌 DeepMind 推出新一代药物研发 AI 模型 AlphaFold 三是有什么重要意义?
zaker: 刚刚,AlphaFold 3 登上 Nature:所有的生命分子结构和相互作用, AI 预测了

本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




