另外一张百亿牌桌要翻?

2024-05-09

原创 陈广晶 虎嗅APP


出品 | 虎嗅医疗组


作者 | 陈广晶


编辑 | 王一鹏


头图 | 视觉中国


大模型再次攻击科学界的降维?


法国科学家埃马纽埃尔·卡彭蒂·2011年(Emmanuelle Charpentier)詹妮弗·杜德纳·美国科学家(Jennifer Doudna)首次合成CRISPR/Cas9(核酸酶蛋白与RNA的结合),并证明细菌确实可以用它来切断病毒DNA,以反击入侵。


但是,杜德纳团队并没有第一时间证明这个工具可以用于动物甚至人类,而是被中国科学家张锋截了胡。


CRISPR美国麻省理工学院-哈佛博德研究所的张锋团队在发表Cas9相关论文后,首次对动物进行实验。2013年,他们成功地验证了CRISPR/Cas9,在RNA的指导下,他们能够准确地将内源基因组分切割到人类和小鼠细胞中,并获得相应的专利。


2022年,张锋及其所在机构获得了CRISPR/Cas9用于所有真核生物的专利,包括动植物、人类等。换句话说,所有相关的商业应用都必须得到授权。因此,张锋仅凭专利授权就获得了巨大的收入。他创办了八家创业公司。换句话说,从2016年开始,几乎每年都会有一家以他的名义新的生物技术公司。在这些情况下,每年都有“躺”赚上亿美元的潜力。


这个故事本来应该停留在“专利战”的故事范围内,但是4月23日,一个意想不到的变量卷了进来:AI技术公司Profluent发布了世界上第一个AI模型设计基因编辑器OpenCRISPR-1,并且开源,在符合伦理条件的情况下,无论是科学研究还是商业行为都可以免费使用。更重要的是,大型模型已经扩展了4.8倍的Cas蛋白质空间,可以作为基因编辑器存在于自然中。OpenCRISPR-一是以这种蛋白质生成基因编辑器的代表,具有很高的功能性和特异性。


根据AI生成基因编辑器发布的Profluent公告,这次他们还同时推出了OpenCRISPRTM计划,希望通过鼓励更多人使用和检测OpenCRISPR-1系统,不断迭代和推进相关计划。


在张锋和杜德纳专利战的背后,还有一个数百亿的其他市场。Profluent 这次公司的发布是一封“战书”,不仅给了张锋队和杜德纳队,也给了所有正在努力开发基因编辑器的科学家。


开源基因编辑器OpenCRISPR-1的框架图是世界上第一个人工智能建立的。来自:Profluent公司网站


最强挑战者来了


「工欲善其事,工欲善其事」,有些跑道如果没有出现可用的工具,根本就不存在,基因编辑就是其中之一。


简单地说,基因编辑就是通过删除、插入或替换某个基因序列来促进基因组的特定变化。


比如:改变大米白叶枯病感病基因的启动子,提高大米的抗病能力;比如人为敲掉老鼠的特定基因,使其含有某种疾病,从而初步验证药物的安全性和有效性;比如修改错误基因,治疗罕见病。


可以说,在碳基生命领域,基因编辑也是一项令人震惊的技术成果,不仅创造了许多诺贝尔奖获得者,开拓了数百亿美元的市场,也为解码碳基生命提供了钥匙。


而且这种技术可以在近十年来如此迅速地实现和发展,简单的基因编辑器,即CRISPR/Cas系统的成功开发是不可或缺的。


基因编辑器的发现也经历了一个相对曲折的过程。早在1987年,一些研究人员就发现了CRISPR,但直到2009年,CRISPR能够准确切割DNA的事实才逐渐变得清晰。


目前,主流基因编辑器CRISPR/Cas系统是一个由单个Cas蛋白(CRISPR相关蛋白,是核酸酶)人工改造而成的生物功能系统,主要包括Cas蛋白结构域和指导RNA-Cas蛋白相当于“剪刀”对DNA的切割目标负责,指导RNA是负责精确定位的“导航”。


CRISPRCas9包括Cas9蛋白质(核酸酶)和RNA。来源:Nature


与前两代基因编辑器(ZFNs)相比TALENs),CRISPR/Cas系统构建更简单、更经济、更高效,不仅广泛应用于农业,而且在疾病治疗等领域也迅速推广。


然而,仍有业内人士认为,基因编辑领域的快速发展确实需要大量的备份工具。在实际应用中,主流CRISPR/Cas系统只能敲掉基因片段,不能给后来者增加基因片段等缺点。


根据Statista的数据,截至2019年2月,仅美国就有5336项CRISPR专利申请。


而且在众多挑战者中,大模型可以算是来势最强的。


根据Profluent团队在预印本网站上发布的论文,人工智能可以绕过进化限制,生成具有最佳属性的编辑器。该团队生成了400万个蛋白质序列,其中一部分是由模型直接生成的,另一部分是由天然蛋白质“改造”的。


这种蛋白质不同于天然蛋白质——与任何天然蛋白质相比,它们都有数百个突变。尽管只有27.6%通过了选择,但Cas蛋白质家族的规模仍然得到有效扩大:整体扩大了4.8倍,其中cas13家族的天然蛋白质较少,扩大了8.4倍。此外,上述结果,仅在16个GPU上,需要3天时间才能得到。


对于张锋团队乃至世界上所有参与挑战的科学家团队来说,这种效率是压倒性的。但效率只是一个方面。从效果来看,大模型没有显著优势;从控制层面来说,大模型很难进入市场。


虽然卡彭蒂耶和杜德纳在专利竞赛中失利,但他们在2020年获得了诺贝尔化学奖,因为他们在基因编辑方面的奉献。来自:视觉中国


目前搅局者影响不大


《生物世界》主编王聪告诉虎嗅,首先,大型基因编辑器的生成效果很难比自然更好。“也就是所谓的垂下果实已经被采摘了”;其次,基因编辑器只是一个工具,后续监管的考验还是很大的。无论哪种情况,如果不能比现有产品更好更领先,监管机构都不太可能允许。


事实上,拥有核心专利的CRISPR/Cas9,张锋团队已成为最好的编辑器。”CRISPR基因编辑/Cas9的效率接近1000%。在接受《中国新闻周刊》采访时,美国国家科学院和工程院教授、哈佛医学院遗传学系教授乔治·丘奇指出。他曾经是张锋的博士后导师。


而且在十几年发展的基础上,基因治疗已经从体外编辑后将修改后的基因片段输入体内治疗(一般基因治疗是一种“替代”治疗),发展到第二代基因治疗疾病(基因编辑治疗)的直接编辑。


2023年底,全球已获准基因编辑治疗。——CRISPR Casgevy,一家治疗公司/福泰制药,是一种用于治疗罕见疾病的药物。与此同时,世界上还有十多种类似的产品。


这类产品的原理是利用病毒载体等输送系统将CRISPR/cas9“输送”到人体内,直接编辑错误的基因来治疗疾病。


这种对基因编辑器安全性的要求无疑更高,在一定程度上也提高了基因编辑器进入的门槛。CRISPR/cas系统问世10年后,其安全性得到了监管部门的认可。新编辑器需要多少年?王聪说:“即使是同一个编辑器,也需要重新进行临床试验来治疗不同的疾病。


这意味着即使一个大模型可以在一分钟内生成数百万个基因编辑器,其中确实有更好的。如果你想挑战现有的高效基因编辑器,还需要时间。


然而,AI对基因编辑器的开始仍然是一个值得关注的进展。作为生命科学领域的大模型,这一事件背后的行业趋势不容忽视。“这是一个开始。”王聪向虎嗅指出,“大模型 “生物技术”已成为热门赛道。


客观来说,CRISPR/Cas系统具有明显的优点,应用广泛,但仍有待改进。


比如:只能做减法,不能做加法;如果目标基因序列前面没有“”PAM“序列(可以理解为提醒基因“剪刀”可以暗语),不能切割;因为CRISPR/Cas系统来自古代细菌或细菌,它们与哺乳动物的DNA修复系统没有那么好的配合,很容易在人类细胞中脱靶;等等。


而且大模型学习速度非常快,再加上全球科学家、商业公司的加入,也确实有机会改变行业。


可以看出,当时张锋的团队很早就把CRISPR的专利完全公开了非商业用途,这也稳定了他们在科研领域的地位——全球科学界根据《不可思议的科学史》一书接受了张锋团队的制度,直到杜德纳团队长期宣布自己的专利。这也为他们在未来稳定市场的“霸主”地位奠定了基础。


如今,OpenCRISPR-1R&D人员“以自己的方式治愈自己”,开源更彻底,不仅免费开放科研,还免费开放商业行为。对更多好的基因编辑器的加速发现和迭代大有裨益。


蛋白质和编辑基因是通过可以快速迭代的大模型产生的,这种将硅基生命和碳基生命紧密联系起来的概率,激励了科学界、投资界和初创企业。


Davididid是美国华盛顿大学生物化学系教授 Baker,在4月23日,他开始了一家新的创业公司Xairairaira,这是蛋白质结构领域的大师。 Therapeutics,获得10亿美元的“种子轮”融资,Foresite capital、F-Prime(富达投资旗下)、红杉资本等都属于投资者。这种可能性是今年生物技术领域最高的融资。


这个企业就是要靠Davidid Baker团队推出了从零开始设计和生成抗体药物的大型模型。基因测序巨头Illumina和生物技术创业公司Interliner也被引入到新的团队中。 Therapeutics团队和技术涵盖了基因学和蛋白质组学。不仅要开发新的治疗方法,还要解锁生物学的奥秘,为未来更多新药的发现提供指导。


从这个角度来看,虽然目前大模型在蛋白质生成和基因编辑领域的价值有限,但AI全面进入医疗制药行业的趋势已经不可阻挡。


原题:“又一张百亿牌桌要翻?”


阅读原文


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com