AI蛋白设计,生物技术的全新变革

01-23 10:13

一、行业定义


AI 蛋白质设计是指结合蛋白质序列、结构和功能数据,通过人工智能技术(如深度学习、生成模型和强化学习)对蛋白质进行预测、设计和优化。


为了实现特定的功能或提高天然蛋白质的性能,蛋白质设计旨在从零开始设计或提高蛋白质的序列。传统的计算蛋白质设计一般采用能量函数和特定的搜索优化算法来获取设计序列。近几年来,随着先进算法的发展,大数据的积累和计算机硬件计算能力的提高,人工智能技术在蛋白质设计领域得到了广泛的应用。


AI 蛋白质设计的应用主要表现在结构预测、功能优化、相互作用预测和高效选择等方面。通过深度学习模型,蛋白质的三维结构可以根据氨基酸序列准确预测,为理解其功能提供了重要依据。另外,AI 还能提高蛋白质功能,设计具有特定功能的分子,如高效催化酶或抗体,极大地加速了药物研发和生物技术的应用。


AI 对蛋白质的预测 - 通过对大量数据的分析,蛋白质在相互作用上也表现突出,AI 可以识别隐藏的药物靶点,促进疾病机制的研究。结合高通量筛选技术,可以快速找到大量备选分子中最有潜力的蛋白质,降低实验验证的成本和时间。


此外,人工智能的自我迭代能力可以实时提高设计过程,提高设计精度和效率。通过这些技术,蛋白质工程的发展得到了很大的推动,特别是在药物发现、工业生物催化和生物制药开发等领域。


AI 蛋白质设计的上下游可以从数据采集、模型训练、设计生成、实验验证等方面进行细分。整个过程涉及很多环节,每一个环节都依赖于高效的人工智能技术与传统生物知识的紧密结合。


上游阶段,首先是收集和处理数据。这个阶段的核心任务是 AI 该模型提供了足够丰富和高质量的输入数据。这一信息主要来自已知的蛋白质数据库(例如 PDB 和 UniProt),包含大量的蛋白质序列、结构和功能信息。另外,高通量测试数据、基因组学数据、临床数据等也是如此。 AI 提供支持。数据处理过程包括清洁、除噪和结构化,以确保数据能够在后期步骤中发挥最大的作用。


进入中游阶段,AI 这些信息的主要工作是建模和训练。该过程通常依赖于深度学习和其它机器学习技术,利用算法对蛋白质的三维结构、功能及其它关键特性进行预测。这时,AI 该模型可根据蛋白质的氨基酸序列预测其空间折叠结构,也可通过其它生物信息工具预测蛋白质与目标分子的相互作用。通过这种方法,不仅可以提高蛋白质设计的效率,还可以为预测蛋白质功能、提高当前蛋白质性能提供准确的指导。


下游阶段,AI 设计或优化的蛋白质将进入实验验证过程。虽然 AI 蛋白质的特性是可以模拟和预测的,但是最终是否具有预期的生物活性、稳定性或其它功能,仍然需要通过实验来验证。这个阶段通常包括蛋白质的合成、表达和功能验证,例如通过高通量筛选试验、酶活性试验、亲和力试验等方式来确定设计的有效性。假如试验结论没有达到预期,AI 通过反馈学习,模型需要优化,然后迭代生成新的蛋白质设计方案。


这些三个阶段都在 AI 在蛋白设计过程中,形成了循环信息反馈。上游数据采集与处理为中游模型训练提供了基础,而中游的设计与推广也为下游实验验证提供了初步的指导。下游试验反馈进一步优化了上游数据选择中游模型训练,形成闭环。这一循序渐进的过程促使 AI 在蛋白工程和药物发现领域,蛋白质设计具有很大的潜力。


尽管存在数据和运算实验验证的考验,但随着技术的发展,生命科学将进一步突破设计效率和应用范围,进入智能化新时代。


2019年,瑞兽分析整理了近几年相关公司的融资情况。 至 2021 年 AI 2021年,蛋白质设计领域融资事件快速增长, 年达到 36 高峰期,显示出投资热潮。2022 2024年后融资事件急剧下降, 年触底至 18 起。数据或说明 AI 作为一个新兴领域,蛋白质设计的融资趋势在经历了快速增长之后,也有可能进入选择整合阶段。


二、相关企业


途深智合


途深智合是一个新锐的家庭 AI 自主研发的蛋白质设计公司 ProteinEngine 该平台可在合成生物、生物医药等多个领域实现通用、快速的蛋白质设计和改造。目前已与国内外多家合成生物医药企业建立商业合作。


途深智合致力于为客户提供通用、轻巧、可控的蛋白质设计和生成方式 AI 加快生成领域蛋白质工程研发,降低合成生物和医药领域开发新产品的难度、周期和成本。可帮助下游合成生物、产品公司、生物制药公司实现定位突变、体外酶改造、酶从头设计、抗体结构设计、复合蛋白设计、全新序列设计、结构设计等任务,共同开发或合作产品。


最近,途深智合宣布完成天使。 轮融资,包括锡创投和上海艾特海浦在内的投资者。2024 年 3 月,它完成了由诚美资产投资的数百万人民币天使轮融资,这一轮所得资金将用于进一步加强。 AI 研究开发蛋白平台。


分子之心


成立于北京分子之心科技有限公司 2022 年 1 月亮,它自主研发 AI “大分子优化设计平台” MoleculeOS “,利用数据驱动的深度学习方法,帮助生物技术专家识别和生产蛋白质,从而将实验室的研究成果大规模投射到工业应用中。该平台不仅可以用于多肽、抗体、酶和小蛋白的研究和设计,还可以将大分子创新药物的研发转化为可预测和可编程,从而提高药物研发全过程的效率。也可用于化学、材料、工业、农业等领域的蛋白质优化和设计。


在核心技术产品层面,分子之心开发了一个一站式 AI 蛋白预测,优化和设计工具—— MoleculeOS 该平台采用先进的机器学习和深度学习算法,可以通过精确的计算和建模,帮助研究人员快速发现和改造蛋白质,大大提高实验室研究的转化效率。另外,分子之心自主研发 AI 大模型产生蛋白质 NewOrigin 在模型、综合序列、结构、功能、进化等诸多领域,具有特定功能的蛋白质可以在几个小时内甚至几分钟内定制,大大降低了实验室的选择和验证成本,提高了蛋白质优化设计的整体效率。在人才方面,分子之心包括一批来自人才。 MIT、耶鲁、加州理工、清华、北大等顶尖大学及药明、诺维信、Meta、亚马逊,百度,阿里,字节,Discovery Studio 等待头部公司的人才。


2024 年 9 月亮消息,分子之心宣布完成。 A 几亿人民币融资由谢诺投资和深圳风险投资联合领导,国香资本和九一投资。本轮融资将主要用于人才团队拓展、技术平台完善和推广。 AI 工业化的蛋白质技术。


百奥几何


北京百奥几何生物科技有限公司是一家生成式公司 AI 驱动的蛋白质设计R&D平台企业通过创建生成型人工智能(AIGC)大模型理解生命语言,构建自然语言和蛋白质语言多模型大模型,重构蛋白质药物发现和设计过程,构建可编程的蛋白质,应用于生物医学和生物制造。


在团队方面,其核心团队是生成式 AI 早在分子生成领域,开拓者 2021 在分子的三维结构中,每年都会产生扩散模型。 ,分子三维结构生成团队最早使用扩散生成模型,其中关键论文 GeoDiff 是 2022 年 AI 领域引用量排名第一 50 其中一篇论文。


以自研生成式为基础 AI 大型模型,百奥几何开发 GeoBiologics 目前,一站式蛋白质设计平台已与国内外多家药企达成授权合作。此外,百奥几何还与多家上下游企业达成战略合作,共同推动生成型人工智能在生物制造领域的落地,包括与阿里巴巴云一起创造人工智能生物制造智能解决方案,与三优生物、百君生物一起创造抗体设计生成 AI 与祥耀生物、引加生物等促进蛋白质、抗体药物产品共同开发的大型模型。


2024 年 6 月亮,百奥几何完成 Pre-A 轮融资,本轮融资由门创投领先,智谱。 AI、盛景嘉成跟随投资,老股东高榕创投继续追加投资。融资主要用于加速生成 AI 大型模型落地于生物制造领域,促进了自有产品的发展。


热点信息三


2024 年 10 月亮,诺贝尔化学奖又一次花落人工智能!AlphaGo 鼻祖等三人获奖


北京时间 10 月 9 日下午,2024 年度诺贝尔化学奖正式公布。瑞典皇家科学院决定 2024 每年一半的诺贝尔化学奖授予 David Baker,为了表彰其对蛋白质设计的贡献,另一半共同授予蛋白质设计 Demis Hassabis 和 John M. Jumper,对蛋白质结构预测的贡献给予表彰。2024 年度诺贝尔化学奖金为 1100 万瑞典克朗,约合 750 万人民币。


2024 年 9 月,DeepMind 推出首个 AI 蛋白设计模型,亲和力提高 300 倍


Google DeepMind 宣布推出 AlphaProteo,第一款专门为新型高韧性蛋白粘结剂设计的 AI 模型。值得注意的是,AlphaProteo 变成 DeepMind 第一个经湿试验验证的 AI 蛋白模型。经湿度试验验证,AlphaProteo 能为多种靶蛋白形成新的蛋白粘结剂,包括与癌症和糖尿病并发症有关的蛋白粘结剂。 VEGF-A。这是 AI 第一次工具可以顺利进行 VEGF-A 蛋白质粘结剂的设计。


2024 年 5 月,谷歌 AlphaFold 3 首发 Nature:对所有生命分子结构和相互作用的成功预测


新一代 AlphaFold ——由 Google DeepMind 和 Isomorphic Labs 革命性人工智能研究团队推出的(AI)模型 AlphaFold 3 ——登上权威科学期刊 Nature。据介绍,AlphaFold 3 对所有生命分子(蛋白质)进行了前所未有的准确预测,DNA、RNA、结构和相互作用等)。


相对于现有的预测方法,AlphaFold 3 发现蛋白质与其它分子类型的相互作用至少有所改善 对某些重要的相互作用类别,50%的预测准确率甚至翻了一番。


2024 年 4 月亮,世界上第一个全部由 AI 设计的 CRISPR 基因编辑器已经成功编辑人类。 DNA,且免费开源


2024 年 4 月 22 日,AI 企业蛋白设计 Profluent 宣布推出 OpenCRISPRTM 该计划发布了世界上第一个开源人工智能生成基因编辑器。— OpenCRISPR-1。


就像基于大语言模型一样。 ChatGPT 大语言模型也可以产生全新的蛋白质,就像一篇新文章一样。而如今,Profluent 展示了人工智能从零开始设计基因编辑器,并对人类基因组进行了第一次成功的精确编辑。值得注意的是,OpenCRISPR-1 它是开源的,不但可以免费用于科学研究,而且可以免费用于商业行为。


2023 年 4 月,AI 新的蛋白质设计方法登 Science,利用强化学习,根据预期直接优化结构


RoseTTAFold 采用强化学习、自上而下设计蛋白质复合物结构的团队原创方法,登上最新一期。 Science。利用这种方法,团队设计了数百种蛋白质结构。电子显微镜等观察证实,这些结构大多可以在实验室生成。此外,预计精确的原子级设计实现了纳米结构与实际纳米结构之间的平均偏差低于单个原子直径。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com