赋予生命科学生态,「摩熵数科」打造AI成都“超级数据系统”
随着人工智能浪潮与生命科学的深度融合,数据已经成为推动产业变革的核心引擎。摩熵数科(成都)医药科技有限公司(以下简称“” 作为一家专注于生命科学领域的数据服务和AI解决方案提供商,摩熵数科正在探索DATA AI赋能生命科学新的商业化路径。

摩熵数科(成都)医药科技有限公司
据了解,「摩熵数科」目前已被四川省“专业化、特新化”的中小企业认可,十余款数据产品已在上海数据交易所上市。近日,36个氪星四川对话「摩熵数科」创始人王中健,探索了企业的技术突破、商业模式和行业布局。

「摩熵数科」王中健(中)创始人
从硅基到碳基,科研转型催生数据智能平台。
王中健的创业故事始于中国科学院上海微系统与信息技术研究所的研究经验。“我从微电子领域跨界到生命科学,不仅是典型的‘硅基到碳基’转型,也是AI时代‘硅基与碳基’的深度融合。“他回忆说,2014年至2015年参与国家药品审计改革信息支持系统相关项目时,接触到生命科学领域数据的具体应用,觉得该领域有很大的商业潜力,于2017年开始筹备公司。

就业务体系而言,「摩熵数科」把生命科学分成生物学。(Biology)、化学(Chemistry)、药学(Pharmacy)、医学(Medicine)四个模块,分子结构、药用价值等实体信息通过AI技术从海量公开和私域数据中获取,结合专业数据进行精细化处理和审批,构建生命科学智能数据集群-BCPM平台。

产品矩阵平台BCPM平台
BCPM平台覆盖数据库超过10万个,高质量结构化数据超过50亿个,形成摩熵生物、摩熵化学、摩熵药业、摩熵医学等200多个专业数据产品。平台注册客户已超过60万,包括5万个个人付费用户。 ,公司付费用户100000 ,为政治、生产、学习、研究、医疗、投资六大客户群体的决策者提供准确、全面、实时的数据支持。
“DATA和AI双向赋能”时代的应用和商业转换
数据技术(DT)和人工智能(AI)在过去的10年里,我们取得了许多技术突破,但仍有大量的创新企业没有找到“场景”。无论技术有多好,都必须实现具体的应用和持续的商业转型。在ChatGPT和DeepSeek代表的新一代人工智能浪潮的推动下,我们将进入‘DATA for AI’和‘AI for DATA“两翼融合的时代。”王中健描述道,“DATA for AI由于数据、算法、计算能力构成了人工智能的三大支柱,已经成为众所周知的概念。伴随着大语言模型(LLMs)“快速发展,”AI for DATA”还得到了显著的推动。这些大型模型显示出卓越的推理能力和智能体(Agents)生态系统,为高效、高质量的数据挖掘提供了坚实的后盾(AI自动抽取数据)。

另外,DeepSeek等模型的开源,促使「摩熵数科」能在技术上迅速与IQVIA合作。、Elsevier、科睿唯安等国际生命科学数据公司齐头并进。根据我国劳动力的高性价比优势,王中健提出,在高质量数据标记、编辑、加工等方面具有优势,「摩熵数科」产品能在全球范围内进行商业拓展,逐步与海外千亿级商业巨头竞争。
四种商业模式,从数据到生态的闭环构建
「摩熵数科」围绕数据价值的有效实现,进行商业模式。
服务SaaS平台:提供类似生命科学领域的标准化数据检索工具,但涵盖了更复杂的文本、元素、分子、反应、药物、机制或疾病数据;深入分析报告:为政府、药企、金融机构提供竞争格局、项目评估等定制咨询;产业链接服务:通过广告、会议等方式构建产业生态和供应链服务;AI模型赋能:为基础模型提供垂直领域知识库,实现AI检索增强。(RAG),模型微调服务提供优质信息(SFT)。
在人员架构方面,「摩熵数科」目前,医药领域近100名专业人员负责平台数据的处理,40多名计算机相关人员负责数据挖掘和算法优化,40多名运营和销售人员负责客户获取、销售和客户服务。据介绍,「摩熵数科」交付以标准化产品为主,销售周期短,转化效率高。销售人员为客户开立试用账户体验后,可以远程完成交易,年度付费客户续费率接近100%。
"我们正在建设PGC领域的生命科学。 UGC AIGC生态。王中健表示,公司的BCPM平台已经实现了用户上传分子结构、自主编辑企业产品、参与数据众包编辑等功能。,并通过分子识别验证码在行业内选择精准用户,逐步推动平台内交易闭环,形成产业生态。
技术突破:生命科学多模态AI模型
在「摩熵数科」在BCPM平台上,AI技术被广泛应用于数据检索与挖掘、多模态数据结合、知识工程系统建设、辅助决策与科研等领域。「摩熵数科」该团队认为,公司的核心竞争力在于BCPM-Miner模型,该模型融合了自然语言理解。(NLP)与计算机视觉(CV),从分子到人体的生命科学多模态识别体系已经建立在生命科学领域。“让机器了解元素、基团、反应、代谢通道、肿瘤组织切片等。这种垂直领域的精细化训练是普通大语言模型无法替代的。”

信息源方面,「摩熵数科」团队通过自主研发的“信息扰动技术”实现数据动态监控,确保时效性;同时,与国家部委、地区政府、相关公司建立完善的脱敏处理流程,依法依规使用私域数据。目前,「摩熵数科」已经签署了近10个城市的医疗数据项目,并且通过隐私计算技术实现了数据的可用性。王中健认为,“数据驱动” AI赋能是医学研发创新的新动力,也是优化资源配置、提高诊疗效率、实现个性化医疗的重要途径。
目前,数据合规性备受关注,「摩熵数科」通过与世界各地的数据集团合作,我们可以探索数据资产进入表和交易的新模式。王中健说:“上海数据交易所已经实现了很多医院科室的数据挂牌交易,我们希望促进更多的区域数据资产化。”
发展愿景:有创造力的团队 流动的数据
帮助生命科学领域的智能基础建设是「摩熵数科」愿景,同时,积极推进数据应用和数据挂牌交易的进程,使数据“流动”起来。

「摩熵数科」部分荣誉
“我们正在通过内部创新团队和与研究机构的合作,促进数据、AI和生命科学的深度结合,持续输出底层研究能力。”王中健说,该团队每周组织一次创新研讨会,探索“DT AI BT“三大技术的融合边界。
尽管面临着AI时代技术创新迅速、数据确认困难、资本市场认可度低等挑战,「摩熵数科」仍然看好国内数据要素市场与人工智能相结合的长期潜力。“成都高新区提供了良好的创业氛围,也期待有关部门在资金、政策、产业链等方面不断帮助企业发展。”王中健透露,“目前公司将开放新一轮融资,期待与相关投融资机构、产业链上下游企业进行深入交流。”
本文来自微信微信官方账号“36氪四川”,作者:36氪四川,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




