蚂蚁投资的生数科技完成数千万元融资,并正在内测数十亿级大模型

商界观察
2023-08-11

ChatGPT 持续引发中国人工智能(AI)大模型赛道的投资热潮。

 

钛媒体 App 独家获悉,8 月 9 日,生成式 AI 公司北京生数科技有限公司(简称 " 生数科技 ")宣布完成数千万元天使 + 轮融资,本轮由锦秋基金投资,资金将主要用于算法研发、产品开发和团队扩充。

 

此前 6 月,生数科技宣布完成蚂蚁集团、BV 百度风投、卓源资本近亿元的天使轮融资,首轮融资后估值 1 亿美金。而仅过去不到两个月,生数科技又一次连续完成第二轮投资。(详见钛媒体 App 前文:《蚂蚁、百度联合投资 AIGC 赛道,生数科技首轮融资后估值 1 亿美金》)

 

生数科技 CEO 唐家渝对钛媒体 App 表示,公司正计划打造百亿级参数量的大模型。相较于其他团队,生数的核心壁垒在于多模态大模型架构的原创先进性、持续的底层算法创新能力等,团队已研发出开源大模型 Unidiffuser。

 

"目前在文生图场景中,我们的效果已经达到了 Stable Diffusion 最新版基础模型效果,但与 Midjourney 相比还有一定差距,主要是美学性方面,我们预计年底会达到 Midjourney 最新版的效果。" 唐家渝表示。

 

据悉,生数科技成立于 2023 年 3 月,是全球领先的生成式 AI 基础设施及应用提供商,由清华系 AI 公司瑞莱智慧 RealAI、蚂蚁集团和百度发起的 BV 百度风投联合孵化成立,致力于打造可控多模态通用大模型。唐家渝此前曾任瑞莱智慧副总裁。

 

产品方面,今年 3 月,生数科技团队已发布 9.5 亿参数的开源多模态大模型 Unidiffuser,采用基于 Transformer 架构的底层统一网络框架 U-ViT,实现图文模态之间的任意跨模态生成。

 

唐家渝告诉钛媒体 App,目前,业界主要集中在解决两大核心问题:一是让模型能理解和对齐多种模态的数据;二是使模型能生成各种模态的内容。大多数方法仍然依赖于组合多个模型来处理多模态数据,但 Unidiffuser 利用 U-ViT 架构,成功地将文本和图像整合到一个框架中,而且其闭源版本还进一步整合了 3D 和视频内容。

 

目前,生数科技团队的研发核心主要有两方面:一是在 Unidiffuser 核心架构设计的基础上自主研发更高参数量的产业级大模型,在文本、图像的基础上融入 3D、视频等更多模态数据,现阶段已实现百亿数据、数十亿参数规模的通用大模型内测,支持文图生成、3D 生成和视频元素编辑等功能;二是基于底层通用模型能力,研发面向图像创作、3D 资产创建等内容创作场景打造 "AI 工具集 ",产品将于今年底前推出。

 

商业化方面,唐家渝向钛媒体 App 透露,生数科技商业化路径分两部分:一方面是开发面向终端用户的应用,例如图像创作助理、3D 资产生成平台,以订阅等形式收费;另一方面,面向 B 端机构,提供调用模型服务。

 

" 我们希望帮助个人用户解决细分场景下的图像创作需求,同时能实现高质量效果。目前,我们一款内测的产品就是定位个人图像创作助理,围绕更通用底层的图像创造和编辑需求,真正做到言出法随,让用户用特别简单的指令和交互就能创造出理想的图像。难点涉及到底层模型可控生成方面的技术突破,以及对于普通用户在图像创作和编辑需求意图方面的深刻理解。" 唐家渝表示。

 

唐家渝认为,相比语言类大模型,在多模态大模型方向,国内与国外的研究都处于早期探索阶段,并没有形成明显的差距,均面临包括架构层面解决多模态数据对齐、模态的统一和通用,以及大模型指令微调等问题,目前全球都还处于早期的技术研究和验证阶段,所以国内外差距不明显。而且在某些工作方向,国内已经领先于国外。

 

值得注意的是,生数科技此轮投资方 " 锦秋基金 " 与字节跳动关系密切。该基金成立于 2022 年 3 月,由原字节跳动财务投资负责人杨洁 Janna 创立,创始成员多数来自于原字节跳动投资团队以及国内顶级风险投资机构和知名产业公司,专注于早期和成长期投资。早前,杨洁还曾供职于红杉资本、深创投、同创伟业等。

 

目前,锦秋基金主要聚焦 AI 和出海领域,已投资海外电商服务平台 Jet Commerce 等,并且杨洁在未来机器人、鲨鱼菲特、零犀科技等多家企业有任职。

 

针对此次融资,锦秋基金投资副总裁郑晓超表示,大模型和生成式 AI 正引领当前最大的一波科技新浪潮,催生了全新的生产力工具和应用产品的出现,但其核心驱动力仍来自于底层模型的创新。生数科技团队不仅聚焦底层技术创新,拥有深度生成式模型的骨干网络、高速采样、可控生成等全栈研发能力,具备从 0 到 1 训练全球最大扩散模型的深厚技术实力。同时在商业化产品探索层面,生数科技团队也具有极强的工程化能力和产品创新能力。

 

唐家渝表示,生成式 AI 技术将让每个人都能更好地进行表达和创造,当想象力不再被局限,生产效率将大幅提升,传统的生产关系和人机交互模式也将得以重塑。未来生数科技将持续打磨通用大模型和应用产品,致力于通过不断解放想象力进而提升全人类的创造力和生产力。

 

本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com