97 年创始人融资数亿,打造 3D 抖音式 AI 3D 新体验
口述丨 VAST 创始人宋亚宸
作者丨铅笔道吴欣晓
当全球都在热议 OpenAI 的 Sora 能用文字生成 60 秒高质量视频时,中国的 VAST 却在默默做一件更具挑战性的事。
VAST 致力于让 AI 不只是“拍出一段视频”,而是“重新生成三维世界”。
过去,专业人士建一个 3D 模型要花十几个小时;现在,在 VAST 的 AI 3D 工作台 Tripo Studio 上,只需 6 分钟,一个皮肤纹路和衣服褶皱都清晰可见的 3D 人物就会出现在屏幕上。
Tripo 能读懂文字和图片,一键生成带完整材质的三维模型,可直接用于游戏、动画、虚拟空间。
这一刻,AI 仿佛成了新的“造物者”。
VAST 的创始人宋亚宸,1997 年出生于杭州,拥有美国约翰霍普金斯大学国际关系学和经济学双学士学位。
他热爱一切与“内容”相关的事物,读历史、看小说,还是《龙与地下城》的老玩家。这种跨学科背景让他更像一个“讲故事的人”。
今年 6 月,VAST 完成数千万美元 Pre A+ 轮融资,由北京市人工智能产业投资基金领投,靖亚资本跟投。此前,VAST 已获绿洲资本、达晨财智等多家知名机构投资。
成立三年来,Vast 已获三轮融资,每轮融资金额均达数亿元,估值位居全球 AI 3D 大模型公司之首。
在商业化方面,VAST 也处于领先地位。截至 2025 年 7 月,其年度经常性收入(ARR)达到 1200 万美元,是该领域收入最高的公司之一。
VAST 的办公室位于清华南门外的东升大厦,这里是中国 AI 企业密度最高的区域之一。创始人宋亚宸表示,他希望有一天,每个人都能像发抖音一样轻松用 AI 生成 3D 内容,像《头号玩家》里那样,在三维世界中拓宽人类的幸福边界。
声明:访谈对象已确认文章信息真实无误,铅笔道愿为其内容做信任背书。以下是宋亚宸口述。

宋亚宸,VAST 创始人,获评 2025 年《财富》中国 40 岁以下最具潜力商界精英
01 “3D 抖音”就此诞生
很多人好奇我的动机。其实很简单,我是个“内容杂食动物”。
我阅读范围广泛,从玄幻小说到《卡拉马佐夫兄弟》;游戏也玩得多样,从《全面战争》到网页小游戏,还爱听评书相声。《龙与地下城》我玩了很多年,公司电竞房里还放着 DnD 的骰子。以前每周都跑团,一坐就是 10 个小时,现在玩得少了,但热爱依旧。
这种广泛的兴趣让我看到了一个巨大的市场空白。文字有公众号和微博,图片有小红书和 Instagram,视频有抖音和 TikTok,它们都有繁荣的 UGC 生态,但 3D 领域却没有一个能创作、分享 3D 内容的平台。
这显然不正常。
VAST 最初的理想是做一个“3D 版 UGC 平台”,可粗略理解为“3D 抖音”,即人人都能随手发 3D 内容。
但现实很残酷,当时 3D 创作门槛极高,要学十几个小时的软件,付费几十块钱,再等上几天渲染,这样的门槛根本无法支撑一个大众化平台。
我意识到,AI 3D 可能是打开零门槛创作大门的钥匙,于是我们果断转向,全力投入 AI 3D 大模型。
那段时间见了一两百个投资人,真正能听懂我们在做什么的可能只有一两个。我常常得从“《王者荣耀》其实就是一个 3D 世界”开始讲起。但越是没人懂,我越笃定,因为这事儿够“硬”,也够“COOL”。
找团队时,我尽可能真诚。和候选人聊天时,我会打开给投资人看的商业计划书,一页一页地告诉他们我们要干什么、路径是什么、难点在哪里。
很幸运,我吸引来了一群比我厉害得多的人,像我们的 CTO 梁鼎、首席科学家曹炎培等,他们在学术算法工程领域非常专业。
我常说,创业就像“填坑”。只有真心想填一个足够大的陨石坑时,才会吸引来那些擅长“填大坑”的人。
02 AI 3D 临界点时刻
最近忙得不可开交,核心就两件事:把产品做深,让市场看懂。
过去,AI 3D 更像一个用于头脑风暴的“玩具”,在项目里的价值可能只占 10%。
但从今年 9 月起,它迎来了真正的临界点。我们发布了 Tripo 3.0 模型,参数直接拉升到两百亿参数级别。
我们把那个版本称为“节点”,从那一刻起,AI 3D 开始进入深层工作流。它能帮助游戏团队、工业设计师,直接生成可用于最终产品的模型,带贴图、有材质,甚至能自动绑定骨骼,而不只是一个粗糙的几何体。
它的价值占比从 10% 跃升到 50%,甚至更高。
为此,我们几乎把全部精力都投入到打造完整工作流上,目标是让创作流程闭环,让想法更快变成成品。现在说“完全闭环”可能还早,但在可见的未来,比如明年,我们有很大概率能实现。
另一件事是让更多人理解 AI 3D 到底是什么。很多人不知道,AI 3D 是人类历史上近两三年才出现的“发明”,我们第一次能用一句话或一张图,就“言出法随”地生成一个三维物件。
我们没有庞大的销售团队,早期的市场教育靠的是和创作者“玩在一起”。我们办了创作者比赛,发奖品,和大家一起折腾。
最早那批创作者非常了不起。在我们刚发布第一代 Tripo 大模型时,产品还远不成熟,功能很有限。但他们用不完美的工具,一点点试出了各种惊艳的作品,还自发在社交媒体上分享、传播。
这种“自来水”是我们最宝贵的资产。
这份努力正在被市场看见。到目前为止,我们的工具已经服务了全球近 500 万专业建模师和超过 4 万家企业。今年 8 月,我们的月收入已经在 200 万美金左右,并且保持着增长。融资方面,我们完成了三轮融资,每一轮的规模都在“数亿人民币”级别。这让我对中国愿意支持长期主义、硬科技的资本市场充满信心。

Tripo 3.0 白模与贴图渲染效果对比
03 一种新的生产力范式诞生
我一直坚信,AI 3D 不是一个“降本增效”的工具,而是一场能力平权的革命。
它正在把 3D 创作从一项只有少数人掌握的精英技能,变成像打字、拍照一样的大众能力。
过去,一个 3D 模型需要设计师花几周时间、耗资数万去完成;现在,用我们的技术,几十秒、几乎零成本,一个普通人打几个字就能生成。
这就像当年手机摄像头普及时,人类第一次意识到“人人都能创作”。当创作门槛被打破,所有行业都会被重新排列。
这不是“替代”,而是交叉打法,新的玩法、新的产业,都会从能力的扩张中生长出来。
1. “3D 菜单”——从照片到空间
我常拿菜单举例。从手写到打印,再到手机上的高清照片,每一次变化都在降低信息不对称。但我一直有个疑问:为什么菜单不是一张 3D 的桌子?
想想我们点菜时的困惑,照片“看起来很诱人”,却没人知道这道菜有多大。如果菜单能让顾客把菜的 3D 模型拖到虚拟桌面上,直观看出体积与摆盘,那才是真正的体验升级。
2. 个性化定制——设计的边际成本归零
我喜欢一个有点“反骨”的例子。假设我想做一个“老板张大嘴巴的杯子”,每天倒水的时候,都像在老板嘴里倒开水。以前,这种定制靠自己几乎不可能实现,因为成本是无限的,没人会为此去学一年 CAD。而现在,用 AI 3D,只需要一张照片、一串文字,成本就变成了零。
当“设计”变得和打字一样简单,柔性化生产链终于能满足海量“非标”需求,那才是真正的大众制造时代。
3. B2B 的柔性生产——制造业的去风险革命
再看一个更宏观的例子,比如义乌或外贸行业。过去的流程是:设计、雕刻样品、寄 100 个实物给海外买家,买家挑 5 个,再“开模”,整个过程昂贵又低效。而在 AI 3D 出现之后,流程变成:生成 1000 个 3D 模型,买家在数字环境里随意挑选、修改,所有迭代都在“开模”之前完成。
这不是“更便宜的设计”,而是为制造业降低风险。“开模”曾是资本支出的巨大瓶颈,如今所有的试验、沟通、失败,都能在虚拟世界完成。AI 3D 释放的,不只是更高的效率,而是一种新的生产力范式。
04 AI 3D 的四大赚钱机会
我将 AI 3D 目前的商业化路径清晰地分为了“四大块”,它们构成了我们当前的收入来源。
第一大支柱是内容创作,涵盖游戏、动画、影视、CG,甚至短剧行业。AI 3D 的意义远不止“降本增效”,它压缩了制作时间、降低了成本,也让创作团队变得更小、更灵活。我认同米哈游创始人蔡浩宇的话:“0.001% 的人会继续把《黑神话:悟空》这样的 3A 大作做到极致,而 99.999% 的人,会创造属于自己的游戏。”AI 3D 就是赋能那 99.999% 的人的工具,让创作权从少数人手中回到大众手中。新的 UGC 玩法正在出现,比如《蛋仔派对》的玩家自制地图;新的交互方式也在诞生,如《燕云十六声》中,“言出法随”就能改变地形。
第二大支柱是工业设计。在重工业里,比如汽车制造,AI 3D 能替代过去极其昂贵的油泥模型。在轻工业领域,它的应用更广,鞋服、家居、玩具、手办等任何需要大量 SKU 的行业,都能从中受益。我特别关注 3D 打印市场,AI 3D 终于给了普通人,哪怕是一年级的小孩,一个拥有 3D 打印机的理由,他们可以随心所欲地生成、打印出属于自己的“奥特曼”。过去十年,3D 打印行业最大的问题不是硬件,而是内容,AI 3D 正在补上这块短板,让每个人都能生产内容,也让 3D 打印真正从“工具”变成了一种创作方式。
第三大支柱是展示与呈现,它几乎和所有“面向视觉的行业”有关。在电商领域,AI 3D 让商品从三张静态照片,变成可以 360 度旋转、可交互的模型;在教育中,孩子不再只是看二维的太阳系图,而是能“走进”一个 3D 的星球系统;在广告与数字文旅领域,可以重现一个古城。我之前提到的“3D 菜单”,就是这一类最典型的例子,它不只是在展示,更是在还原真实世界的维度。
第四大支柱是新兴行业,自动驾驶仿真、机器人训练、数字孪生、AI 游戏、空间智能等都是未来。它们对三维世界的理解和重建能力有着天然的依赖。AI 3D 在这里的角色是“世界的生成引擎”,它让机器不仅能在虚拟世界里学习、决策、测试,还让我们有机会重新定义“智能”,让人工智能真正理解空间、理解物理、理解现实。
我有一个可能听上去有点“反常识”的观点:3D,才是信息的终极形态。在主流认知里,人们普遍认为大模型的“基底”是语言模型,而图像、视频、3D 只是“垂类模型”。但我恰恰认为,事实正好相反,AI 3D 才是真正的“基座模型”。文字、图片、视频,只是人类在低带宽时代,为了传播信息而发明的“压缩格式”,而 3D 才是世界本来的样子,它是信息密度最高的“源文件”。未来的 AGI(通用人工智能),如果只理解文字,那将是一种“高傲”,要真正理解人类,它必须先理解物理世界,理解这个三维的现实。

Tripo 3.0 模型精度跃上新台阶
05 中国唯一领先的 AI 赛道
最后,说点可能听上去有点“狂”,但却是事实。在 AI 领域,大家常觉得中国在追随美国。在文字、图片、视频大模型上,如果说“不落后”,那客观讲,也谈不上“领先”。但在 AI 3D 这条赛道上,中国是全世界最领先的,没有之一。这不是盲目的自信,而是产品、技术、用户和数据共同带来的底气。
我们之所以有机会领先,是因为这个领域在早期具备四个特征:高投入、小市场、非共识,但我们坚信它未来会高速增长。大公司不会在这样一个“反直觉”的方向上全力投入,这恰恰给了我们创业公司一个难得的窗口期。
当然,这份领先也让我有些遗憾。我们在全球范围内最早跑通了这条路,但如今 80% 到 90% 的收入来自海外,国内很多行业和专家,还没有真正意识到这项技术的价值。
我希望,未来能和国内的产业伙伴一起,把这份领先的优势,转化为推动中国经济高质量发展的新动能。
我经常想起玩《龙与地下城》的时候。在那个想象的世界里,你可以成为任何人,做任何事。而我现在做 VAST,最大的梦想,就是让现实世界的每个人,也拥有一支属于自己的“马良神笔”。
你想创造一个属于自己的世界吗?来吧,笔就在这里。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com



