97 年创始人融资数亿，打造 3D 抖音式 AI 3D 新体验

2025-11-19

口述丨 VAST 创始人宋亚宸

作者丨铅笔道吴欣晓

当全球都在热议 OpenAI 的 Sora 能用文字生成 60 秒高质量视频时，中国的 VAST 却在默默做一件更具挑战性的事。

VAST 致力于让 AI 不只是“拍出一段视频”，而是“重新生成三维世界”。

过去，专业人士建一个 3D 模型要花十几个小时；现在，在 VAST 的 AI 3D 工作台 Tripo Studio 上，只需 6 分钟，一个皮肤纹路和衣服褶皱都清晰可见的 3D 人物就会出现在屏幕上。

Tripo 能读懂文字和图片，一键生成带完整材质的三维模型，可直接用于游戏、动画、虚拟空间。

这一刻，AI 仿佛成了新的“造物者”。

VAST 的创始人宋亚宸，1997 年出生于杭州，拥有美国约翰霍普金斯大学国际关系学和经济学双学士学位。

他热爱一切与“内容”相关的事物，读历史、看小说，还是《龙与地下城》的老玩家。这种跨学科背景让他更像一个“讲故事的人”。

今年 6 月，VAST 完成数千万美元 Pre A+ 轮融资，由北京市人工智能产业投资基金领投，靖亚资本跟投。此前，VAST 已获绿洲资本、达晨财智等多家知名机构投资。

成立三年来，Vast 已获三轮融资，每轮融资金额均达数亿元，估值位居全球 AI 3D 大模型公司之首。

在商业化方面，VAST 也处于领先地位。截至 2025 年 7 月，其年度经常性收入（ARR）达到 1200 万美元，是该领域收入最高的公司之一。

VAST 的办公室位于清华南门外的东升大厦，这里是中国 AI 企业密度最高的区域之一。创始人宋亚宸表示，他希望有一天，每个人都能像发抖音一样轻松用 AI 生成 3D 内容，像《头号玩家》里那样，在三维世界中拓宽人类的幸福边界。

声明：访谈对象已确认文章信息真实无误，铅笔道愿为其内容做信任背书。以下是宋亚宸口述。

宋亚宸，VAST 创始人，获评 2025 年《财富》中国 40 岁以下最具潜力商界精英

01 “3D 抖音”就此诞生

很多人好奇我的动机。其实很简单，我是个“内容杂食动物”。

我阅读范围广泛，从玄幻小说到《卡拉马佐夫兄弟》；游戏也玩得多样，从《全面战争》到网页小游戏，还爱听评书相声。《龙与地下城》我玩了很多年，公司电竞房里还放着 DnD 的骰子。以前每周都跑团，一坐就是 10 个小时，现在玩得少了，但热爱依旧。

这种广泛的兴趣让我看到了一个巨大的市场空白。文字有公众号和微博，图片有小红书和 Instagram，视频有抖音和 TikTok，它们都有繁荣的 UGC 生态，但 3D 领域却没有一个能创作、分享 3D 内容的平台。

这显然不正常。

VAST 最初的理想是做一个“3D 版 UGC 平台”，可粗略理解为“3D 抖音”，即人人都能随手发 3D 内容。

但现实很残酷，当时 3D 创作门槛极高，要学十几个小时的软件，付费几十块钱，再等上几天渲染，这样的门槛根本无法支撑一个大众化平台。

我意识到，AI 3D 可能是打开零门槛创作大门的钥匙，于是我们果断转向，全力投入 AI 3D 大模型。

那段时间见了一两百个投资人，真正能听懂我们在做什么的可能只有一两个。我常常得从“《王者荣耀》其实就是一个 3D 世界”开始讲起。但越是没人懂，我越笃定，因为这事儿够“硬”，也够“COOL”。

找团队时，我尽可能真诚。和候选人聊天时，我会打开给投资人看的商业计划书，一页一页地告诉他们我们要干什么、路径是什么、难点在哪里。

很幸运，我吸引来了一群比我厉害得多的人，像我们的 CTO 梁鼎、首席科学家曹炎培等，他们在学术算法工程领域非常专业。

我常说，创业就像“填坑”。只有真心想填一个足够大的陨石坑时，才会吸引来那些擅长“填大坑”的人。

02 AI 3D 临界点时刻

最近忙得不可开交，核心就两件事：把产品做深，让市场看懂。

过去，AI 3D 更像一个用于头脑风暴的“玩具”，在项目里的价值可能只占 10%。

但从今年 9 月起，它迎来了真正的临界点。我们发布了 Tripo 3.0 模型，参数直接拉升到两百亿参数级别。

我们把那个版本称为“节点”，从那一刻起，AI 3D 开始进入深层工作流。它能帮助游戏团队、工业设计师，直接生成可用于最终产品的模型，带贴图、有材质，甚至能自动绑定骨骼，而不只是一个粗糙的几何体。

它的价值占比从 10% 跃升到 50%，甚至更高。

为此，我们几乎把全部精力都投入到打造完整工作流上，目标是让创作流程闭环，让想法更快变成成品。现在说“完全闭环”可能还早，但在可见的未来，比如明年，我们有很大概率能实现。

另一件事是让更多人理解 AI 3D 到底是什么。很多人不知道，AI 3D 是人类历史上近两三年才出现的“发明”，我们第一次能用一句话或一张图，就“言出法随”地生成一个三维物件。

我们没有庞大的销售团队，早期的市场教育靠的是和创作者“玩在一起”。我们办了创作者比赛，发奖品，和大家一起折腾。

最早那批创作者非常了不起。在我们刚发布第一代 Tripo 大模型时，产品还远不成熟，功能很有限。但他们用不完美的工具，一点点试出了各种惊艳的作品，还自发在社交媒体上分享、传播。

这种“自来水”是我们最宝贵的资产。

这份努力正在被市场看见。到目前为止，我们的工具已经服务了全球近 500 万专业建模师和超过 4 万家企业。今年 8 月，我们的月收入已经在 200 万美金左右，并且保持着增长。融资方面，我们完成了三轮融资，每一轮的规模都在“数亿人民币”级别。这让我对中国愿意支持长期主义、硬科技的资本市场充满信心。

Tripo 3.0 白模与贴图渲染效果对比

03 一种新的生产力范式诞生

我一直坚信，AI 3D 不是一个“降本增效”的工具，而是一场能力平权的革命。

它正在把 3D 创作从一项只有少数人掌握的精英技能，变成像打字、拍照一样的大众能力。

过去，一个 3D 模型需要设计师花几周时间、耗资数万去完成；现在，用我们的技术，几十秒、几乎零成本，一个普通人打几个字就能生成。

这就像当年手机摄像头普及时，人类第一次意识到“人人都能创作”。当创作门槛被打破，所有行业都会被重新排列。

这不是“替代”，而是交叉打法，新的玩法、新的产业，都会从能力的扩张中生长出来。

1. “3D 菜单”——从照片到空间

我常拿菜单举例。从手写到打印，再到手机上的高清照片，每一次变化都在降低信息不对称。但我一直有个疑问：为什么菜单不是一张 3D 的桌子？

想想我们点菜时的困惑，照片“看起来很诱人”，却没人知道这道菜有多大。如果菜单能让顾客把菜的 3D 模型拖到虚拟桌面上，直观看出体积与摆盘，那才是真正的体验升级。

2. 个性化定制——设计的边际成本归零

我喜欢一个有点“反骨”的例子。假设我想做一个“老板张大嘴巴的杯子”，每天倒水的时候，都像在老板嘴里倒开水。以前，这种定制靠自己几乎不可能实现，因为成本是无限的，没人会为此去学一年 CAD。而现在，用 AI 3D，只需要一张照片、一串文字，成本就变成了零。

当“设计”变得和打字一样简单，柔性化生产链终于能满足海量“非标”需求，那才是真正的大众制造时代。

3. B2B 的柔性生产——制造业的去风险革命

再看一个更宏观的例子，比如义乌或外贸行业。过去的流程是：设计、雕刻样品、寄 100 个实物给海外买家，买家挑 5 个，再“开模”，整个过程昂贵又低效。而在 AI 3D 出现之后，流程变成：生成 1000 个 3D 模型，买家在数字环境里随意挑选、修改，所有迭代都在“开模”之前完成。

这不是“更便宜的设计”，而是为制造业降低风险。“开模”曾是资本支出的巨大瓶颈，如今所有的试验、沟通、失败，都能在虚拟世界完成。AI 3D 释放的，不只是更高的效率，而是一种新的生产力范式。

04 AI 3D 的四大赚钱机会

我将 AI 3D 目前的商业化路径清晰地分为了“四大块”，它们构成了我们当前的收入来源。

第一大支柱是内容创作，涵盖游戏、动画、影视、CG，甚至短剧行业。AI 3D 的意义远不止“降本增效”，它压缩了制作时间、降低了成本，也让创作团队变得更小、更灵活。我认同米哈游创始人蔡浩宇的话：“0.001% 的人会继续把《黑神话：悟空》这样的 3A 大作做到极致，而 99.999% 的人，会创造属于自己的游戏。”AI 3D 就是赋能那 99.999% 的人的工具，让创作权从少数人手中回到大众手中。新的 UGC 玩法正在出现，比如《蛋仔派对》的玩家自制地图；新的交互方式也在诞生，如《燕云十六声》中，“言出法随”就能改变地形。

第二大支柱是工业设计。在重工业里，比如汽车制造，AI 3D 能替代过去极其昂贵的油泥模型。在轻工业领域，它的应用更广，鞋服、家居、玩具、手办等任何需要大量 SKU 的行业，都能从中受益。我特别关注 3D 打印市场，AI 3D 终于给了普通人，哪怕是一年级的小孩，一个拥有 3D 打印机的理由，他们可以随心所欲地生成、打印出属于自己的“奥特曼”。过去十年，3D 打印行业最大的问题不是硬件，而是内容，AI 3D 正在补上这块短板，让每个人都能生产内容，也让 3D 打印真正从“工具”变成了一种创作方式。

第三大支柱是展示与呈现，它几乎和所有“面向视觉的行业”有关。在电商领域，AI 3D 让商品从三张静态照片，变成可以 360 度旋转、可交互的模型；在教育中，孩子不再只是看二维的太阳系图，而是能“走进”一个 3D 的星球系统；在广告与数字文旅领域，可以重现一个古城。我之前提到的“3D 菜单”，就是这一类最典型的例子，它不只是在展示，更是在还原真实世界的维度。

第四大支柱是新兴行业，自动驾驶仿真、机器人训练、数字孪生、AI 游戏、空间智能等都是未来。它们对三维世界的理解和重建能力有着天然的依赖。AI 3D 在这里的角色是“世界的生成引擎”，它让机器不仅能在虚拟世界里学习、决策、测试，还让我们有机会重新定义“智能”，让人工智能真正理解空间、理解物理、理解现实。

我有一个可能听上去有点“反常识”的观点：3D，才是信息的终极形态。在主流认知里，人们普遍认为大模型的“基底”是语言模型，而图像、视频、3D 只是“垂类模型”。但我恰恰认为，事实正好相反，AI 3D 才是真正的“基座模型”。文字、图片、视频，只是人类在低带宽时代，为了传播信息而发明的“压缩格式”，而 3D 才是世界本来的样子，它是信息密度最高的“源文件”。未来的 AGI（通用人工智能），如果只理解文字，那将是一种“高傲”，要真正理解人类，它必须先理解物理世界，理解这个三维的现实。

Tripo 3.0 模型精度跃上新台阶

05 中国唯一领先的 AI 赛道

最后，说点可能听上去有点“狂”，但却是事实。在 AI 领域，大家常觉得中国在追随美国。在文字、图片、视频大模型上，如果说“不落后”，那客观讲，也谈不上“领先”。但在 AI 3D 这条赛道上，中国是全世界最领先的，没有之一。这不是盲目的自信，而是产品、技术、用户和数据共同带来的底气。

我们之所以有机会领先，是因为这个领域在早期具备四个特征：高投入、小市场、非共识，但我们坚信它未来会高速增长。大公司不会在这样一个“反直觉”的方向上全力投入，这恰恰给了我们创业公司一个难得的窗口期。

当然，这份领先也让我有些遗憾。我们在全球范围内最早跑通了这条路，但如今 80% 到 90% 的收入来自海外，国内很多行业和专家，还没有真正意识到这项技术的价值。

我希望，未来能和国内的产业伙伴一起，把这份领先的优势，转化为推动中国经济高质量发展的新动能。

我经常想起玩《龙与地下城》的时候。在那个想象的世界里，你可以成为任何人，做任何事。而我现在做 VAST，最大的梦想，就是让现实世界的每个人，也拥有一支属于自己的“马良神笔”。

你想创造一个属于自己的世界吗？来吧，笔就在这里。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

11月18日多场足球赛事开打，有冷门吗？

《阿凡达3：火与烬》首曝正片片段，12月19日内地定档上映

行业首台自带云台的机器人手机！荣耀ROBOT PHONE真机首度亮相

暖心！警车开道护送患者，彰显责任担当

铭瑄多款AMD主板新品确认支持未来处理器

项目推荐

迪瓜租机

康老板 · 氧疗堂