不融资无销售,华人公司爆赚10亿美金,估值达1000亿
这或许是整个AI圈里最低调、最赚钱的独角兽企业。
它既没有进行融资,也没有销售团队和市场公关部门,却悄然成为了为OpenAI、Anthropic、Google等一众明星公司提供服务的企业。
它就是Surge AI。
Surge AI成立于2020年,创始人是华人Edwin Chen。他毕业于麻省理工学院,曾在华尔街对冲基金、Google、Facebook从事算法工作,一路走到了AI领域的最前沿。32岁时,他毅然选择创业。
如今,Surge AI的赚钱效率比备受关注的Scale AI还要高。
团队规模超过1200人的Scale AI,年收入为8.5亿美元。而Surge AI仅靠120人的团队,年收入就超过了10亿美元。
据路透社报道,Surge AI正启动首轮融资,目标募资10亿美元,估值可能达到150亿美元(约合1000亿元人民币)。
不出意外的话,我们又将见证一家AI领域千亿级公司的诞生。
不融资、无销售,120人创造10亿美金收入
毫不夸张地说,在AI创业圈,Surge AI是个极为特殊的“异类”。
从创业之初,创始人Edwin Chen就做出了一个“反硅谷”的决定:不接受VC的投资。

▲Surge AI创始人Edwin Chen(来源:Inc.com)
公司成立之初,仅靠他自己拿出的2500万美元维持运营。
不仅如此,在成立后的很长一段时间里,公司连一名专职销售都没有,业务增长完全依靠客户的自发推荐。
第一个客户来自Edwin的人脉圈。这个实验室拿到数据后,发现其质量远超市面上的其他供应商,于是很快将其推荐给了同行。
就这样,一家没有融资、没有销售的小公司,凭借数据质量赢得了OpenAI的认可,随后Anthropic、Google、Microsoft等公司也纷纷与其合作。口口相传之下,Surge AI成为了AI圈中“只靠推荐,无需宣传”的数据标注基础服务商。
Surge AI团队规模很小,年收入超过10亿美元,团队规模仅120人。
相比之下,Scale AI团队规模高达1200人,是Surge AI的十倍,年收入却为8.5亿美元,未能超越Surge AI。
为什么Surge AI会选择这种看似“缓慢”的发展模式呢?
Edwin Chen的观点很明确:“创业不应是一场追求地位的游戏。”
他是MVP(最小可用产品)理念的坚定支持者。他认为,90%的创业者在还未确定产品是否有价值时,就开始在朋友圈炫耀自己融资千万,登上TechCrunch头条,但这对用户而言毫无意义。
而Surge AI从第一个月开始就实现了盈利,不需要资金支持,更不希望通过销售去“推销”产品。他们希望客户是因为真正理解高质量数据的价值,才选择与他们长期合作。
没有了增长的压力,Surge AI从一开始就围绕“隐私优先、安全第一”的原则构建,无需为资本扩张而妥协,也不用为追求利润最大化而牺牲客户数据。
在医疗、政府等领域,客户要求数据全链路“物理隔离”,Surge AI的工作流程——SOC II认证、专家专属标注通道,完全符合合规要求。
这套高度定制、毫不妥协的体系,与Anthropic等“安全主义”实验室的理念天然契合。如今,它已成为这些高度重视AI伦理与数据治理机构的首选供应商。
当然,Surge AI能在AI数据领域取得胜利,不仅依靠安全合规,还得益于其建立的高质量数据体系。
Surge AI如何赢得数据之战?
在大模型发展的现阶段,模型能力的瓶颈往往不在于参数量,而在于数据质量。
很多人认为合成数据是万能的。它确实有一定作用,但存在一个致命缺陷:合成数据只能让模型擅长解决“合成问题”,却无法应对真实世界的问题。
如今,许多模型在基准测试中表现出色,但在实际应用中却漏洞百出。
越来越多的公司找到Surge AI,称他们花费一年时间用合成数据训练模型,结果却全是错误的,现在不得不花费数月时间清理这些无用的数据。
要让模型像人类一样思考、判断,就必须为其提供真实反映人类视角的数据。以往那种“AI包工头”模式已经无法满足需求,靠人海战术堆积数据,无法让模型学到真本领。
Surge AI很早就洞察到了这一趋势,并迅速完成了转型。
它砍掉了低质量的流水线作业,转而搭建了一个名为“Surge Force”的精英网络。
这看似只是一个数据标注工作,但并非任何人都能胜任。毫不夸张地说,想加入这个网络,比申请常春藤盟校还要困难。
例如,对于OpenAI著名的数学数据集GSM8K,Surge AI会优先选择具有数学或STEM学位的标注员,如来自MIT等藤校的大学生。
仅有专业背景还不够,所有标注员还需提交5道试写题目,经另一名资深标注员审核通过后,才能加入团队。
之所以设置如此高的要求,是因为要让模型真正理解一件事情,必须依靠专业人士。因此,Surge AI聘请了许多律师、教师、工程师、多语种专家等,来完成这些看似繁琐的工作。
正是这种近乎苛刻的标准,让Surge AI的数据质量始终保持稳定。许多客户表示,Surge AI交付的几千条人工数据,比他们之前购买的上百万条合成数据更有价值。
除了招揽专业人才,Surge AI在技术方面也进行了创新。
Surge AI自主研发了一套动态标注引擎。它能够理解行业黑话,把握网络文化内涵,甚至对于“how dare you!”这样的句子,它也能准确判断出其中的愤怒、调侃或夸张情绪。
不仅判断准确,而且审查严格。Surge AI独创了“小数点后”级质控技术,准确率比Scale AI(98%)还要高。
Surge AI通过背靠背标注、多轮仲裁、AI辅助校验等方式,确保数据准确率达到99.99%。某企业的旧NLP数据集经Surge AI重新标注后,文本分类准确率显著提高,效果远超普通优化。
RLHF(人类反馈强化学习)是让大模型“理解人类语言”的关键步骤。Surge AI在这方面的进展比其他公司更为显著。
它不仅能够进行偏好排序、奖励建模,还能安排红队攻击,专门为模型提供一些“刁钻”的数据,促使其不断学习和进步。Anthropic团队曾表示,Surge AI的数据质控和RLHF工具,直接推动了Claude性能的突破。
除了数据质量高,Surge AI的效率也非常惊人。
据了解,某客户一次性下达了5000条多轮情感标注任务,按照200条一批的方式发送给Surge AI。结果第一批任务不仅按时交付,而且质量超出预期,于是Surge AI顺理成章地获得了后续合作机会。
总结
总的来说,Surge AI的崛起并非偶然。它抓住了四个关键趋势:
首先是满足高质量数据的刚性需求。
RLHF技术的兴起,使得高质量的人类反馈成为模型性能的关键因素。客户直言:“没有Surge AI的数据,我们根本无法构建现有的模型。”
其次,Surge AI的技术质量为其树立了高壁垒定价权。
精英网络和99.99%的质量目标构建了极高的竞争壁垒,客户对“小数点后精度”的刚性需求(AI安全容错率极低)赋予了Surge AI强大的议价能力。
第三,Surge AI的商业模式具有高利润可复制性。
其深度融入客户的训练流程后,能够产生持续、高粘性的重复收入——因为数据是持续消耗品。
最后,中立性定位使它在行业格局中占据了一席之地。
Meta大力投资Scale AI,引发了OpenAI、Google等公司对“数据经过竞争对手之手”的担忧,大量订单转向了中立的Surge AI,这成为Surge AI在2024年收入超越Scale AI的关键因素。
在AGI的最终竞赛中,真正能够影响AI价值观的,不是模型架构,而是掌握人类反馈数据命脉的企业。而Surge AI,正是那个掌握AI命脉的玩家。
本文来自微信公众号“乌鸦智能说”,作者:智能乌鸦,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




