在DeepSeek之后,一个清华学霸火了。

02-20 11:15

在DeepSeek刷新国产产品 在大模型性能的天花板上,行业上下游的一个关键关闭正在悄然点燃更深层次的变化——盛晨科技宣布,与华为盛腾联合推出DeepSeek-R1全栈推理服务,这是一种可以称之为“提升革命”的重磅弹药,将中国AI算率自主化的想象空间推向了一个新的高度。


01 清华极客破茧AI新极客


当全球AI军备竞赛还没有点燃狼烟的时候,一个中国青年已经悄然完成了自己的技术实力。具有传奇学历背景的90后科技精英刘晨科技创始人尤洋,在学习期间意识到“AI是未来,中国人要有自己的技术”。


尤洋在清华读书时,先后获得了学校、市级优秀学生荣誉和西贝尔奖学金(该系学术荣誉最高)。赴UC 在Berkeley深造期间,Jamess,电子与计算机学院院长。 尤洋,Demmel院士,开启了学术巅峰。AAAI创造了他的记录。、ACL、IPDPS、ICPP四大顶会作为领导者获得最佳论文奖项。通过2020年全球HPC领域最高引用博士毕业生的称号,学术影响力得到证实,而ACM则得到证实。 Doctoral Dissertation 在81位伯克利顶级博士中,Award的提名更是让他脱颖而出。



即使在常春藤盟校教职员工的邀请下,尤洋最终选择在新加坡国立大学开辟新的战场,成为该校计算机系第一位中国“校长青年教授”。毕业后不久,AI的发展浪潮让尤洋看到了创业的机会。尤洋在全球最受关注的OpenAI未能取得巨大成就的时期,多年来一直走在大模型的道路上,并于2021年创立了六晨科技。


据说VC/PE的眼睛比鹰尖。得知尤洋创业,真格基金、创新车间、蓝驰风险投资、红杉中国、新加坡电信、大湾区基金、石溪资本、领先资本、顺禧基金等知名投资机构纷纷递来橄榄叶。 (根据天眼查信息)。融入A 轮子里,六晨科技的投后估值翻了30倍以上,堪称“中国创投圈估值增长最快的AI创业公司之一”。


02 中国在大模型时代的解法


提到为什么要和升腾联合起来,尤洋表示,要“让更多的人做出和部署自己的模型,让中国AI走向世界”。


Deepseek的流行无疑打开了中国AI的市场空间。其中最大的变化就是打破了GPU在性能、性价比和利用率方面的压力,这一点一直被认为是国产芯片。六晨与升腾的合作“更像是一个示范案例”,良好的软件与硬件相结合,充分发挥了国产芯片的价值。


双方联合发布的API在尤洋的计划蓝图中。、云镜像和推理一体机不是简单的产品矩阵,而是一个破壁试验:通过尽可能将硬件提升到极致,弥补国内芯片生态不足的关键软件和高性能算法,六晨科技成功进一步增强了DeepSeek系列模型与九腾的适应性。尤洋直言不讳地说:“这是一件很有意义的事情,公司可以用更低的成本,做更多想做的模型,提高运营效率。” 就拿六晨升腾Deepseek一体机来说,实测数据显示,华为800I 在A2集群中,性能最好的671BDeepseek-R1模型可以实现近200名用户的并发,大大降低了公司部署的算率成本。


这个数据的背后,是尤洋和六晨团队多年来在算率提升的道路上不懈的挑战和突破。随着Colossal-AI深度学习的提高,六晨科技成立之初,同时也引起了开源社区的震惊,其中关键的LAMB优化技术,是微软、字节等巨头争相使用的大规模改进方案,被英伟达官方github认证为“比行业内最佳方案加速17倍”。但在国产芯片中应用Colossal-AI并不那么简单。由于受到带宽和内存的限制,许多算法需要重新设计,以减少多机计算时的数据传输和通信费用。然而,正是这种近4万人在Github上星标的开源系统,一次又一次地克服了这些问题和挑战,成长为六晨科技在提高计算率的道路上的生态堡垒,为尤洋“大模型定向推广”的愿景奠定了坚实的基础。



谈到Colossaloss-AI,尤洋把它比作一个会不断吸收和迭代的大脑。虽然在这个细分领域,无论是初创公司还是大学,都没有比Colossal-AI更多的生态,但尤洋还是谦虚地说:“我不想表达。我比微软和英伟达的人聪明。我们只是说,我们花时间建造堡垒,赢得了越来越多的客户的认可。”。


03 打破MaaS迷思


“MaaS可能是中国短期内最差的商业模式,”对于席卷行业模式的调用服务模式,尤洋展现了技术极客的犀利。


他说:“大厂内卷太严重了,各大云企业,使用全血版DeepSeek-R1,每百万token官方也只能收到16元。假如DeepSeek-R1每天导出1000亿token,那么,如果我们选择英伟达H800服务器,按照每台机器每月75,000元的费用,每月设备总成本为4.5亿元,亏损4亿元,客户越多,损失就越大。“这个算术问题在算率军备竞赛白热化阶段戳破了MaaS服务商的商业幻想。北京八友科技创始人兼首席执行官梁斌也曾在微博上计算,如果使用最好的AMD机,每月收入4500万元的机器成本为3.6亿元,与尤洋的估计大致相似。与MaaS的商业模式相比,尤洋更看好定制公司或应用专属模式的市场。尤洋和我们分享了两个例子:一是李飞飞团队通过不到50美元的计算费用,成功训练出了Open。-AI 与Deepseek-R1推理能力相似的O1顶级模型;另一个是UC伯克利的团队成功训练了DeepScale-1.500美元B-Preview,OpenAI之外的o1-preview。尤洋判断,未来许多企业将选择通过低成本的强化学习、模型蒸馏、快速微调等方式,打造企业专属模式。通过将公司珍贵的私有数据和资源融入到模型中,可以使专属模型达到更高的水平。在未来,他预计这条赛道将变得越来越重要,而这恰好是六晨科技最擅长的部分。


尤洋和六晨科技在这方面已经做了很多探索。作为AI 云计算能力和优化是Infra企业商业化的重要组成部分,它帮助六晨在中国赢得了数千个付费客户。尤洋的野心不止于此。经过国内六晨云的商业模式验证,团队迅速将其扩展到世界上许多国家,收入几乎呈线性增长。也许就是这样,在同行谨慎谈收入的AI创业初期,这家公司才有信心以近乎“叛逆”的姿态发布商业底牌。根据六晨科技2024年的财务报告,企业实现了7700万元的营收(合同)和4800万元的营收(确定)。


说到这种不寻常的公开性,尤洋高兴地说,在将Colossal-AI制作成软件形式后,大量客户愿意购买六晨的产品。“我们的员工也在提高工作效率,以员工数量的1.8倍增长换取营收增长的2.8倍。当我们的商业模式开放时,我们公开了财务数据,客户信任我们。每个人都喜欢我们创造的AI生态,愿意付费。”


04 “中国变量”视频宇宙


作为AI,在我们和大众的印象中, 知名企业Infra,六晨科技一直专注于tofra。 B的业务。然而,从去年开始,六晨推出了一系列视频模型,Videooodeoo一步步从Open-Sora迭代出来。 Ocean,一种风靡全球的商品。


对于我们的好奇,尤洋提出了“世界模型”的概念来回答。根据他的描述,“世界模型”是一种可以生成任何想要的宣传广告、教育、科学、娱乐甚至物理模拟的工具。但是在尤洋眼中,“世界模型”的基础是视频。就像OpenAI的CEO一样,尤洋非常赞同GPT-1时刻视频大模型的观点。此时此刻,就像那一刻一样,视频模型的价值是“难以想象的巨大”,未来三到五年,培养高质量的视频模型无疑是这个领域最重要的。


这一观点部分来自于尤洋自己对视频的喜爱,但更多的是他所关注的视频足够大的商业想象空间和六晨团队的适应性。用尤洋的原话来形容“我们太适合做了”。究竟有多合适?看看Video 目前Ocean所取得的成就一切都很清楚。美国Snapchat在大型视频模型训练中使用了六晨团队的LAMB优化技术。“Snapchat的成功对我们来说是一个很好的背诵”,可以更快更好的训练视频模型,让团队做Video。 Ocean有很大的优势。


不像剪影等工具,Video Ocean选择了更低层次的突破路径:利用“一句话生成4K电影级画面”的能力,尤洋将其定位为“未来的相机”。首先用相机拍摄原始材料,然后用大模型生成这些材料,然后放入剪影等手机进行加工。通过这条路径,尤洋是Video Ocean的发展有三个阶段:第一阶段,用户群集中在C端个人。第2阶段,用户群是视频/YouTube博主和电子商务博主这样的小B。第3阶段的客户是广告工作室和制片公司这样的大B。


除Video公司外,巨头公司 除了对Ocean技术的肯定之外,客户方面的Video Ocean也获得了不少粉丝。Product在北美 在Hunt列表中,Video Ocean一经发布就取得了前三名的好成绩。但是当V2.0发布的时候,热度甚至比以前更高。我们在采访中了解到,Video Ocean即将迎来一个小小的更新,让我们拭目以待。


纵观中国创业史,新兴产业,A 轮,初期商业化,发布扰动全球的商品,多少有些不可思议。在投资者网络上过去对话的企业家中,没有人与尤洋“相似”。在科技行业细分领域的初期,有相当一部分技术和商品是出类拔萃的。然而,基本上没有那些打扰世界并赚钱的人。


现在,尤洋算一个。


本文来自微信微信官方账号“投资者”,作者:非常高,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com