OpenAI坐不住了,说明中国的大模型之路已经走开——钛媒体官网

02-03 07:45

文 | 字母榜


春节期间国产大模型一轮又一轮的产品更新,终于让 OpenAI 不淡定了。


北京时间 2 月 1 日,OpenAI 加急上线了 o3-mini 新的推理模式,并且首次向上 ChatGPT 免费客户开放。


这波来自国内大模型的竞争压力,甚至再次让一些海外同行担心美国。 AI 竞争力问题。


最近,前 OpenAI 高管、AI 初创巨头 Anthropic 创始人达里奥 · 阿莫迪 ( Dario Amodei ) ,很少发表一篇万字长文。在肯定 DeepSeek-R1 在特定的基准测试中,该模型已经接近美国的顶级水平,阿莫迪认为 DeepSeek 这一突破,更加印证了美国对华芯片出口管制政策的必要性和紧迫性。


而这轮国产 AI 力量中,在 DeepSeek 发布 DeepSeek-R1 模型几乎同时推出,月亮的暗面也推出。 Kimi k1.5 新模型。


以上两种推理模式,全面对标。 OpenAI o1 全版本。在这些版本中,Kimi k1.5 凭借同时支持文本和视觉推理的特点,成为第一个可以比肩的人。 o1 多模态模型的完整版本水平。


虽然 OpenAI 展示了下一阶段大模型的技术演进路线,但是直到 DeepSeek-R1 和 Kimi k1.5 在发布之前,国内一批大型模型厂商还没有推出可对比的比较。 OpenAI o1 模型的完整版本。它们的出现,成为国产大模型攻克 OpenAI 再一次展示了技术黑匣子的实力。


更加重要的是,与之相比 OpenAI o1 无论模型付费使用的限制, DeepSeek-R1,还是 Kimi k1.全部支持用户免费无限调用。


堪比 OpenAI o1 模型性能完整版本,加上免费调用的差异化竞争优势,DeepSeek-R1 和 Kimi k1.5 新模式,成为春节期间国内大模式对比 OpenAI 两把尖刀突然袭击。


借助于春节舞台,完成了一些后来居上的战略调整,已经演变成了中国科技公司的保留节目。


2014 春节前夕,微信首次推出红包功能,未能掀起太多水花。转折点发生在 2015 2008年,借助与春晚合作,消耗资金 5 1亿元推出“摇一摇”红包微信,促使微信红包在除夕夜接收总量超过。 10 亿个,并在 2 支付宝之前的花费在天内完成。 10 一年内完成的工作—— 2 一亿张银行卡绑定。


这次微信红包的反击,后来被马云称为阿里内部对支付宝的“偷袭珍珠港”,并促使阿里在阿里。 2016 还逐步大力赞助春晚,通过“集五福”的方式大放异彩。


如今,被 DeepSeek-R1 和 Kimi k1.5 新型突袭之后 OpenAI,还要调整自己的新产品发布节奏。


即使在国产大模型快速技术迭代和模型性能追求的压力下, OpenAI,这样的突袭恐怕也受不了几次。"我们将开发出更好的模型,但是我们不会像往年那样保持这么大的领先优势。" OpenAI CEO 奥特曼在 o3-mini 在发布后的问答环节中说。


01


DeepSeek-R1 和 Kimi k1.5 新型号一经发布,便在国外用户群中引发热议。


英伟达 AI 科学家 Jim Fan 第一时间发帖总结两种模式的相似性,感觉两者都简化了加强学习框架,同时提高了推理性能和效率,评价了两家公司发表的技术论文,都可以称之为“沉重”的水平。


伯克利人工智能博士,Huggingface 机械学科学家 Nathan Lambert、科技大 V AK 等待也纷纷试用 kimi,也有不少业内人士对这两款来自中国的产品进行了评估。


与 DeepSeek-R1 一样,Kimi k1.5 新型也展示了详细的思考过程。


北京时间 1 月 31 日本,苹果公布了新一季度的财务报告,以此为契机,选择 Kimi k1.5 推理模型,输入提示词“写一篇苹果财务报告分析稿,特别要注意中国市场的变化,以及苹果 AI 何时在国产 iPhone “中上线的情况”。


想了一会儿,Kimi 给出了苹果 2025 财年第一财季的财务报告数据,并特别指出其中大中华区的收入是 185.13 亿美元,同比下降 11%。


除提供网络借鉴外 94 除了网页信息之外,Kimi 也列出了自己的详细思考过程。


如果把大模型当成数学家,在加入推理功能之前,大模型只会写出答案,不会写出思维过程,而是在确认一个新的定律或解决一个新的数学问题之前。然而,随着推理功能的加入,现在大模型可以尽可能完整地呈现出原本只存在于数学家个人头脑中的思维过程。


Kimi k1.5 推理模型的思维过程有点“授人以鱼不如授人以渔”的效果。它被用来引导学生学习,或者帮助程序员编写代码等。,所有这些都有更强的实际用途。大模型从有用到真正好用。


更加重要的是,相比 DeepSeek-R1,Kimi k1.5 还是 OpenAI 除了第一次实现 o1 多模态模型的完整版本水平。


在 Kimi k1.5 在推理模式下,上传了苹果最新一季财务报告的数据图,并给出了“给出图中大中华区的盈利能力和同比变化,分析大中华区的营收比例”的提示。


Kimi 不但阅读了照片中的利润数字,而且通过列出数学公式,精确计算出大中华的利润同比下降。 11%,而且营收比例也是从去年同期开始的。 下降到今年的17% 15%。


在一次采访中,杨植麟解释说,在某种意义上,长文本就是长推理,”“如果我们想要的话 AI 从完成一到两分钟的任务到完成一个长期的任务,这一定是一个很长的任务。 context(前后文),才有可能真正把它放进去。 AI 进一步向下推进。”


在一定程度上,添加图片识别等多模态功能也可以看作是对长文本精度的一种提高。随着未来无损压缩视频多模态的融合,这种提升可能会变得更加强大。


02


关注和培养人才, DeepSeek 可以率先对比月亮的暗面。 OpenAI 最新模型 o1 其中一个共性。


在 DeepSeek 目前约 150 大部分人左右的团队都是一群人。 Top 大学应届毕业生,没有毕业的博四,博五见习生,以及一些只有几年毕业的年轻人。


从 2023 自年初成立以来,月之暗面一直被视为中国大型创业公司中技术人才密度最高的玩家之一。


在 Kimi k1.5 中、月之暗面团队找到了一种提高推理效率的原创技术, Long2Short 高效率的思维链。


在 o1 模型中,OpenAI 通常依赖于逻辑链(Chain-of-Thought,CoT)逐步推导出解决方案,这是一种用时间换取准确答案的方法。


月亮暗面团队开发的 long2short 技术途径,将长思维链(复杂的推理过程)的推理结果“教给”短思维链(简单高效的推理过程),两者结合起来,最终加强对“短模型”的学习和微调,从而实现升级。 token 利用率和训练效率的目的。


在 Short CoT(短文本)模式,Kimi k1.5 能力同样领先 GPT-4o 和 Claude 领先范围高达3.5。 550%。


良好的产品使用体验正在给予 Kimi 带来顾客数量的增加。 SimilarWeb 2024 年 12 月的数据,Kimi 在 web 世界排名前五,仅次于世界前五, ChatGPT、Google Gemini、Claude 和 Microsoft Copilot。


03


在 DeepSeek 和 Kimi 他们的突然袭击,来自 OpenAI 等待对手的新一轮竞争,已经在路上了。


在奥特曼预告中 OpenAI 新模型 o3-mini 即使是新一代的高级语音模型也在紧急上线,为了追求追求而发布。 AGI 在路上走得更快,奥特曼更是联合软银孙正义,开始了 5000 一个亿美元的计算率开发计划。


可以预见,追逐的压力,或许很快就会再次来到国内。 AI 们的头上。


但通过 DeepSeek-R1 和 Kimi k1.5 这种新模式的突然袭击,一个值得关注的新变化是,越来越多的国产大模式正在向公众确认其技术创新能力,甚至不排除有一天会实现。 OpenAI 真正的超越。


最近,Meta 首席 AI 杨立昆,科学家(Yann LeCun)又一次在达沃斯“技术辩论”会议上提醒道,“我认为目前 LLM(大语言模型)范式的生命周期相当短,大约只有三到五年。五年之内,任何一个清醒的人都不会再用它们了,至少不会再用它们了。 AI 系统的核心部分…我们将看到一个新的 AI 结构范式的出现,或许目前还不存在。 AI 这些限制是系统的。"


对实现的任何决心 AGI 对于大模型玩家来说,追求 OpenAI 一切都不是公司成立的初衷和目标,OpenAI 与国产大型模型的差距,正在逐步缩小,这是一个不争的客观现实。


谷歌大脑创始人吴恩达斯坦福大学计算机科学系客座教授(Andrew Ng)最近发表文章指出,DeepSeek 讨论使很多人意识到一些非常明显的重要趋势,其中一个就是中国正在生成。 AI 这个领域正在追赶美国。


2022 年 11 月 ChatGPT 刚刚推出时,美国正在生成式 AI 这个领域远远领先于中国,这个领先差距被业界认为是 2-3 2000年间。但是经过两年的发展,OpenAI 国内大模型的领先优势已经缩小到收缩。 6 个月。


通过 Kimi、DeepSeek “中国公司在视频生成等特定领域表现出强大的创新能力,甚至在视频生成等特定领域取得了局部领先地位。”吴恩达评论道。


国产大型模型在技术上的快速迭代能力,甚至吸引了奥特曼 o3-mini 在问答环节中,也不得不正视道,OpenAI 领先优势不会像往年那么大。


归根结底,大模型所蕴含的无限技术创新空间,为国内大模型玩家提供了无限的机会,创造产品差异化。


更广阔的 AI 创新性的前景,也将孕育出更多国产大模型的惊喜时刻。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com