超越ChatGPT的DeepSeek登上了苹果美国区免费APP下载排行榜榜首。

2025-01-28

一月二十七日,Deepseek应用登上苹果中国区域和美国区域应用商城免费APP下载榜首,在美区下载榜上超越了ChatGPT。


美国苹果区应用商城


苹果APP 中国区Store免费榜单


Deepseek来自国内大型模型公司的深度追求,是一家量化巨头幻方量化的大型模型公司。一月二十日,该公司正式发布推理大型模型DeepSeek-R1。一经推出,DeepSeek-R1便以其“物美价廉”的特点,在国外开发者社区中引起了震惊。


R1作为一个开源模型,在数学、代码、自然语言推理等任务中的性能可以与OpenAI相提并论。 正式版本的o1模型,并采用MIT许可协议,支持免费商业化、随意修改和衍化开发等。现在,Chatbotbot在国外大型模型排行榜上。 Arena上,DeepSeek-R1的基准测试排名已经上升到整个类别的第三大模型,最新版本的OpenAIChatGPT-4o并排,并且在风格控制模型中。(StyleCtrl)o1模型在分类中与OpenAI并列第一。


更加令市场惊讶的是,根据DeepSeek的说法,R1的预训练费只有557.6万美元,在2048英伟达H800美元。 GPU(对于中国市场的低配版GPU)集群运行55天,仅为OpenAI。 GPT-4o模型训练费用不到十分之一。根据DeepSeek的说法,R1在后训练阶段大规模使用了强化学习技术,在很少标注数据的情况下,大大提高了模型推理能力。另外,DeepSeek不仅将R1训练技术全部公开,而且将6个小模型蒸馏到社区开源,用户可以借此训练其它模型。


Jim英伟达高级研究科学家 Fan说,DeepSeek-R1可能是“OSS(开源软件)项目第一个展示RL(强化学习)飞轮可以发挥作用并带来持续增长的项目”。在这些过程中,“飞轮”被用来描述AI系统中的自我强化和正向循环。根据DeepSeek的论文,与过去的AI模型不同,它通常依赖于监管微调。(SFT,指AI模型通过标注的数据进行训练),R1全部由强化学习驱动,证明直接强化学习是合理的。


Jim Fan写道:“我们正处于一个奇怪的时间线上。一家非美国公司正在实践OpenAI的最初使命,即实现真正开放的前沿研究,让每个人都受益。这种情况简直不可理解。最娱乐的结果是最有可能的结果。”


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com