DeepSeek的测试来了!AI教母李飞飞用不到50美元训练新模型

02-10 07:34

快科技 2 月 7 日新月异,在科学技术日新月异的今天,人类可以说生活在一个逐渐被人工智能颠覆的世界里。据媒体报道,最近," AI 教母"李飞飞的队伍没有达到 50 一位名叫美金的云计算费用训练 s1 人工智能推理模型。


据了解,s1 模型在在数学和编码能力测试中的表现与OpenAI 的 o1DeepSeek 的 R1类似于尖端推理模型。李飞飞团队的研究人员说,s1 是通过蒸馏法谷歌推理模型 Gemini 2.0 Flash Thinking Experimental精炼出来的。


这个消息让美国科技界大吃一惊,因为 DeepSeek 春节前,团队将 OpenAI 练习费用打到了三十分之一。但是仅仅过了不到一个月,现在李飞飞队又用了。不到 50 美金训练出媲美 SeekR11Deep 的 AI 推理模型,人工智能领域可以算是越来越卷!


团队由李飞飞组成 Gemini 蒸馏出媲美 DeepSeek R1 模型代表,科研人员利用蒸馏技术,成功地从 Gemini 在模型中获取或“蒸馏”知识,并利用这些知识对新模型进行训练,这一新模型可以在性能上与之匹配。 DeepSeek R1 模型堪比。


具体来说,蒸馏技术是一种模型压缩和优化方法,它涉及一个小而简单的模型(通常称为“教师模型”)的学习过程(通常称为“学生模型”)的大而复杂的模型。


教师模型一般具有较高的准确性和复杂性,学生模型更轻,更容易部署和使用。。在保持较高性能的同时,通过蒸馏技术,学生模型可以继承教师模型知识,从而减少计算资源的消耗。


值得注意的是,这项技术并不局限于 Gemini 和 DeepSeek R1 它们之间的蒸馏,也可用于其它 AI 优化和压缩模型。另外,蒸馏技术还可以帮助处理实际应用中深度学习模型所面临的计算资源和延迟问题,使这些模型能够在资源有限的环境中表现出色。


公开资料显示,李飞飞是华裔科学家,被称作" AI 教母",在人工智能领域享有盛誉。于于1976 年出生,16 岁随父母移民美国,以优异的学术能力进入美国普林斯顿大学,并最终获得从人工智能和计算神经科学的角度来看,加州大学博士学位


最著名的成就是创建世界上最大的图像识别数据库。ImageNet,包括21800 个类别和超出1400 万张图像,为计算机视觉领域的发展奠定了基础。现在她是斯坦福大学的终身教授,曾经担任谷歌云首席科学家。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com