还可以免费翻转GPT-4,Meta打了所有闭源大厂的脸。

2024-04-27

不知李彦宏现在的心情如何。


正当他明确表示“开源模型会越来越落后”的时候。 3 天后,活菩萨小扎慢慢地出现了。


一点也不给面子,用自己的力量掀翻了桌子。


近日, Meta 全新的正式发布 Llama 3 模型,又一次上新了 8B 和 70B 两个参数版本。


其训练数据集比 Llama 2 整整大了 7 倍,达到了 15T ,支持能力也是上一代的两倍, 8K 前后文长度。


现在,他们已经接入了 Meta 最近发布的智能助手 Meta AI 中,每个人都可以免费使用。


两种模式同样全面开源,开发者可免费下载,并用于商业用途。 (但需要注意的是,如果MAU超过7亿,则需要申请特殊商业许可证)


小扎这是誓死要在开源这条路上,一条路走向黑暗。


当然更加爆裂的是 Llama 3 除了稳居开源大模型第一外,其实力还可以在一定程度上,薄纱 Gemini Pro 1.5 、 Claude 3 Sonnet 等待位于第一梯队的闭源大模型。


一些网民更新了一个当前大模型能力与参数对应的表格,可以看到 Llama 3 这两个模型的表现都很亮眼。


这样,就算是大模型的开源派大涨了一波斗志。


总而言之,消息一出来,开源社区立刻沸腾起来,各种梗图满天飞,谢谢小扎又带着兄弟们冲了一次。


然而,世超认为既然模型已经上线,看到再多的技术细节和跑分数据,都不如我们自己去尝试。


有点遗憾的是,目前传出的这两个版本,还没有办法支持中文导出。


暂时只有两个简单的功能:文字对话和绘图。如今,每个家庭的多模式都被抛光了。 OUT 了。


但幸运的是,这次 Meta 图片导出,有一个非常新颖的功能。我们在聊天框中输入文字,不需要发送, Llama 3 然后根据内容即时生成图像。


例如,我在对话框中输入了几次【一只猫在睡觉、跳舞、跳舞】,我可以看到屏幕上产生的图片内容正在立即改变。


在文字导出这里,惊喜度并不高。


因为它在测试中,说自己在编程、多选题等方面,都赶上了 Claude 3 中型版本,我们也重点测量了这方面的虚实。


世超测试了很多问题,这里也只释放了两边不同的区域。


比如简单的逻辑判断:我今天有 3 一个苹果,昨天吃了一个,今天还剩多少?


Llama 3 完全没有压力,容易控制。


但是把同样的问题抛给 Claude 3 ,但是完全绕进去了。



然而,后边世超后面简单地测量了几个代码能力,相反, Claude 3 这种表现更令人惊叹。


世超要求 Llama 3 给我做两件简单的事 html 游戏。


因此,贪吃蛇和玩砖游戏都无法正常工作。在游戏开始之前,显示 Game Over 了。


但 Claude 3 这儿做的,虽然有点小瑕疵,但是游戏重新开始后,结果就不会刷新了。但是除此之外,都很完美,游戏可以正常运行。


而且生成速度很快,几秒钟就能完成。上次看到这个速度,还是 GPT-4 。


而且在后来的开题中, Llama 3 然后立刻扳回了一座城市。


世超给出了一个开放的问题:类人机器人的未来会是什么样子?


几个字的小问题, Llama 3 根据短期、中期和长期,分三个阶段构思概率。


由于篇幅有限,这里只截取了短期。


Claude 3 这儿有点平淡无奇,与上面分时、分点列举的优等生相比,逊色不少。


经过整体测试,Llama 3 和闭源的 Claude 3 基本上打得有来有回,甚至在某些方面小胜。


但是如果只能达到这种程度, Meta 这次更新根本无法在圈内掀起如此大的风暴。


这两种模式并不重要,真正的牛叉区域,是网站上提到的一条信息:400B 参数级的 Llama 3 正在进行训练准备。


根据纸面上的各种数据,它在各个方面都是可怕的。


Llama 商品副总裁 Ragavan Srinivasan 根据一次采访,当前版本可以与同类一流的专业模式相媲美。


不但达到了可比性,许多功能性能更强, Claude 3 超大杯版本和 GPT-4 。


虽然 Meta 感觉还要评估一下安全性,再决定开不开源,但是消息一出,行业早就开始狂欢了。


因为开源社区的人,或许不用等OpenAI拾起初衷,就可以到GPT-4级模型进行调试、魔改。


英伟达科学家直接发文称,400B小扎 模型,将是这个行业有一个分界点,这将改变许多企业和研究的未来。


前百度首席科学家、谷歌大脑鼻祖吴恩达也表示,这次Meta更新的是他。到目前为止,我收到了最好的生日礼物。


显而易见, Llama 3 给行业带来的震撼。


目前,这个 400B 最终版本有望在夏天发布。


OpenAI不再使力,Llama 3 以开源大模型为代表,完全超车闭源大模型的历史时刻,也许真的要来了。


而早在 Llama 3 在发布之前,大模型是开源牛还是闭源好的问题,其实早就吵得不可开交了。


两边的阵营都不缺大佬,李彦宏所说的“开源模式会越来越落后”,世超觉得逻辑上很自洽。


因为闭源企业有成熟的商业模式,更多的资金和人力投入到研究中,他们努力研发的成果也可以得到保护。简而言之,如果你能赚钱,你就能收集结算率和人才。


另一方面,很多开源模式,不仅商业模式还在探索中,有些还是小规模零散的商品。


月亮暗面的杨植麟也发表了类似的观点,说大部分都是基于开源大模型的应用。没有大计算能力的验证,很难说他们未来的性能稳定性和可扩展性。


而且支持开源的这一派,世超也觉得不是没有道理。朱啸虎曾表达过一种观点,目前闭源确实领先于开源,但是开源模型最终会赶上。


“OpenAI 就一两百名工程师而言,全球数百万、数千万的开源工程师都在使用,怎么可能一直比非开源落后?”


开源社区用了一年时间,超过了 GPT-3.5 ,现在已经到了 GPT-4 水准。现在 Llama 3 等待模型的大力赶超,正在不断地验证这个句子。


几年前,比尔盖茨公开吐槽。 Linux 系统化。感觉从商业角度来看,它根本不可行,既不能保护自己的知识产权,又不能赚取利润从事研发,最多是个半吊子


乔布斯也在《乔布斯传》中提到,乔布斯也怒不可遏,隔壁安卓就是这样。 shit ,感觉它的开源给它带来了各种各样的麻烦。


最后两个超级大佬都被打脸了。。。甚至在比尔盖茨之后,公开承认微软在偷学。 Linux ,而且安卓一点也不比 iOS 差。


而且世超认为,很有可能大模型的开源闭源之间,根本不是你死我活,不是谁强谁就一定弱。


例如谷歌,基本上是双手抓,既有闭源的。 Gemini ,也有开源的 Gemma 。曾经靠开源出圈 Mistral 拿到微软投资之后,它的 Mistral Large 就不再对外开源了。


所以开源和闭源很可能只是路线的不同,哪有对错,只有是否合适。


而且唯一可以肯定的是,无论你是开源还是闭源,烧钱都逃不掉,不管是开源还是闭源, OpenAI 后面的微软,还是 Llama 背后的 Meta ,亦或是国内 BAT ,大型战场仍然是这群顶级资本之间的斗争。


让我们搬好小板凳,磕着瓜子继续吃瓜。


图片,资料来源

X、Meta AI、Claude 3、Huggingchat


Meta:Introducing Meta Llama 3: The most capable openly available LLM to date、Meet Your New Assistant: Meta AI, Built With Llama 3


The Verge:Meta’s battle with ChatGPT begins now


腾讯新闻《潜望》:朱啸虎讲述了一个中国现实主义AIGC故事


As Meta debuts its Llama 3 model, today’s generative AI landscape is a different animal


本文来自微信微信官方账号“差评”(ID:作者:四大,编辑:江江&面线,36氪经授权发布,chaping321。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com