世界范围内3.5亿下载量突破纪录,Llama家族暴涨10倍,开源王国掀起AI革命

2024-08-31

Llama家族诞生一年半后,早已稳居开源界头。根据最新报告,Llama的全球下载量接近3.5亿,是去年同期的10倍。而且模型开源让大家最深刻的认识是,token的价格一次又一次的下跌。



Llama一举成为世界开源的领头羊。


到目前为止,开源平台HuggingFace下载Llama模型的数量已经接近3.5亿。


Groq的创始人说,这也太疯狂了,想想Linux要多久才能达到这个数字?


官方博客介绍,这个数字,是去年同期的10倍。而且,仅在上个月,模型下载量就超过了2000万次。



2023年2月,Llama 第一次亮相,经过多次迭代,至今已有整整18个月。


而且,在仅仅一年半的时间里,Llama已经从最先进的单一基本模型发展成为一个面向开发者的强大生态系统。


LeCun还没有忘记宣传自己的模型。越来越多的大企业、小企业、创业公司、政府和非营利组织正在基于此开发新的产品和服务。


此外,大学机构、研究人员和工程师每天都在改进Llama,并提出新的例子。



另外,值得注意的是,从今年5月开始,Llama 3.1发布后,云服务提供商将模型API token调用需求,翻了一番多。


从2024年1月到7月,一些Meta最大的云服务提供商,Llama的月度token数量增加了10倍。


从微软云、英伟达、谷歌云等科技巨头,到Groq、像Databricks这样的创业公司,都支持使用Llama模型。


老黄称,「Llama对最先进AI的进步有着深刻的影响。」。


可以看出,Llama正在推动开源之光。


开源Llama,降低token价格战


GPT-4级模型开源,首先带来的收益是,token的价格持续下降。



在DeepLearning的博客中,AI大神吴恩达算了一笔账:


近日,OpenAI正式宣布降价后,GPT-4otoken的费用,现在是每百万token4美元。(假设输入率为80%,输入率为20%)


记住,2023年3月GPT-4首发时,每百万token的费用是36美元。


博客地址:https://www.deeplearning.ai/the-batch/issue-264/


17个月的价格相当于每年下跌79%(4/36) = (1 - p)^{17/12})。


如你所见,token的价格正在迅速下降!


而且推动token价格持续下跌的一个因素,就是开源模型(例如Llamama 发布3.1。


因为API提供商(例如Anyscale)、Fireworks、Together AI创业公司和一些大型云服务提供商不需要担心赚回开发模型所需的成本,所以他们可以直接在价格、速度等其他因素上开始竞争。


另外,一些芯片公司Groq(token领导者的快速生成)、Samba Nova(能以114 tokenLlamamam/s速度运行 3.1 405B)、Cerebras(以1800 tokenLlamamam/s速度运行 3.1 8B),以及英伟达,AMD、在硬件创新方面,英特尔、高通等半导体巨头,最近进一步降低了模型价格。


Groq发布了一份文件,现在支持Llama模型生态。


「到目前为止,Groq已经使用了Llama模型套件和自己的LPU Inference,每天为40多万开发人员提供50亿免费token」。



吴恩达发现,根据未来的技术发展方向,设计是非常有用的,而非局限于当前的水平。


基于很多软硬件企业的技术路线(改进半导体、小模型、推理架构中的算法创新),可以预见,token的价格将继续下降。


这意味着,即使你建造的智能体工作流看起来成本太高,而且随着token价格的持续下降,也许在某个时候,这个计划在未来会变得经济可行。


假定你创建了一个帮助人类的APP,每秒可以连续导出100个token。那么,如果数百万的token 4美元,每小时只花费1.44美元。


它远远低于美国和许多其他国家的最低工资标准。


Meta挑战ChatGPT获得数百万客户


小扎希望,到今年年底,让Meta 超越OpenAI的ChatGPT,AI成为全球使用量最大的AI助手。


现在,这一切都朝着他的目标前进。


根据内部两名员工的说法,八月初,Meta AI(2023年9月发布)在发布不到一年的时间里,每月至少有4亿活跃用户和4000万日活跃用户。


这一数字从侧面反映出,超过30亿用户的Meta每天都要使用Meta旗下的AI助手。


另外还包括,通过Meta Ray-Ban智能眼镜是AI专属网站,也获得了不少客户。


庞大的用户群,成为大型科技公司的优势,希望从ChatGPT中获得部分市场份额和关注。


事实上,谷歌还向数十亿客户推广了对话AI。——Gemini,但是实力不如Meta。


但是有些使用Meta应用程序的人,在Facebook、Reddit、X上,抱怨Meta过于激进地推广AI助手,比如在APP键盘上添加搜索按钮。


有的人还有一个关闭Meta的人。 AI对话教程。


Meta员工基于对客户参与的焦虑,可能会时不时地讨论Meta员工是否有用户无意中使用了Meta。 AI。


八月初使用数据显示,每月活跃用户约10%,每天使用助手来回答问题,生成图像并执行其它任务。


而且这个比例远远低于Meta的其它应用。


Meta早些时候报告说,80%的月活跃用户每天都要使用自己的应用程序。


这些数字描述,Meta AI已成为ChatGPT的强大竞争者之一。


ChatGPT于2022年11月首次推出。到目前为止,每周有超过2亿人使用。根据最近的使用数据,Meta 人工智能可能相距不远。


与Meta 与AI不同,ChatGPT也是一种盈利的商业模式。


数百万顾客每个月需要支付20美元,成为ChatGPT Plus用户,可以使用最先进的模型编写、编程、回答问题的能力。


资料表明,ChatGPT订阅收入每年约为20亿美元。


今年,Meta在数据中心和其他基础设施上投资了400亿美元。


而Meta AI被认为是未来公司获得这些巨额投资收益的关键部分,主要用于Llama背后的大型开发产品。


尽管有报道称,Meta正在推出一位付费版的高级人工智能助手。


去年九月,当Meta刚刚推出AI助手时,每个人都只能依靠Instagram。、Metaapp或Messenger上的直接消息和Metaapp AI聊天。


Meta今年开始应用于各种应用程序, 让它更显眼,更容易浏览。


四月份,他们将Meta 将AI添加到其应用程序的搜索框和信息流中,并推出独立网站meta.ai。



同月,Meta还推出了一款可以识别和分析图像的新版AI助手,并广泛应用于Ray-Ban智能眼镜。


目前,Meta的应用程序中有8种语言可供助手使用,并在22个国家提供,英文版也提供给美国和加拿大的智能眼镜。


开源AI如火如荼


开源AI技术发展迅速,推动了生成式AI的重大创新。GitHub和Hugginginging Face和其他可访问的研究平台,社区已经启动了获得突破性成果的项目。


生态系统:稳步增长,走出泡沫化底谷期。(Trough of Disillusionment)

从2023年第一季度的柔和增长到现在,开发者的兴趣已经增加并趋于稳定,进入「光明期稳步攀爬」(Slope of Enlightenment)——这里增加了价值驱动的创新。


在2024年,严肃的开发者(即GitHub推动者)仍在增加开源AI。



市场分析:开发工具仍然很受欢迎,实践和监督势头正在蓬勃发展。

- 开源AI商品初创企业数量显著增加。


2024年,参与开源AI的参与者数量激增,Neum等新参与者数量激增。 AI和Patronus AI已经进入这个领域,就像Vian一样。 像AI这样的老参与者也为他们的用户提供开源工具包。


- 开发工具仍然很受欢迎;培训和监控工具的竞争加剧


大多数初创企业仍然致力于生成AI的开发工具,这对构建、部署和管理应用尤为重要。


然而,围绕模型培训和指导用例的创业公司活动有所增加,这表明模型的微调和AI治理可能会在小众数据中发生变化。


在开源模型领域,领导者开始出现,开发的新模型很少,更多的重点是来自Mistral和Meta的改进和更有效的版本。


- 开源开发与闭源解决方案的差距正在缩小。


开源促进了研究更具成本效率和可访问性,促进了多元创作者的创新,法律限制更少。据统计,41%的企业客户倾向于选择开源来满足生成AI的需求。


融资环境:融资速度加快,规模较大,后期交易增加。

在过去的几年里,开源AI已经完成了60多笔交易,总融资额超过130亿美元。超过45%的融资属于A轮及以上,说明对增长阶段的投资非常重视。


- Deci 英伟达以3亿美元收购了AI


- Scale F轮融资完成了10亿美元


- Mistral B轮融资完成6.4亿美元


- Together AI完成了A轮融资1.06亿美元


模型训练和开发工具是开源AI领域资金最多的细分领域(不包括Mistral和Databricks),约占融资的60%。


在这些交易中,英伟达参与了8笔交易(包括Scale AI、Mistral AI、Together AI)。


基本模型:性能差距缩小

现在,开源和闭源模型之间的标准差距比以往任何时候都要小——Meta 在MMLU上,Llama和Mistral的表现几乎和GPT-4o一样。


Qwen和Yi等其它开源模型也在性能上迅速赶上。


为解决当前评估(例如Elo和MMLU)的局限性,Hugging 2024年6月,Face正式推出开源LLM排名榜,致力于复杂任务。——Open-LLM-Leaderboard。


近6个月来,随着新竞争对手的出现,开源AI的状况发生了显著变化。


Qwen经过大量的数据预训练,于2024年6月在Huggingface 在Traction上,下载量最高。



Github:Huggingface、MindsDB和Roboflow非常受欢迎

GitHubstars是项目在GitHub上流行的直接指标。


在2023年,AutoGPT和ModularML的Mojo引领了GitHub热度——从那以后,许多仓库都取得了显著的进展。


基于PyTorch的真实世界机器人模型、数据工具等,LeRobot旨在使机器人技术更容易浏览。它拥有最先进的模仿学习和强化学习方法,提供预训练模型、人类收集的数据集和模拟环境。


MindsDB是一个利用企业数据构建AI模型平台的MindsDB。MindsDB简化了数据库与AI/ML工具的连接,并通过自动化工作流程创建定制的AI系统。


参考资料

https://ai.meta.com/blog/llama-usage-doubled-may-through-july-2024/?utm_source=twitter&utm_medium=organic_social&utm_content=image&utm_campaign=llama


https://x.com/ylecun/status/1829233754876834298


https://www.theinformation.com/articles/metas-ai-assistant-wins-millions-of-users-in-challenge-to-chatgpt?rc=epv9gi


https://synaptic.com/resources/open-source-ai-2024/


本文来自微信微信官方账号“新智元”,作者:桃子 好困,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com