一毛钱写两本红楼梦,智谱AI再次降价,为30万企业客户服务。

2024-06-09

作者 | 王沁


编辑 | 邓咏仪


五月份刚刚大幅降价的智谱AI,这个月又给用户全面上新。


六月五日,智谱AI Open Day正式举行。智谱AI在现场发布了GLM-4系列、新API模型的全新开源模型,MaaS 2.0模型开放平台,智能体等商品。


五月份的大模型“大促月”还没有结束,智谱也再次跟进降价。


例如,GLM-4-Flash轻量化版,在公司优惠价下,最低只需6分钱/100万token。这意味着四大名字,比如《红楼梦》,不到一毛钱就能写两遍。


但是在公司V3版本的价格下,用CogView-3文生图模型生成一张图片只需6分钱。


智谱AI还公布了过去一年的商品商业化进展:


目前,智谱AI的开放平台已经为30万企业级客户服务,平均每天调用量达到400亿token。在过去的六个月里,API的日消费量增加了50多倍。


To是智谱AI旗下的 目前,超过30万只智能体活跃在清言的智能体中心,包括思维导图、文档助手、行程安排等多种生产力工具。c商品智谱清言App。


新版MaaS大模型开放平台,价格体系更细分,让企业客户有很多套餐可供选择。客户可以用自己的数据安排私人模型,无需代码,三步微调。


开源90亿参数模型,API价格新低

值得注意的是,这次智谱开源了90亿参数GLM-4-9B。 与模型相比,模型的综合能力 提高ChatGLM3-6B 40% ,全面超出 Llama-3-8B-Instruct。


而且比较训练量更大 Llama-3-8B 模型,GLM-4-49B在英语方面略有领先,中文学科技能提升 50%。


前后文窗口,也从 128K 扩展到了 1M token。这意味着模型可以同时处理 200 一万字的输入,大概相当于 2 本红楼梦或者 125 文章的长度。


GLM-4-9B模型也有自己调用外部工具的能力,也就是Alll。 Tools能力,可调用外部工具(如代码执行、网络浏览、绘图、文件操作、数据库、API 调用等)帮助回答问题或实现目标。


就模型规模而言,GLM-4-9B可以算是一个适合很多应用落地场景的小尺寸。智谱还表示,在开源模型中,智谱并没有盲目追求扩大模型参数。


“在模型规模方面,我们认为显存对于个人用户和开发者来说更有价值。因此,我们没有使用混合专家结构来改变特性,而是将模型规模稍微扩大到9B,并以实际计算量追求性能。”智谱AI的技术团队说。


小模型(10B)在模型落地上 以下轻量化模型)在应用落地方面具有独特的优势——参数小、内存少、响应速度快、易于在终端运行。大型训练模型需要大量的计算资源和数据,而小型模型需要更少的数据,具体的应用领域,更容易商业化。


现在,各大厂商都推出了微软SLM(小语言模型)等小模型系列产品。Phi-3系列,苹果的“小模型”家族,谷歌的Gemma等等。


MaaS平台,增加但降低价格

另外,智谱MaaS大模型开放平台也发布了2.0版本。相比之下,今年1月智谱Dev Day强调GLM-4在对话、代码、照片理解、文生图等方面的硬核能力,强调GLM-4在对话、代码、照片理解、文生图等方面的硬核能力,称GLM-4的英语能力达到GPT-4的90%,在中文表现上超越对方。


而且新一代MaaS平台支持的一系列新型号更加注重商业应用,让企业根据不同的需要有多种套餐可供选择,多样化选择:


GLM-4性能最强,但也是最昂贵的(100元/100万token)


GLM-4-Air性能堪比更大的模型。 GLM-4-0116、但是性价比更高,GLM-4-Flash价格最优惠(0.1元/100万token)


而且CogView-3文生图模型一张图片只要一毛钱。


该模型有套餐,公司VIP卡也推出了各种分级套餐。现在,MaaS平台的智谱有9折V0。、8折V1、7折V2、企业服务体系6折V3。举例来说,在V3价格下,GLM-4-Flash下100万token只需6分钱,CogView-3生成一张图6分钱,主要量大便宜。


智谱MaaS大模型平台根据企业用户的数据安全和私有化模型的需求,在开始训练数据、建立微调任务、部署微调模型三个步骤后,就可以完成私有化模型训练。


智能体上线,可以做更多的任务。

AI圈热议的“智能体”(Agent),现在与大型模型的结合,也越来越紧密。


现在,清言App推出的多智能体合作系统“清流”,可以在同一对话框中自由调用多种不同的智能体协调工作。


清言可调用多种不同的智能体,如思维导图、流程图、数据分析等,同时接入微博、飞书、日历等渠道工具。


智谱AI举了许多有趣的例子。


一个9岁的小男孩,与智谱清言合作,描写了一部关于火星生存的科幻小说。


他首先问质谱清理,如何在火星上生存?智谱清理给出了氧气、水、食物、能源等关键的生存因素,然后建立了整本书的框架。


将文本添加到用户与质谱清言的对话周期中,智谱清言还会查询科学数据来检测小说内容,修改文本错误。


智谱AI Open 在现场,Day还展示了一个“赛博IP”——罗永浩智能体。


AI智能体员工“AI老罗”


它有着和罗永浩一样广泛的知识面和幽默的演讲风格,24小时工作,充分发挥老本行的特点。现场有一张罗永浩风格的直播推广,是一套“奇葩”挖掘机造型的房屋平面图:“想象一下,你要在挖掘机的房子里有多酷,你每天都能感受到项目的力量和魅力。...这款挖掘机房型将每一个空间都挖得恰到好处,与那些几百平米的豪宅不同,它们看起来很大气,但实际上它们是空的,非常冷清。”


挖掘机房型号“AI老罗”解释


按照36氪的试用,现在清言APP的智能体中心,已有多种对话场景。


比如在催生人工智能革命的达特矛斯大会上,你可以和信息论始祖香农对话,和莫言、余华在作家聊天群中对话,通过对话在“无限流继写”中编织小说,问“专业选择导师”智能体如何选择高考专业。



智谱清言聊天界面


大型模型降价已成为一种趋势,如今许多大型模型的超小型模型价格接近免费,这将持续多久?政府服务公司华信永道副总经理吴文表示,企业客户关心价格,但他们不是最关心价格的。最重要的是帮助企业提高利润率。只要能帮企业增加收入,即使贵,公司也愿意用。而且爱设计CEO赵充在会上表示,降价的底线是电费,只要比电费高,还有盈利空间。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com