2024年国内十大模型盘点:行业由虚向实,支付必然趋势
今年8月,根据国家互联网信息办公室发布的数据,国内已有188款人工智能服务通过国家备案,26款人工智能服务已在当地网络信息部门登记。总共有200多个AI大模型出现在网络上,颇具行业一片欣欣向荣的气息。
然而,就像新能源汽车行业的发展一样,大多数技术或资金不足的AI公司最终可能会成为强者的垫脚石。头部企业的产品规划和发展方向通常代表行业趋势,也是小企业的活力。24年来,到底有什么大模型可以代表行业方向?雷科技旗下的智能Pro在本文中进行了一波盘点。
文心一言:国内大型排头兵
在ChatGPT初露辉煌的时候,很多网友曾经说过,通用AI模型和搜索引擎没有什么不同。
的确,当时AI模型给人的感觉就像搜索引擎。作为国内用户数量最多的搜索引擎公司,百度自然感受到了压力。因此,2023年3月16日,百度正式发布了一篇关于AI模型的文章,称其领先于国内AI行业。
经过多次迭代,文心大模型的功能越来越丰富,文心大模型3.5/4.0/4.0相继推出。 Turbo,还有很多版本,比如文心大模型4.0工具版。到目前为止,文心大模型已经支持输入文字、照片、网页、PDF等不同模式的信息,可以导出文字、图片等各种模式的信息。

从文心大模型4.0工具版的命名可以看出,文心大模型正在从“通用性”向“特殊性”迈进。它不再是一个简单的“搜索引擎”,而是一个可以帮助用户提高办公效率的工具。在获得行业头部地位后,文心4.0模型已经收费,只留下文心3.5供用户免费使用。
智谱清言:清华血脉,B/C端同使力
大多数众所周知的AI模型都倾向于C端使用场景,而具有清华大学学术“血脉”的智谱清言则是B端与C端并进的AI模型。目前,智谱清言增加了AI搜索、AI绘图、PPT生成、视频生成、长文档解读、数据分析、视频生成等功能。主页推荐的功能主要是办公场景。
但是,智谱清言的资源无法与腾讯、百度、阿里巴巴、字节跳动等公司相比,开发多种大型模式的压力也不小。与此同时,开拓B端和C端市场,更像是在压力下的突破。根据《中国大模型中标项目监测报告》,今年前三季度智普华章中标了22个大项目,追上了讯飞星火和百度文心,但中标金额仅为2472.3万元。

小雷曾经用智谱清言写文章、视频、照片,感觉还可以,但没有一个能算是第一。没有缺点,很难找到引人注目的优势,这是智谱清言目前面临的问题。
小雷认为,智谱清言应该集中资源和技术,放弃多次竞争,专注于专业场景的B端市场,加强品牌定位。在B端市场取得一定成绩后,我们将开拓难以调整的C端市场。
豆包:全能,强大,真的好用。
就小雷的“旁边统计学”而言,豆包已经成为小雷与同事朋友最常用的AI模型。字节跳动财大气粗,AI的大模型包括即梦、海绵音乐、星画等。,它们面向视频生成、音乐生成、图片生成等诸多领域。只下载一个豆包,就体验不到AI大模型领域字节跳动的全部实力。

然而,豆包在文字和绘图方面的出色表现足以使它成为AI模型的第一梯队。特别是在绘图方面,豆包增加了大多数大型通用模型不支持的照片区域重绘和扩展功能,生成图片的清晰度超过了其他大型AI模型。目前雷科技的很多图片都是豆包AI生成的。此外,豆包的各种功能也在向系统化的场景发展,可以帮助用户做PPT、敲代码。
值得称赞的是,豆包还没有推出会员或充值选项,仍然可以免费使用,并提供丰富的智能设备,甚至包括礼物选择、饮食推荐、好评编写等。
讯飞星火:B端强势,C端上升。
科大讯飞是国内B端市场极其重要的公司,其推出的讯飞星火模式主要应用于医疗、教育、工业、科研等多个领域。10月24日,科大讯飞发布的讯飞星火4.0 Turbo,更有甚者,号称七大核心能力全面超越GPT-4 Turbo。
面向C端市场,讯飞星火模型还支持AI搜索、PPT生成、图像生成、内容写作等功能。它提供各种各样的智能身体,从休闲娱乐到日常事务再到婚姻规划。

一般来说,讯飞星火模型提供的功能主要还是围绕文字信息,图片生成功能不起眼,编程是亮点。文字工作者可以用讯飞星火生成诗歌、口号、小说、视频剧本等信息。B端市场讯飞星火已经占据主导地位,或许将来会使C端发力,推出更多实用、实用的功能。
有道月子:专注于翻译,赢得系统化。
与之前增加专业办公能力的一般大型模型不同,有道推出的月子大型模型致力于翻译场景。据有道首席科学家段亦涛介绍,月子大模型2.0提升了三种能力:口语对话、教育场景中的知识问答和文本编辑,并扩展到更多的学科和学科。
专业场景一直是翻译行业的难题,所以会出现商务英语、计算机英语等学科。子曰模型以翻译功能为核心,可以更智能、更准确地翻译内容。此外,官网显示,在AI模型的加持下,AI写作也增加了,AI PPT、AI口语陪练等功能。

网易有道和百度翻译是小雷最常用的两个翻译软件,但是在体验中,偶尔会遇到专业术语翻译不准确的问题。AI模型可以根据口语习惯进行练习,面对一些模棱两可、不常用的词语,可以提高翻译的准确性。
Kimi:在文字生成领域,真正的王者
月亮的阴暗面不是一个大企业,它拥有的资源比不上百度、阿里巴巴、腾讯、字节跳动,但它开发的Kimi创造了奇迹。11月份苹果平台全球AI 根据APP下载量的数据,Kimi以6%的份额排名第四,另一个进入前五的国产AI应用是豆包。在中国市场,Kimi以760万周的浏览量排名第一,在新榜发布的AI产品周榜中。
严格来说,Kimi的功能并不丰富,重点是文字内容和思维导图,甚至没有其他AI模型标准的文字图片功能。然而,Kimi的免费策略、强大的文档分析能力和多语言对话能力已经成为许多文字工作者首选的AI模型。

小雷经常使用Kimi搜索信息,解读文档,检查文章中的错别字。Kimi爆炸生成器的功能让小雷有了通过AI模型写出过去构思的小说内容的冲动。
Kimi的爆红证实,AI大模型功能的丰富程度并不与用户数量成正相关,打磨几个功能可能更为重要。近日,视觉思维模型k1在月亮的暗面上推出,加强了Kimi的数学、物理、化学基础科学思维能力,能够呈现出完整的思维步骤,将来可能成为学生学习的利器。
快手可灵:让大型视频模型不再是期货
Sora发布后,无数网友讽刺中国互联网科技公司没有创新,无法创造出堪比Sora的产品。然而,仅仅四个月后,随着Sora仍然处于PPT状态,国内短视频平台Aautora的AI团队就创造了一个视频生成的大模型。
经过小雷的实际体验,可灵在国内视频生成大模型中排名第一,是第一有力的竞争对手。除了文化视频,可灵还增加了图片视频功能,可以选择不想呈现的内容。

除生成视频外,可灵还支持文生图片和AI试衣功能,其中AI试衣就是用户上传衣服和模特,生成模特穿衣服的图片。假如需要在网上购买衣服,可以考虑使用可灵来检查衣服是否合身。下一步,可灵还将推出视频编辑功能,帮助用户创建视频。
影片生成大模型是否成熟,关系到AI大模型是否能够理解现实世界,其重要性可能高于其他通用大模型。可灵、即梦、Vidu等视频模型的出现,让我们看到了AI理解世界的可能性,帮助我们展示创造力。
华为盘古:B端专业情景
虽然以B端为主要业务方向,但讯飞星火、智谱清言等大型模型也为C端用户提供了大量功能。华为开发的盘古模型完全面向B端,应用范围如其名,包括交通、工业、建筑、媒体、气候、药业等诸多领域。
盘古大模型支持不同规模、不同规模、不同规模、不同规模的10亿至1万亿参数,可以帮助企业推理各种复杂的任务。盘古大模型虽然不是针对C端产品,但它带来的效率提高可以影响我们生活的方方面面。

一般大型模型容易被数据污染,再加上其黑盒训练模式,日常使用中查询到的一些数据也可能需要校对。特殊的大型模型,尤其是面向工业领域的产品,可以防止数据污染。盘古大模型的名气可能不如很多大语言模型,但价值毋庸置疑。
通义千问:低调的扫地僧
阿里巴巴推出的AI模型通义千问作为与字节跳动、百度、腾讯并列的互联网巨头,似乎有点低调,只有专门用来敲代码的通义灵码。小雷见过营销广告,和程序员朋友分享。
虽然口碑不明显,但通义千问非常好用。它支持的功能与同类产品相似。它提供了许多与生活、工作、绘图和工作场所相关的智能设备,也支持扩展图纸的功能。需要注意的是,通义灵码可以付费解锁高级功能,而通义千问可以免费提供服务。
目前,通义千问的声誉并不明显。毕竟它的存在价值更多的是为阿里云智能业务的爆炸式增长——AI计算能力需求服务,这是阿里必须抓住的机会。正因为如此,阿里也投资了中国AI模型的大部分创业生态。
腾讯元宝:商品刚刚起步,突出巨头的意志。
与之前的大模型相比,腾讯元宝的功能特点没有太大区别,但是提供的智能体比较少,整个界面看起来有点简单。值得一提的是,腾讯元宝提供的智能体主要以影视作品中的人物为原型,包括李承乾、范闲、海棠等。,支持聊天对话功能,继承腾讯擅长的社交基因。

此外,腾讯元宝还增加了最新的混合元文视频模型,可以根据客户描述生成视频。小雷之前感觉到了这个大模型,现在和可灵、即梦、Vidu等产品有明显的差距。
对腾讯来说,大模式暂时落后并不是什么大问题。拥有强大财力的腾讯,可以充分发挥自己的情景优势,也可以收购其他AI企业来壮大自己的实力。参照新能源汽车行业的发展历程,未来几年国内肯定会有大量的AI公司倒闭,包括一定实力的公司和技术人员。通过收购,腾讯可以快速提升其AI团队的实力。
总结:大模型由虚向实,全面收费必然是必然的。
在国内AI行业的起步阶段,我们能接触到的相关应用主要是聊天娱乐,有些产品还打出了“电子伴侣”的口号。这是因为当时国内AI企业技术实力不足,对行业发展方向没有明确的认识。经过长时间的探索,AI公司逐渐找到了前进的方向。
从这些头部企业的行动来看,AI模型的主要发展方向是能够分析和解读文档、照片、视频、音频等模态文档,输出我们需要的模态数据的智能体,而不是“聊天机器人”或“搜索引擎替代品”。
头部企业仍在创造一个系统的使用场景,例如帮助用户生成PPT、制作视频和音频,编写代码等等。如果没有专业的智能体,仅仅依靠原有的问答、搜索等功能,很难把因为好奇和兴趣而感受到AI模型的用户转化为付费用户。
虽然现阶段可以免费使用的AI模型很多,但是支付恐怕已经被头部企业提上日程了。在以上十款AI模型中,文心一言、智谱清言、有道月子、可灵等。已经提供了付费服务,其中文心大模型提供网页付费版和全端付费版。其他AI模型暂时处于内部测试或首次测试状态,官方版本也可能要求用户付费。
在未列出的AI模型中,面向专业场景的产品,如即梦、百应、百应、WPS AI等,都需要付费使用。AI模型的实践和推理需要花费大量的成本,不可能一直免费为用户提供服务。付费使用终究会到来,无非是早一天晚一天。
一般来说,经过一年多的探索,国内AI公司已经基本明确了发展方向,专业使用场景将继续布局。我们接触到更多的大语言模型,我们会融入更多的功能,最终被创建成一个全能的大模型。AI型号越来越实用,同时可以免费提供给我们使用的功能也越来越少,付费使用的时代即将到来。
最让小雷失望的是,这些AI模型仍然在云端完成推理任务。与很多网友关心的隐私问题不同,小雷期待着当地的大型模型,他关注的是降低云计算能力的需求,将推理成本转移到当地,降低大型AI模型的价格。但是,考虑到控制、破解等问题,恐怕AI公司在未来很长一段时间内都不会愿意在PC端推出本地大语言模型。

这篇文章来自“雷科技”,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




