从WAIC2024看人工智能的三大趋势:智能体、具体智能、算率飓风

在短短的10天内,上海连续举办了两次全球重要展览——世界移动通信大会(MWCS2024)和世界人工智能大会(WAIC2024),AI在魔都掀起了一场科技“风暴”,无论是倾盆大雨还是烈日下。
冯·诺伊曼说:“技术的不断进步将在人类历史上引起一个关键的奇点。”从2018年第一届世界人工智能大会的黎明,到第七届WAIC的召开,我们已经站在了奇点的门槛上,比以往任何时候都更符合改写历史的瞬间。
透过WAIC2024镜头,我们可以清楚地看到AI的三大趋势。
趋势一:“百模对决”第二幕,大模型应用第一年开卷AI。 Agent
与一年前的WAIC相比,今年的“百模对决”名副其实,中国电信的“星辰”、阿里的“通义”、百度的“文心”、“混元”腾讯、商汤科技的“日新月异”、云知声的“山河”、AI实验室的“书生”…几乎每一个展位都有自己的“大模型”。
经过一年的参数量级,可以支持前后文token数,推理价格等等,AI Agent(AI助手/AI智能体)拉开了“百模对决”的第二幕。
支付宝智能助理,今年被选为WAIC镇馆之宝,是基于蚂蚁集团百灵模型开发的AIC智能助理。 Agent,用户可以通过拉下支付宝首页来唤起“小助理”,询问后可以获得8000多项数字生活服务,包括旅行、健康、政务和金融。
阿里云的“同门师哥”通义for everyone“然后整合通义大模型的全栈能力,整合通义实验室前沿的文生图、智能编码、文档分析、音视频理解、视觉生成等能力。基于通义千问的最新基本模型,最终形成一个All。 in 全能AI助手one。
在“腾讯元器”展区,与会嘉宾可以通过添加提示词、插件、知识库等自由建立智能体(AI Agent),也可在智能体店选择,使用智能体,以满足不同场景的需要。
除了这些针对个人用户的“AI 作为大型模型从通用到垂直应用的重要“抓手”,助手,AI Agent也出现在各种行业的大模型中。
“为B端客户创造一个AI Agent的过程更像是打通企业流程、全面管理数据、重塑业务结构的机会。中国电信大模型首席专家刘敬谦告诉《IT时报》记者,只有深入了解行业特点和场景需求,才能打造出真正实用的AIT。 Agent,有效地实现技术落地。
Windows和微软 Copilot(助手)建立在11中,AI Agent强调服务的协同性和对自然语言的认识。
OpenAI对AI 大语言模型是Agent的定义(LLM)它是由大脑驱动的,具有独立理解、感知、规划、记忆和使用工具的能力,能够自动执行复杂的任务智能体。它具有独立思考和行动的能力,不仅可以处理数据,还可以根据环境变化独立学习和适应,从而实现特定的目标或处理特定的问题。
不久前,苹果刚刚发布了“Apple Intelligence”,就是整合操作系统、软件、模型和数据,加强对应用场景的理解,深入了解AI用户的需求。 Agent。
首先是AI 比尔·盖茨是Agent欢呼的老板。早在1995年出版的《未来之路》一书中,他就描述了Agent可以理解客户的自然语言,并根据用户的理解完成各种任务,但直到ChatGPT问世,他才看到真正实用的AI。 可能会出现Agent。
对比尔·盖茨来说,AI Agent将彻底颠覆人与机器的互动技术。可以预见的未来是:智能手机将有一个AI。 Agent,这将收集手机中的所有数据,以满足用户随时随地的需求;它将是公司的“AI程序员”,帮助开发人员完成繁琐重复的任务,如编码、检测、升级应用、故障排查、安全扫描和修复、改善云资源等。或者是公司的“数据分析师”,自动收集和分析公司的所有数据,挖掘数据金矿的价值。员工只需使用自然语言和AI。 通过Agent对话,可以获得公司政策、商品信息、业务结果、代码库、人员等相关业务数据和答案。
蚂蚁集团董事长兼首席执行官井贤栋也在本次人工智能大会上表示,在人工智能时代,智能体将逐渐成为一种应用范式,为用户带来跨代服务的升级,而专业智能体是大型落地行业的有效途径。未来,医疗、教育、金融、制造、交通、农业等行业可能会根据自己的情况和独特的经验、规则、数据等生成数百万的智能体,形成庞大的生态。
但是,并非所有的AI都是 Agent自然具有很强的能力。在AIGC时代,每一家公司都不想错过收入,但是每一家公司都在问:AIGC到底能给自己带来什么?为了使生成人工智能的应用和助手真正发挥作用,他们必须了解组织数据、客户、运营和业务,但是现在很多助手都不能轻易个性化,他们的设计也不能满足企业所需的数据隐私和安全要求。
实际上,AI Agent高度依赖于基础大模型的能力,整个企业体系结构的工程能力,R&D人员对行业的理解,以及高质量的数据支持。如果缺乏以上任何条件,AI都可能 Agent只是看上去很漂亮,但在实际使用中却因为不够“专业”,导致应用无法落地。
在腾讯云副总裁、腾讯优图实验室负责人吴运声看来,“应用是未来大模型决战的主战场。目前,大多数大型模型制造商都在智能体领域进行进一步的技术尝试。模型以落地和实用为主。大模型的R&D和应用必须关注和处理具体的需求场景,关注可用性和性价比。
趋势二:智能聚会繁荣,人形机器人进入商业早期阶段
WAIC的镇馆之宝今年做了一道“大菜”——“十八金钢 “人形机器人先锋阵型”收集了中电科、复旦大学、达达、傅利叶、钛虎、星动时代、卓益得、开普勒、宇树等18款国内领先机器人产品。,这真的让观众体验到了什么是“智能元年”。根据主办方的数据,本次会议共展出了25多个人形机器人。

一九五○年,“计算机之父”图灵(Alan Turing)“具体智能”的概念首次在他的文章中提出。严格来说,机器人、工业机器人、拟态机器狗、智能网联车都是“身体”,但人类类型仍然是人类接受度最高的机器人形式。
就硬件条件而言,许多人形机器人已经具有很高的身体敏感度。举例来说,人形机器人(上海)有限公司自主开发人形机器人“青龙”,身高185cm、体重80kg、全身有43个主动自由度,手指可以小心轻放水杯,即使是柔软的面包,也可以在抓起时保证面包形状的完整性。
上海开普勒探索机器人有限公司的一般人形机器人,身高175cm,体重70kg,关节自由度40个,传感器80多个,地形行走复杂,智能避障等多种功能。
中国地方创造人形机器人创新中心总经理许彬一直有一个略显激进的观点:具体智能是通用人工智能的必由之路,只有人形机器人才能实现通用人工智能。核心逻辑是人类社会存在的所有数据,都是为了让人类更好地生存和发展。所有对世界的理解、认知和情感的数据都是围绕人体产生的,而猫或鱼等其他生物本身。人类世界的各个方面都无法感知。
至少在这个阶段,具体智能还没有完全具备对物理世界的认知和互动能力,尤其是目前GPT模式的大模型,在使用具体智能时效果并不理想。
一位国产人形机器人创始人透露,GPT-4V的图像接口之前已经连接到机器人,但是大型机器人对物体的空间认知能力很差,“记忆”只有一秒钟。世界顶级人工智能科学家李飞飞也认为,无论参数有多好,大型机器都没有意识。
“我们应该建立一种‘知识’ 中国工程院教授、同济大学校长郑庆华创新性地提出了数据驱动的智能模型“知识森林”理论,将大模型中碎片化的知识与人类现有的知识链结合起来,然后生成了解释推理的问题解决机制。
上海人工智能实验室主任、首席科学家周伯文也认为,具体智能不仅仅是大模型加机器人的应用,而是大模型接收物理世界的反馈,进而演变。“光看书或者看视频是学不会游泳的。你必须把它们放在水里才能学会。大模型必须通过机器人进入现实世界,才能真正了解物理世界。”
目前,世界模型是具体智能领域最热门的词汇。人工智能实验室构建了一个集“软硬虚实”于一体的机器人训练场——浦源·桃源,同时攻关具体智能的“大脑”和“小脑”。“浦源桃源”是第一个城市级具体智能数字训练场,构建了开源具体智能研究平台,集场景数据、工具链、具体模型评价于一体。作为一个大模型与机器人的连接层,它包含89个功能场景,超过10万个高质量的可交互数据,预计将解决该领域数据匮乏和评估困难的问题。
在大脑方面,人工智能实验室实现了大模型驱动的无人机、机械臂、机器狗三种异构智能体的协同,包括具体智能体自身状态认知、复杂任务分解分配、底层技能协同控制。在小脑方面,通过GPU高性能的并行模拟和强化学习,机器人可以在现实世界中快速有效地学习,并完成高难度的动作。现在单卡一小时的练习可以达到现实世界380天的训练效果。
尽管与智能本体完美匹配的世界模式尚未出现,但近两年来具体智能的发展已远远超出了从业者的预期。
不久前,特斯拉CEO马斯克在年度股东大会上表示,特斯拉将于2025年开始“限量生产”Optimus(擎天柱)人形机器人,明年特斯拉将有1000多个Optimus机器人在运行。达达现场预购了智能人形机器人XR4,价格从39.9万元开始。
宇树科技CEO王兴兴认为,在明年年底之前,世界上肯定会有比人跑得更快的人形机器人。“比如100米跑到10秒,人形机器人在体育和文化表演上应该比做家务更舒服。”
许彬乐观地判断技术的迭代速度。未来3~5年,人形机器人可以在一些工厂的智能生产线上运行,未来5~10年可以在家政服务等场景中使用。
趋势三:多路径破局“铁幕”,国产算率“春季波动”
AI带来的算率飓风,以及美国拉下的“科技铁幕”,使得算率芯片成为近年来WAIC的焦点。
在2022年WAIC期间,美国正面宣布切断英伟达高端芯片对华的供应。现在,两年过去了,当美国不断收紧芯片政策时,国内计算率开始在春天显示出一丝绿色。
7月3日,国内芯片制造商摩尔线程创始人兼首席执行官张建中宣布,“从今年开始,万卡将成为AI模型训练的主要阵地。(KUAE)智能计算集群解决方案升级为万卡万亿参数通用计算率集群,以多功能GPU为基础,打造国内通用加速计算平台,可承载万卡规模和万P浮点计算能力,为万亿参数级大模型培训提供平台。

到目前为止,国内至少有两家芯片厂商已经完成了单池万卡集群的能力,为中国自主可控的AI模型建立了关键的基础设施。
新型异构算率架构也在努力解决算率规模化问题。无问芯穹推出的千卡大型异构芯片混合训练平台,选择“MxN“方案,M层是一个大模型,N层是国内外各种芯片,可以通过算法提升、自动编译、不同芯片藕合等技术一键部署模型,支持Baichuan2、GLM3Chat、Llama2、Qwen系列等20多个模型,在AMD、六种异构芯片上的混合训练,如华为升腾、天数智芯、沐曦、摩尔线程、NVIDIA等,计算率最高为97.6%。
无疑芯穹希望处理国内AI领域存在的“生态立井”问题。虽然不同芯片组成的计算率形成了一个集群,但在生态逻辑上,整个软件栈无法很好地协调和开放。无疑芯穹是一个AI。 Native基础设施可以适应中国独特的多模型和多芯片生态格局,将各种异构算率构建成一个大系统,高效完成大模型的实践和推理。
受芯片禁令的限制,国内单池超大规模集群建设面临困境。只有少数大型互联网制造商和通信运营商具备芯片储备和技术能力,但根据大型Scaling Law(尺度定律),至少在现有路径上,更多的算率可以创造更多的智能。
通讯运营商也开始寻找其他方向,以网强计算。他说:“我们已经在实验室里完成了100公里的并池计算。”刘敬谦告诉记者,为了突破单池计算率的限制,中国电信正试图用400G/800G的超高宽带将两个位于不同区域的实验室无损高速连接起来。同样的预训练任务可以同步部署在两个100公里的实验室,持续训练时间相当于在同一个物理数据中心进行训练。“下一步,我们将在京沪两个单池万卡之间进行快速直接测试。”

试验一旦成功,将极大地缓解国内大模型的“计算焦虑”。GPT-该模型拥有20,000亿参数和80,000亿token,10000个英伟达H100,需要三个月的训练,换成最新的超级芯片BX200,10000个芯片只需10天。而且受制于产能,目前能稳定供货万卡以上的国产芯片并不多。如果数据中心之间的网速几乎可以相当于数据中心内部的高速互联,那么之前全国各地零散建设的区域性计算中心就可以得到有效利用。
“铁幕”多路径破局的尝试,让国产计算能力和国产大模型的春天悄然而至。
排版/ 季嘉颖
照片/ IT时报 WAIC
本文来自微信微信官方账号“IT时报”(ID:vittimes),作者:郝俊慧,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




