首日探馆:大模型时代下具身智能与AI终端的共舞
7月26日,“2025世界人工智能大会暨人工智能全球治理高级别会议”(WAIC 2025)在上海盛大开幕。
大会主论坛上,“AI教父”杰弗里·辛顿抛出“数字智能是否会取代生物智能”的问题,开启了AI之问的新篇章。
除了技术进化,更实际的问题是:AI能否真正融入产业和社会,创造可验证的真实价值?这也是WAIC 2025最贴近实际的实践焦点。
现实中,擎朗科技的机器人能调酒,梅卡曼德的机器人会叠衣服。在世博展览馆里,“WAIC里”的技能大舞台被观众围得水泄不通,智能机器人在文艺站、修理铺、小吃街等地方打鼓、写字、煮串、剥蛋。

在不久的将来,AI或许能为我们给出更多答案。
大模型加速“下沉”
走进世博展览馆H1馆,仿佛打开了AI能力的黑匣子。谷歌、阿里、华为、腾讯等大厂齐聚,AI六小龙、北斗七星、科创八杰等新秀也纷纷亮相。《每日经济新闻》记者在参展企业与专业观众的交流中,听到最多的关键词是“国产化突破”“开源繁荣”“多模态”与“下沉产业”。
阶跃星辰把“中国好声音”的座椅搬到现场,观众一键扫码就能开启AI Rap音乐创作,其后方“多模态卷王”的标语十分醒目。

阶跃星辰方面表示,随着大模型技术进入推理时代,大模型需具备强智能、低成本、可开源和多模态四个特征。升级后的新一代基模Step 3能为开源世界提供性能增强的多模态推理模型。
目前,Step 3已授权国内多家芯片公司,并完成芯片适配。原理分析显示,Step 3在国产芯片上的推理效率最高可达DeepSeek - R1的300%。成立两年多,阶跃星辰搭建的多模态矩阵已覆盖语音、视觉理解、图像编辑、图像和视频生成、音乐等领域。
阶跃星辰工作人员称,在企业模型落地应用中,选择合适的基础模型和解决数据孤岛问题至关重要。要让大模型真正发挥作用,需要全产业链协同创新,涵盖模型、芯片、平台到应用等环节。
模型算法、语料标注、计算资源是导致多模态技术处理存在差异的关键因素。而性能提升是否就等同于模型价值?记者发现,从AI生成式办公、营销到智慧能源、数字基建、工业智造,大模型正加速“下沉”。WAIC 2025的变化在于,越来越多的垂类大模型通过场景共创与数据耦合,重塑产业效率曲线与创新范式。
为解决企业在AI落地过程中面临的数据和应用挑战,从大数据平台起步的星环科技已转型为AI Infra供应商。在新一代AI Infra架构中,AI就绪数据平台为大模型应用做好了数据准备。面对多模态的语料信息,用户可在接口和计算层屏蔽异构数据的差异,以统一形态满足各类垂直大模型的落地场景。
做好语料、知识、模型、应用四大模块的排列组合,对特定行业的智能化转型至关重要。在AI PC展示区,观众通过拖拽连接知识检索、大模型、MCP及业务系统等模块,就能快速形成专属的智能体应用。
星环科技市场部海外市场主管何韵秋向记者演示了金融领域的投研应用。她指出,企业需要能理解业务语言、掌握领域知识的专属智能体。平台基于语料管理和知识管理功能,从大量专业资料中提取高质量数据,保证内容输出准确,并兼容多种国产GPU与推理引擎,以满足企业级模型多环境管理需求。
当AI智能体开发从“技术实验”转向“业务引擎”,何韵秋指出,当前企业AI部署以单点场景应用为主,主要受限于数据治理的前期投入。她强调,构建企业级AI基础设施虽需完成复杂的数据处理与系统整合工作,但这是数字化转型中不可或缺的战略投入。
人形机器人同台竞技
如果说大模型是AI理解世界的一条腿,具身智能就是它迈入物理世界的另一条腿。从世界模型的仿真、推理、迁移,到人形机器人在物流车间的精准拣选,再到语音Agent与传送带设备的协同,都在以实际场景回应:AI能否在物理世界得到验证?
在宇树科技展台上,一场激烈的人形机器人拳击赛正在进行。四台宇树G1人形机器人化身“钢铁拳手”,在擂台上展开对决。首场比赛中,小绿对战小黑,双方动作流畅,攻防转换间展现出仿生科技的敏捷性。最终,小绿一记鞭腿命中对手,赢得首胜,让现场观众大呼过瘾。

宇树科技的“机器搏击”展示了本体运动控制的魅力,而智元机器人展台更注重人形机器人的“大脑”与人机协同。
智元机器人自主研发的启元通用具身大模型,凭借多维度的出色表现,荣获“2025世界人工智能大会”最高奖项SAIL奖。
现场,智元机器人联合创始人兼CTO彭志辉(稚晖君)与灵犀X2人形机器人进行了精彩的人机对话。作为首位以“嘉宾”身份登上WAIC主论坛的机器人,灵犀X2的“本体 + 运动/交互/作业智能”表现超乎预期。
在WAIC2025主论坛上,AI不仅是产业技术的代表,更成为被多角度审视的未来范式。重量级中外嘉宾探讨人工智能的全球合作;图灵奖得主聚焦AI驱动复杂系统的新图景;计算“领头人”探讨“未来算力走向何方”,提出算力架构的前沿方向。
科技领军者纷纷登场,AI处于科学、产业与底层技术的交汇处,它不仅是效率工具,更可能改变人类理解世界的方式。
在商汤展台,新升级的日日新V6.5大模型推理更强、效率更高,开始接受端到端场景落地的“实战考验”。
工作人员让记者戴上小米AI眼镜,体验商汤音视频交互系统的实时反馈。当记者询问“眼前看到的是什么”,耳边会传来对画面的描述与讲解。工作人员表示,与传统AR设备相比,搭载大模型的AI眼镜可在多场景下获得针对性回复,让“看、说、记、想”成为现实。
在大模型、具身智能与算力底盘的推动下,AI已跨越概念验证阶段,进入更确定、可追溯的产业周期,切实解决健康、生产、公共服务中的实际问题。
AI终端百花齐放,端侧大模型加速落地
作为智能世界的关键入口,AI技术推动智能手机、智能眼镜、个人电脑等设备实现形态重构、交互升级与生态重塑。在端侧大模型技术支持下,消费者身边的电子设备越来越智能,功能也日益强大。
在WAIC 2025上,观展者明显感觉到触手可及的AI终端增多了,如可触摸的AI电子宠物、能提示演讲内容的AI眼镜、飞机上不联网也能整理报告的个人电脑、能激发创意的录音设备等。

在世博展览馆H3馆智能终端展区,AI眼镜最为吸睛。它具备实时翻译、内容检索、AI照相、演讲提词等功能,作为连接智能世界的重要入口,几十克重的AI眼镜不断拓展使用场景,试图解决“如何成为真正实用的个人AI助手”的问题。
从百模大战到百镜大战,AI眼镜发展势头正盛,技术路线尚未确定。硬件和软件如何在小小眼镜中平衡,如何打破物理世界和赛博世界的界限,仍有待探索。
不过,一些共识和趋势逐渐显现。当AI浪潮袭来,技术能为人们做什么?一个普遍的答案是记录和解放。在“出门问问”展台,一场特别的艺术展通过终端设备,用AI技术从微观视角还原个体的胡同记忆,勾起人们心中的乡愁。
AI眼镜记录生活点滴,AI录音设备激发灵感时刻……从需求出发,用科技表达,这是人工智能带给人类的浪漫。
但现实中,AI智能终端面临的挑战依然严峻:端侧大模型受能耗与算力限制;AI功能与用户真实需求存在偏差;终端生态碎片化,应用、系统、设备之间存在隔阂。推动AI技术与终端产业深度融合,打造具有持续进化能力的下一代智能终端,仍是全球从业者面临的核心问题。
每日经济新闻
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




