AI原生硬件首战:阿里以眼镜作答,定义超级入口

07-29 07:00

在大模型从生成迈向完成的阶段,所有科技公司都在思索同一个问题:AI真正融入人类生活,会从何处开启?是网页、App,还是某种随身新终端?答案逐渐明晰:硬件,或许是AI原生时代至关重要的起点。

大型科技公司正借助AI硬件探索下一代入口形态。这些尝试达成了一个共识:手机未必是AI的最佳载体,屏幕难以承载持续的对话、感知与主动服务。

对AI有足够野心的科技大公司不会放弃硬件领域。

在此背景下,阿里巴巴在2025世界人工智能大会上推出了首款自研AI眼镜——夸克AI眼镜。

自去年AI硬件成为行业热点,发布会、演示不断涌现。但此次发布,不仅是一款消费电子产品的亮相,更是阿里整合AI To C业务后,首次将AI能力融入物理终端的实际行动。

阿里成为继Meta之后,全球第二家以大模型能力驱动智能眼镜落地的科技平台型公司。

AI+硬件+生态协同:阿里全栈能力的实体化载体

阿里正积极布局C端用户场景通路。2024年底,通义APP并入阿里智能信息事业群,与夸克共同推进AI to C战略,夸克被确定为阿里的AI旗舰应用。这一架构调整,初步规划了阿里在大模型时代的战略方向。

进入2025年,夸克成为该系统中最明确且具潜力的接口:

3月,夸克升级为“AI超级框”,成为融合对话、搜索、执行与决策的智能任务中枢,不再是传统搜索框;

6月高考期间,夸克推出“高考深度搜索”等功能,累计生成超1200万份个性化志愿报告,三四线考生占比过半;

7月,在“AI+健康”竞争激烈的背景下,夸克健康大模型通过国内12门核心学科主任医师级评测,成为首个进入消费级产品体系的“主任级AI医生”。

夸克的每次突破,都是早期长期投入的成果。夸克AI眼镜的推出,也是水到渠成之事。

夸克承接这一任务并非偶然。作为阿里体系内少有的“中立型”工具产品,夸克在年轻群体中口碑良好,在语音、语义、图像等底层能力上积累深厚,其在搜索、健康、教育等场景验证过的产品 - 算法耦合机制,使其成为AI助手形态的理想落地载体。

早在2025年1月,就有报道称夸克团队在探索AI眼镜。此次,阿里选择以眼镜为突破口,进军大模型时代的硬件终端赛道。

这不仅是产品亮相,更是阿里AI to C战略的具象表达。AI眼镜被定义为超级入口的物理载体,旨在打造具备感知与行动能力的随身AI助手。

这一定位反映了阿里对新一代终端形态的判断:下一个入口不应是软硬件简单拼凑的产物,而应是“模型+硬件+生态”一体化能力的闭环输出。

具体而言,夸克AI眼镜融合了阿里多维度的能力:

硬件方面,夸克AI眼镜团队有丰富的终端经验,核心成员多来自硬件行业;

软件与算法上,夸克在语音识别、语义理解和图像问答方面的能力,已在App中得到验证,并基于通义千问构建了多款垂直场景模型;

最终,结合飞猪旅行、阿里商旅等生态能力,形成从场景、指令、调用到反馈的多环协同链路。

这些能力赋予了夸克AI眼镜区别于同类产品的核心特征。夸克AI眼镜负责人宋刚表示,它首先要是一副好戴的眼镜,其次是全天候可用的智能终端,最重要的是成为随身的AI超级助手。“我们把超级AI助手排在第一位。”

从设备到助手,不仅是口号,更体现在功能定义上。团队未从显示端突破,而是聚焦语音交互、第一视角拍摄等“高频刚需”场景,早期着重打造可持续使用的基础能力。

实际交互中,夸克AI眼镜搭载语音与多模态大模型,具备语义理解等核心能力。即便现实条件与测试环境有差异,其识别与响应表现也较为稳定。

结合阿里业务,还能拓展更多场景,如基于骨传导的声纹支付,利用人体健康、运动数据作为多模态输入。

宋刚表示:“我们可以提供闭环的体验。”

综合能力使夸克AI眼镜从单一拍摄设备,转变为能伴随用户生活、工作的个人助手。

路径和逻辑清晰,执行落地才是难题。对阿里而言,这不仅是对新硬件形态的探索,更是验证其AI全栈能力能否闭环的关键战役。

探寻一副眼镜的边界

乔布斯曾说:“用户无法预测没见过的产品。只有看到产品,用户才能给出有用反馈。”

如今,普通消费者仍难以想象AI硬件的最终形态。大模型对C端用户的影响,大多还局限于手机屏幕。

无论是Ray - Ban Meta还是夸克AI眼镜,巨头们都在寻找下一代终端,一个能改变交互方式、兼具入口与出口功能的物理形态。

夸克AI眼镜不想简单移植App,也不复制Ray - Ban Meta,而是进行全新交互逻辑的尝试。

虽然Meta也在做眼镜,但两者逻辑不同。Ray - Ban Meta侧重轻社交、拍照分享,强调“记录”;而夸克AI眼镜更注重理解与执行,是“理解你面对的世界”,更像新的AI助手。

正因如此,并非所有公司都适合做夸克AI眼镜。

产品定义围绕“高频生活场景”展开。AI眼镜响应的是用户“看不清、记不住、解不出”的通用需求。如在飞猪旅行场景中,用户询问“我几点登机”,眼镜可自动显示登机口信息,若叠加高德室内导航,全程可语音指引。

这类场景背后,是阿里内部多个部门与夸克组建的专项开发团队。他们以“Agent”化为导向深度定制,推动业务从被动响应转向主动服务。飞猪、高德等都已开展类似合作,构建不同生活场景的微型AI链路。

只有阿里能做好这件事,因为阿里多年来已打通衣食住行各方面事务,生态完备,只需激活。其他公司即便想法很好,也常因通路问题难以落地。

在功能实现上,AI眼镜普遍面临的能力边界正被逐步突破。

语音交互方面,夸克AI眼镜配备5个麦克风+骨传导系统,能在嘈杂环境精准唤醒,通过通义千问理解指令,自研中控系统智能分发,降低响应延迟。图像问答场景下,结合自研算法与百亿级图像检索能力,识别响应速度与答案质量更高。

多模态能力整合,使夸克AI眼镜在拍照之外更具理解能力,能在多种场景为用户提供即时讲解。

不过,边界不止于此。

互联网公司做硬件常忽视硬件本身。Web和App时代的成功让他们习惯快速迭代,但这不利于硬件产品研发,因为硬件开发周期长。

好在夸克团队有硬件人才,能解决硬件需求和瓶颈。设计上,采用可拔插镜腿与随身换电仓,实现全天候续航;配备双芯片系统控制功耗;使用轻量材料,优化佩戴体验,减少压迫感。

团队深知挑战复杂。宋刚表示:“AI眼镜体验链路长,不能有明显短板,否则体验不闭环,用户难以信任产品。”

AI眼镜作为新终端,不是简单堆叠功能,而是要在人与世界间找到高效、可信赖的交互方式。

入口之争即范式之争

其实,硬件作为AI入口的尝试并非仅在眼镜领域。2017年,中国互联网大厂就开启了智能音箱之争。

但当时AI能力有限,音箱虽能接收指令、唤醒,但难以执行复杂任务。

大模型的出现改变了这一切。新的人机交互形式或许正在诞生,新终端应是能时刻感知、抢先理解的载体。

手机是主动使用的设备,需手动操作才能交互;而AI时代理想的终端应默认在线,先理解再行动。

眼镜具有比手机更优的第一视角感知能力,配合大模型可实时识别世界、主动推送信息,替代复杂操作。

AI眼镜的意义或许不在于成为爆款硬件,而在于成为下一代操作系统的物理接口。

因此,全球科技平台公司都关注AI硬件,本质上是在探寻AI强大后,如何让其随时可用,入口在哪里。

如今,阿里通过夸克AI眼镜迈出的这一步,正是对这一问题的系统性回应。

本文来自微信公众号“智能涌现”,作者:晓曦,36氪经授权发布。

本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com