豆包手机助手亮相:努比亚首发尝鲜,大厂为何难买单?

2天前
互联网巨头对手机入口的争夺从未停止。

大家有没有觉得,2025年的科技圈虽热闹非凡,却总少了些颠覆性的惊喜?


回望这一年,AI大模型领域百花齐放。Sora生成的视频足以以假乱真,GPT-5的智商据称已超越人类平均水平,国内的豆包、千问、DeepSeek等模型也竞争激烈。


然而,这些高科技似乎大多局限于电脑网页或手机聊天App。


再看我们日常高频使用的手机,体验并无太大改观。依旧需要逐个点击App图标,在微信、淘宝、小红书间频繁切换。即便大模型宣传得天花乱坠,点外卖时仍需手动滑动屏幕操作。


就在大家以为2025年将平淡收尾时,字节跳动突然放出重磅消息。


12月1日,字节跳动推出豆包手机助手预览版。



简单来说,这是面向手机厂商的系统级服务,将豆包大模型深度融入操作系统,用户只需语音或简单手势,就能让手机完成原本需数十次屏幕点击的繁琐操作。


遗憾的是,雷科技此次未能提前拿到产品,我对那台中兴工程样机颇为好奇。


不过,这并不影响我们带大家探究豆包背后的技术实力。


努比亚首发,豆包手机助手实现“全权代劳”


先为大家澄清,微博上热传的“中兴将与豆包推出AI原生手机”实属误传。


此次豆包发布的并非手机,而是搭载于nubia M153的手机助手。



看到这个组合,不少读者会疑惑:字节跳动为何不自己做手机?


这个问题我们稍后再谈。


言归正传,根据官方演示视频,豆包手机助手的核心卖点是“全权代劳”。


当前的手机助手如Siri、小爱同学,定闹钟、查天气尚可,但若要求“给微信的老王发红包并附上刚拍的照片”,多数助手会束手无策,最多只能打开微信,后续操作仍需手动完成。


豆包手机助手则截然不同。


演示中,测试人员对手机说:“帮我在所有购物软件上对比这款洗发水的价格,选最便宜的下单。”



手机屏幕自动启动操作,先识图提取商品名,再依次打开淘宝、京东、拼多多搜索比价,最后停在支付页面等待用户手动付款。


整个过程测试人员未碰屏幕,耗时3分12秒。


这一功能相当惊人。


它涉及跨App操作,豆包手机助手不仅要理解语音指令,还需识别屏幕按钮功能,模拟手指点击,像人一样操作各类应用。


这在技术领域被称为GUI Agent(图形界面智能体),相当于给AI配备了“眼睛”和“双手”。


另一个场景也令人印象深刻。


测试人员戴着智能耳机Ola Friend,无暇动手,直接语音唤醒豆包:“帮我查看博客平台的周刊栏目是否更新,若更新则加入播放列表,我路上听。”



手机在锁屏状态下即可执行任务。


即便此时测试人员新增需求:打开特斯拉前备箱、预订西班牙餐厅座位,也不会影响原有任务,多个任务可并行处理。


这类功能在忙碌时刻尤为实用。


基础功能方面,文字交互、语音通话、视频通话与屏幕共享一应俱全,多模态生成与手机原生相册深度融合,可轻松去除照片中的人物与杂物,保留纯净风景。



更值得关注的是豆包手机助手的全局记忆能力,这或将深刻影响未来手机系统交互。


测试人员举例,在Pro模式下,用户说“帮我给女儿选几个礼物加入购物车”,若助手已存储女儿的年龄、兴趣等信息,可直接推荐符合条件的方案,无需用户重复说明细节。


这种体验,仿佛比用户自己更了解需求。


当然,官方也强调,尽管演示内容真实录制,但受大模型技术不确定性影响,相关场景无法保证100%复现。


价格方面,这款搭载豆包手机助手的nubia M153工程机售价3499元。


在2025年旗舰机市场中,这个价格不算高。但考虑到其主要面向开发者和极客尝鲜,普通用户购买可能会遇到不少BUG,后续系统更新也有待观察,建议大家谨慎入手。


适配中小厂商,大厂为何不愿“交权”?


聊完产品,我们来分析背后的逻辑。


很多人会问:这功能听起来不错,为何小米、华为等大厂不自己做,反而让字节跳动抢先?


这其实是“术业有专攻”的体现。


正如我们之前讨论的,小米的小爱同学、华为的小艺虽在进化,但本质上更偏向“守门员”角色。


手机厂商开发AI功能,首要目标是稳定。不能为了智能让手机发烫,也不能让AI随意操作应用,避免出现误发消息等尴尬情况。


因此,大厂的AI功能往往较为保守,主要通过API接口控制App,导致支持的应用有限,操作体验固化。


而字节跳动的豆包则是“进攻型选手”。


豆包背后的大模型具备原生多模态处理能力,无需App专门开放接口,直接像人一样识别屏幕并模拟操作,限制更少。


从提前体验的用户反馈来看,豆包甚至能自主玩微信小游戏。


这种技术路线激进,容错率低,但上限极高。


那字节为何不自己造手机?


这涉及一段互联网往事。当年锤子手机被字节收购后,字节曾尝试做硬件,但结果并不理想。如今手机市场竞争白热化,新玩家难以入局,字节自然不愿再冒风险。


因此,字节选择“借壳上市”。


它需要硬件载体落地AI能力,而中兴/努比亚等二线品牌硬件实力尚可,系统体验却一直是短板。


双方一拍即合:努比亚提供硬件和系统底层权限,字节提供AI技术支持,实现优势互补。


这也为行业提供了新思路:借助AI实现“弯道超车”


试想,如果魅族、摩托罗拉等中小品牌搭载了比主流厂商更智能的豆包手机助手,能自动完成外卖、抢票、修图发朋友圈等操作,你会心动吗?


至少部分极客用户会愿意尝试。


巨头争夺入口:AI能否打破十年前的“ROM魔咒”?


看到豆包的操作,不禁让人感慨:互联网行业真是“循环往复”。


老网民或许记得,2012-2014年是手机ROM百花齐放的时代。


当时腾讯推出TOS,阿里有云OS,百度也做过百度云OS,甚至Facebook都推出了Facebook Home。几乎所有巨头都想通过手机系统抢占移动互联网入口。


雷科技当时也做过不少相关评测。


结果如何?几乎全军覆没。


因为当时的第三方系统除了换皮肤、预装App外,并未带来核心体验提升,反而因功能冗余导致操作复杂,最终因适配差、卡顿被用户抛弃。


十年后的今天,剧本似乎重演。


只是这次的“武器”从UI变成了AI。除谷歌外,字节跳动、OpenAI及各大模型厂商都在试图抢占手机入口。


但这次成功的概率可能更高。


因为AI确实能解决实际痛点。



如果一个手机助手能让你每天少点几百次屏幕,自动处理订票、比价、填表等繁琐任务,你或许愿意忍受它偶尔的小Bug。


更重要的是,这可能对手机行业形成“降维打击”。


它或许不会立即改变市场格局,毕竟小米、华为、苹果的地位难以撼动。但它撕开了一道口子,让我们看到:未来的手机不应只是搭载AI功能的通讯工具,而应是能主动解决问题的智能助手。


或许到2026年,大家讨论手机时,关注的不再是“拍照多少像素”,而是“能帮我解决多少麻烦”。


若真如此,那将是科技带来的美好改变。


本文来自微信公众号“雷科技”,作者:雷科技,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com