AI手机,苹果再次走在国内厂商前面?
今年苹果WWDC结束后,虽然媒体的评价是“没有惊喜”,但罗永浩作为头号黑粉,却异常安静。今年1月,最后一条“杀人”微博愤怒地谴责荣誉抄袭。
相反,马斯克发了七篇文章。 ,狂喷苹果完全访问了OpenAI的ChatGPT。他甚至在库克的帖子下放大了自己的脸,说如果库克不阻止这个令人毛骨悚然的植入软件,他会把禁止苹果设备进入自己的企业,并给出一个科技界广为人知的表情包。

虽然外界也罢奇马斯克为什么这么狂躁,但主要关注的还是Apple“没有惊喜”。 Intelligence(苹果智能)。著名的果链分析师郭明邈在给苹果敲响警钟的同时,也没有忘记提醒消费者,AI可能是苹果区分高端和低端机型的新标签。
在WWDC发布会之后,苹果股价做了一圈过山车,首先在发布当天闻到的声音下降了2%,第二天又奇妙地上涨了7%。
从不满到青睐,资本市场态度在24小时内惊天动地。投资者误解库克了吗?然而,原本乐于看到它的国内厂商仍在尽最大努力制造苹果落后的话题。
不是国内厂商蹭流量,主要是AI手机。苹果之所以被评价为“没有惊喜”,是因为一些消费者已经使用了国产AI手机。换句话说,国内厂商已经教育了WWDC上苹果拿出来的所有东西。
所以问题来了,这次苹果还能走在国内厂商前面吗?
01 AI手机已经到了第二阶段
先说说AI手机在讨论先后问题之前到了哪个阶段。
一般来说,AI手机分为三个阶段:App、功能和原生化。简单来说,去年年初出现了各种chatGPTApp的第一阶段,随着OPPO、三星等厂商推出AI手机,第二阶段也已经到来。
现阶段的AI手机,今年1月发布的OPPO Find X7 还有三星Galaxy S24,具有典型的AI功能特征:支持通话摘要,AIGC清除,AI语音助手等。
而且,在AI手机的整体思路上,每个家庭都趋于一致:将大模型能力内在于操作系统,而不是以醒目的AI应用呈现,而是进一步落地到具体的手机使用场景,最终目的是让AI功能看似无处不在,却无处不在。
具体功能集中在以下几类:
1 输入法。将生成式AI集成到键盘软件中,提供风格建议和智能重写等功能。例如三星Galaxyy AI用户可以改写不同风格和情感的句子,同时提供拼写和语法纠正。
2 例如三星Galaxyyy的实时翻译和转录。 ZenfoneS24和华硕 11 Ultra可以利用设备端的AI功能实现通话的实时翻译。另外,S24的实时翻译功能提供电话实时转录,文本显示在屏幕上,以便于参考,Zenfone的AI Transcript可以自动将语音转换成书面文本。
3 生成和编辑图像内容。比如小米14和小米14Ultra引入了“AI人像”功能,用户可以在手机中使用图库中自己的照片进行训练。训练结束后,用户可以在几乎任何设置中生成逼真的AI自拍,只需输入文本提醒。OPPO Find X7 Ultra可以实现AIGC橡胶擦拭功能,允许不需要的物体或人物在离线状态下从照片中删除。
4 通过LLM实现AI驱动的个性化功能。三星Galaxyy S24可以根据需要生成类似人类的文本能力,也可以帮助编写电子邮件或文档。OPPO Find X7 Ultra提供了多回合的上下文感知对话,还提供了虚拟助手。
5 生成AI界面工具。荣耀的任何门功能用户都可以在应用程序之间拖动文本或图像等元素,AI可以预测客户的意图,并建议相关应用程序共享内容。
根据上述功能,苹果之所以被评为“没有惊喜”,是因为它的主要功能点落在了文字、照片、语音转录、语义搜索和语音助手上。换句话说,比苹果强,还停留在AI手机的第二阶段。
然而,苹果似乎故意制造了一套盲目的方法,并没有在新闻发布会上公布自主研发的大模型。此外,Apple“没有惊喜” Intelligence,导致股价短暂波动。然而,发布会结束后,苹果在一个低调的技术博客中进行了深度摩擦的介绍。端侧模型和云模型都是自己开发的。
其中,端侧模型是一个30亿参数(3B)的小模型,苹果没有公布云模型的具体参数。苹果基本可以在3B级小模型和几个主流7B级模型的能力上获胜,而云模型则直接达到GPT-4。 Turbo级别。
此外,一些分析人士认为,即使苹果实现的AI功能并不突出,它仍然有一定的优势,因为它可以更好地实现AI功能。
以文生图功能为例。一般用户对手机没有生图的需求,但苹果把这个功能放在了真正的需求上:比如GenEmoji、在message中聊天图片,iPad文档处理草图变精图等,AI介入使这一功能真正有用,促进了客户的需求。
而且这并非苹果最大的欲望。
02 由功能到原生化
腾讯于去年十二月发表了一篇题为《《AppAgent: Multimodal Agents as Smartphone Users》论文直译为“作为智能手机客户,需要多种代理方式”。介绍了一个基于LLM的新型多模态Agent框架,旨在操作智能手机应用。
简单来说,腾讯设计了一个可以模仿人类点击、滚动等交互操作的框架,从而达到控制手机的目的的框架。关键是这种方法不需要浏览系统的后端,换句话说,它在不同的应用程序中有很高的适用性。
腾讯为AppAgent设置了三个主要功能:
1) 独立探索学习:智能体可以独立探索应用程序,不需要外部指导。
2) 观察人类演示学习:智能体通过观察客户的操作演示来学习任务执行。
3) 建立知识库:智能体通过上述学习过程积累经验,建立知识库,用于跨应用程序执行复杂的任务。
从理论上讲,AppAgent是一个应用程序,可以帮助你操作所有的应用程序。与苹果在新闻发布会上的演示类似,客户告诉Siri他想接机。Siri可以从邮件中获取航班信息,查找最新的航班信息,调用地图App形成路线,最后生成一个完整的建议。
通过了解UI来执行智能体指令,或者AI手机从功能性转向原生化,将多模态能力客户的UI界面。苹果发布的Ferret UI大模型,意在操作系统层面学习用户的使用习惯,并有望取代用户进行操作。
AI手机基于对UI的认知,结合终端智能体的任务规划和分配能力,具有实现以下重大飞跃的潜力:用户使用自然语言下达指令,AI手机理解意图并将其拆分为具体的工作流程,然后模拟用户操作从UI执行指令。最后,实现了跨App的操作和复杂的任务执行。完成了AI原生手机操作系统的主要结构。
例如,当客户用自然语言向AI手机输入指令“帮我买一张明天下午2点去北京的火车票”时,智能手机首先接受语音、语义分析和意图理解,然后拆分任务。拆分为:开启12306 App、选择搜索票,选择地址“北京”、选择“明天下午2点”、选择“靠窗”、选择“乘客名”、点击“购买”;并且通过UI模型,在App上解读不同的UI界面,模拟用户点击操作,实现整个过程。
这一系列操作是否与苹果在新闻发布会上的演示非常相似,但苹果现阶段并没有使用智能名称,而是称之为了解客户情况,实现跨App操作。
今年MWC展上也出现了类似的产品。Brain.基于App-less交互模式的ai展示概念手机T-Phone,使用者只需在对话框中输入需求,即可快速响应。T-Phone的核心概念是摒弃以App为中心的传统手机,然后通过AI使用前后的预测生成界面,帮助用户实现目标。
在国内厂商中,荣誉在法术OS上推出的任何一个门功能也是AI手机原生化的雏形。它允许用户在应用程序之间拖动文本或图像等元素。虽然被罗永浩抄袭,但其核心能力是“AI预测客户意图,建议相关应用共享内容”。当时荣誉声称,预计将支持世界上约100个最常用的应用程序。
无论是苹果、腾讯、荣誉还是Brain.ai,这类企业最终希望实现的目标是:
用户只需输入自己想要的服务(通过语音、文字等)。),手机会直接跳转到服务页面,或者AI智能系统会直接完成客户需要的服务。
但是基于AI智能体的多元化、自然交互体验,需要一定的甚至所有的功能和服务支持。在此基础上,AI智能体的交互可以从过去的GUI中获得。(Graphical User Interface)发展成VUI(Voice User Interface),最终升级为全新的Agent(App-less)UI,这意味着AI智能体与用户之间的交互将会发生,削弱APP的存在感。
因此,预计这种进化不会一蹴而就。在未来很长一段时间内,AI智能体和App将同时活跃在AI手机中。而且不仅手机厂商,头部App也可以围绕自己的业务生态打造专门的AI智能体,例子就是腾讯发表的论文。
03 尾声
回到我们在文章开头提到的问题,苹果能否在AI手机上领先。表面上看,苹果似乎没有突破现有AI手机的特点,但有三点值得关注。
首先,苹果利用Siri实现的跨App操作,与AI手机原生化阶段的智能体非常接近。目前国产品牌在这方面还是落后的;
其次,在第二阶段的演变中,苹果仍然保持着技术优势。比如苹果和国内品牌在处理大模型手机内存瓶颈时,选择了不同的技术路线。
苹果的思路是通过内存优化解决小内存操作大模型的问题。它构建了一个以闪存为核心的推理成本模型,并使用窗口化。(Windowing)还有团队捆绑(Row-Column Bundling)为了最大限度地减少数据传输,最大限度地提高闪存吞吐量,两项核心技术。
简而言之,苹果实现了iPhone,8G内存。 15 同样是8G内存的Pixel跑通3B参数模型 8和8a,今年5月才跑过1.8B。Gemnini Nano。
相比之下,国内厂商之所以能够在12G内存型号上运行7B参数模型,是因为选择了压缩路线。
例如vivo和OPPO已经在端侧运行了7B参数模型,但核心能力来自联发科。借助后者的混合精度INT4量化技术和NeuroPilot Compression技术可以将130亿参数LLM所需的存储空间从13GB减少到5GB。
今年四月,荣誉还宣布,基于自己的平台级AI压缩技术,7B模型可以在12GB内存设备中快速启动。
总而言之,在AI手机这个问题上的竞争,已经不再是大模型了,而是如何以更低的成本提供更好的服务。
三是苹果宣布开放AI。 SDK,这个信息可能被很多人忽略了。
未来开发者可以调用苹果手机 SDK,基于用户情景理解,完善第三方App的AI功能。AI手机的使用体验将在未来第三方应用程序配备AI能力后得到增强,这是目前用户手机的主要使用场景。
但是对于国内厂商来说,这可能是一项艰巨的工作。所以国内厂商的问题变成了,虽然在思路和布局上领先苹果,但在技术和生态上还是要追求的,这恰恰是苹果难以超越的环城河。
参考资料
[1] AppAgent:Multimodal Agents as Smartphone Users,腾讯团队
[2] 为何华为麒麟9000s,MTK9300S?极客视野?
[3] 苹果发布了Ferrettret的多模式模型-UI,部分手机UI任务超过GPT-4V,雷峰网leiphone
[4] 全面禁用苹果设备的马斯克,隐私泄露贼喊捉贼?太平洋科技
[5] 股价暴涨7%!在深入挖掘了两份低调公布的信息后,我们发现了苹果AI的秘密,腾讯科技
[6] AI端深度报告之AI手机,中银国际
[7] 苹果2024 中银国际WWDC评价
本文来自微信公众号“解码Decode”(ID:36氪经授权发布kankeji001)。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




