苹果AI首秀,其实只有跑马灯才是真的,长文揭示苹果完全搞砸了AI。
苹果去年六月展示了AI版Siri。
在接下来的几个月里,Siri团队对实现该功能的基本技术方案犹豫不决。
根据一位知情的前苹果员工的说法,该团队曾经计划建立一个小模型和一个大模型,每个模型都被命名为「迷你鼠」(Mini Mouse)和「大力鼠」(Mighty Mouse)。
小模型在iPhone上运行,处理设置闹钟这样简单的任务。大模型在云端运行,负责帮助用户预约汽车和参加下一次会议等更复杂的任务。
但是后来,Siri负责人改变了主意,决定建立一个全方位的大模型。
这就是说,Siri软件的云运行,与之前为了保护用户隐私,在系统端部署大部分软件的做法背道而驰。

大幅度调整技术方向,使得Siri团队成员身心疲惫,深受挫折,甚至有人因此离开。
这样,公司今年发布Siri新功能的目标就变得岌岌可危。
这一犹豫不决,导致苹果上个月做出了惊人的决定:将Siri新功能发布日期推迟到2026年。
根据知情人士透露,苹果将解除其AI主管John。 负责日常操作的Giannandrea和副手Robby Walker对Siri的管理权限。
Craigg苹果软件工程主管 在此之前,Federighi将主管Siri,领导Vision。 MikeePro研发 Rockwell将接管Walker工作。
演示,几乎都是假的?
去年六月,苹果发布了一系列Apple名称。 Intelligence的AI功能包括写作、图像生成、全新的照片编辑、邮件功能和Siri升级。

与之前的立场相反,苹果宣布与OpenAI合作,引入ChatGPT作为补充,用于模型无法解决的问题或任务。
在新闻发布会的现场演示中,一位苹果高管问Siri妈妈航班的着陆时间。Siri通过浏览其电子邮件和实时航班数据给出了到达时间。
然后,她让Siri提示午餐计划,Siri从短信中获取细节,并计划从机场到餐厅的路线。
不过,Siri团队成员对此表示惊讶。一位前苹果员工表示,他们从未见过这些功能能够实际运行的版本。
该员工还强调,当时检测设备上唯一激活的新功能是iPhone屏幕边缘的闪光彩带,当用户唤起Siri时。
过去,苹果只在大会上展示已经在检测设备上运行,并经营销团队批准,确保功能和商品能够按时发布。

在2024年苹果开发者大会上,Siri新功能的演示
即便如此,仍然给外界留下了深刻的印象。
该功能公布后两天内,苹果股价上涨了10%以上,华尔街认可苹果推出AI计划。
一些前苹果员工表示,他们对Federighi和Rockwell扭转Siri的局面充满信心。
比起Giannandera和Walker,他们更倾向于事事必亲,而不是更依赖下属管理的具体事项。
对于软件项目的技术细节,Federighi有时甚至超过了负责这些项目的初级工程师。
Rockwell被认为是一个有远见的领导者,不仅可以为项目注入新的思路,还可以巧妙地适应公司文化。
Federighi已经开始做出改变。
即使需要在软件产品中使用软件产品,他指示Siri的机器学习工程师,并不惜一切代价创建顶级的AI功能。与苹果自主研发模式相比,采用其它公司的开源模式。
AI热潮正在兴起
OpenAI于2022年11月发布ChatGPT,震惊了科技界和公众。
不过,Giannandrea团队的前工程师表示,团队高层领导并没有表现出危机感。
相比之下,Federighi的软件工程团队反应敏感。
许多前苹果员工表示,Intelligent Systems团队领导迅速分享LLM的论文,并公开讨论如何利用这些技术改进iPhone。
Intelligent 在向Federighi演示了AI在iPhone上的功能之后,Systems团队内部情绪高涨。
在OpenAI模型的帮助下,这些demo展示了AI如何理解客户手机的屏幕内容,并且可以通过更自然的对话来操作应用程序和执行其他任务。

随后,AI团队和软件工程团队的高管们开始争夺LLM驱动的新功能主动。
软件工程团队在交付方面一直享有良好的声誉,占据上风。
尽管苹果内部已经尝试了OpenAI模型,但是在2023年,管理层告诉工程师,最终产品不能使用外部公司模型,只适合与自主研发模型进行对比测试。
打造苹果大模型,旨在与OpenAI竞争,是Giannandrea团队的职责。
不过,根据很多在2023-2024年使用这些模型之前的苹果员工的说法,他们的性能远不如OpenAI。
AIMLess(漫无目的)
对于世界上市值最高的苹果来说,如何有效地使用AI是当前最关键的挑战之一。
这些都与iPhone和同类产品能否继续保持技术领先水平有关。
随着OpenAII的发展,Siri因其创新而受到批评。 AI产品如ChatGPT爆红,外部不满愈演愈烈。
仅仅九个月前,在开发者大会上,苹果还向投资者保证,将采用Siri升级等功能,在AI领域奋起直追。
对于苹果来说,这次推迟发布是极其尴尬的。
这一困境部分源于其不可动摇的企业价值观。

苹果对用户隐私的高度重视,使得模型训练难以获取大量数据,同时也难以验证系统端AI功能的效果。
但是,很多曾经在AI和软件部门工作过的人都表示,苹果内部高层的个性矛盾,也是一个重要原因。
在Giannandrea领导的AI/ML团队工作之前,超过六名苹果员工表示,领导力不足是问题的根源。
她们指出,Walker不仅缺乏野心,而且缺乏承担责任的勇气。
在苹果内部,AI/ML团队气氛疏松,执行力差,他得到了一个讽刺的昵称。「AIMLess」(由AI/ML首字母组合而成的漫无目的)。
与Federighi领导的软件工程团队形成鲜明对比的是苹果内部对AI/ML团队的负面评价。
软体工程团队以其在操作系统、信息、照片、电子邮件和其它应用方面的优秀工作而闻名。
花了两年时间,只是为了去掉「嘿,Siri」的「嘿」
实际上,Siri的问题已经存在很多年了。
2018年,Giannandrea负责新成立的AI团队,从谷歌跳槽到苹果。科技界普遍认为苹果已经找到了关键人才。
据知情人士透露,虽然当时一些高管认为Giannandrea可能对自动驾驶更感兴趣,但他特别关注Siri。
当时,苹果在2011年推出的Siri发展停滞不前。它对常识性问题表现不佳,对第三方应用的支持极其有限。
Siri团队的成员在接手Giannandrea之前,在苹果内部感到不受重视。
Siri工程师对软件工程团队主导iOS更新不满意,认为他们没有优先考虑修复Siri的问题。另一方面,Siri团队认为Siri团队跟不上节奏,无法支持Federighi团队推出的新功能。
Giannandrea曾经说过,他有信心借鉴谷歌建立AI语音助手的方法来改善Siri。
为了回答常识性问题,他认为苹果只需要获得适当的训练数据,并提高从网络上获取信息的能力。
和Giannandrea一起工作过的人形容他随和、安静,不喜欢和别人发生冲突,这与苹果高管团队中要求严格、性格强势(A型人格)的人形成鲜明对比。

从左至右:Tim Cook、John Giannandrea和Craig Federighi
Giannandrea经常向员工讨论他的想法。他坚信机器学习可以逐步改善商品,从而实现重大进步。他称之为「登山」。
在ChatGPT发布之后,他还表达了不看好聊天机器人的观点,并表示,他认为聊天机器人对用户没有什么价值。。
Walker是Siri的领导者,他经常受到同事的批评。他于2013年加入苹果,并于2022年底开始负责Siri的日常运营。
Walker不愿意在批评者眼中进行大刀阔斧的冒险,只关注性能提升有限的指标,缺乏创新Siri的长远规划。
为了一些细微的进步,他经常会得意忘形,比如把用户对Siri提问的响应时间缩短几个百分点。
Walker的一件骄傲的作品,就是去掉唤起Siri的语音命令。「嘿Siri」里的「嘿」单词,这个任务需要两年多的时间才能完成。
Walker也拒绝了一个建议。该团队计划使用LLM给予Siri更强的情感感知,以便识别来自困境的客户,并做出适当的回应。
但是,这个项目的工程师绕过了他,继续与软件工程团队的安全和定位小组合作开发这个功能。
薪水更高,晋升更快?
由Federighi领导的软件工程团队和Giannandrea的AI/ML团队之间的关系越来越紧张,经常僵持不下。
就管理风格而言,两人截然不同。
Giannandrea更加随和,因为Federighi管理严格,要求极高。
会议期间,Federighi经常像珠炮一样向同事提问,Giannandrea更倾向于倾听。

John Giannandrea
其它方面的不满也在悄然积累。
一些软件工程团队成员对AI团队同事工资高、晋升快感到恼火。
她们也很生气,有些AI团队工程师可以享受更长的假期,周五还可以提前下班,自己却要面对繁重的工作安排。
两个团队之间的不信任越来越深。
Giannandrea的副手今年早些时候要求详细记录一个联合项目的开发过程,以防止项目失败,Federighi团队将责任归咎于AI团队。
Federighi还成立了自己的机器学习团队,这进一步加剧了紧张关系。
Intelligent 由其高级副手Sebastienenen,Systems团队成员超过100人。 Marineau-负责操作的Mes。
在Siri团队的帮助下,他们对自己的模型进行了训练,并建立了多个demo,让用户使用语音命令来控制应用程序。
在一次内部演示中,一名团队成员展示了一个ppt,两座山碰撞后被夷平。有人认为这是对Giannandrean的。「登山」思想的隐晦讽刺。
2022年,Intelligent Systems团队开始与Walker和Vision负责 RockwellPro高管合作,启动了一个代码为Link的项目,但是这个项目很快就陷入了困境。
该项目旨在为混合现实头显和AR眼镜开发语音命令,以控制应用程序,实现目标。

Mike Rockwell
参加三方会议的工程师震惊了Rockwell和Marineau-Mes对Walker公开披露的敌意。
他们经常支持Vision,因为Siri。 Pro进展缓慢,对Walker表示不满。
例如,Rockwell希望戴头显示器的用户可以通过Siri通过语音浏览网页,调整窗口大小。他还想象两个在虚拟空间交流的人可以一起和Siri互动,比如一起规划假期。
但是Siri团队的一些成员对此表示怀疑。最终,由于Siri团队能力的限制,Rockwell为Vision Pro设想的许多功能被削减。
参考资料:
https://www.theinformation.com/articles/apple-fumbled-siris-ai-makeover?rc=epv9gi
本文来自微信微信官方账号“新智元”,作者:新智元,编辑:英智,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




