五大手机实测，大模型新功能到底能做什么？

2024-05-12

假使你像老狐一样关注手机发布会啊，你会发现除了Cpu之外、图像，屏幕，系统这些，最近有一个功能各大手机品牌会花很多时间来介绍。

但是，如果你买了手机，前面的软硬件就是你要考虑的问题， AI 大型模型，我想 99% 没有人会考虑，对吧？

不可否认，AI 代表未来，而且手机厂商都在这方面投入了很高的成本，那么现在手机的大模型哪个最好用呢？

我们找到了华为，小米，OPPO 、vivo ，而且看了其他家庭的新闻发布会后，自信心爆棚，又决定召开新闻发布会的魅族，他们的新旗舰机。

看看这五个大模型中谁的功能更强。

首先介绍一下参数。

vivo X100 和 OPPO Find X7 用的是天玑 9300 ，根据MTK的说法，支持最高支持 330 大模型的亿参数在端侧运行。

vivo 宣传手机的大模型是端侧侧 70 亿加云端 700 亿。

OPPO 在这里，安第斯大模型是 70 亿端侧加 1800 亿云端。

华为 Mate 60 Pro 在华为背后有一个盘古大模型团队，而不是侧载大模型，而是通过云大模型来处理客户的需求。

高通骁龙用于小米和魅族。 8 Gen3 ，支持端侧 100 十亿参数模型。

大型魅族模型 Flyme AI ，宣传是开放的 AI 。简而言之，就是自己不开发，与其他大型团队合作。

雷军在去年 8 月亮发布会上提到小米跑通了。 13 一亿规模的端侧大模型，但达到小米。 14 但是发布的时候没有提到。

因此，小米 14 、魅族 21 和华为手机一样，很有可能没有大模型的侧载，或者不值一提。

在 AI 在设置中，还可以找到一些证据，find X7 支持清除离线图线，vivo 支持本地图片风格化和文档总结。

但在 Mate 60 Pro 、小米 14 和魅族 21 里面，没有本地大模型的设置。

要说的是，OPPO 的离线和 vivo 这个地方是有区别的。

OPPO 即使断网，还是可以消除画面物体，vivo 当地的大型模型一旦断网就不能使用。

上述是各大模型的基本情况。

就参数而言，OPPO 的云端 1800 亿挺唬人，但华为有盘古大模型，在模型技术这一块积累得更深，大家觉得谁强？

各手机厂商对于大模型的应用，都是将大模型融入到原来的语音助手中，所以开启方式还是包括在内。语音唤醒、长按电源键唤起、耳机唤起。

但是各大厂商也有不同的设计，华为和 OPPO 为语音助手提供快捷的方法。

vivo 除了 “ 蓝心小 V 还有“”，还有“” Jovi 声音”，蓝心小 V 是 Jovi 部分语音功能。

小米没有 APP ，点击底部搜索框右侧的小爱同学图标即可进入大模型功能。若经常使用搜索功能，这种设计非常好。

但是一位原教旨主义资深米粉同事则表示，这一搜索框必须撤销，因为不能使用还占用屏幕。

最佳设计是魅族，长按底部横条 mback 按键可以进入语音助手，这种呼出方式还支持识屏，在设备上如影随形，让人感觉很简洁。

我知道这里可能有人夸耀魅族，但是先等等…

魅族还有一个“魅族” Aicy 语音 ”，而在这里 APP 主界面，但没有语音入口，需要进入下一级菜单才能打开场景语言助手功能。

并且，在 Aicy 语音里，Mback 呼出语音助手功能无效。

这儿的交互逻辑，让人感到十分疑惑，就像我们盖了一栋房子，一楼没有门，要从二楼的窗户进去。

但我还是想夸一句，魅族的 mback 真的很有气场。

回到日常使用体验，我们从日常服务开始，首先是最常用的语音助手功能。

比如打开相册，播放歌曲，这位语音助手都会，不做演示。

现在我们将延长对话：我想让你帮我打开一些。 APP ，先打开相册。

华为小艺在这里，OPPO 小布和小米小爱都可以正确识别并打开相册。

vivo 小 V 说明超出了理解范围…

魅族小溪也没有打开，但是从对话的角度来看，它似乎理解了我的要求，推荐了相册应用。

那么我们再复杂一点，把相册前面放在相册前面。“ 开启 ”去掉这个关键字：请帮我打开一些APP，首先是相册。

来到这儿，小爱同学和小布都失败了，“ 开启一些 ” 成为干扰因素，小爱同学就是 APP 请求暂时无法支持，小布已经开始推荐其他请求。 APP 了。

小 V 仍然超出了理解范围，魅族明白了，推荐了相册应用，只有华为成功了。

顺便说一句，在这里，没有大模型。 Siri 同时执行成功，小伙伴们可以试一试。

再复杂一点，变成多个。 APP ：我想让你帮我打开一些。 APP ，第一个是相册，然后关掉，再打开哔哩哔哩。

华为仍然是唯一一个执行操作的人。

也许有些人会认为这样测试语音助手的理解能力是没有用的，是在吹毛求疵，那么，如果我们想让它设置闹钟...

像我这样起床困难的家庭，起床起码得设置 3 个闹铃吧：明天早上请帮我设置闹钟，一个7:50，一个7:55，一个8:00。

只有小艺三个闹钟设置成功，而其它闹钟只能读取一个时间点来设置闹钟。

此时此刻，我明白，每个人的脑海里都有那四个字啊。

就在我惊叹小艺远远领先于同行这么多时候，检测其他人。 APP 时间却翻车了。

举例来说，让他们在美团找外卖：寻找美团的鸡蛋炒饭

小 V 能够成功识别并找到鸡蛋炒饭，小爱和小布同学可以打开美团。

而且小艺不能执行。

但如果换成京东、淘宝搜索耳机，小艺可以成功。

类似地，在哔哩哔哩搜索央视新闻，小艺和小布会失败，小布会失败， V 可以和小爱同学一起成功。

在第三方 APP 执行指令，小 V 这是最好的表现。

细心的朋友可能已经发现了，这里我没有提到魅族。 “ 小溪 ” ，由于……

总体而言，小艺和小艺 V 各有胜负，小艺语言理解能力最好，但是第三方 APP 操作方面，小 V 表现更佳。

而且“小溪”语音助手和大模型似乎是分开的，理解我的指令，但是没有操作。 APP 的权限。

就计算而言，我们可以使用大型模型来帮助我们进行简单的计算。

例如，我去年真正遇到的一个概率问题，0.975 的 126 第二方，这个数据手机助手可以正确计算，通过。

值得注意的是，这一数据最近火了。 kimi 推算出来是错误的。

再次使用常见的鸡腿同笼问题进行检测，原本以为大模型处理这类问题已经驾轻就熟了啊，没想到有个玩家翻车了。...

这个问题：一个铁笼子关着鸡和兔子， 76 只腿，26 大小，鸡和兔子分别是多少？

大多数大模型计算鸡是一种大模型。 14 只，兔子 12 只是，只有小爱同学是错误的，数值是鸡。 23 只，兔子 7 只。

我们测试了很多次这个结果。...

更离谱的是，有时候小爱的同学会列出一个二元方程。当你认为这次终于对了，他的价值颠倒了兔子和鸡。

此时此刻，老狐大概感觉到了帮助学渣学习的痛苦。

不知雷总是怎么看待这个结果。

就工作效率而言，作为自媒体，我们最看重的自然是大模型在文稿方面的优势。

假如要总结一篇稿子的重点内容，它们的表现如何？

我们找到了一篇文章，科技狐最近读了一百多万。。

但是，小爱和小布都没有总结这篇长文的能力，无法上传。 Word 文件，粘贴文本有字数限制，两者都撤出了这个评价。

剩下的小 V 、小溪和小艺里，小 V 有的舍本逐末，有一半的总结是文章介绍，后面讨论的内容被一笔带过。相比之下，小溪和小艺的总结显然更加全面。

另一方面，我又测试了他们写稿子的水平，给出的指令是写一篇关于英伟达历史发展的稿子，然后尴尬地来了。

小布与小溪的开头部分高度相似，同样的错误也出现了。

关于黄仁勋早期的一段描述，都提到他曾经在一段时间里。 1983 2008年在加州大学伯克利分校攻读博士学位。

事实上，在这段时间里，黄仁勋还在读本科。

他们同时引用了错误的信息来源，这的确让人感到尴尬。

小艺的稿子就像列重点一样，记住流水账。

小 V 无论走到哪里，几乎每一段都是从年份开始的，简单描述一下今年企业的重大事件。小艺和小艺 V 结果就是编年体公司的发展历史。

相比之下，小爱生产的稿件可以用出众的文采来形容，分为副标题，重要的产品介绍，现在的行业地位描述，最后还有两个提升。

除这类科普稿外，我们还要求他们写作产品推荐稿，推荐稿， 2000 手机元价位段。

小艺推荐了 3 这款手机，其中数据可谓一塌糊涂，红米 note 11 pro 摄像机和屏幕胡写，reno 5 处理器和屏幕尺寸错误。

更加离谱的是，华为享受着。 X20 这个手机，市场上不会有，真正存在的机型就是华为享受。 20 和荣耀 X20 。

华为与荣耀的关系，也许是对大模型的误解。

唯一值得称赞的是，小艺并不自私，推荐红米和红米。 OPPO 的商品。

小布和小 V 这两种商品私心较强，只推荐自己的品牌。

小布把自家 reno5 K 和 A93s 处理器型号错误，小型 V 参数上没有错误，而且是新款，但是建议手机简单列出几个参数卖点。

不知大家有没有发现，小艺，小布和小布。 V 不管是多写还是少写，都只推荐三款，转到小爱的时候，它终于推荐了四款手机。

但是，产品参数还是有错误的，自己家 note 12 pro 错误的相机参数，iQOO Z6 充电功率也是错误的。

魅族小溪的参数至少是错误的，但是没有预防， iQOO Z5 在这个手机上，原来的屏幕幕尺寸 6.67 寸写成了 6.78 寸。

总体来看看，没有值得信赖的大模型。

就文字形式而言， V 与小爱列举参数的方式不同。

小布和小溪的文字看起来仍然像稿子，但是每篇推荐文章的结构都是一样的，首先写Cpu，然后介绍屏幕，然后是图像，最后是电池和充电功率，缺乏变化。

小艺的稿子变化更大，但也是错误最大的。

由于这些大模型的形成，没有一个可以使用。

这类手稿篇幅较短，推荐型号较少。

让我们增加另一个条件，将字数扩展到 2000 字：帮助我写一篇稿子，选题是 2000 推荐手机元左右，字数在元左右。 2000 字左右。

就结果而言，小 V 忽略字数要求，几乎没有变化。

小爱两次推荐都是 4 一部手机，除了 iQOO Z6 除此之外，其它型号也发生了变化，为了提高字数，每个型号的描述都从特征转变为优缺点。

小艺字数没有增加多少，型号也没有改变。

小布增强了 2 模型，字数增加了，但是远非如此。 2000 字。

溪流没有增加型号，，引入和总结的空间大大增加，并增加了两章:推荐原则和标准、购买建议和注意事项，以满足字数要求，甚至将标题从推荐改为深度推荐。

看来到大模型，也是懂水字数的。

总体而言，在文本生成方面，结果很难令人满意，我真的拔不出矮子里的将军。

除文字外，在图像方面，小艺、小溪目前并不支持生成图片。

小 V 、小布和小爱支持生成图像。

无论画什么场景，小爱同学都保持着色彩丰富的插画风格。

小布的场景偏向于现实。

而小 V 那就是各式各样的风格。

但是在一些详细描述的场景中，大模型无法按规定导出照片。

比如描述一个小姑娘在卖火柴，小狗在旁边睡着了，结果小姑娘也没卖火柴。

而且他们现在还不支持对生成图片进行微调。

上述就是我们在模型中常用的功能感受，由于篇幅的关系，我们不再介绍翻译、敲码等功能。

假如要对这些手机的大模型功能进行评估，我们就要把它们分开。

手机对人类自然语言的理解能力在语音助手部分，在模型的加持下得到显著提高。

因此，我们可以让语音助手帮助我们做更多的事情。

这个部分华为手机最好，可以实现一次发布多个指令使其完成，虽然在这些都是美团，哔哩哔哩 APP 上面失败了，但是瑕不掩瑜。

其次是 vivo 、OPPO 、小米，最糟糕的是魅族小溪。

我理解魅族制作开放式设备与他人合作的方式，但是在融入手机系统方面的确不尽如人意。

但是在生成文本方面，手机大模型与理想效率还有很大差距。

他们生产的文章要点总结还可以，写出来的稿子要么不能满足需求，要么错误很多，要么太简单，还有很长的路要走。

值得注意的是，在完成本项目的最后，当我们再次检测到大模型的推荐效果时，我们发现 vivo 的小 V 取得了显著的进步。

再一次让它推荐 2000 元手机，虽然推荐结果还是 vivo 三部手机，但是文字比以前有了很大的进步，反而变成了一部手机， 5 台式手机生成效果最好。

尽管 AI 目前大模型还不是消费者选择手机的参考标准，但是就像 vivo 一样，整个 AI 该领域的技术进步速度令人惊讶，相信未来大模型将会有广阔的前景。

智能手机自诞生之初就诞生了。 1993 2008年，迎来爆发 iPhone 时刻（ iPhone 3G ），整整用了 15 年。

和智能手机一样 AI ，最终会迎来一个 iPhone 时刻。

本文来自微信微信官方账号“科技狐”（ID：kejihutv），作者：老狐，36氪经授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

“向僵尸开枪”手游端买入量飙升榜一，iOS 每月7000W，数据如何？

单日营收突破4万元的20平小店，“绣球花冰淇淋”爆红，奶茶店怎么跟？

在中美“再全球化豪赌”的背后，美国利率居高不下。

硅谷顶级投资者：未来大势所趋，80%的投资者走错了方向

《穿过月亮的旅行》翻不了国产爱情片。