五大手机实测,大模型新功能到底能做什么?
假使你像老狐一样关注手机发布会啊,你会发现除了Cpu之外、图像,屏幕,系统这些,最近有一个功能各大手机品牌会花很多时间来介绍。
但是,如果你买了手机,前面的软硬件就是你要考虑的问题, AI 大型模型,我想 99% 没有人会考虑,对吧?
不可否认,AI 代表未来,而且手机厂商都在这方面投入了很高的成本,那么现在手机的大模型哪个最好用呢?
我们找到了华为,小米,OPPO 、vivo ,而且看了其他家庭的新闻发布会后,自信心爆棚,又决定召开新闻发布会的魅族,他们的新旗舰机。
看看这五个大模型中谁的功能更强。
首先介绍一下参数。
vivo X100 和 OPPO Find X7 用的是天玑 9300 , 根据MTK的说法,支持最高支持 330 大模型的亿参数在 端侧运行 。
vivo 宣传手机的大模型是端侧侧 70 亿加云端 700 亿 。
OPPO 在这里,安第斯大模型是 70 亿端侧加 1800 亿云端。
华为 Mate 60 Pro 在华为背后有一个盘古大模型团队,而不是侧载大模型,而是通过云大模型来处理客户的需求。
高通骁龙用于小米和魅族。 8 Gen3 ,支持端侧 100 十亿参数模型。
大型魅族模型 Flyme AI ,宣传是开放的 AI 。 简而言之,就是自己不开发,与其他大型团队合作。
雷军在去年 8 月亮发布会上提到小米跑通了。 13 一亿规模的端侧大模型,但达到小米。 14 但是发布的时候没有提到。
因此,小米 14 、魅族 21 和华为手机一样,很有可能没有大模型的侧载,或者不值一提。
在 AI 在设置中,还可以找到一些证据,find X7 支持清除离线图线,vivo 支持本地图片风格化和文档总结。
但在 Mate 60 Pro 、小米 14 和魅族 21 里面,没有本地大模型的设置。
要说的是,OPPO 的离线和 vivo 这个地方是有区别的。
OPPO 即使断网,还是 可以消除画面物体,vivo 当地的大型模型一旦断网就不能使用。
上述是各大模型的基本情况。
就参数而言,OPPO 的云端 1800 亿挺唬人,但华为有盘古大模型,在模型技术这一块积累得更深,大家觉得谁强?
各手机厂商对于大模型的应用,都是将大模型融入到原来的语音助手中,所以开启方式还是包括在内。语音唤醒、长按电源键唤起、耳机唤起。
但是各大厂商也有不同的设计,华为和 OPPO 为语音助手提供快捷的方法。
vivo 除了 “ 蓝心小 V 还有“”,还有“” Jovi 声音”,蓝心小 V 是 Jovi 部分语音功能。
小米没有 APP ,点击底部搜索框右侧的小爱同学图标即可进入大模型功能。若经常使用搜索功能,这种设计非常好。
但是一位原教旨主义资深米粉同事则表示,这一搜索框必须撤销,因为不能使用还占用屏幕。
最佳设计是魅族,长按底部横条 mback 按键可以进入语音助手,这种呼出方式还支持识屏,在设备上如影随形,让人感觉很简洁。
我知道这里可能有人夸耀魅族,但是先等等…
魅族还有一个“魅族” Aicy 语音 ”,而在这里 APP 主界面,但没有语音入口,需要进入下一级菜单才能打开场景语言助手功能。
并且,在 Aicy 语音里,Mback 呼出语音助手功能无效。
这儿的交互逻辑,让人感到十分疑惑,就像我们盖了一栋房子,一楼没有门,要从二楼的窗户进去。
但我还是想夸一句,魅族的 mback 真的很有气场。
回到日常使用体验,我们从日常服务开始,首先是最常用的语音助手功能。
比如打开相册,播放歌曲,这位语音助手都会,不做演示。
现在我们将延长对话:我想让你帮我打开一些。 APP ,先打开相册。
华为小艺在这里,OPPO 小布和小米小爱都可以正确识别并打开相册。
vivo 小 V 说明超出了理解范围…
魅族小溪也没有打开,但是从对话的角度来看,它似乎理解了我的要求,推荐了相册应用。
那么我们再复杂一点,把相册前面放在相册前面。“ 开启 ”去掉这个关键字:请帮我打开一些APP,首先是相册。
来到这儿,小爱同学和小布都失败了,“ 开启一些 ” 成为干扰因素,小爱同学就是 APP 请求暂时无法支持,小布已经开始推荐其他请求。 APP 了。
小 V 仍然超出了理解范围,魅族明白了,推荐了相册应用, 只有华为成功了 。
顺便说一句,在这里,没有大模型。 Siri 同时执行成功,小伙伴们可以试一试。
再复杂一点,变成多个。 APP :我想让你帮我打开一些。 APP ,第一个是相册,然后关掉,再打开哔哩哔哩。
华为仍然是唯一一个执行操作的人。
也许有些人会认为这样测试语音助手的理解能力是没有用的,是在吹毛求疵, 那么,如果我们想让它设置闹钟...
像我这样起床困难的家庭,起床 起码得设置 3 个闹铃吧:明天早上请帮我设置闹钟,一个7:50,一个7:55,一个8:00。

只有小艺三个闹钟设置成功,而其它闹钟只能读取一个时间点来设置闹钟。
此时此刻,我明白,每个人的脑海里都有那四个字啊。
就在我惊叹小艺远远领先于同行这么多时候,检测其他人。 APP 时间却翻车了。
举例来说,让他们在美团找外卖:寻找美团的鸡蛋炒饭
小 V 能够成功识别并找到鸡蛋炒饭,小爱和小布同学可以打开美团。
而且小艺不能执行。
但如果换成京东、淘宝搜索耳机,小艺可以成功。
类似地,在哔哩哔哩搜索央视新闻,小艺和小布会失败,小布会失败, V 可以和小爱同学一起成功。
在第三方 APP 执行指令,小 V 这是最好的表现。
细心的朋友可能已经发现了,这里我没有提到魅族。 “ 小溪 ” ,由于……
总体而言,小艺和小艺 V 各有胜负,小艺语言理解能力最好,但是第三方 APP 操作方面,小 V 表现更佳。
而且“小溪”语音助手和大模型似乎是分开的,理解我的指令,但是没有操作。 APP 的权限。
就计算而言,我们可以使用大型模型来帮助我们进行简单的计算。
例如,我去年真正遇到的一个概率问题,0.975 的 126 第二方,这个数据手机助手可以正确计算,通过。
值得注意的是,这一数据最近火了。 kimi 推算出来是错误的。
再次使用常见的鸡腿同笼问题进行检测,原本以为大模型处理这类问题已经驾轻就熟了啊,没想到有个玩家翻车了。...
这个问题:一个铁笼子关着鸡和兔子, 76 只腿,26 大小,鸡和兔子分别是多少?
大多数大模型计算鸡是一种大模型。 14 只,兔子 12 只是,只有小爱同学是错误的,数值是鸡。 23 只,兔子 7 只。
我们测试了很多次这个结果。...
更离谱的是,有时候小爱的同学会列出一个二元方程。当你认为这次终于对了,他的价值颠倒了兔子和鸡。
此时此刻,老狐大概感觉到了帮助学渣学习的痛苦。
不知雷总是怎么看待这个结果。

就工作效率而言, 作为自媒体,我们最看重的自然是大模型在文稿方面的优势。
假如要总结一篇稿子的重点内容,它们的表现如何?
我们找到了一篇文章,科技狐最近读了一百多万。 。
但是,小爱和小布都没有总结这篇长文的能力,无法上传。 Word 文件,粘贴文本有字数限制,两者都撤出了这个评价。
剩下的小 V 、小溪和小艺里,小 V 有的舍本逐末,有一半的总结是文章介绍,后面讨论的内容被一笔带过。相比之下,小溪和小艺的总结显然更加全面。
另一方面,我又测试了他们写稿子的水平,给出的指令是写一篇关于英伟达历史发展的稿子,然后尴尬地来了。

小布与小溪的开头部分高度相似, 同样的错误也出现了。
关于黄仁勋早期的一段描述,都提到他曾经在一段时间里。 1983 2008年在加州大学伯克利分校攻读博士学位。

事实上,在这段时间里,黄仁勋还在读本科。

他们同时引用了错误的信息来源,这的确让人感到尴尬。
小艺的稿子就像列重点一样,记住流水账。
小 V 无论走到哪里,几乎每一段都是从年份开始的,简单描述一下今年企业的重大事件。小艺和小艺 V 结果就是编年体公司的发展历史。
相比之下,小爱生产的稿件可以用出众的文采来形容,分为副标题,重要的产品介绍,现在的行业地位描述,最后还有两个提升。

除这类科普稿外,我们还要求他们写作 产品推荐稿,推荐稿, 2000 手机元价位段。
小艺推荐了 3 这款手机,其中数据可谓一塌糊涂,红米 note 11 pro 摄像机和屏幕胡写,reno 5 处理器和屏幕尺寸错误。
更加离谱的是,华为享受着。 X20 这个手机,市场上不会有,真正存在的机型就是华为享受。 20 和荣耀 X20 。
华为与荣耀的关系,也许是对大模型的误解。
唯一值得称赞的是,小艺并不自私,推荐红米和红米。 OPPO 的商品。
小布和小 V 这两种商品私心较强,只推荐自己的品牌。
小布把自家 reno5 K 和 A93s 处理器型号错误,小型 V 参数上没有错误,而且是新款,但是建议手机简单列出几个参数卖点。
不知大家有没有发现,小艺,小布和小布。 V 不管是多写还是少写,都只推荐三款,转到小爱的时候,它终于推荐了四款手机。
但是,产品参数还是有错误的,自己家 note 12 pro 错误的相机参数,iQOO Z6 充电功率也是错误的。

魅族小溪的参数至少是错误的,但是没有预防, iQOO Z5 在这个手机上,原来的屏幕 幕尺寸 6.67 寸写成了 6.78 寸。
总体来 看看,没有值得信赖的大模型。
就文字形式而言, V 与小爱列举参数的方式不同。
小布和小溪的文字看起来仍然像稿子, 但是每篇推荐文章的结构都是一样的,首先写Cpu,然后介绍屏幕,然后是图像,最后是电池和充电功率,缺乏变化。
小艺的稿子变化更大,但也是错误最大的。
由于这些大模型的形成,没有一个可以使用。

这类手稿篇幅较短,推荐型号较少。
让我们增加另一个条件,将字数扩展到 2000 字:帮助我写一篇稿子,选题是 2000 推荐手机元左右,字数在元左右。 2000 字左右。
就结果而言,小 V 忽略字数要求,几乎没有变化。

小爱两次推荐都是 4 一部手机,除了 iQOO Z6 除此之外,其它型号也发生了变化,为了提高字数,每个型号的描述都从特征转变为优缺点。
小艺字数没有增加多少,型号也没有改变。
小布增强了 2 模型,字数增加了,但是远非如此。 2000 字。
溪流没有增加型号, ,引入和总结的空间大大增加,并增加了两章:推荐原则和标准、购买建议和注意事项,以满足字数要求,甚至将标题从推荐改为深度推荐。
看 来到大模型,也是懂水字数的。
总体而言,在文本生成方面,结果很难令人满意,我真的拔不出矮子里的将军。
除文字外,在图像方面,小艺、小溪目前并不支持生成图片。
小 V 、小布和小爱支持生成图像。
无论画什么场景,小爱同学都保持着色彩丰富的插画风格。

小布的场景偏向于现实。
而小 V 那就是各式各样的风格。

但是在一些详细描述的场景中,大模型无法按规定导出照片。
比如描述一个小姑娘在卖火柴,小狗在旁边睡着了,结果小姑娘也没卖火柴。
而且他们 现在还不支持对生成图片进行微调。

上述就是我们在模型中常用的功能感受,由于篇幅的关系,我们不再介绍翻译、敲码等功能。
假如要对这些手机的大模型功能进行评估,我们就要把它们分开。
手机对人类自然语言的理解能力在语音助手部分,在模型的加持下得到显著提高。
因此,我们可以让语音助手帮助我们做更多的事情。

这个部分华为手机最好,可以实现一次发布多个指令使其完成,虽然在 这些都是美团,哔哩哔哩 APP 上面失败了,但是瑕不掩瑜。
其次是 vivo 、OPPO 、小米,最糟糕的是魅族小溪。
我理解魅族制作开放式设备与他人合作的方式,但是在融入手机系统方面的确不尽如人意。
但是在生成文本方面,手机大模型与理想效率还有很大差距。
他们生产的文章要点总结还可以,写出来的稿子要么不能满足需求,要么错误很多,要么太简单,还有很长的路要走。
值得注意的是,在完成本项目的最后,当我们再次检测到大模型的推荐效果时,我们发现 vivo 的小 V 取得了显著的进步。
再一次让它推荐 2000 元手机,虽然推荐结果还是 vivo 三部手机,但是文字比以前有了很大的进步,反而变成了一部手机, 5 台式手机生成效果最好。

尽管 AI 目前大模型还不是消费者选择手机的参考标准,但是就像 vivo 一样,整个 AI 该领域的技术进步速度令人惊讶, 相信未来大模型将会有广阔的前景。
智能手机自诞生之初就诞生了。 1993 2008年,迎来爆发 iPhone 时刻 ( iPhone 3G ) ,整整用了 15 年。
和智能手机一样 AI ,最终会迎来一个 iPhone 时刻。
本文来自微信微信官方账号“科技狐”(ID:kejihutv),作者:老狐,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




