WPS再次陷入用户隐私事件,这次真的是一个误解。
要说网上最容易引起网友共鸣的话题,除了各种付费会员涨价,直接关系到大家钱包的事情,可能还有个人隐私相关的问题。毕竟没有人想在网上“裸奔”。就在上周末,一位网络作者在社交平台上发布了一篇文章,称“豆包用WPS云数据训练AI”,给出的证据是其编写的文档尚未发布,只存储在WPS云中,但字节跳动的豆包AI准确引用了相关内容。

经过一个周末的发酵,一家互联网制造商将用户未公开的数据私下授予的“丑闻”呼之欲出。所以,WPS客户服务官微很快就站出来辟谣,“最近有用户给WPS反馈 与AI相关的问题,我们在第一时间进行了严格的调查和用户沟通,相关问题完全不真实。此外,WPS还强调,没有与字节跳动旗下的豆包AI进行任何AI合作,也不会有AI训练中使用的相关文档。
事实上,WPS如此渴望证明自己的清白背后是有原因的。毕竟这是他们第二次卷入用户文档作为AI训练语料料的风波。此前,去年11月16日,金山办公公司宣布拥有大语言模型能力的人工智能办公应用WPS 开启AI首测。AI应用作为一个考虑已久的AI应用,WPS AI上线后很快引起了各方的关注,但仅仅过了三天,就有用户发现其隐私政策默认允许用户在AI培训中使用主动上传的文档。
为什么WPS会把客户创作的内容训练成AI?在强烈的群体条件下,WPS不得不紧急“灭火”。并承诺所有用户文档不会用于任何AI培训目的,也不会在未经客户同意的情况下用于任何情况。隐私政策审查将定期进行,合规性审批将通过第三方独立机构进行,以确保相关承诺的履行。
当时WPS公开承诺用户文档不会被用来训练AI的“历史负担”,导致对“用户信息喂AI”极其敏感。
那么问题来了。WPS这次是不是明知故犯?事实上,他们是无辜的。首先,目前WPS和字节跳动在AI方面没有合作,随着《个人信息保护法》的出台,互联网厂商与其他第三方共享用户个人信息是有限制的,需要单独获得客户的同意,而不是所谓的“一揽子同意”。
第二,在AI跑道上,WPS和字节跳动的豆包是竞争对手。WPS AI支持文本、表格、PPT、PDF等主流办公部件可以提供20多个功能,如快速拟定文档、处理复杂函数公式、协助阅读长文本等。作为AI大模型产品,字节跳动的豆包在文生文和文生图领域与WPS AI显然有竞争关系。
数据生成的语料已成为AIGC迭代升级的燃料,只有不断地给AI喂食数据,才能使结果更加准确。如今,“数据短缺”甚至不再是高高挂在AI厂商头上的达摩克利斯之剑,而是真正成为这些厂商的难题,以至于各大巨头都开始饥肠辘辘。毕竟苹果和英伟达以前都无法想象用Youtube上的视频字幕训练AI。
除了Reddit这样的企业,为了在上市时更好地看到自己的财务,然后出售自己的用户信息,任何对AI领域有很大兴趣的厂商都可能不会用灰色手段抓取朋友的数据,但他们必然会抗拒向第三方出售自己的数据。毕竟AI功能吸引用户购买价格更贵的“大会员”的法宝,有没有理由无缘无故便宜字节跳动?
最后,也是最关键的一点。这位网络作者控告WPS将用户文档交给豆包的原因是他公开发表的作品中没有“手机掉进厕所”的情节,后者只存储在WPS云中作为手稿。然而,基于作者的网络标题和“手机掉进厕所”的情节,一些神奇的网民在搜索引擎上找到了包括上述内容在内的盗版小说网站。
毕竟大豆包模型本质上也是AI搜索,是从全网收集数据,然后整合给出答案。这个时候爬虫遍历全网的时候,拿走作者的网络文章作为盗版小说网站的参考资料也是合乎逻辑的。要知道,基于大语言模型的AI搜索在输出内容时是“中文翻译”,所以内容相似也就不足为奇了。
在这一点上,这件事似乎揭示了真相。然而,有趣的是,互联网公司的倒卖数据是如何成为如此有市场的网络迷因的?这可能是因为国内互联网公司在历史上有各种不折不扣的个人信息收集策略。近年来,在《个人信息保护法》和工业和信息化部的大力控制下,互联网制造商收集用户信息的手段变得更加柔和。
此前,工业和信息化部每隔一段时间就会公开损害用户权益的App,比如擅自向第三方收集个人信息、擅自共享数据、过度索取权限等损害用户权益的例子数不胜数。就连知乎、当当、七猫小说等上市公司的产品也曾“名列前茅”。
作为互联网公司的重要资产,用户信息可以通过对用户行为数据的分析,对某一类用户群体的偏好进行梳理,从而完成用户画像。在用户画像的帮助下,互联网制造商可以知道每个用户的年龄、性别和喜好。在此基础上,数字广告行业的精准推送成为现实。所以互联网厂商之间互相分享用户信息,也早已成为之前逆势而上时代的公开秘密。
由于案底太多,所以一有风吹草动,就不能让顾客不浮想联翩。更致命的是,在厂商和用户之间的博弈中,客户通常处于绝对低位,厂商的数据处理对用户来说是一个纯粹的黑箱,甚至监管部门通常缺乏提前控制的技术资源。纵观过去曝光的用户数据相关问题,几乎不是黑客攻克厂商的防御,用用户信息进行销售,最终迫使厂商承认,剩下的几乎都是厂商内部人士的主动曝光。
无法跨越“塔西佗陷阱”,这实际上是目前国内互联网厂商在客户个人隐私方面的命门。
本文来自微信微信官方账号“三易生活”,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




