谷歌更新隐私政策：有权收集公开数据用于模型培训

商界观察

2023-07-05

OpenAI和微软此前被一些匿名人士集体起诉，称他们利用互联网上大量的公开数据来培养AI，并以此牟取私利。

在这一事件中，有关用户在网上发布的信息是否属于受保护著作权的问题成为争议焦点。诸如维基百科、社交媒体、博客等数以百万计的棘手的问题，用户可能并不在意自己的文字在网络上的二次传播，但可能不愿意拿来作为某个公司AI模型的“教科书”。

或许是受到竞争对手的启发，谷歌选择先堵住这个漏洞。

7月1日，谷歌更新了隐私政策，现在的政策中明确谷歌有权收集任何公开可用的数据，并将其用于其人工智能模型的训练。

换句话说，谷歌已经向所有用户明确表示，只要能从公开渠道获取内容，未来就可以用来训练自己的Bard模型或者所有人工智能。

用户可能不知道隐私政策，但只要他们继续使用谷歌，根据这项政策，他们的信息可以默认用于训练谷歌人工智能模型。

很难评价谷歌的做法是否是恰当的，因为事实上，像谷歌这样的大型搜索引擎服务提供商在收集公共信息或数据方面几乎没有任何限制。它每天会抓取数十亿的公共网页，以索引到其庞大的数据库中，这是OpenAI和微软都不具备的优势。

但从法律上来说，由于对AI的监管还处于非常初级的阶段，人们很难明确公共数据用于私有模型是否存在法律障碍。

不过，谷歌这种“骚操作”也可能被一些数据拥有者看穿，比如推特。

根据推特最近的政策，不同的账户将拥有不同的推特内容访问权限，例如，经过验证的帐户每天可以看到数万条推文，而陌生访客将无法访问推文。

这一策略在很大程度上限制了谷歌所谓的公开可获得数据的范围，当然这也引起了许多推特用户的不理解。

推特执行董事马斯克公开表示，推特之前的数据被大量掠夺，导致普通用户的服务质量下降。因此，即使用户不理解马斯克的决定，他仍然有足够的理由实施这一政策，以阻止AI公司们一波又一波地薅推特羊毛。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com