GPT-四是进入内容审核行业,一天顶人类几个月
本文来自微信微信官方账号:量子位 (ID:QbitAI),作者:克雷西,原标题:“OpenAI已经进入内容审核行业,学校图书馆已经用ChatGPT选择了色情描述”。第一张图片来自:unsplash
学院图书管理员,已开始使用ChatGPT来选择带有色情内容的书籍。
根据一项新规定,爱荷华州的美国大学需要将包含性生活描述在图书馆的书籍下架,但“按照新的要求阅读每本书并选择它们是不可行的”。
借助ChatGPT,一个学区终于在开学前选出了19本符合条件的书。
第二天,OpenAI还正式宣布将GPT-4引入内容审计系统。
就OpenAI而言,GPT-4本审查功能可以将审查更新周期从几个月缩短到几个小时,并且具有更强的灵活性。
高效率自动化内容审核
这一新功能不仅提高了效率,减轻了人类的工作量,而且解决了人工审计中不一致的问题。
最为重要的是,它可以避免有害内容对审计人员造成的身心伤害。
Reed编辑是一家科技媒体。 Albergoti表示:
使用大型语言模型进行内容审查是前进的一步。
并非因为它有多完美,而是因为它的尺度会更加一致,而且不容易受到人类情感和文化差异的影响。
在工作过程中,关键环节是用户政策的设计,这部分是人工主导的。
未来GPT-4将使用一些例子来检验和提高准确性。
通过对GPT-4的预测微调小型筛选器,可以对信息进行批量检查。
OpenAI发言人还透露,一些客户已经使用GPT-4进行了内容审查,但是没有给出具体的清单。
另外,OpenAI正在研究将这个功能从文本审批扩展到图像和视频的识别。 。
所以,这个功能到底好不好?
OpenAI:有信心做得很好
GreggregOpenAI总裁兼创始人 Brockman说,这个功能“非常可靠”。
与此同时,Brockman还显示了测试结果的依据。
判断色情、暴力等多种类型的有害内容,GPT-4人的表现超过了经过少量训练的人。
然而,与经验丰富的审批人员相比,确实存在一些差距。
但是OpenAI安全和认可部门原主管Davee Willner面对著名的科技媒体人Casey “这种情况不会持续太久,”Newton说。
还有负面观点认为,总会有人想尽办法钻AI规则的漏洞。
归根结底,大型越狱事件已不止一两次发生。
Frank,美联社 更有甚者,Bajak表示,像ChatGPT这样的大型语言模型“很难控制”。
对于这一点,Weng也承认,确实没有办法做到100%没有漏洞,但是有信心会很好。
从一开始,我们就不能建立一个100%的“防弹”系统。
每个人都在帮助我们抓住模型中的错误,但是我很有信心它会做得很好。
One More Thing
GPT-4内容审核功能的实用性暂时按下不表,OpenAI的安全工作本身也有很多争议。
根据Time杂志的消息,OpenAI在肯尼亚雇佣数据标记人员标记有害内容的过程中,一些参与者表示,暴力、折磨等有害内容给他们带来了心理创伤。
新的方法出台后,人类仍然需要参与内容审查,但是这种情况可能会大大减少。
参考链接:
[1]https://openai.com/blog/using-gpt-4-for-content-moderation
[2]https://www.popsci.com/technology/iowa-chatgpt-book-ban/
[3]https://www.semafor.com/article/08/15/2023/can-chatgpt-become-a-content-moderator
[4]https://twitter.com/gdb/status/1691500101187805185
[5]https://twitter.com/caseynewton/status/1691602324366786575
本文来自微信微信官方账号:量子位 (ID:QbitAI),作家:克雷西
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




