程序员最喜欢的问答网站,为ChatGPT开启了“奶妈”
Stack Overflow,由于致力于技术问答和社区运营,一个类似知乎、Reddit的老牌网站在全球程序员圈中备受青睐。

但是自ChatGPT问世以来,这个网站的浏览量和搜索量都在短时间内急剧下降,许多程序员开始放弃使用。
为留住用户,Stack 首先,Overflow封杀了ChatGPT,然后推出了自研AIGC产品,但是接连不断的“自救”仍然无法阻止流量的大幅下降。
令人吃惊的是,Stack 本周一,Overflow突然宣布与OpenAI签订协议,并为其提供数据。
有趣的是,Stack Overflow不仅与OpenAI合作,还购买了谷歌Gemini模型的丰富数据。
AI阻挡不了程序员最大的问答网站
在程序员圈里,Stack Overflow的地位有多高?
简而言之,作为一个老牌的问答网站,Stack Overflow已成立16年,最高每月浏览2亿台主机。
无论是一线厂商的技术巨头,还是刚入门的计算机新手,只要提出编程问题,总会有网友冲锋在前,提供想法,甚至直接给出最优解答。
正是因为数据庞大,Stack 虽然Overflow的名气不如Reddit,但它也是圈内人必备的网站。
但是在ChatGPT问世之后,事情开始朝着衰落的方向发展。
在 ChatGPT上线后,很快就有网友发现其优秀的代码生成能力,所以“ChatGPT可以替代Google、Stack Overflow”这句话引起了许多程序员的注意。
但令人意想不到的是,仅仅上线5天之后,Stack Overflow反手, ChatGPT 给封杀了。
这是因为ChatGPT产生的代码错误太离谱了,所以Stack Overflow宣布,所有这些产生垃圾答案的帐户都将被关闭。
有趣的是,Stack Overflow团队发现,很多用来训练AI模型数据的人实际上来自Stack。 Overflow。
假如让AI机器人产生垃圾回答,那不就等于搬起石头砸自己的脚吗?
虽然Stack Overflow的表态非常明确,很多程序员都能理解,但是ChatGPT的感觉真的很香。!
最终,面对AI的强势攻击,Stack Overflow的流量也越来越差,到2023年6月,访问量几乎减半。
为缓解颓势,Stack Overflow 这是一系列措施的开始。
首先,七月份,技术团队利用自己5800万个问题和答案的数据库,制作了一个名为“答案”的数据库「OverflowAI」的AI 工具,它的功能主要集中在编程上,但是没有引起太多的波澜。
十月份,企业CEO宣布解雇约28%的员工,通过减少营销预算,为此, 持续输血的AI工具。
然而,由于OverflowAI仍处于初级测试阶段,OverflowAI可以做的只是拖延Stack,因为它面临着强大而不断进化的ChatGPT。 Overflow衰落的速度。
销售数据,好香
当面临ChatGPT威胁时,Stack Overflow最初选择使用“防御”的姿势。
然而,众所周知,这些公开的互联网数据已经被OpenAI等科技公司用“爬虫”等手段搜索过了,他们不仅要面对客户的流失,还要面对数据的流失。
但毕竟每天的浏览量都在那里,Stack Overflow手里拿着大量高质量的数据,倒也成了一种可交易的资源。
自从《纽约时报》带头起诉OpenAI以来,越来越多的新闻媒体和门户网络参与了OpenAI的征求。
当面临版权问题时,科技公司只能为培训数据支付费用,并承诺不使用个人数据。。
Reddit、Youtube、ShutterStock、Photobucket等网站都是数据交易的受益者,拥有大量高质量的培训资料,科技巨头们花钱也不吝啬。
相比之下,Stack Overflow的数据同样出色,甚至比Reddit这样的综合网站更专业。
因此,Stack Overflow CEO也开始学会向各大科技公司推销自己的数据,其中包括Google。 Gemini 模型。
或许正是看到了科技公司对高质量数据的渴望,让高层选拔的态度发生了360度的巨大变化。既然用户回不来了,至少他们可以在口袋里赚钱。。
值得注意的是,Stack 当时Overflow强调,这个协议并不是唯一的,这意味着任何科技公司都可以购买相同的数据,剩下的就看哪个培训得更好了。
据报道称,Stack Overflow 技术内容将和 OpenAI 的 GPT-4 通过OverflowAPI浏览等模型,未来开发者可以直接通过OverflowAPI浏览。 OpenAI可以获得可靠且经过验证的数据,并且可以帮助他们快速找到解决复杂问题的方法。
还有Stack Overflow 还可以从开发社区收集反馈,保证 AI 不断改进开发工具。
简而言之,Stack Overflow和 OpenAI进行了技术和数据的交换,前者提高了AI能力,后者获得了可靠的数据,两者都取得了双赢。
据报道,预计本次合作将带来第一组集成功能和能力, 2024 今年上半年发布,这也说明双方的合作实际上已经持续了很长时间。
隐私还是个大问题?
目前,越来越多的社区网站开始参与AI培训,包括百度贴吧的“弱智吧”,在一项研究中表现出极佳的数据培训效果,一度冲上热搜。
对传统内容网站的浏览量持续下降,高质量的数据的确是一个可以长期进行的“副业”。
另外,AI虽然很香,但并非没有缺陷。
从Stack开始 Overflow开始转向AI开发能力后,开发者社区的一些成员反对这一变化,他们担心人工智能产生的信息的有效性和数据隐私。
还有专家指出,AI会导致更多的错误代码被推入代码库,甚至会放大当前软件项目中的漏洞和安全问题。
但是对“饥渴”的AI企业来说,不断膨胀的数据消耗问题已经足够令人头痛。
而且网站的帮助,正好可以为自己分担一些风险。。
本文来源于微信微信官方账号“镁客网”(ID:im2maker),作者:MKWjh,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




