Science新研究:AI编程正扩大开发者技能与收入差距,高频使用的新手获益最少
乌得勒支大学的研究团队借助机器学习方法,对GitHub上160097名开发者提交的超3000万份Python代码展开了系统分析,首次大规模地揭示了AI编程的渗透现状。

论文链接:https://www.science.org/doi/10.1126/science.adz9311
数据显示,到2024年底,美国约29%的Python函数由AI辅助生成或直接生成,且在GitHub Copilot、ChatGPT等AI工具发布后,这一比例出现爆发式增长。不过,AI的普及并不均衡,德国、法国的采用率约为23%-24%,印度快速追至20%,其他国家的采用率则明显滞后。
需要注意的是,虽然AI大幅提升了资深开发者的生产力与创新能力,但频繁使用AI的早期职业开发者并未获得实质的效率提升。这意味着,AI可能正在重塑软件开发领域的技能与职业发展阶梯。
全球AI编程采纳差异显著
过去,了解生成式AI在实际工作中的使用情况,主要依靠开发者的问卷调查或短期受控实验。但这些方法存在明显局限:受访者可能因社会期许低报使用频率,实验也难以捕捉长期真实工作场景下的动态变化。因此,要客观、大规模衡量AI对生产力的真实影响,需要能直接观察行为痕迹的新方法。
为此,研究团队创新性地训练了一个神经分类器。该分类器通过GraphCodeBert模型深入理解代码的数据流和结构,并在包含纯人类编写代码与不同大语言模型生成的合成代码的训练集上学习,能有效区分二者的细微差异。

图|将Python函数中的代码分类为人工生成或AI生成。
研究发现,截至2024年底,美国约29%的Python函数被标记为AI生成或辅助完成。这一比例并非匀速上升,在GitHub Copilot预览版推出、ChatGPT公开上线及GPT-4发布等关键节点后,AI生成代码占比均出现陡峭跃升。

图|美国GitHub用户创建或大幅修改的Python函数占比,垂直线表示95%置信区间,揭示了AI关键事件与使用情况突变的对应关系。
这表明,关键生成式AI工具的发布,会直接推动AI生成代码数量显著增长,印证了技术可用性提升能迅速激发开发者实际应用,并反映在代码产出中。
不过,生成式AI在全球扩散的同时,各国采纳速度差异显著:美国早期领先,但优势在收窄;德国、法国以23%-24%的采用率紧随其后;印度采用率快速攀升至20%,展现出强大追赶势头;其他国家采用率则相对落后。这种差异可能源于本地化工具生态、全球主流模型访问限制及技术文化与应用场景的不同。
AI编程的真正获益者是谁?
研究证实,生成式AI确实提升了整个行业的输出效率。模型估计,当AI生成代码比例从0提升至29%(2024年底美国采用率)时,开发者每季度代码提交量平均增加3.6%。

图|基于用户-季度面板回归,结合用户和季度固定效应,估计生成式AI对用户活动的影响。
但深入个体层面分析发现,AI带来的红利并未被平等分享,呈现显著分化。
对资深开发者而言,AI不仅提高写代码速度,更能放大其核心能力。将AI使用率提升至29%,资深开发者代码提交量增长高达6.2%,远超行业平均。更重要的是,AI帮助他们轻松使用不熟悉的软件库和新技术组合,使其能更快进入新领域、尝试新方案,扩展创新边界。

图|相比有经验的开发者,缺乏经验的开发者生产力提升更少。
与直觉相反,尽管初级开发者AI采用率更高(37%),但并未获得可统计的显著生产力提升。

图|按用户GitHub使用年限划分的生成式AI使用强度(2024年,美国)。
为何使用程度最高的人群获益最少?研究指出,这可能源于工作性质与使用方式的差异:资深开发者善于在广泛任务中利用AI,能高效审查调试复杂AI生成代码;而新手可能更多用AI处理基础、模板化任务,或因经验不足难以有效利用和优化AI产出。
早期职业开发者虽使用AI频率更高,但未像资深开发者那样获得生产力或探索新领域的收益。这表明,AI可能替代了新手部分基础编码工作,却未增强其解释复杂代码或系统性创新的能力,导致他们难以利用AI完成任务。
最终,AI显著拉大了资深与初级开发者的效率与创新差距。这不仅是当前产出差异,更预示未来职业路径分化:熟练驾驭AI的资深开发者可能加速迈向更高价值工作,依赖AI却未提升核心竞争力的新手,可能面临更激烈的同质化竞争。
本文来自微信公众号“学术头条”(ID:SciTouTiao),作者:王跃然,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com



