Skip to content

AI生产力悖论:22000名开发者遥测揭示的真相

AI编码助手提升开发者产出,但未提升公司生产力

Section titled “AI编码助手提升开发者产出,但未提升公司生产力”

生成式AI正在重写软件开发的规则——但并不总是以领导者预期的方式。虽然超过75%的开发者现在正在使用AI编码助手,但许多组织报告了一种脱节:开发者说他们工作得更快,但公司没有看到交付速度或业务成果的可衡量改善。

基于来自1,255个团队、超过10,000名开发者的遥测数据,Faros AI最近的标志性研究报告确认:

  • 使用AI的开发者正在编写更多代码并完成更多任务
  • 使用AI的开发者正在并行更多工作流
  • AI增强的代码变得更大、更多bug,并将瓶颈转移到审查
  • AI采用与关键绩效指标之间的任何相关性在公司层面都会消失

这种现象,我们称为”AI生产力悖论”,提出了重要问题和关切:为什么广泛的个人采用没有转化为显著的业务成果,以及AI转型领导者应如何规划未来道路。

#1 个人产出飙升,审查队列膨胀

Section titled “#1 个人产出飙升,审查队列膨胀”

高AI采用团队的开发者完成的任务多21%,合并的拉取请求多98%,但PR审查时间增加91%,揭示了一个关键瓶颈:人工审批。

当审查瓶颈、脆弱的测试和缓慢的发布管道无法匹配新速度时,AI驱动的编码收益就会消失——这就是阿姆达尔定律(Amdahl’s Law)所捕捉的现实:系统的移动速度只与其最慢的链接一样快。没有全生命周期的现代化,AI的好处很快就会被中和。

高AI采用团队的开发者每天接触的任务多9%,拉取请求多47%。

历史上,上下文切换一直被视为负面指标,与认知过载和减少专注力相关。

AI正在改变这个基准,标志着一种新运营模式的出现:在AI增强环境中,开发者不仅在编写代码——他们正在跨多个工作流启动、解除阻塞和验证AI生成的贡献。

随着开发者的角色演变为包括更多编排和监督,更高的上下文切换是预期的。

虽然我们观察到AI使用与正面质量指标之间存在适度相关性(来自有限时间序列数据的更少代码异味和更高测试覆盖率),但AI采用始终与每位开发者9%的bug增加和平均PR大小154%的增加相关。

AI在某些情况下可能支持更好的结构或测试覆盖率,但它也放大了数量和复杂性,对下游审查和测试系统施加了更大压力。

尽管存在这些团队级别的变化,我们观察到AI采用与公司层面的改善之间没有显著相关性。

在总吞吐量、DORA指标和质量KPI方面,在团队行为中观察到的收益在聚合时不会扩展。

这表明下游瓶颈正在吸收AI工具创造的价值,而整个组织中不一致的AI采用模式——团队经常相互依赖——正在消除团队级别的收益。

四种AI采用模式有助于解释平台期

Section titled “四种AI采用模式有助于解释平台期”

即使使用量上升,我们也确定了四种采用模式,有助于解释为什么团队级别的AI收益通常无法扩展:

  • AI采用最近才达到临界质量。 在大多数公司,广泛使用(>60%周活跃用户)仅在最近两到三个季度才开始,表明采用成熟度和支持系统仍在发展中。
  • 即使整体采用看起来强劲,团队之间的使用仍然不均衡。 由于软件交付本质上是跨职能的,孤立地加速一个团队很少转化为组织层面有意义的收益。
  • 采用偏向于资历较浅的工程师。 使用率在公司新人中最高(不要与刚入行的初级工程师混淆)。这可能反映了新聘人员如何依赖AI工具来导航不熟悉的代码库并加速早期贡献。相比之下,高级工程师中较低的采用率可能表明对AI支持更复杂任务的怀疑,这些任务依赖深度系统知识和组织上下文。
  • AI使用仍然停留在表面。 在整个数据集中,大多数开发者只使用自动完成功能。聊天、上下文感知审查或agentic任务执行等高级能力在很大程度上未被利用。

工程领导者下一步应该做什么?

Section titled “工程领导者下一步应该做什么?”

在大多数组织中,AI使用仍然由自下而上的实验驱动,没有结构、培训、总体战略、仪器或最佳实践共享。

少数看到性能收益的公司采用了整个行业需要采用的特定策略,以使AI编码协作者在大规模上提供可衡量的投资回报。