随笔·阅读约 2 分钟·
2026 年的软件工程:当 AI 写代码的速度超过人类理解的速度

2026 年的软件工程:当 AI 写代码的速度超过人类理解的速度

AI 让写代码变便宜了,但代码审查、架构设计、系统品味这些「人力资源」环节成了新的瓶颈。软件工程的瓶颈正在从生产端转向消费端。

原文来源:Software Engineering in 2026 — Ben Congdon 关于 2026 年软件工程关键问题与瓶颈迁移的深度分析

Ben Congdon 在 2025 年底写了一篇关于 2026 年软件工程格局的预测。与其说是预言,不如说是一组清醒的问题清单。他把注意力放在了最容易被忽略的地方:AI 并没有均匀地降低所有环节的成本——它降低了生产的成本,但消费(审查、运维、理解)的成本基本没变。这种不对称才是 2026 年软件工程真正的挑战。

核心论点:边际成本下降,瓶颈迁移

LLM 工具目前的主要影响是:生产高质量代码的边际成本(时间和金钱两方面)都显著下降了。

这句话看起来是好事。但 Congdon 的洞察是:当生产的边际成本下降,而消费(阅读、审查、集成)的成本不变,整个系统的瓶颈就会迁移。

这就像高速公路。你可以把车造得越来越便宜,但如果收费站没有变多,堵车的就不是工厂,而是收费站。

2026 年的软件工程,收费站正在变得拥挤。

—— 广告 ——

基础设施抽象:回报加速,但运维成本没变

好的基础设施抽象在 LLM 加速下回报更加突出。核心基础设施——指标、日志、告警、特性开关、发布系统、自动伸缩、编排、配置、缓存、网络——这些仍然是每家公司都必须处理的问题。

关键是让基础设施自助化:提供友好的 CLI、MCP 就绪的 API,让人类和 AI 都能轻松使用。需要「基础设施工程师介入」的环节越少越好。

但注意:运营(操作系统)的成本还没有像构建成本那样下降。你可以用 AI 更快地写好一个 Kubernetes 部署配置,但当它半夜出问题时,你还是得有人爬起来看。

CI 基础设施:更高赌注

当 AI 写的代码越来越多,CI 的质量、准确性和速度变得比以往任何时候都重要。

一个有趣的推论:LLM 非常擅于写测试。人类不喜欢写测试,因为它们机械、重复、像税收。AI 完全没有这种心理障碍。

所以 2026 年的团队没有借口不做到几乎穷尽的测试场景覆盖

Congdon 建议重新思考单元测试的投资结构:在底层组件中投入更多到属性测试(property testing)和形式化验证(formal verification)。这些领域是 LLM 可以从「逐条写测试」提升到「系统性验证不变式」的地方。

人类引导的抽象:对抗意大利面条的最后防线

这是整篇文章中我认为最重要的洞察。

清晰的模块边界、库接口、基础设施和产品层之间的契约——这些是维护长期代码质量的高杠杆手段。

为什么?因为 LLM 在写代码时没有「系统品味」。给定一个任务,它倾向于找到最贪婪的、能通过 CI 的最短路径。如果没有清晰的边界约束,AI 会以惊人的速度制造意大利面条式代码。

你曾经担心一个 junior 程序员会在两周内搞乱你的代码库吗?AI 可以在两小时内做到同样的事,而且更有说服力。

人类架构师的角色不是写更多代码,而是定义那些 LLM 无法自己发现的抽象边界。用 Congdon 的话说:这是「在 AI 填充整个缝隙之前,先把承重墙砌好」。

代码审查:新的瓶颈

当一个 junior 用 AI 每小时生成 500 行代码,而你每小时只能审查 100 行时,数学就出了问题。

谁的活都干不完。

Congdon 的建议是把风格检查完全交给自动化 lint(AI 来写 lint 规则,AI 来执行,都在预提交阶段完成)。人类的审查应该聚焦在:

  • 接口变更
  • 数据持久化代码
  • 性能关键代码
  • 那些 AI 不容易生成的决策

这就带来了一个悖论:junior 开发者需要比以往更早地培养「审查品味」(review taste),但他们在实际写代码方面获得的练习更少了。不写足够多的代码,如何建立判断代码好坏的标准?

这可能是 2026 年软件工程教育中最未解决的问题。

项目时间估算:方差急剧增大

AI 能处理的任务和不能处理的任务之间的差距在拉大。

  • AI 友好的任务(CRUD、样板代码、标准化配置):时间节约 50-80%
  • AI 不友好的任务(深层上下文、底层系统、高影响域代码):时间节约接近 0%

这对项目经理来说是个噩梦。一个 Sprint 中可能有 80% 的任务在 AI 帮助下几小时完成,而剩下 20% 仍然需要两周。极端方差的估算比统一的慢更难管理。

更有趣的是,这会产生一种压力:把高价值项目「推」向更 AI 友好的方向。有些项目可以(比如代码中心的迁移),有些不能(比如网络协议实现)。能够正确判断哪些应该被推、哪些不能碰——这本身是一种稀缺技能。

自建 vs 购买:天平在倾斜

  • 商品化 SaaS(薄 UI 加 CRUD):中到大型科技公司的决策会明显倾向于自建,因为开发成本已经降到足够低。
  • 基础设施即服务或合规即服务:变化不大,因为运维成本没有像开发成本那样下降。

这个区别很重要。说明「构建成本下降」不等于「总拥有成本下降」。如果你自建一个系统后需要投入运维人力,那可能还是买现成的更划算。

开放式问题:留给整个行业的问题

Congdon 留下了几个没有答案的问题,我认为它们是 2026 年最有价值的问题:

  1. **我们还需要对每一行代码做人工审查吗?**哪些代码是承重的,必须细看?哪些是「随便写写也行」的?
  2. **如何让软件工程师「对抗 AI 产出质量的平庸化」?**当每个人都用相似的模型、相似的提示词,产出趋向同质化——你怎么往上加「额外的质地」?
  3. 当模型再快 100 倍或 1000 倍时,什么会改变?

对第三个问题,他有一个具体的推测:当推理足够便宜,你可以在每条服务日志上都跑一个 LLM。试想一下,每次错误日志出现时,AI 立刻分析上下文、翻 Git 历史、定位到最近的变更——这不是远程的调试助手,而是附着在每行日志上的实时同伴。

两个实用的建议

读完这篇文章,我有两个可以立刻带走的做法:

  1. 开始写 CLAUDE.md(或其他 AI 指令文件)。定义你的项目中的不可违反的约定,让 AI 在生成代码时知道边界在哪里。
  2. 在代码审查上投入更多时间,在代码生成上投入更少。2026 年,读代码的能力比写代码的能力更稀缺。

当每个人都在关注 AI 能写多少代码时,真正有经验的工程师在关注「这些代码值不值得被写进去」。这种区分——可代码生成性 vs 可集成性——可能是 2026 年区分 senior 和 junior 的核心标准。

分享到
微博Twitter

© 2026 四月 · CC BY-NC-SA 4.0

原文链接:https://aprilzz.com/ramble/software-engineering-2026-bottlenecks