
2026 年的软件工程:当 AI 写代码的速度超过人类理解的速度
AI 让写代码变便宜了,但代码审查、架构设计、系统品味这些「人力资源」环节成了新的瓶颈。软件工程的瓶颈正在从生产端转向消费端。
原文来源:Software Engineering in 2026 — Ben Congdon 关于 2026 年软件工程关键问题与瓶颈迁移的深度分析
Ben Congdon 在 2025 年底写了一篇关于 2026 年软件工程格局的预测。与其说是预言,不如说是一组清醒的问题清单。他把注意力放在了最容易被忽略的地方:AI 并没有均匀地降低所有环节的成本——它降低了生产的成本,但消费(审查、运维、理解)的成本基本没变。这种不对称才是 2026 年软件工程真正的挑战。
核心论点:边际成本下降,瓶颈迁移
LLM 工具目前的主要影响是:生产高质量代码的边际成本(时间和金钱两方面)都显著下降了。
这句话看起来是好事。但 Congdon 的洞察是:当生产的边际成本下降,而消费(阅读、审查、集成)的成本不变,整个系统的瓶颈就会迁移。
这就像高速公路。你可以把车造得越来越便宜,但如果收费站没有变多,堵车的就不是工厂,而是收费站。
2026 年的软件工程,收费站正在变得拥挤。
—— 广告 ——
基础设施抽象:回报加速,但运维成本没变
好的基础设施抽象在 LLM 加速下回报更加突出。核心基础设施——指标、日志、告警、特性开关、发布系统、自动伸缩、编排、配置、缓存、网络——这些仍然是每家公司都必须处理的问题。
关键是让基础设施自助化:提供友好的 CLI、MCP 就绪的 API,让人类和 AI 都能轻松使用。需要「基础设施工程师介入」的环节越少越好。
但注意:运营(操作系统)的成本还没有像构建成本那样下降。你可以用 AI 更快地写好一个 Kubernetes 部署配置,但当它半夜出问题时,你还是得有人爬起来看。
CI 基础设施:更高赌注
当 AI 写的代码越来越多,CI 的质量、准确性和速度变得比以往任何时候都重要。
一个有趣的推论:LLM 非常擅于写测试。人类不喜欢写测试,因为它们机械、重复、像税收。AI 完全没有这种心理障碍。
所以 2026 年的团队没有借口不做到几乎穷尽的测试场景覆盖。
Congdon 建议重新思考单元测试的投资结构:在底层组件中投入更多到属性测试(property testing)和形式化验证(formal verification)。这些领域是 LLM 可以从「逐条写测试」提升到「系统性验证不变式」的地方。
人类引导的抽象:对抗意大利面条的最后防线
这是整篇文章中我认为最重要的洞察。
清晰的模块边界、库接口、基础设施和产品层之间的契约——这些是维护长期代码质量的高杠杆手段。
为什么?因为 LLM 在写代码时没有「系统品味」。给定一个任务,它倾向于找到最贪婪的、能通过 CI 的最短路径。如果没有清晰的边界约束,AI 会以惊人的速度制造意大利面条式代码。
你曾经担心一个 junior 程序员会在两周内搞乱你的代码库吗?AI 可以在两小时内做到同样的事,而且更有说服力。
人类架构师的角色不是写更多代码,而是定义那些 LLM 无法自己发现的抽象边界。用 Congdon 的话说:这是「在 AI 填充整个缝隙之前,先把承重墙砌好」。
代码审查:新的瓶颈
当一个 junior 用 AI 每小时生成 500 行代码,而你每小时只能审查 100 行时,数学就出了问题。
谁的活都干不完。
Congdon 的建议是把风格检查完全交给自动化 lint(AI 来写 lint 规则,AI 来执行,都在预提交阶段完成)。人类的审查应该聚焦在:
- 接口变更
- 数据持久化代码
- 性能关键代码
- 那些 AI 不容易生成的决策
这就带来了一个悖论:junior 开发者需要比以往更早地培养「审查品味」(review taste),但他们在实际写代码方面获得的练习更少了。不写足够多的代码,如何建立判断代码好坏的标准?
这可能是 2026 年软件工程教育中最未解决的问题。
项目时间估算:方差急剧增大
AI 能处理的任务和不能处理的任务之间的差距在拉大。
- AI 友好的任务(CRUD、样板代码、标准化配置):时间节约 50-80%
- AI 不友好的任务(深层上下文、底层系统、高影响域代码):时间节约接近 0%
这对项目经理来说是个噩梦。一个 Sprint 中可能有 80% 的任务在 AI 帮助下几小时完成,而剩下 20% 仍然需要两周。极端方差的估算比统一的慢更难管理。
更有趣的是,这会产生一种压力:把高价值项目「推」向更 AI 友好的方向。有些项目可以(比如代码中心的迁移),有些不能(比如网络协议实现)。能够正确判断哪些应该被推、哪些不能碰——这本身是一种稀缺技能。
自建 vs 购买:天平在倾斜
- 对商品化 SaaS(薄 UI 加 CRUD):中到大型科技公司的决策会明显倾向于自建,因为开发成本已经降到足够低。
- 对基础设施即服务或合规即服务:变化不大,因为运维成本没有像开发成本那样下降。
这个区别很重要。说明「构建成本下降」不等于「总拥有成本下降」。如果你自建一个系统后需要投入运维人力,那可能还是买现成的更划算。
开放式问题:留给整个行业的问题
Congdon 留下了几个没有答案的问题,我认为它们是 2026 年最有价值的问题:
- **我们还需要对每一行代码做人工审查吗?**哪些代码是承重的,必须细看?哪些是「随便写写也行」的?
- **如何让软件工程师「对抗 AI 产出质量的平庸化」?**当每个人都用相似的模型、相似的提示词,产出趋向同质化——你怎么往上加「额外的质地」?
- 当模型再快 100 倍或 1000 倍时,什么会改变?
对第三个问题,他有一个具体的推测:当推理足够便宜,你可以在每条服务日志上都跑一个 LLM。试想一下,每次错误日志出现时,AI 立刻分析上下文、翻 Git 历史、定位到最近的变更——这不是远程的调试助手,而是附着在每行日志上的实时同伴。
两个实用的建议
读完这篇文章,我有两个可以立刻带走的做法:
- 开始写
CLAUDE.md(或其他 AI 指令文件)。定义你的项目中的不可违反的约定,让 AI 在生成代码时知道边界在哪里。 - 在代码审查上投入更多时间,在代码生成上投入更少。2026 年,读代码的能力比写代码的能力更稀缺。
当每个人都在关注 AI 能写多少代码时,真正有经验的工程师在关注「这些代码值不值得被写进去」。这种区分——可代码生成性 vs 可集成性——可能是 2026 年区分 senior 和 junior 的核心标准。
© 2026 四月 · CC BY-NC-SA 4.0
原文链接:https://aprilzz.com/ramble/software-engineering-2026-bottlenecks
相关文章
代码行数找了个更好的公关:AI 效率指标背后的真相
从 Google 的 '75% 新代码由 AI 生成' 到 Anthropic 的 '80% 代码由 Claude 编写',AI 公司正在用代码行数替代真正的效率指标。这篇深度分析揭示了为什么这些数字经不起推敲。
2026 年想入行软件工程?门槛已经高到离谱
2026 年想进入软件行业的新人面临的现实:AI 正在消灭"练手级"工作,过去培养初级开发者的路径正在断裂,入行门槛从 6 英尺飙升到了 20 英尺还加了铁丝网
Grug 脑开发者的智慧:一个自嘲的程序员怎样看透软件工程的复杂性
《The Grug Brained Developer》用原始人 Grug 的口吻,讲述了一个资深开发者对软件工程复杂性的深刻洞察——从说不的艺术到测试的辩证法,从微服务的陷阱到类型系统的价值。