AI 时代到底该怎么管一个工程团队

Fiona Fung 在 Anthropic 大会上讲了 28 分钟，聊了聊 AI 时代到底该怎么管一个工程团队。

Fiona Fung 演讲标题页

她做这套幻灯片时，Anthropic 还没有推出 Routines 功能。

三周后，Routines 上线了。这是一个让 Claude Code 在云端按计划自动跑任务的功能，不需要在本地一直开着终端。等到她真正站上 Code with Claude 2026 大会的讲台时，幻灯片里好几张就已经过时了。

Fiona Fung 是 Anthropic 旗下 Claude Code 和 Cowork 两条产品线的工程与产品负责人。她之前在微软干了十二年（从 Visual Studio 做起），后来去 Meta 带过 Facebook Marketplace 和 Instagram 的工程团队，在 2025 年 9 月加入了 Anthropic。这次演讲不到三十分钟，主题听起来很普通：“AI 时代怎么管一个工程团队”，但她讲的全是这一年来在 Claude Code 团队踩过的坑、砸碎的旧规则，以及还没想明白的现实挑战，一点也不讲抽象的空话。

Fiona Fung 演讲封面

视频原链接：https://www.youtube.com/watch?v=igO8iyca2_g

演讲议程

要点速览

软件工程的瓶颈过去是“写代码慢”，现在则转移到了验证、评审、跨职能协作和安全性上。 过去的各种流程都是基于“写代码很贵”这个假设设计的，现在既然“写代码几乎免费”，流程就必须全部重构。
流程极少会自然消亡，组织只会一层层地往上叠加 SLA、规章制度和评审。用 AI 改造工程团队的第一步，其实就是明确允许大家砍掉陈旧流程。
技术辩论的方式变了。过去是把人拉到白板房里画架构图，现在是让 Claude 同时搓出三个 PR，连着对 API 的实际影响范围一起对着代码讨论。
在 Claude Code 团队，所有的 PR 都有 Claude 的参与。“这段代码到底是谁写的？”这个问题已经渐渐失去意义。
经理必须从一线 IC (个人贡献者) 做起。Fiona 在招人时死死咬住这一条，负责招聘的同事一开始甚至不能理解：“现在哪有经理愿意倒回去先写代码的”。她的回应很干脆：“不愿意就趁早好聚好散”。
组织尽量扁平、所有小组共享一个团队目标（mission）。理由很简单：目标一变，层级越多越容易产生对齐损耗，扁平意味着灵活。
代码就是唯一的“事实来源”（source of truth），而不是设计文档。 如果非要保留 spec，就把 spec 提交进代码库，让 Claude 去校验代码与文档是否一致。
衡量效果看三个指标：新人上手时间、PR 的生命周期、Claude 辅助提交的比例。但她也警告，别死盯着“有多少代码是 AI 写的”，那只是虚荣指标，关键要看产品质量和可靠性。

【1】二十年里，行业被重塑了两次

瓶颈已经转移

演讲一开始，Fiona 把时间线拉回了 2000 年代初。她当时在微软做 Visual Studio 2005——全球主流的开发工具之一。那会儿软件还是靠 CD 发行的（再早点是软盘）。因为软件要送到流水线上刻盘、装盒、铺货到店里，每个版本都有雷打不动的发布主线。

后来互联网来了，把发行方式从 CD 变成了在线分发，工程节奏随之被颠覆。现在轮到 AI，但这次变的不只是发行节奏，而是“写代码”这件事本身。

过去管用的老经验，现在未必行得通了。（“What served you prior may not serve you any longer.”）

她在演讲里反复回到这一句。多年来工程节奏围绕一个假设搭建：写代码贵、写测试贵、重构贵。从瀑布到敏捷，每一种方法论都是在分配这块稀缺资源。

过去工程带宽是昂贵资源

去年她还在抱怨 vibe coding（凭感觉编程，由 OpenAI 联合创始人 Andrej Karpathy 在 2025 年初提出）：“为什么到处用常量，工程实践不好。”一年之后，模型变得能干太多。这种突破已经远超单纯的“提速”范畴，而是整体的吞吐量直接跃升了一个数量级。

在 Claude Code 团队，编码很少再是慢的部分

【2】当编码不再是瓶颈，新的卡点出现在哪里

Claude Code 团队现在的瓶颈是验证、评审、跨职能协作、安全。

瓶颈从编码转向周边环节

代码量提升后，她被其他工程负责人问得最多的问题是：“这些代码人怎么审得过来？”她也想知道维护成本怎么算。生成代码的成本几乎为零，但维护成本不会跟着归零。

瓶颈搬家了：编码变快后，验证、评审、协作和安全成为新瓶颈

注：演讲提到的“用 Claude Code 构建 Claude Code”是 Anthropic 公司层面的公开做法。Boris Cherny 此前在多次访谈中讲过，自己用 Claude Code 在 10 天内构建了 Cowork 这个面向非技术用户的桌面 Agent。这是工程现实，不是修辞。

她列出了一份“正在悄然失效”的旧流程清单：长达半年的产品路线图、繁琐的排期会议、对代码的所有权划分、马拉松式的代码评审会议、按部就班的传统团队结构、知识库分享、以及漫长的新人入职培训（onboarding）。这些统统都是因为当初“开发成本太高”而被现实倒逼出来的历史产物。

旧流程开始悄悄失效

流程极少会自然消亡。我们习惯的做法是不断地往上叠加新流程。（“Rarely do processes kill themselves, we tend to just layer more and more and more processes on.”）

她举了个痛点例子：之前在某个团队，SLA（服务级承诺）多到需要拉个大表格强制排序，工程师才能弄清楚哪条需要优先响应。她早就觉得这种过度堆砌该清理了，但真正下决心动手，还是到了 Anthropic 之后。

流程清理路径：砍掉、Claude 化，或保留但变轻

Claude Code 团队重建的五类规范

【3】少做什么：六个月路线图、设计文档、产品评审

刚加入 Claude Code 时她还在问：“不需要做六个月路线图吗？”

规划和技术辩论如何变化

写出来了，前三个月还能用，过完新年再看，已经变了大半。她现在用一个词：jit planning（即时规划），借编程概念里的 just-in-time 编译，意思是什么时候需要再做什么，因为原型成本已经趋零，“提前规划”的杠杆消失了。

设计文档也大量减少。Claude Code 团队的默认讨论媒介从“先写一份 doc”换成了“先发一个 PR”，有想法直接做出来。产品评审会同样开得少，因为产品形态变化太快，与其评审 mock，不如把内部版本推给 Anthropic 全员（她管这个叫 ant-fooding，因为公司名 Anthropic 含“ant”），再推给外部用户，听他们怎么用。

减少设计文档仪式，增加验证投入

【4】多做什么：验证，把质量保障往源头推

她希望团队在验证上加倍投入，叫 shift left（左移）。传统软件流水线左是源头右是交付，把质量保障从靠近交付端的人工测试，往靠近源头的自动化推。

为什么这件事变重要？因为角色边界正在模糊。她的设计师同事现在也在提交代码。Fiona 顺带讲了一个真实的小焦虑：她有次修了个跟求职简历相关的 bug，第二天扫了一眼 Boris 的消息流，看到有人在群里 @ 他报新 bug。她形容自己当时的感触是“心跳都漏了半拍”，生怕是自己捅的娄子。

每个人都不希望因为自己的提交把服务搞挂。在这个高吞吐量的环境下，这是非常真实的心理负担。传统的人工 QA 根本接不住这么高的代码产出率，所以质量保障必须更早地依赖自动化机制。

【5】技术辩论的方式变了：从白板到三个 PR

刚加入 Claude Code 团队时她想做一次重构，借机熟悉代码库。和 Boris 在技术方案上有分歧，她差点习惯性地拍肩膀说“走，去白板房画一下”。

下一秒她马上意识到，其实完全可以让 Claude 同时搓出三个版本的 PR，直接对比完整的代码实现，甚至能拉出对所有调用方的影响。白板上可画不出这么直观的全局视角，但代码可以。

技术辩论里，代码胜出

当写代码变得轻而易举，无休止的争论就显得极其昂贵。（“When building is cheap, arguing is expensive.”）

抛出这个判断时，她的语气尤为严肃。她随即提醒听众：正因为生成代码的成本趋于零，团队文化和底线共识反而变得越发关键。

决不能沦为“谁最后一个 commit 谁赢”。比如有人熬夜到凌晨三点偷偷交代码，或者设个定时任务抢在上线前压哨操作，这绝对不行。恰恰是因为代码不值钱了，团队横向对齐反而更需要明确的底线。

【6】代码评审：Claude 接什么，人保留什么

Cat Wu 在大会上午的 keynote 已经讲了 Claude 自动评审 PR 的能力。Fiona 这里的视角更具体：什么交给 Claude，什么继续留给人。

如何跟上代码评审

注： Cat Wu 是 Claude Code 的产品负责人，与 Boris Cherny 同台主理 Claude Code 产品方向。

交给 Claude 去做的：风格检查、lint 去重、回应代码评审意见、抓常规 bug，以及补全单元测试。她说 Claude 现在非常擅长“打理”PR，通常在人工接手之前就把大部分脏活累活干完了。

依然需要人工介入的有三类：法律和合规层面的审核，因为涉及风险口径；安全敏感代码的边界确认，因为出漏洞的代价太高；针对产品体验的 sense（直觉）和品味，这也是当前大模型相当难跨越的一道门槛。

代码评审的新边界：Claude 先打理，人类最后把关

人类仍然需要评审的地方

第三类她讲了个轻松的例子。她有个小爱好：按节日装饰 Claude 的终端形象。圣诞节那次她想把 Claude 变成雪人，让 Claude 用 ASCII 字符画。她把结果发给设计师同事征求意见，对方一句话：“你把它画成了 Mr. Peanut。”

注： Mr. Peanut 是美国知名零食品牌 Planters 的吉祥物，戴礼帽和单片眼镜，长得跟雪人在轮廓上有点像。

她最终采用了简单方案：冰蓝色 + 雪花。这个故事她拿来说明产品 sense 的意义：抽象判断很难自动化。

【7】代码边界日渐模糊，角色分工也在重新洗牌

在 Claude Code 团队，几乎所有的 PR 都有 Claude 参与。“这段代码到底是谁写的？”这个问题正在变得荒诞甚至没有意义。

这是谁做的修改

Fiona 建议不要纠结于这种表象，而是深挖你真正想搞懂的是什么：是谁的修改引爆了 bug？谁有足够的背景上下文去跟客户解释技术细节？谁对这块代码模块的来龙去脉更清楚？如果你问的是后面细分的这几个问题，就会发现往往有更好的自动化路径来回答。比如她原来有个习惯：每天早上泡一杯咖啡，用 Claude Code 对接客户反馈频道去跑一遍信息汇总摘要；现在这个动作已经被编排进了 Routines 自动化任务里，连手动敲命令都省了。

追问真正的问题

注： Routines 是 Claude Code 的一项功能，可以设置定时或触发式的自动化任务。Fiona 在准备这个演讲的一个月期间，这个功能才刚上线，连她自己的幻灯片内容都因此需要更新。

这种角色的模糊化是双向发生的。一面是非技术出身的人员也开始卷起袖子写代码，Claude Code 团队里的 PM 就在实打实地提交 PR。另一面则是让工程师跳出自己的一亩三分地，去抢传统上属于其他岗位的活儿。Fiona 拿自己举了个例子：她原本想优化一下 Claude Code 的用户问卷调查，又找不到内容设计师。过去她可能要拉着内容团队的人反复抠文案字眼，现在她直接用 Claude 作为文案搭档。她自嘲作为一个典型的工程师，“在把文案写得精炼这件事情上可谓是一塌糊涂”。

Claude 填补跨职能空白

在招聘上，Claude Code 团队重点看两类人。一类是有产品感觉的创意建造者：好奇心强，看到问题就想做产品来解决，会反复打磨体验。另一类是深度系统专家：团队搭建 Claude Code Remote 时发现缺少有分布式系统经验的人。她不再看重的是原始编码吞吐量，模型已经把这部分拉平了。

团队构成应该怎样变化

Fiona 更看重的两类工程师

【8】组织形态：尽量扁平，经理从 IC 做起

Anthropic 招她进 Claude Code 时，对方默认按“10 个 IC 配 1 个经理，再向下嵌套”的结构来招人。Fiona 不要这种。

她想要的是尽量扁平。Claude Code 和 Cowork 两条线只共用一个团队 mission，不让每个小组各自定 mission。理由很实在：mission 一变，多层级要花很多时间向下对齐，扁平等于灵活。

她还坚持一条：Claude Code 团队里所有经理都要先做 IC（individual contributor，一线工程师）。

没有 10:1 配比，经理先从 IC 做起

招聘官最初的反应是“你疯了”，意思是没有经理愿意先做 IC。

我希望 Claude Code 团队的每个经理都从 IC 起步，这是我对团队的期望，不接受就早点分开。（“This is what dogfooding on the Claude Code team's about, this is what I expect and if someone's not interested it's better for us to do earlier separation.”）

这一条对她自己也是。她的上一次 push 代码到生产环境是 2017 年，加入 Anthropic 之后才重新写起代码。她说自己在 Meta 时每年还试着提交一次 PR，但内部工具变得太快，一年学一个命令第二年就过期了。

现在我连 git 命令都不记得了，全靠 Claude 帮我搞定。（“Nowadays I don't even remember git commands, I just always ask Claude to help me out with all of that.”）

【9】从文档退位，让代码成为“唯一事实来源”

知识共享的新源头

Claude Code 团队现在把代码视作最终的 source of truth（唯一事实来源）。比如 Fiona 现在是怎么答复技术客诉的？她会直接启动桌面版 Claude Code，挂载本地 repo 后让大模型直接从代码找逻辑去回答。这种做法彻底干掉了软件行业的一个千年遗留问题：开发文档总是不和代码同步。

代码就是真理的源头

但她特意补充说明：这条经验并不是放之四海而皆准的。如果你们团队业务要求必须有完备的需求文档，那就顺理成章把 spec 也提到代码库里，让 Claude 交叉校验一下最后跑出来的代码跟文档写的是否吻合。

在推行这些变化时，Fiona 区分了“必须统一”和“交给小组”两层。必须统一的几条核心准则：每个团队成员都要用 Claude Code（包括跨职能伙伴，Cowork 也是）；尽可能把能自动化的工作 Claude 化（团队内部叫“claudify everything”）；明确允许杀掉已经不服务于人的旧流程。

这套规范如何推广

核心原则统一，小组保留适配空间

最后一条她给了个具体例子。Claude Code 团队曾经搞过站会，团队变大后改成在共享表格里填周进度。某天她看着这张大表觉得索然无味：因为信息明明都在 Claude 能读到的地方，其实让 Claude 写个总结脚本丢在那里，任何人随时去拉一下其他人的状态摘要，这不比催人填表高到不知道哪里去了。

不过给小组自行拿捏的空间也非常清晰：诸如 bug 的 triage（分诊）机制、排期的节奏、谁值班怎么值，乃至哪些工作流优先级较高需要率先上 Claude，统统放权让小组自己说了算。

Fiona 优先抓的三件事

【10】三个可观察的指标，和一个警告

这些变化真的有效吗

她没透露具体数字，但点了三个方向：

六个月内应该变化的三个指标

新人爬坡时间显著下降。工程师、设计师、PM 在新团队产生有效产出的速度明显更快。

PR 所需的周期明显变短了。她顺带一提，这其实是个值得深挖的指标，因为它的变化折射出的不仅仅是你这团队对 AI 工具的接受度，有时也会暴露下游基建拉胯的弊端，比如 CI（持续集成）管线或产品基础设施环境根本吃不消工程师当前暴增的提交速率。

Claude 介入提交的覆盖比例越来越高。在 Claude Code 团队的氛围里，每一次 commit 带上 Claude 才是被默认的常规操作：

我已经差不多四个月没看到一次非 Claude 辅助的提交了。（“I don't think I've seen a non-Cloud assisted commit probably in the last four months or so.”）

但她在指标这一段明确加了警告：不要只看“代码有多少由 AI 生成”。各家公司新闻稿里这个比例越说越高，但吞吐量本身不是目的，要回头看你究竟在解决什么问题、产品质量和可靠性还守不守得住。

AI-native 工程组织飞轮：吞吐不是终点，质量和可靠性才是目标

【11】她自己也没想清楚的三件事

审计自己的工作流

Fiona 在演讲最后承认，有三个问题她还没答案：

第一，工程师能跨平台流转之后，传统的“iOS 团队 + Android 团队”分队还有没有意义。

第二，自动化评审要推到多远。“信任但验证”的边界在哪儿，会随模型升级再次移动。她提到当天稍早一场关于模型能力的演讲，意思是评审托管给 Claude 多少，不是一个一次定下来的决定。

第三，角色模糊之后，怎样让所有人感觉同样有产出感。当工程师能做内容、PM 能写代码、设计师能修 bug，传统的产出归属变模糊了，公平感的设计是新课题。

Fiona 还在思考的三个问题

她给听众的最后建议其实非常朴素直接：

挑出极其折腾人、尤为啰嗦的那条工作流，重新审视一下它到底还在为谁干活。（“Pick your noisiest workflow … is it still really serving, what's the purpose of there.”）

她拿自己的亲身经历当了反例。以前在带某个团队时有个雷打不动的周例会，五十多号人挤在一个大屋子里。但 Fiona 细看发现，除了被点到名字起来汇报状态的人会假装抬一下头，其他人全都不约而同在低头敲键盘。后来她只问了一句“我们到底图什么还在开这破会”，瞬间全票通过顺带原地解散了。

挑出特别折腾人的工作流

视频原链接：https://www.youtube.com/watch?v=igO8iyca2_g