AI 写代码之后，程序员面试该问什么

职业发展 AI 编程软件工程

Feature Essay

AI 写代码之后，程序员面试该问什么

阮一峰把问题提得很准：当代码能力本身不再等于个人能力，招聘到底该怎么问。综合 Simon Willison、Anthropic、OpenAI 和 Thoughtworks 这批一线讨论，更稳的做法重点是考候选人能不能把 AI 放进一个可验证、可回退、可负责的工程流程里。

2026-03-22 01:30 北京时间 10 分钟难度：进阶岗位重组认知系列

134 阅读 0 点赞

快速答案

如果代码越来越多由 AI 生成，面试就不该再把重点放在徒手写实现，而该转向任务定义、上下文组织、验证完整流程和责任承担。下面这 10 道题，适合直接拿来面试允许使用 AI 的程序员候选人。

这 10 道题不考候选人会不会背提示词，而是考他能不能把问题说清、把边界压清、把结果验清。
每一道题都配了 3 层 drilldown，方便把面试从表面经验推进到真实方法和风险意识。
如果候选人能把这 10 题答实，他大概率已经是「能把 AI 纳入交付流程的人」。

为什么面试题得先换一轮

如果默认候选人可以现场使用 AI，那么很多老题就会迅速失真。你再去考手写排序、背 API 或 40 分钟拼一个 CRUD，测出来的更像「他敢不敢不用 AI」，而不是「他会不会和 AI 一起把事情做成」。

更值得追的问题，是候选人能不能把一个模糊需求压成可执行任务，能不能给模型补对上下文，能不能用测试和日志去验证结果，能不能在风险出现时接管系统。下面这 10 道题，就是围绕这几个能力展开的。

01. 给你一个模糊需求，你会怎么让 AI 开始干活

这道题先看候选人会不会把「需求理解」变成结构化输入，而不是把一句口语直接扔给模型。

第一层追问：你的第一轮提示词会包含哪些元素，比如目标、边界、输入输出、验收标准、不要做什么。
第二层追问：如果 AI 一上来给了一个大而全的方案，你会怎样把它压缩成最小可交付切片。
第三层追问：什么情况下你会停止继续提示，转而回去找产品或业务补信息，而不是让 AI 继续猜。

02. 同一个需求，你会给 AI 喂哪些上下文，不给哪些

真正会用 AI 的人，通常知道上下文要把最关键的约束装进去。

第一层追问：你会优先给什么，比如相关代码、接口定义、历史实现、失败案例、设计规范。
第二层追问：如果上下文太大，模型开始跑偏，你会怎么裁剪和重组。
第三层追问：哪些信息该放进长期固定指令，哪些信息只该放在当前任务里。

03. 你会怎样把一个复杂任务拆成适合 AI 执行的步骤

这道题考的会不会拆出可验证、可并行、可回退的子任务。

第一层追问：请把「给老系统加一个报表导出功能」拆成 5 到 7 个子任务。
第二层追问：哪些子任务可以并行，哪些必须串行，为什么。
第三层追问：如果中途发现最初拆法错了，你会怎么重排任务而不是继续在错误结构上打补丁。

04. 你怎么判断 AI 生成的结果是真的可用

很多候选人会把「跑通了」误当作「可交付了」。这道题就是把这个误区逼出来。

第一层追问：除了代码能跑，你还会设计哪些验证，比如单测、集成测试、边界样例、人工检查。
第二层追问：如果这个任务没有标准答案，你会怎么设计自己的 eval。
第三层追问：如果线上反馈和离线评测冲突，你会优先看什么，再怎么修正评测体系。

05. AI 改完代码后，你怎么做代码审查

AI 时代的 review 重点，已经不只是看代码风格，而是看候选人会不会读 diff、读风险、读后果。

第一层追问：你先看什么，是 diff、测试、日志、架构影响，还是用户路径。
第二层追问：如果代码能工作，但你解释不清为什么这样实现，你会不会合并。
第三层追问：你怎样识别重复逻辑、过度抽象、隐藏耦合这类短期能跑、长期有害的问题。

06. AI 修了很多轮 bug 还没修好，你怎么接管

这道题考的是故障切换能力，也就是候选人会不会在 AI 失控时切回工程方法。

第一层追问：你怎么判断这是提示词问题、上下文问题，还是根因判断出了偏差。
第二层追问：如果模型一直在 brute force 改动，你会怎样强制它先做根因分析。
第三层追问：什么情况下你会中断这轮 AI 会话，自己下场 debug 或换模型换工具。

07. 如果让 AI 直接连工具、数据库和仓库，你怎么控风险

真正成熟的候选人，通常不会把「能自动化」直接等同于「该自动化」。

第一层追问：哪些操作你会允许自动执行，哪些必须人工审批。
第二层追问：你怎么防 prompt injection、越权读取、误调用工具和误删数据。
第三层追问：如果必须处理不可信输入，你会怎样把自由文本先收束成结构化约束。

08. 你如何选择模型、工具和工作流

这道题考的是成本意识和工作流判断，而不是单一工具熟练度。

第一层追问：什么任务你用快模型，什么任务你用强模型，什么任务你干脆不用 AI。
第二层追问：什么情况下你用 IDE 助手，什么情况下用终端 agent，什么情况下拆成多个 agent。
第三层追问：当 latency、token 成本和成功率互相冲突时，你怎么做取舍。

09. AI 写出了能用的代码，3 个月后团队还改得动吗

软件工程不会因为生成速度变快就自动变轻，这道题专门看长期质量判断。

第一层追问：你会重点检查哪些长期信号，比如重复代码、脆弱测试、糟糕命名、错误抽象。
第二层追问：如果 AI 生成的实现明显冗长，你会要求重写、自己手改，还是直接接受。
第三层追问：如果你是 on-call，这段代码至少达到什么标准你才敢发生产。

10. 如果你带一个团队，你会怎么招聘和培养会用 AI 的程序员

最后一题把视角拉到组织层，能回答好的人通常已经不是只会单点操作工具。

第一层追问：你最看重候选人的哪三个信号，是提问质量、验证习惯、代码解释力、风险意识，还是别的。
第二层追问：你如何区分「只会套壳提问的人」和「真能提升团队交付质量的人」。
第三层追问：入职后 30 天，你会要求新人建立哪些 AI 工作习惯，避免团队一起滑向表面高产、实则负债积累。

这 10 题真正想测什么

把这些题放在一起看，考的重点是四件更底层的事。

能不能把问题定义对。
能不能把 AI 约束对。
能不能把结果验证对。
出了事能不能自己兜住。

如果候选人只能谈「我会让 AI 帮我生成」，而很少谈验收、回滚、审批、上下文和责任链，那他更像在展示工具熟悉度；如果他能把这些环节都讲清，你才更有理由相信他真的能在 AI 时代做工程。

参考来源

还没有评论，你可以写下第一条。

继续阅读

继续读这个系列

这篇属于「岗位重组认知系列」，优先按系列顺序继续往下读。

2026-03-22 01:31 北京时间 11 分钟同属「岗位重组认知系列」

同主题延伸

如果你想顺着当前问题继续往下挖，这里优先给相近主题的文章。

2026-03-19 09:00 北京时间 9 分钟同主题：职业发展等 2 个标签

编辑精选

如果你想从这篇扩出去，这里放最近值得继续看的站内长文。

2026-06-20 01:19 北京时间 13 分钟编辑精选

下一篇 AI 程序员面试答案：10 题评分点与识别信号

AI 写代码之后，程序员面试该问什么

快速答案

为什么面试题得先换一轮

01. 给你一个模糊需求，你会怎么让 AI 开始干活

02. 同一个需求，你会给 AI 喂哪些上下文，不给哪些

03. 你会怎样把一个复杂任务拆成适合 AI 执行的步骤

04. 你怎么判断 AI 生成的结果是真的可用

05. AI 改完代码后，你怎么做代码审查

06. AI 修了很多轮 bug 还没修好，你怎么接管

07. 如果让 AI 直接连工具、数据库和仓库，你怎么控风险

08. 你如何选择模型、工具和工作流

09. AI 写出了能用的代码，3 个月后团队还改得动吗

10. 如果你带一个团队，你会怎么招聘和培养会用 AI 的程序员

这 10 题真正想测什么

参考来源

评论（0）

继续阅读

继续读这个系列

AI 程序员面试答案：10 题评分点与识别信号

03. 产品经理在 Agent 时代，会转向成功定义与边界设计

04. 测试工程师会更靠近评测与放行规则

同主题延伸

00｜AI 进入组织之后，8 个岗位会先重排责任链

如何转成 AI Agent 工程师：一份基于最新研究的转型路线图

Java 后端如何转向 AI Agent 工程

编辑精选

泛数据分析应用会长在 Agent 底座上

会用 Agent 后，工程师和业务专家谁更强

从人审代码到 Agent 验证系统迁移