为什么面试题得先换一轮
如果默认候选人可以现场使用 AI,那么很多老题就会迅速失真。你再去考手写排序、背 API 或 40 分钟拼一个 CRUD,测出来的更像“他敢不敢不用 AI”,而不是“他会不会和 AI 一起把事情做成”。
更值得追的问题,是候选人能不能把一个模糊需求压成可执行任务,能不能给模型补对上下文,能不能用测试和日志去验证结果,能不能在风险出现时接管系统。下面这 10 道题,就是围绕这几个能力展开的。
01. 给你一个模糊需求,你会怎么让 AI 开始干活
这道题先看候选人会不会把“需求理解”变成结构化输入,而不是把一句口语直接扔给模型。
- 第一层追问:你的第一轮提示词会包含哪些元素,比如目标、边界、输入输出、验收标准、不要做什么。
- 第二层追问:如果 AI 一上来给了一个大而全的方案,你会怎样把它压缩成最小可交付切片。
- 第三层追问:什么情况下你会停止继续提示,转而回去找产品或业务补信息,而不是让 AI 继续猜。
02. 同一个需求,你会给 AI 喂哪些上下文,不给哪些
真正会用 AI 的人,通常知道上下文不是越多越好,而是要把最关键的约束装进去。
- 第一层追问:你会优先给什么,比如相关代码、接口定义、历史实现、失败案例、设计规范。
- 第二层追问:如果上下文太大,模型开始跑偏,你会怎么裁剪和重组。
- 第三层追问:哪些信息该放进长期固定指令,哪些信息只该放在当前任务里。
03. 你会怎样把一个复杂任务拆成适合 AI 执行的步骤
这道题考的不是“会不会列 Todo”,而是会不会拆出可验证、可并行、可回退的子任务。
- 第一层追问:请把“给老系统加一个报表导出功能”拆成 5 到 7 个子任务。
- 第二层追问:哪些子任务可以并行,哪些必须串行,为什么。
- 第三层追问:如果中途发现最初拆法错了,你会怎么重排任务而不是继续在错误结构上打补丁。
04. 你怎么判断 AI 生成的结果是真的可用
很多候选人会把“跑通了”误当作“可交付了”。这道题就是把这个误区逼出来。
- 第一层追问:除了代码能跑,你还会设计哪些验证,比如单测、集成测试、边界样例、人工检查。
- 第二层追问:如果这个任务没有标准答案,你会怎么设计自己的 eval。
- 第三层追问:如果线上反馈和离线评测冲突,你会优先看什么,再怎么修正评测体系。
05. AI 改完代码后,你怎么做代码审查
AI 时代的 review 重点,已经不只是看代码风格,而是看候选人会不会读 diff、读风险、读后果。
- 第一层追问:你先看什么,是 diff、测试、日志、架构影响,还是用户路径。
- 第二层追问:如果代码能工作,但你解释不清为什么这样实现,你会不会合并。
- 第三层追问:你怎样识别重复逻辑、过度抽象、隐藏耦合这类短期能跑、长期有害的问题。
06. AI 修了很多轮 bug 还没修好,你怎么接管
这道题考的是故障切换能力,也就是候选人会不会在 AI 失控时切回工程方法。
- 第一层追问:你怎么判断这是提示词问题、上下文问题,还是根因判断出了偏差。
- 第二层追问:如果模型一直在 brute force 改动,你会怎样强制它先做根因分析。
- 第三层追问:什么情况下你会中断这轮 AI 会话,自己下场 debug 或换模型换工具。
07. 如果让 AI 直接连工具、数据库和仓库,你怎么控风险
真正成熟的候选人,通常不会把“能自动化”直接等同于“该自动化”。
- 第一层追问:哪些操作你会允许自动执行,哪些必须人工审批。
- 第二层追问:你怎么防 prompt injection、越权读取、误调用工具和误删数据。
- 第三层追问:如果必须处理不可信输入,你会怎样把自由文本先收束成结构化约束。
08. 你如何选择模型、工具和工作流
这道题考的是成本意识和工作流判断,而不是单一工具熟练度。
- 第一层追问:什么任务你用快模型,什么任务你用强模型,什么任务你干脆不用 AI。
- 第二层追问:什么情况下你用 IDE 助手,什么情况下用终端 agent,什么情况下拆成多个 agent。
- 第三层追问:当 latency、token 成本和成功率互相冲突时,你怎么做取舍。
09. AI 写出了能用的代码,3 个月后团队还改得动吗
软件工程不会因为生成速度变快就自动变轻,这道题专门看长期质量判断。
- 第一层追问:你会重点检查哪些长期信号,比如重复代码、脆弱测试、糟糕命名、错误抽象。
- 第二层追问:如果 AI 生成的实现明显冗长,你会要求重写、自己手改,还是直接接受。
- 第三层追问:如果你是 on-call,这段代码至少达到什么标准你才敢发生产。
10. 如果你带一个团队,你会怎么招聘和培养会用 AI 的程序员
最后一题把视角拉到组织层,能回答好的人通常已经不是只会单点操作工具。
- 第一层追问:你最看重候选人的哪三个信号,是提问质量、验证习惯、代码解释力、风险意识,还是别的。
- 第二层追问:你如何区分“只会套壳提问的人”和“真能提升团队交付质量的人”。
- 第三层追问:入职后 30 天,你会要求新人建立哪些 AI 工作习惯,避免团队一起滑向表面高产、实则负债积累。
这 10 题真正想测什么
把这些题放在一起看,真正考的不是 prompt 技巧,而是四件更底层的事。
- 能不能把问题定义对。
- 能不能把 AI 约束对。
- 能不能把结果验证对。
- 出了事能不能自己兜住。
如果候选人只能谈“我会让 AI 帮我生成”,而很少谈验收、回滚、审批、上下文和责任链,那他更像在展示工具熟悉度;如果他能把这些环节都讲清,你才更有理由相信他真的能在 AI 时代做工程。
还没有评论,你可以写下第一条。