先说评分原则

AI 时代面试程序员,最容易犯的错是把“会不会演示工具”误当成“会不会交付结果”。所以这 10 道题的标准答案,不是某句固定话术,而是三类信号。

  • 优秀回答:能主动谈任务边界、验证闭环、失败处理和责任归属。
  • 中等回答:知道 AI 能提效,但更多停留在经验描述,工程化细节不够。
  • 危险信号:几乎只谈速度和模型能力,很少谈测试、回滚、审批和后果。

01. 模糊需求怎么让 AI 开始干活

优秀回答,通常会先把需求压成目标、边界、输入输出和验收标准,再决定怎么下第一轮提示。中等回答会提到“先写个 prompt,让 AI 先出个方案”,但很少明确什么叫完成。危险信号是默认让模型自己猜需求,或者把“多试几轮”当成主要方法。

02. 要给 AI 哪些上下文,不给哪些

优秀回答会区分核心上下文和噪声上下文,知道先给接口、相关代码、约束和失败案例。中等回答会说“把代码仓库喂进去”或“把文档都给它看”,但缺少裁剪逻辑。危险信号是完全没有上下文选择意识,默认认为信息越多越好。

03. 复杂任务怎么拆

优秀回答会把复杂任务拆成几个可验证的小步骤,还能说清哪些可以并行、哪些必须串行。中等回答能列一些步骤,但更像线性待办,不太考虑检查点和回退点。危险信号是把一个大任务整包交给 AI,希望它自动规划、自动落地、自动收尾。

04. 怎样判断 AI 结果真的可用

优秀回答一定会谈测试、对照样例、日志、人工抽查,甚至会区分离线 eval 和线上反馈。中等回答会说“我会自己 review 一下”“我会跑一跑”,但标准不够成体系。危险信号是把“能运行”当成唯一验收条件,或者把“模型说完成了”当成完成。

05. AI 改完代码后怎么 review

优秀回答会从 diff、测试变化、依赖影响和架构后果几层一起看,能说出什么代码虽然能跑但不该合并。中等回答会看代码风格和功能结果,但对长期质量信号不敏感。危险信号是完全把 review 让位给 AI,自己只看 happy path。

06. AI 修了很多轮 bug 还没修好怎么办

优秀回答会先停下来做根因分析,重新检查复现步骤、日志、边界条件和上下文缺口。中等回答会换个 prompt、换个模型、再试几轮,但不一定真正缩小问题空间。危险信号是让 AI 连续蛮力试错,改了很多文件却越来越说不清问题在哪里。

07. AI 连工具和数据库后怎么控风险

优秀回答会明确区分自动允许、需要审批和绝对禁止的操作,还会主动提 prompt injection、越权、误删和不可信输入。中等回答知道“高风险操作要谨慎”,但说不出具体落点。危险信号是默认只要效果好,就应该尽量让 AI 拿到更多权限。

08. 怎样选择模型、工具和工作流

优秀回答会从成本、成功率、延迟和任务类型去选模型与工具,而不是只报最强模型名字。中等回答知道不同工具各有长短,但没有稳定的选择原则。危险信号是把所有问题都丢给同一个模型,或者把贵模型当作缺乏方法时的替代品。

09. 怎样确保 3 个月后团队还改得动

优秀回答会关注重复代码、隐式耦合、脆弱测试、错误抽象和可维护性,还会把 on-call 风险纳入判断。中等回答知道“代码要整洁”,但更多停留在风格层。危险信号是把长期维护完全外包给未来的 AI,默认以后再让模型改回来。

10. 如果你带团队,怎么招聘和培养会用 AI 的程序员

优秀回答会从行为信号出发,比如提问质量、验证习惯、解释能力、复盘能力和风险意识,并能设计新人前 30 天的习惯要求。中等回答更多停留在“让大家多学工具、多提高效率”。危险信号是把“会不会用最新模型”当成核心招聘标准,而几乎不看候选人是否对结果负责。

面试官最后该怎么下判断

如果一个候选人回答这 10 题时,反复出现下面这些表达,通常是加分信号。

  • 我会先把验收标准写出来。
  • 我会先确认边界,而不是让模型猜。
  • 我会先设计测试和检查点,再让 AI 动手。
  • 高风险操作必须人工审批。
  • 如果结果解释不清,我不会直接合并。

反过来,如果他反复出现下面这些表达,就要提高警惕。

  • 先让 AI 全部做出来再说。
  • 多试几次总能试对。
  • 代码跑通就可以上。
  • AI review 过了我就不太看了。
  • 以后有问题再让 AI 改。

把这套标准压缩成一句话,就是:AI 时代真正该招的人,不是最会让模型多写代码的人,而是最会让模型输出进入可靠流程的人。