这篇原文在讲什么

这是 Simon 在 PyCon US 2025 的一份长讲义。它最有价值的地方,是把“在 LLM 之上做软件”这件事从热词层拆回工程层。模型只是其中一块,真正决定系统是否能落地的,是你有没有把日志、工具、结构化输出、检索、权限和安全一起做成体系。

这篇也很适合拿来反驳“LLM 应用就是写 prompt”这种误解。Simon 的整体框架更像一个现代应用开发清单,而不是 prompt 技巧合集。

重点摘译

  • 模型生态当然重要,但做产品的人更该关心的是接口稳定性、成本、延迟、上下文长度和部署方式这些现实变量。
  • 结构化输出、工具调用、向量检索和 embeddings 已经是常见基本件,不是只有大公司才用得到的高级能力。
  • 日志和可观察性不能后补,因为很多 LLM 问题不是单次复现,而是线上才会暴露的概率性问题。
  • Prompt injection 应该被当作安全输入问题来看,尤其当系统能访问私有数据或调用高权限工具时更是如此。
  • Simon 很强调“privileged vs. quarantined”的边界感,本质是在提醒大家不要把不可信内容直接喂给高权限动作链路。

这篇材料对今天还有什么用

如果你正在做内部知识库、自动化工具、copilot 或 agent 平台,这篇最大的用处是帮你补工程 checklist。你会发现,很多线上事故并不是模型不够强,而是系统边界根本没设计清楚。比如谁能调用工具、谁能访问私有上下文、日志里该记什么、失败后怎样快速重放。

对开发者来说,这篇也能帮你把“AI 工程”具体化。它不是另一种神秘岗位,而是把你原本熟悉的软件工程习惯迁移到 LLM 场景里,只是多了概率性输出、不可信输入和外部模型接口这些新变量。

说明

这页是基于原文的中文摘译与导读,不是官方全文翻译。关键表述和细节请以原文为准。

更新附注

  • 版本:v1.1

更新日期:2026-04-02 更新原因:补入 PyCon 日程页与 workshop 讲义站点,给这篇摘译增加更完整的一手材料链路,并同步补齐更新时间。