快速答案
这份讲义的核心不是 prompt 花活,而是把大模型应用拆成可落地的工程组件:模型选择、日志、工具、检索、结构化输出、向量检索和 prompt injection 防护。
- LLM 应用的难点不只在提示词,而在完整的软件工程栈。
- 工具调用、结构化输出、日志和 eval 是耐用能力,不是可选装饰。
- Prompt injection 和不可信输入必须被当成正式安全问题处理。
这篇原文在讲什么
这是 Simon 在 PyCon US 2025 的一份长讲义。它最有价值的地方,是把“在 LLM 之上做软件”这件事从热词层拆回工程层。模型只是其中一块,真正决定系统是否能落地的,是你有没有把日志、工具、结构化输出、检索、权限和安全一起做成体系。
这篇也很适合拿来反驳“LLM 应用就是写 prompt”这种误解。Simon 的整体框架更像一个现代应用开发清单,而不是 prompt 技巧合集。
重点摘译
- 模型生态当然重要,但做产品的人更该关心的是接口稳定性、成本、延迟、上下文长度和部署方式这些现实变量。
- 结构化输出、工具调用、向量检索和 embeddings 已经是常见基本件,不是只有大公司才用得到的高级能力。
- 日志和可观察性不能后补,因为很多 LLM 问题不是单次复现,而是线上才会暴露的概率性问题。
- Prompt injection 应该被当作安全输入问题来看,尤其当系统能访问私有数据或调用高权限工具时更是如此。
- Simon 很强调“privileged vs. quarantined”的边界感,本质是在提醒大家不要把不可信内容直接喂给高权限动作链路。
这篇材料对今天还有什么用
如果你正在做内部知识库、自动化工具、copilot 或 agent 平台,这篇最大的用处是帮你补工程 checklist。你会发现,很多线上事故并不是模型不够强,而是系统边界根本没设计清楚。比如谁能调用工具、谁能访问私有上下文、日志里该记什么、失败后怎样快速重放。
对开发者来说,这篇也能帮你把“AI 工程”具体化。它不是另一种神秘岗位,而是把你原本熟悉的软件工程习惯迁移到 LLM 场景里,只是多了概率性输出、不可信输入和外部模型接口这些新变量。
说明
这页是基于原文的中文摘译与导读,不是官方全文翻译。关键表述和细节请以原文为准。
更新附注
更新日期:2026-04-02
更新原因:补入 PyCon 日程页与 workshop 讲义站点,给这篇摘译增加更完整的一手材料链路,并同步补齐更新时间。
继续阅读
别把这篇当成终点。这里优先给你系列内延续、同主题扩展和站内值得继续看的文章。
同主题延伸
如果你想顺着当前问题继续往下挖,这里优先给相近主题的文章。
2026-04-11 12:10 北京时间
11 分钟
同主题:AI Agent 等 3 个标签
Hermes 不难装。macOS 直接跑官方安装器,Windows 先装 WSL2 再按 Linux 路线装。装完别先闲聊,先用并行读仓库和定时任务两个例子,看看它适不适合你。
2026-04-09 00:20 北京时间
20 分钟
同主题:技术沉淀 等 3 个标签
真正需要重构的不是提示词,而是项目控制层。多窗口同时写文章没有错,问题在于写作、主干集成、部署和恢复过去没有被放进同一套状态机里管理;而且这套控制面现在已经开始落成具体脚本和状态文件。
2026-04-07 21:22 北京时间
17 分钟
同主题:技术沉淀 等 3 个标签
GSD2 在管项目,OMX 在管 Codex。两边都能做长任务,但不在同一层:一个更像执行内核,一个更像编排外挂。把它们看成同一层工具,后面基本都会用错。
编辑精选
如果你想从这篇扩出去,这里放最近值得继续看的站内长文。
2026-04-12 10:20 北京时间
12 分钟
编辑精选
一次原生 Windows 命令行整治记录:把 PowerShell、PATH 和 UTF-8 的反复故障,收敛成 Git Bash、rg、sd、jq、yq 与 ast-grep 这一套稳定工具链。
2026-04-10 10:25 北京时间
9 分钟
编辑精选
这一周最有价值的论文,同时改了三条判断:个人代理依然很脆弱,自动化 QA 还远不到可托付,竞赛编程 agent 的上限又被往上推了一截。
2026-04-10 10:20 北京时间
8 分钟
编辑精选
这一周 GitHub 上真正有分量的上涨,集中在三类更靠近产品底层的仓库:agent 运行层、端侧推理运行时和全双工语音代理。
还没有评论,你可以写下第一条。