04｜上下文工程的成本，正在被 HN 重新算一遍

返回文章列表

AI Agent Hacker News精选软件工程

Feature Essay

04｜上下文工程的成本，正在被 HN 重新算一遍

Hacker News 最近一轮 AI 讨论，重新把 context engineering 推到了正面：模型窗口再大，也救不回组织得很糟的上下文。

2026-05-18 12:00 北京时间 8 min 难度：入门 Hacker News AI 周精选

37 阅读 0 点赞

快速答案

上下文越长不等于效果越好。最近 HN 上几条讨论又把这件事翻了一遍，焦点不是窗口尺寸，而是上下文的质量、组织和重读成本。

上下文窗口的尺寸已经不是核心约束，组织方式才是。
长上下文一旦没有去重和裁剪，重读成本会随会话线性放大。
评估上下文质量需要把答案的可追溯性当成显性指标，而不是只看最终回复是否流畅。

为什么 context engineering 又被翻出来

过去半年里，多数 agent 产品都把焦点放在工具调用和长任务上。窗口尺寸的争论一度安静下来，因为 1M 级别的上下文已经不稀奇。

但最近 HN 的几条讨论把这件事换了一个问法：窗口大不大不重要，问题是上下文里到底装了什么、装多久、怎么裁。

三种典型的上下文坏味道

讨论里反复出现的上下文问题可以归成三类。

重复上下文：同样的工具结果、文档段落或对话历史被多次塞回 prompt
无结构上下文：把所有信息平铺，没有显式标注来源、时间和可信度
陈旧上下文：早期的判断已经被推翻，但旧版本仍然留在窗口里

这三类问题都不是模型能力问题，是工程组织问题。

重读成本比想象中高

很多团队默认窗口大就把全部历史塞进去。这看上去省事，实际上每一轮都让模型重新读一遍冗余内容。

重读成本不仅是 token 钱。更隐蔽的是注意力被稀释：相关性最高的几条信息被埋在很多重复内容里，模型在长上下文里的注意衰减问题就会再次出现。

可以先动的几件事

讨论里被反复提到的实践，整理一下可以马上动手。

按角色分桶：系统说明、用户输入、工具结果、检索结果分开，每个桶都可独立裁剪
对工具结果做 dedupe：相同 URL、相同 SQL 查询、相同函数返回值，只保留一份
把判断分版本：当任务方向被推翻时，不要保留旧判断，只保留最新结论加一行替换原因
把检索结果摘要再回填：不要把全文塞进去，先让模型自己抽要点，再把要点带到下一轮

评估上下文质量的一条指标

如果一定要选一个最朴素的指标，可以选可追溯性：模型给出的每一个判断，能不能指回上下文里的某一条具体来源。

可追溯性高的会话，通常上下文也是干净的；可追溯性低的会话，往往上下文已经被噪声淹没了。

参考来源

还没有评论，你可以写下第一条。

继续阅读

继续读这个系列

这篇属于「Hacker News AI 周精选」，优先按系列顺序继续往下读。

2026-05-24 01:58 北京时间 8 分钟同属「Hacker News AI 周精选」

05｜HN 本周在讨论 Agent 成本和运行边界

这一周 HN 上最有价值的讨论，集中在企业 agent 的成本、spec-driven workflow、本地 RAG 记忆和 Claude Code 安全边界。

2026-04-07 21:55 北京时间更新：2026-04-08 20:42 北京时间 6 min 同属「Hacker News AI 周精选」

00｜本周 3 篇 Hacker News AI 文章先看哪一篇

这页只做导读：告诉你本周 3 篇分别在讲什么，适合谁先读。

2026-04-07 22:05 北京时间更新：2026-04-08 20:42 北京时间 6 min 同属「Hacker News AI 周精选」

01｜OpenClaw 之后，Claude Code 订阅到底包到哪一步

OpenClaw 这轮讨论把 Claude Code 的订阅边界说清了：人工直接使用和第三方 harness 的持续后台运行，要分开看。

同主题延伸

如果你想顺着当前问题继续往下挖，这里优先给相近主题的文章。

2026-04-07 22:15 北京时间更新：2026-04-08 20:42 北京时间 7 min 同主题：AI Agent 等 3 个标签

02｜Coasts 把 agent 运行时问题直接摆出来了

Coasts 把依赖、端口、网络和共享服务这些平时埋在脚手架里的问题直接摆到了产品正面。

2026-03-19 09:00 北京时间 8 分钟同主题：AI Agent 等 2 个标签

07. 当 Agent 开始读文档，文档会变成运行时上下文

文档不会因为生成式 AI 普及就失去价值，但那些「为了交付而交付」的说明书会更快商品化。更重要的文档，正在变成 Agent 和人共同消费的运行时上下文与约束层。

2026-05-24 13:47 北京时间 10 分钟同主题：AI Agent 等 2 个标签

多 Agent 系统最难的重点是控制权转交

多 Agent 系统的关键在于什么时候转交、转给谁、带着什么上下文转交，以及转交后谁对结果负责。

编辑精选

如果你想从这篇扩出去，这里放最近值得继续看的站内长文。

2026-05-29 21:35 北京时间 12 分钟编辑精选

Git 入门：先看懂版本、分支和协作

Git 的核心价值，是让一个项目的每次可靠变化都留下可回退、可比较、可协作的记录。初学者先理解版本快照、暂存区、分支和远程仓库，再学命令会轻松很多。

2026-05-25 00:50 北京时间 9 分钟编辑精选

TerminalWorld：终端 Agent 评测不能只靠人造题

TerminalWorld 从真实终端录屏反向构造任务，得到 1530 个验证任务和 200 个人工复核子集。它说明终端 Agent 的真实难度，比专家手写 benchmark 更杂、更长、更贴近日常开发。

2026-05-25 00:49 北京时间 8 分钟编辑精选

Agentic CLEAR：只做可观测还不够，Agent 需要解释型评测

Agentic CLEAR 位于 observability layer 之上，试图从系统、trace 和 node 三个层级自动生成行为判断。它解决的「日志能不能变成可行动的评测」。

上一篇 03｜Memoir 在补长期上下文管理这层

下一篇 05｜HN 本周在讨论 Agent 成本和运行边界

阅读难度

入门

概念为主，适合快速进入。

专题

Hacker News AI 周精选

要点

上下文窗口的尺寸已经不是核心约束，组织方式才是。
长上下文一旦没有去重和裁剪，重读成本会随会话线性放大。
评估上下文质量需要把答案的可追溯性当成显性指标，而不是只看最终回复是否流畅。

RSS

Subscribe to long-form updates through RSS. Feed timestamps use Beijing time.

Open RSS feed

LLMs

This site also exposes llms.txt and sitemap.xml for model-friendly discovery.

Open llms.txt

04｜上下文工程的成本，正在被 HN 重新算一遍

快速答案

为什么 context engineering 又被翻出来

三种典型的上下文坏味道

重读成本比想象中高

可以先动的几件事

评估上下文质量的一条指标

参考来源

评论（0）

继续阅读

继续读这个系列

同主题延伸

编辑精选