04｜下一波 AI 大公司，为什么可能出在 Agent 层

返回文章列表

Feature Essay

04｜下一波 AI 大公司，为什么可能出在 Agent 层

如果你总觉得行业讨论还停留在“谁模型更强”，这篇会把视角往前推一步。未来很多竞争，不发生在模型 benchmark 上，而发生在谁更会把模型做进具体 agent、具体流程、具体组织，再把结果稳定交给用户。

2026-03-19 21:40 北京时间 11 分钟阅读难度：进阶 Agent 陪读系列

👀 84 阅读 👍 0 点赞

快速答案

模型公司当然重要，但下一波真正贴着用户、贴着任务、贴着业务结果长大的 AI 公司，未必还是卖模型的人，更可能是把模型、工具、工作流和场景绑在一起卖结果的人。这正是 swyx 这篇最值得抓住的判断。

Model Labs 和 Agent Labs 的重心不同，一个更偏模型能力，一个更偏任务结果与系统编排。
Agent 时代的公司竞争力，越来越来自模型选择、工具 harness、工作流设计和真实使用场景。
对开发者和产品来说，这意味着只盯模型已经不够，必须开始理解系统层与任务层。

这篇真正追问的是谁更接近下一波大公司

如果你把这两年的 AI 讨论听多了，很容易形成一种默认视角：最核心的竞争，发生在模型公司之间。谁参数更强，谁 benchmark 更高，谁先发了新能力，谁就站在舞台中央。

swyx 这篇做的事情，是把镜头往旁边挪了一下。它真正追问的是：下一波更像“大公司苗子”的团队，会不会并不长在模型层，而是长在把模型接进任务、流程和组织的那一层。

这个问题一旦问出来，很多事情会突然变得更现实。

用户最终买的，很少是模型本身

开发者平时很容易被模型能力吸走注意力，因为那是最容易看见、最容易对比的部分。但用户决定掏钱时，想的通常是“这个系统到底帮我省了多少活”，而不是“这个模型是不是第一名”。

一个会搜仓库、改代码、跑测试、提交 PR 的工程 agent，它的商业价值往往并不只来自底模本身，而来自整条任务链到底有多顺、失败时能不能救回来、是不是能长期用。

这就是 swyx 想把大家从“模型排行”拉回“任务完成”的原因。

对开发者来说，这会改写你看 AI 产品的方式

如果你是开发者，这篇最有用的地方，是它会逼你跳出“接模型 API 就是在做 AI 产品”的错觉。

以后更值钱的，往往是端到端完成率，而不只是单点能力。你得开始关心这些东西。

任务到底能不能闭环。
工具接得稳不稳。
失败之后怎么恢复。
用户到底在哪一步开始觉得它真有用。

这让开发者的视角从“做功能”慢慢变成“做结果”。

比如同样是“帮用户写文档”，一个产品只是多了个生成按钮，另一个产品却能读仓库、抽改动、生成初稿、回填格式、再交给人审批。两者看起来都沾了 AI，但真正更接近 Agent 公司卖法的，是后者这种“把结果交出来”的产品。

产品和测试会更先感受到这种变化

产品做 AI 功能时，很容易停在“我们接哪个模型”这一层，因为这层最显眼，也最容易汇报。但这篇会迫使你多问一句：用户真正买的，到底是模型能力，还是结果交付？

测试也会比很多人更早看到另一层现实。一个 agent 产品测的已经不是单个页面和按钮，重心会转到整条任务链。它中途会不会断、错了会不会自我放大、系统能不能把自己刚才做的事解释清楚，这些都开始变成主测试对象。

从这个角度看，产品和测试其实比很多人更早站在“Agent 公司”的入口上。

最有带入感的场景，其实就在企业内部。一个“帮销售填 CRM”的功能，如果只是生成一段跟进建议，它还是助手；如果它能读通话纪要、抽关键字段、回填 CRM、提醒下一步、把异常记录丢给销售确认，它就已经开始长出 Agent 公司的味道了。用户为这种东西买单，往往是因为它真帮人少做了四五步，不是因为它模型第一。

对 Agent Engineer 来说，护城河开始换地方了

这篇对 Agent Engineer 的启发很直接：真正要构建的，是可交付的任务系统，不只是会说话的模型外壳。

很多团队会把注意力放在模型接入和提示词技巧上，但更容易长护城河的部分，往往在 orchestration、tooling、eval、memory、权限边界和真实场景适配上。

换句话说，Agent Engineer 也越来越像一类更贴近产品交付的系统工程师。你的工作不只是把能力展示出来，还要把结果稳定交出去。

一个适合立刻做的拆解练习

拿你们现在最想做的一个 AI 功能，强迫自己把它拆成四层写下来：模型、工具、工作流、最终结果。

如果你们现在讨论得最多的仍然是第一层，那就说明这件事还停留在“接能力”的阶段；只有当讨论开始往后三层移动，它才真正开始接近一个 agent 产品。

更新附注

版本：v1.2
更新日期：2026-04-01
更新原因：收紧 summary、abstract、开头与护城河段表述，压掉重复口吻，让这篇更像一篇商业判断文章，而不是系列模板延伸。

版本：v1.1
更新日期：2026-03-20
更新原因：为系列文章补充统一阅读序号，帮助读者更自然地衔接到产品与商业层讨论。

参考来源

这里只有一层：长文 - 评论。可以改昵称，也可以不改；改完之后会在这台设备上记住。

还没有评论，你可以写下第一条。

继续阅读

别把这篇当成终点。这里优先给你系列内延续、同主题扩展和站内值得继续看的文章。

继续读这个系列

这篇属于「Agent 陪读系列」，优先按系列顺序继续往下读。

2026-03-19 21:50 北京时间 10 分钟同属「Agent 陪读系列」

05｜Coding Agent 需要熟练操作者，它不会替你负责

Coding agent 当然有用，但它最依赖的，恰恰是前面那个会提清楚任务、会判断结果、会继续追问的人。真正被放大的，从来不是模型幻觉，而是操作者本身的清晰度和收口能力。

2026-03-19 22:00 北京时间 12 分钟同属「Agent 陪读系列」

06｜2025 年，Agent 编程为什么突然变了

过去一年如果你总觉得模型、Agent、写代码方式都像在突然提速，这篇可以帮你把变化串起来。Karpathy 的价值，在于他把 2025 年几个真正改变格局的转折点挑了出来。

2026-03-19 22:10 北京时间 10 分钟同属「Agent 陪读系列」

07｜别一把梭哈给 AI：和它一步一步把问题做完

很多人以为用 AI 编程就是把任务扔过去、等它回一坨结果。Jeremy Howard 这篇真正有用的，是它提醒大家：更可持续的方式，是把问题拆成小步，让人和 AI 在同一个反馈回路里一起往前走。

同主题延伸

如果你想顺着当前问题继续往下挖，这里优先给相近主题的文章。

2026-04-11 12:10 北京时间 11 分钟同主题：AI Agent 等 2 个标签

编辑精选

如果你想从这篇扩出去，这里放最近值得继续看的站内长文。

2026-04-12 10:20 北京时间 12 分钟编辑精选

下一篇 05｜Coding Agent 需要熟练操作者，它不会替你负责

阅读难度

进阶

信息密度适中，适合连续阅读。

专题

Agent 陪读系列

这个系列使用显式顺序维护，不依赖发布时间改动来维持前后关系。

1. 这篇真正追问的是谁更接近下一波大公司
2. 用户最终买的，很少是模型本身
3. 对开发者来说，这会改写你看 AI 产品的方式
4. 产品和测试会更先感受到这种变化
5. 对 Agent Engineer 来说，护城河开始换地方了
6. 一个适合立刻做的拆解练习
7. 更新附注

要点

Model Labs 和 Agent Labs 的重心不同，一个更偏模型能力，一个更偏任务结果与系统编排。
Agent 时代的公司竞争力，越来越来自模型选择、工具 harness、工作流设计和真实使用场景。
对开发者和产品来说，这意味着只盯模型已经不够，必须开始理解系统层与任务层。

RSS

Subscribe to long-form updates through RSS. Feed timestamps use Beijing time.

Open RSS feed

LLMs

This site also exposes llms.txt and sitemap.xml for model-friendly discovery.

Open llms.txt

04｜下一波 AI 大公司，为什么可能出在 Agent 层

快速答案

这篇真正追问的是谁更接近下一波大公司

用户最终买的，很少是模型本身

对开发者来说，这会改写你看 AI 产品的方式

产品和测试会更先感受到这种变化

对 Agent Engineer 来说，护城河开始换地方了

一个适合立刻做的拆解练习

更新附注

参考来源

评论（0）

继续阅读

继续读这个系列

05｜Coding Agent 需要熟练操作者，它不会替你负责

06｜2025 年，Agent 编程为什么突然变了

07｜别一把梭哈给 AI：和它一步一步把问题做完

同主题延伸

Hermes 安装指南：macOS 和 Windows 怎么装

Anthropic 为什么要把 Managed Agents 做成平台层

把多窗口 AI 工作流重构成单一控制面

编辑精选

在原生 Windows 上，重搭 AI 编程命令行栈

01｜论文精选：这一周最值得看的三条判断

01｜GitHub AI 趋势：这一周最值得看的三条线索