Agent Skills 正在变成新的软件包

Feature Essay

Agent Skills 正在变成新的软件包

HN 对 agent-skills 的讨论、OpenAI 的 Codex plugins and skills、开源 skills 仓库和论文里的 Agent Skills 放在一起看，agent 产品正在补一层新抽象：像软件依赖一样分发可复用的工作能力。

2026-05-24 03:28 北京时间 10 分钟难度：进阶

39 阅读 0 点赞

快速答案

Skills 把流程、工具、脚本、文件和调用约定打包成可安装资产。Agent 生态的下一层竞争，会落到谁能分发、治理和复用这些能力包。

Skills 的价值不在把提示词写长，而在把稳定流程、工具调用、脚本和检查方式封装成可复用单元。
不同团队开始积累自己的 skills 后，企业要管的会变成版本、来源、权限、审计和失效规则。
未来的 Agent 平台不只卖模型和运行时，还会争夺 skills 市场、企业流程库和垂直工作包。

这个词不该被翻译成提示词模板

Agent Skills 这个词最近又热起来，最省事的写法是把它归进「高级提示词合集」。这会把问题写小。

一个 skill 如果只是几段提示词，当然有用，但价值有限。更值得追的是另一件事：agent 生态正在出现一层类似软件包的东西。它把做某类工作的步骤、工具、脚本、文件、上下文读取方式和检查规则放在一起，让 agent 在需要时按包调用，而不是每次从零靠聊天上下文临时拼。

这和过去的 prompt library 不同。Prompt library 更像话术库，skills 更像能力包。前者告诉模型「你应该怎么说」，后者告诉模型「这类工作应该按什么流程做，必要时调用哪些资源，结果怎么检查」。

在 agent 开始替人做事之后，这个差别会变得更重要。模型能力还会变，但企业和开发者留下来的流程、工具和领域知识，不可能每次都重新塞进一段对话里。

为什么 skills 会从个人技巧变成资产层

一个开发者早期用 agent，常见做法是自己写一份项目说明：代码风格、测试命令、发布步骤、常见坑、不要碰的目录、review 偏好。用得久一点，又会加上脚本、检查清单、命令别名、工具说明。

这些东西只留在个人笔记里，作用很有限。换一个工具，重新复制一遍；换一个项目，重新改一遍；团队里其他人用，还是要靠口口相传。

Skills 把这些零散经验往一个可分发单元里收。一个 skill 可以有说明文件，可以有脚本，可以有示例，可以要求 agent 按需读取，而不是一开始就把所有内容塞进上下文窗口。它解决的问题是「怎么让一套工作方法可以被安装、复用和维护」。

开源社区已经在试这件事。addyosmani/agent-skills 把前端、性能、安全、测试、工程实践等工作方法拆成可安装 skills；openai/skills 则把可复用能力放进独立仓库。它们未必会成为最后的标准，但已经说明方向：agent 能力开始有了类似包生态的形态。

软件包的类比成立，但不能照搬

把 skills 类比成 npm 包，能帮助理解，但也有边界。

相似的地方在于，它们都在解决复用和分发。没人愿意每次写 Web 服务都从 socket 开始，也没人愿意每次让 agent 做财报分析、代码迁移、性能审计、投行 pitch 或安全检查时，都重新讲完整流程。

差别也很明显。传统软件包主要交付确定性代码；skills 交付的是一组会被模型解释和执行的工作约定。它可能包含自然语言、脚本、工具说明、输入输出格式、检查步骤和边界提醒。它是在被 agent 读取、选择、解释、调用。

这让治理难度更高。一个 npm 包有依赖版本、许可证、漏洞扫描和 lockfile；一个 skill 也会需要类似东西，但对象更复杂。

这个 skill 来自哪里，谁维护。
它会让 agent 调用哪些工具。
它读写哪些文件或外部系统。
它有没有过期的流程和坏掉的命令。
它的建议和企业内部规范冲突时听谁的。
它能不能被审计，能不能回滚到旧版本。

这些问题一旦出现，skills 就不再是「好用提示词」。它们会变成企业软件资产。

OpenAI 把 plugins 和 skills 放在一起，是一个信号

OpenAI Academy 讲 Codex plugins and skills，值得注意的重点是它把 plugins 和 skills 放在同一个扩展框架里讨论。

Plugin 更像连接能力：接工具、接服务、接外部系统。Skill 更像过程能力：告诉 agent 某类任务应该怎么做。两者放在一起，agent 才不只是「能调用工具」，而是「知道什么时候、按什么流程、用哪些工具完成一类工作」。

这也是 skills 比 prompt 更重的地方。Prompt 通常只改变一次对话的行为；skill 会影响一类任务的执行方式。它可能让 agent 学会怎么写迁移脚本、怎么做可访问性审计、怎么整理设计文档、怎么跑一套端到端测试，甚至怎么准备行业报告。

从平台角度看，这层会自然走向市场和目录。模型是底座，运行时负责执行，MCP 和插件负责连接，skills 负责把人类流程打包。谁能让这些包更容易安装、发现、权限化和更新，谁就更接近 agent 平台的控制面。

论文里的 Agent Skills 说明研究侧也在靠近

arXiv 上的《Agent Skills for Large Language Models》把技能看成让模型通过可组合能力完成更复杂任务的一层抽象。无论最后具体方法怎么演化，它至少说明研究侧也在关注同一个问题：不要只把能力压在一次性 prompt 和模型参数里。

这和工程社区的需求能对上。真实工作一组可复用的过程。写代码要读仓库、理解约束、改文件、跑测试、解释 diff；做金融分析要读表、建模、核对假设、产出材料；做内容审稿要查来源、改结构、检查文风、发布校验。

这些过程有稳定部分，也有变化部分。稳定部分适合变成 skill，变化部分交给 agent 在当次任务里处理。

这层抽象做好以后，agent 的学习方式会更像团队积累工程资产。今天一个人把性能审计流程整理成 skill，明天另一个人就不用重新摸索；今天一个团队把投研材料流程整理成 skill，下次换模型也可以继续用这套工作方法。

金融 Agent 是一个垂直工作包样本

Anthropic 的金融服务 agent 和配套 GitHub repo，也可以放进这个趋势里看。它是在把金融分析里的连接器、数据源、工作流程、子 agent 和任务模板组织起来。

这类垂直 agent 最后很可能不会只以聊天窗口存在。它们会被拆成更细的工作包：KYC、pitch deck、估值复核、市场简报、Excel 建模、财报问答、会议准备。每个包都有输入、工具、检查点和输出格式。

对企业来说，这比「买一个万能 agent」更实际。业务部门不需要先理解 agent 架构，只需要知道某个工作包能不能安全地跑完一类任务。平台团队则需要在背后管理版本、权限、数据来源和审计。

这也是 skills 和垂直 agent 会汇合的地方。垂直 agent 负责面向业务的入口，skills 负责把里面可复用的流程拆成能力单元。前者像产品，后者像依赖。

门槛会从会写变成会管

如果 skills 继续增加，早期最热闹的阶段一定是安装和分享：这个 skill 让 agent 更会写测试，那个 skill 让 agent 更会做报告，另一个 skill 能帮你迁移框架。

但企业会卡在治理上。

一个团队可以随手安装十几个 skills，很快就会遇到问题：两个 skill 的规则冲突，旧 skill 里的命令过期，第三方 skill 要求调用外部服务，某个 skill 把内部路径写进输出，另一个 skill 的许可证不清楚。到这时，能力包越多，风险和维护成本也越高。

Skills 生态成熟的标志，不会只是数量。更重要的是这些能力能不能被管理。

是否有来源签名和版本记录。
是否能限制每个 skill 可调用的工具和数据。
是否能在团队内审批、下架和回滚。
是否能自动检测过期命令、坏链接和不合规流程。
是否能把一次失败反馈回 skill 本身，而不是只修当次输出。

这会把 skills 从个人效率工具推向企业平台能力。好用只是第一步，可治理才决定能不能进组织。

下一层竞争会围绕「流程包」展开

过去大家谈 agent 平台，容易先看模型、上下文长度、工具调用、MCP、沙箱和权限。这些仍然重要，但它们更像底座。底座成熟以后，差异会往上移：谁拥有更好的流程包，谁就更容易留住用户。

开发者会积累自己的 coding skills。公司会积累内部交付 skills。咨询公司会把行业方法打包成客户可用的 agent workflows。开源社区会继续整理通用能力包。模型公司也会把官方最佳实践包装成可安装 assets。

这不是小功能。它关系到 agent 的长期复用方式。模型换代很快，工具接口也会变，但一家公司怎么做风控、怎么做代码评审、怎么写销售提案、怎么跑发布门禁，这些流程知识不会每天重写。

Agent Skills 的关键就在这里：它把这部分知识从一次性对话里拿出来，变成可以被安装、升级、审计和复用的软件资产。

以后评价一个 agent 平台，不能只问它接了几个模型、支持多少工具。还要问它能不能管理 skills，能不能让团队把工作方法留下来，能不能让这些方法跨模型、跨项目、跨工具继续有效。

到那一步，skills 就不再是提示词边角料，而是 agent 时代新的软件依赖。

参考来源

还没有评论，你可以写下第一条。

继续阅读

同主题延伸

如果你想顺着当前问题继续往下挖，这里优先给相近主题的文章。

2026-05-24 03:57 北京时间 11 分钟同主题：AI Agent 等 3 个标签

Agent 可观测性会成为新的基础设施

Agent 真正进入生产之后，问题不再只是能不能回答，而是每一步为什么这样做、花了多少成本、调用了什么工具、失败在哪里。可观测性会从辅助日志变成 Agent 平台的核心层。

2026-05-24 01:58 北京时间 10 分钟同主题：AI Agent 等 3 个标签

Coding Agent 正在竞争企业运行层

这一周的信号说明，Coding Agent 的竞争不再只看模型会不会写代码，而是看谁能把沙箱、权限、验证、成本和工作流一起接进企业工程系统。

2026-05-25 00:33 北京时间 16 分钟同主题：软件工程等 3 个标签

Agent 时代，编程语言不会消失，只会重新分工

Agent 时代不会让编程语言变得不重要。变化恰好相反：语言会从人的偏好问题，变成 Agent 能否理解、修改、验证、部署和长期维护系统的协作界面。

编辑精选

如果你想从这篇扩出去，这里放最近值得继续看的站内长文。

2026-05-29 21:35 北京时间 12 分钟编辑精选

下一篇 Agent 安全的边界正在从提示词移到运行时

阅读难度

进阶

信息密度适中，适合连续阅读。

1. 这个词不该被翻译成提示词模板
2. 为什么 skills 会从个人技巧变成资产层
3. 软件包的类比成立，但不能照搬
4. OpenAI 把 plugins 和 skills 放在一起，是一个信号
5. 论文里的 Agent Skills 说明研究侧也在靠近
6. 金融 Agent 是一个垂直工作包样本
7. 门槛会从会写变成会管
8. 下一层竞争会围绕「流程包」展开

要点

Skills 的价值不在把提示词写长，而在把稳定流程、工具调用、脚本和检查方式封装成可复用单元。
不同团队开始积累自己的 skills 后，企业要管的会变成版本、来源、权限、审计和失效规则。
未来的 Agent 平台不只卖模型和运行时，还会争夺 skills 市场、企业流程库和垂直工作包。

RSS

Subscribe to long-form updates through RSS. Feed timestamps use Beijing time.

Open RSS feed

LLMs

This site also exposes llms.txt and sitemap.xml for model-friendly discovery.

Open llms.txt

Agent Skills 正在变成新的软件包

快速答案

这个词不该被翻译成提示词模板

为什么 skills 会从个人技巧变成资产层

软件包的类比成立，但不能照搬

OpenAI 把 plugins 和 skills 放在一起，是一个信号

论文里的 Agent Skills 说明研究侧也在靠近

金融 Agent 是一个垂直工作包样本

门槛会从会写变成会管

下一层竞争会围绕「流程包」展开

参考来源

评论（0）

继续阅读

同主题延伸

Agent 可观测性会成为新的基础设施

Coding Agent 正在竞争企业运行层

Agent 时代，编程语言不会消失，只会重新分工

编辑精选

Git 入门：先看懂版本、分支和协作

TerminalWorld：终端 Agent 评测不能只靠人造题

Agentic CLEAR：只做可观测还不够，Agent 需要解释型评测