金融是高价值场景
垂直 Agent 这轮最值得看的样本,重点是金融工作包。原因并不神秘:金融工作昂贵、流程固定、数据密集、交付物清楚,而且天然需要审计和复核。
这并不意味着金融最容易被自动化。恰恰相反,金融任务里有大量隐含判断、合规边界、数据授权、模型假设和人工签字。它先被做成 Agent 模板,是因为每省下一小时分析师、合规、审计或运营时间,价值都足够高;每一次错误,也足够值得设计复核机制。
通用 Agent 常常把问题说大:什么都能做。垂直 Agent 的做法更窄:先把一类高频高价值工作拆成可安装的流程包,再把数据连接、技能、子任务和人工审批放进去。金融正好适合暴露这条路线。
Anthropic 做的是工作模板,不是聊天助手
Anthropic 5 月发布的金融服务 Agent,重点不是「Claude 更懂金融」。它推出的是 10 个 ready-to-run agent templates,覆盖 pitchbook、KYC 文件筛查、月结、估值复核、财报电话会更新、市场研究、总账核对等任务。
更关键的是它对模板的定义。每个模板把三类东西打包:skills,负责指令和领域知识;connectors,负责有治理的数据访问;subagents,负责可拆开的子任务,例如可比公司筛选或方法论检查。企业还可以按自己的建模习惯、风险政策和审批流程改造。
这就是垂直 Agent 与通用聊天机器人的分界。金融公司需要的让一个工作流能接入 FactSet、S&P Capital IQ、MSCI、PitchBook、Morningstar、LSEG、Daloopa、内部数据仓库、研究库和 CRM,并且所有访问都在治理边界内发生。
GitHub 仓库暴露了交付形态
Anthropic 同步开放的 anthropics/financial-services 仓库,更像是这类产品形态的说明书。README 里写得很清楚:同一套来源可以作为 Claude Cowork 插件安装,也可以通过 Claude Managed Agents API 部署到自己的 workflow engine 后面。
仓库结构也说明它不是一篇营销稿。里面有 .claude-plugin、managed-agent-cookbooks、plugins、Microsoft 365 安装相关目录和脚本。它把 Pitch Agent、Meeting Prep Agent、Market Researcher、Earnings Reviewer、Model Builder、GL Reconciler 等 Agent 做成可安装对象,同时把 /comps、/dcf、/earnings、/ic-memo 这类命令和技能绑定在一起。
这类交付方式很重要。企业买垂直 Agent,买的是一套能被内部平台团队审查、改造、部署和撤回的资产。插件、cookbook、Managed Agent 模板这些形式,都是为了让 Agent 进入企业软件交付链。
评测给了必要的冷水
金融 Agent 不能只看供应商发布。Herculean 这篇 2026 年 5 月更新的论文,给了更冷静的测量框架。它是在把任务放进四类代表性 workflow:Trading、Hedging、Market Insights 和 Auditing。每个 workflow 都被实例化为 MCP-based skill environment,包含工具、交互动态、约束和成功标准。
论文的结论对产品叙事很有用,也很克制。前沿 Agent 在 Trading 和 Market Insights 上相对表现更好,但在 Hedging 和 Auditing 上明显吃力。原因也不难理解:对冲和审计更依赖长程协调、状态一致性和结构化验证。它们不是写一段摘要或找几条新闻就能完成的任务。
这正好提醒我们:金融 Agent 最有价值的地方,也是最不能轻率自动化的地方。越接近真实账本、风险暴露、审计签字和监管责任,越需要把 Agent 降级为「准备材料、提出草稿、组织证据、触发复核」的角色,而不是直接替人批准。
垂直 Agent 的护城河在流程细节里
通用模型公司容易强调模型能力,垂直 Agent 的护城河却更接近流程资产。一个金融 Agent 如果只是会写一段行业摘要,很快会被通用模型追平。真正难复制的是下面这些东西:
- 数据连接:能否在授权边界内访问内部仓库、市场数据、研究库和办公文件。
- 工作惯例:估值口径、模型模板、图表格式、审稿习惯是否符合机构内部标准。
- 审批链路:哪些动作只能草拟,哪些需要复核,哪些必须人工签字。
- 错误边界:数据缺失、口径冲突、异常数值和假设变化能不能被明确标出。
- 可部署形态:能否作为插件、模板或 API 后台工作流进入企业系统。
这些细节听起来没有「万能 Agent」好卖,但它们决定了产品能不能真正上线。金融行业愿意试垂直 Agent,因为它知道容错低,所以必须把流程做得更具体。
先落地的会是工作包,不是万能同事
垂直 Agent 的路径大概率会比通用 Agent 更平实。它不会一开始替代整间投行或审计团队,而是先从 pitchbook 初稿、会议简报、财报电话会更新、KYC 文件包、月结清单、估值复核这种有清楚输入输出的任务切进去。
这些任务有共同特征:材料多,格式稳定,人工重复劳动重,结果必须给人复核。Agent 在这里不是「独立决策者」,更像一个能把材料、模型、文档和系统串起来的高级执行层。
这也解释了为什么金融会成为垂直 Agent 的早期主战场。因为金融足够贵、足够流程化、足够重视证据链。真正可用的垂直 Agent,不会把「懂行业」停留在语气上,而会把行业知识写进技能、连接器、子任务、审批流和评测环境里。
还没有评论,你可以写下第一条。