为什么平台层才是真正决定长任务上限的那一层
到了 2026 年,再把 Agent 问题只理解成“哪个模型更强”已经不够了。真正拉开差距的,越来越不是前台交互,而是后台平台层:状态怎么存,任务怎么断点续跑,失败怎么回滚,人工怎么插手,预算怎么追踪,工具怎么通过标准协议接进来。这些能力不会直接让 demo 更惊艳,却决定系统能不能连续工作几小时、几天,甚至跨团队运行。
所以如果要判断谁更可能占住长期生态位,平台层比系统层和工具层更值得深看。系统层更容易先拿入口,工具层更容易先拿社区声量,但平台层一旦成为组织默认的 runtime 和 workflow 底座,就会像数据库、中间件、CI 编排层一样形成很高的迁移成本。这也是为什么我更愿意把这场竞争看成基础设施争夺,而不是单纯的 Agent 框架 PK。
今天最值得看的四个主要玩家,以及我为什么只挑这四个
如果把平台层的主流玩家都拉进来,名单会很长:LangGraph、Microsoft Agent Framework、OpenAI Agents SDK、AWS Strands、Temporal 相关方案、Inngest、Restate、DBOS,甚至还可以继续把 LlamaIndex workflow、CrewAI enterprise runtime 一类东西往里放。但如果只选“今天真正有代表性、同时具备官方背书、明确产品化方向和现实生态影响力”的平台层玩家,我会先锁定四个:LangGraph、Microsoft Agent Framework、OpenAI Agents SDK、AWS Strands Agents。
它们刚好代表了四条很不一样的路线。LangGraph 代表开放 agent runtime 路线;Microsoft Agent Framework 代表企业 workflow 与大组织工程路线;OpenAI Agents SDK 代表模型平台原生 SDK 路线;AWS Strands Agents 代表云厂商把 agent runtime 向自身平台能力吸附的路线。它们不是所有玩家,但足够构成一个有解释力的横截面。
LangGraph
- 开放 runtime / graph workflow / durable execution
Microsoft Agent Framework
- 企业 workflow / type-safe orchestration / Azure + M365 整合
OpenAI Agents SDK
- 模型原生 SDK / handoffs / guardrails / tracing / sessions
AWS Strands Agents
- model-first SDK / MCP / AWS 服务整合 / 云内平台路线
第一家:LangGraph,为什么它现在最像开放生态里的平台层头号选手
先看事实。LangGraph 官方 overview 直接把自己定义成一个聚焦 underlying capabilities 的 orchestration framework,重点能力包括 durable execution、human-in-the-loop、comprehensive memory、production-ready deployment。LangChain 官方还明确写到:LangGraph 是用于构建、管理和部署 long-running、stateful agents 的低层 orchestration framework 和 runtime,并且它可以 standalone 使用,但也能与 LangSmith、LangChain、Studio 形成完整套件。
这段官方表述的重要性不在宣传口径,而在于它几乎完整命中了平台层真正该做的事:它不把自己说成聊天框,不把自己说成 prompt helper,而是把 stateful、long-running、durable 这些 platform primitives 放在中心位置。换句话说,LangGraph 是少数从一开始就没有误判问题本质的玩家之一。
再看数据。截至 2026 年 3 月 13 日,我用 GitHub API 拉取到的仓库快照里,LangGraph 大约有 26,309 stars、4,547 forks、432 个 open issues,仓库创建于 2023 年 8 月 9 日,最近更新时间就在 2026 年 3 月 13 日。这说明它不只是有热度,而且仍处于非常活跃的演进期。它的社区体量在平台层里明显领先,这件事对生态位很重要,因为平台层不是只靠企业销售推动,也需要开发者默认愿意围绕它写模板、案例和适配。
团队与出身也很关键。LangGraph 背后是 LangChain Inc,而 LangChain 本身已经在 LLM 框架时代率先占住过开发者心智。很多人对 LangChain 过去的评价褒贬不一,但不能否认的一点是:LangChain 团队在“把一类新范式做成一个开发生态”这件事上,执行力非常强。LangGraph 实际上是在 LangChain 第一阶段经验之上,更准确地对准了 agent runtime 问题。
- 技术领先性主要体现在 durable execution、stateful memory、HITL 和部署调试闭环都比较完整。
- 社区热度在平台层里领先,而且不是短期刷出来的热度,而是持续演进中的热度。
- 它的最大平台气质来自“作为 runtime 存在”,而不是“作为一组 helper 函数存在”。
Strengths
- durable execution 定位明确
- stateful workflow 抽象成熟
- LangSmith / Studio / Deployment 形成套件
- 开放生态与社区热度领先
Weaknesses
- 偏底层,学习曲线不低
- 与 LangChain 生态绑定较深
- 对非 Python 团队吸引力稍弱
Opportunities
- 成为开放生态的默认 agent runtime
- 向企业交付与团队协作平台继续上探
Threats
- 云厂商与模型厂商可能把部分 durability 能力内建
- 更轻量的 SDK 路线可能吸走早期开发者
第二家:Microsoft Agent Framework,最危险的企业平台层玩家
Microsoft Agent Framework 的强势之处,不在于它今天 stars 最多,而在于它的官方定位非常清楚,并且几乎天生站在企业平台层的语境里。Microsoft Learn overview 页面明确写到:Agent Framework 提供两大类能力,Agents 与 Workflows。Workflows 被定义成 graph-based workflows,支持 type-safe routing、checkpointing 和 human-in-the-loop。更关键的是,官方还直接写明:Agent Framework 是 AutoGen 与 Semantic Kernel 的 direct successor,由同一批团队打造,是下一代统一基础。
这段表述的含义很重。它意味着微软不是又起了一个新项目碰碰运气,而是在把 AutoGen 的 agent abstraction 和 Semantic Kernel 的企业特性合并成一个新的平台层路线。官方文档反复强调的关键词包括 session-based state management、type safety、middleware、telemetry、workflow orchestration、long-running scenarios。这些词放在一起,已经非常像企业会采购、会标准化、会长期依赖的平台层能力。
再看数据。根据 2026 年 3 月 13 日的 GitHub API 快照,microsoft/agent-framework 大约有 7,888 stars、1,309 forks、723 个 open issues,仓库创建于 2025 年 4 月 28 日。单看 stars 它不算最热,但考虑到它非常新,而且仍处在 public preview 阶段,这个速度已经不慢。更重要的是,它背后不是一个独立开源项目在试图长成平台,而是微软在主动为 Azure、M365、Foundry、MCP 与多语言企业开发者提供新的 agent/workflow 统一底层。
从团队维度看,它几乎是四家里“组织能力”最强的一家。AutoGen 与 Semantic Kernel 团队本来就已经分别掌握了多 agent 抽象和企业集成经验,现在把这两条线合在一起,再叠加微软在企业销售、云、开发工具链和办公软件上的入口,意味着它具备一种很少有开源框架能拥有的优势:它不需要先说服组织定义这个问题,组织本身已经在微软体系里。
- 技术优势集中在 workflow、checkpoint、type safety、middleware、telemetry 与 Azure/M365 整合。
- 团队优势不是某个明星项目,而是 AutoGen 与 Semantic Kernel 两条线合流后的组织能力。
- 它的不可替代性在微软生态内会非常高,在微软生态外则取决于开发体验与开放程度。
Strengths
- 官方明确是 AutoGen + Semantic Kernel 的 successor
- 企业 workflow 与 state management 能力强
- Python + .NET 双栈
- Azure / M365 / Foundry / MCP 生态整合深
Weaknesses
- 目前仍处于 preview 阶段
- 社区自发生长速度不如 LangGraph
- 容易被理解成“微软体系内框架”
Opportunities
- 成为企业组织里的默认平台层
- 将 workflow、telemetry、approval、MCP 做成 Azure 标配
Threats
- 若开发体验复杂,独立开发者会流向更轻的开放框架
- 若过度绑定 Azure,跨云吸引力会受限
第三家:OpenAI Agents SDK,后劲很大,但今天更像生态连接器而不是完整 runtime
OpenAI Agents SDK 的独特之处,在于它一开始就不只是一个 narrow wrapper。GitHub 官方 README 把它定义成 lightweight yet powerful framework for multi-agent workflows,并且明确写到它是 provider-agnostic,支持 OpenAI Responses 和 Chat Completions,也支持 100+ other LLMs。官方列出的核心概念包括 agents、handoffs、guardrails、sessions、tracing;长任务方面,官方又给出 Temporal integration 与 human-in-the-loop 的耐久执行说明。
这套能力组合很有意思。它说明 OpenAI Agents SDK 并不是一个只有“调用 OpenAI 模型更方便一点”的工具,而是有明确平台化野心:sessions 处理跨 run 记忆,guardrails 处理输入输出校验,tracing 处理可观察性,handoffs 处理 agent 之间的控制转移,Temporal/Restate/DBOS integrations 则把 durable execution 延伸到外部基础设施层。这是一种非常“生态连接器”的做法。
数据上,2026 年 3 月 13 日 GitHub API 快照里,openai/openai-agents-python 大约有 19,955 stars、3,262 forks、60 个 open issues,创建于 2025 年 3 月 11 日。单看增长速度和 issue 控制,它表现非常强。相比 LangGraph,它的优势不是 runtime 身份最明确,而是它站在 OpenAI 自家平台之上:和 Responses API、Codex app、trace viewer、MCP 语境天然更近。这会给它带来非常强的战略后劲。
但我也正因为这个原因,暂时不会把它排到第一。因为到今天为止,它更像一个“非常优秀且战略位置极佳的 agent SDK”,而不是一个已经被广泛承认的 durable workflow runtime。它的平台潜力极强,但平台完成度还没有完全收敛到 LangGraph 那种程度。换句话说,它离未来很近,但离今天的独立平台层头名还差一点点。
- 优势在于模型平台原生性、轻量 abstractions、guardrails / sessions / tracing 齐全,以及与外部 durability 系统的连接能力。
- 技术路线更像“把 Agent 所需能力拼成统一 SDK”,而不是先从 workflow engine 出发。
- 如果 OpenAI 继续把 SDK、Codex app、automations、MCP 与 durable integrations 打通,它的平台地位会继续快速上升。
Strengths
- provider-agnostic,不是单一模型包装器
- handoffs / guardrails / sessions / tracing 组合完整
- 与 OpenAI 平台、Codex、Responses API 距离极近
- GitHub 增长速度很强
Weaknesses
- 更像 SDK,不像完整 workflow runtime
- durable execution 更多依赖外部 integration
- 平台身份尚未像 LangGraph 一样完全固定
Opportunities
- 与 Codex app、automations、tracing、MCP 形成强闭环
- 成为“模型平台原生”的默认 agent 开发层
Threats
- 被视为 OpenAI 专用开发框架,削弱跨生态中立性
- 在 runtime 深度上被更专注的平台层超越
第四家:AWS Strands Agents,最像云内稳步长大的平台层选手
AWS Strands Agents 的路线和前面三家都不完全一样。AWS 官方 Prescriptive Guidance 页面把它定义成 an open-source SDK,最初由 AWS 发布,并强调它是 model-first approach,同时支持 MCP integration、multi-agent collaboration patterns、AWS service integration、foundation model selection 和 multimodal capabilities。GitHub 官方 README 进一步强调它支持 Amazon Bedrock、Anthropic、Gemini、LiteLLM、Ollama、OpenAI、Writer 等多种 provider,同时原生带 Built-in MCP。
这说明 Strands 不是一个简单的 Bedrock SDK 衍生物,而是一种“云厂商试图定义 agent SDK 与工具协议入口”的路线。它的最大优势不在社区最热,而在于它天然可以与 Bedrock、Lambda、Step Functions、AgentCore、样例库、AWS 行业解决方案一起被打包使用。AWS 很擅长做这种事:单看一个项目,未必是全市场最热;但一旦放进它的云产品矩阵里,产品就会拥有强得多的生存能力。
2026 年 3 月 13 日 GitHub API 快照中,strands-agents/sdk-python 大约有 5,302 stars、710 forks、425 个 open issues,创建于 2025 年 5 月 14 日。对比 LangGraph 或 OpenAI Agents SDK,这个社区规模还明显偏小;但如果你把它放到 AWS 语境里去看,它并不需要先赢下所有独立开发者,它只需要先在 AWS 客户体系内成为 agent runtime 的顺手默认选项。
所以我对 Strands 的判断是:它不是“全市场最强平台层候选”,但很可能会成为 AWS 世界里的稳定平台位。尤其一旦 AWS 把 AgentCore、MCP、Bedrock 工作流与行业解决方案更紧密地打包在一起,Strands 的不可替代性就会更多来自云生态,而不是单个 repo 的热度。
- AWS Strands 的核心不是 stars,而是能否和 AWS 更大的平台能力一起被卖出去、被默认采用。
- MCP 原生支持和 provider 覆盖宽度,是它区别于传统云内 SDK 的重要点。
- 它在 AWS 内生态位很稳,但在外部通用平台心智上还明显落后于 LangGraph 和 OpenAI Agents SDK。
Strengths
- AWS 官方推动,云内整合位清晰
- model-first + MCP + multi-agent patterns
- provider 支持广,不只是 Bedrock 单一路线
- 有机会和 AgentCore / Lambda / Step Functions 联动
Weaknesses
- 社区热度与外部默认心智较弱
- 平台中立性的品牌感不够强
- 在显式 workflow 控制感上不如 LangGraph / Microsoft
Opportunities
- 成为 AWS 客户默认的 agent SDK / runtime 路线
- 借助 MCP 与云内工具体系放大平台粘性
Threats
- 被视作“只适合 AWS 体系”的框架
- 在开放社区中被更成熟平台层压制
把四家放在一张表里看,很多差异会立刻清楚
如果只看单个项目,很容易陷入各家宣传口径;但一旦把它们拉到同一张表里,差异就很明显了。LangGraph 最像通用开放 runtime;Microsoft Agent Framework 最像企业 workflow 平台;OpenAI Agents SDK 最像模型平台原生 SDK;AWS Strands 最像云内 agent 平台。它们的生态位不是完全重叠,而是部分重叠、部分错位。
也正因为如此,我不太认同那种简单的“谁会赢下平台层”的问法。更现实的格局,是平台层内部先形成分区:开放通用平台层、企业组织平台层、模型原生平台层、云内平台层。谁最终能跨出自己的初始分区,才真正有机会成为更广义的基础设施。
玩家 | stars | forks | 核心路线 | 最强生态位 | 我给的主观判断
LangGraph | 26,309 | 4,547 | durable runtime / graph workflow | 开放通用平台层 | 当前最成熟
Microsoft Agent Framework | 7,888 | 1,309 | enterprise workflow / Azure integration | 企业平台层 | 企业最危险
OpenAI Agents SDK | 19,955 | 3,262 | model-native SDK / guardrails / tracing | 模型原生平台层 | 后劲最大
AWS Strands Agents | 5,302 | 710 | model-first SDK / MCP / AWS integration | 云内平台层 | AWS 内最稳
从团队、技术、热度、生态、不可替代性五个角度,谁最强
如果按团队与组织能力来看,我会把微软放得很高,因为它直接承接了 AutoGen 与 Semantic Kernel 两条线的积累,并且有 Azure、M365、Foundry 这些现成入口。按技术完成度与问题命中度来看,我会先给 LangGraph,因为它最早、也最持续地把 durable execution、stateful workflow、HITL、deployment 这些平台能力做成显式产品。按战略后劲看,OpenAI Agents SDK 很值得重视,因为它离 OpenAI 自己越来越完整的 agent product stack 太近了。按云内粘性看,AWS Strands 最有机会在 AWS 用户体系里稳稳占住一块。
但如果一定要把这些维度压缩成一句话,那就是:LangGraph 现在最成熟,Microsoft 最有企业组织优势,OpenAI 最有战略后劲,AWS 最有云内落地势能。真正的胜负,可能不是谁单维度最强,而是谁最先把两个维度同时做厚。例如一个平台既有 runtime 深度,又有入口整合;或者既有企业 workflow,又有开发者社区热度。
- 团队与组织能力:微软最强。
- 技术问题命中度:LangGraph 最强。
- 模型平台战略后劲:OpenAI 最强。
- 云内生态粘性:AWS 最强。
我的最终判断:平台层不会只剩一家,但头部格局已经开始清晰
如果你问我,未来平台层会不会只剩一个胜者,我的判断是否定的。平台层太基础、太贴近组织结构和生态边界了,它更像云、数据库或工作流引擎,不太像社交网络那样天然通吃。更可能发生的,是头部格局逐渐稳定:LangGraph 占住开放与独立开发者世界里的默认 runtime 心智;Microsoft Agent Framework 占住大组织 workflow 与企业集成;OpenAI Agents SDK 借助模型平台与 Codex 相关生态继续上探;AWS Strands 在 AWS 体系里建立稳定平台位。
如果只问谁最有可能占据“通用平台层头号生态位”,我现在仍然偏向 LangGraph。不是因为它品牌最大,而是因为它最像一个围绕 long-running、stateful、durable 这些平台问题长出来的系统,而不是后来补 platform features 的 SDK。如果只问谁最有可能占住“企业平台层”,我会更看微软。如果只问谁最有可能在接下来一年里完成位置跃迁,OpenAI Agents SDK 的概率很高。AWS Strands 则很可能成为一个区域性很强、但在自己的区域里非常稳的平台玩家。
对准备自己下场的人来说,这篇分析真正有用的地方在哪里
最有用的地方,不是替你决定投谁,而是让你别在错误的层面重复造轮子。如果你想自己做一套 Agent 系统,平台层这四家的存在意味着你至少要先回答:你要做的是一个新的 runtime,一个新的企业 workflow 平台,一个模型原生开发层,还是一个利用现有平台搭出来的工作系统。如果这个问题不先想清楚,就很容易把别人已经在做且很难撼动的部分重做一遍,却忽略真正的缺口。
所以这篇文章真正想留下的不是一个排行榜,而是一种判断方式:看平台层,不要先问“谁最火”,而要先问“谁在解决哪个最难迁移的问题”。平台层的价值从来不在表面交互,而在于一旦进了组织底层,就会变成别人很难替换掉的那一层。这才是生态位的真正含义。
最后压缩成九条结论
如果把整篇平台层分析压缩成最后的结论,我会留下下面这九条。
- 平台层决定的是 Agent 能不能长期、稳定、可治理地工作。
- LangGraph 目前最像开放生态里的平台层头号玩家。
- Microsoft Agent Framework 是企业平台层里最危险的竞争者。
- OpenAI Agents SDK 现在更像强力 SDK,但后劲极大。
- AWS Strands 很可能在 AWS 体系内形成稳固生态位。
- GitHub stars 只能看社区热度,不能直接等同于最终生态位。
- 平台层的真正护城河来自状态、恢复、审计、协议和工作流,而不是单次模型表现。
- 未来平台层更可能是多强并存,而不是一家通吃。
- 自己下场之前,先判断自己是在补平台缺口,还是在重复造别人已经有强生态位的那一层。
还没有评论,你可以写下第一条。