罗福莉 3 月和 4 月在谈不同问题

3 月 27 日,罗福莉在中关村论坛谈 OpenClaw 时,评价偏正面。按《每日经济新闻》的报道,她看重两点:开源框架能持续吸收社区改进,Agent 也因此不再只剩模型本体,模型之外的工具层、调度层和工作流层开始有了想象空间。

4 月 6 日,她在 X 上的评论换了焦点。36 氪转引的几条判断很集中:第三方框架的上下文管理浪费严重;Anthropic 切断订阅调用并不意外;低价 token 加完全开放的第三方框架不是长期模式;MiMo Token Plan 走按 token 计费;后面的竞争会落到高效率框架和强模型的组合上。

两次表态可以同时成立。3 月底谈的是框架层的技术价值,4 月初谈的是成本和结算方式。前者回答“这类框架有没有必要”,后者回答“这类框架该怎么活下去”。

批评成立的事实基础

先看 Anthropic 自己的规则。Claude 帮助中心现在把 Pro 和 Max 写成面向个人消费者使用 Claude Code 的订阅,Claude 与 Claude Code 共用使用额度。额度不够以后,可以开启 Extra Usage,也可以直接切到 API credits。Anthropic 还单独做了 usage bundles,面额是 50 美元、250 美元和 1000 美元,给超出订阅范围的额外流量结算。这已经不是“订阅包打一切”的产品结构了。

OpenClaw 的 Anthropic 文档把两条路径拆得更清楚。一条是 Anthropic API key,正常走 API 计费;另一条是 OpenClaw 里的 Claude subscription auth。按 OpenClaw 记录的 4 月 4 日通知,后者已经被 Anthropic 认定为 third-party harness usage,需要 Extra Usage,不能继续直接吃原来的订阅额度。文档对新配置的建议也很明确:如果要走清晰、稳定的生产路径,用 Anthropic API key。

再看价格。Anthropic 官方 API 价格里,Claude Sonnet 4.5 的输入价格是每百万 token 3 美元,输出是 15 美元;5 分钟 prompt cache write 是 3.75 美元,cache read 是 0.3 美元。这个价格表放在聊天产品里并不显眼,放到 Agent 框架里就完全不同了。假设一个任务因为多轮调用和上下文重发,被拆成 6 次、每次 10 万 token 级别的输入,输入侧就接近 1.8 美元,输出、缓存写入和重试还没算进去。只要任务带有长历史、多工具调用和低缓存命中率,成本很快就会偏离消费级订阅的设计区间。

罗福莉提到“真实成本可能是订阅价格的数十倍”。这个倍数会随任务形态变化,不能直接拿来套所有场景,但方向没有问题。长上下文、反复重发、后台长跑,本来就是 Agent 框架里最贵的三件事。

这件事不只是一家框架的问题

如果把问题全部归结成 OpenClaw 的产品设计失误,结论会失真。

第一,平台边界本身就在变化。Anthropic 早期让 Claude Code 和外部生态处在同一个使用语境里,增长上来以后,再把第三方 harness 单独收口计费。这里当然有框架对边界的试探,但也有平台在爆量之后重新划线。OpenClaw 只是第一个把这条边界撞得足够明显的项目。

第二,罗福莉也不是纯粹的外部评论者。4 月 3 日,小米刚上线 MiMo Token Plan。官方页面写得很直接:它采用 token 配额制,做了四档套餐,兼容 OpenClaw、OpenCode、Claude Code 等工具。这意味着她在批评 Anthropic 收口时,也在公开强调另一条产品路线。这个立场不影响她对成本问题的判断,但读者需要知道她并不处在中立位置。

第三,框架层的价值没有因为计费变化而消失。持久会话、跨设备接力、多入口接入、后台调度、长期在线,这些能力本来就不属于第一方聊天产品的强项。罗福莉 3 月 27 日对 OpenClaw 的正面评价,到今天仍然站得住。变化的是补贴方式,框架这一层还在。

OpenClaw 已经开始往成本问题上收

OpenClaw 文档近两周的变化,基本都指向同一件事:团队已经把成本放到主线位置。

它单独补了 Token use & costsAPI usage & costsPrompt caching 三块文档,开始把价格显示、缓存策略和 API 账单写清楚。现在可以用 /status 看当前会话消耗,用 /usage full 追加成本信息;也可以通过 cacheRetentioncontextPruning.mode = "cache-ttl" 和 heartbeat keep-warm 去维持缓存命中,减少反复写缓存和反复重发上下文的浪费。

这些改动有两个信号。第一,OpenClaw 已经不把“接通 Anthropic 订阅”视为默认终局,开始把 API 和显式计费当作长期路径。第二,后面的竞争点会从入口数量转到运行效率。入口再多,只要上下文打包和缓存命中做不好,单位经济还是会塌。

OpenClaw 后面更合理的方向

如果把 Anthropic 的规则变化和罗福莉的批评一起看,OpenClaw 后面至少有五件事要尽快做成默认能力。

  • 先把成本前置。长任务启动前就显示模型、预估 token、预算上限和并发设置,不要让用户在任务结束后才看到账单。
  • 把上下文压缩做成主功能。长上下文任务要默认做 diff 化打包、阶段性摘要、工具结果去重和 cache miss 告警,减少同一段历史被反复发送。
  • 把交互式任务和后台任务分层。人在盯着跑的 coding loop 可以继续优先贴近第一方体验;后台长跑、批量任务和多代理协作,应该默认回到 API、额度包或更便宜的模型。
  • 把组织级治理补齐。预算阈值、重试上限、队列优先级、单 agent 并发数、超时中断和审计日志,后面都会比“再多接一个聊天入口”更重要。
  • 把营销口径改掉。以后不该再把“能否复用某个消费级订阅”当成核心卖点,而该把“每类任务用哪种结算方式最稳”直接讲清楚。

这些建议最后都指向同一个定位:OpenClaw 更接近 runtime 层。这个层负责调度模型、管理上下文、约束成本和维持长期任务。定位清楚以后,产品路线也不会继续围着订阅边界打转。

结论

罗福莉这轮批评里,最扎实的部分是单位经济。第三方 Agent 框架如果继续把第一方订阅当成自动化运行层,后面大概率都会遇到同样的问题。OpenClaw 只是最早撞上这堵墙的项目之一。

OpenClaw 这类框架仍然有前途。框架层的价值还在,而且会长期存在。现在变化的是账怎么结、任务怎么分层、成本怎么暴露给用户。

对 OpenClaw 来说,下一阶段的胜负手会落在更少的上下文浪费、更清楚的计费路径和更成熟的运行治理上。罗福莉的批评,最后也落在这里。