4 月 7 日消息,小米集团 MiMo 负责人罗福莉昨天在 X 平台发文,谈及最近 AI 业界火热的 Token(注:词元)价格战。
罗福莉表示,Anthropic 几天前切断了 Claude 第三方工具订阅通道;并且 MiMo 也在几天前推出了 Token Plan,于是她有感而发:
1、Claude Code 的订阅机制在计算资源分配上设计得非常漂亮。但我认为它并不赚钱甚至可能亏损,除非 API 利润率高出 10 到 20 倍。
我无法精确计算第三方框架接入后带来的损失,但我仔细研究 OpenClaw 的上下文管理后发现它很糟糕。例如在一次用户请求中,OpenClaw 会触发多轮低价值的工具调用,每一次都是独立的 API 请求,而且都携带超长上下文(通常超过 10 万 tokens)。
即便有缓存命中,这种方式仍然非常浪费;在极端情况下,还会提高其他请求的缓存未命中率。
这就导致每个用户实际触发的 API 调用次数往往是 Claude Code 原生框架的数倍。换算成 API 成本很可能是订阅价格的几十倍。这已经不是“差距”,而是“巨大鸿沟”。
2、OpenClaw、OpenCode 等第三方框架仍然可以通过 API 调用 Claude,只不过不能再“搭便车”使用订阅额度。
短期来看,这些智能体的用户会感受到成本压力,费用可能轻松上涨几十倍。但这种压力会迫使上述框架优化上下文管理、提高提示词缓存命中率,减少 Token 浪费。
这种痛苦最终会转化为工程上的自律。
3、我建议各大 LLM 公司,在搞清楚如何设计一个不亏钱的编程订阅方案之前,不要盲目去打价格战。
把 Token 价格压得很低、同时完全开放第三方框架看起来对用户很友好,但这其实就陷入了 Anthropic 刚走出的陷阱。
并且更深层的问题在于,如果用户把注意力消耗在低质量 Agent 框架上,那么面对不稳定且缓慢的推理服务时,就只能使用降级过的节省成本大模型,结果仍然无法完成任务。这对于用户体验、留存来说无异于恶性循环。
4、关于 MiMo 的 Token Plan 计划:它支持第三方工具,按 Token 计费,与 Claude 新推出的额外使用套餐逻辑相同。我们的目标是长期稳定地提供高品质服务,而不是让您冲动消费后弃坑。
从宏观角度看,全球计算资源增长的脚步已跟不上 Agent 带来的 Token 需求增长。真正的出路不是提供更便宜的 Token,而是让“更高效的 Agent 框架” × “更强大且更高效的模型”协同演进。
Anthropic 的这次举措无论是否出于本意,都在推动开源、闭源生态发展,这或许是一件好事。
Agent 时代不属于消耗最多算力的人,而属于最懂得如何高效利用算力的人。