小米罗福莉谈 Token 价格战：建议 LLM 公司不要盲目压低价格，会导致恶性循环

点点百科百科资讯 2026-04-07 21:18:05 20

4 月 7 日消息，小米集团 MiMo 负责人罗福莉昨天在 X 平台发文，谈及最近 AI 业界火热的 Token（注：词元）价格战。

▲ 图源：罗福莉本人社媒账号

罗福莉表示，Anthropic 几天前切断了 Claude 第三方工具订阅通道；并且 MiMo 也在几天前推出了 Token Plan，于是她有感而发：

1、Claude Code 的订阅机制在计算资源分配上设计得非常漂亮。但我认为它并不赚钱甚至可能亏损，除非 API 利润率高出 10 到 20 倍。
我无法精确计算第三方框架接入后带来的损失，但我仔细研究 OpenClaw 的上下文管理后发现它很糟糕。例如在一次用户请求中，OpenClaw 会触发多轮低价值的工具调用，每一次都是独立的 API 请求，而且都携带超长上下文（通常超过 10 万 tokens）。
即便有缓存命中，这种方式仍然非常浪费；在极端情况下，还会提高其他请求的缓存未命中率。
这就导致每个用户实际触发的 API 调用次数往往是 Claude Code 原生框架的数倍。换算成 API 成本很可能是订阅价格的几十倍。这已经不是“差距”，而是“巨大鸿沟”。
2、OpenClaw、OpenCode 等第三方框架仍然可以通过 API 调用 Claude，只不过不能再“搭便车”使用订阅额度。
短期来看，这些智能体的用户会感受到成本压力，费用可能轻松上涨几十倍。但这种压力会迫使上述框架优化上下文管理、提高提示词缓存命中率，减少 Token 浪费。
这种痛苦最终会转化为工程上的自律。
3、我建议各大 LLM 公司，在搞清楚如何设计一个不亏钱的编程订阅方案之前，不要盲目去打价格战。
把 Token 价格压得很低、同时完全开放第三方框架看起来对用户很友好，但这其实就陷入了 Anthropic 刚走出的陷阱。
并且更深层的问题在于，如果用户把注意力消耗在低质量 Agent 框架上，那么面对不稳定且缓慢的推理服务时，就只能使用降级过的节省成本大模型，结果仍然无法完成任务。这对于用户体验、留存来说无异于恶性循环。
4、关于 MiMo 的 Token Plan 计划：它支持第三方工具，按 Token 计费，与 Claude 新推出的额外使用套餐逻辑相同。我们的目标是长期稳定地提供高品质服务，而不是让您冲动消费后弃坑。
从宏观角度看，全球计算资源增长的脚步已跟不上 Agent 带来的 Token 需求增长。真正的出路不是提供更便宜的 Token，而是让“更高效的 Agent 框架” × “更强大且更高效的模型”协同演进。
Anthropic 的这次举措无论是否出于本意，都在推动开源、闭源生态发展，这或许是一件好事。
Agent 时代不属于消耗最多算力的人，而属于最懂得如何高效利用算力的人。

本文地址： http://dianzan.cc/33670.html

文章来源：点点百科