牛牛游戏app 罗福莉:列位醒醒吧,该实现token空幻狂欢了
发布日期:2026-04-09 00:15 点击次数:100

这两天,所谓" Anthropic 封禁 OpenClaw "的报谈漫天掩地,但事实上 Anthropic 是罢手了 OpenClaw 这种第三方居品径直通过 Claude Pro 等固定付费的订阅样式来调用才略的旅途。
你确切念念用 Anthropic 的模子和居品,要么通过官方来使用这种订阅情势,要么不错使用按量充费的 API 额度,封禁是莫得封禁,仅仅纵脱了调用和对应的"收费"样式。
比拟于空幻交融成"封禁"并第一时候联念念到"获兔烹狗"的一堆相关,小米 MiMo 大模子负责东谈主罗福莉的一篇长文是少有的对这个事情的确谨慎分析,并聊到点子上的。
她以为,Anthropic 的动作并不虞外,此前咱们一直在一场无法抓续的空幻 token 花费狂欢里,咫尺该醒醒了。

1
订阅制不适宜第三方 Agent
罗福莉当先对 Claude Code 的订阅瞎想给出正面评价,以为这是业内少有的、谨慎对待算力分派问题的居品瞎想。其逻辑是:轻度用户用的少,补贴重度用户,总体平衡。
但她未必指出,这套逻辑有一个粉饰前提:用户用的必须是 Anthropic 我方的框架。一朝脱离 Claude Code,就会出问题。
她以 OpenClaw 看成案例,指出第三方 harness 同期破碎了两个层面的平衡。
第一层是肯求次数。她在推文中写谈:" 我没意见严格狡计第三方 harness 接入变成的亏空,但我近距离看过 OpenClaw 的高下文搞定,很倒霉。在单次用户查询里,它会触发多轮廉价值器具调用,每轮看成零丁 API 肯求发出,每个肯求佩戴的高下文窗口通常普及 100K tokens。执行肯求次数是 Claude Code 原生框架的数倍。折算成 API 订价,真实成本大要是订阅价钱的数十倍。"
粗浅说,合并件事,OpenClaw 要跑十趟,原生框架跑一回。

第二个层面是缓存效果。她在驳斥区补充谈:" 更大的问题是,许多第三方 harness 在接近高下文长度纵脱时,每隔几步就压缩一次器具复返驱散,导致 cache 掷中率极低。"
Claude 的缓存机制依赖高下文前缀的一致性,前缀匹配,才能复用缓存、跳过访佛狡计。但每次压缩王人会改写高下文内容,导致前缀失配,缓存作废,模子被动重新全量读入。
两个问题叠在沿路,把每一次查询的执行 token 花费王人推向极值。
OpenClaw 的用户险些清一色是重度用户,而即即是轻度用户,通过 OpenClaw 发出的每一次肯求,在成本结构上也等同于重度用户。
订阅制赖以建树的诀别假定就此坍弛,补贴干系不复存在,Anthropic 片面承担成本缺口。
就像健身房办卡,就是赌一些用户办了卡但不来,从而补贴天天去健身房用户的成本,而 OpenClaw 让每个用户 7x24 小时的王人去高强度磨练,健身房成本就下不来了。
1
短期阵痛,恒久改善工程递次
而关于用户的大怒,罗福莉以为这个短痛是有用的。
她写谈:" 第三方 harness 如故不错调用 Claude,仅仅不可再搭订阅的便车了。短期内,这批用户会感受到成本冲击,松驰跳升数十倍。但这个压力,碰劲会鞭策这些 harness 去校正高下文搞定、最大化 prompt cache 掷中率、减少无效 token 花费。苦处最终会转动为工程递次。"
订阅制的问题在于,它让 harness 开垦者从来不需要为单次肯求的 token 花费负责。高下文搞定差没干系,cache 掷中率低没干系,归正成本由 Anthropic 的作事器偷偷领受。
但一朝回到 API 计费,这个结构就变了。token 浪掷会径直体咫尺账单上," 优化效果 " 从可作念可不作念,变成了有营业压力启动的工程需求。
每个开垦者单独决策时王人倾向于多用,合座生态的调用质地因此抓续恶化。计费结构的改造,是把外部性里面化的强制工夫。

1
Tokens 价钱战只会导致恶性轮回
比拟于感触 Anthropic 获兔烹狗,抄袭 OpenClaw 后要用我方第一方器具收割用户的相关,牛牛罗福莉提议了一个愈加有点"天子新衣"滋味的领导:
今天单纯为了 token 花费而狂欢,以及模子厂商们由此启航打的各式价钱战,将难以为继。是时候醒醒了。
她写谈:" 我劝 LLM 公司不要在还没搞明白 coding plan 怎样订价之前,就随着降价内卷。廉价卖 token、同期向第三方全面绽开,对用户看起来很友好,但那是一个陷坑。Anthropic 刚从这个陷坑里走出来。淌若用户在劣质 harness、不踏实推理作事、降配模子上反复碰壁,最终什么王人没作念成,用户体验和留存王人不会颜面。"
这个陷坑的机制是:大模子公司推出 coding plan 向第三方 harness 绽开,和 Claude 同样会入不敷出。为了鸿沟成本,平台只可裁减算力或换用更低廉的低智模子。用户名义上有实足的额度,但什么王人作念不好,留存当然也无谓说。
问题的根源在于计费结构。Coding Plan 实质上是按订阅周期加肯求次数的马虎额度包,开垦者买的是一段时候内的粗鄙使用权,感受不到单次肯求的真实成本。
当第三方 harness 接入时,高下文搞定马虎、冗余肯求、低 cache 掷中率变成的算力浪掷,成本全王人由平台肃静领受。
订阅制割断了用量与成本之间的信号传导,重度用户通过低效 harness 透支的算力,最终迫使平台要么封禁第三方,要么靠减慢、限流、降配模子来止损,这恰是 Anthropic 走到今天这一步的旅途。

固然,罗福莉的另一个主义亦然为她在小米作念的尝试和决议"作念告白"。
MiMo 的 Token Plan 走的是另一条路。MiMo 莫得封掉第三方进口,而是改造了计费结构:按执行 token 花费量配额,开垦者购买以 Credit 为单元的 token 额度。
不管使用原生框架如故 OpenClaw 品级三方 harness,每一个浪掷的 token 王人径直从用户的额度包里扣。平台不再为低效 harness 买单,用得多付得多,用得糙成本高," 用量 - 成本 " 的干系重新透明起来。
她将这套逻辑定位为:不是不让用,而是让计费结构自己成为拘谨机制,鞭策生态向高效果标的演化。
廉价订阅的问题不在于低廉自己,而在于它割断了信号传导。在订价逻辑没念念明白之前跟进,复制的可能不是 Anthropic 的上风,而是它刚刚踩过的坑。
1
竞争肃肃参预下一个阶段
罗福莉在推文临了把视线拉到了更大的框架上。
她写谈:" 各人算力的供给速率,仍是追不上 Agent 场景下 token 花费的增速。的确的出息不是更低廉的 token,而是协同进化,更高 token 效果的 agent harness,乘以更深广、更高效的模子。Anthropic 此次,不管主不雅意图是什么,客不雅上把整个生态,不管开源如故闭源,王人推向了这个标的。Agent 时期不属于烧算力最多的东谈主,而属于用算力最智谋的东谈主。"

罗福莉在推文临了恰是在挑战曩昔几年 AI 行业信奉的 " 算力竞赛 " 叙事。
主流逻辑一直是:算力更多,模子更强,成本更低,用户更多,形成正向飞轮。
但 Agent 场景冲破了这个等式。当一次用户查询不错触发数十次 API 调用,每次佩戴普及 100K tokens 的高下文,算力花费的增速就不再是线性的。单纯压低 token 价钱,只会加快这个花费,而不会改造其结构。
这意味着,下一轮竞争的中枢狡计,可能不再是 " 每 token 多低廉 ",而是 " 每 token 能完成几许灵验责任 "。谁先在这个维度上建筑上风,谁就能在各人算力供给跟不上 Agent 需求增速的窗口期里,占据的确有益的位置。
Anthropic 此次调遣,不管出于什么动机,王人在客不雅上把整个生态推向了这个标的。
快把烧 token 变成某种爱重和酬酢展示成本的东谈主们吐槽吐槽 Anthropic 就完结,关于各样 Harness 居品以及模子厂商们来说,这事的确的信号意旨其实很强,淌若如故念念着趁乱靠免费量大管饱去接住一波流量用户,就太不对时宜了。
一个阶段性的狂欢是时候让位于在工程和基础表率瞎想上的的确首要的责任了牛牛游戏app。(转载自硅星东谈主 Pro)
开云体育(kaiyun)官网- 上一篇:抢庄牛牛 远东传动(002406.SZ):预测2025年净利润同比增长25.06%~41.96%
- 下一篇:没有了

备案号: