3你好限制,你的克劳德代码限制去了哪里?一个28天的缓存Bug,以及鼓励你"谨慎使用"的官方回应。
4-17%.这是克劳德代码在过去一个月中的提示缓存命中率。正常水平为97-99%。
这意味着,当您恢复上一个会话时,Claude Code 不会重用以前处理的上下文,而是每次都从头处理所有内容,消耗的积分比正常值高 10 到 20 倍。你可能认为你在继续对话,但实际上,你每次都在开始一个全新的、全价的对话。

这些数据来自独立开发者ArkNill的代理监控。通过设置透明代理,他记录了Claude Code和Anthropic API之间的每一个请求,发现了至少两个客户端方向缓存错误,导致API服务器无法匹配缓存的对话前缀,迫使每轮重建一个完整代币。

上图显示了三个阶段的缓存命中率比较。在 v2.1.69 到 v2.1.89 版本(bug 期间 ) , 单机版的缓存命中率只有 4-17 % 。修复了v2.1.90版中的一个关键错误后,冷启动缓存命中率恢复到47-99.7 % 。到 v2.1.91,稳定的缓存命中率恢复到 97-99%。
图表中一个值得注意的细节:v2.1.90 中的范围相当宽(47% 到 99.7 % ) ,因为当会话刚刚恢复时缓存仍然需要"热身 " , 导致前几轮命中率较低,但很快恢复正常。在bug版本中,这种热身永远不会发生 — 缓存命中率始终保持在系统提示的14,500个令牌上,每次对话历史的全部内容都会被完全计费。
28天,20个版本
此错误不是在一个更新中引入并在下一个更新中修复的类型。根据npm注册表发布记录,引入该漏洞的v2.1.69版本于三月4日发布,修复该漏洞的v2.1.90版本于四月1日发布。其间有28天,跨越20个版本。

时间线揭示了一个诱人的细节。在三月四日引入该漏洞后,用户并没有立即大规模投诉。直到三月二十三日,投诉才大规模爆发,几乎三个星期之后。原因是,根据GitHub第41930期的分析,从三月13日到28日,Anthropic进行了2倍配额的实盘推广(非高峰时段翻倍 ) , 客观上掩盖了bug的影响。促销结束后,缓存漏洞消耗量恢复到正常计费基线,用户的配额瞬间"蒸发 " 。
Anthropic的反应并不迅速。三月月26日,在用户投诉爆发三天后,工程师Thariq Shihipar在其个人X账户上宣布,高峰时段限制(工作日凌晨5点至凌晨11点)已经收紧。三月30日,Anthropic在Reddit上承认“用户达到配额的速度远远超过了预期 ” , 并将其列为团队的首要任务。直到四月一日,团队成员莉迪亚·哈莉才公布了正式的调查结果。
在整个过程中,Anthropic没有发布任何博客文章、发送电子邮箱/邮件通知或更新状态页面。所有官方沟通都完全通过工程师的个人社交媒体帖子和Reddit的一些评论来完成。
您支付了多少钱,可以使用多多头时间?
GitHub 第 #41930 期收集了数百份用户报告。最极端的情况是最大20倍订阅用户(200美元/月 ) , 其5小时的滚动窗口在19分钟内完全消耗殆尽。最大5倍用户(100美元/月)报告说,他们的5小时窗口在90分钟内用完了。据The Letter Two报道,一些用户声称,一个简单的"你好"消耗了他们会话配额的13 % 。Discord上的一位用户20美元/月)提到,他的配额"每周一用完,周六才重置 " , 30天内只有12天的正常使用。

根据ArkNill的基准测试,在错误版本v2.1.89中,Max 20x计划的100%配额将在大约70分钟内耗尽。他还计算了50万个代币上下文会话的单个 - - 恢复操作的成本,大约为0.15美元,因为系统会完全重放整个上下文。
「你拿错了」
Lydia Hallie的调查证实了两点:第一,高峰时段限制确实有所收紧;第二,在100万代币范围内代币消费有所增加。她提到,团队修复了一些bug,但强调"没有一个bug导致收费过高 。 "
然后,她提出了四项节俭建议:
1.使用十四行诗4.6而不是Opus(Opus的消耗率约为两倍 ) ;
2.降低推理深度或在不需要深度推理时关闭扩展思维;
3.不要恢复超过一小时的多头空闲会话;而要启动一个新的会话;
4.设置环境变量 CLAUDE_CODE_AUTO_COMPACT_WINDOW=200000 以限制上下文窗口大小。
没有提到任何形式的配额重置或赔偿。
AI播客主持人亚历克斯·沃尔科夫(Alex Volkov)将这一回应总结为“你持有它是错误的 ” , 指出Anthropic本身将100万代币币上下文设置为默认上下文,将Opus作为旗舰模型进行推广,并强调延伸思维是卖点,但现在建议付费用户不要使用这些功能。
所谓"不过度收费"的说法也与Claude Code自己的更新历史产生了紧张关系。就在Lydia响应的前一天,v2.1.90修复了一个自v2.1.69以来一直存在的缓存回归错误:当使用 - - resume恢复会话时,本应命中缓存的请求将触发完整的提示缓存未命中,从而导致全额计费。Lydia的答复没有提到这一确认的账单异常情况。

相比之下,OpenAI 的 Codex 以前也曾遇到过类似的异常配额消耗问题。OpenAI的做法是重新设置用户配额,发放到账退款,并在三月宣布取消Codex的使用上限。Anthropic的方法是建议用户降级模型、禁用功能、限制上下文并将责任归属于用户使用。
Anthropic 销售"最强模型+最大上下文+最高推理能力"的订阅,每月收费 20 到 200 美元。一个长达28天的缓存漏洞导致付费用户的配额以10-20倍的速度耗尽,官方的反应是谨慎使用。
猜你喜欢

什么是持币生息?如何在持币生息 2026 上领取额外免费加密货币
什么是持币生息?如何使用它?本指南解释了持币生息功能如何运作,以及在持币生息提升活动期间余额如何增加,推荐人如何获得额外奖励。

2026年持币生息比较:哪个交易所能提供最多的额外奖励?
什么是加密货币的持币生息?比较2026年Kraken、欧易、币bit、币安和WEEX的持币生息功能,看看哪些平台提供了超越标准收益机制的额外促销奖励。
《2026年透明度法案》最新动态:稳定币收益禁令、参议院妥协方案及其对加密货币市场的影响
《CLARITY法案》可能会在2026年重塑稳定币收益规则、DeFi激励机制以及加密货币流动性。了解参议院的最新动态、时间表调整,以及该法规可能对加密货币交易者产生的影响。

Tiger Research:亚洲九大市场散户投资者现状分析

福布斯:量子技术威胁加密行业?但更可能是机遇

好战分子特朗普已经忘了在机场排队几小时的美国人

近3亿美元瞄准美国中期选举,Tether高管掌舵加密行业第二大政治基金

Anthropic的三重时刻:代码泄露、政府对峙与武器化

OpenAI与Anthropic同一天两笔收购,是两种IPO焦虑

福布斯:量子技术威胁加密行业?但更可能是机遇

律动 X 知乎香港活动招募skills,现在报名,有机会现场展示

比特币矿企第 N 次出逃

稳定币并购:不会出现“赢家通吃”

胡塞有检查站 | Rewire新闻晨报

人工智能时代的省钱哲学:如何明智地使用每一枚代币

2400亿美元的“黑暗森林”,铁金融的陨落

如何利用人工智能在Polymarket上赚钱?

早报 | YZi Labs 战略追加投资 Predict.fun;Drift Protocol 遭攻击损失至少 2 亿美元;Coinbase 旗下 x402 加入 Linux 基金会
什么是持币生息?如何在持币生息 2026 上领取额外免费加密货币
什么是持币生息?如何使用它?本指南解释了持币生息功能如何运作,以及在持币生息提升活动期间余额如何增加,推荐人如何获得额外奖励。
2026年持币生息比较:哪个交易所能提供最多的额外奖励?
什么是加密货币的持币生息?比较2026年Kraken、欧易、币bit、币安和WEEX的持币生息功能,看看哪些平台提供了超越标准收益机制的额外促销奖励。
《2026年透明度法案》最新动态:稳定币收益禁令、参议院妥协方案及其对加密货币市场的影响
《CLARITY法案》可能会在2026年重塑稳定币收益规则、DeFi激励机制以及加密货币流动性。了解参议院的最新动态、时间表调整,以及该法规可能对加密货币交易者产生的影响。
