3 hello 制限、クロードコードの制限はどこに行ったか。28日間のキャッシュバグ、そして「控えめに使って」と奨励する公式の反応
4-17%.過去1ヶ月間のクロードコードのプロンプトキャッシュヒット率です。正常レベルは97~99%です。
つまり、前のセッションを再開するとき、クロード・コードは以前に処理したコンテキストを再使用せず、毎回ゼロからすべてを処理し、通常の10倍から20倍の割合でクレジットを消費します。会話を続けているつもりでも、実際は毎回まったく新しい、満腹な会話を始めています。

このデータは、独立系デベロッパーであるArkNillのプロキシ監視から得られたものです。透過プロキシを設定することで、彼はClaude CodeとAnthropic APIの間のすべてのリクエストを記録し、APIサーバーがキャッシュされた会話プレフィックスを照合できなくなり、ラウンドごとに完全なトークンの再構築を強制する、少なくとも2つのクライアント側キャッシュのバグを発見した。

上のグラフは、3つのステージにおけるキャッシュヒット率の比較です。バージョンv2.1.69からv2.1.89(バグの期間)では、スタンドアロン版のキャッシュヒット率は4~17%でした。バージョンv2.1.90で重大なバグを修正した後、コールドスタートキャッシュヒット率は47-99.7%に戻りました。v2.1.91では、安定キャッシュヒット率が97~99%まで回復しました。
グラフから注目すべき詳細を1つ。v2.1.90では、セッション再開直後でもキャッシュを「ウォームアップ」する必要があるため、最初の数ラウンドはヒット率が低いものの、すぐに通常に戻るため、その範囲はかなり広い(47%から99.7%)。バグのあるバージョンでは、このウォームアップは発生しません。キャッシュヒット率は常にシステムプロンプトの14,500トークンにとどまり、会話履歴全体が毎回完全に課金されます。
28日間、20バージョン
このバグは、あるアップデートで導入され、次のアップデートで修正されたタイプではありません。npmレジストリのリリース記録によると、3月4日に不具合を導入したバージョンv2.1.69が、4月1日に不具合を修正したバージョンv2.1.90が公開されている。その間は28日間あり、20のバージョンにまたがっていた。

タイムラインは、タンタリングな詳細を明らかにした。3月4日のバグ導入後、ユーザーからすぐに大々的に苦情が出ることはなかった。苦情が一斉に噴出したのは3月23日になってからで、ほぼ3週間後だった。その理由は、GitHub issue #41930の分析によると、3月13日から28日にかけて、Anthropicは2倍のクォータプロモーションライブ(オフピーク時に倍増)を行い、客観的にバグの影響を覆い隠した。プロモーション終了後、キャッシュバグの消費量が通常の課金ベースラインに戻り、ユーザーのクォータは瞬時に「蒸発」しました。
アントロポニックの対応は迅速ではなかった。ユーザーからの苦情が噴出した3日後の3月26日、エンジニアのThariq Shihipar氏は個人Xアカウントで、ピーク時限(太平洋標準時平日午前5時~11時)が厳格化されたと発表した。3月30日、AnthropicはRedditで「ユーザーがノルマを達成する率が予想をはるかに超えた」ことを認め、チームの最優先事項として挙げた。チームメンバーのリディア・ハリーが正式な調査結果を発表したのは4月1日になってからだった。
このプロセスを通じて、Anthropicはブログ記事の公開、メール通知、ステータスページの更新を一切行わなかった。公式なコミュニケーションはすべて、エンジニアの個人的なソーシャルメディアへの投稿と、Redditのいくつかのコメントを通じてのみ行われた。
いくら払ったか、いつまで使えるか
GitHub issue #41930は数百件のユーザーレポートを集めた。最も極端なケースは、Max 20xのサブスクリプションユーザー(月額200ドル)で、5時間のローリングウィンドウが19分で完全に消費されました。Max 5xのユーザー(月額100ドル)は、5時間のウィンドウを90分で使い切ったと報告している。The Letter Twoによると、一部のユーザーは、単純な「こんにちは」がセッションクォータの13%を消費したと主張した。DiscordのProユーザー(月額20ドル)は、彼のクォータが「毎週月曜日に使い果たされ、土曜日にしかリセットされない」ことに言及し、30日間で通常使用量のわずか12日分しかリセットされなかった。

ArkNillのベンチマークテストによると、バグバージョンv2.1.89では、Max 20xプランの100%クォータが約70分で枯渇するという。また、50万トークンコンテキストセッションの1回の - - 再開操作のコストを計算した。これは、システムがコンテキスト全体を完全に再生するため、約0.15ドルである。
「持ち方が間違っている」
リディア・ハリーの調査により、2つの点が確認された。1つ目は、ピーク時の制限が確かに厳しくなったこと、2つ目は、100万トークンのコンテキスト内でトークンの消費が増加したことだ。彼女はチームがいくつかのバグを修正したことに言及したが 、 「 どのバグも過充電にはつながらなかった」と強調した。
そして彼女は、次の4つの倹約の推奨事項を提示しました。
1.Opusの代わりにSonnet 4.6を使う(Opusは約2倍の速度で消費する ) ;
2.深い推論を必要としないときは、推論の深さを下げるか、拡張思考をオフにする。
3.1時間を超える長時間のアイドルセッションを再開しないでください。代わりに新しいセッションを開始してください。
4.環境変数CLAUDE_CODE_AUTO_COMPACT_WINDOW=200000を設定してコンテキストウィンドウのサイズを制限します。
クォータのリセットや補償については言及されなかった。
AIポッドキャストホストのアレックス・ボルコフは、この反応を「あなたは間違って保持している」と要約し、Anthropic自身が100万トークンのコンテキストをデフォルトに設定し、Opusをフラッグシップモデルとして宣伝し、拡張思考をセールスポイントとして強調したが、現在は有料ユーザーにこれらの機能を使用しないようアドバイスしていると指摘した。
「過充電なし」という主張は、クロード・コード自身の更新履歴との緊張も生む。Lydiaの応答のちょうど前日、v2.1.90はv2.1.69から存在していたキャッシュ回帰のバグを修正しました。Lydiaの回答では、この確認された課金異常には言及されていません。

比較のために、OpenAIのCodexは以前にも同じような異常なクォータ消費の問題を経験していた。OpenAIのアプローチは、3月にユーザークォータのリセット、クレジット払い戻しの発行、コーデックスの使用制限の撤廃の発表でした。Anthropicのアプローチは、モデルのダウングレード、機能の無効化、コンテキストの制限、ユーザーの使用状況への責任の帰属をユーザーにアドバイスすることです。
Anthropicは 、 「 最強のモデル+最大のコンテキスト+最高の推論能力」のサブスクリプションを販売しており、月額20~200ドルの料金を請求している。28日間のキャッシュバグにより、有料ユーザーのクォータは10倍から20倍の速さで枯渇し、公式の反応は控えめに利用することだった。
関連記事

Perp DEX:次世代取引所「戦争」

鉱山企業のAI大博打:評価が分化段階に入り、逆転は難しい

アライアンスが起業家に送る手紙:Cursorが600億ドルで売却される際に書かれた

ステーブルコインがついに真の収益を見つけた:オンチェーン再保険 Re の詳細|Re 創設者カラン・サロヤとの対話

不可能三角は根本的に偽の問題です

マイクロストラテジーはデススパイラルに陥るのか?下半期のマクロトレンドはどうなるのか?

ブロックチェーンキャピタルのパートナー:アービトラージの核心的な秘訣

STRC 脱錨 11%、Strategy の永久機関はまだ動いていますか?

早報|イリノイ州が全米で最も厳しいデジタル資産税法に署名;RWAトークン化市場規模が430億ドルを突破、機関がオンチェーン資産の移行を加速

完全版初回ショーQ&A!連邦準備制度理事会議長ウォッシュ:2%のインフレ目標を守り、5つの特別作業部会を設立、個人の点状図は提出せず

破壊者から影の市場へ:暗号市場は伝統的金融の植民地になりつつある

ダリオの重要な長文:現在の市場環境でどのように配置すべきか?

OKX StarがBinanceの競争優位性を鋭く評価:規制が城壁を平坦にすると、競争は始まったばかりです

暗号取引所の新しいプレイスタイル

早報|DeepSeekが70億ドル以上の資金調達を完了し、評価額は500億ドルを超える;マスクの個人資産はビットコインの総時価総額を超えた

カーソル、なぜマスクの宇宙船に乗ったのですか?

慈善の名のもとに、家族の利益:トランプ家族はどのように慈善を利益に変えたのか?

