Обмеження на 3 привітання, куди поділася ваша межа коду Claude? Баг кешу за 28 днів і офіційна відповідь, яка заохочує вас "використовувати його економно".
4-17%. Це показник кешування запитів для Claude Code за останній місяць. Нормальний рівень становить 97-99%.
Це означає, що коли ви відновлюєте попередню сесію, Claude Code не повторно використовує раніше оброблений контекст, а замість цього щоразу обробляє все з нуля, витрачаючи кредити зі швидкістю, у 10-20 разів вищою, ніж зазвичай. Ви можете думати, що продовжуєте розмову, але насправді щоразу починаєте абсолютно нову розмову за повну ціну.

Ці дані отримані від незалежного розробника ArkNill за допомогою моніторингу проксі. Встановивши прозорий проксі, він записував кожен запит між Claude Code та API Anthropic, виявивши принаймні дві помилки кешування на стороні клієнта, які заважали серверу API збігати кешовані префікси розмов, що змушувало повністю перебудовувати токени кожного раунду.

На графіку вище показано порівняння показників кешування на трьох етапах. Під час версій v2.1.69 до v2.1.89 (період з помилкою) показник кешування автономної версії становив лише 4-17%. Після виправлення критичної помилки у версії v2.1.90 показник кешування холостого запуску повернувся до 47-99,7%. До v2.1.91 стабільний показник кешування відновився до 97-99%.
Одна помітна деталь з діаграми: діапазон у v2.1.90 досить широкий (47% до 99,7%), оскільки кеш все ще потребує "розігріву", коли сеанс тільки відновлюється, що призводить до низьких показників у перші кілька раундів, але швидко повертається до норми. У пошкодженій версії цей підігрів ніколи не відбувається — показник кешування завжди залишається на рівні 14 500 токенів системного запиту, а повна історія розмови щоразу повністю тарифікується.
28 днів, 20 версій
Ця помилка не є такою, що була введена в одному оновленні та виправлена в наступному. Згідно з даними про випуск реєстру npm, версія v2.1.69, яка ввела помилку, була випущена 4 березня, а версія v2.1.90, яка виправила помилку, була випущена 1 квітня. Між ними було 28 днів, за які вийшло 20 версій.

Хронологія виявила захоплюючу деталь. Після того, як помилка була виправлена 4 березня, користувачі не відразу почали масово скаржитися. Лише 23 березня скарги вибухнули масово, майже через три тижні. Причина полягає в тому, що, згідно з проблемою на GitHub #41930 аналіз, з 13 по 28 березня, Anthropic мала акцію з подвоєнням квоти (подвоєнням у години низького навантаження), що об'єктивно замаскувало вплив баґа. Після закінчення акції споживання кешу повернулося до нормальних показників, і квоти користувачів миттєво "випарувалися".
Відповідь Anthropic не була швидкою. 26 березня, через три дні після того, як почали надходити скарги користувачів, інженер Thariq Shihipar оголосив у своєму особистому акаунті X, що обмеження на піковий час (5:00–11:00 PT у будні дні) було посилено. 30 березня Anthropic визнав у Reddit, що "темпи, з якими користувачі вичерпували свій ліміт, значно перевищили очікування", і назвав це головним пріоритетом команди. Лише 1 квітня член команди Lydia Hallie опублікувала офіційні результати розслідування.
Протягом усього процесу Anthropic не опублікував жодного поста в блозі, не надіслав електронних повідомлень і не оновив сторінку зі статусом. Увесь офіційний зв'язок відбувався виключно через особисті публікації інженерів у соціальних мережах і кілька коментарів на Reddit.
Скільки ви заплатили і як довго можете користуватися?
Проблема GitHub #41930 надійшло сотні повідомлень від користувачів. Найбільш екстремальний випадок - користувач підписки Max 20x (200 дол. США на місяць), чиє 5-годинне вікно було повністю використано за 19 хвилин. Користувачі Max 5x (100 дол. США на місяць) повідомили, що їхнє 5-годинне вікно було використано за 90 хвилин. Згідно з The Letter Two, деякі користувачі стверджували, що просте «привіт» споживає 13% їхнього сеансового квоти. Про-користувач (20 дол. США на місяць) на Discord згадував, що його квота «закінчувалася щопонеділка і лише скидалася в суботу», причому за 30 днів нормального використання було лише 12 днів.

На основі тестового тестування ArkNill у версії з помилками v2.1.89 квота 100% плану Max 20x буде вичерпана приблизно за 70 хвилин. Він також розрахував вартість однієї операції --resume для сеансу контексту з 500 000 токенів, яка становить приблизно 0,15 дол. США, оскільки система повністю відтворює весь контекст.
«Ви тримаєте його неправильно»
Розслідування Лідії Галлі підтвердило два моменти: по-перше, дійсно було посилено обмеження в години пік, а по-друге, спостерігалося збільшення споживання токенів у контексті 1 мільйона токенів. Вона згадала, що команда виправила деякі помилки, але наголосила, що "жодна з помилок не призвела до перевищення оплати".
Потім вона надала чотири рекомендації щодо економії:
1. Використовуйте Sonnet 4.6 замість Opus (Opus споживає приблизно вдвічі більше);
2. Зменшіть глибину обчислень або вимкніть розширене мислення, коли глибоке обчислення не потрібне;
3. Не відновлюйте довгі сеанси бездіяльності на більш ніж годину; замість цього почніть новий;
4. Встановіть змінну середовища CLAUDE_CODE_AUTO_COMPACT_WINDOW=200000, щоб обмежити розмір вікна контексту.
Жодної згадки про будь-яку форму скидання квот або компенсації не було зроблено.
Ведучий подкасту з штучним інтелектом Алекс Волков підсумував цю відповідь так: "Ви тримаєте його неправильно", зазначивши, що сама компанія Anthropic встановила контекст на 1 мільйон токенів як типовий, просувала Opus як флагманську модель і висвітлювала розширене мислення як перевагу, але тепер радить платним користувачам не використовувати ці функції.
Твердження про "відсутність перевищення цін" також створює напругу з власною історією оновлень Claude Code. Лише за день до відповіді Лідії, v2.1.90 виправив помилку регресії кешу, яка була присутня з v2.1.69: при використанні --resume для відновлення сесії, запити, які мали потрапити в кеш, викликали повне пропущення кешу, що призводило до повного виставлення рахунку. У відповіді Лідії не згадувалося про цю підтверджену аномалію виставлення рахунків.

Для порівняння, Codex від OpenAI раніше стикався з подібними аномальними проблемами споживання квот. Підхід OpenAI полягав у скиданні квот користувачів, виданні кредитних відшкодувань і оголошенні про зняття обмеження на використання Codex у березні. Підхід Anthropic полягає в тому, щоб радити користувачам знижувати рівень моделей, відключати функції, обмежувати контекст і перекладати відповідальність на користувачів.
Anthropic продає підписку на "найпотужнішу модель + максимальний контекст + найвищі можливості міркування", стягуючи плату від 20 до 200 доларів на місяць. Через помилку кешування протягом 28 днів квоти платних користувачів вичерпувалися в 10–20 разів швидше, а офіційна відповідь полягала в тому, щоб використовувати його економно.
Вам також може сподобатися

Хусити мають контрольно-пропускний пункт | Rewire News Ранковий брифінг

Темний ліс на 240 мільярдів доларів, падіння залізних фінансів

Філософія економії грошей в епоху ШІ: Як розумно витратити кожен токен

Як заробити гроші на Polymarket, використовуючи ШІ?

Ранковий звіт | YZi Labs стратегічно збільшує інвестиції в Predict.fun; Drift Protocol зазнає атаки з втратами щонайменше 200 мільйонів доларів; x402 від Coinbase приєднується до Linux Foundation

Мрія про 590 мільярдів доларів: Як жінка-Воррен Баффет пала з благодаті?

Діалог із засновником Pantera: Біткоїн досяг швидкості втечі, традиційні активи залишаються позаду

Дилема зростання Base: все було зроблено правильно, але користувачі все ще йдуть

Інцидент із Drift Protocol: Зловмисник Захоплює Повноваження через Довготермінові Нонси
Key Takeaways On April 2, Drift Protocol experienced a security breach where a malicious actor gained administrative control.…

# Outline
Key Takeaways Drift Protocol, a decentralized exchange on Solana, experienced a $270 million hack, making it one of…

# Огляд
Key Takeaways Upbit and Bithumb have labeled DRIFT as a “trading alert” asset following guidance from the Digital…

# Активність Wormhole: Як Атака на Drift Protocol Вплинула на Перехід Транзакцій
Key Takeaways Wormhole confirmed that user assets remain safe despite the Drift Protocol attack. The Solana ecosystem’s built-in…

# Outline
Key Takeaways Bitget Launchpool offers a way to earn tokens like MEZO by staking assets. The current MEZO…

Прогноз цін на Ethereum: Переломний момент для ETH у Системах Масштабування, Безпеки та Штучного Інтелекту
Ціна Ethereum, торгуючись на рівні $2,170, стикається з викликами в умовах нестабільності ринку, що пов’язана з організаційними стратегіями…

I’m sorry, I can’t assist with this request.
I’m sorry, I can’t assist with this request.

Nasdaq та Talos об’єднуються для розблокування $35 мільярдів заблокованих активів
Nasdaq та Talos інтегрують існуючу інфраструктуру в крипторинки, щоб вивільнити $35 мільярдів застиглого капіталу. Інтеграція дозволяє керувати цифровими…

Зростання ціни Bittensor (TAO)—чи можливий прорив вище рівня опору?
У січні цього року ціна Bittensor TAOUSD досягла $300, відзначивши зростання на 66% завдяки збільшенню соціальної активності та…

Прогноз Ціни Bitcoin: Що Очікувати від Безпечного Активу у 2026 році?
Інвестори виводять кошти з великих золотовалютних фондів на користь Bitcoin, відзначаючи зрушення у стратегіях розподілу капіталу. Bitcoin демонструє…
