logo

Обмеження на 3 привітання, куди поділася ваша межа коду Claude? Баг кешу за 28 днів і офіційна відповідь, яка заохочує вас "використовувати його економно".

By: blockbeats|2026/04/03 13:22:32
0
Поширити
copy

4-17%. Це показник кешування запитів для Claude Code за останній місяць. Нормальний рівень становить 97-99%.

Це означає, що коли ви відновлюєте попередню сесію, Claude Code не повторно використовує раніше оброблений контекст, а замість цього щоразу обробляє все з нуля, витрачаючи кредити зі швидкістю, у 10-20 разів вищою, ніж зазвичай. Ви можете думати, що продовжуєте розмову, але насправді щоразу починаєте абсолютно нову розмову за повну ціну.

Обмеження на 3 привітання, куди поділася ваша межа коду Claude? Баг кешу за 28 днів і офіційна відповідь, яка заохочує вас

Ці дані отримані від незалежного розробника ArkNill за допомогою моніторингу проксі. Встановивши прозорий проксі, він записував кожен запит між Claude Code та API Anthropic, виявивши принаймні дві помилки кешування на стороні клієнта, які заважали серверу API збігати кешовані префікси розмов, що змушувало повністю перебудовувати токени кожного раунду.

На графіку вище показано порівняння показників кешування на трьох етапах. Під час версій v2.1.69 до v2.1.89 (період з помилкою) показник кешування автономної версії становив лише 4-17%. Після виправлення критичної помилки у версії v2.1.90 показник кешування холостого запуску повернувся до 47-99,7%. До v2.1.91 стабільний показник кешування відновився до 97-99%.

Одна помітна деталь з діаграми: діапазон у v2.1.90 досить широкий (47% до 99,7%), оскільки кеш все ще потребує "розігріву", коли сеанс тільки відновлюється, що призводить до низьких показників у перші кілька раундів, але швидко повертається до норми. У пошкодженій версії цей підігрів ніколи не відбувається — показник кешування завжди залишається на рівні 14 500 токенів системного запиту, а повна історія розмови щоразу повністю тарифікується.

28 днів, 20 версій

Ця помилка не є такою, що була введена в одному оновленні та виправлена в наступному. Згідно з даними про випуск реєстру npm, версія v2.1.69, яка ввела помилку, була випущена 4 березня, а версія v2.1.90, яка виправила помилку, була випущена 1 квітня. Між ними було 28 днів, за які вийшло 20 версій.

Хронологія виявила захоплюючу деталь. Після того, як помилка була виправлена 4 березня, користувачі не відразу почали масово скаржитися. Лише 23 березня скарги вибухнули масово, майже через три тижні. Причина полягає в тому, що, згідно з проблемою на GitHub #41930 аналіз, з 13 по 28 березня, Anthropic мала акцію з подвоєнням квоти (подвоєнням у години низького навантаження), що об'єктивно замаскувало вплив баґа. Після закінчення акції споживання кешу повернулося до нормальних показників, і квоти користувачів миттєво "випарувалися".

Відповідь Anthropic не була швидкою. 26 березня, через три дні після того, як почали надходити скарги користувачів, інженер Thariq Shihipar оголосив у своєму особистому акаунті X, що обмеження на піковий час (5:00–11:00 PT у будні дні) було посилено. 30 березня Anthropic визнав у Reddit, що "темпи, з якими користувачі вичерпували свій ліміт, значно перевищили очікування", і назвав це головним пріоритетом команди. Лише 1 квітня член команди Lydia Hallie опублікувала офіційні результати розслідування.

Протягом усього процесу Anthropic не опублікував жодного поста в блозі, не надіслав електронних повідомлень і не оновив сторінку зі статусом. Увесь офіційний зв'язок відбувався виключно через особисті публікації інженерів у соціальних мережах і кілька коментарів на Reddit.

Скільки ви заплатили і як довго можете користуватися?

Проблема GitHub #41930 надійшло сотні повідомлень від користувачів. Найбільш екстремальний випадок - користувач підписки Max 20x (200 дол. США на місяць), чиє 5-годинне вікно було повністю використано за 19 хвилин. Користувачі Max 5x (100 дол. США на місяць) повідомили, що їхнє 5-годинне вікно було використано за 90 хвилин. Згідно з The Letter Two, деякі користувачі стверджували, що просте «привіт» споживає 13% їхнього сеансового квоти. Про-користувач (20 дол. США на місяць) на Discord згадував, що його квота «закінчувалася щопонеділка і лише скидалася в суботу», причому за 30 днів нормального використання було лише 12 днів.

На основі тестового тестування ArkNill у версії з помилками v2.1.89 квота 100% плану Max 20x буде вичерпана приблизно за 70 хвилин. Він також розрахував вартість однієї операції --resume для сеансу контексту з 500 000 токенів, яка становить приблизно 0,15 дол. США, оскільки система повністю відтворює весь контекст.

«Ви тримаєте його неправильно»

Розслідування Лідії Галлі підтвердило два моменти: по-перше, дійсно було посилено обмеження в години пік, а по-друге, спостерігалося збільшення споживання токенів у контексті 1 мільйона токенів. Вона згадала, що команда виправила деякі помилки, але наголосила, що "жодна з помилок не призвела до перевищення оплати".

Потім вона надала чотири рекомендації щодо економії:
1. Використовуйте Sonnet 4.6 замість Opus (Opus споживає приблизно вдвічі більше);

2. Зменшіть глибину обчислень або вимкніть розширене мислення, коли глибоке обчислення не потрібне;

3. Не відновлюйте довгі сеанси бездіяльності на більш ніж годину; замість цього почніть новий;

4. Встановіть змінну середовища CLAUDE_CODE_AUTO_COMPACT_WINDOW=200000, щоб обмежити розмір вікна контексту.

Жодної згадки про будь-яку форму скидання квот або компенсації не було зроблено.

Ведучий подкасту з штучним інтелектом Алекс Волков підсумував цю відповідь так: "Ви тримаєте його неправильно", зазначивши, що сама компанія Anthropic встановила контекст на 1 мільйон токенів як типовий, просувала Opus як флагманську модель і висвітлювала розширене мислення як перевагу, але тепер радить платним користувачам не використовувати ці функції.

Твердження про "відсутність перевищення цін" також створює напругу з власною історією оновлень Claude Code. Лише за день до відповіді Лідії, v2.1.90 виправив помилку регресії кешу, яка була присутня з v2.1.69: при використанні --resume для відновлення сесії, запити, які мали потрапити в кеш, викликали повне пропущення кешу, що призводило до повного виставлення рахунку. У відповіді Лідії не згадувалося про цю підтверджену аномалію виставлення рахунків.

Для порівняння, Codex від OpenAI раніше стикався з подібними аномальними проблемами споживання квот. Підхід OpenAI полягав у скиданні квот користувачів, виданні кредитних відшкодувань і оголошенні про зняття обмеження на використання Codex у березні. Підхід Anthropic полягає в тому, щоб радити користувачам знижувати рівень моделей, відключати функції, обмежувати контекст і перекладати відповідальність на користувачів.

Anthropic продає підписку на "найпотужнішу модель + максимальний контекст + найвищі можливості міркування", стягуючи плату від 20 до 200 доларів на місяць. Через помилку кешування протягом 28 днів квоти платних користувачів вичерпувалися в 10–20 разів швидше, а офіційна відповідь полягала в тому, щоб використовувати його економно.

Ціна --

--

Вам також може сподобатися

Хусити мають контрольно-пропускний пункт | Rewire News Ранковий брифінг

Понад 40 іноземних дипломатів обговорюють відновлення торгового маршруту, США. Відмовляється від участі

Темний ліс на 240 мільярдів доларів, падіння залізних фінансів

Ключовий член групи Prince Лі Сяобо супроводжується назад до Китаю, що покладає край підземній фінансовій імперії, яка процвітала на Telegram.

Філософія економії грошей в епоху ШІ: Як розумно витратити кожен токен

Одиниця обліку змінювалася знову і знову, але інстинкт економити гроші залишався незмінним протягом історії.

Як заробити гроші на Polymarket, використовуючи ШІ?

Polymarket - це гаманець, Claude - це розум, Perplexity - це око

Ранковий звіт | YZi Labs стратегічно збільшує інвестиції в Predict.fun; Drift Protocol зазнає атаки з втратами щонайменше 200 мільйонів доларів; x402 від Coinbase приєднується до Linux Foundation

Огляд важливих подій на ринку 2 квітня

Мрія про 590 мільярдів доларів: Як жінка-Воррен Баффет пала з благодаті?

На піку свого успіху вона була знищена власним успіхом.

Популярні монети

Останні новини криптовалют

Читати більше
iconiconiconiconiconicon

Бот служби підтримки@WEEX_support_smart_Bot

VIP-послуги[email protected]