logo

Скорость, с которой ИИ обнаруживает уязвимости, превзошла скорость, с которой он исправляет уязвимости.

By: blockbeats|2026/03/30 18:02:45
0
Поделиться
copy

27 марта незащищенное хранилище данных в Anthropic раскрыло около 3000 внутренних файлов. Один из черновиков сообщений в блоге раскрыл готовящуюся новую модель Mythos, которую Anthropic оценил как «намного превосходящую любую модель ИИ по возможностям в области кибербезопасности». В тот же день акции CrowdStrike и Okta упали на 7%, а Palo Alto Networks — на 6%.

Паника на рынке не вызвана появлением более мощной модели. Это связано с тем, что создатель этой модели заявил, что ее прогресс в области атак опережает скорость, с которой может идти развитие защиты.

Доминирование ИИ в кибербезопасности

Согласно результатам теста академического бенчмарка CAIBench, в тесте Cybench, имитирующем реальную среду атак и защиты, Claude Sonnet показал успешность в 46%. GPT-5, занимающий второе место, был на уровне 28%, Google Gemini 2.5 Pro достиг только 18%, а модель с открытым исходным кодом qwen3-32B опустилась еще ниже, до 10%.

Скорость, с которой ИИ обнаруживает уязвимости, превзошла скорость, с которой он исправляет уязвимости.

Хотя 46% могут показаться невысокими, это показатель успеха сложных задач по проникновению, включая такие этапы, как обнаружение уязвимостей, создание цепочек эксплойтов и эскалация привилегий. В более простом базовом тесте показатель успеха Claude уже достиг 75%, приближаясь к своему пределу.

Разница не в том, кто немного лучше, а в разнице в масштабах. Сложные возможности Claude в области атаки и защиты в 1,6 раза выше, чем у GPT-5, и в 2,5 раза выше, чем у Gemini. В этой области кибербезопасности распределение способностей среди моделей — это не лестница, а пропасть.

Удвоение за 6 месяцев

Что еще стоит разобрать, так это не горизонтальный разрыв, а вертикальная скорость.

Согласно официальным данным Anthropic, Sonnet 3.7, выпущенный в феврале 2025 года, достиг показателя успеха 35,9% на Cybench (10 попыток). Во второй половине того же года Sonnet 4.5 достиг 76,5%. Вывод исследовательской группы Anthropic: за 6 месяцев показатель успеха удвоился.

Что означает эта скорость? Сравнение в реальных условиях: В марте этого года для аудита кодовой базы Firefox был использован Claude Opus 4.6. Согласно InfoQ, в течение двух недель было обнаружено 22 уязвимости в системе безопасности, 14 из которых были высокорискованными. Эти уязвимости оставались незамеченными, несмотря на многолетние ручные проверки и миллионы часов тестирования с использованием CPU fuzz. Группа безопасности Anthropic ранее сообщила, что Claude обнаружила более 500 уязвимостей высокого риска в нескольких проектах с открытым исходным кодом промышленного уровня, некоторые из которых существовали десятилетиями.

Стандартные сроки проведения традиционного тестирования на проникновение составляют от 2 до 3 недель, и это только для одного приложения. Согласно отчету Verizon 2025 Data Breach Investigations Report, среднее время от публичного раскрытия критической уязвимости до ее массового использования злоумышленниками составляет 5 дней, а среднее время для исправления уязвимости — от 32 до 38 дней.

Скорость, с которой ИИ обнаруживает уязвимости, растет экспоненциально, в то время как скорость исправления уязвимостей человеком является линейной. Разница во времени — это окно атаки.

В просочившейся черновой версии Мифоса Anthropic написала, что эта модель «предвещает грядущую волну моделей, которые могут использовать уязвимости способом, далеко выходящим за рамки усилий защитников». Судя по общеизвестной кривой возможностей, это не преувеличение.

Чем быстрее выпуск, тем более срочным становится предупреждение

Если вы нанесите на временную шкалу действия Anthropic за последние три года, вы увидите четкую закономерность: каждый раз, когда выпускается более мощная модель, за ней быстро следует ответ на более высокий уровень безопасности.

В июле 2023 года Белый дом подписал добровольное обязательство, за которым в сентябре того же года последовал выпуск первой Политики ответственного масштабирования (RSP v1.0). В октябре 2024 года RSP был обновлен до версии 2.0, с добавлением порогового значения для возможностей биохимического оружия. В ноябре 2025 года Anthropic раскрыла инцидент GTG-1002. Группа угроз, поддерживаемая Китаем, эксплуатировала около 30 организаций с использованием Claude Code, при этом ИИ самостоятельно выполнял от 80% до 90% тактических операций в ходе операции. Это была первая задокументированная крупномасштабная межорганизационная шпионская кампания, организованная ИИ.

В феврале 2026 года RSP был обновлен до версии 3.0, с одновременным выпуском Claude Code Security. В том же месяце Пентагон назвал Anthropic «риском для цепочки поставок», потому что Anthropic отказался снять из контракта пункты, запрещающие массовую слежку и полностью автономное оружие. Через месяц утечка информации из Mythos показала, что в проекте Anthropic признал, что эта модель представляет «беспрецедентные риски для сетевой безопасности».

Темпы выпуска новых возможностей ускоряются. Между Claude 1 и Claude 3 прошел год, а между Opus 4.5 и Opus 4.6 — меньше трех месяцев. Меры реагирования на угрозы также ускоряются, но они всегда носят реактивный характер: сначала появляются возможности для злоупотреблений, а потом — исправления в политике. Коллективное падение акций в сфере кибербезопасности 27 марта — это ценообразование этой временной дельты.

Опрос Dark Reading, проведенный ранее в этом году, показал, что 48% специалистов в области кибербезопасности назвали агенты на базе ИИ основным атакующим вектором на 2026 год. Два года назад этот вариант едва ли был в верхней части списка.

Стратегия выпуска Mythos от Anthropic включает предоставление раннего доступа оборонительным организациям, «что дает им преимущество первопроходца». Это утверждение само по себе признает асимметрию нападения и защиты. Если защитникам не нужен преимущество первопроходца, это означает, что атакующие еще не прибыли к порогу.

Цена --

--

Вам также может понравиться

Саммит "AI Agents in Action": 31 марта, Гонконг Киберпорт, сосредоточенный на глубоких водах внедрения ИИ

Завтра в Гонконге Киберпорт состоится грандиозное открытие. Саммит "AI Agents in Action" соберет ведущих экспертов, которые напрямую обсудят реальную эволюцию агентов ИИ от концептуального празднования до оцифровки и масштабного коммерческого внедрения.

Исчезли 2 триллиона долларов, США Акции демонстрируют худший старт за 4 года, почему рынок медвежий?

Рынок пересматривает цены в связи с завершением цикла.

Война не только поднимает цены на нефть, но и заставляет акции Circle стремительно расти

Ожидания высоких процентных ставок в сочетании с взрывным ростом инфраструктуры стейблкоинов привели к тому, что акции Circle удвоились за пять недель, несмотря на общую тенденцию: Понимание двойной игры "макро торговля процентными ставками" и "глобальный платежный фундамент", стоящей за ростом, в одной статье.

Когда агенты становятся потребителями, кто перепишет основную логику интернет-коммерции?

Тридцать лет назад из-за высокой стоимости микроплатежей у интернета не было другого выбора, кроме как принять модель рекламы. Сегодня технический порог для микроплатежей почти равен нулю, но доверие стало самой дорогой роскошью. Тот, кто сможет преодолеть этот разрыв, будет доминировать в следующем поколении интернет...

Кибердаосский гадалка: Поддельный даос, гадание ИИ и история северо-восточной метафизики

В конце вселенной находится Железная гора, в конце мистицизма - ИИ.

Bloomberg: Платежи в стейблкоинах становятся новым любимым инструментом крипто-венчурных компаний

Под влиянием про-крипто политики администрации Трампа энтузиазм рынка по отношению к стейблкоинам достиг рекордного уровня в прошлом году.

Популярные монеты

Последние новости криптовалют

Еще