Могут ли AI-агенты улучшить безопасность Ethereum? OpenAI и Paradigm создали тестовую площадку
Key Takeaways
- EVMbench – новая площадка, разработанная OpenAI и Paradigm, оценивающая, насколько AI-агенты способны обнаруживать, исправлять и эксплуатировать уязвимости в смарт-контрактах на базе Ethereum.
- Три режима тестирования: выявление (detect), исправление (patch) и эксплуатация (exploit) уязвимостей смарт-контрактов.
- AI и безопасность: AI становится важным инструментом как для нападения, так и для защиты в системе смарт-контрактов.
- Тестирование в реальных экономических условиях: цель использования EVMbench – проверка эффективности моделей AI в условиях, приближенных к реальным сценариям, что делает его важным этапом для индустрии.
WEEX Crypto News, 2026-02-19 09:43:01
Введение в EVMbench – инновационная тестовая площадка
В динамичном мире криптовалют и технологий смарт-контрактов обеспечение безопасности занимает важнейшее место. В этом контексте появляется ключевой вопрос — могут ли агенты, работающие на основе искусственного интеллекта (AI), повысить безопасность сети Ethereum? На этот вопрос пытаются ответить OpenAI и инвестиционная компания Paradigm с помощью создания EVMbench. Это новое средство предоставляет возможность исследовать способность AI-агентов по обнаружению, исправлению и эксплуатации серьезных уязвимостей в системе смарт-контрактов Ethereum Virtual Machine (EVM).
Ethereum находится в самом сердце блокчейн-технологий, обеспечивая платформу для смарт-контрактов, которые управляют децентрализованными финансовыми протоколами и запуском токенов. С увеличением количества развертываемых контрактов (более 1.7 миллиона в неделю в ноябре 2025 года), обеспечивать их безопасность становится все более сложной задачей. В ответ на эту проблему появляется EVMbench — инструмент, призванный оценить эффективность AI в повышении уровня безопасности.
Как работает EVMbench?
Платформа EVMbench предусматривает оценку AI-агентов в трех ключевых направлениях: обнаружение (detect), исправление (patch) и эксплуатация (exploit) уязвимостей. Эти режимы позволяют AI проходить различные стадии проверки, тестируя его возможности в условиях, приближенных к реальному миру.
- Режим “Detect”: AI-агенты начинают с проверки репозиториев кода и определяют уязвимости, за что получают определенные баллы. Важно, чтобы AI как можно более полно и точно идентифицировал все проблемы, не оставляя пропущенных недостатков.
- Режим “Patch”: На этой стадии AI пробуют исправлять найденные ошибки, сохраняя при этом изначально задуманную функциональность контракта. Это критически важно, так как любое изменение может оказать значительное влияние на эффективность смарт-контракта.
- Режим “Exploit”: Здесь AI-агенты работают в среде, где симулируются атаки с целью дренажа средств. С помощью воспроизведения транзакций проверяется успешность действий AI в выявлении и использовании уязвимостей.
Представление и внедрение EVMbench
EVMbench интегрирует 120 специально отобранных уязвимостей из 40 аудитов, большая часть которых происходит из открытых конкурсов, таких как Code4rena. Эти уязвимости помогают AI моделям учиться через фиксированные сценарии и реальный опыт, собранный в блокчейн-индустрии. Кроме того, EVMbench учли разработки Stripe в создании банковского проекта по обработке платежей Tempo, что является еще одним шагом в развитии AI технологий.
Эффективность взаимодействия AI с платформой была подтверждена в рамках задачи “Exploit”, где GPT-5.3-Codex показал выдающийся результат с оценкой 72.2%, значительно превосходя предыдущую версию GPT-5, получившую 31.9%. Это демонстрирует, что с помощью инструментов, таких как EVMbench, возможно создание более безопасных и функциональных смарт-контрактов.
AI и безопасность: Новые вызовы и возможности
Поскольку AI становится все более влиятельным как инструмент в сфере безопасности, появляются и новые вызовы. Исследователи из OpenAI поднимают вопрос, что даже такие продвинутые инструмент, как EVMbench, не в полной мере отображают сложность реальных задач в области безопасности. Это подчёркивает важность продолжения разработки и тестирования AI-агентов в условиях, приближенных к реальности, для большей защиты против возможных угроз.
Конфликт вокруг скорости развития AI также находится в центре внимания. В январе 2025 года Сэм Альтман из OpenAI утверждал, что их компания уверена в возможности создания искусственного общего интеллекта (AGI), в то время как Виталик Бутерин, сооснователь Ethereum, подчеркивал необходимость внедрения возможностей “мягкой паузы”, чтобы приостановить индустриальные AI-операции при появлении предупреждающих сигналов.
Заключение
Таким образом, платформа EVMbench представляет собой многообещающий шаг к повышению безопасности смарт-контрактов Ethereum с помощью AI-агентов. Заслуживая внимания не только благодаря возможности обнаружения уязвимостей, но и через технологическую возможность их исправления и использования, EVMbench прокладывает путь к будущему безопасных и доверенных цифровых транзакций.
FAQ
Как EVMbench влияет на безопасность Ethereum?
EVMbench представляет собой тестовую площадку, которая оценивает способность AI-агентов обнаруживать, исправлять и эксплуатировать уязвимости в смарт-контрактах Ethereum. Она способствует созданию более безопасной среды для децентрализованных финансовых транзакций.
Какие этапы проверки включает EVMbench?
EVMbench тестирует AI через три ключевых этапа: обнаружение (detect), исправление (patch) и эксплуатация (exploit) уязвимостей. Эти тесты помогают обеспечить полную функциональность и безопасность смарт-контрактов.
Как была протестирована эффективность EVMbench?
Эффективность EVMbench была проверена с использованием AI модел, таких как GPT-5.3-Codex, который достиг оценки 72.2% в режиме “Exploit”, что демонстрирует значительное улучшение по сравнению с предыдущими моделями.
Какие цели ставятся перед EVMbench?
Цель EVMbench заключается в проверке эффективности AI в условиях, максимально приближенных к реальным сценариям использования. Это помогает повышать уровень безопасности и надежности цифровых активов.
Какое участие принимает WEEX в развитии EVMbench?
WEEX поддерживает разработку и внедрение технологий, таких как EVMbench, предоставляя больше возможностей для безопасных и эффективных транзакций в цифровом мире.
Вам также может понравиться

Утренние новости | OpenAI получает инвестиции в размере 110 миллиардов долларов; Solana запускает Solana Payments; M0, MoonPay и PayPal совместно запускают PYUSDx

2025 Южная Корея Постмортем листинга CEX: Инвестирование в новые монеты = 70% убытка?

Анализ BIP-360: Первый шаг Биткойна к квантовому иммунитету, но почему только "первый шаг"?

50 миллионов USDT обменены на 35 000 долларов США в AAVE: Как произошла эта катастрофа? Кого в этом винить?

Диалог Виталика в Чианг-Май: Взрыв искусственного интеллекта: за что должен бороться крипто-мир?

ZachXBT раскрывает скандал с инсайдерской информацией в Axiom: как внутренние сотрудники злоупотребляют своими привилегиями?

2026 год, как мы должны разумно оценить рыночную стоимость L1?

AWS финансового мира: Почему она становится крупнейшим победителем в эпоху ИИ + стейблкоинов

Учреждения принимают криптовалюту, но практикующие специалисты испытывают необычную фрустрацию. Кто в конечном итоге победит?

Рынок продолжает падать, когда же наступит лучшее время для TGE?

Когда все продают акции программного обеспечения, HSBC заявляет, что вы ошибаетесь

Почему биткойн, который должен был достичь 150 000 долларов, упал в цене вдвое, и кто на самом деле стоит за этим — Джейн Стрит?

Как великий детектив ZachXBT стал мастером в решении странных дел?

Утренний отчет | Kalshi впервые публично наказала инсайдерскую торговлю; STS Digital завершила финансирование на сумму 30 миллионов долларов; American Bitcoin объявила о финансовом отчете за 2025 год.

Решение межпоколенческой дилеммы заключенного: Неизбежный путь кочевого капитала Bitcoin

Цена акций выросла более чем на 35%! Финансовый отчет Circle превзошел ожидания: Объем обращения USDC вырос на 72%

Кто будет контролировать ИИ? Почему децентрализованный ИИ может быть единственной альтернативой правительству и крупным технологическим компаниям
ИИ стал критической инфраструктурой, и правительства и корпорации конкурируют за его контроль. Централизованное развитие и регулирование укрепляют существующие структуры власти. Сообщество Web3 строит децентрализованную альтернативу — распределенные вычисления, токен-стимулы и управление сообществом — прежде чем это окно закрывается.
