AIが脆弱性を発見する速度は、脆弱性を修正する速度を上回っています。

By: blockbeats|2026/03/30 18:05:38
0
シェア
copy

3月27日、Anthropicの無防備なデータキャッシュが約3000の内部ファイルを露出させました。あるドラフトブログ投稿では、Anthropicが「サイバーセキュリティ能力において他のAIモデルを大きく上回る」と自己評価した新しいモデル、Mythosが明らかになりました。同日、CrowdStrikeとOktaはそれぞれ7%急落し、Palo Alto Networksは6%下落しました。

市場のパニックは、より強力なモデルが出現したからではありません。このモデルの創作者が、攻撃側の進展が防御側が追いつく速度を上回っていると述べたからです。

AIサイバーセキュリティの支配

学術的ベンチマークCAIBenchのテスト結果によると、実際の攻撃防御環境をシミュレートしたCybenchテストで、Claude Sonnetは46%の成功率を達成しました。第2位のGPT-5は28%、GoogleのGemini 2.5 Proは18%にとどまり、オープンソースモデルのqwen3-32Bはさらに低い10%に落ち込みました。

AIが脆弱性を発見する速度は、脆弱性を修正する速度を上回っています。

46%は高くないように思えるかもしれませんが、これは脆弱性発見、エクスプロイトチェーンの構築、特権昇格などの複雑な侵入タスクの成功率です。より基本的なBaseテストでは、Claudeの成功率はすでに75%に達し、限界に近づいています。

違いは、誰がわずかに優れているかではなく、その規模にあります。Claudeの複雑な攻撃防御能力は、GPT-5の1.6倍、Geminiの2.5倍です。このサイバーセキュリティの次元では、モデル間の能力の分布は梯子ではなく、ギャップです。

6ヶ月で倍増

さらに分析する価値があるのは、水平のギャップではなく、垂直の速度です。

Anthropicの公式データによると、2025年2月にリリースされたSonnet 3.7は、Cybenchで35.9%の成功率を達成しました(10回の試行)。同年後半に、Sonnet 4.5は76.5%に達しました。Anthropic研究チームの結論は、6ヶ月以内に成功率が倍増したということです。

この速度は何を意味しますか?実際のシナリオ比較:Claude Opus 4.6は、今年の3月にFirefoxコードベースの監査に使用されました。InfoQによると、2週間以内に22のセキュリティ脆弱性が発見され、そのうち14が高リスクとされています。これらの脆弱性は、数年にわたる手動監査と数百万時間のCPUファズテストにもかかわらず、検出されていませんでした。Anthropicのセキュリティチームは以前、Claudeが数十年にわたって存在していたいくつかの生産グレードのオープンソースプロジェクトで500以上の高リスク脆弱性を発見したと開示しました。

そして、従来のペネトレーションテストの業界標準のタイムラインは2〜3週間であり、それは単一のアプリケーションに対してのものです。Verizon 2025データ侵害調査報告書によると、重大な脆弱性の公表から攻撃者による大規模な悪用までの中央値は5日で、パッチ適用までの中央値は32〜38日です。

AIが脆弱性を発見する速度は指数関数的に増加しており、人間のパッチ適用速度は線形です。時間の違いが攻撃ウィンドウです。

漏洩したMythos草案の中で、Anthropicはこのモデルが「防御者の努力をはるかに超えて脆弱性を悪用できるモデルの波を予告する」と書きました。公に知られている能力曲線に基づいて、これは誇張ではありません。

リリースが早いほど、警告が緊急になります。

過去3年間のAnthropicの行動をタイムラインに置くと、明確なパターンが見えてきます:より強力なモデルがリリースされるたびに、それに続いてより高いレベルのセキュリティ対応が迅速に行われます。

2023年7月、ホワイトハウスは自発的な誓約に署名し、同年9月に最初の責任あるスケーリングポリシー(RSP v1.0)が発表されました。2024年10月、RSPはv2.0にアップグレードされ、生物化学兵器能力の閾値が追加されました。2025年11月、AnthropicはGTG-1002事件を開示しました。中国が支援する脅威グループはClaude Codeを使用して約30の組織を悪用し、AIは作戦全体で80%から90%の戦術的操作を独立して実行しました。これは、文書化された最初の大規模なAI主導の組織間スパイ活動キャンペーンでした。

2026年2月、RSPはv3.0に更新され、Claude Code Securityが同時にリリースされました。同月、ペンタゴンはAnthropicを「サプライチェーンリスク」として分類しました。これは、Anthropicが大規模な監視と完全自律型武器を禁止する契約条項を解除することを拒否したためです。1か月後、Mythosのリークにより、Anthropicがこのモデルが「前例のないネットワークセキュリティリスクをもたらす」と草案で認めていたことが明らかになりました。

能力のリリースのペースが加速しています。Claude 1からClaude 3までの間には1年のギャップがあり、Opus 4.5からOpus 4.6までの間は3か月未満です。セキュリティ対応も加速していますが、常に反応的です:能力が最初に悪用され、その後にポリシーパッチが適用されます。3月27日のサイバーセキュリティ株の集団的な下落は、この時間のデルタの価格設定を示しています。

今年初めのDark Readingの調査によると、サイバーセキュリティ専門家の48%がAI駆動のエージェントを2026年の主要な攻撃ベクトルとして特定しました。2年前、この選択肢はほとんどリストの上位にはありませんでした。

AnthropicのMythosリリース戦略は、防御組織に早期アクセスを提供し、「先行者利益を与える」ことを含んでいます。この声明自体が攻撃と防御の非対称性を認めています。防御者が先行者利益を必要としない場合、それは攻撃者がまだ玄関に到達していないことを意味します。

--価格

--

関連記事

タイガーリサーチ:暗号会社はどのようなAIサービスを提供していますか?

バイナンスやコインベースなどの暗号通貨の巨頭がAI防衛戦を全面的に展開:FOMOの感情に駆動され、主要プラットフォームは取引、安全、支払いなどのコアビジネスにAIエージェントを深く統合することを加速しています。

この戦争は原油価格を押し上げるだけでなく、サークルの株価も急騰させている

高金利への期待と、ステーブルコインのインフラが爆発的に拡大したことが相まって、Circleの株価は市場全体の傾向に反して5週間で2倍になった:1つの記事で、「マクロ金利取引」と「グローバル決済基盤」という2つの側面が、急騰の背景にある仕組みを解説。

エージェントが消費者になった時、誰がインターネットコマースの根底にあるロジックを書き換えるのか?

30年前、インターネットはマイクロペイメントのコストが高いため、広告モデルを採用するしかなかった。今日、マイクロペイメントの技術的敷居はほぼゼロですが、信頼は最も高価な贅沢品となっています。このギャップを埋めることができる者は、次世代のイントを席巻する ― ― 。

米国で2兆ドルが消滅株式市場は4年ぶりの最悪のスタートを切った。なぜ市場は弱気なのか?

市場はサイクルが収束するにつれて価格を再調整している。

AIエージェント・イン・アクション・サミット:3月31日、AI実装の深層に焦点を当てた香港サイバーポート

明日、香港サイバーポートがグランドオープンします。「AI Agents in Action」サミットは、AI Agentsの概念祝賀から製品化、大規模な商用実装まで、AI Agentsの本当の進化に直接触れ、トップの専門家が集結します。

サイバー道教占い師:偽の道教、AIの占い、そして東北の易学の歴史

宇宙の果てには鉄山があり、神秘主義の果てにはAIがある。

人気のコイン

最新暗号資産ニュース

もっと見る