Anthropicの新作、AIエージェント基盤チームが不要になるほどの強力さ？

By: blockbeats|2026/04/09 13:00:12

元タイトル：「Anthropicが本日リリースした新製品、AIエージェント基盤チームの大量失業を招く可能性」

著者：Bayu（AIエンジニア）

この製品は「Claude Managed Agents」と呼ばれます。一言で言えば、AnthropicにどのようなAIエージェントが必要かを伝えるだけで、インフラのすべてを含めた運用を従量課金制でクラウド上で実行してくれるというものです。Sentryはこの製品を使って数週間でエンドツーエンドの自動バグ修正を本番導入し、楽天は1週間で専門エージェントをデプロイしました。以前であれば、これらのタスクにはエンジニアチームが数ヶ月がかりで取り組む必要がありました。

一方、Anthropicの年間経常収益（ARR）は300億ドルを突破し、昨年の12月から3倍に成長しました。成長の大部分はエンタープライズ顧客によるものです。ウォール街は警戒を強めており、WSJは、Anthropicのような製品が従来のソフトウェアサービスを陳腐化させることを恐れ、投資家が既存のSaaS企業の株価に対して慎重になっていると報じています。

この製品とは一体何なのか？現在利用しているClaude Codeと何が違うのか？技術的にはどのように実現されたのか？

これは何か？Claude Codeとの違いは？

Claude Codeを利用したことがあるなら、AIエージェントの仕組みはご存知でしょう。タスクを与えると、自律的に手順を計画し、ツールを使い、コードを書き、ファイルを修正して、ステップバイステップでタスクを完了させます。

Claude Codeは個人の開発者が自分のコンピュータ上で実行するコマンドラインツールです。コンピュータをシャットダウンすると動作も停止します。

Managed AgentsはAnthropicのクラウド上で実行されるエンタープライズ向けのAPIサービスです。24時間365日継続的に稼働し、接続が切れても進捗を保持でき、製品にAIエージェント機能を直接組み込むことが可能です。

Notionの運用例：ユーザーがNotion内でClaudeエージェントにタスクを割り当てると、エージェントがバックグラウンドで作業を行い、タスクを完了させて結果を返します。ユーザーはNotionから離れる必要はありません。

代表的なユースケース：

· イベントトリガー型：システムがバグを検出し、自動的にボットを割り当てて修正し、プルリクエストを作成する。人の介入は一切不要。

· スケジュール型：毎朝自動的にGitHubのアクティビティサマリーやチームの作業概要を生成する。

· ファイア・アンド・フォーゲット型：Slackでボットにタスクを割り当てると、完了後にドキュメント、PowerPoint、またはアプリを返却する。

· 長時間実行タスク：数時間にわたる詳細なリサーチやコードのリファクタリング作業。

クラウドホスト型ボットと自社運用ボットの違いは？

自社ホストも可能ですが、コストと手間がかかります。

本番稼働可能なインテリジェントボットには、「APIを叩く」以上のものが必要です。サンドボックス環境（AIがコードを実行し、ファイルを修正し、実際の外部システムに影響を与えずに試行錯誤できる隔離された安全な空間。AIに専用の仮想マシンを提供するようなもの）、認証情報管理、状態復旧、権限制御、エンドツーエンドのトレーシングなどが含まれます。

多くのエンタープライズ顧客は、これまでこれらのタスクに専任のエンジニアチームを必要としていました。今ではプラグ＆プレイで実現できるため、エンジニアは製品の核となる部分に集中できるようになります。

しかし、Managed Agentsが解決する課題は、単なる人件費の削減にとどまりません。

Matt Dongslee氏（@dongxi_nlp）が簡潔にまとめています：

Anthropicのエンジニアリングブログに具体的な例があります：

Claude Sonnet 4.5がコンテキストウィンドウの制限に近づくと、「パニック」を起こして急いでタスクを終了させていました。彼らはこれに対処するため、スケジューリングフレームワークにコンテキストリセット機能を追加しました。しかし、Claude Opus 4.5ではこの問題が解消され、以前のパッチが逆に負担となってしまいました。

自前でスケジューリングフレームワークを構築すると、モデルがアップグレードされるたびに更新が必要になります。Anthropicに任せれば、彼らが最適化を行ってくれます。本質的に、彼らは自分たちが販売するものを最適化しているのです。

誰がどのように使っているのか？

Notionは、ユーザーがコーディング、PPT作成、スプレッドシート整理などのタスクをワークスペース内で直接Claudeにオフロードできるようにしています。数十のタスクを並行して実行し、チーム全体で同じ成果物を共同編集できます。NotionのプロダクトマネージャーEric Liu氏は、ユーザーがNotionを離れることなく、オープンエンドで複雑なタスクを直接委任できると述べています。

Sentryは「バグ発見からコード修正の提出まで」の完全自動化プロセスを実装しました。彼らのAIデバッグツール「Seer」は、根本原因を特定した後、Claudeに直接パッチを書かせ、PR（プルリクエスト）を作成させます。エンジニアリングディレクターのIndragie Karunaratne氏は、数週間で導入でき、自社構築インフラの継続的なメンテナンスコストを削減できたと語っています。

AtlassianはこれをJiraに統合し、開発者がClaude AIに直接タスクを割り当てられるようにしました。

Asanaは「AI Teammates」を作成し、タスクや成果物を引き受けられるAIコラボレーターをプロジェクト管理に追加しました。

General Legal（リーガルテック企業）のアプローチは最も興味深いものです。彼らのAIは、ユーザーのクエリに基づいて検索ツールを一時的に作成できます。以前はユーザーのクエリを予測して検索ツールを事前に開発する必要がありましたが、現在はAIが必要に応じて生成します。CTOによると、開発時間は10分の1に短縮されました。

楽天はエンジニアリング、プロダクト、営業、マーケティング、財務部門に専門的なAIエージェントをデプロイし、それぞれ1週間以内に本番稼働させました。SlackやTeams経由でタスクを受け取り、スプレッドシート、PPT、アプリなどの具体的な成果物を提供しています。

--価格

技術的原則：脳と手の分離

Anthropicのエンジニアリングチームは「Scaling Managed Agents: Decoupling the brain from the hands」という技術ブログを公開し、Managed Agentsの背後にあるアーキテクチャの進化について論じています。

当初、彼らはすべてを1つのコンテナに詰め込んでいました。AIの推論ループ、コード実行環境、セッションログがすべて一緒でした。利点はシンプルさでしたが、欠点は「卵を一つのカゴに盛る」状態であり、コンテナがダウンするとセッション全体が失われ、個々のパーツを別々に置き換えることもできませんでした。

その後、彼らは重要な分離を行いました：

· 「脳（Brain）」：Claudeとスケジューリングフレームワーク。思考と意思決定を担当。

· 「手（Hand）」：サンドボックスと各種ツール。特定の操作の実行を担当。

· 「記憶（Memory）」：独立したセッションログ。発生したすべての記録を担当。

これら3つは独立しており、1つがダウンしても他の2つには影響しません。

この分離により、いくつかの実用的なメリットが生まれました：

スピード

すべてのタスクでフルスペックのサンドボックス環境を起動する必要はありません。現在、サンドボックスはAIが実際にコードを実行する必要がある場合にのみオンデマンドで起動されます。初回応答の平均レイテンシは約60%減少し、極端なケースでは90%以上短縮されました。

セキュリティ

AIが生成したコードはサンドボックス内で実行されますが、外部システムにアクセスするための認証情報はサンドボックス外の安全な保管庫に保存され、物理的に隔離されています。例えば、Gitリポジトリにアクセスする場合、システムは初期化中にコードをクローンし、AIは通常通りgit push/pullを行いますが、トークン自体はAIから見えません。SlackやJiraのようなサービスにはMCP プロトコル経由でアクセスし、リクエストはプロキシ層を通過します。プロキシ層は保管庫から認証情報を取得してサービスを呼び出すため、プロセス全体を通じてAIが認証情報を扱うことはありません。

柔軟性

「脳」は「手」が何であるかを気にしません。エンジニアリングブログには興味深い一節があります。「スケジューリングフレームワークは、サンドボックスがコンテナなのか、携帯電話なのか、あるいはポケモンのエミュレーターなのかを知る必要はない」。単に「名前を入力して文字列を受け取る」というインターフェースに従うだけでよいのです。

これは、複数の「脳」が「手」を共有できること、また1つの「脳」が別の「脳」に「手」を引き継げることを意味し、マルチエージェント連携の基盤となります。

制限事項

Managed Agentsは万能ではありません。いくつか注意点があります：

一部の機能はまだリサーチプレビュー段階です。マルチエージェント連携、高度なメモリツール、自己評価反復（エージェントが自身のタスク完了品質を判断し、反復的に改善する機能）などはまだ完全には公開されておらず、利用には申請が必要です。

プラットフォームのロックイン。Managed Agentsを選択するということは、エージェントのインフラがAnthropicのエコシステムに縛られることを意味します。将来的にモデルやプラットフォームを変更する予定がある場合、移行コストを無視することはできません。

コンテキスト管理は依然として課題です。セッションログは独立して保存されますが、長期タスクにおいてどの情報を保持し、どれを破棄するかという判断には不可逆的な決定が伴います。これは現在進行中の課題であり、現在の彼らのアプローチはコンテキストストレージとコンテキスト管理を分離しています。ストレージは保存を保証し、管理ポリシーはモデルの進化に合わせて調整されます。

コストの予測可能性。1セッション時間あたり0.08ドルは妥当に聞こえるかもしれませんが、エージェントを数時間実行する必要がある複雑なタスクでは、トークン消費量と実行時間コストを考慮すると、総コストは無視できない可能性があります。企業はそれに応じて予算を評価する必要があります。

Managed Agentsは、ほとんどの企業が「AIエージェントに完全に業務を依存する」までには、まだ長い道のりがあることを示しています。

インフラの障壁は下がりましたが、Managed Agentsは「適切なタスクの定義」「ワークフローの設計」「AIにコアビジネスデータへのアクセスを許可するための信頼の構築」を支援することはできません。

AIエージェントインフラの「AWSモーメント」

Managed Agentsは、AWSが初期に辿った道を歩んでいるようです。まずコンピューティングパワーを提供し、次にランタイム環境をカプセル化する、という流れです。

10年前、企業は「クラウドに移行すべきか」を議論していましたが、現在は「エージェントインフラを自社ホストすべきか、マネージドサービスを利用すべきか」を議論しています。歴史的経験から言えば、インフラは決してコアコンピテンシーではないため、ほとんどの企業は最終的にマネージドサービスを選択します。OpenAIも独自のAgentプラットフォーム「Frontier」を立ち上げており、この分野の競争は始まったばかりです。

技術的な観点からは、「脳と手の分離」というアーキテクチャのアプローチが注目に値します。これにより、システムの各パーツが独立して進化できます。モデルをアップグレードして「脳」を変える、新しいツールが必要なら「手」を追加する、ストレージソリューションを変えるなら「メモリ層」を置き換える、といったことが可能です。

エンジニアリングブログの優れた比喩：OSのread()コマンドは、それが1970年代のディスクか現代のSSDかを気にしません。抽象化層が安定していれば、基盤となる実装は容易に交換できるのです。

利用の観点からは、製品にAIエージェント機能を組み込もうとしているエンタープライズ開発者にとって、Managed Agentsは数ヶ月分のインフラ作業を削減してくれる可能性があります。

6つの言語（Python、TypeScript、Java、Go、Ruby、PHP）がSDKでサポートされています。すでにClaude Codeを使用している場合は、最新バージョンにアップデートし、`/claude-api managed-agents-onboarding`と入力して開始してください。

カジュアルなAI愛好家が最も直接的に感じる影響は以下の通りです：あなたが使用するSaaS製品において、バックグラウンドで作業を支援するAIエージェントがますます増えていくでしょう。そして、それらのエージェントの多くはManaged Agents上で動作しているはずです。

価格の目安：トークンコストはAnthropic APIの標準価格に基づきます。実行コストは1セッション時間あたり0.08ドル（アイドル時間は課金されません）、ウェブ検索は1,000回あたり10ドルです。

AIエージェントのインフラは、現在のクラウドコンピューティングのように、最終的に少数の主要プレイヤーによって支配されると思いますか？

元記事リンク