Convierta la IA en un sistema de ejecución individual, la última Guía de Mejores Prácticas de Agentes Gestionados de Claude

By: blockbeats|2026/04/09 18:00:10

Título del artículo original: Lanzamiento de Agentes Gestionados de Claude
Autor original: Lance Martin
Traducción: Peggy, BlockBeats

Nota del editor: Este artículo presenta los agentes gestionados lanzados por Claude. Proporciona un formulario de software más cercano al futuro: los agentes inteligentes ya no son interfaces que responden a solicitudes una sola vez, sino sistemas de ejecución que se pueden configurar, implementar, programar y ejecutar a largo plazo.

Al desacoplar completamente la "inteligencia" (modelo y marco de ejecución), la "ejecución" (herramientas y entorno seguro) y el "proceso" (sesión y registro), los agentes gestionados de Claude transforman el agente de "lógica en código" a una unidad de infraestructura independiente. Este diseño no solo mejora la estabilidad y seguridad del sistema en tareas de larga duración, sino que también permite que los agentes se expandan continuamente a medida que evolucionan las capacidades del modelo, sin estar limitados por los marcos existentes.

Dentro de este marco, los patrones de uso comunes también han cambiado: de la ejecución programada y desencadenada por eventos a la ejecución automática "desencadenada por entrega", y a tareas complejas que abarcan días o incluso semanas, los agentes adquieren verdaderamente la capacidad de "trabajar continuamente". Esto significa que el valor de la IA ya no se refleja únicamente en la calidad de una sola respuesta, sino en su capacidad para acumularse y componerse con el tiempo.

Si las API anteriores permitían a los desarrolladores "involucrar la inteligencia", los agentes gestionados ahora están intentando responder a otra pregunta: cómo hacer que la inteligencia sea un sistema que se pueda alojar, programar y ejecutar de forma continua. En este sentido, los agentes ya no son solo herramientas, sino más bien una nueva primitiva informática.

El artículo original es el siguiente:

TL;DR

Los agentes gestionados de Claude son un marco de ejecución de agentes preconstruido y configurable (arnés de agente) que se ejecuta en infraestructura gestionada. Solo necesita definir un agente como una plantilla, incluidas herramientas, habilidades, repositorios de archivos/código, etc., y el resto del marco de trabajo en tiempo de ejecución y la infraestructura son proporcionados por el sistema. Este sistema está diseñado para mantenerse al día con los niveles de inteligencia en rápido crecimiento de Claude y para admitir tareas de larga duración.

Enlaces relacionados:

·Blog de Claude: Patrones de uso y casos de clientes

·Blog de Ingeniería: Diseño de agentes gestionados por Claude

·Documentación: Guía de inicio, Inicio rápido, Descripción de la CLI y del SDK

Agentes gestionados por Claude

Por qué se necesitan agentes gestionados por Claude

La API de mensajes de Claude es, en esencia, un punto de entrada para interactuar directamente con el modelo: ingrese un mensaje y reciba un contenido a cambio bloque. Los agentes inteligentes creados en la API de mensajes deben depender de un "marco de ejecución" para manejar la ruta de invocación de herramientas, la gestión de contextos y más. Sin embargo, esto plantea varios desafíos:

1. El marco de ejecución debe mantenerse al día con las capacidades en evolución de Claude
Recientemente escribí una entrada de blog sobre cómo crear un agente basado en las capacidades subyacentes de la API de Claude para manejar la orquestación de herramientas y la gestión del contexto. Sin embargo, el problema es que el marco de ejecución del agente a menudo implica algunas suposiciones sobre "lo que Claude no puede hacer". A medida que las capacidades de Claude crecen, estas suposiciones se vuelven rápidamente obsoletas e incluso pueden convertirse en cuellos de botella de rendimiento. Por lo tanto, el marco de ejecución debe actualizarse continuamente para mantener el ritmo de evolución de Claude.

2. Los ciclos de vida de las tareas de Claude se están haciendo más largos
El rango de tareas que Claude puede manejar está creciendo exponencialmente, superando las 10 horas de trabajo humano en las pruebas de referencia METR. Esto exige mayores exigencias a la infraestructura subyacente del agente: debe tener seguridad, estabilidad en escenarios de larga duración (gestionando diversas fallas de infraestructura) y escalabilidad (por ejemplo, apoyando a múltiples equipos de agentes que funcionan simultáneamente).

¿Por qué son importantes estos desafíos?

Abordar los desafíos mencionados anteriormente es crucial porque anticipamos que las versiones futuras de Claude podrán operar de manera continua durante períodos de días, semanas o incluso meses, abordando los problemas más complejos de la humanidad.

El SDK del Agente Claude es el primer paso en esta dirección, proporcionando un marco de trabajo de agente inteligente de uso general y fácil de usar. Mientras tanto, los agentes gestionados de Claude dan un paso más: basándose en esta base, proporcionan un marco de ejecución completo + infraestructura gestionada específicamente diseñada para admitir la ejecución de tareas segura y confiable durante largos períodos de tiempo.

Introducción

Una forma sencilla de empezar es utilizando nuestra habilidad de código abierto claude-api, que se puede utilizar directamente en Claude Code. Simplemente instale la última versión de Claude Code y luego ejecute el siguiente subcomando para completar la configuración de inicialización de los agentes gestionados de Claude.

Personalmente, tengo una fuerte preferencia por el enfoque de "habilidades" para integrar nuevas funcionalidades, y uso esta habilidad de manera extensiva en la práctica.

Convierta la IA en un sistema de ejecución individual, la última Guía de Mejores Prácticas de Agentes Gestionados de Claude

Además, puede consultar nuestra documentación para empezar rápidamente con el SDK o la CLI y prototipar sus agentes en la Consola de Claude.

Casos de uso

Puede encontrar muchos casos de uso interesantes en el blog oficial de Claude. Combinando estos casos con mi propia experiencia práctica, he observado algunos patrones de uso comunes:

1. Desencadenado por evento
Ejecución de tareas por un agente gestionado desencadenada por un servicio.
Por ejemplo, cuando se detecta un error en el sistema, se realiza una llamada automatizada a un agente gestionado para escribir un parche y enviar una solicitud de extracción. No se requiere intervención humana entre las etapas de "problema identificado" y "parche aplicado".

2. Ejecución programada
Programar tareas para que un agente gestionado las ejecute.
Por ejemplo, muchas personas, incluido yo mismo, utilizamos este método para generar informes diarios (como un resumen de actividades en la Plataforma X o GitHub, o un informe de progreso del equipo generado por un agente). A continuación, se muestra un ejemplo de mi resumen diario de actividades en la Plataforma X.

3. Ejecución y olvido
Ejecución de tareas por un agente gestionado desencadenada por un ser humano pero que no requiere seguimiento continuo. Por ejemplo, asignar tareas a un agente gestionado a través de Slack o Teams, que luego completa la tarea de forma autónoma y entrega los resultados (como tablas, diapositivas o incluso aplicaciones).

4. Tareas de largo plazo
Una tarea de larga duración, que considero uno de los escenarios particularmente valiosos para los agentes gestionados.
He realizado algunos experimentos basados en el repositorio de investigación automática de Andrej Karpathy, explorando diferentes formas de aplicación. Por ejemplo, recientemente utilicé la biblioteca de pretexto de _chenglou como entrada y hice que un agente gestionado investigara cómo aplicarla al contenido de nuestro blog de ingeniería.

Conceptos básicos

Hay tres conceptos fundamentales que hay que entender en el proceso de incorporación:

1. Agente
Una configuración con control de versiones que define la "identidad" del agente: incluyendo el modelo, el mensaje de sistema, las herramientas, las habilidades, el servidor MCP, etc. Una vez creado, se puede invocar repetidamente a través de ID.

2. Entorno
Una plantilla utilizada para describir el entorno de sandbox proporcionado para que se ejecute la herramienta del agente (por ejemplo, tipo de tiempo de ejecución, política de red, configuración del paquete de dependencias, etc.).

3. Sesión
Una instancia en ejecución con estado lanzada en función de un agente y entorno preconfigurados. Creará un nuevo entorno de sandbox a partir de la plantilla del entorno, montará los recursos necesarios para esta ejecución (como archivos, repositorios de GitHub) y almacenará de forma segura la información de autenticación en un almacén de claves (como las credenciales de MCP).

Puede pensarlo de esta manera:

· Agente = La propia configuración

· Entorno = La plantilla de entorno de pruebas necesaria para el funcionamiento del agente

· Sesión = Un proceso de ejecución específico

Un Agente puede corresponder a varias Sesiones.

Uso

Consulte la documentación para obtener más detalles. El uso general se divide en dos categorías:

1. SDK (orientado a código)
Integre el SDK en su aplicación para gestionar sesiones en tiempo de ejecución. Actualmente, los agentes gestionados admiten 6 idiomas: Python, TypeScript, Java, Go, Ruby, PHP.

2. CLI (Interfaz de línea de comandos)
Interactúa con todos los recursos de la API a través de la línea de comandos, incluidos agentes, entornos, sesiones, bóvedas, habilidades, archivos, etc. Cada tipo de recurso tiene subcomandos correspondientes.

Práctica común:
Por lo general, la CLI se utiliza para la configuración e inicialización, mientras que el SDK se utiliza para la lógica en tiempo de ejecución.
Una plantilla de agente es persistente: puede crear una plantilla (por ejemplo, definiendo el modelo, el mensaje de sistema, las herramientas, el servidor MCP, las habilidades en YAML), almacenarla en Git y aplicarla durante el proceso de implementación a través de la CLI.

Flujo de trabajo

Coescribí una entrada de blog de ingeniería de Anthropic con @mc_anthropic, @gcemaj y @jkeatn, que proporcionó una explicación detallada de la construcción de los agentes gestionados por Claude. Una conclusión clave del artículo fue que permitir que los agentes se escalen con el nivel de inteligencia de Claude es fundamentalmente un "problema de infraestructura", no solo un problema de diseño del marco de trabajo en tiempo de ejecución.

Esto significa que el verdadero desafío no radica en "cómo escribir un agente más inteligente", sino en cómo construir un sistema que pueda funcionar de manera estable a largo plazo, ser escalable y ser evolutivo, permitiendo que el agente pueda realizar tareas cada vez más complejas y a largo plazo.

Basándonos en esta filosofía, nosotros did no diseñamos un marco de tiempo de ejecución de agente fijo (armazón) ya que anticipamos su evolución continua. En su lugar, "desacoplamos" varias partes clave del sistema:

“Cerebro” (Claude y su marco de tiempo de ejecución)

“Manos” (sandbox y herramienta que realiza acciones concretas)

“Sesión” (registra los registros de eventos de ejecución)

Estos tres se diseñaron como interfaces independientes con suposiciones mínimas entre sí. Cada parte puede fallar o reemplazarse de forma independiente sin afectar al sistema en general.

En el artículo, también compartimos cómo esta arquitectura ofrece mayor fiabilidad, seguridad y flexibilidad, al mismo tiempo que deja espacio para la futura integración de nuevos marcos de tiempo de ejecución, entornos protegidos o infraestructuras que alojen sesiones.

Conclusión

Estoy muy emocionado con los proyectos que exploran la Orquestación de Múltiples Agentes o las tareas de largo horizonte. Algo que siempre me ha frustrado en el pasado es cómo el marco de ejecución del agente lucha por mantenerse al día con las capacidades en evolución del modelo.

La importancia de los Agentes Gestionados por Claude es que se encarga del marco de ejecución y la capa de infraestructura para usted, permitiéndole concentrarse en un nivel más alto, tratando al "agente" en sí como una nueva primitiva fundamental en la API de Claude, lo que permite una mayor exploración y desarrollo sobre ella.

[Enlace de la publicación original]

Te puede gustar

Informe matutino | Coinbase Ventures realiza su primera inversión en ENA; SpaceX planea fijar el precio de su OPI en 135 dólares por acción

Resumen de los eventos importantes del mercado el 3 de junio

Texto completo y análisis del discurso del CEO de SanDisk en la 42.ª Conferencia Anual de Decisiones Estratégicas de Bernstein

El valor fundamental del discurso de Goeckeler reside en que proporciona un marco narrativo altamente transparente y lógicamente claro para la transformación corporativa.

Informe matutino | Strategy vendió 32 BTC y más de 800.000 acciones de MSTR la semana pasada; Binance anunció oficialmente su portal de trading de acciones de EE. UU.; Polymarket alcanzó una asociación exclusiva con OneFootball

Resumen de los eventos importantes del mercado el 1 de junio

Bootcamp de trading WEEXPERIENCE en Polonia: cómo WEEX y FireCrew están haciendo que el trading de criptomonedas sea accesible para todos

WEEX se asoció con Firecrew en Polonia el 29 de mayo para el bootcamp de trading WEEXPERIENCE. Lee el resumen de las sesiones de expertos sobre análisis técnico, psicología de trading y herramientas de IA que demuestran la misión de WEEX de hacer que el trading de criptomonedas sea accesible para todos.

París reina: cómo el PSG truncó el sueño del Arsenal en una final histórica de la Champions League

PSG contra Arsenal, drama, destino y una maldición de 20 años rota. Revive la final de la Champions League 2026 donde el PSG defendió su corona en una tensa tanda de penaltis, mientras el momento estelar de Ousmane Dembélé y un fallo agónico hicieron historia en Budapest.

TaiJi completa una ronda de financiación estratégica de 3,5 millones de dólares, con inversiones de Castrum Capital, Becker Ventures y Coinvestor Ventures

La plataforma de inteligencia de mercado on-chain impulsada por IA para Web3, TaiJi, anunció la finalización de una financiación estratégica de 3,5 millones de dólares, que acelerará la construcción de un nuevo motor de simulación de mercado basado en IA.

¿Bitcoin estancado cerca de los 73 000 $? Cómo los traders encuentran recompensas en un mercado lateral en junio

Bitcoin está estancado cerca de los 73 000 $ a medida que los flujos de los ETF se enfrían y la incertidumbre macroeconómica mantiene a los traders cautelosos. Así es como las campañas de recompensas como Weex Joker Party ayudan a los traders a mantenerse activos durante un mercado lateral en junio.

Cómo hacer staking de Solana: una guía paso a paso para 2026

Encuentra las mejores criptomonedas de IA en 2026 con selecciones basadas en datos: Bittensor, Render y proyectos emergentes. Incluye métricas on-chain, riesgos y guía de trading en WEEX.

Precio garantizado ya disponible en WEEX: opere con mayor precisión

Para ofrecer una experiencia de trading de futuros más fluida, los futuros de WEEX han lanzado una función de "Precio garantizado".

Última investigación del BIS: El futuro de las stablecoins y el panorama monetario global

El informe sostiene que las stablecoins fortalecerán el dominio del dólar estadounidense a corto plazo, planteando riesgos para la soberanía monetaria de los mercados emergentes y las economías en desarrollo, mientras que su trayectoria a largo plazo dependerá de sus modelos de adopción, respuestas regulatorias y la sinergia de...

Entrevista con el maestro de la macroeconomía Raoul Pal: La competencia en IA está dando lugar a una "singularidad económica", no te deshagas fácilmente de tus activos en los próximos cuatro años

En comparación con el Nasdaq, Bitcoin se encuentra actualmente en una posición de sobreventa severa dentro de su tendencia a largo plazo.

La defensa rota de los guardianes de Solana: para atacar a Hyperliquid, ¿han rescatado el guion que alguna vez criticaron de Ethereum?

El auge de HYPE desata una batalla de gigantes. Un líder de Solana critica duramente a Hyperliquid por su centralización, mientras que Arthur Hayes responde con contundencia y una apuesta de 100.000 dólares.

¿Por qué Peter Thiel, el hombre detrás de Palantir, prepara su salida de Argentina?

Palantir, el riesgo político y la autopreservación de los oligarcas tecnológicos.

Informe matutino | Coinbase Ventures realiza su primera inversión en ENA; SpaceX planea fijar el precio de su OPI en 135 dólares por acción

Resumen de los eventos importantes del mercado el 3 de junio

Texto completo y análisis del discurso del CEO de SanDisk en la 42.ª Conferencia Anual de Decisiones Estratégicas de Bernstein

El valor fundamental del discurso de Goeckeler reside en que proporciona un marco narrativo altamente transparente y lógicamente claro para la transformación corporativa.