Convierta la IA en un sistema de ejecución individual: la última guía de mejores prácticas de Claude sobre agentes gestionados.

By: blockbeats|2026/04/09 18:00:03
0
Compartir
copy
Título del artículo original: Lanzamiento de los agentes gestionados de Claude
Autor original: Lance Martin
Traducción: Peggy, BlockBeats

Nota del editor: Este artículo presenta los agentes gestionados lanzados por Claude. Proporciona un formato de software más cercano al futuro: los agentes inteligentes ya no son interfaces que responden a las solicitudes una sola vez, sino sistemas de ejecución que pueden configurarse, implementarse, programarse y ejecutarse a largo plazo.

Al desacoplar por completo la "inteligencia" (modelo y marco de ejecución), la "ejecución" (herramientas y entorno aislado) y el "proceso" (sesión y registro), los agentes gestionados de Claude transforman el agente de "lógica en código" a una unidad de infraestructura independiente. Este diseño no solo mejora la estabilidad y la seguridad del sistema en tareas de larga duración, sino que también permite que los agentes se expandan continuamente a medida que evolucionan las capacidades del modelo, sin las limitaciones de los marcos existentes.

Dentro de este marco, los patrones de uso habituales también han cambiado: desde la ejecución programada y activada por eventos hasta la ejecución automática "al recibir el pedido", y a tareas complejas que abarcan días o incluso semanas, los agentes adquieren realmente la capacidad de "trabajar de forma continua". Esto significa que el valor de la IA ya no se refleja únicamente en la calidad de una sola respuesta, sino en su capacidad para acumularse y multiplicarse con el tiempo.

Si las API anteriores permitían a los desarrolladores "invocar inteligencia", los agentes gestionados ahora intentan responder a otra pregunta: cómo convertir la inteligencia en un sistema que pueda alojarse, programarse y ejecutarse de forma continua. En este sentido, los agentes ya no son meras herramientas, sino que se acercan más a una nueva primitiva de la computación.

El artículo original es el siguiente:

TL;DR

Los agentes gestionados de Claude son un marco de ejecución de agentes (estructura de agente) preconfigurado y personalizable que se ejecuta en una infraestructura gestionada. Solo necesita definir un agente como plantilla (incluidas herramientas, habilidades, repositorios de archivos/código, etc.) y el resto del marco de ejecución y la infraestructura los proporciona el sistema. Este sistema está diseñado para seguir el ritmo del rápido crecimiento de la inteligencia de Claude y para dar soporte a tareas de larga duración.

Enlaces relacionados:

· Blog de Claude : Patrones de uso y casos de clientes

· Blog de ingeniería : Diseño de agentes gestionados por Claude

· Documentación : Guía de inicio rápido, Guía de inicio rápido, Descripción general de la CLI y el SDK

Agentes gestionados por Claude

¿Por qué se necesitan los agentes gestionados por Claude?

La API de mensajes de Claude es fundamentalmente un punto de entrada para interactuar directamente con el modelo: se introduce un mensaje y se obtiene un bloque de contenido. Los agentes inteligentes basados ​​en la API de mensajes necesitan depender de un "marco de ejecución" para gestionar el enrutamiento de la invocación de herramientas, la gestión del contexto y mucho más. Sin embargo, esto plantea varios desafíos:

1. El marco de ejecución debe mantenerse al día con las capacidades en constante evolución de Claude.
Recientemente escribí una entrada de blog sobre cómo crear un agente basado en las capacidades subyacentes de la API de Claude para gestionar la orquestación de herramientas y la administración del contexto. Sin embargo, el problema radica en que el marco de ejecución del agente a menudo implica ciertas suposiciones sobre "lo que Claude no puede hacer". A medida que las capacidades de Claude aumentan, estas suposiciones se vuelven rápidamente obsoletas e incluso pueden convertirse en cuellos de botella en el rendimiento. Por lo tanto, el marco de ejecución debe actualizarse continuamente para mantenerse al ritmo de la evolución de Claude.

2. Los ciclos de vida de las tareas de Claude se están alargando.
El número de tareas que Claude puede realizar está creciendo exponencialmente, superando las 10 horas de trabajo humano en las pruebas de referencia METR. Esto impone mayores exigencias a la infraestructura subyacente del agente: debe contar con seguridad, estabilidad en escenarios de larga duración (manejando diversas fallas de infraestructura) y escalabilidad (por ejemplo, soportando múltiples equipos de agentes que se ejecutan simultáneamente).

Precio de --

--

Por qué estos desafíos son importantes

Es fundamental abordar los desafíos mencionados anteriormente, ya que prevemos que las futuras versiones de Claude podrán operar de forma continua durante días, semanas o incluso meses, resolviendo los problemas más complejos de la humanidad.

El SDK de Claude Agent es el primer paso en esta dirección, ya que proporciona un marco de ejecución de agentes inteligentes de propósito general y fácil de usar. Mientras tanto, los agentes gestionados de Claude van un paso más allá: partiendo de esta base, proporcionan un marco de ejecución completo y una infraestructura gestionada diseñada específicamente para admitir una ejecución de tareas segura y fiable durante largos periodos de tiempo.

Empezando

Una forma sencilla de empezar es utilizando nuestra habilidad de código abierto claude-api, que se puede usar directamente en Claude Code. Simplemente instale la última versión de Claude Code y, a continuación, ejecute el siguiente subcomando para completar la configuración de inicialización de los agentes gestionados de Claude.

Personalmente, tengo una clara preferencia por el enfoque basado en "habilidades" para integrar nuevas funcionalidades, y utilizo ampliamente esta habilidad en la práctica.

Convierta la IA en un sistema de ejecución individual: la última guía de mejores prácticas de Claude sobre agentes gestionados.

Además, puedes consultar nuestra documentación para empezar rápidamente con el SDK o la CLI y crear prototipos de tus agentes en la consola de Claude.

Casos de uso

En el blog oficial de Claude podrás encontrar muchos casos de uso interesantes. Combinando estos casos con mi propia experiencia práctica, he observado algunos patrones de uso comunes:

1. Activado por eventos
Ejecución de tareas por un agente gestionado activada por un servicio.
Por ejemplo, cuando se detecta un error en el sistema, se realiza una llamada automatizada a un agente administrado para que escriba un parche y envíe una solicitud de extracción (PR). No se requiere intervención humana entre las etapas de "problema identificado" y "parche aplicado".

2. Ejecución programada
Programación de tareas para que las ejecute un agente gestionado.
Por ejemplo, muchas personas, incluyéndome a mí, utilizamos este método para generar informes diarios (como un resumen de las actividades en la Plataforma X o GitHub, o un informe de progreso del equipo generado por un agente). A continuación se muestra un ejemplo de mi resumen diario de actividades en la Plataforma X.

3. Dispara y olvida
Ejecución de tareas por un agente gestionado, activada por un humano pero que no requiere seguimiento posterior. Por ejemplo, asignar tareas a un agente gestionado a través de Slack o Teams, que luego completa la tarea de forma autónoma y entrega los resultados (como tablas, diapositivas o incluso aplicaciones).

4. Tareas a largo plazo
Se trata de una tarea de larga duración, que considero uno de los escenarios especialmente valiosos para los agentes gestionados.
He realizado algunos experimentos basados ​​en el repositorio de autoinvestigación de Andrej Karpathy, explorando diferentes formas de aplicación. Por ejemplo, recientemente tomé como entrada la biblioteca de pretextos de _chenglou e hice que un agente administrado investigara cómo aplicarla al contenido de nuestro blog de ingeniería.

Conceptos básicos

Hay tres conceptos fundamentales que se deben comprender en el proceso de incorporación:

1. Agente
Una configuración con control de versiones que define la "identidad" del agente: incluyendo el modelo, el indicador del sistema, las herramientas, las habilidades, el servidor MCP, etc. Una vez creado, puede invocarse repetidamente mediante su ID.

2. Ambiente
Plantilla utilizada para describir el entorno aislado proporcionado para que se ejecute la herramienta del agente (por ejemplo, tipo de tiempo de ejecución, política de red, configuración del paquete de dependencias, etc.).

3. Sesión
Una instancia en ejecución con estado, lanzada en base a un agente y un entorno preconfigurados. Creará un entorno aislado completamente nuevo a partir de la plantilla de entorno, montará los recursos necesarios para esta ejecución (como archivos y repositorios de GitHub) y almacenará de forma segura la información de autenticación en un almacén de claves (como las credenciales de MCP).

Puedes pensarlo de esta manera:

· Agente = La configuración misma

· Entorno = La plantilla de entorno aislado necesaria para el funcionamiento del agente

· Sesión = Un proceso de ejecución específico

Un agente puede corresponder a varias sesiones.

Uso

Consulte la documentación para obtener más detalles. El uso general se divide en dos categorías:

1. SDK (Orientado al código)
Integre el SDK en su aplicación para gestionar las sesiones en tiempo de ejecución. Actualmente, los agentes gestionados admiten 6 idiomas: Python, TypeScript, Java, Go, Ruby, PHP.

2. CLI (Interfaz de línea de comandos)
Interactúa con todos los recursos de la API a través de la línea de comandos, incluidos agentes, entornos, sesiones, bóvedas, habilidades, archivos, etc. Cada tipo de recurso tiene subcomandos correspondientes.

Práctica común:
Normalmente, la interfaz de línea de comandos (CLI) se utiliza para la configuración e inicialización, mientras que el kit de desarrollo de software (SDK) se utiliza para la lógica de ejecución.
Una plantilla de agente es persistente: puede crear una plantilla (por ejemplo, definiendo el modelo, el mensaje del sistema, las herramientas, el servidor MCP y las habilidades en YAML), almacenarla en Git y aplicarla durante el proceso de implementación a través de la CLI.

Flujo de trabajo

Fui coautor de una entrada de blog sobre ingeniería antrópica junto con @mc_anthropic, @gcemaj y @jkeatn, que proporcionaba una explicación detallada de la construcción de los agentes gestionados de Claude. Una conclusión clave del artículo fue que permitir que los agentes escalen al mismo ritmo que el nivel de inteligencia de Claude es fundamentalmente un "problema de infraestructura", no solo un problema de diseño del marco de ejecución.

Esto significa que el verdadero desafío no reside en "cómo escribir un agente más inteligente", sino en cómo construir un sistema que pueda funcionar de forma estable a largo plazo, ser escalable y evolucionar, permitiendo que el agente realice tareas cada vez más complejas y a largo plazo.

Basándonos en esta filosofía, did-133">no diseñamos un marco de ejecución de agentes fijo (arnés), ya que anticipábamos su continua evolución. En cambio, "desacoplamos" varias partes clave del sistema:

“Brain” (Claude y su marco de ejecución)

“Manos” (arenero y herramienta realizando acciones concretas)

“Sesión” (registra los eventos de ejecución)

Estas tres interfaces fueron diseñadas de forma independiente, con suposiciones mínimas entre sí. Cada componente puede fallar o ser reemplazado de forma independiente sin afectar al sistema en su conjunto.

En el artículo, también explicamos cómo esta arquitectura aporta mayor fiabilidad, seguridad y flexibilidad, al tiempo que deja espacio para la futura integración de nuevos marcos de ejecución, entornos aislados o sesiones de alojamiento de infraestructura.

Conclusión

Me entusiasman mucho los proyectos que exploran la orquestación multiagente o las tareas a largo plazo. Algo que siempre me ha frustrado es cómo el marco de ejecución del agente tiene dificultades para mantenerse al día con las capacidades en constante evolución del modelo.

La importancia de los agentes gestionados de Claude radica en que se encargan del marco de ejecución y la capa de infraestructura, lo que le permite centrarse en un nivel superior: tratar al "agente" en sí mismo como una nueva primitiva fundamental en la API de Claude, lo que permite una mayor exploración y desarrollo sobre ella.

[ Enlace a la publicación original ]

También te puede interesar

¿Bitcoin está formando un fondo en 2026? Cómo la sorpresa arancelaria y el alto el fuego podrían impulsar a BTC hacia los 75 000 dólares

Bitcoin podría estar formando su fondo de 2026 cerca de los 65 000 dólares. Vea cómo las sorpresas arancelarias, las entradas de ETF y el alto el fuego en Irán podrían dar forma a la próxima subida de BTC hacia los 75 000 dólares.

Las stablecoins alcanzarán los 315 mil millones de dólares en 2026: Por qué esta es la mayor tendencia en criptomonedas ahora mismo.

Es posible que Bitcoin esté formando su mínimo de 2026 cerca de los 65.000 dólares. Descubre cómo las fluctuaciones arancelarias, las entradas de capital en los ETF y las señales geopolíticas podrían influir en la próxima subida del BTC hacia los 75.000 dólares.

Investigación sobre el tigre: Un análisis exhaustivo de los negocios más rentables y sus modelos de negocio en el sector de las criptomonedas

Las comisiones de pago, la infraestructura compartida y la demanda en el extranjero se han convertido en nuevos campos de batalla.

¿Por qué el alto el fuego entre Estados Unidos e Irán está destinado a ser insostenible?

Análisis detallado: ¿Por qué se critica el alto el fuego entre Estados Unidos e Irán como "nominal"? Cuando ambas partes están acostumbradas a colocar su propio poder por encima de los acuerdos, esta breve paz carente de confianza está destinada a ser solo ruinas.

¿Un jugador de Oriente Medio poco conocido se convertirá en la estrella del mercado de predicciones para el Mundial de 2026?

ADI Predictstreet es el socio oficial del mercado de predicciones de la Copa Mundial de la FIFA 2026.

¿Por qué está condenado al fracaso el alto el fuego entre EE. UU. e Irán?<1>

Ambas partes priorizan el poder dentro del contrato<1>

Monedas populares

Últimas noticias sobre criptomonedas

Leer más