Convierta la IA en un sistema de ejecución individual, la última Guía de Mejores Prácticas de Agentes Gestionados de Claude
Título del artículo original: Lanzamiento de Agentes Gestionados de Claude
Autor original: Lance Martin
Traducción: Peggy, BlockBeats
Nota del editor: Este artículo presenta los agentes gestionados lanzados por Claude. Proporciona un formulario de software más cercano al futuro: los agentes inteligentes ya no son interfaces que responden a solicitudes una sola vez, sino sistemas de ejecución que se pueden configurar, implementar, programar y ejecutar a largo plazo.
Al desacoplar completamente la "inteligencia" (modelo y marco de ejecución), la "ejecución" (herramientas y entorno seguro) y el "proceso" (sesión y registro), los agentes gestionados de Claude transforman el agente de "lógica en código" a una unidad de infraestructura independiente. Este diseño no solo mejora la estabilidad y seguridad del sistema en tareas de larga duración, sino que también permite que los agentes se expandan continuamente a medida que evolucionan las capacidades del modelo, sin estar limitados por los marcos existentes.
Dentro de este marco, los patrones de uso comunes también han cambiado: de la ejecución programada y desencadenada por eventos a la ejecución automática "desencadenada por entrega", y a tareas complejas que abarcan días o incluso semanas, los agentes adquieren verdaderamente la capacidad de "trabajar continuamente". Esto significa que el valor de la IA ya no se refleja únicamente en la calidad de una sola respuesta, sino en su capacidad para acumularse y componerse con el tiempo.
Si las API anteriores permitían a los desarrolladores "involucrar la inteligencia", los agentes gestionados ahora están intentando responder a otra pregunta: cómo hacer que la inteligencia sea un sistema que se pueda alojar, programar y ejecutar de forma continua. En este sentido, los agentes ya no son solo herramientas, sino más bien una nueva primitiva informática.
El artículo original es el siguiente:
TL;DR
Los agentes gestionados de Claude son un marco de ejecución de agentes preconstruido y configurable (arnés de agente) que se ejecuta en infraestructura gestionada. Solo necesita definir un agente como una plantilla, incluidas herramientas, habilidades, repositorios de archivos/código, etc., y el resto del marco de trabajo en tiempo de ejecución y la infraestructura son proporcionados por el sistema. Este sistema está diseñado para mantenerse al día con los niveles de inteligencia en rápido crecimiento de Claude y para admitir tareas de larga duración.
Enlaces relacionados:
·Blog de Claude: Patrones de uso y casos de clientes
·Blog de Ingeniería: Diseño de agentes gestionados por Claude
·Documentación: Guía de inicio, Inicio rápido, Descripción de la CLI y del SDK
Agentes gestionados por Claude
Por qué se necesitan agentes gestionados por Claude
La API de mensajes de Claude es, en esencia, un punto de entrada para interactuar directamente con el modelo: ingrese un mensaje y reciba un contenido a cambio bloque. Los agentes inteligentes creados en la API de mensajes deben depender de un "marco de ejecución" para manejar la ruta de invocación de herramientas, la gestión de contextos y más. Sin embargo, esto plantea varios desafíos:
1. El marco de ejecución debe mantenerse al día con las capacidades en evolución de Claude
Recientemente escribí una entrada de blog sobre cómo crear un agente basado en las capacidades subyacentes de la API de Claude para manejar la orquestación de herramientas y la gestión del contexto. Sin embargo, el problema es que el marco de ejecución del agente a menudo implica algunas suposiciones sobre "lo que Claude no puede hacer". A medida que las capacidades de Claude crecen, estas suposiciones se vuelven rápidamente obsoletas e incluso pueden convertirse en cuellos de botella de rendimiento. Por lo tanto, el marco de ejecución debe actualizarse continuamente para mantener el ritmo de evolución de Claude.
2. Los ciclos de vida de las tareas de Claude se están haciendo más largos
El rango de tareas que Claude puede manejar está creciendo exponencialmente, superando las 10 horas de trabajo humano en las pruebas de referencia METR. Esto exige mayores exigencias a la infraestructura subyacente del agente: debe tener seguridad, estabilidad en escenarios de larga duración (gestionando diversas fallas de infraestructura) y escalabilidad (por ejemplo, apoyando a múltiples equipos de agentes que funcionan simultáneamente).
¿Por qué son importantes estos desafíos?
Abordar los desafíos mencionados anteriormente es crucial porque anticipamos que las versiones futuras de Claude podrán operar de manera continua durante períodos de días, semanas o incluso meses, abordando los problemas más complejos de la humanidad.
El SDK del Agente Claude es el primer paso en esta dirección, proporcionando un marco de trabajo de agente inteligente de uso general y fácil de usar. Mientras tanto, los agentes gestionados de Claude dan un paso más: basándose en esta base, proporcionan un marco de ejecución completo + infraestructura gestionada específicamente diseñada para admitir la ejecución de tareas segura y confiable durante largos períodos de tiempo.
Introducción
Una forma sencilla de empezar es utilizando nuestra habilidad de código abierto claude-api, que se puede utilizar directamente en Claude Code. Simplemente instale la última versión de Claude Code y luego ejecute el siguiente subcomando para completar la configuración de inicialización de los agentes gestionados de Claude.
Personalmente, tengo una fuerte preferencia por el enfoque de "habilidades" para integrar nuevas funcionalidades, y uso esta habilidad de manera extensiva en la práctica.

Además, puede consultar nuestra documentación para empezar rápidamente con el SDK o la CLI y prototipar sus agentes en la Consola de Claude.
Casos de uso
Puede encontrar muchos casos de uso interesantes en el blog oficial de Claude. Combinando estos casos con mi propia experiencia práctica, he observado algunos patrones de uso comunes:
1. Desencadenado por evento
Ejecución de tareas por un agente gestionado desencadenada por un servicio.
Por ejemplo, cuando se detecta un error en el sistema, se realiza una llamada automatizada a un agente gestionado para escribir un parche y enviar una solicitud de extracción. No se requiere intervención humana entre las etapas de "problema identificado" y "parche aplicado".
2. Ejecución programada
Programar tareas para que un agente gestionado las ejecute.
Por ejemplo, muchas personas, incluido yo mismo, utilizamos este método para generar informes diarios (como un resumen de actividades en la Plataforma X o GitHub, o un informe de progreso del equipo generado por un agente). A continuación, se muestra un ejemplo de mi resumen diario de actividades en la Plataforma X.

3. Ejecución y olvido
Ejecución de tareas por un agente gestionado desencadenada por un ser humano pero que no requiere seguimiento continuo. Por ejemplo, asignar tareas a un agente gestionado a través de Slack o Teams, que luego completa la tarea de forma autónoma y entrega los resultados (como tablas, diapositivas o incluso aplicaciones).
4. Tareas de largo plazo
Una tarea de larga duración, que considero uno de los escenarios particularmente valiosos para los agentes gestionados.
He realizado algunos experimentos basados en el repositorio de investigación automática de Andrej Karpathy, explorando diferentes formas de aplicación. Por ejemplo, recientemente utilicé la biblioteca de pretexto de _chenglou como entrada y hice que un agente gestionado investigara cómo aplicarla al contenido de nuestro blog de ingeniería.

Conceptos básicos
Hay tres conceptos fundamentales que hay que entender en el proceso de incorporación:
1. Agente
Una configuración con control de versiones que define la "identidad" del agente: incluyendo el modelo, el mensaje de sistema, las herramientas, las habilidades, el servidor MCP, etc. Una vez creado, se puede invocar repetidamente a través de ID.
2. Entorno
Una plantilla utilizada para describir el entorno de sandbox proporcionado para que se ejecute la herramienta del agente (por ejemplo, tipo de tiempo de ejecución, política de red, configuración del paquete de dependencias, etc.).
3. Sesión
Una instancia en ejecución con estado lanzada en función de un agente y entorno preconfigurados. Creará un nuevo entorno de sandbox a partir de la plantilla del entorno, montará los recursos necesarios para esta ejecución (como archivos, repositorios de GitHub) y almacenará de forma segura la información de autenticación en un almacén de claves (como las credenciales de MCP).
Puede pensarlo de esta manera:
· Agente = La propia configuración
· Entorno = La plantilla de entorno de pruebas necesaria para el funcionamiento del agente
· Sesión = Un proceso de ejecución específico
Un Agente puede corresponder a varias Sesiones.
Uso
Consulte la documentación para obtener más detalles. El uso general se divide en dos categorías:
1. SDK (orientado a código)
Integre el SDK en su aplicación para gestionar sesiones en tiempo de ejecución. Actualmente, los agentes gestionados admiten 6 idiomas: Python, TypeScript, Java, Go, Ruby, PHP.
2. CLI (Interfaz de línea de comandos)
Interactúa con todos los recursos de la API a través de la línea de comandos, incluidos agentes, entornos, sesiones, bóvedas, habilidades, archivos, etc. Cada tipo de recurso tiene subcomandos correspondientes.
Práctica común:
Por lo general, la CLI se utiliza para la configuración e inicialización, mientras que el SDK se utiliza para la lógica en tiempo de ejecución.
Una plantilla de agente es persistente: puede crear una plantilla (por ejemplo, definiendo el modelo, el mensaje de sistema, las herramientas, el servidor MCP, las habilidades en YAML), almacenarla en Git y aplicarla durante el proceso de implementación a través de la CLI.
Flujo de trabajo
Coescribí una entrada de blog de ingeniería de Anthropic con @mc_anthropic, @gcemaj y @jkeatn, que proporcionó una explicación detallada de la construcción de los agentes gestionados por Claude. Una conclusión clave del artículo fue que permitir que los agentes se escalen con el nivel de inteligencia de Claude es fundamentalmente un "problema de infraestructura", no solo un problema de diseño del marco de trabajo en tiempo de ejecución.
Esto significa que el verdadero desafío no radica en "cómo escribir un agente más inteligente", sino en cómo construir un sistema que pueda funcionar de manera estable a largo plazo, ser escalable y ser evolutivo, permitiendo que el agente pueda realizar tareas cada vez más complejas y a largo plazo.

Basándonos en esta filosofía, nosotros did no diseñamos un marco de tiempo de ejecución de agente fijo (armazón) ya que anticipamos su evolución continua. En su lugar, "desacoplamos" varias partes clave del sistema:
“Cerebro” (Claude y su marco de tiempo de ejecución)
“Manos” (sandbox y herramienta que realiza acciones concretas)
“Sesión” (registra los registros de eventos de ejecución)
Estos tres se diseñaron como interfaces independientes con suposiciones mínimas entre sí. Cada parte puede fallar o reemplazarse de forma independiente sin afectar al sistema en general.
En el artículo, también compartimos cómo esta arquitectura ofrece mayor fiabilidad, seguridad y flexibilidad, al mismo tiempo que deja espacio para la futura integración de nuevos marcos de tiempo de ejecución, entornos protegidos o infraestructuras que alojen sesiones.
Conclusión
Estoy muy emocionado con los proyectos que exploran la Orquestación de Múltiples Agentes o las tareas de largo horizonte. Algo que siempre me ha frustrado en el pasado es cómo el marco de ejecución del agente lucha por mantenerse al día con las capacidades en evolución del modelo.
La importancia de los Agentes Gestionados por Claude es que se encarga del marco de ejecución y la capa de infraestructura para usted, permitiéndole concentrarse en un nivel más alto, tratando al "agente" en sí como una nueva primitiva fundamental en la API de Claude, lo que permite una mayor exploración y desarrollo sobre ella.
Te puede gustar

Naval sube personalmente al escenario: El histórico choque entre la gente común y el capital de riesgo.

Criptomonedas a16z: 9 gráficos para comprender las tendencias evolutivas de las stablecoins

Refutación del artículo de Yang Haipo titulado "El fin de las criptomonedas".

¿Puede un secador de pelo generar 34 000 dólares? Interpretación de la paradoja de la reflexividad en los mercados de predicción

El sucesor de Apple enfrenta desafíos inéditos
John Turner se convierte en el nuevo CEO de Apple el 1 de septiembre de 2026, sustituyendo a…

Fundador de 6MV: En 2026, ha llegado el "punto de inflexión histórico" para la inversión en criptomonedas

Abraxas Capital emite 2.890 millones de USDT: ¿Un impulso a la liquidez o simplemente más arbitraje con stablecoins?
Abraxas Capital acaba de recibir 2.890 millones de dólares en USDT recién emitidos de Tether. ¿Se trata de una inyección de liquidez alcista para los mercados de criptomonedas, o es simplemente el día a día de un gigante del arbitraje de stablecoins? Analizamos los datos y el posible impacto en el bitcoin, las altcoins y las finanzas descentralizadas (DeFi).

Un inversor de capital riesgo del mundo de las criptomonedas dijo que la IA es una locura y que ellos son muy conservadores

La historia evolutiva de los algoritmos de contratos: Una década de contratos perpetuos, el telón aún no ha caído.

Noticias sobre ETF de Bitcoin hoy: Entradas de $2.1 mil millones indican una fuerte demanda institucional de BTC.
Las noticias sobre los ETF de Bitcoin registraron entradas de capital por valor de 2.100 millones de dólares durante 8 días consecutivos, lo que supone una de las rachas de acumulación más fuertes de los últimos tiempos. Aquí te explicamos qué significan las últimas noticias sobre los ETF de Bitcoin para el precio de BTC y si el próximo objetivo es superar el nivel de los 80.000 dólares.

Tras haber sido expulsado de PayPal, Musk pretende volver al mercado de las criptomonedas

Michael Saylor: El invierno ha terminado: ¿tiene razón? 5 datos clave (2026)
Michael Saylor tuiteó ayer: «Se acabó el invierno». Es breve. Es atrevido. Y está dando mucho que hablar en el mundo de las criptomonedas.
¿Pero tiene razón? ¿O se trata simplemente de otro director ejecutivo que se está llenando los bolsillos?
Echemos un vistazo a los datos. Seamos neutrales. Veamos si el hielo se ha derretido de verdad.

La aplicación WEEX Bubbles ya está disponible y visualiza el mercado de criptomonedas de un vistazo
WEEX Bubbles es una aplicación independiente diseñada para ayudar a los usuarios a comprender rápidamente los complejos movimientos del mercado de criptomonedas a través de una visualización intuitiva en burbujas.

El cofundador de Polygon, Sandeep: Escribiendo tras la explosión del puente de cadena

Actualización principal en la web: Más de 10 estilos de gráficos avanzados para una visión más profunda del mercado
Para ofrecer herramientas de análisis más potentes y profesionales, WEEX ha lanzado una importante actualización a sus gráficos de comercio web, que ahora admiten hasta 14 estilos avanzados de gráficos.

Informe matutino | Aethir asegura un contrato empresarial de $260 millones con Axe Compute; New Fire Technology adquiere el equipo comercial de Avenir Group; el volumen de operaciones de Polymarket es superado por Kalshi

¿Volverá la Fed a Recortar Tipos de Interés? Los Datos de Esta Noche Son Clave
Los conflictos geopolíticos e inflación creciente generan expectativas de un recorte de tasas por parte de la Fed.…

Publicación Impactante sobre la Preparación Cuántica de XRP para 2028
Vet, validador de XRP Ledger, ha detallado un plan para que XRP se vuelva resistente a amenazas cuánticas.…
Naval sube personalmente al escenario: El histórico choque entre la gente común y el capital de riesgo.
Criptomonedas a16z: 9 gráficos para comprender las tendencias evolutivas de las stablecoins
Refutación del artículo de Yang Haipo titulado "El fin de las criptomonedas".
¿Puede un secador de pelo generar 34 000 dólares? Interpretación de la paradoja de la reflexividad en los mercados de predicción
El sucesor de Apple enfrenta desafíos inéditos
John Turner se convierte en el nuevo CEO de Apple el 1 de septiembre de 2026, sustituyendo a…






