Xiaomi y MiniMax desatan sus movimientos finales, lo que señala el inicio de la Guerra de Precios de Agencias.
El 18 y 19 de marzo, dos empresas chinas lanzaron sucesivamente sus respectivos grandes modelos orientados a Agencias. La startup de IA nacional MiniMax lanzó M2.7, y el equipo de grandes modelos de Xiaomi MiMo presentó V2-Pro. Ambos modelos entraron en el primer nivel mundial en el benchmark de Agencias, pero sus precios de salida de API son 1/21 y 1/8 de Claude Opus 4.6, respectivamente.
Ambas empresas jugaron sus cartas en la misma semana, pero con cartas completamente diferentes. Representan dos caminos técnicos completamente diferentes, apostando por dos futuros de la era de los agentes.
Matrícula del mismo examen, 1/17
Primero, veamos la comparación más intuitiva.

Según OpenRouter y varias páginas oficiales de precios de la empresa, basándose en el precio de salida de la API (por millón de tokens), MiniMax M2.7 es de $1.2, y MiMo-V2-Pro es de $3. Como referencia, el precio de salida de Claude Opus 4.6 es de $25, GPT-5.2 es de $14 y Claude Sonnet 4.6 es de $15.
La diferencia de precio es un orden de magnitud, pero la diferencia de rendimiento no lo es. En SWE-bench Verified (el benchmark actual más utilizado para medir la capacidad de ingeniería de código), MiMo-V2-Pro obtuvo un 78%, Sonnet 4.6 fue del 79,6%, una diferencia de menos de dos puntos porcentuales. La puntuación de M2.7 en SWE-Pro es del 56,22%, a la par con GPT-5.3-Codex. En VIBE-Pro (capacidad de entrega de proyectos de extremo a extremo), M2.7 obtuvo un 55,6%, acercándose al nivel de Opus 4.6.
El enfoque de este gráfico no es quién está más alto o más bajo: los sistemas de referencia de varias empresas no están completamente alineados, por lo que las comparaciones directas deben ser cautelosas. El enfoque está en la "diferencia de tijeras de precio-rendimiento": los modelos de Agente domésticos se han ajustado a la misma banda de rendimiento, pero están en rangos de precios completamente diferentes.
Un billón de parámetros frente a. Autoevolución
El precio es solo la superficie. Las dos empresas han presentado dos conjuntos de cartas completamente diferentes.
MiMo-V2-Pro sigue la ruta de "ir a lo grande o no ir". Según el anuncio oficial de Xiaomi, V2-Pro tiene más de 1 billón de parámetros totales, 42B de parámetros de activación y admite un contexto ultra largo de 1 millón de tokens. Su innovación principal es el mecanismo de atención mixta Hybrid Attention, que ajusta la proporción de Sliding Window Attention (SWA) a Global Attention (GA) a 7:1, mientras que su predecesor V2-Flash era de 5:1. Esta arquitectura hace que el modelo sea más estable en escenarios donde se procesan documentos largos y se realizan múltiples llamadas de herramientas en paralelo en la escena del Agente. En PinchBench (capacidad de invocación de herramientas de agente), MiMo-V2-Pro obtuvo un 84%.
M2.7 tomó un camino completamente diferente. Según la publicación oficial del blog técnico de MiniMax del 18 de marzo, el número de parámetros de M2.7 no se reveló, pero demostró un mecanismo de "evolución auto-iterativa": el modelo ejecutó de forma autónoma más de 100 bucles de optimización, incluyendo el análisis de trayectorias de fallo, la planificación de modificaciones, la modificación de su propia arquitectura de código, la ejecución de evaluaciones y el bucle de nuevo, logrando finalmente una mejora del 30% en el rendimiento en un conjunto de evaluación interno. En el MLE Bench Lite (evaluación de la dificultad del concurso de aprendizaje automático), de 22 problemas difíciles, M2.7 obtuvo 9 medallas de oro, 5 de plata y 1 de bronce, con una tasa de medallas promedio del 66,6%.

De cinco dimensiones, los dos caminos apuntan en direcciones completamente diferentes: MiMo-V2-Pro domina claramente en longitud de contexto y dimensiones de ingeniería de código, mientras que M2.7 amplía la brecha en automatización de oficinas y capacidad de auto-iteración. Según la misma publicación del blog técnico de MiniMax, M2.7 obtuvo un ELO 1495 en GDPval-AA (Evaluación de Procesamiento de Documentos de Oficina), ocupando el primer lugar entre los modelos de código abierto, y mantuvo una tasa de cumplimiento de habilidades del 97% en la prueba MM-Claw que cubre más de 40 habilidades complejas.
Cuatro versiones en cinco meses
No solo los caminos técnicos de las dos empresas son diferentes, sino que sus ritmos de iteración también son completamente diferentes.
Según los registros de lanzamiento público, desde el lanzamiento de M2 en octubre de 2025 hasta el lanzamiento de M2.7 en marzo de 2026, MiniMax iteró cuatro versiones en cinco meses, con un promedio de una versión importante cada 49 días. La brecha entre M2.5 y M2.7 fue de solo unos 30 días.
El ritmo de Xiaomi MiMo es diferente: MiMo-7B se lanzó en abril de 2025 (un modelo de inferencia de código abierto con 7B parámetros), V2-Flash se lanzó en diciembre del mismo año (con 309B parámetros totales), y V2-Pro se lanzó en marzo de 2026 (con 1T parámetros totales). La escala de parámetros entre cada generación es mucho mayor, pero los intervalos entre versiones también son más largos.
MiniMax optó por pasos pequeños y frecuentes, con cada iteración sin dar grandes saltos, pero a una frecuencia muy alta. El mecanismo auto-iterativo de M2.7 está diseñado para una "evolución continua". Xiaomi optó por un enfoque más impactante, con cada versión que presenta cambios significativos en la escala de parámetros y la arquitectura.

Anónimo 8 Días, Summit OpenRouter
Además de la hoja de ruta técnica, la estrategia de lanzamiento de Xiaomi también ha roto las convenciones de la industria.
Según Reuters, el 11 de marzo, un modelo anónimo llamado Hunter Alpha apareció en la plataforma de agregación de API más grande del mundo, OpenRouter. Sin aval de marca, sin evento de lanzamiento de producto, sin blog técnico. Su precio de API era extremadamente bajo, sin embargo, su rendimiento fue sorprendentemente fuerte.
La comunidad comenzó a especular sobre sus orígenes. Según Republic World y varios informes de medios tecnológicos, la especulación más generalizada fue DeepSeek V4, ya que el líder del equipo MiMo, Luo Fuli, había trabajado anteriormente en investigaciones en DeepSeek. El número de llamadas a la API se disparó rápidamente, con un número total de llamadas durante el período anónimo que superó los 1 billón de tokens, alcanzando la cima de las clasificaciones semanales de OpenRouter.

A primera hora del 19 de marzo, Xiaomi reveló: Hunter Alpha es, de hecho, MiMo-V2-Pro. Según el mismo informe de Reuters, las acciones de Xiaomi en Hong Kong se dispararon un 5,8 % tras la revelación.
Esta es la primera vez que un modelo nacional a gran escala se ha demostrado en una plataforma global mediante pruebas puramente a ciegas. Sin depender de la marca, sin depender de la publicidad, se tardaron 8 días en dejar que los desarrolladores votaran con sus acciones.
Te puede gustar

La IA empieza a revolucionar el sector manufacturero | Rewire News, edición matutina

Cuando la escalabilidad se encuentra con la velocidad, la Fundación Ethereum introduce la "dureza" para proteger la capa base

Google, Circle y Stripe se alían para permitir que la IA gaste dinero: Las alegrías y preocupaciones de los gigantes de los pagos en el primer trimestre de 2026

Compra de una fábrica por valor de 100 000 millones de dólares: Bezos y el capital de Oriente Medio desvían la inversión en IA de la nube hacia la planta de producción

La predicción de los mercados ha acaparado la atención, pero la plataforma de intercambio descentralizada Perp DEX ha estado librando una guerra silenciosa contra las bolsas tradicionales.

¿Sigue generando millones al día la caída del mercado? ¿Son reales los ingresos de pump.fun?

Comprender x402 y MPP en un solo artículo: Las dos vías de pago a los agentes

Una rápida mirada a los últimos 18 proyectos de graduación de Alliance: ¿Quién es el próximo Pump.fun?

No es solo el mercado de predicciones el que se beneficia de la guerra de Irak

¿El 99% de los tokens van a cero?

Diálogo de Vitalik en Chiang Mai: La explosión de la inteligencia artificial, ¿por qué debería luchar el cripto?

La "tarjeta bancaria" de la IA ha llamado la atención de los gigantes

Noticias de la mañana | EE. UU. La SEC aprueba el comercio tokenizado en Nasdaq; Animoca Brands anuncia una inversión en tokens AVAX; Algorand Foundation completa la integración estratégica

La última entrevista del CEO de Circle: Las stablecoins no son criptomonedas
En 2025, Circle llevó a cabo un IPO exitoso y sigue siendo un actor destacado en la industria…

Arranca NVIDIA GTC la Próxima Semana con 30,000 Asistentes de 190 Países y Más de Mil Sesiones
Del 16 al 19 de marzo, se celebra NVIDIA GTC 2026 en San José, con más de 30,000…

¿Qué ventajas competitivas seguirán siendo defendibles en la era de la IA?
La capacidad de la IA para escribir código representa un cambio estructural inevitable en la industria del software…

Fuentes Dicen que EE. UU. e Irán No Cederán, el Conflicto en Medio Oriente Podría Prolongarse
La administración Trump ha rechazado esfuerzos diplomáticos para terminar la guerra con Irán, lo que indica una guerra…

Aave Introducirá la Función de Escudo Aave para Bloquear Impactos de Precio Excesivos
Aave lanza la función de Escudo Aave para evitar operaciones con impactos de precio superiores al 25%. Un…