Xiaomi y MiniMax desatan sus movimientos finales, lo que señala el inicio de la Guerra de Precios de Agencias.

By: blockbeats|2026/03/20 13:29:57

vibe

codex

opus-2

El 18 y 19 de marzo, dos empresas chinas lanzaron sucesivamente sus respectivos grandes modelos orientados a Agencias. La startup de IA nacional MiniMax lanzó M2.7, y el equipo de grandes modelos de Xiaomi MiMo presentó V2-Pro. Ambos modelos entraron en el primer nivel mundial en el benchmark de Agencias, pero sus precios de salida de API son 1/21 y 1/8 de Claude Opus 4.6, respectivamente.

Ambas empresas jugaron sus cartas en la misma semana, pero con cartas completamente diferentes. Representan dos caminos técnicos completamente diferentes, apostando por dos futuros de la era de los agentes.

Matrícula del mismo examen, 1/17

Primero, veamos la comparación más intuitiva.

Xiaomi y MiniMax desatan sus movimientos finales, lo que señala el inicio de la Guerra de Precios de Agencias.

Según OpenRouter y varias páginas oficiales de precios de la empresa, basándose en el precio de salida de la API (por millón de tokens), MiniMax M2.7 es de $1.2, y MiMo-V2-Pro es de $3. Como referencia, el precio de salida de Claude Opus 4.6 es de $25, GPT-5.2 es de $14 y Claude Sonnet 4.6 es de $15.

La diferencia de precio es un orden de magnitud, pero la diferencia de rendimiento no lo es. En SWE-bench Verified (el benchmark actual más utilizado para medir la capacidad de ingeniería de código), MiMo-V2-Pro obtuvo un 78%, Sonnet 4.6 fue del 79,6%, una diferencia de menos de dos puntos porcentuales. La puntuación de M2.7 en SWE-Pro es del 56,22%, a la par con GPT-5.3-Codex. En VIBE-Pro (capacidad de entrega de proyectos de extremo a extremo), M2.7 obtuvo un 55,6%, acercándose al nivel de Opus 4.6.

El enfoque de este gráfico no es quién está más alto o más bajo: los sistemas de referencia de varias empresas no están completamente alineados, por lo que las comparaciones directas deben ser cautelosas. El enfoque está en la "diferencia de tijeras de precio-rendimiento": los modelos de Agente domésticos se han ajustado a la misma banda de rendimiento, pero están en rangos de precios completamente diferentes.

Un billón de parámetros frente a. Autoevolución

El precio es solo la superficie. Las dos empresas han presentado dos conjuntos de cartas completamente diferentes.

MiMo-V2-Pro sigue la ruta de "ir a lo grande o no ir". Según el anuncio oficial de Xiaomi, V2-Pro tiene más de 1 billón de parámetros totales, 42B de parámetros de activación y admite un contexto ultra largo de 1 millón de tokens. Su innovación principal es el mecanismo de atención mixta Hybrid Attention, que ajusta la proporción de Sliding Window Attention (SWA) a Global Attention (GA) a 7:1, mientras que su predecesor V2-Flash era de 5:1. Esta arquitectura hace que el modelo sea más estable en escenarios donde se procesan documentos largos y se realizan múltiples llamadas de herramientas en paralelo en la escena del Agente. En PinchBench (capacidad de invocación de herramientas de agente), MiMo-V2-Pro obtuvo un 84%.

M2.7 tomó un camino completamente diferente. Según la publicación oficial del blog técnico de MiniMax del 18 de marzo, el número de parámetros de M2.7 no se reveló, pero demostró un mecanismo de "evolución auto-iterativa": el modelo ejecutó de forma autónoma más de 100 bucles de optimización, incluyendo el análisis de trayectorias de fallo, la planificación de modificaciones, la modificación de su propia arquitectura de código, la ejecución de evaluaciones y el bucle de nuevo, logrando finalmente una mejora del 30% en el rendimiento en un conjunto de evaluación interno. En el MLE Bench Lite (evaluación de la dificultad del concurso de aprendizaje automático), de 22 problemas difíciles, M2.7 obtuvo 9 medallas de oro, 5 de plata y 1 de bronce, con una tasa de medallas promedio del 66,6%.

De cinco dimensiones, los dos caminos apuntan en direcciones completamente diferentes: MiMo-V2-Pro domina claramente en longitud de contexto y dimensiones de ingeniería de código, mientras que M2.7 amplía la brecha en automatización de oficinas y capacidad de auto-iteración. Según la misma publicación del blog técnico de MiniMax, M2.7 obtuvo un ELO 1495 en GDPval-AA (Evaluación de Procesamiento de Documentos de Oficina), ocupando el primer lugar entre los modelos de código abierto, y mantuvo una tasa de cumplimiento de habilidades del 97% en la prueba MM-Claw que cubre más de 40 habilidades complejas.

Cuatro versiones en cinco meses

No solo los caminos técnicos de las dos empresas son diferentes, sino que sus ritmos de iteración también son completamente diferentes.

Según los registros de lanzamiento público, desde el lanzamiento de M2 en octubre de 2025 hasta el lanzamiento de M2.7 en marzo de 2026, MiniMax iteró cuatro versiones en cinco meses, con un promedio de una versión importante cada 49 días. La brecha entre M2.5 y M2.7 fue de solo unos 30 días.

El ritmo de Xiaomi MiMo es diferente: MiMo-7B se lanzó en abril de 2025 (un modelo de inferencia de código abierto con 7B parámetros), V2-Flash se lanzó en diciembre del mismo año (con 309B parámetros totales), y V2-Pro se lanzó en marzo de 2026 (con 1T parámetros totales). La escala de parámetros entre cada generación es mucho mayor, pero los intervalos entre versiones también son más largos.

MiniMax optó por pasos pequeños y frecuentes, con cada iteración sin dar grandes saltos, pero a una frecuencia muy alta. El mecanismo auto-iterativo de M2.7 está diseñado para una "evolución continua". Xiaomi optó por un enfoque más impactante, con cada versión que presenta cambios significativos en la escala de parámetros y la arquitectura.

Precio de --

Anónimo 8 Días, Summit OpenRouter

Además de la hoja de ruta técnica, la estrategia de lanzamiento de Xiaomi también ha roto las convenciones de la industria.

Según Reuters, el 11 de marzo, un modelo anónimo llamado Hunter Alpha apareció en la plataforma de agregación de API más grande del mundo, OpenRouter. Sin aval de marca, sin evento de lanzamiento de producto, sin blog técnico. Su precio de API era extremadamente bajo, sin embargo, su rendimiento fue sorprendentemente fuerte.

La comunidad comenzó a especular sobre sus orígenes. Según Republic World y varios informes de medios tecnológicos, la especulación más generalizada fue DeepSeek V4, ya que el líder del equipo MiMo, Luo Fuli, había trabajado anteriormente en investigaciones en DeepSeek. El número de llamadas a la API se disparó rápidamente, con un número total de llamadas durante el período anónimo que superó los 1 billón de tokens, alcanzando la cima de las clasificaciones semanales de OpenRouter.

A primera hora del 19 de marzo, Xiaomi reveló: Hunter Alpha es, de hecho, MiMo-V2-Pro. Según el mismo informe de Reuters, las acciones de Xiaomi en Hong Kong se dispararon un 5,8 % tras la revelación.

Esta es la primera vez que un modelo nacional a gran escala se ha demostrado en una plataforma global mediante pruebas puramente a ciegas. Sin depender de la marca, sin depender de la publicidad, se tardaron 8 días en dejar que los desarrolladores votaran con sus acciones.

Te puede gustar

IOSG Founder: Please tell Vitalik the truth, let the OGs who have enjoyed the industry's dividends enlighten the young people

The wage earners freeze to death on the road, the sellers of goods die of thirst on the way. The weavers of brocade wear coarse cloth, and the grain growers do not have enough to eat.

Morning Report | SpaceX reveals it holds approximately $1.45 billion in Bitcoin; Nvidia's Q1 financial report shows revenue of $81.6 billion; Manus plans to raise $1 billion for buyback business

Overview of Important Market Events on May 21

Insiders: DeepSeek is forming a Harness team to compete with Claude Code

DeepSeek Code is coming.

SpaceX officially submitted its prospectus, unveiling the largest IPO in history

SpaceX's public market debut could take place as early as June, making it the first in a series of giant IPOs from AI companies, with OpenAI and Anthropic also waiting for the right moment.

The financial changes under the new SEC regulations: Opportunities and regulatory red lines behind "tokenized stocks"

In-depth analysis of "tokenized stocks": The SEC's advancement of an innovation exemption framework has sparked heated discussions, revealing the real risks behind third-party "synthetic asset" certificates and 24/7 trading.

Blockchain Capital Partner: The structure of on-chain dual-layer capital is still in the early stages of value discovery

How can the on-chain economy build a capital structure that promotes open innovation while also considering institutional scale?

Secured over $60 million in funding from Dragonfly, Sequoia, and others, learn about the on-chain derivatives protocol Variational | CryptoSeed

What is the difference with Hyperliquid?

I tested with $10,000: zero wear and tear, annualized 8%, and can earn points (with complete tutorial + screenshots)

Perps DEX newcomer StandX launches native stablecoin DUSD, achieving a real APY of 8.46% with its innovative three-tier yield mechanism, breaking the 3% traditional stablecoin interest rate ceiling.

Morning Report | Deloitte acquires crypto infrastructure company Blocknative; stablecoin company Checker completes $8 million financing; a16z may have become the largest external institutional holder of HYPE

Overview of Important Market Events on May 20

Interpretation of xBubble SOP: Packaging Vibe Coding for non-technical users

DAPPOS has launched the low-threshold AI application xBubble, which innovatively automates the packaging of complex large model workflows with an SOP system, allowing users with no technical background to complete professional-level AI tasks with just one sentence.

From Followers to Price Setters: The Role of the Crypto Market is Reversing

The encryption platform successfully achieved precise pre-listing pricing on CBRS, indicating that Crypto is gradually transforming from a follower of traditional finance into a new pricing hub for global assets through innovative mechanisms.

a16z invested $356 million to aggressively acquire HYPE, surpassing Paradigm to become the largest external holding institution

Eight months later, the price of HYPE is approaching its previous high, and institutions like a16z, Goldman Sachs, and Grayscale are collectively taking action. What is their intention?

I’m sorry, but the information provided in your re…

I’m sorry, but the information provided in your request is incomplete or unclear. If you could provide specific…

Bitcoin Establece un Umbral Decisivo en 55,000 Dólares

Key Takeaways Precio Crítico de Bitcoin: El nivel de 55,000 dólares se presenta como decisivo para la futura…

# Outline

H1: El Impacto en Bitcoin: ¿Podría el Precio Descender a $55,000? Key Takeaways Análisis sobre la posible caída…

IOSG Founder: Please tell Vitalik the truth, let the OGs who have enjoyed the industry's dividends enlighten the young people

The wage earners freeze to death on the road, the sellers of goods die of thirst on the way. The weavers of brocade wear coarse cloth, and the grain growers do not have enough to eat.

Morning Report | SpaceX reveals it holds approximately $1.45 billion in Bitcoin; Nvidia's Q1 financial report shows revenue of $81.6 billion; Manus plans to raise $1 billion for buyback business

Overview of Important Market Events on May 21