Nueva Versión de Mistral AI Supera a Claude 3.7 y Llama 4 a un Precio Imbatible
By: decrypt|2025/05/11 04:30:12
0
Compartir
Nueva Versión de Mistral AI Supera a Claude 3.7 y Llama 4 a un Precio Imbatible Mistral Medium 3 ofrece un rendimiento de gama alta, es lo suficientemente económico para abrirse camino en el software empresarial y supera a los principales competidores. En Resumen Mistral lanzó Medium 3 con rendimiento empresarial y costos ocho veces menores que modelos similares. Evaluaciones lo posicionaron por encima de Llama 4 Maverick y a la par de Claude Sonnet 3.7 en tareas profesionales. Aunque cerrado, Medium 3 ya se usa en sectores clave y llegará a más plataformas como IBM WatsonX y Google Cloud. Decrypt’s Art, Fashion, and Entertainment Hub. Mistral Medium 3 se lanzó ayer, posicionándose como un desafío directo a la economía del despliegue de IA empresarial. La startup parisina, fundada en 2023 por antiguos investigadores de Google DeepMind y Meta AI, lanzó lo que afirma ofrece un rendimiento de vanguardia a un octavo del costo operativo de modelos comparables. "Mistral Medium 3 ofrece un rendimiento de vanguardia, siendo [...] menos costoso", dijo la compañía. El modelo representa la oferta propietaria más potente de Mistral AI hasta la fecha, distinguiéndose de un portafolio de código abierto que incluye Mistral 7B, Mixtral, Codestral y Pixtral. Con $0,4 por millones de tokens de entrada y $2 por millón de tokens de salida, Medium 3 reduce significativamente los costos frente a sus competidores mientras mantiene la paridad de rendimiento. Evaluaciones independientes de Artificial Analysis posicionaron al modelo "entre los principales modelos sin razonamiento, rivalizando Medium 3 con Llama 4 Maverick, Gemini 2.0 Flash y Claude 3.7 Sonnet". Mistral Medium 3 independent evals: Mistral is back amongst the leading non-reasoning models with Medium 3 rivalling Llama 4 Maverick, Gemini 2.0 Flash and Claude 3.7 Sonnet Key takeaways: ➤ Intelligence: We see substantial intelligence gains across all 7 of our evals compared... pic.twitter.com/mc9il9WV8J — Artificial Analysis (@ArtificialAnlys) May 8, 2025 El modelo destaca particularmente en dominios profesionales. Evaluaciones humanas demostraron un rendimiento superior en tareas de codificación, con Sophia Yang, representante de Mistral AI, señalando que "Mistral Medium 3 brilla en el dominio de la codificación y ofrece un rendimiento mucho mejor, en general, que algunos de sus competidores mucho más grandes". Los resultados de las pruebas indican que Medium 3 se desempeña igual o por encima de Claude Sonnet 3.7 de Anthropic en diversas categorías de prueba, mientras supera sustancialmente a Llama 4 Maverick de Meta y Command A de Cohere en áreas especializadas como codificación y razonamiento. La ventana de contexto de 128.000 tokens del modelo es estándar, y su multimodalidad le permite procesar documentos y entradas visuales en 40 idiomas. Pero a diferencia de los modelos que hicieron famoso a Mistral, los usuarios no podrán modificarlo ni ejecutarlo localmente. Actualmente, la mejor fuente para entusiastas del código abierto es Mixtral-8x22B-v0.3 , un modelo de mezcla de expertos que ejecuta 8 expertos de 22.000 millones de parámetros cada uno. Además de Mixtral, la compañía tiene más de una docena de diferentes modelos de código abierto disponibles. También está inicialmente disponible para despliegue empresarial y no para uso doméstico a través de LeChat, la interfaz de chatbot de Mistral. Mistral AI enfatizó las capacidades de adaptación empresarial del modelo, que admite preentrenamiento continuo, ajuste completo e integración en bases de conocimiento corporativas para aplicaciones específicas de dominio. Clientes beta de los sectores de servicios financieros, energía y salud están probando el modelo para mejorar el servicio al cliente, personalizar procesos comerciales y analizar conjuntos de datos complejos. La API se lanzará inmediatamente en Mistral La Plateforme y Amazon Sagemaker, con una próxima integración planificada para IBM WatsonX, NVIDIA NIM, Azure AI Foundry y Google Cloud Vertex. El anuncio generó un considerable debate en las plataformas de redes sociales, con investigadores de IA elogiando el avance en eficiencia de costos mientras señalaban la naturaleza propietaria como una posible limitación. El estado de código cerrado del modelo marca una desviación de las ofertas de peso abierto de Mistral, aunque la compañía insinuó futuros lanzamientos. "Con los lanzamientos de Mistral Small en marzo y Mistral Medium hoy, no es un secreto que estamos trabajando en algo 'grande' durante las próximas semanas", insinuó Sophia Yang, Jefa de Relaciones con Desarrolladores de Mistral, en el anuncio. "Con incluso nuestro modelo de tamaño medio siendo rotundamente mejor que los modelos de código abierto emblemáticos como Llama 4 Maverick, estamos emocionados por 'abrir' lo que está por venir". Mistral tiende a alucinar menos que el modelo promedio, lo cual es una excelente noticia considerando su tamaño. Es mejor que Meta Llama-4 Maverick, Deepseek V3 y Amazon Nova Pro, por nombrar algunos. En este momento, el modelo que tiene menos alucinaciones es el recientemente lanzado Gemini 2.5 Pro de Google. Este lanzamiento llega en medio de un impresionante crecimiento comercial para la compañía parisina, a pesar de haber estado en silencio desde el lanzamiento de Mistral Large 2 el año pasado. Mistral lanzó recientemente una versión empresarial de su chatbot Le Chat que se integra con Microsoft SharePoint y Google Drive, con el CEO Arthur Mensch diciendo a Reuters que han "triplicado (su) negocio en los últimos 100 días, en particular en Europa y fuera de EE.UU." La compañía, ahora valorada en $6.000 millones, está flexionando su independencia tecnológica operando su propia infraestructura de cómputo y reduciendo la dependencia de proveedores de nube estadounidenses—un movimiento estratégico que resuena en Europa en medio de relaciones tensas tras los aranceles del Presidente Trump sobre productos tecnológicos. Queda por ver si la afirmación de Mistral de lograr un rendimiento de nivel empresarial a precios accesibles para el consumidor se mantiene en el despliegue del mundo real. Pero por ahora, Mistral ha posicionado Medium 3 como un punto medio convincente en una industria que a menudo asume que más grande (y más caro) equivale a mejor. Editado por Josh Quittner y Sebastian Sinclair Generally Intelligent Newsletter
También te puede interesar

El momento de pago de los agentes de IA: ¿Quién se convertirá en el Stripe de la economía de las máquinas?
La infraestructura criptográfica y las organizaciones de tarjetas no son mutuamente excluyentes; el ganador será la pasarela unificada que conecte ambas vías simultáneamente.

Reporte matutino | MoonPay adquiere la capa de ejecución de Solana, DFlow; Strategy publica su informe financiero del primer trimestre; Manta Network anuncia el fin de su programa de staking
Resumen de los eventos importantes del mercado el 6 de mayo

Pistas alquiladas: ¿Qué está pagando realmente esta ola de dinero caliente de divisas en stablecoins?
Lo que realmente se está revalorizando en el mercado es la capa intermedia entre los emisores de stablecoins y la economía real: la capa de transacciones.

Dialogue Velocity Eric: ¿Cuál es la ruta de las stablecoins que realmente busca el director financiero?
Exejecutivo estratégico de Worldpay ingresa al espacio cripto: Revela cómo Velocity aborda los problemas más complejos del director financiero (CFO) en cuanto a liquidación transfronteriza y fondos ociosos mediante "cuentas de pago de stablecoins".

La estrategia debió aclarar que no se descarta la venta de monedas
Si Saylor vende sus monedas, ¿se desplomará el mercado de criptomonedas?

¿Cómo logró MegaETH un TVL de 700 millones en una semana tras su TGE? Analizando la estrategia de empaquetamiento
MegaETH creó un volante de inercia con USDm, con el objetivo de atraer a un gran número de usuarios y fondos a corto plazo.

Horario de trading de futuros: opere con criptomonedas 24/7 y obtenga hasta un 45% de reembolso en comisiones
Conozca el horario de trading de futuros y el mejor momento para operar con futuros de criptomonedas. Descubra información sobre el mercado 24/7, las sesiones de mayor actividad y cómo recuperar hasta el 45% de sus comisiones.

¿Por qué a16z Crypto está recaudando otros $2,200 millones para invertir fuertemente en Web3?
Esta ronda de financiamiento apuesta por la transición de las criptomonedas desde la fase de desarrollo de infraestructura hacia la fase de adopción real por parte de los usuarios. Ya sea enfocándose en criptomonedas o incursionando en la IA, este capital real solo fluirá hacia aquellos lugares capaces de convertir la tecnología en productos.

Explicación del algoritmo subyacente de Polymarket
Puede que sea el único artículo en Twitter que explica claramente todo el diseño subyacente de Polymarket en lenguaje sencillo.

¿Qué hacen los proyectos que nacen en el mercado bajista de las criptomonedas?
De enero a abril, RootData ha registrado más de 1,070 nuevos proyectos, una disminución de aproximadamente el 32% en comparación con el mismo periodo del año pasado.

Conferencia del fundador de a16z en Stanford: Siempre que Wall Street y Silicon Valley tienen ideas diferentes, es Wall Street quien termina estando equivocado
Ben Horowitz, cofundador de a16z, dio una charla impactante: los dos fosos tradicionales del software en la era de la IA han desaparecido, y los emprendedores deben buscar "nuevas barreras" más allá del código y la interfaz de usuario.

Michael Saylor: Tras tres trimestres consecutivos de pérdidas, Strategy venderá Bitcoin para pagar dividendos
Tras el informe financiero de MSTR que mostró pérdidas netas continuas, Saylor cambió su postura: Bitcoin ya no es un activo que "nunca se venderá" y puede utilizarse como herramienta de pago.

La estación de peaje en Ormuz y el renminbi que no se puede comprar
El desorden del dólar estadounidense está dando lugar a una nueva situación en la liquidación global: el oro se está redefiniendo como un "puente", el sistema CIPS se está expandiendo rápidamente y los fondos globales están abriendo silenciosamente un nuevo canal para el renminbi, que es "difícil de obtener".

Entrevista con el jefe de estrategia de Coinbase Institutional: La institucionalización de las criptomonedas llega a un punto crítico
Ejecutivos de Coinbase ofrecen un análisis profundo: sin inmutarse por el pánico del mercado a corto plazo, las instituciones están acelerando su entrada, y la tokenización junto con el "exchange de todo" está a punto de reconstruir por completo la infraestructura financiera global.

Diálogo con el CEO de Agora, Nick: La batalla por las licencias de stablecoins apenas comienza
Agora da un paso al frente: solicita oficialmente una licencia de banco fiduciario federal en Estados Unidos, pasando de ser un emisor de stablecoins a una "infraestructura financiera subyacente", con el objetivo de conquistar el mercado multimillonario de pagos empresariales y liquidaciones B2B.

¿Cómo hacer un saldo entre riesgo y retorno en los rendimientos DeFi?
¿Estos rendimientos han sido razonables alguna vez? ¿Alguna vez recibimos la compensación que merecemos por los riesgos asumidos en DeFi y dónde se deben establecer los spreads futuros?

La tesis de Tom Lee sobre Ethereum: Por qué el hombre que acertó el último ciclo está apostando fuerte por Bitmine
Tom Lee se está convirtiendo en uno de los defensores más influyentes de Ethereum. Desde Fundstrat hasta Bitmine, su análisis sobre Ethereum combina el rendimiento del staking, la acumulación de activos y el valor a largo plazo de la red. He aquí por qué «Tom Lee Ethereum» se ha convertido en uno de los temas más seguidos del mundo de las criptomonedas.

Naval sube personalmente al escenario: El histórico choque entre la gente común y el capital de riesgo.
Naval asumió personalmente la presidencia del Comité de Inversiones de USVC. Este fondo, registrado ante la SEC y lanzado por AngelList, busca acercar al público general los principales activos tecnológicos privados como OpenAI, Anthropic y xAI, con un umbral de entrada de 500 dólares. No se trata solo de un nuevo fondo, sino de una experiencia estructural...
El momento de pago de los agentes de IA: ¿Quién se convertirá en el Stripe de la economía de las máquinas?
La infraestructura criptográfica y las organizaciones de tarjetas no son mutuamente excluyentes; el ganador será la pasarela unificada que conecte ambas vías simultáneamente.
Reporte matutino | MoonPay adquiere la capa de ejecución de Solana, DFlow; Strategy publica su informe financiero del primer trimestre; Manta Network anuncia el fin de su programa de staking
Resumen de los eventos importantes del mercado el 6 de mayo
Pistas alquiladas: ¿Qué está pagando realmente esta ola de dinero caliente de divisas en stablecoins?
Lo que realmente se está revalorizando en el mercado es la capa intermedia entre los emisores de stablecoins y la economía real: la capa de transacciones.
Dialogue Velocity Eric: ¿Cuál es la ruta de las stablecoins que realmente busca el director financiero?
Exejecutivo estratégico de Worldpay ingresa al espacio cripto: Revela cómo Velocity aborda los problemas más complejos del director financiero (CFO) en cuanto a liquidación transfronteriza y fondos ociosos mediante "cuentas de pago de stablecoins".
La estrategia debió aclarar que no se descarta la venta de monedas
Si Saylor vende sus monedas, ¿se desplomará el mercado de criptomonedas?
¿Cómo logró MegaETH un TVL de 700 millones en una semana tras su TGE? Analizando la estrategia de empaquetamiento
MegaETH creó un volante de inercia con USDm, con el objetivo de atraer a un gran número de usuarios y fondos a corto plazo.
Atención al cliente:@weikecs
Cooperación empresarial:@weikecs
Trading cuantitativo y MM:[email protected]
Programa VIP:[email protected]





