Nueva Versión de Mistral AI Supera a Claude 3.7 y Llama 4 a un Precio Imbatible

By: decrypt|2025/05/11 04:30:12

Nueva Versión de Mistral AI Supera a Claude 3.7 y Llama 4 a un Precio Imbatible Mistral Medium 3 ofrece un rendimiento de gama alta, es lo suficientemente económico para abrirse camino en el software empresarial y supera a los principales competidores. En Resumen Mistral lanzó Medium 3 con rendimiento empresarial y costos ocho veces menores que modelos similares. Evaluaciones lo posicionaron por encima de Llama 4 Maverick y a la par de Claude Sonnet 3.7 en tareas profesionales. Aunque cerrado, Medium 3 ya se usa en sectores clave y llegará a más plataformas como IBM WatsonX y Google Cloud. Decrypt’s Art, Fashion, and Entertainment Hub. Mistral Medium 3 se lanzó ayer, posicionándose como un desafío directo a la economía del despliegue de IA empresarial. La startup parisina, fundada en 2023 por antiguos investigadores de Google DeepMind y Meta AI, lanzó lo que afirma ofrece un rendimiento de vanguardia a un octavo del costo operativo de modelos comparables. "Mistral Medium 3 ofrece un rendimiento de vanguardia, siendo [...] menos costoso", dijo la compañía. El modelo representa la oferta propietaria más potente de Mistral AI hasta la fecha, distinguiéndose de un portafolio de código abierto que incluye Mistral 7B, Mixtral, Codestral y Pixtral. Con $0,4 por millones de tokens de entrada y $2 por millón de tokens de salida, Medium 3 reduce significativamente los costos frente a sus competidores mientras mantiene la paridad de rendimiento. Evaluaciones independientes de Artificial Analysis posicionaron al modelo "entre los principales modelos sin razonamiento, rivalizando Medium 3 con Llama 4 Maverick, Gemini 2.0 Flash y Claude 3.7 Sonnet". Mistral Medium 3 independent evals: Mistral is back amongst the leading non-reasoning models with Medium 3 rivalling Llama 4 Maverick, Gemini 2.0 Flash and Claude 3.7 Sonnet Key takeaways: ➤ Intelligence: We see substantial intelligence gains across all 7 of our evals compared... pic.twitter.com/mc9il9WV8J — Artificial Analysis (@ArtificialAnlys) May 8, 2025 El modelo destaca particularmente en dominios profesionales. Evaluaciones humanas demostraron un rendimiento superior en tareas de codificación, con Sophia Yang, representante de Mistral AI, señalando que "Mistral Medium 3 brilla en el dominio de la codificación y ofrece un rendimiento mucho mejor, en general, que algunos de sus competidores mucho más grandes". Los resultados de las pruebas indican que Medium 3 se desempeña igual o por encima de Claude Sonnet 3.7 de Anthropic en diversas categorías de prueba, mientras supera sustancialmente a Llama 4 Maverick de Meta y Command A de Cohere en áreas especializadas como codificación y razonamiento. La ventana de contexto de 128.000 tokens del modelo es estándar, y su multimodalidad le permite procesar documentos y entradas visuales en 40 idiomas. Pero a diferencia de los modelos que hicieron famoso a Mistral, los usuarios no podrán modificarlo ni ejecutarlo localmente. Actualmente, la mejor fuente para entusiastas del código abierto es Mixtral-8x22B-v0.3 , un modelo de mezcla de expertos que ejecuta 8 expertos de 22.000 millones de parámetros cada uno. Además de Mixtral, la compañía tiene más de una docena de diferentes modelos de código abierto disponibles. También está inicialmente disponible para despliegue empresarial y no para uso doméstico a través de LeChat, la interfaz de chatbot de Mistral. Mistral AI enfatizó las capacidades de adaptación empresarial del modelo, que admite preentrenamiento continuo, ajuste completo e integración en bases de conocimiento corporativas para aplicaciones específicas de dominio. Clientes beta de los sectores de servicios financieros, energía y salud están probando el modelo para mejorar el servicio al cliente, personalizar procesos comerciales y analizar conjuntos de datos complejos. La API se lanzará inmediatamente en Mistral La Plateforme y Amazon Sagemaker, con una próxima integración planificada para IBM WatsonX, NVIDIA NIM, Azure AI Foundry y Google Cloud Vertex. El anuncio generó un considerable debate en las plataformas de redes sociales, con investigadores de IA elogiando el avance en eficiencia de costos mientras señalaban la naturaleza propietaria como una posible limitación. El estado de código cerrado del modelo marca una desviación de las ofertas de peso abierto de Mistral, aunque la compañía insinuó futuros lanzamientos. "Con los lanzamientos de Mistral Small en marzo y Mistral Medium hoy, no es un secreto que estamos trabajando en algo 'grande' durante las próximas semanas", insinuó Sophia Yang, Jefa de Relaciones con Desarrolladores de Mistral, en el anuncio. "Con incluso nuestro modelo de tamaño medio siendo rotundamente mejor que los modelos de código abierto emblemáticos como Llama 4 Maverick, estamos emocionados por 'abrir' lo que está por venir". Mistral tiende a alucinar menos que el modelo promedio, lo cual es una excelente noticia considerando su tamaño. Es mejor que Meta Llama-4 Maverick, Deepseek V3 y Amazon Nova Pro, por nombrar algunos. En este momento, el modelo que tiene menos alucinaciones es el recientemente lanzado Gemini 2.5 Pro de Google. Este lanzamiento llega en medio de un impresionante crecimiento comercial para la compañía parisina, a pesar de haber estado en silencio desde el lanzamiento de Mistral Large 2 el año pasado. Mistral lanzó recientemente una versión empresarial de su chatbot Le Chat que se integra con Microsoft SharePoint y Google Drive, con el CEO Arthur Mensch diciendo a Reuters que han "triplicado (su) negocio en los últimos 100 días, en particular en Europa y fuera de EE.UU." La compañía, ahora valorada en $6.000 millones, está flexionando su independencia tecnológica operando su propia infraestructura de cómputo y reduciendo la dependencia de proveedores de nube estadounidenses—un movimiento estratégico que resuena en Europa en medio de relaciones tensas tras los aranceles del Presidente Trump sobre productos tecnológicos. Queda por ver si la afirmación de Mistral de lograr un rendimiento de nivel empresarial a precios accesibles para el consumidor se mantiene en el despliegue del mundo real. Pero por ahora, Mistral ha posicionado Medium 3 como un punto medio convincente en una industria que a menudo asume que más grande (y más caro) equivale a mejor. Editado por Josh Quittner y Sebastian Sinclair Generally Intelligent Newsletter

Precio de --

También te puede interesar

El momento de pago de los agentes de IA: ¿Quién se convertirá en el Stripe de la economía de las máquinas?

La infraestructura criptográfica y las organizaciones de tarjetas no son mutuamente excluyentes; el ganador será la pasarela unificada que conecte ambas vías simultáneamente.

Reporte matutino | MoonPay adquiere la capa de ejecución de Solana, DFlow; Strategy publica su informe financiero del primer trimestre; Manta Network anuncia el fin de su programa de staking

Resumen de los eventos importantes del mercado el 6 de mayo

Pistas alquiladas: ¿Qué está pagando realmente esta ola de dinero caliente de divisas en stablecoins?

Lo que realmente se está revalorizando en el mercado es la capa intermedia entre los emisores de stablecoins y la economía real: la capa de transacciones.

Dialogue Velocity Eric: ¿Cuál es la ruta de las stablecoins que realmente busca el director financiero?

Exejecutivo estratégico de Worldpay ingresa al espacio cripto: Revela cómo Velocity aborda los problemas más complejos del director financiero (CFO) en cuanto a liquidación transfronteriza y fondos ociosos mediante "cuentas de pago de stablecoins".

La estrategia debió aclarar que no se descarta la venta de monedas

Si Saylor vende sus monedas, ¿se desplomará el mercado de criptomonedas?

¿Cómo logró MegaETH un TVL de 700 millones en una semana tras su TGE? Analizando la estrategia de empaquetamiento

MegaETH creó un volante de inercia con USDm, con el objetivo de atraer a un gran número de usuarios y fondos a corto plazo.

Horario de trading de futuros: opere con criptomonedas 24/7 y obtenga hasta un 45% de reembolso en comisiones

Conozca el horario de trading de futuros y el mejor momento para operar con futuros de criptomonedas. Descubra información sobre el mercado 24/7, las sesiones de mayor actividad y cómo recuperar hasta el 45% de sus comisiones.

¿Por qué a16z Crypto está recaudando otros $2,200 millones para invertir fuertemente en Web3?

Esta ronda de financiamiento apuesta por la transición de las criptomonedas desde la fase de desarrollo de infraestructura hacia la fase de adopción real por parte de los usuarios. Ya sea enfocándose en criptomonedas o incursionando en la IA, este capital real solo fluirá hacia aquellos lugares capaces de convertir la tecnología en productos.

Explicación del algoritmo subyacente de Polymarket

Puede que sea el único artículo en Twitter que explica claramente todo el diseño subyacente de Polymarket en lenguaje sencillo.

¿Qué hacen los proyectos que nacen en el mercado bajista de las criptomonedas?

De enero a abril, RootData ha registrado más de 1,070 nuevos proyectos, una disminución de aproximadamente el 32% en comparación con el mismo periodo del año pasado.

Conferencia del fundador de a16z en Stanford: Siempre que Wall Street y Silicon Valley tienen ideas diferentes, es Wall Street quien termina estando equivocado

Ben Horowitz, cofundador de a16z, dio una charla impactante: los dos fosos tradicionales del software en la era de la IA han desaparecido, y los emprendedores deben buscar "nuevas barreras" más allá del código y la interfaz de usuario.

Michael Saylor: Tras tres trimestres consecutivos de pérdidas, Strategy venderá Bitcoin para pagar dividendos

Tras el informe financiero de MSTR que mostró pérdidas netas continuas, Saylor cambió su postura: Bitcoin ya no es un activo que "nunca se venderá" y puede utilizarse como herramienta de pago.

La estación de peaje en Ormuz y el renminbi que no se puede comprar

El desorden del dólar estadounidense está dando lugar a una nueva situación en la liquidación global: el oro se está redefiniendo como un "puente", el sistema CIPS se está expandiendo rápidamente y los fondos globales están abriendo silenciosamente un nuevo canal para el renminbi, que es "difícil de obtener".

Entrevista con el jefe de estrategia de Coinbase Institutional: La institucionalización de las criptomonedas llega a un punto crítico

Ejecutivos de Coinbase ofrecen un análisis profundo: sin inmutarse por el pánico del mercado a corto plazo, las instituciones están acelerando su entrada, y la tokenización junto con el "exchange de todo" está a punto de reconstruir por completo la infraestructura financiera global.

Diálogo con el CEO de Agora, Nick: La batalla por las licencias de stablecoins apenas comienza

Agora da un paso al frente: solicita oficialmente una licencia de banco fiduciario federal en Estados Unidos, pasando de ser un emisor de stablecoins a una "infraestructura financiera subyacente", con el objetivo de conquistar el mercado multimillonario de pagos empresariales y liquidaciones B2B.

¿Cómo hacer un saldo entre riesgo y retorno en los rendimientos DeFi?

¿Estos rendimientos han sido razonables alguna vez? ¿Alguna vez recibimos la compensación que merecemos por los riesgos asumidos en DeFi y dónde se deben establecer los spreads futuros?

La tesis de Tom Lee sobre Ethereum: Por qué el hombre que acertó el último ciclo está apostando fuerte por Bitmine

Tom Lee se está convirtiendo en uno de los defensores más influyentes de Ethereum. Desde Fundstrat hasta Bitmine, su análisis sobre Ethereum combina el rendimiento del staking, la acumulación de activos y el valor a largo plazo de la red. He aquí por qué «Tom Lee Ethereum» se ha convertido en uno de los temas más seguidos del mundo de las criptomonedas.

Naval sube personalmente al escenario: El histórico choque entre la gente común y el capital de riesgo.

Naval asumió personalmente la presidencia del Comité de Inversiones de USVC. Este fondo, registrado ante la SEC y lanzado por AngelList, busca acercar al público general los principales activos tecnológicos privados como OpenAI, Anthropic y xAI, con un umbral de entrada de 500 dólares. No se trata solo de un nuevo fondo, sino de una experiencia estructural...

El momento de pago de los agentes de IA: ¿Quién se convertirá en el Stripe de la economía de las máquinas?

La infraestructura criptográfica y las organizaciones de tarjetas no son mutuamente excluyentes; el ganador será la pasarela unificada que conecte ambas vías simultáneamente.

Reporte matutino | MoonPay adquiere la capa de ejecución de Solana, DFlow; Strategy publica su informe financiero del primer trimestre; Manta Network anuncia el fin de su programa de staking

Resumen de los eventos importantes del mercado el 6 de mayo

Contenido

Monedas populares

Últimas noticias sobre criptomonedas

02:43

Data: If BTC falls below 73,673 USD, the cumulative long liquidation intensity on major CEXs will reach 1.213 billion USD

According to Coinglass data, if BTC falls below $73,673, the cumulative long liquidation intensity on mainstream CEX will reach $1.213 billion. Conversely, if BTC breaks above $80,807, the cumulative short liquidation intensity on mainstream CEX will reach $1.048 billion.

02:43

Data: If ETH falls below $2,028, the cumulative long liquidation intensity on mainstream CEX will reach $930 million

According to Coinglass data, if ETH falls below $2,028, the cumulative long liquidation intensity on mainstream CEX will reach $930 million. Conversely, if ETH breaks above $2,233, the cumulative short liquidation intensity on mainstream CEX will reach $695 million.

02:42

Nueva Versión de Mistral AI Supera a Claude 3.7 y Llama 4 a un Precio Imbatible

Precio de --

También te puede interesar

El momento de pago de los agentes de IA: ¿Quién se convertirá en el Stripe de la economía de las máquinas?

Reporte matutino | MoonPay adquiere la capa de ejecución de Solana, DFlow; Strategy publica su informe financiero del primer trimestre; Manta Network anuncia el fin de su programa de staking

Pistas alquiladas: ¿Qué está pagando realmente esta ola de dinero caliente de divisas en stablecoins?

Dialogue Velocity Eric: ¿Cuál es la ruta de las stablecoins que realmente busca el director financiero?

La estrategia debió aclarar que no se descarta la venta de monedas

¿Cómo logró MegaETH un TVL de 700 millones en una semana tras su TGE? Analizando la estrategia de empaquetamiento

Horario de trading de futuros: opere con criptomonedas 24/7 y obtenga hasta un 45% de reembolso en comisiones

¿Por qué a16z Crypto está recaudando otros $2,200 millones para invertir fuertemente en Web3?

Explicación del algoritmo subyacente de Polymarket

¿Qué hacen los proyectos que nacen en el mercado bajista de las criptomonedas?

Conferencia del fundador de a16z en Stanford: Siempre que Wall Street y Silicon Valley tienen ideas diferentes, es Wall Street quien termina estando equivocado

Michael Saylor: Tras tres trimestres consecutivos de pérdidas, Strategy venderá Bitcoin para pagar dividendos

La estación de peaje en Ormuz y el renminbi que no se puede comprar

Entrevista con el jefe de estrategia de Coinbase Institutional: La institucionalización de las criptomonedas llega a un punto crítico

Diálogo con el CEO de Agora, Nick: La batalla por las licencias de stablecoins apenas comienza

¿Cómo hacer un saldo entre riesgo y retorno en los rendimientos DeFi?

La tesis de Tom Lee sobre Ethereum: Por qué el hombre que acertó el último ciclo está apostando fuerte por Bitmine

Naval sube personalmente al escenario: El histórico choque entre la gente común y el capital de riesgo.

El momento de pago de los agentes de IA: ¿Quién se convertirá en el Stripe de la economía de las máquinas?

Reporte matutino | MoonPay adquiere la capa de ejecución de Solana, DFlow; Strategy publica su informe financiero del primer trimestre; Manta Network anuncia el fin de su programa de staking

Pistas alquiladas: ¿Qué está pagando realmente esta ola de dinero caliente de divisas en stablecoins?

Dialogue Velocity Eric: ¿Cuál es la ruta de las stablecoins que realmente busca el director financiero?

La estrategia debió aclarar que no se descarta la venta de monedas

¿Cómo logró MegaETH un TVL de 700 millones en una semana tras su TGE? Analizando la estrategia de empaquetamiento

Contenido

Monedas populares

Últimas noticias sobre criptomonedas

Data: If BTC falls below 73,673 USD, the cumulative long liquidation intensity on major CEXs will reach 1.213 billion USD

Data: If ETH falls below $2,028, the cumulative long liquidation intensity on mainstream CEX will reach $930 million

The Federal Reserve's meeting minutes show that nearly all participants support keeping interest rates unchanged

The Federal Reserve's meeting minutes indicate a slightly strong economic outlook

Federal Reserve meeting minutes, Middle East conflict may affect policy path