Google officially declares war

By: rootdata|2026/05/22 03:45:00

Autor de este artículo: Chengbei XugongApoyo de datos: Gougu Big Data

La Conferencia de Desarrolladores Google I/O 2026 deja una impresión que se resume en dos palabras: arrogancia.

No solo han integrado a la perfección agentes de IA en todos los puntos de entrada de tráfico principales, como búsquedas, navegadores, teléfonos móviles y gafas inteligentes, sino que también han lanzado continuamente tres grandes innovaciones: Gemini 3.5 Flash, el modelo de vídeo Omni y el nuevo asistente de IA Spark.

Tras mostrar sus fortalezas, anunciaron con orgullo que los usuarios activos mensuales de Gemini superaron los 900 millones; también anunciaron oficialmente importantes reducciones de precios.

El mensaje es directo: Soy más fuerte que tú y soy más barato que tú.

¿No es esto una declaración de guerra?

01

La revelación más impactante de la conferencia fue, sin duda, el debut de Gemini 3.5 Flash.

Normalmente, "Pro" representa la columna vertebral, mientras que "Flash" significa ligereza y velocidad.

En términos de parámetros del modelo, 3.5 Flash es efectivamente más pequeño que 3.1 Pro, pero en casi todas las pruebas de referencia de inferencia y codificación, el primero tuvo un rendimiento sorprendentemente mejor:

En la compleja prueba de razonamiento matemático GSM8K, 3.5 Flash obtuvo un 95,8%, superando el 93,2% de 3.1 Pro; en la versión completa de la capacidad de generación de código SWE-bench, 3.5 Flash alcanzó una tasa de solución del 38,4%, superando con creces el 32,1% de 3.1 Pro...

¿Por qué?

Según el "Informe Técnico de Gemini 3.5" publicado por DeepMind, hay dos tecnologías centrales que son las más importantes.

Destilación de conocimiento extrema: Google no confió simplemente en acumular potencia de cálculo para entrenar a Flash; en su lugar, utilizaron el nunca antes lanzado "Gemini 3.5 Ultra" como modelo profesor para realizar una destilación de reducción de dimensionalidad en Flash.

Según un análisis en X del científico jefe de DeepMind, Jeff Dean, la tasa de ajuste fino de 3.5 Flash en conjuntos de datos de cadenas lógicas de alta calidad mejoró un 400% en comparación con la generación anterior.

Esto significa que hereda el "cerebro lógico" de un modelo supergrande, en lugar de ser una "base de conocimientos" de memoria.

Nueva arquitectura MoE (Mezcla de Expertos): Dentro de 3.5 Flash, Google adoptó una red de expertos más detallada.

La MoE tradicional puede tener solo 8 o 16 expertos, activando solo 1-2 a la vez, lo cual es suficiente para soportar modelos a escala de billones de parámetros.

Según un análisis en el memorando de inversión en infraestructura de IA de 2026 de a16z, 3.5 Flash emplea 256 microexpertos, activando hasta 4 de los más eficientes durante cada inferencia.

Esto le permite cubrir un espacio de características multimodales extremadamente grande mientras mantiene un recuento de parámetros de activación extremadamente bajo.

En términos de TTFT (tiempo hasta el primer token), 3.5 Flash ya ha alcanzado menos de 65 milisegundos.

Y un parpadeo humano toma de 100 a 150 milisegundos.

En resumen, cuando opera como agente, desde una perspectiva fisiológica humana, no hay ninguna pausa perceptible.

Para los desarrolladores que necesitan llamar herramientas con frecuencia, participar en múltiples rondas de reflexión y requieren una latencia extremadamente baja, esta es la base perfecta para un superagente.

Solo con una optimización de ingeniería tan extrema se puede establecer el dominio en el "despliegue en el borde" en un entorno ferozmente competitivo.

El primero es el modelo multimodal nativo Gemini Omni Flash.

Omni significa todopoderoso, correspondiente al anterior GPT-4o; solo por el nombre, se puede sentir la intensa competencia.

Al menos en términos de rendimiento, Gemini Omni Flash está mucho más cualificado para usar el carácter "o" que GPT-4o.

Las versiones iniciales como Sora o Gemini 1.5 eran esencialmente parches, convirtiendo voz a texto y luego texto a imágenes.

Pero el Omni lanzado esta vez es una alineación multimodal nativa de extremo a extremo. No solo puede entender de forma nativa la coherencia temporal y las leyes físicas en los vídeos, sino que también reduce el retraso promedio de la industria de 400-600 milisegundos a 120 milisegundos.

Por ejemplo, durante la conferencia: un usuario que lleva una cámara vierte agua, y cuando la taza está a punto de desbordarse, Omni puede decir "¡para, para, para!" 0,5 segundos antes de que el agua se derrame.

Esta inferencia en tiempo real del estado físico del mundo real puede parecer simple, pero es significativa: La IA ha evolucionado oficialmente de un chatbot en la pantalla a una herramienta auxiliar en el mundo real.

Incluso si todavía está en sus primeras etapas.

El segundo es el asistente inteligente Spark.

Según un informe de The Verge tras entrevistar al vicepresidente de Ingeniería de Android, Spark ha recibido control sobre la API nativa del sistema Android 17.

En resumen, los procesos complejos que antes requerían abrir muchas aplicaciones ahora pueden completarse sin mover un dedo; solo instruye a Spark y podrá encargarse de todo por ti, incluso enviar mensajes, organizar correos electrónicos, resumir horarios, rastrear dinámicas web, identificar cargos ocultos en facturas, procesar documentos por lotes, etcétera...

En otras palabras, con el asistente de IA, apenas necesitaremos aplicaciones; cualquier operación compleja se simplifica en un solo comando.

El tercero son las gafas inteligentes.

¿Por qué gafas de nuevo?

Al menos desde la perspectiva de Google, el acceso fluido a la visión y la audición es el anfitrión definitivo para los modelos grandes multimodales.

Estas gafas no tienen un aspecto llamativo, centrándose totalmente en capacidades prácticas:

Lentes de guía de onda a todo color Micro-OLED que pesan solo 4 gramos, con una transmitancia de luz de hasta el 85%;

Equipadas con un chip de borde Gemini ligero de desarrollo propio, latencia de inferencia local ≤12ms, capaz de traducción en tiempo real, reconocimiento de imágenes y análisis de escenas sin necesidad de conectarse a Internet;

Vinculadas de forma nativa al agente Spark, sincronizando datos móviles y en la nube para proporcionar servicios personalizados como recordatorios de horarios, traducción en tiempo real y alertas ambientales.

En resumen, evita la pantalla del smartphone, integrando el agente en la perspectiva en primera persona del usuario a través de las gafas.

Hay demasiado contenido; Google parece haber vaciado todas sus cartas de triunfo a la vez, declarando una verdad al mercado:

Un algoritmo sin un punto de entrada no es nada.

La era de lanzar parámetros de modelo y puntuaciones de referencia ha terminado; los proveedores de modelos puros ya no tienen un foso. El futuro es una batalla espacial cuatridimensional de "borde + nube + ecosistema + hardware".

Meter la IA en un paquete familiar está remodelando la lógica de distribución de tráfico de todo Internet: de "usuarios buscando/haciendo clic activamente" a "agentes de IA distribuyendo servicios activamente".

Para un gran número de desarrolladores y pequeñas y medianas empresas, esta es una excelente noticia, ya que la potencia de cálculo y los modelos subyacentes se han vuelto extremadamente baratos, permitiendo que todos se centren en la innovación en la capa de aplicación.

Pero otros competidores probablemente solo estén maldiciendo en este momento.

02

Cuando anunciaron casualmente desde el escenario que "los usuarios activos mensuales de Gemini han superado oficialmente los 900 millones", causó un gran revuelo en la audiencia.

900 millones es más que la suma de los MAU de todos los competidores en EE. UU.

¿Cómo lo lograron?

La respuesta es simple y brutal: alimentación forzada.

Google no necesita gastar dinero en publicidad para adquirir usuarios como las empresas de IA independientes; solo necesita añadir un icono junto a la barra de direcciones en el navegador Chrome, integrar una tecla de acceso directo en la barra de navegación inferior de 3 mil millones de teléfonos Android y enviar actualizaciones a través de Google Workspace...

El coste de adquisición de clientes es esencialmente cero.

Más críticamente, durante el próximo período, las miradas de los 900 millones de usuarios activos mientras usan gafas inteligentes para ver productos, la lógica corregida mientras procesan tareas con Spark y las interacciones con el modelo visual Omni generarán una cantidad masiva de datos de retroalimentación del mundo real multimodales de alta calidad, todo lo cual nutrirá a Gemini 4.

Esto crea una barrera extremadamente sólida: cuanto mejor sea el modelo de usar -> más usuarios atrae -> más datos genera -> mejor se vuelve el modelo.

Para fortalecer rápidamente este círculo cerrado, Google anunció directamente una guerra de precios contra todos los competidores: el paquete AI Ultra se redujo de 249,99 $/mes a 99,9 $/mes.

El precio de entrada para el millón de tokens de 3.5 Flash cayó a 0,02 $, y el precio de salida por un millón de tokens es de 0,08 $.

¿Qué clase de precio increíble es este?

En comparación, los precios promedio para modelos de niveles similares en la industria rondan los 0,15-0,2 $ por entrada y 0,6-1 $ por salida.

Haciendo números, los principales clientes procesan alrededor de 1 billón de tokens diariamente. Cambiar el 80% de la carga de trabajo a Gemini 3.5 Flash durante un año podría ahorrar más de 1.000 millones de dólares.

¿Por qué atreverse a vender IA a un precio tan bajo?

La mayor confianza es: infraestructura de potencia de cálculo integrada verticalmente.

Incluyendo gigantes como OpenAI y Anthropic, pueden parecer glamurosos, pero esencialmente siguen siendo "inquilinos de potencia de cálculo", necesitando comprar potencia de cálculo a Microsoft y Amazon, quienes a su vez tienen que pagar al viejo Huang.

Google tiene su propio TPU y, combinado con la activación dispersa MoE extremadamente eficiente de 3.5 Flash, ha comprimido los costes de potencia de cálculo al extremo.

Pueden aprovechar al máximo sus ventajas de activos pesados para derrotar a las empresas de algoritmos puros.

La lógica es clara.

Los modelos grandes básicos se están mercantilizando rápidamente. Al igual que el agua y la electricidad, ¿alguna vez has visto a una empresa de agua obtener beneficios exorbitantes?

Google no teme que los modelos grandes en sí mismos no ganen dinero porque pueden recuperarlo a través de anuncios de búsqueda, servicios en la nube y comisiones del ecosistema Android.

Pero para empresas como OpenAI, Anthropic, Cohere y Mistral que dependen únicamente de vender API de modelos grandes, esto es imposible.

Los inversores probablemente ahora quieran presionar la cabeza de Ultraman y preguntar: "El precio de la API de Google es solo una décima parte del tuyo, y su rendimiento es mejor que el tuyo. ¿Cómo esperas que funcione tu modelo de negocio?"

El panorama competitivo en múltiples industrias entrará así en un período de reorganización acelerada.

Los proveedores de IA deben encontrar rápidamente fuentes más baratas de potencia de cálculo o empezar a fabricar chips ellos mismos.

La siguiente es Apple, que sigue construyendo de forma aislada.

La combinación de gafas inteligentes + modelo grande de vídeo Omni + toma de control a nivel de sistema nativo de Spark amenaza indudablemente al iPhone.

Según el "Informe de Previsión de Tendencias de Electrónica de Consumo" de Macquarie: En los próximos tres años, se espera que la proporción de interacciones sin pantalla basadas en visión/voz salte del 8% actual al 35%.

Si los usuarios se acostumbran a completar el trabajo diario y el entretenimiento usando gafas y voz, el tiempo de uso de las pantallas inevitablemente se reducirá significativamente.

Si Apple no puede producir dispositivos portátiles lo suficientemente impresionantes para contrarrestar (Vision Pro es demasiado pesado y caro, destinado a ser un juguete para una minoría), su monopolio en los puntos de entrada en la era de la Internet móvil enfrentará desafíos sin precedentes.

Esto no es iteración; es revolución.

Google ha lanzado el guante a todos los competidores con la tecnología, el tráfico y el precio como tres armas.

En este momento, ¿hay alguien que todavía se burle de ellos por tener la enfermedad de una gran empresa?

Precio de --

Te puede gustar

IOSG Founder: Please tell Vitalik the truth, let the OGs who have enjoyed the industry's dividends enlighten the young people

The wage earners freeze to death on the road, the sellers of goods die of thirst on the way. The weavers of brocade wear coarse cloth, and the grain growers do not have enough to eat.

Morning Report | SpaceX reveals it holds approximately $1.45 billion in Bitcoin; Nvidia's Q1 financial report shows revenue of $81.6 billion; Manus plans to raise $1 billion for buyback business

Overview of Important Market Events on May 21

Insiders: DeepSeek is forming a Harness team to compete with Claude Code

DeepSeek Code is coming.

SpaceX officially submitted its prospectus, unveiling the largest IPO in history

SpaceX's public market debut could take place as early as June, making it the first in a series of giant IPOs from AI companies, with OpenAI and Anthropic also waiting for the right moment.

The financial changes under the new SEC regulations: Opportunities and regulatory red lines behind "tokenized stocks"

In-depth analysis of "tokenized stocks": The SEC's advancement of an innovation exemption framework has sparked heated discussions, revealing the real risks behind third-party "synthetic asset" certificates and 24/7 trading.

Blockchain Capital Partner: The structure of on-chain dual-layer capital is still in the early stages of value discovery

How can the on-chain economy build a capital structure that promotes open innovation while also considering institutional scale?

Secured over $60 million in funding from Dragonfly, Sequoia, and others, learn about the on-chain derivatives protocol Variational | CryptoSeed

What is the difference with Hyperliquid?

I tested with $10,000: zero wear and tear, annualized 8%, and can earn points (with complete tutorial + screenshots)

Perps DEX newcomer StandX launches native stablecoin DUSD, achieving a real APY of 8.46% with its innovative three-tier yield mechanism, breaking the 3% traditional stablecoin interest rate ceiling.

Morning Report | Deloitte acquires crypto infrastructure company Blocknative; stablecoin company Checker completes $8 million financing; a16z may have become the largest external institutional holder of HYPE

Overview of Important Market Events on May 20

Interpretation of xBubble SOP: Packaging Vibe Coding for non-technical users

DAPPOS has launched the low-threshold AI application xBubble, which innovatively automates the packaging of complex large model workflows with an SOP system, allowing users with no technical background to complete professional-level AI tasks with just one sentence.

From Followers to Price Setters: The Role of the Crypto Market is Reversing

The encryption platform successfully achieved precise pre-listing pricing on CBRS, indicating that Crypto is gradually transforming from a follower of traditional finance into a new pricing hub for global assets through innovative mechanisms.

a16z invested $356 million to aggressively acquire HYPE, surpassing Paradigm to become the largest external holding institution

Eight months later, the price of HYPE is approaching its previous high, and institutions like a16z, Goldman Sachs, and Grayscale are collectively taking action. What is their intention?

Coinbase stuffed USDC into Hyperliquid; who made money from this transaction?

On the surface, it seems like a good deal for Hyperliquid with doubled revenue, but in reality, Coinbase has obtained something more valuable: a global distribution channel for USDC. In a situation where it is besieged domestically and locked out by USDT overseas, embedding stablecoins into the larg...

It is Bankless that needs Ethereum, not Ethereum that needs Bankless

The role of Bankless is being replaced by a more decentralized, specialized, and diverse "narrative network."

I’m sorry, but the information provided in your re…

I’m sorry, but the information provided in your request is incomplete or unclear. If you could provide specific…

Bitcoin Establece un Umbral Decisivo en 55,000 Dólares

Key Takeaways Precio Crítico de Bitcoin: El nivel de 55,000 dólares se presenta como decisivo para la futura…

# Outline

H1: El Impacto en Bitcoin: ¿Podría el Precio Descender a $55,000? Key Takeaways Análisis sobre la posible caída…

Base Protocol’s Market Impact Increases Amidst Token Movements

Key Takeaways BankrCoin Surge: BankrCoin alcanzó un máximo histórico de $0.00094 antes de estabilizarse en $0.00078, atrayendo una…

IOSG Founder: Please tell Vitalik the truth, let the OGs who have enjoyed the industry's dividends enlighten the young people

The wage earners freeze to death on the road, the sellers of goods die of thirst on the way. The weavers of brocade wear coarse cloth, and the grain growers do not have enough to eat.

Morning Report | SpaceX reveals it holds approximately $1.45 billion in Bitcoin; Nvidia's Q1 financial report shows revenue of $81.6 billion; Manus plans to raise $1 billion for buyback business

Overview of Important Market Events on May 21