Cuando un token se convierte en trabajo, las personas se convierten en la interfaz

By: blockbeats|2026/03/24 13:38:12
0
Compartir
copy
Autor | Lin Wanwan

En 1876, en la Exposición Mundial de Filadelfia, el emperador brasileño Dom Pedro II recogió la invención de Bell, el teléfono, escuchó una voz al otro lado y exclamó: "¡Dios mío, ¡habla!"

Hace ciento cincuenta años, el 18 de marzo de 2026, en el Centro de Convenciones de San José, vistiendo una chaqueta de cuero negra, Jen-Hsun Huang se paró en el escenario de la conferencia GTC y también pronunció una declaración sorprendente.

"En diez años, NVIDIA probablemente tendrá alrededor de 75,000 empleados. Estarán muy, muy ocupados porque estarán trabajando con 7.5 millones de agentes de IA".

Hubo risas en la audiencia.

75,000 personas, 7.5 millones de agentes, 1:100.

Jen-Hsun Huang se echó a reír y añadió: "Trabajarán las 24 horas del día. Con suerte, nuestra gente no tendrá que competir con ellos".

Los aplausos se detuvieron, y este número quedó eclipsado ese día por los anuncios de lanzamientos de chips más llamativos y anuncios de asociaciones. Pero si nos tomamos un momento para centrarnos en ello de nuevo, esta podría ser posiblemente una de las declaraciones más importantes de toda la conferencia.

No es solo Jen-Hsun Huang. Tres meses antes, otra persona describió el mismo futuro en términos más concretos.

En enero de 2026, en el CES de Las Vegas, el CEO de McKinsey, Bob Sternfels, se sentó en el escenario y presentó los números.

"Actualmente tenemos 40,000 empleados humanos y aproximadamente 25,000 agentes de IA". Hace menos de dos años, este número estaba en los miles. Esos 25,000 agentes generaron 2.5 millones de gráficos en los últimos seis meses.

2,5 millones de gráficos. Esto solía ser el trabajo de los analistas recién contratados. De veintitrés o veinticuatro años, disfrutando del resplandor de una prestigiosa universidad, alineando ejes a las tres de la mañana.

Ese era el punto de partida para cada recién llegado a McKinsey, intercambiando el trabajo más mecánico por un pase a la vía de socio.

Ahora la primera mitad de ese pase ha sido asumida por agentes. Sternfels dijo: “La IA ha llevado a un crecimiento del 25 % en algunas posiciones y a una reducción del 25 % en otras. La empresa está dividida por igual entre expansión y contracción”.

Las historias de NVIDIA y McKinsey cuentan la misma historia.

En un mundo 1:100, el trabajo lo realizan agentes impulsados por tokens, y las personas son interfaces conectadas a estos agentes.

El control remoto de la externalización no está en tus manos

Durante la semana de la GTC, Jensen Huang apareció en el podcast All-In y realizó una declaración aún más impactante.

“Digamos que tienes un ingeniero que gana $500,000 al año. Si no ha consumido al menos $250,000 en Tokens, me preocuparía mucho”.

Cuando el presentador le preguntó si NVIDIA estaba gastando $2 mil millones en Tokens para el equipo de ingeniería, Jensen Huang respondió: “Estamos trabajando en ello”.

Un ingeniero que no consume Tokens no vale ni su salario de $500,000.

Cuando un token se convierte en trabajo, las personas se convierten en la interfaz

El enfoque de NVIDIA es muy directo: incluir Tokens en el paquete de compensación. Jensen Huang dijo durante la conferencia principal de GTC que, en el futuro, cada ingeniero de NVIDIA tendrá un presupuesto anual de Tokens, aproximadamente la mitad de su salario base.

Para un ingeniero con un salario base de decenas de miles de dólares, recibir una cantidad adicional de poder de cómputo equivalente a la mitad de su salario base, un tercio de su paquete total, es pura gasolina.

Para alguien que agota su presupuesto de Tokens, es como tener una docena de agentes de IA trabajando las 24 horas del día para ayudarles a escribir código, ejecutar pruebas, buscar documentos y realizar simulaciones. Alguien con solo la versión gratuita de una cuota de API sigue confiando en sus propias manos para teclear en el teclado. Dos personas con currículums idénticos podrían tener una diferencia de productividad de 5 a 10 veces.

Esto ya no es solo una teoría en Silicon Valley.

En marzo de este año, Business Insider informó sobre un cambio: los ingenieros están empezando a preguntar durante las entrevistas, “¿¿Cuánto presupuesto de Token se asigna a este puesto?”? Tomasz Tunguz, socio de Theory Ventures, se refirió al presupuesto de Token como el “cuarto pilar” de la compensación de los ingenieros, después del salario base, las bonificaciones y la equidad. Greg Brockman, presidente de OpenAI, lo dijo de manera más directa: la cantidad de inferencia a la que se puede acceder determinará cada vez más su productividad general.

En su discurso de GTC, el propio Jensen Huang dijo: “¿Cuánto Token está asociado con mi papel? Esto ya se ha convertido en una herramienta de reclutamiento en Silicon Valley”.

En la década de 1950, los trabajadores de la industria automotriz de Detroit tenían algunos de los salarios más altos de los Estados Unidos. Lo que realmente les permitió vivir una vida de clase media fue la invención de la línea de montaje por parte de Henry Ford. Los trabajadores estaban de pie en la línea, la línea se movía mientras la gente se quedaba quieta, y la producción de todos se amplificaba muchas veces por brazos robóticos. El nivel de vida de un trabajador de Detroit superaba con creces el de los artesanos contemporáneos, cuya artesanía puede que no fuera superior, pero que trabajaban en una línea de montaje más amplia.

El Presupuesto de Tokens de 2026 es el equivalente a la línea de montaje de 1950.

Pero con una diferencia clave.

En Detroit, los trabajadores podían dejar Ford y pasar a GM, a Chrysler, las líneas de montaje estaban por todas partes. Los sindicatos podían negociar con la dirección para obtener mejores velocidades de línea y entornos más seguros.

El Presupuesto de Tokens es diferente. Eres un superhéroe cuando te lo dan, vuelves a ser normal cuando se lo quitan. Las acciones pueden ser cobradas en efectivo, las habilidades pueden seguirte cuando cambias de trabajo. El Presupuesto de Tokens no es nada, solo un código de trampa, con el interruptor controlado por la empresa.

Silicon Valley ya tiene una palabra para esta situación, llamada "Sed de GPU".

Los mejores investigadores de IA cambian de trabajo, la brecha salarial ahora es la segunda, con la potencia de cómputo a la cabeza. No se pueden realizar experimentos, no se pueden desplegar agentes, las habilidades están limitadas por cuotas. "¿Cuántos Tokens te ofrecen" a veces se clasifica por encima de las opciones de acciones. Las acciones son como un cheque futuro que podría no llegar, el Presupuesto de Tokens es productividad que se puede cobrar hoy.

Y aquellos sin IA simplemente son eliminados.

Goldman Sachs estima que la IA podría automatizar el 25% de las horas de trabajo en EE. UU. Una encuesta de Mercer dice que el 65% de los ejecutivos esperan que dos o tres décimas de su fuerza laboral se redistribuyan debido a la IA. Combinando los dos conjuntos de números, la conclusión es clara: las personas con Tokens aumentan exponencialmente su producción, mientras que las que no tienen Tokens son optimizadas.

La línea divisoria es la cuota de Tokens, cada vez menos relacionada con las habilidades de una persona.

El rendimiento de los Tokens es la valoración

El valor personal se determina por la cuota de tokens. Pero, ¿qué pasa con las empresas?

A principios de marzo de 2026, una empresa con sede en Shanghái llamada MiniMax publicó su primer informe anual desde que salió a bolsa. Los ingresos anuales fueron de 79 millones de dólares, con una pérdida neta ajustada de 250 millones de dólares. Según las medidas financieras tradicionales, esta era una pequeña empresa que quemaba efectivo, con ingresos que solo eran una fracción de los números trimestrales de Accenture.

Pero los mercados de capitales lo vieron de manera diferente.

El CEO de MiniMax, Yan Junjie, dijo una frase durante la llamada de resultados, más crítica que todo el informe: "El valor de la empresa está determinado por la Densidad de Inteligencia multiplicada por el Volumen de Tokens".

El Volumen de Tokens, no el crecimiento de los ingresos, no el número de usuarios, no los márgenes brutos.

Los datos que respaldan esta afirmación son muy sólidos. En febrero de 2026, el consumo diario de Tokens del modelo de la serie M2 de MiniMax ha aumentado seis veces en comparación con hace dos meses, en diciembre. El consumo de Tokens en un escenario de programación ha aumentado diez veces. En la plataforma de agregación de modelos de IA OpenRouter, el M2.5 de MiniMax ha consumido 45,5 billones de Tokens en dos semanas, desplazando a todos los modelos estadounidenses y llevando a una empresa con sede en Shanghái a la cima del ranking mundial de consumo de Tokens por primera vez.

La situación fue descrita por el South China Morning Post con una declaración: El modelo de código abierto de China ha puesto fin al dominio del mercado de un año de los desarrolladores estadounidenses. ¿Qué llevó al final? Consumo de tokens. Quien queme la mayoría de los tokens es el ganador.

Esta lógica también se aplica a OpenAI. La plataforma de API de OpenAI procesa 6 mil millones de tokens por minuto, un aumento de 20 veces en dos años. Los clientes empresariales que gastan más de $100,000 anualmente han visto casi un aumento de 7x. El analista de Barclays, Ross Sandler, después de analizar los datos, concluyó: El consumo de tokens del lado del consumidor de OpenAI es más del doble que el de Google Gemini.

El consumo de tokens se ha convertido en la moneda fuerte para clasificar a las empresas de IA.

Aún más interesante es cómo esto se desarrolla internamente dentro de las empresas. Un artículo reciente del New York Times informó sobre un fenómeno llamado "tokenmaxxing": Los ingenieros de Meta y OpenAI compiten en tablas de clasificación internas para ver quién puede consumir más tokens.

El presupuesto de tokens se está convirtiendo en un beneficio estandarizado, al igual que los almuerzos gratuitos y el seguro dental hace una década. Un ingeniero que trabaja en la oficina de Ericsson en Estocolmo dijo al New York Times que sus gastos en Claude podrían ser más altos que su salario, pero la empresa paga la factura.

Un artículo reciente en TechCrunch hizo los cálculos: Un ingeniero podría consumir 10,000 Tokens escribiendo un artículo por la tarde, pero un ingeniero que ejecuta un clúster de agentes puede quemar millones de Tokens en segundo plano en un día sin escribir una sola palabra.

Hace dos años, el precio por millón de Tokens era de $33. Ahora, es de 9 centavos. Eso es una caída del 99.7%. Cuanto más barato es el precio, más intensa es la quema. Cuanto más intensa sea la quema, más difícil será desprenderse.

La predicción de Yan Junjie en la teleconferencia fue: La futura demanda del mercado de Tokens podría aumentar en uno o dos órdenes de magnitud.

Esta es la nueva forma en que las empresas se están valorando en 2026. No se trata de cuánto dinero estás ganando, se trata de cuánto se ha quemado tu Token. MiniMax sufrió un golpe de 2.500 millones, pero la pronunciada curva de crecimiento del rendimiento de Token fue suficiente para despertar el interés de los mercados de capitales. Puede pensarlo como YouTube en 2006, sin ingresos pero con un crecimiento exponencial en el consumo de ancho de banda, lo que llevó a Google a gastar 16.500 millones para adquirirlo.

En los días de YouTube, se estaba quemando el ancho de banda. Hoy en día, MiniMax está quemando Tokens. La unidad de medida ha cambiado, pero la lógica sigue siendo la misma.

La capacidad puede esperar, la deuda no puede

Algo más sucedió esa misma semana que la GTC.

El 18 de marzo, Stripe lanzó el Protocolo de Pagos Automáticos. En términos simples: Los agentes de IA ahora pueden gastar dinero por su cuenta.

Un agente necesita un conjunto de datos, paga por la descarga en sí. Necesita potencia de cómputo para la inferencia, la compra por segundo. Necesita llamar a la API de otro agente, paga la factura por su cuenta. Todo el proceso ya no requiere confirmación humana. Visa ha adaptado los pagos con tarjeta de crédito para este protocolo, Coinbase ha creado carteras para agentes y Mastercard está desarrollando Agent Pay.

El consumo de Tokens ahora tiene una fuente adicional. Anteriormente, solo existía el escenario del 'agente de envío humano'. Ahora, los propios agentes están consumiendo Tokens y utilizando el dinero ganado con los Tokens para comprar aún más Tokens. El cofundador de Stripe, John Collison, utilizó un término: diluvio.

Huang Renxun proporcionó los números correspondientes: NVIDIA planea aumentar la tasa de generación de Tokens de 22 millones a 700 millones, un aumento de 350 veces.

Esto es como construir toda una red de autopistas, apostando a que el flujo de tráfico crecerá exponencialmente.

Una apuesta de infraestructura de 6 billones de dólares requiere una suposición: el consumo global de Tokens debe ser lo suficientemente grande como para respaldar el retorno de la inversión. Esta suposición actualmente es solo eso, una costosa.

En el último trimestre de 2025, las empresas tecnológicas emitieron bonos por un récord de 108.700 millones de dólares. Al entrar en 2026, las primeras semanas vieron otros 100 mil millones de dólares. Morgan Stanley y JPMorgan estiman que en los próximos años, la deuda total de las empresas relacionadas con la IA podría alcanzar los 15 billones de dólares. Según Goldman Sachs, el gasto de capital en IA ya representa alrededor del 3% de los EE. UU. PIB.

Un grupo de personas de Wall Street que primero percibieron el riesgo han comenzado a comprar seguros. El volumen de las transacciones de swaps de crédito por incumplimiento está en aumento. Pagando una prima de unos pocos puntos básicos, están apostando a que estas empresas puedan incumplir su deuda. Daniel Sorid, jefe de estrategia crediticia de Citi, dijo en una conferencia de inversionistas: "Como inversionista crediticio, enfrentar una transformación de esta magnitud que requiere una inversión de capital tan grande es inherentemente inquietante".

El cofundador de Google, Larry Page, dijo algo más extremo dentro de la empresa, diciendo a los empleados de Google varias veces: "Preferiría quebrar antes que perder esta carrera".

Describe con precisión el dilema del prisionero: cada gigante está apostando a que su oponente seguirá invirtiendo, por lo que tampoco pueden detenerse. Quienes se detienen abandonan directamente.

Hay un lado positivo con datos concretos. La tasa de generación de tokens ha aumentado en 350 veces. Stripe acaba de permitir que el agente gaste dinero por su cuenta. McKinsey se ha expandido de unos pocos miles de agentes a 25.000 en dos años. Si la economía de agentes despega por completo, la curva de crecimiento del consumo de tokens podría volverse exponencial.

Pero hay una fecha que está haciendo que muchas personas no puedan dormir por las noches. El acantilado de renovación en la segunda mitad de 2026.

De 2024 a 2025, las empresas estaban gastando su "presupuesto de innovación". Los directores ejecutivos necesitaban decir "estamos adoptando la IA" en la llamada de resultados, no muy sensibles al precio, no exigiendo resultados, gastando dinero en apariencias. En la segunda mitad de 2026, la primera ola de proyectos piloto alcanza el punto de renovación. El presupuesto de innovación se agota, el CTO renuncia a su asiento al otro lado de la mesa y el CFO toma el relevo. El CFO solo reconoce un número: ROI.

Si se reduce un gran número de pilotos, habrá una brecha repentina en el consumo final de Token. La capacidad de producción de 600.000 millones de dólares, los centros de datos construidos, la energía conectada, los chips en el estante, se convertirán en capacidad ociosa.

Algo así ha sucedido en la historia.

En el año 2000, las empresas de telecomunicaciones gastaron billones de dólares en la instalación de cables submarinos. Cuando la burbuja estalló, el 90% de los cables del mundo permanecían oscuros bajo el mar, ociosos durante casi una década. No fue hasta que Netflix comenzó a transmitir en streaming y el iPhone provocó el auge de Internet móvil que los cables se iluminaron lentamente. Los cables no se instalaron en vano. Los constructores del cable, Lucent, Nortel y Tyco, quebraron. La infraestructura se mantuvo, pero los constructores desaparecieron.

En 2012, fue la industria de la energía solar de China. Shangde en Wuxi y Suntech en Jiangxi redujeron los precios globales de los componentes. Con un grave exceso de capacidad, la industria sufrió un baño de sangre durante tres años. La demanda finalmente llegó más tarde, y hoy la energía solar es la fuente de energía de más rápido crecimiento en la Tierra. Shangde quebró. Suntech quebró. Los pioneros se quedaron en el último tramo de oscuridad antes del amanecer.

Después de que Bell inventara el teléfono, Western Union se negó a comprar la patente por $100,000. Diez años después, Western Union estaba dispuesta a ofrecer $25 millones, pero Bell se negó a vender. Treinta años después, la red telefónica cubría todo Estados Unidos. Sin embargo, la mayoría de las pequeñas empresas que habían construido la red no vivieron para ver el día en que el teléfono se generalizó. El ganador fue AT&T, que más tarde adquirió y monopolizó todo.

La historia de la infraestructura siempre es esta versión. La dirección casi siempre es correcta, pero el momento puede ser mortal.

De vuelta al Token. En la estructura mencionada anteriormente, el Token se convierte en trabajo, las personas se convierten en interfaces, la asignación de Tokens define todo, con la premisa de que el Token se consume de manera continua, masiva y rápida. La producción 10x de un ingeniero depende del suministro de Tokens; elimínalo y vuelve a cero. La valoración de 840.000 millones de dólares de OpenAI depende de los compromisos de potencia computacional; si se termina el protocolo, se reduce. Una infraestructura de 600.000 millones de dólares depende del crecimiento del consumo del usuario final; si la tasa de crecimiento se ralentiza, se convierte en una mera cáscara de sí misma.

Cada capa depende de la siguiente. Si el crecimiento del consumo se queda atrás del crecimiento de la construcción en dos o tres años, los precios para todos en toda la cadena se relajarán.

Precio de --

--

¿De qué ferrocarril te estás fiando?

Para 2023, tener una tarjeta es lo más importante. Para 2026, tener un token es lo más importante.

Parece un cambio de palabras, pero la transformación subyacente es más profunda de lo que la mayoría de las personas se dan cuenta.

La GPU es un activo; una vez que la compras, es tuya, bloqueada en un centro de datos donde nadie más puede tomarla.

El token es tráfico. Su producción 10x, su alta valoración, su carta de triunfo en la mesa de negociación, dependen de un suministro continuo y no propio. Cierre el grifo y todo se reinicia a cero.

Cuando el Token se convierte verdaderamente en el trabajo, las personas se convierten en interfaces conectadas al Token. Una buena interfaz puede aumentar el valor del Token, y el juicio, la estética, la experiencia siguen siendo relevantes. Pero cuánto puede hacer una interfaz depende principalmente de cuántos Tokens tenga acceso.

En la década de 1870, los agricultores estadounidenses descubrieron que cultivar buen trigo no era suficiente; tenía que estar cerca del ferrocarril. En la década de 1950, los artesanos descubrieron que, sin importar cuán hábiles fueran, no podían competir con los trabajadores de la línea de montaje. En 2026, los ingenieros están descubriendo que, sin importar cuán bien codificen, sin una asignación de Tokens, todo es solo girar las ruedas.

Cuando el Token se convierte verdaderamente en trabajo, las personas se convierten en interfaces. Aunque la calidad de la interfaz en sí sigue siendo importante, el valor de la interfaz depende principalmente de quién está proporcionando su poder.

Te puede gustar

WEEX P2P ahora soporta JOD, USD y EUR—Reclutamiento de Comerciantes Ahora Abierto

Para facilitar los depósitos en criptomonedas, WEEX ha lanzado oficialmente su plataforma de trading P2P y continúa expandiendo el soporte para fiat. ¡Estamos emocionados de anunciar que el Dinar Jordano (JOD), Dólar Estadounidense (USD) y Euro (EUR) ya están disponibles en WEEX P2P!

Socios de Dragonfly: La mayoría de los agentes no realizan operaciones autónomas, ¿cómo pueden imponerse los pagos con criptomonedas?

Aunque la economía de agentes alcanzará una magnitud muy grande, la proporción de agentes que realmente realicen transacciones no será tan elevada.

Una startup de IA de EE. UU. se lanza por completo al mega-modelo chino | Rewire News Morning Brief

El ecosistema de código abierto y los datos de fabricación forman una doble circulación, permitiendo el progreso hacia la vanguardia incluso bajo restricciones de chips

Trump miente de nuevo: Una operación psicológica de "pausa de cinco días", cómo Wall Street, Bitcoin y los insiders de Polymarket sincronizaron Uposciogen

Dentro de cinco días, el mercado se enfrentará una vez más al "plazo final" de Trump. ¿Será este el verdadero final, o solo otra ronda de idas y vueltas?

¿Se filtró la noticia del alto el fuego antes de tiempo? Un gran mercado de apuestas apuesta por el resultado antes del tuit de Trump

Minutos antes de la publicación de Trump en las redes sociales, que provocó movimientos en los mercados, los futuros del S&P 500 y los del petróleo crudo también registraron un volumen de negociación inusual.

Carta Anual del CEO de BlackRock a los Accionistas: ¿Cómo está Wall Street utilizando la IA para seguir beneficiándose de los Fondos de Pensiones Nacionales?

La IA está creando una enorme riqueza, pero la distribución de la riqueza y la exposición al riesgo se están repitiendo en un patrón familiar

Monedas populares

Últimas noticias cripto

Leer más