Google officially declares war

By: rootdata|2026/05/22 03:45:00
0
Поширити
copy

Автор статті: Chengbei XugongАналітична підтримка: Gougu Big Data

Конференція розробників Google I/O 2026 року викликає лише одне враження: зверхність.

Вони не лише інтегрували ШІ-агентів у всі ключові точки входу, як-от пошук, браузери, мобільні телефони та розумні окуляри, а й безперервно представили три головні інновації: Gemini 3.5 Flash, відеомодель Omni та абсолютно новий ШІ-помічник Spark.

Продемонструвавши свої переваги, вони з гордістю оголосили, що кількість щомісячних активних користувачів Gemini перевищила 900 мільйонів, а також офіційно повідомили про значне зниження цін.

Сенс простий: Я сильніший за вас і я дешевший за вас.

Хіба це не оголошення війни?

01

Найбільш приголомшливою подією конференції, безперечно, став дебют Gemini 3.5 Flash.

Зазвичай «Pro» означає основну модель, а «Flash» — легкість і швидкість.

За кількістю параметрів 3.5 Flash дійсно менша за 3.1 Pro, але майже в усіх тестах на логічні висновки та написання коду вона показала дивовижно кращі результати:

У складному тесті з математичних міркувань GSM8K модель 3.5 Flash набрала 95,8%, перевершивши 93,2% у 3.1 Pro; у повній версії тесту на генерацію коду SWE-bench модель 3.5 Flash досягла рівня успішності 38,4%, значно випередивши 32,1% у 3.1 Pro...

Чому?

Згідно зі «Звітом про технології Gemini 3.5», опублікованим DeepMind, найважливішими є дві ключові технології.

Екстремальна дистиляція знань: Google не просто покладалася на нарощування обчислювальних потужностей для навчання Flash; натомість вони використали ще не випущену модель «Gemini 3.5 Ultra» як модель-вчителя для проведення дистиляції з пониженням розмірності для Flash.

Згідно з аналізом твіта головного науковця DeepMind Джеффа Діна, коефіцієнт тонкого налаштування 3.5 Flash на високоякісних наборах даних логічних ланцюжків покращився на 400% порівняно з попереднім поколінням.

Це означає, що вона успадковує «логічний мозок» надвеликої моделі, а не просто зазубрену «базу знань».

Абсолютно нова архітектура MoE (Mixture of Experts): Усередині 3.5 Flash компанія Google застосувала більш деталізовану мережу експертів.

Традиційна MoE може мати лише 8 або 16 експертів, активуючи лише 1-2 одночасно, чого достатньо для підтримки моделей із трильйонами параметрів.

Згідно з аналізом у меморандумі a16z щодо інвестицій в ШІ-інфраструктуру 2026 року, 3.5 Flash використовує 256 мікроекспертів, активуючи до 4 найефективніших під час кожного висновку.

Це дозволяє їй охоплювати надзвичайно великий мультимодальний простір ознак, зберігаючи при цьому надзвичайно низьку кількість активованих параметрів.

Що стосується TTFT (часу до першого токена), 3.5 Flash вже досягла показника менше 65 мілісекунд.

А людське кліпання очима займає 100-150 мілісекунд.

Коротше кажучи, коли вона працює як агент, з точки зору людської фізіології, жодної помітної паузи взагалі немає.

Для розробників, яким потрібно часто використовувати інструменти, проводити багаторазові роздуми та мати наднизьку затримку, це ідеальна основа для супер-агента.

Тільки завдяки такій екстремальній інженерній оптимізації можна встановити домінування у «периферійному розгортанні» в умовах жорсткої конкуренції.

Перша — це нативна мультимодальна Gemini Omni Flash.

Omni означає всемогутній, що відповідає попередній GPT-4o; лише за назвою можна відчути інтенсивну конкуренцію.

Принаймні з точки зору продуктивності, Gemini Omni Flash набагато більше заслуговує на використання літери «o», ніж GPT-4o.

Ранні версії, такі як Sora або Gemini 1.5, були по суті «клаптиковими», перетворюючи мову на текст, а потім текст на візуальні образи.

Але Omni, випущена цього разу, — це справжнє нативне наскрізне мультимодальне узгодження. Вона може не лише розуміти часову послідовність і фізичні закони у відео, а й скоротити середню затримку в галузі з 400-600 мілісекунд до 120 мілісекунд.

Наприклад, під час конференції: користувач із камерою наливає воду, і коли чашка ось-ось переповниться, Omni може сказати «стоп, стоп, стоп!» за 0,5 секунди до того, як вода проллється.

Це виведення фізичного стану реального світу в реальному часі може здатися простим, але воно має велике значення: ШІ офіційно перетворився з чат-бота на екрані на допоміжний інструмент у реальному світі.

Навіть якщо він все ще на ранніх стадіях.

Друга — це інтелектуальний помічник Spark.

Згідно зі звітом The Verge, де інтерв’ювали віцепрезидента з розробки Android, Spark отримав контроль над нативним API системи Android 17.

Коротше кажучи, складні процеси, які раніше вимагали відкриття багатьох програм, тепер можна виконати, не поворухнувши пальцем; просто дайте вказівку Spark, і він впорається з усім: від надсилання повідомлень, упорядкування електронних листів, підсумовування розкладу, відстеження вебдинаміки, виявлення прихованих платежів у рахунках до пакетної обробки документів тощо...

Іншими словами, з ШІ-помічником нам майже не знадобляться програми; будь-яка складна операція спрощується до однієї команди.

Третє — це розумні окуляри.

Чому знову окуляри?

Принаймні з точки зору Google, безперешкодний доступ до зору та слуху є ідеальним носієм для мультимодальних великих моделей.

Ці окуляри не мають яскравого вигляду, повністю зосереджуючись на практичних можливостях:

Повноколірні хвилеводні лінзи Micro-OLED вагою лише 4 грами, зі світлопропусканням до 85%;

Оснащені власною легкою периферійною мікросхемою Gemini, затримка локального висновку ≤12 мс, здатні до перекладу в реальному часі, розпізнавання зображень та аналізу сцени без підключення до інтернету;

Нативно пов’язані з агентом Spark, синхронізують мобільні та хмарні дані для надання персоналізованих послуг, таких як нагадування про розклад, переклад у реальному часі та сповіщення про навколишнє середовище.

Коротше кажучи, вони оминають екран смартфона, інтегруючи агента в людську перспективу від першої особи через окуляри.

Контенту просто забагато; Google, здається, виклала всі свої козирі одразу, проголосивши ринку істину:

Алгоритм без точки входу — це ніщо.

Ера нарощування параметрів моделі та результатів тестів минула; чисті постачальники моделей більше не мають «рову» навколо свого бізнесу. Майбутнє — це чотиривимірна космічна битва «периферія + хмара + екосистема + обладнання».

Начинка ШІ в «сімейний кошик» насправді змінює логіку розподілу трафіку в усьому інтернеті: від «користувачів, які активно шукають/клацають» до «ШІ-агентів, які активно розподіляють послуги».

Для величезної кількості розробників та малого й середнього бізнесу це чудові новини, оскільки базові обчислювальні потужності та моделі стали надзвичайно дешевими, що дозволяє кожному зосередитися на інноваціях на рівні додатків.

Але інші конкуренти, мабуть, зараз просто лаються.

02

Коли вони невимушено оголосили зі сцени, що «кількість щомісячних активних користувачів Gemini офіційно перевищила 900 мільйонів», це викликало неабиякий ажіотаж у залі.

900 мільйонів — це більше, ніж сукупна кількість активних користувачів усіх конкурентів у США.

Як вони цього досягли?

Відповідь проста і жорстока: примусове впровадження.

Google не потрібно витрачати гроші на рекламу для залучення користувачів, як незалежним ШІ-компаніям; їй просто потрібно додати іконку поруч із адресним рядком у браузері Chrome, інтегрувати клавішу швидкого доступу в нижню панель навігації 3 мільярдів телефонів Android і розсилати оновлення через Google Workspace...

Вартість залучення клієнтів по суті дорівнює нулю.

Що ще важливіше, протягом наступного періоду погляди 900 мільйонів активних користувачів під час перегляду товарів через розумні окуляри, логіка, виправлена під час виконання завдань зі Spark, та взаємодія з візуальною моделлю Omni генеруватимуть величезну кількість високоякісних мультимодальних даних реального світу, які живитимуть Gemini 4.

Це створює надзвичайно міцний бар’єр: чим краща модель у використанні -> тим більше користувачів вона приваблює -> тим більше даних вона генерує -> тим кращою стає модель.

Щоб швидко зміцнити цей замкнений цикл, Google прямо оголосила цінову війну всім конкурентам: пакет AI Ultra було знижено з $249,99/місяць до $99,9/місяць.

Ціна вхідних даних для мільйона токенів 3.5 Flash впала до $0,02, а вихідна ціна за мільйон токенів становить $0,08.

Що це за неймовірна ціна?

Для порівняння, середні ціни на моделі аналогічного рівня в галузі становлять близько $0,15-0,2 за вхідні дані та $0,6-1 за вихідні.

Якщо підрахувати, топові клієнти обробляють близько 1 трильйона токенів щодня. Перенесення 80% робочого навантаження на Gemini 3.5 Flash протягом року може заощадити понад $1 мільярд.

Чому вони наважуються продавати ШІ за такою низькою ціною?

Головна опора: вертикально інтегрована інфраструктура обчислювальних потужностей.

Включаючи таких гігантів, як OpenAI та Anthropic, вони можуть здаватися гламурними, але по суті вони все ще є «орендарями обчислювальних потужностей», яким потрібно купувати потужності у Microsoft та Amazon, які, своєю чергою, повинні платити «старому Хуану» (NVIDIA).

Google має власні TPU, і в поєднанні з надзвичайно ефективною розрідженою активацією MoE у 3.5 Flash, вона стиснула витрати на обчислювальні потужності до краю.

Вони можуть повною мірою використовувати свої переваги важких активів, щоб завдати удару по компаніях, що займаються виключно алгоритмами.

Логіка зрозуміла.

Базові великі моделі швидко стають товаром. Як і вода чи електрика, чи бачили ви коли-небудь, щоб водопостачальна компанія отримувала надприбутки?

Google не боїться, що самі великі моделі не приносять грошей, тому що вони можуть повернути їх через пошукову рекламу, хмарні сервіси та комісії від екосистеми Android.

Але для таких компаній, як OpenAI, Anthropic, Cohere та Mistral, які покладаються виключно на продаж API великих моделей, це неможливо.

Інвестори, мабуть, зараз хочуть натиснути на голову «Ультрамена» (Сема Альтмана) і запитати: «Ціна API Google становить лише одну десяту від вашої, а продуктивність краща за вашу. Як ви очікуєте, що ваша бізнес-модель працюватиме?»

Конкурентне середовище в багатьох галузях таким чином увійде в період прискореного перерозподілу.

ШІ-вендори повинні швидко знайти дешевші джерела обчислювальних потужностей або почати створювати власні чипи.

Наступна — Apple, яка все ще будує свою екосистему ізольовано.

Поєднання розумних окулярів + відеомоделі Omni + нативного системного захоплення Spark, безсумнівно, загрожує iPhone.

Згідно зі «Звітом про прогноз тенденцій споживчої електроніки» Macquarie: У найближчі три роки частка безекранних взаємодій на основі зору/голосу, як очікується, зросте з нинішніх 8% до 35%.

Якщо користувачі звикнуть виконувати щоденну роботу та розваги за допомогою окулярів і голосу, час використання екранів неминуче значно скоротиться.

Якщо Apple не зможе випустити достатньо вражаючі носні пристрої для протидії (Vision Pro занадто важкий і дорогий, приречений бути іграшкою для меншості), її монополія на точки входу в епоху мобільного інтернету зіткнеться з безпрецедентними викликами.

Це не ітерація; це революція.

Google кинула виклик усім конкурентам, використовуючи технології, трафік і ціну як три зброї.

Чи є зараз хтось, хто все ще висміює її за «хворобу великого підприємства»?

Ціна --

--

Вам також може сподобатися

IOSG Founder: Please tell Vitalik the truth, let the OGs who have enjoyed the industry's dividends enlighten the young people

The wage earners freeze to death on the road, the sellers of goods die of thirst on the way. The weavers of brocade wear coarse cloth, and the grain growers do not have enough to eat.

Morning Report | SpaceX reveals it holds approximately $1.45 billion in Bitcoin; Nvidia's Q1 financial report shows revenue of $81.6 billion; Manus plans to raise $1 billion for buyback business

Overview of Important Market Events on May 21

Insiders: DeepSeek is forming a Harness team to compete with Claude Code

DeepSeek Code is coming.

SpaceX officially submitted its prospectus, unveiling the largest IPO in history

SpaceX's public market debut could take place as early as June, making it the first in a series of giant IPOs from AI companies, with OpenAI and Anthropic also waiting for the right moment.

The financial changes under the new SEC regulations: Opportunities and regulatory red lines behind "tokenized stocks"

In-depth analysis of "tokenized stocks": The SEC's advancement of an innovation exemption framework has sparked heated discussions, revealing the real risks behind third-party "synthetic asset" certificates and 24/7 trading.

Blockchain Capital Partner: The structure of on-chain dual-layer capital is still in the early stages of value discovery

How can the on-chain economy build a capital structure that promotes open innovation while also considering institutional scale?

Вміст

Популярні монети

Останні новини криптовалют

Читати більше
iconiconiconiconiconicon
Підтримка клієнтів:@weikecs
Співпраця:@weikecs
Кількісна торгівля та маркетмейкінг:[email protected]
VIP-програма:[email protected]