Google officially declares war
Автор статті: Chengbei XugongАналітична підтримка: Gougu Big Data
Конференція розробників Google I/O 2026 року викликає лише одне враження: зверхність.
Вони не лише інтегрували ШІ-агентів у всі ключові точки входу, як-от пошук, браузери, мобільні телефони та розумні окуляри, а й безперервно представили три головні інновації: Gemini 3.5 Flash, відеомодель Omni та абсолютно новий ШІ-помічник Spark.
Продемонструвавши свої переваги, вони з гордістю оголосили, що кількість щомісячних активних користувачів Gemini перевищила 900 мільйонів, а також офіційно повідомили про значне зниження цін.
Сенс простий: Я сильніший за вас і я дешевший за вас.
Хіба це не оголошення війни?
01
Найбільш приголомшливою подією конференції, безперечно, став дебют Gemini 3.5 Flash.
Зазвичай «Pro» означає основну модель, а «Flash» — легкість і швидкість.
За кількістю параметрів 3.5 Flash дійсно менша за 3.1 Pro, але майже в усіх тестах на логічні висновки та написання коду вона показала дивовижно кращі результати:
У складному тесті з математичних міркувань GSM8K модель 3.5 Flash набрала 95,8%, перевершивши 93,2% у 3.1 Pro; у повній версії тесту на генерацію коду SWE-bench модель 3.5 Flash досягла рівня успішності 38,4%, значно випередивши 32,1% у 3.1 Pro...
Чому?
Згідно зі «Звітом про технології Gemini 3.5», опублікованим DeepMind, найважливішими є дві ключові технології.
Екстремальна дистиляція знань: Google не просто покладалася на нарощування обчислювальних потужностей для навчання Flash; натомість вони використали ще не випущену модель «Gemini 3.5 Ultra» як модель-вчителя для проведення дистиляції з пониженням розмірності для Flash.
Згідно з аналізом твіта головного науковця DeepMind Джеффа Діна, коефіцієнт тонкого налаштування 3.5 Flash на високоякісних наборах даних логічних ланцюжків покращився на 400% порівняно з попереднім поколінням.
Це означає, що вона успадковує «логічний мозок» надвеликої моделі, а не просто зазубрену «базу знань».
Абсолютно нова архітектура MoE (Mixture of Experts): Усередині 3.5 Flash компанія Google застосувала більш деталізовану мережу експертів.
Традиційна MoE може мати лише 8 або 16 експертів, активуючи лише 1-2 одночасно, чого достатньо для підтримки моделей із трильйонами параметрів.
Згідно з аналізом у меморандумі a16z щодо інвестицій в ШІ-інфраструктуру 2026 року, 3.5 Flash використовує 256 мікроекспертів, активуючи до 4 найефективніших під час кожного висновку.
Це дозволяє їй охоплювати надзвичайно великий мультимодальний простір ознак, зберігаючи при цьому надзвичайно низьку кількість активованих параметрів.
Що стосується TTFT (часу до першого токена), 3.5 Flash вже досягла показника менше 65 мілісекунд.
А людське кліпання очима займає 100-150 мілісекунд.
Коротше кажучи, коли вона працює як агент, з точки зору людської фізіології, жодної помітної паузи взагалі немає.
Для розробників, яким потрібно часто використовувати інструменти, проводити багаторазові роздуми та мати наднизьку затримку, це ідеальна основа для супер-агента.
Тільки завдяки такій екстремальній інженерній оптимізації можна встановити домінування у «периферійному розгортанні» в умовах жорсткої конкуренції.
Перша — це нативна мультимодальна Gemini Omni Flash.
Omni означає всемогутній, що відповідає попередній GPT-4o; лише за назвою можна відчути інтенсивну конкуренцію.
Принаймні з точки зору продуктивності, Gemini Omni Flash набагато більше заслуговує на використання літери «o», ніж GPT-4o.
Ранні версії, такі як Sora або Gemini 1.5, були по суті «клаптиковими», перетворюючи мову на текст, а потім текст на візуальні образи.
Але Omni, випущена цього разу, — це справжнє нативне наскрізне мультимодальне узгодження. Вона може не лише розуміти часову послідовність і фізичні закони у відео, а й скоротити середню затримку в галузі з 400-600 мілісекунд до 120 мілісекунд.
Наприклад, під час конференції: користувач із камерою наливає воду, і коли чашка ось-ось переповниться, Omni може сказати «стоп, стоп, стоп!» за 0,5 секунди до того, як вода проллється.
Це виведення фізичного стану реального світу в реальному часі може здатися простим, але воно має велике значення: ШІ офіційно перетворився з чат-бота на екрані на допоміжний інструмент у реальному світі.
Навіть якщо він все ще на ранніх стадіях.
Друга — це інтелектуальний помічник Spark.
Згідно зі звітом The Verge, де інтерв’ювали віцепрезидента з розробки Android, Spark отримав контроль над нативним API системи Android 17.
Коротше кажучи, складні процеси, які раніше вимагали відкриття багатьох програм, тепер можна виконати, не поворухнувши пальцем; просто дайте вказівку Spark, і він впорається з усім: від надсилання повідомлень, упорядкування електронних листів, підсумовування розкладу, відстеження вебдинаміки, виявлення прихованих платежів у рахунках до пакетної обробки документів тощо...
Іншими словами, з ШІ-помічником нам майже не знадобляться програми; будь-яка складна операція спрощується до однієї команди.
Третє — це розумні окуляри.
Чому знову окуляри?
Принаймні з точки зору Google, безперешкодний доступ до зору та слуху є ідеальним носієм для мультимодальних великих моделей.
Ці окуляри не мають яскравого вигляду, повністю зосереджуючись на практичних можливостях:
Повноколірні хвилеводні лінзи Micro-OLED вагою лише 4 грами, зі світлопропусканням до 85%;
Оснащені власною легкою периферійною мікросхемою Gemini, затримка локального висновку ≤12 мс, здатні до перекладу в реальному часі, розпізнавання зображень та аналізу сцени без підключення до інтернету;
Нативно пов’язані з агентом Spark, синхронізують мобільні та хмарні дані для надання персоналізованих послуг, таких як нагадування про розклад, переклад у реальному часі та сповіщення про навколишнє середовище.
Коротше кажучи, вони оминають екран смартфона, інтегруючи агента в людську перспективу від першої особи через окуляри.
Контенту просто забагато; Google, здається, виклала всі свої козирі одразу, проголосивши ринку істину:
Алгоритм без точки входу — це ніщо.
Ера нарощування параметрів моделі та результатів тестів минула; чисті постачальники моделей більше не мають «рову» навколо свого бізнесу. Майбутнє — це чотиривимірна космічна битва «периферія + хмара + екосистема + обладнання».
Начинка ШІ в «сімейний кошик» насправді змінює логіку розподілу трафіку в усьому інтернеті: від «користувачів, які активно шукають/клацають» до «ШІ-агентів, які активно розподіляють послуги».
Для величезної кількості розробників та малого й середнього бізнесу це чудові новини, оскільки базові обчислювальні потужності та моделі стали надзвичайно дешевими, що дозволяє кожному зосередитися на інноваціях на рівні додатків.
Але інші конкуренти, мабуть, зараз просто лаються.
02
Коли вони невимушено оголосили зі сцени, що «кількість щомісячних активних користувачів Gemini офіційно перевищила 900 мільйонів», це викликало неабиякий ажіотаж у залі.
900 мільйонів — це більше, ніж сукупна кількість активних користувачів усіх конкурентів у США.
Як вони цього досягли?
Відповідь проста і жорстока: примусове впровадження.
Google не потрібно витрачати гроші на рекламу для залучення користувачів, як незалежним ШІ-компаніям; їй просто потрібно додати іконку поруч із адресним рядком у браузері Chrome, інтегрувати клавішу швидкого доступу в нижню панель навігації 3 мільярдів телефонів Android і розсилати оновлення через Google Workspace...
Вартість залучення клієнтів по суті дорівнює нулю.
Що ще важливіше, протягом наступного періоду погляди 900 мільйонів активних користувачів під час перегляду товарів через розумні окуляри, логіка, виправлена під час виконання завдань зі Spark, та взаємодія з візуальною моделлю Omni генеруватимуть величезну кількість високоякісних мультимодальних даних реального світу, які живитимуть Gemini 4.
Це створює надзвичайно міцний бар’єр: чим краща модель у використанні -> тим більше користувачів вона приваблює -> тим більше даних вона генерує -> тим кращою стає модель.
Щоб швидко зміцнити цей замкнений цикл, Google прямо оголосила цінову війну всім конкурентам: пакет AI Ultra було знижено з $249,99/місяць до $99,9/місяць.
Ціна вхідних даних для мільйона токенів 3.5 Flash впала до $0,02, а вихідна ціна за мільйон токенів становить $0,08.
Що це за неймовірна ціна?
Для порівняння, середні ціни на моделі аналогічного рівня в галузі становлять близько $0,15-0,2 за вхідні дані та $0,6-1 за вихідні.
Якщо підрахувати, топові клієнти обробляють близько 1 трильйона токенів щодня. Перенесення 80% робочого навантаження на Gemini 3.5 Flash протягом року може заощадити понад $1 мільярд.
Чому вони наважуються продавати ШІ за такою низькою ціною?
Головна опора: вертикально інтегрована інфраструктура обчислювальних потужностей.
Включаючи таких гігантів, як OpenAI та Anthropic, вони можуть здаватися гламурними, але по суті вони все ще є «орендарями обчислювальних потужностей», яким потрібно купувати потужності у Microsoft та Amazon, які, своєю чергою, повинні платити «старому Хуану» (NVIDIA).
Google має власні TPU, і в поєднанні з надзвичайно ефективною розрідженою активацією MoE у 3.5 Flash, вона стиснула витрати на обчислювальні потужності до краю.
Вони можуть повною мірою використовувати свої переваги важких активів, щоб завдати удару по компаніях, що займаються виключно алгоритмами.
Логіка зрозуміла.
Базові великі моделі швидко стають товаром. Як і вода чи електрика, чи бачили ви коли-небудь, щоб водопостачальна компанія отримувала надприбутки?
Google не боїться, що самі великі моделі не приносять грошей, тому що вони можуть повернути їх через пошукову рекламу, хмарні сервіси та комісії від екосистеми Android.
Але для таких компаній, як OpenAI, Anthropic, Cohere та Mistral, які покладаються виключно на продаж API великих моделей, це неможливо.
Інвестори, мабуть, зараз хочуть натиснути на голову «Ультрамена» (Сема Альтмана) і запитати: «Ціна API Google становить лише одну десяту від вашої, а продуктивність краща за вашу. Як ви очікуєте, що ваша бізнес-модель працюватиме?»
Конкурентне середовище в багатьох галузях таким чином увійде в період прискореного перерозподілу.
ШІ-вендори повинні швидко знайти дешевші джерела обчислювальних потужностей або почати створювати власні чипи.
Наступна — Apple, яка все ще будує свою екосистему ізольовано.
Поєднання розумних окулярів + відеомоделі Omni + нативного системного захоплення Spark, безсумнівно, загрожує iPhone.
Згідно зі «Звітом про прогноз тенденцій споживчої електроніки» Macquarie: У найближчі три роки частка безекранних взаємодій на основі зору/голосу, як очікується, зросте з нинішніх 8% до 35%.
Якщо користувачі звикнуть виконувати щоденну роботу та розваги за допомогою окулярів і голосу, час використання екранів неминуче значно скоротиться.
Якщо Apple не зможе випустити достатньо вражаючі носні пристрої для протидії (Vision Pro занадто важкий і дорогий, приречений бути іграшкою для меншості), її монополія на точки входу в епоху мобільного інтернету зіткнеться з безпрецедентними викликами.
Це не ітерація; це революція.
Google кинула виклик усім конкурентам, використовуючи технології, трафік і ціну як три зброї.
Чи є зараз хтось, хто все ще висміює її за «хворобу великого підприємства»?
Вам також може сподобатися

IOSG Founder: Please tell Vitalik the truth, let the OGs who have enjoyed the industry's dividends enlighten the young people

Morning Report | SpaceX reveals it holds approximately $1.45 billion in Bitcoin; Nvidia's Q1 financial report shows revenue of $81.6 billion; Manus plans to raise $1 billion for buyback business

Insiders: DeepSeek is forming a Harness team to compete with Claude Code

SpaceX officially submitted its prospectus, unveiling the largest IPO in history

The financial changes under the new SEC regulations: Opportunities and regulatory red lines behind "tokenized stocks"

Blockchain Capital Partner: The structure of on-chain dual-layer capital is still in the early stages of value discovery

Secured over $60 million in funding from Dragonfly, Sequoia, and others, learn about the on-chain derivatives protocol Variational | CryptoSeed

I tested with $10,000: zero wear and tear, annualized 8%, and can earn points (with complete tutorial + screenshots)

Morning Report | Deloitte acquires crypto infrastructure company Blocknative; stablecoin company Checker completes $8 million financing; a16z may have become the largest external institutional holder of HYPE

Interpretation of xBubble SOP: Packaging Vibe Coding for non-technical users

From Followers to Price Setters: The Role of the Crypto Market is Reversing

a16z invested $356 million to aggressively acquire HYPE, surpassing Paradigm to become the largest external holding institution

Coinbase stuffed USDC into Hyperliquid; who made money from this transaction?

It is Bankless that needs Ethereum, not Ethereum that needs Bankless

I’m sorry, but it seems that the original article …
I’m sorry, but it seems that the original article content is not available for me to reference and…

Bitcoin’s $55,000 Threshold Defines Market Trajectory
Ключові висновки: результативність Bitcoin залежить від важливих цінових порогів, при цьому рівні $55 000 та $60 000 визначені як вирішальні для…

Michael Saylor Experiences Negative Returns on $55 Billion Bitcoin Investment
Основні тези: Майкл Сейлор переживає складний період, оскільки ціна Bitcoin впала на 8% нижче його середньої ціни купівлі.…

Bitcoin Analysts Predict Possible Drop to $55,000 if Key Support Breaks
Основні тези: аналітики прогнозують потенційне падіння до $55 000, якщо рівні підтримки Bitcoin не встоять. Ймовірність того, що Bitcoin…





