logo

Xiaomi і MiniMax розкривають свої найсильніші ходи, що сигналізує про початок цінової війни за агентами.

By: blockbeats|2026/03/20 13:27:16
0
Поширити
copy

18 і 19 березня дві китайські компанії послідовно випустили свої відповідні великі моделі, орієнтовані на агентів. Міс старту AI MiniMax запустив M2.7, а команда великих моделей Xiaomi MiMo представила V2-Pro. Обидві моделі увійшли до світового топ-рівня в агентському бенчмарку, але їх ціни на вихід API становлять 1/21 і 1/8 від Claude Opus 4.6 відповідно.

Обидві компанії розіграли свої карти на тому ж тижні, але з абсолютно різними руками. Вони представляють два абсолютно різні технічні шляхи, роблячи ставку на два майбутні періоди ери Агента.

Така сама експертиза, плата за навчання 1/17

Спочатку розглянемо найбільш інтуїтивне порівняння.

Xiaomi і MiniMax розкривають свої найсильніші ходи, що сигналізує про початок цінової війни за агентами.

Згідно з OpenRouter і різними офіційними сторінками з цінами компаній, виходячи з ціни виведення через API (за мільйон токенів), MiniMax M2.7 становить 1,2 дол. США, а MiMo-V2-Pro – 3 дол. Як довідка, ціна виведення для Claude Opus 4.6 становить 25 дол. США, GPT-5.2 – 14 дол. США, а Claude Sonnet 4.6 – 15 дол. США.

Різниця в ціні становить порядок величини, але різниця в продуктивності – ні. У SWE-bench Verified (сучасному основному тесті для вимірювання можливостей інженерії коду) MiMo-V2-Pro набрав 78%, Sonnet 4.6 – 79,6%, різниця становить менше двох процентних пунктів. Оцінка M2.7 у SWE-Pro становить 56,22%, що відповідає рівню GPT-5.3-Codex. У VIBE-Pro (можливість комплексної доставки проекту) M2.7 набрав 55,6%, що наближається до рівня Opus 4.6.

У цьому графіку акцент не на тому, хто вище або нижче — системи орієнтирів різних компаній не повністю узгоджені, тому прямі порівняння слід робити обережно. Акцент на "різниці у співвідношенні ціна-продуктивність": вітчизняні моделі Agent стиснулися в один діапазон продуктивності, але знаходяться в абсолютно різних цінових діапазонах.

Трильйон параметрів проти. Саморозвитку

Ціна — це лише поверхня. Дві компанії представили два абсолютно різні набори козирів.

MiMo-V2-Pro слідує маршруту «йти у великий бізнес або взагалі не йти». Згідно з офіційною заявою Xiaomi, V2-Pro має понад 1 трильйон загальних параметрів, 42 мільярди параметрів активації та підтримує надзвичайно довгий контекст у 1 мільйон токенів. Її основним нововведенням є змішаний механізм уваги Hybrid Attention, який регулює співвідношення Sliding Window Attention (SWA) до Global Attention (GA) до 7:1, тоді як у попередника V2-Flash воно було 5:1. Ця архітектура робить модель більш стабільною у сценаріях, де обробляються довгі документи та паралельні виклики інструментів у сценах агента. У PinchBench (інструмент для оцінки можливостей виклику агента) MiMo-V2-Pro набрав 84%.

M2.7 пішов зовсім іншим шляхом. Згідно з офіційним технічним блоґом MiniMax від 18 березня, кількість параметрів M2.7 не розголошувалася, але він продемонстрував механізм "самостійної ітеративної еволюції": модель автономно запустила понад 100 циклів оптимізації, включаючи аналіз траєкторій відмов, планування модифікацій, зміну власної архітектури коду, проведення оцінок і повторення циклу, що в підсумку призвело до підвищення продуктивності на 30% у внутрішньому наборі оцінок. У MLE Bench Lite (оцінка складності конкурсу з машинного навчання) з 22 складних задач M2.7 здобув 9 золотих, 5 срібних і 1 бронзову медаль, з середнім показником медалей 66,6%.

З п'яти вимірів два шляхи спрямовані в абсолютно різних напрямках: MiMo-V2-Pro явно домінує в контексті довжини та розмірів інженерного коду, тоді як M2.7 збільшує розрив у автоматизації офісу та самоітеративній здатності. Згідно з публікацією в технічному блозі MiniMax, M2.7 набрав ELO 1495 на GDPval-AA (Оцінка обробки офісних документів), посівши перше місце серед моделей з відкритим вихідним кодом, і зберіг показник відповідності навичок 97% у тесті MM-Claw, що охоплює понад 40 складних навичок.

Чотири версії за п'ять місяців

Не тільки технічні шляхи двох компаній різні, але й їхні ритми ітерації також абсолютно різні.

Згідно з публічними даними про випуск, з випуску M2 у жовтні 2025 року до випуску M2.7 у березні 2026 року, MiniMax випустив чотири версії протягом п'яти місяців, у середньому одну основну версію кожні 49 днів. Проміжок між M2.5 і M2.7 становив лише близько 30 днів.

Ритм Xiaomi MiMo відрізняється: MiMo-7B був випущений у квітні 2025 року (модель інтерпретації з відкритим вихідним кодом з параметрами 7B), V2-Flash був випущений у грудні того ж року (з загальною кількістю параметрів 309B), а V2-Pro був випущений у березні 2026 року (з загальною кількістю параметрів 1T). Масштаб параметрів між кожним поколінням набагато більший, але інтервали між версіями також довший.

MiniMax обрав невеликі, часті кроки, причому кожна ітерація не робить великих стрибків, але з дуже високою частотою. Механізм самопокращення M2.7 розроблений для «безперервної еволюції». Xiaomi обрала більш ефективний підхід, при якому кожна версія має суттєві зміни в масштабі параметрів і архітектурі.

Ціна --

--

Анонімний 8 днів, Summit OpenRouter

Крім технічного плану, стратегія випуску Xiaomi також порушила галузеві звичаї.

За даними Reuters, 11 березня на найбільшій у світі платформі для агрегації API, OpenRouter, з'явилася анонімна модель під назвою Hunter Alpha. Жодного схвалення бренду, жодного заходу з запуску продукту, жодного технічного блогу. Ціни на його API були надзвичайно низькими, але його продуктивність виявилася напрочуд високою.

Спільнота почала будувати припущення щодо його походження. За даними Republic World та кількох технічних ЗМІ, найпоширенішою версією було те, що це DeepSeek V4, оскільки керівник команди MiMo Ло Фулі раніше працював над дослідженнями в DeepSeek. Кількість викликів API швидко зросла, а загальна кількість викликів під час анонімного періоду перевищила 1 трильйон токенів, досягнувши вершини щотижневого рейтингу OpenRouter.

19 березня компанія Xiaomi розкрила: Hunter Alpha - це дійсно MiMo-V2-Pro. Згідно з тим самим звітом Reuters, акції Xiaomi у Гонконзі зросли на 5,8% після цього розкриття.

Вперше масштабна вітчизняна модель довела себе на глобальній платформі за допомогою суто сліпого тестування. Не покладаючись на бренд, не покладаючись на рекламу, знадобилося 8 днів, щоб розробники проголосували ногами.

Вам також може сподобатися

Штучний інтелект починає поглинати виробничу промисловість | Rewire News Morning Edition

Коли Безос починає використовувати штучний інтелект для покупки заводів замість будівництва центрів обробки даних, це свідчить про те, що він вважає, що наступна хвиля цінності штучного інтелекту не знаходиться всередині коробки.

Коли масштабування зустрічається зі швидкістю, Фонд Ethereum впроваджує "Hardness", щоб захистити базовий рівень

Hardness - це протокольний рівень зобов'язань щодо основних властивостей Ethereum, включаючи стійкість до цензури, конфіденційність, безпеку та відсутність дозволів.

Google, Circle, Stripe об'єднуються, щоб дозволити AI витрачати гроші: Радощі та тривоги гігантів платежів у першому кварталі 2026 року

Справжній ворог – це вже не один одного, а нульова вартість сама по собі

Закупівля заводу на 100 мільярдів доларів: Безос і капітал Близького Сходу перенаправляють гроші з хмарних технологій на виробництво

Безос не інвестує в нову модель; він інвестує в ланцюжок поставок.

Прогнозування ринків опинилося в центрі уваги, але Perp DEX тихо веде війну проти традиційних бірж.

Протягом вихідних, що відзначилися безперервною волатильністю, поки традиційні фінансові ринки були закриті, ще одна хвиля інвесторів активно торгувала золотом, нафтою та сріблом на блокчейн-платформі.

Чи криза на ринку все ще приносить мільйони на день? Чи реальний дохід pump.fun?

Якщо це дійсно вигідно, то що стримує ціну $PUMP?

Популярні монети

Останні новини криптовалют

Читати більше
iconiconiconiconiconicon

Бот служби підтримки@WEEX_support_smart_Bot

VIP-послуги[email protected]