شیائومی و مینیمکس هر دو اقدامات نهایی خود را آغاز کردند و این نشان از آغاز جنگ قیمتگذاری عامل (Agent Priceing War) دارد.
در ۱۸ و ۱۹ مارس، دو شرکت چینی به ترتیب مدلهای بزرگ خود را که بر اساس پلتفرم Agent طراحی شده بودند، منتشر کردند. استارتاپ هوش مصنوعی داخلی MiniMax، مدل M2.7 را عرضه کرد و تیم بزرگ مدلسازی شیائومی، MiMo، مدل V2-Pro را معرفی کرد. هر دو مدل در بنچمارک Agent وارد رده برتر جهانی شدند، اما قیمت خروجی API آنها به ترتیب ۱/۲۱ و ۱/۸ Claude Opus 4.6 است.
هر دو شرکت در یک هفته، اما با دستهای کاملاً متفاوت، کارتهای خود را بازی کردند. آنها دو مسیر فنی کاملاً متفاوت را نشان میدهند و روی دو آینده از دوران Agent شرط میبندند.
همان امتحان، شهریه ۱/۱۷
اول، بیایید به شهودیترین مقایسه نگاهی بیندازیم.

طبق اطلاعات OpenRouter و صفحات قیمتگذاری رسمی مختلف این شرکت، بر اساس قیمت خروجی API (به ازای هر میلیون توکن)، MiniMax M2.7 1.2 دلار و MiMo-V2-Pro 3 دلار قیمت دارند. به عنوان مرجع، قیمت خروجی Claude Opus 4.6، 25 دلار، GPT-5.2، 14 دلار و Claude Sonnet 4.6، 15 دلار است.
اختلاف قیمت خیلی زیاده، اما اختلاف عملکرد نه. در SWE-bench Verified (معیار اصلی فعلی برای اندازهگیری توانایی مهندسی کد)، MiMo-V2-Pro امتیاز 78 درصد و Sonnet 4.6 امتیاز 79.6 درصد را کسب کرد که اختلافی کمتر از دو درصد است. امتیاز SWE-Pro مربوط به M2.7، 56.22 درصد است که با GPT-5.3-Codex برابری میکند. در VIBE-Pro (قابلیت تحویل پروژه از ابتدا تا انتها)، M2.7 امتیاز 55.6٪ را کسب کرد که به سطح Opus 4.6 نزدیک میشود.
تمرکز این نمودار بر روی این نیست که چه کسی بالاتر یا پایینتر است - سیستمهای معیار شرکتهای مختلف کاملاً همسو نیستند، بنابراین مقایسههای مستقیم باید با احتیاط انجام شود. تمرکز بر روی «تفاوت قیمت-عملکرد» است: مدلهای داخلی Agent در یک محدوده عملکرد قرار گرفتهاند، اما در محدودههای قیمتی کاملاً متفاوتی هستند.
تریلیون پارامتر در مقابل خود-تکاملی
قیمت فقط ظاهر قضیه است. این دو شرکت دو مجموعه کاملاً متفاوت از برگ برندهها را ارائه دادهاند.
MiMo-V2-Pro از مسیر «یا کار بزرگی انجام بده یا به خانه برگرد» پیروی میکند. طبق اعلام رسمی شیائومی، V2-Pro در مجموع بیش از ۱ تریلیون پارامتر، ۴۲ میلیارد پارامتر فعالسازی دارد و از یک بافت فوق طولانی شامل ۱ میلیون توکن پشتیبانی میکند. نوآوری اصلی آن، مکانیزم توجه ترکیبی (Hybrid Attention) است که نسبت توجه پنجره کشویی (SWA) به توجه کلی (GA) را به 7:1 تنظیم میکند - نسبت V2-Flash قبلی آن 5:1 بود. این معماری، مدل را در سناریوهایی که اسناد طولانی پردازش میشوند و چندین ابزار به طور موازی در صحنهی عامل فراخوانی میشوند، پایدارتر میکند. در PinchBench (ارزیابی قابلیت فراخوانی ابزار عامل)، MiMo-V2-Pro امتیاز ۸۴٪ را کسب کرد.
M2.7 مسیر کاملاً متفاوتی را در پیش گرفت. طبق پست رسمی وبلاگ فناوری MiniMax در ۱۸ مارس، تعداد پارامترهای M2.7 فاش نشده است، اما یک مکانیسم «تکامل خود-تکرارشونده» را نشان میدهد: این مدل به طور خودکار بیش از ۱۰۰ حلقه بهینهسازی را اجرا میکند، از جمله تجزیه و تحلیل مسیرهای شکست، برنامهریزی اصلاحات، اصلاح معماری کد خود، اجرای ارزیابیها و تکرار مجدد حلقه، و در نهایت به بهبود عملکرد ۳۰ درصدی در یک مجموعه ارزیابی داخلی دست مییابد. در MLE Bench Lite (ارزیابی سختی مسابقه یادگیری ماشین)، از بین ۲۲ مسئله چالشبرانگیز، M2.7 با میانگین نرخ مدال ۶۶.۶٪، ۹ مدال طلا، ۵ نقره و ۱ برنز کسب کرد.

از پنج بُعد، این دو مسیر در جهات کاملاً متفاوتی قرار دارند: MiMo-V2-Pro به وضوح از نظر طول متن و ابعاد مهندسی کد برتری دارد، در حالی که M2.7 شکاف را در اتوماسیون اداری و قابلیت خود-تکرارشوندگی افزایش میدهد. طبق همان پست وبلاگ فناوری MiniMax، M2.7 در GDPval-AA (ارزیابی پردازش اسناد آفیس) امتیاز ELO 1495 را کسب کرد و در بین مدلهای متنباز رتبه اول را کسب کرد و در آزمون MM-Claw که بیش از 40 مهارت پیچیده را پوشش میدهد، نرخ انطباق مهارت 97 درصدی را حفظ کرد.
چهار نسخه در پنج ماه
نه تنها مسیرهای فنی این دو شرکت متفاوت است، بلکه ریتم تکرار آنها نیز کاملاً متفاوت است.
طبق سوابق انتشار عمومی، از انتشار M2 در اکتبر 2025 تا انتشار M2.7 در مارس 2026، MiniMax چهار نسخه را در عرض پنج ماه منتشر کرد که به طور متوسط هر 49 روز یک نسخه اصلی بود. فاصله بین M2.5 و M2.7 تنها حدود 30 روز بود.
ریتم MiMo شیائومی متفاوت است: MiMo-7B در آوریل ۲۰۲۵ (یک مدل استنتاج متنباز با ۷ پارامتر)، V2-Flash در دسامبر همان سال (با مجموع ۳۰۹ پارامتر) و V2-Pro در مارس ۲۰۲۶ (با مجموع ۱T پارامتر) منتشر شدند. مقیاس پارامتر بین هر نسل بسیار بزرگتر است، اما فواصل بین نسخهها نیز طولانیتر است.
MiniMax گامهای کوچک و مکرر را انتخاب کرد، به طوری که در هر تکرار، جهشهای بزرگی ایجاد نمیکرد، اما با فرکانس بسیار بالا. خودِ سازوکار خودتکرارشوندهی M2.7 برای «تکامل مداوم» طراحی شده است. شیائومی رویکرد تأثیرگذارتری را انتخاب کرد و هر نسخه شامل تغییرات قابل توجهی در مقیاس پارامترها و معماری بود.

ناشناس ۸ روزه، اجلاس OpenRouter
علاوه بر نقشه راه فنی، استراتژی انتشار شیائومی نیز عرفهای صنعت را زیر پا گذاشته است.
به گزارش رویترز، در ۱۱ مارس، یک مدل ناشناس به نام Hunter Alpha در بزرگترین پلتفرم تجمیع API جهان، OpenRouter، ظاهر شد. نه حمایت از برند، نه مراسم رونمایی از محصول، نه وبلاگ فنی. قیمت API آن بسیار پایین بود، با این حال عملکرد آن به طرز شگفتآوری قوی بود.
جامعه شروع به گمانهزنی در مورد ریشههای آن کرد. طبق گزارش Republic World و چندین رسانه فناوری، رایجترین گمانهزنیها مربوط به DeepSeek V4 بود، زیرا لوو فولی، رهبر تیم MiMo، پیش از این در DeepSeek روی تحقیقات کار کرده بود. تعداد فراخوانیهای API به سرعت افزایش یافت و تعداد کل فراخوانیها در دوره ناشناس از ۱ تریلیون توکن فراتر رفت و به صدر رتبهبندی هفتگی OpenRouter رسید.

اوایل ۱۹ مارس، شیائومی فاش کرد: هانتر آلفا در واقع همان MiMo-V2-Pro است. طبق همان گزارش رویترز، سهام شیائومی در هنگ کنگ پس از این افشاگری، یک بار ۵.۸ درصد افزایش یافت.
این اولین باری است که یک مدل بزرگ داخلی از طریق آزمایش کاملاً کور، خود را در یک پلتفرم جهانی اثبات کرده است. بدون تکیه بر برند، بدون تکیه بر تبلیغات، ۸ روز طول کشید تا به توسعهدهندگان اجازه داده شود با پای خود رأی دهند.
ممکن است شما نیز علاقهمند باشید

هوش مصنوعی شروع به بلعیدن صنعت تولید میکند | نسخه صبحگاهی Rewire News

وقتی مقیاسپذیری با سرعت تلاقی میکند، بنیاد اتریوم «سختی» را برای محافظت از لایه پایه معرفی میکند

گوگل، سِرِکل و استرایپ گرد هم میآیند تا به هوش مصنوعی اجازه خرجکردن پول بدهند: شادیها و نگرانیهای غولهای پرداخت در سهماهه اول ۲۰۲۶

خرید کارخانه ۱۰۰ میلیارد دلاری: بزوس و سرمایه خاورمیانه، سرمایه هوش مصنوعی را از فضای ابری به فروشگاهها منتقل میکنند

پیشبینی بازارها در کانون توجه قرار گرفته است، اما Perp DEX بهطور خاموش در حال جنگ با صرافیهای سنتی بوده است.

آیا رکود بازار هنوز میلیونها دلار در روز درآمد دارد؟ آیا درآمد pump.fun واقعی است؟

درک x402 و MPP در یک مقاله: دو مسیر پرداختهای نماینده

نگاهی سریع به ۱۸ پروژه فارغالتحصیلی اخیر از Alliance: پمپ.فان بعدی کیست؟

فقط بازار پیشبینی از جنگ عراق سود نمیبرد

گزارش صبحگاهی | بیتوایز، کورس وان را خریداری کرد؛ سیرکل عملکرد سهماهه چهارم ۲۰۲۵ و کل سال را اعلام کرد؛ استرایپ بازخرید سهام خود را با ارزش ۱۵۹ میلیارد دلار آغاز کرد

آیا ۹۹٪ توکنها به صفر خواهند رسید؟

«کارت بانکی» هوش مصنوعی توجه غولها را به خود جلب کرده است

اخبار صبحگاهی | ایالات متحده آمریکا کمیسیون بورس و اوراق بهادار آمریکا (SEC) معاملات توکنیزه در نزدک را تأیید کرد؛ Animoca Brands سرمایهگذاری در توکنهای AVAX را اعلام کرد؛ بنیاد Algorand ادغام استراتژیک را تکمیل کرد.

Untitled
I’m sorry, I can’t assist with that request.

Untitled
I’m sorry, but I cannot complete this task.

مزایای رقابتی مقاوم در عصر هوش مصنوعی
تغییر اجتناب ناپذیر است؛ زمانی که هوش مصنوعی شروع به نوشتن کد و بهبود آن میکند، شکست مرزهای…

Untitled
I’m sorry, I can’t assist with that request.

منابع میگویند آمریکا و ایران حاضر به کنار رفتن نیستند، درگیری خاورمیانه میتواند طولانی شود
ایالات متحده و ایران در مورد مذاکره و یا آتشبس تمایلی ندارند، و این نشانهای است که هر…