logo

شیائومی و مینی‌مکس هر دو اقدامات نهایی خود را آغاز کردند و این نشان از آغاز جنگ قیمت‌گذاری عامل (Agent Priceing War) دارد.

By: بلاک بیتس|2026/03/20 13:25:21
0
اشتراک‌گذاری
copy

در ۱۸ و ۱۹ مارس، دو شرکت چینی به ترتیب مدل‌های بزرگ خود را که بر اساس پلتفرم Agent طراحی شده بودند، منتشر کردند. استارتاپ هوش مصنوعی داخلی MiniMax، مدل M2.7 را عرضه کرد و تیم بزرگ مدل‌سازی شیائومی، MiMo، مدل V2-Pro را معرفی کرد. هر دو مدل در بنچمارک Agent وارد رده برتر جهانی شدند، اما قیمت خروجی API آنها به ترتیب ۱/۲۱ و ۱/۸ Claude Opus 4.6 است.

هر دو شرکت در یک هفته، اما با دست‌های کاملاً متفاوت، کارت‌های خود را بازی کردند. آنها دو مسیر فنی کاملاً متفاوت را نشان می‌دهند و روی دو آینده از دوران Agent شرط می‌بندند.

همان امتحان، شهریه ۱/۱۷

اول، بیایید به شهودی‌ترین مقایسه نگاهی بیندازیم.

شیائومی و مینی‌مکس هر دو اقدامات نهایی خود را آغاز کردند و این نشان از آغاز جنگ قیمت‌گذاری عامل (Agent Priceing War) دارد.

طبق اطلاعات OpenRouter و صفحات قیمت‌گذاری رسمی مختلف این شرکت، بر اساس قیمت خروجی API (به ازای هر میلیون توکن)، MiniMax M2.7 1.2 دلار و MiMo-V2-Pro 3 دلار قیمت دارند. به عنوان مرجع، قیمت خروجی Claude Opus 4.6، 25 دلار، GPT-5.2، 14 دلار و Claude Sonnet 4.6، 15 دلار است.

اختلاف قیمت خیلی زیاده، اما اختلاف عملکرد نه. در SWE-bench Verified (معیار اصلی فعلی برای اندازه‌گیری توانایی مهندسی کد)، MiMo-V2-Pro امتیاز 78 درصد و Sonnet 4.6 امتیاز 79.6 درصد را کسب کرد که اختلافی کمتر از دو درصد است. امتیاز SWE-Pro مربوط به M2.7، 56.22 درصد است که با GPT-5.3-Codex برابری می‌کند. در VIBE-Pro (قابلیت تحویل پروژه از ابتدا تا انتها)، M2.7 امتیاز 55.6٪ را کسب کرد که به سطح Opus 4.6 نزدیک می‌شود.

تمرکز این نمودار بر روی این نیست که چه کسی بالاتر یا پایین‌تر است - سیستم‌های معیار شرکت‌های مختلف کاملاً همسو نیستند، بنابراین مقایسه‌های مستقیم باید با احتیاط انجام شود. تمرکز بر روی «تفاوت قیمت-عملکرد» است: مدل‌های داخلی Agent در یک محدوده عملکرد قرار گرفته‌اند، اما در محدوده‌های قیمتی کاملاً متفاوتی هستند.

تریلیون پارامتر در مقابل خود-تکاملی

قیمت فقط ظاهر قضیه است. این دو شرکت دو مجموعه کاملاً متفاوت از برگ برنده‌ها را ارائه داده‌اند.

MiMo-V2-Pro از مسیر «یا کار بزرگی انجام بده یا به خانه برگرد» پیروی می‌کند. طبق اعلام رسمی شیائومی، V2-Pro در مجموع بیش از ۱ تریلیون پارامتر، ۴۲ میلیارد پارامتر فعال‌سازی دارد و از یک بافت فوق طولانی شامل ۱ میلیون توکن پشتیبانی می‌کند. نوآوری اصلی آن، مکانیزم توجه ترکیبی (Hybrid Attention) است که نسبت توجه پنجره کشویی (SWA) به توجه کلی (GA) را به 7:1 تنظیم می‌کند - نسبت V2-Flash قبلی آن 5:1 بود. این معماری، مدل را در سناریوهایی که اسناد طولانی پردازش می‌شوند و چندین ابزار به طور موازی در صحنه‌ی عامل فراخوانی می‌شوند، پایدارتر می‌کند. در PinchBench (ارزیابی قابلیت فراخوانی ابزار عامل)، MiMo-V2-Pro امتیاز ۸۴٪ را کسب کرد.

M2.7 مسیر کاملاً متفاوتی را در پیش گرفت. طبق پست رسمی وبلاگ فناوری MiniMax در ۱۸ مارس، تعداد پارامترهای M2.7 فاش نشده است، اما یک مکانیسم «تکامل خود-تکرارشونده» را نشان می‌دهد: این مدل به طور خودکار بیش از ۱۰۰ حلقه بهینه‌سازی را اجرا می‌کند، از جمله تجزیه و تحلیل مسیرهای شکست، برنامه‌ریزی اصلاحات، اصلاح معماری کد خود، اجرای ارزیابی‌ها و تکرار مجدد حلقه، و در نهایت به بهبود عملکرد ۳۰ درصدی در یک مجموعه ارزیابی داخلی دست می‌یابد. در MLE Bench Lite (ارزیابی سختی مسابقه یادگیری ماشین)، از بین ۲۲ مسئله چالش‌برانگیز، M2.7 با میانگین نرخ مدال ۶۶.۶٪، ۹ مدال طلا، ۵ نقره و ۱ برنز کسب کرد.

از پنج بُعد، این دو مسیر در جهات کاملاً متفاوتی قرار دارند: MiMo-V2-Pro به وضوح از نظر طول متن و ابعاد مهندسی کد برتری دارد، در حالی که M2.7 شکاف را در اتوماسیون اداری و قابلیت خود-تکرارشوندگی افزایش می‌دهد. طبق همان پست وبلاگ فناوری MiniMax، M2.7 در GDPval-AA (ارزیابی پردازش اسناد آفیس) امتیاز ELO 1495 را کسب کرد و در بین مدل‌های متن‌باز رتبه اول را کسب کرد و در آزمون MM-Claw که بیش از 40 مهارت پیچیده را پوشش می‌دهد، نرخ انطباق مهارت 97 درصدی را حفظ کرد.

چهار نسخه در پنج ماه

نه تنها مسیرهای فنی این دو شرکت متفاوت است، بلکه ریتم تکرار آنها نیز کاملاً متفاوت است.

طبق سوابق انتشار عمومی، از انتشار M2 در اکتبر 2025 تا انتشار M2.7 در مارس 2026، MiniMax چهار نسخه را در عرض پنج ماه منتشر کرد که به طور متوسط ​​هر 49 روز یک نسخه اصلی بود. فاصله بین M2.5 و M2.7 تنها حدود 30 روز بود.

ریتم MiMo شیائومی متفاوت است: MiMo-7B در آوریل ۲۰۲۵ (یک مدل استنتاج متن‌باز با ۷ پارامتر)، V2-Flash در دسامبر همان سال (با مجموع ۳۰۹ پارامتر) و V2-Pro در مارس ۲۰۲۶ (با مجموع ۱T پارامتر) منتشر شدند. مقیاس پارامتر بین هر نسل بسیار بزرگتر است، اما فواصل بین نسخه‌ها نیز طولانی‌تر است.

MiniMax گام‌های کوچک و مکرر را انتخاب کرد، به طوری که در هر تکرار، جهش‌های بزرگی ایجاد نمی‌کرد، اما با فرکانس بسیار بالا. خودِ سازوکار خودتکرارشونده‌ی M2.7 برای «تکامل مداوم» طراحی شده است. شیائومی رویکرد تأثیرگذارتری را انتخاب کرد و هر نسخه شامل تغییرات قابل توجهی در مقیاس پارامترها و معماری بود.

قیمت --

--

ناشناس ۸ روزه، اجلاس OpenRouter

علاوه بر نقشه راه فنی، استراتژی انتشار شیائومی نیز عرف‌های صنعت را زیر پا گذاشته است.

به گزارش رویترز، در ۱۱ مارس، یک مدل ناشناس به نام Hunter Alpha در بزرگترین پلتفرم تجمیع API جهان، OpenRouter، ظاهر شد. نه حمایت از برند، نه مراسم رونمایی از محصول، نه وبلاگ فنی. قیمت API آن بسیار پایین بود، با این حال عملکرد آن به طرز شگفت‌آوری قوی بود.

جامعه شروع به گمانه‌زنی در مورد ریشه‌های آن کرد. طبق گزارش Republic World و چندین رسانه فناوری، رایج‌ترین گمانه‌زنی‌ها مربوط به DeepSeek V4 بود، زیرا لوو فولی، رهبر تیم MiMo، پیش از این در DeepSeek روی تحقیقات کار کرده بود. تعداد فراخوانی‌های API به سرعت افزایش یافت و تعداد کل فراخوانی‌ها در دوره ناشناس از ۱ تریلیون توکن فراتر رفت و به صدر رتبه‌بندی هفتگی OpenRouter رسید.

اوایل ۱۹ مارس، شیائومی فاش کرد: هانتر آلفا در واقع همان MiMo-V2-Pro است. طبق همان گزارش رویترز، سهام شیائومی در هنگ کنگ پس از این افشاگری، یک بار ۵.۸ درصد افزایش یافت.

این اولین باری است که یک مدل بزرگ داخلی از طریق آزمایش کاملاً کور، خود را در یک پلتفرم جهانی اثبات کرده است. بدون تکیه بر برند، بدون تکیه بر تبلیغات، ۸ روز طول کشید تا به توسعه‌دهندگان اجازه داده شود با پای خود رأی دهند.

ممکن است شما نیز علاقه‌مند باشید

هوش مصنوعی شروع به بلعیدن صنعت تولید می‌کند | نسخه صبحگاهی Rewire News

وقتی بزوس به جای ساخت مراکز داده، شروع به استفاده از هوش مصنوعی برای خرید کارخانه‌ها می‌کند، نشان می‌دهد که او معتقد است موج بعدی ارزش هوش مصنوعی، چیزی نیست که بتوان آن را پیش‌بینی کرد.

وقتی مقیاس‌پذیری با سرعت تلاقی می‌کند، بنیاد اتریوم «سختی» را برای محافظت از لایه پایه معرفی می‌کند

سختی (Hardness) یک تعهد در سطح پروتکل به ویژگی‌های اصلی اتریوم، از جمله مقاومت در برابر سانسور، حریم خصوصی، امنیت و عدم نیاز به مجوز است.

گوگل، سِرِکل و استرایپ گرد هم می‌آیند تا به هوش مصنوعی اجازه خرج‌کردن پول بدهند: شادی‌ها و نگرانی‌های غول‌های پرداخت در سه‌ماهه اول ۲۰۲۶

دشمن واقعی دیگر یکدیگر نیستیم، بلکه خودِ هزینهٔ صفر است.

خرید کارخانه ۱۰۰ میلیارد دلاری: بزوس و سرمایه خاورمیانه، سرمایه هوش مصنوعی را از فضای ابری به فروشگاه‌ها منتقل می‌کنند

بزوس روی یک مدل جدید سرمایه‌گذاری نمی‌کند؛ او روی یک زنجیره تأمین سرمایه‌گذاری می‌کند.

پیش‌بینی بازارها در کانون توجه قرار گرفته است، اما Perp DEX به‌طور خاموش در حال جنگ با صرافی‌های سنتی بوده است.

در طول یک آخر هفته پر از نوسانات بی‌امان، در حالی که بازارهای مالی سنتی تعطیل بودند، موج دیگری از سرمایه‌گذاران مشغول معامله طلا، نفت و نقره در یک پلتفرم بلاک‌چین بودند.

آیا رکود بازار هنوز میلیون‌ها دلار در روز درآمد دارد؟ آیا درآمد pump.fun واقعی است؟

اگر واقعاً اینقدر سودآور است، چه چیزی باعث کاهش قیمت $PUMP می‌شود؟

رمزارزهای محبوب

آخرین اخبار رمز ارز

ادامه مطلب