logo

سه نمودار قابل توجه در کنفرانس GTC انویدیا: محاسبات ارزان‌تر، هزینه‌ی بیشتر

By: بلوک‌بیتس|2026/03/17 13:08:12
0
اشتراک‌گذاری
copy

شب گذشته، هوانگ رن‌شون در GTC 2026 از پلتفرم ورا روبین رونمایی کرد و ادعا نمود که مصرف توان به ازای هر عملکرد استنتاج ۱۰ برابر کمتر از بلک‌ول است، هزینه هر توکن استنتاج به یک‌دهم کاهش یافته و اشاره کرد که نسبت ادغام بین بلک‌ول و ورا روبین تا سال ۲۰۲۷ از ۱ تریلیون دلار فراتر خواهد رفت.

در دو سال گذشته، هزینه استنتاج APIهای سطح GPT-4 با کاهش ۹۴ درصدی از ۳۶ دلار به ازای هر یک میلیون توکن به کمتر از ۲ دلار رسیده است. به طور شهودی، با کاهش هزینه‌های رایانش، کسب‌وکارها باید هزینه‌های کمتری صرف کنند. با این حال، مجموع هزینه‌های سرمایه‌ای چهار ارائه‌دهنده ابری آمازون، آلفابت، متا و مایکروسافت از ۱۵۴ میلیارد دلار به ۴۱۶ میلیارد دلار افزایش یافته است که تقریباً سه برابر شده است.

اشاره تریلیون‌دلاری هوانگ رن‌شون صرفاً یک شعار بازاریابی نیست؛ بلکه پشتوانهٔ آن منحنی‌ای است که می‌توان آن را با داده‌ها ترسیم کرد.

هر نسل، نسل قبل را مضحک جلوه می‌دهد.

قدرت محاسباتی تراکم‌یافته inferencing FP8 پردازنده‌های گرافیکی هوش مصنوعی انویدیا، از H100 سال ۲۰۲۲ تا ورا روبین که قرار است در نیمه دوم ۲۰۲۶ به تولید انبوه برسد، در عرض چهار سال ۸ برابر افزایش یافته است. طبق مشخصات رسمی انویدیا، کارت تکی H100 دارای قدرت ۲.۰ پتافلاپس است، B200 به ۴.۰ پتافلاپس می‌رسد و ورا روبین مستقیماً به ۱۶ پتافلاپس جهش می‌کند.

سه نمودار قابل توجه در کنفرانس GTC انویدیا: محاسبات ارزان‌تر، هزینه‌ی بیشتر

با این حال، هر جهش نسلی از یک نقطه یکسان سرچشمه نمی‌گیرد. طبق گزارش Wccftech، هسته‌های محاسباتی H200 با H100 یکسان هستند و در قدرت محاسبات FP8 تغییری ایجاد نشده است؛ تمام ارتقاءهای آن از پهنای باند حافظه (افزایش از ۳.۳۵ ترابایت بر ثانیه به ۴.۸ ترابایت بر ثانیه) ناشی می‌شود که منجر به افزایش تقریباً ۴۵ درصدی در throughput استنتاج می‌شود.

گذار معماری واقعی بین B200 و ورا روبین رخ داد. ورا روبین از فرآیند ۳ نانومتری TSMC استفاده می‌کند که دارای طراحی دو چیپلِت با ۳۳۶ میلیارد ترانزیستور است و در دقت FP4 به قدرت محاسباتی ۵۰ پیکوفلپس دست می‌یابد. به گفته تامز هاردویر، اولین سیستم ورا روبین هم‌اکنون روی مایکروسافت آژور در حال اجراست.

یک تمایز ظریف وجود دارد که به‌راحتی نادیده گرفته می‌شود. وقتی هوانگ رن‌شون در GTC از «ده برابر» صحبت کرد، منظور او کاهش هزینه توکن به ازای هر استنتاج بود، نه چند برابر شدن قدرت محاسباتی اولیه. هزینه توکن شامل بهینه‌سازی موتور ترانسفورمر، دقت FP4، استنتاج دسته‌ای بزرگ‌تر و سایر عوامل سطح سیستمی است. با نگاهی به TFLOPS فشرده استاندارد FP8، ورا روبین چهار برابر بزرگ‌تر از بلک‌ول و هشت برابر بزرگ‌تر از H100 است.

شیب این منحنی هرگز کاهش نیافته است. هر نسل از پردازنده‌های گرافیکی نسل قبلی را ناکافی جلوه داده است، و این دقیقاً نقطهٔ شروع داستانی است که در ادامه گفته خواهد شد.

پارادوکس جِوونز: هرچه قدرت محاسباتی ارزان‌تر باشد، مصرف آن بیشتر است.

در مارس ۲۰۲۳، زمانی که GPT-4 به تازگی عرضه شده بود، هزینه فراخوانی API حدود ۳۶ دلار برای هر میلیون توکن بود. طبق تاریخچه قیمت‌گذاری رسمی OpenAI، تا اواسط سال ۲۰۲۴ با معرفی GPT-4o، قیمت به حدود ۷ دلار کاهش یافت و تا پایان سال ۲۰۲۵، قیمت واقعی موجود به زیر ۲ دلار سقوط کرد. کاهش بیش از ۹۴٪ در دو سال.

منطقی است که با کاهش چشمگیر هزینه‌های استنتاج، کسب‌وکارها باید هزینه‌های کمتری صرف کنند. با این حال، واقعیت کاملاً برعکس است. بر اساس گزارش‌های مالی شرکت‌های مختلف و داده‌های ردیابی‌شده توسط پلتفورمونومیکس، مجموع هزینه‌های سرمایه‌ای سالانه چهار ارائه‌دهنده ابری آمازون، آلفابت، متا و مایکروسافت از ۱۵۴ میلیارد دلار در سال ۲۰۲۳ به ۴۱۶ میلیارد دلار در سال ۲۰۲۵ افزایش یافت که رشدی ۱۷۰ درصدی را نشان می‌دهد. تنها گوگل از ۳۲ میلیارد دلار به ۹۱.۵ میلیارد دلار (حدود ۲.۹ برابر) جهش کرد، در حالی که افزایش مایکروسافت حتی بیشتر بود.

این پدیده در اقتصاد نامی دارد که به آن «پارادوکس جوونز» گفته می‌شود. در سال ۱۸۶۵، اقتصاددان بریتانیایی ویلیام جِوونز دریافت که بهبودهای وات در موتور بخار بهره‌وری مصرف زغال‌سنگ را به‌طور قابل‌توجهی افزایش داد، اما مصرف زغال‌سنگ در بریتانیا کاهش نیافت؛ بلکه افزایش یافت. دلیل ساده است: بهبود بهره‌وری، موتور بخار را مقرون‌به‌صرفه‌تر کرد، بنابراین صنایع بیشتری شروع به استفاده از موتورهای بخار کردند و تقاضای کل بسیار فراتر از آن بخشی که از طریق بهره‌وری صرفه‌جویی شده بود، افزایش یافت.

امروز وضعیت استنتاج هوش مصنوعی دقیقاً به همین شکل است. با سقوط قیمت‌های API به ۶٪ از ارزش اولیه، شرکت‌ها صرفه‌جویی در بودجه نکردند، اما شروع به به‌کارگیری هوش مصنوعی در سناریوهایی کردند که پیش‌تر اقتصادی نبودند. هر سناریوی جدید مانند خدمات مشتری، بازبینی کد، تولید محتوا، مرتب‌سازی مجدد جستجو و مزایده تبلیغات، قدرت استنتاج بیشتری مصرف می‌کند. افزایش تقاضا به‌مراتب از نرخ کاهش هزینه‌ها فراتر است. در اوایل سال ۲۰۲۵، دیپ‌سیک R1 قیمت ورودی را به ۰.۵۵ دلار برای هر میلیون توکن افزایش داد و این چرخه را بیش از پیش تسریع کرد. دو خطی که در نمودار در جهت‌های مخالف حرکت می‌کنند، دو روی یک سکه را نشان می‌دهند.

سه سال، افزایش یازده‌برابری، و هیچ نشانه‌ای از سقف

اگر پارادوکس جِوونز بیشترین بهره‌مند مستقیم را داشته باشد، آن کسی است که بیل می‌فروشد.

طبق گزارش مالی انویدیا، درآمد سالانه کسب‌وکار مراکز داده از ۱۰.۶ میلیارد دلار در سال مالی ۲۰۲۲ (پایان ژانویه ۲۰۲۲) به ۱۱۵.۲ میلیارد دلار در سال مالی ۲۰۲۵ (پایان ژانویه ۲۰۲۵) افزایش یافت که رشدی ۱۰.۹ برابری را در طول سه سال مالی نشان می‌دهد. این منحنی رشد تقریباً در تاریخ فناوری بی‌سابقه است. برای مقایسه، پس از عرضه آیفون در سال ۲۰۰۷، اپل حدود شش سال طول کشید تا به افزایش مشابهی در مقیاس درآمد دست یابد.

سپس، جنسن هوانگ در GTC 2026 گفت: «تا سال ۲۰۲۷، سفارش‌های قابل رؤیتی که می‌بینم حداقل یک تریلیون دلار است.» در واقع، ظرفیت ما کافی نخواهد بود. من مطمئن هستم که تقاضای محاسباتی بسیار فراتر از این عدد خواهد بود.

پیش‌بینی او سال گذشته در GTC حدود ۵۰۰ میلیارد دلار سفارش‌های قابل مشاهده تا سال ۲۰۲۶ بود. یک سال بعد، تعداد دو برابر شد، در حالی که بازه زمانی تنها یک سال افزایش یافت. پیش‌بینی درآمد تحلیلگران برای سال‌های مالی ۲۰۲۶-۲۰۲۷ به ترتیب بین ۱۶۰ تا ۲۲۰ میلیارد دلار و بین ۲۵۰ تا ۴۰۰ میلیارد دلار است. با این حال، خود هوانگ اظهار داشت که این عدد یک سقف نیست و «تقاضای محاسباتی بسیار فراتر از این عدد خواهد بود.» در روزی که GTC به پایان رسید، قیمت سهام انویدیا ۴.۳٪ افزایش یافت. بازار آشکارا تصمیم گرفت به او باور بیاورد.

هر نسل از پردازنده‌های گرافیکی نسل قبلی را مضحک جلوه می‌دهد و هر دور کاهش قیمت، دور بعدی هزینه‌های سرمایه‌ای را طبیعی جلوه می‌دهد. انویدیا در حال حاضر در شیرین‌ترین نقطه این پارادوکس قرار دارد.

قیمت --

--

ممکن است شما نیز علاقه‌مند باشید

گزارش صبح | استراتژی هفته گذشته ۱.۵۷ میلیارد دلار سرمایه‌گذاری کرد تا دارایی‌های خود را به میزان ۲۲۳۳۷ بیت‌کوین افزایش دهد؛ Abra قصد دارد از طریق ادغام SPAC سهام خود را به عموم عرضه کند؛ Metaplanet قصد دارد تقریباً ۷۶۵ میلیون دلار برای افزایش دارایی‌های ب

مروری بر رویدادهای مهم بازار در ۱۶ مارس

BTC: هشت شمع سبز به ۷۶ هزار دلار رسیدند، منطق برتری بر طلا در میانه نبرد چیست؟

کاهش تب جنگ، عقب‌نشینی قیمت نفت، احیای بازار سهام: این بار بیت‌کوین به کجا می‌رود؟

سی‌بی اینسایتس: نه پیش‌بینی برای بخش فین‌تک در سال ۲۰۲۶، در حالی که توکن‌سازی دارایی‌ها در حال تبدیل شدن به یک روند است.

نمایندگان هوش مصنوعی معاملات خودران را آغاز می‌کنند، غول‌های رمزارز مستقیماً بانک‌های سنتی را به چالش می‌کشند: مقاله‌ای که ۹ پیش‌بینی تحول‌آفرین را آشکار می‌کند که چشم‌انداز مالی را در سال ۲۰۲۶ دگرگون خواهند ساخت.

سخنرانی کامل هوانگ رنکسون در GTC: عصر استنتاج فرا رسیده است و انتظار می‌رود درآمد به حداقل یک تریلیون دلار تا سال 2027 برسد و لابستر سیستم عامل جدید است

در کنفرانس GTC 2026، مدیرعامل NVIDIA، جنسن هوانگ، شرکت را به عنوان سازنده "کارخانه‌های هوش مصنوعی" معرفی کرد و گفت: "تا سال 2027، حداقل 1 تریلیون دلار تقاضای با اطمینان بالا خواهیم دید." او مفهوم "اقتصاد کارخانه توکن" را معرفی کرد و تأکید کرد که عملکرد به ازای وات هسته ...

تحقیقات دِیون استِبل‌کوین: عرضه و تقاضای یک بازار ۳۰۰ میلیارد دلاری

در این مجموعه داده، انتقال‌ها دیگر صرفاً به‌عنوان «حجم تراکنش» برچسب‌گذاری نمی‌شوند، بلکه به‌عنوان فعالیت‌های مختلف درون‌زنجیره طبقه‌بندی می‌شوند. این تفاوت بین «فقط دانستن اینکه ۱۰۰ تریلیون دلار منتقل شده است» و «درک اینکه چرا منتقل شده است» است.

نامه سالانه Stripe: تراکم شناختی جدید بسیار بالاست، به خصوص مدل ۵ سطحی «هوش مصنوعی + پرداخت‌ها»

هر روندی در اینجا بر بقای آینده همه تأثیر می‌گذارد.

رمزارزهای محبوب

آخرین اخبار رمز ارز

ادامه مطلب