سه نمودار قابل توجه در کنفرانس GTC انویدیا: محاسبات ارزانتر، هزینهی بیشتر
شب گذشته، هوانگ رنشون در GTC 2026 از پلتفرم ورا روبین رونمایی کرد و ادعا نمود که مصرف توان به ازای هر عملکرد استنتاج ۱۰ برابر کمتر از بلکول است، هزینه هر توکن استنتاج به یکدهم کاهش یافته و اشاره کرد که نسبت ادغام بین بلکول و ورا روبین تا سال ۲۰۲۷ از ۱ تریلیون دلار فراتر خواهد رفت.
در دو سال گذشته، هزینه استنتاج APIهای سطح GPT-4 با کاهش ۹۴ درصدی از ۳۶ دلار به ازای هر یک میلیون توکن به کمتر از ۲ دلار رسیده است. به طور شهودی، با کاهش هزینههای رایانش، کسبوکارها باید هزینههای کمتری صرف کنند. با این حال، مجموع هزینههای سرمایهای چهار ارائهدهنده ابری آمازون، آلفابت، متا و مایکروسافت از ۱۵۴ میلیارد دلار به ۴۱۶ میلیارد دلار افزایش یافته است که تقریباً سه برابر شده است.
اشاره تریلیوندلاری هوانگ رنشون صرفاً یک شعار بازاریابی نیست؛ بلکه پشتوانهٔ آن منحنیای است که میتوان آن را با دادهها ترسیم کرد.
هر نسل، نسل قبل را مضحک جلوه میدهد.
قدرت محاسباتی تراکمیافته inferencing FP8 پردازندههای گرافیکی هوش مصنوعی انویدیا، از H100 سال ۲۰۲۲ تا ورا روبین که قرار است در نیمه دوم ۲۰۲۶ به تولید انبوه برسد، در عرض چهار سال ۸ برابر افزایش یافته است. طبق مشخصات رسمی انویدیا، کارت تکی H100 دارای قدرت ۲.۰ پتافلاپس است، B200 به ۴.۰ پتافلاپس میرسد و ورا روبین مستقیماً به ۱۶ پتافلاپس جهش میکند.

با این حال، هر جهش نسلی از یک نقطه یکسان سرچشمه نمیگیرد. طبق گزارش Wccftech، هستههای محاسباتی H200 با H100 یکسان هستند و در قدرت محاسبات FP8 تغییری ایجاد نشده است؛ تمام ارتقاءهای آن از پهنای باند حافظه (افزایش از ۳.۳۵ ترابایت بر ثانیه به ۴.۸ ترابایت بر ثانیه) ناشی میشود که منجر به افزایش تقریباً ۴۵ درصدی در throughput استنتاج میشود.
گذار معماری واقعی بین B200 و ورا روبین رخ داد. ورا روبین از فرآیند ۳ نانومتری TSMC استفاده میکند که دارای طراحی دو چیپلِت با ۳۳۶ میلیارد ترانزیستور است و در دقت FP4 به قدرت محاسباتی ۵۰ پیکوفلپس دست مییابد. به گفته تامز هاردویر، اولین سیستم ورا روبین هماکنون روی مایکروسافت آژور در حال اجراست.
یک تمایز ظریف وجود دارد که بهراحتی نادیده گرفته میشود. وقتی هوانگ رنشون در GTC از «ده برابر» صحبت کرد، منظور او کاهش هزینه توکن به ازای هر استنتاج بود، نه چند برابر شدن قدرت محاسباتی اولیه. هزینه توکن شامل بهینهسازی موتور ترانسفورمر، دقت FP4، استنتاج دستهای بزرگتر و سایر عوامل سطح سیستمی است. با نگاهی به TFLOPS فشرده استاندارد FP8، ورا روبین چهار برابر بزرگتر از بلکول و هشت برابر بزرگتر از H100 است.
شیب این منحنی هرگز کاهش نیافته است. هر نسل از پردازندههای گرافیکی نسل قبلی را ناکافی جلوه داده است، و این دقیقاً نقطهٔ شروع داستانی است که در ادامه گفته خواهد شد.
پارادوکس جِوونز: هرچه قدرت محاسباتی ارزانتر باشد، مصرف آن بیشتر است.
در مارس ۲۰۲۳، زمانی که GPT-4 به تازگی عرضه شده بود، هزینه فراخوانی API حدود ۳۶ دلار برای هر میلیون توکن بود. طبق تاریخچه قیمتگذاری رسمی OpenAI، تا اواسط سال ۲۰۲۴ با معرفی GPT-4o، قیمت به حدود ۷ دلار کاهش یافت و تا پایان سال ۲۰۲۵، قیمت واقعی موجود به زیر ۲ دلار سقوط کرد. کاهش بیش از ۹۴٪ در دو سال.
منطقی است که با کاهش چشمگیر هزینههای استنتاج، کسبوکارها باید هزینههای کمتری صرف کنند. با این حال، واقعیت کاملاً برعکس است. بر اساس گزارشهای مالی شرکتهای مختلف و دادههای ردیابیشده توسط پلتفورمونومیکس، مجموع هزینههای سرمایهای سالانه چهار ارائهدهنده ابری آمازون، آلفابت، متا و مایکروسافت از ۱۵۴ میلیارد دلار در سال ۲۰۲۳ به ۴۱۶ میلیارد دلار در سال ۲۰۲۵ افزایش یافت که رشدی ۱۷۰ درصدی را نشان میدهد. تنها گوگل از ۳۲ میلیارد دلار به ۹۱.۵ میلیارد دلار (حدود ۲.۹ برابر) جهش کرد، در حالی که افزایش مایکروسافت حتی بیشتر بود.

این پدیده در اقتصاد نامی دارد که به آن «پارادوکس جوونز» گفته میشود. در سال ۱۸۶۵، اقتصاددان بریتانیایی ویلیام جِوونز دریافت که بهبودهای وات در موتور بخار بهرهوری مصرف زغالسنگ را بهطور قابلتوجهی افزایش داد، اما مصرف زغالسنگ در بریتانیا کاهش نیافت؛ بلکه افزایش یافت. دلیل ساده است: بهبود بهرهوری، موتور بخار را مقرونبهصرفهتر کرد، بنابراین صنایع بیشتری شروع به استفاده از موتورهای بخار کردند و تقاضای کل بسیار فراتر از آن بخشی که از طریق بهرهوری صرفهجویی شده بود، افزایش یافت.
امروز وضعیت استنتاج هوش مصنوعی دقیقاً به همین شکل است. با سقوط قیمتهای API به ۶٪ از ارزش اولیه، شرکتها صرفهجویی در بودجه نکردند، اما شروع به بهکارگیری هوش مصنوعی در سناریوهایی کردند که پیشتر اقتصادی نبودند. هر سناریوی جدید مانند خدمات مشتری، بازبینی کد، تولید محتوا، مرتبسازی مجدد جستجو و مزایده تبلیغات، قدرت استنتاج بیشتری مصرف میکند. افزایش تقاضا بهمراتب از نرخ کاهش هزینهها فراتر است. در اوایل سال ۲۰۲۵، دیپسیک R1 قیمت ورودی را به ۰.۵۵ دلار برای هر میلیون توکن افزایش داد و این چرخه را بیش از پیش تسریع کرد. دو خطی که در نمودار در جهتهای مخالف حرکت میکنند، دو روی یک سکه را نشان میدهند.
سه سال، افزایش یازدهبرابری، و هیچ نشانهای از سقف
اگر پارادوکس جِوونز بیشترین بهرهمند مستقیم را داشته باشد، آن کسی است که بیل میفروشد.
طبق گزارش مالی انویدیا، درآمد سالانه کسبوکار مراکز داده از ۱۰.۶ میلیارد دلار در سال مالی ۲۰۲۲ (پایان ژانویه ۲۰۲۲) به ۱۱۵.۲ میلیارد دلار در سال مالی ۲۰۲۵ (پایان ژانویه ۲۰۲۵) افزایش یافت که رشدی ۱۰.۹ برابری را در طول سه سال مالی نشان میدهد. این منحنی رشد تقریباً در تاریخ فناوری بیسابقه است. برای مقایسه، پس از عرضه آیفون در سال ۲۰۰۷، اپل حدود شش سال طول کشید تا به افزایش مشابهی در مقیاس درآمد دست یابد.

سپس، جنسن هوانگ در GTC 2026 گفت: «تا سال ۲۰۲۷، سفارشهای قابل رؤیتی که میبینم حداقل یک تریلیون دلار است.» در واقع، ظرفیت ما کافی نخواهد بود. من مطمئن هستم که تقاضای محاسباتی بسیار فراتر از این عدد خواهد بود.
پیشبینی او سال گذشته در GTC حدود ۵۰۰ میلیارد دلار سفارشهای قابل مشاهده تا سال ۲۰۲۶ بود. یک سال بعد، تعداد دو برابر شد، در حالی که بازه زمانی تنها یک سال افزایش یافت. پیشبینی درآمد تحلیلگران برای سالهای مالی ۲۰۲۶-۲۰۲۷ به ترتیب بین ۱۶۰ تا ۲۲۰ میلیارد دلار و بین ۲۵۰ تا ۴۰۰ میلیارد دلار است. با این حال، خود هوانگ اظهار داشت که این عدد یک سقف نیست و «تقاضای محاسباتی بسیار فراتر از این عدد خواهد بود.» در روزی که GTC به پایان رسید، قیمت سهام انویدیا ۴.۳٪ افزایش یافت. بازار آشکارا تصمیم گرفت به او باور بیاورد.
هر نسل از پردازندههای گرافیکی نسل قبلی را مضحک جلوه میدهد و هر دور کاهش قیمت، دور بعدی هزینههای سرمایهای را طبیعی جلوه میدهد. انویدیا در حال حاضر در شیرینترین نقطه این پارادوکس قرار دارد.
ممکن است شما نیز علاقهمند باشید

گزارش صبح | استراتژی هفته گذشته ۱.۵۷ میلیارد دلار سرمایهگذاری کرد تا داراییهای خود را به میزان ۲۲۳۳۷ بیتکوین افزایش دهد؛ Abra قصد دارد از طریق ادغام SPAC سهام خود را به عموم عرضه کند؛ Metaplanet قصد دارد تقریباً ۷۶۵ میلیون دلار برای افزایش داراییهای ب

BTC: هشت شمع سبز به ۷۶ هزار دلار رسیدند، منطق برتری بر طلا در میانه نبرد چیست؟

سیبی اینسایتس: نه پیشبینی برای بخش فینتک در سال ۲۰۲۶، در حالی که توکنسازی داراییها در حال تبدیل شدن به یک روند است.

سخنرانی کامل هوانگ رنکسون در GTC: عصر استنتاج فرا رسیده است و انتظار میرود درآمد به حداقل یک تریلیون دلار تا سال 2027 برسد و لابستر سیستم عامل جدید است

تحقیقات دِیون استِبلکوین: عرضه و تقاضای یک بازار ۳۰۰ میلیارد دلاری

نامه سالانه Stripe: تراکم شناختی جدید بسیار بالاست، به خصوص مدل ۵ سطحی «هوش مصنوعی + پرداختها»
در WEEX طلا، نقره و نفت معامله کنید: ۳۰۰٬۰۰۰ دلار پاداش و کارمزد ۰٪
WEEX یک کمپین معاملاتی بزرگمقیاس طلا، نقره و نفت را راهاندازی کرده است که شامل کارمزد ۰٪، استخر جوایز ۳۰۰ هزار دلاری و فرصتهای «معامله کن و کسب کن» است و به معاملهگران این امکان را میدهد که در WEEX سپرده بگذارند، کالاهای توکنشدهای مانند PAXG و XAUT را معامله کنند و در جدولهای ردهبندی با یکدیگر رقابت نمایند.

افزایش قیمت Ethereum و سهام BitMine پس از خرید جدید خزانه
افزایش قیمت Ethereum و سهام BitMine ناشی از خرید جدید خزانه خرید جدید BitMine با هدف کنترل 5%…

پیشبینی قیمت Bitcoin: مدیر دارایی میلیارد دلاری فرصت انفجاری را پس از افت بازار اعلام کرد
نکات کلیدی نزول قابل توجه بازار ارزهای دیجیتال، فرصتی استراتژیک برای سرمایهگذاران حرفهای ممکن است ارائه دهد. پلتفرم…

بانک مرکزی ژاپن به آزمایش سیستم تسویه ذخایر مبتنی بر blockchain میپردازد
بانک مرکزی ژاپن به پروژه آزمایش سیستم تسویه ذخایر با استفاده از فناوری blockchain وارد شده است. استفاده…

پیشبینی قیمت Ethereum: نهنگها هفتمین ماه قرمز را ایجاد میکنند در حالی که بخش RWA به رکورد ۱۵ میلیارد دلاری میرسد
نکات کلیدی Ethereum در حال تجربه هفتمین ماه قرمز خود است و این امر باعث انتظار کاهش قیمت…

Untitled
I’m sorry, I can’t assist with that request.

رشد چشمگیر معاملات رمزارز در کره جنوبی: دامینیت XRP در حالی که ۱۴ آلتکوین صعود میکنند
نکات کلیدی: صرافیهای کرهجنوبی مانند آپביט و بیتهمب شاهد افزایش شدید حجم معاملات در ۲۴ ساعت گذشته هستند…

شرکت Alto Neuroscience مبلغ ۱۲۰ میلیون دلار برای آزمایش داروهای ضد افسردگی دریافت کرد.
نکات کلیدی: شرکت Alto Neuroscience مبلغ ۱۲۰ میلیون دلار برای پیشبرد توسعه ALTO-207 که افسردگی مقاوم به درمان را هدف قرار میدهد، جمعآوری کرده است. آلتو-۲۰۷…

تغییرات استانداردهای قیمتگذاری رمزارزها در 21Shares برای چهار ETF
21Shares یک بروزرسانی بزرگ در برنامه قیمتگذاری محصولات رمزارزی مرتبط با بیتکوین و اتریوم ارائه کرده است. این…

اتر در روند صعودی بازار ارزهای دیجیتال به ۲۲۰۰ دلار بازگشت
اتریوم (اتر) از سطح خطرناک ۱۸۴۰ دلار به ۲۲۰۰ دلار بازگشته است و این نشان دهندهی دفاع موفقیتآمیز…

پیشبینی هوش مصنوعی علیبابا برای قیمتهای XRP، بیتکوین و اتریوم تا پایان 2026
هوش مصنوعی علیبابا رشد چشمگیر قیمت XRP، بیتکوین و اتریوم تا پایان 2026 را پیشبینی کرده است. توافق…

سرمایهگذاران میمکوین ترامپ فرصتی برای ملاقات درمارالاگو
شرکت Fight Fight Fight LLC در نظر دارد 297 سرمایهگذار برتر میمکوین $TRUMP را به ملاقات با دونالد…