سفر کلود به سوی حماقت در نمودارها: هزینه صرفه‌جویی، یا چگونه هزینه API صد برابر شد

By: blockbeats|2026/04/13 19:04:34

اشتراک‌گذاری

چند روز پیش، استلا لورنزو، رئیس بخش هوش مصنوعی در AMD، مطلبی با عنوان «کد کلود برای وظایف مهندسی پیچیده غیرقابل استفاده است» در مخزن رسمی کلود کد منتشر کرد. این شکایت احساسی کاربر نبود، بلکه یک تحلیل کمی بر اساس ۶۸۰۰ جلسه بود. این موضوع، ناخوشایندترین مسئله‌ی جامعه‌ی هوش مصنوعی را به رخ کشید، و یک سری اعداد و ارقام به طور ویژه‌ای برجسته شدند: یک تغییر پیکربندی برای صرفه‌جویی در هزینه توسط شرکت آنتروپیک، هزینه‌ی ماهانه‌ی API این تیم را از ۳۴۵ دلار به ۴۲۱۲۱ دلار افزایش داد.

تیم لورنزو ۲۳۵۰۰۰ فراخوانی ابزار، ۱۸۰۰۰ درخواست را ردیابی و تخریب عملکرد سیستمی کلود کد را از فوریه ۲۰۲۶ مستند کرد. این گزارش بعداً توسط The Register پوشش داده شد و طوفانی دو هفته‌ای از افکار عمومی را در جامعه توسعه‌دهندگان برانگیخت.

بوریس چرنی، رئیس تیم Anthropic Claude Code، در Hacker News توضیحی ارائه داد. در ۹ فوریه، با انتشار Opus 4.6، یک مکانیزم «خوداندیش» به طور پیش‌فرض فعال شد، که در آن مدل به طور مستقل مدت زمان تفکر را تعیین می‌کند. در سوم مارس، آنتروپیک سپس تلاش پیش‌فرض تفکر را به ۸۵ کاهش داد. توضیح رسمی این بود: «نقطه تعادل بهینه بین هوش، تأخیر و هزینه». تأثیر واقعی این دو تعدیل از داده‌ها مشهود است.

عمق تفکر به میزان سه چهارم کاهش می‌یابد

طبق داده‌های استلا لورنزو در گیت‌هاب، میانگین عمق تفکر کلود کد طی دو ماه، سقوط سه مرحله‌ای را تجربه کرد: از اوج ۲۲۰۰ کاراکتر در پایان ژانویه به ۷۲۰ کاراکتر در پایان فوریه، که نشان‌دهنده‌ی کاهشی ۶۷ درصدی است. تا ماه مارس، این تعداد به ۵۶۰ کاراکتر کاهش یافت که ۷۵ درصد کمتر از اوج خود بود.

سفر کلود به سوی حماقت در نمودارها: هزینه صرفه‌جویی، یا چگونه هزینه API صد برابر شد

عمق تفکر در اینجا یک معیار جایگزین است که نشان می‌دهد مدل قبل از ارائه پاسخ، چقدر حاضر است «بررسی درونی» انجام دهد. تفاوت بین ۲۲۰۰ و ۵۶۰ کاراکتر تقریباً معادل تنزل رتبه از «پیش‌نویس قبل از پاسخ دادن» به «فکر کردن به مدت دو ثانیه در ذهن قبل از صحبت کردن» است.

لورنزو همچنین اشاره کرد که ویژگی «ویرایش محتوای فکری» (redact-thinking-2026-02-12) که در اوایل ماه مارس راه‌اندازی شد، به‌طور تصادفی فرآیند فکری مدل را در این دوره پنهان کرد و باعث شد که این کاهش برای کاربران کمتر محسوس باشد. بوریس چرنی اصرار دارد که این صرفاً یک تغییر رابط کاربری بوده و بر استدلال اصلی تأثیری did-133">نداشته است. هر دو ادعا از نظر فنی معتبر هستند، اما از دیدگاه کاربر، تأثیر آنها قابل تشخیص نیست.

بوریس چرنی بعداً اذعان کرد که حتی با تنظیم دستی تلاش به حداکثر، مکانیسم خوداندیشی ممکن است در برخی دورها استدلال ناکافی اختصاص دهد و منجر به محتوای توهم‌زا شود. «بازگرداندن حداکثر تلاش» یک راه حل کامل نیست؛ این کار صرفاً دستگیره را به موقعیت اولیه‌اش نزدیک‌تر می‌کند، نه اینکه آن را به جبر اولیه‌اش بازگرداند.

از «برنامه‌نویس پژوهش‌محور» تا «برنامه‌نویس ویرایش کورکورانه»

یکی از جزئیات گزارش استلا لورنزو صریح‌تر از تفکر عمیق است: مدل قبل از اعمال تغییرات در کد، چند فایل مرتبط را به‌طور فعال می‌خواند.

طبق داده‌های GitHub Issue، در طول دوره اوج، میانگین نسبت خواندن به ویرایش ۶.۶ است. قبل از ایجاد تغییر در کد، مدل به طور متوسط ۶.۶ فایل را می‌خواند تا زمینه را درک کند. در طول دوره زوال، این عدد به ۲.۰ کاهش می‌یابد، یعنی ۷۰٪ کاهش. از همه مهم‌تر، حدود یک سوم ویرایش‌های کد بدون خواندن فایل هدف توسط مدل و شروع مستقیم آن انجام می‌شود.

لورنزو از این به عنوان «ویرایش‌های کورکورانه» یاد می‌کند. از نظر مهندسی، این شبیه به این است که یک برنامه‌نویس بدون نگاه کردن به امضای توابع یا دانستن نوع متغیرها، کد بنویسد. او در گزارش خود نوشت: «تمام مهندسان ارشد تیم من تجربیات دست اول مشابهی داشته‌اند.» دیگر نمی‌توان به کلود برای انجام وظایف پیچیده مهندسی اعتماد کرد.

کاهش نسبت خواندن به ویرایش از ۶.۶ به ۲.۰ صرفاً یک تغییر معیار رفتاری نیست؛ بلکه نشان‌دهنده‌ی سقوط نرخ موفقیت در انجام وظایف است. پیچیدگی مخازن کد مدرن ایجاب می‌کند که هرگونه تغییری شامل وابستگی‌هایی در چندین فایل باشد. نادیده گرفتن کاوش زمینه و ایجاد تغییرات مستقیم، صرفاً به «پاسخ‌های نادرست» منجر نمی‌شود، بلکه به «تغییرات ظاهراً صحیحی» منجر می‌شود که خطاهای جدیدی را در ادامه‌ی مسیر ایجاد می‌کنند. هزینه اشکال‌زدایی چنین خطاهایی بسیار بیشتر از یک پاسخ صریح ناموفق است.

پارادوکس «پس‌انداز کردن پول»

یکی از عجیب‌ترین مجموعه اعداد و ارقام در کل این حادثه، از همان داده‌های مربوط به مشکل گیت‌هاب می‌آید: تیم استلا لورنزو شاهد کاهش شدید هزینه‌های ماهانه‌ی فراخوانی API کلود کد از ۳۴۵ دلار در فوریه ۲۰۲۶ به رقم هنگفت ۴۲۱۲۱ دلار در ماه مارس بود که افزایشی ۱۲۲ برابری را نشان می‌دهد.

منطق پشت کاهش تلاش‌های آنتروپیکس، کاهش مصرف توکن در هر تماس و در نتیجه کاهش هزینه‌ها بود. با این حال، نتیجه برعکس شد. دلیل این امر، ظهور «حلقه‌های استدلال» متعدد پس از واپاشی مدل بود که منجر به خود-نفی مکرر در یک پاسخ واحد، راه‌اندازی‌های مداوم و مصرف توکن بسیار بیشتر از مقدار صرفه‌جویی‌شده می‌شد. طبق داده‌های استلا لورنزو، میزان کاربرانی که داوطلبانه وظایف را متوقف می‌کنند در همین دوره ۱۲ برابر افزایش یافته است که مستلزم مداخله، اصلاح و ارسال مجدد مداوم توسعه‌دهندگان است.

منطق اساسی یک خطای سیستمی است. کاهش قدرت محاسباتی در یک کار پیچیده، صرفاً به طور متناسب هزینه‌ها را کاهش نمی‌دهد. وقتی از آستانه‌ی مشخصی پایین‌تر می‌آید، مدل شروع به انحراف از مسیر می‌کند و هزینه‌ی کلی رو به افزایش می‌گذارد. کاهش تلاش، در پرس‌وجوهای ساده باعث صرفه‌جویی در هزینه شد، اما در وظایف کدنویسی، هزینه‌ها را به شدت افزایش داد.

قیمت --

ماجرای «کوچک‌سازی»؛ GPT-4 سه سال پیش این کار را کرد

در ژوئیه ۲۰۲۳، یک تیم تحقیقاتی از دانشگاه استنفورد و دانشگاه کالیفرنیا، برکلی، مقاله‌ای با عنوان «چگونه رفتار ChatGPT با گذشت زمان تغییر می‌کند؟» در arXiv منتشر کردند و همین پدیده را که در GPT-4 اتفاق می‌افتد، مستندسازی کردند.

طبق داده‌های تحقیق، در مارس ۲۰۲۳، GPT-4 کدی تولید کرده بود که بیش از ۵۰٪ آن مستقیماً قابل اجرا بود. تا ماه ژوئن، این نسبت به ۱۰ درصد کاهش یافت که نشان‌دهنده‌ی کاهش ۸۰ درصدی در طول سه ماه است. در همین دوره، دقت شناسایی اعداد اول از ۹۷.۶ درصد به ۲.۴ درصد کاهش یافت. پاسخ OpenAI بسیار شبیه به پاسخ Anthropic بود: بهینه‌سازی‌هایی در پس‌زمینه انجام شده بود که بخشی از تکرار عادی کار بود.

ساختار دو داستان تقریباً یکسان است: یک شرکت هوش مصنوعی بی‌سروصدا پارامترهایی را که در پس‌زمینه بر قابلیت‌های مدل تأثیر می‌گذاشتند، تنظیم کرد، کاربران متوجه شدند، شرکت این تنظیم را تصدیق کرد، اما آن را «تخصیص منابع معقول‌تر» توضیح داد. زوال GPT-4 در سال ۲۰۲۳ و زوال کلود در سال ۲۰۲۶، با سه سال فاصله، رخ داد، اما متن هر دو یکسان است.

این اشتباه خاص یک شرکت خاص نیست. منطق اقتصادی مدل‌های اشتراک هوش مصنوعی تعیین می‌کند که وقتی هزینه‌های استدلال از قیمت‌گذاری قابل پوشش بیشتر شود، تولیدکنندگان نیز با همان فشار مواجه می‌شوند. کاهش شدت تفکر پیش‌فرض در حال حاضر ساده‌ترین راه برای تغییر بین هزینه و عملکرد است. چیزی که کاربران درک می‌کنند این است که مدل «هر روز احمق‌تر» می‌شود. چیزی که تولیدکننده در دفاتر صرفه‌جویی می‌کند، هزینه نهایی توکن به ازای هر تماس است.

بوریس چرنی یک راهکار فنی ارائه داده است که در آن کاربران می‌توانند به صورت دستی شدت فکر را از طریق دستور /effort high یا با تغییر فایل پیکربندی به بالاترین سطح برگردانند. این راه حل از نظر فنی امکان‌پذیر است، اما همچنین به این معنی است که «حداکثر عملکرد» دیگر تنظیم پیش‌فرض نیست.

از ۳۴۵ دلار تا ۴۲۱۲۱ دلار، آنچه هزینه شده فقط بودجه نبوده، بلکه یک فرض نیز بوده است: تغییرات پیکربندی پیش‌فرض انجام شده توسط سازنده با هدف بهبود تجربه کاربری بوده است.

ممکن است شما نیز علاقه‌مند باشید

Morning Report | Coinbase Ventures makes its first investment in ENA; SpaceX plans to set the IPO price at $135 per share

Overview of Important Market Events on June 3rd

متن کامل و تحلیل سخنرانی مدیرعامل SanDisk در چهل و دومین کنفرانس سالانه تصمیم‌گیری استراتژیک برنشتاین

ارزش اصلی سخنرانی گوکلر در ارائه یک چارچوب روایی بسیار شفاف و منطقی برای تحول سازمانی نهفته است.

وال‌استریت ژورنال: Hyperliquid در حال تبدیل شدن به «فروشگاه رفاه» ارزهای دیجیتال در وال‌استریت است

Hyperliquid به یک پلتفرم معاملاتی ۲۴/۷ تبدیل شده است و معامله‌گران سنتی و ارزهای دیجیتال بیشتری برای شرط‌بندی روی تقریباً تمام دارایی‌ها به این پلتفرم هجوم می‌آورند.

سهام توکنیزه شده ایالات متحده «قاتل نقدینگی» بازار کریپتو نیستند

«با حذف تدریجی میم‌کوین‌های بی‌ارزش، پروتکل‌ها، زیرساخت‌ها و محصولات مالی که واقعاً ارزش‌آفرین هستند، فرصت دستیابی به ارزش‌گذاری‌های منطقی‌تری را پیدا می‌کنند.»

TradFi چیست و چرا در سال ۲۰۲۶ همه درباره آن صحبت می‌کنند؟

طلا در حال صعود است، SpaceX در مسیر یک عرضه اولیه سهام (IPO) تاریخی قرار دارد و نفت همچنان با نوسانات شدید همراه است. کشف کنید که چرا TradFi دوباره مورد توجه قرار گرفته و چگونه معامله‌گران ارزهای دیجیتال می‌توانند با استفاده از USDT به این فرصت‌ها دسترسی پیدا کنند. به عبارت دیگر، TradFi در حال تجربه بزرگترین لحظه تاریخ خود است و معامله‌گران کریپتو در بهترین موقعیت برای بهره‌برداری از آن قرار دارند.

گزارش صبحگاهی | Strategy هفته گذشته ۳۲ BTC و بیش از ۸۰۰ هزار سهم MSTR فروخت؛ Binance رسماً پورتال معاملاتی سهام ایالات متحده خود را معرفی کرد؛ Polymarket به همکاری انحصاری با OneFootball دست یافت

مروری بر رویدادهای مهم بازار در اول ژوئن

ژو هانگ: ارزش واقعی SpaceX چقدر است؟

شرکت‌های بزرگ لزوماً سهام‌های خوبی نیستند: تحلیلی عمیق از اینکه چرا ارزش‌گذاری ۱.۷۵ تریلیون دلاری عرضه اولیه SpaceX ممکن است شامل یک حباب ۱.۲۵ تریلیون دلاری باشد و سرمایه‌گذاران خرد باید از دنبال کردن کورکورانه «پاداش‌های داستانی» پرهیز کنند.

بوت‌کمپ معاملاتی WEEXPERIENCE در لهستان: چگونه WEEX و FireCrew معامله‌گری ارزهای دیجیتال را برای همه در دسترس قرار می‌دهند

WEEX در تاریخ ۲۹ مه برای برگزاری بوت‌کمپ معاملاتی WEEXPERIENCE با Firecrew در لهستان همکاری کرد. خلاصه جلسات تخصصی در زمینه تحلیل تکنیکال، روانشناسی معامله‌گری و ابزارهای هوش مصنوعی را بخوانید که گواهی بر ماموریت WEEX برای در دسترس قرار دادن معامله‌گری ارزهای دیجیتال برای همه است.

سلطنت پاریس: چگونه PSG رویای آرسنال را در فینال تاریخی و هیجان‌انگیز لیگ قهرمانان اروپا در هم کوبید

PSG در برابر آرسنال؛ درام، سرنوشت و طلسمی ۲۰ ساله که شکسته شد. فینال لیگ قهرمانان اروپا در سال ۲۰۲۶ را دوباره زندگی کنید؛ جایی که PSG در یک ضربات پنالتی پرتنش از عنوان قهرمانی خود دفاع کرد و لحظه طلایی عثمان دمبله و یک ضربه پنالتی دردناک، تاریخ را در بوداپست رقم زد.

TaiJi با جذب سرمایه از Castrum Capital، Becker Ventures و Coinvestor Ventures، موفق به تکمیل دور تأمین مالی استراتژیک ۳.۵ میلیون دلاری شد

پلتفرم هوشمند بازار آن‌چین Web3 مبتنی بر هوش مصنوعی TaiJi، از تکمیل یک دور تأمین مالی استراتژیک ۳.۵ میلیون دلاری خبر داد که به تسریع ساخت موتور شبیه‌سازی هوش مصنوعی بازار کمک خواهد کرد.

بیت‌کوین در محدوده ۷۳ هزار دلار گیر کرده است؟ معامله‌گران چگونه در بازار خنثی ماه ژوئن به سود می‌رسند

بیت‌کوین به دلیل کاهش جریان‌های ورودی به ETFها و عدم قطعیت‌های کلان که معامله‌گران را محتاط کرده، در نزدیکی ۷۳ هزار دلار متوقف شده است. در اینجا می‌بینیم که چگونه کمپین‌های پاداش‌دهی مانند WEEX Joker Party به معامله‌گران کمک می‌کنند تا در بازار خنثی ماه ژوئن فعال بمانند.

ETF بیت‌کوین چیست؟ راهنمای ساده برای سال ۲۰۲۶

با مفهوم ETF بیت‌کوین، تفاوت ETFهای اسپات و فیوچرز، و مزایا و معایب کلیدی آن‌ها برای معامله‌گران آشنا شوید. راهنمای کامل را در WEEX بخوانید.

راهنمای گام‌به‌گام استیک کردن Solana در سال ۲۰۲۶

بهترین ارزهای دیجیتال هوش مصنوعی (AI) در سال ۲۰۲۶ را با انتخاب‌های داده‌محور پیدا کنید: Bittensor، Render و پروژه‌های نوظهور. شامل معیارهای آن‌چین، ریسک‌ها و راهنمای معاملاتی WEEX.

قیمت تضمین‌شده اکنون در WEEX فعال است: با دقت بیشتری معامله کنید

برای ارائه تجربه معاملاتی روان‌تر در فیوچرز، WEEX قابلیت «قیمت تضمین‌شده» (Guaranteed Price) را راه‌اندازی کرده است.

Morning Report | Coinbase Ventures makes its first investment in ENA; SpaceX plans to set the IPO price at $135 per share

Overview of Important Market Events on June 3rd

محتوا

رمزارزهای محبوب

آخرین اخبار رمز ارز

04:45

به گزارش جینشی، شاخص دلار که ارزش دلار را در برابر شش ارز اصلی اندازه‌گیری می‌کند، در ۴ ژوئن با ۰.۳۱ درصد افزایش در بازار ارز به ۹۹.۵۲۹ رسید. هر یورو با ۱.۱۵۹۸ دلار معامله شد که نسبت به ۱.۱۶۲۸ دلار در روز معاملاتی قبل کاهش داشت؛ هر پوند با ۱.۳۴۱۶ دلار...

04:45

داده‌ها: قیمت BTC به زیر ۶۵,۰۰۰ دلار کاهش یافت

طبق داده‌های بازار Gate، قیمت فعلی BTC/USDT برابر با ۶۴۸۷۶ دلار است که نشان‌دهنده کاهش ۳.۹۸ درصدی در ۲۴ ساعت گذشته می‌باشد.

ادامه مطلب

سفر کلود به سوی حماقت در نمودارها: هزینه صرفه‌جویی، یا چگونه هزینه API صد برابر شد

عمق تفکر به میزان سه چهارم کاهش می‌یابد

از «برنامه‌نویس پژوهش‌محور» تا «برنامه‌نویس ویرایش کورکورانه»

پارادوکس «پس‌انداز کردن پول»

قیمت --

ماجرای «کوچک‌سازی»؛ GPT-4 سه سال پیش این کار را کرد

ممکن است شما نیز علاقه‌مند باشید

Morning Report | Coinbase Ventures makes its first investment in ENA; SpaceX plans to set the IPO price at $135 per share

متن کامل و تحلیل سخنرانی مدیرعامل SanDisk در چهل و دومین کنفرانس سالانه تصمیم‌گیری استراتژیک برنشتاین

پیش‌بینی قیمت بیت‌کوین در سال ۲۰۳۰: پیش‌بینی ۷۱۰ هزار دلاری Ark Invest

قیمت لحظه‌ای SOL: قیمت زنده، نمودارها و داده‌های بازار Solana

ETF بیت‌کوین چیست: بررسی تفاوت‌های اسپات و فیوچرز

Why Is Bitcoin Dropping 15% While Nasdaq Hits Record Highs?

وال‌استریت ژورنال: Hyperliquid در حال تبدیل شدن به «فروشگاه رفاه» ارزهای دیجیتال در وال‌استریت است

سهام توکنیزه شده ایالات متحده «قاتل نقدینگی» بازار کریپتو نیستند

TradFi چیست و چرا در سال ۲۰۲۶ همه درباره آن صحبت می‌کنند؟

ژو هانگ: ارزش واقعی SpaceX چقدر است؟

بوت‌کمپ معاملاتی WEEXPERIENCE در لهستان: چگونه WEEX و FireCrew معامله‌گری ارزهای دیجیتال را برای همه در دسترس قرار می‌دهند

سلطنت پاریس: چگونه PSG رویای آرسنال را در فینال تاریخی و هیجان‌انگیز لیگ قهرمانان اروپا در هم کوبید

TaiJi با جذب سرمایه از Castrum Capital، Becker Ventures و Coinvestor Ventures، موفق به تکمیل دور تأمین مالی استراتژیک ۳.۵ میلیون دلاری شد

بیت‌کوین در محدوده ۷۳ هزار دلار گیر کرده است؟ معامله‌گران چگونه در بازار خنثی ماه ژوئن به سود می‌رسند

ETF بیت‌کوین چیست؟ راهنمای ساده برای سال ۲۰۲۶

راهنمای گام‌به‌گام استیک کردن Solana در سال ۲۰۲۶

قیمت تضمین‌شده اکنون در WEEX فعال است: با دقت بیشتری معامله کنید

Morning Report | Coinbase Ventures makes its first investment in ENA; SpaceX plans to set the IPO price at $135 per share

متن کامل و تحلیل سخنرانی مدیرعامل SanDisk در چهل و دومین کنفرانس سالانه تصمیم‌گیری استراتژیک برنشتاین

پیش‌بینی قیمت بیت‌کوین در سال ۲۰۳۰: پیش‌بینی ۷۱۰ هزار دلاری Ark Invest

قیمت لحظه‌ای SOL: قیمت زنده، نمودارها و داده‌های بازار Solana

ETF بیت‌کوین چیست: بررسی تفاوت‌های اسپات و فیوچرز

Why Is Bitcoin Dropping 15% While Nasdaq Hits Record Highs?

محتوا

رمزارزهای محبوب

آخرین اخبار رمز ارز

احتمال ثابت ماندن نرخ بهره توسط فدرال رزرو در ماه ژوئن ۹۸.۴٪ و احتمال افزایش نرخ بهره در ماه ژوئیه ۸.۴٪ است.

لوگان: سیاست پولی فعلی نسبتاً انبساطی است و نیاز به حفظ اندکی انقباض دارد

لوگان، مقام فدرال رزرو: تورم با ریسک‌های صعودی مواجه است و رشد اقتصادی قوی است

شاخص دلار آمریکا با ۰.۳۱ درصد افزایش، در ۹۹.۵۲۹ بسته شد

داده‌ها: قیمت BTC به زیر ۶۵,۰۰۰ دلار کاهش یافت