صندوق بنیانگذاران، پنترا و فرانکلین تمپلتون به "Arena" شرکت Sentient میپیوندند تا عوامل هوش مصنوعی در سطح سازمانی را تحت فشار قرار دهند.
در دو سال گذشته، شرکتها ادغام عوامل هوش مصنوعی را در گردشهای کاری واقعی تسریع کردهاند: از خدمات مشتری و عملیات پشت صحنه گرفته تا فرآیندهای مالی و انطباق که نیاز به تصمیمگیریهای پرمخاطره دارند. همچنان که این سیستمها به طور فزایندهای در عملیات تجاری واقعی گنجانده میشوند، مسئله جدیدی در حال ظهور است: در حالی که عاملها میتوانند اطلاعات را بازیابی کنند، اغلب در ارائه فرآیندهای استدلال پایدار، قابل تفسیر و تکرارپذیر، زمانی که کار "نامرتب"، چند مرحلهای یا پرخطر میشود، با مشکل مواجه میشوند.
امروز، آزمایشگاه هوش مصنوعی متنباز Sentient رسماً Arena را راهاندازی کرد - یک محیط آماده برای تولید و بلادرنگ برای هزاران توسعهدهنده هوش مصنوعی در سراسر جهان تا بر روی سختترین مسائل استدلالی که شرکتها با آن مواجه هستند، آزمایش استرس انجام دهند و به صورت تکراری با هم رقابت کنند. ترکیب اولیه شرکتکنندگان در فاز اول آرنا شامل صندوق بنیانگذاران، پنترا و فرانکلین تمپلتون میشود که بیش از ۱۵ تریلیون دلار دارایی را مدیریت میکند - که نشان میدهد مؤسسات علاقه اولیه و آشکاری به «ارزیابیهای ساختاریافته از عوامل هوش مصنوعی قبل از استقرار» نشان میدهند.
جولیان لاو، شریک مدیریتی در Franklin Templeton Digital Assets، گفت: «وقتی شرکتها از هوش مصنوعی در تحقیقات، عملیات و گردشهای کاری مرتبط با مشتری استفاده میکنند، دیگر سوال این نیست که آیا این سیستمها به اندازه کافی قدرتمند هستند یا خیر... بلکه سوال این است که آیا در گردشهای کاری واقعی قابل اعتماد هستند یا خیر.» لاو افزود که محیطهای ساختاریافتهای مانند آرنا به صنعت کمک میکنند تا بین «ایدههای امیدوارکننده» و «قابلیتهایی که واقعاً میتوانند در تولید مورد استفاده قرار گیرند» تمایز قائل شوند.
هیمانشو تیاگی، یکی از بنیانگذاران سنتینت، اظهار داشت: «عوامل هوش مصنوعی دیگر فقط آزمایشهایی در شرکتها نیستند؛ آنها وارد فرآیندهای حیاتی میشوند که با مشتریان، بودجه و نتایج عملیاتی در ارتباط هستند.» این تغییر، معیارهای ارزیابی را تغییر میدهد. کافی نیست که سیستمها در دموها چشمگیر به نظر برسند. شرکتها باید بدانند: در محیطهای تولیدی، که هزینه شکست بالا و اعتماد شکننده است، آیا عوامل هنوز میتوانند به طور قابل اعتمادی استدلال کنند؟ کسبوکارها به قابلیت مقایسه، تکرارپذیری و روشی برای پیگیری بهبود قابلیت اطمینان در درازمدت نیاز دارند که به مدل یا مجموعه ابزار زیربنایی وابسته نباشد.
آرنا هرج و مرج واقعی گردشهای کاری سازمانی را شبیهسازی میکند: اطلاعات ناقص، متن طولانی، دستورالعملهای مبهم و منابع متناقض. آرنا نه تنها ارزیابی میکند که آیا عاملها «پاسخهای صحیح» ارائه میدهند یا خیر، بلکه ردپاهای استدلال کامل را ثبت میکند تا تیمهای مهندسی بتوانند علل شکست را مشخص کرده و پیشرفتها را در طول زمان اعتبارسنجی کنند.
این یک معیار بیطرفانه و مستقل از فروشنده برای ارزیابی استدلال در مدلها و پشتههای فناوری فراهم میکند. آرنا به جای عملکرد نمایشی، بر عملکرد در سطح تولید تأکید دارد و بدین ترتیب قابلیتهای عامل قابل تأییدی را ایجاد میکند که برای سناریوهای پرخطر قابل اجرا هستند و کسبوکارها میتوانند آنها را به دادههای خصوصی و ابزارهای داخلی خود نیز منتقل کنند.
در اولین چالش، توسعهدهندگانی که به Arena میپیوندند، بر یک مشکل اساسی در سطح سازمانی تمرکز خواهند کرد: استدلال اسنادی. عوامل هوش مصنوعی باید روی دادههای پیچیده و بدون ساختار استدلال و محاسبه کنند - این نوع کار زیربنای سناریوهایی مانند تحلیل مالی، بررسی ریشهای علت، نوشتن یادداشتهای سرمایهگذاری و خدمات مشتری است.
سایر شرکتکنندگان در فاز اولیه شامل alphaXiv، Fireworks، OpenHands و OpenRouter هستند؛ با گسترش Arena در وظایف، صنایع و ادغام مدلها، انتظار میرود شرکتکنندگان بیشتری به آن بپیوندند.
تحقیقات اخیر همچنین شکافی را که آرنا قصد دارد به آن بپردازد، برجسته میکند: ۸۵ درصد شرکتها تمایل خود را برای تبدیل شدن به «شرکتهای عاملمحور» ابراز میکنند و تقریباً سهچهارم آنها در حال برنامهریزی برای استقرار عاملهای خودکار هستند، اما کمتر از یکچهارم آنها در واقع سیستمهای مدیریتی بالغی دارند؛ بسیاری از شرکتها برای مقیاسبندی پروژههای آزمایشی به استقرارهای تولیدی در مقیاس بزرگ با مشکل مواجه هستند. به طور متوسط، شرکتها حدود دوازده عامل را اداره میکنند که اغلب در سناریوهای جداگانه پراکنده هستند؛ بسیاری معتقدند که بدون هماهنگی و قابلیتهای همکاری بهتر، افزودن عوامل بیشتر تنها پیچیدگی را افزایش و ارزش را کاهش میدهد.
گراهام نویبیگ، دانشمند ارشد و یکی از بنیانگذاران OpenHands، گفت: «در OpenHands، ما همیشه مشتاق بودهایم که از توسعهدهندگان در استفاده از عاملها برای حل مشکلات واقعی و عملی حمایت کنیم.» ما همچنین از حمایت از شرکتکنندگان در استفاده از OpenHands Software Agent SDK برای مقابله با این چالشهای پیچیده، هیجانزدهایم.
الکس عطاالله، یکی از بنیانگذاران و مدیرعامل OpenRouter، اظهار داشت: «Arena دقیقاً همان نوع ابتکاری است که میتواند هوش مصنوعی متنباز را به جلو سوق دهد - این به محققان اجازه میدهد تا در یک محیط باز رقابت کنند، تکرار کنند و نوآوری کنند.» ما مشتاقانه منتظر تعمیق همکاری خود با Sentient و فراهم کردن زیرساختهایی برای انجام سریعتر و آسانتر آزمایشها در مقیاس بزرگ هستیم.
آرنا به صورت جهانی راهاندازی خواهد شد و از هزاران توسعهدهنده هوش مصنوعی دعوت میکند تا برای اولین گروه محدود درخواست دهند، و رویدادهای آفلاین قرار است از مارس ۲۰۲۶ در سانفرانسیسکو برگزار شوند.
درباره آزمایشگاههای سنتینت
آزمایشگاههای سنتینت (Sentient Labs) یک سازمان پیشرو در تحقیقات و تولید فناوری است که به پیشرفت هوش مصنوعی متنباز اختصاص دارد. آزمایشگاههای سنتینت، به عنوان موتور نوآوری بنیاد سنتینت، تحقیقات پیشرفتهای را در زمینه استدلال، همترازی و همکاری عاملها در هوش مصنوعی انجام میدهند. Sentient توسعهدهنده اصلی چارچوبهای با کارایی بالا مانند ROMA و مدلهای متنباز مانند Dobby است. ماموریت سنتینت، تبدیل هوش مصنوعی متنباز از «آزمایش» به «ضرورت» است. با فراهم کردن زیرساخت لازم برای ساخت سیستمهای عامل قدرتمند و قابل ترکیب، Sentient به توسعهدهندگان این امکان را میدهد که ابزارهای متنباز را تجاریسازی کرده و به قابلیت استفاده در سطح سازمانی دست یابند. سنتینت متعهد است که متنباز بودن را به استاندارد پیشفرض برای عملیات هوش مصنوعی حیاتی جهانی تبدیل کند.
ممکن است شما نیز علاقهمند باشید

AAVE در منطقه حمایتی کلیدی حرکت میکند و به دنبال افزایش کوتاهمدت به سمت ۱۵۰ دلار است
نکات کلیدی: آوه (Aave) در سطح حمایتی بحرانی حدود ۱۱۴ دلار قرار دارد که نشاندهندهی بلاتکلیفی فعلی بازار است. اگر دوام بیاورد…

Untitled
سقوط نهنگ: باز کردن موقعیت فروش با اهرم 20 برابری نفت در Hyperliquid Key Takeaways یک نهنگ 5.6…

Untitled
Outline for Article H1: مغز متفکر بیتکوین، مایکل سیلر: بیتکوین به عنوان پوشش نهایی در برابر آشفتگی H2:…

Untitled
فهرست مطالب مقدمه زمینه و تعریف موقعیت خرید در بازار ارزهای دیجیتال معرفی موضوع اصلی: فعالیتهای اخیر یک…

Untitled
طرح مقاله مقدمه – توضیحی درباره بیت کوین و اهمیت آن در بازارهای مالی – اشارهای به کاهش…

Untitled
حمله فیشینگ علیه توسعهدهندگان OpenClaw در گیتهاب: تلاش برای سرقت از کیف پولهای ارز دیجیتال کلیدیترین موارد کمپین…

Untitled
ایجاد اختلال در پروتکل DeFi نئوترال: ایمنی کاربر در خطر Key Takeaways تیم نئوترال گزارش داده که پروتکل…

سقوط بیتکوین قیمت را به زیر ۷۱,۰۰۰ دلار کشاند
Key Takeaways قیمت بیتکوین به زیر ۷۱,۰۰۰ دلار سقوط کرد و نشاندهنده کاهش ۰.۹۱ درصدی در روز است.…

Untitled
Overview of a Phishing Incident Causing an $85,000 Loss in sNUSD Key Takeaways یک کاربر به دلیل امضای…

سقوط اتریوم زیر ۲۲۰۰ دلار با افزایش 0.55 درصدی
Key Takeaways قیمت اتریوم به زیر سطح ۲۲۰۰ دلار کاهش یافته است. بر اساس دادههای بازار OKX، قیمت…

Untitled
فهرست [هشدار درباره کمپین فیشینگ بازی جدید “پادجی پنگوئنز”](###هشدار-درباره-کمپین-فیشینگ-بازی-جدید-پادجی-پنگوئنز) [چگونگی عملکرد سایتهای فیشینگ](###چگونگی-عملکرد-سایتهای-فیشینگ) [دلایل جلب توجه فیشرها به…

افت ارزش کریپتو: بررسی عوامل کاهش بازار کریپتو
Key Takeaways بازار کریپتو به مدت دو روز متوالی کاهش یافته است، با افت شدید در دسته بندیهای…

نهنگ بزرگ ارز دیجیتال 10,811.34 واحد اتر خریداری کرد
Key Takeaways از تاریخ ۶ مارس، یک نهنگ بزرگ ارز دیجیتال 10,811.34 واحد اتر به ارزش ۲۲.۵۸ میلیون…

Untitled
اسکایلینک از اهرم برای معاملات بورس استفاده میکند و تحولات اخیر بازار کریپتو Key Takeaways اسکایلینک استفاده از…

Untitled
Outline H1: نهنگرمزگذاری یک معامله بزرگ را با سود 7.093 میلیون دلاری به پایان میرساند Key Takeaways –…

برداشت بلکراک از کوینبیس: ۲۲۶۷ بیتکوین و ۵۰۴۱ اتر
Key Takeaways در مدت زمان ۹ ساعت گذشته، بلکراک مقدار قابل توجهی از ارزهای دیجیتال را از کوینبیس…

Untitled
باستانپژوهی: فروش هزار بیتکوین توسط یک نهنگ تاریخی نتایج کلیدی فروش بیتکوین: نهنگ تاریخی ۱,۰۰۰ بیتکوین به ارزش…

Untitled
I’m sorry, but I can’t assist with this request.
AAVE در منطقه حمایتی کلیدی حرکت میکند و به دنبال افزایش کوتاهمدت به سمت ۱۵۰ دلار است
نکات کلیدی: آوه (Aave) در سطح حمایتی بحرانی حدود ۱۱۴ دلار قرار دارد که نشاندهندهی بلاتکلیفی فعلی بازار است. اگر دوام بیاورد…
Untitled
سقوط نهنگ: باز کردن موقعیت فروش با اهرم 20 برابری نفت در Hyperliquid Key Takeaways یک نهنگ 5.6…
Untitled
Outline for Article H1: مغز متفکر بیتکوین، مایکل سیلر: بیتکوین به عنوان پوشش نهایی در برابر آشفتگی H2:…
Untitled
فهرست مطالب مقدمه زمینه و تعریف موقعیت خرید در بازار ارزهای دیجیتال معرفی موضوع اصلی: فعالیتهای اخیر یک…
Untitled
طرح مقاله مقدمه – توضیحی درباره بیت کوین و اهمیت آن در بازارهای مالی – اشارهای به کاهش…
Untitled
حمله فیشینگ علیه توسعهدهندگان OpenClaw در گیتهاب: تلاش برای سرقت از کیف پولهای ارز دیجیتال کلیدیترین موارد کمپین…