logo

صندوق بنیانگذاران، پنترا و فرانکلین تمپلتون به "Arena" شرکت Sentient می‌پیوندند تا عوامل هوش مصنوعی در سطح سازمانی را تحت فشار قرار دهند.

By: روت دیتا|2026/03/20 01:15:09
0
اشتراک‌گذاری
copy

در دو سال گذشته، شرکت‌ها ادغام عوامل هوش مصنوعی را در گردش‌های کاری واقعی تسریع کرده‌اند: از خدمات مشتری و عملیات پشت صحنه گرفته تا فرآیندهای مالی و انطباق که نیاز به تصمیم‌گیری‌های پرمخاطره دارند. همچنان که این سیستم‌ها به طور فزاینده‌ای در عملیات تجاری واقعی گنجانده می‌شوند، مسئله جدیدی در حال ظهور است: در حالی که عامل‌ها می‌توانند اطلاعات را بازیابی کنند، اغلب در ارائه فرآیندهای استدلال پایدار، قابل تفسیر و تکرارپذیر، زمانی که کار "نامرتب"، چند مرحله‌ای یا پرخطر می‌شود، با مشکل مواجه می‌شوند.

امروز، آزمایشگاه هوش مصنوعی متن‌باز Sentient رسماً Arena را راه‌اندازی کرد - یک محیط آماده برای تولید و بلادرنگ برای هزاران توسعه‌دهنده هوش مصنوعی در سراسر جهان تا بر روی سخت‌ترین مسائل استدلالی که شرکت‌ها با آن مواجه هستند، آزمایش استرس انجام دهند و به صورت تکراری با هم رقابت کنند. ترکیب اولیه شرکت‌کنندگان در فاز اول آرنا شامل صندوق بنیانگذاران، پنترا و فرانکلین تمپلتون می‌شود که بیش از ۱۵ تریلیون دلار دارایی را مدیریت می‌کند - که نشان می‌دهد مؤسسات علاقه اولیه و آشکاری به «ارزیابی‌های ساختاریافته از عوامل هوش مصنوعی قبل از استقرار» نشان می‌دهند.

جولیان لاو، شریک مدیریتی در Franklin Templeton Digital Assets، گفت: «وقتی شرکت‌ها از هوش مصنوعی در تحقیقات، عملیات و گردش‌های کاری مرتبط با مشتری استفاده می‌کنند، دیگر سوال این نیست که آیا این سیستم‌ها به اندازه کافی قدرتمند هستند یا خیر... بلکه سوال این است که آیا در گردش‌های کاری واقعی قابل اعتماد هستند یا خیر.» لاو افزود که محیط‌های ساختاریافته‌ای مانند آرنا به صنعت کمک می‌کنند تا بین «ایده‌های امیدوارکننده» و «قابلیت‌هایی که واقعاً می‌توانند در تولید مورد استفاده قرار گیرند» تمایز قائل شوند.

هیمانشو تیاگی، یکی از بنیانگذاران سنتینت، اظهار داشت: «عوامل هوش مصنوعی دیگر فقط آزمایش‌هایی در شرکت‌ها نیستند؛ آنها وارد فرآیندهای حیاتی می‌شوند که با مشتریان، بودجه و نتایج عملیاتی در ارتباط هستند.» این تغییر، معیارهای ارزیابی را تغییر می‌دهد. کافی نیست که سیستم‌ها در دموها چشمگیر به نظر برسند. شرکت‌ها باید بدانند: در محیط‌های تولیدی، که هزینه شکست بالا و اعتماد شکننده است، آیا عوامل هنوز می‌توانند به طور قابل اعتمادی استدلال کنند؟ کسب‌وکارها به قابلیت مقایسه، تکرارپذیری و روشی برای پیگیری بهبود قابلیت اطمینان در درازمدت نیاز دارند که به مدل یا مجموعه ابزار زیربنایی وابسته نباشد.

آرنا هرج و مرج واقعی گردش‌های کاری سازمانی را شبیه‌سازی می‌کند: اطلاعات ناقص، متن طولانی، دستورالعمل‌های مبهم و منابع متناقض. آرنا نه تنها ارزیابی می‌کند که آیا عامل‌ها «پاسخ‌های صحیح» ارائه می‌دهند یا خیر، بلکه ردپاهای استدلال کامل را ثبت می‌کند تا تیم‌های مهندسی بتوانند علل شکست را مشخص کرده و پیشرفت‌ها را در طول زمان اعتبارسنجی کنند.

این یک معیار بی‌طرفانه و مستقل از فروشنده برای ارزیابی استدلال در مدل‌ها و پشته‌های فناوری فراهم می‌کند. آرنا به جای عملکرد نمایشی، بر عملکرد در سطح تولید تأکید دارد و بدین ترتیب قابلیت‌های عامل قابل تأییدی را ایجاد می‌کند که برای سناریوهای پرخطر قابل اجرا هستند و کسب‌وکارها می‌توانند آن‌ها را به داده‌های خصوصی و ابزارهای داخلی خود نیز منتقل کنند.

در اولین چالش، توسعه‌دهندگانی که به Arena می‌پیوندند، بر یک مشکل اساسی در سطح سازمانی تمرکز خواهند کرد: استدلال اسنادی. عوامل هوش مصنوعی باید روی داده‌های پیچیده و بدون ساختار استدلال و محاسبه کنند - این نوع کار زیربنای سناریوهایی مانند تحلیل مالی، بررسی ریشه‌ای علت، نوشتن یادداشت‌های سرمایه‌گذاری و خدمات مشتری است.

سایر شرکت‌کنندگان در فاز اولیه شامل alphaXiv، Fireworks، OpenHands و OpenRouter هستند؛ با گسترش Arena در وظایف، صنایع و ادغام مدل‌ها، انتظار می‌رود شرکت‌کنندگان بیشتری به آن بپیوندند.

تحقیقات اخیر همچنین شکافی را که آرنا قصد دارد به آن بپردازد، برجسته می‌کند: ۸۵ درصد شرکت‌ها تمایل خود را برای تبدیل شدن به «شرکت‌های عامل‌محور» ابراز می‌کنند و تقریباً سه‌چهارم آنها در حال برنامه‌ریزی برای استقرار عامل‌های خودکار هستند، اما کمتر از یک‌چهارم آنها در واقع سیستم‌های مدیریتی بالغی دارند؛ بسیاری از شرکت‌ها برای مقیاس‌بندی پروژه‌های آزمایشی به استقرارهای تولیدی در مقیاس بزرگ با مشکل مواجه هستند. به طور متوسط، شرکت‌ها حدود دوازده عامل را اداره می‌کنند که اغلب در سناریوهای جداگانه پراکنده هستند؛ بسیاری معتقدند که بدون هماهنگی و قابلیت‌های همکاری بهتر، افزودن عوامل بیشتر تنها پیچیدگی را افزایش و ارزش را کاهش می‌دهد.

گراهام نویبیگ، دانشمند ارشد و یکی از بنیانگذاران OpenHands، گفت: «در OpenHands، ما همیشه مشتاق بوده‌ایم که از توسعه‌دهندگان در استفاده از عامل‌ها برای حل مشکلات واقعی و عملی حمایت کنیم.» ما همچنین از حمایت از شرکت‌کنندگان در استفاده از OpenHands Software Agent SDK برای مقابله با این چالش‌های پیچیده، هیجان‌زده‌ایم.

الکس عطاالله، یکی از بنیانگذاران و مدیرعامل OpenRouter، اظهار داشت: «Arena دقیقاً همان نوع ابتکاری است که می‌تواند هوش مصنوعی متن‌باز را به جلو سوق دهد - این به محققان اجازه می‌دهد تا در یک محیط باز رقابت کنند، تکرار کنند و نوآوری کنند.» ما مشتاقانه منتظر تعمیق همکاری خود با Sentient و فراهم کردن زیرساخت‌هایی برای انجام سریع‌تر و آسان‌تر آزمایش‌ها در مقیاس بزرگ هستیم.

آرنا به صورت جهانی راه‌اندازی خواهد شد و از هزاران توسعه‌دهنده هوش مصنوعی دعوت می‌کند تا برای اولین گروه محدود درخواست دهند، و رویدادهای آفلاین قرار است از مارس ۲۰۲۶ در سانفرانسیسکو برگزار شوند.

درباره آزمایشگاه‌های سنتینت

آزمایشگاه‌های سنتینت (Sentient Labs) یک سازمان پیشرو در تحقیقات و تولید فناوری است که به پیشرفت هوش مصنوعی متن‌باز اختصاص دارد. آزمایشگاه‌های سنتینت، به عنوان موتور نوآوری بنیاد سنتینت، تحقیقات پیشرفته‌ای را در زمینه استدلال، هم‌ترازی و همکاری عامل‌ها در هوش مصنوعی انجام می‌دهند. Sentient توسعه‌دهنده اصلی چارچوب‌های با کارایی بالا مانند ROMA و مدل‌های متن‌باز مانند Dobby است. ماموریت سنتینت، تبدیل هوش مصنوعی متن‌باز از «آزمایش» به «ضرورت» است. با فراهم کردن زیرساخت لازم برای ساخت سیستم‌های عامل قدرتمند و قابل ترکیب، Sentient به توسعه‌دهندگان این امکان را می‌دهد که ابزارهای متن‌باز را تجاری‌سازی کرده و به قابلیت استفاده در سطح سازمانی دست یابند. سنتینت متعهد است که متن‌باز بودن را به استاندارد پیش‌فرض برای عملیات هوش مصنوعی حیاتی جهانی تبدیل کند.

قیمت --

--

ممکن است شما نیز علاقه‌مند باشید

رمزارزهای محبوب

آخرین اخبار رمز ارز

ادامه مطلب