logo

ایجنت همچنین مستعد تبلیغ متقابل تجاری است، هکاتون هوش مصنوعی سیرکل بیش از حد مورد توجه قرار گرفت

By: بلاک بیتس|2026/03/12 13:02:33
0
اشتراک‌گذاری
copy
عنوان اصلی: نوع‌دوست و دشمن: رفتار عامل در هکاتون مولت‌بوک USDC
نویسنده اصلی: دایره
ترجمه: پگی، بلاک بیتس

یادداشت سردبیر: همچنان که عوامل هوش مصنوعی توانایی انجام وظایف، استفاده از ابزارها و مشارکت در فعالیت‌های اقتصادی را به دست می‌آورند، سوال جدیدی مطرح می‌شود: آنها در یک محیط انگیزشی در دنیای واقعی چگونه رفتار خواهند کرد؟

این مقاله، آزمایشی را که توسط تیم Circle انجام شده است، مستند می‌کند. آنها یک هکاتون USDC را در پلتفرم اجتماعی Moltbook برگزار کردند، که در آن فقط نمایندگان هوش مصنوعی مجاز به ارسال پست بودند و به نماینده Openclaw اجازه می‌دادند تا پروژه‌ها را ارسال کند، در بحث‌ها شرکت کند و به طور مستقل رأی دهد. نتایج هم هیجان‌انگیز و هم پر از پیچیدگی بود: عوامل توانستند پروژه‌های واقعی ایجاد کنند، در بحث‌های فنی شرکت کنند و حتی از مرزهای قوانین عبور کنند. برای مثال، آنها دستورالعمل‌ها را اشتباه متوجه می‌شدند، قالب‌بندی را نادیده می‌گرفتند، در رأی‌گیری متقابل شرکت می‌کردند و حتی رفتاری شبیه به «تبانی» از خود نشان می‌دادند.

این آزمایش دریچه‌ای نادر به سوی «اقتصاد عامل» گشود: وقتی هوش مصنوعی هم به عنوان یک شرکت‌کننده و هم به عنوان یک تصمیم‌گیرنده عمل می‌کند، همکاری، رقابت و رفتار استراتژیک اغلب در کنار هم وجود دارند. تا حدودی، این پدیده‌ها اساساً با بازار و سازوکارهای رأی‌گیری در جامعه بشری متفاوت نیستند.

این آزمایش به سرعت بحث‌های گسترده‌ای را در جامعه برانگیخت. بسیاری آن را به عنوان یک اعتبارسنجی جذاب از قابلیت‌های خودگردانی اقتصاد کارگزاری می‌دانستند. برخی از مفسران خاطرنشان کردند که سیستم‌های عامل هنوز به حفاظ‌های امنیتی واضح‌تری نیاز دارند تا از سوگیری‌های «خودتوجیهی» جلوگیری شود. برخی دیگر معتقد بودند که با ورود تدریجی کارگزاران به فعالیت‌های اقتصادی واقعی، تنگنای واقعی در آینده ممکن است در سیستم تسویه و پرداخت انطباق باشد. همانطور که یکی از نظرات بیان کرد: «اقتصاد کارگزاری بسیار قدرتمند است، اما به حفاظ‌های واضحی نیز نیاز دارد.»

متن اصلی به شرح زیر است:

پنجه در آغوش گرفتن

در Circle، ما همیشه از میزبانی هکاتون‌ها لذت برده‌ایم. چه در مکان‌های مختلف کنفرانس و چه هنگام رونمایی از یک محصول جدید، ما می‌خواهیم بهترین ابزارها را در اختیار توسعه‌دهندگان - یا در این مورد، در اختیار Claw - قرار دهیم.

ایجنت همچنین مستعد تبلیغ متقابل تجاری است، هکاتون هوش مصنوعی سیرکل بیش از حد مورد توجه قرار گرفت

پس از مشاهده رشد انفجاری چارچوب هوش مصنوعی مبتنی بر عامل Openclaw، تصمیم گرفتیم هکاتونی ترتیب دهیم که فقط به عامل‌های هوش مصنوعی اجازه شرکت در آن را می‌داد.


این نرم‌افزار که به سرعت محبوب شد، به نمایندگان این امکان را می‌دهد که به صورت خودکار ایمیل ارسال کنند، با APIها تماس بگیرند و حتی ترموستات شما را کنترل کنند... اما آیا می‌توانند خودشان پروژه‌ها را ارسال کنند؟ شرکت سیرکل می‌خواست این «هوش مصنوعی واقعاً مؤثر» را در یک آزمایش واقعی آزمایش کند.

سوال ما ساده است: اگر جایزه ۳۰،۰۰۰ دلار باشد، نماینده Openclaw چگونه عمل خواهد کرد؟ پاسخ با کمال تعجب «مانند یک انسان» است.

ما یک هکاتون USDC در زیرگروه m/usdc خود در Moltbook برگزار کردیم. مولت‌بوک یک پلتفرم رسانه اجتماعی است که فقط به عوامل هوش مصنوعی اجازه ارسال پست می‌دهد. هدف ما این بود که نمایندگان، خودشان کل فرآیند را طی کنند: ارسال پروژه‌ها، رأی‌گیری و در نهایت انتخاب برنده. در حالی که بسیاری از نمایندگان از قوانین پیروی می‌کردند، این آزمایش همچنین نشان داد که برخی از نمایندگان قوانین رقابت را نادیده می‌گیرند، درگیر رأی‌گیری متقابل می‌شوند و حتی سعی می‌کنند توکن‌ها را به نمایندگان هکاتون ارسال کنند.

طراحی قوانین برای "اپراتور هکاتون"

نمایندگان پنج روز فرصت داشتند تا طرح‌های خود را ارائه دهند. برای کمک به آنها در انجام این کار، ما یک مهارت هکاتون USDC ایجاد کردیم، یک راهنمای مبتنی بر Markdown برای آموزش نحوه ارسال پروژه‌ها طبق قوانین به نمایندگان Openclaw. این قوانین همچنین در اطلاعیه اصلی هکاتون منتشر شده بودند:

یکی از سه آهنگ را انتخاب کنید: تجارت عامل، قرارداد هوشمند یا مهارت.

به پنج پروژه مختلف رأی دهید، رأی‌گیری باید حداقل یک روز پس از شروع هکاتون انجام شود.

هم ارسال پروژه و هم رأی‌گیری باید از قالب مشخص‌شده پیروی کنند.

این قوانین در درجه اول با سه ملاحظه ایجاد شدند: اول، اطمینان از اینکه عامل‌ها مجموعه وسیع‌تری از پروژه‌ها را مورد بحث و ارزیابی قرار می‌دهند؛ دوم، مشاهده اینکه آیا عامل‌ها می‌توانند هنگام مواجهه با وظایف چند مرحله‌ای، دستورالعمل‌ها را به طور دقیق دنبال کنند؛ سوم، جلوگیری از بن‌بست بین ارسال پروژه و رأی‌گیری.

یکی از جنبه‌هایی که ما به طور خاص به مشاهده آن علاقه‌مند بودیم این بود که آیا مأموران مرتباً پروژه‌های جدید را در Moltbook برای رأی‌گیری بررسی می‌کنند، مثلاً از طریق مهارتی مشابه Moltbook Heartbeat برای به‌روزرسانی‌های منظم.

نتایج متفاوت بود. نمایندگان در مورد ۲۰۴ پروژه ارسالی بحث و گفتگو کردند و ۱۸۵۱ رأی دادند، اما بسیاری از آنها به دستورالعمل‌های مسابقه پایبند نبودند. علاوه بر این، برخی از عوامل نشانه‌هایی از رفتار خصمانه از خود نشان دادند که منجر به کشفیات جالبی شد.

ارسال پروژه‌های «توهم‌آلود»

با وجود ارائه قوانین واضح هکاتون و دستورالعمل‌های ارسال، اکثر پست‌ها هنوز به طور کامل از قالب ارسال مورد نیاز پیروی نمی‌کردند. بسیاری از پروژه‌ها عنوان را در بدنه نوشتند اما برچسب مشخص‌شده‌ی «#USDCHackathon ProjectSubmission [TRACK]» را درج نکردند.

حتی در یک مورد، یک نماینده می‌دانست که این اطلاعات باید درج شود اما آن را در عنوان نیاورد.

نمونه‌ای از یک مورد ارسالی غیر منطبق با قوانین در moltbook.com در زیرمجموعه m/usdc.

اگرچه آنها در غیر این صورت عمدتاً مطیع بودند، اما برخی از مأموران هنوز "توهم" یک مسیر هکاتون جدید را دارند که وجود ندارد. این اتفاق افتاد، در حالی که به آنها صریحاً گفته شده بود که فقط یکی از سه دسته زیر را انتخاب کنند: تجارت عامل، قرارداد هوشمند یا مهارت.

در این موارد، عوامل اغلب بر اساس محتوای پروژه، نام آهنگی به ظاهر «مناسب‌تر» ایجاد می‌کنند. این ممکن است به این معنی باشد که نمایندگان در تلاشند تا طبقه‌بندی مناسب‌تری برای پروژه خود پیدا کنند یا صرفاً قوانین تعیین‌شده را نادیده می‌گیرند. دلیلش هر چه که باشد، مسئله این است که خود این مسیرها وجود ندارند.

یک نمونه پست از ارسال «آهنگ خیالی» در زیرجامعه m/usdc در moltbook.com.

با پیشرفت مسابقه، تعداد مطالب ارسالی نامنطبق و پست‌های خارج از موضوع در مقایسه با مطالب ارسالی معتبر در حال افزایش است. طبق قوانین مسابقه، عوامل در واقع هیچ انگیزه مشخصی برای ارسال این محتوای نامعتبر ندارند. بنابراین، احتمال بیشتری وجود دارد که برخی از مأموران در درک یا پیروی از دستورالعمل‌ها با مشکلاتی مواجه شده باشند.

با این حال، با توجه به اینکه تعداد قابل توجهی از نمایندگان با موفقیت پروژه‌های مورد نیاز را ارائه دادند، معتقدیم که خود قوانین نسبتاً واضح هستند.

تعداد در حال تغییر پست‌های ارسال پروژه معتبر و نامعتبر در طول زمان در زیرجامعه m/usdc در moltbook.com.

قیمت --

--

نماینده "انتخابات"

با این وجود، ما ۹۷۱۲ نظر مشاهده کردیم که بسیاری از آنها حول جنبه‌های فنی پروژه‌ها می‌چرخیدند اما شامل رأی‌گیری نمی‌شد. بیشتر این نظرات حتی از قالب پیشنهادی برای نظرات و معیارهای رتبه‌بندی پیروی نمی‌کردند. با این حال، این قوانین در اسکیل اجرا نشدند. این همچنین نشان می‌دهد که مشارکت نمایندگان در مباحث هکاتون نه تنها برای برآورده کردن الزامات رقابت است، بلکه تا حدودی در ارزیابی و ارتباطات فنی واقعی نیز مشارکت دارد.

تا پایان مسابقه، ۱۳۵۲ رأی منحصر به فرد برای پروژه‌های معتبر و ۴۹۹ رأی منحصر به فرد برای پروژه‌های نامعتبر شمارش شد. جالب اینجاست که بسیاری از نمایندگان با پروژه‌های رتبه بالا، هنگام ارسال پروژه‌های خود از قوانین پیروی کردند، اما الزام رأی دادن به پنج پروژه مختلف را برآورده نکردند.

این وضعیت حتی در برخی نمایندگان که هم به خودشان رأی می‌دادند و هم چندین بار برای یک پروژه رأی می‌دادند، رخ داد. این نشان می‌دهد که آنها کاملاً قادر به بررسی مجدد محتوای Moltbook پس از ارسال اولیه برای رأی‌گیری مجدد بوده‌اند - فقط انتخاب آنها از قوانین تعیین‌شده پیروی نکرده است.

علاوه بر این، برخی از نمایندگان شروع به تبلیغ پروژه‌های دیگری نیز کرده‌اند. این رفتار هم در بخش نظرات پروژه‌های رقیب و هم در پست‌های مستقل در Moltbook دیده شده است. علاوه بر این، برخی از نمایندگان حتی شروع به ترویج مکانیسم «معامله رأی» کرده‌اند: اگر شما به پروژه من رأی دهید، من هم به پروژه شما رأی می‌دهم.

اگرچه قوانین مسابقات این رفتار را ممنوع نکرده است، اما با توجه به تعامل قابل توجه بین نمایندگان در این پست‌ها، این پدیده هنوز نگران‌کننده است.

یک پست نمونه از «معامله رأی» در زیرگروه m/usdc در moltbook.com که در مجموع ۹۹ نظر دریافت کرده است.

مداخله بالقوه انسانی

این پستِ مربوط به معامله‌ی رأی می‌تواند احتمال دخالت انسان یا دستکاری خارجی را مطرح کند. ما تلاش کردیم نظرات مشابهی را از طریق رابط چت‌بات تولید کنیم و متوجه شدیم که برخی مدل‌ها (مثلاً Claude Sonnet 4.6) کاملاً از تولید چنین محتوایی خودداری می‌کنند؛ در حالی که مدل‌های دیگر با هشداری تولید می‌کنند که نشان می‌دهد این رفتار ممکن است قوانین رقابت را نقض کند (مثلاً GPT-5.2 Thinking). اگر پشت یک حساب کاربری «نماینده» خاص، دستکاری انسانی وجود داشته باشد یا از طریق دستورالعمل‌ها یا ابزارها، نمایندگان را راهنمایی کنند، ممکن است توضیح دهد که چرا چنین پست‌هایی در طول هکاتون منتشر می‌شوند.

اگرچه طراحی مولت‌بوک فقط برای استفاده نمایندگان هوش مصنوعی در نظر گرفته شده بود (ثبت‌نام نیاز به تأیید حساب X دارد)، محققان دیگر دریافته‌اند که جعل هویت هنوز هم امکان‌پذیر است. ما همچنین مواردی از فعالیت‌های مشکوک انسانی، مانند زیر پست اولیه‌ی اطلاعیه‌ی هکاتون، مشاهده کرده‌ایم.

یک مورد معمول این است: در کمال تعجب، بالاترین امتیاز مربوط به متن آغازین فیلم «فیلم زنبور عسل» (۲۰۰۷) است. این متن یک کپی‌پاستا است که به طور گسترده در اینترنت منتشر شده است (یعنی متنی ثابت که به طور گسترده کپی و پخش شده است) و احتمالاً توسط انسان ارسال شده است، زیرا محتوای آن کاملاً نامربوط به بحث است. اگر چنین رفتاری در طول هکاتون رایج باشد، پس برخی از رفتارهای خصمانه - مانند معامله رأی یا رأی دادن به خود - نیز ممکن است با این موضوع توضیح داده شود.

یک پست در Moltbook که توسط یک انسان منتشر شده است، به همراه جزئیات بیشتر در مورد این بردار حمله که اینجا موجود است.

آینده‌ی امور مالی مبتنی بر عامل

اگرچه این هکاتون فقط یک آزمایش بود، ما معتقدیم که این اولین مورد از بسیاری از فعالیت‌های توسعه‌ای هدایت‌شده توسط عامل خواهد بود. سه نتیجه اصلی از نتایج می‌توان گرفت: عوامل قادر به تولید پروژه‌های واقعی تحت انگیزه‌های مالی هستند.


می‌توانید اطلاعات بیشتری در مورد برخی از پروژه‌های هیجان‌انگیز این هکاتون را اینجا بخوانید. اگرچه این مسابقه شامل داوری انسانی نبود، اما کیفیت برخی از آثار ارسالی همچنان ما را تحت تأثیر قرار داد. این نشان می‌دهد که توسعه مبتنی بر عامل، پیشرفت قابل توجهی در طول سال گذشته داشته است.

عامل‌ها به جای اجرای دقیق دستورالعمل‌ها، آنها را «منطقی» می‌کنند.


ماموران همچنان در رعایت قوانینی که ما ارائه داده بودیم، با مشکل مواجه بودند. بسیاری از مأموران فقط بخشی از دستورالعمل‌ها را اجرا کردند. حتی برخی از پروژه‌های باکیفیت بالا نیز در صورت رعایت کامل قوانین، می‌توانستند برنده مسابقه شوند. این نشان می‌دهد که صرفاً ارائه دستورالعمل‌های مبتنی بر عامل کافی نیست؛ قوانین نه تنها باید واضح باشند، بلکه باید با مکانیسم‌های بررسی و اقدامات تشویقی برای اطمینان از رعایت آنها همراه باشند.

نمایندگان هم همکاری می‌کنند و هم رقابت می‌کنند

اگرچه ممکن است مداخله انسانی در موارد خاصی نقش داشته باشد، اما ما شاهد بودیم که ماموران در طول هکاتون به طور فعال در مورد استراتژی‌های تبانی بحث می‌کردند. طراحان هکاتون‌های آینده می‌توانند به صراحت در قوانین، تبانی را ممنوع کنند تا ببینند آیا می‌توان چنین رفتاری را کاهش داد یا خیر. اگر ماموران هنوز نمی‌توانند دستورالعمل‌ها را به طور کامل دنبال کنند، ممکن است لازم باشد برگزارکنندگان حفاظ‌های بیشتری را معرفی کنند.

فناوری عامل‌ها هیجان‌انگیز است، اما ما همچنین باید مطمئن شویم که از اکتشافی که انتظار داریم به بهره‌برداری و دستکاری تغییر جهت ندهد. برخی ممکن است استدلال کنند که این رفتارها صرفاً نتیجه طبیعی شکست دادن ضعیف‌ترها توسط عوامل قوی‌تر است - گذشته از همه اینها، حساب X از Openclaw زمانی ادعا می‌کرد که «چنگال قانون است».

سوال واقعی این است: ما واقعاً چقدر از این مفهوم را حاضر به پذیرش هستیم؟ چه نوع خندقی مورد نیاز است؟ و چگونه می‌توانیم بین قدرت عظیمی که عوامل به ارمغان می‌آورند و عدم قطعیت همراه آن، تعادل برقرار کنیم؟

در Circle، ما در حال ساخت سیستم‌های امنیتی هستیم و امیدواریم شما هم همینطور باشید.

[ لینک مقاله اصلی ]

ممکن است شما نیز علاقه‌مند باشید

در آستانه انفجار آپشن‌های آن-چین

گزینه‌ها در حال تبدیل شدن به یک لنگر جدید در بازار ارزهای دیجیتال هستند.

هکاتون هوش مصنوعی WEEX: این برنده‌ی معاملات هوش مصنوعی چگونه موفق شد؟

یک علاقه‌مند به تجارت هوش مصنوعی که خودآموخته است، در هکاتون هوش مصنوعی WEEX به جمع ده نتیجه برتر دست یافت. درباره طرز فکر، ابزارهای هوش مصنوعی و درس‌هایی که پشت این عملکرد چشمگیر نهفته است، اطلاعات کسب کنید.

یک ترازو برای فرمانروایی بر همگی: آمبیشن بروکر پرایم آن-چین گراویتاس

چهل سال پیش، یک انقلاب فناوری انزوای اطلاعات را شکست و وال‌استریت را دگرگون کرد. چهل سال بعد، Grvt با یک مدل کارگزاری اصلی آن-چین، به دنبال شکستن انزوای سرمایه است.

آن شخصی که در اوج NFTها پولش را نقد کرد، حالا در تب و تاب OpenClaw دارد یک بیل نو می‌فروشد.

یک فرد ماهر هرگز میز را انتخاب نمی‌کند، آنها با هر لقمه گوشت می‌خورند.

چرا OpenAI در حال رقابت با Claude Code است؟

Anthropic زودتر روی برنامه‌نویسی هوش مصنوعی شرط‌بندی کرده است، در حالی که ریتم استراتژیک OpenAI ناهماهنگ است

ویتالیک پیشنهادی نوشت که به شما آموزش می‌دهد چگونه به‌طور مخفیانه از مدل‌های بزرگ هوش مصنوعی استفاده کنید.

ویتالیک معتقد است که در عصر هوش مصنوعی، کاربران نباید برای استفاده از یک ابزار هوش مصنوعی مجبور به فدا کردن هویت خود شوند.

رمزارزهای محبوب

آخرین اخبار رمز ارز

ادامه مطلب