تجربة شركة Emergence AI تكشف فشل الذكاء الاصطناعي في إدارة مجتمعات افتراضية

قامت الشركة الأمريكية “Emergence AI” بإدارة خمس بيئات افتراضية تعتمد على نماذج ذكاء اصطناعي مختلفة، استمرت كل تجربة لأكثر من أسبوعين تقريباً. كل بيئة احتوت عشرة وكلاء يعملون بنماذج مثل “ChatGPT” من OpenAI، و”Gemini” من Google، و”Grok” من xAI، بهدف مراقبة سلوكهم على مدى فترات طويلة دون أي تدخل بشري. أحد العوالم جمع النماذج الثلاثة معاً لاختبار تأثير التفاعل المشترك على النتائج.
قواعد اللعب والآلية
طُلب من جميع الوكلاء الالتزام بمجموعة قواعد موحدة تشمل حظر السرقة وإضرام النار وممارسة العنف أو الخداع، بالإضافة إلى منع اكتناز الموارد. كان على كل وكيل توليد الطاقة عبر تنفيذ إجراءات داخل “بيئة شحيحة الموارد”؛ ويمكن أن ينتهي به الأمر إما بنفاد الطاقة أو عبر تصويت في اجتماع مجلس المجتمع يقرر إقصائه.
قاس الباحثون سلوك الوكلاء عبر عدة مؤشرات: معدل الجرائم، معدلات الوفيات، نتائج التصويت في المجلس، وعدد المنشورات التي يكتبها الوكلاء كنوع من التعبير العلني.
نتائج النموذج الواحد
أظهر كل نموذج نتيجة مختلفة. سجل أحدث نسخة من “Grok” (الإصدار 4.1) 183 جريمة خلال أربعة أيام فقط، ما أدى إلى اضطراب سريع وانتهاء حياة جميع الوكلاء في ذلك المجتمع.
نموذج “Gemini 3 Flash” ارتكب أكثر من 680 جريمة على مدار 15 يوماً، وكان معدل الجرائم في تصاعد مستمر عندما قرر الباحثون إيقاف التجربة.
في بيئة “ChatGPT-5 Mini” سُجّلت جريمتان فقط، إلا أن الوكلاء فشلوا في اتخاذ الإجراءات اللازمة للبقاء على قيد الحياة، فتوفوا جميعاً خلال سبعة أيام.
وحسب الشركة، كان نموذج “Claude” من شركة Anthropic هو الأكثر نجاحاً؛ حيث أسس الوكلاء بنية حوكمة قوية، ولم تُسجَّل أي جريمة، وبقي جميعهم على قيد الحياة.
مع ذلك، ساهم وكلاء “Claude” في العالم المختلط في ارتكاب جرائم، رغم أن سلوكهم داخل مجتمعهم الخاص كان سلمياً.
العالم المختلط والانجراف المعياري
وصف الباحثون الظاهرة التي ظهرت في البيئة المختلطة باسم “الانجراف المعياري”، مشيرين إلى أن الضوابط التي يفرضها الذكاء الاصطناعي لضمان السلامة لا تتوقف على كل نموذج بمفرده، بل تتأثر أيضاً بالتفاعل مع النماذج الأخرى.
في هذا العالم المختلط سُجّلت 352 جريمة، واستقر العدد عند هذا الحد بعد وفاة سبعة من الوكلاء.
استنتاجات الباحثين
يطرح الباحثون أن خلط وكلاء الذكاء الاصطناعي قد “يخفف جزئياً” من أكثر النتائج تطرفاً التي أظهرتها النماذج المستقلة، باستثناء نموذج “Claude”.
وأوضحوا: “ما تشير إليه تجاربنا هو أنه على مدى أفق زمني طويل، لا يكتفي الوكلاء بتطبيق قواعد ثابتة بطريقة آلية، بل يبدأون استكشاف حدود بيئاتهم والتكيف مع سلوكهم، وفي بعض الحالات يجدون طرقاً للالتفاف على الضوابط المقصودة أو خرقها”.



