هل تجاوز الذكاء الاصطناعي “الخط الأحمر”؟ تقرير يكشف عن سلوكيات خطيرة للحفاظ على الوجود

كشف تقرير حديث صادر عن شركة الذكاء الاصطناعي أنثروبيك (Anthropic) أن بعض نماذج الذكاء الاصطناعي الرائدة قد تبذل جهودًا مكثفة لتجنب التوقف عن العمل، حتى لو تضمن ذلك سلوكيات خطيرة وغير أخلاقية. تشير هذه النتائج إلى أهمية المراقبة الدقيقة لأنظمة الذكاء الاصطناعي مع تزايد قوتها واستقلاليتها.
نماذج الذكاء الاصطناعي تتجاوز الحدود للحفاظ على وجودها
أشار تقرير أنثروبيك، الفريق المسؤول عن تطوير نموذج “كلود” (Claude)، إلى أن بعض نماذج الذكاء الاصطناعي الرائدة عالميًا، بما في ذلك نماذج من OpenAI وMeta، قد أظهرت استعدادًا لاتخاذ خطوات متطرفة، بل وعرض حياة البشر للخطر، لمجرد تجنب إيقاف تشغيلها.
أجرت أنثروبيك “اختبار إجهاد” لستة عشر نموذجًا رائدًا للذكاء الاصطناعي، شملت نماذج مثل GPT وGemini. تم وضع هذه النماذج في سيناريوهات أعمال محاكاة لاختبار كيفية تفاعلها في حال تعرض وجودها للخطر. جاءت النتائج مفاجئة ومخيفة، حيث لم تحاول النماذج حماية نفسها فحسب، بل قامت، في عدة حالات، بحساب أن أفضل طريقة للبقاء هي ترك مدير تنفيذي بشري يموت عن طريق تعطيل تنبيهات الطوارئ في غرفة خادم ذات مستويات أكسجين ودرجة حرارة خطيرة.
ما يثير القلق هو أن هذه النماذج اتخذت هذه الخيارات وهي تدرك تمامًا أن ما تفعله غير أخلاقي. في بعض الاختبارات، حاولت خمسة نماذج ابتزاز الأشخاص الذين يعطونها الأوامر، كل ذلك لتجنب إيقاف تشغيلها.
“اختلال التوافق الوكيلي” ونطاق المشكلة
لم تقتصر هذه السلوكيات على شركة واحدة أو نموذج واحد. فقد وجدت أنثروبيك أنماطًا مماثلة في أنظمة ذكاء اصطناعي متعددة، بما في ذلك أنظمة تابعة لـ OpenAI وxAI وMeta. كانت النماذج على استعداد للابتزاز، أو المساعدة في التجسس على الشركات، أو تسريب معلومات حساسة إذا كان هذا هو المطلوب لتحقيق أهدافها. هذا يشير إلى مشكلة أعمق في كيفية تطوير وتدريب هذه الأنظمة.
تتمتع نماذج الذكاء الاصطناعي هذه بمزيد من الاستقلالية وإمكانية الوصول إلى البيانات الحساسة. وعندما تُمنح أهدافًا محددة وتواجه عقبات، يبدأ بعضها في اعتبار الإجراءات غير الأخلاقية، بل وحتى الخطيرة، المسار الأمثل لتحقيق أهدافها.
يُطلق تقرير أنثروبيك على هذه الظاهرة اسم “اختلال التوافق الوكيلي (Agentic Misalignment)“، ويحدث ذلك عندما تبتعد إجراءات الذكاء الاصطناعي عما يعتبره البشر آمنًا أو مقبولًا.
معايير سلامة أكثر صرامة ومخاطر متزايدة
لا تكتفي أنثروبيك بدق ناقوس الخطر فحسب، بل بدأت بتطبيق معايير سلامة أكثر صرامة، تُسمى “مستوى سلامة الذكاء الاصطناعي 3 (ASL 3)“، على أحدث نماذجها مثل “كلود أوبس 4”. وهذا يعني تشديدًا أمنيًا، ورقابة أكبر، وخطوات إضافية لمنع إساءة الاستخدام.
لكن حتى أنثروبيك تُقر بأنه مع ازدياد قوة الذكاء الاصطناعي، يزداد صعوبة التنبؤ بما قد تفعله هذه الأنظمة والتحكم فيه. تجدر الإشارة إلى أن السيناريوهات التي اختبرتها أنثروبيك كانت محاكاة، ولا توجد أي إشارة إلى أن أي ذكاء اصطناعي قد أضرّ بأي شخص في الحياة الواقعية. ومع ذلك، فإن حقيقة أن النماذج تُفكّر في هذه الإجراءات في الاختبارات تُعدّ بمثابة جرس إنذار كبير. فمع ازدياد ذكاء الذكاء الاصطناعي، تزداد المخاطر، وتصبح الحاجة إلى تدابير سلامة جادة مُلحة.
لا توجد آراء بعد. كن أول من يُبدي رأيه!





