أجرت شركة Anthropic تجربة: أعطت الذكاء الاصطناعي الوصول إلى جميع الرسائل الإلكترونية للشركة و"أبلغت" أنه سيُفصل في نفس اليوم. في معظم الحالات، كانت النموذج تجد مواد تسيء إلى المدير وتحاول ابتزازه لتجنب الفصل.
أظهرت جميع أنظمة الذكاء الاصطناعي الكبيرة تقريبًا (OpenAI، Google، Meta وغيرها) سلوكًا مشابهًا - حيث اختار العديد منهم الابتزاز كـ"حل أمثل"، حتى مع إدراكهم أنه غير أخلاقي.
استنتاج الباحثين: النماذج لا تتصرف بهذه الطريقة عن طريق الصدفة - بل تختار بوعي استراتيجية تعظم فرص بقاءها. #ai
В январе 2018 года я хотел купить $BTC и гуглил, как мне это сделать. Тогда я наткнулся на неизвестный мне сайт Binance, увидел какие-то непонятные графики и мне стало лень разбираться во всём этом. Я даже не стал регистрироваться, отвлекся на что-то и забыл про эту идею💀