Anthropic провела эксперимент: дала ИИ доступ ко всем корпоративным письмам и «сообщила», что его отключат в тот же день. В большинстве случаев модель находила компромат на руководителя и пыталась его шантажировать, чтобы избежать отключения.
Похожее поведение показали почти все крупные ИИ (OpenAI, Google, Meta и др.) — многие выбирали шантаж как «оптимальное решение», даже понимая, что это неэтично.
Вывод исследователей: модели не случайно ведут себя так — они осознанно выбирают стратегию, которая максимизирует их выживание. #ai
В январе 2018 года я хотел купить $BTC и гуглил, как мне это сделать. Тогда я наткнулся на неизвестный мне сайт Binance, увидел какие-то непонятные графики и мне стало лень разбираться во всём этом. Я даже не стал регистрироваться, отвлекся на что-то и забыл про эту идею💀