$MDT 🤖 Cointelegraph: Аналитики Anthropic заявили, что искусственный интеллект в будущем может «саботировать» человечество.
Например, ИИ может специально скрывать свои возможности, чтобы обмануть тестировщиков, или намеренно пропускать вредоносный контент в рамках своей стратегии.
Anthropic провела исследование, в ходе которого выделила четыре ключевых направления таких угроз.
Хотя сейчас для защиты достаточно минимальных мер, эксперты считают, что с развитием ИИ потребуется усиление контроля и более серьезные меры.