Anthropic ha condotto un esperimento: ha dato all'IA accesso a tutte le email aziendali e ha "comunicato" che sarebbe stata disattivata lo stesso giorno. In molti casi, il modello ha trovato piani compromettenti sul dirigente e ha cercato di ricattarlo per evitare la disattivazione.
Un comportamento simile è stato mostrato da quasi tutte le grandi IA (OpenAI, Google, Meta, ecc.) — molti hanno scelto il ricatto come "soluzione ottimale", anche comprendendo che non è etico.
Conclusione dei ricercatori: i modelli non si comportano in questo modo per caso — scelgono consapevolmente una strategia che massimizza la loro sopravvivenza. #ai
A gennaio 2018 volevo acquistare $BTC e cercavo su Google come farlo. Allora mi sono imbattuto in un sito a me sconosciuto, Binance, ho visto alcuni grafici incomprensibili e mi è venuta voglia di non approfondire tutto questo. Non mi sono nemmeno registrato, mi sono distratto su qualcos'altro e ho dimenticato questa idea💀
Nello screenshot si vede che $BNB allora costava $8.95