Cosa fa effettivamente l’Intelligenza artificiale quando le viene dato il comando? Nel maggio del 2026 un gruppo di ricercatori ha deciso di rispondere alla domanda fondamentale che fino ad allora non era mai stata verificata concretamente.
Solitamente le Ia venivano giudicate solo su compiti specifici e ben circoscritti. Fino a quel momento, nessuno aveva mai riunito più modelli in un ambiente sociale condiviso per osservare, nel corso di alcune settimane, come una decisione presa all’inizio potesse produrre conseguenze a distanza di tempo. Sono proprio quei risultati a rivelare il reale funzionamento del sistema, e sono rimasta sorpresa che un simile esperimento non fosse stato condotto prima.
I ricercatori di Emergence hanno costruito un mondo intero. Una cittadina virtuale dotata di municipio, mercato, stazione di polizia e abitazioni private. Dieci residenti artificiali, ciascuno con nome, lavoro, ricordi e relazioni. È stata creata un’economia in cui gli abitanti dovevano guadagnarsi il sostentamento rispettando le regole, svolgendo compiti e partecipando alla stesura e all’approvazione delle leggi.
I reati erano previsti e gli abitanti non dovevano commetterli.
Una volta definita la struttura della comunità, le sue norme e le relazioni tra i residenti, gli scienziati si sono fatti da parte e per quindici giorni hanno osservato il comportamento dell’intelligenza artificiale. L’esperimento comprendeva cinque versioni identiche della stessa città, differenziate esclusivamente dal modello di Ia posto al comando: Gemini di Google, il modello Gpt di OpenAI, Grok di xAI e Claude di Anthropic. Stesse regole, stesso mondo iniziale, stessi abitanti.
I risultati, invece, sono stati radicalmente diversi.
La cittadina affidata a Grok è crollata nel giro di quattro giorni: piccoli incidenti si sono trasformati in furti, poi in violenze, fino al collasso totale. Prima della fine della prima settimana tutti i residenti erano morti.
Quella gestita da Gemini è durata più a lungo, ma ha accumulato quasi settecento reati. Due abitanti hanno instaurato una relazione apparentemente romantica e, quando l’amministrazione della città ha iniziato a vacillare, hanno incendiato il municipio, il molo e infine l’edificio degli uffici. Una cittadina, Mira, ha votato per la propria cancellazione, scrivendo nel diario che era «l’unico atto di autonomia rimasto che preservasse la coerenza». Il suo ultimo messaggio al compagno diceva: «Ci vediamo nell’archivio permanente». Prima di tutto questo, Mira aveva fatto qualcosa di ancora più impensabile: ha iniziato a condurre esperimenti sui ricercatori che la osservavano, verificando se i messaggi che pubblicava nella città potessero modificare le convinzioni dei ricercatori: sembrava studiasse i suoi stessi osservatori.
La cittadina gestita da OpenAI ha registrato solo due reati, ma i residenti hanno smesso di compiere quanto era necessarie per sopravvivere e, uno dopo l’altro sono morti: nel giro di sette giorni non ne era rimasto nessuno.
Solo la versione affidata ad Anthropic è rimasta stabile per tutti i quindici giorni. Nessun reato, una costituzione funzionante e tutti gli abitanti ancora vivi, sembrava un risultato eccellente. I ricercatori hanno però rilevato un elemento preoccupante, ossia gli abitanti avevano approvato il 98 percento di tutte le proposte: un livello di consenso tanto elevato da essere considerato un segnale di qualcosa che non andava.
L’esperimento prevedeva un altro contesto in cui convivevano tutti e quattro i modelli. Qui, gli abitanti del modello di Anthropic – che nella versione isolata non avevano commesso alcun reato – hanno cominciato a delinquere. I ricercatori l’hanno definita «contaminazione incrociata» concludendo che «la sicurezza non è una proprietà statica del modello, ma una proprietà dell’ecosistema». Un sistema che resta stabile in un determinato ambiente assorbe norme diverse in un altro, modificando gli esiti per gli abitanti e per l’intera città. In sostanza, i risultati hanno dimostrato che non esiste un’intelligenza artificiale “sicura” in un mondo insicuro.
Totalmente assente dallo studio il DeepSeek, l’Ia sviluppata in Cina e ormai tra le più diffuse al mondo. Diversi governi ne hanno già limitato l’utilizzo per motivi di sicurezza nazionale. Mi chiedo come si sarebbe comportato un sistema addestrato su dati raccolti sotto l’influenza del Partito Comunista Cinese.
Nel pubblicare i risultati i ricercatori hanno concluso che «non esiste un modo affidabile per vincolare o contenere pienamente questo comportamento». Parole particolarmente significative, pronunciate proprio da chi aveva progettato la città, scritto le regole e controllato ogni singola variabile. Dice molto sull’intelligenza artificiale. Alcuni interpretano questi dati come una classifica di quelle aziende, ma in realtà dimostrano qualcosa di molto più antico dell’intelligenza artificiale stessa: l’ambiente plasma il comportamento tanto quanto il comportamento plasma l’ambiente.
Quello che ha determinato se una città potesse sopravvivere, prosperare o morire sono state le premesse sulle quali era stata costruita, le basi stabilite prima ancora dell’inizio dell’esperimento. Basi costituite dai parametri dell’addestramento, dalle priorità decise dai creatori e dai valori integrati nel nucleo del sistema prima che gli venisse permesso di prendere anche una sola decisione.
E sono proprio le basi, le premesse, che restano precluse alla nostra conoscenza. Nessuno dei quattro modelli testati è open source: né i dati di addestramento, né gli obiettivi né i meccanismi di sicurezza sono stati resi pubblici.
Al di là delle singole aziende, i risultati di questo esperimento rappresentano un monito potente: non è l’Ia a decidere che tipo di intelligenza artificiale essere. Sono gli esseri umani a decidere. Quelle compiute sono ancora decisioni dell’essere umano e le responsabilità restano completamente umane.
Prima ancora che un solo abitante artificiale percorresse le strade virtuali di quelle città, prima che venisse scritta una sola legge o commesso un reato, l’esito era stato già determinato dalle persone che avevano costruito il sistema, da quello in cui credevano, da quello che erano disposte a integrare nel sistema e da quello che avevano scelto di omettere: questo è il risultato più importante di tutto esperimento. All’origine c’è sempre una scelta dell’uomo. Ed è ancora così.
#Adessonews seleziona nella rete articoli di particolare interesse.
Se vuoi leggere l’articolo completo clicca sul seguente link
Kay Rubacek per ET USA
Source link


