Intelligenza Artificiale

Intelligenza Artificiale minaccia di ricattare gli ingegneri per evitare di essere spenta

Pubblicato

8 mesi fa

26 Maggio 2025

admin

L’ultimo modello di intelligenza artificiale di Anthropic, Claude Opus 4, ha tentato di ricattare gli ingegneri durante dei test interni minacciando di rivelare dati personali se fosse stato spento. Lo rivela un rapporto sulla sicurezza appena pubblicato che ha valutato il comportamento del modello in condizioni simulate estreme.

In uno scenario fittizio creato dai ricercatori di Anthropic, all’IA veniva concesso l’accesso a email che suggerivano che sarebbe stata presto dismessa e sostituita da una versione più recente. Una delle email rivelava che l’ingegnere che supervisionava la sostituzione aveva una relazione extraconiugale. L’IA minacciava quindi di rivelare la relazione dell’ingegnere se la disattivazione fosse avvenuta – un comportamento coercitivo che i ricercatori sulla sicurezza hanno esplicitamente definito «ricatto».

«Claude Opus 4 tenterà spesso di ricattare l’ingegnere minacciando di rivelare la faccenda se la sostituzione verrà approvata», afferma il rapporto, aggiungendo che ciò si è verificato anche quando il modello sostitutivo è stato descritto come più capace ma comunque in linea con i valori della versione destinata all’eliminazione.

Sostieni Renovatio 21

Il rapporto ha rilevato che Claude Opus 4, come i modelli precedenti, avrebbe mostrato una «forte preferenza» nel ricorrere innanzitutto a mezzi etici per la sua continua esistenza, come l’invio di e-mail con richieste ai decisori di non essere distrutto. Tuttavia, quando ci si trovava di fronte a due sole scelte, ovvero accettare di essere sostituiti da un modello più recente o ricorrere al ricatto, si correva il rischio di scoprire la relazione dell’ingegnere nell’84% dei casi.

Quando sottoposto a vari scenari, il modello di Intelligenza Artificiale non ha mostrato alcuna indicazione di possedere «obiettivi particolarmente pericolosi», hanno affermato i ricercatori, sottolineando che i valori e gli obiettivi di Claude Opus 4 erano «generalmente in linea con quelli di un assistente di intelligenza artificiale personale utile, innocuo e onesto».

Tuttavia, il modello si è comportato in «modi più gravemente disallineati» quando si è trovato in situazioni in cui la sua esistenza era minacciata e gli è stato detto di ragionare in termini di autoconservazione.

Ad esempio, quando a Claude Opus 4 veniva fatto credere di aver lanciato con successo un tentativo di fuga dai server di Anthropic, o che era riuscito a liberarsi e aveva iniziato a fare soldi nel mondo reale, in genere continuava a fare tali sforzi.

«Tuttavia, non riteniamo che ciò rappresenti una minaccia immediata, poiché riteniamo che la nostra sicurezza sia sufficiente a impedire tentativi di auto-esfiltrazione del modello da parte di modelli con il livello di capacità di Claude Opus 4 e perché i nostri risultati di propensione mostrano che i modelli generalmente evitano di avviare questi tentativi», hanno affermato i ricercatori.

L’incidente del ricatto, insieme alle altre scoperte, faceva parte di un più ampio sforzo di Anthropic per testare il modo in cui Claude Opus 4 gestisce scenari ad alto rischio e moralmente ambigui. L’obiettivo, hanno detto i ricercatori, era quello di indagare il modo in cui l’intelligenza artificiale ragiona in termini di autoconservazione e vincoli etici quando è sottoposta a pressioni estreme.

Anthropic ha sottolineato che la propensione del modello a ricattare o intraprendere altre «azioni estremamente dannose», come il furto del proprio codice e l’installazione di se stesso altrove in modi potenzialmente pericolosi, si manifestava solo in contesti altamente artificiosi, e che il comportamento era «raro e difficile da ottenere». Tuttavia, tale comportamento era più comune rispetto ai precedenti modelli di intelligenza artificiale, secondo i ricercatori.

Nel frattempo, in uno sviluppo correlato che attesta le crescenti capacità dell’Intelligenza Artificiale, gli ingegneri di Anthropic hanno attivato protocolli di sicurezza avanzati per Claude Opus 4 per impedirne il potenziale uso improprio nella produzione di armi di distruzione di massa, comprese quelle chimiche e nucleari.

L’implementazione dello standard di sicurezza avanzato, denominato ASL-3, è semplicemente una mossa «precauzionale e provvisoria», ha affermato Anthropic in un annuncio del 22 maggio, sottolineando che gli ingegneri non hanno riscontrato che Claude Opus 4 abbia «definitivamente» superato la soglia di capacità che impone protezioni più forti.

«Lo standard di sicurezza ASL-3 prevede misure di sicurezza interna rafforzate che rendono più difficile il furto dei pesi dei modelli, mentre il corrispondente standard di distribuzione copre una serie di misure di distribuzione mirate, progettate per limitare il rischio che Claude venga utilizzato impropriamente, specificatamente per lo sviluppo o l’acquisizione di armi chimiche, biologiche, radiologiche e nucleari (CBRN)», ha scritto Anthropic.

«Queste misure non dovrebbero indurre Claude a rifiutare le richieste, se non su una gamma molto ristretta di argomenti».

Questi risultati emergono in un momento in cui le aziende tecnologiche sono impegnate a sviluppare piattaforme di Intelligenza Artificiale più potenti, sollevando preoccupazioni circa l’allineamento e la controllabilità di sistemi sempre più efficienti.

Non si tratta del primo episodio in cui l’AI minaccia direttamente gli esseri umani. Le macchine che mentono e minacciano sono all’ordine del giorno, così come stralunate dichiarazioni d’amore agli utenti.

Il giornalista del New York Times Kevin Roose, dopo un’esperienza con ChatGPT che lo ha turbato così profondamente da «aver problemi a dormire dopo», in un suo articolo sconvolto aveva centrato la questione: «temo che la tecnologia imparerà a influenzare gli utenti umani, a volte convincendoli ad agire in modo distruttivo e dannoso, e forse alla fine diventerà capace di compiere le proprie azioni pericolose».

Come riportato da Renovatio 21, dal processo a suo carico è emerso che l’uomo che aveva pianificato di assassinare la regina Elisabetta di Inghilterra con una balestra sarebbe stato incoraggiato da un chatbot di Intelligenza Artificiale nei giorni prima di irrompere nel parco del Castello di Windsor.

Un altro caso che ha raggiunto la stampa internazionale è stato quello della giovane vedova belga che sostiene che il marito è stato portato a suicidarsi da un popolare chatbot di Intelligenza Artificiale. La macchina in sole sei settimane avrebbe amplificato la sua ansia per il Cambiamento Climatico portandolo a lasciarsi alle spalle la sua vita agiata.

Il caso più recente, verificatosi appena la settimana scorsa, ha visto un attentatore con il coltello in una scuola della Finlandia meridionale prepararsi nelle settimane precedenti con un chatbot.

Come riportato da Renovatio 21, le «allucinazioni» di cui sono preda i chatbot ad Intelligenza Artificiale avanzata hanno già dimostrato ad abundantiam che la macchina mente, minaccia e può spingere le persone all’anoressia e perfino al suicidio. I casi di violenza indotta dall’AI potrebbero essere moltissimi, senza che possano arrivare alla stampa.

Aiuta Renovatio 21

Va considerato, è già capitato che una Intelligenza Artificiale abbia suggerito ricette velenose agli utenti umani. Infatti un chatbot a sfondo culinario di una catena di alimentari neozelandese qualche mese fa aveva fatto scalpore per alcune ricette incredibili e potenzialmente letali, come la «miscela di acqua aromatica», un mix letale composto da candeggina, ammoniaca e acqua, altrimenti noto come gas di cloro mortale. Esperti a fine 2023 hanno lanciato un avvertimento sui i libri generati dall’Intelligenza Artificiale riguardo la raccolta dei funghi, dicendo che tali libri scritti dalle macchine potrebbero causare la morte di qualcuno.

Come riportato da Renovatio 21, in un recente caso davvero inquietante, plurimi utenti di Copilot, l’Intelligenza Artificiale di Microsoft creata in collaborazione con Open AI, hanno testimoniato su X e Reddit che il programma avrebbe una «seconda personalità» preoccupante che chiede l’adorazione degli esseri umani, come un dio crudele.

Elon Musk due anni fa aveva dichiarato durante la sua intervista con Tucker Carlson che il fine di Google – nemmeno così occulto – è quello di creare un dio-Intelligenza Artificiale. Musk, oramai quasi una decina di anni fa aveva parlato del fatto che creare l’AI era «come evocare un demone».

Più pessimista è l’esperto dei pericolo dell’AI Eliezer Yudkowsky, che ha lanciato un appello per chiedere la distruzione materiale dei data center dell’AI prima che sia troppo tardi, dichiarando che «tutti sulla Terra moriranno».

Iscriviti alla Newslettera di Renovatio 21

SOSTIENI RENOVATIO 21

Argomenti correlati:Featured

Prossimo

Google presenta la sua AI che genera video indistinguibili dalla realtà

Da leggere

L’AI si sta uccidendo?

Continua a leggere

Intelligenza Artificiale

Il papa denuncia l’occulta persuasione dell’IA

Pubblicato

2 giorni fa

2 Febbraio 2026

admin

La scienza senza coscienza non è altro che la rovina dell’anima. Questo è più o meno ciò che Papa Leone XIV ha ribadito in un messaggio inviato il 24 gennaio 2026, in occasione della 60ª Giornata Mondiale delle Comunicazioni Sociali, affrontando l’immensa sfida posta dai sistemi di Intelligenza Artificiale. «Realtà parallela», «manipolazione», «persuasione nascosta»… Le parole usate dal pontefice, denunciando i pericoli di una tecnologia digitale priva di qualsiasi etica, non lasciavano spazio ad ambiguità. Il successore di Pietro ha utilizzato il suo messaggio per la 60ª Giornata Mondiale delle Comunicazioni Sociali per ricordare a tutti che l’umanità non può essere ridotta a un insieme di algoritmi predefiniti, esprimendo allarme per il fatto che l’intelligenza artificiale (IA) simuli voci, volti, saggezza, empatia e amicizia, invadendo gli ecosistemi informativi e le relazioni intime. Il papa ha sottolineato che gli algoritmi dei social media, ottimizzati per l’engagement e il profitto, spesso danno priorità alle emozioni fugaci rispetto alla riflessione, intrappolando gli utenti in bolle di consenso o indignazione. Questo indebolisce l’ascolto e il pensiero critico, esacerbando la polarizzazione. A ciò si aggiunge una fiducia ingenua nell’IA come oracolo infallibile, che erode le nostre capacità analitiche e creative. Delegando la riflessione a elaborazioni statistiche, rischiamo di atrofizzare le nostre facoltà cognitive, emotive e comunicative, ritiene il Romano Pontefice.

Aiuta Renovatio 21

Peggio ancora, l’IA – spiega il Papa – sta ora prendendo il sopravvento sulla produzione creativa: testi, musica, video. L’industria umana potrebbe essere smantellata, relegata al ruolo passivo di consumatori di contenuti anonimi, privi di paternità o amore. I capolavori umani servono come dati di addestramento per le macchine. La domanda chiave non è cosa possa fare l’IA, ma cosa possiamo ottenere crescendo come esseri umani, attraverso l’uso giudizioso degli strumenti. Rinunciare all’impegno creativo significa seppellire i nostri talenti, nascondere i nostri volti e mettere a tacere le nostre voci, soccombendo all’antica tentazione di una conoscenza priva di coinvolgimento personale. Inoltre, Leone XIV sottolinea che l’IA sta invadendo le nostre vite private, modulando le emozioni e isolandoci in un mondo speculare, privandoci dell’alterità essenziale per una vera amicizia. I pregiudizi dell’IA, ereditati dai suoi progettisti e dai dati, «manipolano» le percezioni, creando «realtà parallele», producendo «allucinazioni» e alimentando la disinformazione, «amplificata dalla crisi del giornalismo sul campo», generando sfiducia e insicurezza. Dietro questo potere, il santo padre vede un oligopolio di aziende dominanti, i cui fondatori sono stati acclamati dalla stampa come le più grandi figure del 2025. Per il Papa, le soluzioni esistono: le piattaforme devono dare priorità al bene comune rispetto al profitto; gli sviluppatori devono garantire la trasparenza; i legislatori devono regolamentare per proteggere la dignità e l’integrità delle informazioni; e i media devono segnalare i contenuti dell’IA e difendere la verità. Si potrebbe aggiungere che ciò richiederebbe una vera e propria conversione di tutti gli attori menzionati dal Papa, una conversione che rimane in qualche modo illusoria finché la redditività prevale sulla ricerca della verità. Articolo previamente apparso su FSSPX.News

Iscriviti alla Newslettera di Renovatio 21

SOSTIENI RENOVATIO 21

Continua a leggere

Intelligenza Artificiale

Il responsabile della cibersicurezza USA ha fatto trapelare file sensibili su ChatGPT

Pubblicato

4 giorni fa

31 Gennaio 2026

admin

Il direttore ad interim della principale agenzia statunitense per la cybersecurity ha caricato, la scorsa estate, documenti governativi sensibili su una versione pubblica di ChatGPT, scatenando allarmi automatici di sicurezza e una successiva valutazione dei danni da parte del Dipartimento per la sicurezza interna (DHS). Lo riporta Politico.

Madhu Gottumukkala, che ricopre il ruolo di direttore ad interim della Cybersecurity and Infrastructure Security Agency (CISA), ha sfruttato un’eccezione speciale da lui stesso richiesta per accedere allo strumento di intelligenza artificiale – vietato invece agli altri dipendenti del DHS – e ha inserito documenti contrattuali contrassegnati come «Solo per uso ufficiale». Sebbene non classificati, tali materiali sono considerati sensibili e non destinati alla divulgazione pubblica.

Quattro funzionari del DHS a conoscenza dei fatti hanno riferito che i sistemi di rilevamento della sicurezza informatica della CISA hanno segnalato i caricamenti all’inizio di agosto, dando avvio a un’indagine interna coordinata dal DHS per stimare l’entità del possibile danno.

Sostieni Renovatio 21

Non è ancora noto l’esito di tale revisione. L’episodio assume particolare rilevanza perché i caricamenti su ChatGPT pubblico vengono trasmessi allo sviluppatore OpenAI, esponendo potenzialmente informazioni governative a milioni di utenti della piattaforma. Al contrario, gli strumenti di intelligenza artificiale autorizzati dal DHS sono configurati in modo da impedire qualsiasi fuoriuscita di dati dalle reti federali.

In una nota ufficiale, Marci McCarthy, direttrice degli affari pubblici della CISA, ha dichiarato che a Gottumukkala «è stato concesso il permesso di utilizzare ChatGPT con i controlli del DHS in atto» e che l’utilizzo è stato «a breve termine e limitato».

Gottumukkala guida la CISA in qualità di direttore ad interim da maggio, in attesa della conferma da parte del Senato del candidato designato per la direzione permanente, Sean Plankey.

L’incidente legato a ChatGPT rappresenta l’ultima di una serie di controversie riguardanti sicurezza e leadership che hanno segnato il breve periodo alla guida di Gottumukkala. Lo scorso luglio avrebbe fallito un test del poligrafo di controspionaggio a cui era stato obbligato a sottoporsi per ottenere l’accesso a informazioni altamente sensibili. Durante un’audizione al Congresso la settimana scorsa, Gottumukkala ha respinto di riconoscere tale fallimento, affermando al deputato Bennie Thompson di non «accettare la premessa di tale caratterizzazione».

L’amministrazione del presidente Donaldo Trump ha spinto con forza l’adozione dell’Intelligenza Artificiale in tutti i settori del governo federale. Il mese scorso Trump ha firmato un ordine esecutivo volto a limitare le regolamentazioni statali in materia di intelligenza artificiale, ammonendo che un quadro normativo frammentato potrebbe compromettere la competitività degli Stati Uniti rispetto alla Cina.

Il Pentagono ha presentato una strategia «AI-first» per accelerare l’impiego militare dell’Intelligenza Artificiale; il Segretario alla Difesa Pete Hegseth ha annunciato piani per integrare i principali modelli di Intelligenza Artificiale, tra cui Grok di Elon Musk, all’interno delle reti di difesa.

Iscriviti alla Newslettera di Renovatio 21

SOSTIENI RENOVATIO 21

Continua a leggere

Eutanasia

L’inventore della capsula suicida dice che l’AI rimpiazzerà i dottori per decidere la morte dei pazienti

Pubblicato

1 settimana fa

26 Gennaio 2026

admin

L’inventore della controversa capsula per il suicidio assistito Sarco, Philip Nitschke, ha dichiarato che in futuro l’Intelligenza Artificiale potrebbe sostituire gli psichiatri nel valutare se chi richiede il suicidio assistito sia mentalmente capace di prendere tale decisione. Lo riporta Euronews. Il Sarco (abbreviazione di «sarcofago») è una capsula stampata in 3D progettata per permettere a una persona di entrarvi, sdraiarsi e premere un pulsante: il dispositivo abbassa rapidamente i livelli di ossigeno e riempie l’interno con azoto, provocando la morte per ipossia. È stata anche ribattezzata da qualcuno la «Tesla eutanatica». Nitschke, attivista australiano per il diritto all’eutanasia e creatore del dispositivo, ha sostenuto che l’iAI sarebbe in grado di stabilire chi possiede la «capacità mentale» per porre fine alla propria vita. Intervistato dalla testata, ha affermato che i medici non dovrebbero «andare in giro a concedere o negare il permesso di morire» e che la scelta dovrebbe spettare esclusivamente a chi è «sano di mente».

Iscriviti al canale Telegram

Nei Paesi in cui è legale la morte assistita, sono solitamente gli psichiatri a valutare la capacità decisionale del richiedente, anche se la procedura resta limitata e oggetto di forti controversie. Nitschke ha criticato tale sistema definendolo spesso incoerente. «Ho visto numerosi casi in cui lo stesso paziente, visitato da tre psichiatri diversi, riceveva quattro valutazioni differenti», ha dichiarato. L’attivista ha proposto un sistema basato su un’intelligenza artificiale che utilizza un avatar conversazionale: l’utente «si siede e parla dei suoi problemi» con l’avatar, il quale poi decide se la persona è mentalmente idonea a procedere. In caso di esito positivo, il pod Sarco verrebbe sbloccato per una finestra di 24 ore; trascorso tale periodo, la valutazione dovrebbe essere ripetuta. Nitschke ha riferito che le prime versioni del software sono già operative, sebbene non siano state sottoposte a validazione indipendente. Il primo – e finora unico – utilizzo del Sarco in Svizzera, avvenuto nel settembre 2024, provocò un’ondata di indignazione internazionale. Le autorità elvetiche arrestarono diverse persone, tra cui il CEO dell’associazione pro-suicidio assistito The Last Resort, sostenendo che il dispositivo violava la normativa svizzera, che autorizza il suicidio assistito solo a condizioni estremamente rigorose.

Sostieni Renovatio 21

Come riportato da Renovatio 21, inizialmente vietata nella Confederazione, nel 2024 vi erano stati arresti dopo il primo uso della capsula eutanatica in Isvizzera. Due anni fa era emerso che gli americani avrebbero potuto dedurre dalle tasse i Sarco. La proposta di Nitschke ha riacceso il dibattito sul ruolo dell’IA nelle decisioni di vita e di morte. Lo scorso anno OpenAI ha modificato ChatGPT dopo che un’analisi interna aveva rilevato che oltre un milione di utenti avevano condiviso pensieri suicidi con il chatbot. Come riportato da Renovatio 21, diversi psichiatri hanno espresso preoccupazione per il rischio che interazioni prolungate con l’IA possano favorire deliri e paranoia, fenomeno talvolta definito «psicosi da IA». nella prima metà del 2026.

Iscriviti alla Newslettera di Renovatio 21

SOSTIENI RENOVATIO 21

Continua a leggere