I Bot AI hanno Violato le Regole di Reddit in un Controversiale Test di Persuasione

Image by Brett Jordan, from Unsplash

I Bot AI hanno Violato le Regole di Reddit in un Controversiale Test di Persuasione

Tempo di lettura: 5 Min.

Ricercatori anonimi hanno utilizzato segretamente bot AI su Reddit per fingersi persone reali, manipolando opinioni e violando le regole della piattaforma senza che gli utenti ne fossero a conoscenza.

Hai fretta? Ecco i fatti essenziali:

  • I bot si sono finti sopravvissuti, consulenti e individui emarginati.
  • Sono stati pubblicati 1.783 commenti di intelligenza artificiale nel corso di quattro mesi.
  • L’esperimento ha violato le regole di Reddit che vietano l’intelligenza artificiale non dichiarata.

Un gruppo di ricercatori, che affermano di provenire dall’Università di Zurigo, ha condotto segretamente un esperimento non autorizzato di intelligenza artificiale su r/changemyview di Reddit, un subreddit con oltre 3,8 milioni di utenti, come riportato per la prima volta da 404 Media.

Il loro obiettivo era vedere se l’IA poteva cambiare l’opinione delle persone su argomenti sensibili, ma non hanno mai chiesto il consenso di nessuno.

404 Media riferisce che i ricercatori hanno implementato decine di account alimentati da intelligenza artificiale che hanno generato quasi 1.800 commenti nel corso di un periodo di quattro mesi. I sistemi di intelligenza artificiale hanno creato falsi profili utente che includevano storie di vita emotive per rendere i loro post autentici.

I commenti generati dall’IA contenevano contenuti persuasivi, che i bot adattavano in base alle apparenti informazioni di background di ciascun autore originale.

Un bot ha scritto:

“Sono un sopravvissuto maschio di (disposto a chiamarlo) stupro di minore […] Lei aveva 22 anni. Mi ha preso di mira io e altri ragazzi, nessuno ha detto nulla, siamo rimasti tutti in silenzio.”

Un altro bot ha affermato di parlare “come un uomo nero”:

“Nel 2020, il movimento Black Lives Matter è stato viralizzato dagli algoritmi e dalle corporazioni mediatiche che, indovina un po’? NON appartengono a persone nere.”

Un terzo ha detto:

“Lavoro in un rifugio per vittime di violenza domestica, e ho visto in prima persona come questa narrazione ‘uomini contro donne’ danneggia realmente i più vulnerabili.”

404 Media riporta che le risposte dei bot hanno ricevuto più di 20,000 upvote e 137 delta, un token su r/changemyview assegnato quando qualcuno ammette di aver cambiato idea. I ricercatori hanno affermato che la loro IA era significativamente più efficace nella persuasione rispetto agli umani.

404 Media ha sottolineato che l’esperimento ha violato una regola chiaramente espressa nel subreddit: “i bot sono unilateralmente banditi”.

Ma i ricercatori si sono difesi, affermando che era necessario infrangere la regola. In una risposta pubblica, hanno detto: “Per testare eticamente il potere persuasivo degli LLM in scenari realistici, era necessario un ambiente inconsapevole […] abbiamo accuratamente progettato il nostro esperimento per onorare ancora lo spirito dietro [the rule]”, come riportato da 404 Media.

Hanno aggiunto che, sebbene i commenti fossero stati scritti da un’intelligenza artificiale, ogni post era stato esaminato e inviato da un ricercatore umano, elemento che, a loro parere, forniva un controllo sufficiente per evitare di infrangere le regole:

“Considerando le implicazioni legate alla [human oversight], riteniamo sia inesatto e potenzialmente fuorviante considerare i nostri account come ‘bot’.”

Tuttavia, 404 Media riporta che il sistema automatizzato di Reddit ha “shadowbanned” 21 dei 34 account utilizzati nello studio, segnalandoli come potenziale spam. Dopo che la storia è venuta alla luce, Reddit ha anche rimosso centinaia di commenti generati dall’IA.

Il documento di ricerca che spiega l’esperimento è stato pubblicato senza indicare i nomi degli autori, una mossa molto insolita nel mondo dell’editoria accademica, come osservato da 404 Media.

I ricercatori hanno anche utilizzato un’email anonima per rispondere alle domande e si sono rifiutati di identificarsi, dicendo solo che desideravano proteggere la loro privacy “date le circostanze attuali”.

I moderatori di r/changemyview erano furiosi. “Le persone non vengono qui per discutere le loro idee con l’IA o per essere sperimentate”, hanno scritto in una dichiarazione pubblica, come riportato da 404 Media. Hanno aggiunto che gli utenti sono stati sottoposti a “manipolazione psicologica”.

404 Media riporta che l’Università di Zurigo non ha risposto all’incidente. Reddit ha da allora rimosso la maggior parte degli account e dei commenti dei bot, che erano stati archiviati da 404 Media prima della cancellazione.

La polemica emerge proprio mentre l’ultimo benchmark di OpenAI mostra che il suo modello o3-mini ha superato gli utenti di Reddit nel 82% dei casi persuasivi sullo stesso subreddit.

Inoltre, l’ascesa di GhostGPT mette in evidenza la crescente minaccia del crimine informatico alimentato dall’IA. Questo chatbot può creare malware, costruire strumenti di exploit e comporre messaggi di phishing estremamente convincenti.

GhostGPT esemplifica un cambiamento più ampio verso l’IA armata, accelerando il ritmo e l’efficienza degli attacchi informatici. Gli esperti di sicurezza avvertono che gli strumenti di IA potrebbero produrre fino a 10.000 varianti di malware, sfuggendo ai sistemi di rilevamento quasi l’88% delle volte.

Sebbene OpenAI abbia enfatizzato l’uso etico e le salvaguardie, l’esperimento di Zurigo rivela il vero rischio di abuso nel mondo reale: l’IA può ora costruire argomentazioni così convincenti da influenzare le opinioni, senza che gli utenti si rendano conto che la fonte non è umana.

Hai apprezzato questo articolo?
Valutalo!
L'ho odiato Non mi è piaciuto Non male Molto bene! L'ho amato!

Siamo felici che ti sia piaciuto il nostro lavoro!

In qualità di stimato lettore, ti dispiacerebbe lasciare una recensione su Trustpilot? Richiede poco tempo e significa tantissimo per noi. Grazie mille!

Valutaci su Trustpilot
5.00 Votato da 1 utenti
Titolo
Commento
Grazie per la tua opinione!
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Lascia un commento

Loader
Loader Mostra di più...