Google DeepMind lancia uno strumento di watermark open-source per aiutare a rilevare i testi generati dall’IA
Hai fretta? Ecco i Fatti Essenziali!
- Google DeepMind ha lanciato SynthID-Text, un nuovo strumento open-source gratuito
- La tecnologia SynthID può ora rilevare testi, audio, video e immagini generati dall’IA
- La ricerca è stata pubblicata su Nature con ulteriori dettagli tecnici
Google DeepMind ha lanciato mercoledì un tool open-source per i watermark chiamato SynthID-Text, per aiutare a rilevare il testo generato da intelligenza artificiale. Il tool è disponibile gratuitamente per le aziende e gli sviluppatori e funziona incorporando watermark invisibili – indetectabili all’occhio umano – nel testo durante la generazione, modificando le probabilità delle parole.
“Qui descriviamo SynthID-Text, uno schema di watermarking per testi pronto per la produzione che preserva la qualità del testo e consente un’alta precisione di rilevamento, con un minimo ritardo,” afferma l’abstract della ricerca pubblicata su Nature. “Per abilitare il watermarking su larga scala, sviluppiamo un algoritmo che integra il watermarking con il campionamento speculativo, una tecnica di efficienza frequentemente usata nei sistemi di produzione.”
Secondo il MIT Technology Review, il laboratorio di ricerca AI del gigante della tecnologia ha sviluppato la tecnologia SynthID per creare diversi strumenti di watermark AI che ora possono riconoscere testi, musica, video e immagini generati da AI. Google DeepMind ha condiviso un video che spiega come funziona la tecnologia su diversi tipi di media.
Ecco come SynthID marchia i contenuti generati da AI su diverse modalità. ↓ pic.twitter.com/CVxgP3bnt2
— Google DeepMind (@GoogleDeepMind) 23 Ottobre, 2024
SynthID è disponibile attraverso il Google Responsible Generative AI Toolkit dell’azienda, e i ricercatori stanno lavorando insieme a Hugging Face, una piattaforma collaborativa per sviluppatori che ospita altri progetti open source come il tutorial di LeRobot per costruire robot alimentati da intelligenza artificiale a casa, per condividerlo sul loro sito.
“Ora, altri sviluppatori di AI [generative] potranno utilizzare questa tecnologia per aiutarli a rilevare se i risultati del testo provengono dai loro stessi [large language models], rendendo più facile per più sviluppatori costruire AI in modo responsabile”, ha detto Pushmeet Kohli, il vicepresidente della ricerca presso Google DeepMind, a MIT Technology Review.
SynthID è stato testato nei prodotti Gemini di Google, e milioni di utenti non sono stati in grado di differenziare tra contenuto con watermark e senza watermark. Tuttavia, i ricercatori hanno riconosciuto che ha dei limiti quando il testo è stato modificato o tradotto, ma rimangono ottimisti e credono che lo strumento potrebbe aiutare a combattere la disinformazione e migliorare la sicurezza dell’IA.
Diverse aziende tecnologiche hanno annunciato strategie di etichettatura dell’IA negli ultimi mesi. Meta ha annunciato a febbraio un sistema per identificare i contenuti IA su Instagram, Facebook e Threads, Google ha richiesto agli utenti di etichettare i contenuti IA a marzo, e Tiktok ha aggiunto etichette al contenuto generato dall’IA a maggio.
Lascia un commento
Annulla