Labirinto AI: Il Nuovo Strumento di Cloudflare Inganna i Crawler AI con Pagine Web False

Image by Marco Verch, from Ccnull

Labirinto AI: Il Nuovo Strumento di Cloudflare Inganna i Crawler AI con Pagine Web False

Tempo di lettura: 4 Min.

Cloudflare ha annunciato “AI Labyrinth”, uno strumento creato per combattere i web scraper guidati da intelligenza artificiale che estraggono dati dai siti web senza permesso.

Di fretta? Ecco i fatti essenziali:

  • Lo strumento genera contenuti realistici ma inutili creati da AI per sprecare il tempo degli scraper.
  • AI Labyrinth prende di mira i bot che ignorano robots.txt, inclusi quelli di Anthropic e Perplexity AI.
  • Funziona come un honeypot di nuova generazione, rilevando e identificando i crawler non autorizzati.

Invece di bloccare direttamente questi bot, AI Labyrinth li inganna conducendoli in un labirinto infinito di pagine generate da AI, sprecando il loro tempo e la loro potenza di calcolo.

“Quando rileviamo un crawling non autorizzato, invece di bloccare la richiesta, indirizzeremo verso una serie di pagine generate da AI che sono abbastanza convincenti da attirare un crawler a percorrerle,” ha spiegato Cloudflare in un post sul blog.

“Ma, pur sembrando reali, questi contenuti non sono in realtà il contenuto del sito che stiamo proteggendo, quindi il crawler spreca tempo e risorse,” ha aggiunto Cloudflare.

ArsTechnica sottolinea che i raccoglitori di AI sono un problema perché raccolgono enormi quantità di dati dai siti web, spesso senza permesso, per addestrare i modelli di AI. Ciò crea diversi problemi: può violare i diritti di proprietà intellettuale, eludendo i controlli che i proprietari dei siti web utilizzano per regolare l’accesso.

Inoltre, la raccolta può portare all’abuso di dati sensibili o proprietari. Il volume della raccolta è aumentato drasticamente, con Cloudflare che segnala oltre 50 miliardi di richieste di crawler al giorno.

Questo vasto estrazione di dati prosciuga le risorse dei siti web, influenzando le prestazioni del sito e la privacy, contribuendo alle crescenti preoccupazioni riguardo lo sfruttamento dei dati nello sviluppo dell’IA.

Mentre tradizionalmente i proprietari dei siti web si affidano al file robots.txt per indicare ai bot ciò a cui possono e non possono accedere, molte aziende di IA, tra cui grandi attori come Anthropic e Perplexity AI, sono state accusate di ignorare queste direttive, come riportato daThe Verge.

Il Labirinto AI di Cloudflare offre un approccio più aggressivo per affrontare questi bot indesiderati. Lo strumento funziona come un “honeypot di prossima generazione”, attirando i bot più a fondo in una rete artificiale di contenuti che sembrano reali, ma che in definitiva sono inutili per la formazione dell’IA.

A differenza degli honeypot tradizionali, che i bot hanno imparato a identificare, il Labirinto AI crea informazioni realistiche ma irrilevanti utilizzando la piattaforma AI Workers di Cloudflare.

“Nessun vero essere umano andrebbe quattro livelli in profondità in un labirinto di assurdità generate dall’IA”, ha osservato Cloudflare. “Qualsiasi visitatore che lo fa è molto probabilmente un bot, quindi ciò ci fornisce un nuovissimo strumento per identificare e prendere le impronte dei bot cattivi.”

Il contenuto generato dall’IA è progettato per essere scientificamente accurato ma non correlato al vero sito web che viene protetto.

Ciò garantisce che lo strumento non contribuisca alla disinformazione pur confondendo ancora i raschietti AI. Le pagine fuorvianti sono invisibili ai visitatori umani e non influenzano il posizionamento sui motori di ricerca.

AI Labyrinth è disponibile come una funzione gratuita, su base volontaria, per tutti gli utenti di Cloudflare. Gli amministratori del sito web possono attivarla attraverso la loro dashboard di Cloudflare, sotto le impostazioni di Gestione Bot.

L’azienda descrive questo come solo l’inizio delle contromisure guidate dall’IA, con piani futuri per rendere le pagine false ancora più ingannevoli.

Il gioco del gatto e del topo tra i siti web e gli scraper AI continua, con Cloudflare che adotta un approccio innovativo per proteggere i contenuti online. Tuttavia, rimangono delle domande su quanto rapidamente le aziende di IA si adatteranno a queste trappole e se questa strategia potrebbe portare a un’escalation nella battaglia per i dati web.

Hai apprezzato questo articolo?
Valutalo!
L'ho odiato Non mi è piaciuto Non male Molto bene! L'ho amato!

Siamo felici che ti sia piaciuto il nostro lavoro!

In qualità di stimato lettore, ti dispiacerebbe lasciare una recensione su Trustpilot? Richiede poco tempo e significa tantissimo per noi. Grazie mille!

Valutaci su Trustpilot
0 Votato da 0 utenti
Titolo
Commento
Grazie per la tua opinione!
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Lascia un commento

Loader
Loader Mostra di più...