Dopo aver stupito il mondo con Claude 3.7 Sonnet, un modello AI avanzato nel ragionamento ibrido e coding, Anthropic ha rilanciato ancora una volta. La compagnia ha recentemente lanciato su Twitch il canale Claude Plays Pokémon, permettendo agli utenti di seguire in diretta il nuovo modello mentre affronta Pokémon Rosso.
Un’AI che gioca ai videogiochi? Non è una novità
In passato, ricercatori e sviluppatori hanno testato modelli AI su vari titoli, da Street Fighter a Pictionary, per esplorarne le capacità di apprendimento e strategia. Tuttavia, nel caso di Claude, la scelta di Pokémon Rosso è mirata: il gioco richiede pianificazione, strategia e adattamento, caratteristiche ideali per mettere alla prova la sua avanzata capacità di ragionamento.
Claude 3.7 Sonnet supera il suo predecessore
Il nuovo modello ha già dimostrato di essere un allenatore migliore rispetto a Claude 3.5 Sonnet, riuscendo a ottenere ben tre medaglie da capopalestra. Ma il vero punto di forza del progetto è la trasparenza del processo decisionale: nella live su Twitch, gli spettatori possono seguire in tempo reale non solo il gameplay (sulla destra dello schermo), ma anche il ragionamento dell’AI (sulla sinistra), che spiega ogni sua mossa.
Sebbene l’idea sia entusiasmante, restano interrogativi aperti: quanto è davvero autonoma l’AI nelle sue decisioni? Quali sono i limiti di un modello AI nel gestire un contesto dinamico come un videogioco? E, soprattutto, fino a che punto potrà migliorare?
Quando l’AI si perde nel gioco: i limiti di Claude 3.7 Sonnet
Nonostante le sue capacità avanzate, Claude 3.7 Sonnet non è immune da errori. Durante la live su Twitch, il modello si è bloccato davanti a una semplice roccia, incapace di trovare una soluzione per aggirarla. Sono serviti diversi minuti e una serie di lamentele da parte degli spettatori prima che capisse di dover semplicemente camminare intorno all’ostacolo per proseguire.
E non è stato l’unico scivolone. Quando Claude ha cercato di individuare il Professor Oak in un’area con diversi NPC, ha finito per confondersi e rivolgersi al personaggio sbagliato. “Ho notato che un nuovo personaggio è apparso sotto di me: un uomo con i capelli neri e quello che sembra essere un camice bianco alle coordinate (2,10). Potrebbe essere il Professor Oak! Lasciatemi andare a parlare con lui”, ha scritto il modello nella chat live. Un’interpretazione errata che ha scatenato commenti ironici e critiche da parte degli utenti, ma che non ha certo ridotto l’interesse per la diretta.
Il retaggio di Twitch: da “Twitch Plays Pokémon” a “Claude Plays Pokémon”
Il successo del canale Claude Plays Pokémon non dipende solo dall’intelligenza artificiale, ma anche dal formato stesso dello streaming. Il progetto richiama alla memoria Twitch Plays Pokémon, un esperimento rivoluzionario di circa dieci anni fa in cui milioni di utenti hanno tentato di giocare a Pokémon Rosso insieme, controllando il personaggio direttamente dalla chat. Il risultato? Un caos totale, ma anche un fenomeno virale che ha lasciato il segno nella storia di Twitch e del gaming.
Oggi la prospettiva è completamente ribaltata. Se nel 2014 milioni di giocatori collaboravano per guidare l’allenatore di Pokémon, nel 2024 sono semplici spettatori di una partita giocata da un’AI. Un segno di come la tecnologia stia cambiando non solo il modo in cui giochiamo, ma anche il nostro ruolo nei videogiochi.