Tu immagina…e l'AI esegue!
Negli ultimi anni l'intelligenza artificiale ha compiuto enormi progressi nella capacità di comprendere e interagire con il linguaggio naturale. Questo sviluppo è stato reso possibile grazie all'aumento del potere di elaborazione dei computer e ai progressi nella tecnologia del machine learning. Uno dei risultati più sorprendenti di questo sviluppo è ChatGPT, sviluppato da OpenAI.
ChatGPT è un software capace di comunicare in modo naturale con le persone, imparando dalle conversazioni precedenti per migliorare le risposte future. Attualmente, i limiti di questo programma sono diversi: le informazioni sono limitate a quelle antecedenti al 2021 e nelle sue risposte potrebbero essere presenti errori o informazioni false. Tuttavia, ChatGPT si evolve man mano che viene utilizzato, perfezionandosi sempre di più.
Al momento, nonostante sia solo una demo, ChatGPT è in grado di svolgere praticamente ogni funzione: risolve problemi di fisica e operazioni matematiche, esplicitando i passaggi e fornendo spiegazioni; è in grado di scrivere articoli di giornale, rispondere a domande appartenenti ad ogni ambito, generare interi discorsi e anche copioni. Non sono richieste particolari doti informatiche per utilizzarlo: basta saper immettere la richiesta in modo corretto, chiaro e preciso.
Tutto ciò avviene in modo immediato: dopo qualche secondo verranno fornite tutte le risposte e informazioni richieste dall'utente. Ciò rende la comunicazione con i computer sempre più naturale e familiare, aprendo nuove possibilità per l'interazione uomo-macchina in futuro.
Le intelligenze artificiali stanno prendendo piede anche in ambito artistico: su Internet è possibile trovare siti gratuiti come AutoDraw di Google, che da una bozza sono in grado di creare disegni gradevoli e artistici, comprendendo ciò che si sta cercando di disegnare, modificandolo e rendendolo migliore.
Esistono poi siti più avanzati, tra cui Dall-E 2, anch'esso sviluppato da OpenAI, che crea delle illustrazioni partendo da una didascalia fornita dall'utente e può addirittura modificare immagini o quadri già esistenti, aggiungendo o rimuovendo elementi, cambiando lo stile o i colori.
La domanda sorge spontanea: come fanno questi software a comprendere le parole da noi dette e trasformarle in immagini? Ciò è possibile grazie al sistema CLIP (Contrastive Learning Image Pre-training): per ogni parola della nostra richiesta, il sistema si collegherà a milioni e milioni di immagini che la contengono nella loro didascalia, cercando un elemento in comune tra esse e riconoscendo il soggetto che ci interessa. Fatto ciò, il sistema applica la tecnica della diffusione, trasformando il testo in dati e modificando l'immagine fino a renderla comprensibile e adatta alla descrizione fornita dall'utente.
Anche Google ha presentato un software estremamente simile: Imagen, giudicato da Google stessa come «il sistema più accurato e pertinente alle richieste dettate dall’utente.»
Questa constatazione è stata sostenuta dai dati forniti da un benchmark (ovvero un parametro di riferimento) chiamato DrawBench, che è stato in grado di confrontare tutti i sistemi di IA, valutandone le diverse prestazioni e i risultati da loro ottenuti.
Tuttavia, queste intelligenze artificiali non sono ancora infallibili: spesso le illustrazioni possono risultare sfocate, di bassa qualità o, addirittura, incomplete, in quanto più lunga è la frase, maggiore è la possibilità che l’intelligenza artificiale “si confonda”, fraintendendo il vero senso della didascalia.
Questi sistemi sono gratuiti, ma accessibili solo ad un pubblico gravemente ristretto e selezionato tramite lunghe liste d’attesa; questo perché le immagini generate potrebbero essere utilizzate per creare e dar base a notizie fasulle o anche per originare illustrazioni discriminatorie.
I due team, Google e OpenAI, stanno lavorando ad algoritmi che possano prevenire questo malo uso dei software, ma, fino alla loro creazione, questi sistemi restano imperfetti e, sotto alcuni aspetti, rischiosi.
Stella Ravani
