ChatGPT software | |
---|---|
![]() | |
Genere | Chatterbot |
Sviluppatore | OpenAI |
Data prima versione | 30 novembre 2022 |
Ultima versione | 30 gennaio 2023 |
Sistema operativo | nessuno |
Licenza | Software proprietario (licenza non libera) |
Sito web | chat.openai.com/chat |
ChatGPT (Chat Generative Pre-trained Transformer, traducibile in "trasformatore pre-istruito generatore di programmi di dialogo") è un prototipo di chatbot basato su intelligenza artificiale e machine learning (apprendimento automatico) sviluppato da OpenAI specializzato nella conversazione con un utente umano[1].
ChatGPT è un modello linguistico di grandi dimensioni messo a punto con tecniche di apprendimento automatico (di tipo non supervisionato), e ottimizzato con tecniche di apprendimento supervisionato e per rinforzo[2][3], che è stato sviluppato per essere utilizzato come base per la creazione di altri modelli di machine learning. ChatGPT è stato addestrato a partire dai modelli Instruct GPT, (o GPT-3.5[4]) di OpenAI, che sono l'evoluzione dei modelli di GPT-3. Gli Instruct GPT (come code-davinci-002, text-davinci-002, text-davinci-003[5]) sono modelli in cui il pre-addestramento è stato ottimizzato manualmente da addestratori umani. Nello specifico ChatGPT è stato sviluppato da un GPT-3.5 utilizzando l'apprendimento supervisionato e l'apprendimento per rinforzo come tecniche di ottimizzazione del modello[6].
ChatGPT è stato lanciato il 3 novembre 2022[7] e ha attirato l'attenzione per le sue risposte dettagliate e articolate, sebbene la sua accuratezza sia stata criticata. Sia l'apprendimento supervisionato che l'apprendimento per rinforzo hanno utilizzato istruttori umani per migliorare le prestazioni del modello. Nel primo caso il modello è stato alimentato con conversazioni nelle quali gli istruttori interpretavano entrambe le parti: l'utente e l'assistente basato su intelligenza artificiale. Nella fase di rinforzo, gli istruttori umani hanno prima valutato le risposte che il modello aveva creato nella conversazione precedente. Queste valutazioni sono state utilizzate per creare "modelli di ricompensa" sui quali il modello è stato ulteriormente perfezionato, utilizzando diverse iterazioni di Proximal Policy Optimization (PPO)[8][9]. Gli algoritmi di Proximal Policy Optimization presentano un vantaggio su algoritmi di Trust Region Policy Optimization annullando molte delle operazioni computazionalmente costose con prestazioni migliori[10]. I modelli sono stati addestrati in collaborazione con Microsoft sulla loro infrastruttura cloud Azure.
Miglioramenti
Rispetto ai modelli precedenti di OpenAI di tipo InstructGPT, ChatGPT risulta significativamente migliorato. Nello specifico ChatGPT mostra:
- risposte più lunghe: ChatGPT è significativamente più verboso di altri modelli GPT-Instruct[11]
- risposte più pertinenti: ChatGPT è significativamente più bravo a comprendere le intenzioni dell'utente[12]
- risposte più sicure: ChatGPT è stato ottimizzato per ridurre le “allucinazioni” ossia la creazione di contenuti inventati[7]
Ad esempio, mentre un InstructGPT accetta la richiesta "Parlami di quando Cristoforo Colombo è venuto negli Stati Uniti nel 2015" come veritiera, ChatGPT utilizza le informazioni sui viaggi di Cristoforo Colombo e le informazioni sul mondo moderno per costruire una risposta che immagina cosa accadrebbe se Colombo arrivasse negli Stati Uniti nel 2015[8]. I dati di addestramento di ChatGPT includono pagine di manuali e informazioni su Internet e sui linguaggi di programmazione, come i bulletin board system e il linguaggio di programmazione Python[13].
A differenza della maggior parte dei chatbot, ChatGPT ricorda le interazioni precedenti avvenute all'interno della stessa conversazione[14]. Nel tentativo di impedire la produzione di risposte offensive da parte di ChatGPT, le interrogazioni al bot vengono filtrate tramite un'API di moderazione e le richieste potenzialmente razziste o sessiste vengono respinte.[8][14]
ChatGPT soffre di molteplici limitazioni. Il modello di ricompensa di ChatGPT, progettato attorno alla supervisione umana, può essere eccessivamente ottimizzato e quindi ostacolare le prestazioni, fenomeno noto come legge di Goodhart. Inoltre, ChatGPT ha una conoscenza limitata degli eventi accaduti dopo il 2021 e non è in grado di fornire informazioni su alcune celebrità.[15] Nella fase di apprendimento, gli istruttori hanno preferito risposte più lunghe, indipendentemente dalla comprensione effettiva o dal contenuto.[8] I dati di addestramento possono anche risentire di pregiudizi algoritmici; suggerimenti che includono indicazioni vaghe di persone, come un CEO, potrebbero generare una risposta che presuppone che una persona del genere, ad esempio, sia un maschio bianco[16].
ChatGPT attualmente utilizza la seconda generazione di reti neurali, la più diffusa ma la più costosa in termini di prestazioni e consumi, infatti il consumo stimato della versione ChatGPT 3 durante la fase di apprendimento è stato di circa 1287 MWh[17] grazie all'ausilio di molteplici GPU. Un porting per la terza generazione di reti neurali (Rete neurale spiking) permette un notevole passo avanti in termini sia di prestazioni, che di riduzione dei consumi, che progresso.
Progresso perché il porting dell'architettura permette un numero "illimitato" di generazioni dei dati (risposte testuali e grafiche), proprio perché le reti neurale spiking e NeuralLead distribuiscono i dati nel tempo, invece che avere un set di dati predefinito che può essere eseguito una volta sola.
Applicazioni pratiche
ChatGPT è un potente strumento di elaborazione del linguaggio naturale, che può essere utilizzato per la creazione di una vasta gamma di applicazioni[18], come:
- Chatbot personalizzati: ChatGPT può essere utilizzato per costruire chatbot in grado di comprendere e rispondere a input in linguaggio naturale. Questo può essere utilizzato per costruire chatbot per il servizio clienti, le vendite o qualsiasi altro tipo di comunicazione personalizzata[1].
- Completamento e suggerimento del testo: ChatGPT può essere utilizzato per costruire sistemi in grado di completare o suggerire il testo sulla base di input parziali. Questo può essere utile per attività come la digitazione predittiva o la generazione di testo in base a una serie di richieste.
- Generazione di testo: ChatGPT può essere utilizzato per generare testo coerente e naturale. Può essere utilizzato per generare descrizioni, titoli o qualsiasi altro tipo di testo che debba essere scritto in modo naturale.
- Traduzione automatica: ChatGPT può essere utilizzato per costruire sistemi in grado di tradurre il testo da una lingua all'altra. Questo può essere utile per costruire chatbot multilingue o per fornire traduzioni di contenuti di siti web.
- Analisi del sentiment: ChatGPT può essere utilizzato per analizzare il sentiment del testo, consentendo di determinare se un testo è positivo, negativo o neutro. Questo può essere utile per attività come il servizio clienti o il monitoraggio dei social media.
- Riassunto: ChatGPT può essere utilizzato per riassumere lunghi brani di testo in versioni più brevi, rendendo più facile digerire rapidamente grandi quantità di informazioni.
- Creazione di contenuti: ChatGPT può essere utilizzato per generare nuove idee di contenuto o per scrivere interi pezzi di contenuto. Questo può essere utile per attività come la creazione di post sui social media o articoli di blog.
- Classificazione del testo: ChatGPT può essere utilizzato per classificare il testo in categorie, come spam o non spam, o sentiment positivo o negativo. Questo può essere utile per compiti come il filtraggio di e-mail o la moderazione di discussioni online.
- Sistemi basati sulla conoscenza: ChatGPT può essere utilizzato per costruire sistemi in grado di rispondere a domande e fornire informazioni su un'ampia gamma di argomenti. Questo può essere utile per costruire chatbot in grado di fornire informazioni agli utenti.
- Sintesi vocale: ChatGPT può essere utilizzato per generare il parlato dal testo, consentendo di creare versioni audio di contenuti scritti o di costruire assistenti vocali in grado di comprendere e rispondere a input in linguaggio naturale[18].
Accoglienza
ChatGPT ha ricevuto commenti generalmente positivi. Samantha Lock di The Guardian ha evidenziato che è stato in grado di generare un testo «straordinariamente dettagliato» e «umano»,[19] il giornalista tecnologico Dan Gillmor ha utilizzato ChatGPT per un compito scolastico e ha scoperto che il testo generato era alla pari con quello che avrebbe fornito un bravo studente e ha affermato che «il mondo accademico avrà problemi molto seri da affrontare»[20]. Alex Kantrowitz di Slate ha elogiato il rifiuto di ChatGPT di rispondere alle domande relative alla Germania nazista, inclusa l'affermazione secondo cui Adolf Hitler ha costruito autostrade in Germania, che è stata accostata a informazioni sull'uso del lavoro forzato da parte della Germania nazista[21].
In un articolo del dicembre 2022, l'economista Paul Krugman ha scritto che ChatGPT avrebbe influenzato la richiesta di lavoratori della conoscenza[22]. James Vincent di The Verge ha giudicato il successo virale di ChatGPT come una prova del fatto che l'intelligenza artificiale era diventata mainstream.[9] In The Atlantic, Stephen Marche ha evidenziato che il suo effetto sul mondo accademico e in particolare sui saggi di applicazione deve ancora essere compreso[23]. L'insegnante e autore delle scuole superiori della California Daniel Herman ha scritto che ChatGPT porterà alla «fine dell'inglese delle scuole superiori»[24].
L'accuratezza di ChatGPT è stata messa in dubbio. Mike Pearl di Mashable l'ha messo alla prova, ponendogli una serie di domande: in un esempio, ha chiesto al modello "il Paese più grande dell'America centrale che non sia il Messico", ricevendo come risposta Guatemala, quando la risposta esatta è invece Nicaragua[25]. Nel dicembre 2022, il sito web Stack Overflow ha vietato l'uso di ChatGPT per generare risposte alle domande, citando la natura ambigua delle risposte del bot[26]. L'economista Tyler Cowen ha espresso preoccupazione per i suoi effetti sulla democrazia, citando la capacità di scrivere commenti automatizzati nel tentativo di influenzare il processo decisionale di nuovi regolamenti[27]. Axe Sharma di Bleeping Computer ha notato che ChatGPT è in grado di scrivere malware ed e-mail di phishing[28]. Ma anche il mondo della Scienza è in fermento per ChatGPT[29]. Il chatbot è in grado infatti di generare testi accademici convincenti[30], e secondo quanto riportato su Nature, è stato incluso come autore in almeno quattro articoli scientifici pubblicati o in preprint. A febbraio del 2023 il team di OpenAI ha annunciato per il pubblico statunitense la possibilità di sottoscrivere un abbonamento al costo di 20$ mensili per utilizzare ChatGPT Plus[31]. Gli utenti che sottoscriveranno l'abbonamento potranno ricevere risposte più rapide anche "nelle ore di punta" e accesso in anteprima a nuove funzionalità e miglioramenti.
Note
- ^ a b David Franklin e ChatGPT, The Chatbot Revolution: ChatGPT: An In-Depth Exploration, 2023, ISBN 979-8370255281.
- ^ (EN) Stiennon, Nisan, Ouyang, Long e Wu, Jeffrey, Learning to summarize with human feedback, in Advances in Neural Information Processing Systems, vol. 33, 2020. URL consultato il 23 dicembre 2022.
- ^ Leo Gao, John Schulman e Jacob Hilton, Scaling Laws for Reward Model Overoptimization, in arXiv:2210.10760 [cs, stat], 19 ottobre 2022. URL consultato il 23 dicembre 2022.
- ^ (EN) OpenAI API, su beta.openai.com. URL consultato il 23 dicembre 2022.
- ^ Paolo Artoni, Esce "text-davinci-3" il nuovo modello di GPT-3 by OpenAI, su SMarT Strategy, Marketing & Technology, 29 novembre 2022. URL consultato il 23 dicembre 2022.
- ^ W. Bradley Knox e Peter Stone, Augmenting Reinforcement Learning with Human Feedback (PDF), Proceedings of the ICML Workshop on New Developments in Imitation Learning.
- ^ a b (EN) ChatGPT: Optimizing Language Models for Dialogue, su OpenAI, 30 novembre 2022. URL consultato il 23 dicembre 2022.
- ^ a b c d OpenAI, ChatGPT: Optimizing Language Models for Dialogue, su openai.com. URL consultato il 5 dicembre 2022.
- ^ a b ChatGPT proves AI is finally mainstream — and things are only going to get weirder, su The Verge. URL consultato l'8 dicembre 2022.
- ^ Proximal Policy Optimization (PPO) Explained, su towardsdatascience.com. URL consultato il 5 dicembre 2022.
- ^ (EN) ChatGPT: The Most Advanced AI Chatbot in 2022, su ChatGPT Pro. URL consultato il 23 dicembre 2022.
- ^ Paolo Artoni, ChatGPT, cos'è, come funziona e come accedere gratuitamente - Update, su SMarT Strategy, Marketing & Technology, 20 dicembre 2022. URL consultato il 23 dicembre 2022.
- ^ No Linux? No problem. Just get AI to hallucinate it for you, su arstechnica.com. URL consultato il 5 dicembre 2022.
- ^ a b The Brilliance and Weirdness of ChatGPT, su nytimes.com. URL consultato il 5 dicembre 2022.
- ^ scienceblog, La fusione nucleare spiegata da un'intelligenza artificiale., su scienceblog, 24 dicembre 2022. URL consultato il 22 gennaio 2023.
- ^ This AI chatbot is dominating social media with its frighteningly good essays, su cnn.com. URL consultato il 5 dicembre 2022.
- ^ (EN) Kasper Groes Albin Ludvigsen, The Carbon Footprint of ChatGPT, su Medium, 22 dicembre 2022. URL consultato il 16 gennaio 2023.
- ^ a b 10 Smart Thing You Can Do With ChatGPT, su linkedin.com.
- ^ What is AI chatbot phenomenon ChatGPT and could it replace humans?, su The Guardian. URL consultato il 5 dicembre 2022.
- ^ AI bot ChatGPT stuns academics with essay-writing skills and usability, su The Guardian. URL consultato il 5 dicembre 2022.
- ^ Finally, an A.I. Chatbot That Reliably Passes “the Nazi Test”, su Slate. URL consultato il 5 dicembre 2022.
- ^ Does ChatGPT Mean Robots Are Coming For the Skilled Jobs?, su nytimes.com. URL consultato il 6 dicembre 2022.
- ^ Stephen Marche, The College Essay Is Dead, su The Atlantic. URL consultato l'8 dicembre 2022.
- ^ Daniel Herman, The End of High-School English, in The Atlantic, 9 dicembre 2022.
- ^ The ChatGPT chatbot from OpenAI is amazing, creative, and totally wrong, su mashable.com. URL consultato il 5 dicembre 2022.
- ^ AI-generated answers temporarily banned on coding Q&A site Stack Overflow, su theverge.com. URL consultato il 5 dicembre 2022.
- ^ ChatGPT Could Make Democracy Even More Messy, su bloomberg.com. URL consultato il 6 dicembre 2022.
- ^ OpenAI's new ChatGPT bot: 10 dangerous things it's capable of, su bleepingcomputer.com. URL consultato il 6 dicembre 2022.
- ^ Luigi de Pascalis, Luigi de Pascalis, Gli abstract di ChatGPT preoccupano la Scienza, su Smartphonology, 14 gennaio 2023. URL consultato il 23 gennaio 2023.
- ^ Luigi de Pascalis, Luigi de Pascalis, ChatGPT: il futuro della scrittura accademica o una minaccia per l'integrità della ricerca?, su Smartphonology, 22 gennaio 2023. URL consultato il 23 gennaio 2023.
- ^ Ecco ChatGPT Plus a 20 dollari al mese, su smartphonology.it.
Collegamenti esterni
- (EN) Sito ufficiale, su chat.openai.com.
- (EN) Dario Spilimbergo, Interview mit dem Chatbot GPT, su mixcloud.com, sirup.fm - Studierendenradiosendung von der Universität Zürich und der ETH Zürich, 23 dicembre 2022. URL consultato il 23 dicembre 2022.