Logo L'ink - Scrittura Professionale l'ink scrittura professionale

"Fare cose con le parole"

L'Intelligenza Artificiale e la scrittura professionale in parole semplici

di Giovanni Acerboni, 21 novembre 2023

 

Nel novembre 2022 è uscito ChatGPT, l'interfaccia che chiunque può utilizzare per farsi scrivere un testo in pochi secondi. ChatGPT rende fruibile facilmente la tecnologia GPT-3 (Generative Pre-trained Transformer) che aveva cominciato a fare notizia l'8 settembre 2020, quando il "Guardian" pubblicò un articolo scritto dall'intelligenza artificiale: A robot wrote this entire article. Are you scared yet, human? In realtà, i giornalisti ci lavorarono per metterlo a posto, ma la sostanza resta: l'intelligenza artificiale diviene generativa.

Il Natural Language Processing

Le tecnologie generative del linguaggio (Large Language Models - LLMs) sono l'evoluzione del Natural Language Processing - NLP, una tecnologia in grado di descrivere (molto bene) la struttura linguistica di un testo, di comprenderne (meno bene) il significato e di interpretarlo (ancora meno bene), ma non di generare automaticamente un testo.

Alla base di queste capacità, c'è l'addestramento, il machine learning. Il software impara, come gli umani, per imitazione. Legge l’enorme quantità enorme di dati di un Corpus (decine o centinaia di milioni di parole) e ne capisce statisticamente la struttura. Il NLP può essere raffinato (fine tuning) con algoritmi che forzano l'analisi, cioè che escludono certe interpretazioni del testo a vantaggio di altre.

La funzione più precisa del NLP è, come dicevo, quella di descrivere la struttura linguistica. Due esempi.

Primo esempio, il POS Tagging, cioè l'etichettatura (Tag) delle Parti del Discorso - Part Of Speech (POS) e l'analisi morfologica (Morphological Analysis). Per esempio di "i", il software dice che è un articolo, plurale, maschile e che la base è "il". Di "andò" dice che è un verbo, tempo passato remoto, terza persona singolare e che la base è "andare". Qui la visualizzazione dell'output di TextPro, un NLP della Fondazione Bruno Kessler di Trento:


Secondo esempio, il Dependency Parse Tree, cioè la ricostruzione dell’albero sintattico (la rappresentazione grafica della struttura della frase: frase principale, frase secondaria, soggetto, verbo ecc.). Qui la visualizzazione:

 

Una tecnologia per specialisti.

 

Le intelligenze generative

Le intelligenze generative, appunto, generano contenuti. Si basano su un addestramento compiuto con una quantità spaventosa di dati, non ‘semplicemente’ un corpus. Per esempio, GPT-3 è stato addestrato con gli archivi di Common Crawl, Wikipedia, Google Books e la piattaforma Reddit:

Ma sono dati che vengono continuamente superati in modo esponenziale dalle nuove versioni dei prodotti.

È sempre il criterio statistico a governare l’output. Il software elabora la richiesta scrive un testo nel quale la parola successiva è tra le più probabili dopo la precedente. Questo meccanismo fa sì che il software può elaborare risposte anche molto diverse. Rispetto al NLP, che non sforna risposte diverse, le intelligenze generative non sono prevedibili. Il che, secondo gli scopi dell’utilizzatore, può essere un vantaggio o uno svantaggio.

Le intelligenze generative sono general purpose: sanno tutto, cioè tutto quello che abbiamo pubblicato nel web, ma lo sanno a un certo livello di profondità e di tecnicità (al momento). Possono quindi generare contenuti validi, ma fino a un certo punto. Racchiudono la cultura scolastica e possono spingersi fino alla cultura di una laurea triennale.

Professionisti e specialisti in generale possono utilizzare le intelligenze generative come spunto, bozza (al momento). Il risparmio di tempo è assicurato, ma ci vuole comunque del lavoro.

Nel novembre 2023, Open AI, l’azienda che ha realizzato ChatGPT, ha rilasciato modelli personalizzabili, cioè addestrabili con i contenuti degli utilizzatori. Una volta addestrato il modello (progetto non semplicissimo), l’intelligenza genererà contenuti molto più precisi.

 

Due suggerimenti ‘aurei’

Per concludere, un paio di suggerimenti ‘aurei’ per chi produce contenuti: