Articoli
Che cosa sono le AI del linguaggio in parole semplici
Due cose comuni alle AI del linguaggio
Tutte le AI del linguaggio hanno in comune due cose.
La prima è la capacità di gestire molto rapidamente una quantità di testi immensamente superiore a quella che può gestire un essere umano in tutta la sua vita.
La seconda è che rispondono secondo un modello che loro stesse hanno creato durante il machine learning. Questo modello è opaco: non possiamo ricostruire con precisione il percorso che porta a una risposta. Per questo si parla di black box (scatola nera). La qualità delle AI del linguaggio si verifica a valle, cioè dai risultati.
I risultati possono essere:
- veri positivi: informazione correttamente considerata corretta e comunicata all’utilizzatore
- veri negativi: informazione correttamente considerata scorretta e non comunicata all’utilizzatore
- falsi positivi: informazione scorrettamente considerata corretta e comunicata all’utilizzatore
- falsi negativi: informazione scorrettamente considerata scorretta e non comunicata all’utilizzatore
Le AI del linguaggio sono di due tipi.
Il Natural Language Processing
Da decenni esistono le AI non generative del linguaggio: i sistemi di Natural Language Processing – NLP. Queste macchine analizzano il linguaggio ma non generano testi nuovi.
Per fare un esempio ho fatto analizzare la mia frase precedente. Ecco la visualizzazione restituita da Tint, la versione italiana realizzata dalla Fondazione Bruno Kessler di Trento del CoreNLP dell’Università di Stanford (l’immagine si vede molto meglio nel pdf)

Subito sopra ogni parola il software aggiunge l’etichetta che definisce la sua caratteristica grammaticale (Parte del Discorso, POS Tagging). Per esempio, “macchine” è S = Sostantivo, “analizzano” è V = Verbo. Le frecce invece definiscono i rapporti sintattici (Dependency Parsing), per cui “macchine” è il soggetto (nsubj), “linguaggio” è il complemento oggetto (obj) ecc.
I NLP sono pensati per essere interrogati da chi conosce il linguaggio macchina, dagli specialisti, in particolare dai linguisti computazionali che le usano per analizzare una gran mole di testi e ricavarci informazioni di tipo linguistico. Per esempio, noi sappiamo che:
- nelle sentenze appare un passivo ogni 31,9 parole;
- gli avvocati fanno un inciso ogni 29,7 parole;
- le PA compongono un periodo troppo lungo ogni 581 parole;
- le imprese compongono frasi con troppi complementi indiretti ogni 154 parole.
I NLP rispondono in base ad algoritmi definiti durante il machine learning. Pertanto:
- danno sempre la stessa risposta alla stessa domanda;
- non imparano con l’esperienza.
Per la maggioranza dei task di analisi del linguaggio, i NLP sono ancora molto più precisi delle AI generative (che infatti se ne servono).
Le AI generative – GenAI
Le AI generative sono molto diverse. Oltre al fatto che scrivono, la loro risposta non è sempre la stessa perché:
- elaborano le informazioni in modo statistico (non algoritmico);
- imparano anche dai dati dell’utilizzatore, che compie una specie di secondo machine learning (successivo a quello del pre-addestramento).
Le GenAI hanno due caratteristiche molto importanti per chi scrive.
La prima caratteristica è che le GenAI non funzionano come biblioteche. I miliardi di testi con cui vengono addestrate vengono scomposti in miliardi di relazioni statistiche tra token. I token sono parole, componenti di parole (prefissi, suffissi, ecc.), non parole (punteggiatura, numeri ecc.). I token galleggiano letteralmente in aria, separati dal testo a cui appartengono. In tal modo il testo, semplicemente, sparisce come unità bibliografica. Questa è la ragione per cui le GenAI non sono affidabili per la ricerca delle fonti (LINK a Parola mia, Imparo a volare).
La seconda caratteristica è che le GenAI non ‘leggono’ il prompt come una domanda, ma come una sequenza di token da completare con le parole più probabili in base al contesto. Per questa ragione, il prompt orienta la ‘risposta’ sugli argomenti e sullo stile con i quali è stato composto. LINK all’articolo Contini)
Per cui Sei Sempre Solo:
- se la GenAI ti ha dato un’informazione nuova, controllala: potrebbe essere sbagliata (falso positivo);
- se avevi già l’informazione che ti ha dato, non fidarti: la GenAI potrebbe averti nascosto le informazioni che non ha considerato pertinenti con il tuo prompt (falso negativo).
In altri termini:
- le GenAI possono essere utili solo se possiedi già il criterio per valutare la risposta;
- se non conosci bene la materia, studiala meglio prima di usare le GenAI;
- se conosci bene la materia, le GenAI possono aiutarti a lavorare meglio, e forse anche più rapidamente.
