Episode Transcript
Available transcripts are automatically generated. Complete accuracy is not guaranteed.
Speaker 1 (00:14):
Dallo studio distribuito di Gump Media Production, notizie di tecnologia, questo è Digitalia.
Francesco Facconi (00:29):
Puntata speciale estiva di Digitalia nella quale parliamo con Agnello De Santo di Large Language Model, linguistica computazionale e di come funziona la ricerca su questi argomenti.
In visita dall'Università dell'Iuta lo accogliamo per imparare insieme a voi qualcosa di più su questi temi sempre caldi nel nostro mondo digitaliano.
Dallo studio di Milano Città Studi, Francesco Facconi.
E dallo studio di Milano Isola Michele Di Maio.
(00:58):
Buonasera, buongiorno, buon tutto perché qua il tempo è fluido nel momento in cui ci ascoltiamo.
Intanto ciao Michele.
Ciao Francesco.
So che non vedi l'ora di presentare questo nostro ospite che ha un cognome strano, cognome già sentito.
Michele Di Maio (01:13):
Ma è un caso, è un caso. Non è assolutamente collegato.
Francesco Facconi (01:17):
Non c'è nepotismo su Digitalia, non c'è...
Michele Di Maio (01:22):
Esatto. Va bene, allora ciao Aniello, Aniello De Santo.
Ciao, che è figlio del nostro Cylon Prof e come il nostro Cylon Prof ha intrapreso la carriera accademica, quindi sono dieci anni, una decina d'anni che lavora nel settore della linguistica computazionale, come hai detto tu, nell'Università dello Utah.
(01:50):
parleremo appunto del tuo
del tuo percorso
e un po' di quello che fai
ecco, ogni tanto qualcuno che davvero
Francesco Facconi (01:59):
ne sa ci vuole sempre
Michele Di Maio (02:03):
intanto come dobbiamo
Francesco Facconi (02:04):
riferirci a te? Perché abbiamo detto
sei stato presentato come ingegnere
ma hai detto no, linguista
e quindi
come ti consideri?
Aniello De Santo (02:14):
Chi sei?
Francesco Facconi (02:16):
Raccontaci brevissimamente
Aniello De Santo (02:19):
qualcosa
Sì, io in realtà mi considero un linguista, ho iniziato da, in Italia ho fatto i studi di ingegneria informatica a Pavia.
Michele Di Maio (02:29):
Ok.
Aniello De Santo (02:30):
Che salutiamo, ciao Pavia.
Michele Di Maio (02:31):
Pavia ci ascolta sempre.
Pavia ci ascolta sempre.
Aniello De Santo (02:35):
Però verso la fine della mia laurea magistrale, l'ingegneria, purché interessante, lasciava qualcosa, non so, di non corrisposto.
Speaker 1 (02:49):
Ok.
Aniello De Santo (02:50):
ed è capitato che a Pavia c'è un ottimo programma di linguistica teorica
in particolare all'Oius Pavia c'è un professore di neurolinguistica Andrea Moro
che studia come il cervello processa il linguaggio
e io mi sono trovato a una delle sue lezioni e ho saltato un colpo di fulmine
(03:11):
per cui da lì ho deciso no io voglio studiare
questo ovviamente magari non buttando i cinque anni di studi di informatica avevo fatto
l'interesse era di usare
aspetti matematici e computazionali
ma per capire come il linguaggio umano funziona
e da lì sono partito
per gli Stati Uniti, ho fatto un dottorato in linguistica
all'Astonie Brook University
Speaker 1 (03:31):
insomma hai unito le due cose
Aniello De Santo (03:32):
ho unito le due cose, però di sicuro come interessi
mi considero un linguista
non un ingegnere informatico
va bene, è giusto, tenere le distanze
Francesco Facconi (03:40):
perdonatemi, sono una persona discretamente ignorante
cosa fa un linguista?
sei un ingegnere, scusa
sono ingegnere quindi bravissimo
cosa fa un linguista?
perché può sembrare
Aniello De Santo (03:51):
i linguisti fanno tante cose in realtà
è uno di quei settori che sono
un po' in inglese direi moda
umbrella term, scusate ogni tanto mi scappano
degli inglesismi e di solito non parlano italiano
Francesco Facconi (04:01):
siamo milanesi quindi parliamo in termini
english perché è molto cool fare così
a Milano, tranquillo
le call vanno così
Aniello De Santo (04:08):
bene
il linguista è un settore gigante che può andare
in generale lo studio del linguaggio
umano, alcuni linguisti direbbero
è lo studio scientifico del linguaggio umano
ogni tanto questa cosa
si porta un po' di supremazia
delle scienze verso per cui io
in realtà non lo amo come definizione
anche se vuole
(04:29):
chiarire che in linguistica
di solito non studiamo
ti insegno l'inglese
Speaker 1 (04:35):
ti insegno il francese
Aniello De Santo (04:36):
ti insegno il cinese ma studiamo
come funziona il linguaggio
alcuni di noi lo studiano da un punto di vista sociale
per cui come le nostre interazioni
sono
come le nostre interazioni
usando l'italiano
come abbiamo appena detto
perché i milanesi usano un po' più di inglese
(05:00):
e altri studiano
lo studiano dal punto di vista cognitivo
che è la parte di cui io mi specializzo di più
per cui cosa succede adesso nel nostro cervello
nella nostra mente
mentre stiamo parlando
come che impariamo
i bambini imparano il linguaggio
molto rapidamente
com'è che succede perché facciamo solo
certi tipi di errori e non altri
(05:20):
e ovviamente queste due cose si intersecano
uno può studiare dal punto di vista sociale
come l'aspetto cognitivo
può influenzare
nelle prossime 5-6 ore
Michele Di Maio (05:31):
risponderai a tutte queste domande
a tutti questi argomenti che hai aperto
però tu parli di singolo linguaggio
Speaker 1 (05:36):
mentre invece
Michele Di Maio (05:38):
nel mondo ci sono n mili
Speaker 1 (05:40):
a linguaggi, come fai a fare
Aniello De Santo (05:42):
questo ombrellone
Speaker 1 (05:44):
tra tutti i linguaggi?
Aniello De Santo (05:45):
è per quello che usa la parola linguaggio invece che parola lingua
quando dico linguaggio intendo appunto questa facoltà cognitiva
che noi umani abbiamo di imparare le lingue
così che se io prendo un bambino
se io fossi nato in Italia da mio padre
ma il primo anno di vita
mi sposto a Tokyo
avrei imparato il giapponese bene come avrei imparato l'italiano
(06:08):
non c'è niente di genetico del fatto di essere nato da un italiano
che mi ha fatto imparare l'italiano
Francesco Facconi (06:13):
C'è qualcosa di cognitivo
Il fatto che abbiamo pomodoro e mozzarella nel sangue
Non c'entra niente con la lingua che parliamo
No
Aniello De Santo (06:20):
Appunto questo poi dal punto di vista sociale
Ci sono un sacco di studi a seconda di poi
Come la cultura influenza il tipo di linguaggio che parliamo
Ma siamo di sicuro predisposti
Ad imparare le lingue
Di imparare in modo particolare
Molto rapidamente
Già dal fatto che ad esempio
Se tu ci pensi le nostre voci sono solo un tipo di rumore
Ma il bambino
(06:41):
A un mese
già impara a distinguere
il ritmo della sua lingua madre
rispetto al ritmo di un'altra lingua
come fa a distinguerlo dai cani
Speaker 1 (06:50):
che abbaiano in sottofondo
dal frigorifero
Aniello De Santo (06:53):
c'è qualcosa predisposto
nel nostro cervello che ci fa
imparare la lingua benissimo
language machines
Michele Di Maio (07:02):
ok
Aniello De Santo (07:04):
per quello uso il linguaggio
e poi ovviamente uno si può specializzare su
come funziona l'inglese, come funziona l'italiano
come funziona il giapponese
a me in realtà appunto dal punto di vista cognitivo
interessa cos'è che hanno in comune
le nostre menti
quando ascoltiamo
l'inglese o l'italiano
Francesco Facconi (07:21):
che è ancora più affascinante da questo punto
e il momento in cui
qualcuno parla più lingue
Speaker 1 (07:27):
questa cosa chiaramente ha una differenza
Francesco Facconi (07:30):
immagino o no
penso poi sia la lingua del tuo caso
ipotetico nel quale ti sei trasferito da piccolo
Speaker 1 (07:36):
a Tokyo e quindi hai imparato il giapponese
Francesco Facconi (07:38):
in tenere età o magari il mio
che adesso sto studiando il tedesco
che chiaramente ha la veneranda età di qualche anno
non è come averla imparata da bambino
Aniello De Santo (07:48):
no, infatti hai toccato queste cose
che toccano un sacco di aspetti interessantissimi
se ci sono differenze tra imparare più lingue quando siamo bambini
e più lingue quando poi siamo adulti
apprendimento di linguaggio da bambini
apprendimento di linguaggio da adulti
se lo fai a scuola con libri è molto diverso come approccio
(08:09):
per cui ci sono un sacco di studi
un sacco di dibattiti molto accesi
su quali sono le differenze
se ci sono davvero differenze
dal punto di vista cognitivo
o è solo perché quando lo impariamo da adulti
siamo un pochino
più lenti a imparare le cose in genere
per cui magari non ha nulla a che fare con il linguaggio
specificamente, abbiamo anche meno tempo
meno attenzione
Francesco Facconi (08:33):
sì, interessantissimo
ti chiedo
apro un momento forse un qualcosa di
Poi magari torniamo sugli argomenti più...
Chi impara a suonare uno strumento?
La lingua della musica.
Michele Di Maio (08:45):
Eh no, esatto.
Francesco Facconi (08:47):
La chiamano la lingua della musica, ma dal tuo punto di vista di ricerca è vera questa affermazione o no?
Aniello De Santo (08:55):
Non sono un esperto in questa cosa, per cui una pura opinione.
Anche di cui c'è un sacco di linguistica, una battuta tra linguisti è che se metti tre linguisti in una stanza
non saremo mai d'accordo su nulla
certo, quell'inside joke
Michele Di Maio (09:12):
inside joke tra linguisti
Aniello De Santo (09:17):
in realtà mi hanno regalato
da pochissimo un libro che si chiama
Language and Music
Speaker 1 (09:21):
in the Brain
Aniello De Santo (09:23):
di cui non mi ricordo l'autore
anche se dovrei saperlo
non ho ancora iniziato a leggere ma ci sono di sicuro
degli aspetti cognitivi simili
sia dal punto di vista di
come percepiamo i suoni
per cui quanta attenzione abbiamo
predisposizione all'accento
e predisposizione alla musica
per esempio probabilmente sono correlati
(09:44):
e ci sono un sacco di studi dal punto di vista
di se le strutture
del linguaggio umano siano poi simili
alle strutture
di un pezzo complicato di Bach
o di Mozart
e si attivano aree del cervello simili o no
il linguaggio tende ad attivare
certe aree che non hanno a che fare
con la musica ma altre aree che sono condivise
(10:05):
per cui la mia opinione è che
non è esattamente come una lingua
cognitivamente ma di sicuro
sfrutta
delle risorse cognitive simili
ok
ma quindi per dirla brutta
Speaker 1 (10:19):
tu la mattina vai in università
Michele Di Maio (10:21):
e metti i caschetti
in testa alla gente per vedere
che aree del cervello
si attivano
Aniello De Santo (10:28):
se potessi
durante il mio dottorato l'ho fatto
una tecnica chiamata
EEG
Speaker 1 (10:36):
C'è falogramma
Aniello De Santo (10:38):
Grazie
Che è esattamente quella
In cui uno viene nel laboratorio
Tu gli metti del gel in testa
Con gli elettrodi
E li metti davanti a uno schermo
Poverini per un'ora
E gli fai leggere un sacco di cose
Una parola alla volta
Perché sbattere le ciglia
Ogni tipo di movimento facciale
(10:58):
In realtà crea un sacco di rumore
In questo tipo di registrazioni
Per cui essere un soggetto
Durante questi esperimenti
è stancantissimo
oggi
uso più
quello che
uso esperimenti comportamentali
di solito per cui
Michele Di Maio (11:17):
l'osservazione insomma
Aniello De Santo (11:19):
oppure ti metto comunque davanti a un computer
ma magari registro quanto tempo ci metti
a leggere una frase
o strumenti
di eye tracking per cui
registro
Quanto tempo i tuoi occhi si soffermano su una certa parola o su un'altra?
Quanto tempo ci metti a rispondere a una domanda rispetto a certi tipi di frase?
(11:44):
Sono tecniche che sono molto buone per capire a livello generale
cos'è che certi tipi di linguaggio fanno rispetto al tuo comportamento
e sono più economiche.
Michele Di Maio (12:00):
Certamente, anche negli Stati Uniti.
Aniello De Santo (12:02):
Anche negli Stati Uniti.
E soprattutto uno dei vantaggi che hanno è che non sono tecniche di laboratorio,
per cui posso fartela fare.
Potrei mandarti adesso un link di uno di questi esperimenti di cui sto raccogliendo dati
e tu potresti farlo, magari non mentre parliamo, però mentre sei in bagno.
Invece di doverti portare in laboratorio, chiuderti in una stanza per due ore.
(12:25):
O in bagno, chiudere in bagno in laboratorio.
Esatto, però in bagno sai, la puoi scegliere tu invece in laboratorio.
Francesco Facconi (12:29):
Chiuderti in bagno per due ore può essere sempre interessante.
Esatto.
per la gioia di chi anche altro sia in casa
tutto questo è veramente
affascinante, so che però
uno degli argomenti di cui possiamo
riuscire a parlare, se è vero quello che
Speaker 1 (12:46):
ci è stato detto, è come tutto
Francesco Facconi (12:49):
questo e tutto quello che studi
ha a che fare con un'altra cosa
che ha a che fare con il linguaggio
quindi oltre al linguaggio, la lingua della musica
ha anche la lingua dei
modelli di linguistica larga
i large language model
ha senso quello che ho detto?
Aniello De Santo (13:04):
cioè c'entra qualcosa?
sì, quanto c'entri
dipende da chi chiedi
io di sicuro mi occupo perché appunto
come dicevamo all'inizio
quando ho intrapreso il mio viaggio da linguista
non volevo buttare anni di esperienza
come mi sono formato
mi sono formato da linguista computazionale
e infatti insieme a questi esperimenti
(13:25):
che faccio con noi di solito
sviluppo modelli computazionali
che mi aiutano a testare teorie del linguaggio
magari a vedere quanti di questi dati
riesco a predire con un certo tipo
di modello. I modelli che uso io
tendono a non essere
del gruppo dei large language
models, possiamo parlare
del perché
(13:46):
decisamente sì
però ovviamente
come penso
tutti sappiamo al giorno
d'oggi è difficile lavorare
penso in qualsiasi contesto ma di sicuro nel contesto
di linguistica
e scienze cognitive
AI
senza parlare di large language models
per cui
(14:08):
sono i corsi che insegno
e ne parliamo quasi sempre
nel bene e nel male
più nel bene o più nel male?
ma io devo
ammettere che
sono
un po' a metà
ma tendo a preferire
lo scetticismo rispetto a un sacco
di questi
(14:29):
trend tecnologici per cui
tendo a enfatizzare il male
ma ovviamente sai
Michele Di Maio (14:38):
certo bisogna bilanciare
Aniello De Santo (14:39):
bisogna bilanciare tutto
ci si prova almeno
Michele Di Maio (14:43):
esattamente
però quindi
le due cose secondo me possono essere
collegate in due
modi perché da una parte
appunto
gli LLM sono
ok dietro hanno
Speaker 1 (14:59):
della matematica, diciamo così
Michele Di Maio (15:02):
ma l'interfaccia
è linguistica
e quindi c'è un ritorno
di
amore, di interesse
Speaker 1 (15:11):
sono anni in cui parliamo tutti STEM
Michele Di Maio (15:13):
STEM qua, STEM là
improvvisamente che ci servono
persone che sappiano scrivere
anzi ancora più che sappiano scrivere
perché sappia come funziona
il linguaggio
dall'altra parte un LLM
può esserti anche utile a te
in quanto ricercatore
mi immagino, ci possono essere
(15:34):
delle applicazioni
quale delle tue cose nel tuo campo
almeno è più preponderante
Aniello De Santo (15:40):
quale applicazione funziona di più?
secondo me entrambe
in modo diverso
hai ragionissimo che
a parte l'interfaccia che al giorno
d'oggi è sicuramente linguistica
se uno prende chat GPT
chiaramente ti ci devi interfacciare
scrivendo o
altri modelli forse parlando
(16:01):
ma dal punto di vista linguistico
al cuore di questi modelli
peraltro sono anche
trained, addestrati su
sul linguaggio umano
su dati che sono puramente linguistici
e infatti
forse delle critiche
che alcuni
(16:22):
AI skeptics
al giorno oggi
pongono rispetto a questi usi di modelli
computazionali di questo tipo come
modelli di intelligenza
è che noi umani non ragioniamo solo
con il linguaggio
siamo contestualizzati in un mondo fisico
visivo
(16:43):
tu dici abbiamo altri linguaggi
Michele Di Maio (16:45):
non verbali che interpretiamo
Aniello De Santo (16:47):
e anche nell'apprendimento del linguaggio
in realtà sappiamo dal punto di vista di gente
che studia l'apprendimento del linguaggio
dei bambini
quello che vedono rispetto alle tue espressioni facciali
o le espressioni facciali dei genitori
o il mondo che li circonda
è importantissimo nel come poi apprendono il linguaggio
(17:11):
l'intonazione di come parli
il contesto sociale e culturale
sono cose che i bambini non imparnano il linguaggio solo
sentendo frase dopo frase dopo frase
che è come invece addestriamo questi modelli
Speaker 1 (17:25):
se no li metti davanti
Aniello De Santo (17:26):
anzi neanche davanti a una televisione
Michele Di Maio (17:27):
davanti a uno stereo e dici così
imparate il linguaggio
Aniello De Santo (17:31):
esatto e non per dire che è solo l'aiuto visuale
ovviamente importante
i bomeni che hanno dei difetti visivi
imparano lo stesso
ma è il contesto di essere fisicamente
nel mondo
Francesco Facconi (17:42):
il contenuto sensoriale probabilmente
tutti gli altri sensi contribuiscono
Aniello De Santo (17:46):
che sia anche solamente l'affetto per i genitori
Francesco Facconi (17:49):
che comunicano il linguaggio inizialmente
la lingua madre
Aniello De Santo (17:52):
chi te lo sta insegnando
sempre delle mie colleghe all'università dello Utah
hanno questa ricerca interessantissima
di quello che sai
di chi sta parlando
se è per esempio un professore o un tuo collega
o un tuo amico
è importantissimo in quanta
attenzione tu poni a quello che stanno
tentando di insegnarti
(18:12):
e per cui tu impari un'altra lingua
ad esempio da adulto
la impari meglio se pensi a questa persona
viene dal paese in cui si parla
persona è un insegnante di quella lingua invece che
questa persona è un adolescente
che l'ha imparata online, anche
se poi magari ti stanno insegnando esattamente
la stessa cosa, per cui il contesto sociale
in cui impariamo è importante
Francesco Facconi (18:33):
di nuovo nel bene e nel male
l'autorità dell'insegnante dice anche
Aniello De Santo (18:37):
in un certo senso
l'autorità o come dicevi tu il rapporto affettivo
o qualsiasi cosa
tu possa pensare dell'interlocutore
e per cui
questi modelli di linguaggio hanno comunque
appunto sono addestrati
hanno alla base queste architetture
che in teoria possono funzionare con altri tipi di input
(18:57):
ma i modelli di cui sono famosi al giorno d'oggi
sono addestrati su
milioni e milioni e milioni e milioni
di data
scritto principalmente
e per cui
(19:18):
c'è questo aspetto di
cosa sappiamo di questi dati
cosa sappiamo del linguaggio
di come funziona
che viene internalizzato
da questi modelli che lo vogliamo
non lo vogliamo
e dall'altro lato così
ti butto due cose rispetto alle due
domande generali e poi decidiamo
cosa ci interessa di più
(19:38):
dall'altro lato c'è ovviamente questa
curiosità nel capire
se questi modelli imparano
il linguaggio, se lo stanno facendo
sembra di sì
se tu metti davanti
qualcuno davanti a
Coggt
sembra che stia avendo una conversazione
(19:58):
possiamo parlare di cosa ne penso io
però di sicuro l'impressione è quella
e per cui uno dice ok se Coggt
impara l'italiano, impara l'inglese
può funzionare come modello
cognitivo di come noi impariamo
l'italiano, impariamo l'inglese oppure di
come noi processiamo l'italiano
per ora che stiamo parlando
possiamo usare Coggt
(20:18):
o le architetture che sono alla base
GPT-1, 2, 3
possiamo usarle per studiare
dal punto di vista cognitivo
invece di fare un esperimento
in laboratorio
possiamo usare questi modelli per studiare
quello che facciamo noi
e dibattiti molto accesi
io tendo ad essere
nel campo della gente che pensa che dal punto di vista cognitivo
(20:40):
questi modelli non sono al momento
particolarmente interessanti
parzialmente perché
chi? Vediamo l'input
forse, vediamo
l'output che è quello che ci scrivono
ma le relazioni
di casualità
come siamo arrivati dal training data
(21:02):
dai dati su cui ti ho addestrato
l'output a queste frasi che mi dai
non è chiarissimo
anzi sono delle grandi
scatole nere, sono le gigantesche
Michele Di Maio (21:12):
scatole nere, esatto, noi le chiamiamo
le reti neurali, poi vabbè anche nel nostro
cervello non è che sia proprio facile guardarci
dentro, no esatto
Aniello De Santo (21:19):
è complicatissimo infatti dal punto di vista
umano come funziona
il linguaggio sia cognitivo che neurale
è ancora una grande domanda
per fortuna perché così
noi possiamo lavorarci
ed è per quello che è un dibattito
perché poi dipende un po' dal punto di vista
filosofico se uno pensa
ok posso capire
(21:41):
cose rispetto a una scatola nera
che è
l'aspetto cognitivo
del linguaggio umano usando un'altra scatola
nera che sono questi large language models
oppure no, sono due scatole nere
che sono interessanti da studiare
magari sono correlate in qualche
modo ma
le devo studiare indipendentemente
io sono al momento da questo secondo
Michele Di Maio (22:03):
ma in cui tu hai visto adesso
chat GPT
ci ha fatto conoscere al grande
pubblico gli LLM
oramai che sono 3 anni
Speaker 1 (22:12):
a fine 22 se non sbaglio
a fine 21, vabbè siamo là
Michele Di Maio (22:15):
tu lavori nel campo da 10 anni
si può dire che hai visto il prima
e il dopo, quanto è cambiato
il tuo lavoro e quanto è cambiato
poi l'ambito di ricerca
Aniello De Santo (22:27):
negli ultimi anni
questa è un'ottima domanda
dato che io
ho fatto
questo sforzo molto cosciente
quando ho iniziato di non
etichettarmi come ah sei l'ingegnere che
arriva a fare linguistica
per cui soprattutto nella prima parte
della mia carriera io mi sono più
focalizzato
(22:48):
ho tentato di star via
da queste tecniche che molto in generale
uno chiamerebbe natural language processing
o NLP
e per cui
molta della mia ricerca invece si è
focalizzata su voglio usare modelli
simbolici
modelli che usano un sacco
di matematica
(23:10):
esplicitamente
non la matematica
astratta
astratta in un senso
opaca di questi modelli
di cui abbiamo
strato dopo strato di funzioni
matematiche, ogni funzione la capiamo
in una neural network, ma
una volta che ne metti
(23:30):
mille, una
dopo l'altra, è quello che crea l'opacità
il black box, che non è che non sappiamo
cosa fa una
funzione logaritmica, non sappiamo cosa
fanno dieci funzioni logaritmiche una
di seguito all'altra
invece io uso modelli che si chiamano simbolici
che sono più simili a quelli che si usavano
negli anni 80
in realtà per fare cose che oggi facciamo
tipo l'EMS
Francesco Facconi (23:52):
la nostalgia è una brutta canaglia
ricordiamolo
l'intelligenza artificiale come lo interpretiamo oggi
non è nata tre anni fa
è tanto tempo
Michele Di Maio (24:01):
ricordiamo sempre che il tuo papà
ha fatto la tesi di laurea
sull'intelligenza artificiale
ci tiene a ricordarci sempre
Aniello De Santo (24:10):
sì
cioè
negli anni 60
ai Bell Labs dell'MIT
si parlava in un certo senso
in modo molto simile
tra questi modelli che usiamo
ora che sono modelli che
al giorno d'oggi a Stanford
non insegnano più
perché
(24:31):
non funzionano bene come funziona
un LLM
ma negli anni 60 erano
oh questi modelli tra 5 anni avranno risolto
il problema del linguaggio
qualsiasi cosa voglia dire risolvere
il problema del linguaggio
però c'è questo senso di
i modelli computazionali
risolveranno qualsiasi problema
qualsiasi domanda scientifica
(24:52):
è sempre stata un po' in giro
in questi approcci
tecnologici
alle domande di intelligenza artificiale
rispetto a
l'intelligenza artificiale in realtà
è un settore interessantissimo perché appunto c'è l'aspetto
tecnologico, l'aspetto delle scienze cognitive
c'è l'aspetto della filosofia
della sociologia, antropologia
(25:15):
che infatti manca un pochino
quando andiamo poi a sentire
solo i CEO delle grandi corporations
di Facebook o OpenAI o Google
Michele Di Maio (25:27):
l'antropologia non ti fa fare profitti
Aniello De Santo (25:30):
esattamente
e in realtà appunto anche dal punto di vista di formazione
studiare ingegneria
molte cose, no? È molto facile focalizzarsi
a così tante cose da imparare
nel mio settore, no?
Se uno dice, però forse un po'
(25:50):
di filosofia della scienza dovresti studiarla
se poi vuoi andare a fare queste cose.
Ovviamente al momento ti viene a dire, ma perché
io devo imparare a
scrivere codice
come se un dottore
deve imparare a fare
le strutture, quando è che ho il tempo
di leggermi filosofia della scienza o sociologia
o antropologia. Però poi ti trovi
appunto con questa un po' di mancanza
(26:12):
di memoria storica
il fatto che
alcune di queste domande ce le avevamo
80 anni fa
Michele Di Maio (26:22):
la tecnologia è cambiata
Aniello De Santo (26:25):
e come cambia la nostra
reazione rispetto alla tecnologia
e quindi
tornando per esempio alla tua domanda di come cambia il mio lavoro
giorno in giorno in realtà quello che è cambiato
principalmente è un po'
del fatto che
più gente
salmino questi termini principali
o un modello di linguaggio
(26:45):
o intelligenza artificiale
e
è cambiato nel dover
davvero leggere
doversi tenere un po' aggiornati
su queste cose che in realtà
anche se io penso ad esempio che
l'ultimo modello di CACPT
non ci sta insegnando niente rispetto alle domande scientifiche
che ho io
è impossibile non tenersi aggiornati
Speaker 1 (27:07):
su cosa sta facendo
Aniello De Santo (27:08):
perché è così prevalente nel settore
che è un po' irresponsabile poi non saperne
Francesco Facconi (27:14):
non so te Michele ma a me sapere che
CiaGPT non sta rispondendo alle sue domande scientifiche
mi tranquillizza
Speaker 1 (27:20):
mi dà la speranza che ci sia ancora qualcosa
Francesco Facconi (27:22):
che non abbiamo veramente raggiunto il soffitto
ho toccato il fondo perché non ho idea di dove stiamo andando
Michele Di Maio (27:28):
serviamo a qualcosa prima che ci colleghino
come batterie ai loro computer
Francesco Facconi (27:34):
dipende a chi chiedi ovviamente
allora io vi prenderei
un minuto, passerei la linea
a Sanremo che c'è Franco che vuole assolutamente
darci un messaggio e poi
torniamo che ho un argomento di cui voglio parlare
Franco Solerio (27:48):
grazie Francesco
solo un minuto per ringraziare
il nostro sponsor, questa puntata
è sponsorizzata da Squarespace
la piattaforma all in one per creare
pubblicare e far crescere la tua presenza online
tutti abbiamo un amico
o magari siamo noi, quell'amico
che dice voglio lanciare una cosa nuova
ci vorrebbe un sito, niente di complicato e lì comincia il dramma, scegliere la piattaforma,
(28:10):
installare plugin, trovare un tema che quasi ti piace, litigare con l'editor visuale,
perdere un pomeriggio ad allineare due blocchi e poi magari il sito resta a metà, in bozza,
per mesi. Perché? Perché mancano tempo, voglia, energia. Ma l'idea era buona, eh? Con Squarespace
quella buona idea può diventare un sito vero, bello e online in pochissimo tempo. È tutto
(28:32):
integrato design dominio strumenti di pubblicazione e commerce newsletter prenotazioni tutto nello
stesso posto il nuovo sistema blueprint ai ti aiuta a iniziare ti fa qualche domanda tipo che stile ti
piace che contenuti vuoi mettere e in pochi clic ti propone una bozza su misura già pronta da
personalizzare e niente panico si modifica tutto trascinando cliccando scrivendo niente codice
(28:56):
niente stress. Hai un servizio da offrire? Squarespace ti permette di ricevere pagamenti,
gestire clienti, inviare fatture, il tutto con un look professionale. Se poi vuoi far crescere
la tua community hai newsletter, analytics, SEO e contenuti a pagamento già inclusi. Tutto
funziona, tutto è fluido e tutto è sempre aggiornato, sicuro e gestito. E se infine
(29:18):
tinkarti? E beh, c'è il supporto clienti, sempre disponibile, 24 ore su 24, 7 giorni
su sette con persone vere che ti rispondono in fretta e che conoscono davvero la piattaforma
perché non rispondono da un call center in giro per il mondo ma direttamente da un ufficio
Squarespace. Vai su squarespace.com slash digitalia e inizia la tua trial gratuita. Non c'è bisogno
di mettere nessuna carta di credito, nessun dato di pagamento perché la trial è gratis
(29:42):
sul serio. Quando finisce il tempo scade e non c'è nessunissimo addebito. Il giorno però che decidi
utilizzarlo, che decidi di pubblicare
e beh usa il codice coupon
DIGITALIA che ti dà diritto
allo sconto del 10%
sul primo acquisto di un sito
o di un dominio. Squarespace
la differenza tra ci vorrebbe un sito
(30:02):
e vedere quel sito online
in meno tempo di quanto pensavi.
Grazie Squarespace per il supporto anche a questa
puntata di DIGITALIA.
Francesco Facconi (30:15):
Rieccoci, grazie Franco,
grazie al nostro sponsor
e rieccoci con Agnello
Speaker 1 (30:21):
ciao a tutti
Francesco Facconi (30:22):
allora prima
del blocco
volevo chiederti
un argomento di cui abbiamo parlato
un paio di volte probabilmente leggendo
degli articoli
non sono sicuro capendoli alla perfezione
per cui magari tu puoi aiutarci
ricordo che un po' di anni fa
o mesi ormai con la velocità
(30:44):
avevo letto come questi
LLM ragionino tutti in inglese
Speaker 1 (30:48):
quindi traducano dall'italiano all'inglese
Francesco Facconi (30:50):
ragionino, creino la risposta
e poi la ripropongano in italiano
nel nostro caso, mentre di recente
ho letto il contrario, che
stanno iniziando a ragionare nelle lingue
locali, come l'italiano
in questo caso, visto che la maggioranza sono sviluppati
in inglese
e che questo fa sì che le risposte
siano differenti
(31:13):
ok, ci sai aiutare
Ha senso questa cosa dal tuo punto di vista?
Aniello De Santo (31:19):
Mi ha colpito?
Allora, l'aspetto principale di questi modelli è su cosa li addestrano.
Per cui quando prima si intendeva che la maggior parte di questi modelli che sono utilizzati in fase di produzione
sono al loro cuore in inglese, è perché il tipo di dati, la quantità di dati di cui uno ha bisogno
(31:45):
rende praticamente
qualsiasi altra lingua
tranne l'inglese, quello che
al giorno oggi chiameremo una low resource language
una lingua in cui ci sono pochi dati
che se ci pensi
quando parliamo di dati parliamo di solito di dati scritti
se ci pensi è un po' assurdo per noi
pensare all'italiano è una lingua su cui ci sono pochi dati scritti
abbiamo risorse scritte
sull'italiano come le abbiamo su
(32:07):
centinaia di altre lingue
per secoli
secoli e secoli
certo ma non possiamo fare
Francesco Facconi (32:13):
addestramento e training con Dante
ad esempio perché se no parleremo tutti in terzine
Aniello De Santo (32:18):
esatto
e soprattutto
il problema principale è l'internet
Speaker 1 (32:27):
l'internet in inglese
Aniello De Santo (32:29):
la predominanza dell'inglese
su qualsiasi sorsa
del world wide web
rende la quantità esatta
di dati che generiamo ogni giorno
in inglese, semplicemente non comparabile
a quasi nessun'altra lingua
quindi
è solo
Speaker 1 (32:49):
una questione di dati che hanno permesso di addestrare
Francesco Facconi (32:51):
più che del
come funziona la lingua nel quale
fammi usare le virgolette
l'LLM sta ragionando in quel momento
Aniello De Santo (33:02):
usiamo ragionare
Francesco Facconi (33:04):
tantissime virgolette
Aniello De Santo (33:05):
esatto, esatto, virgolettatissimo
e non c'è una differenza
nel senso che la lingua su cui
addrestri il modello è la lingua
che il modello usa
per fare
le sue inferenze eccetera eccetera
almeno che tu non faccia
quello che
nel settore certe volte chiamano transfer learning
(33:27):
tu potresti dire oh io addestro un modello
in inglese perché posso
usare questi giga
di risorse e poi faccio
un po' di fine tuning su
un dataset per esempio
le leggi della corte europea
perché ce li abbiamo sia in inglese
in italiano esattamente gli stessi testi
perché io posso usare un modello che ho addestrato
in inglese e gli faccio
(33:49):
imparare la correlazione inglese
italiano su
testi correlati
penso che quando ti riferivi
a questi articoli dicevano ah questi
modelli ragionano in inglese e poi l'interfaccia
è in un'altra lingua sono modelli di questo
tipo in cui
il cuore del modello
quello che davvero fa la maggior parte dei calcoli, diciamo,
(34:16):
è stata addestrata sull'inglese.
Francesco Facconi (34:22):
Quindi il ragionamento dovrebbe essere, sempre fra virgolette ragionamento chiaro,
dovrebbe sempre essere lo stesso.
Aniello De Santo (34:33):
Sì, qui è dove l'opacità di questi modelli si introduce perché dipende da come fai questi step successivi, ci aggiungi un'altra lingua o puoi fare anche dei modelli che sono addestrati su più lingue allo stesso tempo e qui quanto dati in inglese gli è dato rispetto ai dati in italiano, rispetto ai dati in francese o in giapponese conta.
(35:02):
Soprattutto di quanto sono rappresentativi non solo di come funziona l'inglese,
questo che fa funzionare questi modelli molto bene,
questi dati sono rappresentativi di come funziona il mondo,
di come parliamo di professioni lavorative, di come parliamo del tempo,
di come parliamo di chi ha vinto il Festival di Sanremo.
(35:24):
Sono questi dati che sono nascosti in questo addestramento del modello.
Al giorno d'oggi ci sono un sacco di ricercatori, molto più bravi di me, che hanno speso un sacco del loro tempo a dire come facciamo ad ottimizzare questo grosso problema.
Diciamo che tu vuoi il GPT, ti piace come strumento, è un problema di accesso alle tecnologie, il fatto che lo puoi fare solo in inglese,
Speaker 1 (35:53):
o che ti serve una lingua su cui puoi fare addestramento
Aniello De Santo (35:58):
su trilioni di dati
per cui c'è un sacco di gente
al giorno d'oggi che invece si sta specializzando
su come faccio ad avere modelli che funzionano in modo simile
e che magari sono addestrati in modo simile
ma che hanno bisogno di meno dati
e questi sono modelli che potresti concepire
sono addestrati solo in italiano
ce ne sono vari in realtà che vengono da molti ottimi ricercatori italiani
(36:25):
e in questo senso potresti dire
beh questo modello non ha inglese
nessun
nessun
in nessun momento del suo addestramento
se non che ci può essere dell'inglese
nei dati italiani al giorno d'oggi
Michele Di Maio (36:42):
soprattutto quelli milanesi
Aniello De Santo (36:44):
o quelli miei
e questo è un modello in questo senso
che non ha ragionamento in inglese
e poi quindi tornando alla tua domanda
rispondono in modo diverso
al 100% perché questi modelli rispondono
secondo i dati
su cui sono stati addestrati
Francesco Facconi (37:03):
estendo
noi intelligenze
non artificiali, detti anche esseri umani
possiamo rispondere
alla stessa domanda in modo diverso
se siamo stati addestrati
perdonami anche qua le virgolette
in italiano o in inglese o in giapponese
cioè dipende il nostro corpus linguistico
a parità, lo so che è difficile
Speaker 1 (37:23):
la parità di tutto il resto
Francesco Facconi (37:25):
ci fa ragionare in modo diverso
cioè il linguaggio
genera di fatto
quello che poi è
Michele Di Maio (37:34):
è la lingua che influenza il ragionamento
e il ragionamento che influenza la lingua
Speaker 1 (37:39):
questa è una domanda bellissima
Michele Di Maio (37:41):
e mi stai mettendo
Aniello De Santo (37:44):
stai facendo tutte queste domande
che sono esattamente le cose
su cui combattiamo
e su cui la gente ha opinioni molto forti
la mia personale opinione è che certamente qualcosa del linguaggio influenza
come pensiamo un pochino, come strutturiamo il pensiero
per esempio l'italiano tende ad essere l'italiano che ci insegnano a scuola
(38:06):
quando impariamo a scrivere in italiano
impariamo che in italiano si scrive con queste frasi molto lunghe, molto convolute
per cui influenza un pochino il modo in cui poi impari a presentare
stai facendo una lezione
il modo in cui presento un argomento in italiano
è un pochino diverso da come lo presento
in inglese, non perché l'italiano
e l'inglese sono fondamentalmente diversi
(38:28):
dal punto di vista cognitivo, ma perché si portano
carico di tutte quelle altre sostituzioni
sociali, di come
parlo agli studenti
di come parlo con voi, rispetto a come
parlerei in inglese ai miei studenti
e queste cose
ci sono ovviamente nei testi scritti
per cui quando destriamo questi modelli
in italiano e in inglese
(38:48):
ci portiamo questi
bias sociali in certo senso
per cui gli italiani
gli studenti italiani sono più formali degli studenti americani
quando parlano con i loro professori
per cui
ha imparato ad essere formale
non è che l'italiano
è più formale
è che le nostre strutture sociali
che sono nascoste nel come usiamo l'italiano
(39:09):
sono un po' diverse
e le statistiche
del come usiamo il testo
se lo portano dietro
però se tu mi chiedi sai se abbiamo letto un libro
dici che sono andato a vedere
Superman non l'ho visto Superman quindi non chiedetemi
però diciamo che siamo andati a vedere Superman
e me lo chiedi tu in italiano come è Superman
e qualcun altro poi domani me lo chiede
un mio amico me lo scrive dall'America in inglese
(39:30):
la mia risposta come è Superman
alla base non sarà diversa
perché ho risposto in italiano e in inglese
magari in inglese lo uso
in modo un po' più informale in italiano
uso parole un po' più elaborate
ma il cuore della risposta è lo stesso
Francesco Facconi (39:44):
se ti è piaciuto se non ti è piaciuto
Aniello De Santo (39:46):
invece perché questi modelli
sono addestrati su questi corpus
queste strutture dati
che possono essere completamente diverse
è possibilissimo
che ti rispondano due cose completamente diverse
perché il modello non ti sta davvero
e qui la gente
si scanna
Speaker 1 (40:03):
sto per dire una cosa un po' forte
Aniello De Santo (40:06):
la mia opinione
Michele Di Maio (40:07):
quindi mettiamo un avviso agli ascoltatori
Speaker 1 (40:10):
Aniello sta per dire una cosa
Michele Di Maio (40:11):
attenzione potete andare avanti di 40 secondi
Aniello De Santo (40:14):
se non volete
e non vi volete sconvolgere
solo per
i linguisti
per dire per me
il modello non sta ragionando
sta trovando delle correlazioni statistiche
tra il fatto che tu hai detto la parola Superman
e la parola ti piace
Speaker 1 (40:31):
o like
Aniello De Santo (40:32):
e qualsiasi cosa avesse
nel suo corpus di addestramento
il pappagallo stocastico
come direbbe Emily Bender
esatto
Per cui sì, infatti c'è questo dubbio che abbiamo,
e che dato che noi in realtà questi modelli,
a parte essere opachi nel senso che non li capiamo benissimo,
(40:55):
perché è molto difficile ricostruire questi step causali.
C'è gente molto brava che sta lavorando esattamente
a queste tecniche di interpretabilità causali.
Perché mi sta dando questa risposta rispetto a questa domanda?
L'altro problema è che noi non sappiamo su questi modelli
su cosa sono addestrati,
perché io non posso andare a prendere
(41:16):
il modello alla base di CACPT
e guardare che dati ha.
Francesco Facconi (41:19):
Certo.
Aniello De Santo (41:20):
Anche perché molti sono piratati,
quindi non vogliono che li guardano.
Sono piratati, esatto.
OpenAI al momento non rilascia
neanche una descrizione dei dati,
non è che te li fa vedere.
Anche se te li facessi vedere sarebbe inutile
perché sono comunque troppi,
non è che tu puoi pagare uno
a mettersi a leggere i dati.
Certo.
Figura di se si chiamava close AI.
Esatto.
(41:41):
Beh, è qui che è il marketing.
OpenAI è un'ottima
idea
nel punto di vista di vendere un prodotto
perché ti fa pensare
a cose che in realtà non fanno
in ogni caso al momento non ti fanno neanche una descrizione
del loro training set
per cui noi sappiamo che sono
per forza addestrati
(42:03):
sulla totalità
che è l'internet perché
su modelli più piccoli lo vediamo
su modelli che possiamo usare col mio
povero Mac Air che prova a fare
quello che i server
di OpenAI fanno
però non è che possiamo andare a vedere
cosa c'è nel modello di addestramento
sappiamo anche che ad esempio
(42:25):
CACPT, quasi tutte queste
LLAMS che hanno alla base
queste architetture neurali
poi hanno
sopra di loro vari strati
di fine tuning
di solito fine tuning al giorno d'oggi
è fatto con una tecnica che si chiama
reinforcement learning with human in the loop
che è praticamente addestramento
rinforzato con
(42:48):
supervisione umana
siamo diventati schiavi delle macchine
Francesco Facconi (42:51):
in un certo senso
Aniello De Santo (42:53):
sì
qui di nuovo c'è l'aspetto di marketing
che ci viene un po' nascosto il fatto
che ci viene venduto
come se questi modelli magicamente
imparassero queste cose
solo dai dati e poi
veniamo a sapere che tutte queste compagnie
pagano, non profondatamente
purtroppo, pagano
Michele Di Maio (43:13):
vanno in Kenya a fare queste cose
esattamente
Aniello De Santo (43:17):
ti pagano migliaia di jig workers
in Kenya che sono chiusi
dentro stanze 8 ore al giorno
a leggersi il prompt
di GCPT che i nostri
che noi per scherzo
mettiamo, fammi chiedere a GCPT
cosa pensa nel tempo e c'è qualcuno
poverino in Kenya che è lì a leggere
a dare, ah questa è una risposta
(43:37):
adeguata la domanda o no?
magari non lo fanno domanda per domanda
non lo sappiamo, può essere
Francesco Facconi (43:43):
mi sento di colpo estremamente in colpa
per quello che ho scritto
di pieghe compagnia
Michele Di Maio (43:48):
meglio che andare in miniera però comunque
Aniello De Santo (43:51):
meglio che andare in miniera però
Michele Di Maio (43:53):
non l'ideale
Aniello De Santo (43:55):
non l'ideale e dal punto di vista
tecnologico, a parte dal punto di vista sociale
dal punto di vista
tecnologico c'è questa
confusione
del fatto che ci
ci viene venduta un po' di questa oggettività
dell'algoritmo
uno potrebbe anche essere critico indipendentemente
(44:15):
ma poi andiamo a sapere
che questi algoritmi funzionano molto bene
perché ci sono umani che
usano le loro skill
che prima sarebbero state usate
per magari fare queste cose per cui
il governo dà soldi ad OpenAI
per invece fare da filtro
al chatbot
(44:37):
abbiamo divocato un po'
non mi ricordo
come ci siamo arrivati qui
però sì per cui sono queste cose
molto complicate secondo me dal punto di vista
sia tecnologico che sociale
c'è una parte puramente tecnologica
da scienziati a uno farebbe piacere
poter pensare puramente alla tecnologia
è una tecnologia interessante cosa fa
però è impossibile
(44:59):
in un certo senso parlare
di queste cose senza preoccuparsi
dell'aspetto sociale dove prendiamo questi
dati chi è che ci lavora dietro
quali lavori vengono persi
quando una compagnia ci vende
un software dicendo che può fare
certe cose anche se quel software non le può fare.
Senza parlare dal punto di vista di
energia, di
(45:22):
clima.
Michele Di Maio (45:22):
Di spreco dell'energia.
Ascolta, noi adesso ti abbiamo fatto
Speaker 1 (45:26):
parlare un casino di LLM
Michele Di Maio (45:28):
anche se poi, hai detto,
sei anche un po' freddito
sul tema, ma in breve
di cose poi al di fuori dagli LLM
Speaker 1 (45:37):
veramente fighe
Michele Di Maio (45:38):
qual è il fringe adesso nel tuo settore?
Aniello De Santo (45:42):
è un'ottima domanda
guarda, secondo me
il mio story
di questo appunto
in inglese è
computational psycholinguistics
possiamo usare modelli computazionali per studiare
la parte psicologica del linguaggio
secondo me è esattamente questa
la tensione, per cui in realtà c'è
questa domanda di
(46:03):
sono modelli cognitivi o no
ok
quindi stiamo imparando qualcosa
quando li usiamo
non per creare
chatbots, queste tecnologie utili o non utili
stiamo imparando qualcosa su di noi
per cui se vai a una delle conferenze principali
a cui vado io ogni anno
che è la conferenza per lo human sentence processing
(46:26):
che appunto si occupa
di come comprendiamo
il linguaggio
al livello della frase
trovi un sacco di
sottomissioni
che sono
transformer architecture
ha fatto questo, si comporta
come un umano
e secondo me la tensione
(46:47):
nel settore è quella
sicuramente è una domanda interessante
cosa fa questa tecnologia
è una domanda interessante dal punto di vista
di quelli di noi che sono interessati
a sapere cosa fanno gli umani
per fare questo
o no
e
that's the fringe
lì che si combatte
Michele Di Maio (47:08):
ok ok
Aniello De Santo (47:10):
allora c'era l'altro
Michele Di Maio (47:12):
macro tema di cui
volevamo parlare con te è un po'
capire la tua esperienza
invece di ricercatore italiano
all'estero quindi
perché l'Uluita
come l'Uluita e soprattutto dove l'Uluita
Aniello De Santo (47:26):
dove l'Uluita è un'ottima domanda
Michele Di Maio (47:29):
ma guarda io in realtà
Aniello De Santo (47:30):
ho iniziato
ho stato nel New York
Speaker 1 (47:36):
Upstate New York
Aniello De Santo (47:38):
Not Upstate in realtà
Speaker 1 (47:39):
L'università Long Island che è la stessa
Aniello De Santo (47:42):
isola dove è Brooklyn
però dobbiamo essere molto attenti nel caso ci siano
new yorkesi che ascoltano che non è parte di New York City
assolutamente
vicina abbastanza
e sono finito lì
perché volevo studiare linguistica
e in Italia
e in Europa più in generale
è molto difficile fare un dottorato
in un settore in cui non hai studiato prima
(48:05):
parte
per la struttura
dei nostri dottorati
sono più corti di solito
dei nostri dottorati italiani
sono più corti di solito arrivi già con un progetto di ricerca specifico
e dall'altro punto di vista che
certe volte non puoi neanche far domanda
almeno quando io
mi stavo laureando, tipo io fare un master
in linguistica
ho professori che mi dicono no va benissimo
(48:27):
hai studiato da solo, hai recuperato
certi buchi al tempo
non puoi neanche far domanda perché non hai la laurea
nel settore disciplinare giusto
perché in un certo senso l'America era
obbligatoria
perché il loro modello di dottorato
il loro modello accademico
un po' più in generale
(48:47):
ci sono autostrade qui fuori
sì le sentiamo
Francesco Facconi (48:50):
ambulanze
Aniello De Santo (48:52):
il modello universitario se non erro è meno
Francesco Facconi (48:55):
rigido rispetto a noi
c'è più varietà che si può anche scegliere
durante il percorso di studi
Aniello De Santo (49:00):
che è la parte in realtà
che a livello di graduate studies
per cui master e dottorato a me piace molto
del modello americano
questa idea di
tu hai una base generale
per esempio io ho studiato informatica
per cui hai sicuramente dei buchi in altre cose
però il dottorato ti dà il tempo
di studiare anche
sono più lunghi, durano almeno 5 anni
(49:22):
e i primi due anni sono praticamente
solo di studio
di studio e di ricerca
e per cui io sono finito lì perché
appunto volevo studiare linguistica
volevo studiare linguistica in questo modo
usando dal punto di vista umano
perché non volevo andare lì a poi scrivere
app per fare
cioè GPT
però volevo usare
(49:43):
questi skill di matematica
di modellazione matematica che avevo imparato
e c'era questo professore molto
giovane all'Astonia Brook University
che faceva Mathematical Linguistics
qui usando algebra
logica formale
e ci siamo trovati
ho fatto domanda
per cui l'America era principalmente per quello
(50:04):
una volta che ho finito il dottorato
ho deciso di
adesso ormai cinque anni fa
ho detto
io vorrei tentare almeno di
rimanere in università
e in America funziona un pochino
diversamente dall'Italia
e che non puoi rimanere nell'università
dove hai fatto il dottorato
(50:27):
anche se avessero una posizione
nel tuo settore
il mio dipartimento non assumeva nessuno
nel mio settore, anche se l'avessero avuta
non si fa
neanche con
quello che chiamiamo un postdoc
Speaker 1 (50:40):
che è molto raro, almeno nei settori in cui
Aniello De Santo (50:43):
computer science
linguistica, psicologia
l'idea è
ai fini del dottorato vai da qualche altra parte
Francesco Facconi (50:52):
vai e diffondi
immagino quello che hai imparato
vai e diffondi
esatto
sì esatto
Aniello De Santo (50:56):
porti un po'
sia
quello che impari
nel tuo dipartimento
appunto
approcci professionali
approcci intellettuali
è molto open
Francesco Facconi (51:05):
a differenza di qualche altro open
di cui parlavamo prima
questo approccio
sì
Aniello De Santo (51:09):
e ovviamente
hai i suoi pro
e con
uno degli svantaggi principali
che ti forza davvero
a dire
vabbè io quindi vado
dove c'è il lavoro
tipo il mio anno
professori
aperte
nella linguistica e computazione
tipo in dipartimenti linguistica c'erano
10 negli Stati Uniti
fai domanda a tutti i 10
Speaker 1 (51:30):
dove vai?
Aniello De Santo (51:31):
dove ti assumono
esatto
prove con queste cose
per cui poi nell'Odita ci sono finito così
che è uno dei posti che mi hanno fatto un'offerta
l'anno in cui mi sono indottorato
e la loro offerta
era la migliore
che mi avevano fatto
(51:51):
in particolare è quello che gli Stati Uniti chiamano una tenure track
per cui
è un'università di ricerca
principalmente, io faccio corsi
ma la maggior parte delle mie valutazioni
vengono da come pubblico o quanto pubblico
e
fondi adeguati per fare ricerca più o meno
e soprattutto
ha questa idea che ok hai 5 anni
(52:12):
6 anni e poi fai questa
valutazione nazionale
e ottieni il ruolo
diciamo quello che sarebbe così
Scusi siamo finiti così. Nello Utah che è molto
ad ovest degli Stati Uniti
e se pensate
Francesco Facconi (52:25):
di fianco alla California
Aniello De Santo (52:27):
c'è Nevada nel mezzo, a nord dei
Francesco Facconi (52:29):
grandi parchi
Aniello De Santo (52:31):
e a sud dei grandi, dipende
a quali grandi parchi stai pensando, è a sud di Zion
Zion è quello
sopra, giusto giusto
scusatemi, no, adesso gli americani
è a sud di Yosemite
Speaker 1 (52:43):
nord di Zion
Aniello De Santo (52:45):
Zion è Nello Utah
Per cui Salt Lake City
Dove sono io è a North di Zion
E i grandi parti sono un po'
Tutti intorno
È la regione dei grandi parchi
È ad est di alcuni
Grandi parchi, quelli famosi californiani
Speaker 1 (53:02):
Se puoi
Aniello De Santo (53:03):
Esatto
Speaker 1 (53:05):
Stai elencandomi questo
È facile così
Aniello De Santo (53:10):
Però se tu ti immagini
San Francisco
Se da San Francisco guidi in una linea dritta
Verso est
Speaker 1 (53:16):
arrivi a Salt Lake City ma devi passare
Aniello De Santo (53:19):
per il Nevada
Michele Di Maio (53:21):
che è dove è Las Vegas
Aniello De Santo (53:24):
è bello
Michele Di Maio (53:25):
ce lo consigli una vacanza
come vacanza ve lo consiglio di sicuro
se vi piace la natura
Aniello De Santo (53:31):
se vi piacciono i grandi parchi
lo Utah e quella regione lì in realtà
sono unici da quel punto di vista
perché ce ne sono davvero tantissimi
sono spettacolari
è una strada di bassa popolazione
bassa densità
esatto
e si alterna tra dove sono io
io sono in alta montagna
(53:52):
però appena scina
Speaker 1 (53:55):
si scia benissimo
siamo vicinissimi alle montagne
Aniello De Santo (53:58):
tipo dal mio ufficio sciare no
Michele Di Maio (54:01):
quindi come Avellino
Aniello De Santo (54:03):
mi sembra di notare
una certa
Michele Di Maio (54:07):
continuità
come Monticchio
come battuta
Aniello De Santo (54:12):
te ne sei dovuto andare
negli Stati Uniti per finire ad Avellino
va bene va bene
Michele Di Maio (54:18):
ma è così
tornare?
ci torneresti? vorresti?
Aniello De Santo (54:24):
ma guarda
sono difficili
la ricerca americana
ormai sono in America da tanti anni
per cui anche solo il fatto di pensare
spesso 10 anni in un paese
ci vuole tempo ad abituarsi
culturalmente a essere
in un altro posto
(54:46):
ritornare
un passo impegnativo è ritornare
alla fine in un tipo di
struttura accademica a cui non sono più abituato
perché io non ho fatto
dal punto di vista di ricerca non ho fatto nessuna
scusatemi
non ho fatto nessuna delle mie
componenti educative di ricerca
(55:06):
avere in Italia
Speaker 1 (55:08):
il dottorato l'ho fatto all'estero
Aniello De Santo (55:10):
ho lavorato come professore all'estero
ci sono alcuni
modelli di come funziona l'università italiana
a cui non sono proprio abituato
Michele Di Maio (55:20):
infatti tu non hai mai fatto ricerca in Italia
non ho mai fatto ricerca in Italia
Aniello De Santo (55:23):
che infatti è un po' buffo
perché quando incontro certe volte
ricercatori italiani all'estero
finiamo ogni tanto a parlare
di ricerca italiana
io non so neanche i nomi certe volte
o come prima dicevo
scusatemi gli inglesismi
perché non sono abituato
a parlare di queste cose in italiano
perché non le ho mai studiate in italiano
e per cui non mi manca la terminologia
Michele Di Maio (55:45):
che è una cosa un po' imbarazzante
Aniello De Santo (55:47):
certe volte perché di nuovo vuoi spiegare
o vuoi parlare con colleghi italiani
che ovviamente la sanno sia in italiano che in inglese
e gli devi dire
no io devo parlarne in inglese di questa cosa
ma non perché voglio parlarne in inglese
ma perché
Michele Di Maio (55:58):
no ma guarda ci capita la stessa cosa su Digitalia
Speaker 1 (56:01):
che noi leggendo tante cose in inglese
Michele Di Maio (56:02):
ci sono certi argomenti che noi li abbiamo sempre
approcciati passivamente in inglese
e poi siamo qua a parlarcene tra italiani
Francesco Facconi (56:09):
in italiano e quindi dobbiamo
e non ci siamo mai mossi da qui
esatto, ogni tanto qualche
Michele Di Maio (56:16):
ascoltatore ci bastona
ma è difficile
Aniello De Santo (56:19):
mia mamma mi bastona
Michele Di Maio (56:21):
e c'ha ragione
Aniello De Santo (56:24):
però appunto
dal punto di vista linguistico è un po' difficile
fare questo tipo di passaggi
quando non hai il lessico giusto
Michele Di Maio (56:32):
come dicevi
poi se non li sai fare tu che sei linguista
è imbarazzante anche
Aniello De Santo (56:38):
però tornare
sì appunto è complicata
e fino a un paio di anni fa ti avrei detto
guarda io in America sto bene
mi mancano ovviamente certe cose dell'Italia
sia culturali
che di vita quotidiana
però in America sto bene
dal giorno d'oggi
l'America è un posto complicato in cui vivere
e far ricerca in America
(56:59):
è un po' un'incognita
come dicevo prima al momento ho fondi di ricerca
li avrò tra un anno e mezzo
non è chiaro
indipendentemente dalle mie abilità
di avere fondamentale
Francesco Facconi (57:16):
stiamo intuendo ma lasciamo la
sospesa
Michele Di Maio (57:19):
la sfumiamo per la puntata
fra due anni dove ci racconterai
Aniello De Santo (57:23):
però è una cosa secondo me
che si può dire
è che al momento in America
quello su cui fai ricerca
conta se puoi far ricerca o no
indipendente da quanto sia bravo
quanto sia un tema interessante
io ho colleghi
(57:44):
che da un giorno all'altro
hanno scoperto che non potevano
più far ricerca nel senso
gli hanno chiuso il rubinetto
esatto, cosa vuol dire non poter fare ricerca?
ovviamente tu puoi fare che vuoi
Speaker 1 (57:55):
però ti ti dai soldi
Aniello De Santo (57:58):
o se sei un ricercatore estero
puoi pubblicare su quelle cose
un visto
o passare la frontiera
non è chiaro
secondo me è una cosa buona da sapersi
in Italia
al di là di quello che i giornali
dicono o non dicono
Francesco Facconi (58:14):
la ricerca scientifica per uno stato è assolutamente l'ultima
Aniello De Santo (58:17):
delle cose, non serve assolutamente
Francesco Facconi (58:19):
lo ricordiamo e quindi
Aniello De Santo (58:21):
l'America non ne ha beneficiato
per nulla
Francesco Facconi (58:25):
non hanno attirato ai tempi
in altri tempi un sacco di ricercatori
e forse è la volta buona che
anche tu dicevi che c'è
in Italia
Speaker 1 (58:35):
e in Europa uno stile diverso
Francesco Facconi (58:37):
probabilmente ci sono anche meno fondi
e questo è quello che tutti gli amici ricercatori
Speaker 1 (58:40):
che ho dicono
Francesco Facconi (58:42):
però può anche essere il momento in cui
Aniello De Santo (58:44):
come Europa ci si interroga
Francesco Facconi (58:46):
sull'opportunità
Aniello De Santo (58:47):
e infatti ci sono tanti stati
la Francia ad esempio ha iniziato un'iniziativa
giusto quest'anno
un pilot study con l'università di Marsella
dicendo ai ricercatori americani
venite, fate domanda
un concorso
vi diamo fondi più di quelli
che daremmo a un ricercatore
francese di base, di nuovo, queste sono cose
complicate dal punto di vista sociale
(59:08):
perché se fossi poi un ricercatore in Francia direi
ok però
però dal punto di vista di attrazione
di tutta questa gente che se n'è andata
perché in America ci pagano
tre volte tanto
e ci hanno fondi di ricerca
che sono non comparabili
a quelli che i miei colleghi hanno in Italia
ci siamo andati per quello
(59:32):
diciamolo che siete andati per quello
Francesco Facconi (59:34):
e speriamo che qualcuno ascolti
lo so che è ovvia questa cosa
ma diciamola
Aniello De Santo (59:39):
comunque sì, complicato
Francesco Facconi (59:42):
va bene Agnello
io intanto ti ringrazio, è stato veramente
Aniello De Santo (59:46):
interessante
Francesco Facconi (59:47):
questa oretta di chiacchierata
vorrei andare avanti
Speaker 1 (59:51):
personalmente ancora, però secondo me a un certo punto
Francesco Facconi (59:53):
bisogna avere il coraggio di mettere un
Speaker 1 (59:55):
punto e virgola, magari ricominciamo
Francesco Facconi (59:57):
un'altra volta
e ti chiederei se hai qualche
consiglio, qualche
suggerimento di
lettura
Michele Di Maio (01:00:07):
visto poi tuo padre che consiglia
solo libri, quindi ci aspettiamo
Aniello De Santo (01:00:11):
una serie tv, no scherzo
oh magari, lo dovevi dire
prima mi sarei preparato una serie tv da suggerire
ma guarda in realtà
se vi posso suggerire due cose
mi suggerisco un anime
si chiama
che è piuttosto vecchio in realtà
(01:00:34):
però fa domande rispetto al nostro aspetto cognitivo
chi siamo come una mente e l'interfaccia digitale
Speaker 1 (01:00:45):
molto strano, qui siete preparati
Aniello De Santo (01:00:48):
e poi dato che dicevi libri
c'è
questo
ci sono un paio di libri in realtà
che non ho ancora letto ma che sono
on top of my stack
Speaker 1 (01:01:02):
pronti sul comodino
Aniello De Santo (01:01:03):
uno si chiama The AI Con
è di Emily Bender
Speaker 1 (01:01:07):
che abbiamo citato prima per
Aniello De Santo (01:01:09):
Casi Pirate e Alex Hanna
che è un
sociologist incredibile
che parla
di questo
tecnologie LLMs
da un punto di vista di hype
e cosa ci dicono, cosa ci vendono
e quanto questo ha a che fare con questo
che questi modelli possono fare davvero
e l'altro libro si chiama Why We Fear AI
(01:01:32):
by
Hagen Blix e
Ingeborg Glimmer
che prende
un approccio un po' diverso
dal punto di vista economico-sociale
di cosa stanno facendo queste tecnologie
al mercato del lavoro
ci aiuta questa prospettiva
a rispondere domande del tipo
(01:01:53):
può C.A.G.P.T. fare questa cosa o no
entrambi sembrano molto interessanti
dagli estratti che ho letto
non li ho finiti
per cui se li leggete e li odiate
non è colpa mia
va bene
Francesco Facconi (01:02:06):
fantastico
di tradizione mettiamo il gezzino
vuol dire che è il momento di chiudere
è il momento di ringraziarti
Speaker 1 (01:02:14):
infatti c'è un signore dietro di te
che lo riconosco
Michele Di Maio (01:02:18):
che sta lì alla porta
Francesco Facconi (01:02:21):
che controlla che tutto vado bene
che lo trattiamo bene
Agnello intanto
grazie veramente tanto
Speaker 1 (01:02:28):
di aver speso questa oretta con noi
Francesco Facconi (01:02:31):
personalmente l'ho trovata molto
istruttiva, molto interessante
spero che sia, anzi è un argomento molto interessante
quello che abbiamo ascoltato
chi sa, sa
è molto stimolante
anche da quel punto di vista
se qualcuno
fosse interessato ti troviamo immagino
all'Università dell'Ujuta quindi
Aniello De Santo (01:02:50):
cerchiamo il tuo nome
non ci sono tanti Agnello del Santo
non ci sono tanti Agnello del Santo
linguisti credo
per cui
scrivetemi se volete
Francesco Facconi (01:03:02):
fantastico allora grazie
grazie Agnello
grazie Agnello del Santo, grazie Michele
per questa
oretta insieme e a tutti
quanti diamo un
augurio di continuazione di una buona estate
ci vediamo nel prossimo in puntate speciali e poi
nella stagione
tradizionale di digitale che ricomincerà il primo
(01:03:23):
di settembre forse
forse
ciao a tutti
ciao